Analiza statystyczna jest ostatnim etapem badania statystycznego. Jej zadaniem jest wykrycie prawidłowości i zależności zachodzących w badanej zbiorowości statystycznej.
Analiza statystyczna obejmuje:
Analizę natężenia
Analizę struktury
Analizę tendencji centralnej
Analizę rozproszenia
Analizę dynamiki
Analizę współzależności
Zebrany materiał statystyczny zaprezentowany w formie tabelarycznej i graficznej daje pełen obraz zbiorowości statystycznej. Obraz ten jest jednak zbyt szeroki, zawierający zbyt dużo szczegółów i przez to mało czytelny. Czytelny obraz zjawiska możemy uzyskać poprzez obliczenie kilku liczb, które będą charakteryzowały całą zbiorowość statystyczną.
Miarą statystyczną nazywamy te liczby, które są podstawą do dokonania zasadniczej analizy i wyciągnięcia na jej podstawie wniosków dotyczących badanej zbiorowości statystycznej. Analiza statystyczna opiera się na obliczonych miarach a także na opisie zbiorowości.
W analizie statystycznej wykorzystuje się liczby absolutne (bezwzględne) i względne (stosunkowe). Liczby absolutne powstają w trakcie zbierania informacji w badaniu statystycznym i są one liczbami mianowanymi, co oznacza, że określają wielkość badanego zjawiska we właściwych jednostkach miary. Liczby absolutne pozwalają na dokonanie pomiaru i opisanie zjawisk i procesów. Nie zawsze są one jednak wystarczające do analizy.
W niektórych przypadkach niezbędne jest zastosowanie liczb stosunkowych. Liczby te zwane względnymi, wskazują na zależności (stosunki, relacje) między dwoma liczbami absolutnymi, bowiem otrzymujemy je dzieląc jedną z nich przez drugą. Liczby względne umożliwiają porównywanie i ocenę różnych zbiorowości, których porównanie nie byłoby możliwe przy zastosowaniu liczb absolutnych.
ANALIZA NATĘŻENIA
Dokonywanie niektórych zjawisk na podstawie liczb absolutnych jest niemożliwe. W tym wypadku wykorzystać możemy wtedy współczynniki natężenia, które są podstawową miarą analizy natężenia. Są one liczbami mianowanymi - określają liczbę jednostek jednej zbiorowości przypadającą na jednostkę drugiej zbiorowości. Porównane zbiorowości muszą pozostawać ze sobą w logicznym związku. Współczynniki natężenia są często wykorzystywane do charakteryzowania różnych zjawisk. Do najczęściej używanych należą:
Gęstość zaludnienia, czyli liczba mieszkańców przypadająca na km2
Liczba urodzeń, małżeństw czy rozwodów przypadająca na 100000 mieszkańców
Liczba lekarzy przypadająca na 10000 mieszkańców
ANALIZA STRUKTURY
Analiza struktury zbiorowości statystycznej polega na określeniu i zinterpretowaniu prawidłowości występujących w budowie zbiorowości z punktu widzenia określonej cechy statystycznej.
Podstawowym miernikiem statystycznym wykorzystywanym w analizie struktury jest wskaźnik struktury. Wskaźnik struktury jest to stosunek liczebności cząstkowej do liczebności całej zbiorowości. Wskaźniki struktury pozwalają stwierdzić, jak często w badanej zbiorowości występują jednostki posiadające określony wariant cechy, czyli jaki jest udział określonej podgrupy w całej zbiorowości. Obliczenie wskaźników struktury dla wszystkich wariantów cechy pozwala na określenie struktury, czyli wewnętrznej budowy badanej zbiorowości statystycznej, pod względem analizowanej cechy. Wskaźnik struktury obliczony dla określonej części zbiorowości informuje o tym, jaką część całej zbiorowości stanowią jednostki posiadające określony wariant cechy. Wskaźnik występować może w trzech odmianach. Najczęściej stosowaną odmianą jest wskaźnik procentowy, ale może on być także wyrażony w promile.
W analizie struktury często istnieje konieczność porównania budowy dwóch zbiorowości pod względem tej samej cechy statystycznej. Do tego służy wskaźnik porównywalności struktur. Informacje o wartościach cech w obu zbiorowościach muszą być przedstawione w postaci szeregów rozdzielczych, w których podział na klasy (przedziały klasowe) jest taki sam, tzn. granice przedziałów klasowych, ich liczba i rozpiętość muszą być identyczne.
ANALIZA TENDENCJI CENTRALNEJ
Wskazanie w zbiorowości statystycznej takiej wartości badanej cechy, wokół której skupiają się wartości cechy wszystkich jednostek wchodzących w skład tej zbiorowości, to określenie tendencji centralnej w zbiorowości.
Tendencja centralna jest określana przy wykorzystaniu miar tendencji centralnej, zwanych również miarami przeciętnymi lub średnimi. Miary tendencji centralnej są bardzo proste do obliczenia, dzięki czemu są one powszechnie stosowane. Dzięki obliczeniu tych miar możliwe jest zwięzłe scharakteryzowanie - przy wykorzystaniu jednej lub kilku liczb - poziomu określonego zjawiska w zbiorowości statystycznej.
Miary tendencji centralnej dzieli się na dwie grupy:
miary klasyczne;
miary pozycyjne;
Miary klasyczne, wśród których najpopularniejsza jest średnia arytmetyczna, charakteryzują się tym, że są obliczane na podstawie wartości cechy wszystkich jednostek badanej zbiorowości.
Miary pozycyjne, są to wartości cechy statystycznej, jakie wystąpiły u konkretnej jednostki statystycznej, która spośród wszystkich pozostałych jednostek wyróżnia się miejscem (pozycją) w uporządkowanym szeregu statystycznym. Do miar pozycyjnych należy mediana i dominanta.
Średnia arytmetyczna w sposób syntetyczny (za pomocą jednej liczby) charakteryzuje zbiorowość statystyczną. Pozwala ona na ustalenie przeciętnego poziomu zjawiska. Średnia arytmetyczna może być obliczona wówczas, gdy badana cecha statystyczna jest cechą mierzalną ze zmiennością (ciągłą lub skokową). Nie jest możliwe obliczenie średniej arytmetycznej dla cechy niemierzalnej.
Podstawową zaleta miar tendencji centralnej jest wyrażenie ich wielkości w liczbach mianowanych, czyli w takich jednostkach miary, w jakich wyrażona jest wartość cechy.
Ponadto wartość każdej z miar tendencji centralnej mieści się w przedziale między najniższym a najwyższym poziomem wartości cechy w zbiorowości statystycznej. Ta właściwość miar tendencji centralnej jest wykorzystywana przede wszystkim w celu sprawdzania poprawności obliczeń.
ANALIZA ROZPROSZENIA
Analiza tendencji centralnej i asymetrii rozkładu cechy w zbiorowości statystycznej stanowią pierwszy etap analizy statystycznej. Średnia arytmetyczna. Choć tak powszechnie stosowana, posiada pewne wymienione wcześniej wady. Także pozostałe miary tendencji centralnej - mediana i dominanta nie zawsze w dostateczny sposób charakteryzują zbiorowość statystyczną. Dlatego też kolejnym etapem analizy statystycznej jest analiza rozproszenia ( dyspersji, zmienności, odchyleń, rozpiętości), która polega na badaniu różnic między poszczególnymi wartościami cechy jednostek statystycznych.
Obszar zmienności, nazywany także rozstępem, to różnica między maksymalną a minimalną wartością cechy. Jest to bardzo prosta, łatwa do obliczenia miara, której niestety wadą jest mała wartość poznawcza, ponieważ do jej obliczenia wykorzystuje się tylko najniższą i najwyższą wartość cechy.
Kolejną wadą obszaru zmienności jest to, iż miara ta nie uwzględnia wartości pośrednich między najniższą a najwyższą wartością.
Odchylenie przeciętne jest dokładniejszą marą rozproszenia niż obszar zmienności, bowiem uwzględnia nie tylko wartości skrajne, ale wszystkie wielkości pośrednie. Wskazuje ono przeciętną różnicę pomiędzy faktycznymi wartościami cechy, a ich średnią arytmetyczną. Odchylenie przeciętne może być obliczane dla indywidualnego szeregu wartości cechy lub dla wartości cech ujętych w szeregu statystycznym rozdzielczym. W pierwszym przypadku jest to odchylenie przeciętne proste, a w drugim - ważone.
Odchylenie standardowe jest miarą, która podobnie, jak odchylenie przeciętne, charakteryzuje przeciętny poziom odchyleń faktycznych wartości cechy od średniej arytmetycznej. Jest to miara bardziej precyzyjna niż odchylenie przeciętne, choć wymaga bardziej złożonych obliczeń. Odchylenie standardowe może być wyznaczone w sytuacji, gdy dane mają postać indywidualnego szeregu wartości cechy(odchylenie standardowe proste), jak i w sytuacji, gdy dane są uporządkowane w szeregu statystycznym rozdzielczym (odchylenie standardowe ważone).Poziom rozproszenia obliczany za pomocą odchylenia przeciętnego jest zawsze niższy niż poziom rozproszenia ustalony za pomocą odchylenia standardowego.
Współczynnik zmienności W przypadku konieczności porównania rozproszenia dwóch różnych zjawisk należy posłużyć się współczynnikiem zmienności. Współczynnik ten pozwala na ustalenie wyrażonego w procentach zróżnicowania faktycznych wartości cechy w zbiorowości statystycznej. Jest on obliczany nie tylko wtedy, gdy chcemy porównać dyspersję zjawisk o takiej samej średniej arytmetycznej, lecz również wtedy, gdy chcemy porównać dyspersję zjawisk o różnych poziomach średniej arytmetycznej.
Współczynnik zmienności występuje w dwóch postaciach:
jako wyrażona w procentach relacja odchylenia przeciętnego od średniej arytmetycznej;
jako wyrażona w procentach relacja odchylenia standardowego od średniej arytmetycznej.
ANALIZA DYNAMIKI
Miary dynamiki służą do badania zmian, jakie występują w zjawiskach czy procesach na skutek upływu czasu. Rodzaj tych zmian jest niewielki: Zjawisko może rosnąć, bądź też pozostawać na tym samym poziomie. Ale należy pamiętać, że wzrost czy spadek zjawiska może być różny - może więc zdarzyć się sytuacja, w której mamy do czynienia ze wzrostem słabszym i wzrostem silniejszym.
Miarami dynamiki są przyrost absolutny, przyrost względny, tempo wzrostu oraz indeksy.
Przyrost absolutny to różnica między wielkością zjawiska w okresie badanym a wielkością zjawiska w okresie uważanym za wzorzec.
Przyrost względny obliczany jest jako stosunek przyrostu absolutnego do wielkości zjawiska w okresie podstawowym.
Tempo wzrostu to przyrost względny wyrażony w procentach.
Indeksy dynamiki (wskaźniki dynamiki) są to miary, które charakteryzują zmiany poziomu zjawiska obserwowanego w różnym czasie. Indeksy są obliczane jako stosunek wielkości zjawiska w okresie badanym do wielkości tego zjawiska w okresie podstawowym. Indeksy są wielkościami niemianowanymi i wyraża się je najczęściej w procentach. Wyróżnia się dwa rodzaje indeksów: Indeksy indywidualne i indeksy agregatowe. W grupie indeksów indywidualnych występują indeksy o podstawie stałej (indeksy jednopodstawowe) i indeksy o podstawie zmiennej (indeksy łańcuchowe)
Średnie tempo dynamiki to miara pozwalająca na ustalenie średniego tempa wzrostu zjawiska. Konieczność stosowania tej miary wynika z tego, że średniego tempa wzrostu nie można obliczyć jako średniej arytmetycznej indeksów łańcuchowych.
ANALIZA WSPÓŁZALEŻNOŚCI ZJAWISK
Dotychczas opisane analizy dotyczyły obserwacji tylko jednej cechy w zbiorowości statystycznej. Jednak bardzo często występują zjawiska pozostające ze sobą w logicznym związku i wzajemnie na siebie oddziaływujące. To oddziaływanie może być silniejsze lub słabsze.
Związek funkcyjny ma miejsce wówczas, gdy każdej wartości jednej cechy odpowiada ściśle określona wartość innej cechy.
Związek korelacyjny ma miejsce wtedy, gdy każdej wartości jednej cechy odpowiada przybliżona wartość innej cechy.
Aby ustalić siłę związku korelacyjnego, posługujemy się jednym z dwóch współczynników: współczynnikiem korelacji i współczynnikiem korelacji rang.
Współczynnik korelacji przyjmuje wartości od -1 do 1. Jeżeli wartość tego współczynnika jest ujemna, to znaczy, że między dwoma zjawiskami występuje korelacja ujemna, a więc ze wzrostem wartości jednej cechy, maleją wartości cechy drugiej. Wartość dodatnia współczynnika oznacza korelację dodatnią. Współczynnik określa także siłę korelacji - im jest on mniejszy, tym związek jest słabszy, im większy - tym korelacja silniejsza.
Współczynnik korelacji rang stosujemy w przypadku, gdy mamy ustalić występowanie lub brak współzależności w mniejszej liczbie obserwacji, zastosowanie go zapewnia uzyskanie takiego wyniku jak przy obliczaniu współczynnika korelacji, ale jest prostszy do obliczania.
Mogą też być wyrażone w promile lub w postaci ułamka.
www.student.e-tools.pl
0