MIARY ZMIENNOŚCI
Zjawiska masowe są uwarunkowane działaniem zarówno przyczyn głównych (wywołujących zmienność statystyczną), jak i przyczyn ubocznych (wywołujących zmienność przypadkową). Liczbowy rozmiar badanego zjawiska masowego może być zatem rozłożony na dwa składniki, będące rezultatami zmienności systematycznej i przypadkowej. Przybliżonym miernikiem składnika systematycznego zbiorowości statystycznej są miary średnie. Odchylenia poszczególnych wartości jednostek od wartości średnich powstają pod wpływem przyczyn przypadkowych. Do pomiaru tych odchyleń wykorzystuje się miary zmienności (zróżnicowania, dyspersji, rozproszenia).
Dyspersją nazywamy zróżnicowanie jednostek zbiorowości statystycznej ze względu na wartość badanej cechy. Miary dyspersji pozwalają zatem na uogólnienie różnic w wartościach cechy zaobserwowanych u poszczególnych jednostek. Siłę dyspersji można oceniać za pomocą klasycznych i pozycyjnych miar. Ocena dyspersji za pomocą miar klasycznych przyjmuje za punkt odniesienia średnią arytmetyczną. Pozycyjne miary zmienności wyznaczane są głównie na podstawie kwartyli. Do klasycznych miar zmienności zaliczamy:
wariancję
odchylenia standardowe,
odchylenie przeciętne (dewiata),
współczynnik zmienności - jeśli do jego obliczania wykorzystujemy śr arytm i odchyl stand.
Grupę pozycyjnych miar zmienności tworzą:
empiryczny obszar zmienności (rozstęp, amplituda wahań, pole rozsiania),
odchylenie ćwiartkowe,
współczynnik zmienności - jeśli do obliczania przyjmuje się odchylenie ćwiartkowe i medianę.
Miary zmienności można podzielić na bezwzględne (absolutne) i względne (relatywne). Do bezwzględnych miar zróżnicowania zalicza się:
obszar zmienności,
wariancję,
odchylenie standardowe,
odchylenie przeciętne
odchylenie ćwiartkowe.
Absolutne miary zmienności są wielkościami mianowanymi (posiadają takie miano, jakie ma badana cecha). Względną miarą dyspersji jest współczynnik zmienności wyrażany w procentach. Służy on do porównywania zmienności cech mierzonych różnymi jednostkami, jak też porównywania kilku zbiorowości pod względem tej samej cechy, ale będącej na różnym poziomie (określonym średnią arytmetyczną lub inna miarą przeciętną).
Empiryczny obszar zmienności jest różnicą pomiędzy największą i najmniejszą wartością zmiennej w badanej zbiorowości:
R = Xmax - Xmin
Jak wynika ze wzoru obszar zmienności możemy określić ściśle tylko na podstawie szeregu wyliczającego. Na podstawie szeregu rozdzielczego przedziałowego możemy jedynie określić jego przybliżoną wartość, jako różnicę pomiędzy górną granicą ostatniej klasy i dolną granicą klasy pierwszej. Jeżeli jednak szereg rozdzielczy przedziałowy posiada otwarte klasy, to nawet przybliżone określenie obszaru zmienności jest niemożliwe. Obszar zmienności jest miarą prostą i łatwą do obliczania. Posiada jednak poważną wadę: jego wartość zależy jedynie od wartości zmiennej dwóch jednostek zbiorowości. Tym samym nie daje informacji, jak dalece różnia się pomiędzy sobą pozostałe jednostki zbiorowości. Dlatego też obszar zmienności zalicza oblicza się zwykle w celu wstępnej informacji, na jakiej przestrzeni (obszarze) rozciągnięte są wartości badanej zmiennej.
Odchylenie przeciętne - określa o ile wszystkie jednostki danej zbiorowości różnią się średnio ze względu na wartość zmiennej od średniej arytmetycznej tej zmiennej. Odchylenie przeciętna jest średnią arytmetyczną bezwzględnych wartości modułów odchyleń wartości cechy od jej średniej arytmetycznej co można zapisać następująco:
Sposób obliczania odchylenia przeciętnego zilustrujemy na podstawie danych zawartych w tabeli.
Staż pracy w latach (x0i - x1i) |
Liczba nauczycieli (ni) |
Obliczenia pomocnicze |
|||
|
|
|
|
|
|
0 - 5 5 - 10 10 - 15 15 - 20 20 - 25 25 - 30 30 - 35 |
4 7 10 15 8 4 2 |
2,5 7,5 12,5 17,5 22,5 27,5 32,5 |
10,0 52,5 125,0 262,5 180,0 110,0 65,0 |
13,6 8,6 3,6 1,4 6,4 11,4 16,4 |
54,4 60,2 36,0 21,0 51,2 45,6 32,8 |
Rzaem |
50 |
x |
805 |
x |
301,2 |
Do obliczenia odchylenia przeciętnego wykorzystamy wzór:
Najpierw obliczamy średni staż pracy:
Otrzymany wynik oznacza że przeciętne zróżnicowanie badanej zbiorowości nauczycieli ze względu na staż pracy wynosi 6 lat.
Wariancja - to średnia arytmetyczna z kwadratów odchyleń poszczególnych wartości cechy od średniej arytmetycznej całej zbiorowości. Obliczamy się ją w następujący sposób:
Technika obliczania wariancji na przykładzie danych zawartych w tabeli:
Wiek zmarłych w latach (x0i - x1i) |
Liczba zmarłych (ni) |
Obliczenia pomocnicze |
||||
|
|
|
|
|
|
|
0 - 6 7 - 13 14 - 20 21 - 27 28 - 29 |
3186 623 336 243 74 |
3,0 10,0 17,0 24,0 28,5 |
9558 6230 5712 5832 2109 |
-3,6 3,4 10,4 17,4 21,9 |
12,96 11,56 108,16 302,76 479,61 |
41290,56 7201,88 36341,76 73570,68 35491,14 |
Rzaem |
4462 |
X |
29441 |
x |
x |
193896,02 |
W celu obliczenia wariancji należy najpierw obliczyć średnią arytmetyczną:
Wariancja jako suma kwadratów dzielona przez liczbę dodatnią jest zawsze wielkością nieujemną i mianowaną. Mianem wariancji jest kwadrat jednostki fizycznej, w jakiej mierzona jest badana cecha. Im zbiorowość jest bardziej zróżnicowana, tym wyższa jest wartość wariancji.
Odchylenie standardowe jest pierwiastkiem kwadratowym z wariancji, czyli:
Odchylenie standardowe określa, o ile wszystkie jednostki badanej zbiorowości różnią się średnio ze względu na wartość badanej zmiennej od średniej arytmetycznej tej zmiennej. Z zależności między wariancją a odchyleniem standardowym wynika, że zawsze gdy chcemy obliczyć odchylenie standardowe, etapem pośrednim jest wyliczenie wariancji.
Odchylenie standardowe można wykorzystać do konstrukcji typowego obszaru zmienności badanej cechy. W obszarze tym mieści się około 2/3 wszystkich jednostek badanej zbiorowości statystycznej, gdyż jest on zawarty w granicach dwóch odchyleń standardowych:
Typowy obszar zmienności określa wzór:
Pomiędzy odchyleniami: ćwiartkowym, przeciętnym i standardowym, obliczonymi z tego samego szeregu zachodzi następująca relacja
Q < d < s
Dlatego porównując dyspersję różnych szeregów (posiadających to samo miano i zblizony średni poziom cechy) należy dla każdego z nich obliczyć tę samą miarę zróżnicowania.. niewłaściwym byłoby zatem wyciąganie wniosków o zmienności cech w dwóch zbiorowościach przez porównanie np. odchylenia przecietnego dla jednej zbiorowości i odchylenia standardowego dla drugiej.
Z odchyleniem standardowym wiąże się tzw. Reguła trzech sigm. W myśl tej reguły wystąpienie obserwacji o wartości cechy spoza przedziału
jest mało prawdopodobne. W przypadku rozkładów o niewielkiej asymetrii tylko około 1/3 obserwacji wykracza poza przedział wyznaczony przez średnią arytmetyczną i jedno odchylenie standardowe, a jedynie ok. 5% obserwacji poza przedział dwóch sigm. Poza granice trzech sigm wykracza ok. 0,3% obserwacji.
Omówione dotychczas miary dyspersji są miarami bezwzględnymi gdyż są one wyrażane w jednostkach w jakich wyrażone są wartości badanej zmiennej. Nie pozwala to na pełna ocenę siły dyspersji (brak punktu odniesienia), wyklucza możliwość porównywania różnych zbiorowości rozpatrywanych ze względu na tę samą cechę, nie daje możliwości porównywania zmienności charakteryzowanej z punktu widzenia kilku cech, wyrażonych w różnych mianach. Dlatego też w analizie dyspersji stosuje się względną miarę zróżnicowania - współczynnik zmienności.
Współczynnik zmienności jest ilorazem bezwzględnej miary dyspersji do odpowiednich wartości średnich. Współczynnik zmienności wyrażamy w procentach. Z uwagi na fakt że przy analizie rozkładu wartości cechy korzystamy z różnych miar zróżnicowania i przeciętnych, istnieje możliwość obliczania współczynnika zmienności kilkoma metoedami:
Dla szeregu wyliczającego
Dla szeregu rozdzielczego punktowego
Dla szeregu rozdzielczego przedziałowego
Dla szeregu wyliczającego
Dla szeregu rozdzielczego punktowego
Dla szeregu rozdzielczego przedziałowego