Miary zmienności
Wartości średnie nie dają wyczerpującej charakterystyki struktury
zbiorowości. Przede wszystkim nie informują o stopniu zmienności
(dyspersji) badanej cechy. Dyspersją nazywamy zróżnicowanie jednostek
zbiorowości ze względu na wartość badanej cechy. Siłę dyspersji
oceniamy za pomocą pozycyjnych i klasycznych miar zmienności. Do
miar klasycznych zaliczamy: odchylenie przeciętne, wariancję, odchylenie
standardowe oraz współczynnik zmienności (w zależności od techniki
obliczania może być również pozycyjną miarą dyspersji)
Odchylenie przeciętne określa, o ile wszystkie jednostki danej
zbiorowości różnią się średnio ze względu na wartość zmiennej od średniej
arytmetycznej tej zmiennej. Odchylenie przeciętne jest średnią
arytmetyczną bezwzględnych wartość (modułów) odchyleń
wartości cechy od jej średniej arytmetycznej. Oblicza się je wg
wzoru:
dla szeregu wyliczającego:
∑
=
−
=
N
i
i
x
x
N
d
1
1
dla szeregu rozdzielczego punktowego:
i
k
i
i
n
x
x
N
d
⋅
−
=
∑
=
1
1
dla szeregu rozdzielczego przedziałowego:
i
k
i
i
n
x
x
N
d
⋅
−
=
∑
=
1
0
1
Ćwiczenie 5
Oblicz odchylenie przeciętne dla podanego szeregu
Tab. Nauczyciele szkół średnich w miejscowości Z wg stażu pracy
Staż pracy
(w latach)
Liczba
nauczyciel
i
i
n
Obliczenie pomocnicze
0
i
x
i
i
n
x
0
i
i
n
x
0
i
i
i
n
n
x
⋅
0
0-5
5-10
10-15
15-20
20-25
4
7
10
15
8
2,5
7,5
12,5
17,5
22,5
10,0
52,5
125,0
262,5
180,0
13,6
8,6
3,6
1,4
6,4
54,4
60,2
36,0
21,0
51,2
25-30
30-35
4
2
27,5
32,5
110,0
65,0
11,4
16,4
45,6
32,8
Ogółem
50
x
805,0
x
301,2
Źródło: M. Sobczyk, Statystyka, PWN, W-wa 1991, s.45.
Najpierw należy obliczyć średni staż pracy:
lat
x
1
,
16
50
805
=
=
Wynik podstawiamy do wzoru:
lat
d
6
2
,
301
50
1
=
⋅
=
Otrzymany wynik oznacza, że przeciętne zróżnicowanie badanej
zbiorowości nauczycieli ze względu na staż pracy wynosi
±
6 lat.
Wariancja jest to średnia arytmetyczna z kwadratów odchyleń
poszczególnych wartości cechy od średniej arytmetycznej całej
zbiorowości.
Dla szeregu wyliczającego oblicza się ją wg wzoru:
∑
=
−
=
N
i
i
x
x
N
s
1
2
2
)
(
1
Dla szeregu rozdzielczego punktowego:
i
N
i
i
n
x
x
N
s
∑
=
−
=
1
2
2
)
(
1
Dla szeregu rozdzielczego przedziałowego:
i
N
i
i
n
x
x
N
s
∑
=
−
=
1
2
0
2
)
(
1
Ćwiczenie 6
Oblicz wariancję z podanego szeregu.
Tab. Zgony niemowląt na wsi wg wieku w Polsce w 1977 r.
Wiek
zmarłych
(dni)
i
i
x
x
1
0
−
Liczba
zmarłyc
h
i
n
Obliczenie pomocnicze
0
i
x
i
i
n
x
0
x
x
i
−
2
0
−
x
x
i
i
i
n
x
x
2
0
−
0-6
3 186
3,0
9 558
-3,6
12,96
41 290,56
7-13
14-20
21-27
28-29
623
336
243
74
10,0
17,0
24,0
28,5
6 230
5 712
5 832
2 109
3,4
10,4
17,4
21,9
11,56
108,16
302,76
479,61
7 201,88
36 341,76
73 570,68
35 491,14
Ogółem
4 462
x
29 441
x
x
193 896,02
Źródło: M. Sobczyk, Statystyka, PWN, W-wa 1991, s.47.
Najpierw należy obliczyć średnią arytmetyczną:
dnia
x
6
,
6
4462
29441
=
=
Następnie podstawiamy do wzoru:
2
2
5
,
43
4462
02
,
193896
dni
s
=
=
Wariancja, jako suma kwadratów dzielona przez liczbę dodatnią jest
zawsze wielkością dodatnią i mianowaną. Mianem wariancji jest kwadrat
jednostki fizycznej, w jakiej mierzona jest badana cecha.
Im zbiorowość jest bardziej zróżnicowana tym wyższa jest wartość
wariancji
Wariancja obliczona na podstawie szeregów rozdzielczych przedziałowych
jest wielkością zawyżoną. Powoduje to fakt, że do obliczeń wykorzystuje
się środki przedziałów klasowych, a nie średnie arytmetyczne z
poszczególnych klas.
Wariancja jest wielkością kwadratową. Aby uzyskać miarę zróżnicowania o
postaci liniowej (o mianie zgodnym z mianem badanej cechy), wyciągamy
pierwiastek kwadratowy. W wyniku pierwiastkowania otrzymujemy tzw.
odchylenie standardowe.
Odchylenie standardowe jest pierwiastkiem kwadratowym z
wariancji.
2
s
s
=
Odchylenie standardowe określa o ile wszystkie jednostki danej
zbiorowości różnią się średnio od średniej arytmetycznej badanej
zmiennej. Dla poszczególnych rodzajów szeregów korzystamy z
odpowiednich wzorów na wariancję, a następnie wyciągamy pierwiastek
kwadratowy z wariancji.
Możemy je wykorzystać do konstrukcji typowego obszaru zmienności
badanej cechy. W obszarze tym mieści się około 2/3 wszystkich jednostek
badanej zbiorowości statystycznej. Typowy obszar zmienności określa
wzór: