5. Statystyka opisowa – miary zmienności (wzory)
1
Miary pozycyjne
Rozstęp r = x
max
− x
min
.
Kwantyle – wartości danej cechy, które dzielą ją na określone części pod względem liczby jednostek.
Dane muszą być uporządkowane niemalejąco.
Kwartyle dla danych niezgrupowanych
• Kwartyl pierwszy (dolny) Q
1
– dzieli dane tak, że 1/4 jednostek ma wartości niższe lub równe, a
3/4 jednostek ma wartości wyższe lub równe niż kwartyl. (Mediana „lewej połowy danych”.)
• Kwartyl drugi (środkowy) Q
2
to mediana. Dzieli dane tak, że 1/2 jednostek ma wartości niższe
lub równe i 1/2 jednostek ma wartości wyższe lub równe niż kwartyl.
• Kwartyl trzeci (górny) Q
3
– dzieli dane tak, że 3/4 jednostek ma wartości niższe lub równe, a
1/4 jednostek ma wartości wyższe lub równe niż kwartyl. (Mediana „prawej połowy danych”.)
Uwaga Gdy liczba danych jest nieparzysta, to spotyka się dwie definicje kwartyli Q
1
i Q
3
. Jedna
każe włączyć Q
2
zarówno do lewej, jak i do prawej części danych, druga każe Q
2
w ogóle pominąć w
obliczaniu Q
1
i Q
3
.
Kwartyle dla danych zgrupowanych
• Kwartyl pierwszy (dolny)
Q
1
= x
Q
1
+
n
4
−
k−1
P
i=1
n
i
n
Q
1
i
Q
1
,
gdzie:
x
Q
1
– lewy koniec klasy zawierającej pierwszy kwartyl,
n
Q
1
– liczność klasy zawierającej pierwszy kwartyl,
k – numer klasy zawierającej pierwszy kwartyl,
i
Q
1
– szerokość klasy zawierającej pierwszy kwartyl.
• Kwartyl drugi (środkowy)
Q
2
= m
e
= x
m
e
+
n
2
−
k−1
P
i=1
n
i
n
m
e
i
m
e
,
gdzie:
x
m
e
– lewy koniec klasy zawierającej drugi kwartyl,
n
m
e
– liczność klasy zawierającej drugi kwartyl,
k – numer klasy zawierającej drugi kwartyl,
i
m
e
– szerokość klasy zawierającej drugi kwartyl.
• Kwartyl trzeci (górny)
Q
3
= x
Q
3
+
3n
4
−
k−1
P
i=1
n
i
n
Q
3
i
Q
3
,
gdzie:
x
Q
3
– lewy koniec klasy zawierającej trzeci kwartyl,
n
Q
3
– liczność klasy zawierającej trzeci kwartyl,
k – numer klasy zawierającej trzeci kwartyl,
i
Q
3
– szerokość klasy zawierającej trzeci kwartyl.
Rozstęp międzykwartylowy Q
3
− Q
1
.
Odchylenie ćwiartkowe (rozstęp międzykwartylowy połówkowy) Q =
Q
3
−Q
1
2
.
Typowy obszar zmienności (m
e
− Q, m
e
+ Q).
1
2
Miary klasyczne
Odchylenie przeciętne dla danych niezgrupowanych
d =
1
n
n
X
i=1
|x
i
− ¯
x|
Odchylenie przeciętne dla danych zgrupowanych
d =
1
n
k
X
i=1
|s
i
− ¯
x|n
i
,
gdzie:
k – liczba klas,
s
i
– środek i-tej klasy,
n
i
– liczność i-tej klasy,
¯
x – średnia arytmetyczna.
Wariancja dla danych niezgrupowanych
s
2
=
1
n
n
X
i=1
(x
i
− ¯
x)
2
.
Odchylenie standardowe
s =
√
s
2
=
v
u
u
t 1
n
n
X
i=1
(x
i
− ¯
x)
2
.
Typowy obszar zmienności (¯
x − s, ¯
x + s).
Wariancja dla danych zgrupowanych
s
2
=
1
n
k
X
i=1
(s
i
− ¯
x)
2
n
i
,
gdzie:
k – liczba klas,
s
i
– środek i-tej klasy,
n
i
– liczność i-tej klasy,
¯
x – średnia arytmetyczna.
3
Współczynnik zmienności
Miara pozycyjna
v =
Q
m
e
,
gdzie Q – odchylenie ćwiartkowe
Miary klasyczne
v =
d
¯
x
,
gdzie d – odchylenie przeciętne
v =
s
¯
x
2