Temat:
Statystyka opisowa –
opis parametryczny
1
Anna Rajfura, Matematyka i statystyka matematyczna na kierunku Rolnictwo, SGGW
Zagadnienia
Parametryczny opis danych
statystycznych:
a. parametry położenia
b. parametry rozrzutu
c. parametry asymetrii
2
Anna Rajfura, Matematyka i statystyka matematyczna na kierunku Rolnictwo, SGGW
Przypomnienie - populacja
Przykład. Populacja – krowy
pewnej rasy
3
Anna Rajfura, Matematyka i statystyka matematyczna na kierunku Rolnictwo, SGGW
Przypomnienie – populacja
Populacja - zbiór jednostek
statystycznych (populację określa
sam badacz); badanie
statystyczne odnosi się do tych
jednostek.
4
Anna Rajfura, Matematyka i statystyka matematyczna na kierunku Rolnictwo, SGGW
Przypomnienie – cecha
Jednostki statystyczne należące
do określonej populacji różnią się
między sobą pod względem
wybranej cechy.
Przykład. Cecha – zawartość
tłuszczu w mleku krów pewnej
rasy
5
Anna Rajfura, Matematyka i statystyka matematyczna na kierunku Rolnictwo, SGGW
Przypomnienie – populacja
Populacja przedmiotowa – krowy pewnej rasy Populacja zdarzeniowa – zawartość tłuszczu w mleku
2,9%
3,2%
2,7%
3,9%
4,9%
3,3%
2,9%
3,0%
5,1%
2,8%
3,7%
2,8%
3,1%
3,4%
3,3%
2,7%
2,9%
4,8%
4,6%
3,5%
3,9%
2,8%
3,6%
4,4%
4,1%
5,3%
4,5%
3,9%
2,7%
2,9%
3,9%
3,0%
3,6%
2,8%
3,9%
4,8%
4,7%
3,5%
2,7%
3,8%
6
Anna Rajfura, Matematyka i statystyka matematyczna na kierunku Rolnictwo, SGGW
Przypomnienie - próba
Losowanie próby
7
Anna Rajfura, Matematyka i statystyka matematyczna na kierunku Rolnictwo, SGGW
Przypomnienie - próba
Próba - część populacji, która
bezpośrednio podlega badaniu.
Próba jest reprezentatywna, jeśli
zachowuje właściwości struktury
całej populacji.
8
Anna Rajfura, Matematyka i statystyka matematyczna na kierunku Rolnictwo, SGGW
Przypomnienie - próba
Przykład. Próba:
3,9% 2,9% 3,7% 3,1% 2,9%
4,4% 4,5% 2,7% 3,5%
9
Anna Rajfura, Matematyka i statystyka matematyczna na kierunku Rolnictwo, SGGW
Przypomnienie – typy cech
Cechy
mierzalne
niemierzalne
ciągłe
skokowe
10
Anna Rajfura, Matematyka i statystyka matematyczna na kierunku Rolnictwo, SGGW
Przypomnienie - opis statystyczny
Na opis statystyczny składają się:
• opis rozkładu wartości cechy
(rozkładu empirycznego)
• opis parametryczny
11
Anna Rajfura, Matematyka i statystyka matematyczna na kierunku Rolnictwo, SGGW
Przypomnienie – rozkład empiryczny
Szereg rozdzielczy
Klasy wartości
Liczba jednostek
cechy
w klasie
5
-
15
3
15
-
25
13
25
-
35
40
35
-
45
43
45
-
55
15
55
-
65
6
Ogółem
120
12
Anna Rajfura, Matematyka i statystyka matematyczna na kierunku Rolnictwo, SGGW
Przypomnienie – rozkład empiryczny
Liczba
jednostek
50
40
30
20
10
0
10
20
30
40
50
60
Wartość cechy
Histogram, wielobok częstości
13
Anna Rajfura, Matematyka i statystyka matematyczna na kierunku Rolnictwo, SGGW
Przypomnienie – typy rozkładów
Liczba kwadracików
Liczba miotów
45
160
40
140
35
120
30
100
25
80
20
60
15
40
10
20
5
0
0
0
1
2
3
4
5
6
6 i mniej
7
8
9
10
11
12 i
więcej
Liczba komórek drożdży Rys. 1. R. symetryczny
Rys. 2. R. asymetryczny
Liczba aut
Zachmurzenie
35
0,5
30
0,4
25
0,4
0,3
20
0,3
15
0,2
0,2
10
0,1
5
0,1
0,0
0
Pn
Wt
Śr
Cz
Pt
So
N
0
1
2
3
4
5
6
7
8
9
10
Rys. 3. R. równomierny
Rys. 4. Rozkład typu U
14
Anna Rajfura, Matematyka i statystyka matematyczna na kierunku Rolnictwo, SGGW
Opis parametryczny
Czym mogą różnić się dwa
symetryczne rozkłady
dzwonowate?
15
Anna Rajfura, Matematyka i statystyka matematyczna na kierunku Rolnictwo, SGGW
Przykład 1 – masa owocu (g)
Odmiana O1
Odmiana O2
Próba 1: x1, x2, …, x160
Próba 2: y1, y2, …, y160
191,2 193,5 190,0 195,3 197,1 199,5 189,8 197,1
201,2 203,5 200,0 205,3 207,1 209,5 199,8 207,1
193,0 194,5 197,7 193,1 194,2 200,5 193,5 185,3
203,0 204,5 207,7 203,1 204,2 210,5 203,5 195,3
195,1 196,2 195,8 196,9 200,6 189,0 191,6 201,5
205,1 206,2 205,8 206,9 210,6 199,0 201,6 211,5
184,3 186,9 195,1 198,0 202,2 203,5 195,3 200,1
194,3 196,9 205,1 208,0 212,2 213,5 205,3 210,1
197,6 191,5 188,6 192,2 194,6 188,8 193,3 196,8
207,6 201,5 198,6 202,2 204,6 198,8 203,3 206,8
200,8 192,1 195,6 199,8 193,8 189,9 197,0 187,0
210,8 202,1 205,6 209,8 203,8 199,9 207,0 197,0
194,2 190,8 193,9 196,3 198,1 194,2 199,6 196,5
204,2 200,8 203,9 206,3 208,1 204,2 209,6 206,5
198,7 205,8 198,9 190,8 193,8 193,0 194,3 195,4
208,7 215,8 208,9 200,8 203,8 203,0 204,3 205,4
189,5 198,4 199,5 197,7 189,3 197,8 192,5 194,7
199,5 208,4 209,5 207,7 199,3 207,8 202,5 204,7
200,2 197,0 199,9 191,0 189,8 188,3 193,7 193,3
210,2 207,0 209,9 201,0 199,8 198,3 203,7 203,3
196,7 196,9 200,2 197,3 201,8 189,4 206,3 191,6
206,7 206,9 210,2 207,3 211,8 199,4 216,3 201,6
202,7 193,2 193,2 191,6 189,7 194,2 188,1 193,2
212,7 203,2 203,2 201,6 199,7 204,2 198,1 203,2
189,6 193,2 199,5 193,2 194,7 193,7 193,6 197,2
199,6 203,2 209,5 203,2 204,7 203,7 203,6 207,2
197,1 196,0 196,7 194,6 198,1 198,0 199,9 189,2
207,1 206,0 206,7 204,6 208,1 208,0 209,9 199,2
200,2 191,3 191,0 191,9 191,1 193,1 195,4 192,3
210,2 201,3 201,0 201,9 201,1 203,1 205,4 202,3
194,6 197,0 193,4 199,4 198,3 201,4 198,5 201,7
204,6 207,0 203,4 209,4 208,3 211,4 208,5 211,7
195,5 199,4 190,1 200,7 201,6 190,0 196,2 194,1
205,5 209,4 200,1 210,7 211,6 200,0 206,2 204,1
196,7 197,3 194,6 195,6 198,6 197,8 197,3 193,4
206,7 207,3 204,6 205,6 208,6 207,8 207,3 203,4
194,8 197,2 196,1 192,6 202,4 192,7 200,7 189,1
204,8 207,2 206,1 202,6 212,4 202,7 210,7 199,1
194,3 190,7 196,5 194,6 197,6 192,1 190,9 198,8
204,3 200,7 206,5 204,6 207,6 202,1 200,9 208,8
16
Anna Rajfura, Matematyka i statystyka matematyczna na kierunku Rolnictwo, SGGW
Przykład 1 – szereg rozdzielczy
liczebność próby 1.
n = 160
długość klasy
d = 2,5
Numer
Granice
Środek
Liczebność
przedziału
przedziału
przedz. x
n
i
i
1.
<184,05; 186,55)
185,3
2
2.
<186,55;189,05)
187,8
7
3.
<189,05;191,55)
190,3
23
4.
<191,55;194,05)
192,8
32
5.
<194,05;196,55)
195,3
33
6.
<196,55;199,55)
197,8
34
7.
<199,55;201,55)
200,3
20
8.
<201,55;204,05)
202,8
7
9.
<204,05;206,55>
205,3
2
Razem
160
17
Anna Rajfura, Matematyka i statystyka matematyczna na kierunku Rolnictwo, SGGW
Przykład 1 – histogramy
Rozkład wartości cechy w próbie P1
Liczebność ni
40
3
5
32
33
34
30
23
25
20
20
15
10
7
7
5
2
2
Rozkład wartości cechy w próbie P2
0
185,3
187,8
190,3
192,8
195,3
197,8
Liczeb2
n 0
o 0
ść, 3
ni
202,8
205,3
40
wartości cechy
35
32
33
34
30
23
25
20
20
15
10
7
7
5
2
2
0
195,3
197,8
200,3
202,8
205,3
207,8
210,3
212,8
215,3
wartości cechy
18
Anna Rajfura, Matematyka i statystyka matematyczna na kierunku Rolnictwo, SGGW
Przykład 1 – wieloboki częstości
Rozkład wartości
P1
cechy w próbie P1 i P2
P2
Liczebność ni
40
35
30
25
20
15
10
5
0
180,0
190,0
200,0
210,0
220,0
wartości cechy
19
Anna Rajfura, Matematyka i statystyka matematyczna na kierunku Rolnictwo, SGGW
Przykład 2 – masa owocu (w g)
Odmiana O1
Odmiana O3
Próba 1: x1, x2, …, x160
Próba 3: z1, z2, …, z160
191,2 193,5 190,0 195,3 197,1 199,5 189,8 197,1
187,4 192,0 185,0 195,6 199,2 204,0 184,6 199,2
193,0 194,5 197,7 193,1 194,2 200,5 193,5 185,3
191,0 194,0 200,4 191,2 193,4 206,0 192,0 175,6
195,1 196,2 195,8 196,9 200,6 189,0 191,6 201,5
195,2 197,4 196,6 198,8 206,2 183,0 188,2 208,0
184,3 186,9 195,1 198,0 202,2 203,5 195,3 200,1
173,6 178,8 195,2 201,0 209,4 212,0 195,6 205,2
197,6 191,5 188,6 192,2 194,6 188,8 193,3 196,8
200,2 188,0 182,2 189,4 194,2 182,6 191,6 198,6
200,8 192,1 195,6 199,8 193,8 189,9 197,0 187,0
206,6 189,2 196,2 204,6 192,6 184,8 199,0 179,0
194,2 190,8 193,9 196,3 198,1 194,2 199,6 196,5
193,4 186,6 192,8 197,6 201,2 193,4 204,2 198,0
198,7 205,8 198,9 190,8 193,8 193,0 194,3 195,4
202,4 216,6 202,8 186,6 192,6 191,0 193,6 195,8
189,5 198,4 199,5 197,7 189,3 197,8 192,5 194,7
184,0 201,8 204,0 200,4 183,6 200,6 190,0 194,4
200,2 197,0 199,9 191,0 189,8 188,3 193,7 193,3 205,4 199,0 204,8 187,0 184,6 181,6 192,4 191,6
196,7 196,9 200,2 197,3 201,8 189,4 206,3 191,6
198,4 198,8 205,4 199,6 208,6 183,8 217,6 188,2
202,7 193,2 193,2 191,6 189,7 194,2 188,1 193,2
210,4 191,4 191,4 188,2 184,4 193,4 181,2 191,4
189,6 193,2 199,5 193,2 194,7 193,7 193,6 197,2
184,2 191,4 204,0 191,4 194,4 192,4 192,2 199,4
197,1 196,0 196,7 194,6 198,1 198,0 199,9 189,2
199,2 197,0 198,4 194,2 201,2 201,0 204,8 183,4
200,2 191,3 191,0 191,9 191,1 193,1 195,4 192,3
205,4 187,6 187,0 188,8 187,2 191,2 195,8 189,6
194,6 197,0 193,4 199,4 198,3 201,4 198,5 201,7
194,2 199,0 191,8 203,8 201,6 207,8 202,0 208,4
195,5 199,4 190,1 200,7 201,6 190,0 196,2 194,1
196,0 203,8 185,2 206,4 208,2 185,0 197,4 193,2
196,7 197,3 194,6 195,6 198,6 197,8 197,3 193,4
198,4 199,6 194,2 196,2 202,2 200,6 199,6 191,8
194,8 197,2 196,1 192,6 202,4 192,7 200,7 189,1
194,6 199,4 197,2 190,2 209,8 190,4 206,4 183,2
194,3 190,7 196,5 194,6 197,6 192,1 190,9 198,8
193,6 186,4 198,0 194,2 200,2 189,2 186,8 202,6
20
Anna Rajfura, Matematyka i statystyka matematyczna na kierunku Rolnictwo, SGGW
Przykład 2 – wieloboki częstości
Rozkład wartości
P1
cechy w próbie P1 i P3
P3
Liczebność
ni
40
32
33
34
35
30
23
25
20
20
15
7
7
10
2
2
5
0
175,0
185,0
195,0
205,0
215,0
wartości cechy
21
Anna Rajfura, Matematyka i statystyka matematyczna na kierunku Rolnictwo, SGGW
Co opisują parametry?
Przy opisie struktury zbiorowości
parametry (charakterystyki)
opisują własności:
• położenie (przeciętny poziom)
• zróżnicowanie (dyspersję)
• skośność (asymetrię)
22
Anna Rajfura, Matematyka i statystyka matematyczna na kierunku Rolnictwo, SGGW
Rodzaje parametrów
Parametry klasyczne – obliczane na
podstawie wszystkich wyników.
Parametry pozycyjne - wyznaczane na
podstawie pozycji wyników w szeregu
statystycznym lub częstości ich
występowania.
23
Anna Rajfura, Matematyka i statystyka matematyczna na kierunku Rolnictwo, SGGW
Parametry położenia
• wartość średnia (np. arytmetyczna, harmoniczna, geometryczna)
• wartość typowa – najczęściej
występująca (dominanta)
• wartość o ustalonej pozycji w rozkładzie (np. wartość w środku rozkładu -
mediana, wartość w jednej czwartej
rozkładu - kwartyl pierwszy, wartość w jednej dziesiątej rozkładu – decyl pierwszy)
24
Anna Rajfura, Matematyka i statystyka matematyczna na kierunku Rolnictwo, SGGW
Średnia arytmetyczna
Dla próby prostej x , x , ..., x :
1
2
n
x + x
...
x
1
1 +
+
2
+
n
x =
n =
∑ xi
n
n i=1
Dla szeregu rozdzielczego; k - liczba i
klas, nk - liczebność w k-tej klasie: k
∑ &
x& n
+
x n
x&
n
...
x&
n
1
1
+
+
2
2
+
i
i
k
k
i =
x sz =
=
1
n
+ n
...
n
1
+
+
2
+
k
k
∑ n i
i = 1
25
Anna Rajfura, Matematyka i statystyka matematyczna na kierunku Rolnictwo, SGGW
Średnia arytmetyczna z próby prostej Próba prosta 1 - masa owocu odmiany
O1 (w g)
x + x + ... + x
31
7
,
224
x
1
2
n
=
=
=
15
,
195
n
160
26
Anna Rajfura, Matematyka i statystyka matematyczna na kierunku Rolnictwo, SGGW
Średnia arytmetyczna z szeregu rozdz.
Obliczenia na podstawie tych samych
danych zagregowanych w szereg
rozdzielczy:
Ś r od ek pr zed z .
N u me r
G r an ic e
Liczebność
x& n
p r ze dz i a łu
p r ze dz i a łu
x&
i
i
n
i
i
1 .
< 18 4 ,0 5 ; 186 , 55 )
1 85 , 3
2
3 70 , 6
2 .
< 18 6 ,5 5 ;189 , 05 )
1 87 , 8
7
1 31 4 ,6
3 .
< 18 9 ,0 5 ;191 , 55 )
1 90 , 3
2 3
4 37 6 ,9
4 .
< 19 1 ,5 5 ;194 , 05 )
1 92 , 8
3 2
6 16 9 ,6
5 .
< 19 4 ,0 5 ;196 , 55 )
1 95 , 3
3 3
6 44 4 ,9
6 .
< 19 6 ,5 5 ;199 , 55 )
1 97 , 8
3 4
6 72 5 ,2
7 .
< 19 9 ,5 5 ;201 , 55 )
2 00 , 3
2 0
4 00 6 ,0
8 .
< 20 1 ,5 5 ;204 , 05 )
2 02 , 8
7
1 41 9 ,6
9 .
< 20 4 ,0 5 ;206 , 55 >
2 05 , 3
2
4 10 , 6
Ra z e m
1 60
3 12 38 , 0
27
Anna Rajfura, Matematyka i statystyka matematyczna na kierunku Rolnictwo, SGGW
Średnia arytmet. z szer. rozdz., cd.
x
& n + x& n + ... + x n
31
0
,
238
x
1
1
2
2
k
k
=
&
=
=
24
,
195
sz
n + n + ... + n
160
1
2
k
Komentarz:
x =
15
,
195
x
=
24
,
195
sz
28
Anna Rajfura, Matematyka i statystyka matematyczna na kierunku Rolnictwo, SGGW
Parametry rozproszenia
Parametry rozproszenia (dyspersji) -
opisują zróżnicowanie, zmienność
w próbie:
• wariancja (miara klasyczna)
• odchylenie standardowe (miara
klasyczna)
• współczynnik zmienności (miara
klasyczna)
29
Anna Rajfura, Matematyka i statystyka matematyczna na kierunku Rolnictwo, SGGW
Wariancja
Wariancja obciążona:
n
∑ x − n ⋅ x
x − x
+ x − x + ... + x − x
1
2
(
)2
1
(
)2
2
( n
)
2
2
2
i
n
i =1
2
2
s obc =
=
= ∑ x − x
i
n
n
n i=1
Wariancja nieobciążona:
n
∑
− ⋅
−
+
−
+
+
−
2
(
2
2
x
x)2
1
(x x
2
)2 ... (x x
n
)
x
n x
2
i
s
i=1
=
=
n − 1
n − 1
Najmniejsza wartość wariancji wynosi zero, im większe zróżnicowanie, tym większa wartość wariancji.
30
Anna Rajfura, Matematyka i statystyka matematyczna na kierunku Rolnictwo, SGGW
Odchylenie standardowe
Odchylenie standardowe (wyrażane
w takich jednostkach, w jakich
mierzona jest cecha).
2
s = s
31
Anna Rajfura, Matematyka i statystyka matematyczna na kierunku Rolnictwo, SGGW
Współczynnik zmienności
Współczynnik zmienności
s
cv =
⋅ 100%
x
Im mniejszą przyjmuje wartość, tym mniejsza zmienność (mniej zróżnicowana cecha).
32
Anna Rajfura, Matematyka i statystyka matematyczna na kierunku Rolnictwo, SGGW
Asymetria rozkładu wartości cechy *
Przykład. Notowano liczbę błędów popełnianych przez operatorów komputerów w ciągu dnia pracy:
A – po tygodniu od rozpoczęcia pracy, B – po miesiącu od rozpoczęcia pracy, C - po półrocznym okresie pracy.
Liczba
Liczba operatorów
Klasa
błędów
A
B
C
1
0 - 2
1
1
3
2
3 – 4
1
2
5
3
5 – 6
2
4
3
4
7 – 8
3
5
2
5
9 – 10
5
2
1
6
11 – 12
3
1
1
Razem
15
15
15
33
Anna Rajfura, Matematyka i statystyka matematyczna na kierunku Rolnictwo, SGGW
Przykład cd. *
6
5
4
ćś
A
onb 3
e
B
zicL
C
2
1
0
1
2
3
4
5
6
Klasy liczby błędów
A – dominują osoby popełniające dużo błędów B – dominują osoby popełniające średnią ilość błędów
C – dominują osoby popełniające mało błędów 34
Anna Rajfura, Matematyka i statystyka matematyczna na kierunku Rolnictwo, SGGW
Parametry asymetrii *
Parametry asymetrii (skośności):
• moment trzeci względny
(miara klasyczna)
• współczynnik asymetrii
(miara pozycyjna)
35
Anna Rajfura, Matematyka i statystyka matematyczna na kierunku Rolnictwo, SGGW
Parametry asymetrii *
Moment trzeci względny A3
(wzór dla szeregu rozdzielczego)
Moment trzeci centralny:
k
µ = 1
x
&
x n
3 =
∑ ( − )3
i
i
n i=1
Moment trzeci względny:
µ3
A
=
3
3
s
36
Anna Rajfura, Matematyka i statystyka matematyczna na kierunku Rolnictwo, SGGW
Interpretacja *
Interpretacja µ znaku w ocenie kierunku 3
asymetrii:
• µ = 0 rozkład symetryczny
3
• µ > 0 rozkład o asymetrii dodatniej 3
• µ < 0 rozkład o asymetrii ujemnej 3
37
Anna Rajfura, Matematyka i statystyka matematyczna na kierunku Rolnictwo, SGGW
Interpretacja A *
3
Na podstawie badań empirycznych:
• A ∈ −
3
( 2 , 2)
• im wartość A3 bliżej 0, tym słabsza asymetria
• im wartość A3 dalej się od 0, tym większe natężenie asymetrii
38
Anna Rajfura, Matematyka i statystyka matematyczna na kierunku Rolnictwo, SGGW
Przykład - rachunki pomocnicze *
Wyznaczenie parametrów dla przykładu o błędach operatorów:
A
Ra c hun k i po m oc n ic ze :
Ś r o d e k l i c z e b .
K l a s a
k l a s y x
n
x n
( x - x )
( x -
-
( x -
-
i
i
i
i
i
i
x ) 2 ( x i x ) 2 n i
i
x ) 3 ( x i
x ) 3 n i
0 - 2
1
1
1
- 7
4 9
4 9
- 3 43
- 3 43
3 – 4
3 , 5
1
3 , 5
- 4 , 5
2 0 ,2 5
2 0 ,2 5
- 9 1 ,1 25 - 9 1 ,1 25
5 – 6
5 , 5
2
1 1
- 2 , 5
6 , 25
1 2 ,5
- 1 5 ,6 25
- 3 1 ,2 5
7 – 8
7 , 5
3
2 2 ,5
- 0 , 5
0 , 25
0 , 75
- 0 , 12 5
- 0 , 37 5
9 – 10
9 , 5
5
4 7 ,5
1 , 5
2 , 25
1 1 ,2 5
3 , 37 5
1 6 ,8 75
1 1 – 1 2
1 1 ,5
3
3 4 ,5
3 , 5
1 2 ,2 5
3 6 ,7 5
4 2 ,8 75 1 28 , 62 5
Ra z e m
1 5
S u m a
1 30 , 5
- 3 20 , 25
x = 8,00
w ar i an c ja s2
8 , 70
o dc h . st an d. s
2 , 95
µ
- 2 1 ,3 5
3
A
- 0 , 83
3
39
Anna Rajfura, Matematyka i statystyka matematyczna na kierunku Rolnictwo, SGGW
A:
B:
C
µ
-
2
1
,
3
5
-
3
,29 15,26
3
A -
0 ,
8
3
-
0,19 0,57
3
6
5
4
ćś
A
onbe 3
B
zicL
C
2
1
0
1
2
3
4
5
6
Klasy liczby błędów
40
Anna Rajfura, Matematyka i statystyka matematyczna na kierunku Rolnictwo, SGGW