Temat:

Statystyka opisowa –

opis parametryczny

1

Anna Rajfura, Matematyka i statystyka matematyczna na kierunku Rolnictwo, SGGW

Zagadnienia

Parametryczny opis danych

statystycznych:

a. parametry połoŜenia

b. parametry rozrzutu

c. parametry asymetrii

2

Anna Rajfura, Matematyka i statystyka matematyczna na kierunku Rolnictwo, SGGW

Przypomnienie - populacja

Przykład. Populacja – krowy

pewnej rasy

3

Anna Rajfura, Matematyka i statystyka matematyczna na kierunku Rolnictwo, SGGW

Przypomnienie – populacja

Populacja - zbiór jednostek

statystycznych (populację określa

sam badacz); badanie

statystyczne odnosi się do tych

jednostek.

4

Anna Rajfura, Matematyka i statystyka matematyczna na kierunku Rolnictwo, SGGW

Przypomnienie – cecha

Jednostki statystyczne naleŜące

do określonej populacji róŜnią się

między sobą pod względem

wybranej cechy.

Przykład. Cecha – zawartość

tłuszczu w mleku krów pewnej

rasy

5

Anna Rajfura, Matematyka i statystyka matematyczna na kierunku Rolnictwo, SGGW

Przypomnienie – populacja

Populacja przedmiotowa – krowy pewnej rasy Populacja zdarzeniowa – zawartość tłuszczu w mleku

2,9%

3,2%

2,7%

3,9%

4,9%

3,3%

2,9%

3,0%

5,1%

2,8%

3,7%

2,8%

3,1%

3,4%

3,3%

2,7%

2,9%

4,8%

4,6%

3,5%

3,9%

2,8%

3,6%

4,4%

4,1%

5,3%

4,5%

3,9%

2,7%

2,9%

3,9%

3,0%

3,6%

2,8%

3,9%

4,8%

4,7%

3,5%

2,7%

3,8%

6

Anna Rajfura, Matematyka i statystyka matematyczna na kierunku Rolnictwo, SGGW

Przypomnienie - próba

Losowanie próby

7

Anna Rajfura, Matematyka i statystyka matematyczna na kierunku Rolnictwo, SGGW

Przypomnienie - próba

Próba - część populacji, która

bezpośrednio podlega badaniu.

Próba jest reprezentatywna, jeśli

zachowuje właściwości struktury

całej populacji.

8

Anna Rajfura, Matematyka i statystyka matematyczna na kierunku Rolnictwo, SGGW

Przypomnienie - próba

Przykład. Próba:

3,9% 2,9% 3,7% 3,1% 2,9%

4,4% 4,5% 2,7% 3,5%

9

Anna Rajfura, Matematyka i statystyka matematyczna na kierunku Rolnictwo, SGGW

Przypomnienie – typy cech

Cechy

mierzalne

niemierzalne

ciągłe

skokowe

10

Anna Rajfura, Matematyka i statystyka matematyczna na kierunku Rolnictwo, SGGW

Przypomnienie - opis statystyczny

Na opis statystyczny składają się:

• opis rozkładu wartości cechy

(rozkładu empirycznego)

• opis parametryczny

11

Anna Rajfura, Matematyka i statystyka matematyczna na kierunku Rolnictwo, SGGW

Przypomnienie – rozkład empiryczny

Szereg rozdzielczy

Klasy wartości

Liczba jednostek

cechy

w klasie

5

-

15

3

15

-

25

13

25

-

35

40

35

-

45

43

45

-

55

15

55

-

65

6

Ogółem

120

12

Anna Rajfura, Matematyka i statystyka matematyczna na kierunku Rolnictwo, SGGW

Przypomnienie – rozkład empiryczny

Liczba

jednostek

50

40

30

20

10

0

10

20

30

40

50

60

Wartość cechy

Histogram, wielobok częstości

13

Anna Rajfura, Matematyka i statystyka matematyczna na kierunku Rolnictwo, SGGW

Przypomnienie – typy rozkładów

Liczba kwadracików

Liczba miotów

45

160

40

140

35

120

30

100

25

80

20

60

15

40

10

20

5

0

0

0

1

2

3

4

5

6

6 i mniej

7

8

9

10

11

12 i

więcej

Liczba komórek droŜdŜy Rys. 1. R. symetryczny

Rys. 2. R. asymetryczny

Liczba aut

Zachmurzenie

35

0,5

30

0,4

25

0,4

0,3

20

0,3

15

0,2

0,2

10

0,1

5

0,1

0,0

0

Pn

Wt

Śr

Cz

Pt

So

N

0

1

2

3

4

5

6

7

8

9

10

Rys. 3. R. równomierny

Rys. 4. Rozkład typu U

14

Anna Rajfura, Matematyka i statystyka matematyczna na kierunku Rolnictwo, SGGW

Opis parametryczny

Czym mogą róŜnić się dwa

symetryczne rozkłady

dzwonowate?

15

Anna Rajfura, Matematyka i statystyka matematyczna na kierunku Rolnictwo, SGGW

Przykład 1 – masa owocu (g)

Odmiana O1

Odmiana O2

Próba 1: x1, x2, …, x160

Próba 2: y1, y2, …, y160

191,2 193,5 190,0 195,3 197,1 199,5 189,8 197,1

201,2 203,5 200,0 205,3 207,1 209,5 199,8 207,1

193,0 194,5 197,7 193,1 194,2 200,5 193,5 185,3

203,0 204,5 207,7 203,1 204,2 210,5 203,5 195,3

195,1 196,2 195,8 196,9 200,6 189,0 191,6 201,5

205,1 206,2 205,8 206,9 210,6 199,0 201,6 211,5

184,3 186,9 195,1 198,0 202,2 203,5 195,3 200,1

194,3 196,9 205,1 208,0 212,2 213,5 205,3 210,1

197,6 191,5 188,6 192,2 194,6 188,8 193,3 196,8

207,6 201,5 198,6 202,2 204,6 198,8 203,3 206,8

200,8 192,1 195,6 199,8 193,8 189,9 197,0 187,0

210,8 202,1 205,6 209,8 203,8 199,9 207,0 197,0

194,2 190,8 193,9 196,3 198,1 194,2 199,6 196,5

204,2 200,8 203,9 206,3 208,1 204,2 209,6 206,5

198,7 205,8 198,9 190,8 193,8 193,0 194,3 195,4

208,7 215,8 208,9 200,8 203,8 203,0 204,3 205,4

189,5 198,4 199,5 197,7 189,3 197,8 192,5 194,7

199,5 208,4 209,5 207,7 199,3 207,8 202,5 204,7

200,2 197,0 199,9 191,0 189,8 188,3 193,7 193,3

210,2 207,0 209,9 201,0 199,8 198,3 203,7 203,3

196,7 196,9 200,2 197,3 201,8 189,4 206,3 191,6

206,7 206,9 210,2 207,3 211,8 199,4 216,3 201,6

202,7 193,2 193,2 191,6 189,7 194,2 188,1 193,2

212,7 203,2 203,2 201,6 199,7 204,2 198,1 203,2

189,6 193,2 199,5 193,2 194,7 193,7 193,6 197,2

199,6 203,2 209,5 203,2 204,7 203,7 203,6 207,2

197,1 196,0 196,7 194,6 198,1 198,0 199,9 189,2

207,1 206,0 206,7 204,6 208,1 208,0 209,9 199,2

200,2 191,3 191,0 191,9 191,1 193,1 195,4 192,3

210,2 201,3 201,0 201,9 201,1 203,1 205,4 202,3

194,6 197,0 193,4 199,4 198,3 201,4 198,5 201,7

204,6 207,0 203,4 209,4 208,3 211,4 208,5 211,7

195,5 199,4 190,1 200,7 201,6 190,0 196,2 194,1

205,5 209,4 200,1 210,7 211,6 200,0 206,2 204,1

196,7 197,3 194,6 195,6 198,6 197,8 197,3 193,4

206,7 207,3 204,6 205,6 208,6 207,8 207,3 203,4

194,8 197,2 196,1 192,6 202,4 192,7 200,7 189,1

204,8 207,2 206,1 202,6 212,4 202,7 210,7 199,1

194,3 190,7 196,5 194,6 197,6 192,1 190,9 198,8

204,3 200,7 206,5 204,6 207,6 202,1 200,9 208,8

16

Anna Rajfura, Matematyka i statystyka matematyczna na kierunku Rolnictwo, SGGW

Przykład 1 – szereg rozdzielczy

liczebność próby 1.

n = 160

długość klasy

d = 2,5

Numer

Granice

Środek

Liczebność

przedziału

przedziału

przedz. x

n

i

i

1.

<184,05; 186,55)

185,3

2

2.

<186,55;189,05)

187,8

7

3.

<189,05;191,55)

190,3

23

4.

<191,55;194,05)

192,8

32

5.

<194,05;196,55)

195,3

33

6.

<196,55;199,55)

197,8

34

7.

<199,55;201,55)

200,3

20

8.

<201,55;204,05)

202,8

7

9.

<204,05;206,55>

205,3

2

Razem

160

17

Anna Rajfura, Matematyka i statystyka matematyczna na kierunku Rolnictwo, SGGW

Przykład 1 – histogramy

Rozkład wartości cechy w próbie P1

Liczebność ni

40

3

5

32

33

34

30

23

25

20

20

15

10

7

7

5

2

2

Rozkład wartości cechy w próbie P2

0

185,3

187,8

190,3

192,8

195,3

197,8

Liczeb2

n 0

o 0

ść, 3

ni

202,8

205,3

40

wartości cechy

35

32

33

34

30

23

25

20

20

15

10

7

7

5

2

2

0

195,3

197,8

200,3

202,8

205,3

207,8

210,3

212,8

215,3

wartości cechy

18

Anna Rajfura, Matematyka i statystyka matematyczna na kierunku Rolnictwo, SGGW

Przykład 1 – wieloboki częstości

Rozkład wartości

P1

cechy w próbie P1 i P2

P2

Liczebność ni

40

35

30

25

20

15

10

5

0

180,0

190,0

200,0

210,0

220,0

wartości cechy

19

Anna Rajfura, Matematyka i statystyka matematyczna na kierunku Rolnictwo, SGGW

Przykład 2 – masa owocu (w g)

Odmiana O1

Odmiana O3

Próba 1: x1, x2, …, x160

Próba 3: z1, z2, …, z160

191,2 193,5 190,0 195,3 197,1 199,5 189,8 197,1

187,4 192,0 185,0 195,6 199,2 204,0 184,6 199,2

193,0 194,5 197,7 193,1 194,2 200,5 193,5 185,3

191,0 194,0 200,4 191,2 193,4 206,0 192,0 175,6

195,1 196,2 195,8 196,9 200,6 189,0 191,6 201,5

195,2 197,4 196,6 198,8 206,2 183,0 188,2 208,0

184,3 186,9 195,1 198,0 202,2 203,5 195,3 200,1

173,6 178,8 195,2 201,0 209,4 212,0 195,6 205,2

197,6 191,5 188,6 192,2 194,6 188,8 193,3 196,8

200,2 188,0 182,2 189,4 194,2 182,6 191,6 198,6

200,8 192,1 195,6 199,8 193,8 189,9 197,0 187,0

206,6 189,2 196,2 204,6 192,6 184,8 199,0 179,0

194,2 190,8 193,9 196,3 198,1 194,2 199,6 196,5

193,4 186,6 192,8 197,6 201,2 193,4 204,2 198,0

198,7 205,8 198,9 190,8 193,8 193,0 194,3 195,4

202,4 216,6 202,8 186,6 192,6 191,0 193,6 195,8

189,5 198,4 199,5 197,7 189,3 197,8 192,5 194,7

184,0 201,8 204,0 200,4 183,6 200,6 190,0 194,4

200,2 197,0 199,9 191,0 189,8 188,3 193,7 193,3 205,4 199,0 204,8 187,0 184,6 181,6 192,4 191,6

196,7 196,9 200,2 197,3 201,8 189,4 206,3 191,6

198,4 198,8 205,4 199,6 208,6 183,8 217,6 188,2

202,7 193,2 193,2 191,6 189,7 194,2 188,1 193,2

210,4 191,4 191,4 188,2 184,4 193,4 181,2 191,4

189,6 193,2 199,5 193,2 194,7 193,7 193,6 197,2

184,2 191,4 204,0 191,4 194,4 192,4 192,2 199,4

197,1 196,0 196,7 194,6 198,1 198,0 199,9 189,2

199,2 197,0 198,4 194,2 201,2 201,0 204,8 183,4

200,2 191,3 191,0 191,9 191,1 193,1 195,4 192,3

205,4 187,6 187,0 188,8 187,2 191,2 195,8 189,6

194,6 197,0 193,4 199,4 198,3 201,4 198,5 201,7

194,2 199,0 191,8 203,8 201,6 207,8 202,0 208,4

195,5 199,4 190,1 200,7 201,6 190,0 196,2 194,1

196,0 203,8 185,2 206,4 208,2 185,0 197,4 193,2

196,7 197,3 194,6 195,6 198,6 197,8 197,3 193,4

198,4 199,6 194,2 196,2 202,2 200,6 199,6 191,8

194,8 197,2 196,1 192,6 202,4 192,7 200,7 189,1

194,6 199,4 197,2 190,2 209,8 190,4 206,4 183,2

194,3 190,7 196,5 194,6 197,6 192,1 190,9 198,8

193,6 186,4 198,0 194,2 200,2 189,2 186,8 202,6

20

Anna Rajfura, Matematyka i statystyka matematyczna na kierunku Rolnictwo, SGGW

Przykład 2 – wieloboki częstości

Rozkład wartości

P1

cechy w próbie P1 i P3

P3

Liczebność

ni

40

32

33

34

35

30

23

25

20

20

15

7

7

10

2

2

5

0

175,0

185,0

195,0

205,0

215,0

wartości cechy

21

Anna Rajfura, Matematyka i statystyka matematyczna na kierunku Rolnictwo, SGGW

Co opisują parametry?

Przy opisie struktury zbiorowości

parametry (charakterystyki)

opisują własności:

• połoŜenie (przeciętny poziom)

• zróŜnicowanie (dyspersję)

• skośność (asymetrię)

22

Anna Rajfura, Matematyka i statystyka matematyczna na kierunku Rolnictwo, SGGW

Rodzaje parametrów

Parametry klasyczne – obliczane na

podstawie wszystkich wyników.

Parametry pozycyjne - wyznaczane na

podstawie pozycji wyników w szeregu

statystycznym lub częstości ich

występowania.

23

Anna Rajfura, Matematyka i statystyka matematyczna na kierunku Rolnictwo, SGGW

Parametry połoŜenia

• wartość średnia (np. arytmetyczna, harmoniczna, geometryczna)

• wartość typowa – najczęściej

występująca (dominanta)

• wartość o ustalonej pozycji w rozkładzie (np. wartość w środku rozkładu -

mediana, wartość w jednej czwartej

rozkładu - kwartyl pierwszy, wartość w jednej dziesiątej rozkładu – decyl pierwszy)

24

Anna Rajfura, Matematyka i statystyka matematyczna na kierunku Rolnictwo, SGGW

Średnia arytmetyczna

Dla próby prostej x , x , ..., x :

1

2

n

x + x

...

x

1

1 +

+

2

+

n

x =

n =

∑ xi

n

n i=1

Dla szeregu rozdzielczego; k - liczba i

klas, nk - liczebność w k-tej klasie: k

∑ &

x& n

+

x n

x&

n

...

x&

n

1

1

+

+

2

2

+

i

i

k

k

i =

x sz =

=

1

n

+ n

...

n

1

+

+

2

+

k

k

∑ n i

i = 1

25

Anna Rajfura, Matematyka i statystyka matematyczna na kierunku Rolnictwo, SGGW

Średnia arytmetyczna z próby prostej Próba prosta 1 - masa owocu odmiany

O1 (w g)

x + x + ... + x

31

7

,

224

x

1

2

n

=

=

=

15

,

195

n

160

26

Anna Rajfura, Matematyka i statystyka matematyczna na kierunku Rolnictwo, SGGW

Średnia arytmetyczna z szeregu rozdz.

Obliczenia na podstawie tych samych

danych zagregowanych w szereg

rozdzielczy:

Ś r od ek pr zed z .

N u me r

G r an ic e

Liczebność

x& n

p r ze dz i a łu

p r ze dz i a łu

x&

i

i

n

i

i

1 .

< 18 4 ,0 5 ; 186 , 55 )

1 85 , 3

2

3 70 , 6

2 .

< 18 6 ,5 5 ;189 , 05 )

1 87 , 8

7

1 31 4 ,6

3 .

< 18 9 ,0 5 ;191 , 55 )

1 90 , 3

2 3

4 37 6 ,9

4 .

< 19 1 ,5 5 ;194 , 05 )

1 92 , 8

3 2

6 16 9 ,6

5 .

< 19 4 ,0 5 ;196 , 55 )

1 95 , 3

3 3

6 44 4 ,9

6 .

< 19 6 ,5 5 ;199 , 55 )

1 97 , 8

3 4

6 72 5 ,2

7 .

< 19 9 ,5 5 ;201 , 55 )

2 00 , 3

2 0

4 00 6 ,0

8 .

< 20 1 ,5 5 ;204 , 05 )

2 02 , 8

7

1 41 9 ,6

9 .

< 20 4 ,0 5 ;206 , 55 >

2 05 , 3

2

4 10 , 6

Ra z e m

1 60

3 12 38 , 0

27

Anna Rajfura, Matematyka i statystyka matematyczna na kierunku Rolnictwo, SGGW

Średnia arytmet. z szer. rozdz., cd.

x

& n + x& n + ... + x n

31

0

,

238

x

1

1

2

2

k

k

=

&

=

=

24

,

195

sz

n + n + ... + n

160

1

2

k

Komentarz:

x =

15

,

195

x

=

24

,

195

sz

28

Anna Rajfura, Matematyka i statystyka matematyczna na kierunku Rolnictwo, SGGW

Parametry rozproszenia

Parametry rozproszenia (dyspersji) -

opisują zróŜnicowanie, zmienność

w próbie:

• wariancja (miara klasyczna)

• odchylenie standardowe (miara

klasyczna)

• współczynnik zmienności (miara

klasyczna)

29

Anna Rajfura, Matematyka i statystyka matematyczna na kierunku Rolnictwo, SGGW

Wariancja

Wariancja obciąŜona:

n

∑ x − n ⋅ x

x − x

+ x − x + ... + x − x

1

2

(

)2

1

(

)2

2

( n

)

2

2

2

i

n

i =1

2

2

s obc =

=

= ∑ x − x

i

n

n

n i=1

Wariancja nieobciąŜona:

n

∑

− ⋅

−

+

−

+

+

−

2

(

2

2

x

x)2

1

(x x

2

)2 ... (x x

n

)

x

n x

2

i

s

i=1

=

=

n − 1

n − 1

Najmniejsza wartość wariancji wynosi zero, im większe zróŜnicowanie, tym większa wartość wariancji.

30

Anna Rajfura, Matematyka i statystyka matematyczna na kierunku Rolnictwo, SGGW

Odchylenie standardowe

Odchylenie standardowe (wyraŜane

w takich jednostkach, w jakich

mierzona jest cecha).

2

s = s

31

Anna Rajfura, Matematyka i statystyka matematyczna na kierunku Rolnictwo, SGGW

Współczynnik zmienności

Współczynnik zmienności

s

cv =

⋅ 100%

x

Im mniejszą przyjmuje wartość, tym mniejsza zmienność (mniej zróŜnicowana cecha).

32

Anna Rajfura, Matematyka i statystyka matematyczna na kierunku Rolnictwo, SGGW

Asymetria rozkładu wartości cechy *

Przykład. Notowano liczbę błędów popełnianych przez operatorów komputerów w ciągu dnia pracy:

A – po tygodniu od rozpoczęcia pracy, B – po miesiącu od rozpoczęcia pracy, C - po półrocznym okresie pracy.

Liczba

Liczba operatorów

Klasa

błędów

A

B

C

1

0 - 2

1

1

3

2

3 – 4

1

2

5

3

5 – 6

2

4

3

4

7 – 8

3

5

2

5

9 – 10

5

2

1

6

11 – 12

3

1

1

Razem

15

15

15

33

Anna Rajfura, Matematyka i statystyka matematyczna na kierunku Rolnictwo, SGGW

Przykład cd. *

6

5

4

ćś

A

onb 3

e

B

zicL

C

2

1

0

1

2

3

4

5

6

Klasy liczby błędów

A – dominują osoby popełniające duŜo błędów B – dominują osoby popełniające średnią ilość błędów

C – dominują osoby popełniające mało błędów 34

Anna Rajfura, Matematyka i statystyka matematyczna na kierunku Rolnictwo, SGGW

Parametry asymetrii *

Parametry asymetrii (skośności):

• moment trzeci względny

(miara klasyczna)

• współczynnik asymetrii

(miara pozycyjna)

35

Anna Rajfura, Matematyka i statystyka matematyczna na kierunku Rolnictwo, SGGW

Parametry asymetrii *

Moment trzeci względny A3

(wzór dla szeregu rozdzielczego)

Moment trzeci centralny:

k

µ = 1

x

&

x n

3 =

∑ ( − )3

i

i

n i=1

Moment trzeci względny:

µ3

A

=

3

3

s

36

Anna Rajfura, Matematyka i statystyka matematyczna na kierunku Rolnictwo, SGGW

Interpretacja *

Interpretacja µ znaku w ocenie kierunku 3

asymetrii:

• µ = 0 rozkład symetryczny

3

• µ > 0 rozkład o asymetrii dodatniej 3

• µ < 0 rozkład o asymetrii ujemnej 3

37

Anna Rajfura, Matematyka i statystyka matematyczna na kierunku Rolnictwo, SGGW

Interpretacja A *

3

Na podstawie badań empirycznych:

• A ∈ −

3

( 2 , 2)

• im wartość A3 bliŜej 0, tym słabsza asymetria

• im wartość A3 dalej się od 0, tym większe natęŜenie asymetrii

38

Anna Rajfura, Matematyka i statystyka matematyczna na kierunku Rolnictwo, SGGW

Przykład - rachunki pomocnicze *

Wyznaczenie parametrów dla przykładu o błędach operatorów:

A

Ra c hun k i po m oc n ic ze :

Ś r o d e k l i c z e b .

K l a s a

k l a s y x

n

x — n

( x - x )

( x -

-

( x -

-

i

i

i

i

i

i

x ) 2 ( x i x ) 2 — n i

i

x ) 3 ( x i

x ) 3 — n i

0 - 2

1

1

1

- 7

4 9

4 9

- 3 43

- 3 43

3 – 4

3 , 5

1

3 , 5

- 4 , 5

2 0 ,2 5

2 0 ,2 5

- 9 1 ,1 25 - 9 1 ,1 25

5 – 6

5 , 5

2

1 1

- 2 , 5

6 , 25

1 2 ,5

- 1 5 ,6 25

- 3 1 ,2 5

7 – 8

7 , 5

3

2 2 ,5

- 0 , 5

0 , 25

0 , 75

- 0 , 12 5

- 0 , 37 5

9 – 10

9 , 5

5

4 7 ,5

1 , 5

2 , 25

1 1 ,2 5

3 , 37 5

1 6 ,8 75

1 1 – 1 2

1 1 ,5

3

3 4 ,5

3 , 5

1 2 ,2 5

3 6 ,7 5

4 2 ,8 75 1 28 , 62 5

Ra z e m

1 5

S u m a

1 30 , 5

- 3 20 , 25

x = 8,00

w ar i an c ja s2

8 , 70

o dc h . st an d. s

2 , 95

µ

- 2 1 ,3 5

3

A

- 0 , 83

3

39

Anna Rajfura, Matematyka i statystyka matematyczna na kierunku Rolnictwo, SGGW

Przykład – wyniki *

A:

B:

C

µ

-

2

1

,

3

5

-

3

,29 15,26

3

A -

0 ,

8

3

-

0,19 0,57

3

6

5

4

ćś

A

onbe 3

B

zicL

C

2

1

0

1

2

3

4

5

6

Klasy liczby błędów

40

Anna Rajfura, Matematyka i statystyka matematyczna na kierunku Rolnictwo, SGGW