statystyka opisowa 11


Tomasz Owczarek 2011-03-07
3. Opis zbiorowości Szeregi statystyczne
Klasyfikacja szeregów
Opis statystyczny ma na celu przedstawienie wyników badania
Szeregi szczegółowe
w postaci zrozumiałej i czytelnej dla odbiorcy.
Szeregi rozdzielcze
Składają się na niego:
punktowe (cechy ilościowe)
przedziałowe (cechy ilościowe)
Szeregi statystyczne
strukturalne (cechy jakościowe)
Tablice statystyczne
Szeregi rozdzielcze składają się z dwóch elementów:
Wykresy statystyczne
wyszczególnienia wariantów cechy  xi oraz liczebności  ni.
Statystyka opisowa Jednomodalne  jednorodne pod względem badanej cechy.
Wielomodalne  niejednolite, w których można wyróżnić kilka
jednorodnych podzbiorów.
29 30
Szeregi statystyczne Szeregi statystyczne
Szereg rozdzielczy przedziałowy
Przykłady
Wiek osób:
Szeregi szczegółowe
xi 10-20 20-30 30-40 40+
Wiek 10 osób: 15, 16, 18, 19, 22, 28, 34, 42, 46, 50.
ni 4 2 1 3
Płeć 7 osób: K, K, K, K, K, M, M.
Ilość dzieci: 0, 0, 0, 1, 1, 1, 1, 1, 1, 2, 2, 2, 2, 3, 3, 4, 6.
Szereg rozdzielczy strukturalny
Płeć osób:
Szereg rozdzielczy punktowy:
xi K M
ni 5 2
Ilość dzieci:
xi 0 1 2 3 4 6
Wiek badanych osób
ni 3 6 4 2 1 1
Szereg jednomodalny: 10, 10, 12, 12, 13, 13, 14, 15, 16, 18, 19
Szereg wielomodalny: 10, 10, 12, 12, 13, 13, 14, 29, 32, 35, 38, 39
31 32
Konstrukcja szeregu Konstrukcja szeregu
rozdzielczego przedziałowego rozdzielczego przedziałowego
Przykład
Określenie zakresu szeregu
Zbudować szereg rozdzielczy dla danych:
Przedziały nie muszą być równe
1, 1, 2, 3, 4, 6, 8, 9, 9, 10, 10, 11, 12, 13, 15,
18, 18, 19, 20, 25, 28, 29, 32, 32, 37, 45, 53
Ilość klas nie może być zbyt duża, nie więcej niż n0,5
Zakres szeregu: od 1 do 53.
Określenie granic przedziałów
Dolna granica pierwszej klasy: 1; górna granica ostatniej
Zwykle prawostronnie domknięte
klasy: 55
Ilość klas: 5
33 34
Statystyka opisowa 1
Tomasz Owczarek 2011-03-07
Konstrukcja szeregu
rozdzielczego przedziałowego
Tablice statystyczne
Tablice statystyczne są formą graficznej prezentacji rezultatów
Przykład c.d.
1. Równe szerokości klas (przedziałów) obserwacji statystycznej
Szerokość przedziałów: 11
Na tablicę składają się:
Podział:
tytuł tablicy,
boczek czyli nazwy wierszy,
xi 1- 11 11 - 22 22 - 33 33 - 44 44 - 55
ni 12 7 5 1 2
główka (nagłówek) czyli nazwy kolumn,
dane liczbowe,
xi 1- 11 12 - 22 23 - 33 34 - 44 45 - 55
uwagi dotyczÄ…ce przedstawionych liczb,
ni 12 7 5 1 2
zródła.
2. Nierówne szerokości klas
Klasyfikacja tablic
xi 1- 9 10 - 19 20  29 30 - 39 40 - 55
Tablice proste  kryterium opisu zbiorowości stanowi jedna cecha.
ni 9 9 4 3 2
Tablice złożone  kryterium opisu stanowi wiele cech (2 lub 3).
35 36
Tablice statystyczne Tablice statystyczne
Przykład
Tablica 1. Ilość przedsiębiorstw i wielkość sprzedaży w latach 1983-1989
Branża Cecha Rok Znaki używane w tablicach
1983 1984 1985 1986 1987 1988 1989
Branża 1 Ilość 16 15 15 15 15 14 15
kreska ( - )  zjawisko nie występuje,
Sprzedaż 28 307,3 23 122,8 25 349,2 23 122,8 21 671,7 22 625,3 25 785,1
Branża 2 Ilość 38 33 33 33 34 33 33
zero ( 0 )  zjawisko występuje w ilościach mniejszych niż dokładność
Sprzedaż 24 823,1 27 233,7 37 128,4 27 233,7 27 176,7 27 852,6 26 769,1
Branża 3 Ilość 149 146 150 146 152 151 130
w tabeli,
Sprzedaż 20 544,5 27 423,3 52 313,6 27 423,3 29 890,2 32 266,1 30 186,6
Branża 4 Ilość 64 68 67 68 70 71 66
Sprzedaż 14 061,0 16 902,5 22 146,7 16 902,5 18 085,9 19 429,6 19 160,9
kropka ( Å" )  brak informacji lub brak informacji wiarygodnych,
Branża 5 Ilość 16 17 15 17 18 18 17
Sprzedaż 2 014,2 2 365,3 2 546,9 2 365,3 2 582,8 2 750,6 2 908,6
znak iks ( x )  rubryki nie można wypełnić,
Branża 6 Ilość 24 29 24 29 29 26 26
Sprzedaż 2 953,3 4 053,4 3 951,3 4 053,4 4 285,3 4 524,9 4 842,8
gwiazdka ( * )  postawiona obok liczby oznacza, że liczba została
Branża 7 Ilość 79 82 84 82 81 82 89
Sprzedaż 6 132,3 7 316,1 15 891,2 7 316,1 7 458,3 8 122,1 8 748,0
zmieniona w stosunku do poprzednio publikowanej,
Branża 8 Ilość 105 103 105 103 94 98 118
Sprzedaż 48 403,9 50 607,5 53 774,2 50 607,5 51 025,6 51 498,6 47 455,0
Branża 9 Ilość 9 7 7 7 7 7 6
napis  w tym  oznacza, że nie podaje się wszystkich składników sumy
Sprzedaż 843,2 741,5 956,9 741,5 789,0 963,9 789,3
ogólnej.
Sprzedaż wyrażono w mln zł z roku 1989 roku.
yródło: opracowanie własne na podstawie list  500 największych przedsiebiorstw przemysłu
przetwórczego .
37 38
Tablice statystyczne Wykresy statystyczne
Nie usypiajcie odbiorcy!
Wykresy sÄ… graficznÄ…, przyjaznÄ… dla odbiorcy, formÄ…
1991 1992 1993
prezentacji materiału statystycznego.
Kobiety 10 15 16
Mężczyzni 15 10 7
Wykres powinien zawierać:
Tablica może być ozdobą dokumentu
tytuł,
1991 1992 1993
1991 1992 1993
opis zródła,
Kobiety 10 15 16
Kobiety 10 15 16
Mężczyzni 15 10 7
Mężczyzni 15 10 7 opis skali (skala zwykła i logarytmiczna),
legendę opisującą użyte symbole, kolory i kreskowania.
1991 1992 1993 1991 1992 1993
Kobiety 10 15 16 Kobiety 10 15 16
Mężczyzni 15 10 7 Mężczyzni 15 10 7
39 40
Statystyka opisowa 2
Tomasz Owczarek 2011-03-07
Wykresy statystyczne Wykresy statystyczne
50
Inne rodzaje wykresów:
W statystyce najczęściej
40
wykorzystuje się: punktowe (szczególnie w prezentacji obserwacji opartych na dwóch
30
cechach),
histogramy, 20
10
obrazkowe,
diagramy,
0
powierzchniowe,
1 2 3
krzywe liczebności.
diagram
liniowe,
50 50
warstwowe,
40 40
kołowe,
30 30
20 20
inne.
10 10
0 0
Dobór wykresu zależy od treści którą ma przekazywać, a także
1 2 3 1 2 3
histogram
rodzaju oraz odbiorcy dokumentu.
krzywa liczebności
41 42
Wykresy statystyczne Wykresy statystyczne
120 120
100
80 Wsch. 80
Wsch.
Wykres pudełkowy (wykres pudełko)
Zach. 60
Półn.
40 PÅ‚n. 40
20
0 0
0 1 2 3 4 0 1 2 3 4 5
200
160 120
PÅ‚n.
80
120
Wsch.
Zach.
40 Zach.
80 PÅ‚n.
Wsch.
0 PÅ‚n.
40 Wsch.
1. Kw
2. Kw
3. Kw
4. Kw
0
1. Kw 2. Kw 3. Kw 4. Kw
Wsch.
120
21%
1. Kw
80
2. Kw
PÅ‚n.
3. Kw 47%
40
4. Kw
0
Wsch. Zach. PÅ‚n. Zach.
43 44
32%
Wykresy statystyczne Wykresy statystyczne
W którym kraju bezrobocie jest  lepsze ? Co powiesz o dochodach mieszkańców tych dwóch krajów?
Stopa bezrobocia w kraju X Stopa bezrobocia w kraju Y
Dochody w zł
18 100 Dochody w zł
16
14 4 100,0
12
10 3 600,0
10
8
3 100,0
6
4
2 600,0
2
0 1
2 100,0
1990 1991 1992 1993 1994 1995 1996 1997 1998 1999 2000 1990 1991 1992 1993 1994 1995 1996 1997 1998 1999 2000
1 600,0
Oba wykresy prezentujÄ… stopÄ™ bezrobocia w Polsce w latach 1990  2000.
1 100,0
W wykresie dla  kraju X zastosowano zwykłą (naturalną) skalę dla osi 600,0
1 2 3 4 5 6 1 2 3 4 5 6
pionowej, jako minimalną wartość przyjęto 0.
W wykresie dla  kraju Y zastosowano skalÄ™ logarytmicznÄ….
Można manipulować przekazem wykresu dobierając odpowiednio
Inne efekty można uzyskać stosując zwykłą skalę i przyjmując jako
kolory, wielkość wykresu oraz jego tło.
najniższą wartość np. liczbę 6.
45 46
Statystyka opisowa 3
Tomasz Owczarek 2011-03-07
Statystyka opisowa Statystyka opisowa
Statystyka opisowa w sposób syntetyczny opisuje wyniki badań
Częstość (częstość względna):
za pomocÄ… odpowiednich charakterystyk liczbowych
ni
Klasyfikacja miar:
wi =
miary położenia,
n
miary rozproszenia,
miary asymetrii,
gdzie: n - ilość wszystkich obserwacji, ni - ilość obserwacji
miary koncentracji;
sprzyjajÄ…cych i-temu zdarzeniu.
miary klasyczne (oparte na momentach zwykłych i centralnych),
Jest odpowiednikiem prawdopodobieństwa.
miary pozycyjne.
47 48
Statystyka opisowa Statystyka opisowa
Przykład:
Obliczyć częstości i dystrybuantę empiryczną dla szeregu szczegółowego:
Dystrybuanta empiryczna:
1, 1, 3, 4, 4, 4, 5, 5, 5, 6.
w1=0,2; w3=0,1; w4=0,3; w5=0,3; w6=0,1
F (x) =
n "wi
Å„Å‚ 0 x < 1
xi d"x
ôÅ‚0,2 1d" x < 3
ôÅ‚
gdzie: wi - częstość i-tego zdarzenia.
ôÅ‚
ôÅ‚0,3 3 d" x < 4
Fn (x) = dla
òÅ‚
ôÅ‚0,6 4 d" x < 5
Jest odpowiednikiem dystrybuanty teoretycznej w rachunku
ôÅ‚0,9 5 d" x < 6
prawdopodobieństwa.
ôÅ‚
ôÅ‚ 1 x e" 6
ół
49 50
Statystyka opisowa Statystyka opisowa
Przykład:
Obliczyć częstości i dystrybuantę empiryczną dla szeregu rozdzielczego:
xi 10 15 20 25 30 40 50
ni 7 15 36 81 39 14 8
n=200
xi 10 15 20 25 30 40 50
wi 0,035 0,075 0,18 0,405 0,195 0,07 0,04
Å„Å‚ 0 x < 10
ôÅ‚0,035 10 d" x <15
ôÅ‚
ôÅ‚0,110 15 d" x < 20
ôÅ‚0,290 20 d" x < 25
ôÅ‚
Fn(x) = dla
òÅ‚0,695 25 d" x < 30
ôÅ‚
ôÅ‚0,890 30 d" x < 40
ôÅ‚
ôÅ‚0,960 40 d" x < 50
ôÅ‚
1 x e" 50
ół
51 52
Statystyka opisowa 4
Tomasz Owczarek 2011-03-07
Statystyka opisowa Statystyka opisowa
Przykład:
Dla szeregu: 1, 1, 2, 4, 5, 5, obliczyć pierwsze trzy momenty zwykłe i
Momenty zwykłe:
centralne
n
6
1 1 1+1+ 2 + 4 + 5 + 5 18
M1 = xi = = = 3
M = xik "
k "
6 6 6
i=1
n
i=1
6
1 12 +12 + 22 + 42 + 52 + 52 72
2
M = = = = 12
2 "xi
6 6 6
i=1
6
Momenty centralne:
1 13 +13 + 23 + 43 + 53 + 53 324
M3 = xi3 = = = 54
"
6 6 6
i=1
n
1 6
'
1
'
M = - x)k
k
M1 = - x) = 0
"(xi
"(xi
n 6
i=1
i=1
6
1 (1- 3)2 + (1- 3)2 + (2 - 3)2 + (4 - 3)2 + (5 - 3)2 + (5 - 3)2
'
M = - x)2 = = 3
2 "(xi
6 6
i=1
6
1 (1- 3)3 + (1- 3)3 + (2 - 3)3 + (4 - 3)3 + (5 - 3)3 + (5 - 3)3
'
M3 = - x)3 = = 0
"(xi
6 6
i=1
53 54
Miary położenia Miary położenia
Åšrednia arytmetyczna
Miary położenia stosowane są jeżeli istnieje konieczność
pokazania przeciętnej wartości zjawiska, wartości najbardziej Miara najbardziej przydatna dla szeregów o niewielkiej
reprezentatywnej. Inaczej mówiąc pokazuje, gdzie na osi
asymetrii.
liczbowej szukać wartości zjawiska. szczegółowy rozdzielczy punktowy rozdzielczy
przedziałowy
Przez wartość przeciętną niekoniecznie rozumie się średnią w rozumieniu
n k k
średniej arytmetycznej.
1 1 1
&
x = x = xi * ni x = xi * ni
"xi " "
Przykład
n n n
i=1 i=1 i=1
Przeciętna płaca w Polsce może być rozumiana jako:
gdzie: xi  wartość i-tej obserwacji (z kropką  reprezentant
średnia (arytmetyczna) płaca w Polsce  w drugim kwartale 2005 roku
wynosiła 2470,30 zł (dane GUS). przedziału), ni  liczebność i-tej obserwacji, n  liczebność
płaca, która występuje najczęściej,
badanej zbiorowości.
płaca przeciętnego pracownika w Polsce, wielkość płacy dzieląca
Podstawową zaletą jest łatwość interpretacji wyników oraz wykorzystywanie
wszystkie uporządkowane rosnąco płace na dwie równe części,
wszystkich obserwacji przy jej tworzeniu.
jeszcze inaczej.
Wadą jest mała odporność na na skrajne, często niewiarygodne, wartości.
55 56
Miary położenia Miary położenia
Åšrednia geometryczna
Åšrednia harmoniczna
Stosowana w szeregach czasowych jako miara średniego
Stosuje się w przypadku wskazników natężenia lub wartości
przyrostu.
przybliżonych w jednostkach na stałą jednostkę innej
zmiennej, np. prędkość w km/godz., pracochłonność w
n
xG = x1x2 K xn
min/szt.
szczegółowy rozdzielczy punktowy rozdzielczy
Najczęściej wykorzystywana jest do obliczania przeciętnych
przedziałowy
wartości indeksów przyrostu, takich jak indeks przyrostu PKB, k
n n
xH = xH =
indeks wzrostu cen, indeks zmiany kursu walut. n "ni k
1 n ni
i=1
xH = =
" "
k k
&
xi ni ni xi
i=1 i=1
" "
xi xi
i=1 i=1
57 58
Statystyka opisowa 5
Tomasz Owczarek 2011-03-07
Miary położenia Miary położenia
Mediana
Dominanta (moda)
Mediana to wartość środkowa uporządkowanego szeregu. Wartość
Wartość o największej liczebności lub częstości. przeciętnego obiektu. Dla szeregów o dużej asymetrii, mediana pokazuje
wartości najłatwiejsze do zaakceptowania.
W szeregu rozdzielczym przedziałowym:
W szeregach szczegółowych i rozdzielczych punktowych znajduje się za
(nd - nd -1)
pomocÄ…  pokazywania palcem .
do = x0 + *hd
d
(nd - nd -1) + (nd - nd +1)
W szeregu o liczebności nieparzystej jest to element, który w
gdzie:
uporządkowanym szeregu ma numer (nie wartość!):
n +1
x0d  dolna granica przedziału, w którym znajduje się dominanta,
nrm =
2
nd  liczebność przedziału, w którym znajduje się dominanta,
Natomiast w szeregu o liczebności parzystej zwykle przyjmuje się za medianę
nd-1  liczebność przedziału poprzedniego,
średnia arytmetyczną z wartości o numerach:
n n
nd+1  liczebność przedziału następnego,
nrm1 = ; nrm 2 = +1
2 2
hd  szerokość przedziału, w którym znajduje się dominanta.
59 60
Miary położenia Miary położenia
Kwartyle
W szeregu rozdzielczym przedziałowym stosuje się wzór: Kwartyle to wartości, które dzielą szereg na cztery równe części.
Drugi kwartyl jest równy medianie, dlatego zwykle oznaczany jest jako
n h
m
me = xo +[ - n(xo )]*
mediana.
m m
2 n
m
Podobnie jak medianę, w szeregach szczegółowych i rozdzielczych
gdzie:
punktowych, kwartyle  pokazuje siÄ™ palcem .
x0m  dolna granica przedziału, w którym znajduje się
Pierwszy i trzeci kwartyl to elementy w uporzÄ…dkowanym szeregu o
mediana,
numerach:
n +1 3(n +1)
Q1 - , Q3 -
n  liczebność badanej zbiorowości,
4 4
lub element o numerze najbliższym w kierunku środka rozkładu.
n(x0m)  liczebność skumulowana dla dolnej granicy
przedziału z medianą (suma liczebności od początku do W szeregu rozdzielczym przedziałowym kwartyle oblicza się za pomocą
wzorów: hQ
n +1
mediany, bez przedziału z medianą),
1
Q1 = xo +[ - n(xo )]*
Q1 Q1
4 nQ
hm  szerokość przedziału, w którym znajduje się mediana,
1
hQ
3(n +1)
3
nm  liczebność przedziału, w którym znajduje się mediana,
Q3 = xo + [ - n(xo )]*
Q 3 Q3
4 nQ
61 3 62
Miary położenia Miary położenia
Przykład. Przykład c.d.
Obliczyć wszystkie (odpowiednie) miary położenia dla szeregu zawierającego 2, 3, 3, 3, 4, 4, 5, 7, 8
ilości szczeniaków w miocie: 3, 4, 8, 3, 5, 2, 4, 7, 3
Åšrednia arytmetyczna:
W pierwszej kolejności należy uporządkować szereg:
n
1 2 + 3 + 3 + 3 + 4 + 4 + 5 + 7 + 8 39
2, 3, 3, 3, 4, 4, 5, 7, 8
x = = = = 4,33
"xi
Histogram: n 9 9
i=1
3
Dominanta:
2
2, 3, 3, 3, 4, 4, 5, 7, 8
1
do=3
0
2 3 4 5 7 8
63 64
Statystyka opisowa 6
Tomasz Owczarek 2011-03-07
Miary położenia Miary położenia
Przykład c.d. Przykład.
2, 3, 3, 3, 4, 4, 5, 7, 8
Obliczyć przeciętną wartość wzrostu obrotów sklepu jeżeli w trzech
Mediana: kolejnych miesiącach wzrost ten wynosił: 10%, 12% i 15%.
Element o numerze: Średni przyrost mierzony jest za mocą średniej geometrycznej:
n +1 9 +1
nrme = = = 5
2 2
n 3 3
xG = x1x2 K x = 1,1*1,12*1,15 = 1,4168 = 1,1231
me=4 n
Kwartyle:
Obroty przeciętnie rosły o 12,31% miesięcznie.
Pierwszy kwartyl - element o numerze:
n +1 9 +1
nrQ = = = 2,5
1
4 4
Trzeci kwartyl - element o numerze:
3(n +1) 3(9 +1)
nrQ = = = 7,5
3
4 4
Q1=3; Q3=5
65 66
Miary położenia Miary położenia
Przykład. Przykład c.d.
Ilość telefonów w 60 gospodarstwach domowych. xi 0 1 2 3
ni 10 25 20 5
xi 0 1 2 3
xi 0 1 2 3
nsk 10 35 55 60
ni 10 25 20 5
ni 10 25 20 5
Mediana:
nsk 10 35 55 60
Obliczamy liczebności skumulowane:
Wartość w środku uporządkowanego szeregu.
Åšrednia arytmetyczna:
Jest 60 obserwacji. Medianą jest średnia z obserwacji 30-tej i 31-ej.
k
1 0*10 +1* 25 + 2* 20 + 3*5 80
x = xi *ni = = = 11
" 3
Obserwacja o numerze 30 to 1, obserwacja o numerze 31 to 1. MedianÄ… jest 1.
n 60 60
i=1
Kwartyle.
Dominanta:
Pierwszy kwartyl to obserwacja o numerze (n+1)/4, czyli 15,25. Najbliższą w
Wartość, która występuje najczęściej.
kierunku środka jest obserwacja o numerze 16. Jest nią 1.
Dominanta jest 1.
Trzeci kwartyl to obserwacja o numerze 3*(n+1)/4, czyli 45,75. Najbliższą w kierunku
środka jest obserwacja o numerze 45. Jest nią 2.
Pierwszy kwartyl ma wartość 1, trzeci kwartyl ma wartość 2.
67 68
Miary położenia Miary położenia
Przykład. Przykład c.d.
Jakie przeciętne płace otrzymują pracownicy, jeżeli płace kształtowały się
Mediana:
następująco:
n h 38 500
îÅ‚
xi 700-1000 1000-1500 1500-2000 2000-3000
xi 700-1000 1000-1500 1500-2000 2000-3000 m
me = xo +[ - n(xo )]* = 1000 + - 5Å‚Å‚ * = 1000 +14*35,7 = 1499,8
m m ïÅ‚ śł
2 14
ni 5 14 12 7
ni 5 14 12 7 2 n ðÅ‚ ûÅ‚
m
nsk 5 19 31 38
Obliczamy liczebności skumulowane:
Pierwszy kwartyl:
Jako reprezentantów przedziału wyznaczamy ich środki (można przyjąć inne
hQ îÅ‚38 +1 500
n +1
1
Q1 = xo +[ - n(xo )]* = 1000 + - 5Å‚Å‚ * = 1169,6
wartości): 850, 1250, 1750 i 2500.
Q1 Q1
4 nQ ïÅ‚ śł
4 14
ðÅ‚ ûÅ‚
1
Åšrednia arytmetyczna:
k
1 850*5 +1250*14 +1750*12 + 2500*7 60250
Trzeci kwartyl:
&
x = xi *ni = = =1585,53
"
n 38 38
i=1 hQ îÅ‚3(38 +1) 500
3(n +1)
3
Q3 = xo +[ - n(xo )]* = 1500 + -19Å‚Å‚ * = 1927,1
Q 3 Q 3
4 nQ ïÅ‚ śł
4 12
ðÅ‚ ûÅ‚
Dominanta: 3
(nd - nd -1) (14 - 5)
do = x0 + * hd = 1000 + *500 = 1409
d
(nd - nd -1) + (nd - nd +1) (14 - 5) + (14 -12)
69 70
Statystyka opisowa 7
Tomasz Owczarek 2011-03-07
Miary rozproszenia Miary rozproszenia
Miary rozproszenia opisujÄ… rozrzut obserwowanych
Wariancja
wartości. Jak dużo miejsca zajmuje zbiorowość na osi
n
Szereg
liczbowej. 1
szczegółowy
s2 = - x)2
"(xi
Miary rozproszenia nazywane są również miarami n -1
i=1
dyspersji.
k
Szereg rozdzielczy
1
punktowy
s2 =
"(x - x)2 * ni
i
Miary rozproszenia są miarami odległości obserwacji
n -1
i=1
od punktu centralnego rozkładu, w związku z tym
k
Szereg rozdzielczy
1
zawsze przyjmują wartości nieujemne.
przedziałowy
s2 = & - x)2 * ni
"(xi
n -1
i=1
Przez punkt centralny rozumie się którąś z miar
położenia, dobraną w zależności od potrzeb.
71 72
Miary rozproszenia Miary rozproszenia
Odchylenie standardowe Odchylenie standardowe:
Średnia odległość od średniej arytmetycznej (w jednostkach
naturalnych).
s = s2
Współczynnik zmienności
Średnia odległość od średniej arytmetycznej (w ułamkach
średniej).
s s
V = V = *100%
x x
73 74
Miary rozproszenia Miary rozproszenia
Interpretacja wyników:
Odchylenie przeciętne
Jeżeli rozkład cechy jest skupiony w jednym punkcie to wariancja
szczegółowy rozdzielczy punktowy rozdzielczy
przyjmie wartość 0. Jeżeli rozkład jest rozproszony to wariancja przyjmuje
przedziałowy
wartość większą od zera. k k
n
1 1 1
W przypadku wariancji nie można ocenić siły rozproszenia. d = xi - x |
"| "| &
"| d = xi - x |Å" ni d = xi - x |Å" ni
n n n
i=1 i=1
i =1
Odchylenie standardowe interpretowane jest tak samo jak wariancja.
Istnieje jednak możliwość oceny siły rozproszenia, gdyż odchylenie jest
wyrażone w jednostkach naturalnych. Mówi się o:  przeciętnej odległości
Współczynnik zmienności dla odchylenia przeciętnego.
obserwacji od wartości średniej (centralnej) .
d
Współczynnik zmienności interpretowany jest tak samo jak odchylenie
Vd =
standardowe, wnioski jednak formułowane są jako ułamki wartości
x
średniej.
75 76
Statystyka opisowa 8
Tomasz Owczarek 2011-03-07
Miary rozproszenia Miary rozproszenia
Odchylenie kwartylowe (ćwiartkowe):
Rozstęp (obszar zmienności):
Q3 - Q1
Q =
R = max xi - min xi
2
i i
Rozstęp kwartylowy (ćwiartkowy):
Współczynnik zmienności:
Q Q
RQ = Q3 - Q1
V (Q) = V (Q) = *100%
me me
77 78
Miary rozproszenia Miary rozproszenia
Przykład:
Przykład c.d.
Obliczyć miary rozproszenia w szeregu: 2, 3, 3, 3, 4, 4, 5, 7, 8. Odchylenie przeciętne:
n
1 | 2 - 4,33| + | 3- 4,33 | + | 3 - 4,33| +L+ | 8 - 4,33 | 13,99
Z wcześniejszych obliczeń wynika, że:
d = xi - x |= = =1,55
"|
n 9 9
i=1
x = 4,33; do = 3; me = 4; Q1 = 3; Q3 = 5
Współczynnik zmienności:
Wariancja:
n d 1,55
1
V = = = 0,36
s2 = - x)2 (2 - 4,33)2 + (3 - 4,33)2 + (3- 4,33)2 +L+ (8 - 4,33)2
= = 4
"(xi
x 4,33
n -1
i=1 9 -1
Odchylenie standardowe:
Rozstęp:
R = max xi - min xi - 2 = 6
s = s2 = 4 = 2 = 8
i i
Współczynnik zmienności:
Rozstęp kwartylowy:
s 2
= 5
V = = = 0,46 RQ = Q3 - Q1 - 3 = 2
x 4,33
79 80
Miary rozproszenia Miary rozproszenia
Przykład
Przykład c.d.
Obliczyć miary rozproszenia dla szeregu:
Odchylenie przeciętne:
xi 0 1 2 3
n
1
ni 10 25 20 5
d = xi - x |*ni = | 0 -1,33| *10+ |1-1,33| *25+ | 2 -1,33 |*20+ | 3 -1,33 | *5 43,05 0,72
"| = =
n
i=1 60 60
x =1,33; do = 1; me = 1; Q1 =1; Q3 = 2
Współczynnik zmienności:
Wariancja:
k
1 d 0,72
s2 = - x)2 *ni = V = = = 0,54
"(xi
1,33
n -1 x
i=1
(0 -1,33)2 *10 + (1-1,33)2 * 25 + (2 -1,33)2 * 20 + (3 -1,33)2 *5 17,69 + 2,72 + 8,98 +13,94
= = = 0,73
Rozstęp:
60 -1 59
R = max xi - min xi - 0 = 3
= 3
Odchylenie standardowe:
i i
s = s2 = 0,73 = 0,86
Rozstęp kwartylowy:
Współczynnik zmienności: RQ = Q3 - Q1 -1 =1
= 2
0,86
s
V = = = 0,64
x 1,33
81 82
Statystyka opisowa 9
Tomasz Owczarek 2011-03-07
Miary rozproszenia Miary rozproszenia
Przykład
Przykład c.d.
Obliczyć miary rozproszenia dla szeregu:
xi 700-1000 1000-1500 1500-2000 2000-3000
Rozstęp:
ni 5 14 12 7
R = max xi - min xi - 700 = 2300
= 3000
i i
x = 1585,53; do =1409; me =1392,7; Q1 = 1169,6; Q3 = 1927,1
Wariancja:
k Rozstęp kwartylowy:
1
s2 = & - x)2 *ni =
"(xi
RQ = Q3 - Q1 = 1927,1-1169,6 = 757,5
n -1
i =1
(850 -1585,53)2 *5 + (1250 -1585,53)2 *14 + (1750 -1585,53)2 *12 + (2500 -1585,53)2 *7
= = 282690,3
38 -1
Odchylenie standardowe:
s = s2 282690,3 = 531,69
=
Współczynnik zmienności:
s 531,69
V = = = 0,34
x 1585,53
83 84
Asymetria Asymetria
Rozkład symetryczny to taki rozkład, w którym obserwacje
rozłożone są równomiernie wokół osi symetrii.
Rozkład asymetryczny prawostronnie (dodatnio)
Rozkład symetryczny
0,5 0,5
0 0
-2 -1 0 1 2 -2 -1 0 1 2
x = me = do x > me > do
85 86
Asymetria Miary asymetrii
Trzeci moment centralny:
n
Szereg
1
Rozkład asymetryczny lewostronnie (ujemnie)
szczegółowy M ' = - x)3
3 "(xi
n
i=1
0,5
k
Szereg rozdzielczy
1
punktowy M ' = - x)3 Å" ni
"(x
3 i
n
i=1
k
Szereg rozdzielczy
1
M ' = &i - x)3 Å" ni
przedziałowy
3 "(x
n
i=1
0
-2 -1 0 1 2
Gdy rozkład jest symetryczny - M =0.
3
Gdy rozkład jest prawowstronnie (lewostronnie) asymetryczny - M >0
3
x < me < do (M <0).
3
Trzeci moment centralny nie pozwala na określenie siły asymetrii.
87 88
Statystyka opisowa 10
Tomasz Owczarek 2011-03-07
Miary asymetrii Miary asymetrii
Współczynnik asymetrii (klasyczny):
Współczynnik asymetrii (mieszany):
M '
3
x - do
A =
A =
s3
s
W większości rozkładów wartość współczynnika asymetrii znajduje się w
Współczynnik skośności (pozycyjny):
przedziale (-2; 2).
(Q3 - me) - (me - Q1)
A(Q) =
Wartości blisko 0 świadczą, że rozkład ma małą asymetrię
(Q3 - me) + (me - Q1)
Wartości blisko 2 lub -2 świadczą o dużej asymetrii
Interpretacja obydwu współczynników jest podobna jak w przypadku
klasycznego współczynnika asymetrii.
89 90
Miary asymetrii Miary asymetrii
Przykład. Przykład.
Sprawdzić asymetrię szeregu: 2, 3, 3, 3, 4, 4, 5, 7, 8. Sprawdzić asymetrię szeregu rozdzielczego punktowego:
xi 0 1 2 3
Trzeci moment centralny: ni 10 25 20 5
n
1
M ' = - x)3 (2 - 4,33)3 + (3 - 4,33)3 + (3 - 4,33)3 +L+ (8 - 4,33)3
3 "(xi = = 5,44 Trzeci moment centralny:
n
i=1 k
9
1
M ' = - x)3 *ni
Klasyczny współczynnik asymetrii:
3 "(xi
n
i=1
M ' 5,44
3
A = = = 0,68
(0 -1,33)3 *10 + (1-1,33)3 *25 + (2 -1,33)3 *20 + (3 -1,33)3 *5
s3 23 = = 0,08
60
Mieszany współczynnik asymetrii:
Klasyczny współczynnik asymetrii:
x - do 4,33 - 3
A = = = 0,67
M ' 0,08
s 2
3
A = = = 0,13
Pozycyjny współczynnik skośności: s3 0,863
(Q3 - me) - (me - Q1) (5 - 4) - (4 - 3)
A(Q) = = = 0
(Q3 - me) + (me - Q1) (5 - 4) + (4 - 3)
91 92
Miary asymetrii Miary asymetrii
Przykład
Przykład c.d.
Sprawdzić asymetrię szeregu rozdzielczego przedziałowego:
xi 0 1 2 3
ni 10 25 20 5
xi 700-1000 1000-1500 1500-2000 2000-3000
ni 5 14 12 7
Mieszany współczynnik asymetrii:
Trzeci moment centralny:
k
1,33
x - do -1
1
A = = = 0,38
M ' = & - x)3 *ni
3 "(xi
s 0,86
n
i=1
(850 -1585,53)3 *5 + (1250-1585,53)3 *14 + (1750-1585,53)3 *12 + (2500-1585,53)3 *7
Pozycyjny współczynnik skośności: = =
38
(Q3 - me) - (me - Q1) -1) - (1-1)
(2
= 51610 598,8
A(Q) =
= = 1
(Q3 - me) + (me - Q1) -1) + (1-1)
(2
Klasyczny współczynnik asymetrii:
M ' 51610598,8
3
A = = = 0,34
s3 531,693
93 94
Statystyka opisowa 11
Tomasz Owczarek 2011-03-07
Miary asymetrii Koncentracja
Przykład c.d.
xi 700-1000 1000-1500 1500-2000 2000-3000
ni 5 14 12 7 Koncentracja jest to nierównomierne rozdysponowanie
badanej cechy w zbiorowości.
Mieszany współczynnik asymetrii:
1585,53
x - do -1409
A = = = 0,33 Pojęcie wykorzystywane m.in. w ekonomii przemysłowej do
s 531,69
oceny stopnia konkurencyjności gałęzi wytwarzania. Wzrost
koncentracji produkcji, sprzedaży, zatrudnienia itp. w gałęzi
Pozycyjny współczynnik skośności:
może prowadzić do zagrożenia dla konkurencyjności, w
(Q3 - me) - (me - Q1)
A(Q) =
(Q3 - me) + (me - Q1) skrajnym przypadku - do monopolizacji.
(1927,1-1392,7) - (1392,7 -1169,6) 534,4 - 223,1 311,3
= = = = 0,41
(1927,1-1392,7) + (1392,7 -1169,6) 534,4 + 223,1 757,5
95 96
Miary koncentracji Miary koncentracji
Kurtoza
Indeks Hannah-Kay HK(Ä):
Ä
Ä
Ä
Kurtoza jest miarą spłaszczenia rozkładu
szczegółowy rozdzielczy punktowy rozdzielczy
1
przedziałowy n
ëÅ‚ öÅ‚Ä -1
4 4 Ä
4
n k k
1 xi - x 1 & HK(Ä ) = ìÅ‚ ÷Å‚
"si
Kr =
ìÅ‚ ÷Å‚ - "ëÅ‚ xi - x öÅ‚ 1 "ëÅ‚ xi - x öÅ‚
"ëÅ‚ öÅ‚ 3 Kr = ìÅ‚ ÷Å‚ ni - 3 Kr = ìÅ‚ ÷Å‚ ni - 3
íÅ‚ i=1 Å‚Å‚
n s
n s i=1 íÅ‚ Å‚Å‚ n s
i=1 íÅ‚ Å‚Å‚
íÅ‚ Å‚Å‚
i=1
gdzie si jest udziałem i-tej obserwacji w całości populacji.
0,7
1
îÅ‚
HK(Ä ) " ,1Å‚Å‚
ïÅ‚n śł
Kr=0 ðÅ‚ ûÅ‚
Kr>0
Kr<0
Większe wartości indeksu świadczą o większej koncentracji.
Im Ä jest mniejsze tym dla obliczenia indeksu majÄ… wiÄ™ksze znaczenie
0
-2 -1 0 1 2 niewielkie obserwacje.
97 98
Miary koncentracji Miary koncentracji
Indeks Heffindahla (Ä=2):
Indeks Lorenza-Gini ego:
n
2
H =
K = 2T = 1  2P
"si
i=1
Entropia  redudancja (Ä=1):
n
- Å" ln si
"s
i
i=1
E =
ln n
n
"s ln si
i
i=1
R =1+
ln n
99 100
Statystyka opisowa 12
Tomasz Owczarek 2011-03-07
Miary koncentracji Miary koncentracji
Concentration ratio CRk
CRk jest udziałem k największych obserwacji w całości populacji. Duże
Indeks Lorenza-Gini ego:
n wartości świadczą o dużej koncentracji. Najczęściej w badaniach koncentracji
w przemyśle stosuje się wskazniki CR3, CR 5, CR10, CR50.
"i Å" pi 1
k
2
i=1
K = -1-
"si
n
i=1
n
CRk =
n
pi n
"
"si
i=1
i=1
gdzie pi jest wielkością badanej cechy dla i-tego obiektu.
Wariancja logarytmów udziałów
n
1 2
2
à = (ln si - ln s)
"
n
i=1
101 102
Zależność cech Korelacja Pearsona
Zależność korelacyjna  wartościom jednej zmiennej przyporządkowuje
ściśle określone średnie wartości drugiej zmiennej
Zależność liniowa  zależność w której przyporządkowanie ma charakter
liniowy.
Cechy mierzalne
Korelacja Pearsona
Przydatne jest sporządzenie wykresów korelacyjnych i wstępna ocena
Regresja liniowa
rodzaju i siły zależności  na oko .
Cechy porzÄ…dkowe (w tym mierzalne)
Korelacja rang Spearmana
3 3
30 2,5
Cechy jakościowe
25
2
test chi-kwadrat
20
1,5
test zgodności -Kołmogorowa
15
1
test zgodności Kołmogorowa-Smirnowa
10
współczynnik Ć-Yule a
0,5
5
współczynnik T-Czuprowa
0 0
0 0
0 80 0 20 40 60
0 1 0 1
współczynnik V-Cramera
103 104
Korelacja Pearsona Korelacja Pearsona
Kowariancja
Dla szeregów szczegółowych:
Zależność korelacyjna może być przedstawiona w postaci
n
1
szeregu szczegółowego:
C(X ,Y ) = - x)( yi - y)
"(xi
n -1
i=1
Sprzedaż w szt. 100 150 200 250
Dla szeregów zapisanych w postaci tablicy korelacyjnej:
r s
Zysk w tyś zł 4 7 10 14
1
C( X ,Y ) = - x)( y - y)nij
""(xi j
n -1
i=1 j=1
Kowariancja przyjmuje wartości:
Może być również przedstawiona w postaci tablicy korelacyjnej:
- sX *sY d" C(X,Y) d" sX *sY
Ilość dzieci
0 - 1 2 - 3 4 - 6
Dodatnie wartości kowariancji oznaczają zależność dodatnią (jednoczesny
18 - 25 4 2 1
wzrost lub spadek obydwu cech), ujemne oznaczają zależność ujemną (wzrost
25 - 35 7 4 2
wartości jednej cechy jest jednoczesny ze spadkiem wartości drugiej).
105 106
Statystyka opisowa 13
Wiek
Tomasz Owczarek 2011-03-07
Korelacja Pearsona Korelacja Pearsona
Przykład 1. Zbadano wzrost i wagę sześciu osób, a wyniki przedstawiono w
tablicy:
Korelacja
wzrost xi 170 180 165 180 175 170
C(X ,Y )
rX ,Y =
waga yi 75 85 60 80 70 75
sxsy
Korelacja przyjmuje wartości z przedziału: Zbadać czy istnieje zależność pomiędzy wagą i wzrostem.
W celu obliczenia korelacji należy wcześniej obliczyć średnie i odchylenia
-1d" rX ,Y d"1
standardowe dla obydwu cech oraz kowariancjÄ™ obydwu cech.
Interpretacja korelacji jest taka sama jak interpretacja kowariancji.
6 6
1 1
Dodatkowo możliwa jest interpretacja siły zależności. Wartości bliskie 0
X = xi = 173,3 Y = yi = 74,2
" "
6 6
oznaczają brak zależności. Wartości bliskie 1 silną zależność dodatnią, i=1 i=1
natomiast bliskie -1 - silną zależność ujemną.
n n
1 1
sX = - X )2 = 6,1 sY = yi -Y )2 = 8,6
"(xi "(
n -1 n -1
i=1 i=1
107 108
Korelacja Pearsona Korelacja Pearsona
Przykład 1 c.d. Przykład 2.
Obliczamy kowariancję Sprawdzić czy istnieje zależność pomiędzy czasem, jaki studenci poświęcili
n
1 na naukÄ™ ostatniego dnia przed egzaminem ze statystyki i ocenÄ…, jakÄ… uzyskali
C(X ,Y ) = - x)( yi - y) =
"(xi
n -1
i=1 na egzaminie. Wyniki badania znajdujÄ… siÄ™ w tablicy korelacyjnej:
1
= [(170 -173,3)(75 - 74,2) + (180 -173,3)(85 - 74,2) + ...+ (170 -173,3)(75 - 74,2)]=
5
Ocena
= 43,33
2 3 4 5
Kowariancja jest większa od zera w związku z tym zależność jest dodatnia
0 - 1 8 6 4 3
(wzrost jednej cechy pociÄ…ga jednoczesny wzrost drugiej).
1 - 2 2 8 7 5
Obliczamy korelacjÄ™:
2 - 5 3 7 3 2
C( X ,Y ) 43,33 5 - 10 5 6 3 1
rX ,Y = = = 0,83
sxsy 6,1*8,6
Jeżeli istnieje związek, to co jest przyczyną a co jest skutkiem?
Zależność jest dodatnia i silna. Można uznać, że wraz ze wzrostem wagi
rośnie również wzrost osób.
Co jest przyczynÄ…, a co skutkiem?
109 110
Korelacja Pearsona Korelacja Pearsona
Przykład 2 c.d. Przykład 2 c.d.
Obliczamy średnie i wariancje dla rozkładów (liczebności) brzegowych:
Oceny przedstawiono w postaci szeregu rozdzielczego punktowego,
k
1 1 240
natomiast czas - w postaci szeregu rozdzielczego przedziałowego. Aby można X = xi *ni" = (2*18 + 3*27 + 4*17 + 5*11)= = 3,29
"
n 73 73
i=1
było obliczyć średnią, wariancję i kowariancję konieczne jest wyznaczenie
l
1 1 208,5
&
reprezentantów przedziałów oraz liczebności brzegowych: " Y = y *n" j = (0,5*21+1,5*22 + 3,5*15 + 7,5*15)= = 2,86
" j
n 73 73
j=1
k
1
Ocena - xi sX = - X )2 *ni" =
"(xi
n -1
i=1
Reprez. Razem n
2 3 4 5 " j
0 - 1 0,5 8 6 4 3 21
1
2 2 2 2
= [(2 - 3,29) *18 + (3- 3,29) *27 + (4 - 3,29) *17 + (5 - 3,29) *11]= 1,01
1 - 2 1,5 2 8 7 5 22
72
2 - 5 3,5 3 7 3 2 15
l
1
5 - 10 7,5 5 6 3 1 15
sY = y -Y )2 *n" j =
"( & j
Razem n
i" 18 27 17 11 73
n -1
j=1
1
2 2 2 2
= [(0,5 - 2,86) *21+ (1,5 - 2,86) *22 + (3,5 - 2,86) *15 + (7,5 - 2,86) *15]= 2,60
72
111 112
Statystyka opisowa 14
godz)
Czas (w
Czas (w
godz) - y
j
Tomasz Owczarek 2011-03-07
Korelacja Pearsona Regresja I rodzaju
Przykład 2 c.d.
Obliczamy kowariancjÄ™ i korelacjÄ™:
Funkcja regresji I rodzaju zmiennej losowej X względem
r s
1
C(X,Y) = - x)(yj - y)nij =
""(xi zmiennej losowej Y.
n-1
i=1 j=1
1 r
wij
= [(2 - 3,29)(0,5 - 2,86)*8 + (2 - 3,29)(1,5 - 2,86)*2 + (2 - 3,29)(3,5 - 2,86) *3 +
m1(yj ) = E(X /Y = yj ) =
72 "xi
w" j
i=1
+ (2 - 3,29)(7,5 - 2,86)*5 + (3 - 3,29)(0,5 - 2,86)*6 + (3 - 3,29)(1,5 - 2,86)*8 +
+ (3 - 3,29)(3,5 - 2,86)*7 + (3 - 3,29)(7,5 - 2,86)*6 + (4 - 3,29)(0,5 - 2,86)*4 +
Funkcja regresji I rodzaju zmiennej losowej Y względem
+ (4 - 3,29)(1,5 - 2,86)*7 + (4 - 3,29)(3,5 - 2,86) *3 + (4 - 3,29)(7,5 - 2,86)*3+
zmiennej losowej X.
+ (5 - 3,29)(0,5 - 2,86)*3+ (5 - 3,29)(1,5 - 2,86)*5 + (5 - 3,29)(3,5 - 2,86)* 2 +
s
- 22,48
wij
+ (5 - 3,29)(0,5 - 2,86)*1] = = -0,31
m2(xi) = E(Y / X = xi) =
"yj
72
wi"
j=1
C( X ,Y ) - 0,31
rX ,Y = = = -0,12
sxsy 1,01* 2,06
Brak zależności pomiędzy cechami.
113 114
Regresja II rodzaju (liniowa) Regresja II rodzaju (liniowa)
Współczynnik zbieżnoÅ›ci Õ2
Õ
Õ
Õ
Miarą jakości dopasowania jest współczynnik zbieżności:
Regresja liniowa jest prostą, która najlepiej opisuje zależność
n
pomiędzy dwiema cechami.
"( yi - w)2
2 i=1
Õ =
yx n
w = a x+b
y y
- y)2
"(yi
i=1
gdzie
lub współczynnik determinacji R2
C(X,Y)
ay =
2
R2 =1-Õ2
sx
by = y -ayx
Im wartości współczynnika determinacji bliższe są 1 tym lepsze
jest dopasowanie modelu. R2 wskazuje w jakim stopniu model
tłumaczy zależność pomiędzy cechami.
115 116
Korelacja rang Spearmana Korelacja rang Spearmana
Przykład. Zbadać czy istnieje zależność pomiędzy oceną ze statystyki a
Korelacja rang stosowana jest w przypadku, gdy występuje
wzrostem. Wyniki badania przedstawiono w tablicy:
niewielka ilość obserwacji cech mierzalnych lub w przypadku
Xi wysoki niski wysoki średni niski średni
cech jakościowych, porządkowych.
Yi dst bdb db ndst dst db
n
Obliczamy rangi dla obydwu cech:
2
6
"di
i=1 ai 5,5 1,5 5,5 3,5 1,5 3,5
rd = 1-
n(n2 -1) Xi wysoki niski wysoki średni niski średni
Yi dst bdb db ndst dst db
gdzie di=ai-bi, a ai i bi sÄ… rangami nadanymi obydwu cechom
bi 2,5 6 4,5 1 2,5 4,5
w obserwowanej próbie.
oraz różnice rang i ich kwadraty:
Współczynnik korelacji Spearmana przyjmuje wartości z
ai 5,5 1,5 5,5 3,5 1,5 3,5
przedziału [-1; 1]. Wartości bliskie 0 oznaczają brak korelacji, bi 2,5 6 4,5 1 2,5 4,5
ai-bi 3 -4,5 1 2,5 -1 -1
bliskie 1 lub -1 bardzo silnÄ… korelacjÄ™.
(ai-bi)2 9 20,25 1 6,25 1 1
117 118
Statystyka opisowa 15
Tomasz Owczarek 2011-03-07
Korelacja rang Spearmana Szeregi czasowe
Przykład c.d.
Szereg czasowy (chronologiczny) to zbiór obserwacji badanej
Obliczamy korelacjÄ™ Spearmana:
cechy lub wartości badanego zjawiska obserwowanych w
n
2 różnych momentach czasu i uporządkowanych pod względem
6
"di
6*38,5 231
i=1 chronologicznym.
rd = 1- = 1- = 1- = 1-1,1 = -0,1
n(n2 -1) 6*(62 -1) 210
Inne rodzaje zbiorów danych:
Brak zależności pomiędzy wzrostem studenta a oceną z egzaminu ze
Próba przekrojowa z zbiór wartości cechy obserwowany w
statystyki.
tym samym momencie czasu na wielu obiektach.
Próba przekrojowo-czasowa (panel).
Próba przekrojowa zbilansowana i niezbilansowana.
119 120
Szeregi czasowe Składniki szeregu czasowego
Przykłady
Wzrost człowieka mierzony co rok:
W teorii szeregów czasowych wyróżnia się zwykle
54 cm, 67 cm, 83 cm, 95 cm, 104 cm, 112 cm.
następujące składniki szeregu czasowego:
Produkcja przedsiębiorstwa w mln zł mierzona miesięcznie:
3,2, 3,5, 3,6, 3,5, 3,7, 3,9, 4,2, 3,9, 3,8
tendencjÄ™ rozwojowÄ… (trend),
Cena cukru w sklepie:
wahania okresowe,
Data 28.04 29.04 30.4 1.05 2.05 3.05 4.05 6.05 7.05
Cena 1,35 1,39 1,45 1,46 1,46 1,34 1,29 1,23 1,15
wahania koniunkturalne,
1,6
1,2
wahania przypadkowe.
0,8
Cena
cukru
0,4
0
28.04 29.04 30.4 1.05 2.05 3.05 4.05 6.05 7.05
121 122
Składniki szeregu czasowego Składniki szeregu czasowego
Tendencja rozwojowa to własność szeregu polegająca na Wahania okresowe to rytmiczne wahania o określonym cyklu
polegajÄ…ca na systematycznych, jednokierunkowych (okresie przebiegu). Obserwuje siÄ™ wahania w cyklu rocznym,
zmianach (zroście lub spadku) poziomu badanego zjawiska, miesięcznym, tygodniowym lub dziennym.
ujawniająca się w długim okresie obserwacji.
Przykłady
Przykłady
Wahania sprzedaży piwa, lodów związane z porami roku.
Rosnąca sprzedaż i zatrudnienie w rozwijającym się
Zmiany obrotów sklepów związane z występowaniem świąt
przedsiębiorstwie.
(cykl roczny) lub wypłatami w przedsiębiorstwach (cykl
miesięczny).
Wzrost nastolatka.
Ilość wiedzy u studenta AM. Wahania struktury sprzedaży w sklepie osiedlowym w ciągu
doby.
123 124
Statystyka opisowa 16
Tomasz Owczarek 2011-03-07
Składniki szeregu czasowego Składniki szeregu czasowego
Przykład
Wahania koniunkturalne to systemowe, falowe wahania
Sprzedaż piwa małego browaru w ciągu 5 kolejnych lat z
rozwoju gospodarki obserwowane w dłuższych okresach niż
pokazaniem trendu, wahań okresowych i koniunkturalnych.
rok.
1700
Przykłady
1500
Zmiana zapotrzebowania na mięso spowodowana zmianami
1300
stylu życia, zasobnością, itp.
1100
Zmiana zapotrzebowania na futra ze skór naturalnych.
900
Zmiany cen węgla wywołane zmianą zapotrzebowania na
rynkach światowych. 0 5 10 15 20 25 30 35 40 45 50 55 60
Sprzedaż Trend W.okresow e W.koniunkturalne
125 126
Dekompozycja szeregów
Wyrównywanie szeregów
czasowych
Dekompozycja szeregu czasowego to rodzaj analizy
Wyrównywanie szeregów ma na celu usunięcie z szeregu
wahań okresowych, koniunkturalnych i przypadkowych, aby
polegającej na wyodrębnieniu poszczególnych
wyeksponować trend rozwojowy.
składników szeregu i pomiarze ich wielkości.
Metody wyrównywania szeregów:
Na dekompozycję szeregów czasowych składa się:
Åšrednie ruchome,
Wyrównywanie szeregów czasowych
Wyrównywanie wykładnicze,
Analiza wahań okresowych
Dopasowanie krzywych Metodą Najmniejszych Kwadratów.
Analiza wahań koniunkturalnych
127 128
Średnie ruchome Wyrównywanie wykładnicze
Oblicza się zwykle z nieparzystej ilości sąsiadujących ze sobą
obserwacji i przyporządkowuje wartości w środku.
S1 = y1
q
St = ayt + (1- a)St -1, t = 2,..,n
1
yt = yt+i
"
2q +1
i=-q
Przyjmuje siÄ™ za a:
dla nieparzystej ilości okresów lub
małą wartość (bliską 0), gdy nie występuje tendencja
îÅ‚1 q-1 1 Å‚Å‚
1
rozwojowa, a wahania przypadkowe sÄ… silne,
yt = yt-q + yt +i + yt +q śł
ïÅ‚ "
2q 2 2
i=-q+1
ðÅ‚ ûÅ‚
dużą (bliską 1), gdy wahania są niewielkie i występuje
dla parzystej ilości okresów.
tendencja rozwojowa,
zwykle wystarczy wartość z przedziału [0,1; 0,3].
Długość okresu przyjmuje się równą w długości cyklu wahania
okresowego lub wahania koniunkturalnego.
129 130
Statystyka opisowa 17
Tomasz Owczarek 2011-03-07
Wahania okresowe Wahania okresowe
Ad. 2 Oznaczmy przez yt(i) obserwacje, gdzie górny indeks
przedstawia numer obserwacji w cyklu.
Analizę wahań okresowych wykonuje się po oczyszczeniu
Przez Ni oznaczmy zbiór numerów obserwacji dotyczących i-
szeregu z trendu. Służą do tego celu wskazniki wahań
tego podokresu w cyklu.
okresowych.
Ad. 3 Obliczamy średnie dla wszystkich podokresów.
Etapy obliczania wskazników:
1
yi = yt(i)
"
Ustalenie długości cyklu, ni t"Ni
Wybranie obserwacji znajdujÄ…cych siÄ™ w tym samym miejscu
Ad. 4 Obliczamy wskazniki jako:
cyklu, yi
Oi = *100%
y
Obliczenie średnich,
Otrzymany wskaznik opisuje jak zmienia się wartość obserwacji
Obliczenie wskazników.
w zależności od miejsca w cyklu okresowym.
131 132
Indeksy statystyczne Indeksy proste
Indeksy statystyczne są miernikami służącymi do
Przyrost absolutny
dynamicznej analizy zjawiska opisanego za pomocÄ…
"t = "yt = yt - yt -1
szeregu czasowego.
Indeksy proste
Przyrost względny (tempo)
Przyrost absolutny
łańcuchowy
jednopodstawowy
Przyrosty względne (indeksy tempa)
"t "t
´t = ´t =
Indeksy dynamiki
yt* yt -1
Indeksy agregatowe
Wskazniki dynamiki
Indeksy indywidualne (proste)
łańcuchowy
jednopodstawowy
Indeks wartości
yt
yt
Indeksy Laspeyresa
it /t -1 =
it / t* =
yt-1
yt*
Indeksy Paaschego
Indeksy Fischera
133 134
Indeksy proste Indeksy agregatowe
Indeksy agregatowe pokazują zmiany cen, ilości i wartości
Åšredni poziom zjawiska
wszystkich towarów jednocześnie oraz wpływ zmian cen i ilości
dla strumieni
na zmianę wartości.
(wartości można sumować)
n-1
1
Zachodzi zwiÄ…zek:
y = yt
"
n
t=0
wi,0=pi,0*qi,0
dla zasobów
Przez w oznaczono wartość, przez p  cenę, przez q  ilość.
(wartości nie można sumować)
n-2
j odnosi siÄ™ do numeru obserwacji (przedmiotu, towaru), 0 do
0,5( y0 + yn-1) + yt
"
obserwacji w okresie podstawowym (bazowym), 1 do
t =1
y =
n -1
obserwacji w okresie badanym.
135 136
Statystyka opisowa 18
Tomasz Owczarek 2011-03-07
Indeksy agregatowe Indeksy agregatowe
Indeksy agregatowe
Indeksy proste (indywidualne)
Agregatowy indeks wartości
Indywidualny indeks wartości
p q
"wj1 " j1 j1
j j
wj1 I = =
w
iw= pj q
j "wj0 " 0 j0
wj0
j j
Agregatowy indeks cen
Indywidualny indeks cen
Laspeyresa
pj1
p q
i = " j1 j0
j p
p j
j 0
I =
L p
p qj0
" j0
j
Indywidualny indeks ilości
Paaschego
qj1
iq=
pj1qj1
j
"
qj0
j
I =
P p
p q
" j0 j1
j
137 138
Indeksy agregatowe Indeksy agregatowe
Przykład. W salonie sprzedawane są trzy marki samochodów: Renault,
Agregatowy indeks ilości
Nissan i Hyunday. Przeanalizowano ich sprzedaż na koniec 2003 i 2004 roku.
Laspeyresa
Ilości sprzedawanych samochodów oraz przeciętną cenę sprzedaży podano w
pj q
" 0 j1
j tablicy:
I =
L q
p q
" j0 j0
j Rok
Paaschego 2003 2004
pj1qj1 Ilość Cena Ilość Cena
"
j
q0 p0 q1 p1
I = Marka
P q
p q
" j1 j0
Renault 1 20 40 25 45
j
Nissan 2 15 50 11 52
Indeksy Fishera
Hyunday 3 5 30 9 35
cen ilości
I = I I I = I I
F p L p P p F q L q P q
Jak zmieniła się sprzedaż salonu i jaki był wpływ na nią zmiany cen i ilości
sprzedanych samochodów? (wykorzystać indeksy agregatowe).
Równość indeksowa
Iw=LI Iq =PI Iq =F I Iq
p P p L p F
139 140
Indeksy agregatowe Indeksy agregatowe
Przykład c.d.
Przykład c.d.
Do obliczenia indeksów prostych i agregatowych niezbędne jest obliczenie
Obliczamy indeksy proste.
wartości sprzedawanych samochodów:
Indeksy cen:
Rok
p2,1
p1,1 45 52 p3,1 35
2003 2004
i = = = 1,13 i = = =1,04 i = = =1,17
1 p 2 p 3 p
p1,0 40 p2,0 50 p3,0 30
Wartość
w0 w1
Marka
Indeksy ilości:
Renault 1 800 1125
q2,1
q1,1 25 11 q3,1 9
Nissan 2 750 572
iq= = = 1,25 iq= = = 0,73 iq= = = 1,80
1 2 3
Hunday 3 150 315
q1,0 20 q2,0 15 q3,0 5
Indeksy wartości:
w2,1
w1,1 1125 572 w3,1 315
iw= = = 1,41 iw= = = 0,76 iw= = = 2,10
1 2 3
w1,0 800 w2,0 750 w3,0 150
141 142
Statystyka opisowa 19
Tomasz Owczarek 2011-03-07
Indeksy agregatowe Indeksy agregatowe
Przykład c.d. Przykład c.d.
Agregatowy indeks cen:
Obliczamy indeksy agregatowe.
Laspeyresa:
Agregatowy indeks wartości:
p qj0
" j1
45*20 + 52*15 + 35*5 1855
j
p q
"wj1 " j1 j1
I = = = = 1,09
L p
1125 + 572 + 315 2012
j j
p qj 40*20 + 50*15 + 30*5 1700
I = = = = =1,18 " j0 0
w
j
pj q 800 + 750 +150 1700
"wj0 " 0 j0
j j
Gdyby ilości były stałe, na poziomie z roku podstawowego, to zmiany cen
spowodowałyby 9%-wy wzrost wartości sprzedaży
Można to interpretować (przeczytać) jako:
Wartość sprzedawanych samochodów wzrosła w badanym okresie o 18%. Paaschego:
p q
Obroty salonu w roku 2004 stanowiły 118% obrotów w roku 2003.
" j1 j1
45* 25 + 52*11+ 35*9 2012
j
I = = = = 1,11
Jaki wpływ na ten wzrost miały zmiany cen i ilości sprzedawanych P p
pj qj1 40* 25 + 50*11+ 30*9 1820
" 0
samochodów określają indeksy agregatowe cen i ilości.
j
Gdyby ilości były stałe, na poziomie z roku badanego, to zmiany cen
spowodowałyby 11%-wy wzrost wartości sprzedaży
143 144
Indeksy agregatowe Indeksy agregatowe
Przykład c.d. Przykład c.d.
Agregatowy indeks ilości: Indeksy Fishera:
Laspeyresa: Indeks cen:
p qj1
I = I I = 1,09*1,11 = 1,21 = 1,1
" j0
F p L p P p
40*25 + 50*11+ 30*9 1820
j
I = = = = 1,07
L q
Gdyby ilości sprzedawanych samochodów były stałe, to zmiany cen
pj q 40*20 + 50*15 + 30*5 1700
" 0 j0
j spowodowałyby 10%-wy wzrost wartości sprzedaży
Gdyby ceny były stałe, na poziomie z roku podstawowego, to zmiany ilości
spowodowałyby 7%-wy wzrost wartości sprzedaży Indeks ilości:
I = I I = 1,07*1,08 = 1,16 =1,075
F q L q P q
Paaschego:
pj1qj1
" Gdyby ceny były stałe, to zmiany ilości spowodowałyby 7,5%-wy wzrost
45*25 + 52*11+ 35*9 2012
j
I = = = =1,08
wartości sprzedaży.
P q
p q 45*20 + 52*15 + 35*5 1855
" j1 j0
j
Gdyby ceny były stałe, na poziomie z roku badanego, to zmiany ilości
spowodowałyby 8%-wy wzrost wartości sprzedaży
145 146
Statystyka opisowa 20


Wyszukiwarka

Podobne podstrony:
11 Statystyka opisowaid761
1 wprowadzenie do statystyki statystyka opisowa
2 Statystyka opisowa S
Statystyka opisowa
Statystyki opisowe
Statystyka opisowa rozwiÄ…zane kolowkia
Statystyka opisowa
4 Statystyka opisowa i rozkład normalny
Statystyka opisowa
STATYSTYKA OPISOWA
Statystyka opisowa i ekonomiczna Wykład 1
Tworzenie statystyk opisowych w Excelu

więcej podobnych podstron