Statystyka wykłady


Statystyka
Wykład I
" Statystyka  dyscyplina naukowa,
traktujÄ…ca o metodach liczbowego opisu i
wnioskowania o prawidłowościach
występujących w procesach masowych.
" Umożliwia i dostarcza metod do
podejmowania decyzji w warunkach
niepewności.
" Każde zjawisko masowe jest
kształtowane przez dwa rodzaje
przyczyn:
- główne, podstawowe, typowe
- uboczne, przypadkowe, nietypowe
1
" Statystyka opisowa  metody
gromadzenia, opracowywania i
prezentacji danych statystycznych
" Statystyka matematyczna  pozwala na
uogólnienie wniosków wynikających z
obserwacji części zbiorowości tak, aby
ryzyko popełnienia błędu było małe
" Zbiorowość statystyczna (populacja
statystyczna)  zbiór dowolnych elementów
(osób, przedmiotów faktów) podobnych pod
względem określonych cech, ale nie
identycznych
" Dzielimy je na: skończone lub
nieskończone; statyczne lub dynamiczne;
jednowymiarowe lub wielowymiarowe,
jednorodne lub niejednorodne
2
" Jednostki statystyczne  elementy składowe
zbiorowości statystycznej
" Zbiorowość generalna  wszystkie elementy
będące przedmiotem badania, co, do których
chcemy formułować wnioski
" Zbiorowość próbna  podzbiór populacji
generalnej, obejmujący część jej elementów
wybranych w określony sposób
" Badanie statystyczne to ogół prac mający na
celu poznanie struktury określonej
zbiorowości statystycznej.
" Proces zbierania materiału statystycznego
nazywamy obserwacjÄ….
3
" Badanie statystyczne całkowite (podlegają
mu wszystkie jednostki zbiorowości
statystycznej) to np. spis powszechny,
inwentaryzacja, rejestracja,
sprawozdawczość statystyczna.
" Badanie statystyczne częściowe (podlegają
mu tylko wybrane jednostki zbiorowości
generalnej) to np. badanie monograficzne
(jest to badanie indywidualnych
przypadków); badanie ankietowe; badanie
reprezentacyjne.
" Cecha statystyczna to pewna właściwość,
którą charakteryzują się jednostki
statystyczne.
4
" Cechy stałe (rzeczowe, czasowe,
przestrzenne) nie podlegajÄ… badaniu i
decydujÄ… o zaliczeniu jakiejÅ› jednostki do
określonej zbiorowości. Są one wspólne
wszystkim jednostkom zbiorowości.
" Cechy zmienne podlegajÄ… badaniom
statystycznym i różnią poszczególne
jednostki zbiorowości.
" Cechy statystyczne dzielimy na:
1. Mierzalne:
a. Ciągłe
b. Skokowe
2. Niemierzalne
5
" Cechy niemierzalne (jakościowe)  są
określane słownie np. kolor oczu, płeć,
miejsce zamieszkania
" Cechy mierzalne ciągłe  mogą przyjmować
każdą wartość z pewnego zbioru np. waga,
wzrost, długość
" Cechy mierzalne skokowe (dyskretne) 
przyjmują przeliczalny zbiór wartości np.
liczba osób w rodzinie, stopień z kolokwium
" Cele badania statystycznego:
1. poznanie rozkładu zbiorowości ze
względu na wybrane cechy,
2. ustalenie związków miedzy wybranymi
cechami,
6
3. porównanie kilku zbiorowości ze
względu na te same wybrane cechy,
4. poznanie dynamiki zbiorowości czyli
zmian w czasie.
" Kolejne etapy badania statystycznego:
I. projektowanie badania,
II. zbieranie danych (pomiar lub
obserwacja),
III. opracowanie i uporządkowanie materiału
statystycznego,
IV. analiza struktury zbiorowości próbnej,
V. uogólnienie wyników i próba
wyciągnięcia wniosków co do
zbiorowości generalnej.
7
" Szereg statystyczny rozdzielczy  jest to
uporządkowany zbiór danych
statystycznych według jakiegoś logicznego
kryterium.
" Dla cechy ciągłej budujemy szeregi
rozdzielcze z przedziałami klasowymi, a dla
cechy skokowej, jeśli jest mało wartości
danej cechy szereg rozdzielczy punktowy, a
jeśli dużo to również szereg rozdzielczy z
przedziałami klasowymi.
" Szereg czasowy  dane pogrupowane sÄ… w
tym przypadku według kryterium
czasowego np.. PKB w latach 1990  2002.
8
Oznaczenia:
X  cecha
N  liczebność zbiorowości generalnej
n  liczebność zbiorowości próbnej
k  liczba wariantów, wartości lub klas cechy
i  numer kolejnego wariantu, wartości lub
przedziału cechy
i=1,& ,k
xi
- kolejny wariant lub wartość cechy
x0i
- dolna granica przedziału klasowego
x1i
- górna granica przedziału klasowego
ni
- liczebność odpowiadająca kolejnemu
wariantowi, wartości lub przedziałowi
klasowemu
9
wi - częstość względna (wskaznik struktury)
dla kolejnego wariantu, wartości lub
przedziału klasowego
nisk
- liczebności skumulowane ( liczba
jednostek, dla których cecha przyjmuje
xi
wartości nie mniejsze od )
wisk
- dystrybuanta empiryczna (częstości
względne skumulowane 
prawdopodobieństwo, że cecha przyjmie
xi
wartości nie mniejsze niż )
h  rozpiętość przedziału klasowego
Wzory
k
n =ð ni
åð
i=ð1
10
ni
wi =ð
n
i
nisk =ð nj
åð
j=ð1
nji
i i
wisk =ð wj =ð
åð åð
j=ð1 j=ð1
n
Przykłady
I. Cecha niemierzalna
20 studentów pytamy o kolor oczu.
Przyjmując następujące oznaczenia:
N - niebieskie, Z  zielone, P  piwne, C 
czarne, S  szare;
11
Otrzymujemy następujące odpowiedzi:
N, Z, S, N, C, N, S, P, Z, N, P, P, N, C, N,S,
N, Z, P, S
xi
k=5, X  kolor oczu studentów, - kolejne
warianty cechy (C, N, P, S, Z)
Studenci według koloru oczu:
ni
wi
xi
wi
*100%
C 2 2:20=0,1 10%
N 7 7:20=0,35 35%
P 4 4:20=0,2 20%
S 4 4:20=0,2 20%
Z 3 3:20=0,15 15%
20 1,00 100%
åð
12
liczba studentów według
koloru oczu
Z
S
P
N
C
0 2 4 6 8
warianty cechy
13
liczebości czastkowe
podział procentowy studentów
wg. koloru oczu
C
N
P
S
Z
II. Cecha mierzalna skokowa (dyskretna)
60 osób pytamy o liczbę małoletnich dzieci w
rodzinie. Otrzymujemy odpowiedzi postaci:
1,5,6,2,2,itd.
14
X  cecha (liczba małoletnich dzieci w
gospodarstwie domowym)
xi
- kolejne wartości cechy
xi
={0,1,2,3,4,5,6,7,8}, k=9
wi
ni
wisk
k
xi
nisk
1 0 10 0,17 10 0,17
2 1 20 0,33 30 0,50
3 2 9 0,15 39 0,65
4 3 6 0,10 45 0,75
5 4 5 0,08 50 0,83
6 5 4 0,07 54 0,90
7 6 3 0,05 57 0,95
8 7 2 0,03 59 0,98
9 8 1 0,02 60 1,00
åð
60 1
Wykresy, które można sporządzić to: rozkład
liczebności, rozkład częstości, dystrybuanta
empiryczna.
15
III. Cecha mierzalna ciągła.
Dla cechy ciągłej budujemy szereg rozdzielczy
przedziałowy. Liczbę klas, które musimy
utworzyć wyznaczamy ze wzorów:
k ð n
k ð1+ð3,322log n
Rozpiętością przedziału klasowego h
nazywamy różnicę między dolną a górną
granicą tego przedziału.
x1i
x0i
h= -
Rozpiętości przedziałów wyznaczamy ze
wzoru:
xmax -ðxmin
h ð
k
16
100 studentów jednej uczelni spytano o czas
dojazdu na uczelniÄ™. Otrzymano odpowiedzi,
które po uporządkowaniu od najmniejszej do
największej wyglądały następująco:
2min; 2,30min; & ; 81,30min; 90min
k =ð 100 =ð10
90min-ð2min
h =ð =ð 8,8
10
Przyjmujemy, więc h=9.
X  cecha (czas dojazdu do szkoły)
wi
x1i
x0i ni
wisk
k -
nisk
1 0-10 5 0,05 5 0,05
2 10-20 10 0,10 15 0,15
3 20-30 25 0,25 40 0,40
4 30-40 20 0,20 60 0,60
5 40-50 15 0,15 75 0,75
6 50-60 12 0,12 87 0,87
7 60-70 6 0,06 93 0,93
8 70-80 4 0,04 97 0,97
9 80-90 3 0,03 100 1,00
åð
100 1,00
17
Dla zmiennej ciągłej możemy narysować
histogram, wielobok liczebności i krzywą
liczebności.
Rozkłady typowe to takie, które mają tylko
jedno maksimum.
Jeśli przedziały nie są równe to musimy
przeliczyć liczebności cząstkowe korzystając ze
wzoru:
n'i =ð ni hwz
hi
gdzie:
ni'- przeliczona liczebność dla przedziału i
hi - rozpiętość i-tego przedziału
hwz - wybrana podstawowa rozpiętość
przedziału
18
Mamy dane dotyczące zarobków pracowników
pewnej firmy:
x1i
x0i ni
hi
-
ni

(tys.zł.)
0,5-1,5 15 1 7,5
1,5-2,0 20 0,5 20
2,0-2,5 10 0,5 10
2,5-3,5 8 1 4
3,5-3,75 4 0,25 8
3,75-4,0 2 0,25 4
4,0-6,0 6 2 1,5
65
19
WYKAAD II
ANALIZA STRUKTURY
DO PRZEPROWADZENIA WSZECHSTRO-
NNEJ ANALIZY STRUKTURY MUSIMY
UŻYĆ:
1. MIAR POAOŻENIA (POZIOMU
PRZECITNEGO, TENDENCJI
CENTRALNEJ)
2. MIAR ZMIENNOÅšCI
(ROZPROSZENIA, ZRÓŻNICOWANIA,
DYSPERSJI)
3. MIAR ASYMETRII
4. MIAR KONCENTRACJI.
1. MIARY POAOŻENIA
20
DZIELIMY JE NA: KLASYCZNE (ÅšREDNIA
ARYTMETYCZNA, ÅšREDNIA HARMONI-
CZNA, ÅšREDNIA GEOMETRYCZNA) I
POZYCYJNE (DOMINANTA, KWARTYLE).
MIARY KLASYCZNE S OBLICZANE
JAKO WYPADKOWE WARTOÅšCI
WSZYSTKICH ODMIAN CECHY
WSZYSTKICH BADANYCH JEDNOSTEK
ZBIOROWOÅšCI, A MIARY POZYCYJNE
WSKAZUJ NA OKREÅšLON POZYCJ
JEDNOSTEK. MIARY KLASYCZNE
OBLICZAMY TYLKO DLA ROZKAADÓW
TYPOWYCH, A MIARY POZYCYJNE DLA
KAŻDEGO TYPU ROZKAADU.
MIARY KLASYCZNE
_
x
A. ÅšREDNIA ARYTMETYCZNA -
_
n
1 1
åð
(x1+ðx2+ð...+ðxn-ð1+ðxn)=ð xi
x
=
i=ð1
n n
21
JEST TO ÅšREDNIA ARYTMETYCZNA
NIEWAŻONA, OBLICZANA DLA DANYCH
INDYWIDUALNYCH.
PRZYKAAD
20 OSÓB PYTAMY O OCENY Z
EGZAMINU ZE STATYSTYKI.
OTRZYMUJEMY NASTPUJCE
ODPOWIEDZI:
4;2;3;2;3;4;5;2;3;3;3;4;5;5;2;2;3;3;4;3
_
x
=(4+2+3+2+3+4+5+2+3+3+3+4+5+5+2+2+
3+3+4+3)/20=65/20=3,25
ÅšREDNIA OCEN Z EGZAMINU WYNOSI
3,25.
ŚREDNIA ARYTMETYCZNA WAŻONA
DLA DANYCH Z SZEREGU
PUNKTOWEGO (CECHA SKOKOWA):
_
k
1
x =ð xini
åð
i=ð1
n
PRZYKAAD
22
UPORZDKUJMY DANE Z POPRZEDNIE-
GO PRZYKAADU:
xi 2 3 4 5
ni
5 8 4 3
_
x
=(2*5+3*8+4*4+5*3)/20=65/20=3,25
ŚREDNIA ARYTMETYCZNA WAŻONYCH
DLA DANYCH Z SZEREGU ROZDZIEL-
CZEGO PRZEDZIAAOWEGO (CECHA
CIGAA LUB SKOKOWA):
_

k
1
x =ð x ni
åð
i
i=ð1
n

x
i - ÅšRODEK PRZEDZIAAU
GDZIE:
KLASOWEGO.

x0i +ðx1i
x =ð
2
23
ROZWAŻMY PRZYKAAD DOTYCZCY
CZASU DOJAZDU NA UCZELNI:
oð oð
x1i
x0i ni
k -
x x
*ni
i i
1 0-10 5 5 25
2 10-20 10 15 150
3 20-30 25 25 625
4 30-40 20 35 700
5 40-50 15 45 675
6 50-60 12 55 660
7 60-70 6 65 390
8 70-80 4 75 300
9 80-90 3 85 255
åð
100 3780
_
x
=3780/100=37,80
ÅšREDNI CZAS DOJAZDU NA UCZELNI
STUDENTÓW WYNOSI 37,80 MIN.
WAASNOÅšCI ÅšREDNIEJ ARYTMETYK-
CZNEJ:
·ð JEST WYWYPADKOW WSZYSTKICH
WARTOÅšCI ZMIENNYCH BADANEJ
24
CECHY, NIE MOŻE BYĆ WIC NIŻSZA
OD NAJMNIEJSZEJ WARTOÅšCI
ZAOBSERWOWANEJ, ANI WYŻSZA
OD WARTOÅšCI NAJWIKSZEJ.
·ð ZALEÅ»Y NIE OD LICZEBNOÅšCI KLAS,
LECZ OD ICH WZAJEMNYCH
PROPORCJI, WIC MOŻNA J
OBLICZAĆ PRZY ZASTOSOWANIU
CZSTOÅšCI WZGLDNYCH.
·ð SUMA ODCHYLEC POSZCZEGÓL-
NYCH WARTOÅšCI OD ÅšREDNIEJ JEST
RÓWNA ZERO.
·ð SUMA KWADRATÓW ODCHYLEC
POSZCZEGÓLNYCH WARTOŚCI
CECHY OD ÅšREDNIEJ JEST
MINIMALNA.
_
x
B. ÅšREDNIA GEOMETRYCZNA- G
STOSUJEMY J, GDY BADAMY ÅšREDNIO
TEMPO ZMIANY ZJAWISK (SZEREGI
CZASOWE).
25
_
n
Õð
xG =ðn x1x2...xn =ðn xi
i=ð1
C. DOMINANTA (MODA, WARTOŚĆ
NAJCZSTSZA)- D(x)
JEST TO WARTOŚĆ CECHY NAJCZŚCIEJ
PRZYJMOWANA PRZEZ JEDNOSTKI W
PRÓBIE. WYZNACZAMY J JEDYNIE
DLA ROZKAADÓW TYPOWYCH.
PRZEDZIAA, W KTÓRYM WYSTPUJE
DOMINANTA I DWA SSIADUJCE Z
NIM MUSZA MIEĆ TE SAME
ROZPITOÅšCI.
·ð WYZNACZANIE DOMINANTY DLA
CECHY SKOKOWEJ.
JEST TO TA WARTOŚĆ CECHY, DLA
KTÓREJ MAMY NAJWIEKSZ
LICZEBNOŚĆ CZASTKOW LUB
CZSTOŚĆ WZGLDN.
D(x)=3
26
OCEN, KTÓR STUDENCI NAJCZŚCIEJ
DOSTAWALI NA EGZAMINIE ZE
STATYSTYKI JEST 3.
·ð WYZNACZANIE DOMINANTY DLA
CECHY CIGAEJ.
nD -ðnD-ð1
D(x) =ð x0D +ð hD
(nD -ðnD-ð1)+ð(nD -ðnD+ð1)
D(x)=20+{(25-10)/[(25-10)+(25-20)]}10=28
STUDENCI NAJCZÅšCIEJ JAD NA
UCZELNI 28 MIN.
C. KWARTYLE
KWARTYL PIERWSZY DZIELI
ZBIOROWOŚĆ NA DWIE CZŚCI W TAKI
SPOSÓB, ŻE 25% JEDNOSTEK MA
WARTOŚĆ CECHY NIŻSZ OD
KWARTYLA PIERWSZEGO, A 75%
JEDNOSTEK WYŻSZ.
KWARTYL DRUGI ZWANY MEDIAN
DZIELI ZBIOROWOŚĆ NADIW RÓWNE
CZÅšCI.
27
KWARTYL TRZECI DZIELI ZBIOROWOŚĆ
W TAKI SPOSÓB, ŻE 75% JEDNOSTEK MA
WARTOŚCI CECHY NIŻSZE OD
KWARTYLA TRZECIEGO, A 25%
WYŻSZE.
·ð WYZNACZANIE KWARTYLI DLA
CECHY SKOKOWEJ.
Q1;Q2;;Q3- KWARTYL PIERWSZY,
DRUGI, TRZECI
Q1- WARTOŚĆ CECHY, DLA KTÓREJ
LICZEBNOÅšCI SKUMULOWANE PRZYJ-
MUJ WARTOŚĆ n/4.
Q2- WARTOŚĆ CECHY, DLA KTÓREJ
LICZEBNOÅšCI SKUMULOWANE PRZYJ-
MUJ WARTOŚĆ n/2, GDY n PARZYSTE
LUB (n+1)/2 GDY N NIEPARZYSTE.
Q3 - WARTOŚĆ CECHY, DLA KTÓREJ
LICZEBNOÅšCI SKUMULOWANE PRZYJ-
MUJ WARTOŚĆ 3n/4
28
xi 2 3 4 5
ni
5 8 4 3
5 13 17 20
nisk
Q1=2 Q2=3 Q3 =4
25% STUDENTÓW OTRZYMAAO Z
EGZAMINU OCEN NIE WIKSZ NIÅ» 2;
50% STUDENTÓW OCEN NIE WIKSZ
NIÅ» 3, A 75% OCEN NIE WIKSZ NIÅ» 4.
·ð WYZNACZANIE KWARTYLI DLA
CECHY CIGAEJ.
hQp
p*n
sk
Qp =ð x0Q +ð( -ðnQ -ð1)
p p
4 nQp
p=1,2,3
Qp
- KWARTYL RZDU p
x0q
- DOLNA GRANICA PRZEDZIAAU
p
KWARTYLA RZDU p
29
SK
nQ -ð1
- LICZEBNOŚĆ SKUMULOWANA
p
DLA PRZEDZIAAU POPRZEDZAJCEGO
PRZEDZIAA KWARTYLA RZDU p
hQ -
ROZPITOŚĆ PRZEDZIAAU
p
KWARTYLA RZDU p
nQ -
LICZEBNOŚĆ PRZEDZIAAU
p
KWARTYLA RZDU p
x1i
x0i ni
k -
nisk
1 0-10 5 5
2 10-20 10 15
3 20-30 25 40
4 30-40 20 60
5 40-50 15 75
6 50-60 12 87
7 60-70 6 93
8 70-80 4 97
9 80-90 3 100
åð
100
Q1=20+(100/4-15)*10/25=24,00
30
Q2=30+(100/2-40)*10/20=35,00
Q3=40+(3*100/4-60)*10/15=50,00
25% STUDENTÓW DOJEŻDŻA NA
UCZELNI W CZASIE NIE DAUŻSZYM
NIÅ» 24 MINUTY, 50% W CZASIE NIE
DAUŻSZYM NIŻ 35 MINUT, A 25%
STUDENTÓW POŚWICAJCYCH NA
DOJAZD NAJWICEJ CZASU POÅšWIECA
NA TEN CEL CO NAJMNIEJ 50 MINUT.
II. MIARY ZMIENNOÅšCI
CHARAKTERYZUJ STOPIEC ZRÓŻNI-
COWANIA JEDNOSTEK ZBIOROWOÅšCI
POD WZGLDEM BADANEJ CECHY.
DZIELIMY JE RÓWNIEŻ NA MIARY
KLASYCZNE (WARIANCJA, ODCHYLE-
NIE STANDARDOWE, ODCHYLENIE
PRZECITNE, KLASYCZNY WSPÓACZYN
NIK ZMIENNOÅšCI) I POZYCYJNE
(ROZSTP, ODCHYLENIE ĆWIARTKOWE,
POZYCYJNY WSPÓACZYNNIK ZMIENNO-
ÅšCI).
31
MIARY KLASYCZNE
S2(x)
A. WARIANCJA -
JEST TO ÅšREDNIA ARYTMETYCZNA
KWADRATÓW ODCHYLEC POSZCZE-
GÓLNYCH WARTOŚCI CECHY OD
ÅšREDNIEJ ARYTMETYCZNEJ ZBIORO-
WOÅšCI.
WARIANCJA DLA DANYCH INDYWI-
DUALNYCH:
_
n
1
S2(x) =ð (xi -ðx)2
åð
i=ð1
n
WARIANCJA DLA DANYCH Z SZEREGU
PUNKTOWEGO:
_
k
1
2
S (x) =ð [(xi -ðx)2ni]
åð
i=ð1
n
OBLICZMY WARIANCJ DLA DANYCH Z
PRZYKAADU O OCENACH Z EGZAMINU
PODANYCH W POSTACI SZEREGU
PUNKTOWEGO:
S2(x)=
1
[(2 -ð 3,25)2 5 +ð (3 -ð 3,25)28 +ð (4 -ð 3,25)2 4 +ð (5 -ð 3,25)2 3]
=
20
32
=0,9875
WARIANCJA DLA DANYCH Z SZEREGU
ROZDZIELCZEGO PRZEDZIAAOWEGO:
_

k
1
2
S (x) =ð [(x -ðx)2ni]
åð
i
i=ð1
n
OBLICZMY WARIANCJ DLA PRZYKAA-
DU DOTYCZCEGO CZASU DPOJAZDU
DO SZKOAY:
oð oð oð oð
x1i _ _ _
x0i ni
k -
x x x x
) ( -x
)2 )2 ni
( -x
i i i ( -x
i
1 0-10 5 5 -32,80 1075,84 5379,20
2 10-20 10 15 -22,80 519,84 5198,40
3 20-30 25 25 -12,80 163,84 4096,00
4 30-40 20 35 -2,80 7,84 156,80
5 40-50 15 45 7,20 51,84 777,60
6 50-60 12 55 17,20 295,84 3550,08
7 60-70 6 65 27,20 739,84 4439,04
8 70-80 4 75 37,20 1383,84 5535,36
9 80-90 3 85 47,20 2227,84 6683,52
35816,00
åð
100
S2(x)=35816/100=358,16
33
WARIANCJI NIE INTERPRETUJEMY.
INTERPRETUJEMY PIERWIASTEK Z
WARIANCJI ZWANY ODCHYLENIEM
STANDARDOWYM.
B. ODCHYLENIE STANDARDOWE  S(x)
MIERZY PRZECITNE ODCHYLENIE OD
ÅšREDNIEJ ARYTMETYCZNEJ.
S(x) =ð S2(x)
DLA PRZYKAADU Z OCENAMI Z
0,9875 =ð
EGZAMINU: S(x)= 0,99.
OZNACZA TO, ŻE PRZECITNE
ODCHYLENIE OD ÅšREDNIEJ OCEN Z
EGZAMINU WYNOSIAO 0,99, CZYLI
PRAWIE JEDN CAA OCEN.
DLA PRZYKAADU Z DOJAZDEM
STUDENTÓW NA UCZELNI:
358,16 =ð
S(x)= 18,93 MINUTY.
PRZECITNE ODCHYLENIE OD
ÅšREDNIEGO CZASU DOJAZDU NA
UCZELNI WYNOSI 18,93 MINUTY.
34
B. TYPOWY OBSZAR ZMIENNOÅšCI
W OBSZARZE TYM MIEÅšCI SI OKOAO
2/3 WSZYSTKICH BADANYCH
JEDNOSTEK ZBIOROWOÅšCI.
_ _
x-ð S(x) <ð xtyp <ð x+ð S(x)
C. KLASYCZNY WSPÓACZYNNIK
ZMIENNOÅšCI
S(x)*100%
VS =ð
_
x
WSPÓACZYNNIK ZMIENNOŚCI JEST
MIAR NIEMIANOWAN NAJCZÅšCIEJ
PODAWAN W PROCENTACH.
STOSUJEMY GO, GDY CHCEMY
PORÓWNAĆ ZE SOBA KILKA
ZBIOROWOÅšCI POD WZGLDEM TEJ
SAMEJ CECHY LUB JEDN
ZBIOROWOŚĆ ZE WZGLDU NA RÓŻNE
CECHY.
VS Îð<ð 0;0,33 >ð
- MAAE ZRÓŻNICOWANIE
VS Îð<ð 0,33;0,66 >ð
- ÅšREDNIE
ZRÓŻNICOWANIE
35
VS Îð<ð 0,66;1,00 >ð
- DUŻE ZRÓŻNICOWANIE
MIARY POZYCYJNE
D. ROZSTP  R
R =ð xmax -ð xmin
E. ODCHYLENIE ĆWIARTKOWE  Q
JEST TO POAOWA RÓŻNICY MIDZY
TRZECIM A PIERWSZYM KWARTYLEM.
(Q3-ðM )+ð(M -ðQ1) Q3-ðQ1
Q =ð =ð
2 2
MIERZY ONO TYLKO ZRÓŻNICOWANIE
ÅšRODKOWEJ CZÅšCI JEDNOSTEK.
F. TYPOWY OBSZAR ZMIENNOÅšCI
M -ðQ <ð xtyp <ð M +ðQ
G. POZYCYJNY WSPÓACZYNNIK
ZMIENNOÅšCI
Q
VQ =ð
M
36
VQ Îð<ð 0;0,33>ð
- MAAE ZRÓŻNICOWANIE
VQ Îð<ð 0,33;0,66 >ð
- ÅšREDNIE
ZRÓŻNICOWANIE
VQÎð<ð 0,66;1,00 >ð
- DUŻE ZRÓŻNICOWANIE
IV. MIARY ASYMETRII
Asymetria jest zwana również skośnością.
ObliczajÄ…c miary asymetrii dostajemy
informację czy istnieje jednakowy rozkład
badanej cechy powyżej i poniżej średniej
(rozkład symetryczny) lub czy skupienie
występuje przy najniższych wartościach
cechy (asymetria dodatnia, prawostronna) czy
też najwyższych (asymetria ujemna,
lewostronna).
_
x
Jeśli: >M(x)>D(x)  asymetria prawostronna
_
x
37
1. Klasyczny współczynnik asymetrii
_

k
1
åð
(x x)3ni
i
n
i=ð1
Akl =ð
S3(x)
Akl<2
-2<
Znak mówi o kierunku asymetrii, a liczba o jej
sile.
Akl<0  asymetria słaba lewostronna
-0,66<
Akl<0,66  asymetria słaba prawostronna
0<
Akl<-0,66  asymetria średnia lewo-
-1,33<
stronna
Akl<1,33  asymetria średnia prawo
0,66<
stronna
Akl<-1,33  asymetria silna lewostronna
-2<
Akl<2  asymetria silna prawostronna
1,33<
2. Współczynnik skośności
_
x-ðD(x)
WS =ð
S(x)
38
-1-0,330-0,66 stronna
0,33 stronna
-10,663. Pozycyjny współczynnik asymetrii
(Q3-ðM )-ð(M -ðQ1) Q3-ðQ1-ð2M
A =ð =ð
Q3-ðQ1 2Q
-1IV. MIARY KONCENTRACJI
Służą do określenia spłaszczenia rozkładu.
Koncentracja to nierówność rozdziału ogólnej
sumy wartości cechy pomiędzy poszczególne
jednostki zbiorowości.
39
Krzywa koncentracji (krzywa Lorenza)
Mamy dane dotyczÄ…ce liczby napraw
komputerów w pewnym przedsiębiorstwie.
Obliczymy koncentrację tego rozkładu.
Ui
=
xi ni
xini
Yisk
Yi Uisk
=
= 100%
k
åð
xini
wi
= 100%
i=ð1
0 10 16,7 0,0 16,7 0,0
1 22 36,7 21,6 53,3 21,6
2 15 25,0 29,4 78,3 51,0
3 5 8,3 14,7 86,7 65,7
4 5 8,3 19,6 95,0 85,3
5 3 5,0 14,7 100,0 100,0
60 100,0 100,0
40
krzywa Lorenza
120,0
100,0
80,0
60,0
40,0
20,0
0,0
0,0 50,0 100,0 150,0
skumulowane odsetki sprzętu
komputerowego
Współczynnik koncentracji Lorenza:
W 5000-ðZ
K =ð =ð
W +ðZ 5000
W+Z=0,5*100*100=5000
W=5000-Z
Z=0,5*16,7*0+0,5*(53,4-
16,7)*21,6+0,5*(21,6+51,0)*(78,4-53,4)+
+0,5(51,0+65,7)*(86,7-78,4)+
41
liczby napraw
skumulowane odsetki Å‚Ä…cznej
+0,5*(85,3+65,7)*(95,0-86,7)+
+0,5(85,3+100,0)*(100,0-95,0)=2881
5000-ð2881
K= =0,4
5000
0Koncentracja średnia, ponieważ nasz
współczynnik jest równy 0,4.
K=0  brak koncentracji, czyli równomierny
podział ogólnej wartości cechy między jej
jednostki.
K=1  koncentracja zupełna, czyli jednej
jednostce przypada ogólna suma wartości
cechy.
Kroki, które wykonujemy analizując strukturę
zbiorowości:
1. Sprawdzenie czy przedziały są równe.
Jeśli nie są równe przeliczenie liczebności.
2. Decyzja, czy rozkład jest typowy czy
nietypowy.
3. Obliczenie miar poziomu przeciętnego
wszystkich, jeśli rozkład typowy i
pozycyjnych, jeśli nietypowy.
4. Obliczenie miar zróżnicowania.
42
5. Obliczenie miar asymetrii.
6. Obliczenie miar koncentracji.
Wszystkie otrzymane wyniki zawsze
interpretujemy.
WYKAAD III
BADANIE WSPÓAZALEŻNOŚCI
DWÓCH ZJAWISK
Oprócz badania struktury interesującego nas
zjawiska możemy wykrywać i mierzyć
powiązania między różnymi zjawiskami.
Wyróżnione zjawisko, które badamy
nazywamy zmienną zależną, a przyczyny,
które nań działają zmiennymi niezależnymi.
Związek statystyczny występuje wtedy, gdy
danej odmianie cechy niezależnej
odpowiadają różne odmiany cechy zależnej.
Statystyczna analiza współzależności polega
na wykryciu związku, ustaleniu jego siły i
kierunków powiązań oraz przez analizę
regresji, zbadaniu kształtu zależności.
43
Tablica korelacyjna opisuje w sposób
wyjściowy związek dwóch zjawisk.
Wysokość % wydatków na rekreację Ogó-
miesięcznych i oświatę łem
dochodów 0-2 2-4 4-6 6-8 8-10
w zł.
300-500 2 - 1 - - 3
500-700 1 15 5 3 - 24
700-900 - 5 29 10 - 44
900-1100 - - 5 25 2 32
1100-1300 - - - 3 4 7
Ogółem 3 40 41 6 110
Szereg warunkowy to szereg przedstawiajÄ…cy
rozkład cechy Y (cechy X) pod warunkiem,
że cecha X (Y) przyjęła jakąś konkretną
wartość lub należy do jakiegoś konkretnego
przedziału.
Szereg brzegowy to szereg przedstawiajÄ…cy
rozkład cechy Y (X)bez względu na to, jakie
wartości przyjęła cecha X (Y).
44
Oznaczenia:
nij - liczebności szeregów warunkowych
Liczba jednostek, dla których cecha X
przyjęła wartości z przedziału i, a cecha Y
przyjęła wartości z przedziału j.
ni·ð -liczebnoÅ›ci szeregu brzegowego cechy X
n·ð j - liczebnoÅ›ci szeregu brzegowego cechy Y
_
yi
- średnia warunkowa zmiennej Y (średnia
wartość cechy Y pod warunkiem, że cecha X
przyjęła wartości z przedziału i)
_
x
j - średnia warunkowa zmiennej X (średnia
wartość cechy X pod warunkiem, że cecha Y
przyjęła wartości z przedziału i)
S2(x)
- wariancja warunkowa zmiennej X
j
Si2(y)
- wariancja warunkowa zmiennej Y
i=1,2,& ,k  liczba wierszy (liczba
przedziałów zmiennej X)
j=1,2,& ,m  liczba kolumn (liczba
przedziałów zmiennej Y)
45
Cechy X i Y są zależne korelacyjnie, jeżeli
średnie warunkowe zmiennej X są różne dla
wszystkich grup zmiennej Y, a średnie
warunkowe zmiennej Y są różne dla
wszystkich grup zmiennej X.
Wzory:

m
åð
y nij
_
j
j=ð1
yi =ð
ni·ð

k
åð
x nij
_
i
i=ð1
x =ð
j
n·ð j
_

m
åð
(y -ð yi)2nij
j
j=ð1
Si2(y) =ð
ni·ð
_

k
åð
(x -ðx )2nij
i j
i=ð1
S2(x) =ð
j
n·ð j
46
_
m
1
y =ð y n·ð j
åð
j
j=ð1
n
_
k
1
x =ð xini·ð
åð
i=ð1
n
Równość wariancyjna:
Ogólna wariancja zmiennej Y (X)  uznanej
za zależną  jest równa sumie wariancji
średnich warunkowych zmiennej Y (X)
(wariancja ta mierzy zróżnicowanie wartości
Y (X) wyjaśnione, spowodowane
zmiennością cechy X (Y)  uznanej za
niezależna) i średniej arytmetycznej z
wariancji warunkowych zmiennej Y (X)
(wariancja ta mierzy tę część zmienności Y
(X_, które nie została wyjaśniona
zmiennością X (Y)).
_
S2(y) =ð S2(yi)+ð Si2(y)
_
S2(x) =ð S2(x ) +ð S2(x)
j
j
Åšrednia z wariancji warunkowych nazywana
jest wariancjÄ… wewnÄ…trzgrupowÄ…, a wariancja
47
ze średnich warunkowych wariancją
miedzygrupowÄ….
_ _
k
åð
(yi -ð y)2ni·ð
2 i=ð1
S (yi) =ð
n
k
åð
Si2(y)ni·ð
i=ð1
Si2(y) =ð
n
_ _
m
åð
(x -ðx)2n·ð j
j
j =ð1
2
S (x ) =ð
j
n
m
2
åð
S (x)n·ð j
j
2 j =ð1
S (x) =ð
j
n
Pomiar kierunku i siły związku korelacyjnego
a. Stosunek korelacyjny
_
2
S (yi)
Si2(y)
eyx =ð =ð 1-ð
2 2
S (y) S (y)
48
eyx - mierzy siłę związku korelacyjnego.
Mówi nam, z jaką mocą cecha X (zmienna
niezależna) działa na zmienną Y(zmienna
zależna).
eyx <1
0<
eyx =0  brak zwiÄ…zku korelacyjnego
między zmiennymi X i Y
eyx =1  związek funkcyjny między
zmiennymi X i Y
_
2
Si2(x)
S (x )
j
exy =ð =ð 1-ð
2 2
S (x) S (x)
exy - mierzy siłę związku korelacyjnego.
Mówi nam, z jaką mocą cecha Y (zmienna
niezależna) działa na zmienną X(zmienna
zależna).
exy Ä…ð eyx
49
b. Współczynnik korelacji liniowej
Persona
Jeśli stwierdzimy, że nasz związek między
cechami X i Y jest liniowy lub bliski
liniowemu to używamy tej miary do oceny siły
związku korelacyjnego. Współczynnik ten
mierzy nie tylko siłę ale i kierunek związku.
Oznaczamy go literÄ… r.
_ _
k m
1
åð åð
xi y nij -ðx y
j
covxy
i=ð1 j=ð1
n
rxy =ð ryx =ð =ð
S(x)S(y) S(x)S(y)
-1Współczynnik korelacji liniowej Persona
przyjmuje wartości ujemne, gdy zależność
między zmiennymi jest ujemna, a wartości
dodatnie, gdy zależność ta jest dodatnia.
r=0  brak liniowego zwiÄ…zku korelacyjnego
między zmiennymi.
c. miara krzywoliniowości związku
korelacyjnego.
2
my =ð e2 -ðryx
yx
50
lub
2 2
mx =ð exy -ðrxy
Oba mierniki mieszczÄ… siÄ™ w przedziale <0,1>.
Są równe 0, jeśli między zmiennymi jest
związek liniowy lub nie w ogóle związku
korelacyjnego. Im bliższe jedności tym związek
bardziej krzywoliniowy i stosowanie r do oceny
jego siły staje się błędne.
51
LINIOWA FUNKCJA REGRESJI
Często głównym celem badania jest
przewidywanie, na podstawie obserwacji
danych, poziomu wartości cechy przy nowej
nie istniejącej do tej pory wartości zmiennej
niezależnej. W tym celu znajdujemy taką
postać krzywej opisanej matematycznym
wzorem, aby dobrze pasowała do danych
empirycznych. Dopasowanie takiej krzywej
nigdy nie jest idealne, gdyż na cechę badaną
wpływają nie tylko przyczyny główne, ale
również szereg przyczyn pobocznych i
czynników losowych.
Ogólny model regresji cechy Y względem
cechy X dla próby ma postać:
yi =ð f (xi)+ð zi ( 1
gdzie:
i  liczba jednostek poddanych obserwacji ze
względu na Y i X
52
yi - wartości zmiennej Y wyjaśnione przez
funkcję regresji cechy X oraz składnik losowy
zi
f (xi) - funkcja regresji cechy Y względem
cechy X
zi
Składnik losowy zawiera w sobie:
- efekty łącznego oddziaływania na zmienną Y
wszystkich innych czynników poza czynnikami
przyjętymi jako zmienna X,
- efekty działania czynnika czysto losowego,
- błędy wynikające z przyjęcia niewłaściwej
funkcji regresji,
- błędy pomiarów wartości cechy Y i X.
Najtrudniejszym problemem jest wyznaczenie
odpowiedniej postaci funkcji f. Pomocnym jest
wykres empirycznych krzywych regresji i
miara krzywoliniowości związku
korelacyjnego. Najpowszechniej stosowane jest
równanie liniowe i tylko takim będziemy się
zajmować.
FunkcjÄ™ regresji liniowej zmiennej Y
względem zmiennej X zapisujemy:
53
^
y =ð ayx +ðby
( 2
FunkcjÄ™ regresji liniowej zmiennej X
względem zmiennej Y zapisujemy:
^
x =ð axy +ðbx
( 3
Wstawiając równanie (2 do równania (1
otrzymujemy:
yi =ð ayxi +ðby +ð zi
( 4
by
ay i sÄ… nazywane parametrami regresji z
próby. Pierwszy zwany współczynnikiem
regresji liniowej wyraża wielkość przeciętnego
przyrostu wartości zmiennej Y na jednostkę
przyrostu wartości cechy niezależnej X. Drugi
to estymator wyrazu wolnego, który mówi nam
jaką wartość przyjmuje cecha zależna jeśli
cecha niezależna jest równa zero.
by
ay
Parametry i wyznaczamy na podstawie
próby Metodą Najmniejszych Kwadratów
(MNK). Metoda ta polega na takim
54
oszacowaniu parametrów funkcji (2 by dla
danych z próby spełniony był warunek:
n
zi2 Þð min
åð
( 5
i=ð1
zi
Wiemy, że mówi nam o tym, czego nie
wyjaśnia Wyznaczona na podstawie próby
funkcja, czyli pokazuje nam odchylenia
krzywej empirycznej od krzywej teoretycznej.
Im te odchylenia będą mniejsze tym nasza
funkcja będzie lepiej dopasowana.
Wyznaczając z równania (4 otrzymujemy:
zi =ð yi -ðayx-ðby
( 6
Podstawiając równanie (6 do równania (4:
n
(yi -ðayx-ðby)2 Þð min
åð
( 7
i=ð1
Obliczamy pochodne cząstkowe równania (7
przyrównujemy do zera i otrzymujemy wzory
na parametry równania liniowej regresji
minimalizujące kwadrat sumy odchyleń
wartości empirycznych od teoretycznych:
55
_ _
n
åð
(xi -ðx)(yi -ð y)
cov(x, y)
i=ð1
ay =ð =ð =ð ryx S(y) =ð
_ 2
S(x)
S (x)
åð
(xi x)2
n n n
åð åð åð
n xi yi -ð xi yi
i=ð1 i=ð1 i=ð1

n n
åð åð
n xi2 -ð( xi )2
i=ð1 i=ð1
( 8
_ _
by =ð y-ðay x
( 9
Te same wzory, gdy szacujemy regresjÄ™ X
względem Y mają następującą postać:
_ _
n
åð
(xi -ðx)(yi -ð y)
cov(x, y)
i=ð1
ax =ð =ð =ð rxy S(x) =ð
_ 2
S(y)
S (y)
åð
(yi -ð y)2
n n n
( 10
åð åð åð
n xi yi -ð xi yi
i=ð1 i=ð1 i=ð1

n n
åð åð
n yi2 -ð( yi )2
i=ð1 i=ð1
56
_ _
bx =ð x-ð ax y
( 11
Do oceny dopasowania prostej regresji do
punktów empirycznych wykorzystujemy tzw.
reszty, które stanowią różnicę między
wartościami empirycznymi a teoretycznymi
funkcji regresji.
Dla regresji Y względem X reszty
przedstawione sÄ… wzorem:
^
zi =ð yi -ð yi
( 12
Dla regresji X względem Y reszty mają postać:
^
ui =ð xi -ð x
i
( 13
Wariancja składnika resztowego ma postać:
^
n
åð
(yi -ð yi)2
i=ð1
S2(zi) =ð
( 14
n-ðk
^
n
åð
(xi -ð x )2
i
i=ð1
S2(ui) =ð
( 15
n-ðk
gdzie k jest liczbą szacowanych parametrów
równania regresji (dla regresji liniowej k=2).
57
Odchylenie standardowe reszt jest zwane
średnim błędem szacunku i określa o ile
średnio wartości empiryczne odchylają się od
wartości teoretycznych. Im większa jest jego
wartość tym gorsze oszacowanie funkcji
regresji.
Najczęściej stosowaną miarą oceny
dopasowania funkcji regresji jest współczynnik
jð2:
zbieżności
^
n
åð
(yi -ð yi )2
i=ð1
jðyx2 =ð
( 16
_
n
åð
(yi -ð y)2
i=ð1
^
n
åð
(xi -ð x )2
i
i=ð1
jðxy2 =ð
( 17
_
n
åð
(xi -ð x)2
i=ð1
Współczynniki te przyjmują wartości z
przedziału <0,1>. Im mniejsza jest wartość tego
współczynnika tym lepiej dopasowana funkcja
regresji. Można wyrazić go w procentach i
powiedzieć, że taki procent zmienności nie
58
został wyjaśniony przez nasz model regresji
liniowej.
Współczynnik determinacji liniowej mówi nam
ile procent zmienności zostało wyjaśnione
przez nasz model i ma postać:
2 2
R2 =ð1-ðjð2 =ð rxy =ð ryx =ð
_
^ ^
n n
åð åð
(yi -ð yi)2 (yi -ð y)2
i=ð1 i=ð1
=ð1-ð =ð
( 18
_ _
n n
åð åð
(yi -ð y)2 (yi -ð y)2
i=ð1 i=ð1
Miarami wielkości przeciętnego błędu
ay
oszacowania parametrów regresji liniowej i
by
sÄ… odchylenia standardowe tych
parametrów:
S(zi) S(zi)
S(ay) =ð =ð
( 19
_ 2
_
n
n
åð
(xi -ðx)2
åð
xi2-ðn x
i=ð1
i=ð1
n
åð
S2(zi) xi2
i=ð1
S(by) =ð
2 ( 20
_
n
åð
n( xi2-ðn x )
i=ð1
59
Odpowiednio, jeśli szacujemy regresję
zmiennej X od Y wzory te mają postać:
S(ui ) S(ui )
S(ax) =ð =ð
( 21
_ 2
_
n
n
åð
(yi -ð y)2
åð
yi2 -ðn y
i=ð1
i=ð1
n
2
åð
S (ui ) yi2
i=ð1
S(bx) =ð
( 22
2
_
n
åð
n( yi2 -ðn y )
i=ð1
Po wykonaniu wszystkich powyższych
obliczeń możemy zapisać równanie regresji
liniowej:
yi =ð ayxi +ðby +ð zi
( 23
S(ay ) S(by ) S(zi )
dla zmiennej Y zależnej od zmiennej X oraz
równanie:
xi =ð axyi +ðbx +ðui
( 24
S(ax) S(bx) S(ui)
dla zmiennej X zależnej od zmiennej Y.
Celem takiej analizy jest zazwyczaj predykcja.
Chcemy przewidzieć jak zachowa się zmienna
zależna Y (X) jeśli zmienna niezależna X (Y)
60
xp ( yp ).
przyjmie z góry ustaloną wartość
Błąd takiej prognozy ma postać:
_
(xp -ðx)2
1
S(Y / xp) =ð S(z) 1+ð +ð
_ ( 25
n
n
åð
(xi -ðx)2
i=ð1
lub
_
(y -ð y)2
1
p
S(X / yp) =ð S(u) 1+ð +ð
( 26
_
n
n
åð
(yi -ð y)2
i=ð1
61
Wykład VI
Analiza dynamiki zjawisk
Szeregiem czasowym nazywamy ciąg wyników
obserwacji uporzÄ…dkowanych w czasie, tzn.
y
{t, }. Przez te oznaczamy numery kolejnych
t
y
jednostek w czasie, a przez wielkość
t
badanej cechy w momencie t.
Analiza szeregów czasowych daje odpowiedz
na pytanie, jaka jest dynamika zjawiska i jakie
czynniki wywołują zmienność tego zjawiska.
Metody analizy dynamiki zjawisk dzielimy na
dwa rodzaje:
1. metody indeksowe  służą do liczbowego
określania tempa i intensywności zmian
zjawiska w czasie,
2. metody wyodrębniania trendu (ogólnej
tendencji rozwojowej), wahań okresowych
(zmiany powtarzajÄ…ce siÄ™ w tych samych
prawie rozmiarach co pewien stały okres) i
wahań przypadkowych (występują z różną
siłą i w różnych kierunkach).
62
1. Metody indeksowe.
a. Przyrosty absolutne i względne
Przyrosty absolutne informujÄ… o ile siÄ™
zmienił poziom jakiegoś zjawiska w okresie
badanym w stosunku do jego poziomu w
okresie bazowym. Jeśli dla wszystkich
wartości badanej cechy za rok bazowy
przyjmiemy ten sam moment w czasie to taki
przyrost nazywamy przyrostem absolutnym
jednopodstawowym i zapisujemy:
Dðt / k =ð yt -ð yk
gdzie t=1,2,& ,n;
k  moment bazowy
Jeśli wartości cechy odnosimy do jej wartości
z okresu poprzedniego ta taki przyrost
nazywamy absolutnym łańcuchowym i
zapisujemy:
Dðt / t-ð1 =ð yt -ð yt-ð1
gdzie t=1,2,& ,n.
Przyrostem względnym nazywamy stosunek
przyrostu absolutnego do poziomu zjawiska z
okresu bazowego.
Przyrost względny jednopodstawowy:
Dðt / k =ð yt -ð yk
dt / k =ð
yk yk
63
Przyrost względny łańcuchowy:
Dðt / t-ð1 =ð yt -ð yt-ð1
dt / t-ð1 =ð
yt-ð1 yt-ð1
Jeśli przyrosty względne pomnożymy przez
100% to otrzymamy tzw. tempo zmian, które
mówi nam o ile procent poziom zjawiska jest
większy bądz mniejszy w danym okresie od
tego, jaki był w roku bazowym.
b. Indywidualne indeksy dynamiki.
Indeksy dynamiki określają stosunek wielkości
zjawiska w dwóch różnych okresach.
Indeksy indywidualne jednopodstawowe:
yt =ð yk +ð yt -ðyk =ð1+ð dt
it / k =ð
/ k
yk yk
Indeksy indywidualne łańcuchowe:
yt =ð yt-ð1 +ð yt -ð yt-ð1 =ð1+ð dt
it / t-ð1 =ð
/ t-ð1
yt-ð1 yt-ð1
Åšrednie tempo zmian zjawiska w czasie
wyznacza się za pomocą średniej
geometrycznej indeksów łańcuchowych:
_
n-ð1 n-ð1
i =ð in / n-ð1in-ð1/ n-ð2...i2 / 1 =ð in / 1
G
Åšredniookresowe tempo zmian obliczamy:
64
_ _
T =ð i -ð1
n G
W naukach ekonomicznych i pokrewnych duże
znaczenie mają indeksy ilości, cen i wartości
różnych produktów. Wyznaczamy je ze
wzorów:
qn pn wn
iq =ð
, i =ð p0 , i =ð w0
p w
q0
wn , sÄ… odpowiednio
qn pn p0 w0
gdzie ,q0, , ,
ilościami, cenami i wartościami w roku
badanym i bazowym.
Ponieważ w0 =ð p0q0, wn =ð pnqn to iw =ð ipiq .
c. Agregatowe indeksy wielkości
absolutnych.
Agregatowe indeksy cen obrazujÄ… dynamikÄ™
zmian wartości zespołu badanych jednostek
na skutek zmian cen.
·ð Agregatowy indeks cen Laspeyresa
k k
åð åð
pnjq0 j ipjw0 j
j=ð1 j=ð1
I =ð =ð
L p
k k
åð åð
p0 jq0 j w0 j
j=ð1 j=ð1
Wartość tego indeksu mówi nam o ile
zmieniła się wartość jakiegoś zjawiska na
65
skutek zmiany cen przy założeniu stałych
ilości z roku bazowego.
·ð Agregatowy indeks cen Paaschego
k k
åð åð
pnjqnj wnj
j=ð1 j=ð1
Ip =ð =ð
P
k
k
åð
p0 jqnj åð 1 wnj
j=ð1
j=ð1
ipj
Wartość tego indeksu mówi nam o ile
zmieniła się wartość jakiegoś zjawiska na
skutek zmiany cen przy założeniu stałych
ilości z roku badanego.
Agregatowe indeksy ilości obrazują
zmiany wartości ustalonego zespołu
jednostek na skutek zmian ilości.
·ð Agregatowy indeks iloÅ›ci Laspeyresa
k k
åð åð
p0 jqnj iqj w0 j
j=ð1 j=ð1
Iq =ð =ð
L
k k
åð åð
p0 jq0 j w0 j
j=ð1 j=ð1
Wartość tego indeksu mówi nam o ile
zmieniła się wartość jakiegoś zjawiska na
skutek zmiany ilości przy założeniu
stałych cen z roku bazowego.
·ð Agregatowy indeks iloÅ›ci Paaschego
66
k k
åð åð
pnjqnj wnj
j=ð1 j=ð1
Iq =ð =ð
P
k
k
åð
pnjq0 j åð 1 wnj
j=ð1
j=ð1
iqj
Wartość tego indeksu mówi nam o ile
zmieniła się wartość jakiegoś zjawiska na
skutek zmiany cen przy założeniu stałych
ilości z roku badanego.
·ð Agregatowy indeks wartoÅ›ci
k
åð
pnjqnj
j=ð1
Iw =ð =ðPI Iq=ðPIq L I
p L p
k
åð
p0 jq0 j
j=ð1
Wartość tego indeksu mówi nam jak
zmienił się koszt w tych dwóch okresach
ze względu na zmiany w strukturze cen i
ilości łącznie.
2. Metody wyodrębniania trendu, wahań
okresowych i wahań przypadkowych.
Mamy następujące dane dotyczące liczby dni
nieprzepracowanych w kwartale z powodu
choroby wśród pracujących na własny
rachunek.
67
Lata 1991 1992
Kwartały I II III IV I II III IV
Dni w tys. 19 17 16 21 20 18 16 23
yt
1993 1994 1995
I II III IV I II III IV I II III IV
21 19 17 25 22 19 19 26 24 21 20 27
DNI W TYS.
30
25
20
15
10
5
0
I II III IV I II III IV I II III IV I II III IV I II III IV
1991 1992 1993 1994 1995
Z wykresu widać, że podany szereg czasowy
charakteryzuje siÄ™:
·ð Wyraznie wzrostowÄ… tendencjÄ…
rozwojowa (w każdym kolejnym roku
68
wyższa liczba dni niż w roku
poprzednim)
·ð Regularnymi wahaniami okresowymi o
rocznym cyklu wahań ( w każdym IV
kwartale liczba dni nieprzepracowanych z
powodu choroby jest najwyższa a w
każdym III kwartale najniższa)
·ð Wahaniami przypadkowymi
powodujÄ…cymi w niewielkim stopniu
odchylenia od zmian regularnych.
a. Szacowanie czystej postaci tendencji
rozwojowej.
·ð Metoda mechaniczna (Å›rednie ruchome)
Stosując średnie ruchome, doprowadzamy do
wygładzenia szeregu empirycznego przez
częściowe wyeliminowanie wahań
przypadkowych i okresowych. Oznaczmy przez
y1, y2,...,yn wielkości badanego zjawiska w
kolejnych momentach czasu. Na przykład
średnie ruchome 3-okresowe będą miały
postać:
69
_
y1 +ð y2 +ð y3 _
y2 +ð y3 +ð y4 _ y3 +ð y4 +ð y5
y =ð y3 =ð y4 =ð
, ,
2
3 3
3
Jeśli mamy dane miesięczne to stosujemy 12-
okresową średnią ruchomą, a jeśli kwartalne
to 4-okresowa średnią ruchomą.
ÅšredniÄ… ruchomÄ… 4-okresowÄ… wyznaczamy w
następujący sposób (średnie ruchome
scentrowane):
1 1 1 1
y1 +ð y2 +ð y3 +ð y4 +ð y5 _ y2 +ð y3 +ð y4 +ð y5 +ð y6
_
2 2 2 2
y3 =ð y4 =ð
,
3 3
Policzymy średnie ruchome 4-okresowe dla
naszego przykładu:
Lata 1991 1992
Kwartały I II III IV I II III IV
Åšrednie 18,4 18,6 18,8 19,0 19,4 19,6
ruchome
scentro-
wane
1993 1994 1995
I II III IV I II III IV I II III IV
19, 20, 20, 20, 21, 21, 21, 22, 22, 22,
9 5 6 8 0 4 8 1 6 9
Poniższy rysunek przedstawia szereg czasowy
wygładzony średnimi ruchomymi.
70
30
25
20
15
10
5
0
I II III IV I II III IV I II III IV I II III IV I II III IV
1991 1992 1993 1994 1995
·ð Metoda analityczna
Pozwala na przedstawienie trendu w postaci
matematycznej i umożliwia szacowanie
poziomu zjawiska w przyszłości.
yt =ð f (t)+ð zt
yt to zaobserwowany poziom badanego
zjawiska w danym momencie czasu, f(t) to
zt to składnik
funkcja opisujÄ…ca trend, a
resztowy.
Analityczna metoda wyrównywania szeregów
czasowych polega na takim dopasowaniu
71
funkcji matematycznej f(t) do danych
empirycznych, aby jak najlepiej obrazowała
ona ogólną tendencję rozwojową, eliminując
inne wahania.
Przyjmiemy, że nasza postać funkcji trendu to
funkcja liniowa.
yt =ð at +ðb+ð zt
Parametry a i b szacujemy MetodÄ…
Najmniejszych Kwadratów i otrzymujemy
następujące wzory:
n n n
åð åð åð
n ytt-ð t yt
t=ð1 t=ð1 t=ð1
a =ð
n n
åð åð
n t2 -ð( t)2
t=ð1 t=ð1
n n
åð åð
yt -ða t
t=ð0 t=ð0
b =ð
n
Odchylenie standardowe składnika resztowego
obliczamy korzystajÄ…c ze wzoru:
n
åð
zt2
t =ð1
S(zt) =ð
n-ðk
72
Błędy szacunku parametrów wynoszą:
S(zt)
S(a) =ð
_2
n
åð
t2-ðn t
t =ð1
n
2
åð
t
t=ð1
S(b) =ð S(zt)
2
_
n
2
åð
n( t -ðn t )
t=ð1
73


Wyszukiwarka

Podobne podstrony:
Statystyka wyklad 7
Statystyka wyklad 4
Statystyka wyklad4nowy
sdz statystyka wyklad 4
Statystyka wyklad5
Statystyka wyklad 8
Statystyka wyklad 3
Statystyka wyklad 9
Statystyka1st Wyklad2
Statystyka wyklad 6
Statystyka Wykłady
Statystyka1st Wyklad6 Regresja
20151012 MichalTrzesiok Statystyka wyklad2 miary statystyczne handout
sdz statystyka wyklad 3
Statystyka wyklady
Statystyka wykłady
Statystyka1st Wyklad1

więcej podobnych podstron