Wartość sprzedaży środków czystości (Y) w latach 1990 – 2000, a zależność z 10 potencjalnymi zmiennymi objaśnianymi X1, X2, X3, X4, X5, X6, X7, X8, X9, X10.
X1 – zatrudnienie w tys. osób
X2 - dostawy towarów biurowych w tys. Złotych
X3 – średnie ceny sprzedawanych towarów
X4 – powierzchnia sprzedaży w sklepach w tys. m2
X6 – wartość maszyn i urządzeń w mln. złotych
X7 – nakłądy inwestycyjne w mln. złotych
X8 – wartość zakupionych surowców w mln. złotych
X9 – nakłady na reklamę
X10 – średni dochód na osobę w tys. złotych
t |
Y |
X1 |
X2 |
X3 |
X4 |
1 |
100 |
6 |
20 |
25 |
4 |
2 |
109 |
6 |
20 |
25 |
4 |
3 |
148 |
8 |
21 |
26 |
4 |
4 |
159 |
9 |
21 |
26 |
4 |
5 |
117 |
7 |
21 |
24 |
5 |
6 |
143 |
8 |
21 |
24 |
4 |
7 |
186 |
10 |
23 |
21 |
4 |
8 |
190 |
11 |
23 |
20 |
5 |
9 |
189 |
11 |
24 |
20 |
5 |
10 |
210 |
13 |
25 |
18 |
6 |
Średnie wart. |
155,1 |
8,9 |
21,9 |
22,9 |
4,5 |
SUMA |
1551 |
89 |
|
|
|
X5 |
X6 |
X7 |
X8 |
X9 |
X10 |
14 |
8 |
12 |
30 |
5 |
2 |
14 |
8 |
12 |
30 |
4 |
1,5 |
18 |
12 |
12 |
37 |
4 |
1,7 |
18 |
12 |
14 |
40 |
5 |
1,7 |
18 |
8 |
10 |
40 |
6 |
1,7 |
18 |
8 |
12 |
40 |
5 |
1,6 |
24 |
14 |
14 |
52 |
5 |
1,5 |
24 |
16 |
12 |
52 |
6 |
1,8 |
26 |
16 |
12 |
60 |
5 |
2 |
26 |
18 |
10 |
68 |
7 |
1,8 |
20 |
12 |
12 |
44,9 |
5,2 |
1,73 |
_ _ _ _ _
X1 =8,9 X2=21,9 X3=22,9 X4=4,5 X5=20
_ _ _ _ _
X6=12 X7=12 X8=44,9 X9=5,2 X10=1,73
Obliczamy współczynnik korelacji zależności zmiennej objaśnianej Y i potencjalnych zmiennych objaśniających X1,...X10:
r1=0,9819 r4=0,5773 r7=0,0785 r10=0,113
r2=0,9312 r5=0,9499 r8=0,9273
r3=0,8107 r6=0,9508 r9=0,5053
Zapisujemy wektor współczynników korelacji:
r0=[0,9819; 0,9312; 0,8107; 0,5773; 0,9499; 0,9508; 0,0785; 0,9273; 0,5053; 0,113]
Obliczamy współczynniki korelacji między potencjalnymi zmiennymi objaśniającymi X1,...,X10
|
1 |
0,9622 |
-0,8609 |
0,7078 |
0,9495 |
0,9565 |
-0,0715 |
0,9641 |
0,6328 |
0,2239 |
|
0,9622 |
1 |
-0,9378 |
0,7728 |
0,974 |
0,9258 |
-0,1955 |
0,995 |
0,6434 |
0,2727 |
|
-0,8609 |
-0,9378 |
1 |
-0,7898 |
-0,9006 |
-0,8124 |
0,2889 |
-0,926 |
-0,7041 |
-0,2549 |
R |
0,7078 |
0,7728 |
-0,7898 |
1 |
0,6803 |
0,6467 |
-0,7067 |
0,7886 |
0,8547 |
0,4 |
|
0,9495 |
0,974 |
-0,9006 |
0,6803 |
1 |
0,9158 |
-0,0722 |
0,9696 |
0,5759 |
0,2177 |
|
0,9565 |
0,9258 |
-0,8124 |
0,6467 |
0,9158 |
1 |
0 |
0,9035 |
0,4977 |
0,2913 |
|
-0,0715 |
-0,1955 |
0,2889 |
-0,7067 |
-0,0722 |
0 |
1 |
-0,211 |
-0,544 |
-0,283 |
|
0,9641 |
0,995 |
-0,9257 |
0,7886 |
0,9696 |
0,9035 |
-0,2107 |
1 |
0,6804 |
0,255 |
|
0,6328 |
0,6434 |
-0,7041 |
0,8547 |
0,5759 |
0,4977 |
-0,544 |
0,6804 |
1 |
0,3014 |
|
0,2239 |
0,2727 |
-0,2549 |
0,4 |
0,2177 |
0,2913 |
-0,283 |
0,255 |
0,3014 |
1 |
Wyznaczamy krytyczną wartość współczynnika zmienności:
Ö*=0,15
Obliczamy odchylenia standardowe poszczególnych zmiennych objaśniających:
S1= 2,211 S2=1,640 S3=2,7368 S4=0,6708 S5=4,3818
S6=3,6878 S7=1,2649 S8= 12,0037 S9=0,8718 S10=0,1676
Następnie obliczamy współczynniki zmienności poszczególnych zmiennych objaśniających:
Ö1=0,2484 Ö2=0,0749 Ö3=0,1195 Ö4=0,1491 Ö5=0,2191
Ö6=0,3073 Ö7=0,1054 Ö8=0,2673 Ö9=0,1677 Ö10=0,0969
Odrzucamy wszystkie zmienne, których współczynnik zmienności jest mniejszy od krytycznego współczynnika zmienności, więc X2, X3, X4, X7, X10 odrzucamy, ponieważ można je uznać za quasi stałe, czyli nie wnoszą istotnych informacji do modelu.
Metoda wskaźników pojemności informacyjnej
Za pomocą tej metody wyszukuje się kombinacji zmiennych objaśniających, której wartość wskaźnika integralnej pojemności informacyjnej jest maksymalna.
Pierwszym krokiem jest wypisanie wszystkich kombinacji zmiennych, których jest 2m-1, a w naszym przypadku m=5, czyli mamy 31 kombinacji.
C1=X1 C2=X2 C3=X3 C4=X4 C5=X5
C6=(X1:X2) C7=(X1:X3) C8=(X1:X4) C9=(X1:X5) C10=(X2:X3)
C11=(X2:X4) C12=(X2:X5) C13=(X3:X4) C14=(X3:X5) C15=(X4:X5)
C16=(X1:X2:X3) C17=(X1:X2:X4) C18=(X1:X2:X5)
C19=(X1:X3:X4) C20=(X1:X3:X5) C21=(X1:X4:X5)
C22=(X2:X3:X4) C23=(X2:X3:X5) C24=(X2:X4:X5)
C25=(X3:X4:X5) C26=(X1:X2:X3:X4) C27=(X1:X2:X3:X5)
C28=(X1:X2:X4:X5) C29=(X1:X3:X4:X5) C30=(X2:X3:X4:X5)
C31=(X1:X2:X3:X4:X5)
Następnym krokiem jest wyliczenie poszczególnych wskaźników integralnej pojemności informacyjnej dla danych kombinacji:
H1=0,9641 H2=0,9023 H3=0,9040 H4=0,8603 H5=0,2553
H6=0,9573 H7=0,9549 H8=0,9289 H9=0,7469 H10=0,9429
H11=0,8949 H12=0,7346 H13=0,9268 H14=0,7741 H15=0,6639
H16=0,9614 H17=0,9332 H18=0,8462 H19=0,9462 H20=0,8604
H21=0,807 H22=0,9327 H23=0,8598 H24=0,7922 H25=0,8266
H26=0,9521 H27=0,8971 H28=0,8564 H29=0,8738 H30=0,868
H31=0,896
Największym wskaźnikiem integralnej pojemności informacyjnej jest wskaźnik H1, więc najlepszą kombinacją jest C1=X1. Model ekonometryczny będzie wyglądał następująco:
Ý=a0+a1*X1
SZACOWANIE PARAMETRÓW
Klasyczna metoda najmniejszych kwadratów polega na takim wyznaczeniu parametrów modelu, ażeby suma kwadratów między zaobserwowanymi wartościami zmiennej objaśnianej a odpowiednimi wartościami modelowymi była najmniejsza.
Ý=a+b*X1
b=16,1
a=11,81
Model będzie ostatecznie wyglądał następująco:
Ý =16,1*X1+11,81
Obliczenia do tej metody znajdują się w załączniku.
Weryfikacja modelu ma na celu stwierdzenie czy model dobrze opisuje zjawisko. Weryfikację przeprowadza się na dwóch płaszczyznach:
merytorycznej
statystycznej
a)
Ý=16,1*X1+11,81
Dany model pod względem merytorycznym nie ma żadnych uchybień.
b)weryfikacja statystyczna
Dopasowanie modelu wyraża współczynnik determinacji, wskazuje on jaka część ogólnej zaobserwowanej zmienności zmiennej objaśnianej została wyjaśniona przez model ekonometryczny. Przyjmuje on wartości z przedziału <0;1>
Miarą ogólnej zaobserwowanej zmienności zmiennej objaśnianej jest suma kwadratów odchyleń wartości tej zmiennej od jej średniej.
OSK=13160,9
Miarą obserwowanej zmienności zmiennej objaśnianej nie wyjaśnionej przez model jest suma kwadratów odchyleń zmiennej objaśnianej od wartości modelowej.
SKR=491,649
Współczynnik rozbieżności- mierzy tę część zaobserwowanej zmienności, która nie została przez model wyjaśniona. Jest odwrotnością współczynnika determinacji.
WR=SKR/OSK R2=1-WR
WR=0,037 R2=0,963
Współczynnik determinacji jest bliski jeden, więc można uznać, że model pasuje do wyników obserwacji bardzo dobrze.
badanie istotności parametrów
tk=bk/dk
b1=16,1
SKR=491,649
T=10 a=0,1 n-m-1=8
Q=10-2=8
Wyliczamy odchylenie standardowe:
S=7,84
Obliczamy szacunkowy błąd średniej dla X1:
d1=7,84*29=227,4
Empiryczna statystyka studenta wynosi:
t1=16,1/1,72=9,36
Krytyczna wartość statystyki studenta wynosi:
t*=1,86
t1>t* więc należy przyjąć, że zmienna objaśniana jest istotna dla danego modelu ekonometrycznego.
BADANIE WŁASNOŚCI ODCHYLEŃ LOSOWYCH
E |
-8,41 |
0,59 |
7,39 |
2,29 |
-7,51 |
2,39 |
13,19 |
1,09 |
0,09 |
-11,11 |
Hipoteza:
Ho: m/n=1/2
H1: m/n¹1/2
Sprawdzamy ilość reszt dodatnich i ujemnych:
n=10 liczba wszystkich reszt
m=7 reszty dodatnie
h=3 reszty ujemne
Wyznaczamy
temp=8,7
Wyznaczamy ze statystyki t-studenta wartość teoretyczną:
tteor=1,833
temp >tteor, więc odrzucamy hipotezę H0, czyli badane reszty modelu można uznać za nie symetryczne.
H0: s12=s22
H1: s12>s22
n1=4
n2=6
s12=130,9/2=65,45
s22=360,7/4=90,175
Fe=65,45/90,175=0,726
Fa=4,32 dla a=0,10
Fe<Fa więc nie ma podstaw do odrzucenia hipotezy Ho, czyli należy przyjąć, że nie występuje heteroscetastyczność.
H0: rozkład normalny
H1: rozkład nie normalny
Szacuje odchylenie standardowe:
S=7,01 n=10 K1=1 K2=5
Przeprowadzamy standaryzację reszt:
e’1=-1,2 e’2=0,08 e’3=1,05 e’4=0,327 e’5=-1,07
e’6=0,341 e’7=1,882 e’8=0,155 e’9=0,013 e’10=-1,585
Porządkujemy reszty od największej do najmniejszej:
-1,585 -1,2 -1,07 0,013 0,08 0,155 0,327 0,341 1,05 1,882
Sprawdzamy, które cele są pełne, a które puste (bez dystrybuant)
[0;0,1) [0,1;0,2) [0,2;0,3) [0,3;0,4) [0,4;0,5) [0,5;0,6) [0,6;0,7) [0,7;0,8)
2 1 0 2 0 1 2 0
[0,8;0,9) [0,9;1]
1
Mamy trzy puste cele, więc K=3
K1<K<K2 , więc nie ma podstaw do odrzucenia hipotezy Ho, czyli reszty mają rozkład normalny.
VIII. Badanie losowości składnika losowego
H0: losowe
H1: nielosowe
A – dodatnie
B - ujemne
a=0,05
Serie: BAAABAAAAB
Z tablicy rozkładu serii odczytujemy K1 i K2:
K1=2
K2=7
Liczba serii naszego modelu wynosi:
Ke=5
Ke należy do (K1;K2), więc nie ma podstaw do odrzucenia hipotezy H0, czyli reszty są losowe.
IX. Badanie autokorelacji składnika losowego
Zakładamy hipotezy:
H0: j=0
H1: j>0
a=0,05
n=10
m+1=2
Testowanie statystyką Durbina - Watsona
DW=736,79/491,649=1,5
Następnie odczytujemy z tablic Durbina – Watsona wartości dl i du
dl=0,879
du=1,320 dla a=0,05 i n=10 stopni swobody
DW>du , więc nie ma podstaw do odrzucenia hipotezy H0, czyli brak autokorelacji składnika losowego w modelu.
WSZYSTKIE TABELE ZNAJDUJĄ SIĘ NA DOŁĄCZONEJ DYSKIETCE W POSTACI ARKUSZA KALKULACYJNEGO EXCEL 97