Zadaniem będzie analiza wzrostu Produktu Krajowego Brutto w Polsce w latach 90 w zależności od wartości:
Ilości ludności w wieku produkcyjnym;
Stopy bezrobocia;
Produkcji przemysłowej;
Stopy inflacji;
Wzrost przeciętnego, realnego wynagrodzenia;
Objaśnienia symboli
Y - Przyrost produktu krajowego brutto (w %)
X1 - Ilość ludności w wieku produkcyjnym (w mln)
X2 - stopa bezrobocia (w %)
X3 - Produkcja przemysłowa (w % w stosunku do poprzedniego roku)
X4 - Stopa inflacji (w %)
X5 - Wzrost przeciętnego realnego wynagrodzenia brutto (w zł)
Dane statystyczne
Rok |
Y |
X1 |
X2 |
X3 |
X4 |
X5 |
1991 |
-7,0 % |
22,065 |
12,2 % |
- 8,0 % |
70,3 % |
3,29 |
1992 |
2,6 % |
22,205 |
14,3 % |
2,8 % |
43,0 % |
40,39 |
1993 |
3,8 % |
22,332 |
16,4 % |
6,4 % |
35,3 % |
2,39 |
1994 |
5,2 % |
22,493 |
16,0 % |
12,1 % |
32,2 % |
4,66 |
1995 |
7,0 % |
22,663 |
14,9 % |
9,7 % |
27,8 % |
21,7 |
1996 |
6,0 % |
22,836 |
13,2 % |
8,3 % |
19,9 % |
30,55 |
1997 |
6,8 % |
23,003 |
10,3 % |
11,5 % |
14,9 % |
58,85 |
1998 |
4,8 % |
23,239 |
10,4 % |
4,6 % |
11,8 % |
52,25 |
1999 |
4,1 % |
23,424 |
13,1 % |
4,4 % |
7,3 % |
376,76 |
2000 |
4,0 % |
23,650 |
15,1 % |
6,5 % |
8,5 % |
71,99 |
Źródło : Główny Urząd Statystyczny
Wybór zmiennych objaśniających metodą Hellwiga
Wartości wyznaczone w wyniku tych działań tworzą macierz R oraz wektor R0. Przy metodzie Hellwiga możemy obliczyc i koniecznie wyznaczyć współczynniki korelacji między potencjalnymi zmiennymi objaśniającymi i każdą zmienną oraz zmienną objaśnianą.
Tu zastosowano wzór:
gdzie: i,j = 0,1,2,3,4,5
n = 10 - liczba obserwacji.
Wyznaczenie pojemności integralnych dla poszczególnych kombinacji:
Aby wyznaczyć zmienne objaśniające, które powinny wejść do modelu, powinniśmy obliczyć pojemność integralną kombinacji, potencjalnych zmiennych objaśniających według wzoru:
l = (1, 2, ..., L) j = (1, 2, ..., pl)
l = (1, 2, ..., t)
Największa pojemność integralna charakteryzuje się kombinacją zmiennych K={x3 x5} -> H=0,892. Z tego właśnie można wywnioskować, że jest ona najlepszą kombinacją do budowy modelu ekonometrycznego. Z pięciu zmiennych objaśniających, możemy wygenerować L=2p-1 kombinacji, czyli u nas L=31.
H1 = 0,107 |
H123 = 0,604 |
H2 = 0,098 |
H124 = 0,262 |
H3 = 0,892 |
H125 = 0,12 |
H4 = 0,312 |
H134 = 0,741 |
H5 = 0,027 |
H135 = 0,739 |
H12 =0,109 |
H145 = 0,265 |
H13 = 0,744 |
H234 = 0,709 |
H14 = 0,308 |
H235 = 0,716 |
H15 = 0,109 |
H245 = 0,255 |
H23 =0,709 |
H345 = 0,806 |
H24 =0,284 |
H1234 = 0,629 |
H25 =0,114 |
H1235 = 0,609 |
H34 = 0,843 |
H1245 = 0,244 |
H35 = 0,892 |
H1345 = 0,712 |
H45 = 0,25 |
H2345 = 0,69 |
H12345 = 0,615 |
Wybór zmiennych objaśniających metodą Analizy Grafów
Musimy Podobnie jak w metodzie Hellwiga, wyznaczyć macierz współczynników korelacji między zmiennymi R oraz wektor R0.
Korzystamy z tego, że potrzebne dane współczynniki obliczyliśmy wcześniej. Nastepnie wyznaczamy r*:
gdzie: ta2 - wartość krytyczna odczytana z rozkładu t-studenta
n - liczba obserwacji
Mamy podane : n=10 oraz α=0,05 ta2 = 2,306
Wartości współczynników korelacji:
dla
zamieniamy na zera.
A oto powiązania zależności zmiennych objaśniających.
Jak można zaobserwować na powyższym schemacie, na zmienną X1, oddziałuje zmienna X2, X3 oraz X4. Pomiędzy zmienna X5 a resztą zmiennych objaśniających nie zachodzi korelacja. Wynik analizy grafów, pokrywa się z wynikami metody Hellwiga (za najlepszy model opisujący zachowanie się zmiennej objaśnianej został uznany model zawierający zmienne {X3 X5}). Gdyż również tu powinien zostać wybrany model zawierający jedną zmienne X3 X5 jako że posiadają największy wpływ na zmienna endogeniczną.
Metoda najmniejszych kwadratów.
Do oszacowania parametrów strukturalnych modelu ekonometrycznego stosujemy metodę najmniejszych kwadratów. Naszym celem na tym etapie jest przedstawienie modelu w postaci:
W tym celu tworzymy wektor Y, w którym znajdują się nasze dane dotyczące zmiennej endogenicznej oraz macierz X, w której znajdują się wszystkie zmienne objaśniające wraz wartościami, jakie przyjmują. W przypadku, który jest rozpatrywany, macierz X, zawiera jedynie jedna zmienną (wynika to z tego, że szacowany model składa się tylko z jednej zmiennej.
Wektor parametrów strukturalnych należy obliczyć z zależności:
potrzebne są następujące elementy (elementy te są wyznaczane w programie:
7
Dla wartości z naszego zadania tzn. Dla zmiennej{X1} wektor ocen parametrów strukturalnych ma postać:
Według poniższej zależności wyznaczamy wariancję resztową
gdzie: n - liczba obserwacji, k - liczba zmiennych modelu
n = 10, k = 1;
W przypadku powyższego modelu: Su2= 1,5834.
Następnie obliczamy macierz D2(a) - gdzie pierwiastki jej elementów przekątniowych są średnimi błędami szacunku poszczególnych parametrów.
Otrzymany w wyniku zastosowania metody najmniejszych kwadratów model ekonometryczny możemy więc przedstawić następująco:
Y = 0,652252X3 + 0,00504227X5 - 0,369858;
(0,0694786) (0,0036885) (0,570013)
Ocena dopasowania modelu do danych empirycznych (sprawdzianem hipotezy jest statystyka t-Studenta)
Celem tej oceny jest sprawdzenie, czy parametry strukturalne zostały oszacowane z dostateczną precyzją, to znaczy czy możemy mieć do nich zaufanie. Przynosi ona również odpowiedź na pytanie, czy zmienne objaśniające stojące przy tych parametrach istotnie wywierają wpływ na zmienną objaśnianą.
W tym celu dla każdego z parametrów weryfikuje się hipotezę zerową:
H0 : aj = 0
wobec hipotezy alternatywnej:
H1 : aj ≠ 0
Sprawdzianem w tym teście jest statystyka o rozkładzie t-studenta dla
(n-k-1) stopniach swobody oraz poziomem ufności α.
Dla wszystkich parametrów strukturalnych obliczamy wartość:
Jeśli jest ona mniejsza od wartości krytycznej odczytanej z tablicy rozkładu t-Studenta to oznacza to, iż ocena ai statystycznie niewiele różni się od zera zatem hipotezę zerową należy przyjąć - oznacza to brak istotnego wpływu danej zmiennej objaśniającej na zmienną objaśnianą.
Gdy zaś wartość ta jest większa, oznacza to iż hipotezę zerową odrzucamy na rzecz hipotezy alternatywnej - czyli że dana zmienna objaśniająca faktycznie wywiera istotny wpływ na zmienną objaśnianą.
Wartości dla zmiennych powyższego zadania kształtują się następująco:
t(a2) = 9,38781
t(a1) = 1,36702
Dla poziomu istotności α = 0.05 i 10 stopni swobody wartością krytyczną odczytaną z tablic jest t* = 2,306. Tak więc warunek t(a2)>t* został spełniony warunek hipoteza zerowa została odrzucona, natomiast warunek t(a1)>t* jest niespełniony dlatego w tym przypadku hipoteza zerowa nie jest odrzucona.
W wyniku oceny otrzymaliśmy informację, iż pomiędzy zmienną X3 a zmienną Y zachodzi korelacja, natomiast pomiędzy zmienną X5 a zmienną Y nie. Obliczone parametry strukturalne modelu, mają niedostateczną precyzję.
Zgodność oszacowanego modelu
współczynnik zbieżności wyznaczony w programie:
Φ2= 0,089565;
Wartość współczynnika zbieżności jest dosyć duża, co oznacza, że wartości teoretyczne zmiennej endogenicznej niezbyt dokładnie odpowiadają wartościom zaobserwowanym. Stąd wniosek, że model nie jest zbyt dobrze dopasowany.
Współczynnik determinacji
Rw2=0,910435;
Współczynnik ten określa, że 91,04% wariancji bezrobocia, jest wyjaśnione przez oszacowany model ekonometryczny, natomiast 8,95% nie jest przez ten model określone.
Współczynnik zmienności przypadkowej (losowej)
Vs= 0,33736;
Wahania przypadkowe stanowią 33,736% średniego poziomu zmiennej endogenicznej.
Ocena dopasowania modelu do danych empirycznych (sprawdzianem hipotezy jest statystyka F rozkładu F Fischera - Snedecora)
Aby stwierdzić, czy dopasowanie oszacowanego modelu do danych empirycznych jest wystarczające, można zweryfikować hipotezę o istotności współczynnika korelacji wielorakiej. Alternatywnie oznacza to weryfikacje hipotezy zakładającej, że wszystkie parametry strukturalne z wyjątkiem wyrazu wolnego są równe zeru.
Hipotezę zerową można zapisać:
H0: α1 = 0
Wobec hipotezy alternatywnej:
H1: α1 > 0
Sprawdzianem tej hipotezy jest statystyka:
;
Po podstawieniu danych i obliczeniu wyrażenia otrzymujemy:
F = 10,1651 * 7/2 = 35,57777;
Wartość odczytana krytyczna odczytana z tablic rozkładu Fishera - Snedecora dla poziomu istotności α=0,05 oraz 3 i 8 stopni swobody wynosi: Fα = 4,066.
Zachodzi relacja F ≥ Fα, więc hipotezę zerową należy odrzucić. Uwzględnione w modelu zmienne objaśniające dobrze wyjaśniają zmienność zmiennej endogenicznej.
Uwagi i wnioski
Otrzymany model ekonometryczny, słabo modeluje zmiany wartości zmiennej endogenicznej. Jest to spowodowane zbyt małą ilość obserwacji, które zostały uwzględnione przy wyznaczaniu powyższego modelu.
Na nienajlepszy wynik modelu, miał również dobór zmiennych objaśniających, jest ich stanowczo zbyt mało, jak na skale tego zjawiska.
Jak można zobaczyć na przedstawionych wynikach, różnice pomiędzy rzeczywistą wartością zmiennej endogenicznej a wyliczonymi wartościami są duże.
Powyżej został przedstawiony wykres zależności zmiennej objaśnianej od zmiennej objaśniającej. Jest on potwierdzeniem wcześniejszych wniosków - tzn. przybliżenie liniowe nie jest najlepszym rozwiązaniem w powyższym przypadku.
X5
X4
X3
X1
X2