WSTĘP
Poniższe opracowanie ma na celu oszacowanie modelu ekonometrycznego. Wykorzystane dane zostały pobrane z Internetu z głównej strony Głównego Urzędu Statystycznego. Analizą zostały objęte dwie zmienne: Produkt Krajowy Brutto przypadający na 1 mieszkańca oraz przeciętne miesięczne wynagrodzenie brutto . Przyjęto, iż zmienną zależną jest PKB na 1 mieszkańca, natomiast zmienną niezależną jest przeciętne miesięczne wynagrodzenie. Wykorzystane dane są danymi rocznymi, z lat 2001-2010.
Oszacowanie parametrów modelu ekonometrycznego Metodą Najmniejszych Kwadratów (MNK)
Ogólna postać modelu: Y= β0 + β1Xn+ξt
gdzie:
Y- Produkt Krajowy Brutto na 1 mieszkańca w zł
X- Przeciętne miesięczne wynagrodzenie brutto w zł
β0,β1 - nieznane parametry strukturalne
ξt - składnik losowy
t- numer obserwacji
Postać modelu po oszacowaniu MNK:
∧
Yt=(-6058,78)+12,6066X1
(± 1710,05) (± 0,625886)
Interpretacja parametrów strukturalnych
β0 wyraz wolny oszacowano na poziomie (-6058,78) ze średnim błędem szacunku na poziomie ± 1710,05;
β1 jeżeli wynagrodzenie wzrośnie o jednostkę, to PKB na jednego mieszkańca wzrośnie o 12,6066 zł ze średnim błędem szacunku ± 00,625886( ceteris paribus)
Interpretacja ogólnych miar dopasowania
Współczynnik R2 na poziomie równym 0,980662 informuje, że model empiryczny wyjaśnia 98,07% całkowitej, rzeczywistej zmienności PKB na 1 mieszkańca;
Współczynnik determinacji skorygowany R=0,978245 różni się od współczynnika determinacji zaledwie o około 0,2417%, co w miarę dobrze wyrokuje dla sporządzanego modelu.
Współczynnik ϕ2 =1- R2, wyniósł wartość 0,019338, co oznacza iż 1,93% zmienności zmiennej objaśnianej (PKB) nie zostało wyjaśnione przez model empiryczny.
Współczynnik ϕ2 równy 0 po skorygowaniu wynosi 0,021755; 2,175 % zmienności całkowitej zmiennej objaśnianej nie zostało przez dany model wyjaśnione;
Średni błąd resztowy ϕξ= 896,0583 informuje, że rzeczywiste wartości PKB na 1 mieszkańca odchylają się średnio w okresie 10 lat od wartości teoretycznych, czyli oszacowanych na podstawie modelu, o (+896,0583 zł.);
Współczynnik zmienności losowej V=3,21064% , przeciętne odchylenie od wartości teoretycznych od empirycznych zmiennej objaśnianej stanowi 3,21 % przeciętnego poziomu tej zmiennej;
∧
Yt=(-6058,78)+12,6066X1
Wykres przedstawia rzeczywiste wartości PKB w przeliczeniu na 1 mieszkańca oraz wartości oszacowane w modelu. Krzywe obrazujące przebieg danych rzeczywistych oraz te oszacowane modelu mają dość zbliżony przebieg. Tendencja ta, może świadczyć, że model dobrze odwzorowuje rzeczywisty poziom zmiennej objaśnionej.
Badanie istotności parametrów strukturalnych.
Aby ustalić czy zmienna objaśniająca ma statystycznie istotny wpływa na zmienną objaśnianą przeprowadzono weryfikację istotności parametru zmiennej objaśniającej. Przyjęto poziom istotności 0,05,oznaczający 5% ryzyko popełnienia błędu pierwszego rodzaju, który polega na odrzuceniu hipotezy zerowej, która jest prawdziwa.
Badanie istotności parametrów strukturalnych polega na sprawdzeniu czy różnią się one istotnie od zera.
Liczba stopi swobody w analizowanym modelu wyniosła 8.
Hipotezy istotności
Badanie istotności wyrazu wolnego β0:
H0 : β0 = 0 ( zmienna o wpływie statystycznie nieistotnym)
H1 : β0 ≠ 0 ( zmienna o wpływie statystycznie istotnym)
Hipoteza zerowa H0 zakłada, że wyraz wolny β0, nie różni się statystycznie od 0, przy przyjętym poziomie istotności.
Hipoteza alternatywna H1 zakłada, że wyraz wolny β0 różni się statystycznie istotnie od 0,przy przyjętym poziomie istotności.
Dla wyrazu wolnego β0:
Wartość statystyki „t” dla β0 wynosi :
│t1│= (-3,543) < 2,306 p=0,0076 czyli p> α
Na poziomie istotności α= 0,05 nie odrzucamy hipotezy zerowej na rzecz alternatywnej. Zatem wyraz wolny β0, nie różni się statystycznie od 0, przy przyjętym poziomie istotności.
Dla parametru β1 mają postać:
H0 : β1 = 0
H1 : β1 ≠ 0
Wartość statystyki „t” dla β1 wynosi :
│t1│= 20,14 > 2,306 p=0,0000 czyli p< α.
Zatem odrzucamy hipotezę alternatywną na rzecz hipotezy zerowej, wyraz wolny β1 statystycznie istotnie różni się od 0,przy przyjętym poziomie istotności.
Przedziały ufności
- dla parametrów strukturalnych modelu dla parametru β0:
P (- 10002,2 ≤ β1 ≤ -2115,39), gdzie β0= (-6058,78)
W przedziale (-10002,2;-2115,39 z prawdopodobieństwem 0,95 znajduję się nieznana, rzeczywista wartość wyrazu wolnego β0. W 95 przypadkach na 100 przedział zawiera nieznaną, rzeczywista wartość wyrazu wolego β0.
- dla parametrów strukturalnych modelu dla parametru β1:
P (11,1633 ≤ β1 ≤ 14,0499), gdzie β1= 12,6066
W przedziale (11,1633;14,0499) z prawdopodobieństwem 0,95 znajduje się nieznana, rzeczywista wartość parametru strukturalnego β1. W 95 przypadkach na 100 przedział zawiera nieznaną rzeczywistą wartość parametru strukturalnego β1.
Żaden oszacowany przedział ufności nie zawiera 0, potwierdza to wnioski dotyczące istotności parametrów strukturalnych.
Badanie autokorelacji składników losowych.
Do zbadania istotności autokorelacji składników losowych, należy porównać statystykę DW z wartościami krytycznymi d1 i d2,odczytanych z tablic dla odpowiedniej liczby obserwacji T-10 i liczby zmiennych egzogenicznych k-1 oraz założonego poziomu istotności α= 0,05, oznaczającego 5% ryzyko popełnienia błędu pierwszego rodzaju, który polega na odrzuceniu hipotezy zerowej, która jest prawdziwa.
Statystyka Durbina- Watsona wynosi: 1,189357
DWϵ (0,2) - podejrzewamy autokorelację dodatnią
H0:ρ1=0
H1:ρ1<0
Hipoteza zerowa H0 zakłada brak statystycznie istotniej autokorelacji składników losowych. Hipoteza alternatywna H1 zakłada występowanie statystycznie istotniej dodatniej autokorelacji składników losowych.
Mamy dL< DW< dU
Stwierdza się, że statystyka DW znajduję się w obszarze niekonkluzywności. Za pomocą tego testu nie można rozstrzygnąć hipotez.
Badanie jednorodności ( heteroskedastyczność) wariancji składnika losowego za pomocą testu White'a
Przyjęty poziomi istotności α= 0,05 oznacza 5 % ryzyko popełnienia błędu pierwszego rodzaju polegającego na odrzuceniu hipotezy zerowej, która jest prawdziwa.
H0: E (ξt2)=σξ2 -( homoskedastyczność)
H1: E (ξt2)=σξ2 (Eyt)2 - ( heteroskedastyczność)
Statystyka z próby odczytana z wyników testy White'a wynosi TR2=2,022375
Wartość prawdopodobieństwa empirycznego wynosi p=0,363787
Wartość krytyczna testu χ2α(2) odczytujemy z tablic rozkładu chi- kwadrat wartość ta przy poziomie istotności α= 0,05 ma postać χ20,05 (2)=5,99146. Stąd spełnione są następujące zależności.
TR2 < χ20,05 (8); p> α
Zatem nie podstaw do odrzucenia hipotezy zerowej H0. Wariancja składnika losowego jest jednorodna ( składnik losowy jest homoskedastyczny).
Badanie normalności rozkładu składników losowych testu Doornika- Hansena
Przyjęty poziom istotności α= 0,05 oznacza 5% ryzyko popełnienia błędu pierwszego rzędu polegającego na odrzuceniu hipotezy zerowej, która jest prawdziwa.
H0: ξt=N (0,σ2 )
HA: ξt≠N (0,σ2 )
Hipoteza zerowa Ho zakłada, że rozkład składników losowych nie odbiega statystycznie istotnie od rozkładu normalnego.
Hipoteza alternatywna HA zakłada, że rozkład składników losowych odbiega statystycznie istotnie od rozkładu normalnego.
χ 2(2)=1,780; p=0,41073; α= 0,05
Czy na poziomie istotności zachodzi χ 2< χ 20,05(2); p> α
Zatem niema podstaw do odrzucenia hipotezy zerowej H0, rozkład składnika losowego nie odbiega statystycznie od rozkładu normalnego przy przyjętym poziomie istotności.
Badanie liniowości modelu - Test Ramsaya RESET
Hipotezy mają postać:
H0: ( postać analityczna modelu jest właściwa)
H1: ( postać analityczna modelu jest nie właściwa)
Wartość krytyczna testu dla α= 0,05 odczytana z tablic F- Snedecora wynosi F0,05;6=5,14325, natomiast statystyka F z próby oraz wartość prawdopodobieństwa empirycznego p, odczytane z wyników testu liniowości wynoszą odpowiednio F=0,959388, p=0,435.
Zatem mamy zależność F< F0,05;8; p> α na podstawie czego stwierdza się, że nie ma podstaw do odrzucenia hipotezy zerowej, stąd model mam własność analityczną liniową.
Badanie stabilności parametrów strukturalnych modelu
H0: (model charakteryzuje się stałością parametrów)
H1: (model charakteryzuje się stałością parametrów)
Dla testowania tej hipotezy posługuje się testem Chowa ze statystyką testową F.
Statystyka F z próby oraz wartość początkowa prawdopodobieństwa empirycznego p, odczytane z wyników testu Chowa wynoszą odpowiednio F=3,25748; p=0,1102;
Wartość krytyczna odczytana dla k+1=2 i α= 0,05 wynosi F0,05;2;6=4,45897,
Wartość statystyki F=3,25748 z prawdopodobieństwem empirycznym p=0,1102;
Zatem zależność F<F α,1,8; p α. Stąd wnioskujemy, że na poziomie istotności α=0,05 istnieją podstawy do odrzucenia hipotezy zerowej na korzyść alternatywnej, która mówi, iż model nie charakteryzuje się stałością parametrów w czasie.
Podsumowanie:
Ogólne miary dopasowanie świadczą o tym, iż oszacowany model w poprawny sposób opisuje zmienność PKB na jednego mieszkańca w zależności od wysokość średniego wynagrodzenia (średnia krajowa w danym roku). Wzrost wynagrodzenia o jednostkę spowoduje wzrost PKB na jednego mieszkańca o 12,6066 zł. Ze średnim błędem szacunku=0,625886 . Odchylenie wartości teoretycznych od empirycznych zmiennej objaśnianej stanowi jedynie 3,21 % tej zmiennej. Na podstawie skonstruowanego modelu można uznać, że znaczący wpływ na zmianę wielkości PKB ma średnia wysokość wynagrodzenia w Polsce.
Załącznik: dane do modelu