Paweł Niśkiewicz nr. Albumu 44215 23.10.2008r.
Oszacować liniowy model metodą najmniejszych kwadratów na podstawie danych z dowolnego źródła (np. GUS, Eurostat, NBP, GPW itp.). Dane powinny być szeregami czasowymi.
Co najmniej jedną ze zmiennych zlogarytmować.
1. Podać interpretację parametrów przy zmiennych objaśniających
2. Podać interpretację statystyk t-studenta (ocenić istotność zmiennych)
3. Sprawdzić czy składnik losowy podlega autokorelacji (podać wynik testu i interpretację wyniku)
4. Sprawdzić czy składnik losowy jest homo- czy heteroskedastyczny (podać wynik testu i interpretację wyniku)
Zmienna objaśniana:
logG - zlogarytmowana liczba gwałtów w USA(w tys.).
Zmienne objaśniające:
logGP - zlogarytmowana liczba gwałtów w USA w roku poprzednim(w tys.).
logWL - zlogarytmowana liczba włamań w USA w roku poprzednim(w tys.).
logBZ - zlogarytmowana stopa bezrobocia w USA w roku poprzednim(w %).
Badam w Latach 1961-2007. Liczba obserwacji : n = 47
Model 1: Estymacja KMNK z wykorzystaniem 47 obserwacji 1961-2007
Zmienna zależna: logG
|
Współczynnik |
Błąd stand. |
t-Student |
wartość p |
|
const |
-0,395492 |
0,193625 |
-2,0426 |
0,04726 |
** |
logGP |
0,888999 |
0,0201074 |
44,2126 |
<0,00001 |
*** |
logWL |
0,128616 |
0,0375247 |
3,4275 |
0,00135 |
*** |
logBZ |
-0,0632026 |
0,0361634 |
-1,7477 |
0,08766 |
* |
Średnia arytmetyczna zmiennej zależnej = 4,15426
Odchylenie standardowe zmiennej zależnej = 0,557816
Suma kwadratów reszt = 0,0824783
Błąd standardowy reszt = 0,0437961
Wsp. determinacji R2 = 0,99424
Skorygowany R2 = 0,99384
Statystyka F (3, 43) = 2473,08 (wartość p < 0,00001)
Statystyka testu Durbina-Watsona = 1,58496
Autokorelacja reszt rzędu pierwszego = 0,188756
Logarytm wiarygodności = 82,426
Kryterium informacyjne Akaike'a = -156,852
Kryterium bayesowskie Schwarza = -149,451
Kryterium infor. Hannana-Quinna = -154,067
1) Interpretacja ocen parametrów regresji:
logGP - Jeżeli liczba gwałtów w roku poprzednim wzrośnie o 1 procent, to liczba gwałtów w roku bieżącym wzrośnie o około 0,888999 procenta.
logWL - Jeżeli liczba włamań w roku poprzednim wzrośnie o 1 procent, to liczba gwałtów w roku bieżącym wzrośnie o około 0,128616 procenta.
logBZ - Jeżeli stopa bezrobocia w roku poprzednim wzrośnie o 1 procent, to liczba gwałtów w roku bieżącym spadnie o około 0,0632026 procenta.
Interpretacja statystyk t-studenta:
Zmienna logGP jest statystycznie istotna gdyż wartość p dla jej statystyki t-Studenta wynosi poniżej 0,00001 <0,05.
Zmienna logWL jest statystycznie istotna gdyż wartość p dla jej statystyki t-Studenta wynosi 0,00135 <0,05.
Zmienna logBZ nie jest statystycznie istotna gdyż wartość p dla jej statystyki t-Studenta wynosi 0,08766 >0,05 ( Mimo, że istotność zmiennej logBZ uległa znacznej poprawie po zlogarytmowaniu).
3) Test na Autokorelację składnika losowego:
Test Breuscha-Godfreya na autokorelację rzędu pierwszego
Estymacja KMNK z wykorzystaniem 47 obserwacji 1961-2007
Zmienna zależna: uhat
współczynnik błąd standardowy t-Student wartość p
--------------------------------------------------------------
const -0,0125142 0,192554 -0,06499 0,9485
logGP -0,00238322 0,0200586 -0,1188 0,9060
logWL 0,00438351 0,0374290 0,1171 0,9073
logBZ -0,00675291 0,0363116 -0,1860 0,8534
uhat_1 0,194045 0,153642 1,263 0,2136
Wsp. determinacji R-kwadrat = 0,03659
Statystyka testu: LMF = 1,595091,
z wartością p = P(F(1,42) > 1,59509) = 0,214
Statystyka testu: TR^2 = 1,719672,
z wartością p = P(Chi-kwadrat(1) > 1,71967) = 0,19
Ljung-Box Q' = 1,78002 z wartością p = P(Chi-kwadrat(1) > 1,78002) = 0,182
Wartość statystyki F o 1 i 42 stopniach swobody (dla p=0,05) wynosi 4,07265 co jest większe od wartości statystyki testu LMF 4,07265 > 1,595091. Brak więc podstaw do odrzucenia hipotezy zerowej mówiącej o braku autokorelacji składnika losowego.
Test na Heterostoskedastyczność składnika losowego:
Test White'a na heteroskedastyczność reszt (zmienność wariancji resztowej)
Estymacja KMNK z wykorzystaniem 47 obserwacji 1961-2007
Zmienna zależna: uhat^2
współczynnik błąd standardowy t-Student wartość p
--------------------------------------------------------------
const -0,204205 0,320830 -0,6365 0,5284
logGP -0,00688870 0,0499887 -0,1378 0,8911
logWL 0,0669621 0,110427 0,6064 0,5480
logBZ -0,0750972 0,0681797 -1,101 0,2778
sq_logGP 0,0163907 0,00724642 2,262 0,0297 **
X2_X3 -0,0148443 0,0128630 -1,154 0,2559
X2_X4 -0,00852340 0,00674857 -1,263 0,2145
sq_logWL -0,00193496 0,0106109 -0,1824 0,8563
X3_X4 0,0174108 0,0148396 1,173 0,2482
sq_logBZ -0,00612048 0,00873101 -0,7010 0,4877
Wsp. determinacji R-kwadrat = 0,35924
Statystyka testu: TR^2 = 16,884283,
z wartością p = P(Chi-kwadrat(9) > 16,884283) = 0,050559
Hipoteza zerowa mówi, że heteroskedastyczność nie jest obecna. Wartosc statystyki Chi- kwadrat o 9. stopniach swobody wynosi 16,919 i jest odrobinę większa niż wartość TR^2 (16,919 > 16,884283).
Przyjmujemy więc hipotezę zerową na mówiącą, że składnik losowy jest homoskedastyczny.