SPRAWOZDANIE
Z PRZEPROWADZONEGO PROJEKTU
Zadanie:
Zbudowanie modelu ekonometrycznego za pomocą programu Gretl opartego na danych z wyznaczonego zakresu tematycznego.
Temat:
Import ropy naftowej do Polski.
1.Zebranie niezbędnych danych:
Wykres ilustrujący zmiany zmiennej objaśnianej w okresie od stycznia 2009 do sierpnia 2011 roku.
2.Przeprowadzenie analizy danych za pomocą funkcji regresji w programie MS Excel.
3. Import danych do programu Gretl.
Zmienna objaśniana:
V1 - Import ropy naftowej - w mln ton
Zmienne objaśniające:
V2 - Ceny benzyny Pb95 - zł/l
V3 - Ceny LPG - zł/l
V4 - wydobycie ropy - w tysiącach ton
V5 - Liczba nowo-zarejestrowanych pojazdów – szt
V6 - Kurs Walut - USD w zł
V7 - Produkcja przemysłowa w Polsce
4. Budowa modelu klasyczną metodą najmniejszych kwadratów.
Równanie modelu:
Y= (-0,389031) + 0,296666 + 0,391852 + (-0,00668652)
Zakładany poziom ufności = 0,05
Model 1: Estymacja KMNK, wykorzystane obserwacje 2009:01-2011:08 (N = 32)
Zmienna zależna: v1
|
Współczynnik |
Błąd stand. |
t-Studenta |
wartość p |
|
const |
-0,389031 |
0,491412 |
-0,7917 |
0,43601 |
|
v2 |
0,296666 |
0,0729755 |
4,0653 |
0,00042 |
*** |
v3 |
0,391852 |
0,105939 |
3,6989 |
0,00107 |
*** |
v4 |
-0,00627546 |
0,006766 |
-0,9275 |
0,36254 |
|
v5 |
-1,84155e-06 |
4,29025e-06 |
-0,4292 |
0,67142 |
|
v6 |
0,157646 |
0,10056 |
1,5677 |
0,12953 |
|
v7 |
-0,00668652 |
0,00266486 |
-2,5091 |
0,01895 |
** |
Średn.aryt.zm.zależnej |
1,845625 |
|
Odch.stand.zm.zależnej |
0,193039 |
Suma kwadratów reszt |
0,170841 |
|
Błąd standardowy reszt |
0,082666 |
Wsp. determ. R-kwadrat |
0,852109 |
|
Skorygowany R-kwadrat |
0,816616 |
F(6, 25) |
24,00733 |
|
Wartość p dla testu F |
3,07e-09 |
Logarytm wiarygodności |
38,31807 |
|
Kryt. inform. Akaike'a |
-62,63614 |
Kryt. bayes. Schwarza |
-52,37599 |
|
Kryt. Hannana-Quinna |
-59,23519 |
Autokorel.reszt - rho1 |
0,411834 |
|
Stat. Durbina-Watsona |
1,113936 |
Skorygowany R- kwadrat wynosi 0,816616, co oznacza, iż model w 81% wyjaśnia przedstawiany problem, przekraczając tym samym wymagane 70%. Dla zwiększenia tej prawidłowości został przeprowadzony test pominiętych zmiennych. Zostały wykluczone zmienne, których prawdopodobieństwo przekraczało poziom ufności na poziomie 0,05 (przyjęto hipotezę, iż zmienne te są równe 0). Pominięcie zmiennych poprawiło 3 z 3 kryteriów informacyjnych (AIC, BIC, HQC), podniosło skorygowany R-kwadrat - a tym samym dopasowanie modelu - do 82% oraz obniżyło błąd standardowy reszt do 0,081935.
5. Przeprowadzenie testów istotności zmiennych:
T est normalności rozkładu reszt
Hipoteza zerowa: składnik losowy ma rozkład normalny
Statystyka testu: Chi-kwadrat(2) = 0,773249 z wartością p 0,67935
Dystrybuanta empiryczna posiada rozkład normalny. Przyjmujemy hipotezę, iż składnik losowy ma rozkład normalny (p>0,05).
Test heteroskedastyczności reszt – Test White’a
Test White'a na heteroskedastyczność reszt (zmienność wariancji resztowej) –
Hipoteza zerowa: heteroskedastyczność reszt nie występuje
Statystyka testu: LM = 15,4437
z wartością p = P(Chi-kwadrat(9) > 15,4437) = 0,0794482
Przyjmujemy hipotezę o braku występowania heteroskedatyczności reszt. Zmienność wariancji resztowej ma charakter homoskedastyczny.(p>0,05)
Ocena współliniowości VIF
Minimalna możliwa wartość = 1.0
Wartości > 10.0 mogą wskazywać na problem współliniowości-rozdęcia wariancji
v2 3,094
v3 3,383
v7 1,887
VIF(j) = 1/(1 - R(j)^2), gdzie R(j) jest współczynnikiem korelacji wielorakiej
pomiędzy zmienną 'j' a pozostałymi zmiennymi niezależnymi modelu.
Własności macierzy X'X:
1-norm = 4038,534
Wyznacznik = 181509,08
Wskażnik uwarunkowania macierzy CN = 3,2630384e-005
Wartość żadnej ze zmiennych nie przekracza poziomu 10.0. Problem współliniowości – zbyt dużego powiększenia wariancji nie występuje.
Test Durbina-Watsona
Stat. Durbina-Watsona = 0,945721
wartość p = 6,10612e-005
W związku z wartością prawdopodobieństwa zbliżoną do zera musimy odrzucić hipotezę o braku autokorelacji reszt.
Test Breuscha-Godfreya na autokorelację rzędu pierwszego
Statystyka testu: LMF = 9,004117,
z wartością p = P(F(1,27) > 9,00412) = 0,00574
Również test Breuscha-Godfreya wskazuję występowanie autokorelacji reszt, a tym samym błędność modelu.
6. Wprowadzenie zmian w celu pozbycia się autokorelacji reszt
a) Zmiana wartości odrzuconych zmiennych na przyrost względny.
Stat. Durbina-Watsona = 1,05256
wartość p = 0,000142107
Wystąpiła jedynie nieznaczna poprawa wskaźnika autokorelacji. Mimo zastosowania przyrostu względnego zmienne v4, v5, v6 nadal wymagały odrzucenia.
b) Zmiana wartości zmiennej objaśnianej na przyrost względny.
|
Współczynnik |
Błąd stand. |
t-Studenta |
wartość p |
|
const |
0,998445 |
0,00706823 |
141,2582 |
<0,00001 |
*** |
v4 |
0,0118487 |
0,000723279 |
16,3819 |
<0,00001 |
*** |
Jedynie zmienna v4 nie została odrzucona.
Stat. Durbina-Watsona = 2,18311
wartość p = 0,665326
Statystyka Durbina-Watsona wskazała brak istnienia autokorelacji reszt, jednak zmiana modelu nie mogła zostać zaakceptowana w związku z odrzuceniem hipotezy o normalności rozkładu.
Test na normalność rozkładu reszt -
Hipoteza zerowa: składnik losowy ma rozkład normalny
Statystyka testu: Chi-kwadrat(2) = 36,6739
z wartością p = 1,08736e-008
d) Powrót do wartości pierwotnych oraz wprowadzenie logarytmów dla wybranych zmiennych.
Test wykazał normalność rozkładu zmiennych, jednak wprowadzenie logarytmu nie pomogło w pozbyciu się autokorelacji. Maksymalne prawdopodobieństwo wyniosło 0,0012 i było dalekie od wymaganego poziomu ufności.
e) Powrót do wartości pierwotnych oraz dodanie zmiennych w postaci sezonowych różnic dla wszystkich zmiennych objaśniających.
|
Współczynnik |
Błąd stand. |
t-Studenta |
wartość p |
|
const |
-1,02816 |
0,370629 |
-2,7741 |
0,01579 |
** |
v2 |
0,741679 |
0,0712765 |
10,4057 |
<0,00001 |
*** |
v5 |
-2,27795e-05 |
6,55919e-06 |
-3,4729 |
0,00412 |
*** |
sd_v2 |
0,151602 |
0,0860279 |
1,7622 |
0,10151 |
|
sd_v4 |
0,023287 |
0,00584186 |
3,9862 |
0,00155 |
*** |
sd_v5 |
4,5386e-05 |
1,09713e-05 |
4,1368 |
0,00117 |
*** |
sd_v6 |
-0,477485 |
0,100228 |
-4,7640 |
0,00037 |
*** |
Średn.aryt.zm.zależnej |
1,955000 |
|
Odch.stand.zm.zależnej |
0,164141 |
Suma kwadratów reszt |
0,033945 |
|
Błąd standardowy reszt |
0,051099 |
Wsp. determ. R-kwadrat |
0,933688 |
|
Skorygowany R-kwadrat |
0,903083 |
F(6, 13) |
30,50737 |
|
Wartość p dla testu F |
6,20e-07 |
Logarytm wiarygodności |
35,40872 |
|
Kryt. inform. Akaike'a |
-56,81744 |
Kryt. bayes. Schwarza |
-49,84732 |
|
Kryt. Hannana-Quinna |
-55,45680 |
Autokorel.reszt - rho1 |
-0,015289 |
|
Stat. Durbina-Watsona |
1,775146 |
Test na normalność rozkładu reszt -
Hipoteza zerowa: składnik losowy ma rozkład normalny
z wartością p = 0,314624
Test LM na autokorelację rzędu 1 -
Hipoteza zerowa: brak autokorelacji składnika losowego
Statystyka testu: LMF = 0,00344564 z wartością p = P(F(1,12) > 0,00344564) = 0,954158
Test White'a na heteroskedastyczność reszt (zmienność wariancji resztowej) -
Hipoteza zerowa: heteroskedastyczność reszt nie występuje
Statystyka testu: LM = 12,7874 z wartością p = P(Chi-kwadrat(12) > 12,7874) = 0,384678
Pozostawienie jednej ze zmiennych wymagających odrzucenia pozwoliło na pozbycie się autokorelacji reszt i zaakceptowanie hipotezy o jej braku z prawdopodobieństwem równym 0,0529982. Wynik pozostałych testów był prawidłowy.
Odrzucenie zmiennej sd_v2 obniżyło wartość p dla statystyki Durbina-Watsona do poziomu 0,0296066, jednak Test Breuscha-Godfreya wykazał brak autokorelacji reszt.
Ostateczny model:
Zmienna zależna: v1
|
Współczynnik |
Błąd stand. |
t-Studenta |
wartość p |
|
const |
-0,91619 |
0,391637 |
-2,3394 |
0,03466 |
** |
v2 |
0,709878 |
0,0739578 |
9,5984 |
<0,00001 |
*** |
v5 |
-1,92231e-05 |
6,69387e-06 |
-2,8717 |
0,01231 |
** |
sd_v4 |
0,0207348 |
0,00607017 |
3,4158 |
0,00418 |
*** |
sd_v5 |
3,73088e-05 |
1,06913e-05 |
3,4897 |
0,00361 |
*** |
sd_v6 |
-0,460701 |
0,107015 |
-4,3050 |
0,00073 |
*** |
Średn.aryt.zm.zależnej |
1,955000 |
|
Odch.stand.zm.zależnej |
0,164141 |
Suma kwadratów reszt |
0,042054 |
|
Błąd standardowy reszt |
0,054807 |
Wsp. determ. R-kwadrat |
0,917848 |
|
Skorygowany R-kwadrat |
0,888508 |
F(5, 14) |
31,28302 |
|
Wartość p dla testu F |
4,02e-07 |
Logarytm wiarygodności |
33,26661 |
|
Kryt. inform. Akaike'a |
-54,53322 |
Kryt. bayes. Schwarza |
-48,55883 |
|
Kryt. Hannana-Quinna |
-53,36696 |
Autokorel.reszt - rho1 |
0,015710 |
|
Stat. Durbina-Watsona |
1,580160 |
Test LM na autokorelację rzędu 1 -
Hipoteza zerowa: brak autokorelacji składnika losowego
Statystyka testu: LMF = 0,00385401
z wartością p = P(F(1,13) > 0,00385401) = 0,951443
Test White'a na heteroskedastyczność reszt (zmienność wariancji resztowej) -
Hipoteza zerowa: heteroskedastyczność reszt nie występuje
Statystyka testu: LM = 16,2425
z wartością p = P(Chi-kwadrat(10) > 16,2425) = 0,0928991
Test na normalność rozkładu reszt -
Hipoteza zerowa: składnik losowy ma rozkład normalny
Statystyka testu: Chi-kwadrat(2) = 5,59445
z wartością p = 0,0609789
Ocena współliniowości VIF - czynnika powiększania wariancji
Minimalna możliwa wartość = 1.0
Wartości > 10.0 mogą wskazywać na problem współliniowości-rozdęcia wariancji
v2 2,518
v5 6,231
sd_v4 3,690
sd_v5 11,896
sd_v6 6,666
VIF(j) = 1/(1 - R(j)^2), gdzie R(j) jest współczynnikiem korelacji wielorakiej
pomiędzy zmienną 'j' a pozostałymi zmiennymi niezależnymi modelu.
Własności macierzy X'X:
1-norm = 1,9373288e+010
Wyznacznik = 4,6487396e+019
Wskażnik uwarunkowania macierzy CN = 8,5003842e-013
7.Wnioski:
Po wprowadzeniu niezbędnych zmian i przeprowadzeniu testów istotności zmiennych akceptujemy powyższy model, który w 88% procentach wyjaśnia wpływ zmiennych objaśniających na zmienną objaśnianą, jaką stanowi import ropy naftowej do Polski.