Prognozowanie gospodarcze – materiały do ćwiczeń
1. Test t – Studenta
Hipotezy testu:
H0:
j
=0 (parametr strukturalny nieistotnie statystycznie różni się od zera, co oznacza, że zmienna
objaśniająca stojąca przy parametrze
j
nie wpływa na zmienną objaśnianą)
H1:
j
0 (parametr strukturalny istotnie statystycznie różni się od zera, co oznacza, że zmienna
objaśniająca stojąca przy parametrze
j
wpływa na zmienną objaśnianą)
Statystyka test:
𝒕
𝜶
𝒋
=
𝒂
𝒋
𝑺(𝒂
𝒋
)
, gdzie a
j
oznacza ocenę parametru strukturalnego
j
, natomiast S(a
j
) oznacza
błąd oceny parametru strukturalnego. Statystyka ma rozkład testu t – Studenta dla poziomu istotności γ oraz
n-K-1 stopni swobody.
Reguła decyzyjna:
Jeżeli t
j
t
γ, n-K-1
, wówczas następuje odrzucenie hipotezy zerowej o braku istotności statystycznej
parametru strukturalnego, na korzyść hipotezy alternatywnej – co oznacza, że parametr
j
jest istotny
statystycznie, a zmienna stojąca przy parametrze wpływa na zmienną objaśnianą
Jeżeli t
j
< t
γ, n-K-1
, wówczas następuje brak podstaw do odrzucenia hipotezy zerowej o braku istotności
statystycznej parametru strukturalnego, – co oznacza, że parametr
j
jest nie istotny statystycznie a
zmienna stojąca przy parametrze nie wpływa na zmienną objaśnianą.
Testowanie przy wykorzystaniu wartości prawdopodobieństwa testowego p-value
Jeżeli wartość prawdopodobieństwa testowego p ≤
(gdzie
=0,05) to następuje odrzucenie hipotezy
zerowej na korzyść hipotezy alternatywnej.
Jeżeli wartość prawdopodobieństwa testowego p >
(gdzie
=0,05) to następuje brak podstaw do
odrzucenia hipotezy zerowej.
2. Test F dla doboru stopnia wielomianu trendu
Hipotezy testu:
H0:
𝝈
𝒓−𝟏
𝟐
= 𝝈
𝒓
𝟐
(wariancja modelu trendu stopnia niższego jest równa wariancji modelu trendu stopnia
wyższego)
H1:
𝝈
𝒓−𝟏
𝟐
> 𝝈
𝒓
𝟐
(wariancja modelu trendu stopnia niższego jest większa od wariancji modelu trendu stopnia
wyższego)
Statystyka test:
𝑭 =
(𝑺𝒆
𝒓−𝟏
)
𝟐
(𝑺𝒆
𝒓
)
𝟐
, gdzie S
e(r-1)
oznacza błąd standardowy reszt dla modelu trendu stopnia
niższego, natomiast S
er
oznacza błąd standardowy reszt modelu trendu stopnia wyższego. Statystyka ma
rozkład testu F dla poziomu istotności γ oraz n-K
1
-1 stopni swobody oraz n-K
2
-1
Reguła decyzyjna:
Jeżeli F
F
γ, n-K1-1, n-k2-1
, wówczas następuje odrzucenie hipotezy zerowej o równości wariancji badanych
modeli, na korzyść hipotezy alternatywnej – co oznacza, że przy przejściu od modelu trendu stopnia
niższego do modelu trendu stopnia wyższego nastąpił istotny spadek wariancji, dlatego w dalszym
modelowaniu wybieramy model trendu stopnia wyższego.
Jeżeli F < F
γ, n-K1-1, n-k2-1
, wówczas następuje brak podstaw do odrzucenia hipotezy zerowej o równości
wariancji badanych modeli – co oznacza, że przy przejściu od modelu trendu stopnia niższego do
modelu trendu stopnia wyższego nie nastąpił istotny spadek wariancji, dlatego w dalszym
modelowaniu wybieramy model trendu stopnia niższego.
3. Zapis hipotezy modelu ekonometrycznego
Analizowany
proces
Stopień wielomianu trendu
Sezonowość
Autoregresja
P
t
1
Tak (kwartalna)
2
𝑃
𝑡
= 𝛼
0
+ 𝛼
1
𝑡 + 𝛿
1
𝑄
1𝑡
∗
+ 𝛿
2
𝑄
2𝑡
∗
+ 𝛿
3
𝑄
3𝑡
∗
+ 𝛽
1
𝑃
𝑡−1
+ 𝛽
2
𝑃
𝑡−2
+ 𝜀
𝑡
K
t
Stopień wielomianu trendu
Sezonowość
Autoregresja
2
Tak (miesięczna)
1
𝐾
𝑡
= 𝛼
0
+ 𝛼
1
𝑡 + 𝛼
2
𝑡
2
+ 𝛿
1
𝑀
1𝑡
∗
+ ⋯ + 𝛿
11
𝑀
11𝑡
∗
+ 𝛽
1
𝐾
𝑡−1
+ 𝜀
𝑡
Z
t
Stopień wielomianu trendu
Sezonowość
Autoregresja
3
Nie
4
𝑍
𝑡
= 𝛼
0
+ 𝛼
1
𝑡 + 𝛼
2
𝑡
2
+ 𝛼
3
𝑡
3
+ 𝛽
1
𝑍
𝑡−1
+ 𝛽
2
𝑍
𝑡−2
+ 𝛽
3
𝑍
𝑡−3
+ 𝛽
4
𝑍
𝑡−4
+ 𝜀
𝑡
4. Ocena przydatności modelu w procesie prognozowania
Test Durbina-Watsona – test służący do badania zjawiska autokorelacji rzędu I składnika losowego.
H0:
1
=0 (współczynnik autokorelacji rzędu I składnika losowego jest równy 0, co oznacza brak autokorelacji
rzędu I)
H1:
1
0 (współczynnik autokorelacji rzędu I składnika losowego jest różny od 0, co oznacza występowanie
autokorelacji rzędu I)
Do badania autokorelacji rzędu I służy statystyka DW, którą porównuje się z dolną oraz górną granicą
odczytaną z tablic rozkładu testu DW uzależnioną od wielkości próby oraz liczby szacowanych parametrów
w modelu bez wyrazu wolnego.
Jeżeli DW>2, wówczas należy wyprowadzić statystykę DW*=4-DW
DW, DW* > dU (górna granica testu), wówczas występuje brak podstaw do odrzucenia hipotezy zerowej,
która wskazuje na brak autokorelacji rzędu I.
DW, DW* ≤ dL (dolna granica testu), wówczas występuje odrzucenie hipotezy zerowej na korzyść
alternatywnej, co oznacza występowanie autokorelacji rzędu I.
dL< DW, DW* ≤ dU wówczas test DW nie rozstrzyga o istnieniu autokorelacji składnika losowego, należy
zastosować inny test, jest to obszar niekonkluzywny testu.
Test Quinoille’a (wartości współczynników autokorelacji cząstkowej dla testu należy szukać w wartościach
funkcji PACF)
H0:
= 0 (współczynnik autokorelacji rzędu m nie występuje) (
=1,2,…,k)
H1:
0 (współczynnik autokorelacji rzędu m występuje) (
=1,2,…,k)
Test ten pozwala badać autokorelację cząstkową rzędów wyższych.
Wartość statystyki testu przyrównuje się do wartości krytycznej równej
2
√𝑁
, gdzie N jest liczebnością próby.
Jeżeli |
𝝆
𝝉𝝉
| ≥
𝟐
√𝑵
, wówczas następuje odrzucenie hipotezy zerowej H0 na korzyść alternatywnej. Stwierdza
się występowanie autokorelacji m rzędu składnika losowego.
Jeśli |
𝝆
𝝉𝝉
| <
𝟐
√𝑵
, wówczas nie ma podstaw do odrzucenia hipotezy zerowej H0, zatem brak jest
autokorelacji m rzędu składnika losowego
Przykład badania autokorelacji cząstkowej na podstawie funkcji PACF
Decyzja
1. Obliczenie wartości krytycznej testu Quinoile’a wg wzoru
2
√𝑁
=
2
√45
= 0.2913.
2. Stosując metodę od góry do dołu badamy przekroczenia
wartości współczynnika autokorelacji cząstkowej
3. Procedura trwa dopóki nie nastąpi odrzucenie hipotezy
zerowej dla
UWAGA! Ustalony rząd autokorelacji odpowiada szukanemu
rzędowi autoregresji.
1
0.58
2
0.28
3
-0.19
4
0.49
|𝜌
4
| ≥ 0.2913 odrzucenie
H0, oznacza występowanie
autokorelacji
rzędu
4
składnika
losowego,
procedura zatrzymuje się.
5
-0.09
|𝜌
55
| < 0.2913
brak
podstaw do odrzucenia H0,
testujemy dalej
6
0.10
|𝜌
66
| < 0.2913,
brak
podstaw do odrzucenia H0,
testujemy dalej
Test Ljunga Boxa (Q) – służy do badania autokorelacji rzędów wyższych
H0:
1
= … =
m
= 0 (współczynnik autokorelacji rzędu m nie występuje)
H1:
1
…
m
0 (współczynnik autokorelacji rzędu m występuje)
Reguła decyzyjna: PATRZ – TESTOWANIE PRZY WYKORZYSTANIU WARTOŚCI P-VALUE!!!
Test Jarque’a – Bery (JB) – służy do badania, czy rozkład składnika losowego jest rozkładem normalnym.
H0: F(e
i
) = F
N
(e
i
) (rozkład składnika losowego jest rozkładem normalnym)
H1: F(e
i
)
F
N
(e
i
) (składnik losowy ma rozkład inny niż rozkład normalny)
Reguła decyzyjna: PATRZ – TESTOWANIE PRZY WYKORZYSTANIU WARTOŚCI P-VALUE!!!
Test Chowa (F
CHOWA
) – służy do badania zmian strukturalnych w parametrach modelu, weryfikuje hipoteze o
stabilności parametrów modelu.
H0: parametry modelu są stabilne w czasie
H1: parametry modelu są niestabilne w czasie
Reguła decyzyjna: PATRZ – TESTOWANIE PRZY WYKORZYSTANIU WARTOŚCI P-VALUE!!!
Test na liniowość zależności (LM
liniowość
).
H0: zależność w modelu jest liniowa
H1: zależność w modelu jest nie liniowa
Reguła decyzyjna: PATRZ – TESTOWANIE PRZY WYKORZYSTANIU WARTOŚCI P-VALUE!!!
Test White’a (LM
hetero
) – test służy do badania jednorodności wariancji (homoskedastyczności wariancji)
H0:
k
= 0 (wariancja jest homoskedastyczna)
H1:
k
0 (wariancja jest heteroscedastyczna)
Reguła decyzyjna: PATRZ – TESTOWANIE PRZY WYKORZYSTANIU WARTOŚCI P-VALUE!!!
Interpretacja współczynnika determinacji R
2
– wyraża udział zmienności części teoretycznej modelu w
całkowitej zmienności zmiennej objaśnianej. Jest miarą dopasowania modelu do danych empirycznych.
Powinien przyjmować wartości większe niż 85%.
Przykład. R
2
= 90% - oznacza to, że zmienne objaśniające w modelu wyjaśniają 90% zmienności zmiennej
objaśnianej. Dopasowanie modelu do danych empirycznych z próby jest wysokie i przekracza granicę 85%.
Interpretacja współczynnika zmienności V
U
– wyraża procentowy udział średniego błędu reszt w średniej
wartości zmiennej objaśnianej. V
U
nie powinien przekraczać wartości 15%.
Przykład. V
U
= 12% oznacza, że udział procentowy błędu resztowego w średniej wartości zmiennej
objaśnianej wynosi 12% i nie przekracza progu 15%
5. Zapis modelu ekonometrycznego
Model: Estymacja KMNK, wykorzystane obserwacje 1998:03-2014:06 (N = 196)
Zmienna zależna (Y): inf
Współczynnik
Błąd stand.
t-Studenta
wartość p
const
0,0133323
0,00544967
2,4464
0,01540
**
time
-0,000293175
0,000123815
-2,3679
0,01896
**
sq_time
2,44747e-06
1,0182e-06
2,4037
0,01726
**
t3
-6,42445e-09
2,64714e-09
-2,4269
0,01622
**
inf_1
1,34894
0,0716811
18,8187
<0,00001
***
inf_2
-0,375948
0,1125
-3,3418
0,00101
***
inf_3
-0,0222811
0,11012
-0,2023
0,83989
inf_4
0,018173
0,109384
0,1661
0,86824
inf_5
0,0356822
0,10825
0,3296
0,74207
inf_6
-0,035296
0,108145
-0,3264
0,74452
inf_7
0,01944
0,107161
0,1814
0,85625
inf_8
-0,0478541
0,106627
-0,4488
0,65412
inf_9
-0,0114271
0,104751
-0,1091
0,91326
inf_10
0,136582
0,102589
1,3314
0,18477
inf_11
-0,109699
0,103138
-1,0636
0,28895
inf_12
-0,468818
0,103968
-4,5093
0,00001
***
inf_13
0,652636
0,106657
6,1190
<0,00001
***
inf_14
-0,223987
0,0688229
-3,2545
0,00136
***
Średn.aryt.zm.zależnej
0,037961 Odch.stand.zm.zależnej
0,029073
Suma kwadratów reszt
0,002011 Błąd standardowy reszt
0,003361
Wsp. determ. R-kwadrat
0,987798 Skorygowany R-kwadrat
0,986632
F(17, 178)
847,6162 Wartość p dla testu F
1,9e-160
Autokorel.reszt - rho1
0,011438 Stat. Durbina-Watsona
1,971392
𝒊𝒏𝒇
𝒕
=
𝟎,𝟎𝟏𝟑
(𝟎,𝟎𝟎𝟓)
−
𝟎,𝟎𝟎𝟎𝟑𝒕𝒊𝒎𝒆
(𝟎,𝟎𝟎𝟎𝟏)
+
𝟎,𝟎𝟎𝟎𝟎𝟎𝟐𝒕𝒊𝒎𝒆
𝟐
(𝟎,𝟎𝟎𝟎𝟎𝟎𝟏)
−
𝟎,𝟎𝟎𝟎𝟎𝟎𝟎𝟎𝟎𝟔𝒕𝒊𝒎𝒆
𝟑
(𝟎,𝟎𝟎𝟎𝟎𝟎𝟎𝟎𝟎𝟐)
+
𝟏,𝟑𝟒𝟗𝒊𝒏𝒇
𝒕−𝟏
(𝟎,𝟎𝟕𝟐)
−
𝟎,𝟑𝟕𝟔𝒊𝒏𝒇
𝒕−𝟐
(𝟎,𝟏𝟏𝟑)
−
𝟎,𝟎𝟐𝟐𝒊𝒏𝒇
𝒕−𝟑
(𝟎,𝟏𝟏)
+
𝟎,𝟎𝟏𝟖𝒊𝒏𝒇
𝒕−𝟒
(𝟎,𝟏𝟎𝟗)
+
𝟎,𝟎𝟑𝟔𝒊𝒏𝒇
𝒕−𝟓
(𝟎,𝟏𝟎𝟖)
−
𝟎,𝟎𝟑𝟓𝒊𝒏𝒇
𝒕−𝟔
(𝟎,𝟏𝟎𝟖)
+
𝟎,𝟎𝟏𝟗𝒊𝒏𝒇
𝒕−𝟕
(𝟎,𝟏𝟎𝟕)
−
𝟎,𝟎𝟒𝟖𝒊𝒏𝒇
𝒕−𝟖
(𝟎,𝟏𝟎𝟕)
−
𝟎,𝟎𝟏𝟏𝒊𝒏𝒇
𝒕−𝟗
(𝟎,𝟏𝟎𝟓)
+
𝟎,𝟏𝟑𝟕𝒊𝒏𝒇
𝒕−𝟏𝟎
(𝟎,𝟏𝟎𝟑)
−
𝟎,𝟏𝟏𝟎𝒊𝒏𝒇
𝒕−𝟏𝟏
(𝟎,𝟏𝟎𝟑)
−
𝟎,𝟒𝟔𝟗𝒊𝒏𝒇
𝒕−𝟏𝟐
(𝟎,𝟏𝟎𝟒)
+
𝟎,𝟔𝟓𝟑𝒊𝒏𝒇
𝒕−𝟏𝟑
(𝟎,𝟏𝟎𝟕)
−
𝟎,𝟐𝟐𝟒𝒊𝒏𝒇
𝒕−𝟏𝟒
(𝟎,𝟎𝟔𝟗)
+ 𝜺
𝒕
Zapisanie modelu ekonometrycznego z wydruku gretla należy rozpocząć od sprawdzenia jak oznaczona jest
zmienna zależna (zmienna objaśniana – w tym przypadku inf
t
Następnie należy zapisać model, gdzie przed znakiem równości znajduje się proces objaśniany (w tym
przypadku inf
t
) a następnie po znaku równości należy przepisać współczynniki parametrów strukturalnych
wraz z zmiennymi objaśniającymi ( tutaj: time, time
2
, time
3
, inf
t-1
do inf
t-14
). Pod współczynnikami parametrów
należy zapisać w nawiasach błędy standardowe.
W wydruku pogrubiono wartości które należy przepisać aby model ekonometryczny został poprawnie
zapisany.
Każdy model ekonometryczny musi mieć zapisany również składnik losowy (tutaj:
ε
t
)