Paweł Strawiński
Notatki do ćwiczeń z ekonometrii
1.9
Czasowy wymiar danych
Do tej pory rozpatrywaliśmy jedynie modele tworzone na podstawie danych
empirycznych pochodzących z prób przekrojowych. Teraz zajmiemy się za-
gadnieniem budowy modeli regresji, gdy obserwacje pochodzą z kolejnych
okresów czasu. Tego typu modele są ważne z praktycznego punktu widze-
nia, ponieważ mają szerokie zastosowania, między innymi w prognozowaniu
gospodarczym.
Dla odróżnienia danych o charakterze czasowym od danych przekrojo-
wych, które oznaczaliśmy indeksem i porzadkującym badane jednostki, wy-
miar czasowy będziemy oznaczać indeksem t.
Okazuje się że estymatory modelu
y
t
= X
t
β + ε
t
posiadają takie same właściwości jak w przypadku danych przekrojowych.
Jednak występują również pewne specyficzne cechy, nieobecne w danych
przekrojowych. Są trzy zasadnicze różnice pomiędzy modelem utworzonym
na podstawie danych przekrojowych, a takim utworzonym na podstawie da-
nych o wymiarze czasowym. Po pierwsze, w przypadku gdy dane posiadają
wymiar czasowy jest sens mówić o budowie prognoz. Po drugie parametry
modelu mogą być niestabilne w czasie. Po trzecie składnik losowy może pod-
legać zjawisku autokorelacji.
1.9.1
Predykcja
W ekonometrii predykcją nazywamy wnioskowanie przeprowadzone na pod-
stawie Klasycznego Modelu Regresji Liniowej. Możemy tego dokonać nieza-
leżnie od tego czy wartości zmiennych objaśniających pochodzą z próby na
podstawie której szacowaliśmy model, czy są to wartości spoza tej próby.
Aby mieć możliwość wnioskowania na podstawie próby losowej na większą
populację lub dłuższy okres czasu należy przyjąć dwa założenia:
1. prawidłowość z okresu (1..T ) również obowiązuje w okresie progno-
stycznym w przypadku danych czasowych, albo prawidłowość zacho-
dząca dla próby również obowiązuje w całej populacji,
2. składnik losowy w przedziale prognozy zachowuje się tak samo jak w
okresie próby.
Załóżmy, że dysponujemy prostą próbą losową, którą możemy podzielić na
dwie części
1 . . . N
| {z }
estymacja
(N + 1) . . . (N + p)
|
{z
}
predykcja
57
Paweł Strawiński
Notatki do ćwiczeń z ekonometrii
Oznaczmy przez x obserwacje z próby (okresu) estymacji, a przez x
0
z próby
predykcji (okresu prognozy). Na podstawie pierwszej części próby szacujemy
nieznane parametry modelu. Następnie chcemy obliczyć wartość zmiennej
objaśnianej y
f
związaną z wektorem regresorów x
0
, czyli wykonać predykcję
wewnątrz próby (in-sample-prediction). Wartość ta będzie wynosić:
y
f
= x
0
β + ε
0
Z twierdzenia Gaussa-Markowa wynika, że:
ˆ
y
f
= x
0
0
b
jest najlepszym liniowym, nieobciążonym estymatorem E[y
f
| x
0
] o minimal-
nej wariancji. Błąd prognozy e
0
jest równy:
e
0
= y
f
− ˆ
y
f
= x
0
0
β + ε
0
− x
0
0
b = x
0
0
(β − b) + ε
0
Błąd prognozy ma dwa źródła. Po pierwsze b jest tylko estymatorem nie-
znanego parametru β. Jeżeli stosowany jest nieobciążony estymator wektora
parametrów β to wynosi on zero, ponieważ
E(e
0
) = E(y
f
− ˆ
y
f
) = x
0
0
E(b)
|{z}
β
−x
0
0
β = 0
Po drugie zależy on od składnika losowego w okresie prognozy ε
0
. O jakości
prognozy świadczy jej precyzja. Wariancja prognozy wynosi:
var[e
0
| X, x
0
] = σ
2
+ var[(b − β)
0
x
0
| X, x
0
] = σ
2
+ x
0,
(X
0
X)
−1
x
0
Jest ona sumą niedokładności oszacowań parametrów oraz błędu losowego σ
2
.
Jak widać z powyższego wzoru wariancja prognozy nie jest stała. Zależy ona
od wartości x
0
. Przy wyprowadzaniu wzorów zakładaliśmy, że x
0
jest znane
(prognoza ex post). Jeśli x
0
musi być prognozowane (prognoza ex ante) wtedy
wyrażenie na wariancję prognozy musi być zmodyfikowane o wariancję x
0
. W
takim przypadku nie istnieje ogólna postać analityczna wzoru na wariancję
prognozy.
Przedziały ufności dla prognozy Prognoza jest szczególnym przypad-
kiem kombinacji liniowej parametrów i wyprowadzenie przedziałów ufności
wygląda analogicznie. Wychodząc od
δ
0
b − δ
0
β
√
δ
0
Σ
b
δ
∼ t
N =k
58
Paweł Strawiński
Notatki do ćwiczeń z ekonometrii
i kładąc δ
0
b = x
f
b otrzymujemy
P r( ˆ
y
f
− se( ˆ
e
f
)t
α
2
< y
f
< ˆ
y
f
+ se( ˆ
e
f
)t
α
2
)
uzyskany przedział ufności jest przedziałem dla wartości prognozowanej.
W teorii ekonometrii zaproponowano wiele statystyk mierzących dokład-
ność prognozy. Sprawdzają one czy poprawny model oszacowany dla mniej-
szego zbioru obserwacji jest również adekwatny dla większej ilości danych.
Inaczej mówiąc, sprawdzane jest czy prawidłowość zachodząca w mniejszej
próbie może być rozszerzona na większą próbę (całą populację). Większość
z nich dotyczy prognoz ex-post, czyli prognoz dla których wartości zmien-
nych niezależnych nie muszą być prognozowane. Znając wartość realizacji
zmiennej y możemy ocenić dokładność oszacowania za pomocą dwóch miar.
Obie bazują na resztach prognozy. Pierwsza to Mean Squared Error, czyli
estymator wariancji prognozy:
MSE =
1
n
0
X
(y
i
− ˆ
y
i
)
2
gdzie n
0
to długość okresu lub ilość obserwacji dla których obliczana jest pro-
gnoza. MSE jest sumą kwadratów różnic między wartościami rzeczywistymi
a prognozowanymi. Druga to Mean Absolute Error, czyli średni bezwzględny
błąd prognozy
MAE =
1
n
0
X
| y
i
− ˆ
y
i
|
Teoretycznie powinny one dawać zbliżone rezultaty. Jednak w praktyce ich
wartości mogą znacznie się różnić.
Przykład 1.
Dysponujemy następującym zbiorem danych:
| x
y |
| 1
1 |
| 2
2 |
| 3
4 |
| 4
5 |
| 5
5.5 |
| 6
6 |
| 7
8 |
| 8
8.5 |
| 9
9 |
| 10
10.5 |
Obejrzyjmy je na wykresie Chcemy sprawdzić dokładność prognozy. Dzie-
limy próbę na dwie części. Standardowo parametry modelu szacuje się uży-
wając od 2/3 do 80 % obserwacji. Pierwsze osiem obserwacji użyjemy do
wyznaczenia nieznanych parametrów modelu.
59
Paweł Strawiński
Notatki do ćwiczeń z ekonometrii
0
2
4
6
8
10
0
2
4
6
8
10
Zmienna objasniajaca
Zmienna y
Fitted values
Source |
SS
df
MS
Number of obs =
8
-------------+------------------------------
F(
1,
6) =
209.37
Model |
47.1488095
1
47.1488095
Prob > F
=
0.0000
Residual | 1.35119048
6
.225198413
R-squared
= 0.9721
-------------+------------------------------
Adj R-squared =
0.9675
Total |
48.5
7
6.92857143
Root MSE
=
.47455
------------------------------------------------------------------------------
y |
Coef.
Std. Err.
t
P>|t|
[95% Conf. Interval]
-------------+----------------------------------------------------------------
x |
1.059524
.0732248
14.47
0.000
.8803493
1.238698
_cons |
.2321429
.369767
0.63
0.553
-.6726443
1.13693
------------------------------------------------------------------------------
Następnie generujemy wartości dopasowane.
predict fit
I porównujemy je z rzeczywistymi realizacjami. Obliczymy błędy prognozy.
Wartości dopasowane dla 9 i 10 obserwacji wynoszą odpowiednio 9,77 oraz
10,83.
MSE =
1
2
£
(9 − 9, 77)
2
+ (10, 5 − 10, 83)
2
¤
= 0, 3509
MAE =
1
2
£
| 9 − 9, 77 | + | 10, 5 − 10, 83 |
¤
= 0, 55
Teraz pomnóżmy wartości zmiennej zależnej przez 100, ponownie oszacujmy
model i policzmy prognozy i ich błędy. Oczywiście wyniki oszacowań modelu
regresji będą prawie takie same. Jedynie wielkości parametrów będą 100 razy
większe, a całkowita suma kwadratów wzrośnie dziesięć tysięcy razy. Nowe
60
Paweł Strawiński
Notatki do ćwiczeń z ekonometrii
0
2
4
6
8
10
0
2
4
6
8
10
Zmienna objasniajaca
Rzeczywiste
Dopasowane
wartości dopasowane będą wynosi odpowiednio 977 oraz 1083. Obliczmy nowe
błędy prognoz
MSE =
1
2
£
(900 − 977)
2
+ (1050 − 1083)
2
¤
= 3509
Druga to Mean Absolute Error, czyli średni błąd prognozy
MAE =
1
2
£
| 900 − 977 | + | 1050 − 1083 |
¤
= 55
ak widać błąd średniokwadratowy wzrósł 1000 razy, podczas gdy średni błąd
bezwzględny jedynie 100 razy. Jest to ogólna zasada. Dla małych wartości
zmiennej zależnej, mniejszych od 1, błąd średniokwadratowy jest mniejszy od
błędu absolutnego. Dla dużych liczb zależność jest odwrotna. Dlatego lepszą
miarą jakości predykcji dla stosunkowo niewielkich wartości jest MAE, a dla
większych od jeden MSE.
W praktyce często zamiast błędu średniokwadratowego podaje się jego
pierwiastek RMSE.
RMSE =
r
1
n
0
X
(y
i
− ˆ
y
i
)
2
jego wartość jest w mniejszym stopniu uzależniona od wartości prognozowa-
nych niż MSE.
1.10
Testowanie stabilności parametrów. Test prognoz
Ten test służy weryfikacji hipotezy, że model prawdziwy dla pewnego zbioru
obserwacji jest również prawdziwy dla innego zbioru obserwacji dotyczących
tego samego zjawiska. Ma on dwa zastosowania
61
Paweł Strawiński
Notatki do ćwiczeń z ekonometrii
- wykrywanie zmiany strukturalnej
- sprawdzenie, czy wybrana podgrupa zachowuje się w sposób podobny
do całej populacji
Przeprowadzenie testu poprzedzamy podziałem zbioru na część estymacyjną
(E), oraz prognozy (F). Następnie szacujemy parametry modelu na podstawie
zbioru obserwacji z okresu estymacji i sprawdzamy czy one dobrze przybliżają
jego kształtowanie w okresie prognozy.
Dla okresu estymacji mamy model
y
E
= X
E
β
E
+ ε
E
Dla okresu prognozy
y
F
= X
F
β
F
+ ε
F
więc hipotezę można zapisać jako β
E
= β
F
. Aby ją zweryfikować szacuje się
parametry na podstawie połączonej próby z okresu estymacji i prognozy
y
E+F
= X
E+F
β
E+F
+ X
E+F
β
?
+ ε
E+F
i sprawdzamy, czy β
?
= 0. Można tego dokonać wykorzystując sposób testo-
wania łącznych ograniczeń. Statystyka testowa ma postać
(S
E+F
− S
E
)/g
S
E
/(N − k)
∼ F (g, N − k)
1.11
Testowanie zmiany strukturalnej. Test Chowa
Zmiana strukturalna oznacza, że niektóre lub wszystkie współczynniki re-
gresji są różne w różnych podpróbach. W celu analizy różnych możliwości
zmian parametrów modelu w skutek załamania strukturalnego wykorzysta-
my przykład. Dane pochodzą z rynku benzyny w USA z lat 1960-1995. Rynek
paliwowy był stabilny do roku 1973, a po kryzysie naftowym znacznie wzrosły
ceny oraz zwiększyły się ich wahania wokół wartości średnich. Model wygląda
następująco:
ln(G/p
c
) = β
0
+ β
1
lnI
t
+ β
2
lnP
G
+ β
3
lnP
N C
+ β
4
lnP
U C
+ β
5
t + ε
t
(1)
gdzie:
G/p
c
konsumpcja benzyny na jednego mieszkańca
I
t
dochód do dyspozycji na osobę
P
G
cena benzyny
P
N C
cena nowych samochodów
62
Paweł Strawiński
Notatki do ćwiczeń z ekonometrii
P
U C
cena używanych samochodów
t czas
Ponieważ równanie (1) ma postać log-liniową, jego współczynniki są ela-
stycznościami popytu na benzynę względem odpowiednio: konsumpcji ben-
zyny, dochodu do dyspozycji, ceny benzyny, ceny nowych samochodów, ceny
używanych samochodów i czasu.
Załóżmy, że chcemy oszacować przeciętną wielkość inflacji w okresie 1960-
1995. Ponieważ benzyna jest dobrem pośrednim używanym w procesie wy-
twarzania wielu towarów i usług jej cena w znacznym stopniu wpływa na
poziom inflacji, szczególnie w krajach wysoko rozwiniętych. W celu oszaco-
wania przeciętnej inflacji użyjemy naiwnego modelu
P
G
= β
0
+ β
1
t + ε
t
czyli będziemy tłumaczyć cenę benzyny trendem liniowym.
0
1
2
3
4
1960
1970
1980
1990
2000
rok
1
2
3
4
1960
1970
1980
1990
2000
rok
Rozpocznijmy od analizy graficznej. Na lewym rysunku mamy przedsta-
wione oszacowanie inflacji dokonane na całej próbie 36 obserwacji. Na pra-
wym w rozbiciu na dwie podpróby - okres przed szokiem naftowym i po nim.
Jak wyraźnie widać model, w którym szacowane są wspólne parametry dla
całego okresu jest gorzej dopasowany do danych.
. reg Pg year
Source |
SS
df
MS
Number of obs =
36
----------+------------------------------
F(
1,
34) =
160.10
Model |
45.2332456
1
45.2332456
Prob > F
=
0.0000
Residual |
9.60614026
34
.282533537
R-squared
=
0.8248
----------+------------------------------
Adj R-squared =
0.8197
Total |
54.8393858
35
1.56683959
Root MSE
=
.53154
---------------------------------------------------------------------------
63
Paweł Strawiński
Notatki do ćwiczeń z ekonometrii
Pg |
Coef.
Std. Err.
t
P>|t|
[95% Conf. Interval]
----------+----------------------------------------------------------------
year |
.107903
.0085278
12.65
0.000
.0905723
.1252336
_cons |
-211.0615
16.86405
-12.52
0.000
-245.3334
-176.7896
---------------------------------------------------------------------------
Przeciętnie w całym okresie ceny rosły w tempie 10 %.
. reg Pg year if year<=1973
Source |
SS
df
MS
Number of obs =
14
----------+------------------------------
F(
1,
12) =
89.74
Model |
.075011693
1
.075011693
Prob > F
=
0.0000
Residual |
.01003002
12
.000835835
R-squared
=
0.8821
----------+------------------------------
Adj R-squared =
0.8722
Total |
.085041713
13
.00654167
Root MSE
=
.02891
---------------------------------------------------------------------------
Pg |
Coef.
Std. Err.
t
P>|t|
[95% Conf. Interval]
----------+----------------------------------------------------------------
year |
.0181582
.0019168
9.47
0.000
.013982
.0223345
_cons |
-34.71204
3.769332
-9.21
0.000
-42.92471
-26.49937
---------------------------------------------------------------------------
Przed szokiem naftowym cena benzyny rosła przeciętnie o 1 % rocznie.
. reg Pg year if year>1973
Source |
SS
df
MS
Number of obs =
22
----------+------------------------------
F(
1,
20) =
21.38
Model |
7.65171653
1
7.65171653
Prob > F
=
0.0002
Residual |
7.15750201
20
.357875101
R-squared
=
0.5167
----------+------------------------------
Adj R-squared =
0.4925
Total |
14.8092185
21
.705200883
Root MSE
=
.59823
---------------------------------------------------------------------------
Pg |
Coef.
Std. Err.
t
P>|t|
[95% Conf. Interval]
----------+----------------------------------------------------------------
year |
.0929577
.0201035
4.62
0.000
.0510225
.1348928
_cons |
-181.3176
39.89558
-4.54
0.000
-264.5383
-98.09683
---------------------------------------------------------------------------
Po szoku naftowym zanotowano przeciętny 9 % wzrost cen.
Rozbijając próbę na dwie części pozwoliliśmy by zarówno stała jak i na-
chylenie prostej regresji uległo zmianie. W rzeczywistości może zachodzić
jeden z dwóch prostszych przypadków. Jeżeli w skutek szoku zmienia się wy-
łącznie stała a nachylenie pozostaje bez zmian to linia wartości dopasowanych
64
Paweł Strawiński
Notatki do ćwiczeń z ekonometrii
w punkcie szoku zostanie równolegle przesunięta (lewy rysunek). Jeżeli zmie-
nia się wyłącznie nachylenie, to linia wartości dopasowanych będzie załamana
w punkcie szoku (prawy rysunek).
−2
0
2
4
6
8
1960
1970
1980
1990
2000
rok
−5
0
5
10
15
1960
1970
1980
1990
2000
rok
Dokonajmy teraz formalnego wyprowadzenia modeli dla obu przypad-
ków. Cała próba zawiera 36 obserwacji, z czego 14 z lat 1960-1973 pochodzi
sprzed szoku naftowego, a 22 z lat 1974-1995 dotyczy okresu po szoku nafto-
wym. Można więc postawić hipotezę, że mamy doczynienia z dwoma różnymi
regresjami. Wobec tego dekomponujemy y, X, oraz β na:
y =
µ
y
1
y
2
¶
X =
·
X
1
X
2
¸
β =
µ
β
1
β
2
¶
gdzie y
1
oraz X
1
oznacza pierwsze 14 obserwacji, a y
2
oraz X
2
zawierają
pozostałą część próby. Całe równanie możemy zapisać jako:
µ
y
1
y
2
¶
=
·
X
1
0
0
X
2
¸ µ
β
1
β
2
¶
+
µ
ε
1
ε
2
¶
Równanie regresji bez ograniczeń pozwala na to by współczynniki były
różne w obu okresach. Nieograniczonym estymatorem metody najmniejszych
kwadratów jest:
b = (X
0
X)
−1
X
0
y
=
·
X
0
1
X
1
0
0
X
0
2
X
2
¸
−1
µ
X
0
1
y
1
X
0
2
y
2
¶
=
µ
b
1
b
2
¶
który jest równy estymatorom otrzymanym z dwóch mniejszych modeli. Więc
całkowita suma kwadratów reszt z powyższej regresji jest równa sumie dwóch
sum kwadratów reszt z oddzielnych regresji:
e
0
e = e
0
1
e
1
+ e
0
2
e
2
65
Paweł Strawiński
Notatki do ćwiczeń z ekonometrii
Wektor współczynników dla modelu z ograniczeniami można otrzymać dwo-
ma sposobami. Formalnie testujemy ograniczenie β
1
= β
2
można zapisać jako
Rβ = q gdzie R = [I : −I] oraz q = 0.
Znacznie prostszym sposobem jest bezpośrednie narzucenie ograniczenia
i oszacowanie jednego modelu na całej próbie.
µ
y
1
y
2
¶
=
·
X
1
0
0
X
2
¸
β +
µ
ε
1
ε
2
¶
Wtedy różnica między resztową sumą kwadratów modelu e
0
R
e
R
a całko-
witą sumą kwadratów reszt podzielona przez ilość ograniczeń (J), czyli liczbę
kolumn macierzy X
2
. stanowi licznik statystyki F . W mianowniku jest cał-
kowita suma kwadratów reszt modelu podzielona przez (N
1
+ N
2
− 2k) czyli
liczbę obserwacji minus liczba estymowanych parametrów. Statystyka testo-
wa F ma rozkład F z J oraz (N
1
+ N
2
− 2k) stopniami swobody.
Inna możliwością zmiany po szoku naftowym jest, że amerykanie propor-
cjonalnie zmniejszyli swoją konsumpcję, ale pozostałe charakterystyki rynku
takie jak elastyczność dochodowa pozostały na takim samym poziomie. Ta-
ka zmiana przesunie w dół prostą regresji pozostawiając jej współczynniki
nachylenia względem poszczególnych osi układu współrzędnych bez zmian.
Wobec tego równanie bez ograniczeń ma oddzielne współczynniki dla obu
okresów, a równania z ograniczeniami jest pojedynczą regresją. Macierze re-
gresorów przybierają następujące formy:
(unrestricted) : X
U
=
·
i 0 W
pre73
0
0 i
0
W
post73
¸
(restricted) : X
R
=
·
i 0 W
pre73
0 i W
post73
¸
Dwie pierwsze kolumny macierzy X zawierają zmienne zero-jedynkowe
wskazujące na okres z którego pochodzą obserwacje. Macierz W
pre73
zawiera
zmienne objaśniające dla 1 cześci próby,a macierz W
post73
dla drugiej części.
Po oszacowaniu dwóch regresji możemy policzyć statystykę F:
F
J
K
=
(e
0
R
e
R
− e
0
1
e
1
− e
0
2
e
2
)/J
(e
0
1
e
1
+ e
0
2
e
2
)/n − k
gdzie zarówno wektor reszt e
1
jak i wektor reszt e
2
są szacowane z modelu
regresji bez ograniczeń. Hipotezą zerową tego testu mówi, że obydwie regresje
różnią się stałą, ale mają te same współczynniki. Testujemy ją przeciwko
alternatywie, że zarówno stałe, jak i współczynniki w obu regresjach są różne.
Kolejną możliwością jest, że tylko niektóre współczynniki wektora para-
metrów β się zmieniły, a pozostałe parametry nie uległy zmianie. Test Chowa
66
Paweł Strawiński
Notatki do ćwiczeń z ekonometrii
dla tego przypadku wygląda podobnie do testu na zmianę stałej. Niech Z
będzie macierzą zmiennych przy których zmieniają się współczynniki, a W
macierzą zmiennych, których współczynniki się nie zmieniają. Wtedy macierz
regresorów X przyjmie następującą postać:
(unrestricted) : X =
·
i
pre
Z
pre
0
0
W
pre
0
0
i
post
Z
post
W
post
¸
Test przeprowadza się w sposób analogiczny do poprzednich.
Przykład 1.
Oszacowano metodą MNK następujący model:
c
i
= β
0
+ β
1
y
i
+ β
2
p
i
+ ²
gdzie: c
i
jest logarytmem nominalnych wydatków konsumpcyjnych gospo-
darstwa domowego, y
i
jest logarytmem jesgo nominalnego dochodu, a p
i
logarytmemt indeksu cen żywności. Otrzymano następujące wyniki dla 66
obserwacji:
Zmienna Współczynnik Błąd standardowy
stała
6.0
4.0
y
5.0
2.0
p
2.0
1.0
RSS=256, oraz macierz wariancji-kowariancji estymatorów:
16 3 5
3
4 5
5
5 1
a) Oblicz prognozę dla c
t+1
jeżeli y
t+1
= 2, a p
t+1
= 3
b) Oblicz wariancję tej prognozy.
Rozwiązanie
ad a) c
0
t+1
= b
0
+ b
1
y
t+1
+ b
2
p
t+1
= 6 + 5 ∗ 2 + 2 ∗ 3 = 22
ad b) nieobciążony estymator wariancji jest równy:
S
2
=
RSS
T − k
=
256
64
= 4
var(c
0
t+1
) = x
0
t+1
var(b)x
t+1
= [1 2 3]
16 3 5
3
4 5
5
5 1
1
2
3
+ 4 = 147
67
Paweł Strawiński
Notatki do ćwiczeń z ekonometrii
Literatura
[1] William H. Greene (2003) Econometric Analysis, 5th edition.
68