Temat 5 II stopien Kointegracja1


Autor opracowania: Marek Walesiak
5. KOINTEGRACJA
5.1. Pojęcie stacjonarności i niestacjonarności zmiennych
5.2. Szeregi zintegrowane i testowanie stopnia integracji
5.3. Modele regresji liniowej dla szeregów czasowych stacjonarnych
5.4. Modele regresji liniowej dla szeregów czasowych niestacjonarnych z kointegracją
5.5. Modele regresji liniowej dla szeregów czasowych niestacjonarnych bez kointegracji
1
Autor opracowania: Marek Walesiak
5.1. Pojęcie stacjonarności i niestacjonarności zmiennych
Procesem stochastycznym (zob. Osińska [2006], s. 48)  nazywamy funkcję losową zmiennych
losowych X oraz nielosowego argumentu t . Procesy stochastyczne oznacza się Xt , Yt lub
X (t), Y(t).
Proces stochastyczny jest stacjonarny, gdy:
a) E(Xt ) = const
b) var(Xt ) = const
c) cov(Xt , Xt+ j ) = s
j
Średnie i wariancje procesu są stałe w czasie, a kowariancja dla dwóch momentów obserwacji
zależy jedynie od odstępu między nimi (jest niezależna od czasu).
Jeśli nie jest spełniony jeden lub więcej podanych warunków, to proces jest niestacjonarny.
2
Autor opracowania: Marek Walesiak
Rys. 6.1. Proces stochastyczny o stacjonarnej średniej i wariancji
(nic nie można powiedzieć o kowariancji, ponieważ nie można jej pokazać na rysunku)
yródło: Charemza i Deadman [1997], s. 105.
3
Autor opracowania: Marek Walesiak
Rys. 6.2. Proces stochastyczny o niestacjonarnej średniej
yródło: Charemza i Deadman [1997], s. 104.
Średnia procesu na rysunku jest rosnącą funkcją czasu (proces stochastyczny może być niesta-
cjonarny).
4
Autor opracowania: Marek Walesiak
Szereg czasowy obserwacji zmiennej ekonomicznej traktujemy jako część realizacji procesu sto-
chastycznego i oznaczamy xt , yt .
Szereg czasowy jest więc de facto pojedynczą realizacją procesu stochastycznego.
Rys. 6.3. Pojedyncza realizacja procesu stochastycznego
yródło: Charemza i Deadman [1997], s. 107.
5
Autor opracowania: Marek Walesiak
Statystyczne własności analizy regresji otrzymane dla niestacjonarnych szeregów czasowych są
na ogół wątpliwe.
Regresje te dając pozornie dobre wyniki uniemożliwiają stwierdzenie, czy związki ekonomiczne
wynikające z teorii są poparte, czy też nie, wynikami empirycznymi (zob. Charemza i Deadman
[1997], s. 110).
Przykład 1. Typowe dla zmiennych makroekonomicznych jest występowanie trendu wzrostowe-
go. Wartości oczekiwane tych zmiennych są zmienne w czasie (zmienne takie są więc niestacjonar-
ne).
Np. estymacja modelu liniowego jednej zmiennej objaśniającej może spowodować wystąpienie
tzw. regresji pozornej (spurious regression), ponieważ obie zmienne (objaśniana i objaśniająca)
podlegają trendowi wzrostowemu. Model wydaje się dobry (na co wskazują wyniki weryfikacji).
Jednak tylko pozornie. Jakość prognoz na podstawie takiego modelu jest kiepska  zmienne  odda-
lają się (trendy są rozbieżne).
6
Autor opracowania: Marek Walesiak
Przykład 2 (zob. Charemza i Deadman [1997], s. 108).
Regresja trendu liniowego względem trendu kwadratowego.
Zmienna objaśniana yt przyjmuje wartości od 1 do 30, a zmienna objaśniająca xt kwadraty ob-
serwacji na zmiennej objaśnianej. Wyniki estymacji: yt = 5,928+ 0,030 xt
(9,881) (21,224)
R2 = 0,9415; W = 0,8982 ( p - value = 0,00761)
GQ = 0,1271 ( p - value = 0,9997); DW = 0,0577 ( p - value = 0)
Statystyczne wyniki estymacji są zadawalające, jeśli chodzi o istotność parametrów (w nawia-
sach pod ocenami podano wartość statystyki t-Studenta), dopasowanie modelu i homoskedastycz-
ność (test Goldfelda-Quandta GQ) składnika losowego (a = 0,05 Ł p - value).
Niska wartość statystyki Durbina-Watsona DW = 0,0577 < R2 = 0,9415 (występowanie autoko-
relacji pierwszego stopnia) i brak normalności rozkładu składnika losowego są wskazówkami, że
coś jest nie w porządku z tym modelem.
Jakość prognoz na podstawie takiego modelu jest kiepska  zmienne  oddalają się (trendy są
rozbieżne)  zob. rys. 6.4.
7
Autor opracowania: Marek Walesiak
0 200 400 600 800
x
Rys. 6.4. Regresja trendu liniowego względem kwadratowego
8
30
25
20
y
15
10
5
0
Autor opracowania: Marek Walesiak
Szeregi czasowe charakteryzujące się trendem (szeregi niestacjonarne) stanowią poważny pro-
blem dla ekonometrii empirycznej. Mogą prowadzić do:
 pozornych regresji (spurious regression),
 nieinterpretowalnych wartości statystyk t-Studenta oraz innych statystyk (miar dobroci dopa-
sowania),
 utrudnienia oceny otrzymanych wyników.
9
Autor opracowania: Marek Walesiak
5.2. Szeregi zintegrowane i testowanie stopnia integracji
Dla przeprowadzenia jakiejkolwiek sensownej analizy regresji konieczne jest zbadanie stopnia
integracji każdej zmiennej (pod warunkiem, że zmienną niestacjonarną można przekształcić w
zmienną stacjonarną za pomocą obliczania przyrostów).
Rozróżnia się modele regresji liniowej dla szeregów czasowych (zob. Koop G. [2008], rozdz.
7):
a) stacjonarnych (wszystkie szeregi czasowe, tzn. dla zmiennej objaśnianej i objaśniających są
stacjonarne). Posługujemy się tutaj modelami autoregresyjnymi z rozłożonymi opóznieniami (mode-
le ADL);
b) niestacjonarnych, ale odchylenia losowe od ścieżki długookresowej są stacjonarne (występuje
kointegracja). Stosuje się tutaj modelowanie skointegrowanych szeregów czasowych przy zastoso-
waniu mechanizmu ECM;
c) niestacjonarnych, ale nie występuje kointegracja. Posługujemy się tutaj przekształconymi mo-
delami autoregresyjnymi z rozłożonymi opóznieniami (przekształcone modele ADL zawierające
odpowiednie przyrosty zmiennych, które są stacjonarne).
10
Autor opracowania: Marek Walesiak
Szereg zintegrowany yt stopnia d (oznaczany symbolem: yt ~ I(d))  jest to szereg niestacjo-
narny, który można sprowadzić do szeregu stacjonarnego, obliczając przyrosty d razy.
Np. yt ~ I(2) oznacza, że pierwsze przyrosty pierwszych przyrostów są stacjonarne.
Jeśli szereg jest stacjonarny yt ~ I(0), to nie zachodzi potrzeba liczenia przyrostów.
11
Autor opracowania: Marek Walesiak
Testowanie stopnia integracji  testy pierwiastka jednostkowego
A. Test DF Dickeya-Fullera
H0: w równaniu autoregresji yt = ryt-1 + et r =1 (tzw. test jednostkowego pierwiastka; zmienna yt
jest niestacjonarna)
H1: zmienna yt jest stacjonarna ( r <1)
W teście DF metodą najmniejszych kwadratów należy oszacować równanie: Dyt = m + dyt-1 + et
(m  wyraz wolny). Zatem hipotezy są następujące:
H0: d = 0 yt ~ I(1). Szereg yt jest zintegrowany co najmniej rzędu 1
H1: d < 0 yt ~ I(0). Szereg yt jest stacjonarny
dĆj
Statystyka testu DF jest obliczana analogicznie jak statystyka t-Studenta ( DF = ). Ma jed-
S(dĆj )
nak rozkład lewostronnie asymetryczny. Nie wolno więc stosować tablic rozkładu t-Studenta.
Tablice wartości krytycznych testu Dickeya-Fullera znajdują się m.in. w książce Charemzy i De-
admana [1997] oraz Osińskiej [2006], s. 71.
12
Autor opracowania: Marek Walesiak
Kryteria decyzyjne (zob. Osińska [2006], s. 70):
a) DF Ł DF0 (dolna wartość krytyczna)  H0 odrzucamy na rzecz H1, co oznacza, że zmienna
yt jest stacjonarna yt ~ I(0). Szereg yt jest zintegrowany rzędu 0;
b) DF > DF0  nie ma podstaw do odrzucenia H0, co oznacza, szereg yt jest zintegrowany co
najmniej rzędu 1. Zmienna yt jest niestacjonarna.
Następny krok polega na testowaniu czy stopień integracji jest równy jeden. W teście DF MNK
należy oszacować teraz równanie: DDyt = m + dDyt-1 + et . Odpowiednie hipotezy mają postać:
H0: d = 0 yt ~ I(2). Szereg jest zintegrowany co najmniej rzędu 2,
H1: d < 0 yt ~ I(1). Szereg yt jest zintegrowany rzędu 1.
Proces testowania kontynuuje się do momentu stwierdzenia stopnia integracji lub do stwierdze-
nia, że zmiennej yt nie można sprowadzić do szeregu stacjonarnego.
13
Autor opracowania: Marek Walesiak
B. Test ADF (Augmented Dickey-Fuller test)
Test DF ma niską moc i jest wrażliwy na odstępstwa od założeń dotyczących składnika losowe-
go.
Jeśli składnik losowy równania Dyt = m + dyt-1 + et wykazuje autokorelację można uzupełnić
równanie regresji o dodatkowe składniki powodujące eliminację autokorelacji. W teście ADF szacu-
jemy więc MNK regresję postaci:
k
Dyt = m + dyt-1 +
d Dyt-i + et
i
i=1
Liczba opóznień k powinna być dostatecznie mała dla zachowania liczby stopni swobody i na ty-
le duża, aby uwzględnić występowanie autokorelacji.
Procedura testu ADF jest taka sama jak testu DF.
14
Autor opracowania: Marek Walesiak
5.3. Modele regresji liniowej dla szeregów czasowych stacjonarnych
Przy założeniu, że zmienna objaśniana Y i zmienne objaśniające X1,K, Xm są stacjonarne budu-
jemy dla szeregów czasowych tych zmiennych model ADL( p, q, K).
Uogólniony model ADL( p, q, K) oznacza model o p (q) opóznieniach dla zmiennej objaśnianej
(objaśniającej) i K zmiennych objaśniających:
p q
r m
yt =
a ts +b yt-i + c xjt-i + et ,
s i ij
s=0 i=1 j=1 i=0
gdzie: s  stopień wielomianu zmiennej czasowej,
r
a ts  trend,
s
s=0
p(q)  rząd opóznień zmiennej objaśnianej yt (objaśniającej xjt ),
j =1,K,m  numer zmiennej objaśniającej,
as,bi,cij  parametry strukturalne, t  czas.
15
Autor opracowania: Marek Walesiak
W budowie uogólnionego modelu ADL( p, q, K) należy ustalić parametry:
 s  stopień wielomianu zmiennej czasowej,
 p  rząd opóznień zmiennej objaśnianej yt ,
 q  rząd opóznień zmiennych objaśniających xjt .
Można wykorzystać w tym względzie procedurę sekwencyjną bazującą na procedurze mode-
lowania od  ogólnego do szczególnego zaproponowaną przez Hendry ego (zob. np. Koop [2008],
s. 189). Kryterium eliminacji może być wartość statystyki t Studenta (w każdym kroku eliminujemy
maksymalny rząd opóznień lub maksymalny stopień wielomianu, gdy odpowiedni parametr nie-
istotnie różni się od zera).
Kwestią otwartą pozostaje kolejność wyboru parametrów s, p i q (nie ma w tym względzie
żadnej konwencji). Mam w tym względzie 3!= 6 możliwości (np. ustalamy w kolejności s, p, q
lub p, q , s).
Inny sposób polega na zastosowaniu do wyboru parametrów s, p i q statystycznych kryteriów
wyboru między modelami regresji (np. kryteriów informacyjnych AIC, BIC).
16
Autor opracowania: Marek Walesiak
Dla s = 1 i jednej zmiennej objaśniającej model ADL( p, q) przyjmuje postać:
yt = a0 + a1t + b1yt-1 +L+ bp yt- p + c0xt + c1xt-1 +L+ cqxt-q + et
Najprostszy model autoregresyjny (dla s = 0) z rozłożonymi opóznieniami ADL(1,1,1) ma tylko
jedną zmienną objaśniającą i jednookresowe opóznienia (oznaczany jest zwykle jako ADL(1, 1)):
yt = a0 + b1yt-1 + c0xt + c1xt-1 + et
17
Autor opracowania: Marek Walesiak
5.4. Modele regresji liniowej dla szeregów czasowych niestacjonarnych z kointegracją
Z uwagi na to, że w ekonomii większość szeregów czasowych podlega pewnym rodzajom trendu
zaproponowano obliczanie dla zmiennych kolejnych przyrostów szeregów, aż do momentu
otrzymania szeregów stacjonarnych.
Nie jest to jednak rozwiązanie idealne. Zastosowanie przyrostów dla zmiennych w analizie re-
gresji może prowadzić do utraty własności długookresowych (model regresji dla przyrostów może
nie mieć rozwiązania długookresowego).
Potrzeba otrzymania modelu, który łączy w sobie własności krótko- i długookresowe i dla które-
go zachowana jest jednocześnie stacjonarność doprowadziła do ponownego rozważenia problemu
regresji z wykorzystaniem pierwotnych wartości zmiennych, a nie ich przyrostów.
18
Autor opracowania: Marek Walesiak
Wnioski dla rys. 6.5:
 zmienne xt i yt podlegają
trendom dodatnim (są więc nie-
stacjonarne),
 zmienne xt i yt nie mają te-
go samego stopnia integracji,
 zmienne te oddalają się od
siebie, więc różnica zmiennych
xt i yt jest niestacjonarna.
Rys. 6.5. Dwa rozbieżne szeregi
yródło: Charemza i Deadman [1997], s. 123.
19
Autor opracowania: Marek Walesiak
Wnioski dla rys. 6.6:
 zmienne xt i yt podlegają
trendom dodatnim (są więc nie-
stacjonarne),
 zmienne xt i yt mają praw-
dopodobnie ten sam stopień inte-
gracji,
 zmienne te zmieniają się w
podobny sposób, więc różnica
zmiennych xt i yt jest prawdopo-
dobnie stacjonarna,
 rys. ten jest ilustracją poję-
Rys. 6.6. Dwa szeregi dryfujące razem
cia kointegracji.
yródło: Charemza i Deadman [1997], s. 123.
20
Autor opracowania: Marek Walesiak
Idea kointegracji
Istnieje długookresowy związek między dwiema (lub większą liczbą) niestacjonarnych zmien-
nych, dla którego odchylenia losowe od ścieżki długookresowej są stacjonarne.
W relacji długookresowej między dwiema zmiennymi ( yt i xt ) obie muszą być zintegrowane te-
go samego stopnia, jeśli składnik losowy ma być ut ~ I(0).
Problem jest bardziej skomplikowany dla większej liczby zmiennych objaśniających (Charemza i
Deadman [1997], s. 127):
 stopień integracji zmiennej zależnej nie może być wyższy niż stopień integracji którejkolwiek
ze zmiennych objaśniających,
 ponadto liczba zmiennych objaśniających o stopniu integracji wyższym niż dla zmiennej za-
leżnej powinna być równa zeru lub co najmniej równa dwa.
21
Autor opracowania: Marek Walesiak
Pierwsza, najprostsza metoda testowania kointegracji, została zaproponowana przez Engle a i
Grangera:
1. Oszacować metodą najmniejszych kwadratów równanie regresji:
yt = b0 + b1x1t +K+ bmxmt + ut
22
Autor opracowania: Marek Walesiak
2. Do reszt ut tej regresji zastosować test:
a) DF przyjmując równanie Dut = m + dut-1 + et
k
b) ADF przyjmując równanie Dut = m + dut-1 +
d Dut-i + et
i
i=1
Ć Ć
H0: reszty ut są niestacjonarne. Wektor [1,-b1,K,-bm ] otrzymany na podstawie ocen parame-
trów regresji nie jest wektorem kointegrującym dla zmiennych yt , x1t ,K, xmt.
Ć Ć
H1: reszty ut są stacjonarne (ut ~ I(0)). Wektor [1,-b1,K,-bm ] otrzymany na podstawie ocen pa-
rametrów regresji jest wektorem kointegrującym dla zmiennych yt , x1t ,K, xmt.
Zasady wnioskowania są podobne do testowania stopnia integracji. Przy odczytywaniu wartości
krytycznych należy wziąć pod uwagę jeszcze liczbę składowych wektora kointegrującego (liczba
szacowanych parametrów modelu).
23
Autor opracowania: Marek Walesiak
Modelowanie skointegrowanych szeregów czasowych
przy zastosowaniu mechanizmu ECM
ECM  Error Correction Mechanism (mechanizm korekty błędów).
Model skointegrowanych szeregów czasowych składa się z dwóch równań (zob. Osińska [2006],
s. 188):
a) równania długookresowego o postaci:
yt = b0 + b1x1t +K+ bmxmt + ut
b) równania krótkookresowego bazującego na przyrostach badanych szeregów (z uwzględnie-
niem mechanizmu korekty błędów  ECM).
24
Autor opracowania: Marek Walesiak
Przykład
Niech dla szeregów czasowych yt ~ I(1) i xt ~ I(1) występuje kointegracja yt , xt ~ CI(1). Zatem
ut ~ I(0).
Stosujemy w budowie modelu procedurę dwustopniową Engle a Grangera:
a) szacujemy MNK równanie kointegrujące (długookresowe):
yt = b0 + b1x1t + ut
W tym przypadku wprawdzie obie zmienne yt , xt są niestacjonarne, ale występuje między nimi
regresja kointegrująca. Odchylenia losowe są stacjonarne: ut ~ I(0). Regresja ta nie jest więc po-
zorna.
25
Autor opracowania: Marek Walesiak
b) budujemy i estymujemy MNK równanie krótkookresowe bazujące na przyrostach badanych
szeregów (z uwzględnieniem mechanizmu korekty błędów  ECM):
Dyt = b0 + b1Dxt + b2ut-1 +ht ,
gdzie: ut-1 = ECMt-1 = (y - b0 - b1x1)t-1
Mechanizm korekty błędu ECM reprezentuje relację długookresową. Znak parametru b2 musi
być ujemny, gdyż tylko taka relacja zapewnia dochodzenie do poziomu równowagi krótkookreso-
wej.
Parametr b1 informuje o dostosowaniach krótkookresowych w czasie t do stanu równowagi w
czasie t -1.
Jeśli w modelu występuje autokorelacja to równanie krótkookresowe jest następujące:
p q
Dyt = b0 + b1Dxt + b2ut-1 +
b Dyt-i + c Dxt-i + et
i i
i=1 i=1
26
Autor opracowania: Marek Walesiak
5.5. Modele regresji liniowej dla szeregów czasowych niestacjonarnych bez kointegracji
Jeśli zmienna objaśniana Y lub zmienne objaśniające X1,K, Xm są niestacjonarne, a ponadto w
modelu nie występuje kointegracja budujemy przekształcone modele autoregresyjne z rozłożonymi
opóznieniami (przekształcone modele ADL zawierające odpowiednie przyrosty zmiennych, które są
stacjonarne).
Jeśli np. zmienna objaśniana Y i zmienna objaśniająca X są niestacjonarne, ale ich pierwsze
przyrosty są stacjonarne budujemy przekształcony model ADL( p, q).
Dla s = 1 i jednej zmiennej objaśniającej przekształcony model ADL( p, q) przyjmuje postać:
Dyt = a0 + a1t + b1Dyt-1 + L + bp-1Dyt- p+1
+ c0Dxt + c1Dxt-1 + L + cq-1Dxt-q+1 + et
27


Wyszukiwarka

Podobne podstrony:
Temat 4 II stopien Klasyczny model regresji liniowej1
Temat II
Pytania z zakresu kierunku FiR II stopien (1)
2379 MU,II,stopien,I,semestr
BADANIE INST NN 2012 dzienne II stopień
INF II stopien Projektowanie i zarzadzanie projektami informatycznymi
Obliczenia geometryczne II stopien
Obliczenia geometryczne II stopien
INF II stopien Internet w zarzadzaniu
Pedagogika zagadnienia na egzamin dyplomowy II stopie
klucz do testu II Stopień
INFORMATOR Studia Niestacjonarne I i II stopien MECHANIKA i BUDOWA MASZYN 10 11
F II temat 01
Przykładowy zest temat egza Mat II
F II temat 01
AutoCAD stopień II
Alchemia II Rozdział 8

więcej podobnych podstron