Dynamiczne Modele Ekonometryczne
V Ogólnopolskie Seminarium Naukowe, 9-11 września 1997 w Toruniu
Katedra Ekonometrii i Statystyki, Uniwersytet Mikołaja Kopernika w Toruniu
Mariola Piłatowska
Uniwersytet Mikołaja Kopernika
Alternatywne metody eliminacji trendu a interpretacja modelu ekonometrycznego
1. Wprowadzenie
Badając procesy ekonomiczne na podstawie szeregów czasowych wyróżnia się zazwyczaj składnik trendu. Jednak pojęcie trendu można rozumieć dwojako, tzn. jako trend deterministyczny i trend stochastyczny. Rozstrzygnięcie, którą
z dwóch koncepcji trendu, należy przyjąć, dotyczy zagadnienia identyfikacji modelu generującego dane. Jednocześnie przyjęcie określonej postaci trendu
i uwzględnienie tego przy budowie modelu ekonometrycznego jest równoznaczne z eliminacją trendu ze wszystkich badanych procesów ekonomicznych i rozpatrywaniem zależności między nimi na poziomie procesów stacjonarnych. W związku z tym należy rozstrzygnąć jaki jest wpływ wyboru postaci modelu trendu na specyfikację modelu ekonometrycznego, jakość modelu, w tym na interpretację parametrów modeli ekonometrycznych.
Celem artykułu jest przedstawienie możliwości odróżniania dwóch alternatywnych modeli, a z drugiej strony oceny wpływu metody eliminacji trendu na specyfikację i jednocześnie na interpretację parametrów modelu ekonometrycznego.
2. Pojęcie trendu
Trend procesu ekonomicznego należy odnosić do dwóch charakterystyk procesu: do średniej i wariancji. W pierwszym przypadku mówimy o trendzie deterministycznym, w drugim - o trendzie stochastycznym.
Przez trend deterministyczny rozumie się pewną nielosową funkcję zmiennej czasowej t, która opisuje zmienność w czasie wartości średniej procesu.
W przebiegu tej funkcji podkreśla się jej gładki i spokojny przebieg, ponieważ zmiany w wartości średniej kojarzy się ze zmianami długookresowymi, a tym przypisuje się spokojny przebieg.
Często do opisu trendu deterministycznego wykorzystuje się wielomianową funkcję zmiennej czasowej t, wtedy stochastyczny proces ekonomiczny zawierający trend deterministyczny ma postać:
(1)
gdzie: oznacza wielomian r-tego stopnia zmiennej czasowej t, jest stacjonarnym procesem o średniej zero oraz stałej i skończonej wariancji.
W ogólnym przypadku zmienność wartości średniej procesu może być opisana różnymi funkcjami należącymi do określonej rodziny funkcji (np. rodzina funkcji wykładniczych, logarytmicznych, potęgowych, logistycznych), takich że wartości szeregu czasowego będą się różnić od każdej z tej funkcji w sposób losowy.
W przedziale skończonym trend w wartości średniej nazywa się trendem lokalnym, co jest równoznaczne z traktowaniem procesu jako realizacji stacjonarnego w szerszym sensie procesu, czyli o stałej średniej i wariancji oraz funkcji kowariancyjnej zależnej tylko od odstępu . Wydaje się jednak, że istnieje wiele takich makroekonomicznych procesów ekonomicznych, dla których obserwuje się zmiany wartości średniej o charakterze `kumulatywnym
i nieodwracalnym' dotyczące znacznie dłuższych okresów niż na ogół przyjmowane długości prób. Przykładem takiego procesu jest np. wydajność z hektara w rolnictwie w krajach rozwiniętych charakteryzuje się wzrostem wartości średniej w ciągu ostatnich kilkudziesięciu lat.
Trend stochastyczny mają procesy ekonomiczne, które są zintegrowane, czyli posiadają pierwiastek jednostkowy w swojej autoregresyjnej strukturze.
Ogólnie zintegrowany proces można przedstawić jako proces ARIMA(p,r,q)
o postaci
(2)
natomiast zintegrowany proces rzędu pierwszego, czyli ARIMA(p,1,q), można zapisać następująco:
(3)
gdzie: i są stałymi parametrami i jest niezautokorelowanym procesem.
Zintegrowany proces charakteryzuje się stałą wartością średnią oraz wariancją zmierzającą do nieskończoności wraz z t. Szczególnym przypadkiem procesu zintegrowanego jest proces błądzenia przypadkowego, który ma postać
(4)
gdzie jest białym szumem.
Przyjęcie jednego z dwóch modeli trendu ma określone znaczenie z punktu widzenia ekonomicznego.
W teorii ekonomicznej wahań cyklicznych panuje przeważający pogląd, że zakłócenia losowe widoczne w przebiegu procesów ekonomicznych mają przejściowy charakter, tzn. proces powraca po pewnym czasie na linię trendu. Proces taki cechuje się stacjonarnymi wahaniami wokół deterministycznego trendu. Założenie to oznacza, że spadek wartości procesu poniżej linii trendu
w danym okresie nie ma wpływu na prognozy poziomu wartości procesu
w dalekiej przyszłości, wartości procesu muszą wzrastać powyżej swojej historycznej średniej przez kilka następnych okresów do momentu ustalenia na nowo linii trendu.
Natomiast założenie, że proces jest zintegrowany czy w szczególnym przypadku błądzenia przypadkowego (random walk) oznacza, że zakłócenia w przebiegu procesu ekonomicznego mają trwały efekt na system, tzn. nie obserwuje się tendencji powracania procesu do linii trendu w długim okresie; np. spadek wartości zmiennej ekonomicznej w danym okresie obniża wartości prognoz
w nieskończonej przyszłości.
Z drugiej strony na wybór postaci modelu trendu można spojrzeć od strony metod filtracji szeregów.
Przyjęcie modelu trendu stochastycznego (np. zintegrowanego rzędu pierwszego) równoznaczne jest z wyeliminowaniem niestacjonarności poprzez obliczenie pierwszych różnic. Zastosowanie filtru różnicowego ma jednak określone konsekwencje. Filtr ten eliminuje szerokie pasmo nie tylko niskich, ale i wyższych częstości. Nie jest on filtrem symetrycznym, tzn. jego stosowanie zmienia przesunięcia fazowe składowych szeregu przefiltrowanego w stosunku do szeregu oryginalnego. Dodatkowo stosowanie filtru różnicowego wyprowadza zmianę funkcji kowariancyjnej i autokorelacyjnej wyjściowych szeregów (efekt Słuckiego-Yule'a). W związku z tym przy estymacji modelu ekonometrycznego dla szeregów przefiltrowanych należy brać pod uwagę zmianę parametrów strukturalnych w stosunku do parametrów otrzymanych dla danych niefiltrowanych. Również interpretacji tych parametrów nie można odnosić do danych oryginalnych, a tylko do danych przefiltrowanych, w tym przypadku za pomocą metody różnic. Wynika z tego także, że nie należy budować modeli ekonometrycznych jednocześnie dla szeregów przefiltrowanych za pomocą metody różnic i niefiltrowanych, a jedynie dla szeregów transformowanych w taki sam sposób, ponieważ wtedy wszystkie szeregi będą jednakowo przekształcone zgodnie z charakterystykami danego filtru.
Przyjęcie modelu trendu deterministycznego oznacza wyeliminowanie go poprzez odjęcie wartości trendu, np. liniowego, oszacowanych za pomocą metody najmniejszych kwadratów od oryginalnych wartości szeregu. W dziedzinie częstości odpowiada to zmianie tylko częstości zerowej, bez oddziaływania na wyższe częstości. Taka eliminacja trendu nie powoduje zmian funkcji kowariancji i autokorelacji dla szeregów wyjściowych.
Jak widać wybór między procesem zintegrowanym i stacjonarnym wokół trendu deterministycznego nie jest obojętny i ma określone konsekwencje dla dalszego modelowania. Z związku z tym zasadniczym problemem jest odróżnienie tych dwóch trendów.
3. Identyfikacja modelu trendu
Idea, że proces ekonomiczny, oprócz trendu deterministycznego, może posiadać trend stochastyczny, czyli być zintegrowany, spowodowała ogromne zainteresowanie testowaniem istnienia pierwiastków jednostkowych. Zainteresowanie to gwałtownie wzrosło po publikacji Nelsona i Plossera, stwierdzającej że większość makroekonomicznych zmiennych ma pierwiastek jednostkowy, czyli zakłócenia losowe mają trwały efekt na system ekonomiczny. Autorzy ci wykorzystali test Dickeya-Fullera, który weryfikuje hipotezę, że Yt jest zintegrowany rzędu pierwszego (H0: Yt ~ I(1)) wobec hipotezy alternatywnej, że Yt jest zintegrowany rzędu zerowego (H1: Yt ~ I(0)), czyli jest stacjonarny.
Kilka lat później wyniki uzyskane przez Nelsona i Plossera zostały podważone przez Perrona, który wysunął hipotezę, że większość makroekonomicznych zmiennych nie zawiera pierwiastka jednostkowego, a jest stacjonarna wokół trendu, jeśli tylko uwzględni się zmianę wyrazu wolnego i współczynnika kierunkowego funkcji trendu. Wynika z tego, że zakłócenia mają rzeczywiście charakter przejściowy (tymczasowy), tak jak wskazują teorie ekonomiczne.
Przykłady te wskazują na niejednoznaczność wyników uzyskiwanych przy rozstrzyganiu typu niestacjonarności występującego w ekonomicznych zmiennych, tzn. czy proces ma trend deterministyczny (trend w średniej) czy stochastyczny (trend w wariancji).
W dalszej części zostaną pokazane możliwości określenia typu modelu trendu na podstawie przebiegu funkcji autokorelacji i funkcji gęstości spektralnej, a także zostanie wykazane, że test Dickeya-Fullera ma niską moc w odróżnianiu dwóch alternatywnych hipotez.
Pierwsza metoda polega na porównywaniu przebiegu funkcji autokorelacji dla badanych procesów o określonym typie modelu trendu (trend deterministyczny lub stochastyczny) z pewnym wzorcowym przebiegiem tych funkcji, otrzymanych dla generowanych procesów o ustalonej (znanej) postaci funkcji trendu.
Funkcje autokorelacji dla procesu z trendem liniowym w wartości średniej
i dla procesu zintegrowanego przedstawia odpowiednio tablica 1 i 2.
Tablica 1. Funkcje autokorelacji dla generowanego procesu z trendem liniowym (TL)
w wartości średniej o postaci Yt=3+0.1*t+et
(liczba powtórzeń m=200, liczba obserwacji N=120,300 i 40)
|
N |
r1 |
r2 |
r3 |
r4 |
r5 |
r6 |
r7 |
r8 |
r9 |
r10 |
Generowany proces Yt |
120 300 40
|
0.92 0.98 0.54 |
0.92 0.98 0.52 |
0.92 0.98 0.52 |
0.92 0.98 0.50 |
0.92 0.98 0.49 |
0.92 0.98 0.48 |
0.91 0.98 0.46 |
0.91 0.98 0.45 |
0.91 0.98 0.43 |
0.90 0.97 0.42 |
Pierwsze różnice dla procesu Yt |
120 300 40
|
-0.49 -0.49 -0.48 |
-0.00 -0.01 -0.02 |
-0.00 -0.01 0.01 |
-0.01 0.00 -0.01 |
-0.00 -0.00 0.00 |
-0.00 -0.01 0.01 |
0.00 0.01 -0.00 |
-0.01 -0.00 -0.00 |
0.00 -0.00 0.00 |
-0.00 -0.00 -0.01 |
Reszty po trendzie liniowym dla Yt |
120 300 40
|
-0.01 -0.00 -0.05 |
-0.01 -0.01 -0.06 |
-0.02 0.00 -0.08 |
-0.01 0.00 -0.06 |
-0.01 -0.01 -0.05 |
-0.01 -0.01 -0.04 |
-0.01 -0.00 -0.04 |
-0.01 -0.01 -0.03 |
-0.00 -0.01 -0.00 |
-0.01 -0.01 -0.00 |
Wyniki w tablicy 1 pokazują, że przyjęcie modelu z liniowym trendem deterministycznym do eliminacji niestacjonarności pozwoliło uzyskać reszty niezautokorelowane (por. dwa ostatnie wiersze tablicy 1), czyli takie jakie zakładano w modelu generującym dane. Natomiast założenie błędnego typu modelu trendu, tj. modelu zintegrowanego rzędu pierwszego, a tym samym modelu pierwszych różnic do eliminacji niestacjonarności, spowodowało pozorną ujemną autokorelację rzędu pierwszego, równą -0.5 (por. środkowe wiersze tablicy 1).
Tablica 2. Funkcje autokorelacji dla generowanego procesu błądzenia przypadkowego
RW (random walk) o postaci Yt=Yt-1+εt
(liczba powtórzeń m=200, liczba obserwacji N=120,300 i 40)
|
N |
r1 |
r2 |
r3 |
r4 |
r5 |
r6 |
r7 |
r8 |
r9 |
r10 |
Generowany RW |
120 300 40
|
0.97 0.98 0.90 |
0.94 0.97 0.81 |
0.90 0.96 0.71 |
0.87 0.95 0.61 |
0.84 0.94 0.52 |
0.81 0.93 0.44 |
0.78 0.91 0.37 |
0.75 0.90 0.31 |
0.72 0.89 0.25 |
0.69 0.88 0.21 |
Pierwsze różnice dla RW |
120 300 40
|
-0.01 -0.00 -0.02 |
-0.01 0.00 -0.00 |
-0.01 0.01 -0.02 |
0.00 -0.00 -0.02 |
-0.01 0.00 -0.04 |
-0.00 -0.00 -0.03 |
0.01 0.00 -0.06 |
0.00 -0.00 -0.02 |
0.00 0.00 -0.03 |
-0.1 0.00 -0.02 |
Reszty po TL dla procesu RW |
120 300 40 |
0.92 0.96 0.73 |
0.85 0.94 0.53 |
0.78 0.91 0.35 |
0.72 0.88 0.20 |
0.65 0.85 0.08 |
0.59 0.81 -0.01 |
0.53 0.79 -0.08 |
0.47 0.76 -0.11 |
0.42 0.73 -0.10 |
0.36 0.70 -0.06 |
Na podstawie tablicy 2 widać, że przyjęcie prawdziwej postaci modelu trendu, tj. modelu zintegrowanego rzędu pierwszego powoduje, że pierwsze różnice są stacjonarne i nie wykazują autokorelacji (por. środkowe wiersze tablicy 2). Natomiast założenie błędnego deterministycznego modelu trendu liniowego do eliminacji niestacjonarności powoduje wysoką dodatnią autokorelację w resztach dla pierwszych kilku opóźnień.
Wyniki powyższe dotyczą dwóch skrajnych modeli trendu, które mają jednak białoszumowe procesy losowe. Na podstawie badań empirycznych wiadomo, że procesy ekonomiczne charakteryzują się dodatkowo rozbudowaną strukturą autoregresyjną. Wtedy znacznie trudniej jest dokonać jednoznacznego wyboru pomiędzy modelem trendu deterministycznego i stochastycznego (por. wyniki w tablicy 3 i 4).
Dla wygenerowanego procesu z trendem deterministycznym i autoregresją pierwszego rzędu autokorelacje są wysokie i dodatnie dla wszystkich opóźnień (pierwsze wiersze tab. 3). Jeżeli wybrany zostanie prawdziwy model trendu deterministycznego, to autokorelacje dla reszt po trendzie liniowym są niższe niż dla oryginalnego szeregu, ale nadal wysokie i maleją wraz ze wzrostem opóźnienia (por. ostatnie wiersze w tab. 3). Dopasowanie modelu zintegrowanego rzędu pierwszego do procesu z trendem deterministycznym powoduje, że autokorelacje dla pierwszych różnic procesu Yt są ujemne i niskie, oraz maleją ze wzrostem opóźnienia. Ich przebieg jednak nie jest podobny do przebiegu autokorelacji dla pierwszych różnic procesu z trendem deterministycznym
i białym szumem (por. tab. 1), tzn. nie zaznacza się tutaj wyraźnie pozorna
autokorelacja.
Tablica 3. Funkcje autokorelacji dla procesu z trendem liniowym (TL) w wartości średniej i autoregresją AR(1) generowanego według modelu Yt=3+0.1*t+0.8*Yt-1+et
(liczba powtórzeń m=200, liczba obserwacji N=300,120 i 40)
|
N |
r1 |
r2 |
r3 |
r4 |
r5 |
r6 |
r7 |
r8 |
r9 |
r10 |
Generowany proces Yt |
300 120 40
|
0.99 0.96 0.83 |
0.99 0.93 0.69 |
0.98 0.89 0.57 |
0.98 0.87 0.46 |
0.97 0.86 0.37 |
0.97 0.84 0.28 |
0.97 0.82 0.21 |
0.97 0.81 0.16 |
0.96 0.80 0.11 |
0.95 0.79 0.07 |
Pierwsze różnice dla Yt |
300 120 40
|
-0.09 -0.08 -0.08 |
-0.08 -0.07 -0.06 |
-0.06 -0.07 -0.06 |
-0.04 -0.05 -0.05 |
-0.05 -0.04 -0.04 |
-0.03 -0.03 -0.04 |
-0.03 -0.02 -0.04 |
-0.02 -0.03 -0.03 |
-0.02 -0.02 -0.03 |
-0.02 -0.02 -0.01 |
Reszty po trendzie liniowym dla Yt |
300 120 40
|
0.79 0.77 0.63 |
0.62 0.58 0.38 |
0.48 0.43 0.19 |
0.37 0.31 -0.07 |
0.28 0.21 -0.03 |
0.20 0.14 -0.07 |
0.14 0.08 -0.11 |
0.10 -0.03 -0.11 |
0.06 -0.02 -0.11 |
0.04 -0.01 -0.06 |
Tablica 4. Funkcje autokorelacji dla procesu zintegrowanego ARIMA(1,1,0)
o postaci
(liczba powtórzeń m=200, liczba obserwacji N=300,120 i 40)
|
N |
r1 |
r2 |
r3 |
r4 |
r5 |
r6 |
r7 |
r8 |
r9 |
r10 |
Generowany proces ARIMA |
300 120 40
|
0.99 0.99 0.98 |
0.99 0.98 0.93 |
0.98 0.96 0.86 |
0.97 0.93 0.77 |
0.96 0.91 0.69 |
0.95 0.88 0.60 |
0.93 0.84 0.51 |
0.92 0.81 0.42 |
0.91 0.78 0.33 |
0.89 0.74 0.26 |
Pierwsze różnice |
300 120 40
|
0.79 0.77 0.73 |
0.63 0.60 0.52 |
0.50 0.45 0.36 |
0.39 0.34 0.23 |
0.31 0.25 0.13 |
0.24 0.18 0.06 |
0.19 0.13 0.01 |
0.15 0.08 -0.03 |
0.11 0.04 -0.03 |
0.08 0.02 -0.10 |
Reszty po trendzie liniowym |
300 120 40
|
0.99 0.98 0.95 |
0.98 0.95 0.83 |
0.96 0.91 0.66 |
0.95 0.85 0.47 |
0.92 0.78 0.28 |
0.90 0.71 0.09 |
0.87 0.64 -0.07 |
0.84 0.57 -0.22 |
0.81 0.49 -0.35 |
0.78 0.42 -0.46 |
Dla wygenerowanego procesu zintegrowanego ARIMA(1,1,0) autokorelacje są również dodatnie i wysokie (por. tab. 4), a ich przebieg jest podobny do autokorelacji dla procesu z trendem deterministycznym i autoregresją rzędu pierwszego (por. tab. 3), z tą jednak różnicą, że dla procesu ARIMA(1,1,0) autokorelacje nieznacznie szybciej maleją ze wzrostem opóźnienia.
Przyjęcie prawdziwego modelu trendu stochastycznego powoduje, że otrzymane dla pierwszych różnic autokorelacje są dodatnie i wysokie, ze względu na autoregresyjną strukturę procesu (por. dwa środkowe wiersze tab. 4). Należy jednak zwrócić uwagę na fakt, że autokorelacje te są bardzo zbliżone do autokorelacji otrzymanych dla reszt po trendzie liniowym (por. tab. 3), czyli gdy wybrano prawdziwy model trendu deterministycznego. Wynika z tego, że jeżeli procesy charakteryzują się identycznymi lub zbliżonymi strukturami autoregresyjnymi, niemożliwe jest wręcz odróżnienie obu typów modeli trendu na podstawie przebiegu funkcji autokorelacji.
Wybór postaci modelu trendu może być również uzupełniony poprzez badanie kształtu funkcji gęstości spektralnej. Wyniki przedstawiają wykresy
1-12. Jeżeli prawdziwy model generujący dane był postaci ,
a do eliminacji trendu wykorzystano pierwsze różnice to udział wysokich częstości w spektrum reszt dla pierwszych różnic będzie przesadzony (wykres 6). Gdy model generujący dane był typu random walk, to użycie deterministycznego modelu trendu liniowego do eliminacji niestacjonarności spowoduje, że udział niskich częstości w spektrum dla reszt po trendzie liniowym będzie przesadzony (wykres 2). Natomiast przyjęcie prawdziwego modelu trendu do eliminacji niestacjonarności w obu przypadkach powoduje, że otrzymany kształt spektrum jest płaski (wykresy 3 i 5) i odpowiada funkcji gęstości spektralnej dla białego szumu; tym samym potwierdza to własności generowanych procesów.
Jeżeli model generujący dane był modelem z trendem deterministycznym
i autoregresją, to przyjęcie prawdziwego modelu trendu liniowego do eliminacji niestacjonarności powoduje, że w spektrum dla reszt po trendzie liniowym (wykres 11) obserwuje się niższą wartość dla częstości zerowej oraz wyższą dla kilku kolejnych częstości niskich, a następnie wartości funkcji gęstości spektralnej maleją wraz ze wzrostem częstości. Natomiast wykorzystanie pierwszych różnic do eliminacji niestacjonarności powoduje, że w spektrum dla różnic procesu z trendem deterministycznym i autoregresją (wykres 12) został wyeliminowany nadmiernie udział niskich częstości, a udział częstości wysokich jest wyższy, chociaż nie jest on tak wyraźnie zaznaczony jak na wykresie 6 (wyraźniej można to zauważyć przy zmianie skali wykresu 12).
Dopasowanie modelu trendu liniowego do procesu ARIMA(1,1,0) (wykres 8) powoduje, że w spektrum udział niskich częstości jest wysoki, podobnie jak na wykresie 2. Natomiast spektrum dla różnic procesu ARIMA(1,1,0) charakteryzuje się spadkiem mocy i jest płaskie, chociaż obserwuje się nieco wyższy udział częstości niskich niż wysokich (co można by wyraźnie zauważyć przy zmianie skali).
Wyboru modelu trendu można dokonywać za pomocą testu Dickeya-Fullera. Test ten wykorzystano do wygenerowanych procesów o odmiennym typie niestacjonarności, tzn.
do procesu z trendem stochastycznym
(1a) model błądzenia przypadkowego
(1b) model ARIMA(1,1,0) o postaci
do procesu z trendem deterministycznym
(2a) model z trendem liniowym o postaci
(2b) model z trendem liniowym i autoregresją o postaci
.
Tablica 5. Wyniki testu DF dla modeli (1a), (1b), (2a), (2b)
|
Proces z trendem stochastycznym
|
Proces z trendem deterministycznym |
||||
|
Procent odrzuceń H0:Yt~I(1) dla modelu (1a) |
Procent nieodrzuceń H0:Yt~I(1) dla modelu (2a) |
||||
|
n=300 |
n=120 |
n=40 |
n=300 |
n=120 |
n=40 |
α=0.05 |
36.5 |
29.5 |
22.0 |
100.0 |
20.4 |
5.0 |
α=0.01 |
8.0 |
7.0 |
3.0 |
100.0 |
99.5 |
46.0 |
|
Procent odrzuceń H0:Yt~I(1) dla modelu (1b) |
Procent nieodrzuceń H0:Yt~I(1) dla modelu (2b) |
||||
|
n=300 |
n=120 |
n=40 |
n=300 |
n=120 |
n=40 |
α=0.05 |
6.5 |
9.5 |
55.0 |
100.0 |
91.0 |
81.0 |
α=0.01 |
3.0 |
6.0 |
28.0 |
100.0 |
100.0 |
99.0 |
Na podstawie wyników tablicy 5 wyraźnie można zauważyć zmianę decyzji
w teście DF przy zmianie poziomu istotności i liczby obserwacji. Dla generowanego procesu (1a) procent odrzuceń prawdziwej hipotezy Yt~I(1) (i jednocześnie błędnych decyzji, że proces jest stacjonarny) jest szczególnie wysoki przy α=0.05. Natomiast w przypadku procesu (1b) nie obserwuje się tak wyraźnej różnicy między wynikami testu DF przy zmianie poziomu istotności α,
z wyjątkiem przypadków dla n=40.
O ile w przypadku generowanych procesów (1a) i (1b) można powiedzieć, że test DF potwierdził generalnie występowanie trendu stochastycznego, to
w przypadku procesów (2a) i (2b) test DF w większości przypadków, (w wyjątkiem procesu (1a) dla n=40 i α=0.05) nie odrzuca błędnej hipotezy o integracji rzędu pierwszego. Skłonni jesteśmy zatem przyjąć, że mamy do czynienia
z procesem z trendem stochastycznym, gdy w rzeczywistości jest to proces
z trendem deterministycznym.
Również dla wygenerowanego stacjonarnego procesu autoregresyjnego rzędu pierwszego o parametrze bliskim jedności test DF zbyt często nie odrzuca hipotezy zerowej o integracji rzędu pierwszego (por. tablica 6).
Tablica 6. Wyniku testu DF dla stacjonarnego procesu autoregresyjnego
|
Procent nieodrzuceń H0: Yt ~ I(1) |
|||||
Parametr γ |
n=120 |
n=300 |
||||
|
α=0.05 |
α=0.01 |
α=0.05 |
α=0.01 |
||
0.90 0.92 0.94 0.96 0.98 |
6.5 17.5 29.5 50.0 67.0 |
55.0 72.5 83.0 94.0 99.5 |
0.00 0.00 0.00 4.5 100.0 |
0.0 1.0 13.5 53.0 100.0 |
Wyniki tablicy 6 pokazują, że w miarę wzrostu współczynnika autoregresji rzędu pierwszego rośnie procent nieodrzuceń (i jednocześnie błędnych decyzji) hipotezy zerowej o integracji rzędu pierwszego procesu, gdy w rzeczywistości mamy do czynienia z autoregresyjnym procesem stacjonarnym. Oznacza to, że w przypadku wartości parametru bliskiego jedności za pomocą testu DF nie jesteśmy w stanie podjąć właściwej decyzji.
Reasumując w przypadku procesu z trendem deterministycznym, a szczególnie z trendem deterministycznym i autoregresją, test DF zbyt często wskaże na proces z trendem stochastycznym (nieodrzucenie H0). Tłumaczy to dużą liczbę przypadków identyfikacji procesów ekonomicznych jako procesów zintegrowanych gdy stosowano do testowania test DF. Z tego też powodu wydaje się, że konieczne jest spojrzenie na kwestię wyboru modelu trendu od strony konsekwencji dla konstrukcji modelu ekonometrycznego oraz jego interpretacji.
Interpretacja modelu ekonometrycznego po eliminacji trendu
za pomocą alternatywnych metod - przykład empiryczny
Ilustrację wyboru modelu trendu oraz interpretację modelu ekonometrycznego dla szeregów, po eliminacji trendu alternatywnymi metodami, oparto na zagregowanych danych rocznych dla gospodarki USA z lat 1960-95. Dane te pochodzą z banku danych dostępnych w internecie (http://www.nber.org/data-bases/erp97/). Wykorzystano je do badania stopy bezrobocia (SB) w zależności od indeksu produktu krajowego brutto (GDP), średniej tygodniowej stawki
w przemyśle prywatnym (ST) w dolarach i indeksu zmian cen dóbr konsumpcyjnych i usług (IP).
Wzrost indeksu produktu krajowego brutto powinien wpływać na obniżenie stopy bezrobocia. Wzrost stawki tygodniowej (realnej poprzez uwzględnienie
w modelu zmian indeksu cen i usług konsumpcyjnych) powinien wywołać wzrost stopy bezrobocia jeżeli przejawi się bardziej jej wpływ hamujący na popyt na siłę roboczą, a z drugiej strony - może wywołać spadek stopy bezrobocia jeżeli przejawi się bardziej efekt motywujący do zwiększenia aktywności zawodowej. W przypadku indeksu cen oczekuje się, że jego wzrost wywoła wzrost stopy bezrobocia, co nie jest zgodne z ujemną zależnością między tymi zmiennymi opisaną przez krzywą Phillipsa, ale odpowiada to obserwowanemu w USA w pod koniec lat 70-tych i w latach 80-tych okresowi stagflacji.
Pierwszym etapem było określenie typu modelu trendu na podstawie funkcji autokorelacji i przebiegu funkcji gęstości spektralnej.
Wyniki prezentują tablice 7-10 oraz wykresy 13-24.
Tablica 7. Funkcja autokorelacji dla stopy bezrobocia (SB)
|
r1 |
r2 |
r3 |
r4 |
r5 |
r6 |
r7 |
r8 |
SB |
0.786 |
0.497 |
0.309 |
0.224 |
0.193 |
0.12 |
0.067 |
-0.01 |
RSB |
0.702 |
0.34 |
0.113 |
0.032 |
0.02 |
-0.051 |
-0.099 |
-0.169 |
ΔSB |
0.156 |
-0.214 |
-0.235 |
-0.148 |
0.064 |
-0.052 |
0.055 |
-0.042 |
Symbol R oznacza reszty po trendzie liniowym, a Δ - pierwsze różnice.
Tablica 8. Funkcja autokorelacji dla produktu krajowego brutto (GDP)
|
r1 |
r2 |
r3 |
r4 |
r5 |
r6 |
r7 |
r8 |
GDP |
0.431 |
0.36 |
0.361 |
0.286 |
0.254 |
0.132 |
0.041 |
0.06 |
RGDP |
0.401 |
0.33 |
0.331 |
0.257 |
0.237 |
0.121 |
0.021 |
0.045 |
ΔGDP |
-0.41 |
-0.113 |
0.114 |
-0.056 |
0.142 |
-0.066 |
-0.053 |
0.12 |
Symbol R oznacza reszty po trendzie liniowym, a Δ - pierwsze różnice.
Tablica 9. Funkcja autokorelacji dla tygodniowej stawki (ST)
|
r1 |
r2 |
r3 |
r4 |
r5 |
r6 |
r7 |
r8 |
ST |
0.93 |
0.857 |
0.781 |
0.702 |
0.62 |
0.537 |
0.453 |
0.371 |
RST |
0.887 |
0.742 |
0.579 |
0.409 |
0.239 |
0.083 |
-0.054 |
-0.174 |
ΔST |
0.878 |
0.721 |
0.553 |
0.4 |
0.266 |
0.17 |
0.103 |
0.049 |
Symbol R oznacza reszty po trendzie liniowym, a Δ - pierwsze różnice.
Tablica 10. Funkcja autokorelacji dla indeksu cen (IP)
|
r1 |
r2 |
r3 |
r4 |
r5 |
r6 |
r7 |
r8 |
IP |
0.782 |
0.448 |
0.269 |
0.226 |
0.23 |
0.159 |
0.004 |
-0.118 |
RIP |
0.782 |
0.445 |
0.267 |
0.227 |
0.237 |
0.17 |
0.018 |
-0.106 |
ΔIP |
0.302 |
-0.396 |
-0.357 |
-0.098 |
0.248 |
0.216 |
-0.072 |
-0.228 |
Symbol R oznacza reszty po trendzie liniowym, a Δ - pierwsze różnice.
Przebieg funkcji autokorelacji dla reszt po trendzie liniowym i dla pierwszych różnic w przypadku stawki tygodniowej ST (tab. 9) jest bardzo zbliżony do przebiegu autokorelacji w tab. 3 i 4, tzn. autokorelacje dla reszt po trendzie liniowym i dla różnic procesu są bardzo podobne. Oznacza to, że szereg ten może charakteryzować się zarówno trendem deterministycznym, jak i stochastycznym o podobnej strukturze autoregresyjnej. W przypadku indeksu produktu krajowego brutto GDP (tab. 8) ujemna autokorelacja dla różnic procesu może sugerować pozorną autokorelację, a z drugiej strony niska autokorelacja rzędu pierwszego dla poziomu GDP oraz podobna wartość dla reszt po trendzie liniowym wskazuje raczej na proces z trendem deterministycznym lub w ogóle na brak trendu, czyli proces stacjonarny.
Wyniki tablicy 7 prezentują wysokie autokorelacje dla reszt po trendzie liniowym dla stopy bezrobocia (RSB), ale niższe niż dla poziomu SB, oraz znacznie niższe autokorelacje dla różnic, przy czym dla pierwszego opóźnienia autokorelacja jest dodatnia, a dla kilku pozostałych - ujemna. Może to wskazywać na proces z trendem stochastycznym i autoregresją o niewysokiej wartości parametru pierwszego rzędu (ponieważ wtedy autokorelacje są niższe, ale dodatnie) lub ze względu na ujemność pozostałych kilku opóźnień - pozorną autokorelację w różnicach, a tym samym na trend deterministyczny. Podobna sytuacja występuje dla indeksu cen IP - por. tab. 10.
Wykresy 13-24 przedstawiają funkcje gęstości spektralnej dla poziomów procesów ST, IP, SB i GDP, a także dla ich różnic (oznaczenie D przed nazwą zmiennej) i reszt po trendzie liniowym (oznaczenie R przed nazwą zmiennej).
Wykresy 14, 17, 20 i 23 pokazują, że funkcje gęstości spektralnej dla reszt po trendzie liniowym mają dla wszystkich badanych procesów kształt zbliżony do spektrum otrzymanego dla reszt po trendzie liniowym dla generowanego procesu z trendem liniowym i autoregresją rzędu pierwszego, tzn. niższa wartość spektrum dla częstości zerowej oraz wyższa dla kolejnej częstości niskich, bliskich zerowej częstości, a dla kolejnych częstości wartości spektrum maleją wraz ze wzrostem częstości. Jest to jednocześnie kształt spektrum typowy dla stacjonarnych procesów autoregresyjnych. Wskazywałoby to na proces z trendem deterministycznym lub proces autoregresyjny. Wydaje się to również potwierdzać kształt spektrum dla różnic, które jest raczej płaskie, choć udział wysokich częstości w przypadku różnic dla zmiennych IP, SB i GDP (wykresy 15, 18, 21 i 24) jest lekko przesadzony, co występuje przy błędnym przyjęciu metody różnic do eliminacji niestacjonarności w przypadku gdy prawdziwym modelem generującym był model z trendem deterministycznym. Natomiast
w przypadku stawki tygodniowej ST trudno jest rozstrzygnąć czy proces charakteryzuje się trendem deterministycznym czy stochastycznym, ponieważ spektrum dla reszt po trendzie liniowym (wykres 14) sugeruje model z trendem deterministycznym, a spektrum dla różnic (wykres 15) model z trendem stochastycznym.
Do badania typu procesu wykorzystano również test Dickeya-Fullera. Wyniki stosowania testu Dickeya-Fullera w odniesieniu do badanych procesów przedstawione są w tablicy 11.
Tablica 11. wyniki testu DF dla badanych zmiennych
I etap: H0: Yt ~ I(1), H1: Yt ~ I(0) |
II etap: H0: Yt ~ I(2), H1: Yt ~ I(1) |
||
zmienna |
DF |
zmienna |
DF |
SB |
-2.02 |
SB |
-4.92* |
GDP |
-3.41* |
|
|
ST |
3.25 |
ST |
-1.80** |
IP |
-1.93 |
IP |
-4.15* |
* oznacza odrzucenie H0 na poziomie istotności 1%.
** oznacza odrzucenie H0 na poziomie istotności 10%.
Powyższe wyniki wskazują, że stopa zmian produktu krajowego brutto (GDP) jest procesem stacjonarnym, czyli o zerowym rzędzie integracji, natomiast stopa bezrobocia (SB), indeks cen (IP) oraz stawka tygodniowa (ST) są procesami zintegrowanymi rzędu pierwszego I(1).
Porównując te wyniki z rezultatami otrzymanymi na podstawie badania funkcji autokorelacji i funkcji gęstości spektralnej, tylko w jednym przypadku wyniki pokrywają się, tzn. dla stopy zmian produktu krajowego brutto (GDP). Stacjonarność procesu GDP zostało potwierdzone również przez badanie występowania trendu deterministycznego (poprzez szacowanie wielomianu zmiennej czasowej o postaci (1) dla r=1 za pomocą metody najmniejszych kwadratów), natomiast dla pozostałych procesów, w wyjątkiem indeksu cen (IP), stwierdzono istnienie deterministycznego trendu liniowego.
Struktura badanych procesów przy założeniu różnego typu modelu trendu jest przedstawiona w tablicy 12.
Tablica 12. Struktura wewnętrzna badanych zmiennych
model trendu deterministycznego (trend liniowy) |
model trendu stochastycznego |
|||
zmienna |
stopień trendu r |
AR(p.) |
zmienna |
ARIMA(p.,r,q) |
SB |
1 |
2 |
SB |
(0,1,0) |
GDP |
0 |
1 |
GDP |
(1,0,0) |
ST |
1 |
2 |
ST |
(2,1,0) |
IP |
0 |
3 |
IP |
(2,1,0) |
Δ oznacza pierwsze różnice.
W związku z brakiem jednoznacznego wskazania na jeden z dwóch modeli trendu, a także dla celów porównawczych proponuje się utworzyć dwa alternatywne modele zakładające odmienny rodzaj trendu, tzn. deterministycznego lub stochastycznego. Wykluczono z analizy modele, które zakładałyby dla jednych zmiennych model trendu deterministycznego, a dla innych model trendu stochastycznego ze względu na niezachowanie wtedy warunku jednakowej transformacji zmiennych. Wyniki prezentuje tablica 13.
Modele (1) i (2) uwzględniają ten sam typ modelu trendu, tzn. deterministycznego trendu liniowego, z tą tylko różnicą, że w modelu (1) włączono zmienną t, co jest równoznaczne z wyeliminowaniem trendu liniowego
ze wszystkich uwzględnionych zmiennych, a w modelu (2) odjęto oszacowane wartości trendu od zmiennych i oszacowano model dla reszt po trendzie liniowym. Należy zauważyć, że specyfikacja zmiennych w obu modelach jest identyczna, a oceny parametrów otrzymane dla modeli (1) i (2) są bardzo zbliżone, niewielkie różnice wynikają z różnej liczby stopni swobody (w modelu (1) występuje dodatkowo zmienna t), a także z tego, że trend liniowy w modelu (1) jest eliminowany w każdej zmiennej, również opóźnionej, natomiast w modelu (2) reszty dla poszczególnych zmiennych, powstałe poprzez odjęcie oszacowanych wartości trendu od oryginalnych wartości szeregu, zostały wprowadzone
z opóźnieniami wynikającymi z ich struktury autoregresyjnej. Oznacza to, że interpretacja obu parametrów obu modeli może być odnoszona do rzeczywistych zmiennych, natomiast w przypadku modelu (3) tylko do pierwszych różnic zmiennych.
Wyjściowa specyfikacja modelu (3) zawierała również pierwsze różnice indeksu produktu krajowego brutto (GDP) wraz z opóźnieniem pierwszego rzędu, mimo że zmienna wykazywała rząd integracji zerowy. Powodem takiego postępowania było dążenie do transformowania zmiennych w jednakowy sposób, i tym samym zachowania zależności między nimi. Zmienne te jednak okazały się nieistotne.
Tablica 13. Modele dla stopy bezrobocia przy założeniu różnej postaci modelu trendu
(1) Model dla stopy bezrobocia SB 1963-95 |
(2) Model dla reszt po TL dla stopy bezrobocia SB 1963-95 |
(3) Model różnicy stopy bezrobocia ΔSB 1963-1995 |
||||||
zmienna |
para-metr |
stat. t-Stud. |
zmienna |
para-metr |
stat. t-Stud. |
zmienna |
para-metr |
stat. t-Stud. |
stała |
3.16 |
6.68 |
stała |
-0.10 |
-1.72 |
|
|
|
SB(t-1) |
0.46
|
4.41
|
RSB(t-1)
|
0.46
|
4.42
|
|
|
|
SB(t-2) |
0.44 |
3.62 |
RSB(t-2) |
0.42 |
3.48 |
|
|
|
GDP |
-0.21 |
-4.32 |
RGDP |
-0.18 |
-4.43 |
|
|
|
GDP(t-1) |
-0.23 |
-4.06 |
RGDP(t-1) |
-0.21 |
-3.98 |
|
|
|
ST |
-6.18 |
-3.31 |
RST |
-7.32 |
-4.77 |
ΔST |
-10.84 |
-5.02 |
ST(t-1) |
11.42 |
3.71 |
RST(t-1) |
12.30 |
4.14 |
ΔST(t-1) |
11.23 |
5.11 |
ST(t-2) |
-6.11 |
-3.89 |
RST(t-2) |
-5.75 |
-3.74 |
ΔIP(t-1) |
0.29 |
4.67 |
IP(t-1) |
0.35 |
7.35 |
RIP(t-1) |
0.38 |
10.22 |
ΔIP(t-2) |
0.21 |
3.84 |
t |
0.22 |
3.22 |
- |
|
|
|
|
|
R2 |
0.972 |
|
R2 |
0.963 |
|
R2 |
0.67 |
|
DW |
1.44 |
|
DW |
1.50 |
|
DW |
1.91 |
|
S(u) |
0.30 |
|
S(u) |
0.30 |
|
S(u) |
0.59 |
|
N |
33 |
|
N |
33 |
|
N |
33 |
|
Symbol R przy poszczególnych zmiennych oznacza reszty po trendzie liniowym, a Δ - pierwsze różnice obliczone dla poszczególnych zmiennych.
Ze statystycznego punktu widzenia modele (1) i (2) cechuje wysokie stopień dopasowania do danych (ok. 97%) i dobre własności reszt modelu, które nie są zautokorelowane. Znak parametru przy GDP jest zgodny z teorią ekonomii, tzn. że wzrost indeksu produktu krajowego brutto wywołuje spadek stopy bezrobocia.
Reakcja stopy bezrobocia na zmiany indeksu cen była opóźniona i wynosiła 0.35 (w modelu (1)). Oznacza to, że 1% wzrost indeksu cen w okresie poprzednim powodował przeciętnie wzrost stopy bezrobocia w danym okresie przy założeniu ceteris paribus o 0.35%. Potwierdza to tym samym tendencje stagflacyjne w gospodarce. Reakcja stopy bezrobocia SB na zmiany stawki tygodniowej ST jest natychmiastowa, ale również opóźniona, i wyraża się w postaci skumulowanego efektu wynoszącego -0.86. Oznacza to, że wzrost stawki tygodniowej ST o 1 dolara spowodował łącznie przy założeniu ceteris paribus spadek stopy bezrobocia przeciętnie o 0.86%. Stawka tygodniowa jest wyrażona nominalnie, jednak występowanie indeksu zmian cen dóbr i usług konsumpcyjnych w modelu pozwala traktować parametry przy ST w kategoriach realnych. Wtedy jednak znak parametru (skumulowany efekt) jest niezgodny z teorią ekonomii, która sugeruje wzrost stopy bezrobocia przy jednostkowym wzroście płac realnych, ponieważ mają one wpływ hamujący na popyt na siłę roboczą. Ujemny znak dla łącznego oddziaływania ST może oznaczać, że w tym przypadku wzrost stawki tygodniowej miał większe działanie motywujące niż hamujące dla zwiększenia aktywności zawodowej.
Model (3) charakteryzuje się nieco lepszymi własnościami reszt, ale niższym dopasowaniem do danych (ok. 67%). Posiada również inną specyfikację zmiennych niż modele (1) i (2), przy czym trzeba pamiętać, że są to pierwsze różnice tych zmiennych i do nich należy odnosić interpretację parametrów. Różnica stopy bezrobocia ΔSB reaguje na zmianę różnicy stawki tygodniowej ΔST w danym okresie i z jednorocznym opóźnieniem, przy czym łączna wzrostowa reakcja ΔSB przy zmianie ΔST o 1 dolara wynosi przy założeniu ceteris paribus przeciętnie ok. 0.39%. Oznacza to, dla różnic tych zmiennych, odwrotnie niż dla ich poziomów, obserwuje się hamujący wpływ stawki tygodniowej na popyt na siłę roboczą. W przypadku wzrostu różnicy indeksu cen ΔIP wzrostowa reakcja różnicy stopy bezrobocia ΔSB występuje z opóźnieniem od jeden i dwa okresy, a skumulowana reakcja ΔSB na jednostkowy wzrost ΔIP wynosi 0.5, tzn. że wzrost ΔST o 1 dolara przy założeniu ceteris paribus spowodował przeciętnie wzrost ΔSB łącznie o 0.5%. Potwierdza to, podobnie jak w modelach (1) i (2), stagflacyjne tendencje w gospodarce.
Przedstawiony przykład pokazuje, że konieczne jest dążenie do poprawnej identyfikacji modelu trendu, ponieważ przyjęcie określonego założenia w odniesieniu do trendu powoduje otrzymanie różnych modeli pod względem specyfikacji, jak również interpretacji parametrów. W modelu (1), zakładającym model trendu deterministycznego interpretację parametrów należy odnosić do poziomów zmiennych, a w przypadku modelu (3), zakładającego model trendu stochastycznego, interpretacja parametrów dotyczy pierwszych różnic zmiennych. Odpowiednio do tego otrzymuje się inne parametry w obu modelach. Odmienna jest również interpretacja ekonomiczna modelu trendu deterministycznego i stochastycznego; w pierwszym modelu zakłada się stacjonarność procesu wokół deterministycznego trendu i jednocześnie przejściowy charakter zakłóceń losowych, w drugim modelu zakłada się trwałość wpływu zakłócenia na system. Z drugiej strony należy jednak pamiętać, że w skończonych przedziałach czasu nie można wykluczyć sytuacji, w której modele zakładające różną postać trendu będą dobrze opisywać badane zjawisko.
Literatura
Nelson C. R., Plosser C.I., (1982), Trends and Random Walks in Macroeconomic Time Series, Journal of Monetary Economics, 10, s. 139-162.
Perron P., (1989), The Great Crash, `The Oil Price Shock, And The Unit Root Hypothesis, Econometrica, vol. 57, no. 6, s. 1361-1401.
Piłatowska M., (1996), The Identification of Random Walk Process, w: Dynamic Econometic Models, vol. 2, UMK Toruń.
Talaga L., Zieliński Z., (1986), Analiza spektralna w modelowaniu ekonometrycznym, PWE, Warszawa.