1. Prognozowanie na podstawie modeli szeregów czasowych (modeli
struktury, modeli opisowych, modeli podstawowych)
Ogólna postać składnikowa procesu ekonomicznego:
t
wariancji
w
arnosc
niestacjon
t
t
t
sredniej
w
arnosc
niestacjon
t
t
t
t
C
S
P
Y
η
ξ
γ
μ
+
+
+
+
+
+
=
43
42
1
43
42
1
t
P
- składnik trendu deterministycznego,
t
S
- składnik sezonowy (deterministyczny), o cyklu rocznym,
t
C
- inne wahania cykliczne (deterministyczne) o cyklach dłuższych i krótszych niż rok,
t
μ
- trend stochastyczny,
t
γ
- składnik sezonowy stochastyczny,
t
ξ
- wahania cykliczne stochastyczne (inne niż sezonowe),
t
η
- stacjonarny składnik stochastyczny.
1.1. Prognozowanie na podstawie modeli trendu
Zakładamy następującą strukturę procesu ekonomicznego:
.
t
t
t
P
Y
η
+
=
Wyróżnić można m.in. następujące modele trendu:
- model trendu wielomianowego,
,
0
t
r
j
j
j
t
t
Y
η
α
+
=
∑
=
- model trendu potęgowego,
,
t
e
t
Y
t
η
α
α
1
0
=
- model trendu wykładniczego,
,
t
e
Y
t
t
η
α
α
1
0
=
1
1
>
α
,
- model trendu logistycznego,
- inne (tutaj niewymienione).
Schemat prognozowania na podstawie modelu trendu wielomianowego:
Hipoteza modelowa:
t
r
r
t
t
t
t
Y
η
α
α
α
α
+
+
+
+
+
=
...
2
2
1
0
Model ekonometryczny:
t
r
r
t
u
t
a
t
a
t
a
a
y
+
+
+
+
+
=
...
2
2
1
0
, t = 1,2,…, n
Zakłada się, że model ten posiada walory prognostyczne, tj. ma istotne parametry, pożądane
własności procesu resztowego (brak autokorelacji, homoscedastyczność, normalność).
Wyjątkowo w przypadku modeli trendu uchyla się założenie o wysokim stopniu dopasowania
modelu do danych empirycznych ze względu na przyjętą definicję trendu, tj. krzywej
wyznaczającej zasadniczy kierunek rozwoju badanego zjawiska w długim okresie. Krzywa
taka spokojny przebieg, nie może więc jednocześnie być dopasowana do danych
empirycznych.
Predyktor:
r
r
Tp
T
a
T
a
T
a
a
y
+
+
+
+
=
...
2
2
1
0
,
T = n+1, n+2,…, n+h
Prognozy na h-okresów naprzód:
Wektory wartości zmiennych
objaśniających w okresie
prognozowanym
r
r
p
n
T
n
a
n
a
n
a
a
y
)
1
(
...
)
1
(
)
1
(
2
2
1
0
,
1
+
+
+
+
+
+
+
=
+
=
[
]
r
n
T
n
n
n
X
)
1
(
...
)
1
(
1
1
2
1
+
+
+
=
+
=
r
r
p
n
T
n
a
n
a
n
a
a
y
)
2
(
...
)
2
(
)
2
(
2
2
1
0
,
2
+
+
+
+
+
+
+
=
+
=
[
]
r
n
T
n
n
n
X
)
2
(
...
)
2
(
2
1
2
2
+
+
+
=
+
=
…. ….
r
r
p
h
n
T
h
n
a
h
n
a
h
n
a
a
y
)
(
...
)
(
)
(
2
2
1
0
,
+
+
+
+
+
+
+
=
+
=
[
]
r
h
n
T
h
n
h
n
h
n
X
)
(
...
)
(
1
2
+
+
+
=
+
=
_______________
zmienne objaśniające
są zmiennymi quasi-objaśniającymi, bo zmienna czasowa t
jedynie opisuje przebieg zjawiska w czasie, a nie wyjaśnia kształtowania się badanej
zmiennej.
r
t
t
t
,...,
,
2
_____________
Prognozy te muszą być uzupełnione błędami predykcji ex ante (bezwzględny, względny), a
także w miarę napływu informacji o realizacjach zmiennej prognozowanej – również błędami
prognoz ex post (bezwzględny, względny).
Ćwiczenia przykładowe (tego typu zadania będą na 100% na egzaminie):
Zapisz hipotezę modelową, model ekonometryczny, predykator i prognozy na h-okresów
naprzód wraz z podaniem wektora zmiennych objaśniających w okresie prognozowanym dla:
- modelu trendu kwadratowego,
- modelu trendu trzeciego stopnia,
- modelu trendu liniowego.
Schemat prognozowania na podstawie modelu trendu potęgowego:
Hipoteza modelowa:
t
e
t
Y
t
η
α
α
1
0
=
Model ekonometryczny:
t
u
a
t
e
t
a
y
1
0
=
, t = 1,2,…, n
otrzymany na podstawie postaci logarytmowanej:
.
ln
ln
ln
1
0
t
t
u
t
a
a
y
+
+
=
interpretacja a
1
(współczynnika elastyczności): wzrost zmiennej czasowej t o 1% powoduje
zmiennej (bo a
t
y
1
>0) średnio o a
1
%.
Ocena walorów prognostycznych tak jak w modelu trendu wielomianowego.
Predyktor:
1
0
a
Tp
T
a
y
=
, T = n+1, n+2,…, n+h
lub
, w wtedy prognozy dla zmiennej prognozowanej otrzymuje się po
zdelogarytmowaniu
.
T
a
a
y
Tp
ln
ln
ln
1
0
+
=
Tp
y
ln
Prognozy na h-okresów naprzód:
Wektory wartości zmiennych objaśniających
w okresie prognozowanym
)
1
ln(
ln
ln
1
0
,
1
+
+
=
+
=
n
a
a
y
p
n
T
[
]
)
1
ln(
1
1
+
=
+
=
n
X
n
T
)
2
ln(
ln
ln
1
0
,
1
+
+
=
+
=
n
a
a
y
p
n
T
[
]
)
2
ln(
1
2
+
=
+
=
n
X
n
T
…. ….
)
ln(
ln
ln
1
0
,
1
h
n
a
a
y
p
n
T
+
+
=
+
=
[
]
)
ln(
1
h
n
X
h
n
T
+
=
+
=
Prognozy te muszą być uzupełnione błędami predykcji ex ante (bezwzględny, względny), a
także w miarę napływu informacji o realizacjach zmiennej prognozowanej – również błędami
prognoz ex post (bezwzględny, względny).
Schemat prognozowania na podstawie modelu trendu wykładniczego:
Hipoteza modelowa:
t
e
Y
t
t
η
α
α
1
0
=
Model ekonometryczny:
t
u
t
t
e
a
a
y
1
0
=
, t = 1,2,…, n
otrzymany na podstawie postaci logarytmowanej:
.
ln
ln
ln
1
0
t
t
u
a
t
a
y
+
+
=
interpretacja a
1
: wzrost zmiennej czasowej t o jednostkę (czyli o 1 okres, np. rok, lub inaczej z
roku na rok) powoduje wzrost zmiennej (bo a
t
y
1
>1) średnio o (a
1
-1)100%.
____________________________
Przyjęcie trendu wykładniczego jest równoważne z przyjęcie założenia o stałym tempie
wzrostu. Z tego powodu taki model w długim okresie jest niewiarygodny, bo żadna
gospodarka nie może rozwijać się w nieskończoność ze względu na ograniczoność zasobów
(wyjątek jest na razie jeden: Chiny, które w ostatnich 10-12 latach rozwijają się w tempie
średnio 10% rocznie). Kiedyś takie stałe tempo wzrostu zakładano dla dochodu narodowego
w Związku Radzieckim, tylko że już go nie ma.
____________________________
Ocena walorów prognostycznych tak jak w modelu trendu wielomianowego.
Predyktor:
T
Tp
a
a
y
1
0
=
, T = n+1, n+2,…, n+h
lub
, w wtedy prognozy dla zmiennej prognozowanej otrzymuje się po
zdelogarytmowaniu
.
1
0
ln
ln
ln
a
T
a
y
Tp
+
=
Tp
y
ln
Prognozy na h-okresów naprzód:
Wektory wartości zmiennych objaśniających
w okresie prognozowanym
1
0
,
1
ln
)
1
(
ln
ln
a
n
a
y
p
n
T
+
+
=
+
=
[
]
)
1
(
1
1
+
=
+
=
n
X
n
T
1
0
,
1
ln
)
2
(
ln
ln
a
n
a
y
p
n
T
+
+
=
+
=
[
]
)
2
(
1
2
+
=
+
=
n
X
n
T
…. ….
1
0
,
1
ln
)
(
ln
ln
a
h
n
a
y
p
n
T
+
+
=
+
=
[
]
)
(
1
h
n
X
h
n
T
+
=
+
=
Prognozy te muszą być uzupełnione błędami predykcji ex ante (bezwzględny, względny), a
także w miarę napływu informacji o realizacjach zmiennej prognozowanej – również błędami
prognoz ex post (bezwzględny, względny).
Ćwiczenie przykładowe (może znaleźć się na egzaminie)
W celu wyznaczenia prognozy zapotrzebowania przemysłu odzieżowego na tkaniny
bawełniane wykorzystano różne warianty modeli trendu. Oszacowane model dla lat 1970-
1999 mają postać:
t
y
t
ln
14
.
0
7
.
1
ˆ
ln
+
=
t
y
t
027
.
0
7
.
1
ˆ
ln
+
=
Należy dokonać oceny przydatności poszczególnych modeli do prognozowania ze względu na
poprawność interpretacji ekonomicznej.
Trend potęgowy:
1
0
ˆ
a
t
t
a
y
=
t
a
a
y
t
ln
ln
ˆ
ln
1
0
+
=
Trend wykładniczy:
t
t
a
a
y
1
0
ˆ =
t
a
a
y
t
)
(ln
ln
ˆ
ln
1
0
+
=
Stąd jeżeli
t
y
t
ln
14
.
0
7
.
1
ˆ
ln
+
=
to
47
.
5
7
.
1
0
=
= e
a
14
.
0
1
=
a
interpretacja a
1
(współczynnika
elastyczności): wzrost zmiennej czasowej t
o 1% powoduje wzrost zapotrzebowania na
tkaniny (bo a
1
>0) średnio o 0.14%
Ta interpretacja nie ma sensu
ekonomicznego, bo trudno operować 1%
wzrostem zmiennej t, gdy t jest zmienną
skokową.
Stąd jeżeli:
t
y
t
027
.
0
7
.
1
ˆ
ln
+
=
to:
47
.
5
7
.
1
0
=
= e
a
0274
.
1
027
.
0
1
=
= e
a
interpretacja a
1
: wzrost zmiennej czasowej t
o jednostkę (czyli o 1 okres, np. rok, lub
inaczej z roku na rok) powoduje wzrost
zapotrzebowania na tkaniny (bo a
1
>1)
średnio o (1.0274-1)100%, czyli o 2.74%.
Ta interpretacja ma sens ekonomiczny.
Trend logistyczny
(podaję jedynie jako pewną ciekawą koncepcję ze względu na zastosowania
m.in. do badania cyklu życia)
Trend logistyczny ma postać
t
t
e
Y
δ
β
α
−
+
=
1
ˆ
,
,
0
,
>
δ
α
.
1
>
β
_________
Zrobić wykres.
_________
Do punktu przegięcia (o współrzędnych
β
δ
ln
1
dla zmiennej czasowej oraz
2
/
α
dla zmiennej
Y) funkcja rośnie w tempie przyspieszonym, po czym rośnie w tempie malejącym do
asymptoty poziomej (poziom nasycenia -
α
).
Przebiegiem logistycznym charakteryzuje się wiele zjawisk przyrodniczych, m.in. rozwój
populacji żywych organizmów, rozwój nowych gałęzi przemysłu, zjawiska rynkowe dot.
popytu, rozpowszechnianie się innowacji, naśladownictwa, itp.
Zalety i wady prognozowania na podstawie modeli trendu
(takie pytanie jest w zestawie
pytań egzaminacyjnych)
Zalety Wady
- znane wartości zmiennych objaśniających,
bo zmienna t jest zmienną nielosową i jej
wartości od próby do próby nie zmieniają
się, są ustalone,
- prostota obliczeń, bo prognozy
wyznaczane są na zasadzie ekstrapolacji
modelu.
- nieograniczoność funkcji trendu, tj. funkcja
ta rośnie (maleje) nieograniczenie w miarę
jak zmienna t zmierza do nieskończoności,
- z powyższego powodu modele trendu
nadają się do prognozowania na ogół na
krótki horyzont czasowy.
__________________________
Tę nieograniczoność funkcji trendu można zilustrować zachowaniem się tych funkcji w
próbie, a później w okresie prognozowanym (por. wykresy poniżej, dla plonów pszenicy w
latach 1960-2003, prognozy zrobione na 10 lat naprzód).
w próbie
0.0
5.0
10.0
15.0
20.0
25.0
30.0
35.0
40.0
45.0
19
60
19
63
19
66
19
69
19
72
19
75
19
78
19
81
19
84
19
87
19
90
19
93
19
96
19
99
20
02
Serie1
Liniowy (Serie1)
Wielom. (Serie1)
Potęg. (Serie1)
Wykł. (Serie1)
w okresie prognozowanym
0.0
5.0
10.0
15.0
20.0
25.0
30.0
35.0
40.0
45.0
50.0
1960 1963 1966 1969 1972 1975 1978 1981 1984 1987 1990 1993 1996 1999 2002
Serie1
Liniowy (Serie1)
Wielom. (Serie1)
Potęg. (Serie1)
Wykł. (Serie1)
1.2. Prognozowanie na podstawie modeli trendu i sezonowości
Zakładamy, że struktura procesu ekonomicznego jest następująca:
.
t
t
t
t
S
P
Y
η
+
+
=
Składnik sezonowy (o stałej amplitudzie wahań) przedstawia się następująco:
t
S
∑
=
=
m
i
it
i
t
Q
d
S
1
przy warunku
,
∑
=
=
m
i
i
d
1
0
m – liczba podokresów w cyklu rocznym wahań, np. m= 12 dla danych miesięcznych, m=4
dla danych kwartalnych,
i
d
- wskaźniki sezonowości informujące o wielkości efektu sezonowego w danym podokresie
cyklu rocznego,
it
Q
- zero-jedynkowe zmienne sezonowe przyjmujące wartość 1 w danym podokresie cyklu, a
zero w pozostałych.
___________________
Rozpisać teraz zmienne zero-jedynkowe dla m = 4.
___________________
Model zatem trendu (np. przy założeniu trendu liniowego) i sezonowości ma postać:
∑
=
+
+
+
=
m
i
t
it
i
t
Q
d
t
Y
1
1
0
η
α
α
przy warunku
.
(1)
∑
=
=
m
i
i
d
1
0
Podać interpretację wskaźnika sezonowości korzystając z wykresu, a później słownie
stwierdzając, że jest to w przybliżeniu średnia arytmetyczna w odchyleń badanego zjawiska
od poziomu średniego liczona dla jednoimiennych podokresów.
Potem podać właściwą interpretację wskaźnika sezonowości .
i
d
Estymacja modelu (1)
Parametry tego modelu nie mogą być wprost szacowane za pomocą MNK ze względu na
współliniowość zmiennych zero-jedynkowych sezonowych z wyrazem wolnym (pokazać to
na wcześniej przedstawionej macierzy dla zmiennych
). Współliniowość ta powoduje, że
macierz
it
Q
X
X ′
jest macierzą osobliwą, a więc nie istnieje macierz odwrotna
. Stąd nie
jest możliwe wprost zastosowanie MNK.
1
)
(
−
′X
X
Będzie to możliwe jeżeli dokona się następującej korekty zmiennych zero-jedynkowych :
.
*
mt
it
it
Q
Q
Q
−
=
Pokazać, jak wygląda macierz po korekcie na zmiennych zero-jedynkowych i udowodnić, że
teraz zmienne te nie są współliniowe z wyrazem wolnym.
Model trendu i sezonowości po korekcie na zmiennych zero-jedynkowych ma postać:
∑
−
=
+
+
+
=
1
1
*
1
0
m
i
t
it
i
t
Q
d
t
Y
η
α
α
przy czym wskaźnik sezonowości
przy zmiennej
(usuniętej z macierzy) wyznacza się
z warunku
∑
, czyli
.
m
d
mt
Q
=
=
m
i
i
d
1
0
∑
−
=
−
=
1
1
m
i
i
m
d
d
Weryfikacja modelu trendu i sezonowości
(1) badanie istotności parametrów (będzie na egzaminie)
Aby wystąpiły wahania sezonowe przynajmniej jeden wskaźnik sezonowości musi być
istotny statystycznie. Wtedy w modelu pozostają wszystkie zmienne zero-jedynkowe
sezonowe. Jeżeli wszystkie parametry (wskaźniki sezonowości) są nieistotne, to eliminujemy
wszystkie zmienne
(czyli znika człon sezonowy).
*
it
Q
_____________
Przy badaniu istotności wskaźników sezonowości wyjaśnić, co to jest poziom p (empiryczny
poziom istotności).
poziom istotności
α
wartość p (empiryczny poziom istotności)
α
α
=
≥
)
|
(|
,s
t
t
P
przy czym
jest wartością krytyczną
odczytaną z tablic t-Studenta dla poziomu
istotności
s
t
,
α
α
i liczby stopni swobody s.
Wtedy porównuje się wyliczoną statystykę
testową
w wartością krytyczną
.
obl
t
s
t
,
α
Decyzja weryfikacyjna:
- gdy
odrzucamy
przy poziomie
istotności
s
obl
t
t
,
|
|
α
≥
0
H
α
i można wnioskować, że parametr
(wskaźnik sezonowości jest istotny
statystycznie).
i
d
- gdy
, to brak podstaw do odrzucenia
, że wskaźnik sezonowości jest nieistotny
statystycznie.
s
obl
t
t
,
|
|
α
<
0
H
i
d
p
wartosc
t
t
P
obl
=
≥
)
|
(|
Zatem wartość p wyznacza
prawdopodobieństwo, z jakim odrzucilibyśmy
hipotezę zerową, gdyby obszar krytyczny
rozpoczynał się od wartości obliczonej statystyki
(tu: t-Studenta, czyli
). Wtedy porównuje się
poziom istotności
obl
t
α
z wartością p.
Decyzja weryfikacyjna:
- gdy
α
≤
p
wartosc
, to odrzucamy
,
ponieważ jest bardzo mało prawdopodobne
otrzymanie wartości statystyki
w rozkładzie
zmiennej t-Studenta przy założeniu prawdziwości
.
0
H
obl
t
0
H
- gdy
α
>
p
wartosc
, brak podstaw do
odrzucenia
, ponieważ jest wysokie
prawdopodobieństwo otrzymania statystyki
w rozkładzie zmiennej t przy założeniu
prawdziwości
; jest to zatem typowa wartość
w rozkładzie zmiennej t-Studenta.
0
H
obl
t
0
H
Przykład:
Załóżmy, że przy weryfikacji
0
:
1
0
=
d
H
obliczona wartość statystyki t-Studenta wynosi:
z wartością p równą 0.0039, a poziom istotności
66
.
2
=
obl
t
05
.
0
=
α
, co przy dużej liczbie
obserwacji daje wartość krytyczną
.
96
.
1
,
=
s
t
α
Graficzną prezentację tej sytuacji przedstawia wykres:
_____________
(2) badanie własności rozkładu składnika resztowego (tu można pominąć, będzie to na
ćwiczeniach, i powtarza się to z modelu trendu),
(3) ocena dopasowania modelu do danych empirycznych (tu już ma być wysokie
dopasowanie modelu).
(4) na koniec ocena walorów prognostycznych.
Schemat prognozowania na podstawie modelu trendu liniowego i sezonowości periodycznej
Hipoteza modelowa:
t
m
i
it
i
t
Q
d
t
Y
η
α
α
+
+
+
=
∑
−
=
1
1
*
1
0
Model ekonometryczny:
t
m
i
it
i
t
u
Q
d
t
a
a
y
+
+
+
=
∑
−
=
1
1
*
1
0
ˆ
, t = 1,2,…, n
Zakłada się, że model ten posiada walory prognostyczne, tj. ma istotne parametry, pożądane
własności procesu resztowego (brak autokorelacji, homoscedastyczność, normalność),
wysokie dopasowanie modelu do danych empirycznych.
Predyktor:
∑
−
=
+
+
=
1
1
*
1
0
ˆ
m
i
it
i
Tp
Q
d
T
a
a
y
, T = n+1, n+2,…, n+h
Prognozy na h-okresów naprzód:
Wektory wartości zmiennych objaśniających w
okresie prognozowanym
∑
−
=
+
=
+
=
+
+
+
=
1
1
*
1
,
1
0
,
1
ˆ
)
1
(
m
i
n
T
i
i
p
n
T
Q
d
n
a
a
y
[
]
1
,
1
*
1
,
2
*
1
,
1
*
1
...
1
1
+
−
+
+
+
=
+
=
n
m
n
n
n
T
Q
Q
Q
n
X
∑
−
=
+
=
+
=
+
+
+
=
1
1
*
2
,
1
0
,
2
ˆ
)
1
(
m
i
n
T
i
i
p
n
T
Q
d
n
a
a
y
[
]
2
,
1
*
2
,
2
*
2
,
1
*
2
...
2
1
+
−
+
+
+
=
+
=
n
m
n
n
n
T
Q
Q
Q
n
X
…. ….
∑
−
=
+
=
+
=
+
+
+
=
1
1
*
,
1
0
,
ˆ
)
1
(
m
i
h
n
T
i
i
p
h
n
T
Q
d
n
a
a
y
[
]
h
n
m
h
n
h
n
h
n
T
Q
Q
Q
h
n
X
+
−
+
+
+
=
+
=
,
1
*
,
2
*
,
1
*
...
1
Wektory zmiennych objaśniających w okresie prognozowanym rozpisać dla konkretnego
przykładu (zapisy te będą na egzaminie).
Model trendu i sezonowości o zmiennej amplitudzie wahań
Najpierw podać przykłady ekonomiczne, kiedy mamy do czynienia z sezonowością o
zmiennej amplitudzie wahań – zrobić wykresy.
Model trendu liniowego i sezonowości zmiennej (co do amplitudy) ma postać:
∑
=
+
+
+
+
=
m
i
t
it
i
i
t
Q
t
d
d
t
Y
1
1
0
1
0
)
(
η
α
α
przy warunkach:
∑
,
∑
.
=
=
m
i
i
d
1
0
0
=
=
m
i
i
d
1
1
0
_________
Rozpisać macierz obserwacji: dla zmiennych
i
np. dla m=4.
it
Q
it
tQ
_________
Następnie wskazać, że podobnie jak dla sezonowości periodycznej, zachodzi współliniowość
zmiennych: zmienne zero-jedynkowe
są współliniowe z wyrazem wolnym, a zmienne
są współliniowe ze zmienną t (jeżeli występuje w modelu, a tu: występuje).
it
Q
it
tQ
Konieczna jest też transformacja zmiennych
wg zasady
it
Q
.
*
mt
it
it
Q
Q
Q
−
=
_________
Zapisać tę nową macierz.
_________
Modele trendu i sezonowości zmiennej po korekcie na zmiennych
ma postać:
it
Q
∑
−
=
+
+
+
+
=
1
1
*
1
0
1
0
)
(
m
i
t
it
i
i
t
Q
t
d
d
t
Y
η
α
α
,
(2)
przy czym brakujące wskaźniki sezonowości oblicza się na podstawie warunków:
,
,
∑
=
=
m
i
i
d
1
0
0
∑
=
=
m
i
i
d
1
1
0
tzn.
.
,
1
1
0
0
∑
−
=
−
=
m
i
i
m
d
d
∑
−
=
−
=
1
1
1
1
m
i
i
m
d
d
Aby wystąpiła zmienna sezonowość przynajmniej jeden z parametrów
musi być istotny
statystycznie. Jeżeli wszystkie parametry
są nieistotne, to model (2) redukuje się do
modelu sezonowości periodycznej (por. model (1)).
i
d
1
i
d
1
Przykład wskaźników sezonowości zmiennej:
Aby ocenić wielkość wahań sezonowych i ich przebieg należy obliczyć
dla całego
badanego okresu.
t
d
d
i
i
1
0
ˆ
ˆ +
Wartości te, dla przewozów osób (w mln osób) przez PKP w latach 1961-1965, przedstawia
poniższa tabela (por. Z. Zieliński, Metody analizy dynamiki i rytmiczności zjawisk
gospodarczych, s. 154-156, PWN, Warszawa 1979)
rok miesiąc
efekt
sezonowy
1961 1
-1.92
2
-4.48
3
-0.57
4
-1.19
5
-0.32
6
-3.26
7
-0.49
8
1.23
9
3.79
10
1.55
11
2.43
12
2.21
1962 1
-1.17
2
-4.01
3
-0.74
4
-0.43
5
-0.13
6
-3.96
7
-1.58
8
0.22
9
4.38
10
2.04
11
0.89
12
2.83
1963 1
-0.43
2
-3.5
3
0.41
4
0.32
5
0.05
6
-4.67
7
-2.66
8
-0.8
9
4.97
10
2.53
11
-0.64
12
3.45
1964 1
0.32
2
-3.08
3
0.91
4
1.07
5
0.22
6
-5.37
7
-3.75
8
-1.82
9
5.67
10
3.02
11
-2.18
12
4.07
1965 1
1.06
2
-2.62
3
1.41
4
1.83
5
0.41
6
-6.07
7
-4.83
8
-2.84
9
6.15
10
3.52
11
-3.72
12
4.7
-8
-6
-4
-2
0
2
4
6
8
1
4
7 10 13 16 19 22 25 28 31 34 37 40 43 46 49 52 55 58
Wykres 2. Efekty sezonowe (zmienne) przewozów osób przez PKP w poszczególnych
miesiącach w latach 1961-65
Omówić zmiany w amplitudzie wahań.
________________
1.3. Prognozowanie na podstawie modelu autoregresji
Zapis tradycyjny: Proces autoregresji rzędu q o średniej zero ma postać:
∑
−
−
−
−
−
+
=
+
+
+
+
=
q
s
t
s
t
s
t
q
t
q
t
t
t
Y
Y
Y
Y
Y
1
2
2
1
1
ε
α
ε
α
α
α
K
,
gdzie
0
≠
q
α
,
0
)
(
=
−
t
s
t
Y
E
ε
-
dla s=1,2,……,q nie są skorelowane z
s
t
Y
−
t
ε
, a
t
ε
jest białym
szumem.
Jeżeli średnia procesu jest różna od zera, to w zapisie modelu AR(q) pojawi się jeszcze
wyraz wolny, czyli wystąpi
t
Y
0
α
.
Zapis z wykorzystanie operatora cofnięcia
Operator cofnięcia u działa na proces w następujący sposób:
t
Y
s
t
t
s
Y
Y
u
−
=
.
np.
s
t
t
s
t
t
t
t
t
t
Y
Y
u
Y
Y
u
Y
Y
u
Y
uY
−
−
−
−
=
=
=
=
...
3
3
2
2
1
Wtedy proces autoregresji rzędu q ma postać:
t
q
t
q
t
t
t
Y
Y
Y
Y
ε
α
α
α
=
−
−
−
−
−
−
−
K
2
2
1
1
t
t
q
q
Y
u
u
u
ε
α
α
α
=
−
−
−
−
)
...
1
(
2
2
1
t
t
Y
u
A
ε
=
)
(
gdzie
.
)
...
1
(
)
(
2
2
1
q
q
u
u
u
u
A
α
α
α
−
−
−
−
=
Warunki stacjonarności procesu autoregresyjnego:
1. Podać warunki nałożone na parametry dla AR(1) i AR(2).
AR(1):
t
t
t
Y
Y
ε
α
+
=
−1
1
jest stacjonarny, jeżeli
.
1
1
<
α
AR(2):
t
t
t
t
Y
Y
Y
ε
α
α
+
+
=
−
−
2
2
1
1
jest stacjonarny, jeżeli
1
1
2
<
−
α
α
1
1
2
<
+
α
α
.
1
2
<
α
Dla wyższych rzędów autoregresji warunki nałożone na parametry są coraz bardziej
złożone, dlatego wtedy łatwiej korzystać z warunku ogólnego dot. pierwiastków
równania
0
|
)
(
|
=
z
A
.
2. Potem warunek ogólny dotyczący pierwiastków równania
0
|
)
(
|
=
z
A
, tj. wszystkie
pierwiastki równania
są co do modułu większe od jedności.
0
|
)
(
|
=
z
A
Podać przykłady ekonomiczne procesów autoregresyjnych, np. popyt na dobra
konsumpcyjne, nakłady inwestycyjne charakteryzują się inercją (wyjaśnić słowo inercja, bo
nie wszyscy studenci wiedzą).
Estymacja modelu autoregresji rzędu q
Do szacowania parametrów modelu autregresyjnego o postaci
t
q
t
q
t
t
t
Y
Y
Y
Y
ε
α
α
α
α
+
+
+
+
+
=
−
−
−
K
2
2
1
1
0
stosuje się estymator wg metody najmniejszych kwadratów, tj.
,
y
X
X
X
a
′
′
=
−1
)
(
przy czym X – macierz zaobserwowanych wartości zmiennych objaśniających modelu (tutaj
są to opóźnienia
), a y – wektor obserwacji na zmiennej objaśnianej y. Macierz X i wektor
y mają postać:
s
t
y
−
⎥
⎥
⎥
⎥
⎥
⎦
⎤
⎢
⎢
⎢
⎢
⎢
⎣
⎡
=
−
−
−
+
−
q
n
n
n
q
q
q
q
y
y
y
y
y
y
y
y
y
X
K
M
L
M
M
M
K
K
2
1
2
1
1
1
1
1
1
,
.
⎥
⎥
⎥
⎥
⎦
⎤
⎢
⎢
⎢
⎢
⎣
⎡
=
+
+
n
q
q
y
y
y
y
M
2
1
Przykład:
Szereg czasowy dotyczący zmiennej ma postać:
t
y
⎥
⎥
⎥
⎥
⎥
⎥
⎥
⎥
⎥
⎥
⎥
⎥
⎥
⎥
⎦
⎤
⎢
⎢
⎢
⎢
⎢
⎢
⎢
⎢
⎢
⎢
⎢
⎢
⎢
⎢
⎣
⎡
=
68
65
62
58
56
63
51
44
48
45
y
. Zapisz macierz obserwacji X i wektor y dla szacowania modelu autoregresji:
a) rzędu pierwszego
b) rzędu drugiego.
Zapisz ogólną postać tych modeli.
ad. a)
⎥
⎥
⎥
⎥
⎥
⎥
⎥
⎥
⎥
⎥
⎥
⎥
⎦
⎤
⎢
⎢
⎢
⎢
⎢
⎢
⎢
⎢
⎢
⎢
⎢
⎢
⎣
⎡
=
68
65
62
58
56
63
51
44
48
y
,
⎥
⎥
⎥
⎥
⎥
⎥
⎥
⎥
⎥
⎥
⎥
⎥
⎦
⎤
⎢
⎢
⎢
⎢
⎢
⎢
⎢
⎢
⎢
⎢
⎢
⎢
⎣
⎡
=
65
1
62
1
58
1
56
1
63
1
51
1
44
1
48
1
45
1
X
ad. b)
⎥
⎥
⎥
⎥
⎥
⎥
⎥
⎥
⎥
⎥
⎥
⎦
⎤
⎢
⎢
⎢
⎢
⎢
⎢
⎢
⎢
⎢
⎢
⎢
⎣
⎡
=
68
65
62
58
56
63
51
44
y
,
.
⎥
⎥
⎥
⎥
⎥
⎥
⎥
⎥
⎥
⎥
⎥
⎦
⎤
⎢
⎢
⎢
⎢
⎢
⎢
⎢
⎢
⎢
⎢
⎢
⎣
⎡
=
62
65
1
58
62
1
56
58
1
63
56
1
51
63
1
44
51
1
48
44
1
45
48
1
X
____________
Skomentować, że wyjściowy szereg ulega skróceniu o q-obserwacji.
____________
Ustalanie rzędu autoregresji – test Quenouille’a
Do ustalania rzędu autoregresji można wykorzystać dwie metody:
1. Poprzez badanie istotności współczynników autoregresji oraz badanie
białoszumowości składnika resztowego w modelach autoregresji rzędu s, s=1,2,…,q,
2. Poprzez badanie istotności współczynników autokorelacji cząstkowej – test
Quenouille’a.
Ad. 1.
Szacuje się modele autoregresji kolejnych rzędów, np.
- wersja od dołu do góry (od najniższego rzędu autoregresji do najwyższego)
t
t
t
u
y
a
a
y
+
+
=
−1
1
0
t
t
t
t
u
y
a
y
a
a
y
+
+
+
=
−
−
2
2
1
1
0
t
t
t
t
t
u
y
a
y
a
y
a
a
y
+
+
+
+
=
−
−
−
3
3
2
2
1
1
0
t
t
t
t
t
t
u
y
a
y
a
y
a
y
a
a
y
+
+
+
+
+
=
−
−
−
−
4
4
3
3
2
2
1
1
0
…..
Za pomocą testu t-Studenta sprawdza się istotność współczynników autoregresji od ,
poprzez kolejne, aż do pierwszego nieistotnego, a także testuje się brak autokorelacji reszt
za pomocą testu Durbina-Watsona lub testu Quenouille’a.
1
a
t
u
- wersja od góry do dołu (od pewnego maksymalnego rzędu autoregresji, np.
, do
najniższego)
4
max
=
q
t
t
t
t
t
t
u
y
a
y
a
y
a
y
a
a
y
+
+
+
+
+
=
−
−
−
−
4
4
3
3
2
2
1
1
0
t
t
t
t
t
u
y
a
y
a
y
a
a
y
+
+
+
+
=
−
−
−
3
3
2
2
1
1
0
t
t
t
t
u
y
a
y
a
a
y
+
+
+
=
−
−
2
2
1
1
0
….
Za pomocą testu t-Studenta sprawdza się istotność współczynników autoregresji od ,
poprzez kolejne
, aż do pierwszego istotnego, a także testuje się brak autokorelacji
reszt za pomocą testu Durbina-Watsona lub testu Quenouille’a.
4
a
,...
2
,
3
a
a
t
u
Ad. 2. Test Quenouille’a
Najpierw wyjaśnić co to jest współczynnik autokorelacji cząstkowej.
Załóżmy, że chcemy obliczyć autokorelację (zwykłą) między a
, dla różnego q.
t
y
q
t
y
−
Autokorelacja między a
t
y
q
t
y
−
t
y
1
−
t
y
1
ˆ
ρ
→
współczynnik autokorelacji rzędu pierwszego
t
y
2
−
t
y
1
ˆ
ρ
→
współczynnik autokorelacji rzędu drugiego
t
y
3
−
t
y
1
ˆ
ρ
→
współczynnik autokorelacji rzędu trzeciego
t
y
4
−
t
y
1
ˆ
ρ
→
współczynnik autokorelacji rzędu czwartego
…..
….
t
y
q
t
y
−
1
ˆ
ρ
→
współczynnik autokorelacji rzędu q
Są to współczynniki autokorelacji całkowitej
mierzące autokorelację między
a
bez
wyłączenia wpływu opóźnień pośrednich, tj. np.
dla autokorelacji między
a
są to:
. Współczynniki
t
y
1
−
t
y
t
y
3
−
t
y
2
1
,
−
−
t
t
y
y
τ
ρ
ˆ
tworzą funkcję
autokorelacji całkowitej ACF.
Autokorelacja między a
t
y
q
t
y
−
t
y
1
−
t
y
11
ˆ
ρ
→
współ. autokorelacji cząstkowej rzędu pierwszego
t
y
1
−
t
y
1
−
t
y
22
ˆ
ρ
→
współ. autokorelacji cząstkowej rzędu drugiego
t
y
1
−
t
y
1
−
t
y
3
−
t
y
33
ˆ
ρ
→
współ. autokorelacji cząstkowej rzędu trzeciego
t
y
1
−
t
y
1
−
t
y
3
−
t
y
4
−
t
y
44
ˆ
ρ
→
współ. autokorelacji cząstkowej rzędu czwartego
…..
….
t
y
1
−
t
y
1
−
t
y
3
−
t
y
…..
q
t
y
−
ρ
ˆ
→
współ, autokorelacji cząstkowej rzędu q
Są to współczynniki autokorelacji cząstkowej mierzące
autokorelację między
a
z wyłączeniem
wpływu opóźnień pośrednich, tj. np. dla autokorelacji
między
a
są to:
. Współczynniki
t
y
1
−
t
y
t
y
3
−
t
y
2
1
,
−
−
t
t
y
y
ττ
ρ
ˆ
tworzą funkcję autokorelacji cząstkowej PACF.
Współczynniki autokorelacji cząstkowej oblicza się z równań Yule’a-Walkera (por. Box,
Jenkins, Analiza szeregów czasowych, PWE, Warszawa, 1986, na wykładzie nie będzie tych
równań). Jednak w przybliżeniu współczynniki autokorelacji cząstkowej są równe
współczynnikom autoregresji najwyższego rzędu (
) w modelach autoregresji kolejnych
rzędów (
ττ
a
q
,...
2
,
1
=
τ
), tj.
t
t
t
u
y
a
a
y
+
+
=
−1
11
01
11
11
ˆ
ρ
≈
a
t
t
t
t
u
y
a
y
a
a
y
+
+
+
=
−
−
2
22
1
12
02
22
22
ˆ
ρ
≈
a
t
t
t
t
t
u
y
a
y
a
y
a
a
y
+
+
+
+
=
−
−
−
3
33
2
23
1
13
03
33
33
ˆ
ρ
≈
a
t
t
t
t
t
t
u
y
a
y
a
y
a
y
a
a
y
+
+
+
+
+
=
−
−
−
−
4
44
3
34
2
24
1
14
04
44
44
ˆ
ρ
≈
a
…..
….
W teście Quenouille’a weryfikuję się hipotezę:
,
0
:
0
=
ττ
ρ
H
q
,
,
2
,
1 K
=
τ
(współczynnik autokorelacji cząstkowej rzędu
τ
jest nieistotny
statystycznie)
wobec alternatywnej:
,
0
:
1
≠
ττ
ρ
H
(współczynnik autokorelacji cząstkowej rzędu
τ
jest istotny
statystycznie)
Test statystyczny:
n
std
t
1
ˆ
)
ˆ
(
ˆ
ττ
ττ
ττ
τ
ρ
ρ
ρ
=
=
,
n
std
n
1
)
ˆ
(
1
)
ˆ
var(
=
⇒
=
ττ
ττ
ρ
ρ
Jeżeli statystyka jest co do bezwzględnej wartości większa równa ok. 2, to odrzucamy
.
Stąd zamiast wyznaczać wartość dla różnych
τ
, to stosuje się następującą praktyczną
zasadę:
τ
t
0
H
τ
t
jeżeli
n
2
|
ˆ
|
≥
ττ
ρ
, to odrzucamy H
0
i mamy prawo sądzić, że współczynniki autokorelacji
cząstkowej rzędu
τ
jest istotny statystycznie, czyli występuje autokorelacja co najmniej
co najmniej rzędu
τ
(dla procesu czy też dla reszt, zależy, czego dotyczy badanie),
t
Y
jeżeli
n
2
|
ˆ
|
<
ττ
ρ
, to nie ma podstaw do odrzucenia H
0
, tzn. współczynnik autokorelacji
cząstkowej rzędu
τ
jest nieistotny statystycznie, tj. nie występuje autokorelacja rzędu
τ
(dla procesu czy też dla reszt, zależy, czego dotyczy badanie).
t
Y
Dla procesu autoregresji rzędu
τ
zachodzi zatem:
⎩
⎨
⎧
>
=
≤
≠
q
q
τ
ρ
τ
ρ
ττ
ττ
,
0
,
0
Ustalanie rzędu autoregresji za pomocą badania istotności współczynników autokorelacji
cząstkowej w wersji:
a) od dołu do góry (od
τ
= 1, 2,…., q)
b) od góry do dołu (od
1
,.....,
max
q
=
τ
, bardziej zalecana).
ad a) od dołu do góry
-0.6
-0.4
-0.2
0
0.2
0.4
0.6
0.8
1
1
2
3
4
5
6
7
______________
podać opisy osi, a cały wykres narysować na tablicy, tak, żeby studenci robili to równolegle.
Wtedy zrobią dobre notatki.
______________
Załóżmy, że n=36, a zatem
33
.
0
2 =
n
τ
PACF
ττ
ρ
ˆ
testowanie
1 0.7955
11
ˆ
ρ
>0.33, a zatem odrzuca się H0 przy poziomie istotności
α
i można
wnioskować, że współczynnik autokorelacji cząstkowej rzędu pierwszego
11
ρ
dla
jest istotny statystycznie. Zatem rząd autoregresji dla
jest
co najmniej 1. I przechodzimy do testowania współczynnika autokorelacji
cząstkowej rzędu wyższego niż 1. DALEJ
t
Y
t
Y
2
-0.3711
|
ˆ
|
22
ρ
>0.33, a zatem odrzuca się H0 przy poziomie istotności
α
i można
wnioskować, że współczynnik autokorelacji cząstkowej rzędu drugiego
22
ρ
dla
jest istotny statystycznie. Zatem rząd autoregresji dla
jest
co najmniej 2. I przechodzimy do testowania kolejnego współczynnika
autokorelacji cząstkowej rzędu wyższego niż 2. DALEJ
t
Y
t
Y
3 0.1684
33
ˆ
ρ
<0.33, a zatem brak podstaw do odrzucenia H0, że współczynnik
autokorelacji cząstkowej rzędu trzeciego
33
ρ
dla
jest nieistotny
statystycznie. Zatem rząd autoregresji dla
jest równy 2 (czyli wracamy
do kroku poprzedniego). I procedura ustalania rzędu autoregresji kończy
się. STOP.
t
Y
t
Y
4 0.389
↓
5 0.0683
6 -0.1191
7 -0.0947
ad. b) od góry do dołu
τ
PACF
ττ
ρ
ˆ
testowanie
1 0.7955
2
-0.3711
3 0.1684
4 0.389
33
ˆ
ρ
>0.33, a zatem odrzuca się H0 przy poziomie istotności
α
i można
wnioskować, że współczynnik autokorelacji cząstkowej rzędu 3
33
ρ
dla
jest istotny statystycznie. Zatem rząd autoregresji dla
jest równy 3. I
procedura testowania kończy się. STOP
t
Y
t
Y
5 0.0683
55
ˆ
ρ
<0.33, a zatem brak podstaw do odrzucenia H0, że współczynnik
autokorelacji cząstkowej rzędu 5
55
ρ
dla
jest nieistotny statystycznie.
Zatem rząd autoregresji dla
jest niższy niż 5. I przechodzimy do
testowania kolejnego współczynnika autokorelacji cząstkowej, rzędu
niższego niż 5. DALEJ
t
Y
t
Y
6 -0.1191
|
ˆ
|
66
ρ
<0.33, a zatem brak podstaw do odrzucenia H0, że współczynnik
autokorelacji cząstkowej rzędu 6
66
ρ
dla
jest nieistotny statystycznie.
Zatem rząd autoregresji dla
jest niższy niż 6. I przechodzimy do
testowania kolejnego współczynnika autokorelacji cząstkowej, rzędu
niższego niż 6. DALEJ
t
Y
t
Y
7 -0.0947
|
ˆ
|
77
ρ
<0.33, a zatem brak podstaw do odrzucenia H0, że współczynnik
autokorelacji cząstkowej rzędu siódmego
77
ρ
dla
jest nieistotny
statystycznie. Zatem rząd autoregresji dla
jest niższy niż 7. I
przechodzimy do testowania kolejnego współczynnika autokorelacji
cząstkowej, rzędu niższego niż 7. DALEJ
t
Y
t
Y
↑
___________________
Podać komentarz na temat różnych rzędów autoregresji w wersji od dołu do góry i od góry do
dołu.
___________________
Schemat prognozowania na podstawie modelu autoregresyjnego
Hipoteza modelowa:
t
q
t
q
t
t
t
Y
Y
Y
Y
ε
α
α
α
α
+
+
+
+
+
=
−
−
−
K
2
2
1
1
0
Model ekonometryczny:
t
q
t
q
t
t
t
u
y
a
y
a
y
a
a
y
+
+
+
+
+
=
−
−
−
K
2
2
1
1
0
Predyktor:
q
T
q
T
T
Tp
y
a
y
a
y
a
a
y
−
−
−
+
+
+
+
=
K
2
2
1
1
0
Prognozy na h-okresów naprzód
Wartości zmiennych objaśniających w
okresie prognozowanym
q
n
q
n
n
p
n
y
a
y
a
y
a
a
y
−
+
−
+
+
+
+
+
=
1
1
2
1
0
,
1
ˆ
K
[
]
q
n
n
n
n
T
y
y
y
X
−
+
−
+
=
=
1
1
1
...
1
2
2
,
1
1
0
,
2
ˆ
ˆ
+
−
+
+
+
+
+
+
=
q
n
q
n
p
n
p
n
y
a
y
a
y
a
a
y
K
[
]
q
n
n
p
n
n
T
y
y
y
X
−
+
+
+
=
=
2
,
1
2
...
ˆ
1
M
M
p
q
h
n
q
p
h
n
p
h
n
p
h
n
y
a
y
a
y
a
a
y
,
,
2
2
,
1
1
0
,
ˆ
ˆ
ˆ
ˆ
−
+
−
+
−
+
+
+
+
+
+
=
K
[
]
p
q
h
n
p
h
n
p
h
n
h
n
T
y
y
y
X
,
,
2
,
1
ˆ
...
ˆ
ˆ
1
−
+
−
+
−
+
+
=
=
Ćwiczenia przykładowe (będzie na 100% na egzaminie)
Zapisz hipotezę modelową, model ekonometryczny, predyktor i prognozy na 3 okresy
naprzód dla:
- modelu trendu liniowego i autoregresji rzędu pierwszego,
- modelu trendu kwadratowego i autoregresji rzędu drugiego,
- modelu trendu liniowego i autoregresji rzędu trzeciego.
2. Prognozowanie na podstawie modeli przyczynowo-skutkowych
_________
Przedstawić schemat budowy dynamicznego modelu zgodnego (jest w materiałach Moodle’a
wcześniej) najpierw na przykładzie ogólnym, potem na przykładzie z zadaną strukturą
procesów Y
t
i X
t
.
_________
Schemat prognozowania na podstawie modeli przyczynowo-skutkowych (prognozowanie
pośrednie)
y
1
, y
2,…,
y
n
przeszłość
Model
x
11
, x
12,…,
x
1n
x
21
, x
22,…,
x
2n
….
x
k1
, x
k2,…,
x
kn
przeszłość
y
*
n+1
, y
*
n+2,…,
y
*
n+h
przyszłość
Reguła
prognozowania
x
*
1,n+1
, x
*
1,n+2,…,
x
*
1,n+h
x
*
2,n+1
, x
*
2,n+2,…,
x
*
2,n+h
….
x
*
k,n+1
, x
*
k,n+2,…,
x
*
k,n+h
przyszłość
prognozy lb decyzje
_________
Przypomnieć budowę modelu zgodnego dla procesów niestacjonarnych.
Najlepiej na przykładzie ogólnym, ale z zadaną strukturą procesów Y
t
i X
t
.
_________
Zwrócić uwagę, że zanim przystąpimy do prognozowania należy ocenić przydatność
prognostyczną modelu.
Model ma przydatność prognostyczną (walory prognostyczne) jeżeli:
(1) dopasowanie: model jest dość dobrze dopasowany do danych empirycznych, przyjąć
kryterium np. R
2
g
=80%, oraz V
u
*
=15%,
(2) parametry: są istotne statystycznie, są
stabilne
, mają sensowną interpretację
ekonomiczną,
(3) rozkład składnika losowego: rozkład normalny, homoscedastyczny, brak
autokorelacji,
(4) postać zależności (stabilna, niestabilna): zależność ma charakter liniowy.
Gdyby określić ważność poszczególnych kryteriów to kolejność byłaby następująca:
- stabilność parametrów i sensowna interpretacja ekonomiczna,
- homoscedastyczność wariancji resztowej (jest to warunek dla stosowania testu F, a więc i
testu stabilności),
- normalność rozkładu reszt (warunek dla stosowania testu istotności t, F),
- liniowość zależności,
- istotność parametrów,
- brak autokorelacji składnika losowego (pogarsza jedynie efektywność estymatora),
- dopasowanie modelu do danych empirycznych (dobre dopasowanie modelu w próbie nie
zapewnia dobrego zachowania modelu poza próbą, czyli niekoniecznie daje małe błędy
prognozy).
____________
Przedstawić test stabilności Chowa, test nieliniowości White’a (dla logarytmów, dla
kwadratów zmiennych objaśniających).
Źródło: T. Kufel, Ekonometria. Rozwiązywanie problemów z wykorzystaniem programu
Gretl, PWN, Warszawa 2007.
____________
Schemat prognozowania na podstawie modelu przyczynowo skutkowego
Załóżmy, że hipoteza modelowa ma postać:
t
t
t
t
t
t
X
X
Y
Y
ε
δ
α
α
α
α
+
+
+
+
+
+
=
−
−
1
1
,
2
3
,
1
2
1
1
0
Model ekonometryczny:
t
t
t
t
t
u
t
x
x
y
y
+
+
+
+
+
=
−
−
1
1
,
2
3
,
1
2
1
1
0
ˆ
ˆ
ˆ
ˆ
ˆ
δ
α
α
α
α
Predyktor:
T
x
x
y
y
T
T
T
Tp
1
1
,
2
3
,
1
2
1
1
0
ˆ
ˆ
ˆ
ˆ
ˆ
ˆ
δ
α
α
α
α
+
+
+
+
=
−
−
Ze względu na to, że w modelu występują zmienne objaśniające, których wartości nie znamy
w przyszłości, trzeba wyznaczyć prognozy dla zmiennych objaśniających, np. na podstawie
modeli struktury. Oznacza to, że zanim przystąpimy do prognozowania zmiennej objaśnianej,
konieczny jest etap pośredni, tj. wyznaczenie prognoz dla zmiennych objaśniających.
Załóżmy, że struktura zmiennych objaśniających była następująca:
Proces r q
X
1,t
0 2
X
2,t
1 1
Zatem odpowiednie modele struktury przyjmą postać:
t
t
t
t
X
X
X
1
2
,
1
2
1
,
1
1
0
,
1
ε
β
β
β
+
+
+
=
−
−
t
t
t
t
X
X
2
3
1
,
2
1
0
,
2
ε
γ
γ
γ
+
+
+
=
−
Wyznaczenie prognoz dla zmiennych objaśniających:
I.
Hipoteza modelowa:
t
t
t
t
X
X
X
1
2
,
1
2
1
,
1
1
0
,
1
ε
β
β
β
+
+
+
=
−
−
Model ekonometryczny:
t
t
t
t
u
x
x
x
1
2
,
1
2
1
,
1
1
0
,
1
ˆ
ˆ
ˆ
+
+
+
=
−
−
β
β
β
Predyktor:
2
,
1
2
1
,
1
1
0
,
1
ˆ
ˆ
ˆ
−
−
+
+
=
T
T
Tp
x
x
x
β
β
β
Prognozy na h-okresów naprzód
Wartości zmiennych objaśniających w
okresie prognozowanym
1
,
1
2
,
1
1
0
,
1
,
1
ˆ
ˆ
ˆ
−
+
+
+
=
n
n
p
n
x
x
x
β
β
β
[
]
1
1
1
−
+
=
=
n
n
n
T
x
x
X
n
p
n
p
n
x
x
x
,
1
2
,
1
,
1
1
0
,
1
,
1
ˆ
ˆ
ˆ
β
β
β
+
+
=
+
+
[
]
1
,
1
2
1
−
+
+
=
=
n
p
n
n
T
x
x
X
M
M
p
h
n
p
h
n
p
h
n
x
x
x
,
2
,
1
2
,
1
,
1
1
0
,
,
1
ˆ
ˆ
ˆ
−
+
−
+
+
+
+
=
β
β
β
[
]
2
,
1
1
−
+
−
+
+
=
=
h
n
p
h
n
h
n
T
x
x
X
II.
Hipoteza modelowa:
t
t
t
t
X
X
2
3
1
,
2
1
0
,
2
ε
γ
γ
γ
+
+
+
=
−
Model ekonometryczny:
t
t
t
u
t
x
x
2
3
1
,
2
1
0
,
2
ˆ
ˆ
ˆ
+
+
+
=
−
γ
γ
γ
Predyktor:
T
x
x
T
T
3
1
,
2
1
0
,
2
ˆ
ˆ
ˆ
γ
γ
γ
+
+
=
−
Prognozy na h-okresów naprzód
Wartości zmiennych objaśniających w
okresie prognozowanym
)
1
(
ˆ
ˆ
ˆ
3
,
2
1
0
,
1
,
2
+
+
+
=
+
n
x
x
n
p
n
γ
γ
γ
[
]
1
1
1
+
=
+
=
n
x
X
n
n
T
)
2
(
ˆ
ˆ
ˆ
3
,
1
,
2
1
0
,
2
,
2
+
+
+
=
+
+
n
x
x
p
n
p
n
γ
γ
γ
[
]
2
1
,
1
2
+
=
+
+
=
n
x
X
p
n
n
T
M
M
)
(
ˆ
ˆ
ˆ
3
1
,
2
1
0
,
,
2
h
n
x
x
h
n
p
h
n
+
+
+
=
−
+
+
γ
γ
γ
[
]
h
n
x
X
p
h
n
h
n
T
+
=
−
+
+
=
,
1
1
Wracamy teraz do wyznaczania prognoz dla zmiennej objaśnianej.
Predyktor:
T
x
x
y
y
T
T
T
Tp
1
1
,
2
3
,
1
2
1
1
0
ˆ
ˆ
ˆ
ˆ
ˆ
ˆ
δ
α
α
α
α
+
+
+
+
=
−
−
Prognozy na h-okresów naprzód
Wartości zmiennych objaśniających w
okresie prognozowanym
)
1
(
ˆ
ˆ
ˆ
ˆ
ˆ
ˆ
1
,
2
3
,
1
,
1
2
1
0
,
1
+
+
+
+
+
=
+
+
n
x
x
y
y
n
p
n
n
p
n
δ
α
α
α
α
[
]
1
1
,
2
,
1
,
1
1
+
=
+
+
=
n
x
x
y
X
n
p
n
n
n
T
)
2
(
ˆ
ˆ
ˆ
ˆ
ˆ
ˆ
ˆ
1
,
1
,
2
3
,
2
,
1
2
,
1
1
0
,
2
+
+
+
+
+
=
+
+
+
+
n
x
x
y
y
p
n
p
n
p
n
p
n
δ
α
α
α
α
[
]
2
ˆ
1
,
1
,
2
,
2
,
1
,
1
2
+
=
+
+
+
+
=
n
x
x
y
X
p
n
p
n
p
n
n
T
M
M
)
(
ˆ
ˆ
ˆ
ˆ
ˆ
ˆ
ˆ
1
,
1
,
2
3
,
,
1
2
,
1
1
0
,
h
n
x
x
y
y
p
h
n
p
h
n
p
h
n
p
h
n
+
+
+
+
+
=
−
+
+
−
+
+
δ
α
α
α
α
[
]
h
n
x
x
y
X
p
h
n
p
h
n
p
h
n
h
n
T
+
=
−
+
+
−
+
+
=
,
1
,
2
,
,
1
,
1
ˆ
1
Prognozy te powinny być podane wraz z błędami prognoz (ex post) – bo to jest najważniejsza
miara oceny zachowania się modelu w prognozowaniu (czy też poza próbą). Aby to
sprawdzić, należy oszacować model na podstawie części próby, a pewną część (np. 3-6
ostatnich obserwacji zostawić dla weryfikacji prognoz).
Proponuję również, aby oprócz błędu prognoz ex post, obliczyć średni błąd prognoz (RMSE,
root mean square error), a także MAPE (Mean absolute percentage error) – ten ostatni
szczególnie jest polecany (zamiast RMSE) ze względu na odporność na zmiany skali (rzędu
wielkości) zmiennych.
5
.
0
1
2
)
(
1
⎟⎟
⎠
⎞
⎜⎜
⎝
⎛
−
=
∑
+
=
h
n
T
Tp
T
y
y
h
RMSE
100
1
1
⋅
−
=
∑
+
=
h
n
T
T
Tp
T
y
y
y
h
MAPE
MAPE oznacza, że prognozując zmienną y z danego równania mylimy się (np. co roku, jeżeli
dane są roczne) średnio o MAPE %.
Prognozy dla zmiennych objaśniających też powinny być sprawdzane poza próbą. Jest taka
praktyczna zasada, że jeżeli MSE dla danej zmiennej objaśniającej jest większy niż wariancja
tej zmiennej w próbie (
) , to takiej zmiennej nie należy włączać do modelu,
nawet jeśli jest ekonomiczne uzasadnienie dla tej zmiennej. Przyniesie do więcej korzyści
(mniejsze błędy ex post dla zmiennej y) niż strat.
)
(
2
x
S
MSE
>
∑
+
=
−
=
h
n
T
Tp
T
x
x
h
MSE
1
2
)
(
1
∑
=
−
=
n
t
t
x
x
n
x
S
1
2
2
)
(
1
)
(