WYKŁAD 5 31.05.2011
T: PROGNOZY NA PODSTAWIE MODELU EKONOMETRYCZNEGO
Prognozy zmiennych objaśniających:
- podane przez grupy ekspertów
- prognozowane na podstawie modelu
PRZYKŁAD
Model tendencji rozwojowej
Zgromadzono następujące dane:
Yt – zgony niemowląt na 1000 urodzeń żywych
X1t – spożycie wódki czystej i gatunkowej w przeliczeniu na alkohol 100% w litrach na osobę w ciągu roku
X2t - PKB na jednego mieszkańca w $
Błędy w doborze zmiennych:
- ogólne zmienne objaśniające
- brak zmiennych objaśniających o charakterze medycznym
Dane
1992 | 17,3 | 3,5 | 2198 |
---|---|---|---|
1993 | 161 | 3,8 | 2233 |
1994 | 15,1 | 3,8 | 2402 |
1995 | 13,6 | 3,5 | 3293 |
1996 | 12,2 | 2,9 | 3724 |
1997 | 10,2 | 2,8 | 3725 |
1998 | 9,5 | 2,4 | 4098 |
1999 | 8,9 | 2,1 | 4014 |
2000 | 8,1 | 2 | 4078 |
Można by było zastosować model tendencji rozwojowej liniowy, bo widać z wykresu Yt, że zmienne układają się w prostą, skierowaną w dół; nie trzeba modelu ekonometrycznego, zwłaszcza, jeśli nie interesuje nas wpływ zmiennych objaśnianych, a jedynie prognoza.
Spadek alkoholizmu – zmniejszanie zgonów.
Wzrost PKB – zmniejszanie zgonów.
Na podstawie materiału statystycznego oszacowano model ekonometryczny o postaci:
Yt = α1X1t + α2X2t + α0
I uzyskano następujące wyniki
Yt = 1,79X1t – 0,0026X2t + 15,46 + ut
(1,048) (0,000913) (5,998)
Błąd zmiennej alkoholizmu wskazuje, że trzeba tą zmienną usunąć.
n = 9
k = 3
Su2 = 0,796954
Su = 0,892723
Istotność parametrów strukturalnych – test t-Studenta
α = 0,2
Na 100 przypadków 20 razy się mylimy - przy poziomie istotności 0,05 model trzeba by było zmieniać.
t α = 1,415
wartości sprawdzianu:
t α1 = 1,7118 t α2 = -2,8073
utrzymano parametry w modelu
1,098 0,0008 - 6,134
D2(a) = 0,0008 8,32E - 0,7 - 0,005
- 6,134 - 0,005 35,986
Miary dopasowania modelu do danych:
φ2 = 5,28835
R2 = 94,71165
Vs = 7,24
Autokorelacja
n = 9
k = 2
H0: r1 = 0
d = 2,077122 H1: r1 <0
d’= 1,922878
d1’ = 0,629
du’ = 1,699
d’ > du’
Prognoza przyszłych wartości zmiennych objaśniających.
(na rok 2001)s
Prognozy przyszłych wartości zmiennych objaśniających budowane będą na podstawie modelu tendencji rozwojowej o postaci liniowej.
Prognoza zmiennej X1t
X1t = Ytx1t
Ytx1t = α1+ α0 + ξ1
t = 1,2,…9
Ytx1t = - 0,24t + 4,19 + ut
(0,032) (0,18)
(dobre parametry)
R2 = 89% (słaby model do prognozowania)
Prognoza dla t = 10
Prognoza zmiennej X2t
X2t = Ytx2t
Ytx2t = α1+ α0 + ξ1
t = 1,2,…9
Ytx2t = 278,12t + 1916,64 + ut
(38,74) (217,98)
R2 = 88%
Prognoza dla t = 10
Ostatecznie:
Przyszłe realizacje zmiennej objaśniającej:
X1t =1,79
X2t =4697,84
Model ekonometryczny:
Yt = 1,79X1t – 0,0026X2t + 15,46 + ut
(1,048) (0,000913) (5,998)
Zatem
Podstawiając przyszłe realizacje zmiennej objaśniającej do modelu, otrzymamy prognozę zmiennej endogenicznej:
Yp T=2001 = 1,79*1,79 – 0,0026*4697,84 + 15,46 + ut
Średni błąd predykcji:
1,098 0,0008 - 6,134
D2(a) = 0,0008 8,32E - 0,7 - 0,005
- 6,134 - 0,005 35,986
Su2 = 0,796954
Yt = 1,79X1t – 0,0026X2t + 15,46 + ut
1,79
XT = 4697,84
1
$$V = \sqrt{X_{T}^{'}*D^{2}\left( a \right)*X_{T} + S_{u}^{2}}$$
V = 1,08962
(błąd)
Rzeczywiste realizacje zmiennej prognozowanej Yt odchylają się średnio rzecz biorąc in plus bądź in minus o 1,08 zgonów niemowląt na 1000 urodzeń żywych od postawionych prognoz.
Prognozy – w liczbie mnogiej – bo jest cały zbiór prognoz. Wartości parametrów są prognozami ex post. Prognozą ex ante jest wartość na 2001 r.
Względny średni błąd predykcji wynosi:
V* = 16,41 %
V* = (V : Yt ) * 100%
W 2001 r. faktycznie było 7,7 zgonów na 1000 urodzeń żywych.
Współczynnik Janusowy – jeśli jest mniejszy od 1, model jest aktualny i struktury modelu nie trzeba zmieniać.
TEMAT: MODELE ADAPTACYJNE
Cechy ogólne i zastosowania:
dostosowanie do przebiegu proces – naśladowanie procesu (model będzie się dostosowywał)
budowa prognoz krótkookresowych
prosta budowa
możliwość prowadzenia symulacji
możliwość uwzględniania wahań przypadkowych, trendu oraz wahań sezonowych (można stosować te modele w każdych warunkach prognostycznych)
minimalna liczba obserwacji w przypadku modeli bez wahań sezonowych: 8-35 (lub do 40); w przypadku modeli z wahaniami sezonowymi niezbędna jest wiedza na temat 3 pełnych cykli
Ogólna postać modeli adaptacyjnych:
Yt – zmienna prognozowana
Yt = ηt + ut ηt - funkcja trendu (nieznana postać analityczna trendu)
ut – błąd
ut to nie reszta modelu; nie musi spełniać warunków obowiązujących dla reszt, ut nie muszą sumować się do zera!
Wady:
trudności w ustalaniu początkowych wartości do symulacji
strata informacji (brak pierwszych prognoz; zostają utracone, szereg czasowy teoretyczny po zastosowaniu modelu będzie skrócony; o kilka pierwszych obserwacji lub (w wahaniach sezonowych) o jeden pełny cykl
założenie o liniowości zmian zmiennej prognozowanej w przyszłości
postarzanie informacji
Symulacja
W przypadku modeli adaptacyjnych symulacja polega na takim doborze parametrów wygładzania, by zminimalizować dowolnie wybrany błąd ex post prognoz wygasłych.
Wybór błędu do minimalizowania: taki, którego zasadę działania dobrze rozumiemy.
Model wyrównywania wykładniczego Browna
Zastosowanie: zmienna prognozowana wykazuje trend oraz wahania przypadkowe (nie ma sezonowości).
Wady modelu: straty informacji, problem z doborem wartości początkowych.
Zalety: łatwość prowadzenia obliczeń.
Ocena trendu na moment t:
mt = αyt + (1-α) mt-1
mt – ocena trendu na okres bieżący t
α – parametr wygładzania
yt – realizacja zmiennej prognozowanej w momencie t
mt-1 - ocena trendu na moment poprzedni t-1
parametr wygładzania: 0≤ α ≤ 1
Jeżeli szereg (zmienna prognozowana) wykazuje bardzo szybkie tempo zmian, to parametr (alfa) dąży do jedności bądź jest równy 1. Jeśli tempo zmian jest niskie, parametr wygładzania jest bliski 0 lub równy 0.
Dokładność parametru: do 2-4 miejsc po przecinku.
Równanie prognozy:
YTp = mt + (mt – mt-1)h
h – horyzont prognozy
Gdyby nie uwzględniać horyzontu prognozy, prognozy na kolejne okresy miałyby cały czas tę samą wartość, rokrocznie byłyby stałe.
Jeśli parametr wygładzania równy jest zero, ocena trendu z momentu bieżącego jest równa ocenie trendu z momentu poprzedniego. Zasada prognozy naiwnej – „to co wczoraj, to dzisiaj, to co dzisiaj, to jutro”.
Wartości początkowe do symulacji:
m1 = y1
pierwsza ocena trendu jest równa pierwszej realizacji y
lub
m1 = ẏ (średnie y)
Pierwsza ocena trendu jest równa średniej z realizacji y.
Model Holta – postać klasyczna
Bardziej zaawansowany, dwa parametry wygładzania dobierane jednocześnie.
Zastosowanie: zmienna prognozowana wykazuje trend oraz wahania przypadkowe (nie ma sezonowości).
Wady modelu: straty informacji, problem z doborem wartości początkowych.
Zalety: łatwość prowadzenia obliczeń.
Musimy mieć wartość początkową; straty w informacjach
Ocena trendu:
Ft-1 = αyt-1 + (1 - α) (Ft-2 + St-2)
(wygładzona wartość przyrostu trendu)
St-1 = β (Ft-1 – Ft-2) + (1 - β) St-2
parametr wygładzania: 0≤ α,β ≤ 1
YTp = Fn + Sn (t – n) gdzie t > n
(wyprzedzenie czasowe
– horyzont prognozy)
Wartości początkowe do symulacji:
F1 = y1 lub Yt* = a1t + a0 + ut
parametr wolny
z modelu trendu
Model generuje wartości od F2
S1 = y2 – y1 lub Yt* =a1t + a0 + ut
Model Wintersa – postać addytywna
Wady modelu: straty informacji, problem z doborem wartości początkowych.
Zalety: łatwość prowadzenia obliczeń.
Ocena trendu:
Ft-1 = α(yt-1 – Ct-1-r) + (1 - α) (Ft-2 + St-1)
Ct-1-r – wskaźnik sezonowości w sensie Wintera
r – długość cyklu
wyrównana wartość przyrostu trendu:
St-1 = β (Ft-1 – Ft-2) + (1 - β) St-2
Ocena wskaźnika sezonowości:
Ct-1 = γ (yt-1 – Ft-1) + (1 – γ) Ct-1-r
parametr wygładzania: 0≤ α,β,γ ≤ 1
Wartości początkowe do symulacji:
F1 = y1 lub F1 = y średnie
S1 = y2 – y1
$$C_{1} = \overset{\overline{}}{}y_{t}$$
(średnia z przyrostów y)
Δyt = yt – yt-1
Jeden parametr za cykliczność.
Równanie prognozy dane jest jako:
YTp = Fn + Sn (t – n) + C1-r
Wada: ograniczenie co do horyzontu prognozy (prognoza na jeden pełny cykl)
t > n (wyprzedzenie czasowe)
Model Wintersa – postać multiplikatywna
Ocena trendu:
$$F_{t - 1} = \alpha\frac{y_{t - 1}}{C_{t - 1 - r}} + \left( 1 - \alpha \right)(F_{t - 2} + S_{t - 2})$$
Wyrównana wartość przyrostu trendu:
St − 1 = β(Ft − 1 + Ft − 2)+(1−β)St − 2
Ocena wskaźnika sezonowości:
$$C_{t - 1} = \gamma\frac{y_{t - 1}}{F_{t - 1}} + \left( 1 - \gamma \right)C_{t - 1 - r}$$
Parametry wygładzone:
0≤ α,β,γ ≤ 1
Jeśli bardzo głębokie cykle: γ bliskie 1
Jeśli bardzo płytkie cykle: γ bliskie 0
Równanie prognozy dla modelu multiplikatywnego:
YTp = [Fn + Sn (t – n)] * Ct-r
t > n
Jeśli zmiany zachodzą wolno, parametry wygładzania są bliskie 0, jeśli zmiany zachodzą szybko, parametry wygładzania są bliskie 1.