Prof. Mariola Piłatowska
Prognozowanie gospodarcze
Egzamin: trzeba mieć zaliczone ćwiczenia (przy komputerze – będzie losowane zadanie), egzamin testowo-opisowy, testowy tzn., że będzie trzeba coś np. wyliczyć i wtedy zaznaczyć odpowiedź z podanych. Egzamin jest punktowany i na usosie będą podane punkty a na maila dostaniemy rozkład punktów na daną ocenę.
Dyżury: wtorek 16.10-17.10
Literatura: Maria Cieślak „Prognozowanie gospodarcze. Projekty i zadania”, PWN
Aleksander Zajasiak „Prognozowanie ekonomiczne” PWE
Magdalena Osińska „Współczesna ekonometria”, TNOiK
Tadeusz Kufel „Ekonometria. Rozwiązywanie problemów z wykorzystaniem programu Grelt.
Przedmiot
Przewidywanie przyszłości to wnioskowanie o przyszłych procesach. Może być racjonalne (zdroworozsądkowe i naukowe) i nieracjonalne.
Racjonalne przewidywanie jest wtedy kiedy cały proces wnioskowania ma charakter logiczny, czyli przebiega od przesłanek poprzez dane, diagnozowanie do wniosków. Proces przewidywania, gdy bazuje na doświadczeniu mamy do czynienia z przewidywaniem zdroworozsądkowym, przykładem jest wyznaczanie prognoz pogody przez górala mieszkającego od lat w górach, wynika z doświadczenia w danej dziedzinie.
Przewidywanie naukowe bazuje na dorobku nauki, tzn. że wykorzystuje całą metodologie nauk, teorię dotyczącą badanego zjawiska i wykorzystuje metody rozwiązywania danego problemu np. KMNK.
Przewidywanie nieracjonalne, gdy w procesie wnioskowania o przyszłości nie ma związku między przesłankami a wnioskami albo nie ma w ogóle znanych przesłanek, nie ma bazy do wyciąganych tych wniosków, np. różnego rodzaju jasnowidztwo.
Prognozowanie jest to racjonalne i naukowe wnioskowanie o przyszłości (przewidywanie przyszłości racjonalne naukowe).
Prognoza jest to rezultat prognozowania. To pewien sąd/ informacja dotyczący/a stanu w przyszłości.
Właściwości musi mieć ten sąd by była to prognoza. Te właściwości są następujące:
sąd oparty jest na dorobku nauki,
odnosi się do konkretnej przyszłości – czas może być oznaczony explicite, czyli jawnie, wprost albo implicite, czyli w domyśle. Czas wyrażony explicite tzn., że podany konkretnie okres, np. w 2013r. bezrobocie będzie wynosić 9%, musi być określony jak robimy prognozy na podstawie zmiennych ilościowych. Jeżeli zmienny mają charakter jakościowy to czas/przyszłość wyrażone jest implicite, np. Jan Kowalski będzie dobrym studentem.
jest weryfikowalny empirycznie wynika z tego, że prognoza jest precyzyjnie sformułowana oraz odniesienia do konkretnego momentu w przyszłości.
jest niepewny, ale akceptowany – jeżeli prognoza bazuje na dorobku nauki, odnosi się do konkretnej przyszłości jest weryfikowalna empirycznie to możemy myśleć, że tak będzie na pewno. Ale prognozując my zakładany możliwość pewnego błędu. Proces prognozowania dopuszcza błąd, jest niepewny sąd, ale akceptowalny, nie przekracza pewnej granicy. Jest to naturalna strona prognozowania.
Model ekonometryczny jest tylko i wyłącznie przybliżeniem rzeczywistości a nie rzeczywistością. Nie odkrywa żadnej i jedynej prawdy, jest uproszczonym przybliżeniem rzeczywistości, może zawierać błędy, jest niepewny.
Obiekt – kraj,
- obiad,
- województwo,
- firma
proste Zjawiska – ekonomiczne
złożone - gospodarcze
- socjologiczne
Zmienne
Ilościowe jakościowe
Funkcje prognoz:
preparacyjna – związana jest z tym, że prognoza przygotowuje na ogół inne działania, ma służyć do podjęcia decyzji
aktywizująca – wzrost zjawisk będzie powodował korzyści dla społeczeństwa a inny wzrost będzie powodował niekorzyści dla społeczeństwa. W związku z tym ta funkcja polega na tym, aby skłaniać do podejmowania działań, które będą sprzyjały do realizacji prognozy, jeżeli jest ona zjawiskiem korzystnym, np. wzrost PKB, lub słaniać do działań hamujących realizujących prognozy, jeżeli jest to niekorzystne dla gospodarki, społeczeństwa, np. jeżeli prognozujemy stopę bezrobocia by zapobiegać dalszemu wzrostowi. Mamy tu do czynienia z prognozami ostrzegawczymi.
Informacyjna – prognoza ma przygotować na zmiany, które zajdą w przyszłości (przygotować tak by społeczeństwo miało czas do przygotowania się do tej zmiany)
Rodzaje prognoz:
Wg horyzontu czasowego – jest zależna od tego dla czego jest ta prognoza
Długookresowe – dla przedsiębiorstwa do 3lat/ dla gospodarki powyżej 5lat
Średniookresowe – dla przedsiębiorstwa do roku/ dla gospodarki do 5lat
Krótkookresowe – dla przedsiębiorstwa kilka miesięcy / dla gospodarki 2lata
Wg stanu zmiennej
Ilościowa
- punktowa – określona na ogół w formie liczby, np. stopa bezrobocia wynosi 9%
- przedziałowa – podane w formie przedziału, czyli np. (8,2%; 9,8%) przedział o określonych krańcach z pewnym wysokim prawdopodobieństwem pokrywa/obejmuje nieznaną wartość zmiennej prognozowanej w przyszłości, np. stopy bezrobocia.
Jakościowa
Wg celu lub funkcji
Badawcze, w tym ostrzegawcze
Realistyczne
Normatywne – coś co jest pożądane, do czegoś do czego pożądany. Szuka się wielkości, która by była wyznacznikiem wielkości do której zmierzamy
Wg zakresu ujęcia
Częściowe – na podstawie np. modelu rynku pracy
Globalne – na podstawie np. modelu rynku światowego
Wg zasięgu terytorialnego
Światowe
Krajowe
Regionalne
Metody prognozowania
Metody niema tematyczne
Analogowe – tego samego typu, np. popyt na coś w różnych krajach
Heurystyczne – wykorzystuje się, gdy chodzi o prognozowanie o zjawiskach nowych
- delficka
- burza mózgów
- ekspertów
Intuicyjne – obarczone są większym błędem
Ankietowe – można w nich uczestniczyć albo jako ankieter albo jako ankietowany. Wszystko zależy od tego na ile uczciwie odpowiedzą ankietowani. Obarczone są większym błędem
Metody matematyczno-statystyczne
Modele deterministyczne – zależność ma charakter funkcyjny
Modele ekonometryczne – zależność ma charakter stochastyczny (występuje zmienna losowa)
- jednorównaniowy – (3 pierwsze) modele opisowe, szeregów czasowych, struktury zjawisk ekonometrycznych
* model trendu
* modele sezonowości
* Autoregresyjny AR, średniej ruchomej MA, ARMA – model autoregresyjny+ model średniej ruchomej, modele ARIMA, ARCH, GARH
* przyczynowo-skutkowe – wystąpią zmienne opisowe- wielorównaniowe
* proste
* rekurencyjne
* współzależne
Podstawowe pojęcie teorii procesów stochastycznych/ z ekonometrii dynamicznej, które są zasadnicze dla prognozowania
Proces stochastyczny – określa się Yt… Y-2, Y-1, Y0, Y1, Y2,… – jest to ciąg zmiennych losowych wziętych z kolejnych momentów czasu. Realizacją jest szereg czasowy, czyli zbiór par {t; yt} takich, że kolejnym wartościom czasu zostały przyporządkowane określone wartości badanego zjawiska. Szereg czasowy jest skończony, np. produkcja w latach 2000-2011.
Stacjonarny – muszą być spełnione warunki by był stacjonarny;
- biały szum
Niestacjonarny
Szereg czasowy
Biały szum – czysty proces losowy; takie proces, który nie wykazuje żadnej prawidłowości, dlatego jest czysto losowy. Jest nieprognozowany. Ma średnią zero, ma stałą i skończoną wariancję oraz jest nie zautoskolerowany, tzn. nie ma autokorelacji.
Charakterystyki procesu stochastycznego
Wartość oczekiwana E(Yt) = mt
Wariancja D2(Yt)= E(Yt – mt)2 = σ2t
Funkcja kowariancyjna – K(t-s)= E[(Yt – mt) (Ys-ms)] = K(τ) ; jest funkcją odstępu, nie zależy od czasu
Funkcja autokorelacji R(τ) = R(t-s) = K(τ) / D2(Yt)
Funkcja gęstości spektralnej
E(Yt) = m – stała średnia
D2(Yt) = σ2 < nieskończoność – stała wariancja
K(τ) = K(t-s)
Jak są spełnione te trzy to proces jest stacjonarny a jak chociaż jeden z nich jest niespełniony to proces niestacjonarny.
Mówi się o stacjonarności i niestacjonarności średniej i wariancji.
Ogólna struktura procesu ekonomicznego
Yt = Pt + St + Ct + μt + γt + ξt + ηt
Pt - składnik trendu (deterministyczny)
St – składnik sezonowy (wahania sezonowe) o rocznym cyklu powtarzalności
Ct – wahania sezonowe inne niż roczne
Pt, St, Ct niestacjonarność średniej jak co najmniej jeden niespełniony
(modele trendu, sezonowości, autoregresji)
μt –
ɣt – sezonowość stochastyczna
ξt - cykliczność inna niż stochastyczna sezonowa
μt, γt, ξt niestacjonarność wariancji
(modele ARIMA, ARCH, GARCH)
ηt – stacjonarny proces stochastyczny
Biały szum E(εt) = 0 średnia procesu = 0
K(τ) = 0; τ ≠ 0
σ2; τ = 0
niezautoskalowany εt εt-1; εt-2; …; εt-0
Proces predykcji – wyznaczania prognoz
Założenia:
(1) znany jest oszacowany i zweryfikowany(model ma walory prognostyczne) model ekonometryczny;
(2)zakłada się, że struktura modelu jest stabilna w czasie, tzn.
- parametry strukturalne są stałe w czasie – nie zmieniają się;
- postać analityczna modelu jest stała w dłuższym czasie – nie zmienia się;
- struktura przyczynowa modelu jest stała – nie zmienia się w czasie.
(3) znane są wartości zmiennych objaśniających w okresie prognozowanym
(4) rozkład składnika losowego (resztowego) jest stały w czasie, czyli nie zmienia się
(5) dopuszcza się możliwość ekstrapolacji modelu poza obszar zmienności zmiennych objaśniających
$(\overset{\overline{}}{X} - \ S\left( x \right);\ \overset{\overline{}}{X} + \ S(x))$ - obszar zmienności
$(\overset{\overline{}}{t} - \ S\left( t \right);\overset{\overline{}}{t} + \ S\left( t \right))\ $
Predyktor – predyktor jest to pewien funkcjonał o postaci φT (t(x), mający taką własność, że wartość tego funkcjonału, dla konkretnej próby, można traktować jako prognozę zmiennej Y. To jaką postać ma ta operacja (φT) zależy od przyjętej zasady predykcji. Predyktor też jest zmienną losową – zmienia się od próby do próby.
φT – operacja, którą trzeba wykonać aby obliczyć prognozę
t(x) – model ekonometryczny
Zasady predykcji – zasada predykcji jest to pewna reguła postępowania umożliwiająca otrzymanie najlepszego w danych warunkach przybliżenia nieznanej wartości zmiennej prognozowanej Y w okresie prognozowanym - T.
* zasada predykcji nieobciążonej – polega na wyznaczeniu prognozy na poziomie wartości oczekiwanej zmiennej prognozowanej. Ta zasada jest stosowana wtedy, gdy proces predykcji jest powtarzalny. Wtedy stosownie tej zasady predykcji nieobciążonej powoduje, że ani się nie zawyża ani nie zaniża tych przybliżeń, wartości prognoz, tzn. średnie błędów będą się równoważyć.
estymacja | Predykcja | |
---|---|---|
Poziom populacji generalnej | αj- parametr strukturalny (nieznane) | Yt - zmienna prognozowana (nieznana) |
Poziom próby | - wzór = estymator
- oceny parametrów aj
|
- wzór = predyktor
- prognoza, czyli konkretna wartość (liczba)
|
Predyktor φ + (t(x))
model ekonometryczny
operacja, którą należy wykonać, by obliczyć prognozę
Zasada predykcji
$$Y_{t} = \ \sum_{j = 1}^{K}{\alpha_{j}X_{j_{T}} + \eta_{t*}}$$
$y_{T_{P}} = E\left( Y_{t} \right) = \ E(\sum_{j = 1}^{K}{\alpha_{j}X_{j_{T}} + \eta_{t})}t = 1,2,\ldots,n$ model dla okresu próby
$Y_{t} = \ \sum_{j = 1}^{K}{\alpha_{j}X_{j_{T}} + \eta_{T},\ T = n + 1,\ldots,n + k}$
$y_{T_{P}} = E\left( Y_{t} \right) = \ E(\sum_{j = 1}^{K}{\alpha_{j}X_{j_{T}} + \eta_{t})} = \ \sum_{j = 1}^{K}{\alpha_{j}E}\left( X_{j_{T}} \right) + \ E\left( \eta_{T} \right) = \sum_{j = 1}^{K}{\alpha_{j}E}\left( X_{j_{T}} \right) = \ \sim\sum_{j = 1}^{K}{a_{j}x_{j_{T}} = \ y_{T_{P}}}\ $
predyktor nieobciążony
αj= aj; E(XjT) ≈xjT predyktor punktowy
liczba
Predyktor też jest zmienną losową – zmienia się od próby do próby.
Predykcja (obliczanie prognozy) -
- prognoza punktowa – jak jest predyktor punktowy to istnieje też przedziałowy
- prognoza przedziałowa
Predyktor przedziałowy
P = {yTP− uαVT<Yt<yTP+ukVT} = 1 − α
yTP - predyktor punktowy
uα – wartość krytyczna z układu normalnego
VT- średni błąd predykcji
Yt - średnia prognozowana
1 − α - współczynnik ufności
Proces stochastyczny to funkcja losowa zmiennych losowych oraz nielosowego argumentu t, który oznacza czas.
Miary dokładności
- ex ante – mierniki wylicza się przed otrzymaniem realizacji zmiennej prognozowanej; informują o spodziewanej wielkości odchyleń wartości zmiennej prognozowanej od prognoz
- ex post – informują o rzeczywistej wielkości odchyleń wartości prognozowanej od prognoz (czyli takiej jaka już wystąpiła)
BŁĄD EX ANTE
Wariancja predykcji zależy od 3 wartości: wartości kowariancji i wariancji, wielkości resztowej
Interpretuje się pierwiastek z wariancji a nie wariancje.
Błąd predyktora D = YT − yTP
predyktor
wartość oczekiwana E(D) = E(YT − yTP)=0 predykcja jest nieobciążona, czyli trwale ani nie zaniża ani nie zawyża prognozy
wariancja predykcji – war (D)
VT2 = war (D) = E(YT − yTP)2
Wzór Hottelinga
$$V_{T}^{2} = \ \sum_{i = 1}^{K}{x_{\text{iT}^{2}}D^{2}(a_{i})} + \ 2\sum_{i = 1}^{K - 1}{\sum_{j = i + 1}^{K}{x_{\text{iT}}x_{\text{jT}}cov(a_{i},\ a_{j})} + S^{2}(u)}$$
a – oceny parametrów
xiT, xjT - wartości zmiennych objaśniających w okresie prognozowanym
D2(ai) - wariancja estymatorów parametrów strukturalnych
S(u) – wariancja resztowa modelu na podstawie, której prognoza
D(a) = $S^{2}\left( u \right)(X^{T}{X)}^{- 1} = \ \begin{bmatrix} D^{2}(a_{11}) & cov\ (a_{1}a_{2}) & cov\ (a_{\ldots)} \\ cov\ (a_{2}a_{1}) & D^{2}(a_{21}) & \vdots \\ cov(a_{k}a_{1}) & \vdots & D^{2}\left( a_{31} \right) \\ \end{bmatrix}$ - macierz wariancji i kowariancji
k – liczba zmiennych w modelu
Średni błąd predykcji $V_{T} = \ \pm \sqrt{V_{T}^{2}}$
INTERPRETCJA – jeżeli wykonujemy cały ciąg prognoz to wartość zmiennej prognozowanej będą się różnić od prognoz przeciętnie o +/- VT w jednostkach y.
VT2 = S2(u)[1 + XT(XTX)−1(XTT)
T – transpozycja
T – okres (?)
XT - wektor wierszowy wartości zmiennych objaśniających w okresie T
XTT - wektor prognozy (kx1) tylko transponowany
$$V_{T}^{2} = \ S^{2}\left( u \right)\lbrack 1 + \lbrack\begin{matrix}
x_{1T} & x_{2T} & \ldots & x_{3T}\rbrack\ \lbrack\ \\
\end{matrix}(X^{T}{X)}^{- 1}\rbrack_{\text{KxK}}\begin{bmatrix}
x_{1T} \\
x_{2T} \\
\vdots \\
x_{\text{KT}} \\
\end{bmatrix}$$
Tj – błąd bezwzględny
Błąd względny ex ante VT - pierwiastek
$V_{T}^{*} = \ \frac{V_{T}}{y_{T_{p}}} \times 100$
Średni błąd predykcji stanowi określony procent prognozy. Na podstawie tego błędu określamy czy prognozy są
dopuszczalne czy nie dopuszczalne.
Vg* - błąd graniczny przyjmowany przez badacza
VT* ≤ Vg* nasze prognozy są dopuszczalne, możemy spodziewać się niewielkich odchyleń wartości zmiennej prognozowanej od prognoz.
VT* > Vg* prognozy niedopuszczalne, możemy spodziewać się, że odchylenia wartości zmiennej prognozowanej od prognoz będą duże – nie do zaakceptowania
Błędy EX POST
Błąd prognozy
1) δT = yT − yTP
yT - realizacja zmiennej
yTP - prognoza (liczba)
δT > 0 yT > yTP prognoza była niedoszacowana, czyli za mała w stosunku do realizacji
δT < 0 yT < yTP prognozy przeszacowane, czyli za duże w stosunku do realizacji
Względny błąd prognozy
2) $\delta_{T}^{*} = \ \frac{\delta_{T}}{y_{T}}\ \times 100$ błąd prognozy stanowi średni błąd zmiennej prognozowanej
Ocenia się trafność prognoz
δg* = 5%, 10%, 15%
δT* ≤ δg* prognozy były trafne, tzn. że różnice między realizacją zmiennej prognozowanej a prognozą były niewielkie
δT* > δg* prognoza nietrafna, błąd za duży, różnice między realizacją zmiennej prognozowanej a prognozą były za duże
3) MSE (mean square error) – bezwzględny
$$MSE = \ \frac{1}{h}\sum_{T = n + 1}^{n + h}{({y_{T} - \ y_{T_{P}})}^{2}}$$
RMSE = $\pm \sqrt{\text{MSE}}$
INTERPRETACJA: Wartości zmiennej prognozowanej różniły się od prognoz przeciętnie o +/- RMSE (w jednostkach zmiennej y) w całym okresie prognozowania.
4) Średni błąd % - względny (dla całego okresu)
MAPE (mean absolut percentage error)
$$MAPE = \ \frac{1}{h}\sum_{T = n + 1}^{n + h}{\left| \frac{y_{T} - \ y_{T_{P}}}{y_{T}} \right| \times 100}$$
INTERPRETACJA: Prognozując zmienną y mylimy się przeciętnie o MAPE %.
Podsumowanie: etapy prognozowania
PROGNOZOWANIE NA PODSTAWIE MODELI OPISOWYCH (STRUKTURY WEWNĘTRZNEJ): modele trendu, sezonowości, autoregresji.
Modele trendu
Yt = Pt + ηt
Pt - składnik modelu trendu
Trend – gładka i spokojna w przebiegu krzywa wyznaczająca zasadniczy kierunek rozwoju zjawiska w długim okresie.
Pt - to wielomian zmiennej czasowej t
$$P_{t} = \ \sum_{j = 0}^{r}{\alpha_{j}t^{j}}$$
r –stopień wielomianu trendu
t – zmienna czasowa t (1,2,…n)
r=0 Yt = α0 + ηt trend stały (zerowy)
r = 1 Yt = α0 + α1t + ηt
r = 2 Yt = α0 + α1t + α2t2 + ηt trend kwadratowy
Yt = α0 + α1t + α2t2 + … + αrtr + ηt
Model trendu wielomianowego stopnia r
Szacowanie modelu trendu wielomianowego za pomocą KMNK
- macierz obserwacji na zmiennych objaśnianych
const t t2 tr
$$X = \ \begin{bmatrix}
1 & 1 & 1^{2} & \cdots & 1^{r} \\
1 & 2 & 2^{2} & \cdots & 2^{r} \\
1 & 3 & 3^{2} & \cdots & 3^{r} \\
\vdots & \vdots & \vdots & \cdots & \vdots \\
1 & n & n^{2} & \cdots & n^{r} \\
\end{bmatrix}$$
(estymator) $a = \ \begin{bmatrix} a_{0} \\ a_{1} \\ a_{2} \\ \vdots \\ a_{r} \\ \end{bmatrix} = \ \left( X^{T}{X)}^{- 1}X^{T}y \right.\ $
EGZAMIN!!! Podany model i należy zapisać macierz obserwacji dla danego modelu
- ustalenie stopnia r – stosujemy test F w odniesieniu do modeli kolejnych stopni trendu z istotnymi parametrami
Stosujemy, gdy dwa porównywane modele mają istotne parametry.
Formuła testu F
H0 : δr − 12 = δr2
niższy wyższy
H1 : δr − 12 > δr2 – lepszy model stopnia r
Jeżeli dwie wariancje resztowe są nieistotnie różne (jednakowe) przyjmuje się ten stopnia niższego.
Jeżeli nastąpił istotny spadek wariancji przy przejściu z modelu trendu stopnia r-1 do modelu trendu stopnia r to przyjmujemy model trendu co najmniej r.
Jeżeli nie nastąpił istotny spadek wariancji przy przejściu z modelu trendu stopnia r-1 do modelu trendu stopnia r, to przyjmuje się model trendu prostszego, czyli r-1.
$$F = \ \frac{S_{r - 1}^{2}\left( u \right)}{S_{r}^{2}\left( u \right)}\ > 1$$
[w liczniku zawsze ta większa wariancja i na ogół to ta niższego stopnia)
(n1−k1−1) liczba zmiennych bez stałej
V1 = n1 − k1 a tu ze stałą
V2 = n2 − k2
Reguła: Jeżeli F ≥ Fα, V1, V2 odrzucamy H0 przy poziomie istotności α i możemy sądzić, że δr − 12 jest istotnie większe niż δr2, czyli nastąpił istotny spadek wariancji reszt przy przejściu z modelu trendu stopnia r-1 do modelu trendu stopnia r, czyli stopień trendu jest równy co najmniej r (ale może być wyższy, czyli wtedy porównujemy wariancje z modeli trendu kolejnych stopni i kontynuujemy to testowanie, aż po raz pierwszy nie odrzucimy H0).
Jeżeli F < Fα, V1, V2 to wtedy nie ma podstaw do odrzucenia H0 , o tym, że δr − 12 ……………………………………., czyli nie nastąpił istotny spadek wariancji przy przejściu z modelu trendu stopnia r-1 do modelu trendu stopnia r, WNIOSEK: Stopień trendu jest równy r-1 (model prostszy).
- weryfikacja modelu (brak występowania autokorelacji składnika resztowego, rozkład składnika reszt normalny, jednorodność składnika resztowego)
EGZAMIN!!! Prognoza na podstawie modelu trendu wielomianowego
Hipoteza modelowa:
Yt = α0 + α1t + α2t2 + … + αrtr + ηt t= 1,2,…,n
Model ekonometryczny:
yt = a0 + a1t + a2t2 + … + artr + μt (model oszacowany)
Zakładamy, że ma walory prognostyczne – nadaje się do prognozowania
Predyktor: yTP=a0 + a1T + a2T2 + …+ arTr T = n+1, n+2,…,n+h
T – okres prognozowany
P – prognoza
Prognozy na h- okresów naprzód:
yT = n + 1, P=a0 + a1(n + 1)+ a2(n + 1)2 + …+ ar(n + 1)r
EGZAMIN!!!
Wektor wartości zmiennych w okresie prognozowanym:
$$X_{T = n + 1} = \ \begin{bmatrix}
1 & n + 1 & (n + 1)^{2} & \ldots & (n + 1)^{r} \\
\end{bmatrix}$$
Prognoza na 2 okresy naprzód:
yT = n + 2, P=a0 + a1(n+2) + a2(n+2)2 + …+ ar(n+2)r
$$X_{T = n + 2} = \ \begin{bmatrix}
1 & n + 2 & (n + 2)^{2} & \ldots & (n + 2)^{r} \\
\end{bmatrix}$$
Itd.
yT = n + h, P=a0 + a1(n+h) + an(n+h)2 + …+ ar(n+h)r
$$X_{T = n + h} = \ \begin{bmatrix}
1 & n + h & (n + h)^{2} & \ldots & (n + h)^{r} \\
\end{bmatrix}$$
Zapisać wg tego sposobu na 3 okresy naprzód w przypadku modelu trendu liniowego, kwadratowego i 3-stopnia. Przyjąć, że n=40
(zeszyt)
MODELE SEZONOWOŚCI
Yt= Pt+St+ηt
St – składnik sezonowy – wahania sezonowe
Wahania sezonowe są to pewne regularnie powtarzające się wahania poziomu zjawiska badanego wokół pewnej stałej lub wokół trendu o cyklu rocznym.
Trzeba mieć dane o okresie więcej niż rok żeby analizować sezonowość – kwartalne, miesięczne, dekadowe. Trzeba mieć cykle minimum - 3 lata.
stała amplituda wahań/stałe wahania sezonowe
Zmienna amplituda wahań
$$Y_{t} = \alpha_{0} + \alpha_{1}t + \sum_{i = 1}^{m}{d_{i}Q_{\text{it}}} + \eta_{t}$$
$$\sum_{i = 1}^{m}{d_{i}Q_{\text{it}}} = \ S_{t}$$
$$\sum_{i = 1}^{m}d_{i} = 0$$
Qit - zmienna zero-jedynkowa, które przyjmują wartość 1 w i-tym podokresie cyklu a 0 w pozostałych podokresach.
di - wskaźnik sezonowości – mierzy wielkość efektu sezonowego w danym podokresie cyklu.
INTERPRETACJA
Parametr informuje o wielkości efektu sezonowego (odchylenia w górę lub dół w stosunku od średniego poziomu) w danym okresie cyklu rocznego.
Inaczej mówiąc (upraszczając) parametr di to średnia arytmetyczna odchyleń od trendu badanego zjawiska liczona dla jednoimiennych podokresów (2 kwartał 1 roku, 2 kwartał 2 roku itd.)
m – liczba podokresów w cyklu wahań
m=12 – dane miesięczne
m=4 – dane kwartalne
Definicja zmiennych zero-jedynkowych
m=4 (suma Q) (1-4) (2-4) (3-4) (4-4)
Stała 10 1 1 1 1 1 1 1 1
|
t 1 2 3 4 5 6 7 8
|
1 0 0 0 1 0 0 0
|
0 1 0 0 0 1 0 0
|
0 0 1 0 0 0 1 0
|
0 0 0 1 0 0 0 1
|
1 1 1 1 1 1 1 1
|
Q1t* 1 0 0 -1 1 0 0 -1
|
Q2t* 0 1 0 -1 0 1 0 -1
|
Q3t* 0 0 1 -1 0 0 1 -1
|
Q4t* 0 0 0 0 0 0 0 0
|
1 1 1 -3 1 1 1 -3
|
---|
Wykreślamy, bo same zera
Została usunięta współliniowość
Zmiennych 0-1, mogę zastoso-
wać KMNK do nowego modelu
Zmienne 0-1 są współliniowe z wyrazem wolnym.
a = (XTX)−1XTy (jak występuje współliniowość)
|XTX| = 0 macierz osobliwa, nie istnieje do niej macierz odwrotna więc nie można zastosować estymatora, trzeba przekształcić zmienne 0-1, by usunąć zmienne 0-1 (współliniowość).
Qit*= Qit − Qmt
$$Y_{t} = \alpha_{0} + \alpha_{1}t + \sum_{i = 1}^{m - 1}{d_{i}Q_{\text{it}}^{*}} + \eta_{t}$$
$\sum_{i = 1}^{m - 1}{d_{i}Q_{\text{it}}^{*}}$ = d1Q1t*+ d2Q2t*+ d3Q3t*
Wzór na wyznaczenie efektu sezonowego w m-tym podokresie
$$\mathbf{d}_{\mathbf{m}}\mathbf{= \ -}\sum_{\mathbf{i = 1}}^{\mathbf{m - 1}}\mathbf{d}_{\mathbf{i}}$$
EGZAMIN!!! Przykład z miesiącami, trzeba będzie wyznaczyć dla grudnia
Badanie występowania wahań sezonowych
Wahania sezonowe występują wtedy, gdy przynajmniej jeden ze wskaźników sezonowości di jest istotny statystycznie.
Nie występują badania sezonowe gdy wszystkie wskaźniki sezonowe di są nieistotne statystycznie. Wtedy z modeli usuwa się cały wskaźnik sezonowy.
Walory prognostyczne - bada się własności rozkładu składnika resztowego: autokorelacja a raczej jej brak, homoscedastyczność, normalność rozkładu składnika resztowego.
Należy też zbadać stopień dopasowania do danych empirycznych.
Schemat prognozowania z trendu i sezonowości (???)
Hipoteza modelowa $Y_{t} = \alpha_{0} + \alpha_{1}t + \sum_{i = 1}^{m - 1}{d_{i}Q_{\text{it}}^{*}} + \eta_{t}$
Model ekonom.: $y_{t} = a_{0} + a_{1}t + \sum_{i = 1}^{m - 1}{d_{i}^{\hat{}}Q_{\text{it}}^{*}} + e_{t}$ ten model ma mieć walory prognostyczne
Predyktor: $y_{T_{P}} = \ a_{0} + a_{1}T + \sum_{i = 1}^{m - 1}{d_{i}^{\hat{}}Q_{\text{iT}}^{*}}$
Prognozy na 4 okresy:
$y_{{T = n + 1,}_{P}} = \ a_{0} + a_{1}(n + 1) + \sum_{i = 1}^{m - 1}{d_{i}^{\hat{}}Q_{iT = n + 1}^{*}}$
XT = n + 1 = [1 n+1 1 0 0]
(z tabelki)
$y_{{T = n + 2,}_{P}} = \ a_{0} + a_{1}(n + 2) + \sum_{i = 1}^{m - 1}{d_{i}^{\hat{}}Q_{iT = n + 2}^{*}}$
XT = n + 2 = [1 n+2 0 1 0]
$y_{{T = n + 3,}_{P}} = \ a_{0} + a_{1}(n + 3) + \sum_{i = 1}^{m - 1}{d_{i}^{\hat{}}Q_{iT = n + 3}^{*}}$
XT = n + 3 = [1 n+3 0 0 1]
$y_{{T = n + 4,}_{P}} = \ a_{0} + a_{1}(n + 4) + \sum_{i = 1}^{m - 1}{d_{i}^{\hat{}}Q_{iT = n + 4}^{*}}$
XT = n + 4 = [1 n+4 −1 −1 −1]
Modele autoregresyjne
Model autoregresji rzędu q:
Yt = α1Yt − 1 + α2Yt − 2 + … + αqYt − q + εt
3 warunki:
αq ≠ 0
εt musi być białym szumem (jeżeli jest dobrze ustalony poziom autoregresji to jest biały szum)
Yt − s (s =1,2…q) – nie są skorelowane ze składnikiem losowym E(Yt − s, εt) = 0
Zjawisko procesu autoregresyjnego występuje kiedy efekty działania pewnych czynników nie zanikają (nie kończą się) w okresie za który obserwujemy dane zjawisko tylko przenoszą się na okresy następne, np. popyt, inwestycje.
Yt − α1Yt − 1 − α2Yt − 2 − … − αqYt − q = α0 + εt
(1−α1u1−α2u2−…−αquq)Yt = α0 + εt
u0
A(u)Yt = α0 + εt nowoczesny zapis modelu (operator cofnięcia)
usYt = Yt − s
u2Yt = Yt − 2
Postać modelu:
- zapis tradycyjny
- operator cofnięcia
Estymacja parametru
Do szacowania wykorzystuje się metodę najmniejszych kwadratów (KMNK).
$$a = \begin{bmatrix}
a_{1} \\
a_{2} \\
\vdots \\
a_{n} \\
a_{0} \\
\end{bmatrix} = (X^{T}X)^{- 1}X^{T}y$$
yt − 1 yt − 2 ⋯ yt − q 1
$y_{t} = \begin{bmatrix} y_{1} \\ y_{2} \\ y_{3} \\ \vdots \\ y_{n} \\ \end{bmatrix}$ $y = \begin{bmatrix} y_{q + 1} \\ y_{q + 2} \\ \vdots \\ y_{n} \\ \end{bmatrix}$ $X = \begin{bmatrix} y_{q} & y_{q - 1} & \cdots & q_{1} & 1 \\ y_{q + 1} & y_{q} & \cdots & q_{2} & 1 \\ \vdots & \vdots & \cdots & \vdots & \vdots \\ q_{n - 1} & q_{n - 2} & \cdots & q_{n - q} & 1 \\ \end{bmatrix}$
Yt = α1Yt − 1 + α0 + εt
q=1
$y_{t} = \ \begin{bmatrix} 53 \\ 55 \\ 60 \\ 62 \\ 68 \\ 70 \\ 72 \\ 69 \\ 70 \\ 75 \\ \end{bmatrix}\ $ $y = \begin{bmatrix} 55 \\ 60 \\ 62 \\ \vdots \\ 75 \\ \end{bmatrix}$ $X = \begin{bmatrix} 53 & 1 \\ 55 & 1 \\ 60 & 1 \\ \vdots & \vdots \\ 70 & 1 \\ \end{bmatrix}$
q=2
Yt = α1Yt − 1 + α2Yt − 2 + α0 + εt
$y = \begin{bmatrix} 60 \\ 62 \\ 68 \\ \vdots \\ 75 \\ \end{bmatrix}$ $X = \begin{bmatrix} 55 & 53 & 1 \\ 60 & 55 & 1 \\ 62 & 60 & 1 \\ \vdots & \vdots & \vdots \\ 70 & 69 & 1 \\ \end{bmatrix}$
EGZAMIN – podany szereg czasowy Yt i będzie trzeba zapisać macierz obserwacji y i X, jeśli chodzi o model autoregresji i trendu rzędu np. 2, 3…
Ustalanie rzędu autoregresji:
- badanie istotność współczynników autokorelacji cząstkowej (PACF)
- istotność współczynników autoregresji + badanie biało szumowości procesu resztowego: wersja „od dołu do góry” (od najmniejszego τ) i od „góry do dołu” (od największego τ)
Współczynnik autokorelacji całkowitej
$y_{t}\text{\ \ \ \ \ }y_{t - 1}\ \ \ \leftarrow \hat{\rho_{1}}$
$y_{t}\text{\ \ \ \ \ }{\text{\ \ \ \ \ \ \ \ \ \ }y}_{t - 2}\ \ \ \leftarrow \hat{\rho_{2}}\ $
$y_{t}\text{\ \ \ \ \ }{\text{\ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ }y}_{t - 3}\ \ \ \leftarrow \hat{\rho_{3}}\ $ ACF – Auto Correlation Function
$y_{t}\text{\ \ \ \ \ }{\text{\ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ }y}_{t - q}\ \ \ \leftarrow \hat{\rho_{q}}\ $
$r_{\text{xy}} = \frac{\text{cov}(x,y)}{S\left( x \right)S(y)}$
y = yt
x = yt − 1
Badanie istotność współczynników autokorelacji cząstkowej (PACF)
$y_{t}\text{\ \ \ \ \ }y_{t - 1}\ \ \ \ \ \ \ \ \ \leftarrow \hat{\rho_{11}} = \hat{\rho_{1}}$
$y_{t}\text{\ \ \ \ \ }y_{t - 1}\text{\ \ \ \ \ \ }y_{t - 2}\ \ \ \leftarrow \hat{\rho_{22}}$
$y_{t}\text{\ \ \ \ \ }y_{t - 1},\ y_{t - 2}\text{\ \ \ }y_{t - 3}\ \ \ \ \leftarrow \hat{\rho_{33}}$ f. autokorelacji cząstkowej PACF
Itd. Partial Auto Correlation Function
$y_{t}\text{\ \ \ \ \ }y_{t - 1},\ y_{t - q - 1}\text{\ \ \ }y_{t - q}\ \ \ \ \ \ \ \ \ \ \ \leftarrow \hat{\rho_{\text{qq}}}$
Czysta autokorelacja – przy wyłączeniu wpływu z pośrednimi opóźnieniami.
Jak obliczyć? Układ równań Yale’a - Walkera
Metoda uproszczona
yt = a11yt − 1 + a01 + u1t
yt = a12yt − 1 + a22yt − 2 + a02 + u2t
yt = a13yt − 1 + a23yt − 2 + a33yt − 3 + a03 + u3t
Itd.
Szacunki współczynników autokorelacji cząstkowej
$a_{11} \approx \hat{\rho_{11}}$
$a_{22} \approx \hat{\rho_{22}}\ $
$a_{33} \approx \hat{\rho_{33}}$
Itd.
Test Quenouille’a
H0 : ρττ = 0 współczynnik autokorelacji cząstkowej rzędu τ=0 , nieistotny statystycznie τ=1,2,…,q
H1 : ρττ ≠ 0 istotny statystycznie
Weryfikacja hipotezy
$$t_{\tau} = \ \frac{\left| \hat{\rho_{\text{ττ}}} \right|}{\frac{1}{\sqrt{n}}}$$
Błąd standardowy S(${\hat{\rho}}_{\text{ττ}}$) współczynnika autokorelacji cząstkowej(mianownik)
Stosuje się wersję uproszczoną
$$t_{\tau} = \ \frac{\left| \hat{\rho_{\text{ττ}}} \right|}{\frac{1}{\sqrt{n}}}\ > 2$$
Reguła decyzyjna
$\left| \hat{\rho_{\text{ττ}}} \right| \geq \frac{2}{\sqrt{n}}$ odrzucamy hipotezę zerową i możemy sądzić, że współczynnik autokorelacji cząstkowej rzędu τ jest istotny statystycznie, w związku z tym rząd autoregresji jest równy τ
$\left| \hat{\rho_{\text{ττ}}} \right| < \frac{2}{\sqrt{n}}$ nie ma podstaw do odrzucenia hipotezy zerowej, współczynnik autokorelacji cząstkowej rzędu τ jest nieistotny statystycznie. Rząd autoregresji jest mniejszy niż τ
$\frac{2}{\sqrt{n}} = \rho_{\text{kryt}}$
Przykład
τ | $${\hat{\rho}}_{\text{ττ}}$$ |
„od góry do dołu” |
---|---|---|
1 2 3 4 5 6 |
0,72 -0,38 -0,20 0,34 0,12 -0,05 |
$\left| \hat{\rho_{44}} \right| > 0,3 \Rightarrow q = 4$ rząd autoregresji równy 4, odrzucamy H0, współ. istotny $\left| \hat{\rho_{55}} \right| < 0,3 \Rightarrow q < 5$ brak podstaw do odrzucenia H0, $\left| \hat{\rho_{66}} \right| < 0,3 \Rightarrow q < 6$ wsp. nieistotny |
$\frac{2}{\sqrt{n}} = \rho_{\text{kryt}}$ = 0,3
${\hat{\rho}}_{\text{ττ}}$
1
0,5
0,3
τ
1 2 3 4 5 6 -0,3
-0,5
-1
Sprawdzam od dołu, który jest istotny i kończę, gdy po raz pierwszy natknę się na istotny.
„Od góry do dołu” – metoda bardziej efektywna
Yt = α1Yt − 1 + α2Yt − 2 + α3Yt − 3 + α4Yt − 4 + α0 + εt
${\hat{\rho}}_{\text{ττ}}$
Będzie białym szumem jak
$\left| \hat{\rho_{\text{ττ}}} \right| < \frac{2}{\sqrt{n}}$
Proces predykcji
Hipoteza modelowa: Yt = α1Yt − 1 + α2Yt − 2 + … + αqYt − q + α0 + εt
Model ekonometryczny: yt = a1yt − 1 + a2yt − 2 + … + aqyt − q + a0 + ut
Model ekonometryczny musi spełniać pewne kryteria:
- istotność parametru,
- ut musi mieć własności biało szumowe,
-musi być wysoki stopień dopasowania do danych empirycznych
Predyktor: yTp = a1yT − 1 + a2yT − 2 + … + aqyT − q + a0
EGZAMIN: Będzie oszacowany model i będzie trzeba oszacować prognozy. Do konkretnego przykładu.
Prognozy na h - okresów: yT = n + 1 = a1yn + a2yn − 1 + … + aqyn − q + a0
$$X_{n + 1} = \begin{bmatrix}
y_{n} & y_{n - 1} & \ldots & y_{n - q + 1} & 1 \\
\end{bmatrix}$$
yT = n + 2, p = a1yn + 1, p + a2yn + … + aqyn + 2 − q + a0
$$X_{n + 2} = \begin{bmatrix}
y_{n + 1,p} & y_{n} & y_{n - 1} & \ldots & y_{n + 2 - q} & 1 \\
\end{bmatrix}$$
yT = n + 3, p = a1yn + 2, p + a2yn + 1, p + a3yn + … + aqyn + 3 − q + a0
$$X_{n + 3} = \begin{bmatrix}
y_{n + 2,p} & y_{n + 1,p} & y_{n} & \ldots & y_{n + 3 - q} & 1 \\
\end{bmatrix}$$
Itd.
yT = n + h, p = a1yn + h − 1, p + a2yn + h − 2, p + … + aqyn + h − q, p + a0
$$X_{n + h} = \begin{bmatrix}
y_{n + n - 1,p} & y_{n + h - 2,p} & \ldots & y_{n + h - q,p} & 1 \\
\end{bmatrix}$$
Potem uzupełnić błędy predykcji i prognoz.
Warunki stacjonarności modelu autoregresji
Yt = α1Yt − 1 + εt
Stacjonarny, gdy: |α1| <1
Yt = α1Yt − 1 + α2Yt − 2 + εt
Stacjonarny, gdy: |α2| <1
α2 − α1 < 1
α2 + α1 < 1
A(u)Yt = α0 + εt
|A(z)| = 0
1 − α1z − α2z2 − … − αqzq = 0 „z” to pierwiastki tego równania
z1 = ?
z2 = ?
⋮
Model autoregresji jest stacjonarny, jeśli wszystkie pierwiastki równania A(z) = 0 (wart. Bezwzględna) są co do modułu większe od jedności.
Jeśli nie są spełnione warunki stacjonarności to prognozy z tego okresu są wybuchowe.
Ćwiczenie do domu
yn = 75
yt = 1, 05yt − 1 + 0, 5 + ut
Modele przyczynowo-skutkowe
EGZAMIN!!
Na czym polega badanie wewnętrznej struktury procesu ekonomicznego (zjawiska ekonomicznego)?
Ustaleniu stopnia trendu (test F, t- studenta – pomocniczo)
Zbadaniu występowania wahań sezonowych (czy istotne czy nie) – dotyczy tylko danych miesięcznych, kwartalnych – nie bada się dla rocznych (na zaliczeniu będą roczne dane więc nie ma badania sezonowości!!)
Ustaleniu rzędu autoregresji
Jeśli występuje trend (i/lub sezonowość) to badanie rzędu autoregresji robimy na podstawie reszt z modelu trendu i/lub sezonowości. Wykorzystujemy badanie istotności autokorelacji cząstkowej (PACF) – test Quenouille’a
yt = a0 + a1t + ut
PACF
(dodajemy 2rząd opóźnienia – tyle ile wyszedł)
$y_{t} = a_{0} + a_{1}t + y_{1}^{\hat{}}y_{t - 1} + y_{2}^{\hat{}}y_{t - 2} + e_{t}$ PACF, biały szum
Pełny model struktury (trendu i autoregresji)
Jeśli trend i sezonowość nie występują to badanie rzędu autoregresji przeprowadzamy bezpośrednio dla tej zmiennej nas interesującej (y, X). Wykorzystujemy badanie istotności autokorelacji cząstkowej (PACF) – test Quenouille’a
yt = a0 + ut
PACF q=2
yt = a0 + a1yt − 1 + a2yt − 2 + et PACF
Badanie wewnętrznej struktury poszczególnych procesów EGZAMIN!!!
r | q | St |
|
---|---|---|---|
Yt |
1 | 2 | - |
X1t |
2 | 0 | - |
X2t |
0 | 1 | - |
(q - opóźnienia)
Yt = α0 + α1t + β1Yt − 1 + β2Yt − 2 + εyt
X1t = δ0 + δ1t + δt2 + εX1t
X2t = g0 + g1X2, t − 1 + εX2t
Żeby poprawić model trzeba włączyć składnik trendu (i ewentualnie sezonowości) i opóźnienia dla wszystkich zmiennych X, Y, j i t jeśli to jest uzasadnione.
$Y_{t} = \alpha_{0} + \alpha_{1}X_{1t} + \alpha_{2}X_{2t} + \ \ldots + \alpha_{K}X_{\text{Kt}} + \eta_{t} = \alpha_{0}\sum_{j = 1}^{K}{\alpha_{j}X_{\text{jt}} + \eta_{t}}$ (dynamiczny, bo zjawiska w czasie, przyczynowo-skutkowy)
Pyt + ARy PXyt + ARXjt
Czy poprawnie zbudowany? Czy zawiera wszystkie zmienne, które powinien zawierać? (czy dobrze wyspecyfikowany?)
To czego nie uwzględniliśmy wpada do składnika stochastycznego - ηt
r | q | |
---|---|---|
|
0 0 0 ⋮ 0 |
0 0 0 ⋮ 0 |
Wszystkie procesy są białymi szumami i wtedy model jest zapisany poprawnie
Budowa dynamicznego modelu zgodnego – opracowana przez prof. Zygmunta Zielińskiego – podobną wersję opracował David Hendry, przy czym jego koncepcja nazywana jest od ogółu do szczegółu (congruent model – model zgodny).
Przez zgodność modelu rozumie się identyczność wewnętrznej struktury procesu objaśnianego Yt i łącznej wewnętrznej struktury procesów objaśniających Xjt, przy zachowaniu biało szumowych własności procesu resztowego.
W praktyce oznacza to budowę dynamicznego modelu przyczynowo-skutkowego w taki sposób, aby uwzględnić informacje o wewnętrznej strukturze badanych procesów (sezonowości, trendu, autoregresji), a proces resztowy był białym szumem.
Etapy budowy zgodnego modelu ekonometrycznego:
Budowa modeli struktury (modeli szeregów czasowych)
r | q | |
---|---|---|
Yt |
1 | 2 |
X1t |
2 | 0 |
X2t |
0 | 1 |
Yt = α0 + α1t + β1Yt − 1 + β2Yt − 2 + εyt
X1t = δ0 + δ1t + δt2 + εX1t
X2t = g0 + g1X2, t − 1 + εX2t
Budowa dynamicznego modelu zgodnego dla biało szumowych składowych odpowiednich procesów
εYt = ρ1εx1t + ρ2εx2t + εt
(r=0,q=0) (0,0) (0,0)
Wewnętrzna struktura εYt jest identyczna z łączną strukturą εx1t i εx2t a proces resztowy jest białym szumem.
Nie możemy obserwować εt
Nie możemy poprzestać na tym modelu, bo ε nie są bezpośrednio obserwowalne.
Budowa dynamicznego modelu zgodnego dla rzeczywistych procesów, dla których możemy dysponować realizacjami, Xji, Yt.
(Za epsilony wstawiamy wyrażenia wyliczone z modeli struktury)
Yt − α0 − α1t − β1Yt − 1 − β2Yt − 2 = ρ1(X1t−δ0−δ1t−δt2) + ρ2(X2t−g0−g1X2t − 1) + εt
Jest dalej białym szumem
Yt = β1Yt − 1 + β2Yt − 2 + δ1X1t + δ2X2t − δ2γ1X2, t − 1 + (α0−δ1−δ2) + (−δ1)t − +
Jest to model dynamiczny zgodny uwzględniający informacje o wewnętrznej strukturze wszystkich badanych procesów a jednocześnie proces resztowy jest białym szumem.
Yt = α0 + α1X1t + α2X2t + ηt
Nie będzie białym szumem
a nawet będzie procesem niestacjonarnym
Zadanie
Przedstaw poszczególne etapy budowy dynamicznego modelu zgodnego wiedząc, że wewnętrzna struktura badanych procesów jest taka jak w podanej tabelce.
(zrobić jak to wyżej!!!! Nazwać etapy, modele struktury napisać, zrobić rozpiskę każdego etapu (dokładnie jak wyżej)
procesy | r | q |
---|---|---|
Yt | 2 | 1 |
X1t | 1 | 2 |
X2t | 3 | 1 |
Stopień wynikowy trendu będzie równy najwyższemu spośród tych trendów
Wersja skrócona
Budowa modeli struktury:
(zeszyt)
Ten model jest tzw. pełną wersją modelu zgodnego, tzn. wersją uwzględniającą wszystkie informacje o wewnętrznej strukturze badanych procesów.
Jest to najbardziej rozbudowana postać modelu. Niektóre parametry będą nieistotne, zatem jeśli tak będzie to trzeba przejść do wersji zredukowanej modelu zgodnego (od pełnej do zredukowanej) tzn. zredukowanej tylko do istotnych czynników.
Korzysta się z a posteriori polegającej na tym, że w każdym kroku wyrzuca się tylko jeden czynnik – ten, dla którego statystyka t- studenta była najmniejsza, co do bezwzględnej wartości. Ten model zredukowany podlega weryfikacji.
Trzeba sprawdzić czy został spełniony warunek zgodności, czyli czy proces resztowy jest białym szumem!!!!!
Robimy to dla wersji pełnej i zredukowanej modelu.
Ogólna postać dynamicznego modelu zgodnego
(zeszyt)
Opóźnienia Y pełnią rolę zastępczą tzn. pojawiają się wtedy m.in. gdy w modelu nie uwzględniono wszystkich przyczyn Y.
X bieżące i opóźnione pełnią rolę czynników przyczynowych i mają interpretację.
Składnik trendowo -sezonowy – jego pojawienie w modelu oznacza, że ze wszystkich procesów została wyeliminowana niestacjonarność i w związku z tym parametry modelu βs i αjs są miarą zależności na poziomie procesów stacjonarnych.
Składnik losowy – biało szumowy występuje dlatego, że zależności między zależnościami ekonomicznymi mają charakter stochastyczny.
Zadanie
Oszacowano model sprzedaży napojów gazowanych Yt (w tys litrów) w zależności od opadów Xt (mm) na podstawie danych miesięcznych okresu 2000-2004 (5lat; dane oczyszczone z sezonowości) dla pewnej firmy. Na podstawie poniższych informacji dokonaj oceny jakości modelu oraz jego przydatności w prognozowaniu.
Model: estymacja KMNK z wykorzystaniem 60 obserwacji 2000:01 do 2004:12
Zmienna zależna: Yt
Zmienna współczynnik statystka t-studenta wartość p
Const -485,6 -2,62 0,013
Xt -4,7 -2,04 0,050
Xt-1 -3,8 -1,53 0,136
t 23,7 2,82 0,008
Yt-1 0,5 3,47 0,001
R2 = 0,81, Vu=12,2%
ρ11 =- 0,076
JB=1,61 (p=0,14)
LMhetero= 0,53 (p=0,26)
LM liniowość=3,53 (p=0,03)
Fchowa= 0,71 (p=0,62)
Wartośći krytyczne: tα,s =1,98
Ocena jakości:
1. parametry:test t-studenta (stwierdzenie istotności parametrów), Fchowa (stabilność), interpretacja aj
2. składnik resztowy: test JB (normalność), LMhetero (homoscedastyczność wariancji), autokorelacja
3. liniowość zależności: LMliniowość (zależności Yt względem Xt wraz z opóźnieniami)
4. dopasowanie modelu danych empirycznych: R2, Ve(Vu)
Podsumowanie jakości
Istotność
H0 : αj = 0
H1 : αj ≠ 0
t1= |−2,04| > tα, s = 1, 98 odrzucamy hipotezę zerową i mogę sądzić, że parametry stojące przy Xt, t, Yt-1 są istotne statystycznie
t2 = |−1,53| < tα, s nie ma podstaw do odrzucenia hipotezy zerowej, że parametr stojący przy Xt-1 jest nieistotny statystycznie
t3=2,82 > tα, s
t4= 3,47 > tα, s
lub
p1= 0,050 = α=0,05 (poziom istotności) jak poprzednio
p2=0,136 > α=0,05 nie ma podstaw do odrzucenia
p3=0,008 < α=0,05
p4=0,001 < α=0,05
Stabilność parametrów
H0 : βI = βII (stabilne)
H1 : βI ≠ βII (niestabilne)
FChowa = 0,71 (p=0,62)
P=0,62 > α=0,05 (poziom istotności)
Nie ma podstaw do odrzucenia hipotezy zerowej, że parametry są stabilne, czyli są w obu próbach nieistotne statystycznie.
Interpretacja aj (nie interpretuje się parametrów przy t i Yt-1, tylko te co przy X)
Jak jest tylko jedna zmienna Xt
Wzrost wielkości opadów o 1mm spowoduje przeciętnie spadek napojów gazowanych o 4,7tys. litrów, ceteris Paribas.
Jak jest Xt-1 -4,7+(-3,8)= -8,5
Wzrost wielkości opadów o 1mm spowoduje przeciętnie łącznie spadek sprzedaży napojów gazowanych (rząd wielkości). Można spodziewać się, że będzie to wiarygodne, ale potrzeba dodatkowych informacji,
Normalność składnika resztowego
H0: rozkład składnika resztowego jest normalny
H1: rozkład składnika resztowego nie jest normalny
JB = 1,61 (p=0,14)
p=0,14 > α=0,05 nie ma podstaw do odrzucenia hipotezy zerowej, że rozkład składnika resztowego jest normalny
Homoskedastyczność wariancji
H0 : σI2 = σII2 homoskedastyczność
H1 : σI2 ≠ σII2 heteroskedastyczność
(H1 : σI2 > σII2 )
LMhetero= 0,53 (p=0,26)
p=0,26 > α=0,05 nie ma podstaw do odrzucenia hipotezy zerowej, że wariancja resztowa jest homoskedastyczna
Autokorelacja
Liniowość
H0: zależność Yt względem Xt jest liniowa
H1: zależność Yt względem Xt nie jest liniowa
LM=3,53 (p=0,03)
p=0,03 < α=0,05 odrzucamy hipotezę zerową i możemy sądzić, że zależność zmiennej Yt względem Xt jest nieliniowa.
Dopasowanie modeli do danych empirycznych
R2=0,81 >R2g=0,75 (regułą na podstawie, której formułujemy wniosek, musi być)
Stopień dopasowanie modelu do danych empirycznych jest wysoki
Vu=12,2% > Vu*= 10% oznacza, że wielkość odchyleń empirycznych wielkości sprzedaży od wartości teoretycznych jest nie do zaakceptowania.
Na korzyść jakości modelu przemawia:
- istotność parametrów stojących przy Xt, t, Yt-1;
- stabilność parametrów
- sensowna pod względem ekonomicznym interpretacja parametrów
- normalność rozkładu składnika resztowego
- homoscedastyczność wariancji resztowej
- autokorelacja składnika resztowego
- oraz wysoki stopień dopasowania modelu do danych empirycznych
Na niekorzyść modelu świadczy:
- nieliniowość zależności Yt względem Xt
- zbyt duże odchylenia wartości empirycznych sprzedaży od wartości teoretycznych
- nieistotność parametru stojącego przy Xt-1
Model jest umiarkowanej jakości ze względu na te 3 powyższe elementy, a ostatecznie wartość tego modelu przy prognozowaniu będziemy mogli ocenić po eliminacji nieistotnego czynnika (zmiennej Xt-1).
Jeżeli występuje tylko nieliniowość w minusach: Możemy taki model uznać warunkowo za nadający się do prognozowania, bowiem ta liniowa zależność, którą przyjęłam w modelu może być tylko przybliżeniem wartości.
Kryterium ważne z punktu widzenia prognozowania: jeśli parametry są niestabilne to model nie nadaje się do prognozowania (niewiarygodność w prognozowaniu) oraz interpretacja aj
Gdyby wystąpiła autokorelacja: należy przebudować model przez włączenie opóźnienia , ponownie oszacować i dokonać oceny jakości. Dopiero wtedy można wysunąć ostateczny wniosek czy model nadaje się do prognozowania.
Wady i zalety prognozowania na podstawie modelu trendu
Wady | Zalety |
---|---|
|
|
Wady i zalety na podstawie modelu sezonowości
Wady | Zalety |
---|---|
|
|
Wady i zalety na podstawie modelu przyczynowo-skutkowego
Wady | Zalety |
---|---|
|
|
Wady i zalety na podstawie modelu autoregresji
Wady | Zalety |
---|---|
|
|
NA PEWNO BĘDĄ WADY I ZALETY
Nie będzie prognozowania na podstawie modelu wielorównaniowego!!!!