Prognozowanie gospodarcze- prof. Magdalena Osińska
Wykład 1-25.02.2013
Prognozy i symulacje
Literatura:
Prognozowanie gospodarcze. Praca zbiorowa pod redakcją M. Cieślak, PWE
Prognozowanie w przedsiębiorstwie, P. Dittman, PWE
J. H. Gajda, Symulacje i prognozy ekonometryczne, Wyd. Beck.
M. Osińska, (red.) Ekonometria współczesna, Wyd. TNOIK, Toruń.
Prognozowanie w logistyce, M. Osińska (2011 lub 2012)
Prognozowanie
przedmiot prognozowania: budowanie prognoz, np. prognoz gospodarczych, społecznych, politycznych, rozwoju całego świata, rozwoju gminy, lokalnej społeczności, rozwoju branży, firmy itp.
Prognoza danego zjawiska: wskazanie najbardziej prawdopodobnej drogi rozwoju tego zjawiska w oparciu o naszą wiedzę i dotychczasowy przebieg zjawiska, wiedzę o obecnym stanie zjawiska
Prognoza to wypowiedź o przyszłości. Nie wiemy jaka będzie przyszłość. Prognoza jest efektem prognozowania.
Oszacowanie to wypowiedź o przeszłości lub teraźniejszości. Dotyczy parametrów, których dokładnych wielkości nie znamy. Oszacowanie to wynik estymacji (oszacowania)
Wypowiedź na temat przyszłości- przewidywanie przyszłości, możemy podzielić na:
Prognoza:
jest budowana z wykorzystaniem nauki
odnosi się do nieodległej przyszłości
jest empirycznie weryfikowana
jest prawdziwa z dużym prawdopodobieństwem
Prognoza zjawisk ekonomicznych ma często charakter warunkowy. Jeśli będą spełnione pewne warunki, zrealizowane pewne działania, to nastąpi określone zjawisko ekonomiczne.
egz! prognozowanie na podstawie trendu
Funkcje prognozy:
wspomagająca- podjęcie decyzji mikro- i makroekonomicznych (przygotowująca, preparacyjna)
aktywizująca- wspomagająca podjęcie działań aktywizujących lub przeciwstawiających się
informacyjna- uprzedzenie, poinformowanie o mogących nastąpić zmianach, skutkach działania
Konstruowanie prognozy jest wskazane gdy:
horyzont czasowy jest krótki
zmiany prognozowanej wielkości są powolne
prognozowane wielkości mają głównie autonomiczny charakter, mało zależą od arbitralnych decyzji
jest duża inercja (bezwładność) prognozowanej zmiennej
Główne zastosowanie w gospodarce to prognozowanie:
wielkości, których nie da się zaplanować
wskaźników techniczno-ekonomicznych
finansowe
ścieżek rozwoju
efektów zamierzonych posunięć gospodarczych
stopnia realizacji przyjętych celów
odchyleń od wyznaczonych celów
Prognozowanie, a przewidywanie.
Przewidywanie bazuje na wiedzy, doświadczeniu i intuicji, brak przesłanek naukowych. Wyrocznia delficka.
Prognozowanie realizowanie jest na podstawie reguł i zasad naukowych(znane są teorie, metody, obiektywne przesłanki, na podstawie których można wnioskować o przyszłości).
Metody naukowe w tym metoda delficka.
Historia prognozowania zjawisk gospodarczych sięga XIX w.. Celem jest zmniejszanie niepewności, co do przebiegu przyszłych zdarzeń.
Klasyfikacja metod prognozowania:
Metody matematyczno – statyczne:
- metody oparte na modelach deterministycznych(opis zjawiska następuje w sposób dokładny – fizyka, chemia, ekonometria matematyczna),
- metody oparte na metodach stochastycznych(ekonometrycznych) – opis fragmentu rzeczywistości jest niedokładny, z dokładnością do składnika losowego.
Modele jednorównaniowe:
Modele szeregów czasowych
Model trendu i sezonowości
Modele autoregresyjne AR
Modele średniej ruchomej MA
ARMA
ARIMA
Jednorównaniowe modele przyczynowo-skutkowe[modele jakie były na ekonometrii]
Modele wielorównaniowe:
Modele proste
Modele rekurencyjne
Modele o równaniach współzależnych.
Modele adaptacyjne:
Średnie ruchome,
Wygładzanie wykładnicze.
Inne:
Sztuczne sieci neuronowe,
Prognozowanie przez symulację.
Metody niematematyczne (jakościowe)
Metody heurystyczne:
Metody ankietowe,
Metoda intuicyjna,
Metoda ekspertów,
Metoda delficka.
Metody analogowe:
Analogie historyczne,
Analizy przestrzenno – czasowe,
Analizy biologiczne.
Prognozy kombinowane: formułowanie prognoz w oparciu o różne modele i wyznaczenie prognozy, jako wartości średniej poszczególnych wyników.
Przykładowe pytania prognostyczne:
Jak zmieni się sprzedaż, gdy zwiększymy wydatki na reklamę o 10%?
Jakich przychodów może się spodziewać rząd w ciągu dwóch lat?
Ile jednostek powinniśmy sprzedać, żeby pokryć wydatki inwestycyjne?
Jaka będzie suma pożyczek w naszym banku w ciągu następnych 10 lat?
Czy będzie recesja? Jeśli tak to kiedy się ona rozpocznie, jak będzie długa i kiedy się zakończy?
Etapy prognozowania(wg Cieślak):
Sformułowanie zadania prognostycznego.
Sformułowanie przesłanek prognozy.
Wybór predykatora.
Wyznaczenie prognozy.
Ocena dokładności prognozy.
Zarządzanie procesem prognostycznym:
Dlaczego potrzebujemy prognozy?
Kto będzie użytkownikiem prognozy?
Jaki poziom szczegółowości jest niezbędny i jaki jest horyzont prognozy?
Jakie dane są dostępne i jakie dane są wystarczające dla celów prognostycznych?
Jaki jest koszt prognozy?
Jaka jest oczekiwana dokładności prognozy?
Czy prognoza ma wspomagać proces decyzyjny?
…
Podstawowe pojęcia:
Predykcja – proces prognozowania na podstawie modelu ekonometrycznego.
Prognoza – liczba, wartość pewnej zmiennej w przyszłości, kierunek zmian (wzrost, spadek).
Predyktor – pewien funkcjonał określony w przestrzeni wszystkich modeli ekonometrycznych opisujących badane zjawisko.
Horyzont – prognozowania – okres, na który prognoza jest formułowana.
Ze względu na horyzont prognozy dzielimy na:
- krótkookresowe (operacyjne) do 1 roku,
- średniookresowe (strategiczne) 1-3 lat,
- długookresowe (perspektywiczne) powyżej 3 lat.
Symulacja – badanie możliwych stanów interesującego nas fragmentu rzeczywistości za pomocą
eksperymentowanie na modelu. Eksperymentowanie polega na obliczaniu wartości zmiennych endogenicznych przy różnych dopuszczalnych wartościach zmiennych objaśniających lub różnych dopuszczalnych wartościach parametrów.
Możemy mówić o:
symulacji ex post (co by było, gdyby),
symulacji rozumianej, jako porównanie wariantów działań (ex, ante) (co będzie, gdy),
wariantowaniu modelu ze względu na wartości parametrów, które mogą się zmieniać w czasie.
Założenia predykcji dokonywanej na podstawie modelu ekonometrycznego
Dysponujemy modelem ekonometrycznym (oszacowanym, oszacowane parametry struktury stochastycznej, określone dopasowanie modelu).
egz! etapy budowy modelu ekonometrycznego
Struktura opisywania przez model zjawisk jest stabilna w czasie:
nie zmieniają się postaci (analityczne) modelu w okresie próby,
nie zmieniają się parametry strukturalne modelu.
Znane są wartości zmiennych objaśniających w okresie prognozowania (XT)
$$Y_{t} = \sum_{t = 1}^{k}{\alpha_{i}x_{\text{it}} + \eta_{t}}\ \ \ \ \ \ \ \ \ \ t = \left\{ 1,2,\ldots,n \right\} - \ w\ okresie\ proby(male\ t)$$
$$Y_{T} = \sum_{T = 1}^{k}{\alpha_{i}x_{\text{iT}} + \eta_{T}\ \ \ \ \ \ \ \ \ \ T = \left\{ T + 1,T + 2,\ldots,n \right\} - w\ okresie\ prognozowanym}$$
Planujemy, że zmienne osiągną dany poziom lub przyjmujemy ich wartości na poziomie prognozowanym
Rozkład składnika losowego jest stabilny w czasie:
gdy nie jest, a zmiany są regularne i niewielkie to dają się opisać,
gdy są nieregularne i duże to nie dają się opisać.
Dopuszczalność ekstrapolacji modelu poza obserwowany w próbie obszar zmienności zmiennych objaśniających.
Zasady predykcji
zasada predykcji nieobciążonej,
zasada predykcji według największego prawdopodobieństwa,
Ad. 1 (stosowana przy metodach ilościowych, matematyczno-statystycznych)
Zasada predykcji nieobciążonej polega na wyznaczeniu prognozy na poziomie wartości oczekiwanej(poziomie średnim) zmiennej prognozowanej.
Jeżeli model prognostyczny ma postać:
$Y_{T} = \sum_{i = 1}^{k}{\alpha_{i}X_{\text{it}} + \eta_{T}}$ T= n+1,n+2,…,n+k
należy obliczyć wartość oczekiwaną zmiennej prognozowanej
$$E\left( Y_{T} \right) = E\left( \sum_{i = 1}^{k}{\alpha_{i}X_{\text{iT}} + \eta_{T}} \right)$$
Ponieważ E(ηT) = 0, stąd $E\left( Y_{T} \right) = \sum_{i = 1}^{k}{\alpha_{i}x_{\text{iT}}}\ $
Predykator według zasady predykcji nieobciążonej
$$Y_{\text{TP}} = E\left( Y_{T} \right) = \sum_{i = 1}^{k}{\alpha_{i}X_{\text{iT}}}$$
Tę zasadę stosuje się wtedy, gdy proces jest powtarzalny, bo nie występują systematyczne błędy, bo w długim ciągu prognoz błędy dodatnie i ujemne równoważą się, co oznacza, że proces predykcji nie zawyża, ani zaniża ocen przyszłej realizacji zmiennej prognozowanej.
Ad. 2 (stosowana przy metodach eksperckich – heurystycznych)
Zasada według największego prawdopodobieństwa, polega na tym, że prognozę wyznacza się na poziomie równym dominancie zmiennej prognozowanej
YTP = M(YT)
[dominanta, modalna, moda stąd M]
- Gdy budujemy prognozę punktową dla zmiennej skokowej to prognozę wyznacza się na poziomie odpowiadającej największej wartości prawdopodobieństwa w okresie prognozowanym
W przypadku ciągłym prognozą będzie taka wartość zmiennej prognozowanej, której odpowiada mac funkcji gęstości prawdopodobieństwa.
Różnice między wyżej wymienionymi zasadami predykcji występują gdy rozkład zmiennej prognozowanej nie jest symetryczny względem zmiennej oczekiwanej
Mierniki rzędu dokładności prognoz
- mierniki dokładności predykcji ex ante (przed zrealizowaniem wartości zmiennej prognozy) podają spodziewany rząd odchyleń wartości zmiennej prognozowanej od prognozy.
- mierniki dokładności predykcji ex post (wyznaczanie po zrealizowaniu wartości zmiennej prognozowanej) podają faktyczny rząd odchyleń realizacji zmiennej prognozowanej od prognozy.
Błąd predytkora (ex ante)
D = yTP − yT = yTP − E(yT)
Jeżeli E(yTP−E(YT)) = 0 to mówimy o predykcji nieobciążonej,
Jeżeli E(yTP−E(YT)) ≠ 0 to predykcja obciążona.
Wariancja predykcji zależy od:
- wariancji i kowariancji estymatora,
- wartości zmiennych objaśniających w okresie prognozowanym,
- wariancji składnika losowego.
Model $Y_{T} = \sum_{i = 1}^{k}{\alpha_{i}X_{\text{it}} + \eta_{t}}$ w postaci macierzowej:
Y = Xα + η
Wariancja predykcji: VT2 = (1+XT(XTX)−1XTT) S(u)2
VT2 − wariancja predyckji,
XT , XTT − wektor wartosci zmiennych objasniajacych w okresie prognozowanym,
Su2 Se2 − wariancja skladnika losowego,
(XTX)−1 − macierz wariancji − kowariancji estymatora, [(XTX)−1XTy z KMNK]
Średni błąd predykcji $V_{T} = \ \sqrt{V_{T}^{2}}$
Informuje o ile średnio w długim ciągu prognoz rzeczywiste realizacje zmiennej prognozowanej będą się różnić od wartości wyliczanych prognoz
Względny błąd predykcji $V_{T}^{*} = \frac{V_{T}}{y_{\text{TP}}}*100\%$
Mówi ile procent prognozy stanowi średni błąd predykcji, służy do oceny czy predykcja jest dopuszczalna.
Jeżeli V*T ≤ V*G to prognoza jest dopuszczalna.
Granica błędu V*G to np. 5%, 10%.
Jeżeli V*T ≥ V′G to prognoza niedopuszczalna.
Błąd prognozy (ex post)
Realizacja zmiennej prognozowanej minus prognoza
δT = YT − yTP
Wariancja błędu prognozy
$$\sigma_{T}^{2} = \ \frac{1}{h}\sum_{T = n + 1}^{n + h}{(y_{T} - y_{\text{TP}})}^{2}$$
h=1,2…,H – horyzont prognozy,
yTP = wartość prognozowana
yT – wartość zrealizowana
Średni błąd prognozy w całym okresie prognozy
$$\delta_{T} = \sqrt{\delta_{T}^{2}}$$
Określamy trafność prognozy
Względny błąd prognozy
$$\delta_{T}^{*} = \frac{\delta_{T}}{Y_{T}}*100\%$$
Jeżeli δ*T ≤ δ*G to prognoza jest trafna,
granica błędu δ*G to np. 5%, 10%.
Jeżeli δ*T ≥ δ*G to prognoza nie jest trafna
Prognoza może nie być trafna, bo:
- model nie jest najlepszy
- któreś założenie predykcji nie zostało spełnione
Wykład 2- 04.03.2013
Inne mierniki jakości prognoz ex post
Miernik Theila
Współczynnik Janusowy
Średni absolutny błąd predykcji (MAPE)
Ad1.
$$I^{2} = \ \frac{\frac{1}{h}\sum_{T = n + 1}^{n + h}{(y_{T} - y_{\text{TP}})}^{2}}{\frac{1}{h}\sum_{T = n + 1}^{n + h}Y_{T}^{2}} = \frac{\sum_{T = n + 1}^{n + h}{(y_{T} - y_{\text{TP}})}^{2}}{\sum_{T = n + 1}^{n + h}Y_{T}^{2}}$$
horyzont prognozy T={n+1, n+2,…, n+h} t= {1….n}
Informuje o tym, jaki był przeciętny względny błąd predykcji w całym okresie prognozowanym.
Zachodzi:
I2 = I12 + I22 + I32
przy czym:
$I_{1}^{2} = \frac{{(({srednia\ wartosc)y}_{T} - {(srednia\ wartosc)y}_{\text{TP}})}^{2}}{\frac{1}{h}\sum_{T = n + 1}^{n + h}y_{T}^{2}}$ - jest wielkością błędu wynikającego z obciążenia metody predykcji
$I_{2}^{2} = \frac{{(S_{\text{yT}} - S_{\text{yTP}})}^{2}}{\frac{1}{h}\sum_{T = n + 1}^{n + h}Y_{T}^{2}}$ - jest wielkością błędu wynikającego z niedostosowania elastyczności prognozy do faktycznych wahań zmiennej prognozowanej [ korelacja powinna wynosić 1]
$I_{3}^{2} = \frac{2\ S_{\text{yT}}*\ S_{\text{yTP}}\ \left( 1 - r \right)}{\frac{1}{h}\sum_{T = n + 1}^{n + h}Y_{T}^{2}}$ – błąd wynikający z braku pełnej zgodności kierunku zmian wartości teoretycznej ze zmianami wartości empirycznych
r- współczynnik korelacji między YT (wartości rzeczywiste) i YTP (wartości prognozowane) wskaźnik korelacji Pearsona
Ad. 2
$$J = \frac{\sum_{T = n + 1}^{n + h}{(y_{T} - y_{\text{TP}})}^{2}}{\begin{matrix}
\frac{1}{h}\sum_{t = 1}^{n}\left( y_{i} - \hat{y_{t}} \right)^{2} \\
\\
\end{matrix}}$$
Jeżeli J=1 to oznacza, że model ekonometryczny nie ulega dezaktualizacji, czyli licznik i mianownik mają podobny charakter, czyli rząd dokładności predykcji jest równy rzędowi dokładności modelu w próbie
Jeżeli J>1 to model ulega dezaktualizacji, traci on dobre własności prognostyczne i należałoby oszacować ten model na podstawie nowych informacji lub zbudować innym model.
J>2 dezaktualizacja
Ad. 3
Średni absolutny błąd predykcji
$$MAPE = \ \frac{1}{h}\sum_{h = 1}^{H}|\frac{y_{\text{TP}} - y_{T}}{Y_{T}}|*100\%$$
h = 1.2….H – horyzont prognozy
yTP- wartości prognozowane
yT – wartość zrealizowana
Służy do porównań prognoz otrzymanych różnymi metodami
Naiwne metody prognozowania
- często spotykane w życiu codziennym
- prognozę wyznacza się na takim poziomie zmienności prognozowania, jaki był obserwowany w okresie poprzednim – prognoza = to, co było wczoraj
YT = n-1, p = Yn
Ogólnie:
yTP = yt-1
yTP = yT-4 [sprzed 4 okresów; dotyczy sezonowości]
yTP = yT-1 + (yT-1 – yT-2)
yTP = (1+c) yT-1
WYKŁAD 2
Prognozowanie na podstawie funkcji trendu i sezonowości
Oznaczenia:
yt – proces stochastyczny (ekonomiczny)
yt = Pt + St + ηt
Pt – składnik trendu – wyznacza zasadniczy kierunek rozwoju danego zjawiska w czasie, przebieg gładki i spokojny, bo zmiany trendowe związane są z długim okresem
St –składnik sezonowy określający wahanie sezonowe (wahanie cykliczne o okresie rocznym)
ηt- składnik stochastyczny (losowy), może być stacjonarny lub niestacjonarny, o średniej zero.
Pt + St – składnik niestochastyczny – opisuje zmiany wartości średniej procesu.
E(yt) = Pt + St
E(ηt) = 0
prognoza wg trendu powinna być na okresy długie
Wielomianowa funkcja trendu
gdzie:
r - topień wielomianu trendu
t- zmienna czasowa
jest przyjmowana wtedy, gdy nie mamy żadnych innych informacji jaka jest postać funkcji trendu.
Gdy r= 0 to Pt = a0 - trend nie występuje.
r> 0 - występuje trend.
r=1 wtedy Pt = a0
Badanie stopnia wielomianu trendu
Zastosowanie testu Fishera – Snedecora (F) do oceny istotności spadku wariancji resztowej przy przechodzeniu do coraz wyższych stopni wielomianu trendu
Mając realizację procesu stochastycznego szacujemy parametry trendu liniowego
yt = a0 + a1t + ut
Stosujemy estymator według KMNK, aby otrzymać oszacowane wartości:
a = (X′X)−1X′y
$X = \ \begin{bmatrix} 1 & 1 \\ 1 & 2 \\ 1 & 3 \\ \ldots & \ldots \\ 1 & n \\ \end{bmatrix}$
yt = a0 + a1t + ut (+/- S(a1)) (S2(u))
Jeżeli trend jest liniowy to a1 musi być istotny stochastycznie
$t = \ \frac{a_{1}}{S(a_{1})}$ t ≥ t∝, 1
Szacujemy model trendu kwadratowego
yt = a0 + a1t + a2t2 + ut (+/- S(a1)) (+/- S(a2)) (S2(u))
$X = \ \begin{bmatrix} 1 & 1 & 1 \\ 1 & 2 & 4 \\ 1 & 3 & 9 \\ \ldots & \ldots & \ldots \\ 1 & n & n^{2} \\ \end{bmatrix}$
Badamy czy istotnie spadła wariancja składnika resztowego, kiedy przechodzimy do modelu trendu kwadratowego ( wtedy przyjmujemy m. kwadrat.)
Test F
H0 : σ12 = σ22
H1 : σ12 ≥ σ22
$$F = \ \frac{S_{1}^{2}(u)}{S_{2}^{2}(u)}$$
Większe wariancje resztowe – oznaczają model gorszy
Jeżeli F ≥ F∝, S1, S2 odrzucamy H0 przy poziomie istotności ∝. Oznaczenia S1 = η1 − k1 liczba obserwacji minus liczba parametrów modelu trendu liniowego S2 = η2 − k2 liczba obserwacji minus liczba parametrów trendu kwadratowego.
Jeżeli F ≥ F∝, η1, η2 to nie ma podstaw do odrzucenia H0 przy poziomie istotności ∝ o równości wariancji w obu badanych modelach, czyli nie nastąpił istotny spadek wariancji resztowej przy przejściu od modelu liniowego do modelu kwadratowego. Stopień wielomianu trendu jest równy stopniowi modelu pierwszego – oznacza to koniec procedury wyboru.
W przypadku, gdy F ≥ F∝, S1, S2 konieczne jest oszacowanie parametrów trendu trzeciego stopnia.
yt = a0 + a1t + a2t2 + a3t3 + ut (+/- S(a1)) (+/- S(a2)) (+/- S(a3)) (S2(u))
Ekstrapolacja trendu poza obszar próby
yTP = a0 + a1T
t = 1,2…n+h – przeszłość
T= n+1, n+2,…, n+h – przyszłość
Modele trendu mają tę zaletę, że znane są wartości zmiennych objaśniających w okresie prognozowanym
Model trendu kwadratowego
yTP = a0 + a1T + a2T2
Prognozy wygasłe – gdy dokonujemy prognozy dla zmiennych, których wartości już się zrealizowały i są znane (znane yT)
Gdy realizacja > prognoza, wtedy prognoza niedoszacowana
Gdy realizacja < prognoza, wtedy prognoza przeszacowana
Modele trendu i sezonowości
yT = Pt + St + ηt
Wahania, które mają okres roczny spotyka się w wielu procesach ekonomicznych, np. popyt na towary zmienia się sezonowo (np. obuwie, napoje itd.)
W inflacji i bezrobociu, PKB – też można zauważyć sezonowość.
Budowa modelu z sezonowością.
$S_{t} = \sum_{k = 1}^{m}{d_{k}Q_{\text{kt}}}$
dk – parametr mierzący efekt sezonowy w cyklu roku, np. o ile wykonano mniej napojów w styczniu niż wielkość średnia
m – liczba sezonów w roku
m = 4,12,36…
$$Q_{\text{kt}} = \ \left\{ \begin{matrix}
1 - zjawisko\ wystepuje - zmienna\ zerojedynkowa \\
0 - nie\ wystepuje\ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \\
\end{matrix} \right.\ $$
Model trendu liniowego i sezonowości kwartalnej:
$$y_{t} = \ a_{0} + a_{1}t + \ \sum_{k = 1}^{m}{d_{k}Q_{\text{kt}} + \eta_{t}}$$
Żeby oszacować budujemy macierz obserwacji
$$X = \ \begin{bmatrix}
1 & 1 & 1 & 0 & 0 & 0 \\
1 & 2 & 0 & 1 & 0 & 0 \\
\ldots & \ldots & 0 & 0 & 1 & 0 \\
1 & n & 0 & 0 & 0 & 1 \\
\end{bmatrix}$$
Ponieważ suma 4 ostatnich kolumn jest równa 1 w każdym wierszu zmienne są współliniowe, jedne z nich da się przedstawić jako kombinację liniową innych (wektory są liniowo zależne)
$d_{4} = \ - \sum_{k = 1}^{3}d_{k}$ wówczas wyznacznik macierzy (XTX) = 0 – macierz jest osobliwa. Przeprowadza się korektę tej macierzy – od każdej kolumny odejmujemy kolumnę ostatnią
$X = \ \begin{bmatrix} 1 & 1 & 1 & 0 & 0 \\ 1 & 2 & 0 & 1 & 0 \\ 1 & 3 & 0 & 0 & 1 \\ \ldots & \ldots & - 1 & - 1 & - 1 \\ 1 & n & 1 & 0 & 0 \\ \end{bmatrix}$ - co m-ty wiersz pojawi się -1
$$y_{t} = \ a_{0} + a_{1}t + \ \sum_{k = 1}^{m - 1}{d_{k}Q_{\text{kt}} + u_{t}}$$
Efekt sezonowy dla m-tego okresu w cyklu $d_{m} = \ \sum_{k = 1}^{m - 1}d_{k}$
Mając oszacowane parametry przystępujemy do weryfikacji, a następnie do prognozowania na podstawie modelu trendu i sezonowości
Przynajmniej jeden parametr stojący przy zmiennej sezonowej musi być istotny statystycznie wtedy wahanie sezonowe występuje. Jeżeli żaden parametr nie jest istotny tzn. że wahanie sezonowe nie występuje. Eliminowanie części nieistotnych wahań sezonowych jest błędem.
Prognozowanie na podstawie modelu trendu i sezonowości
Prognozę wyznacza się na poziomie wartości oczekiwanej
Wartość zmiennych objaśniających są z góry ustalone (prognoza deterministyczna). Tendencje zaobserwowane w próbie będą kontynuowane.
$$y_{t} = \ a_{0} + a_{1}T + \ \sum_{k = 1}^{m - 1}{d_{k}Q_{\text{kt}}}$$
Pytanie: Jakie wartości przyjmą zmienne objaśniające w okresie prognozowanym?
Błędy ex ante i ex post wylicza się analogicznie.
Metody prognozowania na podstawie szeregów czasowych
modele trendu
modele sezonowości
modele autoregresyjne
Procesy
Stacjonarne
|
Niestacjonarne! (częściej)
- trend -sezonowość (determinacja
-dane zintegrowane dane modelem ARIMA (inflacja, podaż pieniądza) |
---|
Prognozowanie na podstawie modeli autoregresyjnych
Model autoregresyjny AR(p)
$$Y_{t} = \ \propto_{1}Y_{t - 1} + \propto_{2}Y_{t - 2} + \ \ldots + \propto_{p}Y_{t - p} + \ \epsilon_{t}\ = \ \sum_{i = p}^{P}{\propto_{i}Y_{t - i} + \ \epsilon_{t}}$$
ϵt − proces bialoszumowy; biały szum jest procesem stacjonarnym o następujących własnościach:
E(εt) = 0
D2(εt) = δ2
cov (εt1,εt2) = 0 oznacza brak autokorelacji
Proces Y jest stacjonarny gdy:
E(Yt) = const
i
D2(Yt) = const
i
cov (Yt1,Yt2) = K(t2−t1) = k(τ)
wszystkie trzy muszą zachodzić naraz
Model z operatorem przesunięcia
( I − ∝1u − ∝2u2 − … − ∝pup) Yt = ϵt
usYt = Yt − s - operator cofnięcia (przesunięcie wstecz)
Ogólna postać modelu AR
A(u)Yt = ϵt
ϵt - biały szum – proces czysto losowy, brak autokorelacji
z tym, że:
∝p ≠ 0
∝0 = 1
Stacjonarność modelu AR [ nie zawsze jest stacjonarny]
A(u) = 0
Jeżeli wszystkie pierwiastki powyższego równania wielomianowego są, co do modułu większe od jedności (leżą poza okręgiem jednostkowym) to proces AR jest stacjonarny.
1.Szczególna postać modelu
Yt = ∝1Yt − 1 + ϵt
|∝1| < 1
Jest to stacjonarny model AR(1) – model Markowa
(1−∝1u)Yt = ϵt
1 − ∝1u = 0
1 − ∝1z = 0
$z = \ \frac{1}{\propto_{1}}$
u- parametr przesunięcia wstecz
u * Yt = Yt − 1
u3Yt = Yt − 3
2.Warunki stacjonarności procesu AR(2)
Yt = ∝1Yt − 1 + ∝2Yt − 2 + ϵt
|∝2| < 1
∝2 − ∝1 < 1
∝2 + ∝1 < 1
Badanie rzędu modelu autoregresyjnego
Ustalenie rzędu AR za pomocą testu Durbina Watsona i testu na istotność parametrów strukturalnych (popularne ale nie poprawne)
Wykorzystanie innych testów na autokorelację – np. Boxa-Pierce’a, Boxa-Ljunga
Wykorzystanie funkcji autoregresji cząstkowej i testu Quinauille’a
Wykorzystanie kryteriów formalnych Akaibe’a i Schwarca
np. proces autoregresyjny
yt = 0, 7yt − 1 + εt- stacjonarny
yt = 0, 95yt − 1 + εt- stacjonarny
yt = 1, 01yt − 1 + εt- niestacjonarny
Ad 1.
Procedura niepoprawna, gdyż test DW nie należy stosować tam, gdzie występuje opóźniona zmienna endogeniczna.
Polega na szacowaniu parametrów modeli coraz wyższych rzędów (1,2,3 itd.) i wyborze tego modelu, którego parametr przy najdalszym opóźnieniu jest istotny, zaś proces resztowy nie zawiera autokorelacji.
egz! jakie są hipotezy i postać testu DW?
Ad 2.
Test Boxa-Ljunga (badanie autokorelacji dowolnego rzędu)
H0 : brak autokorelacji $\bigwedge_{j}^{}r_{j} = 0$
H1: AR(p) lub MA(p) $\bigvee_{j}^{}{r_{j}\ \neq}0$
$$Q^{'} = \ T\left( T + 2 \right)\sum_{i = 1}^{p}\frac{rj^{2}}{T - j}$$
Gdzie:
$$r_{j} = \ \frac{\sum_{t = j + 1}^{T}{e_{t}e_{t - 1}}}{\sum_{t = 1}^{T}e_{t}^{2}}\ \ \ \ \ \ \ \ \ \ \ \ \ \ \ j \leq p$$
Q′ ∼ χ2(p) - chi-kwadrat o p stopniach swobody-
Ad. 3 PACF (practial autocorelation function)
yt = φττyt − τ + εt -> postać ogólna
φ- opóźnienie
1. yt = φ11yt − 1 + εt
2. yt = φ22yt − 2 + εt
3. yt = φ33yt − 3 + εt
⋮
Wyznaczania współczynnika autokorelacji cząstkowej
Funkcja autokorelacji
Yt = ∝1Yt − 1 + ∝2Yt − 2 + …+∝pYt − p + ϵt mnozymy obustronnie przez Yt − τ
Yt = Yt − τ∝1Yt − 1 + Yt − τ∝2Yt − 2 + …+Yt − τ∝pYt − p + Yt − τϵt
Wartość oczekiwana (kowariancja)
E(εtYt − τ) = 0, bo E(εt) = 0
K(τ) = ∝1K(τ−1) + ∝2K(τ−2)+…+ ∝pK(τ−p) / : K(o)
$$\frac{K\left( \tau \right)}{K(o)} = R\left( \tau \right) - \ wspolczynnik\ autokorelacji$$
R(τ) = ∝1K(τ−1) + ∝2K(τ−2)+…+ ∝pK(τ−p) - funkcja autokorelacji
Autokorelacja cząstkowa PACF
yt = φ11yt − 1 + εt
yt = φ22yt − 2 + εt
yt = φ33yt − 3 + εt
Itd.
PACF = {φ11, φ22, φ33}
Test Quienoille’a (test na istotność współczynnika autokorelacji)
Dla sprawdzenia istotności φτ, τ. Jeżeli:
$$t = \frac{{\hat{\varphi}}_{\tau,\tau}}{S({\hat{\varphi}}_{\tau,\tau})}\ \geq 2$$
H0 : φττ = 0 brak autokoleracji
H1 : φττ ≠ 0 wystepuje autokoleracja
Wówczas współczynnik jest statystycznie istotny
Zakłada się, że
$$S\left( \varphi_{\tau,\tau} \right) = \frac{1}{\sqrt{n}} - \ blad\ standardowy\ \varphi_{\tau,\tau}$$
n- liczebność próby
Podstawiając do t mamy:
$$\left| {\hat{\varphi}}_{\text{ττ}} \right|\ \geq \frac{2}{\sqrt{n}}$$
Jeżeli ${|\varphi}_{\tau,\tau}|\ < \frac{2}{\sqrt{n}}$ to następuje zanikanie autokorelacji cząstkowej, rząd modelu AR nie będzie większy od p. W przypadku modelu AR funkcja autokorelacji cząstkowej urywa się na poziomie nie przekraczającym 20 % długości szeregu.
Wykład 3- 11-03-2013
Model trendu i sezonowości -> długi okres
Model autokorelacji -> prognoza krótki okres
Jak połączymy AR daje krótkookresowe dostosowanie do prognozy długoterminowej
Ad. 4
Kryteria informacyjne
Kryterium Akaike’a
$$A^{'}C = \ln L\left( \overset{\grave{}}{\theta} \right) - \ 2k$$
(to coś nad θ to jest daszek)
kryt. inf-> min
AIC-> min
!SC-> min
Gdzie:
$\ln L\left( \overset{\grave{}}{\theta} \right)$ – logarytm funkcji wiarygodności
k – liczba szacowanych parametrów
W praktyce:
$$A^{'}C = n{{\ln\overset{\grave{}}{\sigma}}^{2}\ }_{e} - 2\ \left( p + q + 1 \right);\ \ \ \ \ \ \ \left( p + q + 1 \right) - \ liczba\ szacowanych\ parametrow\ w\ modelu$$
${{\ln\overset{\grave{}}{\sigma}}^{2}}_{e}$ - logarytm z wariancji reszt - im mniejsza tym lepiej
(Ten dzyndzelek nad σ to jest daszek)
Kryterium Schwarza
$$SC = n\ \ln L\left( \overset{\grave{}}{\theta} \right) - \ k\ln n$$
w praktyce:
$$SC = n\ {{\ln\overset{\grave{}}{\sigma}}^{2}\ }_{e} - \ \left( p + q + 1 \right)\ln n$$
Lepsze niż Akeike’a
Wybiera się model o min wartościach kryteriów – najmniejsza strata informacji
Wybiera się model, któremu odpowiadają minimalne wartości tych kryteriów, co oznacza najmniejszą stratę informacji.
Prognoza na przykładzie modelu AR(2)
$$Y_{t} = \ {\overset{\grave{}}{\propto}}_{0}\ + \ {\overset{\grave{}}{\propto}}_{1}Y_{t - 1} + {\overset{\grave{}}{\propto}}_{2}Y_{t - 2} + \ \epsilon_{t}$$
Prognoza na n+h okres
$$Y_{n + h,\ P} = \ {\overset{\grave{}}{\propto}}_{0}\ + \ {\overset{\grave{}}{\propto}}_{1}Y_{n + h - 1} + {\overset{\grave{}}{\propto}}_{2}Y_{n + h - 2}$$
Dla n+1
$Y_{n + 1,\ P} = \ {\overset{\grave{}}{\propto}}_{0}\ + \ {\overset{\grave{}}{\propto}}_{1}Y_{n} + {\overset{\grave{}}{\propto}}_{2}Y_{n - 1}$ (n – ostatnia obserwacja w szeregu)
Dla n+2
$Y_{n + 2,\ P} = \ {\overset{\grave{}}{\propto}}_{0}\ + \ {\overset{\grave{}}{\propto}}_{1}Y_{n + 1} + {\overset{\grave{}}{\propto}}_{2}Y_{n}$
Dla n+3
$Y_{n + 3,\ P} = \ {\overset{\grave{}}{\propto}}_{0}\ + \ {\overset{\grave{}}{\propto}}_{1}Y_{n + 2} + {\overset{\grave{}}{\propto}}_{2}Y_{n + 1}$
Itd…..
Przy prognozowaniu na kolejne okresy wstawiamy prognozy wcześniej wyliczone. To oznacza, że następuje kumulacja błędów prognoz, można wyliczyć błędy ex ante i ex post.
Modele AR wykorzystuje się do prognozowania na okresy krótkie. W okresach dłuższych wartości prognoz zmierzają do poziomu stałego wyznaczonego przez ${\overset{\grave{}}{\propto}}_{0}$ lub w przypadku braku wyrazu wolnego do zera.
Prognozowanie na podstawie dynamicznego modelu zgodnego
Dynamiczny model zgodny może dotyczyć ekonometrycznego modelowania zależności przyczynowych pomiędzy ekonometrycznymi procesami stochastycznymi jak również modelowania jednowymiarowych i wielowymiarowych szeregów czasowych
Modelem zgodnym nazywamy taki model, w którym proces endogeniczny Yt jest wyjaśniony przez procesy egzogeniczne wraz z ich całą strukturą dynamiczną, przy czym proces resztowy pozostaje białym szumem.
Przez wewnętrzną strukturę dynamiczną będziemy rozumieć zarówno składowe stacjonarne i niestacjonarne (np. trend, sezonowość, autoregresję), występujące z różnym nasileniem w każdym z analizowanych procesów.
Badanie wewnętrznej struktury procesów oraz konstrukcje modelu empirycznego
Specyfikacja zmiennych objaśniających przebiega dla każdego równania na podstawie badania istotności zależności i własności reszt
Dynamiczny liniowy model zgodny o zmiennych wartościach średniej dotyczy zarówno procesów stacjonarnych jak i niestacjonarnych, dlatego w modelu uwzględnia się wartość średnią mt , która może zawierać trend (Pt), składnik sezonowy (St) lub jednocześnie oba te czynniki (Pt , St)
Liniowy model zgodny można zapisać w postaci:
$$Y_{t} = \ m_{t} + \ \sum_{s = 1}^{q}{\beta_{s}Y_{t - S}} + \ \sum_{s = 0}^{P}{\alpha_{s}X_{t - S} + \ \varepsilon_{t}}$$
Gdzie:
mt- wartość średnia procesu, która może przybierać postać: $\left\{ \begin{matrix} m_{t} = const \\ m_{t} = \ P_{t} \\ m_{t} = \ S_{t} \\ m_{t} = \ P_{t}{+ S}_{t} \\ \end{matrix} \right.\ $
Yt, Yt − S- proces endogeniczny w czasie bieżącym (t) i w czasie opóźnionym (t-s)
Xt − S, Xt - proces egzogeniczny w czasie bieżącym (t) i w czasie opóźnionym (t-s)
εt - składnik losowy, biały szum
Trend „r” | Sezonowość | AR(q) | |
---|---|---|---|
Yt |
1 | + | 1 |
X1t |
2 | - | 1 |
Xqt |
1 | + | 2 |
$$Y_{y} = \propto_{0} + \propto_{1}t + \sum_{}^{}{d_{k}Q_{\text{kt}} + \beta y_{t - 1} + \varepsilon_{\text{yt}}}$$
X1t = γ0+γ1t + γ2t2 + cX1t − 1 + εx1t
$$X_{2t} = \propto_{0} + \propto_{1}t + \sum_{}^{}q_{k}Q_{\text{kt}} + d_{1}X_{2t - 1} + d_{2}X_{2t - 2} + \varepsilon_{x_{2}t}$$
Model:
Yt = f(x1t, x2t, εt) długaśny wzór
Etapy specyfikacji dynamicznego liniowego modelu zgodnego dla procesów niestacjonarnych w wartości średniej:
Badanie struktury wewnętrznej procesów
Wyodrębnienie trendu
Wyodrębnienie składnika sezonowego
Ustalenie rzędu opóźnień poszczególnych procesów
Sformułowanie ogólnego modelu zawierającego max stopień wielomianu trendu, sezonowość oraz max rząd autoregresji dla każdego procesu
Oszacowanie postaci pierwotnej modelu zgodnego uwzględniającej wszystkie wyspecyfikowane składniki
Weryfikacja modelu na podstawie badania istotności zmiennych oraz własności reszt
Interpretacje ocen parametrów strukturalnych oraz ocena dopasowania modelu
Prognozowanie
Stosuje się założenie predykcji ekonometrycznej
Wykorzystuje się zasady prognozowania omówione dla modeli trendu, sezonowości i autoregresji.
Wartości zmiennych objaśniających w okresie prognozowanym:
Jeżeli nie ma innych zaleceń – wylicza się na podstawie jednowymiarowych modeli tych zmiennych, zawierających trend, sezonowość oraz opóźnienie autoregresyjne
Można wyznaczyć błędy prognoz ex ante i ex post
Wykład 4- 18-03-2013
Prognozowanie za pomocą metod adaptacyjnych
Mają zastosowanie kiedy przebieg zjawiska w czasie jest nieregularny lub nawet skokowy, dochodzi do załamania dotychczas obserwowanych trendów. Zjawiska o charakterze skokowym prowadzą do dezaktualizacji modelu ekonometrycznego co osłabia założenie predykcji.
Cechy metody adaptacyjnej
- w metodzie adaptacyjnej nie ustala się postaci analitycznej trendu, a jedynie wyznacza się ocenę trendu jako pewną średnią z wartości ocen dokonywanych w okresach wcześniejszych i pewnej liczby najnowszych realizacji zmiennej prognozowanej
- podobnie jak modele tendencji rozwojowej nie prowadzą do wyjaśnienia przyczyn zjawiska, tylko do ustalenia pewnej krzywej opisującej przebieg zjawiska w sposób najbardziej spokojny (giętki)
Prognozowanie na podstawie średnich ruchomych
Poszczególnym wartościom szeregu przypisuje się średnią arytmetyczną określonej liczby wyrazów. Im średnie ruchome jest dłuższa (liczone z większej liczby wyrazów), tym następuje większe wygładzenie badanego szeregu. Im większe k tym większe wygładzenie.
Oznaczamy kolejne wartości szeregu czasowego
y1, y2. Y3, … , yn-2 , yn-1 , yn
średnie ruchome wyznaczamy różnie w zależności od ich długości (k)
gdy k jest nieparzyste (np. k=3) to średnie ruchome wyznaczają się następująco:
$$\overset{\overline{}}{y_{2}} = \frac{y_{1} + y_{2} + y_{3}}{3}$$
$$\overset{\overline{}}{y_{3}} = \frac{y_{2} + y_{3} + y_{4}}{3}$$
[przesuwamy się o jedno- jedno poniżej i jedno powyżej]
Postulat postarzania informacji
Obserwacje wcześniejsze mają mniejsze wagi niż ostatnio.
Średnia ruchoma ważona
$$\overset{\overline{}}{y_{i}} = \ w_{1}y_{1} + w_{2}y_{2} + {w_{3}y}_{3}$$
w1 + w2 + w3 =1
itd. aż do ostatniego okresu:
$$\overset{\overline{}}{y_{n - 1}} = \frac{y_{n - 2} + y_{n - 1} + y_{n}}{3}$$
Zauważmy, że przy k =3 straciliśmy jedną informację na początku i jedną na końcu szeregu czasowego (1+1 = 2 straty)
REGUŁA: Im dłuższa średnia ruchoma (im większe k) tym większe straty na informacji, ale za to lepsze wygładzenie i możliwość zaobserwowania tendencji rozwojowej badanego zjawiska
Gdy k jest parzyste (np. k=4) to średnie ruchome wyznacza się następująco (tzw. średnia scentrowana)
$$\overset{\overline{}}{y_{3}} = \frac{\frac{y_{1}}{2} + y_{2} + y_{3} + y_{4} + \frac{y_{5}}{2}}{4}$$
Itd. Aż do:
$$\overset{\overline{}}{y_{n - 2}} = \frac{\frac{y_{n - 4}}{2} + y_{n - 3} + y_{n - 2} + y_{n - 1} + \frac{y_{n}}{2}}{4}$$
[półtora powyżej i półtora poniżej]
!Zakłada się, że poziom zmiennej prognozowanej nie ulega gwałtownym zmianom, a ewentualne wahania są niewielkie.
Metodę tę stosuje się przy prognozowaniu na krótkie okresy.
Prognozowanie:
- przyjmuje się, że wartość zmiennej prognozowanej w następującym okresie będzie równa średniej arytmetycznej z k ostatnich wartości zmiennej
$$y_{\text{TP}} = \frac{1}{k}\ \sum_{i = t - k}^{t - 1}y_{i}$$
Gdzie k jest długością średniej ruchomej i jednocześnie jest stałą wygładzania.
W parzystym wzorze wagi są jednakowe dla nowszych i starszych informacji.
Jeżeli prognozuje się na podstawie średniej ruchomej ważonej postaci
$$y_{\text{TP}} = \ \sum_{i = t - k}^{t - 1}y_{i}\omega_{i - t + k + 1}$$
[dowolność przy wyborze k:
wagi- czy i jakie
porównanie: błąd prognozy ex post]
To wagi dobiera się na podstawie doświadczenia oraz metodą prób i błędów. Można dobierać wagi tak, aby ciąg prognoz wygasłych z wartościami empirycznymi dawał jak najmniejszy błąd. Suma wag musi być równa jeden.
średnia ruchoma ważona
$y_{2} = \frac{1}{4}y_{1} + \frac{1}{4}y_{2} + \frac{2}{4}y_{3}$ [suma wag = 1 (zawsze!)]
Model wyrównania(wygładzania) wykładniczego Browna
Zał. Występują wahania trendowe i przypadkowe, nie ma zmian o charakterze cyklicznym.
Ocena trendu mt:
mt=αyt+(1 − α)mt − 1 ważny wzór
mt-ocena trendu
yt- rzeczywista obserwacja
mt=yt
Gdzie:
α- parametr wygladzania, przyjmuje wartości z przedziału <0,1>
- gdy α bliskie jedności, tzn. że większe znaczenie przypisujemy nowszym informacjom oraz przypuszczamy, że wystąpią głębokie załamania (wahania, zmiany)
- gdy α bliskie 0 powtarzają się prawidłowości z przeszłości, większe znaczenie przypisujemy informacjom wcześniejszym, a mniejsze teraźniejszym
α musi być dobrane metodą prób i błędów lub za pomocą optymalizacji
Dla okresu t-1:
mt − 1 = αyt − 1 + (1−α)[αyt − 1 + (1−α)mt − 2]
Po podstawieniu do mt:
mt = αyt + (1−α)[αyt − 1+(1−α)mt − 2] = αyt + α(1−α)yt − 1 + (1 − α)2yt − 2
dla t-2
mt − 2 = ∝yt − 2 + (1 − ∝)mt − 3
EXEL- analiza danych-> średnia ruchoma-> wygładzanie wykładnicze
Ogólne równanie trendu:
$$m_{t} = \sum_{i = 1}^{\infty}{(1 - \alpha)}^{i}y_{t - i} + {(1 - \alpha)}^{i + 1}m_{t - i - 1}$$
Nazwa wyrównania wykładniczego wynika z tego, że parametry maleją wykładniczo, tzn. wagi wskazują, że informacje wcześniejsze będą miały mniejsze znaczenie niż późniejsze.
Jak prognozować na okres n+h?
!yTP = mt + (mt−mt − 1)h = mt + mth
Obliczamy mierniki dokładności ex post
(ex ante się nie da)
$\overset{\overline{}}{u} = \frac{1}{h}\sum_{}^{}{\left( y_{T} - y_{\text{TP}} \right) \approx 0\ }$ - predykcja ma nieokreślony charakter
$\text{Sp}^{2} = \frac{1}{2}\sum_{}^{}{\left( y_{T} - y_{\text{TP}} \right)^{2}\ }$ - wariancja prognozy
$\overset{\overline{}}{u}$ jak najbliższe 0 i Sp2 jak najmniejsze
prognoza= ostatnia obserwacja+ ostatni przyrost
kryteria:
-średni błąd ex post
- nie można policzyć błędów ex ante
Wygładzanie wykładnicze:
1.Model Browna
2.Model Holta
3.Model Wintersa
Model Holta
Można stosować, gdy występują zmiany w trendzie i wahania przypadkowe.
Wyznacza się:
- mt – ocenę trendu
- dt – ocenę przyrostów trendu
Ocena trendu:
mt = αyt + (1−α)(mt − 1 + dt − 1)
ważne:
dtβ ∈ [0,1]
kryterium minimalizacji: minimalny błąd ex post
Za m1 można przyjąć y1
Ocena przyrostów trendu:
dt = β(mt − mt − 1)+(1 − β)dt − 1
Za d1 można przyjąć y2 – y1 (dt-1 = yt-1 – yt-2 )
Wyznaczanie prognozy:
yTP = mn + hdn
Model Wintersa
W modelu tym wyznacza się:
- ocenę trendu (mt)
- ocenę składnika losowego (St)
- ocenę przyrostów trendu (dt)
Dopuszcza się możliwość zmian w trendzie i wahaniach sezonowych
Yt = Pt + St + ηt
Ocena trendu:
mt = α(yt − St − l)+(1−α)(mt − 1 + dt − 1)
Ocena składnika losowego
St = γ(yt − mt)+(1−γ)St − l
Ocena przyrostów trendu
dt = β(mt − mt − 1)+(1−β)dt − 1
Gdzie:
α, β, γ - parametry modelu o wartościach z przedziału <0,1>, znajdowane metodą prób i błędów
α, β, γ - bliskie 1 oznacza, że model będzie wrażliwy na wahania przypadkowe
α, β, γ - bliskie 0, tzn. że jest ryzyko że model będzie zbyt wolno reagować na zmiany przypadkowe
Wyznaczanie prognozy
- równanie prognozy na okres n+h
yTP = mn + hdn + St − l + h
Gdzie:
YTP – prognoza wyznaczana na okres t
L – nr okresu wcześniejszego
St-l+h – ocena składnika sezonowych z okresu wcześniejszych o l.
Wykorzystuje się tu zasadę, że przyrosty są względnie stałe.
Wykład 5- 25-03-2013
Prognozowanie na podstawie modelu wielorównaniowego
Zapis modelu wielorównaniowego (postać strukturalna)
AY + BX = η
Gdzie:
Y – wektor g x 1 zmiennych endogenicznych modelu
X - wektor k x 1 zmiennych objaśniających
A – macierz g x g parametrów stojących przy nieopóźnionych zmiennych endogenicznych
B – macierz g x k parametrów stojących przy zmiennych objaśniających
η – wektor składników losowych o wymiarach g x 1
Y1 = β10 + β11X1 + β12X2 + εt
Y2 = β20 + β23X3 + ε2
Ze względu na rodzaj powiązań pomiędzy nieopóźnionymi zmiennymi endogenicznymi wyróżniamy następujące typy modeli wielorównaniowych
Modele proste (KMNK)
Modele rekurencyjne (KMNK w odpowiedniej kolejności)
Modele o równaniach współzależnych (2MNK i inne metody)
Czym charakteryzuje się wymienione rodzaje modeli ?
Model o równaniach współzależnych
Np. zatt = a0 + a1prodt+a2TUPt+a3płacet + et
Płacet = b0 +b1wydajnośćt+b2bezrobociet+b3zatrudt+b4ceny+e2
Mamy powiązania pomiędzy zmiennymi egzogenicznymi
Model prosty jest takim modelem, w którym nie występuje żadne powiązanie między zmiennymi endogenicznymi i macierz A jest macierzą diagonalną
Możemy szacować parametry za pomocą KMNK dla każdego równania oddzielnie
Prognozowanie odbywa się dla każdego równania oddzielnie, analogicznie jak ma to miejsce dla modeli jednorównaniowych
W modelach rekurencyjnych występują jednokierunkowe powiązania między zmiennymi endogenicznymi, a macierz A jest macierzą trójkątną.
Np.
y1t = b0 + b11X1t + ε1t t=1,2… nl
y2t = a21Y1t + b20 + b22X2t + ε2t
Widać zależność y2t <- y1t
Parametry modeli rekurencyjnych szacujemy za pomocą KNMK dla każdego równania oddzielnie, przy czym ważna jest kolejność estymacji
Prognozowanie do tych modeli:
Y1TP = B0 + B1X1T
Y1TP = a21Y1TP + B20 + B22X2T
Model o równaniach współzależnych
Cecha charakterystyczna:
Dwukierunkowe powiązania między zmiennymi endogenicznymi
Y1 = α1Y2 + α13Y3 + β11X1 + β10 + ε1
Y2 = α21Y1 + β22X2 + β20 + ε2
Y3 = α31Y1 + α32Y2 + β30 + ε3
A – macierz dowolna
$$\begin{bmatrix}
1 & {- \alpha}_{12} & {- \alpha}_{13} \\
{- \alpha}_{21} & 1 & 0 \\
{- \alpha}_{31} & {- \alpha}_{32} & 1 \\
\end{bmatrix}\text{\ \ }\begin{bmatrix}
Y_{1} \\
Y_{2} \\
Y_{3} \\
\end{bmatrix}$$
Zmienne powinny być nieskorelowane ze sobą jeśli ma być stosowane KMNK
Nie są spełnione warunki KMNK, bo:
E(Y2ε1) ≠ 0 i E(Y3ε1)≠0 są skorelowane
E(Y1ε1) ≠ 0
E(Y1ε3) ≠ 0
E(Y2ε3) ≠ 0
Identyfikacja
Zasada: możliwość odtworzenia parametrów postaci strukturalnej modelu z postaci zredukowanej
Postać zredukowana
AX + BX = ε -> postać strukturalna opisuje rzeczywiste powiązanie między zmiennymi ekonomicznymi
|A| ≠ 0
A−1AY + A−1BX = A−1ε
Y + A−1BX = A−1ε
Y = A−1BX + A−1ε
π = −A−1B ; η = A−1ε
Y = πX + η –postać zredukwona
Postać zredukowana modelu ekonometrycznego jest modelem prostym, zatem może być oszacowana KMNK dla każdego równania oddzielnie
2MNK
Szacujemy parametry postaci zredukowanej za pomocą KMNK i wyliczamy $\hat{Y_{i}}$
Szacujemy parametry postaci strukturalnej z wykorzystaniem wartości $\hat{Y_{i}}$ z kroku 1 za pomocą KMNK
Prognozowanie an podstawie modelu ekonometrycznego modeli wielorównaniowych
Model o równaniach współzależnych – prognozuje się na podstawie postaci zredukowanej modelu (na 1 okres w przód) lub na podstawie postaci końcowej (na dłuższy okres). Czasami wyjątkowo prognozuje się na podstawie postaci strukturalnej, a pomija się współzależność (tylko na krótki okres).
Inny zapis modelu wielorównaniowego:
yt = Ayt + Byt − 1 + Cxi + ut
Przykład (*)
$$\left\{ \begin{matrix}
\text{KONS}_{t} = a_{1}\text{DNW}_{t} + b_{1}\text{KONS}_{t - 1} + C_{1} + u_{t} \\
\text{DNW}_{t} = \text{KONS}_{t} + \text{INW}_{t} \\
\end{matrix} \right.\ $$
Równanie pierwsze jest równaniem stochastycznym, drugie zaś tożsamością. Potraktowanie tego jako systemu daje:
$$y_{t} = \begin{bmatrix}
\text{KONS}_{t} \\
\text{DNW}_{t} \\
\end{bmatrix}\ \ A = \begin{bmatrix}
0 & a_{1} \\
1 & 0 \\
\end{bmatrix}\text{\ \ \ }y_{t - 1} = \begin{bmatrix}
\text{KONS}_{t - 1} \\
\text{DNW}_{t - 1} \\
\end{bmatrix}\ \ B = \begin{bmatrix}
b_{1} & 0 \\
0 & 0 \\
\end{bmatrix}$$
$$x_{t} = \begin{bmatrix}
\text{INW}_{t} \\
1 \\
\end{bmatrix}\ \ \ C = \begin{bmatrix}
0 & c_{1} \\
1 & 0 \\
\end{bmatrix}\text{\ \ }u_{t} = \begin{bmatrix}
u_{t} \\
0 \\
\end{bmatrix}$$
Postać zredukowaną otrzymamy po eliminacji jednoczesnych związków między zmiennymi endogenicznymi (Ayt)
yt − Ayt = Byt − 1 + Cxt + ut
(I−A)yt = Byt − 1 + Cxt+ut
Mnożąc przez macierz odwrotną (I-A)-1 otrzymamy:
yt = (I−A)−1Byt − 1 + (I−A)−1Cxt+(I−A)−1ut
Dokonując odpowiednich podstawień otrzymujemy:
yt = P2yt − 1 + P1xt + P0ut − postac zredukowana
Jako zmienne objaśniające nie występują nieopóźnione zmienne endogeniczne (współzależne)
Macierz P2 charakteryzuje bezwładność systemu, a jej elementy mówią o tym jaka część jednostkowej zmiany wartości zmiennej endogenicznej jest przez system przenoszona na zmienne endogeniczne w okresie następnym. Im mniejsze elementy macierzy P2 tym słabiej zmienna endogeniczne reagują na to co działo się w przeszłości. Skrajny przypadek: elementy macierzy = 0, co znaczy że zmiany systemu endogenicznego nie zalezą od swojej przeszłości tylko reagują na bieżące zmiany wartości zmiennej egzogenicznej
Macierz P1 – charakteryzuje siłę reakcji zmiennej endogenicznej na zmiany egzogeniczne. Jej elementy nazywa się mnożnikami bezpośrednimi systemu
Macierz P0 – macierz charakteryzuje siłę z jaką jednostkowe zakłócenia wybranego równania zmieniają (po przebiegnięciu przez cały system) wartość zmiennej endogenicznej. Jej elementy nazywam się mnożnikami względem zakłóceń. Informują one o stopniu współzależności danej zmiennej endogenicznej z pozostałymi zmiennymi endogenicznymi
Oszacowane równanie dla spożycia jest następujące:
Zmienna | Ocena parametru | t-Stud |
---|---|---|
Stała DNWt KONSt-1 |
0,0827 0,3414 0,5225 |
0,49 3,29 3,75 |
R2 = 0,98 DW = 2,48 Su – 0,06 |
Liczba obserwacji 10 (1970-79) |
$\ \ A = \begin{bmatrix} 0 & 0,3414 \\ 1 & 0 \\ \end{bmatrix}$ $B = \begin{bmatrix} 0,5225 & 0 \\ 0 & 0 \\ \end{bmatrix}$ $C = \begin{bmatrix} 0 & 0,0827 \\ 1 & 0 \\ \end{bmatrix}\ \ I - A = \begin{bmatrix} 1 & - 0,3414 \\ - 1 & 1 \\ \end{bmatrix}\text{\ \ }$
${(I - A)}^{- 1} = \begin{bmatrix} 1,5183 & 0,5183 \\ 1,5183 & 1,5183 \\ \end{bmatrix} = P_{0}\ $
$P_{1} = \begin{bmatrix} 0,5183 & 0,1256 \\ 1,5183 & 0,1256 \\ \end{bmatrix}$
$P_{2} = \begin{bmatrix} 0,7933 & 0 \\ 0,7933 & 0, \\ \end{bmatrix}$
Interpretacje:
- Macierz P1 : 0,5183 oznacza, że przyrost INWt (inwestycji) o jednostkę (1 mld zł) przyniesie wzrost konsumpcji (KONSt) o 0,5183 mld zł (518 mln zł)
- 1,5183 – wzrost INW o jednostkę (1 mld zł) spowoduje wzrost DNWW o 1,5183
- Macierz P2: jeżeli spożycie wzrośnie w danym okresie o jednostkę (1 mld zł), to z tytułu inercji reprezentantów prze zmienną opóźnioną (t-1), spożycie w okresie następnym będzie o 0,7933 wyższe od poziomu bazowego, czyli od poziomu, który miałby miejsce, gdyby nie nastąpił przyrost spożycia. W modelu nie występuje DNWt-1 , dlatego P2 = 0
- Macierz P0 : jeżeli zakłócenie równania spożycia wzrosłoby o 1 mld zł, to w wyniku działania sprzężeń zwrotnych spożycie wzrosłoby o 1,5183. Byłoby to o połowę więcej niż wynosi początkowe zakłócenie (1 mld zł); oznacza to, że model wzmacnia zakłócenia funkcji konsumpcji.
- w niektórych modelach impuls zakłócający ulega zmniejszaniu kompensacji
Postać zredukowana może służyć do prognozowania, ale tylko na okres następny (na 1 okres w przód). Na więcej okresów w przód prognozujemy na podstawie postaci końcowej.
Wykład 6- 08-04-2013
Postać końcowa modelu wielorównaniowego:
Eliminujemy opóźnione wartości zmiennych endogenicznych
yt = P2yt − 1 + P1xt + P0ut
Podstawiając za nie całe równanie opóźnione o jeden okres. Podobnie za yt-2 podstawiamy ponownie całe równanie opóźnione o jeden okres itd. Podstawia się za yt--w Aż dojdzie do y0 dla t=0
yt = P2yt − 1 + P1xt + P0ut
yt = P2(yt = P2yt − 1 + P1xt + P0ut)+P1xt + P0ut
……
$$y_{t} = {P_{2}}^{w}y_{0} + \sum_{w = 0}^{t = 1}{M_{w}X_{t - w}\ } + \sum_{w = 0}^{t = 1}{N_{w}u_{t - w}\ }$$
P2wy0 – reprezentuje zmieniające się w czasie wpływy wartości startowych zmiennych endogenicznych
$\sum_{w = 0}^{t = 1}{M_{w}X_{t - w}\ }\ $ - człon będący rozkładem opóźnionych w czasie wartości zmiennych z góry ustalonych (objaśniających) przemnożonych prze macierz parametrów Mw. Macierze te zawierają mnożniki dynamiczne zmiennych objaśniających względem zmiennych objaśnianych
$\sum_{w = 0}^{t = 1}{N_{w}u_{t - w}\ }$ - człon reprezentujący całkowite zakłócenie postaci końcowej
Mnożniki dynamiczne charakteryzują siłę, z jaką zmiany w wartościach zmiennych objaśniających xk dokonane „w” okresów wstecz wpływają na bieżące wartości zmiennych objaśnianych
Wracając do przykładu (*) odpowiednio macierze M mają postać:
$$M_{0} = P_{1} = \begin{bmatrix}
0,5183 & 0,1256 \\
1,5183 & 0,1256 \\
\end{bmatrix};\ M_{1} = \begin{bmatrix}
0,4113 & 0,0996 \\
0,4113 & 0,0996 \\
\end{bmatrix}$$
zeszyt
Mnożniki dynamiczne to elementy m11 każdej macierzy:
Np. M1=0,2054- w czwartym roku po zwiększeniu inwestycji o 1 mld zł spożycie będzie wyższe o 0,2054 mld zł od poziomu bazowego, czyli takiego, jaki osiągnęłoby spożycie gdyby nie nastąpił wzrost inwestycji
EGZ! interpretacja mnożników
Mnożnik można zaznaczyć na osi liczbowej lub wyliczyć całkowity przyrost konsumpcji z tytułu wzrostu inwestycji w roku zerowym. Skumulowany mnożnik, czyli suma poszczególnych mnożników dynamicznych informuje o całkowitym wzroście zmiennej y z tytułu przyrostu x w całym okresie.
Modele ekonometryczne ograniczonej zmiennej zależnej
Zmienna objaśniająca może więc przyjąć dwie wartości 0;1
Wartość oczekiwana tej zmiennej może być interpretowana jaki prawdopodobieństwo warunkowe danego zdarzenia, przy ustalonych wartościach zmiennej objaśniającej.
Do modelowania zmiennych jakościowych nie można stosować klasycznych modeli ekonometrycznych, ponieważ wartości tych zmiennych (wartości prawdopodobieństwa) mogą przyjmować wartości jedynie z przedziału (0;1)
Monotoniczne przekształcenia przedziału prawdopodobieństwa (0;1) na przedział (-∞, +∞) Najpopularniejszymi przekształceniami o tych własnościach są przekształcenia probitowe i logitowe.
Skorzystanie z przekształceń wymaga ustalenia liczby kategorii zmiennej objaśniającej (ustalenie szeregu rozdzielczego przedziałowego), aby można było mierzyć częstości p wystąpienia wariantu zmiennej objaśnianej w każdej … z tym kategorii (makrodane)
$$y = \left\{ \begin{matrix}
1 - dostanie\ kredytu \\
0 - niedostanie\ kredytu \\
\end{matrix} \right.\ $$
Transformacja probitowa:
Dany jest model klasyczny postaci:
Yt = α0 + α1X1t + εt
gdzie:
$$Y_{t} = \left\{ \begin{matrix}
1 \\
0 \\
\end{matrix} \right.\ $$
Niech p oznacza warunkowe prawdopodobieństwo pojawienia się danego wariantu zmiennej objaśnionej przy ustalonych wartościach zmiennych objaśniających.
Transformacja probitowa polega na zmianie danego prawdopodobieństwa p na wartość dystrybuanty F standaryzowanego rozkładu normalnego N(0,1) tm:
p = F(T)
$$p = F\left( \alpha_{0} + \alpha_{1}X_{1} \right) = \frac{1}{\sqrt{2\pi}}\int_{- \infty}^{\alpha_{0} + \alpha_{1}X_{1}}{exp(} - \frac{u^{2}}{2})dx$$
gdzie u ∼ N(0, 1)
Dokonując przekształceń postaci:
F−1[p] = α0 + α1X1
gdzie F−1 jest funkcją odwrotną do dystrybuanty standaryzowanego rozkładu normalnego, otrzymuje się funkcję probitową (tzw. probity), którą dla uniknięcia wartości ujemnych należy powiększyć o liczbę 5.
Stąd funkcja probitowa dana jest następującym wzorem:
P = F−1(p) + 5
w miejsce prawdopodobieństw empirycznych (częstości) podstawia się probity i otrzymuje postać modelu:
Pt = α0 + α1X1t + εt
Transformacja logitowa
Transformacja logitowa polega na zamianie prawdopodobieństwa z przedziału (0,1) na przedział ( − ∞, +∞), tj. na logity w następujący sposób:
$$L = ln\frac{p}{1 - p}$$
Następnie wartość logitów L podstawia się w miejsce zmiennej objaśnianej, stąd badany model przyjmuje postać:
Lt = α0 + α1X1t + εt
Aby w powyższym modelu otrzymać wartość prawdopodobieństwa p należy sprowadzić go do postaci logistycznej:
$$p = \frac{1}{1 + exp\lbrack - \left( \alpha_{0} + \alpha_{1}X_{1t} \right)\rbrack}$$
Modele transformowane można oszacować uogólnioną metodą najmniejszych kwadratów. Prawdopodobieństwo zastępuje się częstościami oszacowanymi na podstawie próby.
Wykład 7- 22-04-2013
Prognozowanie heurystyczne
heurystyka- znajdować, odkrywać
Oznacza, że będziemy odkrywali nowe fakty i relacje między nimi oraz dochodzenie do nowych prawd. Zawiera metody, które są ogólną postawą umysłu wobec problemu.
Prognozowanie heurystyczne łączy:
myślenie systematyczne
myślenie intuicyjne
Polega na przewidywaniu nowych zjawisk, faktów, niekoniecznie na podstawie przeszłości; opiera się na wyobraźni, fantazji, elastyczności, zdrowym rozsądku. Prognozę uzyskuje się wykorzystując opinię ekspertów opartą na intuicji i doświadczeniu.
Przykłady zjawisk prognozowanych metodami heurystycznymi:
określenie daty zajścia określonego zjawiska
określenie poziomu badanego zjawiska
określenie prawdopodobieństwa wystąpienia danego zdarzenia
tworzenie ocen faktów determinujących przeszłość
określenie tzw. punktów zwrotnych przebiegu pewnych zjawisk
Heurystyczne metody prognozowania:
burza mózgów
metoda delficka
metoda ankietowa
Burza mózgów
Wychodzi z założenia, ze rozdziela się fazę tworzenia od fazy oceniania pomysłów, które są produkowane w trakcie trwania sesji.
Celem takiego podziału jest zwielokrotnienie efektów poszukiwania twórczych rozwiązań
Założenia burzy mózgów:
nie krytykować, ale stymulować uzyskanie dużej liczby twórczych pomysłów
można wypowiadać wszystkie pomysły w trakcie sesji
można łączyć i doskonalić pomysły wcześniej wypowiedziane, bo pomysły nie mają autorstwa, są własnością całej grupy
pomysły można wypowiadać, nie czekając na swoją kolejkę, nie trzeba śledzić sposobu rozumowania innych osób
Sesja składa się z następujących faz:
przygotowania
tworzenia
oceniania
Przygotowanie: Organizatorzy badania precyzują badany problem i muszą dobrać zespół ekspertów (zespół twórczy i zespół oceniający- ocenia i opracowuje syntetyczny pomysł)
Tworzenie: Pomysły są wypowiadane, każdy ma numer identyfikacyjny
Ocenianie: Ustalone jest kryterium oceny ,analiza i ocena tych pomysłów wypowiedzianych w trakcie tworzenia sesji oraz przygotowanie ostatecznego sposobu rozwiązania problemu.
Ustalenie pomysłu syntetycznego polega na tym, aby z fragmentów najlepszych pomysłów stworzyć najlepszy pomysł- PROGNOZĘ
Do rozwiązania można łatwo dojść w krótkim czasie, dotyczy to problemów nieskomplikowanych, które można łatwo sprecyzować.
Wady:
1.Grupa może być zdominowana przez jedną lub kilka indywidualności
2. Grupa może czuć się pod presja uczestników.
3. Brak odpowiedzialności za wypowiedziane pomysły
4. Uczestnicy mogą być przeciążeni zbędnymi informacjami.
5. Niechęć uczestników do wcześniej wypowiedzianego poglądu.
Metoda delficka
Metoda prognozowania długookresowego
Cechy:
anonimowość opinii ekspertów ( wypowiadają się w postaci ankiety); mogą wypowiadać poglądy niepopularne
niezależność opinii ekspertów, uczestnicy są izolowani, nie znają się
wieloetapowość postępowania( ankiety wysyłane, zwracane, opracowywane; wyniki wysyłane do ekspertów; ankieta znowu wraca do opracowania)
Wady:
koszty metody (trzeba zatrudnić wiele osób do zbierania, opracowywania ankiet)
badanie długo trwa
brak możliwości bezpośredniej wymiany poglądów między ekspertami (waga i zaleta)
małe zaangażowanie ekspertów o ile nie znają dużo szczegółów
Tę metodę wykorzystuje się przy prognozowaniu długookresowym, więc weryfikacja prognoz następuje w długim okresie.
Opracowywanie ankiet
Literatura M. Szreder, Metody i techniki sondażowych badań opinii, PWE 2004
Statystyczne opracowywanie odpowiedzi ekspertów i respondentów; odpowiedzi na pytania mogą być pomiarami w skali nominalnej lub porządkowej, czyli na skali przeznaczonej do badania zjawisk jakościowych
w skali nominalnej obserwacji podlegają różne kategorie cechy jakościowej, co pozwala na klasyfikowanie obiektów ze względu na wyróżnione warianty. Jeżeli ekspert wskazuje dany wariant (nadajemy 1), w przeciwnym wypadku wskazujemy 0; Nie można porównywać wartości, możliwe do wykonania są dwie operacje
- zaliczenie do kategorii
- niezaliczenie do kategorii
pomiar na skali porządkowej- pozwala na rangowanie, czyli porządkowanie według kolejności wariantów zmiennej wyróżnionych w danym pytaniu (można porównywać warianty)
pomiar na skali porządkowej (interwałowej) (możliwe dodanie i odejmowanie) i ilorazowej wtedy, gdy mówimy o zjawiskach które dają się wyrazić w postaci liczb- dochodzą wtedy operacje mnożenia i dzielenia
Ekspert/kategoria | ||||
---|---|---|---|---|
1 | 2 | … | K | |
1 | X11 | X12 | … | Xkk |
2 | X21 | X22 | … | X2k |
… | … | … | … | … |
N | Xn1 | Xn2 | … | xnk |
i-numer eksperta
j- numer kategorii
xij- gdy pomiary na skali nominalnej to oznacza numer i-tego wariantu w skali nominalnej w odpowiedzi udzielonej przez j-tego eksperta, gdy pomiar na skali porządkowej to oznacza rangę nadaną przez i-tego eksperta j-tej kategorii
Przeprowadza się w analizie odpowiedzi udzielonych przez ekspertów w celu:
wyodrębnienia grup ekspertów o zbliżonych poglądach
wykrycia przyczyn zróżnicowania opinii ekspertów
wykrycia charakterystyk osobowych
oceny zgodności sądów ekspertów
ustalenie wspólnego sądu grupy ekspertów
Ustalenie stopnia zgodności opinii ekspertów:
Pomiar na skali nominalnej- do oceny stosuje się współczynnik dyspersji względnej klasyfikacji hr postaci:
$$h_{r} = \frac{k}{k - 1}(1 - \sum_{j = 1}^{k}{fr_{j}^{2}})$$
k − liczba wariantow
r- i-te pytania
frj- częstotliwość występowania j-tego wariantu (kategorii) w r-tym pytaniu
Współczynnik h jest unormowany w skali 0-1, Im mniejsza wartość, tym większa zgodność opinii ekspertów
Gdy pomiar odbywa się na skali porządkowej to używamy współczynnika konkordancji Kendala i Smitha.
$$W = \frac{12*S}{n^{2}(k^{3} - k)}$$
k − liczba wariantów
n− liczba ekspertów
$$S = \sum_{j = 1}^{k}(\sum_{i = 1}^{n}{x_{\text{ij}} - X)^{2}}$$
$\overset{\overline{}}{x}$- średnia wartości sumy rang wszystkich wariantów
$$\overset{\overline{}}{x} = \frac{1}{k}\sum_{i = 1}^{n}{}\sum_{j = 1}^{k}x_{\text{ij}}$$
Wartość tego współczynnika jest unormowana (0,1). Im wyższy tym większa zgodność opinii ekspertów. Istotność współczynnik konkordancji bada się testem chi-kwadrat, postaci:
$$\chi^{2} = \frac{12*S}{nk(k + 1)}$$
Wartość krytyczną odczytujemy z tablic rozkładu χ2 dla poziomu istotności α oraz k-1 stopni swobody.
Skala przedziałowa, ilorazowa- stosujemy rozstęp kwartylowy
Δ = Q3 − Q1
Im mniejszy rozstęp, tym większa zgodność. Dla oceny zgodności można ustalić wartość graniczną.
-----
Badanie własności reszt modelu
Kolejnym etapem weryfikacji oszacowanego modelu jest badanie wybranych własności rozkładu reszt, do których zalicza się: losowy charakter reszt, normalność rozkładu składnika losowego, autoregresję I rzędu składnika losowego oraz jednorodność wariancji składnika losowego
Normalność rozkładu składnika losowego
(???)
Rozkład statystyki Bery-Jarque’a (JB) jset zbieżny do rozkładu Chi – kwadrat o 2 stopniach swobody: χ2α(2)
$$JB = N\ \left( \frac{1}{6}\ B_{1} + \ \frac{1}{24}\ \left( \beta_{2} - 3 \right)^{2} \right),\ gdzie:$$
$$\sqrt{\beta_{1}} = \ \frac{1}{N}\ \sum_{i = 1}^{N}{e_{i}^{3}\ /S^{3}(e_{i})}$$
$$\beta_{2} = \ \frac{1}{N}\ \sum_{i = 1}^{N}{e_{i}^{4}\ /S^{4}(e_{i})}$$
Jeżeli JB < χ2α(2) -> nie ma podstaw do odrzucenia H0 – rozkład składnika losowego jest rozkładem normalnym
Jeżeli JB ≥ χ2α(2) -> odrzuca się Ho, nie jest rozkładem normalnym
Testowanie stabilności modelu – dotyczy przypadku, kiedy moment zmiany strukturalnej jest nieznany.
TEST CUSUM – oparty na skumulowanej sumie reszt otrzymanych rekurencyjnie. W pakietach komputerowych jest obliczany łącznie z 5% liniami krytycznymi. Test pokazuje niestabilność parametrów, gdy skumulowana suma reszt w jakimś momencie przekracza 5% linie krytyczne.
Weryfikację modelu ??? jest za pomocą statystyki wt , której wartość wyznacza się według formuły:
$$w_{t} = \ \sum_{t = k + 1}^{T}\frac{w_{t}}{S}\ ,\ gdzie:$$
S – odchylenie standardowe z wt, a wt jest stosunkiem reszty et do obciążenia prognozy powstałym wg formuły:
$$w_{t} = \ \frac{e_{t}}{\sqrt{1 + \ X_{t}^{T}{(X_{t - 1}^{T}X_{t})}^{- 1}*\ X_{t}}}$$
Przy czym t=k+1, … , T
Wektor parametrów modelu α jest stabilny jeżeli E(wt) = 0, w przeciwnym wypadku jest niestabilny. Linie krytyczne wyznaczają wzory:
$$\left\lbrack K \pm \ - 0,948\ \left( T - k\frac{1}{2}\ \right) \right\rbrack\text{\ \ i\ \ }\left\lbrack T \pm 3*0,948\left( T - k\frac{1}{2} \right) \right\rbrack$$
Test Chowa
[rysunek trudny do przemalowania]
yt = b0 + b1X1t + b2X2t + … + bkXkt + ε1t t=1,2… nl
yt = c0 + c1X1t + c2X2t + … + ckXkt + ε2t t=nl+1… T
H0 : βk = γkα - nie ma zmiany struktury
H1 : βk ≠ γkα - jest zmiana
SSR1 – suma kwadratów reszt pierwszego modelu
SSR2 – suma kwadratów reszt drugiego modelu
SRR – z modelu
SSR3 = SSR1 + SSR2
SSR4 = SSR – SSR3
$$\begin{matrix}
bez\ podzialu\ na\ ??? \\
dla\ calosci \\
\end{matrix}\ \left\{ \begin{matrix}
y_{t} = a_{0} + \ a_{1}x_{1} + a_{2}x_{2} + \ldots + a_{k}x_{\text{kt}} + \varepsilon_{t} \\
t = 1,\ \ldots\ldots T \\
\end{matrix} \right.\ \ $$
Statystyka Chowa
$$F = \frac{\frac{\text{SSR}_{4}}{k + 1}}{\frac{\text{SSR}_{3}}{T - 2*\left( k + 1 \right)}}$$
Fα ; (k+1) ; T-2(k+1)
k+1 – liczba szacowanych parametrów
Wykład 15.04.2013
Prognozowanie analogowe
Prognozowanie analogowe polega na przewidywaniu przyszłości określonej zmiennej przez wykorzystanie informacji o innych zmiennych, których zmiany w czasie są podobne, ale nie równoczesne.
Podobieństwo zmiennych jest rozumiane jako podobieństwo kształtowania się w czasie wartości zmiennych opisujących dane zjawisko w różnych obiektach lub różne zjawiska w jednym obiekcie.
Argumenty za prognozowaniem analogowym:
Niestabilność prawidłowości występujących w zjawiskach społeczno-ekonomicznych
Brak wystarczającego wyjaśnienia danego zjawiska przez teorie
Zmienność zbiorów przyczyn i sposobów ich oddziaływania
Metody prognozowania analogowego.
Metoda analogii biologicznej
Polega na przenoszeniu budowy i funkcjonowania organizmów żywych na inne obiekty np. konstrukcja maszyn na wzór organizmów żywych, wytwarzanie lekarstw mających odzwierciedlić działanie pewnych roślin, sztuczne sieci neuronowe
Metoda analogii przestrzennej
Polega na przewidywaniu wystąpienia określonego zdarzenia na podstawie informacji o pojawieniu się takiego zdarzenia w innych obiektach, np. pojawienie się kart płatniczych w pewnym obiekcie pozwala przypuszczać, ze pojawią się one też w innych obiektach; występowanie zachorowań na pewnym obszarze pozwala przypuszczać, że wystąpią też gdzieś indziej (AIDS, SARS, grypa), wprowadzenie pewnej technologii w jednej firmie pozwala przypuszczać, że pojawi się też w innych firmach.
Metoda analogii historycznej
Polega na przenoszeniu prawidłowości zmian w czasie jednych zjawisk na innej zjawiska zachodzące w tym samym obiekcie, np. rozwój radiofonii może być pomocny przy rozwoju telewizji; cykl życia pralek wirnikowych da się przenieść na cykl życia automatów
Szczególne zastosowanie w diagnozowaniu gospodarki, badaniu cykli koniunkturalnych,
Metoda analogii przestrzenno-czasowych
Polegają na przenoszeniu z jednych obiektów na inne prawidłowości zmian zjawisk w czasie; używa się zmiennych jednoimiennych, np. liczba komputerów sprzedawanych w krajach rozwiniętych może być podstawą do oceny dynamiki sprzedaży w krajach o niższym stopniu rozwoju; popyt na samochody osobowe w danym kraju upodabnia się do popytu w krajach wysoko rozwiniętych, następują zachowania imitacyjne jeżeli chodzi o dobra luksusowe; prognozowanie zjawisk demograficznych, prognozowanie w przedsiębiorstwie, np. struktura kosztów
Prognozowanie za pomocą analogii przestrzenno czasowych
Ustalenie podobieństwa zmiennych badanych obiektów
Dwa kryteria ilościowe podobieństw zmiennych
1.podobność poziomu (wartości)
2. podobności kształtu (zmian w czasie)
Ad 1. Dwie zmienne są podobne, jeżeli w pewnym okresie lub momencie osiągnęły jednakową wartość; bierze się pod uwagę sytuację, w której zmienna prognozowana osiąga w czasie późniejszym t’ ten sam poziom, co poziom w zmiennej porównywana w okresie wcześniejszym t.
Dla zmiennych jednoimiennych
yt′(s) − yt(k) ≈ 0 dla t′ ≥ t
yt(k)- poziom zmiennej y osiągnięty w obiekcie k- tym w okresie t
yt′(s)-poziom zmiennej y osiągnięty w obiekcie s-tym w okresie t’
Ad 2 . Dwie zmienne są podobne, jeżeli charakteryzują się podobnymi zmianami w czasie (wahania sezonowe, cykliczne, tendencja w czasie). Dla zmiennych jedno- jak i wieloimiennych.
Warunek! do stworzenia prognozy:
zmiany zmiennej prognozowanej muszą być późniejsze niż zmiany zmiennej porównywanej; jest to jednocześnie warunek aby stworzyć prognozę.
Sporządza się prognozy o horyzoncie średnio- i długookresowym, przy ocenie dopuszczalności prognoz stosuje się błąd ex post.
Etapy prognozowania przestrzenno – czasowego.
Ustalanie wstępnej liczby obiektów
Pomiar podobieństwa zmiennych
Wyznaczanie prognoz cząstkowych
Wyznaczanie prognozy globalnej
Ad1) Chodzi o dobór obiektów stanowiących wzór obiektu prognozowanego. Im większa liczba obiektów, tym większe wiarygodność prognozy. Dane dla zjawiska prognozowanego mają postać szeregów czasowych.
Ad2) Jeżeli podobieństwo określa się wg poziomu i kształtu to wybiera się ostatni dostatecznie długi fragment szeregu czasowego obiektu prognozowanego p(o) i porównuje z innymi obiektami
We fragmentach szeregach czasowych pozostałych obiektów, wcześniejszych niż data początkowa przedziału p(o), poszukuje się wartości zmiennej zbliżonej do ostatniej wartości zmiennej z przedziału p(o).
Daty początkowe ustala się w taki sposób, aby przedziały p(o) (dotyczące obiektu prognozowanego)i p(k) były jednakowej długości
Dla każdego z tych przedziałów wylicza się miarę podobieństwa d(o,k) – np. współczynnik korelacji liniowej (Można przyjmować również inne miary prawdopodobieństwa).
Jeśli wybiera się kryterium kształtu to przedziały podobieństwa p(k) są poszukiwane na fragmentach szeregów czasowych wcześniejszych niż data początkowa przedziału p(o)
Wartość krytyczna miary podobieństwa
d(o, k) ≥ d* d* − przyjmujemy arbitralnie , najczęściej 0,9
Gdy nierówność jest spełniona to obiekty można wykorzystać do prognozowania. Gdy lewa strona nierówności jest dużo większa od prawej, to warto powiększać przedziały podobieństwa do takiego stopnia aż miara d(0,k) zrówna się z wartością krytyczną, co pozwala stwierdzić czas występowania długotrwałego podobieństwa obiektów. Wzmacnia to prognozowanie i pozwala przedłużyć horyzont prognozowania
Ad3) Wyznaczanie prognoz cząstkowych
Polega na przedłużeniu szeregu obiektu prognozowanego o skorygowaną stałą przesunięcia fragment szeregu k-tego obiekty następująco po przedziale podobieństwa tego obiektu
Przesunięcie | -2 | -1 | 0 | 1 | 2 |
---|---|---|---|---|---|
yt(o) |
… y−2(o) | y−1(o) |
y0(o) |
||
yt(k) |
… y−2(k) | y1(k) |
y2(k) |
przedział podobieństwa prognoza
yt(o)- wartość zmiennej y w okresie prawdopodobieństwa
yt(k) – wartość zmiennej y w okresie t w k-tym, podobnym obiekcie, wartość 0- ostatnia wartość szeregu p(o) i p(k)
y0(o) – wartość ostatnia, dokonujemy prognozy cząstkowej
Prognoza cząstkowa (prognoza obiektu 0 na podstawie obiektu k)
yt*(o,k) = yt(k)+(o,k)
(o,k) - stała przesunięcia
(o,k) = y0(o) − y0(k) – różnica ostatniej wartości w przedziale podobieństwa
t = 1,2,…, n(k)
n(k) – liczba obserwacji występujących w przedziale podobieństwa k-tego obiektu, nie przekraczająca długości tego obiektu.
Ad4) Prognozę globalną wyznaczamy tak, że stanowi ona przedłużenie szeregu czasowego obiektu prognozowanego a przeciętne wartości prognoz cząstkowych.
$y_{t}^{*\left( o \right)} = \sum_{k = 1}^{k}{\omega^{(o,k)}y_{t}^{*\left( o,k \right)}}$ - końcowa wartość prognozy
$\omega^{(o,k)} = \frac{d^{\left( o,k \right)}}{\sum_{k = 1}^{k}d^{\left( o,k \right)}}$
Waga ta jest miar a podobieństwa k-tego obiektu do sumy wszystkich miar.
Jest to końcowa wartość prognozy.
Prognozowanie za pomocą analogii historycznych
Metoda ta wykorzystuje dwa rodzaje zmiennych:
zmienną wiodącą (jej zmiany występują wcześniej niż w przypadku zmiennej naśladującej)
zmienną naśladującą (jest prognozowana przy zastosowaniu zmiennej wiodącej)
Zwykle ustala się kilka zmiennych wiodących(m), np.
dochody konsumentów przy prognozowaniu sprzedaży artykułów, których zakup wymaga zgromadzenia pieniędzy
barometr koniunktury gospodarki lub danej branży, w której działa dane przedsiębiorstwo; jest to zmienna wiodąca dla prognozowania sprzedaży produkcji przedsiębiorstwa;
liczba urodzeń, liczba dzieci w wieku szkolnym, np. gdy chce się prognozowań sprzedaż art. szkolnych
produkcja części zamiennych do różnych urządzeń, np. pralek- zmienną wiodącą jest sprzedaż pralek w okresie poprzednim
Metoda zmiennych wiodących ma szczególne zastosowanie, gdy badane zjawisko wykazuje wahania cykliczne, ponieważ jeżeli dla zmiennej wiodącej obserwuje się zmiany wartości, to można oczekiwać po pewnym czasie takiej samej zmiany dla zmiennej naśladującej
wykres
Etapy postępowania:
Wybór zmiennej wiodącej i naśladującej
Pomiar podobieństwa zmiennych
Określenie opóźnienia zmiennej naśladującej
Budowa modelu wiążącego zmienne naśladujące ze zmiennymi wiodącymi, który stanowi podstawę prognozowania
Ad 2) wybiera się fragment (odpowiednio długi) szeregu czasowego zmiennej naśladującej, oblicza się miarę podobieństwa tego fragmentu z fragmentami szeregów o takiej samej długości zmiennych wiodących, przesuwając w każdym kroku szeregi zmiennej wiodącej o jeden okres w tył
dp –miar podobieństwa, np. współczynnika korelacji wzajemnej postaci:
$$r_{p} = \frac{\sum_{}^{}{(y_{t}} - \overset{\overline{}}{y})(x_{t - p} - {\overset{\overline{}}{x}}_{t - p})}{\sqrt{\sum_{}^{}{(y_{t} - {\overset{\overline{}}{y}}_{t})}^{2}*\ \sum_{}^{}{(x_{t - p} - {\overset{\overline{}}{x}}_{t - p})}^{2}}}\ \ \ \ \ \ \ p = 1,2\ldots,s$$
Ad 3) Wyznacza się maksymalną wartość miary podobieństwa – jest ona większa lub równa od pewnej wartości krytycznej
Max d-p ≥ d* d* = 0,9
p = t max y – t max x
t maxy– numer okresu, w którym zmienna naśladująca y przyjęła wartość maksymalną
tmaxx- numer okresu, w którym zmienna wiodąca x przyjęła wartość maksymalną
Stosuje się tez kryterium
p = t min y- t min x
Jeżeli cykli jest więcej, to może okazać się, że odstęp nie będzie taki sam w każdym cyklu, wtedy przyjmujemy średnią arytmetyczną z tych opóźnień.
Ad 4)
yt- zmienna naśladująca
Model:
yt = f(xt − p) + ηt
Model liniowy
yt = α0 + α1xt + ηt
Model jest szacowany, poddawany weryfikacji i służy za podstawę prognozowania zmiennej naśladującej. Jego zaletą jest to, że można wyznaczyć p prognoz dla zmiennej naśladującej wykorzystując znane wartości zmiennej wiodącej.
Jeśli zmiennych wiodących jest więcej, to model ma postać:
yt = f(x1t − p,x2t − p,…,xmt − p) + ηt
Dla każdej zmiennej wiodącej należy określić opóźnienie p
Zamiast m zmiennych wiodących można wprowadzić tzw. zmienną syntetyczną.
$$x_{t}^{*} = \sum_{i = 1}^{m}x_{\text{it}}^{*}\text{\ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ }x_{\text{it}}^{*} = \frac{x_{\text{it}} - {\overset{\overline{}}{x}}_{i}}{\overset{\overline{}}{x_{i}}} + 100$$
Xit – i-ta zmienna wiodąca
Wyznaczenie p dla zmiennej syntetycznej.
Można traktować zmienną syntetyczną jako jedną zmienną wiodącą i postępować jak poprzednio stosując miary podobieństwa
Zmienna zbieżna – w tym samym okresie występująca ta sama wartość
Produkcja przemysłowa
Zatrudnienie
Obroty w handlu
dochody ludności
Zmienne naśladujące:
Czas trwania bezrobocia
Inwestycje
Koszty działalności gospodarczej
stopa % banków dla pożyczek krótkoterminowych
Prognozowanie ostrzegawcze
Jest to przewidywanie spadku koniunktury gospodarczej, ma sygnalizować niebezpieczeństwo załamania kryzysowego.
Gdy obserwujemy spadek wskaźników, które powinny rosnąć (stymulanty) lub wzrost tych które powinny spadać (destymulanty), to mamy niepomyślną sytuację gospodarczą (NSG) – następuje zachwianie równowagi dynamicznej całego systemu gospodarczego, zachwianie równowagi pożądanego przebiegu rozwoju społ- gosp.
----
Prognozowanie ostrzegawcze to prognoza jakościowa, dokonuje się ją na podstawie funkcji wygładzającej
Jej zadaniem jest stwierdzenie czy tempo wzrostu zjawiska maleje czy nie
xt - badane zjawisko
f(t) – funkcja wygładzająca
xt = f(t) + vt
0 < | f(t) – f(t-1) | < Δ1
$\frac{1}{n}\ \sum_{t = 1}^{n}\left( f\left( t \right) - f\left( t - 1 \right) \right)^{2} < \Delta_{2}$
var(vt) = δ2
$$\frac{\delta^{2}}{\Delta_{2}} < \ \varepsilon$$
Prognozowanie polega na przewidywaniu spadku funkcji wygładzającej (czyli fazy zmieniania się wartości tej funkcji.
Prognoza ostrzegawcza będzie prawdziwa gdy:
XTo – XTo-1 <0 (spadek wartości szeregu) lub
f(T0) – f(To-1) < 0 (spadek wartości funkcji wygładzającej w okresie prognozowanym)
Metody ustalania sygnału ostrzegawczego
metoda różnic
metoda linii kontrolnych
badanie przebiegu cyklu koniunkturalnego i wykorzystanie syntetycznych wskaźników zmiennych wiodących i zbieżnych