Literatura:
„Prognozowanie gospodarcze” M Cieślak, PWN III wydanie
„Prognozowanie gospodarcze” Dittman AE Wrocław
„Predykcja ekonometryczna” A. Zewiasz
Wykład 1 - 13.10.2001
Wyznaczanie prognoz
Prognozowanie ilościowe czyli predykcja pozwala wyznaczać prognozy za pomocą przesłanek z modeli ekonometrycznych. Nie dotyczy ono tylko przyszłości ale może także dotyczyć przeszłości lub teraźniejszości. Prognozowanie ma ścisłe powiązania z demografią.
Prognozowanie wykorzystywane jest między innymi w Głównym Urzędzie Statystycznym oraz w dużych przedsiębiorstwach czy centralach gdzie za pomocą prognozowania ocenia się perspektywy planowanej produkcji.
Podstawowe pojęcia:
model ekonometryczny
(wg Z. Czerwińskiego) - może być rozumiany ogólnie, intuicyjnie jako obraz, odbicie, odwzorowanie określonego obiektu w określonym języku.
Model ekonometryczny - również będzie układem równań odwzorowującym wyróżnione zależności między zjawiskami ekonomiczno - społecznymi.
Część związków można mierzyć a niektóre nie.
Związki mierzalne nazywane są korelacyjnymi.
Y = f (x1, x2 ......xkၖ)
y - zjawisko badane
x1,x2-zjawiska, czynniki
ၖ- składnik losowy (psi,) - jest to łączny efekt oddziaływania na zmienną y, oddziałuje na te i inne czynniki, które nie zostały uwzględnione bezpośrednio w zbiorze x.
Jest to zmienna losowa o określonym rozkładzie.
E(ၖ) = 0; D2(ၖ) = ၤ2 = const. (ၤ2 - wariancja)
liniowy model ekonometryczny
Yt = ၡ0 + ၡ1xt + ၸt t = 1,2,………….,n
gdzie:
ၸt - składnik losowy
ၡ0 - współczynnik kierunkowy funkcji regresji
Aby przedłużyć prognozę od 1,2,.............,n należy wykonać estymację parametrów ၡ0 i ၡ1.
Do estymacji parametrów wykorzystuje się metodę najmniejszych kwadratów.
MNK polega na znajdowaniu takich wartości ocen parametrów strukturalnych modelu, by suma kwadratów odchyleń zaobserwowanych (empirycznych) wartości i zmiennej y, od jej wartości teoretycznych wyznaczonych przez model była najmniejsza w przypadku jednej zmiennej objaśniającej.
MNK polega na znajdowaniu takiej prostej , która jest najlepiej dopasowana, do wszystkich punktów empirycznych, czyli minimalizowana jest sumą kwadratów reszt (ut).
Klasyczne założenia MNK
Zmienne objaśniające x są nielosowe i niewspółliniowe k<n;
Istnieje n populacji składników losowych, o nadziejach matematycznych E(ၖt)=0 i stałych wariancjach o skończonych wartościach ၤ2 =D2(ၖt) = const, t= 1, 2, 3, ...... n.
Realizacje zmiennych tworzą proces czysto losowy tzn., że następuje po sobie realizacja składnika losowego , są nieskorelowane, czyli ρ(ၖt; ၖts)= 0 dla t ≠ s
składniki losowe są nieskorelowane ze zmiennymi objaśniajacymi.
Jeżeli ww. założenia są spełnione to estymator ma dobre własności tzn.
jest nieobciążony;
zgodny;
najbardziej efektywny;
f (0, 1) =
(Yt - 0 - 1xt)2 =
et2
et2 = Yt - (0 - 1xt)
^ ^
f (0, 1) = minimum
gdy wartość zmiennej objaśniającej zależy od więcej niż jednej zmiennej objaśnianej
Yt = ၡ0 + ၡ1xt1 + ၡ2xt2 + …………. + ၡkxtk + ၸt
t = 1,2,……………,n
parametr „ၡ1” wskazuje o ile przeciętnie zmieni się wartość „y” jeśli „x1” zmieni się o jedną jednostkę w pewnym okresie czasu.
szeregi czasowe - są realizacją procesu stochastycznego który możemy zapisać ciągiem zmiennych losowych.
ၻytၽ= ၻy1, y2, ................., ynၽ szeregi czasowe
gdy „t” jest okresem miesiąca to:
„y1” to np. styczeń
„y2” to luty itd.
gdy zaobserwujemy już jakiś proces wówczas oznaczamy dane małymi literami.
momenty czasu
ၻYtၽ= ၻY1, Y2, ................., Ynၽ
zmienna “Y” jest pewną funkcją która może
przybierać różne wartości „y”
0,3 dla y = 0
PၻY=yၽ = 0,5 dla y = 1
0,2 dla y = 2
PၻY=yၽ = 0 < p < 1
realizacja procesu to ciąg: ၻ0,0,1,1,0,0,0,1ၽ
^
oceniając p wyznaczamy prognozę
„p” zmienia się jednak z czasem
P ၻYt=yၽ = 0 < p < 1
Rachunek macierzowy
Y =
x =
n x 1 n x (k+1)
Składnik losowy - ၸ (ksi)
ၸ =
ၡ =
n x 1 (k + 1) x 1
f (α0, α1, ................... αk) =
lub w formie macierzowej:
Y = Xα + ξ Y* = Xα ; Y* - wartość teoretyczna funkcji regresji
f(α) = (Y - Yt)T(Y - Y*) = (Y - Xd)T(Y - Xα)
gdy, chcemy obliczyć średni błąd szacunku stawiamy hipotezę, że α0 = 0 i próbujemy ją zweryfikować.
Główne klasyczne założenia regresji liniowej.
zakładamy, że dla każdego „t” nadzieja matematyczna równa się 0.
2. zakładamy, że dla każdego „t” wariancja składnika losowego jest równa δ2 - jest stała
składnik losowy ma rozkład homostechastyczny
3. gdy w czasie są nieskorelowane macierze składników losowych
4. zakładamy, że wartości zmiennych objaśniających są nie losowe to znaczy są
ustalone z góry.
R(X) = k+1 ⇒ det (XTX) > 0 R(X) - rząd macierzy
5. czasami wprowadzamy założenie, że wektor składników losowych ma
n-wymiarowy rozkład normalny z nadzieją matematyczną równą 0.
ξ ∼ N(0, In δ2) ⇒ Y ∼ N(Xαi, In δ2)
wektor wartości funkcji regresji (wartości teoretyczne funkcji regresji)
wariancja resztowa
współczynnik zbieżności
Macierz wariancji i dewariancji estymatorów.
D2(α) = (XTX)-1δ2 Se2 ⇒ δ2
;
Hipotezy:
a) H0 αj = 0
b) H1 αj ≠ 0
j-oty parametr funkcji jest równy 0, nie ma wpływu ma zmienną objaśniającą.
Sprawdzian testu Studenta
0
a → ta → K = (-∞; -ta > ∪ < ta; ∞)
za „a” przyjmujemy małą liczbę np. 0,01; 0,05
Poziom istotności:
prognoza czy wartość symulowana
XT - wartości hipotetyczne
Wykład 2 - 28.10.2001
Model potęgowy
t = 1,2, ........., n
najczęściej rozważany natomiast jest model:
gdzie:
Zt - poziom zatrudnienia,
Wt - poziom środków trwałych,
α1- elastyczność produkcji względem zatrudnienia.
model ten jest modelem nieliniowym
- estymacja modelu:
- logarytm modelu:
Ut, Rt, Vt - są nowymi zmiennymi
po obliczeniu otrzymujemy:
natomiast
]
Szczególne modele regresji (trendy).
a) model addytywny jest jednym z modeli szeregu czasowego
Yt,h = f(t) + a(h) + ξt
trend wahania wahania
sezonowe losowe
trend f(t) jest funkcją kolejnych numerów czasów (generalnie obrazuje przyrost).
b) model multiplikatywny.
rozwój zjawiska obrazuje trend ale wahania sezonowe są coraz większe (brak stabilności)
Najprostszą formą trendu jest funkcja liniowa:
f1(t) = β0 + tβ1 + ξt
Wyliczenie parametrów na podstawie wzorów analitycznych:
wzór 1:
wzór 2:
wzór 3:
wzór na β0:
Zadanie:
W miesiącach od stycznia do kwietnia zaobserwowano następujące wydatki: 4, 6, 10, 8.
Interpretacja wyniku: Średnio z miesiąca na miesiąc wartość wydatków rosła o 1,6 jednostki.
t |
|
Yt |
Yt- |
|
1 |
4,6 |
4 |
-0,6 |
0,36 |
2 |
6,2 |
6 |
-0,2 |
0,04 |
3 |
7,8 |
10 |
2,2 |
4,84 |
4 |
9,4 |
8 |
-1,4 |
1,96 |
Σ |
|
|
0,0 |
7,2 |
suma reszt
jest to pośredni test sprawdzający poprawność wykonania zadania, gdy otrzymamy 0 zadanie uważa się za wykonane poprawnie.
obliczamy odchylenia wydatków od trendu:
Interpretacja wyniku: Wydatki rzeczywiste odchylają się od trendu o 1,9 jednostki.
oceniamy błąd obliczeń:
Interpretacja wyniku: Średni błąd szacunku czyli odchylenie standardowe estymatora pierwszego β1 jest równe 0,85 jednostki (wskazuje to rząd błędu jakim szacowany jest parametr)
oceniamy względny błąd szacunku (błąd średni)
Interpretacja wyniku: Względny błąd szacunku stanowi 53,1% oceny całego szacunku.
Wyznaczamy prognozę na podstawie trendu:
Interpretacja wyniku: Prognoza równa jest 11 jednostek.
Obliczamy możliwy błąd prognozy:
czyli:
- średni błąd prognozowania czyli predykcji.
Interpretacja wyniku: Rzeczywiste prognozowania które występują w przyszłości mogą się odchylać o 5,2 jednostki.
Obliczamy odchylenie średniego błędu predykcji:
Rodzaje trendów liniowych.
a)
przyrost trendu liniowego
b) aby opisać krzywą z wykresu należy:
funkcja trendu zapisana jest w postaci funkcji regresji, do obliczenia jej używamy wzorów macierzowych.
c) krzywą tą możemy również modelować za pomocą funkcji wykładniczej:
i wyznaczamy logarytm:
;
d) inna postać trendu to:
model szeregu czasowego wygląda wtedy następująco:
i wyznaczamy logarytm:
e) funkcja logarytmiczna:
f) funkcja logistyczna:
f(t) punkt nasycenia rynku
t
Zadanie:
Rozważamy wahania sezonowe o cyklu rocznym, obserwowane będą wartości cechy w poszczególnych miesiącach:
gdzie: t = 1,2 - bieżący numer miesiąca
h = 1,2,3,.......,12- miesiąc w cyklu wahań
k = 1,2,.... - numer roku .
np. obserwacja z piątego roku z marca
to: k=5; h=3
t = (5-1) x 12 + 3 = 48+3 = 51
z obliczenia wynika, że jest to 51 miesiąc z kolei w cyklu który obserwujemy.
cykl dwuokresowy:
określa amplitudę
wahania sezonowego
gdzie:
„t” - przyjmujemy jako bieżące półrocze
„h” - numer półrocza (0 - pierwsze półrocze, 1 - drugie półrocze)
„k” - numer roku
macierz danych przyjmuje następującą postać:
cykl kwartalny - wprowadzamy dwie zmienne zero - jedynkowe.
suma dwóch zmiennych
zero jedynkowych
aby obliczyć cykl miesięczny musimy wprowadzić cztery zmienne zero jedynkowe
numer bieżący miesiąca:
t = (k-1)c+h
wahania sezonowe wprowadzają składnik losowy ηt (eta).
m - liczba wszystkich lat
np.
gdzie: t - numer bieżący kwartału
prognozy kwartalne
wyznacz prognozę na trzeci kwartał piątego roku:
k=5, H=3
T = (k-1)c+H
T = (5-1) 4+3 = 19
badany kwartał jest 19 z kolei badanym kwartałem
obliczamy prognozę:
Wykład 3 - 10.11.2001
Wyznaczanie tendencji rozwojowych zwanych trendami.
Metody adaptacyjne:
a) metoda średnich ruchomych - metoda wygładzania średnich czasowych.
t |
Yt |
|
|
|
1 |
2 |
- |
- |
- |
2 |
4 |
3,3 |
- |
3,5 |
3 |
4 |
5,3 |
4,0 |
5,0 |
4 |
8 |
4,7 |
4,8 |
5,5 |
5 |
2 |
5,3 |
4,4 |
4,5 |
6 |
6 |
3,3 |
4,4 |
4,0 |
7 |
2 |
4 |
- |
3,5 |
8 |
4 |
- |
- |
- |
obliczeń w tabeli dla średniej ruchomej scentrowanej trzyokresowej dokonano z wzoru:
a dla średniej ruchomej scentrowanej pięciookresowej z wzoru:
wykres szeregu
(3) oraz
(5) przedstawia się w sposób następujący:
Im więcej składowych tym przebieg jest bardziej łagodny. Zazwyczaj rozważamy średnie 5, 10, 30 i 100 okresowe.
Uogólnienie wzoru na dowolną liczbę składników:
gdy k jest liczbą nieparzystą:
gdy k jest liczbą parzystą:
dla k = 2
dla k = 4
dla dowolnej liczby parzystej:
b) średnie ruchome uprzednie:
wzór ogólny:
w szczególności:
Im większe „k” tym prognoza wyznaczona na podstawie tendencji długookresowej a im mniejsze „k” prognoza zależna od czynników bieżących.
przykład:
t |
Yt |
|
|
Ut(2) |
Ut(4) |
Ut2(2) |
Ut2(4) |
1 |
2 |
- |
- |
- |
- |
- |
- |
2 |
4 |
- |
- |
- |
- |
- |
- |
3 |
4 |
3 |
- |
1 |
- |
1 |
- |
4 |
8 |
4 |
- |
4 |
- |
16 |
- |
5 |
2 |
6 |
4,5 |
- 4 |
-2,5 |
16 |
6,25 |
6 |
6 |
5 |
4,5 |
1 |
-1,5 |
1 |
2,25 |
7 |
2 |
4 |
5,0 |
- 2 |
-3,0 |
4 |
9 |
8 |
4 |
4 |
4,5 |
0 |
-0,5 |
0 |
0,25 |
Σ |
|
|
|
0 |
-4,5 |
38 |
17,75 |
wyznaczanie prognozy na okres 9:
wyliczamy błędy prognoz ex - post na podstawie wzoru:
średnie wartości błędów prognoz obliczamy z wzoru:
dla badanego przykładu:
prognoza przeszacowana
wyznaczenie wariancji predykcji ex - post obliczamy z wzoru:
dla badanego przykładu:
⇒ Sp(2) = 2,52
⇒ Sp(4) = 2,11
wyniki obrazują odchylenia prognoz, ze względu na mniejszy błąd należy wybrać prognozę o parametrze 2,11.
uprzednia mediana ruchoma.
k = 1,2 ⇒ Met(k) =
przykład:
t |
Yt |
Met+1(3) |
Met+1(4) |
1 |
2 |
- |
- |
2 |
4 |
4 |
- |
3 |
4 |
4 |
- |
4 |
8 |
4 |
4 |
5 |
2 |
6 |
4 |
6 |
6 |
2 |
5 |
7 |
2 |
4 |
4 |
8 |
4 |
- |
3 |
obliczenie do tabeli:
Met+1(3) - kolejność składników do obliczeń wpisywać rosnąco (od najmniejszej do największej).
mediana dla nieparzystej liczby składników jest składnikiem środkowym.
2,4,4 środkowa 4 czyli mediana
4,4,8 środkowa 4 czyli mediana
2,4,8 środkowa 4 czyli mediana
2,6,8 środkowa 6 czyli mediana
2,2,6 środkowa 2 czyli mediana
2,4,6 środkowa 4 czyli mediana
Met+1(4) - kolejność składników do obliczeń wpisywać rosnąco (od najmniejszej do największej).
mediana dla parzystej liczby składników jest średnią arytmetyczną środkowych dwóch operacji.
2,4,4,8 suma dwóch środkowych cyfr dzielona przez dwa 8:2 = 4
2,4,4,8 suma dwóch środkowych cyfr dzielona przez dwa 8:2 = 4
2,4,6,8 suma dwóch środkowych cyfr dzielona przez dwa 10:2 = 5
2,2,6,8 suma dwóch środkowych cyfr dzielona przez dwa 8:2 = 4
2,2,4,6 suma dwóch środkowych cyfr dzielona przez dwa 6:2 = 3
wyznaczanie kwantyli - gdy „k” jest duże:
Wykład 4 - 12.01.2002
Metody adaptacyjne cd.
wyrównywanie wykładnicze ma postać:
ocena trendów w okresie
jest równa:
ocena ta równa jest średniej wartości dwóch ważonych
prognoza na okres t+1 ma postać:
prognozę tę możemy również zapisać jako:
Ut - błąd prognozy
błąd prognozy okresu t+1
Sposoby wyznaczania parametru α.
W praktyce wykonujemy to w sposób arbitralny - jeśli szereg który mamy analizować przebiega w sposób stacjonarny.
Aby wyznaczyć α przyjmuje się, że:
α = 0; 0,1; 0,2; 0,3; 0,4; ........................1,0
i dla każdego α wylicza się wartości trendu np.
k = 1,2 ............n
następnie obliczamy błędy prognozowania Ut,p(α)
następnie wyliczamy sumy kwadratów błędów prognozowania
przykład:
Cena akcji w poszczególnych pięciu notowaniach tworzy następujący szereg.
Wyznaczyć prognozę na okres szósty.
t |
Yt |
|
|
|
|
1 |
2 |
2,0 |
- |
- |
- |
2 |
4 |
3,6 |
2,0 |
2 |
4,0 |
3 |
1 |
1,52 |
3,6 |
-2,6 |
6,76 |
4 |
5 |
4,3 |
1,52 |
3,5 |
12,25 |
5 |
5 |
4,86 |
4,3 |
0,7 |
0,49 |
6 |
- |
- |
4,86 |
- |
|
Σ |
|
|
|
|
23,50 |
dla obliczeń założono, że
Y0 = Y1 a α = 0,8
sposób obliczania
suma kwadratów Q(α) wynosi Q(0,8) = 23,5
możemy teraz obliczyć wariancję predykcji ex - post
metoda autoregresyjna
rozważamy ciąg obserwacji od Y1 do Yn
współczynnik autokorelacji rzędu „k”
(ro)
i należy do przedziału <-1,1>
estymator współczynnika:
modele autoregresyjne:
funkcja autoregresyjna rzędu „g”
model autoregresyjny rzędu pierwszego zachodzi gdy:
Rk > Rk+1 k = 1,2 ................. n
i ma postać:
Współczynnik autokorelacji rzędu pierwszego mierzy następujące współzależności:
B(Yt,Yt-1) > 0
B(Yt, Yk) = 0
dla k = 2,3 .................n
Wyznaczanie prognoz jest pewna symulacja.
Podstawą jest model ekonometryczny, szczególnym jego przypadkiem jest funkcja trendu.
Wyliczenie wartości zmiennej prognozowanej i wyznaczenie błędu prognozowania.
Błąd jest nieodzowny w wyznaczaniu prognozy.
Klasyczne metody prognozowania wykorzystują wygładzanie szeregów czasowych.
Oprócz prognozy trzeba wyznaczyć błąd prognozy w 2 sposoby:
istnieje możliwość wyliczania błędu ex ande - podejście modelowe
stosuje się wyliczenie błędu ex post - podejście adaptacyjne
ex ande wykorzystywane w momencie wyznaczania samej prognozy
ex post możliwe do zastosowania kiedy wyznaczamy ciąg prognoz dotyczących kilku okresów.
KLASYCZNY LINIOWY MODEL EKONOMETRYCZNY
k
Yt = ∑ αi Xi + ξt
t=0
αo, 1Xoi = 1 wyraz wolny, stały
k
Yt = α0 + ∑αi * Xit + ξt
t=1
Dodatkowe warunki
Yt i ξt - zmienne losowe
α0 + ∑αi* Xit- zmienne losowe
Zakłada się, że nadzieja matematyczna zmiennej objaśniającej będzie równa zmiennej nielosowej, ponadto dla każdego t wariancja jest równa sigma kwadrat.
Dal każdego t = h kowariancja pomiędzy składnikami są nie korelowane ze sobą.
KLASYCZNY MODEL REGRESJI
k
1E(ξt) = 0 → E(Yt) = ∑ αi Xit
t t=0
1D2(ξt) = 02 1 Cov(ξt ξh) = 0
t t+h=1...n
Dla każdego t rozkład normalny
1 ξt ≈ η (0,02)
t
t = 1,2,...,n n+1, n+2,n+h h = 1,2,...
h - wyprzedzenie czasowe prognozowania
Y1, Y2, ..., Yn Yn+1, Yn+2, Yn+h
obserwowane prognozowane
Błąd prognozy
Ut+h = Yt+h - Ypt+h
Yp1t+h = f (Y1,Y2,...,Yn)
y1,y2,...,yn Ut+h = yt+h - ypt+h
Najprostszy sposób wyznaczania prognozy jest związany z modelem liniowym
Y = Xα + ξ
ξ1 Y1 1 X11 X12 . X1n
ξ2 Y2 1 X21 X22 . X2n
ξ = . Y = . X.= . . . .
. . . . . . .
. . . . . . .
ξ Yn 1 Xn1 Xn2 . Xnn
t
Metoda najmniejszych kwadratów
ϕ(α) = ( Y - Xα)T ( Y - Xα)
a : ϕ (a) = min
a = (XTX)-1 XTY
^
e = Y - Y = Y - X*a
Stopień dopasowania ocenia się za pomocą wariancji resztowej
et = y = ∑ α1 * Xit
t=0
V(a) = I - (α - a) ( α - a)T = (XTX)-1 δ2
V^(a) = (XTX)-1 S2e
V11 V12 V1n
V(a) = . . . = [Vij] (k+1)*(k+1)
. . .
D2(ai) i=j =δ2 2ij
Vij= Cov (aiaj) i≠j =δ2 2ij
y - wynagrodzenie bieżące
y= 1970,8 -749,3x1 + 1,6x2 + 388,2x3-697,9x4 +e
stałe płeć wyagr. wykszt. rasa
pracownika przeciętne
y^
y= -3123,5+1,7x2+408,2x3+e
(701,5) (0,059) (64,220)
D^(y^i)- przeciętny zarobek
a= [∑(yt-y) t] / [∑ (t-t)2], y = 1/n ∑yt, t= 1/n ∑t
t=1 t=1 t=1
b= y - at, S2e = [∑(yt - y^t)2]/ n-2
Metoda adaptacyjna - wykładnicza
D2(a) cov(a,b) 0,0751
V = = S2e (XTX)-1 =
cov(a,b) D2(b) 0,0751 (2,6
1 1
1
. .
X = t 1
. .
. .
n 1
MODEL TRENDU
D2(Yt^) = D^(a)t2 + 2cov^(a,b)t + D2^(b) + S2e
It = , yt - Zt
MEDIANA
szereg jednostopniowy
X n+1/2 n- nieparzyste
Me =
Xn/2 +Xn/2+1 n - parzyste
2
szereg wielostopniowy
Me = X0 + C0/n0 ( n/2 - cum-1)
KLASYCZNY MODEL EKONOMETRYCZNY
k
Yt = ∑ αiXi + ξt
t=0
k
Yt = ∑αiXit + α0 + ξt
t=1
Błąd prognozy
Ut+h = Yt+h - Ypt+h
Ypt+h = f(Y1,Y2,...,Yn) Yt,p+h = ∑ ai * Xin+h
Warunek kryterium najmniejszych kwadratów
ϕ(a) = uTu = (y - xa)T(y-xa) = min
a= (XTX)-1 XTy Y^ = Xa - model oszacowany
A-1 = (1/detA) * DT
Reszta
e = Y - Y^ = Y - Xa - wektor reszt
Wariancja resztowa
Kowariancja
V(a) = E (α-a)(α-a)T = (XTX)-1 * δ2
V^(a) = (XTX)-1 * S2e
Prognoza na okresy n+1, n+h
k
Yp,t+h = ∑ ai * Xin+h
i=0
Ocena błędu prognozy
k
Yt = ∑αiXit + ξt
i=0
Liniowa funkcja trendów
Yt = at + b + ξt
Błąd prognozowania ex ante
Un+h = Yn+h - Yp,n+h
k k
E(Un+h) = E(Yn+h) - E(Yp,n+h) = ∑αiXi,n+h - ∑E(ai) * Xi,n+h = 0
i=0 i=0
Nadzieja matematyczna predykatora = 0 - predykator jest nieobciążony
Błąd losowy prognozowania - wyrażony wariancją (nie jest mniejszy od wariancji składnika losowego)
D2(Un+h) = D2(Yn+h - Yp,n+h) = D2(Yn+h) + D2(Yp,n+h)
Względny ład prognozy
γ(Un+h) = * 100%
γ (un+h) ≤ γ %
Horyzont predykcji
H:max γ(Un+h) ≤ γ0
H:max D2(Un+h) ≤ d0
Metody wyrównywania wykładniczego
Yt = αy-1 + α(1-α)yt-2 + α(1-α)2 yt-3
Y^t+1 = αyt + (1-α)yt^
Ut(α) = yt - yt^(α)
U =1/m ∑ut
Wariancja ex post prognozowania
S2u = 1/m ∑ u2t
t
Su = √S2u
Np. γ9 = Sk/y9^ (względny błąd prognozy / ostatnie nasze prognozy y9^)
Ocena parametrów trendu liniowego wyznacza metody NMK.
yt = eα+βt lub yt = αβt β>0
β>1 rosnąca
β<1 malejąca
Wielomian drugiego stopnia (parabole)
yt = αt + α1t α2t2 α2>0
Funkcja potęgowa
yt = αtβ 0<β<1
Funkcja liniowo - odwrotnościowa
yt = α + β/t β<0
Funkcja ilorazowa
yt = αt/ β+t
Funkcja logistyczna
yt = α / 1+ βe - δt α δ>0, β>1
Model potęgowy
yt = αtβ
Średnie ruchome nieparzyste liczby składników
Średnie ruchome parzysta liczba składników
Ruchome średnie
Yt+1(k) = 1/k ∑Yi
Yt+1(1) = 1*Yt = Yt
Yt+1(2) = ½ (Yt-1 + Yt)
Metody wyznaczania prognoza pomocą średnich ruchomych.
Wskaźnik średniego indeksu wyznaczonych cech
Indeks zmiennej o podstawie stałej
It/c = yt/yc It/c = dt/c + 1 dk/c = (yt - yc)/yc
Indeks o podstawie łańcuchowej stosunek do okresu poprzedniego
It = yt/ (yt - 1) It = dt + 1 dt = (yt - yt-1) / yt-1
d = I + 1 I = √ I1 * I2 * I3 * ... * In+1 * In
I1 * I2 * I3 = y1/y0 * y2/y1 * y3/y2 = y3/y0 = I3/0
It = yt / yt -1
yt = I1 * yt-1
Ik-1 = yt-1/yt-2
yt-1 = Ik-1 * yt-2
yt = ItIk-1yt-2
yt = ItIx-1 It-2 yt-3
yt= I * yt-1
Prognoza yt = I2yt-2
yt-1 = Iyt-2
yk = I3yt-3
Ogólny wzór na metodę prognozowania - wskaźnik indeksu średniego
yt = Ik * yt-k
t |
yt |
|
|
|
|
1 |
6 |
-1,66 |
- |
- |
|
2 |
10 |
1,30 |
- |
- |
|
3 |
13 |
1,00 |
- |
- |
|
4 |
13 |
1,07 |
- |
-- |
|
5 |
14 |
|
- |
0,64 |
0,40 |
6 |
18 |
|
17,36 |
-1,5 |
2,25 |
7 |
20 |
|
21,50 |
-4,6 |
21,16 |
8 |
22 |
|
26,60 |
-8,98 |
80,64 |
9 |
24 |
|
32,98 |
15,08 |
104,45 |
10 |
24 |
|
|
14,44 |
|
Stopień pierwiastka jest równy liczbie wymnażanych indeksów
I = 4√ 2,33 = 1,24
y6 = I * y5 = 1,24 * 14 = 17,36
yt = Ik * yt-k
yt+k = Ik * yt
y7= I2 * y5 = (1,24)2 * 14 = 1,24*17,36=21,50
y8 = I3 * y5 = I * y7 = 1,24*21,50=26,60
y9 = I4 * y5 = I * y8 = 1,24*26,60=32,98
Ex post
et = yt - yt
e = 1/m ∑ et
e = -1/4 * 14,44 = -3,61
Wartości zmiennej prognozowanej są przeszacowywane o 3,61.
Dostajemy tą prognozę obciążona błędem systematycznym.
Błąd przeciętny prognozowania wyliczmy na podstawie ex post
S2k = 1/m ∑ e2t = ¼ * 104,45 = 26,11
Se = √ 26,11 = 5,11
Średni błąd prognozowania Vk
Vt = Se / yt
V8 = 5,11/26,60 = 0,19
V6 = 5,11/17,36 = 0,29
|
yt |
yt |
ξt = yt-yt |
h |
yt,h |
gt,h |
yt |
1 |
1 |
7 |
-6 |
1 |
1,67 |
0,14 (1/7) |
3,64 (7*0,52) |
2 |
8 |
9 |
-1 |
2 |
7,34 |
0,88 (8/9) |
8,10 (9*0,9) |
3 |
12 |
11 |
1 |
3 |
13,66 |
1,09 (12/11) |
12,32 |
4 |
17 |
13 |
4 |
4 |
17 |
1,3 |
15,86 |
5 |
9 |
15 |
-6 |
1 |
33 |
0,6 |
|
6 |
16 |
17 |
-1 |
2 |
|
0,94 |
|
7 |
22 |
19 |
3 |
3 |
|
1,15 |
|
8 |
26 |
21 |
5 |
4 |
|
1,23 |
|
9 |
19 |
23 |
-4 |
1 |
|
0,82 |
|
10 |
22 |
25 |
-3 |
2 |
|
0,88 |
|
11 |
31 |
27 |
4 |
3 |
|
1,14 |
|
12 |
33 |
29 |
4 |
4 |
|
1,13 |
|
13 |
|
31 |
|
|
25,67 |
|
|
14 |
|
33 |
|
|
31,34 |
|
|
15 |
|
35 |
|
|
27,66 |
|
|
16 |
|
37 |
|
|
41,33 |
|
|
prognozy
yt = 2t + 5 + ξt
MODEL SZEREGU KLASOWEGO
Szereg czasowy
yt = f(t) + a(t) + ξt
funkcja odzwierciedlająca
wahania sezonowe
ξt - losowe wahania w tym zadaniu - addytyczne
yt = f(k) b(t) - ξt
Ocena wskaźnika sezonowości ah
T - bieżący identyfikator danych
yt,h = f(t) + ah + ξt
ah = 1/m∑ξ t,h
a1 = 1/3 (ξ1 + ξ5 + ξ9) = 1/3 ( -6-6-4) = -16/3 = -5,33
a2 = 1/3 (ξ2 + ξ6 + ξ10) = 1/3 (-1-1-3) = -5/3 = -1,66
a3 = 1/3 (ξ3 + ξ7 + ξ11) = 1/3 (1+3+4) = 8/3 = 2,66
Model
yt,h = yt+ ah
Średni wskaźnik sezonowości dla kwartału będziemy dodawać do funkcji trendu
y1,1 = 7-5,33 = 1,67
Błąd prognozy - nie obliczmy bo za dużo zmiennych
MODEL MULTIPLIKATYCZNY
yt = f(t)b(t)ξt
yt,h - f(k) bh ξt,h
Oceny wskaźników sezonowości
bn = 1/m ∑ yt,h/yt
gt,h = yt,h / yt
b1 = 1/3 (0,14+0,6+0,82) = 0,52
b2 = 1/3 (0,88+0,04+0,88) =0,9
b3 = 1/3 (1,09+1,15+1,14) = 1,12
b4 = 1/3 (1,3+1,23+1,13) = 1,22
Ocena funkcji
yt = yt - bh
Struktura czasowa wykazuje wahania sezonowe. Trend rosnący z wahaniami sezonowymi.
Czy do tego by pasował model multipliatyczny?
W tym przypadku by pasowała funkcja trendu wyznaczona na podstawie średnich.
Podstawowe własności modeli ekonometrycznych (estymacja modelu, parametry określające zgodność modelu z danymi i wariancja resztowa), współrzędne zbieżności, determinacji, współrzędne funkcji regresji ≠0.
Model ekonometryczny z 1 zmienną lun 2 lub 3 wymaga prognozy na podstawie podanego modelu. Wartości zmiennej objaśnianej.
Metoda najmniejszych kwadratów - estymacja trendu liniowego kwadratów nieliniowych.
Trend z jedna zmienną objaśniającą - czas.
!!! Oszacować parametry trendu
Wariancja rusztowa - błąd prognozy (współrzędne zbieżności, determinacja)
Metody klasyczne - najstarsze
Wyznaczanie trendu metodą najmniejszych kwadratów, metody adaptacyjne - średnie scentrowane (mediany)
Średnie ruchome scentrowane
Wahania sezonowe
Ocena dokładności składników losowych za pomocą wariancji ex post, wskaźniki prognozowania
MODELOWANIA SZEREGÓW CZASOWYCH
Metoda autoregesyjna
Y1,Y2,...,Yt, ..Yn - zależności liniowe autokorelacji
Autokorelacja do badania stopnia zależności.
|
Yt-1 |
Yt-2 |
Yt-Y |
Yt-1-Y |
(Yt-Y)2 |
(Yt-Y)(Yt-1Y) |
2 |
4 |
0 |
0,9 |
2,9 |
0,81 |
2,61 |
4 |
0 |
0 |
2,9 |
-1,1 |
8,41 |
-3,19 |
0 |
0 |
1 |
-1,1 |
-1,1 |
1,21 |
1,21 |
0 |
1 |
0 |
-1,1 |
-0,1 |
1,21 |
0,11 |
1 |
0 |
- |
-0,1 |
-1,1 |
0,01 |
0,11 |
0 |
- |
- |
-1,1 |
|
1,21 |
∑0,85 |
|
|
|
|
|
∑12,86 |
|
Model autoregresji
t
Yt = α0 + ∑ αdYt-1 + ξ t
d-1
t h
Yt = α0 + ∑ α1γt-1 + ∑βxt + ξt
t-1
PROGNOZY I SYMULACJE TESTY Z NASZEGO EGZAMINU
TEST 1
Zapisać i wyjaśnić własności funkcji opisującej trend paraboliczny
Trend wzrostu sprzedaży wody mineralnej ma postać Yt= 2t+180, gdzie t= 1,2,3... Kwartalne addytywne wskaźniki sezonowości sprzedaży wody wynoszą -50, -10, 40, 20 odpowiednio dla kwartałów I, II, III, IV. Prognozy na kolejne kwartały roku 10 wynoszą odpowiednio:
Notowania kursów akcji w kolejnych okresach wynoszą: 20, 30, 40, 50, 60. Zcentrowane średnie ruchome dwu-okresowe określa ciąg:
Współczynnik determinacji trendu liniowego wyznaczonego na podstawie 12 obserwacji wynosi 0,95, a suma kwadratów odchyleń zmiennej objaśnianej od jej średniej wynosi 20. Wartość wariancji resztowej jest równa:
W latach od 1 do 10 trend wzrostu sprzedaży pewnego towaru ma postać Yt= t2-2t+80 Średni względny błąd predykcji ex-ante poziomu sprzedaży na rok 12 jest równy 4%. Jaka jest wartość wariancji predykcji ex-ante na rok 12.
W miesiącach od stycznia do kwietnia zaobserwowano następujące indeksy łańcuchowe tygodniowych dochodów sklepu (w%): 114,116,116,118. Jakie było średnie tempo zmian. Wyznaczyć prognozę na podstawie indeksu średniego na miesiąc lipiec, gdy wiadomo, ze dochód sklepu w kwietniu wynosił 10 tyś. Zł.
W miesiącach od stycznia do lipca zaobserwowano nast. Miesięczne wydatki (w zł): 4,5,8,10,12,14,15. Oszacować trend metodą najmniejszych kwadratów na podstawie danych od stycznia do kwietnia i wyznaczyć na jego podstawie prognozy wydatków do lipca. Wyliczyć i zinterpretować średnią i wariancje ex-post błędów prognoz.
TEST 2
Trend wzrostu sprzedaży wody mineralnej ma postać Yt = 2t+180, gdzie t= 1,2,3.... Kwartalne multiplikatywne wskaźniki sezonowości sprzedaży wody wynoszą 120%, 50%, 140% i 90% odpowiednio dla kwartałów I, II, III, IV. Prognozy na kolejne kwartały roku 10 wynoszą odpowiednio:
Zapisać i wyjaśnić funkcje opisującą trend wykładniczy (*potęgowy)
Notowania kursów akcji w kolejnych okresach wynoszą 2,3,4,5,3. Średnie ruchome trój-okresowe określa ciąg:
Współczynnik zbieżności trendu liniowego wyznaczonego na podstawie 12 obserwacji wynosi 0,1, a wariancja resztowa 2. Wówczas suma kwadratów odchyleń zmiennej objaśnianej od jej średniej wynosi:
W latach od 1 do 10 trend wzrostu sprzedaży pewnego towaru ma postać Yt=t2-2t+80. Wariancja predykcji ex-ante wynosi 16 na rok 12. Średni względny błąd predykcji ex-ante poziomu sprzedaży na rok 12 jest równy:
W miesiacach od stycznia do kwietnia zaobserwowano następujące tygodniowe zyski sklepu (w tyś zł) 4,5,6,6,8,. Jakie było średnie tempo zmian . Wyznaczyć prognozę na podstawie indeksu średniego na miesiąc czerwiec
W miesiącach od stycznia do kwietnia zaobserwowano następujące miesięczne wydatki (w zł) 4,6,10,8. na podstawie trendu :y=3t+1 wyznaczyć drugi ciąg prognoz na miesiące od stycznia (t=1) do kwietnia. Wyliczyć średnią oraz wariancje ex-post błędów. Wyliczyć współczynniki Theila dla obu metod prognozowania.
TEST 3
W latach od 1 do 10 trend wzrostu sprzedaży pewnego towaru ma postać Yt=t2-2t+80. Wariancja predykcji ex-ante wynosi 16 na rok 12. Średni względny błąd predykcji ex-ante poziomu sprzedaży na rok 12 jest równy:
Trend wzrostu sprzedaży wody mineralnej ma postać Yt=2t+180 gdzie t=1,2,3,....Kwartalne multiplikatywne wskaźniki sezonowości sprzedaży wody wynoszą 50%, 100%, 200% i 80% Odpowiednio dla kwartałów I, II, III i IV. Prognozy na kolejne kwartały roku 10 wynoszą odpowiednio.
Zapisać i wyjaśnić funkcję opisującą trend potęgowy.
Notowania kursów akcji w kolejnych okresach wynoszą 2,3,4,5,3. Zcentrowane średnie ruchome trój-okresowe określa ciąg.
Współczynnik zbieżności trendu liniowego wyznaczonego na podstawie 12 obserwacji wynosi 0,2 a wariancja resztowa 2. Wówczas suma kwadratów odchyleń zmiennej objaśnianej od jej średniej wynosi:
W miesiącach od stycznia do kwietnia zaobserwowano następujące tygodniowe zyski sklepu (w tyś zł): 4,5,6,6,8. Jakie było średnie tempo zmian. Wyznaczyć prognozę na podstawie indeksu średniego na miesiąc czerwiec.
W kolejnych miesiącach zaobserwowano następujące tygodniowe wydatki (w zł) 4,6,4,8,5,6 Wyznaczyć ciąg prognoz metodą średnich ruchomych 3-składnikowych. Wyliczyć średnią oraz wariancje ex-post błędów. Wyliczyć współczynniki Theila dla obu metod prognozowania.
TEST 4
Zapisać i wyjaśnić własności funkcji opisującej trend logarytmiczny .
Trend wzrostu sprzedaży piwa ma postać : Yt=2t+10, gdzie t=1,2,3,.... Kwartalne addytywne wskaźniki sezonowości sprzedaży wody wynoszą -5,-1,4,2 odpowiednio dla kwartałów I, II, III, IV. Prognozy na kolejne kwartały roku 10 wynoszą odpowiednio:
Notowania kursów dolara względem złotego w kolejnych dniach wynoszą 4,3,4,5,60. Uprzednie średnie ruchome dwu-okresowe określa ciąg:
Współczynnik determinacji trendu logistycznego wyznaczonego na podstawie 12 obserwacji wynosi 0,95 a suma kwadratów odchyleń zmiennej objaśnianej od jej średniej wynosi 20. Wartość wariancji resztowej jest równa.
W latach od 1 do 10 trend wzrostu sprzedaży pewnego towaru ma postać: Yt=t2-2t+80 Średni względny błąd predykcji ex-ante poziomu sprzedaży na rok 12 jest równy 4%. Jaka jest wartość wariancji predykcji ex-ante na rok 12.
W miesiącach od stycznia do kwietnia zaobserwowano nast. Indeksy łańcuchowe tygodniowych dochodów hurtowni, (w%): 110,110,120,120 Jakie było średnie tempo zmian. Wyznaczyć prognozę na podstawie indeksu średniego na miesiąc lipiec , gdy wiadomo, że dochód sklepu w kwietniu wynosił 100 tyś zł.
W miesiącach od stycznia do lipca zaobserwowano nast. miesięczne wydatki (w zł) 4,5,8,10,12,14,15 . Oszacować metodą najmniejszych kwadratów trend na podstawie danych od stycznia do kwietnia i wyznaczyć na jego podstawie prognozy wydatków do lipca. Wyliczyć i zinterpretować średnią i wariancję ex-post błędów prognoz.
PROGNOZOWANIE I SYULACJA
-STRONA 43 -
Parametry
Obserwacje zmiennych objaśniających (egzogeniczne)
Składnik losowy = objaśnia wpływ czynników niewyjaśnionych
0
ξ
S2e = eTe *
1
n-k-1
1
n-1
n
S2e = ∑ e2k
t=1
1
n-k-1
X0 - początek przedziału mediany
C0 - długość przedziału mediany
n0- liczba przedziału mediany
cum-1 - liczba kumulacji przedziału poprzedzającego przedział mediany
S2e = eTe
1
n-k-1
1
n-1
n
S2e = ∑ e2t
t=1
1
n-k-1
et = yi - ∑αiXit
D(Un+h)
Yp,n+h
h- wyprzedzenie czasowe
a=
∑yt -y)t
∑(t-t)2
b = y - at
n
y = ∑yt
t=1
1
n
n
t = 1/n ∑t
t=1
S2e =
∑(yt-yt)2
n-2
t+(k-1/2)
Yt(k) = ∑Yi
i=t-(k-1/2)
1
k
t-(k/2-1)
Yt(k) = (1/2Yt-k/2 + ∑Yi + 1/2Yt +k/2)
i=t-(k/2+1)
1
k
I = √ I2 I3 I4 I5
4
I = √ = √
4
y2 y3 y 4 y5
y1 y2 y3 y4
4
y5
y1
4
0
-2
-4
-6
1 2 3 4 5 6 7 8 9 10 11 12
Średni wskaźnik sezonowości modelu multiplikatycznego
Żeby policzyć tak jak myśmy to zrobili to tak powinno to wyglądać
NASZ PRZYPADEK
stałe
λ =
Cov (Yt, Yt-1)
D(Yt) D(Yt-1)
D2(Yt) = δ2
t
λt = const
t-1
γd =
Ct,t-d = ∑(Yt-Y)(Yt-1-Y)
t
S2t-d = ∑(Yt-1-Y)2
t
Y= ∑Yt
t
γd =
Ct,t-1 = ∑(Yt - Y)(Yt-1 - Y)
Ct,t-d
St, St-d
1
n-d
1
n-d
1
n
Ct,t-d
S2t
1
n-1
P, gdy y = 1
1 - p, gdy y = 0
Pt, gdy y = 1
1 - pt, gdy y = 0
rozkład normalny
rozkład Studenta