Prognozowanie, Tadeusz W.Bołt,
1
2. Błędy prognoz i ich analiza
1
2.1 Rodzaje błędów prognoz
W trakcie poprzedniego wykładu stwierdziliśmy, że prognozy ekonomiczne, z uwagi na
stochastyczny charakter procesów generujących zmienne ekonomiczne, obarczone będą błędami. Błędy
prognozowania mogą być analizowane ex post i ex ante.
Schemat 2.1 Rodzaje błędów prognoz – kryterium obserwowalności
Źródło: opracowanie własne
Błędy ex post, tj. błędy zaobserwowane są analizowane przy pomocy znanych narzędzi
statystyki opisowej oraz statystyki matematycznej. Statystyka opisowa oferuje narzędzia dające
możliwość wyznaczenia miar położenia oraz miar rozproszenia. Statystyka matematyczna oferuje
możliwości testowania hipotez statystycznych parametrów rozkładu błędów prognoz. W konsekwencji
w szczególnych przypadkach analiza błędów ex post prowadzi do zdefiniowania poprawek
prognostycznych, np. poprawek ze względu na obciążenie, czy autokorelację.
Błędy ex ante, nieobserwowalne w chwili wyznaczania prognozy, są analizowane drogą
dedukcyjną. Określany jest ich rozkład w warunkach przyjętych założeń odnośnie do modelu
generującego obserwacje zmiennej prognozowanej. Parametry rozkładu błędu ex ante mogą być
oszacowane, nawet w przypadku, gdy błędy ex post nie są zaobserwowane.
Dla różnych celów definiować można błędy prognoz w różny sposób i odnosić je do różnych
okresów/przedziałów czasu. Stąd też istnieje potrzeba klasyfikacji błędów prognoz.
Ze względu na sposób definiowania, błędy prognozy, zarówno ex post jak i ex ante, podzielić
można na dwa rodzaje:
błędy bezwzględne, wyznaczone jako różnice, bądź kwadraty różnic między zmienną
prognozowaną a prognozą, wyrażone w jednostkach tej zmiennej,
błędy względne, wyrażone jako stosunki błędów bezwzględnych do wartości prognoz,
wyrażone zwykle w procentach.
Błędy bezwzględne, ponieważ wyrażone są w jednostkach zmiennej prognozowanej, nie mogą
służyć do porównywania dokładności prognozowania różnych zmiennych. Błędy względne nie zależą od
jednostek w jakich zmienne prognozowane są wyrażone. Mogą zatem służyć do celów porównawczych.
1
Materiał dydaktyczny do wykorzystania przez studentów uczestniczących w wykładach z Prognozowania,
prowadzonych przez Tadeusza W. Bołta.
Błędy
prognoz
Ex ante
Ex post
Błędy prognoz
wygasłych
Błędy prognozy
będących wynikiem
eksperymentów
prognostycznych
Prognozowanie, Tadeusz W.Bołt,
2
Schemat 2.2 Rodzaje błędów prognoz – kryterium sposobu definiowania
Źródło: opracowanie własne
2.2 Analiza błędów prognoz ex post
Przejdźmy obecnie do analizy błędów prognoz ex post, a więc błędów, które zostały
zaobserwowane w pewnym przedziale czasu w przeszłości, zwanym przedziałem empirycznej
weryfikacji prognozy. W przedziale tym zastosowano wybraną metodę prognozowania do wyznaczenia
prognoz zmiennej
j
t
y
z wyprzedzeniem
j
okresów, co oznacza, że prognozy wyznaczone zostały w
każdym z okresów
t
na okresy
)
(
j
t
. Zatem zarówno prognozy jak i błędy prognoz będą odrębnie
analizowane dla różnych wyprzedzeń czasowych. W ogólnym przypadku można przypuszczać, że wraz
ze wzrostem wyprzedzenia czasowego dokładności prognoz powinny być coraz mniej dokładne.
Schemat 2.3 ukazuje rodzaje błędów prognoz ex post klasyfikowane według kryterium
okresu/przedziału czasu dla którego są wyznaczane. Zgodnie z tym kryterium wyróżniamy: błędy
danego (indywidualnego) okresu czasu, błędy skumulowane oraz błędy średnie.
Schemat 2.3 Rodzaje błędów prognoz – kryterium okresu, którego dotyczą
Źródło: opracowanie własne
Zarówno błędy bezwzględne jak i względne są obliczane dla każdego okresu, na który została
wyznaczona prognoza. Można powiedzieć, że jeśli metoda prognozowania jest dobrze dobrana wtedy
błędy prognoz ex post powinny oscylować wokół zera. Pierwszą zatem metodą analizy błędów
prognoz ex post jest wstępna analiza szeregu czasowego błędów, w szczególności analiza wykresów
błędów prognoz na osi czasu. Taka wstępna analiza pozwala na ocenę:
czy błędy prognoz oscylują wokół zera,
Błędy
prognoz
Błędy
bezwzględne
Błędy
względne
Błędy
prognoz
Błędy prognoz
danego okresu
Błędy
skumulowane/
błędy średnie
Prognozowanie, Tadeusz W.Bołt,
3
czy występują nietypowe co do wielkości błędy prognoz.
Analiza wstępna nie jest jednak wystarczająca. Trudno jest bowiem na jej podstawie precyzyjnie
określić charakter zmian błędów prognoz w czasie, w szczególności określić parametry rozkładu błędów
prognoz. Można powiedzieć, że do statystycznej analizy błędów prognoz ex post wykorzystać można
wszystkie narzędzia oferowane przez statystykę opisową oraz statystykę matematyczną, szczególnie
wtedy, gdy ciąg zaobserwowanych błędów prognoz ex post jest relatywnie długi.
Przejdźmy obecnie do zdefiniowania podstawowych błędów bezwzględnych i względnych.
Błąd prognozy ex post
)
(
|
p
j
t
t
(bezwzględny) jest definiowany jako różnica między zmienną
prognozowaną
)
(
j
t
y
, zaobserwowaną w tym okresie, a prognozą tej zmiennej
)
(
|
p
j
t
t
y
, wyznaczoną w
okresie
t
, na okres
)
(
j
t
:
p
j
t
t
j
t
p
j
t
t
y
y
|
|
,
,...)
2
,
1
;
,...,
1
(
j
j
T
t
(2.1)
gdzie
t
jest kolejnym okresem próby historycznej,
T
oznacza liczebność próby historycznej, natomiast
j
oznacza realne wyprzedzenie czasowe prognozy. Błąd prognozy jest wyrażony w takich samych
jednostkach jak zmienna prognozowana. Jeśli zmienną prognozowaną jest indeks zmian lub stopa
zmian, wyrażone w procentach, wtedy błąd prognozy jest również wyrażony w procentach.
Realizacje błędów prognoz
p
j
t
t
|
mogą być dodanie, jeśli prognozy niedoszacowują realizacje
zmiennej prognozowanej, ujemne jeśli prognozy przeszacowują realizacje zmiennej prognozowanej. W
szczególnym przypadku realizacją błędu prognozy ex post może być liczba zero, jeśli
p
j
t
t
j
t
y
y
|
.
Możemy zatem powiedzieć, że dysponując szeregiem
T
obserwacji historycznych oraz
wyznaczając prognozy na kolejne okresy
}
),...,
2
(
),
1
{(
T
j
j
, otrzymamy ciąg liczący
)
(
j
T
prognoz i odpowiadających im błędów prognoz.
Absolutny błąd prognozy ex post
|)
(|
|
p
j
t
t
jest definiowany jako wartość bezwzględna błędu
bezwzględnego:
|
|
|
|
|
|
p
j
t
t
j
t
p
j
t
t
y
y
,
,...)
2
,
1
;
,...,
1
(
j
j
T
t
. (2.2)
Absolutny błąd prognozy przyjmuje zatem wartości nieujemne i jest wykorzystywany do oceny
rzędu odchyleń zmiennej prognozowanej od prognozy.
Podobne znaczenie posiadają kwadratowe błędy prognozy ex post, definiowane jako:
2
2
)
(
)
(
|
|
p
j
t
t
j
t
p
j
t
t
y
y
,
,...)
2
,
1
;
,...,
1
(
j
j
T
t
. (2.3)
Błędy kwadratowe przyjmują wartości nieujemne. Są wyznaczane i analizowane w celu
umożliwienia wstępnej oceny, czy wariancja błędu prognozy jest stała, czy zmienia się w czasie.
Procentowy, względny błąd prognozy ex post
)
(
|
p
j
t
t
PE
2
definiujemy jako procentowy udział
bezwzględnego błędu prognozy w wartości prognozy
3
:
2
W literaturze przedmiotu wykorzystuje się dwa rodzaje oznaczeń błędów prognoz: pierwszy, stosowany w trakcie
wykładów, zawiera literkę
E
od angielskiego ,,error’’, drugi natomiast zawieram literkę
D
, od angielskiego
,,deviation’’. Na przykład dla oznaczenia średniego kwadratowego błędu prognozy stosuje się dwa oznaczenia:
MSE
(Mean Squared Error) lub
MSD
(Mean Squared Deviation).
3
Alternatywną definicją tego błędu jest:
100
j
t
p
j
t
t
p
j
t
t
y
APE
|
|
, określający procentowy udział błędu prognozy
w zaobserwowanej wartości zmiennej prognozowanej.
Prognozowanie, Tadeusz W.Bołt,
4
100
p
j
t
t
p
j
t
t
p
j
t
t
y
PE
|
|
|
,
,...)
2
,
1
;
,...,
1
(
j
j
T
t
. (2.4)
Błąd ten określa jaki procent wartości prognozy w danym okresie czasu stanowił błąd tej
prognozy. Podobnie jak błąd bezwzględny błąd względny może przyjmować wartości ze zbioru liczb
rzeczywistych.
Błąd ten obliczamy wtedy, gdy zmienna prognozowana jest wyrażona w innych jednostkach niż
procenty.
Absolutny procentowy, względny błąd prognozy ex post
)
(
|
p
j
t
t
APE
jest definiowany jako
wartość bezwzględna błędu procentowego:
100
p
j
t
t
p
j
t
t
p
j
t
t
y
APE
|
|
|
,
,...)
2
,
1
;
,...,
1
(
j
j
T
t
. (2.5)
Podobnie jak absolutny błąd prognozy, omawiany błąd prognozy może przyjmować wartości
nieujemne. Błąd ten wykorzystamy do oceny dopuszczalności prognoz ex post. Zakładając, że
satysfakcjonuje nas dokładność prognozowania nie mniejsza niż
%
a
przyjmiemy następującą regułę
decyzyjną:
prognozę dla której
a
APE
p
j
t
t
|
, nazywać będziemy prognozą dopuszczalną
(wystarczająco dokładną),
prognozę dla której
a
APE
p
j
t
t
|
, nazywać będziemy prognozą niedopuszczalną.
Wybór liczby
a
powinien uwzględniać rodzaj szeregu czasowego zmiennej prognozowanej,
wyprzedzenie czasowe prognozy oraz cel dla którego prognoza jest wyznaczana. W przypadku
szeregów czasowych o wysokiej częstotliwości, przyjęte kryterium prognozy dopuszczalnej może być
mniej rygorystyczne (
a
może być większe), inaczej niż w przypadku danych rocznych. Mniej
rygorystyczne kryterium dopuszczalności prognozy możemy zaakceptować dla prognoz z większym
wyprzedzeniem czasowym. Również mniej rygorystyczne kryterium dopuszczalności można przyjąć w
przypadku, gdy prognozy nie są wykorzystywane do podejmowania bieżących decyzji operacyjnych,
bardziej rygorystycznie natomiast powinny być oceniane prognozy wykorzystywane do podejmowania
bieżących decyzji gospodarczych.
Drugą grupę błędów stanowią błędy skumulowane. Są one definiowane jako cząstkowe sumy
błędów prognoz liczonych dla kolejnych indywidualnych okresów czasu. W trakcie wykładów
rozpatrywać będziemy skumulowane błędy bezwzględne oraz procentowe (względne). Błędy
skumulowane pokazują ,,ewolucję procesu prognozowania’’ w okresie próby. Wszystkie błędy
skumulowane można traktować jako bezpośrednie lub pośrednie miary obciążenia błędów prognozy.
Skumulowane, cząstkowe błędy prognozy ex post
)
(
,
p
j
s
CE
definiowane są jako
4
:
s
t
p
j
t
t
p
j
s
CE
1
|
,
,
,...}
2
,
1
;
),...,
2
(
),
1
(
{
j
T
j
j
s
, (2.6)
tzn. jako cząstkowe sumy bezwzględnych błędów prognoz lub w odniesieniu do względnych błędów
procentowych jako:
s
t
j
t
t
p
j
s
PE
CPE
1
|
,
,
,...}
2
,
1
;
),...,
2
(
),
1
(
{
j
T
j
j
s
. (2.7)
4
W literaturze przedmiotu niekiedy skumulowane błędy oznaczane są jako CUSUM (Cumulative Sum), natomiast
skumulowane błędy kwadratowe jako CUSUMSQ (Cumulative Sum of Squares). Zob. np. R.L.Brown, J.Durbin,
J.M.Evans, Techniques for testing the constancy of regression relations over time (with discussion), Journal of the
Royal Statistical Society B, vol. 37, str. 149-192.
Prognozowanie, Tadeusz W.Bołt,
5
Skumulowane cząstkowe błędy prognoz pokazują, czy wykorzystywana metoda ma tendencję
do przeszacowania/niedoszacowania realizacji zmiennej prognozowanej.
Miarą obciążenia błędu prognozy dla całej próby jest średnia arytmetyczna bezwzględnych
błędów prognoz
)
(
p
j
p
j
ME
, definiowana jako:
p
j
j
T
t
p
j
t
t
p
j
y
y
j
T
ME
1
1
|
,
,...)
2
,
1
(
j
, (2.8)
gdzie:
j
T
t
j
t
y
j
T
y
1
1
jest średnią arytmetyczną zmiennej prognozowanej, natomiast
j
T
t
p
j
t
t
p
j
y
j
T
y
1
1
|
jest średnią prognoz z wyprzedzeniem
j
okresów.
Miarą obciążenia, liczoną w oparciu o błędy względne, jest średnia arytmetyczna błędów
względnych
)
(
p
j
MPE
:
j
T
t
p
j
t
t
p
j
PE
j
T
MPE
1
1
|
,
,...)
2
,
1
;
,...,
1
(
j
j
T
t
. (2.9)
Średni absolutny błąd prognozy
)
(
p
j
MAE
jest definiowany jako średnia arytmetyczna błędów
absolutnych:
j
T
t
p
j
t
t
p
j
j
T
MAE
1
1
|
|
|
,
,...)
2
,
1
(
j
. (2.10)
Średni absolutny procentowy, względny błąd prognozy ex post
)
(
p
j
MAPE
jest definiowany
jako średnia arytmetyczna procentowych błędów prognozy:
100
1
1
j
T
t
p
j
t
t
p
j
t
t
p
j
y
j
T
MAPE
|
|
,
,...)
2
,
1
;
,...,
1
(
j
j
T
t
. (2.11)
Średnie błędy absolutne
p
j
MAE
oraz
p
j
MAPE
nie są miarami obciążenia (przyjmują tylko
wartości nieujemne). Należy je traktować jako miary rozproszenia.
Przejdźmy obecnie do klasycznych miar rozproszenia (zmienności) błędów prognoz.
Średni kwadratowy błąd prognozy
)
(
p
j
MSE
definiować będziemy jako średnie kwadratowe
odchylenie zmiennej prognozowanej od prognozy tej zmiennej lub ekwiwalentnie jako średnie
kwadratowe odchylenie błędu prognozy z wyprzedzeniem
j
okresów od zera. Możemy zatem zapisać,
że
5
:
5
Alternatywnym średniego stosunku do (2.21) sposobem definiowania średniego kwadratowego błędu prognozy
jest:
j
T
t
p
j
t
t
p
j
j
T
MSE
1
2
1
)
(
|
. Dla dużych prób oba sposoby dają w przybliżeniu takie same wyniki.
Pierwszy z nich może być traktowany jako nieobciążony estymator odpowiedniego parametru rozkładu błędu
prognozy, drugi natomiast jako obciążony, ale zgodny estymator największej wiarygodności. Zob. np. H.Theil,
Zasady ekonometrii, PWN, Warszawa 1979, str. 111-112. Ten drugi wykorzystywać będziemy w prezentowanych
w następnych częściach dekompozycjach Theila.
Prognozowanie, Tadeusz W.Bołt,
6
j
T
t
p
j
t
t
p
j
j
T
MSE
1
2
1
1
)
(
|
,
,...)
2
,
1
(
j
. (2.12)
Warto w tym miejscu wyjaśnić różnicę pomiędzy średnim kwadratowym błędem prognozy
)
(
p
j
MSE
a wariancją błędu prognozy
)
(
ˆ
2
p
j
. Prawdziwa jest równość:
6
2
2
1
2
1
1
1
)
(
)
(
ˆ
)
(
|
p
j
p
j
j
T
t
p
j
p
j
p
j
t
t
p
j
j
T
j
T
j
T
MSE
, (2.13)
gdzie:
j
T
t
p
j
p
j
t
t
p
j
j
T
1
2
2
1
1
)
(
)
(
ˆ
|
jest wariancją błędu prognozy ex post.
Można zatem stwierdzić, że średni kwadratowy błąd prognozy jest sumą wariancji błędu
prognozy oraz kwadratu obciążenia prognozy. Jeżeli obciążenie prognozy jest równe zero
0
p
j
,
wtedy:
)
(
ˆ
2
p
j
p
j
MSE
. (2.14)
Różnica w interpretacji obu miar zmienności wynika z przyjęcia różnych punktów odniesienia.
W przypadku średniego kwadratowego błędu prognozy, punktem odniesienia jest zero, natomiast w
przypadku wariancji jest nim średnia wartość błędów prognoz (obciążenie).
Średni błąd prognozy
)
(
p
j
RMSE
wyznaczać natomiast będziemy jako pierwiastek kwadratowy
ze średniego kwadratowego odchylenia:
j
T
t
p
j
t
t
p
j
p
j
j
T
MSE
RMSE
1
2
1
1
)
(
|
(2.15)
i interpretować jako przeciętne in plus in minus odchylenie błędu prognozy od zera lub
ekwiwalentnie jako przeciętne in plus in minus odchylenie zmiennej prognozowanej od prognozy
tej zmiennej.
6
Prawdziwy jest następujący ciąg przekształceń tożsamościowych:
.
)
(
)
(
)
(
)
(
|
|
|
j
T
t
p
j
p
j
p
j
t
t
j
T
t
p
j
j
T
t
p
j
p
j
t
t
j
T
t
p
j
p
j
p
j
t
t
p
j
j
T
j
T
j
T
j
T
MSE
1
1
2
1
2
1
2
1
2
1
1
1
1
1
1
Drugi składnik sumy można zapisać następująco:
2
1
2
1
1
1
)
(
)
(
p
j
j
T
t
p
j
j
T
j
T
j
T
. Dla dużej
liczebności próby
1
1
j
T
j
T
i przybliżenie (2.13) jest bardzo dokładne, np. dla
30
)
(
j
T
iloraz ten
wynosi
034
,
1
. Trzeci składnik tej równości zeruje się, gdyż suma odchyleń od średniej jest równa zeru:
j
T
t
p
j
p
j
t
t
p
j
j
T
t
p
j
p
j
p
j
t
t
j
T
j
T
1
1
0
1
2
1
2
)
(
)
(
|
|
, co prowadzi do wyniku zapisanego w
równaniu (2.13).
Prognozowanie, Tadeusz W.Bołt,
7
Jest oczywiste, że wyznaczyć można również odchylenie standardowe błędu prognozy jako
pierwiastek z wariancji, zgodnie z:
)
(
ˆ
)
(
ˆ
2
p
j
p
j
. (2.16)
Odchylenie standardowe błędu prognozy definiuje przeciętne in plus in minus odchylenie błędu
prognozy od średniej wartości tego błędu (obciążenia). Widać zatem wyraźnie, że jeśli obciążenie błędu
prognozy jest zerowe wtedy obie miary zmienności równają się.
Dla oceny relatywnej dokładności prognozowania można obliczyć dodatkowo przeciętny
względny błąd prognozy
)
(
p
j
V
zdefiniowany jako
7
:
100
p
j
p
j
p
j
y
RMSE
V
. (2.17)
Błąd ten określa procentowy udział średniego błędu prognozy w średniej wartości prognoz
z wyprzedzeniem
j
okresów.
Wprowadzimy obecnie współczynnik dokładności prognoz ex post, związany z pojęciem
prognozy dopuszczalnej. Oznaczmy przez
p
j
WS
współczynnik sprawdzalności prognoz, który
zdefiniujemy jako:
100
j
T
l
WS
dop
p
j
(2.18)
gdzie:
dop
l
oznacza liczbę prognoz dopuszczalnych (tj. spełniających
a
APE
p
j
t
t
|
), natomiast
)
(
j
T
oznacza liczbę wszystkich prognoz ex post. Współczynnik
p
j
WS
oznacza zatem jaki procent
wszystkich prognoz stanowiły prognozy dopuszczalne. Jest oczywiste, że współczynnik ten przybiera
wartości z przedziału
100
;
0
.
Wprowadzimy ponadto kolejny współczynnik dokładności prognoz ex post, związany z jakością
prognozowania zmian kierunków realizacji zmiennej prognozowanej. Rozważymy dwa przypadki:
pierwszy, gdy zmienna prognozowana przyjmuje wartości nieujemne, tzn. jest wyrażona w
jednostkach naturalnych lub jest indeksem procentowym,
drugi, gdy zmienna prognozowana może przyjmować wartości rzeczywiste, tzn. jest procentową
stopą zmian wyrażoną w procentach lub jest przyrostem wyrażonym w jednostkach naturalnych.
W pierwszym przypadku obliczymy pierwsze przyrosty zmiennej prognozowanej oraz pierwsze
przyrosty prognoz tej zmiennej. Następnie obliczymy liczbę przypadków, w których przyrosty zmiennej
prognozowanej mają takie same znaki jak przyrosty prognoz. Liczbę tę oznaczymy
zgodne
l
.
W przypadku drugim obliczmy liczbę przypadków, w których realizacje zmiennej
prognozowanej mają taki sam znak jak prognozy. Liczbę tę oznaczymy
zgodne
l
.
Współczynnik poprawności
)
(
p
j
WP
przepowiadania kierunków zmian definiujemy jako
procentową frakcję liczby prognoz zgodnych (w sensie znaków) w ogólnej liczbie prognoz (lub ich
przyrostów), co zapiszemy:
7
Alternatywną formą tego współczynnika jest:
100
y
RMSE
V
p
j
p
j
, określający procentowy udział średniego
błędu prognozy w średniej wartości zmiennej prognozowanej.
Prognozowanie, Tadeusz W.Bołt,
8
100
j
T
l
WP
zgodne
p
j
. (2.18)
Jest oczywiste, że również ten współczynnik przybiera wartości z przedziału
100
;
0
.
Inną miarą zgodności kierunków realizacji zmiennej prognozowanej i prognoz jest
współczynnik korelacji liniowej Pearsona, definiowany jako:
)
(
ˆ
)
(
ˆ
)
,
(
ˆ
,
p
j
p
j
y
y
y
y
y
y
r
p
j
(2.19)
gdzie:
j
T
t
j
t
y
y
j
T
y
1
2
2
)
(
1
1
)
(
ˆ
-
jest
wariancją
zmiennej
prognozowanej,
)
(
ˆ
)
(
ˆ
2
y
y
,
j
T
t
p
j
p
j
t
t
p
j
y
y
j
T
y
1
2
2
1
1
)
(
)
(
ˆ
|
-
jest
wariancją
prognoz,
)
(
ˆ
)
(
ˆ
2
p
j
p
j
y
y
,
j
T
t
p
j
p
j
t
t
j
t
p
j
y
y
y
y
j
T
y
y
1
1
1
)
)(
(
)
,
(
ˆ
|
- jest kowariancją pomiędzy
zmienną prognozowaną a prognozą tej zmiennej.
Współczynnik ten przybiera wartości z przedziału
1
1
p
j
y
y
r
,
. Bliskie jedności wartości tego
współczynnika, świadczą o zgodności kierunków zmian realizacji zmiennej prognozowanej z ich
prognozami.
Dysponując oszacowaniem obciążenia błędów prognoz
p
j
ME
oraz odchyleniem standardowego
)
(
ˆ
p
j
możemy testować hipotezę dotyczącą istotności obciążenia. Odpowiednie hipotezy statystyczne
zapiszemy w następujący sposób:
8
0
0
p
j
t
t
E
H
|
:
;
0
p
j
t
t
A
E
H
|
:
. (2.20)
Jeżeli błędy prognoz mają rozkłady normalne, to odpowiednią statystyką testu jest
9
:
)
(
~
)
(
)
(
ˆ
1
0
j
T
p
j
p
j
t
j
T
t
(2.21)
o rozkładzie t-Studenta i
)
1
(
j
T
stopniach swobody. Duże co do modułu wartości statystyki
t
upoważniają do odrzucenia hipotezy zerowej, małe natomiast nie dają podstaw do jej odrzucenia. W
szczególności dla przyjętego ryzyka wnioskowania (poziomu istotności
) regułami podejmowania
decyzji są:
8
Możemy oczywiście weryfikować hipotezy jednostronne. W przypadku układu zdań
0
0
p
j
t
t
E
H
|
:
;
0
p
j
t
t
A
E
H
|
:
hipoteza zerowa jest odrzucana na korzyść hipotezy alternatywnej, która stwierdza, że
występuje istotne nieoszacowanie prognoz. W przypadku układu zdań
0
0
p
j
t
t
E
H
|
:
;
0
p
j
t
t
A
E
H
|
:
hipoteza zerowa jest odrzucana na korzyść hipotezy alternatywnej, która stwierdza, że występuje istotne
przeszacowanie prognoz.
9
Zob. np. J.Jóźwiak, J.Podgórski, Statystyka opisowa od podstaw, PWE, Warszawa 1997, str. 245.
Prognozowanie, Tadeusz W.Bołt,
9
jeżeli
t
t
|
|
- podejmujemy decyzję o braku podstaw do odrzucenia hipotezy zerowej,
stwierdzamy zatem, że obciążenie błędów prognoz z wyprzedzeniem
j
okresów statystycznie
nieistotnie różni się od zera,
jeżeli
t
t
|
|
- podejmujemy decyzję o odrzuceniu hipotezy zerowej na rzecz hipotezy
alternatywnej, stwierdzamy zatem, że obciążenie błędów prognoz z wyprzedzeniem
j
okresów
statystycznie istotnie różni się od zera.
Jeśli obciążenie błędów prognoz jest statystycznie istotnie różne od zera można zdefiniować
prognozę skorygowaną
)
~
(
|
p
j
t
t
y
ze względu na obciążenie. Można w takim przypadku zapisać, że:
p
j
p
j
t
t
p
j
t
t
y
y
|
|
~
. (2.22)
2.3 Diagram prognostyczny i linia prognoz dokładnych
Diagramem prognostycznym nazywać będziemy wykres zależności pomiędzy zmienną
prognozowaną a jej prognozami (dla zadanego wyprzedzenia czasowego prognozy). Rysunek 2.1
przedstawia diagram prognostyczny w którym na osi rzędnych zaznaczono wartości prognoz z
wyprzedzeniem
)
1
(
j
, natomiast na osi odciętych zaznaczono wartości zmiennej prognozowanej.
Dane dotyczą kwartalnej stopy inflacji w Polsce i będą wykorzystywane w trakcie wykładów.
Źródło: opracowanie własne
Rysunek 2.2 Diagram prognostyczny -
linia prognoz dokładnych
p
j
t
y
Źródło: opracowanie własne
Rysunek 2.1 Diagram prognostyczny
-2
-1
0
1
2
3
4
-2
0
2
4
p
t
y
1
1
t
y
Prognozowanie, Tadeusz W.Bołt,
10
Rysunek 2.3 Diagram prognostyczny
-2
0
2
4
-2
0
2
4
Źródło: opracowanie własne
Jak widać z rysunku 2.1 realizacje zmiennej prognozowanej i prognoz nie pokrywają się, tzn.
występują niezerowe błędy prognoz. Tym nie mniej realizacje te skupione są wokół pewnej prostej.
Gdyby prognozy nie były obarczone błędami, realizacje zmiennej prognozowanej i prognoz leżałyby na
,,linii prognoz dokładnych’’, którą zamieszczono na rysunku 2.2. Linia ta przechodzi przez początek
układu współrzędnych. Niestety jednak, jak pokazuje rysunek 2.3, empiryczna liniowa zależność
pomiędzy zmienną prognozowana a prognozami tej zmiennej odbiega od linii prognoz dokładnych.
Rozważmy liniową zależność pomiędzy zmienną prognozowaną a prognozą, zapisaną jako:
j
t
p
j
t
t
j
j
j
t
y
b
a
y
|
,
,...)
2
,
1
;
,...,
1
(
j
j
T
t
(2.23)
gdzie:
j
a
,
j
b
parametry,
j
t
- składnik zakłócający, o którym zakładamy, że jest generowany przez
proces czysto losowy. Zakładamy zatem, że
0
j
t
E
,
2
2
)
(
j
t
E
;
s
j
E
s
t
j
t
;
0
.
Oszacowaniami MNK parametrów tego modelu są
10
:
p
j
j
j
y
b
y
a
ˆ
ˆ
, (2.24)
)
(
ˆ
)
(
ˆ
)
(
ˆ
)
,
(
ˆ
ˆ
,
2
p
j
y
y
p
j
p
j
j
y
y
r
y
y
y
b
p
j
. (2.25)
Wariancje błędów ocen parametrów
j
a
,
j
b
znajdziemy w następujący sposób
11
:
j
T
t
p
j
p
j
t
t
j
y
y
b
1
2
2
2
)
(
ˆ
)
ˆ
(
ˆ
|
, (2.26)
1
1
2
1
2
2
2
T
t
p
j
p
j
t
t
j
T
t
p
j
t
t
j
y
y
j
T
y
a
)
(
)
(
)
(
ˆ
)
ˆ
(
ˆ
|
|
(2.27)
10
W sprawie klasycznej metody najmniejszych kwadratów zob. np. H.Theil, Zasady ekonometrii, PWN,
Warszawa 1979, str. 56-60 oraz str.121-164. Zobacz też T.W. Bołt, Wykłady z ekonometrii,
11
Zobacz. np. H.Theil, Zasady ekonometrii, PWN, Warszawa 1979, str.124-125. Zobacz też T.W. Bołt, Wykłady
z ekonometrii, www.wzr.pl .
Prognozowanie, Tadeusz W.Bołt,
11
gdzie
j
T
t
j
t
j
T
1
2
2
ˆ
2
1
ˆ
jest wariancją reszt w modelu (2.23), przy czym
j
t
j
t
j
t
y
y
ˆ
ˆ
,
natomiast wartość teoretyczna zmiennej prognozowanej
)
ˆ
(
j
t
y
, jest wyznaczona jako:
p
j
t
t
j
j
j
t
y
b
a
y
|
ˆ
ˆ
ˆ
,
,...)
2
,
1
;
,...,
1
(
j
j
T
t
. (2.28)
Dysponując oszacowaniami MNK parametrów
j
a
,
j
b
możemy testować następujące hipotezy
statystyczne dotyczące linii prognoz dokładnych
12
:
0
:
0
j
a
H
;
0
:
j
A
a
H
(2.29)
1
:
0
j
b
H
;
1
:
j
A
b
H
. (2.30)
Oznaczmy oszacowania MNK parametrów
j
a
,
j
b
jako:
j
aˆ
,
j
bˆ
, natomiast ich średnie błędy
jako:
)
ˆ
(
ˆ
j
a
,
)
ˆ
(
ˆ
j
b
. Odpowiednie statystyki t-Studenta mają postacie
13
:
)
ˆ
(
ˆ
0
ˆ
j
j
a
a
a
t
j
;
)
ˆ
(
ˆ
1
ˆ
j
j
b
b
b
t
j
. (2.31)
Jeśli błędy prognoz mają rozkłady normalne wtedy statystyki
j
a
t
,
j
b
t
mają rozkłady t-Studenta
o
)
2
(
j
T
stopniach swobody. Duże co do modułu wartości statystyk
j
a
t
;
j
b
t
uprawniają do
odrzucenia hipotez zerowych na korzyść hipotez alternatywnych, małe zaś na przemawiają na korzyść
hipotez zerowych. W szczególności dla akceptowanego poziomu ryzyka
reguły podejmowania
decyzji są następujące:
jeżeli
t
t
j
a
|
|
,
t
t
j
b
|
|
- podejmujemy decyzję o braku podstaw do odrzucenia hipotez
zerowych, stwierdzamy zatem, empiryczna linia (2.23) statystycznie nieistotnie różni się od
linii prognoz dokładnych,
jeżeli
t
t
j
a
|
|
,
t
t
j
b
|
|
- podejmujemy decyzję o odrzuceniu hipotez zerowych na rzecz
hipotez alternatywnych, stwierdzamy zatem, empiryczna linia (2.23) statystycznie istotnie różni
się od linii prognoz dokładnych.
Współczynnik determinacji
)
(
2
j
R
dla liniowej relacji (2.23) jest definiowany zgodnie z:
2
,
1
2
1
2
2
)
(
)
ˆ
(
p
j
y
y
j
T
t
j
t
j
T
t
j
j
t
j
r
y
y
y
y
R
(2.32)
Współczynnik ten może być wykorzystywany jako kryterium oceny jakości prognoz.
12
W trakcie wykładu rozpatrywać będziemy tylko indywidualne hipotezy dotyczące parametrów
j
a
,
j
b
. Nie jest
jednak trudno testować obie hipotezy łącznie, korzystając ze statystyk o rozkładzie
2
oraz Fishera-Snedecora.
13
Zob. np. H.Theil, zasady ekonometrii, PWN, Warszawa 1979, str.
Prognozowanie, Tadeusz W.Bołt,
12
2.4 Dekompozycje średniego kwadratowego błędu prognoz Theila
14
Średni kwadratowy błąd prognozy oraz średni błąd prognozy są naturalnymi, najczęściej
stosowanymi miernikami dokładności prognoz ex post. Prognozy są tym bardziej dokładne im miary te
są bliższe zeru. H. Theilowi zawdzięczamy bardziej szczegółowe analizy, zwane dekompozycjami
Theila, które umożliwiają określenie przyczyn powstawania błędów prognoz. Omówimy dwie
dekompozycje średniego kwadratowego błędu prognozy.
Drogą bezpośredniego sprawdzenia wykazać można, że prawdziwa jest następująca równość
(pierwsza dekompozycja Theila):
2
2
2
2
1
1
2
1
)
(
)
(
ˆ
)
(
ˆ
)
(
)}
(
ˆ
)
(
ˆ
{
)
(
)
(
ˆ
,
p
j
p
j
y
y
p
j
p
j
p
j
p
j
j
T
j
T
y
y
r
y
y
j
T
j
T
MSE
p
j
, (2.33)
gdzie: symbole występujące po prawej stronie równości zdefiniowano w poprzednich częściach
wykładu.
Dzieląc obie strony równości zapisanej wyżej przez
p
j
MSE
otrzymamy:
p
j
p
j
p
j
p
j
y
y
p
j
p
j
MSE
j
T
j
T
MSE
y
y
r
MSE
y
y
p
j
2
2
1
1
2
1
)
(
)
(
ˆ
)
(
ˆ
)
(
)}
(
ˆ
)
(
ˆ
{
,
. (2.34)
Wprowadźmy oznaczenia:
p
j
p
j
S
j
MSE
y
y
U
2
)}
(
ˆ
)
(
ˆ
{
,
p
j
p
j
y
y
C
j
MSE
y
y
r
U
p
j
)
(
ˆ
)
(
ˆ
)
1
(
2
,
,
p
j
p
j
M
j
MSE
j
T
j
T
U
2
1
)
(
, (2.35)
gdzie:
S
j
U
nazywać będziemy współczynnikiem udziału błędów z tytułu wariancji,
C
j
U
nazywać
będziemy współczynnikiem udziału błędów kierunków tytułu niezgodności kierunków realizacji,
M
j
U
natomiast nazywać będziemy współczynnikiem udziału błędów z tytułu obciążenia.
Współczynnik
S
j
U
określa, jaki jest udział błędów wynikających różnicy zmienności zmiennej
prognozowanej i prognoz tej zmiennej w średnim kwadratowym błędzie prognozy. Duże wartości tego
współczynnika wskazują na małą lub zbyt dużą elastyczność elastyczność metody prognozowania,
zastosowanej w badanym przypadku prognozowania. W przypadku zbyt małej elastyczności tj.
)
(
ˆ
)
(
ˆ
p
j
y
y
, szereg czasowy zmiennej prognozowanej wykazuje dużą zmienność, natomiast
metoda prognozowania daje prognozy wygładzone. W przypadku zbyt dużej elastyczności tj.
)
(
ˆ
)
(
ˆ
p
j
y
y
szereg czasowy zawiera regularne zmiany (inercyjne), natomiast wykorzystana jest
metoda prognozowania wrażliwa na zmiany najnowszych obserwacji. Jest oczywiste, że
0
S
j
U
, jeśli
)
(
ˆ
)
(
ˆ
p
j
y
y
.
Współczynnik
C
j
U
określa, jaki jest udział błędów wynikających z niezgodności kierunków
realizacji zmiennej prognozowanej i prognoz tej zmiennej. Współczynnik ten równa się zero
0
C
j
U
,
14
Zob. H.Theil, Applied economic forecasting, North-Holland Publishing Company, Amsterdam 1961, str. 25-39.
Prognozowanie, Tadeusz W.Bołt,
13
jeśli
1
,
p
j
y
y
r
. Im bardziej empiryczny współczynnik korelacji odbiegać będzie od jedności, tym
większe wartości przyjmować będzie współczynnik
C
j
U
.
Współczynnik
M
j
U
określa, jaki jest udział błędów spowodowanych obciążeniem prognozy w
średnim kwadratowym błędzie prognozy. Współczynnik ten przyjmie wartość zero
0
M
j
U
jeśli
0
p
j
, tzn.
p
j
y
y
. Duży udział błędów z tytułu obciążenia wskazuje na systematyczne
przeszacowanie, bądź nieoszacowanie prognoz. Jest to zwykle sygnałem do zmiany modelu
prognostycznego, wykorzystywanego w prognozowaniu.
Wszystkie omawiane współczynniki są unormowane w przedziale
1
;
0
oraz sumują się do
jedności:
1
M
j
C
j
S
j
U
U
U
. (2.36)
Podobnie jak w przypadku omawianym wyżej, również obecnie, drogą bezpośredniego
sprawdzenia wykazać można, że prawdziwa jest równość (druga dekompozycja Theila):
2
2
2
2
2
2
1
1
1
)
(
)
(
ˆ
)
(
)}
(
ˆ
)
(
ˆ
{
)
(
)
(
ˆ
,
,
p
j
y
y
y
y
p
j
p
j
p
j
p
j
j
T
j
T
y
r
y
r
y
j
T
j
T
MSE
p
j
p
j
, (2.37)
przy czym oznaczenia pozostają niezmienione.
Dzieląc obie strony tej równości przez
p
j
MSE
otrzymamy:
p
j
p
j
p
j
y
y
p
j
y
y
p
j
MSE
j
T
j
T
MSE
y
r
MSE
y
r
y
p
j
p
j
2
2
2
2
1
1
1
)
(
)
(
ˆ
)
(
)}
(
ˆ
)
(
ˆ
{
,
,
. (2.38)
Wprowadzając oznaczenia:
p
j
y
y
p
j
R
j
MSE
y
r
y
U
p
j
2
,
)}
(
ˆ
)
(
ˆ
{
,
p
j
y
y
D
j
MSE
y
r
U
p
j
)
(
ˆ
)
1
(
2
2
,
,
p
j
p
j
M
j
MSE
j
T
j
T
U
2
1
)
(
(2.39)
otrzymamy:
1
M
j
D
j
R
j
U
U
U
. (2.40)
Współczynnik
R
j
U
określać będziemy jako współczynnik udziału błędów z tytułu odchyleń od
linii prognoz dokładnych. Jak pokazaliśmy w poprzedniej części wykładu oszacowaniem współczynnika
kierunkowego linii (2.23) jest
)
(
ˆ
)
(
ˆ
ˆ
,
p
j
y
y
j
y
y
r
b
p
j
. Oszacowanie to jest równe jedności,
1
ˆ
j
b
, jeśli
)
(
ˆ
)
(
ˆ
,
y
r
y
p
j
y
y
p
j
. W takim przypadku
0
R
j
U
. Zatem im większa jest różnica
)
(
ˆ
)
(
ˆ
,
y
r
y
p
j
y
y
p
j
,
tym większe jest odchylenie współczynnika
j
bˆ
od jedności, tym większe wartości przyjmuje
współczynnik
R
j
U
.
Prognozowanie, Tadeusz W.Bołt,
14
Współczynnik
D
j
U
nazywać będziemy współczynnikiem udziału błędów z tytułu
niedopasowania relacji (2.23). Ponieważ
2
2
,
)
1
(
j
y
y
p
j
r
jest współczynnikiem zbieżności obliczonym
dla modelu (2.23), określa zatem jaka część zmienności realizacji zmiennej prognozowanej nie została
wyjaśniona przez zmienność prognoz. Jeśli zatem
1
,
p
j
y
y
r
, wtedy
0
2
j
znieważ wtedy
0
D
j
U
.
Współczynnik udziału błędów z tytułu obciążenia
M
j
U
omówiono poprzednio.
2.5 Skorelowanie w czasie błędów prognoz ex post
Kolejnym etapem analizy błędów prognoz ex post może być badanie autokorelacji
(skorelowania w czasie) tych błędów. Jest zrozumiałe, że analiza autokorelacji ma uzasadnienie wtedy,
gdy dysponujemy stosunkowo długim szeregiem czasowym obserwowalnych błędów prognoz.
Skorelowanie w czasie błędów prognoz może być wynikiem wielu przyczyn. Jedną z nich może być na
przykład błąd konstrukcji modelu prognostycznego (ekonometrycznego). Niezależnie od przyczyn
powodujących skorelowanie w czasie błędów prognoz, informacje o rodzaju tego skorelowania mogą
być wykorzystane do skonstruowania poprawki prognozy ze względu na autokorelację.
Dla uproszczenia zapisów rozpatrzmy przypadek autokorelacji rzędu pierwszego
)
(
1
.
Oszacowaniem tego współczynnika na podstawie ciągu
)
(
j
T
zaobserwowanych błędów prognoz ex
post jest
15
:
T
t
p
j
t
t
T
t
p
j
t
t
p
j
t
t
1
2
2
1
1
1
)
ˆ
(
ˆ
ˆ
ˆ
|
|
|
. (2.41)
Współczynnik ten informuje o sile i kierunku skorelowania w czasie kolejnych błędów prognoz
z wyprzedzeniem
j
okresów. Można testować hipotezę istotności tego współczynnika wykorzystując
statystykę Box-Pierce’a lub Ljung-Boxa
16
. Jeśli okaże się, że współczynnik autokorelacji jest istotnie
różny od zera, wtedy uzasadnienie ma wyznaczenie prognozy skorygowanej:
p
j
t
t
j
p
j
t
t
p
j
t
t
y
y
1
1
1
|
|
|
ˆ
~
. (2.42)
2.6 Prognozowanie bez wygładzania
Rozważmy obecnie tzw. naiwną metodę prognozowania
17
, polegającą na wyznaczeniu prognozy
na okres następny na poziomie poprzedniej realizacji zmiennej prognozowanej. Mimo nazwy
sugerującej niezbyt mocne uzasadnienia tej metody, pokażemy, że wzmiankowana metoda
prognozowania ma mocne podstawy teoretyczne.
Rozważmy liniowy model błądzenia przypadkowego, który zapiszemy w następujący sposób:
t
t
t
y
y
1
;
)
,...,
1
(
T
t
, (2.43)
15
W sprawie autokorelacji zobacz np. H.Theil, Zasady ekonometrii, PWE, Warszawa 1979, str. 257-261.
16
Zob. G.E.P.Box, D.A.Pierce, Distribution of residual autocorrelations in autoregressive-integreted moving
average time series models, Journal of the American Statistical Association, vol. 65, 1970, str. 1509-1526,
G.M.Ljung, G.E.P.Box, On a measure of lack of fit in time series models, Biometrica, vol.65, 1978, str. 297-303.
17
Zob. np. J.B.Gajda, Prognozowanie i symulacja a decyzje gospodarcze, Wydawnictwo C.H.Beck, Warszawa
2001, str. 176-180.
Prognozowanie, Tadeusz W.Bołt,
15
gdzie
t
jest czysto losowym zakłóceniem, spełniającym
18
:
0
t
E
,
2
2
)
(
t
E
;
s
t
E
s
t
;
0
.
Jeżeli wyjściowa obserwacja jest zadana (ustalona) jako
0
y
, wtedy poziom zmiennej
t
y
w
dowolnym momencie czasu jest wyznaczony przez ustaloną wartość początkową oraz wszystkie
zakłócenia jakie zrealizowały się do momentu
t
włącznie, co zapiszemy:
19
t
s
s
t
y
y
1
0
(2.44)
gdzie
t
s
s
1
jest definiowane jako trend stochastyczny
20
.
Realizacja zmiennej w okresie
)
1
(
t
generowanej przez proces błądzenia przypadkowego
różnić się będzie o czysto losowe (,,nieprognozowalne’’) zakłócenie losowe, co zapiszemy:
1
1
t
t
t
y
y
. (2.45)
Można zadać pytanie: jaka jest najlepsza prognoza zmiennej
1
t
y
wyznaczona w okresie
t
? Nie
ulega wątpliwości, że w takim przypadku najlepszą prognozą tej zmiennej jest:
t
p
t
t
y
y
1
|
;
)
1
,...,
2
,
1
(
T
t
. (2.46)
W tym przypadku wyprzedzenie czasowe prognozy wynosi
)
1
(
j
. Błędem prognozy ex post
jest:
1
1
1
1
1
t
t
t
p
t
t
t
p
t
y
y
y
y
|
. (2.47)
Ponieważ wariancja składnika zakłócającego wynosi
2
2
)
(
t
E
, zatem wariancja błędu
prognozy z wyprzedzeniem jednego okresu wynosi:
2
2
1
2
1
)
(
)
(
|
t
p
t
t
E
E
. (2.48)
Można powiedzieć, że wariancja składnika zakłócającego jest minimalnym średnim
kwadratowym błędem, jaki można popełnić prognozując zmienną
1
t
y
, jeśli ta zmienna jest generowana
przez model błądzenia przypadkowego. Zastosowanie jakiejkolwiek innej metody prognozowania nie
powinno przynieść prognoz o średnim kwadratowym błędzie mniejszym niż
2
. W takim przypadku
18
Założenie to może być testowane przy pomocy statystyki Ljunga –Boxa.
19
To czy dany szereg czasowy jest generowany przez proces błądzenia przypadkowego jest przedmiotem
wnioskowania statystycznego. Najbardziej znanym testem jest test Dickey-Fullera. Przegląd problemów z tym
związanych można znaleźć w książce: G.S.Maddala, Introduction to econometrics, MacMillan Publishing
Company, New York 1992, str. 580-588. Z uwagi na charakter wykładu nie rozwijamy szerzej tej problematyki.
20
Szereg czasowy, którego wyrazy są generowane przez proces błądzenia przypadkowego jest niestacjonarny,
gdyż wariancja, autokowariancje (
j
) i współczynniki autokorelacji (
j
) dla takiego szeregu są zmienne w
czasie.
Możemy pokazać, że
0
y
Ey
t
;
2
2
0
2
t
y
y
E
t
y
)
(
;
2
0
0
)
(
)
)(
(
j
t
y
y
y
y
E
j
t
t
j
;
t
j
t
j
/
)
(
.
Prognozowanie, Tadeusz W.Bołt,
16
nie opłaca się ponosić kosztów na przygotowanie prognoz przy pomocy najbardziej skomplikowanych
metod, gdyż prognozy otrzymane metodą naiwną będą porównywalnie dokładne.
Zauważmy, że na efektywnych rynkach (finansowych i towarowych) ceny dóbr są generowane
przez procesy błądzenia przypadkowego. Zatem na rynkach efektywnych wykorzystywanie specjalnych
metod prognozowania nie przynosi zmniejszenia ryzyka, gdyż rynek efektywny dyskontuje natychmiast
wszystkie informacje, których efekty ,,zawarte są w ostatnio zaobserwowanej cenie’’.
21
Dla metod prognozowania stosowanych w dalszych częściach zajęć obliczać będziemy
współczynnik prognozowalności
)
(
p
j
WPR
, będący ilorazem średniego kwadratowego błędu
rozpatrywanej metody do średniego kwadratowego błędu dla metody bez wygładzania. Definicja tego
współczynnika jest następująca:
)
(bw
MSE
MSE
WPR
p
j
p
j
p
j
(2.49)
gdzie
p
j
MSE
jest średnim kwadratowym błędem dla rozpatrywanej metody prognozowania,
)
(bw
MSE
p
j
jest średnim kwadratowym błędem dla metody bez wygładzania.
Jeśli
1
p
j
WPR
, to analizowana metoda prognozowania jest ,,nie lepsza’’ niż metoda bez wygładzania.
Inną, ale podobną w interpretacji miarą porównawczą, jest współczynnik
2
j
U
Thiela. Ma on
następującą definicję:
j
T
t
j
t
t
j
t
j
T
t
j
t
p
j
t
t
j
t
j
y
y
y
j
T
y
y
y
j
T
U
1
2
1
2
2
1
1
|
(2.50)
W liczniku zapisanego w (2.50) wyrażenia znajduje się suma kwadratów relatywnych (procentowych)
błędów prognoz podzielona przez liczbę prognoz. Jest to odpowiednik
p
j
MSE
znajdującego się w
liczniku wyrażenia (2.49). W mianowniku wzoru (2.50) natomiast znajduje się suma kwadratów
relatywnych błędów prognoz dla metody bez wygładzania, tj odpowiednik
)
(bw
MSE
p
j
ze wzoru
(2.49). Zatem jeśli
1
2
j
U
, to analizowana metoda prognozowania jest ,,nie lepsza’’ od metody bez
wygładzania, natomiast gdy
1
2
j
U
analizowana metoda daje prognozy obarczone średnio mniejszym
relatywnym błędem niż metoda bez wygładzania.
21
Zob. np. E.J.Elton, M.J.Gruber, Nowoczesna teoria portfelowa i analiza papierów wartościowych, WIG Press,
Warszawa 1998, str.497-540.