background image

Prognozowanie, Tadeusz W.Bołt,  

 

2. Błędy prognoz i ich analiza

1

 

 
2.1 Rodzaje błędów prognoz  
      

W  trakcie  poprzedniego  wykładu  stwierdziliśmy,  że  prognozy  ekonomiczne,  z  uwagi  na 

stochastyczny charakter procesów generujących zmienne ekonomiczne, obarczone będą błędami. Błędy 
prognozowania mogą być analizowane ex post i ex ante. 
 
Schemat 2.1 Rodzaje błędów prognoz – kryterium obserwowalności 
 

 

Źródło: opracowanie własne 

 

Błędy  ex  post,  tj.  błędy  zaobserwowane  są  analizowane  przy  pomocy  znanych  narzędzi 

statystyki  opisowej  oraz  statystyki  matematycznej.  Statystyka  opisowa  oferuje  narzędzia  dające 
możliwość  wyznaczenia  miar  położenia  oraz  miar  rozproszenia.  Statystyka  matematyczna  oferuje 
możliwości testowania hipotez statystycznych parametrów rozkładu błędów prognoz. W  konsekwencji 
w  szczególnych  przypadkach  analiza  błędów  ex  post  prowadzi  do  zdefiniowania  poprawek 
prognostycznych, np. poprawek ze względu na obciążenie, czy autokorelację.   

Błędy  ex  ante,  nieobserwowalne  w  chwili  wyznaczania  prognozy,  są  analizowane  drogą  

dedukcyjną.  Określany  jest  ich  rozkład  w  warunkach  przyjętych  założeń  odnośnie  do  modelu 
generującego  obserwacje  zmiennej  prognozowanej.  Parametry  rozkładu  błędu  ex  ante  mogą  być 
oszacowane, nawet w przypadku, gdy błędy ex post nie są zaobserwowane. 

Dla  różnych  celów  definiować  można  błędy  prognoz  w  różny  sposób  i  odnosić  je  do  różnych 

okresów/przedziałów czasu. Stąd też istnieje potrzeba klasyfikacji błędów prognoz. 

Ze  względu na sposób  definiowania, błędy prognozy,  zarówno  ex post jak  i  ex ante, podzielić 

można na dwa rodzaje: 

 

błędy  bezwzględne,  wyznaczone  jako  różnice,  bądź  kwadraty  różnic  między  zmienną 
prognozowaną a prognozą, wyrażone w jednostkach tej zmiennej, 

 

błędy  względne,  wyrażone  jako  stosunki  błędów  bezwzględnych  do  wartości  prognoz, 
wyrażone zwykle w procentach. 

Błędy  bezwzględne,  ponieważ  wyrażone  są  w  jednostkach  zmiennej  prognozowanej,  nie  mogą 

służyć do porównywania dokładności prognozowania różnych zmiennych. Błędy względne nie zależą od 
jednostek w jakich zmienne prognozowane są wyrażone. Mogą zatem służyć do celów porównawczych.  
 
 
 
 
 
 

                                                

1

  Materiał  dydaktyczny  do  wykorzystania  przez  studentów  uczestniczących  w  wykładach  z  Prognozowania, 

prowadzonych przez Tadeusza W. Bołta. 

Błędy  

prognoz 

 

Ex ante 

 

Ex post 

Błędy prognoz 

wygasłych 

Błędy prognozy 

będących wynikiem 

eksperymentów  

prognostycznych 

background image

Prognozowanie, Tadeusz W.Bołt,  

 

 
 
 
Schemat 2.2 Rodzaje błędów prognoz – kryterium sposobu definiowania  
 

 

 

 Źródło: opracowanie własne 

 
 

2.2 Analiza błędów prognoz ex post 
 

Przejdźmy  obecnie  do  analizy  błędów  prognoz  ex  post,  a  więc  błędów,  które  zostały 

zaobserwowane  w  pewnym  przedziale  czasu  w  przeszłości,  zwanym  przedziałem  empirycznej 
weryfikacji prognozy. W przedziale tym zastosowano wybraną metodę prognozowania do wyznaczenia 
prognoz zmiennej 

j

t

y

 z wyprzedzeniem 

j

 okresów, co oznacza, że prognozy  wyznaczone  zostały  w 

każdym  z  okresów 

t

  na  okresy 

)

(

j

t

.  Zatem  zarówno  prognozy  jak  i  błędy  prognoz  będą  odrębnie 

analizowane dla różnych wyprzedzeń czasowych. W ogólnym przypadku można przypuszczać, że wraz 
ze wzrostem wyprzedzenia czasowego dokładności prognoz powinny być coraz mniej dokładne.  

Schemat  2.3  ukazuje  rodzaje  błędów  prognoz  ex  post  klasyfikowane  według  kryterium 

okresu/przedziału  czasu  dla  którego  są  wyznaczane.  Zgodnie  z  tym  kryterium  wyróżniamy:  błędy 
danego (indywidualnego) okresu czasu, błędy skumulowane oraz błędy średnie. 
 
Schemat 2.3 Rodzaje błędów prognoz – kryterium okresu, którego dotyczą 

 

 

 

        Źródło: opracowanie własne 

 

Zarówno błędy bezwzględne  jak i  względne są obliczane dla każdego  okresu, na który została 

wyznaczona  prognoza.  Można  powiedzieć,  że  jeśli  metoda  prognozowania  jest  dobrze  dobrana  wtedy 
błędy  prognoz  ex  post  powinny  oscylować  wokół  zera.  Pierwszą  zatem  metodą  analizy  błędów 
prognoz  ex  post  jest  wstępna  analiza  szeregu  czasowego  błędów,  w  szczególności  analiza  wykresów 
błędów prognoz na osi czasu. Taka wstępna analiza pozwala na ocenę:  

 

czy błędy prognoz oscylują wokół zera, 

Błędy 

prognoz 

Błędy  

bezwzględne 

Błędy 

względne 

Błędy 

prognoz 

Błędy prognoz  
danego okresu 

Błędy 

skumulowane/ 

błędy średnie 

background image

Prognozowanie, Tadeusz W.Bołt,  

 

 

czy występują nietypowe co do wielkości błędy prognoz. 

Analiza wstępna nie jest jednak wystarczająca. Trudno jest bowiem na jej podstawie precyzyjnie 

określić charakter zmian błędów prognoz w czasie, w szczególności określić parametry rozkładu błędów 
prognoz.  Można  powiedzieć,  że  do  statystycznej  analizy  błędów  prognoz  ex  post  wykorzystać  można 
wszystkie  narzędzia  oferowane  przez  statystykę  opisową  oraz  statystykę  matematyczną,  szczególnie 
wtedy, gdy ciąg zaobserwowanych błędów prognoz ex post jest relatywnie długi. 

Przejdźmy obecnie do zdefiniowania podstawowych błędów bezwzględnych i względnych. 

       

Błąd  prognozy  ex  post 

)

(

|

p

j

t

t

  (bezwzględny)  jest  definiowany  jako  różnica  między  zmienną 

prognozowaną  

)

(

j

t

y

, zaobserwowaną w tym okresie, a prognozą tej zmiennej 

)

(

|

p

j

t

t

y

, wyznaczoną w 

okresie 

t

, na okres 

)

(

j

t

 

p

j

t

t

j

t

p

j

t

t

y

y

|

|

,  

,...)

2

,

1

;

,...,

1

(

j

j

T

t

                                                                             (2.1) 

 
gdzie 

t

 jest kolejnym okresem próby historycznej, 

T

 oznacza liczebność próby historycznej,  natomiast 

j

  oznacza  realne  wyprzedzenie  czasowe  prognozy.    Błąd  prognozy  jest  wyrażony  w  takich  samych 

jednostkach  jak  zmienna  prognozowana.  Jeśli  zmienną  prognozowaną    jest  indeks  zmian  lub  stopa 
zmian, wyrażone w procentach, wtedy błąd prognozy jest również wyrażony w procentach. 

Realizacje błędów prognoz 

p

j

t

t

|

 mogą być  dodanie, jeśli prognozy  niedoszacowują  realizacje 

zmiennej prognozowanej, ujemne  jeśli prognozy przeszacowują realizacje zmiennej prognozowanej.  W 
szczególnym przypadku realizacją błędu prognozy ex post może być liczba zero,  jeśli 

p

j

t

t

j

t

y

y

|

      

Możemy  zatem  powiedzieć,  że  dysponując  szeregiem 

T

  obserwacji  historycznych    oraz 

wyznaczając  prognozy  na  kolejne  okresy 

}

),...,

2

(

),

1

{(

T

j

j

,  otrzymamy  ciąg  liczący 

)

(

j

T

 

prognoz i odpowiadających im błędów prognoz. 
      

Absolutny  błąd  prognozy  ex  post 

|)

(|

|

p

j

t

t

  jest  definiowany  jako  wartość  bezwzględna  błędu 

bezwzględnego: 
 

|

|

|

|

|

|

p

j

t

t

j

t

p

j

t

t

y

y

,...)

2

,

1

;

,...,

1

(

j

j

T

t

.                                                                         (2.2) 

 
      

Absolutny błąd prognozy przyjmuje zatem wartości nieujemne i jest wykorzystywany do oceny 

rzędu odchyleń zmiennej prognozowanej od prognozy. 
      

Podobne znaczenie posiadają kwadratowe błędy prognozy ex post, definiowane jako: 

 

2

2

)

(

)

(

|

|

p

j

t

t

j

t

p

j

t

t

y

y

,  

,...)

2

,

1

;

,...,

1

(

j

j

T

t

.                                                                   (2.3) 

 
     

Błędy  kwadratowe  przyjmują  wartości  nieujemne.  Są  wyznaczane  i  analizowane  w  celu 

umożliwienia wstępnej oceny, czy wariancja błędu prognozy jest stała, czy zmienia się w czasie.  
      

Procentowy,  względny  błąd  prognozy  ex  post 

)

(

|

p

j

t

t

PE

2

  definiujemy  jako  procentowy  udział 

bezwzględnego  błędu prognozy w wartości prognozy

3

 

                                                

2

 W literaturze przedmiotu wykorzystuje się dwa rodzaje oznaczeń błędów prognoz: pierwszy, stosowany w trakcie 

wykładów,  zawiera  literkę 

E

  od  angielskiego  ,,error’’,  drugi  natomiast  zawieram  literkę 

D

,  od  angielskiego 

,,deviation’’.  Na przykład dla oznaczenia średniego kwadratowego  błędu prognozy stosuje się dwa  oznaczenia: 

MSE

 (Mean Squared Error) lub 

MSD

 (Mean Squared Deviation). 

3

 Alternatywną definicją tego błędu jest: 

100

j

t

p

j

t

t

p

j

t

t

y

APE

|

|

, określający procentowy udział błędu prognozy 

w zaobserwowanej wartości zmiennej prognozowanej. 

background image

Prognozowanie, Tadeusz W.Bołt,  

 

100

p

j

t

t

p

j

t

t

p

j

t

t

y

PE

|

|

|

,  

,...)

2

,

1

;

,...,

1

(

j

j

T

t

.                                                                             (2.4) 

     
      

Błąd  ten  określa  jaki  procent  wartości  prognozy  w  danym  okresie  czasu  stanowił  błąd  tej 

prognozy.  Podobnie  jak  błąd  bezwzględny  błąd  względny  może  przyjmować  wartości  ze  zbioru  liczb 
rzeczywistych. 
      

Błąd ten obliczamy wtedy, gdy zmienna prognozowana jest wyrażona w innych jednostkach niż 

procenty. 

      

Absolutny  procentowy,  względny  błąd  prognozy  ex  post 

)

(

|

p

j

t

t

APE

  jest  definiowany  jako 

wartość bezwzględna błędu procentowego: 
 

100

p

j

t

t

p

j

t

t

p

j

t

t

y

APE

|

|

|

,...)

2

,

1

;

,...,

1

(

j

j

T

t

.                                                                          (2.5) 

 
     

Podobnie  jak  absolutny  błąd  prognozy,  omawiany  błąd  prognozy  może  przyjmować  wartości 

nieujemne.  Błąd  ten  wykorzystamy  do  oceny  dopuszczalności  prognoz  ex  post.  Zakładając,  że 
satysfakcjonuje  nas  dokładność  prognozowania  nie  mniejsza  niż 

%

a

  przyjmiemy  następującą  regułę 

decyzyjną: 

 

prognozę  dla  której

a

APE

p

j

t

t

|

,    nazywać  będziemy  prognozą  dopuszczalną 

(wystarczająco dokładną), 

 

prognozę dla której

a

APE

p

j

t

t

|

,  nazywać będziemy prognozą niedopuszczalną. 

     

Wybór  liczby 

a

  powinien  uwzględniać  rodzaj  szeregu  czasowego  zmiennej  prognozowanej, 

wyprzedzenie  czasowe  prognozy  oraz  cel  dla  którego  prognoza  jest  wyznaczana.  W  przypadku 
szeregów  czasowych  o  wysokiej  częstotliwości,  przyjęte  kryterium  prognozy  dopuszczalnej  może  być 
mniej  rygorystyczne  (

a

  może  być  większe),  inaczej  niż  w  przypadku  danych  rocznych.  Mniej 

rygorystyczne  kryterium  dopuszczalności  prognozy  możemy  zaakceptować  dla  prognoz  z  większym 
wyprzedzeniem czasowym. Również mniej rygorystyczne kryterium dopuszczalności można przyjąć w 
przypadku,  gdy  prognozy  nie  są  wykorzystywane  do  podejmowania  bieżących  decyzji  operacyjnych, 
bardziej rygorystycznie  natomiast powinny być  oceniane prognozy  wykorzystywane  do podejmowania 
bieżących decyzji gospodarczych. 
     

Drugą  grupę  błędów  stanowią  błędy  skumulowane.  Są  one  definiowane  jako  cząstkowe  sumy 

błędów  prognoz  liczonych  dla  kolejnych  indywidualnych  okresów  czasu.  W  trakcie  wykładów 
rozpatrywać  będziemy  skumulowane  błędy  bezwzględne  oraz  procentowe  (względne).  Błędy 
skumulowane  pokazują  ,,ewolucję  procesu  prognozowania’’  w  okresie  próby.    Wszystkie  błędy 
skumulowane można traktować jako bezpośrednie lub pośrednie miary obciążenia błędów prognozy.  
     

Skumulowane, cząstkowe błędy prognozy ex post 

)

(

,

p

j

s

CE

 definiowane są  jako

4

 

s

t

p

j

t

t

p

j

s

CE

1

|

,

,...}

2

,

1

;

),...,

2

(

),

1

(

{

j

T

j

j

s

,                                                              (2.6) 

 
tzn.  jako  cząstkowe  sumy  bezwzględnych  błędów  prognoz    lub  w  odniesieniu  do  względnych  błędów 
procentowych jako: 
 

s

t

j

t

t

p

j

s

PE

CPE

1

|

,

,...}

2

,

1

;

),...,

2

(

),

1

(

{

j

T

j

j

s

.                                                        (2.7) 

                                                

4

 W literaturze przedmiotu niekiedy skumulowane błędy oznaczane są jako CUSUM (Cumulative Sum), natomiast 

skumulowane błędy kwadratowe jako CUSUMSQ (Cumulative Sum of Squares). Zob. np.  R.L.Brown, J.Durbin, 
J.M.Evans, Techniques for testing the constancy of regression relations over time (with discussion), Journal of the 
Royal Statistical Society B, vol. 37, str. 149-192. 

background image

Prognozowanie, Tadeusz W.Bołt,  

 

      

Skumulowane  cząstkowe  błędy  prognoz  pokazują,  czy  wykorzystywana  metoda  ma  tendencję 

do przeszacowania/niedoszacowania realizacji zmiennej prognozowanej.  
      

Miarą  obciążenia  błędu  prognozy  dla  całej  próby  jest  średnia  arytmetyczna  bezwzględnych 

błędów prognoz 

)

(

p

j

p

j

ME

, definiowana jako: 

 

p

j

j

T

t

p

j

t

t

p

j

y

y

j

T

ME

1

1

|

,  

,...)

2

,

1

(

j

,                                                                              (2.8) 

 

gdzie: 

j

T

t

j

t

y

j

T

y

1

1

  jest  średnią  arytmetyczną  zmiennej  prognozowanej,  natomiast 

j

T

t

p

j

t

t

p

j

y

j

T

y

1

1

|

 jest średnią prognoz z wyprzedzeniem 

j

 okresów. 

 
      

Miarą  obciążenia,  liczoną  w  oparciu  o  błędy  względne,  jest  średnia  arytmetyczna  błędów 

względnych 

)

(

p

j

MPE

:   

 

j

T

t

p

j

t

t

p

j

PE

j

T

MPE

1

1

|

,...)

2

,

1

;

,...,

1

(

j

j

T

t

.                                                              (2.9) 

 

     

Średni absolutny błąd prognozy  

)

(

p

j

MAE

 jest definiowany jako średnia arytmetyczna błędów 

absolutnych: 
 

j

T

t

p

j

t

t

p

j

j

T

MAE

1

1

|

|

|

,...)

2

,

1

(

j

.                                                                                      (2.10) 

 

      

Średni  absolutny  procentowy,  względny  błąd  prognozy  ex  post 

)

(

p

j

MAPE

  jest  definiowany 

jako średnia arytmetyczna procentowych błędów prognozy: 
 

100

1

1

j

T

t

p

j

t

t

p

j

t

t

p

j

y

j

T

MAPE

|

|

,...)

2

,

1

;

,...,

1

(

j

j

T

t

.                                                     (2.11) 

 

      

Średnie  błędy  absolutne 

p

j

MAE

  oraz 

p

j

MAPE

  nie  są  miarami  obciążenia  (przyjmują  tylko 

wartości nieujemne). Należy je traktować jako miary rozproszenia. 
      

Przejdźmy obecnie do klasycznych miar rozproszenia (zmienności) błędów prognoz.     

      

Średni  kwadratowy  błąd  prognozy   

)

(

p

j

MSE

  definiować  będziemy  jako  średnie  kwadratowe 

odchylenie  zmiennej  prognozowanej  od  prognozy  tej  zmiennej  lub  ekwiwalentnie  jako  średnie 
kwadratowe odchylenie błędu prognozy z wyprzedzeniem 

j

 okresów od zera. Możemy zatem zapisać, 

że

5

                                                

5

  Alternatywnym średniego stosunku do (2.21) sposobem definiowania średniego kwadratowego błędu prognozy 

jest: 

j

T

t

p

j

t

t

p

j

j

T

MSE

1

2

1

)

(

|

.    Dla  dużych  prób  oba  sposoby  dają  w  przybliżeniu  takie  same  wyniki. 

Pierwszy  z  nich  może  być  traktowany  jako  nieobciążony  estymator  odpowiedniego  parametru  rozkładu  błędu 
prognozy,  drugi  natomiast  jako  obciążony,  ale  zgodny  estymator  największej  wiarygodności.  Zob.  np.  H.Theil, 
Zasady ekonometrii, PWN, Warszawa 1979, str. 111-112. Ten drugi wykorzystywać będziemy w prezentowanych 
w następnych częściach dekompozycjach Theila.  

background image

Prognozowanie, Tadeusz W.Bołt,  

 

 

j

T

t

p

j

t

t

p

j

j

T

MSE

1

2

1

1

)

(

|

,   

,...)

2

,

1

(

j

.                                                                             (2.12) 

 
       

Warto  w  tym  miejscu  wyjaśnić  różnicę  pomiędzy  średnim  kwadratowym  błędem  prognozy 

)

(

p

j

MSE

 a wariancją błędu prognozy 

)

(

ˆ

2

p

j

. Prawdziwa jest równość:

6

 

 

2

2

1

2

1

1

1

)

(

)

(

ˆ

)

(

|

p

j

p

j

j

T

t

p

j

p

j

p

j

t

t

p

j

j

T

j

T

j

T

MSE

,                                  (2.13) 

 

gdzie: 

j

T

t

p

j

p

j

t

t

p

j

j

T

1

2

2

1

1

)

(

)

(

ˆ

|

 jest wariancją błędu prognozy ex post.  

 
      

Można  zatem  stwierdzić,  że  średni  kwadratowy  błąd  prognozy  jest  sumą  wariancji  błędu 

prognozy  oraz  kwadratu  obciążenia  prognozy.  Jeżeli  obciążenie  prognozy  jest  równe  zero 

0

p

j

wtedy: 
 

)

(

ˆ

2

p

j

p

j

MSE

.                                                                                                                               (2.14) 

 
     

Różnica w interpretacji obu miar zmienności wynika z przyjęcia różnych punktów odniesienia. 

W  przypadku  średniego  kwadratowego  błędu  prognozy,  punktem  odniesienia  jest  zero,  natomiast  w 
przypadku wariancji jest nim średnia wartość błędów prognoz (obciążenie). 
     

Średni błąd prognozy  

)

(

p

j

RMSE

 wyznaczać natomiast będziemy jako pierwiastek kwadratowy 

ze średniego kwadratowego odchylenia: 
 

j

T

t

p

j

t

t

p

j

p

j

j

T

MSE

RMSE

1

2

1

1

)

(

|

                                                                             (2.15) 

 
i  interpretować  jako  przeciętne  in  plus  in  minus  odchylenie  błędu  prognozy  od  zera  lub 
ekwiwalentnie jako  przeciętne  in  plus in  minus odchylenie  zmiennej prognozowanej od  prognozy 
tej zmiennej

                                                

6

  Prawdziwy jest następujący ciąg przekształceń tożsamościowych: 

 

.

)

(

)

(

)

(

)

(

|

|

|

j

T

t

p

j

p

j

p

j

t

t

j

T

t

p

j

j

T

t

p

j

p

j

t

t

j

T

t

p

j

p

j

p

j

t

t

p

j

j

T

j

T

j

T

j

T

MSE

1

1

2

1

2

1

2

1

2

1

1

1

1

1

1

Drugi  składnik  sumy  można  zapisać  następująco: 

2

1

2

1

1

1

)

(

)

(

p

j

j

T

t

p

j

j

T

j

T

j

T

.    Dla  dużej 

liczebności próby 

1

1

j

T

j

T

  i    przybliżenie  (2.13)  jest  bardzo  dokładne, np.  dla 

30

)

(

j

T

  iloraz  ten 

wynosi 

034

,

1

. Trzeci składnik tej równości zeruje się, gdyż suma odchyleń od średniej jest równa zeru: 

j

T

t

p

j

p

j

t

t

p

j

j

T

t

p

j

p

j

p

j

t

t

j

T

j

T

1

1

0

1

2

1

2

)

(

)

(

|

|

, co prowadzi do  wyniku zapisanego  w 

równaniu (2.13). 

background image

Prognozowanie, Tadeusz W.Bołt,  

 

     

Jest  oczywiste,  że  wyznaczyć  można  również  odchylenie  standardowe  błędu  prognozy  jako 

pierwiastek z wariancji, zgodnie z: 
 

)

(

ˆ

)

(

ˆ

2

p

j

p

j

.                                                                                                                           (2.16) 

 
     

Odchylenie standardowe błędu prognozy  definiuje przeciętne in plus in minus odchylenie błędu 

prognozy od średniej wartości tego błędu (obciążenia). Widać zatem wyraźnie, że jeśli obciążenie błędu 
prognozy jest zerowe wtedy obie miary zmienności równają się.     
     

Dla  oceny  relatywnej  dokładności  prognozowania  można  obliczyć  dodatkowo  przeciętny 

względny błąd prognozy 

)

(

p

j

V

 zdefiniowany jako

7

 

100

p

j

p

j

p

j

y

RMSE

V

.                                                                                                                            (2.17) 

 
      

Błąd ten określa procentowy udział średniego błędu prognozy w średniej wartości prognoz 

z wyprzedzeniem 

j

 okresów. 

     

Wprowadzimy  obecnie  współczynnik  dokładności  prognoz  ex  post,  związany  z  pojęciem 

prognozy  dopuszczalnej.  Oznaczmy  przez 

p

j

WS

  współczynnik  sprawdzalności  prognoz,  który 

zdefiniujemy jako: 
 

100

j

T

l

WS

dop

p

j

                                                                                                                               (2.18) 

 

gdzie: 

dop

l

 oznacza liczbę prognoz dopuszczalnych (tj. spełniających 

a

APE

p

j

t

t

|

), natomiast 

)

(

j

T

 

oznacza  liczbę  wszystkich  prognoz  ex  post.  Współczynnik 

p

j

WS

  oznacza  zatem  jaki  procent 

wszystkich prognoz stanowiły prognozy dopuszczalne. Jest oczywiste, że współczynnik ten przybiera 
wartości z przedziału 

100

;

0

      

Wprowadzimy ponadto kolejny współczynnik dokładności prognoz ex post, związany z jakością 

prognozowania zmian kierunków realizacji zmiennej prognozowanej. Rozważymy dwa przypadki: 

 

pierwszy,  gdy  zmienna  prognozowana  przyjmuje  wartości  nieujemne,  tzn.  jest  wyrażona  w 
jednostkach naturalnych lub jest indeksem procentowym, 

 

drugi, gdy zmienna prognozowana może przyjmować wartości rzeczywiste, tzn. jest procentową 
stopą zmian wyrażoną w procentach lub jest przyrostem wyrażonym w jednostkach naturalnych.  

      

W pierwszym przypadku obliczymy pierwsze przyrosty zmiennej prognozowanej oraz pierwsze 

przyrosty prognoz tej zmiennej. Następnie obliczymy liczbę przypadków, w których przyrosty zmiennej 
prognozowanej mają takie same znaki jak przyrosty prognoz. Liczbę tę oznaczymy 

zgodne

l

      

W  przypadku  drugim  obliczmy  liczbę  przypadków,  w  których  realizacje  zmiennej 

prognozowanej mają taki sam znak jak prognozy. Liczbę tę oznaczymy 

zgodne

l

      

Współczynnik  poprawności 

)

(

p

j

WP

przepowiadania  kierunków  zmian  definiujemy  jako 

procentową frakcję liczby prognoz zgodnych (w sensie znaków) w ogólnej liczbie prognoz (lub ich 
przyrostów), co zapiszemy: 
 

                                                

7

 Alternatywną formą tego współczynnika jest:  

100

y

RMSE

V

p

j

p

j

, określający procentowy udział średniego 

błędu prognozy w średniej wartości zmiennej prognozowanej. 

background image

Prognozowanie, Tadeusz W.Bołt,  

 

100

j

T

l

WP

zgodne

p

j

.                                                                                                                                (2.18) 

 
      

Jest oczywiste, że również ten współczynnik przybiera wartości z przedziału 

100

;

0

      

Inną  miarą  zgodności  kierunków  realizacji  zmiennej  prognozowanej  i  prognoz  jest 

współczynnik korelacji liniowej Pearsona, definiowany jako: 
 

)

(

ˆ

)

(

ˆ

)

,

(

ˆ

,

p
j

p
j

y

y

y

y

y

y

r

p
j

                                                                                                                            (2.19) 

 

gdzie: 

j

T

t

j

t

y

y

j

T

y

1

2

2

)

(

1

1

)

(

ˆ

 

jest 

wariancją 

zmiennej 

prognozowanej, 

)

(

ˆ

)

(

ˆ

2

y

y

j

T

t

p

j

p

j

t

t

p
j

y

y

j

T

y

1

2

2

1

1

)

(

)

(

ˆ

|

jest 

wariancją 

prognoz, 

)

(

ˆ

)

(

ˆ

2

p
j

p
j

y

y

j

T

t

p

j

p

j

t

t

j

t

p

j

y

y

y

y

j

T

y

y

1

1

1

)

)(

(

)

,

(

ˆ

|

-  jest  kowariancją  pomiędzy 

zmienną prognozowaną a prognozą tej zmiennej. 
      

Współczynnik ten przybiera wartości z przedziału  

1

1

p
j

y

y

r

,

. Bliskie jedności wartości tego 

współczynnika,  świadczą  o  zgodności  kierunków  zmian  realizacji  zmiennej  prognozowanej  z  ich 
prognozami. 

      

Dysponując oszacowaniem obciążenia błędów prognoz 

p

j

ME

 oraz odchyleniem standardowego  

)

(

ˆ

p

j

 możemy testować hipotezę dotyczącą istotności obciążenia. Odpowiednie hipotezy statystyczne 

zapiszemy w następujący sposób:

 8

 

 

0

0

p

j

t

t

E

H

|

:

0

p

j

t

t

A

E

H

|

:

.                                                                                              (2.20)                                                                                                                                

 
      

Jeżeli błędy prognoz mają rozkłady normalne, to odpowiednią statystyką testu jest

9

 

)

(

~

)

(

)

(

ˆ

1

0

j

T

p

j

p

j

t

j

T

t

                                                                                                       (2.21) 

 
o  rozkładzie  t-Studenta  i 

)

1

(

j

T

  stopniach  swobody.  Duże  co  do  modułu  wartości  statystyki 

t

 

upoważniają  do  odrzucenia  hipotezy  zerowej,  małe  natomiast  nie  dają  podstaw  do  jej  odrzucenia.  W 
szczególności  dla  przyjętego  ryzyka  wnioskowania  (poziomu  istotności 

)  regułami  podejmowania 

decyzji są: 

                                                

8

 

Możemy  oczywiście  weryfikować  hipotezy  jednostronne.  W  przypadku  układu  zdań 

0

0

p

j

t

t

E

H

|

:

0

p

j

t

t

A

E

H

|

:

  hipoteza  zerowa  jest  odrzucana  na  korzyść  hipotezy  alternatywnej,  która  stwierdza,  że 

występuje istotne nieoszacowanie prognoz. W przypadku układu zdań 

0

0

p

j

t

t

E

H

|

:

0

p

j

t

t

A

E

H

|

:

 

hipoteza  zerowa  jest  odrzucana  na  korzyść  hipotezy  alternatywnej,  która  stwierdza,  że  występuje  istotne 
przeszacowanie prognoz.  

9

 Zob. np. J.Jóźwiak, J.Podgórski, Statystyka opisowa od podstaw, PWE, Warszawa 1997, str. 245. 

background image

Prognozowanie, Tadeusz W.Bołt,  

 

 

jeżeli 

t

t

|

|

  -  podejmujemy  decyzję  o  braku  podstaw  do  odrzucenia  hipotezy  zerowej,  

stwierdzamy  zatem,  że  obciążenie  błędów  prognoz  z  wyprzedzeniem 

j

  okresów  statystycznie 

nieistotnie różni się od zera, 

 

jeżeli 

t

t

|

|

  -  podejmujemy  decyzję  o  odrzuceniu  hipotezy  zerowej  na  rzecz  hipotezy 

alternatywnej, stwierdzamy zatem, że obciążenie błędów prognoz z wyprzedzeniem 

j

 okresów 

statystycznie istotnie różni się od zera.  

       

Jeśli  obciążenie  błędów  prognoz  jest  statystycznie  istotnie  różne  od  zera  można  zdefiniować 

prognozę skorygowaną 

)

~

(

|

p

j

t

t

y

 ze względu na obciążenie. Można w takim przypadku zapisać, że: 

 

p

j

p

j

t

t

p

j

t

t

y

y

|

|

~

.                                                                                                                             (2.22) 

 
 
2.3  Diagram prognostyczny i linia prognoz dokładnych 
 
      

Diagramem  prognostycznym  nazywać  będziemy  wykres  zależności  pomiędzy  zmienną 

prognozowaną  a  jej  prognozami  (dla  zadanego  wyprzedzenia  czasowego  prognozy).  Rysunek  2.1 
przedstawia  diagram  prognostyczny  w  którym  na  osi  rzędnych  zaznaczono  wartości  prognoz  z 
wyprzedzeniem 

)

1

(

j

,  natomiast  na  osi  odciętych  zaznaczono  wartości  zmiennej  prognozowanej. 

Dane dotyczą kwartalnej stopy inflacji w Polsce i będą wykorzystywane w trakcie wykładów. 
 

 
 
 

 

 
 
 
 
 
 
 

                                                   Źródło: opracowanie własne 

Rysunek 2.2 Diagram prognostyczny - 

linia prognoz dokładnych

p

j

t

y

 

                                                  Źródło: opracowanie własne 

Rysunek 2.1 Diagram prognostyczny

-2

-1

0

1

2

3

4

-2

0

2

4

p

t

y

1

1

t

y

background image

Prognozowanie, Tadeusz W.Bołt,  

 

10 

Rysunek 2.3 Diagram  prognostyczny

-2

0

2

4

-2

0

2

4

 

                                                 Źródło: opracowanie własne 

 
      

Jak  widać  z  rysunku  2.1  realizacje  zmiennej  prognozowanej  i  prognoz  nie  pokrywają  się,  tzn. 

występują  niezerowe  błędy  prognoz.  Tym  nie  mniej  realizacje  te  skupione  są  wokół  pewnej  prostej. 
Gdyby prognozy nie były obarczone błędami, realizacje zmiennej prognozowanej i prognoz leżałyby na 
,,linii  prognoz dokładnych’’, którą zamieszczono  na  rysunku 2.2. Linia ta przechodzi przez początek 
układu  współrzędnych.  Niestety  jednak,  jak  pokazuje  rysunek  2.3,  empiryczna  liniowa  zależność 
pomiędzy zmienną prognozowana a prognozami tej zmiennej odbiega od linii prognoz dokładnych. 
      

Rozważmy  liniową zależność pomiędzy zmienną prognozowaną a prognozą, zapisaną jako: 

 

j

t

p

j

t

t

j

j

j

t

y

b

a

y

|

,  

,...)

2

,

1

;

,...,

1

(

j

j

T

t

                                                                 (2.23) 

 
gdzie:  

j

a

j

b

 parametry, 

j

t

 - składnik zakłócający, o którym zakładamy, że jest generowany przez 

proces czysto losowy. Zakładamy zatem, że 

0

j

t

E

2

2

)

(

j

t

E

s

j

E

s

t

j

t

;

0

.  

            Oszacowaniami MNK parametrów tego modelu są

10

 

p

j

j

j

y

b

y

a

ˆ

ˆ

,                                                                                                                                    (2.24) 

 

)

(

ˆ

)

(

ˆ

)

(

ˆ

)

,

(

ˆ

ˆ

,

2

p
j

y

y

p
j

p
j

j

y

y

r

y

y

y

b

p
j

.                                                                                                           (2.25) 

 
      

Wariancje błędów ocen parametrów 

j

a

j

b

 znajdziemy w następujący sposób

11

 

j

T

t

p

j

p

j

t

t

j

y

y

b

1

2

2

2

)

(

ˆ

)

ˆ

(

ˆ

|

,                                                                                                          (2.26) 

 



1

1

2

1

2

2

2

T

t

p

j

p

j

t

t

j

T

t

p

j

t

t

j

y

y

j

T

y

a

)

(

)

(

)

(

ˆ

)

ˆ

(

ˆ

|

|

                                                                                      (2.27) 

 

                                                

10

  W  sprawie  klasycznej  metody  najmniejszych  kwadratów  zob.  np.  H.Theil,  Zasady  ekonometrii,  PWN, 

Warszawa 1979, str. 56-60 oraz str.121-164.  Zobacz też  T.W. Bołt, Wykłady z ekonometrii, 

www.wzr.pl

 .  

11

 Zobacz. np. H.Theil, Zasady ekonometrii, PWN, Warszawa 1979, str.124-125. Zobacz też  T.W. Bołt, Wykłady 

z ekonometrii,  www.wzr.pl 

background image

Prognozowanie, Tadeusz W.Bołt,  

 

11 

gdzie 

j

T

t

j

t

j

T

1

2

2

ˆ

2

1

ˆ

 jest wariancją reszt  w  modelu (2.23), przy czym  

j

t

j

t

j

t

y

y

ˆ

ˆ

natomiast wartość teoretyczna zmiennej prognozowanej 

)

ˆ

(

j

t

y

, jest wyznaczona jako: 

 

p

j

t

t

j

j

j

t

y

b

a

y

|

ˆ

ˆ

ˆ

,...)

2

,

1

;

,...,

1

(

j

j

T

t

.                                                                            (2.28) 

 
      

Dysponując oszacowaniami MNK parametrów 

j

a

j

b

  możemy testować następujące hipotezy 

statystyczne dotyczące linii prognoz dokładnych

12

 

0

:

0

j

a

H

;  

0

:

j

A

a

H

                                                                                                            (2.29) 

 

1

:

0

j

b

H

;  

1

:

j

A

b

H

.                                                                                                              (2.30) 

 

      

Oznaczmy  oszacowania  MNK  parametrów 

j

a

j

b

  jako: 

j

aˆ

j

bˆ

,  natomiast  ich  średnie  błędy 

jako: 

)

ˆ

(

ˆ

j

a

)

ˆ

(

ˆ

j

b

. Odpowiednie statystyki t-Studenta mają postacie

13

 

)

ˆ

(

ˆ

0

ˆ

j

j

a

a

a

t

j

;  

)

ˆ

(

ˆ

1

ˆ

j

j

b

b

b

t

j

.                                                                                                               (2.31) 

 
       

Jeśli błędy prognoz mają rozkłady normalne wtedy statystyki 

j

a

t

,   

j

b

t

 mają rozkłady t-Studenta 

)

2

(

j

T

  stopniach  swobody.  Duże  co  do  modułu  wartości  statystyk 

j

a

t

;   

j

b

t

  uprawniają  do 

odrzucenia hipotez zerowych  na korzyść  hipotez alternatywnych,  małe zaś na przemawiają na korzyść 
hipotez  zerowych.  W  szczególności  dla  akceptowanego  poziomu  ryzyka 

  reguły  podejmowania 

decyzji są następujące: 

 

jeżeli 

t

t

j

a

|

|

,   

t

t

j

b

|

|

-  podejmujemy  decyzję  o  braku  podstaw  do  odrzucenia  hipotez 

zerowych,    stwierdzamy  zatem,  empiryczna  linia  (2.23)  statystycznie  nieistotnie  różni  się  od 
linii prognoz dokładnych, 

 

jeżeli 

t

t

j

a

|

|

,   

t

t

j

b

|

|

-  podejmujemy  decyzję  o  odrzuceniu  hipotez  zerowych  na  rzecz 

hipotez alternatywnych,  stwierdzamy zatem, empiryczna linia (2.23) statystycznie istotnie różni 
się od linii prognoz dokładnych. 

      

Współczynnik determinacji 

)

(

2
j

R

 dla liniowej relacji (2.23)  jest definiowany zgodnie z: 

 

2

,

1

2

1

2

2

)

(

)

ˆ

(

p
j

y

y

j

T

t

j

t

j

T

t

j

j

t

j

r

y

y

y

y

R

                                                                                                        (2.32) 

 

Współczynnik ten może być wykorzystywany jako kryterium oceny jakości prognoz.  

 
 
 

                                                

12

 W trakcie wykładu rozpatrywać będziemy tylko indywidualne hipotezy dotyczące parametrów 

j

a

j

b

. Nie jest 

jednak trudno testować obie hipotezy łącznie, korzystając ze statystyk o rozkładzie 

2

 oraz Fishera-Snedecora. 

13

 Zob. np. H.Theil, zasady ekonometrii, PWN, Warszawa 1979, str.  

background image

Prognozowanie, Tadeusz W.Bołt,  

 

12 

2.4 Dekompozycje średniego kwadratowego błędu prognoz Theila

14

 

 
      

Średni  kwadratowy  błąd  prognozy  oraz  średni  błąd  prognozy  są  naturalnymi,  najczęściej 

stosowanymi miernikami dokładności prognoz ex post. Prognozy są tym bardziej dokładne im miary te 
są  bliższe  zeru.  H.  Theilowi  zawdzięczamy  bardziej  szczegółowe  analizy,  zwane  dekompozycjami 
Theila,  które  umożliwiają  określenie  przyczyn  powstawania  błędów  prognoz.  Omówimy  dwie 
dekompozycje średniego kwadratowego błędu prognozy.   
      

Drogą  bezpośredniego  sprawdzenia  wykazać  można,  że  prawdziwa  jest  następująca  równość 

(pierwsza dekompozycja Theila): 
 

2

2

2

2

1

1

2

1

)

(

)

(

ˆ

)

(

ˆ

)

(

)}

(

ˆ

)

(

ˆ

{

)

(

)

(

ˆ

,

p

j

p
j

y

y

p
j

p

j

p

j

p

j

j

T

j

T

y

y

r

y

y

j

T

j

T

MSE

p
j

,                                                  (2.33) 

 
gdzie:  symbole  występujące  po  prawej  stronie  równości  zdefiniowano  w  poprzednich  częściach 
wykładu. 
      

Dzieląc obie strony równości zapisanej wyżej przez 

p

j

MSE

 otrzymamy: 

 

p

j

p

j

p

j

p
j

y

y

p

j

p

j

MSE

j

T

j

T

MSE

y

y

r

MSE

y

y

p
j

2

2

1

1

2

1

)

(

)

(

ˆ

)

(

ˆ

)

(

)}

(

ˆ

)

(

ˆ

{

,

.                                           (2.34) 

 

Wprowadźmy oznaczenia: 

 

p

j

p
j

S
j

MSE

y

y

U

2

)}

(

ˆ

)

(

ˆ

{

,  

p

j

p
j

y

y

C

j

MSE

y

y

r

U

p
j

)

(

ˆ

)

(

ˆ

)

1

(

2

,

p

j

p

j

M
j

MSE

j

T

j

T

U

2

1

)

(

,                 (2.35) 

 

gdzie: 

S
j

U

  nazywać  będziemy  współczynnikiem  udziału  błędów  z  tytułu  wariancji, 

C

j

U

  nazywać 

będziemy  współczynnikiem udziału błędów kierunków tytułu  niezgodności kierunków realizacji, 

M
j

U

 

natomiast nazywać będziemy współczynnikiem udziału błędów z tytułu obciążenia.  
      

Współczynnik 

S
j

U

 określa, jaki jest udział błędów  wynikających różnicy zmienności zmiennej 

prognozowanej i prognoz tej zmiennej w średnim kwadratowym błędzie prognozy.  Duże wartości tego 
współczynnika  wskazują  na  małą  lub  zbyt  dużą  elastyczność  elastyczność  metody  prognozowania, 
zastosowanej  w  badanym  przypadku  prognozowania.  W  przypadku  zbyt  małej  elastyczności  tj. 

)

(

ˆ

)

(

ˆ

p
j

y

y

,    szereg  czasowy  zmiennej  prognozowanej  wykazuje  dużą  zmienność,  natomiast 

metoda  prognozowania  daje  prognozy  wygładzone.  W  przypadku  zbyt  dużej  elastyczności    tj. 

)

(

ˆ

)

(

ˆ

p
j

y

y

  szereg  czasowy  zawiera  regularne  zmiany  (inercyjne),  natomiast  wykorzystana  jest 

metoda prognozowania wrażliwa na zmiany najnowszych obserwacji. Jest oczywiste, że 

0

S
j

U

, jeśli 

)

(

ˆ

)

(

ˆ

p
j

y

y

      

Współczynnik 

C

j

U

  określa,  jaki  jest  udział  błędów  wynikających  z  niezgodności  kierunków 

realizacji zmiennej prognozowanej i prognoz tej zmiennej. Współczynnik ten równa się zero 

0

C

j

U

                                                

14

 Zob. H.Theil, Applied economic forecasting, North-Holland Publishing Company, Amsterdam 1961, str. 25-39. 

background image

Prognozowanie, Tadeusz W.Bołt,  

 

13 

jeśli 

1

,

p
j

y

y

r

.  Im  bardziej  empiryczny  współczynnik  korelacji  odbiegać  będzie  od  jedności,  tym 

większe wartości przyjmować będzie współczynnik 

C

j

U

      

Współczynnik 

M
j

U

  określa,  jaki  jest  udział  błędów  spowodowanych  obciążeniem  prognozy  w 

średnim  kwadratowym  błędzie  prognozy.  Współczynnik  ten  przyjmie  wartość  zero   

0

M
j

U

  jeśli 

0

p

j

,  tzn. 

p

j

y

y

.  Duży  udział  błędów  z  tytułu  obciążenia  wskazuje  na  systematyczne 

przeszacowanie,  bądź  nieoszacowanie  prognoz.  Jest  to  zwykle  sygnałem  do  zmiany  modelu 
prognostycznego, wykorzystywanego w prognozowaniu.  
      

Wszystkie  omawiane  współczynniki są unormowane  w przedziale 

1

;

0

  oraz  sumują  się  do 

jedności: 
 

1

M
j

C

j

S
j

U

U

U

.                                                                                                                           (2.36) 

 
      

Podobnie  jak  w  przypadku  omawianym  wyżej,  również  obecnie,  drogą  bezpośredniego 

sprawdzenia wykazać można, że prawdziwa jest równość (druga dekompozycja Theila): 
 

2

2

2

2

2

2

1

1

1

)

(

)

(

ˆ

)

(

)}

(

ˆ

)

(

ˆ

{

)

(

)

(

ˆ

,

,

p

j

y

y

y

y

p
j

p

j

p

j

p

j

j

T

j

T

y

r

y

r

y

j

T

j

T

MSE

p
j

p
j

,                                                      (2.37) 

 
przy czym oznaczenia pozostają niezmienione.  
      

Dzieląc obie strony tej równości przez 

p

j

MSE

otrzymamy: 

 

p

j

p

j

p

j

y

y

p

j

y

y

p
j

MSE

j

T

j

T

MSE

y

r

MSE

y

r

y

p
j

p
j

2

2

2

2

1

1

1

)

(

)

(

ˆ

)

(

)}

(

ˆ

)

(

ˆ

{

,

,

.                                                 (2.38) 

 

Wprowadzając oznaczenia: 

 

p

j

y

y

p
j

R
j

MSE

y

r

y

U

p
j

2

,

)}

(

ˆ

)

(

ˆ

{

p

j

y

y

D
j

MSE

y

r

U

p
j

)

(

ˆ

)

1

(

2

2

,

,  

p

j

p

j

M
j

MSE

j

T

j

T

U

2

1

)

(

                       (2.39) 

 
otrzymamy: 
 

1

M
j

D
j

R
j

U

U

U

.                                                                                                                           (2.40) 

 

      

Współczynnik 

R
j

U

 określać będziemy  jako  współczynnik  udziału błędów z tytułu odchyleń  od 

linii prognoz dokładnych. Jak pokazaliśmy w poprzedniej części wykładu oszacowaniem współczynnika 

kierunkowego  linii  (2.23)  jest 

)

(

ˆ

)

(

ˆ

ˆ

,

p
j

y

y

j

y

y

r

b

p
j

.    Oszacowanie  to  jest  równe  jedności, 

1

ˆ

j

b

,  jeśli 

)

(

ˆ

)

(

ˆ

,

y

r

y

p
j

y

y

p
j

.  W takim przypadku 

0

R
j

U

. Zatem im większa jest różnica 

)

(

ˆ

)

(

ˆ

,

y

r

y

p
j

y

y

p
j

tym  większe  jest  odchylenie  współczynnika 

j

bˆ

  od  jedności,  tym  większe  wartości  przyjmuje 

współczynnik 

R
j

U

background image

Prognozowanie, Tadeusz W.Bołt,  

 

14 

      

Współczynnik 

D
j

U

  nazywać  będziemy  współczynnikiem  udziału  błędów  z  tytułu 

niedopasowania relacji (2.23). Ponieważ 

2

2

,

)

1

(

j

y

y

p
j

r

 jest  współczynnikiem  zbieżności  obliczonym 

dla  modelu (2.23),  określa zatem  jaka część  zmienności realizacji zmiennej prognozowanej  nie została 
wyjaśniona  przez  zmienność  prognoz.    Jeśli  zatem 

1

,

p
j

y

y

r

,  wtedy   

0

2

j

  znieważ  wtedy 

0

D
j

U

      

Współczynnik  udziału błędów z tytułu obciążenia 

M
j

U

  omówiono poprzednio.  

 
 
2.5 Skorelowanie w czasie błędów prognoz ex post 
 
      

Kolejnym  etapem  analizy  błędów  prognoz  ex  post  może  być  badanie  autokorelacji 

(skorelowania w czasie) tych błędów. Jest zrozumiałe, że analiza autokorelacji ma uzasadnienie wtedy, 
gdy  dysponujemy  stosunkowo  długim  szeregiem  czasowym  obserwowalnych  błędów  prognoz. 
Skorelowanie w czasie błędów prognoz może być wynikiem wielu przyczyn. Jedną z nich może być na 
przykład  błąd  konstrukcji  modelu  prognostycznego  (ekonometrycznego).  Niezależnie  od  przyczyn 
powodujących  skorelowanie  w  czasie  błędów  prognoz,  informacje  o  rodzaju  tego  skorelowania  mogą 
być wykorzystane do skonstruowania poprawki prognozy ze względu na autokorelację.  
      

Dla  uproszczenia  zapisów  rozpatrzmy  przypadek  autokorelacji  rzędu  pierwszego 

)

(

1

Oszacowaniem tego współczynnika na podstawie ciągu 

)

(

j

T

 zaobserwowanych błędów prognoz ex 

post jest

15

 

 

T

t

p

j

t

t

T

t

p

j

t

t

p

j

t

t

1

2

2

1

1

1

)

ˆ

(

ˆ

ˆ

ˆ

|

|

|

.                                                                                          (2.41) 

 

Współczynnik ten informuje o sile i kierunku skorelowania w czasie kolejnych błędów prognoz 

z  wyprzedzeniem 

j

  okresów.  Można  testować  hipotezę  istotności  tego  współczynnika  wykorzystując 

statystykę  Box-Pierce’a  lub  Ljung-Boxa

16

.  Jeśli  okaże  się,  że  współczynnik  autokorelacji  jest  istotnie 

różny od zera, wtedy uzasadnienie ma wyznaczenie prognozy skorygowanej: 
 

p

j

t

t

j

p

j

t

t

p

j

t

t

y

y

1

1

1

|

|

|

ˆ

~

.                                                                                                                 (2.42) 

 
                                                                                                                                
2.6 Prognozowanie bez wygładzania 
 
      

Rozważmy obecnie tzw. naiwną metodę prognozowania

17

, polegającą na wyznaczeniu prognozy 

na  okres  następny  na  poziomie  poprzedniej  realizacji  zmiennej  prognozowanej.  Mimo  nazwy 
sugerującej  niezbyt  mocne  uzasadnienia  tej  metody,  pokażemy,  że  wzmiankowana  metoda 
prognozowania ma mocne podstawy teoretyczne.  
      

Rozważmy liniowy model błądzenia przypadkowego, który zapiszemy w następujący sposób: 

 

t

t

t

y

y

1

)

,...,

1

(

T

t

,                                                                                                              (2.43) 

                                                

15

 W sprawie autokorelacji zobacz np. H.Theil, Zasady ekonometrii, PWE, Warszawa 1979, str. 257-261. 

16

  Zob.  G.E.P.Box,  D.A.Pierce,  Distribution  of  residual  autocorrelations  in  autoregressive-integreted  moving 

average  time  series  models,  Journal  of  the  American  Statistical      Association,  vol.  65,  1970,  str.  1509-1526, 
G.M.Ljung, G.E.P.Box, On a measure of lack of fit in time series models, Biometrica, vol.65, 1978, str. 297-303. 

17

  Zob.  np.  J.B.Gajda,  Prognozowanie  i  symulacja  a  decyzje  gospodarcze,  Wydawnictwo  C.H.Beck,  Warszawa 

2001, str. 176-180. 

background image

Prognozowanie, Tadeusz W.Bołt,  

 

15 

 

gdzie 

t

 

jest  czysto  losowym  zakłóceniem,  spełniającym

18

0

t

E

2

2

)

(

t

E

s

t

E

s

t

;

0

Jeżeli  wyjściowa  obserwacja  jest  zadana  (ustalona)  jako 

0

y

,  wtedy  poziom  zmiennej 

t

y

  w 

dowolnym  momencie  czasu  jest  wyznaczony  przez  ustaloną  wartość  początkową  oraz  wszystkie 
zakłócenia jakie zrealizowały się do momentu 

t

 włącznie, co zapiszemy:

19

 

 

t

s

s

t

y

y

1

0

                                                                                                                              (2.44) 

 

gdzie 

t

s

s

1

 jest definiowane jako trend stochastyczny

20

.  

 

Realizacja  zmiennej  w  okresie 

)

1

(

t

  generowanej  przez  proces  błądzenia  przypadkowego 

różnić się będzie o czysto losowe (,,nieprognozowalne’’) zakłócenie losowe, co zapiszemy: 
 

1

1

t

t

t

y

y

.                                                                                                                                   (2.45) 

 
      

Można zadać pytanie: jaka jest najlepsza prognoza zmiennej 

1

t

y

 wyznaczona w okresie 

t

?  Nie 

ulega wątpliwości, że w takim przypadku najlepszą prognozą tej zmiennej  jest: 
 

t

p

t

t

y

y

1

|

)

1

,...,

2

,

1

(

T

t

.                                                                                                            (2.46) 

 

W tym przypadku  wyprzedzenie czasowe prognozy  wynosi 

)

1

(

j

. Błędem prognozy ex post 

jest: 
 

1

1

1

1

1

t

t

t

p

t

t

t

p

t

y

y

y

y

|

.                                                                                                 (2.47) 

 

Ponieważ  wariancja  składnika  zakłócającego  wynosi 

2

2

)

(

t

E

,  zatem  wariancja  błędu 

prognozy z wyprzedzeniem jednego okresu wynosi: 
 

2

2

1

2

1

)

(

)

(

|

t

p

t

t

E

E

.                                                                                                               (2.48) 

 
      

Można  powiedzieć,  że  wariancja  składnika  zakłócającego  jest  minimalnym  średnim 

kwadratowym błędem, jaki można popełnić prognozując zmienną 

1

t

y

, jeśli ta zmienna jest generowana 

przez  model  błądzenia  przypadkowego.  Zastosowanie  jakiejkolwiek  innej  metody  prognozowania  nie 
powinno przynieść prognoz  o średnim  kwadratowym  błędzie  mniejszym  niż 

2

.  W  takim  przypadku 

                                                

18

 Założenie to może być testowane przy pomocy statystyki  Ljunga –Boxa. 

19

  To  czy  dany  szereg  czasowy  jest  generowany  przez  proces  błądzenia  przypadkowego  jest  przedmiotem 

wnioskowania  statystycznego.    Najbardziej  znanym  testem  jest    test  Dickey-Fullera.  Przegląd  problemów  z  tym 
związanych  można  znaleźć  w  książce:  G.S.Maddala,  Introduction  to  econometrics,  MacMillan  Publishing 
Company, New York 1992, str. 580-588. Z uwagi na charakter wykładu nie rozwijamy szerzej tej problematyki. 

20

  Szereg  czasowy,  którego  wyrazy  są  generowane  przez  proces  błądzenia  przypadkowego  jest  niestacjonarny, 

gdyż  wariancja,  autokowariancje    (

j

)  i  współczynniki  autokorelacji    (

j

)  dla  takiego  szeregu  są  zmienne  w 

czasie.  
Możemy  pokazać,  że 

0

y

Ey

t

2

2

0

2

t

y

y

E

t

y

)

(

;   

2

0

0

)

(

)

)(

(

j

t

y

y

y

y

E

j

t

t

j

t

j

t

j

/

)

(

.  

background image

Prognozowanie, Tadeusz W.Bołt,  

 

16 

nie opłaca się ponosić kosztów na przygotowanie prognoz przy pomocy  najbardziej skomplikowanych 
metod, gdyż prognozy otrzymane metodą naiwną będą porównywalnie dokładne. 
      

Zauważmy, że na efektywnych rynkach (finansowych i towarowych) ceny dóbr są generowane 

przez procesy błądzenia przypadkowego. Zatem na rynkach efektywnych wykorzystywanie specjalnych 
metod prognozowania nie przynosi zmniejszenia ryzyka, gdyż rynek efektywny dyskontuje natychmiast 
wszystkie informacje, których efekty ,,zawarte są w ostatnio zaobserwowanej cenie’’. 

21

 

      

Dla  metod  prognozowania  stosowanych  w  dalszych  częściach  zajęć  obliczać  będziemy 

współczynnik  prognozowalności 

)

(

p

j

WPR

,  będący  ilorazem  średniego  kwadratowego  błędu 

rozpatrywanej  metody  do  średniego  kwadratowego  błędu  dla  metody  bez  wygładzania.  Definicja  tego 
współczynnika jest następująca: 

)

(bw

MSE

MSE

WPR

p

j

p

j

p

j

                                                                                                                         (2.49) 

 

gdzie 

p

j

MSE

  jest  średnim  kwadratowym  błędem  dla  rozpatrywanej  metody  prognozowania, 

)

(bw

MSE

p

j

 jest średnim kwadratowym błędem dla metody bez wygładzania.  

Jeśli 

1

p

j

WPR

, to analizowana  metoda prognozowania jest ,,nie lepsza’’ niż metoda bez wygładzania.  

 

Inną,  ale  podobną  w  interpretacji  miarą  porównawczą,    jest  współczynnik 

2
j

U

  Thiela.  Ma  on 

następującą definicję: 
 





j

T

t

j

t

t

j

t

j

T

t

j

t

p

j

t

t

j

t

j

y

y

y

j

T

y

y

y

j

T

U

1

2

1

2

2

1

1

|

                                                                                                   (2.50) 

 
W liczniku zapisanego w (2.50) wyrażenia znajduje się suma kwadratów  relatywnych (procentowych) 
błędów  prognoz  podzielona  przez  liczbę  prognoz.  Jest  to  odpowiednik 

p

j

MSE

  znajdującego  się  w 

liczniku  wyrażenia  (2.49).  W  mianowniku  wzoru  (2.50)  natomiast  znajduje  się  suma  kwadratów 
relatywnych  błędów  prognoz  dla  metody  bez  wygładzania,  tj  odpowiednik 

)

(bw

MSE

p

j

  ze  wzoru 

(2.49).  Zatem  jeśli 

1

2

j

U

,  to  analizowana  metoda  prognozowania  jest  ,,nie  lepsza’’  od  metody  bez 

wygładzania, natomiast gdy 

1

2

j

U

 analizowana  metoda  daje prognozy  obarczone średnio  mniejszym 

relatywnym błędem niż metoda bez wygładzania. 

                                                

21

 Zob. np.  E.J.Elton, M.J.Gruber, Nowoczesna teoria portfelowa i analiza papierów wartościowych,  WIG Press, 

Warszawa 1998, str.497-540.