Ocena prognozy
Ocena ex post prognozy punktowej
Błąd prognozy (predykcji) ex post:
dla τ = 1, 2,..., T*
Względny błąd prognozy
.
Dla całego okresu prognozy łącznie wyznacza się zazwyczaj błędy średnie prognoz, z których najczęściej używane przedstawiono poniżej.
Średni błąd prognozy ex post
pomaga ocenić przeciętne obciążenie prognozy.
Średni błąd wartości bezwzględnych
podaje, w jednostkach bezwzględnych, o ile średnio prognoza różni się od wartości rzeczywistej.
Pierwiastek błędu średniokwadratowego
interpretuje się podobnie jak błąd MAE (jest bardziej czuły na wartości skrajne).
Średni absolutny błąd procentowy
.
podaje o ile procent średnio prognoza różni się od wartości rzeczywistej.
Błędy średnie wyznacza się wtedy, gdy znana jest już rzeczywista wartość zmiennej prognozowanej i są one miarą różnicy między wartością prognozy i zaobserwowaną wartością zmiennej prognozowanej.
Przykład
Wyznaczyć błędy średnie ex post prognoz wyznaczonych w poprzednim przykładzie wiedząc, że wielkość sprzedaży badanego makaronu w kolejnych kwartałach 2004 roku wyniosła 187, 188, 192 i 194 kg.
Błędy prognoz ex post dla kolejnych okresów wynoszą:
.
Jak widać, poza pierwszym kwartałem błędy są ujemne, to znaczy prognozy częściej „przeszacowywały” badaną wielkość.
Średni błąd prognozy ex post
,
zatem wartość rzeczywista była niższa od prognozowanej średnio o 2,44 kg/kwartał.
Średni błąd wartości bezwzględnych
,
tzn. prognozy różniły się od wartości rzeczywistych średnio o 2,99 kg/kwartał.
Pierwiastek błędu średniokwadratowego
,
zgodnie z wartością tego błędu przeciętna różnica między wartością rzeczywistą i prognozowaną wynosi 3,38 kg/ kwartał. Różnica między wielkością tego i poprzedniego błędu wynika z istnienia wpływu sporej wielkości (co do wartości bezwzględnej) błędu w ostatnim okresie prognozy.
Średni absolutny błąd procentowy
,
tzn. prognozy różniły się od wartości rzeczywistych średnio kwartalnie o 1,56%.
Ocena ex ante prognozy punktowej
Źródła błędów prognoz:
błąd estymacji modelu (oszacowane wartości wektora parametrów a różnią się od oryginalnych wartości wektora α),
błąd struktury stochastycznej modelu (oszacowane parametry rozkładu składnika losowego, w szczególności wariancja resztowa Se2 różni się od wartości rzeczywistej σ2),
błąd losowy (wartość składnika losowego w momencie prognozy ετ jest różna od zera),
błąd specyfikacji modelu (zastosowano nieodpowiednią postać funkcyjną modelu lub nieodpowiedni zestaw zmiennych objaśniających),
błąd warunków endogenicznych (nastąpiło zakłócenie postaci modelu),
błąd warunków egzogenicznych (wartości - w przypadku ich szacowania - zmiennych objaśniających uwzględnione w prognozie różnią się od rzeczywistych),
błąd pomiaru.
Błąd prognozy wyraża się jako różnica
dla τ = 1, 2,..., T*
W momencie konstruowania prognozy wartość rzeczywista
zmiennej objaśnianej zazwyczaj nie jest znana. Pożądana jest jej nieobciążoność, to znaczy oczekujemy, że
.
Wielkość błędu prognozy można rozłożyć na składowe
Pierwszy składnik odpowiada za nieznajomość wartości zmiennych objaśniających dla okresu prognozy, drugi za nieznajomość prawdziwych wartości parametrów modelu.
Zakładając nieobciążoność predykcji oraz w przypadku, gdy znane są właściwe wartości zmiennych objaśniających dla okresu prognozy, tzn.
wyznaczamy ocenę wariancji błędu prognozy jako
lub (dla samego momentu τ)
oraz średni błąd predykcji (prognozy) ex ante
.
Błąd ten informuje, o ile oszacowana wartość zmiennej prognozowanej
średnio odchyla się od rzeczywistej wartości zmiennej prognozowanej
dla kolejnych okresów τ = 1, 2,..., T*.
Dla przypadku jednej zmiennej objaśniającej (k=1) powyższy wzór przyjmuje postać:
Względny błąd predykcji (prognozy) ex ante wyznaczamy jako
Przykład
Wielkość sprzedaży pewnego rodzaju makaronu (w kg) w pewnym punkcie sprzedaży w kolejnych kwartałach lat 2000-2003 kształtowała się następująco:
110, 113, 127, 131, 132, 130, 142, 144, 150, 162, 160, 170, 167, 168, 178, 175
Na podstawie tych danych sformułowano model trendu w postaci
, t=1,2,...16,
Se2=20,16, R2=0,961, F=345,34, W=0,96, DW=1,75.
Na podstawie tego modelu wykonać prognozę na rok 2004.
Zakładając utrzymywanie się istniejącego trendu mamy dla t=17, 18, 19 i 20:
dla pierwszego kwartału
,
dla drgiego kwartału
dla trzeciego kwartału
dla czwartego kwartału
Macierz
ma postać
zatem średnie błędy prognozy ex ante dla kolejnych kwartałów wynoszą
.
Nie są to duże wartości błędów, bowiem średnie względne błędy prognozy ex ante wynoszą (w przybliżeniu dla wszystkich okresów są podobne) 0,027, czyli 2,7%.
Dopuszczalność prognozy
kryterium wielkości średniego błędu predykcji ex ante:
lub
, gdzie
- z góry ustalone wartości krytyczne błędu
odpowiednio duże prawdopodobieństwo realizacji prognozy (wiarygodność prognozy)
błąd prognozy wygasłej (ex post) na jeden okres lub (lepiej) średni (kryterium niezależne od metody prognozowania)
ocena dopuszczalności prognozy przez niezależnych ekspertów (możliwe do zastosowania również dla prognoz jakościowych)
Maksymalny horyzont prognozy - najdalszy (w przyszłość) moment lub okres, dla którego prognoza jest dopuszczalna.
Prognoza przedziałowa
Przedział ufności dla prognozy (prognozę przedziałową) konstruuje się w oparciu o wyznaczony średni błąd predykcji ex ante oraz o wartości statystyki tα jako:
w którym z prawdopodobieństwem
znajduje się wartość zmiennej prognozowanej. Prawdopodobieństwo
nazywa się wiarygodnością prognozy. Statystyka t ma n-(k+1) stopni swobody.
Przykład
Dla poprzedniego przykładu i
=0,95, wobec t0,05 14=2,145 przedziały ufności są postaci
.t