Mierniki jakości prognoz
Konstruując prognozę należy jednocześnie, jeśli jest to oczywiście możliwe, wyznaczyć
odpowiedni miernik, określający dokładność otrzymanej prognozy.
•
Prognoza jest obciążona błędem, jeśli wartość rzeczywista badanego zjawiska
różni się od jego prognozy. Oznaczając przez (t > n) wartość prognozy
zmiennej y na okres (lub moment) t, błąd prognozy (bezwzględny) określony
jest jako:
dla t>n, gdzie:
•
– rzeczywista wartość zmiennej prognozowanej Y w okresie t, t > n.
•
Wartość tego błędu wyrażona jest w tych samych jednostkach co zmienna prognozowana. Wartość
tego błędu określa, jakie było w chwili t odchylenie prognoz od wartości rzeczywistych zmiennej
prognozowanej. Jeśli wartość błędu prognozy w okresie (momencie) t jest równa zero, to można
powiedzieć, że prognoza była trafna. Jeśli błąd prognozy w okresie (momencie) t był ujemny, to
mówi się, że prognoza jest zawyżona w stosunku do rzeczywistej wartości zmiennej prognozowanej,
w przeciwnym przypadku - prognoza jest zaniżona w stosunku do rzeczywistej wartości zmiennej
prognozowanej.
*
t
y
*
t
t
t
y
y
q
t
y
Mierniki jakości prognoz
Możliwe jest również wyznaczenie względnego błędu prognozy na okres
(moment) t. Błąd ten określony jest jako:
dla t> n.
Wartość tego błędu informuje, jakie było w
chwili t odchylenie prognoz od wartości
rzeczywistej zmiennej prognozowanej,
wyrażone w procentach wartości rzeczywistej.
%)
100
(
t
t
t
y
q
φ
Miary błędu prognoz ex post i ex ante
Błąd prognozy może być wyznaczony zarówno po upływie czasu na który jest
konstruowana prognoza (znana jest wówczas rzeczywista, zrealizowana wartość
zmiennej prognozowanej) bądź też przed upływem tego czasu (Cieślak, 2005: 49).
Z tego względu można wyróżnić dwa rodzaje mierników dokładności prognozy,
a mianowicie:
•
mierniki dokładności ex post (błędy ex post),
•
mierniki dokładności ex ante (oceny błędu ex ante).
•
Mierniki dokładności ex post (łac. ex post – po czasie) wyznaczane są po
upływie czasu, na który została skonstruowana prognoza. Wówczas
wyznaczony błąd prognozy określa stopień trafności prognozy.
•
Mierniki dokładności ex ante (łac. ex ante – z wyprzedzeniem) wyznaczane
są w momencie konstruowania prognozy (czyli w momencie, gdy nie jest
znana rzeczywista wartość zmiennej prognozowanej), określają więc jedynie
oczekiwaną (spodziewaną) wartość odchyleń rzeczywistych realizacji
zmiennej prognozowanej od prognoz.
Miary błędu prognoz ex post
•
Błędy prognoz ex post można obliczać zarówno dla pojedynczego okresu
(momentu) czasu z przedziału empirycznej weryfikacji prognozy, jak i dla
wszystkich tych okresów. Jeśli błędy zostały wyznaczone dla wszystkich
okresów czasu, to możliwe jest skonstruowanie jednego miernika
określającego średnią wartość błędu prognozy w przedziale empirycznej
weryfikacji prognozy.
•
W literaturze przedmiotu istnieje wiele mierników błędów prognoz ex post
(Cieślak, 2005: 49-53; Welfe, 2003: 231-237).
Średni błąd prognozy ME (ang. mean error)
s-liczba obserwacji dla których posiadamy informację o wielkościach
empirycznych i prognozowanych badanej zmiennej.
Błąd ten wyrażony jest w tych samych jednostkach co zmienna prognozowana.
Określa on jedynie obciążoność prognozy. Jeśli wartość tego błędu jest istotnie
większa od zera, to prognozy są niedoszacowane, co oznacza, że wartości
empiryczne są, średnio rzecz biorąc, wyższe niż wartości prognozy.
S
s
s
s
y
y
S
ME
1
*
1
Średni błąd procentowy
(ang. mean percentage error)
•
Wartość tego błędu określa jakie było, średnio rzecz biorąc, odchylenie
prognoz od wartości rzeczywistej zmiennej prognozowanej, wyrażone w
procentach wartości rzeczywistej.
•
Choć oba z wyżej wymienionych błędów określają obciążoność prognozy, ich
istotna wadą jest to, iż błędy dodatnie redukowane są przez błędy ujemne. Nie
są więc miarą dokładności prognozy. Wolne od tych wad są błędy
bezwzględne (absolutne).
%
100
1
1
*
S
s
s
s
s
y
y
y
S
MPE
Średni absolutny błąd procentowy
(ang. mean absolute percentage error)
•
Określa on o ile średnio procent odchylają się wartości rzeczywiste od prognoz.
%
100
1
1
*
S
s
s
s
s
y
y
y
S
MAPE
Pierwiastek błędu średniokwadratowego
(ang. root mean square error)
Wartość tego błędu wyrażona jest w tych samych jednostkach co zmienna
prognozowana. Określa on o ile średnio jednostek odchylają się wartości
rzeczywiste od prognoz.
Duże różnice między wartością średniego absolutnego błędu prognozy a wartością
pierwiastka błędu średniokwadratowego wskazuje na występowanie błędów o
skrajnie dużych wartościach.
S
s
s
s
y
y
S
RMSE
1
2
*
)
(
1
Pierwiastek procentowego błędu
średniokwadratowego (ang. root mean
square percentage error)
•
Wartość tego błędu wyrażona jest w procentach .
•
Określa on o ile średnio procent odchylają się wartości rzeczywiste od
prognoz.
100
*
)
(
1
1
2
*
S
s
s
s
s
y
y
y
S
RMSPE
Prognozowanie na podstawie
szeregów czasowych
Szeregiem czasowym (jednowymiarowym) nazywamy ciąg
wartości zmiennej y uporządkowany przez czas.
Szereg taki można zapisać w postaci n wymiarowego wektora
(np. wierszowego) w następujący sposób:
n
y
y
y
y
2
1
Składowe szeregu czasowego
W każdym szeregu czasowym wyróżnia się dwie składowe: składową
systematyczną i składową przypadkową (Newbold, 1984: 693;
Cieślak, 2005: 64-65).
Składowa systematyczna jest efektem oddziaływania na badane zjawisko
stałego zestawu czynników. Składowa systematyczna może występować
w postaci stałego poziomu, tendencji rozwojowej (trendu), wahań
sezonowych, wahań cyklicznych.
Składowa przypadkowa (zwana także składnikiem losowym lub wahaniami
przypadkowymi) jest efektem działania na badane zjawisko czynników
losowych (przypadkowych).
Rysunek 1. Stały poziom i wahania przypadkowe
Zmienna prognozowana charakteryzuje się stałym (przeciętnym)
poziomem, jeśli jej wartości oscylują wokół ustalonego stałego
poziomu (rys. 1).
stały poziom+wahania przypadkowe
0
0,2
0,4
0,6
0,8
1
1,2
1,4
1
2
3
4
5
6
7
8
9
10
czas
Rysunek 2. Trend (rosnący) i wahania przypadkowe
Tendencja
rozwojowa
jest
to
długookresowa skłonność do
jednokierunkowych
zmian
(wzrostu
lub
spadku)
wartości
prognozowanej zmiennej (rys. 2)
trend + wahania przypadkowe
0
0,5
1
1,5
2
2,5
1
2
3
4
5
6
7
8
9 10 11 12 13 14 15 16 17 18 19 20
czas
Rysunek 3. Trend (malejący) i wahania sezonowe
Wahania sezonowe są to odchylenia od stałego poziomu lub od trendu powtarzające się w
regularnych odstępach czasowych. Mogą być obserwowane jedynie na danych o
większej częstotliwości niż dane roczne. Związane są zwykle z porami roku (stąd ich
nazwa). Na rys. 3 przedstawiony jest szereg czasowy charakteryzujący się trendem
(malejącym) z wahaniami sezonowymi (i oczywiście z wahaniami przypadkowymi).
trend+wahania sezonowe
0
2
4
6
8
10
12
1
3
5
7
9
11
13
15
17
19
21
23
czas w kwartałach
Rysunek 4. Stały poziom i wahania cykliczne
Wahania cykliczne są to długookresowe, powtarzające się rytmicznie w przedziałach czasu
dłuższych niż rok, odchylenia wartości badanej zmiennej od stałego poziomu lub trendu.
Dla zmiennych ekonomicznych związane są one z cyklem koniunkturalnym. Na rysunku
4 przedstawiony jest ten typ wahań występujących w powiązaniu ze stałym poziomem
zjawiska.
stały poziom + wahania cykliczne
0
1
2
3
4
5
6
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37
czas (w latach)
Strukturalne i niestrukturalne metody prognozowania
•
Strukturalne metody prognozowania wymagają definiowania struktury zależności w
jakiej osadzona jest dana wielkość ekonomiczna. Wykorzystujemy w ich przypadku
wiedzę o determinantach kształtujących zjawisko. (np. prognozowanie na podstawie
modelu przyczynowo-skutkowego).
•
Prognozowanie niestrukturalne skupia się na analizie samego szeregu czasowego,
składowych tego szeregu i jego własności, ignorując zależności ekonomiczne.
Model strukturalny, oparty na teorii ekonomicznej, nie jest niezbędny do tego, aby
prognozować zjawiska ekonomiczne. W sytuacji, gdy przedmiotem zainteresowania jest
sama prognoza, budowa modelu strukturalnego może okazać się zbyt kosztowna i
czasochłonna. Zastosowanie wówczas znajdują modele niestrukturalne.
Celowość użycia modeli niestrukturalnych uzasadnia się na kilka sposobów, np.:
„czasem głównym zadaniem jest przewidzenie tego co się zdarzy, nie zaś wyjaśnienie
dlaczego to się zdarzy”. Wreszcie: ”koszty zdobycia wiedzy o przyczynach wystąpienia
przewidywanych zjawisk mogą być niewspółmiernie wysokie w porównaniu z
konstrukcją prognozy, opartą na modelu szeregu czasowego”
Niestrukturalne metody prognozowania
procesów gospodarczych
•
Modele niestrukturalne opierają się na założeniu, że informacje zawarte w
samych danych statystycznych opisujących kształtowanie się badanego
zjawiska w czasie są wystarczające na to, aby na ich podstawie podać
dokładny opis tego zjawiska i wyznaczyć jego prognozę na kolejne okresy
(momenty) należące do przyszłości.
•
Modele te znajdują zastosowanie w przypadku, gdy zmienne prognozowane
mają dość stabilny przebieg w czasie. Mogą być stosowane zarówno w
przypadku zjawisk charakteryzujących się względnie stałym poziomem (z
niewielkimi wahaniami przypadkowymi), jak również w przypadku zjawisk
wykazujących tendencję rozwojową. Dopuszcza się również występowanie
(zarówno ze stałym poziomem, jaki i z trendem) wahań sezonowych.
•
Prognozowanie niestrukturalne skupia się na analizie samego szeregu
czasowego, składowych tego szeregu i jego własności, ignorując zależności
ekonomiczne.
Niestrukturalne metody prognozowania
procesów gospodarczych cd.1
•
Podstawowym założeniem, które musi być spełnione w przypadku
prognozowania przyszłych wartości zjawisk przy zastosowaniu modeli
niestrukturalnych jest to, że mechanizm kształtujący badane zjawisko
w przeszłości nie ulegnie zmianie, a zatem w przyszłych okresach w
badanym zjawisku mogą wystąpić wyłączne zmiany ilościowe. Oznacza to
więc, że prognozy otrzymywane na podstawie modeli niestrukturalnych
mają charakter prognoz krótkookresowych.
Do podstawowych niestrukturalnych metod prognozowania zalicza się:
•
metody naiwne,
•
metody średniej ruchomej,
•
metody wyrównywania wykładniczego (metoda Browna, Holta i Wintera).
Metody naiwne
•
Metody naiwne oparte są na prostych przesłankach dotyczących przyszłości,
które zakładają, że nie nastąpią zmiany w dotychczasowym sposobie
oddziaływania czynników określających wartości zmiennej prognozowanej
(Cieślak, 2005: 68).
•
Na ich podstawie konstruuje się prognozy krótkookresowe, najczęściej na
jeden okres naprzód, czyli na okres t = n + 1, gdzie n – liczba obserwacji
zmiennej prognozowanej.
•
Dobór odpowiedniej metody naiwnej zależy wyłącznie od tego, jak
kształtowało się badane zjawisko w przeszłości.
Metoda naiwna –poziom bez zmian
W przypadku szeregów czasowych charakteryzujących się względnie
stałym poziomem z niewielkimi odchyleniami przypadkowymi
można
przyjąć, że wartość zmiennej prognozowanej na okres (moment) t=n+1 będzie
równa wartości tej zmiennej z okresu poprzedniego, czyli:
(1)
gdzie:
•
– prognoza zmiennej y na okres (moment) t
•
- wartość zmiennej prognozowanej w okresie t - 1.
1
*
t
t
y
y
*
t
y
1
t
y
Przykład 1.
Dany jest szereg czasowy opisujący wysokość przeciętnych miesięcznych
zarobków w pewnej firmie (w tys. zł), od stycznia 2012 do lipca 2012 . Na
podstawie tych informacji (tabl. 1) wyznaczyć prognozę wysokości przeciętnych
zarobków na sierpień 2012 r.
Tablica 1. Wysokość przeciętnych miesięcznych zarobków (w tys. zł)
Okres
1
2
3
4
5
6
7
Wysokość zarobków
(w tys. zł)
1,861 1,864 1,862 1,865 1,864 1,866 1,865
Rozwiązanie przykładu 1:
•
W pierwszym kroku, należy określić jak kształtuje się badane zjawisko w czasie. W tym
celu możemy posłużyć się jego wykresem (rys. 1).
Rysunek 1. Wysokość przeciętnych miesięcznych zarobków (w tys. zł)
1,84
1,86
1,88
1
2
3
4
5
6
7
Rozwiązanie przykładu 1:
Tablica 2. Wartości rzeczywiste i ich prognozy
t
1
1,861
–
2
1,864
1,861
3
1,862
1,864
4
1,865
1,862
5
1,864
1,865
6
1,866
1,864
7
1,865
1,866
8
–
1,865
t
y
*
t
y
Metoda naiwna – przyrost bez zmian
• Jeśli szereg czasowy charakteryzuje się trendem liniowym
, to
prognozę na okres t=n+1 można wyznaczyć jako:
•
Oznacza to, że prognoza wartości badanego zjawiska jest równa wartości
badanego zjawiska z okresu poprzedniego powiększona o ostatni przyrost
wartości badanej zmiennej.
)
(
2
1
1
*
t
t
t
t
y
y
y
y
Przykład 2.
Mając informacje o liczbie osób pobierających zasiłki w Łodzi (w tys. osób) w
latach 1998-2005 (tabl. 3) wyznaczyć odpowiednią metodą naiwną prognozę
liczby osób korzystających z zasiłków w 2006 roku.
Tablica 3. Liczba osób korzystających z zasiłków w Łodzi (w tys. osób)
Lata
t
1998
1
25,6
1999
2
28,3
2000
3
31,4
2001
4
33,9
2002
5
37,1
2003
6
39,8
2004
7
42,9
2005
8
46,1
Rozwiązanie przykładu 2
•
Rozpoczynamy od analizy graficznej (rys. 2).
Rysunek 2. Liczba osób korzystających z zasiłków w Łodzi (w tys. osób)
20
30
40
50
1
2
3
4
5
6
7
8
Rozwiązanie przykładu 2
Tablica 4. Prognozy wygasłe
Lata
t
1998
1
25,6
-
-
1999
2
28,3
2,7
-
2000
3
31,4
3,1
31
2001
4
33,9
2,5
34,5
2002
5
37,1
3,2
36,4
2003
6
39,8
2,7
40,3
2004
7
42,9
3,1
42,5
2005
8
46,1
3,2
46
t
y
1
1
Δ
t
t
t
t
y
y
y
*
t
y
Rozwiązanie przykładu 2
• A zatem wyznaczając prognozę na rok 2006 (t=9) można zastosować
metodę opisaną zależnością
49,3 tys. osób
)
9
,
42
1
,
46
(
1
,
46
)
(
7
8
8
*
9
y
y
y
y
49,3 tys. osób.
Metody naiwne
•
W przypadku szeregów czasowych, w których występują wahania sezonowe,
możliwe jest zastosowanie powyższych metod prognozowania, jednak należy
brać pod uwagę jedynie obserwacje pochodzące z jednoimiennych okresów.
Przykładowo, jeśli w cyklu wahań występują cztery fazy (np. dane kwartalne),
to wówczas prognozując wartość zmiennej dla I fazy (np. I kwartału) należy
opierać się na informacjach o kształtowaniu się wartości badanego zjawiska w
każdej pierwszej fazie cyklu badanego okresu.
•
Przedstawione powyżej metody prognozowania przyszłych wartości choć są
proste w zastosowaniu, to jednak jakość otrzymywanych na ich podstawie
prognoz jest raczej niska. Ocenę jakości prognoz można przeprowadzić
wyłącznie na podstawie błędów ex post.
Metody naiwne
• Metoda naiwna (poziom bez zmian) wykorzystuje jedynie
najświeższą informację do sformułowania prognozy na
okresy następne.
• Mogą być wykorzystane do prognozowania bez
konieczności gromadzenia dużej liczby informacji.
• Stosowane do prognozowania na krótki dystans czasowy.
• Jeśli ostatnie obserwacje są nietypowe, to prognoza może
być błędna.
Niestrukturalne metody prognozowania - metody średniej ruchomej
•
Podobnie jak w przypadku metod naiwnych, metody oparte na średniej
ruchomej stosuje się do prognozowania krótkookresowego, najczęściej na
jeden okres naprzód (t = n + 1).
Stosowne są do prognozowania
przyszłych wartości zjawisk, które charakteryzują się względnie
stałym poziomem z niewielkimi odchyleniami przypadkowymi.
•
W metodzie średnich ruchomych prognoza na okres t wyznaczana jest jako
średnia arytmetyczna z k ostatnich wartości tej zmiennej. Może to być
zarówno średnia arytmetyczna prosta, jak i średnia arytmetyczna ważona. W
pierwszym przypadku mamy więc do czynienia z metodą średniej ruchomej
prostej, w drugim zaś z metodą średniej ruchomej ważonej.
Metoda średniej ruchomej prostej
• W przypadku średniej ruchomej prostej prognoza na okres (moment)
t = n + 1 jest wyznaczona jako:
•
Stałą k nazywa się stałą wygładzania
•
n-liczba obserwacji zmiennej prognozowanej.
n
k
n
t
t
t
y
k
y
1
*
1
Metoda średniej ruchomej ważonej
• W przypadku średniej ruchomej ważonej prognozę na okres (moment)
t=n+1 wyznacza się jako:
waga nadana wartości zmiennej y w okresie t, przy czym
n
k
n
t
t
t
t
ω
y
y
1
*
,
t
1
,
0
t
1
1
n
k
n
t
t
ω
Stała wygładzania k
Liczba wyrazów średniej ruchomej (k), czyli stała wygładzania, jest określana przez
prognostę. Wraz ze wzrostem wartości stałej wygładzania rośnie efekt wyrównywania.
Średnia ruchoma wyznaczona z większej liczby wyrazów będzie silniej wygładzała
szereg, lecz jednocześnie wolniej reagowała na zmiany poziomu prognozowanej
zmiennej. Wyznaczona z mniejszej liczby wyrazów będzie szybciej odzwierciedlała
aktualne zmiany zachodzące w wartościach prognozowanej zmiennej, lecz większy
wpływ na nią będą miały wahania przypadkowe (mniejszy będzie efekt wygładzania
szeregu). Wybór liczby wyrazów średniej ruchomej musi stanowić kompromis między
tymi możliwościami .
Do wyznaczenia liczby wyrazów średniej ruchomej można użyć błędów prognoz ex post
(np. błędu średniokwadratowego) i wybrać ten wariant, dla którego wartość błędu jest
najmniejsza (Cieślak, 2005: 70). Należy jednak pamiętać, że zwiększanie stałej
wygładzania powoduje skrócenie szeregu prognoz wygasłych, co może w istotny sposób
wpłynąć na wartość błędu prognozy.
Model średniej ruchomej prostej
a model średniej ruchomej ważonej
W modelu średniej ruchomej prostej nadaje się jednakowe wagi
wszystkim wartościom zmiennej y, na podstawie których wyznaczono
wartość średniej. Ponieważ zwykle nowsze dane zawierają bardziej
aktualne informacje na temat kształtowania się badanego zjawiska,
powinny one w większym stopniu wpłynąć na wartość prognozy.
Postulat ten, nazywany starzeniem się informacji spełniony jest przez
średnią ruchomą ważoną (Cieślak, 2005: 70).
Modele wygładzania wykładniczego
Jak można było zauważyć w przykładach zastosowań metod naiwnych-
generowane przez nie prognozy zależą od ostatniej (lub dwóch
ostatnich) realizacji zmiennej prognozowanej. Pozostają zatem pod
silnym wpływem zakłóceń realizowanych w ostatnim ( przedostatnim)
okresie.
Metody wygładzania wykładniczego są uogólnieniem metod naiwnych.
Skonstruowano je tak, aby -dzięki filtracji zakłóceń- zredukować
nadmierną zależność prognoz od ostatnich zakłóceń, nie tracąc jednak
korzyści związanych z wyznaczeniem kolejnej prognozy w zależności
od ostatniej (i przedostatniej) realizacji zmiennej prognozowanej.
Metoda Browna
• Metoda wygładzania wykładniczego, znana również jako metoda
Browna (1959) może być stosowana dla zmiennych, dla których
przyrosty trendu (poza okresami kiedy następowała zmiana lub
załamanie trendu) są w przybliżeniu stałe lub zmieniają się w
regularny sposób (Zeliaś i in., 2003: 143).
W niniejszym kursie ograniczono się do przedstawienia najprostszej
metody wygładzania wykładniczego, którą stosuje się w przypadku
szeregów charakteryzujących się stałym poziomem, z niewielkimi
wahaniami przypadkowymi.
Metoda Browna
•
Wygładzanie szeregu czasowego charakteryzującego się względnie stałym
poziomem bez wahań sezonowych polega na obliczeniu wartości
wygładzonych według następującego wzoru rekurencyjnego:
– wartość wygładzona zmiennej y w okresie t,
1
)
1
(
^
1
1
^
1
1
^
t
y
y
y
y
y
t
t
t
^
t
y
α
1
,
0
α
– stała wygładzania,
.
Metoda Browna
W powyższym wzorze, punktem startowym jest przyjcie jako pierwszej wartości
wygładzonej (w pierwszym okresie) wartości rzeczywistej z pierwszego okresu.
Jako pierwszą wartość wygładzoną można również przyjąć średnią arytmetyczną
wyznaczoną na podstawie wszystkich wartości badanej zmiennej.
Parametr wygładzania –alfa- odgrywa ważną rolę: im bliższy jest zeru tym prognoza
jest bliższa ostatniej prognozie sformułowanej na okres poprzedni. Im parametr alfa
jest bliższy jedności, tym bieżąca prognoza jest bliższa ostatniej realizacji zmiennej.
Optymalna wartość parametru alfa zależy od właściwości wygładzanego szeregu i dobierana
jest eksperymentalnie metodą prób i błędów, na podstawie zarejestrowanych w
przeszłości realizacji zmiennej prognozowanej. Często dobiera się taką wartość
parametru alfa, aby miara dokładności prognoz ex post była najmniejsza.
^
t
y
^
1
t
y
Metoda Holta
• Metoda Holta stosowana jest do
wygładzania szeregu czasowego, który
charakteryzuje się trendem z wahaniami
przypadkowymi.
• W oparciu o wygładzone wartości
konstruuje się prognozę przyszłych wartości
badanej zmiennej. W metodzie Holta
wygładzaniu poddaje się zarówno
przyrosty wartości zmiennej czasowej,
jak i poziom tej zmiennej.
Metoda Holta
• W metodzie Holta występują dwie stałe wygładzania: – stała
wygładzanie poziomu (F) oraz – stała wygładzania przyrostu (T).
Równania wygładzające wykładniczo poziom F oraz przyrosty badanej
zmiennej T mają postać:
α
β
)
)(
1
(
1
1
1
1
t
t
t
t
T
F
α
y
α
F
y
F
1
1
1
2
1
)
1
(
)
(
t
t
t
t
T
β
F
F
β
T
y
y
T
Metoda Holta
• Prognoza na okres (t + 1) wyznaczona jest
w metodzie Holta jako:
• Prognozę wykraczającą poza próbę, na
okres t+h
t
t
t
T
F
y
*
1
n
n
h
t
T
h
F
y
*
Metoda Wintera
• Metoda Wintera stosowana jest do
wygładzania szeregu czasowego, który
charakteryzuje się trendem z wahaniami
sezonowymi i przypadkowymi.
• W oparciu o wygładzone wartości
konstruuje się prognozę przyszłych wartości
badanej zmiennej. W metodzie Wintera
wygładzaniu poddaje się 3 elementy:
poziom zmiennej, jej przyrost oraz efekt
sezonowy.
Metoda Wintera
W metodzie Wintera występują trzy stałe wygładzania: – stała
wygładzanie poziomu (F), – stała wygładzania przyrostu (T) oraz Ɣ-
stała wygładzania efektu sezonowego (S).
W metodzie tej wprowadzamy dodatkowy symbol
r - oznaczający długość cyklu sezonowości.
Dla danych półrocznych r wynosi 2, dla kwartalnych 4, dla miesięcznych 12 itd.
Jeśli efekt związany z sezonem jest stały w czasie opisujemy go formułą addytywną:
• Indeks sezonowy S
i
dla przypadku addytywnego mówi, o ile wartość
zmiennej w danym sezonie różni się od wartości oczyszczonej z
sezonowości. W skali roku efekty sezonowe addytywne sumują się do
zera.
α
β
t
i
t
t
S
y
y
*
*
ˆ
Metoda Wintera
Jeśli efekt związany z sezonem jest względnie stały (stały procent badanej zmiennej) w
czasie opisujemy go formułą multiplikatywną:
• Indeks sezonowy S
i
dla przypadku multiplikatywnego pokazuje
stosunek wartości zmiennej do jej wartości oczyszczonej z
sezonowości. W skali roku iloczyn efektów sezonowych
multiplikatywnych równy jest jedności.
• W obecności wyraźnego trendu spodziewać się należy raczej efektów
multiplikatywnych.
t
i
t
t
S
y
y
*
*
ˆ
Metoda Wintera –model addytywny
• Równania wygładzające wykładniczo poziom F oraz przyrosty badanej
zmiennej T mają postać:
)
)(
1
(
)
(
1
1
1
t
t
r
t
t
t
r
r
T
F
S
y
F
y
F
1
1
1
)
1
(
)
(
t
t
t
t
r
r
r
T
F
F
T
y
y
T
Metoda Wintera –model addytywny
• Równania wygładzające wykładniczo efekt sezonowy S mają postać:
S
F
y
S
r
t
t
t
t
)
1
(
)
(
r
y
y
S
r
i
i
i
i
1
Metoda Wintera –model addytywny
• Prognoza na okres (t + 1) wyznaczona jest
w metodzie Wintera jako:
• Prognozę wykraczającą poza próbę, na
okres t+h
r
t
t
t
t
S
T
F
y
*
1
r
t
t
t
h
t
S
T
h
F
y
*
Metoda Wintera –model multiplikatywny
• Równania wygładzające wykładniczo poziom F oraz przyrosty badanej
zmiennej T mają postać:
)
)(
1
(
)
:
(
1
1
1
t
t
r
t
t
t
r
r
T
F
S
y
F
y
F
1
1
1
)
1
(
)
(
t
t
t
t
r
r
r
T
F
F
T
y
y
T
Metoda Wintera –model multiplikatywny
• Równania wygładzające wykładniczo efekt sezonowy S mają postać:
S
F
y
S
r
t
t
t
t
)
1
(
)
:
(
r
y
y
S
r
i
i
i
i
1
:
Metoda Wintera –model multiplikatywny
• Prognoza na okres (t + 1) wyznaczona jest
w metodzie Wintera jako:
• Prognozę wykraczającą poza próbę, na
okres t+h
r
t
t
t
t
S
T
F
y
*
)
(
*
1
r
t
t
t
h
t
S
T
h
F
y
*
)
(
*
Dobór postaci analitycznej funkcji trendu
Dobór analitycznej funkcji trendu, która w możliwie najlepiej
odzwierciedla kształtowanie się badanego zjawiska w przeszłości,
może się opierać na graficznej analizie wyników obserwacji
zmiennej prognozowanej.
Analiza graficzna polega na ocenie wzrokowej, w jaki sposób układają się
punkty empiryczne reprezentujące kolejne wartości badanej zmiennej,
a następnie dopasowaniu odpowiedniej matematycznej funkcji, która
jak najlepiej dopasuje się do danych empirycznych.
Poniżej przedstawione są najczęściej stosowane funkcje trendu, które
wykorzystywane są do opisu zjawisk ekonomicznych, w zależności od
ich dynamicznych własności.
Liniowa funkcja trendu
Jest to najprostsza postać funkcji trendu. Opisana jest równaniem:
W tym przypadku przyrost absolutny zmiennej objaśnianej jest w
przybliżeniu stały.
Znak parametru określa kierunek trendu :
• jeśli >0, to mamy do czynienia z trendem rosnącym,
• jeśli < 0, to trend jest malejący.
t
t
f
1
0
)
(
1
1
Rysunek 5. Trend liniowy
trend liniowy
0
0,5
1
1,5
2
2,5
1
3
5
7
9
11
13
15
17
19
czas
y
0
1
α
0
1
α
Rysunek 6. Kształt funkcji o przyśpieszonym tempie wzrostu
0
200
400
600
800
1000
1200
1
3
5
7
9
11
13
15
17
19
21
23
25
27
29
31
czas
y
Funkcje o przyśpieszonym tempie wzrostu
Jeśli badane zjawisko charakteryzuje się przyśpieszonym tempem wzrostu (por.
rys. 6), to wówczas do jego opisu można zastosować następujące funkcje:
• funkcję wykładniczą
t
t
Ae
y
β
0
β
1
β
αβ
y
t
t
Funkcje o przyśpieszonym tempie wzrostu
Jeśli badane zjawisko charakteryzuje się przyśpieszonym tempem wzrostu (por.
rys. 6), to wówczas do jego opisu można zastosować następujące funkcje:
• wielomian drugiego stopnia (parabola)
• funkcje potęgową
0
2
2
2
1
0
α
t
α
t
α
α
y
t
1
1
0
1
α
t
α
y
α
t
Rysunek 7. Kształt funkcji o malejącym tempie wzrostu
0
0,5
1
1,5
2
2,5
3
3,5
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25
czas
y
Funkcje o malejącym tempie wzrostu
Jeśli badane zjawisko charakteryzuje się malejącym tempem wzrostu (por. rys. 7),
to wówczas do jego opisu można zastosować następujące funkcje:
• logarytmiczna
• potęgowa
Stosujemy je, gdy tempo wzrostu jest malejące.
0
ln
1
1
0
α
t
α
α
y
t
)
1,
0
(
β
t
α
y
β
t
Funkcje o malejącym tempie wzrostu
Jeśli badane zjawisko charakteryzuje się malejącym tempem wzrostu (por. rys. 7),
to wówczas do jego opisu można zastosować następujące funkcje:
• funkcja hiperboliczno-liniowa
• funkcja homograficzna
Stosujemy je, gdy tempo wzrostu jest malejące oraz występuje dążenie do
ustalonego poziomu.
0
1
1
0
α
t
α
α
y
t
0
,
β
α
t
β
t
α
y
t
Poszukiwanie odpowiedniej klasy funkcji
Ogromna liczba funkcji spełniających określone kryteria powoduje, że często nie
można w sposób jednoznaczny wskazać, która z nich będzie najlepiej
opisywała badane zjawisko. Warto więc podkreślić, iż przy poszukiwaniu
odpowiedniej klasy funkcji, należy starać się tak ją dobrać, aby (Zeliaś i in.,
2003: 75):
•
można ją było wyprowadzić z dostatecznie realnych założeń teoretycznych;
•
łatwo było posługiwać się nią w dalszej analizie;
•
jej parametry miały merytoryczne znaczenie w opisie rozwoju badanego
zjawiska;
•
prognozy dokonane na ich podstawie były możliwie jak najbardziej zgodne z
rzeczywistymi realizacjami prognozowanego zjawiska.
Wymienione wyżej funkcje nie wyczerpują całego zbioru funkcji, które są
stosowane w empirycznych analizach tendencji rozwojowej. Szeroki przegląd
funkcji trendu można znaleźć w pracy Zeliasia i in. (2003: 80-86).
Model trendu liniowego
Szereg czasowy przedstawia liczbę udzielonych noclegów w hotelach na
obszarze Polski ( mln), w latach 1990-1998.
1. Oszacować parametry trendu liniowego opisującego liczbę udzielonych
noclegów w hotelach na terenie Polski. Wyniki zinterpretować.
2. Ocenić model pod względem statystycznym.
3. Wyznaczyć prognozy (punktowe) liczby noclegów na kolejne trzy lata.
Rok
1990 1991 1992 1993 1994 1995 1996 1997 1998
Liczba
noclegów
(w mln)
6,11 6,50 6,77 7,15 7,52 8,05 8,53 8,89 9,28
Rysunek 8. Liczba noclegów udzielonych w hotelach na terenie Polski
Z analizy graficznej wartości badanej zmiennej wynika, iż liczba
udzielanych noclegów w Polsce charakteryzowała się wyraźnym,
liniowym trendem rosnącym. Oznacza to, że do opisu tego zjawiska
można zastosować trend liniowy.
6
6,5
7
7,5
8
8,5
9
9,5
1
2
3
4
5
6
7
8
9
Liniowa funkcja trendu
Wobec powyższego rzeczywiste wartości badanej zmiennej zostały zdekomponowane na
dwie składowe: składową systematyczną, wyrażającą się liniową funkcja trendu oraz
składową przypadkową. Szacując parametry modelu wyznaczamy równanie
teoretycznej linii trendu postaci:
gdzie Macierz X i wektor y mają postać:
t
a
a
y
t
1
0
y
X
X)
(X
a
T
1
T
1
0
a
a
9
1
8
1
7
1
6
1
5
1
4
1
3
1
2
1
1
1
X
28
,
9
89
,
8
53
,
8
05
,
8
52
,
7
15
,
7
77
,
6
50
,
6
11
,
6
y
Obliczenia pomocnicze
285
45
45
9
X
X
T
0167
,
0
0833
,
0
0833
,
0
5278
,
0
1
T
X)
(X
27
,
368
8
,
68
y
X
T
4045
,
0
6219
,
5
a
Model liniowy
• Interpretacja parametrów:
a
0
= 5,6219 określa liczbę noclegów (w mln) w hotelach na terenie Polski
w roku 1989 (okresie bezpośrednio poprzedzającym okres badany).
Wartość ta jest wartością teoretyczną, wynikającą z oszacowanej
funkcji trendu.
a
1
= 0,4045 oznacza, ze w badanym okresie liczba udzielonych noclegów
w hotelach na terenie Polski rosła średnio z roku na rok o 0,4045 mln
szt.
t
y
t
4045
,
0
6219
,
5
Szacowanie parametrów funkcji w arkuszu kalkulacyjnym Excel
Do oszacowania parametrów naszej funkcji możemy wykorzystać arkusz
kalkulacyjny Excel.
W wyniku zastosowania funkcji REGLINP mamy oszacowane zarówno
wartości estymatorów parametrów funkcji, jak również statystyki
określające stopień dopasowania (dokładne wyjaśnienie sposobu
zastosowania funkcji REGLINP można znaleźć w pracy A. Snarskiej,
2005: 149-152).
Miara
Składnia funkcji
Współczynnik regresji
=NACHYLENIE( )
=REGLINP( )
narzędzie analityczne: Regresja
dodaj linię trendu
Wyraz wolny w równaniu regresji
==REGLINP( ), ODCIĘTA( )
narzędzie analityczne: Regresja
dodaj linię trendu
Ocena modelu pod względem statystycznym
Weryfikacja modelu
Miary dopasowania modelu do danych empirycznych:
1.
Odchylenie standardowe reszt modelu :
–
rzeczywista (zaobserwowana) liczba noclegów w hotelach na terenie Polski różni się od
średnio o 0,082 mln od wartości teoretycznych otrzymanych na podstawie modelu.
2. Współczynnik determinacji :
– oznacza, że w 99,5% zmienność badanej zmiennej została wytłumaczona przez model.
3.
Średnie błędy ocen parametrów :
-
określają, o ile średnio pomyliliśmy się w szacowaniu parametrów modelu.
W świetle powyższych statystyk można stwierdzić, że oszacowany model
jest dobrze dopasowany do danych empirycznych, czyli zastosowana
postać funkcji trendu dobrze opisuje przebieg badanego zjawiska w
czasie (w badanym okresie). Na podstawie tego modelu możemy więc
wyznaczyć prognozę liczby noclegów na kolejne trzy lata.
082
,
0
Se
995
,
0
2
R
011
,
0
)
(
1
a
S
059
,
0
)
(
0
a
S
Prognozy (punktowe) liczby noclegów
Prognoza na rok 1999 (T=10)
Prognoza na rok 2000 (T=11)
Prognoza na rok 2001(T=12)
667
,
9
4045
,
0
6215
,
5
10
1
10
*
4045
,
0
6215
,
5
*
10
y
071
,
10
4045
,
0
6215
,
5
11
1
11
*
4045
,
0
6215
,
5
*
11
y
476
,
10
4045
,
0
6215
,
5
12
1
12
*
4045
,
0
6215
,
5
*
12
y
Trend nieliniowy -przykład.
W pewnym przedsiębiorstwie w 1996 roku podjęto produkcję nowego jogurtu. Koszt
produkcji 1000 litrów jogurtu (zł) w latach 1996-2004 kształtował się następująco:
1. W oparciu o analizę graficzną dokonać wyboru funkcji trendu, która będzie dobrze
dopasowana do danych empirycznych;
2. Oszacuj jej parametry i oceń model pod względem statystycznym.
3. Wyznacz prognozę punktową kosztów produkcji 1000 litrów jogurtu na rok 2005 i 2006.
Lata
1996
1997
1998
1999
2000
2001
2002
2003
2004
Koszt
produkcji
3000 2550 2400 2360 2260 2240 2230 2190 2160
Wykres
Dobór odpowiedniej postaci funkcji trendu poprzedzony jest analizą graficzną
rozkładu wartości badanej zmiennej w poszczególnych latach.
Jak wynika z powyższego, badane zjawisko charakteryzuje się coraz wolniejszym
trendem malejącym. Wydaje się także, że wartości kosztów nie przekroczą
pewnego stałego poziomu. Wszystkie te przesłanki pozwalają wywnioskować,
że dobrą funkcją może być funkcja hiperboliczno-liniowa :
1500
1700
1900
2100
2300
2500
2700
2900
3100
1996
1997
1998
1999
2000
2001
2002
2003
2004
t
α
α
t
f
1
0
)
(
0
1
α
Postać funkcji trendu
Powyższy model nie jest modelem liniowym, można go sprowadzić
jednak do postaci liniowej poprzez transformację zmiennych.
Dokładniej rzecz ujmując, przyjmijmy, że
co pozwala powyższy model transformować do postaci liniowej:
t
t
ξ
t
α
α
y
1
0
t
t
1
t
t
ξ
t
α
α
y
1
0
Wyniki estymacji modelu wykonane w arkuszu kalkulacyjnym EXCEL.
Ocena statystyczna modelu
Oszacowany model ma postać:
Nie jest jednak możliwa interpretacja parametrów modelu.
Transformacja modelu w postać liniową nie zmieniła lewej strony modelu (dalej po lewej stronie jest
poziom zmiennej objaśnianej), zatem możemy zinterpretować miary dopasowania modelu do danych
empirycznych (odchylenie standardowe reszt modelu, współczynnik determinacji, średnie błędy ocen
parametrów). A zatem:
•
Se = 21,37 [zł] oznacza, że rzeczywiste koszty wyprodukowania 1000 litrów jogurtu różnią się od
kosztów teoretycznych średnio o 21,37 zł.
•
R
2
= 0,99 – oznacza, że w 99% model wyjaśnia zmienność y-greka
Średnie błędy ocen parametrów również świadczą o wysokiej precyzji estymacji funkcji trendu.
Wobec powyższego, można uznać, iż oszacowany model jest dobrą aproksymacją przebiegu badanego
zjawiska w badanym okresie, można więc na jego podstawie wyznaczyć prognozę kosztów produkcji
jogurtu w dwóch kolejnych latach.
t
y
t
1
99
,
920
17
,
2087
^
Prognoza kosztów wyprodukowania 1000 l jogurtu na lata 2005-2006
• Prognoza dla roku 2005 (t=10)
• Prognoza dla roku 2006 (t=11)
27
,
2179
99
,
920
17
,
2087
10
1
1
10
1
99
,
920
17
,
2087
*
10
y
90
,
2170
99
,
920
17
,
2087
11
1
1
11
1
99
,
920
17
,
2087
*
11
y