3. Wyrównywanie szeregu czasowego za pomocą średnich (skrót)
Przedmiotem wykładu będą obecnie metody prognozowania oparte na wygładzaniu. Na pierwszym wykładzie omawiano strukturę szeregu czasowego zmiennej
, wyodrębniając składową systematyczną, cykliczną, sezonową i zakłócenie przypadkowe (losowe). Oryginalne szeregi czasowe zawierają zatem efekty oddziaływania czynników przypadkowych. Procedura wygładzania jest operacją wykonywaną na oryginalnych wyrazach szeregu czasowego. Oryginalne wartości są w toku procedury wygładzania zastępowane przez odpowiednio dobrane funkcje tych wyrazów, które szacują systematyczne i periodyczne składowe szeregu. Wartości wygładzone możemy interpretować jako wartości oczyszczone z zakłóceń losowych.
Wszystkie metody prognozowania, które omawiać będziemy w trakcie tego wykładu będą składały się z dwóch etapów:
wygładzania szeregu,
prognozowania szeregu.
Prognoza na okres
, wyznaczona w okresie
jest równa dostępnej w tym okresie wartości wygładzonej szeregu.
Schemat 3.1 Metody prognozowania oparte na wygładzaniu
Źródło: opracowanie własne
Schemat 3.1 prezentuje algorytm określający sposób postępowania w procedurach wykorzystujących metody prognozowania oparte na wygładzaniu. Ponieważ apriori trudno jest stwierdzić jaki sposób wygładzania zapewni najlepszą jakość prognozowania w odniesieniu do danego szeregu czasowego, algorytm zakłada prognozowanie obserwacji historycznych (ex post) oraz ocenę na tej podstawie dokładności prognozowania. Jeśli prognozy okazują się niewystarczająco dokładne (niedopuszczalne) następuje wybór nowego sposobu wygładzania i powrót do pierwszego etapu procedury.
Formalnie rzecz biorąc, dla szeregu czasowego liczącego
wyrazów, wygładzanie można opisać w następujący sposób:
;
gdzie
jest wartością wygładzoną na okres
w oparciu o informacje dostępne aż do tego okresu.
Prognozą ex post na okres
, wyznaczoną w okresie
jest:
;
.
W trakcie wykładu rozpatrywać będziemy różne sposoby wygładzania liniowego, wykorzystujące średnie wartości szeregu, które dla porządku pogrupujemy na następujące klasy:
według kryterium sposobu liczenia średniej wyodrębniać będziemy:
a) średnie nieważone,
b) średnie ważone,
według kryterium sposobu aktualizacji próby wyodrębniać będziemy:
a) średnie obliczane rekurencyjnie (przez dołączanie kolejnych obserwacji),
b) średnie ruchome (przez wymianę obserwacji, z zachowaniem stałej szerokości ,,okna'').
W praktyce zatem każdy sposób wygładzania, który rozpatrywać będziemy w trakcie wykładów, określony będzie przez dwa wyżej wymienione kryteria. Występować zatem będą średnie nieważone rekurencyjne i średnie nieważone ruchome oraz średnie ważone rekurencyjne i średnie ważone ruchome.
Cechą średniej nieważonej jest nadawanie tej samej wagi wszystkim obserwacjom z danego podzbioru, dla którego wyznaczana jest wartość średnia. Cechą średniej ważonej jest nadawanie różnych wag obserwacjom starszym i nowszym. Cechą średniej obliczanej rekurencyjnie jest uwzględnianie wszystkich obserwacji dostępnych w okresie
, natomiast cechą średniej ruchomej jest odrzucanie najstarszej obserwacji, za każdym razem, kiedy dołączona jest obserwacja najnowsza.
Schemat 3.2
Rodzaje średnich wykorzystywanych w wyrównywaniu szeregów czasowych
Źródło: opracowanie własne
3.1. Średnia arytmetyczna rekurencyjna nieważona
Rekurencyjna średnia arytmetyczna szeregu jest obliczana w następujący sposób:
;
.
Wszystkie obserwacje należące do podzbioru pierwszych
elementów szeregu mają wagi równe
. Rozpisując powyższą równość dla kolejnych
otrzymujemy:
………………………….
.
Przeszacowanie średniej na kolejny okres czasu następuje zatem w ślad za dołączeniem kolejnej obserwacji. Można zapisać rekurencyjną formułę średniej arytmetycznej w następujący sposób:
;
.
Wykorzystamy obecnie wygładzone wartości do prognozowania ex post, zgodnie z następującą formułą:
;
.
Prognozą na okres
, wyznaczaną w okresie
jest dostępna w tym okresie ocena średniej arytmetycznej (nieważonej) szeregu czasowego.
Błędem prognozy ex post jest:
;
.
Do opisu błędów ex post wykorzystywać będziemy, omówione w części poprzedniej, mierniki dokładności prognoz ex post, wraz z dekompozycjami prognostycznymi Theila.
W prognozowaniu ex ante wykorzystywana będzie dostępna w momencie wyznaczania prognozy średnia arytmetyczna. Ogólnie możemy zapisać, że:
;
.
Wyznaczone dla błędów ex post miary dokładności wykorzystywać będziemy do (przybliżonej) oceny dokładności prognoz ex ante.
3.2. Średnia arytmetyczna rekurencyjna ważona
Wygładzanie średnią nieważoną, jak pokazaliśmy w punkcie poprzednim, niesie zagrożenie wystąpienia systematycznego błędu przeszacowania/niedoszacowania składnika systematycznego w przypadku, gdy szereg czasowy jest niestacjonarny (z tendencją malejącą/rosnącą). Jednym ze sposobów eliminacji tego typu błędów jest ważenie obserwacji. Intuicyjnie rzecz biorąc, z punktu widzenia wyznaczenia wartości wygładzonej na okres
, informacje starsze powinny mieć mniejszą wagę niż obserwacje nowsze, w szczególności obserwacja bieżąca.
Średnią arytmetyczną ważoną
, wyznaczoną na okres
, definiuje następująca równość:
;
,
gdzie
oznacza wagę przypisaną obserwacji o numerze
, w szeregu zawierającym
obserwacji.
O wagach zakładamy, że każda z nich jest unormowana na przedziale
oraz że sumują się do jedności, co zapiszemy:
;
.
W wielu przypadkach, choć nie jest to bezwzględnie konieczne, zakładać będziemy, że wagi monotonicznie maleją jak rośnie odległość danego okresu od okresu bieżącego
, co zapiszemy:
.
Rozpisując wzór na średnią dla kolejnych okresów otrzymujemy:
……………………………
.
W literaturze przedmiotu najczęściej omawiane są trzy rodzaje wag:
wagi harmoniczne
,
wagi liniowe
,
wagi geometryczne
.
Wszystkie trzy rodzaje wag spełniają trzy wymienione wyżej warunki. Różnica między nimi polega na różnym tempie wygasania w miarę oddalania się od okresu bieżącego. Wagi harmoniczne charakteryzują się tym, że ich przyrosty są odwrotnie proporcjonalne do czasu. Wagi liniowe mają stałe przyrosty, natomiast wagi geometryczne stałe ilorazy.
Wagi harmoniczne definiowane są następująco:
;
;
.
W tablicy 3.1 podane są wagi harmoniczne dla szeregów czasowych liczących od
do
obserwacji. Jak widać wszystkie wagi są unormowane, monotoniczne i sumują się do jedności. Przykładowe obliczenia dla
podajemy poniżej:
;
;
;
.
Tablica 3.1 Wagi harmoniczne
|
|
|
|
|
|
|
|
|
1 |
1,000 |
0,250 |
0,111 |
0,063 |
0,040 |
0,028 |
0,020 |
0,016 |
2 |
|
0,750 |
0,278 |
0,146 |
0,090 |
0,061 |
0,044 |
0,033 |
3 |
|
|
0,611 |
0,271 |
0,157 |
0,103 |
0,073 |
0,054 |
4 |
|
|
|
0,521 |
0,257 |
0,158 |
0,109 |
0,079 |
5 |
|
|
|
|
0,457 |
0,242 |
0,156 |
0,111 |
6 |
|
|
|
|
|
0,408 |
0,228 |
0,152 |
7 |
|
|
|
|
|
|
0,370 |
0,215 |
8 |
|
|
|
|
|
|
|
0,340 |
.... |
|
|
|
|
|
|
|
|
|
1,000 |
1,000 |
1,000 |
1,000 |
1,000 |
1,000 |
1,000 |
1,000 |
Źródło: opracowanie własne
Źródło: opracowanie własne
Wagi liniowe
dane są wzorem:
;
,
przy czym
.
W tablicy 3.2 podane są wagi harmoniczne dla szeregów czasowych liczących od
do
obserwacji. Przykładowe obliczenia dla
podajemy poniżej:
;
;
.
Widać wyraźnie, że wagi te, dla ustalonego
mają stałe przyrosty.
Tablica 3.2. Wagi liniowe
|
|
|
|
|
|
|
|
|
1 |
1,000 |
0,333 |
0,167 |
0,100 |
0,067 |
0,048 |
0,036 |
0,028 |
2 |
|
0,667 |
0,333 |
0,200 |
0,133 |
0,095 |
0,071 |
0,056 |
3 |
|
|
0,500 |
0,300 |
0,200 |
0,143 |
0,107 |
0,083 |
4 |
|
|
|
0,400 |
0,267 |
0,190 |
0,143 |
0,111 |
5 |
|
|
|
|
0,333 |
0,238 |
0,179 |
0,139 |
6 |
|
|
|
|
|
0,286 |
0,214 |
0,167 |
7 |
|
|
|
|
|
|
0,250 |
0,194 |
8 |
|
|
|
|
|
|
|
0,222 |
.... |
|
|
|
|
|
|
|
|
|
1,000 |
1,000 |
1,000 |
1,000 |
1,000 |
1,000 |
1,000 |
1,000 |
Źródło: opracowanie własne
Źródło: opracowanie własne
Wagi geometryczne
definiowane są za pomocą wzoru:
;
.
Zmienność wag geometrycznych zależy od parametru
. Wziąwszy
bliskie zera, co pokazuje tablica 3.3, otrzymujemy wagi szybko zbiegające do zera, w miarę wzrostu odległości od okresu bieżącego
. Biorąc
bliskie jedności, co pokazuje tablica 3.5, otrzymujemy wagi wolno malejące w miarę wzrostu odległości od okresu bieżącego. Obliczenia dla
oraz
i
podajemy poniżej:
;
;
,
;
;
.
Tablica 3.3. Wagi geometryczne,
|
|
|
|
|
|
|
|
|
1 |
1,000 |
0,091 |
0,009 |
0,001 |
0,000 |
0,000 |
0,000 |
0,000 |
2 |
|
0,909 |
0,090 |
0,009 |
0,001 |
0,000 |
0,000 |
0,000 |
3 |
|
|
0,901 |
0,090 |
0,009 |
0,001 |
0,000 |
0,000 |
4 |
|
|
|
0,900 |
0,090 |
0,009 |
0,001 |
0,000 |
5 |
|
|
|
|
0,900 |
0,090 |
0,009 |
0,001 |
6 |
|
|
|
|
|
0,900 |
0,090 |
0,009 |
7 |
|
|
|
|
|
|
0,900 |
0,090 |
8 |
|
|
|
|
|
|
|
0,900 |
.... |
|
|
|
|
|
|
|
|
|
1,000 |
1,000 |
1,000 |
1,000 |
1,000 |
1,000 |
1,000 |
1,000 |
Źródło: opracowanie własne
Tablica 3.4 Wagi geometryczne,
|
|
|
|
|
|
|
|
|
||||||||
1 |
1,000 |
0,333 |
0,143 |
0,067 |
0,032 |
0,016 |
0,008 |
0,004 |
||||||||
2 |
|
0,667 |
0,286 |
0,133 |
0,065 |
0,032 |
0,016 |
0,008 |
||||||||
3 |
|
|
0,571 |
0,267 |
0,129 |
0,063 |
0,031 |
0,016 |
||||||||
4 |
|
|
|
0,533 |
0,258 |
0,127 |
0,063 |
0,031 |
||||||||
5 |
|
|
|
|
0,516 |
0,254 |
0,126 |
0,063 |
||||||||
6 |
|
|
|
|
|
0,508 |
0,252 |
0,125 |
||||||||
7 |
|
|
|
|
|
|
0,504 |
0,251 |
||||||||
8 |
|
|
|
|
|
|
|
0,502 |
||||||||
.... |
|
|
|
|
|
|
|
|
||||||||
|
1,000 |
1,000 |
1,000 |
1,000 |
1,000 |
1,000 |
1,000 |
1,000 |
Źródło: opracowanie własne
Tablica 3.5 Wagi geometryczne,
|
|
|
|
|
|
|
|
|
1 |
1,000 |
0,474 |
0,299 |
0,212 |
0,160 |
0,126 |
0,102 |
0,084 |
2 |
|
0,526 |
0,332 |
0,236 |
0,178 |
0,140 |
0,113 |
0,093 |
3 |
|
|
0,369 |
0,262 |
0,198 |
0,156 |
0,126 |
0,104 |
4 |
|
|
|
0,291 |
0,220 |
0,173 |
0,140 |
0,115 |
5 |
|
|
|
|
0,244 |
0,192 |
0,155 |
0,128 |
6 |
|
|
|
|
|
0,213 |
0,173 |
0,142 |
7 |
|
|
|
|
|
|
0,192 |
0,158 |
8 |
|
|
|
|
|
|
|
0,176 |
.... |
|
|
|
|
|
|
|
|
|
1,000 |
1,000 |
1,000 |
1,000 |
1,000 |
1,000 |
1,000 |
1,000 |
Źródło: opracowanie własne
Źródło: opracowanie własne
Źródło: opracowanie własne
Źródło: opracowanie własne
Wagi geometryczne są zatem bardzo elastyczne, bowiem dobierając odpowiednią wartość parametru
otrzymujemy bardzo różne sposoby ważenia obserwacji historycznych. Powstaje problem, jakie wagi wybrać oraz jakie kryterium wyboru przyjąć? Odpowiedź na to pytanie wynika z analizy błędów ex post. Jak w każdej metodzie prognozowania opartej na wygładzaniu, prognoza jest wyznaczana na poziomie dostępnej w okresie
wartości wygładzonej. W naszym przypadku zapiszemy:
;
.
Błąd prognozy ex post obliczymy jak poprzednio:
,
.
Zauważmy, że prognoza jest funkcją wag, gdyż wartości średniej ważonej zależą od wag. Zapiszemy symbolicznie, że:
.
Błąd prognozy ex post będzie zatem także funkcją wag:
.
W konsekwencji wszystkie parametry rozkładu błędów prognoz ex post będą funkcjami wag. Zatem naturalnym sposobem wyboru wag będzie optymalizacja wybranego miernika rozkładu błędów względem wag. Jako kryterium wyboru możemy przyjąć na przykład:
minimalizację średniego kwadratowego błędu prognozy, wtedy zapiszemy:
,
minimalizację średniego absolutnego, procentowego błędu prognozy, co zapiszemy:
,
maksymalizację współczynnika korelacji liniowej Persona (kwadratu tego współczynnika) pomiędzy realizacjami zmiennej prognozowanej a prognozami wyprzedzeniem j okresów, co zapiszemy:
.
W tablicach 3.22 - 3.33 przedstawiono wyniki procesu prognozowania stopy inflacji z wyprzedzeniem jednego okresu z wykorzystaniem różnych ważonych średnich rekurencyjnych.
3.3. Średnia ruchoma nieważona
Wyrównywanie (wygładzanie) szeregu czasowego omówioną w punkcie poprzednim metodą średniej arytmetycznej szeregu daje wyniki obciążone systematycznym błędem, szczególnie w przypadku niestacjonarnych szeregów czasowych, charakteryzujących się występowaniem tendencji rosnącej (malejącej). Jak pokazaliśmy, w przypadku tendencji malejącej wyrównanie średnią arytmetyczną daje systematyczne przeszacowanie realizacji szeregu czasowego, w przypadku tendencji rosnącej odwrotnie. Dlatego też często stosowanym, elastycznym sposobem wygładzania szeregu czasowego jest zastosowanie średniej ruchomej.
Załóżmy, że dysponujemy szeregiem czasowym
,
. Średnią ruchomą nieważoną nazywać będziemy ciąg średnich (arytmetycznych) szeregu wyznaczonych w następujący sposób:
;
,
gdzie
jest parametrem nazywanym ,,szerokością okna'' wygładzania. Wybór stałej
przesądza o tym w jaki sposób następować będzie wygładzanie szeregu. Przyjmując małe
otrzymujemy tzw. średnią szybką, tj. liczoną na podstawie niewielkiej liczby okresów, szybko reagującą na wymianę informacji. Przyjmując
duże, otrzymujemy tzw. średnią wolną, tj. liczoną na podstawie dużej liczby okresów, gdzie wymiana obserwacji nie wpływa na istotne przeszacowanie średniej.
Rozpisując dla kolejnych t otrzymujemy:
……………………………
Przykład dla k=2:
……………………………
Średnia ruchoma jest to zatem średnia liczona dla kolejnych, przesuwanych po osi czasu przedziałów, kiedy w kolejnym przedziale czasowym najstarsza obserwacja jest odrzucana, natomiast kolejna najnowsza jest dołączana.
Dla szeregu czasowego liczącego
wyrazów, liczba wyznaczonych średnich ruchomych wynosi zatem
.
Prognozę ex post wyznaczymy w następujący sposób:
;
.
3.4. Średnia ruchoma ważona
Średnią ruchoma ważoną
, wyznaczoną na okres
, definiuje następująca równość:
;
,
gdzie
oznacza wagę przypisaną obserwacji o numerze
, w szeregu zawierającym
obserwacji.
O wagach zakładamy, że każda z nich jest unormowana na przedziale
oraz że sumują się do jedności, co zapiszemy:
;
.
Ponieważ w średniej ruchomej szerokość okna jest ustalona i równa ,,k'', zatem wagi zależą od ,,k'' i są ustalone dla całej próby. Rozpisując dla kolejnych t otrzymujemy:
……………………………
Przykład dla k=2:
……………………………
Wagi harmoniczne definiowane dla ustalonego
są następująco:
;
;
.
Przykład wag harmonicznych dla dla
:
;
;
Wagi liniowe dla ustalonego
dane są wzorem:
;
,
przy czym
.
Przykład wag liniowych dla
:
;
.
Wagi geometryczne dla ustalonego
definiowane są za pomocą wzoru:
;
.
Przykład wag geometrycznych dla
:
;
.
Materiał dydaktyczny do wykorzystania przez studentów uczestniczących w wykładach z Prognozowania, prowadzonych przez Tadeusza W. Bołta.
Szczegółowo na ten temat w kolejnych punktach wykładu.
W przypadku omawianych w częściach następnych wag w wygładzaniu metodą wyrównywania wykładniczego, wagi nie muszą spełniać tego warunku.
Zob. np. Z.Czerwiński, B.Guzik, Prognozowanie ekonometryczne, PWE Warszawa, 1980, str. 216-218.
Górny indeks w nawiasie
oznacza szerokość okna wygładzania.
Wybór
sprowadza omawianą metodę do prognozowania bez wygładzania, omówionego jako ,,metoda naiwna'' w trakcie wykładu 2.
Prognozowanie, Tadeusz W.Bołt,
1
Wygładzanie szeregu daną metodą (1)
Prognozowanie obserwacji
historycznych (2)
Prognozy nie -dopuszczalne
Prognozy dopuszczalne
Prognozowanie
ex ante (3a)
Wybór nowej metody
wygładzania (3b)
Rodzaje
średnich
Rekurencyjne
(SR)
Ruchome
(SM)
Nieważone
(SRN)
Ważone
(SRW)
Nieważone
(SMN)
Ważone
(SMW)