1
II.
PROGNOZOWANIE NA PODSTAWIE SZEREGÓW CZASOWYCH
1. Składowe szeregów czasowych
Tradycyjnie w szeregach czasowych wyróżnia się dwie składowe : składową
systematyczną , będącą efektem oddziaływań stałego zestawu czynników na zmienną
prognozowaną oraz składową przypadkową – zwaną często składnikiem losowym lub
wahaniami przypadkowymi. Składowa systematyczna może wystąpić w postaci tendencji
rozwojowej /trendu/ lub stałego przeciętnego poziomu zmiennej prognozowanej oraz
składowej okresowej /składowej periodycznej/. Składowa okresowa występuje w postaci
wahań cyklicznych lub sezonowych.
Y
t - czas
Rys. 1. Szereg czasowy
Y
wahania cykliczne
wahania sezonowe
stały poziom
trend
wahania
przypadkowe
t - czas
Rys. 2. Dekompozycja szerego czasowego.
2
Tendencja rozwojowa, zwana trendem, jest długookresową skłonnością do
jednokierunkowych zmian /wzrostu lub spadku/ wartości badanej zmiennej. Jest
rozpatrywana jako konsekwencja działania stałego zestawu czynników, takich jak np. w
przypadku sprzedaży – liczba potencjalnych klientów, technologia czy preferencje
konsumentów. Może być wyznaczona, gdy dysponuje się długim ciągiem obserwacji.
Stały /przeciętny/ poziom prognozowanej zmiennej występuje wówczas, gdy w szeregu
czasowym nie ma tendencji rozwojowej, wartości zmiennej prognozowanej oscylują zaś
wokół pewnego /stałego poziomu/.
Wahania cykliczne wyrażają się w postaci długookresowych rytmicznych wahań wartości
wokół tendencji rozwojowej lub stałego / przeciętnego/ poziomu tej zmiennej. W ekonomii są
one na ogół związane z cyklem koniunkturalnym gospodarki.
Wahania sezonowe są wahaniami wartości obserwowanej zmiennej wokół tendencji
rozwojowej lub stałego / przeciętnego/ poziomu tej zmiennej. Wahania te, mające skłonność
do powtarzania się w określonym czasie, nie przekraczającym jednego roku, odzwierciedlają
wpływ „kalendarza” na działalność gospodarczą.
Trend
Rys. 3. Trend
Y
t - kwartały
Rys. 4. Trend z wahaniami sezonowymi
3
Y
t
Rys. 5. Trend z wahaniami cyklicznymi
Proces wyodrębniania poszczególnych składowych danego szeregu czasowego określa
się mianem dekompozycji szeregu. Identyfikację poszczególnych składowych szeregu
czasowego konkretnej zmiennej umożliwia – w wielu przypadkach- ocena wzrokowa
sporządzonego wykresu. Wykres szeregu czasowego umożliwia ponadto wykrycie obserwacji
nietypowych oraz punktów zwrotnych.
Dla wielu szeregów czasowych wystarczająco adekwatne mogą się okazać modele
zawierające tylko niektóre składowe. Inne szeregi mogą wymagać budowy modeli ze
wszystkimi składowymi szeregu czasowego.
Pytanie, na które należy w takich przypadkach odpowiedzieć brzmi: czy można traktować
wyraźne odchylenie niektórych danych od poszczególnych obserwacji szeregu czasowego
tylko jako normalne wahanie losowe / wahanie przypadkowe/ lub wahanie okresowe, czy tez
należy przyjąć, że zostały popełnione błędy w rejestracji danych lub może wystąpiła
gwałtowna zmiana rozpatrywanego zjawiska. Występowanie w szeregu czasowym
obserwacji nietypowych może w poważnym stopniu wpłynąć na rezultat procesu konstrukcji
prognoz. Konieczne może być wówczas wyeliminowanie tego rodzaju obserwacji z szeregu
czasowego.
Innym ważnym zagadnieniem jest występowanie w szeregu czasowym tzw. punktów
zwrotnych. W punktach tych następuje zmiana kierunku tendencji rozwojowej /ze
wzrostowej do spadkowej i odwrotnie/ bądź zmiana tempa wzrostu lub spadku wartości
zmiennej. Występowanie punktów zwrotnych, wpływające w istotny sposób na przebieg
procesu prognozowania może wymagać użycia specjalnych metod prognozowania, np.
analogowych, heurystycznych bądź opartych na funkcjach segmentowych, a nie na funkcjach
analitycznych tendencji wzrostowej; w skrajnych przypadkach może nawet udaremnić
prognozowanie.
4
Proces prognozowania polega na przetwarzaniu informacji o przeszłości oraz przejście od
informacji przetworzonej do prognozy. W przypadku prognozowania na podstawie szeregu
czasowego przetwarzanie informacji o przeszłości następuje przez budowę odpowiedniego
modelu formalnego, przejście zaś od informacji przetworzonej do prognozy – przez wybór
reguły prognozowania.
Używanie w prognozowaniu modeli szeregów czasowych jest spowodowane trzema
głównymi przyczynami :
- po pierwsze, zjawisko jest zbyt złożone, by można było je opisać i zrozumieć bez
użycia modeli.
- po
drugie,
głównym zadaniem prognosty jest przewidzenie tego, co się zdarzy, a nie
wyjaśnienie, dlaczego to się zdarzy.
- po trzecie zaś, koszty zdobycia wiedzy o przyczynach występowania
przewidywanych zjawisk mogą być niewspółmiernie wysokie w porównaniu z
konstrukcją prognozy opartą na modelu szeregu czasowego.
Modelem szeregu czasowego służącym do określenia przyszłej wartości zmiennej
prognozowanej
Y
w momencie /okresie/ prognozowania
t
tj.
∗
t
y
jest model formalny,
którego zmiennymi objaśniającymi /wyjścia/ mogą być tylko zmienne czasowe oraz przyszłe
wartości lub prognozy zmiennej
Y
.
Model szeregu czasowego przedstawia zatem prognozowany system, którym może być
gospodarka narodowa, wielkość /wartość/ sprzedaży przedsiębiorstwa, dochody rodziny itp.
Jako czarną skrzynkę
Zmienne Zmienna
wejścia prognozowana
Rys. 6. System prognozowania.
Ogólna postać szeregu czasowego jest następująca:
(
)
t
p
t
t
p
t
t
t
y
y
y
y
t
f
y
ε
,
,......,
,
,......,
,
*
*
1
1
*
−
−
−
−
=
/ 1 /
gdzie:
*
*
1
*
,......,
,
p
t
t
t
y
y
y
−
−
- prognoza zmiennej
Y
wyznaczona na okres
p
t
t
t
−
−
,......,
1
,
p
t
t
y
y
−
−
,......,
1
- zaobserwowane wartości zmiennej
Y
w momencie /okresie
p
t
t
−
−
,......,
1
System
5
t
- zmienna czasowa
p
- wielkość opóźnienia
ε
- składnik losowy
W zależności od przyjętych założeń odnośnie wpływu poszczególnych składowych
szeregu czasowego na prognozowaną zmienną oraz wzajemnych relacji tych składowych,
konstruowany model może mieć różną formę. Na ogół przyjmuje się addytywną lub
multiplikatywną formę modelu.
W modelu addytywnym – zakłada się, że obserwowane wartości zmiennej prognozowanej
są sumą /wszystkich lub niektórych/ składowych szeregu czasowego. Jeśli jedyną zmienną
objaśniającą modelu jest zmienna czasowa, to postać modelu może być następująca:
( ) ( ) ( )
t
t
t
h
t
g
t
f
Y
ε
+
+
+
=
/ 2 /
lub :
( ) ( )
t
t
t
h
t
g
const
Y
ε
+
+
+
=
/ 3 /
gdzie :
( )
t
f
- funkcja czasu, charakteryzująca tendencję rozwojową, nazywana funkcją
trendu,
( )
t
g
- funkcja czasu, charakteryzująca wahania sezonowe,
( )
t
h
- funkcja czasu, charakteryzująca wahania cykliczne,
ε
- składnik losowy,
const
- stały (średni poziom prognozowanej zmiennej )
Zakłada się więc, że występuje interakcja pomiędzy poszczególnymi składowymi szeregu; są
one niezależne.
W modelu multiplikatywnym przyjmuje się, że obserwowane wartości zmiennej
prognozowanej są iloczynem / wszystkich lub niektórych/ składowych szeregu czasowego.
Jeśli jedyną zmienną objaśniającą modelu jest zmienna czasowa, to postać modelu może być
następująca:
( ) ( ) ( )
t
t
t
h
t
g
t
f
Y
ε
∗
∗
∗
=
/ 4 /
lub :
( ) ( )
t
t
t
h
t
g
const
Y
ε
∗
∗
∗
=
/ 5 /
Możliwe jest takie stosowanie różnego rodzaju postaci modeli mieszanych – addytywno-
multiplikatywnych, które są o wiele bardziej skomplikowane i trudniejsze zarówno do
estymacji jak też interpretacji .
6
Konstrukcja prognozy na podstawie modelu szeregu czasowego polega na ogół na
ekstrapolacji funkcji trendu, a następnie na jej korekcie uwzględniającej oddziaływanie wahań
okresowych /sezonowych i cyklicznych/ na prognozowaną zmienną. Zakłada się, że wartość
oczekiwana składnika losowego dla modeli, w których oddziaływanie wahań przypadkowych
nakłada się multiplikatywnie na wszystkie lub niektóre składowe szeregu, równa się jeden, w
przypadku zaś, gdy wahania przypadkowe nie występują jako iloczyn z inną składową
szeregu czasowego-zero.
2. Naiwne metody prognozowania
Metody określane mianem naiwnych są oparte na bardzo prostych przesłankach dotyczących
przyszłości: np.:
- sprzedaż przedsiębiorstwa w następnym kwartale będzie kształtowana na
dotychczasowym poziomie
- zysk
wzrośnie w tym samym stopniu co ubiegłym miesiącu.
Umożliwiają one /na ogół/ konstrukcję prognoz krótkookresowych – na jeden okres.
Najbardziej znana z tych metod polega na konstrukcji prognozy na moment –okres t na
poziomie zaobserwowanej wartości zmiennej prognozowanej w momencie /okresie t-1/
Model ma postać następującą
t
t
y
y
=
+
*
1
/ 6 /
−
+
*
1
t
y
prognoza zmiennej
Y
na moment
1
+
t
−
t
y
wartość zmiennej prognozowanej w momencie
t
Metoda ta jest oparta na znanym w statystyce modelu błądzenia losowego. Badania
dowiodły, że rynki papierów wartościowych, walut i niektórych towarów można dobrze
opisać, używając tego rodzaju modelu
1
.
Gdy w szeregu czasowym występuje tendencja rozwojowa do budowy prognozy na moment
1
+
t
na poziomie zaobserwowanej wartości zmiennej prognozowanej w momencie
t
powiększonym o zaobserwowany przyrost tej zmiennej momencie
t
w porównaniu z
momentem
1
−
t
(
)
1
*
1
−
+
−
+
=
t
t
t
t
y
y
y
y
/ 7 /
1
Makridakis S, Wheelwright Forecasting .Methods for Management J. Wiley and Sons. New Jork,1989 za :
M.Cieślak (red.) Prognozowanie gospodarcze, AE Wrocław,1993
7
Jeżeli prognozowana zmienna np. sprzedaż, wykazuje tendencję do wzrostu /spadku/ , to do
prognozowania można użyć metodę, w której przyjmuje się, że wartość prognozowanej
zmiennej wzrośnie /spadnie/ w momencie prognozowanym
1
+
t
o określony procent w
porównaniu z poziomem tej zmiennej w momencie poprzedzającym t
(
)
t
t
y
c
y
+
=
+
1
*
1
/ 8 /
c – wskaźnik wzrostu (lub spadku, gdy c jest ujemne )
np.
t
t
y
y
01
,
1
*
1
=
+
/ 9 /
Podobna jest metoda oparta na założeniu iż prognoza w momencie
1
+
t
będzie równa
zaobserwowanej wartości zmiennej prognozowanej w momencie t, powiększonej o pewną
stałą c. Postać tego modelu jest następująca:
c
y
y
t
t
+
=
+
*
1
/ 10 /
Prognoza może być także konstruowana metodą opartą na założeniu, że wartość zmiennej w
momencie
1
+
t
będzie równa zaobserwowanej wartości zmiennej prognozowanej w
momencie t powiększonym o średni przyrost wartości zmiennej w dostępnym materiale
statystycznym.
Odpowiedni model ma postać:
(
)
∑
−
−
+
=
−
=
−
+
1
1
1
*
1
1
1
t
i
i
i
t
t
y
y
t
y
y
/ 11 /
W przypadku występowania w szeregu czasowym zmiennej prognozowanej wahań
sezonowych np. kwartalnych można użyć metody polegającej na budowie prognozy na
kwartał t + 1 na poziomie zaobserwowanej wartości zmiennej w korespondującym kwartale z
ubiegłego roku tj. t + 1 – 4
Model ten będzie następujący:
3
*
1
−
+
=
t
t
y
y
/ 12 /
Można także budować prognozę na moment t + 1
1
*
1
+
+
=
t
t
t
t
c
c
y
y
/ 13 /
gdzie :
−
+
1
,
t
t
c
c
wskaźniki sezonowości dla okresów
1
t
oraz
+
t
8
Metody naiwne są proste, czyli łatwe do zrozumienia oraz szybkie i tanie w zastosowaniu.
Trafność prognoz wyznaczonych z ich użyciem jest na ogół niska, chociaż nie pozbawiona
sensu. Metody naiwne mogą być używane do porównywania trafności konstruowanych za ich
pomocą prognoz i prognoz budowanych innymi, bardziej skomplikowanymi metodami oraz
oceny celowości stosowania innych metod prognozowania.
Ocenę jakości prognoz naiwnych przeprowadza się jedynie ex post, nie ma bowiem
możliwości określenia błędów ex ante.
3. Modele tendencji rozwojowej w prognozowaniu
3.1. Istota prognozowania na podstawie modeli tendencji rozwojowej.
Model tendencji rozwojowej /trendu/ należy do szczególnej klasy modeli
ekonometrycznych, w których zmienność zmiennej objaśniającej opisywana jest przez
specyficzną zmienną objaśnianą jaką jest czas. Na ogół modele te nie wyjaśniają mechanizmu
kształtowania się rozpatrywanej zmiennej objaśnianej, lecz obrazują kształtowanie się jej w
czasie.
Można powiedzieć, że model trendu w sposób pośredni opisuje ten mechanizm,
szczególnie wtedy gdy zmienne objaśniające są silnie skorelowane ze sobą i jednocześnie z
czasem. Modele te z powodzeniem wykorzystuje się zarówno do predykcji średniookresowej,
gdy rozważa się model tendencji rozwojowej z wahaniami periodycznymi.
Wykorzystanie modeli tendencji rozwojowej do prognozownia średnio /do 5 lat/ a nawet
długookresowego /powyżej 5 lat/ daje dobre wyniki, gdy rozwój zjawiska w czasie wykazuje
bardzo trwałe i systematyczne zmiany jednokierunkowe, przy jednoczesnym ograniczonym
oddziaływaniu losowości. Przykładem takich zjawisk jest kształtowanie się podstawowych
wielkości makroekonomicznych np. PKB, wydajność pracy, poziom zatrudnienia, liczba
ludności itp.
Stosowanie modeli tendencji rozwojowej do prognozowania ma szereg zalet
2
:
1. Do budowy odpowiedniego modelu niezbędne są jedynie informacje empiryczne
odnoszące się do zmiennej prognozowanej.
2. Przy budowie prognozy nie występuje kłopotliwy problem znajomości zmiennych
objaśniających w okresie prognozowanym, gdyż zagadnienie sprowadza się do prostej
ekstrapolacji funkcji trendu przez nadanie odpowiedniej wartości zmiennej czasowej w
okresie prognozowanym, gdyż zagadnienie sprowadza się do prostej ekstrapolacji funkcji
2
A. Zeliaś. Teoria prognozy, PWE Warszawa 1997 s. 74
9
trendu przez nadanie odpowiedniej wartości zmiennej czasowej w okresie
prognozowanym.
3. Modele tendencji rozwojowej wykorzystywane do prognozowania są w przeważającej
części liniowe względem parametrów lub dają się łatwo do takich sprowadzić, stąd nie ma
trudności z ich estymacją.
4. Łatwo można także ocenić dokładność budowanych prognoz, wykorzystując mierniki
dokładności prognoz ex ante .
Trzeba także zwrócić uwagę na pewne trudności jakie mają miejsce w trakcie budowy
prognoz na podstawie modeli tendencji rozwojowej. Do najważniejszych z nich należą:
1. Trafny wybór analitycznej postaci modeli trendu będącego podstawą prognozowania
2. Występująca często autokorelacja składnika losowego.
Przydatność poszczególnych modeli tendencji wzrostowej do celów prognostycznych
oceniana jest różnie. Z. Pawłowski uważa, że trendy liniowy i wielomianowe mają
ograniczoną przydatność w procesie predykcji
3
. Ograniczoność ta wynika z faktu, że są to
funkcje, które nie posiadają asymptot poziomych. O ile w zaobserwowanym przedziale
zmienności zmiennej czasowej funkcje liniowe i wielomiany dają dobrą zgodność
wartości teoretycznych zmiennej prognozowanej z jej wartościami empirycznymi, to po
wyjściu poza tę zmienność zgodność jest zwykle gorsza. Nie ma bowiem racjonalnego
uzasadnienia, że poza obserwowanym odcinkiem czasu rozwój zmiennej prognozowanej
będzie odpowiadał przebiegowi określonego wielomianu. Na tej podstawie większą
użyteczność w prognozowaniu mają te modele tendencji rozwojowej, które posiadają
asymptoty poziome, gdyż zjawiska gospodarcze „ mają swoje naturalne granice”. Z tą
tezą można się zgodzić, przynajmniej jeżeli analizujemy krótkie lub średnie okresy – w
dłuższych okresach postęp techniczny dość często „łamał asymptoty poziome”.
3.2. Analityczne postaci modeli tendencji rozwojowej
Ogólnie model trendu można zapisać:
( )
ε
+
=
t
f
Y
t
n
t
,......,
2
,
1
=
/ 14 /
lub :
( )
ε
∗
=
t
f
Y
t
n
t
,......,
2
,
1
=
/ 15 /
( )
−
t
f
funkcja trendu
3
Z. Pawłowski, Zasady predykcji ekonometrycznej, PWN Warszawa 1982, s.210-211
10
−
ε
składnik losowy /zmienna losowa/ charakteryzująca efekty oddziaływań wahań
przypadkowych na trend, której wartość oczekiwana jest równa 0 w przypadku modeli
addytywnych lub 1 w przypadku modeli multiplikatywnych, a wariancja składnika
losowego jest skończona.
Analizując postać funkcji f /t/ można wybierać w różny sposób. Niekiedy jej postać wynika z
pewnej teorii ekonomicznej lub przyrodniczej i wtedy naszym zadaniem jest poprzez budowę
estymację modeli jej weryfikacja.
Najczęściej jednak postać analityczną odczytujemy z rozrzutu punktów czyli wykresów
zwłaszcza, że modele trendu to funkcje z jedną zmienną, które stosunkowo łatwo jest
wykreślić.
3.2.1. Liniowy model trendu
Jest najprostszym i i najczęściej wykorzystywanym modelem tendencji rozwojowej
postaci:
ε
α
β
+
+
=
t
Y
t
/ 16 /
Parametry tego modelu szacujemy najczęściej Klasyczną Metoda Najmniejszych Kwadratów
– oczywiście wtedy gdy spełnione są jej założenia
( )
0
.
1
=
ε
E
( )
I
.
2
2
2
σ
εε =
T
D
/ 17 /
n
k
rz
≤
+
=
1
X
.
3
−
X
.
4
macierz obserwacji zmiennych objaśniających w tym przypadku
zmiennej czasowej ma ustalone wartości.
Wtedy :
( )
y
X
X
X
T
1
T
−
=
a
b
gdzie : / 18 /
=
n
1
2
1
1
1
X
Μ
Μ
lub w postaci algebraicznej :
11
(
)( )
( )
∑ −
∑
−
−
=
=
=
n
t
n
t
t
t
t
t
t
y
y
a
1
2
1
lub
( )
(
)
1
12
2
1
−
∑ −
=
=
n
n
y
t
t
a
n
t
t
gdyż :
( )
(
)
∑
−
=
−
=
n
t
n
n
t
t
1
2
2
12
1
/ 19 /
t
a
y
b
−
=
Ocenę wariancji odchyleń losowych trendu liniowego otrzymujemy ze wzoru (tzw. wariancja
resztowa) :
2
1
2
2
−
∑
=
=
n
e
S
n
t
t
e
/ 20 /
Standardowe błędy szacunku (oceny) parametrów
α
oraz
β
wynoszą :
( )
( )
(
)
12
1
2
1
2
−
=
∑ −
=
=
n
n
S
t
t
S
a
S
e
n
t
e
( )
( )
(
)
1
12
1
12
2
1
2
2
2
1
2
1
2
1
2
−
∑
=
−
∑
=
∑ −
∑
=
=
=
=
=
n
t
n
S
n
n
t
S
t
t
n
t
S
b
S
n
t
e
n
t
e
n
t
n
t
e
/ 21 /
i dalej wiedząc , że :
(
)(
)
∑
+
+
=
=
n
t
n
n
n
t
1
2
6
1
1
2
otrzymujemy :
( )
(
)
(
)
1
1
2
2
−
+
=
n
n
n
S
b
S
e
Oceny dopasowania modelu do danych empirycznych dokonujemy obliczając :
- współczynnik zbieżności
2
φ
:
(
)
∑
−
∑
=
=
=
n
t
t
n
t
t
y
y
e
1
2
1
2
2
φ
/ 22 /
- współczynnik determinacji
2
2
1
φ
−
=
R
:
12
(
)
∑
−
∑
−
=
=
=
n
t
t
n
t
t
y
y
e
R
1
2
1
2
2
1
/ 23 /
- oraz skorygowany współczynnik determinacji
2
R
:
(
)
2
2
2
1
1
R
k
n
k
R
R
−
−
−
−
=
/ 24 /
Należy zbadać istotność parametrów korzystając z faktu, że statystyki :
( )
( )
b
S
b
t
oraz
a
S
a
t
b
a
=
=
/ 25 /
mają rozkład
Studenta
t
−
o
1
−
−
k
n
stopniach swobody na poziomie istotności
γ
Należy również zbadać czy wstępuje autokorelacja składników losowych obliczając
współczynnik autokorelacji reszt rzędu pierwszego :
(
)(
)
(
) (
)
∑
∑
−
−
∑
−
−
=
=
=
−
−
=
−
−
n
t
n
t
t
t
t
t
n
t
t
t
t
t
e
e
e
e
e
e
e
e
r
2
2
2
1
1
2
2
1
1
1
/ 26 /
a następnie stosując test Durbina – Watsona :
przy
0
1
>
r
obliczając statystykę
d
:
(
)
( )
∑
∑
−
=
=
=
−
n
t
t
n
t
t
t
e
e
e
d
2
2
2
2
1
/ 27 /
gdy :
0
1
<
r
obliczamy :
d
d
−
=
4
`
Możemy również skorzystać ze wzoru przybliżonego :
(
)
1
1
2
r
d
−
≈
Jeżeli test Durbina – Watsona nie da odpowiedzi możemy skorzystać z testu istotności
współczynnika korelacji wiedząc, że statystyka :
2
1
1
1
1
3
r
n
r
t
−
−
=
/ 28 /
ma rozkład
Studenta
t
−
o
3
−
n
stopniach swobody na poziomie istotności
γ
.
W
przypadku
występowania autokorelacji składników losowych, bądź
heteroskedastyczności składników losowych do szacowania parametrów stosujemy
13
Uogólnioną Metodę Najmniejszych Kwadratów (UMNK)
4
i wektor parametrów
strukturalnych szacujemy według formuły :
(
)
y
V
X
X
V
X
a
1
T
1
1
T
−
−
−
=
/ 29 /
bądź stosując na przykład metodę Cochrena – Orcutta parametry strukturalne modelu
obliczamy na podstawie formuły :
(
)
∗
∗
−
∗
∗
=
y
X
X
X
a
1
T
T
/ 30 /
gdzie :
2
1
1
1
1 r
y
y
−
=
∗
n
t
y
r
y
y
t
t
t
,......,
3
,
2
dla
1
1
=
−
=
−
∗
n
..,
0,1,2,....
dla
1
2
1
1
1
=
−
=
∗
j
r
x
x
j
j
n
t
n
j
x
r
x
x
j
t
j
t
j
t
,......,
3
,
2
oraz
,......,
2
,
1
,
0
dla
,
1
1
,
,
=
=
−
=
−
∗
przy czym
−
1
r
to współczynnik autokorelacji reszt rzędu pierwszego.
W przypadku trendu liniowego wartości zmiennej prognozowanej można również
przygotować w postaci przyrostów. W ten sposób skracamy o jeden długość szeregu ale
unikamy zjawiska autokorelacji.
3.2.2. Modele nieliniowe sprowadzalne do postaci liniowej
5
.
Trend potęgowy.
0
>
=
β
β
ε
α
e
t
Y
/ 31 /
Kształt trendu zależy od wartości parametru
α
4
Twórcą UMNK jest A. C. Aitken : On Least Squares and Linear Combination of Observations, Proceedings of
the Royal Society of Edinburgh 55/1935. Opis metody można znaleźć np. w pracy : E. Nowak, Zarys metod
ekonometrii, PWN, Warszawa 1998, s. 109 – 117.
5
Szeroki przegląd modeli jednej zmiennej można znaleźć w pracy : T. Stanisz, Funkcje jednej zmiennej w
badaniach ekonomicznych, PWN, Warszawa, 1986.
14
2 t
1.2
t
0
5
2
1
<
α
0.5 t
0.5
t
0
5
10
1
0
<
α
t
t
0
5
10
5
1
=
α
t
5
10
1
>
α
Trend potęgowy sprowadzamy do postaci liniowej stosując Transformację logarytmiczną :
ε
α
β
e
t
Y
ln
ln
=
/ 32 /
15
e
t
Y
ln
ln
ln
ln
ε
α
β
+
+
=
/ 33 /
dokonując podstawień :
Z
t
V
Y
=
=
=
ln
ln
ln
0
α
β
/ 34 /
otrzymujemy model liniowy :
ε
α
α
+
+
=
Z
V
0
/ 35 /
Trend wykładniczy .
( )
0
0,
>
>
=
β
α
α
β
ε
e
Y
t
/ 36 /
0.9
t
t
0
5
10
0.5
1
1
0
<
<
α
1.5
t
t
0
5
10
50
100
1
>
α
Trend wykładniczy sprowadzamy do postaci liniowej stosując również transformację
logarytmiczną :
e
t
Y
ln
ln
ln
ln
ε
α
β
+
+
=
/ 37 /
dokonując podstawień :
1
0
ln
ln
ln
α
α
α
β
=
=
=
V
Y
/ 38 /
otrzymujemy model :
ε
α
α
+
+
=
t
V
1
0
/ 39 /
przy czym :
1
0
α
α
α
β
e
e
=
=
/ 40 /
Oszacowana wartość parametru
α
przemnożona przez 100% informuje o
średniorocznym (średniokwartalnym, itp.) tempie wzrostu zmiennej prognozowanej w
procentach.
Trend logarytmiczny.
0
ln
>
+
+
=
β
ε
α
β
t
Y
/ 41 /
16
2 2 ln t
( )
.
t
0
5
10
10
10
0
>
α
α
β
−
=
=
e
t
y
0
1 1.5 ln t
( )
t
0
5
5
5
10
0
<
α
α
β
−
=
=
e
t
y
0
Linnearyzację przeprowadzamy dokonując podstawienia :
Z
t
=
ln
/ 42 /
co pozwala otrzymać model liniowy postaci :
ε
α
β
+
+
=
Z
Y
/ 43 /
Trend hiperboliczny
ε
α
β
+
+
=
t
Y
/ 44 /
17
5
1
t
t
0
5
10
5
6
7
8
0
>
α
5
1
t
0
5
10
3
4
Hiperbola
0
<
α
Transformacji do postaci liniowej dokonujemy poprzez podstawienie :
Z
t
=
1
i otrzymujemy model :
ε
α
β
+
+
=
Z
Y
/ 45 /
Trend paraboliczny
ε
α
α
α
+
+
+
=
2
2
1
0
t
t
Y
/ 46 /
5 t 0.5 t
2
t
0
2
4
6
500
Linnearyzację przeprowadzamy dokonując podstawień :
2
2
1
Z
t
Z
t
=
=
co pozwala otrzymać model postaci :
ε
α
α
α
+
+
+
=
2
2
1
1
0
Z
Z
Y
/ 47 /
18
3.2.3. Modele trendu nie sprowadzalne do postaci liniowej.
Bardzo wiele zjawisk ekonomicznych, społecznych czy też demograficznych nie daje
się efektywnie opisać za pomocą modeli liniowych bądź też modeli sprowadzalnych do
postaci liniowej. Stąd też pojawiła się bardzo obszerna klasa modeli nieliniowych nie
sprowadzalnych do postaci liniowej, które wymagają odmiennych niż wcześniej
prezentowane modele metod estymacji. W niniejszym wykładzie ograniczymy się jako
przykładu do wykorzystania krzywej logistycznej.
3.2.3.1.
Trend logistyczny.
Krzywa (trend) logistyczna została odkryta na początku XIX wieku przez
P.F. Verhulsta
6
. Pierwszym propagatorem tej funkcji był R. F. Pearl, który nadał tej krzywej
ostateczną postać :
0.
1,
0,
1
>
>
>
+
=
γ
β
α
β
α
γ
t
e
Y
/ 48 /
Krzywa logistyczna ma asymptotę poziomą o równaniu
α
=
Y
. Krzywa logistyczna jest
wypukła dla :
γ
β
ln
0
−
<
≤
t
a wklęsła dla :
6
P. F. Verhulst, Notice sur loi que la popuation suit dans son accroisment, Correspondance Mathematique et
Phisique 1838 nr 10 za : T. Stanisz, Funkcje jednej zmiennej w badaniach ekonomicznych, PWN, Warszawa
1986, s. 124 –125.
19
γ
β
ln
−
>
t
dla :
γ
β
ln
−
=
p
t
ma punkt przegięcia
7
dla którego osiąga wartość
2
)
(
α
=
p
t
Y
Powyższe własności są charakterystyczne dla wzrostu wielu zjawisk ekonomicznych,
demograficznych, przyrodniczych i innych. Często obserwujemy następującą tendencję : na
początku wartości zmiennej rosną powoli, potem coraz szybciej, jednak po uzyskaniu
pewnego poziomu prędkość wzrostu słabnie i następuje stabilizacja. Tak zachowuje się wiele
produktów wchodzących na rynek. W ten sposób zmienia się liczba mieszkańców
wyodrębnionych obszarów.
G. Tintner wykazał, że rozwój ludności Szwecji przebiegał
zgodnie z krzywą logistyczną
8
. Stąd też krzywa (trend) logistyczna ma wiele zastosowań do
opisu i prognozowania różnorodnych zjawisk
9
.
Istnieje szereg metod estymacji parametrów krzywej logistycznej
10
. Najstarszą jest metoda
estymacji opracowana w 1927 roku przez H. Hotellinga
11
. Metodę tę M. Kowerski zastosował
do estymacji parametrów trendu logistycznego opisującego zmiany liczby mieszkańców miasta
Zamościa w latach 1974 - 1999
12
. Dobrze znana jest również metoda estymacji opracowana w
1958 roku przez G. Tintnera
13
. Coraz częściej do estymacji prametrów trendu logistycznego
stosuje nieliniową metodę najmniejszych kwadratów.
3.2.3.2. Nieliniowa metoda najmniejszych kwadratów. Algorytm Gaussa - Newtona
14
Załóżmy, że chcemy oszacować parametry strukturalne trendu nieliniowego postaci :
( )
t
t
t
f
Y
ε
α
+
=
,
n
t
,......,
2
,
1
=
/ 1 /
gdzie :
7
Analizę przebiegu zmienności trendu logistycznego można znaleźć w pracy : J. Grzeszczuk, M. Kasjaniuk,
J. Kurek, Matematyka dla studentów ekonomii i informatyki, WSZiA w Zamościu , Zamość 2001.
8
G. Tintner, Econometrics, Wiley, New York, 1952 za : T. Stanisz, Funkcje jednej zmiennej ...op. cit., s.126
9
M. Kowerski zastosował krzywą logistyczną do prognozowania rozwoju społeczno – gospodarczego miasta
Zamościa : M. Kowerski, Zamość – diagnoza i prognoza rozwoju, Wiadomości Statystyczne, 2/2002.
10
Szeroki przegląd tych metod daje T. Stanisz w pracy : Funkcje jednej zmiennej w badaniach ekonomicznych,
PWN, Warszawa 1986, s. 122 – 168.
11
H. Hotelling, Differential Equations Subject to Error and Population Estimates, Journal of American Statistical
Association, 1927, t 3.
12
M. Kowerski, Potencjał demograficzny miasta Zamościa. Diagnoza i prognoza, w : B. Kawałko, Z. Mitura
(red.) Uwarunkowania rozwoju regionalnego z uwzględnieniem restrukturyzacji obszarów wiejskich, WSZiA w
Zamościu, Zamość 2001.
13
G. Tintner, Eine neue Methode fur die Schatzung der logistischen Funktion, Metrika, !958 nr 1 za : T. Stanisz,
Funkcje jednej zmiennej,...op.cit., s. 140.
14
Opracowano na podstawie : A. Goryl, modele nieliniowe w : K. Kukuła ( red. ) Wprowadzenie do ekonometrii
w przykładach i zadaniach, PWN, Warszawa 1999. s. 91 – 95.
20
−
t
Y
zmienna objaśniana
−
t
czas
[ ]
−
=
i
α
α
wektor
k
parametrów strukturalnych
−
t
ε
składnik losowy
przy czym zakładamy, że składniki
t
ε
są nieskorelowane, mają średnią różną od zera oraz
jednakową, dodatnią i skończoną wariancję.
Zastosowanie Klasycznej Metody Najmniejszych Kwadratów wprost do modelu, czyli
wyznaczenie estymatora
a
wektora parametrów
α
takiego, że :
( )
( )
[
]
( )
a
S
t
f
y
n
t
t
=
∑
−
=
=
2
1
,
min
S
min
α
α
/ 49 /
prowadzi do nieliniowego układu równań normalnych, który zwykle musi być rozwiązywany
za pomocą numerycznych procedur iteracyjnych.
Alternatywną, numeryczną realizacją nieliniowej MNK jest metoda Gaussa - Newtona,
polegająca na zastąpieniu w
tej
−
ε
iteracji modelu jego liniową aproksymantą uzyskaną
przez rozwinięcie w szereg Taylora z dokładnością do składników liniowych ( tj. pierwszych
pochodnych ) wokół przybliżenia wektora oszacowań parametrów
( )
l
a
:
( )
( )
( )
( )
( )
(
)
( )
l
t
k
j
l
j
j
l
a
j
l
t
a
t
f
a
t
f
Y
ν
α
α
α
α
+
∑
−
∂
∂
+
=
=
=
1
,
,
n
t
,......,
2
,
1
=
/ 50 /
gdzie :
( )
( )
−
+
=
t
l
t
l
t
ε
ε
ν
nowe składniki losowe, przy czym :
( )
−
l
t
ε
są błędami wyrażającymi odchylenia powstałe wskutek
zastosowania aproksymacji (pominięcie dalszych wyrazów
rozwinięcia Taylora), które w miarę zbiegania się procedury
iteracyjnej powinny dążyć do zera.
Model jest już liniowy względem parametrów :
( )
( )
l
j
j
l
j
a
−
=
α
δ
/ 51 /
a zatem mogą one być szacowane za pomocą Klasycznej Metody Najmniejszych Kwadratów:
( )
( )
( )
( )
[
]
( )
( )
( )
l
T
l
l
T
l
l
e
Z
Z
Z
d
1
−
=
/ 52 /
gdzie :
21
( )
( )
[ ]
( )
( )
l
a
j
l
tj
l
t
f
z
Z
=
∂
∂
=
=
α
α
α
,
/ 53 /
- macierz
k
n
×
pierwszych pochodnych cząstkowych względem parametrów
obliczonych dla ustalonych w
tej
l
−
iteracji przybliżeń
( )
l
a
oraz wartości zmiennej
czasowej,
( )
( )
( )
[
]
l
t
l
a
t
f
y
e
,
−
=
/ 54 /
- wektor
różnic między zaobserwowanymi wartościami zmiennej objaśnianej a
tym
l
−
przybliżeniem ( wartościami teoretycznymi z
tej
l
−
iteracji ).
Wartości
( )
l
j
d
są szacunkami
( )
l
j
δ
czyli odchyleń
tych
l
−
przybliżeń
( )
l
j
a
od
wartości rzeczywistych
j
a
. W następnej iteracji zamiast
( )
l
j
a
bierzemy poprawione oceny
parametrów :
( )
( )
( )
l
j
l
j
l
j
d
a
a
+
=
+
1
/ 55 /
i ponownie rozwijamy funkcję / 1 / w szereg Taylora według wzoru / 3 /, ale teraz wokół
( )
1
+
l
j
a
i znowu stosujemy Klasyczną Metodę Najmniejszych Kwadratów.
Postępowanie kontynuujemy tak długo, aż wartości bezwzględne wszystkich poprawek
będą równe zero z dokładnością
γ
( np.
6
10
−
=
γ
). Jeżeli zachodzi to od pewnej iteracji
L
,
to jako oceny parametrów otrzymane KMNK przyjmujemy oszacowanie z tej właśnie iteracji.
To oznacza, że jeżeli dla wszystkich
L
l
≥
oraz dla wszystkich
k
j
,......,
2
,
1
=
( )
γ
<
l
j
d
to
( )
l
a
a
=
/ 56 /
Metoda Gaussa – Newtona sprowadza się zatem do ciągu zastosowań KMNK, w którym
rolę macierzy
X
(obserwacji zmiennych objaśniających ) pełni macierz
( )
l
Z
( pierwszych
pochodnych cząstkowych obliczonych dla ustalonych przybliżeń
( )
l
a
oraz wartości zmiennej
czasowej ), a rolę wektora obserwacji zmiennej objaśnianej, wektor
( )
l
e
( różnic pomiędzy
wartościami empirycznymi zmiennej objaśnianej a
tymi
l
−
przybliżeniami
( )
( )
l
a
t
f ,
.
22
Można pokazać
15
, że zgodnym nieobciążonym oszacowaniem asymptotycznej macierzy
wariancji – kowariancji estymatorów parametrów jest macierz :
( )
( )
( )
( )
[
]
1
2
2
−
=
L
T
L
e
Z
Z
S
a
D
/ 57 /
gdzie :
( )
( )
( )
( )
[
]
2
1
2
,
1
1
∑
−
−
=
−
=
=
n
t
t
L
T
L
e
a
t
f
y
k
n
e
e
k
n
S
/ 58 /
Należy podkreślić, że jeżeli zastosujemy kryterium błędu średniokwadratowego, to żadna
inna metoda nie da rezultatów lepszych niż Nieliniowa Metoda Najmniejszych
Kwadratów. I nieważne czy to będzie metoda Gaussa – Newtona, metoda quasi – Newtona
czy algorytm Marquardta, rezultat końcowy będzie taki sam, różna może być co najwyżej
liczba niezbędnych iteracji. Dodać należy także, że metoda Gaussa – Newtona wymaga
dobrych wartości początkowych
( )
0
a
, gdyż w przypadku gdy
( )
0
a
nie jest dostatecznie
bliskie rzeczywistym wartościom parametru
α
, algorytm może nie być zbieżny. Dlatego też
metodę Gaussa – Newtona warto poprzedzić jakąś metodą przybliżoną, dającą początkowe
przybliżenia oszacowań parametrów
16
4. Prognozowanie na podstawie modeli adaptacyjnych.
Prognozowanie na podstawie trendu pełzającego z wykorzystaniem metody wag
harmonicznych
17
.
Metodę trendu pełzającego z zastosowaniem wag harmonicznych do prognozowania
(zwłaszcza krótkoterminowego) zaproponował Z. Hellwig
18
. Jest ona związana z predykcją
według tzw. zasady postarzania informacji
19
. Zgodnie z tą zasadą bardziej preferuje się
informacje nowsze niż starsze. Procedura predykcji obejmuje w tym wypadku dwa niezależne
etapy:
1. Wyrównanie szeregu czasowego zmiennej prognozowanej za pomocą trendu pełzającego,
15
M. J. Box, Bias in nonlinear estimation, Journal of Royal Statistical Society, 1971, seria B, nr 33. oraz
D. A. Ratkowsky, Nonlinear regression modelling. A unified practical approach, Marcel Dekker Inc.
New York 1983.
16
Przykłady takich metod podaje A. Goryl w : Modele nieliniowe w : K. Kukuła, Wprowadzenie do ekonometrii
w przykładach i zadaniach, PWN Warszawa, 1999 s. 94 – 95.
17
Opracowano na podstawie : E. Nowak, Zarys metod ekonometrii. Zbiór zadań, PWN, Warszawa 1998,
s.190 -194 oraz A. Zeliaś, Teoria prognozy, PWE, Warszawa 1997, s. 239 – 246.
18
Z. Hellwig, Schemat budowy prognozy statystycznej metodą wag harmonicznych,
Przegląd Statystyczny, 2/1967
19
S. Bartosiewicz. Ekonometria, Technologia ekonometrycznego przetwarzania informacji, PWE,
Warszawa 1976.
23
2. Ustalenie prognoz z wykorzystaniem wag harmonicznych.
Punktem wyjścia szacowania parametrów trendu pełzającego są obserwacje
n
y
y
y
,......,
,
2
1
zmiennej prognozowanej Y. Dla przyjętej z góry liczby naturalnej
s
takiej ,
że
n
s
<
, na podstawie
s
kolejnych obserwacji:
n
s
n
s
n
s
l
l
l
s
s
y
y
y
y
y
y
y
y
y
y
y
y
Λ
Λ
Λ
Λ
Λ
Λ
Λ
Λ
Λ
Λ
Λ
Λ
,
,
,
,
,
,
,
,
2
1
1
1
1
3
2
2
1
+
−
+
−
−
+
+
+
/ 1 /
szacujemy za pomocą metody najmniejszych kwadratów parametry strukturalne liniowych
trendów segmentowych:
(
)
(
)
(
)
(
)
n
s
n
s
n
t
t
a
b
Y
s
l
l
l
t
t
a
b
Y
s
t
t
a
b
Y
s
t
t
a
b
Y
s
n
s
n
s
n
l
l
l
,...,
2
,
1
1
,
1
,
ˆ
1
,...,
3
,
2
ˆ
...,
,
2
,
1
ˆ
1
1
1
2
2
2
1
1
1
+
−
+
−
=
+
=
−
+
+
=
+
=
+
=
+
=
=
+
=
+
−
+
−
+
−
Λ
Λ
Λ
Λ
Λ
Λ
Λ
Λ
Λ
Λ
Λ
Λ
Λ
Λ
/ 2 /
Z
każdego równania trendu odcinkowego wyznacza się teoretyczne wartości zmiennej
prognozowanej:
(
)
1
,...,
1
,
,
1
,...,
2
,
1
ˆ
−
+
+
=
+
−
=
+
=
s
l
l
l
t
s
n
l
t
a
b
y
l
l
tl
/ 3 /
Każdej jednostce czasu odpowiada p (t ) wartości teoretycznych
20
:
( )
+
−
+
−
=
+
−
+
−
+
=
−
=
=
n
s
n
s
n
t
dla
t
n
s
n
s
s
t
dla
s
s
t
dla
t
t
p
,...,
3
,
2
1
1
,...,
1
,
,
1
,...,
2
,
1
/ 4 /
20
Wzór ten jest w pełni stosowny dla warunku :
2
1
:
czyli
1
−
≤
≥
+
−
n
s
s
s
n
. Generalnie chodzi o to, że
t
yˆ
jest średnią wartości teoretycznych
trendów dla okresu t
24
Ostatecznym
wygładzeniem badanego szeregu czasowego jest: średnia z wartości
teoretycznych oszacowanych na podstawie modeli odcinkowych w danej jednostce czasu:
( )
∑
=
+
−
=
1
1
ˆ
1
ˆ
s
n
l
tl
t
y
t
p
y
/ 5 /
Łącząc kolejne punkty
( )
t
y
t ˆ
,
odcinkami prostymi, otrzymuje się wykres trendu
badanego szeregu czasowego w postaci łamanej zwanej trendem pełzającym (ruchomym).
Miarą jakości dopasowania trendu segmentowego do danych empirycznych może być na
przykład współczynnik korelacji pomiędzy empirycznym szeregiem czasowym a
wygładzonym
( )
t
t
Y
Y
r
ˆ
,
.
W kolejnym etapie oblicza się przyrosty wygładzonych wartości szeregu czasowego:
t
t
t
y
y
w
ˆ
ˆ
1
1
−
=
+
+
(
)
1
,...,
2
,
1
−
=
n
t
/ 6 /
Aby
zrealizować zasadę postarzania informacji, wyznacza się wagi harmoniczne
1
,...,
2
,
1
(
1
1
1
1
1
−
=
∑
−
−
=
=
+
n
t
i
n
n
c
t
i
t
/ 7 /
Wagi harmoniczne występujące we wzorze / 7 / są zawsze nieujemne, a ich suma
równa jest jedności. Mamy więc :
1
1
1
1
1
1
0
1
+
+
−
=
+
<
<
<
=
∑
t
t
t
n
t
t
c
c
c
c
/ 8 /
Następnie oblicza się średni ważony przyrost wygładzonych wartości zmiennej
prognozowanej:
∑
−
=
+
=
1
1
1
n
t
t
t
c
w
w
/ 9 /
oraz odchylenie standardowe przyrostów:
(
)
∑
−
=
+
+
−
=
1
1
2
1
1
n
t
t
t
w
w
w
c
S
/ 10 /
25
Prognozę punktową zmiennej Y na okres T ustala się jako sumę n-tego wygładzonego
elementu szeregu
( )
∃
y
n
oraz iloczynu średniej przyrostów
w
i
n
T
−
=
τ
w
y
y
n
T
τ
+
=
∗
ˆ
/ 11 /
W celu wyznaczenia przedziału prognozy oblicza się współczynnik :
∑
−
−
=
+
=
1
1
n
n
t
t
c
r
τ
β
τ
µ
/ 12 /
Dolną granicę przedziału prognozy wyznacza się jako :
w
T
T
S
r
y
dy
τ
−
=
∗
∗
/ 13 /
Górną granicę przedziału prognozy wyznacza się jako :
w
T
T
S
r
y
gy
τ
+
=
∗
∗
/ 14 /.
Na zakończenie należy podkreślić, że najbardziej przekonywującymi argumentami za
stosowanie prognozowania opartego o metodę trendu pełzającego z wykorzystaniem wag
harmonicznych są :
- nieregularność zjawisk ekonomicznych – większa od tej, jaką zakłada budowanie
klasycznych modeli trendu jako analitycznej funkcji czasu określonej dla całego okresu
obejmującego analizowaną przeszłość i przewidywaną przyszłość,
- występowanie w prognozowanych zmiennych tzw. „punktów zwrotnych”,
- starzenie
się informacji.
Literatura :
1. Z. Czerwiński, B. Guzik, Prognozowanie ekonometryczne, PWE Warszawa, 1980
2. M. Cieślak (red.), Prognozowane gospodarcze. Wydawnictwo AE we Wrocławiu,
Wrocław 1993
3. M. Cieślak ( red. ), Prognozowanie gospodarcze, PWN, Warszawa 1997
4. J. Grzeszczuk, M. Kasjaniuk, J. Kurek, Matematyka dla studentów ekonomii i informatyki,
WSZiA w Zamościu , Zamość 2001.
5. Z. Hellwig ( red.), Zarys ekonometrii, PWE, Warszawa 1970
6. Z. Hellwig, Schemat budowy prognozy statystycznej metodą wag harmonicznych,
26
Przegląd Statystyczny, 2/1967
7. M. Kowerski. Ekonometria. Przewodnik po wykładach, WSZiA w Zamościu, Zamość 1998
8. M. Kowerski, Zamość – diagnoza i prognoza rozwoju, Wiadomości Statystyczne, 2/2002.
9. M. Kowerski, Potencjał demograficzny miasta Zamościa. Diagnoza i prognoza, w : B.
Kawałko, Z. Mitura (red.) Uwarunkowania rozwoju regionalnego z uwzględnieniem
restrukturyzacji obszarów wiejskich, WSZiA w Zamościu, Zamość 2001.
10. K. Kukuła ( red. ) Wprowadzenie do ekonometrii w przykładach i zadaniach, PWN,
Warszawa 1999.
11. E. Nowak (red.), Prognozowanie gospodarcze, Agencja Wydawnicza Placet,
Warszawa 1998
12. E. Nowak, Zarys metod ekonometrii. Zbiór zadań, PWN, Warszawa 1998,
13. Z. Pawłowski, Zasady predykcji ekonometrycznej, PWN Warszawa 1982
14. T. Stanisz, Funkcje jednej zmiennej w badaniach ekonomicznych, PWN, Warszawa, 1986
15. A. Zeliaś. Teoria prognozy, PWE Warszawa 1997
.