EKONOMETRIA
Dr Stanisław Barczak
1
ZAGADNIENIA WSTĘPNE
Czym jest ekonometria?
Umożliwia dokonywanie pomiarów procesów ekonomicznych.
Twórcy:
Frish (1936r) – unifikacja teorii ekonomii, statystyki i matematyki. Główny cel ekonometrystów to przewidywanie
cykli koniunkturalnych. Początek od stworzenia zakłóconego ruchu wahadła (analogia do wahań giełdowych).
Ekonometria to:
Gregory C. Chaw – jest nauką i sztuką stosowania metod statystycznych do mierzenia relacji ekonomicznych.
Zbigniew Pawłowski – jest nauką o metodach badania ilościowych prawidłowości występujących w zjawiskach
ekonomicznych za pomocą odpowiednio wyspecjalizowanego aparatu matematyczno-statystycznego.
Oskar Lange – nauka o ilościowych aspektach procesów ekonomicznych, zajmująca się ustaleniem za pomocą
statystyki konkretnych ilościowych prawidłowości zachodzących w życiu gospodarczym.
Henry Theil – zajmuj się ona empiryczną weryfikacją spraw ekonomicznych.
Słowo empiryczne wskazuje na to, że dane wykorzystywane do tej weryfikacji otrzymuje się z obserwacji, natomiast
obserwacja może polegać na dokonaniu kontrolowanego eksperymentu w celu weryfikacji określonego
interesującego go prawa lub też może to być obserwacja bierna. Bierna dominuje wśród ekonomistów.
Historia metod ekonometrycznych.
I era – era klasycznej metody najmniejszych kwadratów, modele TIMBERGENA, działy: analiza popytu
konsumpcyjnego, podaży, kosztów produkcji, wydajności pracy.
II era – rozwój estymacji 2MNK i 3MNK, metody zmiennych instrumentalnych, powstały modele Kleina, Kleina-
Goldbergena, podejście przyczynowo-skutkowe.
III era – zastosowanie analizy mnożnikowej, Goldberger w 1956 roku, powstaje analiza przepływów
międzygałęziowych.
Po II WŚ można powiedzieć, że ekonometria jest już nauką.
IV era – wprowadzenie analizy spektralnej do ekonometrii, prekursorzy tego to Jevons i Moore, lata 60te to
panowanie analizy spektralnej
Od lat 60tych powszechna komputeryzacja.
V era – powstają makromodele będące podstawą symulacji i prognozowania, metody „input-output”. Możliwe staje
się prowadzenie badań o charakterze symulacyjnym.
Ekonometria:
-
bada związki ilościowe i jakościowe pomiędzy kategoriami
-
jest zbiorem różnych metod
-
nie ma wyraźnych granic
-
rozważa się ją w powiązaniu z innymi naukami: ekonomią matematyczną (metody i zasady formułowania
teorii ekonomicznych), teorią ekonometrii (konstrukcja modeli ekonometrycznych i opisu danych),
statystyką ekonomiczną (zbieranie, gromadzenie i organizacja danych statystycznych)
Przedmiotem analizy ekonometrycznej jest:
-
konstrukcja modeli ekonometrycznych
-
estymacja jego parametru
-
szeroko pojęte wnioskowanie na podstawie modelu ekonometrycznego
Model ekonometryczny:
Pawłowski – konstrukcja formalna, która za pomocą jednego równania, bądź też wielu równań odwzorowuje
zasadnicze powiązania ilościowe zachodzące między badanymi zjawiskami.
Hellwig – model ogólnie rozumiany, musi być zawsze lepszą lub gorszą kopią oryginału i dlatego też, aby można
było mówić o sensownym sporządzaniu kopii, należy wiedzieć czym jest oryginał; proces powstawania modelu to
efekt świadomego i celowego odwzorowania fragmentu rzeczywistości
EKONOMETRIA
Dr Stanisław Barczak
2
Klein – schematyczne uproszczenie rzeczywistości, pomijające nieistotne aspekty.
Specyfikacja modelu ekonometrycznego – sprecyzowanie zmiennych objaśniających, zmiennych objaśnianych
(endogenicznych), podjęcie decyzji co do charakteru występujących w modelu związków oraz podjęcie decyzji co
do postaci analitycznej modelu (liniowa, nieliniowa sprowadzalna do liniowej, strikte nieliniowa).
Specyfikacja modelu ekonometrycznego opiera się na informacjach „a priori” (teorie ekonomiczne) oraz
informacjach z badań empirycznych.
Informacja „a priori”:
-
istniejące teorie ekonomiczne
-
ogólnie znane zależności ekonomiczne typu rozrachunkowego lub bilansowego
-
informacje pochodzące z poprzednio prowadzonych badań ekonometrycznych – są podstawą do nowych
rozwiązań
-
informacje o ustalonych instytucyjnie wartościach odnoszących się do pewnych zmiennych
ekonometrycznych (np. oprocentowanie kredytów, stopa dyskontowa, stopa podatku etc.)
Jednorównaniowy model ekonometryczny:
Y = f(X1,X2....Xk,
ξ
)
Y- zmienna endogeniczna (objaśniana) – to wyróżnione zjawiska ekonomiczne, które są opisywane (wyjaśniane)
przez poszczególne równania lub równanie modelu.
X1-Xk – zmienne objaśniające – służą do opisu, wyjaśniania zmian zmiennych endogenicznych, w modelu jest ich
pewna ilość
ξ
(ksi) – składnik losowy – część stochastyczną modelu, jest zmienną losową o wartości oczekiwanej (E(
ξ
)=0) i
rozkładzie normalnym, nie jest elementem pozytywnym.
Nigdy nie możemy powiedzieć, że znaleźliśmy wszystkie zmienne X.
ξ
- zawiera w sobie błąd jaki popełniamy, gdyby nie on to można idealnie przewidzieć np. kursy walut.,
ξ
jest
pozostałymi zmiennymi X, nieuwzględnionymi w modelu.
W modelu ekonometrycznym składnik losowy wynika z:
-
uwzględnienia wpływu wszystkich czynników mało istotnych, niewyspecyfikowanych w równaniu bądź
równaniach modelu
-
z różnic pomiędzy przyjętą postacią analityczną modelu, a istniejącą zależnością w rzeczywistości
-
błąd pomiaru zmiennych
-
czynniki losowe wpływające na zmienną endogeniczną (np. pobór energii elektrycznej)
Jeśli dobieramy złą postać analityczną to „zwiększamy” wskaźnik losowści.
Przykład 1
Zbudujmy model ekonometryczny popytu na kompot z wiśni. Wyspecyfikujemy Y.
Yt – popyt na kompot z wiśni
X1t – cena kompotu z wiśni
X2t – cena kompotu z czereśni
ξ
- składnik losowy
Do konstrukcji modelu wykorzystujemy dane empiryczne.
Model w sensie ogólnym Yt = f(X1t,X2t,
ξ
t)
Trzeba znaleźć postać analityczną modelu dla pełnej jego specyfikacji.
Yt = f(Yt-
1
;
ξ
) – cena kompotu zależy tylko od czasu – jest to postać autoregresyjna.
Rzeczą bardzo istotną – odpowiednie wyspecyfikowanie opóźnienia czasowego.
Przykład:
Model liniowy jednorównanionwy
Yt =
α
1
X
1t
+
α
0
+
ξξξξ
t
Jest to model przyczynowo-skutkowy, z jedną zmienną objaśniającą, gdzie
α
1 i
α
0(parametr wolny) to parametry
strukturalne.
Model dzieli się na dwie części: deterministyczną i stochastyczną (pogrubiona)
Do takiej specyfikacji ekonometryk musi wybrać odpowiednie zmienne o charakterze liniowym.
6 etapów budowy modeli ekonometrycznych.
1. Określenie celu oraz zakresu badania (potrzebne: wiedza i praktyka z zakresu teorii ekonomii i statystki).
EKONOMETRIA
Dr Stanisław Barczak
3
2. Specyfikacja modelu ekonometrycznego (określenie zmiennych – endogenicznych i objaśniających oraz
postać analityczna modelu). Dodatkowo należy określić źródła danych oraz ich wiarygodność. Od tego
etapu zależy powodzenie przedsięwzięcia budowy modelu ekonometrycznego. Daje nam to analityczną
postać modelu, wstępną postać modelu – można ją określić jako hipotezę badawczą – przypuszczenie o
stanie procesu przed przeprowadzeniem badania, musi być jednoznacznie weryfikowalna.
3. Gromadzenie odpowiednich danych statystycznych na podstawie których zostaną oszacowane parametry
strukturalne modelu ekonometrycznego. Parametry nigdy nie będą znane (będą to tylko parametry
szacunkowe)
4. Estymacja parametrów strukturalnych modelu
Y
t
=
α
1
X
1
+
α
2
X
2
+
α
0
+
ξ
t
Y
t
= a
1
X
1
+ a
2
X
2
+ a
0
+ U
t
oszacowany model ekonometryczny, parametry „a” są już konkretnie
oszacowanymi wartościami.
Nie istnieje uniwersalna metoda szacowania parametrów strukturalnych.
Dobór odpowiedniego estymatora (można „rozluźnić” warunki stosowania estymatorów).
Dokonuje się weryfikacji modelu ekonometrycznego (jeśli weryfikacja nie przejdzie pomyślnie to powrót do
etapu 1.)
5. Praktyczne wykorzystanie modelu ekonometrycznego. Dokonanie badanej analizy na podstawie
historycznych danych. Wykorzystuje się do przewidywania przyszłości – narzędzie do budowy prognoz,
oraz wykorzystuje się je do eksperymentów symulacyjnych.
6. Możemy to dokonać w odpowiednich warunkach prac nad modelem makroekonomicznym.
Często wszystkie te etapy prowadzone są równolegle.
Klasyfikacja modeli ekonometrycznych:
1. Na podstawie cech budowy modeli oraz typu modeli
-
analityczno opisowe – opisujące stan rzeczy w danym momencie czasu, wykorzystanie prawidłowości
rządzących systemem
-
prognostyczne – przewidywanie stanu w przyszłości, jeżeli analityczno-opisowy jest dobrze dopasowany to
jego też można wykorzystać do prognoz
-
symulacyjne i sterowania – analiza symulacyjna i sterowania
2.
-
liniowe
Y
t
=
α
1
X
1
+
α
2
X
2
+
α
3
X
3
+
α
0
+
ξ
t
3 zmienne objaśniające nie uwzględnia wpływu czasu – model statyczny
Y
t
=
β
Y
t-1
α
1
X
1
+
α
2
X
2
+
α
0
+
ξ
t
model dynamiczny – mamy zmienną opóźniającą, uwzględnia upływ czasu.
-
nieliniowe – sprowadzalne do liniowych
o
hiperboliczne
t
t
t
X
Y
ξ
α
α
+
+
×
=
0
1
1
1
o
kwadratowy niezupełny
t
t
t
X
Y
ξ
α
α
+
+
=
0
2
1
1
-
nieliniowe
o
trend logistyczny (dynamiczny do badania trendu)
t
t
t
e
Y
ξ
β
α
γ
+
+
=
−
1
3. Ze względu na udział czynnika:
-
statyczne
-
dynamiczne -> nie ma zależności tylko przyczynowo-skutkowej, bo nie zależy tylko od czasu.
4. Ze względu na walory poznawcze:
-
przyczynowo-opisowe – zmienne endogeniczne (skutek), a zmienna objaśniająca (przyczyny) i parametry
strukturalne świadczą o sile związku pomiędzy zmienną endogeniczną, a zmiennymi objaśniającymi.
-
symptomatyczne – modele, w których pomiędzy zmienną endogeniczną, a zmiennymi objaśniającymi
zachodzi silna korelacja, natomiast interpretacja przyczynowo-skutkowa jest nieuprawniona; stosuje się gdy
brak jest podstaw do oczekiwania przyczynowości badanej relacji ekonomicznej (brak akceptowanej teorii
ekonomicznej) lub gdy zmienne reprezentujące przyczyny bądź skutek (zmienne objaśniające) są
nieobserwowalne, takie modele stosuje się często wobec prognozowania gospodarczego
-
tendencji rozwojowych – modele trendu, w nich jedyną zmienna objaśniającą jest zmienna czasowa
(pomija się w nim tak na dobrą sprawę istotne czynniki, co powoduje zwiększenie się czynnika losowości)
Miary jakości modelu:
-
stopień dopasowania modelu do danych empirycznych
EKONOMETRIA
Dr Stanisław Barczak
4
-
dokładność parametru modelu (dokładne oszacowanie parametrów strukturalnych modelu)
-
wartość informacyjna modelu
-
sensowność interpretacji parametrów (jeśli nie ma sensownej to model nie nadaj się do niczego)
-
wartość prognostyczna modelu
Wg Tinbergena – należy patrzeć (przy wyborze modelu etc.): jaka relacja tak na dobrą sprawę nas interesuje, jeśli
znamy dobrze zagadnienie ekonomiczne to „intuicja nam podpowie, którą metodę wybrać”
DOBÓR ZMIENNYCH OBJAŚNIAJĄCYCH DO MODELU LINIOWEGO-
JEDNORÓWNANIOWEGO
Musi być znana zmienna endogeniczna.
Y
t
= f(X
1
, X
2
...X
k
,
ξ
)
dochodzimy do wniosku, że to będzie model liniowy i wybieramy najistotniejsze zmienne
objaśniające.
Zmienne objaśniające w modelu ekonometrycznym powinny charakteryzować się następującymi cechami:
-
odpowiednią zmiennością
-
wykazywać silną korelacją ze zmienną endogeniczną (istotną korelacje)
-
powinny wykazywać słabe (nieistotne) korelacje między sobą
Y
t
=
α
1
X
1t
+
α
2
X
2t
+
α
3
X
3t
+
α
0
+
ξ
t
Jeśli np korelacja X
1t
i X
2t
= 0,85 mówi, że w taki sam sposób kształtują one Y. Wystarczy wybrać tylko jedną z tych
zmiennych, tę która jest bardziej skorelowana z Y.
Jeśli nie mamy wszystkich danych to szukamy zmiennych naśladowczych, bądź pomijamy zwiększając tym samym
ξ
.
Formalne etapy dobory zmiennych objaśniających do modelu ekonometrycznego:
1. Ustalenie liczby potencjalnych zmiennych objaśniających – tylko nazywamy zmienne, nie mamy danych
2. Gromadzimy materiał statystyczny
3. Usuwamy zmienne o niskiej zmienności (jeśli zmienna endogeniczna ma niską zmienność – brak
konieczności budowy modelu), zmienne objaśniające muszą mieć ten sam okres zmienności co Y.
4. Ustalenie miernika jakości modelu ekonometrycznego
można rozpatrywać z trzech punktów widzenia:
-
jego dopasowanie do rzeczywistych danych empirycznych
-
istotność parametrów strukturalnych modelu
-
brak autokorelacji składnika losowego
5. Obliczenie współczynnika korelacji pomiędzy wszystkimi rozpatrywanymi zmiennymi
6. Ustalenie kombinacji zmiennych, które wejdą do modelu
Zmienne muszą wykazywać zróżnicowanie (liczone współczynnikiem zmienności)
_
x
S
V
i
i
=
Wartość kryterium współczynnika zmienności to 0,1 poniżej go nie jest zmienną – wyrzucamy ją z modelu, lecz
należy ją dodać przy parametrze wolnym (ślepa zmienna – zawsze 1).
Quasi stała – prawie stała, jeśli bardzo zaokrąglamy i wtedy jest taka sama, też się taką odrzuca (o bardzo małej
zmienności).
Metoda doboru zmiennych Pawłowskiego:
Zgodnie z procedurą Pawłowskiego do modelu ekonometrycznego wejdzie kombinacja zmiennych objaśniających,
która spowoduje, że:
-
model będzie gwarantował pewną z góry ustaloną dokładność (dopasowanie do danych empirycznych)
-
spośród wszystkich kombinacji zmiennych objaśniających należy wybrać te kombinację, w której
uwzględnione zmienne objaśniające nie są skorelowane między sobą
Tworzymy macierz potencjalnych zmiennych i wektor kolumnowy zmiennej endogenicznej
n
y
y
y
Y
...
2
1
=
EKONOMETRIA
Dr Stanisław Barczak
5
nt
n
n
t
t
X
X
X
X
X
X
X
X
X
X
...
...
...
...
...
...
...
2
1
2
22
21
1
12
11
=
Wartość współczynnika korelacji Rw między zmienną endogeniczną, a zmiennymi objaśniającymi była nie mniejsza
niż z góra zadana liczba.
∂
> 0
to może być pewną miarą służącą badaniu dokładności modelu.
Rw – współczynnik korelacji wielorakiej.
|
|
det
|
|
det
1
R
W
Rw
−
=
R
R
R
W
o
o
1
=
R – współczynnik korelacji między wybranymi zmiennymi objaśniającymi
R
o
– wektor kolumnowy współczynnika korelacji pomiędzy wybranymi zmiennymi objaśniającymi, a zmienną
endogeniczną.
Przykład
Dane są 3 potencjalne zmienne objaśniające X
1t
, X
2t
, X
3t
oraz Y
t
1.Wyliczenie współczynnika korelacji pomiędzy zmiennymi objaśniającymi.
1
34
,
0
18
,
0
34
,
0
1
4
,
0
18
,
0
4
,
0
1
=
R
wzór na ilość kombinacji L = 2
p
– 1, gdzie P to liczba zmiennych objaśniających.
Jest 7 kombinacji K1={x1}, K2={x2}.... K7={X1,X2,X3}
Szukamy właściwej kombinacji
Korelacje wszystkich zmiennych ze zmienną endogeniczną Y:
3
,
0
7
,
0
88
,
0
=
O
R
Rozpatrujemy kombinację K={x1,x2}
1
4
,
0
4
,
0
1
7
,
0
88
,
0
=
=
R
R
o
Tworzymy macierz W
1
4
,
0
7
,
0
4
,
0
1
88
,
0
7
,
0
88
,
0
1
=
W
det |W| = 0,84
det |R| = 0,684
Rw = 0,9584
W analogiczny sposób postępujemy z pozostałymi kombinacjami i wybieramy tę z najwyższym Rw.
Metoda wskaźników pojemności informacyjnej (metoda Hellwiga):
1.Indywidualne wskaźniki pojemności informacyjnej.
∑
=
+
=
pl
i
ij
oj
ij
r
r
h
1
2
|
|
1
l – elta kombinacja zmiennych objaśniających
j – jota zmienna objaśniająca
r
oj
– współczynnik korelacji liniowej Pearsona między jotą zmienną objaśniającą i zmienną endogeniczną Y
EKONOMETRIA
Dr Stanisław Barczak
6
r
ij
– współczynnik korelacji liniowej Pearsona pomiędzy itą i jotą zmienną objaśniającą.
Przyjmuje on wartość z przedziału 0 <= h <= 1, jeżeli poza przedziałem to wiemy, że wzięliśmy do modelu
nieliniowego współczynniki korelacji liniowej.
Współczynnik (zmienne objaśniające) posiadają różną nośność informacyjną (np. X1 – 0,4; X2 – 0,5; etc.)
2.Wskaźniki integralne pojemności informacyjnej H.
H – suma h, przyjmuje wartości z tego samego przedziału 0<= H <= 1
Przykład
Dane są zmienne X
1t
, X
2t
, X
3t
Korzystając z procedury Hellwiga
23
,
0
7
,
0
88
,
0
=
O
R
1
34
,
0
18
,
0
34
,
0
1
4
,
0
18
,
0
4
,
0
1
=
R
liczymy:
0
1
)
88
,
0
(
2
11
+
=
h
0
1
)
7
,
0
(
2
22
+
=
h
0
1
)
23
,
0
(
2
33
+
=
h
4
,
0
1
)
88
,
0
(
2
41
+
=
h
4
,
0
1
)
7
,
0
(
2
42
+
=
h
18
,
0
1
)
88
,
0
(
2
51
+
=
h
18
,
0
1
)
23
,
0
(
2
53
+
=
h
34
,
0
1
)
7
,
0
(
2
62
+
=
h
34
,
0
1
)
23
,
0
(
2
63
+
=
h
18
,
0
4
,
0
1
)
88
,
0
(
2
71
+
+
=
h
34
,
0
4
,
0
1
)
7
,
0
(
2
72
+
+
=
h
18
,
0
34
,
0
1
)
23
,
0
(
2
73
+
+
=
h
Integralne wskaźniki H
H
1
= h
11
H
2
= h
22
H
3
= h
33
H
4
= h
41
+ h
42
H
5
= h
51
+ h
53
H
6
= h
62
+ h
63
H
7
= h
71
+ h
72
+h
73
Na ich podstawie dokonujemy wyboru H
max.
– z pośród w/w H
Mogą być rozbieżności pomiędzy metodą Pawłowskiego i Hellwiga.
Metoda współczynników korelacji
2
*
2
2
−
+
=
n
t
t
r
wartość krytyczna współczynnika korelacji
t – wartość krytyczna odczytana z tablic t-Studenta
n – liczba obserwacji
Przykład:
Przy poziomie istotności
α
= 0,05 oraz n = 28 wyznaczyć wartości krytyczne współczynników korelacji, a następnie
zaproponować zmienne objaśniające do modelu.
n – 2 = 26
α
= 0,05
t
α
= 2,056
r* = 0,3739 - wszystko co poniżej tej wartości jest nieistotne statystycznie.
EKONOMETRIA
Dr Stanisław Barczak
7
=
83
,
0
87
,
0
48
,
0
86
,
0
58
,
0
Ro
wszystkie zmienne mogą wejść do modelu, są istotne (wartości wyższe od r*)
zmienne których r są w [] mogą razem funkcjonować w modelu, nie
są ze sobą skorelowane
Klasyczna metoda najmniejszych kwadratów (KMNK). Idea metody: wyznaczenie ocen parametrów strukturalnych
a
1
, a
2
,...a
k
, (konkretne wartości) parametrów strukturalnych
α
1
,
α
2
, ...
α
k
aby suma kwadratów odchyleń
zaobserwowanych wartości zmiennej endogenicznej Y
t
od jej wartości teoretycznych obliczonych na podstawie
modelu była najmniejsza.
Dany jest jednorównaniowy model ekonometryczny
Y
t
=
α
1
X
1t
+
α
2
X
2t
+ ... +
α
k-1
X
(k-1)t
+
α
k
+
ξ
t
t = 1,2...n
Kryterium metody najmniejszych kwadratów ma postać:
Ψ
=
∑
(y
t
– a
1
X
1t
– a
2
X
2t
- .... – a
k-1
X
(k-1)t
–a
k
)
k
min. czyli wartości teoretyczne modelu dane są jako:
Y*
t
= a
1
X
1t
+ a
2
X
2t
+ ... + a
k-1
X
(k-1)t
+
α
k
Ostateczna postać KMNK dana jest jako:
Ψ
=
∑
(y – y
t
*)
2
min gdzie wyrażenie (y
t
– y
t
*) = u
t
; gdzie t = 1,2...n
reszta modelu/równania.
Y
t
=
α
1
X
1t
+
α
2
X
2t
+
α
0
+
ξξξξ
t
Y
t
= a
1
X
1t
+ a
1
X
2t
+ a
0
+ u
t
Zastosowanie KMNK wymaga spełnienia następujących założeń:
-
postać modelu jest liniowa względem parametrów bądź sprowadzana do liniowej
-
zmienne objaśniające są wielkościami nielosowymi
-
zmienne objaśniające nie wykazują współliniowości
-
składnik losowy
ξ
ma wartość oczekiwaną równą zero E(
ξ
) = 0 oraz stałą wariancję D
2
(
ξ
) =
σ
2
-
nie następuje autokorelacja składnika losowego (nie ma zależności korelacyjnych między poszczególnymi
realizacjami składnika losowego – chodzi o zależność rządu pierwszego)
Miara zależności, wariancja składnika losowego nie zależy od zmiennych objaśniających (składnik losowy nie jest
skorelowany ze zmiennymi objaśniającymi)
Układ skalarny
W celu wyznaczenie ocen parametrów strukturalnych modelu znajdujemy minimum funkcji
[ ]
=
1
62
,
0
1
51
,
0
]
17
,
0
[
1
59
,
0
86
,
0
]
33
,
0
[
1
]
1
,
0
[
64
,
0
26
,
0
79
,
0
1
R
taką obserwację odrzucamy
i rozpatrujemy osobno
Y
X
EKONOMETRIA
Dr Stanisław Barczak
8
2
1
*
)
(
∑
=
−
=
n
t
t
t
y
y
ψ
minimum
0
=
Ψ
aj
σ
σ
(j = 1,2,...t)
2
∑
(y
t
– a
1
X
1t
– a
2
X
2t
-...- a
k
) (-X
1t
) = 0
2
∑
(y
t
– a
1
X
1t
– a
2
X
2t
-...- a
k
) (-X
2t
) = 0
∑
(y
t
– a
1
X
1t
– a
2
X
2t
-...- a
k
) (-1) = 0
Po wykonaniu odpowiednich przekształceń otrzymujemy tzw. układ równań normalnych danych jako:
a
1
∑
X
1t
2
+ a
2
∑
X
2t
+...+ a
k
∑
X
1t
=
∑
X
1t
y
t
a
1
∑
X
1t
X
2t
+ a
2
∑
X
2t
2
+...+ a
k
∑
X
2t
=
∑
X
2t
y
t
a
1
∑
X
1t
+ a
2
∑
X
2t
+ ....+ na
k
=
∑
y
t
Układ macierzowy
Jest to kolumnowy wektor zmiennej endogenicznej
=
n
y
y
y
y
...
2
1
=
−
−
−
1
...
1
...
...
...
...
1
...
1
...
1
,
2
1
1
,
2
22
21
1
,
1
12
11
k
n
n
n
k
k
x
x
x
x
x
x
x
x
x
X
Macierz realizacji zmiennych objaśniających.
Kolumnowy wektor parametrów strukturalnych:
=
n
α
α
α
α
...
2
1
Kolumnowy wektor ocen parametrów strukturalnych
=
n
a
a
a
a
...
2
1
Kolumnowy wektor realizacji składnika losowego:
=
n
ξ
ξ
ξ
ξ
...
2
1
EKONOMETRIA
Dr Stanisław Barczak
9
Kolumnowy wektor reszt:
=
k
u
u
u
u
...
2
1
Wektor wartości teoretycznych
=
*
*
2
*
1
...
*
k
y
y
y
Y
Tak więc model:
Y=
α
1
X
1t
+
α
2
X
2t
+... +
α
k-1
X
(k-1)t
+
α
k
+
ξ
W zespole macierzowym ma następującą postać:
Y = X
α
+
ξ
Wektor wartości teoretycznych zmiennej endogenicznej Y ma postać:
Y* = X
α
Funkcja kryterium KMNK dana jest jako:
Ψ
= (y - Xa)’ (y – Xa)
min – transpozycja macierzy
Formuła:
A = (x’x)
-1
x’y
‘ – transpozycja prosta
-1
– macierz odwrotna
Przykład (jedna zmienna objaśniająca)
Na podstawie danych statystycznych zamieszczonych w tablicy oszacować parametry strukturalne modelu o postaci.
Y
t
=
α
1
X
1t
+
α
0
+
ξ
t
y
t
3 2 2 1 1
X
1t
2 2 1 1 0
Wyznaczamy wykres rozrzutu
=
1
1
2
2
3
y
=
1
0
1
1
1
1
1
2
1
2
X
parametr wolny (na końcu jest
ξ
t
)
Stosując formułę na wektor ocen parametrów strukturalnych czyli
a = (X’X)
-1
X’Y
−
−
=
−
71
,
0
43
,
0
43
,
0
36
,
0
)
'
(
1
X
X
ocena parametru a
1
ocena parametru a
0
=
86
,
0
78
,
0
a
9
13
'
=
Y
X
EKONOMETRIA
Dr Stanisław Barczak
10
Model po oszacowaniu
Y*
t
= 0,78X
1t
+ 0,86 + u
t
Intensywność wzrostu X
1t
o 1 jednostkę spowoduje wzrost Y o 0,78.
a
0
= 0,86 – taką średnią wartość przyjmuje zmienna endogeniczna Y
t
w przypadku gdy zmienna objaśniająca X
1t
będzie równe zero (= 0)
Model liniowy z 2 zmiennymi objaśniającymi.
Każdy parametr szacowany na podstawie 2,5 obserwacji (zdecydowanie za mało – tutaj tylko
dla uproszczenia).
Yt – poziom produkcji
X
1t
– liczba pracowników
X
2t
– zużycie energii elektrycznej
Yt =
α
X
1t
β
1
X
2t
β
2
e
(
γ
-t)
– postać statyczna. „e“ – elementem dynamicznym.
Yt =
α
1
X
1t
+
α
2
X
2t
+
α
0
+
ξ
t
Weryfikacja postaci analitycznej modelu, od wykresu rozrzutu (dla obu zmiennych) zależy czy model liniowy czy
nie.
=
1
2
,
14
23
1
14
22
1
8
,
13
24
1
4
,
13
23
1
5
,
12
25
X
14
13
13
12
11
=
Y
Tworzymy X’X. Później (X’X)
-1
A
-1
= (1/detA) * adjA
a
1
a
2
a
3
Yt = 0,31X
1t
+ 2,04X
2t
– 22,51 + U
t
Wzrost liczby pracowników o 1 etat spowoduje wzrost poziomu produkcji Yt o 0,31 tys sztuk, pod warunkiem, że
zużycie energii elektrycznej nie ulegnie zmianie.
Wzrost zużycia energii elektrycznej o 1 MWh spowoduje wzrost poziomu produkcji o 2,04 tys sztuk pod
warunkiem, że liczba pracowników nie ulegnie zmianie
-22,51 taki średni poziom miałaby zmienna endogeniczna w przypadku gdy zmienne objaśniające są równe 0.
WŁASNOŚCI ESTYMATORÓW
Estymator nieobciążony:
1. Jeśli jego wartość oczekiwana (nadzieja matematyczna) jest równa estymowanemu parametrowi E(a)=a
2. Dla Modelu danego jako y = Xa +
ξ
wektor parametrów strukturalnych dany jest jako a = (X’X)
-1
X’Y
3. E(a) = E[(X’X)
-1
X’Y] = E[(X’X)
-1
X’ * (Xa +
ξ
)]
4. Zakłada się, że zmienne objaśniające są nielosowe E(
ξ
)=0
5. Stąd estymator parametrów strukturalnych jest nieobciążony jeżeli:
2
,
14
23
14
14
22
13
8
,
13
24
13
4
,
13
23
12
5
,
12
25
11
2
1
t
X
t
X
Yt
−
=
51
,
22
04
,
2
31
,
0
a
=
63
5
,
858
1
,
147
'Y
X
EKONOMETRIA
Dr Stanisław Barczak
11
a. Zmienne objaśniające są nielosowe – kowariancja składnika losowego nie zależy od zmiennych
objaśniających E(X
ξ
)=0
b. Składnik losowy ma wartość oczekiwaną 0
Estymator Zgodny:
1. Estymator parametru
α
jest zgodny jeżeli jest stohastycznie zbieżny do szacowanego parametru
α
. Oznacza
to, że przy wzroście liczby obserwacji do nieskończoności, jego wartość dąży stohastycznie do prawdziwej
wartości szacowanego parametru:
1
}
|
{|
lim
=
<
−
∞
>
−
ε
a
a
P
n
Jeżeli wraz ze wzrostem liczebności próby oczekiwana wartość rozkładu estymatora zmierza do wartości
szacowanego parametru, a jednocześnie wariancja estymatora zmierza do zera, to estymator taki jest zgodny
Estymator efektywny:
Przy danych kilku estymatorach zgodnych i nieobciążonych estymatorem najefektywniejszym jest ten, który posiada
najmniejszą wariancję.
Jeżeli spełnione są założenia KMNK (dotyczące składnika losowego oraz zmiennych objaśniających) to estymator a
= (X’X)
-1
X’Y jest estymatorem najefektywniejszym spośród estymatorów liniowych, gdzie jego wariancja dana jest
następującą formułą:
D^(a) =
δ
^ * (X’X)
-1
jako macierz wariancji i kowariancji, na głównej przekątnej wariancje estymatorów, poza
nią kowariancje.
δ
^ = S^(u)
Założenia klasycznej metody najmniejszych kwadratów do własności estymatorów:
1. Jeżeli
zmienne
objaśniające
są
współliniowe,
to
nie
istnieje
estymator
dany
formułą
a = (X’X)
-1
X’Y, ponieważ nie istnieje macierz odwrotna do macierzy (X’X) to wyznacznik jest równy 0,
czyli det (X’X) = 0.
2. Jeżeli wariancja składnika losowego nie jest stała to:
a = (X’X)
-1
X’Y jest nieobciążony, i zgodny, ale nie jest najefektywniejszy. Musi istnieć stałość wariancji w
czasie
δ
^
1
=
δ
^
2
. Często się rezygnuje z efektywności estymatora
3. Jeżeli składnik losowy jest zależny cov(
ξ
t
;
ξ
t+1
) różna od 0, a w zbiorze zmiennych objaśniających nie ma
zmiennej endogenicznej opóźnionej (
α
1
Y
t-1
)w czasie to a = (X’X)
-1
X’Y jest nieobciążony i zgodny, ale nie
jest już najefektywniejszy
4. Jeżeli składnik losowy jest zależny [cov(
ξ
t
;
ξ
t+1
) różna od 0], a w zbiorze zmiennych objaśniających istnieje
zmienna endogeniczna opóźniona w czasie to:
a = (X’X)
-1
X’Y nie jest zgodny
5. Jeżeli wariancja składnika losowego jest funkcją zmiennych objaśniających to estymator a = (X’X)
-1
X’Y
nie jest zgodny.
Klasyczne założenia dotyczące składnika losowego:
Dana jest macierz wariancji i kowariancji składnika losowego:
=
)
(
^
...
)
(
)
(
...
...
...
...
)
(
...
)
(
^
)
(
)
(
...
)
(
)
(
^
)
'
,
(
2
1
2
2
1
2
1
1
1
n
n
n
n
n
D
E
E
E
D
E
E
E
D
E
ξ
ξ
ξ
ξ
ξ
ξ
ξ
ξ
ξ
ξ
ξ
ξ
ξ
ξ
ξ
ξ
ξ
macierz kwadratowa i symetryczna
-
jest kwadratowa i symetryczna
-
na głównej przekątnej znajdują się wariancje składnika losowego poszczególnych
okresów (w przypadku serii czasowych), natomiast poza główną przekątną znajdują się
kowariancje między składnikami losowymi poszczególnych okresów.
Można wyróżnić 4 sytuacje związane z założeniami:
1. Spełnione założenie MNK
a. Wariancja jest jednorodna D^(
ξ
1
) = D^(
ξ
2
) =... = D^(
ξ
n
) =
δ
^
b. Brak autokorelacji czyli składnik losowy jest niezależny E(
ξ
t
,
ξ
t+1
)=0
c. Macierz wariancji i kowariancji ma postać:
EKONOMETRIA
Dr Stanisław Barczak
12
In
E
2
2
2
2
...
0
0
...
...
...
...
0
...
0
0
...
0
)
'
,
(
δ
δ
δ
δ
ξ
ξ
=
=
gdzie In to macierz jednostkowa
2. Nie jest spełnione założenie o jednorodności wariancji składnika losowego
a. D^(
ξ
1
)
≠
D^(
ξ
2
)
≠
...
≠
D^(
ξ
n
)
≠
δ
^
b. Brak autokorelacji czyli składnik losowy jest niezależny E(
ξ
t
,
ξ
t+1
)=0
c. Wówczas macierz wariancji i kowariancji składnika losowego jest macierz diagonalna i ma postać:
=
)
(
^
...
0
0
...
...
...
...
0
...
)
(
^
0
0
...
0
)
(
^
)
'
,
(
2
1
n
D
D
D
E
ξ
ξ
ξ
ξ
ξ
3. Jeżeli spełnione jest założenie o jednorodności wariancji składnika losowego, czyli (dzieli próbę na 2 części
i w obu wariancje będą równe):
a. D^(
ξ
1
) = D^(
ξ
2
) =... = D^(
ξ
n
) =
δ
^
b. Składnik losowy jest zależny (występuje jego autokorelacja)
c. Wówczas macierz wariancji i kowariancji składnika losowego jest macierzą symetryczną i ma
postać:
=
1
...
...
1
...
...
...
1
...
1
)
'
,
(
2
1
2
21
1
22
n
n
n
n
E
ρ
ρ
ρ
ρ
ρ
ρ
ξ
ξ
współczynniki autokorelacji między składnikiem losowym i-tego i –tgo okresy.
4. Jeżeli nie jest spełnione założenie o jednorodności wariancji składnika losowego:
a. D^(
ξ
1
)
≠
D^(
ξ
2
)
≠
...
≠
D^(
ξ
n
)
≠
δ
^
b. Oraz nie jest jest spełnione założenie o braku korelacji, czyli występuje sytuacja, w której E(
ξ
1
ξ
2
)
≠
0
c. Wówczas macierz wariancji i kowariancji składnika losowego jest macierzą symetryczną i ma
postać (tak jak w sytuacji 1).
Sytuacje 3 i 4 to tzw. „egzamin” dla modelu i nie jest zależne od naszych błędów.
MODELE NIELINOWE SPROWADZALNE DO LINIOWYCH
MODEL HIPERBOLICZNY:
Oszacować model o postaci Y
t
=
α
1
(1/X
1t
) +
α
0
+
ξ
t
Na podstawie danych statystycznych stablicowanych:
Y
t
1
1,1
1,11
1,12
1,22
1,25
1,36
1,54
2
2
X
1t
11
8
6
4
4
3
2
2
2
1
G
t
0,09
0,126
0,16
0,25
0,25
0,33
0,5
0,5
0,5
1
Na podstawie wykresu rozrzutu
model hiperboliczny (wykres hiperboli)
Model należy sprowadzić do postaci liniowej, by zastosować MNK.
G
t
= 1/X
1t
Stąd model będzie liniowy ze względu na zmienną G.
Y
t
=
α
1
G
t
+
α
0
+
ξ
t
Stosujemny MNK:
A = (X’X)
-1
X’Y
EKONOMETRIA
Dr Stanisław Barczak
13
=
1
1
1
5
,
0
1
5
,
0
1
5
,
0
1
33
,
0
1
25
,
0
1
25
,
0
1
166
,
0
1
126
,
0
1
09
,
0
X
=
2
2
54
,
1
36
,
1
25
,
1
22
,
1
12
,
1
11
,
1
1
,
1
1
Y
=
10
71
,
3
71
,
3
03
,
2
' X
X
−
−
=
−
31
,
0
56
,
0
56
,
0
52
,
1
)
'
(
1
X
X
=
7
,
13
86
,
5
'Y
X
ostatecznie a = 1,17 v 0,93
Postać pierwsze Y
t
= 1,17G
t
+ 0,93 + U
t
Postać druga i ostateczna: Y
t
= 1,17 (1/X
1t
) + 0,93 + U
t
Wzrost ceny o 100zł spowoduje spadek wielkości sprzedaży o 1,17szt.
Weryfikacja modelu ekonometrycznego:
Oznacza to:
-
zbadanie czy oszacowany model jest zgodny z rzeczywistością (kierunek wpływu zmiennych
objaśniających jest zgodny z rzeczywistością(
-
zbadanie czy model ekonometryczny jest wystarczająco przejrzysty
-
zbadanie czy zmienne objaśniające istotnie wpływają na zmianę endogeniczną
-
zbadanie czy spełnia założenie MNK
Miary struktury stochastycznej:
1. Wariancja resztowa i odchylenie standardowe reszt:
a. Przy spełnionych warunkach MNK nieobciążonym estymatorem wariancji resztowej jest
wariancja resztowa wyznaczona wg następującej formuły:
∑
∑
=
=
−
=
−
−
=
n
t
n
t
t
u
k
n
Yt
Yt
k
n
u
S
1
1
*
2
1
)
(
1
)
(
gdzie n – liczba obserwacji, k – liczba szacowanych
parametrów.
Pierwiastek kwadratowy wariancji resztowej daje tzw. Odchylenie standardowe reszt czyli S(u).
Odchylenie standardowe informuje o ile średnio rzecz biorąc in plus, bądź in minus odchylają się
rzeczywiste realizacje zmiennej endogenicznej od wartości teoretycznych wyznaczonych przez model.
2. Macierz wariancji i kowariancji oraz średnie błędy szacunkowe
a. D
2
(a)=
δ
2
(X’X)
-1
gdzie
δ
2
= S
2
(u) czyli D
2
(a)= S
2
(u)(X’X)
-1
b. Miary struktury stochastycznej (wariancja resztowa oraz macierz wariancji i kowariancji) modelu
związane są ze zmienną
ξ
.
Miara precyzji estymacji parametru struktury są średnie błędy szacunku. Kwadraty błędów szacunku
znajdują się na głównej przekątnej macierzy wariancji i kowariancji. Pierwiastek wariancji estymatora
daje zatem średni błąd szacunku dla danego parametru.
3. Miary dopasowania modelu do danych empirycznych (badanie jakości modelu).
a. Współczynnik zbieżności (przyjmuje wartości od 0 do 1) – miara negatywna
i.
∑
∑
=
=
−
−
=
n
t
n
t
Y
Yt
Yt
Yt
1
2
_
1
2
*
2
)
(
)
(
ϕ
ii. współczynnik zbieżności może być stosowany tylko w przypadku modeli liniowych i
modeli do liniowych sprowadzalnych
EKONOMETRIA
Dr Stanisław Barczak
14
iii. współczynnik zbieżności przyjmuje wartość 0 w przypadku gdy wszystkie wartości
teoretyczne zmiennej endogenicznej są równe wartościom rzeczywistym zmiennej
endogenicznej
ϕ
2
=0 => model idealnie dopasowany
iv. jeżeli współczynnik zbieżności przyjmuje wartość 1 oznacza to, że zmienność, zmiennej
endogenicznej została całkowicie nie wyjaśniona przez model ekonometryczny (na
wykresie rozrzutu punkty emiryczne „wszędzie”)
b. Współczynnik determinacji
i. Jest miarą alternatywną w stosunku do
ϕ
u dana jest R
2
= 1-
ϕ
2
nie jest jednak
najważniejszą miarą modelu
ii. Przyjmuje wartości od 0 do 1
iii. Współczynnik determinacji jest kwadratem współczynnika korelacji wielorakiej (reaguje
na ilość zmiennych)
iv. Informuje jaka cześć zmienności zmiennej endogenicznej została wyjaśniona przez model
v. Jego wartości związane z przyrostem ilości zmiennych objaśniających rośnie, można
zatem dodatkowo skorzystać ze skorygowanego współczynnika determinacji (gdy mamy
dużo zmiennych objaśniających I będą budowane prognozy).
)
1
(
1
1
1
2
~
2
R
m
n
n
R
−
−
−
−
−
=
gdzie n to liczba obserwacji, a m liczba zmiennych objaśniających
interpretacja analogiczna do R
2
(tylko dla modeli liniowych bądź do liniowych sprowadzalnych) Zawsze
skorygowany współczynnik determinacji niższy od normalnego.
c. Współczynnik zmienności losowej
i. Vs = Su/Y I zawsze podawany w procentach (%). Współczynnik zmienności losowej
informuje jaką część średniego poziomu zmiennej endogenicznej stanowią wahania
przypadkowe.
Przykład:
Y
t
=
α
1
X
1t
+
α
0
+
ξ
1
Y
t
1
0
2
2
X
1t
2
0
-2
-1
Model po oszacowaniu MNK Yt = -0,31X
1t
+ 1,17 + u
t
Obliczamy wartości teoretyczne modelu:
Y*1 = -0,31*2 + 1,17 = 0,542
Y*2 = 1,17
Y*3 = 1,8
Y*4 = 1,485
Wariancja resztowa:
U1 = 0,457 U2 = -1,17 U3 = 0,2 U4 = 0,514
suma powinna się równać 0.
∑
u
2
= 1,8857 n = 4 k = 2 => Su = 0,971
Rzeczywiste realizacje zmiennej endogenicznej (Yt) odchylają się średnio rzecz biorąc +/- o 0,971 (jednostki) od
wartości teoretycznych wyznaczonych przez model.
Liczymy macierz wariancji i kowariancji oraz średnie błędy szacunku:
D
2
(a) = S
2
(u)(X’X)
-1
= 0,9428
*
257
,
0
028
,
0
028
,
0
114
,
0
=
242
,
0
026
,
0
026
,
0
107
,
0
Średnie błędy szacunku:
D^(a1) = pierwiastek z 0,107 = 0,32
D^(a2) = pierwiastek z 0,242 = 0,49
Model zapisujemy:
Y*
t
= -0,31X
1t
+ 1,17 + u
t
(0,32) (0,49)
EKONOMETRIA
Dr Stanisław Barczak
15
WERYFIKACJA ISTOTNOŚCI PARAMETRÓW STRUKTURALNYCH MODELU
NP.
Y
t
= 10X
1t
+ 2X
2t
+ 5 + u
t
Jeżeli stwierdzimy, że nieistotny jest wpływ, którejś ze zmiennych to ją usuwamy.
Wtedy ponownie szacujemy model bez tej zmiennej.
Nie ma konieczności testowania parametru wolnego.
Do przyczyn nieistotności parametrów strukturalnych modelu można zaliczyć:
-
brak zależności między zmienną objaśniającą, albo endogeniczną
-
mała dokładność lub nieodpowiednia jakość danych statystycznych
-
słaba dokładność technik estymacji oraz wnioskowania statystycznego (ważny przy małych próbach)
-
przyjęcie niewłaściwej postaci analitycznej modelu
-
okoliczności przypadkowe wynikające z losowości próby
-
pominięcie istotnych zmiennych objaśniających, te braki będą się kumulowały w resztach co spowoduje
wysoką wariancję resztową, co z kolei spowoduje, że średnie błędy szacunku będą wysoki, im wyższa
wartość wariancji szacunku tym większe średnie błędy.
TEST T-STUDENTA
H0:
α
= 0 wobec hipotezy alternatywnej takiej, że H1:
α
1
≠
0
Jeżeli H0 odrzucamy tzn, że parametr jest istotny.
Sprawdzeniem hipotezy H0 jest statystyka t-studenta o n-k stopniach swobody, gdzie k to liczba szacowanych
parametrów.
T = a
i
/D(a
i
) gdzie i = 1,2...k
a
i
- ocena parametru
α
1
D(a
i
) – średni błąd szacunku parametru a
i
|t| > t
α
gdzie t
α
to wartość krytyczna odczytywana z tablic.
W takim wypadku H0 odrzucamy na korzyść hipotezy alternatywnej.
Przykład:
Y
t
= 6X
1t
+ 4X
2t
– 8X
3t
+ 10 + u
t
(2) (1) (4) (6)
S(u) = 0,4
R^ = 0,98
N = 20, k = 4, n-k = 16
Zakładamy poziom istotności
α
=0,05 => t
α
= 2,120
H0:
α
1 = 0
H1:
α
1
≠
0
T = 6/2 = 3 |t| > t
α
H0: odrzucamy na korzyść H1, czyli
α
1
≠
0
Zmienna objaśniająca X
1t
istotnie wpływa na zmienną endogeniczną Yt i należy ją pozostawić.
α
2
t = 4 => pozostawiamy w modelu X
2t
α
3
t = -2 => X
3t
nieistotnie wpływa na Yt i należy ją z modelu wyrzucić.
α
4 (ślepa zmienna)
T = 1,8 => nieistotnie wpływa na model i należy ją z niego usunąć
Jeżeli chcemy utrzymać model to musimy zmienić poziom istotności np.
α
= 0,1 gdzie t
α
= 1,76
EKONOMETRIA
Dr Stanisław Barczak
16
Jeżeli wypada nam jakaś zmienna to szacujemy model raz jeszcze i raz jeszcze sprawdzamy istotność zmiennych.
Autokorelacja składnika losowego rzędu I. Test Durbina-Watsona
Może ona wyrażać się w postaci:
ξ
t
= f(
ξ
t-1
,
ξ
t-2
...
ξ
t-
τ
)
Do najczęstszych odstępstw od założeń MNK można zaliczyć fakt iż składnik losowy
ξ
t nie tworzy procesu czysto
losowego, lecz zależy od wskaźnika bieżącego „t”. Sytuacja taka ma miejsce, gdy wskaźnik t wyznacza pewne
rozmieszczenie przestrzenna lub częściej gdy realizacje
ξ
t są zależne w czasie.
Autokorelacje można mierzyć tzw. współczynnikiem autokorelacji rzędu
τ
, który jest liczony jako współczynnik
korelacji liniowej r
t
)
(
)
(
)
(
)
(
)
(
1
τ
τ
τ
τ
ξ
ξ
ξ
ξ
ξ
ξ
ρ
−
−
−
×
×
−
=
t
t
t
t
t
D
D
E
E
E
Estymator współczynnika autokorelacji rzędu
τ
, dany jako
−
−
×
−
−
−
×
−
×
×
−
−
×
=
∑
∑
∑
∑
∑
∑
∑
+
=
−
+
=
−
+
=
+
=
−
+
=
+
=
−
τ
τ
τ
τ
τ
τ
τ
τ
τ
τ
τ
τ
τ
τ
τ
n
u
u
n
u
u
n
n
u
u
n
u
u
r
n
t
t
n
t
t
n
t
t
n
t
t
n
t
n
t
t
n
t
t
t
t
2
1
1
2
2
1
1
2
1
1
)
(
)
(
)
(
Współczynnik autokorelacji przyjmuje wartość z przedziału [-1,1]
Przyczyny autokorelacji składnika losowego:
-
błędy specyfikacji modelu:
o
pominięcie istotnej zmiennej objaśniającej
o
błędne określenie opóźnień czasowych zmiennej bądź kilku zmiennych objaśniającej
o
przyjęcie niewłaściwej postaci analitycznej modelu
test Durbina-Watsona stosowany jest tylko do testowania autokorelacji rzędu I
H0:
ρ
1 = 0
H1:
ρ
1 > 0 lub H1:
ρ
< 0
Sprawdzeniem Ho jest statystyka Durbina-Watsona (gdy dysponujemy resztami modelu danymi jako:
∑
∑
=
=
−
−
=
n
t
t
n
t
t
t
U
U
U
d
1
2
2
2
1
)
(
, gdzie Ut to reszta równania z okresem t.
Sprawdzian hipotezy H0 możemy przedstawić jako (gdy mamy współczynniki autokorelacji I rzędu)
d = z (1 – r
1
) gdzie r
1
to współczynnik autokorelacji I rzędu
Statystyka D-W przyjmuje wartości z przedziału [0,4]
W przybliżeniu dla r = 1; d = 0, r = 0 d =2 i dla r = -1 d = 4
Pomiędzy 0 a 2 zależność dodatnia (+), pomiędzy 2, a 4 ujemna (-)
EKONOMETRIA
Dr Stanisław Barczak
17
Podjęcie decyzji w przypadku gdy:
- mamy doczynienia z dodatnią korelacją składnika losowego H0:
ρ
1 = 0 i H1
ρ
1 > 0
d
L
- dolna wartość krytyczna odczytana z tablic
d
n
- górna wartość krytyczna odczytana z tablic
•
jeżeli d <= d
L
to H0 odrzucamy, wtedy model należy poprawić (oszacować ponownie uogólnioną MNK lub
zastosować metodę różniczki zupełnej)
•
jeżeli d
L
< d < d
n
to nie można podjąć decyzji odnośnie istotności bądź nieistotności autokorelacji składnika
losowego – tzw. obszar niekonkluzywności
•
jeżeli d => d
n
nie ma podstaw do odrzucenia H0.
- mamy doczynienia z dodatnią korelacją składnika losowego H0:
ρ
1 = 0 i H1
ρ
1 < 0
•
liczymy d’ (d’= 4 – d)
•
jeżeli d’ <= d
L
to H0 odrzucamy, wtedy model należy poprawić (oszacować ponownie uogólnioną MNK
lub zastosować metodę różniczki zupełnej)
•
jeżeli d
L
< d’ < d
n
to nie można podjąć decyzji odnośnie istotności bądź nieistotności autokorelacji
składnika losowego – tzw. obszar niekonkluzywności
•
jeżeli d’ => d
n
nie ma podstaw do odrzucenia H0.
Homoskedastyczność – jednorodność wariancji składnika losowego (
ρ
0 nie jest spełniona – poprawiamy model
uogólnioną MNK, tracimy na dokładności modelu).
Homoskedastyczność jest:
-
jednym z założeń MNK
-
oznacza, iż wraz ze zmianą wartości zmiennej endogenicznej lub zmiennych objaśniających lub wraz z
upływem czasu wariancja składnika losowego ulega zmianie
-
odstąpienie od tego założenia powoduje obniżenie efektywności estymatorów
Test Goldfelda – Quandta
Próbę statystyczną dzieli się na 2 części, (gdy ilość jest nieparzysta to odrzucamy środkową).
Na podstawie równoliczących prób szacuje się dwa modele ekonometryczne, a następnie oblicza się ich wariancje
resztowe
S
2
u1
oraz S
2
u2
∑
=
−
×
−
=
n
t
t
t
u
Y
Y
k
n
S
1
2
2
)
*
(
1
W teście weryfikowane są następujące hipotezy H0:
ρ
2
1
=
ρ
2
2
H1:
ρ
2
1
>
ρ
2
2
Zakładając prawdziwość H0, sprawdzianem testu jest statystyka F o rozkładzie Fishera-Snedecora danego
następującą formułą:
2
1
2
2
Su
Su
F
o m
1
= (n
2
– k) i m
2
= (n
1
i k) stopniach swobody
Decyzja: hipotezę o homoskedastyczności odrzucamy, gdy wartość sprawdzianu F przekroczy wartość krytyczną F
α
odczytaną z tablic rozkładu Fishera dla określonego poziomu istotności oraz określonej liczby stopni swobody.
Y
6
8
5
7
5
|
4
8
4
7
6
X
1
2
1
1
1
|
0
2
0
1
1
Na podstawie danych z tabeli oszacowano model ekonometryczny i otrzymano wyniki
Yt = 2X
1t
+ 4 + u
t
Su
2
= 0,5
Model 1 (z pierwszej części tabeli)
Yt = 2,25X
1t
+ 3,5 + u
t
Su
2
= 0,9166
Model 2 (z drugiej części tabeli)
Yt = 2,07X
1t
+ 4,14 + u
t
Su
2
= 0,2619
Test Fishera:
EKONOMETRIA
Dr Stanisław Barczak
18
α
= 0,05 m
1
= 3 m
2
= 3
F = 0,2619/0,9166 = 0,2857
Wartość z tablic F
α
= 9,28
F < F
α
brak podstaw do odrzucenia H0, głoszącej stałość wariancji składnika losowego.
Przykład 1.
Na podstawie 25 operacji oszacowano model ekonometryczny i otrzymano wyniki:
Y
t
= 2X
1t
- 3X
2t
+ 4X
3t
+ 5 + u
t
Współczynnik autokorelacji rzędu I wynosi r
1
=-0,95; k=3; n=25;
α
=0,05
H
0
:r
1
=0
H
1
:r
1
<0
Statystyka: d =2 (1 - r
1
) = 2(1 + 0,95) = 3,9 liczymy d’= 4 – 3,9 = 0,1
d
L
=1,12 d
u
=1,66
d’<d
L
hipotezy zerowe odrzucamy na korzyść hipotezy alternatywnej głoszącej, że r
1
<0 Istotna
autokorelacja ujemna składnika losowego. Model należy poprawić.
Pierwsza rzecz to szacowanie przyczyn istotnej autokorelacji (np. opuszczanie istotnych przyczyn), (czy proces jest
nieliniowy, a wg modelu liniowy). Ostateczność
MNK lub różniczki zupełnej.
Przykład 2.
L.p. 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
U
t
-1 -1 -2 -2 -2 1 2 -2 1 1
1
1
0
-1 0
1
0
2
1
0
U
t-1
-
-1 -1 -2 -2 -2 1 2 -2 1
1
1
1
0
-1 0
1
0
2
1
Dodatkowo wiadomo, że model posiada 2 zmienne objaśniające. k=2 n=20
α
=0,05
H
0
:
ρ
1
=0
H
1
:
ρ
1
>0 (bo d<2)
(
)
∑
∑
=
=
−
−
=
n
t
t
n
t
t
t
u
u
u
d
1
2
2
2
1
test tylko dla autokorelacji rzędu I
(
)
∑
=
−
=
−
20
2
2
1
58
t
t
t
u
u
∑
=
=
20
1
2
34
t
t
u
6918
,
1
34
58
=
=
d
d
L
=1,10 d
u
=1,54
d > d
u
Brak podstaw do odrzucenia H
0
, głoszącej, że
ρ
1
=0. Nieistotna autokorelacja składnika losowego.
UOGÓLNIONA METODA NAJMNIEJSZYCH KWADRATÓW
lekarstwo na autokorelację i niestałość wariancji
1. służy do szacowania parametrów strukturalnych modeli liniowych przy niespełnionym założeniu o stałości
wariancji odchyleń
2. służy do szacowania parametrów strukturalnych modeli liniowych przy niespełnionym założeniu o braku
autokorelacji składnika losowego
Wówczas macierz wariancji i kowariancji może być zapisana jako:
D
2
(a) =
σ
2
Ω
dowolna dodatnio określona macierz stopnia n
Wektor ocen parametrów strukturalnych dotyczy uogólnionej MNK dany:
(
)
y
X
X
X
a
1
1
'
'
−
−
Ω
Ω
=
KMNK analogicznie do
(
)
y
X
X
X
a
'
'
1
−
=
Wyznaczenie wektora ocen parametrów strukturalnych
Wyznaczenie macierzy wagowej P:
P jest taka, że
Ω
-1
= P’P
EKONOMETRIA
Dr Stanisław Barczak
19
UWAGA!
Następnie oblicza się ważone obserwacje zmiennych czyli: y
*
=Py
X
*
=PX
Praktyczne zastosowanie UMNK wymaga znajomości macierzy
Ω
. Macierz
Ω
zazwyczaj nie jest a priori znana.
1. przypadek
niestałość wariancji odchyleń losowych
Macierz
Ω
jest macierzą diagonalną jako:
Ω
Ω
Ω
=
Ω
n
...
0
0
...
...
...
...
0
...
0
0
...
0
2
1
Macierz odwrotna
Ω
Ω
Ω
=
Ω
−
n
1
...
0
0
...
...
...
...
0
...
1
0
0
...
0
1
2
1
1
A macierz wagowa P dana jest jako wektor
Wyznacznik macierzy diagonalnej
iloczyn głównej przekątnej
Elementami na głównej przekątnej mogą być:
a) realizacje wybranej zmiennej objaśniającej X (najprostszy
przypadek), czyli
Ω
t
= X
t
t = 1,2,3,...,n
b) moduły reszt modelu oszacowanego MNK, czyli
Ω
t
= |u
t
|
t = 1,2,3,...,n
c) w przypadku autokorelacji składnika losowego zakłada się nieciągłe{
ξ
} podleganie procesowi
autoregresyjnemu rzędu I czyli:
Ω
t
=
ρξ
t-1
+
η
t
t = 1,2,3,...,n
gdzie |
ρ
| < 1 wówczas
ρ
τ
=
ρ
τ
A macierz
Ω
jest macierzą współczynników autokorelacji odchyleń losowych o postaci:
=
Ω
−
−
−
−
−
1
...
...
...
...
...
...
...
1
...
1
3
2
1
2
1
2
η
η
η
η
η
ρ
ρ
ρ
ρ
ρ
ρ
ρ
ρ
ρ
−
−
+
−
+
−
−
+
−
−
=
Ω
−
1
0
...
0
0
0
1
...
0
0
0
...
...
...
...
...
...
...
0
0
0
...
1
0
0
0
0
...
1
0
0
0
...
0
1
2
2
2
1
ρ
ρ
ρ
ρ
ρ
ρ
ρ
ρ
ρ
ρ
Macierz wagowa P
−
−
−
−
−
=
1
0
...
0
0
0
0
1
...
0
0
0
...
...
...
...
...
...
...
0
0
0
...
1
0
0
0
0
...
0
1
0
0
0
...
0
0
1
2
ρ
ρ
ρ
ρ
ρ
P
Ocena współczynnika autokorelacji dana jest jako:
(
)
(
)
∑
∑
=
−
=
+
−
−
−
=
n
t
t
n
t
t
t
u
n
u
u
k
n
r
1
2
1
1
1
1
1
1
k – liczba szacowanych parametrów w modelu
Wariancja resztowa dana jest następującą formułą:
u
u
k
n
S
u
1
2
'
1
1
−
Ω
−
−
=
u - kolumnowy wektor reszt
Ω
Ω
Ω
=
n
P
1
...
0
0
...
...
...
...
0
...
1
0
0
...
0
1
2
1
EKONOMETRIA
Dr Stanisław Barczak
20
Macierz wariancji i kowariancji dana jest jako:
( )
(
)
1
1
2
2
'
−
−
Ω
=
X
X
S
a
D
u
Zastosowanie UMNK dla poprawienia modelu wykazującego autokorelację składnika losowego.
Yt
6
5
6,5
4
5,5
2
6
3
5
5
X
1t
1
2
1
1
1
0
2
0
1
1
X
2t
-1
0
1
0
1
-1
-1
0
0
1
Oszacowano model w postaci:
Y
t
=
α
1
X
1t
+
α
2
X
2t
+
α
0
+
ξ
t
i otrzymano wynik:
Yt = 1,5X
1t
+ 0,5X
2t
+ 3,3 + u
t
(0,52) (0,42) (0,61)
d = 3,0264 jeżeli d > 3 (ok 3,6) to można praktycznie od razu stwierdzić autokorelacja istotna.
Test Durbina-Watsona:
N = 10 K = 2
H
0
:
ρ
1
= 0
H
1
:
ρ
1
< 0
d’ = 0,9736
d
L
= 0,697
d
U
= 1,641
Obszar niekonkluzywności – nie wiadomo nic o składniku losowym (nie można podjąć decyzji).
Stosujemy UMNK i korzystamy w dalszym ciągu z modelu.
Reszty w modelu zanikają z czasem (w momencie spadków stałych, zaczyna się opóźnienie w modelu).
UMNK:
Wektor ocen parametrów strukturalnych UMNK dany jako:
(
)
y
X
X
X
a
1
1
'
'
−
−
≈
Ω
Ω
=
Założono, że na głównej przekątnej macierzy wprowadzone zostaną moduły reszt modelu oszacowanego KMNK:
Macierz 10x10:
=
Ω
3
,
0
2
,
0
3
,
0
0
2
,
0
8
,
0
2
,
0
8
,
0
0
2
,
1
3
,
1
7
,
1
=
Ω
−
3
,
0
1
...
0
0
...
...
...
...
0
...
3
,
1
1
0
0
...
0
7
,
1
1
1
też macierz 10x10
EKONOMETRIA
Dr Stanisław Barczak
21
Oszacowany model ma postać:
~Y
t
= 1,71X
1t
+ 0,55X
2t
+ 3,07 + u
t
(0,34) (0,27) (0,41)
S
2
u
= 1,0954
S
u
= 1,0466
Reszty również zanikają z czasem. Po zastosowaniu UMNK – zmniejszają się amplitudy wahań.
EKONOMETRYCZNA TEORIA PROGNOZ
Przewidywanie przyszłości – np. prognoza pogody na Śląsku o 12:48m etc.
Jeżeli nie dysponujemy historią, nie możemy prognozować ekonometrycznie.
-
nieracjonalne – wróżby, magia, proroctwa, wszystko co oparte na doświadczeniu, a nie wymaga stosowania
reguł naukowych
-
racjonalne – na podstawie racjonalnych przesłanek (zbiory faktów z przeszłości)
o
zdroworozsądkowa – na nosa, tak mi się wydaje; często wynika z doświadczenia
o
naukowe – fakty i tylko fakty
Naukowe to wiedza + metody, dowody.
Prognoza:
-
Zbigniew Hellwig – prognozą statystyczną nazywać będziemy każdy sąd, którego prawdziwość jest
zdarzeniem losowym, przy czym prawdopodobieństwo tego zdarzenia jest znane i wystarczająco duże dla
celów praktycznych
-
Zbigniew Pawłowski – wnioskowaniem w przyszłość na podstawie modelu będziemy nazywać predykcją,
natomiast konkretny wynik otrzymany na skutek zastosowanego wnioskowania nazywać będziemy
prognozą.
Ostatecznie przez prognozę będziemy rozumieć sąd o następujących właściwościach:
-
Sformułowana z wykorzystaniem dorobku nauki
-
odnoszące się do określonej przyszłości – jest to sąd o stanie zmiennych, bądź zmiennej w przyszłości,
która jest określona explicite przez podanie momentu czasu (np. 30.06 przychód ze sprzedaży wyniesie
2mln zł), bądź implicite (np. Anna będzie dobrym lekarzem)
-
Jest to sąd weryfikowalny empirycznie, prognoza jest sformułowana precyzyjnie oraz istnieje określony
czas w którym będzie sprawdzona
-
Jest to sąd niepewny, ale akceptowany (dopuszczalna/niedopuszczalna)
-
Należy unikać stawiania prognoz banalnych (np. jutro będzie wtorek etc.)
Funkcje prognoz:
-
preparacyjna – prognozowanie jest działaniem, które przygotowuje inne działania
-
aktywizująca – ma za zadanie pobudzać do działania (prognozy ostrzegawcze)
-
informacyjna
Rodzaje prognoz:
-
ilościowe – prognoza wyrażona jest liczbą (punktowe – wielkość sprzedaży 2mln zł, lub przedziałowe, 2-
2,5mln zł)
-
jakościowe – najczęściej prognoza słownie opisana sytuacja (np. za 2 tygodnie kurs euro spadnie)
Ze względu na typ zmian zmiennej prognozowanej:
-
krótkoterminowe – na przedział czasu, w którym zachodzą tylko zmiany ilościowe
-
średnioterminowe – na przedział czasu, w którym zachodzą zmiany ilościowe, ale oczekuje się też zmian
jakościowych
-
długookresowe – zachodzą zmiany ilościowe i jakościowe, które też należy uwzględnić.
Podstawowe pojęcia prognozowania:
Dopuszczalność prognozy – prognoza jest dopuszczalna, wówczas gdy obdarzona jest przez odbiorcę stopniem
zaufania uprawniającym do tego by mogła być wykorzystana do celu, dla którego była budowana. Jest określana w
tym samym momencie, w którym wyznacza się prognozę.
EKONOMETRIA
Dr Stanisław Barczak
22
Maksymalny horyzont prognozy – należy do przyszłości, najdalszy moment dla, którego prognoza jest
dopuszczalna.
Żądany horyzont prognozy – odbiorca prognozy może życzyć sobie prognozy na dowolny moment czasu, przy
czym, nie może być ona zrealizowana w momencie gdy żądany horyzont jest dłuższy niż maksymalny.
Prognoza wygasła – prognoza wyznaczona na taki moment, dla którego znana jest prawdziwa wartość zmiennej
prognozowanej (prognozy ex post).
Zmienna prognozowana – Yt, zmienna endogeniczna, reprezentuje, obiekt, proces, zjawisko, które podlega
prognozowaniu.
Cechy danych wykorzystywanych do budowy prognoz:
1. Rzetelność – dane są rzetelne gdy są zgodnie z przedmiotem, którego dotyczą
2. Jednoznaczność – dane powinny być tak przedstawiane, by każdy odbierał je tak samo
3. Kompletność – dane powinny obejmować wszystkie ważne i istotne dla celów badawczych informacje
4. Aktualność danych dla przyszłości – czy pewne czynniki nie przestaną wpływać na Yt
5. Koszt zbierania i opracowywania danych
6. Porównywalność danych – można je porównywać z punktu widzenia:
a. Czasu – by między poszczególnymi realizacjami była ta sama przerwa (ten sam interwał)
b. Terytorium – powinny dane pochodzić z tego samego terytorium
c. Stosowane pojęcia i kategorie – dane powinny być podobnie konstruowane (ważne dla
wskaźników makroekonomicznych)
d. Metody obliczeń – dokładność, formuły obliczania agregatów
Prezentacja danych:
-
szereg czasowy momentów – wyraża poziom zjawiska w danym momencie (wielkość sprzedaży w latach
97-2002 stan na 31.12
moment pomiaru)
-
szereg czasowy okresów – wielkość sprzedaży pewnego wyrobu w pierwszej połowie 2002 (od...do...)
interwał pomiędzy danymi taki sam, w systemie pn-pt, uznaje się, że pt-pn taki sam jak wt-śr, czy śr-czw.
Święta, niedziele itp. prognozuje się odrębnie
Składowe szeregu czasowego:
•
wahania przypadkowe
•
trend
•
stały/średni poziom
•
wahania sezonowe (krótkookresowe)
•
wahania cykliczne (długookresowe)
MODELE ADAPTACYJNE
Nie wymagają one szacowania, estymatorów, założeń, są one dobre dla krótkookresowych prognoz.
Cechy ogólne i zastosowanie:
-
dostosowane do przebiegu procesu – naśladowanie procesu
-
budowa prognoz krótkookresowych
-
prosta budowa
-
możliwość sprawdzenia symulacji
-
możliwość uwzględnienia wahań przypadkowych trendu oraz wahań sezonowych
Ogólna postać Y
t
=
η
t
+ u
t
Wady:
-
trudność w ustaleniu początkowych wartości do symulacji
-
strata informacji
-
założenia o liniowości zmiennej prognozowanej w przyszłości
-
postarzanie informacji
Symulacja – w przypadku modeli adaptacyjnych, symulacja polega na takim dobrze parametrów wygładzania by
zminimalizować dowolnie wybrany błąd ex post.
EKONOMETRIA
Dr Stanisław Barczak
23
Okres weryfikacji prognoz (ex post) jeżeli błąd 5% to zakładamy, że w przyszłości też 5% (na podstawie danych +
prognoz).
Ex ante – ex post + odcinek uwzględniający przyszłość, im dalej tym większy błąd.
Model wyrównywania wykładniczego Browna:
Zastosowania:
-
zmienna prognozowana wykazuje trend oraz wahania przypadkowe
Wady:
-
strata informacji, problem z doborem wartości początkowych
Zalety:
-
łatwość prowadzenia obliczeń
-
nie trzeba stosować długich szeregów czasowych (40, min. ilość to 8-12)
Wyłącznie dla prognoz krótkookresowych.
Postać modelu oraz trendu na moment t: m
1
=
α
y
1
+ (1 -
α
) m
t-1
m
t-1
- ocena trendu na moment poprzedni (t-1).
α
– parametr wygładzania (przyjmuje wartości od 0 do 1) – zakładamy go a’priori, im bliższy 1, tym szybciej model
reaguje.
y
1
– zmienna prognozowana
Jeżeli proces jest niestabilny w czasie (szybkie zmiany, nieregularne) to
α
bliżej 1.
Jeżeli proces jest stabilny w czasie (nie wykazuje radykalnych zmian) to
α
bliżej 0.
Równanie prognozy w tym modelu: Y
Tp
= m
t
+ (m
t
– m
t-1
)n
n- zakładany z góry horyzont prognozy
z okresu na okres n=1. Jeden punkt w przyszłość n=1, drugi n=2.
n - daje nam wyprzedzenie czasowe.
Nie uwzględniamy czynników kształtujących Y.
Wartości początkowe do symulacji:
m
1
= y
t
lub m
1
= śr.y
Model Holta, postać klasyczna:
Zastosowanie:
-
zmienne prognozowane wykazują trend oraz wahania przypadkowe
Wady:
-
strata informacji, problem z doborem wartości początkowych
Zalety:
-
łatwość prowadzenia obliczeń
-
krótki szereg czasowy (40 obserwacji, min 12)
Ocena trendu: F
t-1
=
α
y
t-1
+ (1-
α
)(F
t-2
+ S
t-2
)
y
t-1
– realizacja zmiennej prognozowanej na okres t-1 (poprzedni).
S
t-2
– ocena przyrostu trendu na okres t-2.
α
- parametr wygładzania
Wyznaczenie wartości przyrostu trendu: S
t-1
=
β
(F
t-1
– F
t-2
) + (1 -
β
)S
t-2
α
,
β
- parametry wygładzania przyjmują wartości od 0 do 1.
Równanie prognozy: Y
Tp
= F
n
– S
n
(t – n); gdzie t > n t – n – wyprzedzenie czasowe;
n – horyzont prognozy.
Wartości początkowe do symulacji:
F
1
= Y
1
lub
Yt = a
1t
+ a
0
+ u
t
a
1
– mówi o przeciętnych zmianach z okresu na okres i pokazuje kierunek (+/-)
a
0
– mówi o tym co było w okresie poprzedzającym okres weryfikacji.
F
1
= a
0
S
1
= y
2
– y
1
S
1
= a
1t
EKONOMETRIA
Dr Stanisław Barczak
24
Model Holta – z trendem hiperbolicznym gasnącym
Ocena trendu: F
t-1
=
α
y
t-2
+ (1 -
α
) (F
t-2
+ S
t-2
)
ϕ
Parametr
ϕ
- odpowiedzialny za gasnący trend;
Parametry wygładzania przyjmują wartości od 0 do 1.
Równanie prognozy:
∑
−
=
+
=
n
t
i
i
Tp
Sn
Fn
Y
1
ϕ
; gdzie t > n
Model Wintersa – postać addytywna (ze stałą amplitudą wahań)
Zastosowanie:
-
w przypadku szeregów czasowych zawierających tendencję rozwojową, wahania przypadkowe oraz
wahania cykliczne
Wady:
-
strata informacji, problem z doborem wartości początkowych
Zalety:
-
łatwość prowadzenia obliczeń
-
krótki szereg czasowy (40 obserwacji, min 12)
Ocena trendu: F
t-1
=
α
(y
t-1
– C
t-1-r
) + (1 -
α
)(F
t-2
– S
t-2
)
C – ocena wskaźnika sezonowości na moment t-1-r
R – liczba faz cyklu, określany z góry
Wyrównanie wartości przyrostu trendu: S
t-1
=
β
(F
t-1
– F
t-2
) + (1 -
β
)S
t-2
Ocena wskaźnika sezonowości C
t-1
=
γ
(y
t-1
– F
t-1
) + (1 +
γ
) C
t-1-r
γ
- parametr wygładzania
Wartości początkowe do symulacji:
F
1
= y
t
lub F
1
= śr.y
S
1
= y
2
– y
1
C1 = śr.
∆
y
t
- średnia arytmetyczna z pierwszych różnić Y.
∆
y
t
= y
t
– y
t-1
Równanie prognozy jako: Y
Tp
= F
n
+ S
n
(t – n) + C
t-r
t > n
Horyzont prognozy = r.
Postać multiplikatywna modelu:
Ocena trendu:
)
(
)
1
(
2
2
1
1
1
−
−
−
−
−
+
+
+
+
×
=
t
t
r
t
t
t
S
F
C
y
F
α
α
Wyrównana wartość przyrostu trendu: S
t-1
=
β
(F
t-1
– F
t-2
) + (1 -
β
)S
t-2
Ocena wskaźnika sezonowości:
r
t
t
t
t
C
F
y
C
−
−
−
−
−
×
−
+
×
=
1
1
1
1
)
1
(
γ
γ
Prognoza: Y
Tp
= [P
n
+ S
n
(t – n)]C
t-r
t > n r – maksymalny horyzont czasowy.
Ustalenie parametrów wygładzania:
-
parametry bliskie jedności, w przypadku gdy wszystkie składowe szeregu czasowego (trend, wahania
sezonowe, wahania cykliczne) zmieniają się szybko
-
parametry bliższe zeru – w przypadku gdy wszystkie składowe zmieniają się wolno
Minimalizacja ze względu na średni względny błąd prognoz ex post:
00
1
1
1
∑
=
×
−
×
=
m
t
t
Tp
t
y
y
y
m
ψ
EKONOMETRIA
Dr Stanisław Barczak
25
LINIOWA FUNKCJA TRENDU
Prognozowanie na podstawie funkcji trendu – modele rozwojowe.
Przyjmujemy, że poszukiwana funkcja trendu ma postać liniową.
F(t) = α
0
+ β
1+t
Jest modelem dynamicznym. Zmienne nielosowe.
Model szeregu czasowego:
Y
t
= α
o
+ α
1t
+ ξ
t
Y
t
– zmienna prognozowana
α
0
– parametr wolny
α
1t
– parametr przy zmiennej czasowej
ξ
t
– składnik losowy
W szeregu czasowym dane są ułożone chronologicznie, może on być: wielowymiarowy lub jednowymiarowy (1
zmienna prognozowana).
Dzielą się na szeregi czasowe momentów i szeregi czasowe okresów.
1. Wszystkie realizacje powinny być w tej samej jednostce.
2. Wszystkie realizacje powinny być z tego samego obszaru terytorialnego.
3. Jeśli istnieją luki informacyjne, powinniśmy uzupełnić te dane, albo z innych źródeł, albo metodami
statystycznymi/ekonometrycznymi.
Szacowanie za pomocą MNK – funkcja kryterium w postaci:
∑
=
−
=
n
t
t
t
y
y
1
2
_
ϕ
minumum
Rozwiązaniem układu równań normalnych względem parametrów jest:
α
0
= śr.y – α
1śr.t
∑
∑
=
=
−
−
×
−
=
n
t
n
t
t
t
t
y
y
t
t
1
2
_
1
_
_
1
)
(
)
(
)
(
α
Wynik oszacowania parametrów modeli: y
t
= α
0
+ α
1t
+ u
t
prognozy ex post – trend prognozy wygasłej.
u
t
= y
t
– y*
t
Modele dynamiczne uwzględniają upływ czasu.
Postać macierzowa modelu jest następująca:
y = X
α
+
ξ
gdzie:
=
n
y
y
y
y
...
2
1
=
n
X
1
...
...
2
1
1
1
=
1
0
α
α
α
=
n
ξ
ξ
ξ
ξ
...
2
1
Wektor ocen parametrów strukturalnych dany jako:
a = (X’X)
-1
X’Y
=
∑
∑
=
=
n
t
t
n
t
t
ty
y
Y
X
1
1
'
=
∑
∑
∑
=
=
=
n
t
n
t
n
t
t
t
t
n
X
X
1
2
1
1
'
=
1
0
a
a
a
przy czym det (X’X)
≠
0
Weryfikacja modelu
Wariancja resztowa:
EKONOMETRIA
Dr Stanisław Barczak
26
(
)
∑
=
−
×
−
=
n
t
t
t
y
y
k
n
Su
1
2
2
*
1
stąd odchylenie standardowe reszt dane jest:
2
Su
Su
=
Średnie błędy szacunku, czyli macierz wariancji i kowariancji:
D
2
(a) – Su
2
(X’X)
-1
∑
∑
=
=
−
×
×
=
n
t
n
t
t
t
n
t
Su
a
D
1
2
_
1
2
2
0
)
(
)
(
∑
=
−
=
n
t
t
t
Su
a
D
1
2
_
2
1
)
(
Współczynnik zbieżności:
(
)
∑
∑
=
=
−
−
=
n
t
t
n
t
t
t
y
y
y
y
1
2
_
1
2
2
*
ϕ
φ
2
= [0,1]
Współczynnik determinacji:
R
2
= 1 – φ
2
Prognoza punktowa dana jest jako:
T = przyszły punkt w przyszłości, horyzont prognozy.
[ ]
T
a
a
a
a
T
y
P
T
1
0
1
0
1
+
=
=
Średni błąd predykcji dany jest jako: (prognoza ex ante) – przyjmuje on jednostki zmiennej prognozowanej
X’
T
– kolumnowy wektor przyszłych realizacji zmiennych objaśniających
D^(a) – macierz wariancji, kowariancji
Su^ - wariancje resztowe
2
2
)
(
'
Su
X
a
D
X
V
T
T
+
×
×
=
Uwzględniony średni błąd predykcji dany jest jako:
100
*
×
=
P
T
y
V
V
- określa on dopuszczalność prognozy.
Prognoza przedziałowa budowana wokół prognozy punktowej:
P(y
P
T
– uV < y
T
< y
P
T
+ uV) = γ
T
γ
T
– wiarygodność predykcji
y
T
– wartość zmiennej prognozowanej w jednostce czasu T
uV – współczynnik związany z wiarygodnością prognozy, rozkładem zmiennej prognozowanej oraz długością
przedziału czasowego próby.
Przykład
Na podstawie danych o bezrobociu w Polsce w tablicy oszacować funkcję trendu w postaci:
Y
t
= a
0
+ a
1t
+ ξ
t
Lata
95
96
97
98
99
00
01
02
Yt
67,1
62,1
73,7
80,6
82
87,8
106
97,6
trend
62,25
87,93
73,6
79,28
84,95
90,63
96,3
101,98
EKONOMETRIA
Dr Stanisław Barczak
27
Dane wejściowe w postaci wektora:
=
6
,
97
...
1
,
67
y
Parametr wolny & czas:
=
8
1
7
1
6
1
5
1
4
1
3
1
2
1
1
1
X
t
II
– wyskalowanie czasu, te same odległości i suma równa do 0.
Yt
10
15
13
11
15
16
t
I
1
2
3
4
5
6
t
II
-2,5
-1,5
-0,5
0,5
1,5
2,5
Dla nieparzystej ilości danych by było 2 | 1 | 0 | 1 | 2 etc.
Stosując formułę na wektor. a = (X’X)
-1
X’y
=
8
7
6
5
4
3
2
1
1
1
1
1
1
1
1
1
'
X
=
204
36
36
8
' X
X
−
−
=
−
0238
,
0
107
,
0
107
,
0
607
,
0
)
'
(
1
X
X
X’y =
4
,
3194
9
,
656
=
675
,
5
575
,
56
a
Model po szacowaniu Yt = 56,575 + 5,675 + u
t
(4,3747) (0,8663)
Interpretacja parametrów:
-
wolny – w roku 1994 poziom bezrobocia w Polsce wyniósł 56,575 tysięcy osób (dot 1 okresu)
-
przy zmiennej czasowej – w latach 95 – 02 bezrobocie w Polsce wzrosło z roku na rok średnio rzecz biorąc
o 5,675 tys osób.
Wartości teoretyczne bezrobocia:
Y1 = 56,575 + 5,675*1 = 62,25
Y8 = 56,575 + 5,675*8 = 101,975
Miary struktury stochastycznej:
Su
2
= 31,52 (tys.
2
)
Su
2
= 5,614 tys
n = 8; k =2
_
Y – 82,115 [tys] – przeciętny poziom bezrobocia.
Dopasowanie modelu do danych empirycznych
Φ = 12,26% R
2
= 87,74%
Prognoza punktowa na rok 2003 t=9 Y9 = 56,575 + 5,675*9 = 107,65 tys.
Średni błąd predykcji:
=
9
1
Xt
EKONOMETRIA
Dr Stanisław Barczak
28
1 – przyszła realizacja ślepej zmiennej (zawsze 1)
9 – przyszła realizacja zmiennej czasowej.
V = 7,1176 tys
V* = 6,61%
Prognoza przedziałowa n-k = 6 (6 stopni swobody)
α = 0,05 tα = 2,447 testujemy t-studenta
107,65 – 2,447*7,1176 < yt < 107,65 + 2447*7,1176
90,2332 < yt < 125,0668
Ulega zmianie wraz ze wzrostem horyzontu czasowego – średni błąd predykcji wrasta.
METODA TRENDÓW JEDNOIMIENNYCH OKRESOWYCH
Metoda polega na oszacowaniu parametrów analitycznych funkcji trendu oddzielnie dla poszczególnych faz cyklu.
Prognoza otrzymana jest przez ekstrapolację oszacowanej funkcji trendu dla każdej fazy cyklu. Przyjmijmy, że
szereg czasowy składa się z „n” obserwacji. Szereg czasowy należy podzielić na „m” szeregów czasowych
odnoszących się do tej samej fazy cyklu.
y
lj
= f
j
(l) + ξ
lj
f
j
– funkcja trendu dla j-tej fazy trendu
y
lj
– wartość szeregu czasowego w l-tym cyklu (l = 1,2,... n)
ξ
lj
– składnik losowy
W metodzie trendów jednoimiennych okresów dla każdej fazy cyklu najczęściej wybierana jest postać liniowa
funkcji trendu.
Ostatecznie mamy:
y
lj
= α
oj
+ α
lj
+ ξ
lj
(l = 1, ... n) (j = 1, ... m)
gdzie α – parametry strukturalne j-tej liniowej funkcji trendu.
Przykład:
Lata
1999
2000
2001
2002
Kwartały I
II
III
IV I
II
III
IV I
II
III
IV I
II
III
IV
Yt
7
10
13
15
6
9
14
15
6
8
13
15
7
9
11
14
Yt – przewozy ładunków w mln. Ton
Wyjściowy szereg czasowy dzielimy na m = 4
Szeregi czasowe jednoimiennych okresów:
1999 I
7
1
2000 I
6
2
2001 I
6
3
2002 I
7
4
1999 III
13
1
2000 III
14
2
2001 III
13
3
2002 III
11
4
1999 II
10
1
2000 II
9
2
2001 II
8
3
2002 II
9
4
1999 IV
15
1
2000 IV
15
2
2001 IV
15
3
2002 IV
14
4
EKONOMETRIA
Dr Stanisław Barczak
29
Dla każdego szeregu czasowego szacujemy model o:
y
t
= α
1t
+ α
0
+ ξ
t
Każdy model szacujem wg formuły: a = (X’X)
-1
* X’Y
Macierz X zawsze będzie:
=
1
1
1
1
4
3
2
1
X
=
4
10
10
30
' X
X
−
−
=
−
5
,
1
5
,
0
5
,
0
2
,
0
)
'
(
1
X
X
Pierwszy model I-kwartał:
=
7
6
6
7
Y
=
26
65
'Y
X
=
5
,
6
0
α
Model można zapisać jako:
Y*t = 0t + 6,5 + Ut
Y*t = 6,5 + Ut
Drugi model II-kwartał
=
9
8
9
10
Y
=
36
88
'Y
X
−
=
10
4
,
0
α
Y*t = -0,4t + 10 + Ut
Trzeci model – III-kwartał
=
11
13
14
13
Y
=
51
124
'Y
X
−
=
5
,
14
7
,
0
α
Y*t = -0,7t + 14,5 + Ut
Czwaty model – IV-kwartał
=
14
15
15
15
Y
=
59
146
'Y
X
−
=
5
,
15
3
,
0
α
Y*t = -0,3t + 15,5 + Ut
Analiza uzyskanych wyników
Su
2
= 0,5
Su = 0,7071
−
−
=
75
,
0
25
,
0
25
,
0
1
,
0
)
(
2
a
D
D(a1) = 0,3162 D(a2) = 0,866
Y*t = 6,5 + Ut
(0,866)
Y = 6,5 φ
2
= 100% R
2
= 0%
EKONOMETRIA
Dr Stanisław Barczak
30
Prognoza na 1-szy kwartał 2003 wynosi 6,5mln ton.
Średni błąd predykcji:
=
1
5
T
X
X’
T
D
2
(a) = [0,25 -0,5]
gdzie 5 to przyszła realizacja zmiennej czasowej, a 1 – stała, ślepa zmienna
X
T
’D
2
(a)X
T
= 0,75
V – wyliczane ze wzoru (poprzedni wykład)
V
2
= 1,25
V=1,118
Średnio rzecz biorąc odchyla się o +/- 1,118 mln ton od postawionej prognozy
Względny błąd predykcji V* = 17,2%
V* = V/Y
TP
* 100%
Kwartał II
Su
2
= 0,6
Su = 0,7745
D(a
1
) = 0,3464 D(a
0
) = 0,9486
φ
2
= 60% R
2
= 40%
Y
TP
= 8 V = 1,2247
V* = 15,31%
Kwartał III
Su
2
= 1,15
Su = 1,0723
D(a
1
) = 0,4975 D(a
0
) = 1,3133
φ
2
= 48,42% R
2
= 51,58%
Y
TP
= 11,7
V = 1,6955
V* = 14,49%
Kwartał IV
Su
2
= 0,15
Su = 0,3872
D(a
1
) = 0,1732 D(a
0
) = 0,4743
φ
2
= 40% R
2
= 60%
Y
TP
= 14
V = 0,9123
V* = 4,37%
Zalety metody trendów jednoimiennych okresów:
+ horyzontem są 4 kwartały w przyszłości i nie są obciążone błędem, we wszystkich 4 kwartałach najniższe z
możliwych błędów
+ szacujemy tylko i wyłącznie trendy liniowe
+ służy prognozowaniu, gdy zmiana prognoz wykazuje zmiany sezonowe
+ nie musimy wprowadzać zmiennych naśladujących sezonowość
Wady:
-
wymagana duża ilość obserwacji w szeregu czasowym
-
czasami jest dużym przybliżeniem, trend mało elastyczny
MODEL KLEINA
Model ze zmiennymi zerojedynkowymi.
Gdy zmienna wykazuje trend, wahania sezonowe i przypadkowe, z addytywnym przebiegiem sezonowości. Do
wyodrębnienia wahań sezonowych można wykorzystać zmienne zerojedynkowe (naśladujące).
m – odległość cyklu wahań
Do modelu wprowadzamy „m” zmiennych zerojedynkowych czyli V
1t
, V
2t
...V
mt
wprowadzenie zmiennej
naśladującej wymaga wprowadzenia parametru strukturalnego.
Y
t
= f(t) +
β
1
V
1t
+
β
2
V
2t
+ ... +
β
m
V
mt
+
ξ
t
Z parametrem
β
odpowiadają za sezonowość.
Z definicji addytywnych wahań sezonowych wynika że:
∑
∑
=
−
=
−
=
=>
=
m
i
m
i
i
m
i
1
1
1
0
β
β
β
Wprowadzając
β
m
do modelu otrzymamy jego następującą postać. Model ten nie ma zastosowania dla trendów
nieliniowych.
Y
t
= f(t) +
β
1
(V
1t
-V
mt
) +
β
2
(V
2t
-V
mt
) ... +
β
m-1
(V
m-1t
– V
mt
) +
ξ
t
EKONOMETRIA
Dr Stanisław Barczak
31
Parametry
β
i informują o ile średnio rzecz biorąc w i-tym okresie cykle wahań poziomów zjawiska różni się od
poziomu wynikającego z ogólnej tendencji rozwojowej.
Przykład:
‘95
‘96
‘97
‘98
I
II
I
II
I
II
I
Yt
20
40
30
60
50
80
70
t
-3
-2
-1
0
1
2
3
(V
1
-V
2
) 1
-1
1
-1
1
-1
1
T sumujące się do 0 lepsze dla liczenia „na piechotę“
V
1t
=> I połowa 1; II połowa 0
V
2t
=> I połowa 0; II połowa 1
Model:
Y
t
=
α
1
+
β
1
(V
1t
-V
2t
) +
α
0
+
ξ
t
Model szacujemy MNK:
−
−
−
−
−
−
=
1
1
3
1
1
2
1
1
1
1
1
0
1
1
1
1
1
2
1
1
3
X
=
70
80
50
60
30
40
20
Y
−
=
25
,
51
75
,
8
93
,
8
a
Y*
t
= 8,93t – 8,75 (V
1t
– V
2t
) + 51,25 + u
t
lub
Y*
t
= 8,93t – 8,75V
1t
+ 8,75V
2t
+ 51,25 + u
t
W latach 95-98 rozpatrywany proces wzrastał z półrocza na półrocze średnio rzecz biorąc o 8,93
W drugim półroczu roku ’94 przeciętny poziom rozpatrywanego procesu wynosił 51,25.
W rozpatrywanym okresie odchylenie od trendu wynosiło –8,75 w pierwszych półroczach oraz 8,75 w drugich
półroczach.
Wartość teoretyczna modelu
Y*
1
= 15,71 => 8,93(-3) – 8,57(1) + 51,25
Y*
2
= 42,14 => 8,93(-2) – 8,75 (-1) + 51,25
Y*
3
= 33,57
Y*
4
= 60
Y*
5
= 51,43
Y*
6
= 77,86
Y*
7
= 69,28
Suma u
2
= 42,857
n = 7; k = 3; S
2
u = 10,71; su = 3,27
−
−
=
56
,
1
22
,
0
22
,
0
56
,
1
38
,
0
)
(
2
a
D
D(a
1
) = 0,62 D(
β
) = 1,25 D(a
0
) = 1,25
Śr.Y = 50
Suma(Y
t
– śr.Y)
2
= 2800
φ
2
= 1,53% (= 42,85/2800) R
2
= 98,47%
prognoza na drugie półrocze 98 t=4, V
1
-V
2
= -1
Y
TP
= 8,93(4) – 8,75(-1) + 51,25 = 95,71
Średni błąd predykcji:
−
=
1
1
4
T
X
V = 4,5175 V* = 4,72%
Wady:
-
tego typu modele są nieelastyczne, co generuje błędy
Zalety:
+ prosty w szacowaniu i identyfikacji
EKONOMETRIA
Dr Stanisław Barczak
32
PROGNOZOWANIE NA PODSTAWIE MODELU EKONOMETRYCZNEGO
Zgromadzono następujące dane:
Yt – zgony niemowląt na 1000 urodzeń żywych
X
1t
– spożycie wódki czystej i gatunkowej w przeliczeniu na alkohol 100% w litrach na osobę w ciągu roku
X
2t
– PKB na jednego mieszkańca w $
Lata
1992
1993
1994
1995
1996
1997
1998
1999
2000
Yt
17,3
16,1
15,1
13,6
12,2
10,2
9,5
8,9
8,1
X
1t
3,5
3,8
3,8
3,5
2,9
2,8
2,4
2,1
2,0
X
2t
2198
2233
2402
3293
3724
3725
4098
4014
4078
Oszacowano model:
Y*
t
– 1,79X
1t
– 0,0026X
2t
+ 15,46 + u
t
(1,048) (0,00913) (5,998)
Budujemy prognozę na 2001.
Miary struktury stochastycznej.
N = 9; k = 3l Su
2
= 0,796954 Su = 0,892723
Istotność parametrów strukturalnych test t-studenta.
α
= 0,2 t
α
= 1,415
t
α
1
= 1,7118
t
α
2
= 2,8073
Obie zmienne wchodzą do modelu
−
−
−
−
=
986
,
35
005
,
0
134
,
6
005
,
0
0000008
,
0
0008
,
0
134
,
6
0008
,
0
098
,
1
)
(
2
a
D
φ
2
= 5,29% R
2
= 94,71% Vs = 7,24%
Autokorelacja n = 9; k = 2
H
0
:r
1
= 0
H
1
:r
1
< 0
DW = 2,08 DW’ = 1,92
Jeżeli DW > 2 to hipotezę alternatywną j/w; jeśli < 2 to odwrotnie znak większości.
d
l
= 0,629 d
u
= 1,699
DW’ > du – brak podstaw do odrzucenia H
0
. Brak istotnie ujemnej autokorelacji.
Budujemy prognozę.
Prognozy przyszłych wartości zmiennych objaśniających budowane będą na podstawie modeli tendencji
rozwojowych o postaci liniowej.
Prognoza zmiennej X
1t
X
1t
= Y
tx1t
=> Y
tx1t
=
α
1t
+
α
0
+
ξ
t
t = 1...9
Y*
tx1t
= -0,24t + 4,19 + u
t
R
2
= 89%
(0,032) (0,18)
Prognoza dla t=10 Y
TPx1t=10
= 1,79 (prognoza X
1t
dla roku 2001)
Prognoza zmiennej X
2t
X
2t
= Y
tz2t
=> Y
tx2t
=
α
1t
+
α
0
+
ξ
t
t = 1...9
Y*
tx2t
= 278,12t + 1916,64 + u
t
R
2
= 88%
(38,74) (217,98)
Prognoza dla t=10 Y
TPx2t=10
= 4697,84 (prognoza X
2t
dla roku 2001)
Podstawiamy realizacje do modelu:
Y*
TP=2001
= 1,79 * 1,79 – 0,0026 * 4697,84 + 16,46 = 6,64
EKONOMETRIA
Dr Stanisław Barczak
33
=
1
84
,
4697
79
,
1
T
X
=> V = 1,08962; czyli mylimy się +/- 1 zgon.
Względny średni błąd predykcji V* = 16,41%
W roku 2001 faktycznie było 7,7 zgonów niemowląt (wg naszych prognoz 6,64).
Trafność prognozy Y
t
– Y
TP
= -1,06
Błędy ex-post. Współczynnik Theila
∑
∑
∈
∈
−
=
ep
ep
I
t
t
I
t
TP
t
y
y
y
I
2
2
2
)
(
Współczynnik rozbieżności Theila przybiera wartości równe zeru w przypadku gdy
predykcja jest idealnie dokładna.
2
I
I
=
Pierwiastek kwadratowy współczynnika Theila informuje jaki był przeciętny względny błąd prognozy w okresie
weryfikacji prognoz bez względu na to co było tego przyczyną.
I
2
= I
2
1
+ I
2
2
+ I
2
3
można całość podzielić przez I
2
i wtedy współczynniki sumują się do 0 i można określić jaki
jest udział poszczególnego we współczynniku I
2
.
∑
∑
∈
∈
×
−
=
ep
ep
I
t
t
I
t
TP
t
y
m
y
y
I
2
2
_
_
2
1
1
)
(
m – wielkości „sparowane”. Wygasłe prognozy + rzeczywiste.
m – tyle ile jest tych par.
Mierzy czy predykcja jest rzeczywiście nieobciążona. W przypadku spełnienia tego warunku licznik równy jest 0.
∑
∑
∈
∈
×
−
=
ep
ep
I
t
t
I
t
P
y
m
S
S
I
2
2
2
2
1
)
(
S – odchylenie standardowe zmiennej prognozowanej
S
P
– odchylenie standardowe prognoz wygasłych
Służy do badania na ile estatyczność predykcji była dostosowana do rzeczywistych wahań zmiennej prognozowanej
– czy wahania zostały przewidziane.
∑
∈
×
−
×
×
×
=
ep
I
t
t
P
y
m
r
S
S
I
2
2
3
1
)
1
(
2
r – współczynnik korelacji
Oparty o współczynnik korelacji
Informuje o błędach wynikających z niedostatecznej zgodności kierunku zmian prognoz, ze zmianami kierunku
zmiennej prognozowanej
∑
∈
=
ep
I
t
t
y
m
y
1
_
∑
∈
=
ep
I
t
TP
TP
y
m
y
1
_
- średnia z prognoz wygasłych (ex post).
EKONOMETRIA
Dr Stanisław Barczak
34
∑
∈
−
=
ep
I
t
t
t
y
y
m
S
2
_
)
(
1
∑
∈
−
=
ep
I
t
TP
TP
P
y
y
m
S
2
_
)
(
1
- odchylenie standardowe prognoz
S
S
y
y
y
y
m
r
P
I
t
TP
TP
t
t
ep
∑
∈
−
×
−
=
)
(
)
(
1
_
_
- współczynnik korelacji liniowej między zmienną prognozowaną, a
prognozami.
Oszacowany model tendencji rozwojowej:
Yt = -0,24t + 4,19 + u
t
Współczynnik Theila
śr.Yt = 2,97
śr.Y
TP
= 2,97
S = 0,6662
S
P
= 0,6282
V = 0,9429
I
2
= 0,005285
I – 0,07269
I
2
1
= 0,00000000000000000000000000000000218 = 0
I
2
2
= 0,000155
I
2
3
= 0,005129 <= największe zagrożenie dla nas to ten błąd.
Nie należy prognozować w oparciu o 1 model lub 1 błąd.
MODELE ZE ZMIENNYMI NAŚLADUJĄCYMI
Uwagi wstępne
Granger oraz Mansfield wykazali możliwość przewidywania zmian koniunktury na podstawie wcześniejszych zmian
zachodzących w pewnej klasie zmiennych nazywanych zmiennymi wiodącymi.
Typy zmiennych:
Zmienne wiodące – charakteryzują się określonymi zmianami swoich wartości, zachodzącymi wcześniej niż miary
wartości – innej grupy zmiennych, które określa się jako zmienne naśladujące.
Zmienne naśladujące – naśladują z pewnym opóźnieniem zmiany zachodzące w wartości zmiennych wiodących.
Znalezienie (identyfikacja) zmiennej wiodącej umożliwi budowę prognozy zmiennej naśladującej.
Warunek budowy prognozy:
podstawowym warunkiem budowy prognozy jest duże podobieństwo kształtowania się wartości obu zmiennych w
czasie
przy budowie prognoz oprócz podobieństwa zmiennych należy uwzględnić następujące opóźnienia w czasie
Podobieństwo i opóźnienia w czasie (p) [brak cykliczności]
Do pomiaru podobieństwa oraz wyznaczania wielkości opóźnienia w czasie (p) można zastosować współczynniki
korelacji liniowej. Opóźnienie zależy od szeregu czasowego.
Podobieństwo i opóźnienie w czasie (p) [istnieje cykliczność]
W przypadkach występowania wahań cyklicznych (w szeregu czasowym obu zmiennych opóźnienie w czasie (p)
może być wyznaczone jako liczba jednostek czasu dzieląca okres o najwyższej/najniższej wartości) wartości
zmiennej wiodącej w danym cyklu od okresu o najwyższej/najniższej wartości zmiennej naśladującej w jej
rozpatrywaniu.
Podobieństwo i opóźnienie w czasie [istnieje cykliczność]
p = t
maxY
– t
maxX
lub p = t
minY
– t
minX
p – opóźnienie
t
maxX
– numer okresu o najwyższej wartości zmiennej wiodącej
t
maxY
– numer okresu o najwyższej wartości zmiennej naśladującej
t
minX
– numer okresu o najniższej wartości zmiennej wiodącej
EKONOMETRIA
Dr Stanisław Barczak
35
t
minY
– numer okresu o najniższej wartości zmiennej naśladującej
Gdy w szeregach czasowych obu zmiennych następuje więcej niż 1 cykl wówczas opóźnienie może być wyznaczone
jako średnia arytmetyczna lub mediana opóźnień obliczanych dla poszczególnych cykli.
Uwaga!: daje czasami błędne rezultaty
Rozwiązanie przynoszące lepsze wyniki to:
Określenie wielkości opóźnienie na podstawie współczynników korelacji.
Polega na obliczeniu wartości współczynnika korelacji dla różnych opóźnień czasowych i wyborze tego opóźnienia
dla którego wartość współczynnika korelacji jest najwyższa.
Przykłady zmiennych wiodących:
barometr koniunktury całej gospodarki lub branży może stanowić zmienną wiodącą dla budowy prognoz sprzedaży
niektórych produktów
indeks siły nabywczej publikowany w USA, zawiera on informacje dotyczące oceny zmiany zaludnienia, dochodów
ludności, sprzedaży detalicznej oraz kompleksowy szacunek wielkości popytu
rynek samochodów, na którym zmienną wiodącą są dochody ludności, zmienna ta często wykazywana jest przez
producentów samochodów i ma za zadanie określić przyszły popyt poprzez pryzmat wcześniejszej sytuacji
finansowej konsumentów
liczba narodzin dzieci, liczba dzieci w wieku szkolnym, liczba dzieci w wieku przedszkolnym, mogą one stanowić
zbiór zmiennych wiodących dla prognoz przyszłego popytu na produkty skierowane do dzieci
Budowa prognozy zmiennej prognozowanej (naśladującej)
Dane jest opóźnienie czasowe między zmienną prognozowaną, a zmienną wiodącą.
∆
Y
t
t+1
– względna zmiana (wzrost/spadek) wartości zmiennej prognozowanej w okresie t+1 w porównaniu z
okresem t.
t
t
t
t
t
y
y
y
Y
−
=
∆
+
+
1
1
∆
X
t-p
t+1-p
– względna zmienna (wzrost/spadek) wartości zmiennej wiodącej X w okresie t+1-p w porównaniu do
okresu t-p
p
t
p
t
p
t
p
t
p
t
y
x
x
X
−
−
−
+
−
+
−
−
=
∆
1
1
____
1
n
y
∆
- średnia bezwzględnych wartości
1
+
∆
t
t
y
w n przyszłych okresach.
______
1
p
n
p
x
−
−
∆
- średnia z bezwzględnych wartości
______
1 p
n
p
t
x
−
+
−
∆
w n przyszłych okresów.
W okresie prognozy t+1 > n; będzie zachodziła w przybliżeniu następująca równość.
__
1
__
1
1
1
p
n
p
n
p
t
p
t
t
t
x
y
x
y
−
−
−
+
−
+
∆
∆
≈
∆
∆
lub
(
)
(
)
__
1
__
1
1
1
p
n
p
n
p
t
p
t
p
t
t
t
t
x
y
x
x
x
y
y
y
−
−
−
−
−
+
+
∆
∆
≈
−
−
Po dokonaniu odpowiednich przekształceń prognoza na okres t+1 będzie dana jako:
t
p
n
p
p
t
t
n
t
y
x
x
y
y
×
∆
∆
×
∆
+
=
−
−
−
+
−
+
∗
___
1
1
1
__
1
1
1
EKONOMETRIA
Dr Stanisław Barczak
36
Maksymalny horyzont prognozy będzie równy opóźnieniu p
Przykład:
I
II
III
IV
I
II
III
IV
I
II
III
IV
I
II
III
IV
1999
2000
2001
2002
Proces 1 165 167 201 245 267 269 261 257 205 175 165 155 153 151 161 165
Proces 2 243 271 299 281 259 209 179 169 157 153 149 161 179 203 219 229
Opóźniamy proces pierwszy kolejno o 1, 2 ,3 i 4 okresu [po prostu przepisujemy I 1999. kolejno na II 1999, III
1999, IV 1999, a przy opóźnieniu o 4 I 2000; i tak kolejno z wszystkimi obserwacjami].
Korelacje:
Opóźnienie o 1 kwartał = 0,57
Opóźnienie o 2 kwartały = 0,88
Opóźnienie o 3 kwartały = 0,98
max współczynnik korelacji i z tym opóźnieniem szacujemy model
Opóźnienie o 4 kwartały = 0,92
Najwyższą wartość współczynnika korelacji została wyznaczona przy opóźnieniu o 3 kwartały, stąd opóźnienie w
czasie dane jest jako p=3
(
)
p
t
p
t
p
t
p
t
p
t
x
x
x
x
−
−
−
+
−
+
−
−
=
∆
1
1
stąd:
(
)
3
3
3
1
3
1
3
−
−
−
+
−
+
−
−
=
∆
t
t
t
t
t
x
x
x
x
;
(
)
3
3
2
2
3
−
−
−
−
−
−
=
∆
t
t
t
t
t
x
x
x
x
średnia
_____
1
4
+
∆
t
y
= 0,0764
średnia
____
2
3
−
−
∆
t
t
x
= 0,0882
Ostatecznie przewidywana wielkość procesu 1 w I kwartale 2003 dana jest jako:
t
p
n
p
p
t
t
n
t
y
x
x
y
y
×
∆
∆
×
∆
+
=
−
−
−
+
−
+
∗
___
1
1
1
__
1
1
1
stąd:
159
,
184
165
088
,
0
134
,
0
076
,
0
1
16
=
×
×
+
=
∗
y
Model ekonometryczny
Przy porównywaniu czasowym wyznaczamy 3 budowane modele ekonometryczne o następującej postaci:
Y*
t
= a
1
×
x
t-p
+ a
0
+
ξ
t
Na podstawie MNK.
Y*
t
– prognoza na moment okres t.
X
t-p
– wartość zmiennej wiodącej w okresie t-p
a
0
,a
1
– parametry strukturalne modelu.
ξ
t – czynnik losowy
Y*
t
= 0,87X
t-3
+ 18,49 + Ut
R
2
= 96,9%
Podstawiamy do modelu wartości zmiennej wiodącej z II 2002, czyli 203 i otrzymujemy prognozę procesu 1 na I
2003.
Y*
t
= 0,87
×
203 + 18,49 = 195,1
Modele ze zmiennymi wiodącymi pozwalają na przewidywanie w przyszłym kształtowaniu się zmiennej
prognozowanej zarówno w przypadku występowania wahań sezonowych jak i cyklicznych.
Modele mogą uwzględniać większą liczbę zmiennych wiodących.
EKONOMETRIA
Dr Stanisław Barczak
37
MODELE AUTOREGRESYJNE I ŚREDNIEJ RUCHOMEJ (ARMA) I (ARIMA)
Nie ma zmiennych objaśniających – same szeregi czasowe.
Określają związek funkcyjny między wartościami zmiennej prognozowanej w okresie / momencie t, a wartościami
tej zmiennej z okresów/momentów poprzednich t-1, t-2 ... t-p; p – opóźnienie.
Powody stosowania:
1) Istnieje wiele zjawisk gospodarczych wskazujących na występowanie opóźnienia ich przebiegu w czasie
np. popyt na wiele dóbr trwałego użytku charakteryzuje się cyklami opóźnień związanymi z okresem ich
użytkowania
2) Rezygnacja z uwzględniania niejednokrotnie wielu zmiennych objaśniających
Zastosowanie:
Modelowanie stacjonarnych szeregów czasowych czyli:
-
takich szeregów czasowych, w których występują jedynie wahania losowe wokół średniej
-
szeregów czasowych niestacjonarnych sprowadzanych do stacjonarnych
Klasyfikacja modeli autoregresyjnych i średniej ruchomej:
•
Modele autoregresji (AR)
•
Modele średniej ruchomej (MA)
•
Modele mieszane autoregresji i średniej ruchomej (ARMA)
Zintegrowane modele autoregresji i średniej ruchomej – w nich zakłada się stacjonarność zmiennej prognozowanej.
W przypadku braku stacjonarności:
-
dokonuje się przekształcenia szeregu czasowego w szereg stacjonarny, przeprowadzając operację
różnicowania, która polega na d-krotnym obliczaniu różnic sąsiednich wyrazów szeregu
Pierwsze różnice oblicza się jako: w
t
= y
t
– y
t-1
; drugie jako: z
t
= w
t
– w
t-1
= (y
t
– y
t-1
) - (y
t-1
– y
t-2
) = y
t
– 2y
t-1
+ y
t-2
.
Kolejne oblicza się analogicznie.
Przeprowadza się tą operacją, aż do momentu gdy szereg czasowy stanie się stacjonarny.
Budowane dla tych przekształconych szeregów czasowych modele określa się mianem zintegrowanych modeli:
1) Autoregresyjne (ARI)
2) Średniej ruchomej (IMA)
3) Autoregresji i średniej ruchomej (ARIMA)
Przyjęta uniwersalna notacja modeli:
ARIMA (p,d,q)
p – rząd autoregresji, wielokrotność opóźnienia
d – krotność różnicowania
q – liczba parametrów średniej ruchomej
ARIMA(p,0,0)
AR(p)
ARIMA(0,0,q)
MA(q)
ARIMA(p,0,q)
ARMA(p,q)
ARIMA(p,d,0)
ARI(p,d)
Podejście do budowy modeli zaproponowane przez BOXa i JENKINSa w 1976
Zakładamy, że tworzymy nowy stacjonarny szereg czasowy zmiennej prognozowanej.
Po identyfikacji odpowiedniego dla danego szeregu czasowego modelu, czyli określenia jego postaci oraz wielkości
uwzględniających w modelu opóźnień, używa się współczynników autokorelacji i autokorelacji cząstkowej.
Główna zasada:
Jeśli wartość współczynnika autokorelacji wykładniczo maleje do 0, czyli liczba tych współczynników istotnie
różnych od 0 jest stosunkowo duża, a liczba współczynników autokorelacji cząstkowej istotnie różniących się od 0
jest bardzo mała to należy stosować MODEL AUTOREGRESYJNY
Jeśli wartość współczynników autokorelacji cząstkowej wykładniczo maleje do 0, czyli liczba tych współczynników
istotnie różniących się od 0 jest stosunkowo duża, a liczba współczynników autokorelacji istotnie różniących się od
0 jest bardzo mała to powinno się stosować MODELE ŚREDNIEJ RUCHOMEJ
EKONOMETRIA
Dr Stanisław Barczak
38
Jeśli współczynniki autokorelacji oraz autokorelacji cząstkowej wykładniczo maleją do 0, czyli liczby tych
współczynników istotnie różniących się od 0 są stosunkowo duże to należy stosować MODELE MIESZANE
AUTOKORELACJI I ŚREDNIEJ RUCHOMEJ
Ogólny proces liniowy [Yule]
Biały szum
Szeregi czasowe, w których kolejne wartości są silnie zależne przedstawione są jako szeregi generowane przez ciąg
niezależnych zakłóceń losowych impulsów
ξ
t.
Zakłócenia te są realizacjami zmiennych losowych o ustalonym rozkładzie (najczęściej rozkład normalny) o
wartości oczekiwanej E(x) = 0 i
δ
ξ
2
. Ciąg takich zmiennych losowych to biały szum.
Szereg czasowy o silnie skorelowanych wartościach traktowany jest jako realizacja procesu {Yt} określonego w
następujący sposób.
Yt =
µ
+
ε
t
+
ψ
1
*
ε
t-1
+
ψ
2
*
ε
t-2
...
ψ
- parametry (wagi) modelu
µ
- określony poziom rozpatrywanego procesu, dla procesów stacjonarnych określa on poziom średni
ε
t
– zakłócone impulsy losowe.
Wprowadzamy operator przesunięcia wstecz dany jako: B
i
=
ε
t-i
Yt =
µ
*(1 +
ψ
1
B
1
+
ψ
2
B
2
+ ...) => Yt =
ψ
(B)
ε
t
; przy założeniu, że
ψ
B = 1 +
ψ
1
B
1
+
ψ
2
B
2
+ ...
Proces może być traktowany jako wyjaśnienie filtru liniowego funkcji danej jako:
ψ
B = 1 +
ψ
1
B
1
+
ψ
2
B
2
+ ... przekształcającej biały szum w proces stochastyczny.
Proces filtracji polega na przedstawieniu szeregu czasowego jako ważonych sum poprzednich zakłóceń losowych
ε
t
Pojęcie funkcji losowej:
Przyjmijmy, że t jest nielosową wartością rzeczywistą w zbiorze T, oraz, że T może być przedziałem skończonym
lub nieskończonym.
W zastosowaniu ekonomicznych zakłada się, że t jest zmienną czasu.
Y(t) jest funkcją losową, jeżeli zna się odpowiednie dystrybuanty dowolnego zbioru zmiennych losowych czyli:
Y(t
1
); Y(t
2
)....(Yt
n
), gdzie ti należy do T; i = 1,2....n
Łączna dystrybuanta zmiennych losowych dana jest jako:
F
t1,t2...t2
(y
1
,y
2
...y
n
) = P [Y(t
1
) < y
1
; Y(t
2
) < y
2
...; Y(t
n
) < y
n
]
Są to warunki zgodności; jeśli znamy dystrybuantę – zgodny, jeśli nie znamy – niezgodny
Funkcja losowa Y(t) nielosowego rzeczywistego argumentu t nazywa się procesem stochastycznym.
Wg Boxa i Jenkinsa procesem stochastycznym jest zjawisko stochastyczne zmieniające się w czasie zgodnie z
rozkładem prawdopodobieństwa.
Proces stochastyczny z czasem dyskretnym (ozn. Y
t
) ma miejsce wówczas gdy zbiór argumentów t obejmuje tylko
liczby całkowite.
Pole losowe stanowi funkcję losową wielu nieskończonych argumentów.
W ekonomii polem nielosowym mogą być wydatki na żywność gospodarstw domowych, będące funkcją takich
argumentów jak: czas, grupa społeczno-ekonomiczna, dochód etc.
Charakterystyki procesu stochastycznego z czasem dyskretnym
1) średnia wartość m
t
= E(Y
t
); t = 0,
±
1,
±
2 ...
2) wariancja D
2
(Y
t
) = E(Y
t
- m
t
)
2
; t = 0,
±
1,
±
2 ...
3) funkcja kowariancji K(t,s) = E[(Y
t
– m
t
)
×
(Y
s
– m
s
)]’ t = 0,
±
1,
±
2 ...... t
≠
s; s – chwila
4) funkcja autokorelacyjna:
( )
( )
)
0
(
)
(
)
(
2
K
K
Y
D
K
R
τ
τ
τ
υ
=
=
; gdzie
τ
= t – s
5) spektrum – funkcja gęstości spektralnej:
( )
∑
∞
=
−∞
=
Π
=
t
t
K
f
)
(
2
1
τ
ω
; gdzie
N
i
Π
=
2
ω
; i = 0,1,2... ½ N
EKONOMETRIA
Dr Stanisław Barczak
39
Procesy stochastyczne stacjonarne i niestacjonarne.
Proces stacjonarny oznacza, że ciąg wag
ψ
1
,
ψ
2
... jest skończony lub nieskończony, zbieżny, a parametr
µ
jest
średnią wokół, której występują wahania przypadkowe.
Proces niestacjonarny oznacza, iż ciąg wag nie spełnia warunków skończoności/nieskończoności i zbieżności, a
parametr
µ
nie ma większego znaczenia i służy jako punkt odniesienia poziomu procesu.
Procesy stochastyczne dzielimy na:
1) stacjonarny w węższym i szerszym sensie
2) niestacjonarne
Proces stochastyczny w węższym sensie – dystrybuanta związana z n obserwacjami y
t1
, y
t2
, ..... y
tn
,
dokonywanymi w dowolnych momentach czasu t
1
, t
2
, ... t
n
, jest taka sama jak dystrybuanta związana z n-
obserwcajami y
t1+k
, y
t2+k
....y
tn+k
dokonywanymi w momentach t
1+k
, t
2+k
...t
n+k
, czyli zachodzi warunek:
F
t1+k,t2+k....tn+k
(y
t1+k
,y
t2+k
....y
tn+k
) = F
t1,t2...tn
(y
t1
,y
t2
...y
tn
)
Oznacza to, że łączna dystrybuanta dowolnego zbioru obserwacji nie ulega zmianie w czasie przy przesunięciu
na osi czasu o k-całkowitych jednostek do przodu lub do tyłu.
Proces stacjonarny w sensie szerszym – ma miejsce jeżeli wartość średnia i wariancja procesu są stałe,
niezależnie od czasu t, a funkcja kowariancji zależy od różnicy t – s =
τ
, czyli spełnione są następujące warunki:
1) średnia wartość m
t
= E(Y
t
) = const.
2) wariancja D
2
(Y
t
) = E(Y
t
- m
t
)
2
=
σ
2
= const.
3) funkcja kowariancji K(t,s) = K(
τ
)
Stacjonarność w węższym
stacjonarność w szerszym.
Stacjonarność w szerszym sensie nie wymaga stabilności rozkładów, a jedynie stabilności pewnych parametrów tych
rozkładów (w/w).
W analizie ekonometrycznej wykorzystuje się metody procesów stacjonarnych w szerszym sensie.
Ergodyczność – oznacza, że każda poszczególna realizacja procesu stochastycznego jest pełnoprawnym
przedstawicielem całego zbioru możliwych realizacji.
Założenie o ergodyczności umożliwia obliczanie głównych charakterystyk procesu na podstawie jednej realizacji dla
wystarczająco długiego okresu, czyli po czasie t, a nie na podstawie pewnej liczby realizacji danego procesu, czyli
po realizacjach.
Proces jest niestacjonarny gdy nie jest spełniony przynajmniej 1 z 3 w/w warunków
Można wyróżnić następujące procesy niestacjonarne:
1) procesy niestacjonarne w średniej, stacjonarne w wariancji
2) procesy niestacjonarne w wariancji, stacjonarne w średniej
3) procesy o niestacjonarnej funkcji kowariancji i stałych wartościach średnich
4) procesy niestacjonarne w średniej i wariancji oraz funkcji kowariancji.
Ekonomiczny proces stochastyczny przedstawiany jest jako:
Y
t
= P
t
+ S
t
+ C
t
+
µ
t
Pt – trend
St – wahania sezonowe
Ct – wahania cykliczne (koniunkturalne)
µ
t – nieregularne wahania przypadkowe.
Przez trend Pt rozumie się ogólne tendencje rozwojowe (kierunek rozwoju) charakteryzują dany szereg czasowy na
przestrzeni dłuższego okresu. Trend kojarzony jest z powolnymi i systematycznymi zmianami poziomu procesu
ekonomicznego zachodzącego w długim okresie pod wpływem działania silnych, trwałych przyczyn. Zakłada się, że
funkcje opisujące trend powinny zachować się gładkością i spokojnością przebiegu.
Wahania sezonowe St
są wahaniami powtarzającymi się periodycznie w pewnych określonych podokresach
(miesiące, kwartały) każdego roku. Występowanie wahań sezonowych, które oscylują wokół trendu jest efektem
oddziaływania podstawowych czynników sezonowych: czynniki kalendarzowe, klimatyczno-przyrodnicze oraz
EKONOMETRIA
Dr Stanisław Barczak
40
czynników społeczno-ekonomicznych bezpośrednio lub pośrednio zależnych od podstawowych czynników
sezonowych. Ważne jest zawsze rozstrzygające o typie wahań sezonowych.
Wahania Ct
są wahaniami powtarzającymi się cyklicznie z mniejszą lub większą regularnością. Uważa się je za
odzwierciedlenie wahań koniunkturalnych w gospodarce. Charakteryzują się one duża zmiennością cykli, czasu
trwania poszczególnych wielkości, amplitud. Utrudnia ten fakt prowadzenie badań.
Można wyróżnić liczby faz:
2 – ekspansja i recesja
3 – wzrost większy od trendu, wzrost zbliżony do trendu, wzrost niższy od trendu
4 – ostrzeżenie, recesja, ożywienie, ekspansja
6 – wzrost, rozkwit, ostrzeżenie, recesja, depresja, ożywienie
Wahania nieregularne
µ
t
trudno jest podać jeden ich schemat. Można jednak wyróżnić wahania przypadkowe i
wahania katastrofalne.
Linii trendu nie da się oddzielić od linii wahań cyklicznych ponieważ linie te nie powstały pod działaniem
oddzielnych zespołów przyczyn.
Do początku lat 70-tych zasadą stało się rozpatrywanie trendu i wahań koniunkturalnych łącznie. Zatem proces
ekonomiczny można zapisać jako: Y
t
= P
t
+ S
t
+
µ
t
.
Z punktu widzenia teorii procesów stochastycznych model: Y
t
= P
t
+ S
t
+
µ
t,
można zapisać jako: E(Y
t
) = P
t
+ S
t
Co oznacza, że model opisuje niestacjonarny proces stochastyczny ze zmienną wartością oczekiwaną. Proces
odchyleń od trendu i wahań sezonowych
µ
t jako stacjonarny o średniej równej zero.
Trend Pt procesu stochastycznego można nazwać pewną krzywą ciągłą wyznaczoną przez wartości oczekiwane
procesu w układzie współrzędnych prostokątnych, w którym oś odciętych (X) odpowiada ciągłej zmiennej czasowej
t.
Proces autoregresyjny AR(p)
Proces autoregresyjny rzędu p dany jako:
Yt =
ϕ
0
+
ϕ
1
Y
t-1
+
ϕ
2
Y
t-2
+ .... +
ϕ
p
Y
t-p
+
ε
t
Gdzie:
ϕ
0
,
ϕ
1
...
ϕ
p
są parametrami procesu; p – opóźnienie czasowe;
ε
- zakłócenia losowe i jest zmienną losową o
rozkładzie N(0,
σ
2
)
Proces autoregresyjny AR(p) charakteryzuje się tym, że jego bieżąca wartość jest sumą skończonej kombinacji
liniowej poprzednich jego wartości oraz zakłócenia losowego.
Proces autoregresji można traktować jako liniowe równanie regresji wielorakiej zmiany Yt względem opóźnionych
w czasie wartości tej zmiennej.
Stosując operator przesunięcia wstecz B, proces można przedstawić jako:
φ
p
(B)Yt =
ϕ
0
+
ε
t
gdzie:
φ
p
= 1 -
ϕ
1
B
1
-
ϕ
2
B
2
- .... -
ϕ
p
B
p
jest wielomianem charakterystycznym procesu rzędu
„p”.
φ
(B) = 0
równanie charakterystyczne procesu.
Problem identyfikacji procesu autoregresyjnego AR(p)
Polega na stwierdzeniu, że rozpatrywany proces jest procesem autoregresyjnym oraz na określenie jego rzędu p.
Identyfikacja:
Polega na porównaniu własności teoretycznych funkcji autokorelacji i autokorelacji cząstkowej z zachowaniem się
współczynników autokorelacji i autokorelacji cząstkowej oszacowanych na podstawie szeregu czasowego.
Funkcja autokorelacji dana jako: Yt =
ϕ
0
+
ϕ
1
Y
t-1
+
ϕ
2
Y
t-2
+ .... +
ϕ
p
Y
t-p
+
ε
t
ρ
k
=
ϕ
1
ρ
k-1
+
ϕ
2
ρ
k-2
+ ...... +
ϕ
p
ρ
k-p
gdzie
ρ
k
,
ρ
k-1
....
ρ
k-p
– współczynniki autokorelacji przy odstępie równym k, k-1, ... k-p
ϕ
0
,
ϕ
1
...
ϕ
p
są parametrami procesu
Jeżeli proces jest stacjonarny to rozwiązaniem jest funkcja auokorelacji składająca się z zanikających funkcji
wykładniczych i sinusoid tłumionych.
Podstawiając do równania:
ρ
k
=
ϕ
1
ρ
k-1
+
ϕ
2
ρ
k-2
+ ...... +
ϕ
p
ρ
k-p
; kolejno dla k=1,2...p
EKONOMETRIA
Dr Stanisław Barczak
41
Otrzymujemy układ równań Yule’a-Walkera dany jako:
+
+
+
=
+
+
+
=
+
+
+
=
−
−
−
−
p
p
p
p
p
p
p
p
ϕ
ρ
ϕ
ρ
ϕ
ρ
ρ
ϕ
ϕ
ρ
ϕ
ρ
ρ
ϕ
ρ
ϕ
ϕ
ρ
....
2
.
..........
..........
..........
..........
..........
....
2
....
2
2
1
1
2
1
1
2
1
1
1
1
Zmieniając teoretyczne wartości współczynników autokorelacji na współczynniki autokorelacji
ρ
k
oszacowane na
podstawie szeregu czasowego otrzymane jest tzw. oszacowanie Yule’a-Walkera
Funkcja autokorelacji cząstkowej:
W celu oszacowania korzystamy równań Yule’a-Walkera
Dodatkowo przyjmuje się, że
ϕ
k
to j-ty współczynnik w procesie autoregresji rzędu k. Oznacza to, że ostatni
współczynnik to
ϕ
kk
, który spełnia następujący uklad równań:
ρ
j
=
ϕ
k,1
ρ
j-1
+
ϕ
k,2
ρ
j-2
+ ...... +
ϕ
k,k-1
ρ
j-(k-1)
+
ϕ
k,k
ρ
j-k
j =1,2....k
Rozwiązując równania kolejne dla k = 1,2 otrzymujemy:
ϕ
1,1
=
ρ
1
=
1
1
1
1
1
2
1
1
2
,
2
ρ
ρ
ρ
ρ
ρ
ϕ
=
1
1
1
1
1
1
2
1
1
2
1
3
2
1
2
1
1
1
3
,
3
ρ
ρ
ρ
ρ
ρ
ρ
ρ
ρ
ρ
ρ
ρ
ρ
ρ
ϕ
Wielkość
ϕ
kk
jest traktowana jako funkcja odstępu k i nazywa się funkcją autokorelacji cząstkowej. W przypadku
AR(p) jest ona różna od 0 dla k
≤
p
i
i równa 0 dla k > p, zatem funkcja ta urywa się w okresie p.
Wykorzystując procesy AR(p) modelowane są zarówno procesy stacjonarne jak i niestacjonarne.
Proces średniej ruchomej MA(q)
Przyjmuje, że tylko q początkowych wag procesu:
Yt =
ϕ
0
+
ϕ
1
Y
t-1
+
ϕ
2
Y
t-2
+ .... +
ϕ
p
Y
t-p
+
ε
t
Jest różny od 0 to proces taki nazywamy procesem średniej ruchomej dany jako:
Yt =
µ
+
ε
t
+ v
1
ε
t-1
– v
2
ε
t-2
- ....... - v
q
ε
t-q
ε
t
,
ε
t-1
.....
ε
t-q
– odchylenia losowe w okresach t, t-1, ... t-q o rozkładzie N(0,
σ
2
)
µ
- v
1
– v
2
- .... – v
q
– parametry modelu (wagi), q – wielkość opóźnienia
Średnia ruchoma – wagi modelu nie muszą się sumować do jedności i mogą przyjmować wartości ujemne.
Korzystając z operatora przesunięcia wstecz, model średniej ruchomej można zapisać jako:
Yt =
µ
+
θ
q
(B)
ε
t
gdzie:
θ
q
(B) = 1 – v
1
B
1
- .... – v
q
B
q
– wielomian charakterystyczny
θ
q
(b) = 0 – równanie charakterystyczne
Identyfikacja procesu MA(q)
Identyfikacja procesu średniej ruchomej MA(q) odbywa się przez porównanie teoretycznych i empirycznych
współczynników autokorelacji i autokorelacji cząstkowej. Przy czym teoretyczna funkcja autokorelacji tego procesu
dana jest jako:
>
=
+
+
+
+
+
−
=
−
−
q
k
dla
q
k
dla
v
v
v
v
v
v
v
q
q
k
q
k
k
k
_
;
0
...
2
,
1
_
;
...
1
....
2
2
1
1
1
ρ
Funkcja ta jest równa 0 dla wartości k większych niż rząd procesu oznacza, to że urywa się punkcje q.
Model średniej ruchomej jest zawsze stacjonarny, niezależnie od wartości parametrów.
EKONOMETRIA
Dr Stanisław Barczak
42
Proces autoregresji i średniej ruchomej ARMA(p,q)
W celu zwiększenia elastyczności oraz dopasowania modelu do danych empirycznych często łączy się 2 procesy
czyli AR(p) i MA(q).
Jest to spowodowane faktem, że nie zawsze możliwy jest wybór procesu o postaci AR(p) lub MA(q), który
charakteryzuje się niewielką liczbą parametrów i jest dobrze dopasowany do danych empirycznych.
Proces autoregresji i średniej ruchomej jest dany jako:
Yt =
ϕ
0
+
ϕ
1
Y
t-1
+
ϕ
2
Y
t-2
+ .... +
ϕ
p
Y
t-p
- v
1
ε
t-1
– v
2
ε
t-2
- ....... - v
q
ε
t-q
+
ε
t
Stosując operator przesunięcia wstecz B, proces można zapisać jako:
φ
p
(B)Y
t
=
ϕ
0
+
θ
q
(B)
ε
t
Postać funkcji autokorelacji procesu ARMA(p,q) zależy od parametrów p i q:
-
jeżeli q-p < 0 to funkcja autokorelacji składa się z funkcji wykładniczych i/lub sinusoid tłumionych
-
jeżeli p-q > 0 to wystąpi q-p+1 początkowych wartości
ρ
0
,
ρ
1
....
ρ
p-q
, które nie są rozważane przez ten
proces.
Funkcja autokorelacji cząstkowej procesu ARMA(p,q) zachuje się jak funkcja autokorelacji cząstkowej procesu
średniej ruchomej, zależnie od rzędu średniej ruchomej wartości parametrów. Urywa się w punkcie p.
Z góry założona stacjonarność.
Proces zintegrowany
W przypadku szeregu czasowego, który nie jest stacjonarny można go sprowadzić do stacjonarności poprzez
operację różnicowania, czyli d-krotnym obliczaniu różnic sąsiednich wyrazów.
Szereg czasowy, którego pierwsze różnice są stacjonarne nazywany jest szeregiem zintegrowanym stopnia
pierwszego.
Szereg czasowy, którego drugie różnice są stacjonarne nazywany jest szeregiem zintegrowanym stopnia drugiego.
Itd.
Szereg, który jest stacjonarny nazywamy zintegrowanym szeregiem stopnia zerowego.
Proces można zapisać przy pomocy tzw. operatora różnic rzędu danego:
∇
d
= (1-B)
d
Proces przyjmuje postać:
∇
y
t
= y
t
– y
t-1
∇
2
y
t
=
∇
y
t
-
∇
y
t-1
= (y
t
- y
t-1
) – (y
t-1
– y
t-2
)
∇
d
y
t
=
∇
d-1
y
t -
∇
d-1
y
t-1
Zatem jeżeli szereg czasowy dany jako (y
t
)
t=1,2....n
o liczbie wyrazów n zadziałamy operatorem (w
t
)
t=d+1....n
=
(
∇
d
y
t
)
t=d+1....n
; którego liczba wyrazów będzie wynosić n –d.
Jeżeli szereg taki okaże się stacjonarny to można go modelować stosując, jeden z procesów AR(p), MA(q),
ARMA(p,q) określonych mianem:
•
zintegrowanego procesu regresji ARI(p)
•
zintegrowanego procesu średniej ruchomej IMA(q)
•
zintegrowanego procesu autoregresji i średniej ruchomej ARIMA(p,d,q)