EKONOMETRIA Dr Stanisław Barczak
ZAGADNIENIA WSTPNE
Czym jest ekonometria?
Umożliwia dokonywanie pomiarów procesów ekonomicznych.
Twórcy:
Frish (1936r) unifikacja teorii ekonomii, statystyki i matematyki. Główny cel ekonometrystów to przewidywanie
cykli koniunkturalnych. Początek od stworzenia zakłóconego ruchu wahadła (analogia do wahań giełdowych).
Ekonometria to:
Gregory C. Chaw jest naukÄ… i sztukÄ… stosowania metod statystycznych do mierzenia relacji ekonomicznych.
Zbigniew Pawłowski jest nauką o metodach badania ilościowych prawidłowości występujących w zjawiskach
ekonomicznych za pomocÄ… odpowiednio wyspecjalizowanego aparatu matematyczno-statystycznego.
Oskar Lange nauka o ilościowych aspektach procesów ekonomicznych, zajmująca się ustaleniem za pomocą
statystyki konkretnych ilościowych prawidłowości zachodzących w życiu gospodarczym.
Henry Theil zajmuj siÄ™ ona empirycznÄ… weryfikacjÄ… spraw ekonomicznych.
Słowo empiryczne wskazuje na to, że dane wykorzystywane do tej weryfikacji otrzymuje się z obserwacji, natomiast
obserwacja może polegać na dokonaniu kontrolowanego eksperymentu w celu weryfikacji określonego
interesującego go prawa lub też może to być obserwacja bierna. Bierna dominuje wśród ekonomistów.
Historia metod ekonometrycznych.
I era era klasycznej metody najmniejszych kwadratów, modele TIMBERGENA, działy: analiza popytu
konsumpcyjnego, podaży, kosztów produkcji, wydajności pracy.
II era rozwój estymacji 2MNK i 3MNK, metody zmiennych instrumentalnych, powstały modele Kleina, Kleina-
Goldbergena, podejście przyczynowo-skutkowe.
III era zastosowanie analizy mnożnikowej, Goldberger w 1956 roku, powstaje analiza przepływów
międzygałęziowych.
Po II WŚ można powiedzieć, że ekonometria jest już nauką.
IV era wprowadzenie analizy spektralnej do ekonometrii, prekursorzy tego to Jevons i Moore, lata 60te to
panowanie analizy spektralnej
Od lat 60tych powszechna komputeryzacja.
V era powstają makromodele będące podstawą symulacji i prognozowania, metody input-output . Możliwe staje
się prowadzenie badań o charakterze symulacyjnym.
Ekonometria:
- bada związki ilościowe i jakościowe pomiędzy kategoriami
- jest zbiorem różnych metod
- nie ma wyraznych granic
- rozważa się ją w powiązaniu z innymi naukami: ekonomią matematyczną (metody i zasady formułowania
teorii ekonomicznych), teoriÄ… ekonometrii (konstrukcja modeli ekonometrycznych i opisu danych),
statystykÄ… ekonomicznÄ… (zbieranie, gromadzenie i organizacja danych statystycznych)
Przedmiotem analizy ekonometrycznej jest:
- konstrukcja modeli ekonometrycznych
- estymacja jego parametru
- szeroko pojęte wnioskowanie na podstawie modelu ekonometrycznego
Model ekonometryczny:
Pawłowski konstrukcja formalna, która za pomocą jednego równania, bądz też wielu równań odwzorowuje
zasadnicze powiązania ilościowe zachodzące między badanymi zjawiskami.
Hellwig model ogólnie rozumiany, musi być zawsze lepszą lub gorszą kopią oryginału i dlatego też, aby można
było mówić o sensownym sporządzaniu kopii, należy wiedzieć czym jest oryginał; proces powstawania modelu to
efekt świadomego i celowego odwzorowania fragmentu rzeczywistości
1
EKONOMETRIA Dr Stanisław Barczak
Klein schematyczne uproszczenie rzeczywistości, pomijające nieistotne aspekty.
Specyfikacja modelu ekonometrycznego sprecyzowanie zmiennych objaśniających, zmiennych objaśnianych
(endogenicznych), podjęcie decyzji co do charakteru występujących w modelu związków oraz podjęcie decyzji co
do postaci analitycznej modelu (liniowa, nieliniowa sprowadzalna do liniowej, strikte nieliniowa).
Specyfikacja modelu ekonometrycznego opiera siÄ™ na informacjach a priori (teorie ekonomiczne) oraz
informacjach z badań empirycznych.
Informacja a priori :
- istniejÄ…ce teorie ekonomiczne
- ogólnie znane zależności ekonomiczne typu rozrachunkowego lub bilansowego
- informacje pochodzące z poprzednio prowadzonych badań ekonometrycznych są podstawą do nowych
rozwiązań
- informacje o ustalonych instytucyjnie wartościach odnoszących się do pewnych zmiennych
ekonometrycznych (np. oprocentowanie kredytów, stopa dyskontowa, stopa podatku etc.)
Jednorównaniowy model ekonometryczny:
Y = f(X1,X2....Xk,¾)
Y- zmienna endogeniczna (objaśniana) to wyróżnione zjawiska ekonomiczne, które są opisywane (wyjaśniane)
przez poszczególne równania lub równanie modelu.
X1-Xk zmienne objaśniające służą do opisu, wyjaśniania zmian zmiennych endogenicznych, w modelu jest ich
pewna ilość
¾ (ksi) skÅ‚adnik losowy część stochastycznÄ… modelu, jest zmiennÄ… losowÄ… o wartoÅ›ci oczekiwanej (E(¾)=0) i
rozkładzie normalnym, nie jest elementem pozytywnym.
Nigdy nie możemy powiedzieć, że znalezliśmy wszystkie zmienne X.
¾ - zawiera w sobie bÅ‚Ä…d jaki popeÅ‚niamy, gdyby nie on to można idealnie przewidzieć np. kursy walut., ¾ jest
pozostałymi zmiennymi X, nieuwzględnionymi w modelu.
W modelu ekonometrycznym składnik losowy wynika z:
- uwzględnienia wpływu wszystkich czynników mało istotnych, niewyspecyfikowanych w równaniu bądz
równaniach modelu
- z różnic pomiędzy przyjętą postacią analityczną modelu, a istniejącą zależnością w rzeczywistości
- błąd pomiaru zmiennych
- czynniki losowe wpływające na zmienną endogeniczną (np. pobór energii elektrycznej)
Jeśli dobieramy złą postać analityczną to zwiększamy wskaznik losowści.
Przykład 1
Zbudujmy model ekonometryczny popytu na kompot z wiśni. Wyspecyfikujemy Y.
Yt popyt na kompot z wiśni
X1t cena kompotu z wiśni
X2t cena kompotu z czereśni
¾ - skÅ‚adnik losowy
Do konstrukcji modelu wykorzystujemy dane empiryczne.
Model w sensie ogólnym Yt = f(X1t,X2t, ¾t)
Trzeba znalezć postać analityczną modelu dla pełnej jego specyfikacji.
Yt = f(Yt-1; ¾) cena kompotu zależy tylko od czasu jest to postać autoregresyjna.
Rzeczą bardzo istotną odpowiednie wyspecyfikowanie opóznienia czasowego.
Przykład:
Model liniowy jednorównanionwy
Yt = Ä…1X1t+Ä…0 + ¾t
¾
¾
¾
Jest to model przyczynowo-skutkowy, z jedną zmienną objaśniającą, gdzie ą1 i ą0(parametr wolny) to parametry
strukturalne.
Model dzieli się na dwie części: deterministyczną i stochastyczną (pogrubiona)
Do takiej specyfikacji ekonometryk musi wybrać odpowiednie zmienne o charakterze liniowym.
6 etapów budowy modeli ekonometrycznych.
1. Określenie celu oraz zakresu badania (potrzebne: wiedza i praktyka z zakresu teorii ekonomii i statystki).
2
EKONOMETRIA Dr Stanisław Barczak
2. Specyfikacja modelu ekonometrycznego (określenie zmiennych endogenicznych i objaśniających oraz
postać analityczna modelu). Dodatkowo należy określić zródła danych oraz ich wiarygodność. Od tego
etapu zależy powodzenie przedsięwzięcia budowy modelu ekonometrycznego. Daje nam to analityczną
postać modelu, wstępną postać modelu można ją określić jako hipotezę badawczą przypuszczenie o
stanie procesu przed przeprowadzeniem badania, musi być jednoznacznie weryfikowalna.
3. Gromadzenie odpowiednich danych statystycznych na podstawie których zostaną oszacowane parametry
strukturalne modelu ekonometrycznego. Parametry nigdy nie będą znane (będą to tylko parametry
szacunkowe)
4. Estymacja parametrów strukturalnych modelu
Yt = Ä…1X1 + Ä…2X2 + Ä…0 + ¾t
Yt = a1X1 + a2X2 + a0 + Ut oszacowany model ekonometryczny, parametry a są już konkretnie
oszacowanymi wartościami.
Nie istnieje uniwersalna metoda szacowania parametrów strukturalnych.
Dobór odpowiedniego estymatora (można rozluznić warunki stosowania estymatorów).
Dokonuje się weryfikacji modelu ekonometrycznego (jeśli weryfikacja nie przejdzie pomyślnie to powrót do
etapu 1.)
5. Praktyczne wykorzystanie modelu ekonometrycznego. Dokonanie badanej analizy na podstawie
historycznych danych. Wykorzystuje się do przewidywania przyszłości narzędzie do budowy prognoz,
oraz wykorzystuje się je do eksperymentów symulacyjnych.
6. Możemy to dokonać w odpowiednich warunkach prac nad modelem makroekonomicznym.
Często wszystkie te etapy prowadzone są równolegle.
Klasyfikacja modeli ekonometrycznych:
1. Na podstawie cech budowy modeli oraz typu modeli
- analityczno opisowe opisujące stan rzeczy w danym momencie czasu, wykorzystanie prawidłowości
rzÄ…dzÄ…cych systemem
- prognostyczne przewidywanie stanu w przyszłości, jeżeli analityczno-opisowy jest dobrze dopasowany to
jego też można wykorzystać do prognoz
- symulacyjne i sterowania analiza symulacyjna i sterowania
2.
- liniowe
Yt = Ä…1X1 + Ä…2X2 + Ä…3X3 + Ä…0 + ¾t 3 zmienne objaÅ›niajÄ…ce nie uwzglÄ™dnia wpÅ‚ywu czasu model statyczny
Yt = ²Yt-1 Ä…1X1 + Ä…2X2 + Ä…0 + ¾t model dynamiczny mamy zmiennÄ… opózniajÄ…cÄ…, uwzglÄ™dnia upÅ‚yw czasu.
- nieliniowe sprowadzalne do liniowych
o hiperboliczne
1
Yt = Ä…1 × +Ä…0 + ¾t
X1t
o kwadratowy niezupełny
Yt = Ä…1X12 +Ä…0 + ¾t
t
- nieliniowe
o trend logistyczny (dynamiczny do badania trendu)
Ä…
Yt = + ¾t
1+ ²e-Å‚t
3. Ze względu na udział czynnika:
- statyczne
- dynamiczne -> nie ma zależności tylko przyczynowo-skutkowej, bo nie zależy tylko od czasu.
4. Ze względu na walory poznawcze:
- przyczynowo-opisowe zmienne endogeniczne (skutek), a zmienna objaśniająca (przyczyny) i parametry
strukturalne świadczą o sile związku pomiędzy zmienną endogeniczną, a zmiennymi objaśniającymi.
- symptomatyczne modele, w których pomiędzy zmienną endogeniczną, a zmiennymi objaśniającymi
zachodzi silna korelacja, natomiast interpretacja przyczynowo-skutkowa jest nieuprawniona; stosuje siÄ™ gdy
brak jest podstaw do oczekiwania przyczynowości badanej relacji ekonomicznej (brak akceptowanej teorii
ekonomicznej) lub gdy zmienne reprezentujące przyczyny bądz skutek (zmienne objaśniające) są
nieobserwowalne, takie modele stosuje się często wobec prognozowania gospodarczego
- tendencji rozwojowych modele trendu, w nich jedyną zmienna objaśniającą jest zmienna czasowa
(pomija się w nim tak na dobrą sprawę istotne czynniki, co powoduje zwiększenie się czynnika losowości)
Miary jakości modelu:
- stopień dopasowania modelu do danych empirycznych
3
EKONOMETRIA Dr Stanisław Barczak
- dokładność parametru modelu (dokładne oszacowanie parametrów strukturalnych modelu)
- wartość informacyjna modelu
- sensowność interpretacji parametrów (jeśli nie ma sensownej to model nie nadaj się do niczego)
- wartość prognostyczna modelu
Wg Tinbergena należy patrzeć (przy wyborze modelu etc.): jaka relacja tak na dobrą sprawę nas interesuje, jeśli
znamy dobrze zagadnienie ekonomiczne to intuicja nam podpowie, którą metodę wybrać
DOBÓR ZMIENNYCH OBJAŚNIAJCYCH DO MODELU LINIOWEGO-
JEDNORÓWNANIOWEGO
Musi być znana zmienna endogeniczna.
Yt = f(X1, X2...Xk, ¾) dochodzimy do wniosku, że to bÄ™dzie model liniowy i wybieramy najistotniejsze zmienne
objaśniające.
Zmienne objaśniające w modelu ekonometrycznym powinny charakteryzować się następującymi cechami:
- odpowiednią zmiennością
- wykazywać silną korelacją ze zmienną endogeniczną (istotną korelacje)
- powinny wykazywać słabe (nieistotne) korelacje między sobą
Yt = Ä…1X1t + Ä…2X2t + Ä…3X3t + Ä…0 + ¾t
Jeśli np korelacja X1t i X2t = 0,85 mówi, że w taki sam sposób kształtują one Y. Wystarczy wybrać tylko jedną z tych
zmiennych, tę która jest bardziej skorelowana z Y.
Jeśli nie mamy wszystkich danych to szukamy zmiennych naśladowczych, bądz pomijamy zwiększając tym samym
¾.
Formalne etapy dobory zmiennych objaśniających do modelu ekonometrycznego:
1. Ustalenie liczby potencjalnych zmiennych objaśniających tylko nazywamy zmienne, nie mamy danych
2. Gromadzimy materiał statystyczny
3. Usuwamy zmienne o niskiej zmienności (jeśli zmienna endogeniczna ma niską zmienność brak
konieczności budowy modelu), zmienne objaśniające muszą mieć ten sam okres zmienności co Y.
4. Ustalenie miernika jakości modelu ekonometrycznego można rozpatrywać z trzech punktów widzenia:
- jego dopasowanie do rzeczywistych danych empirycznych
- istotność parametrów strukturalnych modelu
- brak autokorelacji składnika losowego
5. Obliczenie współczynnika korelacji pomiędzy wszystkimi rozpatrywanymi zmiennymi
6. Ustalenie kombinacji zmiennych, które wejdą do modelu
Zmienne muszą wykazywać zróżnicowanie (liczone współczynnikiem zmienności)
Si
Vi =
_
x
Wartość kryterium współczynnika zmienności to 0,1 poniżej go nie jest zmienną wyrzucamy ją z modelu, lecz
należy ją dodać przy parametrze wolnym (ślepa zmienna zawsze 1).
Quasi stała prawie stała, jeśli bardzo zaokrąglamy i wtedy jest taka sama, też się taką odrzuca (o bardzo małej
zmienności).
Metoda doboru zmiennych Pawłowskiego:
Zgodnie z procedurą Pawłowskiego do modelu ekonometrycznego wejdzie kombinacja zmiennych objaśniających,
która spowoduje, że:
- model będzie gwarantował pewną z góry ustaloną dokładność (dopasowanie do danych empirycznych)
- spośród wszystkich kombinacji zmiennych objaśniających należy wybrać te kombinację, w której
uwzględnione zmienne objaśniające nie są skorelowane między sobą
y1
Tworzymy macierz potencjalnych zmiennych i wektor kolumnowy zmiennej endogenicznej
y2
Y =
...
yn
4
EKONOMETRIA Dr Stanisław Barczak
X11 X12 ... X1t
X X ... X
21 22 2t
X =
... ... ... ...
X X ... X
n1 n2 nt
Wartość współczynnika korelacji Rw między zmienną endogeniczną, a zmiennymi objaśniającymi była nie mniejsza
niż z góra zadana liczba.
" > 0 to może być pewną miarą służącą badaniu dokładności modelu.
Rw współczynnik korelacji wielorakiej.
det | W |
Rw = 1-
det | R |
1 Ro
W = R współczynnik korelacji między wybranymi zmiennymi objaśniającymi
Ro R
Ro wektor kolumnowy współczynnika korelacji pomiędzy wybranymi zmiennymi objaśniającymi, a zmienną
endogenicznÄ….
Przykład
Dane są 3 potencjalne zmienne objaśniające X1t, X2t, X3t oraz Yt
1.Wyliczenie współczynnika korelacji pomiędzy zmiennymi objaśniającymi.
1 0,4 0,18
R = 0,4 1 0,34
0,18 0,34 1
wzór na ilość kombinacji L = 2p 1, gdzie P to liczba zmiennych objaśniających.
Jest 7 kombinacji K1={x1}, K2={x2}.... K7={X1,X2,X3}
Szukamy właściwej kombinacji
Korelacje wszystkich zmiennych ze zmiennÄ… endogenicznÄ… Y:
0,88
RO = 0,7
0,3
Rozpatrujemy kombinacjÄ™ K={x1,x2}
0,88 1 0,4
Ro = R =
0,7 0,4 1
Tworzymy macierz W
1 0,88 0,7
W = 0,88 1 0,4
0,7 0,4 1
det |W| = 0,84
det |R| = 0,684
Rw = 0,9584
W analogiczny sposób postępujemy z pozostałymi kombinacjami i wybieramy tę z najwyższym Rw.
Metoda wskazników pojemności informacyjnej (metoda Hellwiga):
1.Indywidualne wskazniki pojemności informacyjnej.
2
roj
hij =
pl
1+ rij |
"|
i=1
l elta kombinacja zmiennych objaśniających
j jota zmienna objaśniająca
roj współczynnik korelacji liniowej Pearsona między jotą zmienną objaśniającą i zmienną endogeniczną Y
5
EKONOMETRIA Dr Stanisław Barczak
rij współczynnik korelacji liniowej Pearsona pomiędzy itą i jotą zmienną objaśniającą.
Przyjmuje on wartość z przedziału 0 <= h <= 1, jeżeli poza przedziałem to wiemy, że wzięliśmy do modelu
nieliniowego współczynniki korelacji liniowej.
Współczynnik (zmienne objaśniające) posiadają różną nośność informacyjną (np. X1 0,4; X2 0,5; etc.)
2.Wskazniki integralne pojemności informacyjnej H.
H suma h, przyjmuje wartości z tego samego przedziału 0<= H <= 1
Przykład
Dane sÄ… zmienne X1t, X2t, X3t
KorzystajÄ…c z procedury Hellwiga
0,88 1 0,4 0,18
RO = 0,7 R = 0,4 1 0,34
0,23 0,18 0,34 1
liczymy:
(0,88)2 (0,7)2 (0,23)2
h11 = h22 = h33 =
1+ 0 1+ 0 1+ 0
(0,88)2 (0,7)2
h41 = h42 =
1+ 0,4 1+ 0,4
(0,88)2 (0,23)2
h51 = h53 =
1+ 0,18 1+ 0,18
(0,7)2 (0,23)2
h62 = h63 =
1+ 0,34 1+ 0,34
(0,88)2 (0,7)2 (0,23)2
h71 = h72 = h73 =
1+ 0,4 + 0,18 1+ 0,4 + 0,34 1+ 0,34 + 0,18
Integralne wskazniki H
H1 = h11
H2 = h22
H3 = h33
H4 = h41 + h42
H5 = h51 + h53
H6 = h62 + h63
H7 = h71 + h72 +h73
Na ich podstawie dokonujemy wyboru Hmax. z pośród w/w H
Mogą być rozbieżności pomiędzy metodą Pawłowskiego i Hellwiga.
Metoda współczynników korelacji
2
t
r* = wartość krytyczna współczynnika korelacji
2
t + n - 2
t wartość krytyczna odczytana z tablic t-Studenta
n liczba obserwacji
Przykład:
Przy poziomie istotności ą = 0,05 oraz n = 28 wyznaczyć wartości krytyczne współczynników korelacji, a następnie
zaproponować zmienne objaśniające do modelu.
n 2 = 26
Ä… = 0,05
tÄ… = 2,056
r* = 0,3739 - wszystko co poniżej tej wartości jest nieistotne statystycznie.
6
EKONOMETRIA Dr Stanisław Barczak
0,58
îÅ‚ Å‚Å‚
ïÅ‚0,86śł
ïÅ‚ śł
ïÅ‚ śł
Ro = 0,48 wszystkie zmienne mogą wejść do modelu, są istotne (wartości wyższe od r*)
ïÅ‚0,87śł
ïÅ‚ śł
ïÅ‚0,83śł
ðÅ‚ ûÅ‚
1 0,79 [0,26] 0,64 [0,1]
îÅ‚ Å‚Å‚
ïÅ‚
1 [0,33] 0,86 0,59śł zmienne których r są w [] mogą razem funkcjonować w modelu, nie
ïÅ‚ śł
sÄ… ze sobÄ… skorelowane
R = ïÅ‚ śł
1 [0,17] 0,51
ïÅ‚
1 0,62śł
ïÅ‚ śł
ïÅ‚ śł
1
ðÅ‚ ûÅ‚
Klasyczna metoda najmniejszych kwadratów (KMNK). Idea metody: wyznaczenie ocen parametrów strukturalnych
a1, a2,...ak, (konkretne wartości) parametrów strukturalnych ą1, ą2, ... ąk aby suma kwadratów odchyleń
zaobserwowanych wartości zmiennej endogenicznej Yt od jej wartości teoretycznych obliczonych na podstawie
modelu była najmniejsza.
Y
takÄ… obserwacjÄ™ odrzucamy
i rozpatrujemy osobno
X
Dany jest jednorównaniowy model ekonometryczny
Yt = Ä…1X1t + Ä…2X2t + ... + Ä…k-1X(k-1)t + Ä…k + ¾t
t = 1,2...n
Kryterium metody najmniejszych kwadratów ma postać:
¨ = " (yt a1X1t a2X2t - .... ak-1X(k-1)t ak)k min. czyli wartoÅ›ci teoretyczne modelu dane sÄ… jako:
Y*t = a1X1t + a2X2t + ... + ak-1X(k-1)t + Ä…k
Ostateczna postać KMNK dana jest jako:
¨ = " (y yt*)2 min gdzie wyrażenie (yt yt*) = ut ; gdzie t = 1,2...n reszta modelu/równania.
Yt = Ä…1X1t + Ä…2X2t + Ä…0 + ¾t
¾
¾
¾
Yt = a1X1t + a1X2t + a0 + ut
Zastosowanie KMNK wymaga spełnienia następujących założeń:
- postać modelu jest liniowa względem parametrów bądz sprowadzana do liniowej
- zmienne objaśniające są wielkościami nielosowymi
- zmienne objaśniające nie wykazują współliniowości
- skÅ‚adnik losowy ¾ ma wartość oczekiwanÄ… równÄ… zero E(¾) = 0 oraz staÅ‚Ä… wariancjÄ™ D2(¾) = Ã2
- nie następuje autokorelacja składnika losowego (nie ma zależności korelacyjnych między poszczególnymi
realizacjami składnika losowego chodzi o zależność rządu pierwszego)
Miara zależności, wariancja składnika losowego nie zależy od zmiennych objaśniających (składnik losowy nie jest
skorelowany ze zmiennymi objaśniającymi)
Układ skalarny
W celu wyznaczenie ocen parametrów strukturalnych modelu znajdujemy minimum funkcji
7
EKONOMETRIA Dr Stanisław Barczak
n
*
È = yt - yt )2 minimum
"(
t=1
è
= 0 (j = 1,2,...t)
Ãaj
2" (yt a1X1t a2X2t -...- ak) (-X1t) = 0
2" (yt a1X1t a2X2t -...- ak) (-X2t) = 0
" (yt a1X1t a2X2t -...- ak) (-1) = 0
Po wykonaniu odpowiednich przekształceń otrzymujemy tzw. układ równań normalnych danych jako:
a1"X1t2 + a2"X2t +...+ ak"X1t = "X1tyt
a1"X1tX2t + a2"X2t2 +...+ ak"X2t = "X2tyt
a1"X1t + a2"X2t + ....+ nak = "yt
Układ macierzowy
Jest to kolumnowy wektor zmiennej endogenicznej
y1
îÅ‚ Å‚Å‚
ïÅ‚y śł
2
ïÅ‚ śł
y =
ïÅ‚ śł
...
ïÅ‚y śł
ðÅ‚ n ûÅ‚
x11 x12 ... x1,k -1 1
îÅ‚ Å‚Å‚
ïÅ‚x x22 ... x2,k 1śł
21 -1
ïÅ‚ śł
X = Macierz realizacji zmiennych objaśniających.
ïÅ‚ śł
... ... ... ... 1
ïÅ‚x xn2 ... xn,k 1śł
n1 -1
ðÅ‚ ûÅ‚
Kolumnowy wektor parametrów strukturalnych:
îÅ‚Ä…1
Å‚Å‚
ïÅ‚Ä… śł
2
ïÅ‚ śł
Ä… =
ïÅ‚ śł
...
ïÅ‚Ä… śł
ðÅ‚ n ûÅ‚
Kolumnowy wektor ocen parametrów strukturalnych
a1
îÅ‚ Å‚Å‚
ïÅ‚a śł
2
ïÅ‚ śł
a =
ïÅ‚ śł
...
ïÅ‚a śł
ðÅ‚ n ûÅ‚
Kolumnowy wektor realizacji składnika losowego:
¾1
îÅ‚ Å‚Å‚
ïÅ‚¾ śł
2
ïÅ‚ śł
¾ =
ïÅ‚ śł
...
ïÅ‚¾ śł
ðÅ‚ n ûÅ‚
8
EKONOMETRIA Dr Stanisław Barczak
Kolumnowy wektor reszt:
u1
îÅ‚ Å‚Å‚
ïÅ‚u śł
2
ïÅ‚ śł
u =
ïÅ‚ śł
...
ïÅ‚u śł
ðÅ‚ k ûÅ‚
Wektor wartości teoretycznych
*
îÅ‚ Å‚Å‚
y1
ïÅ‚ śł
*
y2
ïÅ‚ śł
Y* =
ïÅ‚ śł
...
ïÅ‚ śł
*
ïÅ‚ śł
ðÅ‚yk ûÅ‚
Tak więc model:
Y=Ä…1X1t + Ä…2X2t +... + Ä…k-1X(k-1)t + Ä…k + ¾
W zespole macierzowym ma następującą postać:
Y = XÄ… + ¾
Wektor wartości teoretycznych zmiennej endogenicznej Y ma postać:
Y* = XÄ…
Funkcja kryterium KMNK dana jest jako:
¨ = (y - Xa) (y Xa) min transpozycja macierzy
Formuła:
A = (x x)-1 x y
transpozycja prosta
-1
macierz odwrotna
Przykład (jedna zmienna objaśniająca)
Na podstawie danych statystycznych zamieszczonych w tablicy oszacować parametry strukturalne modelu o postaci.
Yt = Ä…1X1t + Ä…0 + ¾t
yt 3 2 2 1 1
X1t 2 2 1 1 0
Wyznaczamy wykres rozrzutu
3 2 1
îÅ‚ Å‚Å‚ îÅ‚ Å‚Å‚
ïÅ‚2śł ïÅ‚2 1śł
ïÅ‚ śł ïÅ‚ śł
ïÅ‚ śł ïÅ‚ śł
y = 2 X = 1 1 parametr wolny (na koÅ„cu jest ¾t )
ïÅ‚1śł ïÅ‚1 1śł
ïÅ‚ śł ïÅ‚ śł
ïÅ‚1śł ïÅ‚0 1śł
ðÅ‚ ûÅ‚ ðÅ‚ ûÅ‚
Stosując formułę na wektor ocen parametrów strukturalnych czyli
a = (X X)-1 X Y
0,36 - 0,43
îÅ‚ Å‚Å‚
(X ' X )-1 =
ïÅ‚ śł
ðÅ‚- 0,43 0,71 ûÅ‚
13
0,78
îÅ‚ Å‚Å‚
ocena parametru a1
X 'Y =
a =
ïÅ‚0,86śł
ocena parametru a0
9
ðÅ‚ ûÅ‚
9
EKONOMETRIA Dr Stanisław Barczak
Model po oszacowaniu
Y*t = 0,78X1t + 0,86 + ut
Intensywność wzrostu X1t o 1 jednostkę spowoduje wzrost Y o 0,78.
a0 = 0,86 taką średnią wartość przyjmuje zmienna endogeniczna Yt w przypadku gdy zmienna objaśniająca X1t
będzie równe zero (= 0)
Model liniowy z 2 zmiennymi objaśniającymi.
Każdy parametr szacowany na podstawie 2,5 obserwacji (zdecydowanie za mało tutaj tylko
Yt X1t X 2t
dla uproszczenia).
11 25 12,5
Yt poziom produkcji
X1t liczba pracowników
12 23 13,4
X2t zużycie energii elektrycznej
13 24 13,8
13 22 14
14 23 14,2
Yt = Ä…X1t²1 X2t²2 e(Å‚-t) postać statyczna. e elementem dynamicznym.
Yt = Ä…1X1t + Ä…2X2t + Ä…0 + ¾t
Weryfikacja postaci analitycznej modelu, od wykresu rozrzutu (dla obu zmiennych) zależy czy model liniowy czy
nie.
25 12,5 1 11
îÅ‚ Å‚Å‚
ïÅ‚23 13,4 1śł 12
ïÅ‚ śł
ïÅ‚ śł
X = 24 13,8 1 Y = 13
ïÅ‚22 14 1śł 13
ïÅ‚ śł
ïÅ‚23 14,2 1śł 14
ðÅ‚ ûÅ‚
Tworzymy X X. Pózniej (X X)-1
A-1 = (1/detA) * adjA
147,1 0,31
îÅ‚ Å‚Å‚ îÅ‚ Å‚Å‚
a1
ïÅ‚858,5śł ïÅ‚ śł
a2
X 'Y = a = 2,04
ïÅ‚ śł ïÅ‚ śł
ïÅ‚ śł ïÅ‚- 22,51ûÅ‚ a3
śł
63
ðÅ‚ ûÅ‚ ðÅ‚
Yt = 0,31X1t + 2,04X2t 22,51 + Ut
Wzrost liczby pracowników o 1 etat spowoduje wzrost poziomu produkcji Yt o 0,31 tys sztuk, pod warunkiem, że
zużycie energii elektrycznej nie ulegnie zmianie.
Wzrost zużycia energii elektrycznej o 1 MWh spowoduje wzrost poziomu produkcji o 2,04 tys sztuk pod
warunkiem, że liczba pracowników nie ulegnie zmianie
-22,51 taki średni poziom miałaby zmienna endogeniczna w przypadku gdy zmienne objaśniające są równe 0.
WAASNOŚCI ESTYMATORÓW
Estymator nieobciążony:
1. Jeśli jego wartość oczekiwana (nadzieja matematyczna) jest równa estymowanemu parametrowi E(a)=a
2. Dla Modelu danego jako y = Xa + ¾ wektor parametrów strukturalnych dany jest jako a = (X X)-1 X Y
3. E(a) = E[(X X)-1 X Y] = E[(X X)-1 X * (Xa + ¾)]
4. ZakÅ‚ada siÄ™, że zmienne objaÅ›niajÄ…ce sÄ… nielosowe E(¾)=0
5. Stąd estymator parametrów strukturalnych jest nieobciążony jeżeli:
10
EKONOMETRIA Dr Stanisław Barczak
a. Zmienne objaśniające są nielosowe kowariancja składnika losowego nie zależy od zmiennych
objaÅ›niajÄ…cych E(X¾)=0
b. Składnik losowy ma wartość oczekiwaną 0
Estymator Zgodny:
1. Estymator parametru ą jest zgodny jeżeli jest stohastycznie zbieżny do szacowanego parametru ą. Oznacza
to, że przy wzroście liczby obserwacji do nieskończoności, jego wartość dąży stohastycznie do prawdziwej
wartości szacowanego parametru:
lim P{| a - a |< µ} = 1
n->"
Jeżeli wraz ze wzrostem liczebności próby oczekiwana wartość rozkładu estymatora zmierza do wartości
szacowanego parametru, a jednocześnie wariancja estymatora zmierza do zera, to estymator taki jest zgodny
Estymator efektywny:
Przy danych kilku estymatorach zgodnych i nieobciążonych estymatorem najefektywniejszym jest ten, który posiada
najmniejszÄ… wariancjÄ™.
Jeżeli spełnione są założenia KMNK (dotyczące składnika losowego oraz zmiennych objaśniających) to estymator a
= (X X)-1 X Y jest estymatorem najefektywniejszym spośród estymatorów liniowych, gdzie jego wariancja dana jest
następującą formułą:
D^(a) = ´^ * (X X)-1 jako macierz wariancji i kowariancji, na głównej przekÄ…tnej wariancje estymatorów, poza
niÄ… kowariancje.
´^ = S^(u)
Założenia klasycznej metody najmniejszych kwadratów do własności estymatorów:
1. Jeżeli zmienne objaśniające są współliniowe, to nie istnieje estymator dany formułą
a = (X X)-1 X Y, ponieważ nie istnieje macierz odwrotna do macierzy (X X) to wyznacznik jest równy 0,
czyli det (X X) = 0.
2. Jeżeli wariancja składnika losowego nie jest stała to:
a = (X X)-1 X Y jest nieobciążony, i zgodny, ale nie jest najefektywniejszy. Musi istnieć stałość wariancji w
czasie ´^1 = ´^2 . CzÄ™sto siÄ™ rezygnuje z efektywnoÅ›ci estymatora
3. Jeżeli skÅ‚adnik losowy jest zależny cov(¾t;¾t+1) różna od 0, a w zbiorze zmiennych objaÅ›niajÄ…cych nie ma
zmiennej endogenicznej opóznionej (ą1Yt-1)w czasie to a = (X X)-1 X Y jest nieobciążony i zgodny, ale nie
jest już najefektywniejszy
4. Jeżeli skÅ‚adnik losowy jest zależny [cov(¾t;¾t+1) różna od 0], a w zbiorze zmiennych objaÅ›niajÄ…cych istnieje
zmienna endogeniczna opózniona w czasie to:
a = (X X)-1 X Y nie jest zgodny
5. Jeżeli wariancja składnika losowego jest funkcją zmiennych objaśniających to estymator a = (X X)-1 X Y
nie jest zgodny.
Klasyczne założenia dotyczące składnika losowego:
Dana jest macierz wariancji i kowariancji składnika losowego:
D^ (¾1) E(¾1¾ ) ... E(¾1¾n )
îÅ‚ Å‚Å‚
ïÅ‚E(¾ ¾1) D^ (¾2 ) ... E(¾2¾n )śł
2
ïÅ‚ śł
E(¾,¾ ') = macierz kwadratowa i symetryczna
ïÅ‚ śł
... ... ... ...
ïÅ‚E(¾ ¾1) E(¾n¾2 ) ... D^ (¾n )śł
ðÅ‚ n ûÅ‚
- jest kwadratowa i symetryczna
- na głównej przekątnej znajdują się wariancje składnika losowego poszczególnych
okresów (w przypadku serii czasowych), natomiast poza główną przekątną znajdują się
kowariancje między składnikami losowymi poszczególnych okresów.
Można wyróżnić 4 sytuacje związane z założeniami:
1. Spełnione założenie MNK
a. Wariancja jest jednorodna D^(¾1) = D^(¾2) =... = D^(¾n) = ´^
b. Brak autokorelacji czyli skÅ‚adnik losowy jest niezależny E(¾t,¾t+1)=0
c. Macierz wariancji i kowariancji ma postać:
11
EKONOMETRIA Dr Stanisław Barczak
2
îÅ‚ Å‚Å‚
´ 0 ... 0
ïÅ‚ śł
2
0 ´ ... 0
2
ïÅ‚ śł
E(¾,¾ ') = = ´ In gdzie In to macierz jednostkowa
ïÅ‚ śł
... ... ... ...
ïÅ‚ śł
2
0 0 ... ´
ïÅ‚ śł
ðÅ‚ ûÅ‚
2. Nie jest spełnione założenie o jednorodności wariancji składnika losowego
a. D^(¾1) `" D^(¾2) `"... `" D^(¾n) `" ´^
b. Brak autokorelacji czyli skÅ‚adnik losowy jest niezależny E(¾t,¾t+1)=0
c. Wówczas macierz wariancji i kowariancji składnika losowego jest macierz diagonalna i ma postać:
D^ (¾1) 0 ... 0
îÅ‚ Å‚Å‚
ïÅ‚ śł
0 D^ (¾2 ) ... 0
ïÅ‚ śł
E(¾,¾ ') =
ïÅ‚ śł
... ... ... ...
ïÅ‚
0 0 ... D^ (¾n )śł
ðÅ‚ ûÅ‚
3. Jeżeli spełnione jest założenie o jednorodności wariancji składnika losowego, czyli (dzieli próbę na 2 części
i w obu wariancje będą równe):
a. D^(¾1) = D^(¾2) =... = D^(¾n) = ´^
b. Składnik losowy jest zależny (występuje jego autokorelacja)
c. Wówczas macierz wariancji i kowariancji składnika losowego jest macierzą symetryczną i ma
postać:
1 Á22 ... Á1n
îÅ‚ Å‚Å‚
ïÅ‚Á 1 ... Á2n śł
21
ïÅ‚ śł
E(¾,¾ ') =
ïÅ‚ śł
... ... 1 ...
ïÅ‚ śł
Á2n ... 1
ðÅ‚Á1n ûÅ‚
współczynniki autokorelacji między składnikiem losowym i-tego i tgo okresy.
4. Jeżeli nie jest spełnione założenie o jednorodności wariancji składnika losowego:
a. D^(¾1) `" D^(¾2) `"... `" D^(¾n) `" ´^
b. Oraz nie jest jest speÅ‚nione zaÅ‚ożenie o braku korelacji, czyli wystÄ™puje sytuacja, w której E(¾1¾2)
`" 0
c. Wówczas macierz wariancji i kowariancji składnika losowego jest macierzą symetryczną i ma
postać (tak jak w sytuacji 1).
Sytuacje 3 i 4 to tzw. egzamin dla modelu i nie jest zależne od naszych błędów.
MODELE NIELINOWE SPROWADZALNE DO LINIOWYCH
MODEL HIPERBOLICZNY:
Oszacować model o postaci Yt = Ä…1(1/X1t) + Ä…0 + ¾t
Na podstawie danych statystycznych stablicowanych:
Yt 1 1,1 1,11 1,12 1,22 1,25 1,36 1,54 2 2
X1t 11 8 6 4 4 3 2 2 2 1
Gt 0,09 0,126 0,16 0,25 0,25 0,33 0,5 0,5 0,5 1
Na podstawie wykresu rozrzutu model hiperboliczny (wykres hiperboli)
Model należy sprowadzić do postaci liniowej, by zastosować MNK.
Gt = 1/X1t
Stąd model będzie liniowy ze względu na zmienną G.
Yt = Ä…1Gt + Ä…0 + ¾t
Stosujemny MNK:
A = (X X)-1X Y
12
EKONOMETRIA Dr Stanisław Barczak
0,09 1 1
îÅ‚ Å‚Å‚ îÅ‚ Å‚Å‚
ïÅ‚0,126 1śł ïÅ‚ śł
1,1
ïÅ‚ śł ïÅ‚ śł
ïÅ‚ śł ïÅ‚ śł
0,166 1 1,11
ïÅ‚
0,25 1śł ïÅ‚1,12śł
ïÅ‚ śł ïÅ‚ śł
ïÅ‚
0,25 1śł ïÅ‚1,22śł 2,03 3,71 1,52 - 0,56 5,86
îÅ‚ Å‚Å‚ îÅ‚ Å‚Å‚ îÅ‚ Å‚Å‚
X = ïÅ‚ śł ïÅ‚ śł (X ' X )-1 = X 'Y =
Y = X ' X =
ïÅ‚3,71 10 śł ïÅ‚ śł ïÅ‚13,7śł
0,33 1śł ïÅ‚1,25śł
ïÅ‚ ðÅ‚ ûÅ‚ ðÅ‚- 0,56 0,31 ûÅ‚ ðÅ‚ ûÅ‚
ïÅ‚
0,5 1śł ïÅ‚1,36śł
ïÅ‚ śł ïÅ‚ śł
0,5 1śł ïÅ‚1,54śł
ïÅ‚
ïÅ‚ śł
0,5 1śł ïÅ‚ 2
ïÅ‚ śł ïÅ‚ śł
ïÅ‚ 1 1śł ïÅ‚ 2 śł
ðÅ‚ ûÅ‚ ðÅ‚ ûÅ‚
ostatecznie a = 1,17 v 0,93
Postać pierwsze Yt = 1,17Gt + 0,93 + Ut
Postać druga i ostateczna: Yt = 1,17 (1/X1t) + 0,93 + Ut
Wzrost ceny o 100zł spowoduje spadek wielkości sprzedaży o 1,17szt.
Weryfikacja modelu ekonometrycznego:
Oznacza to:
- zbadanie czy oszacowany model jest zgodny z rzeczywistością (kierunek wpływu zmiennych
objaśniających jest zgodny z rzeczywistością(
- zbadanie czy model ekonometryczny jest wystarczajÄ…co przejrzysty
- zbadanie czy zmienne objaśniające istotnie wpływają na zmianę endogeniczną
- zbadanie czy spełnia założenie MNK
Miary struktury stochastycznej:
1. Wariancja resztowa i odchylenie standardowe reszt:
a. Przy spełnionych warunkach MNK nieobciążonym estymatorem wariancji resztowej jest
wariancja resztowa wyznaczona wg następującej formuły:
n n
1
2
S (u) = gdzie n liczba obserwacji, k liczba szacowanych
"(Yt - Yt*) = 1 "ut
n - k n - k
t=1 t=1
parametrów.
Pierwiastek kwadratowy wariancji resztowej daje tzw. Odchylenie standardowe reszt czyli S(u).
Odchylenie standardowe informuje o ile średnio rzecz biorąc in plus, bądz in minus odchylają się
rzeczywiste realizacje zmiennej endogenicznej od wartości teoretycznych wyznaczonych przez model.
2. Macierz wariancji i kowariancji oraz średnie błędy szacunkowe
a. D2(a)=´2(X X)-1 gdzie ´2 = S2(u) czyli D2(a)= S2(u)(X X)-1
b. Miary struktury stochastycznej (wariancja resztowa oraz macierz wariancji i kowariancji) modelu
zwiÄ…zane sÄ… ze zmiennÄ… ¾.
Miara precyzji estymacji parametru struktury są średnie błędy szacunku. Kwadraty błędów szacunku
znajdują się na głównej przekątnej macierzy wariancji i kowariancji. Pierwiastek wariancji estymatora
daje zatem średni błąd szacunku dla danego parametru.
3. Miary dopasowania modelu do danych empirycznych (badanie jakości modelu).
a. Współczynnik zbieżności (przyjmuje wartości od 0 do 1) miara negatywna
n
"(Yt - Yt*)2
2 t=1
i. Õ =
n
_
"(Yt - Y )2
t=1
ii. współczynnik zbieżności może być stosowany tylko w przypadku modeli liniowych i
modeli do liniowych sprowadzalnych
13
EKONOMETRIA Dr Stanisław Barczak
iii. współczynnik zbieżności przyjmuje wartość 0 w przypadku gdy wszystkie wartości
teoretyczne zmiennej endogenicznej są równe wartościom rzeczywistym zmiennej
endogenicznej Õ2=0 => model idealnie dopasowany
iv. jeżeli współczynnik zbieżności przyjmuje wartość 1 oznacza to, że zmienność, zmiennej
endogenicznej została całkowicie nie wyjaśniona przez model ekonometryczny (na
wykresie rozrzutu punkty emiryczne wszędzie )
b. Współczynnik determinacji
i. Jest miarÄ… alternatywnÄ… w stosunku do Õ u dana jest R2 = 1- Õ2 nie jest jednak
najważniejszą miarą modelu
ii. Przyjmuje wartości od 0 do 1
iii. Współczynnik determinacji jest kwadratem współczynnika korelacji wielorakiej (reaguje
na ilość zmiennych)
iv. Informuje jaka cześć zmienności zmiennej endogenicznej została wyjaśniona przez model
v. Jego wartości związane z przyrostem ilości zmiennych objaśniających rośnie, można
zatem dodatkowo skorzystać ze skorygowanego współczynnika determinacji (gdy mamy
dużo zmiennych objaśniających I będą budowane prognozy).
~
n -1
R2 = 1- (1- R2 ) gdzie n to liczba obserwacji, a m liczba zmiennych objaśniających
n - m -1
interpretacja analogiczna do R2 (tylko dla modeli liniowych bÄ…dz do liniowych sprowadzalnych) Zawsze
skorygowany współczynnik determinacji niższy od normalnego.
c. Współczynnik zmienności losowej
i. Vs = Su/Y I zawsze podawany w procentach (%). Współczynnik zmienności losowej
informuje jaką część średniego poziomu zmiennej endogenicznej stanowią wahania
przypadkowe.
Przykład:
Yt = Ä…1X1t + Ä…0 + ¾1
Yt 1 0 2 2
X1t 2 0 -2 -1
Model po oszacowaniu MNK Yt = -0,31X1t + 1,17 + ut
Obliczamy wartości teoretyczne modelu:
Y*1 = -0,31*2 + 1,17 = 0,542
Y*2 = 1,17
Y*3 = 1,8
Y*4 = 1,485
Wariancja resztowa:
U1 = 0,457 U2 = -1,17 U3 = 0,2 U4 = 0,514 suma powinna się równać 0.
"u2 = 1,8857 n = 4 k = 2 => Su = 0,971
Rzeczywiste realizacje zmiennej endogenicznej (Yt) odchylają się średnio rzecz biorąc +/- o 0,971 (jednostki) od
wartości teoretycznych wyznaczonych przez model.
Liczymy macierz wariancji i kowariancji oraz średnie błędy szacunku:
0,114 0,028 0,107 0,026
îÅ‚ Å‚Å‚ îÅ‚ Å‚Å‚
D2(a) = S2(u)(X X)-1= 0,9428 *
ïÅ‚0,028 0,257śł = ïÅ‚0,026 0,242śł
ðÅ‚ ûÅ‚ ðÅ‚ ûÅ‚
Średnie błędy szacunku:
D^(a1) = pierwiastek z 0,107 = 0,32
D^(a2) = pierwiastek z 0,242 = 0,49
Model zapisujemy:
Y*t = -0,31X1t + 1,17 + ut
(0,32) (0,49)
14
EKONOMETRIA Dr Stanisław Barczak
WERYFIKACJA ISTOTNOŚCI PARAMETRÓW STRUKTURALNYCH MODELU
NP.
Yt = 10X1t + 2X2t + 5 + ut
Jeżeli stwierdzimy, że nieistotny jest wpływ, którejś ze zmiennych to ją usuwamy.
Wtedy ponownie szacujemy model bez tej zmiennej.
Nie ma konieczności testowania parametru wolnego.
Do przyczyn nieistotności parametrów strukturalnych modelu można zaliczyć:
- brak zależności między zmienną objaśniającą, albo endogeniczną
- mała dokładność lub nieodpowiednia jakość danych statystycznych
- słaba dokładność technik estymacji oraz wnioskowania statystycznego (ważny przy małych próbach)
- przyjęcie niewłaściwej postaci analitycznej modelu
- okoliczności przypadkowe wynikające z losowości próby
- pominięcie istotnych zmiennych objaśniających, te braki będą się kumulowały w resztach co spowoduje
wysoką wariancję resztową, co z kolei spowoduje, że średnie błędy szacunku będą wysoki, im wyższa
wartość wariancji szacunku tym większe średnie błędy.
TEST T-STUDENTA
H0: ą = 0 wobec hipotezy alternatywnej takiej, że H1:ą1 `" 0
Jeżeli H0 odrzucamy tzn, że parametr jest istotny.
Sprawdzeniem hipotezy H0 jest statystyka t-studenta o n-k stopniach swobody, gdzie k to liczba szacowanych
parametrów.
T = ai/D(ai) gdzie i = 1,2...k
ai - ocena parametru Ä…1
D(ai) średni błąd szacunku parametru ai
|t| > tą gdzie tą to wartość krytyczna odczytywana z tablic.
W takim wypadku H0 odrzucamy na korzyść hipotezy alternatywnej.
Przykład:
Yt = 6X1t + 4X2t 8X3t + 10 + ut
(2) (1) (4) (6)
S(u) = 0,4
R^ = 0,98
N = 20, k = 4, n-k = 16
Zakładamy poziom istotności ą=0,05 => tą = 2,120
H0:Ä…1 = 0
H1:Ä…1 `" 0
T = 6/2 = 3 |t| > tą H0: odrzucamy na korzyść H1, czyli ą1 `" 0
Zmienna objaśniająca X1t istotnie wpływa na zmienną endogeniczną Yt i należy ją pozostawić.
Ä…2
t = 4 => pozostawiamy w modelu X2t
Ä…3
t = -2 => X3t nieistotnie wpływa na Yt i należy ją z modelu wyrzucić.
ą4 (ślepa zmienna)
T = 1,8 => nieistotnie wpływa na model i należy ją z niego usunąć
Jeżeli chcemy utrzymać model to musimy zmienić poziom istotności np. ą = 0,1 gdzie tą = 1,76
15
EKONOMETRIA Dr Stanisław Barczak
Jeżeli wypada nam jakaś zmienna to szacujemy model raz jeszcze i raz jeszcze sprawdzamy istotność zmiennych.
Autokorelacja składnika losowego rzędu I. Test Durbina-Watsona
Może ona wyrażać się w postaci:
¾t = f(¾t-1, ¾t-2...¾t-Ä)
Do najczÄ™stszych odstÄ™pstw od zaÅ‚ożeÅ„ MNK można zaliczyć fakt iż skÅ‚adnik losowy ¾t nie tworzy procesu czysto
losowego, lecz zależy od wskaznika bieżącego t . Sytuacja taka ma miejsce, gdy wskaznik t wyznacza pewne
rozmieszczenie przestrzenna lub częściej gdy realizacje ¾t sÄ… zależne w czasie.
Autokorelacje można mierzyć tzw. współczynnikiem autokorelacji rzÄ™du Ä, który jest liczony jako współczynnik
korelacji liniowej rt
E(¾t¾t-1) - E(¾ ) × E(¾t-Ä )
Ä
ÁÄ =
D(¾t ) × D(¾t-Ä )
Estymator współczynnika autokorelacji rzÄ™du Ä, dany jako
n n
×
"ut "ut-Ä
n
t=Ä +1
× ut-Ä - (n -Ä ) ×
"ut
(n -Ä ) × (n -Ä )
t=Ä +1
rt =
2 2
n n
ëÅ‚ öÅ‚ ëÅ‚ öÅ‚
ëÅ‚ öÅ‚ ëÅ‚ öÅ‚
ìÅ‚ ÷Å‚ ìÅ‚ ÷Å‚
ìÅ‚ ÷Å‚ ìÅ‚ ÷Å‚
"ut "ut-Ä
n n
ìÅ‚ ÷Å‚ ìÅ‚ ÷Å‚
2 íÅ‚t=Ä +1 Å‚Å‚ 2 íÅ‚t=Ä +1 Å‚Å‚
- × -
ìÅ‚ "ut "ut-Ä
÷Å‚ ìÅ‚ ÷Å‚
n -Ä
ìÅ‚t=Ä +1 n -Ä ÷Å‚ ìÅ‚t=Ä +1 ÷Å‚
ìÅ‚ ÷Å‚ ìÅ‚ ÷Å‚
íÅ‚ Å‚Å‚ íÅ‚ Å‚Å‚
Współczynnik autokorelacji przyjmuje wartość z przedziału [-1,1]
Przyczyny autokorelacji składnika losowego:
- błędy specyfikacji modelu:
o pominięcie istotnej zmiennej objaśniającej
o błędne określenie opóznień czasowych zmiennej bądz kilku zmiennych objaśniającej
o przyjęcie niewłaściwej postaci analitycznej modelu
test Durbina-Watsona stosowany jest tylko do testowania autokorelacji rzędu I
H0:Á1 = 0
H1:Á1 > 0 lub H1:Á < 0
Sprawdzeniem Ho jest statystyka Durbina-Watsona (gdy dysponujemy resztami modelu danymi jako:
n
-Ut-1)2
"(Ut
t=2
d = , gdzie Ut to reszta równania z okresem t.
n
2
"Ut
t=1
Sprawdzian hipotezy H0 możemy przedstawić jako (gdy mamy współczynniki autokorelacji I rzędu)
d = z (1 r1) gdzie r1 to współczynnik autokorelacji I rzędu
Statystyka D-W przyjmuje wartości z przedziału [0,4]
W przybliżeniu dla r = 1; d = 0, r = 0 d =2 i dla r = -1 d = 4
Pomiędzy 0 a 2 zależność dodatnia (+), pomiędzy 2, a 4 ujemna (-)
16
EKONOMETRIA Dr Stanisław Barczak
Podjęcie decyzji w przypadku gdy:
- mamy doczynienia z dodatniÄ… korelacjÄ… skÅ‚adnika losowego H0:Á1 = 0 i H1Á1 > 0
dL - dolna wartość krytyczna odczytana z tablic
dn - górna wartość krytyczna odczytana z tablic
" jeżeli d <= dL to H0 odrzucamy, wtedy model należy poprawić (oszacować ponownie uogólnioną MNK lub
zastosować metodę różniczki zupełnej)
" jeżeli dL < d < dn to nie można podjąć decyzji odnośnie istotności bądz nieistotności autokorelacji składnika
losowego tzw. obszar niekonkluzywności
" jeżeli d => dn nie ma podstaw do odrzucenia H0.
- mamy doczynienia z dodatniÄ… korelacjÄ… skÅ‚adnika losowego H0:Á1 = 0 i H1Á1 < 0
" liczymy d (d = 4 d)
" jeżeli d <= dL to H0 odrzucamy, wtedy model należy poprawić (oszacować ponownie uogólnioną MNK
lub zastosować metodę różniczki zupełnej)
" jeżeli dL < d < dn to nie można podjąć decyzji odnośnie istotności bądz nieistotności autokorelacji
składnika losowego tzw. obszar niekonkluzywności
" jeżeli d => dn nie ma podstaw do odrzucenia H0.
Homoskedastyczność jednorodność wariancji skÅ‚adnika losowego (Á0 nie jest speÅ‚niona poprawiamy model
uogólnioną MNK, tracimy na dokładności modelu).
Homoskedastyczność jest:
- jednym z założeń MNK
- oznacza, iż wraz ze zmianą wartości zmiennej endogenicznej lub zmiennych objaśniających lub wraz z
upływem czasu wariancja składnika losowego ulega zmianie
- odstąpienie od tego założenia powoduje obniżenie efektywności estymatorów
Test Goldfelda Quandta
Próbę statystyczną dzieli się na 2 części, (gdy ilość jest nieparzysta to odrzucamy środkową).
Na podstawie równoliczących prób szacuje się dwa modele ekonometryczne, a następnie oblicza się ich wariancje
resztowe
S2 oraz S2
u1 u2
n
1
2
Su = × - Y *t )2
"(Yt
n - k
t=1
W teÅ›cie weryfikowane sÄ… nastÄ™pujÄ…ce hipotezy H0:Á2 = Á2 H1:Á2 > Á2
1 2 1 2
Zakładając prawdziwość H0, sprawdzianem testu jest statystyka F o rozkładzie Fishera-Snedecora danego
następującą formułą:
2
Su2 o m1 = (n2 k) i m2 = (n1 i k) stopniach swobody
F
2
Su1
Decyzja: hipotezę o homoskedastyczności odrzucamy, gdy wartość sprawdzianu F przekroczy wartość krytyczną Fą
odczytaną z tablic rozkładu Fishera dla określonego poziomu istotności oraz określonej liczby stopni swobody.
Y 6 8 5 7 5 | 4 8 4 7 6
X 1 2 1 1 1 | 0 2 0 1 1
Na podstawie danych z tabeli oszacowano model ekonometryczny i otrzymano wyniki
Yt = 2X1t + 4 + ut Su2 = 0,5
Model 1 (z pierwszej części tabeli)
Yt = 2,25X1t + 3,5 + ut Su2 = 0,9166
Model 2 (z drugiej części tabeli)
Yt = 2,07X1t + 4,14 + ut Su2 = 0,2619
Test Fishera:
17
EKONOMETRIA Dr Stanisław Barczak
Ä… = 0,05 m1 = 3 m2 = 3
F = 0,2619/0,9166 = 0,2857
Wartość z tablic Fą = 9,28
F < Fą brak podstaw do odrzucenia H0, głoszącej stałość wariancji składnika losowego.
Przykład 1.
Na podstawie 25 operacji oszacowano model ekonometryczny i otrzymano wyniki:
Yt = 2X1t - 3X2t + 4X3t + 5 + ut Współczynnik autokorelacji rzędu I wynosi r1=-0,95; k=3; n=25; ą=0,05
H0:r1=0
H1:r1<0
Statystyka: d =2 (1 - r1) = 2(1 + 0,95) = 3,9 liczymy d = 4 3,9 = 0,1 dL=1,12 du=1,66
d
autokorelacja ujemna składnika losowego. Model należy poprawić.
Pierwsza rzecz to szacowanie przyczyn istotnej autokorelacji (np. opuszczanie istotnych przyczyn), (czy proces jest
nieliniowy, a wg modelu liniowy). Ostateczność MNK lub różniczki zupełnej.
Przykład 2.
L.p. 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
Ut -1 -1 -2 -2 -2 1 2 -2 1 1 1 1 0 -1 0 1 0 2 1 0
Ut-1 - -1 -1 -2 -2 -2 1 2 -2 1 1 1 1 0 -1 0 1 0 2 1
Dodatkowo wiadomo, że model posiada 2 zmienne objaśniające. k=2 n=20 ą=0,05
H0:Á1=0
n
2
- ut-1)
"(ut
t=2
d =
H1:Á1>0 (bo d<2) test tylko dla autokorelacji rzÄ™du I
n
2
"ut
t=1
20 20
58
2 2
- ut-1) = 58 = 34 d = = 1,6918 dL=1,10 du=1,54
"(ut "ut
34
t=2 t=1
d > du
Brak podstaw do odrzucenia H0, gÅ‚oszÄ…cej, że Á1=0. Nieistotna autokorelacja skÅ‚adnika losowego.
UOGÓLNIONA METODA NAJMNIEJSZYCH KWADRATÓW
lekarstwo na autokorelację i niestałość wariancji
1. służy do szacowania parametrów strukturalnych modeli liniowych przy niespełnionym założeniu o stałości
wariancji odchyleń
2. służy do szacowania parametrów strukturalnych modeli liniowych przy niespełnionym założeniu o braku
autokorelacji składnika losowego
Wówczas macierz wariancji i kowariancji może być zapisana jako:
D2(a) = Ã2&! dowolna dodatnio okreÅ›lona macierz stopnia n
Wektor ocen parametrów strukturalnych dotyczy uogólnionej MNK dany:
-1
a = (X '&!-1X )X '&!-1 y KMNK analogicznie do a = (X ' X ) X ' y
Wyznaczenie wektora ocen parametrów strukturalnych
Wyznaczenie macierzy wagowej P: P jest taka, że &!-1 = P P
18
EKONOMETRIA Dr Stanisław Barczak
UWAGA!
Następnie oblicza się ważone obserwacje zmiennych czyli: y*=Py X*=PX
Praktyczne zastosowanie UMNK wymaga znajomości macierzy &!. Macierz &! zazwyczaj nie jest a priori znana.
1. przypadek niestałość wariancji odchyleń losowych
Macierz &! jest macierzÄ… diagonalnÄ… jako:
1
îÅ‚ Å‚Å‚
ïÅ‚&! 0 ... 0 śł
&!1 0 ... 0
îÅ‚ Å‚Å‚
1
ïÅ‚ śł
ïÅ‚ śł
1
ïÅ‚ śł
0 &!2 ... 0
0 ... 0
ïÅ‚ śł
&! = Macierz odwrotna &!-1 =
ïÅ‚ śł
&!2
ïÅ‚ śł
... ... ... ...
ïÅ‚ śł
... ... ... ...
ïÅ‚
ïÅ‚ śł
0 0 ... &!n śł
1
ðÅ‚ ûÅ‚
0 0 ...
ïÅ‚ śł
&!n ûÅ‚
ïÅ‚ śł
ðÅ‚
A macierz wagowa P dana jest jako wektor
1
îÅ‚ Å‚Å‚
0 ... 0
ïÅ‚ śł
&!1
Wyznacznik macierzy diagonalnej iloczyn głównej przekątnej
ïÅ‚ śł
1
ïÅ‚ śł
0 ... 0
ïÅ‚ śł
P =
&!2
ïÅ‚ śł
... ... ... ...
ïÅ‚ śł
1
ïÅ‚ śł
0 0 ...
Elementami na głównej przekątnej mogą być:
ïÅ‚
&!n śł
a) realizacje wybranej zmiennej objaśniającej X (najprostszy
ðÅ‚ ûÅ‚
przypadek), czyli
&!t = Xt t = 1,2,3,...,n
b) moduły reszt modelu oszacowanego MNK, czyli &!t = |ut| t = 1,2,3,...,n
c) w przypadku autokorelacji skÅ‚adnika losowego zakÅ‚ada siÄ™ nieciÄ…gÅ‚e{¾} podleganie procesowi
autoregresyjnemu rzędu I czyli:
&!t = Á¾t-1 + ·t t = 1,2,3,...,n gdzie |Á| < 1 wówczas ÁÄ = ÁÄ
A macierz &! jest macierzą współczynników autokorelacji odchyleń losowych o postaci:
1
îÅ‚ - Á 0 ... 0 0 0
Å‚Å‚
2
ïÅ‚ 2 śł
îÅ‚ Å‚Å‚
1 Á Á ... Á·-1
ïÅ‚- Á 1+ Á - Á ... 0 0 0 śł
ïÅ‚ śł
Á 1 Á ... Á·-2 śł ïÅ‚ 0 - Á 1+ Á 2 ... 0 0 0 śł
ïÅ‚
&! =
&!-1 =
ïÅ‚ śł
ïÅ‚ śł
... ... ... ... ...
... ... ... ... ... ... ...
ïÅ‚ śł
ïÅ‚ śł
·-1
2
ïÅ‚
ðÅ‚Á Á·-2 Á·-3 ... 1 śł ïÅ‚ 0 0 0 ... - Á 1+ Á - Áśł
ûÅ‚
ïÅ‚ śł
0 0 0 ... 0 - Á 1
ïÅ‚ śł
ðÅ‚ ûÅ‚
Macierz wagowa P
2
îÅ‚
1- Á 0 0 ... 0 0 0Å‚Å‚
ïÅ‚ śł
- Á 1 0 ... 0 0 0śł
ïÅ‚
ïÅ‚
0 - Á 1 ... 0 0 0śł
P = ïÅ‚ śł
ïÅ‚ ... ... ... ... ... ... ...śł
ïÅ‚
0 0 0 ... - Á 1 0śł
ïÅ‚ śł
ïÅ‚ śł
0 0 0 ... 0 - Á 1ûÅ‚
ðÅ‚
Ocena współczynnika autokorelacji dana jest jako:
n-1
(n - k -1) ut+1
"ut
t=1
r1 = k liczba szacowanych parametrów w modelu
n
2
(n -1)
"ut
t=1
Wariancja resztowa dana jest następującą formułą:
1
2
Su = u'&!-1u u - kolumnowy wektor reszt
n - k -1
19
EKONOMETRIA Dr Stanisław Barczak
Macierz wariancji i kowariancji dana jest jako:
-1
2
D2(a)= Su (X '&!-1X )
Zastosowanie UMNK dla poprawienia modelu wykazującego autokorelację składnika losowego.
Yt 6 5 6,5 4 5,5 2 6 3 5 5
X1t 1 2 1 1 1 0 2 0 1 1
X2t -1 0 1 0 1 -1 -1 0 0 1
Oszacowano model w postaci:
Yt = Ä…1X1t + Ä…2X2t + Ä…0 + ¾t i otrzymano wynik:
Yt = 1,5X1t + 0,5X2t + 3,3 + ut
(0,52) (0,42) (0,61)
d = 3,0264 jeżeli d > 3 (ok 3,6) to można praktycznie od razu stwierdzić autokorelacja istotna.
Test Durbina-Watsona:
N = 10 K = 2
H0: Á1 = 0
H1: Á1 < 0
d = 0,9736
dL = 0,697
dU = 1,641
Obszar niekonkluzywności nie wiadomo nic o składniku losowym (nie można podjąć decyzji).
Stosujemy UMNK i korzystamy w dalszym ciÄ…gu z modelu.
Reszty w modelu zanikają z czasem (w momencie spadków stałych, zaczyna się opóznienie w modelu).
UMNK:
Wektor ocen parametrów strukturalnych UMNK dany jako:
H"
a = (X '&!-1X )X '&!-1 y
Założono, że na głównej przekątnej macierzy wprowadzone zostaną moduły reszt modelu oszacowanego KMNK:
Macierz 10x10:
1,7
îÅ‚ Å‚Å‚
ïÅ‚ śł
1,3
ïÅ‚ śł
ïÅ‚ 1,2 0 śł
ïÅ‚ śł
0,8
ïÅ‚ śł
ïÅ‚ śł
0,2
&! = ïÅ‚ śł
0,8
ïÅ‚ śł
ïÅ‚ śł
0,2
ïÅ‚ śł
0 0,3
ïÅ‚ śł
ïÅ‚ śł
0,2
ïÅ‚ śł
ïÅ‚ 0,3śł
ðÅ‚ ûÅ‚
1
îÅ‚ Å‚Å‚
ïÅ‚1,7 0 ... 0 śł
ïÅ‚ śł
1
też macierz 10x10
ïÅ‚ śł
0 ... 0
&!-1 =
ïÅ‚ 1,3 śł
ïÅ‚ śł
... ... ... ...
ïÅ‚ śł
1
0 0 ...
ïÅ‚
0,3śł
ðÅ‚ ûÅ‚
20
EKONOMETRIA Dr Stanisław Barczak
Oszacowany model ma postać:
~Yt = 1,71X1t + 0,55X2t + 3,07 + ut
(0,34) (0,27) (0,41)
S2u = 1,0954
Su = 1,0466
Reszty również zanikają z czasem. Po zastosowaniu UMNK zmniejszają się amplitudy wahań.
EKONOMETRYCZNA TEORIA PROGNOZ
Przewidywanie przyszłości np. prognoza pogody na Śląsku o 12:48m etc.
Jeżeli nie dysponujemy historią, nie możemy prognozować ekonometrycznie.
- nieracjonalne wróżby, magia, proroctwa, wszystko co oparte na doświadczeniu, a nie wymaga stosowania
reguł naukowych
- racjonalne na podstawie racjonalnych przesłanek (zbiory faktów z przeszłości)
o zdroworozsądkowa na nosa, tak mi się wydaje; często wynika z doświadczenia
o naukowe fakty i tylko fakty
Naukowe to wiedza + metody, dowody.
Prognoza:
- Zbigniew Hellwig prognozą statystyczną nazywać będziemy każdy sąd, którego prawdziwość jest
zdarzeniem losowym, przy czym prawdopodobieństwo tego zdarzenia jest znane i wystarczająco duże dla
celów praktycznych
- Zbigniew Pawłowski wnioskowaniem w przyszłość na podstawie modelu będziemy nazywać predykcją,
natomiast konkretny wynik otrzymany na skutek zastosowanego wnioskowania nazywać będziemy
prognozÄ….
Ostatecznie przez prognozę będziemy rozumieć sąd o następujących właściwościach:
- Sformułowana z wykorzystaniem dorobku nauki
- odnoszące się do określonej przyszłości jest to sąd o stanie zmiennych, bądz zmiennej w przyszłości,
która jest określona explicite przez podanie momentu czasu (np. 30.06 przychód ze sprzedaży wyniesie
2mln zł), bądz implicite (np. Anna będzie dobrym lekarzem)
- Jest to sąd weryfikowalny empirycznie, prognoza jest sformułowana precyzyjnie oraz istnieje określony
czas w którym będzie sprawdzona
- Jest to sÄ…d niepewny, ale akceptowany (dopuszczalna/niedopuszczalna)
- Należy unikać stawiania prognoz banalnych (np. jutro będzie wtorek etc.)
Funkcje prognoz:
- preparacyjna prognozowanie jest działaniem, które przygotowuje inne działania
- aktywizująca ma za zadanie pobudzać do działania (prognozy ostrzegawcze)
- informacyjna
Rodzaje prognoz:
- ilościowe prognoza wyrażona jest liczbą (punktowe wielkość sprzedaży 2mln zł, lub przedziałowe, 2-
2,5mln zł)
- jakościowe najczęściej prognoza słownie opisana sytuacja (np. za 2 tygodnie kurs euro spadnie)
Ze względu na typ zmian zmiennej prognozowanej:
- krótkoterminowe na przedział czasu, w którym zachodzą tylko zmiany ilościowe
- średnioterminowe na przedział czasu, w którym zachodzą zmiany ilościowe, ale oczekuje się też zmian
jakościowych
- długookresowe zachodzą zmiany ilościowe i jakościowe, które też należy uwzględnić.
Podstawowe pojęcia prognozowania:
Dopuszczalność prognozy prognoza jest dopuszczalna, wówczas gdy obdarzona jest przez odbiorcę stopniem
zaufania uprawniającym do tego by mogła być wykorzystana do celu, dla którego była budowana. Jest określana w
tym samym momencie, w którym wyznacza się prognozę.
21
EKONOMETRIA Dr Stanisław Barczak
Maksymalny horyzont prognozy należy do przyszłości, najdalszy moment dla, którego prognoza jest
dopuszczalna.
Żądany horyzont prognozy odbiorca prognozy może życzyć sobie prognozy na dowolny moment czasu, przy
czym, nie może być ona zrealizowana w momencie gdy żądany horyzont jest dłuższy niż maksymalny.
Prognoza wygasła prognoza wyznaczona na taki moment, dla którego znana jest prawdziwa wartość zmiennej
prognozowanej (prognozy ex post).
Zmienna prognozowana Yt, zmienna endogeniczna, reprezentuje, obiekt, proces, zjawisko, które podlega
prognozowaniu.
Cechy danych wykorzystywanych do budowy prognoz:
1. Rzetelność dane są rzetelne gdy są zgodnie z przedmiotem, którego dotyczą
2. Jednoznaczność dane powinny być tak przedstawiane, by każdy odbierał je tak samo
3. Kompletność dane powinny obejmować wszystkie ważne i istotne dla celów badawczych informacje
4. Aktualność danych dla przyszłości czy pewne czynniki nie przestaną wpływać na Yt
5. Koszt zbierania i opracowywania danych
6. Porównywalność danych można je porównywać z punktu widzenia:
a. Czasu by między poszczególnymi realizacjami była ta sama przerwa (ten sam interwał)
b. Terytorium powinny dane pochodzić z tego samego terytorium
c. Stosowane pojęcia i kategorie dane powinny być podobnie konstruowane (ważne dla
wskazników makroekonomicznych)
d. Metody obliczeń dokładność, formuły obliczania agregatów
Prezentacja danych:
- szereg czasowy momentów wyraża poziom zjawiska w danym momencie (wielkość sprzedaży w latach
97-2002 stan na 31.12 moment pomiaru)
- szereg czasowy okresów wielkość sprzedaży pewnego wyrobu w pierwszej połowie 2002 (od...do...)
interwał pomiędzy danymi taki sam, w systemie pn-pt, uznaje się, że pt-pn taki sam jak wt-śr, czy śr-czw.
Święta, niedziele itp. prognozuje się odrębnie
Składowe szeregu czasowego:
" wahania przypadkowe
" trend
" stały/średni poziom
" wahania sezonowe (krótkookresowe)
" wahania cykliczne (długookresowe)
MODELE ADAPTACYJNE
Nie wymagają one szacowania, estymatorów, założeń, są one dobre dla krótkookresowych prognoz.
Cechy ogólne i zastosowanie:
- dostosowane do przebiegu procesu naśladowanie procesu
- budowa prognoz krótkookresowych
- prosta budowa
- możliwość sprawdzenia symulacji
- możliwość uwzględnienia wahań przypadkowych trendu oraz wahań sezonowych
Ogólna postać Yt = ·t + ut
Wady:
- trudność w ustaleniu początkowych wartości do symulacji
- strata informacji
- założenia o liniowości zmiennej prognozowanej w przyszłości
- postarzanie informacji
Symulacja w przypadku modeli adaptacyjnych, symulacja polega na takim dobrze parametrów wygładzania by
zminimalizować dowolnie wybrany błąd ex post.
22
EKONOMETRIA Dr Stanisław Barczak
Okres weryfikacji prognoz (ex post) jeżeli błąd 5% to zakładamy, że w przyszłości też 5% (na podstawie danych +
prognoz).
Ex ante ex post + odcinek uwzględniający przyszłość, im dalej tym większy błąd.
Model wyrównywania wykładniczego Browna:
Zastosowania:
- zmienna prognozowana wykazuje trend oraz wahania przypadkowe
Wady:
- strata informacji, problem z doborem wartości początkowych
Zalety:
- łatwość prowadzenia obliczeń
- nie trzeba stosować długich szeregów czasowych (40, min. ilość to 8-12)
Wyłącznie dla prognoz krótkookresowych.
Postać modelu oraz trendu na moment t: m1 = ąy1 + (1 - ą) mt-1
mt-1- ocena trendu na moment poprzedni (t-1).
ą parametr wygładzania (przyjmuje wartości od 0 do 1) zakładamy go a priori, im bliższy 1, tym szybciej model
reaguje.
y1 zmienna prognozowana
Jeżeli proces jest niestabilny w czasie (szybkie zmiany, nieregularne) to ą bliżej 1.
Jeżeli proces jest stabilny w czasie (nie wykazuje radykalnych zmian) to ą bliżej 0.
Równanie prognozy w tym modelu: YTp = mt + (mt mt-1)n
n- zakładany z góry horyzont prognozy
z okresu na okres n=1. Jeden punkt w przyszłość n=1, drugi n=2.
n - daje nam wyprzedzenie czasowe.
Nie uwzględniamy czynników kształtujących Y.
Wartości początkowe do symulacji:
m1 = yt lub m1 = śr.y
Model Holta, postać klasyczna:
Zastosowanie:
- zmienne prognozowane wykazujÄ… trend oraz wahania przypadkowe
Wady:
- strata informacji, problem z doborem wartości początkowych
Zalety:
- łatwość prowadzenia obliczeń
- krótki szereg czasowy (40 obserwacji, min 12)
Ocena trendu: Ft-1 = Ä…yt-1 + (1-Ä…)(Ft-2 + St-2)
yt-1 realizacja zmiennej prognozowanej na okres t-1 (poprzedni).
St-2 ocena przyrostu trendu na okres t-2.
ą - parametr wygładzania
Wyznaczenie wartoÅ›ci przyrostu trendu: St-1 = ²(Ft-1 Ft-2) + (1 - ²)St-2
Ä…,² - parametry wygÅ‚adzania przyjmujÄ… wartoÅ›ci od 0 do 1.
Równanie prognozy: YTp = Fn Sn(t n); gdzie t > n t n wyprzedzenie czasowe;
n horyzont prognozy.
Wartości początkowe do symulacji:
F1 = Y1 lub
Yt = a1t + a0 + ut
a1 mówi o przeciętnych zmianach z okresu na okres i pokazuje kierunek (+/-)
a0 mówi o tym co było w okresie poprzedzającym okres weryfikacji.
F1 = a0
S1 = y2 y1
S1 = a1t
23
EKONOMETRIA Dr Stanisław Barczak
Model Holta z trendem hiperbolicznym gasnÄ…cym
Ocena trendu: Ft-1 = Ä…yt-2 + (1 - Ä…) (Ft-2 + St-2)Õ
Parametr Õ - odpowiedzialny za gasnÄ…cy trend;
Parametry wygładzania przyjmują wartości od 0 do 1.
t-n
i
Równanie prognozy: YTp = Fn + Sn ; gdzie t > n
"Õ
i=1
Model Wintersa postać addytywna (ze stałą amplitudą wahań)
Zastosowanie:
- w przypadku szeregów czasowych zawierających tendencję rozwojową, wahania przypadkowe oraz
wahania cykliczne
Wady:
- strata informacji, problem z doborem wartości początkowych
Zalety:
- łatwość prowadzenia obliczeń
- krótki szereg czasowy (40 obserwacji, min 12)
Ocena trendu: Ft-1 = Ä…(yt-1 Ct-1-r) + (1 - Ä…)(Ft-2 St-2)
C ocena wskaznika sezonowości na moment t-1-r
R liczba faz cyklu, określany z góry
Wyrównanie wartoÅ›ci przyrostu trendu: St-1 = ²(Ft-1 Ft-2) + (1 - ²)St-2
Ocena wskaznika sezonowości Ct-1 = ł(yt-1 Ft-1) + (1 + ł) Ct-1-r ł - parametr wygładzania
Wartości początkowe do symulacji:
F1 = yt lub F1 = śr.y
S1 = y2 y1
C1 = śr."yt - średnia arytmetyczna z pierwszych różnić Y.
"yt = yt yt-1
Równanie prognozy jako: YTp = Fn + Sn(t n) + Ct-r t > n
Horyzont prognozy = r.
Postać multiplikatywna modelu:
yt1
Ocena trendu: Ft-1 = Ä… × + (1+ Ä…) + (Ft-2 + St-2 )
Ct-1-r
Wyrównana wartość przyrostu trendu: St-1 = ²(Ft-1 Ft-2) + (1 - ²)St-2
yt-1
Ocena wskaznika sezonowoÅ›ci: Ct-1 = Å‚ × + (1- Å‚ ) × Ct-1-r
Ft-1
Prognoza: YTp = [Pn + Sn(t n)]Ct-r t > n r maksymalny horyzont czasowy.
Ustalenie parametrów wygładzania:
- parametry bliskie jedności, w przypadku gdy wszystkie składowe szeregu czasowego (trend, wahania
sezonowe, wahania cykliczne) zmieniajÄ… siÄ™ szybko
- parametry bliższe zeru w przypadku gdy wszystkie składowe zmieniają się wolno
Minimalizacja ze względu na średni względny błąd prognoz ex post:
m
yt - yTp
1
È = × ×100
"
m yt
t=1
24
EKONOMETRIA Dr Stanisław Barczak
LINIOWA FUNKCJA TRENDU
Prognozowanie na podstawie funkcji trendu modele rozwojowe.
Przyjmujemy, że poszukiwana funkcja trendu ma postać liniową.
F(t) = Ä…0 + ²1+t
Jest modelem dynamicznym. Zmienne nielosowe.
Model szeregu czasowego:
Yt = Ä…o + Ä…1t + ¾t
Yt zmienna prognozowana
Ä…0 parametr wolny
Ä…1t parametr przy zmiennej czasowej
¾t skÅ‚adnik losowy
W szeregu czasowym dane są ułożone chronologicznie, może on być: wielowymiarowy lub jednowymiarowy (1
zmienna prognozowana).
Dzielą się na szeregi czasowe momentów i szeregi czasowe okresów.
1. Wszystkie realizacje powinny być w tej samej jednostce.
2. Wszystkie realizacje powinny być z tego samego obszaru terytorialnego.
3. Jeśli istnieją luki informacyjne, powinniśmy uzupełnić te dane, albo z innych zródeł, albo metodami
statystycznymi/ekonometrycznymi.
Szacowanie za pomocÄ… MNK funkcja kryterium w postaci:
2
n
_
Õ = yt - yt öÅ‚ minumum
ìÅ‚ ÷Å‚
"ëÅ‚
íÅ‚ Å‚Å‚
t=1
Rozwiązaniem układu równań normalnych względem parametrów jest:
n
_ _
"(t - t) × (yt - y)
t=1
ą0 = śr.y ą1śr.t ą1 =
n
_
"(t - t)2
t=1
Wynik oszacowania parametrów modeli: yt = ą0 + ą1t + ut prognozy ex post trend prognozy wygasłej.
ut = yt y*t
Modele dynamiczne uwzględniają upływ czasu.
Postać macierzowa modelu jest następująca:
y = XÄ… + ¾
gdzie:
y1 1 1 ¾1
îÅ‚ Å‚Å‚ îÅ‚ Å‚Å‚ îÅ‚ Å‚Å‚
ïÅ‚y śł ïÅ‚1 2śł îÅ‚Ä…0 Å‚Å‚ ïÅ‚¾ śł
2 2
ïÅ‚ śł ïÅ‚ śł ïÅ‚ śł
y = X = Ä… = ¾ =
ïÅ‚Ä… śł
ïÅ‚ śł ïÅ‚ śł ïÅ‚ śł
... ... ... ...
ðÅ‚ 1 ûÅ‚
ïÅ‚y śł ïÅ‚1 nśł ïÅ‚¾ śł
ðÅ‚ n ûÅ‚ ðÅ‚ ûÅ‚ ðÅ‚ n ûÅ‚
Wektor ocen parametrów strukturalnych dany jako:
a = (X X)-1 X Y
n n
îÅ‚ Å‚Å‚ îÅ‚
yt n
" "t Å‚Å‚
ïÅ‚ śł ïÅ‚ śł
a0
îÅ‚ Å‚Å‚
t=1 t=1
X 'Y = ïÅ‚ śł X ' X = ïÅ‚ śł a =
n n n ïÅ‚a śł
2
ïÅ‚ śł ïÅ‚
ðÅ‚ 1 ûÅ‚
"tyt "t "t śł
ïÅ‚ śł ïÅ‚ śł
ðÅ‚ t=1 ûÅ‚ ðÅ‚ t=1 t=1 ûÅ‚
przy czym det (X X) `" 0
Weryfikacja modelu
Wariancja resztowa:
25
EKONOMETRIA Dr Stanisław Barczak
n
1
2
Su2 = × - y *t ) stÄ…d odchylenie standardowe reszt dane jest: Su = Su2
"(yt
n - k
t=1
Średnie błędy szacunku, czyli macierz wariancji i kowariancji:
D2(a) Su2(X X)-1
n
2
Su2 ×
"t
Su2
t=1
D(a0 ) = D(a1) =
n
_
2
n
_
n × - t)2
"(t
ìÅ‚ ÷Å‚
"ëÅ‚t - t öÅ‚
t=1
íÅ‚ Å‚Å‚
t=1
Współczynnik zbieżności:
n
2
- y *t )
"(yt
2 t=1
Õ =
2
n
_
ìÅ‚ ÷Å‚
"ëÅ‚ yt - yöÅ‚
íÅ‚ Å‚Å‚
t=1
Ć2 = [0,1]
Współczynnik determinacji:
R2 = 1 Ć2
Prognoza punktowa dana jest jako:
T = przyszły punkt w przyszłości, horyzont prognozy.
0
P
yT = [1T]îÅ‚a Å‚Å‚ = a0 + a1T
ïÅ‚a śł
ðÅ‚ 1 ûÅ‚
Średni błąd predykcji dany jest jako: (prognoza ex ante) przyjmuje on jednostki zmiennej prognozowanej
X T kolumnowy wektor przyszłych realizacji zmiennych objaśniających
D^(a) macierz wariancji, kowariancji
Su^ - wariancje resztowe
V = X 'T ×D2 (a) × XT + Su2
Uwzględniony średni błąd predykcji dany jest jako:
V
V* = ×100 - okreÅ›la on dopuszczalność prognozy.
P
yT
Prognoza przedziałowa budowana wokół prognozy punktowej:
P(yPT uV < yT < yPT + uV) = Å‚T
łT wiarygodność predykcji
yT wartość zmiennej prognozowanej w jednostce czasu T
uV współczynnik związany z wiarygodnością prognozy, rozkładem zmiennej prognozowanej oraz długością
przedziału czasowego próby.
Przykład
Na podstawie danych o bezrobociu w Polsce w tablicy oszacować funkcję trendu w postaci:
Yt = a0 + a1t + ¾t
Lata 95 96 97 98 99 00 01 02
Yt 67,1 62,1 73,7 80,6 82 87,8 106 97,6
trend 62,25 87,93 73,6 79,28 84,95 90,63 96,3 101,98
26
EKONOMETRIA Dr Stanisław Barczak
Dane wejściowe w postaci wektora:
67,1
îÅ‚ Å‚Å‚
ïÅ‚ śł
y = ...
ïÅ‚ śł
ïÅ‚
ðÅ‚97,6śł
ûÅ‚
Parametr wolny & czas:
1 1
îÅ‚ Å‚Å‚
ïÅ‚1 2śł
ïÅ‚ śł
ïÅ‚ śł
1 3
ïÅ‚ śł
ïÅ‚1 4śł tII wyskalowanie czasu, te same odlegÅ‚oÅ›ci i suma równa do 0.
X =
ïÅ‚1 5śł
ïÅ‚ śł
ïÅ‚1 6śł
ïÅ‚1 7śł
ïÅ‚ śł
ïÅ‚ śł
ðÅ‚1 8ûÅ‚
Yt 10 15 13 11 15 16
tI 1 2 3 4 5 6
tII -2,5 -1,5 -0,5 0,5 1,5 2,5
Dla nieparzystej ilości danych by było 2 | 1 | 0 | 1 | 2 etc.
Stosując formułę na wektor. a = (X X)-1 X y
1 1 1 1 1 1 1 1 8 36 0,607 - 0,107
îÅ‚ Å‚Å‚ îÅ‚ Å‚Å‚ îÅ‚ Å‚Å‚
X '=
ïÅ‚1 2 3 4 5 6 7 8śł X ' X = ïÅ‚36 204śł (X ' X )-1 = ïÅ‚
ðÅ‚ ûÅ‚ ðÅ‚ ûÅ‚ ðÅ‚- 0,107 0,0238śł
ûÅ‚
656,9 56,575
îÅ‚ Å‚Å‚ îÅ‚ Å‚Å‚
X y = a =
ïÅ‚3194,4śł ïÅ‚ śł
5,675
ðÅ‚ ûÅ‚ ðÅ‚ ûÅ‚
Model po szacowaniu Yt = 56,575 + 5,675 + ut
(4,3747) (0,8663)
Interpretacja parametrów:
- wolny w roku 1994 poziom bezrobocia w Polsce wyniósł 56,575 tysięcy osób (dot 1 okresu)
- przy zmiennej czasowej w latach 95 02 bezrobocie w Polsce wzrosło z roku na rok średnio rzecz biorąc
o 5,675 tys osób.
Wartości teoretyczne bezrobocia:
Y1 = 56,575 + 5,675*1 = 62,25
Y8 = 56,575 + 5,675*8 = 101,975
Miary struktury stochastycznej:
Su2 = 31,52 (tys.2)
Su2 = 5,614 tys
n = 8; k =2
_
Y 82,115 [tys] przeciętny poziom bezrobocia.
Dopasowanie modelu do danych empirycznych
Åš = 12,26% R2 = 87,74%
Prognoza punktowa na rok 2003 t=9 Y9 = 56,575 + 5,675*9 = 107,65 tys.
Średni błąd predykcji:
1
îÅ‚ Å‚Å‚
Xt =
ïÅ‚9śł
ðÅ‚ ûÅ‚
27
EKONOMETRIA Dr Stanisław Barczak
1 przyszła realizacja ślepej zmiennej (zawsze 1)
9 przyszła realizacja zmiennej czasowej.
V = 7,1176 tys
V* = 6,61%
Prognoza przedziałowa n-k = 6 (6 stopni swobody)
Ä… = 0,05 tÄ… = 2,447 testujemy t-studenta
107,65 2,447*7,1176 < yt < 107,65 + 2447*7,1176
90,2332 < yt < 125,0668
Ulega zmianie wraz ze wzrostem horyzontu czasowego średni błąd predykcji wrasta.
METODA TRENDÓW JEDNOIMIENNYCH OKRESOWYCH
Metoda polega na oszacowaniu parametrów analitycznych funkcji trendu oddzielnie dla poszczególnych faz cyklu.
Prognoza otrzymana jest przez ekstrapolację oszacowanej funkcji trendu dla każdej fazy cyklu. Przyjmijmy, że
szereg czasowy składa się z n obserwacji. Szereg czasowy należy podzielić na m szeregów czasowych
odnoszÄ…cych siÄ™ do tej samej fazy cyklu.
ylj = fj(l) + ¾lj
fj funkcja trendu dla j-tej fazy trendu
ylj wartość szeregu czasowego w l-tym cyklu (l = 1,2,... n)
¾lj skÅ‚adnik losowy
W metodzie trendów jednoimiennych okresów dla każdej fazy cyklu najczęściej wybierana jest postać liniowa
funkcji trendu.
Ostatecznie mamy:
ylj = Ä…oj + Ä…lj + ¾lj (l = 1, ... n) (j = 1, ... m)
gdzie Ä… parametry strukturalne j-tej liniowej funkcji trendu.
Przykład:
Lata 1999 2000 2001 2002
Kwartały I II III IV I II III IV I II III IV I II III IV
Yt 7 10 13 15 6 9 14 15 6 8 13 15 7 9 11 14
Yt przewozy ładunków w mln. Ton
Wyjściowy szereg czasowy dzielimy na m = 4
Szeregi czasowe jednoimiennych okresów:
1999 II 10 1
1999 I 7 1
2000 II 9 2
2000 I 6 2
2001 II 8 3
2001 I 6 3
2002 II 9 4
2002 I 7 4
1999 IV 15 1
1999 III 13 1
2000 IV 15 2
2000 III 14 2
2001 IV 15 3
2001 III 13 3
2002 IV 14 4
2002 III 11 4
28
EKONOMETRIA Dr Stanisław Barczak
Dla każdego szeregu czasowego szacujemy model o:
yt = Ä…1t + Ä…0 + ¾t
Każdy model szacujem wg formuły: a = (X X)-1 * X Y
11
îÅ‚ Å‚Å‚
ïÅ‚21śł
30 10 0,2
îÅ‚ Å‚Å‚ îÅ‚ - 0,5
Å‚Å‚
ïÅ‚ śł
Macierz X zawsze będzie: X = X ' X = (X ' X )-1 =
ïÅ‚10 4 śł ïÅ‚ śł
ïÅ‚ śł
31
ðÅ‚ ûÅ‚ ðÅ‚- 0,5 1,5 ûÅ‚
ïÅ‚41śł
ðÅ‚ ûÅ‚
Pierwszy model I-kwartał:
7
îÅ‚ Å‚Å‚
ïÅ‚6śł
65 0
îÅ‚ Å‚Å‚ îÅ‚ Å‚Å‚
ïÅ‚ śł
Y = X 'Y = Ä… =
ïÅ‚26śł ïÅ‚6,5śł
ïÅ‚ śł
6
ðÅ‚ ûÅ‚ ðÅ‚ ûÅ‚
ïÅ‚7śł
ðÅ‚ ûÅ‚
Model można zapisać jako:
Y*t = 0t + 6,5 + Ut
Y*t = 6,5 + Ut
Drugi model II-kwartał
10
îÅ‚ Å‚Å‚
ïÅ‚ śł
9 88
îÅ‚ Å‚Å‚ îÅ‚- 0,4
Å‚Å‚
ïÅ‚ śł
Y = X 'Y = Ä… =
ïÅ‚36śł ïÅ‚ śł
ïÅ‚ śł
8 10
ðÅ‚ ûÅ‚ ðÅ‚ ûÅ‚
ïÅ‚ śł
9
ðÅ‚ ûÅ‚
Y*t = -0,4t + 10 + Ut
Trzeci model III-kwartał
13
îÅ‚ Å‚Å‚
ïÅ‚14śł
124
îÅ‚ Å‚Å‚ îÅ‚- 0,7
Å‚Å‚
ïÅ‚ śł
Y = X 'Y = Ä… =
ïÅ‚ śł ïÅ‚14,5 śł
ïÅ‚ śł
13 51
ðÅ‚ ûÅ‚ ðÅ‚ ûÅ‚
ïÅ‚11śł
ðÅ‚ ûÅ‚
Y*t = -0,7t + 14,5 + Ut
Czwaty model IV-kwartał
15
îÅ‚ Å‚Å‚
ïÅ‚15śł
146
îÅ‚ Å‚Å‚ îÅ‚- 0,3
Å‚Å‚
ïÅ‚ śł
Y = X 'Y = Ä… =
ïÅ‚ śł ïÅ‚15,5 śł
ïÅ‚ śł
15 59
ðÅ‚ ûÅ‚ ðÅ‚ ûÅ‚
ïÅ‚14śł
ðÅ‚ ûÅ‚
Y*t = -0,3t + 15,5 + Ut
Analiza uzyskanych wyników
Su2 = 0,5 Su = 0,7071
0,1 - 0,25
îÅ‚ Å‚Å‚
D2 (a) = D(a1) = 0,3162 D(a2) = 0,866
ïÅ‚ śł
ðÅ‚- 0,25 0,75 ûÅ‚
Y*t = 6,5 + Ut
(0,866)
Y = 6,5 Ć2 = 100% R2 = 0%
29
EKONOMETRIA Dr Stanisław Barczak
Prognoza na 1-szy kwartał 2003 wynosi 6,5mln ton.
Średni błąd predykcji:
5
îÅ‚ Å‚Å‚
XT = X TD2(a) = [0,25 -0,5]
ïÅ‚1śł
ðÅ‚ ûÅ‚
gdzie 5 to przyszła realizacja zmiennej czasowej, a 1 stała, ślepa zmienna
XT D2(a)XT = 0,75
V wyliczane ze wzoru (poprzedni wykład)
V2 = 1,25
V=1,118
Åšrednio rzecz biorÄ…c odchyla siÄ™ o +/- 1,118 mln ton od postawionej prognozy
Względny błąd predykcji V* = 17,2%
V* = V/YTP * 100%
Kwartał II
Su2 = 0,6 Su = 0,7745 D(a1) = 0,3464 D(a0) = 0,9486
Ć2 = 60% R2 = 40% YTP = 8 V = 1,2247 V* = 15,31%
Kwartał III
Su2 = 1,15 Su = 1,0723 D(a1) = 0,4975 D(a0) = 1,3133
Ć2 = 48,42% R2 = 51,58% YTP = 11,7 V = 1,6955 V* = 14,49%
Kwartał IV
Su2 = 0,15 Su = 0,3872 D(a1) = 0,1732 D(a0) = 0,4743
Ć2 = 40% R2 = 60% YTP = 14 V = 0,9123 V* = 4,37%
Zalety metody trendów jednoimiennych okresów:
+ horyzontem są 4 kwartały w przyszłości i nie są obciążone błędem, we wszystkich 4 kwartałach najniższe z
możliwych błędów
+ szacujemy tylko i wyłącznie trendy liniowe
+ służy prognozowaniu, gdy zmiana prognoz wykazuje zmiany sezonowe
+ nie musimy wprowadzać zmiennych naśladujących sezonowość
Wady:
- wymagana duża ilość obserwacji w szeregu czasowym
- czasami jest dużym przybliżeniem, trend mało elastyczny
MODEL KLEINA
Model ze zmiennymi zerojedynkowymi.
Gdy zmienna wykazuje trend, wahania sezonowe i przypadkowe, z addytywnym przebiegiem sezonowości. Do
wyodrębnienia wahań sezonowych można wykorzystać zmienne zerojedynkowe (naśladujące).
m odległość cyklu wahań
Do modelu wprowadzamy m zmiennych zerojedynkowych czyli V1t, V2t...Vmt wprowadzenie zmiennej
naśladującej wymaga wprowadzenia parametru strukturalnego.
Yt = f(t) + ²1V1t + ²2V2t + ... +²mVmt + ¾t
Z parametrem ² odpowiadajÄ… za sezonowość.
Z definicji addytywnych wahań sezonowych wynika że:
m m-1
= 0 => ²m = -
"²i "²i
i=1 i=1
WprowadzajÄ…c ²m do modelu otrzymamy jego nastÄ™pujÄ…cÄ… postać. Model ten nie ma zastosowania dla trendów
nieliniowych.
Yt = f(t) + ²1(V1t-Vmt) + ²2(V2t-Vmt) ... + ²m-1(Vm-1t Vmt) + ¾t
30
EKONOMETRIA Dr Stanisław Barczak
Parametry ²i informujÄ… o ile Å›rednio rzecz biorÄ…c w i-tym okresie cykle wahaÅ„ poziomów zjawiska różni siÄ™ od
poziomu wynikającego z ogólnej tendencji rozwojowej.
Przykład:
95 96 97 98
I II I II I II I
Yt 20 40 30 60 50 80 70
t -3 -2 -1 0 1 2 3
(V1-V2) 1 -1 1 -1 1 -1 1
T sumujÄ…ce siÄ™ do 0 lepsze dla liczenia na piechotÄ™
V1t => I połowa 1; II połowa 0 V2t => I połowa 0; II połowa 1
Model:
Yt = Ä…1 + ²1(V1t-V2t) + Ä…0 + ¾t
Model szacujemy MNK:
îÅ‚- 3 1 1 20
Å‚Å‚ îÅ‚ Å‚Å‚
ïÅ‚ ïÅ‚40śł
ïÅ‚- 2 -1 1śł ïÅ‚ śł
śł
8,93
ïÅ‚-1 1 1 30
śł ïÅ‚ śł îÅ‚ Å‚Å‚
ïÅ‚
ïÅ‚ ïÅ‚60śł
a = 8,75śł
X = 0 -1 1śł Y =
ïÅ‚- śł
ïÅ‚ śł ïÅ‚ śł
ïÅ‚ ðÅ‚ ûÅ‚
1 1 1śł ïÅ‚50śł ïÅ‚ 51,25 śł
ïÅ‚ śł ïÅ‚ śł
2 -1 1śł ïÅ‚80śł
ïÅ‚
ïÅ‚
3 1 1śł ïÅ‚70śł
ðÅ‚ ûÅ‚ ðÅ‚ ûÅ‚
Y*t = 8,93t 8,75 (V1t V2t) + 51,25 + ut lub Y*t = 8,93t 8,75V1t + 8,75V2t + 51,25 + ut
W latach 95-98 rozpatrywany proces wzrastał z półrocza na półrocze średnio rzecz biorąc o 8,93
W drugim półroczu roku 94 przeciętny poziom rozpatrywanego procesu wynosił 51,25.
W rozpatrywanym okresie odchylenie od trendu wynosiło 8,75 w pierwszych półroczach oraz 8,75 w drugich
półroczach.
Wartość teoretyczna modelu
Y*1 = 15,71 => 8,93(-3) 8,57(1) + 51,25
Y*2 = 42,14 => 8,93(-2) 8,75 (-1) + 51,25
Y*3 = 33,57 Y*4 = 60 Y*5 = 51,43 Y*6 = 77,86 Y*7 = 69,28
Suma u2 = 42,857
n = 7; k = 3; S2u = 10,71; su = 3,27
0,38
îÅ‚ Å‚Å‚
D(a1) = 0,62 D(²) = 1,25 D(a0) = 1,25
ïÅ‚
D2 (a) = 1,56 - 0,22śł
ïÅ‚ śł
ïÅ‚ - 0,22 1,56 śł
ðÅ‚ ûÅ‚
Åšr.Y = 50
Suma(Yt śr.Y)2 = 2800
Ć2 = 1,53% (= 42,85/2800) R2 = 98,47%
prognoza na drugie półrocze 98 t=4, V1-V2 = -1 YTP = 8,93(4) 8,75(-1) + 51,25 = 95,71
Średni błąd predykcji:
4
îÅ‚ Å‚Å‚
ïÅ‚ śł V = 4,5175 V* = 4,72%
XT =
ïÅ‚-1śł
ïÅ‚ śł
1
ðÅ‚ ûÅ‚
Wady:
- tego typu modele są nieelastyczne, co generuje błędy
Zalety:
+ prosty w szacowaniu i identyfikacji
31
EKONOMETRIA Dr Stanisław Barczak
PROGNOZOWANIE NA PODSTAWIE MODELU EKONOMETRYCZNEGO
Zgromadzono następujące dane:
Yt zgony niemowląt na 1000 urodzeń żywych
X1t spożycie wódki czystej i gatunkowej w przeliczeniu na alkohol 100% w litrach na osobę w ciągu roku
X2t PKB na jednego mieszkańca w $
Lata 1992 1993 1994 1995 1996 1997 1998 1999 2000
Yt 17,3 16,1 15,1 13,6 12,2 10,2 9,5 8,9 8,1
X1t 3,5 3,8 3,8 3,5 2,9 2,8 2,4 2,1 2,0
X2t 2198 2233 2402 3293 3724 3725 4098 4014 4078
Oszacowano model:
Y*t 1,79X1t 0,0026X2t + 15,46 + ut
(1,048) (0,00913) (5,998)
Budujemy prognozÄ™ na 2001.
Miary struktury stochastycznej.
N = 9; k = 3l Su2 = 0,796954 Su = 0,892723
Istotność parametrów strukturalnych test t-studenta. ą = 0,2 tą = 1,415
tÄ…1 = 1,7118
tÄ…2 = 2,8073
Obie zmienne wchodzÄ… do modelu
1,098 0,0008 - 6,134
îÅ‚ Å‚Å‚
ïÅ‚0,0008 0,0000008 - 0,005śł
D2 (a) =
ïÅ‚ śł
ïÅ‚- 6,134 - 0,005 35,986 śł
ðÅ‚ ûÅ‚
Ć2 = 5,29% R2 = 94,71% Vs = 7,24%
Autokorelacja n = 9; k = 2
H0:r1 = 0
H1:r1< 0
DW = 2,08 DW = 1,92
Jeżeli DW > 2 to hipotezę alternatywną j/w; jeśli < 2 to odwrotnie znak większości.
dl = 0,629 du = 1,699
DW > du brak podstaw do odrzucenia H0. Brak istotnie ujemnej autokorelacji.
Budujemy prognozÄ™.
Prognozy przyszłych wartości zmiennych objaśniających budowane będą na podstawie modeli tendencji
rozwojowych o postaci liniowej.
Prognoza zmiennej X1t
X1t = Ytx1t => Ytx1t = Ä…1t + Ä…0 + ¾t t = 1...9
Y*tx1t = -0,24t + 4,19 + ut R2 = 89%
(0,032) (0,18)
Prognoza dla t=10 YTPx1t=10 = 1,79 (prognoza X1t dla roku 2001)
Prognoza zmiennej X2t
X2t = Ytz2t => Ytx2t = Ä…1t + Ä…0 + ¾t t = 1...9
Y*tx2t = 278,12t + 1916,64 + ut R2 = 88%
(38,74) (217,98)
Prognoza dla t=10 YTPx2t=10 = 4697,84 (prognoza X2t dla roku 2001)
Podstawiamy realizacje do modelu:
Y*TP=2001 = 1,79 * 1,79 0,0026 * 4697,84 + 16,46 = 6,64
32
EKONOMETRIA Dr Stanisław Barczak
1,79
îÅ‚ Å‚Å‚
ïÅ‚4697,84śł
=> V = 1,08962; czyli mylimy siÄ™ +/- 1 zgon.
XT =
ïÅ‚ śł
ïÅ‚ śł
1
ðÅ‚ ûÅ‚
Względny średni błąd predykcji V* = 16,41%
W roku 2001 faktycznie było 7,7 zgonów niemowląt (wg naszych prognoz 6,64).
Trafność prognozy Yt YTP = -1,06
Błędy ex-post. Współczynnik Theila
- yTP )2
"(yt
t"Iep
2
I =
Współczynnik rozbieżności Theila przybiera wartości równe zeru w przypadku gdy
yt2
"
t"Iep
predykcja jest idealnie dokładna.
2
I = I
Pierwiastek kwadratowy współczynnika Theila informuje jaki był przeciętny względny błąd prognozy w okresie
weryfikacji prognoz bez względu na to co było tego przyczyną.
I2 = I21 + I22 + I23 można całość podzielić przez I2 i wtedy współczynniki sumują się do 0 i można określić jaki
jest udział poszczególnego we współczynniku I2.
_ _
- yTP )2
"(yt
t"Iep
I12 = m wielkości sparowane . Wygasłe prognozy + rzeczywiste.
1
× yt2
"
m
t"Iep
m tyle ile jest tych par.
Mierzy czy predykcja jest rzeczywiście nieobciążona. W przypadku spełnienia tego warunku licznik równy jest 0.
"(S - SP )2
t"Iep
I2 2 =
1
× yt2
"
m
t"Iep
S odchylenie standardowe zmiennej prognozowanej
SP odchylenie standardowe prognoz wygasłych
Służy do badania na ile estatyczność predykcji była dostosowana do rzeczywistych wahań zmiennej prognozowanej
czy wahania zostały przewidziane.
2 × S × SP × (1- r)
I3 2 = r współczynnik korelacji
1
× yt2
"
m
t"Iep
Oparty o współczynnik korelacji
Informuje o błędach wynikających z niedostatecznej zgodności kierunku zmian prognoz, ze zmianami kierunku
zmiennej prognozowanej
_ _
1 1
y = yt yTP = yTP - średnia z prognoz wygasłych (ex post).
" "
m m
t"Iep t"Iep
33
EKONOMETRIA Dr Stanisław Barczak
_ _
1 1
S = - yt )2 SP = - yTP )2 - odchylenie standardowe prognoz
"(yt "(yTP
m m
t"Iep t"Iep
_ _
1
- yt ) × (yTP - yTP )
"(yt
m
t"Iep
r = - współczynnik korelacji liniowej między zmienną prognozowaną, a
SPS
prognozami.
Oszacowany model tendencji rozwojowej:
Yt = -0,24t + 4,19 + ut
Współczynnik Theila
śr.Yt = 2,97 śr.YTP = 2,97
S = 0,6662 SP = 0,6282
V = 0,9429
I2 = 0,005285 I 0,07269
I21 = 0,00000000000000000000000000000000218 = 0
I22 = 0,000155
I23 = 0,005129 <= największe zagrożenie dla nas to ten błąd.
Nie należy prognozować w oparciu o 1 model lub 1 błąd.
MODELE ZE ZMIENNYMI NAÅšLADUJCYMI
Uwagi wstępne
Granger oraz Mansfield wykazali możliwość przewidywania zmian koniunktury na podstawie wcześniejszych zmian
zachodzÄ…cych w pewnej klasie zmiennych nazywanych zmiennymi wiodÄ…cymi.
Typy zmiennych:
Zmienne wiodące charakteryzują się określonymi zmianami swoich wartości, zachodzącymi wcześniej niż miary
wartości innej grupy zmiennych, które określa się jako zmienne naśladujące.
Zmienne naśladujące naśladują z pewnym opóznieniem zmiany zachodzące w wartości zmiennych wiodących.
Znalezienie (identyfikacja) zmiennej wiodącej umożliwi budowę prognozy zmiennej naśladującej.
Warunek budowy prognozy:
podstawowym warunkiem budowy prognozy jest duże podobieństwo kształtowania się wartości obu zmiennych w
czasie
przy budowie prognoz oprócz podobieństwa zmiennych należy uwzględnić następujące opóznienia w czasie
Podobieństwo i opóznienia w czasie (p) [brak cykliczności]
Do pomiaru podobieństwa oraz wyznaczania wielkości opóznienia w czasie (p) można zastosować współczynniki
korelacji liniowej. Opóznienie zależy od szeregu czasowego.
Podobieństwo i opóznienie w czasie (p) [istnieje cykliczność]
W przypadkach występowania wahań cyklicznych (w szeregu czasowym obu zmiennych opóznienie w czasie (p)
może być wyznaczone jako liczba jednostek czasu dzieląca okres o najwyższej/najniższej wartości) wartości
zmiennej wiodącej w danym cyklu od okresu o najwyższej/najniższej wartości zmiennej naśladującej w jej
rozpatrywaniu.
Podobieństwo i opóznienie w czasie [istnieje cykliczność]
p = tmaxY tmaxX lub p = tminY tminX
p opóznienie
tmaxX numer okresu o najwyższej wartości zmiennej wiodącej
tmaxY numer okresu o najwyższej wartości zmiennej naśladującej
tminX numer okresu o najniższej wartości zmiennej wiodącej
34
EKONOMETRIA Dr Stanisław Barczak
tminY numer okresu o najniższej wartości zmiennej naśladującej
Gdy w szeregach czasowych obu zmiennych następuje więcej niż 1 cykl wówczas opóznienie może być wyznaczone
jako średnia arytmetyczna lub mediana opóznień obliczanych dla poszczególnych cykli.
Uwaga!: daje czasami błędne rezultaty
RozwiÄ…zanie przynoszÄ…ce lepsze wyniki to:
Określenie wielkości opóznienie na podstawie współczynników korelacji.
Polega na obliczeniu wartości współczynnika korelacji dla różnych opóznień czasowych i wyborze tego opóznienia
dla którego wartość współczynnika korelacji jest najwyższa.
Przykłady zmiennych wiodących:
barometr koniunktury całej gospodarki lub branży może stanowić zmienną wiodącą dla budowy prognoz sprzedaży
niektórych produktów
indeks siły nabywczej publikowany w USA, zawiera on informacje dotyczące oceny zmiany zaludnienia, dochodów
ludności, sprzedaży detalicznej oraz kompleksowy szacunek wielkości popytu
rynek samochodów, na którym zmienną wiodącą są dochody ludności, zmienna ta często wykazywana jest przez
producentów samochodów i ma za zadanie określić przyszły popyt poprzez pryzmat wcześniejszej sytuacji
finansowej konsumentów
liczba narodzin dzieci, liczba dzieci w wieku szkolnym, liczba dzieci w wieku przedszkolnym, mogą one stanowić
zbiór zmiennych wiodących dla prognoz przyszłego popytu na produkty skierowane do dzieci
Budowa prognozy zmiennej prognozowanej (naśladującej)
Dane jest opóznienie czasowe między zmienną prognozowaną, a zmienną wiodącą.
"Ytt+1 względna zmiana (wzrost/spadek) wartości zmiennej prognozowanej w okresie t+1 w porównaniu z
okresem t.
yt+1 - yt
"Ytt+1 =
yt
"Xt-pt+1-p względna zmienna (wzrost/spadek) wartości zmiennej wiodącej X w okresie t+1-p w porównaniu do
okresu t-p
xt+1- p - xt- p
t+1- p
"X =
t- p
yt- p
____
n
"y1 - średnia bezwzględnych wartości "ytt+1 w n przyszłych okresach.
______ ______
n
"x1-- p - średnia z bezwzględnych wartości "xtn+1- p w n przyszłych okresów.
p - p
W okresie prognozy t+1 > n; będzie zachodziła w przybliżeniu następująca równość.
__
n
"ytt+1 "y1
H"
"xtt+1- p __
n
- p
"x1-- p
p
lub
(yt+1 - yt )
__
n
yt "y1
H"
__
(xt+1- p - xt- p )
n
"x1-- p
p
xt- p
Po dokonaniu odpowiednich przekształceń prognoza na okres t+1 będzie dana jako:
ëÅ‚ öÅ‚
__
"
ìÅ‚
"xtt+1- p ÷Å‚
yt+1 = "y1 × × yt
ìÅ‚1+ n -1 ÷Å‚
___
n
ìÅ‚
"x1-- p ÷Å‚
p
íÅ‚ Å‚Å‚
35
EKONOMETRIA Dr Stanisław Barczak
Maksymalny horyzont prognozy będzie równy opóznieniu p
Przykład:
I II III IV I II III IV I II III IV I II III IV
1999 2000 2001 2002
Proces 1 165 167 201 245 267 269 261 257 205 175 165 155 153 151 161 165
Proces 2 243 271 299 281 259 209 179 169 157 153 149 161 179 203 219 229
Opózniamy proces pierwszy kolejno o 1, 2 ,3 i 4 okresu [po prostu przepisujemy I 1999. kolejno na II 1999, III
1999, IV 1999, a przy opóznieniu o 4 I 2000; i tak kolejno z wszystkimi obserwacjami].
Korelacje:
Opóznienie o 1 kwartał = 0,57
Opóznienie o 2 kwartały = 0,88
Opóznienie o 3 kwartały = 0,98 max współczynnik korelacji i z tym opóznieniem szacujemy model
Opóznienie o 4 kwartały = 0,92
Najwyższą wartość współczynnika korelacji została wyznaczona przy opóznieniu o 3 kwartały, stąd opóznienie w
czasie dane jest jako p=3
(xt+1- p - xt- p) stÄ…d:
"xtt+1- p =
- p
xt- p
(xt+1-3 - xt-3); "xtt-2 = (xt-2 - xt-3)
"xtt+1-3 =
-3 -3
xt-3 xt-3
_____
t
średnia "y4+1 = 0,0764
____
średnia "xtt-2 = 0,0882
-3
Ostatecznie przewidywana wielkość procesu 1 w I kwartale 2003 dana jest jako:
ëÅ‚ öÅ‚
__
"
ìÅ‚
"xtt+1- p ÷Å‚
yt+1 = "y1 × × yt stÄ…d:
ìÅ‚1+ n -1 ÷Å‚
___
n
ìÅ‚
"x1-- p ÷Å‚
p
íÅ‚ Å‚Å‚
"
ëÅ‚ 0,134 öÅ‚
y16 = 1+ 0,076× ÷Å‚ ×165 = 184,159
ìÅ‚
0,088
íÅ‚ Å‚Å‚
Model ekonometryczny
Przy porównywaniu czasowym wyznaczamy 3 budowane modele ekonometryczne o następującej postaci:
Y*t = a1 × xt-p + a0 + ¾t
Na podstawie MNK.
Y*t prognoza na moment okres t.
Xt-p wartość zmiennej wiodącej w okresie t-p
a0,a1 parametry strukturalne modelu.
¾t czynnik losowy
Y*t = 0,87Xt-3 + 18,49 + Ut
R2 = 96,9%
Podstawiamy do modelu wartości zmiennej wiodącej z II 2002, czyli 203 i otrzymujemy prognozę procesu 1 na I
2003.
Y*t = 0,87×203 + 18,49 = 195,1
Modele ze zmiennymi wiodącymi pozwalają na przewidywanie w przyszłym kształtowaniu się zmiennej
prognozowanej zarówno w przypadku występowania wahań sezonowych jak i cyklicznych.
Modele mogą uwzględniać większą liczbę zmiennych wiodących.
36
EKONOMETRIA Dr Stanisław Barczak
MODELE AUTOREGRESYJNE I ÅšREDNIEJ RUCHOMEJ (ARMA) I (ARIMA)
Nie ma zmiennych objaśniających same szeregi czasowe.
Określają związek funkcyjny między wartościami zmiennej prognozowanej w okresie / momencie t, a wartościami
tej zmiennej z okresów/momentów poprzednich t-1, t-2 ... t-p; p opóznienie.
Powody stosowania:
1) Istnieje wiele zjawisk gospodarczych wskazujących na występowanie opóznienia ich przebiegu w czasie
np. popyt na wiele dóbr trwałego użytku charakteryzuje się cyklami opóznień związanymi z okresem ich
użytkowania
2) Rezygnacja z uwzględniania niejednokrotnie wielu zmiennych objaśniających
Zastosowanie:
Modelowanie stacjonarnych szeregów czasowych czyli:
- takich szeregów czasowych, w których występują jedynie wahania losowe wokół średniej
- szeregów czasowych niestacjonarnych sprowadzanych do stacjonarnych
Klasyfikacja modeli autoregresyjnych i średniej ruchomej:
" Modele autoregresji (AR)
" Modele średniej ruchomej (MA)
" Modele mieszane autoregresji i średniej ruchomej (ARMA)
Zintegrowane modele autoregresji i średniej ruchomej w nich zakłada się stacjonarność zmiennej prognozowanej.
W przypadku braku stacjonarności:
- dokonuje się przekształcenia szeregu czasowego w szereg stacjonarny, przeprowadzając operację
różnicowania, która polega na d-krotnym obliczaniu różnic sąsiednich wyrazów szeregu
Pierwsze różnice oblicza się jako: wt = yt yt-1 ; drugie jako: zt = wt wt-1 = (yt yt-1) - (yt-1 yt-2) = yt 2yt-1 + yt-2 .
Kolejne oblicza siÄ™ analogicznie.
Przeprowadza się tą operacją, aż do momentu gdy szereg czasowy stanie się stacjonarny.
Budowane dla tych przekształconych szeregów czasowych modele określa się mianem zintegrowanych modeli:
1) Autoregresyjne (ARI)
2) Åšredniej ruchomej (IMA)
3) Autoregresji i średniej ruchomej (ARIMA)
Przyjęta uniwersalna notacja modeli:
ARIMA (p,d,q)
p rząd autoregresji, wielokrotność opóznienia
d krotność różnicowania
q liczba parametrów średniej ruchomej
ARIMA(p,0,0) AR(p)
ARIMA(0,0,q) MA(q)
ARIMA(p,0,q) ARMA(p,q)
ARIMA(p,d,0) ARI(p,d)
Podejście do budowy modeli zaproponowane przez BOXa i JENKINSa w 1976
Zakładamy, że tworzymy nowy stacjonarny szereg czasowy zmiennej prognozowanej.
Po identyfikacji odpowiedniego dla danego szeregu czasowego modelu, czyli określenia jego postaci oraz wielkości
uwzględniających w modelu opóznień, używa się współczynników autokorelacji i autokorelacji cząstkowej.
Główna zasada:
Jeśli wartość współczynnika autokorelacji wykładniczo maleje do 0, czyli liczba tych współczynników istotnie
różnych od 0 jest stosunkowo duża, a liczba współczynników autokorelacji cząstkowej istotnie różniących się od 0
jest bardzo mała to należy stosować MODEL AUTOREGRESYJNY
Jeśli wartość współczynników autokorelacji cząstkowej wykładniczo maleje do 0, czyli liczba tych współczynników
istotnie różniących się od 0 jest stosunkowo duża, a liczba współczynników autokorelacji istotnie różniących się od
0 jest bardzo mała to powinno się stosować MODELE ŚREDNIEJ RUCHOMEJ
37
EKONOMETRIA Dr Stanisław Barczak
Jeśli współczynniki autokorelacji oraz autokorelacji cząstkowej wykładniczo maleją do 0, czyli liczby tych
współczynników istotnie różniących się od 0 są stosunkowo duże to należy stosować MODELE MIESZANE
AUTOKORELACJI I ÅšREDNIEJ RUCHOMEJ
Ogólny proces liniowy [Yule]
Biały szum
Szeregi czasowe, w których kolejne wartości są silnie zależne przedstawione są jako szeregi generowane przez ciąg
niezależnych zakłóceÅ„ losowych impulsów ¾t.
Zakłócenia te są realizacjami zmiennych losowych o ustalonym rozkładzie (najczęściej rozkład normalny) o
wartoÅ›ci oczekiwanej E(x) = 0 i ´¾2 . CiÄ…g takich zmiennych losowych to biaÅ‚y szum.
Szereg czasowy o silnie skorelowanych wartościach traktowany jest jako realizacja procesu {Yt} określonego w
następujący sposób.
Yt = µ + µt + È1*µt-1 + È2*µt-2 ...
È - parametry (wagi) modelu
µ - okreÅ›lony poziom rozpatrywanego procesu, dla procesów stacjonarnych okreÅ›la on poziom Å›redni
µt zakłócone impulsy losowe.
Wprowadzamy operator przesuniÄ™cia wstecz dany jako: Bi = µt-i
Yt = µ*(1 + È1B1 + È2B2 + ...) => Yt = È(B)µt ; przy zaÅ‚ożeniu, że ÈB = 1 + È1B1 + È2B2 + ...
Proces może być traktowany jako wyjaśnienie filtru liniowego funkcji danej jako:
ÈB = 1 + È1B1 + È2B2 + ... przeksztaÅ‚cajÄ…cej biaÅ‚y szum w proces stochastyczny.
Proces filtracji polega na przedstawieniu szeregu czasowego jako ważonych sum poprzednich zakłóceÅ„ losowych µt
Pojęcie funkcji losowej:
Przyjmijmy, że t jest nielosową wartością rzeczywistą w zbiorze T, oraz, że T może być przedziałem skończonym
lub nieskończonym.
W zastosowaniu ekonomicznych zakłada się, że t jest zmienną czasu.
Y(t) jest funkcją losową, jeżeli zna się odpowiednie dystrybuanty dowolnego zbioru zmiennych losowych czyli:
Y(t1); Y(t2)....(Ytn), gdzie ti należy do T; i = 1,2....n
AÄ…czna dystrybuanta zmiennych losowych dana jest jako:
Ft1,t2...t2 (y1,y2...yn) = P [Y(t1) < y1; Y(t2) < y2 ...; Y(tn) < yn]
Są to warunki zgodności; jeśli znamy dystrybuantę zgodny, jeśli nie znamy niezgodny
Funkcja losowa Y(t) nielosowego rzeczywistego argumentu t nazywa siÄ™ procesem stochastycznym.
Wg Boxa i Jenkinsa procesem stochastycznym jest zjawisko stochastyczne zmieniajÄ…ce siÄ™ w czasie zgodnie z
rozkładem prawdopodobieństwa.
Proces stochastyczny z czasem dyskretnym (ozn. Yt) ma miejsce wówczas gdy zbiór argumentów t obejmuje tylko
liczby całkowite.
Pole losowe stanowi funkcję losową wielu nieskończonych argumentów.
W ekonomii polem nielosowym mogą być wydatki na żywność gospodarstw domowych, będące funkcją takich
argumentów jak: czas, grupa społeczno-ekonomiczna, dochód etc.
Charakterystyki procesu stochastycznego z czasem dyskretnym
1) średnia wartość mt = E(Yt); t = 0, ą1, ą2 ...
2) wariancja D2(Yt) = E(Yt - mt)2; t = 0, Ä…1, Ä…2 ...
3) funkcja kowariancji K(t,s) = E[(Yt mt) × (Ys ms)] t = 0, Ä…1, Ä…2 ...... t `" s; s chwila
K(Ä ) K(Ä )
4) funkcja autokorelacyjna: R(Ä )= = ; gdzie Ä = t s
D2 (YÅ ) K(0)
t="
1
5) spektrum funkcja gÄ™stoÅ›ci spektralnej: f (É)=
"K(Ä ) ; gdzie É = 2 i ; i = 0,1,2... ½ N
2 N
t=-"
38
EKONOMETRIA Dr Stanisław Barczak
Procesy stochastyczne stacjonarne i niestacjonarne.
Proces stacjonarny oznacza, że ciÄ…g wag È1, È2... jest skoÅ„czony lub nieskoÅ„czony, zbieżny, a parametr µ jest
średnią wokół, której występują wahania przypadkowe.
Proces niestacjonarny oznacza, iż ciąg wag nie spełnia warunków skończoności/nieskończoności i zbieżności, a
parametr µ nie ma wiÄ™kszego znaczenia i sÅ‚uży jako punkt odniesienia poziomu procesu.
Procesy stochastyczne dzielimy na:
1) stacjonarny w węższym i szerszym sensie
2) niestacjonarne
Proces stochastyczny w węższym sensie dystrybuanta związana z n obserwacjami yt1, yt2, ..... ytn,
dokonywanymi w dowolnych momentach czasu t1, t2, ... tn, jest taka sama jak dystrybuanta zwiÄ…zana z n-
obserwcajami yt1+k, yt2+k....ytn+k dokonywanymi w momentach t1+k, t2+k...tn+k, czyli zachodzi warunek:
Ft1+k,t2+k....tn+k(yt1+k,yt2+k....ytn+k) = Ft1,t2...tn(yt1,yt2...ytn)
Oznacza to, że łączna dystrybuanta dowolnego zbioru obserwacji nie ulega zmianie w czasie przy przesunięciu
na osi czasu o k-całkowitych jednostek do przodu lub do tyłu.
Proces stacjonarny w sensie szerszym ma miejsce jeżeli wartość średnia i wariancja procesu są stałe,
niezależnie od czasu t, a funkcja kowariancji zależy od różnicy t s = Ä, czyli speÅ‚nione sÄ… nastÄ™pujÄ…ce warunki:
1) średnia wartość mt = E(Yt) = const.
2) wariancja D2(Yt) = E(Yt - mt)2 = Ã2 = const.
3) funkcja kowariancji K(t,s) = K(Ä)
Stacjonarność w węższym stacjonarność w szerszym.
Stacjonarność w szerszym sensie nie wymaga stabilności rozkładów, a jedynie stabilności pewnych parametrów tych
rozkładów (w/w).
W analizie ekonometrycznej wykorzystuje się metody procesów stacjonarnych w szerszym sensie.
Ergodyczność oznacza, że każda poszczególna realizacja procesu stochastycznego jest pełnoprawnym
przedstawicielem całego zbioru możliwych realizacji.
Założenie o ergodyczności umożliwia obliczanie głównych charakterystyk procesu na podstawie jednej realizacji dla
wystarczająco długiego okresu, czyli po czasie t, a nie na podstawie pewnej liczby realizacji danego procesu, czyli
po realizacjach.
Proces jest niestacjonarny gdy nie jest spełniony przynajmniej 1 z 3 w/w warunków
Można wyróżnić następujące procesy niestacjonarne:
1) procesy niestacjonarne w średniej, stacjonarne w wariancji
2) procesy niestacjonarne w wariancji, stacjonarne w średniej
3) procesy o niestacjonarnej funkcji kowariancji i stałych wartościach średnich
4) procesy niestacjonarne w średniej i wariancji oraz funkcji kowariancji.
Ekonomiczny proces stochastyczny przedstawiany jest jako:
Yt = Pt + St + Ct + µt
Pt trend
St wahania sezonowe
Ct wahania cykliczne (koniunkturalne)
µt nieregularne wahania przypadkowe.
Przez trend Pt rozumie się ogólne tendencje rozwojowe (kierunek rozwoju) charakteryzują dany szereg czasowy na
przestrzeni dłuższego okresu. Trend kojarzony jest z powolnymi i systematycznymi zmianami poziomu procesu
ekonomicznego zachodzącego w długim okresie pod wpływem działania silnych, trwałych przyczyn. Zakłada się, że
funkcje opisujące trend powinny zachować się gładkością i spokojnością przebiegu.
Wahania sezonowe St są wahaniami powtarzającymi się periodycznie w pewnych określonych podokresach
(miesiące, kwartały) każdego roku. Występowanie wahań sezonowych, które oscylują wokół trendu jest efektem
oddziaływania podstawowych czynników sezonowych: czynniki kalendarzowe, klimatyczno-przyrodnicze oraz
39
EKONOMETRIA Dr Stanisław Barczak
czynników społeczno-ekonomicznych bezpośrednio lub pośrednio zależnych od podstawowych czynników
sezonowych. Ważne jest zawsze rozstrzygające o typie wahań sezonowych.
Wahania Ct są wahaniami powtarzającymi się cyklicznie z mniejszą lub większą regularnością. Uważa się je za
odzwierciedlenie wahań koniunkturalnych w gospodarce. Charakteryzują się one duża zmiennością cykli, czasu
trwania poszczególnych wielkości, amplitud. Utrudnia ten fakt prowadzenie badań.
Można wyróżnić liczby faz:
2 ekspansja i recesja
3 wzrost większy od trendu, wzrost zbliżony do trendu, wzrost niższy od trendu
4 ostrzeżenie, recesja, ożywienie, ekspansja
6 wzrost, rozkwit, ostrzeżenie, recesja, depresja, ożywienie
Wahania nieregularne µt trudno jest podać jeden ich schemat. Można jednak wyróżnić wahania przypadkowe i
wahania katastrofalne.
Linii trendu nie da się oddzielić od linii wahań cyklicznych ponieważ linie te nie powstały pod działaniem
oddzielnych zespołów przyczyn.
Do początku lat 70-tych zasadą stało się rozpatrywanie trendu i wahań koniunkturalnych łącznie. Zatem proces
ekonomiczny można zapisać jako: Yt = Pt + St + µt.
Z punktu widzenia teorii procesów stochastycznych model: Yt = Pt + St + µt, można zapisać jako: E(Yt) = Pt + St
Co oznacza, że model opisuje niestacjonarny proces stochastyczny ze zmienną wartością oczekiwaną. Proces
odchyleÅ„ od trendu i wahaÅ„ sezonowych µt jako stacjonarny o Å›redniej równej zero.
Trend Pt procesu stochastycznego można nazwać pewną krzywą ciągłą wyznaczoną przez wartości oczekiwane
procesu w układzie współrzędnych prostokątnych, w którym oś odciętych (X) odpowiada ciągłej zmiennej czasowej
t.
Proces autoregresyjny AR(p)
Proces autoregresyjny rzędu p dany jako:
Yt = Õ0 + Õ1Yt-1 + Õ2Yt-2 + .... + ÕpYt-p + µt
Gdzie: Õ0, Õ1...Õp sÄ… parametrami procesu; p opóznienie czasowe; µ - zakłócenia losowe i jest zmiennÄ… losowÄ… o
rozkÅ‚adzie N(0,Ã2)
Proces autoregresyjny AR(p) charakteryzuje się tym, że jego bieżąca wartość jest sumą skończonej kombinacji
liniowej poprzednich jego wartości oraz zakłócenia losowego.
Proces autoregresji można traktować jako liniowe równanie regresji wielorakiej zmiany Yt względem opóznionych
w czasie wartości tej zmiennej.
Stosując operator przesunięcia wstecz B, proces można przedstawić jako:
Ćp(B)Yt = Õ0 + µt gdzie: Ćp = 1 - Õ1B1 - Õ2B2 - .... - ÕpBp jest wielomianem charakterystycznym procesu rzÄ™du
p .
Ć(B) = 0 równanie charakterystyczne procesu.
Problem identyfikacji procesu autoregresyjnego AR(p)
Polega na stwierdzeniu, że rozpatrywany proces jest procesem autoregresyjnym oraz na określenie jego rzędu p.
Identyfikacja:
Polega na porównaniu własności teoretycznych funkcji autokorelacji i autokorelacji cząstkowej z zachowaniem się
współczynników autokorelacji i autokorelacji cząstkowej oszacowanych na podstawie szeregu czasowego.
Funkcja autokorelacji dana jako: Yt = Õ0 + Õ1Yt-1 + Õ2Yt-2 + .... + ÕpYt-p + µt
Ák = Õ1Ák-1 + Õ2Ák-2 + ...... + ÕpÁk-p
gdzie Ák, Ák-1 .... Ák-p współczynniki autokorelacji przy odstÄ™pie równym k, k-1, ... k-p
Õ0, Õ1...Õp sÄ… parametrami procesu
Jeżeli proces jest stacjonarny to rozwiązaniem jest funkcja auokorelacji składająca się z zanikających funkcji
wykładniczych i sinusoid tłumionych.
PodstawiajÄ…c do równania: Ák = Õ1Ák-1 + Õ2Ák-2 + ...... + ÕpÁk-p ; kolejno dla k=1,2...p
40
EKONOMETRIA Dr Stanisław Barczak
Otrzymujemy układ równań Yule a-Walkera dany jako:
Á1 = Õ1 + Õ2Á1 + .... + Õ Á
Å„Å‚
p p-1
ôÅ‚
= Õ1Á1 + Õ2 + .... + Õ Á
ôÅ‚Á2 p p-2
òÅ‚
ôÅ‚...................................................
ôÅ‚Á p = Õ1Á p-1 + Õ2Á p-2 + .... + Õ p
ół
ZmieniajÄ…c teoretyczne wartoÅ›ci współczynników autokorelacji na współczynniki autokorelacji Ák oszacowane na
podstawie szeregu czasowego otrzymane jest tzw. oszacowanie Yule a-Walkera
Funkcja autokorelacji czÄ…stkowej:
W celu oszacowania korzystamy równań Yule a-Walkera
Dodatkowo przyjmuje siÄ™, że Õk to j-ty współczynnik w procesie autoregresji rzÄ™du k. Oznacza to, że ostatni
współczynnik to Õkk, który speÅ‚nia nastÄ™pujÄ…cy uklad równaÅ„:
Áj = Õk,1Áj-1 + Õk,2Áj-2 + ...... + Õk,k-1Áj-(k-1) + Õk,kÁj-k j =1,2....k
Rozwiązując równania kolejne dla k = 1,2 otrzymujemy:
Õ1,1 = Á1
1 Á1 Á1
îÅ‚ Å‚Å‚
ïÅ‚Á 1 Á2 śł
1 Á1
îÅ‚ Å‚Å‚
1
ïÅ‚ śł
ïÅ‚Á Á2 śł
ïÅ‚ śł
Á2 Á3 ûÅ‚
ðÅ‚ 1 ûÅ‚
ðÅ‚Á1
Õ2,2 =
Õ3,3 =
1 Á1
îÅ‚ Å‚Å‚
1 Á1 Á2
îÅ‚ Å‚Å‚
ïÅ‚Á 1 śł
ïÅ‚
ðÅ‚ 1 ûÅ‚ Á1 1 Á1 śł
ïÅ‚ śł
ïÅ‚ śł
Á1 1
ðÅ‚Á2 ûÅ‚
Wielkość Õkk jest traktowana jako funkcja odstÄ™pu k i nazywa siÄ™ funkcjÄ… autokorelacji czÄ…stkowej. W przypadku
AR(p) jest ona różna od 0 dla k d" pi i równa 0 dla k > p, zatem funkcja ta urywa się w okresie p.
Wykorzystując procesy AR(p) modelowane są zarówno procesy stacjonarne jak i niestacjonarne.
Proces średniej ruchomej MA(q)
Przyjmuje, że tylko q początkowych wag procesu:
Yt = Õ0 + Õ1Yt-1 + Õ2Yt-2 + .... + ÕpYt-p + µt
Jest różny od 0 to proces taki nazywamy procesem średniej ruchomej dany jako:
Yt = µ + µt + v1µt-1 v2µt-2 - ....... - vqµt-q
µt, µt-1.....µt-q odchylenia losowe w okresach t, t-1, ... t-q o rozkÅ‚adzie N(0,Ã2)
µ - v1 v2 - .... vq parametry modelu (wagi), q wielkość opóznienia
Średnia ruchoma wagi modelu nie muszą się sumować do jedności i mogą przyjmować wartości ujemne.
Korzystając z operatora przesunięcia wstecz, model średniej ruchomej można zapisać jako:
Yt = µ + ¸q(B) µt gdzie: ¸q(B) = 1 v1B1 - .... vqBq wielomian charakterystyczny
¸q(b) = 0 równanie charakterystyczne
Identyfikacja procesu MA(q)
Identyfikacja procesu średniej ruchomej MA(q) odbywa się przez porównanie teoretycznych i empirycznych
współczynników autokorelacji i autokorelacji cząstkowej. Przy czym teoretyczna funkcja autokorelacji tego procesu
dana jest jako:
Å„Å‚- vk + v1vk -1 + .... + vq-kvq
;dla _ k = 1,2...q
ôÅ‚
2 2
Ák = 1+ v1 + ...vq
òÅ‚
ôÅ‚0;dla _ k > q
ół
Funkcja ta jest równa 0 dla wartości k większych niż rząd procesu oznacza, to że urywa się punkcje q.
Model średniej ruchomej jest zawsze stacjonarny, niezależnie od wartości parametrów.
41
EKONOMETRIA Dr Stanisław Barczak
Proces autoregresji i średniej ruchomej ARMA(p,q)
W celu zwiększenia elastyczności oraz dopasowania modelu do danych empirycznych często łączy się 2 procesy
czyli AR(p) i MA(q).
Jest to spowodowane faktem, że nie zawsze możliwy jest wybór procesu o postaci AR(p) lub MA(q), który
charakteryzuje się niewielką liczbą parametrów i jest dobrze dopasowany do danych empirycznych.
Proces autoregresji i średniej ruchomej jest dany jako:
Yt = Õ0 + Õ1Yt-1 + Õ2Yt-2 + .... + ÕpYt-p - v1µt-1 v2µt-2 - ....... - vqµt-q + µt
Stosując operator przesunięcia wstecz B, proces można zapisać jako:
Ćp(B)Yt = Õ0 + ¸q(B)µt
Postać funkcji autokorelacji procesu ARMA(p,q) zależy od parametrów p i q:
- jeżeli q-p < 0 to funkcja autokorelacji składa się z funkcji wykładniczych i/lub sinusoid tłumionych
- jeżeli p-q > 0 to wystÄ…pi q-p+1 poczÄ…tkowych wartoÅ›ci Á0, Á1....Áp-q, które nie sÄ… rozważane przez ten
proces.
Funkcja autokorelacji czÄ…stkowej procesu ARMA(p,q) zachuje siÄ™ jak funkcja autokorelacji czÄ…stkowej procesu
średniej ruchomej, zależnie od rzędu średniej ruchomej wartości parametrów. Urywa się w punkcie p.
Z góry założona stacjonarność.
Proces zintegrowany
W przypadku szeregu czasowego, który nie jest stacjonarny można go sprowadzić do stacjonarności poprzez
operację różnicowania, czyli d-krotnym obliczaniu różnic sąsiednich wyrazów.
Szereg czasowy, którego pierwsze różnice są stacjonarne nazywany jest szeregiem zintegrowanym stopnia
pierwszego.
Szereg czasowy, którego drugie różnice są stacjonarne nazywany jest szeregiem zintegrowanym stopnia drugiego.
Itd.
Szereg, który jest stacjonarny nazywamy zintegrowanym szeregiem stopnia zerowego.
Proces można zapisać przy pomocy tzw. operatora różnic rzędu danego: "d = (1-B)d
Proces przyjmuje postać:
"yt = yt yt-1
"2yt = "yt - "yt-1 = (yt - yt-1) (yt-1 yt-2)
"dyt = "d-1yt - "d-1yt-1
Zatem jeżeli szereg czasowy dany jako (yt)t=1,2....n o liczbie wyrazów n zadziałamy operatorem (wt)t=d+1....n =
("dyt)t=d+1....n ; którego liczba wyrazów będzie wynosić n d.
Jeżeli szereg taki okaże się stacjonarny to można go modelować stosując, jeden z procesów AR(p), MA(q),
ARMA(p,q) określonych mianem:
" zintegrowanego procesu regresji ARI(p)
" zintegrowanego procesu średniej ruchomej IMA(q)
" zintegrowanego procesu autoregresji i średniej ruchomej ARIMA(p,d,q)
42
Wyszukiwarka
Podobne podstrony:
Metodologia nauk przyrodniczych wyk adyDynamika grup w organizacji Wyk éadywyk adyfilozofia wyk adyPotencja é innowacyjny MSP Wyk éadyZPKB wyk ady AKMi dzynarodowe stosunki gospodarcze wyk adywyk ekonomikaPrezentacja ekonomia instytucjonalna na Moodlewięcej podobnych podstron