Ekonometria Wykład IV-19.04.2012r.
Wybrane problemy budowy modeli ekonometrycznych
Na etapie specyfikacji spotykamy się z różnymi problemami:
Heteroscedastyczność
Autokorelacja
Zjawisko współliniowości
Koincydencja
Kataliza
Poprawna budowa modeli ekonometrycznych wymaga, aby zmienne objaśniające nie były wzajemnymi kombinacjami liniowymi (aby wartość jednej nie była funkcją innej).
Współliniowość- wartość zmiennych objaśniających polega na tym, że szeregi obserwacji zmiennych objaśniających są nadmiernie skorelowane(pojęcie zostało wprowadzone w 1934r, przez Fischera, problem dotyczy zazwyczaj danych w problem szeregów czasowych).
Jeżeli występuje ścisła korelacja liniowa, to rząd macierzy X (obserwacji zmiennych objaśniających) jest mniejszy od k=1 (k- liczba zmiennych objaśniających), a w konsekwencji macierzy XTX jest osobliwa, co uniemożliwia wyznaczenie parametrów metodą MNK.
W praktyce dokładna zależność liniowa zmiennych objaśniających jest mało prawdopodobna. Często Janek występuje bardzo zbliżona do ściśle liniowych zależności i wartości zmiennych objaśniających(nadmiernie skorelowane)- mówimy wtedy o przybliżonej współliniowości.
Przyczyny:
Tendencja kształtowania się wartości wielu kategorii ekonomicznych według tych samych trendów rozwojowych lub szerszej- według podobnych cykli koniunkturalnych
Współliniowość może być spowodowana małą liczbą obserwacji
W modelach w których informacje o zmiennych mają charakter danych przekrojowych, występowanie zjawiska jest tłumaczone tendencję do proporcjonalnych zmian wartości zmiennych objaśniających
Skutki:
Niemożliwy jest poprawny pomiar siły oddziaływania poszczególnych zmiennych na zmienną objaśnianą (założenie ceteris Paribus może być nieaktualne)
Bezpośredni wpływ na jakość modelu( oceny średnich błędów szacunku parametrów są duże w wartość statystyk t-studenta małe, co sugeruje usunięcie tych zmiennych ze specyfikacji modelu. Możemy otrzymać paradoksalny rezultat: wszystkie zmienne objaśniające są statystycznie nieistotne, a mimo to współczynnik determinacji R2 osiąga dużą wartość)
Niewielkie zmiany w zbiorze danych powodują duże zmiany otrzymanych estymatorach
Zmiana znaków algebraicznych estymowanych parametrów modelu(współczynniki równania regresji mają ”złe”, czyli nie zgodne z teorią znaki, albo są zbyt małe lub zbyt duże)
Przybliżona współliniowość nie powoduje utraty przez estymator wektora parametrów α modelu wyznaczony KMNK własności o których mówi twierdzenie Gaussa-Marlowa
W przypadku współliniowości można:
Zmienić postać funkcyjną modelu
Usunąć zmienną lub zmienne
Nałożyć restrykcje na parametry
Dokonać transformacji zmiennych
Zastosować inną metodę estymacji parametrów(np. metoda głównych składowych, metoda estymacji grzbietowej)
Zasada koincydencji
Pożądaną wartością modelu jest zgodność znaków ocen parametrów i znaków współczynników korelacji. Jeżeli istnieje taka zgodność to mówimy, że model ma własność koincydencji. Wiąże się to bezpośrednio z możliwością sensownego interpretowania estymatorów parametrów modelu ekonometrycznego.
Dla każdej zmiennej objaśniającej
Sqn ri=sgn$\hat{\propto_{1}}$
Gdy znaki są różne wówczas wartość ocen parametrów nie mają większego poznawczego znaczenia, gdy informują o kierunku oddziaływania zmiennych objaśniających na zmienną objaśnianą zgodnym z rzeczywistością. Przyczyną takiego stanu może być między innymi zbyt duża liczba zmiennych objaśniających w modelu
Kataliza
Współczynnik determinacji jest miarą dopasowania modelu ekonometrycznego do danych empirycznych, lecz informacja jaką niesie o modelu może być fałszywa jeśli w modelu występują zmienne, które nazywamy katalizatorami.
Efelt Katalizy polega na tym, że otrzymujemy wysokie R2, chociaż charakter i siła powiązań zmiennych objaśniających i zmiennej objaśnianej tego nie uwzględniają(współczynnik determinacji może osiągnąć duże wartości na skutek nie tylko silnego skorelowania zmiennych objaśniających ze zmienną objaśnianą lecz także silnego wzajemnego skorelowania zmiennych objaśniających). Po usunięciu tej zmiennej z modelu i powtórnym oszacowaniu wartość R2 jest znacznie mniejsza.
Jak wykrywamy występowanie efektu katalizy?
Zmienna Xi z pary zmiennych (Xi,Xj) i<j jest katalizatorem jeśli:
Rij<0 lub ru>$\frac{r_{i}}{r_{j}}$ ri=t(Xi , Y) rij=t(Xi , Yj)
Sprawdzamy natężenie efektu katalizy dla całego modelu
Ƞ=R2-H
H- integralna pojemność informacji modelu z metody Hellwiga doboru zmiennych do modelu
Względne natężenie efektu katalizy
$$W_{n} = \frac{n}{R^{2}}*100\%$$
Estymacja parametrów modeli ekonometrycznych z autokorelacją składnika losowego
Klasycznej MNK nie można stosować, jeżeli nie jest spełnione jedno z założeń, czyli jeśli występuje autokorelacja odchyleń losowych, wariancja odchyleń losowych nie jest stała lub zmienne objaśniające mają charakter losowy. Można wówczas wykorzystywać metody, które opierają się klasycznej MNK …ale uwzględniają niespełnienie któregoś z warunku..
Występowanie autokorelacji sprawia, że estymatory są zgodne, nieobciążone ale nie najefektywniejsze ( w przypadku występowania zjawiska autokorelacji składnika losowego macierz wariancji i kowariancji nie jest macierzą diagonalną), Dla modeli z autokorelacją składnika losowego stosuje się często transformację zmiennych. Jedną z metod szacowania parametrów jest metoda Cochorne’a-Orcuta(metoda różniczki zupełnej, szczególna postać uogólnionej KMNK)
Przekształcenie Cochrona-orcutta
Polega na przejściu od modelu
$Y = \sum_{j = 0}^{k}{\alpha_{j}X_{j} + \sigma}$
Do modelu
$$Y = \sum_{j = 0}^{k}{\alpha_{j}{K}_{j} + \sigma}$$
Przy czym
yi = yi − piyi − 1 + x0 = x0 − p1xi − 1, j
Pi-autokorelacja składnika losowego rzędu pierwszego
Najczęściej zakładamy, że współczynnik autokorelacji rzędu I jest równy jest równy jedności. Upraszcza to obliczenia oraz interpretację otrzymanych wyników, jednak zdarza się, że otrzymany model jest mniej efektywny. Po dokonaniu zmiany wartości zmiennych liczba dostępnych obserwacji zmniejsza się o jedną. Dla tak przekształconych zmiennych dokonujemy oszacowania parametrów KMNK. Wektor ocen parametrów strukturalnych wyznaczany na podstawie wzoru
$\hat{\alpha} = (x^{T}X)^{- 1}$ XTy
Ocenę parametru wolnego wyznaczamy według wzoru
$$\hat{\alpha_{0}} = \overset{\overline{}}{y} - \ \sum_{}^{}{\hat{\alpha_{i}}\overset{\overline{}}{x_{i}}}$$
Macierz wariancji i kowariancji ocen parametrów strukturalnych ma postać:
$$D^{2}\left\{ \hat{\alpha_{i}} \right) = \text{Se}^{2}*(X^{T}X)^{- 1}$$
Gdzie ΔXi- macierz pierwszych różnic macierzy objaśniających, w której pierwsza kolumna to jedynka.
W przypadku istotnej autokorelacji (test Durbina-Watsona) przekształcamy zmienne i budujemy kolejny model. Kończymy po wyeliminowaniu autokorelacji składnika losowego.
Uogólnienia MNK
Uogólniona MNK polega na modyfikacji MNK, która przezwycięża skutki niespełnienia w rzeczywistości założenia mówiącego o homoscedastyczności składnika losowego. MA ona zastosowanie do szacowania parametrów modelu przy niestałości założenia o stałości wariancji odchyleń losowych (mówimy o tzw. Braku sferyczności składnika losowego) lub założenie o braku autokorelacji odchyleń. Wprowadzamy nową, dodatnio określoną macierz symetryczną stopnia n-Ω. Wektor ocen parametrów strukturalnych otrzymamy uogólnioną MNK ma postać :
$$\hat{\alpha} = (X^{T}\mathrm{\Omega}^{- 1}X)^{- 1}X^{T}\mathrm{\Omega}^{- 1}y$$
Macierz Ω jest macierzą diagonalną, której zazwyczaj nie jest znana postać.
W najprostszym przypadku zakłada się wariancja odchyleń losowych jest proporcjonalna do wybranej zmiennej objaśniającej X(ω=X) lub modułowi reszt modelu oszacowanego na podstawie danych pierwotnych za pomocą KMNK.
Prognozowanie(predykcja)ekonometryczne:
Proces wnioskowania o przyszłych ( lub ogólnie nieznanych) wartościach zmiennej na podstawie modelu ekonometrycznego objaśniającego tę zmienną.
Zmienne yi dla której konstruuje się prognozę nazywana jest zmienną prognozowaną natomiast okres na jaki buduje się prognozę nazywa się horyzontem prognozy lub okresem prognozowanym(predykcja) oznaczać go będziemy przez T.
Predyktor to pewien funkcjonał określony w przestrzeni wszystkich modeli ekonometrycznych opisujących badane zjawisko. W praktyce jest to poprawnie wyspecyfikowany oszacowany model ekonometryczny.
Założenia teorii predykcji:
Znane są oszacowania parametrów modelu w którym zmienna (zmienne) prognozowane jest zmienną objaśnioną
Model powinien być wszechstronnie i pozytywnie zweryfikowany (struktura modelu<postać analityczna i parametry strukturalne> musi być stabilna w czasie zarówno w próbie jak i w okresie prognozowanym)
Znane są wartości (lub oszacowanie) zmiennych objaśniających dla określonego horyzontu prognozy
Rozkład składnika losowego jest stacjonarny
Dopuszczalność eksploatacji poza obserwowany w próbie obszar zmienności zmiennych objaśniających
Prognozowanie ekonometryczne
Ze względu na horyzont prognozy dzielimy na:
Krótkookresowe (operacyjne)
Średniookresowe (strategiczne)
Długookresowe (perspektywiczne)
Etapy Prognozowania:
Sformułowanie zadania prognostycznego
Sformułowanie przesłanek prognozy (określenie czynników kształtujących zjawisko, określenie zbioru danych)
Wybór metody prognozowania
Wyznaczenie prognozy
Ocena dokładności prognozy
Zasady predykcji
Zasada predykcji nieobciążonej (prognozę wyznacza się na poziomie wartości oczekiwanej zmiennej prognozowanej. Błędy prognozy mają charakter losowy, o średniej zero czyli nie występują błędy systematyczne)
Zasada predykcji…
Rodzaje prognoz
Ex post- jest dokonywana dla okresów, dla których znamy realizację zmiennej objaśnionej przez model (wartość zmiennych objaśniających są znane, a sama prognoza może być porównane z wartościami zaobserwowanymi). Prognoza ex-post jest dokonywana aby zbadać własności prognostyczne modelu.
Ex ante- dostępność danych dotyczących zmiennych objaśniających zależy od długości i struktury występujących opóźnień oraz charakteru zjawisk. Najczęściej dane te są wyznaczone tylko z pewnym prawdopodobieństwem.
Podstawowe postulaty predykcji:
Prognoza powinna być obliczona wraz z odpowiednim miernikiem rzędu dokładności
Przy wyborze sposobu budowania prognoz należy dążyć do wysokiej efektywności predykcji czyli osiągnięcia zadowalającego rzędu dokładności predykcji
Źródła błędów prognoz
Błąd estymacji
Błąd struktury stochastycznej
Błąd losowy
Błąd specyfikacji
Błąd warunków endogenicznych
Błąd warunków egzogenicznych
Błąd pomiaru
Mierniki rzędu dokładności prognoz
Mierniki ex ante:
Średni błąd predykcji
VT=$\sqrt{\text{Se}^{2}(1 + X_{T}(X^{T}X)^{- 1}X_{T}^{T})}$
XT-wektor wartości zmiennych objaśniających w okresie prognozowanym T
X- macierz obserwacji na zmiennych objaśniających modelu
Można też skorzystać ze wzoru skalarnego
$$D^{2}\left( \hat{U_{T}} \right) = \sum_{i = 1}^{k}{X_{\text{iT}}^{2}D^{2}(\hat{\alpha_{1})}} + 2\sum_{i}^{}{\sum_{j}^{}X_{\text{iT}}}X_{\text{jT}}\text{cov}\left( \hat{\alpha_{i}},\hat{\alpha_{j}} \right) + \sigma_{T}^{2}$$
Błąd ten informuje o ile średnio w długim ciągu prognoz, wartość zmiennej prognozowanej będą się różnić od prognoz (mierniki te oblicza się przed realizacją). Średni błąd predykcji zależy zatem od: wariancji i kowariancji estymatorów, wartości zmiennych objaśniających w okresie prognozowanym wariancje składnika losowego.
Względny błąd predykcji
$$V_{T} = \frac{V_{T}}{y_{T}}*100\%$$
Informuje jaką procentowo część wartości prognozy stanowi średni błąd predykcji.
Mierniki rzędu trafności prognoz
Mierniki ex post
Średni błąd prognozy(ME):
$$ME = \frac{\sum_{}^{}{(y^{D} - y)}}{N}$$
Średni błąd procentowy(MPE):
$$MPE = \frac{\sum_{}^{}\frac{(y^{D} - y)}{y}}{N}*100$$
Średni absolutny błąd(MAE):
$$MAE = \frac{\sum_{}^{}{|y^{D} - y|}}{N}$$
Średni absolutny błąd procentowy(MAPE):
MAPE=
Błąd średniokwadratowy(MSE):
MSE=
Prognozowanie na podstawie elastyczności
Prognozy mogą odnosić się nie tylko do bezwzględnego poziomu zmiennej prognozowanej, ale także możliwe jest wnioskowanie o przyrostach tej zmiennej:
Przyrost bezwzględnych
Przyrost względnych
Predykcja przyrostów jest szczególnie wygodnym sposobem wnioskowania w przyszłości w sytuacji:
Gdy informacje o wartościach zmiennych objaśniających modelu w okresie prognozowania są trudno dostępne
Natomiast łatwo podać przewidywaniom ich przyrosty w okresie prognozowanym
W praktyce predykcji ekonometrycznej szczególnie ważne miejsce zajmuje budowa prognoz względnego przyrostu zmiennej prognostycznej przy użyciu wskaźnika elastyczności np.
W badaniach popytu konsumpcyjnego
Przy niektórych…
W prognozowaniu na podstawie wskaźnika elastyczności nie może z góry powiedzieć, jaki jest możliwy błąd wnioskowania w przyszłości.
Podstawowe mierniki elastyczności: elastyczność punktową i różnicową
Elastyczność punktowa zmiennej Y względem zmiennej X1 w funkcji:
Y=f(X1,X2,…,Xk)
Nazywamy wyrażenie:
Ep(xi)=
Przy czym zakłada się że ΔX1-> 0 co często jest sprzeczne z rzeczywistym przebiegiem zjawisk ekonomicznych
Elastyczność punktowa rzędu r zmiennej Y względem zmiennej xi w funkcji
Y=f(X1,X2,…,Xk)
Nazywamy wyrażenie
Jeżeli funkcja jest potęgowa tzn Y=
To elastycznością punktową rzędu I (r=1) względem zmiennej X1 jest parametr α1 ponieważ
Elastyczność jakie będą względne zmiany(procentowe) zmiennej Y, przy 1% zmianach zmiennej Xi(w tym przypadku wynoszą αi).
Elastyczność punktową rzędu II (r=2) względem zmiennej Xi: $\text{Ep}^{2}\left| x_{i} \right| = \frac{\alpha_{i}(\alpha_{i} - 1)}{x_{i}}$
Ze względu na to, że definicja elastyczności punktowej zakłada się dowolnie małe zmiany zmiennej xi(Δxi->0)
Elastyczność różniczkową zmiennej Y względem zmiennej Xi nazywamy stosunek relatywnego przyrostu zmiennej Y (zmiennej objaśnionej) do relatywnego przyrostu zmiennej objaśniającej (zmiennej Xi)
$$E_{r}\left( x_{i} \right) = \frac{Y}{Y} + \frac{X_{i}}{X_{i}}$$
Elastyczność różniczkową można wyrazić za pomocą sumy elastyczności punktowej rzędu r:
ER(Xi)=
W praktyce szereg powyższy jest bardzo szybko zbieżny i dlatego zwykle wystarczy wziąć pod uwagę 2 lub najwyżej 3 pierwsze wyrazy
Jeżeli funkcja jest funkcją potęgowa tzn.
Y = α0x1α1 * x2α2 * …xiαi…xkαk
To elastyczność różniczkowa wynosi:
$$E_{R}\left( x_{i} \right) = \alpha_{i} + \alpha_{i}\left( \alpha_{i} - 1 \right)*\frac{x}{x_{i}}$$
Prognoza względem przyrostu zmiennej objaśnianej Y:
ER(xi)=
$\frac{Y}{Y} = \ $ gdzie ΔYt=Yt+1-Yt ΔXn=Xn+1-Xn