MODEL EKONOMETRYCZNY
„Model jest to schematyczne uproszczenie, pomijające nieistotne aspekty w celu wyjaśnienia wewnętrznego działania, formy lub konstrukcji bardziej skomplikowanego mechanizmu.” (Lawrence R. Klein)
ZALETY MODELU- możliwość względnie taniego eksperymentowania, możliwość analizy, realizacji prognozy, symulacji.
Model ekonometryczny- formalny matematyczny zapis istniejących prawidłowości ekonomicznych. Celem takiego modelu może być opis zależności, przewidywanie przyszłego kształtowania się zależności, symulacja.
KLASYFIKACJA MODELI EKONOMETRYCZNYCH
Ze względu na wyróżnione cechy:
występowanie lub brak w modelu zmiennej losowej;
modele deterministyczne lub stochastyczne.
ze względu na formę związku między zmiennymi występującymi w modelu;
modele liniowe i nieliniowe
ze względu na ilość rozpatrywanych zależności
modele jednorównaniowe i wielorównaniowe
ze względu na czynnik czasu;
modele statyczne [związki zachodzą w tej samej jednostce czasowej] i modele dynamiczne [uwzględniają czynnik czasu w formie opóźnień lub zmiennej czasowej]
ze względu na charakter analizowanych związków;
modele przyczynowo-skutkowe i modele symptomatyczne.
KLASYFIKACJA ZMIENNYCH I PARAMETRÓW
WYSTĘPUJĄCYCH W EKONOMETRYCZNYCH MODELACH.
Zmienne endogeniczne i egzogeniczne w modelu ekonometrycznym.
Zmienne egzogeniczne (zmienne objaśniające w modelu, wśród nich zmienne sterujące będące przedmiotem polityki gospodarczej).
Zmienne objaśniane i objaśniające (dot. danego równania )
Zmienne z góry ustalone (zm. egzogeniczne, zmienne endogeniczne z opóźnieniami i z wyprzedzeniami, zmienna czasowa-wyrażająca systematyczne zmiany w czasie zmiennej endogenicznej).
Zmienne zerojedynkowe (dla określenia czynników niemierzalnych).
Składnik losowy ( zmienna wyrażająca łączny efekt tych czynników, które nie zostały wyspecyfikowane w modelu, a także z błędów wynikających z przyjęcia niewłaściwej postaci funkcyjnej modelu, błędów pomiaru wartości zmiennych.
Parametry struktury stochastycznej modelu (parametry rozkładu składnika losowego)
Parametry strukturalne modelu (parametry występujące przy kolejnych zmiennych, określające kształtowanie zmiennej objaśnianej).
ETAPY ANALIZY EKONOMETRYCZNEJ
SPECYFIKACJA ZMIENNYCH I DOBÓR POSTACI MODELU
USTALENIE PRZEDMIOTU BADANIA, LISTA ZMIENNYCH OBJAŚNIAJĄCYCH I OBJAŚNIANYCH, POSTAĆ FUNKCYJNA MODELU.
W OPARCIU O TEORIĘ EKONOMII, ZEBRANE DANE STATYSTYCZNE, KORELACJE.
ZEBRANIE DANYCH STATYSTYCZNYCH
ZEBRANIE DANYCH, UPORZĄDKOWANIE (SZEREGI CZASOWE, PRZEKROJOWE, PRZEKROJOWO-CZASOWE) I ANALIZA PRZYDATNOŚCI DANYCH. OKREŚLENIE MIERNIKA, PORÓWNYWALNOŚĆ DANYCH.
ESTYMACJA PARAMETRÓW
WYZNACZENIE OCEN PARAMETRÓW STRUKTURALNYCH ORAZ
PARAMETRÓW STRUKTURY STOCHASTYCZNEJ MODELU.
NARZĘDZIE - METODA NAJMNIEJSZYCH KWADRATÓW (MNK).
WERYFIKACJA MODELU
ANALIZA OTRZYMANYCH OCEN PARAMETRÓW STRUKTURALNYCH I STRUKTURY STOCHASTYCZNEJ MODELU.
WERYFIKACJA MERYTORYCZNA I STATYSTYCZNA.
PRAKTYCZNE WYKORZYSTANIE MODELU
ANALIZA PRAWIDŁOWOŚCI ( HISTORYCZNA ).
PROGNOZOWANIE
ESTYMACJA PARAMETRÓW
MODELU EKONOMETRYCZNEGO
(ESTYMACJA PUNKTOWA)
METODA NAJMNIEJSZYCH KWADRATÓW (MNK)
Model
- empiryczna wartość zmiennej objaśnianej w okresie t
- empiryczna wartość zmiennej objaśniającej j w okresie t
- nieznany parametr stojący przy zmiennej
- zakłócenie w okresie t (składnik losowy)
Zapis macierzowy modelu
Model po oszacowaniu parametrów strukturalnych
lub
- empiryczna wartość zmiennej objaśnianej w okresie t
- teoretyczna wartość zmiennej objaśnianej w okresie t
- empiryczna wartość zmiennej objaśniającej j w okresie t
- oszacowany parametr stojący przy zmiennej
-realizacja zakłócenia w okresie t (reszta w okresie t)
Zapis macierzowy oszacowanego modelu
lub
gdzie
Wzór MNK
(Wyprowadzenie wzoru)
Minimalizujemy sumę kwadratów reszt modelu:
Znajdujemy wartość najmniejszą powyższej funkcji
(pochodna po a przyrównana do 0)
Wzór MNK ma postać:
WARUNKI STOSOWALNOŚCI MNK
Zmienna objaśniana y jest zmienną losową,
Zmienne objaśniające X nie są zmiennymi losowymi,
n>k , tzn. liczba obserwacji n powinna być większa
od liczby szacowanych parametrów (zmiennych objaśniających) k
zmienne objaśniające nie mogą być współliniowe, tzn wektory obserwacji zmiennych objaśniających (kolumny macierzy X) powinny być liniowo niezależne.
składnik losowy musi spełniać następujące założenia:
εt : N(0, σ2 ),
E(εt )=0,
D2 (εt )=σ2 oraz
Cov (εiεj) =0, i≠j
W zapisie macierzowym 4 powyższe założenia sprowadzają się do następującej postaci macierzy wariancji i kowariancji składnika losowego
Przy w/w założeniach MNK daje estymatory:
zgodne,
nieobciążone i
najefektywniejsze.
Estymacja przedziałowa parametrów strukturalnych modelu
Zakładając, że εt:N(0,σ) dla każdego t otrzymujemy, że estymatory (aj) parametrów (αj) mają również rozkłady normalne:
W praktyce zastępujemy nieznane odchylenie standardowe D(aj) odchyleniem S(aj) postaci:
gdzie:
- j-ty element głównej przekątnej macierzy (XTX)-1
- wariancja resztowa wyliczana jako:
Można oszacować nieznane wartości parametrów używając techniki estymacji przedziałowej (przedziały ufności).
Przedział ufności z przyjętym z góry prawdopodobieństwem u=1-α (poziom ufności) pokrywa nieznaną wartość parametru αj.
tα,r - wartość krytyczna zmiennej o rozkładzie t-Studenta
dla r=n-k stopniach swobody przy ustalonym z góry poziomie istotności (α).
Miara dopasowania oszacowanego modelu do danych empirycznych
(współczynnik determinacji R2)
Mówi nam w jakim procencie zmienność y
jest objaśniana przez model.
W modelu musi występować wyraz wolny.
Interpretacja jest poprawna pod warunkiem, że badane związki są liniowe.
R2 przyjmuje wartości z przedziału (0, 1)
ŚREDNI BŁĄD SZACUNKU
(SEE-Standard Error of Estimation)
Wariancja resztowa
Średni błąd szacunku
Przewidywane przez oszacowane równanie (model) wartości zmiennej objaśnianej y (y teoretyczne)
średnio różnią się od empirycznych wartości tej zmiennej (y empiryczne) o wartość błędu Se.
Testowanie istotności ocen parametrów
(tj. testowanie trafności doboru zmiennej objaśniającej)
HIPOTEZY
H0: j = 0 (zmienna Xj nie ma wpływu
na zmienną objaśnianą y)
H1: j ≠ 0 (zmienna Xj ma wpływ
na zmienną objaśnianą y)
SPRAWDZIAN
S(aj) jest średnim błędem szacunku nieznanego parametru j.
cjj jest j-tym elementem głównej przekątnej macierzy (XTX)-1.
Statystyka t(aj) ma rozkład Studenta o n-k stopniach swobody.
Wyliczoną wartość sprawdzianu t(aj) porównujemy z odczytaną z tablic Studenta wartością krytyczną tα,r. Jeżeli:
| t(aj) | ≤ tα,r. nie ma podstaw do odrzucenia hipotezy H0
| t(aj) | > tα,r. odrzucamy H0 na korzyść H1.
Testowanie założeń
dla składnika losowego modelu
Macierz wariancji składnika losowego powinna mieć w przypadku MNK następującą postać:
W przypadku braku spełnienia założeń odnośnie do składnika losowego nie wolno używać metody MNK.
O przypadku heteroskedstyczności mówimy gdy na głównej przekątnej tej macierzy są różne elementy.
O przypadku autokorelacji powiemy gdy poza główną przekątną tej macierzy będą elementy niezerowe.
Dodatkowo powinniśmy sprawdzić czy składniki losowe mają rozkłady normalne.
Testowanie przypadku heteroskedastyczności
Problem ten najczęściej występuje przy estymacji modelu na podstawie danych przekrojowych lub przekrojowo-czasowych.
Załóżmy że dane pochodzą z dwóch różnych populacji.
Wówczas na głównej przekątnej macierzy wariancji i kowariancji mogą wystąpić dwie różne wartości wariancji:
oraz
.
Statystyczną istotność różnic testujemy wykorzystując test F Snedecora.
Sprawdzianem hipotezy (H0) jest statystyka F Snedecora postaci:
przy czym
o
oraz
stopniach swobody
,
- oznaczają wariancje resztowe dla prób odpowiednio z populacji pierwszej i z populacji drugiej
Jeżeli
przy określonym poziomie istotności α, to należy użyć uogólnionej MNK (UMNK) zamiast klasycznej MNK.
Testowanie przypadku autokorelacji
składnika losowego
Przyczyny autokorelacji:
Dłuższe działanie czynników przypadkowych (powodujących zaburzenia w normalnym przebiegu zjawiska) niż w czasie przyjętym za jednostkę.
Błędy w budowie modelu.
Pominięcie jednej lub kilku istotnych zmiennych objaśniających.
Użycie zmiennej z nieprawidłowo określonym opóźnieniem.
Przyjęcie niewłaściwej postaci analitycznej modelu.
Test Durbina-Watsona (test DW)
Na początek obliczamy współczynnik autokorelacji reszt r dla modelu oszacowanego MNK:
et - reszta empiryczna dla okresu t w modelu oszacowanym MNK
Następnie weryfikujemy poniższe hipotezy (ρ jest nieznanym współczynnikiem autokorelacji składnika losowego):
(nie istnieje autokorelacja)
(istnieje autokorelacja dodatnia; jeżeli r jest dodatni)
lub
(istnieje autokorelacja ujemna; jeżeli r jest ujemny)
Sprawdzianem hipotezy H0 przy hipotezie alternatywnej H1: ρ>0 jest statystyka d.
Sprawdzianem hipotezy H0 przy hipotezie alternatywnej H1: ρ<0 jest statystyka 4−d.
Statystyka d ma rozkład Durbina-Watsona.
Jeżeli d≤dL odrzucamy H0 na rzecz H1. Istnieje autokorelacja.
Jeżeli d≥dU przyjmujemy H0. Brak autokorelacji.
Jeżeli dL<d<dU test nie daje odpowiedzi. Nie możemy podjąć decyzji o przyjęciu lub odrzuceniu H0. Należy podjąć decyzję o powiększeniu próby.
Testowanie normalności zakłóceń
(składnika losowego)
TEST JARQUE-BERA (TEST JB)
TEST JB jest oparty o trzeci oraz czwarty moment rozkładu.
Trzeci moment mówi o asymetrii. Dla rozkładów symetrycznych jest on równy zero (rozkład normalny jest rozkładem symetrycznym).
Czwarty moment mówi o smukłości rozkładu (tzw. kurtoza); (dla rozkładu normalnego kurtoza=3).
Test JB oparto na porównaniu jak miary asymetrii i kurtozy odbiegają od wielkości charakterystycznych dla rozkładu normalnego.
H0: składniki losowe podlegają rozkładowi normalnemu
H1: składniki losowe nie podlegają rozkładowi normalnemu
Sprawdzianem testu jest statystyka Jarque-Bera postaci:
gdzie:
Statystyka JB ma rozkład
zawsze o r=2 stopniach swobody (przykładowo dla poziomu istotności α=0,05 wartość krytyczna wynosi
).
Wnioskowanie na podstawie statystyki JB
Jeżeli
, to wówczas nie mamy podstaw do odrzucenia hipotezy H0 mówiącej o tym, że składniki losowe podlegają rozkładowi normalnemu.
Jeżeli natomiast
, to odrzucamy H0 i przyjmujemy hipotezę H1 mówiącą o tym, że składniki losowe podlegają rozkładowi innemu niż normalny.
Prognozowanie na podstawie modelu ekonometrycznego
TP - numer okresu na który dokonujemy prognozy
- nieznana przyszła wartość zmiennej objaśnianej dla okresu TP
- przyszła wartość zmiennej objaśnianej dla okresu TP wyliczona na podstawie modelu ekonometrycznego
- wektor obserwacji dla zmiennych objaśniających w okresie TP (dodatkowy wiersz w macierzy X)
PROGNOZA PUNKTOWA
Wartość prognozy
dla zmiennej objaśnianej na okres TP wyliczmy następująco:
ŚREDNI BŁĄD PREDYKCJI (STP)
PROGNOZA PRZEDZIAŁOWA
Przedział ufności dla nieznanej wartości zmiennej objaśnianej
w okresie TP.
gdzie:
- poziom ufności
- liczba stopni swobody
- wartość krytyczna rozkładu Studenta o r stopniach swobody przy poziomie istotności α
Komentarz do miar wyznaczanych
przez arkusz kalkulacyjny EXCEL
(analiza danych, regresja)
Wielokrotność R - współczynnik korelacji wielorakiej
R kwadrat - współczynnik determinacji (R2)
gdzie:
WSK - wyjaśniona suma kwadratów (ta część zmienności zmiennej objaśnianej, która została wyjaśniona przez model)
RSK - resztowa suma kwadratów (ta część zmienności zmiennej objaśnianej, której model nie wyjaśnia)
OSK - ogólna suma kwadratów OSK=WSK+RSK
Dopasowany R kw - skorygowany R kwadrat2 (współczynnik determinacji skorygowany stopniami swobody). Pozwala porównać dopasowanie równań różniących się ilością zmiennych objaśniających.
Błąd standardowy - pierwiastek z wariancji resztowej (
)
Obserwacje - liczba obserwacji (n)
ANALIZA WARIANCJI
df - degrees of freedom - liczba stopni swobody
liczba zmiennych objaśniających (k)
liczba obserwacji pomniejszona o liczbę szacowanych parametrów (n− k−1) lub (n− k) dla modelu bez wyrazu wolnego
razem (k+ n− k−1= n−1) lub (k+ n− k= n) dla modelu bez wyrazu wolnego
SS - sum of squares (kolejno: WSK, RSK, OSK)
MS - mean of squares (kolejno:
WSK/k, k - liczba zmiennych objaśniających,
RSK/(n-k-1), (k+1)→liczba szacowanych parametrów.
Statystyka F
Statystyka F ma rozkład Fishera. Jest ona związana z hipotezą odnośnie istotności szacunków parametrów.
H0: α1=α2=...=αk=0
Wszystkie zmienne objaśniające są nieistotne;
nie mają wpływu na zmienną objaśnianą
H1: co najmniej jeden z parametrów różny od zera
Co najmniej jedna zmienna objaśniająca ma wpływ
na zmienną objaśnianą
Uwaga! Stosowanie testów t oraz F jest poprawne przy założeniu,
że składnik losowy ma rozkład normalny
18
Ekonometria - materiały („folie”) do wykładu D.Miszczyńska, M.Miszczyński