Michał Przybyliński, Materiały do zajęć z
Ekonometrii
Pojęcie modelu
Model ekonometryczny
Model jest to uproszczone przedstawienie rzeczywistości.
Modele mogą przyjmować różną postać. Modelami są na
Lawrence R. Klein:
przykład teorie ekonomiczne  wyrażone w postaci opisu
Model jest to schematyczne uproszczenie, pomijajÄ…ce nieistotne
słownego, wykresu lub równania matematycznego.
aspekty w celu wyjaśnienia wewnętrznego działania, formy lub
konstrukcji bardziej skomplikowanego mechanizmu.
Model ekonometryczny to równanie lub układ równań
(nierówności) dotyczący zjawisk ekonomicznych.
Główną zaletą modelu jest możliwość taniego i bezpiecznego
Modele ekonometryczne różnią się od modeli ekonomicznych
przeprowadzania eksperymentów  symulowania rzeczywistych
procesów. Najczęściej model kojarzy się z postacią fizyczną, na przede wszystkim tym, że są konstruowane z myślą o ich
przykład samolotem w zmniejszonej skali, ale często także
empirycznej weryfikacji i praktycznym zastosowaniu.
posługujemy się modelami słowno-logicznymi, graficznymi, czy też
matematycznymi. Modelami można nazwać teorie ekonomiczne.
Przykład modelu ekonometrycznego
Klasyfikacja modeli ekonometrycznych
Poniższe modele opisują zależność spożycia od dochodów w skali
Ze względu na postać funkcji:
makro.
Liniowe Nieliniowe
Ct = Ä… + ²Dt + µt Ci = Ä… + ²Di +µi
Ze względu na występowanie elementów losowych:
Ä…, ² - parametry
Ä…, ² - parametry
Deterministyczne Stochastyczne
µ - skÅ‚adnik losowy
µ - skÅ‚adnik losowy
C  spożycie z dochodów C  spożycie z dochodów Ze względu na charakter analizowanych związków:
indywidualnych w pewnym kraju indywidualnych w pewnym roku
Przyczynowo-skutkowe Symptomatyczne
w mln USD (zmienna objaśniana) w mln USD (zmienna objaśniana)
D  dochody osobiste ludności w D  dochody osobiste ludności w Ze względu na czynnik czasu:
tym kraju w mln USD (zmienna tym samym roku w mln USD Statyczne opisują zależności w obrębie jednego okresu (momentu)
objaśniająca) (zmienna objaśniająca) Dynamiczne uwzględniają czynnik czasu  zawierają opóznienia lub
zmienną czasową. Szczególnym przypadkiem modelu dynamicznego
t  numer okresu (np. roku) i  numer kraju jest model autoregresyjny
Etapy analizy ekonometrycznej
Modele jedno- i wielorównaniowe
Ze względu na ilość równań:
Opracowanie założeń
Teoria Dane
Jednorównaniowe Wielorównaniowe
Modele wielorównaniowe ze względu na powiązania pomiędzy
Budowa modelu:
zmiennymi dzielimy na:
1) Dobór zmiennych objaśniających 2) Wybór postaci modelu
Proste
Estymacja parametrów:
Rekurencyjne
1) Aspekt numeryczny 2) Aspekt statystyczny
O równaniach współzależnych
W odniesieniu do modeli wielorównaniowych używamy pojęć:
Weryfikacja modelu:
Zmienna egzogeniczna 1) Weryfikacja merytoryczna 2) Weryfikacja statystyczna
Zmienna endogeniczna
Wykorzystanie modelu:
Zmienna z góry ustalona
1) Opis rzeczywistości 2) Prognozowanie 3) Symulacja
Michał Przybyliński, Materiały do zajęć z
Ekonometrii
Reszty
Model liniowy
et = yt - wt
wt = a1xt1 + a2xt 2 +K+ ak xtk
n n
2
et = 0 min
yt = a1xt1 + a2xt 2 +K+ ak xtk + et " "et
t =1 t=1
yt - obserwacja na zmiennej objaśnianej w okresie t,
n n
xtj - obserwacja na j-tej zmiennej objaśniającej w okresie t,
et2 = ( yt - wt )2 =
" "
aj - parametr występujący przy j-tej zmiennej objaśniającej,
t =1 t =1
t = 1, 2, ..., n.
n
2
Jeśli obserwujemy n obiektów w tym samym okresie użyjemy
= [yt - (a1xt1 + a2 xt 2 + K + ak xtk )]
"
subskryptu i zamiast t.
t =1
Wzór MNK  Metoda Najmniejszych
Zapis macierzowy
Kwadratów
Ponieważ opracowano wiele modyfikacji tej metody, poniższą formułę
y1
îÅ‚ łł
x11 x12 ... x1k îÅ‚a1łł îÅ‚e1łł okreÅ›la siÄ™ także jako KlasycznÄ… MetodÄ™ Najmniejszych Kwadratów
îÅ‚ łł
(KMNK), po angielsku Ordinary Least Squares (OLS)
ïÅ‚y śł
ïÅ‚x x22 ... x2kśł ïÅ‚a2śł ïÅ‚e2śł
2 n
ïÅ‚ śł ïÅ‚ śł ïÅ‚ śł
21
ïÅ‚ śł
et2 = eTe = (y - Xa )T (y - Xa ) =
"
ïÅ‚ śł ïÅ‚ ïÅ‚
. . . . .
śł, a=ïÅ‚ . śł e=ïÅ‚ . śł
t =1
y=ïÅ‚ śł, X=ïÅ‚
śł, śł,
ïÅ‚ śł
. . . . . . .
ïÅ‚ śł ïÅ‚ śł ïÅ‚ śł
= yTy - 2aTXTy + aTXTXa min
ïÅ‚ śł
ïÅ‚ śł ïÅ‚ śł ïÅ‚ śł
. . . . . . .
ïÅ‚ śł
ïÅ‚ śł
- 2XTy + XTXa = 0 XTXa = XTy
ïÅ‚ śł
xn2 ... xnkûÅ‚ ïÅ‚ śł ïÅ‚ śł
ðÅ‚xn1
n
ïÅ‚ śł ïÅ‚ śł ïÅ‚ śł
ðÅ‚y ûÅ‚ ðÅ‚akûÅ‚ ðÅ‚enûÅ‚
-1
e = y - w a = (XTX) XTy
w = Xa y = Xa+e
Przykład Zapis w postaci układu równań
i yi xi 2,5 y
1 = a1 + a2 Å"10 + e1
1 1 10
1 = a1 + a2 Å"8 + e2
2
2 1 8
3 1,5 12
1,5 = a1 + a2 Å"12 + e3
1,5
4 1,2 10
yi = a1 + a2xi + ei 1,2 = a1 + a2 Å"10 + e4
5 1,6 161
6 1,6 14 1,6 = a1 + a2 Å"16 + e5
0,5
7 1,2 11
1,6 = a1 + a2 Å"14 + e6
x
0
8 1,3 13
0 2 4 6 8 10 12 14 16 18 20 1,2 = a1 + a2 Å"11 + e7
9 2 18
i  numer gospodarstwa domowego
1,3 = a1 + a2 Å"13 + e8
yi  wydatki na odzież w tys. złotych na osobę rocznie
2 = a1 + a2 Å"18 + e9
xi  dochód w tys. złotych na osobę rocznie
Michał Przybyliński, Materiały do zajęć z
Ekonometrii
1 10
îÅ‚ łł
Zapis macierzowy ïÅ‚1 8 śł
Obliczenia
ïÅ‚ śł
ïÅ‚1 12śł
e1
îÅ‚ łł
1 1 10
îÅ‚ łł îÅ‚ łł
ïÅ‚1 10śł
9 112
ïÅ‚e2 śł îÅ‚ 1 1 1 1 1 1 1 1 1 łłïÅ‚1 îÅ‚ łł
ïÅ‚ śł ïÅ‚1 8 śł XT X =
1 ïÅ‚10 8 12 10 16 14 11 13 18śłïÅ‚ 16śł = ïÅ‚112 1474śł
śł
ïÅ‚ śł ðÅ‚ ûÅ‚ ðÅ‚ ûÅ‚
ïÅ‚ śł ïÅ‚ śł
ïÅ‚1 14śł
3
ïÅ‚e śł ïÅ‚ śł
1 11
ïÅ‚1,5śł ïÅ‚1 12śł
2,04155
îÅ‚ - 0,15512
łł
ïÅ‚1 13śł
(XT X)-1 =
ïÅ‚e4 śł
ïÅ‚- 0,15512 0,01247 śł
ïÅ‚1,2śł ïÅ‚1 10śł ïÅ‚ śł
ðÅ‚ ûÅ‚
a1
îÅ‚ łł
ïÅ‚ śł
ðÅ‚1 18ûÅ‚
ïÅ‚e śł 1
îÅ‚ łł
ïÅ‚1,6śł ïÅ‚1
a = e =
5
y = X = 16śł
ïÅ‚a śł ïÅ‚ śł
1
ïÅ‚ śł
ïÅ‚ śł ïÅ‚ śł
ïÅ‚ śł
ðÅ‚ 2ûÅ‚
6
ïÅ‚e śł
ïÅ‚1,5śł
ïÅ‚1,6śł ïÅ‚1 14śł
ïÅ‚1,2śł
ïÅ‚ śł
e7
ïÅ‚ śł ïÅ‚ śł îÅ‚ 1 1 1 1 1 1 1 1 1 12,4
łłïÅ‚ îÅ‚ łł
1,2 1 11
XTy =
ïÅ‚e8 śł ïÅ‚10 8 12 10 16 14 11 13 18śłïÅ‚1,6śł = ïÅ‚162,1śł
śł
ïÅ‚1,3śł ïÅ‚1 13śł
ðÅ‚ ûÅ‚ ðÅ‚ ûÅ‚
ïÅ‚1,6śł
ïÅ‚ śł
ïÅ‚ śł ïÅ‚ śł
ïÅ‚ śł
1,2
ïÅ‚ śł
0,16953
2 îÅ‚ łł
ïÅ‚ śł ïÅ‚ śł ðÅ‚e9 ûÅ‚
ïÅ‚1,3śł
ðÅ‚ ûÅ‚ ðÅ‚1 18ûÅ‚
a =
ïÅ‚ śł
ïÅ‚0,09709śł
y = Xa+e
2
ïÅ‚ śł ðÅ‚ ûÅ‚
ðÅ‚ ûÅ‚
Interpretacja parametrów funkcji liniowej
Oszacowane równanie
wi = 0,16953 + 0,09709Å" xi
a1 - wartość zmiennej y, gdy wszystkie x są równe 0
2,5
Gospodarstwo domowe nie posiadajÄ…ce dochodu powinno
wydawać na odzież przeciętnie ok. 170 zł/osobę rocznie.
2
Parametr ten (przy pewnych zastrzeżeniach) można
1,5 nazwać autonomicznym popytem na odzież.
1
a2 - reakcja y na jednostkowy wzrost x
Wzrost dochodów o tysiąc zł/osobę powoduje w przeciętnym
0,5
gospodarstwie domowym wzrost wydatków na odzież o ok.
0 97 zł/osobę. Parametr ten można nazwać krańcową
skłonnością do konsumpcji odzieży.
0 5 10 15 20
Wartości teoretyczne i reszty
Warunki formalne stosowalności MNK
i yi xi yi ei
1 1 10 1,1404 -0,1404
2 1 8 0,9463 0,0537 Parametry modelu można oszacować MNK jeżeli:
3 1,5 12 1,3346 0,1654
1) Model jest liniowy lub można go doprowadzić do
postaci liniowej
4 1,2 10 1,1404 0,0596
5 1,6 16 1,723 -0,1230 2) Liczba obserwacji musi być większa niż liczba
szacowanych parametrów (n>k)
6 1,6 14 1,5288 0,0712
3) macierz XTX nie jest osobliwa (można wyznaczyć
7 1,2 11 1,2375 -0,0375
macierz do niej odwrotnÄ…)
8 1,3 13 1,4317 -0,1317
9 2 18 1,9172 0,0828
Michał Przybyliński, Materiały do zajęć z
Ekonometrii
Wyniki obliczeń jako oszacowania
Własności estymatorów MNK
parametrów w populacji generalnej
Estymator a wektora parametrów ą modelu
ekonometrycznego wyznaczony przy pomocy MNK jest
yt = Ä…1xt1 +Ä…2xt 2 +K+Ä…k xtk + µt
estymatorem nieobciążonym, zgodnym i najbardziej
efektywnym jeżeli:
y, x - wartości zmiennych w populacji generalnej
Ä… - parametr w populacji generalnej
E(µt )= 0
µ - skÅ‚adnik losowy,
2
D2(µt )= Ã
parametry a traktujemy jako estymatory parametrów ą,
cov(µt ,µs )= 0, t `" s
wartości 0.16953 i 0.09709 są wtedy ocenami
parametrów ą1 i ą2 z populacji generalnej
Dodatkowo zakłada się, że rozkład składnika losowego jest normalny.
Założenie to umożliwia weryfikację modelu.
Współczynnik determinacji
Średni błąd szacunku
(SEE - Standard Error of Estimation)
n
2
"e
t
eTe
1) Przyczyny występowania błędu
t=1
R2 =1- =1-
n
2) Wariancja skÅ‚adnika losowego Ã2 jako miara błędu 2
"(y - y) yTy - ny2
t
3) Wariancja reszt jako oszacowanie wariancji składnika t=1
losowego
0.0993 0.0993
R2 =1- =1- = 0.8839
1 1
17.94-9Å"1.3782 0.8556
Se2 = eTe = (yT y - aT XT y)
n - k n - k
1
aT XTy - ny2
Se = Se2 = 0.0993 = 0.1191
R2 =
7
yTy - ny2
Ilustracja współczynnika determinacji Interpretacja współczynnika determinacji
Część zmienności y objaśniona przez model. Zbudowany
2
przez nas model tłumaczy zróżnicowanie wydatków w ok. 88
procentach. Ponieważ w modelu występuje tylko jedna
zmienna objaśniająca, możemy powiedzieć, że zróżnicowanie
1,6
wydatków na odzież w ok. 88 procentach wynika ze
zróżnicowania dochodów.
y Å› r.
Zastrzeżenia:
1,2
R2 jest podniesionym do kwadratu współczynnikiem
korelacji liniowej, i dlatego jego interpretacja jest poprawna
tylko wtedy, gdy badane zwiÄ…zki sÄ… liniowe. R2 przyjmuje
0,8
wartości z przedziału (0,1). W modelu musi występować
7 8 9 10 11 12 13 14 15 16 17 18 19
wyraz wolny.
Michał Przybyliński, Materiały do zajęć z
Ekonometrii
Przedział ufności dla parametru
Średnie błędy estymatorów
P{aj - S(aj)tÄ… <Ä… < aj + S(aj)tÄ…}=1-Ä…
j
2
S (aj)= Se2cjj cjj - element głównej
Wartość tą odczytujemy z tablic rozkładu t-Studenta
przekÄ…tnej macierzy (XTX)-1
dla n-k stopni swobody, na poziomie istotności ą.
S(aj)= Se cjj
P{0.1695-0.1702Å"2.365<Ä…1 < 0.1695+ 0.1702Å"2.365}= 0.95
P{-0.2387<Ä…1 < 0.5719}= 0.95
S(a1) = 0.1191 2.04155 = 0.17017
P{0.0971-0.0133Å"2.365<Ä…2 < 0.0971+ 0.0133Å"2.365}= 0.95
S(a2) = 0.1191 0.01247 = 0.0133
P{0.0656 < Ä…2 < 0.1285}= 0.95
Test istotności - przykład
Test istotności
Stawiamy hipotezę, że parametr w
H0 :Ä…j = 0 H0 :Ä…2 = 0
H0 :Ä…1 = 0
populacji generalnej jest równy 0.
Alternatywa  parametr ten jest różny H1 :ą2 `" 0
H1 :Ä…1 `" 0
H1 :Ä…j `" 0
od zera.
0,09709
0,16953
t(a2)= = 7,3
aj Dzielimy oszacowanie parametru przez
t(a1)= = 0,996
0,0133
t(aj)= 0,17017
błąd estymatora.
S(aj)
t(a2) >tÄ…
t(a1) d" tÄ…
Jeżeli wartość bezwzględna tego ilorazu
t(aj) >tą jest odpowiednio duża, odrzucamy H0.
Nie mamy podstaw do Odrzucamy H0. Parametr Ä…2
Parametr w populacji generalnej nie jest
odrzucenia hipotezy istotnie różni się od zera. X
t(aj) d"tą równy dokładnie aj, ale z określonym zerowej. Wyraz wolny nie ma istotny wpływ na Y.
prawdopodobieństwem możemy
różni się istotnie od zera.
stwierdzić, że różni się od zera.
Podstawowe problemy zwiÄ…zane z budowÄ…
Funkcja potęgowa
i estymacjÄ… modelu ekonometrycznego
Ä… Ä…3 Ä…k
yt = eÄ…1 xt12 xt 2 ...xt,k-1eµt
Ä… Ä… Ä…k
1) Współliniowość zmiennych objaśniających  zmienne
ln(yt ) = ln(eÄ…1xt12 xt23...xt,k-1eµt )
objaśniające są ze sobą wyraznie skorelowane
Ä…2 Ä…3 Ä…k t
1
ln( yt ) = ln eÄ… + ln xt1 + ln xt 2 + ... + ln xt,k -1 + ln eµ
2) Niejednorodność (heteroskedastyczność) składnika
ln(yt ) =Ä…1 lne +Ä…2 ln xt1 +Ä…3 ln xt2 +...+Ä…k ln xt,k-1 +µt lne
losowego  wariancja składnika losowego nie jest stała.
Zjawisko to występuje głównie w przypadku prób
ln(yt ) =Ä…1 +Ä…2 lnxt1 +Ä…3 lnxt2 +...+Ä…k lnxt,k-1 +µt
przekrojowych.
*
3) Autokorelacja składnika losowego. Problem ten występuje
yt = ln yt *
* * *
w przypadku prób czasowych. W kształtowaniu się
yt =Ä…1+Ä…2xt1+Ä…3xt2 +...+Ä…kxt,k-1+µt
*
składnika losowego występuje pewna prawidłowość, np.
xt, j = lnxt, j
reszty układają się w długie dodatnie i ujemne serie.
*
wt = ewt
Michał Przybyliński, Materiały do zajęć z
Ekonometrii
Zasady doboru zmiennych objaśniających
Współliniowość zmiennych
18
objaśniających
16
14
12
Konsekwencje: niemożność wyodrębnienia wpływu y
yt =Ä…1 +Ä…2x1t +µt
10
x1
8
poszczególnych x-ów na y, co prowadzi do  dziwnych
x2
6
oszacowań parametrów. Oszacowania te są bardzo wrażliwe
4
yt =Ä…1 +Ä…2x2t +µt
2
na dodanie lub usunięcie obserwacji. W przypadku silnej
0
współliniowości uzyskane oszacowania parametrów możemy
1 2 3 4 5 6 7 8 9 10 11
20
uznać za przypadkowe, i nie mamy do nich zaufania.
18
16
Postępowanie: 14
12 y
" Usunąć (zastąpić) jedną ze skorelowanych zmiennych
10 x1
8 x2
objaśniających
6
" Ustalić z góry wartość jednego z parametrów 4
yt =Ä…1 +Ä…2x1t +Ä…3x2t +µt
2
" Zastosować specjalną technikę estymacji
0
1 2 3 4 5 6 7 8 9 10 11
Niejednorodność (heteroskedastyczność)
Test Goldfelda-Quandta
1. Dzielimy próbę na co najmniej dwie części, zgodnie z wiedzą a priori
składnika losowego - przykład
i szacujemy parametry modelu osobno dla każdej z tych podprób.
Obliczamy wariancje reszt, a następnie wybieramy dwie skrajne
wartości. Największą oznaczmy Se12 a najmniejszą Se22.
2 2
2. Stawiamy hipotezÄ™: H0 :Ã1 = Ã
2
2 2 2 2
H1 :Ã1 `" Ã albo H1 :Ã1 > Ã
2 2
3. W tablicach rozkładu F znajdujemy wartość krytyczną dla
wybranego poziomu istotności i liczby stopni swobody w obu
podpróbach:
Fn1-k ,n2-k
2
Se1
4. Obliczamy sprawdzian testu:
F =
do c ho dy
2
Se2
W tej populacji zróżnicowanie wydatków rośnie wraz ze wzrostem
5. Sprawdzamy warunek:
F > Fn1-k ,n2-k
dochodów. Rozrzut punktów wokół prostej zależy od poziomu zmiennej
objaśniającej  nie jest jednakowy (stały) dla gospodarstw o różnych Jeżeli warunek jest spełniony, odrzucamy H0, co oznacza, że wariancja
dochodach. składnika losowego nie jest jednorodna w całej populacji.
Przykład testu Goldfelda-Quandta
Autokorelacja składnika losowego
Badane gospodarstwa podzielono na biedne i bogate
i yi xi
sortujÄ…c je zgodnie z osiÄ…ganymi dochodami. Przy
2 1 8 cov(µt ,µt-i ) `" 0
pomocy MNK oszacowano parametry modelu dla
1 1 10
gospodarstw biednych, o dochodach 12 tys. zł./os. i
Najprostszy przypadek to schemat autoregresyjny
4 1,2 10
mniej, uzyskujÄ…c Se2= 0,016591. Podobnie, dla
pierwszego rzędu AR(1):
7 1,2 11
gospodarstw bogatych (13 tys. zł/os. i powyżej)
µt = Áµt-1 +¾t
3 1,5 12 uzyskano Se2= 0,016949. Ponieważ wariancja reszt w
18 14
gospodarstwach bogatych jest wyższa niż w biednych,
8 1,3 13 16
12
to ona znajdzie się w liczniku wyrażenia F.
14
6 1,6 14
10
2 12
Se1 0,016949
5 1,6 16 8
10
F = = = 1,021578
2
8
6
9 2 18 Se2 0,016591
6
4
PrzyjmujÄ…c jednostronny obszar odrzucenia, odczytujemy z tablic
4
2
2
wartość 5,462 (dla poziomu istotności ą=0,1 i odpowiednio 3 i 2
0 0
stopni swobody). Ponieważ wartość testu jest niższa, stwierdzamy, że
1 2 3 4 5 6 7 8 9 10 11 12 13 14 1 2 3 4 5 6 7 8 9 10 11 12 13 14
nie ma podstaw do odrzucenia hipotezy zerowej, czyli wariancja w
Autokorelacja dodatnia Autokorelacja ujemna
populacji generalnej jest stała.
wydatki