Ekonometria
Metody ilościowe w ekonomii
statystyka opisowa i matematyczna
programowanie matematyczne
analiza przepływów międzygałęziowych
ek
e o
k no
n me
m t
e ria
analiza szeregów czasowych
teoria gier
ekonomia matematyczna
2
Definicje ekonometrii
…jest nauką i sztuką stosowania metod
statystycznych do mierzenia relacji
ekonomicznych (G. C. Chow)
…to n
a
n u
a k
u a
k
a za
z j
a mu
m j
u ąc
ą a
c
a s
i
s ę
ę u
s
u t
s al
a an
a i
n em
e
,
m z
a
z
a
pomocą metod statystycznych, konkretnych ilościowych prawidłowości zachodzących w życiu gospodarczym (O. Lange)
…to to, czym zajmują się ekonometrycy
(A. S. Goldberger)
3
Model ekonometryczny
Jest to formalny opis stochastycznej
zależności wyróżnionej wielkości,
zj
z aw
a isk
s a
a l
ub
u prze
z biegu
u proce
c su
s
u
ekonomicznego od czynników, które
je kształtują, wyrażony w formie
pojedynczego równania lub układu
równań.
4
Klasyfikacja modeli
jedno- i wielorównaniowe,
liniowe i nieliniowe,
statyczne i dynamiczne,
pr
p zy
z c
y z
c y
z n
y o
n wo-o
- p
o i
p so
s w
o e
w
e i
s
y
s m
y
p
m t
p oma
m t
a yc
y z
c n
z e
n ,
e
proste, rekurencyjne i o równaniach łącznie współzależnych.
5
Klasyfikacja danych
szeregi czasowe: przedstawiają stan
badanego zjawiska w kolejnych
jednostkach czasu
da
d n
a e
n
e p
r
p ze
z k
e r
k ojowe:
e o
pi
p su
s j
u ą
ą s
t
s an
a
n z
j
z aw
a isk
s a
k
a w
us
u t
s al
a ony
n m
y
m c
z
c a
z s
a i
s e,
e a
l
a e
e w
o
dn
d i
n es
e i
s en
e i
n u
u d
o
d
różnych obiektów
dane panelowe (przekrojowo-czasowe),
obejmujące obie te płaszczyzny
równocześnie
Ekonometria 110010-0609
6
Model regresji prostej
y = α0 + α1 ⋅ x + ε
i
i
i
y – zmienna objaśniana
i
x – zm
z
i
m en
e n
n a
n
a o
bj
b aś
a n
ś i
n aj
a ąc
ą a
c
i
α – wyraz wolny (stała)
0
α – współczynnik regresji
1
ε – składnik losowy
i
7
Model regresji wielorakiej
y = α0 + α1 ⋅ x 1 + α2 ⋅ x + ...
2
+α ⋅ x + ε
i
i
i
k
ki
i
zmiennych objaśniających może być wiele, ale ich
c l
icz
c b
z a
a nie
e moż
o e
ż
e prz
r e
z k
e r
k a
r c
a z
c a
z ć
a
ć licz
c b
z y
y
obserwacji
ważne pojęcie: liczba stopni swobody
df = n – (k + 1)
stała i współczynniki regresji określane są łącznie mianem parametrów strukturalnych Ekonometria 110010-0609
8
Metoda najmniejszych kwadratów
MNK polega na wyznaczeniu takich oszacowań a wektora parametrów α, dla którego suma kwadratów reszt modelu jest najmniejsza.
Wektor reszt e to wektor różnic między
wartościami empirycznymi a teoretycznymi zmiennej objaśnianej:
e = y − yˆ = y − Xa 9
Oszacowania MNK
−1
a
(XT )X XT
=
y
y – wektor wartości zmiennej objaśnianej X – macierz wartości zmiennych
objaśniających
10
Przykład: spożycie alkoholu
spożycie wódki i innych napojów alkoholowych (oprócz wina i piwa) w przeliczeniu na alkohol 100% w litrach na osobę (dane: GUS):
2001: 1,7
20
2 0
0 2
0 :
2 1
,
1 7
2003: 2,4
2004: 2,5
2005: 2,5
pytanie: o ile średnio rośnie spożycie napojów alkoholowych z roku na rok?
11
Przykład: wyniki estymacji
wsp
błąd
t
p
stand
α
1,44
0,22
6,55
0,008
0
α
0,24
0,07
3,43
0,038
1
12
Reszty MNK
MNK polega na wyznaczeniu takich oszacowań a wektora parametrów α, dla którego suma kwadratów reszt modelu jest najmniejsza.
Wektor reszt e to wektor różnic między
wartościami empirycznymi a teoretycznymi zmiennej objaśnianej:
e = y − yˆ = y − Xa 13
Przykład: reszty
obs
y
y teoret
reszty
1
1,7
1,68
0,02
2
1,7
1,92
-0,22
3
2,4
2,16
0,24
4
2,5
2,40
0,10
5
2,5
2,64
-0,14
Średnia reszt:
-5,6E-18
14
Założenia klasycznej MNK
zmienne objaśniające są nielosowe i
nieskorelowane ze składnikiem losowym
macierz zmiennych objaśniających ma
pe
p ł
e ny
n
y r
zą
z d
ą
d k
o
k lum
u
n
m o
n wy:
y r
z(
z X)=
= k
+
k 1 ≤
n
wartość oczekiwania składnika losowego jest równa zero
macierz wariancji i kowariancji wektora składników losowych jest ilorazem
macierzy jednostkowej i stałej
15
Założenia MNK
z innego punktu widzenia
Sztuka ekonometrii to umiejętność określenia zbioru założeń zarazem dostatecznie
konkretnego i dostatecznie realistycznego, ab
a y
b
y j
ak
a
k n
a
n j
a lep
e i
p ej
e w
yk
y o
k rzy
z s
y t
s ać
a
ć d
o
d st
s ęp
ę n
p e
n
e
dane (E. Malinvaud)
[czyli, w wolnym tłumaczeniu P. Kennedy’ego,
“sztuka wykreślania krzywej linii od
nieuzasadnionych założeń do oczywistych
wniosków”]
16
Własności estymatorów MNK
Na mocy twierdzenia Gaussa – Markowa
estymator KMNK jest estymatorem:
liniowym,
zg
z o
g dn
d y
n m
y
m (
zb
z i
b eż
e n
ż y
n m
y
m s
t
s och
c a
h s
a t
s yc
y z
c n
z i
n e
e d
o
d α
),
nieobciążonym: E(a) = α,
najefektywniejszym (o najmniejszej
wariancji) w klasie liniowych i
nieobciążonych estymatorów
17
Dodatkowe założenie
W celu weryfikacji hipotez statystycznych formułuje się często dodatkowe założenie:
sk
s ł
k ad
a n
d i
n k
k l
oso
s wy
y m
o
m de
d l
e u
u m
a
m
a r
ozk
z ł
k ad
a
d
normalny o wartości oczekiwanej 0 i
skończonej stałej wariancji.
18
Interpretacja współczynników
regresji
Ocena (oszacowanie) a parametru
i
strukturalnego α występującego przy
i
zm
z
i
m en
e n
n e
n j
e X
ozn
z a
n c
a z
c a
z ,
a o
i
le
e p
r
p ze
z c
e i
c ęt
ę ni
n e
e
i
zmieniła się wartość zmiennej objaśnianej, gdy przy nie zmienionych wartościach
innych zmiennych objaśniających (ceteris paribus) wartość zmiennej X wzrosła o
i
jednostkę.
19
Przykład: interpretacja
z każdym kolejnym rokiem spożycie wódki i innych napojów alkoholowych (oprócz wina i piwa) w litrach na osobę rośnie średnio o 0,24
litra na osobę w przeliczeniu na alkohol 100% [w model
e u r
eg
e res
e ji
s wi
w el
e orak
a iej
e n
j al
a eż
e ał
a o
ł by dodać
a
ć
„ceteris paribus”]
w roku „zerowym” (poprzedzającym zakres próby zastosowanej do estymacji, czyli 2000) spożycie wódki i innych napojów alkoholowych wynosiło ok. 1,44 litra na osobę w przeliczeniu na alkohol 100% [w rzeczywistości 2,0 – zmiana trendu!
Por. dane_1_11.xls]
20
Inne metody estymacji
MNW (metoda największej wiarygodności): modele nieliniowe, wielorównaniowe, o
heteroskedastycznym składniku losowym
UMM (
uo
u gó
g lni
n ona
n
a m
e
m t
e oda
d
a m
o
m me
m n
e t
n ów):
:
dane panelowe
MZI (metoda zmiennych
instrumentalnych): zmienne objaśniające
skorelowane ze składnikiem losowym,
modele wielorównaniowe
21
Weryfikacja statystyczna
interpretacja współczynnika determinacji i/lub kryteriów informacyjnych
test stopnia współliniowości zmiennych objaśniających
tes
e t
s y
y ist
s ot
o noś
o c
ś i
c :
podzbioru zmiennych objaśniających
poszczególnych zmiennych objaśniających
testy własności składnika losowego modelu:
autokorelacji
heteroskedastyczności
normalności rozkładu
22
Klasyczny R2
kryterium wewnątrzpróbowe: mierzy
dopasowanie tych obserwacji, które należą do próby, ale nie daje informacji o wartości prognostycznej modelu
niem
e
al
a ej
e ąc
ą a
c
a f
u
f nkc
k j
c a
a licz
c b
z y
y zm
z
ien
e nyc
y h
c
objaśniających → pokusa maksymalizacji R2
przez dodanie kolejnych zmiennych do modelu
interpretowalny jedynie, gdy zależność pomiędzy zmienną objaśnianą a zmiennymi
objaśniającymi jest liniowa, parametry modelu oszacowano MNK, a model zawiera wyraz
wolny
23
Inne współczynniki determinacji
Skorygowany:
uwzględnia liczbę zmiennych i karze za dodawanie zbędnych zmiennych
bar
a d
r zi
z ej
e w
iar
a y
r g
y od
o ny
y niż
ż kl
k as
a y
s c
y z
c n
z y
y R2
R
Niescentrowany:
stosowany w modelach szacowanych bez
wyrazu wolnego
Ekonometria 110010-0609
24
Kryteria informacyjne
ilość informacji zawarta w modelu definiowana jest jako odległość danego modelu od
“prawdziwego” i mierzona za pomocą
logarytmu funkcji wiarygodności
idea
e
a k
r
k y
r t
y er
e i
r um info
f r
o m
r
ac
a y
c j
y neg
e o:
o miar
a a
r
a
stanowiąca równowagę między tą odległością a oszczędną specyfikacją modelu
definiowane jako przeciętna wartość logarytmu funkcji wiarygodności skorygowana o różnie zdefiniowaną funkcję straty
podstawowe: Akaike (AIC), Schwarza (SIC) 25
Kryteria informacyjne, c.d.
kryterium zarówno wewnątrz-, jak i
pozapróbowe (prognostyczne)
stosowane najczęściej w sytuacji, gdy badane mod
o el
e e
e n
ie
e są
s
ą za
z g
a nież
e d
ż żo
ż n
o e,
e a
a t
eo
e r
o i
r a
a ek
e o
k n
o om
o
ii
nie daje wskazówek co do wyboru
AIC karze za niepotrzebne zmienne w modelu silniej niż SIC i skorygowany R2
26
Współczynnik korelacji liniowej
mierzy kierunek i siłę zależności między dwiema zmiennymi X i Y
cov( X Y
,
r
=
XY
)
XY
DX
D
⋅ DY
D
bezwzględna wartość r
świadczy o sile
XY
współzależności zmiennych (stopniu
determinacji wartości jednej zmiennej przez wartości drugiej zmiennej)
27
Współczynnik korelacji, c.d.
jest wielkością niemianowaną
r
= r
XY
YX
jeśli r
= 0, zmienne X i Y są nieskorelowane
XY
jeś
e l
ś i r
< 0,
0 z
m
z
ien
e ne
e X i Y są
s
ą sk
s o
k r
o e
r l
e ow
o an
a e
e
XY
ujemnie
jeśli r
> 0, zmienne X i Y są skorelowane
XY
dodatnio
28
Zapis współczynników korelacji
r
1
L
r
r
1
12
1 k
L
2
2
r 1
2
r k
R
R =
1
o = r
M
M
M
O
M
L
r
r
k
r
1
k 1
k 2
r - współczynnik korelacji między X i X
ij
i
j
r - współczynnik korelacji między Y i X
i
i
29
Zastosowania
współczynników korelacji
model jest koincydentny, jeśli dla każdej zmiennej objaśniającej modelu spełniony jest warunek sgn(r ) = sgn(a ), gdzie a jest
i
i
i
oszacowaniem parametru strukturalnego przy zm
z
ien
e nej
e o
b
o jaś
a n
ś iaj
a ąc
ą e
c j
e Xi
pomiar efektu katalizy, czyli zakłócenia wyników estymacji modelu wskutek
występowania w modelu zmiennych –
katalizatorów
dobór zmiennych objaśniających do modelu metodą Hellwiga
30
Weryfikacja hipotez
hipoteza statystyczna: przypuszczenie co do rozkładu populacji generalnej, którego
prawdziwość oceniana jest na podstawie wyników próby losowej
tes
e t
s s
t
s at
a yst
s ycz
c ny:
: r
eg
e uła
ł
a rozst
s rzygają
a c
ją a
c ,
a jak
ja ie
e
wy
w niki
i p
róby p
ozwa
w l
a ają
a
ją uznać
a
ć s
p
s raw
a d
w zan
a ą
ą
hipotezę za prawdziwą, a jakie – za fałszywą
hipoteza podlegająca weryfikacji nazywana jest hipotezą zerową (H ); jej zaprzeczenie – hipotezą 0
alternatywną (H )
1
hipotezę H uznaje się za prawdziwą w przypadku 1
odrzucenia H0
31
Weryfikacja hipotez, c.d.
obszar krytyczny: jeśli wynik próby należy do tego obszaru, to H jest odrzucana
0
błąd I rodzaju: odrzucenie hipotezy H , która w 0
istocie jest prawdziwa (prawdopodobieństwo α)
błą
ł d
ą II
I
I ro
r d
o za
z j
a u: prz
r y
z j
y ęc
ę i
c e
e hipot
o ez
e y
z
y H , k
t
k ór
ó a
r
a w
0
istocie jest fałszywa (prawdopodobieństwo 1 –
α)
przed przystąpieniem do weryfikacji hipotezy ustala się dopuszczalne prawdopodobieństwo popełnienia błędu I rodzaju (najczęściej 1, 5
lub 10%)
32
Parametryczne testy istotności
służą do weryfikacji hipotez o tym, że parametry rozkładu populacji generalnej
przyjmują ustalone wartości
hi
h po
p tez
e y
z
y m
a
m j
a ą
ą p
o
p st
s ać
a
ć H
: β = β , H : β ≠ β ,
0
β = β , H :
0
1
β ≠ β ,
0
0
1
0
gdzie β jest dowolnym parametrem
rozkładu
najczęściej jesteśmy zainteresowani tylko jednym parametrem rozkładu (średnią) i
konkretną wartością β = 0
0
33
Test istotności zmiennej
H : β = 0
H : β ≠ 0
0
1
Hipoteza zerowa mówi, że badany parametr, średnio rzecz biorąc, przyjmuje w populacji wartość zero (czyli że zmienna nie ma
statystycznie istotnego wpływu na zmienną objaśnianą).
34
Test istotności zmiennej, c.d.
do testowania H służy statystyka t-
0
Studenta
jeśli spełnione jest założenie o normalności rozk
z ł
k ad
a u
d
u s
k
s ł
k ad
a n
d i
n ka
k
a l
oso
s weg
e o
g m
o
m de
d l
e u,
u
zmienna losowa t ma rozkład t-Studenta z n-(k+1) stopniami swobody
wartości krytyczne statystyki t-Studenta są stablicowane dla danego poziomu istotności α oraz liczby stopni swobody
Ekonometria 110010-0609
35
Empiryczny poziom istotności
najniższy poziom istotności, przy którym należy odrzucić hipotezę zerową
nazywany też krańcowym lub dokładnym poziomem istotności, gdyż wyraża prawdopodobieństwo popełnienia błędu I rodzaju
w w
ię
i k
ę s
k z
s o
z ś
o c
ś i
c
i pa
p ki
k e
i t
e ó
t w
ó ek
e o
k n
o om
o
et
e r
t y
r c
y z
c n
z yc
y h
c
oznaczany najczęściej jako „wartość p” lub „p-value”
pozwala weryfikować hipotezy o istotności zmiennych modelu bez konieczności wyznaczania statystyk testowych i sięgania do tablic
nie wymaga arbitralnego ustalenia poziomu istotności α
Ekonometria 110010-0609
36
Test istotności modelu
Hipotezę o jednoczesnej istotności wybranego podzbioru zmiennych objaśniających
testuje się przy pomocy dwóch testów dla du
d ż
u y
ż c
y h
c
h p
r
p ób:
b
uogólnionego testu Walda
testu LM (mnożnika Lagrange’a)
Ekonometria 110010-0609
37
Test Walda
oprócz modelu podstawowego szacujemy
model rozszerzony, z dodatkowymi
zmiennymi objaśniającymi x
, ...., x
i
k+1
k+m
sprawdzamy, czy są one statystycznie
ist
s otne
n
jeśli składnik losowy ma rozkład normalny, statystyka testu Walda ma rozkład F-Snedecora z r = m oraz r = n-(k+1)-m
1
2
stopniami swobody (gdzie m jest liczbą
dodatkowych zmiennych)
38
Względne błędy szacunku
Opisują precyzję oszacowania konkretnego parametru:
a
S
w
S
j
S
=
a j
a j
Dopuszczalne są błędy względne nie
przekraczające 50%.
39
Test RESET
Regression Specification Error Test;
B.Ramsey [1969]
bardzo ogólny test, wykrywający wiele
bł
b ę
ł dó
d w
ó sp
s e
p cy
c fikacj
c i
j mod
o e
d lu:
u
pominięte zmienne objaśniające
korelację między zmienną objaśniającą a składnikiem losowym
błędną postać funkcyjną
40
Test RESET, c.d.
idea: wiele nieliniowych funkcji można przybliżyć za pomocą wielomianów; zatem
jeżeli dodanie do zbioru regresorów ich
wyższych potęg znacząco poprawi dopasowanie mod
o el
e u, w
sk
s a
k z
a u
z je
e to
o na
a zł
z e
ł
e dob
o ra
r n
a ie
e jeg
e o
o
postaci funkcyjnej
pozwala wykryć błąd specyfikacji nawet w modelach, w których tradycyjne miary jakości (R2, statystyki istotności, test autokorelacji) dają dobre rezultaty
Ekonometria 110010-0609
41
Test RESET, c.d.
wymaga oszacowania rozszerzonego modelu, zawierającego potęgi wartości teoretycznych wyznaczonych na podstawie wyjściowego
modelu (uwaga: można spodziewać się
współliniowości tych zmiennych, nie należy więc
ę
c p
rz
r e
z s
e a
s d
a za
z ć
a
ć z
z ich
c licz
c b
z ą!
ą )
H : współczynniki przy dodatkowych
0
zmiennych są łącznie równe 0
na podstawie R2 modelu rozszerzonego oblicza się statystykę mnożnika Lagrange’a (LM =
n⋅R2) o asymptotycznym rozkładzie χ2 o liczbie stopni swobody równej liczbie dodanych
zmiennych do równania modelu
42
Test Davidsona - McKinnona
sposób sprawdzenia poprawności specyfikacji modelu, zwłaszcza wobec kilku alternatywnych możliwości modelowania wybranego zjawiska
model traktowany jest jako kompletny, jeśli ró
r w
ó nan
a ie
e ko
k n
o ku
k re
r n
e cy
c j
y ne
e nie
e tłu
ł mac
a z
c y
z
y
badanego zjawiska lepiej
szacowane są dwa modele o identycznej
postaci funkcyjnej i tej samej liczbie zmiennych objaśniających, ale o rozłącznych zbiorach zmiennych
43
Test Davidsona - McKinnona
(1)
= α0 +α1 ⋅
+...
1
+α ⋅
+ ε
i
Y
X i
k
X ki
i
(2)
= β0 + β1 ⋅
+...
1
+ β ⋅
+ξ
i
Y
Z i
k Z ki
i
Po
o os
o z
s a
z c
a o
c w
o an
a iu mod
o el
e u (1)
1 t
eo
e r
o e
r t
e yc
y z
c n
z e
e
wartości zmiennej Y dodawane są jako zmienna objaśniająca do modelu (2); jeśli zmienna ta okazuje się statystycznie nieistotna, model (2) jest traktowany jako kompletny. Procedura ta jest następnie powtarzana po odwróceniu
kolejności modeli (1) i (2).
Ekonometria 110010-0609
44
Zasada Goodharta
Wszystkie modele ekonometryczne
prze
z st
s aj
a ą
ą d
zi
z ał
a a
ł ć
a
ć w m
o
m me
m nc
n i
c e, g
dy
zaczynają być stosowane dla potrzeb
polityki gospodarczej
45