Slajdy 01-02

Ekonometria

r Em

ilia Tom

c y

z k

Instytut Ekonometrii, Szkoła Główna Handlowa

Metody ilościowe w ekonomii

statystyka opisowa i matematyczna

programowanie matematyczne

analiza przepływów międzygałęziowych

e o

k no

n me

m t

e ria

analiza szeregów czasowych

teoria gier

ekonomia matematyczna

Ekonometria 110010-0609

Definicje ekonometrii

…jest nauką i sztuką stosowania metod

statystycznych do mierzenia relacji

ekonomicznych (G. C. Chow)

…to n

n u

a k

u a

a za

z j

a mu

m j

u ąc

ą a

a s

s ę

ę u

u t

s al

a an

a i

n em

m z

pomocą metod statystycznych, konkretnych ilościowych prawidłowości zachodzących w życiu gospodarczym (O. Lange)

…to to, czym zajmują się ekonometrycy

(A. S. Goldberger)

Ekonometria 110010-0609

Model ekonometryczny

Jest to formalny opis stochastycznej

zależności wyróżnionej wielkości,

z aw

a isk

s a

a l

u prze

z biegu

u proce

c su

ekonomicznego od czynników, które

je kształtują, wyrażony w formie

pojedynczego równania lub układu

równań.

Ekonometria 110010-0609

Klasyfikacja modeli

jedno- i wielorównaniowe,

liniowe i nieliniowe,

statyczne i dynamiczne,

p zy

z c

y z

c y

z n

y o

n wo-o

- p

o i

p so

s w

o e

e i

s m

m t

p oma

m t

a yc

y z

c n

z e

n ,

proste, rekurencyjne i o równaniach łącznie współzależnych.

Ekonometria 110010-0609

Klasyfikacja danych

szeregi czasowe: przedstawiają stan

badanego zjawiska w kolejnych

jednostkach czasu

d n

a e

e p

p ze

z k

e r

k ojowe:

e o

p su

s j

u ą

ą s

s an

n z

z aw

a isk

s a

a w

u t

s al

a ony

n m

m c

c a

z s

a i

s e,

e a

a e

e w

d i

n es

e i

s en

e i

n u

u d

różnych obiektów

dane panelowe (przekrojowo-czasowe),

obejmujące obie te płaszczyzny

równocześnie

Ekonometria 110010-0609

Model regresji prostej

y = α0 + α1 ⋅ x + ε

y – zmienna objaśniana

x – zm

m en

e n

n a

a o

b aś

a n

ś i

n aj

a ąc

ą a

α – wyraz wolny (stała)

α – współczynnik regresji

ε – składnik losowy

Ekonometria 110010-0609

Model regresji wielorakiej

y = α0 + α1 ⋅ x 1 + α2 ⋅ x + ...

+α ⋅ x + ε

zmiennych objaśniających może być wiele, ale ich

c l

icz

c b

z a

a nie

e moż

o e

e prz

r e

z k

e r

k a

r c

a z

c a

z ć

ć licz

c b

z y

obserwacji

ważne pojęcie: liczba stopni swobody

df = n – (k + 1)

stała i współczynniki regresji określane są łącznie mianem parametrów strukturalnych Ekonometria 110010-0609

Metoda najmniejszych kwadratów

MNK polega na wyznaczeniu takich oszacowań a wektora parametrów α, dla którego suma kwadratów reszt modelu jest najmniejsza.

Wektor reszt e to wektor różnic między

wartościami empirycznymi a teoretycznymi zmiennej objaśnianej:

e = y − yˆ = y − Xa Ekonometria 110010-0609

Oszacowania MNK

−1

(XT )X XT

y – wektor wartości zmiennej objaśnianej X – macierz wartości zmiennych

objaśniających

Ekonometria 110010-0609

Przykład: spożycie alkoholu

spożycie wódki i innych napojów alkoholowych (oprócz wina i piwa) w przeliczeniu na alkohol 100% w litrach na osobę (dane: GUS):

2001: 1,7

2 0

0 2

0 :

2 1

1 7

2003: 2,4

2004: 2,5

2005: 2,5

pytanie: o ile średnio rośnie spożycie napojów alkoholowych z roku na rok?

Ekonometria 110010-0609

Przykład: wyniki estymacji

wsp

błąd

stand

1,44

0,22

6,55

0,008

0,24

0,07

3,43

0,038

Ekonometria 110010-0609

Reszty MNK

MNK polega na wyznaczeniu takich oszacowań a wektora parametrów α, dla którego suma kwadratów reszt modelu jest najmniejsza.

Wektor reszt e to wektor różnic między

wartościami empirycznymi a teoretycznymi zmiennej objaśnianej:

e = y − yˆ = y − Xa Ekonometria 110010-0609

Przykład: reszty

obs

y teoret

reszty

1,7

1,68

0,02

1,7

1,92

-0,22

2,4

2,16

0,24

2,5

2,40

0,10

2,5

2,64

-0,14

Średnia reszt:

-5,6E-18

Ekonometria 110010-0609

Założenia klasycznej MNK

zmienne objaśniające są nielosowe i

nieskorelowane ze składnikiem losowym

macierz zmiennych objaśniających ma

p ł

e ny

y r

zą

z d

d k

k lum

m o

n wy:

y r

z X)=

= k

k 1 ≤

wartość oczekiwania składnika losowego jest równa zero

macierz wariancji i kowariancji wektora składników losowych jest ilorazem

macierzy jednostkowej i stałej

Ekonometria 110010-0609

Założenia MNK

z innego punktu widzenia

Sztuka ekonometrii to umiejętność określenia zbioru założeń zarazem dostatecznie

konkretnego i dostatecznie realistycznego, ab

a y

y j

k n

n j

a lep

e i

p ej

e w

y o

k rzy

z s

y t

s ać

ć d

d st

s ęp

ę n

p e

dane (E. Malinvaud)

[czyli, w wolnym tłumaczeniu P. Kennedy’ego,

“sztuka wykreślania krzywej linii od

nieuzasadnionych założeń do oczywistych

wniosków”]

Ekonometria 110010-0609

Własności estymatorów MNK

Na mocy twierdzenia Gaussa – Markowa

estymator KMNK jest estymatorem:

liniowym,

z o

g dn

d y

n m

m (

z i

b eż

e n

ż y

n m

m s

s och

c a

h s

a t

s yc

y z

c n

z i

n e

e d

d α

nieobciążonym: E(a) = α,

najefektywniejszym (o najmniejszej

wariancji) w klasie liniowych i

nieobciążonych estymatorów

Ekonometria 110010-0609

Dodatkowe założenie

W celu weryfikacji hipotez statystycznych formułuje się często dodatkowe założenie:

s ł

k ad

a n

d i

n k

k l

oso

s wy

y m

m de

d l

e u

u m

a r

ozk

z ł

k ad

normalny o wartości oczekiwanej 0 i

skończonej stałej wariancji.

Ekonometria 110010-0609

Interpretacja współczynników

regresji

Ocena (oszacowanie) a parametru

strukturalnego α występującego przy

m en

e n

n e

n j

e X

ozn

z a

n c

a z

c a

z ,

a o

e p

p ze

z c

e i

c ęt

ę ni

n e

zmieniła się wartość zmiennej objaśnianej, gdy przy nie zmienionych wartościach

innych zmiennych objaśniających (ceteris paribus) wartość zmiennej X wzrosła o

jednostkę.

Ekonometria 110010-0609

Przykład: interpretacja

z każdym kolejnym rokiem spożycie wódki i innych napojów alkoholowych (oprócz wina i piwa) w litrach na osobę rośnie średnio o 0,24

litra na osobę w przeliczeniu na alkohol 100% [w model

e u r

e res

e ji

s wi

w el

e orak

a iej

e n

j al

a eż

e ał

a o

ł by dodać

„ceteris paribus”]

w roku „zerowym” (poprzedzającym zakres próby zastosowanej do estymacji, czyli 2000) spożycie wódki i innych napojów alkoholowych wynosiło ok. 1,44 litra na osobę w przeliczeniu na alkohol 100% [w rzeczywistości 2,0 – zmiana trendu!

Por. dane_1_11.xls]

Ekonometria 110010-0609

Inne metody estymacji

MNW (metoda największej wiarygodności): modele nieliniowe, wielorównaniowe, o

heteroskedastycznym składniku losowym

UMM (

u gó

g lni

n ona

a m

m t

e oda

a m

m me

m n

e t

n ów):

dane panelowe

MZI (metoda zmiennych

instrumentalnych): zmienne objaśniające

skorelowane ze składnikiem losowym,

modele wielorównaniowe

Ekonometria 110010-0609

Weryfikacja statystyczna

interpretacja współczynnika determinacji i/lub kryteriów informacyjnych

test stopnia współliniowości zmiennych objaśniających

tes

e t

s y

y ist

s ot

o noś

o c

ś i

c :

podzbioru zmiennych objaśniających

poszczególnych zmiennych objaśniających

testy własności składnika losowego modelu:

autokorelacji

heteroskedastyczności

normalności rozkładu

Ekonometria 110010-0609

Klasyczny R2

kryterium wewnątrzpróbowe: mierzy

dopasowanie tych obserwacji, które należą do próby, ale nie daje informacji o wartości prognostycznej modelu

niem

a ej

e ąc

ą a

a f

f nkc

k j

c a

a licz

c b

z y

y zm

ien

e nyc

y h

objaśniających → pokusa maksymalizacji R2

przez dodanie kolejnych zmiennych do modelu

interpretowalny jedynie, gdy zależność pomiędzy zmienną objaśnianą a zmiennymi

objaśniającymi jest liniowa, parametry modelu oszacowano MNK, a model zawiera wyraz

wolny

Ekonometria 110010-0609

Inne współczynniki determinacji

Skorygowany:

uwzględnia liczbę zmiennych i karze za dodawanie zbędnych zmiennych

bar

a d

r zi

z ej

e w

iar

a y

r g

y od

o ny

y niż

ż kl

k as

a y

s c

y z

c n

z y

y R2

Niescentrowany:

stosowany w modelach szacowanych bez

wyrazu wolnego

Ekonometria 110010-0609

Kryteria informacyjne

ilość informacji zawarta w modelu definiowana jest jako odległość danego modelu od

“prawdziwego” i mierzona za pomocą

logarytmu funkcji wiarygodności

idea

a k

k y

r t

y er

e i

r um info

f r

o m

a y

c j

y neg

e o:

o miar

a a

stanowiąca równowagę między tą odległością a oszczędną specyfikacją modelu

definiowane jako przeciętna wartość logarytmu funkcji wiarygodności skorygowana o różnie zdefiniowaną funkcję straty

podstawowe: Akaike (AIC), Schwarza (SIC) Ekonometria 110010-0609

Kryteria informacyjne, c.d.

kryterium zarówno wewnątrz-, jak i

pozapróbowe (prognostyczne)

stosowane najczęściej w sytuacji, gdy badane mod

o el

e e

e n

e są

ą za

z g

a nież

e d

ż żo

ż n

o e,

e a

a t

e r

o i

r a

a ek

e o

k n

o om

nie daje wskazówek co do wyboru

AIC karze za niepotrzebne zmienne w modelu silniej niż SIC i skorygowany R2

Ekonometria 110010-0609

Współczynnik korelacji liniowej

mierzy kierunek i siłę zależności między dwiema zmiennymi X i Y

cov( X Y

)

⋅ DY

bezwzględna wartość r

świadczy o sile

współzależności zmiennych (stopniu

determinacji wartości jednej zmiennej przez wartości drugiej zmiennej)

Ekonometria 110010-0609

Współczynnik korelacji, c.d.

jest wielkością niemianowaną

= r

jeśli r

= 0, zmienne X i Y są nieskorelowane

jeś

e l

ś i r

< 0,

0 z

ien

e ne

e X i Y są

ą sk

s o

k r

o e

r l

e ow

o an

a e

ujemnie

jeśli r

> 0, zmienne X i Y są skorelowane

dodatnio

Ekonometria 110010-0609

Zapis współczynników korelacji

 r 

 1

r 

1 k

 





 2 

r 1

r k





R =

o = r

 M 

 M

M 

 







r 



k 1

k 2



r - współczynnik korelacji między X i X

r - współczynnik korelacji między Y i X

Ekonometria 110010-0609

Zastosowania

współczynników korelacji

model jest koincydentny, jeśli dla każdej zmiennej objaśniającej modelu spełniony jest warunek sgn(r ) = sgn(a ), gdzie a jest

oszacowaniem parametru strukturalnego przy zm

ien

e nej

e o

o jaś

a n

ś iaj

a ąc

ą e

c j

e Xi

pomiar efektu katalizy, czyli zakłócenia wyników estymacji modelu wskutek

występowania w modelu zmiennych –

katalizatorów

dobór zmiennych objaśniających do modelu metodą Hellwiga

Ekonometria 110010-0609

Weryfikacja hipotez

hipoteza statystyczna: przypuszczenie co do rozkładu populacji generalnej, którego

prawdziwość oceniana jest na podstawie wyników próby losowej

tes

e t

s s

s at

a yst

s ycz

c ny:

: r

e uła

a rozst

s rzygają

a c

ją a

c ,

a jak

ja ie

w niki

i p

róby p

ozwa

w l

a ają

ją uznać

ć s

s raw

a d

w zan

a ą

hipotezę za prawdziwą, a jakie – za fałszywą

hipoteza podlegająca weryfikacji nazywana jest hipotezą zerową (H ); jej zaprzeczenie – hipotezą 0

alternatywną (H )

hipotezę H uznaje się za prawdziwą w przypadku 1

odrzucenia H0

Ekonometria 110010-0609

Weryfikacja hipotez, c.d.

obszar krytyczny: jeśli wynik próby należy do tego obszaru, to H jest odrzucana

błąd I rodzaju: odrzucenie hipotezy H , która w 0

istocie jest prawdziwa (prawdopodobieństwo α)

błą

ł d

ą II

I ro

r d

o za

z j

a u: prz

r y

z j

y ęc

ę i

c e

e hipot

o ez

e y

y H , k

k ór

ó a

a w

istocie jest fałszywa (prawdopodobieństwo 1 –

α)

przed przystąpieniem do weryfikacji hipotezy ustala się dopuszczalne prawdopodobieństwo popełnienia błędu I rodzaju (najczęściej 1, 5

lub 10%)

Ekonometria 110010-0609

Parametryczne testy istotności

służą do weryfikacji hipotez o tym, że parametry rozkładu populacji generalnej

przyjmują ustalone wartości

h po

p tez

e y

y m

m j

a ą

ą p

p st

s ać

ć H

: β = β , H : β ≠ β ,

β = β , H :

β ≠ β ,

gdzie β jest dowolnym parametrem

rozkładu

najczęściej jesteśmy zainteresowani tylko jednym parametrem rozkładu (średnią) i

konkretną wartością β = 0

Ekonometria 110010-0609

Test istotności zmiennej

H : β = 0

H : β ≠ 0

Hipoteza zerowa mówi, że badany parametr, średnio rzecz biorąc, przyjmuje w populacji wartość zero (czyli że zmienna nie ma

statystycznie istotnego wpływu na zmienną objaśnianą).

Ekonometria 110010-0609

Test istotności zmiennej, c.d.

do testowania H służy statystyka t-

Studenta

jeśli spełnione jest założenie o normalności rozk

z ł

k ad

a u

u s

s ł

k ad

a n

d i

n ka

a l

oso

s weg

e o

g m

m de

d l

e u,

zmienna losowa t ma rozkład t-Studenta z n-(k+1) stopniami swobody

wartości krytyczne statystyki t-Studenta są stablicowane dla danego poziomu istotności α oraz liczby stopni swobody

Ekonometria 110010-0609

Empiryczny poziom istotności

najniższy poziom istotności, przy którym należy odrzucić hipotezę zerową

nazywany też krańcowym lub dokładnym poziomem istotności, gdyż wyraża prawdopodobieństwo popełnienia błędu I rodzaju

w w

ię

i k

ę s

k z

s o

z ś

o c

ś i

i pa

p ki

k e

i t

e ó

t w

ó ek

e o

k n

o om

e r

t y

r c

y z

c n

z yc

y h

oznaczany najczęściej jako „wartość p” lub „p-value”

pozwala weryfikować hipotezy o istotności zmiennych modelu bez konieczności wyznaczania statystyk testowych i sięgania do tablic

nie wymaga arbitralnego ustalenia poziomu istotności α

Ekonometria 110010-0609

Test istotności modelu

Hipotezę o jednoczesnej istotności wybranego podzbioru zmiennych objaśniających

testuje się przy pomocy dwóch testów dla du

d ż

u y

ż c

y h

h p

p ób:

uogólnionego testu Walda

testu LM (mnożnika Lagrange’a)

Ekonometria 110010-0609

Test Walda

oprócz modelu podstawowego szacujemy

model rozszerzony, z dodatkowymi

zmiennymi objaśniającymi x

, ...., x

k+1

k+m

sprawdzamy, czy są one statystycznie

ist

s otne

jeśli składnik losowy ma rozkład normalny, statystyka testu Walda ma rozkład F-Snedecora z r = m oraz r = n-(k+1)-m

stopniami swobody (gdzie m jest liczbą

dodatkowych zmiennych)

Ekonometria 110010-0609

Względne błędy szacunku

Opisują precyzję oszacowania konkretnego parametru:

a j

Dopuszczalne są błędy względne nie

przekraczające 50%.

Ekonometria 110010-0609

Test RESET

Regression Specification Error Test;

B.Ramsey [1969]

bardzo ogólny test, wykrywający wiele

bł

b ę

ł dó

d w

ó sp

s e

p cy

c fikacj

c i

j mod

o e

d lu:

pominięte zmienne objaśniające

korelację między zmienną objaśniającą a składnikiem losowym

błędną postać funkcyjną

Ekonometria 110010-0609

Test RESET, c.d.

idea: wiele nieliniowych funkcji można przybliżyć za pomocą wielomianów; zatem

jeżeli dodanie do zbioru regresorów ich

wyższych potęg znacząco poprawi dopasowanie mod

o el

e u, w

s a

k z

a u

z je

e to

o na

a zł

z e

e dob

o ra

r n

a ie

e jeg

e o

postaci funkcyjnej

pozwala wykryć błąd specyfikacji nawet w modelach, w których tradycyjne miary jakości (R2, statystyki istotności, test autokorelacji) dają dobre rezultaty

Ekonometria 110010-0609

Test RESET, c.d.

wymaga oszacowania rozszerzonego modelu, zawierającego potęgi wartości teoretycznych wyznaczonych na podstawie wyjściowego

modelu (uwaga: można spodziewać się

współliniowości tych zmiennych, nie należy więc

c p

r e

z s

e a

s d

a za

z ć

ć z

z ich

c licz

c b

z ą!

ą )

H : współczynniki przy dodatkowych

zmiennych są łącznie równe 0

na podstawie R2 modelu rozszerzonego oblicza się statystykę mnożnika Lagrange’a (LM =

n⋅R2) o asymptotycznym rozkładzie χ2 o liczbie stopni swobody równej liczbie dodanych

zmiennych do równania modelu

Ekonometria 110010-0609

Test Davidsona - McKinnona

sposób sprawdzenia poprawności specyfikacji modelu, zwłaszcza wobec kilku alternatywnych możliwości modelowania wybranego zjawiska

model traktowany jest jako kompletny, jeśli ró

r w

ó nan

a ie

e ko

k n

o ku

k re

r n

e cy

c j

y ne

e nie

e tłu

ł mac

a z

c y

badanego zjawiska lepiej

szacowane są dwa modele o identycznej

postaci funkcyjnej i tej samej liczbie zmiennych objaśniających, ale o rozłącznych zbiorach zmiennych

Ekonometria 110010-0609

Test Davidsona - McKinnona

(1)

= α0 +α1 ⋅

+...

+α ⋅

+ ε

X i

X ki

(2)

= β0 + β1 ⋅

+...

+ β ⋅

+ξ

Z i

k Z ki

o os

o z

s a

z c

a o

c w

o an

a iu mod

o el

e u (1)

1 t

e r

o e

r t

e yc

y z

c n

z e

wartości zmiennej Y dodawane są jako zmienna objaśniająca do modelu (2); jeśli zmienna ta okazuje się statystycznie nieistotna, model (2) jest traktowany jako kompletny. Procedura ta jest następnie powtarzana po odwróceniu

kolejności modeli (1) i (2).

Ekonometria 110010-0609