modele regresji SGH metody statystyczne 2008


kwiecień, 2008 r.
Adam Szulc
Instytut Statystyki i Demografii
WYBRANE ZAGADNIENIA ESTYMACJI I WERYFIKACJI
JEDNORÓWNANIOWYCH MODELI REGRESJI
(w ramach wykładu:  Metody Statystyczne )
I. JEDNORÓWNANIOWY MODEL EKONOMETRYCZNY: ............................................... 2
OGÓLNE ZASADY KONSTRUKCJI, ESTYMACJI I WERYFIKACJI ................................ 2
1. Definicja modelu regresji................................................................................................. 2
2. Statystyczna analiza reszt modelu. ................................................................................. 4
3. Estymacja modelu liniowego za pomocą klasycznej metody najmniejszych kwadratów
(KMNK) ................................................................................................................................. 5
4. Ocena oszacowania modelu liniowego za pomocÄ… klasycznej MNK ........................... 5
5. Postępowanie w sytuacjach wykraczających poza schemat klasycznej MNK .................. 7
II. WYBRANE METODY ESTYMACJI MODELI REGRESJI .............................................. 8
1. MNK z warunkami dodatkowymi .................................................................................. 8
2. Estymacja modeli ekonometrycznych za pomocą metody największej wiarygodności
(MNW) ................................................................................................................................... 8
3. Uwagi o estymacji modeli nieliniowych.......................................................................... 9
4. Estymacja za pomocÄ… zmiennych instrumentalnych (MZI) ...................................... 10
5. Zmienne binarne w modelach regresji: regresja logitowa i probitowa..................... 12
III. TESTY STATYSTYCZNE W MODELACH REGRESJI ................................................ 14
1. Testy warunków ograniczających modelu ................................................................... 14
2. Testy specyfikacji modelu.............................................................................................. 16
3. Test stabilności parametrów ......................................................................................... 17
4. Test homoskedastyczności reszt .................................................................................... 17
Dekalog ekonometrii stosowanej według Petera Kennedy ego .................................. 18
Literatura podstawowa: .................................................................................................... 19
Literatura uzupełniająca: .................................................................................................. 19
ZADANIA............................................................................................................................ 20
ZASADY ZALICZANIA ZAJĆ ....................................................................................... 24
ZADANIA Z OSTATNIEGO SPRAWDZIANU ................................................................ 25
WYBRANE ZAGADNIENIA ESTYMACJI I WERYFIKACJI
JEDNORÓWNANIOWYCH MODELI REGRESJI
Motto 1: Ka\dy ekonomista jest ekonometrykiem czy tego chce czy nie (Joseph Schumpeter)
Motto 2: Są trzy złote zasady ekonometrii: testować, testować i testować (David Hendry)
Motto 3: Dwóch rzeczy lepiej nie oglądać w czasie ich powstawania: parówek i oszacowań
modeli ekonometrycznych (Edward Leamer )
I. JEDNORÓWNANIOWY MODEL EKONOMETRYCZNY:
OGÓLNE ZASADY KONSTRUKCJI, ESTYMACJI I WERYFIKACJI
1. Definicja modelu regresji
Jednorównaniowy model regresji jest zdefiniowany następująco:
yi = g(xi1, xi2,..., xik ) + µi (i =1,2,..., n) (1.1)
gdzie:
yi - i-ta wartość zmiennej objaśnianej (zale\nej),
xij - i-ta wartość j-tej zmiennej objaśniającej (niezale\nej; j=1,2,...k),
µi - i-ta reszta (bÅ‚Ä…d) modelu (ró\nica miÄ™dzy oszacowanÄ… i empirycznÄ… wartoÅ›ciÄ… yi),
n - liczba obserwacji,
k- liczba zmiennych objaśniających (je\eli w modelu występuje wyraz wolny to pozwalająca
oszacować odpowiedni parametr kolumna jedynek jest traktowana jako dodatkowa, k + 1-
sza zmienna).
Postać funkcji g określa typ modelu. W większości omawianych tu przypadków będzie to
funkcja liniowa. Model ma wtedy następującą postać:
yi = Ä…1xi1 + Ä…2xi2 + ... + Ä…kxik + Ä…0 + µi = Xia' + µi (i = 1,2,..., n) (1.2)
Alternatywna definicja modelu regresji jest następująca:
g(xi1, xi2,..., xik ) = E[Y | X = (xi1, xi2,..., xik )] (1.3)
Funkcja regresji g oznacza w tym przypadku warunkową wartość oczekiwaną zmiennej
objaśnianej, pod warunkiem, \e zmienne objaśniające przyjęły wartości określone przez (k-
wymiarowy) wektor X1. Aby modele zapisane za pomocą równań (1.1) i (1.3) były
równowa\ne, musi być spełniony warunek:
2
E(µ | X) = 0 (1.4)
1
Wartość tej funkcji jest zwykle zwana (nieprecyzyjnie) wartością teoretyczną zmiennej Y.
2
Taki zapis (stosowany w dalszej części konspektu) jest równowa\ny zapisowi wektorowemu:
2
tzn. wartość oczekiwana reszty modelu dla dowolnego wektora zmiennych objaśniających X
jest równa zeru.
f(Y|X)
lub
f(Y,X)
Y
N(Ä…1xn+Ä…0,Ã2)
Ä…1X+Ä…0
(xn,yn)
(x2,y2)
(x1,y1)
x1 x2 . . . xn X
Rys. 1.1. Zało\enia modelu regresji liniowej z jedną zmienną objaśniającą
RozpatrujÄ…c najprostszy z mo\liwych model regresji czyli model liniowy z jednÄ… zmiennÄ…
objaśniającą mo\na zilustrować istotę regresji ekonometrycznej za pomocą rysunku 1.1.
Przykładowo, dla zbioru gospodarstw domowych dane są indywidualne (czyli dostępne dla
ka\dego gospodarstwa osobno) informacje o ich (Å‚Ä…cznych) wydatkach na konsumpcjÄ™
(zmienna Y) i dochodach (zmienna X). Warunkowa wartość oczekiwana E(Y|X=xi) mo\e być
przedstawiona za pomocą prostej o równaniu: ą1xi1 + ą0. Zakłada się, \e rzeczywista wartość
zmiennej Y jest wynikiem losowania przy ustalonej wartości zmiennej X. Wartości
parametrów funkcji regresji szacuje się na podstawie próby (losowej lub nielosowej3). Tak jak
wszystkie wyniki estymacji uzyskane za pomocą próby, ró\nią się one od rzeczywistych
E[µ1 | X = (x11 , x12 ,..., x1k )] 0
îÅ‚ Å‚Å‚ îÅ‚ Å‚Å‚
ïÅ‚E[µ | X = (x21 , x22 ,..., x2k )]śł ïÅ‚0śł
2
ïÅ‚ śł ïÅ‚ śł
ïÅ‚ śł ïÅ‚ śł
. .
=
ïÅ‚ śł ïÅ‚. śł
.
ïÅ‚ śł ïÅ‚ śł
ïÅ‚ śł ïÅ‚. śł
.
ïÅ‚ śł ïÅ‚ śł
| X = (xn1 , xn2 ,..., xnk )]ûÅ‚ ðÅ‚0śł
ïÅ‚ śł ïÅ‚
ðÅ‚E[µn ûÅ‚
3
Nawet je\eli próba jest nielosowa, mo\na zastosować wnioskowanie statystyczne z uwagi na wy\ej
wymienione zało\enie odnośnie losowości Y.
3
(czyli  obowiązujących w populacji generalnej) wartości.4 Charakter zale\ności między
warunkową wartością oczekiwaną Y i zmienną X przesądzający o wyborze funkcji g jest (tak
jak ka\dy model) przyjętym zało\eniem na temat rzeczywistości. Mo\e ono być zatem
spełnione lub nie (dokładnie nie jest spełnione praktycznie nigdy). O tym czy przyjęcie danej
postaci jest sÅ‚uszne mo\na siÄ™ przekonać m. in. analizujÄ…c rozkÅ‚ad reszt modelu µ.
2. Statystyczna analiza reszt modelu.
Występowanie w modelu reszt czyli ró\nic między teoretyczną i empiryczną wartością
modelu jest wynikiem m. in. faktu, i\ na wartości Y mają wpływ nie tylko zmienne zawarte w
wektorze X. Inne przyczyny to błędy pomiaru wartości obu zmiennych (nie będą one
omawiane) oraz wybór niewłaściwej funkcji regresji. Znaczenie (często niedoceniane,
zwłaszcza w badaniach o charakterze aplikacyjnym) analizy reszt modelu wynika m. in. z
następujących przesłanek:
a/ Optymalną metodę szacowania parametrów modelu mo\na wybrać jedynie po
weryfikacji zało\eń odnośnie rozkładu reszt.
b/ Oszacowanie  teoretycznych wartości zmiennej objaśnianej oraz parametrów modelu
zawiera błędy losowe, które mo\na ocenić jedynie za pomocą analizy reszt.
c/ Jedynie za pomocą oceny rozkładu reszt mo\na stwierdzić czy przyjęcie określonej
postaci modelu jest uzasadnione.
Znajomość rozkładu reszt jest zatem konieczna zarówno na etapie modelowania jak i
weryfikacji.
Zało\enia odnośnie reszt jakie standardowo przyjmuje się w badaniu regresji opisują
równania 1.5 - 1.7.
E(µ | X) = E(µ) = 0 (1.5)
Warunek ten oznacza, oprócz zerowej wartości oczekiwanej reszt, ich niezale\ność od
wartości zmiennych objaśniających.
2
E(µµ'| X) = Ã I (1.6)
gdzie I jest macierzą diagonalną z wartościami 1 na przekątnej (zapis 2 oznacza transpozycje
wektora; w tym przypadku kolumna jest mno\ona przez wiersz). Zapis ten oznacza
spełnianie dwóch warunków, które łącznie określa się jako sferyczność reszt: reszty nie są ze
sobÄ… skorelowane, zaÅ› ich warunkowa wariancja jest równa staÅ‚ej Ã2, niezale\nie od wartoÅ›ci
X. W przypadku spełniania pierwszego warunku mówimy o braku autokorelacji reszt, w
przypadku drugiego o homoskedastyczności reszt. Niespełnianie tych warunków określa się,
odpowiednio, mianem autokorelacji reszt oraz ich heteroskedastyczności.
(µ | X) : N(0,ÃI) (1.7)
Warunek ten mówi, i\ rozkład reszt jest dla danych wartości X normalny, z zerową wartością
oczekiwanÄ… i wariancjÄ… Ã2.
4
Jest to kolejny powód, dla którego  teoretyczne wartości zmiennej objaśnianej uzyskane na podstawie
oszacowania modelu ró\nią się od rzeczywistych.
4
3. Estymacja modelu liniowego za pomocÄ… klasycznej metody
najmniejszych kwadratów (KMNK)
Zało\enia omówione w poprzedniej części muszą być spełnione5, aby parametry liniowego
modelu (1.2) mo\na było oszacować za pomocą klasycznej metody najmniejszych kwadratów
(MNK). Wówczas wektor oszacowań parametrów modelu (uzyskany przez minimalizacje
sumy kwadratów reszt) ma postać następującego iloczynu macierzy:
a = (XX')-1X'Y (1.8)
Oszacowanie wariancji reszt oblicza się następująco:
e'e
s2 = (1.9)
n - k -1
gdzie e jest wektorem empirycznych reszt modelu. Z kolei estymatory wariancji oszacowania
parametrów modelu (będących miarą błędu oszacowania) uzyskuje się za pomocą wzoru:
2
S (a) = s2 (X'X)-1 (1.10)
Je\eli wszystkie wymienione wcześniej zało\enia (liniowość warunkowej wartości
oczekiwanej, zało\enia 1.5 - 1.7 oraz odpowiedni rząd macierzy danych) są spełnione, to
uzyskane estymatory sÄ… nieobciÄ…\one, zgodne i najefektywniejsze (majÄ… najmniejszÄ…
wariancję ze wszystkich nieobcią\onych estymatorów). Spełnianie powy\szych zało\eń nie
pozwala jeszcze stwierdzić, \e oszacowany model spełnia stawiane przed nim wymagania
(np. pozwala wykorzystać oszacowania w prognozowaniu lub wyznaczaniu relacji
ekonomicznych między zmiennymi). Jest jednak warunkiem koniecznym dla poprawności
oszacowań uzyskanych za pomocą MNK.
W przypadku, gdy w modelu występuje tylko jedna zmienna objaśniająca (k=2, a macierz X
ma wymiary n x 2) wynik estymacji za pomocą klasycznej MNK mo\na zilustrować za
pomocÄ… rysunku 1.2.
4. Ocena oszacowania modelu liniowego za pomocÄ… klasycznej MNK
Miernikiem pozwalającym ocenić stopień dopasowania modelu do danych empirycznych jest
współczynnik determinacji:
n
[ yi - y)(wi - w)]2
"(
i=1
R2 = (1.11)
n n
[ i - y)2][ i - w)2]
"(y "(w
i=1 i=1
5
Oprócz warunków, jakie muszą spełniać reszty wymaga się równie\ mi. in. aby wektor danych X był macierzą
o wymiarach n x k majÄ…cÄ… rzÄ…d k.
5
Jest on równy kwadratowi współczynnika korelacji liniowej pomiędzy empirycznymi i
 teoretycznymi wartościami zmiennej objaśnianej. R2 przyjmuje wartości z przedziału [0,1].
Je\eli spełnione są zało\enia KMNK, to wy\sze wartości oznaczają lepsze dopasowanie
modelu do danych empirycznych (i np. ni\szy błąd prognozy), choć nie istnieje \adna stała
granica, poni\ej której oszacowanie nale\ałoby odrzucić. Jedynym warunkiem, który musi
być spełniony jest statystyczna istotność oszacowania tego parametru. Mo\na ją sprawdzić za
pomocą testu opisanego poni\ej (równanie 1.13 wraz z komentarzem).
Y
Ä…1X+ Ä…0
yi
µi ei
a1X+ a0
E(Y|X=xi)
xi X
Rys. 1.2. Model regresji w populacji generalnej i oszacowanie
Dwie kolejne metody oceny  jakości oszacowania są testami statystycznymi pozwalającymi
ocenić czy parametry, których oszacowania uzyskano są istotnie ró\ne od zera. Pierwszy z
testów pozwala ocenić w ten sposób oszacowanie ka\dego parametru osobno. Statystyka
testowa dla j-tej zmiennej (j=1,2,...,k) ma postać:
aj
t = (1.12)
S(aj)
gdzie mianownik jest błędem standardowym oszacowania j-tego parametru równania (1.2).
Je\eli reszty mają rozkład normalny (spełniają warunek 1.7), to powy\sza statystyka ma
rozkład t (Studenta) z (n-k-1) stopniami swobody. Hipoteza zerowa w tym teście mówi, \e
wartość parametru w populacji generalnej jest równa zeru.
Kolejna statystyka testowa pozwala zweryfikować hipotezę mówiącą, \e wszystkie oprócz
wyrazu wolnego parametry są równe zeru. Przy normalności rozkładu reszt statystyka ta,
zdefiniowana jak poni\ej ma rozkład F (Snedecora) z k i (n-k-1) stopniami swobody.
R2 / k
F = (1.13)
(1- R2 ) /(n - k -1)
6
Współczynnik determinacji oraz statystyki zdefiniowane za pomocą równań (1.12) i (1.13)
stanowią najpopularniejsze narzędzia oceny  jakości oszacowania modelu. Jak łatwo
zauwa\yć, statystyka (1.13) stanowi tak\e test dla hipotezy mówiącej, \e współczynnik
determinacji ma wartość zerową.
5. Postępowanie w sytuacjach wykraczających poza schemat klasycznej
MNK
Zało\enia odnośnie reszt modelu opisane za pomocą równań (1.5) - (1.7) w rzeczywistości są
spełniane dość rzadko. Przykładowo, warunek stałej i niezale\nej od wartości X wariancji jest
mało realistyczny, gdy model regresji opisuje zale\ność wydatków konsumpcyjnych i
dochodów gospodarstw domowych (por. Rys. 1.1). Zró\nicowanie wydatków
konsumpcyjnych z pewnością rośnie wraz z dochodem gospodarstw, jako \e mogą one
wybierać między konsumpcją bie\ącą i oszczędzaniem czy inwestowaniem. Gospodarstwa
najmniej zamo\ne wydają, przeciętnie rzecz biorąc, niemal całość swoich dochodów na
zaspokojenie bie\Ä…cych potrzeb konsumpcyjnych. Zatem gospodarstwa o niskich dochodach
charakteryzują się stosunkowo niską wariancją wydatków. Z kolei warunek niezale\ności
reszt między sobą jest bardzo trudny do spełnienia w przypadku modelowania szeregów
czasowych, zwłaszcza za pomocą tzw. modelu autoregresji. Je\eli  teoretyczna wartość
wyrazu szeregu czasowego w danym momencie zale\y od wartości wyznaczonych dla
okresów wcześniejszych, to trudno zakładać, \e nie będzie od nich zale\na reszta modelu.
Stosunkowo najłatwiejsze do utrzymania jest zało\enie o normalności rozkładu reszt,
zwłaszcza przy du\ej próbie.
Niespełnianie warunków (1.5  1.7) ma ró\norakie konsekwencje. Najpowa\niejsze skutki
niesie ze sobą skorelowanie reszt i zmiennych objaśniających. W tym przypadku uzyskane za
pomocą MNK estymatory parametrów modelu tracą nieobcią\oność i zgodność. Metoda
postępowania w takim przypadku została opisana w ż II.4. Niesferyczność reszt nie skutkuje
obcią\onością estymatorów parametrów strukturalnych MNK, ale sprawia \e tracą one
efektywność. Obcią\one stają się natomiast estymatory wariancji oszacowań tych parametrów
(równanie 1.10). Ponadto w przypadku występowania autokorelacji reszt najczęściej ma
miejsce przeszacowanie wartości R2.
Częste w praktyce niespełnianie zało\eń odnośnie rozkładu reszt nie jest jedynym
ograniczeniem dla praktycznej u\yteczności modelu opisanego w Rozdziale I. Tak\e
zało\enie liniowości warunkowej wartości oczekiwanej zmiennej objaśnianej często nie jest
spełnione. Wreszcie, w empirycznych zastosowaniach modeli regresji w analizie
ekonomicznej oszacowania nierzadko muszą spełniać określone zale\ności w celu
zapewnienia zgodności z teoriami ekonomicznymi. Wszystkie te uwarunkowania zmuszają do
sięgnięcia po metody estymacji wykraczającej poza klasyczną MNK.
W kolejnych częściach zostały opisane zarówno wybrane metody estymacji modeli regresji
jak i testy pozwalające na wybór odpowiedniego modelu.
7
II. WYBRANE METODY ESTYMACJI MODELI REGRESJI
1. MNK z warunkami dodatkowymi
W wielu przypadkach teorie ekonomiczne wymagają, aby parametry modelu spełniały
określone warunki dodatkowe. Jednak uzyskane (dowolną metodą) na podstawie danych
empirycznych oszacowania często ich nie spełniają, w związku z czym warunki te trzeba na
uzyskane rozwiązania narzucić. Jednym z mo\liwych do zastosowania w takiej sytuacji
rozwiązań jest MNK z warunkami dodatkowymi. Uzyskane oszacowania stanowią wówczas
warunkowe minimum sumy kwadratów reszt. Zespół liniowych6 warunków narzuconych na
wektor parametrów a zawsze mo\na przedstawić za pomocą układu równań:
R~'= r (2.1)
a
gdzie R jest macierzÄ… o wymiarach m × (k +1) , zaÅ› r wektorem o wymiarach m x 1 (m jest
liczbą warunków ograniczających). Je\eli są spełnione wszystkie warunki pozwalające
zastosować klasyczną MNK, to wektor warunkowych oszacowań parametrów liniowego
modelu regresji mo\na przedstawić następująco:
~
a = a - (X'X)-1R'[R(X' X)-1R']-1(Ra - r) (2.2)
gdzie a jest wektorem oszacowań uzyskanych za pomocą bezwarunkowej MNK (por.
równanie 1.8). Metody oszacowania wariancji reszt modelu oraz wariancji oszacowań
parametrów podaje A. Darnell (1994, str. 350-351).
W punkcie 1 rozdziału III omówione zostały dwa testy (Walda i ilorazu wiarygodności)
pozwalające ocenić czy narzucenie warunków dodatkowych jest uzasadnione przy danych
wektorach X i Y oraz danej postaci funkcji regresji.
2. Estymacja modeli ekonometrycznych za pomocą metody największej
wiarygodności (MNW)
Metoda największej wiarygodności jest znacznie bardziej uniwersalna i najczęściej
bardziej efektywna od metody najmniejszych kwadratów. Mo\na ją stosować równie\ do
estymacji modeli nieliniowych, a tak\e w przypadku heteroskedastyczności lub autokorelacji
reszt7 (por. równanie 1.6 z komentarzem). Estymatory uzyskane za pomocą tej metody są
zgodne i asymptotycznie najefektywniejsze. Mogą natomiast być one obcią\one, co ma
istotne znaczenie w przypadku małych prób. Inną słabością tej metody jest mniejsza ni\ w
przypadku MNK odporność na niespełnianie zało\enia o normalności rozkładu reszt.
Estymatory MNW parametrów w populacji generalnej uzyskuje się maksymalizując poni\szą
funkcję wiarygodności:
6
Warunki nieliniowe nie będą tu omawiane.
7
Klasyczna MNK nie mo\e być stosowana w takim wypadku lecz mo\na skorzystać z estymatorów uzyskanych
za pomocą tzw. uogólnionej MNK (patrz: A. Darnell, 1994, str. 163-167)
8
n
L(Åš | X) = f (xi,Åš1,Åš2,...,Åšm) (2.3)
"
1=1
gdzie f jest funkcją gęstości prawdopodobieństwa dla zmiennej X, zaś Ś = [Ś1, Ś2, ... , Śm]
wektorem szacowanych parametrów. Idea MNW polega na znalezieniu takich wartości
parametrów Ś, które maksymalizują prawdopodobieństwo lub gęstość prawdopodobieństwa
uzyskania próby X.
W praktyce du\o wygodniej jest znalezć maksimum dla funkcji będącej logarytmem L:
n
ln L(Åš | X) = f (xi, Åš1,Åš2,...,Åšm) (2.4)
"ln
i=1
W przypadku, gdy estymuje siÄ™ liniowy model regresji z wieloma zmiennymi, estymator
uzyskany za pomocą MNW ma postać następującego wektora:
Ć Ć
â = (X'&!X)-1 X'&!Y (2.5)
Ć
gdzie &! oznacza oszacowanie macierzy wariancji i kowariancji reszt. W przypadku
homoskedastyczności i braku autokorelacji reszt jest ona macierzą jednostkową (I w
równaniu 1.6) pomno\oną przez skalar. Aatwo zauwa\yć, \e powy\sze równanie jest
wówczas identyczne z równaniem (1.8) czyli estymatory MNW stają się identyczne z
estymatorami uzyskanymi za pomocą MNK. W przypadku heteroskedastyczności lub
Ć
autokorelacji reszt niezbędne jest oszacowanie macierzy &! . Robi się to zakładając, \e jej
elementy są określoną funkcją wartości zmiennych objaśnianych, następnie za pomocą MNW
Ć
znajdując parametry tej funkcji. Szczegóły tej i kilku innych metod szacowania &!
Ć
przedstawił W. Greene (str. 511-517 i 555-569). Je\eli &! jest znana (w praktyce warunek ten
prawie nigdy nie jest spełniony) to oszacowanie a jest identyczne z oszacowaniem
uzyskanym za pomocą uogólnionej MNK.
Oszacowanie wariancji reszt modelu mo\na uzyskać następująco:
2
Ć
\ (e) = (Y-Xâ)'&!-1(Y - Xâ) / n (2.6)
podczas gdy wariancję oszacowania parametrów modelu uzyskuje się za pomocą wzoru
2
Ć
S (â) = %5Å„2 (X'&!X)-1 (2.7)
Obydwa wy\ej wymienione estymatory sÄ… obciÄ…\one, ale zgodne, a tym samym nieobciÄ…\one
asymptotycznie.
3. Uwagi o estymacji modeli nieliniowych
Modele nieliniowe ze względu na parametry mo\na oszacować zarówno za pomocą MNW
jak i metody minimalizującej sumę kwadratów reszt, rozwijając funkcję nieliniową w
(liniową) sumę wyrazów szeregu Taylora. W tym drugim przypadku oszacowanie są z samej
9
istoty metody jedynie przybli\eniami. StosujÄ…c MNW w przypadku wielu funkcji mo\na
wyznaczyć pochodne analitycznie, dzięki czemu uzyskuje się oszacowania dokładne. Biorąc
pod uwagÄ™ fakt, i\ estymatory uzyskane tÄ… metodÄ… sÄ… zgodne i asymptotycznie
najefektywniejsze (co nie jest najczęściej spełnione w przypadku metod opartych na
minimalizacji sumy kwadratów reszt), nale\ałoby więc uznać jej wy\szość nad MNK. Za
metodą MNK przemawiają jednak czasami względy praktyczne. Metoda MNW jest dostępna
tylko w niektórych pakietach statystyczno-ekonometrycznych, jest te\ najczęściej znacznie
bardziej czasochłonna (choć wymaga te\ znacznie mniej pamięci komputerowej).
W wielu przypadkach nieliniowe (ze względu na zmienne) modele mo\na oszacować, po
odpowiednich przekształceniach, metodami estymacji liniowej. Przykładowo, nieliniowy
model:
k
Ä…i
yi = Ä… 0 µi (2.8)
"xi
i=1
jest równowa\ny poni\szemu modelowi logarytmicznemu:
k
ln yi = lnÄ… 0 + i ln xi + lnµi (2.9)
"Ä…
i=1
który mo\e być oszacowany za pomocą metod liniowych (w miejsce wartości zmiennych Y i
X nale\y podstawić ich logarytmy).
4. Estymacja za pomocÄ… zmiennych instrumentalnych (MZI)
Estymatory uzyskane za pomocą zmiennych instrumentalnych pozwalają ograniczyć w
znacznym stopniu (negatywne) skutki liniowego skorelowania reszt modelu ze
zmiennymi objaśniającymi (por. równanie 1.5 wraz z komentarzem). W przypadku
występowania tej zale\ności estymatory parametrów równania liniowego uzyskane za
pomocą klasycznej MNK tracą własność nie tylko nieobcią\oności, ale i zgodności.
Przez zmienne instrumentalne (zwane te\ instrumentami) nale\y rozumieć dodatkowe
zmienne wykorzystane w estymacji odznaczające się dwiema własnościami: a/ są
nieskorelowane (w praktyce: słabo skorelowane) z resztami modelu, b/ są skorelowane z tymi
zmiennymi objaśniającymi w modelu pierwotnym, które są skorelowane z resztami (mówi
siÄ™, \e te ostatnie zmienne sÄ… instrumentowane). Macierz zmiennych instrumentalnych
powinna zawierać co najmniej tyle zmiennych (kolumn), ile jest zmiennych objaśniających w
pierwotnym modelu skorelowanych z resztami oraz tzw. autoinstrumenty czyli te kolumny
macierzy X, które odpowiadają zmiennym nieskorelowanym z resztami. Postać estymatora
uzyskanego za pomocą zmiennych instrumentalnych jest następująca:
)
a = (t' X)-1t' Y (2.10)
gdzie t oznacza macierz zawierajÄ…cÄ… (m. in.) zmienne instrumentalne8. Jedna z jej
mo\liwych postaci przedstawia równanie (2.13). Je\eli są one nieskorelowane z resztami
8
Jeden ze sposobów konstrukcji tej macierzy został podany poni\ej.
10
pierwotnego modelu, to powy\sze wyra\enie jest asymptotycznie nieobciÄ…\onym9
estymatorem parametrów modelu. Estymator wariancji reszt modelu ma postać:
) )
e'e
)2
s = (2.11)
n - kI
)
gdzie e jest wektorem reszt w zmodyfikowanym modelu, a kI stanowi liczbÄ™ zmiennych
instrumentalnych. Asymptotycznie nieobcią\ony estymator wariancji oszacowań parametrów
ma postać:
) )2
2
S (a) = s (t' X)-1t' t(t' X)-1 (2.12)
Wariancja ta jest tym mniejsza, im silniejsza jest korelacja między zmiennymi
instrumentowanymi i instrumentalnymi. Jest to jedno z kryteriów doboru zmiennych
instrumentalnych. Drugie kryterium stanowi, zgodnie z tym co zostało napisane powy\ej,
nieskorelowanie z resztami pierwotnego modelu czyli warunek konieczny dla nieobcią\oności
)
a . Nietrudno zgadnąć, \e opierając się na ka\dym z wymienionych kryteriów z osobna
uzyskalibyśmy dwa ró\ne zestawy instrumentów. W praktyce znacznie bardziej istotne jest
skorelowanie instrumentów ze zmiennymi instrumentowanymi, co przekłada się na ich
efektywność. Z drugiej strony, je\eli jest ono silne, to są one równie\ dość mocno
skorelowane z resztami. Zatem ka\da dodatkowa zmienna instrumentalna zwiększa
obcią\enie estymatorów. Skutecznym sposobem zwiększenia efektywności estymatorów bez
utraty informacji zawartej w potencjalnych instrumentach jest u\ycie ich kombinacji liniowej
zamiast pojedynczej zmiennej. Kombinację tę mo\na uzyskać np. szacując (za pomocą MNK)
model, w którym zmienna instrumentowana jest funkcją instrumentów i stosując to
oszacowanie jako zmienną instrumentalną10. Mo\na wykazać, \e tak uzyskane estymatory
parametrów mają najni\szą wariancję ze wszystkich estymatorów uzyskanych za pomocą
tych samych zmiennych instrumentalnych.
Macierz t uzyskuje siÄ™, niezale\nie od liczby zmiennych instrumentalnych i rodzaju
zastosowanej kombinacji, następująco:
t = W(W'W)-1W' X (2.13)
gdzie W jest macierzÄ… uzyskanÄ… poprzez zamianÄ™ w macierzy X zmiennych skorelowanych z
resztami przez instrumenty.
Metoda estymacji za pomocą zmiennych instrumentalnych, choć mo\e przynieść bardzo
korzystne skutki, nie powinna być stosowana pochopnie. Poniewa\ istnienia liniowej
korelacji reszt i zmiennych objaśniających nie mo\na sprawdzić bezpośrednio11 jej istnienie
mo\na jedynie podejrzewać na podstawie dociekań teoretycznych bądz doświadczenia
wynikającego z wcześniejszych estymacji z udziałem podobnych zmiennych. Formalne
uzasadnienie dla stosowania MZI stanowią wyniki testów ex post. Najpopularniejszy z nich
jest szczególnym przypadkiem testu Walda (por. punkt 1 w rozdziale III) i polega na ocenie
9
A więc równie\ zgodnym, je\eli jego wariancja maleje do zera wraz ze wzrostem próby.
10
Jest to szczególny przypadek tzw. dwustopniowej (zwanej tez podwójną) metody najmniejszych kwadratów
(2MNK).
11
Korelacja liniowa uzyskanych za pomocą MNK reszt i dowolnej zmiennej objaśniającej w próbie zawsze
wynosi 0.
11
istotności ró\nicy pomiędzy oszacowaniami parametrów uzyskanych za pomocą MNK i MZI.
Jest on znany jako test Hausmana lub Durbina-Wu-Hausmana (DWH) i został opisany przez
Greene a (str. 443-444) i Darnella (str. 132-135)12. Zalecane jest równie\ sprawdzenie czy
instrumenty sÄ… dostatecznie mocno skorelowane ze zmiennymi instrumentowanymi. Je\eli w
modelu jest instrumentowana jedna zmienna, to wystarczający jest test istotności R2 po
oszacowaniu za pomocą MNK modelu w którym zmienną objaśnianą jest ta zmienna zaś
zmiennymi objaśniającymi instrumenty. W przypadku większej liczby zmiennych
instrumentowanych test tego typu mo\e okazać się niewystarczający (zwłaszcza w przypadku
silnego skorelowania pomiędzy nimi). Prostą procedurę postępowania w takiej sytuacji
przedstawił J. Shea ( Instrument relevance in multivariate linear models: a simple measure ,
Review of Economics and Statistics, 79, str. 348-52, 1997 r.).
5. Zmienne binarne w modelach regresji: regresja logitowa i probitowa
Zmienne binarne czyli przyjmujące tylko dwie wartości (najczęściej 0 i 1) są jedną z
najpopularniejszych metod modelowania ekonometrycznego. Ich u\yteczność jest oczywista
w przypadku, gdy model regresji opisuje takie zjawiska jakościowe np. zale\ność między
dochodem, a płcią. W najprostszym modelu tego typu zmienną objaśnianą byłby dochód,
zmienną objaśniającą zmienna przyjmująca wartość 1, gdy badana osoba jest kobietą i 0, gdy
mę\czyzną (lub odwrotnie). Model taki, a tak\e modele obejmujące większą liczbę binarnych
zmiennych objaśniających opisane poni\ej, mo\na oszacować tak samo jak modele ze
zmiennymi ciągłymi.
W wielu przypadkach konieczne jest, aby zmienne jakościowe wyznaczały więcej ni\ dwie
kategorie. Przykładem mo\e być model trendu z wahaniami okresowymi, np. kwartalnymi.
Zmienne binarne powinny przyjmować wartość 1, gdy obserwacja nale\y do danego kwartału
i 0 w przeciwnym przypadku. Najprostszy model (zakładający stałość amplitudy wahań czyli
jej niezale\ność od poziomu trendu) z kwartalnymi wahaniami miałby postać:
yi = Ä…0 + Ä…1t + Ä…2 xi1 + Ä…2 xi2 + Ä…3xi3 + µi (i = 1,2,...,n) (2.14)
gdzie t oznacza czas, zaś zmienne x1, x2 i x3 przyjmują wartość 1 dla obserwacji nale\ących,
odpowiednio, do 1, 2 i 3 kwartału. W modelu został pominięty ostatni kwartał, któremu
odpowiadają zerowe wartości wszystkich wymienionych zmiennych. Pominięcie jednej
kategorii (jej wybór nie ma znaczenia) jest niezbędne, aby uniknąć liniowej zale\ności
między zmiennymi.
W podanym przykładzie nie mo\na było z góry zakładać stałej (np. rosnącej) zale\ności
między numerem kwartału, a siłą wahań okresowych. Zatem zastąpienie trzech zmiennych
binarnych jedną zmienną przyjmującą wartości 1, 2, 3 i 4 najczęściej nie upowa\niałoby do
zastosowania liniowej estymacji parametrów. Nawet jednak w przypadku, gdy zale\ność
między zmienną objaśnianą jest monotoniczna (np. między dochodem i poziomem
wykształcenia13 lub między wydatkami na mieszkanie i liczbą osób w gospodarstwie
domowym) zastosowanie zmiennych binarnych mo\e być korzystne. Po pierwsze, u\ycie
12
Ten i podobne testy występują pod nazwą testów egzogeniczności (zaprzeczeniem egzogeniczności jest
endogeniczność).
13
Mo\na np. przyjąć, \e wykształceniu podstawowemu odpowiada wartość zmiennej objaśniającej 1,
zawodowemu 2 itd. Inne rozwiązanie polega na zdefiniowaniu zmiennej jako liczby ukończonych lat nauki.
12
jednej zmiennej jest równowa\ne z mało realistycznym zało\eniem, \e np.  przyrost
wykształcenia o jednostkę powoduje średnio stały (równy wartości odpowiedniego
parametru) przyrost zmiennej objaśniającej. Inny przykład u\yteczności zmiennych binarnych
stanowią modele, w których pewne zmienne objaśniające mogą występować więcej ni\ raz,
co najczęściej powoduje stochastyczną współliniowość tych zmiennych14 i obni\a
efektywność estymatorów. W celu ograniczenia tego zjawiska niektóre zmienne mo\na co
najmniej raz zastąpić kilkoma zmiennymi binarnymi. Np. liczba osób mo\e być wyra\ona w
postaci kilku zmiennych binarnych, które przyjmują wartość 1 gdy gospodarstwo jest jedno,
dwu, trzy itd. osobowe. Jedyną, i niezbyt istotną, wadą takiego rozwiązania jest zwiększenie
liczby zmiennych objaśniających.
Sytuacje zmienia się, gdy binarna jest zmienna objaśniana. Zastosowanie MNK nie pozwala
uzyskać nieobcią\onych czy zgodnych estymatorów (wartość oczekiwana reszt jest ró\na od
zera). W efekcie, zakres zmienności wartości teoretycznych zmiennej objaśnianej wykracza poza
przedział [0,1]. Tymczasem, wartości te nale\ałoby traktować jako wartość oczekiwaną
( teoretyczną ) prawdopodobieństwa, \e zmienna Y przyjmie wartość 1. Rozwiązaniem tego
problemu jest zastosowanie tzw. regresji logitowej lub probitowej. Polega ona na zastosowaniu
odpowiedniej rosnącej transformacji wartości teoretycznych zmiennej objaśnianej, dzięki której
przyjmuje ona wartości z przedziału [0,1]. Przykładowo, w przypadku regresji logitowej ma ona
postać:
exp(Ä…0 + Ä…i xi1 + Ä…2 xi2 + ... + Ä…k xik ) exp(XiÄ…)
Ć Ć
P( yi = 1) = Pi = = (2.15)
1+ exp(Ä…0 + Ä…i xi1 + Ä…2 xi2 + ... + Ä…k xik ) 1+ exp(XiÄ…)
Wobec powy\szego, wartość oczekiwaną prawdopodobieństwa wylosowania próby Y czyli
odpowiadającą jej funkcję wiarygodności mo\na wyznaczyć następująco:
L(a | Y) = iÄ…) (2.16)
"›(X "[1- ›(XiÄ…)]
yi=1 yi=0
gdzie › jest transformacjÄ… logitowÄ…15 wystÄ™pujÄ…cÄ… po prawej stronie równania (2.15).
Oszacowania parametrów modelu logitowego (i probitowego) wyznacza się za pomocą MNW,
znajdując wartości parametrów maksymalizujące powy\szą funkcję (w praktyce: jej logarytm).
Szczegóły tej procedury przedstawił W. Greene (1997, str. 883)16. Poniewa\ równanie (2.15)
mo\na równie\ zapisać:
Ć Ć
ln[Pi /(1- Pi )] = Ä…0 + Ä…i xi1 + Ä…2 xi2 + ... + Ä…k xik (2.17)
to znak oszacowań parametrów modelu mo\na interpretować tak jak w przypadku zwykłego
modelu liniowego (jako \e lewa strona równania jest rosnącą transformacją pi). Inna postać tego
samego równania pozwala zapisać iloraz dwóch prawdopodobieństw (ang.: odds ratio )
następująco:
14
Np. w modelach popytu ze zmiennymi demograficznymi liczba osób w gospodarstwie pojawia się przy ka\dej
grupie wydatków.
15
W przypadku regresji probitowej transformacja Pi jest dystrybuantą rozkładu normalnego standardowego.
Wprawdzie oszacowania parametrów tego typu modelu są ró\ne od oszacowań modelu logitowego, ale ich
interpretacja jest identyczna. Bardzo zbli\one są te\  wartości teoretyczne prawdopodobieństw.
16
Podaje on układ równań nieliniowych, który rozwiązuje się w sposób numeryczny, nie mo\na więc podać
ogólnej postaci estymatorów parametrów.
13
P(Y = 1)
= exp(XiÄ…) (2.18)
P(Y = 0)
Dodatnia wartość oszacowania oznacza pozytywny wpływ odpowiedniej zmiennej objaśniającej
na oszacowanie teoretycznej wartości prawdopodobieństwa, \e Y przyjmie wartość 1.
Interpretacja wartości parametrów jest jednak bardziej skomplikowana. Nie mo\e być ona
traktowana, w odró\nieniu od modeli liniowych, jako oszacowanie efektu marginalnego
względem xi. Z uwagi na nieliniowość modelu zmiana teoretycznej wartości
prawdopodobieństwa spowodowana zmianą i-tej zmiennej objaśniającej zale\y od wartości
zmiennych objaśniających Xi (i-tego wiersza w macierzy danych). Dla j-tej zmiennej
objaśniającej efekt marginalny jej zmiany o jednostkę mo\na oszacować następująco:
"E(Y | Xi )
= ›(Xia)[1- ›(Xia)]a (2.19)
j
"x
j
Wariancję oszacowań parametrów modelu logitowego mo\na oszacować za pomocą wzoru:
-1
n
îÅ‚ Å‚Å‚
2
S (a) = - ›(Xia) ]2 XiXi 'śł (2.20)
"[yi
ïÅ‚
ðÅ‚ i=1 ûÅ‚
III. TESTY STATYSTYCZNE W MODELACH REGRESJI
1. Testy warunków ograniczających modelu
W wielu przypadkach zgodność z teoriami ekonomicznymi wymaga, aby oszacowania
parametrów modelu spełniały pewne warunki. Mo\na to osiągnąć estymując model np. za
pomocą warunkowej MNK (por. rozdział II, cz.1). Regresja warunkowa mo\e być te\
wykorzystana jako test teorii ekonomicznych rozumianych jako przyjmowanie konkretnych
wartości przez parametry: je\eli oszacowania uzyskane za pomocą metod bezwarunkowych
są bliskie oszacowaniom warunkowym to mo\na uznać, \e wyniki estymacji potwierdzają
teorię. W niniejszym paragrafie omówione zostaną dwa testy pozwalające stwierdzić, czy
ró\nice między oszacowaniami warunkowymi i bezwarunkowymi nakazują odrzucenie teorii.
Oba wykorzystujÄ… statystyki Ç2 przyjmujÄ…ce tym wiÄ™kszÄ… wartość im wiÄ™ksze wystÄ™pujÄ…
ró\nice (mówiąc w uproszczeniu), między oszacowaniami warunkowymi i bezwarunkowymi.
Ideę konstrukcji obu tych testów: ilorazu wiarygodności i Walda ilustruje rysunek 3.1.
Przedstawiony został na nim test dla jednego warunku h(Ś)=0 narzuconego na jeden parametr
Ś, jednak oba testy mogą być zastosowane równie\ w przypadku wielu ograniczeń i wielu
parametrów.
Test ilorazu wiarygodności oparty jest na następującym zało\eniu: je\eli warunek dodatkowy
(lub zespół warunków) jest prawdziwy, to narzucenie tego warunku nie powinno
spowodować du\ego spadku wartości funkcji wiarygodności. Statystyka zdefiniowana za
pomocą równania (3.1) przyjmuje tym większą wartość im większy jest ten spadek. Je\eli jej
wartość przekroczy wartość krytyczną, to hipotezę mówiącą o spełnianiu warunku
(warunków) nale\y odrzucić.
14
LR
LR = -2ln (3.1)
LU
gdzie LR i LU są, odpowiednio, wartościami funkcji wiarygodności uzyskanymi dla modelu z
ograniczeniami i bez. Powy\sza statystyka, przy prawdziwości hipotezy zerowej (h(Ś)=0) ma
asymptotyczny rozkÅ‚ad Ç 2 o liczbie stopni swobody równej liczbie narzuconych ograniczeÅ„.
ln LU ln L(Åš)
h(Åš)
IW (LR)
ln LR
Wald
Ć Ć
0 ÅšR ÅšMNW Åš
Rys. 3.1. Test ilorazu wiarygodności i test Walda dla jednego warunku (na podstawie: Greene, str. 160)
Drugi z testów, zaproponowany przez Walda, zakłada, \e je\eli warunek dodatkowy (lub
zespół warunków) jest prawdziwy, to uzyskane za pomocą estymacji warunkowej
oszacowania powinny je w przybli\eniu spełniać. Statystyka testowa ma postać:
-1
2
Ć Ć Ć
W = [h(Åš)]'[S [h(Åš)]] [h(Åš)] (3.2)
gdzie:
'
Ć Ć
îÅ‚"h(Åš)Å‚Å‚ îÅ‚"h(Åš)Å‚Å‚
2
Ć Ć
S2[h(Åš)] =
ïÅ‚ śłS (Åš)ïÅ‚ śł
Ć Ć
"Åš "Åš
ðÅ‚ ûÅ‚ ðÅ‚ ûÅ‚
Ć
h(Ś) oznacza macierz testowanych warunków, której elementy obliczono podstawiając
2
Ć
oszacowania parametrów Ś. S (Ś) jest macierzą wariancji oszacowania parametrów Ś.
Statystyka Walda równie\ ma asymptotyczny rozkÅ‚ad Ç2 o liczbie stopni swobody równej
liczbie narzuconych ograniczeń.
15
Z teoretycznego punktu widzenia (np. oceniając moc testów) nie mo\na przyznać wy\szości
\adnej z powy\szych metod. O wyborze winny więc decydować względy praktyczne. Wadą
testu ilorazu wiarygodności jest konieczność oszacowania dwóch modeli (z warunkami
dodatkowymi i bez). Wadą testu Walda jest konieczność wyznaczenia macierzy wariancji
oszacowań parametrów (co jednak najczęściej musi być zrobione z innych względów) i w
wielu przypadkach konieczność  ręcznego wyznaczania wartości statystyki testowej.
2. Testy specyfikacji modelu
W licznych zastosowaniach liniowa postać modelu nie jest adekwatna i konieczny jest wybór
innej postaci funkcji regresji (g w równaniu 1.1). Teoria ekonomiczna bardzo rzadko pozwala
uzasadnić wybór jej konkretnej postaci, często więc nale\y dokonać go posługując się metodą
prób i błędów lub poprzez obserwację rozkładu wartości empirycznych. Poni\ej zostały
przedstawione dwa testy (specyfikacji) pozwalające dokonać weryfikacji wyboru postaci
funkcji g.
Test RESET (Regression Equation Specification Error Test) zwany te\ testem Ramsey a
mo\e być wykorzystany do weryfikacji hipotezy o liniowości funkcji regresji (równania 1.2).
Aby wyznaczyć stosowną statystykę testową nale\y oszacować model liniowy oraz model o
następującej postaci:
yi = a1xi1 + Ä…2 xi2 + ... + Ä…k xik + Ä…0 + ²i1 wi2 + ²i2 wi32 + ... + ²i ( p-1) wip p-1) + µi (3.3)
1 (
gdzie wij j-1) (j=2,...,p) jest i-tą  teoretyczną wartością zmiennej objaśnianej uzyskaną za
(
pomocą estymacji modelu liniowego (liniowej części równania 3.3). Poni\sza statystyka
mo\e być u\yta do konstrukcji testu.
[RRSS -URSS]/( p -1)
R = (3.4)
URSS /(n - k -1)
gdzie RRSS jest sumą kwadratów reszt modelu liniowego, zaś URSS sumą kwadratów reszt
modelu (3.3). Je\eli hipoteza o liniowości jest prawdziwa, to R ma rozkład F z (p-1) i (n-k-1)
stopniami swobody. Gdy suma kwadratów reszt modelu liniowego jest znacznie większa od
sumy kwadratów reszt modelu nieliniowego, to statystyka R przekracza poziom krytyczny i
hipotezę o liniowości nale\y odrzucić. Hipoteza alternatywna nie precyzuje postaci funkcji
regresji.
Kolejny test pozwala na specyfikacje postaci funkcji regresji w hipotezie zerowej i
alternatywnej, jest te\ bardziej ogólny od testu RESET z uwagi na wielość potencjalnych
specyfikacji. Wykorzystuje on następującą transformację (Boxa i Coxa) zmiennej X:

Å„Å‚ -1) /  dla  `" 0
(X
( )
X = (3.5)
òÅ‚
ółln(X) dla  = 0
Umo\liwia ona zapis modelu regresji z jedną zmienną17 za pomocą następującej18 funkcji:
17
Mo\e on być uogólniony przez dodanie dowolnej liczby zmiennych objaśniających.
16
´
yi( ) = Ä…1xi(1 ) + Ä…0 + µi (i = 1,2,..., n) (3.6)
Model ten nale\y oszacować za pomocą metody największej wiarygodności (szczegóły
przedstawiÅ‚ A. Darnell, 1994, str. 37) dwukrotnie: zakÅ‚adajÄ…c liniowość (wtedy =´=1) oraz
przyjmujÄ…c inne wartoÅ›ci  i ´. Test liniowoÅ›ci jest w tym przypadku testem ilorazu
wiarygodnoÅ›ci dla hipotezy zerowej: =´=1. Test ten mo\na te\ przeprowadzić tak\e dla
innych form funkcji regresji w hipotezie zerowej, choć w praktyce estymacja modelu, w
szczególności wariancji oszacowań jest dość trudna a czasami problematyczna. W przypadku
gdy test nie daje jednoznacznych wskazań odnośnie  właściwych parametrów transformacji
Boxa-Coxa nale\y przyjąć wartości oszacowań (parametrów strukturalnych i transformacji)
uzyskanych za pomocą metody największej wiarygodności.
3. Test stabilności parametrów
Omawiany test (Chowa) pozwala zweryfikować hipotezę o stałości relacji ekonomicznych w
modelach liniowych, objawiającej się niezmiennymi (w czasie lub przestrzeni) wartościami
parametrów w modelach. Niezmienność (w praktyce: przybli\ona) parametrów jest jednym z
zasadniczych warunków m. in. trafności prognoz. Stabilność parametrów bada się (ex post)
sprawdzając czy są one jednakowe w dwóch badanych podpróbach (np. w dwóch okresach
lub w dwóch regionach). Test Chowa wymaga trzech estymacji za pomocą MNK: dla całej
próby (Y,X) oraz dla dwóch podprób (Y1,X1) (Y2,X2). Pierwsza z nich (milcząco) zakłada, \e
parametry są stałe dla całej badanej próby, jest więc estymacją z warunkami dodatkowymi (a1
= a2). Dwie pozostałe są estymacjami bezwarunkowymi. Je\eli hipoteza o stabilności
parametrów jest prawdziwa, to suma kwadratów reszt w estymacji warunkowej powinna być
równa sumie dwóch sum kwadratów reszt uzyskanych dla estymacji bezwarunkowych. Je\eli
ró\nica między wy\ej wymienionymi sumami jest du\a, to hipotezę o stabilności parametrów
nale\y odrzucić. Statystyka testowa następującej postaci (por. objaśnienia do równania 3.4;
suma kwadratów reszt estymacji bezwarunkowej URSS jest sumą dwóch sum kwadratów
reszt uzyskanych za pomocą zastosowanej do ka\dej podpróby oddzielnie MNK):
[RRSS -URSS]/(k +1)
Ch = (3.7)
URSS /(n - 2k - 2)
ma rozkład F z (k+1) i (n-2k-2) stopniami swobody.
Powy\szy test wymaga homoskedastyczności reszt. W przypadku niespełniania tego warunku
nale\y go zmodyfikować stosując test Walda (szczegóły przedstawił A. Darnell, 1994, str.
51).
4. Test homoskedastyczności reszt
Występowanie heteroskedastyczności reszt nakazuje modyfikację metod estymacji wariancji
oszacowań parametrów i weryfikacji hipotez odnośnie parametrów modelu. Jej rozpoznanie
ma więc zasadnicze znaczenie w modelowaniu regresji. Przedstawiony poni\ej test
18
PrzykÅ‚adowo, model jest liniowy, gdy =´=1 lub logarytmiczny, gdy =´=0
17
wykorzystuje fakt, i\ w przypadku homeskedastyczności reszt (co objawia się ich
niezale\nością od wartości zmiennych objaśniających) uporządkowanie (w dowolnej
kolejności) \adnej ze zmiennych objaśniających nie powinno spowodować uporządkowania
reszt. Omówiony tu test zaproponowany przez S. Goldfelda i R. Quandta porównuje
wariancje reszt w dwóch podpróbach otrzymanych po uporządkowaniu badanej zmiennej
 podejrzanej o skorelowanie z wariancjÄ… reszt. Wariancje te sÄ… wyznaczane poprzez
estymacje dwóch modeli, dla ka\dej podpróby oddzielnie. Je\eli powy\sza zale\ność nie ma
miejsca, to wariancje reszt w obydwu podpróbach nie powinny się istotnie ró\nić. W
przeciwnym przypadku hipotezę o homoskedastyczności reszt nale\y odrzucić. Statystyka
testowa postaci (subskrypty 1 i 2 oznaczają numer próby):
'
e1e1 /(n1 - k -1)
GQ = (3.8)
e' e2 /(n2 - k -1)
2
ma rozkład F z (n1-k-1) i (n2-k-1) stopniami swobody (licznik powinien mieć wy\sza wartość,
w przeciwnym przypadku nale\y zamienić subskrypty). Je\eli wartość krytyczna zostanie
przekroczona, to hipotezę zerową nale\y odrzucić.
W wielu przypadkach moc testu mo\na zwiększyć, usuwając część obserwacji  środkowych
(po uporzÄ…dkowaniu). Tym samym jednak zmniejsza siÄ™ liczbÄ™ stopni swobody, co z kolei
wpływa negatywnie na moc testu, tym bardziej, im mniejsza jest próba. Test Goldfelda i
Quandta wymaga, aby rozkład reszt był normalny.
Istnieje wiele innych testów heteroskedastyczności reszt. Je\eli rozkład tych ostatnich nie jest
normalny, mo\na zastosować np. test White a omówiony przez W. Greene a (1997, str. 550-
551) i A. Darnella (1994, str. 438-440). Test ten jednak nale\y stosować jedynie w przypadku
gdy mamy pewność, i\ specyfikacja funkcji regresji jest poprawna. Inny test, zaproponowany
przez Breuscha i Pagana (Greene, 1997, str. 552-553), pozwala wykryć heteroskedastyczność
reszt dla wszystkich zmiennych objaśniających łącznie. W przypadku gdy w modelu
występuje więcej ni\ jedna zmienna objaśniająca, wykrycie zmiennej  odpowiedzialnej za
heteroskedastyczność i tak wymaga testowania ka\dej ze zmiennych osobno (np. za pomocą
testu Goldfelda-Quandta).
Dekalog ekonometrii stosowanej według Petera Kennedy ego
1. Będziesz u\ywać zdrowego rozsądku i teorii ekonomicznych.
2. Będziesz zadawać właściwe pytania.
3. Powinieneś znać kontekst (analizy - przyp. A. S.).
4. Będziesz badać ( inspect ) dane.
5. Nie będziesz oddawać czci skomplikowanej formie ( complexity ).
6. Będziesz długo i uwa\nie oglądać wyniki (estymacji - przyp. A. S.).
7. Będziesz zwa\ać na koszty  przeszukiwania danych ( data mining ).
8. Będziesz zgadzać się na kompromisy.
9. Nie będziesz mylić istotności z istotą19 (zagadnienia - przyp. A. S.).
10. Będziesz spowiadać się z odporności na zało\enia (niedosłowne tłumaczenie  Thou shalt
confess in the presence of sensitivity ).
19
W oryginale:  significance i  substance .
18
Literatura podstawowa:
William H. Greene,  Econometric Analysis , Prentice-Hall International, Inc. (ró\ne
wydania; podawane tu numery stron pochodzÄ… z wydania III z roku 1997)
Peter Kennedy,  A Guide to Econometrics , Blackwell Publishing (ró\ne wydania)
G.S. Maddala (2006),  Ekonometria , PWN.
Literatura uzupełniająca:
Wojciech W. Charemza i Derek F. Deadman (1997),  Nowa Ekonometria , PWE.
Gregory C. Chow (1995),  Ekonometria , PWN.
Adrian C. Darnell (1994),  A Dictionary of Econometrics , Edward Elgar Publishing, Inc.
Fumio Hayashi (2000),  Econometrics , Princeton University Press (I rozdział i niektóre
zbiory danych dostępne na stronie http://www.pup.princeton.edu).
Dale J. Poirier (1995),  Intermediate Statistics and Econometrics; A Comparative Approach ,
The MIT Press.
Aleksander Welfe  Ekonometria , PWE (ró\ne wydania)
Wybrane artykuły z Journal of Economic Perspectives, vol. 15, nr 4, 2001.
(z komputerów uczelnianych dostępne na stronie www.jstor.org)
Niezła strona polskojęzyczna Jerzego Mycielskiego
http://inflacja.icm.edu.pl/jmyc/
Cały obowiązujący zakres kursu mo\na znalezć w niniejszym skrypcie zaś szczegółowe
wyjaśnienia w ksią\kach zaliczonych do literatury podstawowej. Literatura uzupełniająca
równie\ opisuje te zagadnienia, ale \adna z pozycji nie wyczerpuje zakresu w całości.
Przyjęta konwencja oznaczeń:
X, Y - zmienne
X, Y - macierze (wektory) obserwacji
yi, xij, xi - pojedyncze obserwacje
ą ,Ś - wektory parametrów
Ä… ,Åš - pojedyncze parametry
Ć
Ć
ą,Ś,a - wektory oszacowań
Ć
Ä…i,ai - pojedyncze oszacowania
k - liczba zmiennych objaśniających w modelu (nie obejmuje wyrazu wolnego)
n - liczba obserwacji
wektor parametrów/oszacowań modelu jest kolumną
wektor obserwacji dla jednej zmiennej jest kolumnÄ…
wektor zmiennych dla jednej obserwacji jest wierszem
19
ZADANIA20
1.* Dla gospodarstw domowych, których głowami są osoby powy\ej 40 roku \ycia
oszacowane zostały dwa modele, w których zmienną objaśnianą był m. in. dochód na osobę
(DOCH) wyra\any w złotych miesięcznie. Zbiór zmiennych objaśniających był następujący:
" WIEK - wiek głowy gospodarstwa,
" PRAC - zmienna 0/1 przyjmująca wartość 1, gdy głowa gospodarstwa jest
pracownikiem (tylko drugi model)
" EMEREN - zmienna 0/1 przyjmująca wartość 1, gdy głowa gospodarstwa jest
emerytem lub rencistÄ… (tylko drugi model)
Próba liczyła ponad 20 000 obserwacji. Wyniki estymacji były następujące (w nawiasach
podane sÄ… statystyki t-Studenta):
I model
DOCH = -3,85*WIEK + 791 + µ
(-13,3) (21,2)
R2 = 0,008
II model:
DOCH = 1,50*WIEK + 88,2*PRAC - 104,2*EMEREN + 512,9 + µ
(13,5) (9,0) (-9,2) (23,4)
R2 = 0,025
W obydwu przypadkach R2 okazał się istotnie większy od zera, zaś \aden z testów nie
wykazał i\ klasyczna MNK mo\e być niewłaściwa. W drugim modelu nie jest spełniona tzw.
 zasada koincydencji . Czy niewłaściwy jest model czy te\ powy\sza zasada?
2. Które stwierdzenia są nieprawdziwe i dlaczego?
a/ W liniowym modelu z jedną zmienną kowariancja kwadratów reszt i zmiennej
objaśniającej nie ró\ni się statystycznie od zera. Oznacza to homoskedastyczność reszt.
b/ Niska wartość R2 w liniowym modelu z jedną zmienną dowodzi, \e zale\ność między
zmienną objaśnianą i objaśniającą jest nieliniowa lub statystycznie nieistotna.
c/ zmienne niezale\ne muszą być losowe,
d/ Je\eli model regresji liniowej został oszacowany za pomocą wszystkich obserwacji w
populacji generalnej (a = Ä…), to R2 = 1.
20
Gwiazdka oznacza, \e zadanie jest nieco trudniejsze od pozostałych;  zal oznacza, \e
zadanie pochodzi z testów zaliczeniowych z poprzednich lat.
20
3. Za pomocÄ… klasycznej MNK oszacowano dwa liniowe modele inflacji. W pierwszym z
modeli współczynnik determinacji okazał się większy ni\ w modelu drugim, natomiast
oszacowanie wariancji reszt było w nim mniejsze. Ponadto okazało się, \e statystyka F
zdefiniowana za pomocą równania (1.13) tylko w przypadku drugiego oszacowania
przekracza wartość krytyczną przy poziomie istotności 0,05.
Które oszacowanie nale\y uznać za lepsze?
4. Dane są 4 próby liczące po 11 elementów, dla których poni\sze statystyki są jednakowe:
X = 9 ; Y = 7,5 ; D2 (X ) = 10 ; D2 (Y ) = 3,73
Oszacowanie modeli regresji za pomocą MNK dało równie\ wiele jednakowych wyników:
2
v = 0,5 Å" X + 3 ; S(a) = 0,188 ; R2 = 0,667 ; = 13,75 ; - v )2 = 27,5
"ei "(wi
i i
Graficzna ilustracja danych i funkcji regresji przedstawia się następująco:
Czy powy\sze wyniki przekreślają sens posługiwania się modelami regresji?
(Przedstawiony zbiór danych znany jest jako kwartet Anscombe a . Dane indywidualne mo\na
znalezć np. tutaj: http://www2.sjsu.edu/faculty/gerstman/EpiInfo/cont-cont.htm.)
5.(zal.) Model wydatków konsumpcyjnych dla trzech grup wydatków (np. \ywność,
mieszkanie i  pozostałe ) ma postać:
Xi
wil = Ä…l + Ä…l1 ln p1 + Ä…l 2 ln p2 + Ä…l3 ln p3 + ²l ln( ) + µi
P
gdzie wil oznacza udział (proporcję) wydatków na l-te dobro (l=1,2,3) w bud\ecie i-tego
gospodarstwa (lub i-tej grupy gospodarstw), pl indeks cen l-tej grupy wydatków, Xi sumę
wydatków i-tego gospodarstwa na głowę, P agregatowy indeks cen.
Od parametrów modelu wymaga się, aby spełniany był tzw. warunek jednorodności
zdefiniowany: ąl1 + ąl 2 + ąl3 = 0 . Szacując model bez narzucenia warunków jednorodności
uzyskano oszacowania parametrów (w nawiasach podane są błędy standardowe oszacowań):
a1=1,8 (0,95) a11= 0,04 (0,008) a12=0,24 (0,009) a13= -0,1 (0,025) d1= 0,85 (0,72)
Zakładając (abstrakcyjnie!), \e wszystkie elementy poza główną przekątną w macierzy
wariancji i kowariancji oszacowań parametrów (wzór 1.10) są równe zeru, nale\y sprawdzić
przy poziomie istotności 0,01 hipotezę o jednorodności oszacowanego modelu.
Liczba obserwacji wynosi 5000.
21
6. W modelu występującym w zadaniu 5 zmienna X okazała się skorelowana z resztami
modelu? Jakie mogą być tego przyczyny? Jakie zmienne instrumentalne mo\na zastosować
do estymacji tego modelu.?
7.(zal.) Na podstawie danych indywidualnych z bud\etów gospodarstw domowych z 2002 r.
oszacowany został model wydatków na pieczywo21. Z uwagi na domniemane skorelowanie
reszt z dwiema pierwszymi zmiennymi (suma wydatków gospodarstwa i kwadrat tej sumy),
oszacowano model równie\ za pomocą metody zmiennych instrumentalnych.
Nale\y ustalić przyczynę skorelowania przynajmniej jednej ze zmiennych z resztami.
Jakie instrumenty mogą być u\yte? (nale\y wymienić co najmniej dwa, uzasadniając
odpowiedz).
Wyniki oszacowań przedstawia poni\sza tabela.
MNK MZI
Zmienna
oszacowanie t oszacowanie t
wydatki -0,222 -37,1 -0,274 -24,9
wydatki2 0,014 32,5 0,018 21,9
miasto -0,009 -32,8 -,007 -27,9
log_wiek 0,042 5,7 0,045 5,29
log_wiek2 -0,005 -4,9 -0,005 5,1
wyraz wolny 0,797 37,1 0,975 25,3
R2 0,61 0,59
Nale\y te\ ocenić prawdziwość poni\szych stwierdzeń:
a/ Skoro t i R są (z jednym wyjątkiem) wy\sze przy MNK, to nale\y wykorzystać
oszacowania uzyskane tÄ… metodÄ….
b/ Oszacowania uzyskane za pomocÄ… MZI sÄ… nadal obciÄ…\one i niezgodne, poniewa\
pozostawione zostały zmienne skorelowane z resztami.
c/ Usunięcie pierwszych dwóch zmiennych pozwoli uzyskać za pomocą MNK nieobcią\one
estymatory parametrów modelu.
8. (zal.). Za pomocą 54 obserwacji oszacowany został model o następującej ogólnej postaci:
yi = a1xi( ) + a2xi(´ ) + b + ei
gdzie zapis X() oznacza transformację Boxa-Coxa. Dokonano następnie za pomocą testu
ilorazu wiarygodności weryfikacji dwóch hipotez:
H0:  = 1 oraz H0: ´ = 2 przy obustronnych hipotezach alternatywnych. Statystyki testowe
przyjęły wartości 0,64 oraz 0,9.
Posługując się tymi samymi danymi wykonano równie\ test Chowa dla modelu:
wi = b1xi + b0
obliczając m. in. sumy kwadratów reszt RRSS i URRS. Którą (które) parę (pary) wartości
mo\na uznać za najbardziej prawdopodobne: a/ 190 i 175, b/ 190 i 180, c/ 225 i 185.
21
Zmienną objaśnianą jest udział wydatków na pieczywo w łącznej sumie wydatków gospodarstwa.
22
9*(zal.). Za pomocą 203 obserwacji oszacowano następujący model regresji:
yi = Ä…0 + Ä…1xi1 + Ä…2xi2 + µi
Dla p=2 wartość statystyki w teście Ramsey a (RESET) wyniosła 3,89.
Za pomocą tej samej próby oszacowano równie\ model:
2 2
yi = ²0 + ²1xi1 + ²2xi1 + ²3xi2 + ²4xi2 + µi
uzyskujÄ…c m. in. wynik:
îÅ‚îÅ‚1 0Å‚Å‚ îÅ‚1 0Å‚Å‚2 Å‚Å‚-1 îÅ‚ 1,2 -1,2Å‚Å‚
-1
ïÅ‚ïÅ‚ S2(b)ïÅ‚ śł
[S2[h(b)]] = =
ïÅ‚-1,2 2,1 śł
ïÅ‚ðÅ‚0 1śł ðÅ‚0 1śł śł
ûÅ‚ ûÅ‚ ðÅ‚ ûÅ‚
ðÅ‚ ûÅ‚
gdzie S2 (b) jest macierzÄ… wariancji i kowariancji oszacowaÅ„ parametrów ²2 i ²4. Które z
nastÄ™pujÄ…cych par oszacowaÅ„ parametrów ²2 i ²4 nie mogÄ… (najprawdopodobniej) być
prawdziwymi oszacowaniami: b2=0,6 i b4=-1,2 oraz b2=1,8 i b4=-3,6. Odpowiedz nale\y
uzasadnić.
10. Liniowy model wyjaśniający zmiany bezrobocia w Niemczech został oszacowany na
podstawie danych z landów wschodnich i zachodnich (osobno) oraz trzeci raz na podstawie
wszystkich danych łącznie. Liczba obserwacji wynosiła, odpowiednio: 22, 38 i 60. Modele
były identyczne i liczyły po 6 zmiennych objaśniających. Sumy kwadratów reszt w modelach
 wschodnim ,  zachodnim i  połączonym wynosiły odpowiednio: 90, 120 i 240.
Identyczny model został oszacowany dla Belgii trzykrotnie: dla Flandrii (28
obserwacji), dla Walonii (32 obserwacje) i dla całego kraju (60 obserwacji). Sumy kwadratów
reszt dla pierwszych dwóch estymacji wyniosły, odpowiednio, 75 i 95. Regionalne
zró\nicowanie przyczyn bezrobocia jest znacznie wy\sze w Niemczech ni\ w Belgii. Która z
trzech liczb: 280, 160 i 190 jest najbardziej prawdopodobna jako suma kwadratów reszt w
trzeciej estymacji modelu?
11. (zal.). Za pomocą 54 obserwacji oszacowany został model o następującej ogólnej postaci:
yi( ) = a1xi(´ ) + a0 + ei
gdzie zapis Y() oraz X(´) oznacza transformacjÄ™ Boxa-Coxa. Dokonano nastÄ™pnie za pomocÄ…
testu ilorazu wiarygodności weryfikacji dwóch hipotez:
H0:  = 0 oraz H0: ´ = 1 przy obustronnych hipotezach alternatywnych. Statystyka testowa
przyjęła wartość.
Posługując się tymi samymi danymi wykonano równie\ test Chowa dla modelu:
wi = b1xi + b0
obliczając m. in. sumy kwadratów reszt RRSS i URRS. Którą (które) parę (pary) wartości
mo\na uznać za najbardziej prawdopodobne: a/ 190 i 175, b/ 190 i 180, c/ 225 i 185.
12*. Oszacowano dwa liniowe modele regresji z dwiema zmiennymi objaśniającymi (X1 i X2)
za pomocą klasycznej MNK, uzyskując następujące informacje o wartościach zmiennej i
resztach:
23
Pierwsza estymacja:
X1 1 1,2 1,6 2 2,1 2,2 2,3 2,9 3,1
µ -0,1 -0,2 0,1 -0,2 -0,1 0,2 0,3 0,1 -0,1
Druga estymacja:
X1 3,1 3,5 3,7 3,8 4 4,6 4,6 4,8
µ 0,3 -0,2 -0,2 0,3 -0,1 -0.1 0,2 -0,2
śaden z zastosowanych testów nie upowa\nił do odrzucenia zało\enia o normalności reszt.
Czy na tej podstawie mo\na wysnuć wniosek o homoskedastyczności reszt modelu
oszacowanego na podstawie całej próby (obejmującej 17 obserwacji)? Czy wniosek ten
zmieniłby się gdyby X1 była jedyną zmienną objaśniającą?
ZADANIE DOMOWE22 (nieobowiÄ…zkowe i, wbrew pozorom, trudne)
Nale\y uzasadnić  przykazania dekalogu Kennedy ego (patrz: str. 18), odwołując się do
literatury i/lub własnych doświadczeń. Mo\na u\ywać negatywnych przykładów ( do czego
prowadzi łamanie danego przykazania ). Za ka\de przykazanie mo\na otrzymać 1 punkt (w
wyjątkowych przypadkach więcej) zaś końcowa ocena to liczba uzyskanych punktów minus
5, w przypadku gdy ocena jest nieujemna lub zero w przeciwnym przypadku.
Rozwiązania nale\y zło\yć w formie pisemnej podczas zajęć lub w Instytucie Statystyki i
Demografii (713F) do maja, godz. 15:00.
ZASADY ZALICZANIA ZAJĆ
Aktywność na ćwiczeniach będzie premiowana punktami (bez górnego limitu).
Do tej oceny będzie dodawana (ewentualna) ocena za zadanie domowe.
Dla osób, które chcą poprawić konto punktowe po zakończeniu zajęć przewidziane są dwa
sprawdziany (mo\na pisać tylko w jednym terminie). Końcowa ocena będzie sumą
wszystkich uzyskanych punktów, z dwoma ograniczeniami: a/ punkty za prace domową będą
dodane pod warunkiem uzyskania co najmniej 2 pkt. za sprawdzian lub 4 pkt. za aktywność,
b/ osoby, które uzyskały du\o punktów za ćwiczenia i pracę domową23 będą mogły
rozwiązywać tylko część zadań na sprawdzianie.
22
Zadanie nale\y wykonać samodzielnie. W przypadku stwierdzenia jego podobieństwa do innych rozwiązań (w
szczególności rozwiązań przedstawionych przez inne osoby, ale nie tylko) ocena za pracę domową zostanie
obni\ona do zera.
23
Szczegóły będą podane pózniej.
24
ZADANIA Z OSTATNIEGO SPRAWDZIANU
1. Eksperci Instytutu im. Doktora Kevorikiana twierdzÄ…, \e jeden wypalany dziennie papieros
zwiększa tętno średnio o 0,55 uderzenia na minutę. Na podstawie wyników badania 850 osób
oszacowano model, w którym zmienną objaśnianą było tętno a objaśniającą liczba
wypalanych dziennie papierosów. Wartość oszacowania parametru przy zmiennej
objaśniającej wyniosła 0,45, zaś wariancja tego oszacowania 0,0012.
Czy mo\na stwierdzić, \e wyniki badania zaprzeczają przypuszczeniu ekspertów
Instytutu? Na pytanie nale\y odpowiedzieć bez posługiwania się testem t-Studenta (wszystkie
inne testy sÄ… dozwolone). (4 pkt.)
Odpowiedz:
Hipotezę mówiącą, \e oszacowanie parametru regresji wynosi 0,55 mo\na sprawdzić m. in.
za pomocą testu Walda. Jego statystyka testowa (wzór 3.2) przyjmuje wartość:
1
(0,45 - 0,55) (0,45 - 0,55)'= 8,33
0,0012
Poniewa\ ma ona rozkÅ‚ad Ç2 z 1 stopniem swobody, to hipotezÄ™ zerowÄ… mo\na odrzucić
praktycznie przy dowolnym poziomie istotności. Ergo, eksperci Instytutu nie mają racji.
2. Tzw. translogarytmiczna funkcja pośredniej u\yteczności danego gospodarstwa domowego
ma postać:
n n n
p d(LIO, P)
ëÅ‚ öÅ‚
pid(LIO, P)
öÅ‚
ìÅ‚ ÷Å‚
ln v(P, X ) = Ä…0 + lnëÅ‚ lnìÅ‚ j
ìÅ‚ ÷Å‚ ìÅ‚ ÷Å‚
"lnëÅ‚ pid(LIO, P) öÅ‚ + 1 ""²ij
÷Å‚
X 2 X X
íÅ‚ Å‚Å‚ íÅ‚ Å‚Å‚
i=1 i=1 j=1
íÅ‚ Å‚Å‚
gdzie :
m
ëÅ‚ öÅ‚
i
i
d(LIO, P) = LIOS expìÅ‚ LIO÷Å‚ piÅ‚ LIO
"Sk
íÅ‚ k =1 Å‚Å‚
P = [p1, p2, ... pn] jest wektorem cen, X sumą wydatków konsumpcyjnych gospodarstwa, LIO
liczbą osób zaś n oznacza liczbę (grup) dóbr (w omawianym modelu wynosi ona 5). Na
parametry funkcji zostały narzucone warunki:
n n n
i ²ij = 0 dla j = 1, 2, ... , n; i = 0;
"Ä… = 1; " "Å‚
i=1 i=1 i=1
Wartości parametrów zostały oszacowane (za pomocą tzw. równości Roy a) dwukrotnie: bez
narzuconych ograniczeń i z ograniczeniami. W pierwszym przypadku logarytm funkcji
wiarygodności wyniósł -1850. Jaką maksymalną wartość mo\e przyjąć logarytm funkcji
wiarygodności przy estymacji modelu z narzuconymi warunkami dodatkowymi, aby mo\na
było uznać, \e nie są one spełniane  samorzutnie . (4 punkty).
Odpowiedz:
Odpowiedz na pytanie wymaga ustalenia przy jakiej wartości statystki w teście ilorazu
wiarygodnoÅ›ci odrzucimy hipotezÄ™ zerowÄ…. Ma ona rozkÅ‚ad Ç2 z liczbÄ… stopni swobody
równą liczbie testowanych warunków czyli 7 (1 + 5 +1). Przyjmując poziom istotności 0,05
ustalamy wartość krytyczną statystyki testowej na 14,1. Musimy zatem rozwiązać nierówność
(por wzór 3.1)
25
LR
- 2 ln > 14,1
LU
Poniewa\ ln LU=-1850, to ln LR>1857,05.
3.  Archimedes powiedział: dajcie mi punkt podparcia i dostatecznie długą dzwignię, a
podniosę Ziemię. Ekonomiści mają własną dzwignię Archimedesa: estymację metodą
zmiennych instrumentalnych (Michael P. Murray, Journal of Economic Perspectives, nr 4,
2006).
Na czym polega podobieństwo między dzwignią Archimedesa i MZI?
(Wskazówka: nikomu nie udało się podnieść Ziemi metodą Archimedesa).
(1 pkt.)
Odpowiedz
Analogiczne ograniczenia w stosowaniu MZI to:
a/ nieuniknione skorelowanie instrumentów z resztami (skoro są skorelowane ze zmiennymi
instrumentowanymi), co odpowiada brakowi dostatecznie długiej dzwigni
b/ niemo\ność empirycznego sprawdzenia skorelowania zmiennych instrumentowanych z
resztami, co odpowiada brakowi punktu podparcia.
4. Proszę ocenić prawdziwość poni\szych zdań, uzasadniając odpowiedz:
a/ Je\eli statystyka testu Goldfelda-Quandta w modelu zale\ności pomiędzy zmienną
instrumentowaną a (potencjalnymi) instrumentami przekroczyła wartość krytyczną, to
stosowanie metody zmiennych instrumentalnych nie jest wskazane.
b/ Odrzucenie hipotezy zerowej w teście Chowa nie pozwala za stosować testu RESET dla
tych samych danych i tego samego modelu.
c/ Przy du\ej próbie testem ilorazu wiarygodności mo\na zastąpić test F (1.13, str. 6 w
skrypcie) lecz testem F nie zawsze mo\na zastąpić test ilorazu wiarygodności.
d/ Usunięcie z modelu zmiennej objaśniającej skorelowanej z inną (pozostawioną) zmienną
objaśniającą mo\e skutkować niezgodnością estymatorów parametrów strukturalnych.
(4 punkty)
Odpowiedzi:
a/ NIE. Przekroczenie wartości krytycznej w teści G-Q wskazuje na skorelowanie wariancji
reszt z którąś ze zmiennych objaśniających, co nie świadczy o skorelowaniu samych reszt.
b/ NIE. Testy te mogą być do pewnego stopnia stosowane zamiennie jako testy liniowości.
c/ TAK. Test ilorazu wiarygodności słu\y do testowania dowolnych hipotez o parametrach,
test F jedynie hipotezy mówiącej o ich zerowej wartości.
d/ TAK. Usunięta zmienna wchodzi w skład (nowych) reszt. Skoro pozostawiona jest z nią
skorelowana, to mo\e być równie\ skorelowana z resztami.
26


Wyszukiwarka

Podobne podstrony:
Wyklad 7 Nieparametryczne metody statystyczne PL [tryb zgodności]
Modele zajęć praktycznych metody nauczania
Metody statystyczne dla opornych cz 2
Metody statystyczne dla opornych cz 1
2008 Metody obliczeniowe 08 D 2008 11 11 21 31 58
Metodyka statystycznych analiz wypadków przy pracy
chomik Wybrane modele ekologiczne oraz metody rozwiązywania równań różniczkowych zwyczajnych
METODY STATYSTYCZNE 2014 materiały do W4
L7 Modele regresyjne
rozklady statystyk z proby SGH zadania

więcej podobnych podstron