hetero


Paweł Strawiński Notatki do ćwiczeń z ekonometrii
2 Rozszerzenia MNK
2.1 Heteroscedastyczność
2.1.1 Wprowadzenie
Przy wyprowadzaniu estymatorów Klasycznego Modelu Regresji Liniowej
(KMRL) zakładaliśmy, że są spełnione założenia Gaussa-Markowa, tzn. skład-
niki losowe są homoscedastyczne i nieskorelowane. Jednak te założenia dla
dużej liczby modeli nie są spełnione. Homoscedastycznośc i nieskorelowanie
składników losowych są przypadkiem szczególnym, a nie regułą.
Heteroscedastyczność, czyli brak stałej wariancji występuje w wielu kla-
sach modeli, zarówno w modelach dla danych przekrojowych, jak i w mo-
delach tworzonych na podstawie szeregów czasowych i danych o charakterze
panelowym. Najprostszym przykładem, który uzasadnia powszechnośc wy-
stępowania heteroscedastyczności jest analiza wydatków gospodarstw domo-
wych na konkretną grupę towarów np. żywność. Naturalne jest, że gospodar-
stwa domowe dysponujące większym budżetem, będą przeciętnie wydawały
więcej. Będą kupowały większe ilości towarów, bardziej zróżnicowany koszyk
dóbr i będą to z reguły towary droższe. Gdy wykonamy wykres wydatków
konsumpcyjnych w stosunku do dochodów rozporządzalnych to zauważymy,
że wśród gospodarstw o niższych dochodach zróżnicowanie poziomu wydat-
14.4 31786.08
dochód rozporządzalny
Zródlo: Obliczenia wlasne, dane BBGD 2004
ków jest dużo mniejsze (absolutnie i relatywnie) niż w grupie gospodarstw o
wysokich dochodach. Dzieje się tak, gdyż bogatsze gospodarstwa nabywają
bardziej zróżnicowane koszyki dóbr, oraz mają większe możliwości substytucji
dóbr tańszych droższymi odpowiednikami.
Model ze zmienną wariancją może przyjmować różne formy. Wychodząc
od Klasycznego Modelu Regresji Liniowej postać funkcyjną modelu możemy
68
wydatki konsumpcyjne
0
10000
20000
30000
40000
Paweł Strawiński Notatki do ćwiczeń z ekonometrii
zapisać jako:
y = X² + µ (1)
Model z heteroscedastycznością różni się jedynie tym od KMRL, że na dia-
gonali macierzy wariancji-kowariancji składnika losowego znajdują się różne,
dodatnie liczby obrazujące wielkość wariancji (błędu pomiaru) dla kolejnych
obserwacji. W odróżnieniu od KMRL macierz wariancji-kowariancji oznacza-
my przez:
var(µ) = &! = Ã2V (2)
gdzie V jest macierzÄ… diagonalnÄ…, ale elementy stojÄ…ce na diagonali nieko-
niecznie są równe 1. Funkcja opisująca zmienność wariancji może przyjmo-
wać różne formy. Załóżmy, że wariancja składnika losowego modelu zależy od
pewnego zbioru zmiennych Z. W jego skład mogą wchodzić zarówno zmienne
objaśniające modelu, czyli wektory z macierzy X, jak również zmienne nie
uwzględnione w równaniu modelu. Przykładowe formy heteroscedastyczno-
ści:
1. wariancja może być funkcją liniową zmiennych z macierzy Z
2
var(µi) = Ãi = ´zi ´ > 0
2. forma kwadratowa zabezpiecza nas przed ewentualną ujemnością wa-
riancji
2 2
var(µi) = Ãi = ´zi ´ > 0
3. wariancja może być również funkcją afiniczną zmiennych z macierzy Z.
W takim przypadku mówimy o heteroscedastyczności addytywnej
2 2
var(µi) = Ãi = ´1 + ´2zi ´1 > 0, ´2 > 0
4. wariancja może również przyjmować postać wykładniczą. Wtedy mó-
wimy o wariancji z heteroscedastycznością multiplikatywną
2 2
var(µi) = Ãi = exp(´1 + ´2zi )
5. w modelu może również występować wariancja przełącznikowa (swit-
ching).
2
Ã1 dla i=1...s
2
var(µi) = Ãi =
2
Ã2 dla i=s+1...T
ten typ wariancji może być połączony z każdą z uprzednio przedsta-
wionych postaci.
69
Paweł Strawiński Notatki do ćwiczeń z ekonometrii
2.1.2 Własności estymatorów MNK
Estymatorem w KMRL otrzymywanym Metodą Najmniejszych Kwadratów
dla wektora nieznanych parametrów ² jest:
b = (X X)-1X y (3)
Jeśli uchylimy założenie o homoscedatyczości to estymator nadal pozostanie
nieobciążony, ponieważ:
E(b) = E(X X)-1X y = E(X X)-1X (X² + µ) =
(X X)-1X X E(²) + (X X)-1X X E(µ) = ²
I I 0
Podczas dowodu nieobciążoności nie korzystamy z homoscedastyczności skład-
nika losowego µ. Jeżeli macierz obserwacji X nie zawiera regresorów skore-
lowanych z bÅ‚Ä™dem losowym µ, to wariancjÄ™ estymatora b możemy zapisać
jako:
var(b) = E(b - E(b))(b - E(b)) = E[(X X)-1X µµ X(X X)-1] =
(X X)-1X E(µµ )X(X X)-1 = (X X)-1X E[&!]X(X X)-1
var(b) = Ã2(X X)-1X V X(X X)-1 (4)
Jak widać wariancja estymatora jest różna od Ã2(X X)-1. Jeżeli V jest ma-
cierzą dodatnio okresloną (a tak jest w przeważającej większości przypadków)
to rzeczywista wariancja jest wyższa niż oszacowanie uzyskane MNK. Wo-
bec tego statystyka S2 będzie obciążonym estymatorem wariancji składnika
losowego. Jednak zazwyczaj nie ma pewności, czy estymator MNK niedo-
szacowuje, czy przeszacowuje prawdziwą wielkość wariancji. Co więcej testy
statystyczne oparte na statystykach t, F oraz Ç2 bardzo czÄ™sto bÄ™dÄ… dawać
mylne wyniki.
2.1.3 Uogólniona Metoda Najmniejszych Kwadratów
W związku z tym, że MNK zastosowana do modelu regresji liniowej z nie-
sferycznym składnikiem losowym jest nieefektywna, zamiast niej używa się
Uogólnionej Metody Najmniejszych Kwadratów (UMNK) Generalized Least
Squares (GLS). Pozwala ona na uwzględnienie braku sferyczności błędów
losowych.
Do otrzymania efektywnego estymatora wektora nieznanych parametrów
² wymagana jest znajomość postaci macierzy wariancji-kowariancji &!. Na
początku rozważymy przypadek, w którym macierz &! jest znana, symetrycz-
na i dodatnio określona.
70
Paweł Strawiński Notatki do ćwiczeń z ekonometrii
Twierdzenie 1 O faktoryzacji macierzy.
Każdą dodatnio określoną macierz A można przedstawić w postaci:
A = C›C
gdzie kolumny macierzy C zawierajÄ… wektory wÅ‚asne macierzy A, a › jest
macierzą diagonalną z wartościami własnymi macierzy A na diagonali.
Stosując twierdzenie o faktoryzacji do macierzy &! możemy zapisać:
&! = C›C
Elementem upraszczającym faktoryzację macierzy &! jej symetryczność.
"jest
1
2
Niech › bÄ™dzie macierzÄ… diagonalnÄ… o elementach i na diagonali. Oczy-
1 1 1
2 2 2
wiÅ›cie › › = ›. Niech P = ›- . Wobec tego &!-1 = P P , ponieważ P i ›
sÄ… diagonalne to P = P oraz › = › . Jeżeli przemnożymy model (1) z lewej
strony przez macierz P otrzymamy:
P y = P X² + P µ
lub alternatywnie
y" = X"² + µ" (5)
Wariancja składnika losowego wynosi zatem:
E[µ"µ "] = P µµ P = Ã2P V P = Ã2I
Zatem w modelu z przekształconymi zmiennymi składnik losowy jest ho-
moscedastyczny i nieskorelowany. Wobec tego możemy zastosować MNK do
estymacji parametrów modelu (5). Ponieważ macierz wariancji-kowariancji
&! jest znana, y" oraz X" są danymi pochodzącymi z próby losowej. Wobec
tego:
Ć
² = (X"X")-1X"y" (6)
Ć
² = (X P P X)-1X P P y
Ć
² = (X &!-1X)-1X &!-1y
jest efektywnym estymatorem nieznanego wektora parametrów ². Estymator
(6) jest nazywany estymatorem Uogólnionej Metody Najmniejszych Kwa-
dratów, albo estymatorem Aitkena. Różni się on od klasycznego estymatora
MNK tym, że do  ważenia obserwacji używa macierzy &!-1 zamiast macierzy
jednostkowej I.
71
Paweł Strawiński Notatki do ćwiczeń z ekonometrii
Własności estymatora UMNK.
Twierdzenie 2 Aitkena
Jeżeli wektory macierzy X" sÄ… nieskorelowane z bÅ‚Ä™dem losowym µ", wtedy:
Ć
E[² | X"] = E[(X"X")-1X"y" | X"] = ² + E[(X"X")-1X"µ | X"] = ²
Estymator Uogólnionej Metody Najmniejszych Kwadratów jest nieobciążony.
Ten wynik jest równoważny z E[P µ | P X] = 0. Ponieważ macierz P skÅ‚ada
siÄ™ ze znanych staÅ‚ych elementów, warunek redukuje siÄ™ do E[µ | X] = 0,
czyli regresory powinny być nieskorelowane ze składnikiem losowym.
Estymator Uogólnionej Metody Najmniejszych Kwadratów jest zgodny je-
1
śli plimnX"X" = Q", gdzie Q" jest dodatnio określoną macierzą o skończo-
nych elementach. WstawiajÄ…c do wzoru na estymator otrzymujemy:
1
plim[ X &!-1X]-1 = Q-1
"
n
by ta granica istniała i była skończona macierz danych transformowanych X"
musi być macierzą o pełnym rzędzie kolumnowym i skończonych elementach.
Estymator Uogólnionej Metody Najmniejszych Kwadratów ma rozkład asymp-
totycznie normalny o Å›redniej ² i wariancji:
Ć
var[² | X"] = Ã2(X"X")-1 = Ã2(X &!-1X)-1
Ć
Estymator Uogólnionej Metody Najmniejszych Kwadratów ² jest liniowym,
nieobciążonym estymatorem o minimalnej wariancji dla uogólnionego mode-
lu regresji, o ile znana jest postać macierzy wariancji-kowariancji. Wynika
to z zastosowania twierdzenia Gaussa-Markowa do modelu (6). Twierdzenie
Gaussa-Markowa jest przypadkiem szczególnym twierdzenia Aitkena, dla któ-
rego &! = I.
2.1.4 Stosowalna UMNK
Estymator wyprowadzony w części 2.1.3 jest nazywany w literaturze ekono-
metrycznej estymatorem Teoretycznej Uogólnionej Metody Najmniejszych
Kwadratów. Jest to spowodowane tym, że w celu wyprowadzenia tego esty-
matora musi być znana macierz wariancji-kowariancji składnika losowgo &!.
Przeważnie w zastosowaniach ekonometrycznych ta macierz nie jest znana,
wobec tego nie możemy użyć UMNK. Możemy jednak nieznane parametry
macierzy zastąpić estymatorami. Ale jeśli nie narzucimy żadnych ograniczeń
na postać macierzy wariancji-kowariancji staniemy przed nierozwiązywalnym
72
Paweł Strawiński Notatki do ćwiczeń z ekonometrii
problemem. Macierz &! jest macierzÄ… symertycznÄ… o wymiarze N × N. Wo-
bec tego musimy oszacować n(n + 1)/2 nieznanych parametrów, dysponując
jedynie n obserwacjami. Jest to zadanie niewykonalne.
Wobec tego dla każdego konkretnego modelu ekonometrycznego wybie-
ramy zbiór parametrów ¸ tak aby &! = &!(¸) postać macierzy wariancji-
kowariancji składnika losowego zależała jedynie od wartości parametrów z
tego zbioru. W przypadku heteroscedastyczności zazwyczaj przyjmujemy, że
model ma jeden dodatkowy parametr.
2 ¸
Ãi = Ã2zi (7)
Ć
Przypuśćmy, że ¸ jest zgodnym estymatorem nieznanego wektora parame-
trów ¸. Wobec tego w UMNK możemy zastÄ…pić nieznanÄ… macierz wariancji-
Ć
kowariancji skÅ‚adnika losowego jej estymatorem &! = &!(¸).
Zapiszmy estymator Stosowalnej UMNK jako
Ż Ć Ć
² = (X &!-1X)-1X &!-1y (8)
Jednak czÄ™sto w zastosowaniach zamiast przyjmować zaÅ‚ożenie µ <" N (0, Ã2&!),
warto jest przyjąć, że µ <" N (0, V ). W takim przypadku estymator przyjmuje
postać
-1 -1
bSUMNK = (X V X)-1X V y (9)
Jeżeli spełnione są następujące warunki:
1 1
Ć
plim X &!-1X - X &!-1X = 0
n n
1 1
Ć
"
plim X &!-1µ - " X &!-1µ = 0
n n
Ż Ć
to estymator ² jest asymptotycznie równoważny estymatorowi ². Pierwszy
z warunków stanowi, że jeżeli ważona suma kwadratów otrzymywana z ma-
cierzy &! dąży do dodatnio określonej macierzy, to ważona suma kwadratów
Ć
otrzymywana z estymatora macierzy &! dąży do tej samej macierzy. Drugi
warunek mówi, że jeśli macierz przekształconych zmiennych jest macierzą
odwracalną o skończonych elementach, to jej rozkładem granicznym będzie
rozkład asymptotycznie normalny. Estymatory SUMNK są asymptotycznie
efektywnie, jednak w małych próbach ich własności nie są znane.
2.1.5 Ważona Metoda Najmniejszych Kwadratów
Jednym z wyjątkowych przypadków, w którym forma macierzy wariancji-
kowariancji &! jest znana jest przypadek Ważonej Metody Najmniejszych
73
Paweł Strawiński Notatki do ćwiczeń z ekonometrii
Kwadratów. Jeżeli w modelu występuje heteroscedastyczności to &! jest ma-
cierzÄ… diagonalnÄ… o elementach var[µi | xi] = Ã2Éi jest przypisanie wag po-
szczególnym obserwacjom. Estymator UMNK dany jest wzorem:
Ć
² = (X &!-1X)-1X &!-1y
Jeżeli elementy Éi (wagi) sÄ… znane to &!-1 jest macierzÄ… diagonalnÄ… o elemen-
tach na diagonali równych 1/Éi. Jeżeli przeksztaÅ‚cimy model mnożąc przez
macierz P danÄ… wzorem:
îÅ‚ Å‚Å‚
"
1/ É1 0
ïÅ‚ śł
.
.
P =
ðÅ‚ . ûÅ‚
"
0 1/ ÉN
i zastosujemy MNK do przekształconego modelu to otrzymamy estymator
ważonej metody najmniejszych kwadratów
n n
-1
b = wix ixi wix iyi
i=1 i=1
w którym wi = 1/Éi. Obserwacje o maÅ‚ych wariancjach, a wiÄ™c bardziej
dokładne, dostają większe wagi, wobec tego mają większy wpływ na wielkości
uzyskanych oszacowań. W praktyce bardzo często jako wagi bierze się jedną
ze zmiennych objaśniających modelu lub jej kwadrat.
2.1.6 Stosowalna UMNK
Metoda UMNK jest metoda czysto teoretyczna, gdyż w praktyce nie są zna-
ne wartości elementów macierzy wariancji-kowariancji (poza przypadkiem w
pełni kontrolowanego eksperymentu). Aby uzyskać jej oszacowanie, przyjmu-
je się założenie, ze wariancja błędu losowego jest funkcją wektora zmiennych
egzogenicznych Z.
2
E(µi | Zi) = Ãi = Ã2f(zi)
gdzie f(·) jest pewnÄ… funkcjÄ…. Z reguÅ‚y przyjmuje siÄ™ że jest ona liniowa,
kwadratowa lub wykładnicza.
W modelu z heteroscedastycznym składnikiem losowym, w którym brak
jest autokorelacji, macierz wariancji-kowariancji błędu losowego jest diago-
nalna. Jej odwrotność przyjmuje postać:
îÅ‚ Å‚Å‚
1
0
f(Ä…0
+Ä…zi)
1 1
ïÅ‚ śł
-1 .
.
&!-1 = V = = Ã2L L
ðÅ‚ . ûÅ‚
Ã2 Ã2
1
0
f(Ä…0
+Ä…zi)
Oszacowania uzyskujemy w następujący sposób:
74
Paweł Strawiński Notatki do ćwiczeń z ekonometrii
1. Szacujemy model yi = xib + ei i uzyskujemy wektor reszt.
2. Przeprowadzamy regresję e2 na stałej i wektorze zi
3. Szacujemy macierz L.
Ć
4. Przekształcamy za pomocą oszacowania L oryginalny model
5. Obliczamy estymator
W praktyce oszacowania uzyskane za pomocą SUMNK są zbliżone do osza-
cowań MNK.
2.1.7 Estymator White a
Jeśli znalibyśmy macierz wariancji-kowariancji &!, wtedy estymatorem ma-
cierzy wariancji-kowariancji wektora parametrów ² byÅ‚oby
-1 -1
1 1 1 1
var(²) = X X X &!X X X
n n n n
Jednak macierz &! nie jest znana. Zachodzi więc konieczność oszacowania
n(n+1)/2 nieznanych parametrów macierzy na podstawie n obserwacji. Whi-
te w swoim artykule z 1980 roku pokazał, że rozwiązaniem jest odmienne
spojrzenie na problem. To co jest istotne to uzyskanie zgodnego estymatora
dla macierzy X &!X, która ma wymiar k × k. Ponadto liczba zmiennych w
modelu jest zazwyczaj stała i nie zależy od rozmiaru próby. Oznaczmy przez
xj j-ty wiersz macierzy obserwacji X. Wówczas
n
2
X &!X = X Ã2V X = Ãi xix i
i=1
White zaproponował by nieznane wariancje zastąpić kwadratami reszt. W
ten sposób uzyskany estymator jest zgodny.
Formalnie należy pokazać że
n n
1
plimQ" = plim Ãijxix j
n
i=1 j=1
Elementy macierzy Q" to iloczyny wariancji Ãij oraz kolumn macierzy X.
DziÄ™ki temu, że b jest zgodnym estymatorem wektora ², reszty otrzymane z
MNK ei są zgodnymi punktowymi estymatorami błędów z populacji. White
wykazał, że w przypadku heteroscedastyczności dla estymatora
n
1
S = e2xix i
i
n
i=1
75
Paweł Strawiński Notatki do ćwiczeń z ekonometrii
prawdziwe jest
plimS = plimQ"
Korzystając z prawa wielkich liczb możemy zapisać plimQ" dla przypadku
heteroscedastyczności jako
n n
1 1
plimQ" = plim Ãijxix i = plim µ2 xix i (10)
ii
n n
i=1 i=1
Ponieważ b jest zgodnym estymatorem ², możemy zastÄ…pić w (10) bÅ‚Ä™dy
losowe z populacji µi przez wartoÅ›ci z próby ei. w rezultacie otrzymujemy
estymator White a, który jest zgodny w przypadku heteroscedastyczności
(White heteroscedasticity consistent estimator)
-1 -1
1 1 1 1
AsyV ar[b] = X X X [e2&!]X X X (11)
i
n n n n
AsyV ar[b] = n(X X)-1S(X X)-1
Z równania (11) wynika, że nie robiąc żadnych założeń a priori o postaci
heteroscedastyczności, możemy przeprowadzić estymację metodą MNK. Jest
to bardzo użyteczne w sytuacji, gdy nic nie wiemy o naturze heterosceda-
styczności w modelu.
2.1.8 Testowanie występowania heteroscedastyczności
Wnioskowanie na podstawie modelu w którym pominiemy problem hetero-
scedastyczności z dużym prawdopodobieństwem jest nieprawidłowe. Z tego
powodu ważnym elementem budowy poprawnego modelu ekonometrycznego
jest zbadanie czy składnik losowy jest homoscedastyczny. Większość testów
wykrywających heteroscedastyczność bazuje na tym że estymator metody
najmniejszych kwadratów jest zgodny nawet w przypadku występowania he-
teroscedastyczności. Wobec tego reszty otrzymane metodą MNK z modelu
będą zachowywać się bardzo podobnie jak prawdziwe reszty nawet przy he-
teroscedastyczności. Korzystając z tej własności test konstruuje się na pod-
stawie otrzymanych reszt z regresji.
Test White a. Test White a jest ogólnym testem wykrywającym obecność
heteroscedastyczności. Testujemy hipotezę:
2
H0 : Ãi = Ã2 "i
H1 : H0 jest nieprawdziwa
Test przeprowadzany jest w sposób następujący:
76
Paweł Strawiński Notatki do ćwiczeń z ekonometrii
1. Szacujemy parametry modelu regresji y = X² + µ, i zapamiÄ™tujemy
wektor reszt ei
2. Podnosimy reszty do kwadratu e2
i
3. Przeprowadzamy regresję e2 na stałej, wszystkich zmiennych modelu (je
i
możemy pominąć) oraz kwadratach zmiennych i wszystkich iloczynach
postaci xsxr s = r

4. Zapamiętujemy R2
5. Statystyka LM = nR2 ma asymptotyczny rozkÅ‚ad Ç2 z liczbÄ… stopni
swobody równą ilości zmiennych w regresji z punktu (3) bez stałej
Intuicyjnie idea testu jest prosta. Jeżeli model jest prawidłowy, i nie występu-
je heteroscedastyczność, kwadraty reszt powinny niewiele wyjaśniać. Wobec
tego jeśli statystyka testowa jest mała nie mamy podstaw by twierdzić że w
modelu występuje heteroscedastyczność.
Warto również zauważyć, że test RESET Ramsey a jest przypadkiem
szczególnym testu White a.
Przykłady: Model 1. Zarobki.
Source | SS df MS Number of obs = 25794
----------+------------------------------ F( 5, 25788) = 999.01
Model | 243286287 5 48657257.3 Prob > F = 0.0000
Residual | 1.2560e+09 25788 48705.6867 R-squared = 0.1623
----------+------------------------------ Adj R-squared = 0.1621
Total | 1.4993e+09 25793 58128.5052 Root MSE = 220.69
--------------------------------------------------------------------------
zarobki | Coef. Std. Err. t P>|t| [95% Conf. Interval]
----------+---------------------------------------------------------------
plec | 59.02909 2.776036 21.26 0.000 53.58791 64.47028
wyzsze | 242.0832 5.010558 48.31 0.000 232.2622 251.9042
srednie | 118.7394 3.565809 33.30 0.000 111.7503 125.7286
staz | -.9534177 .1201839 -7.93 0.000 -1.188985 -.7178505
dmiasto | 90.71356 3.233862 28.05 0.000 84.37501 97.05211
_cons | 103.4462 4.563119 22.67 0.000 94.50228 112.3902
--------------------------------------------------------------------------
. whitetst
White s general test statistic : 1457.719 Chi-sq(15) P-value = 6.e-302
77
Paweł Strawiński Notatki do ćwiczeń z ekonometrii
Jak widać wartość statystyki testowej jest duża, a p-value nieznacznie różni
się od zera, wobec tego odrzucamy hipotezę zerową o homoscedastyczności
składnika losowego. Można również przeprowadzić test sam test, ale oparty
o macierz informacyjnÄ…:
. imtest, white
White s test for Ho: homoskedasticity
against Ha: unrestricted heteroskedasticity
chi2(15) = 1457.72
Prob > chi2 = 0.0000
Cameron & Trivedi s decomposition of IM-test
---------------------------------------------------
Source | chi2 df p
---------------------+-----------------------------
Heteroskedasticity | 1457.72 15 0.0000
Skewness | 84.08 5 0.0000
Kurtosis | 6.75 1 0.0094
---------------------+-----------------------------
Total | 1548.54 21 0.0000
---------------------------------------------------
Na podstawie wyników testu stwierdzamy, że w modelu występuje heterosce-
dastyczność, reszty są skośne i ich kurtoza jest różni się od kurtozy rozkładu
normalnego.
Model 2. Dane losowe.
Source | SS df MS Number of obs = 100
----------+------------------------------ F( 2, 97) = 3017.22
Model | 119.91201 2 59.9560051 Prob > F = 0.0000
Residual | 1.92751219 97 .01987126 R-squared = 0.9842
----------+------------------------------ Adj R-squared = 0.9839
Total | 121.839522 99 1.23070225 Root MSE = .14097
--------------------------------------------------------------------------
x | Coef. Std. Err. t P>|t| [95% Conf. Interval]
----------+---------------------------------------------------------------
x1 | .4917573 .0065512 75.06 0.000 .478755 .5047597
x2 | .0170383 .0121051 1.41 0.162 -.0069869 .0410635
_cons | -.198657 .0288946 -6.88 0.000 -.2560048 -.1413091
--------------------------------------------------------------------------
. whitetst
White s general test statistic : 3.091832 Chi-sq( 5) P-value = .6858
78
Paweł Strawiński Notatki do ćwiczeń z ekonometrii
Jak widać wartość statystyki testowej jest mała, a p-value ma dużą wartość,
wobec tego brak jest podstaw do odrzucenia hipotezy zerowej o homosceda-
styczności składnika losowego.
Test Goldfelda-Quandta. W celu przeprowadzenia testu zakładamy, że
możemy podzielić próbę na dwie części według wartości zmiennej, którą
podejrzewamy o powodowanie heteroscedastyczności. W ten sposób, jeżeli
rzeczywiści zmienna powoduję heteroscedastyczność, otrzymamy podział na
podpróbę z mniejszą i większą wariancją. Test sprawdza, czy wariancja w
obu grupach jest taka sama, czy różni się. Procedura i statystyka testowa
jest analogiczna do testu Chow a.
2
H0 : Ãi = Ã2 "i
2
ÃL dla i=1...k
2
H1 : Ãi =
2
ÃH dla i=k+1...T
e 2e2/(n2 - K)
F [n2 - K, n1 - K] =
e 1e1/(n1 - K)
By przeprowadzić test estymujemy dwie regresje na podpróbkach. Przy praw-
dziwości hipotezy zerowej statystka testowa jako iloraz dwóch zmiennych lo-
sowych o rozkÅ‚adzie Ç2 ma rozkÅ‚ad F [n2 - K, n1 - K]
Niestety test Goldfelda-Quandta jest bardzo wrażliwy na założenie o nor-
malności rozkładu reszt. Jeśli składniki losowe nie mają rozkładu normalnego,
statystyka testowa nie ma rozkładu F, i daje może dawać mylne wyniki.
By zwiększyć moc testu możemy wyrzucić część obserwacji ze środka
próby. Ale im więcej obserwacji wyrzucimy, tym mniej stopni swobody będą
miały wyrażenia w liczniku i mianowniku statystyki testowej. Wobec tego
literatura ekonometryczna sugeruje by wyrzucać liczbę obserwacji leżącą po-
między 20 % liczebności próby a 1/3 próby.
Test ten, tak jak test Chowa, nie jest oprogramowany w pakiecie STATA.
Jednak możemy uzyskać wartość statystyki testowej estymując oba modele.
Test Breuscha-Pagana. Test Goldfelda-Quanta pozwala na uzależnienie
wariancji składnika losowego tylko od jednej zmiennej. Heteroscedastycz-
ność w modelu może być powodowana przez więcej niż jedną zmienną. Test
Breuscha-Pagana zakłada, że wariancja jest funkcją liniową zmiennych mo-
delu.
2
H0 : Ãi = Ã2 "i
2
H1 : Ãi = Ã2f(Ä…0 + Ä…1zi)
Test przeprowadzany jest w sposób następujący:
79
Paweł Strawiński Notatki do ćwiczeń z ekonometrii
1. Liczymy model regresji y = X² + , i zapamiÄ™tujemy wektor reszt ei
2. Podnosimy reszty do kwadratu e2
i
e2
i
3. Normalizujemy wektor reszt gi =
e e/n
4. Przeprowadzamy regresjÄ™ gi na zi
5. Zapamiętujemy ESS
1
6. Statystyka LM = ESS, przy prawdziwej H0 ma asymptotyczny roz-
2
kÅ‚ad Ç2 z liczbÄ… stopni swobody równÄ… iloÅ›ci zmiennych w macierzy z
(rzędowi macierzy z)
Regresja pomocnicza sprawdza siłę związku między kwadratem reszt a wek-
torem zmiennych Z. Jeżeli wariancja rzeczywiście zależy od zmiennych za-
wartych w macierzy Z to wyjaśniona suma kwadratów regresji pomocniczej
będzie duża i statystyka wpadnie do obszaru krytycznego wskazując na he-
teroscedastyczność. Natomiast niska wartość statystyki testowej może być
zarówno efektem braku heteroscedastyczności, jak i zle wyspecyfikowanej al-
ternatywy.
Przykłady: Model 1. Zarobki.
. hettest
Breusch-Pagan / Cook-Weisberg test for heteroskedasticity
Ho: Constant variance
Variables: fitted values of zarobki
chi2(1) = 2905.94
Prob > chi2 = 0.0000
. hettest plec wyzsze srednie staz dmiasto
. hettest, rhs
Breusch-Pagan / Cook-Weisberg test for heteroskedasticity
Ho: Constant variance
Variables: plec wyzsze srednie staz dmiasto
chi2(5) = 3904.92
Prob > chi2 = 0.0000
. hettest plec wyzsze srednie staz dmiasto staz2
Breusch-Pagan / Cook-Weisberg test for heteroskedasticity
80
Paweł Strawiński Notatki do ćwiczeń z ekonometrii
Ho: Constant variance
Variables: plec wyzsze srednie staz dmiasto staz2
chi2(6) = 4071.97
Prob > chi2 = 0.0000
Jak widać niezależnie od tego czy do testu jako zmienną objaśniającą wez-
miemy kolejne potęgi zmiennej zarobki, czy pełny zestaw regresorów, czy
zestaw regresorów uzupełniony o kwadrat zmiennej staż zawsze uzyskujemy
ten sam rezultat. Wysoka wartość statystyki testowej wskazuje na obecność
heteroscedastyczności.
Model 2. Dane losowe.
. hettest
Breusch-Pagan / Cook-Weisberg test for heteroskedasticity
Ho: Constant variance
Variables: fitted values of x
chi2(1) = 0.56
Prob > chi2 = 0.4561
Jak widać w przypadku tego modelu niska wartość statystyki testowej spra-
wia, że brak jest podstaw do odrzucenia hipotezy, że wariancja jest stała.
Test Szroetera Ten test, tak jak test Goldfelda-Quandta pozwala na uza-
leżnienie wariancji wyłącznie od jednej zmiennej objaśniającej. Jego dodat-
kowym założeniem jest to, że istnieje monotoniczna funkcja h(.) która jest
rosnąca lub malejąca i wiąże wielkość regresora z wielkością wariancji.
2
H0 : Ãi = Ã2 "i
2
H1 : Ãi = Ã2h(xi)
Statystyka testowa ma postać
n
h(xi)e2
i
i=1
H =
n
e2
i=1 i
Å»
Przy prawdziwej hipotezie zerowej powinna zachodzić równość H = h(xi),
czyli wartość statystyki testowej powinna być równa średniej wartości funkcji
przekształcającej obserwacje. Znormalizowana postać statystyki
6n
Q = H
n2 - 1
81
Paweł Strawiński Notatki do ćwiczeń z ekonometrii
ma w przybliżeniu rozkład normalny N(0, 1).
Test Szroetera zakłada, że zmienna x jest ciągła lub quasi-ciągła. Dla
zmiennych dyskretnych, a w szczególności dla zmiennych 0-1 (dummy varia-
bles) może dawać nieprawidłowe wyniki, ponieważ każda funkcja która nie
jest funkcją stałą, będzie spełniać warunek monotoniczności dla zmiennej
przyjmującej wyłącznie dwie wartości. Wobec tego moc testu będzie mała.
Przykłady: Model 1. Zarobki.
. szroeter plec wyzsze srednie staz dmiasto
Szroeter s test for homoskedasticity
Ho: variance constant
Ha: variance monotonic in variable
---------------------------------------
Variable | chi2 df p
-------------+-------------------------
plec | 1286.81 1 0.0000 #
wyzsze | 1559.06 1 0.0000 #
srednie | 4.50 1 0.0340 #
staz | 17.86 1 0.0000 #
dmiasto | 731.08 1 0.0000 #
---------------------------------------
# unadjusted p-values
Jak widać hipoteza zerowa testu, czyli stałość wariancji, jest odrzucana dla
każdej ze zmiennych. Przy czym tak naprawdę interesuje nas jedynie zmienna
staż, bowiem wyłącznie ta zmienna jest ciągła. Dla pozostałych zmiennych
nie są spełnione założenia testu. Na podstawie rezultatów testu widzimy że
wariancja jest monotonicznÄ… funkcjÄ… zmiennych modelu.
Model 2. Dane losowe.
. szroeter x1 x2
Szroeter s test for homoskedasticity
Ho: variance constant
Ha: variance monotonic in variable
---------------------------------------
Variable | chi2 df p
-------------+-------------------------
x1 | 0.68 1 0.4103 #
82
Paweł Strawiński Notatki do ćwiczeń z ekonometrii
x2 | 0.96 1 0.3279 #
---------------------------------------
# unadjusted p-values
Podobnie jak przy poprzednich testach przeprowadzanych dla tego modelu,
nie mamy podstaw do odrzucenia hipotezy o homoscedastyczności składnika
losowego.
Który test wybrać?
W praktyce wybór odpowiedniego testu wykrywającego obecność hete-
roscedastyczności jest zdeterminowany przez wiedzą, pochodzącą najczęściej
spoza próby, na temat jej możliwych form funkcyjnych. Jeżeli znamy zmien-
ne odpowiedzialne za heteroscedastycznośc to wtedy powinniśmy użyć jeden
ze specyficznych testów, ponieważ one z większym prawdopodobieństwem
odrzucają hipotezę zerową o homoscedastyczności. Ale musimy być ostrożni
dokonujÄ…c wyboru testu, bowiem w przypadku, gdy prawdziwa heterosceda-
styczność ma inną formę funkcyjną wybrany przez nas test może nie wykryć
jej obecności. Najbardziej ogólny test, test White a, ma ograniczoną moc.
Czasami proste wykonanie wykresu reszty i jednej lub kilku zmiennych mo-
że nam pomóc. Jeżeli zmienną odpowiedzialną za heteroscedastyczność jest
zmienna dyskretna to najbardziej jest prawdopodobne że tą zależność wy-
kryje test Goldfelda-Quandta. Jeżeli heteroscedastycznośc jest funkcją linio-
wą zmiennych, to tą zależność największą szansę ma wykryć test Breucha-
Pagana. Natomiast, jeżeli podejrzewamy że heteroscedastyczność rośnie lub
maleje wraz z wartościami jednej ze zmiennych ciągłych to powinniśmy za-
stosować test Szroetera.
Przykład empiryczny1 Przeanalizujemy model popytu na pracę zgłasza-
nego przez belgijskie firmy. Próba zawiera dane z 570 firm z roku 1996. Do-
stępne są następujące zmienne:
" labor zatrudnienie
" wage suma pensji podzielona przez liczbę pracowników (w milionach
Bef)
" output wartość dodana produkcji (w milionach Bef)
" capital wartość majątku trwałego (w milionach Bef)
1
Na podstawie Verbbek(2000)
83
Paweł Strawiński Notatki do ćwiczeń z ekonometrii
Możemy zapisać ogólną postać funkcji popytu na pracę jako
L = f(wage, output, capital)
. reg labor wage output capital
Source | SS df MS Number of obs = 570
-----------+------------------------------ F( 3, 566) = 2701.56
Model | 198887382 3 66295793.9 Prob > F = 0.0000
Residual | 13889543.2 566 24539.829 R-squared = 0.9347
-----------+------------------------------ Adj R-squared = 0.9344
Total | 212776925 569 373948.902 Root MSE = 156.65
--------------------------------------------------------------------------
labor | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-----------+--------------------------------------------------------------
wage | -162.7665 12.26131 -13.27 0.000 -186.8497 -138.6833
output | .380672 .0088206 43.16 0.000 .3633468 .3979972
capital | -.1132496 .0066786 -16.96 0.000 -.1263675 -.1001317
_cons | 281.8517 19.46326 14.48 0.000 243.6226 320.0807
--------------------------------------------------------------------------
Współczynniki wyestymowanego modelu są zgodne z teorią ekonomiczną.
Wyższe pensje powodują niższe zatrudnienie (ceteris paribus), wyższa pro-
dukcja oznacza wyższe zatrudnienie. Widać też słaby efekt substytucji pracy
kapitałem.
Jednak w tego typu modelach (modele mikroekonomiczne) bardzo czÄ™-
sto występuje heteroscedastyczność. Jest to związane z tym, że w tej samej
próbie zarówno mamy małe firmy zatrudniające do kilku osób działające na
rynku lokalnym, jak i duże koncerny zatrudniające kilkadziesiąt tysięcy pra-
cowników.
Przed przystąpieniem do testowania przeanalizujmy zależność wielkości
reszt z regresji od wielkości zmiennych i wartości teoretycznych y uzyskanych
z modelu.
Analiza graficzna reszt sugeruję, że wielkość składnika losowego jest uza-
leżniona od zmiennej wage.
Występowanie heteroscedastyczności potwierdza test Breuch-Pagan a.
Breusch-Pagan / Cook-Weisberg test for heteroskedasticity
Ho: Constant variance
Variables: fitted values of labor
chi2(1) = 3020.42
Prob > chi2 = 0.0000
Pierwszym krokiem w eliminowaniu heteroscedastyczności z modelu jest zlo-
garytmowanie wszystkich zmiennych. Przekształcenie danych przez funkcję
84
Paweł Strawiński Notatki do ćwiczeń z ekonometrii
-2000 -1000 0 1000 2000 -2000 -1000 0 1000 2000
Residuals Residuals
-2000 -1000 0 1000 2000 0 5000 10000
Residuals Fitted values
yródło: Obliczenia własne.
logarytmicznÄ… zmniejsza wariacjÄ™. Po zlogarytmowaniu dostaniemy model
log-liniowy.
. reg lnlabor lnwage lnoutput lncapital
Source | SS df MS Number of obs = 569
-----------+------------------------------ F( 3, 565) = 1011.02
Model | 656.747032 3 218.915677 Prob > F = 0.0000
Residual | 122.338815 565 .216528876 R-squared = 0.8430
-----------+------------------------------ Adj R-squared = 0.8421
Total | 779.085847 568 1.37163001 Root MSE = .46533
--------------------------------------------------------------------------
lnlabor | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-----------+--------------------------------------------------------------
lnwage | -.9277642 .0714046 -12.99 0.000 -1.068015 -.7875132
lnoutput | .9900474 .0264103 37.49 0.000 .938173 1.041922
lncapital | -.0036975 .0187697 -0.20 0.844 -.0405644 .0331695
_cons | -.4480909 .0932397 -4.81 0.000 -.6312296 -.2649522
--------------------------------------------------------------------------
Przeprowadzamy ponownie test sprawdzający czy składnik losowy jest ho-
moscedastyczny.
85
wage
output
0
2
4
6
8
0
10000
20000
30000
40000
50000
capital
Residuals
0
20000
40000
60000
80000
-2000
-1000
0
1000
2000
Paweł Strawiński Notatki do ćwiczeń z ekonometrii
. hettest
Breusch-Pagan / Cook-Weisberg test for heteroskedasticity
Ho: Constant variance
Variables: fitted values of lnlabor
chi2(1) = 19.49
Prob > chi2 = 0.0000
Ponieważ nadal heteroscedstycznośc stanowi problem powinniśmy użyć es-
tymatorów White a. Są one odporne na heteroscedastyczność i dają lepsze
estymatory wariancji składnika losowego i błędów standardowych estymato-
rów.
. reg lnlabor lnwage lnoutput lncapital, robust
Regression with robust standard errors Number of obs = 569
F( 3, 565) = 544.73
Prob > F = 0.0000
R-squared = 0.8430
Root MSE = .46533
--------------------------------------------------------------------------
| Robust
lnlabor | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-----------+--------------------------------------------------------------
lnwage | -.9277642 .0866604 -10.71 0.000 -1.09798 -.7575483
lnoutput | .9900474 .0467902 21.16 0.000 .8981434 1.081951
lncapital | -.0036975 .037877 -0.10 0.922 -.0780944 .0706995
_cons | -.4480909 .1332882 -3.36 0.001 -.7098918 -.18629
--------------------------------------------------------------------------
Wyraznie widać, że rzeczywiste błędy standardowe estymatorów są większe
od uzyskanych standardowÄ… procedurÄ….
Oczywiście, zamiast używać estymatorów odpornych na heteroscedastycz-
ność możemy za pomocą testu White a poszukać zmiennych które ją powodu-
jÄ…. Przyjmijmy, że wariancja µi zależy od zmiennych lnwage, lnoutput, oraz
lncapital. Aby obliczyć wartość statystyki testowej generujemy wektor reszt
.predict e, resid
a następnie obliczamy ich kwadraty
gen e2=e^2
Przeprowadzając regresję pomocniczą kwadratów reszt na zbiór zmiennych
od których chcemy uzależnić wariację składnika losowego otrzymujemy:
. reg e2 lnoutput lncapital lnwage
86
Paweł Strawiński Notatki do ćwiczeń z ekonometrii
Source | SS df MS Number of obs = 569
-----------+------------------------------ F( 3, 565) = 29.98
Model | 1.6898e+12 3 5.6327e+11 Prob > F = 0.0000
Residual | 1.0615e+13 565 1.8788e+10 R-squared = 0.1373
-----------+------------------------------ Adj R-squared = 0.1327
Total | 1.2305e+13 568 2.1664e+10 Root MSE = 1.4e+05
--------------------------------------------------------------------------
e2 | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-----------+--------------------------------------------------------------
lnoutput | 41917.91 7779.576 5.39 0.000 26637.49 57198.33
lncapital | -359.6716 5528.915 -0.07 0.948 -11219.41 10500.07
lnwage | 33726.26 21033.37 1.60 0.109 -7586.883 75039.4
_cons | -212582.4 27465.23 -7.74 0.000 -266528.8 -158636
--------------------------------------------------------------------------
Zmienna lnoutput wydaje się być istotna w wyjaśnianiu zróżnicowania kwa-
dratów reszt. Wysoka wartość statystyki F modelu, również sugeruje obec-
ność heteroscedastycznoci w składniku losowym, ponieważ zmienne są łącz-
nie istotne, czyli wyjaśniają kwadrat błędu. Postępując dalej w sposób ana-
logiczny, możemy dokładnie znalezć funkcję, która jest odpowiedzialna za
heteroscedastyczność.
Literatura
[1] William H. Greene (2003) Econometric Analysis, 5th edition.
[2] Jerzy Mycielski (2000) Notatki do ćwiczeń z ekonometrii, WNE.
[3] Jerzy Szroeter (1978)  A Class of Parametric Test for Heteroscedasticity
in Linear Econometric Models , Econometrica 46, vol. 6.
[4] Marno Verbbek (2000) A Guide to Modern Econometrics, John Wiley &
Sons.
[5] Halber White (1980)  A Heteroscedasticity-Consistent Covariance Ma-
trix Extimator and a Direct Test for Heteroscedasticity , Econometrica
48, vol. 4, str 817-838.
87


Wyszukiwarka

Podobne podstrony:
heterocycle
nickel?talysts heterogeneous eros rn011
Spatial Visualization for Heterogeneous Cinema Venue Data
ZwiÄ…zki heterocykliczne i kwasy nukleinowe
Heterocykliczne ZwiÄ…zki Aromatyczne
22 Heterocykliczne zwiÄ…zki aromatyczne
Heterogennosc lipidu A bakteri G( )
03 Deontonomizm heteronomiczny T Hobbesa
Russula Heterophyllae
ANOMALIE HETEROCHROMOSOMÓW
Heteronuclear Correlation Spectroscopy
hodowla cwiczenie4 heterozja
heteroskedastyczność
CzÄ…steczki heterojÄ…drowe

więcej podobnych podstron