G całkowita konsumpcja benzyny w USA (w mld galonów)
Pop populacja (w mln), Y dochód per capita (w 100 $), Pg cena benzyny (w $),
Pnc średnia cena nowych samochodów (w 1000$), Puc średnia cena używanych samochodów (w 1000$),
Ppt ceny transportu publicznego (w 10$)
Gi = ²0 + ²1Popi + ²2Yi + ²3Pgi + ²4Pnci + ²5Puci + ²6Ppti + µi
p-value jest to prawdopodobieństwo popełnienia błędu przy odrzuceniu prawdziwej hipotezy zerowej.
Porównujemy je z poziomem istotności, na którym pracujemy (np. ą = 0,05 ). Poziom istotności rozumiemy jako
nasze maksymalne przyzwolenie na prawdopodobieństwo popełnienia błędu przy odrzuceniu prawdziwej
hipotezy zerowej. Jęśli więc p - value < ą , to odrzucamy prawdziwą H0 z mniejszym prawdopodobieństwem
niż maksymalne przez nas dopuszczane, więc H0 można odrzucić. Jeśli natomiast p - value > ą , to szansa, że
popełnimy błąd przy odrzuceniu H0 jest większa niż dopuszczana, więc nie ma podstaw do odrzucenia H0 .
Np. p-value podane w ostatniej kolumnie powyższego wydruku z pakietu ekonometrycznego Gretl dotyczy
testów istotności poszczególnych zmiennych w modelu. Dla zmiennej Ppt p-value wynosi 0,094, zaś hipotezy
testu istotnoÅ›ci dla tej zmiennej to (patrz równanie modelu nad wydrukiem): H0 : ²6 = 0 i H1 : ²6 `" 0 .
Przyjmując ą = 0,05 , mamy p - value = 0,094 > ą = 0,05, a więc prawdopodobieństwo, że popełnimy błąd przy
odrzuceniu hipotezy zerowej jest większe niż maksymalne przez nas dopuszczane. Nie odrzucamy więc H0 ,
czego wynikiem jest uznanie zmiennej Ppt za nieistotną (na poziomie istotności ą = 0,05 , czyli na poziomie
istotności 5%-wym). Aatwo zauważyć, że wybierając inny poziom istotności (np. ą = 0,1), może się zdarzyć, że
wynik analizy będzie inny. Teraz zachodzi p - value = 0,094 < ą = 0,1 , a więc szansa na popełnienie błędu przy
odrzuceniu H0 jest mniejsza niż maksymalnie dopuszczalna, odrzucamy ją więc i przyjmujemy hipotezę
alternatywną, co oznacza, że zmienna jest w modelu istotna (na poziomie istotności 10%-wym).
1
Gi = ²0 + ²1Yi + ²2Pgi + ²3Pnci + ²4Puci + ²5Ppti + µi
Gi = ²0 + ²1Yi + ²2Pgi + ²3Puci + ²4Ppti + µi
2
Gi = ²0 + ²1Yi + ²2Pgi + ²3Puci + µi
Teraz wszystkie zmienne objaśniające w analizowanym przez nas modelu są statystycznie istotne (i poszczególne
z nich są istotne i łącznie są one istotne). Jednak w procesie dochodzenia do tej postaci modelu, pominęliśmy z
modelu trzy zmiennej objaśniające. Czy mogliśmy to zrobić? Czy łącznie nie były one w stanie wyjaśnić choć
części zmienności zmiennej objaśnianej (konsumpcji benzyny)?
Aby odpowiedzieć sobie na to pytanie, przeanalizujmy przypadek teoretyczny:
Test na łączną istotność podzbioru regresorów / Test pominiętych zmiennych
Załóżmy, że mamy dwa konkurencyjne modele:
yi = ²1 + ²2x2i + ²3x3i +...+ ²k xki + µi = Xi² + µi (1)
yi = ²1 + ²2x2i + ²3x3i +...+ ²k xki +Ä…1z1i +Ä…2z2i +...+Ä…mzmi + µi = Xi² + ZiÄ… + µi (2)
Modele te są bardzo do siebie podobne, z tymże w modelu (1) na yi wpływa (k-1) zmiennych objaśniających
zawartych w macierzy X, zaś w modelu (2), na tę samą zmienną wpływają znowu zmienne z macierzy X, ale
również wpływa na nią m zmiennych z macierzy Z. Model (2) nazwiemy modelem bez ograniczeń/bez restrykcji
(modelem ogólnym), zaś model (1) modelem z ograniczeniami/restrykcjami (modelem szczególnym), jako, że
na parametry zmiennych z macierzy Z nałożyliśmy ograniczenia, że są one równe zero, więc zmiennych tych w
tym modelu nie ma, bo sÄ… nieistotne.
Jeśli chcielibyśmy szacować model (1), musimy przeprowadzić test na łączną istotność zmiennych zawartych w
macierzy Z (które są podzbiorem regresorów modelu (2)). Jeśli test nie pozwoli odrzucić hipotezy zerowej, którą
jest H0 :ą = 0 , to regresory z macierzy Z można pominąć, czyli poprawny jest model (1). Przyjęcie hipotezy
alternatywnej ( H1 :ą `" 0 ) wskazuje na poprawność modelu (2).
Rozróżnienie, który z modeli jest poprawny jest o tyle ważne, że gdy szacujemy model (1), a poprawny jest
model (2) (problem zmiennych pominiętych), to estymatory są obciążone. Gdy sytuacja jest odwrotna i
3
szacujemy model (2) gdy poprawny jest model (1) (problem zmiennych nieistotnych), to estymatory sÄ…
nieefektywne, ale pozostają nieobciążone. Oczywiście problem zmiennych pominiętych (obciążoność
estymatorów) niesie ze sobą dużo bardziej negatywne konsekwencje dla oszacowań parametrów modelu niż
problem zmiennych nieistotnych (estymatory mniej efektywne), jednakże obydwa przypadki są niepożądane w
czasie estymacji i powinniśmy się ich wystrzegać.
Test przeprowadzamy w następujący sposób:
- szacujemy model bez ograniczeń (2) i obliczamy jego współczynnik determinacji, nazywając go R2 .
2
- szacujemy model z ograniczeniami (1) i obliczamy jego współczynnik determinacji, nazywając go RR .
2
(R2 - RR ) / J
- wyznaczamy statystykę testową: F = ~ F(J,n - (k + m)) , gdzie J oznacza ilość
(1- R2) /(n - (k + m))
restrykcji nałożonych na model (1) (a więc ilość zmiennych z macierzy Z ilość zmiennych, które
chcemy pominąć), n jest ilością obserwacji, a (k+m) ilością zmiennych objaśniających modelu bez
ograniczeń (2). Znając rozkład statystyki testowej, możemy odczytać z tablic wartość krytyczną i jeśli
F > Fkr , to przyjmujemy hipotezę alternatywną o prawdziwości modelu (2), zaś gdy F < Fkr , to nie ma
podstaw do odrzucenia hipotezy zerowej, a więc przyjmujemy poprawność modelu (1). Wynik testu
często wygodniej jest odczytać z p-Value (często podawanego przez pakiety ekonometryczne), które
mówi nam o prawdopodobieństwie popełnienia błędu przy odrzuceniu prawdziwej hipotezy zerowej.
W naszym przypadku, test na możliwość pominięcia zmiennych Pop, Pnc i Ppt wyglądałby następująco:
2
R2 = 0,99042 , RR = 0,989368 , J = 3 , n = 36 , k + m = 7 . Obliczamy F :
(0,99042 - 0,989368) / 3
F = = 1,0615 . Odczytujemy z tablic F-Snedecora (o J=3 i (n-k-m)=29 stopniach
(1- 0,99042) /(36 - 7)
swobody) wartość krytyczną. Wynosi ona: Fkr = 2,93 . Ponieważ zachodzi F < Fkr , to ma podstaw do odrzucenia
hipotezy zerowej, parametry przy zmiennych Pop, Pnc i Ppt są równe zero, czyli zmienne te są łącznie nieistotne
i mogliśmy je z modelu pominąć.
Te sam test, przeprowadzony przez pakiet ekonometryczny Gretl, wygląda następująco:
Interpretując p-value, dochodzimy do tych samych wniosków.
4
Wyszukiwarka
Podobne podstrony:
cwicz6Ćwicz6MELAK instrukcje cwicz6cwicz6 7Cwicz6więcej podobnych podstron