Wykład 4. Wyznaczanie błędów standardowych i testowanie hipotez o istotności parametrów;
W modelu ekonometrycznym wyznacza się dwa rodzaje wariancji , a następnie odchyleń standardowych (zwanych błędami standardowymi lub błędami). I tak wyznacza się błąd dla reszt modelu oraz błędy dla poszczególnych parametrów strukturalnych:
- wyznaczanie odchylenia standardowego reszt modelu (błędu dla modelu) odbywa się według wzoru:
; gdzie
n - liczba wierszy ; m- liczba zmiennych niezależnych
- wyznaczanie błędów standardowych dla parametrów strukturalnych odbywa się według wzoru
gdzie
są to elementy lezące na głównej przekątnej macierzy
- macierz wariancji i kowariancji parametrów strukturalnych wyznacza się ją ze wzoru:
=
Testowanie parametru c o istotności . Stawiamy dwie hipotezy Ho oraz H1
Ho: c=0 (parametr c jest nieistotny)
H1: c≠0 (parametr c jest istotny)
Hipotezę Ho odrzucamy na korzyść hipotezy H1 (czyli parametr jest istotny)
jeśli
(jeśli
należy do zbioru Krytycznego),
Inaczej mówiąc parametr c jest istotny wtedy gdy
gdzie:
-
( t empiryczne) wyznacza się na podstawie wzoru (zwanego statystyką)
- K zbiór krytyczny wyznaczamy na podstawie
Zbiór krytyczny K składa się z dwóch przedziałów na osi liczbowej:
oraz
. Wartość
należy do jednego z przedziałów (
) wtedy gdy
-
(t alfa) , wartość
odczytujemy z tablic (rozkładu danej statystyki) dla z góry zadanego poziomu istotności
(np.
).
Pojęcia:
- poziom istotności (liczba z góry zadana i określająca prawdopodobieństwo popełnienia błędu I rodzaju. To prawdopodobieństwo jest oznaczone symbolem
(i ma być małe najwyżej 0,1, czyli
).
W modelach ekonometrycznych testuje się różne parametry na tzw. istotność. Najczęściej na istotność bada się: a) współczynnik korelacji
b) współczynnik determinacji, c) poszczególne parametry strukturalne stojące przy zmiennych niezależnych w modelu. Przy tym badaniu wszystkie hipotezy stawia się tak samo, ale różnie wyznacza się parametry
oraz
. I tak:
1) Dla istotności współczynnika korelacji jest
→ odczytuje z tablic rozkładu studenta dla n-2 stopni swobody oraz poziomu istotności
2) Dla Współczynnika determinacji
=
= F*odczytuje z tablic F-Fischera Snedecora na przecięciu wiersza
i kolumny
; gdzie:
oraz
stopni swobody dla poziomu istotności
=0,05
n= liczba obserwacji , m=liczba zmiennych (cech) niezależnych w modelu
3) Dla badania istotności parametrów
w modelu regresyjnym liniowym s. 137
→z tablic rozkładu studenta dla n-m-1 stopni swobody oraz poziomu istotności
(lub z rozkładu normalnego)
- odczytać liczbę z tablicy 4 na przecięciu wiersza i kolumny: wiersz → lss = n-m-1; kolumna → P=
Przykłady
Przykład 6.1 na s. 137 (dla punktu 2 i 3)
W celu zbadania koniunktury giełdowej mierzonej wielkością indeksu WIG
oszacowano model na podstawie 20 danych miesięcznych i czterech zmiennych niezależnych (
- przyrost stopy WIBOR;
- miesięczna stopa inflacji;
- łączna wartość mowych emisji w mln zł;
- sałdo obrotó handlu zagranicznego ( w mln zł) i otrzymano:
oraz błędy standardowe dla poszczególnych parametrów strukturalnych (na podstawie D2 (a) wariancji i kowariancji ocen parametrów zob. s. 67):
;
;
;
Ponadto współczynnik determinacji, czyli
Zbadać istotność parametrów w tym modelu na poziomie istotności
Badanie istotności współczynnika determinacji
zatem
= F* z tablic F-Fischera Snedecora z
oraz
, czyli
;
Zatem
= F*= zob. liczba z tablicy 2 oraz
(wiersz) i
(kolumna) = 3,06
Sprawdzamy, czy
; tak, ponieważ
zatem parametr
jest istotny, co oznacza, żę przynajmniej jeden z parametrów
jest istotny.
Sprawdzamy istotność parametrów
, dla każdego parametru.
Wyznaczamy dla każdego parametru
(statystykę) ze wzoru:
. Zatem mamy :
;
;
- odczytać liczbę z tablicy 4 : dla parametrów lss = n-m-1=20-4-1=15 P=
=0,05,
Zatem
Sprawdzamy kolejno istotność, tzn czy
Zatem parametr
jest istotny ponieważ
, parametr
jest nieistotny (ponieważ
nie jest większy od 2,131); parametr
jest istotny, (ponieważ
) natomiast parametr
jest nieistotny . Jeśli parametry są nieistotne, to oznacza, że zmienne objaśnia-jące (niezależne) są nieistotne nie mają one żadnego wpływu i należy je usunąć z modelu
Przykład: Na podstawie powyższych danych
y |
|
x |
z |
w |
|
2 |
|
8 |
4 |
10 |
1 |
0 |
|
11 |
6 |
20 |
1 |
1 |
|
10 |
5 |
30 |
1 |
2 |
|
9 |
2 |
36 |
1 |
2 |
|
8 |
8 |
35 |
1 |
3 |
|
5 |
9 |
40 |
1 |
Skonstruowano następujący model
Oraz obliczono: wariancję reszt
;
=0,98318
|
0,069918 |
0,023989 |
0,003381 |
-0,82661 |
|
0,023989 |
0,042719 |
-0,00166 |
-0,39859 |
|
0,003381 |
-0,00166 |
0,001939 |
-0,07458 |
|
-0,82661 |
-0,39859 |
-0,07458 |
11,57709 |
Sprawdzić czy współczynnik
jest istotny oraz czy wszystkie zmienne objaśniające są istotne na poziomie istotności
(Sprawdzić czy model jest dobry oraz czy wszystkie zmienne należy zastosować w modelu, czyli sprawdzamy wszystkie parametry strukturalne stojące przy zmiennych niezależnych czy są istotne).).
Sprawdzanie
- sprawdzenie czy model jest dobry
=3;
=6-3-1=2;
= F*= 19,16;
Ponieważ
:
, to
jest istotny. Ponieważ współczynnik determinacji
jest istotny to oznacza, że skonstruowany model jest dobry. W dostateczny sposób objaśnia zmienną zależna Y.
Sprawdzanie czy poszczególne zmienne objaśniające (niezależne) są dobre
Należy skonstruować macierz
|
|
macierz |
|
|
|
|
|
|
|
|
0,006221 |
0,002134 |
0,000301 |
-0,07354 |
|
0,006221 |
0,078871 |
-0,52791 |
-6,69333 |
|
0,002134 |
0,003801 |
-0,00015 |
-0,03546 |
|
0,003801 |
0,06165 |
-0,14239 |
-2,30963 |
|
0,000301 |
-0,00015 |
0,000173 |
-0,00664 |
|
0,000173 |
0,013135 |
0,012996 |
0,989451 |
|
-0,07354 |
-0,03546 |
-0,00664 |
1,030029 |
|
1,030029 |
1,014903 |
6,590398 |
6,493622 |
|
|
|
|
|
|
|
|
|
|
- odczyt z tablicy Studenta dla lss=n-2 = 6-3-1=2 oraz
; zatem
=4,303
Sprawdzając kolejno
wynika, że tylko
, co oznacza, że tylko parametr (-0,52791) stojący prze zmiennej X jest istotny, a pozostałe parametry strukturalne są nieistotne, a to oznacza, że zmienne niezależne (Z, W) należy z modelu usunąć i zbudować model tylko ze zmienną niezależną X.
Przykład badania istotności dla współczynnika korelacji s. 34
Sprawdzić czy współczynnik korelacji między zmienną X1 oraz X5 wynoszący 0,1 wyznaczony dla 28 elementów jest istotny na poziomie istotności
; Zatem
- odczytać liczbę z tablicy 4 : dla parametrów lss = n-2=28-2=26 P=
=0,05,
Zatem
Ponieważ
nie jest większe od
(0,512 nie jest większe od 2,056 zatem współczynniki korelacji r(X1, X5) jest nieistotny - co oznacza brak zależności.
Przykład zad. na testowanie istotności współczynnika korelacji s. 35 zad. 2.8
W firmie Progresja produkcja P i koszty całkowite K w ciągu 6 miesięcy przedstawiały się następująco:
P |
101 |
100 |
98 |
100 |
102 |
101 |
K |
152 |
151 |
147 |
148 |
155 |
147 |
Na podstawie powyższych danych wyznaczono dwie funkcje regresyjne:
oraz
.
Sprawdzić, czy współczynnik korelacji istotnie różni się od zera na poziomie istotności
=0,864
Wyznaczamy
(t empiryczne) na podstawie odpowiedniego wzoru) oraz
(t alfa), którego wartośc odczytujemy z tablic, a następnie te dwie wartości porównujemy
= 3,44
- odczytać liczbę z tablicy 4 - rozkład studenta: dla parametrów lss = n-2=6-2=4
=0,02,
Zatem
= 3,747
Aby parametr był istotny to:
. Ponieważ
nie jest większe od 3,747, zatem współczynnik korelacji jest nieistotny.
Sprawdzanie istotności parametru za pomocą wartości zwanej „pi value”.
Wartość „pi value” - jest to prawdopodobieństwo, które mówi jak duży błąd popełnimy jeśli przyjmiemy, że parametr jest istotny (odrzucimy hipotezę zerową). Jeśli wartość pi value jest większa od z góry ustalonego przez nas poziomu istotności α (błędu I rodzaju) , to parametr jest nieistotny. Wartośc „pi value” można znaleźć w wynikach opcji Regresja. Dla współczynnika determinacji „pi value” odczytuje się pod nazwą „Istotność F”, natomiast dla poszczególnych parametrów strukturalnych „pi value” odczytuje się w kolumnie „Wartość-p”.
Przykład: Na podstawie powyższych danych
y |
|
x |
z |
w |
2 |
|
8 |
4 |
10 |
0 |
|
11 |
6 |
20 |
1 |
|
10 |
5 |
30 |
2 |
|
9 |
2 |
36 |
2 |
|
8 |
8 |
35 |
3 |
|
5 |
9 |
40 |
|
|
|
|
|
Skonstruowano następujący model
PODSUMOWANIE - WYJŚCIE |
|
|
|
|
|||
|
|
|
|
|
|
|
|
Statystyki regresji |
|
|
|
|
|
||
Wielokrotność R |
0,983176 |
|
|
|
|
|
|
R kwadrat |
0,966636 |
|
|
|
|
|
|
Dopasowany R kwadrat |
0,916589 |
|
|
|
|
|
|
Błąd standardowy |
0,298281 |
|
|
|
|
|
|
Obserwacje |
6 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
ANALIZA WARIANCJI |
|
|
|
|
|||
|
df |
SS |
MS |
F |
Istotność F |
|
|
Regresja |
3 |
5,155391 |
1,718464 |
19,31482 |
0,049627 |
|
|
Resztkowy |
2 |
0,177943 |
0,088971 |
|
|
|
|
Razem |
5 |
5,333333 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Współczynniki |
Błąd standardowy |
t Stat |
Wartość-p |
Dolne 95% |
Górne 95% |
|
Przecięcie |
6,590398 |
1,014903 |
6,493622 |
0,022904 |
2,223622 |
10,95717 |
|
Zmienna X 1 |
-0,52791 |
0,078871 |
-6,69336 |
0,0216 |
-0,86727 |
-0,18856 |
|
Zmienna X 2 |
-0,14239 |
0,06165 |
-2,30958 |
0,147179 |
-0,40765 |
0,122874 |
|
Zmienna X 3 |
0,012996 |
0,013135 |
0,989441 |
0,426735 |
-0,04352 |
0,069509 |
Na podstawie wyników z opcji Regresja wydać że współczynnik determinacji jest istotny dla poziomu istotności
, ale już dla poziomu istotności
nie jest istotny (jest nieistotny)
Natomiast parametry strukturalne dla
są wszystkie nieistotne za wyjątkiem parametru stojącego przy pierwszej zmiennej w modelu ponieważ dla tego parametru „ pi value” =0,0216 i wartość ta jest mniejsza od
. Zatem w tym modelu istotna jest tylko zmienna X , natomiast zmienne Z oraz W są nieistotne i należy je usunąć z modelu.
4