Badanie istotności parametrów regresji


Badanie istotności parametrów regresji

Oceny standardowych błędów estymatorów parametrów regresji.

W procesie sprawdzania istotności poszczególnych parametrów regresji ważna rolę spełniają tzw. oceny standardowych błędów estymatorów parametrów regresji 0x01 graphic
. Będziemy je oznaczać odpowiednio 0x01 graphic
.

W przypadku, gdy wykorzystujemy zapis macierzowy oblicza się je ze wzorów:

0x01 graphic
,

gdzie

Często wyniki obliczeń zapisuje się w postaci

0x01 graphic
.

Jeżeli oceny 0x01 graphic
"małe" w porównaniu z wartościami estymatorów 0x01 graphic
, to można się spodziewać, że model regresyjny jest zadawalający. Dokładniej co oznacza słowo "małe", sprecyzujemy w dalszej części tego wykładu, omawiając przedziały ufności i testy istotności dla parametrów regresji.

Przykład (Inflacja) (kontynuacja przykładu 6.1). W szczególnym przypadku 0x01 graphic
oceny standardowych błędów estymatorów parametrów regresji wyznacza się ze wzorów:

0x01 graphic
,

0x01 graphic
.

W rozważanym przykładzie mamy

0x01 graphic
, 0x01 graphic
, 0x01 graphic
i 0x01 graphic
.

Zatem

0x01 graphic
,

0x01 graphic
.

Wyniki obliczeń zapisujemy w postaci

0x01 graphic
.

Przykład (Reklama).(kontynuacja przykładu 6.2).

Z wydruku

Współczynniki

Błąd standardowy

Przecięcie

47,16494227

2,470414433

x1

1,599040336

0,280963057

x2

1,148747938

0,30524885

odczytujemy

0x01 graphic
,

0x01 graphic
,

0x01 graphic
.

Oszacowany model regresji zapisujemy w postaci

0x01 graphic
.

Przedziały ufności dla parametrów regresji.

Przedziałem ufności dla parametru regresji 0x01 graphic
, gdzie 0x01 graphic
, nazywamy przedział liczbowy, o którym przypuszczamy, że mieści się w nim nieznany parametr 0x01 graphic
. Z przedziałem tym związana jest miara ufności (pewności) równa prawdopodobieństwu, że przedział rzeczywiście zawiera interesujący nas parametr, zwana poziomem ufności. Zwykle przyjmuje się poziom ufności 0x01 graphic
lub 0x01 graphic
. Dla ustalonego poziomu ufności 0x01 graphic
wyznaczony przedział nazywamy 0x01 graphic
przedziałem ufności.

0x01 graphic
przedział ufności dla parametru regresji 0x01 graphic
, wyznaczamy korzystając ze wzoru:

0x01 graphic
,

gdzie

Przykład wyznaczania wartości krytycznej.

Przyjmijmy, że konstruujemy 90 % przedział ufności, gdy do dyspozycji mamy 0x01 graphic
obserwacji, a związek regresyjny ma 0x01 graphic
zmienne objaśniające. Zatem

0x01 graphic

oraz liczba stopni swobody wynosi

0x01 graphic
.

Korzystamy z tablic

Liczba stopni swobody

0x01 graphic

0x01 graphic

...

0x01 graphic

1

0x01 graphic

2

.

13

0x01 graphic

1,771

.

120

0x01 graphic

i odczytujemy

0x01 graphic
.

Przykład (Inflacja) (kontynuacja). Podamy 99 % przedział ufności dla parametru 0x01 graphic
i 95 % przedział ufności dla parametru 0x01 graphic
.

  1. 99 % przedział ufności dla parametru 0x01 graphic

Dla 0x01 graphic
i liczby stopni swobody 0x01 graphic
, z tablic odczytujemy 0x01 graphic
. Poprzednio obliczyliśmy 0x01 graphic
i 0x01 graphic
. Ostatecznie

0x01 graphic
,

i szukany przedział ufności jest postaci

0x01 graphic

Podsumowując, przedział 0x01 graphic
zawiera prawdziwą wartość parametru 0x01 graphic
z prawdopodobieństwem 0,99.

  1. 95 % przedział ufności dla parametru 0x01 graphic

Dla 0x01 graphic
i liczby stopni swobody 0x01 graphic
, z tablic odczytujemy 0x01 graphic
. Poprzednio obliczyliśmy 0x01 graphic
i 0x01 graphic
. Ostatecznie

0x01 graphic
,

i szukany przedział ufności jest postaci

0x01 graphic

Podsumowując, przedział 0x01 graphic
zawiera prawdziwą wartość parametru 0x01 graphic
z prawdopodobieństwem 0,95.

Przykład (Reklama).(kontynuacja).

Z wydruku

Dolne 95%

Górne 95%

Dolne 99,0%

Górne 99,0%

Przecięcie

41,32334457

53,00653997

38,51977401

55,81011053

x1

0,934668753

2,263411919

0,61581547

2,582265202

x2

0,426949621

1,870546256

0,080535401

2,216960475

odczytujemy np.

  1. 99 % przedział ufności dla parametru 0x01 graphic

0x01 graphic
.

Przedział 0x01 graphic
zawiera prawdziwą wartość parametru 0x01 graphic
z prawdopodobieństwem 0,99.

  1. 95 % przedział ufności dla parametru 0x01 graphic

0x01 graphic
.

Przedział 0x01 graphic
zawiera prawdziwą wartość parametru 0x01 graphic
z prawdopodobieństwem 0,95.

Uwaga. Gdyby estymatory 0x01 graphic
rozpatrywać oddzielnie, to łącznym obszarem ufności dla obu parametrów byłby prostokąt o bokach będących przydziałami ufności dla pojedynczych parametrów. W rzeczywistości obszary te są bardziej skomplikowane. Na przykład, przy założeniach przyjętych w niniejszych wykładach są to elipsy. Nie każdy punkt prostokąta pojawia się w łącznych obszarach ufności.

7.3 Testy istotności dla parametrów regresji.

Zainteresujemy się obecnie oceną istotności poszczególnych parametrów regresji 0x01 graphic
. Chodzi tu o sprawdzenie, czy zmiany zmiennej objaśniającej 0x01 graphic
w jakimś stopniu wyjaśniają zmienność zmiennej objaśnianej y. Jeżeli tak, to zmienną 0x01 graphic
włączamy do równania.

Precyzyjniej, będziemy testować hipotezy o poszczególnych parametrach (współczynnikach kierunkowych) równania regresji postaci:

  1. 0x01 graphic

  2. 0x01 graphic

0x01 graphic

  1. 0x01 graphic

0x01 graphic

  1. 0x01 graphic

Podamy teraz algorytm postępowania w przypadku testowania hipotezy istotności dowolnego z parametrów regresji. Niech będzie to np. parametr 0x01 graphic
. Przyjmiemy także trzy warianty hipotezy alternatywnej 0x01 graphic
. Testujemy więc trzy pary hipotez:

0x01 graphic

0x01 graphic

Test opieramy o sprawdzian

0x01 graphic
.

Obszar krytyczny testu zależy od przyjętej hipotezy alternatywnej:

  1. 0x01 graphic

0x01 graphic
,

  1. 0x01 graphic

0x01 graphic
,

  1. 0x01 graphic

0x01 graphic
,

gdzie

Zatem, jeżeli wartość sprawdzianu t należy do obszaru krytycznego K, to odrzucamy hipotezę zerową 0x01 graphic
i przyjmujemy hipotezę alternatywną 0x01 graphic
. Oznacza to , że parametr 0x01 graphic
jest istotny (na poziomie istotności 0x01 graphic
) i należy włączyć go do równania regresji. W przypadku, gdy jeżeli wartość sprawdzianu t nie należy do obszaru krytycznego K, to nie ma podstaw do odrzucenia hipotezy zerowej 0x01 graphic
. Mówimy wtedy, ze parametr 0x01 graphic
jest nieistotny.

Przykład (Inflacja) (kontynuacja). Najpierw sprawdzimy na poziomie istotności 0x01 graphic
istotność parametru 0x01 graphic
. Hipotezy stawiamy w postaci:

0x01 graphic

Zbiór krytyczny jest postaci

0x01 graphic
.

Ponieważ

0x01 graphic
, 0x01 graphic
, 0x01 graphic
, 0x01 graphic
,

więc

0x01 graphic
,

Obliczamy wartość sprawdzianu testu

0x01 graphic
.

Należy ona do zbioru krytycznego

0x01 graphic
0x01 graphic
,

zatem przyjmujemy (na poziomie istotności 0x01 graphic
) hipotezę alternatywna: "parametr 0x01 graphic
jest istotny".

W przypadku parametru 0x01 graphic
hipotezę alternatywna, dla przykładu, postawimy inaczej:

0x01 graphic

Przyjmujemy poziom istotności 0x01 graphic
. W tym przypadku zbiór krytyczny jest postaci

0x01 graphic
.

Ponieważ

0x01 graphic
, 0x01 graphic
, 0x01 graphic
, 0x01 graphic
,

więc

0x01 graphic
.

Obliczamy wartość sprawdzianu testu

0x01 graphic
.

Należy ona do zbioru krytycznego

0x01 graphic
0x01 graphic
,

zatem przyjmujemy (na poziomie istotności 0x01 graphic
) hipotezę alternatywna: "parametr 0x01 graphic
jest istotny, przy czym jest dodatni".

Przykład Na podstawie 0x01 graphic
obserwacji dopasowano do danych model regresji liniowej o 0x01 graphic
zmiennych objaśniających wyniki analizy regresji przedstawione są w poniższej tabeli.

Zmienna objaśniająca

Estymatory parametrów

Oceny błędów standardowych

Wartość

sprawdzianu

Wnioski o parametrze

Stała

32,9

3,13

10,511

istotny

0x01 graphic

0,75

0,27

2,778

istotny

0x01 graphic

13,78

6,93

1,988

nieistotny

0x01 graphic

-10,12

0,67

-15.10

istotny

0x01 graphic

-3,12

2,62

-1,191

nieistotny

Sprawdzamy istotność parametrów na poziomie istotności 0x01 graphic
, przy czym hipoteza alternatywna jest dwustronna (parametr jest różny od zera). Zbiór krytyczny jest postaci

0x01 graphic
,

czyli

0x01 graphic
.

Przykład (Reklama).(kontynuacja).

Z wydruku

Współczynniki

Błąd standardowy

t Stat

Wartość-p

Przecięcie

47,16494227

2,470414433

19,09191496

2,69229E-07

x1

1,599040336

0,280963057

5,691283238

0,00074201

x2

1,148747938

0,30524885

3,763316185

0,007044246

na podstawie Wartości - p zauważamy, że wszystkie parametry są istotne dla zwykle przyjmowanych poziomów istotności.

Skorzystaliśmy tu z reguły:

Jeżeli Wartość - p dla danego parametru jest mniejsza od przyjętego poziomu istotności, np. 0x01 graphic
, to ten parametr jest istotny.

1



Wyszukiwarka