58
3.7 Analiza regresji
gdzie b = (i>o,...,bp)T.
Dla takich estymatorów prawdziwa jest uogólniona wersja twierdzenia 3.44.
Twierdzenie 3.49 (Twierdzenie Gaussa-Markowa). Przyjmijmy założenie: (N2’) Niech e będzie wektorem losowym o wartości oczekiwanej zero (czyli Eć =0) i macierzy kowariancji danej macierzą a2II (czyli VARc = o2I).
Przy założeniu (N2’j estymatory MNK dane wzorem (3.178) są nieobcią-żone, a ponadto mają minimalną wariancję spośród wszystkich nieobciążonych estymatorów liniowych dla b (tzn. estymatorów postaci cTY dla pewnego wektora stałych c, czyli takiego, który możemy przedstawić za pomocą pewnej funkcji liniowej).
Wykorzystując notację macierzową możemy w prosty sposób uogólnić inne wyniki uzyskane dla modelu regresji z pojedynczą zmienną niezależną x. Predykcję zapisać możemy w postaci
Y = Xb (3.179)
dla pewnej ustalonej macierzy obserwacji X. Prawdziwą jest podstawowa tożsamość analizy wariancji
SST = SSR + SSE , (3.180)
gdzie odpowiednio
SST = (Y - Yl)T (Y - Yl) r, SSR = (y - Yl) T (y - Yl) ,
l SSE = (Y- t)T (y-£) , (3.181)
a 1 jest wektorem złożonym z samych jedynek o n elementach. Współczynnik dopasowania R2 jest określony analogicznie jak dla poprzedniego modelu i ma identyczną interpretację. Błąd średniokwadratowy wyraża się wzorem oop
MSE = , . (3.182)
n-p- 1
Jeśli spełnione jest założenie
Uwaga 3.50. Założenie (Ni*): e jest wektorem losowym o łącznym rozkładzie normalnym N(0, <r2H),
to możemy skonstruować odpowiedni test sprawdzający, czy istnieje zależność pomiędzy zmiennymi niezależnymi a zmienną zależną. Odpowiada on zatem tostowi F z poprzedniego modelu. Tym razem hipoteza zerowa ma postać
(3.183)
Zauważmy, że jeśli hipoteza ta jest prawdziwa, to zmienne x.i,... ,x.p nie mają statystycznego wpływu na zmienną V.
Hipotezę tą odrzucamy, jeśli wartość statystyki testowej F równa
(3.184)
SSR/p
MSE
jest większa niż kwantyl Fj_a,p>n_p_i.