54
3.7 Analiza regresji
czyli zmienna Y nie jest związana z zachowaniem się zmiennej x. W takim przypadku model analizy regresji nie jest w ogóle dla nas przydatny (np. w predykcji). Aby sprawdzić hipotezę (3.151) przy założeniu (NI) w teście F obliczamy tzw. statystykę F postaci
F==SSR MSE ’
(3.154)
gdzie
SSR =
(3.155)
n-2
(3.156)
przy czym MSE nazywany jest błędem średniokwadratowym. Hipotezę Ho odrzucamy wtedy, gdy
F > Fi_a>i,n_2 , (3.157)
gdzie symbol po prawej stronie oznacza kwantyl rozkładu F, o rzędzie 1 — a i parametrach 1, n — 2.
Dla każdego z parametrów bo i bi możemy zbudować odpowiedni przedział ufności Jeśli chodzi o odpowiedni przedział dla parametru bo, to, na poziomie ufności fi, może posłużyć on również do testowania hipotezy zerowej na poziomie istotności a = 1 — 0
Ho : bo = 0 (3.158)
wobec
HuboźO. (3.159)
Zauważmy, że jeśli przyjmiemy hipotezę zerową (3.158), to w modelu analizy regresji otrzymujemy uproszczoną funkcję opisującą zależność, postaci
Y = b\X + £ ,
(3.160)
czyli bez wyrazu wolnego (stałej). Mówimy wtedy, że wyraz wolny jest nieistotny. Z kolei przedział ufności dla parametru b\ (wyrazu kierunkowego) może posłużyć również do testowania (3.151) wobec (3.152). Co ważne, test F odrzuca hipotezę zerową wtedy i tylko wtedy, gdy w przedziale ufności dla parametru również nie zawiera się zero. Innymi słowy, test F i wykorzystanie przedziału ufności dla bi są „zgodnymi” testami, tzn. dającymi dokładnie takie same wyniki. Przedziały ufności są szczególnie przydatne we wspomnianej w dalszym ciągu tzw. regresji wielorakiej, gdzie obowiązuje model postaci „jedna zmienna zależna, wiele zmiennych niezależnych”.
Przedział ufności dla parametru bo ma postać
h-a/2,n-2
&0 + £ł-a/2,n—5
(3.161)
a dla parametru
(3.162)
, MSE i t MSE I