55
Statystyka matematyczna
Przedstawiony wcześniej prosty model regresji można uogólnić. Jednym z takich sposobów uogólnienia jest przyjęcie nie tylko samej zmiennej zależnej Y, ale również zmiennej niezależnej jako zmiennych losowych. W związku z tym będziemy teraz również zmienną niezależną oznaczać dużą literą, czyli przez X.
W ujęciu tym obserwator dysponuje wynikami (w postaci par) doświadczeń losowych (Xi, Yi),..., (Xn,Yn). Jesteśmy zatem zainteresowani znalezieniem zależności postaci
Y = b1X + b0-{-s, (3.163)
gdzie poszczególne symbole bo, b\, e mają podobne znaczenie co w rozdziale 3.7.2.
Mimo zasadniczej zmiany w sformułowaniu modelu, wyniki pozostają w zasadzie identyczne.
Uwaga 3.46. Przyjmijmy następujące założenia:
1. (N3) (Xi, Yi),..., {Xn, Yn) są niezależnymi wektorami losowymi, o jednakowym rozkładzie normalnym N(px, P-Y, , p) (tzn. poszczególne
pary są do siebie niezależne, zmienna X pochodzi z rozkładu N{px,&\), zmienna Y z rozkładu N(py,^y) oraz Cov(X,Y) = qvxvy), lub
2. (NĄ) (Xi, Yi), ..., (Xn,Yn) są niezależnymi wektorami losowymi, o jednakowym rozkładzie, przy czym EX = /*x>EY = py , Var X = o\, Var Y = <jy,Cov(X, Y) = qox<*y-
Jak łatwo zauważyć, założenie (N4) jest słabsze.
W modelu (3.163) odpowiednie estymatory parametrów mają postać
6i = COV(*’y) , fe0 = ? ~ biX . (3.164)
5A'
Są one wyznaczone poprzez minimalizację błędu średniokwadrat owego, czyli minimalizację funkcji postaci
Esr2 = E(V - b,X - baf , (3.165)
co właściwie odpowiada metodzie najmniejszych kwadratów. W szczególności zachodzi twierdzenie
Twierdzenie 3.47. Jeśli w modelu zdefiniowanym przez (3.163), zachodzi założenie (N3), to estymatory (3.164) są estymatorami największej wiarygodności. Test F zmienia teraz trochę postać. Otóż testuje on hipotezę zerową
H0 :Corr(A",Y) =0 (3.166)
wobec
tfi:Corr(X,Y)^0. (3.167)
Należy jednak podkreślić, że intuicyjnie odpowiada to tej samej sytuacji - jeśli korelacja jest równa zeru, oznacza to, że nie istnieje liniowa zależność pomiędzy zmiennymi X i Y, czyli &i = 0. W przypadku, gdy spełnione jest założenie (N3) przyjęcie Ho prowadzi do silniejszego wniosku - iż zmienne są w ogóle niezależne.
Jeśli spełnione jest założenie (N3), test F w modelu z losową zmienną objaśniającą wykorzystuje zasadniczo identyczną statystykę testową oraz regułę testową, jak w przypadku modelu z deterministyczną zmienną x.