57
Statystyka matematyczna
Przykład 3.48. Temperatura procesora w komputerze może zależeć od wielu czynników, np. obciążenia pracą, temperatury otoczenia, szybkości działania wiatraczka, itd. Z kolei plony na polu mogą zależeć od ilości opadów, temperatury, ilości nawozów, itp.
Zakładać będziemy, że istnieje zależność liniowa pomiędzy zmienną zależną a zmiennymi niezależnymi, tzn. nasz model analizy regresji przedstawić możemy jako
Y = bo -f i»ix.i ■+*...+ bpx.p + £ , (3.172)
gdzie Y jest zmienną losową obserwowalną, x.i,x.2,... ,x_p - zmiennymi deterministycznymi obserwowalnymi, £ - losowym, nieobserwowanym błędem. W tym modelu nasze obserwacje mają zatem postać wektorów
(3.173)
gdzie pierwszy numer w indeksie dolnym oznacza numer obserwacji (czyli przypadek), zaś drugi numer odnosi się do tego, że zaobserwowano wartość odpowiedniej zmiennej x.j. Stąd model ten zapisać możemy w postaci
Yi = bo + bjiij £i , (3.174)
j=i
gdzie i = l,...,n i j = l,...,p oraz zakładamy, że n > p-f-1. Dzięki temu ostatniemu założeniu będziemy dysponować dostateczną ilością informacji w celu wyestymowania nieznanych dla nas parametrów bo,bi,... ,bp. Model (3.174) można prościej zapisać w postaci macierzowej
(3.175)
a w skrócie
(3.176)
gdzie Y jest wektorem n-elementowym złożonym z obserwacji zmiennej zależnej, macierz X ma wymiar n x {p+ 1) iw pierwszej kolumnie złożona jest z jedynek (co odpowiada wyrazowi wolnemu bo), a w pozostałych zawiera obserwacje zmiennych niezależnych pogrupowane w kolumny odpowiadające kolejnym parametrom bijbz,... ,bp, b to wektor p -f- 1-elementowy zawierający nieznane parametry modelu bo,bi,... ,bp, a e jest wektorem n-elementowym błędów.
Podobnie jak poprzednio, naszym celem jest znalezienie estymatorów bo,... ,bp nieznanych parametrów modelu. W tym celu stosujemy zmodyfikowaną metodę najmniejszych kwadratów, która w regresji wielorakiej polega na rozwiązaniu zadania minimalizacji
^rain (Xb - Y)T (Xb - Y) . (3.177)
Załóżmy, że macierz X jest macierzą pełnego rzędu (czyli rankX = p+1). Wtedy można rozwiązać analitycznie zadanie (3.177) i estymatory najmniejszych kwadratów dane są wzorem
(3.178)