56 3.7 Analiza regresji
Notacja macierzowa jest bardzo przydatna, gdy rozpatrujemy wielowymiarowe zmienne losowe. Takie wielowymiarowe zmienne losowe będziemy przedstawiać w postaci wektorów-kolumn, np.
Z
(3.168)
łożona z k ..Doiedvnczvch”
gdzie Z jest zmienną losową (wektorem)
Z\y..., Zk- Dla takiej zmiennej losowej - wektora, mamy EZ = (BZi,..., EZk)T, czyli jego wartość oczekiwana jest wektorem poszczególnych wartości oczekiwanych. Znak T oznacza transpozycję wektora.
Macierzą kowariancji (zwaną czasami również macierzą wariancji-kowariancji) zmiennej Z jest macierz
(VarZi Cov{ZuZ2) $ov(Z2,Zl) VarZ2
('ov(Zk, Z\) Cov(Zk, Z2)
Cov(ZuZk)\ r Cov(Z2,Z*) • (3169)
Var Zk
czyli macierz, która na głównej przekątnej ma wariancje dla poszczególnych zmiennych losowych Z\, Z2ł..., Zk, zaś poza nią są wszystkie możliwe kowariancje par „składowych” zmiennych losowych. Zachodzi przy tym
(3.170)
VAR Z = E(Z — E Z)(Z - E Z)7
jest to więc „uogólnienie” wzoru na wariancję dla jednowymiarowej zmiennej losowej na większą liczbę wymiarów. Macierz kowariancji musi być macierzą symetryczną (z symetrii samej kowariancji).
Wielowymiarowy rozkład normalny Z posiada gęstość daną wzorem
gdzie W jest macierzą symetryczną, dodatnio określoną o wymiarach kxk, zaś p jest wektorem k-wymiarowym. Przy tak zdefiniowanej gęstości mamy E Z = p oraz VAR Z = W. Zgodnie z ogólna konwencją będziemy zatem pisać Z ~ N(p, W).
Zauważmy, że jeśli Z ~ N(p}<rH), gdzie II jest macierzą jednostkową, to kowariancja pomiędzy poszczególnymi zmiennymi równa się zero. Dodatkowo, z pewnych twierdzeń rachunku prawdopodobieństwa, jeśli zmienna Z pochodzi z rozkładu normalnego, to w takim przypadku poszczególne składowe Z\, Z2, ...,Zk są od siebie dodatkowo niezależne. Należy jednak pamiętać, iż rozumowanie tar kie nie jest to prawdą, gdy Z pochodzi z innego rozkładu niż normalny.
W tym modelu analizy regresji zakładać będziemy, że jedna zmienna zależna Y może zależeć od wielu deterministycznych zmiennych niezależnych oznaczanych przez x,\yx.2,... ,x.p.