Zakładamy, że rząd macierzy X jest równy k. Jest to założenie o charakterze technicznym (będziemy macierz X’X odwracać wielokrotnie, a (X’X)’' istnieje gdy rz(X) = k BM} oznaczające, że kolumny macierzy X są liniowo niezależne. To odzwierciedla intuicję o niedublowaniu informacji - do modelu wprowadza się liniowych kombinacji uwzględnionych już zmiennych (ale nieliniowe można - np. w translogarytmicznej funkcji produkcji). To ustala też minimalną liczbę obserwacji: z 3° wynika, że T > k (z definicji rzędu macierzy).
Kolejne założenia (4° i 5°) dotyczą wektora epsilon:
<Txl)
Czytamy: wartość oczekiwana wektora losowego e jest wektorem zerowym. Zapis 0(Txi) oznacza wektor kolumnę o wymiarach T na 1 zawierający wyłącznie zera. Wartość oczekiwana wektora losowego E to wektor zawierający odpowiednio wartości oczekiwane składników losowych poszczególnych obserwacji:
E(e,) |
0' | |
E (e 2) |
- |
0 |
E(eT) |
0 |
(to, co jest nad znakiem równości czytamy „na mocy” i będzie nadużywane na następnym wykładzie; df (czasem trzy poziome kreski albo :=) oznacza „na mocy definicji” czyli Jest zdefiniowany jako” a czwórka „na mocy założenia numer 4” - to tak dla jasności . .. BM}
Założenie to oznacza, że łączny wpływ czynników drugorzędnych, przypadkowych nie może mieć tendencji, składnika systematycznego. Oczekujemy, że średnio rzecz biorąc, łączny wpływ tych czynników będzie odchylał wartość y, to w górę, to w dół, i że wartość oczekiwana tych odchyleń powinna być zerowa.
Założenie 5° mówi o postaci macierzy wariancji-kowariancji wektora losowego £. Macierz wariancji -kowariancji zwana dalej macierzą kowariancji to macierz zawierająca podstawowe charakterystyki rozproszenia wielowymiarowej zmiennej losowej. Jednowymiarowa zmienna losowa zwykle może być charakteryzowana miarą położenia (wartość oczekiwana) i rozproszenia (wariancja bądź odchylenie standardowe). [„Zwykle”, gdyż wielkości te mogą nie istnieć w wypadku niektórych zmiennych losowych. Tu założenia 4° i 5° mówią, że e charakteryzuje się rozkładem posiadającym momenty pierwszego i drugiego rzędu]. Wektor losowy £ jest wielowymiarową zmienną losową charakteryzowaną miarą położenia -omówioną w poprzednim punkcie wartością oczekiwaną będącą wektorem - oraz miarą rozproszenia -macierzą kowariancji, która określa wariancję poszczególnych składowych wektora losowego i zależności pomiędzy nimi - odpowiednie kowariancje. Ponieważ wariancję możemy uważać za kowariancję pomiędzy zmienną a nią samą, macierz w której zebrane są wszystkie kowariancje charakteryzujące wektor losowy £ nazywamy macierzą kowariancji i oznaczamy jako V(fi); macierz kowariancji musi być dodatnio określona (więc i symetryczna, skoro symetryczna to i kwadratowa oczywiście); c2 (sigma kwadrat) to skalar, nieznany większy od zera parametr struktury stochastycznej. Kwadrat jest tu tylko dlatego, że sama sigma to tradycyjnie nieznane odchylenie standardowe czyli pierwiastek z wariancji. It to macierz jednostkowa stopnia T, czyli