Wykłady v. ekonometrii Jacka Osie"niskiego
yi y 2
(Txl)
Kolejne y, to nie liczby z roczników czy księgowości czy skądkolwiek. Na tym etapie trzeba o nich myśleć zupełnie inaczej. To są możliwe obserwacje (ujęcie ex antę). Tworzony jest schemat, który mówi jak rzeczywiste obserwacje mogłyby się pojawić (patrz „model” wyżej) - obserwacja jest tu zmienną losową: reprezentuje to, co mogłoby się wydarzyć, a nie to, co zarejestrowano. Zarejestrowane liczby to realizacje zmiennej losowej, a na etapie modelowania „możliwa realizacja” zjawiska empirycznego, czyli wektor y to wektor losowy, który będzie dalej opisywany.
Zmienne zewnętrzne (w kontekście regresji „objaśniające” <explanatory variables> będą zwykle dobierane w oparciu o modele ekonomiczne. Zakłada się, że aby opisać powstawanie y trzeba i wystarczy wyróżnić k („ka małe”) odrębnych zmiennych objaśniających x. Każdej obserwacji na zmiennej objaśnianej y odpowiada po jednej wartości każdej z k zmiennych objaśniających xj; (i = l,...k).
Macierz X (macierz zmiennych objaśniających, macierz regresorów, macierz planu eksperymentu <design matrix>) tworzona jest w ten sposób, że kolejne kolumny odpowiadają różnym zmiennym objaśniającym a w ramach kolumny (w kolejnych wierszach) występują wartości danej zmiennej objaśniającej.
x,,
x12 ... xlk
X22 ••• X2t
T obserwacji na zmiennej objaśnianej tworzy wektor y, a w macierzy X jest po T wartości wszystkich k zmiennych objaśniających, każdej zmiennej odpowiada jedna kolumna macierzy X, a kolejnym jej wartościom (odpowiadającym kolejnym obserwacjom na y) posuwanie się do kolejnego wiersza. Przy małych iksach pierwsza liczba to numer obserwacji a druga to numer zmiennej. Dobrze jest się oswoić z tym zapisem, opłaca się wiedzieć bez wahania co jest „Te duże” a co „ka małe”. Przy każdej macierzy warto odruchowo pomyśleć o wymiarze, co w wierszach, co w kolumnach i co to jest element a jj.
Czy można powiedzieć, że macierz X grupuje obserwacje na zmiennych objaśniających? Tu są zastrzeżenia. Bo trzeba by powiedzieć, że są to obserwacje bez błędów - gdyby założyć, że są to realne obserwacje, obarczone np. błędem pomiaru, trzeba byłoby założyć ich losowość - będzie to przedmiotem jednego z kolejnych podrozdziałów. Na tym etapie bezpieczniej jest nazywać macierz X macierzą wartości zmiennych objaśniających, a nie obserwacji.
Ponadto praktycznie zawsze (ale niekoniecznie na kolokwium © to dopisek AD 2003 kiedy przepisywacz niniejszego ze sprawdzanego kolokwiami stał się sprawdzającym kolokwia) w dalszej fazie, post-modelowej (czyli na ćwiczeniach;-)) w macierzy X pierwsza kolumna będzie zawierać same jedynki, co odpowiada uwzględnieniu wyrazu wolnego.