7(j 1. Zagadnienia wstępne
7(j 1. Zagadnienia wstępne
N i ech ,v, , v■, (.....xni będą pomiarami cechy X, (j = 1, 2,...,p) wykonanymi na n
obiektach. Zbiór tych wartości stanowi kolumnę j w macierzy danych X. Będzie
my go przedstawiali w postaci wektora kolumnowego x ( = [x,(., x2/,..., xnj]'. Średnia arytmetyczna tych pomiarów, oznaczana przez x r dana jest wzorem
6 = 1.2,..., p) (1.4)
Dla macierzy danych X można więc zdefiniować kolumnowy wektor średnich
u
= -X’l„ (1.5)
n
_ *2 X =
X
_ p
gdzie 1, jest kolumnowym wektorem jednostkowym [1,1,- - • ,1]
W ektor średnich jest punktem ciężkości wielowymiarowego układu danych i nosi nazw ę centroidu (ang. centroid).
Wariancję cechy j będziemy oznaczali s;2 = S- i obliczali w dobrze znany sposób ze wzoru
s* (; = 1,2,...,p) (1.6)
Odchylenie standardowe (s. = Js~) jest pierwiastkiem z wariancji. Wariancje są elementami na przekątnej macierzy kowariancji S (wzór 1.14).
Ważną rolę w analizie wielowymiarowej spełniają przetworzone macierze obserwacji. Może to być na przykład macierz danych centrowanych (ang. centred data matrix)
X„ = X-l,x’ (1.7)
gdzie 11 jest kolumnowym wektorem jednostkowym (n X 1).
Otrzymujemy ją z odjęcia od wartości każdej z kolumn, reprezentujących określoną zmienną Xr ich wartości średnich, x, — x. dla i = 1.....n. |est oczywiste,
że suma elementów w każdej kolumnie macierzy X„ jest równa 0, a w ślad za tym wartości średnie zmiennych centrowanych będą równe xJ(O)=0. Wariancje zmiennych centrowanych nie ulegają natomiast zmianie, s2(x j(0]) = s3(x,). P0' dobnie jak nie zmieniają się kowariancje i korelacje między zmiennymi.