Wartości cechy obiektu i (wiersze w macierzy X) będziemy oznaczali za pomocą wektora wierszowego xV = [xi} *xip\. Jest on określany takimi ter
minami jak przypadek (ang. case), rekord czy profil, w zależności od kontekstu i celu analizy. Macierz obserwacji X może być zatem przedstawiona jako kolumna takich wektorów - przypadków
•2)
X =
x
n
ch
ch
i)>
o-
ta
W analizie wielowymiarowej n wierszy macierzy danych traktuje się jako zbiór n punktów w p-wymiarowej przestrzeni zmiennych Rp, i odwrotnie, p kolumn jest traktowanych jako p punktów w n- wymiarowej przestrzeni obiektów Rn Dla analityka położenie punktów i odległości między punktami, reprezentującymi poszczególne obserwacje, ma oczywiste znaczenie. Dwa punkty, które są bliskie sobie w przestrzeni Rp, muszą mieć podobne wartości dla p zmiennych, np dwa gospodarstwa domowe „bliskie sobie” mają podobne wzorce wydatków. Jeśli cho dzi z kolei o przestrzeń Rn, to można powiedzieć, że jeżeli dwie zmienne są bliskie sobie w tej przestrzeni, to mają podobne wartości dla obserwacji, innymi słowy, mierzą one prawie tę samą rzecz. Jest to oczywiście bardzo luźna interpretacja od ległości między punktami w przestrzeni i niewiele jeszcze z niej wynika
Duży zwykle zbiór danych, jaki reprezentuje macierz danych X, stanowi poważne ograniczenie dla wszelkich prób wizualnego wyciągnięcia potrzebnych informacji. Można je jednak wstępnie oceniać poprzez obliczenie pewnych charak terystyk opisowych: średnio arytmetycznej jako punktu ciężkości zbioru danych, wariancji lub odchylenia standardowego jako miary zmienności itd. (zob. dwa ostatnie wiersze w tablicy 11).
20 Zagadnienie pomiaru odległości będzie tematem rozdziału 4