1 Zagadnienia wstępne
dwóch podejść, opisowego i stochastycznego. Z podejściem opisowym mamy do czynienia wówczas, gdy dane pochodzą ze sprawozdawczości statystycznej, która w przeważającej mierze nosi cechę badania pełnego. Zjawiska społeczne i ekono-miczne objęte zakresem centralnej sprawozdawczości statystycznej odnoszą się zwykle do przestrzennych jednostek administracyjnych, jednostek czasu, segmentów lub sektorów gospodarki itd. Ujęcie tych zjawisk jest deterministyczne, a podejście badawcze jest opisowe. Wielkości, za pomocą których opisujemy zjawiska i populacje, nie mają charakteru losowego; są zmiennymi w zwykłym sensie. Podejście stochastyczne wynika z losowego charakteru próby, którą wybieramy z populacji o pewnym rozkładzie dla celu danego badania, lub losowo zaplanowanego eksperymentu, który ma charakter powtarzalny. Takie podejście wymaga, aby cechy, za pomocą których charakteryzujemy obiekty, traktować jako zmienne losowe.
Różnica podejść odpowiada tu rozróżnieniu między statystyką opisową a indukcyjną. A zatem w opisowym podejściu nie interesują nas własności stochastyczne zbioru obserwacji. Macierz obserwacji jest po prostu zbiorem danych. Analizując je, nie wchodzimy w naturę mechanizmu, który te dane generuje (zob. łajuga. 1993). Badacza interesują przede wszystkim podstawowe charakterystyki opisujące zbiór obserwacji. W podejściu stochastycznym podstawowym elementem jest wnioskowanie o populacji na podstawie zbioru obserwacji. Wiele probabilistycznych procedur znanych z analizy jednowymiarowej ma tu swoje rozszerzenie.
Podstawy statystycznej analizy wielowymiarowej sięgają roku 1883, kiedy to F. Galton określił cel statystyki jako poszukiwanie metod badania dużej liczby powiązanych faktów oraz wyrażania ich w sposób zwięzły i syntetyczny (zob. Maxwell, 1977). Pojęcie dużej ilość danych nie dotyczy zatem liczebności próby, lecz liczby równocześnie rozważanych zmiennych, a ów zwięzły opis sprowadza się do względnie małej liczby parametrów, tak aby ich interpretacja była ułatwiona. Idea, która później zaowocowała konkretnymi metodami, jest zawsze godna uwagi, ale nie mniej ważny jest aspekt praktyczny. Manly (1986) twierdzi, że rozwój metod wielowymiarowej analizy statystycznej rozpoczął się na dobre w roku 1898, kiedy to H. Bumpus zgromadził dane o pięciu cechach morfologicznych wróbli, które zginęły w czasie bardzo silnego sztormu. Porównanie pomiarów u tych ptaków i u ptaków, które sztorm przeżyły, miało służyć wyka zaniu, że ptaki, któr< zginęły, zginęły nie przez przypadek, lecz wskutek fizycznej
4 Sir Francis Galton (1822-1911), angielski naukowiec; przyrodnik, antropolog, lekarz. Pionier użycia odcisków palców jako metody identyfikacji jednostek prekursor cugcniki I « on a koncepcji regresji i korelacji (w 1877 r. wprowadził współczynnik korelacji jako miarę zależności dwóch zmiennych). Zainicjował zastosowanie „statystyki korelacyjnej" w ckspcrymentai li psychologu? nych.