METODY CZYNNIKOWE
Metody czynnikowe stanowią zespół metod i procedur statystycznych pozwalających na zredukowanie dużej liczby zmiennych do kilku wzajemnie nieskorelowanych czynników. Zachowują one stosunkowo dużą część informacji tkwiących w zmiennych pierwotnych, a jednocześnie każda z nich jest nośnikiem innych treści merytorycznych.
analiza głównych składowych
klasyczna analiza czynnikowa
analiza kanoniczna
analiza korespondencji
analiza dyskryminacyjna
ANALIZA GŁÓWNYCH SKŁADOWYCH
Ogólna charakterystyka
polega na przekształceniu obserwowalnych zmiennych wejściowych w nowe, nieobserwowalne i zarazem nieskorelowane zmienne nazywane głównymi składowymi (czynnikami)
każda z głównych składowych jest liniową funkcją zmiennych wejściowych
główne składowe są tak uporządkowane, aby wariancje kolejnych głównych składowych (stanowiące miarę ich zasobów informacyjnych o badanym zjawisku) były coraz mniejsze
suma wariancji wszystkich zmiennych wejściowych jest równa sumie wariancji głównych składowych, co oznacza że przekształcenie zmiennych wejściowych w główne składowe nie prowadzi do żadnych strat informacji o badanym zjawisku
kilka pierwszych głównych składowych zawiera zdecydowaną większość informacji o badanym zjawisku, dostarczanych przez zmienne wejściowe, co pozwala na redukcję liczby głównych składowych przy możliwie małej stracie informacji wejściowych
ALGORYTM ANALIZY GŁÓWNYCH SKŁADOWYCH
budowa macierzy danych wejściowych o postaci:
, i=1,2,...,n; j=1,2,...,m, (5.1)
gdzie:
xij - wartość j-tej zmiennej w i-tym obiekcie.
przedstawienie zmiennych wejściowych, po ich uprzedniej standaryzacji, jako liniowej kombinacji głównych składowych (czynników):
Z = WF (5.2)
gdzie:
Z = [zji] - wystandaryzowana macierz obserwacji (m x n), przy czym zji jest wartością wystandaryzowanej j-tej zmiennej w i-tym obiekcie,
W = [wjl] - macierz współczynników głównych składowych (n x s), przy czym wjl jest wartością współczynnika znajdującego się przy j-tej zmiennej i l-tej składowej,
F = [fli] - macierz głównych składowych (czynników) (s x n), przy czym fli jest wartością l-tej głównej składowej w i-tym obiekcie,
przy czym zakładamy, że poszukiwane główne składowe są niezależne:
, l=1,2,...,s, (5.3)
, l',l=1,2,...,s; l'≠l. (5.4)
szacunek współczynników głównych składowych:
podstawą do wyznaczania elementów macierzy współczynników głównych składowych jest macierz korelacji R o postaci:
(5.5)
w pierwszym etapie analizy poszukujemy współczynników pierwszej głównej składowej, której wariancja powinna mieć maksymalny udział w sumie wariancji zmiennych wejściowych
ponieważ główne składowe są nieskorelowane zależność pomiędzy zasobami informacyjnymi danej zmiennej, a współczynnikami głównych składowych można przedstawić następująco:
, j=1,2,...,m, (5.6)
innymi słowy zasoby informacyjne (wariancje) każdej ze zmiennych wejściowych możemy zdekomponować na sumę kwadratów współczynników kolejnych głównych składowych
współczynniki pierwszej głównej składowej wj1, wyznaczamy tak aby maksymalizowały funkcję:
, (5.7)
i spełniały warunki (5.3) i (5.4). Maksimum tej funkcji wyznacza się za pomocą mnożników Lagrange'a
aby otrzymać współczynniki 1-szej głównej składowej będące elementami wektora w1 musimy rozwiązać układ m-równań jednorodnych o s-niewiadomych o postaci:
, (5.8)
gdzie:
I=[diag(1)] - macierz jednostkowa (s x s),
λ1 - pierwiastek charakterystyczny (wartość własna) równania wyznacznikowego odpowiadający pierwszemu wektorowi charakterystycznemu,
a1=[aj1] - unormowany wektor charakterystyczny (wartości własnych)
(m x 1), odpowiadający 1-szemu największemu pierwiastkowi charakterystycznemu (wartości własnej).
układ (5.8) ma rozwiązanie niezerowe gdy spełniony jest warunek:
(5.9)
wyrażenie (5.9) jest wielomianem charakterystycznym s-tego stopnia macierzy R ze względu na λ, przy czym istnieje s-pierwiastków charakterystycznych
wektor wl jest wektorem charakterystycznym (własnym) macierzy R, odpowiadającym największemu z jej pierwiastków charakterystycznych
pierwiastki charakterystyczne macierzy R uzyskujemy rozwiązując równanie (5.9)
po malejącym uporządkowaniu pierwiastków charakterystycznych, największy z nich podstawimy do układu (5.8) i znajdujemy elementy wektora własnego a1.
na podstawie wyznaczonego wektora własnego i odpowiadającej mu wartości własnej obliczamy współczynniki pierwszej głównej składowej:
, (5.10)
gdzie:
- wektor (m x 1), którego elementami są współczynniki pierwszej głównej składowej.
współczynnik 1-szej głównej składowej w równaniu j-tej zmiennej jest obliczany według wzoru:
(5.11)
wyznaczamy wartości współczynników drugiej głównej składowej analogicznie jak pierwszej głównej składowej, z tym że punktem wyjścia jest tzw. macierz pozostałości korelacyjnych:
, (5.12)
gdzie:
R1 - macierz pozostałości korelacyjnych po pierwszym czynniku.
wyznaczanie współczynników kolejnych głównych składowych przebiega w identyczny sposób
po wyznaczeniu współczynników głównych składowych, zakładając, że macierz współczynników głównych składowych spełnia równanie:
, (5.13)
wyznaczamy wartości głównych składowych (czynników) dla poszczególnych obiektów:
. (5.14)
INTERPRETACJA GEOMETRYCZNA
Rys. 5.1. Dopasowanie położenia układu osi głównych składowych do konfiguracji punktów reprezentujących obiekty.
elementy macierzy obserwacji X mogą być interpretowane w ujęciu geometrycznym jako współrzędne n-punktów reprezentujących obiekty w m-wymiarowej przestrzeni zmiennych Rm. Innymi słowy każdy obiekt reprezentowany jest przez wektor opisujących go zmiennych
początek układu współrzędnych znajduje się, ze względu na standaryzację zmiennych, w środku ciężkości rozważanego zbioru punktów reprezentujących obiekty
elementy niezbędne do wyznaczania konfiguracji wektorów (wzajemne położenie wektorów względem siebie, długości oraz kątów między nimi) zawiera macierz korelacji R
długości wektorów wyznaczają elementy na głównej przekątnej macierzy R, a kąty pomiędzy wektorami jej pozostałe elementy
długości wektorów, ze względu na standaryzację zmiennych wejściowych, są jednostkowe
położenie osi pierwszej głównej składowej dobieramy tak aby zminimalizować sumę kwadratów odległości punktów obiektów od ich rzutów na tą oś
ortogonalna macierz ładunków czynnikowych W definiuje transformację zmiennych wejściowych w główne składowe poprzez obrót pierwotnego układu współrzędnych:
współrzędne punktów obiektów w nowym układzie czynnikowym obliczamy następująco:
OKREŚLENIE LICZBY GŁÓWNYCH SKŁADOWYCH
Kryterium wartości własnej:
zostawienie w dalszej analizie tylko tych czynników, których wartości własne są większe od 1
Kryterium osypiska:
Rys. 5.13.
Kryterium stopnia wyjaśniania wariancji:
pozostawienie do dalszej analizy tylu głównych składowych, aby udział sumy ich wariancji w sumie wariancji wszystkich głównych składowych, będącej miarą zasobów informacyjnych głównych składowych, przekraczał określony procent, najczęściej powyżej 80%
INTERPRETACJA WYNIKÓW
miarą zmienności zmiennych wejściowych przypadającą na l-tą główną składową (ilość informacji o badanych obiektach zawartej w tej głównej składowej) jest wyrażenie:
. (5.17)
zasoby informacyjnych dostarczanych przez r pierwszych głównych składowych wyznaczamy jako:
. (5.18)
kwadraty współczynników głównych składowych głównych składowych i pierwiastków charakterystycznych odpowiadających im wariancji, które są jednocześnie współczynnikami korelacji pomiędzy wejściowymi i głównymi składowymi:
, j=1,2,...,m; l',l=1,2,...,s, (5.19)
określają one jakie odsetki wariancji (zasobów informacyjnych) zmiennych wejściowych przenoszą poszczególne główne składowe i mogą służyć do interpretacji poszczególnych składowych