Analiza czynnikowa
(notatki z wykładu)
Dwa cele stosowania analizy czynnikowej:
Redukcja przestrzeni własności, redukcja liczby zmiennych w analizie.
Odkrywanie głębokiej struktury zjawisk, która wyjaśnia zaobserwowane korelacje między zmiennymi
Analiza składowych głównych a analiza czynnikowa
W analizie składowych głównych czynnik jest czymś innym niż w analizie czynnikowej. W analizie składowych głównych chcemy sprowadzić zmienność do minimalnej liczby wymiarów. Najpierw wyznaczamy tyle składowych głównych, ile jest zmiennych. Składowe główne to takie osie nowego układu współrzędnych, które zbierają największą zmienność zmiennych. Pierwsza składowa główna wyjaśnia zawsze największą ilość wariancji, druga największą z pozostałej itd. Podstawowym celem analizy składowych głównych jest redukcja przestrzeni własności. W analizie czynnikowej mamy teorię, która mówi o ukrytych wymiarach zjawisk.
Initial Statistics:
Variable Communality * Factor Eigenvalue Pct of Var Cum Pct
*
R1.1 1,00000 * 1 3,21214 32,1 32,1
R1.2 1,00000 * 2 1,22459 12,2 44,4
R1.3 1,00000 * 3 ,95900 9,6 54,0
R1.4 1,00000 * 4 ,86770 8,7 62,6
R1.5 1,00000 * 5 ,82047 8,2 70,8
R1.6 1,00000 * 6 ,74447 7,4 78,3
R1.7 1,00000 * 7 ,69731 7,0 85,3
R1.8 1,00000 * 8 ,59658 6,0 91,2
R1.9 1,00000 * 9 ,45386 4,5 95,8
R1.10 1,00000 * 10 ,42388 4,2 100,0
PC extracted 2 factors.
Pierwsza tabela:
Variable - zmienne wzięte do analizy czynnikowej
Communality - Zasób zmienności wspólnej - zakres wariancji podzielanej przez nasze zmienne. Zakres zmienności danej zmiennej wyjaśniany przez model.
Druga tabela:
Factor - czynnik. Tutaj przy dziesięciu zmiennych mamy 10 czynników. Te 10 czynników wyjaśnia w 100% wariancje 10 zmiennych.
Eigenvalue - wartość własna.
Pct of var - Procent wyjaśnionej wariancji (= wartość własna podzielona przez sumę zasobów zmienności wspólnej)
Cum pct - Skumulowany procent wyjaśnionej wariancji.
Kryteria wyboru liczby czynników:
Kryterium Kaizera: bierzemy tyle czynników, ile ma wartości własne powyżej 1. Tam gdzie wartość własna jest mniejsza od 1, czynnik wyjaśnia mniej niż pojedyncza zmienna.
Kryterium osypiska (scree plot): trzeba wziąć tyle czynników, ile ich jest na górce.
Kryterium sensownej interpretacji.
Factor Matrix:
Factor 1 Factor 2
R1.8 ,72220 -,22087
R1.10 ,65690 -,48415
R1.2 ,58570 ,55799
R1.4 ,58360 -,27895
R1.7 ,56972 ,04625
R1.6 ,54036 -,21692
R1.1 ,52803 ,14833
R1.9 ,43562 -,24991
R1.5 ,43461 ,24370
R1.3 ,54899 ,59933
Factor Matrix (=Factor Pattern Matrix w przypadku czynników ortogonalnych) - Macierz ładunków czynnikowych - zawiera standaryzowane współczynniki regresji zmiennej na zestaw czynników w modelu. Gdy czynniki są nieskorelowane współczynniki regresji cząstkowej są równe współczynnikom korelacji r Pearsona między zmiennymi a czynnikiem.
Czynniki ortogonalne - czynniki nieskorelowane ze sobą (prostopadłe).
Czynniki skośne - czynniki skorelowane ze sobą.
Final Statistics:
Variable Communality * Factor Eigenvalue Pct of Var Cum Pct
*
R1.1 ,30082 * 1 3,21214 32,1 32,1
R1.2 ,65439 * 2 1,22459 12,2 44,4
R1.3 ,66059 *
R1.4 ,41841 *
R1.5 ,24828 *
R1.6 ,33904 *
R1.7 ,32672 *
R1.8 ,57035 *
R1.9 ,25222 *
R1.10 ,66592 *
Communalities - Jaki zakres zmienności danej zmiennej jest wyjaśniany przez te czynniki, które wzięliśmy do analizy (w tym przypadku 2). Jeśli zmienna ma małą wartość zasobu zmienności wspólnej (communality), to jest słabo wyjaśniana przez model.
Rotacja to obrót układu współrzędnych utworzonego przez wyekstrahowane czynniki. Rotacja jest zabiegiem matematycznym, który służy do uzyskania układu, który jest łatwiejszy w interpretacji. W wyniku rotacji suma wyjaśnionej wariancji pozostaje stała.
Rotacja ortogonalna - taki układ, w którym czynniki są nieskorelowane.
Rodzaj rotacji ortogonalnych:
Rotacja Quartimax - służy do wyjaśnienia wariancji zmiennych przy pomocy najmniejszej liczby czynników
Rotacja Varimax - Prowadzi do najlepszej czytelności czynników. Tam gdzie daje duże ładunki na jednym czynniku, to daje małe ładunki na drugim czynniku. Prowadzi do wyjaśnienia czynników przy pomocy najmniejszej liczby zmiennych.
Equamax - rotacja pośrednia między Quartimax i Varimax
Rotacja nieortogonalna - rotacja, w której czynniki są skorelowane, np. rotacja Oblimin. W przypadku rotacji Oblimin możemy sterować parametrem Delta. Pozwala on wpływać na skośność czynników. Im bardziej ujemna delta, tym czynniki są bliższe ortogonalności, gdy delta=0, dopuszczamy maksymalną skośność.
W przypadku rotacji nieortogonalnej otrzymujemy dwie macierze:
Pattern Matrix:
Factor 1 Factor 2
R1.10 ,86620 -,15134
R1.8 ,68780 ,13866
R1.4 ,64114 ,01364
R1.6 ,55850 ,05315
R1.9 ,51398 -,03066
R1.7 ,35531 ,32536
R1.3 -,12882 ,85694
R1.2 -,06828 ,83448
R1.5 ,09402 ,45236
R1.1 ,23974 ,40486
Pattern Matrix - Macierz wzoru czynników (=macierzy struktury czynników w przypadku czynników ortogonalnych) - macierz ładunków czynnikowych. Jest to macierz współczynników regresji pomiędzy czynnikami a zmienną.
Structure Matrix:
Factor 1 Factor 2
R1.10 ,80427 ,20313
R1.8 ,74454 ,42012
R1.4 ,64672 ,27601
R1.6 ,58025 ,28170
R1.9 ,50143 ,17967
R1.7 ,48845 ,47076
R1.2 ,27321 ,80654
R1.3 ,22185 ,80422
R1.1 ,40541 ,50296
R1.5 ,27913 ,49083
Structure Matrix - Macierz struktury czynników - macierz współczynników korelacji między zmienną a czynnikiem.
c:\$elka\factor.doc
3
3