Techniki analizy czynnikowej
Dr hab. inż. Jadwiga Stobiecka
Katedra Analizy Rynku i Badań Marketingowych
Uniwersytet Ekonomiczny w Krakowie
Zastosowanie
• Redukcja liczby zmiennych
• Wykrycie struktury i ogólnych
prawidłowości w związkach pomiędzy
zmiennymi
• Weryfikacja wykrytych prawidłowości i
powiązań
• Opis i klasyfikacja badanych obiektów w
nowych przestrzeniach zdefiniowanych
przez nowe zmienne (czynniki)
Podręcznik
pomocy
Jak to wygląda?
Co znaczą wyniki?
Podstawowe pojęcia
• Ładunki czynnikowe
(factor loadings
) wyrażają stopień
nasycenia zmiennej danym czynnikiem. Dla
nieskorelowanych czynników stanowią one współczynniki
korelacji danej zmienwej pierwotnej z poszczególnymi
czynnikami.
• Wartości własne
(eigenvalues)
– otrzymuje się je przez
podniesienie do kwadratu i zsumowanie ładunków kolejnych
czynników w poszczególnych zmiennych.
• Zasoby zmienności wspólnej
(communality) = suma
kwadratów ładunków czynnikowych w danym wierszu
(wielorakie R^2).
Metoda wyodrębniania czynników
•
Składowe główne
–W procedurze przyjmujemy, że zasoby
zmienności wspólnej, znajdujące się na przekątnej macierzy
korelacji, równe są 1 (zakłada się ortogonalność głównych
składowych.
•
Czynniki główne – zasoby zmienności wspólnej
= wielorakie
R2. Zasoby zmienności wspólnej są szacowane jako
współczynniki determinacji cząstkowej danej zmiennej
wejściowej z pozostałymi zmiennymi.
•
Czynniki główne – czynniki największej wiarygodności
. W
metodzie tej zakładamy z góry liczbę czynników jaką
wykorzystany w analizie (musimy ją wpisać w pole: Maksymalna
liczba czynników). Aby nie nakładać innych ograniczeń na liczbę
czynników, wpisujemy w pole: Minimalna wartość własna
wartość 0.
•
Czynniki główne – iterowane zasoby zmienności wspólnej
(MINERS).
Dokonane wybory akceptujemy klawiszem OK.
Metoda wyodrębniania czynników (c.d.)
•
Czynniki główne – czynniki największej wiarygodności
.
W metodzie tej zakładamy z góry liczbę czynników jaką
wykorzystany w analizie, musimy ją wpisać w pole Maksymalna
liczba czynników.
Aby nie nakładać innych ograniczeń na liczbę czynników
wpisujemy w pole Minimalna wartość własna wartość 0.
Mamy też możliwość weryfikacji hipotezy przy jakiej liczbie
czynników zaproponowany przez nas model analizy czynnikowej
wystarczająco dokładnie odtwarza współczynniki korelacji
między zmiennymi wejściowymi.
Wyniki weryfikacji uzyskujemy w tablicy Dobroć dopasowania
klikając na karcie Wyjaśniana wariancja klawisz Test dobroci
dopasowania.
Metoda wyodrębniania czynników (c.d.)
• Czynniki główne – metoda centroidalna
. Wybierając
metodę centroidalną w polu Maksymalna liczba iteracji
wpisujemy liczbę iteracji, w których szacujemy zasoby
zmienności wspólnej zmiennych wejściowych. Szacunek
możemy zakończyć w momencie, gdy nie osiągniemy
podanej liczby iteracji, a uzyskamy w danej iteracji zmianę
zasobów zmienności wspólnej, w stosunku do poprzedniej
iteracji, mniejszą niż wartość podana w polu Minimalna
zmiana w zasobach zmienności wspólnej.
• Czynniki główne – metoda osi głównych
– w przypadku tej
metody musimy przyjąć dodatkowe założenia, podobnie jak w
metodzie centroidalnej. Przyjęte ustawienia umożliwiają
uzyskanie maksymalnej liczby czynników celem poddania ich
dalszej analizie.
Wartości własne
Wartość
własna
% ogółu
wariancji
Skumulowana
wartość własna
Skumulowany
%
1
4,805029
40,04191
4,805029
40,04191
2
0,816228
6,80190
5,621257
46,84381
3
0,540036
4,50030
6,161292
51,34410
Wykres wartości własnych
1
2
3
Liczba wartości własnych
0,0
0,5
1,0
1,5
2,0
2,5
3,0
3,5
4,0
4,5
5,0
5,5
W
a
rt
.
Wartości własne (eigenvalues) –
otrzymuje się je przez podniesie-
nie do kwadratu i zsumowanie
ładunków kolejnych czynników w
poszczególnych zmiennych.
Zasób zmienności wspólnej
Od –
Czynnika 1
Od –
Czynnikia2
Od –
Czynnika 3
Wielokr.
- R-kwadr.
CENA
0,093185
0,176915
0,215176
0,260144
ESTETYKA
0,475359
0,551815
0,577908
0,523404
OSTROŚĆ OBRAZU
0,662472
0,824764
0,878872
0,788318
KOLORYSTYKA
0,616471
0,710955
0,854645
0,781812
BARWA GŁOSU
0,646039
0,648037
0,667178
0,704652
OBSŁUGA
0,278832
0,281227
0,285673
0,387223
NIEZAWODNOŚĆ
0,176683
0,345307
0,401999
0,419348
PARAMETRY TECHN.
0,162925
0,222757
0,228691
0,306370
NOWOCZESNOŚĆ
0,447542
0,482106
0,495117
0,566630
JAKOŚĆ
0,435026
0,491935
0,506243
0,539419
SERWIS
0,157993
0,163175
0,317536
0,207845
MARKA
0,652501
0,722265
0,732254
0,645618
W trzech pierwszych kolumnach tablicy znajdują się odsetki wariancji wspólnej poszczególnych
zmiennych wejściowych wyjaśnianej przez pierwszy (pierwsza kolumna), dwa pierwsze czynniki
(druga kolumna), trzy pierwsze czynniki (trzecia kolumna). Przykładowo trzy pierwsze czynniki
wyjaśniają ponad 85,5% wariancji wspólnej zmiennej kolorystyka ekranu telewizora. W ostatniej
kolumnie mamy wartości współczynnika determinacji wielorakiej zmiennych wejściowych z
trzema pierwszymi czynnikami.
Wartościami ładunków czynnikowych przed rotacją
Czynnik - 1
Czynnik - 2
Czynnik - 3
CENA
0,305262
0,289361
0,195604
ESTETYKA
0,689463
0,276506
0,161535
OSTROŚĆ OBRAZU
0,813924
0,402855
-0,232612
KOLORYSTYKA
0,785157
0,307382
-0,379065
BARWA GŁOSU
0,803766
0,044697
-0,138351
OBSŁUGA
0,528046
-0,048941
0,066675
NIEZAWODNOŚĆ
0,420337
-0,410638
-0,238102
PARAMETRY TECHN.
0,403639
-0,244606
0,077031
NOWOCZESNOŚĆ
0,668986
-0,185914
0,114063
JAKOŚĆ
0,659565
-0,238555
-0,119616
SERWIS
0,397484
0,071982
0,392889
MARKA
0,807775
-0,264128
0,099948
War.wyj.
4,805029
0,816228
0,540036
Udział
0,400419
0,068019
0,045003
Otrzymane ładunki czynnikowe są jednocześnie współczynnikami korelacji pomiędzy zmiennymi wejściowymi
i czynnikami. Ich kwadraty (współczynniki determinacji) mówią nam jaka część wariancji wspólnej zmiennych
wejściowych została wyjaśniona przez kolejne czynniki. Zmienne dla których wartości tych współczynników
determinacji przekraczają 0,5 są wykorzystywane do interpretacji czynników.
Uzyskana struktura
ładunków czynników
nie pozwala na
interpretację drugiego i
trzeciego czynnika.
Sugeruje to zastosowa-
nie rotacji osi
czynnikowych w celu
uzyskania prostej
struktury ładunków
czynnikowych, co
powinno w efekcie
ułatwić interpretację
samych czynników.
Wartościami ładunków czynnikowych po rotacji
Varimax
znormalizowanej
Czynnik - 1
Czynnik - 2
Czynnik - 3
CENA
-0,019990
0,235896
0,398911
ESTETYKA
0,248325
0,475526
0,538626
OSTROŚĆ
OBRAZU
0,257494
0,844855
0,314308
KOLORYSTYKA
0,316303
0,856052
0,147552
BARWA GŁOSU
0,511576
0,580308
0,262126
OBSŁUGA
0,386325
0,247164
0,274473
NIEZAWODNOŚĆ
0,597564
0,148740
-0,150975
PARAMETRY
TECHN.
0,447641
0,055494
0,158836
NOWOCZESNOŚĆ
0,579844
0,225403
0,328771
JAKOŚĆ
0,624172
0,321993
0,113897
SERWIS
0,193105
0,054323
0,526589
MARKA
0,731410
0,270852
0,352041
War.wyj.
2,494898
2,382226
1,284168
Udział
0,207908
0,198519
0,107014
Możliwe rotacje czynników:
Varimax surowa,
Varimax znormalizowana,
Biquartimax surowa,
Biquartimax znormalizowana,
Quartimax surowa,
Quartimax znormalizowana,
Equamax surowa,
Equamax znormalizowana.
Wykres konfiguracji punktów reprezentujących zmienne w
układzie dwóch pierwszych osi czynnikowych
Ładunki czyn., czynnik 1 wz. czynn. 2
Rotacja: Varimax znormalizo
Wyodrębn. : Czynniki główne (centroid.)
OC_CENA
OC_EST
OC_OST RO
OC_KOLOR
OC_GŁOS
OC_OBSŁU
OC_NIEZA
OC_P_T
OC_NOWOC
OC_JAK
OC_SERW
OC_MARKA
-0,1
0,0
0,1
0,2
0,3
0,4
0,5
0,6
0,7
0,8
Czynn. 1
0,0
0,1
0,2
0,3
0,4
0,5
0,6
0,7
0,8
0,9
C
z
y
n
n
.
2
OC_CENA
OC_EST
OC_OST RO
OC_KOLOR
OC_GŁOS
OC_OBSŁU
OC_NIEZA
OC_P_T
OC_NOWOC
OC_JAK
OC_SERW
OC_MARKA
Liczba czynników – przyjmowana arbitralnie
• Wartość własna >1
• Metoda procentu wariancji wyjaśnianej
przez
czynniki wspólne (badacz z góry przyjmuje procent
wariancji wyjaśnianej przez czynniki, przy czym ostatni
tłumaczy co najmniej 5% wariancji)
• Metoda testu osypiska
(należy znaleźć punkt
załamania krzywej, od którego rozpoczyna się
rumowisko)
• Metoda najsłabszej dolnej granicy
(WLB) zwana
też regułę Kaisera-Guttmana
• Metoda najsilniejszej dolnej granicy
(SLB)
Analiza hierarchiczna
1
2
3
1 1,000000
0,742638
0,619549
2 0,742638
1,000000
0,728444
3 0,619549
0,728444
1,000000
Skupien.
- 1
Skupien.
- 2
Skupien.
- 3
W1
-0,83297
-0,87488
-0,820995
P1
0,553319 0,000000
0,000000
P2
0,000000 0,484344
0,000000
P3
0,000000
0,000000
0,570935
Wtórne -
1
Pierw. -
1
Pierw. -
2
Pierw. -
3
CENA
0,33194
-0,15087
0,09379
0,27097
ESTETYKA
0,68548
-0,02295
0,18091
0,27346
OSTROŚĆ OBRAZU
0,794019
-0,06487
0,49416
-0,00065
KOLORYSTYKA
0,74657
0,01113
0,52392
-0,15058
BARWA GŁOSU
0,744715
0,21394
0,25687
-0,02876
OBSŁUGA
0,488586
0,19457
0,03904
0,08702
NIEZAWODNOŚĆ
0,32469
0,46900
0,00912
-0,27664
PARAMETRY
TECHN.
0,348744
0,31338
-0,09003
0,02754
NOWOCZESNOŚĆ
0,605026
0,34419
-0,03022
0,09838
JAKOŚĆ
0,575862
0,39653
0,07480
-0,10862
SERWIS
0,401716
0,04021
-0,11127
0,37705
MARKA
0,72330
0,44948
-0,03500
0,07640
Dziękuję za uwagę