Rozdział VI
ANALIZA CZYNNIKOWA
6.1. Wprowadzenie
Analiza czynnikowa jest metodą badania struktury wewnętrznych zależności obserwacji wielowymiarowych. Zakłada się w niej, że każdą zmienną obserwowalną (wejściową) można przedstawić jako kombinację liniową pewnej liczby nieobserwowalnych zmiennych, zwanych czynnikami, wspólnych dla całego zbioru zmiennych wejściowych oraz jednego nieobserwowalnego czynnika swoistego dla tej zmiennej. Jednocześnie czynniki wspólne i czynniki swoiste nie są ze sobą skorelowane. Założenia te dają podstawę do podziału wariancji każdej zmiennej wejściowej (będącej miarą jej zasobu informacyjnego o badanym zjawisku) na wariancję wyjaśnianą przez czynniki wspólne i wariancję wyjaśnianą przez czynnik swoisty. Celem analizy czynnikowej jest znalezienie takiego zbioru czynników wspólnych oraz określenie ich relacji ze zmiennymi obserwowalnymi, który pozwala na wyjaśnienie struktury powiązań między zmiennymi obserwowalnymi.
Za prekursora analizy czynnikowej uważany jest C. Spearman (1904). Jako pierwszy sformułował on na gruncie psychologii hipotezę, że zmienne obserwowalne można przedstawić jako funkcje liniowe jednego czynnika wspólnego oraz zbioru czynników swoistych, z których każdy charakteryzuje jedyną w swoim rodzaju właściwość jednej ze zmiennych obserwowalnych. L. Thurston (1945) rozwinął model zaproponowany przez Spearman'a włączając do niego wiele czynników wspólnych oraz proponując metodę, znaną jako metoda centroidalna, szacunku współczynników poszczególnych czynników (zwanych ładunkami czynnikowymi) w modelu liniowym, w oparciu o macierz korelacji pomiędzy zmiennymi wejściowymi. Znaczący wkład w rozwój metody czynnikowej ma D. N. Lawley (1940), który zakładając normalny rozkład wejściowych zmiennych losowych przeprowadził szacunek ładunków czynnikowych za pomocą metody największej wiarygodności, eliminując niedogodności metody centroidalnej. Analiza czynnikowa był następnie rozwijana w różnych ośrodkach naukowych (Anderson i Rubin, 1956; Harman, 1960; Morrison 1990). W polskiej literaturze jest szeroko prezentowana m. in. w pracach W. Pluty (1977, 1986), A. Zeliasia i in. (1991), K. Jajugi (1993), w pracach zbiorowych pod redakcją W. Ostasiewicza (1998) oraz E. Gatnara i M. Walesiaka (2004).
6.2. Algorytm analizy czynnikowej
Punktem wyjścia analizy czynnikowej, tak samo jak i analizy głównych składowych, jest budowa macierzy danych wejściowych (5.1). Zakłada się przy tym, że każda ze zmiennych wejściowych ma rozkład normalny. Każdą ze zmiennych wejściowych, po ich uprzednim wystandaryzowaniu, przedstawia się tutaj jako kombinację liniową nie wyłącznie zmiennych nieobserwowalnych zwanych czynnikami wspólnymi (głównymi), przenoszącymi informacje wspólne dla zmiennych wejściowych, ale także pojedynczej zmiennej zwanej czynnikiem swoistym (specyficznym), przenoszącym informacje zawarte wyłącznie w tej zmiennej wejściowej i nie powielane przez inne zmienne wejściowe.
Zależność tą można przedstawić następująco (Harman, 1960, s. 13):
, (6.1)
gdzie:
- macierz ładunków czynnikowych czynników wspólnych (n x s), przy czym wjl jest ładunkiem czynnikowym znajdującym się przy j-tej zmiennej i l-tym czynniku wspólnym,
- macierz czynników wspólnych (s x n), przy czym fli jest wartością l-tego czynnika wspólnego w i-tym obiekcie,
- macierz diagonalna ładunków czynnikowych czynników swoistych (n x m), przy czym bj jest ładunkiem czynnikowym j-tego czynnika swoistego,
- macierz czynników swoistych (n x m), przy czym uij jest wartością j-tego czynnika swoistego w i-tym obiekcie.
Zakłada się, że zarówno czynniki wspólne jak i czynniki swoiste nie są między sobą skorelowane. Innymi słowy wariancję (zasób informacyjny) każdej ze zmiennej wejściowej można rozłożyć na wariancję wyjaśnianą przez czynniki wspólne (zasoby informacyjne danej zmiennej wejściowej wspólne z zasobami informacyjnymi innych zmiennych wejściowych) oraz przez czynnik swoisty (zasoby informacyjne tej zmiennej wejściowej nie powielane przez inne zmienne wejściowe):
, j=1,2,...,m (6.2)
gdzie:
- zasoby zmienności wspólnej j-tej zmiennej,
- zasoby zmienności swoistej j-tej zmiennej.
W analizie czynnikowej dąży się do eliminacji wpływu czynników swoistych na rzecz czynników wspólnych, co jest równoważne z minimalizacją wpływu na kształtowanie się wartości zmiennych wejściowych wszystkich innych zmiennych poza czynnikami wspólnymi. Eliminacja tego wpływu odbywa się poprzez zastąpienie w macierzy korelacji R współczynników korelacji znajdujących się na głównej przekątnej (współczynników korelacji, których wartości są równe 1), zasobami zmienności wspólnej (wartościami najczęściej mniejszymi od 1). Uzyskujemy w ten sposób tzw. zredukowaną macierz korelacji o postaci:
, j,j'=1,2,...,m. (6.3)
Zasoby zmienności wspólnej szacowane są za pomocą różnych metod, przy czym najczęściej stosowane są formuły (Thurston, 1945; Zakrzewska, 1994):
średnia arytmetyczna współczynników korelacji danej zmiennej z innymi zmiennymi:
, j,j'=1,2,...,m; j≠j', (6.4)
maksymalna wartość bezwzględna z współczynników korelacji danej zmiennej z innymi zmiennymi:
, j,j'; j,j'=1,2,...,m; j≠j', (6.5)
współczynnik determinacji wielorakiej danej zmiennej z innymi zmiennymi:
, j=1,2,...,m, (6.6)
gdzie:
x'=[xj'], j'=1,2,...,m; j≠j', (6.7)
formuła triad:
, j,j',j”=1,2,...,m; j≠j'≠j'', (6.8)
gdzie:
- najwyższe wartości współczynników korelacji j-tej zmiennej z innymi zmiennymi.
Ostatecznie układ równań (6.1) sprowadza się do postaci:
. (6.9)
Zredukowana macierz korelacji stanowi podstawę do wyznaczenia parametrów zwanych ładunkami czynnikowymi w kolejnych równaniach modelu (6.9) w oparciu o zależność:
. (6.10)
6.3. Metody szacunku ładunków czynnikowych
Istnieje szereg metod wyznaczania ładunków czynnikowych. Ich opis możemy znaleźć m. in. w opracowaniach J. O. Kima i C. W. Muellera (1978), M. Zakrzewskiej (1994) oraz pracy pod redakcją E. Gatnara i M. Walesiaka (2004). W naszej prezentacji koncentrujemy się na metodach zawartych w pakiecie STATISTICA, które są najczęściej stosowane w praktyce.
6.3.1. Metoda osi głównych
Metoda osi głównych jest stosowana przy wyznaczaniu współczynników głównych składowych. Jedyną różnicą, w stosunku do procedury stosowanej w analizie głównych składowych, jest tutaj operowanie w miejsce pełnej macierzy korelacji zredukowaną macierzą korelacji, w której na głównej przekątnej zamiast jedynek znajdują się wartości zasobów zmienności wspólnej kolejnych zmiennych wejściowych.
6.3.2. Metoda centroidalna
Metoda centroidalna, zaproponowana przez L. Thurston'a (1945), jest najstarszą metodą wyznaczania ładunków czynnikowych. Opiera się ona na geometrycznym podejściu do analizy czynnikowej. Kolumny macierzy danych wejściowych można interpretować w ujęciu geometrycznym jako konfigurację m-wektorów zmiennych w n-wymiarowej przestrzeni euklidesowej R. Wzajemny układ wektorów, reprezentujących zmienne, określa korelacje pomiędzy zmiennymi, tzn. cosinusy kątów między wektorami są równe współczynnikom korelacji pomiędzy zmiennymi. W metodzie centroidalnej zakłada się, że osie poszczególnych czynników przechodzą przez środki ciężkości (centroidy) konfiguracji wektorów. Sposób wyznaczania osi czynnikowych jest tutaj podobny jak w metodzie osi głównych, a mianowicie kolejne czynniki wyjaśniają maksymalną część zmienności wspólnej zmiennych wejściowych. Metody te różnią się natomiast sposobem wyodrębniania czynników.
Wartości ładunków czynnikowych stanowią współrzędne punktów reprezentujących zmienne w nowym, ortogonalnym układzie odniesienia. W pierwszym kroku szukane są ładunki czynnikowe pierwszego czynnika, którego udział w wyjaśnianiu zasobów wspólnych zmienności jest największy. Od strony geometrycznej oznacza to, że oś czynnikowa pierwszego czynnika przechodzi przez środek ciężkości punktów reprezentujących zmienne. Można wykazać (Statystyczne metody..., 1998, s. 221), że ładunki pierwszego czynnika obliczamy w oparciu o wzór:
, j=1,2,...,m. (6.11)
Po wyznaczeniu ładunków pierwszego czynnika tworzymy, podobnie jak w metodzie głównych składowych, macierz pozostałości korelacyjnych, która stanowi podstawę wyznaczania ładunków czynnikowych drugiego z czynników. Jednakże w uzyskanej macierzy pozostałości korelacyjnych sumy jej elementów po wierszach i po kolumnach są równe zeru co uniemożliwia bezpośrednie obliczenie ładunków czynnikowych. Najpierw należy dokonać odwrócenia znaków algebraicznych w wybranej kolumnie i wierszu macierzy. Zmiany znaków dokonujemy w kolejnych wierszach i kolumnach aż do uzyskania najmniejszej liczby znaków ujemnych w całej macierzy pozostałości korelacyjnych. Procedura zmiany znaków algebraicznych jest procedurą podlegającą w dużym stopniu subiektywnym ocenom, co wpływa na możliwość otrzymywania niejednoznacznych wyników. Następnie umieszczamy na głównej przekątnej ponownie wyznaczone zasoby zmienności wspólnej, obliczamy ładunki czynnikowe drugiego czynnika oraz przywracamy pierwotne znaki tych zmiennych, dla których wcześniej zostały dokonane zmiany znaków. Ładunki czynnikowe kolejnych czynników obliczamy w analogiczny sposób.
6.3.3. Metoda największej wiarygodności
Metoda największej wiarygodności została zaproponowana przez D. N. Lawley'a (1940). W metodzie tej zakładamy na wstępie liczbę czynników wspólnych, którą chcemy uzyskać. Przyjmujemy także, że dane wejściowe pochodzą z próby o wielowymiarowym rozkładzie normalnym. Ładunki czynnikowe wyznaczane są w taki sposób aby zmaksymalizować prawdopodobieństwo wyjaśniania przez model współczynników korelacji w wejściowej, obserwowalnej macierzy korelacji.
Istnieje szereg procedur wyznaczania czynników za pomocą metody największej wiarygodności. Jako najlepsza z nich wskazywana jest procedura zaproponowana przez K. G. Jöreskoga (1967). Ładunki czynnikowe są tutaj szacowane, podobnie jak w metodzie osi głównych, poprzez rozwiązanie równania charakterystycznego o postaci (Metody statystycznej..., 2004, s. 205):
, (6.12)
gdzie
jest definiowana jako (Kim i Mueller, 1978, s. 25):
(6.13)
przy czym:
U2 - macierz wariancji czynników specyficznych szacowana w kolejnych iteracjach.
Wariancja specyficzna traktowana jest tutaj jako wariancja błędu, który minimalizujemy maksymalizując jednocześnie odtworzenie elementów wejściowej macierzy korelacji przez szacowane ładunki czynnikowe. We wstępnej iteracji, szacując macierz zredukowaną
, stosujemy metodę osi głównych.
6.3.4. Metoda najmniejszych reszt (MINRS)
Metoda najmniejszych reszt została zaproponowana przez H. H. Harmana i W. H. Jonesa (1996). W metodzie tej szacujemy ładunki czynnikowe kolejnych czynników minimalizując sumę kwadratów odchyleń zaobserwowanych wartości współczynników korelacji pomiędzy zmiennymi wejściowymi od wartości tych współczynników odtworzonych przez przyjęty zbiór czynników:
, (6.14)
przy założeniu:
, j=1,2,...,m. (6.15)
W praktyce oznacza to konieczność ustalenia liczby czynników, które zdecydujemy się wykorzystać w analizie.
6.4. Interpretacja geometryczna
Interpretacja geometryczna analizy czynnikowej jest podobna jak analizy głównych składowych. Podstawowe różnice wynikają z operowania w analizie czynnikowej zredukowaną macierzą korelacji
, w której na głównej przekątnej znajdują się zasoby zmienności wspólnej zamiast pełnych zasobów zmienności jak ma to miejsce w analizie głównych składowych. Elementy tej macierzy wyznaczają konfigurację wektorów zmiennych charakteryzujących poszczególne obiekty. Długości tych wektorów są, w odróżnieniu od metody głównych składowych, mniejsze od jedności gdyż nie uwzględniamy zasobów zmienności swoistej. Ponadto kąty między wektorami zmiennych w przestrzeni czynników wspólnych (w analizie czynnikowej) są mniejsze niż w przestrzeni czynników wspólnych i specyficznych (w analizie głównych składowych).
6.5. Metody rotacji czynników
Uzyskany, w wyniku stosowania przedstawionych wcześniej metod szacunku ładunków czynnikowych, zbiór czynników nie jest jedynym możliwym układem czynnikowym przy ustalonej wcześniej wielkości zasobów zmienności wspólnej. Tą samą zredukowaną macierz korelacji możemy odtworzyć za pomocą nieskończenie wielu różnych macierzy ładunków czynnikowych otrzymanych w wyniku obrotu (rotacji) układu osi czynnikowych dookoła swojego początku, przy czym, co należy jeszcze raz podkreślić, udział czynników w wyjaśnianiu wspólnej wariancji (suma ich zasobów informacyjnych) nie ulega w wyniku rotacji zmianie.
Podstawowym celem rotacji układu osi czynnikowych jest uzyskanie jak najprostszej interpretacji poszczególnych czynników. Kryteria prostoty czynnikowej, tzw. prostej struktury ładunków czynnikowych, zostały sformułowane przez L. L. Thurston'a (1945). Prowadzą one do wyodrębnienia rozłącznych grup zmiennych wejściowych, z których każda zawiera zmienne o wysokich ładunkach dla jednego czynnika, średnie dla kilku innych czynników oraz bliskie zeru dla pozostałych czynników.
Możemy wyróżnić dwie grupy metod rotacji czynników, a mianowicie rotacje ortogonalne oraz rotacje ukośne.
6.5.1. Rotacje ortogonalne
Metody rotacji ortogonalnych polegają na poszukiwaniu ortogonalnej macierzy transformacji spełniającej warunek (Zeliaś i in., 1991, s. 161):
, (6.16)
gdzie:
B=[bjl] - macierz ładunków czynnikowych (m x s) po rotacji osi czynnikowych,
T=[tll'] - macierz transformacji (s x s).
Elementy macierzy transformacji określają wielkość kątów, o jakie należy obrócić układ osi czynnikowych. Ponieważ w wyniku przekształcenia (6.16) zasoby zmienności wspólnej poszczególnych zmiennych wejściowych nie ulegają zmianie, zachodzi następująca zależność:
, j=1,2,...,l (6.17)
Zachodzi również równość o postaci (Dobosz, 2001, s. 291):
, (6.18)
określona jako niezmiennik transformacji ortogonalnej.
Powyższa równość wskazuje, że maksymalizacja jednego z jej składników prowadzi do minimalizacji drugiego składnika.
Do najczęściej stosowanych metod rotacji ortogonalnej należą (Dobosz, 2001; Zakrzewska, 1994; Metody statystycznej..., 2004) quartimax, varimax i equamax. W kryterium quartimax (Carrol, 1953; Neahaus i Wrigley, 1954) przeprowadzamy rotację osi czynnikowych minimalizując wartość składnika P i jednocześnie maksymalizując składnik Q, czyli dążymy do prostej struktury maksymalizując wariancję kwadratów ładunków czynnikowych dla każdej zmiennej:
(6.19)
Metoda ta prowadzi do maksymalizacji wartości dużych ładunków czynnikowych oraz minimalizacji małych ładunków czynnikowych. Przedstawione kryterium quartimax nazywane jest surowym, gdyż nadaje większą wagę zmiennym mającym większy udział w zasobach zmienności wspólnej.
Kryterium varimax stanowi modyfikację metody quartimax (Kaiser, 1958; Harman, 1960). Miarą prostoty danego czynnika jest wyrażenie o postaci:
, l=1,2,...s. (6.20)
Dany czynnik odznacza się największą interpretowalnością (prostotą) gdy powyższe wyrażenie (wariancja kwadratów ładunków czynnikowych l-tego czynnika) przyjmuje wartość maksymalną, co odpowiada sytuacji, że jego ładunki czynnikowe dla zmiennych wejściowych albo dążą do jedności, albo do zera. Tym samym rotacja osi czynnikowych, prowadząca do prostej struktury czynnikowej, jest tak dokonywana aby zmaksymalizować sumę wariancji kwadratów ładunków czynnikowych wszystkich czynników:
. (6.21)
Obok kryteriów surowych quartimax oraz varimax stosowane są kryteria znormalizowane. Normalizacja ładunków czynnikowych prowadzi do neutralizacji większego wpływu na uzyskiwane rozwiązania czynników początkowych o dużych wartościach. Normalizacja przebiega według formuły:
, j=1,2,...m; l=1,2,...s. (6.22)
Ostatecznie kryterium znormalizowanego quartimax przyjmuje postać:
(6.23)
Natomiast kryterium znormalizowanego varimax przybiera postać:
(6.24)
Od strony technicznej kryterium quartimax koncentruje się na upraszczaniu wierszy macierzy ładunków czynnikowych, a kryterium varimax na upraszczaniu kolumn tej macierzy.
Kolejne dwa kryteria biquartimax i equamax łączą odpowiednio ważone warunki quartimax i varimax, co możemy zapisać:
, (6.25)
gdzie:
α,β - wagi.
Po przemnożeniu przez liczbę zmiennych m kryterium to przyjmuje ogólną postać (Metody statystycznej..., 2004, s. 214; Kim i Mueller 1978, s. 36):
, (6.26)
gdzie:
.
Przy przyjęciu wag jednostkowych dla obu kryteriów, tzn. dla γ=0,5, otrzymujemy surowe kryterium biquartimax o postaci:
(6.27)
Natomiast wersja znormalizowana kryterium biquartimax może być przedstawiona następująco:
. (6.28)
Jeżeli przyjmiemy, że waga dla surowego kryterium quartimax jest jednostkowa, a waga dla surowego kryterium varimax równa jest połowie liczby czynników, tzn. dla
, equamax ma postać:
. (6.29)
Poprzez analogię do normalizacji poprzednich kryteriów znormalizowane kryterium equamax zapisujemy jako:
. (6.30)
6.5.2. Rotacje ukośne
W rotacji ukośnej nie zakładamy ortogonalności czynników (Kim i Mueller, 1978; Metody statystycznej..., 2004). Interpretacja czynników ukośnych często jest trudna w praktyce, gdyż w rotacji ukośnej zakłada się skorelowanie czynników. W procedurach rotacji ukośnej wyznaczane są grupy zmiennych wejściowych, które reprezentują poszczególne wymiary przestrzeni czynnikowej. Przy idealnej strukturze prostej każdy czynnik powinien mieć znaczące (różne od zera) wartości ładunków czynnikowych tylko dla jednej grupy zmiennych wejściowych oraz zerowe dla pozostałych grup zmiennych. Innymi słowy każda grupa zmiennych (a ściślej punkty ją reprezentujące) posiada niezerowe rzuty tylko na jedną oś odniesienia. Kryterium w rotacji ukośnej będącym odpowiednikiem kryterium ortogonalnego quartimax, jest quartimin. Surowe kryterium quartimin możemy zdefiniować następująco:
, (6.31)
gdzie:
ajl, ajl' - współczynniki korelacji liniowej pomiędzy j-tą zmienną wejściową i odpowiednio l-tym i l'-tym czynnikiem.
Ponieważ w rotacji ukośnej zakładamy korelację czynników współczynniki korelacji w wyrażeniu (6.31) nie są równe ładunkom czynnikowym (Harman, 1960). Kryterium (6.31) można również, analogicznie jak kryterium w rotacji ortogonalnej, przedstawić w formie znormalizowanej.
Modyfikacja quartimin prowadzi do sformułowania kryterium covarimin lub biquartimin o postaci:
(6.32)
Jest ono odpowiednikiem kryterium varimax w rotacji ortogonalnej.
Kombinacja liniowa kryteriów (6.31) oraz (6.32) prowadzi do sformułowania ogólnego kryterium o postaci:
. (6.33)
Po przemnożeniu przez liczbę zmiennych m oraz założeniu, że
uzyskujemy ogólne kryterium indirect oblimin (Harman, 1960, s. 324; Kim i Mueller, 1978, s. 38; Metody statystycznej..., 2004, s. 215):
. (6.34)
Parametr γ jest nazywany wskaźnikiem skośności. W sytuacji gdy γ=0 uzyskujemy kryterium quartimin (najbardziej ukośne), przy γ=0,5 otrzymujemy kryterium biquartimin (mniej ukośne), a przyjęcie γ=1 prowadzi do kryterium covarimin (najmniej ukośne). Możemy także uzyskiwać poprzez normalizację ładunków czynnikowych, analogicznie jak w przypadku rotacji ortogonalnych, znormalizowane kryterium indirect oblimin.
Kryteria oparte na formule indirect oblimin prowadzą do uproszczenia ładunków czynnikowych względem osi odniesienia. Innego typu grupę kryterium, tzw. direct oblimin, tworzą rotacje ukośne dążące do uproszczenia struktury ładunków czynnikowych względem czynników (Kim i Mueller, 1978, s. 39; Metody statystycznej..., 2004, s. 216):
. (6.35)
Współczynnik δ jest współczynnikiem skośności, pozwalającym uzyskać mniej (przy mniejszych wartościach δ) lub bardziej (przy większych wartościach δ) skośne rozwiązanie.
Przedstawione kryteria rotacji są najczęściej stosowane w praktyce, jednakże nie wyczerpują wszystkich rozwiązań w tym zakresie (Browne, 2001).
6.6. Określanie liczby czynników
Decyzja co do liczby czynników wykorzystywanych w ostatecznej analizie jest, podobnie jak w analizie głównych składowych, decyzją o charakterze subiektywnym. Podejmując ją możemy korzystać z różnych technik wspomagających, które zostały przedstawione przy prezentacji metody głównych składowych (por. rozdz. 5.4).
Poza tymi technikami, szacując ładunki czynnikowe metodą największej wiarygodności można zweryfikować hipotezę, że przy przyjętej liczbie czynników zaproponowany przez nas model wystarczająco dokładnie odtwarza współczynniki korelacji między zmiennymi wejściowymi. W tym celu wykorzystujemy statystykę chi-kwadrat o postaci (Morrison, 1990, s. 463 i 464):
, (6.36)
gdzie:
S - macierz kowariancji pomiędzy zmiennymi wejściowymi,
,
o liczbie stopni swobody równej:
.
Zwykle weryfikacja odpowiedniej hipotezy odbywa się w sposób interacyjny począwszy od modelu z jednym czynnikiem. W przypadku nieadekwatywności tego modelu zwiększamy liczbę czynników o 1. Przedstawiony test wymaga operowania dużą próbą.
6.7. Interpretacja wyników
Interpretacja wyników uzyskanych za pomocą klasycznej analizy czynnikowej jest analogiczna jak w przypadku analizy głównych składowych. Należy jedynie pamiętać, że czynniki wspólne uwzględniane ostatecznie w analizie przenoszą wyłącznie zasoby zmienności wspólnej zmiennych wejściowych.
Przykład 6.1
Praktyczne zastosowanie klasycznej analizy czynnikowej zostało przedstawione na przykładzie badania 242 gmin miejskich (wszystkie gminy miejskie w Polsce z wyłączeniem gmin będących jednocześnie powiatami grodzkimi) charakteryzowanych przez wartości wybranych zmiennych w 2005 r. Wejściowy zbiór zmiennych charakteryzujących gminy, był identyczny jak w przykładzie 5.1 i miał następującą postać:
C11.1 - liczba mieszkań ogółem na 1 mieszkańca,
E13.1 - liczba gimnazjów dla dzieci i młodzieży na 100 osób w wieku 13-15 lat,
K1.1 - udział powierzchni użytków rolnych w powierzchni gminy ogółem,
N1.1 - liczba jednostek (firm) zarejestrowanych w systemie REGON,
O1.1 - dochody budżetu gminy w tys. zł na osobę.
Zmienne powyższe zostały poddane standaryzacji. Fragment arkusza zawierającego wartości tych zmiennych przedstawiono na rysunku 6.1.
Rys. 6.1. Fragment tablicy z danymi do Przykładu 6.1.
W analizie wykorzystano pakiet STATISTICA. Moduł analityczny został uruchomiony poprzez wybranie z menu Statystyka opcji Wielowymiarowe techniki eksploracyjne/Analiza czynnikowa (rys. 6.2).
Rys. 6.2. Opcje modułu Wielowymiarowe techniki eksploracyjne.
W efekcie na ekranie pojawia się wstępne okno modułu analizy czynnikowej (rys. 6.3).
Rys. 6.3. Wstępne okno modułu analizy czynnikowej.
Klikając klawisz Zmienne otwieramy okno Wybierz zmienne do analizy, w którym wybieramy zmienne do analizy (rys. 6.4).
Rys. 6.4. Okno wyboru zmiennych do analizy.
Wybór akceptujemy klawiszem OK. Jednocześnie pozostawiamy wybraną domyślnie postać wejściowego pliku danych Dane surowe, gdyż nasze dane mają postać pliku danych STATISTICA (rys. 6.5).
Rys. 6.5. Okno analizy czynnikowej z przyjętymi założeniami.
Nasze wybory akceptujemy klawiszem OK.
Na ekranie pojawia się okno Metoda wyodrębniania czynników (rys. 6.6).
Rys. 6.6. Okno Metoda wyodrębniania czynników.
W górnej części okna znajdują się podstawowe dane podsumowujące dotychczasową analizę. W oknie mamy ponadto do wyboru trzy karty: Podstawowe, Więcej i Statystyki opisowe. Klikając klawisz Statystyki opisowe uzyskujemy możliwość przeglądania podstawowych statystyk opisowych (rys. 6.7).
Rys. 6.7. Karta ze statystykami opisowymi.
Najbardziej istotnym ich elementem jest macierz korelacji pomiędzy zmiennymi którą uzyskujemy najpierw klikając klawisz Przegląd korelacji, średnich i odchyleń standardowych, a następnie po otwarciu okna przedstawionego na rysunku 6.8 klawisz Korelacje.
Rys. 6.8. Okno Przegląd statystyk opisowych.
Otrzymana macierz korelacji zawiera współczynniki korelacji liniowej pomiędzy zmiennymi wejściowymi (rys. 6.9).
Rys. 6.9. Macierz współczynników korelacji pomiędzy zmiennymi charakteryzującymi gminy.
Czy wyższe wartości bezwzględne współczynników korelacji tym lepszy efekt da zastosowanie analizy czynnikowej.
W wyniku zastosowania analizy czynnikowej możemy uzyskać maksymalnie pięć czynników. W decyzji ile ostatecznie czynników wybrać do analizy pomoże nam zastosowanie kryteriów Kaisera i testu osypiska.
Na wstępie wybieramy metodę szacunku ładunków czynnikowych. Na karcie Więcej w oknie Metoda wyodrębniania czynników (rys. 6.6) mamy do wyboru następujące metody:
Składowe główne - Metoda ta została przedstawiona w rozdz. 5.2. W procedurze przyjmujemy, że zasoby zmienności wspólnej, znajdujące się na przekątnej macierzy korelacji, równe są 1.
Czynniki główne - zasoby zmienności wspólnej = wielorakie R2. Zasoby zmienności wspólnej są szacowane jako współczynniki determinacji cząstkowej danej zmiennej wejściowej z pozostałymi zmiennymi.
Czynniki główne - iterowane zasoby zmienności wspólnej (MINERS). Metoda została przedstawiona w rozdz. 6.3.4.
Czynniki główne - czynniki największej wiarygodności. Metoda została przedstawiona w rozdz. 6.3.3. Ponieważ w metodzie tej zakładamy z góry liczbę czynników jaką wykorzystany w analizie musimy ją wpisać w pole Maksymalna liczba czynników. Ponadto aby nie nakładać innych ograniczeń na liczbę czynników, wpisujemy w pole Minimalna wartość własna wartość 0. W naszym przykładzie testowanie minimalnej liczby czynników zaczynamy od jednego czynnika (rys. 6.10).
Rys. 6.10. Okno Metoda wyodrębniania czynników z wybraną opcją Czynniki największej wiarygodności.
Dokonane wybory akceptujemy klawiszem OK. Po wyborze tej metody wyodrębniania czynników pojawia się okno Wyniki analizy czynnikowej z otwartą kartą Wyjaśniana wariancja (rys. 6.11).
Rys. 6.11. Karta Wyjaśniana wariancja.
W oknie tym mamy możliwość weryfikacji hipotezy przy jakiej liczbie czynników zaproponowany przez nas model analizy czynnikowej wystarczająco dokładnie odtwarza współczynniki korelacji między zmiennymi wejściowymi. Wyniki weryfikacji uzyskujemy w tablicy Dobroć dopasowania klikając na karcie Wyjaśniana wariancja klawisz Test dobroci dopasowania. Przy wyborze jednego czynnika tablica ta ma postać jak na rysunku 6.12.
Rys. 6.12. Tablica z wynikami testu dobroci dopasowania przy wyborze jednego czynnika.
Przy poziomie istotności większym od krytycznego poziomu istotności p*=0,000000 odrzucamy hipotezę zerową co jest tożsame ze stwierdzeniem, że jeden czynnik jest niewystarczający do odtworzenia korelacji pomiędzy zmiennymi wejściowymi. Zwiększając na karcie Więcej w oknie Metoda wyodrębniania czynników maksymalną liczbę czynników do dwóch, uzyskujemy tablicę z wynikami testu przedstawioną na rysunku 6.13.
Rys. 6.13. Tablica z wynikami testu dobroci dopasowania przy wyborze dwóch czynników.
Przy poziomie istotności mniejszej od krytycznego poziomu istotności p*=0,107946 nie ma podstaw do odrzucenia hipotezy zerowej mówiącej, że dwa czynniki wystarczająco dokładnie odtwarzają korelacje pomiędzy zmiennymi wejściowymi.
Czynniki główne - metoda centroidalna. Metoda ta została przedstawiona w rozdz. 6.3.2. Wybierając metodę centroidalną w polu Maksymalna liczba iteracji wpisujemy liczbę iteracji, w których szacujemy zasoby zmienności wspólnej zmiennych wejściowych. Szacunek możemy zakończyć także w momencie gdy nie osiągniemy podanej liczby iteracji, a uzyskamy w danej iteracji zmianę zasobów zmienności wspólnej, w stosunku do poprzedniej iteracji, mniejszą niż wartość podana w polu Minimalna zmiana w zasobach zmienności wspólnej (rys. 6.14).
Rys. 6.14. Okno Metoda wyodrębniania czynników z wybraną opcją Metoda centroidalna.
Czynniki główne - metoda osi głównych. Metoda ta została przedstawiona w rozdz. 6.3.1.
W przypadku wyboru tej metody musimy przyjąć dodatkowe założenia jak w metodzie centroidalnej (rys. 6.15).
Rys. 6.15. Okno Metoda wyodrębniania czynników z wybraną opcją Metoda osi głównych.
Do dalszej analizy wybieramy metodę centroidalną. Akceptujemy dokonane wybory klawiszem OK otrzymując okno Wyniki analizy czynnikowej (rys. 6.16).
Rys. 6.16. Okno Wyniki analizy czynnikowej z otwartą kartą Wyjaśniana wariancja.
Przyjęte ustawienia umożliwiają uzyskanie maksymalnej liczby czynników celem poddania ich dalszej analizie. W oknie tym na karcie Wyjaśniana wariancja mamy możliwość wykorzystania wspomnianych kryteriów ustalenia ostatecznej liczby czynników do dalszej analizy. Na karcie uruchamiamy klawisz wartości własne otrzymując tablicę zawierającą wartości własne czynników, procenty sumy wariancji zmiennych wejściowych wyjaśniane przez kolejne czynniki oraz skumulowane wartości własne czynników i skumulowane sumy wariancji zmiennych wejściowych wyjaśniane przez kolejne czynniki (rys. 6.17).
Rys. 6.17. Tablica z wartościami i skumulowanymi wartościami własnymi czynników oraz procentami sumy wariancji i skumulowanymi procentami sumy wariancji.
Kryterium Kaisera wskazuje, że do dalszej analizy należy wykorzystać tylko pierwszy czynnik, którego wartość własna jest większa od 1. Czynnik ten przenosi tylko około 34% informacji zawartych w zmiennych wejściowych (sumy wariancji zmiennych wejściowych). Klikając klawisz Wykres osypiska otrzymujemy wykres liniowy wartości własnych (rys. 6.18).
Rys. 6.18. Wykres osypiska.
Osypisko na wykresie zaczyna się od wartości własnej trzeciego czynnika, co sugeruje przyjęcie do dalszej analizy trzech czynników. Ostatecznie decydujemy się kontynuować analizę przy dwóch czynnikach. Wyjaśniają one łącznie prawie 53% zmienności zmiennych wejściowych (rys. 6.17). Klikamy klawisz Anuluj i wracamy do okna Metoda wyodrębniania czynników, w którym zmieniamy Maksymalną liczbę czynników z 5 na 2 (rys. 6.19).
Rys. 6.19. Okno Metoda wyodrębniania czynników z wybranymi opcjami Metoda centroidalna i Maksymalna liczba czynników równa 2.
Na ekranie otrzymujemy ponownie okno Wyniki analizy czynnikowej (rys. 6.20).
Rys. 6.20. Okno Wyniki analizy czynnikowej z otwartą kartą Wyjaśniana wariancja.
W górnej części okna umieszczone są wybrane, podstawowe wyniki analizy przy przyjętych założeniach, które znajdują się także w szczegółowych tablicach wyników analizy. W oknie tym na karcie Wyjaśniana wariancja klikamy klawisz Zasoby zmienności wspólnej. Otrzymujemy okno z wartościami zasobów zmienności wspólnej przenoszonymi przez dwa pierwsze czynniki, uwzględniane w dalszej analizie (rys. 6.21).
Rys. 6.21. Tablica z wartościami zasobów zmienności wspólnej czynników.
W dwóch pierwszych kolumnach tablicy znajdują się odsetki wariancji wspólnej poszczególnych zmiennych wejściowych wyjaśnianej przez pierwszy (pierwsza kolumna) oraz dwa pierwsze czynniki (druga kolumna). Przykładowo dwa pierwsze czynniki wyjaśniają ponad 62% wariancji wspólnej zmiennej O1.1 (przenoszą 62% informacji o badanych gminach zawartych w tej zmiennej, wspólnych z innymi zmiennymi). W kolejnych wierszach, w ostatniej kolumnie, mamy wartości współczynnika determinacji wielorakiej zmiennych wejściowych z dwoma pierwszymi czynnikami.
Klikając na karcie Wyjaśniona wariancja klawisz Korelacje resztowe/odtworzone otwieramy okno z dwoma tablicami (6.22).
Rys. 6.22. Tablice z odtworzonymi i resztowymi korelacjami pomiędzy zmiennymi wejściowymi.
Wartości w macierzy korelacji resztowych są różnicami pomiędzy korelacjami zmiennych wejściowych, a korelacjami odtworzonymi przez dwa pierwsze czynniki. Wartości na przekątnej tej macierzy wskazują na zasoby zmienności (zasoby informacji o badanych gminach) poszczególnych zmiennych wejściowych nie wyjaśniane przez dwa pierwsze czynniki (pierwiastek kwadratowy z jeden minus zasoby zmienności wspólnej przenoszonej przez dwa pierwsze czynniki). Poza przekątną znajdują się wartości współczynników korelacji liniowej pomiędzy zmiennymi wejściowymi, które nie zostały odtworzone przez dwa pierwsze czynniki. Wartości w macierzy korelacji odtworzonych są korelacjami pomiędzy zmiennymi wejściowymi, które są odtworzone przez dwa pierwsze czynniki.
Interpretacja czynników uwzględnionych w analizie dokonywana jest w oparciu o wartości ładunków czynnikowych. Dla otrzymania ładunków czynnikowych w oknie Wyniki analizy czynnikowej, na karcie Ładunki klikamy klawisz Podsumowanie: ładunki czynnikowe, otrzymując tabelę z wartościami ładunków czynnikowych dla dwóch pierwszych czynników (rys. 6.23).
Rys. 6.23. Tablica z wartościami ładunków czynnikowych przed rotacją.
Otrzymane ładunki czynnikowe są jednocześnie współczynnikami korelacji pomiędzy zmiennymi wejściowymi i czynnikami. Tym samym ich kwadraty (współczynniki determinacji) mówią nam jaka część wariancji wspólnej zmiennych wejściowych została wyjaśniona przez kolejne czynniki. Zmienne dla których wartości tych współczynników determinacji przekraczają 0,5 są wykorzystywane do interpretacji czynników. Odpowiednie wartości ładunków czynnikowych zostają zaznaczone w pakiecie STATISTICA kolorem czerwonym.
Uzyskana struktura ładunków czynników nie pozwala na interpretację drugiego czynnika. Sugeruje to zastosowanie rotacji osi czynnikowych w celu uzyskania prostej struktury ładunków czynnikowych, co powinno w efekcie ułatwić interpretację samych czynników. W tym celu w oknie Wyniki analizy czynnikowej na karcie: Podstawowe, rozwijamy pole Rotacja czynników otrzymując do wyboru następujące metody rotacji czynników: Varimax surowa, Varimax znormalizowana, Biquartimax surowa, Biquartimax znormalizowana, Quartimax surowa, Quartimax znormalizowana, Equamax surowa, Equamax znormalizowana. Wybieramy metodę Equamax znormalizowana (rys. 6.24).
Rys. 6.24. Karta Podstawowe z wybraną metodą rotacji czynników Equamax znormalizowana.
Następnie klikamy klawisz Podsumowanie: ładunki czynnikowe otrzymując nową macierz ładunków czynnikowych (rys. 6.25).
Rys. 6.25. Tablica z wartościami ładunków czynnikowych po rotacji.
Nowy układ ładunków czynnikowych pozwala na łatwiejszą interpretację czynników niż układ ładunków czynnikowych sprzed rotacji. Czynnik pierwszy reprezentuje zmienne C11.1, E13.1 oraz O1.1. Czynnik drugi przenosi natomiast przede wszystkim informacje zawarte w zmiennej wejściowej N1.1. Przyjmujemy uzyskany układ ładunków czynnikowych jako ostateczny i przechodzimy do dalszej analizy wyników.
Graficzną prezentację powiązań między zmiennymi wejściowymi, a czynnikami możemy uzyskać klikając na karcie Ładunki klawisz Wykres 2W ładunków czynnikowych (rys. 6.26).
Rys. 6.26. Wykres konfiguracji punktów reprezentujących zmienne w układzie dwóch pierwszych osi czynnikowych.
Na wykresie przedstawione są punkty reprezentujące zmienne wejściowe w układzie dwóch pierwszych osi czynnikowych. Współrzędnymi tych punktów są po prostu wartości ładunków czynnikowych dwóch pierwszych czynników.
Dla analizowanych gmin możemy obliczyć wartości czynników wybranych do analizy. W tym celu w oknie Wyniki analizy czynnikowej wybieramy kartę Wartości czynnikowe (rys. 6.27).
Rys. 6.27. Karta Wartości czynnikowe.
Na karcie tej klikamy klawisz Współczynniki czynników otrzymując tablicę wartości współczynników czynników umożliwiających obliczenie wartości dwóch pierwszych czynników dla każdej z badanych gmin (rys. 6.28).
Rys. 6.28. Tablica z wartościami współczynników czynników dla zmiennych wejściowych.
Klikając na tej samej karcie klawisz Wartości czynników otrzymujemy tablicę z wartościami dwóch pierwszych czynników dla wszystkich badanych gmin (rys. 6.29).
Rys. 6.29. Fragment tablicy z wartościami dwóch pierwszych czynników dla badanych gmin.
Model analizy czynnikowej (6.1) można przedstawić także w postaci układu liniowych równań regresji (Giri, 2004, s. 518):
, gdzie czynniki swoiste traktowane są jako błędy losowe, a u jest wektorem czynników swoistych.
Por. rozdz. 5.2.
Por. rozdz. 6.4.
Najczęściej odwracamy znaki w tej kolumnie i wierszu, w których ich liczba jest największa.
210