Przykład 6.1
Praktyczne zastosowanie klasycznej analizy czynnikowej zostało przedstawione na przykładzie badania 242 gmin miejskich (wszystkie gminy miejskie w Polsce z wyłączeniem gmin będących jednocześnie powiatami grodzkimi) charakteryzowanych przez wartości wybranych zmiennych w 2005 r. Wejściowy zbiór zmiennych charakteryzujących gminy, był identyczny jak w przykładzie 5.1 i miał następującą postać:
C11.1 - liczba mieszkań ogółem na 1 mieszkańca,
E13.1 - liczba gimnazjów dla dzieci i młodzieży na 100 osób w wieku 13-15 lat,
K1.1 - udział powierzchni użytków rolnych w powierzchni gminy ogółem,
N1.1 - liczba jednostek (firm) zarejestrowanych w systemie REGON,
O1.1 - dochody budżetu gminy w tys. zł na osobę.
Zmienne powyższe zostały poddane standaryzacji. Fragment arkusza zawierającego wartości tych zmiennych przedstawiono na rysunku 6.1.
Rys. 6.1. Fragment tablicy z danymi do Przykładu 6.1.
W analizie wykorzystano pakiet STATISTICA. Moduł analityczny został uruchomiony poprzez wybranie z menu Statystyka opcji Wielowymiarowe techniki eksploracyjne/Analiza czynnikowa (rys. 6.2).
Rys. 6.2. Opcje modułu Wielowymiarowe techniki eksploracyjne.
W efekcie na ekranie pojawia się wstępne okno modułu analizy czynnikowej (rys. 6.3).
Rys. 6.3. Wstępne okno modułu analizy czynnikowej.
Klikając klawisz Zmienne otwieramy okno Wybierz zmienne do analizy, w którym wybieramy zmienne do analizy (rys. 6.4).
Rys. 6.4. Okno wyboru zmiennych do analizy.
Wybór akceptujemy klawiszem OK. Jednocześnie pozostawiamy wybraną domyślnie postać wejściowego pliku danych Dane surowe, gdyż nasze dane mają postać pliku danych STATISTICA (rys. 6.5).
Rys. 6.5. Okno analizy czynnikowej z przyjętymi założeniami.
Nasze wybory akceptujemy klawiszem OK.
Na ekranie pojawia się okno Metoda wyodrębniania czynników (rys. 6.6).
Rys. 6.6. Okno Metoda wyodrębniania czynników.
W górnej części okna znajdują się podstawowe dane podsumowujące dotychczasową analizę. W oknie mamy ponadto do wyboru trzy karty: Podstawowe, Więcej i Statystyki opisowe. Klikając klawisz Statystyki opisowe uzyskujemy możliwość przeglądania podstawowych statystyk opisowych (rys. 6.7).
Rys. 6.7. Karta ze statystykami opisowymi.
Najbardziej istotnym ich elementem jest macierz korelacji pomiędzy zmiennymi którą uzyskujemy najpierw klikając klawisz Przegląd korelacji, średnich i odchyleń standardowych, a następnie po otwarciu okna przedstawionego na rysunku 6.8 klawisz Korelacje.
Rys. 6.8. Okno Przegląd statystyk opisowych.
Otrzymana macierz korelacji zawiera współczynniki korelacji liniowej pomiędzy zmiennymi wejściowymi (rys. 6.9).
Rys. 6.9. Macierz współczynników korelacji pomiędzy zmiennymi charakteryzującymi gminy.
Czy wyższe wartości bezwzględne współczynników korelacji tym lepszy efekt da zastosowanie analizy czynnikowej.
W wyniku zastosowania analizy czynnikowej możemy uzyskać maksymalnie pięć czynników. W decyzji ile ostatecznie czynników wybrać do analizy pomoże nam zastosowanie kryteriów Kaisera i testu osypiska.
Na wstępie wybieramy metodę szacunku ładunków czynnikowych. Na karcie Więcej w oknie Metoda wyodrębniania czynników (rys. 6.6) mamy do wyboru następujące metody:
Składowe główne - Metoda ta została przedstawiona w rozdz. 5.2. W procedurze przyjmujemy, że zasoby zmienności wspólnej, znajdujące się na przekątnej macierzy korelacji, równe są 1.
Czynniki główne - zasoby zmienności wspólnej = wielorakie R2. Zasoby zmienności wspólnej są szacowane jako współczynniki determinacji cząstkowej danej zmiennej wejściowej z pozostałymi zmiennymi.
Czynniki główne - iterowane zasoby zmienności wspólnej (MINERS). Metoda została przedstawiona w rozdz. 6.3.4.
Czynniki główne - czynniki największej wiarygodności. Metoda została przedstawiona w rozdz. 6.3.3. Ponieważ w metodzie tej zakładamy z góry liczbę czynników jaką wykorzystany w analizie musimy ją wpisać w pole Maksymalna liczba czynników. Ponadto aby nie nakładać innych ograniczeń na liczbę czynników, wpisujemy w pole Minimalna wartość własna wartość 0. W naszym przykładzie testowanie minimalnej liczby czynników zaczynamy od jednego czynnika (rys. 6.10).
Rys. 6.10. Okno Metoda wyodrębniania czynników z wybraną opcją Czynniki największej wiarygodności.
Dokonane wybory akceptujemy klawiszem OK. Po wyborze tej metody wyodrębniania czynników pojawia się okno Wyniki analizy czynnikowej z otwartą kartą Wyjaśniana wariancja (rys. 6.11).
Rys. 6.11. Karta Wyjaśniana wariancja.
W oknie tym mamy możliwość weryfikacji hipotezy przy jakiej liczbie czynników zaproponowany przez nas model analizy czynnikowej wystarczająco dokładnie odtwarza współczynniki korelacji między zmiennymi wejściowymi. Wyniki weryfikacji uzyskujemy w tablicy Dobroć dopasowania klikając na karcie Wyjaśniana wariancja klawisz Test dobroci dopasowania. Przy wyborze jednego czynnika tablica ta ma postać jak na rysunku 6.12.
Rys. 6.12. Tablica z wynikami testu dobroci dopasowania przy wyborze jednego czynnika.
Przy poziomie istotności większym od krytycznego poziomu istotności p*=0,000000 odrzucamy hipotezę zerową co jest tożsame ze stwierdzeniem, że jeden czynnik jest niewystarczający do odtworzenia korelacji pomiędzy zmiennymi wejściowymi. Zwiększając na karcie Więcej w oknie Metoda wyodrębniania czynników maksymalną liczbę czynników do dwóch, uzyskujemy tablicę z wynikami testu przedstawioną na rysunku 6.13.
Rys. 6.13. Tablica z wynikami testu dobroci dopasowania przy wyborze dwóch czynników.
Przy poziomie istotności mniejszej od krytycznego poziomu istotności p*=0,107946 nie ma podstaw do odrzucenia hipotezy zerowej mówiącej, że dwa czynniki wystarczająco dokładnie odtwarzają korelacje pomiędzy zmiennymi wejściowymi.
Czynniki główne - metoda centroidalna. Metoda ta została przedstawiona w rozdz. 6.3.2. Wybierając metodę centroidalną w polu Maksymalna liczba iteracji wpisujemy liczbę iteracji, w których szacujemy zasoby zmienności wspólnej zmiennych wejściowych. Szacunek możemy zakończyć także w momencie gdy nie osiągniemy podanej liczby iteracji, a uzyskamy w danej iteracji zmianę zasobów zmienności wspólnej, w stosunku do poprzedniej iteracji, mniejszą niż wartość podana w polu Minimalna zmiana w zasobach zmienności wspólnej (rys. 6.14).
Rys. 6.14. Okno Metoda wyodrębniania czynników z wybraną opcją Metoda centroidalna.
Czynniki główne - metoda osi głównych. Metoda ta została przedstawiona w rozdz. 6.3.1.
W przypadku wyboru tej metody musimy przyjąć dodatkowe założenia jak w metodzie centroidalnej (rys. 6.15).
Rys. 6.15. Okno Metoda wyodrębniania czynników z wybraną opcją Metoda osi głównych.
Do dalszej analizy wybieramy metodę centroidalną. Akceptujemy dokonane wybory klawiszem OK otrzymując okno Wyniki analizy czynnikowej (rys. 6.16).
Rys. 6.16. Okno Wyniki analizy czynnikowej z otwartą kartą Wyjaśniana wariancja.
Przyjęte ustawienia umożliwiają uzyskanie maksymalnej liczby czynników celem poddania ich dalszej analizie. W oknie tym na karcie Wyjaśniana wariancja mamy możliwość wykorzystania wspomnianych kryteriów ustalenia ostatecznej liczby czynników do dalszej analizy. Na karcie uruchamiamy klawisz wartości własne otrzymując tablicę zawierającą wartości własne czynników, procenty sumy wariancji zmiennych wejściowych wyjaśniane przez kolejne czynniki oraz skumulowane wartości własne czynników i skumulowane sumy wariancji zmiennych wejściowych wyjaśniane przez kolejne czynniki (rys. 6.17).
Rys. 6.17. Tablica z wartościami i skumulowanymi wartościami własnymi czynników oraz procentami sumy wariancji i skumulowanymi procentami sumy wariancji.
Kryterium Kaisera wskazuje, że do dalszej analizy należy wykorzystać tylko pierwszy czynnik, którego wartość własna jest większa od 1. Czynnik ten przenosi tylko około 34% informacji zawartych w zmiennych wejściowych (sumy wariancji zmiennych wejściowych). Klikając klawisz Wykres osypiska otrzymujemy wykres liniowy wartości własnych (rys. 6.18).
Rys. 6.18. Wykres osypiska.
Osypisko na wykresie zaczyna się od wartości własnej trzeciego czynnika, co sugeruje przyjęcie do dalszej analizy trzech czynników. Ostatecznie decydujemy się kontynuować analizę przy dwóch czynnikach. Wyjaśniają one łącznie prawie 53% zmienności zmiennych wejściowych (rys. 6.17). Klikamy klawisz Anuluj i wracamy do okna Metoda wyodrębniania czynników, w którym zmieniamy Maksymalną liczbę czynników z 5 na 2 (rys. 6.19).
Rys. 6.19. Okno Metoda wyodrębniania czynników z wybranymi opcjami Metoda centroidalna i Maksymalna liczba czynników równa 2.
Na ekranie otrzymujemy ponownie okno Wyniki analizy czynnikowej (rys. 6.20).
Rys. 6.20. Okno Wyniki analizy czynnikowej z otwartą kartą Wyjaśniana wariancja.
W górnej części okna umieszczone są wybrane, podstawowe wyniki analizy przy przyjętych założeniach, które znajdują się także w szczegółowych tablicach wyników analizy. W oknie tym na karcie Wyjaśniana wariancja klikamy klawisz Zasoby zmienności wspólnej. Otrzymujemy okno z wartościami zasobów zmienności wspólnej przenoszonymi przez dwa pierwsze czynniki, uwzględniane w dalszej analizie (rys. 6.21).
Rys. 6.21. Tablica z wartościami zasobów zmienności wspólnej czynników.
W dwóch pierwszych kolumnach tablicy znajdują się odsetki wariancji wspólnej poszczególnych zmiennych wejściowych wyjaśnianej przez pierwszy (pierwsza kolumna) oraz dwa pierwsze czynniki (druga kolumna). Przykładowo dwa pierwsze czynniki wyjaśniają ponad 62% wariancji wspólnej zmiennej O1.1 (przenoszą 62% informacji o badanych gminach zawartych w tej zmiennej, wspólnych z innymi zmiennymi). W kolejnych wierszach, w ostatniej kolumnie, mamy wartości współczynnika determinacji wielorakiej zmiennych wejściowych z dwoma pierwszymi czynnikami.
Klikając na karcie Wyjaśniona wariancja klawisz Korelacje resztowe/odtworzone otwieramy okno z dwoma tablicami (6.22).
Rys. 6.22. Tablice z odtworzonymi i resztowymi korelacjami pomiędzy zmiennymi wejściowymi.
Wartości w macierzy korelacji resztowych są różnicami pomiędzy korelacjami zmiennych wejściowych, a korelacjami odtworzonymi przez dwa pierwsze czynniki. Wartości na przekątnej tej macierzy wskazują na zasoby zmienności (zasoby informacji o badanych gminach) poszczególnych zmiennych wejściowych nie wyjaśniane przez dwa pierwsze czynniki (pierwiastek kwadratowy z jeden minus zasoby zmienności wspólnej przenoszonej przez dwa pierwsze czynniki). Poza przekątną znajdują się wartości współczynników korelacji liniowej pomiędzy zmiennymi wejściowymi, które nie zostały odtworzone przez dwa pierwsze czynniki. Wartości w macierzy korelacji odtworzonych są korelacjami pomiędzy zmiennymi wejściowymi, które są odtworzone przez dwa pierwsze czynniki.
Interpretacja czynników uwzględnionych w analizie dokonywana jest w oparciu o wartości ładunków czynnikowych. Dla otrzymania ładunków czynnikowych w oknie Wyniki analizy czynnikowej, na karcie Ładunki klikamy klawisz Podsumowanie: ładunki czynnikowe, otrzymując tabelę z wartościami ładunków czynnikowych dla dwóch pierwszych czynników (rys. 6.23).
Rys. 6.23. Tablica z wartościami ładunków czynnikowych przed rotacją.
Otrzymane ładunki czynnikowe są jednocześnie współczynnikami korelacji pomiędzy zmiennymi wejściowymi i czynnikami. Tym samym ich kwadraty (współczynniki determinacji) mówią nam jaka część wariancji wspólnej zmiennych wejściowych została wyjaśniona przez kolejne czynniki. Zmienne dla których wartości tych współczynników determinacji przekraczają 0,5 są wykorzystywane do interpretacji czynników. Odpowiednie wartości ładunków czynnikowych zostają zaznaczone w pakiecie STATISTICA kolorem czerwonym.
Uzyskana struktura ładunków czynników nie pozwala na interpretację drugiego czynnika. Sugeruje to zastosowanie rotacji osi czynnikowych w celu uzyskania prostej struktury ładunków czynnikowych, co powinno w efekcie ułatwić interpretację samych czynników. W tym celu w oknie Wyniki analizy czynnikowej na karcie: Podstawowe, rozwijamy pole Rotacja czynników otrzymując do wyboru następujące metody rotacji czynników: Varimax surowa, Varimax znormalizowana, Biquartimax surowa, Biquartimax znormalizowana, Quartimax surowa, Quartimax znormalizowana, Equamax surowa, Equamax znormalizowana. Wybieramy metodę Equamax znormalizowana (rys. 6.24).
Rys. 6.24. Karta Podstawowe z wybraną metodą rotacji czynników Equamax znormalizowana.
Następnie klikamy klawisz Podsumowanie: ładunki czynnikowe otrzymując nową macierz ładunków czynnikowych (rys. 6.25).
Rys. 6.25. Tablica z wartościami ładunków czynnikowych po rotacji.
Nowy układ ładunków czynnikowych pozwala na łatwiejszą interpretację czynników niż układ ładunków czynnikowych sprzed rotacji. Czynnik pierwszy reprezentuje zmienne C11.1, E13.1 oraz O1.1. Czynnik drugi przenosi natomiast przede wszystkim informacje zawarte w zmiennej wejściowej N1.1. Przyjmujemy uzyskany układ ładunków czynnikowych jako ostateczny i przechodzimy do dalszej analizy wyników.
Graficzną prezentację powiązań między zmiennymi wejściowymi, a czynnikami możemy uzyskać klikając na karcie Ładunki klawisz Wykres 2W ładunków czynnikowych (rys. 6.26).
Rys. 6.26. Wykres konfiguracji punktów reprezentujących zmienne w układzie dwóch pierwszych osi czynnikowych.
Na wykresie przedstawione są punkty reprezentujące zmienne wejściowe w układzie dwóch pierwszych osi czynnikowych. Współrzędnymi tych punktów są po prostu wartości ładunków czynnikowych dwóch pierwszych czynników.
Dla analizowanych gmin możemy obliczyć wartości czynników wybranych do analizy. W tym celu w oknie Wyniki analizy czynnikowej wybieramy kartę Wartości czynnikowe (rys. 6.27).
Rys. 6.27. Karta Wartości czynnikowe.
Na karcie tej klikamy klawisz Współczynniki czynników otrzymując tablicę wartości współczynników czynników umożliwiających obliczenie wartości dwóch pierwszych czynników dla każdej z badanych gmin (rys. 6.28).
Rys. 6.28. Tablica z wartościami współczynników czynników dla zmiennych wejściowych.
Klikając na tej samej karcie klawisz Wartości czynników otrzymujemy tablicę z wartościami dwóch pierwszych czynników dla wszystkich badanych gmin (rys. 6.29).
Rys. 6.29. Fragment tablicy z wartościami dwóch pierwszych czynników dla badanych gmin.
1