Rozdział IX
ANALIZA DYSKRYMINACYJNA
9.1. Wprowadzenie
Analiza dyskryminacyjna stanowi zespół metod dyskryminacyjnych i klasyfikacyjnych (Krzyśko, 1990, s. 9 i 10). Metody dyskryminacyjne mają na celu podział porównywanych obiektów na grupy obiektów jak najbardziej do siebie podobnych ze względu na opisujące je właściwości. Zagadnienie dyskryminacji może być rozwiązane za pomocą funkcji (zmiennych) dyskryminacyjnych, które są najczęściej funkcjami liniowymi (Jajuga, 1993, s. 139) zmiennych wejściowych charakteryzujących analizowane obiekty. Zmienne dyskryminacyjne nie są ze sobą skorelowane, a tym samym nie powielają informacji o badanych obiektach, przenosząc jednocześnie informacje zawarte w zmiennych wejściowych. Funkcje dyskryminacyjne są wyznaczane w taki sposób aby maksymalizować stosunek zróżnicowania międzygrupowego zmiennych wejściowych do ich zróżnicowania wewnątrzgrupowego, czyli dążą do optymalnego podziału obiektów na grupy. Jednocześnie dokonujemy oceny, które ze zmiennych najsilniej różnicują (dyskryminują) grupy obiektów.
Metody klasyfikacyjne służą do ustalenia, do której z utworzonych grup należy przyporządkować dany obiekt (w praktyce najczęściej nowy obiekt, którego właściwości nie były brane pod uwagę przy tworzeniu grup obiektów) wykorzystując w tym celu te zmienne, które miały największą moc dyskryminacyjną. Do klasyfikacji obiektów do wcześniej otworzonych grup obiektów można stosować funkcje klasyfikacyjne, które są liniowymi kombinacjami wcześniej zidentyfikowanych zmiennych dyskryminacyjnych. Funkcje klasyfikacyjne wyznaczane są dla wszystkich grup obiektów. Dany obiekt klasyfikujemy do tej grupy obiektów, dla której wartość funkcji klasyfikacyjnej dla tego obiektu jest największa.
Zagadnienie dyskryminacji zostało po raz pierwszy podniesione przez R. A. Fishera (1936). W swojej pracy przedstawił on pojęcie funkcji dyskryminacyjnej oraz podał sposób szacowania jej parametrów. Szczegółowy opis analizy dyskryminacyjnej można znaleźć m. in. w pracach D. J. Handa (1981), K. Jajugi (1990), W. R. Klecka (1980) i M. Krzyśko (1990).
9.2. Algorytm budowy funkcji dyskryminacyjnych
Punktem wyjścia konstrukcji funkcji dyskryminacyjnych, podobnie jak i w przypadku analizy głównych składowych, jest budowa macierzy danych wejściowych o postaci (5.1). Przyjmuje się, że zmienne te posiadają wielowymiarowy rozkład normalny, chociaż badania empiryczne wskazują, że naruszenie tego założenia nie wpływa znacząco na ich właściwości dyskryminacyjne.
Funkcje dyskryminacyjne stanowią liniowe kombinacje uprzednio wystandaryzowanych zmiennych wejściowych. Innymi słowy zmienne dyskryminacyjne są liniowymi funkcjami zmiennych wejściowych co można zapisać:
, (9.1)
gdzie:
F=[fli] - macierz zmiennych dyskryminacyjnych (s x n), przy czym fli jest wartością l-tej zmienną dyskryminacyjnej w i-tym obiekcie,
AT=[alj] - macierz współczynników zmiennych dyskryminacyjnych (s x m), przy czym alj jest współczynnikiem znajdującym się przy l-tej zmiennej dyskryminacyjnej i j-tej zmiennej wejściowej,
Z=[zjl] - wystandaryzowana macierz obserwacji (m x n), przy czym zji jest wartością wystandaryzowanej j-tą zmiennej w i-tym obiekcie.
Przy wyznaczaniu współczynników funkcji dyskryminacyjnej dążymy do maksymalizacji stosunku zmienności międzygrupowej zmiennych wejściowych do ich zmienności wewnątrzgrupowej. W praktyce najczęściej wyznaczamy te współczynniki rozwiązując układ m- równań jednorodnych z s- niewiadomymi o postaci:
, j=1,2,..,s. (9.2)
M - macierz międzygrupowej sumy kwadratów:
, (9.3)
W - macierz wewnątrz grupowej sumy kwadratów:
, (9.4)
- wektor wystandaryzowanych zmiennych (1 x m) w r-tej grupie obiektów, przy
czym
jest wartością j-tą zmiennej w i-tym obiekcie należącym do r-tej grupy,
- wektor średnich wartości wystandaryzowanych zmiennych (1 x m) w r-tej grupie, przy czym
jest średnią wartością j-tej zmiennej w r-tej grupie:
, (9.5)
- wektor średnich wartości wystandaryzowanych zmiennych (1 x m), przy czym
jest średnią wartością j-tej zmiennej:
. (9.6)
Układ ten ma niezerowe rozwiązanie gdy spełniony jest warunek:
. (9.7)
Rozwiązaniem równania (9.7) jest s nieujemnych wartości własnych (pierwiastków charakterystycznych)
, które odpowiadają unormowanym wektorom własnym a1,a2,...,as zawierającym współczynniki kolejnych funkcji dyskryminacyjnych (9.1). Procedura wyznaczania współczynników kolejnych funkcji dyskryminacyjnych jest analogiczna do procedury wyznaczania ładunków głównych składowych. Zmienne dyskryminacyjne są wzajemnie ortogonalne co oznacza, że ich zasoby informacyjne w zakresie dyskryminacji grup obiektów nie pokrywają się. Ponadto kolejne zmienne dyskryminacyjne, odpowiadające coraz mniejszym wartościom własnym λl, mają coraz mniejszą moc dyskryminacyjną. Liczba możliwych do wyznaczenia zmiennych dyskryminacyjnych, równa rzędowi macierzy M, nie przekracza liczby zmiennych wejściowych i jest o 1 mniejsza niż liczba grup obiektów:
.
Łączna moc dyskryminacyjna zmiennych dyskryminacyjnych równa jest sumie odpowiadających im pierwiastków charakterystycznych.
9.3. Określanie liczby zmiennych wejściowych istotnie dyskryminujących obiekty
Zmienne wejściowe z różną mocą dyskryminują grupy obiektów. Przed przystąpieniem do analizy dyskryminacyjnej pożądane jest zbadanie, które z nich dyskryminują grupy obiektów w sposób istotny, czyli ustalenie, które z nich należy włączyć do modelu (9.1). W przypadku gdy liczba grup obiektów jest większa od dwóch możemy w tym celu wykorzystać procedury weryfikacji hipotez o równości wartości oczekiwanych zmiennych w grupach obiektach. Jedna z nich opiera się na statystyce lambda Wilksa. Statystyka ta, będąca miarą mocy dyskryminacyjnej zmiennych, nazywana tzw. cząstkową lambdą Wilksa, przyjmuje postać (Dobosz, 2001, s. 320):
(9.8)
gdzie:
- wartość współczynnika lambda Wilksa dla modelu po wprowadzeniu do niego j-tej zmiennej,
- wartość współczynnika lambda Wilksa dla modelu przed wprowadzeniem do niego j-tej zmiennej.
Ostatecznie statystyka testowa służąca weryfikacji istotności dyskryminacyjnej danej zmiennej przyjmuje postać (Rao, 1965, s. 470):
. (9.9)
Statystyka ta, przy założeniu istotności dyskryminacyjnej danej zmiennej, posiada rozkład F-Fishera o liczbach stopni swobody:
oraz
.
Jeżeli wartość statystyki testowej jest mniejsza od wartości krytycznej, przy przyjętym poziomie istotności, to wkład rozważanej zmiennej w dyskryminację grup obiektów jest istotny.
9.4. Określanie liczby zmiennych dyskryminacyjnych
Dla określenia ile zmiennych dyskryminacyjnych (funkcji dyskryminacyjnych) należy wykorzystać ostatecznie w dyskryminacji obiektów należy dokonać badania ich statystycznej istotności. Możemy wykorzystać w tym celu test lambda Wilksa (Morrison 1990, s. 329-330). Na wstępie zakładamy, że przynajmniej k pierwszych zmiennych dyskryminacyjnych jest istotnych i testujemy hipotezę o istotności s - k ostatnich zmiennych dyskryminacyjnych. Do weryfikacji tak postawionej hipotezy stosujemy statystykę lambda Wilksa o postaci:
. (9.10)
Przyjmuje ona wartości w zakresie od 1 (brak mocy dyskryminacyjnej) do 0 (doskonała moc dyskryminacyjna). Statystyka ta ma, przy założeniu prawdziwości hipotezy zerowej asymptotycznie rozkład chi-kwadrat o postaci:
(9.11)
i liczbie stopni swobody:
.
Weryfikacja odpowiedniej hipotezy zerowej odbywa się w sposób iteracyjny. Gdy wartość statystyki testowej jest mniejsza od wartości krytycznej, przy przyjętym poziomie istotności, to przynajmniej zmienna dyskryminacyjna o indeksie k+1 jest istotna.
Wykorzystując fakt, że kolejne zmienne dyskryminacyjne mają coraz mniejszą moc dyskryminacyjną, przyjmujemy na początku procesu weryfikacyjnego, że przynajmniej pierwsza zmienna dyskryminacyjna jest istotna, tzn., że k=0. Jeżeli stwierdzimy jej istotność to zwiększamy kolejno indeks k o jeden testując istotność kolejnych zmiennych dyskryminacyjnych.
9.5. Interpretacja wyników
Wartości bezwzględne współczynników funkcji dyskryminacyjnej, szacowanych w oparciu o wystandaryzowane wartości zmiennych wejściowych (standaryzowanych współczynników), określają siłę dyskryminacyjną zmiennych wejściowych. Czym wyższa wartość danego współczynnika, tym większy wpływ odpowiadającej mu zmiennej wejściowej na zmienność danej funkcji dyskryminacyjnej, a w efekcie tym większa jej moc dyskryminacyjna. Natomiast znak danego współczynnika określa czy wpływ ten jest pozytywny, czy też negatywny. Należy pamiętać, że moc dyskryminacyjna zmiennych wejściowych zależy od różnic wartości oczekiwanych poszczególnych zmiennych w wyodrębnionych grupach obiektów oraz od siły powiązań między zmiennymi charakteryzującymi obiekty. Mała wartość bezwzględna współczynnika przy danej zmiennej może oznaczać, że grupy obiektów są słabo przez nią dyskryminowane lub też, że zmienna ta może powielać informacje wnoszone przez inne zmienne wejściowe.
Zmienne dyskryminacyjne są ze sobą nieskorelowane co oznacza, że nie powielają informacji w zakresie dyskryminacji grup obiektów, czyli wariancji międzygrupowej. O stopniu wyjaśniania wariancji międzygrupowej przez zmienne dyskryminacyjne mówią ich wartości własne. Tym samym miarą relatywnej mocy dyskryminacyjnej zmiennych dyskryminacyjnych jest wyrażenie:
, l=1,2,..,s. (9.12)
Inny sposób interpretacji wyników dyskryminacji został zaczerpnięty z analizy kanonicznej. Przypominamy, że w analizie kanonicznej badane są powiązania pomiędzy dwoma zbiorami zmiennych wejściowych, z których każdy jest przedstawiony jako kombinacja liniowa nieskorelowanych nowych zmiennych (ukrytych), zwanych zmiennymi kanonicznymi. Współczynniki stojące przy zmiennych kanonicznych (wagi kanoniczne) są tak wyznaczane aby zmaksymalizować korelacje pomiędzy kolejnymi parami zmiennych kanonicznych. W analizie dyskryminacyjnej pierwszą grupę zmiennych wejściowych tworzą zmienne dyskryminacyjne, a drugą grupę zmiennych wejściowych „sztuczne zmienne” zero-jedynkowe, reprezentujące grupy obiektów. Miarą powiązania pomiędzy zmiennymi dyskryminacyjnymi (Ul) i odpowiadającymi im zmiennymi reprezentującymi grupy obiektów (Vl) są współczynniki korelacji kanonicznej o postaci:
, l=1,2,..,s. (9.13)
Współczynniki korelacji kanonicznej są tym samym miarami siły dyskryminacji grup obiektów przez zmienne dyskryminacyjne.
Interpretacja poszczególnych zmiennych dyskryminacyjnych może opierać się na przedstawieniu zmiennych wejściowych jako kombinacji liniowej zmiennych dyskryminacyjnych (czynników). Parametry stojące przy zmiennych dyskryminacyjnych, nazywane ładunkami dyskryminacyjnymi, są współczynnikami korelacji liniowej pomiędzy poszczególnymi zmiennymi wejściowymi, a zmiennymi dyskryminacyjnymi. Poszczególne zmienne dyskryminacyjne interpretujemy na podstawie nazw zmiennych wejściowych, które są najsilniej z nimi skorelowane.
9.6. Algorytm budowy funkcji klasyfikacyjnych i klasyfikacja obiektów
Konstrukcja funkcji klasyfikacyjnych bazuje na zmiennych wejściowych o istotnej mocy dyskryminacyjnej, wykazanej poprzez zastosowanie testu lambda Wilksa. Zakładając, że zmienne te posiadają wielowymiarowy rozkład normalny oraz równość macierzy wariancji/ kowariancji w grupach obiektach do klasyfikacji obiektów stosujemy linową postać funkcji klasyfikacyjnej (Krzyśko, 1990). W funkcji tej zmienna klasyfikacyjna przedstawiana jest jako kombinacja liniowa zmiennych wejściowych o istotnej mocy dyskryminacyjnej. Funkcje klasyfikacyjne, wyznaczane dla każdej grupy obiektów, mają następującą postać:
, r=1,2,...,z; m'≤m, (9.14)
gdzie:
Kr - r-ta zmienna klasyfikacyjna (dla r-tej grupy obiektów),
crj, j=0,1,...,m' - współczynniki zmiennych pierwotnych o istotnej mocy dyskryminacyjnej.
Dla klasyfikowanego obiektu obliczane są wartości wszystkich funkcji klasyfikacyjnych (dla każdej z grup obiektów). Jeżeli liczebności grup obiektów są zbliżone to obiekt klasyfikujemy do tej grupy, dla której wartość funkcji klasyfikacyjnej jest największa. W przypadku niespełnienia tego warunku stosujemy zmodyfikowaną postać funkcji klasyfikacyjnej:
. (9.15)
Funkcje klasyfikacyjne można wykorzystać do klasyfikacji do grup obiektów zarówno nowych obiektów jak i obiektów należących już do tych grup. Poprawność klasyfikacji jest zawsze o wiele większa dla drugiej z sytuacji, gdyż wtedy stosujemy funkcje klasyfikacyjne, których parametry zostały oszacowane w oparciu o wartości zmiennych wejściowych w zbiorach badanych obiektów, do których należy także klasyfikowany obiekt. W praktyce jednak prawie zawsze mamy do czynienia z pierwszą z sytuacji klasyfikacyjnych. Tym samym poprawność klasyfikacji przy użyciu funkcji klasyfikacyjnych należy przede wszystkim oceniać dokonując klasyfikacji obiektów, których wartości charakterystyk nie były brane pod uwagę przy konstrukcji funkcji klasyfikacyjnych.
9.7. Prawdopodobieństwa klasyfikacji
Podczas klasyfikacji obiektów do grup, w celu zwiększenia prawdopodobieństwa prawidłowej klasyfikacji, możemy wykorzystać dodatkową wiedzę o badanym zjawisku, poza informacjami o wartościach zmiennych wejściowych. Dotyczy ona częstości występowania w całej populacji generalnej (a nie tylko w obserwowanym przez nas zbiorze obiektów) obiektów należących do utworzonych przez nas grup obiektów. Stanowią one podstawę oceny tzw. prawdopodobieństwa a priori zaklasyfikowania danego obiektu do jednej z grup. Najczęściej w procesie klasyfikacji stosowane są trzy rodzaje prawdopodobieństw a priori, a mianowicie (Dobosz, 2001, s. 325):
jednakowe dla każdej grupy obiektów. Opcja ta jest stosowana jeżeli nie chcemy uwzględnić różnych liczebności obiektów w poszczególnych grupach, które poddaliśmy obserwacji empirycznej wiedząc, że w całej badanej populacji grupy te są jednakowo liczne.
proporcjonalne do liczebności grup obiektów. Wybieramy tę opcję gdy stosunki liczebności grup obiektów poddanych obserwacji są takie same jak w całej populacji obiektów.
zdefiniowane przez prowadzącego klasyfikację. Opcja ta powinna zostać wybrana gdy znamy stosunki liczebności grup obiektów w populacji, które są inne niż obiektów poddanych obserwacji.
Znając prawdopodobieństwo a priori możemy oszacować oczekiwane prawdopodobieństwo błędnej klasyfikacji, a tym samym klasyfikować obiekty do tych grup gdzie to prawdopodobieństwo jest najmniejsze. Wykorzystujemy w tym celu regułę klasyfikacji opartą na twierdzeniu Bayesa (Krzyśko, 1990, s. 14-15; Stanisz, 2007, s. 67).
Prawdopodobieństwo warunkowe, że obiekt należy do danej grupy obiektów, przy założeniu znajomości wartości zmiennych w badanych obiektach (istotnie dyskryminujących obiekty) możemy, wykorzystując twierdzenie Bayesa, przedstawić następująco:
, (9.16)
gdzie:
pr' - prawdopodobieństwo a priori zakwalifikowania i-tego obiektu do r'-tej grupy,
xi, xi' - wektor wartości zmiennych wejściowych, istotnie dyskryminujących obiekty, w odpowiednio i-tym i i'-tym klasyfikowanym obiekcie,
- prawdopodobieństwo warunkowe, otrzymania wektora wartości zmiennych odpowiednio xi albo xi' opisujących klasyfikowany odpowiednio i-ty albo i'-ty obiekt, jeżeli wiemy, że obiekt ten należy odpowiednio do r-tej albo r'-tej grupy.
Są to prawdopodobieństwa a posteriori gdyż obliczamy je na podstawie wartości zmiennych istotnie dyskryminujących obiekty, użytych do budowy funkcji dyskryminacyjnych. Reguła Bayesa mówi, że dany obiekt klasyfikujemy do tej klasy Gr', dla której wartość P(Gr'|xd) jest największa. Na podstawie powyższych zależności możemy wyznaczyć prawdopodobieństwo błędnej klasyfikacji a posteriori.
, (9.17)
gdzie:
- prawdopodobieństwo błędnego zakwalifikowania i-tego obiektu do r'-tej grupy pomimo, że należy on do r-tej grupy.
Celem klasyfikacji jest zminimalizowanie powyższego prawdopodobieństwa.
9.8. Klasyfikacja za pomocą odległości Mahalanobisa
Inna taksonomiczna procedura klasyfikacji, często stosowana w praktyce, oparta jest na mierzy odległości Mahalanobisa (1.53). Dla każdego klasyfikowanego obiektu obliczamy jego odległości Mahalanobisa od centroid (środków ciężkości) grup obiektów. Dany obiekt klasyfikujemy do tej grupy, od której odległość ta jest najmniejsza. Oznacza to, że charakterystyki klasyfikowanego obiektu (wartości zmiennych opisujących obiekt) są najbardziej zbliżone do charakterystyk właśnie tej grupy obiektów, w porównaniu z charakterystykami innych grup obiektów. Możemy także, podobnie jak w przypadku funkcji klasyfikacyjnych, szacować prawdopodobieństwo błędnej klasyfikacji dla poszczególnych grup obiektów.
Przykład 9.1
Ilustrację zastosowania analizy dyskryminacyjnej stanowi przykład oceny zdolności dyskryminacyjnej zmiennych charakteryzujących poziom rozwoju wybranych losowo 728 gmin miejskich, wiejskich i miejsko-wiejskich w Polsce w 2005 r., a następnie klasyfikacja gmin do tych grup gmin na podstawie zmiennych o istotnej zdolności dyskryminacyjnej. Wyjściowy zbiór zmiennych, które zostały następnie poddane ocenie zdolności dyskryminacyjnej, zawierał następujące zmienne:
C11.1 - liczba mieszkań ogółem na 1 mieszkańca,
D1.1 - liczba aptek ogółem na 1 mieszkańca,
E13.1 - liczba gimnazjów dla dzieci i młodzieży na 100 osób w wieku 13-15 lat,
K1.1 - udział powierzchni użytków rolnych w powierzchni gminy ogółem,
N1.1 - liczba jednostek (firm) zarejestrowanych w systemie REGON,
O1.1 - dochody gminy ogółem w tys. zł na osobę,
O1.1A - dochody własne gminy w tys. zł na osobę,
O1.10 - subwencje ogólne w tys. zł na osobę,
O1.12 - dotacje celowe z budżetu państwa w tys. zł na osobę,
O1.16 - dotacje otrzymane z funduszy celowych w tys. zł na osobę.
Zmienne powyższe zostały wstępnie poddane standaryzacji. Fragment arkusza zawierający wartości tych zmiennych przedstawiono na rysunku 9.1.
Rys. 9.1. Fragment tablicy z danymi do Przykładu 9.1.
Analizę przeprowadzono z wykorzystaniem pakietu STATISTICA. Odpowiedni moduł analityczny uruchamiamy wybierając z menu STATISTICA opcję Wielowymiarowe techniki eksploracyjne/Analiza dyskryminacyjna (rys. 9.2).
Rys. 9.2. Opcje modułu Wielowymiarowe techniki eksploracyjne.
Na ekranie otrzymujemy wstępne okno modułu analizy dyskryminacyjnej (rys. 9.3).
Rys. 9.3. Wstępne okno modułu analizy dyskryminacyjnej.
Klikając w oknie klawisz Zmienne otwieramy okno Wybierz zmienną grupującą i listę zmiennych niezależnych (rys. 9.4).
Rys. 9.4. Okno wyboru zmiennych do analizy.
W lewym oknie wybieramy zmienną grupującą NOWAZM. W prawej części okna wybieramy wszystkie pozostałe zmienne, charakteryzujące gminy. Nasz wybór akceptujemy klawiszem OK.
Wracamy do wstępnego modułu analizy dyskryminacyjnej, w którym klikamy klawisz Kody zmiennej grupującej otrzymując okno Wybierz kody zmiennej grupującej (rys. 9.5).
Rys. 9.5. Okno Wybierz kody zmiennej grupującej.
W oknie tym klikamy klawisz Wszystkie i akceptujemy nasz wybór klawiszem OK. W efekcie przyporządkowaliśmy poszczególnym gminom odpowiadające im kody typu gminy, które będą pojawiały się w trakcie dalszej analizy, a mianowicie:
- gmina miejska,
- gmina wiejska,
- gmina miejsko-wiejska.
Na zakończenie ustalania założeń analizy akceptujemy opcję Więcej opcji (analiza krokowa) klikając w odpowiednie okienko. Pozwoli to nam prześledzenie etapów badania mocy dyskryminacyjnej zmiennych charakteryzujących gminy (włączania ich do funkcji dyskryminacyjnych) oraz udostępnienie różnych opcji zawierających miary opisujące własności zmiennych wejściowych. Przyjęte założenia analizy funkcji dyskryminacyjnych (rys. 9.6) akceptujemy klawiszem OK.
Rys. 9.6. Okno analizy funkcji dyskryminacyjnych z przyjętymi założeniami.
W efekcie otrzymujemy okno Definicja modelu (rys. 9.7).
Rys. 9.7. Okno Definicja modelu.
Rozwijając listę w oknie Metoda mamy możliwość wyboru jednej z trzech metod konstrukcji funkcji dyskryminacyjnej. Wybór opcji Standardowa powoduje wprowadzenie do modelu (równania funkcji dyskryminacyjnej) wszystkich wybranych zmiennych. Wybór opcja Krokowa postępująca prowadzi do wprowadzania do modelu kolejnych zmiennych o najwyższej mocy dyskryminacyjnej. Wreszcie zdecydowanie się na opcję Krokowa wsteczna powoduje wprowadzenie na początku do modelu wszystkich zmiennych, a następnie usuwanie z niego w kolejnych krokach zmiennych o najmniejszej mocy dyskryminacyjnej. W tych dwóch ostatnich opcjach procedura włączania do modelu/usuwania z modelu zmiennych zostaje zakończona gdy są spełnione pewne założenia zatrzymania procedury przez użytkownika. Spośród powyższych opcji wybieramy metodę krokową budowy funkcji dyskryminacyjnej. W ramach okna Definicja modelu pojawiają się pola, w których należy podać założenia konstrukcji funkcji dyskryminacyjnej (rys. 9.8).
Rys. 9.8. Okno Definicja modelu po wyborze metody krokowej postępującej dla konstrukcji funkcji dyskryminacyjnej.
W pierwszym z nich, Tolerancja wskazujemy jaki odsetek nowych informacji o gminach, nie powielanych ze zmiennymi już wprowadzonymi do modelu, musi wnosić dana zmienna aby została wprowadzona do modelu. Wartość tolerancji jest równa dopełnieniu do 1 współczynnika determinacji zmiennej wprowadzanej do modelu ze zmiennymi już wprowadzonymi do modelu. Pozostawiamy w polu Tolerancja domyślną wartość 0,01, co oznacza że nowa zmienna, aby zostać wprowadzona do modelu, musi wnosić do niego przynajmniej 1% nowych, nie wniesionych już do modelu przez znajdujące się w nim zmienne, informacji o badanych gminach.
Następnym parametrem, którego wartość należy ustalić jest F wprowadzenia. Czym wyższa wartość tego parametru dla danej zmiennej, tym wyższa jej moc dyskryminacyjna. Jeżeli wartość parametru F dla danej zmiennej będzie większa niż wprowadzona do okna opcji F wprowadzenia, zmienna ta zostanie wprowadzona do modelu. Innymi słowy im niższa wartość F wprowadzenia tym więcej zmiennych wprowadzimy do modelu. Pozostawiamy w oknie Definicja modelu wartość domyślną 1. Wpływ kolejnej opcji F usunięcia na budowę modelu, w przypadku wyboru metody analizy krokowej postępującej, powinniśmy pominąć pozostawiając wartość domyślną 0. Wartość ta wskazuje bowiem przy jakiej wielkości parametru F usuwamy zmienną z modelu i parametr ten powinien być tym samym stosowany przy wyborze metody Krokowa wsteczna do konstrukcji funkcji dyskryminacyjnej.
Kolejnym założeniem konstrukcji modelu jest liczba kroków wprowadzania zmiennych do modelu ustalana w ramach opcji Liczba kroków. Jeżeli chcemy wprowadzić do modelu wszystkie zmienne, pod warunkiem spełnienia przez nie wcześniejszych założeń, wartość wybrana w tej opcji nie powinna być mniejsza niż liczba zmiennych. Wskazuje to na zasadność pozostawienia domyślnej liczby kroków 10. W ramach ostatniej opcji Wyświetl wyniki ustalamy zakres wyników, które będą pokazywane podczas analizy. Jeżeli wybieramy wariant Tylko podsumowanie program przeprowadzi cała procedurę budowy modelu pokazując tylko ostateczne wyniki uzyskane po ostatnim kroku. Wybór wariantu Dla każdego kroku pozwala na wywoływanie okien z wynikami po każdym kroku budowy modelu, poczynając od kroku 0. W naszym przykładzie wybieramy ten drugi wariant opcji kończąc ustalanie założeń do konstrukcji modelu (rys. 9.9).
Rys. 9.9. Okno Definicja modelu z przyjętymi założeniami zasad konstrukcji funkcji dyskryminacyjnych.
Nasze wybory akceptujemy klawiszem OK. Na ekranie, na karcie Więcej, ukazuje się okno Wyniki analizy funkcji dyskryminacyjnej w kroku 0 (rys. 9.10).
Rys. 9.10. Okno Wyniki analizy funkcji dyskryminacyjnej w kroku 0.
Krok 0 oznacza, że nie rozpoczęliśmy jeszcze wyboru zmiennych, które zostaną użyte do budowy funkcji dyskryminacyjnych. Powoduje to, że niektóre klawisze w oknie są nieaktywne. Istotne informacje, dla dalszych etapów budowy modelu, uzyskujemy jedynie w oknie, które otrzymujemy klikając klawisz Zmienne poza modelem (rys. 9.11).
Rys. 9.11. Tablica z charakterystykami zmiennych znajdujących się poza modelem w kroku 0.
Informacje zawarte w arkuszu pozwalają m. in. wskazać, które zmienne nie znajdują się w modelu i jaka jest ich relatywna (w porównaniu z innymi zmiennymi) moc informacyjna.
W pierwszej kolumnie mamy podane wartości statystyki lambda Wilksa, określone wzorem (9.10), po wprowadzeniu danej zmiennej do modelu. Stanowi ona ocenę mocy dyskryminacyjnej modelu (wszystkich zmiennych wprowadzonych do modelu łącznie). Przypominamy, że czym mniejsza wartość tej statystyki tym większa moc dyskryminacyjna modelu. W kolejnej kolumnie podawane są wartości Cząstkowych lambda Wilksa (9.8). Określają one wkłady poszczególnych zmiennych do dyskryminacji grup gmin. Czym mniejsza wartość tej statystyki tym większa moc dyskryminacyjna danej zmiennej. Ze względu na fakt, że do modelu nie wprowadzono żadnej zmiennej wartości cząstkowych lambda Wilksa są takie same jak wartości lambda Wilksa.
W trzeciej kolumnie tablicy znajdują się wartości F wprowadzenia dla zmiennych wejściowych. Kolejność uporządkowania zmiennych wejściowych ze względu na wartości statystyki F jest zgodna z hierachią ich mocy dyskryminacyjnej i jednocześnie identyczna z ich uporządkowaniem ze względu na wartości cząstkowej lambda Wilksa. Wartości statystyki F mierzą tym samym moc dyskryminacyjną zmiennych i wskazują na kolejność wprowadzania zmiennych wejściowych do modelu. Najwyższą wartość statystyki F posiada zmienna O1,10(F=276,9) i ona jako pierwsza znajdzie się w modelu. Do modelu nie weszłyby natomiast zmienne O1,1 oraz O1,16, dla których wartości statystyki F są mniejsze od założonej wcześniej minimalnej wartości tej statystyki równej 1. Wartości wszystkich trzech wymienionych statystyk w trakcie budowy modelu będą ulegały zmianom, ze względu na skorelowanie zmiennych wejściowych wprowadzanych do modelu. Tym samym może także ulec zmianie zbiór zmiennych, które znajdą się ostatecznie w modelu.
Podawany w kolejnej kolumnie tablicy krytyczny poziom p nie może być interpretowany identycznie jak w testach istotności dotyczących równości średnich wartości danej zmiennej w grupach gmin. Nie weryfikujemy tutaj hipotezy, że dana zmienna istotnie różnicuje grupy gmin lecz czy wnosi istotny wkład do modelu (zmiennej dyskryminacyjnej) wyjaśniającego zróżnicowanie grup gmin.
Wartości Tolerancji oraz R-kwadrat, równe są dla każdej zmiennej 1,0 oraz 0,0 gdyż do modelu nie wprowadzono jeszcze żadnej zmiennej.
Klikając klawisz Dalej, w prawym dolnym rogu okna Wyniki analizy funkcji dyskryminacyjnej (rys. 9.10), wprowadzamy do modelu kolejne zmienne zgodnie z ich mocą dyskryminacyjną.
Dla prezentacji procedury budowy modelu omówimy przykładowo jej wybrane kroki. Zaczniemy od kroku 3. W kroku 3 okno Wyniki analizy funkcji dyskryminacyjnej przedstawiono na rysunku 9.12.
Rys. 9.12. Okno Wyniki analizy funkcji dyskryminacyjnej w kroku 3.
W górnej części okna znajdują się ogólne informacje dotyczące aktualnego etapu budowy modelu. Między innymi wskazany jest numer kroku budowy modelu (3) i ostatnia zmienna wprowadzona do modelu (N1.1). Na karcie Więcej uaktywnił się także klawisz Podsumowanie: Zmienne w modelu. Klikając ten klawisz otrzymujemy arkusz zawierający podsumowanie aktualnego modelu (etapu budowy funkcji dyskryminacyjnej) (9.13).
Rys. 9.13. Tablica z charakterystykami zmiennych znajdujących się w modelu w kroku 3.
Dyskryminacja typów gmin przez zmienne znajdujące się już w modelu jest wysoce istotna (lambda Wilksa=0,36391; F=158,51; p<0,0000). Wartość lambda Wilksa po wprowadzeniu do modelu ostatniej zmienne wyraźnie spadła (z 1 do 0,391) co wskazuje na znaczący wzrost jego mocy dyskryminacyjnej. Wartości F usunięcia dla każdej zmiennej jest wysoka, a krytyczny poziom istotności p=0,000 wskazuje na istotny ich wkład w dyskryminację grup gmin. W tablicy pojawiły się także wartości tolerancji różne od jedności i wartości R-kwadrat różne od zera. Przykładowo wartości tolerancji=0,826 i R-kwadrat=0,174 dla zmiennej N1.1 oznacza, że 82,6% informacji wnoszonych przez tą zmienną nie jest powielanych przez dwie pozostałe zmienne już znajdujące się w modelu. Klikając klawisz Zmienne poza modelem otwieramy okno z wartościami statystyk dla zmiennych znajdujących się jeszcze poza modelem (rys. 9.14).
Rys. 9.14. Tablica z charakterystykami zmiennych znajdujących się poza modelem w kroku 3.
Wartości statystyki F wprowadzenia wskazują, że kolejną zmienną, która zostanie wprowadzona do modelu jest zmienna K1.1.
Klikając klawisz Dalej w prawym lewym rogu okna Wyniki analizy funkcji dyskryminacyjnej przechodzimy do ostatniego 10 kroku analizy (rys. 9.15).
Rys. 9.15. Okno Wyniki analizy funkcji dyskryminacyjnej w kroku 10 końcowym.
Klawisz Zmienne poza modelem jest nieaktywny gdyż procedura wyboru zmiennych wejściowych do funkcji dyskryminacyjnej została zakończona. Klikając klawisz Podsumowanie: Zmienne w modelu otrzymujemy tablicę z podstawowymi statystykami oceniającymi moc dyskryminacyjną modelu oraz moc dyskryminacyjną poszczególnych zmiennych wejściowych (rys. 9.16).
Rys. 9.16. Tablica z charakterystykami zmiennych wprowadzanych do modelu w kolejnych krokach.
Do modelu ostatecznie nie weszła tylko zmienna O1.16. Największy wkład do dyskryminacji różnych typów gmin, na który wskazują najwyższe wartości statystyki F usunięcia oraz najniższe wartości cząstkowe lambda Wilksa, mają zmienne D1.1 oraz N1.1.
Korzystny w tym momencie byłby powrót do okna Definicja modelu oraz ponowny wybór zmiennych do analizy, pomijając zmienną O1.16. Po ponownym wykonaniu analizy otrzymujemy arkusz analogiczny jak arkusz na rysunku 9.16, jednakże już bez zmiennej O1.16 (rys. 9.17).
Rys. 9.17. Tablica z charakterystykami zmiennych dyskryminacyjnych wprowadzonych ostatecznie do modelu.
Wartości statystyk dla modelu i dla zmiennych w modelu uległy nieznacznym zmianom lecz sama hierarchia i relacje charakterystyk mocy dyskryminacyjnej zmiennych pozostały bez zmian. Klikając w oknie Wyniki analizy kanonicznej klawisz Wykonaj analizę kanoniczną otrzymujemy okno Analiza kanoniczna (rys. 9.18) pozwalające na interpretację otrzymanych funkcji dyskryminacyjnych, w których zmienne dyskryminacyjne są liniowymi funkcjami wybranych w poprzednich etapach zmiennych wejściowych istotnie dyskryminujących grupy gmin.
Rys. 9.18. Okno Analiza kanoniczna.
W pakiecie STATISTICA szacunek współczynników funkcji dyskryminacyjnych odbywa się w analogiczny sposób jak w analizie kanonicznej (por. rozdz. VII). Pierwszą grupę zmiennych stanowią zmienne dyskryminacyjne, a drugą zmienne zero-jedynkowe reprezentujące typ gminy, przyjmujące wartość 1 gdy dana gmina należy do danego typu gmin i wartość 0 w przeciwnej sytuacji.
Aby otrzymać wartości współczynników funkcji dyskryminacyjnych klikamy na karcie Więcej w oknie Analiza kanoniczna klawisz Współczynniki dla zmiennych kanonicznych.
W efekcie uzyskujemy dwa arkusze z surowymi współczynnikami i standaryzowanymi współczynnikami funkcji dyskryminacyjnych (rys. 9.19).
Rys. 9.19. Tablice z wartościami współczynników standaryzowanych i surowych funkcji dyskryminacyjnych.
W naszym przykładzie otrzymaliśmy dwie funkcje dyskryminacyjne. Dla oceny wpływu poszczególnych zmiennych na tworzenie funkcji dyskryminacyjnych korzystamy ze współczynników standaryzowanych, chociaż ze względu na wcześniejszą standaryzację zmiennych wejściowych możemy skorzystać także ze współczynników niestandaryzowanych. Największy wpływ na kształtowanie się wartości pierwszej z funkcji dyskryminacyjnych mają zmienne D1.1, O1.1 oraz O1.10. W przypadku drugiej funkcji dyskryminacyjnej tego typu zmiennymi są zmienne O1.1A i O1.1. W tablicach na rysunku 9.19 otrzymaliśmy obok współczynników funkcji dyskryminacyjnych także Wartości własne dla każdej z funkcji oraz Skumulowaną proporcję, która określa jaki procent wariancji międzygrupowej wyjaśniają kolejne funkcje dyskryminacyjne. Pierwsza z funkcji dyskryminacyjnych wyjaśnia aż ponad 97% tej wariancji, a tym samym powinna stanowić podstawę dalszych analiz.
Pomimo, że druga z funkcji dyskryminacyjnych posiada relatywnie niewielką moc dyskryminacyjną powinniśmy zbadać jej istotność. W tym celu w oknie Analiza kanoniczna (rys. 9.18) klikamy klawisz Podsumowanie: Testy chi-kwadrat kolejnych pierwiastków otrzymując wyniki testowania istotności zmiennych (funkcji) dyskryminacyjnych (rys. 9.20). Wartości krytycznych poziomów istotności p w ostatniej kolumnie tablicy wskazują, że obie funkcje dyskryminacyjne są istotne.
Rys. 9.20. Tablica z wynikami testu istotności zmiennych dyskryminacyjnych.
Po stwierdzeniu, że obie funkcje dyskryminacyjne są istotne przechodzimy do określenia charakteru tej dyskryminacji. Zaczniemy od oceny numerycznej klikając klawisz Średnie zmiennych kanonicznych (rys. 9.21).
Rys. 9.21. Tablica z średnimi wartościami zmiennych dyskryminacyjnych.
W otrzymanej tablicy, w kolejnych kolumnach, znajdują się przeciętne wartości zmiennych dyskryminacyjnych dla każdego typu gmin. Różnice pomiędzy średnimi wartościami zmiennych dyskryminacyjnych dla gmin są znacząco większe dla pierwszej ze zmiennych dyskryminacyjnych niż dla drugiej z nich. Pierwsza funkcja dyskryminacyjna odróżnia przede wszystkim gminy miejskie od gmin wiejskich. Średnia wartość pierwszej funkcji dyskryminacyjnej dla gmin miejsko-wiejskich jest nieznacznie bardziej bliska średniej wartości tej funkcji dla gmin wiejskich niż gmin miejskich. Natomiast druga funkcja dyskryminacyjna rozróżnia przede wszystkim gminy miejsko-wiejskie od pozostałych typów gmin.
Charakter dyskryminacji możemy także ocenić w formie graficznej. W oknie Analiza kanoniczna otwieramy kartę Wartości kanoniczne (rys. 9.22).
Rys. 9.22. Karta Wartości kanoniczne.
Na karcie tej klikamy klawisz Wykres rozrzutu wartości kanonicznych otrzymując wykres 9.23.
Rys. 2.23. Wykres konfiguracji punktów reprezentujących gminy w układzie wyznaczonym przez zmienne (osie) dyskryminacyjne.
Na wykresie wyraźnie widać, że współrzędne zdecydowanej większości punktów reprezentujących gminy miejskie względem pierwszej zmiennej (osi) dyskryminacyjnej mają znacznie wyższe wartości od analogicznych współrzędnych punktów reprezentujących gminy wiejskie. Natomiast współrzędne punktów reprezentujących gminy miejsko-wiejskie względem pierwszej zmiennej dyskryminacyjnej przyjmują wartości z górnej części przedziału zmienności współrzędnych dla gmin wiejskich i dolnej części przedziału zmienności współrzędnych dla gmin miejskich. Ze względu na niewielką dyskryminację typów gmin drugiej ze zmiennych dyskryminacyjnych przedziały zmienności współrzędnych gmin różnych typów w sposób znaczący pokrywają się.
Wartości współrzędnych pojedynczych punktów, reprezentujących poszczególne gminy, prezentowanych na wykresie 9.23 (w układzie osi czynnikowych), uzyskać możemy klikając w oknie Analiza kanoniczna na karcie Wartości kanoniczne klawisz Wartości kanoniczne dla każdego przypadku. Otrzymujemy tablicę, w której kolumnach znajdują się właśnie wartości zmiennych dyskryminacyjnych dla każdej objętej badaniem gminy (rys. 9.24).
Rys. 9.24. Fragment tablicy z wartościami zmiennych dyskryminacyjnych dla gmin.
Interpretacji otrzymanych zmiennych dyskryminacyjnych dokonujemy, w analogiczny sposób jak czynników w innych metodach czynnikowych, w oparciu o postać strukturalną modelu. Poszczególne zmienne wejściowe przedstawiane są jako kombinacja zmiennych dyskryminacyjnych. Parametry funkcji, zwane ładunkami czynnikowymi, są jednocześnie współczynnikami korelacji liniowej pomiędzy zmiennymi wejściowymi i zmiennymi dyskryminacyjnymi. Wartości tych współczynników otrzymujemy klikając w oknie Analiza czynnikowa, na karcie Więcej (rys. 9.18) klawisz Struktura czynnikowa. Z wartości występujących w pierwszej otrzymanej kolumnie tablicy (rys. 9.25) wynika, że kwadraty współczynników korelacji dla żadnej ze zmiennych wejściowych nie przekraczają wartości 0,5 co znacząco utrudnia interpretację pierwszej ze zmiennych dyskryminacyjnych.
Rys. 9.25. Tablica z wartościami współczynników korelacji (ładunków czynnikowych) zmiennych wejściowych ze zmiennymi dyskryminacyjnymi.
Możemy jednocześnie stwierdzić że zmienna ta przede wszystkim reprezentuje własności dyskryminacyjne zmiennych wejściowych O1.10, D1.1, C11.1 i N1.1. W przypadku drugiej ze zmiennych dyskryminacyjnych jej zdolność dyskryminacyjna typów gmin jest wynikiem zdolności dyskryminacyjnej zmiennej wejściowej E13.1.
Drugie z zastosowań analizy dyskryminacyjnej, do klasyfikacji obiektów do grup obiektów, zilustrujemy korzystając z tych samych danych jak w przypadku procedury dyskryminacji tych gmin. Jedyną różnicą jest eliminacja ze zbioru zmiennych wejściowych zmiennej O1.16, której moc dyskryminacyjna typów gmin okazała się nieistotna. Po ponownym przeprowadzeniu analizy funkcji dyskryminacyjnej otrzymujemy okno Wyniki analizy funkcji dyskryminacyjnej, w którego górnej części znajduje się podsumowanie wyników (rys. 9.26).
Rys. 9.26. Okno Wyniki analizy funkcji dyskryminacyjnej.
Aby przejść do klasyfikacji gmin do grup typów gmin w oknie tym klikamy klawisz Klasyfikacja. Otwieramy w ten sposób kartę umożliwiającą zarówno ustalenie założeń klasyfikacji jak i przeprowadzenie samej procedury klasyfikacji (rys. 9.27).
Rys. 9.27. Karta Wyniki analizy funkcji dyskryminacyjnej.
Procedurę rozpoczynamy od wyboru sposobu określenia prawdopodobieństwa a priori. Wyboru tego dokonujemy wybierając w ramach opcji Prawdopodobieństwa klasyfikacyjne a priori jedną z trzech opcji: Proporcjonalnie do wielkości grup, Jednakowe dla wszystkich grup, Zdefiniowane przez użytkownika. Ponieważ nasz przykład ma wyłącznie ilustracyjny charakter pozostawimy domyślną opcję Proporcjonalnie do wielkości grup. Po ustaleniu prawdopodobieństwa a priori przystępujemy do konstrukcji funkcji klasyfikacyjnych dla każdego typu gmin klikając klawisz Funkcje klasyfikacyjne. Otrzymujemy tablicę, w której kolumnach znajdują się współczynniki funkcji klasyfikacyjnych (rys. 9.28), dla kolejnych typów gmin: miejskich, wiejskich i miejsko-wiejskich.
Rys. 9.28. Tablica z wartościami współczynników funkcji klasyfikacyjnych.
Ze względu na niewielkie różnice w liczebnościach gmin w poszczególnych ich typach stosowanie liniowej postaci funkcji klasyfikacyjnych należy uznać za zasadne. Czym wyższa wartość bezwzględna współczynnika stojącego przy danej zmiennej wejściowej tym większy jej wpływ na tworzenie danej funkcji klasyfikacyjnej i samą klasyfikację danej gminy do danego typu gmin.
W oparciu o otrzymane funkcje klasyfikacyjne możemy dokonać kwalifikacji poszczególnych gmin do typów gmin. Program daje nam do wyboru dwa rodzaje postępowania. Możemy, w oparciu o otrzymane funkcje klasyfikacyjne, klasyfikować do typów gmin te gminy, których wartości charakterystyk (wartości zmiennych wejściowych) zostały wykorzystane do konstrukcji funkcji klasyfikacyjnych. Mamy wtedy do czynienia z tzw. klasyfikacją post hoc. Druga z możliwości to tzw. klasyfikacja a priori, czyli klasyfikacja do typów gmin tych gmin, których wartości charakterystyk nie były uwzględnione przy konstrukcji funkcji klasyfikacyjnych. Oczywiście częstość trafności klasyfikacji post hoc zawsze będzie większa od częstości trafności klasyfikacji a priori. Jeżeli chcemy przeprowadzić klasyfikację a priori klikamy klawisz Selekcja w ramach opcji Wybór przypadków do klasyfikacji (rys. 9.27) otrzymując okno Warunki selekcji przypadków do analizy lub wykresu (rys. 9.29).
Rys. 9.29. Okno Warunki selekcji przypadków dla analizy lub wykresu.
Oczywiście w momencie rozpoczynania analizy dyskryminacyjnej należałoby włączyć wcześniej do zbioru danych wartości zmiennych o gminach, które to gminy nie byłyby wcześniej brane pod uwagę w konstrukcji funkcji dyskryminacyjnych. Wtedy po skonstruowaniu funkcji klasyfikacyjnych, wykorzystując opcje z okna Warunki selekcji przypadków do analizy lub wykresu, moglibyśmy dokonać klasyfikacji do grup typów gmin tylko gmin wyłączonych z procedury konstrukcji funkcji klasyfikacyjnych.
Ze względu na ilustracyjny charakter naszego przykładu skoncentrujemy się wyłącznie na klasyfikacji post hoc. Dla ogólnej oceny trafności klasyfikacji poszczególnych gmin do typów gmin klikamy na karcie Klasyfikacja klawisz Macierz klasyfikacji. Na ekranie otrzymujemy tablicę zawierającą informacje na temat liczby i odsetka gmin poprawnie sklasyfikowanych w każdej z grup gmin (rys. 9.30).
Rys. 9.30. Macierz trafności klasyfikacji gmin do typów gmin.
W naszym przykładzie ponad 75% gmin zostało poprawnie zakwalifikowanych do typów gmin. Najlepszy wynik uwzględniliśmy dla gmin miejskich (85,5%), dla których wartości zmiennych uwzględnionych w badaniu znacząco różnią się od wartości tych zmiennych dla gmin innego typu. Najmniejszy odsetek trafnych klasyfikacji wystąpił dla gmin miejsko-wiejskich (64,2%), które posiadają wartości charakterystyk pośrednie pomiędzy gminami miejskimi i gminami wiejskimi.
Dla poznania wyników klasyfikacji pojedynczych gmin, za pomocą funkcji klasyfikacyjnych, klikamy na karcie Klasyfikacja klawisz Klasyfikacja przepadków. W otrzymanej tablicy, której fragment został przedstawiony na rysunku 9.31, uzyskujemy wyniki klasyfikacji każdej z gmin.
Rys. 9.31. Fragment tablicy wyników klasyfikacji gmin.
W pierwszej z kolumn zaznaczono gwiazdkami gminy, które zostały błędnie zakwalifikowane do typu gminy. W drugiej z kolumn znajdują się symboliczne nazwy gmin. W kolejnych kolumnach znajdują się klasyfikacje gmin według pierwszego, drugiego i trzeciego wyboru, tzn. typy gmin, dla których dana gmina miała kolejno największe prawdopodobieństwo a posteriori.
Do klasyfikacji gmin do wyróżnionych ich typów możemy także wykorzystać, zamiast funkcji klasyfikacyjnych, procedurę opartą na odległości Mahalanobisa. Kwadraty odległości Mahalanobisa poszczególnych gmin od środków ciężkości grup gmin, składających się z gmin danego typu, otrzymujemy klikając na karcie klasyfikacja klawisz Kwadraty odległości Mahalanobisa (rys. 9.32).
Rys. 9.32. Fragment tablicy z wartościami kwadratów odległości Mahalanobisa gmin od środków ciężkości grup gmin.
W pierwszej kolumnie zaznaczono gwiazdkami gminy, których klasyfikacja do typu gminy okazała się błędna. W kolejnych kolumnach podawane są właśnie kwadraty odległości Mahalanobisa od środków ciężkości grup gmin poszczególnych typów. Oczywiście dana gmina zostaje zakwalifikowana do tego typu gmin, od którego środka ciężkości jest najmniej odległa.
Klikając na karcie Klasyfikacja klawisz Prawdopodobieństwa a posteriori uzyskujemy tablicę z prawdopodobieństwami a posteriori, że dana gmina należy do danego typu gmin (rys. 9.33).
Rys. 9.33. Fragment tablicy z wartościami prawdopodobieństw a posteriori.
Błędne klasyfikacje zostały zaznaczone w pierwszej kolumnie tablicy gwiazdkami. W kolejnych kolumnach podawane są, dla poszczególnych gmin, prawdopodobieństwa a posteriori zakwalifikowania ich do danego typu gmin. Gmina jest ostatecznie klasyfikowana do tego typu gmin, dla którego odpowiadające gminie prawdopodobieństwo a posteriori jest największe.
W literaturze przedmiotu występują również sformułowania funkcji dyskryminacyjnej z wyrazem wolnym. Funkcje dyskryminacyjne możemy wyznaczać również dla zmiennych niestandaryzowanych.
Metody wyznaczania współczynników funkcji dyskryminacyjnych zostały omówione m. in. w pracy K. Jajugi (1990).
Współczynniki te mogą być one traktowane jako odpowiedniki wystandaryzowanych współczynników regresji wielorakiej.
Nieznaczne różnice wariancji/kowariancji w grupach obiektów, przy operowaniu dużymi i jednakowo licznymi próbami, nie wpływają znacząco na uzyskiwane wyniki (Tabachnik i Fidell, 1996). Gdy warunek jednorodności wariancji/kowariancji jest wyraźnie naruszony możemy stosować kwadratowe funkcje klasyfikacyjne.
1
295