Metoda analizy macierzy współczynników korelacji
Jest to metoda, która bazuje na macierzy współczynników korelacji R opisanej wzorem (3.6) obliczonej dla pierwotnego zbioru zmiennych diagnostycznych. W tym przypadku kryterium klasyfikacji jest tzw. wartość krytyczna
, która może być wskazana przez badacza lub wyznaczona ze wzoru:
(3.7)
gdzie:
- wartość teoretycznej statystyki odczytana z tablic t-Studenta dla zadanego poziomu istotności α i N - 2 stopni swobody
N - liczba obserwacji.
Algorytm doboru zmiennych diagnostycznych jest następujący.
Ze zbioru potencjalnych zmiennych objaśniających eliminuje się wszystkie zmienne, dla których zachodzi nierówność:
(3.8)
gdzie rj0 jest współczynnikiem obliczonym dla j-tej zmiennej diagnostycznej i zmiennej grupującej.
Na tym etapie z pierwotnego zbioru zmiennych diagnostycznych usuwa się takie, które nie są skorelowane ze zmienną grupującą.
Spośród pozostałych potencjalnych zmiennych jako zmienną objaśniającą wybiera się zmienną Xh dla której zachodzi warunek
(3.9)
Zmienna Xh jest nośnikiem największego zasobu informacji o zmiennej objaśnianej.
Ze zbioru potencjalnych zmiennych objaśniających eliminuje się wszystkie zmienne, dla których zachodzi nierówność:
(3.10)
Są to zmienne zbyt silnie skorelowane ze zmienna objaśniającą xh, co powoduje powielanie informacji.
Postępowanie w punktach 2-3 powtarza się aż do wyczerpania pierwotnego zbioru zmiennych diagnostycznych.