Sprawozdanie z badań - model prognostyczny kondycji ekonomiczno-finansowej przedsiębiorstw metodą analizy dyskryminacyjnej klasyfikowane charakteryzują się przeważnie dużą ilością cech, ale nie każda z nich jest istotna pod wzglądem jej siły dyskryminacyjnej. Z tego powodu należy dokonać wyboru najbardziej istotnych cech. Zmniejsza to wymiar przestrzeni cech i upraszcza obliczenia. Wybór zmiennych do modelu albo odbywa się w sposób arbitralny tzn. korzystając z różnorakich przesłanek ustala się te najbardziej istotne, albo w sposób iteracyjny. Metody iteracyjne najczęściej polegają na włączaniu lub wyłączaniu z modelu takich zmiennych, które poprawiają jego jakość.
Aby sprawdzić jakość modelu można skorzystać z kilku kryteriów. Najbardziej znane z nich to A Wilksa, albo odległość D2Mahalanobisa.
Lambda Wilksa jest liczona według wzoru:
X = r-
Gdzie macierze W, M są określone następująco:
i ieKj i ieKj
Im mniejsza jest wartość statystyki A tym większe zróżnicowanie pomiędzy klasami. To jak zmienia się wartość statystyki A po dodaniu do modelu (p+1)- szej zmiennej można zweryfikować przy pomocy statystyki F, mającej rozkład Fishera-Snedecora o n-l-p oraz k-1 stopniach swobody:
1-Xp
j, n-k-p Xp k-1 ' V, ’
Xp
gdzie:
n- liczba obiektów, k - liczba klas,
p - liczba zmiennych w funkcji,
X - wartość statystyki Wilksa przed dodaniem zmiennej,
Xp+, - wartość statystyki Wilksa po dodaniu zmiennej.
Innym kryterium jakości dyskryminacji jest odległość D2Mahalanobisa liczona ze wzoru:
6