Sprawozdanie z badań - model prognostyczny kondycji ekonomiczno-finansowej przedsiębiorstw metodą analizy dyskryminacyjnej
Fisher zaproponował obliczenie odległości między środkami skupień dla zestandaryzowanych cech obiektów, tak aby dokładnie określić położenie szukanej płaszczyzny. Należy znaleźć kierunek d, dla którego wyrażenie:
dTx| -dTx2 yldTSd
Przyjmuje maksymalną wartość. W powyższym wyrażeniu 3ć,,3ć2są wektorami średnich arytmetycznych w obu klasach, a S to wspólna macierz wariancji i kowariancji. Ostatecznie szukany kierunek można wyznaczyć na podstawie poniższego równania (k oznacza parametr):
^ = £llll. kS
Metody używane w pakietach komputerowych takich jak Statistica, SPSS pozwalają wyznaczyć k funkcji dyskryminacyjnych. Dany obiekt jest przypisywany do klasy, dla której funkcja dyskryminacyjna przyjmuje największa wartość. Jeśli chodzi o postać funkcji dyskryminacyjnej to w zasadzie może być dowolna, ale praktycznie najczęściej stosuje się funkcje liniowe postaci:
di(x) = ajfi(x),
Gdzie f(x) jest dowolną funkcją wektora cech. Funkcję dyskryminacyjną można również zapisać w postaci:
di (x) = a0+aixl + a2x2 +... + amxm,
W przypadku, gdy zbiór uczący zawiera obiekty należące tylko do dwóch klas K/, K2, wystarczy znaleźć jedną funkcję dyskryminacyjną d o następującej własności:
x, e K{ =>g(;t,.)>0 Xj e K2 => g(*,)<0
W przypadku, gdy występuje k klas, należy znaleźć (k-1) funkcji dyskryminacyjnych. Czyli obiekt x zostanie zaklasyfikowany do klasy Kj, jeśli funkcja gi/x)>0 dla każdego i j.
Przy dwóch kategoriach chcąc ocenić jakość przeprowadzonej dyskryminacji buduje się macierz klasyfikacji, która porównuje klasyfikację obiektów wynikającą z analizy dyskryminacyjnej z ich rzeczywistym stanem. Macierz klasyfikacyjna ma postać:
4