106
8. Metody probabilistyczne
begin
for i := 1 to numclass do
fun[i] := log ( density(i, obj)) + log(Prob[i])
rec := pointmax(fun);
end
Przystępując do analizy wybranych szczegółowych zagadnień związanych z wykorzystaniem probabilistycznych metod rozpoznawania musimy wrócić do definicji (82) i stwierdzić, że w praktyce znajomość rozkładów P(xji) dla wszystkich klas i jest problematyczna. W dodatku zauważmy, że wzór (106) (i poprzednie) wymaga znajomości postaci P(xji) nadającej się do efektywnego obliczania przy dowolnym z, czyli w rezultacie najchętniej - w postaci analitycznej (por. postulowaną funkcję densityfi, obj)). Jest to bardzo poważny problem na gruncie statystyki: jak uzyskać rozkład wielowymiarowy(7) zmiennej losowej z jedynie na podstawie obserwacji próbek (z*,ik) £ U. W rozważanym zadaniu rozpoznawania problem jest jeszcze trudniejszy: potrzeba takich rozkładów (warunkowych!) niejeden, lecz L.
Możliwe są tu trzy podejścia. Pierwsze zakłada, że rozkłady P(xji) są znane i z góry szczegółowo zadane (na przykład: na podstawie wcześniejszych badań statystycznych, na których możemy się oprzeć). Wówczas naturalnie problem nie istnieje i wzór (106) jest efektywny.
Podejście drugie bazuje na hipotezie o określonym (zadanym z góry) charakterze rozkładu. Przykładowo (co dalej będzie szerzej dyskutowane) często można założyć, że interesujący rozkład jest rozkładem Gaussa lub Bernoulliego. Zadanie znalezienia rozkładu P(xji) sprowadza się wówczas do znalezienia (estymacji) parametrów tego rozkładu. Tego typu problemy są szczegółowo omawiane na gruncie statystyki i mają swoje rozwiązania
(7) Warto zauważyć, że w odróżnieniu od wcześniej dyskutowanego zagadnienia rozkładów P(x/i)] i — 1.....L, zagadnienie znalezienia wartości p*, i = 1,... L, jest
w praktyce zupełnie proste. Wystarczy tu zwykle estymacja na podstawie frekwencji obiektów klasy i w ciągu uczącym U. Można przyjąć na przykład p* = ,V1 /:V lub inną, równie prostą regułę.