105
8.3. Rozpoznawanie w przestrzeni wielowymiarowej
Wykorzystując własność (102) lub (103) we wzorze (101), stwierdzamy, że
L
= (104)
l/=l
Ponownie znajdujemy we wzorze (104) składnik ^pv P(xjnu)% o którym wcześniej stwierdzono, że nie zależy od i. Przeto można zauważyć, że Q'(x) będzie tym mniejsze, im większy będzie składnik plp(xji). Składnik ten można więc utożsamić z funkcją przynależności
Ci(x)=piP(xJi), (105)
której maksimum wskazywać będzie właściwą klasę i. Prostota wzoru (105) decyduje o jego popularności; zauważając dodatkowo, że dowolna, mono-tonicznie rosnąca funkcja argumentu C'(x) może być również używana w charakterze funkcji przynależności, możemy wzór (105) poddać obustronnemu logarytmowaniu, otrzymując formułę:
C'(x) = In P(x/i) + lnp* (106)
bardzo przydatną w analizie przypadków szczegółowych.
Przykład. W wielokrotnie cytowanej rozprawie doktorskiej L. Kota użyto wzoru (106) do rozpoznawania samogłosek. Uzyskano następujące odsetki poprawnych rozpoznań - tabela 8.1 Ponieważ w tym samym zadaniu metody mi-nimalnoodległościowe dawały zawsze 100% poprawnych rozpoznań - nie jest to wynik świadczący o zaletach metod probabilistycznych!
Tabela 8.1. Poprawność rozpoznawania samogłosek za pomocą metod probabilistycz nych
Samogłoska |
i |
y |
e |
e |
0 |
u |
Procent rozpoznań |
100 |
97,0 |
82,3 |
95,8 |
95,5 |
81,1 |
Przedstawmy teraz rozważaną metodę w postaci ogólnego algorytmu. Będą w nim określone następujące obiekty:
Prob[l .. numclass] - tablica prawdopodobieństw klas (p‘), density(i, obj) - funkcja określająca warunkowe gęstości (p(x/i)).