44
4. Metody inininialnoodległościowe
Przykład. W badaniach nad rozpoznawaniem mowy polskiej [58] prowadzonych w latach 1970-1990 w Zakładzie Biocybernetyki AGH, przyjmowano jako składowe x3 przestrzeni cech X amplitudy sygnału dźwiękowego w 96 pasamach widma o częstotliwościach f3 = 12bj + 62,5 Hz {j = 1,2, ... ,96). W przestrzeni tej zdefiniowano 9 różnych metryk(J), a następnie podejmowano próby rozpoznawania określonych fonemów (na przykład samogłosek) przy użyciu opisanych dalej metod z wykorzystaniem tych metryk. Okazało się, że na tym samym komputerze i dla tych samych wypowiedzi (traktowanych jako testy) procent poprawnych rozpoznań i czas rozpoznawania przedstawia się w sposób pokazany w tabeli 4.1.
Tabela 4.1. Zależność dokładności i czasu rozpoznawania od zastosowanej metryki
Metryka |
Procent poprawnych rozpoznań |
Czas rozpoznawania, ms |
Euklidesowa |
0,933 |
1,00 |
Hamminga |
0,967 |
0,64 |
Czebyszewa |
0,933 |
0,84 |
Camberra |
0,933 |
0,96 |
Minkowskiego (0,1) |
0,767 |
3,05 |
Minkowskiego (10) |
0,933 |
2,03 |
Pearsona |
0,900 |
1,03 |
Mahalanobisa (1) |
0,833 |
1,30 |
Mahalanobisa (2) |
0,833 |
1,30 |
Jak wynika z tego przykładu, od trafnego wyboru metryki zależeć może zarówno efekt rozpoznawania, jak i jego pracochłonność - wyrażająca się mniejszymi lub większymi wymaganiami co do mocy obliczeniowej maszyny rozpoznającej. Rozwinięcie tego tematu także znajduje się w Dodatku 1.
Zasada wszystkich omawianych tu metod (rys. 4.1) zwanych mimmalno-odległościowymi polega na następującym prostym rozumowaniu: Wybrać 1
Niektóre z tych metryk przytoczono w Dodatku 1.