65
6.1. Postawienie zadania
Aby postępowanie takie było efektywne, musimy ograniczyć zakres sumowania we wzorze (44). Załóżmy (co będzie przedmiotem dalszych rozważań), że funkcje przynależności C(x) dobrze rozwijają się w szereg względem wybranej rodziny funkcji O, w wyniku czego wartości wag V1 dla v > rn mogą być pominięte
V<6/[v„>m[VV <£]]■ (46)
W efekcie można stosować zapis
m
t/=0
implikujący bardzo wygodną z praktycznego punktu widzenia sytuację: do określenia wszystkich funkcji przynależności wystarczy wyznaczyć tylko Lin współczynników V*, które są też jedyną konieczną do zapamiętania informacją przy dalszym rozpoznawaniu. W stosunku do konieczności pamiętania całego ciągu uczącego U dla metod minimalnoodległościowych jest to duża oszczędność.
Przykład. W zadaniach analizy i rozpoznawania mowy rozważanych w pracy doktorskiej A. Dworskiego [61] stosowano ciąg uczący, obejmujący ponad 36 tysięcy próbek sygnału, będących wektorami w 96-wymiarowej przestrzeni cech. Do zapamiętania tego zbioru danych w przypadku używania metod minimalnoodległościowych konieczne były 4 megabajty pamięci. Tymczasem przy rozpoznawaniu wszystkich 40 fonemów języka polskiego z użyciem metod aproksyma-cyjnych konieczne było zapamiętanie zaledwie około 5 tysięcy współczynników VJ, co wymagało niespełna 20 kB.
Zasadnicza trudność przy stosowaniu w praktyce wzoru (47) wiąże się z koniecznością wyboru rodziny funkcji <P. Trudność ta wynika z potrzeby spełnienia kilku warunków. Po pierwsze, trzeba zapewmić warunki dla zastąpienia wzoru (44) wzorem (47), czyli - dobrą rozwijalność funkcji C'(x) (o których nie wiemy nic poza tym, że istnieją!) w szereg względem funkcji