80
6. Metody aproksymacyjne
Wówczas
m
C\x) = C\x) = Y, V*i, (71)
i/=0
i włzory (66), (67) i (68) mogą być stosowane bez ograniczeń. Możemy to interpretować między innymi w ten sposób, że wzór (70) zadaje transformację n-wymiarowej przestrzeni cech w m-wymiarową przestrzeń „prostującą”, w której to przestrzeni obszary należące do różych klas, nieseparowalne liniowo w przestrzeni cech, dają się rozgraniczać hiperpłaszczyznami (71).
Ocena szans powodzenia rozpoznawania w konkretnym zadaniu z wykorzystaniem metod funkcji przynależności Cł(z) mających postać agregatów określonych funkcji <pv jest bardzo trudna. Jednak w sposób dość ogólny można wykazać, że prawdopodobieństwo poprawnego rozpoznania wyraźnie wzrasta przy przejściu od funkcji C‘(i) liniowych do - bogatszych w możliwości - funkcji nieliniowych. Dzieje się tak dlatego, że - jak wspomniano - na ogół m n. Na przykład dla funkcji C'(x) kwadratowej m = n(n -f 3)/2, zaś dla funkcji C*(ąr) będącej wielomianem stopnia ^
gdzie
fn + M) _ (n + Z1)-\ M ) nW-
oznacza symbol Newtona.
Wpływ wielkości m na prawdopodobieństwo prawidłowego rozpoznania oszacować można na podstawie następującego prostego rozumowania: N punktów (na przykład wszystkie punkty ciągu uczącego) podzielić można na dwie klasy (rozważamy najprostszy przypadek /, = 2) ogółem na 2;V sposobów(3). Za pomocą hiperpłaszczyzn(4) w m- wy miarowej przestrzeni te Ar punktów podzielić można na L(N}m) sposobów. Zatem prawdopodobieństwo tego, że uda się za pomocą generowanego w procesie uczenia
(3) Zakładamy, że wszystkie punkty znajdują się w m-wymiarowej przestrzeni w tak zwanym ogólnym położeniu, co oznacza, że żaden podzbiór m + 1 punktów nie leży w całości na żadnej (m — 1)-wymiarowej hiperpłaszczyźnie (na przykład dla m = 2 oznacza to, że żadne trzy punkty nie leżą na jednej prostej).
(4) Funkcje C‘(x) generują zawsze podziały liniowe m-wymiarowej przestrzeni prostującej, zadanej transformacją xu = </v(:r).