24
2. Zadanie rozpoznawania
i ij ■ interpretowane (w rozważanym na rysunku 2.1 przykładzie) jako średnica obiektu i jego stopień szarości.
Sytuacja, kiedy cechy mogą być interpretowane jako liczby, jest najkorzystniejsza, jakkolwiek nie jedyna. Cechami w ogólnym przypadku mogą być również pojedyncze bity sygnalizujące obecność lub brak określonej właściwości rozważanego obiektu, a także symbole kodowe (nazwy) określające wartości cech porządkowych lub wręcz jakościowych rozważanych obiektów(1). Oczywiście w takim przypadku przestrzeń X nie może być traktowana jako euklidesowa, co jednak nie przeszkadza we wprowadzeniu pewnych intuicji geometrycznych.
Przykład. Na rysunku 2.2 pokazano przestrzeń cech opartą nadanych binarnych, a na rysunku 2.3 - przestrzeń cech porządkowych i opisowych. Jak widać także i w przypadku tych cech możliwe jest utożsamianie obiektów z punktami w przestrzeni, chociaż przestrzeń ta nie jest tak gęsto wypełniona punktami, jak przestrzeń liczb rzeczywistych.
Rodzaj i własności wybranej przestrzeni cech bardzo silnie wpływają na dalszy tok procesu rozpoznawania. Jest to zupełnie zrozumiale: obiekty d € D mają potencjalnie nieskończenie wiele cech. Odwzorowanie B prowadzące do n-wymiarowej (n <C oo) przestrzeni cech X związane jest zawsze z utratą części informacji, zatem jeśli utracona zostanie informacja istotna z punktu widzenia celów rozpoznawania, a w przestrzeni cech uwzględni się wyłącznie cechy mato ważne - to straty tej nie da się zrekompensować żadnymi późniejszymi wysiłkami.
Nie ustalono dotychczas żadnych ścisłych metod określania struktury przestrzeni cech i jej wybór ma w dużej mierze charakter heurystyczny i arbitralny, zależny od własności zbioru D oraz od pomysłowości twórcy algorytmu A. Zagadnienie to było już sygnalizowane w poprzednim rozdziale. W literaturze istnieje na ten temat jedynie kilka ogólnikowych wskazówek, na przykład szeroko znana jest zasada Brawermanna. Zasada ta głosi, że cechy x„ muszą być tak dobrane, aby w przestrzeni cech X punkty x odpowiadające obiektom d należącym do jednej klasy (d 6 A) grupowały się w postaci skupisk możliwie maksymalnie zwartych wewnętrznie i możliwie najbardziej oddalonych od podobnych skupisk dla innych klas(2). Zasada
(2) L.I. Rozonoer opisał tę zasadę obrazowo w ten sposób, że różnice pomiędzy klasami w przestrzeni cech muszą być innego rodzaju, niż różnica, jaka istnieje pomiędzy gąbką a nasącząjącą ją wodą.