kryterium. To ogólne kryterium składni się z dwóch kryteriów ele* men tamy ch:
~ prostota klas,
zróżnicowanie klas.
Kryteria te są bardzo podobne do stosowanych w omawianych wcześniej algorytmach CLUSTER.
Proces klasyfikacji realizowany przez algorytm RUMMAGE odbywa się w następujący sposób: '
1. Weź zbiór obiektów i dokonaj jego podziału na podzbiory w oparciu o wartości wszystkich cech.
2. Wybierz cechę, której Wartości dają najlepszy podział (ze względu na stosowane kryterium) i dokonaj tego podziału.
3. Jeśli nie ma dobrego podziału, to zakoócz pracę. W przeciwnym przypadku powtarzaj rekurencyjnie kroki 1—3 dla wszystkich podzbiorów.
Najważniejszy dla procesu klasyfikacji jest wybór cechy, w oparciu o którą dokonywany będzie podział zbiorów obiektów znajdujących się w każdym z węzłów drzewa. Formalnie kryterium jakości podziału w algorytmie RUMMAGE jest funkcją:
•/(*,) = gt PM+gz Żfx,), | .. , (6.1}
gdzie P to ocena prostoty opisu klas (kompleksów), ocena
zróżnicowania klas, gt oraz g2 — wagi (przy czym gt + g2 — 1) nadawane tym kryteriom elementarnym przez prowadzącego klasyfikację. Ta zmienna ją, która, daje największą wartość funkcji (6.1), jest wybierana jako podstawa podziała zbioru obiektów w analizowanym węźle drzewa.
Prostotę klasy mierzy się liczbą selektorów znajdujących się w opisującym ją kompleksie oraz liczbą wartości cech w poszczególnych selektorach. Najpierw oblicza się średnią długość selektorów w kompleksie charakteryzującym klasę K:
gdzie L(xi) to liczba wartości cechy xt w selektorze, | — liczba selektorów (cech). Na przykład dla selektora £x = Iv6v8] wartość £(*) =» 3.
Następnie na tej podstawie oblicza się. prostotę wszystkich'klas uzyskanych w efekcie podziału zbioru obiektów w oparciu o wartości pewnej cechy r.
1-1_
n
gdzie Ar to liczba klas.
Z kolei zróżnicowanie klas w algorytmie RUMMAGE mierzy się jako odwrotność ich podobieństwa.
Najpierw znajduje, się współczynnik podobieństwa T selektorów I* = w»] oraz [* = Wj), będący stosunldem liczby t#h wartości ceChy. które są wspólne w obu selektoraćhi do całkowitej ich liczby:
BmhbI
gdzie w, oraz w; to -zbiory wartości cechy x w obu selektorach.
Podobieństwo dwóch klas Kt oraz AT* (opisywanych przez kompleksy) liczy się jako średnie podobieństwo wszystkich selektorów:
. -:
- - $■ '■
Natomiast ich zróżnicowanie to przeciwieństwo podobieństwa:
Ostatecznie zróżnicowanie klas jest Jednią arytmetyczną zróżnicowania wszystkich ich pan
gdzie k to liczbą klas.
Na przykład mamy zbiór obiektów:-
107