IMAGE2 (2)

IMAGE2 (2)





(9.15)

(9.16)

Symbole atJ oraz btj we wzorach (9.15) i (9.16) reprezentują uporządkowanie wartości obu cech.

Współczynnik r przyjmuje wartości z przedziału [—1,1], które interpretuje sic podobnie jak w przypadku współczynnika korelacji liniowej. Przy okazji warto dodać, że M. Walesiak zwrócił uwagę na to. iż współczynnik t Kendalla jest szczególną postacią współczynnika korelacji liniowej Pearsona (Walesiak 1993). Miara ta ma jeszcze jedną istotną zaletę. Otóż można ją stosować nawet wtedy, gdy w tablicy 9.2 występują wiersze i kolumny 6. liczebnościach równych zero.

Chociaż współczynnik ten zakłada, że obie cechy mierzy się na skali porządkowej (co w przypadku klas nie występuje), dokładność klasyfikacji w prowadzonych eksperymentach była nieco większą. Ze względu na konstrukcję tej miary nie można jej stosować w . odniesieniu dęTcećh ilościowych poddawanych dyskretyzacji.

9.5. Porządkowanie drzewa

Kolejny problem związany z konstruowaniem drzew klasyfikacyjnych dotyczy decyzji o tym, kiedy zaprzestać dalszego podziału podzbiorów. Chodzi o to, by U2yskać^drzewo o minimalnej liczbie węzłów, nie obniżając przy tym .jakości” reguł klasyfikacji obiektów. Nazywa się to porządkowaniem drzewa.

W tym celu można zastosować jedną z dwóch metod. Pierwsza określana jest w literaturze jako porządkowanie wstępne (ang. pre-pruning) i polega na ustaleniu granicznej wartości miary jakości podziału J*, której przekroczenie oznacza zakończenie podziału i utworzenie liścia:

(9.17)

Metoda ta stosowana jest m.in. w algorytmie ASSISTANT (Cestnik i in. 1987). Ponieważ jednak trudno z góry ustalić wartość J*, podział kończy się zwykle zbyt wcześnie lub zbyt późno.

Można wykorzystać także inne reguły stopu. Najprostsza mówi o tym, by zakończyć podział zbioru obiektów Ss (utworzyć liść), gdy jest on odpowiednio jednorodny. Homogeniczńość można mierzyć za pomocą częstości:


(9.18)

gdzie ty to liczba obiektów w zbiorze Slt 4ux— liczebność najliczniejszej klasy w 5,, tj. 1^ — max {//}. Na przykład wartość parametru c = 1

oznacza, że zbiór nie będzie dzielony, jeśli wszystkie obiekty należą do tej'samej klasy. ’

Inne rozwiązanie polega na uniknięciu tworzenia podzbiorów w sytuacji, gdy zbiór S^jest nieliczny. Do oceny tego stosuje się parametr

n


(9.19)

garien ’ tp.^^mfeÓl>mktqv| w całym zbiorze ucżąćyim Jeśli przyjmie się np^WąrtoŚć    oznacza to, że zbiór'Ą me będzie dzielony, gdy

jeMp^^^^ll^dnre pdniźój 5% wszystkich Obiektów.

Odmienną koncepcję rozwiązania tego samego problemu zaproponowano    Zamiast okreśiania‘ kryterium stopu dla

propsu dzielenia zbiorów obiektów należy utworzyć pełne drzewo

IBBHa

Rys. 9.6. Porządkowanie drzewa klasyfikacyjnego


II— Synbaficae metodjr_

177


Wyszukiwarka

Podobne podstrony:
26 4 209 Ćwiczenie 26 (26.13) 1 (26.14) 1 (26.15) ości E. i 1. I Znak minus we wzorze (26.18) oraz w
Image 11 16 się względem przedmiotu manipulowanego - robot jest programowany we współrzędnych zewnęt
image 016 16 Parametry anten Antena Rys. 1.4. Ilustracja graficzna możliwości uzyskania stałego pozi
Scan10139 a)    zapewnienie swobody, względne dogodności wyboru oraz zakupu we właści
KROPKA WE WZORACH ELEKTRONOWYCH SYMBOLIZUJE JEDEN ELEKTRON, KRESKA ZAŚ
Image 15 WKŁADKA H DO INSTRUKCJI SERWISOWEJ STEREOFONICZNEGO WZMACNIACZA HI-FI TYPU WS-442 SCHEMAT I
image 15 (2) BÓL DRZEWA Jam jest drzewo, Na którym onego czasu Zawisnął On na Golgocie. Wyrosłem w g
IMAGE1 TERAPEUTYCZNE ZASTOSOWANIE ZIMNA % imnlejw, szybkości przewodnictwa we wt nerwowych, % hamow
IMAGE?7 ę,2UEUÓŁ WARÓW** fclMIIY UUMIMWEJ ORAZ JEJ POMUEKM 2 PlOWAHl KOMIWOWYMl *H 5,0— WA* m 110 PR
Image (15)
Image (15) Praca w zespole osobowości to na pewno dobrzy szefowie, a inne na pewno źli. Osobowość tr
Image (15) I2£>}i HP- Ki t Ci { 8> BiO (^ 7o U 0to . &x )pK ( : Ci{..... ...-......$ ....

więcej podobnych podstron