5$ = 2436684974110751.
Uwzględniając dodatkowo fakt, iż w ramach taksonomii liczba klas zwykle nie jest dana a priori, należy uwzględnić odpowiednią sumę liczb Stirlinga:
Metody taksonomii numerycznej są bardzo efektywnym narzędziem badań naukowych, służącym do odkrywania (ujawniania) struktury zbioru obserwacji, np. systematyki roślin czy zwierząt. Niestety, wymagają od badacza, by cechy grupowanych obiektów byty reprezentowane za,pomocą liczb',: podczas gdy bardziej naturalne wydaje się użycie do tego celu s^boH i nazw, jak w. języku potocznym.
Jak już wspomniano, taksonomia jest procesem przydzielania obiektów do właściwych kategorii. Jej celem jest zwykle:
• Uzyskanie jednorodnych przedmiotów badania, ułatwiających wyr odrębnienie ich zasadniczych cech.
• Zredukowanie dużej liczby danych pierwotnych do kilku podstawowych kategorii, które mogą być traktowane jako przedmioty dalszej analizy. -
• Zmniejszenie nakładu pracy i czasu analiz, których przedmiotem będzie uzyskanie w wyniku klasyfikacji obiektów typowych.
Odkrycie nieznanej struktury 1 analizowanych danych. -‘s - Proces ten może być jednak utrudniony przez niedoskonałą definicję klas, brak ich rpzłączności itp, /
Z naukowego punktu widzenia taksonomia możej?być wykorzystywana do tworzenia indukcyjnych uogólnień: Ponieważ obiekty^podobne należą dó. tych'samych kategorii (klas), do opisu można użyć nazw kategorii, 'ayiipojęć.
2^diuctywpływnarezd metod taksonomet-
tytsmyćh ma wybór odpowiedniej miary podobieństwa (lub mępodobień-stwa) obiektów. Miara ta może mieć^charakter.
— miary odległości,
^^współczynnika korelacji? •>
W praktyce najczęściej .stosuje się różne geometryczne miary odległości y przestrzeni cech1. Zatem wybór takiej:/nuaiy-W: zasadniczy .sposób wpływa na wyniki klasyfikacji i zwykle jest związany z odpowiednią metodą grupowania.
d: DxD-»/?+
Funkcja będąca miarą odległości między dwoma obiektami x oraz y ma postać:
i spełnia warunki dla metryk: v l) d(x,y) = 0, gdy x
d(xxy) ~ ,*),._
-a. 41 d(x,y)+źf(ji,z). •
Miary odległości są jedynie funkcją obu rozważanych obiektów i charakteryzują się tym, że wabst ich wartości oznacza zwiększenie stopnia'zróżnicowania obiektów.
, . Jeśli chodzi o pr^ldad miary tęgo typju^to do najcz^eiej( wyxpr?yś-tjwanyćh^hal^y/żnc/ryfaz. Mińjąwfttegp: . ‘ \
-g^e^Ijp^^rty to wartości k-tęj zmiennej dla obiektów Oj oraz ój. Dla /PJ^2dreptezeatuiei. i,o^eglp^eululdeso,wą,yra = 1 — miejską,
Czebyszewa.’ '
Czasami whteraturze1 (np$ w -pracy J. Kolonia (1980)) używa się ^he^średmo poj^ią: m/ard podobieństwa (bliśkośiś,. zgp^pŚcj), której wartość rośnie, gdy maleją różnice między obiektami. Można traktować ^|^^p^;?tunkcję:
2) p(x,y) = l,
27
Można również porównywać rozważane obiekty z pewnym obiektem wzorcowym, jak to proponuje Z. Hellwig w metodzie wzorca rozwoju (1968). Polega ona na tym, że konstruuje sie hipotetyczny wzontec rozwoju, a następnie (po dokonaniu normalizacji cech) oblicza Sie odległość Od niego poszczególnych obiektów.