10689 IMAGE7 (2)

5$ = 2436684974110751.

Uwzględniając dodatkowo fakt, iż w ramach taksonomii liczba klas zwykle nie jest dana a priori, należy uwzględnić odpowiednią sumę liczb Stirlinga:

s^+s^f+sg»> •

Metody taksonomii numerycznej są bardzo efektywnym narzędziem badań naukowych, służącym do odkrywania (ujawniania) struktury zbioru obserwacji, np. systematyki roślin czy zwierząt. Niestety, wymagają od badacza, by cechy grupowanych obiektów byty reprezentowane za,pomocą liczb',: podczas gdy bardziej naturalne wydaje się użycie do tego celu s^boH i nazw, jak w. języku potocznym.

Jak już wspomniano, taksonomia jest procesem przydzielania obiektów do właściwych kategorii. Jej celem jest zwykle:

• Uzyskanie jednorodnych przedmiotów badania, ułatwiających wyr odrębnienie ich zasadniczych cech.

• Zredukowanie dużej liczby danych pierwotnych do kilku podstawowych kategorii, które mogą być traktowane jako przedmioty dalszej analizy. -

• Zmniejszenie nakładu pracy i czasu analiz, których przedmiotem będzie uzyskanie w wyniku klasyfikacji obiektów typowych.

Odkrycie nieznanej struktury ¹ analizowanych danych. -‘s - Proces ten może być jednak utrudniony przez niedoskonałą definicję klas, brak ich rpzłączności itp, /

Z naukowego punktu widzenia taksonomia możej?być wykorzystywana do tworzenia indukcyjnych uogólnień: Ponieważ obiekty^podobne należą dó. tych'samych kategorii (klas), do opisu można użyć nazw kategorii, 'ayiipojęć.

22. Podobieństwo i odległość

2^diuctywpływnarezd metod taksonomet-

tytsmyćh ma wybór odpowiedniej miary podobieństwa (lub mępodobień-stwa) obiektów. Miara ta może mieć^charakter.

— miary odległości,

^^współczynnika korelacji? •>

W praktyce najczęściej .stosuje się różne geometryczne miary odległości y przestrzeni cech¹. Zatem wybór takiej:/nuaiy-W: zasadniczy .sposób wpływa na wyniki klasyfikacji i zwykle jest związany z odpowiednią metodą grupowania.

d: DxD-»/?⁺

Funkcja będąca miarą odległości między dwoma obiektami x oraz y ma postać:

i spełnia warunki dla metryk: _v l) d(x,y) = 0, gdy x

d(x_xy) ~ ,*),._

-a. 41 d(x,y)+źf(ji,z). •

Miary odległości są jedynie funkcją obu rozważanych obiektów i charakteryzują się tym, że wabst ich wartości oznacza zwiększenie stopnia'zróżnicowania obiektów.

, . Jeśli chodzi o pr^ldad miary tęgo typju^to do najcz^eiej₍ wyxpr?yś-tjwanyćh^hal^y/żnc/ryfaz. Mińjąwfttegp: . ‘ \

(2.2)

-g^e^Ijp^^r_ty to wartości k-tęj zmiennej dla obiektów Oj oraz ój. Dla /P_J^2dreptezeatuiei. i,o^eglp^eululdeso,wą,yra = 1 — miejską,

Czebyszewa.’ '

Czasami whteraturze¹ (np$ w -pracy J. Kolonia (1980)) używa się ^he^średmo poj^ią: m/ard podobieństwa (bliśkośiś,. zgp^pŚcj), której wartość rośnie, gdy maleją różnice między obiektami. Można traktować ^|^^p^;?tunkcję:

tbk$, że: I

1) ó Ąi&j, y)||p^ b Sy,

2) p(x,y) = l,

I 3'

Można również porównywać rozważane obiekty z pewnym obiektem wzorcowym, jak to proponuje Z. Hellwig w metodzie wzorca rozwoju (1968). Polega ona na tym, że konstruuje sie hipotetyczny wzontec rozwoju, a następnie (po dokonaniu normalizacji cech) oblicza Sie odległość Od niego poszczególnych obiektów.

Wyszukiwarka

Podobne podstrony:
DSC00082 LUDMIR XXXV Fakt, iż widz wie dobrze, że Ludmir nie jest w istocie szewczykiem, osłabia tu
dzają fakt, iż dominującą przyczyną powstawania długu publicznego w Polsce jest zaciąganie pożyczek
3. Z uwagi na fakt, iż od.....lat prowadzą działalność gospodarczą która jest zgod
page0173 169 fizyolog, iż praca przystosowania mięśni narządu bynajmniej nie jest identyczną w pierw
Image(2817) Kukurydza StarLink Ze względu na ten incydent kukurydza StarLink nie jest stosowana nawe
P1010881 znaczy niedługo przed godziną pierwszą. Fakt, że Dracula udał się na południe, nie jest dla
64292 PAWLUCZUK ŻYWIOŁ I FORMA (50) liśmy wyżej, iż na poziomie świadomości prerefle-ksyjnej nie jes
Za tym rozwiązaniem dodatkowo przemawia fakt, iż zadania w ramach każdej sekcji skomponowane są tak,
Dodatkowym argumentem przemawiającym za potrzebą stosowania metod aktywizujących jest fakt, iż metod
skanuj0061 (19) 126 Ontologia społeczeństwa logia winna uwzględniać ten fakt w swoich analizach. Bad
skanuj0022 (76) dodatkową cyfrą arabską, a w ramach tych ostatnich warianty 1 oznaczone małymi liter
stat PageY resize 59 Statystyka matematyczna Ze względu na fakt, iż w modelu tym dopuszczamy istnie
100 Jacek Sójka Fakt, iż własną kulturę badać można jedynie od wewnątrz (osobną kwestią jest badanie

więcej podobnych podstron

10689 IMAGE7 (2)

10689 IMAGE7 (2)

s^+s^f+sg»> •

22. Podobieństwo i odległość

(2.2)

tbk$, że: I

1) ó Ąi&j, y)||p^ b Sy,

I 3'

10689 IMAGE7 (2)

10689 IMAGE7 (2)