214 4 AM.1|,AtNłvUiV!
\\ dalszych punktach przedstawiono wiele różnych miar odległości j ^ dobienstwa. Wbrew pozorom ich liczba, jeśli uwzględnić rodzaj miary, jest njCCo mniejsza. Pewne miary dla cech mierzalnych mają bowiem swoje odpowiednią dla zmiennych binarnych lub w formie kategorii. W literaturze występują one jednak pod innymi nazwami (a nierzadko jedna miara ma wiele różnych nazw). \ala_ kie sytuacje będziemy zwracali uwagę, gdyż znacznie to ułatwi poruszanie się w gąszczu miar
4.3.1. Pomiar zróżnicowania obiektów według cech ilościowych - miary odległości
Miary odległości są pewnymi funkcjami wartości cech X,.... ,Xf
opartymi na odległościach (dystansach) między punktami r i s w przestrzeni wielowymiarowej izob Guzik, 1989), przy czym r,s — 1.....n, jeśli rozważamy rze
czy wiste obiekty, każdy badany obiekt, zgodnie z podstawowym założeniem statystycznej analizy wielowymiarowej, jest bowiem punktem w przestrzeni cech. w której odległość dwóch punktów jest wartością metryki tej p-wymiarowej przestrzeni A .....A* ). Metry ka ma następujące własności:
1) dn = 0 wtedy i tylko wtedy, gdy x f = x t
i należy to rozumieć w ten sposób, że metryka nie rozróżnia obiektów' identycznych),
2) dn > 0 dla wszystkich r i s, dla których x r ^ x f
(odległość nie może być ujemna; równocześnie znaczy to, że obiekty nieiden-tycznc są rozróżniane przez metrykę),
3) dn=d m dla wszystkich r i s
(oznacza to. że odległość między obiektem r a obiektem sznaczy tyle co odległość między obiektem s a obiektem r, odległość dwóch obiektów jest relacją symetryczną),
4) dn<drw + dm dla wszystkich r i s
(suma odległości między obiektami r i w oraz między obiektami w i s jest nic mniejsza niż odległość między obiektami r i s; jest to tzw. nierówność trójkąta - długość jednego boku nie jest dłuższa niż suma dwóch pozostałych boków). Można wykazać, że suma dwóch metryk jest też metryką, ale już iloczyn dwóch metryk (a zwłaszcza kwadrat metryki) nie musi spełniać nierówności trójkąta i może nie być metryką. Metryki, które spełniają trzy pierwsze warunki, lecz nie spełniają nierówności trójkąta, są określane jako półmetryki lub semimetryki lub też pseudometryki. Z kolei metryki, które dodatkowo spełniają relację < max{dfW,dm \ noszą nazwę ultrametryk, a sama nierówność nosi nazwę nie
równości ultrametryki. W taksonomii wielkość dr nosi nazwę odległości takso nomicznej
Zauważmy, że wprowadzono tu nowe symbole r i s na oznaczenie punktów w przestrzeni wielowymiarowej Jeżeli tymi punktami są rzeczywiste obiekty, to symbole te są równoważne wcześniejszym symbolom i oraz powiedzmy, k Jed nak symbolom r i s nadajemy tu znaczenie nieć< szersze w odniesieniu do gru powania hierarchicznego będą one również reprezentow ały skupienia
Najczęściej stosuje się miary odległości oparte na ogolnei metryce potęgowej
(4.3
gdzie m jest dowrolną liczbą naturalną (zw aną stałą Mmkowskiego specy fikującą wykładnik potęgi, której wartości zmieniają wagi dużych i małych rożni*. Należy szczególnie wyróżnić metrykę miejską i metrykę euklidesowa.
Metryka miejska (ang city błock'* i definiowana jest przez wykładnik m = 1
d
(44
Anderberg (1973) twierdzi, że metry ka miejska jest miarą naibardziei naiu ralną. Jest ona mało czuła na w artości skrajne U życie te; metryki lest właściwe jednak pod pewnymi założeniami, z który ch naiistotnieis7\ m lest wzaiemne me skorelowanie zmiennych Jeżeli zmienne są skorelowane to efekt grupowania opartego na metryce miejskiej może się okazać bezwartościowy9 Jest to ograniczenie bardzo poważne i nie w y daje się. aby mogło byc w praktycc przestrzegane • Metryka euklidesowa (ang. euclidian metru lest 7 kolei definiowana przez wykładnik m = 2
Jest ona powszechnie znana iako odległość euklidesowa dwóch punktów w przestrzeni p-wymiarowej. Jest to klasyczna i naibardziei popularna odległość taksonomiczna. W celu uw ypuklenia małych rożnie między obiektami możemy się posługiwać kwadratem tei metryki, czyli kwadratową odległością eukli-desową
(4.6)
(zob. Anderberg. 1973).
^Zob. R Shcphard, Metru Struaurs i Ordinai Data joumal of Mathematical Psychology, 3,1* Podano za: lłair i in., 1995. I cj cechy metryki miejskiej zdają się nie potwierdzać inni badacze