64456 P3200143

64456 P3200143



214 4 AM.1|,AtNłvUiV!

\\ dalszych punktach przedstawiono wiele różnych miar odległości j ^ dobienstwa. Wbrew pozorom ich liczba, jeśli uwzględnić rodzaj miary, jest njCCo mniejsza. Pewne miary dla cech mierzalnych mają bowiem swoje odpowiednią dla zmiennych binarnych lub w formie kategorii. W literaturze występują one jednak pod innymi nazwami (a nierzadko jedna miara ma wiele różnych nazw). \alakie sytuacje będziemy zwracali uwagę, gdyż znacznie to ułatwi poruszanie się w gąszczu miar

4.3.1. Pomiar zróżnicowania obiektów według cech ilościowych - miary odległości

Miary odległości są pewnymi funkcjami wartości cech X,.... ,Xf

4.-/(xr,x,)    (4.2)

opartymi na odległościach (dystansach) między punktami r i s w przestrzeni wielowymiarowej izob Guzik, 1989), przy czym r,s — 1.....n, jeśli rozważamy rze

czy wiste obiekty, każdy badany obiekt, zgodnie z podstawowym założeniem statystycznej analizy wielowymiarowej, jest bowiem punktem w przestrzeni cech. w której odległość dwóch punktów jest wartością metryki tej p-wymiarowej przestrzeni A .....A* ). Metry ka ma następujące własności:

1)    dn = 0 wtedy i tylko wtedy, gdy x f = x t

i należy to rozumieć w ten sposób, że metryka nie rozróżnia obiektów' identycznych),

2)    dn > 0 dla wszystkich r i s, dla których x r ^ x f

(odległość nie może być ujemna; równocześnie znaczy to, że obiekty nieiden-tycznc są rozróżniane przez metrykę),

3)    dn=d m dla wszystkich r i s

(oznacza to. że odległość między obiektem r a obiektem sznaczy tyle co odległość między obiektem s a obiektem r, odległość dwóch obiektów jest relacją symetryczną),

4)    dn<drw + dm dla wszystkich r i s

(suma odległości między obiektami r i w oraz między obiektami w i s jest nic mniejsza niż odległość między obiektami r i s; jest to tzw. nierówność trójkąta - długość jednego boku nie jest dłuższa niż suma dwóch pozostałych boków). Można wykazać, że suma dwóch metryk jest też metryką, ale już iloczyn dwóch metryk (a zwłaszcza kwadrat metryki) nie musi spełniać nierówności trójkąta i może nie być metryką. Metryki, które spełniają trzy pierwsze warunki, lecz nie spełniają nierówności trójkąta, są określane jako półmetryki lub semimetryki lub też pseudometryki. Z kolei metryki, które dodatkowo spełniają relację < max{dfW,dm \ noszą nazwę ultrametryk, a sama nierówność nosi nazwę nie

równości ultrametryki. W taksonomii wielkość dr nosi nazwę odległości takso nomicznej

Zauważmy, że wprowadzono tu nowe symbole r i s na oznaczenie punktów w przestrzeni wielowymiarowej Jeżeli tymi punktami są rzeczywiste obiekty, to symbole te są równoważne wcześniejszym symbolom i oraz powiedzmy, k Jed nak symbolom r i s nadajemy tu znaczenie nieć< szersze w odniesieniu do gru powania hierarchicznego będą one również reprezentow ały skupienia

Najczęściej stosuje się miary odległości oparte na ogolnei metryce potęgowej


(4.3

gdzie m jest dowrolną liczbą naturalną (zw aną stałą Mmkowskiego specy fikującą wykładnik potęgi, której wartości zmieniają wagi dużych i małych rożni*. Należy szczególnie wyróżnić metrykę miejską i metrykę euklidesowa.

Metryka miejska (ang city błock'* i definiowana jest przez wykładnik m = 1


d


(44

Anderberg (1973) twierdzi, że metry ka miejska jest miarą naibardziei naiu ralną. Jest ona mało czuła na w artości skrajne U życie te; metryki lest właściwe jednak pod pewnymi założeniami, z który ch naiistotnieis7\ m lest wzaiemne me skorelowanie zmiennych Jeżeli zmienne są skorelowane to efekt grupowania opartego na metryce miejskiej może się okazać bezwartościowy9 Jest to ograniczenie bardzo poważne i nie w y daje się. aby mogło byc w praktycc przestrzegane • Metryka euklidesowa (ang. euclidian metru lest 7 kolei definiowana przez wykładnik m = 2

(4.5)

Jest ona powszechnie znana iako odległość euklidesowa dwóch punktów w przestrzeni p-wymiarowej. Jest to klasyczna i naibardziei popularna odległość taksonomiczna. W celu uw ypuklenia małych rożnie między obiektami możemy się posługiwać kwadratem tei metryki, czyli kwadratową odległością eukli-desową


(4.6)

(zob. Anderberg. 1973).


^Zob. R Shcphard, Metru Struaurs i Ordinai Data joumal of Mathematical Psychology, 3,1* Podano za: lłair i in., 1995. I cj cechy metryki miejskiej zdają się nie potwierdzać inni badacze


Wyszukiwarka

Podobne podstrony:
P3310030 (2) W dalszych punktach przedstawiono wiele różnych miar odległości i podobieństwa. Wbrew p
DSC01296 (3) Am putacje u Amputacje u dzieci przedstawiają wiele odrębności, związanych ze zjawiskie
214 REPETYTORIUM MATURZYSTY BIOLOGIA Gekon, przedstawiciel jaszczurek. Gckony żyją na wszystkich
CCF20090831119 214 Samowolka jedności w jej podwojeniu przedstawia sobą ruch uznawania (des Amrkenn
teatr5 które uniemożliwia dalszy bieg przedstawienia, jest czymś j nagminnym. Zbiory anegdot teatral
Kardas rodzia 25252525B3 strony!4 215 214 CZĘŚĆ II PROCESY W ZARZĄDZANIU PRZEDSIĘBIORSTWEM Trzeba j
page0412 408 a jeszcze łatwiej przy skrzyżowaniu ras dalszych, gdy przeciwnie o wiele trudniej zapyl
201411191350 FIKCJA PRODUJK/CJI ■    Przedstawia wiele istniejących w danym okresie
79017 img034 (61) W tym rozdziale przedstawiłem kilka różnych metod nauki. Można ich używać w podane
6 (782) 4. Rysunek obok przedstawia charakterystykę impedancyjną zabezpieczenia odległościowego RZB

więcej podobnych podstron