34753 P3310032 (2)

34753 P3310032 (2)



którą możemy zapisać również w postaci

(4.6a)


2l| = (*, - i ,)'(*, - | ,)=|lx, — x ,11*

gdzie: x' oraz x'r - wektory wierszowe (1 x p),

|| x r — x , || - euklidesowa norma wektora (x r — x 4)

Takie podejście do mierzenia odległości jest zalecane, jeśli w grupowaniu hierarchicznym stosowane są metody: centroidalna, Warda, średniego zróżnicowania lub sumy kwadratów (zob. punkt 4.6). Kwadratowa odległość euklidesowa jest zawsze wyborem bezpiecznym. Podobnie jak w przypadku metryki miejskiej metrykę euklidesową można stosować, gdy zmienne są wzajemnie nieskorelo-wane, co jest warunkiem trudnym do spełnienia. W przeciwnym przypadku metryka euklidesowa będzie złą miarą odległości (Everitt, 1993) i wówczas zalecaną miarą odległości jest odległość Mahalanobisa20. Nie wydaje się, aby to ograniczenie było w praktyce uwzględniane.

Jakkolwiek metryka euklidesowa jest najpowszechniej stosowaną miarą zróżnicowania, to wielu badaczy woli stosować metrykę miejską. Argumentują oni, że metryka miejska spełnia następujący warunek: jeżeli dwa obiekty są opisane dwiema zmiennymi, których jednostki skali są jednakowe, to mają one tę samą odległość bez względu na to, czy są oddalone o dwie jednostki ze względu na każdą zmienną, czy też o jedną jednostkę ze względu na jedną zmienną i o trzy jednostki ze względu na drugą zmienną, co czyni z niej naturalną miarą odległości (zob. Everitt, 1993). Poważny natomiast zarzut formułuje się pod adresem metryki eu-klidesowej, taki mianowicie, że w przypadku zmiany skali pomiarowej nie zachowuje ona nawet porządku odległości. Everitt (1993) daje przykład trójki dzieci, którym zmierzono wagę (w funtach) oraz wzrost (w stopach). Dla danych I(60;3,0), 11(65:3,5) oraz III(63;4,0) mamy następujące odległości euklidesowe. du = 5,OZ    = 3,16 oraz d2i = 2,06. Jeśli natomiast wzrost zmierzymy w calach,

to odległości euklidesowe wyniosą: d}2 = 7,81,du = 12,37 orazd2, = 6,32i dziecko I będzie teraz traktowane jako bardziej podobne do dziecka II niż do 111. Zanim więc obliczy się odległości euklidesowe dobrze jest przeprowadzić standaryzację zmiennych według wzoru xij/sj. Jest to zarzut prawdziwy, ale odnosi się również do odległości miejskiej, która także zmienia porządek odległości przy zmianie skali pomiarowej zmiennej lub zmiennych (zob. Hair i in., 1995) Właśnie zmiana skali (pomiar nie w stopach, lecz w calach; nie w minutach, lecz w sekundach itp.) powoduje, że zmienna przeskalowana zacznie dominować w obliczeniach.

20 Odległość Mahalanobisa dla dwóch obiektówr i s dana jest wzorem d = (x % )S“’(x — x,)', gdzie xr i x, są wierszowymi wektorami pomiarów, zaś S macierzą kowariancji. Formuła odległości Mahalanobisa ma wbudowaną procedurę standaryzacyjną danych


Wyszukiwarka

Podobne podstrony:
15728 P3200144 216 4-Analiza skupią kioi 4 możemy zapisać również w postaci«2 )2 =(x - X J(x, - xj=
skrypt wzory i prawa z objasnieniami20 36 Praca ■ Dla stałej siły pracę wydłuż odcinka o długości /
Metody numeryczne - 7. Całkowanie numeryczne Wzór ten możemy zapisać także w postaci: ^
cw elektrotechnika giżewski cw1#2 Ćwiczenie 1 Zad. 1. Dla wektorów Ri zdefiniowanego w postaci: Ri=1
16. Czy ułamki nieskończone są liczbami niewymiernymi? Nie. Jeśli liczbę możemy zapisać w postaci
CCF20110602003 Ten/ostatni przypadek ,nas najbardziej interesuje, bo możemy go zapisać w dogodniejs
7 (337) po cXte / -• J- /e z Pochodną rzędu drugiego możemy zapisać w postaci macierzy:   
DSC59 Zgodnie z zasadą d’Alemberta warunek „równowagi dynamicznej” modelu możemy zapisać w postaci
Zdjęcie0166 (10) Powyższe możemy zapisać w postaci wektorowej: Zgodnie z prawami dynamiki Newtona, c
2id137 Ćwiczenia laboratoryjne z fizyki CV* _
ANSI C 7 2 TYPY, OPERATORY I WYRAŻENIA możemy zapisać w bardziej zwartej postaci if (c != ’


więcej podobnych podstron