którą możemy zapisać również w postaci
(4.6a)
gdzie: x' oraz x'r - wektory wierszowe (1 x p),
|| x r — x , || - euklidesowa norma wektora (x r — x 4)
Takie podejście do mierzenia odległości jest zalecane, jeśli w grupowaniu hierarchicznym stosowane są metody: centroidalna, Warda, średniego zróżnicowania lub sumy kwadratów (zob. punkt 4.6). Kwadratowa odległość euklidesowa jest zawsze wyborem bezpiecznym. Podobnie jak w przypadku metryki miejskiej metrykę euklidesową można stosować, gdy zmienne są wzajemnie nieskorelo-wane, co jest warunkiem trudnym do spełnienia. W przeciwnym przypadku metryka euklidesowa będzie złą miarą odległości (Everitt, 1993) i wówczas zalecaną miarą odległości jest odległość Mahalanobisa20. Nie wydaje się, aby to ograniczenie było w praktyce uwzględniane.
Jakkolwiek metryka euklidesowa jest najpowszechniej stosowaną miarą zróżnicowania, to wielu badaczy woli stosować metrykę miejską. Argumentują oni, że metryka miejska spełnia następujący warunek: jeżeli dwa obiekty są opisane dwiema zmiennymi, których jednostki skali są jednakowe, to mają one tę samą odległość bez względu na to, czy są oddalone o dwie jednostki ze względu na każdą zmienną, czy też o jedną jednostkę ze względu na jedną zmienną i o trzy jednostki ze względu na drugą zmienną, co czyni z niej naturalną miarą odległości (zob. Everitt, 1993). Poważny natomiast zarzut formułuje się pod adresem metryki eu-klidesowej, taki mianowicie, że w przypadku zmiany skali pomiarowej nie zachowuje ona nawet porządku odległości. Everitt (1993) daje przykład trójki dzieci, którym zmierzono wagę (w funtach) oraz wzrost (w stopach). Dla danych I(60;3,0), 11(65:3,5) oraz III(63;4,0) mamy następujące odległości euklidesowe. du = 5,OZ = 3,16 oraz d2i = 2,06. Jeśli natomiast wzrost zmierzymy w calach,
to odległości euklidesowe wyniosą: d}2 = 7,81,du = 12,37 orazd2, = 6,32i dziecko I będzie teraz traktowane jako bardziej podobne do dziecka II niż do 111. Zanim więc obliczy się odległości euklidesowe dobrze jest przeprowadzić standaryzację zmiennych według wzoru xij/sj. Jest to zarzut prawdziwy, ale odnosi się również do odległości miejskiej, która także zmienia porządek odległości przy zmianie skali pomiarowej zmiennej lub zmiennych (zob. Hair i in., 1995) Właśnie zmiana skali (pomiar nie w stopach, lecz w calach; nie w minutach, lecz w sekundach itp.) powoduje, że zmienna przeskalowana zacznie dominować w obliczeniach.
20 Odległość Mahalanobisa dla dwóch obiektówr i s dana jest wzorem d = (x — % )S“’(x — x,)', gdzie xr i x, są wierszowymi wektorami pomiarów, zaś S macierzą kowariancji. Formuła odległości Mahalanobisa ma wbudowaną procedurę standaryzacyjną danych