J(0}.02):= maxj xtj —x2J
W procedurach SPSS ponadlo jest dostępna melryka zdefiniowana jako kwadrat odległości euklidesowej (SEUCLID).
4.45
Wybór jediui Problem len < lula).
Przykład 4. Rozważmy 3 w złotych \u
Więcej miar podobieństwa i odległości dla zmiennych zerojedynkowych i ilościowych, dostępnych w SPSS poddaje [Zakrzewska, 2004]. Przykłady wielu innych metryk można znaleźć w [Grabiński, 1992], ale niekiedy są one niedostępne w programach statystycznych i przez to rzadziej stosowane. Uwagę chcemy zwrócić na metrykę Mahalanobisa:
■—■11/2
Tablica 4.8
Zmienna ->
Osoba
y(o,,o.)= ~x2JXxil -x2l)s
4.46
Źródło: oprać
j=1 /-I
gdzie sjest jl-tym elementem macierzy odwrotnej do macierzy kowariancji zmiennych
między dwoma obiektami. Metryka Mahalanobisa jest preferowana w przypadku występowania silnej współzależności między zmiennymi. W przypadku braku skorelowania zmiennych pokrywa się ona z odległością euklidesową. Ponieważ jest ona rzadko dostępna w pakietach statystycznych, jest zastępowana kwadratem odległości euklidesowej [Hair i in., 1995].
Wiele mierników zgodności skonstruowanych specjalnie dla obiektów będących strukturami przedstawiono w pracy [Kukuła, 1996]. Niektóre z nich mogą być wykorzystane jako metryka przestrzeni grupowania.
Wybór metryki w istotny sposób decyduje o przyporządkowaniu obiektów do skupień. Rozważmy 3 punkty na płaszczyźnie o współrzędnych A=(-3,3), B=(4 Oj i C=0,0). Punkt C leży bliżej punktu B (niż punktu A) w sensie metryki euklidesowo* •, metryki miejskie], ale bliżej punktu A (niż punktu B) w sensie metryki Czebyszewa. Zatem jeżeli punkty A i B byłyby środkami ciężkości dwóch skupień, to przyporządkowanie punktu C do skupienia (najbliższego) byłoby inne. We wcześniejszych rozważaniach zwracaliśmy już uwagę, że o grupowaniu decyduje też sposób zdefiniowania odległości międ/y obiektem a skupieniem oraz między dwoma skupieniami (przy ustaleniu tej samej metryki przestrzeni).
Przyjmijm to mamy
Y\. leżeli < wtedy d{/ W ażenie j Ważenie i
proporcjo wiadając Przeksz Często \
Wspó dej o1 czyn
4.2.3. Normalizacja
Normalizacja ma na celu przekształcenie zmiennych w celu doprowadzenia do porównywalnych wielkości.
B =
do
m
s