218 4. Analiza skupień
218 4. Analiza skupień
yfl.
a Ula dużych p, jak to zwykle bywa w praktyce, oczekiwana wartość d jest bliska
Tę samą przeciętną miarę obliczoną dla zmiennych standaryzowanych R B. Caltell przekształcił w pewną formę współczynnika korelacji. Współczynnik ten, zwany współczynnikiem Cattella (ang. coefficient of pattem similarity), ma po-
stać
2Xo,s(P) ~ Pdl 2*8
(4.10)
gdzie Xo5(P) jest medianą w rozkładzie chi-kwadrat dla p stopni swobody.
Zależność między drs a jest liniowa, stąd obie miary dają klasyfikacje niemal identyczne.
Między wartościami metryk bezwzględnych a wartościami metryk uśrednionych zachodzi proporcjonalność, z uwagi na stały dzielnik, odpowiednio p oraz
Niejednokrotnie warto się posługiwać odległościami opartymi na metrykach znormalizowanych, które otrzymuje się, stosując względną transformację do odległości bezwzględnych (zob. Ludwig i Reynolds, 1988). Dwie takie miary to:
• Względna odległość euklidesowa (ang. relative eućlidian distance)
której wartości wahają się w przedziale od 0 do -Jl.
• Względna odległość absolutna (ang. relative absolute distance)
d
która z kolei przyjmuje wartości z przedziału od 0 do 2.
Pewnym innym sposobem ominięcia wpływu wartości zmiennej X na pomiar odległości jest użycie przeciętnej kwadratowej różnicy standaryzowanej
22 Współczynniki korelacji (dowolnej postaci) są miarami podobieństwa Zobacz punkt 4.3.2.