224 4 Analiz skup1(.n
Ponieważ współczynnik korelacji — \£qn < i to nie spełnia on pierwszego warunku stawianego miarom podobieństwa. Aby uniknąć tej niedogodności, nalew stosować jego bezwzględną wartość \qn[ Wśród innych propozycji uwagę zwraca normowanie współczynnika korelacji według wzoru qr[ = (q +1) / 2 Można tez stosować inne przekształcenia, takie jak: 1 — q^, 1 — | qn |czy 1 — qn, prowadzące jednak do miar odległości. W każdym przypadku, z wyjątkiem 1-<j Transformacja daje dla nowej miary przedział wartości [0, 1| (zob. Timm, 2002).
Te niedogodności współczynnika korelacji dla obiektów mogą prowadzić do sytuacji, ze rozdzielenie obiektów jest niemożliwe lub niewłaściwe, mimo że mają one wyraźną strukturę grupową. Cytuje się jednak badania, w których z powodzeniem wykorzystano współczynnik korelacji jako miarę podobieństwa obiektów i to tam. gdzie zawiodła euklidesowa miara odległości (Strauss i in.; podano za: Everitt, 1993). Współczynnik korelacji między wielowymiarowymi obiektami był przedmiotem badania ze względu na jego metryczną własność. W 1953 roku L.J. Cronbach i G C Gleser wykazali52, że jeżeli wykorzysta się standaryzowane dla obiektów wartości cech według wzoru
gdzie S — y 2(jrM — xt )2, to kwadrat odległości euklidesowej jest funkcją współczynnika korelacji według wzoru (4.24)
P - — -i 2
t x.—x X , — X
(dl;')2 = 2 --4-
S
O
Oznacza to. że miarą odległości opartą na współczynniku korelacji jest m Jlfl — qn). Należy zgodzić się z Anderbergiem (1973), który odmawia jednak większego sensu standaryzacji obiektów według różnych cech, jeśli nie są one współmierne, gdyż dla cech o różnych skalach pomiarowych miara podobieństwa ąm ma niewielkie znaczenie.
Wydaje się, że daleko idąca ostrożność w stosowaniu współczynnika korelacji mied/v obiektami jako miary podobieństwa jest mimo wszystko konieczna, a być
Współczynnik korelacji między dwoma rekordami (obiektami) jest traktowany jako środek identyfikowania typów jednostek, zwłaszcza w Q- analizie czynnikowej.
** Wynik badania Cronhacha i Glesera podajemy za Anderbergiem (1973).
może w takim przypadku należy od razu cechy .standaryzować w zwykły sposób tzn. według wzoru zi; — (xi( - i t) /1, W celu uniknięcia wartości ujemnych
on i<-c znos*
można też stosować transformację x x ^ Ź żT Wymaga tegc
zapewnienia porównywalności zmiennych w obrębu obiektów (homogenieznow wektorów wierszowych). Zawsze też można dane transformować na zmieńnt bi narne i wykorzystać jedną z dalej omówionych miar podobieństwa
Inną miarą, na którą warto spojrzeć uważnie, jest miara podobieństwa Braya
i Curtisa
2 £[min (xr x. )1
427
W* * —---
Ir
Została ona po raz pierwszy wprowadzona w ekologii: 1957 i w za stosowa niach ekologicznych jest bardzo popularna (zob Ludwig i Reynolds 1988 Ker shaw, 1978; Zakrzewska, 1987. Bazar nik im 1992 Wrspółc zynnik ter, jak rząd ko który, po wymnożeniu przez 100 może wyrażać procent podobieństwa Ma on ciekawą konstrukcję, licznik jest podwojoną sumą mniejszych z dwóch wartości cech w parach obiektów, natomiast mianownik jest łączną sumą wartośc i cech u obu jednostek. Przyjmuje on wartości z przedziału [0. 1], przy czym 0 wystąpić może tylko w przypadku, gdy jeden z obiektów w parze jest pozbaw ton \ wszyst kich cech”. Maksymalna wartość 1 (lub 100% i pojawi sic wówczas gdy w artosc i cech u obu obiektów są identyczne. W aplikacjach ekologicznych miara ta jest sto sowana do zmiennych skokowych, którymi są liczby stwierdzonych okazów rozważanych gatunków (które traktujemy jako cechy) w przestrzennych jed nostkach losowania (które traktujemy jako obiekty) Miara W" mogłaby tez znaleźć zastosowanie do cech ilościowych dowolnej natury
Ludwig i Reynolds (1988) podają, iż dopełnienie tego współczynnika podo bieństwa do 1, dn = 1 — W* . jest miarą odległości bardzo przydatną z uwagi na zakres przyjmowanych wartości.
Wprowadzimy jeszcze jedną miarę odległości między obiektami Omawiamy ją w tym punkcie ze względu na jej związek z omówionym tu współczynnikiem korelacji Przyjmijmy, żc mamy dwa obiekty r i s oraz ich wektory x , i x . przy czym zmienne są mierzalne. Zaznaczmy dwa punkty A i B w dwuwymiarowej
n Stwierdzenia tego nie należy traktować jako czysto teoretycznego, albowiem w pewnych zasto Km antach taki wynik może być realny Dotyczy to zwłaszcza podstawowego zastosowania w eko logii, a mianowicie badania obfitości badanych gatunków (liczby zarejestrowanych okazów) w prze strzcnnych jednostkach losowania Może być tak. że rozważane gatunki w jakimś wylosowanym kwadracie nie wystąpią