52780 P3200148

52780 P3200148



224 4 Analiz skup1(.n

względnych wymiarów obiektów Ale jest to prawda tylko po części, gdyz współczynnik może przyjąć wartość 1, gdy profile pomiarów nie są równoległe = zob. Everitt, 1993).

Ponieważ współczynnik korelacji \£qn < i to nie spełnia on pierwszego warunku stawianego miarom podobieństwa. Aby uniknąć tej niedogodności, nalew stosować jego bezwzględną wartość \qn[ Wśród innych propozycji uwagę zwraca normowanie współczynnika korelacji według wzoru qr[ = (q +1) / 2 Można tez stosować inne przekształcenia, takie jak: 1 q^, 1 — | qn |czy 1 qn, prowadzące jednak do miar odległości. W każdym przypadku, z wyjątkiem 1-<j Transformacja daje dla nowej miary przedział wartości [0, 1| (zob. Timm, 2002).

Te niedogodności współczynnika korelacji dla obiektów mogą prowadzić do sytuacji, ze rozdzielenie obiektów jest niemożliwe lub niewłaściwe, mimo że mają one wyraźną strukturę grupową. Cytuje się jednak badania, w których z powodzeniem wykorzystano współczynnik korelacji jako miarę podobieństwa obiektów i to tam. gdzie zawiodła euklidesowa miara odległości (Strauss i in.; podano za: Everitt, 1993). Współczynnik korelacji między wielowymiarowymi obiektami był przedmiotem badania ze względu na jego metryczną własność. W 1953 roku L.J. Cronbach i G C Gleser wykazali52, że jeżeli wykorzysta się standaryzowane dla obiektów wartości cech według wzoru

z4 = —*—z—-    (i = 1,.... n)    (4.25)

gdzie S — y 2(jrMxt )2, to kwadrat odległości euklidesowej jest funkcją współczynnika korelacji według wzoru (4.24)

P    -    — -i 2

t x.—x    X , — X


(dl;')2 = 2 --4-

S



O


(4.26)


Oznacza to. że miarą odległości opartą na współczynniku korelacji jest m Jlfl — qn). Należy zgodzić się z Anderbergiem (1973), który odmawia jednak większego sensu standaryzacji obiektów według różnych cech, jeśli nie są one współmierne, gdyż dla cech o różnych skalach pomiarowych miara podobieństwa ąm ma niewielkie znaczenie.

Wydaje się, że daleko idąca ostrożność w stosowaniu współczynnika korelacji mied/v obiektami jako miary podobieństwa jest mimo wszystko konieczna, a być

Współczynnik korelacji między dwoma rekordami (obiektami) jest traktowany jako środek identyfikowania typów jednostek, zwłaszcza w Q- analizie czynnikowej.

** Wynik badania Cronhacha i Glesera podajemy za Anderbergiem (1973).

może w takim przypadku należy od razu cechy .standaryzować w zwykły sposób tzn. według wzoru zi; — (xi( - i t) /1, W celu uniknięcia wartości ujemnych

on i<-c znos*


można też stosować transformację x x ^ Ź żT Wymaga tegc

zapewnienia porównywalności zmiennych w obrębu obiektów (homogenieznow wektorów wierszowych). Zawsze też można dane transformować na zmieńnt bi narne i wykorzystać jedną z dalej omówionych miar podobieństwa

Inną miarą, na którą warto spojrzeć uważnie, jest miara podobieństwa Braya

i Curtisa

2 £[min (xr x. )1

427


W* * —---

Ir

Została ona po raz pierwszy wprowadzona w ekologii: 1957 i w za stosowa niach ekologicznych jest bardzo popularna (zob Ludwig i Reynolds 1988 Ker shaw, 1978; Zakrzewska, 1987. Bazar nik im 1992 Wrspółc zynnik ter, jak rząd ko który, po wymnożeniu przez 100 może wyrażać procent podobieństwa Ma on ciekawą konstrukcję, licznik jest podwojoną sumą mniejszych z dwóch wartości cech w parach obiektów, natomiast mianownik jest łączną sumą wartośc i cech u obu jednostek. Przyjmuje on wartości z przedziału [0. 1], przy czym 0 wystąpić może tylko w przypadku, gdy jeden z obiektów w parze jest pozbaw ton \ wszyst kich cech”. Maksymalna wartość 1 (lub 100% i pojawi sic wówczas gdy w artosc i cech u obu obiektów są identyczne. W aplikacjach ekologicznych miara ta jest sto sowana do zmiennych skokowych, którymi są liczby stwierdzonych okazów rozważanych gatunków (które traktujemy jako cechy) w przestrzennych jed nostkach losowania (które traktujemy jako obiekty) Miara W" mogłaby tez znaleźć zastosowanie do cech ilościowych dowolnej natury

Ludwig i Reynolds (1988) podają, iż dopełnienie tego współczynnika podo bieństwa do 1, dn = 1 — W* . jest miarą odległości bardzo przydatną z uwagi na zakres przyjmowanych wartości.

Wprowadzimy jeszcze jedną miarę odległości między obiektami Omawiamy w tym punkcie ze względu na jej związek z omówionym tu współczynnikiem korelacji Przyjmijmy, żc mamy dwa obiekty r i s oraz ich wektory x , i x . przy czym zmienne są mierzalne. Zaznaczmy dwa punkty A i B w dwuwymiarowej

n Stwierdzenia tego nie należy traktować jako czysto teoretycznego, albowiem w pewnych zasto Km antach taki wynik może być realny Dotyczy to zwłaszcza podstawowego zastosowania w eko logii, a mianowicie badania obfitości badanych gatunków (liczby zarejestrowanych okazów) w prze strzcnnych jednostkach losowania Może być tak. że rozważane gatunki w jakimś wylosowanym kwadracie nie wystąpią


Wyszukiwarka

Podobne podstrony:
danego obiektu. Najczęściej jest to przypisanie pikselom należącym do obiektów sztucznych wartości
DSC00082 (27) Skalowme makroświala Mikrosenosry mają z grubsza wymiar f zak-i- .    n
DSC04224 Terminologia Górny wymiar ymrm zny B jest to największa dopuszczalna waitośc liczbowa, ktoi
Kielich Rubina Bardzo ważną umiejętnością jest wyodrębnienie obiektu z tla. Jest to zwykle
Typ obiektowy = klasa - jest to złożona struktura danych o określonej liczbie atrybutów. Atrybuty dz
obiektywizm rzeczywistości jest to, że obserwatora społeczeństwa nęci przeciwstawianie jednostki jak
ANALIZA WYNIKU FINANSOWEGO Przychód ze sprzedaży jest to ogół środków jakie przedsiębiorstwo otrzymu
Analiza otoczenia konkurencyjnego Jest to analiza sektora, w którym dział przedsiębiorstwo. Sektor j
PODSTAWY ANALIZY materiały pomocnicze do wykładu2006/07 Jest to konspekt wykładu z analizy matematyc
IMG94 70 tlf; Strukturo Wiele z tych uwag można rzeczywiście uznać za wyczytane z samego obiektu, a
Wymiarowanie i Tolerowanie Geometryczne "GD&T - to nie tylko znajomość symboli - to przede
AnalizaFinansowaTeoriaPrakty0 lioriit i praktyka (iniiti:y Jbuinsynuy n /irzfflsiębiorstnw jest to
Analiza konkurencji wewnątrz sektora M. Portera. Sektor - jest to grupa firm oferujących dobra lub u
Poznaj C++ w$ godziny0215 206Godzina 14 W liniach 34-37 kasowane i odtwarzane są wewnętrzne zmienne
P3200168 264 4. Analiza skupień • Wyszukujemy w macierzy najmniejszą odległość między dwoma obiektam

więcej podobnych podstron