P3200152

P3200152



Spośród wymienionych czterech wskaźników podobieństwa najczyściej sio suwane są współczynniki Jaccarda oraz Sokala i MAchenera. "W pewnych dziedzi naeh badań. np. ekologii1, zaleca się stosowanie również innych wskaźników. S to między innymi (zob. Ludwig i Reynolds, 1988)

• Współczynnik Rogersa i Tammoto z roku 1960

Podwaja on wagi obserwacji niezgodnych i posiada własności metryki. • Indeks Ochiai

który jest średnią geometryczną dwóch ilorazów pn / pnA / (,fl-V b) oraz I pn / pa = a / (a + c), czyli prawdopodobieństwa warunkowego tego, że cecha jest obecna u obiektu s pod warunkiem, że jest obecna u obiektu r oraz prawdo- ' podobieństwa warunkowego, że cecha jest obecna u obiektu r pod warunkiem,że jest obecna u obiektu s (zob. indeks Dice a).

Pierwszy iloraz pojawia się jako odrębna miara podobieństwa - półmetryka, ] znana pod nazwą współczynnika Kulczyńskiego. Zauważmy, że indeks Ochiai jest identyczny z cosinusem kierunkowym (wzór 4.2.9), jeśli zmienne przyjmują


(4.41)

p


jedynie wartości l (obecność) i 0 (nieobecność), gdyż wówczas Z^xIjxłj a,

i    p

Z x„ =ii + t oraz 2 x = a + b.

;-l    ”    1-1    2

W 3 =


<i + 2b ■+• 2c


W


który podobnie jak współczynnik Rogersa i Tanimoto podwaja niezgodne serwacje, ale nie uwzględnia zgodnych nieobecności.

Więcej współczynników można znaleźć w książkach Anderberga u Sneatha i Sokala (1973), Timma (2002) czy artykule Gowera (1985). Ni z nich nie są jednak zalecane, a niektóre są uważane wręcz za nonsensów

współczynnik (a + d) / (a + b + c) jest wewnętrznie sprzeczny) Współt /\nniki podobieństwa mają różne konstrukcje. Są współczynniki uwzględniające zgodne nieobecności (d) oraz współczynniki, które ich nic uwzględniają, przy czym owe uwzględnianie lub nie dotyczyć może zarówno l’«v.nika, jak i mianownika Ti udn<> jest z góry przesądzać, żc la druga kategoria (tj nieuwzględmająca wspoł-nie obecności) jest właściwsza, gdyż ocena wartości współczynnika w danym zastosowaniu powinna wynikać ze znaczenia zgodnych nieobecności, czyli właściwie tego, jak obszerna jest kategoria „0" Wśród współczynników są takie, które pod wajają znaczenie niektórych kombinacji obecności i nieobecności podczas gdy inne stosują jednakowe wagi.

Różne formuły współczynników powodują, że dają one rożne wartości podobieństwa dla tej samej pary obiektów. Nie to jednak jest ich wadą Wadą jest na tomiast to, że nie wszystkie one są łącznie monotoniczne tzn ich wartości dla par obiektów nie tworzą po uporządkowaniu ciągów monotomcznych (lub inaczej ciągi wartości poszczególnych współczynników mają różny porządek) Na przykład wiadomo, że współczynnik Jaccarda, Dice a i Anderberga są wzajemnie monotoniczne, podobnie jak w spółczynnik Sokala i Michenera jest monotoniczny ze współczynnikiem Rogera i Tanimoto (zob Anderberg 1973 Johnson i Wi-chem, 1992)45. Nie są natomiast wzajemnie monotonie zne współczynniki Sokala i Michenera oraz Jaccarda. Wzajemna monotoniczność miar podobieństwa jest ważna z tego względu, że niektóre procedury grupowania hierarchicznego są od pome na zmianę miary podobieństwa, jeśli zachowany jest względny porządek wartości miar i dają taką samą hierarchię grupowania inne zaś nie są odporne i dają dla różnych miar różniące się ugrupow anta Grupowanie zarów no metodą najbliższego sąsiada, jak i metodą najdalszego sąsiada takim wpływom me pod lega, czyli zastosowanie którejkolwiek z dwóch miary podobieństwa W' lub Wfl albo też Wm lub W KT prow adzi do identycznego grupowania44 W każdym innym przypadku należy się spodziewać, że efekt grupowania będzie pozostawał pod wpływem użytego współczynnika Własność wzajemnej monotoniczności współczynników można wykazać empirycznie lub można jej dowieść teoretycznie.

Współczynniki podobieństw-a dla danych binarnych, poprzez ich dopełnienia do 1 jako miary odległości, były badane przez Baulieu (1989,1997). Otrzymał on serię miar4S 3

1

   W ekologii miary podobieństwa (asocjacji) służą do badania współwystępowania gat\ legającego na tym, iż w tzw. polach podstawowych (kwadratach) stwierdza się wy stępo; występowanie) oraz współwystępowanie określonych gatunków organizmów roślinny c rzęcych. Choć technicznie problem jest analogiczny, to filozofia badania jest odmienna analizie asocjacji cech (podobieństwa cech) a nie obiektów.

2

Współczynnik Anderberga4

3

- Monotoniczność jest własnością także innych miar zarówno podobieństwa, jak i odległości 44 0 grupowaniu hierarchicznym traktuje punkt 4.6.

^ Tc miary odległości oznaczono literkami w celu identyfikacji miar podobieństwa, z których po wstały. Nic oznacza to więc. że taka lub inna miara odległości jest przypisywana odpowiednim ba daczom Na przykład miara odległość d1 jest w literaturze przedmiotu nazywana odległością Marci newskiego i Steinhausa (zob. Piclou, 1984).

4

   Nie ma pewności co do pochodzenia tego współczynnika Anderbcrg go podaje, ago („umuwnof). Podają go również, ale nie nazywają Sneath i Sokal (1973).


Wyszukiwarka

Podobne podstrony:
83078 P3200150 ------------------------ nak, że współobecności są silniejszym wskaźnikiem podobieńst
Gennep Obrz?dy przej?cia2 gratteznte, wyżej wspomniane podobieństwa pojawią sio nieuchronnie, gdy
Zdj?cie2574 Metody bazujące na funkcjach radialnych & Spośród wymienionych bazowych funkcji radi
skanowanie0042 (18) I spośród wymienionych niżej elementów budowy oka wypisz te, które: a) stanowią
50193 IMG63 (2) Wskaźnik podobieństwa struktur jest określony następującym
skanowanie0042 (18) I spośród wymienionych niżej elementów budowy oka wypisz te, które: a) stanowią
* Spośród wymienionych poniżej uzdrowisk w Polsce wskaż położone w obrębie regionu turystyczneg
9. •    Spośród wymienionych miejscowości uzdrowiskowych wskaż związane
12 Egzamin maturalny z historii sztuki Poziom podstawowyZadanie 19. (2 pkt) Spośród wymienionych rze
IMAG0066 (6) 2$ charakterystyczny składnik wymienianych tu poglądówso. Podobieństwo tych koncepcji p
Zadanie 6. (2 pkt) Dane są wzory: HCl, LiOH. Ra(OH)2t C^jOH. H30+, NO;, S2_, OH" Spośród wymien

więcej podobnych podstron