P3200151

230 lAlUllij-;, _SJ._UPicn

Na tej relacji opiera się badanie metrycznych własności wskaźnikóv

dobienstwa

Do najbardziej znanych i najczęściej stosowanych wskaźników podob' ■ twa należą :

• Współczynnik Russela-Rao (ang. positive matching dicholomy coefficient)

(4.35)

lub W^M=-P P

który jest proporcją cech obecnych u obu obiektów i jest miarą skojarzenia Współczynnik Russela-Rao jest półmetryką.

• Współczynnik Jacearda (ang. Jaccards dichotomy coefficient)

W' =

Pn+P_a~ Pn

lub W =-—

a + b+ c

(4.36)

który jest proporcją cech obecnych wobec wszelkich obecności (pomija przy tym negatywne skojarzenia). Ta bodajże najstarsza miara (1908) zawiera się w prze-dziale od 0 do 1 i jest metryczna.

Współczynnik Dicea lub Sórensena

W^D = -

2p»

P* + P_a

lub W° =

ang. quotient ojsimilarity) 2a

2a+b+c

(4.37)

który jest zmienioną wersją współczynnika Jacearda i został skonstruowany jako średnia harmoniczna dwóch stosunków p_rt / p_n = a / (a + b) oraz Pn i P_u =a/(J + c), czyli współobecności w łącznej liczbie obecności cechy

„ , 2

w dwóch porównywanych obiektach; --—■—-—

(p„/pj+(p„

-—-. Można zauważyć, że / p„)

w stosunku do współczynnika Jacearda wzmacnia on wagę współobecności, podwajając ją. Zawiera się on również w przedziale od 0 do 1, lecz daje wynik przeciętnie o jedną trzecią wyższy. Łatwo się jest przekonać, że współczynnik Dice a

^J7 Dysponując tym narzędziem. Czytelnik może sam sprawdzić, który ze wskaźników podobieństwa omawianych w tym punkcie jest metryką. Warto przy tym pamiętać, iż jeżeli d_n jest metryką, to metryką jest również d_n /(tv+ d_n), gdzie w jest dowolną wartością liczbową. Ilekroć będziemy stwierdzać, iż ta czy inna miara podobieństwa jest metryczna, będziemy mieli na myśli to, iż miara odległości i_n = 1 -IV’ jest metryką czy półmetryką.

³⁸ Przynajmniej niektóre z tych współczynników możemy otrzymać jako metryczne miary odległości lub ich funkcje dla danych alternatywnych (zerojedynkowych).

³⁹ L.R. Dice zastosował go w 1945 roku w badaniach i kologicznych. a po nim w 1948 roku T. Sóren sen - w zagadnieniach socjologii roślin (zob. Sneath i Sokal, 1973 oraz Ludwig i Reynolds, 1988). Wydaje się jednak, żc już w 1920 roku współczynnik ten został zaproponowany przez H A. Gica sona w badaniach ekologicznych do oceny współwystępowania gatunków roślin: C ³ 2h»/(0+ H. gdzie w jest liczbą gatunków wspólnych dla obu stanowisk, zaś a i b - liczbą wszystkich gatunków występujących w jednym i drugim z dwóch porównywanych stanowisk (zob. Kershaw, 1978). Tak odczytane znaczenia podanych symboli odpowiadają dokładnie wzorowi (4.37).

;_est równoznaczny ze współczynnikiem podobieństwa Braya i Curtisa (zob wzór 4.27) dla cech binarnych. Jest on ponadto dopełnieniem do wartości jeden współczynnika Lance a i Williamsa zastosowanego do danych binarnych

X A\ -X

b-ł- c

(a + b) + (a + c)

2a + b+ c

(4.38)

Z uwagi na relację tego współczynnika ze współczynnikiem 4 17) jest on też nazywany współczynnikiem Czekano w skiego (zob Timm 2002 lesi on me tryczną miarą podobieństwa.

• Współczynnik Sokala-Michenera (ang simple mauhing coefficieni)

Pn Z P» -

_w»i _ p» + (P~ Pn-Prn+Pm\__l

(4 39

który jest proporcją łącznej liczby zgodnych obecności i nieobecności lest to je den ze starszych (z roku 1958) i najrozsądniejszych w skazntkow Bywa on tez na zywany wskaźnikiem podobieństwa (ang similańiy indac) lub współczynnikiem koincydencji (zob. Kendall i Buckland, 1975. Maxwell. 1977) Tak jak poprzednie współczynniki zawiera się w przedziale [0, 1] i spełnia warunki metryki W swei komplementarnej postaci 1 - W ^SM = (b + c) / p jest on równy kwadratowi prze ciętnej odległości euklidesowej opartej na niestandaryzow anych cechach, przyjmujących wartości 0 lub 1

Wraz ze współczynnikiem Sokala i Michenera powraca problem łącznych nieobecności. Doceniając komizm cytowanego w nim przykładu Snetha i Sokala, musimy podkreślić, że to nie współczynniki podobieństwa poprzez swą konstrukcję uwzględniającą współ-nieobecności są złe. lecz absurdalny dobor zmiennych przez badacza może doprowadzić do takich sytuacji. Znaczenie współ-nie-obecności jako indykatora podobieństwa zależy od dziedziny badan (np. inne znaczenie może mieć w mikrobiologii), konkretnego zagadnienia i staranności w doborze zmiennych. Jeżeli negatywne skojarzenia mają być wykluczone, to sięgniemy do współczynnika Jacearda, jeśli zaś mają znaczenie, to wykorzystamy współczynnik Sokala i Michenera.

Everitt (1993) przytacza ą Go worem, że w „charakterze odległości euklidesowej' może występować wyrażenie d = ^2(1 — U ), pod warunkiem, że macierz współczynników podobieństwa jest

dodatnio pół-określona. Warunek ten spełniają współczynniki Sokala i Michenera (U’⁵** ) oraz Jac carda (W^;).

Wyszukiwarka

Podobne podstrony:
0000015(1) 2 230 KlNEZTi 1 odpowiednich mięśni zmniejszony. Jeżeli w tej sytuacji wykona się ru
?egna?ek5 w 230 riftymt urządzeniami przckanwunia treści kształcenia. W tej koncepcji rnult], mdii
fraszka 230 (FRANCUSKO-POLSKIE ZWIĄZKI LITERACKIE) - FRASZKA go. Tłumaczenie ukazało się w 1726 r. p
2013 03 10 10 15 Czas cyklu pracy koparki Tc [sj 0H - współczynnikpoprmukony na -wysokość urabiani
3.6 Konfiguracja programowego klienta VoIP - SJ-Phone Po standardowej instalacji programu SJ-Phone,
CCF20090831127 230 Samoioiedza świadomość zepchnięta z powrotem do siebie samej staje się w czynnoś
i 11 u111 y 11 sj i j 111 f f f i1111 /v mimMMnmMMNHMTales z Miletu Tales urodził się w Milecie, st
1tom114 5. MATERIAŁOZNAWSTWO ELEKTROTECHNICZNE 230 Udział rozpuszczalnika decyduje o podziale na lak
2010 06 17;37;41 Reszty rok/kwartał Reszta (wahanie losowe)e,~x,~ {y, +Sj), gdzie te i- ty sezon o
M Feld TBM230 230 6. Rodzaje naddatków i czynniki wpływające na ich wielkość RYS. 6.5. Wyjaśnienie b

więcej podobnych podstron

P3200151

P3200151

Pn+Pa~ Pn

P* + Pa

Pn+P_a~ Pn

P* + P_a