P3200146

ZAJ

—^liaaupjj;

• Współczynnik Lance a i Williamsa

(4.17)

ktorego licznik jest metryką miejską, zaś mianownik można traktować jako miarę łącznej wielkości dwóch obiektów (zob. Anderberg, 1973). Jest to zatem również pewna odmiana metryki miejskiej i uogólnienie odległości Czekanowskiego¹Niezależnie od tego współczynnik ten jest uogólnieniem współczynnika Dicea, niemniej nie jest on miarą metryczną^{2 3}.

Zarówno metryka Canberra, jak i współczynnik Lancea i Williamsa są zalecane dla danych cechujących się skośnością oraz występowaniem wartości skrajnych (zob. Timm, 2002).

• Współczynnik dywergencji (ang. coefficient of divergence)

d

X._: + X

* 7

(4.18)

użyty po raz pierwszy przez Clarka w 1952 roku na gruncie biologii. Przybiera on wartości z przedziału [0,1 ], a przez to jest stosowany dość często (zob. Sneath i Sokal, 1973).

• Miara odległości Matusity ⁶

(4.19)

d

(4.20)

gdzie K_; jest rozstępem zmiennej X . Z jej konstrukcji widzimy, że przyjmuje ona wartości z przedziału [0, l]²⁷.

Zauważmy, że zarówno metryka Canberra, jak i współczynnik Lance a i Wil ■ liamsa są tak skonstruowane, że można je stosować tylko dla zmiennych dodatnio określonych (aby nie było ujemnych odległości) i dlatego nie są one właściwe dla danych centrowanych lub standaryzowanych. Trzy ostatnie współczynniki lei wady nie posiadają. W przypadku metryki Canberra pojawia sic problem, jeśli dane pochodzą ze zliczeń, jak to często bywa w zagadnieniach ekologicznych Jeżeli bowiem x ■ — x _sj = 0, to mianownik składnika sumy jest równy 0 i wówczas ów składnik należy potraktować jako równy 0. Uzasadnieniem takiego postępowania jest to, że x _n — x ^ = 0 oznacza identyczność obiektów ze względu na zmienną X , a zatem nie może zwiększać wartości miary odległości

Odległości taksonomiczne oparte na metrykach stosowane do wyjściowych zmiennych X , a więc do liczb mianowanych, uwzględniają rząd wielkości zmień nych i nie mają zatem określonych górnych granic. Wartości tych miar kształtują się przede wszystkim pod wpływem wartości zmiennych wyrażonych dużymi liczbami²⁸, a wówczas jako miary podobieństw a mogą one być niedogodne Miary odległości oparte na metrykach oraz inne miary niemetryczne należy stosować gdy wszystkie rozpatrywane zmienne są mierzone w tych samych jednostkach lub ich wartości są niemianowane, a ponadto mają ten sam rząd wartości Wymaga to zazwyczaj normalizacji zmiennych (zob. punkt 4.3) lub jakiegoś szczególnego sposobu ważenia²⁹. Wagi a. mogą być wprow adzone do wszystkich powyższych wzorów, na przykład w odniesieniu do metryk w następujący sposób

(4.21)

Zmienne o dużym rzędzie wartości mogą być skalow ane w dół poprzez użycie takiej funkcji wagowej.

Wyznaczone wartości mierników odległości między obiektami są przedstawiane w postaci kwadratowej i symetrycznej macierzy odległości o wymiarach (n X n), równych liczbie obiektów ^{4 5}

Miara to bywa też nazywana współczynnikiem Czekanowskiego (zob. Timm, 2002). Co do ną zwy tego współczynnika, to nie ma pełnej jasności - czasami jest on przypisywany Brayowi i Cun¹' sowi (zob. Janowitz, 2002).

Jeżeli współczynnik Lancea i Williamsa zastosujemy do zmiennych binarnych (0- 1),tootrTi

mamy dopełnienie współczynnika Dicea do 1, ponieważ £|x.₍ — | —^ora?

⁺x») ⁶ ⁺ &)+ (⁶+ c)(zob. punkt 4.4.3).

Miara ta jest też nazywana odległością Hellingera (zob. Gordon, 1999).

²⁷ Zobacz współczynnik Gowcra dla zmiennych różnego typu w punkcie 4.3.6

Z uwagi na to, że różnice między dwoma obiektami są agregowane liniowo, wystarczy nieraz, wartości jednej zmiennej wyrazić w setkach lub tysiącach jednostek, aby radykalnie zmniejszyć odległość.

W odniesieniu na przykład do gazowych zanieczyszczeń powietrza atmosferycznego punktem wyjścia do zdefiniowania wag mogłaby być toksyczność poszczególnych gazów.

Metryka Gowera

Wyszukiwarka

Podobne podstrony:
31431 P3310036 (2) dIKsu, (4 17) którego licznik jest metryką miejską, zaś mianownik można traktować
56 I. Teoria granic którego licznik jest sumą wszystkich liczników napisanych powyżej ułamków, a
56 I. Teoria granic którego licznik jest sumą wszystkich liczników napisanych powyżej ułamków, a
56 I. Teoria granic którego licznik jest sumą wszystkich liczników napisanych powyżej ułamków, a
P3200017 macierz współczynników Korelacji: 1 * r21 1 n / * D 1,0 -0,17] R = /,! rpt
Współczesne problemy energetyki 17 Strumień powietrza kierowany do membrany wysokotemperaturowej (HT
43944 WP 1405053 ZAGADNIENIA FIZYK! WSPÓŁCZESNEJ Uran —> podstawowy pierwiastek z którego robi s
Zadanie 1 Do realizacji procesu, którego celem jest demineralizacja wody na S=40 m2 membrany o współ
img136 (17) którego stężenie vvynosiio .a) M%Śh IG”/. c) 1S%^^=2^4=; -MUL lL O (2fW>^0/d Ar U 3
rozdział 2 tom 16 2.9.19. Dodatki i współczynnik do tabeli 17.2. Symbol Warunki
12489 skanuj0276 (4) Obliczamy teoretyczny i praktyczny współczynnik przesunięcia zarysu: 17-9 17 14

więcej podobnych podstron