P3310037 (2)

P3310037 (2)



fov



arP


•li?


iję,

1 D„


e;


S^ale.

;,v


(4.18)


lera on h iS0-


[4.19)


4.20)


jo na-Curti-


I i, Podobieństwo obiektów i jego pomiai


221


gilzie K iest rozstępem zmiennej X Z jej konstrukcji widzimy, że przyjmuje ona wartości z przedziału [O, 1] .

Zauważmy, że zarówno metryka Canberra, jak i współczynnik Lance a i Wil liumsa są tak skonstruowane, że można je stosować tylko dla zmiennych dodatnio określonych (aby nie było ujemnych odległości) i dlatego nie są one właściwe dla danych centrowanych lub standaryzowanych. Trzy ostatnie współczynniki tej wady nie posiadają. W przypadku metryki Canberra pojawia się problem, jeśli dane pochodzą ze zliczeń, jak to często bywa w zagadnieniach ekologicznych, leżeli bow iem xn — x . = 0, to mianownik składnika sumy jest równy 0 i wówczas ów składnik należy potraktować jako równy 0. Uzasadnieniem takiego postępowania jest to, że xq = x sj=0 oznacza identyczność obiektów ze względu na zmienną X , a zatem nie może zwiększać wartości miary odległości.

Odległości taksonomiczne oparte na metrykach stosowane do wyjściowych zmiennych A . a więc do liczb mianowanych, uwzględniają rząd wielkości zmiennych i nie mają zatem określonych górnych granic. Wartości tych miar kształtują się przede wszystkim pod wpływem wartości zmiennych wyrażonych dużymi liczbami"*, a wówczas jako miary podobieństwa mogą one być niedogodne. Miary odległości oparte na metrykach oraz inne miary niemetryczne należy stosować, gdy wszystkie rozpatrywane zmienne są mierzone w tych samych jednostkach lub ich wartości są niemianowane, a ponadto mają ten sam rząd wartości. Wymaga to zazwyczaj normalizacji zmiennych (zob. punkt 4.3) lub jakiegoś szczególnego sposobu ważenia29. Wagi a mogą być wprowadzone do wszystkich powyższych wzorów, na przykład w odniesieniu do metryk w następujący sposób

i

<«»>

Zmienne o dużym rzędzie wartości mogą być skalowane w dół poprzez użycie takiej funkcji wagowej.

Wyznaczone wartości mierników odległości między obiektami są przedstawiane w postaci kwadratowej i symetrycznej macierzy odległości o wymiarach (n X n), równych liczbie obiektów


3trzy-    I    17 Zobacz współczynnik Gowera dla zmiennych różnego typu w punkcie 4.3.6.

Z uwagi na to, że różnice między dwoma obiektami są agregowane liniowo, wystarczy nieraz wartości jednej zmiennej wyrazić w setkach lub tysiącach jednostek, aby radykalnie zmniejszyć odległość.

** W odniesieniu na przykład do gazowych zanieczyszczeń powietrza atmosferycznego punktem wyjścia do zdefiniowania wag mogłaby być toksyczność poszczególnych gazów.



Wyszukiwarka

Podobne podstrony:
dowski). 18.15. Układ sił politycznychStr. & 17.55. Pro-gram na dz, nast. 18.00—19.00. Koncert
10 pazdziernik 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 f
a) 1 b) -W-— —GS—© C) - PI H=dZ Rys. 18.33. Zabezpieczenia
folkowa imprezaLU DOTEK A 18 września (piątek) 2015, godzina 20:30BUNKIER K L U » O ii A L Ii li
Journal des Trlbunaux Mlxtes. 41 jwie: Samedi 13 Fćuior 1932, ii 10 li. 3 l icu: ii Ale.antlrie, rue
wartość średnia tego przebiegu: -Li (2 j ) sin(x)dz 0 =1/T (1+1)= = ~y (-cos
4c765728026cb?7 ło II 12 13 n li /6 r 18 19 20 21 22 23 1 25 26 2m 28 29 3l> (ttłtf f/Stcrtf
pozamałżeńskich w stolicy, ale nie odbiega on znacząco od skali ogólnopolskiej. W latach 2004-2007 1
ijJ i:r / — -^jć 1 1 W —łi M- I I . .Sł 1 1! ? •a * ! J i J lit .. 18 !! I
3un^ w GCK Kargowazebraliśmy 18 642,00 zł 25,20 Euro, 20,04 G6P oraz inną walutę Ale*0 .ofu nie kOfl

więcej podobnych podstron