238 4. Anuli; VŁń skupii:il
Manty'ego (1986), który rozważa możliwość grupowania krajów europejskich o podobne; strukturze zatrudnienia, wyrażając tę strukturę odsetkami zatrudnionych w poszczególnych działach gospodarki. Każdy kraj stanowi zatem jed nostkę badania. Zagadnieniem, ze względu na które kraje są porównywane, jest zatrudnienie jako całość (jeden lub 100%), zaś addytywnymi częściami tej całości są udziały zatrudnienia w poszczególnych działach. Aby je otrzymać, trzeba zmic rzyć te części, co w tym przypadku odbywa się - formalnie rzecz biorąc - w drodze zliczenia zatrudnionych Dalsze przykłady nasuwają się same: udziały poszczególnych działów gospodarki w produkcie krajowym brutto porównywanych państw, struktura demograficzna (np. według wieku) ludności porównywanych krajów, struktura przestępstw itd. Również w innych dziedzinach badań takie sytuacje mogą zaistnieć, jak na przykład porównywanie struktury kolonii zwierząt jakiegoś gatunku według przynależności do wyodrębnionych klas genetycznych.
Przyjmijmy, że mamy n jednostek badania i pewną szczególną własność, dla której wyróżniamy pewną liczbę p kategorii (lub klas). Każdą z tych kategorii traktujemy jako odrębną cechę (j = 1,2,..., p). Dla każdej kategorii określamy jej udziały w danej wielkości, ze względu na którą porównujemy obiekty. Oznaczmy przez ptj udział ;-tcj kategorii w całości zjawiska w jednostce badania
r
i (j s 1,2.....n), przy czym Ż plf = ldla każdego i. Istnieją różne propozycje mie
rzenia odległości między jednostkami na podstawie danych w postaci proporcji,
Jedną z możliwości jest miara48
(4.44)
będąca połową sumy bezwzględnych różnic proporcji. Przyjmuje ona wartość 0, gdy p = p t dla wszystkich j (identyczność) oraz wartość 1, gdy nie ma wspólnych kategorii, tzn. zachodzi wzajemna rozłączność występowania (dla każdej kategorii mamy różnicę 0— p9 lub prj — 0, a suma wynosi 2).
Inną miarą zróżnicowania jest wielkość
(4.45)
4H W badaniach przestrzennych, a mianowicie w analizie lokalizacji, wielkość ta występuje pod nazwą współczynnika Giniego albo indeksu koncentracji Analogicznie zbudowany jest też współczynnik lokalizacji Florencea, z tym że suma modułów różnic jest dzielona przez 200 dla proporcji wyrażonych w postaci odsetków, tak że przyjmuje on wartości z przedziału [0.1] (zob Ha iicki, 2002. Goodall. 1987).
która przyjmuje wartości od 0 do 1 Wartość 0 {idealne podobienatwoj przybiera ona, gdy odpowiadające sobie udziały są takie sann czyli gdy p « p Wartość 1 (całkowite niepodobieńst w o obiektów) zrealizuje sii; natomiast wówczas, gdy za chodzi wzajemne rozłączne występowanie (w takiej sytuacji iloczyn p p —Odia
każdego j, a w konsekwencji również suma I pi)pt = Oj
Miara to wymaga pewnych wyjaśnień W punkcie 4 3.2 tego rozdziału zdcfi niowano cosinus kąta między wektorami \ , i i ,, reprezentującymi obiekty 1 wzór 4.29) i stwierdzono, że przez analogię do współczynnika korelacji między obiek tami może on być traktowany jako miara podobieństwa typu korelacyjnego łezek przyjmiemy, że zmienne, które charakteryzują obiekty maja postać proporcji (czyli wskaźników struktury), to cosinus kierunkowy zapiszemy jako
5 p„p*
4 46
a dalej miarę odległości w postaci danej wzorem (4,45).
W badaniach genetycznych, gdy trzeba opisa< grupy lub populacje w termi nach częstości występowania genów stosuje się miarę odległości zwaną od ległością genetyczną (ang. genelic distance), która jest definiowana następująco (zob. Everitt, 1993)
(4.47)
gdzie
(4.48
gdzie z kolei pn i pv są częstościami genów w Mej parze alleli1' danego loeus w populacji r i s (jeśli rozważa się kilka loci, to odległości genetyczne dr dodaje
się)50
Skoro oba wskaźniki dj,” i J są miarami odległości, to za miary podo bieństwa można przyjąć s= 1 — d; oraz 5^=1 — d'* Pierwsza z nich
Alicie (lub allelomorfy) to różne odmiany danego genu U pojedynczego osobnika występują \yl ko dwa alicie każdego genu lm większa jest liczba odmian danego genu. tym większa jest liczba możliwych kombinacji między nimi i większa liczba genotypów (liczba kombinacji z powtórzę mamił Każdą populację charakteryzuje określona częstość występowania poszczególnych alleli Badaniem prawidłowości rozdziału alleli i zmian częstości genów w następujących po sobie pokoi* niach zajmuje się genetyka populacji.
50 leżeli chcielibyśmy uogólnić tę miarę na zmienne jakościowe, to słowo „loeus" powinniśmy zastąpić słowem ..zmienna”, natomiast termin „allele" terminem kategorie zmiennych