Dla metod hierarchicznych można badać zachowanie się przestrzeni metrycznej podczas kolejnych etapów łączenia obiektów w skupienia [Marek, 1989]. Początkowy etap łączenia dwóch pierwszych obiektów jest identyczny dla wszystkich metod aglomeracyjnych, po-nieważ wychodzą one z tej samej macierzy odległości D. Zostają połączone dwa najbliższe obiekty. Rozbieżności występujące w następnych krokach wynikają z innego rodzaju zniekształcenia przestrzeni, spowodowanego odmiennym sposobem obliczania odległości między skupieniami (redukowane macierze odległości w kolejnych krokach mogą być inne dla różnych metod skupiania). Wyróżniamy 3 rodzaje przekształceń: zwężające, gdy dla nowo powstałego skupienia St = S cj Sq mamy:
d{S,,Sr)+d[S'.Sr)
4.28
r ^ p, r q
tzn. odległość nowego skupienia S, od dowolnego skupienia 5,jest mniejsza niż średnia odległość starych skupień Sr i Sq od skupienia S, (wyliczana na podstawie wcześniejszej macierzy odległości); zachowujące, gdy zachodzi równość:
d(S,.S,) =
4.29
2 . r ^ p, r ^ q
rozszerzające, gdy zachodzi nierówność:
d{S„Sr):
d{Sp,Sr)+d{Sg,Sr)
4.30
Metoda najbliższego sąsiedztwa jest metodą zwężającą, metoda najdalszego sąsiedztwa jest metodą rozszerzającą, a metoda średniej odległości między skupieniami jest metodą zachowującą. W przypadku pozostałych metod możemy jedynie mówić o tendencjach do zwężania, rozszerzania lub zachowywania przestrzeni. Metoda środków ciężkości i metoda średniej odległości wewnątrz skupień wykazują tendencję do zachowywania przestrzeni, a metoda Warda do rozszerzania. Ostateczny efekt zniekształcenia zależy od konfiguracji danych.
Niekorzystną cechą metody najbliższego sąsiedztwa jest tendencja do tworzenia tzw. łańcuchów, w których odległości między dwoma obiektami mogą być znacznie większe niż odległości od obiektów innych skupień.
134