kolejnym szczeblom hierarchii są widoczne na dendrogramie. W grupowaniu po-dzialowy m lego nie widzimy i co najwyżej możemy testować różne podziały l wieloma różnymi liczbami skupień, a i tak trudno jest ocenić na oko, która z nich jest najwłaściwsza. Zaproponowano więc pewną liczbę metod, które mogą okazać się pomocne w konkretnej sytuacji. Większość metod nie ma formalnego charakteru i opiera się na wykresie wartości kryterium grupowania względem liczby grup. Duże zmiany poziomu na takim wykresie (powiedzmy wewnątrzgrupowej sumy kwadratów) mają stanowić pewną sugestię co do liczby skupień. Na przykład znaczny spadek tej sumy powinien sugerować większą liczbę skupień ,8. Rozwinięto jednak pewne bardziej formalne metody oceny. Są one znane jako reguły zatrzymania (ang. stopping rules). Pięć takich reguł, które wyróżniły się w badaniach, wymienia Gordon (1999). Niektóre reguły są określane jako ogólne, inne zaś jako lokalne.
W jakimś sensie z liczbą grup wiąże się problem badania izolacji i spójności grup wynikających z zastosowanej metody klasyfikacji. Zasadniczo wyniknął on z analizy porównawczej dwóch metod: najbliższego sąsiada i najdalszego sąsiada. Zdefiniowano w tym celu pojęcie „oddzielenia” (ang. moat) oraz „powiązania” (ang. connectedness) grupy. Oddzielenie danej grupy C należy rozumieć jako różnicę między poziomem , na którym uformowało się to skupienie, a ostatnim poziomem /i,.,, na którym wszystkie obiekty łączą się w jedną ostateczną grupę. Na przykład, owe oddzielenie dla skupienia obiektów (5, 6) w metodzie najbliższego sąsiada wynosi: 4,17—2,51=1,66, zaś w metodzie najdalszego sąsiada: 9,23— 2,51 = 6,72- W hierarchicznych metodach grupowania może dochodzić do poważnego zniekształcenia wyjściowych odległości i dlatego miara ta powinna być interpretowana ostrożnie. W metodzie najdalszego sąsiada oddzielenie będzie zwykle większe niż w metodzie najbliższego sąsiada Jednakże względnie duża wartość oddzielenia na dendrogramie w metodzie najbliższego sąsiada będzie wskazywać na grupę izolowaną.
Literatura naukowa obfituje w przykłady zastosowań analizy skupień Zrozumiała idea metod grupowania oraz dostępność programów komputerowych sprawiły, iż są one stosowane nawet w nadmiarze. Studiując liczne przykłady grupowania, można co najwyżej rozważać, na ile poprawnie stosowano miary zróżnicowania
118 Wykres taki jest sporządzany na wzór wykresu osypiska w analizie głównych składowych. Podobnie subiektywne podejście stosowane jest na podstawie analizy dendrogramu w hierarchicznych metodach grupowania.