4.1. Metody analizy skupień
4.1.1. Wprowadzenie
Analiza skupień jest techniką wielowymiarową pozwalającą wykrywać podobieństwa między obiektami. Związana jest ściśle z zagadnieniami klasyfikowania i porządkowania. Problemy te, związane z wszelką działalnością poznawczą człowieka, od dawna spotykały się z zainteresowaniem przedstawicieli różnych dziedzin wiedzy. Praktyczne wykorzystanie tworzonych narzędzi powstało z chwilą zastosowania formalnych procedur klasyfikacji oraz wprowadzenia metod ilościowych, natomiast szybki ich rozwój nastąpił w latach 60 i 70-tych w związku z postępem techniki komputerowej. Obecnie analiza skupień znajduje zastosowanie w różnych dziedzinach nauki: antropologii, biologii, psychologii, medycynie, geografii, rolnictwie, lingwistyce, w badaniach nad rozpoznawaniem obrazów i sztuczną inteligencją. Liczne są zastosowania w naukach ekonomicznych (regionalizacja przestrzenna. modelowanie zjawisk społecznych, segmentacja rynku).
Istnieje duża liczba publikacji poświęcona analizie skupień, jej algorytmom i metodologii. Do najbardziej znanych pozycji poświęconych tej tematyce należą: [Anderberg, 1973], [Sneath. Sokal, 1973], [Hartigan, 1975], [Everitt, 1980]. W języku polskim przegląd problemów analizy skupień zawarty jest w pracy [Grabiński, 1992], natomiast jej zastosowaniom w badaniach społeczno-ekonomicznych poświęcone są książki [Grabiński, Wydy-mus. Zeliaś, 1989] i [Pociecha, Podolec, Sokołowski, Zając, 1990], Z kolei praca [Marek, 1989] zawiera kompleksowy opis pewnej klasy najczęściej stosowanych metod grupowania, zwanych metodami SAHN (Sekwencyjne, Aglomeracyjne, Hierarchiczne, dające Nie-pokrywające się skupienia).
Klasyfikacja a grupowanie
W niniejszej pracy będziemy odróżniać pojęcia: klasyfikacja i grupowanie (skupianie) (por. [Mezzich, Solomon, 1980]).
Mówiąc o klasyfikacji mamy na myśli metody pozwalające przypisywać obiekty do zdefiniowanych wcześniej grup. W przypadku klasyfikacji mamy zdefiniowane grupy obiektów. natomiast zadanie polega na przyporządkowaniu określonych obiektów do odpowiednich grup, zgodnie z ustalonymi kryteriami. Przykładem metody klasyfikacji jest zapocząt-
przez R.Fishera analiza dyskryminacji, w której wykoryzsłuje się funkcje dyskryminacyjne.