do danych podlegających analizie. Wykorzystują podejście zwane w teorii rozpoznawania obrazów syntaktycznym {(Jajuga 1990). Na przykład odległość między obiektami ot oraz Oj w metodach przedstawionych w książce nie ma charakteru numerycznego, jak w przypadku odległości euklidesowej:
lecz w większości przypadków reprezentują ją różne odmiany miar syntaktycznych. Najprostsza z nich ujmuje odległość w postaci liczby cech, których wartościami oba obiekty się różnią.
Nieparametryczne metody klasyfikacji nie były raczej rozwijane na gruncie statystyki i pojawiły się poza nią; w teorii rozpoznawania obrazów, psychologii, sztucznej inteligencji itd.
Symboliczne metody klasyfikacji należy postrzegać jako, komplementarne w stosunku dó metod klasycznych —numerycznych, będące ich uzupełnieniem i rozszerzeniem. Mogą być stosowane wtedy, gdy charakter danych statystycznych nie pozwala wykorzystać metod numerycznych lub gdy zadaniem jest otrzymanie rezultatów klasyfikacji w postaci, bezpośrednio zrozumiałej dla osoby dokonującej analizy, a więc w różnego typu systemach wspomagania decyzji, systemach eksperckich itp.
Omawiane w .książce metody przeznaczone są głównie do klasyfikacji obiektów, których cechy reprezentują zmienne jakościowe. Ponieważ na gruncie statystyki podział cech na ilościowe i jakościowe prowadzi do nieporozumied, należy wyjaśnić znaczenie, w jakim pojęcia te będą tu. uży^ahei ..
Cechą nazywa się pewną własność obiektów należących do joz+ ważanego zbioru, wspólną dla wszystkich i przyjmującą wartości z określonego zbioru, np. cecha „kolor” może przyjmować wartości ze zbioru:
{biały, żółty, czerwony, niebieski, zielony}.
Biorąc pod uwagę sposób wyrażania wartości cech, można podzielić je na (Borys 1980): '
— kwantytatywne,
— opisowe.
Wartości cech kwanty tatywnych są liczbami rzeczywistymi, uzys- . kanymi w wyniku pomiaru i wyrażonymi w określonych jednostkach miary (np. ciężar, zysk, objętość) lub są liczbami całkowitymi otrzymanymi w wyniku policzenia (np. zatrudnienie w przedsiębiorstwie). Cechy tego typu często nazywana się też cechami ilościowymi.
Natomiast jeśli chodzi o cechy opisowe, to ich wartościom przypisywane są różnego rodzaju symbole (np. słowa, wyrażenia). W statystyce cechy te określa się także mianem cech niemierzalnych lub jakościowych. Wartości cech opisowych można również wyrazić za pomocą liczb, lecz jest to, Ktoięg^^czgy i często pozbawiony sensu. Stosuje się go zwykle pO;ito.i :bv.iuprdśeić; zapis (np. dfc$ęe&ygp2«f wartość 1 może oznaczać kobietę, a 2 — mężczyznę), a także by spełnić wymagania stosowanych programów komputerowych..
Niestety, podział cech na ilościowe oraz jakościowe nie jest precyzyjny i wywołuje spory.. Aby tego uniknąć, rozróżnia się cechy ze względu na stosowaną skalę pomiaru. Przy czym przez pomiar cechy rozumie się jej porównanie z , wzorcem (wyposażonym w odpowiednią skalę), w efekcie czego można cq najmniej dokonać identyfikacji jej wartości (Steczkowski, |eili^.^§.
W teorii pomiaru wymienia się zwykle cztery skale pomiaru (Steyens
— skala nominalna,
— skala porządkowa,
skala interwałowa (przedziałowa),. . skala ilorazowa (stosunkowa). ,
Dwie pierwsze określa się też mianem skal „słabych”,; a dwie następne piskał .mocnych”.
Skala nominalna — nazywana także skalą nazw — najczęściej-jest stosowana w przypadku pomiaru cech opisowych. Poszczególnym wartościom cechy nadawane są symboliczne nazwy, stąd o dwóch obiektach A i B można powiedzieć jedynie to, czy mają takie same wartości .cechy ęzy różne, tj. czy zachodzą między nimi relacje:
Szczególnym przypadkiem skali nominalnej jest skala dychotomiczna, stosowana do pomiaru cechy dwuwariantowej, tj. przyjmującej jedną
19