183
Dodatek 1. Problem wyboru metryki w przestrzeni cech
Kolejnym defektem, wspólnym dla metryk p\ -rps, jest fakt oparcia ich koncepcji na milczącym założeniu o ortogonalności bazy przestrzeni cech X. Założenie to w ogólnym przypadku jest niczym nie usprawiedliwione, gdyż wybór cech x„ jest zwykle podyktowany możliwościami pomiarowymi i nie ma żadnych przesłanek, że tak uzyskane wartości x„ wyznaczają ortogonalną bazę. Wprost przeciwnie, w większości praktycznych zadań można bez trudu wykazać, że poszczególne składowe wektora x są ze sobą skorelowane.
Rozważmy, jakie są tego praktyczne konsekwencje. Załóżmy, że składowa x„ jest silnie skorelowana ze składowymi xM orzą x,. Oznacza to, między innymi, że istnieje równanie regresji o postaci:
xv — ,x^ -ł* Pjji,Xjj -f- Poi, -f (Dl.9)
pozwalające wyznaczać wartości x„ na podstawie wartości x^ oraz x,. Wartości współczynników regresji oraz P0„ mogą być wyznaczone
przy użyciu standardowych procedur analizy regresyjnej, zaś składnik e„ może być pomijalnie mały przy silnej korelacji pomiędzy i, a i, i x,. Pominięcie składnika s„ we wzorze (Dl.9) prowadzi jednak natychmiast do wniosku, że wszystkie wartości x„ leżą na pewnej prostej (wyznaczonej przez /?„„) na płaszczyźnie xllxn. Jak z tego wynika, traktowanie
x„ jako zmiennej składowej odkładanej na osi prostopadłej do pozostałych jest zniekształceniem rzeczywistości.
Możliwe i celowe jest więc stosowanie innych metryk, na przykład metryki Mahalanobisa
pr(xl‘,x’>) = -£’’)TT-1(£'i - i"), (Dl.10)
w której obecność macierzy kowariancji cech T (patrz wzory (116) i (118)) prowadzi do„wyprostowania” nieortogonalnego układu współrzędnych na drodze apriorycznej transformacji liniowej. Warto zauważyć, że dla cech zdekorelowanych pi sprowadza się do metryki P2, przy A„ określonym wzorem (Dl .4). Metryka Mahalanobisa jest przykładem metryki kwadratowej o ogólnym wzorze
(Dl.11)
p8(x'',x'') = \j(xM — xi)TH(x>‘ — ii),