1=
gdzie Z =X
(14.1)
gdzie macierz £ jest macierzą symetryczną stopnia p + q. Zakładamy również, że Z jest macierzą nieosobliwą, przy czym jej wyznacznik IZI > 0. Oznaczmy przez s rząd pod-macicrzy
Szukamy pary funkcji liniowych najlepiej dopasowanej (reprezentującej) obydwa zbiory zmiennych. Główna idea analizy kanonicznej polega na tym, aby funkcję liniową zmiennych x postaci
u = /, xl + l2x2+... + lpxp i funkcję liniową zmiennych y postaci v = m, y, +m2y2 + ... + mqyq
dobrać w taki sposób, aby korelacja w parze zmiennych kanonicznych była maksymalna. Spełnienie tego istotnego warunku oznacza, że pary zmiennych kanonicznych u, i vr możemy uważać za dobrą reprezentację danych wyjściowych w ramach przyjętego modelu. Liczba par zmiennych kanonicznych jest równa liczbie zmiennych zależnych, tzn. zmiennych objaśnianych.
Szukamy zatem funkcji liniowych u = LTx i v = MTy spełniających warunki:
1. a2(u) = a2(v) = 1,
2. kowariancja cov(m, v) = max.
Funkcje u i v noszą nazwę zmiennych kanonicznych, a wektory L i M — wektorów kanonicznych. Pierwszy warunek z wyżej wymienionych oznacza unormowanie wariancji szukanych funkcji liniowych, przy czym
a2 (u) = o2 (Ltx) = (Lrx) (Ltx)t = LTxxrL = LT!LaL ,
i analogicznie
a2 (v) = o2 (Mrx) = (Mry) (MTy)r = MTy yrM = MT'LyyM .
Natomiast kowariancja cov(m, v) = pMV
293