W licznych badaniach biometrycznych obserwuje się równocześnie wiele cech charakteryzujących populację biologiczną. Cechy te mogą być (i na ogół są) wzajemnie zależne, w związku z tym istotne jest określenie siły tej zależności oraz jej wykorzystanie do przewidywania jednej cechy na podstawie innej. W pierwszej części skryptu rozpatrywaliśmy zależność między dwiema cechami (zależną i niezależną), opisując ten związek funkcją liniową — prostą regresji. Gdybyśmy mieli zespół trzech zmiennych Y, X,, X2 i chcielibyśmy określać wartości cechy / na podstawie Xx lub X2, to można to zrobić konstruując dwie funkcje regresji
y=/i(*i) oraz Y =/2 (X2)
i wybierając tę z nich, która jest dokładniejsza. Wydaje się jednak intuicyjnie jasne, że łączne wnioskowanie o cesze Y na podstawie wartości obu zmiennych X, i X2 powinno dać wyniki lepsze (a już na pewno nie gorsze) niż rozpatrywanie pojedynczych związków.
Rozpatrujemy zespół cech J\ Xj, X2, ...,Xp o których zakładamy, że są określone na wszystkich elementach populacji. Liniowy związek między wartością cechy /-tego elementu populacji, tzn. y4, a wartościami pozostałych cech tego elementu, tzn. X;, definiujemy za pomocą równości:
Analizując powyższą zależność możemy stwierdzić (jest to uproszczenie), że dzieli ona wartość y, na trzy części:
— część p0 wspólną dla wszystkich elementów populacji.
— części Pj X/j wynikające z „czystego” wpływu danej cechy,
— część e, wynikającą z wpływu czynników losowych, specyficznych dla yr, tzn. takich, które nie są związane z pozostałymi cechami.
250