Dlatego należałoby raczej określić równanie regresji wyższego stopnia, a następnie, po zbadaniu istotności współczynnika regresji przy najwyższej potędze, ewentualnie obniżyć stopień równania.
Przykład 1. Predykcja pojemności czaszki1
Zadanie polega na oszacowaniu pojemności czaszki w sytuacji, gdy czaszka jest połamana lub uszkodzona i pojemność nie może być zmierzona bezpośrednio. W takim przypadku pojemność czaszki można z pewną dokładnością oszacować na podstawie wyników pomiarów pewnych cech zewnętrznych, jeżeli tylko takie pomiary są możliwe do wykonania. Podstawowe dane, które są tu potrzebne, to kompletne wyniki pomiarów zarówno pojemności czaszek jak i danych cech zewnętrznych wykonanych na kilku dobrze zachowanych czaszkach. Dane te posłużą nam do oszacowania funkcji regresji, która z kolei będzie służyła do predykcji.
Trzy podstawowe cechy zewnętrzne, na podstawie których można szacować pojemność C czaszki, to wymiar strzałkowy (odległość gładzizna — potylica) L, największa szerokość kości ciemieniowej B oraz wysokość (odległość pomiędzy podstawą czaszki i bregmą) H. Ponieważ wielkością, którą mamy szacować, jest pojemność, odpowiednią funkcją regresji może być funkcja
C = yL P' B*2 // P3 (13.9)
gdzie y. Pi. P2. P3 są parametrami, które należy wyznaczyć. Wprowadzając nowe zmienne
y = log10C. = logu, Ł. *2 = log10fl, Ar3 = log10// ,
możemy powyższą funkcję napisać w postaci
gdzie po = log10Y. Warto zauważyć, że wybór postaci funkcji regresji jest w tym przypadku arbitralny, równic dobrze można przyjąć funkcję regresji postaci
C = P0 + P,L + P2# + P3// (13.11)
lub też
283
Zaczerpnięty z: Rao C. R.: Modele liniowe statystyki matematycznej, PWN, Warszawa, 1982