4.4. Regresja wielokrotna — wybór zmiennych 4.4.1. Opis metody
Dotychczas rozważane modele regresji były modelami pierwszego stopnia jednej zmiennej niezależnej. Bardziej ogólny typ modelu liniowego zmiennych X|, x>,.., x% może być przedstawiony w postaci:
(4.24)
E(r | x)« p,, + fi, f,(x) + f2(x)+... + Pm fm(x).
Każda funkcja fi(x), i ■ 1,2,.... m jest ogólnie funkcją zmiennych niezależnych xT ■ (xi. X2, .... Xt) i może przybierać dowolną postać. W najprostszym przypadku każda fj(x) może zawierać tylko jedną zmienną x. Nieznane współczynniki Po, Pi, .... Pm nazywa się współczynnikami regresji wielokrotnej. Interesują nas następujące problemy:
- wybór podzbioru (f(x), fj(x), .... l*m(x)) funkcji zmictmych niezależnych do modelu regresji z pewnego zadanego zbioru,
- oszacowanie współczynników regresji po. Pi,...» Pm i weryfikacja hipotez Ho.: Pi • 0, i ■ 0,1,..., m,
- ocena stopnia dopasowania zależności zawierającej wybrane funkcje zmiennych niezależnych do danych.
Niech (Xn, X|2, X|k, yi), ..., (x.i, x^..... X*, y„) będzie ciągiem n wektorów
obserwacji zmiennych niezależnych xi, X2,.... x* oraz zmiennej zależnej Y. Przyjmuje sie, że zbiór funkcji fj(x), k(x), —- fa(x) jest zadany, przy czym liczba funkcji w tym zbiorze m+1 < n. Jedną z metod wyboru podzbioru funkcji f(i) zmiennych niezależnych jest metoda odrzucania. Zasadnicze etapy tej procedury są następujące:
1. Oblicza się oszacowania współczynników regresji w modelu zawierającym wszystkie możliwe funkcje zmiennych niezależnych, stosując metodę najmniejszych kwadratów zdefiniowaną w następujący sposób:
(4.26)
59