B.
Analiza macierzy współ czynników korelacji.
Należy tu wybrać takie zmienne objaśniające, które są silnie skorelowane ze zmienną objaśnianą i jednocześnie słabo skorelowane pomiędzy sobą. Punktem wyjścia jest macierz U=[R0; R], gdzie: Ro = [rY.xJ. R = [r*J.
Dla zadanego poziomu istotności a oraz dla n-2 stopni swobody z tablic rozkładu Studenta odczytujemy wartość krytyczną statystyki I* a następnie wyznacza tzw. Wartość krytyczną współczynnika korelacji:
r*= [ (I*)1 2/ ((I*)2 + n-2) ].
1. Ze zbioru potencjalnych zmiennych objaśniających eliminuje się wszystkie zmienne, dla których zachodzi nierówność:
[rj ś r*;
zmienne X„ są nieistotnie skorelowane ze zmienną objaśnianą.
2. Spośród pozostałych zmiennych jako zmienną objaśniającą wybiera się taką zmienną Xht, dla której:
[nj =max {[rJ };
zmienna Xh« jest nośnikiem największego zasobu informacji o zmiennej objaśnianej Y,.
3. Ze zbioru potencjalnych zmiennych objaśniających eliminuje się wszystkie zmienne, dla których:
[rhJ > r*;
są to zmienne zbyt silnie skorelowane ze zmienną objaśniającą Xi«, a więc powielające dostarczone przez nią informacje.
Postępowanie przedstawione w punktach 1, 2, i 3 kontynuuje się aż do momentu wyczerpania zbioru potencjalnych zmiennych objaśniających.
W przykładzie macierz U jest równa:
0,979912
1
0,900368
0,938194
0,000000 0,956612
0,900368
1
0,915886
0,000000 0,957427
0,938194
0,915886
1
-0,07217 0,075378
0,000000
0,000000
-0,07217
1
Wartość statystyki I* odczytana z tablic testu t - Studenta jest równa /dla rozkładu (n-2,a); gdzie n = 8 , a = 0,02/ 2,896, stąd r* = 0,09.
0.979912
0.956612
0,957427
0,075378