gd/ic R: kw.uJr.li współczynnika korelacji wielokrotne)
:V rozmini prdby.
v liczba predyklorów
Stopień obciążenia R: jako oszacowania odpow icdnicj wam**., u p,
u t lii* VI ri 9 /«• .
I
M-a* w wagiregrcsji wielokrolńelobtaonc * )»!*, p,,*
, “ "„,L Procedura luka no.i miano miała ma i raj......... .
« Lrerium a pnrdyktorami ważonym, określa n
laejc miedzy . Jcm , wielkość1 r.. ogólnie r/ccz biur*
ireyi.mrj' “**? ^elokn„nej w populacji. Obciążenie ...
w—pX- • zwiększa sie wra, ze w**™ Bgy^, J
Przy obliczaniu regresji wielokrotnej R: podlega wpływowi korelacji. ub. między predyktorami. Widać to wyraźnie we wzorach służących do oWiwar* regresji dla dwóch zmiennych niezależnych
Rozważmy przykład z jedna zmicnn;j zależna i dwiema zmiennymi • nymi. czyli predyktorami. Dla uproszczenia przyjmijmy, ze ri: = r,, = 0,50 w. rę jak zmienia się rv. R: zmienia się w- następujący sposób:
fy R ‘
0.0000 CkSOOO
0.5000 0.3333
0. 7071 0.2929
0.8660 0.2680
1.0000 ?
Gdy r2j rośnie. R■ maleje. Wydawałoby się. że gdy r:, osiąga wanoś. powinno zbliżać się do 0.25(X) jako do granicy. Jednak okazuje się. /:
1. = pt = 1/0. czyli wagi regresji są nie określone W tym wypadka :• zmienne niezależne są ze sobą skorelowane w sposób doskonały N.. ... wszystkie punkty układają się w linię prostą 1 możemy dokładnie pr/cw:J/ .\ zmienną na podstawie drugiej. Ze statystycznego punktu widzenia tc dw.c /r są równoważne 1 stanowią miarę tej samej cechy.
Znajomość trzeciej zmiennej nie wnosi juz na temat zmiennej /A/n. nowej informacji, jaka nie zawierałaby się juz w drugiej zmiennej. Tr/cdi/r < jest zatem redundantna. Powicia ona to. co jest już nam znane Nieokreślona ■: regresji mówi nam po prostu, ze w tej sy tuacji usiłowanie obliczenia tych bezsensownym wysiłkiem.
R>c. 2ł>2. Graficzne prwdsuwwwe L>vcU,i nś<dł> wmci*^,
Wpływ korelacji między zmiennymi niezależnymi na * mozru lustrów* tak jak na rycinie .6 . Zmienne przcdstaw.onc Lun * w po**, koł o powyentb* jednostkowej odpowiadającej wononcj. zmiennej dla wyników onlanJowych Na lyCUUe 26.2a mamy dwa kola przedstawiając zmienne X, i X. Koła te mc zacho-d/4 na siebie. Zmienne te nie są skorelowane. Ą: = 0. Na nonie 2f>2b koła nakładają się na siebie. Powierzchnia wspólna odpowiada części wanancj, wspólne, obu zmiennych, co wyraża = 0.25. Na rycinie 26.2r pr/cdsLiw.ona jcm podobai sytuacja z trzema zmiennym, Zmienne X. i X. nakładaj* się na zmienna X, aJc mc na siebie nawzajem. W tym wypadku ru = 0.25. r„ = 0.25. ić, = 0. a = = 0.50. Połowę wariancji X, wyjaśniają zmienne X. i X, razem. Na rycime 26.2J wszystkie trzy koła nakładają 'ię na siebie Tu = rj, = r., = 0.25. * f? = 0.3333 Powierzchnia wspólna zmiennych X. i X, nakłada >,ę na powierzchnię wspólna zmiennych X, 1 X,. Obrazuje to zaciemnione miejsce na >rodku rysunku 2t> 2d. \ zatem część powierzchni wspólnych X, 1 X, oraz X, 1 X, jest niejako podwojona, powtarza się. jest więc redundantna przy przewidywaniu X, na podstawie X. 1 X Zwróćmy uwagę na znaczna różnicę w zakresie Na rycinie 26.2r jest ono równe 0.50. a na rycinie 26.2d tylko 0,3333. Zmniejszenie się wartości przewidywanej wynika z korelacji, czyli nakładania się \ i X,.
Przy więcej niż dwóch zmiennych graficzne przedstawienie wpły wu redundancji staje się bardzo skomplikowane Zazwyczaj przy przewidywaniu jednej zmiennej na podstawie więcej niż dwóch innych zmiennych próbujemy zidentyfikować i wydzielić takie zmienne nic/ale/nc. które w miarę możności s* silnie skorelowane ze zmiemuj zulc/n*. a zarazem słabo skorelowane między sobą W praktyce może
52«l