2|0 ftMtfmJ| \|«W>
Imświ i Aiuii/J regresji i II. ^1 nie mtvc tyć stosowana. ieU»Nfop aarnc>flu m nehrwe U ominie lc trudność. r.ul/i Blalock (1915.» W) Moj. na Id wżyć 'iwuln^o pn>/rr.»fnn regresji n-ćliniowri kim) znajduje si; * kontpute. mydi poktetidi utyitycinrch
laierakcjf KUwzsa wcnfe aruli/y regres me uwzględnia mozlnroki.» pary. Iroj. ki itd p;cii>kioiOw nut*’., »u<*k Jo równania miernlcję Teki iiiicmI m icsl nowym prc-dyifwrm lei «i|ayt jądo równana regres* pokara* Brzeziński(1997. rozd/ U).
Zmienne rcdundantnc. Pewne predy który mogą hyc rtdundantrie. Izn mog.| ro>n,. cowić wtoki zmiennej zależnej lylko dlatego, ze M iilme iknrelowaoc i innynu /rmennymi niezależnymi (.świecą światłem odhiijin"). Trzeba je znaleźć i uiun^ t równania Robi sie 10 za pomocą boktmtl iatpwt*) analizy regresji Podobnie jen w prnpndku analiz dyskryminacyjnej lub korelacji kanonicznej: zmienne redundani ne «wwi Hiahza a&fro
Przewidywanie i włHfor R Gdy budujemy równanie regresji z myślą o zastoso warno go w praktyce (np. do przewidywania powodzenia w muce lub w pracy), wie), to* *’jest znaczn* ważniejsza mź iswtnok statystyczni Jeśb jest małe. nałezy sie spodziewać dużych różnic miedzy wartościami przewidywanymi a rzeczywistymi. Można udowodnić, że odchylenie standardowe łych różnic w populacji, czyli % tfflfldjnfoHypraw^iw/ito. równa się:
gd/ic o, jest odchyleniem standardowym zmiennej zależnej. Jest to ważny wzór. po mewaz pozwala zdecydować, czy zbiór predyktorów w ogolę nadaje się do pnewidy, winią Y. Zauważmy, że gdy R' jest bliskie 0. to błąd przewidywania jest bliski odchy leniu standardowemu Y Jest to równoważne .przewidywaniu" polegającemu na przy pisaniu każdemu badanemu tej samej prognozy równej f. W miarę jak R' rośnie n» mcc malej* i przy iM ich odchylenie standardowe jest nmne 0. co znaczy, ze wr-toto przewidywane dokładnie pokrywają sag z rzeczywistymi
Wiele łat temu grupa badaczy zainteresowanych bardziej racjonalnymi metodami rekrutacji na studia doniosła z dumą. te cztery predyktory; wynik egzaminu wstępnego, oceny na Świadectwie maturalnym, wynik testowania inteligencji i tzw. wskaźnik biogn-fczno-srodomskowy wysoko koreluj z wynikami studiowania na I i II roku w jednej z akademii medycznych (/H70). Żeby wykorzystać to równanie do selekcji Landyda-uw. tntKa*w,pm sprawna niezależnej próbce, ponieważ nie tylko me ma zad ncj gwinncji że obliczone wagi będą zawsze takie same. ale jest bardziej prawdopodoh nc. że będą malały, niż że Mą rosły. To zjawisko, zwane kurczeniem się R, jest tym wy raźniejsze, im mniejsza była pierwsza próbka Uważa się że względnie stabilne uac* b R mana azyikać dopiero wtedy, gdy ni każdy predyktor przypada )0- 300 osób.
Ale nawet gdyby R okazało się stabilne, to i tak łatwo obliczyć, że trafność prze-widywania byłaby lyłkoo30\ większa niż trafność przewidywania, te wszystkim kin-dyditom będąc się wiodło średnio. Ten sam wzór informuje, że zmniejszenie Nędi przewidywania o połowę jest możliwe dopiero wtedy, gdy współczynnik korelacji przekracza wartość 0.86. co zdarza się niezmiernie rzadko.
Słitjityin TH
Oczywiście nie po to egzaminuje uę kandydatów, by móc pi ze widzi* wyńft \ ^wanu. leci po la by przewidzieć uysobK poradzą aa studiach, czy mc Zamuit analizy regres* lepiej wmmtc analizę dyski jurnacyM porwała** przewidywać, w które) i tych dwóch klas /najdzie tg kandydat
)lkmiki nielkmei ejtkti
gadacze często zapominają, tt wartość testu statystycznego nte jest marą wnikała wyniku. Nie jest dlatego, 2c t, / czy x: zależą od liczebności próbki przy lej same. wielkości różnicy między grupami t rośnie w miarę wzrostu wteftoto grap, Zety orzec, jak duży jest wynik, pou/ebujemy innych mierników. Ich wiżnoic wran gdv wynik mi znaczenie praktyczne Kiedy sprawdzamy jakieś wyrafinowane przewidywane teoretyczne, liczy się nawet slaby wynik, jeśli tylko ulotnie rożni się od zera. Ale gdy wynik ma być zastosowany w praktyce, tama ulotność daje niewiele W pewnym doniesieniu przeczytałem o związku między postawą promoderm/acyjną nauczyciela a wielkością dochodu w jego rodzinie. Na dowod przytoczono wipołc/ynnik korelacji: z 0,12. Cóż z tego, że ten współczynnik jest istotny na poziomu <105. ikao «ia te zaledwie 1,4% zróżnicowania obu zmiennych* Gdybyśmy chcieli przewidywać p» stawę na podstawie dochodu, zredukowalibyśmy błąd przewidywania zaledwie o IV Choć istotny statystycznie, wynk jest nieistotny dla praktyki Jeśh posługujemy się leuem t. możemy zmierzyć wietoić rożncy n pomocą w1 (omega kwadrat) Hayia:
l łnit/fj- I
Miemah ten mioiri. pM zfógzmcaminii gaicaaq aleźnq w>>yiinii anicnoa niezależna W przypadku jednoczynukowtj analizy wariancji proponuje się mac oszacowania. Najprostsze to if (eu kwadrat):
W wieloczynnikowych analizach wariancji wielkość efektów szacuje się u pomocą cząstkowej ty . W mianowniku znajduje się wówczas SSimm poomicuzoM o SSy odpowiadające pozostałym efektom Na przykład dla efektu głównego komentarza iV 38SO,9/(22993.5-11 >.6-2755.6). czyli 0,19.1 lub 19.3% Szerzej pisze olym Brzeziński (1985).
Gdy obliczamy współczynniki korelacji Pearsona wielkość związku szacuje /. czyli współczynnik determinacji. O wielkości efektu w analizie regresji najlepiej informuje R\ Trudniej oszacować wielkość efektu pojedynczego predyltori BUfcck (1975.1 19) proponuje oblit/.c współczynnik ŁoreUcji cz4»;lowej u/n wspok/yn-nik korelacji między danym predyktorem a tą częścią zmiennej zile/nej. której nie wyjaśniły jiozostałc predykloryż Kwadr.il lego wipotczyiuuka inferanaie. jaki procent zrózwcrmawi* zmiennej załrzng wyjawia dany predyiior. gdy pozostałe pndyitory