mu jemy Y\ czyli a$zocO\vani| wartość Y. Kolumna 6 w tabeli 8.1 pok.t/i,; cowanc przewidywane wyniki testu czytania, uzyskane dzidki zastosnu.im , ■ | równania regresji
Dotychczas zajmowaliśmy się regresją Y dla X. Linia regresji została umu.iv, na po to. by zminimalizować sumę kwadratów odległości, równoległych di< między punktami a limą. Problem polegał na oszacowaniu bąd/ przewiń z. minimalnym błędem, wyników testu czytania na podstawie ilorazów mul Jeżeli jednak chcemy oszacować bądź przewidzieć ilorazy inteligencji na p.xi wyników testu czytania, musimy posłużyć się inną lima regresji, mianowicie regresji X dla Y. Linia ta umiejscowiona jest w takiej pozycji, by suma kwadr odległości, poprowadzonych równolegle do osi X. między punktami a linia • najmniejsza. Jeżeli .Y jest wartością zaobserwowaną, a .V* wartością os/.K, bądź przewidzianą na podstawie Y. to lima la jest umiejscowiona tak. aby w.-c.i Z(X - X*)2 była najmniejsza
Wzór linii regresji X względem Y jest następujący:
X = bnY + an .
gdzie X* — oszacowana bądź przewidziana wartość X. bn — nachylenie linii regresji. a~ — punkt, w którym linia przecina oś X.
Wartości b, i a, można obliczyć według następujących wzorów:
W I
(8’ I
" " N1YZ-\1Y)2 LY--N?2
~ N'— * X - bly7-
Dla danych z tabeli 8.1 wielkość 2Y2 = 74 885. Wartości IXY. I.Y i Ił . takie same jak podano w podrozdziale 8.4. Po zastosowaniu wzorów (8.61 ns' otrzymujemy:
18 x 130806-2024 xI155 _
- = 34.98-
„ 2024- 1207 x II55
18
Linia regresji dla przewidywania ,Y na podstawie Y jest zatem dana przez nmiu: Y* m 1.207)' ♦ 34,98
Podane wyżej wzory i obliczenia u <K„wtfcu- _
v u v / v.»łv . JW,ł°C u/upcłmcniem WtatŚm ru
rei*** y db * // U > ,,nc .ib „ » taUn
j,agran..e rmpfowtn" i«mcw d*ic l.n.e Jedn. |,„„ p„CVL„| g „Jiuv.,e
,„wad MJfiK kwadratów odchyleń rńwnote^ch do m, r. IKj im„ cryl. Ul -- /-)•■ Dnigu linia jest umtejscnwwu ul h> sumę k»udntó»
Odchylę* równoległych do om .V. .*| lm„. etyl, UX Xr j„t|, mKĆT. x , y istnieje korelacja doskonała, to te dwie Imię się pokrywają
wyrażonych w postaci odchyleń
Dotychczas zajmowaliśmy się regresja Y dla X i X dla Y na podstawie wy ników surowych. Możemy jednak sporządzać' linie regresji, tuc tylko opierając się na wynikach surowych, lecz tak/c biorąc za podstawę odchylenia. czyli wyniki w postaci X — X — X i y = I - P. Nachylenia tych dwóch linii regresji wyrażone w postaci odchyleń zapisuje się po prostu następująco:
h - 52
<8.81
‘ Li h -£2
Nachylenia linii w modelu dla odchyleń są oczywiście dokładnie takie -omc jak w modelu dla wyników surowych. Równania <S.8i są postaciami równań 18.3» i (8.6) dla odchyleń. Zmienia się natomiast położenie osi Punktem przecięcia obu linii regresji z osiami jest punkt 0. Obie linie przechodzą przez punkt początkowy a„ = tfn = 0.
iłczynnik według momentu iloczynowego (mieszanego 1 jest statystyka określającą silę związku między dwiema zmiennymi. Jego definicję można łatwo sformułować. odwołując się do zjawiska regresji. Współczynniki korelacji tradycyjnie konstruuje się w taki sposób, aby przyjmowały wartości od 1 do *1. Wartość ujemna wskazuje związek ujemny, czyli sytuację, w której X maleje, a ) wzrasta Wartość dodatnia wskazuje związek dodatni, czyli sytuację, gdy X wzrasta, a > maleje. Na oznaczenie wartości współczynnika korelacji 1 próby stosuje się powszechnie symbol r. Natomiast parametr populacji, czyli korelację w populacji, z której została pobrana próba, oznacza się symbolem p.
Omawiając regresję liniową >’ względem X /wróciliśmy uwagę, że wynik ) można traktować jako złożony z dwóch części. Jedna część 10 przewidywana war-
141