czyli odległość miedzy osiq X a linia rcgrcsii. mierzona równolegli iej. Druga część to różnica między wartością Y zaobserwowaną ,, w. ..
teść Y
ostatniej. Druga część to różnica między wartością >' zaobserwowan i vv ..
Y przewidywana, czyli Y - Y Wyniku stąd. że Y = Y + tY - >'» Jc/cli. stron tego wyrażenia odejmiemy F. otrzymamy:
Można wykazać, ze te dwie części. (Y - V) i (F - Y). są od siebie u albo nic skorelowane ze sobą. gdy linia regresji jest wyznaczana metodą nj)nir,K-kwadratów Metoda ta umiejscawia limę regresji w takiej pozycji, że suma U , odchyleń od niej jest najmniejsza. Zatem przez podniesienie do kwadratu, zsuń w obrębie N elementów i odrzucenie trzeciego członu otrzymujemy:
KF - F)2 = 1(Y - F)2 ♦ Z(F - Y):.
Tak więc całkowitą sumę kwadratów Y można traktować jako mun sumy kwadratów wartości przewidywanych i sumy kwadratów błędów pi/, wania. W bardzo realnym sensie suma kwadratów KF* - F): jest tą częścią >r ności w zakresie F. którą można wyjaśnić, przewidzieć, przypisać lub , i przez zmienność w zakresie X. Opisuje ona zasób informacji, jakimi djsp.r.. na temat Y. na podstawie naszej znajomości X. Suma kw adratów Ii) V nie wyjaśnioną częścią zmienności Y. częścią, której nie można przypisać n. ności X. lecz którą trzeba wyjaśnić wpływem innych czynników Ponieważ , my kwadratów są bezpośrednio dodawalne do siebie, to jeżeli KF - F): - : i, I(Y - F)2 = 750. a KF- >')2 = 250. uprawnione jest twierdzenie, że częsc r 0.75 lub 75 procent zmienności Y można przewidzieć na podstaw ie A. a pw część. 0.25 lub 25 procent, trzeba przypisać czynnikom innym niż X
Powyższe rozumowanie wskazuje, ze w charakterze miary siły związku dzy X i Y możemy zastosować prosty stosunek przewidywanej sumy kwadry do całkowitej sumy kwadratów. Statystykę tę nazwano współczynnikiem </< :< nacji, zapewne dlatego, że część zmienności jednej zmiennej determinuje mc : podstawie zmienności drugiej zmiennej. Współczynnik determinacji wyraża u
(8.10 H
’ KF-F)2 '
Zwróćmy uwagę, ze wielkość la jest zawsze dodatnia i przyjmuje wan.iv O do I. Jest to stosunek liczb, który w prosty sposób określa siłę związku iuk dwiema zmiennymi. Uważa się. żc definicja współczynnika korelacji powinna.. wierac pojęcie kierunku, wzrostu lub spadku jednej zmiennej w stosunku do .. gicj. Można to bez trudu osiągnąć, wyciągając z powyższej wielkości pierw ia- • kwadratowy i oznaczając go znakiem ..plus" lub ..minus". Zatem
v KF-F)2
Statystyka ta pmyjmujc wartości od -I do ♦ ! Wano<c ujemne iworfcza. /* * maleje w miarę wzimtu K. a wanofct dodatme świadcz* ze jea ru ,«***
Zwróćmy uwagę, Ze współczynnik korelacji sam * *** n>c jec lic/b. Jest on pierwiastkiem kwadratowym ze amunku bc/b W zmĄ/ku / tym współczynnik 0.60 me wyrwa dwukrotnie wKk%/ej siły /w,viu wtpófc/snmk 0.30. Różnica między współczynnikami 0.40 i 0J0 me jot taka san.a A rtLn** między współczynnikami 0.50 i 0.60.
Ogólnie rzecz biorąc, przy interpretowaniu siły zwiVku nuędzs dwiema zmiennymi, niezależnie od kierunku, r. czyli wspókzynmk determinacji. jest sta-tystyką dojącą więcej informacji aniżeli r. Jeżeli r = 0.80. j r = o A* mottem) stwierdzić. Ze 64 procent zmienności jednej zmiennej daje sie przewidzieć na pod-stawie zmienności drugiej zmiennej. Wartości r * 100 dla wwtoCci , od 0.10 do 1.00 są następujące:
r |
K x 100 |
0.10 |
1 |
0.20 |
4 |
0.30 |
9 |
0.40 |
16 |
0.50 |
25 |
0.60 |
36 |
0.70 |
49 |
0.80 |
h4 |
0.90 |
KI |
t.oo |
100 |
Tak więc korelacja 0.10 wyraża związek 1-procentowy, a korelacja 0.50 związek 25-procentowy. Aby stwierdzić, żc 50 procent wariancji jednej zmiennej można przewidzieć na podstawie wariancji drugiej zmiennej, musimy otrzymać korelację 0.7071. Przy korelacji bardzo wysokiej, na przykład 0.90. nic wyjaśniona wariancja wynosi 19 procent. Zwróćmy równic/ uwagę, ze jednakowe różnice między współczynnikami korelacji mogą wyrażać zupełnie odmienne różnice w /Aresie sdy związku. Na przykład różnica między współczynnikami korelacji 0.20 i 0.30 wyraża 5-procentową różnicę w zakresie siły związku, gdy tymczasem różnica między współczynnikami 0.80 i 0.90 wyraża 17-proccntową różnicę w zakresie siły związku.
8.8. Obliczanie współczynnika korelacji
Do obliczania współczynnika według momentu iloczynowego można stosować bardzo dużo różnych wzorów. Obliczenia te wykonuje dzisiaj komputer Wzór na korelację dla odchyleń jest następujący:
r
Łty
(8.12)
143