Przykład obliczania r na podstawie lego wzoru podaje tabela 8.2.
Pierwsze dwie kolumny tabeli 8.2 zawierają pary pomiarów X i > k te zostały zsumowane i podzielone przez N w celu otrzymania średnich V Kolumna 3 zawiera odchylenia od średniej zmiennej X. a kolumna 4 .nkli, t*d średniej > Kolumny 5 i 6 zawierają kwadraty tych odchyleń Kolumn.., zostały zsumowane w celu uzyskania 2»r i Sr Kolumna 7 zawiera iloczyny , Została ona zsumowana w celu uzyskania Svy. Współczynnik korelacji w przykładzie wynosi +0.58.
ruhrLi K.2. Oblic/anic współczynnika korelacji w. przypadku danych nic pogrupowanych / u/,.
odchyleń
1 |
[-5- |
7 |
4 |
5 |
6 | |
V |
»■ |
j |
y |
ł2 |
>; | |
i |
-i |
-3 |
1 |
9 |
*? | |
10 |
6 |
♦4 |
♦2 |
16 |
4 |
*« |
5 |
2 |
-1 |
_2 |
1 |
4 |
♦2 |
II |
K |
♦5 |
+4 |
25 |
16 |
*20 |
12 |
5 |
*6 |
+1 |
36 |
1 |
*6 |
* |
1 |
_2 |
-3 |
4 |
9 |
♦6 |
3 |
4 |
-3 |
o |
9 |
0 |
0 |
2 |
6 |
+2 |
16 |
4 |
-Ji | |
7 |
5 |
♦1 |
♦ 1 |
1 |
1 |
*1 |
1 |
y ~ . |
-5 |
_2 |
25 |
4 |
♦ 10 |
60 |
40 |
0 |
0 |
134 |
52 |
4S |
X = 6.0 |
r= 4.o |
I** |
Ly2 |
Ły | ||
1 |
48 3 vfVx <: |
= +Ó.58 |
W niektórych sytuacjach warto stosować wzór na współczynnik korelacji wyników surowych, czyli operujący pomiarami pierwotnymi. Wzór ten jest iuv; pujiicy:
' IX^ (IX)2] [N1Y2 -(LYp)
Czytelnik zechce zwrócić uwagę, że stosowanie tego wzoru wymaga postu/, nia stę. oprócz N, pięcioma członami; IXK, IX2. IK\ IX i IY. W praktyce dysponujemy kalkulatorem, wzór ten, albo jakaś prosta jego odmiana, jest chr. najłatwiej.szym wzorem na obliczanie współczynników korelacji.
Przykład stosowania wzoru na obliczanie współczynnika korelacji dla u>’ ków surowych przedstawia tabela 8.3. Pierwsze dwie kolumny tej tabeli zawiera:: pary pomiarów A i ł Kolumny te zostały zsumowane w celu otrzymania IX i li Kolumny 3 i -I zawieraj!} kwadraty pomiarów. Zostały one zsumowane w cci. uzyskania IA i Ił*. Kolumna 5 zawiera człon iloczynowy XY. Suma tej kolum: to IX). Korelacja wynosi + 0.58. co potwierdza wartość otrzymaną popr/edr metodą na podstawie odchyleń.
W kategoriach wyników standardowych korelację i regresję można /definiować bardzo prosto jako sumę iloczynu wyników standardowych podzielonych przez N - I. Zatem
(8.14)
r = I'V-’ . r N-1
gdzie = (X - X)/si, a s, i j, są odpowiednio nic obciążonymi
wskaźnikami o, i ov. Łatwo zauważyć, że wielkość I:,:, jest miara związku między dwiema zmiennymi. Jeżeli wszystkie wartości z, i leżą dokładnie na Unii prostej o nachyleniu dodatnim, to każda wartość będzie równa każdej wartości ;r W takiej sytuacji zk - zr a Z^Z, = z\ = z;. Stad 1:^, = = 1“ Wielkość
= = jy - I, jak to wykazano w podrozdziale 5.8. Zatem w takiej »>tuacji
r - I. W sytuacji odwrotnej, mianowicie gdy wszystkie wartości i leża dokładnie na linii prostej o nachyleniu ujemnym, to ka/da wartość będzie miała tę samą bezwzględna wartość liczbową co :v lecz przeciwny znak Stad suma iloczynów wyników standardowych będzie wynosiła co. jak można łatwo wyka
zać. równe jest -<jV - I). Wówczas r = -l. Jeżeli wszystkie wartości i m uporządkowane losowo i nic wykazują żadnego wzajemnego systematycznego związku, to oczekiwana wartość I:,c, = 0. a więc r = 0.
Jeżeli pary wyników standardowych przedstawimy na wykresie jako dwie linie regresji dopasowane do danych, to równania dla tych linii będą następujące
145