BADANIE KORELACJI MIĘDZY CECHAMI
Zależność korelacyjna między cechami mierzalnymi charakteryzuje się tym, że ściśle
określonym wartościom jednej zmiennej przyporządkowane są ściśle określone wartości
drugiej zmiennej.
Stopień zależności liniowej pomiędzy badanymi cechami mierzalnymi określa współczynnik
korelacji PEARSONA r
xy
.
KORELACYJNY WYKRES ROZRZUTU (wykres punktowy)
a) korelacja liniowa dodatnia b) korelacja liniowa ujemna c) brak korelacji
d) korelacja
krzywoliniowa
Korelacja dodatnia występuje wtedy, gdy wzrostowi wartości jednej cechy odpowiada wzrost
średnich wartości drugiej cechy.
Korelacja ujemna występuje wtedy, gdy wzrostowi wartości jednej cechy odpowiada spadek
średnich wartości drugiej cechy.
Współczynnik korelacji PEARSONA r
xy
.
∈
[-1 ; 1] jest miarą siły liniowego związku między
cechami.
Dla szeregów szczegółowych:
Dla szeregów rozdzielczych z przedziałami klasowymi występują przeważnie różne
liczebności klas dla cechy X i dla cechy Y. Stąd w liczniku powyższego wzoru wystąpią
iloczyny przyrostów wartości cech w różnych kombinacjach przynależności do klas ze
względu na cechę X i cechę Y. Czyli wzór (1) przyjmuje poniższą postać:
r
x x y y
x x
y y
Cov X Y
s s
xy
i
i
n
i
i
i
n
i
i
n
x y
=
−
−
−
−
=
=
=
=
∑
∑
∑
(
)(
)
(
)
(
)
( ; )
( )
1
2
1
2
1
1
)2(
);(
)
(
)(
)
)(
(
1
2
1
2
1 1
yx
s
j
j
j
r
i
i
i
r
i
ij
s
j
j
i
xy
ss
YX
Cov
ny
y
nx
x
ny
yx
x
r
=
−
−
−−
=
∑
∑
∑∑
=
•
•
=
•
•
= =
•
•
Sens sumowania obrazuje poniższa tablica dwudzielna (tablica korelacyjna):
TABLICA DWUDZIELNA
Y
X
y
1
y
2
•••
y
j
•••
y
s
n
i
•
x
1
n
11
n
12
•••
n
1j
•••
n
1s
n
1
•
x
2
n
21
n
22
•••
n
2j
•••
n
2s
n
2
•
•••
•••
•••
•••
•••
•••
•••
•••
x
i
n
i1
n
i2
•••
n
ij
•••
n
is
n
i
•
•••
•••
•••
•••
•••
•••
•••
•••
x
r
n
r1
n
r2
•••
n
rj
•••
n
rs
n
r
•
n
•
j
n
•
1
n
•
2
•••
n
•
j
•••
n
•
s
n
Kowariancję między cechami X i Y czyli Cov (X;Y) wyznaczają dla szeregów
szczegółowych i rozdzielczych odpowiednio liczniki wzorów (1) i (2) podzielone przez n .
Odchylenia standardowe cech są zaznaczone odpowiednio przez s
x
i s
y
.
Znak współczynnika korelacji świadczy o kierunku korelacji, a jego wartość bezwzględna o
sile korelacji.
Gdy r
xy
=
±
1 to występuje zależność liniowa, gdy zaś r
xy
= 0 to cechy są nieskorelowane.
Klasyfikacja siły związku liniowego między cechami na podstawie wartości bezwzględnej
współczynnika korelacji (r
xy
∈
[ -1 ; 1 ] )
Zmienność wartości
bezwzględnej
|
r
xy
|
Siła związku liniowego między
cechami X ,Y
|
r
xy
|
< 0.2
Brak związku liniowego
0.2
≤
|
r
xy
|
< 0.4
Niska zależność liniowa
0.4
≤
|
r
xy
|
< 0.7
Umiarkowana zależność liniowa
0.7
≤
|
r
xy
|
< 0.9
Znacząca zależność liniowa
0.9
≤
|
r
xy
|
Bardzo silna zależność liniowa
UWAGA 1.
Gdy r
xy
≈
0 to oznacza to tylko brak zależności liniowej między badanymi cechami.
UWAGA 2.
Wielkość współczynnika korelacji zależy od zakresu zmienności badanych cech.
Przykład 1.
Nr. miesiąca
Produkcjawyrobu
(w tonach)
Zużycie surowca
(w kilogramach)
1
90
40
2
85
35
3
110
50
4
125
45
5
120
40
6
150
63
7
140
45
8
160
61
9
200
70
10
190
61
11
220
85
12
210
65
Wykres punktowy i obliczenia pomocnicze obrazuje poniższy arkusz: