Tadeusz Kotarbiński (1886 - 1981)
-
Szeregu korelacyjnego
-
Tablicy korelacyjnej
•
analiza korelacji – badanie siły związku
między zmiennymi;
•
analiza regresji - analizowanie związków
(relacji) między zmiennymi za pomocą
matematycznej zależności zwanej funkcją
regresji
•
Współczynnik korelacji liniowej
Pearsona
•
Współczynnik korelacji rang
Spearmana
•
Współczynnik korelacji Czuprowa
W przypadku przedstawienia danych w formie
szeregu korelacyjnego, zależność między
cechami można zbadać za pomocą
współczynnika korelacji liniowej Pearsona lub
współczynnika korelacji rang Spearmana.
W przypadku przedstawienia danych w formie
tablicy korelacyjnej zależność między cechami
można zbadać za pomocą współczynnika
korelacji liniowej Pearsona lub współczynnika
Czuprowa.
1.
obie analizowane cechy muszą być wyrażone w
wariantach liczbowych (są cechami ilościowymi);
2.
zależność między badanymi cechami jest zależnością
liniową;
3.
jest symetryczny, czyli r
yx
=r
xy
;
4.
przyjmuje wartości z przedziału :
•
r
yx
=0
, oznacza to brak współzależności między badanymi
zjawiskami;
•
r
yx
=1
lub r
yx
=-1
, oznacza to pełną (całkowitą) zależność
między cechami (występuje związek funkcyjny);
•
ujemna wartość współczynnika r
ryx
oznacza ujemny związek
między cechami;
•
dodatnia wartość r
yx
oznacza dodatni związek między cechami;
1
,
1
y
S
x
S
x
y
x
y
y
S
x
S
y
x
c
r
r
xy
yx
,
lata
Spożycie mięsa i
przetworów w kg na
1 mieszkańca
Spożycie ryb i
przetworów w kg
na 1 mieszkańca.
1983
58,3
7,4
1984
57,2
7,9
1985
60,2
7,8
1986
66,0
6,8
1987
66,7
6,7
1988
68,3
6,5
1989
68,6
6,1
1990
68,6
5,4
1991
73,2
6,2
1992
70,3
6,4
lata
y
i
x
i
xy
y
2
x
2
1983 58,3 7,4 431,42 3398,8
9
54,76
1984 57,2 7,9 451,88 3271,8
4
62,41
1985 60,2 7,8 469,56 3624,0
4
60,84
1986
66 6,8 448,80 4356,0
0
46,24
1987 66,7 6,7 446,89 4448,8
9
44,89
1988 68,3 6,5 443,95 4664,8
9
42,25
1989 68,6 6,1 418,46 4705,9
6
37,21
1990 68,6 5,4 370,44 4705,9
6
29,16
1991 73,2 6,2 453,84 5358,2
4
38,44
1992 70,3 6,4 449,92 4942,0
9
40,96
suma 657,
4
67,
2
4385,16 43476
,8
457,
16
2568
,
3
10
2
,
67
10
4
,
657
10
16
,
4385
,
y
x
y
x
y
x
c
0924
,
5
10
4
,
657
10
8
,
43476
2
2
2
x
x
x
S
7467
,
0
10
2
,
67
10
16
,
457
2
2
2
y
y
y
S
8565
,
0
7467
,
0
0924
,
5
2568
,
3
yx
r
1.
obie analizowane cechy muszą dać się uporządkować
(malejąco lub rosnąco);
2.
jest symetryczny, czyli R
yx
=R
xy
;
3.
przyjmuje wartości z przedziału :
•
R
yx
=0
, oznacza to brak współzależności między badanymi
zjawiskami;
•
R
yx
=1
lub R
yx
=-1
, oznacza to pełną (całkowitą) zależność
między cechami (występuje związek funkcyjny);
•
ujemna wartość współczynnika R
ryx
oznacza ujemny związek
między cechami;
•
dodatnia wartość R
yx
oznacza dodatni związek między
cechami;
1
,
1
d
i
- różnica między rangą cechy y
i
a rangą cechy x
i
1
n
n
d
6
1
R
R
2
n
1
i
2
i
xy
yx
lata
Spożycie mięsa i
przetworów w kg na
1 mieszkańca
Spożycie ryb i
przetworów w kg
na 1 mieszkańca.
1983
58,3
7,4
1984
57,2
7,9
1985
60,2
7,8
1986
66,0
6,8
1987
66,7
6,7
1988
68,3
6,5
1989
68,6
6,1
1990
68,6
5,4
1991
73,2
6,2
1992
70,3
6,4
lata
y
i
x
i
r
y
r
x
d
i
2
1983
58,3 7,4
2
8
36
1984
57,2 7,9
1 10
81
1985
60,2 7,8
3
9
36
1986
66
6,8
4
7
9
1987
66,7 6,7
5
6
1
1988
68,3 6,5
6
5
1
1989
68,6 6,1 7,5 2
30,25
1990
68,6 5,4 7,5 1
42,25
1991
73,2 6,2 10 3
49
1992
70,3 6,4
9
4
25
suma 657,4 67,2
310,5
n
n
d
R
i
yx
3
2
6
1
8818
,
0
10
10
5
,
310
*
6
1
3
yx
R
Liczba błędów
Wiek 0 - 5 6 - 11 12 - 17 18 - 23
20
-24
1
-
-
-
25 –
29
-
1
-
-
30 –
34
-
2
1
-
35 –
39
-
2
3
-
40 –
44
-
-
4
2
45 -
49
-
-
-
4
y
S
x
S
x
y
x
y
y
S
x
S
y
x
c
r
r
xy
yx
,
Liczba błędów
Wiek 0 - 5 6 - 11 12 - 17 18 - 23
20
-24
1
-
-
-
25 –
29
-
1
-
-
30 –
34
-
2
1
-
35 –
39
-
2
3
-
40 –
44
-
-
4
2
45 -
49
-
-
-
4
Y
j
n
i.
x
i
x
i
n
i
x
i
2
n
i
x
i
0 -
5
6 - 11 12 -
17
18 -
23
20 -24
1
-
-
-
1
22,
5
22,5 506,2
5
25 – 29
-
1
-
-
1
27,
5
27,5 756,2
5
30 – 34
-
2
1
-
3
32,
5
97,5 3168,
75
35 – 39
-
2
3
-
5
37,
5
187,
5
7031,
25
40 – 44
-
-
4
2
6
42,
5
255 10837
,5
45 - 49
-
-
-
4
4
47,
5
190 9025
n
.j
1
5
8
6
20 x
780 3132
5
Y
j
2,5 8,5 14,5 20,5 x
x
y
j
n
.j
2,5 42,5 116
123
284
y
j
2
n
.j
6,2
5
361,2
5
1682 2521,
5
457
1
2
,
14
20
284
y
y
;
39
20
780
.
j
.
n
n
n
n
x
x
j
i
i
7268
,
6
39
25
,
1566
25
,
1566
20
31325
x
;
2
.
2
2
2
2
x
S
n
n
x
x
x
x
S
i
i
1875
,
5
2
,
14
55
,
228
55
,
228
20
4571
y
;
2
.
2
2
2
2
y
S
n
n
y
y
y
y
S
j
j
ij
j
i
n
y
x
n
1
y
x
ij
j
i
n
y
x
n
1
y
x
25
,
584
11685
*
20
1
)
4
*
5
,
20
*
5
,
47
2
*
5
,
25
*
5
,
42
4
*
5
,
14
*
5
,
42
3
*
5
,
14
*
5
,
37
2
*
5
,
8
*
5
,
37
1
*
5
,
14
*
5
,
32
2
*
5
,
8
*
5
,
32
1
*
5
,
8
*
5
,
27
1
*
5
,
2
*
5
,
22
(
*
20
1
xy
8726
,
0
1875
,
5
7268
,
6
45
,
30
yx
r
y
S
x
S
x
y
x
y
y
S
x
S
y
x
c
r
r
xy
yx
,
1.
obie analizowane cechy mogą być wyrażone w
wariantach liczbowych lub opisowych (są cechami
ilościowymi lub jakościowymi);
2.
jest symetryczny, czyli T
yx
=T
xy
;
3.
przyjmuje wartości z przedziału :
•
T
yx
=0
, oznacza to brak współzależności między badanymi
zjawiskami;
•
T
yx
=1
oznacza to pełną (całkowitą) zależność między cechami
(występuje związek funkcyjny);
1
,
0
n – liczba obserwacji,
k – liczba wariantów cechy X,
r – liczba wariantów cechy Y
1
r
1
k
n
T
T
2
xy
yx
k
i
r
j
ij
ij
ij
n
n
n
1
1
2
2
ˆ
ˆ
n
n
n
n
j
i
ij
.
.
ˆ
Klasa
wagonu
do 200
km
201-400
km
ponad 400
km
1 klasa
399
1688
881
2 klasa
1018
3120
1704
n
ij
do 200
km
201-400
km
ponad 400
km
n
i.
1 klasa
399
1688
881
2968
2 klasa
1018
3120
1704
5842
n
.j
1417
4808
2585
8810
do 200
km
201-400
km
ponad 400
km
n
i.
1
klasa
2968
2
klasa
5842
n
.j
1417
4808
2585
8810
ij
n
ˆ
do 200
km
201-400
km
ponad 400
km
n
i.
1
klasa
477,373 1619,766
6
870,8604
2968
2
klasa
939,627 3188,233
4
1714,1396
5842
n
.j
1417
4808
2585
8810
ij
n
ˆ
do 200
km
201-400
km
ponad 400
km
Σ
1 klasa
12,8669
2,8744
0,1181
15,85
94
2 klasa
6,537
1,4603
0,06
8,057
3
Σ
19,4039
4,3347
0,1781
23,91
67
ij
2
ij
ij
nˆ
nˆ
-
n
0438
,
0
1
2
*
1
3
8810
9167
,
23
xy
T
1
r
1
k
n
T
T
2
xy
yx
y
y
b
x
a
y
x
S
y
S
r
x
S
x
y
c
a
yx
y
2
,
x
a
y
b
y
y
2
yx
2
n
1
i
2
i
i
e
r
1
y
S
2
n
n
2
n
y
ˆ
y
S
%
100
y
S
V
e
Se
2
yx
2
2
e
n
1
i
2
i
n
1
i
2
i
i
2
r
y
S
S
n
2
n
1
y
y
y
ˆ
y
1
R
2
2
R
1
n
x
S
S
a
D
e
y
2
x
a
D
b
D
y
y
y
y
a
D
a
t
y
y
b
D
b
t
Fuller