Analiza współzależności i korelacji

background image

Tadeusz Kotarbiński (1886 - 1981)

background image
background image

-

Szeregu korelacyjnego

-

Tablicy korelacyjnej

background image

analiza korelacji – badanie siły związku

między zmiennymi;

analiza regresji - analizowanie związków

(relacji) między zmiennymi za pomocą

matematycznej zależności zwanej funkcją

regresji

background image

Współczynnik korelacji liniowej

Pearsona

Współczynnik korelacji rang

Spearmana

Współczynnik korelacji Czuprowa

background image

W przypadku przedstawienia danych w formie
szeregu korelacyjnego, zależność między
cechami można zbadać za pomocą
współczynnika korelacji liniowej Pearsona lub
współczynnika korelacji rang Spearmana.

W przypadku przedstawienia danych w formie
tablicy korelacyjnej zależność między cechami
można zbadać za pomocą współczynnika
korelacji liniowej Pearsona lub współczynnika
Czuprowa.

background image

1.

obie analizowane cechy muszą być wyrażone w
wariantach liczbowych (są cechami ilościowymi);

2.

zależność między badanymi cechami jest zależnością
liniową;

3.

jest symetryczny, czyli r

yx

=r

xy

;

4.

przyjmuje wartości z przedziału :

r

yx

=0

, oznacza to brak współzależności między badanymi

zjawiskami;

r

yx

=1

lub r

yx

=-1

, oznacza to pełną (całkowitą) zależność

między cechami (występuje związek funkcyjny);

ujemna wartość współczynnika r

ryx

oznacza ujemny związek

między cechami;

dodatnia wartość r

yx

oznacza dodatni związek między cechami;

1

,

1

background image

 

   

   

y

S

x

S

x

y

x

y

y

S

x

S

y

x

c

r

r

xy

yx

,

background image

lata

Spożycie mięsa i

przetworów w kg na

1 mieszkańca

Spożycie ryb i

przetworów w kg

na 1 mieszkańca.

1983

58,3

7,4

1984

57,2

7,9

1985

60,2

7,8

1986

66,0

6,8

1987

66,7

6,7

1988

68,3

6,5

1989

68,6

6,1

1990

68,6

5,4

1991

73,2

6,2

1992

70,3

6,4

background image

lata

y

i

x

i

xy

y

2

x

2

1983 58,3 7,4 431,42 3398,8

9

54,76

1984 57,2 7,9 451,88 3271,8

4

62,41

1985 60,2 7,8 469,56 3624,0

4

60,84

1986

66 6,8 448,80 4356,0

0

46,24

1987 66,7 6,7 446,89 4448,8

9

44,89

1988 68,3 6,5 443,95 4664,8

9

42,25

1989 68,6 6,1 418,46 4705,9

6

37,21

1990 68,6 5,4 370,44 4705,9

6

29,16

1991 73,2 6,2 453,84 5358,2

4

38,44

1992 70,3 6,4 449,92 4942,0

9

40,96

suma 657,

4

67,

2

4385,16 43476

,8

457,

16

background image

 

2568

,

3

10

2

,

67

10

4

,

657

10

16

,

4385

,

y

x

y

x

y

x

c

 

 

0924

,

5

10

4

,

657

10

8

,

43476

2

2

2

x

x

x

S

 

 

7467

,

0

10

2

,

67

10

16

,

457

2

2

2

y

y

y

S

8565

,

0

7467

,

0

0924

,

5

2568

,

3

yx

r

background image

1.

obie analizowane cechy muszą dać się uporządkować
(malejąco lub rosnąco);

2.

jest symetryczny, czyli R

yx

=R

xy

;

3.

przyjmuje wartości z przedziału :

R

yx

=0

, oznacza to brak współzależności między badanymi

zjawiskami;

R

yx

=1

lub R

yx

=-1

, oznacza to pełną (całkowitą) zależność

między cechami (występuje związek funkcyjny);

ujemna wartość współczynnika R

ryx

oznacza ujemny związek

między cechami;

dodatnia wartość R

yx

oznacza dodatni związek między

cechami;

1

,

1

background image

d

i

- różnica między rangą cechy y

i

a rangą cechy x

i

1

n

n

d

6

1

R

R

2

n

1

i

2

i

xy

yx

background image

lata

Spożycie mięsa i

przetworów w kg na

1 mieszkańca

Spożycie ryb i

przetworów w kg

na 1 mieszkańca.

1983

58,3

7,4

1984

57,2

7,9

1985

60,2

7,8

1986

66,0

6,8

1987

66,7

6,7

1988

68,3

6,5

1989

68,6

6,1

1990

68,6

5,4

1991

73,2

6,2

1992

70,3

6,4

background image

lata

y

i

x

i

r

y

r

x

d

i

2

1983

58,3 7,4

2

8

36

1984

57,2 7,9

1 10

81

1985

60,2 7,8

3

9

36

1986

66

6,8

4

7

9

1987

66,7 6,7

5

6

1

1988

68,3 6,5

6

5

1

1989

68,6 6,1 7,5 2

30,25

1990

68,6 5,4 7,5 1

42,25

1991

73,2 6,2 10 3

49

1992

70,3 6,4

9

4

25

suma 657,4 67,2

310,5

background image

n

n

d

R

i

yx

3

2

6

1

8818

,

0

10

10

5

,

310

*

6

1

3

yx

R

background image

Liczba błędów

Wiek 0 - 5 6 - 11 12 - 17 18 - 23

20

-24

1

-

-

-

25 –

29

-

1

-

-

30 –

34

-

2

1

-

35 –

39

-

2

3

-

40 –

44

-

-

4

2

45 -

49

-

-

-

4

background image

 

   

   

y

S

x

S

x

y

x

y

y

S

x

S

y

x

c

r

r

xy

yx

,

background image

Liczba błędów

Wiek 0 - 5 6 - 11 12 - 17 18 - 23

20

-24

1

-

-

-

25 –

29

-

1

-

-

30 –

34

-

2

1

-

35 –

39

-

2

3

-

40 –

44

-

-

4

2

45 -

49

-

-

-

4

background image

Y

j

n

i.

x

i

x

i

n

i

x

i

2

n

i

x

i

0 -

5

6 - 11 12 -

17

18 -

23

20 -24

1

-

-

-

1

22,

5

22,5 506,2

5

25 – 29

-

1

-

-

1

27,

5

27,5 756,2

5

30 – 34

-

2

1

-

3

32,

5

97,5 3168,

75

35 – 39

-

2

3

-

5

37,

5

187,

5

7031,

25

40 – 44

-

-

4

2

6

42,

5

255 10837

,5

45 - 49

-

-

-

4

4

47,

5

190 9025

n

.j

1

5

8

6

20 x

780 3132

5

Y

j

2,5 8,5 14,5 20,5 x

x

y

j

n

.j

2,5 42,5 116

123

284

y

j

2

n

.j

6,2

5

361,2

5

1682 2521,

5

457

1

background image

2

,

14

20

284

y

y

;

39

20

780

.

j

.

n

n

n

n

x

x

j

i

i

 

 

 

7268

,

6

39

25

,

1566

25

,

1566

20

31325

x

;

2

.

2

2

2

2

x

S

n

n

x

x

x

x

S

i

i

 

 

 

1875

,

5

2

,

14

55

,

228

55

,

228

20

4571

y

;

2

.

2

2

2

2

y

S

n

n

y

y

y

y

S

j

j

background image



ij

j

i

n

y

x

n

1

y

x

background image



ij

j

i

n

y

x

n

1

y

x

25

,

584

11685

*

20

1

)

4

*

5

,

20

*

5

,

47

2

*

5

,

25

*

5

,

42

4

*

5

,

14

*

5

,

42

3

*

5

,

14

*

5

,

37

2

*

5

,

8

*

5

,

37

1

*

5

,

14

*

5

,

32

2

*

5

,

8

*

5

,

32

1

*

5

,

8

*

5

,

27

1

*

5

,

2

*

5

,

22

(

*

20

1

xy

background image

8726

,

0

1875

,

5

7268

,

6

45

,

30

yx

r

 

   

   

y

S

x

S

x

y

x

y

y

S

x

S

y

x

c

r

r

xy

yx

,

background image

1.

obie analizowane cechy mogą być wyrażone w
wariantach liczbowych lub opisowych (są cechami
ilościowymi lub jakościowymi);

2.

jest symetryczny, czyli T

yx

=T

xy

;

3.

przyjmuje wartości z przedziału :

T

yx

=0

, oznacza to brak współzależności między badanymi

zjawiskami;

T

yx

=1

oznacza to pełną (całkowitą) zależność między cechami

(występuje związek funkcyjny);

1

,

0

background image

n – liczba obserwacji,
k – liczba wariantów cechy X,
r – liczba wariantów cechy Y

 

1

r

1

k

n

T

T

2

xy

yx



k

i

r

j

ij

ij

ij

n

n

n

1

1

2

2

ˆ

ˆ

n

n

n

n

j

i

ij

.

.

ˆ

background image

Klasa
wagonu

do 200

km

201-400

km

ponad 400

km

1 klasa

399

1688

881

2 klasa

1018

3120

1704

background image

n

ij

do 200

km

201-400

km

ponad 400

km

n

i.

1 klasa

399

1688

881

2968

2 klasa

1018

3120

1704

5842

n

.j

1417

4808

2585

8810

background image

do 200

km

201-400

km

ponad 400

km

n

i.

1
klasa

2968

2
klasa

5842

n

.j

1417

4808

2585

8810

ij

n

ˆ

background image

do 200

km

201-400

km

ponad 400

km

n

i.

1
klasa

477,373 1619,766

6

870,8604

2968

2
klasa

939,627 3188,233

4

1714,1396

5842

n

.j

1417

4808

2585

8810

ij

n

ˆ

background image

do 200

km

201-400

km

ponad 400

km

Σ

1 klasa

12,8669

2,8744

0,1181

15,85

94

2 klasa

6,537

1,4603

0,06

8,057

3

Σ

19,4039

4,3347

0,1781

23,91

67

ij

2

ij

ij

-

n

background image

 

0438

,

0

1

2

*

1

3

8810

9167

,

23

xy

T

 

1

r

1

k

n

T

T

2

xy

yx

background image

y

y

b

x

a

y

 

 

 

 

x

S

y

S

r

x

S

x

y

c

a

yx

y

2

,

x

a

y

b

y

y

background image

 

2

yx

2

n

1

i

2

i

i

e

r

1

y

S

2

n

n

2

n

y

ˆ

y

S

%

100

y

S

V

e

Se

 

2

yx

2

2

e

n

1

i

2

i

n

1

i

2

i

i

2

r

y

S

S

n

2

n

1

y

y

y

ˆ

y

1

R

2

2

R

1

background image

 

 

n

x

S

S

a

D

e

y

   

2

x

a

D

b

D

y

y

 

y

y

a

D

a

t

 

y

y

b

D

b

t

background image

Fuller


Document Outline


Wyszukiwarka

Podobne podstrony:
ćw 5 analiza współzależności zmiennych
statys ANALIZA WSPÓŁZALEŻNOŚCI
wyklad 3b ANALIZA WSPÓŁZALEŻNOŚCI
STAT3 ANALIZA REGRESJI I KORELACJI wersja.2011, ANALIZA REGRESJI I KORELACJI
Analiza współzależności zmiennych na różnych skalach pomiarowych
Metody analizy współzależności
Analiza współzależności (2)
Analiza współzależności zjawisk ekonomicznych, Studia, STUDIA PRACE ŚCIĄGI SKRYPTY
ANALIZA WSPOLZALEZNOSCI ZJAWISK czesc 1, materiały z roku 2011-2012, Semestr II, Statystyka opisowa
wyklad4b ANALIZA WSPÓŁZALEŻNOŚCI
Analiza współzależności wzory, I rok, Statystyka opisowa
Analiza wspolzaleznosci MOC
Analiza współzależności (8 stron) 3WWDYEUOONKTCD6JQ5OEOPOCUHWFYQNCOOTUDBA
Opisowe metody analizy współzależności zjawisk

więcej podobnych podstron