Korelacje

background image

Korelacje

background image

Korelacja

Korelacja

to zwi

ą

zek mi

ę

dzy zmiennymi

- sytuacja, w której zmianom warto

ś

ci

jednej zmiennej towarzyszy zmiana
warto

ś

ci drugiej – skorelowanej z ni

ą

zmiennej.

• Miar

ą

siły i kierunku oraz kształtu zwi

ą

zku

jest

współczynnik korelacji

(dla

zmiennych porz

ą

dkowych i ilo

ś

ciowych)

lub

współczynnik kontyngencji

(dla

zmiennych nominalnych)

background image

Korelacja

• Nale

ż

y zwróci

ć

uwag

ę

,

ż

e nawet wysoka

warto

ść

współczynnika korelacji

(kontyngencji) nie

ś

wiadczy o zwi

ą

zku

przyczynowo – skutkowym, ale jedynie o

współwyst

ę

powaniu cech, czy

współzmienno

ś

ci.

background image

Współczynnik r Pearsona

• Do pomiaru siły zwi

ą

zku mi

ę

dzy

zmiennymi interwałowymi słu

ż

y

ć

mo

ż

e

współczynnik korelacji

r Pearsona

.

• Przyjmuje on warto

ś

ci do -1 (dla bardzo

silnych zwi

ą

zków ujemnych) do + 1 (dla

bardzo silnych zwi

ą

zków dodatnich

(Uwaga stosuje si

ę

go wył

ą

cznie do

interpretacji zwi

ą

zków liniowych)

background image

Silny zwi

ą

zek dodatni r ~ 1

background image

Silny zwi

ą

zek ujemny r ~ -1

background image

Brak zwi

ą

zku - r ~ 0

background image

Brak zwi

ą

zku liniowego - r ~ 0

background image

Zwi

ą

zek mi

ę

dzy zmiennymi

ilo

ś

ciowymi

background image

Zwi

ą

zek mi

ę

dzy zmiennymi

ilo

ś

ciowymi

• Obliczamy kowariancj

ę

według wzoru:

88

,

6

10

8

,

68

)

)(

(

cov

=

=

=

N

Y

Y

X

X

xy

background image

Zwi

ą

zek mi

ę

dzy zmiennymi

ilo

ś

ciowymi

Kowariancja

jest matematycznym

wska

ź

nikiem współzmienno

ś

ci.

Wystandaryzowanie jej pozwala na
uzyskanie współczynnika

r Pearsona

,

który umo

ż

liwia ocen

ę

kierunku i siły

zwi

ą

zku mi

ę

dzy zmiennymi.

background image

Zwi

ą

zek mi

ę

dzy zmiennymi

ilo

ś

ciowymi

Współczynnik r Pearsona

y

x

xy

s

s

r

cov

=

background image

Zwi

ą

zek mi

ę

dzy zmiennymi

ilo

ś

ciowymi

• Odchylenia standardowe dla zmiennej x i y

mo

ż

emy obliczy

ć

ze skróconego wzoru:

2

2



=

N

X

N

X

s

x

background image

Zwi

ą

zek mi

ę

dzy zmiennymi

ilo

ś

ciowymi

background image

Zwi

ą

zek mi

ę

dzy zmiennymi

ilo

ś

ciowymi

87

,

2

10

55

10

385

2

2

2

=

=



=

N

X

N

X

s

x

40

,

2

10

40

,

84

10

84

,

769

2

2

2

=

=



=

N

Y

N

Y

s

y

background image

Zwi

ą

zek mi

ę

dzy zmiennymi

ilo

ś

ciowymi

99

,

0

40

,

2

*

87

,

2

88

,

6

cov

=

=

=

y

x

xy

s

s

r

Otrzymana warto

ść ś

wiadczy o

bardzo silnym zwi

ą

zku dodatnim

mi

ę

dzy zmiennymi X i Y .

background image

Zwi

ą

zek mi

ę

dzy zmiennymi

ilo

ś

ciowymi

]

)

(

][

)

(

[

)

)(

(

2

2

2

2

y

y

N

x

x

N

y

x

xy

N

r

Σ

Σ

Σ

Σ

Σ

Σ

Σ

=

background image
background image

99

,

0

40

,

575

*

825

688

)

7123

40

,

7698

)(

3025

3850

(

4642

5330

)

40

,

84

84

,

769

*

10

)(

55

385

*

10

(

40

,

84

*

55

533

*

10

]

)

(

][

)

(

[

)

)(

(

2

2

2

2

2

2

=

=

=

=

=

=

=

Σ

Σ

Σ

Σ

Σ

Σ

Σ

=

r

r

r

y

y

N

x

x

N

y

x

xy

N

r

background image

Zwi

ą

zek mi

ę

dzy zmiennymi

ilo

ś

ciowymi

• Kwadrat współczynnika korelacji

nazywany jest

WSPÓŁCZYNNIKIEM

DETERMINACJI

– pokazuje ona w jakim

stopniu zmienno

ść

jednej zmiennej

wyja

ś

niana jest przez drug

ą

zmienn

ą

.

• W naszym przykładzie r

2

= (0,99)

2

=0,98

lub 98 %

background image

Dane porz

ą

dkowe

• Dla danych porz

ą

dkowych korzystamy np..

ze współczynnika r

s

Spearmana –

opartego na ró

ż

nicach rang pomiarów.

• Przed obliczeniem r

s

Spearmana nale

ż

y

pomiary PORANGOWA

Ć

.

background image

Dane porz

ą

dkowe

)

1

(

6

1

2

2

=

n

n

d

r

i

s

gdzie d

i

– ró

ż

nice mi

ę

dzy rangami w

parach, a n to liczba par.

background image

Dane porz

ą

dkowe

• Współczynnik

r

s

Spearmana

podobnie jak

r Pearsona

przyjmuje warto

ś

ci do -1 (dla

bardzo silnych zwi

ą

zków

ujemnych) do + 1 (dla bardzo
silnych zwi

ą

zków dodatnich.

background image

Współczynnik r

s

Spearmana

• Badano, czy istnieje zwi

ą

zek mi

ę

dzy

ś

redni

ą

ocen z ostatniego semestru, a

odczuwan

ą

satysfakcj

ą

ze studiów.

• Obie zmienne wyra

ż

one s

ą

na skali

porz

ą

dkowej i przyjmuj

ą

nast

ę

puj

ą

ce

warto

ś

ci:

background image

Współczynnik r

s

Spearmana

background image

Porangowano pomiary

background image

Rangi wpisano do tabeli

background image

Współczynnik r

s

Spearmana

71

,

0

990

285

1

)

1

100

(

10

50

,

47

*

6

1

)

1

(

6

1

2

2

=

=

=

=

=

s

i

s

r

n

n

d

r

background image

Współczynnik r

s

Spearmana

• Uzyskany wynik wskazuje na

umiarkowanie silny zwi

ą

zek dodatni

mi

ę

dzy zmiennymi:

r

s

=0,71

r

s

2

=0,50

background image

Korelacje w SPSS

Korelacje

Bie

żą

ce

wynagrodz

enie

Sta

ż

pracy

(miesi

ą

ce)

Wykształcenie

(w latach

nauki)

Pocz

ą

tkowe

wynagrodze

nie

Korelacja Pearsona

1

,084

,661(**)

,880(**)

Istotno

ść

(dwustronna)

,067

,000

,000

Bie

żą

ce wynagrodzenie

N

474

474

474

474

Korelacja Pearsona

,084

1

,047

-,020

Istotno

ść

(dwustronna)

,067

,303

,668

Sta

ż

pracy (miesi

ą

ce)

N

474

474

474

474

Korelacja Pearsona

,661(**)

,047

1

,633(**)

Istotno

ść

(dwustronna)

,000

,303

,000

Wykształcenie (w latach
nauki)

N

474

474

474

474

Korelacja Pearsona

,880(**)

-,020

,633(**)

1

Istotno

ść

(dwustronna)

,000

,668

,000

Pocz

ą

tkowe

wynagrodzenie

N

474

474

474

474

** Korelacja jest istotna na poziomie 0.01 (dwustronnie).

Gdy istotno

ść

dla współczynnika korelacji

jest wi

ę

ksza od 0,05

stwierdzamy, i

ż

pomi

ę

dzy zmiennymi nie ma zwi

ą

zku – nie interpretujemy

nieistniej

ą

cego zwi

ą

zku !

Gdy istotno

ść

jest

mniejsza/równa

od 0,05 – mówimy o istnieniu

zwi

ą

zku i staramy si

ę

go opisa

ć

(jego sił

ę

, kierunek ), a przy zmiennych

nominalnych charakter zwi

ą

zku.

background image

Dane nominalne

• Badano sympatie polityczne w trzech

województwach. Respondenci wskazywali
na swoj

ą

ulubion

ą

parti

ę

.

• Sprawd

ź

, czy istnieje zwi

ą

zek mi

ę

dzy

miejscem zamieszkania, a sympatiami
politycznymi

background image

Dane nominalne

20

15

15

Wojew.3

5

20

25

Wojew.2

15

15

10

Wojew.1

Opcja C

Opcja B

Opcja A

background image

Dane nominalne

• Obliczamy warto

ś

ci

oczekiwane dla
poszczególnych
komórek

• Np.:

N

b+d

a+c

c+d

d

c

a+b

b

a

N

c

a

b

a

e

a

)

)(

(

+

+

=

background image

14,79

suma:

2,28

32,60

5,71

14,29

20

i

0,46

8,18

-2,86

17,86

15

h

0,46

8,18

-2,86

17,86

15

g

6,04

86,30

-9,29

14,29

5

f

0,26

4,58

2,14

17,86

20

e

2,85

50,98

7,14

17,86

25

d

1,12

12,74

3,57

11,43

15

c

0,04

0,50

0,71

14,29

15

b

1,29

18,40

-4,29

14,29

10

a

(o-e)

2

/e

(o-e)

2

(o-e)

e

o

background image

Dane nominalne

Im wi

ę

ksze ró

ż

nice mi

ę

dzy warto

ś

ciami

oczekiwanymi (o), a obserwowanymi (e) tym
silniejszy zwi

ą

zek mi

ę

dzy zmiennymi .

Suma ostatniej kolumny to warto

ść

χχχχ

2 –

jego

warto

ść

nie pozwala na bezpo

ś

rednie

oszacowanie siły zwi

ą

zku, dlatego na jego

podstawie obliczamy współczynniki
kontyngencji

Fi Yula i V Cramera

background image

Dane nominalne

• Dla tablic czteropolowych stosujemy współczynnik

Fi

(

φ

) Yula

. Przyjmuje on warto

ś

ci od 0 (brak do zwi

ą

zku)

do 1 (silny zwi

ą

zek)

N – liczba osób w tabeli

N

2

χ

ϕ

=

background image

Dane nominalne

• W przypadku tablic o wi

ę

kszej liczbie pól

stosujemy

współczynnik V Cramera

, który

interpretujemy podobnie jak

φ

Yula.

min (w-1:k-1)

oznacza mniejsz

ą

z dwóch

warto

ś

ci: liczba wierszy minus 1 lub liczba

kolumn minus 1

)

1

;

1

min(

2

=

k

w

N

V

χ

background image

Dane nominalne

• W naszym przykładzie tabela jest 9 -

polowa, zatem do oceny zwi

ą

zku mi

ę

dzy

miejscem zamieszkania a preferencjami
politycznymi nale

ż

y u

ż

y

ć

współczynnik

kontyngencji

V Cramera.

background image

Dane nominalne

23

,

0

2

*

140

79

,

14

)

1

;

1

min(

2

=

=

=

k

w

N

V

χ

Obliczona warto

ść

współczynnika V

ś

wiadczy o

bardzo słabym zwi

ą

zku mi

ę

dzy zmiennymi.

Nale

ż

y pami

ę

ta

ć

, i

ż

w przypadku danych nominalnych przy

interpretacji nale

ż

y równie

ż

opisa

ć

charakter zwi

ą

zku – np. w

województwie 1 przewa

ż

aj

ą

zwolennicy opcji B i C, a w

województwie 2 zwolennicy opcji A


Wyszukiwarka

Podobne podstrony:
Badanie korelacji zmiennych
Statystyka #9 Regresja i korelacja
06 Testy korelacjiid 6413 ppt
WS korelacja nowy
Zwiazki korelacyjne parametrow zageszczenia wyznaczonych VSS i LFG
Badanie korelacji
korelacja ZIP5
ZK PZ Spotkanie 6 (korelacje i Regresja)
Metodologia - SPSS - Zastosowanie komputerów - Brzezicka Rotkiewicz - Korelacje, Metodologia - SPSS
Korelacja ZIP6 id 248036 Nieznany
Korelacja liniowa, fizyczna, chemia fizyczna, Fizyczna, CH. FIZYCZNA, laborki sprawozdania fizyczna
projekt 1 zestaw korelacji, AGH GIG WGGiOŚ - GEOLOGIA NAFTOWA (II stopień), Analiza Basenów Sedyment
Zadaniedo8 ćwiczenia KORELACJA, Rok I, matematyka
Współczynnik korelacji rang spearmana
pps 3 analiza korelacyjna
Integracja a korelacja
Korelacja i regresja

więcej podobnych podstron