C11 2

background image

ĆWICZENIE 11

Korelacja

1.

Współczynnik korelacji

2.

Współczynnik korelacji liniowej –definicja

3.

Estymacja współczynnika korelacji

4.

Testy istotności współczynnika korelacji

Regresja

1.

Metoda najmniejszych kwadratów

2. Regresja liniowa-

wyznaczanie parametrów A i B

dla ‘najlepszej prostej) Y= A +B*X

3. Testy dla parametru B (nachylenia)

ANALIZA KORELACJI I REGRESJI

background image

KORELACJA

Korelacja ujemna występuje wtedy, gdy wzrostowi wartości jednej zmiennej odpowiada

spadek średnich wartości drugiej zmiennej (przypadek 2. na rys. 1).

W analizie korelacji badacz jednakowo traktuje obie zmienne -

nie wyróżniamy zmiennej

zależnej i niezależnej. Korelacja między X i Y jest taka sama, jak między Y i X. Mówi nam ona,
na ile obie zmienne zmieniają się równocześnie w sposób liniowy. Precyzyjna definicja zaś
brzmi:

Korelacja między zmiennymi X i Y jest miarą siły liniowego

związku między tymi zmiennymi

Rys. 1. Korelacyjne
wykresy rozrzutu; 1 -
korelacja liniowa
dodatnia, 2 - korelacja
liniowa ujemna, 3 - brak
korelacji, 4 - korelacja
krzywoliniowa

background image

WSPÓŁCZYNNIK KORELACJI

LINIOWEJ


background image

WSPÓŁCZYNNIK KORELACJI

LINIOWEJ

background image

WSPÓŁCZYNNIK KORELACJI LINIOWEJ

Z nierówności Schwarza wynika, że:

Jeśli to punkty leżą na pewnej prostej.

Jeśli r jest bliskie zeru, to punkty są nieskorelowane i nie wyznaczają prostej.

Współczynnik korelacji można wyznaczyć korzystając z EXCELA:

Wstaw funkcję| statystyczne| WSP.KORELACJI

Tablica 1 - wstawić wartości x

i

Tablica 2 - wstawić wartości y

i

r

xy

(wsp. korelacji dla próby. Wylicza się ze wzoru:

background image

ESTYMACJA i TEST ISTOTNOŚCI DLA

WSPÓŁCZYNNIKA KORELACJI

Współczynnik korelacji dla populacji:

Jego estymatorem jest współczynnik korelacji z próby:

Przypadek 1. Dwuwymiarowy rozkład badanych dwu mierzalnych cech X i Y w
populacji generalnej jest normalny, bądź zbliżony do normalnego. Z populacji
tej wylosowano do próby n elementów ( n-kilkaset). Wzór na przedział ufności :

z

α

ma rozkład N(0,1)

(16)

(17)

(18)

background image

ESTYMACJA i TEST ISTOTNOŚCI DLA

WSPÓŁCZYNNIKA KORELACJI

z

α

ma rozkład N(0,1)

Ćwiczenie: Wykonano n=240 niezależnych pomiarów oporu elektrycznego R
kawałka metalu dla różnych temperatur w przedziale 298K< T<738K i
otrzymano dla par (T

i

, R

i

) i=1, 2,…240 współczynnik korelacji próby:

r

TR

=0,7945

. Przyjmując poziom ufności 1-

=0,95

zbudować przedział ufności

dla nieznanego wsp. korelacji populacji

ρ między temperaturą a oporem.

Rozwiązanie:

1-

=0,95 =>

/2=0,025 => z

=1,960


0,7945-0,0467 <

ρ < 0,7945+0,0467 czyli: 0,7478 < ρ < 0,8412

background image

TEST ISTOTNOŚCI DLA WSPÓŁCZYNNIKA

KORELACJI

Przypadek 2. Dwuwymiarowy rozkład badanych dwu mierzalnych cech X i Y w

populacji generalnej jest normalny, bądź zbliżony do normalnego. Z populacji tej
wylosowano do próby n elementów ( niekoniecznie dużo). Na podstawie wyników
próby sprawdzić hipotezę, że zmienne X i Y nie są skorelowane tj: H

o

: ρ=0

Statystyka:

t- rozkład t-Studenta z k=n-2, jeśli: |t|<t

α

nie ma podstaw do odrzucenia H

o

(zmienne

X i Y są nieskorelowane). Gdy hipoteza alternatywna precyzuje znak ρ, tzn. gdy H

1

: ρ<0

lub H

1

: ρ>0, wówczas w tym teście korzystamy z lewostronnego lub prawostronnego

obszaru krytycznego, odpowiednio.

(19)

background image

ESTYMACJA i TEST ISTOTNOŚCI DLA

WSPÓŁCZYNNIKA KORELACJI

Przypadek 3. Dwuwymiarowy rozkład badanych dwu mierzalnych cech X i Y w

populacji generalnej jest normalny, bądź zbliżony do normalnego. Z
populacji tej wylosowano do próby n elementów ( niekoniecznie dużo).Na
podstawie wyników próby sprawdzić hipotezę, że współczynnik korelacji w
populacji ma określona wartość ρ

o

o

0), wobec hipotezy alternatywnej:

H

1

: ρ

ρ

o

Statystyka:

z ma rozkład N(0,1) jeśli |z|>z

α

( tj. z znajduje się w obszarze

krytycznym) to H

o

odrzucić. Gdy H

1

: ρ<ρ

o

lub H

1

: ρ> ρ

o

, wówczas w tym

teście korzystamy z lewostronnego lub prawostronnego obszaru
krytycznego, odpowiednio.

(20)

background image

ESTYMACJA i TEST ISTOTNOŚCI

DLA WSPÓŁCZYNNIKA KORELACJI

Zadanie: Spośród studentów pewnego wydziału wylosowano
niezależnie 10 studentów IV roku i otrzymano dla nich następujące
średnie oceny uzyskane w sesji egzaminacyjnej na I roku (x

i

) oraz

na IV roku (y

i

) :


x

i

3,5 4,0 3,8 4,6 3,9 3,0 3,5 3,9 4,5 4,1

y

i

4,2 3,9 3,8 4,5 4,2 3,4 3,8 3,9 4,6 4,0


a) Sporządzić wykres y jako funkcja x
b) Na poziomie istotności

=0,05 zweryfikować hipotezę, że istnieje

korelacja między wynikami studiów uzyskiwanymi przez studentów
tego wydziału na I i IV roku.
H

o

:

=0, wobec H

1

:

0

background image

ROZWIĄZANIE

k = n-2

background image

WSPÓŁCZYNNIK KORELACJI RANG

SPEARMANA

Współczynnik korelacji rang Spearmana (współczynnik korelacji kolejnościowej)
stosuje się w przypadkach:
1) Obie cechy są mierzalne lecz próba jest mało liczna
2) Przynajmniej jedna z cech ma charakter jakościowy i jest możliwość ustalenia
kolejności ,natężenia’ tej cechy, porządkując poszczególne elementy w ciąg
rosnąco lub malejąco.

Element próby ze względu na każdą cechę otrzymuje

rangę

,

która określa jego miejsce w ciągu.
Dla n-elementowej próby ranę ze względu na cechę X oznaczamy

c

ix

gdzie x=1, 2,… n. Natomiast rangę na cechę Y oznaczamy

c

iy

.

Różnicę rang oznaczmy jako;

d

i

=c

ix

-c

iy

Współczynnik korelacji rang Spearmana:


Okazuje się, że :


Jeśli |r

s

| jest bliski 1

– silna zależność obu cech.

background image

WSPÓŁCZYNNIK KORELACJI RANG SPEARMANA

(Przykład)

Przykład: W 15-sto osobowej
grupie studentów sprawdzono
ranking ich ocen z chemii i fizyki. Na
czele umieszczono najlepszych, zaś
na końcu najsłabszych. Wyniki
rankingu zebrano w tabeli. Czy
można przyjąć, że istnieje silna
zależność między wynikami
osiąganymi z obu przedmiotów?

CHEMIA

FIZYKA

Miejsce w
rankingu

Nazwisko

studenta

Miejsce w
rankingu

Nazwisko

studenta

1

AX

1

IP

2-3

BY

2

CZ

CZ

3

EW

4

DV

4

AX

5

EW

5

BY

6

FT

6

JQ

7

GS

7

HR

8

HR

8

GS

9

IP

9

DV

10

JQ

10

LN

11

KO

11

KO

12

LN

12

FT

13

MM

13

MM

14

NL

14

OK

15

OK

15

NL

background image

Lp.

Nazwisko
studenta

c

ix

c

iy

d

i

=c

ix

-c

iy

d

i

2

1

AX

1

4

-3

9

2

CZ

2,5

2

0,5

0,25

3

BY

2,5

5

-2,5

6,25

4

DV

4

9

-5

25

5

EW

5

3

2

4

6

FT

6

12

-6

36

7

GS

7

7

0

0

8

HR

8

8

0

0

9

IP

9

1

8

64

10

JQ

10

6

4

16

11

KO

11

11

0

0

12

LN

12

10

2

4

13

MM

13

13

0

0

14

NL

14

15

-1

1

15

OK

15

14

1

1

SUMA

168,5

Współzależność jest dodatnia i umiarkowanie silna

WSPÓŁCZYNNIK KORELACJI RANG SPEARMANA

(Przykład)

background image

WSPÓŁCZYNNIK KORELACJI RANG SPEARMANA

TEST ISTOTNOSCI

H

o

:

ρ =0 (brak korelacji między X i Y)

H

1

:

ρ

0


t

– rozkład t-Studenta; k= n-2

background image

METODA NAJMNIEJSZYCH KWADRATÓW

background image

METODA NAJMNIESZYCH KWADRATÓW

gdzie:

lub, w równoważnej formie:

y= A + Bx

background image

METODA NAJMNIESZYCH KWADRATÓW

y= A + Bx

EXCEL| wstaw funkcję | statystyczne| NACHYLENIE:

znane_y :

znane _x :

B

EXCEL| wstaw funkcję | statystyczne| ODCIĘTA:

znane_y :

znane _x :

A

background image

WYZNACZANIE A i B

EXCEL| statystyczne| NACHYLENIE

,

znane_y (wstawić wartości y

i

)

znane_x (wstawić wartości x

i

)

B

EXCEL| statystyczne| ODCIĘTA

,

znane_y (wstawić wartości y

i

)

znane_x (wstawić wartości x

i

)

A

background image

TESTY ISTOTNOŚCI DLA WSPÓŁCZYNNIKA B

(NACHYLENIA) REGRESJI LINIOWEJ

1. H

o

: B=

o

k= N-2

2. H

o

:

1

=

2

(test równoległości)

k= N1+N2 -4

background image

ZADANIA

500 6E-10
550 9E-9
600 4.5E-8
630 1.3E-7
650 2.8E-7
675 4E-7
700 8E-7
750 3.2E-6
800 5.5E-6

TABELA

T[K]

σ [(Ωm)

-1

]

Zadanie 1: Wykonano pomiary przewodnictwa
elektrycznego (

σ) półprzewodnika w zakresie

temperatur 500K <T< 800 K Wyniki pomiarów
podano w Tabeli. Wykonać:
a)

Obliczyć współczynnik korelacji r

b)

Sporządzić wykres σ= f(T)

c)

Na poziomie istotności α= 0,001 sprawdzić
czy zmienne (T,

σ) są skorelowane (liniowo).

d)

Metodą najmniejszych kwadratów wyznaczyć
parametry prostej:

σ= A + B*T

e)

Zmieniając zmienne (T, σ) na (1/T, log σ)
powtórzyć czynności a-c

f)

Na poziomie istotności α= 0,001 sprawdzić
czy zmienne (1/T, log

σ) są skorelowane

(liniowo).

g)

Metodą najmniejszych kwadratów wyzna

czyć

parametry prostej: log

σ= A

1

+ B

1

* (1/T)

background image

WSPÓŁCZYNNIK PEARSONA vs. SPEARMANA

Nauczy

ciel (i)

Punkty

przyznane

przez

dyrektora X

1i

Punkty

przyznane

przez

wizytatora X

2i

Rangi

ocen

dyrektora

r

1i

Rangi

ocen

wizytat

ora r

2i

d

i

= r

1i

-

r

2i

d

i

2

1

5

5

2

15

10

3

5

10

4

10

15

5

20

20

Suma

Obliczyć współczynniki korelacji ocen dyrektora (X

1

) oraz wizytatora (X

2

)

a) Pearsona
b) Spearmana

Zadanie 2: W pewnej szkole poddano

nowoprzyjętych nauczycieli ocenie.

Opinie

wydał dyrektor szkoły i wizytator. Wyniki oceny zamieszczono w

poniższej tabeli:


Wyszukiwarka

Podobne podstrony:
Podstawy zarządzania 6 01 2008 C11 ćw 5
C11 5
C11 3
Nissan Tiida, typ C11, 2006
C11 Liczby zespolone
Celestron C6, C8, C9 25, C11 SGT
C11, SGSP, SGSP, cz.1, hydromechanika, Hydromechanika, instrukcje stare
C11 sch
C11 6
C-11, Sprawozdanie z ˙wiczenia C11
C11
Elementy grafiki inzynierskiej c11
C11 2
ADAM C11
c11 (2)
meo C11
highwaycode pol c11 niekozystne warunki atmosferyczne (s 77 79, r 229 237)
lwm c11
C11 7

więcej podobnych podstron