ĆWICZENIE 11
Korelacja
1.
Współczynnik korelacji
2.
Współczynnik korelacji liniowej –definicja
3.
Estymacja współczynnika korelacji
4.
Testy istotności współczynnika korelacji
Regresja
1.
Metoda najmniejszych kwadratów
2. Regresja liniowa-
wyznaczanie parametrów A i B
dla ‘najlepszej prostej) Y= A +B*X
3. Testy dla parametru B (nachylenia)
ANALIZA KORELACJI I REGRESJI
KORELACJA
Korelacja ujemna występuje wtedy, gdy wzrostowi wartości jednej zmiennej odpowiada
spadek średnich wartości drugiej zmiennej (przypadek 2. na rys. 1).
W analizie korelacji badacz jednakowo traktuje obie zmienne -
nie wyróżniamy zmiennej
zależnej i niezależnej. Korelacja między X i Y jest taka sama, jak między Y i X. Mówi nam ona,
na ile obie zmienne zmieniają się równocześnie w sposób liniowy. Precyzyjna definicja zaś
brzmi:
Korelacja między zmiennymi X i Y jest miarą siły liniowego
związku między tymi zmiennymi
Rys. 1. Korelacyjne
wykresy rozrzutu; 1 -
korelacja liniowa
dodatnia, 2 - korelacja
liniowa ujemna, 3 - brak
korelacji, 4 - korelacja
krzywoliniowa
WSPÓŁCZYNNIK KORELACJI
LINIOWEJ
WSPÓŁCZYNNIK KORELACJI
LINIOWEJ
WSPÓŁCZYNNIK KORELACJI LINIOWEJ
Z nierówności Schwarza wynika, że:
Jeśli to punkty leżą na pewnej prostej.
Jeśli r jest bliskie zeru, to punkty są nieskorelowane i nie wyznaczają prostej.
Współczynnik korelacji można wyznaczyć korzystając z EXCELA:
Wstaw funkcję| statystyczne| WSP.KORELACJI
Tablica 1 - wstawić wartości x
i
Tablica 2 - wstawić wartości y
i
r
xy
(wsp. korelacji dla próby. Wylicza się ze wzoru:
ESTYMACJA i TEST ISTOTNOŚCI DLA
WSPÓŁCZYNNIKA KORELACJI
Współczynnik korelacji dla populacji:
Jego estymatorem jest współczynnik korelacji z próby:
Przypadek 1. Dwuwymiarowy rozkład badanych dwu mierzalnych cech X i Y w
populacji generalnej jest normalny, bądź zbliżony do normalnego. Z populacji
tej wylosowano do próby n elementów ( n-kilkaset). Wzór na przedział ufności :
z
α
ma rozkład N(0,1)
(16)
(17)
(18)
ESTYMACJA i TEST ISTOTNOŚCI DLA
WSPÓŁCZYNNIKA KORELACJI
z
α
ma rozkład N(0,1)
Ćwiczenie: Wykonano n=240 niezależnych pomiarów oporu elektrycznego R
kawałka metalu dla różnych temperatur w przedziale 298K< T<738K i
otrzymano dla par (T
i
, R
i
) i=1, 2,…240 współczynnik korelacji próby:
r
TR
=0,7945
. Przyjmując poziom ufności 1-
=0,95
zbudować przedział ufności
dla nieznanego wsp. korelacji populacji
ρ między temperaturą a oporem.
Rozwiązanie:
1-
=0,95 =>
/2=0,025 => z
=1,960
0,7945-0,0467 <
ρ < 0,7945+0,0467 czyli: 0,7478 < ρ < 0,8412
TEST ISTOTNOŚCI DLA WSPÓŁCZYNNIKA
KORELACJI
Przypadek 2. Dwuwymiarowy rozkład badanych dwu mierzalnych cech X i Y w
populacji generalnej jest normalny, bądź zbliżony do normalnego. Z populacji tej
wylosowano do próby n elementów ( niekoniecznie dużo). Na podstawie wyników
próby sprawdzić hipotezę, że zmienne X i Y nie są skorelowane tj: H
o
: ρ=0
Statystyka:
t- rozkład t-Studenta z k=n-2, jeśli: |t|<t
α
nie ma podstaw do odrzucenia H
o
(zmienne
X i Y są nieskorelowane). Gdy hipoteza alternatywna precyzuje znak ρ, tzn. gdy H
1
: ρ<0
lub H
1
: ρ>0, wówczas w tym teście korzystamy z lewostronnego lub prawostronnego
obszaru krytycznego, odpowiednio.
(19)
ESTYMACJA i TEST ISTOTNOŚCI DLA
WSPÓŁCZYNNIKA KORELACJI
Przypadek 3. Dwuwymiarowy rozkład badanych dwu mierzalnych cech X i Y w
populacji generalnej jest normalny, bądź zbliżony do normalnego. Z
populacji tej wylosowano do próby n elementów ( niekoniecznie dużo).Na
podstawie wyników próby sprawdzić hipotezę, że współczynnik korelacji w
populacji ma określona wartość ρ
o
(ρ
o
0), wobec hipotezy alternatywnej:
H
1
: ρ
ρ
o
Statystyka:
z ma rozkład N(0,1) jeśli |z|>z
α
( tj. z znajduje się w obszarze
krytycznym) to H
o
odrzucić. Gdy H
1
: ρ<ρ
o
lub H
1
: ρ> ρ
o
, wówczas w tym
teście korzystamy z lewostronnego lub prawostronnego obszaru
krytycznego, odpowiednio.
(20)
ESTYMACJA i TEST ISTOTNOŚCI
DLA WSPÓŁCZYNNIKA KORELACJI
Zadanie: Spośród studentów pewnego wydziału wylosowano
niezależnie 10 studentów IV roku i otrzymano dla nich następujące
średnie oceny uzyskane w sesji egzaminacyjnej na I roku (x
i
) oraz
na IV roku (y
i
) :
x
i
3,5 4,0 3,8 4,6 3,9 3,0 3,5 3,9 4,5 4,1
y
i
4,2 3,9 3,8 4,5 4,2 3,4 3,8 3,9 4,6 4,0
a) Sporządzić wykres y jako funkcja x
b) Na poziomie istotności
=0,05 zweryfikować hipotezę, że istnieje
korelacja między wynikami studiów uzyskiwanymi przez studentów
tego wydziału na I i IV roku.
H
o
:
=0, wobec H
1
:
0
ROZWIĄZANIE
k = n-2
WSPÓŁCZYNNIK KORELACJI RANG
SPEARMANA
Współczynnik korelacji rang Spearmana (współczynnik korelacji kolejnościowej)
stosuje się w przypadkach:
1) Obie cechy są mierzalne lecz próba jest mało liczna
2) Przynajmniej jedna z cech ma charakter jakościowy i jest możliwość ustalenia
kolejności ,natężenia’ tej cechy, porządkując poszczególne elementy w ciąg
rosnąco lub malejąco.
Element próby ze względu na każdą cechę otrzymuje
rangę
,
która określa jego miejsce w ciągu.
Dla n-elementowej próby ranę ze względu na cechę X oznaczamy
c
ix
gdzie x=1, 2,… n. Natomiast rangę na cechę Y oznaczamy
c
iy
.
Różnicę rang oznaczmy jako;
d
i
=c
ix
-c
iy
Współczynnik korelacji rang Spearmana:
Okazuje się, że :
Jeśli |r
s
| jest bliski 1
– silna zależność obu cech.
WSPÓŁCZYNNIK KORELACJI RANG SPEARMANA
(Przykład)
Przykład: W 15-sto osobowej
grupie studentów sprawdzono
ranking ich ocen z chemii i fizyki. Na
czele umieszczono najlepszych, zaś
na końcu najsłabszych. Wyniki
rankingu zebrano w tabeli. Czy
można przyjąć, że istnieje silna
zależność między wynikami
osiąganymi z obu przedmiotów?
CHEMIA
FIZYKA
Miejsce w
rankingu
Nazwisko
studenta
Miejsce w
rankingu
Nazwisko
studenta
1
AX
1
IP
2-3
BY
2
CZ
CZ
3
EW
4
DV
4
AX
5
EW
5
BY
6
FT
6
JQ
7
GS
7
HR
8
HR
8
GS
9
IP
9
DV
10
JQ
10
LN
11
KO
11
KO
12
LN
12
FT
13
MM
13
MM
14
NL
14
OK
15
OK
15
NL
Lp.
Nazwisko
studenta
c
ix
c
iy
d
i
=c
ix
-c
iy
d
i
2
1
AX
1
4
-3
9
2
CZ
2,5
2
0,5
0,25
3
BY
2,5
5
-2,5
6,25
4
DV
4
9
-5
25
5
EW
5
3
2
4
6
FT
6
12
-6
36
7
GS
7
7
0
0
8
HR
8
8
0
0
9
IP
9
1
8
64
10
JQ
10
6
4
16
11
KO
11
11
0
0
12
LN
12
10
2
4
13
MM
13
13
0
0
14
NL
14
15
-1
1
15
OK
15
14
1
1
SUMA
168,5
Współzależność jest dodatnia i umiarkowanie silna
WSPÓŁCZYNNIK KORELACJI RANG SPEARMANA
(Przykład)
WSPÓŁCZYNNIK KORELACJI RANG SPEARMANA
TEST ISTOTNOSCI
H
o
:
ρ =0 (brak korelacji między X i Y)
H
1
:
ρ
0
t
– rozkład t-Studenta; k= n-2
METODA NAJMNIEJSZYCH KWADRATÓW
METODA NAJMNIESZYCH KWADRATÓW
gdzie:
lub, w równoważnej formie:
y= A + Bx
METODA NAJMNIESZYCH KWADRATÓW
y= A + Bx
EXCEL| wstaw funkcję | statystyczne| NACHYLENIE:
znane_y :
znane _x :
B
EXCEL| wstaw funkcję | statystyczne| ODCIĘTA:
znane_y :
znane _x :
A
WYZNACZANIE A i B
• EXCEL| statystyczne| NACHYLENIE
,
• znane_y (wstawić wartości y
i
)
• znane_x (wstawić wartości x
i
)
B
EXCEL| statystyczne| ODCIĘTA
,
• znane_y (wstawić wartości y
i
)
znane_x (wstawić wartości x
i
)
•
A
TESTY ISTOTNOŚCI DLA WSPÓŁCZYNNIKA B
(NACHYLENIA) REGRESJI LINIOWEJ
1. H
o
: B=
o
k= N-2
2. H
o
:
1
=
2
(test równoległości)
k= N1+N2 -4
ZADANIA
500 6E-10
550 9E-9
600 4.5E-8
630 1.3E-7
650 2.8E-7
675 4E-7
700 8E-7
750 3.2E-6
800 5.5E-6
TABELA
T[K]
σ [(Ωm)
-1
]
Zadanie 1: Wykonano pomiary przewodnictwa
elektrycznego (
σ) półprzewodnika w zakresie
temperatur 500K <T< 800 K Wyniki pomiarów
podano w Tabeli. Wykonać:
a)
Obliczyć współczynnik korelacji r
b)
Sporządzić wykres σ= f(T)
c)
Na poziomie istotności α= 0,001 sprawdzić
czy zmienne (T,
σ) są skorelowane (liniowo).
d)
Metodą najmniejszych kwadratów wyznaczyć
parametry prostej:
σ= A + B*T
e)
Zmieniając zmienne (T, σ) na (1/T, log σ)
powtórzyć czynności a-c
f)
Na poziomie istotności α= 0,001 sprawdzić
czy zmienne (1/T, log
σ) są skorelowane
(liniowo).
g)
Metodą najmniejszych kwadratów wyzna
czyć
parametry prostej: log
σ= A
1
+ B
1
* (1/T)
WSPÓŁCZYNNIK PEARSONA vs. SPEARMANA
Nauczy
ciel (i)
Punkty
przyznane
przez
dyrektora X
1i
Punkty
przyznane
przez
wizytatora X
2i
Rangi
ocen
dyrektora
r
1i
Rangi
ocen
wizytat
ora r
2i
d
i
= r
1i
-
r
2i
d
i
2
1
5
5
2
15
10
3
5
10
4
10
15
5
20
20
Suma
Obliczyć współczynniki korelacji ocen dyrektora (X
1
) oraz wizytatora (X
2
)
a) Pearsona
b) Spearmana
Zadanie 2: W pewnej szkole poddano
nowoprzyjętych nauczycieli ocenie.
Opinie
wydał dyrektor szkoły i wizytator. Wyniki oceny zamieszczono w
poniższej tabeli: