Wykład 8
Analiza korelacji
Korelacja krzywoliniowa
-miary krzywoliniowości
korelacji-
dr Elżbieta Gołąbeska
Rozważania dotyczące korelacji
między dwiema zmiennymi X i Y
prowadzone były dotychczas wyłącznie w
zakresie
stwierdzenia istnienia tejże korelacji.
Wprowadze
nie
W tym celu stawiano hipotezę zerową
o niezależności badanych zmiennych.
Następnie weryfikowano ją testem chi-
kwadrat.
W momencie odrzucenia H
0
stwierdzano,
że istnieje korelacja między X i Y.
Wprowadze
nie
Po stwierdzeniu, że korelacja istnieje,
w dalszej części analizy należałoby zbadać
czy jest to korelacja liniowa czy
krzywoliniowa.
Wprowadze
nie
Współczynnik korelacji
liniowej
Stosunki korelacyjne
Miary krzywoliniowości
Oznaczenia
xy
r
xy
e
yx
e
xy
m
yx
m
Czy korelacja jest liniowa czy
krzywoliniowa ?
Korelacja między zmiennymi X i Y jest liniowa,
jeśli
xy
r
=
xy
e
Zwykle jednak
|
|
xy
r
<
xy
e
Wówczas mówimy, że korelacja może być
krzywoliniowa
W celu stwierdzenia krzywoliniowości należy
wyznaczyć
tzw. miary krzywoliniowości korelacji
Miary krzywoliniowości korelacji
xy
m
=
xy
e
-
xy
r
oraz
yx
m
=
yx
e
-
xy
r
2
2
W przypadku, gdy
xy
m
>
0,2
to można sądzić, że zależność między zmiennymi X i
Y
jest krzywoliniowa
2
2
Wstępna interpretacja miar
krzywoliniowości korelacji
Interpretacja miar krzywoliniowości korelacji jest
tylko wstępna
i powinna być uzupełniona bardziej obiektywną
oceną statystyczną.
W tym celu należy dokonać weryfikacji hipotezy
zerowej
zakładającej, że korelacja między zmiennymi jest
liniowa
wobec prawostronnej hipotezy alternatywnej.
Hipoteza o liniowości korelacji
0
)
(
:
0
xy
xy
r
e
E
H
0
)
(
:
0
xy
yx
r
e
E
H
wobe
c
0
)
(
:
1
xy
xy
r
e
E
H
2
2
2
2
2
2
Weryfikacja hipotezy o liniowości
korelacji
Do weryfikacji powyższych hipotez zerowych na
deklarowanym poziomie istotności stosujemy
odpowiednio testy
l
n
e
l
r
e
F
xy
xy
xy
x
1
1
k
n
e
k
r
e
F
yx
xy
yx
y
1
1
lub
gdzie: k – liczba wierszy l – liczba kolumn n –
liczebność próby losowej
2
2
2
2
2
2
Obszar krytyczny
W celu podjęcia decyzji weryfikacyjnej
należy w oparciu o hipotezę alternatywną
wyznaczyć (prawostronny) obszar krytyczny:
)
,
(
2
1
,
,
s
s
F
1
1
k
s
k
n
s
2
Decyzja weryfikacyjna
Jeżeli wynik testu mieści się w wyznaczonym
obszarze krytycznym,
to hipotezę zerową należy odrzucić
na korzyść hipotezy alternatywnej,
co oznacza, że korelacja między badanymi
zmiennymi
jest krzywoliniowa.
Przykład
Analizą statystyczną objęto 50 polskich największych firm
(próba losowa) w 2011 roku ze względu na zysk brutto (w
tys.PLN)
i rentowność brutto (w procentach poniesionych nakładów).
Dla obu zmiennych zestawiono ETK o wymiarach 5 x 5 i
otrzymano fragment wydruku komputerowego:
wsp. korelacji liniowej - 0,3462
x wz y y wz x
stosunki korelacyjne 0,7227 0,6905
miary krzywoliniowości 0,4024 0,3569
Deklarując poziom istotności 0,01 wypowiedzieć się czy
korelacja obserwowanych zmiennych jest liniowa i ujemna.
Bardzo dziękuję za uwagę
i zapraszam na kolejny wykład
Elżbieta Gołąbeska