WYKLADY SZ A KORELACJI bezCHI2


35
b. ANALIZA WSPÓAZALEŻNOŚCI
 RACHUNEK KORELACJI I REGRESJI
W badaniu współzależności zjawisk rozróżniamy dwa rodzaje zależności:
- zależność funkcyjną  polega na tym, że zmiana wartości jednej zmiennej powodu-
je ściśle określoną zmianę wartości drugiej zmiennej  oznacza to, że okre-
ślonej wartości jednej zmiennej odpowiada ściśle określona i tylko jedna
wartość drugiej zmiennej
- zależność stochastyczna  to zależność pomiędzy dwoma zmiennymi losowymi po-
legająca na tym, że ze zmianą jednej z nich zmienia się rozkład prawdopo-
dobieństwa drugiej zmiennej
- z tą zależnością mamy do czynienia wtedy, gdy wpływ jednej zmiennej
na drugą zależny jest od czynników przypadkowych wspólnie działających
na obie zmienne
- szczególnym przypadkiem tej zależności jest zależność korelacyjna 
występuje ona wówczas, gdy określonym wartościom jednej zmiennej
przyporządkowuje się pewne średnie z kilku wartości drugi zmiennej
Metody wyznaczania zależności korelacyjnej
a. Najprostszym sposobem jest zgrupowanie materiału w szeregi statystyczne wg cech,
które chcemy badać:
- jeżeli wzrostom wartości danych jednego szeregu statystycznego odpowiadają
spadki wartości drugiego szeregu, wówczas mamy do czynienia z korelacją ujem-

- jeżeli wzrostom wartości danych jednego szeregu statystycznego odpowiadają
wzrosty wartości danych drugiego szeregu, a spadkom odpowiadają spadki wów-
czas mamy do czynienia z korelacją dodatnia
b. Diagram korelacyjny  jest to przeniesienie na wykres w fazie punktów danych licz-
bowych, co w efekcie daje pewien rozrzut
- Diagram korelacyjny umożliwia wstępną ocenę siły i kierunku zależności, a także
daje podstawę do wyboru odpowiedniej funkcji matematycznej opisującej zależ-
ność między badanymi zmiennymi.
36
skutek
y y y
. . ... . .. . ..
.
. . . . . . .. . .. .. . . . .. .
. . . .
. . .
. . . . . .. . . . . . . . . . .. . . .
.
. . .
. . . . . . . . . . . . . . . . .
. . .
. . . .
. . . . . . . . . . . ..
x x x
przyczyna
korelacja dodatnia korelacja ujemna brak zależności
x to y x to y Ż między badanymi
x Ż to y Ż x Ż to y cechami
c. Współczynnik korelacji Pearsona
n
1 ć
xi yi - x y

N
Ł i=1 ł
rxy =
-1 Ł rxy Ł1
sx sy
Wskazuje na kierunek powiązania:
- jeżeli r(x;y) = -1  doskonała korelacja ujemna,
- jeżeli  1 < r(x;y) < 0  niedoskonała korelacja ujemna,
- jeżeli r(x;y) = 0  brak związku między badanymi cechami,
- jeżeli 0 < r(x;y) < 1  niedoskonała korelacja dodatnia,
- jeżeli r(x;y) = 1  doskonała korelacja dodatnia.
Wskazuje na siłę powiązania:
- jeżeli r(x;y) zbliża się do 0, oznacza to, że nie ma związku między badanymi ce-
chami,
- jeżeli r(x;y) zbliża się do 1 lub -1, oznacza to, że związek między badanymi ce-
chami jest silny.
x, y  cechy ilościowe (mierzalne)
37
Równanie regresji
- jest ilościowym wyrazem zależności między określonymi wartościami zmien-
nej niezależnej i odpowiadającymi im średnimi wartościami zmiennej zależnej
Mamy dwa równania regresji:
Y'(x) = a(y) +b( y) X
X  zmienna niezależna
Y  zmienna zależna
X '(y) = a(x) + b(x) Y
X  zmienna zależna
Y  zmienna niezależna
a(x) , a(y)  wyrazy wolne równania regresji  nie posiadają samodzielnej treści
ekonomicznej  nie interpretujemy ich
b(x) , b(y)  współczynniki regresji  wartość współczynnika regresji wyraża o ile
przeciętnie zmieni się (wzrośnie lub zmaleje) zmienna zależna, jeśli
zmienna niezależna wzrośnie o jednostkę
sy
b(y) = r a(y) = y - b(y) x
sx
sx
b(x) = r a(x) = x - b( x) y
sy
rxy = b(y)b(x)
y y y y y
y y
x x x x x
x x
r(x;y) = -1 0 < r(x;y) < 1 r(x;y) = 0 -1< r(x;y) < 0 r(x;y) = -1
im mniejszy kąt,
tym zależność
jest silniejsza
38
Odchylenie standardowe składnika resztowego (średni błąd szacunku)
- szacując wartość y na podstawie wartości x (lub odwrotnie) musimy się liczyć
z możliwością popełnienia błędu  jeśli porównamy wartości empiryczne z
wielkościami teoretycznymi (obliczonymi na podstawie funkcji regresji), to
zauważymy, że pomiędzy nimi występują różnice
Pomiaru tych odchyleń dokonujemy obliczając średni błąd szacunku S.
- względem cechy y:
n
- yi ')2
(yi
i=1
S( y) =
n - k
gdzie: yi  wartości empiryczne
yi  wartości teoretyczne (wyzn. na podst. równania regresji)
n  liczebność próby
k  liczba szacowanych parametrów
S( y) = sy 1- r( x;y) 2 - gdy znamy r(x;y)
gdzie: sy  odchylenie standardowe
- względem cechy x:
n
- xi ')2
(xi
i=1
S( x) =
n - k
2
S( x) = sx 1- r
Wielkość odchylenia standardowego składnika resztowego informuje o ile przeciętnie
można się pomylić szacując wartości zmiennych x i y na podstawie funkcji regresji.
(Wielkość błędu mierzy dokładnie przewidywanie zmiennej na podstawie funkcji regre-
sji.)
39
Miary dobroci dopasowania
- służą do oceny stopnia dopasowania funkcji regresji do danych empirycznych
- współczynnik determinacji  informuje jaki procent zmienności zmiennej
objaśnianej jest wyjaśnione przez wyznaczone równanie regresji:
d = r( x; y) 2 100
- współczynnik indeterminacji  pomnożony przez 100 określa procent zmien-
ności zmiennej objaśnianej niewyjaśniony daną regresją
n
- yi ')2
(yi
2 i=1
j = j2 = 1- d
n
- y)2
(yi
i=1
- gdy współczynnik determinacji dąży do jedności, a współczynnik in-
determinacji dąży do zera, wówczas statystyczna dobroć dopasowa-
nia funkcji rośnie
- gdy współczynnik determinacji dąży do zera, a współczynnik inde-
terminacji dąży do jedności, wówczas statystyczna dobroć dopaso-
wania funkcji maleje
- w przypadku gdy współczynnik determinacji równa się jedności, a
współczynnik indeterminacji równa się zeru mamy sytuację, w której
zaobserwowane punkty leżą dokładnie na prostej
- w przypadku gdy współczynnik determinacji równa się zeru, a
współczynnik indeterminacji równa się jedności wówczas występuje
maksymalne możliwe odchylenie się punktów od dopasowanej pro-
stej
- współczynnik zmienności resztowej  informuje jaki procent zaobserwowa-
nej zmienności zmiennej objaśnianej stanowią odchylenia przypad-
kowe
S( y)
Vr = 100
y
gdzie: S(y)  odchylenie standardowe składnika resztowego
40
Korelacja wieloraka i cząstkowa
- Korelacja wieloraka  występuje wówczas, porównujemy ze sobą więcej niż dwie
cechy.
- Korelacja cząstkowa  polega na tym, że porównujemy ze sobą dwie cechy z równo-
czesnym założeniem, że istnieją i mają wpływ na dane zjawisko inne ce-
chy, od których świadomie się abstrahuje poprzez ich eliminację.
- Współczynnik korelacji cząstkowej w przypadku trzech zmiennych:
y  zmienna objaśniana
x1, x2  zmienne objaśniające
ryx - ryx rx x2
1 2 1
ryx x2 =
1
2
(1- ryx )(1- rx2x )
2 1 2
ryx - ryx rx x2
2 1 1
ryx x1 =
2
2
(1- ryx )(1- rx2x )
1 1 2
rx x2 - ryx ryx
1 1 2
rx x2y =
1
2 2
(1- ryx )(1- ryx )
1 2
- Współczynnik korelacji wielorakiej w przypadku trzech zmiennych:
2 2
Ryx x2 = 1-(1- ryx )(1- ryx x1 )
1 1 2
0 Ł Ryx x2 Ł1
1
Regresja wieloraka
Y'= a0 + a1X1 + a2 X + ... + ai X + x
2 i
gdzie: Y  zmienna objaśniana
Xi  zmienne objaśniające
a0  wyraz wolny funkcji regresji
ai  współczynnik regresji
x - składnik losowy
41
- W przypadku trzech zmiennych:
Y'= a0 + a1X1 + a2 X
2
sy ryx - ryx rx x2 sy ryx - ryx rx x2
1 2 1 2 1 1
a1 = a2 =
sx 1- rx2x sx 1- rx2x
a0 = y - a1 x1 - a2 x2
1 1 2 2 1 2
gdzie: sy , sx , sx - odchylenia standardowe zmiennych y, x1, x2
1 2
- Odchylenie standardowe składnika resztowego
- yi ')2
(yi
2
S( y) = S( y) = sy 1- Ryx x2
1
n - 3
- Współczynniki b - miara relatywnego wpływu zmiennych objaśniających na zmienną
objaśnianą
sx sx
1 2
b1 = a1 b2 = a2
sy sy
Korelacja rang  Spearmana
Metoda zwana korelacją rang (lub korelacją kolejności) ma zastosowanie wówczas, gdy
badana zbiorowość jest nieliczna, mniejsza niż 30 jednostek.
W przypadku, gdy pomiędzy badanymi zjawiskami lub cechami występuje związek, wówczas
ranga (kolejność) rozpatrywana według wielkości skojarzonych wartości zmiennych x i y
będzie taka sama lub też bardzo podobna.
- Współczynnik korelacji Spearmana
n
6 )2
(di
i=1
rs = 1-
-1 < rs < 1
n3 - n
gdzie: n  liczebność próby
di  różnica pomiędzy rangą cechy x i y ( di = Rx - Ry )
i i
42
Przykład 1
Produkcja budowlano-montażowa oraz przeciętne zatrudnienie w Polsce w latach 1987-1996
przedstawia się następująco:
Rangi
Produkcja (x) Zatrudnienie (y)
Lata d = Rx - Ry d2
[mld zł] [tys. osób]
Rx Ry
1987 50 646 1 2 -1 1
1988 53 645 2 1 1 1
1989 61 716 3 7 -4 16
1990 66 692 4 3 1 1
1991 71 693 5 4 1 1
1992 78 714 6 6 0 0
1993 79 738 7 9 -2 4
1994 86 704 8 5 3 9
1995 92 732 9 8 1 1
1996 99 756 10 10 0 0
S = 34
Wyznaczanie współczynnika korelacji rang:
- uporządkowanie wyjściowych danych wg rosnących wariantów jednej z cech (tu: wg pro-
dukcji)
- uporządkowanym wartościom zmiennych nadajemy następne numery kolejnych liczb
naturalnych  czynność tę nazywamy rangowaniem (sposób rangowania musi być jedna-
kowy dla obu zmiennych)
- w przypadku gdy występują jednakowe wartości zmiennych przyporządko-
wujemy im średnią arytmetyczną obliczoną z ich kolejnych numerów
- wyznaczamy wartości d i d2
- obliczamy wartość współczynnika korelacji rang:
6 34
rs = 1- = 0,794
103 -10
Odp. Pomiędzy produkcją budowlano-montażową a zatrudnieniem istnieje silna dodatnia
zależność korelacyjna. Wraz ze wzrostem produkcji wzrasta zatrudnienie.
43
Przykład 2
Spożycie mięsa na jedną osobę oraz dochód w przeliczeniu na osobę w gospodarstwie domo-
wym w próbie dziewięciu gospodarstw pracowniczych w Poznaniu w 1994r. przedstawia ta-
bela:
Spożycie
Uporządkowanie (rosnące) Rangi
Dochód (x)
mięsa (y) d d2
[mln zł/os]
x y Rx Ry
[kg/os]
9 20 9 20 1 1 0 0
11 24 11 24 2 2 0 0
12 25 12 25 3 3 0 0
15 27 15 27 4 5 -1 1
17 29 17 29 5 7,5 -2,5 6,25
18 29 18 29 6 7,5 -1,5 2,25
28 32 18 26 7 4 3 9
22 28 22 28 8 6 2 4
18 26 28 32 9 9 0 0
S = 22,5
a) Czy prawdziwe jest przypuszczenie, że pomiędzy wyróżnionymi zmiennymi występuje
związek korelacyjny?
ad. a)
6 22,5
rs = 1- = 0,8125
93 - 9
Odp. Między badanymi cechami zachodzi silna dodatnia zależność korelacyjna. Wraz ze
wzrostem dochodów wzrasta spożycie mięsa.


Wyszukiwarka

Podobne podstrony:
WYKLADY SZ TEORIA I A STRUKTURY
WYKLADY SZ A DYNAMIKI
20151019 MichalTrzesiok Statystyka wyklad3 analiza korelacji handout
120123 IK wykład 4 WO SŻ kształt ukł geomet
Wyklad3(korelacja2014teoria2 zadania2)
WSFiZ SZ RF Wykład2
Wyklad 8 KORELACJA ZM LOSOWYCH In Ekol
WSFiZ SZ RF Wykład1
wyklad 3 korelacja
Wyklad3(korelacja1)
WSFiZ SZ RF Wykład 5
WSFiZ SZ RF Wykład 4
WSFiZ SZ RF Wykład 6
Wyklad3(korelacja2014teoria3 zadania3)
Sieci komputerowe wyklady dr Furtak
Wykład 05 Opadanie i fluidyzacja

więcej podobnych podstron