Kopia analiza wspolzaleznosci 2 zjawisk


Analiza współzale\ności
Analiza współzale\ności
dwóch zjawisk
dwóch zjawisk
dr in\. Iwona Staniec
dr in\. Iwona Staniec
Zakład Metod Ilościowych w Zarządzaniu
Zakład Metod Ilościowych w Zarządzaniu
Politechniki Aódzkiej
Politechniki Aódzkiej
Analiza współzale\ności
Analiza współzale\ności
Punktem wyjściowym do badania
Punktem wyjściowym do badania
współzale\ności cech są dane, w których
współzale\ności cech są dane, w których
dla ka\dej jednostki statystycznej określono
dla ka\dej jednostki statystycznej określono
wartości dwóch cech: X i Y. Mamy więc
wartości dwóch cech: X i Y. Mamy więc
zbiór n jednostek i przyporządkowane im
zbiór n jednostek i przyporządkowane im
pary cech (xi, yi), i = 1, 2, ... n.
pary cech (xi, yi), i = 1, 2, ... n.
Szereg szczegółowy dla dwóch
Szereg szczegółowy dla dwóch
obserwowanych cech
obserwowanych cech
i xi yi
1 x1 y1
2 x2 y2
... ... ...
n xn yn
Tablica korelacyjna
Tablica korelacyjna
l
Y
y1d - y1g y2d - y2g ... yld - ylg
"n = ni"
X ij
j=1
x1d - x1g n11 n12 ... n1l
n1 "
x2d - x2g n21 n22 ... n1l
n2 "
... ... ... ... ... ...
xkd - xkg nk1 nk2 ... nkl
nk "
k k l
n" j = n
"n = n" j i"
"n = "
ij
...
n" 1 n" 2 n" l
i=1 i=1 j =1
Przykład
Przykład
Lp. Powierzchnia Liczba
u\ytkowa (w m2) mieszkańców
1 2 3 1 2 3
1. 42 4 16. 75 3
2. 48 2 17. 68 5
3. 37 1 18. 46 3
4. 56 2 19. 74 2
5. 46 3 20. 85 5
6. 102 4 21. 64 4
7. 33 4 22. 56 4
8. 74 5 23. 30 2
9. 63 5 24. 93 4
10. 42 2 25. 49 1
11. 58 3 26. 66 3
12. 72 4 27. 56 3
13. 96 5 28. 104 4
14. 38 1 29. 43 3
15. 64 5 30. 39 2
Dane pogrupowane
Dane pogrupowane
w tabeli korelacyjnej
w tabeli korelacyjnej
Liczba osób (yj)
1 2 3 4 5 Razem
Pow. u\.(xi)
30-50 3 4 3 2 - 12
50-70 - 1 3 2 3 9
70-90 - 1 1 1 2 5
90-110 - - - 3 1 4
Razem 3 6 7 8 6 30
Współzale\ność
Współzale\ność
występująca między cechami mo\e być
występująca między cechami mo\e być
dwojakiego rodzaju:
dwojakiego rodzaju:
" funkcyjna (dokładna)
funkcyjna
funkcyjna
funkcyjna
" stochastyczna
stochastyczna (probabilistyczna).
stochastyczna
stochastyczna
" Szczególnym przypadkiem zale\ności
" Szczególnym przypadkiem zale\ności
stochastycznej jest zale\ność korelacyjna
stochastycznej jest zale\ność korelacyjna
(statystyczna).
statystyczna
statystyczna
statystyczna
(statystyczna).
statystyczna
statystyczna
statystyczna
Przy badaniu współzale\ności cech przyjmuje się
Przy badaniu współzale\ności cech przyjmuje się
zwykle jedną cechę za niezale\ną (objaśniającą),
zwykle jedną cechę za niezale\ną (objaśniającą),
której zmienność jest uwarunkowana czynnikami
której zmienność jest uwarunkowana czynnikami
zewnętrznymi, a drugą za zmienną zale\ną
zewnętrznymi, a drugą za zmienną zale\ną
(objaśnianą), tzn. jej wahania próbuje się
(objaśnianą), tzn. jej wahania próbuje się
wyjaśnić (przynajmniej częściowo) zmiennością
wyjaśnić (przynajmniej częściowo) zmiennością
cechy niezale\nej.
cechy niezale\nej.
Zale\ność korelacyjna mo\e być obustronna lub
obustronna
obustronna
obustronna
Zale\ność korelacyjna mo\e być obustronna lub
obustronna
obustronna
obustronna
jednostronna.
jednostronna
jednostronna
jednostronna
jednostronna.
jednostronna
jednostronna
jednostronna
60
50
40
30
20
10
0
200 210 220 230 240 250 260
6
5
4
3
2
1
0
0 10 20 30 40 50 60
Dwie cechy mierzalne
Dwie cechy mierzalne
Dwie cechy mierzalne
Dwie cechy mierzalne
Dwie cechy mierzalne
Dwie cechy mierzalne
Dwie cechy mierzalne
Dwie cechy mierzalne
1. Kowariancja
1. Kowariancja
1. Kowariancja
1. Kowariancja
1. Kowariancja
1. Kowariancja
1. Kowariancja
1. Kowariancja
dla szeregu szczegółowego
dla szeregu szczegółowego
n
1
covxy =
"(x - x)(yi - y) = covyx
i
n
i=1
n
1
covxy = xi yi - x Å" y = covyx
"
n
i=1
dla szeregu w tablicy korelacyjnej
k l
k l
&
& y n" j
ni"
1
" j
i
&-
&-
j=1
covxy =
i=1
""(x x)(y y)nij = covyx x = "x
i j
y =
n
i=1 j=1 n
n
k
k l
1
1
&-
Sx =
"(x x)2 ni"
i
& &
covxy =
n
i=1
""x y nij - x Å" y = covyx
i j
n
i=1 j=1
l
1
&
Sy =
"(y - y)2 n" j
j
n
j=1
Kowariancja
Kowariancja
Kowariancja
Kowariancja
Kowariancja
Kowariancja
Kowariancja
Kowariancja
Jest to:
Jest to:
miara symetryczna;
miara symetryczna;
przyjmuje wartości z przedziału
przyjmuje wartości z przedziału
<-SxSy, SxSy>;
<-SxSy, SxSy>;
informuje o kierunku korelacji między
zmiennymi.
Współczynnik korelacji
liniowej Pearsona:
covxy
rxy = = ryx
SxSy
Jest to:
Jest to:
- miara symetryczna;
- miara symetryczna;
- przyjmuje wartości z przedziału <-1,1>;
- przyjmuje wartości z przedziału <-1,1>;
- informuje o sile oraz kierunku korelacji liniowej
- informuje o sile oraz kierunku korelacji liniowej
między zmiennymi.
między zmiennymi.
Dwie cechy mierzalne
Kierunek zale\ności
Kierunek zale\ności
rxy= 0 świadczy o braku korelacji liniowej między
rxy= 0 świadczy o braku korelacji liniowej między
badanymi cechami (mo\liwe, \e istnieje między
badanymi cechami (mo\liwe, \e istnieje między
nimi korelacja krzywoliniowa!),
nimi korelacja krzywoliniowa!),
rxy> 0 informuje nas, \e mamy do czynienia z
rxy> 0 informuje nas, \e mamy do czynienia z
korelacją dodatnią (wraz ze wzrostem wartości
korelacją dodatnią (wraz ze wzrostem wartości
jednej cechy wzrasta średnia warunkowa drugiej),
jednej cechy wzrasta średnia warunkowa drugiej),
rxy< 0 korelacja jest ujemna (wzrostowi wartości
rxy< 0 korelacja jest ujemna (wzrostowi wartości
jednej cechy towarzyszy spadek średniej
jednej cechy towarzyszy spadek średniej
warunkowej drugiej).
warunkowej drugiej).
przy rxy= 1 lub -1 mamy liniową zale\ność
przy rxy= 1 lub -1 mamy liniową zale\ność
funkcyjnÄ….
funkcyjnÄ….
W analizach statystycznych
W analizach statystycznych
zwykle przyjmuje siÄ™, \e je\eli
zwykle przyjmuje siÄ™, \e je\eli
ćłrxyćł wynosi:
ćłrxyćł wynosi:
- mniej ni\ 0,2 - praktycznie brak zwiÄ…zku
- mniej ni\ 0,2 - praktycznie brak zwiÄ…zku
liniowego między badanymi cechami, mo\e
liniowego między badanymi cechami, mo\e
występować korelacja krzywoliniowa;
występować korelacja krzywoliniowa;
- <0,2-0,4) - zale\ność liniowa wyrazna, lecz
- <0,2-0,4) - zale\ność liniowa wyrazna, lecz
niska;
niska;
- <0,4-0,7) - zale\ność umiarkowana;
- <0,4-0,7) - zale\ność umiarkowana;
- <0,7-0,9) - zale\ność znacząca;
- <0,7-0,9) - zale\ność znacząca;
- <0,9-1> zale\ność bardzo silna.
- <0,9-1> zale\ność bardzo silna.
Współczynnik determinacji
liniowej
R2=rxy2
podaje, jaka część zmienności cechy
zale\nej jest wyjaśniona zmiennością cechy
niezale\nej.
Dwie cechy mierzalne
3. Współczynnik korelacji
3. Współczynnik korelacji
kolejnościowej (rang) Spearmana
kolejnościowej (rang) Spearmana
Rxy
Rxy
miara korelacji, wygodna i u\yteczna dla
miara korelacji, wygodna i u\yteczna dla
niezbyt długich szeregów szczegółowych z
niezbyt długich szeregów szczegółowych z
dwoma cechami mierzalnymi (lub
dwoma cechami mierzalnymi (lub
przynajmniej posiadajÄ…cymi pewien
przynajmniej posiadajÄ…cymi pewien
naturalny porzÄ…dek pozwalajÄ…cy na
naturalny porzÄ…dek pozwalajÄ…cy na
ustawienie wartości rosnąco lub malejąco) .
ustawienie wartości rosnąco lub malejąco) .
Wartość Rxy nale\y do przedziału <-1,1> i
Wartość Rxy nale\y do przedziału <-1,1> i
mówi o sile oraz kierunku korelacji.
mówi o sile oraz kierunku korelacji.
Dwie cechy mierzalne
Współczynnik rang Spearmana
Współczynnik rang Spearmana
Rxy
Rxy
N
2
6
"d
i
i=1
Rxy = Ryx = 1-
n3 - n
gdzie di są ró\nicami między kolejnymi numerami
gdzie di są ró\nicami między kolejnymi numerami
(rangami) nadawanymi w kolejności niemalejącej
(rangami) nadawanymi w kolejności niemalejącej
(lub nierosnÄ…cej) osobno dla ka\dej cechy od 1 do
(lub nierosnÄ…cej) osobno dla ka\dej cechy od 1 do
n.
n.
Je\eli kilka elementów w szeregu ma taką samą
Je\eli kilka elementów w szeregu ma taką samą
wartość jednej cechy, to nadaje im się rangi
wartość jednej cechy, to nadaje im się rangi
będące średnią arytmetyczną przypadających na te
będące średnią arytmetyczną przypadających na te
elementy rang.
elementy rang.
Dwie cechy niemierzalne, dwie
Dwie cechy niemierzalne, dwie
Dwie cechy niemierzalne, dwie
Dwie cechy niemierzalne, dwie
cechy mierzalne, cecha
cechy mierzalne, cecha
cechy mierzalne, cecha
cechy mierzalne, cecha
niemierzalna i cecha mierzalna
niemierzalna i cecha mierzalna
niemierzalna i cecha mierzalna
niemierzalna i cecha mierzalna
Współczynnik zbie\ności Czuprowa
Współczynnik zbie\ności
Czuprowa
2
Ç
Txy = Tyx =
n (k -1)(l -1)
Wymaga ona danych pogrupowanych w tablicy
korelacyjnej
0 d" Txy d" 1
k l
ni" n" j
1
(nij - nij )2
2
1
Ç = nij =
""
1
nij
n
i=1 j=1
6
y = 0,0927x + 0,3203
5
R2 = 0,667
4
3
2
1
0
0 10 20 30 40 50 60
y = -0,3758x + 109,37
60
R2 = 0,4963
50
40
30
20
10
0
200 210 220 230 240 250 260
SZEREGI CZASOWE
SZEREGI CZASOWE
SZEREGI CZASOWE
SZEREGI CZASOWE
SZEREGI CZASOWE
SZEREGI CZASOWE
SZEREGI CZASOWE
SZEREGI CZASOWE
Na rozwój zjawiska w czasie mają wpływ najczęściej następujące cztery
Na rozwój zjawiska w czasie mają wpływ najczęściej następujące cztery
czynniki:
czynniki:
" trend - długookresowe, systematyczne zmiany jakim podlega
trend
trend
" trend
trend - długookresowe, systematyczne zmiany jakim podlega
trend
trend
trend
określone zjawisko w czasie;
określone zjawisko w czasie;
" wahania sezonowe
wahania sezonowe - regularne odchylenia od tendencji
wahania sezonowe
" wahania sezonowe
wahania sezonowe
wahania sezonowe - regularne odchylenia od tendencji
wahania sezonowe
wahania sezonowe
rozwojowej (trendu);
rozwojowej (trendu);
" wahania cykliczne
wahania cykliczne - wahania zwiÄ…zane z cyklem
wahania cykliczne
" wahania cykliczne
wahania cykliczne
wahania cykliczne - wahania zwiÄ…zane z cyklem
wahania cykliczne
wahania cykliczne
koniunkturalnym;
koniunkturalnym;
" wahania przypadkowe
wahania przypadkowe - wszystkie nieregularne zmiany.
wahania przypadkowe
" wahania przypadkowe
wahania przypadkowe
wahania przypadkowe - wszystkie nieregularne zmiany.
wahania przypadkowe
wahania przypadkowe
Szereg bez trendu
Szereg bez trendu
Szereg bez trendu
Szereg bez trendu
Szereg bez trendu
Szereg bez trendu
Szereg bez trendu
Szereg bez trendu
20
18
16
14
12
10
0 2 4 6 8 10
Nr tygodnia
y = 15 szt.
sam ochodów w szt
Liczba sprzedanych
Åšrednia ruchoma
Åšrednia ruchoma
średnia
t y 3-okresowa 4-okresowa 5-okresowa 6-okresowa
1 15
2 17 14,67
3 12 15,00 14,5 15
4 16 14,33 15,125 14,2 14,58
5 15 14,00 14,125 14,4 14,83
6 11 14,67 14,625 15,4 14,92
7 18 15,33 15,375 14,8 15,00
8 17 16,00 13,375 15
9 13 15,33
10 16
Prognoza
Prognoza
Prognoza
Prognoza
BÅ‚Ä…d prognozy wyznacza siÄ™ natomiast w momencie
dokonania pomiaru rzeczywistej wartości zmiennej
prognozowanej w okresie t=1,2,...,T i jest on
ró\nicą między wartością prognozy i
zaobserwowaną wartością zmiennej prognozowanej,
czyli:
1
et = yt - yt
Bezwzględny błąd prognozy, który wyra\any jest w
tych samych jednostkach co zmienna prognozowana.
Charakterystyką dokładności prognoz jest średni
T
błąd kwadratowy
t
"e2
i=1
MSE =
T
" W praktyce wygodnie jest posługiwać się
" W praktyce wygodnie jest posługiwać się
błędem względnym postaci:
błędem względnym postaci:
1
yt - yt
wet = "100%
yt
" który informuje o procentowych odchyleniach
" który informuje o procentowych odchyleniach
prognozy od rzeczywistej wartości zmiennej
prognozy od rzeczywistej wartości zmiennej
prognozowanej dla kolejnych okresów czasu.
prognozowanej dla kolejnych okresów czasu.
" W celu wyznaczenia średniego błędu dla całego
" W celu wyznaczenia średniego błędu dla całego
horyzontu prognozy wykorzystuje siÄ™
horyzontu prognozy wykorzystuje siÄ™
najczęściej tzw. błąd średniokwadratowy
najczęściej tzw. błąd średniokwadratowy
2
postaci
postaci
T T
1
îÅ‚ - yt
Å‚Å‚
1 1 yt
S = Å"100%
"(we )2 = T "
y t ïÅ‚
T yt śł
t =1 t=1
ðÅ‚ ûÅ‚
" który informuje o średnim względnym
" który informuje o średnim względnym
odchyleniu prognozy od wartości rzeczywistej
odchyleniu prognozy od wartości rzeczywistej
dla całego horyzontu prognozy, czyli t=1,2,...,T.
dla całego horyzontu prognozy, czyli t=1,2,...,T.
Prognoza
Prognoza
t y 3-okresowa et et2 wet2 4-okresowa et et2 wet2
1 15
2 17
3 12
0,006953
4 16 14,67 1,33 1,78
0 0
5 15 15,00 0,00 0,00 15 0,00 0,00
0,091818 0,132231
6 11 14,33 -3,33 11,11 15 -4,00 16,00
0,049383 0,0625
7 18 14,00 4,00 16,00 13,5 4,50 20,25
0,018824 0,013841
8 17 14,67 2,33 5,44 15 2,00 4,00
0,032189 0,029941
9 13 15,33 -2,33 5,44 15,25 -2,25 5,06
0 0,006094
10 16 16,00 0,00 0,00 14,75 1,25 1,56
11 15 15,33 x 39,78 0,199167 16 x 46,88 0,244607
1
39,78
S = 0,199167 = 16,7%
MSE = = 5,68szt
y
7
7
1
46,88
MSE = = 7,8szt S = 0,244607 = 20,19%
y
6
6
Szereg czasowy z trendem
Szereg czasowy z trendem
Szereg czasowy z trendem
Szereg czasowy z trendem
20
15
10
5
0
0 2 4 6 8 10 12
t
1
y = f (t)+ µ
y
70
65
60
55
Szereg czasowy z trendem i
sezonowością
2
0
-
1
1
-
5
9
8
2
-
0
1
-
5
9
3
2
-
0
1
-
5
9
8
1
-
0
1
-
5
9
3
1
-
0
1
-
5
9
8
0
-
0
1
-
5
9
3
0
-
0
1
-
5
9
8
2
-
9
0
-
5
9
M
I
C
O
K
O
i
j
c
k
a
a
n
e
c
Metody dekompozycji
Metody dekompozycji
Do analizy takiego szeregu i prognozowania zjawiska na
przyszłość wykorzystuje się metody dekompozycji,
metody dekompozycji
metody dekompozycji
metody dekompozycji
polegające na wyodrębnieniu poszczególnych czynników
określających zmienność tego zjawiska w czasie.
W procesie dekompozycji wyró\niamy następujące etapy:
" wygładzanie szeregu czasowego;
" wyznaczenie czynnika sezonowego,
" oddzielenie trendu i czynnika cyklicznego w
wygładzonym szeregu.
Metody wygładzania szeregu:
" mechaniczna -
mechaniczna - średnia ruchoma;
mechaniczna -
mechaniczna -
" analityczna - funkcja trendu - prosty model
analityczna -
analityczna -
analityczna -
regresyjny.
Uwolnienie szeregu czasowego od trendu:
Uwolnienie szeregu czasowego od trendu:
Uwolnienie szeregu czasowego od trendu:
Uwolnienie szeregu czasowego od trendu:
 dla modelu multiplikatywnego - charakteryzujÄ…cego
się względną stałością wahań sezonowych
yt
 dla t=1,2,..,n
wt =
1
yt
 dla modelu addytywnego - charakteryzujÄ…cego siÄ™
absolutną stałością wahań sezonowych
1
wt = yt - yt
 dla t=1,2,..,n
Eliminacja wahań przypadkowych z
wielkości wt - dla jednoimiennych okresów
obliczamy średnie arytmetyczne z wyrazów
wt, które nazywany surowymi wskaznikami
sezonowości
s
wi+ j*k
"
i=1,2,...,k
j=0
ci' =
s
s- liczba jednoimiennych okresów;
k - liczba faz wahań w cyklu.
Surowe wskazniki sezonowości informują o
ile poziom zjawiska jest wy\szy lub ni\szy
od poziomu, jaki byłby osiągnięty, gdyby
nie było wahań, a rozwój następował by
zgodnie z trendem.
Czyste wskazniki sezonowości - surowe
wskazniki sezonowości dzieli się przez
średnią arytmetyczną wskazników
surowych. Suma otrzymanych wskazników
jest równa liczbie faz wahań okresowych.


Wyszukiwarka

Podobne podstrony:
kopia analiza wskaznikowa
Kopia analiza?c
Kopia Analiza matematyczna 1 DEFINICJE, WZORY 2
Przemoc seksualna wobec kobiet analiza zjawiska na przykładzie historii Kuby Rozpruwacza
Analiza pragmatyczna wypowiedzi Zjawisko anafory
Analizowanie zjawisk atmosferycznych i hydrologicznych zachodzÄ…cych w przyrodzie
OPISOWA ANALIZA ZJAWISK MASOWYCH
Analiza Matematyczna 2 Zadania

więcej podobnych podstron