ANALIZA WSPÓAZALEśNOŚCI ZJAWISK EKONOMICZNYCH
ANALIZA WSPÓAZALEśNOŚCI ZJAWISK EKONOMICZNYCH
ANALIZA WSPÓAZALEśNOŚCI ZJAWISK EKONOMICZNYCH
ANALIZA WSPÓAZALEśNOŚCI ZJAWISK EKONOMICZNYCH
Przypuśćmy, \e rozpatrujemy pewną zbiorowość statystyczną łącznie ze względu na
dwie cechy (ze względu na dwuwymiarową cechę statystyczną) Y oraz X. Naszym
zadaniem jest ująć ilościowo związek pomiędzy cechą Y (zmienna objaśnianą) a cechą
X (zmienną objaśniającą).
Dysponujemy n obserwacjami zmiennych X i Y (y1,x1),(y2,x2),...,(yn,xn).
Współczynnik korelacji liniowej Pearsona definiowany jest:
Cov(X,Y)
i
"(x - x)(yi - y) ,
rXY = =
sXsY
i i
"(x - x)"(y - y)
gdzie Cov(X,Y) to kowariancja cech X i Y.
1
PRZYKAAD:
Nocny klub w małym miasteczku uniwersyteckim próbuje ustalić, czy powinien zwiększyć
tygodniowe nakłady na reklamę w radiu uniwersyteckim. Dane na temat przychodów (y) oraz
nakładów na reklamę radiową (x) w ciągu ostatnich sześciu tygodni podane są w tablicy.
Y przychody X wydatki na
w tys. zł reklamę w setkach zł
1 1,5 1
2 2 2,5
3 1 0
4 2 3
5 3,5 4
6 1,5 2
2
ANALIZA REGRESJI LINIOWEJ
Przypuśćmy, \e rozpatrujemy pewną zbiorowość statystyczną łącznie ze względu na
dwie cechy (ze względu na dwuwymiarową cechę statystyczną) Y oraz X. Naszym
zadaniem jest ująć ilościowo związek pomiędzy cechą Y (zmienna objaśnianą) a cechą
X (zmienną objaśniającą).
Przypuśćmy, \e zamierzamy ująć zale\ność pomiędzy zmiennymi w postaci funkcji
liniowej
Y = 0 + 1X +
3
Przypuśćmy, \e dysponujemy n obserwacjami par (y1,x1),(y2,x2),...,(yn,xn).
Na podstawie obserwacji staramy się oszacować nieznane parametry 0 i 1.
Szacując parametry tzw. metodą najmniejszych kwadratów (NK) staramy się znalezć
takie b0 i b1, które minimalizują następującą funkcję kryterium
n
S(b0,b1) =
i
"[y - (b0 +b1xi)]2 .
i=1
4
(x5,y5)
Y
(x3,y3)
d5
d3
d4
(x1,y1)
y1
d2
(x4,y4)
d1
(x2,y2)
w1
X
5
Ró\niczkując funkcję S(b0,b1) względem zmiennych b0 i b1, otrzymamy
n
dS
= -2
i
"(y -a -bxi),
db0
i=1
n
dS
= -2
i
"(y -a -bxi)xi .
db1
i=1
Przyrównując pochodne cząstkowe do zera oraz upraszczając otrzymujemy tzw.
układ równań normalnych
n n
ńł
ł
ł
nb0 +b1
i i
"x = "y
ł
ł
i=1 i=1
ł
.
ł
n n n
ł
łb0 2
ł
i i i
"x +b1"x = "y xi
ł
ł
ół i=1 i=1 i=1
6
Układ ma rozwiązanie:
n
i
"(x - x)(yi - y)
sY
i=1
b1 = = rXY ,
n
sX
i
"(x - x)2
i=1
b0 = y -b1x .
Oszacowane na podstawie danych równanie regresji ma postać:
wi = b0 +b1xi i = 1,...,n,
7
Zauwa\my, \e na rozpatrywany zbiór danych mo\emy spojrzeć z punktu widzenia:
yi = b0 +b1xi + ei i = 1,...,n ,
gdzie ei = yi - wi , i = 1,...,n są resztami regresji liniowej
8
DOBROĆ DOPASOWANIA
DOBROĆ DOPASOWANIA
DOBROĆ DOPASOWANIA
DOBROĆ DOPASOWANIA
Zauwa\my, wykorzystując to\samość
yi - wi = (yi - y) - (wi - y)
Mo\emy wyrazić sumę kwadratów reszt regresji jako
i i i
"(y - wi)2 = "(y - y)2 + "(w - y)2 - 2"(y - y)(wi - y),
i
Zauwa\ając, \e
2
i i i i
"(y - y)(wi - y) = "(y - y)b1(xi - x) = b1 "(x - x)2 = "(w - y)2
9
Mo\emy zapisać
i i i
" (y - y)2 = " (y - wi)2 + " (w - y)2
SYY RSS SSREG
Pierwszy człon to suma kwadratów obserwacji zmiennej objaśnianej wokół jej
średniej tzw. skorygowana suma kwadratów Y (SScorrected) oznaczana SYY.
Odstępstwo wartości obserwacji zmiennej objaśnianej od przewidywanych regresją
reprezentuje drugi człon (SSresidual) oznaczany RSS.
Część zmienności zmiennej objaśnianej wyjaśniona regresją (SSregression) wyra\a
trzeci człon oznaczany jako SSreg.
10
Dobroć dopasowania modelu regresji do danych empirycznych mierzona jest przez
iloraz nazywany współczynnikiem determinacji
SSreg
R2 = .
SYY
Zauwa\my, \e
i i i
"(y - y)2 "(y - wi)2 "(w - y)2 ,
= +
i i i
"(y - y)2 "(y - y)2 "(y - y)2
100% = 2 + R2.
11
100% zmienności zmiennej objaśnianej dzielimy na tę część, której nie udało się nam
wyjaśnić modelem regresji ( współczynnik zbie\ności 2) oraz tę część, którą
tłumaczy model regresji (współczynnik determinacji R2).
12
Wariancja resztowa
Wariancja resztowa
Wariancja resztowa
Wariancja resztowa
Dobroć modelu regresji mo\emy mierzyć za pomocą tzw. wariancji resztowej
(oceny wariancji składnika losowego ):
n
1
se2 =
i
"(y - wi)2,
n - k
i=1
gdzie:
n liczba obserwacji (xi,yi)
k liczba szacowanych parametrów funkcji regresji (w naszym przypadku 2)
Współczynnik zmienności resztowej
se
Ve =
y
13
Nocny klub w małym miasteczku uniwersyteckim próbuje ustalić, czy powinien zwiększyć
tygodniowe nakłady na reklamę w radiu uniwersyteckim. Dane na temat przychodów (y) na
reklamę radiową (x) w ciągu ostatnich sześciu tygodni podane są w tablicy.
Y przychody X wydatki na
w tys zł reklamę w setkach zł
1 1,5 1
2 2 2,5
3 1 0
4 2 3
5 3,5 4
6 1,5 2
14
RESZTY:
1 2 3 4 5 6
0.1714 -0.1429 0.2143 -0.4143 0.5429 -0.3714
WSPÓACZYNNIKI:
Oszacowanie Std. Error t p value Pr(>|t|)
wyraz wolny 0.7857 0.3218 2.441 0.0711
wydatki na reklamę 0.5429 0.1309 4.146 0.0143
R2: 0.8112, Skorygowany R2 : 0.764
15
PRZYKAADY KU PRZESTRODZE
Nr obs. x1 y1 y2 y3 x2 y4
1 10 8,04 9,14 7,46 8 6,58
2 8 6,95 8,14 6,77 8 5,76
3 13 7,58 8,74 12,74 8 7,71
4 9 8,81 8,77 7,11 8 8
5 11 8,33 9,26 7,81 8 8,47
6 14 9,96 8,1 8,84 8 7,04
7 6 7,24 6,13 6,08 8 5,25
8 4 4,26 3,1 5,39 19 12,5
9 12 10,84 9,13 8,15 8 5,56
10 7 4,82 7,26 6,42 8 7,91
11 5 5,68 4,74 5,73 8 6,89
Mamy tu cztery zbiory danych: x1 i y1 ; B: x1 i y2 ; C : x1 i y3 ; D : x2 i y4
16
17
18
PRZYKAAD EMPIRYCZNY
Rozpatrujemy zbiór danych zło\ony z 69 powiatów województw lubelskiego (24),
łódzkiego (23) i małopolskiego (22) badanych ze względu na stopę bezrobocia
rejestrowanego i powierzchnię mieszkania na 1 mieszkańca (w m2) w roku 2005.
19
PRZYKAAD EMPIRYCZNY
Stopa bezrobocia vs. saldo migracji w powiatach granicznych RP w 2004 roku
3
RDEPTH=0
RDEPTH=0.053
2
RDEPTH=0.375
RDEPTH=0.113
1
RDEPTH=0.428
0
-1
-2
-2 -1 0 1 2 3 4 5
migration
20
unemployment rate
Wyszukiwarka
Podobne podstrony:
WYKLAD 4 OPIPRZ OPI wyklad 6 IIe pdfPRZ OPI wyklad 7 IIe pdfWYKŁAD St Opi cz3WYKŁAD St Opi cz1WYKŁAD St Opi cz4WYKŁAD St Opi cz2OPI wykład 9 IIe pdfSieci komputerowe wyklady dr FurtakWykład 05 Opadanie i fluidyzacjaWYKŁAD 1 Wprowadzenie do biotechnologii farmaceutycznejmo3 wykladyJJwięcej podobnych podstron