D. Kosiorowski wykład 7 2006
Zagadnienie regresji liniowej
Przypuśćmy, że rozważamy dwie zmienne losowe i
reprezentujące zjawiska ekonomiczne, gdzie możemy łatwo
obserwować, jest trudniej obserwowalna. Zastanawiamy się
nad sposobem prognozowania wartości na podstawie
wartości . Prognozowana wartość zmiennej losowej ma być
pewną funkcją . Jeżeli ograniczymy się do funkcji liniowych,
natomiast za kryterium dobroci przybliżenia przyjmniemy średni
kwadrat błędu, otrzymamy następujące zadanie:
32 | strona
D. Kosiorowski wykład 7 2006
Dane są zmienne losowe i o skończonych i dodatnich
wariancjach. Należy wskazać takie współczynniki i , aby
średni bład prognozy tzn:
był minimalny.
33 | strona
D. Kosiorowski wykład 7 2006
Uwaga: Nie wnikamy tutaj w naturę związku miedzy
zmiennymi. Interesuje nas jedynie możliwie najprostsza
zależność spełniona z pewnym przybliżeniem, która daje
podstawe do podejmowania decyzji.
34 | strona
D. Kosiorowski wykład 7 2006
Zagadnienie regresji liniowej (najczęściej wykorzystywana
technika statystyczna w badaniach ekonomicznych):
Dany jest wektor losowy .
Wskazać takie liczby , , aby
funkcja zmiennych i :
przyjęła możliwie najmniejszą wartość.
35 | strona
D. Kosiorowski wykład 7 2006
Rozwiązanie:
Szukamy minimum funkcji poprzez przyrównanie jej
pochodnych cząstkowych do zera, następnie rozwiązujemy
powstały w ten sposób układu równań (tzw. układu równań
normalnych) dalej badamy punktu krytycznego.
Wykorzystując standardowe oznaczenia:
, , , ,
36 | strona
D. Kosiorowski wykład 7 2006
łatwo wykazać, że funkcja przyjmuje minimum dla:
Minimum wynosi ) nazywane jest wariancją
resztkową względem .
37 | strona
D. Kosiorowski wykład 7 2006
Prognozowana wartość zmiennej losowej , oznaczana przez
wyraża się wzorem:
Zapisywany także:
Jeżeli , wzór upraszcza się do:
38 | strona
D. Kosiorowski wykład 7 2006
Pierwsze starcie ze statystyką matematyczną:
W zastosowaniach praktycznych na ogół nie znamy ani
rozkładów zmiennych i ani ich rozkładu łacznego.
Niezbędne dla rozwiązania zagadnienia regresji charakterystyki
liczbowe rozkładu:
, , , ,
szacuje na podstawie losowej próby złożonej z obserwacji
zjawisk. Przypuśćmy mianowicie, że dysponujemy
obserwacjami:
39 | strona
D. Kosiorowski wykład 7 2006
Za wartości nieznanych charakterystyk liczbowych przyjmujemy
ich odpowiedniki obliczone z próby:
;
;
40 | strona
D. Kosiorowski wykład 7 2006
Przykład:
Bivariate Histogram Powiaty RP 2004
41 | strona
D. Kosiorowski wykład 7 2006
Scatterplot POWIATY_2005
wynagrodzenie brutto = 2326,8459-13,3962*stopa_bezr
4000
3800
stopa bezrobocia:wynagrodzenie brutto: r = -0,3437; p = 0,0000
3600
3400
3200
3000
2800
2600
2400
2200
2000
1800
1600
1400
1200
0 5 10 15 20 25 30 35 40 45
stopa bezrobocia
42 | strona
wynagrodzenie brutto
D. Kosiorowski wykład 7 2006
Scatterplot = 2326,8459-13,3962*x
4000
3800
stopa bezrobocia:wynagrodzenie brutto: r = -0,3437; p = 0,0000
3600
3400
3200
3000
2800
2600
2400
2200
2000
1800
1600
1400
1200
0 5 10 15 20 25 30 35 40 45
stopa bezrobocia
43 | strona
wynagrodzenie brutto
D. Kosiorowski wykład 7 2006
Zagadnienie prognozy
Przypuśćmy, że dany jest wektor losowy
reprezentujący
interesujące nas dwa zjawiska ekonomiczne (np. popyt na
pewien towar i podaż tego towaru). W zastosowaniach często
jest tak, że jedną ze zmiennych powiedzmy łatwiej
obserwować, druga ze zmiennych jest trudniej obserwowalna.
Powstaje ważne w praktyce pytanie jak na podstawie
obserwacji prognozować ?
44 | strona
D. Kosiorowski wykład 7 2006
Zmienną losową , gdzie jest funkcją borelowską,
nazywamy prognozą przy pomocy , a ,
błędem średniokwadratowym prognozy. (o funkcji borelowskiej
można myśleć jak o funkcji na tyle regularnej, że jest
zmienną losową)
45 | strona
D. Kosiorowski wykład 7 2006
jest prognozą optymalną (w błędu
średniokwadratowego), jeśli ,
gdzie kres dolny (inf (można myśleć jak o minimum)) brany jest
po wszystkich borelowskich funkcjach .
46 | strona
D. Kosiorowski wykład 7 2006
Twierdzenie: Niech . Wtedy prognoza optymalna
istnieje i jako można wziąć .
Zagadnienie znajdowania optymalnej prognozy jest
wszechobecne w ekonomii, finansach, zastosowaniach
rachunku prawdopodobieństwa w życiu gospodarczym.
Twierdzenie uzasadnia wysiłek poznawczy związany z ogólnym
spojrzeniem na warunkową wartość oczekiwaną.
47 | strona
D. Kosiorowski wykład 7 2006
Twierdzenie: Jeśli wektor losowy ma rozkład
normalny, to regresja (prognoza) jest liniowa. Niech
, wtedy
(twierdzenie to w pewnym sensie tłumaczy powszechność
założenia wielowymiarowej normalności badanych zjawisk,
prognozowanie w takim przypadku jest o wiele łatwiejsze)
48 | strona
Wyszukiwarka
Podobne podstrony:
OPR 7 A 07wyklad 16 07 OPR07 Charakteryzowanie budowy pojazdów samochodowych9 01 07 drzewa binarne02 07str 04 07 maruszewski07 GIMP od podstaw, cz 4 Przekształcenia07 Komórki abortowanych dzieci w Pepsi07 Badanie „Polacy o ADHD”CKE 07 Oryginalny arkusz maturalny PR Fizyka07 Wszyscy jesteśmy obserwowaniwięcej podobnych podstron