06 regresja www przeklej plid 6390


RYNEK NIERUCHOMOÅšCI
dr inż. Radosław Cellmer
Wykład
Modelowanie ekonometryczne cen nieruchomości
Treść wykładu:
1. Analiza regresji wielorakiej
2. Zastosowanie narzędzi obliczeniowych
3. Weryfikacja i interpretacja modelu regresji
PAASZCZYZNA W PRZESTRZENI TRÓJWYMIAROWEJ
Z
X
Y
POZIOM CEN TRANSAKCYJNYCH W ZALEŻNOŚCI OD
POWIERZCHNI I STANDARDU MIESZKANIA
Rozrzutu 3W Cena względem Powierzchnia i Standard
POZIOM CEN TRANSAKCYJNYCH W ZALEŻNOŚCI OD
POWIERZCHNI I STANDARDU MIESZKANIA
Cena = 2938,7641-1,6303*x+364,9833*y
> 3600
< 3600
< 3500
< 3400
< 3300
< 3200
< 3100
REGRESJA WIELORAKA OGÓLNY CEL
Ogólnym celem regresji wielokrotnej jest badanie związków pomiędzy wieloma zmiennymi
objaśniającymi (niezależnymi) a zmienną objaśnianą (zależną).
Przykładowo rzeczoznawca majątkowy określając wartość lokalu mieszkalnego zbiera dane
dotyczące podobnych lokali  powierzchnia użytkowa, liczba pomieszczeń, zużycie techniczne
itp. oraz subiektywną ocenę atrakcyjności obiektu.
Dokonując analizy regresji wielorakiej można uzyskać odpowiedz na pytanie:
Jak poszczególne wielkości wpływają na cenę lokalu?
U podstaw modelu regresji leży hipoteza o istnieniu zależności, między co najmniej dwiema
zmiennymi. Zakłada się, że wzrostowi jednej z badanych wielkości towarzyszy wzrost lub spadek
drugiej. Stąd zależność zmiennej Y od zmiennych X1, X2, ..., Xk przedstawia się za pomocą funkcji:
Y = f(X1, X2, ..., Xk)
PROCEDURA ANALIZY REGRESJI WIELORAKIEJ
1. Określenie zestawu zmiennych (cech rynkowych) i ich opis w przyjętej skali liczbowej
2. Określenie postaci analitycznej modelu
3. Estymacja parametrów modelu
4. Weryfikacja merytoryczna i statystyczna modelu
5. Zastosowanie modelu do prognozy zmiennej objaśnianej
5. Zastosowanie modelu do prognozy zmiennej objaśnianej
Cena = 2938,7641-1,6303*x+364,9833*y
> 3600
< 3600
< 3500
< 3400
< 3300
< 3200
< 3100
POSTAĆ ANALITYCZNA MODELU REGRESJI WIELORAKIEJ
Najczęściej wykorzystywanym modelem jest model liniowy o następującej postaci:
Y = ²0 + ²1X1 + ²2X2 + & + ²kXk + ¾
² ² ² ² ¾
² ² ² ² ¾
² ² ² ² ¾
gdzie:
Y - zmienna objaśniana (zależna)
X1, X2, ..., Xk - zmienne objaśniające (niezależne)
²1, ²2, ..., ²k - parametry modelu
²1, ²2, ..., ²k - parametry modelu
²0 - staÅ‚a
¾ - skÅ‚adnik losowy (reszta) modelu
v
ESTYMACJA PARAMETRÓW MODELU
Dane wyjściowe:
Cena Cecha 1 Cecha 2 Cecha k
Cena Cecha 1 Cecha 2 Cecha k
Cena Cecha 1 Cecha 2 Cecha k
Lp. Cena Cecha 1 Cecha 2 ... Cecha k
1 y1 x11 x12 & x1k
1 y1 x11 x12 & x1k
2 y2 x21 x22 & x2k
& & & & & &
n yn xn1 xn2 & xnk
ESTYMACJA PARAMETRÓW MODELU
Układ równań:
y1 = ²0 + ²1 x11 + ²2 x12 + & + ²k x1k
y2 = ²0 + ²1 x21 + ²2 x22 + & + ²k x2k
& & & & & & & & & & & & & & &
yn = ²0 + ²1 xn1 + ²2 xn2 + & + ²k xnk
Układ równań w postaci macierzowej:
Y = XA gdzie:
Y = XA gdzie:
y1
1 x11 x12 ... x1k ²0
îÅ‚ Å‚Å‚
îÅ‚ Å‚Å‚ îÅ‚ Å‚Å‚
ïÅ‚y śł
ïÅ‚1 x21 x22 ... x2k śł ïÅ‚² śł
2
1
ïÅ‚ śł
ïÅ‚ śł ïÅ‚ śł
Y =
X = A =
ïÅ‚ śł
...
ïÅ‚ śł ïÅ‚ śł
... ... ... ... ... ...
ïÅ‚y śł
ïÅ‚1 xn1 xn2 ... xnk śł
ïÅ‚² śł
ðÅ‚ n ûÅ‚
ðÅ‚ ûÅ‚
ðÅ‚ k ûÅ‚
Macierz parametrów modelu wyznacza się metodą najmniejszych kwadratów, wykorzystując
następujący wzór:
A = (XTX)-1XTY
ANALIZA REGRESJI WIELORAKIEJ
1. Określenie zestawu zmiennych (cech rynkowych) i ich opis w przyjętej skali liczbowej
ANALIZA REGRESJI WIELORAKIEJ
2. Określenie postaci analitycznej modelu
Y = ²0 + ²1X1 + ²2X2 + ²3X3 + ²4X4 + ²5X5 + & + ²kXk + ¾
² ² ² ² ² ² ² ¾
² ² ² ² ² ² ² ¾
² ² ² ² ² ² ² ¾
gdzie:
Y - zmienna objaśniana (cena transakcyjna)
X1 - zmienna objaśniająca (powierzchnia)
X2 - zmienna objaśniająca (położenie)
2
X - zmienna objaśniająca (kondygnacja)
X3 - zmienna objaśniająca (kondygnacja)
X4 - zmienna objaśniająca (technologia)
X5 - zmienna objaśniająca (standard)
²1, ²2, ..., ²k - parametry modelu
²0 - staÅ‚a
¾ - skÅ‚adnik losowy (reszta) modelu
ANALIZA REGRESJI WIELORAKIEJ
3. Estymacja parametrów modelu  przy pomocy programu STATISTICA
ANALIZA REGRESJI WIELORAKIEJ
3. Estymacja parametrów modelu  przy pomocy programu STATISTICA
ANALIZA REGRESJI WIELORAKIEJ
3. Estymacja parametrów modelu  przy pomocy programu STATISTICA
ANALIZA REGRESJI WIELORAKIEJ
3. Estymacja parametrów modelu  przy pomocy programu STATISTICA
Cena = 1482,83  1,81 · X1 + 207,04 · X2 + 281,51 · X3 + 455,49 · X4 + 208,72 · X5
ANALIZA REGRESJI WIELORAKIEJ
3. Estymacja parametrów modelu  przy pomocy arkusza kalkulacyjnego (polecenie REGLINP)
Cena = 1482,83  1,81 · X1 + 207,04 · X2 + 281,51 · X3 + 455,49 · X4 + 208,72 · X5
ANALIZA REGRESJI WIELORAKIEJ
3. Estymacja parametrów modelu  przy pomocy arkusza kalkulacyjnego (narzędzie  Analiza danych )
Cena = 1482,83  1,81 · X1 + 207,04 · X2 + 281,51 · X3 + 455,49 · X4 + 208,72 · X5
WERYFIKACJA MODELU REGRESJI WIELORAKIEJ
Przez weryfikację modelu ekonometrycznego należy rozumieć ocenę jego poprawności przy
wzięciu pod uwagę aspektów merytorycznych i statystycznych.
Weryfikacja modelu może polegać na określeniu stopnia zgodności zbudowanego modelu z
danymi empirycznymi oraz na ocenie jakości ocen parametrów strukturalnych.
Wnioskowanie z modelu jest możliwe tylko wtedy, gdy wartości miar modelu nie wskazują na
rozbieżności między modelem a rzeczywistością. Może ono polegać na interpretacji modelu
rozbieżności między modelem a rzeczywistością. Może ono polegać na interpretacji modelu
(diagnoza rynku), predykcji bÄ…dz symulacji.
WERYFIKACJA MODELU REGRESJI WIELORAKIEJ
Weryfikacja merytoryczna  to stwierdzenie zgodności modelu z wiedzą o badanych
zjawiskach i zdrowym rozsądkiem. Polega na ocenie właściwości znaków przy
obliczonych współczynnikach oraz wielkości oszacowanych współczynników.
Weryfikacja statystyczna  polega na sprawdzeniu czy model spełnia standardowe
postulaty statystyczne: istotność zmiennych objaśniających, wymagane dopasowanie
do wyników obserwacji i pożądane właściwości składnika resztowego.
do wyników obserwacji i pożądane właściwości składnika resztowego.
WERYFIKACJA STATYSTYCZNA
Przebieg weryfikacji statystycznej modelu
" weryfikacja hipotezy o nieistnieniu zależności pomiędzy zbiorem zmiennych
objaśniających a cenami transakcyjnymi
" ocena współczynnika determinacji
" ocena błędu standardowego estymacji
" weryfikacja hipotezy o nieistotności parametrów modelu regresji
" weryfikacja hipotezy o nieistotności parametrów modelu regresji
WERYFIKACJA HIPOTEZY O BRAKU ZALEŻNOŚCI OPISANEJ
PRZEZ MODEL
Hipotezę o nieistnieniu zależności pomiędzy zbiorem zmiennych objaśniających a
cenami transakcyjnymi weryfikuje siÄ™ przy pomocy statystyki F Fischera-Snedecora -
stosowanej w celu zbadania czy uzyskane wyniki modelu regresji nie wystąpiły
przypadkowo.
Test F wykonuje się stawiając następujące hipotezy:
H0: ą1 = ą2 = ... = ąk = 0 co oznacza, że model nie przedstawia żadnej zależności
H0: ą1 = ą2 = ... = ąk = 0 co oznacza, że model nie przedstawia żadnej zależności
H1: co najmniej jedno ą `" 0, co oznacza, że model przedstawia zależność statystyczną,
WERYFIKACJA HIPOTEZY O BRAKU ZALEŻNOŚCI OPISANEJ
PRZEZ MODEL
W celu weryfikacji hipotezy zerowej obliczoną wartość statystyki F porównujemy z
wartością krytyczną.
Wartość empiryczną statystyki F oblicza się z wzoru:
n
îÅ‚
2
"(w - y) Å‚Å‚ / k
i
ïÅ‚ śł
ðÅ‚ i=1 ûÅ‚
F =
F =
n
îÅ‚
îÅ‚ Å‚Å‚
2
"(y - w) Å‚Å‚ /(n - k -1)
i
ïÅ‚ śł
ðÅ‚ i=1 ûÅ‚
gdzie: wi - oznacza kolejną cenę estymowaną (wartość teoretyczną - estymator ceny)
y - jest to średnia arytmetyczna obliczona z cen transakcyjnych
yi - oznacza kolejnÄ… cenÄ™ transakcyjnÄ…
n - jest to liczba obserwacji (liczba danych o transakcjach)
k - oznacza liczbę zmiennych objaśniających (liczba cech przyjętych do analiz)
WERYFIKACJA HIPOTEZY O BRAKU ZALEŻNOŚCI OPISANEJ
PRZEZ MODEL
Wartość krytyczną odczytuje się z tabeli wartości krytycznych rozkładu F-Snedecora dla
przyjętego poziomu istotności (równego zazwyczaj 0,01; 0,05 lub 0,10), określonej liczby
zmiennych objaśniających i stopni swobody.
Przykład:
dla liczby nieruchomości podobnych n = 21
dla liczby zmiennych objaśniających v1 = 5
dla liczby stopni swobody równej n - k - 1 v2 = 21 -5 -1 = 15
dla poziomu istotności równego ą = 0,05
wartość krytyczna statystyki F na podstawie tabeli wartości krytycznych wynosi 2,90
wartość krytyczna statystyki F na podstawie tabeli wartości krytycznych wynosi 2,90
v2\v1 1 2 ... 5
1 161,4 199,5 ... 230,2
2 18,51 19,00 ... 19,30
... ... ... ... ...
15 4,54 3,68 ... 2,90
Jeżeli wartość empiryczna statystyki F jest wyższa od wartości krytycznej tzn:
Fobl e" Fkryt
e"
e"
e"
to hipotezę o nieistnieniu zależności należy odrzucić (zależności opisane modelem nie wystąpiły
przypadkowo).
WERYFIKACJA HIPOTEZY O BRAKU ZALEŻNOŚCI OPISANEJ
PRZEZ MODEL (PRZYKAAD)
Istotność F oznacza prawdopodobieństwo, że zależności opisane modelem wystąpiły
przypadkowo
Istotność F = 0,00000004
hipotezę o nieistnieniu zależności należy odrzucić (zależności opisane modelem nie wystąpiły
przypadkowo).
WSPÓACZYNNIK DETERMINACJI
Współczynnik determinacji R2 określa się z następującego wzoru:
n n
2 2
- y) - wi )
"(wi "(yi
i=1 i=1
R2 = = 1-
n n
2 2
"(y - y) "(y - y)
i i
i=1 i=1
R2 pomnożony przez 100% interpretuje się jako stopień wyjaśnienia całkowitej zmienności
zmiennej zależnej przez zmienność uwzględnionych w badaniu zmiennych niezależnych.
Współczynnik determinacji spełnia warunek: 0 < R2 < 1. Im bliższy jest jedności, tym lepiej
zależność liniowa została dopasowana do danego zbioru obserwacji.
WSPÓACZYNNIK DETERMINACJI (PRZYKAAD)
Współczynnik determinacji wyniósł 0,829 co oznacza, ze 83% zmienności cen zostało
wyjaśnione przez model
BAD STANDARDOWY ESTYMACJI
(ODCHYLENIE STANDARDOWE RESZT)
Błąd standardowy estymacji określony jest jako pierwiastek z wariancji reszt i może być
interpretowany jako błąd, który możliwy jest do popełnienia w trakcie prognozowania przy
pomocy modelu. Opisany jest następującym wzorem:
n
2
"e
i
i=1
Se =
n - k -1
n - k -1
gdzie:
ei - reszta (różnica pomiędzy wartością teoretyczną i obserwowaną)
n - liczba obserwacji
k - liczba zmiennych objaśniających
BAD STANDARDOWY ESTYMACJI
(ODCHYLENIE STANDARDOWE RESZT) - PRZYKAAD
Błąd standardowy estymacji wyniósł 158,21 zł co oznacza, że błąd prognozy będzie bliski tej
wartości
WERYFIKACJA HIPOTEZY O NIEISTOTNOŚCI PARAMETRÓW
MODELU
Narzędziem pozwalającym na ocenę istotności poszczególnych zmiennych niezależnych jest test t-
Studenta. Określa on, czy liniowa zależność między dwiema zmiennymi jest istotna statystycznie.
Zakłada się, że stosunek odchylenia od średniej lub innego parametru w rozkładzie statystyk z
prób do błędu standardowego tego rozkładu jest zgodny z rozkładem t.
Ä…i
i
t =
t =
SÄ…
i
gdzie: Ä…i - testowany parametr modelu regresji
Sąi - błąd standardowy parametru ąi
WERYFIKACJA HIPOTEZY O NIEISTOTNOŚCI PARAMETRÓW
MODELU
Test t-Studenta może posłużyć do weryfikacji następującej hipotezy:
H0: ąi = 0 co oznacza, że dany parametr w stopniu nieistotnym różni się od zera (nie istnieje
zależność między daną zmienną a ceną)
H1: ąi `" 0, co oznacza, że wartość danego parametru jest statystycznie istotna
Wartość krytyczną rozkładu t-Studenta odczytuje się z tablic (lub z kalkulatora
prawdopodobieństwa) dla przyjętego poziomu istotności i określonej liczby stopni swobody.
Jeżeli wartość empiryczna statystyki t jest wyższa od wartości krytycznej tzn:
tobl e" tkryt
e"
e"
e"
to hipotezę o nieistotności parametru należy odrzucić (parametr jest istotny statystycznie).
WERYFIKACJA HIPOTEZY O NIEISTOTNOŚCI PARAMETRÓW
MODELU (PRZYKAAD)
Wartość-p oznacza prawdopodobieństwo, że dana zmienna jest statystycznie nieistotna. Za
poziom krytyczny przyjmujemy 0,05


Wyszukiwarka

Podobne podstrony:
ekn teoria egzaminy 06 11 www przeklej pl
micros multimetry www przeklej pl
adam bytof moc autohipnozy www przeklej pl
index www przeklej pl
zwielokrotnianie umyslu www przeklej pl
micros transformatory www przeklej pl
adam bytof alchemia cudow www przeklej pl
03 analiza wycena www przeklej pl

więcej podobnych podstron