Podstawy statystyki i ekonometrii 2014 część 2


PODSTAWY STATYSTYKI I EKONOMETRII
CZ. 2
DR INÅ». TOMASZ BUDZYCSKI
SPIS TREÅšCI
Spis treści
1. Wstęp 2
2. Model ekonometryczny i jego elementy 2
2.1. Model regresji 2
2.2. Proces budowy modelu regresji 4
3. Przykłady budowy modelu ekonometrycznego (modelu regresji) 11
3.1. Budowa modelu ekonometrycznego (modelu regresji wielokrotnej) dla potrzeb 11
określenia wartości rynkowej nieruchomości gruntowej niezabudowanej
3.2. Budowa modelu ekonometrycznego (modelu regresji wielokrotnej) dla potrzeb
17
określenia wartości rynkowej nieruchomości lokalowej stanowiącej lokal mieszkalny
Załącznik
Rozkład t-Studenta
1
1. Wstęp
Niniejsze opracowanie zostało sporządzone dla potrzeb realizacji minimalnych wymogów
programowych na studiach podyplomowych w zakresie wyceny nieruchomości, określonych
przez Ministra Infrastruktury w rozporzÄ…dzeniu z dnia 7 czerwca 2010 r. Zawiera ono
zgodnie z ww. wymogami jedynie podstawy ekonometrii niezbędne rzeczoznawcom
majątkowym w procesie wyceny nieruchomości.
2. Model ekonometryczny i jego elementy
Model ekonometryczny jest to formalny opis stochastycznej zależności zjawiska lub
przebiegu procesu ekonomicznego od czynników, które je kształtują, wyrażony w formie
pojedynczego równania bądz układu równań. W dalszej części konspektu będziemy używać
pojęcia używanego w statystyce tj. modelu regresji.
Można wyróżnić modele regresji:
·ð wielokrotnej - dla przypadku dwóch i wiÄ™cej zmiennych objaÅ›niajÄ…cych,
·ð prostej - dla przypadku jednej zmiennej objaÅ›niajÄ…cej.
Do budowy modeli regresji stosowana jest analiza regresji, pozwalajÄ…ca na wykrywanie
zależności między zjawiskami, badanie siły zależności, wyjaśnianie ich oraz przewidywanie
wielkości jednego ze zjawisk na podstawie wielkości innych.
2.1. Model regresji
Stosując model regresji zakładamy, że istnieje zależność między co najmniej dwoma
zjawiskami oraz że wzrostowi jednej z badanych wielkości towarzyszy wzrost lub spadek
drugiej.
Model regresji w postaci addytywnej wyraża się wzorem:
Y =ð f (xi ) +ðeð i=1,2, ..., k (1)
a w postaci multiplikatywnej
Y =ð f (xi )eð i=1,2, .., k (2)
gdzie:
Y- zmienna zależna (objaśniana),
xi - zmienne niezależne (objaśniające)
eð -skÅ‚adnik losowy wyrażajÄ…cy tak zwany bÅ‚Ä…d w równaniu, czyli wpÅ‚yw na Y czynników
nie uwzględnionych w modelu w sposób bezpośredni.
2
W modelu wartości nieruchomości zmienną objaśnianą jest cena transakcyjna a zmiennymi
objaśniającymi  cechy nieruchomości wpływające na zmienność cen a przez to na wartość.
Jeżeli założymy, że model jest liniowy i występuje w nim tylko jedna zmienna objaśniająca
wówczas model taki nazywamy liniowym modelem regresji prostej (dwuwymiarowej). Ma on
następującą postać
Y =ð að0 +ðað1X1 +ðeð (3)
gdzie:
Y- zmienna objaśniana
X1 - zmienna objaśniająca
að0,að1 - nieznane parametry strukturalne modelu
eð - skÅ‚adnik losowy
Jeżeli model (3) uogólnimy na dowolną liczbę zmiennych objaśniających to nazywany
jest on liniowym modelem regresji wielokrotnej (wielorakiej) i przyjmuje on następującą
postać:
Y =ðað0 +ðað1X1 +ðað2 X +ð...+ðaðn X +ðeð (4)
2 n
gdzie:
Y- zmienna objaśniana
X1, X2,,..., Xn - zmienne objaśniające
að0,að1,...,aðn - nieznane parametry strukturalne modelu
eð - skÅ‚adnik losowy
Aby uwzględnić w jednym modelu wpływ wielu cech nieruchomości na jej wartość oprócz
przedstawionego wyżej modelu regresji wielokrotnej, można również zastosować model
zaproponowany przez CzajÄ™  model wielu regresji prostych (dwuwymiarowych), opisujÄ…cy
związek między ceną i cechami nieruchomości za pomocą kilku niezależnych modeli regresji
prostej. W metodzie tej wartość nieruchomości oblicza się jako średnią ważoną z wartości
nieruchomości uzyskanych z modelu regresji prostej. Wagi dla tych wartości stanowi
współczynnik r2 (kwadrat wartości współczynnika korelacji liniowej Pearsona dla
poszczególnych zmiennych niezależnych (cech nieruchomości) i zmiennej zależnej (ceny
nieruchomości)) lub też współczynnik determinacji R2 wyznaczony dla niezależnych modeli
regresji prostej.
3
2.2. Proces budowy modelu regresji
W celu stworzenia i zastosowania modelu regresji (w nazewnictwie ekonometrii zwanego
jednorównaniowym modelem ekonometrycznym) stosuje się 4-etapową procedurę
modelowania:
1. Merytoryczna analiza zjawiska i konstrukcja modelu;
2. Estymacja parametrów modelu;
3. Weryfikacja modelu;
4. Zastosowanie modelu.
2.2.1. Merytoryczna analiza zjawiska i konstrukcja modelu
Etap merytorycznej analizy zjawiska i konstrukcji modelu w procesie wyceny nieruchomości
obejmuje:
1. określenie zestawu cech zmiennych (cech rynkowych) i ich opis w przyjętej skali
liczbowej,
2. określenie postaci analitycznej modelu.
Określenie zestawu cech zmiennych wymaga wyodrębnienia grupy cech nieruchomości
wpływających na zmienność cen a przez to na wartość nieruchomości.
Kolejnym krokiem w I etapie modelowania jest opisanie w przyjętej skali liczbowej cech
mogących potencjalnie wpływać na wartość nieruchomości. Cechy te można podzielić na:
cechy ilościowe i cechy jakościowe lub odpowiednio mierzalne i niemierzalne. Dla cechy
ilościowej jej wartość może przyjmować bezwzględną wartość cechy np. powierzchnia
wyrażona w m2. Natomiast dla cechy jakościowej jej wartość przedstawia się na skali
interwałowej, na której mają znaczenie różnice między tymi wartościami np. cecha
lokalizacja wyrażona na skali porządkowej bardzo dobra  dobra - zła przyjmuje wartości na
skali interwałowej odpowiednio np. 4-2-1.
W przypadku budowy modelu regresji wielokrotnej ważnym zagadnieniem jest wybór
właściwych zmiennych objaśniających (cech nieruchomości). Dokonywany jest on ze zbioru
zmiennych potencjalnych, poprzez ich redukcję w podzbiór zmiennych dopuszczalnych.
Ogólną zasadą wyboru zmiennych jest preferowanie takich zmiennych objaśniających Xi,
które są silnie (statystycznie istotnie) powiązane ze zmienną objaśnianą Yi i jednocześnie
słabo (nie są statystycznie istotnie) powiązane parami  to jest między sobą. Zasadę tę można
zrealizować opierając się na analizy macierzy współczynników korelacji par zmiennych
(macierzy współczynników korelacji zupełnej) i eliminacji tych zmiennych objaśniających,
których współczynniki korelacji:
żð ze zmiennÄ… objaÅ›niana sÄ… niskie lub nieistotne statystycznie,
4
żð pomiÄ™dzy zmiennymi objaÅ›niajÄ…cymi sÄ… wysokie lub istotne statystycznie.
Przyjmuje się, że korelacja jest:
żð sÅ‚aba (niski współczynnik korelacji) gdy |r|<=0.3
żð silna (wysoki współczynnik korelacji) gdy |r|>0.6
Kolejnym krokiem w tym etapie modelowania ekonometryczne jest określenie postaci
analitycznej modelu. Oznacza to konieczność określenia postaci funkcji, która będzie
opisywała zależność pomiędzy zmienną objaśnianą - wartością nieruchomości (ceną
transakcyjną) a zmiennymi objaśniającymi  cechami nieruchomości.
Modele regresji ze względu na postać analityczną zależności funkcyjnych modelu dzieli się
na:
żð modele liniowe , w którym wszystkie zależnoÅ›ci modelu sÄ… liniowe,
żð modele nieliniowe, w których chociaż jedna zależność modelu jest nieliniowa.
Najczęściej w wycenie nieruchomości stosuje się modele liniowe lub modele nieliniowe
zawierające funkcje nieliniowe np. wielomianowe, które przed wyznaczeniem parametrów
modelu można doprowadzić do postaci liniowej. Popularność wspomnianych modeli wynika
z:
żð prostoty rozwiÄ…zywania liniowych ukÅ‚adów równaÅ„ za pomocÄ… wielu skutecznych
algorytmów algebry liniowej m.in. klasycznej metody najmniejszych kwadratów;
żð Å‚atwoÅ›ci w interpretacji wyników.
2.2.2. Estymacja parametrów modelu
Metody estymacji parametrów modelu można podzielić na:
żð metody estymacji modeli liniowych,
żð metody estymacji modeli nieliniowych.
Najczęściej stosowaną metodą estymacji parametrów modeli liniowych jest klasyczna metoda
najmniejszych kwadratów. Polega na spełnieniu warunku [vv]=min gdzie v stanowi różnicę
pomiędzy wartością nieruchomości wyliczoną z modelu a ceną transakcyjną.
Parametry strukturalne modelu oblicza siÄ™ na podstawie wzoru:
A=(XT X)-1 XT Y (5)
gdzie:
A  wektor ocen nieznanych parametrów strukturalnych modelu
5
X  macierz wartości zmiennych objaśniających
Y  wektor wartości zmiennej objaśnianej
Metoda ta pozwala na oszacowanie dokładności wyznaczenia parametrów modelu.
Wymaga ona spełnienia kilku warunków:
1. Zmienne objaśniające są wielkościami nielosowymi i nie zachodzi między nimi
współliniowość;
2. Składnik losowy jest zmienną losową, której nadzieja matematyczna równa jest 0,
a wariancja stałą;
3. Obserwacje są niezależne;
4. Składnik losowy jest nieskorelowany ze zmiennymi objaśniającymi;
5. Liczba zmiennych objaśniających musi być mniejsza od liczby obserwacji;
6. Nie występują współzależności między składnikami losowymi poszczególnych równań
modelu (autokorelacja składnika losowego).
Estymacja parametrów modeli nieliniowych może odbywać się nieliniową metodą
najmniejszych kwadratów za pomocą m.in. następujących algorytmów:
żð uogólniony proces Seidela,
żð algorytm Centrum Quadricae,
żð nieliniowy (kwadratowy) proces iteracyjny Newtona.
2.2.3. Weryfikacja modelu
Weryfikacja modelu składa się z dwóch części: weryfikacji merytorycznej oraz weryfikacji
statystycznej.
Podczas weryfikacji merytorycznej sprawdza siÄ™, czy zbudowany model jest zgodny z wiedzÄ…
o badanym zjawisku i zdrowym rozsądkiem. Ocenia się zgodność znaków obliczonych
współczynników oraz wielkości oszacowanych współczynników. Negatywny wynik
weryfikacji merytorycznej np. niewłaściwe znaki współczynników w przypadku modelu
regresji wielokrotnej mogą świadczyć o: niewłaściwej postaci analitycznej modelu,
współliniowości zmiennych niezależnych, błędach przedstawienia zmiennych jakościowych
za pomocą liczb lub nieuwzględnieniu istotnej zmiennej niezależnej.
W ramach weryfikacji statystycznej sprawdza się, czy model spełnia postulaty statystyczne:
istotność zmiennych objaśniających, dopasowanie modelu do wyników obserwacji (cen
transakcyjnych) i pożądane właściwości składnika resztowego.
6
Weryfikacja statystyczna dotycząca dwóch pierwszych postulatów obejmuje:
żð weryfikacjÄ™ hipotezy o nieistnieniu zależnoÅ›ci miÄ™dzy zbiorem zmiennych objaÅ›niajÄ…cych
(cechami) a zmienną objaśnianą (ceną transakcyjną),
żð weryfikacjÄ™ hipotezy o nieistotnoÅ›ci parametrów regresji,
żð ocenÄ™ współczynnika determinacji,
żð ocenÄ™ bÅ‚Ä™du standardowego estymacji,
Weryfikacja hipotezy o nieistnieniu zależności między zbiorem zmiennych
objaśniających (cechami) a zmienną objaśnianą (ceną transakcyjną)
Hipotezę weryfikuje się za pomocą statystyki F, która przy spełnionym założeniu
o normalności rozkładu składnika losowego modelu (4) ma rozkład F-Snedecora.
Test F wykonuje siÄ™, testujÄ…c hipotezÄ™: H0: að1, = að2, = ... = aðk, = 0,
przy hipotezie alternatywnej H1: co najmniej jedno að1 różne od 0.
W celu weryfikacji hipotezy zerowej obliczoną wartość statystyki F porównuje się
z wartością krytyczną, odczytywaną z tabeli wartości krytycznych rozkładu F-Snedecora lub
obliczaną komputerowo za pomocą kalkulatora prawdopodobieństwa, dla przyjętego poziomu
istotności 0,05, określonej liczby zmiennych objaśniających i liczby stopni swobody równej
n-k-1 ( wg oznaczeń wzoru ( 6)).
Wartość statystyki F- Snedecora oblicza się ze wzoru:
n
[ (wi -ð y)2]/ k
åð
i =ð 1
F = (6)
n
[ (yi -ð wi )2]/(n -ð k -ð1)
åð
i -ð1
gdzie:
wi - kolejna cena estymowana
yi - średnia arytmetyczna obliczona z cen transakcyjnych
yi - kolejna cena transakcyjna
n - liczba obserwacji (cen transakcyjnych)
k - liczba zmiennych objaśniających (cech)
7
Jeżeli obliczona wartość statystyki F jest wyższa od wartości krytycznej to hipotezę zerową
o nieistnieniu zależności należy odrzucić. Oznacza to, że zależności opisane modelem nie
wystąpiły przypadkowo.
Weryfikacja hipotezy o nieistotności parametrów regresji
Hipotezę tę weryfikuje się, aby ocenić istotność poszczególnych zmiennych objaśniających.
W tym celu wykonuje się test t-Studenta, która przy spełnionym założeniu o normalności
rozkładu składnika losowego modelu (4) ma rozkład t-Studenta. Testem t-Studenta weryfikuje
siÄ™ hipotezÄ™ zerowÄ…: H0: aði= 0, przy hipotezie alternatywnej H1: aði Ä…ð 0. W celu weryfikacji
hipotezy zerowej, oznaczającej brak wpływu zmiennej objaśniającej na zmienną objaśnianą,
obliczoną wartość statystyki t-Studenta porównuje się z wartością krytyczną, odczytywaną
z tabeli wartości krytycznych rozkładu t-Studenta lub obliczaną komputerowo za pomocą
kalkulatora prawdopodobieństwa, dla przyjętego poziomu istotności np. 0,05, określonej
liczby stopni swobody równej n-k-1 (wg oznaczeń wzoru (6)).
Wartość statystyki t-Studenta oblicza się ze wzoru:
aði
t =ð (7)
Sað
i
gdzie:
aði - testowany parametr modelu regresji
Sað - bÅ‚Ä…d standardowy parametru aði
i
Hipotezę zerową odrzuca się, jeżeli wartość bezwzględna statystyki t-Studenta jest wyższa od
wartości krytycznej. Jeśli tak jest, oznacza to, że przy wybranym poziomie istotności badana
zmienna objaśniająca (cecha) ma statystycznie istotny wpływ na zmienną objaśnianą (cenę).
Ocena współczynnika determinacji
Współczynnik determinacji R2 jest miarą dopasowania modelu (4) do danych empirycznych.
Obliczany jest on na podstawie wzoru:
n n
-ð y)2 -ð w)2
åð(wi åð(yi
i=ð1 i=ð1
R2 =ð =ð 1-ð (8)
n n
-ð y)2 -ð y)2
åð(yi åð(yi
i=ð1 i=ð1
8
gdzie:
wi - kolejna cena estymowana
yi - średnia arytmetyczna obliczona z cen transakcyjnych,
yi - kolejna cena transakcyjna
Współczynnik determinacji R2 wyrażony w procentach (100*R2) interpretowany jest jako
stopień wyjaśnienia całkowitej zmienności zmiennej objaśnianej (ceny) przez zmienność
zmiennych objaśniających (cech) występujących w modelu (4). Jest on liczbą z przedziału
<0,1>. Im wartość współczynnika determinacji bliższa jest jedności, tym lepiej model (4) jest
dopasowany do danego zbioru obserwacji (cen).
Niektórzy autorzy proponują zachowanie pewnej rezerwy przy stosowaniu współczynnika
determinacji R2 ponieważ jego wysoka wartość wynika nie tylko z silnej korelacji między
zmiennymi objaśniającymi a zmienną objaśnianą, lecz również między zmiennymi
objaśniającymi. Uważają oni, że informacja jaką niesie o modelu współczynnik determinacji
może być fałszywa, jeśli w modelu występują zmienne objaśniające silnie skorelowane
z innymi zmiennymi objaśniającymi. Wówczas w modelu występuje zjawisko nazywane
efektem katalizy. Sprawdzenie występowania efektu katalizy można przeprowadzić za
pomocą miary zwanej natężeniem efektu katalizy określonej wzorem:
hð =ð R2 -ð H (9)
gdzie:
R2 - współczynnik determinacji
H - integralna pojemność informacyjna zestawu zmiennych objaśniających modelu
obliczanÄ… obliczana na podstawie wzoru:
2
k
r
j
H =ð , hi =ð (10)
åðhi
i=ð1
åð| rij |
iÎðqð
gdzie:
rij - współczynniki korelacji liniowej Pearsona między zmiennymi objaśniającymi
rj - współczynniki korelacji liniowej Pearsona pomiędzy odpowiednią zmienną
objaśniającą a zmienną objaśnianą,
Ocena błędu standardowego estymacji
Błąd standardowy estymacji stanowi błąd, który jest możliwy do popełnienia w trakcie
określania wartości nieruchomości za pomocą modelu. Pokazuje on, o ile przeciętnie
9
odchylają się wartości obserwowane (ceny) od wartości teoretycznych obliczonych za
pomocÄ… modelu.
Obliczany jest on na podstawie wzoru :
[dðdð ]
s =ð , (11)
n
gdzie:
´ - odchylenie wartoÅ›ci obserwowanej (ceny) od wartoÅ›ci obliczonej z modelu
n  liczba obserwacji (cen)
Przy ocenie dokładności modelu można korzystać również z odchylenia przeciętnego
obliczanego na podstawie wzoru:
[DðDð]
s =ð , (12)
n
gdzie:
" = ((w-Wa)/w)*100%
w  cena transakcyjna
Wa  wartość wyliczona z modelu
Pożądane właściwości składnika resztowego
W celu weryfikacji statystycznej pożądanych właściwości składnika resztowego
przedmiotem analizy jest wektor reszt modelu (różnic między wartością empiryczną
a teoretyczną zmiennej objaśnianej), który uważa się za empiryczną realizację składnika
losowego modelu. Weryfikacja własności składnika losowego modelu składa z kilku kroków.
Obejmuje ona m.in. badanie losowości składnika losowego, badanie autokorelacji składnika
losowego, badanie normalności rozkładu składnika losowego.
Badanie losowości składnika losowego dokonuje się poprzez analizę losowego charakteru
reszt surowych lub standaryzowanych w drodze weryfikacji hipotezy zerowej
2 2
H0 : E(z2 -ðxð ) =ð 0 przy hipotezie alternatywnej H1 : E(z2 -ðxð ) >ð 0 gdzie: xð jest j-tym
j j j j j
składnikiem losowym a z jest j-tym składnikiem resztowym. W celu weryfikacji hipotezy
j
zerowej można zastosować test Walda-Wolfowitza.
W celu zbadania autokorelacji skÅ‚adnika losowego formuÅ‚uje siÄ™ hipotezÄ™ zerowÄ… H0: Á = 0,
która oznacza nieskorelowanie skÅ‚adników losowych., przy hipotezie alternatywnej H1: Á>0.
Do weryfikacji hipotezy zerowej najczęściej stosuje się test Durbina-Watsona.
10
Badanie normalności rozkładu składnika losowego wykonuje się porównując rozkładu
standaryzowanych reszt z standardowym rozkładem normalnym. Porównanie można
przeprowadzić: wizualnie z wykorzystaniem normalnego wykresu prawdopodobieństwa reszt
(gdy surowe reszty mają rozkład normalny to oczekiwane poziomy reszt standaryzowanych
mają przebieg liniowy) lub przy użyciu testów zgodności najczęściej testu chi-kwadrat.
2.2.4. Zastosowanie modelu
Uzyskany model stosuje się do określenia wartości jednostkowej nieruchomości poprzez
podstawienie do niego wartości cech opisujących szacowaną nieruchomość.
3. Przykłady budowy modelu ekonometrycznego (modelu regresji)
Poniżej przedstawiono proces budowy modelu ekonometrycznego ( modelu regresji
wielokrotnej) dla potrzeb:
1. określenia wartości rynkowej nieruchomości gruntowej niezabudowanej
przeznaczonej pod zabudowÄ™ mieszkaniowÄ… jednorodzinnÄ…,
2. określenia wartości rynkowej nieruchomości lokalowej stanowiącej lokal mieszkalny.
3.1. Budowa modelu ekonometrycznego (modelu regresji wielokrotnej) dla potrzeb
określenia wartości rynkowej nieruchomości gruntowej niezabudowanej
Proces budowy modelu ekonometrycznego obejmuje 4 etapy opisane w rozdziale 2.
3.1.1. Merytoryczna analiza zjawiska i konstrukcja modelu
1. Określenie zestawu cech zmiennych (cech rynkowych) i ich opis w przyjętej skali
liczbowej.
W celu zbadania, które cechy miały istotny wpływ na ceny tych nieruchomości, przyjęto
cechy (zmienne) i skale ocen (wartości zmiennej) podane w tabeli 1.
Tabela 1. Cechy nieruchomości i skale ocen
Cecha (zmienna) Ocena Wartości
(oznaczenie cechy) zmiennej
Lokalizacja centralna 2
(LOK) peryferyjna 1
Powierzchnia działki od 5000 m2 (bardzo słaba) 1
(POW) od 2000 do 4999 m2 (słaba) 2
od 1000 do 1999 m2 (średnia) 3
od 500 do 999 m2 (dobra) 4
do 499 (bardzo dobra) 5
11
Uzbrojenie techniczne współczynniki określone (uzyskane z analizy Suma
rynku) dla następujących mediów: współczynników
(UZBR)
- energia elektryczna  1,0 z kolumny Ocena
- gazociÄ…g  1,3
- wodociÄ…g  1,4
- kanalizacja  1,0
Dostęp komunikacyjny słaby 1
(DK) średni 2
dobry 3
Sąsiedztwo mało atrakcyjne 1
(SS) średnio atrakcyjne 2
atrakcyjne 3
bardzo atrakcyjne 4
Stan zagospodarowania i słaby 1
ograniczenia w średni 2
użytkowaniu dobry 3
(ZAG) bardzo dobry 4
Bazę sprzedanych nieruchomości gruntowych niezabudowanych przeznaczonych pod
zabudowÄ™ mieszkaniowÄ… jednorodzinnÄ… opisanych zgodnie z zasadami zawartymi
w powyższej tabeli 1 zawiera tabela 2.
Tabela 2. Baza danych transakcyjnych
CENA
Nr LOK POW UZBR DK SS ZAG
[zł/m2]
1 125,84 2 5 3,3 3 2 3
2 88,88 2 3 3,3 2 3 3
3 62,49 2 3 2 3 3 2
4 62,11 2 3 1 2 2 1
5 72,59 2 3 1 2 2 2
6 73,36 2 3 1 2 2 2
7 93,16 2 2 2,3 2 1 4
8 69,83 2 3 2,3 2 2 2
9 71,08 2 3 2 1 3 2
10 70,83 2 3 2 1 3 2
11 70,75 2 3 1 1 3 3
12 73,96 2 3 1 1 3 2
13 75,43 2 3 3,3 1 3 3
14 88,67 2 2 2,3 2 2 3
15 73,22 2 2 2 2 1 3
16 51,41 2 2 2 2 1 2
17 73,08 2 2 2 2 1 3
18 72,75 2 3 2 2 2 3
19 109,82 2 3 3,3 3 4 3
20 106,82 2 4 2,3 2 2 3
12
21 127,05 2 4 2,3 3 3 3
22 96,08 2 3 2,2 2 3 3
23 119,48 2 4 2,3 2 2 3
24 90,35 2 4 3,3 2 3 4
25 72,95 2 4 1 2 3 3
26 81,42 2 4 2,3 2 4 3
27 80,17 2 2 2,3 2 3 2
28 126,22 2 4 2,3 3 3 3
29 83,92 2 4 2,3 2 3 3
30 115,41 2 4 2,3 3 2 3
31 81,03 2 4 2,3 2 3 3
32 47,94 2 1 2 2 1 2
33 117,19 2 5 2,3 3 2 2
34 109,58 2 4 4,7 3 2 3
35 53,22 2 1 4,7 3 2 2
36 100,84 2 3 1 3 3 3
37 84,29 2 4 3,3 2 2 3
38 80,99 2 4 1 2 3 3
39 67,59 2 4 3,3 2 2 3
40 84,04 2 4 1 2 3 2
41 93,18 2 4 2,3 2 3 3
42 108,15 2 4 2,3 2 3 3
43 100,41 2 3 2,3 2 3 3
44 90,23 2 3 1 2 3 3
45 87,08 2 4 2,3 2 3 3
46 65,34 2 3 3,3 3 2 2
47 87,37 2 4 3,3 3 3 4
48 102,26 2 4 3,3 3 3 3
49 55,84 2 3 3,3 3 1 2
50 54,05 2 2 4,7 3 1 2
51 42,99 2 3 1 2 3 1
52 70,60 2 2 3,3 3 1 3
53 125,01 2 3 4,7 3 4 3
54 85,34 2 3 3,3 3 1 4
55 103,92 2 5 4,7 3 4 4
56 108,87 2 4 4,7 3 2 2
57 111,35 2 4 4,7 3 2 3
58 84,60 2 3 2 3 3 3
59 106,73 2 3 1 3 3 3
60 44,44 1 3 3,4 2 2 2
61 60,06 1 4 3,4 2 3 3
62 60,91 1 4 3,4 2 3 3
63 57,74 1 4 3,4 2 3 3
64 49,80 1 4 2,3 2 3 3
65 52,14 1 4 2,3 2 2 3
66 47,92 1 4 2,3 2 2 3
67 42,62 1 4 1 2 3 3
13
68 42,62 1 4 1 2 3 3
69 41,04 1 3 2,3 1 4 3
70 38,58 1 4 1 1 4 4
71 31,13 1 3 1 1 3 3
72 37,83 1 4 1 2 2 3
73 37,96 1 4 1 2 2 3
74 38,73 1 4 1 2 2 3
75 35,57 1 2 2,4 1 3 3
76 42,60 1 4 1,3 2 3 3
77 45,82 1 4 1,3 2 3 3
78 44,07 1 3 3,4 2 2 3
79 28,36 1 3 1 2 2 2
80 35,85 1 4 0 1 3 3
81 26,57 1 3 0 1 3 3
82 27,49 1 4 0 1 3 2
83 26,63 1 3 0 1 3 2
84 26,63 1 3 0 1 3 2
85 26,63 1 3 0 1 3 2
86 26,32 1 4 0 1 3 2
87 26,30 1 4 0 1 3 2
88 25,46 1 3 0 1 3 2
89 25,46 1 3 0 1 3 2
90 25,46 1 3 0 1 3 2
91 25,07 1 2 0 1 3 2
92 25,07 1 3 0 1 3 2
93 30,81 1 3 0 1 3 2
94 30,52 1 3 0 1 3 2
95 32,17 1 3 0 1 3 2
96 24,36 1 4 0 1 3 2
97 28,90 1 2 0 1 3 2
98 30,89 1 3 0 1 3 2
99 29,94 1 3 0 1 3 2
100 30,56 1 3 0 1 3 2
101 29,84 1 3 0 1 3 2
102 27,27 1 2 0 1 3 3
103 29,34 1 3 0 1 3 2
104 26,17 1 2 0 1 3 2
105 30,39 1 4 0 1 3 3
106 24,92 1 3 0 1 3 2
107 28,19 1 3 0 1 3 3
108 22,41 1 3 0 1 3 2
109 28,01 1 3 0 1 3 3
110 26,24 1 3 0 1 3 2
111 21,10 1 3 0 1 3 2
112 22,30 1 4 0 1 3 2
113 29,13 1 2 1 1 3 3
114 19,07 1 3 1 2 1 1
14
W celu doboru właściwych cech rynkowych  zmiennych niezależnych do modelu regresji
wielokrotnej, obliczono macierz współczynników korelacji liniowej (tabela 3) oraz
współczynniki korelacji cząstkowej (tabela 4) i dokonano ich analizy.
Tabela 3. Macierz współczynników korelacji liniowej
CENA LOK POW UZBR DK SS ZAG
CENA 1,00 0,85 0,30 0,69 0,75 -0,11 0,46
LOK 0,85 1,00 -0,00 0,62 0,67 -0,28 0,22
POW 0,30 -0,00 1,00 0,13 0,21 0,27 0,31
UZBR 0,69 0,62 0,13 1,00 0,76 -0,29 0,41
DK 0,75 0,67 0,21 0,76 1,00 -0,37 0,32
SS -0,11 -0,28 0,27 -0,29 -0,37 1,00 0,09
ZAG 0,46 0,22 0,31 0,41 0,32 0,09 1,00
Tabela 4. Współczynniki korelacji cząstkowej
Cecha Współczynniki
korelacji
czÄ…stkowej
LOK 0,795723
POW 0,383905
UZBR 0,116524
DK 0,317048
SS 0,261611
ZAG 0,351292
Na podstawie analizy macierzy współczynników korelacji liniowej (tabela 3) oraz
współczynników korelacji cząstkowej (tabela 4) do budowy modelu regresji wielokrotnej
przyjęto następujące cechy: lokalizacja ogólna, powierzchnia działki, dostęp komunikacyjny,
sÄ…siedztwo i stan zagospodarowania.
2. Określenie postaci analitycznej modelu
Po analizie zależności cech rynkowych i ceny w oparciu o wykresy korelacyjne uznano, że
występujące zależności można przyjąć jako liniowe. Stąd budowany model będzie modelem
liniowej regresji wielokrotnej.
3.1.2. Estymacja parametrów modelu
Do estymacji parametrów modelu zastosowano metodę najmniejszych kwadratów,
wykorzystujÄ…c program komputerowy STATISTICA.
Otrzymane wyniki prezentuje tabela 5.
15
Tabela 5. Podsumowanie regresji
Podsumowanie regresji zmiennej zależnej: CENA
R= ,93407490 R2= ,87249592 Popraw. R^2= ,86659295
F(5,108)=147,81 p<0,0000 BÅ‚Ä…d std. estymacji: 11,475
BÅ‚Ä…d st. BÅ‚Ä…d st.
BETA BETA B B t(108) poziom p
W. wolny -79,0020 7,288182 -10,8397 0,000000
LOK 0,670327 0,047380 41,9589 2,965744 14,1479 0,000000
POW 0,166734 0,039416 6,7243 1,589628 4,2301 0,000049
DK 0,252391 0,052861 10,6624 2,233152 4,7746 0,000006
SS 0,109895 0,040343 4,8204 1,769596 2,7240 0,007523
ZAG 0,169535 0,038129 8,3992 1,889033 4,4463 0,000021
Równanie modelu regresji wielokrotnej jest zatem następujące:
y=41,9589*xLOK+6,7243*xPOW+10,6624*xDK+4,8204*xSDZ+8,3992*xZAG-79,0020.
Dokładność modelu wyrażona poprzez błąd standardowy wynosi 11,48 zł/m2.
3.1.3. Weryfikacja modelu
Weryfikacja modelu składa się z dwóch części: weryfikacji merytorycznej oraz weryfikacji
statystycznej.
Weryfikacja merytoryczna modelu regresji
Wyniki analizy pod względem merytorycznym (wartości i znaki parametrów modelu)
ww. modelu nie odbiegają od tendencji obserwowanych na lokalnym rynku nieruchomości.
Weryfikacja statystyczna modelu regresji
Weryfikacja statystyczna modelu regresji następuje poprzez sprawdzenie postulatów
statystycznych:
·ð istotność zmiennych objaÅ›niajÄ…cych
Na poziomie istotności 0,05 odrzucono hipotezę o braku zależności pomiędzy
zmiennymi objaśniającymi a ceną transakcyjną jak również hipotezę o braku istotności
statystycznej parametrów regresji.
·ð dopasowanie modelu do wyników obserwacji
Stwierdzono bardzo dobre dopasowanie modelu R2 wyniosło 0, 87249592.
·ð pożądane wÅ‚aÅ›ciwoÅ›ci skÅ‚adnika resztowego m.in.:
- autokorelacja składnika losowego
16
Wartość testu DW wynosząca 1,57 oznacza, że na poziomie istotności 0,05 została
odrzucona hipoteza zerowa o braku zjawiska autokorelacji reszt pierwszego rzędu.
- normalność rozkładu składnika losowego
Oczekiwane poziomy reszt standaryzowanych miały przebieg liniowy co świadczyło
o spełnieniu założenia normalności rozkładu składnika losowego.
3.1.4. Zastosowanie modelu
Uzyskany model stosuje się do określenia wartości jednostkowej nieruchomości poprzez
podstawienie do niego wartości cech opisujących szacowaną nieruchomość.
3.2. Budowa modelu ekonometrycznego (modelu regresji wielokrotnej) dla potrzeb
określenia wartości rynkowej nieruchomości lokalowej stanowiącej lokal mieszkalny
Proces budowy modelu ekonometrycznego obejmuje 4 etapy opisane w rozdziale 2.
3.2.1. Merytoryczna analiza zjawiska i konstrukcja modelu
1. Określenie zestawu cech zmiennych (cech rynkowych) i ich opis w przyjętej skali
liczbowej.
W celu zbadania, które cechy miały istotny wpływ na ceny tych nieruchomości, przyjęto
cechy (zmienne) i ich skale (wartości zmiennej) podane w poniższej tabeli 6.
Tabela 6. Cechy nieruchomości i skale ocen
Cecha (zmienna)
Opis Ocena Wartość
(oznaczenie cechy)
dzielnice: Śródmieście, Centrum,
dobra 3
Bolesława Prusa
Lokalizacja
dzielnica BÄ…ki, osiedle Parkowe oraz
(LOK) przeciętna 2
Lipowa Ostoja
osiedle Staszica cz. A oraz Staszica cz.
słaba 1
B, dzielnica: Gąsin i Żbików
budynek otoczony zabudowÄ…
jednorodzinnÄ…, oraz usytuowany w
korzystne 3
bezpośrednim sąsiedztwie parku lub
otoczony w dużym stopniu zielenią
Otoczenie budynek charakteryzujÄ…cy siÄ™
przeciętne 2
(OTOCZ) przeciętnym otoczeniem
budynek usytuowany w pobliżu
obiektów przemysłowych
niekorzystne 1
17
bardzo dobry dostęp do komunikacji
publicznej, bezpośrednie sąsiedztwo bardzo
4
obiektów handlowo-usługowych oraz dobra
obiektów użyteczności publicznej
dobry dostęp do komunikacji
publicznej, bliskie sąsiedztwo obiektów
handlowo-usługowych oraz łatwość w dobra 3
dostępie do obiektów użyteczności
Dostępność
publicznej
komunikacji i usług
słaby dostęp do komunikacji publicznej,
(DKU)
przeciętny dostęp do obiektów
przeciętna 2
handlowo-usługowych oraz obiektów
użyteczności publicznej
utrudniony dostęp do komunikacji
publicznej, ograniczona ilość obiektów
handlowo-usługowych w sąsiedztwie słaba 1
oraz trudność w dostępie do obiektów
użyteczności publicznej
budynek wykonany w nowoczesnej
bardzo
technologii, wybudowany w 2000r. 4
dobry
i pózniej
budynek wykonany w technologii
wielkiej płyty lub cegły, w którym
dobry 3
przeprowadzono gruntowne remonty,
Stan techniczny
niezależnie od roku budowy
budynku
budynek w technologii wielkiej płyty,
(STAN TECH)
w którym przeprowadzono jedynie
przeciętny 2
drobne remonty, niezależnie od roku
budowy
budynek z cegły, w którym
przeprowadzono jedynie drobne zły 1
remonty, wybudowany do 1960r.
bardzo
lokale jedno i dwuizbowe 4
dobra
Liczba izb (L IZB)
lokale trzy i czteroizbowe dobra 2
lokale pięcioizbowe słaba 1
W celu doboru właściwych cech rynkowych  zmiennych niezależnych do modelu regresji
wielokrotnej, obliczono macierz współczynników korelacji liniowej  tabela 7
18
Tabela 7. Macierz współczynników korelacji liniowej
LOK OTOCZ DKU STAN L IZB CENA
TECH
LOK 1 0,2697 0,5529 0,3602 0,0856 0,4504
OTOCZ 0,2697 1 0,1498 0,2600 -0,0413 0,2864
0,5529 0,1498 1 -0,0820 -0,0438 0,2476
DKU
STAN 0,2600 -0,0820 1 0,1442 0,4244
0,3602
TECH
L IZB 0,0856 -0,0413 -0,0438 0,1442 1 0,1833
CENA 0,4504 0,2864 0,2476 0,4244 0,1833 1
Dokonując oceny współczynnika korelacji w parach cecha  cena można zauważyć, że
największa wartość współczynnika korelacji występuje dla atrybutów  lokalizacja (0,4504)
oraz  stan techniczny (0,4244), zatem mają one największy wpływ na zmienność cen.
Dokonując analizy, należy zauważyć, iż współczynnik korelacji pomiędzy cechą  dostępność
komunikacji i usług oraz cechą  lokalizacja charakteryzuje się wysoką wartością (0,5529).
Oznacza to, że atrybuty te są ze sobą ściśle skorelowane, więc opisują podobny zakres
zmienności cen transakcyjnych. Z tego powodu cechę  dostępność komunikacji i usług
wyeliminowano z dalszych analiz.
Zatem ostatecznie do budowy modelu regresji wielokrotnej przyjęto następujące cechy:
lokalizacja, otoczenie, stan techniczny budynku, liczba izb.
2. Określenie postaci analitycznej modelu
Po analizie zależności cech rynkowych i ceny w oparciu o wykresy korelacyjne uznano, że
występujące zależności można przyjąć jako liniowe. Stąd budowany model będzie modelem
liniowej regresji wielokrotnej.
3.1.2. Estymacja parametrów modelu
Do estymacji parametrów modelu zastosowano metodę najmniejszych kwadratów,
wykorzystujÄ…c program komputerowy STATISTICA.
Otrzymane wyniki prezentuje tabela 5.
19
Tabela 5. Podsumowanie regresji
Podsumowanie regresji zmiennej zależnej: CENA
R= , 55864469 R2= , 31208389 Popraw. R2= , 29752482
F(4,189)=21,436 p<0,0000 BÅ‚Ä…d std. estymacji: 837,48
BÅ‚Ä…d st. BÅ‚Ä…d st.
BETA BETA B B t(189) poziom p
W. wolny 3431,666 315,1199 10,89003 0,000000
LOK 0,308509 0,066039 367,314 78,6269 4,67161 0,000006
OTOCZ 0,141234 0,063975 264,473 119,7994 2,20763 0,028474
STAN 0,258411 0,066385 260,268 66,8624 3,8926 0,000137
TECH
L IZB 0,125493 0,061264 126,517 61,7641 2,04839 0,041905
Równanie modelu regresji wielokrotnej jest zatem następujące:
y=367,314*xLOK+264,473*xOTOCZ+260,268*xSTAN TECH+126,517*xL IZB+3431,67.
Dokładność modelu wyrażona poprzez błąd standardowy wynosi 837,48 zł/m2.
3.2.3. Weryfikacja modelu
Weryfikacja modelu składa się z dwóch części: weryfikacji merytorycznej oraz weryfikacji
statystycznej.
Weryfikacja merytoryczna modelu regresji
Dokonując oceny merytorycznej zbudowanego modelu, stwierdzono, że wartości
współczynników mają wartości dodatnie oraz pokazują prawdopodobny wpływ
poszczególnych cech nieruchomości na zmienność cen na lokalnym rynku nieruchomości.
Weryfikacja statystyczna modelu regresji
Weryfikacja statystyczna, polegająca na sprawdzeniu hipotez o braku zależności między
zmiennymi objaśniającymi a zmienna objaśnianą oraz o braku istotności statystycznej
parametrów regresji na poziomie istotności 0,05 w oparciu odpowiednio
o test F oraz test t-Studenta, przebiegła pomyślnie. Przeprowadzono także badanie
normalności składnika losowego, polegające na porównaniu rozkładu standaryzowanych reszt
modelu z rozkładem normalnym. Dokonano tego wizualnie, przy użyciu normalnego wykresu
prawdopodobieństwa reszt. Gdy surowe reszty mają rozkład normalny to oczekiwane
poziomy reszt standaryzowanych majÄ… przebieg liniowy. Wykres nr 1 potwierdza
normalność rozkładu składnika losowego.
20
Wykres 1. Wykres normalności reszt.
Podsumowując, zbudowany model można uznać za statystycznie poprawny. Stwierdza się
jednak, na podstawie wartości współczynnika R2, że wyjaśnił on jedynie 31% zmienności cen
nieruchomości przyjętych do budowy modelu. Pozostała zmienność cen być może zależy od
innych czynników w tym czynników losowych. Dokładność modelu, wyrażona za pomocą
błędu standardowego wynosi 837,48zł/m2.
3.1.4. Zastosowanie modelu
Uzyskany model stosuje się do określenia wartości jednostkowej nieruchomości poprzez
podstawienie do niego wartości cech opisujących szacowaną nieruchomość.
Bibliografia
Adamczewski Z. 2002. Nieliniowe i nieklasyczne algorytmy w geodezji. Oficyna
Wydawnicza PW, Warszawa 2002
Adamczewski Z. 2011. Elementy modelowania matematycznego w wycenie nieruchomości.
Podejście porównawcze. Oficyna Wydawnicza PW, Warszawa 2011
Luszniewicz A. SÅ‚aby T. 2001. Statystyka z pakietem komputerowym STATISTICA PL.
Teoria i zastosowania. C.H. Beck. Warszawa 2001
yróbek S. 2007. Metodyka określania wartości rynkowej nieruchomości. Educaterra 2007
21


Wyszukiwarka

Podobne podstrony:
Podstawy statystyki i ekonometrii 2014 część 1
Blender 3D Bryły Podstawowe Prosta Animacja Brył Część 1 Tutorial
Blender 3D Bryły Podstawowe Prosta Animacja Brył Część 2 Tutorial
Balcerowicz Szkutnik Podstawy statystyki w przykładach i zadaniach
07 Podstawa opodatkowania VAT 2014 zajęcia
MPiS30 W09 Podstawy statystyki matematycznej
Podstawy statystyki
Podstawy Automatyki Lab 2014 CW3 Badania regulatora dwupołożeniowego

więcej podobnych podstron