Budowa modelu zależności cen
samochodów typu SUV od
wybranych zmiennych na
podstawie danych rynkowych
pozyskanych
z serwisu allegro
Wykonali:
Wydział Informatyki i Zarządzanie
Kierunek: Zarządzanie
Stopień: Magisterski
Modelowanie ekonometryczne i prognozowanie
Prowadzący: Dr David Ramsey
Plan prezentacji
1. Cel projektu
2. Opis danych i ich przygotowanie
3. Model regresji
4. Interpretacja modelu
5. Weryfikacja założeń modelu
6. Prognozowanie
Cel projektu
Celem projektu było wyznaczenie modelu regresji
liniowej, który za pomocą wybranych zmiennych
opisuje ich wpływ na cenę samochodu typu SUV.
Dane
Źródłem obserwacji był serwis allegro.pl, z którego
zostały pobrane dane pochodzące z początku kwietnia
2015 roku oraz zapisane w formie tabeli w arkuszu Excel.
Jest to zbiór 158 obserwacji nie posiadający zależności
od czasu.
Zmienną zależną (objaśnianą) jest cena, natomiast
zmiennymi niezależnymi (objaśniającymi) są: marka,
model, rok produkcji, moc silnika, pojemność silnika,
rodzaj paliwa (benzyna, diesel, hybryda/Benzyna),
przebieg, skrzynia biegów.
Przygotowanie danych
Rekodowanie zmiennych
(1/2)
Zmienne kategorialne rodzaj paliwa i rodzaj marki należy
zrekodować na zmienne binarne. Jeżeli jest k-kategorii,
należy stworzyć (k-1) zmiennych binarnych.
Kategorią, która występuje
najczęściej jest kategoria 0 – BMW.
Pozostałe zmienne rekodujemy tak,
że:
• M1 – kategoria 1,
• M2 – kategoria 2,
• M3 – kategoria 3,
• M4 – kategoria 4,
• M5 – kategoria 5,
• M6 – kategoria 6.
Rekodowanie zmiennych
(2/2)
Częstość występowania dla zmiennej rodzaj paliwa
przedstawia się następująco:
Kategorią, która występuje najczęściej jest kategoria 0 –
Diesel. Będzie ona naszą podstawą przy porównaniu.
Pozostałe zmienne rekodujemy tak, że:
• S1 – kategoria 1 – silnik na benzynę,
• S2 – kategoria 2 – hybryda.
Model regresji
W celu utworzenia modelu regresji przeprowadzona
została analiza regresji metodą regresji liniowej za
pomocą programu SPSS. Została określona zmienna
zależna i zmienne wyjaśniające:
• cena jako zmienna zależna,
• zmienne wyjaśniające:
» kod marki,
» moc silnika,
» wiek,
» przebieg,
» rodzaj paliwa.
Model regresji
Model krokowej regresji liniowej opisuje wpływ
poszczególnych danych na cenę końcową samochodu
typu SUV. Wyraża się on wzorem:
y = 136478.383 + 421.637Moc -
18222.043Wiek
+ 75481.773M4 + 26216.186M2 +
19828.485M3
- 0.226Przebieg - 46013.702S1 - 61177.803S2
Gdzie M3, M4 są szczególnym uwzględnieniem dla marek odpowiednio Range
Rover oraz Porsche, S1 jest to silnik napędzany benzyną, S2 –
hybryda/benzyna.
Interpretacja modelu
Interpretacja modelu
1. Gdy moc silnika rośnie o 1KM to cena wzrośnie o 421.637
jednostek.
2. Marka M4 – Porsche - jest średnio o 10454.232 złotych
droższa od BMW (podstawa).
3. Samochody na benzynę są średnio o 7380.530 złotych
droższe od diesel’a (podstawa).
4. samochody hybrydowe są średnio 20460.536 złotych droższe
od diesel’a (podstawa).
5. Jeżeli przebieg samochodu wzrośnie o 1km to cena wzrośnie
o 0,62 jednostek.
6. Marka m2 jest średnio o 8668.685 złotych droższa od BMW
(podstawa).
Interpretacja modelu
Najlepszą miarą mocy w przedstawionej tabelce ze
współczynnikami
jest
bezwzględna
wartość
statystyki t. Na tej podstawie wnioskujemy, że
najważniejszym czynnikiem wpływającym na cenę
samochodu typu SUV jest moc silnika (t=12.217).
Weryfikacja założeń
modelu
Na pierwszym histogramie można
zauważyć obserwacje odstające,
które
zostały
usunięte
przed
utworzeniem histogramu drugiego.
Reszty można określić jako
zbliżone
do
rozkładu
normalnego.
Prognozowanie
Obok mamy próbkę cen
obliczonych przy użyciu
modelu, zauważyć można,
że wyniki dla BMW oraz
AUDI są
bardzo zbliżone do obserwacji, natomiast ceny Porsche i
Mercedesa są mocno niedoszacowane.
Dziękujemy za
uwagę