SAS Enterprise Miner Klasyfikacja za regresji – laboratorium nr 4 - klucz
Zbudować model dla predykcji cen samochodów w oparciu o dane ze zbioru AUTODANE.
Zmienną zależną jest cena samochodu, predyktorami (zmiennymi niezależnymi) są wiek
samochodu oraz jego przebieg)
1.
Ocenić dopasowanie modelu na podstawie wskaźników R
2
oraz błędów oszacowań
parametrów
Odp. Współczynnik determinacji R
2
wynosi 0,89, co oznacza, że 89 % zmienności ceny
samochodu może zostać objaśnione przez dwie zmienne : przebieg i wiek. Na podstawie
R
2
model należy uznać za dobrze dopasowany do danych empirycznych.
Względne błędy estymatorów współczynników wynoszą: wyraz wolny - poniżej 50%,
przebieg – powyżej 50 %, wiek – poniżej 50%. Dużym błędem obarczony jest zatem
parametr przy zmiennej WIEK. Ocenę estymatorów parametrów można przeprowadzić
również w oparciu o statystykę t ( wartości bezwzględne powyżej 2 świadczą o
dopuszczalnym błędzie) bądź poziom istotności – wartości poniżej 0.05.
2.
Napisać równanie prostej regresji.
CENA= 46.92 - 0.0283 * PRZEBIEG – 3.0112* WIEK
Wykonać punkty 1-2 ustawiając jako metodę selekcji Backward.