SAS Enterprise Miner Klasyfikacja za regresji – laboratorium nr 4 - klucz
Zbudować model dla predykcji cen samochodów w oparciu o dane ze zbioru AUTODANE.
Zmienną zależną jest cena samochodu, predyktorami (zmiennymi niezależnymi) są wiek
samochodu oraz jego przebieg)
1. Ocenić dopasowanie modelu na podstawie wskaźników R2 oraz błędów oszacowań
parametrów
Odp. Współczynnik determinacji R2 wynosi 0,89, co oznacza, że 89 % zmienności ceny samochodu może zostać objaśnione przez dwie zmienne : przebieg i wiek. Na podstawie
R2 model należy uznać za dobrze dopasowany do danych empirycznych.
Względne błędy estymatorów współczynników wynoszą: wyraz wolny - poniżej 50%,
przebieg – powyżej 50 %, wiek – poniżej 50%. Dużym błędem obarczony jest zatem
parametr przy zmiennej WIEK. Ocenę estymatorów parametrów można przeprowadzić
również w oparciu o statystykę t ( wartości bezwzględne powyżej 2 świadczą o
dopuszczalnym błędzie) bądź poziom istotności – wartości poniżej 0.05.
2. Napisać równanie prostej regresji.
CENA= 46.92 - 0.0283 * PRZEBIEG – 3.0112* WIEK
Wykonać punkty 1-2 ustawiając jako metodę selekcji Backward.