SAS Enterprise Miner Klasyfikacja za regresji – laboratorium nr 4 - klucz

Zbudować model dla predykcji cen samochodów w oparciu o dane ze zbioru AUTODANE.

Zmienną zależną jest cena samochodu, predyktorami (zmiennymi niezależnymi) są wiek

samochodu oraz jego przebieg)

1. Ocenić dopasowanie modelu na podstawie wskaźników R2 oraz błędów oszacowań

parametrów

Odp. Współczynnik determinacji R2 wynosi 0,89, co oznacza, że 89 % zmienności ceny samochodu może zostać objaśnione przez dwie zmienne : przebieg i wiek. Na podstawie

R2 model należy uznać za dobrze dopasowany do danych empirycznych.

Względne błędy estymatorów współczynników wynoszą: wyraz wolny - poniżej 50%,

przebieg – powyżej 50 %, wiek – poniżej 50%. Dużym błędem obarczony jest zatem

parametr przy zmiennej WIEK. Ocenę estymatorów parametrów można przeprowadzić

również w oparciu o statystykę t ( wartości bezwzględne powyżej 2 świadczą o

dopuszczalnym błędzie) bądź poziom istotności – wartości poniżej 0.05.

2. Napisać równanie prostej regresji.

CENA= 46.92 - 0.0283 * PRZEBIEG – 3.0112* WIEK

Wykonać punkty 1-2 ustawiając jako metodę selekcji Backward.