background image

SAS Enterprise Miner  Klasyfikacja za regresji – laboratorium nr 4  - klucz 

 

Zbudować model dla predykcji cen samochodów w oparciu o dane ze zbioru AUTODANE.  
Zmienną zależną jest cena samochodu,  predyktorami (zmiennymi niezależnymi) są wiek 
samochodu oraz jego przebieg)  

 

 

 

1.

  Ocenić dopasowanie modelu na podstawie wskaźników R

2

 oraz błędów oszacowań 

parametrów 

 

 
Odp. Współczynnik determinacji R

wynosi 0,89, co oznacza, że 89 %  zmienności ceny 

samochodu może zostać objaśnione przez dwie zmienne : przebieg i wiek. Na podstawie  
R

model należy uznać za dobrze dopasowany do danych empirycznych.  

Względne błędy estymatorów współczynników wynoszą: wyraz wolny  - poniżej 50%, 
przebieg – powyżej 50 %, wiek – poniżej 50%.  Dużym błędem obarczony jest zatem 
parametr przy zmiennej WIEK. Ocenę estymatorów parametrów można przeprowadzić 
również w oparciu o statystykę t ( wartości bezwzględne powyżej 2 świadczą o 
dopuszczalnym błędzie) bądź poziom istotności – wartości poniżej 0.05.  
 

background image

  
2.

  Napisać równanie prostej regresji.  

 
CENA= 46.92 - 0.0283 * PRZEBIEG – 3.0112* WIEK 

 
Wykonać punkty 1-2 ustawiając jako  metodę selekcji Backward.