L5 regresja logistyczna (2)

background image

SAS Enterprise Miner Klasyfikacja za regresji logistycznej – laboratorium nr 5

Wczytać z pliku SPAMBASE.DATA do zbioru SPAMBASE dane opisujące e-maile pod kątem
częstości występowania słów i znaków, oraz zaklasyfikowanych jako spam lub normalna
poczta.
W pliku SPAMBASE.DESC oraz SPAMBASE.NAMES znajduje się opis zmiennych
zawartości pliku i interpretacji zmiennych.

Zbudować model predykcyjny dla klasyfikowania e-maila jako spam w oparciu o
zaproponowane w modelu zmienne predykcyjne, przyjmując założenia opisane poniżej.
Wykorzystać diagram budowany dla drzewa decyzyjnego.

Przyjąć metodę Backward doboru zmiennych do modelu. Pozostałe parametry pozostawić
domyślne.

a)

Podaj proporcję błędnych klasyfikacji wyznaczoną w oparciu o ciąg walidujący

b)

Porównać proporcję błędnych klasyfikacji w porównaniu z modelem opartym o

drzewo decyzyjne.

c)

Podaj trzy najistotniejsze zmienne dla prognozowania zawartości maila ?


Wyszukiwarka

Podobne podstrony:
L5 regresja logistyczna klucz (2)
L5, regresja logistyczna
L5 regresja logistyczna klucz (2)
regresja logistyczna w R
cw 04 regresja logistyczna
regresja logistyczna w R
3 SYSTEMY LOGISTYCZNE
Magazyny i centra logistyczne
Logistyczny łańcuch dostaw
Statystyka #9 Regresja i korelacja
Metodologia SPSS Zastosowanie komputerów Brzezicka Rotkiewicz Regresja
A A Praktyczne zastosowane myślenia logistycznego
Logistyka dystrybucji 3
4 Koszty Logistyki w sieci dystrybucji

więcej podobnych podstron