L5 regresja logistyczna klucz


SAS Enterprise Miner Klasyfikacja za regresji logistycznej  laboratorium nr 5 - klucz
Wczytać z pliku SPAMBASE.DATA do zbioru SPAMBASE dane opisujące e-maile pod kątem
częstości występowania słów i znaków, oraz zaklasyfikowanych jako spam lub normalna
poczta.
W pliku SPAMBASE.DESC oraz SPAMBASE.NAMES znajduje się opis zmiennych
zawartości pliku i interpretacji zmiennych.
Zbudować model predykcyjny dla klasyfikowania e-maila jako spam w oparciu o
zaproponowane w modelu zmienne predykcyjne, przyjmując założenia opisane poniżej.
Wykorzystać diagram budowany dla drzewa decyzyjnego.
Przyjąć metodę Backward doboru zmiennych do modelu. Pozostałe parametry pozostawić
domyślne.
a) Podaj proporcję błędnych klasyfikacji wyznaczoną w oparciu o ciąg walidujący
Odp. 0.0739130435
b) Porównać proporcję błędnych klasyfikacji w porównaniu z modelem opartym o
drzewo decyzyjne.
Dla drzewa decyzyjnego proporcja błędnych klasyfikacji wynosiła 0,1072, a więc
model predykcyjny oparty na regresji logistycznej jest lepiej dopasowany.
c) Podaj trzy najistotniejsze zmienne dla prognozowania charakteru maila ?
Odp. FREQ5, WORD7, WORD16.
d) Podaj przykładowe trzy zmienne, które nie są istotne ?
Odp. FREQ1, WORD1, WORD18
e)


Wyszukiwarka

Podobne podstrony:
L5 regresja logistyczna
L4 regresja liniowa klucz
Regresja logistyczna
Regresja logistyczna 8
Regresja logistyczna
t logistyk2 0X klucz
logistyka transportu towarowego w europie klucz do zrównoważonej mobilności
regresja empiryczna
klucz test zawodowy Y6ZUUDOV
ps029 klucz
rynek pracy logistyka
Logistyka (13 stron)
Klucz Odpowiedzi Chemia Nowej Ery III Węgiel i jego związki z wodorem
02 PNJN A KLUCZ

więcej podobnych podstron