Paulina Samiec, Bartosz Szewczyk, Adam Molecki IIE sem. 5 rok 3
Tworzymy model klasyfikujący klientów na tych, którzy dokonają zakupu roweru i tych, którzy tego nie zrobią (zmienna objaśniana - BikeBuyer)
na podstawie arkusza „Source Data” .
A)
W pierwszym modelu wykorzystujemy wszystkie dostępne zmienne oprócz ID i zmiennej Bike Buyers. Ponieważ zamieszczamy wygląd drzewa.
8887- liczba przykładów poprawnie nieprzydzielonych do wybranej klasy (poprawnie odrzuconych) 94 – liczba poprawnie sklasyfikowanych przykładów z wybranej klasy 113–liczba przykładów błędnie przydzielonych do wybranej klasy, Podczas gdy w rzeczywistości do niej nie należą 906 – liczba błędnie sklasyfikowanych przykładów z tej klasy , to jest Decyzja negatywna podczas gdy przykład w rzeczywistości jest Pozytywny( błąd pominięcia ) |
---|
Trafność =89,81% .
Czułość 9,4 %
Specyficzność – 98,74 %
W modelu największy wpływ na zakup roweru miały zmienne (w odpowiedniej kolejności) :Age, Cars, Region, Maritial Status, Yeraly income
Druhie drzewo (I rozwiązanie – odrzucamy zmienne):
Do naszego algorytmu użyliśmy zmiennych : Age, Cars, Childern , Region, Occupation. Pozostałe zmienne odrzuciliśmy. Poniżej schemat drzewa.
8942- liczba przykładów poprawnie nieprzydzielonych do wybranej klasy (poprawnie odrzuconych) 71 – liczba poprawnie sklasyfikowanych przykładów z wybranej klasy 58 –liczba przykładów błędnie przydzielonych do wybranej klasy, Podczas gdy w rzeczywistości do niej nie należą 929 – liczba błędnie sklasyfikowanych przykładów z tej klasy , to jest Decyzja negatywna podczas gdy przykład w rzeczywistości jest Pozytywny( błąd pominięcia ) |
---|
Trafność =90,13% .
Czułość 7,1 %
Specyficzność – 99,36 %
Do modelu wrzucamy : wiek, children, cars, yearly income