PS BJAM projekt

Paulina Samiec, Bartosz Szewczyk, Adam Molecki IIE sem. 5 rok 3

Tworzymy model klasyfikujący klientów na tych, którzy dokonają zakupu roweru i tych, którzy tego nie zrobią (zmienna objaśniana - BikeBuyer)

na podstawie arkusza „Source Data” .

W pierwszym modelu wykorzystujemy wszystkie dostępne zmienne oprócz ID i zmiennej Bike Buyers. Ponieważ zamieszczamy wygląd drzewa.

8887- liczba przykładów poprawnie nieprzydzielonych do wybranej klasy

(poprawnie odrzuconych)

94 – liczba poprawnie sklasyfikowanych przykładów z wybranej klasy

113–liczba przykładów błędnie przydzielonych do wybranej klasy,

Podczas gdy w rzeczywistości do niej nie należą

906 – liczba błędnie sklasyfikowanych przykładów z tej klasy , to jest

Decyzja negatywna podczas gdy przykład w rzeczywistości jest

Pozytywny( błąd pominięcia )

Trafność =89,81% .

Czułość 9,4 %

Specyficzność – 98,74 %

W modelu największy wpływ na zakup roweru miały zmienne (w odpowiedniej kolejności) :Age, Cars, Region, Maritial Status, Yeraly income

Druhie drzewo (I rozwiązanie – odrzucamy zmienne):

Do naszego algorytmu użyliśmy zmiennych : Age, Cars, Childern , Region, Occupation. Pozostałe zmienne odrzuciliśmy. Poniżej schemat drzewa.

8942- liczba przykładów poprawnie nieprzydzielonych do wybranej klasy

(poprawnie odrzuconych)

71 – liczba poprawnie sklasyfikowanych przykładów z wybranej klasy

58 –liczba przykładów błędnie przydzielonych do wybranej klasy,

Podczas gdy w rzeczywistości do niej nie należą

929 – liczba błędnie sklasyfikowanych przykładów z tej klasy , to jest

Decyzja negatywna podczas gdy przykład w rzeczywistości jest

Pozytywny( błąd pominięcia )

Trafność =90,13% .

Czułość 7,1 %

Specyficzność – 99,36 %

Do modelu wrzucamy : wiek, children, cars, yearly income