Klucze (kwerendy) do analizy sprzedaży algorytmem drzew decyzyjnych.
Przed przystąpieniem do budowy drzewa decyzyjnego utworzona została kwerenda wybierająca Klienci_BazaKwerend_Lata. Składa się ona z tabel Klienci, Czas, Sprzedaż, KlasyProduktow oraz Produkty, połączonych ze sobą relacjami w następujący sposób:
Kwerenda ta tworzy tabelę zawierającą informacje dotyczące wykształcenia, faktu posiadania domu, przychodu rocznego i wielkości zakupów dokonanych w danym roku przez klienta departamentu. Została ona wykorzystana do utworzenia tabeli Klienci_BazaKwerend, zawierającej informacje o średniej wartości dokonanego zakupu przez klienta o danym ID.
Kwerendy te stanowią bazę, która zostanie wykorzystana do tworzenia drzewa decyzyjnego dla departamentu.
Kolejne kroki algorytmu konstrukcji drzewa decyzyjnego.
Pierwszym krokiem w tworzeniu konstrukcji drzewa decyzyjnego będzie utworzenie kwerendy Klienci_Korzen oraz kwerend dla wszystkich kryteriów podziału (dochód, wykształcenie, fakt posiadania domu). Kwerendy te zostały utworzone na bazie kwerendy Klienci_BazaKwerend i zwracają one takie dane, jak: ilość klientów posiadających dom, określony dochód czy też określone wykształcenie, średnią wartość zakupów dokonanych przez określoną grupę klientów oraz wariancję zakupów dla każdego z wymienionych czynników. Kwerenda Klienci_Korzen zwraca ilość wszystkich klientów departamentu, średnią wartość zakupów przez nich dokonanych i wariancję tych zakupów.
Kolejnym krokiem będzie utworzenie kwerendy Klienci_KorzenS^2, opierającej się na kwerendach utworzonych dla wszystkich kryteriów podziału. Kwerenda ta zwraca wartości wariancji zakupów dla każdego z tych kryteriów i zapisana została w następujący sposób:
SELECT DISTINCTROW Sum([Klienci_Korzen_Wyksztalcenie_PonN_109].[S^2]*[Klienci_Korzen_Wyksztalcenie_PonN_109].[N])/Sum([Klienci_Korzen_Wyksztalcenie_PonN_109].[N]) AS [S^2 _wyksztalcenie], Sum([Klienci_Korzen_Dom_PonN_109].[S^2]*[Klienci_Korzen_Dom_PonN_109].[N])/Sum([Klienci_Korzen_Dom_PonN_109].[N]) AS [S^2 _Dom], Sum([Klienci_Korzen_Dochody_PonN_109].[S^2]*[Klienci_Korzen_Dochody_PonN_109].[N])/Sum([Klienci_Korzen_Dochody_PonN_109].[N]) AS [S^2 _Dochody]
FROM Klienci_Korzen_Wyksztalcenie_PonN_109, Klienci_Korzen_Dochody_PonN_109, Klienci_Korzen_Dom_PonN_109;
Na jej podstawie podjęta została decyzja, aby korzeń drzewa decyzyjnego podzielić ze względu na wykształcenie. Kwerendą wynikową jest tutaj Klienci_Korzen_Wyksztalcenie.
Aby wybrać kolejną kategorię podziału, utworzono kwerendy Klienci_Wyksztalcenie_Dochody oraz Klienci_Wyksztalcenie_Dom. Zostały one utworzone również na podstawie kwerendy Klienci_BazaKwerend. Zwracają one informacje dotyczące poziomu dochodów i faktu posiadania domu dla każdego ze stopni wykształcenia, ilości klientów posiadających dane wykształcenie i dany dochód oraz dom, średnią wartość dokonanych przez nich zakupów i wariancję tych zakupów. Na podstawie tych dwóch kwerend utworzona została kwerenda Klienci_Wyksztalcenie_S^2, dzięki której podjęta zostaje decyzja co do kolejnego kryterium podziału drzewa decyzyjnego – dochodów. Kwerendą wynikową dla tego podziału będzie Klenci_Wyksztalcenie_Dochody.
Ostatni podział drzewa decyzyjnego nastąpi według faktu posiadania domu. Kwerendą wynikową jest Klienci_Wyksztalcenie_Dochody_Dom, bazująca na kwerendzie Klienci_BazaKwerend, zawierająca informacje na temat ilości klientów posiadających dane wykształcenie, dany dochód i dom (lub brak domu), średnią wartość zakupów przez nich dokonanych i wariancję zakupów.
Struktura drzewa decyzyjnego i wnioski dla kierownictwa sklepu (departamentu).
Na podstawie drzewa decyzyjnego utworzonego za pomocą wyżej wymienionego algorytmu można zauważyć, że klienci przynoszący departamentowi największe przychody posiadają:
wykształcenie wyższe (bachelors degree), przychód roczny w wysokości od 50 000 $ do 70 000 $ i nie posiadają domu (choć w tej grupie zarówno ilość klientów, jak i średnia wartość zakupów między osobami posiadającymi dom, a nie posiadającymi domu są bardzo zbliżone),
wykształcenie średnie (high school degree), przychód roczny w wysokości od 30 000 $ do 50 000 $ i nie posiadają domu;
częściowe wykształcenie średnie (partial high school degree), przychód roczny w wysokości od 10 000 $ do 30 000 $ i posiadają dom.
Departament w kolejnych latach powinien więc skupiać się przede wszystkim na tych klientach i kierować swą kampanię marketingową głównie do nich, aby maksymalizować zyski ze sprzedaży swoich produktów.
Schemat drzewa decyzyjnego został zamieszczony na kolejnej stronie.
Korzeń | Wykształcenie | Klasa rocznych przychodów | Fakt posiadania domu |
---|