POLITECHNIKA ŚWIĘTOKRZYSKA W KIELCACH |
---|
SYSTEMY INTELIGENTNE 2 |
Laboratorium Nr. 4 |
Wstęp
Celem zajęć było zapoznanie się z programem DeTreex 4.0 przy pomocy, którego przeprowadziliśmy proces konstrukcji drzew decyzyjnych dla danych liniowo separowanych
oraz liniowo nieseparowanych.
Dane z laboratorium 1
Dane liniowo separowane:
Dane Uczące Dane Testujące
drzewo decyzyjne Zbiór reguł optymalnego drzewa
Min. liczba przykładów tworzących liść drzewa | Przycinanie drzewa decyzyjnego | PPBS-DU [%] | PPBS-DT [%] | RD (liczba liści (reguł)) | PPDDU [%] | PPDDT[%] |
1 | 0 | 0 | 3 | 100 | 100 | |
10 | 0 | 0 | 3 | 100 | 100 | |
20 | 0 | 0 | 3 | 100 | 100 | |
30 | 0 | 0 | 3 | 100 | 100 | |
40 | 0 | 0 | 3 | 100 | 100 | |
45 | 33.33 | 33.33 | 2 | 33.33 | 66.66 |
Dane z laboratorium 2
Dane liniowo nieseparowane:
Dane Uczące Dane Testujące
Drzewo maksymalne
Zbiór reguł decyzyjnych dla drzewa maksymalnego
Min. liczba przykładów tworzących liść drzewa | Przycinanie drzewa decyzyjnego | PPBS-DU [%] | PPBS-DT [%] | RD (liczba liści (reguł)) | PPDDU [%] | PPDDT[%] |
1 | 0 | 0 | 7 | 100 | 100 | |
5 | 0 | 0 | 7 | 100 | 100 | |
10 | 12.50 | 13.33 | 4 | 87.5 | 86.67 | |
15 | 12.50 | 16.67 | 5 | 87.5 | 83.33 | |
20 | 15.83 | 15.56 | 4 | 84.17 | 84.44 | |
25 | 17.50 | 37.78 | 3 | 82.5 | 62.22 | |
30 | 37.50 | 40.00 | 2 | 62.5 | 60 | |
35 | 40.83 | 40.00 | 2 | 59.17 | 60 | |
40 | 40.83 | 40.00 | 2 | 58.17 | 60 |
Dane z laboratorium 3
Obrazy Idealne:
drzewo decyzyjne Zbiór reguł optymalnego drzewa
Min. liczba przykładów tworzących liść drzewa | Przycinanie drzewa decyzyjnego | PPBS-DU [%] | PPBS-DT [%] | RD (liczba liści (reguł)) | PPDDU [%] | PPDDT[%] |
1 | 0 | 0 | 5 | 0 | 100 | |
5 | 0 | 0 | 5 | 0 | 100 | |
10 | 0 | 0 | 5 | 0 | 100 | |
11 | 0 | 40.00 | 3 | 0 | 60.00 | |
12 | 0 | 40.00 | 3 | 0 | 60.00 | |
13 | 0 | 40.00 | 3 | 0 | 60.00 | |
14 | 0 | 40.00 | 3 | 0 | 60.00 | |
15 | 0 | 60.00 | 2 | 0 | 40.00 | |
16 | 0 | 60.00 | 2 | 0 | 40.00 |
Wnioski
Dla danych liniowo separowanych optymalne drzewo uzyskaliśmy dla domyślnych
ustawień tzn. parametr 1 ustawiony był na 1.
Natomiast dla danych liniowo nieseparowanych musiałem stopniowo zwiększać ilość przykładów wymaganych do stworzenia liścia. Niestety w raz z zwiększaniem parametru 1 sukcesywnie zmniejszała się liczba liści ale jednocześnie zmniejszała się skuteczność poprawnych decyzji zarówno dla danych uczących jak i dla danych testowych.