Przebieg procesu dyskretyzacji.
Zbiór danych IRIS
Dyskretyzacja z użyciem Naiwnego klasyfikatora Bayesa
Dyskretyzacja przez podział na określaną liczbę binów/przedziałów ? ( Discretize by binning)
Liczba binów |
ACC |
(+/-) |
WM_prec |
( +/-) |
WM_recall |
(+/-) |
5 |
93,33 |
5,96 |
93,94 |
5,86 |
93,33 |
5,96 |
10 |
94,67 |
5,81 |
95,28 |
5,56 |
94,67 |
5,81 |
15 |
96 |
6,11 |
96,39 |
5,83 |
96 |
6,11 |
20 |
92,67 |
7,57 |
93,49 |
7,18 |
92,67 |
7,57 |
25 |
92,67 |
6,29 |
93,55 |
5,95 |
92,67 |
6,29 |
Dyskretyzacja poprzez podział na przedziały/biny o jednakowym rozmiarze (Discretize by size)
Liczba binów |
ACC |
(+/-) |
WM_prec |
( +/-) |
WM_recall |
(+/-) |
5 |
42 |
5,21 |
29,92 |
7,35 |
42 |
5,21 |
10 |
68 |
7,77 |
57,29 |
15,34 |
68 |
7,77 |
15 |
40,67 |
9,17 |
23,56 |
8,83 |
40,67 |
9,17 |
20 |
34,67 |
2,67 |
14,18 |
4,69 |
34,67 |
2,67 |
25 |
33,33 |
0 |
13,05 |
1,83 |
33,33 |
0 |
Dyskretyzacja metodą równej częstości (Discretize by frequency)
Liczba binów |
ACC |
(+/-) |
WM_prec |
( +/-) |
WM_recall |
(+/-) |
5 |
44,67 |
6,7 |
36,81 |
9,93 |
44,67 |
6,7 |
Dyskretyzacja przez entropie (Discretize by entropy)
Liczba binów |
ACC |
(+/-) |
WM_prec |
( +/-) |
WM_recall |
(+/-) |
x |
66,67 |
5,16 |
58,37 |
15,37 |
66,67 |
5,16 |
Podsumowanie otrzymanych wyników
Dyskretyzacja z użyciem drzew decyzji
Dyskretyzacja przez podział na określaną liczbę przedziałów ( Discretize by binning)
Liczba binów |
ACC |
(+/-) |
WM_prec |
( +/-) |
WM_recall |
(+/-) |
Liczba liści |
5 |
36,67 |
6,83 |
18,64 |
14,04 |
36,67 |
6,83 |
7 |
10 |
37,33 |
4,42 |
26,32 |
16,13 |
37,33 |
4,42 |
13 |
15 |
35,33 |
3,06 |
17,68 |
11,13 |
35,33 |
3,06 |
13 |
20 |
33,33 |
0 |
11,11 |
0 |
33,33 |
0 |
1 |
25 |
33,33 |
0 |
11,11 |
0 |
33,33 |
0 |
1 |
Dyskretyzacja poprzez podział na przedziały/biny o jednakowym rozmiarze (Discretize by size)
Liczba binów |
ACC |
(+/-) |
WM_prec |
( +/-) |
WM_recall |
(+/-) |
Liczba liści |
5 |
33,33 |
0 |
11,59 |
0,39 |
33,33 |
0 |
16 |
10 |
33,33 |
0 |
11,27 |
0,32 |
33,33 |
0 |
10 |
15 |
33,33 |
0 |
11,11 |
0 |
33,33 |
0 |
13 |
20 |
33,33 |
0 |
11,11 |
0 |
33,33 |
0 |
14 |
25 |
33,33 |
0 |
11,11 |
0 |
33,33 |
0 |
14 |
Dyskretyzacja metodą równej częstości (Discretize by frequency)
Liczba binów |
ACC |
(+/-) |
WM_prec |
( +/-) |
WM_recall |
(+/-) |
Liczba liści |
5 |
89,33 |
7,42 |
90,65 |
6,87 |
89,33 |
7,42 |
13 |
Dyskretyzacja przez entropie (Discretize by entropy)
Liczba binów |
ACC |
(+/-) |
WM_prec |
( +/-) |
WM_recall |
(+/-) |
Liczba liści |
x |
33,33 |
0 |
11,11 |
0 |
33,33 |
0 |
14 |
Podsumowanie otrzymanych wyników
Zbiór danych WBC
Dyskretyzacja z użyciem Naiwnego klasyfikatora Bayesa
Dyskretyzacja przez podział na określaną liczbę przedziałów ( Discretize by binning)
Liczba binów |
ACC |
(+/-) |
WM_prec |
( +/-) |
WM_recall |
(+/-) |
5 |
33,19 |
1,4 |
16,81 |
0,48 |
48,16 |
2,32 |
10 |
76,97 |
6,17 |
80,31 |
3,2 |
82,43 |
4,7 |
15 |
86,7 |
4,82 |
86,37 |
3,81 |
89,75 |
3,75 |
20 |
59,38 |
4,51 |
72,31 |
1,63 |
68,7 |
3,33 |
25 |
59,23 |
3,62 |
71,15 |
2,22 |
68,18 |
2,87 |
Dyskretyzacja poprzez podział na przedziały/biny o jednakowym rozmiarze (Discretize by size)
Liczba binów |
ACC |
(+/-) |
WM_prec |
( +/-) |
WM_recall |
(+/-) |
5 |
29,62 |
33,33 |
20,61 |
9,14 |
42,7 |
4,79 |
10 |
54,51 |
4,71 |
68,86 |
4,61 |
64,49 |
4,38 |
15 |
75,39 |
4,53 |
79 |
1,99 |
80,92 |
3,2 |
20 |
72,25 |
2,94 |
77,59 |
1,43 |
78,73 |
2,27 |
25 |
65,95 |
3,44 |
74,97 |
1,69 |
73,92 |
2,87 |
Dyskretyzacja metodą równej częstości (Discretize by frequency)
Proces dyskretyzacji tą metodą niemożliwy do przeprowadzenia. // zbyt dużo takich samych wartości
Dyskretyzacja przez entropie (Discretize by entropy)
Liczba binów |
ACC |
(+/-) |
WM_prec |
( +/-) |
WM_recall |
(+/-) |
x |
97,14 |
2,3 |
96,51 |
2,8 |
97,42 |
2,1 |
Podsumowanie wyników
Dyskretyzacja z użyciem drzew decyzji
Dyskretyzacja przez podział na określaną liczbę przedziałów ( Discretize by binning)
Liczba binów |
ACC |
(+/-) |
WM_prec |
( +/-) |
WM_recall |
(+/-) |
Liczba liści |
5 |
20,02 |
13,9 |
19,38 |
11,89 |
20,64 |
11,45 |
34 |
10 |
72,68 |
5,61 |
72,11 |
11,01 |
64,74 |
6,54 |
19 |
15 |
69,95 |
3,8 |
70,77 |
12,45 |
58,61 |
5,11 |
19 |
20 |
69,67 |
3,62 |
74,93 |
16,12 |
56,42 |
5,33 |
19 |
25 |
68,53 |
3,53 |
67,05 |
19,55 |
55 |
4,79 |
19 |
Dyskretyzacja poprzez podział na przedziały/biny o jednakowym rozmiarze (Discretize by size)
Liczba binów |
ACC |
(+/-) |
WM_prec |
( +/-) |
WM_recall |
(+/-) |
Liczba liści |
5 |
63,39 |
3,88 |
50,99 |
12,83 |
50,38 |
4,23 |
30 |
10 |
65,66 |
3,96 |
57,6 |
11,18 |
53,53 |
5,04 |
35 |
15 |
68,1 |
3,14 |
68,79 |
10,82 |
55,9 |
2,91 |
33 |
20 |
68,39 |
3,12 |
67,18 |
10,26 |
56,52 |
4,2 |
37 |
25 |
69,96 |
3,15 |
72,85 |
9,2 |
58,47 |
4,39 |
30 |
Dyskretyzacja metodą równej częstości (Discretize by frequency)
Proces dyskretyzacji tą metodą niemożliwy do przeprowadzenia.
Dyskretyzacja przez entropie (Discretize by entropy)
Liczba binów |
ACC |
(+/-) |
WM_prec |
( +/-) |
WM_recall |
(+/-) |
Liczba liści |
x |
25,34 |
15,8 |
19,45 |
8,44 |
19,55 |
11,91 |
34 |
Podsumowanie wyników
Zbiór danych ionosphere
Dyskretyzacja z użyciem Naiwnego klasyfikatora Bayesa
Dyskretyzacja przez podział na określaną liczbę przedziałów ( Discretize by binning)
Proces dyskretyzacji tą metodą nie był możliwy
Dyskretyzacja poprzez podział na przedziały/biny o jednakowym rozmiarze (Discretize by size)
Proces dyskretyzacji tą metodą nie był możliwy -> przekonwertuj label na wartość nominalną -> wartość nominalna nie obsługiwana przez bayesa.
Dyskretyzacja metodą równej częstości (Discretize by frequency)
Liczba binów |
ACC |
(+/-) |
WM_prec |
( +/-) |
WM_recall |
(+/-) |
5 |
88,89 |
6,05 |
88,44 |
6,7 |
88,41 |
5,74 |
Dyskretyzacja przez entropie (Discretize by entropy)
Liczba binów |
ACC |
(+/-) |
WM_prec |
( +/-) |
WM_recall |
(+/-) |
x |
89,46 |
4,78 |
89,35 |
5,05 |
87,85 |
5,64 |
Podsumowanie wyników
Dyskretyzacja z użyciem drzew decyzji
Dyskretyzacja przez podział na określaną liczbę przedziałów ( Discretize by binning)
Liczba binów |
ACC |
(+/-) |
WM_prec |
( +/-) |
WM_recall |
(+/-) |
Liczba liści |
5 |
74,94 |
5,64 |
86,08 |
2,3 |
65,1 |
7,72 |
26 |
10 |
74,94 |
5,64 |
86,08 |
2,3 |
65,1 |
7,72 |
34 |
15 |
74,94 |
5,64 |
86,08 |
2,3 |
65,1 |
7,75 |
20 |
20 |
74,94 |
5,64 |
86,08 |
2,3 |
65,1 |
7,75 |
20 |
25 |
74,94 |
5,64 |
86,08 |
2,3 |
65,1 |
7,75 |
28 |
Dyskretyzacja poprzez podział na przedziały/biny o jednakowym rozmiarze (Discretize by size)
Liczba binów |
ACC |
(+/-) |
WM_prec |
( +/-) |
WM_recall |
(+/-) |
Liczba liści |
5 |
81,2 |
8,1 |
88,69 |
3,44 |
74 |
11,34 |
27 |
10 |
75,49 |
5,62 |
85,668 |
2,79 |
66,03 |
7,8 |
30 |
15 |
74,94 |
5,64 |
86,08 |
2,3 |
65,1 |
7,72 |
29 |
20 |
74,94 |
5,64 |
86,08 |
2,3 |
65,1 |
7,72 |
16 |
25 |
74,94 |
5,64 |
86,08 |
2,3 |
65,1 |
7,72 |
19 |
Dyskretyzacja metodą równej częstości (Discretize by frequency)
Liczba binów |
ACC |
(+/-) |
WM_prec |
( +/-) |
WM_recall |
(+/-) |
Liczba liści |
5 |
78,34 |
10,87 |
79,04 |
12,35 |
74,33 |
11,23 |
36 |
Dyskretyzacja przez entropie (Discretize by entropy)
Liczba binów |
ACC |
(+/-) |
WM_prec |
( +/-) |
WM_recall |
(+/-) |
Liczba liści |
x |
71,79 |
2,98 |
84,75 |
1,29 |
60,77 |
3,26 |
22 |
Podsumowanie wyników
Zbiór danych z procesu wytapiania stali
Dyskretyzacja z użyciem Naiwnego klasyfikatora Bayesa
Dyskretyzacja przez podział na określaną liczbę przedziałów ( Discretize by binning)
Liczba binów |
ACC |
(+/-) |
WM_prec |
( +/-) |
WM_recall |
(+/-) |
5 |
61,94 |
0,93 |
41 |
12,61 |
51,38 |
2,87 |
10 |
59,28 |
5,28 |
44,64 |
16,81 |
50,13 |
2,41 |
15 |
59,8 |
3,52 |
36,17 |
10,1 |
50,23 |
3,76 |
20 |
48,32 |
11,47 |
52,01 |
16,86 |
51,62 |
3,73 |
25 |
57,14 |
7,85 |
56,04 |
10,96 |
52,72 |
2,16 |
Dyskretyzacja poprzez podział na przedziały/biny o jednakowym rozmiarze (Discretize by size)
Liczba binów |
ACC |
(+/-) |
WM_prec |
( +/-) |
WM_recall |
(+/-) |
5 |
61,94 |
0,66 |
30,97 |
0,33 |
50 |
0 |
10 |
61,94 |
0,66 |
30,97 |
0,33 |
50 |
0 |
15 |
61,94 |
0,66 |
30,97 |
0,33 |
50 |
0 |
20 |
61,94 |
0,66 |
30,97 |
0,33 |
50 |
0 |
25 |
61,94 |
0,66 |
30,97 |
0,33 |
50 |
0 |
Dyskretyzacja metodą równej częstości (Discretize by frequency)
Liczba binów |
ACC |
(+/-) |
WM_prec |
( +/-) |
WM_recall |
(+/-) |
5 |
61,94 |
0,66 |
30,97 |
0,33 |
50 |
0 |
Dyskretyzacja przez entropie (Discretize by entropy)
Liczba binów |
ACC |
(+/-) |
WM_prec |
( +/-) |
WM_recall |
(+/-) |
x |
85,55 |
3,33 |
85,69 |
2,53 |
87,52 |
2,61 |
Podsumowanie wyników
Dyskretyzacja z użyciem drzew decyzji
Dyskretyzacja przez podział na określaną liczbę przedziałów ( Discretize by binning)
Liczba binów |
ACC |
(+/-) |
WM_prec |
( +/-) |
WM_recall |
(+/-) |
Liczba liści |
5 |
81,15 |
4,37 |
80,75 |
4,49 |
81,97 |
4,2 |
40 |
10 |
78,64 |
7,79 |
77,73 |
16,27 |
74,25 |
11,31 |
17 |
15 |
73,62 |
8,52 |
66,78 |
23,84 |
67,27 |
12,49 |
13 |
20 |
72,99 |
7,45 |
66,12 |
22,94 |
66,27 |
11,82 |
19 |
25 |
66,19 |
9,47 |
41,32 |
21,16 |
56,52 |
13,61 |
1 |
|
|
|
|
|
|
|
|
Dyskretyzacja poprzez podział na przedziały/biny o jednakowym rozmiarze (Discretize by size)
Liczba binów |
ACC |
(+/-) |
WM_prec |
( +/-) |
WM_recall |
(+/-) |
Liczba liści |
5 |
61,94 |
0,66 |
30,97 |
0,33 |
50 |
0 |
62 |
10 |
61,94 |
0,66 |
30,97 |
0,33 |
50 |
0 |
63 |
15 |
61,94 |
0,66 |
30,97 |
0,33 |
50 |
0 |
71 |
20 |
61,94 |
0,66 |
30,97 |
0,33 |
50 |
0 |
80 |
25 |
61,94 |
0,66 |
30,97 |
0,33 |
50 |
0 |
26 |
Dyskretyzacja metodą równej częstości (Discretize by frequency)
Liczba binów |
ACC |
(+/-) |
WM_prec |
( +/-) |
WM_recall |
(+/-) |
Liczba liści |
5 |
61,94 |
0,66 |
30,97 |
0,33 |
50 |
0 |
133 |
Dyskretyzacja przez entropie (Discretize by entropy)
Liczba binów |
ACC |
(+/-) |
WM_prec |
( +/-) |
WM_recall |
(+/-) |
Liczba liści |
x |
61,94 |
0,66 |
30,97 |
0,33 |
50 |
0 |
25 |
Podsumowanie wyników