Przebieg procesu dyskretyzacji.



  1. Zbiór danych IRIS

    1. Dyskretyzacja z użyciem Naiwnego klasyfikatora Bayesa



  1. Dyskretyzacja przez podział na określaną liczbę binów/przedziałów ? ( Discretize by binning)





Liczba binów

ACC

(+/-)

WM_prec

( +/-)

WM_recall

(+/-)

5

93,33

5,96

93,94

5,86

93,33

5,96

10

94,67

5,81

95,28

5,56

94,67

5,81

15

96

6,11

96,39

5,83

96

6,11

20

92,67

7,57

93,49

7,18

92,67

7,57

25

92,67

6,29

93,55

5,95

92,67

6,29





  1. Dyskretyzacja poprzez podział na przedziały/biny o jednakowym rozmiarze (Discretize by size)

Liczba binów

ACC

(+/-)

WM_prec

( +/-)

WM_recall

(+/-)

5

42

5,21

29,92

7,35

42

5,21

10

68

7,77

57,29

15,34

68

7,77

15

40,67

9,17

23,56

8,83

40,67

9,17

20

34,67

2,67

14,18

4,69

34,67

2,67

25

33,33

0

13,05

1,83

33,33

0



  1. Dyskretyzacja metodą równej częstości (Discretize by frequency)

Liczba binów

ACC

(+/-)

WM_prec

( +/-)

WM_recall

(+/-)

5

44,67

6,7

36,81

9,93

44,67

6,7



  1. Dyskretyzacja przez entropie (Discretize by entropy)



Liczba binów

ACC

(+/-)

WM_prec

( +/-)

WM_recall

(+/-)

x

66,67

5,16

58,37

15,37

66,67

5,16





  1. Podsumowanie otrzymanych wyników



    1. Dyskretyzacja z użyciem drzew decyzji



  1. Dyskretyzacja przez podział na określaną liczbę przedziałów ( Discretize by binning)

Liczba binów

ACC

(+/-)

WM_prec

( +/-)

WM_recall

(+/-)

Liczba liści

5

36,67

6,83

18,64

14,04

36,67

6,83

7

10

37,33

4,42

26,32

16,13

37,33

4,42

13

15

35,33

3,06

17,68

11,13

35,33

3,06

13

20

33,33

0

11,11

0

33,33

0

1

25

33,33

0

11,11

0

33,33

0

1



  1. Dyskretyzacja poprzez podział na przedziały/biny o jednakowym rozmiarze (Discretize by size)

Liczba binów

ACC

(+/-)

WM_prec

( +/-)

WM_recall

(+/-)

Liczba liści

5

33,33

0

11,59

0,39

33,33

0

16

10

33,33

0

11,27

0,32

33,33

0

10

15

33,33

0

11,11

0

33,33

0

13

20

33,33

0

11,11

0

33,33

0

14

25

33,33

0

11,11

0

33,33

0

14



  1. Dyskretyzacja metodą równej częstości (Discretize by frequency)

Liczba binów

ACC

(+/-)

WM_prec

( +/-)

WM_recall

(+/-)

Liczba liści

5

89,33

7,42

90,65

6,87

89,33

7,42

13



  1. Dyskretyzacja przez entropie (Discretize by entropy)

Liczba binów

ACC

(+/-)

WM_prec

( +/-)

WM_recall

(+/-)

Liczba liści

x

33,33

0

11,11

0

33,33

0

14



  1. Podsumowanie otrzymanych wyników



  1. Zbiór danych WBC

    1. Dyskretyzacja z użyciem Naiwnego klasyfikatora Bayesa





  1. Dyskretyzacja przez podział na określaną liczbę przedziałów ( Discretize by binning)

Liczba binów

ACC

(+/-)

WM_prec

( +/-)

WM_recall

(+/-)

5

33,19

1,4

16,81

0,48

48,16

2,32

10

76,97

6,17

80,31

3,2

82,43

4,7

15

86,7

4,82

86,37

3,81

89,75

3,75

20

59,38

4,51

72,31

1,63

68,7

3,33

25

59,23

3,62

71,15

2,22

68,18

2,87



  1. Dyskretyzacja poprzez podział na przedziały/biny o jednakowym rozmiarze (Discretize by size)

Liczba binów

ACC

(+/-)

WM_prec

( +/-)

WM_recall

(+/-)

5

29,62

33,33

20,61

9,14

42,7

4,79

10

54,51

4,71

68,86

4,61

64,49

4,38

15

75,39

4,53

79

1,99

80,92

3,2

20

72,25

2,94

77,59

1,43

78,73

2,27

25

65,95

3,44

74,97

1,69

73,92

2,87



  1. Dyskretyzacja metodą równej częstości (Discretize by frequency)



Proces dyskretyzacji tą metodą niemożliwy do przeprowadzenia. // zbyt dużo takich samych wartości



  1. Dyskretyzacja przez entropie (Discretize by entropy)



Liczba binów

ACC

(+/-)

WM_prec

( +/-)

WM_recall

(+/-)

x

97,14

2,3

96,51

2,8

97,42

2,1



  1. Podsumowanie wyników







    1. Dyskretyzacja z użyciem drzew decyzji

  1. Dyskretyzacja przez podział na określaną liczbę przedziałów ( Discretize by binning)

Liczba binów

ACC

(+/-)

WM_prec

( +/-)

WM_recall

(+/-)

Liczba liści

5

20,02

13,9

19,38

11,89

20,64

11,45

34

10

72,68

5,61

72,11

11,01

64,74

6,54

19

15

69,95

3,8

70,77

12,45

58,61

5,11

19

20

69,67

3,62

74,93

16,12

56,42

5,33

19

25

68,53

3,53

67,05

19,55

55

4,79

19





  1. Dyskretyzacja poprzez podział na przedziały/biny o jednakowym rozmiarze (Discretize by size)



Liczba binów

ACC

(+/-)

WM_prec

( +/-)

WM_recall

(+/-)

Liczba liści

5

63,39

3,88

50,99

12,83

50,38

4,23

30

10

65,66

3,96

57,6

11,18

53,53

5,04

35

15

68,1

3,14

68,79

10,82

55,9

2,91

33

20

68,39

3,12

67,18

10,26

56,52

4,2

37

25

69,96

3,15

72,85

9,2

58,47

4,39

30



  1. Dyskretyzacja metodą równej częstości (Discretize by frequency)



Proces dyskretyzacji tą metodą niemożliwy do przeprowadzenia.

  1. Dyskretyzacja przez entropie (Discretize by entropy)



Liczba binów

ACC

(+/-)

WM_prec

( +/-)

WM_recall

(+/-)

Liczba liści

x

25,34

15,8

19,45

8,44

19,55

11,91

34



  1. Podsumowanie wyników



  1. Zbiór danych ionosphere

    1. Dyskretyzacja z użyciem Naiwnego klasyfikatora Bayesa



  1. Dyskretyzacja przez podział na określaną liczbę przedziałów ( Discretize by binning)

Proces dyskretyzacji tą metodą nie był możliwy

  1. Dyskretyzacja poprzez podział na przedziały/biny o jednakowym rozmiarze (Discretize by size)

Proces dyskretyzacji tą metodą nie był możliwy -> przekonwertuj label na wartość nominalną -> wartość nominalna nie obsługiwana przez bayesa.

  1. Dyskretyzacja metodą równej częstości (Discretize by frequency)

Liczba binów

ACC

(+/-)

WM_prec

( +/-)

WM_recall

(+/-)

5

88,89

6,05

88,44

6,7

88,41

5,74



  1. Dyskretyzacja przez entropie (Discretize by entropy)

Liczba binów

ACC

(+/-)

WM_prec

( +/-)

WM_recall

(+/-)

x

89,46

4,78

89,35

5,05

87,85

5,64



  1. Podsumowanie wyników

    1. Dyskretyzacja z użyciem drzew decyzji

  1. Dyskretyzacja przez podział na określaną liczbę przedziałów ( Discretize by binning)

Liczba binów

ACC

(+/-)

WM_prec

( +/-)

WM_recall

(+/-)

Liczba liści

5

74,94

5,64

86,08

2,3

65,1

7,72

26

10

74,94

5,64

86,08

2,3

65,1

7,72

34

15

74,94

5,64

86,08

2,3

65,1

7,75

20

20

74,94

5,64

86,08

2,3

65,1

7,75

20

25

74,94

5,64

86,08

2,3

65,1

7,75

28



  1. Dyskretyzacja poprzez podział na przedziały/biny o jednakowym rozmiarze (Discretize by size)

Liczba binów

ACC

(+/-)

WM_prec

( +/-)

WM_recall

(+/-)

Liczba liści

5

81,2

8,1

88,69

3,44

74

11,34

27

10

75,49

5,62

85,668

2,79

66,03

7,8

30

15

74,94

5,64

86,08

2,3

65,1

7,72

29

20

74,94

5,64

86,08

2,3

65,1

7,72

16

25

74,94

5,64

86,08

2,3

65,1

7,72

19



  1. Dyskretyzacja metodą równej częstości (Discretize by frequency)

Liczba binów

ACC

(+/-)

WM_prec

( +/-)

WM_recall

(+/-)

Liczba liści

5

78,34

10,87

79,04

12,35

74,33

11,23

36



  1. Dyskretyzacja przez entropie (Discretize by entropy)

Liczba binów

ACC

(+/-)

WM_prec

( +/-)

WM_recall

(+/-)

Liczba liści

x

71,79

2,98

84,75

1,29

60,77

3,26

22



  1. Podsumowanie wyników





  1. Zbiór danych z procesu wytapiania stali

    1. Dyskretyzacja z użyciem Naiwnego klasyfikatora Bayesa

  1. Dyskretyzacja przez podział na określaną liczbę przedziałów ( Discretize by binning)

    Liczba binów

    ACC

    (+/-)

    WM_prec

    ( +/-)

    WM_recall

    (+/-)

    5

    61,94

    0,93

    41

    12,61

    51,38

    2,87

    10

    59,28

    5,28

    44,64

    16,81

    50,13

    2,41

    15

    59,8

    3,52

    36,17

    10,1

    50,23

    3,76

    20

    48,32

    11,47

    52,01

    16,86

    51,62

    3,73

    25

    57,14

    7,85

    56,04

    10,96

    52,72

    2,16

  2. Dyskretyzacja poprzez podział na przedziały/biny o jednakowym rozmiarze (Discretize by size)

Liczba binów

ACC

(+/-)

WM_prec

( +/-)

WM_recall

(+/-)

5

61,94

0,66

30,97

0,33

50

0

10

61,94

0,66

30,97

0,33

50

0

15

61,94

0,66

30,97

0,33

50

0

20

61,94

0,66

30,97

0,33

50

0

25

61,94

0,66

30,97

0,33

50

0



  1. Dyskretyzacja metodą równej częstości (Discretize by frequency)

Liczba binów

ACC

(+/-)

WM_prec

( +/-)

WM_recall

(+/-)

5

61,94

0,66

30,97

0,33

50

0



  1. Dyskretyzacja przez entropie (Discretize by entropy)

Liczba binów

ACC

(+/-)

WM_prec

( +/-)

WM_recall

(+/-)

x

85,55

3,33

85,69

2,53

87,52

2,61



  1. Podsumowanie wyników





    1. Dyskretyzacja z użyciem drzew decyzji

  1. Dyskretyzacja przez podział na określaną liczbę przedziałów ( Discretize by binning)

Liczba binów

ACC

(+/-)

WM_prec

( +/-)

WM_recall

(+/-)

Liczba liści

5

81,15

4,37

80,75

4,49

81,97

4,2

40

10

78,64

7,79

77,73

16,27

74,25

11,31

17

15

73,62

8,52

66,78

23,84

67,27

12,49

13

20

72,99

7,45

66,12

22,94

66,27

11,82

19

25

66,19

9,47

41,32

21,16

56,52

13,61

1











  1. Dyskretyzacja poprzez podział na przedziały/biny o jednakowym rozmiarze (Discretize by size)

Liczba binów

ACC

(+/-)

WM_prec

( +/-)

WM_recall

(+/-)

Liczba liści

5

61,94

0,66

30,97

0,33

50

0

62

10

61,94

0,66

30,97

0,33

50

0

63

15

61,94

0,66

30,97

0,33

50

0

71

20

61,94

0,66

30,97

0,33

50

0

80

25

61,94

0,66

30,97

0,33

50

0

26



  1. Dyskretyzacja metodą równej częstości (Discretize by frequency)

Liczba binów

ACC

(+/-)

WM_prec

( +/-)

WM_recall

(+/-)

Liczba liści

5

61,94

0,66

30,97

0,33

50

0

133



  1. Dyskretyzacja przez entropie (Discretize by entropy)

Liczba binów

ACC

(+/-)

WM_prec

( +/-)

WM_recall

(+/-)

Liczba liści

x

61,94

0,66

30,97

0,33

50

0

25



  1. Podsumowanie wyników