6218157022

6218157022



informacji wynikający z zastosowania atrybutu a do zbudowania testu dzielącego zbiór przykładów uczących S jest zdefiniowany jako różnica:

Gain{S, a) = Ent(S) — Ent(S\a).

3.1 Przykład tworzenia drzewa

Załóżmy, że chcemy klasyfikować klientów sklepu elektronicznego pod względem tego czy kupią komputer czy nie. Elementy tego zbioru zestawiono w tabeli 2.

Tablica 2: Zbiór przykładów uczących opisujących grupę klientów sklepu elek-t ronicznego_

lp

Dochody

Student

Płeć

Kupuje komputer

1

średnie

tak

mężczyzna

tak

2

średnie

nie

kobieta

nie

3

wysokie

tak

kobieta

tak

4

niskie

tak

mężczyzna

nie

5

niskie

tak

kobieta

nie

6

średnie

tak

kobieta

tak

7

niskie

nie

kobieta

nie

8

średnie

nie

mężczyzna

nie

Wśród przykładów występuje binarna klasyfikacja. W związku z tym miara entropii dla zbioru S wyraża się wzorem:

Ent(S) = ~PTak 1§2 PTak ~ PNie lg2 PNie

Zbiór 8 przykładów składa się z 3 przykładów decyzji Tak i 5 na decyzję Nie. Odpowiednie prawdopodobieństwa są równe ptak = 3/8 oraz pnie = 5/8. Wartość entropii związanej z binarną klasyfikacją rozważanego zbioru przykładów jest następująca:

Ent(S) = -(3/8) lg2(3/8) - (5/8) lg2(5/8) = 0.531 + 0.424 = 0.955

. Jeśli wybierzemy atrybut dochody do zbudowania korzenia drzewa, a ma on 3 wartości: {niskie,rednie,wysokie}.

Pierwszy podzbiór Sn^s^e (4,5,7} zawiera 3 przykłady, które należą do klasy decyzyjnej Nie.

Drugi podzbiór Sgre^n{e — {1,2,6,8} zawiera po 2 przykłady z obu klas, podczas, gdy podzbiór SWySOkie = {3} złożony jest z jednego przykłady z klasy Tak.

Wartość entropii warunkowej ze względu na ten atrybut jest następująca: Ent(S\dochody) = § * Ent(Sniskie) + | * Ent{Sśrednie) + | * Ent.(SwysoUe) = S*(-0łlog20-l*log2 l)+f(-|*log2 |-l*log2 §)+§*(—0*log20—l*log2 1) = 0+ 0.5 + 0 = 0.5 Przyrost informacji:

GainInformation(S, dochody) = Ent(S) — Ent(S\dochody) = 0.955 — 0.5 = 0.455.

Wartości miar przyrostu informacji wynikających z zastosowania pozostałych

5



Wyszukiwarka

Podobne podstrony:
fia5 Baterie ogniw Przeczytaj poniżej umieszczoną informację o ogniwach i zastosuj ją do dalszych p
3 Ważne aspekty budowy drzewa Zasadniczym problemem jest wybór właściwego atrybutu do zbudowania cał
Image331 parator 85. Do zbudowania komparatora 3-poziomowego 44-bitowych liczb dwójkowych należy zat
współudział w realizacji obowiązków wynikających z ustawy o dostępie do informacji publicznej;24 Do
img295 3.    Ćwiczenia werbalne. Zastosowanie techniki ..Usta atrybutów” do wyróżnian
200 201 aooo Rys. 5-85. Zastosowanie sumatora do dodawania i odejmowania taki można zbudować jaszcze
Do zbierania i przetwarzania informacji o wynikach dziennej produkcji odlewni, potrzebny jest komput
large83673099 1. INFORMACJE OGÓLNE Zastosowanie kombajnu „Bizon-Super” do zbioru zbóż daje wiele ko
200 201 200 O Rya. 5.85. Zastosowanie sumatora do dodawania i odejmowania taki można zbudować jeszcz
współudział w realizacji obowiązków wynikających z ustawy o dostępie do informacji publicznej;24 Do
Wszechnica Popołudniowa: Tendencje w rozwoju informatyki i jej zastosowań Od abaków do maszyny
techniczny przygotowanie stanowisk Wytyczne do wykonania testu praktycznego SESJA MAJ-CZERWIEC 201

więcej podobnych podstron