NAI B3 pytaniaKontrolne

NAI [B.3], „praca własna” studenta

13 maja 2010

Drzewa decyzyjne (II) + algorytm k-NN

Binarne drzewa decyzyjne różnią się od drzew decyzyjnych następującymi

własnościami

składają się z węzłów mających dokładnie dwie krawędzie,

umożliwiają klasyfikację danych należących do jednej z dwóch klas,

mają w swojej budowie wyłącznie liście probabilistyczne,

zwykle są drzewami o większej wysokości.

Liść probabilistyczny to:

element decyzyjnego drzewa binarnego,

element drzewa decyzyjnego,

element, którego wykorzystanie jest możliwe tylko w przypadku

dwuklasowego klasyfikatora,

żadna z powyższych odpowiedzi.

Przycinanie drzewa oznacza:

wybranie n węzłów drzewa,

usunięcie tych gałęzi drzewa, które reprezentują najmniejszą liczbę

przykładów uczących,

usunięcie takich gałęzi, że błąd klasyfikacji nie wzrasta powyżej założonego

poziomu,

żadna z powyższych odpowiedzi.

Algorytm k-NN to:

algorytm k nienazwanych przykładów,

algorytm, który może być dwukrotnie gorszy od klasyfikatora Bayesa,

inna wersja algorytmu k średnich

żadna z powyższych odpowiedzi.

Algorytm k-NN wiąże się z:

obliczaniem średniej ważonej punktów reprezentujących dane uczące,

obliczaniem odległości między punktami reprezentującymi dane

treningowe,

obliczaniem mediany i macierzy kowariancji,

żadna z powyższych odpowiedzi.

NAI [B.3], „praca własna” studenta

13 maja 2010

Ćwiczenie 1

Poniżej przedstawiono dwa wiersze danych, które należy zaklasyfikować

wykorzystując poniższe drzewo decyzyjne. Jeśli klasyfikacja nie jest możliwa

uzasadnij: dlaczego? Na jakiej podstawie możliwa była klasyfikacja i do jakich klas

zostaną owe dwa wiersze zaklasyfikowane?

[16]

vhigh

unacc

0/1

low, med, high

[15]

low

acc

0/2

med, high, vhigh

[13]

2, 3, 4

unacc

0/7

5more

A5
[6]

small

unacc

0/1

med, big

acc

0/5