metody selekcji cech


Metody selekcji cech
A po co to
pðCzÄ™sto mamy do dyspozycji dane w
postaci zbioru cech lecz nie wiemy które z
tych cech będą dla nas istotne.
pðW zbiorze cech mogÄ… wystÄ…pić cechy
redundantne  niosÄ…ce identycznÄ…
informację jak istniejące już cechy
pðCel  wybranie ze zbioru dostÄ™pnych cech
tych które nas  interesują
Interesujące cechy to takie, których kombinacja
pozwala na możliwie najlepszą
klasyfikacjÄ™ lub regresjÄ™!
8
7
6
Przykład z danymi iris
5
4
3
2
6
4
2
2
1
0
5 6 7 8 2 3 4 2 4 6 0 1 2
Podział metod selekcji cech
pðZe wzglÄ™du na charakter problemu
Nadzorowane
Nienadzorowame
pðZe wzglÄ™du na relacjÄ™ z innymi
algorytmami nadrzędnymi
Filtry
Wrappery (opakowane)
Frapery  kombinacja filtrów i Wrapperów
Metody wbudowane
Filtry cech
pðFiltry cech to taka grupa metod, która
autonomicznie podejmuje decyzję, które z
cech będą istotne dla pózniejszego procesu
uczenia. Decyzja ta podejmowana jest na
podstawie niezależnego od klasyfikatora
współczynnika takiego jak  informacja
wzajemna lub  dywergencja Kullbacka
Leiblera
Pozyskanie informacji Ostateczny model
Filtr cech Ocena modelu Model końcowy
(danych) decyzyjny
Informacja wzajemna i
dywergencja Kullbacka Leiblera
pðInformacja wzajemna (ang. Mutual
Information)
Dla zmiennych o rozkładach dyskretnych p(x) i
q(x)
Dla zmiennych ciągłych o rozkładach p(x) i q(x)
pðDywergencja Kullbacka Leiblera (ang.
Kullback Leibler divergence)
Dla zmiennych o rozkładach dyskretnych p(x) i
q(x)
Dla zmiennych ciągłych o rozkładach p(x) i q(x)
Metody opakowane
pðMetody opakowane to grupa metod w której
występuje sprzężenie zwrotne pomiędzy
elementem decyzyjnym (np.. SieciÄ…
neuronowÄ…) a algorytmem selekcji cech.
Dzięki temu podzbiór cech optymalizowany
jest pod kÄ…tem konkretnego klasyfikatora
Informacja zwrotna o jakości
wybranych cech
Pozyskanie informacji Ostateczny model
Metoda opakowana Ocena modelu Model końcowy
(danych) decyzyjny
Metody filtrów
pð Zalety
Uniwersalność  uzyskany podzbiór cech jest niezależny
od klasyfikatora, dzięki czemu teoretycznie możemy
użyć dowolny klasyfikator
W problemach medycznych jak analiza DNA zależy nam
na znalezieniu genów odpowiedzialnych za pewne cechy,
nie chcemy by wynik był zależny od użytej sieci
neuronowej
Szybkość  jesteśmy niezależni od metody
klasyfikacyjnej dzięki czemu złożoność obliczeniowa nie
wpływa na szybkość i wydajność tego algorytmu
Uniwersalność - algorytm tego typu może być
wykorzystany do każdego problemu klasyfikacyjnego
pð Wady
Konieczność estymacji wielowymiarowych rozkładów
prawdopodobieństwa
Metody opakowane
pðZalety
Wybrany podzbiór cech jest dostosowany do
wymagań lub charakteru algorytmu
decyzyjnego (sieci neuronowej itp)
Większa dokładność niż metod filtrów
Uniwersalność - algorytm tego typu może być
wykorzystany do każdego problemu
klasyfikacyjnego
pðWady
Często większa złożoność obliczeniowa
Kombinacje filtrów i metod
opakowanych
pðWykorzystuje siÄ™ algorytm filtrów do
selekcji cech, jednakże parametry filtru
dostraja siÄ™ na podstawie metody
opakowujÄ…cej.
pðWÅ‚aÅ›ciwoÅ›ci
Szybkość
Często większa dokładność niż metod filtrów,
lecz mniejsza niż metod opakowanych
Uniwersalność - algorytm tego typu może być
wykorzystany do każdego problemu
klasyfikacyjnego
Metody wbudowane
pð Metody wbudowane to taka grupa algorytmów
które wykorzystują pewne cechy algorytmów
uczenia dokonujÄ…c automatycznej selekcji cech
na etapie uczenia sieci neuronowej lub innego
algorytmu decyzyjnego
pð WÅ‚aÅ›ciwoÅ›ci
Szybkość  selekcja cech realizowana jest podczas
procesu uczenia dzięki czemu nie musimy dokonywać
żadnych dodatkowych obliczeń
Dokładność  metody te są zaprojektowane pod kątem
konkretnego algorytmu
Brak uniwersalności  metody te można wykorzystywać
jedynie dla danego algorytmu
Algorytmy
przeszukiwania
Selekcja w przód
pð Startuje z pustego
zbioru cech i
stopniowo zwiększ
jego rozmiar aż do
osiągnięcia maksimum
funkcji oceniajÄ…cej
(np.. MI lub max.
dokładność sieci
neuronowej)
pð ZÅ‚ożoność
obliczeniowa: n2
Selekcja w tył
pð Startuje z peÅ‚nego
zbioru cech i
stopniowo usuwa z
niego najmniej
użyteczne cechy aż do
osiągnięcia maksimum
funkcji oceniajÄ…cej
(np.. MI lub max.
dokładność sieci
neuronowej)
pð ZÅ‚ożoność
obliczeniowa: n2
Inne
pðSelekcja z wykorzystaniem algorytmów
genetycznych
pðSelekcja typu  i w przód  j w tyÅ‚ i
odwrotna
Dadajemy algorytmem selekcji w przód  i
nowych cech po czym z rezultatu usówamy  j
najmniej użytecznych. Warunek i>j
Z całego podzbioru usuwamy  i najmniej
istotnych cech, po czym dodajemy  j nowych.
Warunek i>j
Metody rankingowe
Metody rankingowe
pðMetody rankingowe sÄ… bardzo wydajnymi
(szybkimi) metodami selekcji cech
pðStosowane sÄ… jako filtry  wówczas należy
podać liczbę wybranych cech jako wejście
algorytmu
pðStosowane jako frappers (kombinacja
metod filtrów i opakowanych)  wówczas
liczba wybranych cech optymalizowana
jest przez algorytm decyzyjny (np.. Sieć
neuronowÄ…)
pðWady brak stabilnoÅ›ci
Metody rankingowe - algorytm
Współczynniki rankingowe
pð Znormalizowany zysk informacji (ang. Normalized information
gain) lub asymetryczny współczynnik zależności (ang. asymmetric
dependency coecient, ADC)
pð znormalizowany wzglÄ™dny zysk informacyjny (ang. normalized
gain ratio)
pð kryterium DML
pð Gdzie:
H(c)  entropia klasy
H(f)  entropia cechy
MI(c,f)  informacja wzajemna
Pomiędzy cechą i klasą


Wyszukiwarka

Podobne podstrony:
Metody badań i selekcji substancji czynnych w bioitechnologii
Metody numeryczne w11
Metody i techniki stosowane w biologii molekularnej
14 EW ZEW Srodowisko do metody Johna
Metody badan Kruczek
ciz poradnik metody rekrutacji
10z2000s21 Metodyka podziału zadań w sekcji ratownictwa chemiczno ekologicznego
Niekonwencjonalne metody leczenia
PO stosuje metody sowieckich zbrodniarzy
metody spawania stali nierdzewnych
BDO metody sporzadzania rachunkow pienieznych
metody nauczania
Metodologia pracy umysłowej Esej na temat Metody uczenia się
2008 Metody obliczeniowe 13 D 2008 11 28 20 56 53

więcej podobnych podstron