Metody selekcji cech
A po co to
pðCzÄ™sto mamy do dyspozycji dane w
postaci zbioru cech lecz nie wiemy które z
tych cech będą dla nas istotne.
pðW zbiorze cech mogÄ… wystÄ…pić cechy
redundantne niosÄ…ce identycznÄ…
informację jak istniejące już cechy
pðCel wybranie ze zbioru dostÄ™pnych cech
tych które nas interesują
Interesujące cechy to takie, których kombinacja
pozwala na możliwie najlepszą
klasyfikacjÄ™ lub regresjÄ™!
8
7
6
Przykład z danymi iris
5
4
3
2
6
4
2
2
1
0
5 6 7 8 2 3 4 2 4 6 0 1 2
Podział metod selekcji cech
pðZe wzglÄ™du na charakter problemu
Nadzorowane
Nienadzorowame
pðZe wzglÄ™du na relacjÄ™ z innymi
algorytmami nadrzędnymi
Filtry
Wrappery (opakowane)
Frapery kombinacja filtrów i Wrapperów
Metody wbudowane
Filtry cech
pðFiltry cech to taka grupa metod, która
autonomicznie podejmuje decyzję, które z
cech będą istotne dla pózniejszego procesu
uczenia. Decyzja ta podejmowana jest na
podstawie niezależnego od klasyfikatora
współczynnika takiego jak informacja
wzajemna lub dywergencja Kullbacka
Leiblera
Pozyskanie informacji Ostateczny model
Filtr cech Ocena modelu Model końcowy
(danych) decyzyjny
Informacja wzajemna i
dywergencja Kullbacka Leiblera
pðInformacja wzajemna (ang. Mutual
Information)
Dla zmiennych o rozkładach dyskretnych p(x) i
q(x)
Dla zmiennych ciągłych o rozkładach p(x) i q(x)
pðDywergencja Kullbacka Leiblera (ang.
Kullback Leibler divergence)
Dla zmiennych o rozkładach dyskretnych p(x) i
q(x)
Dla zmiennych ciągłych o rozkładach p(x) i q(x)
Metody opakowane
pðMetody opakowane to grupa metod w której
występuje sprzężenie zwrotne pomiędzy
elementem decyzyjnym (np.. SieciÄ…
neuronowÄ…) a algorytmem selekcji cech.
Dzięki temu podzbiór cech optymalizowany
jest pod kÄ…tem konkretnego klasyfikatora
Informacja zwrotna o jakości
wybranych cech
Pozyskanie informacji Ostateczny model
Metoda opakowana Ocena modelu Model końcowy
(danych) decyzyjny
Metody filtrów
pð Zalety
Uniwersalność uzyskany podzbiór cech jest niezależny
od klasyfikatora, dzięki czemu teoretycznie możemy
użyć dowolny klasyfikator
W problemach medycznych jak analiza DNA zależy nam
na znalezieniu genów odpowiedzialnych za pewne cechy,
nie chcemy by wynik był zależny od użytej sieci
neuronowej
Szybkość jesteśmy niezależni od metody
klasyfikacyjnej dzięki czemu złożoność obliczeniowa nie
wpływa na szybkość i wydajność tego algorytmu
Uniwersalność - algorytm tego typu może być
wykorzystany do każdego problemu klasyfikacyjnego
pð Wady
Konieczność estymacji wielowymiarowych rozkładów
prawdopodobieństwa
Metody opakowane
pðZalety
Wybrany podzbiór cech jest dostosowany do
wymagań lub charakteru algorytmu
decyzyjnego (sieci neuronowej itp)
Większa dokładność niż metod filtrów
Uniwersalność - algorytm tego typu może być
wykorzystany do każdego problemu
klasyfikacyjnego
pðWady
Często większa złożoność obliczeniowa
Kombinacje filtrów i metod
opakowanych
pðWykorzystuje siÄ™ algorytm filtrów do
selekcji cech, jednakże parametry filtru
dostraja siÄ™ na podstawie metody
opakowujÄ…cej.
pðWÅ‚aÅ›ciwoÅ›ci
Szybkość
Często większa dokładność niż metod filtrów,
lecz mniejsza niż metod opakowanych
Uniwersalność - algorytm tego typu może być
wykorzystany do każdego problemu
klasyfikacyjnego
Metody wbudowane
pð Metody wbudowane to taka grupa algorytmów
które wykorzystują pewne cechy algorytmów
uczenia dokonujÄ…c automatycznej selekcji cech
na etapie uczenia sieci neuronowej lub innego
algorytmu decyzyjnego
pð WÅ‚aÅ›ciwoÅ›ci
Szybkość selekcja cech realizowana jest podczas
procesu uczenia dzięki czemu nie musimy dokonywać
żadnych dodatkowych obliczeń
Dokładność metody te są zaprojektowane pod kątem
konkretnego algorytmu
Brak uniwersalności metody te można wykorzystywać
jedynie dla danego algorytmu
Algorytmy
przeszukiwania
Selekcja w przód
pð Startuje z pustego
zbioru cech i
stopniowo zwiększ
jego rozmiar aż do
osiągnięcia maksimum
funkcji oceniajÄ…cej
(np.. MI lub max.
dokładność sieci
neuronowej)
pð ZÅ‚ożoność
obliczeniowa: n2
Selekcja w tył
pð Startuje z peÅ‚nego
zbioru cech i
stopniowo usuwa z
niego najmniej
użyteczne cechy aż do
osiągnięcia maksimum
funkcji oceniajÄ…cej
(np.. MI lub max.
dokładność sieci
neuronowej)
pð ZÅ‚ożoność
obliczeniowa: n2
Inne
pðSelekcja z wykorzystaniem algorytmów
genetycznych
pðSelekcja typu i w przód j w tyÅ‚ i
odwrotna
Dadajemy algorytmem selekcji w przód i
nowych cech po czym z rezultatu usówamy j
najmniej użytecznych. Warunek i>j
Z całego podzbioru usuwamy i najmniej
istotnych cech, po czym dodajemy j nowych.
Warunek i>j
Metody rankingowe
Metody rankingowe
pðMetody rankingowe sÄ… bardzo wydajnymi
(szybkimi) metodami selekcji cech
pðStosowane sÄ… jako filtry wówczas należy
podać liczbę wybranych cech jako wejście
algorytmu
pðStosowane jako frappers (kombinacja
metod filtrów i opakowanych) wówczas
liczba wybranych cech optymalizowana
jest przez algorytm decyzyjny (np.. Sieć
neuronowÄ…)
pðWady brak stabilnoÅ›ci
Metody rankingowe - algorytm
Współczynniki rankingowe
pð Znormalizowany zysk informacji (ang. Normalized information
gain) lub asymetryczny współczynnik zależności (ang. asymmetric
dependency coecient, ADC)
pð znormalizowany wzglÄ™dny zysk informacyjny (ang. normalized
gain ratio)
pð kryterium DML
pð Gdzie:
H(c) entropia klasy
H(f) entropia cechy
MI(c,f) informacja wzajemna
Pomiędzy cechą i klasą
Wyszukiwarka
Podobne podstrony:
Metody badań i selekcji substancji czynnych w bioitechnologiiMetody numeryczne w11Metody i techniki stosowane w biologii molekularnej14 EW ZEW Srodowisko do metody JohnaMetody badan Kruczekciz poradnik metody rekrutacji10z2000s21 Metodyka podziału zadań w sekcji ratownictwa chemiczno ekologicznegoNiekonwencjonalne metody leczeniaPO stosuje metody sowieckich zbrodniarzymetody spawania stali nierdzewnychBDO metody sporzadzania rachunkow pienieznychmetody nauczaniaMetodologia pracy umysłowej Esej na temat Metody uczenia się2008 Metody obliczeniowe 13 D 2008 11 28 20 56 53więcej podobnych podstron