2212791072

2212791072



3.2. Selekcja wektorów

Selekcja danych jest ważnym procesem ze względu na przygotowane odpowiedniego zbioru danych do dalszej analizy, wpływa ona na uogólnianie algorytmu. Wektory odstające mogą wystąpić w każdym zbiorze danych, wynikają one z błędów pomiarowych, lub błędu ludzkiego. Próbka odstająca od pozostałych może reprezentować obszar, gdzie badana teoria może nie występować. Znalezienie optymalnej reprezentacji wektorów (danych) dzieli się na selekcję i optymalizację. Zagadnienie optymalizacji oraz selekcji prototypów dla algorytmu k - NN jest bardzo ważne, ponieważ nie tylko wpływa na zdolność do uogólniania algorytmu, ale również zmniejsza jego złożoność obliczeniową.

Metody eliminacji przypadków odstających określa się również, jako zagadnienie poszukiwania prototypów. W literaturze można znaleźć szereg metod taksonomii takich algorytmów. Wśród nich należy wymienić podział na metody optymalizacji i selekcji. Selekcja cechuje się bezpośrednim wyborem prototypów - wektorów zbioru trenującego. Natomiast optymalizacja minimalizuje wybrane kryterium w celu wyznaczenia nowego położenia wektorów prototypowych. Optymalizację od selekcji rozróżnia to, że położenia wektorów prototypowych nie muszą być dopasowane do konkretnego przypadku ze zbioru treningowego, a mogą to być nowe wektory wyznaczone na bazie oryginalnego zbioru uczącego. W grupie metod optymalizujących rozróżnia się dwie strategie rozwiązania problemu, bezpośrednią i pośrednią. Metoda bezpośrednia wyróżnia się bezpośrednią minimalizacją błędu klasyfikacji danych, zaś metodę pośrednią charakteryzuje algorytmy nienadzorowanej analizy danych. Metody znajdowania prototypów można również podzielić na przyrostowe i redukcyjne. W metodzie przyrostowej poszukiwanie wektorów wzorcowych zaczyna się od pustego zbioru P = 0. Następnie do zbioru P dodaje się nowe wektory, poprzez minimalizację określonego kryterium. W metodach redukcyjnych działanie algorytmu rozpoczyna się od pełnego zbioru prototypów P = T, następnie usuwane są wektory niewpływające na polepszenie generalizacji algorytmu. Jednym z przypadków metod przyrostowych jest kondensacja danych. W metodzie tej eliminuje się wektory „wewnętrzne”, które leżą daleko od granicy decyzji i nie mają wpływu na klasyfikacje. Drugą grupą jest metoda filtrów albo edycji eliminującej wektory odstające. Metody te zalicza się do metod redukcyjnych. W praktyce wykorzystuje się często oba rodzaje algorytmów, dzięki czemu ze zbioru danych usuwane są wektory odstające i kondensujące dane. W dalszej części podrozdziału zostaną przedstawione przykłady algorytmu selekcyjnego oraz redukcyjnego, których wpływ jest badany w niniejszej pracy. [15]

17



Wyszukiwarka

Podobne podstrony:
Zdjęcie0551 31R I Zagadnienie (o jest ważne zwłaszcza ze względu na to, że dom ■ nacja człowieka w&n
Mechanika 0 3.e. Wytrzymałość złożona. Wytrzymałość prosta - gdy element jest liczony tytko ze wzglę
PwTiR145 288 Rozdział 9 Umowa o usługi gastronomiczne jest umową nienazwaną. Ze względu na jej miesz
oraz roli ministerstwa z jednej strony a instytutów z drugiej. Jest to zrozumiałe ze względu na trad
Obraz6 (19) OBSŁUGAPrzednie siedzenia Prawidłowe ustawienie siedzeń jest bardzo ważne ze względu na
Osiągnięcie pełnej jednorodności portfela jest niemożliwe. Ponadto, ze względu na konkurencję, ZU st
SPAWANIE ELEKTRONOWE - wykorzystywane jest w przemyśle lotniczym ze względu na wysoką jakość spoin o
CCF20091227019 Bogdan Rączkowski - BHP w praktyce Rozdział 9 •    gdy jest to koniec
Obecnie na rynku znajduje się wiele podkładów o różnej kolorystyce, co jest bardzo istotne ze względ
100(34 ■ Czysty, krystaliczny glin jest kruchy i łamliwy. Ze względu na swoje właściwości, takie jak
Zdjeciew stosować chłodnice z rurkami wykonanymi z micdrioniklu NNŻ101. Nic jest wskazane natomiast,
systemie EFTPOS przy pomocy kart magnetycznych jest to korzystne ze względu na szybkie obciążenie ra
Wstęp Terapia pedagogiczna jest różnie definiowana, ze względu na zamiennie używane określenia:
Wstęp Terapia pedagogiczna jest różnie definiowana, ze względu na zamiennie używane określenia:
Wstęp Terapia pedagogiczna jest różnie definiowana, ze względu na zamiennie używane określenia:

więcej podobnych podstron