1636660534

1636660534



Relaksacja liniowej separowalności

Wiele modeli klasyfikacyjnych takich jak te porównane w tej pracy (CPL, SVM, ML) zależą od parametru regularyzacyjnego, który decyduje o tym czy model będzie bardziej dopasowany do danych treningowych czy będzie miał większe właściwości generalizacyjne. Zagadnienie doboru parametrów w taki sposób aby model jak najlepiej zachowywał się na nowych nie widzianych danych jest zagadnieniem kluczowym w budowie modeli prognostycznych. Jest to podstawowy problem, z którym spotyka się każdy badacz. Czy maksymalnie zminimalizować błąd na zbiorze uczącym czy zbudować prosty model, który być może będzie miał lepsze właściwości uogólniające i lepiej zachowa się na nowych danych (ang. bias-variance tradeoff). W przypadku maszyny wektorów wspierających SVM, modelu logistycznego oraz klasyfikatora liniowego CPL możemy o tym decydować poprzez parametr regularyzacyjny. Czym większa wartość parametru A we wzorze (5), tym większe znaczenie w minimalizowanej funkcji będą miały wartości parametrów modelu ti>j,w^. W procesie minimalizacji wartości tej funkcji, niektóre z nich mogą ulec wyzerowaniu. Sterując wartością parametru A możemy sterować złożonością modelu. Zwykle dobór tego parametru następuje poprzez sprawdzenie kilku, kilkunastu jego wartości na skali logarytmicznej, np. w pracy [34] dla klasyfikatora SVM sprawdzane są następujące wartości C = 2-5,2-4,..., 25.

W przypadku klasyfikatora opartego na funkcjach typu CPL dobór wartości parametru regularyzacyjnego może zostać przeprowadzony w taki sposób, aby kolejno zerować wartości współczynników modelu Wi gdzie i — 1..N. Idea takiego rozwiązania została zaproponowana po raz pierwszy przez Bobrowskiego [3] i rozwijana w kolejnych latach [6] owocując implenentacją zrównolegloną w języku C, użytą do obliczeń w niniejszej rozprawie. Metoda ta znana pod nazwą relaksacji liniowej separowalności RLS (ang. relaxed linear separability) jest metodą selekcji cech. Generuje ona podprzestrzenie o coraz mniejszych wymiarach kończąc na przestrzeni jednowymiarowej, eliminując kolejno cechy poprzez odpowiednie zwiększanie wartości parametru A. Podobna metoda selekcji cech dla modeli regresyjnych znana jest pod nazwą LASSO [40] [41].

Metoda ta została wykorzystana do obliczeń w tej pracy w następujący sposób. Został wygenerowany ciąg podprzestrzeni zgodnie z metodą RLS, każda z nich została oceniona za pomocą trafności klasyfikacji acc obliczonej metodą leave-one-out. Dla najlepszej podprzestrzeni został zbudowany klasyfikator CPL z parametrem A = 0,0005/ra, gdzie liczność zbioru.

7



Wyszukiwarka

Podobne podstrony:
12592 SNC00114 W kodeksie cywilnym mamy wiele czynności nieodpłatnych, takich jak użyczenie, bezczyn
29 (37) 29 1.1. Wybrane zagadnienia chemii budowlanej liwiąjąc wiele procesów technologicznych, taki
mamy także cały album z demami z 2009 roku, który zawiera wiele dobrych utworów, takich jak
PC161332 ZADANIA I. Napędowa siła hydrolizy. Wiele reakcji biosyntezy, takich jak na przykład syntez
slide Manipulatory bramowe mają wiele zalet, takich jak: *łuży udźwig (350-500 kg), ^duży zakres pr
Drogą polikondensacji otrzymuje się wiele powszechnie stosowanych polimerów, takich jak: żywice
Systemy rozproszone - podsumowanie obliczenie wykorzystuje wiele zasobów (takich jak procesory, pami
III - Definiowanie materiału: Wiele problemów rozwiązywanych za pomocą narzędzi takich jak FlexPDE,
img512 Obok tych zalet autobus ma także wiele wad, takich jak: -    głośna praca siln
Istnieje wiele odmian rolnictwa alternatywnego, takich jak, rolnictwo biodynamiczne (biologiczno-dyn
Obecnie o wiele szersze zastosowanie znalazło inkludowanie próbek w tworzywach sztucznych takich jak
ullman026 (2) Przy korzystaniu z terminów takich jak „pojedynczy” lub .jeden" v określeniach je
PANDEMIA MOŻE WYWOŁYWAĆ U WIELU OSÓB SILNY STRES I WIELE EMOCJI TAKICH JAK LĘK, ZŁOŚĆ.SMUTEK,
Istnieje wiele baz danych zawierających informacje o Arabidopsis thaliana takich jak The Arabidopsis

więcej podobnych podstron