img122 (12)

img122 (12)



116

Na czym polega ten problem?

Otóż reguły uczenia, które poznałeś we wcześniejszych odcinkach cyklu, opierały się na prostej, ale bardzo skutecznej zasadzie: każdy neuron sieci sam wprowadzał poprawki do swego stanu wiedzy (zmieniając wartości współczynników wagowych na wszystkich swoich wejściach) na podstawie znanej wartości błędu, jaki popełnił. W przypadku sieci jednowarstwowej sytuacja była prosta i oczywista: sygnał wyjściowy każdego neuronu porównywany był z prawidłową wartością podaną przez nauczyciela, co dawało wystarczającą podstawę do korekty wag. W sieci wielowarstwowej nie jest już tak łatwo. Neurony końcowej (wyjściowej) warstwy mogą mieć oszacowane błędy w sposób w miarę prosty i pewny - jak poprzednio, poprzez porównanie sygnału produkowanego przez każdy neuron z wzorcowym sygnałem podawanym przez nauczyciela.

Natomiast neurony wcześniejszych warstw? Tu trzeba błędy oszacować matematycznie, bo wprost się ich zmierzyć nie da - brakuje wiadomości, jakie POWINNY być wartości odpowiednich sygnałów, bo nauczyciel nie określa tych wartości pośrednich, koncentrując się wyłącznie na efekcie końcowym.

Metodą, która powszechnie stosowana jest do “odgadywania” błędów neuronów warstw ukrytych, jest metoda zwana backpropagation (wstecznej propagacji błędów). Metoda ta tak bardzo jest popularna, że w większości gotowych programów służących do tworzenia modeli sieci i ich uczenia -stosuje się tę metodę jako domyślną, a często jest ona jedyną dostępną metodą uczenia sieci, co oszczędza użytkownikom zbędnych rozterek. Metodę backpropagation poznasz w działaniu, studiując zachowanie kolejnego programu, jaki za chwilę Ci zaproponuję, zanim to jednak nastąpi musimy wrócić do jednego zagadnienia szczegółowego, które okaże się teraz bardzo ważne, a które do tej pory traktowane było trochę po macoszemu. Zajmę się mianowicie kształtem nieliniowej charakterystyki używanych w badaniach neuronów.

7.2. Jak zmieniać “próg” nieliniowej charakterystyki neuronu?

W poprzednim rozdziale rozważaliśmy neurony oparte na zasadzie “wszystko albo nic”. Mogły one działać na zasadzie logicznej kategoryzacji wejściowych sygnałów (prawda lub fałsz - 0 lub 1), albo mogły opierać się na charakterystyce “bipolarnej” (aprobata lub dezaprobata czyli sygnały +1 lub -1). W obydwu rozważanych przypadkach przejście między dwoma wyróżnionymi stanami miało charakter gwałtowny: albo sygnały wyjściowe


Wyszukiwarka

Podobne podstrony:
292 (7) fflO(12.47.    Na czym polega obróbka plazmowa? Obróbka plazmowa polega na dz
294 (7) 12.51. Na czym polega laserowa obróbka cieplna? Obróbka cieplna opiera się w tym przypadku n
19.    Na czym polega uniwersalizm problemów egzystencjalnych w dramacie Szekspi
122 ZDARZENIA — KSIĄŻKI — LUDZIE naturę. Na czym proces ten polega? Otóż związki organiczne
12. Na czym polega regulacja hydrauliczna instalacji centralnego ogrzewania. Polega na zrównoważeniu
SDC10771 Na czym polega problem Zsynchronizowaniu w czasie wszelkich dostaw, aby skrócić do minimum
12.    Korzystając z podręcznika wyjaśnij, na czym polega mechanizm pług and play. 13
12.    Korzystając z podręcznika wyjaśnij, na czym polega mechanizm pług and play. 13
Wyjaśnij na czym polegają 3 koncepcje rozwiązania problemu postępującej degradacji i braku możliwośc
274 (8) ROZDZIAŁ 12 12.1. 12.2.Obróbki powierzchniowe WPROWADZENIE Na czym polega obróbka
Zagadnienia-pytania (do losowania) na egzaminie dyplomowym 5)    Na czym polega probl
Untitled1 Rozdział 3Czy mam problemy z jedzeniem? Celem zajęć jest uświadomienie uczniom, na czym po

więcej podobnych podstron