Sieci CP str033

Sieci CP str033



33


Rozdział 3- Liniowe sieci neuronowe

który nie powinien się buntować przeciwko wnioskom formułowanym z wykorzystaniem matematyki. Inżynier bowiem zawsze odpowiada za jakość zbudowanej przez siebie konstrukcji i w razie katastrofy to on jest stawiany przed sądem, a nie jakieś tam równanie!

3.4 Matematyczne aspekty procesu uczenia sieci

Skupmy teraz uwagę na matematycznych właściwościach opisanego procesu uczenia. Przytoczony wyżej wzór opisujący regułę uczenia elementu ADALINE jest. bardzo ważny, gdyż zastosowana w nim reguła DELTA jest podstawą i punktem wyjścia przy konstrukcji większości algorytmów automatycznego uczenia. L tego względu warto dokonać także matematycznej analizy istoty tej reguły. Dla skupienia uwagi podczas dalszych rozważań wygodnie jest. wprowadzić, pojęcie ciągu uczącego. Ciąg t.cn ma następującą budowę:

U= «    >,< X‘V >.....<    »

czyli składa się z par postaci < X<;),    > zawierający cli wektor X podany w j-tym

kroku procesu uczenia i informację o wymaganej odpowiedzi neuronu z w tym kroku. Uwzględniając numerację par składających się na ciąg uczący, można zapisać w zmodyfikowany sposób rozważaną tu regułę uczenia:

W(;+I) _ -yyU) ą. yji) j) ję(j)

We wzorze tym

,    frU) — A}) _ y(j)

gdzie

yii) - w(j

Regułą ta daje się łatwo stosować pod warunkiem wprowadzenia początkowego wektora wag W*1); zwykle zakłada się, że wektor ten ma składowe wybrane losowo*. W programach symulujących pracę sieci neuronowych wykorzystuje się specjalne rozkazy, nakazujące nadanie losowych wartości składowym wektora wag. ale nie jest to konieczne, ponieważ mogą one pochodzić na przykład z poprzedniego cyklu uczenia, kiedy neuronowi narzucano realizację innej funkcji. Jedyne, czego trzeba bezwarunkowo unikać, to przyjmowania jednakowych wartości dla różnych składowych wektora W na początku procesu uczenia (powinno się zapewnić    Nie dotrzymanie tego warunku prowadzi niekiedy do braku

postępów w początkowym etapie procesu uczenia.

Po wprowadzeniu przytoczonych oznaczeń można sformułować cel procesu uczenia. Celem tytn jest uzyskanie zgodności odpowiedzi neuronu * z wymaganymi wartościami co daje się sprowadzić do mimimalizacji funkcji kryterialnej

« = 5 t

j = l

^Dodatkowo celowe jest przyjmowanie na początku niezbyc dużych wartości składowych wektora W, tak. aby norma || Hdł)|| była ograniczona. Wymaganie to wynika z faktu, żc stosowanie reguły DELTA w procesie uczenia prowadzi do systematycznego zwiększania normy wektora W (j| Md-i+D|| > )j    o> może

prowadzić do przepełnienia {overfiou>) podczas prowadzenia sensownych obliczeń. Przyjęcie malej wartości || wprawdzie nie eliminuje tego problemu, ale może spowodować, że wystąpi on znacznie później.

a Funkcja Q nawiązuje do szeroko znanej metody najmniejszych kwadratów (oznaczanej w literaturze jako LMS), dlatego omawiana metoda uczenia bywa także opisywana w skrócie iako metoda LMS.


Wyszukiwarka

Podobne podstrony:
img033 33 Rozdział 3. Ijiniowe sieci neuronowe który nie powinien się buntować przeciwko wnioskom fo
Sieci CP str039 39 Rozdział 3. Liniowe siwi neuronowe mu taką strategię uczenia, by zapamięta] i pot
img073 (30) Elementa oprowadzenie do techniki sieci neuronowych 67 Nie przejmuj się, że program
Sieci CP str037 37 Rozdział 3. Liniowe sieci neuronowe pokazano jedynie oczy i usta). Takie zadanie
Sieci CP str029 29 Rozdział X. Liniowe sieci neuronowe że neuron rozpoznaje1 sygnały wejściowe, wyró
Sieci CP str035 35 Rozdział 3. Liniowe sieci neuronowe albo prościej „<>> = —_— v
Sieci CP str037 37 Rozdział 3. Liniowe sieci neuronowe pokazano jedynie oczy i usta). Takie zadanie
Sieci CP str045 45 łiuzdziHl . i. Liniowe .sjpc/ neuronowe ma na ogól niewielką wartość, poniowaz po
Sieci CP str051 51 Rozdział 4. Nieliniowe nieci neuronowe<p(e) -, 1e Taka postać ma sporo wad, od

więcej podobnych podstron