115
Rozdział 9. Dynamika procesu uczenia sieci neuronowych
zjawisko jest znane w biologii pod nazwą „habituacji”1, a w teorii sieci neuronowych jest znane pod nazwą „wykrywacza nowości” (nordily dełeclor).
Przypadek 3. Tutaj także jedna funkcja jest liniowa, a druga stała, tylko odwrotnie, niż w poprzednio omówionym przypadku: 0 = ot *y = /3 y. Wówczas
dW
— = aX-f>vw
Na pozór równanie to jest bardzo podobne do wyżej omówionego, jednak wsławienie liniowego równania opisującego funkcjonowanie neuronu (y = Wr X) ujawnia natychmiast rzeczywistą złożoność rozważanego tu problemu, ponieważ równanie dynamiki uczenia
dW . Tx
—— = (r« / — fl W WT) X dt
jest w tym wypadku nieliniowo ze względu na W, a więc nie może być w ogólnym przypadku rozwiązane analitycznie. Istotnie, podane wyżej równanie jest szczególną postacią równania Riccatiego, którego całka nie jest znana w postaci analitycznej. Naturalnie w konkretnym przypadku zawsze pozostaje do dyspozycji rozwiązanie numeryczne, jednak jego przydatność jest bardzo ograniczona. Możliwe jest jedynie uzyskanie pewnych ogólnych informacji o wartościach W(J) przy dość oczywistych i możliwych do spełnienia w praktyce założeniach upraszczających. Przykładowo wymuszając obie strony podanego wyżej równania przez 2Wr otrzymujemy równanie
2Wt ^ = 2Wt U I - () W W7') X dl
Równanie to jest już równaniem skalarnym (nie wektorowym), a jego jedyną niewiadomą jest kwadrat modułu wektora W. Zapisując to w sposób jawny mamy:
|(l|W|[2)=2tf n ||W||2)
Można udowodnić, że rozwiązanie tego równania ||W||- dla y > 0 jest zbieżne do pewnej ustalonej wartości ||W*J|a = ro można interpretować w ten sposób, że długość wektora ||W||2 nie ulega w trakcie uczenia istotnym zmianom, natomiast istota uczenia polega na tym, że wektor W jest obracany w taki sposób, aby dążył do uzgodnienia swego kierunku z kierunkiem wektora X.
Podane wyżej rozważania wydają się być problematyczne, ponieważ w ogólnym przypadku trudno zagwarantować spełnienie warunku y > 0 dla dowolnego X. Rozwiązaniem może tu być jednak uwzględnienie wpływu nieliniowej funkcji ^(e), charakteryzującej się z reguły „odcinaniem” ujemnych wartości sygnałów y.
Zagadnienie obrotu wektora W w celu uzgodnienia jego położenia z kierunkiem wektora X (a dokładniej — z kierunkiem oczekiwanego (średniego) położenia wektora X) rozważymy jako problem statystyczny. Wprowadźmy pojęcie warunkowej wartości oczekiwanej:
_ E{- |W}
1Habituarja jest procesem stopniowego przywyczAjania się .systemu nerwowego do niezmiennego zestawu bodźców zmysłowych. W wyniku habilitacji takie niezmienne bodźce po pewnym czasie przód ają być świadomie dostrzegane.