Sieci CP str113

113

Rozdział 9. Dynamika procesu uczenia sieci neuronowych

Rozwiązanie ma ogólną posłać

W(0 = t-*¹ ^W(O) + rr jf <-^0r X(r) dr

i można mu przypisać prostą interpretację: Uczenie prowadzi w tym wypadku jedynie do wyznaczania ruchomej średniej (ważonej wykładniczą funkcją czasu) wejściowego wektora X(J). Początkowa wartość wektora W(0) jest szybko zapominana.

Przypadek 2. Jedna funkcja jest liniowa, a druga stała: 4> = a y i -y = fi

dW

— = a y X — ft W

Jest to — jak pisze Kohonen pierwszy nietrywialny model procesu uczenia najniższego rzędu. W tym wypadku sygnał wyjściowy neuronu y ingeruje w proces uczenia w najprostszy z możliwych sposobów, wywodzący się z klasycznych prac Ilebba [HebbdO].

Zakładając, że neuron jest typu ADALINE (z liniową funkcją przejścia y?) mamy oczywiście y - W^rX, a zatem

—- = (<i X X^r — li I) w

gdzie I jest macierzą jednostkową o rozmiarach [ii x »]. Równanie to można zapisać w wygodniejszej postaci

y = -/ł(I-AX X^r) W

gdzie A = cc/}). Właściwości tego równania łatwiej będzie prześledzić, jeśli wprowadzi się dyskretną skalę czasu. Wówczas kolejne wartości wektora W{/) (gdzie / =0, 1,2,...) można wyznaczać z iteracyjnego równania

W(l+ 1)= [(l-«I + oX(/)X^T(()] W(f)

Oznaczając występujący przy W(/) zależny od czasu {numeru kroku /) macierzowy mnożnik w tym równaniu przez P(/) otrzymujemy proste w formie równanie dynamiki procesu uczenia:

W(t + 1) = P(/) W(0

gtlzie macierz P(t) wyznaczana jest za pomocą zależności:

P(f) = (l -/#)! + .. X(/)X^T(f)

Rozwiązanie opisanego równania daje dynamikę procesu uczenia w formie:

W(/+ 1) =

n ho

*=u

W(0)

Dość łatwo jest się zorientować, że rozwiązanie to w ogólnym przypadku ma dość niekorzystne właściwości: albo jest rozbieżne (wartości W(/) „eksplodują” i osiągają nieskończenie duże wartości), albo zbiega się do wektora zerowego. Tak więc rozważaną tu metodę uczenia wolno stosować jedynie tło modelowania systemów o skończonym i relatywnie krótkim

Wyszukiwarka

Podobne podstrony:
img113 113 Rozdział 9. Dynamika procesu uczenia sieci neuronowych Rozwiązanie ma ogólną postać W(f)
Sieci CP str117 117 Rozdział 9. Dynamika procesu uczenia sieci neuronowych Do tego samego wniosku mo
img117 117 Rozdział 9. Dynamika procesu uczenia sieci neuronowych Do tego samego wniosku można dojść
img115 115 Rozdział 9. Dynamika procesu uczenia sieci neuronowych zjawisko jest znane w biologii pod
img117 117 Rozdział 9. Dynamika procesu uczenia sieci neuronowych Do tego samego wniosku można dojść
img119 119 Rozdział 9. Dynamika procesu uczenia sieci neuronowych albo — uwzględniając równanie opis
img112 Rozdział 9Dynamika procesu uczenia sieci neuronowych W poprzednich rozdziałach prezentowane b
Sieci CP str046 ■i-10. Przyspieszanie procesu uczenia momenł.nm): .(rrOO + l) Z opisywanych w litera

więcej podobnych podstron

Sieci CP str113

Sieci CP str113

W(0 = t-*1 ^W(O) + rr jf <-0r X(r) dr

dW

— = a y X — ft W

—- = (<i X Xr — li I) w

y = -/ł(I-AX Xr) W

W(l+ 1)= [(l-«I + oX(/)XT(()] W(f)

P(f) = (l -/#)! + .. X(/)XT(f)

n ho

W(0 = t-*¹ ^W(O) + rr jf <-^0r X(r) dr

—- = (<i X X^r — li I) w

y = -/ł(I-AX X^r) W

W(l+ 1)= [(l-«I + oX(/)X^T(()] W(f)

P(f) = (l -/#)! + .. X(/)X^T(f)