Zi (zi ’ > , zk) — wektor żądanych wartości wyjściowych;
k liczba wyjść sieci (neuronów warstwy wyjściowej).
^<1)
xi ** ••• \
warstwa wejściowa |
pierwsza warstwa |
warstwa wyjściowa | |
ukryta |
Rys. Z.2.4. Model sieci wielowarstwowej .
,r; Mi — liczba neuronów w i-tej warstwie; W— liczba warstw w Sieci
Uczenie sieci polega naprezentacji ciągu uczącego1 i zmianie wag neuronów taki sposób, aby błąd między odpowiedzią sieci Y (dla konkretnego wzorca a żądaną wartością na wyjściu Z był jak najmniejszy. W celu wyznaczenia tego błędu wykorzystuje się często zależność:
£ *
gdzie: zm — żądana wartość na m-tym wyjściu sieci neuronów, ym — odpowiedź neuronu na zadany wektor X,
ym = 9(X OO-
Całkowity błąd sieci można wyznaczyć jako sumę błędów dla każdego z wyjść sieci:
k
Q • V <2, , (Z.2.7)
m = I
Najbardziej rozpowszechnioną i sprawdzoną metodą zmiany wartości wag jest metoda gradientowa. Według tej zasady wartość i-tej wagi m-tego neuronu jest modyfikowana o pewną wartość Awtm:
(Z.2.8)
A Wi = -T]-
Wi
m (nowe)
= Wt
m (stare)
+ A
gdzie: r\ — współczynnik regulujący szybkość zmian.
Po wstawieniu do wzoru (Z.2.8) zależności opisującej błąd sieci, otrzymujemy:
(79(0
(Z.2.9)
gdzie: 8m = (zm - y,j — różnica między wartością żądaną na m-tym wyjściu
sieci a wartością uzyskaną,
— sumaryczne pobudzenie m-tego neuronu.
69
Obok ciągu uczącego, występuje także tak zwany ciąg testujący o podobnej strukturze. Zawiera on inny zestaw par, które są wykorzystywane podczas testowania sieci.