306
wektora W w j-tym kroku o pewną wielkość Vte;, proporcjonalną do i-tej składowej gradientu funkcji Q w danym punkcie:
Znak we wzorze wskazuje na wybór kierunku najszybszego malenia funkcji Q. Ponieważ Q zależy od y, zaś y = ip(e) jest funkcją zależną od łącznego pobudzenia e, które to dopiero zależy bezpośrednio od współczynników wag ?iii, gradient Q rozbijamy na pochodną funkcji złożonej:
SQU) ÓQ(i) dyW 6e<>)
Swi Syii) de(i) dwi
przy czym oczywiście
Łącząc te wzory odpowiednio otrzymujemy formulę uczenia znaną z ram-