103
Rozdział 8. Sieci pamięci skojarzeniowej
Rozwinięciem omówionych wyżej koncepcji Hopfielda i Hintona jest BAM — Bidirectionzl Associztire Memory czyli dwukierunkowa pamięć skojarzeniowa. Koncepcja lej sieci wywodzi się z wczesnych prac Grossberga [Gros82], ale najważniejsze prace na temat BAM przedstawili Kosko i Guest [Kosk87]. Wykorzystaniem praktycznym sieci typu BAM zajmuje się przedsiębiorstwo o nazwie Verac Corporation. Sieć BAM jest częściowo oparta na koncepcji sieci ART, gdyż kluczem do jej działania jest wzajemne oddziaływanie sygnałów wejściowych i wyjściowych w zamkniętej pętli sprzężenia zwrotnego. Jednak cechy charakterystyczne sieci BAM są na tyle odmienne od sieci ART, że zwykle rozważa się te dwie sieci całkowicie oddzielnie.
W sieci BAM występują dwa wektory sygnałów, oznaczane zwykle jako X i Y. Nie muszą one być jednakowych rozmiarów, przeciwnie zwykle zakłada się, że wektor X zawiera m składowych (X 6 7Jm), a wektor Y zawiera ;» składowych (Y € Hn). Zadaniem sieci jest przyjęcie w trakcie procesu uczenia i zarejestrowanie (w postaci wag ) zależności pomiędzy wejściem X i wyjściem Y. W tym celu —jak zawsze — wykorzystywany jest ciąg uczący postaci w taki sposób, aby po ponownym pojawieniu się pewnego konkretnego wektora X^ (lub wektora podobnego do X(*^ — sieć jest asocjacyjna, więc jest w stanie uogólniać swoje doświadczenia) sieć odtwarzała na swoim wyjściu wektor Y<k* zapamiętany jako skojarzony z danym X.
Wektor X podawany jest na wejścia wszystkich neuronów wejściowej warstwy sieci, która jest połączona z warstwą wyjściową w taki sposób, że współczynniki wagowe tworzą macierz W o wymiarach [m x n]. W wyniku przejścia sygnałów Xj € X przez neurony wyjściowej warstwy powstaje wektor Y, którego składowe otrzymuje się według znanej zależności:
gdzie <p jest nielinową funkcją wiążącą wejście z wyjściem w pojedynczym neuronie. Zależność tę można zapisać w formie wektorowej
Y = * (W X)
gdzie: W jest macierzą wag wyjściowej warstwy sieci, Y jest wektorem wyjściowym drugiej warstwy sieci, a $ jest wielowymiarowym nieliniowym odwzorowaniem
* : 7Jn =*
stanowiącym formalny agregat odwzorowań realizowanych skalarnie przez funkcje <p, które zwykle przyjmowane są w postaci funkcji progowej albo sigmoidalnej funkcji logistycznej