Sterowanie neuronowe bezzałogowym pojazdem podwodnym 473
problemu optymalizacyjnego, w którym, przyjmując błąd wyjściowy neuronu w postaci [1,
<k) = yd(k)-y(k) (8)
gdzie: yd - żądana odpowiedź układu; y - aktualna odpowiedź układu, należy zminimalizować kryterium mające postać:
J=^E\ę(kf) (9)
gdzie: E - operator wartości oczekiwanej.
Do rozwiązania tak sformułowanego problemu optymalizacyjnego i określenia optymalnych wartości parametrów neuronu zastosowano metodę gradientów sprzężonych. Aktualizacja wartości parametrów sieci neuronowej przeprowadza się po każdorazowej prezentacji wektora uczącego zgodnie z równaniem [2]:
v(k +1) = v(i) - i?V„./|>_>(ł| + 0°)
gdzie: v - uogólniony parametr sieci, r\ - współczynnik uczenia, /j - współczynnik sprzężenia, k - krok iteracji.
Biorąc pod uwagę kryterium minimalizacji, gradient może być wyrażony równaniem [1,
2]:
— = £{-e(4)F'(g,J'(*)K(*)} (11)
au
gdzie: Sv(k) - wektor wrażliwości sygnału gamma na zmianę parametru v , F' - pochodna funkcji aktywacji neuronu.
3. BADANIA DOŚWIADCZALNE
Na regulator składają się dwie sieci neuronowe: sieć sterująca i sieć identyfikująca (rys. 4), zaś cały regulator wypracowuje sygnał sterujący w dwóch etapach [3]. W pierwszym etapie sieć identyfikująca przeprowadza identyfikację stanu obiektu w danej chwili czasowej, wokół bieżącego punktu równowagi, na podstawie informacji o bieżącym kursie oraz bieżącej prędkości obrotowej wokół osi normalnej pojazdu (prędkość zmiany kursu). Do nauki jako wzorcowy podawany jest sygnał sterujący kursem pojazdu. W drugimi etapie następuje przepisanie wag z sieci identyfikującej do sieci sterującej. W ten sposób sieć sterująca powinna posiadać transmitancję zbliżoną do odwrotnej transmitancji obiektu w danej chwili czasowej, a więc wokół bieżącego punktu równowagi. Na wejście tej sieci podawana jest informacja o rozbieżności między kursem zadanym i bieżącym oraz w związku z tym, że dąży się do tego, żeby pojazd miał zerową prędkość obrotową wokół osi normalnej pojazdu (brak