18 Wybór drogi oceanicznej z uwzględnieniem warunków pogodowych 361
posiada tę właściwość, że jakikolwiek jest początkowy stan i początkowe są decyzje, to te ostatnie decyzje muszą stworzyć optymalną politykę nie zważając na stan powstający z pierwszej decyzji”.
Ta zasada implikuje fakt, że równoczesne określenie całości sekwencji sterowania optymalnego może być zastąpione przez sekwencyjne określanie procesu. Wynik jest zatem iteracyjnym sposobem obróbki funkcji, która może być rozwiązywana bardzo efektywnie za pomocą komputera. Klasyczna teoria sterowania wiąże się ściśle z dynamiczną optymalizacją systemów zakłócanych. Istotą algorytmu są więc jego dwie podstawowe zmienne:
• zmienna stanu,
• zmienna sterowania.
Należy zauważyć, że zmienne stanu są zależne od zmiennych sterowania, te zaś są zmiennymi niezależnymi, które podejmujący decyzje może zmieniać w takich granicach, aby osiągnąć swój założony cel. Każdy problem sterowany składa się z trzech głównych elementów:
1) zestawu równań funkcjonalnych, opisujących zmiany systemu w czasie; zmiany te określone są pojęciem dynamiki systemu;
2) wielookresowych funkcji celu, mierzonych przez wskaźnik systemu, wyrażonych w zwykłych, dających się zmierzyć jednostkach, jak czas, pieniądz itp.;
3) ograniczenia dopuszczalnych warunków na obu zmiennych, tj. stanu i sterowania.
Problem optymalizacji trajektorii jest problemem deterministycznym, jeżeli nie pojawi się żaden element stochastyczny w dynamice, funkcji celu lub w ograniczeniach. O ile problem zawiera elementy losowe, których rozkład normalny jest określony i znany dla decydenta, to problem nazywany jest stochastycznym. Gdy parametr rozkładu prawdopodobieństwa elementu losowego nic jest dokładnie znany, lecz w formie przewidywanego rozkładu w każdym stadium, to problem określany jest jako adaptacyjny. Tak w ięc oba problemy: adaptacyjny i stochastyczny, rozwiązywane są metodą programowania dynamicznego. Metoda ta jest zdecydowanie lepsza od w ielu technik matematycznego programowania.
Metoda PI) oparta jest na następujących założeniach:
1. Odpowiedź kadłuba jest funkcją prędkości, uzyskiwaną przez aproksymację krzywej, najbardziej zbliżonej do aktualnych danych rzeczywistych. Funkcja może być dwu-lub w ielowymiarowa oraz bardzo uproszczona w formie:
Vs = F{Hf,qf)
2. Ograniczenia, jakie występują w tej metodzie są geofizyczne; określone jest spektrum falowania.
3. Funkcja celu określona jest minimalnym czasem przejścia od A do /?; może być rozszerzona do minimalnych kosztów i innych kryteriów.