Katedra Inteligentnych Systemów Interaktywnych 18 WETI PG
Temat |
Uczenie ze wzmocnieniem z rozmytą aproksymacją funkcji użyteczności na przykładzie sterowania pojazdem |
Temat w języku angielskim |
Reinforcement learning with action value function fuzzy approximation in vehicle control problem |
Opiekun pracy |
dr inż. Jerzy Dembski |
Konsultant pracy | |
Cel pracy |
Opracowanie metod uczenia ze wzmocnieniem z rozmytą reprezentacją funkcji użyteczności akcji w zadaniu sterowania pojazdem. Porównanie opracowany ch rozwiązań do znanych metod aproksymacji funkcji użyteczności ze szczególnym uwzględnieniem reprezentacji rozmytej. |
Zadania |
1. Opracowanie modelu fizycznego pojazdu; 2. Opracowanie metod z rozmytą reprezentacją funkcji użyteczności; 3. Przeprowadzenie eksperymentów i porównanie własnych rozwiązań do znanych metod aproksymacji funkcji użyteczności w uczeniu ze wzmocnieniem; |
Literatura |
1. Cichosz P.: Systemy uczące się, WNT, Warszawa 2000; 2. Rutkowski L: Metody i techniki sztucznej inteligencji, Wydawnictwo Naukowe PWN, Warszawa 2005; 3. Sutton R.S., Barto A.G.: Reinforcement Learning: An Introduction, MIT Press, Cambridge, MA, 1998 http://www.incompleteideas.net/sutton/book/ebook/node65 .html; |