Katedra Inteligentnych Systemów Interaktywnych WETI PG
Temat |
Morfologia ze słownika morfologicznego |
Temat w języku angielskim |
Morphology from a Morphological Lexicon |
Opiekun pracy |
dr inż. Jan Daciuk |
Konsultant pracy | |
Cel pracy |
Słownik morfologiczny zawiera informacje o odmianie słów. Może być wykorzystany przede wszystkim do analizy lub syntezy morfologicznej. W analizie morfologicznej na w ejściu mamy formę odmienioną słowa, a na wyjściu jego postać hasłową (taką jak w zwykłym, drukowanym słowniku, np. mianownik liczby pojedynczej dla rzeczowników) i kategorie obejmujące część mowy. W syntezie na wejściu mamy formę hasłową i kategorie, a na wyjściu formę odmienioną. Słowniki morfologiczne często tworzone są metodą „chińskiej armii”, tzn. twórcy słownika ręcznie wprowadzają do niego wszystkie formy. Możliwe jest lepsze podejście, w którym twórcy tworzą reguły odmiany, obejmujące reguły sklejania (w uproszczeniu: doklejanie końcówek) i reguły fonologiczne/ortograficzne (wymiany, dodawanie i usuw anie głosek). Wów czas dodanie słowa do słow nika polega jedynie na dodaniu go do grupy innych słów odmieniających się tak samo: formy odmienione z kategoriami powstaną automatycznie. Celem pracy jest stworzenie narzędzia, które na podstawie istniejącego słow nika morfologicznego utworzy opis morfologiczny języka obejmujący reguły i klasyfikację słów ze słownika. |
Zadania |
1. Zapoznanie się z regułami morfologicznymi; 2. Zapoznanie się z narzędziami do tw orzenia opisu morfologicznego j ęzyka; 3. Zapoznanie się z metodami uczenia maszynowego; 4. Wybór formatu opisu morfologii (dla jakiego narzędzia będzie tworzony); 5. Projekt narzędzia o modułowej postaci, umożliw iającego łatwą zmianę algorytmu uczenia. 6. Testowanie różnych algorytmów uczenia. 7. Opracowanie ostatecznej formy programu. |
Literatura |
1. Daniel Jurafsky, James Martin, Speech and Language Processing. An Introduction to Natural Language Processing, Computational Linguistics and Speech Recognition, Second Edition, Pearson/Prentice Hall, 2009; 2. Richard Sproat, Morphology and Computation, MIT Press, 1992; 3. Graeme D. Ritchie, Alan W. Black, Graham J. Russel, Stephen G. Pulman, Computational Morphology, MIT Press, 1992; 4. Kenneth R. Beesley, Lauri Karttunen, Finite State Morphology, CSLI Publications, 2003; 5. Paweł Cichosz, Systemy uczące się, Wydaw nictwa Naukow o-Techniczne, 2000; 6. Jacek Koronacki, Jan Ćwik, Statystyczne systemy uczące się. Akademicka Oficyna Wydawnicza EXIT, wydanie drugie, 2008; 7. Materiały do przedmiotu Przetwarzanie języ ka naturalnego; |
Uwagi |
Narzędzie pow inno być przenośne |