Katedra Inteligentnych Systemów Interaktywnych 16 WETI PG
Temat |
Analiza opinii w wybranych zbiorach tekstów z wykorzystaniem metod uczenia maszynowego |
Temat w języku angielskim |
Opinion analysis in seiected text sets using machinę leaming methods |
Opiekun pracy |
dr inż. Jerzy Dembski |
Konsultant pracy | |
Cel pracy |
Klasyfikacja tekstów w zględem opinii jest zadaniem dużo trudniejszym niż klasyfikacja względem treści co sprawia, że proste metody statystyczne oparte na prostych cechach takich jak koszyk słów, czy n-gramy zwykle zawodzą. Do ciekawej grupy metod należą metody związane z uczeniem wraz z jednoczesną selekcją cech, takie jak sieci neuronowe, drzewa decyzyjne czy boosting. Celem pracy jest więc sprawdzenie przydatności tych metod w analizie opinii w wybranych zbiorach tekstów, głównie recenzji filmowych i tekstów- politycznych. |
Zadania |
1. Zapoznanie się z literaturą dotyczącą klasyfikacji tekstów': 2. Implementacja wybranych metod klasyfikacji; 3. Wykonanie ekspery mentów oraz podsumowanie otrzy manych rezultatów; |
Literatura |
1. Pang B., Lee L.: Opinion mining and sentiment analysis, Foundations and Trends in Information Retrieval, Vol. 2, No 1-2, pp 1-135, 2008; 2. 2. Sebastiani F.: Machinę Leaming in Automated Text Categorization, ACM Computing Surveys, Vol. 34, No. 1, pp 1-47, 2002; 3. Ruiz M., Padmini S.: Hierarchical Text Categorization Using Neural Networks, Information Retrieval, 5, pp 87-118, Kluwer Academic Publishers, 2002; 4. Joachims T.: Text categorization with support vector machines: Learning with many relevant features. European Conference on Machinę Leaming (ECML'98), pages 137-142, 1998; 5. Schapire R. E., Singer Y., BoosTexer: A Boosting-based System for Text Categorization, Machinę Leaming, pp 135-168,2000; |