3784502945
TORUŃSKIE STUDIA BIBLIOLOGICZNE
2011, ml (6)
Piotr Malak
Instytut Informacji Naukowej i Bibliologii Uniwersytet Mikołaja Kopernika w Toruniu
e-mail: piomk@umk.pl
Metody statystyczne w komputerowym przetwarzaniu języka naturalnego
Wśród metod komputerowego przetwarzania dokumentów języka naturalnego niepoślednie miejsce zajmują metody statystyczne. Analiza statystyczna tekstów, frekwencji poszczególnych wyrazów czy zależności współwystępowania konstrukcji wielo wyrazowych jest jednym z najczęściej wykorzystywanych narzędzi w wyszukiwaniu informacji (ang. information retrieval).
Systemy wyszukiwawcze w znacznym stopniu wykorzystują statystyczne metody komputerowego przetwarzania tekstów, zarówno z pojedynczych dokumentów, jak i - przede wszystkim - z całych ich kolekcji. Gwoli uściślenia należy dodać, że najczęściej analizowane są teksty z poszczególnych dokumentów, natomiast wnioski wyciągane są na podstawie porównania określonych właściwości dotyczących jednego dokumentu z wartościami tych samych cech stwierdzonych dla całego zbioru dokumentów. Wnioskowanie o prawidłowościach językowych jest przeprowadzane na podstawie statystycznej analizy odpowiednio dużych zbiorów tekstów.
Statystyka w przetwarzaniu języka naturalnego
Jak podaje Mieczysław Sobczyk, statystyka jest nauką dotyczącą ilościowych metod badania zjawisk (inaczej procesów) masowych1. Pojęcie
1
Por. M. Sobczyk, Statystyka, wyd. 3 zm., Warszawa 2000; tenże, Statystyka. Podstawy teoretyczne, przykłady - zadania, Lublin 1998.
Wyszukiwarka
Podobne podstrony:
2011 12 01 50 23 Stp-ł- &52MO kcUee Toruńskie Studia Bibliologiczne2008, nr 1 Uniwersytet MikołTORUŃSKIE STUDIA BIBLIOLOGICZNE 2008, nr 3Barbara Centek Instytut Informacji Naukowej i BibliologiiPRZEGLĄD BIBLIOTECZNY 2008 z. 4 PL ISSN 0033-202X PIOTR GAWRYSIAK Instytut Informatyki PolitechnikaNowości Wydawnictwa AP JERZY JAROWIECKI Instytut Informacji Naukowej i Bibliotekoznawstwa Studia nadZagadnienia Informacji Naukowej. Instytut Informacji Naukowej i Studiów Bibliologicznych UniwersytetWiesław Babik Uniwersytet Jagielloński Instytut Informacji Naukowej i BibliotekoznawstwaBIBLIOTEKABiblioteka Główna Instytut Informacji Naukowej i Bibliotekoznawstwa Uniwersytetu MariiSPRAWOZDANIE Z DZIAŁALNOŚCI INSTYTUTU INFORMACJI NAUKOWEJ I STUDIÓW BIBLIO-LOGICZNYCH UNIWERSYTETUBiblioteka Główna Instytut Informacji Naukowej i Bibliotekoznawstwa Uniwersytetu MariiNowości Wydawnictwa AP STANISŁAW SKÓRKA Instytut Informacji Naukowej i Bibliotekoznawstwa UżytkownicNowości Wydawnictwa AP BARBARA GÓRA Instytut Informacji Naukowej i Bibliotekoznawstwa BibliotekaZdjęcie0416 Centrum Edukacji Bibliotekarskiej, Informacyjnej t Dokumentacyjnej Instytut Informacji NUniwersytet Wrocławski Instytut Informacji Naukowej i BibliotekoznawstwaKsicążki IWONA PIETRZKIEWICZ Instytut Informacji Naukowej i Bibliotekoznawstwa Biblioteka kanonikówZ PRAC BIBLIOTEK) PAN W WARSZAWIE 345 bezpośrednio u wydawcy — w Instytucie Informacji Naukowej w FiPRZEGLĄD BIBLIOTECZNY 1991 1/4 PL ISSN 0033-202X INSTYTUT INFORMACJI NAUKOWEJ, TECHNICZNEJ IPRZEGLĄD BIBLIOTECZNY 2009 z. 4 PL ISSN 0033-202X Dorota Chiopkowska Instytut Informacji Naukowej iwięcej podobnych podstron