3784502945

3784502945



TORUŃSKIE STUDIA BIBLIOLOGICZNE

2011, ml (6)

Piotr Malak

Instytut Informacji Naukowej i Bibliologii Uniwersytet Mikołaja Kopernika w Toruniu

e-mail: piomk@umk.pl

Metody statystyczne w komputerowym przetwarzaniu języka naturalnego

Wśród metod komputerowego przetwarzania dokumentów języka naturalnego niepoślednie miejsce zajmują metody statystyczne. Analiza statystyczna tekstów, frekwencji poszczególnych wyrazów czy zależności współwystępowania konstrukcji wielo wyrazowych jest jednym z najczęściej wykorzystywanych narzędzi w wyszukiwaniu informacji (ang. information retrieval).

Systemy wyszukiwawcze w znacznym stopniu wykorzystują statystyczne metody komputerowego przetwarzania tekstów, zarówno z pojedynczych dokumentów, jak i - przede wszystkim - z całych ich kolekcji. Gwoli uściślenia należy dodać, że najczęściej analizowane są teksty z poszczególnych dokumentów, natomiast wnioski wyciągane są na podstawie porównania określonych właściwości dotyczących jednego dokumentu z wartościami tych samych cech stwierdzonych dla całego zbioru dokumentów. Wnioskowanie o prawidłowościach językowych jest przeprowadzane na podstawie statystycznej analizy odpowiednio dużych zbiorów tekstów.

Statystyka w przetwarzaniu języka naturalnego

Jak podaje Mieczysław Sobczyk, statystyka jest nauką dotyczącą ilościowych metod badania zjawisk (inaczej procesów) masowych1. Pojęcie

1

Por. M. Sobczyk, Statystyka, wyd. 3 zm., Warszawa 2000; tenże, Statystyka. Podstawy teoretyczne, przykłady - zadania, Lublin 1998.



Wyszukiwarka

Podobne podstrony:
2011 12 01 50 23 Stp-ł- &52MO kcUee Toruńskie Studia Bibliologiczne2008, nr 1 Uniwersytet Mikoł
TORUŃSKIE STUDIA BIBLIOLOGICZNE 2008, nr 3Barbara Centek Instytut Informacji Naukowej i Bibliologii
PRZEGLĄD BIBLIOTECZNY 2008 z. 4 PL ISSN 0033-202X PIOTR GAWRYSIAK Instytut Informatyki Politechnika
Nowości Wydawnictwa AP JERZY JAROWIECKI Instytut Informacji Naukowej i Bibliotekoznawstwa Studia nad
Zagadnienia Informacji Naukowej. Instytut Informacji Naukowej i Studiów Bibliologicznych Uniwersytet
Wiesław Babik Uniwersytet Jagielloński Instytut Informacji Naukowej i BibliotekoznawstwaBIBLIOTEKA
Biblioteka Główna Instytut Informacji Naukowej i Bibliotekoznawstwa Uniwersytetu Marii
SPRAWOZDANIE Z DZIAŁALNOŚCI INSTYTUTU INFORMACJI NAUKOWEJ I STUDIÓW BIBLIO-LOGICZNYCH UNIWERSYTETU
Biblioteka Główna Instytut Informacji Naukowej i Bibliotekoznawstwa Uniwersytetu Marii
Nowości Wydawnictwa AP STANISŁAW SKÓRKA Instytut Informacji Naukowej i Bibliotekoznawstwa Użytkownic
Nowości Wydawnictwa AP BARBARA GÓRA Instytut Informacji Naukowej i Bibliotekoznawstwa Biblioteka
Zdjęcie0416 Centrum Edukacji Bibliotekarskiej, Informacyjnej t Dokumentacyjnej Instytut Informacji N
Uniwersytet Wrocławski Instytut Informacji Naukowej i Bibliotekoznawstwa
Ksicążki IWONA PIETRZKIEWICZ Instytut Informacji Naukowej i Bibliotekoznawstwa Biblioteka kanoników
Z PRAC BIBLIOTEK) PAN W WARSZAWIE 345 bezpośrednio u wydawcy — w Instytucie Informacji Naukowej w Fi
PRZEGLĄD BIBLIOTECZNY 1991 1/4 PL ISSN 0033-202X INSTYTUT INFORMACJI NAUKOWEJ, TECHNICZNEJ I
PRZEGLĄD BIBLIOTECZNY 2009 z. 4 PL ISSN 0033-202X Dorota Chiopkowska Instytut Informacji Naukowej i

więcej podobnych podstron