3784502951

Piotr Malak

masowości zakłada badanie odpowiednio dużego zbioru jednostek, które cechują się podobnymi, ale nieidentycznymi właściwościami. Wynikiem badań statystycznych są reguły bądź wnioski dotyczące uśrednionych wartości cech badanych zbiorowości. Owe reguły to tzw. prawidłowości statystyczne. Badania statystyczne dotyczą tzw. zbiorowości statystycznej (populacji, masy statystycznej). Populacja oznacza zbiór elementów objętych badaniem statystycznym. Poszczególne elementy składowe populacji są nazywane jednostkami statystycznymi, przy czym w obrębie jednej zbiorowości statystycznej można wyróżnić wiele jednostek statystycznych (np. podzbiór leksemów, zdań czy też całych tekstów badanego zbioru dokumentów)¹.

Chris Manning i Hinrich Schiitze - autorzy pracy Foundations ofsta-tistical natural language processing - w interesujący sposób streścili umiejscowienie i przynależność statystycznego nurtu przetwarzania języka naturalnego (ang. Natural Language Processing, dalej: NLP). Badania kwantytatywne nad językiem naturalnym zdefiniowali jako dyscyplinę łączącą wszystkie podejścia ilościowe do automatycznego przetwarzania języka, włączając w to modelowanie probabilistyczne, teorię informacji oraz algebrę liniową. Pomimo potencjalnej wieloznaczności tego pojęcia Manning i Schiitze konkludują, że na przestrzeni ostatniej dekady statystyczne NLP było terminem używanym najpowszechniej do oznaczenia wszystkich prac nad przetwarzaniem języka naturalnego niewprowadza-jących symboliki ani logiki².

Należy zgodzić się z powyższymi wywodami, ponieważ badania statystyczne języka naturalnego rzeczywiście korzystają z osiągnięć teorii informacji, teorii prawdopodobieństwa oraz rozwiązań algebry linio-

Tenże, Statystyka..., s. 11-13.

Tłumaczenie własne autora na podstawie: Ch. D. Manning, H. Schiitze, Foundations of statistical natural language processing, Cambridge 1999, s. XXXI-XXXII: "A finał remark is in order on the title we have chosen for this book. Calling the field Statistical Natural Language Processing might seem questionable to someone who takes their definition of a statistical method from a standard introduction to statistics. Statistical NLP as we defi-ne it comprises all quantitative approaches to automated language processing, including probabilistic modeling, information theory, and linear algebra. While probability theory is the foundation for formal statistical reasoning, we take the basie meaning of the term 'statistics' as being broader, encompassing all quantitative approaches to data (a definition which one can quickly confirm in almost any dictionary). Although there is thus some po-tential for ambiguity, Statistical NLP has been the most widely used term to refer to non-symbolic and non-logical work on NLP over the past decade, and we have decided to keep

Wyszukiwarka

Podobne podstrony:
witaminy1 Do powtórzenia 1. Rozwiąż logogryf. Wpisz w odpowiednie kratki nazwy warzyw, które znajdu
Zastosowanie tych członów powoduje jednak to, że odpowiedź prędkości układu regulacji także cechuje
DSCF3094 Starzenie się to zmniejszenie zdolności do odpowiedzi na stres środowiskowy, które poj
agroturyst. Badaniem objęto 810 kwater agrotur które poddały się kategoryzacji Wejskiej Bazy Noclego
str08201 i wreszcie założenie i utrzymywanie Zakładu badania, lak na slokacłi gór, jak i na równina
WYKORZYSTANIE TECHNIK MULTIMEDIALNYCH I GRAFIKI 3D DO NAUCZANIA ANATOMII Piotr RZĄD Katedra i Zakład
Obowiązuje od dnia 16.11.2015 r.ZAKŁAD BADANIA WIRUSÓW GRYPY. KRAJOWY OŚRODEK DS. GRYPY NIZP-PZH Usł
24 (104) przygotowanie pacjenta do badania Odpowiedni odstęp czasowy po leczeniu -
BADANIAILOŚCIOWE Odpowiedź na pytanie „ile”? Nacisk na wyniki liczbowe. Zorientowanie na
74 75 Zakładając badania efektów działań edukacyjnych w zakresie twórczości należy także uwzględnić
b.    poznanie zakładów pracy (odpowiednio: przedsiębiorstw, firm, instytucji,
72767 Slajd71 ZASADY ŚNIADANIA 1.    zakładamy odpowiednią ilość czasu, żeby nie
HIGIENA I EPIDEMIOLOGIA ZAKŁAD BADANIA ŚRODOWISKA WYDZIAŁU FARMACEUTYCZNEGO WUM W WARSZAWIE 02-097
II. Test i karta odpowiedzi. Piotr GumiennyTEST czas - 120 min. Odpowiedzi wpisz w karcie
Piotr Sawicki, Sławomir Zwolenik 4.2. Badanie deformacji żelbetonowej belki stropowej (projekt

więcej podobnych podstron