3784502947

3784502947



Metody statystyczne w komputerowym przetwarzaniu języka naturalnego

częściej analizuje się cechy przeliczalne;

- cechy jakościowe, których wartości zmiennych nie wyraża się liczbami, np. stosunek liczebności leksemów rodzimych i obcych w słownictwie, zdania złożone - współrzędnie i podrzędnie29.

Podstawową kategorią stosowaną w ilościowych obliczeniach statystycznych jest częstość absolutna (frekwencja) F. Jest to wskaźnik liczbowy otrzymany drogą sumowania jednostek wchodzących w skład danej próby. Podstawą sumowania mogą być wystąpienia poszczególnych jednostek bądź też wartości konkretnej cechy określającej dane jednostki. Częstość występowania słów w tekście jest cechą ilościową przeliczalną, o wartościach wyrażanych za pomocą liczb naturalnych.

Częstość absolutną F można przedstawić za pomocą następującego wzoru:

F = tf

Wzór 1: Wzór na częstość absolutną wystąpień danego słowa,

gdzie:

F - częstość absolutna,

n - liczebność zbioru analizowanych dokumentów,

f. - częstość wstąpienia danego słowa w kolejnym dokumencie30.

Ze względu na to, że najczęściej analiza statystyczna obejmuje wiele tekstów z danej dziedziny, można wprowadzić dodatkową kategorię, jaką jest częstość średnia, określana wzorem:


n n

Wzór 2: Wzór na częstość średnią, gdzie:

F- częstość absolutna31.

29    R. Hammerl, J. Sambor, Statystyka..., s. 19; M. Sobczyk, Statystyka..., s. 12-13, 92-113.

30    Słownik frekwencyjny polszczyzny współczesnej, oprać. I. Kurcz i in., pod red. Z. Sa-loniego, Kraków 1990, s. 1.

31    Tamże.



Wyszukiwarka

Podobne podstrony:
Metody statystyczne w komputerowym przetwarzaniu języka naturalnegc Analiza statystyczna elementów z
Metody statystyczne w komputerowym przetwarzaniu języka naturalnegc wej do przeprowadzenia wieloaspe
Metody statystyczne w komputerowym przetwarzaniu języka naturalnego znawstwa statystycznego dowodzą,
Metody statystyczne w komputerowym przetwarzaniu języka naturalnego wo dostosowanej do potrzeb kompu
Metody statystyczne w komputerowym przetwarzaniu języka naturalnego czeniowo najważniejszym, dla
Przetwarzanie języka naturalnego to zatem jedna z dziedzin Al, która umożliwia porozumiewanie się lu
Przetwarzanie języka naturalnego Reprezentacja wiedzy -    Sieci semantyczne -
IMG!29 resize METODY SYSTEMATYCZNEB2. Metoda „czarnej skrzynki" Metoda w której analizuje się t
IMG84 EN 180 9000:2009 Metody statystyczne mogą pomóc w mierzeniu, opisaniu, analizie, interpretowa
[4] Gatnar E., Walesiak M. (red.) (2004), Metody statystycznej analizy wielowymiarowej w badani
7 2. Analiza języka naturalnego. Neurokognitywne inspiracje w tym zakresie pomagają nam lepiej zrozu

więcej podobnych podstron