3784499251

2.1.2.2.3. Parametry rozkładu normalnego

Parametry p i cr² są wyznaczane przez autorów empirycznie na podstawie testowego korpusu.

Wartość oczekiwana p jest stosunkiem długości tekstu docelowego do długości tekstu źródłowego.

/(S)

Wariancje wylicza się przy założeniu że a², czyli kwadrat różnicy długości segmentów źródłowych i docelowych w dopasowaniu, rośnie proporcjonalnie do długości segmentów źródłowych. Stałą przyrostu wyznacza się na podstawie regresji liniowej.

Ostatecznie jednak w samym algorytmie nie wyznacza się parametrów dla tekstów wejściowych, przyjmując wartości uśrednione, wyliczone ręcznie z korpusu testowego, niezależne od języków. Autorzy algorytmu argumentują że i tak ich dokładne wartości nie mają wielkiego wpływu na wynik urównoleglania. Przyjmuje się zatem uśrednione wartości uzyskane z korpusu testowego to: p=l , a <j²=6,8

2.1.2.2.4. Obliczanie wartości funkcji p

Aby obliczyć wartość funkcji p należy dokonać kilku przekształceń:

P((e-f)\ó)=P(6\(e-f))-P((e-f)yt

Gdzie t jest pewną stałą którą możemy pominąć gdyż jest identyczna dla wszystkich porównywanych dopasowań.

P((e-f)) jest pobierane z Tabeli 1, utworzonej na podstawie danych empirycznych uzyskanych z testowego korpusu.

Kategoria dopasowania (e-f)	Prawdopodobieństwo wystąpienia kategorii dopasowania P({e-f))
(1-1)	0,89
(1-0) albo (0-1)	0,0099
(2-1) albo (1-2)	0,089
(2-2)	0,011

Tabela 1: Prawdopodobieństwa występowania kategorii dopasowań^lsNatomiast drugi człon można obliczyć jako:

18 Niniejsza tabela pochodzi z artykułu [Gale. Church. 1991],

Wyszukiwarka

Podobne podstrony:
img077 (16) x - parametr, cp{x) - funkcja rozkładu normalnego Tabela 4 Dane do wyznaczania prawdopod
inwestycji). 10. Wybrane parametry sieci są optymalizowane przez cały badany okres
skanuj0084 (11) ( cny minimalne w niektórych krajach są wyznaczane przez państwo, np. na mleko, prze
56 Ceny minimalne w niektórych krajach są wyznaczane przez państwo, np. na mleko, przetwory mleczne
Ceny wolnorynkowe - są wyznaczane przez rynek na podstawie działania praw popytu i podaży. Ten typ c
Pole elektromagnetyczne: Wokół przewodu elektr. powstaje pole mag. którego linie sil są wyznaczone p
DSC02154 6. Rozkład normalny jest określony jednoznacznie przez 2 parametry Są to
35 Zalozrny, ze rozkłady hipotezy HO i HI sa gaussowskie (normalne) z parametrami odpowiednio rnO, s

więcej podobnych podstron