3784499251

3784499251



2.1.2.2.3.    Parametry rozkładu normalnego

Parametry p i cr2 są wyznaczane przez autorów empirycznie na podstawie testowego korpusu.

Wartość oczekiwana p jest stosunkiem długości tekstu docelowego do długości tekstu źródłowego.

/(S)

Wariancje wylicza się przy założeniu że a2, czyli kwadrat różnicy długości segmentów źródłowych i docelowych w dopasowaniu, rośnie proporcjonalnie do długości segmentów źródłowych. Stałą przyrostu wyznacza się na podstawie regresji liniowej.

Ostatecznie jednak w samym algorytmie nie wyznacza się parametrów dla tekstów wejściowych, przyjmując wartości uśrednione, wyliczone ręcznie z korpusu testowego, niezależne od języków. Autorzy algorytmu argumentują że i tak ich dokładne wartości nie mają wielkiego wpływu na wynik urównoleglania. Przyjmuje się zatem uśrednione wartości uzyskane z korpusu testowego to: p=l , a <j2=6,8

2.1.2.2.4.    Obliczanie wartości funkcji p

Aby obliczyć wartość funkcji p należy dokonać kilku przekształceń:

P((e-f)\ó)=P(6\(e-f))-P((e-f)yt

Gdzie t jest pewną stałą którą możemy pominąć gdyż jest identyczna dla wszystkich porównywanych dopasowań.

P((e-f)) jest pobierane z Tabeli 1, utworzonej na podstawie danych empirycznych uzyskanych z testowego korpusu.

Kategoria dopasowania

(e-f)

Prawdopodobieństwo wystąpienia kategorii dopasowania P({e-f))

(1-1)

0,89

(1-0) albo (0-1)

0,0099

(2-1) albo (1-2)

0,089

(2-2)

0,011

Tabela 1: Prawdopodobieństwa występowania kategorii dopasowańls Natomiast drugi człon można obliczyć jako:

18 Niniejsza tabela pochodzi z artykułu [Gale. Church. 1991],

20



Wyszukiwarka

Podobne podstrony:
img077 (16) x - parametr, cp{x) - funkcja rozkładu normalnego Tabela 4 Dane do wyznaczania prawdopod
inwestycji). 10.    Wybrane parametry sieci są optymalizowane przez cały badany okres
skanuj0084 (11) ( cny minimalne w niektórych krajach są wyznaczane przez państwo, np. na mleko, prze
56 Ceny minimalne w niektórych krajach są wyznaczane przez państwo, np. na mleko, przetwory mleczne
Ceny wolnorynkowe - są wyznaczane przez rynek na podstawie działania praw popytu i podaży. Ten typ c
Pole elektromagnetyczne: Wokół przewodu elektr. powstaje pole mag. którego linie sil są wyznaczone p
DSC02154 6.    Rozkład normalny jest określony jednoznacznie przez 2 parametry Są to
35 Zalozrny, ze rozkłady hipotezy HO i HI sa gaussowskie (normalne) z parametrami odpowiednio rnO, s

więcej podobnych podstron