występowania innych kategorii dopasowań niż jeden do jednego.
Żeby dokładnie zmierzyć jakość urównoleglenia danych tekstów trzeba mieć do dyspozycji urównoleglenie referencyjne tych samych tekstów, najczęściej wykonane przez człowieka. Niech A=(d1, a2,..., 3r) będzie ocenianym urównolegleniem. Niech B=(b1, b2,..., bq) będzie urównolegleniem referencyjnym. Niech AnB oznacza część wspólną urównolegleń A i B , czyli urównoleglenie zawierające dopasowania należące zarówno do A , jak i do B . Niech \A\ oznacza ilość dopasowań w urównolegleniu, czyli rozmiar listy jego dopasowań. Poniżej przedstawię najszerzej stosowane miary jakości urównoleglenia, a mianowicie dokładność i kompletność.
Dokładność (ang. precisioń) określa ilość poprawnych dopasowań w stosunku do wszystkich dopasowań ocenianego urównoleglenia. Stosując powyższe oznaczenia można to zapisać następująco:
Kompletność (ang. recałl) określa ilość poprawnych dopasowań w stosunku do wszystkich dopasowań urównoleglenia referencyjnego. Stosując powyższe oznaczenia można to zapisać następująco:
r IdriBl |B| '
Powstały w wyniku urównoleglania korpus równoległy dopasowany na poziomie zdania ma wiele zastosowań. Może być używany bezpośrednio jako pamięć tłumaczeń w systemie tłumaczenia przez analogię. W ten sposób został on zastosowany w systemie heTManb.
Urównoleglanie tekstów dwujęzycznych na poziomie zdania jest pierwszym krokiem do urównoleglania na poziomie wyrazu, utworzenia modelu tłumaczenia, czyli słownika probabilistycznego. Model tłumaczenia jest jednym ze składników niezbędnych do tłumaczenia
6 System heTMart to system zarządzania pamięcią tłumaczeń. Został on szerzej opisany w rozdziale 4.
14