Baza danych Document Understanding
Baza danych Document Understanding dotyczy jednostronicowych dokumentów. Baza zostaªa utwo-
rzona w oparciu o trzydzie±ci kopii listów biznesowych wysªanych przez rm¦ Olivetti. Spo±ród wszystkich
komponentów logicznych listów, zwanych blokami, wyró»niono pi¦¢, na podstawie których utworzono klasy
decyzyjne. Bloki te identykowane s¡ poprzez nast¦puj¡ce jednoargumentowe relacje: sender, receiver,
logo, reference oraz date. Wiedz¦ dziedzinow¡ stanowi¡ jednoargumentowe relacje okre±laj¡ce wªasno±ci
wszystkich bloków (np. with-very-small(block), position-top(block)) oraz dwuargumentowe relacje okre-
±laj¡ce zwi¡zki zachodz¡ce pomi¦dzy dokumentem a blokiem lub mi¦dzy blokami danego dokumentu (np.
part-of(document,block), above(block
1
,block
2
)).
c
1
(sender)
c
21
(receiver)
c
3
(logo)
c
8
(date)
c
5
c
14
(reference)
c
24
c
7
Rysunek 1: Jednostronicowy dokument