Baza danych Document Understanding Baza danych Document Understanding dotyczy jednostronicowych dokumentów. Baza zostaªa utwo-rzona w oparciu o trzydzie±ci kopii listów biznesowych wysªanych przez rm¦ Olivetti. Spo±ród wszystkich komponentów logicznych listów, zwanych blokami, wyró»niono pi¦¢, na podstawie których utworzono klasy decyzyjne. Bloki te identykowane s¡ poprzez nast¦puj¡ce jednoargumentowe relacje: sender, receiver, logo, reference oraz date. Wiedz¦ dziedzinow¡ stanowi¡ jednoargumentowe relacje okre±laj¡ce wªasno±ci wszystkich bloków (np. with-very-small(block), position-top(block)) oraz dwuargumentowe relacje okre-
±laj¡ce zwi¡zki zachodz¡ce pomi¦dzy dokumentem a blokiem lub mi¦dzy blokami danego dokumentu (np.
part-of(document,block), above(block1,block2)).
c8 (date)
c1 (sender)
c21 (receiver)
c3 (logo)
c14 (reference)
c5
c24
c7
Rysunek 1: Jednostronicowy dokument