3784499240

3784499240



1. Pojęcia

1.1.    Segmentacja tekstu

1.1.1.    Definicje

1.1.1.1.    Definicja tekstu

Tekstem w niniejszej pracy nazywam dowolny skończony, zazwyczaj stosunkowo długi, ciąg znaków, mający pewne znaczenie w języku naturalnym i stanowiący pewną całość. Tekstami są na przykład artykuły, książki, strony internetowe, treści umów itd.

1.1.1.2.    Definicja segmentu

Segmentem w niniejszej pracy nazywam pewien wydzielony na podstawie pewnego kryterium fragment tekstu. Mówiąc o segmencie najczęściej mam na myśli zdanie, jednak może to też być akapit, rozdział, czy część zdania albo słowo.

1.1.1.3.    Definicja procesu segmentacji tekstu

Segmentacją w niniejszej pracy określam proces dzielenia tekstu na segmenty, podczas którego nie są pomijane żadne znaki. Wynikiem tego procesu jest lista segmentów. Zatem jeśli jest tekstem, a    ,tn listą segmentów powstałą w procesie segmentacji tego tekstu, to

T = t1+t2+ ■■■ + tn, gdzie operator + oznacza konkatenację napisów.

1.1.2. Problemy segmentacji tekstu

Problemy segmentacji tekstu zależą od przyjętego poziomu szczegółowości segmentacji. Na przykład podział tekstu na paragrafy jest stosunkowo prosty do przeprowadzenia, wystarczy bowiem dzielić tekst po znaku końca wiersza1. Podział na wyrazy jest już zadaniem trudniejszym. Jednak w przypadku niniejszej pracy najczęściej stosowanym poziomem szczegółowości segmentacji jest zdanie.

Zadanie podziału tekstu na zdania z początku może wydawać się trywialne - wystarczy dzielić tekst po kropce, znaku zapytania lub wykrzykniku. Niestety, istnieje tak duża liczba innych zastosowań znaku kropki - na przykład w skrótach, liczbach, datach itd., że zachodzi potrzeba zastosowania bardziej wyrafinowanej metody.

10

1

Albo pr/cd znakiem końca wiersza, zależnie od przyjętej konwencji.



Wyszukiwarka

Podobne podstrony:
PRZEDMIOTOWE EFEKTY KSZTAŁCENIA Z zakresu wiedzy studenta: W1 Zna pojęcie modelu obliczeń, definicję
praca inżynierska - KLAUS R..3.9.    Rozdziały Podstawową jednostką segmentacji tekst
Pojęcia podstawowe: Według definicji podanej w Międzynarodowym słowniku terminów metrologii prawnej
IMAG0046 Podstawowym pojęciem teorii Holmesa jest pojęcie „mapy” tekstu wyjściowego oraz tekstu doce
pis treściWstęp 91.    Podstawowe pojęcia dotyczące tekstu 13 1.1.
1. Pojęcie i cele kary Definicja: Kara to środek przymusu, którego dolegliwość nie jest dla sprawcy
Pomiar - definicje pomocnicze Cecha - pojęcie pierwotne, nie definiowane (właściwość, coś co opisuje
behavioryzmu czy pojęcia psychoanalityczne. Operacyjne definicje mogą być użyteczne jako punkt wyjśc
MATERIAŁ MYŚLENIA: POJĘCIA Zimbardo [s. 404] definiuje pojęcia (concepts) jako "kategorie,
14 ROZDZIAŁ 2. TEORIA POWIERZCHNI2.2 Podstawowe pojęcia, metryka Riemanna Definicja 2.2.1 (powierzch
top1 Rozdział IPodstawowe pojęcia § 1. Pojęcie przestrzeni topologicznej Definicja. Przestrzenią
POJĘCIE ADMINISTRACJI-ROZNE DEFINICJE. ❖Administracja -( zarząd, zarządzanie) oznacza jedną z
WYK02 Podstawowe pojęcia Fizjoterapii. Etymologia i definicja słowa: rehabilitacja, fizjoterapia.
3 ISTOTA MECHATRONIKI1. POJĘCIA PODSTAWOWE MECHATRONIKI 1.1.Definicja mechatroniki Pojecie

więcej podobnych podstron