ważności w odniesieniu do poszczególnych części tekstu. Tak. np. autor recenzji należącej do pogranicza kilku dyscyplin może podjąć się /.dania sprawy /. tych tylko części c/y wątków, które na
leżą do jego specjalności. polegający
na dosłownym ktS^ych_JVagmcntowJ^ mia-
nowięicjctorcjit^ccm^^ z przyjętego punktu
wadzenia (np. definicje, kluczowe tezy czy sformułowania istotnych punTTtow uderzające swą trafnością). "*
Trudno wyliczyć wszystkie możliwe kryteria ważności, jest ich bowicnTl^lOTc^ywa^^^T^ widzenia różnych
tckstowTT?ilTeży^jTcuiinfcć^(}Tra^'ó^Tiai,^ktorć wiąjifli^ślinicj z właściwościami samego tekstu, choć także nieobojętny jest dla nicłi wniesiony z zewnątrz punkt widzeniu. Wyróżni się tu przede wszystkim pewne /kryteria ilościowej a następnie wskaże inne, które można by określić jako/kryteria jakościowe.")
Powstający w wyniku takich operacji tekst streszczenia nazywać będziemy /"wyciągiem siiitk. tywnym z oryginału. Wyc ągi sc łektywne można otrzymać jako rezultat mechanicznego ekstrahowania (ang. cMracfing),który to proces da się w całości wykonać za pomocą (paszyny cyfrowi. Niektórzy autorzy uważają, że termin „streszczenie" -- angielskie abstract — jest w tym przypadku niewłaściwy i że należy go zastąpić właśnie terminem „wyciąg” - - : .ngiclskic cxtracij. Przy zestawieniu tych dwóch wyrażeń angielska h łacińskiego pochodzenia powstaje pewna etymologiczna gra słów, która dobrze oddaje istotne różnice i związane 7. nimi możliwości operacji mechanicznych, (ffistrakj) wymaga czynności abstrahowania, to jest ujmowania tono co ważne. nrzv
2 W spr. wic aktualnych możliwości streszczaniu maszynowego lak wypowiadają sic autorzy pewnej monografii dotyczącej streszczania c-Ia c«*!6vv informacji n ukowej. „The present-doy piocess docs not produce o tnie ahstract. : .»•• ouiput /ihc < j. >■■■.•■• t: tr,i:i • ■ r ■ ‘ f siwi
ficant repr, \cntutirc srntrnces mc idcntified, c\!n>cted front the oriKinol oclicie tmd printed os o i ontpnfer-pri -duccd estrad of ihc orticie. Alt/ionph lin phrases c jntpnterhosed estruetinp otul compnk, produced cjctrncls ore :nmc i.ccurol and morę descriptii e of huth the proces.* i nd lite ptminet lite ternts ore not cont-mnniy uscJ\ automat ic ahstract tup is nwre ofteit found in the literaturę". 11. Bor-ko, Ch. I . Uernier, Absttuctiny, Cmircpts utld Method*. New Yoii. 1975. Zob. s. 1('4.
pomijaniu (l.ic. abstrahcre) elementów uznanych za nieistotne; potrzebne icst^wicc do lego intuicyjne ujmowanie zasadniczych idei tek* tu. (Ll .drai^ natomiast wymaga jedynie posiadaitia Jakiegoś kryterium wyciągania (łac. e.\iruhere) zjckslu gotowych zdań, przy czym Kryterium to może być mechaniczne, na przykład odwołujące się ! jdź do występowania określonego kształtu w zdaniu. które ma zostać wyciągi^tc,bn^ do pozycji danego jadania w~^Urnl\turźe^
5.2.2. Pierwsze z dwóch powyższych kryteriów mechanicznego wyróżniania zdań, mających się złożyć na wyciąg, zakłada istnienie zbioru słów służących do takiej identyfikacji. Mają to być wyrażenia szczególnie symptomatyczne dla zawartości tekstu, a więc te, które określamy miancni^SLÓw KLUCZOWYOji Zbiór słów kluczowych <1 Ki danego tekstu nazywa się jego skorowidzem lub (fNDtiKSFM rzeczowy^ a czynność charakteryzowania za-wartości tekstu za pomocą słów kluczowych nazywa się indf.kso-wanifm. Tak więc przy jednej z metod tworzenia wyciągów indeksowanie wyprzedza streszczenie. Klasyczna metoda mechanicznego inde ksowai i i a polega na uwzględnieniu częstotli wości występowania słów; powodem jej popularności jest przydatność w procesie mechanizacji streszczania, który zdając część pracy maszynom umożliwia przyspieszenie, tak bardzo pożądane, w cyklu mlormo wanta o dokumentach. Pierwszym krokiem jest obliczanie częstości występowania w danym tekście terminów nale-iTłcyZn^Tirr^łZrśsTrcJ^TTrrcsTonc^kTasy^^^zTrac^ari^-b^dcm K). iCb^żeonawnizo^ być iloczynem (w sensie teorii
zbiorów) dwóch lub więcej klas; interesują nas np. terminy specjalistyczne z pewnej dziedziny, będące zarazem rzeczownikami.
Wniesiony nrzezośobę streszczającą punkt widzenia wyraża się w wyborze klasy A', ewentualnie w wyborze fragmentu tekstu, który może być poddany badaniu, a także w wyborze jeszcze jednego wskaźnika, który można by nazwać<^skaznTlacm^7o^^w^ Ten ostatni ważny jest z tego względu, że zagęszczenie pewnego wyrażenia (ściślej cgzcmplarzyjedncgojyjyjj^
57