č 2 9 22

č 2 9 22



slova (Ize ovsem zadat i j ej i ch urćita omezeni a vynechavky), je jednak konkordance rrinohonasobne vetsi neź puvodni text a jednak nemusi vedle sebe uvadet v§ech-ny flektivni tvary slova, ktere k sobe patri, protoże mezi nimi abecedne mużou figurovat slovajina, kterasem ćiste abecedne taky patri (srovnej ukazku v priloze).

Pro beżnou lingvistickou prąci se tu nejvice a hojne osvedćif v prostredi DOS komerćne śireny oxfordsky program Micro-OCP, obsahujici vedle vlastni konkordance radu dalśich nastroju, popr. WordCruncher z Brigham Young University nebo KAYE od G. Kaye, vyvinuty pro firmu IBM, v prostredi Maclntoshe pak zvlaśte uspeśny Conc, ktery je volne śiritelny (mj. prostrednictvim Consortium for Lexical Research v Novem Mexiku). Pro velke poćitaće (mainframe, ale i Unixov-ske pracovni stanice) byl vyvinut OCP (Oxford Concordance Programme), jimź byl zpracovan velky oxfordsky slovnik a z nehoż byl pro potreby PC pak vytvo-ren i zmineny Micro-OCP. Pro svuj velky rozsah muże byt. do formy konkordance pfevedena też jen urćita ćast jazykov>'ch dat korpusu, a to v zasadę bud’ ućelove (se zadanim omezeneho a dobre vymezeneho crte, popr. i możne selekce, napr. pfi tvorbe slovniku), nebo obecne jako omezene referenćni jadro korpusu pro zakladni (strućne) overovani hlavnich dat a jejich rysu.

Fuli-textova databaze (też jen textova databaze) leżi v podstate kdesi na pul ceste mezi syntagmatickou linearni podobou retezcu textovych vyskytu a jejich paradigmatickou podobou v jazykovem systemu. Tuto jeji pfechodnou povahu zabezpećuje kombinace linearni textove podoby korpusu a pfidaneho znaćkovani (viz i vyśe), ktere k linearnim tvariim pfirazuje jejich kategorie, a tedy i paradig-maticke tridy; mira, podoba a forma techto znaćek muże byt ovśem velmi ruzna. Prace s takovouto podobou korpusu, ktera je dnes obvyk!e i podobou pro cely korpus zakladni a nejuplnejśi, umożńuje diky specialnimu ułożeni pomoci zvlaśtnich indexu rychle vyhledavani a vyvolavani (angl. data retrieval) zadanych potrebnych dat v celem korpusu; lze tu vyhodne vyhledavat i kombinace slovnich tvaru oddele-ne i vetśim poćtem jinych s!ov, jejich souhmny vypis, statistiky apod. Pro prostredi DOS je nejznamejśi zmineny WordCruncher, popr. ruzne dalsi komerćni nelingvis-ticke full-textove programy; v prostredi UNIX je zdaleka nejrozśirenejśi program PAT (srov. napr. Salminen et al., 1992).

Plnou korelaci se systemem a jeho kategoriemi tento typ programu v żadne podo-be pochopitelne neumożńuje; zależi to na vnesenem znaćkovani a to zase na kvalite vychozi teorie, kterou odrażi. Hlavni potrebou lingvisty je totiż obvykle prevest textove flektivni tvary a varianty pod neutralni slovnikove reprezentace, tj. jejich lemmatizace. Lemmatizator je tudiż takovy program, ktery sam nebo v propojeni s jinym programem (napr. full-textovou databazi) dokaże vśechny t.vary lexemu svest dohromady pod spolećne lemma, napr. nominativ ći infinitiv (u ćeskych sloves‘muże jit o desitky aż stovky tvaru k jedinemu slovesu); vyvijeny ćes-ky lemmatizator muże navic k danemu lexikalnirnu zakładu, resp. korenu dodavat i pravidelne derivaty z oblasti tvoreni slov, tedy slovni ćeledi. Żądny lemmatiza-tor vśak dosud neni schopny lenimatizovat viceslovne tvary a jednotky, vżdy se jeho możnosti omezuji na diskretni hranice tvaru jedineho; zde tedy zustava cele vyznamne pole otevrene a dosud nefeśene.

Tfeti formou spravy a zpracovani korpusovych dat je databaze, obvykle relaćniho typu, kde se bud’ użivaji individualne konstruovane databazove progra-

127


Slovo «i slovesnost, 56, 1995


Wyszukiwarka

Podobne podstrony:
ARYOWIE I ICH SIEDZIBY. 173 do szukania tejże kolebki w strefach krajów cieplejszych, bądź i s tni e
mikroekonomia wykłady (22) hoAjO woJkĄO) cej U/yCWOOi>»ej S^opu 9(xo*1/ Cj (XjvVtA AU- T-£ U2.Vt
mikroekonomia wykłady (22) hoAjO woJkĄO) cej U/yCWOOi>»ej S^opu 9(xo*1/ Cj (XjvVtA AU- T-£ U2.Vt
3 Doggies 8 and 2 pieces wilh w hit ej Ch 3, tum. Row I: Startmg in secnnri ch frora hook, work
mikroekonomia wykłady (22) hoAjO woJkĄO) cej U/yCWOOi>»ej S^opu 9(xo*1/ Cj (XjvVtA AU- T-£ U2.Vt
VIII Zaopatrzenie Uczelni System 22:Zakupy CG Zakupy materiałów i usług CH Zakupy aparatury
pytania na nieorg 2 22.Wyjaśnij na przykładzie związku A12(CH,)6 wiązanie trójccntrowc z deficytem e
chemia organiczna zestaw 4 (strona trzecia) 22 Jak można zrealizować następujące przekształcenia: CH
Kotwica0120 236 7. Konstrukcje dachowe Rysunek 7.22. Dach o konstrukcji płatwiowo-kleszczów ej ze śc
DOKONYWANIE ZMIAN ej ch jak namowy, ... -.:ymi niż biały r~ ęsa nosy ryżowej, tofu Tym źródłem :
- 22 mie, Uczniowie przybywali z cał-ej -^olski. Najcześciątbrio oczywiście z Zagłębia Dąbrowskiego
IMG87 (2) miary budowli. Istnieją numo-. ——k ch: ‘takimi elementami są stopnie , Z^ jednakowe ,.vnn
Raz w tygodniu, o t eciej w niedzielę, zbierają się p yjaciele: Bła ej, Gra yna, El bieta, Je y
5 22 Odszukaj wśród rysunków przybory do utrzymania czystości osobistej i pokoloruj je. Przyjrzyj si
BEZ HEJTU EJ O AKCJI Niezmiennie nie wprowadzamy cenzury, jednak społeczność roztocze.net

więcej podobnych podstron