dva hlavm (Atkins - Clear - Ostler, 1992): (a) jako extenzivniho zdroje dat, z ne-hoź je możne vybirat, co je potrebne, a (b) jako prostredi pro testovani, trenovani a vylepśovani automatizovanych (lingvistickych) nastroju ruzneho druhu.
Lingvisticke v y u ż i t i korpusu pochopitelne zavisi na tom, s jakym ci-lem a v jakem rozsahu były vybudovany; proti specificky orientovanym stojl korpus relativne obecny a vicefunkćni, ktery vśak sam muże byt slożen z ruznych homo-gennich vrstev, resp. subjazyku (Mc.Naught, 1993) vhodnych pro specifićtejśi cile. Podle stupne oznaćkovani a analyży korpusu, u ktere - vzhledem ke splyvave po-vaze dat - zkuśenosti (McNaught, 1993; Leech, 1993 aj.) stale vice mluvi jen pro obecnou skeletonovou podobu, lze zakladni prąci s text.ovym korpusem videt v peti fazich:
1 identifikace tvaru v text.u,
2 zjiśteni distribuce tvarii a jejich komhinaci s cflem odhalit syntakticke a seman-ticke tridy a jejich kombinace, vćetne kombinaci pevnych,
3 zjiśteni, jak tyto sernanticke tridy a jejich kombinace tvor( vyśśi semanticke celky a struktury,
4 zjiśteni, jak se tyto vyśśi struktury kombinuj! v zakladni textove jednotky,
5 zjiśteni, jak se zjiśtene vysledky proinitaji/mapuji do struktur jineho jazyka.
Nektere, zvl. formalni pristupy pristupovaly k popisu jazyka ćasto s nevyslove-
nym predpokladem, że je budę możne overit prave na tak rozsalilem materiału, jaky nabizi jedine korpus (u nas napr. Sgall a kol., 1986; Sgall - Hajićova - Pane-vova, 1986), vetśina si jich ovśern ten to predpoklad nekladla. Dnes je zrejme, źe jen skrze korpus pujde (1) - vzhledem k tomu, że tradićni popisy leccos vynechavaji -poprve v historii o możnost relativne uplneho popisu jazyka, (2) o precizaci, resp. redistribuci hranic a podstaty mnohych tradićnich jazykovych kategorii a jevu (po-pf. testovani dosavadnich gramatik), (3) o prvni popis jevu, pro ktere dostatećna data dosud nebyla k dispozici, a v neposledni rade (4) i o realnou śanci objevu jevu a souvislosti zcela novych. Po propojeni synchronniho korpusu s diachronnim (srov. napr. Rissanen, 1989) lze mj. (5) ziskat nejen lepsi predstavu o typech ja-zykove variability (srov. 5.2.), ale i o zakonitostech vyvoje ćeśtiny. Je ovśem tfeba tu i videt urćite problemy, znanie uż dnes: yedle do znaćne miry otevrene otazky reprezentativnosti korpusu (k niż cesty pres vagni a prekryvajici se typologii textu zrejme nevedou), popr. i jeho vśestrannosti, korpus ovśem nemiiże dobre obecne reśit otazku negativniho dokladu, vyskytu jevu; feśi ji jen ad hoc po explicitnini zadani. Tuto otazku ovśem nereśi ani vetśina popisu dosavadnich.
Obecne budę pozornost venovana vetśine techto oblasti i specifickych jevu zna-menat i specifickou renesanci zajmu o statisticke aspekty jazyka (Baayen, 1992; Kohler et al., 1993), a to nejen v jevech paradigmatickych, ale i syntagmatickych, zvlaśte v oblasti kolokability jazykovych forem (lexemu, Church - Hanks, 1990) a jejich pravidel ći norem (Church - Hanks, 1990). Jednou z hlavnich metodo-logickych otazek, kterou budę treba tak ći onak zodpovedet (srov. Leech, 1991), je to, zda budę możne budouci analyzu jazyka na korpusu oprit uź o indukova-ne a autoinatizoVane procedury objevovani (discovery procedures), ći zda lingvista budę i nadale inuset zustat. u sve intuice a lingvisticke distinkce do textu vnaśet (v podstate arb i tramę). Menśi mira uspeśnosti dosavadnich kognitivnich pristupu
131
Slow a slovesnost, 56, 1995