č 2 6 22

č 2 6 22



prav, reprezentativnosti, standardizace aj. Hlavnim centrem mezinarodm inventari-zace elektronickych netechnickych textu je od r. 1991 CETH (Center for Electronic Texts in the Humanities), situovany na univerzitach v Rutgers a Princetonu; no-vym evropskym strediskem se vśak v tomto smyslu stava i Edinburgh. Otazkam a zkuśenostem prace s korpusem se venuji predevśim dva ćasopisy: Literary and Linguistic Computing a Computer and the Humanities, srov. vśak i elektronicky ćasopis CORPORA (viz vyśe).

4.Vystavba korpusu

Hlavni fazę vystavby korpusu tvofi (A) specifikace jeho projektu, tj. jeho typu predevśim podle cile a pouźitelnosti (viz zvl. zde 3.), (B) zajiśteni potrebneho bard waru a softwaru, (C) sber dat a jejich oznaĆkovani (viz zde 2. a dal), (D) zpracovani korpusu a integrace jeho ćasti (textova a relaćni databaze, konkordance, frekvenćni seznamy, lemmatizace aj.) a (E) zajiśteni jeho dalśiho rustu a zpetnych vazeb (srov. Atkins - Clear - Ostler, 1992).

Podle povahy korpusu jsou data v zasadę standardmmi v z o r k y nebo p l n y m i t e x t y , a to tak, aby se co nejverneji zachytila v a r i a b i 1 i t a textu jak z hle-diska jejich typu (variabilita lingvisticka), tak rozsahu a sloźeni jejich distribuce (variabilita situaćni). Jejich vlastni vyber se ridi podle pojeti, vymezeni statisticke populace, a to predevśim kriterii (A) recepce ći (B) percepce, a tedy podle toho, jak licie jazyka użi'vaji (recepce, tj. ve skutećnosti jazyka jen nekolika mało spiso-vatelu, novinaru apod. pro velmi śiroke publikum ruznych medii) ći toho, jak jim pisf a mluvi (produkce, tj. jazyka velmi śirokeho vzorku aktivm'ch użivatelu pro stejne śiroke spektrum pnjemcu). Protoże jednostranna orientace na recepci (A) by znamenala zamenit jazyk jen nekolika profesionalu, jakkoliv vlivny, za skuteć-ne reprezentativni obraz celeho spektra użivatelu, a naopak orientace na produkci (B) by sice zachytila pestrost typu textu, ale za cenu zaznamu i velmi ndkych, ne-li ezoterickych pripadu, je tfeba volit pro vyber textu percepci i recepci v ur-ćite proporci. Predevśim tiinto ohledem je dana zasadni otazka reśeni nezbytne reprezentativnosti korpusu a jeho dat. Druhy m ohledem pf i stanovem po-vahy reprezentativnosti je to, zda zapojena kriteria urćujfći typy sledovanych textu, tj. (C) textu jakożto produktu, jsou externf ći intern! (srov. też Biber, 1993). In-terni kriteria jsou kriteria lingvisticka (jazykova, tykaj! se ne/formalnosti textu, vztahu lexikon-syntax aj.), kriteria exterm' jsou naopak nelingvisticka (nejazykova, tykaj! se typologie textu, tj. jejich puvodu, ne/pfipravenosti, żanru, situace, odbornosti, ćasu aj.); żadna prima ći jednoducha souvislost mezi obema typy neni. Avśak zakladni orientace primarne ći vylućne jen na toto kriterium (C) by sice zachytila textove typy a registry, ne vśak tolik typicke vzorce uzu ruznych socialnich skupin (srov. i Engwall, 1994).

Zjednoduśeny, avśak vyćerpavajici obraz populace, ktery Ize uźit jako ramec pro strategii projektu korpusu, nabizi D. Biber (1993); uvażuje o sedmi hierarchizova-nych situaćnich parametrech, poużitelnych hlavne pro stanoveni povahy vzorku (z nichż hlavni jsou prvni tri):

1    primarni kanał (jazyk psany/mluvenv/transkribovany)

2    format (ne/publikovany, uvnitf dal deleny)

3    scena (institucionalni/jina verejna/soukroma ći osobni)

4    adresat (a-pluralita: ne/vyćisleny/pluralovy/individualni/ja sam;

124


Slovo a slovesnost, 56, 1995


Wyszukiwarka

Podobne podstrony:
lab 22 2 K - ^dcrf/U&SC /UU2^AJ^04060ĆL //JdodoSc /aJłIcĆ&mi.    /Cdcyzn dzj
PROJEKT z dnia 22.09.2005 STANDARDY KSZTAŁCENIA kierunek informatyka STUDIA PIERWSZEGO STOPNIA
22.Rzecznik - reprezentuje 23.    Margines w ubezpieczeniach osobowych zależy od -
Slajd12 (22) Różnice w reprezentacji danych . i Różna reprezentacja liczb całkowitych (np. uzupełnie
Untitled Scanned 22 4 PC-°bO^ zeaowf aj raA-uz* vi<2j wiym €j ix<- piną.Jy UXóvł w-jcp^oł pTy^
Załącznik nr 5 do Uchwały nr 87/2004 RG zdn. 22.04.04r.STANDARDY NAUCZANIA DLA KIERUNKU STUDIÓW TECH
ANSI C 8 6 STRUKTURY_______ Ta funkcja zakłada, że prostokąt jest reprezentowany w standardowej po
P3261302 22* 5 Mrtodi nabyć** w standardy 22* 5 Mrtodi nabyć** w standardy u    ***»
22 (371) Odchyleńia_ standardowe estymatorów bo i b zależą od g - nieznanej wartości odchylenia stan
pytania na nieorg 2 22.Wyjaśnij na przykładzie związku A12(CH,)6 wiązanie trójccntrowc z deficytem e
Z ryciny 22.2 wynika, że każde ciągle widmo rentgenowskie zawiera wyróżnioną falę elektromagnetyczną
Sam Zrobię88 6 (22) Rys. 2. Schemat ideowy gry Rys. 3. Wygląd układu scalonego (a ) i diod elektrol
strona (392) Ryc. 5-22. Stymulacja punktu ruchowego (ułożenie jednobiegunowe) za pomocą trzymanej w-

więcej podobnych podstron