2. Metodologiczne i teoretyczne podstawy współczesnej leksykografii
30
2.3.1. Metoda tradycyjna
Podstawową czynnością techniczną w pracy leksykografa jest /gromadzenie zbiorą tekstów. Nic idzie tu o zwykły zbiór tekstów, ale o zbiór w postaci kartoteki cytatów, które staną się podstawą interpretacji materiału językowego Dlatego podstawowym elementem przygotowawczej pracy Icksyko-graficznej było zawsze sporządzanie kartek (Uszek), na których z wyselekcjonowanych wcześniej źródeł wypisywało się poszczególne zdania. Każde zdanie należało przepisać na tylu kartkach, ile różnych form wyrazowych w mm występowało. Następnie każdą liszkę poddawało się opisowi przez umieszczenie w jej górnej części formy podstawowej odpowiedniego wyrazu i wkładało się do szufladek (lub pudeł) tworzących kartotekę słownika Proces ten nazywa się w lingwistyce cksccrpcją. W zależności od przyjętego planu niektóre dzieła cksccrpowano w całości, tzn. rozpisywano na lis/ki całą ich treść, inne tylko częściowo, np. w wylosowanych fragmentach (proces losowania pozwala zapewnić statystyczną reprezentatywność wybranej próby). Przykładowo, na potrzeby Słownika poił redakcją W. Doroszewskiego" (125 tys. haseł) zgromadzono około 6,5 min takich fiszek. a dla Oxford English Dktionary (450 tys. haseł) — 5 min (dane za: Piotrowski 1994a)
Następnie, juz po ustaleniu siatki haseł, osoba odpowiedzialna /a opracowanie określonego hasła pobierała z kartoteki zbiór fiszek zawierających wyraz hasłowy (ich ilość mierzono często nie na sztuki, ale w centymetrach bieżących, tak jak w archiwistyce) i na podstawie ich sortowania, segregowania docierała do analizy znaczeniowej hasła oraz uzupełniała inne segmenty struktury artykułu hasłowego
Jak z tego krótkiego opisu wynika, przygotowawcze czynności Icksyko-graficznc były niezwykle pracochłonne Wymagały więc albo zatrudnienia licznej grapy wykonawców (co okazało się możliwe przede wszystkim przy słowniku Doroszewskiego, ponieważ projekt ten cieszył się ogromnym wsparciem finansowym i organizacyjnym ze strony ówczesnej władzy), albo też długiego czasu Znamienny jest tu przykład Słownika staropolskiego. Ideę jego opracowania sformułowano w latach 70. XJX wieku, pod koniec tegoż stulecia opracowano ie/ zasady cksccrpcji źródeł. Ponieważ jednak przy eks-ccrpcji zatrudnionych było kilka osób. w dodatku dorywczo, proces len ciągnął się aż do okresu jhi II wojnie światowej. Dopiero wtedy z fu ml uszy państwowych powołano pracownię z kilkoma etatami, co pozwoliło zintensyfikować pracę Zeszyt próbny wydano w 1947 roku, pierwszy zeszyt ukazał sie w 1953. Obecnie edycja słownika dobiegała końca, po ponad 100 lalach od po- 1
jawienia się pierwotnego zamysłu. Podobnie czasochłonne 54 prace n.id innymi słownikami naukowymi. Słownik polszczyzny XVI wieku ukazuje się już ponad 35 lat. Słownik ywar polskich PAN, do którego zbieranie materiałów zapoczątkowano przed I wojną światową, przez lat ponad 20 (zdołano wydać materiał obejmujący cztery początkowe litery alfabetu) Od rozpoczęcia prac nad słownikiem polszczyzny XVII wieku do ukazania się pierwszego zeszytu również minęły dwie dekady. Jedną z ważnych przyczyn takiego stanu jest właśnie pracochłonność tradycyjnej metody gromadzenia danych językowych, w .sytuacji gdy ograniczenia linansowe nic pozwalają na powiększenie zespołu leksykografów. Co najgorsze, mimo że obecnie rozwój techniki pozwalałby na automatyzację procesu redagowania tych słowników, zmiana metody okazuje s:ę nieopłacalna Zbyt wielki zasób cytatów zebrano już metodami tradycyjnymi, aby ich kopiowanie na nośniki komputerowe było ekonomicznie uzasadnione.
Rozwój techniki komputerowej otworzył nowe możliwości również w dziedzinie automatyzacji prac leksykograficznych. Etapem pracy leksykografa, w którym komputer może oddać największe usługi, jest właśnie piuccs gromadzenia materiału do słowników. Prace nad korzystaniem z komputerów w badaniach językoznawczych trwały juz. od lat 50., ale dopiero w latach 80 maszyny te osiągnęły taki stopień zaawansowania (przede wszystkim odpowiednią pojemność pamięci), jaki umożiiwia gromadzenie 1 przetwarzanie odpowiednio wielkich zbiorów danych językowych. Wówczas to zaczęły w świetle (zwłaszcza w Wielkie; Brytanii) powstawać komputerowe korpusy tekstów, które później stały się podstawą słowników Wraz z. wkroczeniem techniki komputerowej upowszechnił się w leksykografa termin korpus tekstów, oznaczający zbiór tekstów danego języka (oczywiście, uprzednio wyselekcjonowanych dla zachowania reprezentatywności), utrwalony na nośnikach magnetycznych. przechowywany w pamięci komputerów, który można przeszukiwać za pomocą specjalnie przygotowanych programów. Z leksykografią komputerową wiązano wielkie nadzieje także w Polsce leszcze w latach 80. pojawiały MC plany wykorzystania komputerów me tylko do porządkowania korpusu 1 wyszukiwania w nur. zadanych ciągów tekstowych, aic również, do automatyzacji analizy flcksyjnej, morfologicznej, czy nawet półautomatycznej redakcji haseł (por. np. Lubaszewski, JJyrski J98.S, J9K9; Węgrzy-
Więcei mlormucji nu temat prac nad słownikiem ir.nr.su zralczc we wilępte do słownika (Doroszewski IWH: XXX).