ELEMENTY METODOLOGII BADAŃ NAD JĘZYKIEM
1. EPISTEMOLOGICZNE PODSTAWY NAUKI
poniżej
1.1. Wyznaczniki nauki: przedmiot, cel, metoda.
Przedmiot - materialny (dane, np. Cechy, to co dane do zbadania) i formalny (aspekt, punkt patrzenia na przedmiot, decyduje o metodzie)
Cel - nie można odłączyć od siebie celów poznawczych i praktycznych
Metoda - sposób badania rzeczywistości i dochodzenia do prawdy. Świadomy sposób postępowania, prowadzący do osiągnięcia jakiegoś celu. Odkrywa i systematyzuje wiedzę. Tworzy język nauki.
Typy: dedukcyjna, indukcyjna.
1.2. Metoda a teoria.
Teoria - wiedza wyjaśniająca jakiś zespół zjawisk, zespół logicznie powiązanych twierdzeń, spełniający kryteria poprawności metodologicznej.
1.3. Metoda a metodologia.
Metodologia - ogół metod przyjętych w danej teorii naukowej albo zastosowanych w danej pracy naukowej, nauka o metodach badań naukowych, w szczególności o skutecznych sposobach oceny ich wartości poznawczych.
1.4. Nauka a pojęcie prawdy.
Tarski - zdanie prawdziwe to zdanie, które wyraża, że tak a tak rzeczy się mają, i rzeczy mają się tak właśnie.
Prawda to właściwy sposób uchwycenia rzeczy.
Podziały:
Relatywizm vs Absolutyzm - czy do istoty rzeczy można dojść? R - nie, A - tak.
Racjonalizm vs Empiryzm - apriorycznie czy aposteriorycznie?
Wyjaśnienie analitycznie vs syntetyczne - od ogółu do szczegółu vs od szczegółu do ogółu
Realizm vs idealizm - świat poznawalny i opisywalny vs zawsze uwarunkowane pojmowanie świata
Kryteria prawdy:
psychologiczne - intuicja, powszechna zgoda, objawienie, etc.
Logiczne - koherencja, ekonomia systemu, konwencja
praktyczne - skuteczność, użyteczność, praktyczność.
Nauka - zbiór sądów, zdań deklaratywnych (opisowych, obserwacyjnych, sądów na temat wiedzy implicytnej) o rzeczywistości.
1.5. Cechy pytań naukowych.
poprawne (stosowne, jednoznaczne)
trafne (oparte na prawdziwych założeniach)
rozstrzygalne - nierozstrzygalne są takie, na które odpowiedzi nie możemy udzielić (ale z czasem mogą stać się rozstrzygalne)
zasadne - niezasadne są pytania dawno rozstrzygnięte, banalne
2. WYJAŚNIANIE W NAUCE
2.1. Wiedza jasna a wiedza wyraźna (wg Zawadowskiego).
wiedza jasna (implicytna) - nieuświadomiona, np. kompetencja językowa, nie znamy jej reguł, ale wiemy, 'jak to się robi'
wiedza wyraźna (eksplicytna) - dokładnie jesteśmy w stanie określić jej pochodzenie, zbiór sądów na temat wiedzy jasnej
Język zazwyczaj poznajemy najpierw implicytnie. Odwrotnie z szachami, znakami drogowymi, etc.
2.2. Podział zdań deklaratywnych.
poniżej
2.2.1. Zdania analityczne.
Analityczne (aprioryczne) - wartość logiczna przypisywana na podstawie logiki i znajomości języka, niezależnie od doświadczenia.
2.2.2. Zdania syntetyczne.
Syntetyczne (aposterioryczne) - wymagają odwołania do doświadczenia, empirycznego sprawdzenia.
2.3. Wyjaśnianie idiograficzne a nomotetyczne.
Nomotetyczne - wnioskowanie niezawodne oparte na dedukcji, od ogółu (zdania analitycznego) do szczegółu; aksjomat → teoremat; nauki dedukcyjne (logika, matematyka).
Idiograficzne - wnioskowanie nieniezawodne, oparte na indukcji, od szczegółu do ogółu; przez pojedyncze twierdzenia do ogólnej tezy; jest uprawdopodabniające, ale nigdy nie można zbadać całego zbioru.
2.4. Klasyczna opozycja metodologiczna (indukcjonizm - dedukcjonizm).
Indukcja - od szczegółu do ogółu
Dedukcja - od ogółu do szczegółu
Nie ma nauk czysto indukcyjnych.
2.5. Kanony indukcji eliminacyjnej (wg J. S. Milla).
poniżej
2.5.1. Kanon zgodności.
Dotyczy związków pomiędzy przyczyną i skutkiem danego zjawiska.
Jeżeli dany element powtarza się w danym układzie w różnych konfiguracjach, to może on być czynnikiem powodującym zjawisko.
Dany element występuje stale, podczas gdy inne elementy nie występowały stale.
2.5.2. Kanon jedynej różnicy.
Ma miejsce wtedy, kiedy możemy wskazać warunki niezbędne do zaistnienia danej sytuacji.
Jeżeli zjawisko Z stale występowało, gdy występowało też zjawisko X, a stale nie występowało, gdy nie występowało zjawisko X, można domniemywać, że zjawisko X ma istotny związek ze zjawiskiem Z.
2.5.3. Kanon zmian towarzyszących.
Możemy zastosować wówczas, gdy zaobserwujemy zmiany w natężeniu zjawiska, w zależności od sytuacji towarzyszących.
Podczas gdy zjawisko X ulega analogicznym zmianom do tych, które zachodzą w zjawisku Y - prawdopodobnie zjawisko X ma istotny związek ze zjawiskiem Y.
3. PODSTAWOWE PODZIAŁY W OBRĘBIE JĘZYKOZNAWSTWA
3.1. Językoznawstwo ogólne (teoretyczne) a szczegółowe (empiryczne).
Ogólne - zajmuje się budowaniem ogólnej teorii języka, tworzy narzędzia badań dla nauk szczegółowych, definiuje podstawowe pojęcia, formułuje ogólne hipotezy.
Nauka o uniwersalnych regułach i strukturach budowy języków czasu (wstęp do nauki o języku).
Szczegółowe - sprawdza, falsyfikuje teorie językoznawstwa ogólnego; bada poszczególne zjawiska (praktycznie); analizuje konkretny materiał badawczy. Inaczej językoznawstwo opisowe (np. Gramatyka opisowa).
Wzajemnie się dopełniają.
3.2. Językoznawstwo diachroniczne (historyczne) a synchroniczne.
Podział de Saussure'a;
Synchroniczne - zatrzymuje język w danej chwili jego istnienia, bada go jako zjawisko statyczne; kluczowy jest dla niego moment czasowy. Statyczny punkt widzenia.
Diachroniczne - bada język jako twór żywy, ciągle rozwijający się, bada zmiany zachodzące w języku z upływem czasu, na podstawie zdań ogólnych ustala zasady ewolucji języka.
3.3. Językoznawstwo porównawcze a kontrastywne (konfrontatywne).
Porównawcze - inaczej historyczne, porównuje procesy rozwoju danych języków
Kontrastywne - porównuje języki w danym momencie czasowym - synchronicznie.
+
Typologiczne - ustala związki między językami abstrahując od rzeczywistego pokrewieństwa; np. podobieństwa między systemami głoskowymi, morfologicznymi, składniowymi, etc.
3.4. Językoznawstwo podstawowe a stosowane.
Podstawowe - badania nieukierunkowane praktycznie; prowadzone, by odkryć coś nowego, rozwinąć pewien problem badawczy.
Stosowane - znajduje zastosowanie dla ustaleń nauki podstawowej - logopedia, metodologia nauczania języka, teoria przekładu, etc.
3.5. Językoznawstwo opisowe a normatywne.
Opisowe - typowo naukowe, opisuje, nie oceniając, zdaje sprawę z pewnym faktów
Normatywne - kiedy formujemy zalecenia, jak należy mówić, etc. - na pograniczu nauki.
3.6. Związki językoznawstwa z innymi dziedzinami.
Psycholingwistyka - pokazuje proces przyswajania języka, problemy z relacją między językiem a myśleniem - czy jakaś część naszego myślenia wymyka się językowi? Akwizycja języka.
Etnolingwistyka - o pochodzeniu, wytworzeniu się systemu języka, językowy ludowy obraz świata. Jakie wartości są związane z poszczególnymi elementami świata. Amalgamat, np. Kultu słońca (nie można na nie wskazywać palcem, wyrzucać śmieci w jej kierunku, etc).
Socjolingwistyka - relacje między rozwarstwieniem języka a rozwarstwieniem społecznym. Np. Języki poszczególnych zawodów.
Geografia językowa - bada zasięg poszczególnych form/cech językowych, zróżnicowanie terytorialne języka.
Dialektologia - bada języki poszczególnych regionów, klas społecznych, etc. Język kaszubski, śląski, etc.
4. POJĘCIE PARADYGMATU NAUKOWEGO.
4.1. Paradygmat naukowy w ujęciu Thomasa Kuhna.
Zespół norm, wzorców, reguł postępowania przyjęty w danym czasie w danej dziedzinie przez pewną społeczność badaczy - paradygmat badawczy.
4.2. Schemat rozwoju nauki w ujęciu Thomasa Kuhna.
PRENAUKA (rozmaite sądy na temat przedmiotu, nieuporządkowane, nie ma jeszcze norm i wzorców postępowania) → PARADYGMAT NAUKOWY (nagromadzenie sądów wymaga uporządkowania - ustalenia paradygmatu) → KRYZYS → REWOLUCJA → NOWY PARADYGMAT
4.3. Najważniejsze paradygmaty naukowe.
4.3.1. Paradygmat indukcjonistyczny.
Podstawą nauki - zdania obserwacyjne, a głównym zadaniem - zbieranie faktów i przechodzenie od zdań szczegółowych do zdań ogólnych potwierdzonych.
4.3.2. Paradygmat weryfikacjonistyczny.
Podstawą nauki - ogólne hipotezy, a głównym zadaniem - empiryczne weryfikowanie tych hipotez.
Koło Wiedeńskie - każde zdanie obserwacyjne ma sens tylko w obrębie pewnej teorii, a więc systemu zdań ogólnych.
4.3.3. Paradygmat falsyfikacjonistyczny.
Podstawą nauki jest falsyfikowanie hipotez i poszukiwanie ogólniejszych hipotez; hipotezy ogólnej nie można potwierdzić zdaniami szczegółowymi ,więc nauka nigdy nie dostarcza pewności (K. Popper).
4.3.4. Paradygmat postmodernistyczny.
Anarchistyczna koncepcja wiedzy (P. Feyerbrend); granice wiedzy naukowej wyznacza kultura (gust, etc); tworzenie nauki to tworzenie tekstów, które uznaje się za naukowe (Derrida), rozumienie zamiast wyjaśniania.
4.4. Paradygmaty naukowe a paradygmaty językoznawcze.
Indukcjonistyczny - językoznawczy: historyczno-porównawczy
Popularny w XIX wieku, kiedy powstało językoznawstwo. Pokazywało języki w różnych fazach rozwoju i porównywało je ze sobą.
Wady: niemożliwa jest naukowa obserwacja bez żadnych założeń teoretycznych - nie wiedzielibyśmy wówczas, co mamy obserwować; opisywanie faktów językowych w oderwaniu od innych faktów nie daje pełnego obrazu opisywanego języka.
Weryfikacjonistyczny - językoznawczy: strukturalistyczny
Binarny: langue - parole, diachronia - synchronia, syntagma - paradygmat
Swoimi badaniami starają się udowodnić, że język jest systemem znaków.
Falsyfikacjonistyczny - językoznawczy: generatywno-transformacyjny
Podstawowe założenia: gramatyka w postaci systemu dedukcyjnego, zatem każda falsyfikacja teorii standardowej kończyła się zaproponowaniem nowej teorii, Noam Chomsky.
Gramatyka może tylko generować zdania, albo może je generować i transformować.
Postmodernistyczny - językoznawczy : kognitywizm
Cechuje go niejednorodność (definicyjna cecha postmodernizmu), zrozumienie zamiast wyjaśniania. Próbuje odpowiedzieć na pytanie, jaka jest rola języka w powstawaniu świata.
4.5. Wzajemne oddziaływanie paradygmatów.
Stawianie hipotez historycznojęzykowych i weryfikowanie ich empirycznie;
procedury falsyfikujące w strukturalizmie;
wskazywanie kategorii pośrednich i prototypów w generatywizmie.
5. DEFINICJE I BŁĘDY DEFINIOWANIA
Żeby uniknąć zarzutu, że pytania zawiera wyrazy wieloznaczne, przeprowadza się operację myślową zwaną definiowaniem.
5.1. Budowa definicji klasycznej.
DEFINIENDUM (człon definiujący) + SPÓJNIK DEFINICYJNY + DEFINIENS człon definiowany (genus proximum /rodzaj najbliższy/ i differentia specifica /różnica gatunkowa/)
5.2. Typy definicji słownikowych.
Definiuje znaczenie i właściwości językowe wyrazu.
5.2.1. Definicje ikonograficzne.
Nauka przez pokazywanie rzeczy w świecie, przez obrazek jabłka definiuje jabłko, etc.
5.2.2. Definicje zwerbalizowane.
Wyrażona słowami.
5.2.3. Definicje niesemantyczne.
Nie dają wiadomości na temat znaczenia danego wyrazu, a jedynie o jego właściwościach - sposobie użycia, funkcji w zdaniu.
5.2.3.1. Definicje pragmatyczne.
Znaczenie i właściwości. Sposób użycia.
5.2.3.2. Definicje gramatyczne.
Wskazują cechy gramatyczne wyrazu.
5.2.4. Definicje semantyczne
Dają wiadomości na temat znaczenia wyrazu.
5.2.4.1. Definicje metajęzykowe
Nadjęzykowe, poza ciągiem składniowym; wskazują zastosowania definiowanego słowa a tekście.
5.2.4.2. Definicje przedmiotowe.
Postulat przekładalności.
5.2.4.2.1. Definicje rozczłonkowane.
Iść i coś trzymać jako 'nieść', czyli złożone z paru czynności. Przyjmuje się, że są lepsze, bo ukazują elementy prostsze.
5.2.4.2.2. Definicje nierozczłonkowane.
Gdy definiujemy wyraz nacechowany przez neutralny (?) . Oparte na jednym elemencie. Np. 'być narąbanym' jako 'być pijanym'.
5.3. Podstawowe błędy definiowania.
brak synonimii między definiendum a definiensem
A) d1 ma szerszy zakres niż d2 - szczenię - młody wilki
B) d1 ma zakres węższy niż d2 - pudel - mały pies
definiens jest ciągiem jednostek o tym samym lub większym stopniu złożoności, co definiendum
A) idem per idem - definiowanie wyrazu nim samym (np. słony - mający słony smak)
B) ignotum per ignotum - nieznane przez nieznane (troskliwy - pieczołowity)
definicja encyklopedyczna zamiast słownikowej
6. ŹRÓDŁA DANYCH LINGWISTYCZNYCH
6.1. Introspekcja
6.2. Źródła archiwalne.
6.3. Słowniki, listy frekwencyjne i konkordancje.
6.4. Korpusy i elektroniczne bazy danych.
6.6. Badania ankietowe.
6.6.1. Budowa ankiety.
Części kwestionariusza:
I Wstępna: część formalno-ewidencyjna
Nazwa placówki prowadzącej badania;
Tytuł kwestionariusza;
wprowadzenie;
a) określenie celu badań (naukowego i praktycznego)
b) zapewnienie o poufności (anonimowości) danych
c) Uzasadnienie wyboru respondenta (np. wybór losowy)
d) instrukcja (zbiorcza lub przy każdym pytaniu)
e) apel o szczerość
f) określenie sposobu zwrotu ankiety
g) podziękowanie.
II Właściwa: pytania.
Społeczno-demograficzne
O przedmiot badań
III Końcowa: podziękowania, prośba o powtórne sprawdzenie odpowiedzi, etc.
6.6.2. Typy pytań ankietowych.
6.6.2.1. Kryteria podziału pytań ankietowych.
Jak wyżej, plus:
Podział ze względu na cel:
wprowadzające
o źródła informacji
o opinię
o wiedzę
o fakty
o sugestie
o motywy
Podział ze względu na budowę:
zamknięte logiczne i techniczne
otwarte logiczne i techniczne
zamknięte logiczne, otwarte techniczne (autentyczniejsze, swobodniejsze i pełniejsze odpowiedzi, osadzone w kontekście wiedzy respondenta, ale trudniejsze do analizy, bardziej męczące dla respondenta, często pozostawiane bez odpowiedzi)
otwarte logiczne i zamknięte techniczne (ułatwiają pracę respondentom i badaczom, przynoszą materiały ujednolicone i zestandaryzowane, ale mogą sugerować odpowiedz dzięki prekategoryzacji)
Kryteria podziału pytań zamkniętych:
Miejsce usytuowania odpowiedzi:
a) wbudowane odpowiedzi
b) zewnętrzne odpowiedzi
Sposób przedstawiania alternatyw:
a) pytania rozstrzygnięcia (czy?)
b) pytania dopełnienia (które?)
Żądanie wyboru:
a) żądanie określonej liczby odpowiedzi
b) żądanie wszystkich odpowiedzi
Rozszerzenie zupełności:
a) minimalne
b) ograniczone
c) maksymalne
Budowa listy odpowiedzi:
a) alternatywy
b) kafeterie
- dysjunkcje
- koniunkcje
- rangi
numerowanie
porównywanie par
- skale
jednostronne
dwustronne
dyferencjał semantyczny
Podział pytań ze względu na funkcje:
dotyczące badanej problematyki
metryczkowe
wykluczające się
puste i podchwytliwe
filtrujące
sprawdzające
6.6.2.2. Budowa listy odpowiedzi.
jw.
6.6.2.3. Dyferencjał semantyczny.
6.6.3. Podstawowe błędy w konstruowaniu pytań ankietowych.
7. BADANIA KORPUSOWE
Rodzaje korpusów:
jednojęzyczny vs wielojęzyczny
synchroniczny vs diachroniczny
mieszany vs jednoodmianowy (chodzi o odmiany języka)
duży korpus vs megakorpus (duży: do kilkudziesięciu mln wyrazów; mega: setki mln i +)
lokalny vs rozproszony
zrównoważony vs oportunistyczny
7.1. Metody budowy korpusów językowych.
7.1.1. Określenie wielkości korpusu.
Podział na duży korpus i megakorpus (wyżej)
7.1.2. Dobór materiałów.
Jednojęzyczny vs wielojęzyczny, synchroniczny vs diachroniczny, mieszany vs wieloodmianowy, lokalny vs rozproszony, zrównoważony vs oportunistyczny.
7.1.3. Podział tekstów na segmenty.
Za pomocą analizatora morfologicznego(?) Morefusz.
7.2. Pojęcie korpusu zrównoważonego.
Korpus zrównoważony jest:
Reprezentatywny: z przyjętą dokładnością odzwierciedla strukturę całej populacji (zbiorowości generalnej). Odpowiednia frekwencja, kolejność.
Warunki reprezentatywności:
skończoność populacji (język zamkniętym systemem znaków, skończona ilość elementów - ale to raczej niemożliwe)
homogeniczność - różnorodne style, różnice między językiem mówionym a pisanym sprawiają, że korpus nie może stać się h.
7.3. Typowe narzędzia oferowane przez korpusy elektroniczne.
7.4. Zastosowania korpusów językowych
7.5. Korpusy języka polskiego.
7.5.1. Korpus Słownika frekwencyjnego polszczyzny współczesnej.
korpus słownika frekwencyjnego polszczyzny współczesnej — zestaw tekstów zebranych w latach 1963-1967 na potrzeby badań nad częstością występowania wyrazów w języku polskim.
Składa się na nie 10 000 próbek po około 50 słów każda, czyli ogółem ok. 500 000 słów z tekstów współczesnego języka pisanego, zgromadzonych w pięciu transzach odpowiadających najważniejszym stylom polszczyzny pisanej. Wyniki dla poszczególnych stylów zostały w latach 1974-77 udostępnione w postaci list frekwencyjnych, natomiast w roku 1990 ukazał się słownik frekwencyjny polszczyzny współczesnej w postaci tomu zbiorczego.
7.5.2. Korpus Języka Polskiego PWN.
Korpus ogólny współczesnej polszczyzny, wchodzący obecnie w skład Narodowego Korpusu Języka Polskiego. Udostępniona w sieci wersja (40 milionów słów) stanowi fragment większego korpusu, skompilowanego dla wewnętrznych potrzeb wydawnicwa.
Rozmiar: 40 mln. segmentów (pełna wersja sieciowa); 7 250 000 segmentów (wersja demonstracyjna)
Struktura: Korpus stosunkowo zrównoważony z przewagą artykułów prasowych. Składa się z dwóch części: połowa to zrównoważony tematycznie i gatunkowo zbiór próbek tekstu z około 2000 źródeł; druga połowa to artykuły prasowe z Rzeczypospolitej. Większość tekstów pochodzi z lat 1990-2005. Poniżej skład procentowy pełnej wersji sieciowej:
Język pisany - 95,5% |
Język mówiony - 4,5% |
|
|
Język pisany |
Język mówiony |
|
|
Dostępność: Online, ze strony projektu (polska i angielska wersja językowa). Dostępna bezpłatnie jest tylko wersja demonstracyjna z ograniczonymi możliwościami wyszukiwania. Wersja demonstracyjna na CD jest również dodawana do luksusowego wydania Uniwersalnego słownika języka polskiego. Dostęp do pełnej wersji sieciowej (doba/miesiąc/rok) można wykupić płacąc kartą, przelewem lub SMSem.
7.5.3. Korpus Instytutu Podstaw Informatyki PAN.
Korpus IPI PAN to duży, anotowany morfosyntaktycznie (wtf?) korpus ogólny współczesnego języka polskiego. Powstał on w Instytucie Podstaw Informatyki PAN w latach 2001-2004. Poza samym korpusem, w ramach projektu powstały również: system znaczników morfosyntaktycznych (tagów), narzędzie anotujące (tager) oraz zestaw narzędzi do przeszukiwania korpusu i tworzenia konkordancji - Poliqarp. Korpus IPI PAN stanowi obecnie komponent Narodowego Korpusu Języka Polskiego.
Rozmiar: ok. 250 mln. segmentów
Struktura: Brak szczegółowych danych dotyczących pełnej wersji korpusu. Twórcy projektu podają informacje jedynie o składzie 30-milionowej, stosunkowo zrównoważonej próbki, przedstawione poniżej:
Język pisany - 85 % |
Język mówiony - 15% |
* Proza dawna to głównie teksty powstałe w XIX w i na początku wieku XX - należące do kanonu literatury polskiej. |
|
Jednym z podkorpusów IPI PAN-u jest zawierający około 662 tysięcy segmentów Korpus Słownika Frekwencyjnego IPI PAN. Został on utworzony na bazie Słownika frekwencyjnego polszczyzny współczesnej PAN (Kraków 1960). W wersji podstawowej zawierał on 500 tysięcy segmentów po 100 tysięcy słów z: tekstów popularnonaukowych, drobnych wiadomości prasowych, tekstów publicystycznych, prozy artystycznej, dramatu artystycznego. W odróżnieniu od całości, Korpus Słownika Frekwencyjnego nie zawiera pełnych tekstów - zbudowany jest z 10 tysięcy próbek po 50 słów każda.
Anotacja: Korpus anotowany morfosyntaktycznie. Oznaczone zostały klasy gramatyczne (np. rzeczownik, przymiotnik, imiesłów) i kategorie gramatyczne (np. liczba, przypadek, rodzaj, osoba).
Przykładowy znacznik dla słowa 'mężczyzna' to: [subst:sg:nom:m1] - pierwsza wartość to klasa gramatyczna (rzeczownik), kolejne określają wartości odpowiednich dla tej klasy kategorii gramatycznych (liczba, przypadek, rodzaj). Szczegółowy opis znaczników morfosyntaktycznych zastosowanych w korpusie znajduje się w Ściągawce do Korpusu IPI PAN.
Z każdym tekstem znajdującym się w Korpusie IPI PAN związane są metadane. Część z nich można przeszukać za pomocą programu Poliqarp. Są to:
autor tekstu (dla książek)
tytuł tekstu
styl tekstu (np. artystyczny, publicystyczny)
medium/ kanał publikacji (prasa, książka, internet, rękopis)
wydawca tekstu książkowego lub prasowego
miejsce wydania tekstu książkowego lub prasowego
data (pierwszego) wydania
data powstania
Pozostałe korpusy:
Korpus PELCRA (Polish and English Language Corpora for Research and Application)
Korpus staropolski IJP PAN w Krakowie (do 1500 roku, wszystkie teksty, 500.000 wyrazów; nie ma problemu z reprezentatywnością)
Współczesny korpus języka polskiego (tzw. krakowski), 16 mln wyrazów, teksty ważne kulturowo (więc średnio reprezentatywny); powstawał w latach 70'.
zasoby internetowe też mogą być traktowane jak korpus.
3