Języki informacyjno-wyszukiwawcze - W. Babik
WYKŁAD 1
18.10.2007 - Literatura, omówienie (podobno) pracy semestralnej.
WYKŁAD 2
25.10.2007 - Definicja strukturalna i funkcjonalna języków informacyjno-wyszukiwawczych.
Wąskie znaczenie terminu, JIW - uważa się, że są to języki sztuczne służące do opisu treści dokumentów. Nowsze opracowania rozszerzają tę definicję również o formę dokumentu.
(to znaczy, że JIW = TREŚĆ + FORMA)
Szerokie znaczenie terminu, JIW - uważa się (Babik również), że języki te są budowane dla różnych typów systemów informacyjno-wyszukiwawczych, a nie tylko do systemów dokumentacyjnych i opisów dokumentów. Babik kazał rozumieć definicję JIW w szerszym znaczeniu!.
Języki informacyjno-wyszukiwawcze są to wyspecjalizowane systemy przeznaczone do opisu treści i podstawowych cech formalnych dokumentów.
KOD - może mieć taką samą strukturę jak język. Reguły kodu nie są jawne dla wszystkich tylko, dla pewnej grupy użytkowników. Pewnym rodzajem kodu są piktogramy oraz ideogramy. Przykłady: @, $, § itp. W JIW informacje są zapisywane za pomocą kodu.
SZYFR - jest rodzajem kodu, służy do zapisu treści umownymi znakami Treść przekazywana za pomocą szyfru jest utajone. Informacje są utajone. Do rozbijania szyfry służy szyfrarka
Język i jego elementy J = S + G + S*
Słownik (słownictwo)
Gramatyka
Reguły interpretacji, semantyka transformacyjna
W każdym języku oprócz elementów można jeszcze uwzględnić poziomy.
Siedem poziomów języka naturalnego:
Cecha dystynktywna fonemu.
Fonem
Morfem
Wyraz
Związek wyrazowy
Zdanie
Tekst
Poziomy języka informacyjno-wyszukiwawczego. (Teoretycznie jest ich 4, Babik uważa jednak, że tak naprawdę jest ich 5).
Elementarny znak graficzny [EZG] (litery, cyfry, znaki semigraficzne) - elementarne znaki graficzne są pustymi semantycznie elementami języka.
Elementarna jednostka leksykalna [EJL] (deskryptory, słowa kluczowe, symbole, tematy)
Zdanie
Tekst JIW (CHWD, IW.)
Z elementarnych znaków graficznych [EZG] tworzy się elementarne jednostki leksykalne [EJL]. W nowszych opracowaniach (zwłaszcza literatura zagraniczna) wyróżnia się 5 poziomów JIW. Drugim poziomem, po EZG, są morfemy, z których tworzy się EJL, a z nich następnie zdania. CHWD i IW to teksty stworzone w językach informacyjno wyszukiwawczych.
CHWD - charakterystyka wyszukiwawcza dokumentu.
IW - instrukcja wyszukiwawcza.
Tekst napisany w JIW może być zawarty np. na karcie katalogowej lub w rekordzie bibliograficznym, ale mogą to być również słowa kluczowe.
Pod języki (subjęzyki, dialekty JIW)
- język indeksowania [indexing language]
- język wyszukiwawczy [retrival language]
DEFINICJA STRUKTURALNA JIW - jest to język sztuczny, który składa się z trzech elementów: słownika, gramatyki i reguł interpretacji, czyli semantyki transformacji, oraz z 5 poziomów [EZG, morfemów, EJL, zdań i tekstu]
JIW - wyspecjalizowały się w realizacji tylko pewnych określonych funkcji, a mianowicie funkcji metainformacyjnej, polegającej na reprezentowaniu treści i formy dokumentów, oraz funkcji wyszukiwawczej, polegającej na wyrażaniu kierowanych do systemu informacyjno-wyszukiwawczego pytań informacyjnych i kształtowaniu procesu wyszukiwania informacji.
Funkcje JIW:
Konstruktywne (istotne)
Funkcja metainformacyjna [opisowa]
Funkcja wyszukiwawcza [znalezienie informacji, faktów, przedmiotów]
Pochodne (mogą być, ale nie muszą)
Organizująca in. porządkująca np. zbiór informacji i/lub faktów
Określania zakresów tematycznych zbiorów i systemów informacyjnych i wyszukiwawczych.
FUNKCJA METAINFORMACYJNA - jest specyficzną funkcja opisową wszystkich JIW przeznaczonych dla dokumentacyjnych SIW.
FUNKCJA WYSZUKIWAWCZA - realizacji tej funkcji służą wyrażane w JIW pytania informacyjne.
Pozostałe funkcje mają charakter wtórny. Należą do nich Funkcja organizująca (porządkująca), oraz funkcja określania zakresów tematycznych zbiorów SIW ( podział pola tematycznego i informacyjnego danego systemu na mniejsze jednostki).
Babik wymyślił 5 funkcję JIW [funkcja babikowa in. reklamowa lub marketingowa] funkcja ta może odnosić się np. do słów kluczowych w headach stron internetowych.
WYKŁAD 3
08.11.2007 - Systemy leksykalne i słownikowe w systemach informacyjno-wyszukiwawczych.
Słownictwo - zbiór wyrazów używanych w danym języku.
Słownictwo JIW > Słownik
W każdym języku wyróżnia się dwa plany (wymyślił je Ferdynand de Saussure, Szwajcar, Babik uważa, że był on wybitnym językoznawcą)
DWIE PŁASZCZYZNY:
Treści (zbiór cech, które można opisać w danym języku)
Wyrażania (forma, w jakiej treść jest wyrażana np. le chat, cat, kot, ĸошка, itd.)
SYSTEM LEKSYKALNY - jest to struktura językowa zbudowana z wykładników językowych znaczeń (wyrazów, leksemów), które można wyrazić w danym języku za pomocą środków, którymi ten język dysponuje.
TRÓJKĄT DOKUMENTACYJNY
System leksykalny ma swoją wewnętrzną strukturę. Tworzy ją sieć formalnych, strukturalnych i funkcjonalnych zależności występujących między jednostkami w systemie leksykalnym danego języka.
EJL - elementarne jednostki leksykalne mają znaczenie, więc są to znaki w pełni semantyczne.
Każdy język ma dwa rodzaje notacji: paranaturalną i sztuczną.
Paranaturalne - występują w sytuacji, gdy jednostki leksykalne języka są równokształtne z wyrażeniami języka naturalnego. Jest to np. Język Haseł Przedmiotowych lub Słów Kluczowych.
Sztuczne - nie korzysta się ze słownictwa języków naturalnych np. UKD.
Języki klasyfikacyjne (sztuczne) używają słownictwa sztucznego. EJL pojawiające się w zdaniach pełnia określoną funkcję. We wszystkich językach informacyjno-wyszukiwawczych wyróżnia się dwa typy jednostek leksykalnych:
autosyntaktyczne jednostki leksykalne, mogą one samodzielnie tworzyć zdania
synsyntaktyczne elementarne jednostki leksykalne, czyli nie samodzielne jednostki (słownictwo pomocnicze)
Słownictwo języków sztucznych jest znacznie uboższe w sferze leksykalnej od języka naturalnego. Tylko niektóre wyrażenia występujące w języku naturalnym są potrzebne do odtworzenia formy i treści dokumentu w danym systemie informacyjno wyszukiwawczym.
Systemy słownikowe - struktura zbudowana jest ze znajdujących się w słowniku wykładników językowych znaczeń, jakie można wyrazić w danym języku. Biorąc pod uwagę słownik danego języka, można wyróżnić:
JIW o słownictwie swobodnym (nie da się pokazać, bo istnieje np. w naszej głowie)
JIW o słownictwie kontrolowanym (posiada jawny słownik o charakterze normatywnym, przykładem jest UKD)
JIW o słownictwie częściowo kontrolowanym (posiada słownik o charakterze częściowo jawnym)
TYPY SŁOWNIKÓW
Słowniki wyliczające Elementarne Jednostki Leksykalne.
Słowniki zawierające zdania w danym języku.
Słowniki negatywne -„STOP LISTA” zbiory wyrazów, których nie wolno używać np. słownik wulgaryzmów
Rodzaje uporządkowania EJL:
Losowe, przypadkowe, (ale tak nie powinno być)
Formalne, np. według alfabetu
Semantyczne (według znaczenia, np. czasopisma podzielone na dzienniki, tygodniki, miesięczniki itd.).
Mieszany (np. alfabetyczno-semantycznie)
WYKŁAD 4
15.11.2007 - Systemy semantyczne JIW
System semantyczny danego języka jest utożsamiany z polem semantycznym języka.
POLE SEMANTYCZNE - jest to struktura zbudowana ze znaczeń (treści), jakie można wyrazić w danym języku za pomocą środków (relacji), którymi język ten dysponuje. Pole semantyczne ma treść i zakres.
Zakres - np. wszystkie stworzenia, którym można przyporządkować jakąś nazwę
Treść - cechy pewnych obiektów, zbiór cech
Każda jednostka leksykalna ma TREŚĆ [ in. konotacje, intencje] i ZAKRES [in. denotacja, ekstensja].
SYSTEMY RELACYJNE - między jednostkami leksykalnymi zachodzą relacje, czyli związki pewne, które mogą zachodzić pomiędzy przedmiotami, ludźmi, np. pokrewieństwo. W JIW relacje to związki zachodzące pomiędzy jednostkami leksykalnymi w słowniku i/lub w tekście.
Relacje mogą być:
- pozajęzykowe np.: pokrewieństwo, odległości między planetami [wszystko to, przykłady Babika]
- językowe, znajdujące się w kontekście, w tekście lub słowniku miedzy wyrazami.
Relacje w JIW wyrażają bezpośrednio związki pomiędzy klasami dokumentów, których nazwami są klasy dokumentów. Relacje te odwzorowują związki między terminami.
TERMIN - jest to wyraz, nazwa o ściśle określonym znaczeniu.
W zależności od miejsca występowania wyróżniamy dwa typy relacji:
PARADYGMATYCZNE - słownikowe (występujące w słownikach)
SYNTAGMATYCZNE - tekstowe (występujące w tekście)
RELACJE PARADYGMATYCZNE:
Relacje synonimii wyszukiwanej
Relacje hierarchiczne
Relacje generyczne (określają rodzaj, gatunek)
Relacje mereologiczne
Relacje hierarchii tematycznej
Relacje współrzędności
Relacje kojarzeniowe
RELACJE SYNTAGMATYCZNE: wykładnikami tych relacji są np.:
Znaki łączące jak w UKD
Wskaźnik więzi (połączenie)
Wskaźnik roli (funkcja)
Wskaźnik wagi (znaczenia)
Algebra Boole'a
Typy struktur pola semantycznego (trzy podziały)
W zależności od typów relacji wykorzystywanych do organizacji pola semantycznego.
Monorelacyjne
Polirelacyjne
W zależności od rodzaju generowanych układów struktur leksykalnych.
A-hierarchiczne
Monohierarchiczne
Polihierarchiczne
W zależności od dopuszczalnej liczby wystąpień pojęcia danej jednostki leksykalnej.
Monopozycyjne
Polipozycyjne
Nie pamiętam jakie jeszcze???
Typy struktur pola semantycznego (modele)
Struktura płaska (ahierarchiczna) np. klasyczne języki słów kluczowych [ 0 ]
Struktura monorelacyjno-monohierarchiczna, taksonomie są stosowane w JIW [ 1,1 ]
Struktura monorelacyjno-polihierarchiczna, klasyfikacja pozornie fasetowa np. UKD [ 1, 0 ]
Struktura polirelacyjno-monohierarchiczna, klasyfikacje biblioteczno-bibliograficzne [ 0, 1 ]
Struktura polirelacyjno-polihierarchiczna, struktura fasetowa [ 0, 0 ]
RELACJE KOJARZENIOWE - opierają się na podobieństwie treści. W JIW mają dużą wartość wyszukiwawczą. Są charakterystyczne dla poszczególnych dziedzin. Zwykle mają charakter pozajęzykowy. Wykorzystują schematy - część-całość, przyczyna-skutek.
Przykłady:
Proces - urządzenie do wykonywania czynności (drukować-drukarka)
Produkt - wykonawca (produkt-producent)
WYKŁAD 5
22.11.2007 - Systemy gramatyczne JIW
Gramatyka odnosi się do 5 poziomów JIW. Zarówno do elementarnych jednostek leksykalnych jak i tekstu.
SYSTEM GRAMATYCZNY - jest to zbiór zasad dla każdego poziomu, określające struktury języka, które połączenia wyrażeń, przyjmuje się za wyrażenia danego języka.
1. System gramatyczny według E. Ścibora (nie jest jego twórcą, tylko go omówił w na początku l. 80')
2. System gramatyczny B. Bojar.
Ad. 1 E. Ścibor wymienił 4 rodzaje gramatyki:
Zerowa - charakterystyczna dla języków, które posługują się jedną zasadą „o niedołączaniu”. Nie jest tu możliwe żadne połączenie wyrażeń elementarnych, nie ma tu wyrażeń złożonych. Istnieją natomiast zdania elementarne, składające się z jednej elementarnej jednostki, to znaczy, że status EJL zmienia się na zdanie w JIW. Ten typ gramatyki stosuje się w klasyfikacji wyliczającej.
Pozycyjna - charakterystyczna dla JIW, w których miejsce elementarnej jednostki leksykalnej jest ściśle ustalone. Zmiana miejsca położenia elementarnych jednostek leksykalnych powoduje zmianę znaczenia całego zdania. Stosowana jest w klasycznych językach haseł przedmiotowych i Dwukropkowej Hierarchii Ranganathana. Przykłady: filozofia-historia ( to znaczy historia filozofii), historia-filozofia (historiozofia, filozofia historii, jak rozwija się historia).
Częściowo-pozycyjna - występuje w tych językach, w których miejsce autosyntaktycznych jednostek leksykalnych jest dowolne, a synsyntaktycznych jest niezmienne. Gramatyka ta wykorzystuje wskaźniki roli, więzi, modyfikatory lub deskryptory aspektowe. Ten typ gramatyki stosowany jest m.in. w językach deskryptorowych.
Nie pozycyjna - jest to gramatyka opozycyjna do gramatyki pozycyjnej. Jest stosowana w JIW gdzie jednostki leksykalne są ułożone w dowolnej kolejności. Losowa kolejność występowania EJL w obrębie zdania jest istotą indeksowania współrzędnego. Jest stosowana w klasycznych językach słów kluczowych.
Ad. 2 B. Bojar wymieniła 4 rodzaje gramatyki:
Zerowa - brak jest wykładników relacji syntagmatycznych. Wykładnikami tymi są: wskaźnik więzi, roli, wagi i algebra Boole'a, w związku z tym kolejność wyrażeń elementarnych w zdaniu JIW jest dowolna. Gramatyka stosowana w językach słów kluczowych i językach deskryptorowych bez wykładników relacji syntagmatycznych.
Pozycyjna - jest stosowana w JIW, w których relacje syntagmatyczne są wyznaczone przez pozycje wyrażeń elementarnych w wyrażeniu złożonym. Ten typ gramatyki jest stosowany gdy wykładnikami relacji syntagmatycznych są wskaźniki roli np. w niektórych językach deskryptorowych, językach haseł przedmiotowych lub wskaźniki przynależności jak np. w Dwukropkowej Hierarchii Ranganathana.
Częściowo-pozycyjna - stosowana gdy niektóre pozycje elementarnych jednostek leksykalnych w wyrażeniu złożonym, pełnią funkcję relacji syntagmatycznych. Stosowana np. w językach deskryptorowych, w których modyfikatory znajduje się po deskryptorze.
Nie pozycyjna - jest stosowana w JIW, w których wykładniki relacji syntagmatycznych mają inny charakter niż pozycja wyrażenia elementarnego w wyrażeniu złożonym. Kolejność wyrażeń może być dowolna ale nie musi.
Wskaźnik wagi - wykładniki językowe wskazujące na znaczenie danego zagadnienia w ramach danego dokumentu, np. przekreślone zero „Ø”, wskazuje, że warto zwrócić uwagę na dany artykuł lub pozycję.
Wskaźniki więzi - pokazują, które elementy w opisie (słowa kluczowe) są ze sobą połączone, np.: RURY/1MIEDŹ/2 DACH/2 OŁÓW/1
Są to wykładniki językowe łączące elementy wyszukiwawcze, które oddają właściwy sens zdania. Akurat to zdanie mówi, że szukamy czegoś na temat ołowianych rur i miedzianych dachów, a nie odwrotnie
Wskaźniki roli - nie mam pojęcia.
WYKŁAD 6
06.12.2007 - Systemy pragmatyczne JIW
Pragmatyka to część semiotyki, która zajmuje się posługiwaniem i stosowaniem JIW. Nazwy dla posługiwania się, JIW to:
Tematowanie (posługiwanie się językiem haseł przedmiotowych)
Klasyfikowanie (posługiwanie się UKD)
Indeksowanie (używanie języków słów kluczowych i języków deskryptorowych)
INDEKSOWANIE - jest to proces/czynność sporządzania charakterystyki słownej treści dokumentu lub pytania informacyjnego i jej przekład na JIW, np. tworzenie haseł przedmiotowych.
ETAPY INDEKSOWANIA:
DOKUMENT TEKSTOWY
CHARAKTERYSTYKA SŁOWNA DOKUMENTU W JĘZYKU NATURALNYM
SŁOWA KLUCZOWE, SYMBOLE KLASYFIKACYJNE, JĘZYK SZTUCZNY, JIW
TEKSTY JIW
CHARAKTERYSTYKI WYSZUKIWAWCZE DOKUMENTÓW, np. karta katalogowa, opis bibliograficzny, opis przedmiotowy.
Parametry indeksowania ( to jest pytanie na egzamin)
Szerokość indeksowania
Szczegółowość indeksowania (in. głębokość)
Szerokość indeksowania - jest to stopień odzwierciedlenia w CHWD lub instrukcji, treści danego dokumentu.
Szczegółowość - jest uzależniona od szczegółowości słownika JIW. Mierzy się ją liczbą jednostek leksykalnych użytych w CHWD, czyli w tekstach JIW.
RODZAJE INDEKSOWANIA
Intelektualne, w starszej literaturze manualne (posługujemy się głową i rozumiem)
Jest to indeksowanie swobodne, opiera się na słowniku nie jawnym - głowie.
Może być to indeksowanie słownikowe, in. normatywne, gdy opieramy się na słowniku jawnym np. na tablicach UKD.
Trzeci rodzaj indeksowania intelektualnego to indeksowanie współrzędne.
Automatyczne (3 metody)
Indeksowanie statystyczne, TEORIA WARTOŚCI INFORMACYJNEJ SŁOWA, twórcą tej teorii jest H. P. Lunh. Do tego rodzaju indeksowania potrzebny jest program, który wybiera słowa względem częstotliwości ich występowania. Efektem jest powstanie krzywej Gansa, która określa wartość informacyjną.
Rachunek prawdopodobieństwa
Metody syntaktyczne (opierają się na teorii języków formalnych w zbiorze znaczników frazowych).
TRYBY INDEKSOWANIA
Indeksowanie uogólniające (zwiększa kompletność, zmniejsza dokładność)
Indeksowanie wyszczególniające (zmniejsza kompletność, zwiększa dokładność)
WYKŁAD 7
13.12.2007 - Porównywanie i ocena JIW. Wybrane typologie JIW.
Klasyfikacja w nauce to czynność/operacja dokonywana na zbiorze elementów. Jest to przydzielanie poszczególnych elementów do wcześniej przygotowanego schematu klas. Nie powinno być takich elementów, które mogą być przydzielone do kilku klas jednocześnie. Wszystkie elementy powinny być rozdzielone w klasy. (W. Babik przedstawił to na przykładzie worków). Aby dobrze klasyfikować, należy schematowi klasyfikacyjnemu nadać odpowiednie kryteria, według których będziemy dzielić elementy. Jednym z przykładów podziału, jest podział dychotomiczny - na dwie grupy. Może to być np. podział ze względu na płeć.
Typologia - jest to dopasowanie elementu do wcześniej ustalonych typów. Jest to operacja polegająca na porównywaniu z najbardziej odpowiednim typem do danego egzemplarza - elementu. Podziały te są jednak bardzo subiektywne. Typologie tworzymy, gdy różne elementy można dopasować do kilku podzbiorów.
Cel pragmatyczny (użyteczność)
Cel dydaktyczny (uporządkować wiedzę)
Cel teoretyczny (wzbogacenie naukowego dorobku)
Najstarszym JIW jest klasyfikacja biblioteczna np. w bibliotece Asurbanipala
JEAN - CLAUDE GARDIN - opracował jedną z pierwszych poważnych typologii JIW (1966 r. Biuletyn Bibliotek Francuskich) (mamy krytykować Gardina). Jest on twórcą typologii słowników JIW. Typologia ta polega na wielostopniowym dychotomicznym podziale słowników JIW. J. Gardin uznał, że słownik określa sam język.
Słowniki jawne
Słownictwo uporządkowane semantycznie
Listy pozytywne (można używać w indeksowaniu)
Listy negatywne (nie można używać w indeksowaniu, tzw. stop-listy)
Słownictwo uporządkowane formalnie, np. alfabetycznie
Słowniki niejawne
Podział języków informacyjno-wyszukiwawczych według J. Gardin'a
Języki deskryptorowe
Języki słownikowe
Języki klasyfikacyjne
E. F. SKOROCHODKO - Klasyfikacja semantyczna JIW.
Kryterium podziału były relacje zachodzące między elementarnymi jednostkami leksykalnymi w JIW. Skorochodko zbudował dwie oddzielne typologie JIW:
Klasyfikacja pragmatyczna (systemowa)
Klasyfikacja syntagmatyczna
A. I. CZERNY - Typologia według kryteriów połączeń.
Prekoordynowane: klasyfikacja biblioteczna, języki haseł przedmiotowych
Postkoordynowane: języki deskryptorowe, języki syntagmatyczne, kody semantyczne
E. ŚCIBOR - Typologia strukturalna JIW, 1981 rok
Kryterium tej typologii to różne elementy określające strukturę JIW. Tak rozległe kryterium sprawiło, że E. Ścibor wyodrębnił aż 1176 różnych typologii JIW. Schemat główny zredukował i ograniczył tylko do 174:).
BIBLIOTEKARZE - zwyczajowa typologia bibliotek
Klasyfikacje biblioteczno-bibliograficzne,
Języki haseł przedmiotowych,
Języki słów kluczowych,
Języki deskryptorowe,
Kody semantyczne.
WYKŁAD 8
20.12.2007 - Języki paranaturalne.
Grupę tych języków wyróżniono ze względu na słownictwo - ich charakter, notację. Do paranaturalnych języków informacyjno-wyszukiwawczych należą m.in.:
Języki słów kluczowych
Języki deskryptorowe
Języki haseł przedmiotowych
Bibliotekarze stosują te języki, na co dzień.
Tezaurus Informacji Naukowej - Ewa Chmielewska-Gorczyca, Ośrodek Informacji Naukowej [OIN] PAN, 1992.
Schemat opisu JIW |
Język Słów Kluczowych |
Języki deskryptorowe |
Języki Haseł Przedmiotowych |
Nazwa typu i/lub podtypów
|
|
|
|
Charakter słownictwa |
Słownictwo paranaturalne |
Słownictwo paranaturalne lub mieszane |
Słownictwo paranatuarlne |
Słownik |
|
|
|
EJL |
|
|
|
Relacje słownikowe |
Klasyczny JSK nie odwzorowuje żadnych relacji |
Wszystkie typy relacji |
|
Gramatyka |
|
|
|
Zastosowanie |
Systemy zautomatyzowane, specjalistyczne systemy informacyjne |
Systemy informacyjno - wyszukiwawcze. |
W katalogach bibliotecznych, dotyczy wszystkich dziedzin wiedzy, jak np. UKD |
Metodologia, normalizacja |
Nie ma prawie zaplecza metodologicznego, ale istnieją instrukcje np. OPI - instrukcja Synaba za pomocą słów swobodnych |
Polska Norma Tezaurusa, jednojęzyczny, zasady tworzenia, forma, struktura |
NUKAT ?? |
WYKŁAD 9
03.01.2008 - Tezaurusy. Języki klasyfikacyjne.
03.12.2007 - M. Nahotko - Języki deskryptorowe. Tezaurusy
W latach 70' i 80' nastąpił boom języków deskryptorowych, używanych szczególnie w bibliograficznych bazach danych. Słownikiem tego języka jest tezaurus!! Ale jak to określił dr Nahotko granica między słownikiem słów kluczowych, a tezaurusem jest bardzo płynna i nigdy tak naprawdę nie wiadomo, czy to jest tak rozbudowany Słownik Słów Kluczowych, czy tak ubogi Tezaurus . Tezaurusy SA zwykle wąsko-dziedzinowe.
Słownik ten operuje dwoma rodzajami terminów: deskryptorami i askryptorami.
DESKRYPTORY - słowo, określające obiekt; jest to najlepsze słowo użynane do określenia danego obiektu, jednemu deskryptorowi można przyporządkować kilka askryptorów.
ASKRYPTORY - termin zakazany, askryptorem może być w stosunku do deskryptora jego synonim lub słowo, termin rzadko używany lub archaiczny.
Tezaurus - słownik języka deskryptorowego, jednostkami leksykalnymi są tam deskryptory askryptory i modyfikatory. Tezaurus jest stworzony do indeksowania dokumentu w określonych sytuacjach w wąskich dziedzinach.
Między deskryptorami i askryptorami zachodzi relacja synonimii i równoleżności. Każdy deskryptor występuje w kontekście innych deskryptorów i askryptorów. Deskryptor występuje, więc w tezaurusie kilka razy. Istnieją deskryptory szersze, węższe i kojarzeniowe. Wszystkie deskryptory i askryptory tworzą razem artykuły deskryptorowe. Udoskonaleniem tezaurusów są tzw. „więzi” wskaźniki więzi to np. cyfry i szersze numery dotyczące tych samych tematów. Dzięki wskaźnikom łatwiej jest opisać i w szczególności powiązać dokumenty. Wskaźniki można podzielić na”
- wskaźniki roli tzw. modyfikatory
- wskaźniki wagowe.
1. Wielojęzyczny tezaurus „Eudised mehrsprachiger thesaurus zur Informationsersehliesung in…”
2. Thesaurus of Information Science Terminology. Claire K. Schultz
3. A compressed Term Index. Alan Gilarist, M. Keen
4. Тезаурус, научно-технических терминов, Moskwa
5. PATIN, Eugeniusz Ścibor, Joanna Tomasik-Beck
6. Thesaurus of ERIC Descriptors
7. Thesaurus of psychological index term
8. Tezuarus naukoznawstwa,metalurgii i żelaza - procesy I aparatura chemiczna. PAN
Języki klasyfikacyjne są najstarszym typem języków informacyjno-wyszukiwawczych.
Najbardziej znane ośrodki, które badają JIW znajdują się w Wielkiej Brytanii (Londyn - CRG - Classyfication Research Group) oraz w Indiach (DRTC - Documentation and Research Trening Center).
Elementy opisu języka:
1. Nazwa typu JIW (systemy klasyfikacyjne, klasyfikacje, katalogi biblioteczno-bibliograficzne)
2. Słownictwo (naturalne, sztuczne)
3. Nazwa słownika (np. tablice UKD)
4. Nazwa jednostek leksykalnych (np. symbole)
5. Typy relacji
6. Stosowana gramatyka
7. Zastosowanie
8. Historia/geneza
9. Zaplecze metodologiczne (np. pragmatyka UKD)
Przegląd wybranych JIW - E. Ścibor.
Klasyfikacje tematyczne BSO, PKT przeznaczone do porządkowania dokumentów na półkach w bibliografiach itd., służą też do zarządzania systemami informacyjnymi, a także do określania zbiorów tematycznych, zbiorów systemów informacyjnych, tezaurusów itd. Określane zwykle w języku francuskim - nie pamiętam jak, rosyjskim - rubrykatory, polskim - klasy tematyczne.
Są to przeważnie mono hierarchiczne systemy z wyodrębnionymi poddziałami pomocniczymi. Są niegłębokie, ograniczające się do 2-4 stopni poddziału. Klasyfikacje odsyłają do bloków informacji, a nie do konkretnych dokumentów. Klasy tematyczne stanowią uzupełnienie do języków deskryptorowych. [PASCAL, MISION, POLSKA KLASYFIKACJA TEMATYCZNE - PKT, BSO - międzynarodowy schemat stworzony przez FID i UNESCO]
„CLEARINGHOUSE for thesauri and classyfication schemes” - spisy wszystkich opublikowanych tezaurusów, wydawane w Waszyngtonie i w Warszawie .
WYKŁAD 10
10.01.2008 - Nowe typy JIW.
Języki kodów semantycznych
Języki syntagmatyczne
Języki opisu bibliograficznego
Język meta danych
JĘZYKI KODÓW SEMANTYCZNYCH (JKS) - są to języki sztuczne, słowniki tych języków zawierają stosunkowo nieliczne jednostki leksykalne, tylko najgłówniejsze pojęcia tzw. prymitywy. Prymitywy to jednostki leksykalne, które nie mają znaczeń. Kody semantyczne były budowane na podstawie/zasadzie tzw. Języka semantycznego.
Język semantyczny (cechy):
Jest pozbawiony synonimii i homonimii,
Opiera się na z góry określonym zbiorze wyrażeń, reprezentujących elementarne znaczenia (prymitywy semantyczne lub mnożniki semantyczne).
Do najbardziej znanych JIW tego typy zalicza się m.in.:
Język ASM - WRU, lub po prostu nazywany Kodem Semantycznym, 1954-59 - USA. Za twórców języka uważany jest A. Kent, J. W. Perry (i M. Barry, ale to była kobieta, więc się ją pomija ). Zbudowano go na potrzeby systemu informacyjnego z dziedziny metalurgii w ośrodku badań z zakresu dokumentacji i przekazywania informacji WRU - Western Reserve University - Cleveland. ASM - American Society for Metals, czyli Amerykańskie Stowarzyszenie Metalurgów. Słownik tego języka składał się z kilkunastu kartek i zawierał tylko 214 jednostek leksykalnych, tzw. mnożników semantycznych ułożonych alfabetycznie. Sposób tworzenia jednostek leksykalnych: wykreślano ze słów wszystkie samogłoski, a następnie (zaczynając od końca wyrazu) wykreślano również spółgłoski, aby uzyskać postać „czteroznakową”. Puste miejsca zapełniano samogłoskami określającymi relacje (a, e, i). Relacje „i” - typu część-całość; relacje „a” zawiera się w jakiejś klasie; relacje „e” oznacza być produktem.
ANIMAL N_ML NAML np. psy, NEML np. szynka
FISH F_SH FASH np. sardynki, FESH np filety rybne ;)
MILITARY M_LT
SCIENCE S_CN
W języku tym istnieją też wskaźniki roli in. relacje syntagmatyczne - tekstowe, np.:
KEJ - materiał przetworzony
KUJ - składnik
KAM - proces
KAJ - surowiec
Język RX Kodów, 1960-64 - ZSRR. Stworzony przez E. F. Skorohodko; L. E. Pszeniczną; T. N. Griznuchina. Język stworzony na potrzeby radiotechniki i komunikacji w Instytucie Cybernetyki Radzieckiej Akademii Nauk w Kijowie. Schemat tworzenia wyrażeń w tym języku: X1 = R1 X2 R2 X3. X - to jednostki leksykalne, R - relacje.
Uniwersalny Kod Semantyczny W. W. Martynowa - ZSRR, 1977
Olgierd Adrian Wojtasiewicz, Bożenna Bojar, Barbara Sosińska-Kalata - POLSKA.
Waclav Smetaček - CZECHOSŁOWACJA.
JĘZYKI SYNTAGMATYCZNE
Język SYNTOL ( Syntagmatic Organization Language - R. C. Cross, J. C. Gadrin, F. Levy)
Podstawową zasadą syntolu jest wyodrębnienie syntagm, czyli elementarnych jednostek leksykalnych składni. Język został stworzony w latach 1960-62 dla potrzeb systemu Euratom. System działał w Narodowym Ośrodku Badań Naukowych we Francji (CNRS - Paryż).
Niektóre JIW stosowane są przede wszystkim do opisu formalnego. (Elementy formalne to elementy opisu bibliograficznego). Typy JIW nakierowane na elementy formalne:
Języki opisu bibliograficznego
Języki cytowań bibliograficznych
Języki meta danych.
Ad. 2
Twórcą języka cytowań bibliograficznych jest Eugene Garfield (USA). Cechy języka:
- słownictwo mieszane
- słownik: nazw, tytułów, nazw miejscowości itd.
- jednostki leksykalne to elementy opisu bibliograficznego
- wszystkie typy relacji
- stosowanie dwu rodzajów gramatyki: „?” i częściowo-pozycyjnej
- zastosowanie: w bibliografiach, indeksach itp.
WYKŁAD 11
17.01.2008 - Języki systemów faktograficznych.
Preserved Context Index System - PRECIS, jest to system indeksu przedmiotowego z zachowaniem kontekstu. Opracował go Derek Austin z Wielkiej Brytanii. Powstanie tego języka wiąże się z automatyzacją angielskiej bibliografii narodowej w latach 70'. Kolejność słów w tym języku nazywa się „sznurkiem wejściowym terminów”. Gramatyka opiera się na wskaźnikach roli.
Języki systemów faktograficznych to JIW stosowane w systemach dokumentacyjnych, ekspertowych, multimedialnych, hipertekstowych, faktograficznych. Języki te opisują obiekty, przedmioty, fakty, osoby. Odsyłają one bezpośrednio identyfikują obiekt (dokument) i informują o nim.
Systemy faktograficzne dzielą się na: dedukcyjne i nie dedukcyjne. Dedukcyjne oparte są na wnioskowaniu, nie dedukcyjne natomiast, głównie na porównywaniu.
Informacja faktograficzna - występuje w systemie faktograficznym, jest to informacja jednostkowa o obiekcie, osobie, fakcie itd. Jest to „coś” stwierdzającego istnienie cechy danego obiektu, przedmiotu, faktu, osoby. Informacja faktograficzna może występować w postaci: liczbowej, opisowej i graficznej (np. wykres, rysunek, fotografia, animacja).
Są różne stosowane nazwy na określenie typów tego języka:
Obiekt - atrybut
Obiekt - cecha
Przedmiot - własność
Typ prostych systemów faktograficznych
PRZYKŁAD: CZŁOWIEK [OBIEKT] WIEK, WZROST, WAGA, KOLOR OCZU [CECHY]
Każda z cech ma swoją wartość.
Trzy elementy opisu to „triada”. Słownik języków systemów faktograficznych ma budowę modułową. Składa się z trzech grup:
Nomenklatury obiektów
Nomenklatury cech
Nomenklatury wartości.
Język systemów faktograficznych stosuje gramatykę pozycyjną i częściowo-pozycyjną.
Typy języków w prostych systemach faktograficznych:
Ankietowe - opierają się na formularzach
Języki służące do tworzenia tablic pasmetrycznych ?
Języki „a priori” - mają usystematyzowaną nomenklaturę i nazewnictwo
Języki „apos priori” - zależnie od przyjętej metody budowy słownika
WYKŁAD 12 - SEMESTR DRUGI
27.02.2008 - Metodyka projektowania JIW
Istnieją dwa podejścia w projektowaniu:
Podejście systemowe (język jako system - 3 elementy języka połączone ze sobą relacjami, hierarchiczne powiązania).
Podejście sieciowe (język jako sieć - Język traktuje się, jako sieć, gdzie wszystkie elementy są równe, nie ma relacji hierarchicznych, nie ma nadrzędności i podrzędności, poszczególne elementy połączone są różnego typu relacjami, głównie relacjami kojarzeniowymi).
Projektowanie języka jest zwykle elementem projektowania systemu informacyjno-wyszukiwawczego Słownikami takich systemów są tzw. SŁOWNIKI PRAKTYCZNE. Języki, które projektuje się dla konkretnej dziedziny, a są wykorzystywane przez różne systemy informacyjne, mają SŁOWNIKI TEORETYCZNE. [np. Słownik słów kluczowych slawistyki, należy do słowników praktycznych bo został zaprojektowany dla systemu slawistycznego].
Inne dwa podejścia/ujęcia projektowania JIW:
Diagnostyczne (mamy język, badamy go, testujemy, wyszukujemy błędy, modyfikujemy, udoskonalamy usuwając błędy).
Prognostyczne (budujemy nowy język)
DWIE METODOLOGIE STOSOWANE PRZY BUDOWANIU JIW:
Miękka (soft methodology - P.B. Checkland)
Twarda (hard methodology - jasno określone reguły postępowania, nie są dopuszczalne odstępstwa od normy).
STRUKTURA PROCESU PROJEKTOWANIA
Projektowanie zakresu i pola semantycznego JIW.
Metody wyboru terminów [są to metody gromadzenia słownictwa]
Metoda indukcyjna - polega na indeksowaniu dokumentów
Metoda dedukcyjna - wykorzystywanie istniejących już usystematyzowanych zbiorów słownictwa, np. z leksykonów, encyklopedii, tezaurusów, słowników słów kluczowych, Słowników haseł przedmiotowych, indeksów rzeczowych, drukowanych katalogów, podręczników itp.
Metoda indukcyjno-dedukcyjna, lub dedukcyjno-indukcyjna (połączenie dwóch w/w metod, z naciskiem na jedną z nich)
Opracowanie, strukturalizacja, systematyzacja słownictwa.
Metoda definicyjna.
Metoda hierarchizacje (hierarchiczne drzewa).
Kategoryzacja semantyczna (tworzymy kategorie znaczeniowe, np. ludzie i wymieniamy nazwiska).
Prezentacja słownictwa w postaci słownikowej.
Słownictwo przedstawiamy za pomocą słowników np. jawnych
Projektowanie gramatyki języka.
WYKŁAD 13
12.03.2008 - Ośrodki badawcze zajmujące się JIW w Polsce i na świecie.
OSOBY:
Olgierd Ungurian - autor pierwszego w Polsce podręcznika z zakresu JIW, zajmował się teorią klasyfikacji Randganathana. Studiował w Moskwie nauki techniczne. W Polsce zajmował się głównie UKD. Napisał szereg opracowań tej klasyfikacji.
Olgierd Adrian Wojtasiewicz - zajmował się głównie problematyka kodów semantycznych.
Bożenna Bojar - językoznawca,
Jadwiga Sadowska - zajmowała się głównie językami haseł przedmiotowych
Ewa Chmielewska-Gorczyca - autorka Tezaurusa Informacji Naukowej, startowała w konkursie miss Świata
INSTYTUCJE ZWIĄZANE Z UCZELNIAMI< INSTYTUTY NAUKOWO-BADAWCZE:
INTE - Instytut Informacji Technicznej i Ekonomicznej. W ośrodku tym funkcjonowała jednostka JIW, prowadzona przez Eugeniusza Ścibora. W licznych pracach pomagała mu natomiast Lucyna Anna Bielicka.
UW - Instytut Informacji Naukowej i Studiów Bibliologicznych, z ośrodkiem tym związana jest Jadwiga Woźniak-Kasperek.
Warszawska Szkoła JIW - szkoła ta w swym czasie spłodziła wielu doktorów m.in. Wiesława B.
ORGANIZACJE I STOWARZYSZENIA PROFESJONALNE:
Polskie Towarzystwo Informacji Naukowej i Technicznej - Katowice
ISKO, a może ISCO? Nie jestem pewna.
ŚWIAT - Osoby:
Jean-Claude Gardin (Francja) - twórca typologii słowników JIW, podział wielostopniowy dychotomiczny 1966 rok.
Karen Spark Jones (Wielka Brytania) - zajmowała się badaniem lingwistycznych podstaw JIW, specjalizowała się w językach słów kluczowych oraz automatycznych indeksach.
Arkadij Iwanowicz Czerny - twórca kolejnej klasyfikacji podobnie jak Gardin
INSTYTUCJE:
Western Reserve University - Cleveland (USA) - wiąże się ze stworzeniem kodu semantycznego - ASM WRU przez Kent'a I Perry'ego
Ośrodek Badan Naukowych we Francji (Paryż) CNRS - stworzenie języka syntagmatycznego SYNTOL przez Jean-Claude Gardin'a.
Amerykańskie Stowarzyszenie Informacji Naukowej i Technologii - ASIST, funkcjonujące od 1927 roku. Najbardziej znanymi dyrektorami tej placówki byli m.in.: James W. Perry, Harold Borko, Michael Buckland, Eugene Garfield, Nicolas Belkin.
OCLC
DRTC (Documentation Research Training Center) - Indie, Bangalore, Centrum Badań Dokumentacyjnych i Szkoleń. W instytucie tym, badacze zajmują się głównie dwu kropkową klasyfikacją Ranganathana. Obecnie opracowano już 7 wersji aktualizacji. Organizacja powstała w 1962 roku.
CRG (Classification Research Group) - Londyn, 1952 rok. Ośrodek skupia specjalistów zakresu JIW. Stworzono tu wiele klasyfikacji fasetowych w tym również klasyfikację Informacji Naukowej. Z ośrodkiem tym wiąże się także Teoria poziomów zintegrowanych.
WYKŁAD 14
19.03.2008 - Indeksowanie w XXI wieku.
Indeksowanie współrzędne - polega na charakteryzowaniu złożonej treści dokumentu lub pytania informacyjnego za pomocą współrzędnych dających się swobodnie kombinować, słów kluczowych, deskryptorów lub specjalnych znaków. Istotą tego indeksowania jest losowa kolejność występowania EJL w obrębie zdania.
Indeksowanie ankietowe
Indeksowanie asocjacyjne
Indeksowanie automatyczne - generowane przez program, do tego typu zalicza się indeksowanie statystyczne, probabilistyczne i lingwistyczne.
Indeksowanie hierarchiczne
Indeksowanie pragmatyczne - jest to tematowanie (nadawanie haseł przedmiotowych), klasyfikowanie (nadawanie symboli UKD), i indeksowanie (nadawanie słów kluczowych i dokonywanie charakterystyki w językach deskryptorowych)
Indeksowanie. semantyczne - dzieli się na indeksowanie derywacyjne i słownikowe.
Indeksowanie derywacyjne (strukturalne) - zakłada wykorzystanie terminów występujących w tekstach indeksowanych dokumentów. Tylko w razie potrzeby zakłada się możliwość wprowadzenia dodatkowych terminów spoza tekstu.
Indeksowanie normatywne (słownikowe) - zakłada przekład swobodnie wybranych z tekstu opisywanego dokumentu słów kluczowych, na elementarne jednostki leksykalne języka informacyjnego.
In. statystyczne - związane z teorią wartości informacyjnej słowa, twórcą tej teorii jest Lunh, ten typ indeksowania polega na badaniu częstotliwości występowania słowa, a następnie tworzenie krzywej Gunsa.
In. swobodne - inaczej intelektualne, manualne.
In. syntaktyczne
In. uogólniające - jeden z trybów indeksowania, zwiększa się tu kompletność, zmniejsza zaś dokładność.
In. wyszczególniające - drugi tryb indeksowania, zwiększa się dokładność, zmniejsza kompletność.
Metody indeksowania intuicyjnego (intelektualnego)
Metody indeksowania sformalizowanego.
Pomysłodawcą tych metod jest Jarosław Pacek
Metody indeksowania sformalizowanego, (czyli metody indeksowania automatycznego) generowane są przez jakiś program.
Indeksowanie automatyczne:
Metody statystyczne (frekwencyjne) - twórcą jest H. P. Lunh, rozwinął je natomiast H. P. Edmundson. Metody te polegają na wykorzystaniu pewnych statystycznych prawidłowości rozkładu słów, grup lub innych elementów tekstowych.
Metody słownikowe - charakterystyczną cechą tych metod jest to, że wymaga najpierw sporządzenia słownika
Metody gramatyczne - obejmuje metody morfologiczne i syntaktyczne. Grupy metod syntaktycznych stosowana jest do selekcji słów kluczowych.
Metody pozycyjne - polegają na wydzieleniu najbardziej informacyjnych fragmentów tekstu.
INDEKSOWANIE AUTOMATYCZNE:
Indeksowanie statystyczne
Indeksowanie probabilistyczne ( rachunek prawdopodobieństwa)
Indeksowanie lingwistyczne ( wykorzystuje analizę automatyczną języka)
WYKŁAD 15
09.04.2008 - Wpływ językoznawstwa na teorie JIW
Kierunki współczesnego językoznawstwa:
Strukturalizm
Generatywizm
Kognitywizm
Funkcjonalizm
Lingwistyka kwantytatywna/statystyczna
STRUKTURALIZM (język pojmowany jako system znaków - Ferdynand de Saussure)
Określił język jako stały zbiór (dokładniej: system) norm społecznych, umożliwiających porozumiewanie się. Podobnie jak Jan Niecisław Baudouin de Courtenay odróżniał język, jako system zasad, od mówienia, które jest indywidualną realizacją tegoż systemu.
De Saussure ukuł termin językoznawstwa diachronicznego [językoznawstwo diachroniczne to dział językoznawstwa zajmujący się badaniem relacji, jakie występują między elementami języka w różnych epokach jego rozwoju. Językoznawstwo diachroniczne bada, więc zmiany, jakie zachodzą w języku z upływem czasu] dla badań historycznych nad językiem i językoznawstwa synchronicznego, opisującego stan języka w danym momencie. Wprowadził termin znaku językowego jako składowej dwóch elementów - znaczonego i znaczącego, gdzie pierwszy to samo abstrakcyjne pojęcie, a drugi - jego akustyczna reprezentacja. Język w rozumieniu de Saussure'a funkcjonuje w oparciu o związki syntagmatyczne, istniejące pomiędzy elementami umieszczonymi w konkretnej wypowiedzi i związki paradygmatyczne, istniejące na poziomie abstrakcyjnym.
Strukturalizm to kierunek w językoznawstwie, rozpowszechniony zarówno w Europie jak i w USA. Istnieją w związku z tym dwa nurty strukturalizmu:
- europejski (szkoły: genewska, praska, kopenhaska, londyńska)
- amerykański.
SZKOŁA PRASKA - związana z osobami Mikołaja Trzebickiego i Romana Jacobsona, który zajmował się przede wszytki funkcjami języków informacyjno-wyszukiwawczych.
SZKOŁA KOPENHASKA - związana przede wszystkim z Luisem Hjemselvem, twórcą glossematyki. Przeniósł on z języka naturalnego do sztucznego plan treści i plan wyrażania.
SZKOŁA GENEWSKA - związana z Ferdynandem de Saussurem
SZKOŁA LONDYŃSKA - najmniej ważna, niemniej jednak pracował, tam Polak Bronisław Malinowski.
STRUKTURALIZM AMERYKAŃSKI
Określany jest też jako dystrybucjonizm, wiązany jest z nazwiskami następujących osób:
Leonard Bloomfield - językoznawca amerykański. Jego działalność wywarła bardzo duży wpływ na rozwój amerykańskiego strukturalizmu językowego w okresie od lat 30. do 50. XX wieku. Był uważany za twórcę amerykańskiej szkoły strukturalistycznej. Bloomfield twierdził, że język należy opisywać jako część zachowania się człowieka w kategoriach bodźców i reakcji. Znaczenie wyrażenia językowego to, jego zdaniem, sytuacja, w której użytkownik danego języka je wypowiada oraz reakcja wywołana u odbiorcy. Definicja znaczenia musi, zatem uwzględnić wiedzę o użytkowniku (mówiącym i odbiorcy), w szczególności o procesach neurologicznych, doświadczeniu życiowym etc. Na obecnym etapie nauki wg niego te badania są niemożliwe.
Edward Sapir i Benjamin Lee Whorf - autorzy koncepcji, iż każdy język determinuje w specyficzny sposób postrzeganie rzeczywistości przez jego użytkowników, znanej jako hipoteza Sapira-Whorfa.
Charles Francoise Hockett - zajmował się językami Indian.
GENERATYWIZM
Noam Chmsky - profesor językoznawstwa w Massachusetts Institute of, współtwórca (wraz z Morris Halle) gramatyki transformacyjno-generatywnej. Język jest według Chomsky'ego nieskończonym zbiorem zdań, generowanych za pomocą skończonej liczby reguł i słów. Opracował tzw. hierarchię Chomsky'ego - klasyfikację formalnych gramatyk w językach formalnych.
Zellig Sabbetai Harris - profesor językoznawstwa na uniwersytecie Pennsylvania w Filadelfii. Uczeń Leonarda Bloomfielda, jeden z najwybitniejszych przedstawicieli amerykańskiej szkoły strukturalistycznej. Początkowo był zwolennikiem teorii dystrybucjonizmu, od około 1952 roku przedstawicielem teorii transformacjonizmu. Najważniejsze prace Harrisa:
1939 - "Development of the Canaanite Dialects"
1951 - "Methods in Structural Linguistics"
1957 - "Cooccurence and Transformation in Linguistic Structure"
1959 - "The Transformational Model of the Language Structure"
1965 - "Transformational Theory"
Babik Wiesław - opis metody generowania języków ciągami definicyjnymi.
KOGNITYWIZM - kojarzony jest z teorią poznania. Istnieją dwa główne nurty:
Kognitywizm symboliczny - modelowanie, modelowanie podejmowania decyzji
Kognitywizm subsymboliczny - wyjaśnia procesy myślowe w mózgu ludzkim opartym na funkcjonowaniu sieci neuronowej.
Ronald Langacker - amerykański językoznawca, profesor Uniwersytetu Kalifornijskiego w San Diego w USA. Znany najbardziej jako współtwórca językoznawstwa kognitywnego i twórca gramatyki kognitywnej. Langacker przedstawił główne założenia swojej teorii gramatyki kognitywnej w dwutomowym dziele Foundations of Cognitive Grammar, od którego bierze swój początek językoznawstwo kognitywne. Zgodnie z tymi założeniami, każdy język, którym posługuje się człowiek, składa się wyłącznie z jednostek semantycznych, fonologicznych i symbolicznych (te ostatnie są złożeniem dwóch pierwszych). Zdaniem Langackera struktury językowe są wynikiem działania procesów kognitywnych, czego dowodem są owoce badań psychologii gestaltu.
Przedstawiciele kognitywizmu w Polsce to m.in.: Tomasz Krzeszowski, Aleksander Szwedek, Elżbieta Tabakowska.
LINGWISTYKA STATYSTYCZNA LUB KWANTYTATYWNA
Badania dotyczące prawidłowości językowych. W wojnie słów wygrywają te, które są krótsze. I tak używa się w Polsce słowa komputer, a nie maszyna cyfrowa.
Przedstawicielami tego kierunku są m.in. Jadwiga Sambor i Rolf Hammer.
FUNKCJONALIZM - Językoznawstwo funkcjonalne
Zajmuje się badaniami nad funkcjami języka (jest to przedłużenie tego, czym zajmowano się m.in. w Szkole praskiej). Niektórzy przeciwstawiają funkcjonalizm, formalizmowi.
Funkcjonalizm zajmuje się:
Badaniami struktury informacyjnej wypowiedzi i tego, w jaki sposób informacja jest przekazywana oraz w jakiej strukturze, np. za pomocą UKD itp.,
Dynamizmem komunikatywnym,
Procesem komunikowania,
Pragmatyką i semantyką,
Stylistyką.
WYKŁAD 16
23.04.2008 - JIW, a potrzeby użytkowników.
Języki informacyjne powinny zaspakajać jak najwięcej potrzeb użytkowników. Szybkie tempo zmian potrzeb i wymagań użytkowników, wymaga stałej pracy nad JIW.
Katarzyna Marterska w jednym ze swoich artykułów, porównuje młodych użytkowników systemów, ze starszymi .
Starsi użytkownicy
|
Młodsi użytkownicy
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Psychologiczne aspekty niezbędne do … … … … … … … przy JIW:
JIW muszą być dostosowane do poziomu rozwoju użytkowników, oraz do poziomu umiejętności.
W SIW językowi informacyjnemu, towarzyszy tzw. język kwerend język wyszukiwawczy.
Problemy lingwistyczne (nieznajomość języka; nieznajomość systemów informacyjno-wyszukiwawczych).
WYKŁAD 17
07.05.2008 - Fasetowa organizacja współrzędnych JIW.
Fasetowość
Tezaurofaseta
Klasaurus
Ontologie
Fasetowość (fasety) - termin często jest stosowany zamiennie z kategorią. Pojawił się w Dwukrokowej Klasyfikacji Ranganathana (1933). Gramatykę w tej Klasyfikacji nazwano formułą fasetową. Ranganathan wymienił w swojej klasyfikacji 5 głównych faset tj.: Personalisty, Matter, Energy, Space, Time [PMEST]. Fasetami są więc pewne kategorie, do których zalicza się określona grupę terminów np.: Dziedziny wiedzy (to będzie faseta), natomiast poszczególne nazwy dziedzin wiedzy: matematyka, medycyna, prawo, bibliotekoznawstwo itp.będą terminami zaliczonymi do fasety, czyli będą izolatami . W klasyfikacji Ranganathana, izolaty to elementarne jednostki leksykalne.
Fasetowość w językach deskryptorowych: pojawienie się modyfikatorów określających deskryptory.
Tezaurofaseta - termin zarezerwowany dla słownika wydanego w Anglii w 1970 roku, dla British Electric Company. Był to wtedy nowoczesny słownik, w którym klasyfikację fasetową połączono z tezaurusem. Obecnie wszystkie tezaurusy mają już taką strukturę, aczkolwiek nazywa się je tezaurusami fasetowymi [a nie tezaurofasetami].
Klasaurus - jest to rodzaj, typ tezaurusa fasetowego, w którym słownictwo ze zrębu głównego jest uporządkowane według klasyfikacji Ranganathana.
DSIS - Deep Structure Indexing System. Wyodrębniono tu 4 fasety (podobne do tych zastosowanych w klasyfikacji Ranganathana). W DSIS wyodrębnił je Bhattacharyya (jakiś pan z Indii). Oto i rzeczone fasety: dyscyplina, obiekt, własność, akcja (nazwy działań, procesów).
POPSI - Postulate-based Permuted Subject Indexing. System indeksowania automatycznego służący do automatycznego tworzenia, generowania indeksów przedmiotowych (na podstawie fraz nominalnych w języku angielskim).
Fraza nominalna - wyrażenie posiadające rzeczownik (zwykle jest to rzeczownik z przymiotnikami).
Ontologia - w JIW jest to sieć, zbiór jednostek leksykalnych wzajemnie ze sobą powiązanych relacjami, które tworzą dla każdej jednostki leksykalnej kontekst.
3
Tekst
Zdanie
EJL
Morfem
EZG
Słownik Gramatyka Reguły
JIW
SYSTEM LEKSYKALNY
SYSTEM SŁOWNIKOWY
SYSTEM SEMANTYCZY
SYSTEM RELACYJNY
SYSTEM GRAMATYCZNY
SYSTEM TRANSFORMACJI (tworzenie nowych słów)
SYSTEM PRAGMATYCZNY (jak posługiwać się danym językiem)
Rzeczywistość dokumentacyjna
Książka o kocie, kotach
Rzeczywistość poza językowa
Istnienie kota, jako zwierzaka
Rzeczywistość językowa
Słowo „kot”
szerokość
głębokość
treść