JIW

I. Językoznawstwo ogólne

  1. Semiotyka – to nauka o znakach i systemach znakowych tworzących język. Zajmuje się rodzajami, właściwościami i funkcjami znaków. Obejmuje swym zakresem semantykę, syntaktykę i pragmatykę.

Przedstawiciele: Umberto Eco, Charles Sanders Pierce, Ferdynand de Saussure

  1. Semantyka – jest to nauka zajmująca się badaniem związków, jakie zachodzą między znakiem, a rzeczywistością, do której znak się odnosi. Semantyka zajmuje się problematyką znaczenia wyrażeń.

Przedstawiciele: H. Paul, A. Millet, M. Breal

  1. Pragmatyka – dział językoznawstwa, którego przedmiotem są społeczne i sytuacyjne warunki funkcjonowania języka.

  2. Gramatyka – zbiór reguł określających system zasady budowy i odmiany wyrazów oraz reguł składni danego języka. W zakres gramatyki wchodzą takie dziedziny jak fonologia, składnia, morfologia. Wyróżnia się gramatykę opisową i historyczno porównawczą.

  3. Semiologia – teoria badająca wpływ znaków na porozumiewanie się ludzi, obejmuje semantykę, syntaktykę i pragmatykę.

  4. Językoznawstwo – dział nauk humanistycznych, bada istotę, budowę i rozwój języka.

  5. Działy językoznawstwa (przykłady, bo jest ich w cholere dużo):

    • Dialektologia

    • Etymologia

    • Fonologia

    • Frazeologia

    • Leksykologia

    • Pragmatyka

    • Semantyka

    • Semiotyka

    • Słowotwórstwo

    • Syntaktyka

  6. Język – to zespół społecznie wytworzonych i obowiązujących znaków poza dźwiękowych (wtórnie pisanych) oraz reguł określających ich użycie, funkcjonujący jako narzędzie komunikacji społecznej.

  7. Kod – ścisłe przyporządkowanie elementów jednego zbioru (najczęściej znaków, nazw, liter) elementom drugiego zbioru (najczęściej sygnałom)

  8. Szyfr – ciąg liczb i/lub innych symboli stanowiących kod dostępu. Zapis tekstu za pomocą systemu znaków umownych, stosowany w celu zatajenia treści.

  9. Funkcje języka:

    • Funkcja ekspresywna

    • Funkcja impresywna

    • Funkcja fatyczna

    • Funkcja poetycka

    • Funkcja metajęzykowa

    • Funkcja meta informacyjna

    • Funkcja opisowa

  10. Relacje w języku:

    • Relacje paradygmatyczne – skojarzeniowe, tkwiące w świadomości mówiących (np. biały-biel-bielić)

    • Relacje syntagmatyczne – kontekstowe, istniejące w tekście (np. biały-śnieg, bielić ścianę)

  11. Znak – to co informuje o czymś poprzez wywołanie odpowiednich skojarzeń.

  12. Podział znaków:

    • Naturalne (opierać się mogą na relacji przyczynowo – skutkowej lub szerzej – na relacji faktycznej przyległości) o Symptomy (znaki jednostronne) o Obrazy (znaki dwustronne)

    • Konwencjonalne (opierają się na konwencji, umowie istniejącej między członkami jakiejś wspólnoty komunikatywnej)

Ze względu na zmysły:

Poziomy znaków języka naturalnego

POZIOM ZNAK PROSTY

REGUŁY

FORMA

ZNACZENIOWA

FORMA

INFORMACYJNA

Fonetyczny Elementarna cecha fonetyczna

Reguły fonetyczne

Nie

Nie

Fonem

Reguły fonetyczne

Nie

Nie

Morfologiczny Morfem

Reguły morfologiczne

Tak

Nie

Leksykalny Wyraz

Reguły składniowe

Tak

Nie

Fraza

(syntagma)

Reguły składniowe

Tak

Nie

Syntaktyczny Zdanie

Reguły składniowe

Tak

Tak

Teksu Tekst

-

Tak

Tak

  1. Cechy znaków językowych:

    • Arbitralność języka wiąże się z jego konwencjonalnością i oznacza, że między formą a treścią znaków brak związku naturalnego

    • Semantyczność polega na tym, że znaki językowe odsyłają odbiorcę do jakichś zjawisk otaczającego świata. Semantyczność języka to abstrakcyjność jego znaków.

    • Dwustopniowość struktury oznacza, że język jest zorganizowany na dwóch poziomach: jeden tworzą elementy nie obdarzone znaczeniem, drugi – jednostki znaczące.

    • Autonomiczność języka to możliwość posługiwania się językiem dla mówienia o sprawach odległych w czasie i przestrzeni.

    • Kreacyjność polega na tym, że człowiek może mówić o wszystkim o czym zechce.

  2. Funkcje znaków/systemów znakowych:

    • Komunikatywna

    • Semantyczna

    • Informacyjna

    • Reprezentatywna

    • Przedstawieniowa

    • Referencyjna

  3. Znaczenie w języku:

Znaczenie jest to relacja słowna do świata, do zewnętrznej pozajęzykowej rzeczywistości. Znaczeniem jest odniesienie ogólne, czyli relacja między słowem, a przedmiotem czy zjawiskiem jednostkowym. Znaczenia ukazują w jaki sposób postrzegamy i oceniamy elementy świata, do których te słowa się odnoszą.

Rodzaje znaczeń w języku:
a) Etymologiczne

  1. Nazwa – wyraz lub kilka wyrazów oznaczających kogoś lub coś Typy nazw:

    • Nazwy pospolite (dotyczą typowych jednostek systemu leksykalnego, mających znaczenie, które odpowiada którejś z klas pojęciowych)

    • Nazwy własne (nie mają znaczenia leksykalnego, są określeniami jednostkowymi, są określeniami pojedynczych, niepowtarzalnych przejawów naszej rzeczywistości)

  2. Plan treści – materiał znaczeniowy wypowiedzi

  3. Plan wyrażania – to sposób organizowania materiału językowego w wypowiedzi literackiej

  4. Pole semantyczne – struktura zbudowana ze znaczeń (treści), jakie można wyrazić w danym języku za pomocą środków (relacji), którymi ten język dysponuje. Pole semantyczne ma zakres (np. wszystkie stworzenia, którym można przyporządkować jakąś nazwę) i treść (cechy pewnych obiektów, zbiór cech).

  5. Denotacja (zakres, ekstensja) – zbiór tych elementów rzeczywistości (desygnatów), którym zgodnie z regułami semantyki danego języka można przyporządkować daną nazwę lub wyraz. Denotacją nazwy „kot” jest zbiór wszystkich (przeszłych, obecnych i przyszłych) kotów.

  6. Konotacja (treść, intencja) – treść nazwy, czyli taki zespół cech elementów rzeczywistości, na podstawie których można przyporządkować mu zgodnie z regułami semantyki danego języka dana nazwę, wyrażenie. Cechy mogą być konstytutywne i charakterystyczne.

  7. Polisemia – wieloznaczność językowa, zjawisko, w którym jedno słowo ma więcej niż jedno znaczenie

  8. Synonimia – bliskoznaczność wyrazów

  9. Homonimia – właściwość wyrazów, polegająca na tym, że brzmią jednakowo, mając różne znaczenia

  10. Antonimia – przeciwstawność znaczeń wyrazów (np. ciepły-zimny)

  11. Język sztuczny – język w znaczeniu, który został przez kogoś celowo zbudowany; konstrukcja języka sztucznego zawsze poprzedza jego użycie. Synonim: język formalny. Np. język rachunku zdań, język strukturalnych wzorów chemicznych, język esperanto.

  12. Jak wyżej, Język sztuczny=język formalny

  13. System leksykalny – struktura językowa zbudowana z wykładników językowych znaczeń

(wyrazów, leksemów), które można wyrazić w danym języku za pomocą środków, którymi ten język dysponuje.

  1. System słownikowy każdego języka naturalnego ma budowę luźną. Oznacza to, że wyrażenia nie dają się ułożyć w jedno drzewo klasyfikacyjne.

  2. Metajęzyk – dowolny język służący do opisu innego języka.

  3. Metainformacja – informacja o informacji (np. katalogi, słowniki, rejestry, materiały informacyjne, przewodniki, poradniki)

II. Teoria JIW (struktura i funkcje)

  1. Język informacyjno – wyszukiwawczy – jest systemem sztucznym, zbudowanym celowo dla potrzeb optymalizacji reprezentacji istotnych elementów treści i/lub formy dokumentów w systemie informacyjno-wyszukiwawczym i zapewnienia ich formalnego odnalezienia w odpowiedzi na zapytanie informacyjne użytkownika.

Sztuczny system językowy, którego wyspecjalizowanymi funkcjami są funkcja meta informacyjna i wyszukiwawcza.

  1. Funkcje JIW:

    • Funkcja impresywna (apelatywna) = funkcja wyszukiwawcza

    • Funkcja meta informacyjna – wyspecjalizowana funkcja opisowa JIW, polegająca na odwzorowaniu cech treści i/lub formy dokumentów

    • Funkcja wyszukiwawcza (heurystyczna) – wyspecjalizowana funkcja impresywna

(imperatywna, apelatywna) jiw polegająca na sterowaniu procedurami wyszukiwania informacji o dokumentach i cechach treści i/lub form wskazanych przez użytkownika

  1. Funkcje wtórne JIW:

    • Funkcja organizująca (porządkująca) – zapewnia strukturalizację zbioru informacyjnego, ułatwiająca selekcję określonych opisów dokumentów

    • Funkcja opisu zbiorów dokumentów (informacji) i/lub wyznaczania zakresów półsemantycznych JIW (realizowana przez podgrupę JIW takich jak klasyfikacje szczytowe i nadrzędne języki deskryptorowe operujące makrotezaurusami.

  2. Poziomy znaków JIW – określają stopień złożoności znaku w strukturze języka oraz związaną z nim funkcję.

POZIOM

JIW

Język klasyfikacyjny

UKD

Jednostka

Reguły

Jednostka

Reguły

Notacyjny

EZG

Notacyjne

Znaki bazy

notacyjnej

Danego

notacji

typu

Leksykalny

EJL

Składniki zdania

Symbole klasyfikacyjne

(główne i

pomocnicze)

Budowy symboli tematów

002.145 (091)

„20”

Syntaktyczny

Zdanie JIW

Składniki tekstu Symbole klasyfikacyjne tematów Budowy symboli dokumentów

Symbole proste, rozwinięte i

złożone tematów

504

504.052

616-051

373:62](436)

Tekstu

Tekst, JIW,

ChWD, IW

Symbole

klasyfikacji

dokumentów

  1. System notacyjny – to baza notacyjna (alfabet) + reguły notacyjne

Baza notacyjna – zbiór elementarnych znaków graficznych, za pomocą których tworzone są wyrażenia JIW

Reguły notacyjne – zasady łączenia elementarnych znaków graficznych w ciągi stanowiące elementarne jednostki leksykalne JIW

Elementarnymi znakami graficznymi JIW mogą być:

  1. Podstawowe rodzaje systemów notacyjnych:

  1. Podział wg typu alfabetu:

    • Notacja jednorodna

    • Notacja mieszana

    • Notacja alfabetyczna

    • Notacja numeryczna

    • Notacja specjalna

  2. Podział wg cech strukturalnych:

    • Notacja liniowa

    • Notacja strukturalna

    • Notacja hierarchiczna

    • Notacja składnikowa

    • Notacja retroaktywna

    • Notacja znaków skróconych

c) Podział wg cech mnemotechnicznych

  1. Podział leksykalny

Elementarna jednostka leksykalna to wyraz (wyrażenie proste) JIW, czyli najmniejsza jednostka JIW pełniąca funkcję semantyczną.

Zbiór EJL stanowi słownictwo JIW.

Rodzaje EJL i słownictwo JIW wyróżnia się ze względu na ich cechy:

  1. Podstawowe typy EJL:

  1. Podział ze względu na formę wyrażeniową:

    • Słownictwo para naturalne (quasi naturalne) - derywowane ze słownictwa języka naturalnego; najczęściej przyjmuje postać prostych lub rozwiniętych fraz nominalnych; np. naturalne nazwy klas ANATOMIA, PTAKI

    • Słownictwo sztuczne – kody sztuczne; najczęściej przyjmuje postać numerycznych, alfabetycznych lub alfanumerycznych symboli pojęć (klas) elementarnych wyodrębnionych w polu semantycznym JIW, np. symbole klasyfikacyjne klas głównych i pomocniczych 611, 598.2, 621.43

  2. Podział ze względu na funkcję semantyczną w opisie dokumentów:

    • Słownictwo podstawowe – zbiór podstawowych jednostek leksykalnych przeznaczonych do wyrażania podstawowych elementów treści dokumentu, najczęściej przedmiotu głównego, drugorzędnego lub potocznego, np. symbole główne UKD.

    • Słownictwo pomocnicze – zbiór pomocniczych jednostek leksykalnych przeznaczonych do wyrażania drugorzędnych charakterystyk dokumentu np. aspektu, lokalizacji czasowo – przestrzennej, formy dokumentu, relacji zachodzących między wyrażeniami reprezentującymi podstawowe elementy treści, np. symbole podziałów wspólnych i analitycznych UKD, znaki łączące.

  1. Typy słowników JIW

  1. Wg zasad prezentacji przekładu z języka naturalnego na JIW:

    • Słownik explicite – jednoznacznie wskazujący przyporządkowanie EJL JIW określonym wyrażeniom naturalnym stanowiącym nazwy elementów treści lub cech formalnych dokumentów; wg niektórych teoretyków JIW klasę tę reprezentują wyłącznie tezaurusy (słowniki języków deskryptorowych);

    • Słownik implicite – wymagające od użytkownika samodzielnego ustalenia związku między wyrażeniami naturalnymi opisującymi elementy treści i cechy formalne dokumentu a odpowiadającymi im wyrażeniami JIW; do klasy tej zalicza się większość słowników JIW o słownictwie kontrolowanym, w tym tablice klasyfikacyjne.

  2. Wg zasad porządkowania wykazu EJL:

    • Słownik dodatni – wykaz EJL, za pomocą których buduje się zdania JIW o słownictwie kontrolowanym; w językach klasyfikacyjnych przyjmuje postać tablic klasyfikacyjnych.

    • Słownik ujemny – wykaz wyrażeń, których nie wolno stosować do tworzenia zdań JIW; wykorzystywany w językach o para naturalnym słownictwie niekontrolowanym (tzw. języku swobodnych słów kluczowych).

    • Słownik zadany instrukcją – zbiór reguł wyznaczających podzbiór wyrażeń języka naturalnego, które wolno stosować jako EJL o niekontrolowanym słownictwie para naturalnym.

Organizacja systemu leksykalnego JIW

  1. Pole semantyczne JIW – suma znaczenia wszystkich wyrażeń JIW; zbiór wchodzących we wzajemne relacje pojęć, które można wyrazić w danym JIW

  2. Struktura pola semantycznego JIW wyznaczana jest przez 3 elementy:

    • Sieć paradygmatycznych relacji semantycznych

    • Kategoryzację semantyczną EJL

    • Podział dyscyplinarny EJL

  3. Relacje w JIW:

    • Paradygmatyczne (relacje systemowe, słownikowe), tego typu relacje występują w słownikach JIW. Relacje zachodzące między elementami języka (słownika)

    • Syntagmatyczne (relacje tekstowe) – są to relacje zachodzące między elementami tekstów języka

  4. Relacje paradygmatyczne w JIW:

    • Relacja synonimii

    • Relacja hierarchiczna

    • Relacja generyczna

    • Relacja merologiczna

    • Relacja hierarchii tematycznej

    • Relacja kojarzeniowa

Podział relacji, ze względu na rzeczywistość, której dotyczą:

  1. Kategoryzacja semantyczna – podział słownictwa na kategorie semantyczne

  2. Podział dyscyplinarny – podział pola semantycznego JIW na obszary odpowiadające dyscyplinom nauki lub działom działalności praktycznej, do których kwalifikowane są pojęcia reprezentowane przez EJL

  3. Relacja syntagmatyczna – relacja między wyrażeniami prostymi w strukturze wyrażenia złożonego

  4. Rodzaje relacji syntagmatycznych:

    • Syntagmatyczne relacje współwystępowania (konkurencji), odpowiadające znaczeniem spójnikowi „i”

    • Syntagmatyczne relacje zależności semantycznej specyfikowanej lub niespecyfikowanej, odpowiadające znaczeniem takim spójnikom jak „a”, „wobec” etc.

  5. Wykładniki relacji syntagmatycznych:

    • Wskaźniki więzi – symbole cyfrowe lub literowe stosowane na oznaczenie relacji występujących pomiędzy jednostkami leksykalnymi tworzącymi tekst JIW.. wskaźniki więzi zapobiegają błędnej koordynacji jednostek leksykalnych tworzących daną charakterystykę dokumentu.

    • Wskaźniki wagi – ich zadaniem jest określenie w jakim stopniu dana jednostka leksykalna wchodząca w skład charakterystyki wyszukiwawczej wyraża treść dokumentu.

    • Wskaźniki roli – są wykładnikami językowymi relacji dotyczących funkcji lub roli jednostek leksykalnych występujących w tekście danego dokumentu.

    • Algebra Boole’a

    • Znaki łączące jak w UKD: ;,:.+/- ip.

  6. Gramatyka JIW – zespół zasad łączenia ze sobą EJL w strukturze zdania JIW i zachodzących między nimi relacji syntagmatycznych

  7. Typy gramatyki JIW:

    • Gramatyka zerowa – jedyną regułą gramatyczną jest reguła o nieodłączaniu tj. reguła tworzenia zdań jednowyrazowych.

Każda EJL stanowi samodzielną charakterystykę dokumentu lub instrukcję wyszukiwawczą; nie dopuszcza się możliwości łączenia EJL w wyrażenia bardziej złożone; brak wykładników relacji syntagmatycznych.

Gramatyka ta w formie czystej jest stosowana już tylko w klasycznych wyliczających klasyfikacjach bibliotecznych

Stosowane są dwie odmiany tej gramatki:

Historia – filozofia (idee filozoficzne, które pojawiły się w historii)

Jedyną regułą gramatyczną jest reguła dołączania (konkatenacji). Jedyną relacją syntagmatyczną jest reguła kookurencji, czyli współwystępowania EJL w zdaniu w dowolnej kolejności. Interpretacja znaczeniowa każdej EJL jest niezależna od kontekstu. Każda EJL jest samodzielnym kluczem wyszukiwawczym.

Klasycznym przykładem gramatyki nie pozycyjnej jest gramatyka stosowana najczęściej w językach deskryptorowych, językach słów kluczowych, określana jako indeksowanie współrzędne (koordynacyjne).

„ samodzielna EJL – niesamodzielna EJL” I swobodny szyk fraz typu:

„samodzielna EJL – samodzielna EJL” Ten typ gramatyki cechuje UKD.

  1. Reguły gramatyki JIW odpowiadają na pytania:

    • Jaka jest najmniejsza i największa liczba EJL tworzących zdanie

    • Jakie EJL mogą samodzielnie tworzyć zdanie, a jakie mogą się powtarzać

    • Czy są jakieś EJL, które zawsze muszą występować w zdaniu

    • Czy istnieje jakiś określony porządek w układzie EJL

    • Czy istnieją zasady korelacji między EJL w zdaniu

  2. Relacje w JIW:

    1. Relacje synonimii wyszukiwawczej

    2. Relacja hierarchiczna

      1. Relacje generyczne

        1. Nadrzędności

        2. podrzędności

      2. Relacje merologiczne

        1. Nadrzędności

        2. podrzędności

      3. Relacje hierarchii tematycznej

        1. Nadrzędności

        2. Podrzędności iii.

    1. Relacje współrzędności

    2. Relacje kojarzeniowe

    3. Relacje syntagmatyczne

  3. Pragmatyka JIW – dziedzina teorii, która zajmuje się problemami dotyczącymi posługiwania się tymi językami, a więc stosowania ich w opisie dokumentów, a także do wyszukiwania dokumentów.

  1. Rodzaje pragmatyki JIW:

    • Ogólna – zbiór zasad posługiwania się JIW lub danym typem JIW; ma dwa działy:

      • Pragmatyka indeksowania dokumentów o Pragmatyka wyszukiwania dokumentów

    • Szczegółowa – dotyczy zasad posługiwania się konkretnym językiem, np. UKD o Wykorzystanie danego JIW w opisie dokumentów

      • Wyszukiwanie dokumentów w konkretnym języku

  2. Indeksowanie (szerokość indeksowania i szczegółowość indeksowania zwana też głębokością) – czynność sporządzania tekstu w danym JIW czyli charakterystyki słownej, treści dokumentu a także jej przekładu na wybrany JIW. W wyniku takiego przekładu otrzymujemy dok. w postaci charakterystyki wyszukiwawczej zapytania.

  3. Szerokość indeksowania – odpowiada na pytanie w jakim stopniu została odzwierciedlona (jako pokrywa się) treść dokumentu w charakterystyce wyszukiwawczej tego dokumentu. Szerokość indeksowania rośnie wraz z liczbą uwzględnionych w charakterystyce wyszukiwawczej dokumentu tematów. (im więcej tematów tym szerokość jest większa).

  4. Szczegółowość indeksowania – jest to stopień uogólnienia (szczegółowości) jednostek leksykalnych użytych w indeksowaniu do tworzenia tekstów danego dokumentu. Głębokość rośnie wraz z liczbą jednostek leksykalnych użytych w tekście JIW służących do rozdrobienia treści dokumentu. Stopień rozdrobnienia treści w charakterystyce wyszukiwawczej dokumentu.

27.Metody indeksowania:

Indeksowanie intelektualne (ręczne/konwencjonalne) – indeksowanie swobodne (gdy słownik mamy w głowie), indeksowanie słownikowe, indeksowanie hybrydowe (ze słowników i tego co mamy w głowie), indeksowanie współrzędne.

Tryby indeksowania:

Indeksowanie automatyczne (niekonwencjonalne)

Metody indeksowania automatycznego:

 Lingwistyczne – metody wykorzystujące automatyczną analizę językowa w celu wyróżnienia w tekście dokumentu wyrażeń informacyjnie ważnych, znaczących dla jego treści.

Indeksowanie współrzędne – indeksowanie charakteryzujące się tym, że pomiędzy użytymi wyrażeniami JIW zachodzi jedynie relacja współwystępowania w tekście – dzięki czemu każde z nich może samodzielnie pełnić funkcję wyszukiwawczą.

Metody indeksowania współrzędnego można wyróżnić wg stopnia ich formalizacji lub kryterium wyboru słów kluczowych.
a) Wg stopnia formalizacji:

b) Wg kryterium wyboru słów kluczowych:

  1. Typologia JIW (wg Ścibora):

    1. Języki klasyfikacyjne (klasyfikacje piśmiennictwa)

    2. Języki haseł przedmiotowych

    3. Języki słów kluczowych

    4. Języki deskryptorowe

    5. Języki kodów semantycznych i języki syntagmatyczne

    6. Języki opisu formalnego (bibliograficznego, katalogowego, cytowań bibliograficznych)

  2. Metody projektowania JIW:

    • Metoda określania zakresu i modelu pola semantycznego JIW

    • Metody wyboru terminów

    • Metody opracowania/strukturalizacji/systematyzacji zgromadzonej terminologii

    • Metody prezentacji słownictwa

  3. Tendencje rozwoju JIW:

Jadwiga Woźniak-Kasperek:

  1. Od starożytności do lat 60. XX w.. Charakterystyczną cecha tego okresu są wyłącznie języki o słownictwie kontrolowanym

  2. Lata 60. i 70. To okres intensywnych badań nad efektywnością JIW, przede wszystkim o słownictwie kontrolowanym.

  3. Lata 70. – najlepsze efekty uzyskuje się stosując język kontrolowany i język naturalny

  4. Lata 90. Renesans i powrót JIW o słownictwie kontrolowanym.

E. Ścibor:

  1. Stosowanie swobodnych słów kluczowych w wyszukiwarkach internetowych

  2. Dążenie do integracji tezaurusów z obsługiwanymi przez nie bazami danych

  3. Transformacja JHP upodobniających się w coraz większym stopniu do innych języków

  4. Utrzymywanie się znaczenia języków klasyfikacyjnych i dążenie do ich przekształcania w klasyfikacje fasetowe

Do współczesnych trendów rozwoju JIW i opracowania rzeczowego można zaliczyć:

[Wzięte z książki jakiejś tam, wg Babika nazywanej „strzał w dziesiątkę”]

31. Kryteria i wyznaczniki oceny języków informacyjno-wyszukiwawczych:

Za najważniejszą cechę konstytuującą wartość jiw uznaje się odpowiednią siłę semantyczną języka osiąganą na osiach paradygmatycznej i syntagmatycznej dzięki:

Oznacza to, że optymalny jiw to taki, który jest odpowiedni, przydatny i stosowny do sytuacji czyli:

Rodzaj stosowanego jiw ma niewielki wpływ na efektywność wyszukiwania informacji, poszczególne typy jiw mają zbliżony poziom potencjalnej efektywności wyszukiwawczej, na efektywność wyszukiwani istotnie wpływa sposób eksploatacji jiw (indeksowanie).

III. Języki informacyjno-wyszukiwawcze

Języki klasyfikacyjne – klasa JIW, których paradygmatykę stanowią relacje hierarchiczne, odwzorowywane najczęściej w strukturze ich wyrażeń.

Słownikiem klasyfikacji są tablice klasyfikacyjne:

Gramatyka: reguły budowy symboli klasyfikacyjnych pojęć, tematów i dokumentów:

Najbardziej znanymi i rozpowszechnionymi klasyfikacjami są UKD, KDD, KBK, Klasyfikacja Dwukropkowa Ranganathana.

Języki klasyfikacyjne są wykorzystywane w Internecie do klasyfikowania i porządkowania logicznego lub dziedzinowo tematycznego. Stosuje się je przede wszystkim w internetowych katalogach.

Klasyfikacja Dziesiętna Dewey’a - jest obecnie najpopularniejszą klasyfikacją stosowaną na wszystkich kontynentach, tłumaczoną na wiele języków. Wykorzystywana jest do porządkowania zbiorów bibliotecznych, a także do układu wielu bibliografii i wydawnictw informacyjnych.

Uniwersalna Klasyfikacja Dziesiętna – UKD jest modyfikacją KDD dokonaną przez dwóch prawników belgijskich: Paula Otleta i Henriego La Fontaine’a w latach 1897-1905.

Elementarne jednostki leksykalne UKD mają postać symboli. Symbole te umieszczone są w tablicach klasyfikacyjnych w dwóch zrębach: głównym – Tablicach głównych i pomocniczych – Tablicach pomocniczych. Symbole umieszczone w Tablicach głównych składają się z cyfr, natomiast w Tablicach pomocniczych – z cyfr i znaków graficznych będących wskaźnikami, wyróżnikami jednostek tam zamieszczonych. Każdemu symbolowi towarzyszy odpowiednik słowny, który wyjaśnia jego znaczenie. Symbol razem z odpowiednikiem tworzy hasło UKD.

Gramatyka określa sposób tworzenia symboli rozwiniętych i złożonych. Symbol rozwinięty powstaje z połączenia symbolu głównego z symbolem(ami) poddziałów wspólnych i analitycznych. Symbol rozwinięty może zawierać w zasadzie wszystkie rodzaje symboli pomocniczych, a nawet kilka jednego rodzaju, z wyjątkiem symbolu poddziału wspólnego punktu widzenia (…). Symbol złożony powstaje w wyniku zestawienia symboli prostych (nierozwiniętych) i/lub symboli rozwiniętych za pomocą znaków łączących (symboli łączących). W UKD stosowane są następujące znaki łączące: + (znak plus), / (kreska ukośna), : (dwukropek), : : (podwójny dwukropek), [ ] (nawias kwadratowy). Znaki łączące + (plus), / (kreska ukośna) i : (dwukropek) mają również zastosowanie przy budowie symboli poddziałów wspólnych (…). Znak + (plus) i / (kreska ukośna) służą do łączenia symboli oznaczających pojęcia równorzędne i nie powiązane z żadnymi lub powiązane bardzo luźnymi relacjami. Wskaźnik plus łączy symbole niekolejne. Znak / (kreska ukośna) łączy symbole kolejne i jest to skrócony zapis za pomocą znaku + (plus). Symbole złożone za pomocą znaków + i / oznaczają najczęściej wielo tematyczną treść klasyfikowanego dokumentu, kilka odrębnych zagadnień i rozszerzają zakres symbolu pierwszego. Znak : (dwukropek) stosuje się dla oznaczenia relacji między pojęciami. Mogą być one różnorodne, np.: wzajemny stosunek, wpływ, działanie, przeznaczenie itp. Wskaźnik : : (dwukropek podwójny) wyznacza stałą kolejność elementów w symbolu złożonym (nie może podlegać inwersji). Tworzy się w ten sposób symbole złożone dla nowych pojęć, dla których nie ma w tablicach odpowiednich symboli. Wskaźnik [ ] (nawias kwadratowy) przeznaczony jest do grupowania symboli prostych i/lub rozwiniętych, połączonych znakiem plusa lub dwukropkiem, które pozostają w pewnej relacji do symboli znajdujących się za nawiasem. Nawias pełni rolę analogiczną jak w zapisie algebraicznym. Można stosować nawias tylko jednostronny, jeśli symbole za nawiasem odnoszą się do wszystkich symboli umieszczonych przed nimi.


Klasyfikacja Biblioteki Kongresu – jest systemem opracowanym dla księgozbioru Biblioteki w Waszyngtonie. Prace nad klasyfikacją rozpoczęto w 1899 roku. Struktura KBK ma charakter typowo monohierarchiczny. W KBK nie stosuje się poddziałów wspólnych dla całego schematu. Tablice klasyfikacyjne nie posiadają wspólnego indeksu przedmiotowego lecz odrębne indeksy dla poszczególnych działów.

Klasyfikacje monohierarchiczne

Systemy klasyfikacji, w których wszystkie klasy są ujęte w jeden schemat hierarchiczny i wywodzą się od jednej klasy, obejmującej cały zakres danej klasyfikacji. W typowych klasyfikacjach monohierarchicznych wszystkie jednostki leksykalne (symbole) są wyliczone jawnie (w „gotowej” formie) w tablicach klasyfikacji, stanowiących słownik języka informacyjnego typu klasyfikacyjnego.

Typowe klasyfikacje monohierarchiczne są stosowane obecnie bardzo rzadko. O wiele częściej występują klasyfikacje monohierarchiczne z bardziej lub mniej wyodrębnionymi poddziałami pomocniczymi (wspólnymi, analitycznymi itp.). Przykładami takich klasyfikacji są UKD i PKT.

Klasyfikacje fasetowe

System klasyfikacji, w których klasy są uporządkowane na podstawie wspólnych

charakterystyk wg kategorii i faset lub tylko wg faset (faseta = grupa klasy odpowiadających jakiejś wspólnej charakterystyce, oznaczający np. rodzaj materiału, rodzaj czynności itp.; fasety mogą być grupowane w kategorie).

Przy klasyfikowaniu dokumentów wg klasyfikacji fasetowej w większości wypadków są używane złożone jednostki leksykalne (symbole złożone), tworzone przez syntezę (zestawienie) elementarnych jednostek leksykalnych, zaczerpniętych z poszczególnych faset.

Klasyfikacja Biblioteczno-Bibliograficzna – powstała w latach 60. W ZSRR, opracowana przez pracowników największych bibliotek radzieckich. Jako kryterium systematyzacji wiedzy zastosowano marksistowsko-leninowską koncepcję nauk.

Klasyfikacja ta dzieli całość nauk na 3 grupy (dodając każdej z nich nauki o niej):

BBK ma szeroko rozbudowany system poddziałów wspólnych, które określają formy dokumentów, terytorium, język lub pojęcie etniczne, chronologię dokumentów, pojęć wspólnych dla danej nauki.

BBK dopuszcza posługiwanie się dwukropkiem dla połączenia dwóch symboli głównych. Wszystkie działy są opatrzone indeksami przedmiotowymi.

Notacja ma charakter mieszany: duże i małe litery alfabetu rosyjskiego oraz cyfry arabskie. Gramatyka tej klasyfikacji jest wzorowana na UKD. Tablice poszczególnych działów zawierają indeks przedmiotowy.

Klasyfikacja BBK była stosowana oprócz w ZSRR również w bibliotekach w Bułgarii, Wietnamie, NRD, Czechosłowacji i Polsce.

Broad System of Ordering – BSO (szeroki system porządkowania) – jest klasyfikacją szczytową opracowaną przez UNISIST przez zespół specjalistów w ramach współpracy FID i UNESCO. Spełniać ma rolę języka pośredniczącego między różnymi JIW. Klasyfikacja ta jest płytkim systemem polihierarchicznym. Gramatyka BSO jest określana w formule fasetowej.

Klasyfikacja Dwukropkowa Rananathana - klasyfikacja stworzona w 1933 r. przez Shiyali Ramarnita Ranganathana. Nazwa tej klasyfikacji pochodzi od dwukropka, będącego jednym elementem łączącym symbole w pierwszej wersji tej klasyfikacji. Ówczesna wersja obejmowała 32 działy główne ułożone wg ewolucyjnej koncepcji wiedzy od nauk przyrodniczych począwszy, a skończywszy na naukach społecznych. Druga wersja, uzupełniona i zmieniona, ukazała się w latach 50. XX w. wprowadzając już 42 działy. Rodzaje relacji:

Polska Klasyfikacja Tematyczna – jest płytką klasyfikacją uniwersalną opracowaną dla SINTO w celu:

Język Haseł Przedmiotowych – język naturalny o słownictwie quasi-naturalnym (mającym postać wyrażeń języka naturalnego) i gramatyce pozycyjnej, tj. o ustalonym szyku EJL w zdaniu języka informacyjnego.

Słownictwo:

Słownik: słownik tematów i określników, słownik haseł przedmiotowych, KHW

Język Haseł Przedmiotowych Biblioteki Narodowej:

JHP BN jest JIW o charakterze uniwersalnym stosowanym od kilkudziesięciu lat w bieżącej bibliografii narodowej, katalogach BN oraz co najmniej kilkuset polskich bibliotekach.

Tematy JHP BN są jednostkami samodzielnymi leksykalnie i składniowo, tzn. mogą samodzielnie stanowić hasło przedmiotowe. Tematy dzielimy na rzeczowe – wyrażane zwykle nazwą pospolitą, jednostkowe – osobowe, korporatywne, tytułowe, geograficzne, formalne.

Określniki są wyrażeniami niesamodzielnymi składniowo, tzn. nie mogą samodzielnie stanowić hasła przedmiotowego. Są elementem dodawanym po temacie w celu doprecyzowania kontekstu, wskazania na aspekt, ujęcie, punkt widzenia, lokalizacji przedmiotu dokumenty w czasie i przestrzeni.

Dzielimy na:

Terminy użyte jako tematy powinny odpowiadać polskiej terminologii z danej dziedziny i pochodzić z wiarygodnych polskich źródeł informacji. Obecnie podstawowym zasobem terminów są wielkie encyklopedie uniwersalne oraz encyklopedie dziedzinowe i słowniki terminologiczne. Terminy są weryfikowane za pomocą aktualnego słownika języka polskiego.

JHP KABA – posiada charakterystyczne cechy dla innych języków haseł przedmiotowych. Język o notacji paranaturalnej.

Język słów kluczowych

Języki informacyjne o słownictwie quasi – naturalnym i gramatyce niepozycyjnej (dowolny szyk elementarnych jednostek leksykalnych w zdaniu języka informacyjnego), równoznacznej w zasadzie indeksowaniem współrzędnym, polegającym na charakteryzowaniu złożonej treści dokumentu przez koordynację współrzędnych, niezależnych, dających się swobodnie zestawiać elementarnych jednostek leksykalnych.

Słownictwo: słowa (fazy) kluczowe

Gramatyka: indeksowanie współrzędne, w przypadku stosowania słownictwa pomocniczego – gramatyka częściowo pozycyjna

Słowa kluczowe w nauce o informacji:

W nauce o informacji można wyróżnić 3 odmienne podejścia do słów kluczowych:

  1. Odrębność w stosunku do wyrażeń języka naturalnego. System leksykalny sztucznego języka słów kluczowych stanowi kontekst słów kluczowych.

  2. Akceptacja bezpośrednich związków integracyjnych z językiem naturalnym. Język naturalny dale kontekst słowom kluczowym.

  3. System leksykalny języka słów kluczowych stanowi kontekst poszczególnych słów kluczowych, zaś język naturalny uzupełnia deficyty tego kontekstu.

Języki deskryptorowe

Języki informacyjne o słownictwie przeważnie quasi – naturalnym i gramatyce przeważnie niepozycyjnej, równoznacznej w zasadzie z indeksowaniem współrzędnym.

Słownictwo: deskryptory oraz ewentualnie identyfikatory, modyfikatory, wskaźniki roli, więzi wagi, relatory:

Słownik: tezaurus:

Języki semantyczne

Całkowicie sformalizowane języki informacyjne, których słownik składa się ze stosunkowo nielicznych kodów (symboli) literowych i/lub cyfrowych, używanych w celu oznaczenia pojęć ogólnych i form gramatycznych.

Kody semantyczne – są budowane na zasadzie tzw. języka semantycznego, stosowanego jako pozbawiony synonimii i homonimii metajęzyk opisu znaczenia głównie wyrażeń języka naturalnego. Słownik takiego języka składa się z wyrażeń, które reprezentują znaczenia elementarne (w sensie filozoficznym). Odwzorowujące podstawowe cechy elementarnej rzeczywistości.

Najbardziej znanymi jiw należącymi do tej grupy są Język ASM-WRU (kod semantyczny J. W. Pery’ego i A. Kenta, M. M. Berry), American Society for Metals, powstał dla ośrodka badań i przekazywania informacji przy Western Reserve University Cleverland (Ohio), 19541959. Słownik składał się z 214 mnożników semantycznych (ang. semantic factors) Słownictwo: mnożniki semantyczne, prymitywy semantyczne, semy

Słownik:

Języki syntagmatyczne:

Słownictwo: deskryptory (lub słowa kluczowe) i relatory

Jedynym językiem syntagmatycznym szerzej znanym jest SYNATOL opracowany w latach

1960-2 na potrzeby systemu EURATOM; stanowił on rodzaj j, deskryptorowego ze znacznie rozbudowaną gramatyką, opartą na systemie delatorów wskazujących powiązania zachodzące między deskryptorami w charakterystykach dokumentów lub w instrukcjach wyszukiwawczych.

Cechy wspólne:

Język tezaurusów (historia, rozwój, rodzaje):

Pierwszy tezaurus został opracowany w 1532 roku przez Roberta Stephanusa i wydany w Paryżu „Thesaurus lingua latinae”. Był to jednojęzyczny słownik frazeologiczny w układzie alfabetycznym, pozwalał poznać znaczenie danego wyrazu oraz jego synonimy.

Pierwszy polski tezaurus opracował Grzegorz Knapski w 1621 r.

Tezaurus Petera Marka RouFgeta („Tezaurus angielskich wyrazów i zwrotów”) został wydany w 1852 r. ma on ok. 100 wydań, znane są 2 wersje tego tezaurusa: „Roget’s International Thesaurus”, „Roget’s Pocket Thesaurus”. Tezaurus składa się z dwóch części, pierwsza jest podzielona na kategorie, klasy i sekcje. Drugą część stanowi indeks alfabetyczny. Adaptacji tego tezaurusa na język polski podjął się Roman Zawiliński.

Rodzaje tezaurusów:

Rozwój tezaurusów:

Tezaurus dokumentacyjny – I taki tezaurus opracował K. Paulus w 1959 r., dotyczył urządzeń elektrycznych i mechanicznych. W Polsce pierwszy tezaurus dokumentacyjny powstał w 1969 r. i dotyczył urządzeń transportu bliskiego.


Typy:

Postać:

Słownictwo tezaurusa stanowią deskryptory, askryptory i (opcjonalnie) modyfikatory.

Deskryptory – to wyrażenia języka deskryptorowego, służące do charakteryzowania dokumentów i pytań, mające na ogół budowę identyczną lub zbliżoną do wyrazów języka naturalnego, choć na ogół nieco inne znaczenie.

Askryptory – to terminy zakazana, nie używane w indeksowaniu, ale przydatne do sprawnej realizacji wyszukiwania; ich znaczenia reprezentują w języku deskryptorowym odpowiednie deskryptory.


Modyfikatory (deskryptory aspektowe)
– to wyrazy pomocnicze niesamodzielnie składniowo, najczęściej o ogólnym, szerokim znaczeniu, stosowane tylko i wyłącznie razem z deskryptorami w celu modyfikacji ich znaczeń.

Metody opracowywania tezaurusów:

Kartoteka Haseł Wzorcowych – forma prezentacji języka opisu bibliograficznego oraz JIW, jak również ich organizacji, kontroli poprawności i spójności w niektórych zautomatyzowanych SIW.

KHW zawiera:

Języki metadanych:

To języki, w których mogą być wprowadzane meta dane obiektów cyfrowych umieszczanych w systemie. Są to m.in. meta dane wydań, publikacji planowanych, grupowych, katalogów oraz opisy i komentarze do wydań i publikacji grupowych. W ramach języków metadanych użytkownika administrator wybiera domyślny język metadanych. Meta dane w tym języku reprezentowane są użytkownikowi stron internetowych wtedy, gdy nie ma on w swoich preferowanych językach żadnego języka z listy wykorzystywanych języków metadanych. Języki metadanych dotyczą elementów, które z reguły codziennie wprowadzane są do biblioteki cyfrowej. Z tego względu zestaw języków metadanych musi być ograniczony do takich języków, w których redaktorzy mogą wprowadzać informacje (meta dane, opisy itd.).

Metadane – dane o danych, informacja o informacji. W działalności informacyjnej termin ten oznacza zdefiniowanie lub opis danych. Często przy tej okazji podaje się przykład katalogu bibliotecznego jako dobrze ustrukturalizowanego zbioru metadanych. Meta dane umożliwiają użytkownikom wyszukanie potrzebnej informacji w cyberprzestrzeni wraz z odpowiedzią na pytanie w jakiej relacji pozostaje ona do innych informacji.


Język opisu formalnego – to klasa wyspecjalizowanych para naturalnych JIW w funkcji wyrażenia cech formalnych dokumentów umożliwiających ich identyfikację. Zazwyczaj są nimi nazwiska i imiona autorów, rok publikacji, miejsce wydania, nazwa wydawcy, tytuł serii, forma wydawnicza i piśmiennicza. Różne elementy tego języka są wykorzystywane do opisu poszczególnych typów dokumentów z uwzględnieniem ich cech relewantnych dla użytkowników. Słowniki tych języków są niejawne.

Do tej grupy JIW zalicza się języki opisu bibliograficznego (katalogowego) i języki cytowań bibliograficznych.

Język opisu bibliograficznego - to klasa języków opisu formalnego stosowana w bibliografiach, bibliografiach załącznikowych, katalogach bibliotecznych.

Język cytowań bibliograficznych – to klasa JIW stosowanych w tzw. indeksach cytowań bibliograficznych, których teksty składają się z opisu bibliograficznego dokumentów cytowanych oraz listy opisów bibliograficznych dokumentów cytowanych w dokumencie źródłowym, tj. umieszczonych w tzw. bibliografii załącznikowej, spisie literatury wykorzystanej w przypisach. Jest to JIW wykorzystujący bibliograficzne odesłania jednych autorów do drugich oraz ujawniający związki tematyczne pomiędzy pracami jednego lub różnych autorów. Języki te powstały w latach 60. XX w.

JIW prostych systemów faktograficznych

System faktograficzny – jest to zespół środków umożliwiających wyszukiwanie i przekazywanie informacji faktograficznej; najeżą tu język informacyjny, zasady opracowywani i wyszukiwania informacji oraz środki techniczne umożliwiające realizację tych procesów.

Prosty system faktograficzny – system faktograficzny niededukcyjny, pozbawiony możliwości wnioskowania, ograniczony jedynie do agregowania danych i wykonywania na nich prostych operacji.

Słownik: znormalizowane nazwy obiektów, cech, wartości. Może zawierać jednostki paranaturalne ale i wartości liczbowe.

Gramatyka; pozycyjna + gramatyka częściowo pozycyjna z rozbudowanym systemem wskaźników roli

Typy języków obiekt – atrybut:

Język systemu „Wielka Emigracja” – dane do tego eksperymentalnego systemu faktograficznego zgromadzono na podstawie materiału archiwalnego znajdującego się w Archiwum Historycznym Ministerstwa Wojny w Vincennes pod Paryżem. System zawiera dane o 2500 emigrantach polskich z epoki napoleońskiej i Powstania Listopadowego. Obiektami są więc w tym systemie emigranci. Do opisu stosuje się opracowany a priori wykaz atrybutów, częściowo wraz z ich wartościami, np. urodzenie, pochodzenie, śmierć, wykształcenie, zawód. Sporządzanie charakterystyk wyszukiwawczych obiektów ogranicza się do podania wartości niektórych atrybutów i zaznaczenia, która z pośród wymienianych wartości atrybutów odnosi się do danego obiektu. Określenia odnoszące się do niektórych atrybutów w tym systemie są właśnie wartościami tych atrybutów. Do odzwierciedlenia relacji paradygmatycznych pomiędzy atrybutami i ich wartościami zastosowano „schodkową” postać zapisu, tzn. nazwy wartości lub atrybutów podrzędnych przesunięto w prawo o 4 znaki w stosunku do nazw atrybutów.

Język systemu analizy treści listów – obiektami systemu są listy, analogiczne jak dokument w systemach dokumentacyjnych. Celem systemu analizy listów jest dostarczenie informacji ułatwiającej podjęcie decyzji poprzez ocenę aktualności zagadnienia i rozpowszechnienia zjawiska na podstawie częstotliwości jego występowania w listach informacja faktograficzna o treści powinna zawierać następujące dane:

W celu wprowadzenia danych do systemu na podstawie listów przygotowuje się specjalne ankiety. Pewne pytania ankiety mają charakter formalny, inne merytoryczny. W celu ujednolicenia odpowiedzi na pytania przygotowano spis możliwych odpowiedzi, czyli wartości atrybutów. Spis taki można opracować na podstawie treści listów lub też bez odwoływania się do nich.

IV. JIW stosowane w konkretnych systemach

  1. Przewodnik Bibliograficzny:

    • Język Haseł Przedmiotowych Biblioteki Narodowej

    • Uniwersalna Klasyfikacja Dziesiętna

  2. KaRo (pisałam, do pana, który stworzył KaRo):

KaRo samo nie implementuje jakiegoś konkretnego języka, zamienia tylko proste dane z formularzy na zapytania zgodne z Z39.50 zapisane w formacie RQG. Dostęp do Federacji Bibliotek Cyfrowych jest realizowany poprzez ich interfejs zgodny z OpenSearch.

  1. Biblioteka WZiKS:

    • Język Haseł Przedmiotowych KABA

    • Kartoteka Haseł Wzorcowych

    • Język stworzony przez bibliotekę

  2. Katalog Kartkowy BJ:

    • Katalogi alfabetyczne łacińskie (bez polskich znaków)

    • Katalogi rzeczowe systematyczne wg układu stworzonego przez pracowników BJ

    • Katalogi przedmiotowe wg JHP BN

  3. Katalog OPAC BJ:

    • Język Haseł Przedmiotowych KABA

    • MeSH

Usuwanie homonimii i synonimii

Eliminacja homonimii - eliminuje to szum informacyjny - (np. Użytkownik pytając o „Różę“ dostaje informację o chorobie zamiast o roślinie) - trzeba określić dookreślenia, zwykle w nawiasie.

Synonimia jest podciągana zwykle do relacji odpowiedniości leksykalnej. Wyklucza się ją poprzez odsyłacze. Na wyższych poziomach niż EJL synonimia też się tworzy czasem i bardzo trudno ją przewidzieć i trudniej jeszcze ją wykluczyć.

Kryteria wyboru JIW:

1. język informacyjny - j. sztuczny którego wyspecjalizowaną funkcją jest funkcja metainformacyjna polegająca na odwzorowaniu cech informacji i/lub cech nośników informacji, na których są one utrwalone, przez tworzenie ich reprezentacji zwanej charakterystyką wyszukiwawcza dokumentu oraz funkcja wyszukiwawcza polegająca na wyrażaniu zapytań informacyjnych i umożliwianiu odnalezienia w zbiorze wyszukiwawczym tych informacji, które spełniają warunki wyrażone w zapytaniu. Ze względu na różne cechy funkcjonalne i własności strukturalne wyróżnia się wiele typów JIW. W zależności od tego, czy przeznaczone są do opisu informacji dokumentacyjnej, czy informacji faktograficznej, dzieli się je ogólnie na dokumentacyjne JIW i faktograficzne JIW. Pierwsza grupa może być rozbita na 2 podklasy, przy innym kryterium funkcjonalnym – wyspecjalizowane w wyrażaniu cech formalnych dokumentu lub własności jego treści. Języki wyspecjalizowane w pierwszej z tych funkcji, czyli w wyrażaniu własności dokumentu traktowane jako nośnik informacji, to języki opisu bibliograficznego, języki opisu formalnego i języki opisu katalogowego. Języki wyspecjalizowane w funkcji drugiej to języki opisu rzeczowego dokumenty, które w dawniejszej literaturze utożsamiane były z językami informacyjno wyszukiwawczymi w ogóle i obejmowały wszelkie języki przeznaczone do tworzenia opisu dokumentów na potrzeby katalogów rzeczowych. Obecnie zarysowuje się tendencja traktowania takich języków jedynie jako jednego z podtypów szerszej klasy języków informacyjno wyszukiwawczych, do którego najczęściej zalicza się klasyfikacje (wśród nich klasyfikacje monohierarchiczne i klasyfikacje fasetowe), jhp, języki deskryptorowe, języki słów kluczowych, języki typu kodu semantycznego i tzw. języki syntagmatyczne.

Funkcje języka informacyjnego:

  1. metainformacyjna – odtwarza treść dokumentu oraz jego cechy formalne

  2. wyszukiwawcza – umożliwia wyrażenie zapytań informacyjnych w formie instrukcji wyszukiwawczych oraz odnalezienie w zbiorze informacyjnym tych dokumentów, które odpowiadają danemu zapytaniu

2. Specjalistyczny język sztuczny, przeznaczony do opisania podstawowych treści dokumentów i formułowania kwerend; jest językiem ogólnym, który jest interpretowany dopiero w zaprojektowanym systemie; język powinien być kompletny, zupełny, prosty i powinien spełniać oczekiwania użytkownika; ta sama informacja o obiekcie może być różnie zapisana w zależności od przyjętego języka.

Funkcje języka informacyjno-wyszukiwawczego:

A. Funkcja metainformacyjna - polega na ograniczaniu funkcji semantycznej języka naturalnego do opisu informacji - np. prezentacji cech treściowych i/lub formalnych dokumentów czy też prezentacji dystynktywnych cech obiektów pozadokumentacyjnych; funkcja podstawowa

B. Funkcja wyszukiwawcza (impresywna, heurystyczna) - polega na sterowaniu procesem wyszukiwania informacji poprzez wyrażenia charakteryzujące warunki, jakie powinien spełniać wyszukany podzbiór informacji. O możliwościach realizacji funkcji wyszukiwawczej decyduje w znacznej mierze funkcja organizacyjna; funkcja podstawowa

C. Funkcja organizacyjna - określa miejsce wyrażeń syntaktycznie prostych języka w zbiorze informacji systemu poprzez formę tych wyrażeń (plan wyrażenia); funkcja wtórna

D. Funkcja określania zakresu tematycznego zbiorów informacji

Funkcje i znaczenia relacji paradygmatycznych:

a) Nacechowanie i nienacechowanie.

b) Obciążenie funkcjonalne

W angielskim istnieje wiele wyrazów, tworzących tzw. pary minimalne, które różnią się tylko tym, że w jednym jest /p/ a w drugim /b/, np. pet – bet, pack – back, cap – cab itp. Ponieważ takich wyrazów jest wiele, kontrast między tymi dwoma elementami ma duże obciążenie funkcjonalne. Inne opozycje wykazują mniejsze obciążenie funkcjonalne.

Zatem im większe obciążenie funkcjonalne tym ważniejsze przyswojenie sobie danej opozycji.

W skandynawskich: długość (samogłoski i spółgłoski): w polskim nie ma obciążenia funkcjonalnego (taaaka ryba to wciąż taka ryba), podczas gdy w szwedzkim – ogromne.

Ograniczenia

- Obciążenie funkcjonalne może być różne w zależności od miejsca w wyrazie: większe w nagłosie ale bez znaczenia w wygłosie (jak w polskim p - b).

- Obciążenie funkcjonalne zależy też od tego, czy dane wyrazy mają podobną dystrybucję. Przy dystrybucji komplementarnej – zero!

- Częstość występowania danego wyrazu.

c) Struktura statystyczna. Prawo Zipf’a.

Korelacja między długością a częstością występowania danego elementu.

d) Redundancja

’Zbyteczność’. Pewna część informacji gramatycznej jest zakodowana wielokrotnie, ale też pewna część informacji umyka w ’szumie’, stąd pewna ilość redundancji jest konieczna.

e) Akceptowalność

Wypowiedź akceptowalna została lub mogła zostać wyprodukowana przez rodowitego użytkownika danego języka w odpowiednim kontekście i jest albo mogłaby być akceptowana jako należąca do tego języka przez innego z jego rodowitych użytkowników.

f) Gramatyczność

akceptowalność na mocy określonego zbioru reguł i określonej klasyfikacji elementów leksykalnych i gramatycznych języka. Niedookreśloność gramatyki: to, czy dana wypowiedź jest gramatyczna czy nie można stwierdzić tylko w odniesieniu do konkretnego zbioru reguł.

g) Sensowność

Układ tezaurusa Rogeta

"(...) nazwa tezaurus zyskała znaczenie słownika pojęciowego, w którym słownictwo jest uporządkowane według kategorii tematycznych, a artykuły hasłowe zawierają wykaz wyrażeń pokrewnych znaczeniowo wobec danego hasła (najczęściej synonimów i bliskoznaczników, niekiedy też hiperonimów, hiponimów i antonimów). Pierwszym słownikiem tego typu był Petera Marca Rogeta Thesaurus of English Words and Phrases (Londyn 1852; do dziś ok. 100 wydań) i on to właśnie stał się wzorcem tezaurusa rozmumianego jako słownik pojęciowy. (...)Tezaurus Rogeta pomyślany był jako narzędzie, które piszącym ułatwi znalezienie odpowiedniego słowa lub frazy wyrażającej określone pojęcie, określony sens. Tezaurus jako narzędzie wyszukiwania informacji ma indeksatorowi zapewnić wybór terminów, które najlepiej identyfikują pojęcia składające się na treść indeksowanego tekstu (dokumentu), a wyszukującemu – wybór terminów, za pomocą których najtrafniej wyrazi pojęcia składające się na temat, którego omówień szuka w systemie informacyjnym, co w konsekwencji powinno pozwolić mu wyodrębnić opisy tych omówień (dokumentów zawierających je) w zbiorze wyszukiwawczym systemu. W obu przypadkach wybór właściwego wyrażenia umożliwić ma prezentacja jego powiązań znaczeniowych z innymi wyrażeniami, czyli projekcja r e l a c y j n e j s t r u k t u r y j e g o p o l a s e m a n t y c z n e g o za pomocą artykułów słownikowych zawierających informacje o relacjach semantycznych, w które wchodzi wyrażenie hasłowe, oraz za pomocą pojęciowej organizacji leksyki, grupującej wyrażenia według kategorii semantycznych.

Wąskie znaczenie terminu, JIW – uważa się, że są to języki sztuczne służące do opisu treści dokumentów. Nowsze opracowania rozszerzają tę definicję również o formę dokumentu.

(to znaczy, że JIW = TREŚĆ + FORMA)

Szerokie znaczenie terminu, JIW – uważa się (Babik również), że języki te są budowane dla różnych typów systemów informacyjno-wyszukiwawczych, a nie tylko do systemów dokumentacyjnych i opisów dokumentów. Babik kazał rozumieć definicję JIW w szerszym znaczeniu!.

Języki informacyjno-wyszukiwawcze są to wyspecjalizowane systemy przeznaczone do opisu treści i podstawowych cech formalnych dokumentów.

KOD – może mieć taką samą strukturę jak język. Reguły kodu nie są jawne dla wszystkich tylko, dla pewnej grupy użytkowników. Pewnym rodzajem kodu są piktogramy oraz ideogramy. Przykłady: @, $, § itp. W JIW informacje są zapisywane za pomocą kodu.

SZYFR – jest rodzajem kodu, służy do zapisu treści umownymi znakami Treść przekazywana za pomocą szyfru jest utajone. Informacje są utajone. Do rozbijania szyfry służy szyfrarka

Język i jego elementy J = S + G + S*

  1. Słownik (słownictwo)

  2. Gramatyka

  3. Reguły interpretacji, semantyka transformacyjna

W każdym języku oprócz elementów można jeszcze uwzględnić poziomy.

Siedem poziomów języka naturalnego:

  1. Cecha dystynktywna fonemu.

  2. Fonem

  3. Morfem

  4. Wyraz

  5. Związek wyrazowy

  6. Zdanie

  7. Tekst

Poziomy języka informacyjno-wyszukiwawczego. (Teoretycznie jest ich 4, Babik uważa jednak, że tak naprawdę jest ich 5).

  1. Elementarny znak graficzny [EZG] (litery, cyfry, znaki semigraficzne) – elementarne znaki graficzne są pustymi semantycznie elementami języka.

  2. Elementarna jednostka leksykalna [EJL] (deskryptory, słowa kluczowe, symbole, tematy)

  3. Zdanie

  4. Tekst JIW (CHWD, IW.)

Z elementarnych znaków graficznych [EZG] tworzy się elementarne jednostki leksykalne [EJL]. W nowszych opracowaniach (zwłaszcza literatura zagraniczna) wyróżnia się 5 poziomów JIW. Drugim poziomem, po EZG, są morfemy, z których tworzy się EJL, a z nich następnie zdania. CHWD i IW to teksty stworzone w językach informacyjno wyszukiwawczych.

CHWD – charakterystyka wyszukiwawcza dokumentu.

IW – instrukcja wyszukiwawcza.

Tekst napisany w JIW może być zawarty np. na karcie katalogowej lub w rekordzie bibliograficznym, ale mogą to być również słowa kluczowe.

Pod języki (subjęzyki, dialekty JIW)

- język indeksowania [indexing language]

- język wyszukiwawczy [retrival language]

DEFINICJA STRUKTURALNA JIW – jest to język sztuczny, który składa się z trzech elementów: słownika, gramatyki i reguł interpretacji, czyli semantyki transformacji, oraz z 5 poziomów [EZG, morfemów, EJL, zdań i tekstu]

JIW – wyspecjalizowały się w realizacji tylko pewnych określonych funkcji, a mianowicie funkcji metainformacyjnej, polegającej na reprezentowaniu treści i formy dokumentów, oraz funkcji wyszukiwawczej, polegającej na wyrażaniu kierowanych do systemu informacyjno-wyszukiwawczego pytań informacyjnych i kształtowaniu procesu wyszukiwania informacji.

Funkcje JIW:

  1. Konstruktywne (istotne)

    • Funkcja metainformacyjna [opisowa]

    • Funkcja wyszukiwawcza [znalezienie informacji, faktów, przedmiotów]

  2. Pochodne (mogą być, ale nie muszą)

    • Organizująca in. porządkująca np. zbiór informacji i/lub faktów

    • Określania zakresów tematycznych zbiorów i systemów informacyjnych i wyszukiwawczych.

FUNKCJA METAINFORMACYJNA – jest specyficzną funkcja opisową wszystkich JIW przeznaczonych dla dokumentacyjnych SIW.

FUNKCJA WYSZUKIWAWCZA – realizacji tej funkcji służą wyrażane w JIW pytania informacyjne.

Pozostałe funkcje mają charakter wtórny. Należą do nich Funkcja organizująca (porządkująca), oraz funkcja określania zakresów tematycznych zbiorów SIW ( podział pola tematycznego i informacyjnego danego systemu na mniejsze jednostki).

Babik wymyślił 5 funkcję JIW [funkcja babikowa in. reklamowa lub marketingowa] funkcja ta może odnosić się np. do słów kluczowych w headach stron internetowych.

08.11.2007 – Systemy leksykalne i słownikowe w systemach informacyjno-wyszukiwawczych.

Słownictwo – zbiór wyrazów używanych w danym języku.

Słownictwo JIW > Słownik

W każdym języku wyróżnia się dwa plany (wymyślił je Ferdynand de Saussure, Szwajcar, Babik uważa, że był on wybitnym językoznawcą)

DWIE PŁASZCZYZNY:

  1. Treści (zbiór cech, które można opisać w danym języku)

  2. Wyrażania (forma, w jakiej treść jest wyrażana np. le chat, cat, kot, ĸошка, itd.)

SYSTEM LEKSYKALNY – jest to struktura językowa zbudowana z wykładników językowych znaczeń (wyrazów, leksemów), które można wyrazić w danym języku za pomocą środków, którymi ten język dysponuje.

TRÓJKĄT DOKUMENTACYJNY

System leksykalny ma swoją wewnętrzną strukturę. Tworzy ją sieć formalnych, strukturalnych i funkcjonalnych zależności występujących między jednostkami w systemie leksykalnym danego języka.

EJL – elementarne jednostki leksykalne mają znaczenie, więc są to znaki w pełni semantyczne.

Każdy język ma dwa rodzaje notacji: paranaturalną i sztuczną.

Paranaturalne – występują w sytuacji, gdy jednostki leksykalne języka są równokształtne z wyrażeniami języka naturalnego. Jest to np. Język Haseł Przedmiotowych lub Słów Kluczowych.

Sztuczne – nie korzysta się ze słownictwa języków naturalnych np. UKD.

Języki klasyfikacyjne (sztuczne) używają słownictwa sztucznego. EJL pojawiające się w zdaniach pełnia określoną funkcję. We wszystkich językach informacyjno-wyszukiwawczych wyróżnia się dwa typy jednostek leksykalnych:

Słownictwo języków sztucznych jest znacznie uboższe w sferze leksykalnej od języka naturalnego. Tylko niektóre wyrażenia występujące w języku naturalnym są potrzebne do odtworzenia formy i treści dokumentu w danym systemie informacyjno wyszukiwawczym.

Systemy słownikowe – struktura zbudowana jest ze znajdujących się w słowniku wykładników językowych znaczeń, jakie można wyrazić w danym języku. Biorąc pod uwagę słownik danego języka, można wyróżnić:

  1. JIW o słownictwie swobodnym (nie da się pokazać, bo istnieje np. w naszej głowie)

  2. JIW o słownictwie kontrolowanym (posiada jawny słownik o charakterze normatywnym, przykładem jest UKD)

  3. JIW o słownictwie częściowo kontrolowanym (posiada słownik o charakterze częściowo jawnym)

TYPY SŁOWNIKÓW

  1. Słowniki wyliczające Elementarne Jednostki Leksykalne.

  2. Słowniki zawierające zdania w danym języku.

  3. Słowniki negatywne –„STOP LISTA” zbiory wyrazów, których nie wolno używać np. słownik wulgaryzmów

Rodzaje uporządkowania EJL:

  1. Losowe, przypadkowe, (ale tak nie powinno być)

  2. Formalne, np. według alfabetu

  3. Semantyczne (według znaczenia, np. czasopisma podzielone na dzienniki, tygodniki, miesięczniki itd.).

  4. Mieszany (np. alfabetyczno-semantycznie)

15.11.2007 – Systemy semantyczne JIW

System semantyczny danego języka jest utożsamiany z polem semantycznym języka.

POLE SEMANTYCZNE – jest to struktura zbudowana ze znaczeń (treści), jakie można wyrazić w danym języku za pomocą środków (relacji), którymi język ten dysponuje. Pole semantyczne ma treść i zakres.

Każda jednostka leksykalna ma TREŚĆ [ in. konotacje, intencje] i ZAKRES [in. denotacja, ekstensja].

SYSTEMY RELACYJNE – między jednostkami leksykalnymi zachodzą relacje, czyli związki pewne, które mogą zachodzić pomiędzy przedmiotami, ludźmi, np. pokrewieństwo. W JIW relacje to związki zachodzące pomiędzy jednostkami leksykalnymi w słowniku i/lub w tekście.

Relacje mogą być:

- pozajęzykowe np.: pokrewieństwo, odległości między planetami [wszystko to, przykłady Babika]

- językowe, znajdujące się w kontekście, w tekście lub słowniku miedzy wyrazami.

Relacje w JIW wyrażają bezpośrednio związki pomiędzy klasami dokumentów, których nazwami są klasy dokumentów. Relacje te odwzorowują związki między terminami.

TERMIN – jest to wyraz, nazwa o ściśle określonym znaczeniu.

W zależności od miejsca występowania wyróżniamy dwa typy relacji:

  1. PARADYGMATYCZNE - słownikowe (występujące w słownikach)

  2. SYNTAGMATYCZNE - tekstowe (występujące w tekście)

RELACJE PARADYGMATYCZNE:

  1. Relacje synonimii wyszukiwanej

  2. Relacje hierarchiczne

    1. Relacje generyczne (określają rodzaj, gatunek)

    2. Relacje mereologiczne

    3. Relacje hierarchii tematycznej

  3. Relacje współrzędności

  4. Relacje kojarzeniowe

RELACJE SYNTAGMATYCZNE: wykładnikami tych relacji są np.:

Typy struktur pola semantycznego (trzy podziały)

  1. W zależności od typów relacji wykorzystywanych do organizacji pola semantycznego.

  1. W zależności od rodzaju generowanych układów struktur leksykalnych.

  1. W zależności od dopuszczalnej liczby wystąpień pojęcia danej jednostki leksykalnej.

Typy struktur pola semantycznego (modele)

  1. Struktura płaska (ahierarchiczna) np. klasyczne języki słów kluczowych [ 0 ]

  2. Struktura monorelacyjno-monohierarchiczna, taksonomie są stosowane w JIW [ 1,1 ]

  3. Struktura monorelacyjno-polihierarchiczna, klasyfikacja pozornie fasetowa np. UKD [ 1, 0 ]

  4. Struktura polirelacyjno-monohierarchiczna, klasyfikacje biblioteczno-bibliograficzne [ 0, 1 ]

  5. Struktura polirelacyjno-polihierarchiczna, struktura fasetowa [ 0, 0 ]

RELACJE KOJARZENIOWE – opierają się na podobieństwie treści. W JIW mają dużą wartość wyszukiwawczą. Są charakterystyczne dla poszczególnych dziedzin. Zwykle mają charakter pozajęzykowy. Wykorzystują schematy – część-całość, przyczyna-skutek.

Przykłady:

  1. Proces – urządzenie do wykonywania czynności (drukować-drukarka)

  2. Produkt – wykonawca (produkt-producent)

22.11.2007 – Systemy gramatyczne JIW

Gramatyka odnosi się do 5 poziomów JIW. Zarówno do elementarnych jednostek leksykalnych jak i tekstu.

SYSTEM GRAMATYCZNY – jest to zbiór zasad dla każdego poziomu, określające struktury języka, które połączenia wyrażeń, przyjmuje się za wyrażenia danego języka.

1. System gramatyczny według E. Ścibora (nie jest jego twórcą, tylko go omówił w na początku l. )

2. System gramatyczny B. Bojar.

Ad. 1 E. Ścibor wymienił 4 rodzaje gramatyki:

Ad. 2 B. Bojar wymieniła 4 rodzaje gramatyki:

Wskaźnik wagi – wykładniki językowe wskazujące na znaczenie danego zagadnienia w ramach danego dokumentu, np. przekreślone zero „Ø”, wskazuje, że warto zwrócić uwagę na dany artykuł lub pozycję.

Wskaźniki więzi – pokazują, które elementy w opisie (słowa kluczowe) są ze sobą połączone, np.: RURY/1MIEDŹ/2 DACH/2 OŁÓW/1

Są to wykładniki językowe łączące elementy wyszukiwawcze, które oddają właściwy sens zdania. Akurat to zdanie mówi, że szukamy czegoś na temat ołowianych rur i miedzianych dachów, a nie odwrotnie

Wskaźniki roli – nie mam pojęcia.

06.12.2007 – Systemy pragmatyczne JIW

Pragmatyka to część semiotyki, która zajmuje się posługiwaniem i stosowaniem JIW. Nazwy dla posługiwania się, JIW to:

  1. Tematowanie (posługiwanie się językiem haseł przedmiotowych)

  2. Klasyfikowanie (posługiwanie się UKD)

  3. Indeksowanie (używanie języków słów kluczowych i języków deskryptorowych)

INDEKSOWANIE – jest to proces/czynność sporządzania charakterystyki słownej treści dokumentu lub pytania informacyjnego i jej przekład na JIW, np. tworzenie haseł przedmiotowych.

ETAPY INDEKSOWANIA:

DOKUMENT TEKSTOWY

CHARAKTERYSTYKA SŁOWNA DOKUMENTU W JĘZYKU NATURALNYM

SŁOWA KLUCZOWE, SYMBOLE KLASYFIKACYJNE, JĘZYK SZTUCZNY, JIW

TEKSTY JIW

CHARAKTERYSTYKI WYSZUKIWAWCZE DOKUMENTÓW, np. karta katalogowa, opis bibliograficzny, opis przedmiotowy.

Parametry indeksowania ( to jest pytanie na egzamin)

  1. Szerokość indeksowania

  2. Szczegółowość indeksowania (in. głębokość)

Szerokość indeksowania – jest to stopień odzwierciedlenia w CHWD lub instrukcji, treści danego dokumentu.

Szczegółowość – jest uzależniona od szczegółowości słownika JIW. Mierzy się ją liczbą jednostek leksykalnych użytych w CHWD, czyli w tekstach JIW.

RODZAJE INDEKSOWANIA

  1. Intelektualne, w starszej literaturze manualne (posługujemy się głową i rozumiem)

    1. Jest to indeksowanie swobodne, opiera się na słowniku nie jawnym – głowie.

    2. Może być to indeksowanie słownikowe, in. normatywne, gdy opieramy się na słowniku jawnym np. na tablicach UKD.

    3. Trzeci rodzaj indeksowania intelektualnego to indeksowanie współrzędne.

  2. Automatyczne (3 metody)

    1. Indeksowanie statystyczne, TEORIA WARTOŚCI INFORMACYJNEJ SŁOWA, twórcą tej teorii jest H. P. Lunh. Do tego rodzaju indeksowania potrzebny jest program, który wybiera słowa względem częstotliwości ich występowania. Efektem jest powstanie krzywej Gansa, która określa wartość informacyjną.

    2. Rachunek prawdopodobieństwa

    3. Metody syntaktyczne (opierają się na teorii języków formalnych w zbiorze znaczników frazowych).

TRYBY INDEKSOWANIA

  1. Indeksowanie uogólniające (zwiększa kompletność, zmniejsza dokładność)

  2. Indeksowanie wyszczególniające (zmniejsza kompletność, zwiększa dokładność)

– Porównywanie i ocena JIW. Wybrane typologie JIW.

Klasyfikacja w nauce to czynność/operacja dokonywana na zbiorze elementów. Jest to przydzielanie poszczególnych elementów do wcześniej przygotowanego schematu klas. Nie powinno być takich elementów, które mogą być przydzielone do kilku klas jednocześnie. Wszystkie elementy powinny być rozdzielone w klasy. (W. Babik przedstawił to na przykładzie worków). Aby dobrze klasyfikować, należy schematowi klasyfikacyjnemu nadać odpowiednie kryteria, według których będziemy dzielić elementy. Jednym z przykładów podziału, jest podział dychotomiczny – na dwie grupy. Może to być np. podział ze względu na płeć.

Typologia – jest to dopasowanie elementu do wcześniej ustalonych typów. Jest to operacja polegająca na porównywaniu z najbardziej odpowiednim typem do danego egzemplarza – elementu. Podziały te są jednak bardzo subiektywne. Typologie tworzymy, gdy różne elementy można dopasować do kilku podzbiorów.

  1. Cel pragmatyczny (użyteczność)

  2. Cel dydaktyczny (uporządkować wiedzę)

  3. Cel teoretyczny (wzbogacenie naukowego dorobku)

Najstarszym JIW jest klasyfikacja biblioteczna np. w bibliotece Asurbanipala

JEAN - CLAUDE GARDIN – opracował jedną z pierwszych poważnych typologii JIW (1966 r. Biuletyn Bibliotek Francuskich) (mamy krytykować Gardina). Jest on twórcą typologii słowników JIW. Typologia ta polega na wielostopniowym dychotomicznym podziale słowników JIW. J. Gardin uznał, że słownik określa sam język.

  1. Słowniki jawne

    1. Słownictwo uporządkowane semantycznie

  1. Słowniki niejawne

Podział języków informacyjno-wyszukiwawczych według J. Gardin’a

  1. Języki deskryptorowe

  2. Języki słownikowe

  3. Języki klasyfikacyjne

E. F. SKOROCHODKO – Klasyfikacja semantyczna JIW.

Kryterium podziału były relacje zachodzące między elementarnymi jednostkami leksykalnymi w JIW. Skorochodko zbudował dwie oddzielne typologie JIW:

  1. Klasyfikacja pragmatyczna (systemowa)

  2. Klasyfikacja syntagmatyczna

A. I. CZERNY – Typologia według kryteriów połączeń.

  1. Prekoordynowane: klasyfikacja biblioteczna, języki haseł przedmiotowych

  2. Postkoordynowane: języki deskryptorowe, języki syntagmatyczne, kody semantyczne

E. ŚCIBOR – Typologia strukturalna JIW, 1981 rok

Kryterium tej typologii to różne elementy określające strukturę JIW. Tak rozległe kryterium sprawiło, że E. Ścibor wyodrębnił aż 1176 różnych typologii JIW. Schemat główny zredukował i ograniczył tylko do 174:).

BIBLIOTEKARZE – zwyczajowa typologia bibliotek

  1. Klasyfikacje biblioteczno-bibliograficzne,

  2. Języki haseł przedmiotowych,

  3. Języki słów kluczowych,

  4. Języki deskryptorowe,

  5. Kody semantyczne.

Schemat opisu JIW Język Słów Kluczowych Języki deskryptorowe Języki Haseł Przedmiotowych
Nazwa typu i/lub podtypów
  • Języki swobodnych słów kluczowych (podtypy)

  • Języki słów kluczowych oparte na słownik jawnym

  • Języki słów kluczowych wykorzystujące słowniki jako rodzaj pomocy leksykalnej

  • Kartoteka Haseł Wzorcowych

  • KABA

  • JHP Biblioteki Narodowej

Charakter słownictwa Słownictwo paranaturalne Słownictwo paranaturalne lub mieszane Słownictwo paranatuarlne
Słownik
  • Słownik Słów Kluczowych

  • Wykaz Słów Kluczowych

  • Indeks Słów Kluczowych

  • Lista Słów Kluczowych

  • Słowa Kluczowe

  • Tezaurus (słownictwo kontrolowane) Istnieją tezaurusy filologiczne lub terminologii translatoryjnej oraz dokumentacyjne.

  • Słownictwo ujęte w kartoteki haseł wzorcowych i kartoteki haseł formalnych (??)

EJL
  • Słowa kluczowe – jest to ujednolicone wyrażenie rzeczownikowe, jedno wyrazowe zaczerpnięte z tytułu, tekstu, dokumentu.

  • Deskryptory

  • Askryptory

  • Kwantyfikatory

  • Hasła Przedmiotowe składające się z tematów i określników

Relacje słownikowe Klasyczny JSK nie odwzorowuje żadnych relacji Wszystkie typy relacji
Gramatyka
  • Zerowa (wg Bojar)

  • Niepozycyjna (wg Ścibora)

  • Częściowo – pozycyjna ( wg gramatyki Ścibora)

  • Zerowa (wg Bojar)

  • Częściowo-pozycyjna (wg Bojar)

  • Pozycyjna (wg Ścibora i Bojar też)

Zastosowanie Systemy zautomatyzowane, specjalistyczne systemy informacyjne Systemy informacyjno – wyszukiwawcze. W katalogach bibliotecznych, dotyczy wszystkich dziedzin wiedzy, jak np. UKD
Metodologia, normalizacja Nie ma prawie zaplecza metodologicznego, ale istnieją instrukcje np. OPI – instrukcja Synaba za pomocą słów swobodnych Polska Norma Tezaurusa, jednojęzyczny, zasady tworzenia, forma, struktura NUKAT ??

20.12.2007 – Języki paranaturalne.

Grupę tych języków wyróżniono ze względu na słownictwo – ich charakter, notację. Do paranaturalnych języków informacyjno-wyszukiwawczych należą m.in.:

Języki słów kluczowych

Języki deskryptorowe

Języki haseł przedmiotowych

Bibliotekarze stosują te języki, na co dzień.

Tezaurus Informacji Naukowej – Ewa Chmielewska-Gorczyca, Ośrodek Informacji Naukowej [OIN] PAN, 1992.

03.01.2008 – Tezaurusy. Języki klasyfikacyjne.

– M. Nahotko – Języki deskryptorowe. Tezaurusy

W latach i nastąpił boom języków deskryptorowych, używanych szczególnie w bibliograficznych bazach danych. Słownikiem tego języka jest tezaurus!! Ale jak to określił dr Nahotko granica między słownikiem słów kluczowych, a tezaurusem jest bardzo płynna i nigdy tak naprawdę nie wiadomo, czy to jest tak rozbudowany Słownik Słów Kluczowych, czy tak ubogi Tezaurus . Tezaurusy SA zwykle wąsko-dziedzinowe.

Słownik ten operuje dwoma rodzajami terminów: deskryptorami i askryptorami.

DESKRYPTORY – słowo, określające obiekt; jest to najlepsze słowo użynane do określenia danego obiektu, jednemu deskryptorowi można przyporządkować kilka askryptorów.

ASKRYPTORY – termin zakazany, askryptorem może być w stosunku do deskryptora jego synonim lub słowo, termin rzadko używany lub archaiczny.

Tezaurus – słownik języka deskryptorowego, jednostkami leksykalnymi są tam deskryptory askryptory i modyfikatory. Tezaurus jest stworzony do indeksowania dokumentu w określonych sytuacjach w wąskich dziedzinach.

Między deskryptorami i askryptorami zachodzi relacja synonimii i równoleżności. Każdy deskryptor występuje w kontekście innych deskryptorów i askryptorów. Deskryptor występuje, więc w tezaurusie kilka razy. Istnieją deskryptory szersze, węższe i kojarzeniowe. Wszystkie deskryptory i askryptory tworzą razem artykuły deskryptorowe. Udoskonaleniem tezaurusów są tzw. „więzi” wskaźniki więzi to np. cyfry i szersze numery dotyczące tych samych tematów. Dzięki wskaźnikom łatwiej jest opisać i w szczególności powiązać dokumenty. Wskaźniki można podzielić na”

- wskaźniki roli tzw. modyfikatory

- wskaźniki wagowe.

1. Wielojęzyczny tezaurus „Eudised mehrsprachiger thesaurus zur Informationsersehliesung in…”

2. Thesaurus of Information Science Terminology. Claire K. Schultz

compressed Term Index. Alan Gilarist, M. Keen

4. Тезаурус, научно-технических терминов, Moskwa

5. PATIN, Eugeniusz Ścibor, Joanna Tomasik-Beck

6. Thesaurus of ERIC Descriptors

7. Thesaurus of psychological index term

8. Tezuarus naukoznawstwa,metalurgii i żelaza – procesy I aparatura chemiczna. PAN

Języki klasyfikacyjne są najstarszym typem języków informacyjno-wyszukiwawczych.

Najbardziej znane ośrodki, które badają JIW znajdują się w Wielkiej Brytanii (Londyn – CRG – Classyfication Research Group) oraz w Indiach (DRTC – Documentation and Research Trening Center).

Elementy opisu języka:

1. Nazwa typu JIW (systemy klasyfikacyjne, klasyfikacje, katalogi biblioteczno-bibliograficzne)

2. Słownictwo (naturalne, sztuczne)

3. Nazwa słownika (np. tablice UKD)

4. Nazwa jednostek leksykalnych (np. symbole)

5. Typy relacji

6. Stosowana gramatyka

7. Zastosowanie

8. Historia/geneza

9. Zaplecze metodologiczne (np. pragmatyka UKD)

Przegląd wybranych JIW – E. Ścibor.

Klasyfikacje tematyczne BSO, PKT przeznaczone do porządkowania dokumentów na półkach w bibliografiach itd., służą też do zarządzania systemami informacyjnymi, a także do określania zbiorów tematycznych, zbiorów systemów informacyjnych, tezaurusów itd. Określane zwykle w języku francuskim – nie pamiętam jak, rosyjskim – rubrykatory, polskim – klasy tematyczne.

Są to przeważnie mono hierarchiczne systemy z wyodrębnionymi poddziałami pomocniczymi. Są niegłębokie, ograniczające się do 2-4 stopni poddziału. Klasyfikacje odsyłają do bloków informacji, a nie do konkretnych dokumentów. Klasy tematyczne stanowią uzupełnienie do języków deskryptorowych. [PASCAL, MISION, POLSKA KLASYFIKACJA TEMATYCZNE – PKT, BSO – międzynarodowy schemat stworzony przez FID i UNESCO]

„CLEARINGHOUSE for thesauri and classyfication schemes” – spisy wszystkich opublikowanych tezaurusów, wydawane w Waszyngtonie i w Warszawie .

10.01.2008 – Nowe typy JIW.

  1. Języki kodów semantycznych

  2. Języki syntagmatyczne

  3. Języki opisu bibliograficznego

  4. Język meta danych

JĘZYKI KODÓW SEMANTYCZNYCH (JKS) – są to języki sztuczne, słowniki tych języków zawierają stosunkowo nieliczne jednostki leksykalne, tylko najgłówniejsze pojęcia tzw. prymitywy. Prymitywy to jednostki leksykalne, które nie mają znaczeń. Kody semantyczne były budowane na podstawie/zasadzie tzw. Języka semantycznego.

Język semantyczny (cechy):

Jest pozbawiony synonimii i homonimii,

Opiera się na z góry określonym zbiorze wyrażeń, reprezentujących elementarne znaczenia (prymitywy semantyczne lub mnożniki semantyczne).

Do najbardziej znanych JIW tego typy zalicza się m.in.:

  1. Język ASM – WRU, lub po prostu nazywany Kodem Semantycznym, 1954-59 – USA. Za twórców języka uważany jest A. Kent, J. W. Perry (i M. Barry, ale to była kobieta, więc się ją pomija ). Zbudowano go na potrzeby systemu informacyjnego z dziedziny metalurgii w ośrodku badań z zakresu dokumentacji i przekazywania informacji WRU – Western Reserve University – Cleveland. ASM – American Society for Metals, czyli Amerykańskie Stowarzyszenie Metalurgów. Słownik tego języka składał się z kilkunastu kartek i zawierał tylko 214 jednostek leksykalnych, tzw. mnożników semantycznych ułożonych alfabetycznie. Sposób tworzenia jednostek leksykalnych: wykreślano ze słów wszystkie samogłoski, a następnie (zaczynając od końca wyrazu) wykreślano również spółgłoski, aby uzyskać postać „czteroznakową”. Puste miejsca zapełniano samogłoskami określającymi relacje (a, e, i). Relacje „i” – typu część-całość; relacje „a” zawiera się w jakiejś klasie; relacje „e” oznacza być produktem.

    1. ANIMAL N_ML NAML np. psy, NEML np. szynka

    2. FISH F_SH FASH np. sardynki, FESH np filety rybne ;)

    3. MILITARY M_LT

    4. SCIENCE S_CN

W języku tym istnieją też wskaźniki roli in. relacje syntagmatyczne – tekstowe, np.:

  1. Język RX Kodów, 1960-64 – ZSRR. Stworzony przez E. F. Skorohodko; L. E. Pszeniczną; T. N. Griznuchina. Język stworzony na potrzeby radiotechniki i komunikacji w Instytucie Cybernetyki Radzieckiej Akademii Nauk w Kijowie. Schemat tworzenia wyrażeń w tym języku: X1 = R1 X2 R2 X3. X – to jednostki leksykalne, R – relacje.

  2. Uniwersalny Kod Semantyczny W. W. Martynowa – ZSRR, 1977

  3. Olgierd Adrian Wojtasiewicz, Bożenna Bojar, Barbara Sosińska-Kalata – POLSKA.

  4. Waclav Smetaček – CZECHOSŁOWACJA.

JĘZYKI SYNTAGMATYCZNE

Język SYNTOL ( Syntagmatic Organization Language – R. C. Cross, J. C. Gadrin, F. Levy)

Podstawową zasadą syntolu jest wyodrębnienie syntagm, czyli elementarnych jednostek leksykalnych składni. Język został stworzony w latach 1960-62 dla potrzeb systemu Euratom. System działał w Narodowym Ośrodku Badań Naukowych we Francji (CNRS – Paryż).

Niektóre JIW stosowane są przede wszystkim do opisu formalnego. (Elementy formalne to elementy opisu bibliograficznego). Typy JIW nakierowane na elementy formalne:

  1. Języki opisu bibliograficznego

  2. Języki cytowań bibliograficznych

  3. Języki meta danych.

Ad. 2

Twórcą języka cytowań bibliograficznych jest Eugene Garfield (USA). Cechy języka:

- słownictwo mieszane

- słownik: nazw, tytułów, nazw miejscowości itd.

- jednostki leksykalne to elementy opisu bibliograficznego

- wszystkie typy relacji

- stosowanie dwu rodzajów gramatyki: „?” i częściowo-pozycyjnej

- zastosowanie: w bibliografiach, indeksach itp.

17.01.2008 – Języki systemów faktograficznych.

Preserved Context Index System – PRECIS, jest to system indeksu przedmiotowego z zachowaniem kontekstu. Opracował go Derek Austin z Wielkiej Brytanii. Powstanie tego języka wiąże się z automatyzacją angielskiej bibliografii narodowej w latach . Kolejność słów w tym języku nazywa się „sznurkiem wejściowym terminów”. Gramatyka opiera się na wskaźnikach roli.

Języki systemów faktograficznych to JIW stosowane w systemach dokumentacyjnych, ekspertowych, multimedialnych, hipertekstowych, faktograficznych. Języki te opisują obiekty, przedmioty, fakty, osoby. Odsyłają one bezpośrednio identyfikują obiekt (dokument) i informują o nim.

Systemy faktograficzne dzielą się na: dedukcyjne i nie dedukcyjne. Dedukcyjne oparte są na wnioskowaniu, nie dedukcyjne natomiast, głównie na porównywaniu.

Informacja faktograficzna – występuje w systemie faktograficznym, jest to informacja jednostkowa o obiekcie, osobie, fakcie itd. Jest to „coś” stwierdzającego istnienie cechy danego obiektu, przedmiotu, faktu, osoby. Informacja faktograficzna może występować w postaci: liczbowej, opisowej i graficznej (np. wykres, rysunek, fotografia, animacja).

Są różne stosowane nazwy na określenie typów tego języka:

  1. Obiekt - atrybut

  2. Obiekt - cecha

  3. Przedmiot - własność

  4. Typ prostych systemów faktograficznych

PRZYKŁAD: CZŁOWIEK [OBIEKT] WIEK, WZROST, WAGA, KOLOR OCZU [CECHY]

Każda z cech ma swoją wartość.

Trzy elementy opisu to „triada”. Słownik języków systemów faktograficznych ma budowę modułową. Składa się z trzech grup:

  1. Nomenklatury obiektów

  2. Nomenklatury cech

  3. Nomenklatury wartości.

Język systemów faktograficznych stosuje gramatykę pozycyjną i częściowo-pozycyjną.

Typy języków w prostych systemach faktograficznych:

Ankietowe – opierają się na formularzach

Języki służące do tworzenia tablic pasmetrycznych ?

Języki „a priori” – mają usystematyzowaną nomenklaturę i nazewnictwo

Języki „apos priori” – zależnie od przyjętej metody budowy słownika

27.02.2008 – Metodyka projektowania JIW

Istnieją dwa podejścia w projektowaniu:

  1. Podejście systemowe (język jako system – 3 elementy języka połączone ze sobą relacjami, hierarchiczne powiązania).

  2. Podejście sieciowe (język jako sieć – Język traktuje się, jako sieć, gdzie wszystkie elementy są równe, nie ma relacji hierarchicznych, nie ma nadrzędności i podrzędności, poszczególne elementy połączone są różnego typu relacjami, głównie relacjami kojarzeniowymi).

Projektowanie języka jest zwykle elementem projektowania systemu informacyjno-wyszukiwawczego Słownikami takich systemów są tzw. SŁOWNIKI PRAKTYCZNE. Języki, które projektuje się dla konkretnej dziedziny, a są wykorzystywane przez różne systemy informacyjne, mają SŁOWNIKI TEORETYCZNE. [np. Słownik słów kluczowych slawistyki, należy do słowników praktycznych bo został zaprojektowany dla systemu slawistycznego].

Inne dwa podejścia/ujęcia projektowania JIW:

  1. Diagnostyczne (mamy język, badamy go, testujemy, wyszukujemy błędy, modyfikujemy, udoskonalamy usuwając błędy).

  2. Prognostyczne (budujemy nowy język)

DWIE METODOLOGIE STOSOWANE PRZY BUDOWANIU JIW:

  1. Miękka (soft methodology – P.B. Checkland)

  2. Twarda (hard methodology – jasno określone reguły postępowania, nie są dopuszczalne odstępstwa od normy).

STRUKTURA PROCESU PROJEKTOWANIA

  1. Projektowanie zakresu i pola semantycznego JIW.

  2. Metody wyboru terminów [są to metody gromadzenia słownictwa]

  1. Opracowanie, strukturalizacja, systematyzacja słownictwa.

  1. Prezentacja słownictwa w postaci słownikowej.

  1. Projektowanie gramatyki języka.

12.03.2008 – Ośrodki badawcze zajmujące się JIW w Polsce i na świecie.

OSOBY:

Olgierd Ungurian – autor pierwszego w Polsce podręcznika z zakresu JIW, zajmował się teorią klasyfikacji Randganathana. Studiował w Moskwie nauki techniczne. W Polsce zajmował się głównie UKD. Napisał szereg opracowań tej klasyfikacji.

Olgierd Adrian Wojtasiewicz – zajmował się głównie problematyka kodów semantycznych.

Bożenna Bojar – językoznawca,

Jadwiga Sadowska – zajmowała się głównie językami haseł przedmiotowych

Ewa Chmielewska-Gorczyca – autorka Tezaurusa Informacji Naukowej, startowała w konkursie miss Świata

INSTYTUCJE ZWIĄZANE Z UCZELNIAMI< INSTYTUTY NAUKOWO-BADAWCZE:

INTE – Instytut Informacji Technicznej i Ekonomicznej. W ośrodku tym funkcjonowała jednostka JIW, prowadzona przez Eugeniusza Ścibora. W licznych pracach pomagała mu natomiast Lucyna Anna Bielicka.

UW – Instytut Informacji Naukowej i Studiów Bibliologicznych, z ośrodkiem tym związana jest Jadwiga Woźniak-Kasperek.

Warszawska Szkoła JIW – szkoła ta w swym czasie spłodziła wielu doktorów m.in. Wiesława B.

ORGANIZACJE I STOWARZYSZENIA PROFESJONALNE:

Polskie Towarzystwo Informacji Naukowej i Technicznej – Katowice

ISKO, a może ISCO? Nie jestem pewna.

ŚWIAT – Osoby:

Jean-Claude Gardin (Francja) – twórca typologii słowników JIW, podział wielostopniowy dychotomiczny 1966 rok.

Karen Spark Jones (Wielka Brytania) – zajmowała się badaniem lingwistycznych podstaw JIW, specjalizowała się w językach słów kluczowych oraz automatycznych indeksach.

Arkadij Iwanowicz Czerny – twórca kolejnej klasyfikacji podobnie jak Gardin

INSTYTUCJE:

Western Reserve University – Cleveland (USA) – wiąże się ze stworzeniem kodu semantycznego – ASM WRU przez Kent’a I Perry’ego

Ośrodek Badan Naukowych we Francji (Paryż) CNRS – stworzenie języka syntagmatycznego SYNTOL przez Jean-Claude Gardin’a.

Amerykańskie Stowarzyszenie Informacji Naukowej i Technologii – ASIST, funkcjonujące od 1927 roku. Najbardziej znanymi dyrektorami tej placówki byli m.in.: James W. Perry, Harold Borko, Michael Buckland, Eugene Garfield, Nicolas Belkin.

OCLC

DRTC (Documentation Research Training Center) – Indie, Bangalore, Centrum Badań Dokumentacyjnych i Szkoleń. W instytucie tym, badacze zajmują się głównie dwu kropkową klasyfikacją Ranganathana. Obecnie opracowano już 7 wersji aktualizacji. Organizacja powstała w 1962 roku.

CRG (Classification Research Group) – Londyn, 1952 rok. Ośrodek skupia specjalistów zakresu JIW. Stworzono tu wiele klasyfikacji fasetowych w tym również klasyfikację Informacji Naukowej. Z ośrodkiem tym wiąże się także Teoria poziomów zintegrowanych.

Rodzaj gramatyki Typologia wg E. Ścibora Typologia B. Bojar (nowa typologia)
zerowa - reguła o niedołączaniu
- możliwe tylko zdania jednoelementowe
- np. klasyfikacje monohierarchiczne wykorzystujące porządkowanie książek na półkach
- brak wykładników relacji syntagmatycznych
- kolejność wyrażeń jest dowolna
- np. klasyczny język słów kluczowych
pozycyjna - miejsce każdej jednostki w zdaniu jest ściśle ustalone
- np. języki haseł przedmiotowych
- relacje syntagmatyczne są wyrażane przez pozycję wyrażeń elementarnych w wyrażeniu złożonym
- np. języki deskryptorowe, języki haseł przedmiotowych
Częściowo pozycyjna - miejsce niektórych jednostek leksykalnych w zdaniu jest określona ściśle a innych dowolna
- stosowana w UKD
- funkcje wykładników relacji syntagmatycznych pełnią niektóre pozycje wyrażeń elementarnych w wyrażeniu złożonym
- np. wyrażenia deskryptorowe - modyfikatory
niepozycyjna - szyk dowolny
- przeciwieństwo gramatyki pozycyjnej
- dowolna, losowa kolejność występowania jednostek leksykalnych w zdaniu
- relacja współwystępowania, wszystkie jednostki leksykalne mają taki sam status
- relacji syntagmatycznych mają inny charakter niż pozycja wyrażenia elementarnego w wyrażeniu złożonym
- np. język haseł przedmiotowych, wskaźniki w określonej kolejności

Typologia tezaurusów

- tezaurusy jedno-, dwu- i wielojęzykowe (kryterium językowe)

- tezaurusy tradycyjne lub elektroniczne (kryterium formy)

- tezaurusy ogólne i specjalistyczne (kryterium tematu)

- tezaurusy branżowe, dziedzinowe, nadrzędne, makrotezaurusy (kryterium zakresu pola semantycznego)

- tezaurusy alfabetyczne, alfabetyczno-hierarchiczne, fasetowe, graficzne, permutacyjne (kryterium cech formalnych: układ i forma prezentacji słownictwa)

Tezaurusy obcojęzyczne z zakresu INiB:

  1. "Information science thesaurus" C.K. Schulz

  2. "Thesaurus Bureau Marcel Van Dijk”

  3. „Informacionno-poiskovyj tezaurus po informatike"

  4. "Thesaurus of information technology terms"

  5. "The librariens thesaurus"

  6. "Asis thesaurus of information science and librarianship"


Wyszukiwarka

Podobne podstrony:
JIW Abstrakty2
jiw-egzamin, Zagadnienia egzaminacyjne- JIW
jiw
Systemy JIW, INIB, JIW
JIW-Rodzaje, Inib, Jęzuki Informacyjno-Wyszukiwawcze
Abstrakt, INIB, JIW
JIW Słowa kluczowe
Języki informacyjne - Babik, INIB, JIW
JIW (języki informacyjno-wyszukiwawcze) - notatki z wykładów, Bibliotekoznawstwo, Bibliotekoznawstwo
Cechy języka KABA, INIB, JIW
JIW abstrakty2 2012 2013
JIW Abstrakty
Budowa tablic UKD - Gruchała, INIB, JIW
Analiza dokumentacyjna, INIB, JIW
JIW-KABA, Inib, Jęzuki Informacyjno-Wyszukiwawcze
JIW - notatki z ćwiczeń, Informacja naukowa i bibliotekoznawstwo
JIW Abstrakty2

więcej podobnych podstron