11. Jezyki informacyjno - wyszukiwawcze
JĘZYKI INFORMACYJNO-WYSZUKIWAWCZE (JIW)
Termin pojawił się w l. 50/60 ub. Wieku.
Wczśniej JIW utożsamiane z zastosowaniami: katalogami systematycznym, działowym, klasowym i przedmiotowym.
JIW jest tylko narzędziem, który umożliwia funkcjonowanie katalogu rzeczowego lub innego zbioru informacyjnego.
Definicja
JIW to język sztuczny o wyspecjalizowanych funkcjach: odtwarzania treści i formy dokumentów oraz treści zapytań użytkowników oraz wyszukiwania dokumentów w zbiorze informacyjnym w odpowiedzi na zapytanie użytkownika. JIW pełni w specyficzny sposób tylko funkcję przedstawieniową. Wskazuje, odtwarza, opisuje treść i formę dokumentu.
Na system JIW składają się następujące elementy:
Zbiór dokumentów(zbiór informacji, zbiór informacyjno- wyszukiwawczy)
Język informacyjno- wyszukiwawczy
Środki techniczne
Użytkownicy informacji
Pracownicy informacji
Elementy JIW
Podobnie jak każdy język, w tym także naturalny, każdy JIW posiada:
Zasób leksykalny (słownictwo JWI jest zwykle zarejestrowane w odpowiednich słownikach. Słownikami tymi mogą być tablice klasyfikacyjne /np. UKD/, tezaurusy, słowniki tematów i określinków, wykaz słó kluczowych)
Reguły budowy konstrukcji złożonych (gramatykę)
Cechy JIW
Język sztuczny.
*Sztuczny, czyli nie naturalny;
*Powstaje przez czyjeś celowe działąnie, nie samorzutnie;
*Konstrukcja i słownictwo jest z góry zaplanowane;
*JIW też ulegają zmianom;
*JIW uboższy od naturalnego pod względem budowy, leksyki i funkcji.
Język o wyspecjalizowanych funkcjach.
*Funkcje j. naturalnego i JIW
~ Opisywanie rzeczywistości (f. przedstawieniowa, komunikatywna, opisowa);
~ Sygnalizowanie cech psychicznych i fizjologicznych rozmówcy (f. ekspresywna);
~ Oddziaływanie na zachowanie rozmówcy przez tryb rozkazujący, dobór słownictwa (f.
impresywna, imperatywna);
~ Podtrzymywanie kontaktu (f. fatyczna);
~ Zwracanie uwagi na tekst, jego opis (f. poetycka), treść tekstu (f. metainformacyjna);
~ Opisywanie języka jako systemu, jego budowy, funkcji (f. metajęzykowa)
~ JIW pełni głównie funkcję przedstawieniową, częściowo funkcję metainformacyjną.
Charakterystyka wyszukiwawcza dokumentu
Dwie możliwości wyrażania treści dokumentu:
Krótki tekst w j. naturalnym (abstrakt, streszczenie, analiza dokumentacyjna);
Test języka sztucznego - ChWD(charakterystyka wyszukiwawcza dokumentu)
Tworzona na podstawie analizy informacyjno-logicznej
Ustalenie najważniejszych treści dokumentu:
- Główny temat i przedmiot,
- Sposób przedstawienia przedmiotu,
- Przedmioty drugorzędne i poboczne.
RODZAJE JĘZYKÓW INFORMACYJNO WYSZUKIWAWCZYCH
Nie ma danych podających dokłądnie ile takich języków istnieje Sadowska i Turowska w swojej książce z 1990 roku mówią o 4 tysiącach. Niezależnie jednak od ich liczby wszystkie one dadzą się sprowadzić do kilku, kilkunastu grup, charakteryzujących się wspólnymi cechami. Najczęściej brane pod uwagę cechy języków, które są podstawą różnych typologi to:
Sposób uporzadkowania słownika( logiczne lub formalne)
Sposób tworzenia słownika( równolegle z indeksowaniem lub wcześniej)
Sposób budowanie jednostek złożonych ( gramatyka)
Stopień rozwoju relacji paradygmatycznych ( uwzględnienie zależności podrzędności , nadrzędności, równoznaczności, kojarzeniowe lub brak takich zależności)
Przykładowe typy JIW
Klasyfikacje biblioteczno-bibliograficzne
Języki haseł przedmiotowych
Języki słów kluczowych
Języki deskryptorowe
Kody semantyczne
Inne języki informacyjne z rozbudowanymi środkami wyrażania relacji syntegmatycznych (relacje między znakami w określonej, konkretnej wypowiedzi)
Język informacyjno - wyszukiwawczy - celowo przez kogoś zbudowany, specjalizuje się w opracowaniu cech treściowych i formalnych dokumentów, oraz umożliwianie udostępniania. Zasób leksykalny języka nazywany jest gramatyką, a zasady budowy gramatyką. Język sztuczny nie powstaje samorządnie w toku używania go, a jest stworzony przez kogoś w konkretnym celu, a jego słownictwo i konstrukcje są wcześniej zaprojektowane. Język o wyspecjalizowanych funkcjach: język ten pełni tylko pewne funkcje.
1. Odtwarza treść i formę dokumentu i umożliwia znalezienie w zbiorze informacyjnym.
2. Służy także do formułowania instrukcji wyszukiwawczej dokumentu.
Instrukcja wyszukiwawcza - zapytanie użytkownika wyrażona w języku naturalnym. Charakterystyka - treść i forma dokumentu zapisana w pewien charakterystyczny sposób..
J i-w - charakterystyka i położenie dokumentu w zbiorze - instrukcja wyszukiwawcza powinna być dostosowana do charakterystyki wyszukiwawczej. J i-w - jest systemem znakowym. Zbudowany jest z poziomów języka odpowiadające ze złożoności pewnych komunikatów. Poziomy są:
- poziom elementarny znaków graficznych alfabet - baza notacyjna,
reguły łączenia to reguły notacyjne
cały system formy wyrażania tych znaków to notacja - system kształtowania;
słownictwo (wyrażenia leksykalne)
wyrażenia literowe,
cyfrowe,
cyfrowo-literowe które uznaje się za jednostki znaczące i odpowiadają one wyrazom z języka naturalnego;
poziom zdania: zadania to wyrażenia lub symbole pozostające wobec siebie w jakiejś zależności składniowej np. symbol główny i symbol pomocniczy;
poziom tekstu - całość opisowa odnosząca się do treści dokumentu ze zdań buduje się charakterystyki wyszukiwawcze dokumentu i język wyszukiwawczy
Budowa J i-w - słownictwo i gramatyka: Na słownictwo J i-w składa się zbiór znaków sztucznych utworzonych nie maja one postaci wyrażeń języka naturalnego.
Gramatyka J i-w to zbiór reguł tworzenia wyrażeń z jednostek elementarnych i określa jakie są dopuszczane reguły na każdym poziomie elementarnym, jednostka prosta może być symbol cyfrowy lub alfanumeryczny. Jednostka złożona może być grupa wyrazów lub grupa symboli. Wyrazy i symbole musza pozostawać wobec siebie w
jakiejś zależności.
Typy gramatyk w zależności na sposób tworzenia jednostek złożonych
1 gramatyka pozycyjna- określa miejsce jednostek prostych w jednostce złożonej. Zmiana miejsca jednostki powoduje zmianę znaczenia całości
2. gramatyka częściowo pozycyjna -dopuszcza zmianę miejsca jednostek prostych nie powodując
zmiany znaczenia całości
3 gramatyka swobodna -szyk dowolny jednostek prostych -kolejność dowolna-stosowana w jeżyku deskryptorowym
Relacje między elementami języka
1. Paradygmatyczne- relacje uwarunkowane istnieniem logicznych związków między wyrazami. Są to relacje stałe- nadrzędności i podrzędność. relacje te zachodzą miedzy jednostkami, leksykalne są odpowiednio oznakowane.
2. Syntagmatyczne- relacje zachodzące miedzy jednostkami prostymi elementarnymi jednostce złożonej. Wyrażone są odpowiednimi znakami np. .: zależność ogólna :: ustalenie kolejności symboli - następowanie.
Płytkie klasyfikacje specjalnego zastosowania są wykorzystywane do porządkowania istniejącego piśmiennictwa. Większość klasyfikacji ma notację, czyli system znakowania. Służy porządkowaniu klas w schemacie klasyfikacyjnym. W monohierarchicznych to nazwy klas.
Klasyfikacje monohierarchiczne:
inaczej klasyfikacje liniowe wliczające jednoaspektowe, w których wszystkie klasy są ujęte w jedyny schemat hierarchiczny i wywodzą się od jednej klasy obejmującej cały zakres klasyfikacji. Można więc wszystkie klasy tworzące jeden układ hierarchiczny przedstawić w postaci drzewa jednej tablicy lub w porządku liniowym. Przez
klasę rozumie się podstawowy element systemu klasyfikacji reprezentujący ogół przedmiotów pojęć itp. Mających jedna lub kilka cech wspólnych. W strukturze typowej klasyfikacji monohierarchicznej nie powinny istnieć podziały pomocnicze, symbole rozwinięte. Nie powinno stasować się tzw. równoległej rozbudowy symboli ani
tworzyć symboli złożonych przez zestawienie dwu lub więcej symboli głównych i rozwiniętych albo głównych, rozwiniętych. Klasyfikowanie: musimy treść odszukać w tym drzewie, schemacie. Wtedy prawie gotowe. Klasyfikacje monochierarchiczne nie istnieją. Chyba że tablice główne UKD.
Klasyfikacje Polihierarchiczne:
fasetowe, wieloaspektowe to klasyfikacje w których klasy są uporządkowane na podstawie wspólnych charakterystyk według kategorii i faset lub tylko wg. faset w obrębie fasety klasy mogą być uporządkowane hierarhicznie. Faseta to inaczej podkategoria w klasyfikacjach fasetowych grupa klas odpowiadająca jakiejś wspólnej charakterystyce oznaczających np. rodzaj czynności rodzaj materiału. Fasety pomagają wielopłaszczyznowo określić temat. Fasety mogą być grupowane w kategorii w klasyfikacjach fasetowych elementarne jednostki leksykalne wyrażają podstawowe elementy treści dokumentów. Przeważnie nie ma możliwości rozłożenia ich na jeszcze mniejsze elementy w typowych klasyfikacjach fasetowych wodróżnieniu od klasyfikacji monohierarchicznychm słownik nie może być przedstawiony za pomocą jednego układu klasyfikacyjnego, lub kilku równoległych układów klasyfikacyjnych.
Polihierarchiczność polega na tym, że całą wiedzę dzieli więcej niż jeden raz. Oprócz klas głównych wprowadza drugi typ podziału - na kategorie. Każdą dziedzinę nauki można rozpatrywać w aspekcie 5 kategorii:
Indywiduum - przedmioty mające cechy indywidualne.
Materia - wartości i właściwości
Energia - działanie, metoda, rozwój
Przestrzeń i czas
Cechą charakterystyczną jest to, że nie ma tu gotowych symboli, są tworzone w trakcie klasyfikowania.
Zalety: wieloaspektowość
Wady: trudne klasyfikowanie
Klasyfikacja Ranganatana (Ramamrita Ranganafhan) (1892-1972) należy do najwybitniejszych teoretyków klasyfikacji. Był twórca Klasyfikacji dwukropkowej, będącej pierwszą uniwersalna klasyfikacją wieloaspektową, fasetową. Jego metodyka klasyfikacji, budowa sygnatury rzeczowej za pomocą dwukropka i znakowanie ósemkowe odegrały inspirującą rolę w rozwoju myśli klasyfikacyjnej. Pozostawił duża spuściznę teoretyczną. Jego Klasyfikacja fasetowa -
Klasyfikacja Dwukropkowa opracowana w 1933 roku jest zbudowana jakby w dwóch wymiarach : wg określonej klasyfikacji dziedzin piśmiennictwa, a jednocześnie wg przedmiotów przejawiających się w kategoriach ogólnych, opowiadającym głównym aspektom, pod którym można rozpracowywać dziedziny wiedzy. Wprowadził pięć podstawowych kategorii pojęć: indywiduum, materia, energia, przestrzeń i czas. Kategoriom ogólnym odpowiadają w poszczególnych tablicach dla zagadnień szczegółowych kategorie specjalne, czyli fasety. Dla każdej fasety tworzona jest odpowiednia tablica, w której wymienione są pojęcia ułożone według wybranego porządku, np. ewolucyjnego, chronologicznego hierarchicznego, przestrzennego. Owe pojęcia w fasecie nazywane są izolatami i oznaczone są kodem literowym, cyfrowym lub alfanumerycznym. Struktura klasyfikacji Ranganathana jest bardzo złożona, np. wprowadza ona nie tylko poddziały wspólne: przestrzeni, języka, czasu ale liczne relacje występujące na kilku poziomach, bardzo obszerna bazę notacji. Ranganathan ustala dla budowy klasyfikacji, a szczególnie dla klasyfikacji fasetowej, reguły tzw. kanony, które podaje w trzech grupach: kanony planu treści, kanony planu werbalnego i kanony planu notacji. Klasyfikacja Ranganathana jest klasyfikacją polihierarchiczną dzięki swej budowie dzielące wszystkie byty uniwersum dwukrotnie: na klasy główne - zgodnie z podstawową klasyfikacją odpowiadającą hierarhicznej klasyfikacji nauk - i przejawy kategorii podstawowych w głównych klasach w formie faset i izolat wg klasyfikacji głębokiej - szczegółowej, w której istnieją wielostopniowe hierarchiczne drzewa klasyfikacyjnem grupujące izolaty w ramach każdej fasety. Klasyfikacje fasetowe są stosowane w systemach specjalnych, dla wielu dziedzin, w których nie wykorzystuje się kategorii ogólnych. Szczególnie duże zasługi w zakresie popularyzacji klasyfikacji fasetowych ma Classification Research Group - brytyjski zespół do badań klasyfikacji, który opracował wiele systemów klasyfikacji fasetowych, a także posiada dorobek w zakresie badań teorii klasyfikacji.