Zagadnienia egzaminacyjne - JIW.
Definicje:
język informacyjno- wyszukiwawczy- język sztuczny, którego wyspecjalizowaną funkcja jest funkcja metainformacyjna, polegająca na odwzorowaniu cech treści i/ lub cech formalnych dokumentów przez tworzenie ich reprezentacji zwanej charakterystyką wyszukiwawczą dokumentu oraz funkcja wyszukiwawcza, polegająca na wyrażaniu zapytań informacyjnych i umożliwianiu odnalezienie w zbiorze informacyjnym tych informacji, które spełniają warunki wyrażone w treści zapytania.
desygnat-1. obiekt rzeczywistości pozajęzykowej, do której odsyła znak na podstawie reguł semantycznych; desygnatami wyrażeń języka informacyjnego mogą być nie tylko dokumenty mające własności wskazane za pomocą danych wrażeń lecz również same te własności.
2. element rzeczywistości, któremu według zasad semantyki języka możemy przyporządkować dane wyrażenie, np. desygnatem nazwy „człowiek” będzie Jan Kowalski, zbiór desygnatów tworzy denotację.
desygnatami bezpośrednimi wyrażeń języka informacyjnego są dokumenty , np. jeżeli deskryptorem jest „samolot” to desygnatem bezpośrednim będą wszystkie dokumenty opisujące samoloty.
desygnatami pośrednimi wyrażeń języka informacyjnego są obiekty pozadokumentacyjne (opisane w dokumentach), np. jeżeli deskryptorem będzie samolot to desygnatami bezpośrednimi będą wszystkie rzeczywiste samoloty.
denotacja (ekstensja)- zakres czyli zbiór elementów rzeczywistości, którym zgodnie z regułami semantyki języka można podporządkować dane wyrażenia. Najczęściej przyjmuje się, że denotacją nazwy jednostkowej jest indywidualny przedmiot określany ta nazwą (desygnat), denotacją nazwy ogólnej jest zbiór jej wszystkich desygnatów, denotacja predykatu jest klasa przedmiotów, o których można ten predykat zgodnie z prawdą orzec. W logice uważa się ,że denotacją zdania jest jego wartość logiczna. Termin denotacja wprowadzony został w opozycji do terminu konotacja. W opisie języków informacyjno- wyszukiwawczych rozróżnić można denotacje bezpośrednią i denotację pośrednią ich wyrażeń, np. zbiór wszystkich ludzi jacy żyją będzie tworzył denotację nazwy „ człowiek” czyli zakres nazwy.
denotacją bezpośrednią jest zbiór desygnatów bezpośrednich danego wyrażenia
denotacją pośrednią jest zbiór desygnatów pośrednich danego wyrażenia.
konotacja (intensja)- 1. treść czyli zespół cech elementów rzeczywistości, na podstawie których można przyporządkować mu zgodnie z regułami semantyki danego języka dane wyrażenie tego języka ( wykładnik językowy). Są to tzw. cechy konstytutywne i charakterystyczne. 2. otwieranie przez pewne klasy wyrażeń miejsc w tekście dla innych klas wyrażeń, w tym sensie, ze wystąpienie elementu klasy pierwszej pociąga za sobą wystąpienie elementu klasy drugiej. 3. skojarzenia, jakie budzi w odbiorcy komunikatu( lub nadawcy komunikatu) dane wyrażenie, np. nazwa „człowiek” konotuje czyli współoznacza takie cechy jak żywotność zwierzęcą, cielesność, rozumność.
konotację bezpośrednią, tworzy zespół cech konstytutywnych i charakterystycznych ich desygnatów bezpośrednich.
konotację pośrednią tworzy zespół cech konstytutywnych i charakterystycznych ich desygnatów pośrednich.
pole semantyczne (pole znaczeniowe)- zbiór wyrażeń pozostających względem siebie w określonych relacjach semantycznych. W każdym języku naturalnym wyróżnić można wiele takich pól, np. nazwy pokrewieństw, nazwy zwierząt, roślin. Zbiór wszystkich takich pól tworzy pole semantyczne języka. W językach informacyjno- wyszukiwawczych pola semantyczne bywają nazywane kategoriami lub fasetami.
zapytanie informacyjne (pytanie informacyjne)- zapytanie skierowane przez użytkownika do systemu informacyjno- wyszukiwawczego; sformułowane w języku naturalnym.
charakterystyka wyszukiwawcza dokumentu- tekst sformułowany w języku informacyjno- wyszukiwawczym odtwarzający treść i/ lub formę dokumentu.
indeksowanie- tworzenie charakterystyki wyszukiwawczej dokumentu lub instrukcji wyszukiwawczej.
indeksowanie współrzędne- indeksowanie polegające na tym, że wyrażenia tworzące charakterystykę wyszukiwawczą dokumentu lub instrukcje wyszukiwawczą są wobec siebie równorzędne; mogą występować w dowolnej kolejności.
instrukcja wyszukiwawcza- tekst wyrażony w języku informacyjno- wyszukiwawczym odtwarzający treść zapytania informacyjnego.
gramatyka ( składnia, syntaksa, syntaktyka)- zbiór reguł określających dla każdego poziomu struktury języka, jakie połączenia wyrażeń elementarnych przyjmuje się w tym języku (uważa się) za zdania.
jednostka leksykalna- wyrażenie należące do słownictwa jakiegoś języka informacyjno- wyszukiwawczego (symbol w językach typu klasyfikacji, deskryptor w językach deskryptorowych, temat, określnik w języku haseł przedmiotowych, słowo kluczowe w języku słów kluczowych).
słownik- zbiór wyrażeń ( symboli, słów) danego języka, najczęściej uporządkowany w postaci tablic lub innego wykazu; słownictwo.
słownik haseł przedmiotowych- alfabetycznie uporządkowany zbiór haseł przedmiotowych (prostych i rozwiniętych).
słownik tematów i określników- alfabetycznie uporządkowane zbiory tematów i określników, podające informacje o zachodzących między nimi relacjach; nadrzędności, podrzędności, równoznaczności.
słownik dodatni- słownik zawierający wyrażenia języka naturalnego mogące pełnic funkcje wyrażeń języka informacyjno- wyszukiwawczego.
słownik ujemny (stop lista)- słownik zawierający wyrażenia języka naturalnego nie mogące pełnić funkcji wyrażeń języka informacyjno- wyszukiwawczego.
leksykalizacja- proces zanikania pierwotnego związku między budową słowotwórczą wyrazu a jego znaczeniem; w wyniku l. wyraz funkcjonuje jako niezależna od swej etymologii jednostka semantyczna (złodziej - "ten, co czyni zło", wskutek l. znaczy "ten, co kradnie"; słonina od "słony" - niegdyś: solony tłuszcz wieprzowy - to przykłady l. ze zmian semantycznych; grzeczny - pochodzący od wyrażenia "k rzeczy" - do rzeczy, stosowny - to przykład l. wynikłej ze zmian fonetycznych); l. prowadzi też do powstawania idiomów. Przykład ze Ścibora: ciężka woda, wolne miasto (znaczą coś innego niż by sugerowała nazwa).
trójkąt semantyczny- Przedstawiony przez C.K. Ogdena i I.A.Richardsa w pracy „The Meaning of Meaning” (1923) schemat odwzorowujący znaczenie znaku semantycznego, na który składa się potrójna relacja między 1) symbolem a myślą, 2) myślą a rzeczą, 3) myślą a rzeczą, przy czym każdy z 3 składników pośredniczy między dwoma pozostałymi, z tym, że związek między symbolem a rzeczą nie jest bezpośredni.
myśl
/ \
symbol---------rzecz
2. Struktury języka naturalnego- poziomy.
Na podst. wykładu i E. Ścibora: „Wybrane zagadnienia teorii języków informacyjnych” (wg klasyfikacji B. Sosińskiej - Kalaty)
Poziomy |
Nazwa znaku |
Nazwa znaku tworzonego |
Funkcja znaczeniowa |
Funkcja informacyjna |
Reguły gramatyczne |
I |
Cecha dystynktywna fonemu (odróżnianie od siebie głosek) |
Fonem |
Nie ma |
Nie ma |
Reguły budowy fonemu |
II |
Fonem (najmniejsza cząstka języka semantycznie pusta jak litera, głoska) |
Morfem |
Ma |
Nie ma |
Reguły budowy morfemu |
III |
Morfem (najmniejsza cząstka języka semantycznie pełna jak przyrostek) |
Wyraz |
Ma |
Nie ma |
Reguły słowotwórcze |
IV |
Wyraz |
Związek wyrazowy |
Ma |
Nie ma |
Reguły frazotwórcze |
V |
Związek wyrazowy |
Zdanie |
Ma |
Ma |
Reguły zdaniotwórcze |
VI |
Zdanie |
Tekst |
Ma |
Ma |
Reguły tekstotwórcze |
VII |
Tekst |
- |
Ma |
Ma |
- |
3. Struktura języka sztucznego- poziomy w omawianych typach języków.
W definicji jiw można zauważyć, że język ten ma dwie cechy: język sztuczny, język o wyspecjalizowanych funkcjach.
Język sztuczny, rozpatrywany w opozycji do języka naturalnego, cechuje się tym, że jest tworzony celowo przez kogoś, jego konstrukcja i słownictwo są wcześniej ustalone, zaprojektowane. Nie oznacz to, że język taki nie ulega zmianom. Są one jednak rejestrowane i dołączane do reguł danego języka. Zdarza się, że jęz. sztuczny jest podobny do jęz. naturalnego, np. esperanto. Zwykle jednak jęz. sztuczny jest znacznie uboższy od jęz. naturalnego zarówno pod względem budowy, jak i środków leksykalnych (słownictwa), nie pełni też nawet połowy tych funkcji, które przypisuje się jęz. naturalnemu.
Język o wyspecjalizowanych funkcjach oznacza, że pełni on tylko pewne funkcje, te, które zadecydowały o jego powstaniu: odtwarza treść i formę dokumentów, umożliwia ich odnalezienie w zbiorze informacyjnym, służy do formułowanie tzw. instrukcji wyszukiwawczej.
Jiw pełni w specyficzny sposób tylko funkcję przedstawieniową. Wskazuje, odtwarza, opisuje treść i formę dokumentu.
Odtwarzanie treści i formy dokumentu oraz zapisywanie tego w pewien skrócony i symboliczny sposób, to tworzenie charakterystyki wyszukiwawczej dokumentu.
Jiw pełni także funkcję meteinformacyjną, ponieważ: dokument jest nośnikiem informacji, a jęz. służy do opisywanie tej informacji, to możemy powiedzieć, że jęz. ten informuje o informacji.
Poziomy jiw:
1. Poziom elementarnych znaków graficznych. Są to litery, cyfry, znaki specjalne, np.: +, /, -, :, „, ( ), ., [ ], =
2. Poziom elementarnych jednostek leksykalnych. Są to wyrażenia językowe, symbole cyfrowe lub cyfrowo-literowe, które uznaje się za jednostki znaczące, np. tematy i określniki w języku haseł przedmiotowych, deskryptory w językach deskryptorowych, symbole z tablic klasyfikacji, słowa kluczowe.
3. Poziom zdań. Są to wyrażenia i symbole pozostające wobec siebie w jakiejś zależności składniowej, np. temat i określnik(i), symbol główny i symbol pomocniczy.
4. Poziom tekstu, tj, charakterystyki wyszukiwawczej dokumentu i instrukcji wyszukiwawczej sformułowanej w postaci jednego lub kilku haseł przedmiotowych, kilku, kilkunastu słów kluczowych lub deskryptorów, symbolu prostego, rozwiniętego lub złożonego.
Znaki graficzne występujące na pierwszym poziomie same nic nie znaczą. Pełnią rolę pomocniczą(jako jednostki łączące, wskaźniki gramatyczne), a jednocześnie są podstawą tworzenia jednostek drugiego poziomu, a te z kolei jednostek poziomów następnych.
Poziomy w UKD:
1. Cyfry 0...9, znaki pomocnicze: :, ::, +, /, [ ], „, -, ( ), =, litery alfabetu języka naturalnego A/Z.
2. Symbole główne (z tablic głównych), np.: 663.9 (używki) oraz symbole z tablic pomocniczych, np.: (438) (Polska), (075) (podręcznik). Każdy z tych symboli ma znaczenie, aczkolwiek nie wszystkie mogą występować samodzielnie. Znaczenie symboli jest wyjaśnione za pomocą odpowiedników słownych w tablicach. Odpowiedniki słowne nie należą do słownika danej klasyfikacji, nie stanowią jednostek leksykalnych tego języka, są objaśnieniem symboli w jęz. Naturalnym.
3. Symbole główne oraz symbole rozwinięte i złożone, np.: 663.9(438) Używki w Polsce. Symbole składowe występują w określonej kolejności, każdy z nich ma swoje znaczenie, a znaczenie całości jest suma znaczeń składowych. Jeżeli symbol wyczerpuje opis rzeczowy dok. To pełni rolę charakterystyki wysz., tzn. Może być zaliczony do poziomu następnego.
4. Charakterystyka wyszukiwawcza może składać się z jednego lub kilku symboli prostych lub rozwiniętych zapisanych w sposób pionowy lub poziomy, np.: 661.8:612.017+612.4] (061.3) Sprawozdanie z konferencji na temat wpływu układu nerwowego na odporność oraz zagadnienia fizjologii gruczołów.
Poziomy w Języku Haseł Przedmiotowych:
1. Litery, cyfry, -, ( ).
2. Tematy, tematy z dopowiedzeniami i określniki. Tematy są wyrażeniami samodzielnie składniowo i znaczeniowo, tzn. że są wystarczające aby utworzyć hasło przedmiotowe.
Określniki są to wyrażenia, które nie są samodzielne składniowo, tzn, muszą być dołączone do tematów.
3. Hasło przedmiotowe. Może ono składać się z samego tematu lub tematu z dopowiedzeniem lub tematu z określnikiem(ami).
4. Opis przedmiotowy, tj. charakterystyka wysz. dok., składająca się z jednego lub kilku haseł. Liczba haseł tworzących charakterystykę wysz. Jest uzależniona od samego dok.
Poziomy jiw.
Poziom |
Nazwa znaku |
Nazwa znaku tworzonego |
Funkcje znaczeń |
Funkcje informacyjne |
Reguły gramatyczne |
I |
Elementarny znak graficzny |
Elementarna jednostka leksykalna |
nie ma |
nie ma |
Reguły notacyjne |
II |
Elementarna jednostka leksykalna |
Zdanie |
ma |
nie ma |
Reguły zdaniotwórcze |
III |
Zdanie |
Tekst(spójny) |
ma |
nie ma |
Reguły tekstotwórcze |
IV |
Tekst-charakterystyka wysz. dok. |
- |
ma |
nie ma |
- |
4. Rodzaje słownictwa.
Rodzaje słownictwa: paranaturalne, sztuczne.
Język naturalny słowo odsyła do obiektu rzeczywistego
Język sztuczny słowo odsyła do dokumentu.
Najpopularniejsze typologie języków informacyjno-wyszukiwawczych wyróżniają dwa zasadnicze ich rodzaje. Są to języki informacyjno-wyszukiwawcze o tzw. słownictwie paranaturalnym oraz języki informacyjno-wyszukiwawcze o słownictwie sztucznym.
Przez słownictwo paranaturalne (quasinaturalne) rozumie się zbiór wyrażeń (wyrazów i związków wyrazowych) pewnego języka naturalnego (np. języka polskiego), które wykorzystywane są jako wyrażenia języka informacyjno-wyszukiwawczego wskazujące tematy czy przedmioty treści dokumentów oraz ich cechy formalne. Do najbardziej rozpowszechnionych typów języków o słownictwie paranaturalnym należą język haseł przedmiotowych, język słów kluczowych i język deskryptorowy.
(prościej: słownictwo paranaturalne składa się z wyrażeń, tj. wyrazów i połączeń wyrazowych, zaczerpniętych z danego języka naturalnego np. temat „Informacja operacyjna”, występujący w Słowniku języka haseł przedmiotowych piśmiennictwa wojskowego zaczerpnięto z języka polskiego)
Przez słownictwo sztuczne rozumie się zbiór takich znaków prostych czy złożonych (jednoelementowych i wieloelementowych), które zostały specjalnie utworzone w celu wyrażania określonych znaczeń i które nie maja postaci wyrażeń języka naturalnego. Najczęściej słownictwo sztuczne przyjmuje postać pewnych symboli lub kodów numerycznych, alfabetycznych, alfanumerycznych lub - bardzo rzadko - znaków specjalnych. Najpopularniejszym typem języków informacyjno-wyszukiwawczych o słownictwie sztucznym są tzw. języki klasyfikacyjne, czyli klasyfikacje piśmiennictwa stosowane jako klasyfikacje biblioteczne, klasyfikacje biblioteczno-bibliograficzne i klasyfikacje dokumentacyjne. Do grupy języków o słownictwie sztucznym zwykle zalicza się również języki zwane kodami semantycznymi, które najczęściej także posługują się wyrażeniami w postaci sztucznych kodów.
(prościej: Słownictwo sztuczne składa się z wyrażeń symbolicznych, sztucznych, nazywanych zwykle symbolami. Symbole mogą być cyfrowe, literowe, literowo-cyfrowe, czyli alfanumeryczne, mogą też składać się z liter i/lub cyfr oraz znaków specjalnych, np. interpunkcyjnych. Mają one odmienną postać niż odpowiadające im znaczeniowo wyrażenia języka naturalnego, np. elementarną jednostką leksykalną UKD o znaczeniu „archeologia” jest symbol UKD o postaci 902)
Kluczem otwierającym system jest zawsze język: sztuczny, informacyjno-wyszukiwawczy - w wypadku zbioru dokumentacyjnego, naturalny - w wypadku zbioru informacyjnego.
JĘZYK NATURALNY
język powstały stopniowo i samorzutnie w toku porozumiewania się ludzi.
Funkcje języka naturalnego:
semantyczna = znaczeniowa - każdemu wyrażeniu przypisane jest znaczenie; odsyła do obiektu (desygnatu)
ekspresywna - funkcja komunikatu polegająca na tym, ze nadawca komunikatu może wyrazić informacje o swoim stanie (ton, odpowiedni dobór słów)
metainformacyjna - pozwala w treści komunikatu przekazywać informacje o informacji
klasyfikacyjna - pozwala na klasyfikacje obiektów
ludyczna - możliwość zabawy językiem
metajęzykowa - pozwala odnosić się w treści komunikatu do języka
estetyczna - funkcja komunikatu pozwalająca na zaspokajanie potrzeb estetycznych odbiorcy komunikatu
JĘZYK SZTUCZNY
język stworzony specjalnie, w danym momencie, przez określonego człowieka, bądź określoną grupę ludzi w celu pełnienia funkcji określonych przez twórcę (twórców). Wszelkie zmiany w tym języku mogą być wprowadzane tylko przez właściwe grono kompetentnych osób. Język, którego słownictwo i budowa dostosowane są do pełnienia określonych funkcji.
Funkcje języka sztucznego:
metainformacyjna - odtwarzanie treści dokumentu (czyli cechy informacji zawartej w dokumencie) oraz jego cech formalnych,
wyszukiwawcza (heurystyczna) - umożliwia wyrażanie zapytań informacyjnych w formie instrukcji wyszukiwawczych oraz odnalezienie tych dokumentów, które odpowiadają danemu zapytaniu
JĘZYK INFORMACYJNO-WYSZUKIWAWCZY
1. język informacyjny - j. sztuczny którego wyspecjalizowaną funkcją jest funkcja metainformacyjna polegająca na odwzorowaniu cech informacji i/lub cech nośników informacji, na których są one utrwalone, przez tworzenie ich reprezentacji zwanej charakterystyką wyszukiwawcza dokumentu oraz funkcja wyszukiwawcza polegająca na wyrażaniu zapytań informacyjnych i umożliwianiu odnalezienia w zbiorze wyszukiwawczym tych informacji, które spełniają warunki wyrażone w zapytaniu. Ze względu na różne cechy funkcjonalne i własności strukturalne wyróżnia się wiele typów JIW. W zależności od tego, czy przeznaczone są do opisu informacji dokumentacyjnej, czy informacji faktograficznej, dzieli się je ogólnie na dokumentacyjne JIW i faktograficzne JIW. Pierwsza grupa może być rozbita na 2 podklasy, przy innym kryterium funkcjonalnym - wyspecjalizowane w wyrażaniu cech formalnych dokumentu lub własności jego treści. Języki wyspecjalizowane w pierwszej z tych funkcji, czyli w wyrażaniu własności dokumentu traktowane jako nośnik informacji, to języki opisu bibliograficznego, języki opisu formalnego i języki opisu katalogowego. Języki wyspecjalizowane w funkcji drugiej to języki opisu rzeczowego dokumenty, które w dawniejszej literaturze utożsamiane były z językami informacyjno wyszukiwawczymi w ogóle i obejmowały wszelkie języki przeznaczone do tworzenia opisu dokumentów na potrzeby katalogów rzeczowych. Obecnie zarysowuje się tendencja traktowania takich języków jedynie jako jednego z podtypów szerszej klasy języków informacyjno wyszukiwawczych, do którego najczęściej zalicza się klasyfikacje (wśród nich klasyfikacje monohierarchiczne i klasyfikacje fasetowe), jhp, języki deskryptorowe, języki słów kluczowych, języki typu kodu semantycznego i tzw. języki syntagmatyczne.
Funkcje języka informacyjnego:
metainformacyjna - odtwarza treść dokumentu oraz jego cechy formalne, wyszukiwawcza - umożliwia wyrażenie zapytań informacyjnych w formie instrukcji wyszukiwawczych oraz odnalezienie w zbiorze informacyjnym tych dokumentów, które odpowiadają danemu zapytaniu
2. Specjalistyczny język sztuczny, przeznaczony do opisania podstawowych treści dokumentów i formułowania kwerend; jest językiem ogólnym, który jest interpretowany dopiero w zaprojektowanym systemie; język powinien być kompletny, zupełny, prosty i powinien spełniać oczekiwania użytkownika; ta sama informacja o obiekcie może być różnie zapisana w zależności od przyjętego języka.
Funkcje języka informacyjno-wyszukiwawczego:
A. Funkcja metainformacyjna polega na ograniczaniu funkcji semantycznej języka naturalnego do opisu informacji - np. prezentacji cech treściowych i/lub formalnych dokumentów czy też prezentacji dystynktywnych cech obiektów pozadokumentacyjnych; funkcja podstawowa
B. Funkcja wyszukiwawcza (impresywna, heurystyczna) polega na sterowaniu procesem wyszukiwania informacji poprzez wyrażenia charakteryzujące warunki, jakie powinien spełniać wyszukany podzbiór informacji. O możliwościach realizacji funkcji wyszukiwawczej decyduje w znacznej mierze funkcja organizacyjna; funkcja podstawowa
C. Funkcja organizacyjna określa miejsce wyrażeń syntaktycznie prostych języka w zbiorze informacji systemu poprzez formę tych wyrażeń (plan wyrażenia); funkcja wtórna
D. Funkcja określania zakresu tematycznego zbiorów informacji; funkcja.
5. Rodzaje gramatyki
Gramatyka zerowa - mamy z nią do czynienia wtedy, gdy w danym języku informacyjnym nie istnieją żadne reguły łączenia elementarnych jednostek leksykalnych w zdania języka informacyjnego, w tym także reguły umożliwiające dopisywanie tych jednostek w dowolnym szyku.
W językach o gramatyce zerowej przejście z drugiego do trzeciego poziomu polega jedynie na użyciu danej elementarnej jednostki leksykalnej do scharakteryzowania treści lub formy danego dokumentu.
W gramatyce zerowej zdania języka informacyjnego, są więc zawsze jednoelementowe.
Do stosowania z gramatyką zerową nadają się najlepiej klasyfikacje monohierarchiczne, przeznaczone głównie do porządkowania książek na półkach, np.: Klasyfikacja Międzynarodowa F. Ridera.
Gramatyka pozycyjna - w tego rodzaju gramatyce miejsce każdej elementarnej jednostki leksykalnej w zdaniu języka informacyjnego jest ściśle ustalone, a zmiana miejsca powoduje zmianę znaczenia zdania.
Przykładem mogą być zdania wyrażone w języku haseł przedmiotowych.
Gramatyka częściowo pozycyjna - z tego rodzaju gramatyką mamy do czynienia wówczas, gdy miejsce niektórych elementarnych jednostek leksykalnych w zdaniu języka informacyjnego jest dowolne (autosyntaktyczne), natomiast miejsce innych elementarnych jednostek leksykalnych jest ściśle określone (synsytaktyczne) i nie może być zmienione bez spowodowania zmiany znaczenia zdania jako całości.
Jeżeli zdanie składa się z kilku grup autosyntaktycznych, można zmieniać pozycje tych grup.
Przykładem może być symbol złożony UKD.
Gramatyka niepozycyjna (swobodna)- jest ona przeciwieństwem gramatyki pozycyjnej i polega na dowolnej (losowej) kolejności elementarnych jednostek leksykalnych w zdaniu języka informacyjnego. Obowiązują tu reguły indeksowania współrzędnego.
Przykładem może być język deskryptorowy, słów kluczowych.
6. Cechy oraz funkcje języka naturalnego.
Definicje języka naturalnego (etnicznego):
rozwija się żywiołowo w toku porozumiewania się ludzi
ma zbiór elementów nie mających znaczenia, czyli elementów semantycznie pustych. Z tego zbioru powstaje element semantycznie pełny
Cechy języka naturalnego:
dwuklasowość (dualizm)
arbitralność
semantyczność
autonomiczność
produktywność → z niewielkiego zbioru znaków można tworzyć nieskończoną liczbę jednostek wyższego poziomu (wyrazu
kulturowość → język przechodzi za pomocą kultury, wychowania
zdolność informacyjna do przekazywania informacji
zdolność do nadawania i odbierania sygnałów, do porozumiewania się
odróżnialność, wyrazistość → słyszymy różnicę w głoskach
Funkcje języka naturalnego wg Romana Jacobsona:
f. semantyczna (f. znaczeniowa) → funkcja komunikatu polegająca na tym, że każdemu wyrażeniu przypisane jest znaczenie.
f. ekspresywna → funkcja komunikatu polegająca na tym, że nadawca komunikatu może wyrazić informację o swoim stanie; to możliwość wyrażania tych informacji
w języku. Np. ton wypowiedzi, odpowiedni dobór słów (zdrobnienia), szybkość, jąkanie się, seplenienie.
f. impresywna → funkcja komunikatu polegająca na tym, że nadawca komunikatu
w treści komunikatu może wpłynąć na stan odbiorcy komunikatu inny niż stan poinformowania; to możliwość wyrażania tych informacji w języku. Np. ton wypowiedzi, odpowiedni dobór słów → polecenia, rozkazy.
f. estetyczna → funkcja komunikatu polegająca na zaspokajaniu potrzeb estetycznych odbiorcy komunikatu. Np. rymy, epitety, aliteracja, intonacja, styl.
f. fatyczna → funkcja komunikatu pozwalająca nadawcy podtrzymać kontakt
z odbiorcą. Np. mhm, aha, halo, słucham.
f. metainformacyjna → funkcja komunikatu pozwalająca w treści komunikatu przekazywać informacje o informacji
f. metajęzykowa → funkcja komunikatu pozwalająca odnosić się w treści komunikatu do języka
f. klasyfikacyjna → funkcja komunikatu pozwalająca na logiczny podział obiektów
f. ludyczna → funkcja komunikatu dająca możliwość zabawy językiem. Np. rebusy, kalambury, łamigłówki, dowcipy
Źródełka wiedzy tajemnej:
- wykłady
- E. Ścibor: Klasyfikacja piśmiennictwa
7. Relacje syntagmatyczne- definicja, przykłady
RELACJE SYNATAGMATYCZNE
Relacje syntagmatyczne czyli tekstowe zachodzą między jednostkami leksykalnymi wchodzącymi w skład tekstów wyrażonych w języku informacyjnym, tj. charakterystyk i instrukcji wyszukiwawczych; relacje syntagmatyczne mogą zachodzić nie tylko miedzy elementarnymi jednostkami leksykalnymi, ale także między pewnymi, dającymi się wyodrębnić wewnątrz zdania języka informacyjnego, grupami tych jednostek, pozostających w związku składniowym.
Wykładniki relacji syntagmatycznych:
znaki łączące stosowane w UKD
myślnik używany w jhp jako symbol wyrażający podporządkowanie określnika tematowi lub innemu określnikowi poprzedzającemu go w strukturze hasła przedmiotowego.
wskaźniki więzi, wskaźniki roli i wagi ( współczynniki wagowe), stosowane jako wyrażenia pomocnicze w niektórych językach deskryptorowych.
Przykłady:
„ ziemniaki- ochrona”
Relacja między symbolem głównym UKD 001 Nauka i wiedza w ogólności a symbolem poddziału wspólnego formy (091) opracowanie historyczne w symbolu rozwiniętym ( a więc w zdaniu) UKD 001(091) Historia nauki ( symbol (091) uściśla znaczenie symbolu 001)
8. relacje paradygmatyczne- definicja przykłady
RELACJE PARADYGMATYCZNE
Definicje:
relacje zachodzące między wyrażeniami w słowniku;
relacje paradygmatyczne (słownikowe) zachodzą między jednostkami leksykalnymi występującymi w słowniku języka informacyjnego.
1. r. synonimii- związek zachodzący między synonimami, tj. wyrażeniami mającymi to samo znaczenie, ale inną formę. Językoznawstwo, Lingwistyka |
2. r. antonimii- związek zachodzący między antonimami, tj. wyrażeniami mającymi znaczenia przeciwstawne. a) a. skalarne (stopniowalne) Zimny - gorący b) a. niestopniowane- nie ma stadiów pośrednich. Start - meta c) a. komplementarności (dopełnienia) Żywy - martwy d) a. konwersyjne- A jest w relacji z B wtedy i tylko wtedy, gdy B jest w relacji z A. Uczeń - nauczyciel Mąż- żona |
3. r. homonimii- związek zachodzący między wyrażeniami mającymi jednakowe brzmienie ale inne znaczenia. Szczerzy jak być szczerym. Szczerzy jak szczerzyć zęby. |
4. r. polisemii (wieloznaczności)- związek zachodzący między terminami o tej samej formie i różnych znaczeniach, ale w jakimś sensie związanych. Mur → idea chronienia |
5. r. ekwiwalencji- równoznaczność zachodząca między terminami. Tłumaczenia i synonimy |
hierarchiczne |
1. r. nadrzędności generycznej (hiperonimie)- relacja typu rodzaj-gatunek Ssak - pies |
2. r. podrzędności generycznej (hiponimia)- relacja typu gatunek-rodzaj Pies - ssak |
3. r. mereologiczna- relacja typu część-całość lub całość-część. Książka - okładka But - podeszwa Koło - samochód |
4. r. współrzędności- relacja zachodząca między wyrażeniami tego samego poziomu, mającymi wspólny bezpośrednio nadrzędny termin szerszy. Drzewa iglaste: - świerk - sosna |
5. r. równorzędności- relacja zachodząca między wyrażeniami będącymi na tym samym poziomie, ale nie mającymi wspólnego terminu nadrzędnego. Drzewa:
- brzoza - olcha b) drzewa iglaste - świerk - sosna |
6. r. skojarzeniowa (kojarzeniowa, asocjacyjna)- relacja zachodząca między wyrażeniami, które występują często w jednym kontekście. Proces - urządzenie → wiercenie - wiertarka Przyczyna - skutek → korozja - perforacja Produkt - twórca → but - szewc |
7. r. tematyczna- relacja zachodząca między dyscypliną a obiektem tej dyscypliny. Psychologia - osobowość Informatyka - oprogramowanie |
9. Notacja- definicja, cechy, typy.
Funkcja organizacyjna: ma na celu wspomaganie procesu wyszukiwania za pomocą informacji zawartych w strukturze języka. Funkcja organizacyjna jest realizowana przez notację.
Notacja( system notacyjny, system znakowania)- składa się ze zbioru elementarnych znaków graficznych (zwanych bazą notacyjną lub alfabetem) oraz zbioru reguł określających warunki, które muszą być spełnione przy łączeniu elementów
Funkcje notacji:
Funkcja organizująca zbiór informacji
Możliwość ujawnienia logicznych związków w strukturze języka
Cechy ogólne notacji
Funkcja kontrastowa (elementy notacji muszą być od siebie odróżniane)
N = < Bn + Rn>
NOTACJA = BAZA NOTACYJNA + REGUŁY NOTACYJNE
Funkcja kombinatoryjna (dowolne zestawienie znaków w większe struktury złożone)
Stała wartość porządkowa
Typologia notacji wg 3 kryteriów:
Ze względu na charakter bazy notacyjnej
a)jednolita notacja, której zbiór stanowią elementy tego samego typu
Notacja alfabetyczna litery
Notacja numeryczna cyfry
Notacja specjalna znaki specjalne( rysunki, symbole)
b)niejednolita jest to notacja której zbiór stanowią elementy różnego typu
Notacja alfanumerycznacyfry + litery
Notacja mieszana cyfry +litery + np…..
Klasyfikacja UKD ma notację numeryczną, symbole nie są brane pod uwagę bo są pomocnicze
Według generowanie słownictwa
a)Notacja sztuczna
b)Notacja paranaturalna do opisu dokumentów używa się słów, które mają formę graficzną jak w języku naturalnym, nie zawsze musi dokładnie oddawać ten sam sens co język naturalny, nie ma odmiany
3)Ze względu na możliwość ujawniania logicznych struktur
a) Notacja strukturalna- ujawniają strukturę
-notacja kompresywna: dla pewnego podziału hierarhi podaje się numer potem ciąły
-notacja niekompresywna
-notacja hierarchiczna : *notacja alfabetyczna np. A, B, C, D, Z a potem np. ZZA
*notacja numeryczna w niej mamy notacje setną, dziesiętną oraz ósemkową * oraz notacja mieszana
-notacja komponentalna- każdy element jest opisany za pomocą cech, które ten element tworzą
Struktura logiczna- termin węższy zawiera się w terminie szerszym
1.1
1.1.2
b)Notacja niestrukturalna
Porządkowa - celem jest ustalenie porządku pionowego systemu( zbioru) leksykalnego języka np. ponumerowanie słów w słowniku
SC - notacja znaków skróconych, odtwarza porządek notacji, to co najczęściej szukane (szczegółowe) ma krótszy zapis, mniej szczegółowe mają szerszy zapis
Retroaktywna
Porządkowanie funkcji notacji
Produktywność- pozwala na tworzenie odpowiedniej liczby jednostek leksykalnych
Jednoznaczność- wyeliminowanie homonimii i synonimi
Możliwość ujawniania logicznych struktur w systemie leksykalnym
Zwięzłość notacji
Mnemoniczność- techniki ułatwiające zapamiętywanie
10. Język unitermowy- język słów kluczowych, historia, charakterystyka słownictwa i gramatyki.
Język słów kluczowych ma przynajmniej dwie cechy wspólne z językiem haseł przedmiotowych, a mianowicie: 1) słownictwo paranaturalne; 2) alfabetyczne uporządkowanie wyrażeń w słowniku (wykazie) słów kluczowych i w zbiorach informacyjnych zorganizowanych według tego języka. Język słów kluczowych różni się natomiast od języka haseł przedmiotowych gramatyką, która w przypadku pierwszego z tych języków jest niepozycyjna. Stosowanie gramatyki niepozycyjnej jest równoznaczne z indeksowaniem współrzędnym, polegającym na charakteryzowaniu złożonej treści dokumentu (i ewentualnie jego cech formalnych) za pomocą współrzędnych (tj. równorzędnych, niezależnych) wyrażeń jiw. W przypadku języka słów kluczowych wyrażeniami tymi są słowa kluczowe, czyli wyrażenia wybrane z tekstu dokumentu lub zapytania informacyjnego, charakteryzujące jego treść , a w pewnych - raczej rzadkich - wypadkach także pewne cechy formalne dokumentu. Każde ze słów kluczowych występujących w charakterystyce wyszukiwawczej dokumentu lub instrukcji wyszukiwawczej utworzonej zgodnie z zasadami indeksowania współrzędnego może być użyte jako samodzielny element wyszukiwawczy (czyli może samodzielnie pełnić funkcję wyszukiwawczą) i zestawione (skoordynowane) z innym słowem kluczowym lub innymi słowami kluczowymi w celu wyrażenia złożonego przedmiotu dokumentu lub treści zapytania informacyjnego. Na przykład przedmiot dokumentu „kolekcjonerstwo szabel”, który w Języku Haseł Przedmiotowych Piśmiennictwa Wojskowego jest wyrażony za pomocą hasła przedmiotowego „Szabla - kolekcjonerstwo”, składającego się z tematu „Szabla”, myślnika i określnika „kolekcjonerstwo”, w języku słów kluczowych byłby wyrażony za pomocą dwóch odrębnych i niezależnych słów kluczowych: „Szabla” i „Kolekcjonerstwo”. Słowa te mogłyby być użyte pojedynczo - w celu wyrażenia odpowiednio przedmiotów „szable (ogólnie)” lub „kolekcjonerstwo (ogólnie)” lub łącznie - jako zestawienie „Szabla + Kolekcjonerstwo” - w celu reprezentowania wskazanego wyżej przedmiotu „kolekcjonerstwo szabel”; ponadto każde z tych słów mogłoby być użyte łącznie z jakimkolwiek innym słowem kluczowym w celu wyrażenia innych przedmiotów, np. „Szabla + Produkcja” (przedmiot: „produkcja szabel”), „Kolekcjonerstwo + Zabawki militarne” (przedmiot: kolekcjonerstwo zabawek militarnych) itp.
W typowych językach słów kluczowych nie są odwzorowane żadne relacje paradygmatyczne między wyrażeniami tych jiw (tj. między poszczególnymi słowami kluczowymi). W niektórych opublikowanych słownikach słów kluczowych (np. w słownikach z zakresu nauk społecznych i przyrodniczych, wydanych przez były Ośrodek Informacji Naukowej Polskiej Akademii Nauk na przełomie lat 80. i 90. XX w.) jest zaznaczana (za pomoc± odsyłaczy „zob.”) relacja odpowiedniości wyszukiwawczej między wyrażeniami języka naturalnego nie przyjętymi jako słowa kluczowe a reprezentującymi je słowami kluczowymi.
Języki słów kluczowych są jeszcze prostsze w użyciu i bardziej komunikatywne dla użytkowników niż języki haseł przedmiotowych. Wadą ich jest natomiast to, że w stopniu większym niż inne typy jiw generują zjawiska negatywne, jakimi są cisza informacyjna i szum informacyjny. Cisza informacyjna polega na niewydaniu przez siw informacji relewantnych, odpowiadających na zapytanie informacyjne użytkownika, mimo iż informacje te znajduj± się w zbiorze informacyjnym danego systemu. Jeżeli np. do słownika słów kluczowych wprowadzimy synonimiczne słowa kluczowe „Helikopter” i „Śmigłowiec” i nie połączymy ich żadnym odsyłaczem, to może się zdarzyć, że użytkownik w odpowiedzi na zapytanie informacyjne dotyczące helikopterów czyli śmigłowców otrzyma bądź tylko dokumenty zaindeksowane słowem kluczowym „Helikopter”, bądź tylko te, które zaindeksowano słowem kluczowym „śmigłowiec”; w każdym z tych dwóch przypadków otrzyma zatem tylko część dokumentów relewantnych (tj. odpowiadających zgłoszonemu przez niego zapytaniu).
Szum informacyjny jest zjawiskiem poniekąd odwrotnym do ciszy informacyjnej: polega on na wydaniu przez siw informacji nierelewantnych (tj. nie odpowiadających zapytaniu zgłoszonemu przez użytkownika), znajdujących się zbiorze informacyjnym tego systemu. W przypadku stosowania języka słów kluczowych szum informacyjny występuje szczególnie często na poziomie zdań, w wyniku tzw. fałszywej koordynacji wyrażeń charakterystyki wyszukiwawczej dokumentu lub instrukcji wyszukiwawczej. Na przykład dokument dotyczący historii filozofii zostanie zaindeksowany słowami kluczowymi „Historia” i „Filozofia”; w odpowiedzi na zapytanie informacyjne dotyczące historii filozofii użytkownik może uzyskać jednak nie tylko relewantne (tj. odpowiadające zgłoszonemu przez niego zapytaniu) dokumenty dotyczące tej dziedziny, ale także nierelewantne dokumenty odnoszące się do filozofii historii, czyli historiozofii; one bowiem także zostaną zaindeksowane słowami kluczowymi „Historia” i „Filozofia”. Jednym ze sposobów pozwalających zapobiec tego rodzaju szumowi informacyjnemu jest wprowadzenie dwuwyrazowych słów kluczowych „Historia filozofii” i „Filozofia historii”.
Odmianą języka słów kluczowych jest język unitermowy, którego zasady sformułował w 1951 roku amerykański logik M. Taube. Nazwa „język unitermowy” pochodzi od terminu „uniterm” (ang. uni term - termin jednostkowy), którym określa się używane w tym języku słowa kluczowe. Unitermy są przeważnie jednowyrazowe (są równokształtne z wyrazami, ale tylko takimi, które zawierają jeden rdzeń (np. nie byłby dozwolony uniterm Helioterapia [terapia słońcem] gdyż posiada dwa rdzenie: 1)gr. Helios (słońce) i 2) terapia).
M. Taube wyróżnił
Unitermy „wolne” równokształtne z wyrazami o jednym rdzeniu
Unitermy „związane” równokształtne z wyrazami złożonymi.
Możliwość stosowania unitermów „związanych” została obwarowana następującymi ograniczeniami: 1) w wypadku unitermów ”związanych” jednowyrazowych dopuszczono tylko unitermy równokształtne z takimi wyrazami złożonymi, którym w planie treści odpowiada klasa pojęć prostych nierozkładalnych już na pojęcia prostsze, bardziej elementarne; 2) w wypadku unitermów „związanych” wielowyrazowych dopuszczono tego rodzaju unitermy tylko wówczas, gdy nie istnieją unitermy „wolne” równokształtne z poszczególnymi wyrazami, dającymi się wyróżnić w obrębie połączenia wyrazowego, równokształtnego z danym unitermem „związanym” wielowyrazowym, np. uniterm pompa próżniowa tylko wówczas może być wprowadzony do wykazu unitermów, gdy w tymże wykazie nie występują unitermy pompa i próżnia.
Języki unitermowe są stosowane przeważnie w systemach wyszukiwania informacji, których podstawą jest kartoteka inwersyjna (kartę zakłada się dla jednostki leksykalnej języka informacyjnego, a nie dla dokumentu), złożona z kart typu Uniterm (ang uniterm cards). Na karty o formacie 75x125 lub 203x125 mm nanosi się specjalną siatkę, a w poszczególnych kratkach nanosi się numery dokumentów scharakteryzowanych za pomocą danego unitermu. Jeśli potrzebne są dokumenty dotyczące np. „łopatek turbin gazowych”, to należy odszukać karty unitermow Łopatka, Turbina i Gaz, numery dokumentów powtarzające się na wszystkich trzech kartach będą dotyczyły łopatek turbin gazowych.
Najistotniejszą cecha jezyków unitermowych jest możliwość tworzenia dużej liczby zdań jiw ze stosunkowo malej liczby elementarnych jednostek leksykalnych (unitermów). Wadą języków unitermowych jest natomiast większe niż w innych językach prawdopodobieństwo wystąpienia fałszywych koordynacji unitermow, będących przyczyną szumu informacyjnego (wydanie użytkownikowi dokumentów nie odpowiadających zgłoszonemu przez niego zapytaniu informacyjnemu.
Obecnie języki unitermowe używane są rzadko, ale były one wielkim wydarzeniem w historii języków informacyjnych, ponieważ - obok deskryptorów Calvina N. Mooersa, które pojawiły się w 1950r - dały początek indeksowaniu współrzędnemu.
11. Język deskryptorowy- historia, charakterystyka słownictwa i gramatyki.
GENEZA JĘZYKÓW DESKRYPTOROWYCH
Genezy można się doszukiwać w unitermach (pierwszych językach opartych na indeksowaniu współrzędnym) - brak relacji hierarchicznych i innych pomiędzy nimi (niekiedy tylko usuwano synonimię i homonimię terminów) powodował konieczność wielokrotnego przeszukiwania zbiorów, a fałszywe skojarzenia unitermów bywały przyczyną szumu informacyjnego. Dlatego też powstała konieczność przejścia na jęz. deskryptorowy o słownictwie kontrolowanym, oparty na tezaurusie.
JĘZYK DESKRYPTOROWY
Jiw, najczęściej o notacji paranaturalej, z określoną w tezaurusie paradygmatyką, którego jednostki słownika nazywane są deskryptorami, a gramatykę stanowią reguły indeksowania współrzędnego (indeksowanie cechujące się tym, że pomiędzy użytymi wyrażeniami jiw zachodzi jedynie relacja współwystępowania w tekście - dzięki czemu każde z nich może samodzielnie pełnić funkcję wyszukiwawczą); w rozwiniętych wariantach język ten posiada wykładniki relacji syntagmatycznych oraz modyfikatory i/lub wskaźniki roli - np. siarka (produkt), gdzie produkt jest wskaźnikiem roli.
12. Tezaurus - historia, struktura, typy, metodyka budowy, deskryptor, skryptor, modyfikator, identyfikator, artykuł deskryptorowy, indeksy KWIC, KWOC.
Historia.
Pierwszy tezaurus został opracowany w roku 1532 przez Roberta Stephanusa i wydany w Paryżu. „Thesaursus linguae latinae” był to jednojęzyczny słownik frazeologiczny w układzie alfabetycznym, pozwalał poznać znaczenie znalezionego wyrazu oraz jego synonimy.
Pierwszy polski tezaurus opracował Grzegorz Knapski. W 1621 roku został wydany tom 1 - obszerny, polsko-łaciński. Tom 2 - będący indeksem do tomu 1 - w 1626 roku. Natomiast tom 3 - „Adagia Polonica” - stanowi zbiór przysłów.
„Tezaurus angielskich wyrazów i zwrotów(tzw. Rogeta)”, został wydany w 1852 roku przez Petera Marka Rogeta. Ma on ok. 100 wydań, znane są dwie wersje tego tezaurusa:
1. Roget's International Thesaurus - zawiera ponad 200 tys. wyrażeń;
2. Roget's Pocket Thesaurus - skrócone wydanie.
Tezaurus składa się z dwóch części - pierwsza jest podzielona na kategorie, klasy i sekcje (podział systematyczny). Drugą część stanowi indeks alfabetyczny.
Adaptacji tego tezaurusa na język polski podjął się Roman Zawiliński. W 1926 roku wydał on „Dobór wyrazów. Słownik wyrazów bliskoznacznych i jednoznacznych”, zawierający 20 tys. wyrażeń, posiadający analogiczny układ w stosunku do tezaurusa Rogeta.
T. filologiczne - stanowią słownik synonimów i antonimów, niektóre posiadają cechy słowników frazeologicznych. Nie są normatywne.
T. współczesne - są normatywne - nakazują stosowania pewnych wyrażeń, zakazując stosowania innych.
Rozwój tezaurusów:
1. T. alfabetyczne proste - opracowywane na wzór słowników haseł przedmiotowych - zawierały tylko te relacje, które stosowano w słownikach JHP. Nie stosowano symetrii odsyłaczy.
2. T. alfabetyczno-hierarchiczne - zaczęły pojawiać się relacje hierarchiczne.
3. T. z częścią systematyczną - gdzie słownictwo porządkowano wg pewnych kategorii.
4. Tezaurusofasety - głupstwo jak cholera, tezaurus pełni tylko rolę indeksu do tablic.
Pierwszy t. dokumentacyjny - opracowany przez W. K. Paulusa w 1959 r. dotyczył urządzeń elektrycznych i mechanicznych.
W Polce pierwszy t. dokumentacyjny powstał w 1969 r. i dotyczył - uwaga cytuję - „urządzeń transportu bliskiego”.
Typy tezaurusów.
1. Liczba języków etnicznych - jednojęzyczne i wielojęzyczne.
2. Zakres pola semantycznego:
a) ogólny - szeroki zakres pola semantycznego, obejmuje kilka dziedzin, bądź obszerną dyscyplinę (np. chemię).
b) specjalistyczny - zakres pola semantycznego wąski, ograniczony do dyscypliny, branży(t. poczty, t. obróbki skrawaniem), dziedziny(t. fizyki, t. górnictwa) bądź działu(t. BHP, t. polityki naukowej, t. korozji części samochodowych).
Odrębny typ - t. pomocniczy - może odwzorowywać również cechy formalne, np. rodzaj źródła informacji.
3. Relacje pomiędzy tezaurusem służącym jako punkt wyjścia do opracowania innego tezaurusa a tezaurusem zbudowanym na jego podstawie:
a) źródłowy - stanowi punkt wyjścia do opracowania innego tezaurusa.
b) docelowy - opracowany na podstawie innego tezaurusa.
4. Powiązanie lub brak powiązania z innymi tezaurusami:
a) niezależny - stosowany samodzielnie, bez powiązania z innym tezaurusem lub innymi tezaurusami.
b) wchodzące w skład systemu - powinny być opracowane wg wspólnych zasad, z rygorystyczną kontrolą słownictwa.
- nadrzędne ogóle - suma logiczna wszystkich tezaurusów częściowych.
- nadrzędny podstawowy - zawiera tylko podstawowe jednostki, spośród ogółu jednostek tworzących całość systemu.
- podrzędne częściowe - wycinki tezaurusa nadrzędnego ogólnego.
- podrzędny elementarny - bardzo szczegółowy, może zawierać deskryptory zaczerpnięte z innych tezaurusów. Stanowi samodzielne narzędzie do indeksowania dokumentów.
5. Struktura
a) alfabetyczne
b) systematyczne
c) graficzne
d) indeksy permutacyjne
6. Postać.
a) t. w formie opublikowanej (książkowe, drukowane)
b) t. w formie maszynopisu
c) t. w pamięci komputera
Metody budowy.
1. Metoda dedukcyjna - wykorzystywanie gotowych, usystematyzowanych zbiorów słownictwa (np. tezaurusów, norm i słowników, klasyfikacji).
2. Metoda indukcyjna - tworzenie samemu.
Definicje.
1. Deskryptor - elementarna jednostka leksykalna języka deskryptorowego. Jest autosyntaktyczna, czyli może sama stanowić zdanie. Deskryptor prosty, to taki, który stanowi tylko jeden wyraz. Deskryptor składający się z dwóch lub więcej wyrazów to deskryptor złożony. Są dwie kategorie deskryptorów - k. obiektów fizycznych (przedmioty, materiały, ludzie, zwierzęta) oraz k. obiektów abstrakcyjnych (działania, zjawiska, jednostki miary, dyscypliny nauki).
2. Askryptor - jednostki leksykalne tezaurusa, nie przyjęto do języka deskryptorowego. Stosowane w celu ułatwienia przekładu tekstu z języka naturalnego na deskryptorowy. Askryptorami mogą być:
- synonimy deskryptora (terminy zapożyczone, terminy naukowe, żargonowe, nazwy firmowe i gatunkowe, nazwy i symbole, itp.)
- quasi-synonimy - wyrażenia, których znaczenie w języku naturalnym uznawane jest za różne, a w języku informacyjnym są używane do indeksowania tych samych dokumentów (antonimy, wyrażenia bliskoznaczne używane zamiennie, wyrażenia zbyt szczegółowe i uogólniające).
3. Modyfikatory (deskryptory aspektowe) - pomocnicze jednostki języka deskryptorowego, niesamodzielne składniowo. Charakteryzują się małą wartością informacyjną, wskazują na aspekt treściowy. Pełnią podobną rolę do określników w JHP.
4. Identyfikator - szczególny przypadek deskryptora. Mogą nim być: nazwy własne, nazwy osób, nazwy geograficzne, itd.
5. Artykuł deskryptorowy - powinien składać się z części:
- deskryptor tytułowy - jest hasłem artykułu deskryptorowego, jeśli jest wieloznaczny, należy dodać objaśnienia.
- definicje - poprzedzone DEF - dotyczy deskryptorów wieloznacznych, bądź też zawężenia lub rozszerzenia znaczenia deskryptora w stosunku do wyrażenia języka naturalnego z nim równoważnego; daty przyjęcia, bądź zmiany definicji deskryptora; źrodła deskryptora.
- askryptory - poprzedzone NU - w kolejności alfabetycznej.
- deskryptor główny - poprzedzone GD - jest to deskryptor nie przyporządkowany hierarchicznie żadnemu deskryptorowi.
- deskryptory szersze - SD lub SDG i SDM
- deskryptory węższe - WD lub WDG i WDM
- deskryptory kojarzeniowe - poprzedzone KD
6. Artykuł askryptorowy powinien zawierać:
- askryptor tytułowy - stanowi on hasło artykułu askryptorowego.
- deskryptor - poprzedzony wskaźnikiem relacji ekwiwalencji U.
7. Indeks permutacyjny - alfabetyczny wykaz deskryptorów złożonych powtórzonych pod każdym z wyrazów składowych (czyli po naszemu - uwzględnianie kolejności występowania kolejnych wyrazów składowych deskryptora). Są 2 możliwości - KWIC - słowo w kontekście (np. DUPA BLADA, a pod tym BLADA DUPA) i KWOC - poza kontekstem (np. DUPA dupa blada, a pod tym BLADA dupa blada).
13. Język haseł przedmiotowych - KABA, BN.
1. Krótka historia.
2. Zasady ogólne.
3. Słownictwo (rodzaje).
4. Gramatyka i relacje.
5. Porównanie JHP KABA I JHP BN.
14. Cechy dobrego jiw (tu miały być postulaty optymalności jiw wg artykułu)
Przeprowadzone wiele let temu badania, znane jako badania cranfieldzkie pokazały, że :
- rodzaj stosowanego języka informacyjno-wyszukiwawczego ma stosunkowo niewielki wpływ na efektywnośc wyszukiwania
informacji
- jeżeli do języków różnych typów wprowadzimy te same pojęcia, to języki te będą miały taką samą lub bardzo zbliżoną
potencjalną efektywność
- sposób eksploatacji JIW wpływa na efektywność wyszukiwania w większym stopniu niż zastosowanie tego lub innego
języka
- im bogatszy jest JIW, im bardziej rozbudowana jego składnia i morfologia, tym większe powinien mieć możliwości
uzyskania wysokiej efektywności funkcjonowania
- szczególne znaczenie przy wyborze języka powinna mieć jego efektywność ekonomiczna
Z powyższych sformułowań wynika zatem, że dobry JIW to najogólniej taki, który jest odpowiedni, przydatny, stosowny do sytuacji danej biblioteki, czyli:
- odwzorowuje te pojęcia, które byłyby potrzebne do takiego charakteryzowania dokumentów, żeby użytkownik mógł je odszukać w odpowiedzi na różne formułowane kwerendy
- jest stosunkowo łatwy do nauczenia się przez bibliotekarzy i w pewnym stopniu przez użytkowników
- odpowiada warunkom technicznym biblioteki
- odpowiada warunkom finansowym biblioteki
JIW a środki techniczne
Środki techniczne mogą mieć dodatkowy pozytywny wpływ na efektywność wyszukiwawczą, jeśli inne elementy
systemu, zwłaszcza te o charakterze intelektualnym mają odpowiednio wysoką jakość.
Na podstawie artykułu:
Cechy dobrego języka informacyjno-wyszukiwawczego/Jadwiga Woźniak.-
W: Zagadnienie Informacji Naukowej/pod red. Bożenny Bojar.-1998, nr 2, s. 3-17
15. Kategorie wiedzy (Marysia) na pod
Najczęściej na podstawie typu rzeczywistości odniesienia wyróżnia się cztery kategorie wiedzy: wiedzę o dziedzinie ( domenie), reprezentowanej przez zasoby informacyjne sytemu, wiedzę o problemie (zadaniu), którego dotyczy wyszukiwanie, wiedzę o systemie, ogólną wiedzę o świecie. W każdej z tych ogólnych kategorii wiedzy można przeprowadzić dalszy podział, przyjmując za podstawę takie cechy jak, typ składających się na nią informacji (wiedza deklaratywna - proceduralna; strukturalna - strategiczna) czy odniesienie do podmiotu poznania ( semantyczna - epizodyczna).
David Jonassen wyróżnił trzy główne typy wiedzy odwzorowywanej w systemach informacyjnych i poszukiwanej przez ich użytkowników: wiedzę ontologiczną, wiedze epistemologiczną i wiedzę fenomenologiczną. Pierwsza jest zapisem pewnego fragmentu rzeczywistości zgodnie z określoną orientacją dziedzinową. Druga jest operacyjnie zorientowanym zapisem określonej sytuacji poznawczej. Trzecia wyznaczona jest przez zbiorowe i indywidualne doświadczenie poznawcze projektantów i użytkowników systemu. Każda kategoria organizowanej wiedzy wymaga innych metod i narzędzi porządkowania i reprezentowania w systemie informacyjnym - każda przyjęta metoda porządkowania i reprezentacji wyznacza pewien model organizacji wiedzy, który decyduje o zakresie jej odwzorowania i dostępu do jej elementów.
16. JIW jako narzędzie organizacji wiedzy (Lila)
Język informacyjno-wyszukiwawczy jako narzędzie organizacji wiedzy
Od dawna starano się zorganizować wiedzę, sklasyfikować ją. Na przełomie lat 20,30-tych XX wieku zajął się tym Henry Bliss. Klasyfikacja czyli podział logiczny wiedzy realizuje cele: 1) porządkowanie wiedzy,2) porządkowanie dokumentów.
Badania prowadzone w zakresie organizacji wiedzy posługują się następującymi metodologiami badawczymi:
empiryzm (automatyczne metody klasyfikacji, kategoryzacja terminów wyszukiwawczych),
racjonalizm (klasyfikacja oparta na podziale logicznym),
historycyzm (rozwój klasyfikacji),
pragmatyzm (zastosowanie wiedzy). Z nich najczęściej stosowane to empiryzm i racjonalizm.
Organizacja wiedzy to obszar badań i zespołu działań związanych z generowaniem opisów dokumentów, ich treści, przeznaczenia, własności formalnych i organizacja tych opisów. Do procedur organizacji wiedzy należą: indeksowanie, katalogowanie, klasyfikowanie, abstraktowanie, wyszukiwanie, tworzenie charakterystyk wyszukiwawczych, zarządzanie bazami danych.
W systemach informacyjnych procedurom organizacji podlegają różne rodzaje wiedzy. Te kategorie to wiedza o dziedzinie, problemie, świecie, systemie. Na pewnym seminarium wyróżniono trzy kategorie: wiedzę ontologiczna, epistemologiczną fenomenologiczną.
Jakikolwiek język służy do organizacji wiedzy. Odwzorowanie wiedzy w jiw jest realizowane poprzez odwzorowanie pojęć i odwzorowanie relacji. Odwzorowanie pojęć, czyli nadawanie nazw to słownictwo języka informacyjno-wyszukiwawczego, inaczej mówiąc zasoby informacyjne systemu (wiedza o dziedzinie). Odwzorowanie relacji to reguły gramatyczne (informacje o wyszukiwaniu).
Słownictwo można podzielić na: modele organizacji, relacje, hierarchię.
Wśród modeli organizacyjnych wyróżniamy:
1) podział kategorialny, który dzieli się na kategorie ontologiczne i kategorie epistemiczne
2) podział dyscyplinarny, który zakłada zakwalifikowanie każdego wyrażenia do klasy dziedzinowej odpowiadającej dyscyplinarnemu porządkowaniu reprezentowanego przez nie pojęcia. Podział kategorialny zakłada zakwalifikowanie każdego wyrażenia do określonej grupy kategorialnej. Kategorie ontologiczne to kategorie nadrzędne (podział wg. typów elementów rzeczywistości), a kategorie epistemiczne to kategorie funkcjonalne (podział wg kryterium zadań poznawczych).
Ze względu na stopień rozbudowy struktury relacyjnej wyróżniamy organizację monorelacyjną (klasyfikacje fasetowe) i polirelacyjną.
Biorąc pod uwagę hierarchię wyróżniamy modele:
- organizację hierarchiczną, wyrażenia słownictwa pozostają względem siebie w stosunku współrzędności
- org. monohierarchiczną, jedno drzewo i jeden typ relacji
- org. polihierarchiczną, jedno drzewo, ale na poszczególnych poziomach występują różne relacje
- org. quasihierarchiczną, porządek wiedzy w postaci struktury cyklicznej
Cztery podstawowe organizacje wiedzy o problemie wyznaczane są przez cztery typy gramatyk jiw: gramatykę 1) zerową, 2) pozycyjną 3) częściowo pozycyjną 4) niepozycyjną.
Gramatyka zerowa - żadnych reguł dotyczących łączenia EJL w zdania, jedyna reguła to reguła o niedołączaniu.
Gramatyka pozycyjna - miejsce każdej jednostki jest ściśle ustalone, zmiana miejsca powoduje zmianę znaczenia całego zdania. Przykładem może być JHP.
Gramatyka częściowo pozycyjna - miejsce niektórych EJL jest ściśle określone, przestawienie miejsca powoduje zmianę znaczenia zdania. Inne jednostki mogą być dowolnie przestawiane. Przykład UKD, język deskryptorowy.
Gramatyka niepozycyjna - Istnieje całkowita dowolność elementów. Za przykład niech posłuży język słów kluczowych.
1