1. System leksykalny JIW.
struktura językowa zbudowana z wykładników językowych znaczeń. Tymi wykładnikami są wyrazy, zdania, teksty jakie można wyrazić w danym języku za pomocą środków, którymi ten język dysponuje.
2. Język opisu formalnego – charakterystyka i typologia (język opisu bibliograficznego).
1)
język opisu bibliograficznego (katalogowego) to klasa języków opisu formalnego stosowana w bibliografiach, bibliografiach załącznikowych, katalogach bibliotecznych.
2)
• Języki paranaturalne, których funkcją jest wyrażanie cech formalnych dokumentów
umożliwiających ich identyfikację (cechy formalne: nazwiska i imiona autorów, tytuł,
nazwa wydawcy, miejsce, rok wydania itd.)
• Słownik niejawny
• Przykłady: Język opisu bibliograficznego (katalogowego) oraz języki cytowań
bibliograficznych
3. Słowniki słów kluczowych – rodzaje.
Klasyczne słowniki słów kluczowych – najprostszego typu słownika używają klasyczne jęz. słów kluczowych. Są to słowniki jednojęzyczne, bazujące na jednym języku naturalnym. Następuje w nim „naturalizacja” wyrażeń języka naturalnego użytych w funkcji metainformacyjnej. Przykładem systemów wykorzystujących klasyczne języki słów kluczowych są: SYNABA, CYTBIN, system BOINTE w Gliwicach, GOSPODARKA czy BAZTECH. Słowniki tych systemów stanowią najprostsze alfabetyczne listy słów kluczowych bez jakichkolwiek informacji dodatkowych.
Słowniki słów kluczowych z systemami odesłań – listo słów kluczowych towarzysza różnego rodzaju odsyłacze, będące wykładnikami podstawowych relacji słownikowych, do których zalicza się relację synonimii wyszukiwawczej oraz relację pokrewieństwa. Przykład stanowi większość słowników budowanych przez OIN PAN
Słowniki słów kluczowych z elementami fasetyzacji – oprócz alfabetycznego zrębu głównego zawierają dodatkowo wykazy słów kluczowych różnych kategorii np. (OIN PAN) „Słownik słów kluczowych z historii Polski”, „Słownik słów kluczowych z językoznawstwa”
Słowniki słów kluczowych w układzie gniazdowym – Nowym rozwiązaniem w słownikach słów kluczowych jest układ gniazdowy słów kluczowych wspomagany systemem terminologicznym. Ten sposób prezentacji jęz. słów kluczowych dostarcza jeszcze więcej informacji o jego strukturze semantycznej. Zastosowano go w jęz. słów kluczowych etnologii. Język ten powstał, a właściwie powstaje, od roku 1993 w ramach prac zespołu kierowanego przez prof. Czesława Robotyckiego z Instytutu Etnologii i Antropologii Kulturowej UJ nad porządkowaniem terminologii tej dyscypliny.
Wielojęzyczne słowniki słów kluczowych - osobna grupa w tego typu narzędziach nie tłumaczy się wyrażeń pobieranych z poszczególnych języków na wyrażenia pozostałych języków lecz łączy się je relacjami równoważności. Stosowana tu technika tzw. mapowania, to jest odwzorowywania jednego systemu w drugim zapewnia kompatybilność i współdziałanie różnych systemów. Takie systemy zapewniają równoległe przeszukiwanie zasobów za pomocą języków słów kluczowych opartych na leksyce kilku różnych języków etnicznych.
4. Język słów kluczowych.
1)
JĘZYK SŁÓW KLUCZOWYCH – język informacyjno-wyszukiwawczy o notacji paranaturalnej, bez określonej explicite w słowniku paradygmatyki, w którym jednostki słownika nazywane są słowami kluczowymi, a na gramatykę składają się reguły indeksowania współrzędnego.
2)
Język słów kluczowych wywodzony od średniowiecza, gdy tworzono katalogi, w których hasłem był główny wyraz tytułu. Genezy języków słów kluczowych doszukują się niektórzy w języku unitermowym. System Unitermów Mortimera Taubego: uniterm – termin jednowyrazowy zapisywany na kartach unitermowych.
Definicja
JIW, którego słownictwo tworzą wyrażenia zwane słowami kluczowymi, wybierane z tekstu dokumentu lub treści zapytania informacyjnego, nie kontrolowane lub nie w pełni kontrolowane, a gramatyką są reguły indeksowania współrzędnego.
Cechy charakterystyczne
· Forma jednostek leksykalnych tożsama z formą wyrażeń języka naturalnego.
· Brak kontroli (lub kontrola częściowa) słownictwa.
· Słownik uporządkowany alfabetycznie, tzn. nie uwzględniający żadnych relacji między jednostkami leksykalnymi.
· Gramatyka oparta na indeksowaniu współrzędnym.
5. Pojęcie i definicja terminu słowo kluczowe.
Słowa, które najlepiej reprezentują treść dokumentu.
Dwa znaczenia terminu słowo kluczowe:
Każde wyrażenie, wyraz z tytułu lub tekstu dokumentu wykorzystywane do odtwarzania treści lub każde słowo z zapytania.
Jednostka leksykalna języka słów kluczowych.
6. Metody indeksowania współrzędnego.
INDEKSOWANIE WSPÓŁRZĘDNE, indeksowanie koordynacyjne, indeksowanie korelacyjne, indeksowanie wieloaspektowe, indeksowanie współrzędnościowe – indeksowanie charakteryzujące się tym, że pomiędzy użytymi wyrażeniami języka informacyjno-wyszukiwawczego zachodzi jedynie relacja współwystępowania w tekście – dzięki czemu każde z nich może samodzielnie pełnić funkcje wyszukiwawczą.
Zasada indeksowania współrzędnego została opracowana w pierwszej połowie lat 50. w związku z podjętymi próbami mechanizacji systemów informacyjno-wyszukiwawczych. Do jej sformułowania i rozpropagowania przyczynił się M. Taube (USA), z którego nazwiskiem związane jest zastosowanie indeksowania współrzędnego w praktyce informacyjnej. W swoich pracach pisze on o współrzędnych dokumentu w znaczeniu, w jakim używa się tego terminu w matematyce. Tak jak współrzędne w matematyce jednoznacznie określają położenie punktu w przestrzeni, tak wyrażenia języka informacyjno-wyszukiwawczego, pełniące funkcję współrzędnych, winny wskazywać, gdzie dany dokument (który możemy przedstawić jako punkt) znajduje się w przestrzeni informacyjnej (zbiorze wyszukiwawczym) i tym samym umożliwiać wyszukanie tego dokumentu w odpowiedzi na zapytanie informacyjne. Charakterystyki wyszukiwawcze dokumentów zbudowane w oparciu o zasadę indeksowania współrzędnego można w uproszczeniu traktować jak zbiory wyrażeń języka informacyjno-wyszukiwawczego i wówczas instrukcje wyszukiwawcze maja charakter pytań o sumę zbiorów, iloczyn zbiorów lub różnicę zbiorów. Języki informacyjno-wyszukiwawcze bazujące na zasadzie indeksowania współrzędnego obecnie są wykorzystywane przede wszystkim w systemach o wyszukiwaniu zautomatyzowanym z inwersyjną organizacją zbiorów wyszukiwawczych (inwersja).
7. Typologia języków klasyfikacji.
TYPOLOGIA JĘZYKÓW KLASYFIKACJI (KLASYFIKACJI PIŚMIENNICTWA)
KLASYFIKACJA PIŚMIENNICTWA – 1. klasyfikacja zbioru dokumentów na grupy według wspólnych własności ich treści i/lub cech formalnych dokumentów; 2. klasyfikacja dokumentów, której celem jest zakwalifikowanie ich do grup tematycznych wyodrębnionych w przyjętej organizacji określonego zbioru informacyjnego; 3. klasyfikacja czyli język klasyfikacji
TYPOLOGIA – zależnie od przyjętych kryteriów wyróżnia się następujące typy klasyfikacji piśmiennictwa:
1)ze względu na zakres: klasyfikacje uniwersalne, klasyfikacje specjalistyczne, klasyfikacje branżowe, klasyfikacje specjalne
2)ze względu na zastosowanie: klasyfikacje biblioteczne, klasyfikacje bibliograficzne, klasyfikacje dokumentacyjne
3)ze względu na rodzaj struktury: klasyfikacje wyliczające, klasyfikacje fasetowe (klasyfikacje analityczno-syntetyczne oraz tzw. klasyfikacje częściowo-fasetowe lub częściowo-monohierarchiczne, w których klasy odpowiadające własnościom treści lub formy wspólnym wielu dokumentom zorganizowane są w odrębnych drzewach klasyfikacyjnych, jednak zasadnicza część klasyfikacji obejmująca szczegółowe tematy dokumentów ma strukturę monohierarchiczną. Ostatni z tych podziałów jest równoważny podziałowi klasyfikacji piśmiennictwa na klasyfikacje monohierarchiczne i klasyfikacje polihierarchiczne oraz klasyfikacje częściowo-monohierarchiczne lub częściowo-polihierarchiczne.
8. Język słów kluczowych – naturalny czy sztuczny?
Język słów kluczowych jest językiem sztucznym jak każdy inny JIW, czyli jest zbudowany celowo, a nie powstaje stopniowo i samorzutnie w toku porozumiewania się. Język słów kluczowych korzysta jednak z elementów języka naturalnego, np.:
- Forma jednostek leksykalnych JSK jest tożsama z formą wyrażeń języka naturalnego;
- Podstawą tworzenia słów kluczowych jest język naturalny.
9. Pojęcie i definicja terminu tezaurofaseta.
Termin zarezerwowany dla słownika wydanego w Anglii w 1970 roku, dla British Electric Company. Był to wtedy nowoczesny słownik, w którym klasyfikację fasetową połączono z tezaurusem. Obecnie wszystkie tezaurusy mają już taką strukturę, aczkolwiek nazywa się je tezaurusami fasetowymi [a nie tezaurofasetami].
10. Definicja języka.
1. zespół społecznie wytworzonych i obowiązujących znaków dźwiękowych (wtórnie pisanych) oraz reguł określających ich użycie, funkcjonujący jako narzędzie komunikacji społecznej
2. system znaków złożony ze słownika i gramatyki, tj, zbioru znaków oraz zbioru reguł posługiwania się nimi w komunikacji (kod).
11. Język kodów semantycznych a języki syntagmatyczne.
- zbudowane na zasadzie kodu semantycznego (pozbawiony homonimii i synonimii metajęzyk opisu znaczenia głównie wyrażeń języka naturalnego)
- słownik: określony zbiór wyrażeń reprezentujących tzw. znaczenia elementarne (prymitywy semantyczne lub mnożniki semantyczne), odzworozujące podstawowe cechy opisywanej rzeczywistości
- reguły gramatyczne: określają sposób łączenia elementów słownika w jednoznaczne formuły
- przykład tego języka: Kod Semantyczny Perry’ego i Kenta
Języki syntagmatyczne:
- słowniki: tezaurus lub wykaz słów kluczowych bądź relatorów
- słownictwo : deskryptory lub słowa kluczowe i delatory (deskryptory wyrażone za pomocą notacji para naturalnej, delatory za pomocą notacji sztucznej)
- rozbudowana gramatyka częściowo pozycyjna
- mają bardzo rozwinięte relacje syntagmatyczne (czyli mogą bardzo precyzyjnie opisywać treści)
- przykład języka: SYNTOL
Języki kodów semantycznych i języki syntagmatyczne – CECHY WSPÓLNE:
- ich słowniki zawierają stosunkowo niewielką liczbę jednostek leksyklanych będących wybranymi wyrazami, morfemami zaczerpniętymi z języka naturalnego lub symbolami
- gramatyka: zapewnia jednoznaczność zapisu znaczeń, np. w postaci drzewa zależności
- należą do grupy kodów semantycznych, czyli całkowicie sformalizowanych języków informacyjnych, których słowniki składają się z kodów (symboli) literowych i/lub cyfrowych, używanych do oznaczania pojęć ogólnych
12. Rodzaje języków słów kluczowych.
RODZAJE JĘZYKÓW SŁÓW KLUCZOWYCH
Klasyczne języki słów kluczowych. Takim językiem jest język swobodnych słów kluczowych: nie posiada on systemu odsyłaczy, bazuje na słowniku mentalnym człowieka, tj. słowniku niejawnym.
Nieklasyczne języki słów kluczowych; wspomagane systemem odsyłaczy (poza odsyłaczem „zob.”), który wprowadza w system leksykalny system preferencji, co sprawia, że język ten traci atrybut klasycznego, stając się nieklasycznym językiem słów kluczowych. (Podział wg B. Bojar)
Stopień kontroli słownictwa stanowi kryterium wyróżnienia następujących odmian języka słów kluczowych:
- język słów kluczowych o słownictwie niekontrolowanym słownikiem (języki swobodnych słów kluczowych;
- język słów kluczowych o słownictwie częściowo kontrolowanym słownikiem, na przykład słowniki słów kluczowych wydawane przez Pracownie OIN PAN w Krakowie w swej istocie miały pełnić funkcje wykazów wzorcowych słów kluczowych
- język słów kluczowych o słownictwie kontrolowanym słownikiem (słownik-wykaz słów kluczowych, kartoteka wzorcowa słów kluczowych jako leksykograficzna baza danych).
E. Ścibór wyróżnił w ramach typologii strukturalnej języków informacyjno-wyszukiwawczych następujące rodzaje języka słów kluczowych:
- najprostszy język słów kluczowych (bez usunięcia synonimii, bez odsyłaczy i bez hierarchii)
- język słów kluczowych bez hierarchii, z odsyłaczami „zob.” lub najprostszy język deskryptorowy, o słowniku w postaci tezaurusa alfabetycznego prostego (odsyłacze „U” – „używaj”)
- język słów kluczowych bez hierarchii, z odsyłaczami „zob. też”.
13. Pojęcie i definicja terminu klasaurus.
Jest to rodzaj, typ tezaurusa fasetowego, w którym słownictwo ze zrębu głównego jest uporządkowane według klasyfikacji Ranganathana.
14. Etapy indeksowania swobodnego w języku słów kluczowych.
ETAPY INDEKSOWANIA SWOBODNEGO w języku słów kluczowych zawarte zostały w instrukcji opracowanej w 1984 roku przez Lucynę Annę Bielicką i dotyczącą indeksowania prac badawczych za pomocą swobodnych słów kluczowych w systemie SYNABA. Tekst instrukcji składa się z sześciu punktów.
1.Wprowadzenie: podstawowe informacje dotyczące języka, reguł indeksowania swobodnego, wyboru słowa kluczowego oraz tworzenia tekstów w języku słów kluczowych.
2. Etapy indeksowania swobodnego:
- analiza treści/formy pracy naukowo-badawczej
- wybór słów kluczowych
- nadawanie odpowiedniej formy słowom kluczowym
3. Analiza treści prac naukowo-badawczych, której celem jest ustalenie istotnych elementów treści indeksowanych dokumentów.
4. Kryteria oceny zestawu wybranych słów kluczowych, które maja stanowić charakterystykę wyszukiwawczą.
5. Kryteria określania i leksykograficznego ujednolicania formy słów kluczowych.
6. Sposób stosowania zasad formalnych (zilustrowane za pomocą 8 przykładów), zawartych w punktach 1-5.
15. Pojęcie i definicja terminu ontologia.
Ontologia – w JIW jest to sieć, zbiór jednostek leksykalnych wzajemnie ze sobą powiązanych relacjami, które tworzą dla każdej jednostki leksykalnej kontekst.
16. Rodzaje relacji paradygmatycznych.
17. Języki haseł przedmiotowych – charakterystyka.
JHP - to języki inf.-wysz. o notacji paranaturalnej,w których jednostki sółownika nazywane są tematami i określnikami, a gramatykę stanowią regułu budowy haseł przedmiotowych, ich łączenia i transformacji.
CHARAKTERYSTYKA:
Słownictwo: tematy (ewentualnie z dopowiedzeniami) i określniki
wyrażane za pomocą notacji paranaturalnej
kontrolowane
podzielone na dwie podstawowe kategorie syntaktyczne: tematy samodzielne składniowo i określniki niesamodzielne składniowo
Słownik: słownik tematów i określników, słownik haseł przedmiotowych, KHW
słownik przekładowy
uporządkowany alfabetycznie i zawierający odsyłacze
zwykle składający się z odrębnych wykazów tematów i określników stosowanych przy poszczególnych kategoriach tematów
Gramatyka: reguły budowy haseł przedmiotowych (zdań i tekstów)
gramatyka pozycyjna, wyznaczająca szyk elementów hasła przedmiotowego
podstawowy schemat hasła przedmiotowego: TEMAT, dopowiedzenie - określnik
schematy indywidualne określają kolejność poszczególnych kategorii określników w hasłach
18. Pojęcie terminu folksonomia.
–efekt tagowania,
–zbiór tagów,
•Thomas Vander Wal - twórca terminu (2004 r.)
–społeczne klasyfikowanie,
–rozwijający się, indukcyjny schemat kategoryzacyjny
19. Systemy słownikowe JIW.
Systemy słownikowe – struktura zbudowana jest ze znajdujących się w słowniku wykładników językowych znaczeń, jakie można wyrazić w danym języku. Biorąc pod uwagę słownik danego języka, można wyróżnić:
1. JIW o słownictwie swobodnym (nie da się pokazać, bo istnieje np. w naszej głowie)
2. JIW o słownictwie kontrolowanym (posiada jawny słownik o charakterze normatywnym, przykładem jest UKD)
3. JIW o słownictwie częściowo kontrolowanym (posiada słownik o charakterze częściowo jawnym)
TYPY SŁOWNIKÓW
1. Słowniki wyliczające Elementarne Jednostki Leksykalne.
2. Słowniki zawierające zdania w danym języku.
3. Słowniki negatywne –„STOP LISTA” zbiory wyrazów, których nie wolno używać np. słownik wulgaryzmów
Rodzaje uporządkowania EJL:
1. Losowe, przypadkowe, (ale tak nie powinno być)
2. Formalne, np. według alfabetu
3. Semantyczne (według znaczenia, np. czasopisma podzielone na dzienniki, tygodniki, miesięczniki itd.).
4. Mieszany (np. alfabetyczno-semantycznie)
Tablice klasyfikacyjne
Alfabetyczny wykaz tematów i określników
Alfabetyczny wykaz słów kluczowych
20. Pojęcie i definicja terminu metadane.
Metadane często nazywane są "danymi o danych" lub "informacją o informacji". Są to obrazowe określenia, ale mogą nieco zaciemnić sedno sprawy. W działalności informacyjnej termin "metadane" oznacza zdefiniowanie lub opis danych. Często przy tej okazji podaje się przykład katalogu bibliotecznego jako dobrze ustrukturyzowanego zbioru metadanych: każda karta katalogowa opisuje znacznie większy zasób informacji, którym jest skatalogowana książka lub inny dokument i odsyła użytkownika do tego dokumentu.
Podobnie metadane zawierają informacje o formie i treści dokumentów elektronicznych. Jedna z definicji mówi, że metadane to zwięzły i systematyczny zestaw informacji odsyłającej, który może być użyty do efektywnego i trafnego wyszukiwania większych zestawów informacji (czyli samych dokumentów elektronicznych). Metadane obejmują indeksowanie i katalogowanie wszelkich zasobów informacji w formie elektronicznej: stosowane są np. do opisu danych tekstowych, informacji o przestrzeni geograficznej, obrazów (dokumentów graficznych), muzyki (dokumentów dźwiękowych) i dzieł multimedialnych.
Metadane umożliwiają użytkownikom wyszukanie potrzebnej informacji w cyberprzestrzeni wraz z odpowiedzią na pytanie, w jakiej relacji pozostaje ona do innych informacji. Tradycyjne metody katalogowania nie są odpowiednie dla WWW: gwałtowny wzrost ilości danych uniemożliwia takie opracowanie. Natomiast wykorzystanie metadanych ułatwia zorganizowanie i zarządzanie informacją znajdującą się w WWW w sposób pozwalający na jej wyszukiwanie
Jednym z najczęściej stosowanych formatów metadanych, którego inicjatorem w dużej mierze byli bibliotekarze, jest Dublin Core Metadata Element Set (DC). Utworzony on został dla dokumentów tekstowych w Web przez grupę związaną z OCLC (http://purl.oclc.org/metadata/dublin_core/). Dublin Core to cały system różnych działań obejmujących warsztaty szkoleniowe, publikacje, grupy dyskusyjne i robocze pracujące na rzecz ułatwienia przeszukiwania zasobów elektronicznych. Efekt tych prac to piętnaście elementów Dublin Core (zob. rys. 1), które w intencji ich twórców powinny znaleźć szerokie zastosowanie i być łatwiejsze w użyciu niż biblioteczny katalog kartkowy.
Elementy Dublin Core mogą być podzielone na trzy klasy (Zawartość - Content, Własność Intelektualna - Intellectual Property, Dookreślenie - Instantiation) w następujący sposób:
Zawartość (Content) | Własność intelektualna (Intellectual Property) |
Dookreślenie - Instantiation |
---|---|---|
Tytuł (Title) | Twórca (Creator) | Data (Date) |
Opis (Description) | Współtwórca (Contributor) | Format (Format) |
Źródło (Source) | Własność (Rights) | Identyfikator (Identifier) |
Język (Language) | ||
Relacja (Relation) | ||
Miejsce i Czas (Coverage) |
Część z tych elementów, takich jak tytuł, autor, opis rzeczowy jest dobrze znana wszystkim, którzy choć raz widzieli rekord bibliograficzny. Niektóre z elementów służą do zapisu danych technicznych i zawierają informację ważną dla dokumentów internetowych, jaką jest rozmiar pliku. Część jednak jest typowa dla nowych potrzeb cyberprzestrzeni i informuje np. kto posiada prawa do danego materiału.
Mówiąc o metadanych należy także wspomnieć o SGML i XML. Są to metajęzyki mogące zawierać elementy metadanych. SGML (Standard Generalized Markup Language) używa kodów ASCII do opisania tekstu. Każdy komputer rozumie ten kod. HTML, o którym wspominaliśmy już w kilku miejscach, jest bardzo prostym podzbiorem SGML. Przy pomocy SGML możliwe jest zidentyfikowanie i wyszukanie nazw, tytułów, opisów rzeczowych, połączeń pomiędzy tekstem i obrazami lub baz danych. Jednak SGML może być zrozumiany tylko przez specjalne przeglądarki, więc jeżeli ma być powszechnie dostępny, tłumaczony jest na HTML.
Nowym standardem w Web staje się obecnie XML (Extensible Markup Language), produkt W3C. O ile HTML to po prostu tekst ASCII zawierający etykiety umieszczane wg pewnych określonych reguł, to XML pozwala na określenie własnej struktury dokumentu. Standardem zapisu znaków w XML jest Unicode, co pozwala na unifikację wyglądu znaków narodowych, np. polskich, bez względu na użytą przeglądarkę, dzięki czemu dokument w języku polskim może być właściwie wyświetlony zarówno w kraju, jak i w Ameryce, co obecnie nie jest możliwe (lub trudne jest do osiągnięcia). XML jest narzędziem bardziej ogólnym od HTML. Ten ostatni zawiera informacje wyłącznie służące poprawnemu wyświetleniu danych na ekranie przy pomocy przeglądarki. Natomiast XML pozwala na logiczne uporządkowanie informacji wg potrzeb i żądań autora i/lub osób, z którymi wymieniamy dane.
21. Metody indeksowania dokumentów (intelektualne i automatyczne).
22. Formy słów kluczowych.
Mogą to być terminy: jedno-, dwu-, trzy- i czterowyrazowe.
SK podaje się zwykle w pierwszym przypadku l. poj. W l. mn. zaleca się podawanie: rzeczowników o charakterze pluralia tantum, np. nożyczki; nazw roślin, rodów, grup związków chemicznych i minerałów, grup osób, np. Żydzi (ale nazwy grup zawodowych – w l. poj., np. górnik), nazw wyższych grup zwierząt, wyrażeń powszechnie stosowanych w l. mn., np. wody przybrzeżne.
Kolejność słów: a) w terminie: określona (rzeczownikprzymiotnik określający...), b) w opisie: dowolna.
Liczba słów: 8-15
Interpunkcja: rozdzielanie SK dowolnymi znakami interpunkcyjnymi.
23. Pojęcie i definicja terminu deskryptor.
jednostka leksykalna przejęta z języka naturalnego, stosowana w jiw.Jest to ciąg jedno lub wielowyrazowy bądz symbol,
Słownictwo deskryptorowe jest uporządkowane . Derskryptory tworzą tzw.artykuły deskryptorowe, które są alfabetycznie uporządkowane wg.deskryptora tytułowego
Artykuł deskryptorowy
Deskryptor tytułowy
DEF definicja
NU nie używaj
GD główny deskryptor
SD szerszy deskryptor
WD węższy deskryptor
KD kojarzeniowy deskryptor
24. Systemy gramatyczne JIW.
• Gramatyka pozycyjna – miejsce każdej jednostki leksykalnej jest w zdaniu informacyjnym ściśle ustalone, a jego zmiana powoduje zmianę znaczenia zdania
• Gramatyka o dowolnym szyku – miejsce każdej jednostki leksykalnej w zdaniu jest dowolne (inaczej: indeksowanie współrzędne)
• Gramatyka o typie pośrednim (częściowo pozycyjna) – miejsce samodzielnych elementarnych jednostek w zdaniu jest dowolne, a miejsce niesamodzielnych jednostek jest ściśle ustalone
25. Charakterystyka tezaurusa Petera Rougeta.
Petera Marca Rogeta Thesaurus of English Words and Phrases (Londyn 1852; do dziś ok. 100 wydań) i on to właśnie stał się wzorcem tezaurusa rozmumianego jako słownik pojęciowy.Tezaurus Rogeta pomyślany był jako narzędzie, które piszącym ułatwi znalezienie odpowiedniego słowa lub frazy wyrażającej określone pojęcie, określony sens. Tezaurus jako narzędzie wyszukiwania informacji ma indeksatorowi zapewnić wybór terminów, które najlepiej identyfikują pojęcia składające się na treść indeksowanego tekstu (dokumentu), a wyszukującemu – wybór terminów, za pomocą których najtrafniej wyrazi pojęcia składające się na temat, którego omówień szuka w systemie informacyjnym, co w konsekwencji powinno pozwolić mu wyodrębnić opisy tych omówień (dokumentów zawierających je) w zbiorze wyszukiwawczym systemu. W obu przypadkach wybór właściwego wyrażenia umożliwić ma prezentacja jego powiązań znaczeniowych z innymi wyrażeniami, czyli projekcja r e l a c y j n e j s t r u k t u r y j e g o p o l a s e m a n t y c z n e g o za pomocą artykułów słownikowych zawierających informacje o relacjach semantycznych, w które wchodzi wyrażenie hasłowe, oraz za pomocą pojęciowej organizacji leksyki, grupującej wyrażenia według kategorii semantycznych.
26. Wymagania formalne od słów kluczowych.
27. Pojęcie i definicja terminu tezaurus.
struktura językowa zbudowana z wykładników językowych znaczeń jakie można wyrazić w danym języku znajdujących się w słowniku
28. Systemy pragmatyczne JIW.
29. Podstawowe różnice między klasyfikacjami (opracowane w CERNIE)
30. Liczba słów kluczowych (ile?)
Liczba słów kluczowych nie jest limitowana i jest uzależniona jedynie od zakresu i wagi informacji zawartych w indeksowanym dokumencie; uzywa się ich tyle, by w pełni oddać treść dokumentu.
Liczba ta powinna jednak wynosić średnio 8-15 słów.
31. Tendencje rozwoju JIW na początku XXI wieku.
Dominacja paranaturalnych jiw i stopniowe eliminowanie ich sztuczności
• Tworzenie paranaturalnych języków opartych na więcej niż jednym języku naturalnym stanowiących narzędzia wielojęzycznego reprezentowania i przeszukiwania
zasobów informacyjnych
• Dążenie do zapewnienia kompatybilności jiw poprzez tworzenie specjalnych języków „pośredników”
• Upraszczanie struktur jiw
• Komercjalizacja utrzymywania i stosowania poszczególnych jiw
32. Język haseł przedmiotowych KABA.
Jednostki leksykalne jhp KABA
· tematy,
· określniki,
· tematy z prepozycją,
· określniki swobodne i związane,
· tematy i określniki rzeczowe,
· tematry i określniki lokalizujące (chronologiczne i geograficzne),
· tematy i określniki formy.
Szyk określników w zdaniu języka KABA:
[temat] – [określnik rzeczowy] – [określnik geograficzny] – [określnik chronologiczny] – [określnik formy]
Dla haseł z zakresu sztuk pięknych i literatury:
Po temacie pierwszeństwo mają określniki chronologiczne, jeżeli więc istnieje potrzeba dołączenia po określniku chronologicznym zarówno określnika rzeczowego, jak i geograficznego należy utworzyć dwa hasła przedmiotowe:
[temat] – [określnik chronologiczny] – [określnik rzeczowy]
oraz
[temat – [określnik chronologiczny] – [określnik geograficzny]
CECHY: JHP KABA posiada cechy charakterystyczne dla innych języków haseł przedmiotowych:
· notacja paranaturalna
Jednostki leksykalne mają formę wyrażeń równokształtnych z wyrażeniami języka naturalnego, tzn. że forma tematów i określników jest tożsama z formami języka naturalnego, jednak znaczenia tych jednostek nie zawsze są tożsame. Oznacza to, że spośród kilku znaczeń leksykalnych (słownikowych) wyrazu wybiera się tylko pewne (np. nieprzenośne, nieprzestarzałe, niedialektalne, jasne znaczeniowo, najbardziej znane, najbardziej rozpowszechnione w piśmiennictwie), które przejmuje się do słownictwa języka haseł przedmiotowych, nadając im odpowiednią formę.
· jednostki słownika nazywa się tematami i określnikami
Tematy i określniki są podstawą tworzenia zdań i tekstów w jhp, czyli haseł przedmiotowych, a następnie opisów przedmiotowych.
Tematy to wyrażenia autosyntaktyczne, mogące same stanowić zdania języka haseł przedmiotowych.
Określniki to wyrażenia synsyntaktyczne, które nie mogą same stanowić zdań w jhp; mogą one wystąpić w zdaniu tylko po temacie lub innym określniku.
· gramatykę stanowią reguły budowy haseł przedmiotowych, ich łączenia oraz transformacji
Temat jest elementem obowiązkowym hasła; hasło przedmiotowe składające się tylko z tematu jest hasłem prostym.
Hasło przedmiotowe rozwinięte składa się z tematu i określników.
Wspólną cechą jest też budowa hasła przedmiotowego rozwiniętego, w którym kategoria tematu występuje na pierwszym miejscu, a określniki na dalszych:
[Temat] - - [określnik rzeczowy] - - [określnik geograficzny] - - [określnik chronologiczny] - - [określnik formy]
· zakres słownictwa nieograniczony
JHP KABA wyróżnia się spośród innych języków następującymi cechami:
· struktura słownictwa dostosowana do katalogowania przedmiotowego wyszczególniającego
· kompatybilność z najbardziej znaczącymi i rozpowszechnionymi w świecie, językami haseł przedmiotowych:
a) Biblioteki Narodowej Francji – Répertoire d’Autorité-Matière Encyclopédique et Alphabétique Unfié – RAMEAU;
b) Biblioteki Kongresu w Waszyngtonie – Library of Congress Subject Headings – LCSH;
c) Biblioteki Universytetu Lavala (Québec) – Répertoire de vedettes-matière - RVM
· przekładalny na dwa języki RAMEAU i LCSH (możliwość półautomatycznego przekształcania haseł przedmiotowych;
· współtworzony przez współpracujące biblioteki akademickie w toku katalogowania przedmiotowego;
· leksyka prezentowana w formie kartoteki haseł wzorcowych, spójnej z kartoteką wzorcową haseł formalnych.
KARTOTEKA WZORCOWA JĘZYKA KABA
Podstawową jednostką kartoteki wzorcowej jest rekord khw. Rekord w formacie wymiennym MARC 21 składa się z etykiety rekordu, tablicy adresów i pól danych (pola stałej długości oraz pola zmiennej długości).
33. Pragmatyka ogólna języków słów kluczowych.
Pragmatyka języka słów kluczowych opiera się na indeksowaniu współrzędnym, przez które rozumie się charakteryzowanie treści dokumentów lub opis potrzeb informacyjnych za pomocą współrzędnych, niezależnych, dających się swobodnie zestawić elementarnych jednostek leksykalnych, przeważnie mających postać wyrazów i połączeń wyrazowych zaczerpniętych z języka naturalnego, nazwanych w przypadku jęz. słów kluczowych słowami kluczowymi. W ten sposób treść dokumentu podlega w procesie indeksowania dekompozycji na zbiór oddzielnych słów kluczowych. Słowa kluczowe tworzące charakterystykę wyszukiwawczą dokumentu lub instrukcję wyszukiwawczą zapytania traktowane są jako wzajemnie niezależne i równorzędne czyli współrzędne. Każda taka jednostka może pełnić funkcje klucza wyszukiwawczego, a więc staje się samodzielnym elementem wyszukiwawczym bez względu na jej pozycję w tekście. Jednostki te mogą się znajdować w dowolnym miejscu tekstu, a więc być wymieniane w dowolnej kolejności.
34. Pojęcie i definicja terminu klasyfikacja tematyczna.
jest to płytka klasyfikacja łącząca pokrewne dziedziny wiedzym służąca do porządkowania źródeł informacji o dokumentach, a więc całych zbiorów dokumentów pochodnych, nadrzędna w stosunku do języków informacyjno-wyszukiwawczych używanych w systemach informacyjno-wyszukiwawczych. Przykładem jest Polska Klasyfikacja Tematyczna
35. Makro i mikro tezaurusy.
MAKROTEZAURUS – w opozycji do mikrotezaurusa – tezaurus, którego pole semantyczne pozostaje w relacji nadrzędności z polami semantycznymi tezaurusów dziedzinowych. Najczęściej obejmuje uniwersum wiedzy lub kilku dziedzin.
MIKROTEZAURUS – w opozycji do makrotezaurusa – tezaurus specjalistyczny, którego pole semantyczne obejmuje tylko wąska dziedzinę wiedzy.
36. Języki cytowań bibliograficznych.
37. Pragmatyka szczegółowa języków słów kluczowych.
38. Pojęcie i definicja terminu syntagma.
fraza, grupa słów, gramatycznie i syntaktycznie powiązanych, które mogą stanowić część zdania (np. podmiot, przydawka, orzeczenie) lub też samodzielnie tworzą zdania oraz równoważniki zdań. Termin ten został wprowadzony przez Ferdinanda de Saussure.
Syntagma składa się ze słowa głównego i pozostałych elementów, które są jemu podporządkowane. Dla frazy nominalnej słowem głównym jest rzeczownik.
39. Systemy semantyczne JIW.
System semantyczny (pole semantyczne) jiw to struktura zbudowana ze znaczeń, jakie można wyrazić w danym języku za pomocą środków (relacji), którymi język ten dysponuje.
40. Języki syntagmatyczne – charakterystyka.
Języki syntagmatyczne charakteryzują się bardzo rozwiniętymi relacjami syntagmatycznymi (składniowymi) co nadaje im dużą zdolność do precyzyjnego opisu treści dokumentów. Przykład: francuski język SYNTOL
SYNTOL(Syntagmatic Organization Language), powstał w Paryżu w 1960-62. Jego twórcą był J.C.Gardin, który zbudował dla systemu EURATOM dla CNRS;
podstawową zasadą syntolu jest wyodrębnienie syntagm, czyli elementarnych jednostek leksykalnych składni
słownictwo : deskryptory lub słowa kluczowe i delatory;
deskryptory wyrażone za pomocą notacji para naturalnej, delatory za pomocą notacji sztucznej;
słownik : tezaurus lub wykaz słów kluczowych bądź relatorów
41. Pole znaczeniowe słowa kluczowego (książka B.)
42. Pojęcie i definicja terminu rubrykator.
płytka klasyfikacja specjalnego zastosowania, tworzona do porządkowania żródeł informacji o dokumentach, do wymiany informacji między systemami i sieciami informacyjnymi. Związane z tworzeniem wielkich systemów informacyjnych o zasięgu międzynarodowym lub ogólnokrajowym (UNISIST - BSO, SINTO - PKT)
43. Struktura JIW (elementy).
44. Języki metadanych.
45. Języki słów kluczowych a języki deskryptorowe.
Cechy wspólne:
- korzystają ze słownictwa jęz. naturalnych
- wykorzystują reguły indeksowania współrzędnego.
Różnice:
- rodzaj uporządkowania
- stopień kontroli słownictwa
Języki deskryptorowe maja słownictwo w pełni kontrolowane i uporządkowane.
Jednostki leksykalne jęz. słów kluczowych w zasadzie są swobodne, tj. kontrolowane tylko do pewnego stopnia.
46. Typologie JIW.
47. Języki informacyjne prostych systemów faktograficznych. (ma tego nie być)
Języki systemów faktograficznych to JIW stosowane w systemach dokumentacyjnych, ekspertowych, multimedialnych, hipertekstowych, faktograficznych. Języki te opisują obiekty, przedmioty, fakty, osoby. Odsyłają one bezpośrednio identyfikują obiekt (dokument) i informują o nim. Systemy faktograficzne dzielą się na: dedukcyjne i nie dedukcyjne. Dedukcyjne oparte są na wnioskowaniu, nie dedukcyjne natomiast, głównie na porównywaniu.
Informacja faktograficzna
informacja jednostkowa o jakimś obiekcie istniejącym w rzeczywistości, stwierdzająca lub potwierdzająca pewne cechy;
informacja w postaci liczbowej, opisowej, graficznej;
elementy inf. faktograficznej :
Obiekt – cecha – wartość/parametr np.,
CZŁOWIEK [OBIEKT] →WIEK, WZROST, WAGA, KOLOR OCZU [CECHY]
48. Słowo kluczowe w nauce o informacji.
W nauce o informacji można odróżnić trzy odmienne podejścia do słów kluczowych:
1. Odrębność w stosunku do wyrażeń jęz. naturalnego. System leksykalny sztucznego języka słów kluczowych stanowi kontekst słów kluczowych.
2. Akceptacja bezpośrednich związków integracyjnych z jęz. naturalnym. Język naturalny nadaje kontekst słowom kluczowym.
3. System leksykalny jęz. słów kluczowych stanowi kontekst poszczególnych słów kluczowych, zaś jęz. naturalny uzupełnia deficyty tego kontekstu.
49. Pojęcie i definicja terminu kod semantyczny.
Języki, których słowniki zawierają stosunkowo nieliczną grupę słownictwa(słownictwo odpowiada ogólnym pojęciom, są maksymalnie redukowane, zawierają tylko kilkadziesiąt najogólniejszych pojęć-nazywa się je prymitywami lub mnożnikami semantycznymi);
Są pozbawione synonimii i homonimii,
Jednostki tych języków – symbole - pełnią funkcje leksykalne i gramatyczne;
Jest to grupa języków, w których rozwinięto relacje paradygmatyczne; przykładem jest kod semantyczny Perry’ego i Kenta
50. Indeksowanie automatyczne – charakterystyka i rodzaje.
Trzy metody automatycznego indeksowania dokumentów
1. Indeksowanie statystyczne – metody wykorzystujące statystyczne właściwości wyrazów lub wyrażeń występujących w tekście dokumentu w aspekcie danego dokumentu lub całego dokumentu.
2. Indeksowanie probabilistyczne – Metody wykorzystujące rachunek prawdopodobieństwa w celu określenia prawdopodobieństwa wyszukania dokumentu relewantnego
Oraz wykorzystujące rozkłady części terminów w celu określenia tego prawdopodobieństwa
3. Indeksowanie lingwistyczne – metody wykorzystujące automatyczną analizę językową w celu wyróżnień informacyjnie ważnych, znaczących dla jego treści
51. Języki deskryptorowe a klasyfikacje fasetowe.
J.DESKRYPTOROWE to klasa JIW, w których słownictwo pochodzi z języka naturalnego a gramatyka są reguły indeksowania współrzędnego.
Słownictwo stanowią jednostki leksykalne przejęte z języka naturalnego wyrażone za pomocą rotacji paranaturalnej;są to:deskryptory(mogą występować samodzielnie) oraz ewentualne identyfikatory, modyfikatory, wskaźniki roli, więzi, wagi, relatory(mogą występować jako paranaturalne słownictwo pomocnicze).
Słownik = tezaurus (słownik przekładowy; uporządkowany alfabetycznie i semantycznie; kontrolowany-zawiera jednostki leksykalne przyjęte i odrzucone:deskryptory i askryptory).
Gramatyka: indeksowanie współrzędne, dla słownictwa pomocniczego-częściowo pozycyjna, deskryptory traktowane są równorzędnie, oddzielone wybranymi znakami przestankowymi, dokument może otrzymać od kilku do kilkunastu deskryptorów.
KLASYFIKACJE FASETOWE są najnowszym rodzajem klasyfikacji, opierają się na relacjach hierarchicznych; na jednym stopniu podziału stosuje się w nich wiele zasad podziału. Wzorem dla tych klasyfikacji jest Klasyfikacja Dwukropkowa.
Słownictwo: symbole klasyfikacyjne (wyrażone za pomocą notacji sztucznej, kontrolowane)
Słownik: tablice klasyfikacyjne (słownik przekładowy, uporządkowany semantycznie na podstawie relacji hierarchicznych,wyposażony w sieć odsyłaczy)
KF umożliwiają idneksowanie wieloaspektowe i ułatwiają gromadzenie w jednym m-scu jakiegoś tematu lub przedmiotu; łatwo wprowadzać do nich nowe terminy (fokusy)
Gramatyka: reguły budowy symboli klasyfikacyjnych, pojęć, tematów i dokumentów
52. Pojęcie i definicja terminu pragmatyka.
Pragmatyka JIW - to dziedzina teorii JIW, która zajmuje się problemami posługiwania się i stosowania poszczególnych JIW
dział teorii JIW, zajmująscy się problemami dotyczącymi użytkowania, posługiwania się i wykorzystania JIW w indeksowaniu i wyszukiwaniu informacji.
Pragmatyka dotyczy zasad poprawnego użycia języka.
53. Systemy relacyjne JIW.
SYSTEMY RELACYJNE – między jednostkami leksykalnymi zachodzą relacje, czyli związki pewne, które mogą zachodzić pomiędzy przedmiotami, ludźmi, np. pokrewieństwo. W JIW relacje to związki zachodzące pomiędzy jednostkami leksykalnymi w słowniku i/lub w tekście.
Relacje mogą być:
- pozajęzykowe np.: pokrewieństwo, odległości między planetami - językowe, znajdujące się w kontekście, w tekście lub słowniku miedzy wyrazami.
Relacje w JIW wyrażają bezpośrednio związki pomiędzy klasami dokumentów, którymi nazwami SA klasy dokumentów. Relacje te odwzorowują związki między terminami.
TERMIN – jest to wyraz, nazwa o ściśle określonym znaczeniu.
W zależności od miejsca występowania wyróżniamy dwa typy relacji:
PARADYGMATYCZNE - słownikowe (występujące w słownikach), relacje w jakich pozostają wobec siebie jednostki leksykalne zarejestrowane w danym słowniku(rel. nadrzędności, podrzędności, równoznaczności, kojarzeniowa)
SYNTAGMATYCZNE - tekstowe (występujące w tekście) reacje, w jakich pozostają wobec siebie jednostki leksykalne w charakterystyce wyszukiwawczej dokumentu (symbol główny, symbol pomocniczy, temat, określnik)
RELACJE PARADYGMATYCZNE:
Relacje synonimii wyszukiwanej
Relacje hierarchiczne
Relacje generyczne (określają rodzaj, gatunek)
Relacje mereologiczne
Relacje hierarchii tematycznej
Relacje współrzędności
Relacje kojarzeniowe
54. Języki haseł przedmiotowych a języki deskryptorowe.
Języki deskryptorowe | Języki Haseł Przedmiotowych |
---|---|
· Kartoteka Haseł Wzorcowych · KABA · JHP Biblioteki Narodowej |
|
Słownictwo paranaturalne lub mieszane | Słownictwo paranatuarlne |
· Tezaurus (słownictwo kontrolowane) Istnieją tezaurusy filologiczne lub terminologii translatoryjnej oraz dokumentacyjne. | · Słownictwo ujęte w kartoteki haseł wzorcowych i kartoteki haseł formalnych (??) |
· Deskryptory · Askryptory · Kwantyfikatory |
· Hasła Przedmiotowe składające się z tematów i określników |
Wszystkie typy relacji | |
· Częściowo – pozycyjna · Niepozycyjna |
· Pozycyjna |
Systemy informacyjno – wyszukiwawcze. | W katalogach bibliotecznych, dotyczy wszystkich dziedzin wiedzy, jak np. UKD |
Polska Norma Tezaurusa, jednojęzyczny, zasady tworzenia, forma, struktura | NUKAT ?? |
55. Słowa kluczowe w wyszukiwarkach internetowych.
W systemie www słowo kluczowe to „ słowo lub wyrażenie umieszczane w kodzie HTML strony internetowej w celu jego umieszczenia/ zaindeksowania w bazie danych wyszukiwarki internetowej w odpowiedniej kategorii tematycznej”. Używane w Internecie słowa kluczowe to jednostki leksykalne jęz. naturalnego, służące do opisu i wyszukiwania informacji.
Dostępne w sieci zbiory słów kluczowych maja postać:
- słowników tradycyjnych w statycznym formacie tekstowym
- słowników w formacie HTML, ale nadal statycznych, bez aktywnych hiperłączy
- słowników w formacie HTML dynamicznych, z pełnymi możliwościami nawigowania za pomocą hiperłączy
- słowników z zaawansowanym interfejsem graficznym i wizualną prezentacją informacji
- słowników w formacie XML
Charakterystyczną cechą słów kluczowych w Internecie, a także w ogóle jest ich nieostrość oraz różnorodność kryteriów derywacji. Pozwala to na tworzenie wielu punktów dostępu w procesie indeksowania informacji, co obecnie uważa się za źródło siły wyszukiwawczej Internetu, chociaż często prowadzi do szumu lub ciszy informacyjnej.
56. Relacje hierarchiczne w JIW.
Klasę relacji hierarchicznych tworzą trzy podstawowe typy:
- relacje generyczne - związek hierarchiczny zachodzący pomiędzy nazwą gatunkową i nazwą rodzajową ( relacja podrzędności generycznej) lub między nazwą rodzajową i nazwą gatunkową ( relacja nadrzędności generycznej).
- relacje mereologiczne - zachodzące pomiędzy nazwami pewnych całości a nazwami ich części i odwrotnie.
- relacje hierarchii tematycznej ( dokumentacyjnej) - między wyrażeniami reprezentującymi pewne dyscypliny wiedzy, określane jako tematy szersze, a wyrażeniami reprezentującymi pewne obiekty lub problemy badawcze tych dyscyplin, określanymi jako tematy węższe.
57. Klasyfikacje tematyczne – charakterystyka i rodzaje.
58. Słowo kluczowe a fraza kluczowa.
59. Pojęcie i definicja terminu słownik mentalny.
SŁOWNIK MENTALNY (słownik/leksykon umysłowy)
Magazyn i miejsce procesów pamięciowych oraz procesów produkcji i odbioru tekstów języka informacyjno-wyszukiwawczego.
Analiza struktury organizacji informacji leksykalnej w umyśle człowieka wymaga odwołania się do badań psychologicznych i osiągnięć nauk poznawczych. Umysł posiada umiejętność odzwierciedlania tego, co istotne w zjawiskach świata poznawanego przez człowieka. Najbliższe poglądom współczesnej psychologii poznawczej jest stanowisko, że człowiek aktywnie uczestniczy w konstruowaniu obrazu rzeczywistości, posługując się danymi, których dostarcza mu doświadczenie. To, co człowiek ma w umyśle, stanowi zapis informacyjny zdeterminowany jednak przez reguły rządzące ludzkim systemem poznawczym. Zapis ten jest odpowiednio zorganizowany i utrwalony w pamięci. Rodzi się więc pytanie, w jaki sposób taki zapis powstaje i jaki jest sposób jego organizacji.
Dwa nurty współczesnych badań nad tym zagadnieniem:
- paradygmat neuropsychologiczny: podkreśla funkcjonalny aspekt procesów pamięciowych
- paradygmat teorioinformacyjny: podkreśla aspekt strukturalny, skupia się na modelu logicznego lub asocjacyjnego zapisu wiedzy
Słownik umysłowy jest układem poznawczym, którego zadaniem jest identyfikowanie znaczenia percypowanych bodźców werbalnych. Obiektami informacji zawartej w słowniku są leksemy, stanowiące fragment wiedzy językowej dotyczącej leksyki i reguł jej funkcjonowania. Zadaniem słownika umysłowego jest ustalenie struktury semicznej leksemu, przez którą rozumie się charakterystyczny dla niego zespół dystynktywnych cech semantycznych.
Podstawę budowy słownika stanowią dwa rodzaje wiedzy: nie jestem pewna czy o to właściwie chodzi, bo trudno odnaleźć sens w gąszczu specjalistycznych terminów i specyficznego języka autora Słów kluczowych, ale te pojęcia na pewno występują w związku z budową, strukturą słownika mentalnego
- językowa, na którą składają się: kompetencja językowa (abstrakcyjna zdolność posługiwania się językiem), kompetencja komunikacyjna (umiejętność użycia języka odpowiednio do zamierzeń nadawcy), wiedza o pozostałych elementach układu komunikacyjnego
- pozajęzykowa: konceptualizacja świata wyrażona za pomocą odpowiedniego systemu kategorii pojęciowych i zachodzących miedzy nimi relacji
60. Relacje syntagmatyczne w JIW (wskaźniki roli, wagi, itd.)
Relacja syntagmatyczna - relacja między wyrażeniami prostymi w strukturze wyrażenia złożonego ;
W JIW wyróżnia się
syntagmatyczne relacje współwystępowania odpowiadające znaczeniem spójnikowi “i “
syntagmatyczne relacje zależności semantycznej specyfikowanej lub niespecyfikowanej odpowiadającej znaczeniem takim spójnikom jak “a” “wobec” itd
Wykładnikami tych relacji są :
1.Znaki łączące, jak w UKD : ; :: + / - itp
2.Wskaźniki więzi – pokazują, które elementy w opisie (słowa kluczowe) są ze sobą połączone, np.: RURY/1àMIEDŹ/2 àDACH/2 àOŁÓW/1
Są to wykładniki językowe łączące elementy wyszukiwawcze, które oddają właściwy sens zdania. Akurat to zdanie mówi, że szukamy czegoś na temat ołowianych rur i miedzianych dachów, a nie odwrotnie J
3. Wskaźniki roli
4. Wskaźniki wagi (współczynniki wagowe)– wykładniki językowe wskazujące na znaczenie danego zagadnienia w ramach danego dokumentu, np. przekreślone zero „Ø”, wskazuje, że warto zwrócić uwagę na dany artykuł lub pozycję.
5. Algebra BOOle`a
Relacje syntagmatyczne (w zdaniach, występujące między elementami tekstu) możemy wyrażać w językach w dwa sposoby - symbol prosty i symbol złożony (łączony plusem, dwukropkiem, ukośnikiem - w klasyfikacjach jak UKD). W języku haseł przedmiotowych do tych relacji służy myślnik. W języku deskryptorowym będą to wskaźniki roli, wskaźniki wagi i wskaźniki więzi. W języku słów kluczowych generalnie nie ma takich relacji (bo jest indeksowanie współrzędne - nie pokazuje relacji syntagmatycznych
61. UKD.
UKD (Uniwersalna Klasyfikacja Dziesiętna) jest modyfikacją Klasyfikacji Dziesiętnej Melvila Deweya) dokonaną przez dwóch prawników belgijskich: Paula Otleta i Henriego La Fontaine’a w latach 1897-1905. Twórcy UKD przejęli bez zasadniczych zmian schemat KDD, natomiast znacznie rozbudowali poddziały pomocnicze i wprowadzili możliwość tworzenia symboli złożonych. Została zmieniona gramatyka, która zasadniczo odróżniała KDD od UKD. W roku 1905 Międzynarodowy Instytut Bibliograficzny wydał tablice tej klasyfikacji po raz pierwszy. UKD zyskała szerokie zastosowanie w bibliotekach na całym świecie, a jej tablice publikowane są w 23 językach. Właścicielem praw autorskich do UKD jest FID (The International Federation for Information and Documentation). Tablice UKD wydawane są w pięciu wariantach, które mają zadowalać szeroki krąg użytkowników:
- wydanie pełne;
- wydanie pośrednie;
- wydanie skrócone;
- wydanie bardzo skrócone;
- wydanie specjalne.
UKD oparta jest na systemie dziesiętnym. Charakteryzuje się ona porządkowaniem cyfr w kolejności ułamków dziesiętnych, a nie liczb naturalnych, oraz rozbudową „wszerz” jednej klasy ograniczoną do 10, ponieważ z jednego symbolu można utworzyc tylko 10 równorzędnych. W UKD zaniechano stosowania trzycyfrowego minimum – dopisywania zer na końcu symbolu tak jak w KDD, wprowadzono natomiast oddzielanie grup trzycyfrowych kropką, ułatwiającą odczytywanie i zapisywanie symbolu. Zasadniczy trzon klasyfikacji stanowią tablice główne. Każdy z głównych działów dzieli się na 10 dalszych. Występuje rozbudowa pozioma „wszerz” – w szeregu i pionowa „w głąb” – w łańcuchu
zasady budowy symboli złożonych w UKD
Symbol złożony powstaje w wyniku zestawienia symboli prostych (nierozwiniętych) i/lub symboli rozwiniętych za pomocą znaków łączących (symboli łączących). W UKD stosowane są następujące znaki łączące:
+ (znak plus)
/ (kreska ukośna)
: (dwukropek)
:: (podwójny dwukropek)
[ ] (nawias kwadratowy)
Znaki + i / służą do łączenia symboli oznaczających pojęcia równorzędne i nie powiązane żadnymi lub powiązane bardzo luźnymi relacjami. Plus łączy symbole niekolejne, a kreska ukośna kolejne (jest to skrócony zapis symboli z plusem).
Znak : stosuje się dla oznaczania relacji między pojęciami. Symbole są odwracalne. Dwukropek zawęża zakres pojęcia znakowanego pierwszym symbolem.
Wskaźnik :: wyznacza stałą kolejność elementów w symbolu złożonym (nie może podlegać inwersji). W ten sposób można tworzyć nowe symbole, brakujące w tablicach.
Wskaźnik [ ] przeznaczony jest do grupowania symboli prostych i/lub rozwiniętych, połączonych znakiem plus lub dwukropkiem, które pozostają w pewnej relacji do symboli znajdujących się za nawiasem. Nawias pełni rolę analogiczną jak w zapisie algebraicznym.
62. Słowa kluczowe w systemach hipertekstowych i hipermedialnych (służą jako oznaczenia węzłów)
63. Pojęcie i definicja terminu kod.
Kod (łac. codex – spis) – ciąg składników sygnału (kombinacji sygnałów elementarnych, np. kropek i kresek, impulsów prądu, symboli) oraz reguła ich przyporządkowania składnikom wiadomości (np. znakom pisma). W niektórych zastosowaniach, głównie przy przesyłaniu informacji podlegających utajnieniu, zwany jest szyfrem. Kody są stosowane m.in. w telegrafii, w technice cyfrowej.
W semiotyce kod to system znaków. Wyróżnia się m.in. kody otwarte i zamknięte.
W teorii informacji kod to reguła, według której informacjom cyfrowym k-wymiarowym zwanym też informacjami pierwotnymi (źródłowymi) lub ciągami informacyjnymi złożonymi z informacji elementarnych xij,j = 1,2...k przyporządkowane są ciągi kodowe n-wymiarowe , czyli sygnały złożone z n sygnałów elementarnych , przy czym n > k.
Przykłady kodów
Kod Aikena
Kod ASCII [aski] (ang. American Standard Code for Information Interchange) - przypisujący 7 bitowej liczbie (128 kombinacji) znaki pisarskie
kod bajtowy
Kod Baudot
Kod bezpieczeństwa - składa się z liter IP i dwóch do czterech znaków, z których pierwszy oznacza odporność na penetrację ciał stałych, a drugi na penetrację wody
kod binarny i kod Graya
Kod EBCDIC (ang. Extended Binary Coded Decimal Interchange Code) - rozszerzony dziesiętny zakodowany dwójkowo kod wymiany
kod genetyczny
Kod Golda
kod Hamminga
Kod Huffmana, tj. optymalny (najkrótszy) kod prefiksowy otrzymany za pomocą algorytmu Huffmana
kod językowy
kod kreskowy
Kod lotniska IATA – trzyliterowy kod alfanumeryczny, służący do oznaczania portów lotniczych
Kod lotniska ICAO (ang. Location Indicator) – powszechnie używana nazwa czteroliterowego tzw. wskaźnika lokalizacji
Kod Morse'a
Kod NATO (ang. NATO reporting names)
kod pocztowy
Kod PUK (ang. Personal Unblocking Key) - ośmiocyfrowy kod umożliwiający odblokowanie karty SIM używanej w telefonie komórkowym
kod Q
kod samochodowy
kod samolotowy
kod splotowy
Kod Towarowy EAN (ang. European Article Number)
Unicode
Kod zamknięty - jednoklasowy system znaków, do którego nie można wprowadzać nowych elementów
64. Język a kod.
KOD – może mieć taką samą strukturę jak język. Reguły kodu nie są jawne dla wszystkich tylko, dla pewnej grupy użytkowników. Pewnym rodzajem kodu są piktogramy oraz ideogramy. Przykłady: @, $, § itp. W JIW informacje są zapisywane za pomocą kodu.
język a szyfr
JĘZYK - Zespół społecznie wytworzonych i obowiązujących znaków dźwiękowych (wtórnie pisanych) oraz reguł określających ich użycie, funkcjonujący jako narzędzie komunikacji społecznej. Podstawową funkcją języka jest przedstawienie, czyli zastępowanie za pomocą umownych znaków zjawisk świata obiektywnego.
System znaków złożonych ze słownika i gramatyki tj. zbioru znaków oraz zbioru reguł posługiwania się nimi w komunikacji
SZYFR – jest rodzajem kodu, służy do zapisu treści umownymi znakami Treść przekazywana za pomocą szyfru jest utajone. Informacje są utajone. Do rozbijania szyfru służy szyfrarka.
65. Podobieństwa i różnice między systemami gramatycznymi opracowanymi przez Ścibora i Bojar.
Gramatyka odnosi się do 5 poziomów JIW. Zarówno do elementarnych jednostek leksykalnych jak i tekstu.
SYSTEM GRAMATYCZNY – jest to zbiór zasad dla każdego poziomu, określające struktury języka, które połączenia wyrażeń, przyjmuje się za wyrażenia danego języka.
1. System gramatyczny według E. Ścibora (nie jest jego twórcą, tylko go omówił w na początku l. 80’)
2. System gramatyczny B. Bojar.
Ad. 1 E. Ścibor wymienił 4 rodzaje gramatyki:
Zerowa – charakterystyczna dla języków, które posługują się jedną zasadą „o niedołączaniu”. Nie jest tu możliwe żadne połączenie wyrażeń elementarnych, nie ma tu wyrażeń złożonych. Istnieją natomiast zdania elementarne, składające się z jednej elementarnej jednostki, to znaczy, że status EJL zmienia się na zdanie w JIW. Ten typ gramatyki stosuje się w klasyfikacji wyliczającej.
Pozycyjna – charakterystyczna dla JIW, w których miejsce elementarnej jednostki leksykalnej jest ściśle ustalone. Zmiana miejsca położenia elementarnych jednostek leksykalnych powoduje zmianę znaczenia całego zdania. Stosowana jest w klasycznych językach haseł przedmiotowych i Dwukropkowej Hierarchii Ranganathana. Przykłady: filozofia-historia ( to znaczy historia filozofii), historia-filozofia (historiozofia, filozofia historii, jak rozwija się historia).
Częściowo-pozycyjna – występuje w tych językach, w których miejsce autosyntaktycznych jednostek leksykalnych jest dowolne, a synsyntaktycznych jest niezmienne. Gramatyka ta wykorzystuje wskaźniki roli, więzi, modyfikatory lub deskryptory aspektowe. Ten typ gramatyki stosowany jest m.in. w językach deskryptorowych.
Nie pozycyjna – jest to gramatyka opozycyjna do gramatyki pozycyjnej. Jest stosowana w JIW gdzie jednostki leksykalne są ułożone w dowolnej kolejności. Losowa kolejność występowania EJL w obrębie zdania jest istotą indeksowania współrzędnego. Jest stosowana w klasycznych językach słów kluczowych.
Ad. 2 B. Bojar wymieniła 4 rodzaje gramatyki:
Zerowa – brak jest wykładników relacji syntagmatycznych. Wykładnikami tymi są: wskaźnik więzi, roli, wagi i algebra Boole’a, w związku z tym kolejność wyrażeń elementarnych w zdaniu JIW jest dowolna. Gramatyka stosowana w językach słów kluczowych i językach deskryptorowych bez wykładników relacji syntagmatycznych.
Pozycyjna – jest stosowana w JIW, w których relacje syntagmatyczne są wyznaczone przez pozycje wyrażeń elementarnych w wyrażeniu złożonym. Ten typ gramatyki jest stosowany gdy wykładnikami relacji syntagmatycznych są wskaźniki roli np. w niektórych językach deskryptorowych, językach haseł przedmiotowych lub wskaźniki przynależności jak np. w Dwukrokowej Hierarchii Ranganathana.
Częściowo-pozycyjna – stosowana gdy niektóre pozycje elementarnych jednostek leksykalnych w wyrażeniu złożonym, pełnią funkcję relacji syntagmatycznych. Stosowana np. w językach deskryptorowych, w których modyfikatory znajduje się po deskryptorze.
Nie pozycyjna – jest stosowana w JIW, w których wykładniki relacji syntagmatycznych mają inny charakter niż pozycja wyrażenia elementarnego w wyrażeniu złożonym. Kolejność wyrażeń może być dowolna ale nie musi.
66. Główne kierunki rozwoju klasyfikacji fasetowych.
67. Słowa kluczowe w literaturoznawstwie nazywamy?
słowa klucze – słowa o ponadprzeciętnej częstotliwości występowania w tekście
68. Pojęcie i definicja terminu uniterm.
1) elementarna jednostka leksykalna JIW opracowanego przez amerykańskiego logika
M. Taubego w 1951 r. Unitermy są wyrażeniami semantycznie prostymi reprezentowanymi przez wyrazy języka naturalnego
2) nazwa własna języka inf. - wysz. opracowanego przez M. Taubego, którego słownik tworzą unitermy, a gramatykę reguły indeksowania współrzędnego
69. Typy słowników i ich zastosowanie.
TYPY SŁOWNIKÓW
1. Słowniki wyliczające Elementarne Jednostki Leksykalne.
2. Słowniki zawierające zdania w danym języku.
3. Słowniki negatywne –„STOP LISTA” zbiory wyrazów, których nie wolno używać np. słownik wulgaryzmów
Rodzaje uporządkowania EJL:
1. Losowe, przypadkowe, (ale tak nie powinno być)
2. Formalne, np. według alfabetu
3. Semantyczne (według znaczenia, np. czasopisma podzielone na dzienniki, tygodniki, miesięczniki itd.).
4. Mieszany (np. alfabetyczno-semantycznie)
Tablice klasyfikacyjne
Alfabetyczny wykaz tematów i określników
Alfabetyczny wykaz słów kluczowych
70. Definicja terminu taksonomia.
- jest szczególnym rodzajem klasyfikacji
Taksonomia (gr. taksis - układ, porządek + nomos - prawo) – poddyscyplina systematyki nauka o zasadach i metodach klasyfikowania, w szczególności o tworzeniu i opisywaniu jednostek systematycznych (taksonów) i włączaniu ich w układ kategorii taksonomicznych
Niekiedy słowem tym określa się określony podział (układ) systematyczny danej grupy organizmów. Termin "taksonomia" – początkowo zdefiniowany przez De Candolle'a (1813) jako nauka o teorii klasyfikacji organizmów – jest bliskoznaczny do terminu systematyka, który w pierwotnej definicji odnosił się do zastosowań praktycznych tej klasyfikacji. W 1969 Ernst Mayr zdefiniował taksonomię jako teorię i praktykę klasyfikacji. Niektórzy naukowcy synonimizują terminy "taksonomia" i "systematyka
taksonomia fenetyczna – opierająca się na relacjach podobieństwa między klasyfikowanymi obiektami.
taksonomia filogenetyczna – opierająca się na relacjach pokrewieństwa klasyfikowanych obiektów.
Metody taksonomii fenetycznej można zastosować wszędzie tam, gdzie można stosować metody statystyczne np. w biologii, medycynie, naukach społecznych.
Metody taksonomii filogenetycznej mogą być stosowane tylko do takich obiektów, dla których możliwe jest zdefiniowanie relacji pokrewieństwa. Są to przede wszystkim organizmy żywe oraz ich geny, ale mogą też być memy lub ogólniej zbiory replikatorów, np języki. Metody filogenetyczne stosowane są w informatyce do analizy wyników działania algorytmów genetycznych.
71. Klasyfikacja dwukropkowa Ranganathana.
Klasyfikacja dwukropkowa (Colon Classification) – klasyfikacja stworzona w 1933 r. przez Shiyali Ramamrita Ranganathana, profesora katedry księgoznawstwa w Delhi. Nazwa tej klasyfikacji pochodzi od dwukropka, będącego jedynym elementem łączącym symbole w pierwszej wersji KD. Ówczesna wersja obejmowała 32 działy główne ułożone wg ewolucyjnej koncepcji wiedzy od nauk przyrodniczych począwszy a skończywszy na naukach społecznych. Druga wersja, uzupełniona i zmieniona, ukazała się w latach 50. XX w. wprowadzając już 42 następujące działy:
z Generalia
1 Wiedza ogólnie
2 Bibliotekarstwo
3 Nauka o książce
4 Dziennikarstwo
A Nauki przyrodnicze
AZ Nauki matematyczne
B Matematyka
BZ Nauki fizyczne
C Fizyka
D Inżynieria
E Chemia
F Technologia
G Biologia
H Geologia
HZ Górnictwo
I Botanika
J Rolnictwo
K Zoologia
KZ Hodowla zwierząt
L Medycyna
LZ Farmakognozja
M Nauki stosowane
Doświadczenia duchowe i mistycyzm
MZ Nauki humanistyczne i społeczne
MZA Nauki humanistyczne
N Sztuki piękne
NX Literatura i język
O Literatura
P Językoznawstwo
Q Religia
R Filozofia
S Psychologia
Nauki społeczne
T Wychowanie
U Geografia
V Historia
W Nauki polityczne
X Ekonomika
Y Socjologia
YX Praca społeczna
Z Prawo
KD jest pierwszą klasyfikacją fasetową (o strukturze polihierarchicznej), jedyną wśród klasyfikacji uniwersalnych. Oprócz podziału treści piśmiennictwa według klas głównych opartych na klasyfikacji nauk, wprowadza drugi podział na pięć kategorii ontologicznych pojęć szczegółowych (zwanych izolatami) składających się na tematy dokumentów:
* P – Personality (Indywiduum): kategoria oznaczająca pojęcia posiadające cechy indywidualne, oznaczana przecinkiem (,)
* M – Matter (Materia): kategoria materiału i własności, oznaczana średnikiem (;)
* E – Energy (Energia): kategoria procesów i działań, oznaczana dwukropkiem (:)
* S – Space (Przestrzeń)
do tej pory opracowano 7 wersji; trwają prace nad ósmą
72. Systemy notacyjne.
System notacyjny to baza notacyjna ( alfabet) + reguły notacyjne.
Baza notacyjna - zbiór elementarnych znaków graficznych (EGZ), za pomocą których tworzone są wyrażenia JIW.
Reguły notacyjne - zasady łączenia EGZ w ciągi (rzadziej w ukł. jukstapozycyjne) stanowiące elementarne jednostki leksykalne JIW.
73. JIW stosowane w systemie WWW.
Najważniejszym językiem informacyjno-wyszukiwawczym stosowanym na całym świecie do charakteryzowania dokumentów z zakresu medycyny i nauk pokrewnych jest Medical Subject Headings - MeSH, tworzony w oryginalnej anglojęzycznej wersji przez National Library of Medicine w Waszyngtonie.
Polskie biblioteki medyczne stworzyły i na bieżąco aktualizują polską wersję MeSH. Dzięki temu, przy poszukiwaniu informacji, polscy użytkownicy mogą korzystać ze Słownika terminów medycznych MeSH dostępnego ze strony BG GUMed
Słownik Mesh
ułatwia wyszukiwanie informacji w bazach i katalogach medycznych, może być również pomocny w doborze słów kluczowych zamieszczanych przy publikacjach w czasopismach naukowych.
Wyszukiwanie możliwe jest według terminów polskich, angielskich i łacińskich.
Jako wynik otrzymujemy:
brzmienie hasła w tych językach
*
definicję poszukiwanego hasła w języku angielskim
*
sugestię terminów, jakich nie należy stosować – odsyłacze
*
informację o zakresie stosowania danego hasła
* sugestię terminów powiązanych z hasłem głównym – zobacz też
74. Pole semantyczne języka słów kluczowych a języka naturalnego (książka B.)
75. Klasyfikacje fasetowe w Polsce – kto stworzył?
tworzył Ścibor ??
Klasyfikacje fasetowe (polihierarchiczne) – na jednym stopniu podziału można stosować wiele zasad podziału, co nie pozwala na uporządkowanie wyodrębnionych w ten sposób klas w jedno drzewo klasyfikacyjne
Faseta – zbiór klas, wyodrębniony według jednej zasady podziału i uporządkowanych według relacji generycznej. Fasety mogą być grupowane w kategorie, nazywane są dlatego podkategoriami.
Klasyfikacja nauk dzieli dziedziny, klasyfikacja piśmiennictwa – literaturę.
Klasa macierzysta: Krzesło:
· Krzesła obrotowe
o Materiałowe
§ Skórzane
§ Lniane
§ Itd.
Klasa węzłowa to klasa która dzieli się na następne klasy
Klasyfikacje stosowane już było w Bibliotece Assurbanipala
76. Pojęcie i definicja performatywna funkcja w językach naturalnych.
77. Funkcje pochodne JIW.
78. Wzory strukturalno-metodyczne opracowania tezaurusów (2 normy)
79. Pojęcie i definicja terminu szyfr.
inaczej kryptograficzny algorytm szyfrujący jest to funkcja matematyczna wykorzystywana do szyfrowania jawnego lub do jego deszyfrowania .Zazwyczaj jedna funkcja urzywana jest do szyfrowaniaa inna wykorzystywana jest do deszyfrowania.Wiadomość przed zaszyfrowaniem to tekst jawny a po zaszyfrowaniu szyfrogramem
Szyfry historyczne musiały umożliwiać szyfrowanie i deszyfrowanie przez człowieka, a więc opierać się na bardzo prostych operacjach. Współczesne komputery są o kilkanaście rzędów wielkości szybsze w obliczeniach od ludzi i potrafią złamać praktycznie każdy tego typu szyfr. Istnieją jednak przykłady szyfrów, które są możliwe do stosowania przez człowieka bez użycia komputerów i zapewniają pewien sensowny poziom bezpieczeństwa. Warto zwrócić uwagę na fakt, że zwykle siatka szpiegowska w obcym kraju może mieć utrudniony dostęp do sprzętu komputerowego, nadal jednak musi być w stanie przesyłać bezpiecznie zaszyfrowane wiadomości. Przykład szyfru o omawianych własnościach stanowi szyfr one time pad, szyfry podstawieniowe dla krótkich wiadomości, a nawet szyfr Solitare opisany w książce "Cryptonomicon" Neala Stephenson
Wszystkie wymienione niżej szyfry nie mają obecnie żadnego praktycznego • szyfr przestawieniowy • szyfr podstawieniowy • Enigma •znaczenia: • szyfr zmiennoprzesuwny • Gaderypoluki •Szachownica Polibiusza szyfr liczbowy
80. Poziomy JIW.
Poziomy języka informacyjno-wyszukiwawczego.
Elementarny znak graficzny [EZG] (litery, cyfry, znaki semigraficzne) – elementarne znaki graficzne są pustymi semantycznie elementami języka.
Elementarna jednostka leksykalna [EJL] (deskryptory, słowa kluczowe, symbole, tematy)
Zdanie
Tekst JIW (CHWD, IW.)
Z elementarnych znaków graficznych [EZG] tworzy się elementarne jednostki leksykalne [EJL]. W nowszych opracowaniach (zwłaszcza literatura zagraniczna) wyróżnia się 5 poziomów JIW. Drugim poziomem, po EZG, są morfemy, z których tworzy się EJL, a z nich następnie zdania. CHWD i IW to teksty stworzone w językach informacyjno wyszukiwawczych.
CHWD – charakterystyka wyszukiwawcza dokumentu.
IW – instrukcja wyszukiwawcza.
Tekst napisany w JIW może być zawarty np. na karcie katalogowej lub w rekordzie bibliograficznym, ale mogą to być również słowa kluczowe.
81. Geneza i historia języka słów kluczowych (książka B.)
82. Pojęcie i definicja terminu tagowanie.
Tagowanie - to nic innego jak katalogowanie, indeksowanie czy kategoryzacja, ale w odniesieniu do zasobów internetowych i, co najważniejsze, wykonywane przez użytkowników. W dotychczasowym modelu:
kataloger(bibliotekarz) -> dokument -> opis -> użytkownik
został "podmieniony" pierwszy element. Wykwalifikowanego i obiektywnego bibliotekarza zastąpił niewykwalifikowany i subiektywny internauta:
internauta -> dokument -> opis -> użytkownik
sposoby prezentacji tagów
Jednym z ciekawszych (wizualnie i pod względem użyteczności) sposobów prezentowania listy tagów jest tzw. chmura tagów (tag cloud albo label cloud). Jest to lista tagów, w której wielkość poszczególnych wpisów odzwierciedla ich częstotliwość pojawiania się na blogu. Jeśli więc tutaj największą czcionką (do tego w innym, wyróżniającym się, kolorze) podany jest tag AdSense, oznacza to, że o tym pisałem najczęściej.
83. Klasyfikacje tematyczne.
84. Język indeksowania a język wyszukiwawczy.
85. Funkcje języków słów kluczowych.
86. BSO – Szeroki System Porządkowania.
BSO - Broad System of Ordering (pol. Szeroki system porządkowania)
Jest klasyfikacją szczytową opracowaną dla UNISIST przez zespół specjalistów w ramach współpracy FID i UNESCO. Spełniać ma funkcję języka pośredniczącego między różnymi jiw. Prace nad BSO rozpoczęto w latach 50-tych, a w 1978 r. opublikowano tablice wraz z indeksem w jęz. ang. i fr.
Struktura BSO:
jest płytkim systemem polihierarchicznym o 3-4 stopniach hierarchii, podziałach pomocniczych - fasetach do wykorzystania w całym schemacie. Na pierwszym poziomie hierarchii - 320 działów - obszarów tematycznych uporządkowanych w następujących grupach:
- wiedza ogólnie ( dyscypliny mające zastosowanie w wielu dziedzinach np. filozofia, logika, matematyka itp.) - symbole 100 - 188
- nauka i technologia ( fizyka, nauki przyrodnicze, rolnicze, medyczne, psychologia) - symbole 200-450
- oświata- 460-467
- potrzeby człowieka - 500-588
- technika - 600-890
- język, lingwistyka i literatura - 910-928
- sztuka - 940-957
- religia i ateizm - 970-992
Rolę podziałów pomocniczych pełnią 3 fasety:
1 -faseta o charakterze fakultatywnym dla źródeł informacji
2 - faseta czasu
3 - faseta miejsca
Notacja pełni rolę tylko porządkującą. Klasy główne znakowane są symbolami trzycyfrowymi, na niższych poziomach znakowanie dwucyfrowe poprzedzone przecinkiem. Stosowane są również oznaczenia A/Z dla indywidualnych obiektów, osób, organizacji.
Gramatyka BSO określona jest w formule fasetowej. Symbole złożone ( kombinowane) zestawiane z symbolami tego samego działu tworzy się za pomocą cyfry 0. Symbole złożone z symboli różnych działów tworzy się za pomocą kreski.
87. Parametry indeksowania.
Szerokość indeksowania – stopień pokrywania się charakterystyki wszukiwawczej dokumentu z zakresem tematycznym dokumentu
Głębokość indeksowania (szczegółowość) – stopień uogólnienia czyli pokrywania się konotacji wyrażeń
88. Typologie tezaurusów.
Tezaurus w formie, która w polskim piśmiennictwie nazywana jest t e z a u r u s e m d o k u m e n t a c y j n y m, a w literaturze anglojęzycznej – chyba zresztą trafniej – t e z a u r u s e m i n f o r m a c y j n o - w y s z u k i w a w c z y m (ang. information retrieval thesaurus), pojawił się niemal równocześnie z wyodrębnieniem się informacji naukowej jako dyscypliny, która na progu epoki eksplozji informacji za cel postawiła sobie badanie działalności informacyjnej i wypracowanie profesjonalnych metod i narzędzi jej prowadzenia
Tezaurus w formie, która w polskim piśmiennictwie nazywana jest t e z a u r u s e m d o k u m e n t a c y j n y m, a w literaturze anglojęzycznej – chyba zresztą trafniej – t e z a u r u s e m i n f o r m a c y j n o - w y s z u k i w a w c z y m (ang. information retrieval thesaurus), pojawił się niemal równocześnie z wyodrębnieniem się informacji naukowej jako dyscypliny, która na progu epoki eksplozji informacji za cel postawiła sobie badanie działalności informacyjnej i wypracowanie profesjonalnych metod i narzędzi jej prowadzenia
Za pierwowzór t e z a u r u s a k l a s y c z n e g o uważa się opublikowany w 1967 r. Thesaurus of Engineering and Scientific Terms (TEST), który powstał w ramach tzw. projektu LEX, realizowanego w latach sześćdziesiątych wspólnie przez przez Office of Naval Research amerykańskiego Department of Defence (DOD) oraz Engineering Joint Council (EJC). TEST zastąpił wcześniejszy Thesaurus of Engineering Terms wykorzystywany przez EJC.
Alfabetyczna lista deskryptorów miała tu już większość charakterystycznych cech tego, co w następnych 30 latach uznano za „tezaurusowy standard”, a zatem formę tzw. alfabetyczno-hierarchicznego wykazu deskryptorów i askryptorów,2 w którym zastosowano symetryczne oznaczenia relacji ekwiwalencji (USE – UF), hierarchicznych (BT i NT) oraz asocjacyjnych (RT) używane do dzisiaj
Thesaurofacet Austina i Dale’a wydany w 1970 r. pierwszy tezaurus zintegrowany z klasyfikacją fasetową (Thesaurofacet 1969; zob. też Sosińska-Kalata, 2002). W konstrukcji tej zespół kierowany przez Jean Aitchison po raz pierwszy wykorzystał metodę analizy fasetowej jako sposób opracowania leksyki języka deskryptorowego, którą stanowiły znormalizowane odpowiedniki słowne branżowej klasyfikacji fasetowej EE Classification of Engineering. Dzięki temu zabiegowi indeks przedmiotowy do tej klasyfikacji otrzymał postać tezaurusa, sama klasyfikacja natomiast pełniła rolę szkieletu organizacyjnego semantycznej prezentacji leksyki zawartej w tym tezaurusie stał się później wzorem dla twórców tzw. t e z a u r u s ó w f a s e t o w y c h. Jest to dziś najczęściej stosowany model organizacyjny tezaurusa, co niewątpliwie ma związek z przedstawieniem takiej właśnie koncepcji opracowania i prezentacji słownictwa wyszukiwawczego w normie ISO 2788 z 1986 r.
tzw. t e z a u r u s a m i w y s z u k i w a w c z y m i, które ograniczając kontrolę synonimii i bliskoznaczności do identyfikacji ciągów synonimicznych i rezygnując z wyboru jednostki preferowanej nie spełniają wymagań standardów tezaurusa klasycznego. Tezaurusy te wykazują jednak dużą użyteczność zarówno w wyszukiwaniu pełnotekstowym, jak i w równoczesnym przeszukiwaniu zasobów wielu systemów czy serwisów informacyjnych stosujących różne systemy kontroli słownictwa
89. Historia JIW.
JIW lub językami informacyjnymi we współczesnej literaturze z zakresu informacji naukowej nazywa się wyspecjalizowane sztuczne systemy językowe tworzone jako narzędzia opisu i wyszukiwania treści oraz podstawowych cech formalnych informacji przedstawionej w dokumentach oraz pytaniach użytkowników. W piśmiennictwie naukowym terminy te pojawiają się w połowie XX w., co wiązało się z zainteresowaniem specjalistów informacji naukowej problematyką budowy i funkcjonowania tego typu systemów językowych. Dopiero na przełomie lat pięćdziesiątych i sześćdziesiątych ubiegłego stulecia zaczęto nazywać je językami informacyjno-wyszukiwawczymi i traktować jako specjalny rodzaj języka, którego realizacji może w konkretnych systemach informacyjno-wyszukiwawczych przyjmować różne formy. Wcześniej tego typu systemy znakowe, tworzone na użytek opracowania rzeczowego zbiorów bibliotecznych, utożsamiano z ich zastosowaniami, głównie z katalogami bibliotecznymi.
90. Polskie tezaurusy w informacji naukowej.
91. Struktura języka słów kluczowych (nie ma jednego poziomu).
92. Polska klasyfikacja tematyczna.
PKT - Polska Klasyfikacja Tematyczna - jest płytką klasyfikacją uniwersalną opracowaną dla SINTO w celu:
- określenia obszarów tematycznych zbiorów, podsystemów i serwisów informacyjnych, które zostaną wyodrębnione w ramach SINTO
- porządkowania wydawnictw informacyjnych, szczególnie o charakterze interdyscyplinarnym,
- określenia zakresów tematycznych dziedzinowych języków informacyjnych oraz koordynacji prac nad tymi językami.
PKT może być wykorzystana także do innych celów, np. do prowadzenia selektywnej dystrybucji i retrospektywnego wyszukiwania informacji dla pytań o szerokim przekroju tematycznym.
Pierwsza wersja PKT została opracowana w l. 1976-79, druga wersja 1982-83
Struktura PKT:
Na pierwszym poziomie wyodrębniono 79 działów uporządkowanych w następujących grupach:
- nauki społeczne
- nauki ścisłe i przyrodnicze
- nauki stosowane. Gałęzie gospodarki narodowej
- zagadnienia ogólne i kompleksowe
- dokumenty o treści uniwersalnej. Zbiory uniwersalne. Zbiory uniwersalne ze względu na formę lub postać fizyczną dokumentów
obok tablic głównych PKT zawiera tablice podziałów wspólnych: podziały typowe, geograficzne, języka
93. Pojęcie indeksowania.
94. System leksykalny języka słów kluczowych.
System leksyklany języka słów kluczowych składa się ze słownictwa, które tworzą wyrażenia zwane słowami kluczowymi (słowo kluczowe = jednostka leksykalna);
- słownictwo nie jest poddane kontroli lub podlega tylko kontroli częściowej;
- forma jednostek leksykalnych jest tożsama z formą wyrażeń języka naturalnego;
- słownik jest uporządkowany alfabetycznie, tzn. nie uwzględniaja żadnych relacji między jednostkami leksykalnymi.
95. Gramatyka JIW.
zespół zasad łączenia ze sobą EJL w strukturze zdania JIW i wyrażania zachodzących między nimi relacji syntagmatycznych
Wyróżnia się cztery ogólne typy gramatyki JIW:
- gramatykę zerową
- gramatykę pozycyjną
- gramatykę niepozycyjną
- gramatykę częściowo pozycyjną
96. Języki klasyfikacyjne – charakterystyka.
97. Pojęcie i definicja terminu indeksowanie współrzędne.
INDEKSOWANIE WSPÓŁRZĘDNE, indeksowanie koordynacyjne, indeksowanie korelacyjne, indeksowanie wieloaspektowe, indeksowanie współrzędnościowe – indeksowanie charakteryzujące się tym, że pomiędzy użytymi wyrażeniami języka informacyjno-wyszukiwawczego zachodzi jedynie relacja współwystępowania w tekście – dzięki czemu każde z nich może samodzielnie pełnić funkcje wyszukiwawczą.
Zasada indeksowania współrzędnego została opracowana w pierwszej połowie lat 50. w związku z podjętymi próbami mechanizacji systemów informacyjno-wyszukiwawczych. Do jej sformułowania i rozpropagowania przyczynił się M. Taube (USA), z którego nazwiskiem związane jest zastosowanie indeksowania współrzędnego w praktyce informacyjnej. W swoich pracach pisze on o współrzędnych dokumentu w znaczeniu, w jakim używa się tego terminu w matematyce. Tak jak współrzędne w matematyce jednoznacznie określają położenie punktu w przestrzeni, tak wyrażenia języka informacyjno-wyszukiwawczego, pełniące funkcję współrzędnych, winny wskazywać, gdzie dany dokument (który możemy przedstawić jako punkt) znajduje się w przestrzeni informacyjnej (zbiorze wyszukiwawczym) i tym samym umożliwiać wyszukanie tego dokumentu w odpowiedzi na zapytanie informacyjne. Charakterystyki wyszukiwawcze dokumentów zbudowane w oparciu o zasadę indeksowania współrzędnego można w uproszczeniu traktować jak zbiory wyrażeń języka informacyjno-wyszukiwawczego i wówczas instrukcje wyszukiwawcze maja charakter pytań o sumę zbiorów, iloczyn zbiorów lub różnicę zbiorów. Języki informacyjno-wyszukiwawcze bazujące na zasadzie indeksowania współrzędnego obecnie są wykorzystywane przede wszystkim w systemach o wyszukiwaniu zautomatyzowanym z inwersyjną organizacją zbiorów wyszukiwawczych (inwersja).
98. Pole semantyczne i jego struktura.
POLE SEMANTYCZNE – jest to struktura zbudowana ze znaczeń (treści), jakie można wyrazić w danym języku za pomocą środków (relacji), którymi język ten dysponuje. Pole semantyczne ma treść i zakres.
Zakres – np. wszystkie stworzenia, którym można przyporządkować jakąś nazwę
Treść – cechy pewnych obiektów, zbiór cech
Każda jednostka leksykalna ma TREŚĆ [ in. konotacje, intencje] i ZAKRES [in. denotacja, ekstensja].
Pole semantyczne JIW – suma znaczenia wszystkich wyrażeń JIW, zbiór wchodzących we wzajemne relacje pojęć, które można wyrazić w danym JIW.
Struktura pola semantycznego JIW wyrazona jest przez:
sieć paradygmatycznych relacji semantycznych
kategoryzację semantyczną EJL
podział dyscyplinarny EJL
W JIW występują dwa rodzaje relacji:
paradygmatyczne (słownikowe)
syntagmatyczne (tekstowe)
Relacje paradygmatyczne:
synonimii wyszukiwawczej
hierarchiczne (generyczne, mereologiczne, hierarchii tematycznej)
współrzędności (współwystepowania)
kojarzeniowe
Relacje syntagmatyczne – wykładniki:
znaki łączące
wskaźniki więzi
wskaźniki roli
wskaźniki wagi
algebra Boole’a
99. Kod semantyczny Perrego i Kenta.
stworzony w latach 1954 – 1959, (KS ASM-WRU); powstał w ośrodku badań w zakresie dokumentacji i przekazywania informacji: American Society for Metals – Western Reserve University w Cleveland. Zbudowano go na potrzeby systemu informacyjnego z dziedziny metalurgii. — słownik składa się z 214 mnożników semantycznych; - mnożniki semantyczne zawsze składają się z trzech spółgłosek i jednego wolnego miejsca, które zastępuje samogłoska;
ANIMAL đ N_ML đ NAML np. psy, NEML np. szynka
100. Język słów kluczowych a język naturalny.
101. Język haseł przedmiotowych BN a KABA
JHP BN | KABA (Katalogi Automatyczne Bibliotek Akademickich) |
---|---|
1945 - 1956 – pierwszy słownik |
1991 – biblioteka UW chciała stworzyć język do opisu katalogów 1992 – BJ, BUG |
Tematy ogólne i jednostkowe (np. nazwy własne): · Osobowe · Geograficzne · Korporatywne · Chronologiczne · Etniczne · Rzeczowe Określniki: · Jednostkowe · Klasowe – mają postać nazwy dziedziny, działalności · Przedmiotowe – stany i zjawiska, czynności · Lokalizujące · Formalne |
Tematy rzeczowe (zamiast ogólnych) i tematy z prepozycją (coś jak określnik) – tematy z prepozycją stosujemy gdy przedmiotem jest. Właściwy temat jest z apozycją a drugi temat jest prepozycją np. Chopin, Fryderyk (1810-1849). Fantazje. Fortepian. Op. 49. f-moll. /prepozycja to Chopin, Fyderyk(). Tytuł dzieła to temat) Określniki są swobodne (łączy się z wszystkimi tematami) i związane (tylko dla konkretnych tematów lub jednego tematu). Określniki: · Rzeczowe · Chronologiczne · Geograficzne · Formy |
Budowa: Temat – okr. jednostkowe – okr. przedmiotowe – okr. klasowe – okr. lokalizujące | Budowa: Rzeczowe – geograficzne - chronologiczne – formy\ |
Smoki : potwory z mitów i książek / oprac. Gerrie McCall Smok (mit.) - wydawnictwa dla młodzieży |
UJ: Hasło przedmiotowe Smoki -- legendy. Hasło przedmiotowe Smoki -- wydawnictwa ilustrowane. Hasło przedmiotowe Potwory -- wydawnictwa ilustrowane. |
Zjawy: szaleństwo i śmierć w lit. Hispanoamerykańskiej Lit. Fant. Łac. – historia Realizm magiczny – literatura Ameryki Łacińskiej |
Literatura hispanoamerykańska – tematy, motywy Realizm magiczny (literatura) Fantastyka (literatura) |
Pedagogika biblioteczna | Biblioteki i edukacja – Konferencje Biblioteki – aspekt społeczny – konferencje |
JHP KABA posiada skomplikowane słownictwo i zasady metodyczne. Bardzo szybko przybywa haseł wzorcowych, a tematy są bardzo szczegółowe. Oba omawiane języki są utrzymane w postaci kartoteki wzorcowej i w formacie USMARC, oba zostały przyjęte w narodowym katalogu centralnym NUKat. Jhp KABA i jhp BN nie powinny być traktowane jako konkurencyjne, lecz jako komplementarne dla różnych typów bibliotek. Jhp KABA może być stosowany w specjalistycznych księgozbiorach naukowych, natomiast jhp BN powinien nadal służyć bibliotekom publicznym, szkolnym, pedagogicznym i bibliografii narodowej.
102. Kryteria podziału i odmiany słów kluczowych (książka B.)
103. Głębokość indeksowania.
jest to stopień uogólnienia czyli pokrywania się treści dokumentu z treśćią charakterystyki wyszukiwawczej.
104. Zalety i wady języków słów kluczowych.
Zalety :
- Słownictwo naturalne lub paranaturalne tzn. słownictwo języka naturalnego w funkcji metainformacyjnej lub równokształtne z wyrażeniami języka naturalnego, ułatwiające posługiwanie się tym językiem
- możliwość swobodnego indeksowania współrzędnego
- elastyczność pod względem absorpcji nowych tematów i obszarów wiedzy wchodzących w zakres danego systemu tj. łatwość wprowadzania nowych terminów, co ułatwia szybka asymilację i efektywne odwzorowanie nowych zakresów badanych, nowych dziedzin i zagadnień w przypadku środowiska internetowego które szybko i żywiołowo reaguje na nowe kierunki w badaniach naukowych
- hierarchiczność słów kluczowych, co daje możliwość wskazywania przynależności danego dokumentu / informacji do wielu klas (ale jednocześnie powoduje niekiedy konieczność wielokrotnego przeszukiwania zbiorów dla wyszukania kompletnej informacji)
- otwartość
Wady:
- duże ryzyko subiektywizmu, związane z intuicyjnością wyboru terminów, które może prowadzić do braku spójności
- uzależnienie od języków etnicznych, co uniemożliwia powszechność ich stosowania
- duża, a w zasadzie permanentna w przypadku języków słów kluczowych o słownictwie niekontrolowanym, niestabilność systemu językowego
- brak możliwości semantycznej strukturalizacji informacji
- powstawanie szumu informacyjnego na skutek fałszywych skojarzeń słów kluczowych
- niekontrolowane słownictwo, z którego nie usunięto wieloznaczności wynikającej z synonimii i homonimii
105. Klasyczne języki słów kluczowych.
106. Pole informacyjne JIW.
107. Pojęcie i definicja terminu temat.
108. Morfemy w JIW.
Poziomy języka informacyjno-wyszukiwawczego. (Teoretycznie jest ich 4, Babik uważa jednak, że tak naprawdę jest ich 5).
1. Elementarny znak graficzny [EZG] (litery, cyfry, znaki semigraficzne) – elementarne znaki graficzne są pustymi semantycznie elementami języka.
2. Elementarna jednostka leksykalna [EJL] (deskryptory, słowa kluczowe, symbole, tematy)
3. Zdanie
4. Tekst JIW (CHWD, IW.)
Z elementarnych znaków graficznych [EZG] tworzy się elementarne jednostki leksykalne [EJL]. W nowszych opracowaniach (zwłaszcza literatura zagraniczna) wyróżnia się 5 poziomów JIW. Drugim poziomem, po EZG, są morfemy, z których tworzy się EJL, a z nich następnie zdania. CHWD i IW to teksty stworzone w językach informacyjno wyszukiwawczych.
109. Nieklasyczne języki słów kluczowych.
110. Słowniki słów kluczowych z systemami odesłań (książka B.)
111. Elementy języków słów kluczowych (słownik, itd.)
112. Tezaurusy – historia, rozwój, rodzaje.
113. Kompletność indeksowania.
114. Słowniki słów kluczowych w układzie gniazdowym (książka B.)
Słowniki słów kluczowych w układzie gniazdowym – Nowym rozwiązaniem w słownikach słów kluczowych jest układ gniazdowy słów kluczowych wspomagany systemem terminologicznym. Ten sposób prezentacji jęz. słów kluczowych dostarcza jeszcze więcej informacji o jego strukturze semantycznej. Zastosowano go w jęz. słów kluczowych etnologii. Język ten powstał, a właściwie powstaje, od roku 1993 w ramach prac zespołu kierowanego przez prof. Czesława Robotyckiego z Instytutu Etnologii i Antropologii Kulturowej UJ nad porządkowaniem terminologii tej dyscypliny.
115. Definicja terminu faseta.
Faseta – zbiór klas, wyodrębniony według jednej zasady podziału i uporządkowanych według relacji generycznej. Fasety mogą być grupowane w kategorie, nazywane są dlatego podkategoriami.
Klasyfikacja nauk dzieli dziedziny, klasyfikacja piśmiennictwa – literaturę.
Klasa macierzysta: Krzesło:
· Krzesła obrotowe
o Materiałowe
§ Skórzane
§ Lniane
§ Itd.
Klasa węzłowa to klasa która dzieli się na następne klasy
Klasyfikacje stosowane już było w Bibliotece Assurbanipala
116. Słowa kluczowe w indeksach rzeczowych.
117. Języki deskryptorowe tworzone w Polsce na przełomie XX i XXI wieku. (tezaurus Biblioteki Sejmowej).
System tezaurusów Biblioteki Sejmowej jest wykorzystywany do
indeksowania dokumentów w bazach zautomatyzowanego
katalogu ALEPH – BS. Jest dostêpny w sieci Internet na stronie Biblioteki
Sejmowej, jako baza wzorcowa w komputerowym
systemie bibliotecznym
Wszystkie tezaurusy systemu STEBIS są tezaurusami wielojęzycznymi, odpowiedniki
obcojęzyczne mogą służyć jednocześnie jako tablice przejścia do tezaurusa ParlamentuEuropejskiego EUROVOC, z którym system STEBIS jest w znacznym stopniu kompatybilny.
Poszczególne mikrotezaurusy są także publikowane w postaci wydawnictw
książkowych.
118. Prędkość indeksowania.
119. Słowa kluczowe w systemach pełnotekstowych.
120. Definicja terminu tag.
–niekontrolowane słowo kluczowe nadawane przez użytkownika określonemu obiektowi informacyjnemu,
–tanie metadane (tworzone przez użytkowników),
- tworzony zewnętrznie
–przejaw współuczestnictwa użytkownika
w tworzeniu zawartości sieci (Web 2.0).
121. Konwencjonalne metody indeksowania.
122. Uniwersalny kod semantyczny Martynowa.
123. Typy i formy odsyłaczy w JIW.
124. Okresy rozwoju JIW wg Ścibora.
125. Wielojęzyczne słowniki słów kluczowych.
126. Kartoteki wzorcowe.
127. Język słów kluczowych a język unitermów.
Język słów kluczowych – JIW o notacji paranaturalnej, bez ścisłej paradygmatyki o jednostkach elementarnych nazywanych słowami kluczowymi. Słownictwo języków słów kluczowych składa się z quasi-naturalnych jednostek leksykalnych – słów kluczowych. Słowa kluczowe to terminy jedno- lub wielowyrazowe, wybrane swobodnie z opisywanego dokumentu, muszą jednak być słowami znaczącymi, selektywnymi (najlepiej rzeczownik lub przymiotnik w mianowniku l.poj. albo pluraria-tantum). I jest to etap końcowy – nie trzeba już przekładać takiej charakterystyki na znormalizowane deskryptory, symbole czy tematy i określniki. Słownik słów kluczowych nie jest zatem zamknięty – stanowi raczej wykaz użytych w różnych opisach jednostek i nie jest to słownik ujemny, zakazujący jakiś jednostek. Gramatyka JSK jest niepozycyjna (indeksowanie współrzędne).
Język swobodnych słów kluczowych nie posiada słownika, a jednostki pochodzą z indeksowanego tekstu i są wybierane przez indeksatora – z zasobu słownika czynnego (mentalnego).
Język unitermowy stanowi odmianę JSK i został stworzony w 1951 r. przez M. Taube’go (ang. unit term – termin jednostkowy). Unitermy są przeważnie jednowyrazowe – to równokształtne wyrazy (nie połączenia międzywyrazowe) – takie, które nie są złożone motywowane, tj. mają tylko jeden rdzeń (nie: helioterapia). Rozróżniamy:
· Unitermy wolne – równokształtne z wyrazami o jednym rdzeniu
· Unitermy związane – równokształtne z połączeniami wyrazowymi lub wyrazami złożonymi motywowanymi. A) dozwolone tylko takie unitermy jednowyrazowe, które zbudowane są z “pojęć jednostkowych” – nierozkładalnych pojęć prostych). B) Jeśli taki uniterm ma być wielowyrazowy, to musi się składać z istniejących już unitermów wolnych.
Języka unitermowego używamy wpisując każdą jednostkę na osobną kartę katalogową danej jednostki. Np. karta KOMPUTER będzie zawierać wszystkie dokumenty (ich numery/sygnatury) z unitermem KOMPUTER. Dały podstawy do rozwoju języków deskryptorowych z np. przydatnymi wskaźnikami więzi i roli czy też jednostkami wielowyrazowymi.
128. Relacje kojarzeniowe w JIW.
opierają się na podobieństwie treści. W JIW mają dużą wartość wyszukiwawczą. Są charakterystyczne dla poszczególnych dziedzin. Zwykle mają charakter pozajęzykowy. Wykorzystują schematy – część-całość, przyczyna-skutek.
Przykłady:
Proces – urządzenie do wykonywania czynności (drukować-drukarka)
Produkt – wykonawca (produkt-producent)
129. Charakterystyka funkcjonalno-strukturalna języka unitermowego.
Język unitermowy stanowi odmianę JSK i został stworzony w 1951 r. przez M. Taube’go (ang. unit term – termin jednostkowy). Unitermy są przeważnie jednowyrazowe – to równokształtne wyrazy (nie połączenia międzywyrazowe) – takie, które nie są złożone motywowane, tj. mają tylko jeden rdzeń (nie: helioterapia). Rozróżniamy:
· Unitermy wolne – równokształtne z wyrazami o jednym rdzeniu
· Unitermy związane – równokształtne z połączeniami wyrazowymi lub wyrazami złożonymi motywowanymi. A) dozwolone tylko takie unitermy jednowyrazowe, które zbudowane są z “pojęć jednostkowych” – nierozkładalnych pojęć prostych). B) Jeśli taki uniterm ma być wielowyrazowy, to musi się składać z istniejących już unitermów wolnych.
Języka unitermowego używamy wpisując każdą jednostkę na osobną kartę katalogową danej jednostki. Np. karta KOMPUTER będzie zawierać wszystkie dokumenty (ich numery/sygnatury) z unitermem KOMPUTER. Dały podstawy do rozwoju języków deskryptorowych z np. przydatnymi wskaźnikami więzi i roli czy też jednostkami wielowyrazowymi.
130. Definicja hasła przedmiotowego.
(zrobiłam na przykładzie JHP KABA)
hasło przedmiotowe składające się tylko z tematu jest hasłem prostym.
Hasło przedmiotowe rozwinięte składa się z tematu i określników.
Wspólną cechą jest też budowa hasła przedmiotowego rozwiniętego, w którym kategoria tematu występuje na pierwszym miejscu, a określniki na dalszych:
[Temat] - - [określnik rzeczowy] - - [określnik geograficzny] - - [określnik chronologiczny] - - [określnik formy]
131. PRECIS
Preserved Context Index System [PRECIS] – przedstawiciel języków sznurkowych; jest to system indeksu przedmiotowego z zachowaniem kontekstu. Opracował go Derek Austin z Wielkiej Brytanii w 1971r. Powstanie tego języka wiąże się z automatyzacją angielskiej bibliografii narodowej. Opracowali do badacze z CRG. Nowoczesność tego języka (w tamtych czasach) polegała na dostępie do każdego elementu z opisu katalogowego dzięki rotacji elementów (sznurek tematyczny do komputerowego tworzenia zapisów), dlatego dokument jest rozkładany na pojedyncze pojęcia i składane w sznurek tematyczny. Gramatyka opiera się na wskaźnikach roli. Bieżąco buduje się tezaurus. Dostęp do dokumentu przez LIDERA, np.:
1. Sznurek:
FRANCJA(lider)
PRZEMYSŁ TEKSTYLNY. WYWALIFIKOWANA KADRA. PERSONEL. SZKOLENIE.
2. Sznurek:
PRZEMYSŁ TEKSTYLNY
WYWALIFIKOWANA KADRA. PERSONEL. SZKOLENIE. FRANCJA
itd.
132. Funkcje JIW
Funkcje podstawowe:
- f. metainformacyjna - wyspecjalizowana funkcja opisowa JIW polegająca na odwzorowaniu cech treści i/lub formy dokumentów
- f. wyszukiwawcza - (heurystyczna) JIW - wyspecjalizowana funkcja impresywna JIW polegająca na sterowaniu procedurami wyszukiwania informacji o dokumentach o cechach treści i/lub formy wskazanych przez użytkownika
Funkcje wtórne:
- f. organizująca (porządkująca) - zapewniająca strukturalizację zbioru informacyjnego ułatwiającą selekcję określonych opisów dokumentów
- f. opisu zbiorów dokumentów (informacji) i /lub wyznaczania zakresów pól semantycznych
133. Rodzaje indeksowania
1)
ankietowe – którym zadaniem indeksatora jest tworzenie charakterystyk i instrukcji wyszukiwawczych według odpowiednich formularzy
asocjacyjne – w którym do charakterystyk lub instrukcji wyszukiwawczych wprowadza się dodatkowo wyrażenia JIW pozostające w relacjach asocjacyjnych do już wyindeksowanych elementów
Automatyczne – dokonywane przy uzyciu specjalnego programu w komputerowych systemach informacyjno-wyszukiwawczych
Derywacyjne – wykorzystujące w funkcji wyrażeń JIW wyrażenia występujące w indeksowanych dokumentach
Hierarchiczne – polegające na wprowadzaniu do charakterystyk informacyjno-wyszukiwawczych dodatkowo wyrażeń pozostających w relacji nadrzędności, w stosunku do tych, które zostały wytypowane
Paradygmatyczne – polegające na wprowadzaniu do charakterystyk wyszukiwawczych lub instrukcji wyszukiwawczych dodatkowo wyrażeń pozostających w relacjach paradygmatycznych w stosunku do tych, które zostały wytypowane na podstawie analizy tekstu indeksowanego dokumentu
Semantyczne – oparte na niesformalizowanych (zwykle odwołujących się do intuicji indeksatora) kryteriach wyboru
Słownikowe – prowadzone z użyciem wyłącznie wyrażeń umieszczonych w słowniku danego JIW
Statystyczne - w którym kryteria wyboru oparte są na statystycznej analizie tekstu indeksowanego dokumentu
Swobodne – prowadzone w jezyku swobodnych słów kluczowych
Syntaktyczne – w którym do charakterystyki informacyjno-wyszukiwawczej wybierane są jedynie te wyrażenia języka naturalnego, które pozostają w określonych relacjach syntagmatycznych względem innych wyrażeń tego tekstu
Uogólniające – w którym denotacja pośrednia chociaż jednego wyrażenia użytego w charakterystyce wyszukiwawczej dokumentu (instrukcji wyszukiwawczej) jest wieksza od denotacji przedmiotu dokumentu(czyli tematu), zaś konotacja jest mniejsza
Współrzędne - w którym pomiędzy użytymi wyrażeniami języka informacyjno-wyszukiwawczego zachodzi jedynie relacja współ występowania w tekście – dzięki czemu każde z nich może samodzielnie pełnić funkcję wyszukiwawczą
Wyszczególniające – w którym denotacje pośrednie i konotacje pośrednie poszczególnych wyrażeń JIW użytych w charakterystyce wyszukiwawczej dokumentu lub instrukcji wyszukiwawczej są równe denotacjom i konotacjom wyrażeń języka naturalnego reprezentujących przedmioty dokumentu (temat) uwzględnione przy indeksowaniu
2)
Intelektualne, w starszej literaturze manualne (posługujemy się głową i rozumiem)
Jest to indeksowanie swobodne, opiera się na słowniku nie jawnym – głowie.
Może być to indeksowanie słownikowe, in. normatywne, gdy opieramy się na słowniku jawnym np. na tablicach UKD.
Trzeci rodzaj indeksowania intelektualnego to indeksowanie współrzędne.
Automatyczne (3 metody)
Indeksowanie statystyczne, TEORIA WARTOŚCI INFORMACYJNEJ SŁOWA, twórcą tej teorii jest H. P. Lunh. Do tego rodzaju indeksowania potrzebny jest program, który wybiera słowa względem częstotliwości ich występowania. Efektem jest powstanie krzywej Gansa, która określa wartość informacyjną.
Rachunek prawdopodobieństwa
Metody syntaktyczne (opierają się na teorii języków formalnych w zbiorze znaczników frazowych).
134. INSTYTUCJE ZWIĄZANE Z UCZELNIAMI, INSTYTUTY NAUKOWO-BADAWCZE:
Biblioteka Narodowa – zajmuje się semiotyką, pragmatyką, opracowuje Bibliografię Narodową
INTE – Instytut Informacji Technicznej i Ekonomicznej. (Już nie istnieje) W ośrodku tym funkcjonowała jednostka JIW, prowadzona przez Eugeniusza Ścibora (zajmował się klasyfikacjami tematycznymi). W licznych pracach pomagała mu natomiast Lucyna Anna Bielicka.
UW – Instytut Informacji Naukowej i Studiów Bibliologicznych, z ośrodkiem tym związany był Olgierd Ungurian, obecnie pracuje tam Jadwiga Woźniak-Kasperek i Barbara Sosińska-Kalata.
Warszawska Szkoła JIW – już nie istnieje, ale szkoła ta w swym czasie spłodziła wielu doktorów m.in. W. Babik, Z. Jarmoszuk (obecnie pracuje w Narodowym Centrum Kultury)
ORGANIZACJE I STOWARZYSZENIA PROFESJONALNE:
Polskie Towarzystwo Informacji Naukowej i Technicznej – Katowice
ISCO (International Standard Classification of Occupation)
ŚWIAT
OSOBY
Jean-Claude Gardin (Francja) – twórca typologii słowników JIW, podział wielostopniowy dychotomiczny 1966 rok.
Karen Spark Jones (Wielka Brytania) – zajmowała się badaniem lingwistycznych podstaw JIW, specjalizowała się w językach słów kluczowych oraz automatycznych indeksach.
Arkadij Iwanowicz Czerny – twórca kolejnej klasyfikacji podobnie jak Gardin
INSTYTUCJE:
Western Reserve University – Cleveland (USA) – wiąŜe się ze stworzeniem kodu semantycznegoASM WRU przez Kent’a I Perry’ego
Ośrodek Badan Naukowych we Francji (ParyŜ) CNRS – stworzenie języka syntagmatycznego SYNTOL przez Jean-Claude Gardin’a.
Amerykańskie Stowarzyszenie Informacji Naukowej i Technologii – ASIST, funkcjonujące od 1927 roku. Najbardziej znanymi dyrektorami tej placówki byli m.in.: James W. Perry, Harold Borko, Michael Buckland, Eugene Garfield, Nicolas Belkin.
OCLC
DRTC (Documentation Research Training Center) – Indie, Bangalore, Centrum Badań Dokumentacyjnych i Szkoleń. W instytucie tym, badacze zajmują się głównie dwu kropkową klasyfikacją Ranganathana. Obecnie opracowano już 7 wersji aktualizacji. Organizacja powstała w 1962 roku.
CRG (Classification Research Group) – Londyn, 1952 rok. Ośrodek skupia specjalistów zakresu JIW. Stworzono tu wiele klasyfikacji fasetowych w tym również klasyfikację Informacji Naukowej. Z ośrodkiem tym wiąże się także Teoria poziomów zintegrowanych.