„System informacyjno-wyszukiwawczy to system przetwarzający informację, który z informacji wejściowych, […], tworzących zbiór informacyjny, tworzy odpowiednio ustrukturalizowany zbiór wyszukiwawczy poprzez odpowiednie transformacje [np. abstrakty, opis przy użyciu JIW itd.], a następnie dokonuje na nim […] wyszukiwania informacji […] na podstawie określonej dla danego systemu relewancji technicznej. [Zgodne z tym kryterium informacje] tworzą zbiór informacji […] udostępnianej użytkownikowi systemu”.
Powyższa definicja odnosi się do systemów zautomatyzowanych, czyli tych, w których procesy przechowywania, porządkowania, selekcjonowania i prezentowania informacji i wymiany danych z użytkownikiem odbywają się via komputer.
Modele wyszukiwania informacji
Model algorytmiczny
instrukcja |
- |
wyniki |
odpowiedzi |
|
kryt. zgodności |
|
|
warunkiem wyszukiwania jest zbudowanie konkretnej instrukcji (liczy się ona, a nie użytkownik!), m.in. dzięki słownikom języków informacyjno-wyszukiwawczych systemu, operatorom logicznym, eliminacji wieloznaczności
główne założenia: stabilność i definiowalność potrzeb, dominacja wyszukiwania według przyjętych a priori, niezmiennych założeń
de facto: przedmiot i cel potrzeb są dynamiczne, niedookreślone, między użytkownikiem a informacją zachodzą ciągłe interakcje, istnieje tendencja użytkowników do szperania w sieci
Model zadaniowy i kognitywny
punkt ciężkości przenosi się z pytania na użytkownika: warunkiem wyszukiwania jest sformułowanie pytania, które dopiero przekształcane jest na wyrażenie wyszukiwawcze; późniejsza ocena i selekcja rezultatów prowadzi do uzyskania rekordów pertynentnych
rozwiązywanie problemu to proces przetwarzania informacji posiadanej i uzyskiwanej, który prowadzi do wygenerowania zbioru rozwiązań problemu
Model zadaniowy: wyszukiwanie zależy od typu i zakresu przedmiotowego problemu / zadania (precyzyjnie zdefiniowanego)
Model poznawczy: jest niezależny od typu problemu, ma otwartą strukturę
poziomy werbalizowania potrzeby: potrzeba wewnętrzna (visceral need), konkretyzacja potrzeby (conscious need werbalizacja), pytanie zadawane systemowi (formalised need), potrzeba kompromisowa (compromised need „wynegocjowana” po wzięciu pod uwagę ograniczeń systemu)
cechy wyszukiwania: ciągłość, dynamiczność, heurystyczność procesu
Model konwersacyjny
podobny do modelu kognitywnego, ale tu bierze się dodatkowo pod uwagę różnorakie interakcje wpływające na proces wyszukiwania
interakcje między użytkownikami
między użytkownikiem a otoczeniem
między użytkownikiem a sytuacją poznawczą (i. sytuacyjna)
między strukturami poznawczymi a tekstami (i. poznawcza)
między użytkownikiem a systemem (i. powierzchniowa)
między użytkownikiem a jego intencjami (i. emocjonalna)
wyszukiwanie to wieloetapowy proces negocjacyjny między użytkownikiem a pośrednikiem to dialog, którego celem jest rozpoznanie potrzeb, sformułowanie pytań, uzyskanie odpowiedzi i jej ocena
dialog z systemem przebiega wielopoziomowo: poprzez środki nie-lingwistyczne (np. klikanie myszką - Nb., przykład pochodzi z artykułu), języki sformalizowane, język naturalny, w ramach którego korzysta się z podjęzyka (A. Jönsson), czyli języka wykonawczego (zautomatyzowanego lub nie) pertynentnego wobec dziedziny lub zadania, w którym jest wykorzystywany
niezbędne komponenty modelu: użytkownik, struktura problemu, dziedzina systemu, dialog. Interakcje między nimi są najważniejszym elementem tego modelu
Wyszukiwanie informacji w źródłach
Wyszukiwanie to aktywny proces selektywnego pozyskiwania zgromadzonych danych (PN-ISO:5127:2005)
Strategie wyszukiwawcze: ich ustalenie zależy od charakteru pozyskiwanych danych
konkretnego dokumentu, którego tytuł i/lub autor są znani
informacji na określony temat w niezidentyfikowanym dokumencie
rozpoznanie tematu w wydawnictwach informacyjnych
poszukiwanie w bibliografiach
kwerenda w katalogach
Jeśli użytkownik otrzymuje informację zgodną ze swymi potrzebami, jest ona relewantna.
Jeśli nie otrzyma żadnych dokumentów, mówimy o ciszy informacyjnej.
Jeśli otrzyma dane i relewantne, i zbędne, następuje szum informacyjny.
Wyszukiwanie jest procesem wyselekcjonowania informacji relewantnych ze zbioru pod względem kryteriów:
trafności wyszukiwania, czyli zgodności z zapytaniem
wysokiego stopnia kompletności, który otrzymujemy, eliminując ciszę informacyjną, czyli dążąc do wyszukania wszystkich możliwych dokumentów
Obiekty, o których informacje zawiera źródło są opisane według cech formalnych (fizycznych zasięg) i rzeczowych (treściowych zakres)
Strategia wyszukiwawcza to przemyślany plan działań prowadzący do takiego zapisania problemu wyszukiwawczego, który pozwoli na najszybsze odnalezienie informacji relewantnych
Wyszukiwanie proste
Strategia budowania klas
w pierwszej kolejności definiuje się terminy, którymi można odzwierciedlić treść zapytania i dzieli się je na klasy (grupy synonimów)
następnie określa się relacje między klasami i wybiera indeksy, które mają być przeszukane
Klasa A: (T.a1 OR T.a2 OR T.a3) |
AND / OR / NOT |
Instrukcja |
Klasa B: (T.b1 OR T.b2 OR T.b3) |
|
|
|
AND / OR / NOT |
|
Klasa C: (T.c1 OR T.c2 OR T.c3) |
|
|
Strategia kolejnych klas
najpierw określa się klasę najbardziej charakterystyczną (nazwa własna, osoba, technologia) albo taką, która gwarantuje, że system wygeneruje najmniej wyników
po przeprowadzeniu kwerendy zawęża się ją poprzez dodawanie kolejnych klas
(Klasa A AND Klasa B) |
Wynik I AND |
Itd. |
rezultat końcowy |
|
Klasa C |
|
|
Strategia podwójnych klas. Skuteczna, gdy:
wszystkie aspekty instrukcji są równie ważne
użytkownik kładzie równy nacisk na precyzję i kompletność, a iloczyn klas generuje zbyt mało rekordów
użycie terminów ogólnych wygenerowałoby zbyt wiele zagadnień nierelewantnych
(Klasa A AND Klasa B) (Klasa B AND Klasa C) (Klasa A AND Klasa C) |
OR |
rezultat |
Strategia pomnażania odwołań
gdy nie można się oprzeć na jednym tezaurusie
pierwszy - relewantny i znany - dokument jest poprawnie zaindeksowany
na podstawie opisujących go terminów buduje się instrukcję wyszukiwawczą
wśród znalezionych w ten sposób dokumentów wybiera się terminy do budowy kolejnych instrukcji
do pewnego stopnia jest to „droga na skróty”, przy której można coś pominąć
Strategia indeksów cytowań
analiza cytowań dostępna w niektórych bazach bibliograficznych
śledzenie bibliografii i przypisów oraz dokonanych wcześniej analiz dokumentów współcytowanych i dokumentów cytujących daną pracę
strategia opiera się na założeniu, że istnieje związek semantyczny między publikacją cytowaną a cytującą