7862366411

7862366411



z tych systemów używają eufemistycznego (w takich przypadkach) terminu stopień relewancji. Pamiętać należy, że w takich przypadkach proces ustalania stopnia relewancji jest dość złożony. Kiedy w zapytaniu używa się jednego tylko terminu, kwestia stopnia relewancji, pogrupowania lub ustalenia priorytetów wyników przedstawia się względnie prosto. Dokumenty Internetowe, których poszukiwany termin występuje w „dobrych” miejscach (np. w tytule) lub ma najwyższy stopień częstości, będą umieszczane jako pierwsze na liście znalezionych dokumentów, zaś pozostałe dokumenty w porządku malejącym, relatywnie do wyników najlepszego (na podstawie położenia terminu i częstości jego występowania). Problem jest tym bardziej złożony, im więcej terminów występuje w zapytaniu. Wyobraźmy sobie zapytanie z dwoma terminami. System przetwarza pytanie i znajduje „właściwe” dokumenty (na początku listy znajdują się te. które według niego są najbardziej „relewantne”), i tak jednak zdarza się, że w tekście wyszukanych dokumentów nie ma wspomnianych terminów, terminy te mogą znajdować się wśród niewidocznych na ekranie me-taznaczników. Kiedy terminów jest więcej, złożoność wyszukiwania wzrasta jeszcze bardziej. Pamiętając, że system może polegać tylko na położeniu i częstości danego terminu (jako miarze jego ważności), przypuśćmy, że w pytaniu są trzy terminy. Czy zatem dokument, w którym pierwsze dwa terminy występują w stopniu umiarkowanym i mają „dobre” położenie znajduje się na liście końcowych wyników wyżej niż dokument, który odznacza się wysoką częstością występowania wszystkich trzech terminów, ale tylko jeden termin ma „dobre” położenie? Oczywiście użytkownik tego nie wie i w wielu przypadkach prawdopodobnie nie dowie się, jest to bowiem część tzw. tajemnicy handlowej dotyczącej danego systemu wyszukiwawczego, a każdy system wyszukiwawczy posiada własne algorytmy określające relewancje. Według Search Engine Watch wskaźnikiem stopnia relewantności dokumentów może być liczba odesłań do danego dokumentu od innych dokumentów - im więcej takich odesłań, tym wyższe miejsce dokumentu na liście wyników wyszukiwania, ale jak wcześniej stwierdziliśmy ma to niewiele wspólnego z jakością dokumentu. Wskaźnikiem takim mogą też być słowa kluczowe w metaznacznikach, ale nadmierne ich wykorzystanie przez projektantów stron WWW bywa ograniczane przez systemy wyszukiwawcze. W niektórych systemach wyszukiwawczych rzadziej używane słowa uzyskują większy stopień relewancji, co w jakimś stopniu zmusza użytkowników do umieszczania takich właśnie słów w kwerendach. Czasami system wyszukiwawczy pozwala użytkownikom “polepszyć” strategię wyszukiwawczą przez wskazanie słów, które koniecznie muszą wystąpić w dokumencie uznanym za relewantny lub określenie, które słowa nie powinny tam się znaleźć (wspomniane wcześniej „słowa wymagane”, „słowa zabronione”, poprzedzone odpowiednio znakami „ + ” „-”). Ale należy jeszcze raz podkreślić, że algorytm systemu wyszukiwawczego jest ukryty przed końcowym użytkownikiem, który musi go po prostu zaakceptować, nie ma bowiem możliwości poznania jego działania. Gdyby nawet istniała możliwość dokonania w nim zmian to i tak potrafiliby tego dokonać tylko informatycy.

Można polepszyć tzw. pozorną relewancję, jeśli przeanalizuje się cechy zapytań zapewniających uzyskanie „dobrych” wyników oraz wyniki dokonanych przez system wyszukiwań. Umożliwiłoby to orientację w zakresie zasobów Internetu dla danego systemu wyszukiwawczego oraz rozeznanie co do tego, jakich terminów lub jakich kombinacji terminów powinno się używać, aby zwiększyć prawdopodobieństwo "idealnych” odpowiedzi (oraz jakich terminów lub

12



Wyszukiwarka

Podobne podstrony:
Używaj słownika efektywnie I Przypadek użycia 5. System prosi klienta o podanie [danych
Diagramy sekwencji (UML) Modelują zachowanie systemu (scenariusz), najczęściej jakiś przypadek
skanuj0466 (2) Rozdział 18. ♦ System zbierania opinii 483 W przypadku gdy skrypt zostanie wywołany p
3. Źródła obowiązującego prawa cywilnego 21 zaobserwować można wzajemne wpływy tych systemów na sieb
WIESŁAW BABIK 82 systemach bibliotecznych znajduje wyraz w zmianach terminologii, np. nazwy z użytko
Systemes de caisses-enregistreuses et terminaux d’encaissements La competence OMRONapplitec •
8 Paweł Cabała dwóch wykluczających się relacji może być w takich przypadkach nadmiernym
IMG?51 30 O inierifk.iluahwid jące; w takich przypadkach mówić można o intertekstualności narzuconej

więcej podobnych podstron