19.11.2013, Sapa
Jak działa wyszukiwarka?
Nie widzi wszystkiego, ale i tak znajdzie więcej niż człowiek może "wchłonąć".
Wyszukiwarki indeksują słowa ważne, znaczące; nie indeksują : na, do, od, i, oraz, pod, a, lub, itp.
Wyszukiwarki nie indeksują całych dokumentów!
Wyszukiwarka ze względów funkcjonalnych zbudowana jest z 4 podstawowych elementów: [ang.
search engine]
1 – Szperacz (inaczej: bot, robot)- program indeksujący (software),
który wędruje po linkach od strony do strony i je indeksuje
2 – Indeks (inaczej : baza wyszukiwarki) – lista terminów, które
szperacz znalazł w sieci, np. dokonuje analiz statystycznych. Jest
efektem pracy szperacza
3 – Interfejs – część webu która odpowiada za komunikację między
Internetem a użytkownikiem. Pozwala na zadanie pytania i
otrzymanie odpowiedzi. Interfejs jest tym co widzą użytkownicy
4 – Algorytm rankingowy – decyduje o kolejności wyświetlania
wyników w zbiorze wyników wyszukiwania.
SZPERACZ - dla informatyków: search engine;
Jeżeli interfejs nie pozwala nam zapytać (nie mamy narzędzia by o coś zapytać) to mimo tego że dane
są w bazie, nie mamy możliwości by je odnaleźć.
Interfejs ważny jest w dwóch momentach: zadania pytania i odbierania wyników.
Wyniki wyszukiwania są przedstawione w formie listy, uporządkowane wg relewantności
(Odpowiedności wobec zapytania)
Dziś
relewantność
oznacza zgodność z potrzebą (przykład Sapy: chcę makowca – dostaję makowca);
tradycyjnie oznacza odpowiednią zgodność z zapytaniem (przykład Sapy: chce makowca – proszę
ciasto – dostaję sernik).
Pertynentność
natomiast oznacza zaspokajanie potrzeb.
Czyli…
Odpowiedź relewantna – odpowiedź zgodna z potrzebą;
Odpowiedź pertynentna – odpowiedź zgodna z zadanym pytaniem (Choć nie otrzymujemy tego czego
potrzebujemy)
1
2
3
4
www.ranking.pl
% ludzi, którzy używają konkretnych wyszukiwarek:
onet - poniżej 1 %
67% google
17% Bing
12 % Yahoo
http://www.thumbshots.com
Literatura dla chętnych:
Tomaszczyk Jacek (2008). Clustering w wyszukiwarkach internetowych. Praktyka i Teoria Informacji
Naukowej i Technicznej, nr 1, s. 26-31
Algorytm rankingowy: (co decyduje o tym, że wyniki ustawione są w takiej a nie innej kolejności) jest
bardzo ważny dla interesów które reklamują się w Internecie (np. księgarnie internetowe)
wiedzę na temat działania algorytmów czerpiemy między innymi z wyszukiwarek (porady jak
efektywnie wyszukiwać).