Wyszukiwarki
Metawyszukiwarki
Katalogi
Google Docs
uzytkownik: wsus.katowice
hasło: wsus1234
Wyszukiwarki, metawyszukiwarki, katalogi
Zasada działania wyszukiwarek:
- robot (pająk) "chodzący" po sieci hipertekstu
- zapis do baz danych zawartości stron automat.,
- indeksowanie zawartości stron i obiektów na stronach
- dostęp - moduł wyszukujący - odnalezienie fraz w indeksach i
wyświetlenie listy skojarzonych z frazą stron
jakość odpowiedzi:
- algorytmy szeregujące listy odpowiedzi
- "zakres" wyszukiwarki (ilość stron, typy dokumentów,
geografia)
- indeksowanie plików różnych formatów
Wyszukiwarki, metawyszukiwarki, katalogi
http://www.link2city.com/web-marketing-how-search-engine-work.htm
Wyszukiwarki, metawyszukiwarki, katalogi
Zasada działania wyszukiwarek:
ranking odpowiedzi zależy od:
- proporcji liczby szukanych słów w tekscie do całkowitej ilosci
słów - ile razy dane słowo wystepuje w tekscie,
- wystepowania hasła w tytule strony, w jednym z nagłówków,
- pozycji (strony, na których poszukiwane słowo jest na
poczatku tekstu sa zwykle waniejsze),
- wystepowania hasła w nazwie domeny, katalogu lub pliku,
- wystepowania hasła w tzw. znacznikach META linków
(połaczen) do tej strony z innych stron.
jak to robi Google?
(cytowania, anchory, ruch + 97 innych)
Wyszukiwarki, metawyszukiwarki, katalogi
Polskojęzyczne wyszukiwarki:
Google -
Gooru -
Netsprint -
Szukacz -
Inne:
http://www.altavista.com/
http://search.yahoo.com
http://www.alltheweb.com
http://ask.com
http://www.bing.com/
Wyszukiwarki, metawyszukiwarki, katalogi
Zasada działania metawyszukiwarek (zwanych też
multiwyszukiwarkami):
- "meta", czyli "nad"
- odpytują równolegle wiele wyszukiwarek
- usuwają (lub scalają) wyniki powielone
- nie posiadają własnych indeksów
Wyszukiwarki, metawyszukiwarki, katalogi
Metawyszukiwarki - przykłady:
7metasearch -
All4One -
Mamma -
Wyszukiwarki, metawyszukiwarki, katalogi
Wyszukiwarki kontekstowe:
- pozwalają grupować wyniki wyszukiwania według
dodatkowych powiązań tematycznych pomiędzy dokumentami
- wskazują dodatkowy kontekst, w którym występuje słowo lub
wyrażenie wyszukiwawcze podane przez użytkownika
-kontekst w oparciu o podobieństwo (logiczne, probabilistyczne,
lingwistyczne)
Clusty -
Scirus -
(także Deep Web)
Wyszukiwarki, metawyszukiwarki, katalogi
Charakterystyka katalogów:
- są tworzone przez redaktorów (ręcznie), (może być wspomagane przez automaty)
- w katalogach indeksowane są wyłącznie strony główne witryn internetowych;
- zasoby pojedyńczego katalogu stanowią zaledwie mały procent baz danych
wyszukiwarek internetowych;
- budowa:
a. informacje dostępne są w systemie hierarchicznym, co umożliwia przeglądanie
poszczególnych kategorii
głównych, podrzędnych oraz powiązanych
b. informacje nie są indeksowane pełnotekstowo - umieszczane są tylko podstawowe
metadane dotyczące zasobu internetowego: tytuł strony, opis zawartości, adres URL oraz
opcjonalnie słowa kluczowe, typ zasobu i
autor (indywidualny lub korporatywny)
- budowa katalogu wpływa na możliwości wyszukiwania w nim informacji: jest nim
przeglądanie zasobów poprzez wertowanie kategorii lub też korzystanie z wyszukiwarki
wewnętrznej, która pozwala jednak na przeszukanie wyłącznie tych informacji, które są
zaindeksowane;
Wyszukiwarki, metawyszukiwarki, katalogi
Katalogi - przykłady:
- Yahoo!Directory -
- Google -
- Excite -
- DMOZ -
- DMOZ (polski) -
http://www.dmoz.org/World/Polski/
- Wirtualna Polska -
- Onet -
Wyszukiwarki, metawyszukiwarki, katalogi
Wyszukiwanie - ograniczanie zakresu wyszukiwania:
Metawyszukiwanie -wyszukiwanie w określonych częściach strony
internetowej.
title: pozwala na wyszukanie stron internetowych i dokumentów
elektronicznych, które w tytule zadaną frazę:
intitle: "fraza" (w tytule)
lub
allintitle: fraza (wszystko w tytule)
url: (inurl: allinurl: ) poszukuje słów lub wyrażeń w adresach
internetowych stron i dokumentów
text: (intext: allintext: ) poszukuje słów lub wyrażeń wyłącznie w tekście
strony lub dokumentu (pomijając tytuł,
opisy grafiki, opisy hiperłączy itp.)
Wyszukiwarki, metawyszukiwarki, katalogi
Wyszukiwanie - ograniczanie zakresu wyszukiwania:
anchor: (inanchor: allinanchor: ) poszukuje słów lub wyrażeń w treści
hiperłączy zdefiniowanych na stronach
internetowych i w dokumentach
site: przeszukuje zawartość jednej wybranej witryny internetowej lub
domeny (np. us.edu.pl lub gov.pl) Zapytania z
użyciem site: mają postać:
"granty europejskie" site:gov.pl
filetype: poszukuje określonego formatu pliku. Polecenie filetype: ma
składnię podobną do polecenia site:
"Jan K." filetype:ppt (wyszuka prezentacje PowerPoint zawierające w
tekście wyrażenie "Jan K.")
drzewo filetype:pdf (wyszuka dokumenty w formacie PDF zawierające
słowo "drzewo")
Wyszukiwarki, metawyszukiwarki, katalogi
Wyszukiwanie - ograniczanie zakresu wyszukiwania:
related: odnajduje strony internetowe powiązane z adresem z
zapytania np.:
related: onet.pl (w wynikach znajdziemy portale i serwisy informacyjne,
gdyż takim serwisem jest Onet)
related: toyota.com (w wynikach otrzymamy strony firm
motoryzacyjnych)
link: w odpowiedzi otrzymamy strony, na których znajdują się
hiperłącza do witryny, o którą pytamy, np.:
link:onet.pl (w odpowiedzi otrzymamy strony internetowe zawierające
odsyłacz do serwisu Onet)
define: (składnia specjalna obsługiwana w wyszukiwarce Google)
pozwala odszukać definicje encyklopedyczne i słownikowe. (ang.)
define:infobroker
Wyszukiwarki, metawyszukiwarki, katalogi
Wyszukiwanie - modyfikacje warunków wyszukiwawczych:
Operatory logiczne:
AND
OR
NEAR
"" (fraza)
- (wykluczenie)
* (zastępowanie)
ale jest "wyszukiwanie zaawansowane", np.:
http://www.google.pl/advanced_search?hl=pl
http://www.netsprint.pl/serwis/search?adv=1
http://search.yahoo.com/web/advanced?ei=UTF-8&fr=yfp-t-701
http://www.alltheweb.com/advanced?advanced=1&&q=
Wyszukiwarki, metawyszukiwarki, katalogi
Ciekawostki:
Monitoring wyszukiwawczy:
- wysyłanie wyników wyszukiwania na maila.