Wyszukiwarki
Metawyszukiwarki
Katalogi
Wyszukiwarki, metawyszukiwarki, katalogi
Zasada działania wyszukiwarek:
- robot (pająk) "chodzący" po sieci hipertekstu
- zapis do baz danych zawartości stron automat.,
- indeksowanie zawartości stron i obiektów na stronach
- dostęp - moduł wyszukujący - odnalezienie fraz w indeksach i
wyświetlenie listy skojarzonych z frazą stron
jakość odpowiedzi:
- algorytmy szeregujące listy odpowiedzi
- "zakres" wyszukiwarki (ilość stron, typy dokumentów,
geografia)
- indeksowanie plików różnych formatów
Wyszukiwarki, metawyszukiwarki, katalogi
http://www.link2city.com/web-marketing-how-search-engine-work.htm
Wyszukiwarki, metawyszukiwarki, katalogi
Zasada działania wyszukiwarek:
ranking odpowiedzi zależy od:
- proporcji liczby szukanych słów w tekscie do całkowitej ilosci
słów - ile razy dane słowo wystepuje w tekscie,
- wystepowania hasła w tytule strony, w jednym z nagłówków,
- pozycji (strony, na których poszukiwane słowo jest na
poczatku tekstu sa zwykle waniejsze),
- wystepowania hasła w nazwie domeny, katalogu lub pliku,
- wystepowania hasła w tzw. znacznikach META linków
(połaczen) do tej strony z innych stron.
jak to robi Google?
(cytowania, anchory, ruch + 97 innych)
Wyszukiwarki, metawyszukiwarki, katalogi
Polskojęzyczne wyszukiwarki:
Google - http://www.google.pl
Gooru - http://www.gooru.pl
Netsprint - http://www.netsprint.pl
Szukacz - http://www.szukacz.pl
Inne:
http://www.altavista.com/
http://search.yahoo.com
http://www.alltheweb.com
http://ask.com
http://www.bing.com/
Wyszukiwarki, metawyszukiwarki, katalogi
Zasada działania metawyszukiwarek:
- "meta", czyli "nad"
- odpytują równolegle wiele wyszukiwarek
- usuwają wyniki powielone
- nie posiadają własnych indeksów
Wyszukiwarki, metawyszukiwarki, katalogi
Metawyszukiwarki - przykłady:
Metacrawler - http://www.metacrawler.com
7metasearch - http://7metasearch.com
All4One - http://www.all4one.com
Mamma - http://www.mamma.com
Kartoo - www.kartoo.com
http://www.raz-dwa-trzy.com/
Wyszukiwarki, metawyszukiwarki, katalogi
Wyszukiwarki kontekstowe:
- pozwalają grupować wyniki wyszukiwania według
dodatkowych powiązań tematycznych pomiędzy dokumentami
- wskazują dodatkowy kontekst, w którym występuje słowo lub
wyrażenie wyszukiwawcze podane przez użytkownika
-kontekst w oparciu o podobieństwo (logiczne, probabilistyczne,
lingwistyczne)
Clusty - http://www.clusty.com
KoolTorch - http://www.kooltorch.com
SearchMe - http://www.searchme.com
Scirus - http://www.scirus.com
Wyszukiwarki, metawyszukiwarki, katalogi
Charakterystyka katalogów:
- są tworzone przez redaktorów (ręcznie), (może być wspomagane przez
automaty)
- w katalogach indeksowane są wyłącznie strony główne witryn internetowych;
- zasoby pojedyńczego katalogu stanowią zaledwie mały procent baz danych
wyszukiwarek internetowych;
- budowa:
a. informacje dostępne są w systemie hierarchicznym, co umożliwia
przeglądanie poszczególnych kategorii
głównych, podrzędnych oraz powiązanych
b. informacje nie są indeksowane pełnotekstowo - umieszczane są tylko
podstawowe metadane dotyczące zasobu internetowego: tytuł strony, opis
zawartości, adres URL oraz opcjonalnie słowa kluczowe, typ zasobu i
autor (indywidualny lub korporatywny)
- budowa katalogu wpływa na możliwości wyszukiwania w nim informacji: jest
nim przeglądanie zasobów poprzez wertowanie kategorii lub też korzystanie z
wyszukiwarki wewnętrznej, która pozwala jednak na przeszukanie
wyłącznie tych informacji, które są zaindeksowane;
Wyszukiwarki, metawyszukiwarki, katalogi
Katalogi - przykłady:
- Yahoo!Directory - http://dir.yahoo.com/
- Google - http://www.google.pl/dirhp
- Excite - http://www.excite.com/
- DMOZ - http://www.dmoz.org/
- DMOZ (polski) - http://www.dmoz.org/World/Polski/
- Wirtualna Polska - http://katalog.wp.pl/
- Onet - http://katalog.onet.pl/
+ tysiące katalogów SEO (magazyny linków dla Google)
Wyszukiwarki, metawyszukiwarki, katalogi
Wyszukiwanie - ograniczanie zakresu wyszukiwania:
Metawyszukiwanie -wyszukiwanie w określonych częściach strony
internetowej.
title: pozwala na wyszukanie stron internetowych i dokumentów
elektronicznych, które w tytule zadaną frazę:
intitle: "fraza" (w tytule)
lub
allintitle: fraza (wszystko w tytule)
url: (inurl: allinurl: ) poszukuje słów lub wyrażeń w adresach
internetowych stron i dokumentów
text: (intext: allintext: ) poszukuje słów lub wyrażeń wyłącznie w tekście
strony lub dokumentu (pomijając tytuł,
opisy grafiki, opisy hiperłączy itp.)
Wyszukiwarki, metawyszukiwarki, katalogi
Wyszukiwanie - ograniczanie zakresu wyszukiwania:
anchor: (inanchor: allinanchor: ) poszukuje słów lub wyrażeń w treści
hiperłączy zdefiniowanych na stronach
internetowych i w dokumentach
site: przeszukuje zawartość jednej wybranej witryny internetowej lub
domeny (np. us.edu.pl lub gov.pl) Zapytania z
użyciem site: mają postać:
"granty europejskie" site:gov.pl
filetype: poszukuje określonego formatu pliku. Polecenie filetype: ma
składnię podobną do polecenia site:
"Jan K." filetype:ppt (wyszuka prezentacje PowerPoint zawierające w
tekście wyrażenie "Jan K.")
drzewo filetype:pdf (wyszuka dokumenty w formacie PDF zawierające
słowo "drzewo")
Wyszukiwarki, metawyszukiwarki, katalogi
Wyszukiwanie - ograniczanie zakresu wyszukiwania:
related: odnajduje strony internetowe powiązane z adresem z
zapytania np.:
related: onet.pl (w wynikach znajdziemy portale i serwisy informacyjne,
gdyż takim serwisem jest Onet)
related: toyota.com (w wynikach otrzymamy strony firm
motoryzacyjnych)
link: w odpowiedzi otrzymamy strony, na których znajdują się
hiperłącza do witryny, o którą pytamy, np.:
link:onet.pl (w odpowiedzi otrzymamy strony internetowe zawierające
odsyłacz do serwisu Onet)
define: (składnia specjalna obsługiwana w wyszukiwarce Google)
pozwala odszukać definicje encyklopedyczne i słownikowe. (ang.)
define:infobroker
Wyszukiwarki, metawyszukiwarki, katalogi
Wyszukiwanie - modyfikacje warunków wyszukiwawczych:
Operatory logiczne:
AND
OR
NEAR
"" (fraza)
- (wykluczenie)
* - zastępowanie
ale jest "wyszukiwanie zaawansowane", np.:
http://www.google.pl/advanced_search?hl=pl
http://www.netsprint.pl/serwis/search?adv=1
http://search.yahoo.com/web/advanced?ei=UTF-8&fr=yfp-t-701
http://www.alltheweb.com/advanced?advanced=1&&q=
Wyszukiwarki, metawyszukiwarki, katalogi
Ciekawostki:
http://www.chacha.com/
http://www.mahalo.com/
http://www.wolframalpha.com/
http://tineye.com/
http://www.uczelnie.org/
Monitoring wyszukiwawczy:
Google Alert - wysyłanie wyników wyszukiwania na maila.
Wyszukiwarka
Podobne podstrony:
2 Wyszukiwarki, metawyszukiwarki, katalogiWyszukiwarki i katalogi stron (2)Optymalizacja serwisow internetowych Tajniki szybkosci, skutecznosci i wyszukiwarekkatalog powojniki?rwaplclematis splitkatalog okrywowe atrakcjaplclematis mainkatalog powojniki grupy heracleifoliaenclematis mainDarmowa wyszukiwarka styl TIGERkatalog2program szkolenia specjalistycznego www katalogppoz plFolder roboczy katalogKatalog bramKatalog układów logicznych CMOS serii 4000wyszukiwaniewięcej podobnych podstron