2 Wyszukiwarki, metawyszukiwarki, katalogi


Wyszukiwarki
Metawyszukiwarki
Katalogi
Google Docs
uzytkownik: wsus.katowice
hasło: wsus1234
Wyszukiwarki, metawyszukiwarki, katalogi
Zasada działania wyszukiwarek:
- robot (pająk) "chodzący" po sieci hipertekstu
- zapis do baz danych zawartości stron automat.,
- indeksowanie zawartości stron i obiektów na stronach
- dostęp - moduł wyszukujący - odnalezienie fraz w indeksach i
wyświetlenie listy skojarzonych z frazą stron
jakość odpowiedzi:
- algorytmy szeregujące listy odpowiedzi
- "zakres" wyszukiwarki (ilość stron, typy dokumentów,
geografia)
- indeksowanie plików różnych formatów
Wyszukiwarki, metawyszukiwarki, katalogi
http://www.link2city.com/web-marketing-how-search-engine-work.htm
Wyszukiwarki, metawyszukiwarki, katalogi
Zasada działania wyszukiwarek:
ranking odpowiedzi zależy od:
- proporcji liczby szukanych słów w tekscie do całkowitej ilosci
słów - ile razy dane słowo wystepuje w tekscie,
- wystepowania hasła w tytule strony, w jednym z nagłówków,
- pozycji (strony, na których poszukiwane słowo jest na
poczatku tekstu sa zwykle waniejsze),
- wystepowania hasła w nazwie domeny, katalogu lub pliku,
- wystepowania hasła w tzw. znacznikach META linków
(połaczen) do tej strony z innych stron.
jak to robi Google?
(cytowania, anchory, ruch + 97 innych)
Wyszukiwarki, metawyszukiwarki, katalogi
Polskojęzyczne wyszukiwarki:
Google - http://www.google.pl
Gooru - http://www.gooru.pl
Netsprint - http://www.netsprint.pl
Szukacz - http://www.szukacz.pl
Inne:
http://www.altavista.com/
http://search.yahoo.com
http://www.alltheweb.com
http://ask.com
http://www.bing.com/
Wyszukiwarki, metawyszukiwarki, katalogi
Zasada działania metawyszukiwarek (zwanych też
multiwyszukiwarkami):
- "meta", czyli "nad"
- odpytują równolegle wiele wyszukiwarek
- usuwają (lub scalają) wyniki powielone
- nie posiadają własnych indeksów
Wyszukiwarki, metawyszukiwarki, katalogi
Metawyszukiwarki - przykłady:
Metacrawler - http://www.metacrawler.com
7metasearch - http://7metasearch.com
All4One - http://www.all4one.com
Mamma - http://www.mamma.com
Kartoo - www.kartoo.com
i szereg innych
Wyszukiwarki, metawyszukiwarki, katalogi
Wyszukiwarki kontekstowe:
- pozwalają grupować wyniki wyszukiwania według
dodatkowych powiązań tematycznych pomiędzy dokumentami
- wskazują dodatkowy kontekst, w którym występuje słowo lub
wyrażenie wyszukiwawcze podane przez użytkownika
-kontekst w oparciu o podobieństwo (logiczne, probabilistyczne,
lingwistyczne)
Clusty - http://www.clusty.com
Scirus - http://www.scirus.com (także Deep Web)
Wyszukiwarki, metawyszukiwarki, katalogi
Charakterystyka katalogów:
- są tworzone przez redaktorów (ręcznie), (może być wspomagane przez automaty)
- w katalogach indeksowane są wyłącznie strony główne witryn internetowych;
- zasoby pojedyńczego katalogu stanowią zaledwie mały procent baz danych
wyszukiwarek internetowych;
- budowa:
a. informacje dostępne są w systemie hierarchicznym, co umożliwia przeglądanie
poszczególnych kategorii
głównych, podrzędnych oraz powiązanych
b. informacje nie są indeksowane pełnotekstowo - umieszczane są tylko podstawowe
metadane dotyczące zasobu internetowego: tytuł strony, opis zawartości, adres URL oraz
opcjonalnie słowa kluczowe, typ zasobu i
autor (indywidualny lub korporatywny)
- budowa katalogu wpływa na możliwości wyszukiwania w nim informacji: jest nim
przeglądanie zasobów poprzez wertowanie kategorii lub też korzystanie z wyszukiwarki
wewnętrznej, która pozwala jednak na przeszukanie wyłącznie tych informacji, które są
zaindeksowane;
Wyszukiwarki, metawyszukiwarki, katalogi
Katalogi - przykłady:
- Yahoo!Directory - http://dir.yahoo.com/
- Google - http://www.google.pl/dirhp
- Excite - http://www.excite.com/
- DMOZ - http://www.dmoz.org/
- DMOZ (polski) - http://www.dmoz.org/World/Polski/
- Wirtualna Polska - http://katalog.wp.pl/
- Onet - http://katalog.onet.pl/
+ tysiące katalogów SEO (magazyny linków dla Google)
Wyszukiwarki, metawyszukiwarki, katalogi
Wyszukiwanie - ograniczanie zakresu wyszukiwania:
Metawyszukiwanie -wyszukiwanie w określonych częściach strony
internetowej.
title: pozwala na wyszukanie stron internetowych i dokumentów
elektronicznych, które w tytule zadaną frazę:
intitle: "fraza" (w tytule)
lub
allintitle: fraza (wszystko w tytule)
url: (inurl: allinurl: ) poszukuje słów lub wyrażeń w adresach
internetowych stron i dokumentów
text: (intext: allintext: ) poszukuje słów lub wyrażeń wyłącznie w tekście
strony lub dokumentu (pomijając tytuł,
opisy grafiki, opisy hiperłączy itp.)
Wyszukiwarki, metawyszukiwarki, katalogi
Wyszukiwanie - ograniczanie zakresu wyszukiwania:
anchor: (inanchor: allinanchor: ) poszukuje słów lub wyrażeń w treści
hiperłączy zdefiniowanych na stronach
internetowych i w dokumentach
site: przeszukuje zawartość jednej wybranej witryny internetowej lub
domeny (np. us.edu.pl lub gov.pl) Zapytania z
użyciem site: mają postać:
"granty europejskie" site:gov.pl
filetype: poszukuje określonego formatu pliku. Polecenie filetype: ma
składnię podobną do polecenia site:
"Jan K." filetype:ppt (wyszuka prezentacje PowerPoint zawierające w
tekście wyrażenie "Jan K.")
drzewo filetype:pdf (wyszuka dokumenty w formacie PDF zawierające
słowo "drzewo")
Wyszukiwarki, metawyszukiwarki, katalogi
Wyszukiwanie - ograniczanie zakresu wyszukiwania:
related: odnajduje strony internetowe powiązane z adresem z
zapytania np.:
related: onet.pl (w wynikach znajdziemy portale i serwisy informacyjne,
gdyż takim serwisem jest Onet)
related: toyota.com (w wynikach otrzymamy strony firm
motoryzacyjnych)
link: w odpowiedzi otrzymamy strony, na których znajdują się
hiperłącza do witryny, o którą pytamy, np.:
link:onet.pl (w odpowiedzi otrzymamy strony internetowe zawierające
odsyłacz do serwisu Onet)
define: (składnia specjalna obsługiwana w wyszukiwarce Google)
pozwala odszukać definicje encyklopedyczne i słownikowe. (ang.)
define:infobroker
Wyszukiwarki, metawyszukiwarki, katalogi
Wyszukiwanie - modyfikacje warunków wyszukiwawczych:
Operatory logiczne:
AND
OR
NEAR
"" (fraza)
- (wykluczenie)
* (zastępowanie)
ale jest "wyszukiwanie zaawansowane", np.:
http://www.google.pl/advanced_search?hl=pl
http://www.netsprint.pl/serwis/search?adv=1
http://search.yahoo.com/web/advanced?ei=UTF-8&fr=yfp-t-701
http://www.alltheweb.com/advanced?advanced=1&&q=
Wyszukiwarki, metawyszukiwarki, katalogi
Ciekawostki:
http://www.chacha.com/
http://www.mahalo.com/
http://www.wolframalpha.com/
http://tineye.com/
http://www.uczelnie.org/
www.yasni.de
http://wyczajka.com/
Monitoring wyszukiwawczy:
Google Alert - wysyłanie wyników wyszukiwania na maila.


Wyszukiwarka

Podobne podstrony:
Wyszukiwarki metawyszukiwarki katalogi
Wyszukiwarki i katalogi stron (2)
Optymalizacja serwisow internetowych Tajniki szybkosci, skutecznosci i wyszukiwarek
katalog powojniki?rwaplclematis split
katalog okrywowe atrakcjaplclematis main
katalog powojniki grupy heracleifoliaenclematis main
Darmowa wyszukiwarka styl TIGER
katalog2
program szkolenia specjalistycznego www katalogppoz pl
Folder roboczy katalog
Katalog bram
Katalog układów logicznych CMOS serii 4000
wyszukiwanie

więcej podobnych podstron