Temat:
„Wyszukiwarki internetowe i zasady wyszukiwania informacji w internecie”
Wyszukiwarki lub katalogi są zasobami sieci, które śledzą informacje dostępne w internecie i odpowiadają każdemu pytającemu co jest gdzie w Internecie.
Chociaż wyszukiwarki i katalogi stanowią różne narzędzia do wyszukiwania w Internecie, to termin "wyszukiwarka" będzie używany zamiennie, jako że pod względem funkcjonowania są bardzo podobne.
Wyszukiwarki są dużymi bazami danych oraz indeksów, do których jest dostęp poprzez stronę WWW wyszukiwarki. Wielkość tych baz danych jest olbrzymia i z każdym dniem się powiększa. Co zrobić, żeby znaleźć informację, serwis lub produkt w takim morzu danych? Wystarczy użyć wyszukiwarki. Lecz nie jest to takie proste. Jeśli szukasz określonych informacji otrzymujesz z wyszukiwarki dużą ilość spokrewnionych ze sobą odpowiedzi, uporządkowanych według pewnej logiki. Ta uporządkowana lista dokumentów czasami obejmuje tysiące pozycji. Osoba, która szuka danych nie wychodzi poza pierwszą dwudziestkę albo trzydziestkę odpowiedzi. Zatem reszta wyników wyszukiwania nie bywa przeglądana, chociaż mogą tam się znajdować bardziej związane z przedmiotem poszukiwań. Jeśli więc chcesz, aby twoje strony były oglądane należy zadbać o pozycję w pierwszej trzydziestce znajdowanych dokumentów.
Ogólnie mówiąc wyszukiwarki to oprogramowanie którego zadaniem jest zbieranie informacji zawartych na stronach, przetwarzanie ich i prezentowanie użytkownikowi w przystępny sposób.
W praktyce to wygląda to tak, że szukając informacji na jakiś temat wpisujemy do wyszukiwarki słowa związane z danym tematem i otrzymujemy listę stron które powinny zawierać to czego szukamy. Skąd jednak wyszukiwarka wie jakie strony ma wyświetlić? Wszystko zaczyna się od robotów (zwanych też pająkami ), które przeczesują sieć w poszukiwaniu stron. Kiedy robot odwiedzi serwer, zaczyna czytać strony podążając za linkami na niej zawartymi. Każdy robot jest inny i czyta co innego, zwraca szczególną uwagę na niektóre elementy stron a inne pomija. Wszystko to co znalazł przekazuje do bazy. Baza to tzw. Serce wyszukiwarki. Tu przechowywane są wszystkie informacje o odwiedzonych przez roboty stronach. Trzecim elementem wyszukiwarki jest sam mechanizm wyszukiwawczy, oprogramowanie które przyjmuje od nas zapytania i wertuje swój indeks w poszukiwaniu czegoś, co mogłoby nam pomóc. To właśnie od algorytmu tego oprogramowania zależy, która strona będzie pierwsza, a która z numerem 99000 na liście wyświetlonych wyników.
Do niedawna większość algorytmów opierała się na częstotliwości występowania słów kluczowych w dokumencie HTML. Jeżeli poszukiwane słowo występowało w tytule strony, jej opisie, metodach oraz często powtarzało się w tekście, to strona taka miała duże szanse na wysoką pozycję na liście wyników. Dziś sprawa jest dużo bardziej skomplikowana. Nowoczesne wyszukiwarki przykładają większą wagę do tematyki strony oraz do jej popularności. Wyszukiwarki nowej generacji próbują odgadnąć o czym właściwie jest ta strona, analizując zarówno zawartość samej strony jak i stron, do których prowadzą od niej linki. Nie bez znaczenia stała się popularność strony, im większa, tym większa pozycja w rankingu.
Powróćmy jednak jakie wyszukiwarki powinny interesować właściciela polskiej strony.
Najważniejsze to:
Onet,
Wirtualna Polska,
Google,
NetSprint.
Pierwsze dwie firmy to najpopularniejsze firmy w Polsce, absolutni liderzy na rynku. Onet wykorzystuje, wyglądający na „niezniszczalny” mechanizm Infoseeka do przeszukiwania polskich zasobów oraz Altavistę do zasobów świtowych. WP do krajowych zasobów zatrudnia norweskiego FASTa natomiast w poszukiwaniu światowych posiłkuje się wynikami z bazy Google. Sam Google od pewnego czasu obsługuje język polski, a ponieważ to gigant w branży wyszukiwarek więc zalicza się go do najważniejszej czwórki. Natomiast NetSprint przebojem wdziera się na polski rynek, świetnie i szybko przeszukuje Polski Internet.
Pozostali generują mniejszy ruch a także nie zawsze poprawnie działają ale mimo to nie można ich pomijać. Są to: Interia, Hoga, Poland.com, Gazeta.pl
5 najwazniejszych wyszukiwarek w tej chwili to:
Altavista
Excite
FASt
Inktomi
Prawdopodobnie już niedługo tylko Google pozostanie jedyna z tej piątki wyszukiwarką, która będzie indeksować strony za darmo (ściślej mówiąc: indeksować w rozsądnym terminie). Inktomi i FAST już pobierają opłaty za dodanie indeksu. Altacista zacznie to robić od przyszłego lata a Excite do końca roku. Na koniec można rozważać obecność płatnej wyszukiwarki GoTo. Jej popularność jest jej atutem a idea jej działania polega na płatnym wykupie pozycji na liście wyników wyszukiwarek.
1
Najważniejszą rzeczą jest zrozumienie logiki wyszukiwania aby tak zaprojektować swoje strony , by ukazywały się na wysokich miejscach odpowiedzi, jakiej udziela wyszukiwarka na zadane zapytanie.