nie więcej niż dwie wymienione, podlegają one ciągłym modyfikacjom w krótkim czasie. Aktualne dane o przeglądarkach i dostępie do nich można znaleźć pod adresem internetowym http://www.browsers.com.
Wyszukiwarki są specjalnymi programami komputerowymi służącymi do przeszukiwania zasobów Internetu, zbierania danych o dostępnych stronach WWW oraz tworzenia na tej podstawie baz danych. Przykład 4.JO ilustruje pracę zespołu specjalistów z firmy IBM Almaden Research Center z San Jose w Kalifornii. Rezultatem tej pracy jest nowa wyszukiwarka o nazwie Clever. Wyszukiwarki wyglądają tak samo jak standardowe strony WWW, wyróżniają je jedynie specjalne okienka, do których można wpisać termin lub słowa-kluczc. Wyszukiwarka porównuje ten termin ze swoją bazą danych i tworzy listę stron odpowiadających podanym kryteriom, czyli tzw. hitom (trafieniom). Każda wyszukiwarka prowadzi poszukiwania, przechowuje i odzyskuje dane w odmienny sposób. Przy wyborze wyszukiwarki należy więc zwrócić uwagę na to, która z nich ma największą i najbardziej aktualną bazę danych, czy oferuje dodatkowe komendy zawężające obszar poszukiwań oraz jak długo trzeba czekać na wykaz odpowiedzi. Obecnie największe bazy danych zawierają takie wyszukiwarki, jak: AltaVisła, Yahoo!, HotBot oraz Northern Light. Oprócz wymienionych znane są jeszcze takie wyszukiwarki, jak Infoseek czy Excite. Cały ich przegląd, wraz z opisem poszczególnych narzędzi wyszukujących, można znaleźć pod adresem http://www.searchenginewatch.com. Należy jednak pamiętać, że każda wyszukiwarka tworzy listę na podstawie najnow-
Zespół 8 pracowników naukowych, z których 6 pracuje w IBM Almaden Research Center, a pozostałych dwóch — w Cornel University oraz w University of Catifornia, opracował nowoczesną technikę (o nazwie Clever — spryciara) znajdowania danych w dżungli internetowej opartą na wykorzystaniu struktury hiperłączy. Analizując te odnośniki, Clever automatycznie identyfikuje dwa typy witryn internetowych: strony źródłowe z danymi autorytatywnymi, tzw. źródła (authorities), oraz węzły {hubs). Te pierwsze są najlepszymi, bo oryginalnymi źródłami informacji na określony temat, drugie zaś są zbiorami odnośników do źródeł. Clever wykorzystuje dwufazowy proces iteracyjny. W pierwszej fazie używa bieżącej oceny źródeł informacji, aby polepszyć estymaty węzłów odnośników, w drugiej zaś używa ulepszonych ocen węzłów, aby polepszyć estymaty źródeł informacji. Pozwala to na stworzenie nowej, bardziej wiarygodnej listy źródeł informacji. Wielokrotne powtarzanie tej procedury prowadzi do optymalnego wyboru.
Źródło: Hiporprzoszukiwanic Sieci. .Świat Nauki" 1999, sierpień.
161