World Wide Web-technologiczny cud czy informacyjny nieład?
Cyfrowa pragmatyka Sieci. dr Konrad Dominas
przed spiderami34 Problemem robotów są również dynamicznie generowane adresy URL (aplikacje Flash, rozszerzenia .asp, .php, .jsp), które w nielicznych przypadkach mogą spowodować uwięzienie pająka i w efekcie jego zawieszenie poprzez nieustanne zapisywanie tych samych elementów witryn.
Konkludując powyższe zastrzeżenia, należy podkreślić, iż nie istnieją takie algorytmy, które pozwalałyby pracującym w oparciu o nie narzędziom gromadzić, klasyfikować i udostępniać wiedzę tak, jak czyni to ludzki umysł. Problem ten jest nieustającym wyzwaniem dla wszystkich instytucji i organizacji odpowiedzialnych za rozwój WWW.
Mówiąc o statusie ontologicznym rozmaitych treści w Sieci, nie sposób jednak pominąć w nim rolę wyszukiwarek. To one wyznaczają obszar badań, pozwalają na szybki dostęp do właściwych materiałów, pokazują jak szukać i jaką drogą podążać. Posługiwanie się takimi terminami, jak rozproszenie czy dekonstruowanie się materiału internetowego zazwyczaj pokazuje sposób, w jaki algorytmy wyszukiwarek zmieniają - w postaci rankingu stron - ustalone w literaturze przedmiotu pojęcia związane z określoną dziedziną wiedzy. Badanie znalezionych i określonych już witryn zawsze będzie próbą kategoryzowanie tego, co w przypadku materiału internetowego nie można, z uwagi na dynamiczność Sieci, klasyfikować. Dlaczego?
Każdy, kto kiedykowiek chciał zmierzyć się z opisaniem określonej treści w WWW, powinien wziąć pod uwagę, że te same informacje objawiają się w różnych aspektach, a każdy z nich ma własne wyznaczniki, które wpływają znacząco na obecny w Internecie materiał. Problemem staje się więc nie tylko uchwycenie dynamicznych wciąż treści za pomocą wyszukiwarek internetowych, lecz także sposób ich opisania. Przypomina to sytuację, w której chcemy zrobić zdjęcie poruszającemu się z niezwykłą prędkością obiektowi.
34/ http://www.wszpwn.com.pl/wszpwn/_gAllery/48/79/48797.doc.