cją logiczną dokumentu jest zestaw słów, przez co indeksowany dokument jest p0slr ny jako ich nieuporządkowany zestaw. We współczesnych wyszukiwarkach repre* ^ jest rozbudowana o dodatkowe dane, wskazujące na częstotliwości słów, atrybuty towania tekstu, oraz mctadanc tworzone zgodnie i zasadami HTML [Baeza-Yatcs p,*-lo 2006, s. 530). ‘''n
Sortowanie dokumentów odszukanych odbywa się według algorytmu PageRank i decyduje o miejscu wyszukanej strony na liście stron przedstawionej użytkownikom S gorytnt ten daje zadowalające rezultaty nawet w przypadku, gdy dostępnych jest |v ^ mało informacji o rzeczywistych potrzebach użytkowników. Jakość strony Web w *il(| -° stopniu nic zależy od jej zawartości. Wykorzystuje się wyłącznic strukturę odnośnjll)!1^ w zasobie. Każdy odnośnik to glos oddany na stronę, do której prowadzi, Odnośniki ■ są jednak traktowane równorzędnie. Odnośnik ze strony wysoko postawionej w ranki ^ jest bardziej wartościowy, niż odnośnik z innej strony. Całkowity PageRank strony-?2 sumą wszystkich wartości odnośników wskazujących na nią. Wartość odnośnika od cech strony, od której odnośnik przychodzi: PageRank jest dzielony przez liczb? ^ nośników wychodzących ze strony. W efekcie możliwe jest porównywanie dowolni dwóch stron i określenie ich miejsca w rankingu. Autorzy PageRank wykorzystali J-ideę tzw, mądrości lub inteligencji zbiorowej4*', nazywanej też „mądrością tłumów” uC dącej także cechą serwisów Webu 2.0), uznając, że najlepsze są te strony, które uzysuf w powszechnym głosowaniu użytkowników Internetu najwięcej głosów, innym prawem mądrości zbiorowej, skrzętnie rejestrowanym przez twórców Google są tzw, stJJ' mienie kliknięć {clickstiwn), czyli zjawisko polegające na tym, że subiektywne oceny Sa* modzielnie działających jednostek sumują się we wskazania najwartościowszych miej/ w Internecie2, kierowanie się opinią i doświadczeniami innych, a więc mądrością zbioro wą. jest obecnie jedną z najbardziej użytecznych strategii wyszukiwania informacji [JUz. 2007, s. 47], Jest ona jednak również krytykowana za tworzenie tzw. Google EfTect, czyij mylenie popularności z jakością [Brabazon 2006, s. 160].
nazwą Google Scholar. Wyszukiwarka ta, udostępniona jak dotąd w wersji beta, stawia użytkownikom wyniki wyszukiwań ograniczone do obiektów o treści naukowej go jak się wydaje nie stanowiło wcześniej oferty żadnej innej wyszukiwarki globalnej' Jest to bezpłatnie dostępna usługa internetowa o przyjaznym interfejsie, podobnym do standardowego interfejsu Google. Część obiektów indeksowanych przez Google Scholar znajduje się na serwerach wydawców komercyjnych, skąd dostępne mogą być za opłatą jednak nawet w takich sytuacjach użytkownik ma do dyspozycji przynajmniej opis, często z abstraktem. Jednak znaczną część zasobów Google Scholar stanowią obiekty publiko-wane w trybie Open Access. Często zdarza się. że wyszukiwarka kieruje do dwóch wersji
Oprócz dostępu do pełnych tekstów dokumentów, interesującą ofertę dla użytkowników stanowią analizy wykonywane przez wyszukiwarkę i wynikające z nich rankingi relewancji. Jednym z wielu kryteriów służących rankingowi jest liczba cytowań dokumentu, które zastępują odnośniki do stron Web, uwzględniane w standardowych Google, W efekcie częściej cytowane dokumenty są umieszczane wyżej w rankingu, co ułatwia ich odszukanie przez użytkowników. Dzięki istnieniu indeksu cytowań użytkownik może także śledzić wszystkie cytowania danego dokumentu, co nie jest dostępne w Google -lam wyszukiwarka nie pokazuje odnośników do wyszukanych stron. Automatyczna realizacja indeksu cytowań wymaga, aby odsyłacze bibliograficzne w tekście byty dostępne
»baJaczy Podejmuje próby oceny jątóri wyauiiwm* Google U„
%iy rrzt"lt!l<mc f ,rady«yjnycii w <w
>C u pr/cdslatvionych P^Philipp. M,y« i w, J '"JJ
mSM »z“"f“ * ą»J proponuj, mmZiZwZ
“ani» główn-e dokumentów dos^pnych bezpłatnie onlin*. Moź« ,)ę
;> «*» muowej digittliacji |„J L;(M [lW,S1||
^dzonycii m in. przez Google. Inne bsdania mon fani ^
google Scholar oraz w Scopus i ISI Web of Science, a więc bardziej porównywalnych I \Jisów (Mcho, Yang 2007]. Google pozwala! na lepsze wyszukiwanie w materiałach Serencyjnych (czterokrotnie lepsze wyniki), źródłach nie-anglojęzycznydi (ponad /cściokrotnic) oraz materiałach archiwizowanych na osobistych lub instytucjonalnych tronach Web (w ogóle nie uwzględnianych przez pozostałe zasoby), Scopus oraz Web of Science lepiej natomiast selekcjonują publikacje o wysokiej cytowalności. podczas gdy Liki Google Scholar obciążane są dużą masą słabo cytowanych publikacji Porównanie jakości wyszukiwania w Google i systemach bibliotecznych wskazuje na uzyskiwanie
. ■ I—,„U ..ibLb^kIUiu IfaflW-łi/jl/rtUl, ni^„nn>||/nftu .I..I MA,,___
iJV1niiki. Lotaai' Meho i N^ili wyniki ^
stronacr Science wyniki'
jak^e' identycznych wskaźników trafności (w obu przypadkach około 60%), przy czym1 ^zukiwarka góruje nad OPAC dostępnością wyszukanych materiałów, a katalog biblio-*Ly ich jakością [Brophy, Bawden 2005, s. 510]. Wśród wyszukiwarek Google Scho-r daje najlepszą trafność wyszukiwania treści naukowych (Robinson. Wustcman 2007, | 76]. Wyszukiwarki globalne, takie jak Google i Yahoo są przy tym wyraźnie bardziej Efektywne od mniejszych wyszukiwarek lokalnych (Lewandowski 2008, s, 927], Badania Wskazują także na lepsze wyniki prezentowane przez Google w niektórych dyscyplinach, j<k informatyka czy niektóre nauki społeczne (Kousha, Thelwall 2007],
W wyniku realizacji takich inicjatyw, jak Google Scholar i Google Books, nieaktual
ny staje się dychotomiczny podział na wyszukiwanie w Google (dające ogólne pojęcie
0 tematyce) i wyszukiwanie w zasobach bibliotek (dające wyniki wiarygodne) (Lack 2006, Si 77]. Dzięki wyszukiwarce typu Google możliwe jest zbadanie różnego rodzaju zasobów informacji - cyfrowej i tradycyjnej, wysokiej i nieznanej jakości, darmowej i udostępnianej komercyjnie44. Dzięki temu, że digitalizacja w ramach Google Books opiera się na drukowanych zbiorach bibliotek akademickich, powstający zasób cyfrowy znajduje głównie zainteresowanie w środowiskach naukowych45. Wyszukiwarki tego typu służą także do zapewnienia możliwości przeszukiwania zasobów o ograniczonym dostępie (ukrytych), na przykład zasobów określonej instytucji czy organizacji. Wówczas użytkownik ma możliwość wyboro pomiędzy wyszukiwaniem ograniczonym do określonego zasobu
1 przeszukiwaniem całego Webu. Wyszukiwarki stają się więc narzędziem pozwalającym na wyszukiwanie badawcze, o którym mowa była na początku rozdziału.
171
Henry Jcnkins, za Pierw Levym, twórcą pojęcia inteligencji zbiorowej, określa ją jako zdolność wirtualnych społeczności do wykorzystywania połączonych uzdolnień wszystkich ich członków [Jenkins 2007, s. 31).
Na podstawie strumieni kliknięć poznawane są preferencje użytkowników - informacji o tym. co użytkownik odwiedzi! i co wybiera! przeglądając Web. Strumienie te są formą metadanych [Battclle 2006, s. 194].
H Często maca się uwagę, że wielkie projekty digitalizacji zbiorów bibliotek, realizowane przez Google maję na celu nie tyle udostępnienie digitalizowanych publikacji w wersji cyfrowej, lecz „umożliwienie wyszukiwania w trybie online informacji dostępnej offlinc" [Johnson 2007, s. Jj. Chodzi o wyszukiwanie pelnotekstowe publikacji drukowanych. Skanowanie to ma głównie zapewnić możliwość indeksowania peinotekstowego kopiowanych zasobów; ich udostępnianie w formie cyfrowej jest jakby efektem ubocznym. Dlatego też pojawiająca się krytyka dotycząca jakości skanów (np. (Duguid 2007]) nic jest najistotniejsza.
” Można szacować, żc ponad 90% pozycji (materializacji) digitalizowanych przez Google Books me należy do literatury pięknej, a z tego 78% to publikacje na poziomie naukowym [Laroic, Dempsey 2009).