IMG63 (2)

IMG63 (2)



cją logiczną dokumentu jest zestaw słów, przez co indeksowany dokument jest p0slr ny jako ich nieuporządkowany zestaw. We współczesnych wyszukiwarkach repre* ^ jest rozbudowana o dodatkowe dane, wskazujące na częstotliwości słów, atrybuty towania tekstu, oraz mctadanc tworzone zgodnie i zasadami HTML [Baeza-Yatcs p,*-lo 2006, s. 530).    ‘''n

Sortowanie dokumentów odszukanych odbywa się według algorytmu PageRank i decyduje o miejscu wyszukanej strony na liście stron przedstawionej użytkownikom S gorytnt ten daje zadowalające rezultaty nawet w przypadku, gdy dostępnych jest |v mało informacji o rzeczywistych potrzebach użytkowników. Jakość strony Web w *il(| -° stopniu nic zależy od jej zawartości. Wykorzystuje się wyłącznic strukturę odnośnjll)!1^ w zasobie. Każdy odnośnik to glos oddany na stronę, do której prowadzi, Odnośniki ■ są jednak traktowane równorzędnie. Odnośnik ze strony wysoko postawionej w ranki ^ jest bardziej wartościowy, niż odnośnik z innej strony. Całkowity PageRank strony-?2 sumą wszystkich wartości odnośników wskazujących na nią. Wartość odnośnika od cech strony, od której odnośnik przychodzi: PageRank jest dzielony przez liczb? ^ nośników wychodzących ze strony. W efekcie możliwe jest porównywanie dowolni dwóch stron i określenie ich miejsca w rankingu. Autorzy PageRank wykorzystali J-ideę tzw, mądrości lub inteligencji zbiorowej4*', nazywanej też „mądrością tłumów” udącej także cechą serwisów Webu 2.0), uznając, że najlepsze są te strony, które uzysuf w powszechnym głosowaniu użytkowników Internetu najwięcej głosów, innym prawem mądrości zbiorowej, skrzętnie rejestrowanym przez twórców Google są tzw, stJJ' mienie kliknięć {clickstiwn), czyli zjawisko polegające na tym, że subiektywne oceny Sa* modzielnie działających jednostek sumują się we wskazania najwartościowszych miej/ w Internecie2, kierowanie się opinią i doświadczeniami innych, a więc mądrością zbioro wą. jest obecnie jedną z najbardziej użytecznych strategii wyszukiwania informacji [JUz. 2007, s. 47], Jest ona jednak również krytykowana za tworzenie tzw. Google EfTect, czyij mylenie popularności z jakością [Brabazon 2006, s. 160].

nazwą Google Scholar. Wyszukiwarka ta, udostępniona jak dotąd w wersji beta, stawia użytkownikom wyniki wyszukiwań ograniczone do obiektów o treści naukowej go jak się wydaje nie stanowiło wcześniej oferty żadnej innej wyszukiwarki globalnej' Jest to bezpłatnie dostępna usługa internetowa o przyjaznym interfejsie, podobnym do standardowego interfejsu Google. Część obiektów indeksowanych przez Google Scholar znajduje się na serwerach wydawców komercyjnych, skąd dostępne mogą być za opłatą jednak nawet w takich sytuacjach użytkownik ma do dyspozycji przynajmniej opis, często z abstraktem. Jednak znaczną część zasobów Google Scholar stanowią obiekty publiko-wane w trybie Open Access. Często zdarza się. że wyszukiwarka kieruje do dwóch wersji

Oprócz dostępu do pełnych tekstów dokumentów, interesującą ofertę dla użytkowników stanowią analizy wykonywane przez wyszukiwarkę i wynikające z nich rankingi relewancji. Jednym z wielu kryteriów służących rankingowi jest liczba cytowań dokumentu, które zastępują odnośniki do stron Web, uwzględniane w standardowych Google, W efekcie częściej cytowane dokumenty są umieszczane wyżej w rankingu, co ułatwia ich odszukanie przez użytkowników. Dzięki istnieniu indeksu cytowań użytkownik może także śledzić wszystkie cytowania danego dokumentu, co nie jest dostępne w Google -lam wyszukiwarka nie pokazuje odnośników do wyszukanych stron. Automatyczna realizacja indeksu cytowań wymaga, aby odsyłacze bibliograficzne w tekście byty dostępne

»“l,'wi0nc w WNh rtkww.ni,

P<r./t^ Cllmfclls■■ *<W■>wyhrancgogJdoiumXi ^1">'e W'1"1 na,0m,“'Coog,t    ^kiwirt, ,|*h., JZ

»baJaczy Podejmuje próby oceny jątóri wyauiiwm* Google U„

%iy rrzt"lt!l<mc f    ,rady«yjnycii w <w

>C u pr/cdslatvionych P^Philipp. M,y« i    w, J '"JJ

•SmB baz,anycl1 Co°8 “** ** amfl Sm

mSM    »z“"f“ * ą»J proponuj, mmZiZwZ

WMmWatowi.

ani» główn-e dokumentów dos^pnych bezpłatnie onlin*. Moź« ,

;> «*» muowej digittliacji |„J L;(M [lW,S1||

^dzonycii m in. przez Google. Inne bsdania mon fani    ^

google Scholar oraz w Scopus i ISI Web of Science, a więc bardziej porównywalnych I \Jisów (Mcho, Yang 2007]. Google pozwala! na lepsze wyszukiwanie w materiałach Serencyjnych (czterokrotnie lepsze wyniki), źródłach nie-anglojęzycznydi (ponad /cściokrotnic) oraz materiałach archiwizowanych na osobistych lub instytucjonalnych tronach Web (w ogóle nie uwzględnianych przez pozostałe zasoby), Scopus oraz Web of Science lepiej natomiast selekcjonują publikacje o wysokiej cytowalności. podczas gdy Liki Google Scholar obciążane są dużą masą słabo cytowanych publikacji Porównanie jakości wyszukiwania w Google i systemach bibliotecznych wskazuje na uzyskiwanie

.    ■ I—,„U ..ibLb^kIUiu IfaflW-łi/jl/rtUl, ni^„nn>||/nftu .I..I MA,,___


iJV1niiki. Lotaai' Meho i    N^ili wyniki ^

stronacr Science wyniki'

jak^e' identycznych wskaźników trafności (w obu przypadkach około 60%), przy czym1 ^zukiwarka góruje nad OPAC dostępnością wyszukanych materiałów, a katalog biblio-*Ly ich jakością [Brophy, Bawden 2005, s. 510]. Wśród wyszukiwarek Google Scho-r daje najlepszą trafność wyszukiwania treści naukowych (Robinson. Wustcman 2007, | 76]. Wyszukiwarki globalne, takie jak Google i Yahoo są przy tym wyraźnie bardziej Efektywne od mniejszych wyszukiwarek lokalnych (Lewandowski 2008, s, 927], Badania Wskazują także na lepsze wyniki prezentowane przez Google w niektórych dyscyplinach, j<k informatyka czy niektóre nauki społeczne (Kousha, Thelwall 2007],

W wyniku realizacji takich inicjatyw, jak Google Scholar i Google Books, nieaktual

ny staje się dychotomiczny podział na wyszukiwanie w Google (dające ogólne pojęcie

0    tematyce) i wyszukiwanie w zasobach bibliotek (dające wyniki wiarygodne) (Lack 2006, Si 77]. Dzięki wyszukiwarce typu Google możliwe jest zbadanie różnego rodzaju zasobów informacji - cyfrowej i tradycyjnej, wysokiej i nieznanej jakości, darmowej i udostępnianej komercyjnie44. Dzięki temu, że digitalizacja w ramach Google Books opiera się na drukowanych zbiorach bibliotek akademickich, powstający zasób cyfrowy znajduje głównie zainteresowanie w środowiskach naukowych45. Wyszukiwarki tego typu służą także do zapewnienia możliwości przeszukiwania zasobów o ograniczonym dostępie (ukrytych), na przykład zasobów określonej instytucji czy organizacji. Wówczas użytkownik ma możliwość wyboro pomiędzy wyszukiwaniem ograniczonym do określonego zasobu

1    przeszukiwaniem całego Webu. Wyszukiwarki stają się więc narzędziem pozwalającym na wyszukiwanie badawcze, o którym mowa była na początku rozdziału.


171

1

Henry Jcnkins, za Pierw Levym, twórcą pojęcia inteligencji zbiorowej, określa ją jako zdolność wirtualnych społeczności do wykorzystywania połączonych uzdolnień wszystkich ich członków [Jenkins 2007, s. 31).

2

Na podstawie strumieni kliknięć poznawane są preferencje użytkowników - informacji o tym. co użytkownik odwiedzi! i co wybiera! przeglądając Web. Strumienie te są formą metadanych [Battclle 2006, s. 194].

H Często maca się uwagę, że wielkie projekty digitalizacji zbiorów bibliotek, realizowane przez Google maję na celu nie tyle udostępnienie digitalizowanych publikacji w wersji cyfrowej, lecz „umożliwienie wyszukiwania w trybie online informacji dostępnej offlinc" [Johnson 2007, s. Jj. Chodzi o wyszukiwanie pelnotekstowe publikacji drukowanych. Skanowanie to ma głównie zapewnić możliwość indeksowania peinotekstowego kopiowanych zasobów; ich udostępnianie w formie cyfrowej jest jakby efektem ubocznym. Dlatego też pojawiająca się krytyka dotycząca jakości skanów (np. (Duguid 2007]) nic jest najistotniejsza.

” Można szacować, żc ponad 90% pozycji (materializacji) digitalizowanych przez Google Books me należy do literatury pięknej, a z tego 78% to publikacje na poziomie naukowym [Laroic, Dempsey 2009).


Wyszukiwarka

Podobne podstrony:
IMG63 (2) cją logiczną dokumentu jest zestaw słów, przez co indeksowany dokument jest p0slr ny jako
IMG75 (3) cją i że alegoryzacja jest środkiem, za pomocą któreś darzenia nabierają sensów moralnych
50193 IMG63 (2) Wskaźnik podobieństwa struktur jest określony następującym
50193 IMG63 (2) Wskaźnik podobieństwa struktur jest określony następującym
IMG63 (2) Wskaźnik podobieństwa struktur jest określony następującym
IMG63 H Potencjał spoczynkowy- w spoczynku błona komórkowa jest spolaryzowana, nierównomierna 
IMG63 CERA TŁUSTA POZORNIE SUCHA •    Występuje kiedy cera tłusta jest
IMG63 LXXX WYBÓR TEKSTÓW. ZASADY WYDANIA logicznych — gdyż poeta stale wprowadzał nazwy z mitologii
IMG63 Czy psychoanaliza jest nauką? Karl Poppar (filozof nauki): Dana teoria jest naukowa, jeśli wy
IMG63 (18) CHjCHiBr A B A - ma w sąsiedztwie 2 protony (od grupy B) I Jest przez nie rozszczepiany
IMG#63 (4) ■    Głównym miejscem syntezy cytokinin jest korzeń (z korzenia 
IMG$63 (5) Przeciwieństwem podmiotowego traktowania uczniów jest przedmiotowe (instrumentalne) ich t
74163 IMG$63

więcej podobnych podstron