ZASTOSOWANIE ALGORYTMÓW GRUPOWANIA
W SIECI WWW I E-BIZNESIE
Sprawozdanie VII
Grupowanie wyników wyszukiwania
Czemiel Paulina
Hałaburda Krzysztof
Zadanie 1
Narzędzia: SearchEngine (praca dyplomowa Wojciecha Rakowskiego), Carrot (Dawid
Weiss:
http://search.carrot2.org/stable/search)
1.
(Carrot+Lingo oraz Google) Wyszukać następujące informacje używając systemu Carrot z algorytmem Lingo
oraz Google|Bing
•
Podać imiona bohaterów i nazwiska grających ich aktorów w serialu „Czterej pancerni i pies”
•
Podać nazwy gatunków drzew chronionych w Polsce
pytanie
Carrot
1
Janusz Gajos
Janek Kos
Franciszek Pieczka
Gustlik Jeleń
Włodzimierz Press
Grigorij Saakaszwili
Pola Raksa
Marusia "Ogoniok"
Wiesław Gołas
Tomasz Czereśniak
Roman Wilhelmi
Olgierd Jarosz
Małgorzata Niemirska
Lidka Wiśniewska
Witold Pyrkosz
Franek Wichura
Janusz Gajos
Janek Kos
Franciszek Pieczka
Gustlik Jeleń
Włodzimierz Press
Grigorij Saakaszwili
Pola Raksa
Marusia "Ogoniok"
Wiesław Gołas
Tomasz Czereśniak
Roman Wilhelmi
Olgierd Jarosz
Małgorzata Niemirska
Lidka Wiśniewska
Witold Pyrkosz
Franek Wichura
Barbara Krafftówna
Honorata
Tadeusz Fijewski
Czereśniak
Janusz Kłosiński
Czernousow
Barbara Krafftówna
Honorata
Tadeusz Fijewski
Czereśniak
Janusz Kłosiński
Czernousow
2
•
cis pospolity (Taxus baccata ),
•
sosna limba (Pinus cembra ),
•
brzoza ojcowska (Betula × oycoviensis),
•
jarząb szwedzki (Sorbus intermedia ),
•
jarząb brekinia (Sorbus torminalis),
•
sosna górska (Pinus mugo ).
•
brzoza ojcowska,
•
cis pospolity,
•
jarząb brekinia,
•
jarząb szwedzki,
•
limba.
Określić w każdym przypadku czas, w którym wyszukano informacje.
W pierwszym przykładzie wpisaliśmy w obu wyszukiwarkach: ‘aktorzy czterej pancerni i pies’. Obie
wyszukiwarki w pierwszej pozycji wyszukały stronę: http://www.filmweb.pl/Czterej.Pancerni.I.Pies/cast. Lista pełnej
obsady była zawarta w pierwszo wybranym przez nas linku , dlatego czas wyszukania pełnych informacji w obu
przypadkach był bardzo szybki a wyniki pełne.
W drugim przykładzie jako słowa kluczowe wpisaliśmy: ‘drzewa chronione w Polsce’. Wyszukiwarka Google
jako pierwszy wynik wyświetliła stronę: http://www.okop.om.pttk.pl/zrzut/obrazki.pdf. Informacje w wybranym pliku
były pełne, zawierające nazwy polskie i łacińskie drzew oraz obrazki. Liczba chronionych drzew w Polsce wg tej strony
wynosi 6. Czas wyszukania pełnych informacji był bardzo szybki. Wyszukiwarka Carrot w pierwszej pozycji
wyświetla link do strony: http://portalwiedzy.onet.pl/24211,,,,rosliny_chronione_w_polsce,haslo.html. Informacje na tej
stronie są ogólne i niepełne. Liczba chronionych drzew dla tej strony wynosi 5. Znalezienie dokładniejszych wyników
zajmuje więcej czasu. Wyszukiwarka Carrot nie zasugerowała nam strony wybranej przez nas w wyszukiwarce Google.