ZASTOSOWANIE ALGORYTMÓW GRUPOWANIA
W SIECI WWW I E-BIZNESIE
Sprawozdanie VII
Grupowanie wyników wyszukiwania
Czemiel Paulina
Hałaburda Krzysztof
Zadanie 1
Narzędzia: SearchEngine (praca dyplomowa Wojciecha Rakowskiego), Carrot (Dawid Weiss: http://search.carrot2.org/stable/search)
(Carrot+Lingo oraz Google) Wyszukać następujące informacje używając systemu Carrot z algorytmem Lingo oraz Google|Bing
Podać imiona bohaterów i nazwiska grających ich aktorów w serialu „Czterej pancerni i pies”
Podać nazwy gatunków drzew chronionych w Polsce
pytanie |
Carrot |
|
1 |
Janek Kos Gustlik Jeleń Grigorij Saakaszwili Marusia "Ogoniok" Tomasz Czereśniak Olgierd Jarosz Lidka Wiśniewska Franek Wichura Honorata Czereśniak Czernousow |
Janek Kos Gustlik Jeleń Grigorij Saakaszwili Marusia "Ogoniok" Tomasz Czereśniak Olgierd Jarosz Lidka Wiśniewska Franek Wichura Honorata Czereśniak Czernousow |
2 |
|
|
Określić w każdym przypadku czas, w którym wyszukano informacje.
W pierwszym przykładzie wpisaliśmy w obu wyszukiwarkach: `aktorzy czterej pancerni i pies'. Obie wyszukiwarki w pierwszej pozycji wyszukały stronę: http://www.filmweb.pl/Czterej.Pancerni.I.Pies/cast. Lista pełnej obsady była zawarta w pierwszo wybranym przez nas linku , dlatego czas wyszukania pełnych informacji w obu przypadkach był bardzo szybki a wyniki pełne.
W drugim przykładzie jako słowa kluczowe wpisaliśmy: `drzewa chronione w Polsce'. Wyszukiwarka Google jako pierwszy wynik wyświetliła stronę: http://www.okop.om.pttk.pl/zrzut/obrazki.pdf. Informacje w wybranym pliku były pełne, zawierające nazwy polskie i łacińskie drzew oraz obrazki. Liczba chronionych drzew w Polsce wg tej strony wynosi 6. Czas wyszukania pełnych informacji był bardzo szybki. Wyszukiwarka Carrot w pierwszej pozycji wyświetla link do strony: http://portalwiedzy.onet.pl/24211,,,,rosliny_chronione_w_polsce,haslo.html. Informacje na tej stronie są ogólne i niepełne. Liczba chronionych drzew dla tej strony wynosi 5. Znalezienie dokładniejszych wyników zajmuje więcej czasu. Wyszukiwarka Carrot nie zasugerowała nam strony wybranej przez nas w wyszukiwarce Google.