Ćwiczenia infobrokerskie 8, Studia INiB, Internet jako środowisko informacyjne


POPRAWA ZADANIA DOMOWEGO

1. Proszę wyszukać kolorowe zdjęcie przedstawiające zabytkowy młyn wiatrowy będący elementem ekspozycji etnograficznego muzeum architektury wiejskiej na otwartym powietrzu we Wdzydzach Kiszewskich.

Jak powinna być zbudowana optymalna instrukcja dla tego wyszukiwania?

Przykładowe rozwiązanie dla Google Grafika:

wiatrak „Wdzydze Kiszewskie” skansen

Instrukcja wyszukiwawcza powstała poprzez zastosowanie zasady redukcji, czyli sprowadzenia wszystkich złożonych elementów problemu wyszukiwawczego do ich najprostszej, jeśli to możliwe jednowyrazowej postaci.

2. Pacjent gabinetu stomatologicznego słyszy mimochodem urywek rozmowy, którą - używając zawodowego żargonu - prowadzą na jego temat dwaj lekarze stomatolodzy w pokoju obok:

Na jakie schorzenie cierpi pacjent?

Cel ćwiczenia: kształcenie umiejętności rozpoznawania w poleceniu wyszukiwawczym kluczowych informacji, które powinny ukierunkować budowę instrukcji, a następnie strategię wyszukiwania. W tym wypadku najistotniejszy są najistotniejsze są dwa fakty:

  1. lekarze używają zawodowego żargonu => posługują się terminami, które niekoniecznie pochodzą z naukowego słownika medycyny stomatologicznej, mogą mieć natomiast zasięg lokalny i wynikać z ustalonego w danym środowisku obyczaju => podczas interpretowania polecenia wyszukiwawczego nie można więc zakładać, że słowa padające z ust lekarzy na pewno znajdą się w naukowym/fachowym piśmiennictwie z zakresu stomatologii => z tego wniosek, że z ostrożności nie powinno się ich traktować jako „gotowych” argumentów wyszukiwawczych w budowanych przez siebie instrukcjach;

  2. położenie pacjenta jest nietypowe: mimochodem słyszy przebieg lekarskiego konsylium => aż dwaj lekarze próbują rozwikłać zagadkę przypadłości pacjenta, i naradzają się „w ukryciu” (nie planują, że pacjent będzie słyszał ich rozmowę => należy stąd wnosić, że schorzenie pacjenta może być rzadkie/nietypowe/zastanawiające.

Droga do rozwiązania:

1) Ośródka - ustalamy standardowe znaczenie tego terminu za pomocą dostępnych źródeł leksykograficznych w postaci drukowanej i elektronicznej, trzeba korzystać również z własnej wiedzy językowej => znaczenie słowa ośródka: miękisz, miąższ (chleba), w paleontologii ślad po rozłożonych tkankach miękkich wypełniających niegdyś zachowaną skamielinę.

Wniosek: w odniesieniu do zębów (bo one są przecież przedmiotem dyskusji stomatologów) ośródka będzie prawdopodobnie oznaczać wypełniające ząb tkanki miękkie.

  1. Odnajdujemy odpowiednik żargonowego słowa ośródka w naukowej terminologii dentystycznej.

Google Grafika => instrukcja: „ząb” => wynik: przekrój poprzeczny zęba ludzkiego, z uwidocznieniem kolejnych warstw tkanek => www.anatomiac.w.interia.pl/trzonowy.gif

Ośródka = miazga zębowa

3) Identyfikujemy prawidłową (medyczną) nazwę schorzenia określonego żargonowo przez lekarzy jako rozpad ośródki => wyszukiwarka globalna (np. Google) => instrukcja: miazga rozpad => gnilny rozpad miazgi = zgorzel miazgi;

4) Wyjaśnienie terminu poronny => przegląd dostępnych źródeł leksykograficznych (np. Słownika Języka Polskiego lub dobrej encyklopedii on-line) uzmysławia, że słowo to zostało użyte przez lekarzy zgodnie ze swoim fachowym znaczeniem => poronny: bezobjawowy lub skąpoobjawowy przebieg choroby;

5) Wniosek końcowy: pacjent cierpi na nietypową, bo bezobjawową (najpewniej bezbolesną) zgorzel miazgi zębowej.

3. Proszę zidentyfikować pojęcie/byt/obiekt/zjawisko, na który(e) wskazują skojarzenia związane z poniższymi słowami/wyrażeniami:

Klaudiusz - Druga Księga Samuela 4.4 i 9.1 - ischemia - średnik - Koń września -

Myślnik - Meribbaal - witryna sklepowa

Korekta wykonana podczas zajęć

4. W wyszukiwarce działającej na zasadzie alternatywy proszę zbudować, w trybie wyszukiwania prostego, instrukcję wyszukiwawczą spełniającą następujące kryteria:

Uwaga: wyszukiwanie fikcyjne

+”owoce morza” małże ostrygi -„Cztery noce z Anną” „Przewodnik po zbiorach rękopisów w Wilnie” +url:BMS +domain:gov.pl

5. W wyszukiwarce opartej na zasadzie koniunkcji proszę zbudować, w trybie wyszukiwania prostego, instrukcję wyszukiwawczą spełniającą następujące kryteria:

Uwaga: wyszukiwanie fikcyjne

-„Ania z Zielonego Wzgórza” powieść pamiętnik OR „proza liryczna” -„Kimi Raeikkoenen” link:www.bj.uj.edu.pl - domain:pl filetype:pdf

6. W wyszukiwarce działającej na zasadzie alternatywy proszę zbudować, w trybie wyszukiwania prostego, instrukcję wyszukiwawczą spełniającą następujące kryteria (uwaga: wyszukiwarka umożliwia maskowanie końcówek):

Uwaga: wyszukiwanie fikcyjne

Przykładowe rozwiązanie:

+przepisy regulacje ustawa +kolczyk* +bydł* -owiec -owce -kozy -kóz -trzod* -url:armir host:www.minrol.gov.pl

7. W wyszukiwarce portalu Wirtualna Polska, w trybie wyszukiwania prostego, proszę zbudować instrukcję spełniającą następujące kryteria:

Uwaga: wyszukiwanie należy przeprowadzić naprawdę, dążąc do uzyskania relewantnego wyniku.

latimeria „pusty kolec” -dwudyszne link:www.strona.com description:biogeneza keywords:Darwin OR keywords:ewolucjonizm

NB: Strona Jerome'a F. Hamlina przestała istnieć, stąd w korekcie zadania umowny człon: link:www.strona.com

8. Poszukują Państwo francuskich serwisów WWW zawierających odnośnik do witryny domowej Biblioteki Narodowej w Warszawie.

domain:fr link:www.bn.org.pl

Powyższa instrukcja jest poprawnie tylko interpretowana przez wyszukiwarki

Altavista i Alltheweb.

9. Proszę podać wyniki działań logicznych:

A - B = Ø, gdzie A - zbójniki, B - marsupialia

A i B = Ø, gdzie A - jeże, a B - jeżozwierze

A i B = B, gdzie A - jeleniowate, B - perukarze

A lub B = B, gdzie A - ludzie i niedźwiedzie, B - omnivora vel pantofagi

A lub B = zbiór dokumentów zwierających termin salamandra plamista lub słowo gady

gdzie A - zbiór dokumentów zawierających termin salamandra plamista, B - zbiór dokumentów zawierających słowo gady

10. Poszukują Państwo aktualnych informacji na temat gospodarki rybackiej w zakresie połowów Clupea harengus, prowadzonej w miejscowości Darłówek.

Pierwszy krok: rozważamy, co w istocie jest przedmiotem poszukiwania => połowy śledzia w Darłówku

W wyszukiwarce działającej na zasadzie koniunkcji zbudowałeś dwie instrukcje:

  1. Darłówek clupea harengus akweny rybacy łodzie kutry sieci

  2. Darłówek śledzie.

Proszę ocenić skuteczność obu instrukcji i na podstawie poczynionych spostrzeżeń sformułować zalecenie dotyczące optymalnego budowania zapytań wyszukiwawczych w wyszukiwarkach działających na zasadzie koniunkcji.

a) wyniki nieliczne i mało relewantne

wniosek: niewłaściwie sformułowana instrukcja wyszukiwawcza

błędy: zbyt wiele argumentów (w tym jeden po łacinie i bez cudzysłowu), skutkiem czego instrukcja staje się zbyt szczegółowa w stosunku do przedmiotu poszukiwań

usprawnienie: zmniejszyć liczbę argumentów i dobrać je tak, aby jak najdokładniej odpowiadały tematowi kwerendy

b) wyniki zbyt iczne i mało relewantne

wniosek: niewłaściwie sformułowana instrukcja wyszukiwawcza

błędy: zbyt mało argumentów, instrukcja staje się zbyt ogólnikowa (nieprecyzyjna) w stosunku do przedmiotu poszukiwań

usprawnienie: dodać co najmniej jeden argument, tak aby instrukcja jak najdokładniej odzwierciedlała istotę problemu wyszukiwawczego

Optymalna instrukcja w wyszukiwarce działającej na zasadzie koniunkcji: Darłówek śledzie połowy

11. Poszukują Państwo informacji na temat zagłady Żydów w Lublinie podczas II Wojny Światowej. W wyszukiwarce Ask sformułowali Państwo instrukcję złożoną ze słów Żydzi Lublin. Wyniki są liczne, lecz mało relewantne.

  1. dlaczego pierwsza próba wyszukiwania okazała się chybiona?

Zadana instrukcja wyszukiwawcza okazała się zbyt ogólnikowa w stosunku do stopnia szczegółowości potrzeby informacyjnej.

[Trzeba sprostować, że wyszukiwarka Ask w ograniczonym stopniu penetruje zasoby polskojęzyczne, toteż uzyskane wyniki są nieliczne i mało relewantne (ta sama instrukcja w wyszukiwarce Google daje ok. 241 tys. rezultatów, w Yahoo - w zasobach polskojęzycznych - ok. 490 tys.). Pierwsza próba wyszukiwania okazała się więc mało skuteczna także z powodu sformułowania instrukcji w języku polskim.]

  1. w jaki sposób ulepszą Państwo instrukcję? Proszę wprowadzić odpowiednią korektę i zapisać instrukcję na nowo.

W celu udoskonalenia instrukcji, należy uzupełnić ją o co najmniej jeden argument, uściślający zakres poszukiwanych treści.

Brakujący argument można wybrać samodzielnie lub skorzystać z podpowiedzi (tzw. klastrów) Related Search, automatycznie generowanych przez system Ask.

Jeśli optujemy za udoskonalaniem instrukcji w języku polskim, mogłaby ona zostać zbudowana np. tak: Żydzi Lublin zagłada, niemniej po jej zastosowaniu natychmiast uwidacznia się skąpość wyników.

Dlatego należy sformułować instrukcję w języku angielskim (przykładowe wersje):

Jews Lublin Holocaust

Jews Lublin „concentration camp”

Jews Lublin ghetto

Jews Lublin extermination

Jews Lublin Shoah

12. Poszukują Państwo:

  1. czarno-białych animacji przedstawiających chwyty dżudo,

  2. fotografii ulicznych latarń gazowych w Krakowie.

Która z wymienionych wyszukiwarek posłuży do tych celów najlepiej?

∆ Google Images ∆ Ask Images ∆ Dogpile Images

∆ Ditto ∆ Picsearch ∆ MSN Images

13. Proszę porównać liczbę, relewancję, przejrzystość graficznej prezentacji oraz szybkość generowania wyników wyszukiwania w narzędziach Google, A9, Teoma, MSN, Yahoo i DMOZ dla argumentu Raleigh i Camorra.

Proszę obmyślić własny termin/sformułowanie, które pozwolą porównać osiągi wszystkich powyższych narzędzi.

Cel ćwiczenia: ukazanie korzyści z posługiwania się wyszukiwarkami, które automatycznie generują podpowiedzi, umożliwiające przeprowadzenie wyczerpującej kwerendy nawet wówczas, gdy rozpoczynając wyszukiwanie nie znamy wszystkich znaczeń zadanego w instrukcji argumentu.

Okazuje się, że termin Raleigh ma liczne homonimy - w zależności od kontekstu, w którym występuje, przybiera odmienne znaczenia.

Korzystanie z wyszukiwarki, która serwuje podpowiedzi (grupuje wyniki w kategorie według odrębnych znaczeń zadanego argumentu wyszukiwawczego, tworząc tzw. klastry) pozwala odkryć homonimiczność użytych w kwerendzie terminów, a nadto pokazuje, że mogą one występować w nieoczekiwanych, wcześniej nam nieznanych kontekstach.

Porównanie narzędzi wyszukiwawczych dla argumentu Raleigh

Liczba wyników

Klastrowanie

Przejrzystość prezentacji

Google

43,6 mln

NIE

Estetyka strony obojętna dla jakości wyszukiwania i oceny relewancji (ani nie pomaga ani nie przeszkadza). Przydatne podglądy map wyświetlane automatycznie w module wyszukiwania w Sieci

A9

10,4 mln

NIE

Może przeszkadzać przełamanie strony na dwie szpalty: w jednej wyniki wyszukiwania OpenSearch (Web by Alexa), w drugiej wyniki z serwisu Amazon Books

Ask

7,01 mln

TAK - Related Search

Zwiększona dzięki zastosowaniu klastrowania wyników.

Automatyczny podgląd miniatur witryn z bogatą warstwą graficzną.

MSN

21,8 mln

NIE

Estetyka strony obojętna dla jakości wyszukiwania i oceny relewancji (ani nie pomaga ani nie przeszkadza)

Yahoo

203 mln

TAK - por. zrzut ekranowy poniżej

Porównywalna do Google i MSN

Dmoz

186

NIE - por. zrzut ekranowy poniżej

Wygląd tabeli wyników jest charakterystyczny dla tzw. Human-Edited Internet Indexes, czyli katalogów stron WWW, w których linki do konkretnych zasobów selekcjonują, przyporządkowują do odopowiednich kategorii w schemacie klasyfikacyjnych, a następnie krótko opisują ludzie (nie dzieje się to automatycznie)

Yahoo - system generuje podpowiedzi, trzeba jednak być czujnym, żeby je zauważyć: podczas wpisywania instrukcji do okna dialogowego na stornie głównej serwisu, na krótką chwilę pojawia się lista możliwych do wyboru klastrów (zaznaczonych na ilustracji strzałką)

Zrzut ekranowy DMOZ do wzglądu na następnej stronie

0x08 graphic
0x01 graphic

DMOZ - Open Directory Project

W odpowiedzi na zadaną instrukcję (Raleigh) system generuje tabelę wyników, którą poprzedza lista wszystkich kategorii katalogowych, w jakich żądane słowo wystąpiło. Jeszcze przed przeglądaniem poszczególnych wyników uzyskujemy wskazówkę, że Raleigh jest homonimem i został sklasyfikowany m.in. w działach:

United States: North Carolina: Localities (miasta stanu Północna Karolina) - jako miasto o nazwie Raleigh (107 trafień)

People and Society: Biography: Explorers (biografie podróżników) - jako nazwa osobowa, sir Walter Raleigh, Walter (6 tarfień)

United States: West Virginia: Counties (hrabstwa stanu Zachodznia Virginia): Raleigh (7 trafień)

Zrzut ekranowy DMOZ do wzglądu na następnej stronie.

Wnioski: korzystanie z wyszukiwarek klastrujących pozwoliło ustalić, że argument Raliegh jest terminem homonimicznym, tj. przyjmuje wiele odmiennych znaczeń w zależności od kontekstu językowego, w jakim się pojawia.

Po zapoznaniu się z klastrami, można stwierdzić, że Raleigh to:

0x01 graphic



Wyszukiwarka

Podobne podstrony:
Ćwiczenia infobrokerskie 1, Studia INiB, Internet jako środowisko informacyjne
Ćwiczenia infobrokerskie 7, Studia INiB, Internet jako środowisko informacyjne
Ćwiczenia infobrokerskie 5, Studia INiB, Internet jako środowisko informacyjne
Ćwiczenia infobrokerskie 2, Studia INiB, Internet jako środowisko informacyjne
Ćwiczenia infobrokerskie 4, Studia INiB, Internet jako środowisko informacyjne
Ćwiczenia infobrokerskie 3, Studia INiB, Internet jako środowisko informacyjne
Ćwiczenia infobrokerskie 6, Studia INiB, Internet jako środowisko informacyjne
Ćwiczenia infobrokerskie 1, Studia INiB, Internet jako środowisko informacyjne
Ćwiczenia infobrokerskie 5 - rozwiązanie, Studia INiB, Internet jako środowisko informacyjne
Wyszukiwanie info w Internecie - podsumowanie, Studia INiB, Internet jako środowisko informacyjne
ZADANIE INTERNET - cz.1, Studia INiB, Internet jako środowisko informacyjne
ZADANIE INTERNET - cz.2, Studia INiB, Internet jako środowisko informacyjne
INTERNET JAKO ŚRODOWISKO INFORMACJI-DO EGZAMINU, INiB, I rok, I semestr, Internet, egzam
Internet jako środowisko informacyjne wykłady
Strategie wyszukiwania- internet, Internet jako środowisko informacyjne
Internet jako środowisko informacyjne wykłady
Podseria - ćwiczenia, Studia INiB, Formaty danych w systemach informacyjno-wyszukiwawczych
Internet jako zrodlo informacji Nieznany
Rekord bibliograficzny, Studia INiB, Formaty danych w systemach informacyjno-wyszukiwawczych

więcej podobnych podstron