7808336066
Wyszukiwanie informacji Agnieszka Nowak
Problem nie jest trywialny...bo:
• nie jest znana liczba oczekiwanych grup,
• miara podobieństwa dokumentów jest trudna do zdefiniowania,
• grupy mogą się nakładać,
• znalezienie opisu dla grupy nie jest łatwe,
• wymagana szybkość działania {on-line},
• dokumenty mogą być wielojęzyczne,
• opisy są zazwyczaj krótkie i niepełne.
Modelowanie podobieństwa
Modelowanie to wykorzystuje techniki:
1. modelowanie odległości w przestrzeniach n-wymiarowych,
2. model grafowy,
3. współwystępowanie słów i fraz.
Tematem niniejszej prezentacji jest skupienie się na pierwszej technice, która pozwala na wykorzystywanie do grupowania różnego typu algorytmów. Tutaj omówiony zostanie algorytm analizy skupień z aglomeracyjnym łączeniem obiektów tworzących w ten sposób pewną strukturę hierarchiczną, stąd nazwa algorytmu:
AHC - Agglomerative Hierarchical Clustering.
Przebieg grupowania AHC:
Przebieg grupowania obiektów w ramach metod aglomeracyjnych odbywa się w następujących krokach:
1. Utwórz n klas zawierających pojedyncze obiekty.
2. Oblicz wartość pewniej miary podobieństwa (odległości) dla wszystkich par klas.
3. Połącz dwie klasy najbardziej podobne.
4. Jeśli wszystkie obiekty należą do jednej klasy, to zakończ pracę. W przeciwnym przypadku przejdź do kroku 2.
Wyszukiwarka
Podobne podstrony:
Wyszukiwanie informacji Agnieszka Nowak Zgodnie z algorytmem z macierzy usuwamy kolumnę i wiersz dlaWyszukiwanie informacji Agnieszka Nowak Metoda ap uq b C NajbliższegoWyszukiwanie informacji Agnieszka Nowak Iteracja 4 łączy obiekty P_8 oraz P_io. Iteracja nr 5 to połWyszukiwanie informacji Agnieszka Nowak Iteracja kolejna to połączenie obiektów P 36 oraz obiektuWyszukiwanie informacji Agnieszka Nowak Systemy odpowiadające na pytania - [system START, system AnsWyszukiwanie informacji Agnieszka Nowak Wyszukiwanie informacji Agnieszka NowakPodsumowanie Na prawdWyszukiwanie informacji Agnieszka Nowak Funkcja wyszukiwania określa, jak dobrze dokument odpowiadaWyszukiwanie informacji Agnieszka Nowak przyczyniło się do faktu, iż z czasem wyszukiwarki zaczęłyWyszukiwanie informacji Agnieszka Nowak Przykładowo dla podanych niżej dwóch wektorów: WyszukiwanieWyszukiwanie informacji Agnieszka NowakWyszukiwarka ? Co to takiego właściwie jest ? Poznajmy tajemnWyszukiwanie informacji Agnieszka NowakCo to jest Carrot2 ? Jak mówią twórcy systemu - Carrot2 jestWyszukiwanie informacji Agnieszka NowakPageRank PageRank jest wartością liczbową, reprezentującąWyszukiwanie informacji Agnieszka Nowak1 iteracja p_Wyszukiwanie informacji Agnieszka NowakPrzebieg aglomeracji Odległość ŁączoneWyszukiwanie informacji Agnieszka NowakSchemat działania systemy wyszukiwawczegoModele wyszukiwaniaWyszukiwanie informacji Agnieszka NowakSystemy organizujące wyniki [vivisimo/ carrot] Systemy te opiWyszukiwanie informacji Agnieszka NowakAlgorytm grupowania: 1. Mając macierz D=[dłZalecenia Jest to kolejne zadanie, które wymaga od ucznia nie tylko wyszukania informacji, ale (do psię umysłowych warunków skupiania uwagi. Wyszukiwanie informacji w Internecie nie jest nabywaniemwięcej podobnych podstron