7808336066

7808336066



Wyszukiwanie informacji Agnieszka Nowak

Problem nie jest trywialny...bo:

•    nie jest znana liczba oczekiwanych grup,

•    miara podobieństwa dokumentów jest trudna do zdefiniowania,

•    grupy mogą się nakładać,

•    znalezienie opisu dla grupy nie jest łatwe,

•    wymagana szybkość działania {on-line},

•    dokumenty mogą być wielojęzyczne,

•    opisy są zazwyczaj krótkie i niepełne.

Modelowanie podobieństwa

Modelowanie to wykorzystuje techniki:

1.    modelowanie odległości w przestrzeniach n-wymiarowych,

2.    model grafowy,

3.    współwystępowanie słów i fraz.

Tematem niniejszej prezentacji jest skupienie się na pierwszej technice, która pozwala na wykorzystywanie do grupowania różnego typu algorytmów. Tutaj omówiony zostanie algorytm analizy skupień z aglomeracyjnym łączeniem obiektów tworzących w ten sposób pewną strukturę hierarchiczną, stąd nazwa algorytmu:

AHC - Agglomerative Hierarchical Clustering.

Przebieg grupowania AHC:

Przebieg grupowania obiektów w ramach metod aglomeracyjnych odbywa się w następujących krokach:

1.    Utwórz n klas zawierających pojedyncze obiekty.

2.    Oblicz wartość pewniej miary podobieństwa (odległości) dla wszystkich par klas.

3.    Połącz dwie klasy najbardziej podobne.

4.    Jeśli wszystkie obiekty należą do jednej klasy, to zakończ pracę. W przeciwnym przypadku przejdź do kroku 2.



Wyszukiwarka

Podobne podstrony:
Wyszukiwanie informacji Agnieszka Nowak Zgodnie z algorytmem z macierzy usuwamy kolumnę i wiersz dla
Wyszukiwanie informacji Agnieszka Nowak Metoda ap uq b C Najbliższego
Wyszukiwanie informacji Agnieszka Nowak Iteracja 4 łączy obiekty P_8 oraz P_io. Iteracja nr 5 to poł
Wyszukiwanie informacji Agnieszka Nowak Iteracja kolejna to połączenie obiektów P 36 oraz obiektu
Wyszukiwanie informacji Agnieszka Nowak Systemy odpowiadające na pytania - [system START, system Ans
Wyszukiwanie informacji Agnieszka Nowak Wyszukiwanie informacji Agnieszka NowakPodsumowanie Na prawd
Wyszukiwanie informacji Agnieszka Nowak Funkcja wyszukiwania określa, jak dobrze dokument odpowiada
Wyszukiwanie informacji Agnieszka Nowak przyczyniło się do faktu, iż z czasem wyszukiwarki zaczęły
Wyszukiwanie informacji Agnieszka Nowak Przykładowo dla podanych niżej dwóch wektorów: Wyszukiwanie
Wyszukiwanie informacji Agnieszka NowakWyszukiwarka ? Co to takiego właściwie jest ? Poznajmy tajemn
Wyszukiwanie informacji Agnieszka NowakCo to jest Carrot2 ? Jak mówią twórcy systemu - Carrot2 jest
Wyszukiwanie informacji Agnieszka NowakPageRank PageRank jest wartością liczbową, reprezentującą
Wyszukiwanie informacji Agnieszka Nowak1 iteracja p_
Wyszukiwanie informacji Agnieszka NowakPrzebieg aglomeracji Odległość Łączone
Wyszukiwanie informacji Agnieszka NowakSchemat działania systemy wyszukiwawczegoModele wyszukiwania
Wyszukiwanie informacji Agnieszka NowakSystemy organizujące wyniki [vivisimo/ carrot] Systemy te opi
Wyszukiwanie informacji Agnieszka NowakAlgorytm grupowania: 1. Mając macierz    D=[dł
Zalecenia Jest to kolejne zadanie, które wymaga od ucznia nie tylko wyszukania informacji, ale (do p
się umysłowych warunków skupiania uwagi. Wyszukiwanie informacji w Internecie nie jest nabywaniem

więcej podobnych podstron