3784500534

3784500534



XVI Konferencja PLOUG Kościelisko Październik 2010

Metody algebraiczne w zadaniach eksploracji danych na przykładzie automatycznego analizowania treści dokumentów

Jarosław Gramacki, Artur Gramacki Uniwersytet Zielonogórski, Instytut Informaty ki i Elektroniki

J.Gramacki@iie.uz.zgora.pl, A.Gramacki@iie.uz.zgora.pl

Abstrakt. Przeszukiwanie dużych zbiorów dokumentów (dających się w ogólności sprowadzić do postaci tekstowej) odbywa się najczęściej w ten sposób, że użytkownik formułuje zapytanie wpisując słowa kluczowe i/lub frazy, które w jego odczuciu najlepiej opisują poszukiwane w dokumentach treści. Następnie obsługujące te zapytania wyszukiwarki zwracają pewną, zwykle bardzo dużą. liczbę dokumentów, które najlepiej ..pasują" do zadanego przez użytkownika zapytania. Używane są przy tym różne algorytmy i metody oceny zgodności treści dokumentu z wpisanym zapytaniem. Duża liczba zwracanych przez wyszukiwarkę dokumentów oznacza, że często zmuszeni jesteśmy do czasochłonnego ich przeglądania celem weryfikacji trafności zwracanych wyników. Gdy dokument)- są długie, czas ich przeglądania znacznie się wydłuża. Można by go wydatnie skrócić, gdyby istniała możliwość automatycznego generowania sensów nych podsumowań (streszczeń) zwracanych dokumentów. W arty kule omawiamy wybrane metody służące automatycznemu wydobywaniu z tekstu jego najistotniejszych słów kluczowych oraz najistotniejszych fragmentów (zdań). Posługujemy- się głównie wybranymi metodami algebraicznymi, wskazując również na istniejące metody heurystyczne. Pokazujemy również, jak niektóre z omawianych w artykule zadań można zrealizować w- module Oracle Text (instalowanym jako opcja serwera bazodanowego Oracle).

Informacja o autorach. Dr inż. Jarosław- Gramacki jest adiunktem na Wydziale Elektrotechniki. Informatyki i Telekomunikacji w Instytucie Informatyki i Elektroniki Uniwersytetu Zielonogórskiego. W pracy naukowej zajmuje się różnymi technikami przetwarzania danych, ich analizą zastosowaniami ukierunkowanymi na przetwarzanie danych. Zajmuje się ponadto projektowaniem, wykonywaniem oraz wdrażaniem aplikacji usprawniających szeroko rozumiane zarządzanie Uczelnią. Od wielu lat prowadzi zajęcia dydaktyczne dotyczące baz danych, sy stemów zarządzania bazami danych oraz wy korzy stania technologii bazodanowych (głównie firmy Oracle) do budowy aplikacji użytkowych.

Dr inż. Artur Gramacki jest adiunktem na Wydziale Elektrotechniki, Informatyki i Telekomunikacji w Instytucie Informatyki i Elektroniki Uniwersytetu Zielonogórskiego. Interesuje się zagadnieniami związanymi z bazami danych oraz eksploracją danych. W swej pracy wykorzystuje głównie rozwiązania firmy Oracle, choć nieobce są mu również rozwiązania bazodanowe innych producentów, w tym również te spod znaku OpenSource. Od w-ielu lat prowadzi zajęcia dydaktyczne dotyczące baz danych, systemów zarządzania bazami danych oraz budow ania bazodanowych aplikacji użytkowych. Bral czy nny udział w różnych projektach informatycznych z tego zakresu.



Wyszukiwarka

Podobne podstrony:
Metody algebraiczne w zadaniach eksploracji danych na przy kładzie automatycznego ...
Metody algebraiczne w zadaniach eksploracji danych na przykładzie automatycznego ...
Metody algebraiczne w zadaniach eksploracji danych na przykładzie automatycznego ...
Metody algebraiczne w zadaniach eksploracji danych na przykładzie automatycznego ...
Metody algebraiczne w zadaniach eksploracji danych na przykładzie automatycznego ...
Metody algebraiczne w zadaniach eksploracji danych na przykładzie automatycznego ...   &nb
Metody algebraiczne w zadaniach eksploracji danych na przykładzie automatycznego ...
Metody algebraiczne w zadaniach eksploracji danych na przy kładzie automatycznego ...
Metody algebraiczne w zadaniach eksploracji danych na przykładzie automatycznego ...
X Konferencja PLOUG Kościelisko Październik 2004Wybrane zagadnienia informatyczne zintegrowaneg
Degradacja środowiska a świadomość społeczna. 8 października 2010 r. Konferencja naukowo - techniczn
PROGRAM KONFERENCJI 19 października 2010 r. Teatr „Maska", ul. A. Mickiewicza 13 Sala
Artykuł Autorski, XI Forum Inżynierskiego ProCAxcz. II, Kraków, 16-18 października 2012 r. metody

więcej podobnych podstron