SI5301 w1

SZTUCZNA INTELIGENCJA (INE5301 sem. 8)
WYKAAD 2008/09
Cel wykładu:
Kurs obejmuje przegląd metod i narzędzi umożliwiających komputerowi rozwiązywanie
problemów wchodzących w zakres sztucznej inteligencji. Szczególną uwagę zwrócono na
zagadnienia przetwarzania języka naturalnego, reprezentacji wiedzy oraz uczenia się komputerów.
Plan wykładu:
1. Podstawowe definicje (AI, NLP, HCI). Klasyfikacja i struktura systemów NLP. Podstawowe
problemy przetwarzania języka naturalnego. Przykłady zastosowań.
2. Analiza mowy parametry opisu sygnału mowy, wybrane metody klasyfikacji.
3. Zastosowanie ukrytych modeli Markowa do rozpoznawania mowy.
4. Pojęcie gramatyki. Analiza syntaktyczna języka polskiego.
5. Formalny opis składni języka polskiego (wg Szpakowicza).
6. Analiza semantyczna zdania (gramatyka przypadków, teoria CD, słownik WORDNET).
7. Rozpoznanie semantyki poleceń w języku naturalnym.
8. Strategie prowadzenia dialogu użytkownik komputer. Narzędzia do tworzenia chatterbotów.
9. Tłumaczenie maszynowe.
10. Uczenie się komputerów. Klasyfikator bayesowski. Sieci bayesowskie.
11. Przechwytywanie spamu za pomocą klasyfikatora bayesowskiego.
12. Zastosowanie uczenia się w programowaniu gier.
Literatura:
1. S. Russell, P. Norvig - "Artificial Intelligence: A Modern Approach", Prentice Hall, 2003
2. D. Jurafsky, J. Martin - Speech and Language Processing , Prentice Hall, 2000
3. Z. Vetulani - Komunikacja człowieka z maszyną. Komputerowe modelowanie kompetencji
językowej , Exit, 2004
4. J. Kazimierczak - "Przetwarzanie języka naturalnego", WKA, 2005
5. P. Cichosz - "Systemy uczące się", WNT, 2007
Wykład 1. Podstawowe definicje. Klasyfikacja i struktura systemów NLP.
1. Sztuczna inteligencja (AI - Artificial Intelligence)
Celem sztucznej inteligencji jest projektowanie inteligentnych systemów, to znaczy systemów
wykazujących cechy podobne do cech inteligentnego działania człowieka: rozumowania, uczenia
się, rozumienia języka, rozwiązywania problemów.
Podstawowa definicja:
Sztuczna inteligencja (AI) to dziedzina nauki zajmująca się rozwiązywaniem zagadnień
efektywnie niealgorytmizowalnych w oparciu o modelowanie wiedzy. AI uważana jest za część
informatyki.
Inne definicje:
" AI to nauka mająca za zadanie nauczyć maszyny zachowań podobnych do ludzkich
" AI to nauka o tym, jak nauczyć maszyny robić rzeczy które obecnie ludzie robią lepiej
" AI to nauka o komputerowych modelach wiedzy umożliwiających rozumienie, wnioskowanie i
działanie.
Podstawowe zagadnienia AI:
" rozwiązywanie problemów (gry np.szachy, zagadki logiczne, obliczenia symboliczne)
" rozumowanie logiczne (dowodzenie twierdzeń, projektowanie układów logicznych)
" przetwarzanie języka naturalnego (rozumienie języka, tłumaczenie maszynowe, rozumienie
mowy mówionej)
" programowanie automatyczne (opis algorytmów przy pomocy języka naturalnego)
" systemy doradcze (inżynieria wiedzy - reprezentacja wiedzy, dialog z systemem, itp.)
" robotyka i wizja (rozpoznawanie obrazów, planowania działań)
" automatyczne uczenie się (sieci neuronowe, algorytmy ewolucyjne, logika rozmyta)
Dwa kierunki badań w obszarze AI:
" metody symboliczne (np. programowanie logiczne)
" metody wzorowane na działaniu ludzkiego mózgu (np. sieci neuronowe)
2
2. Przetwarzanie języka naturalnego (NLP)
Głównym celem prac prowadzonych w tej dziedzinie jest opracowanie modeli opisujących
strukturę języka oraz poznanie mechanizmów rozumienia i formułowania wypowiedzi.
Zrozumienie zasad budowy i posługiwania się językiem naturalnym możliwe jest dzięki wspólnym
wysiłkom badaczy z wielu dyscyplin naukowych: lingwistyki, logiki, filozofii, psychologii,
neurofizjologii oraz informatyki.
Definicja:
NLP to dział AI zajmujący się poszukiwaniem metod formalnego opisu języka naturalnego oraz
reprezentacji wiedzy zawartej w tekstach.
Początki zainteresowania przetwarzaniem języka naturalnego związane są z problemem
automatycznego tłumaczenia tekstów z jednego języka na inny. Pierwszy projekt badawczy
dotyczący automatycznego tłumaczenia tekstów rozpoczęto w roku 1946 w Birkbeck College w
Londynie.
Zastosowania systemów NLP można podzielić na następujące kategorie:
" rozpoznawanie (rozumienie) i synteza mowy
" interfejsy w języku naturalnym (HCI z ang. human - computer interfaces)
" rozumienie i generowanie tekstów, prowadzenie dialogu (np. inteligentne wyszukiwania
informacji, dokonywanie streszczeń, tworzenie bazy wiedzy, itd.)
" automatyczne tłumaczenie tekstów (np. system JANUS-II)
" inteligentne edytory tekstów
" nauka języków obcych
Wykorzystanie języka naturalnego do komunikacji z komputerem posiada następujące zalety:
" korzystanie z komputera przez osoby bez specjalistycznego przygotowania
" szybkość (klawiatura 0,5 słowa/s; profesjonalna maszynistka 1.5-2.5 słowa/s; spontaniczna mowa
2.5-3.6 słowa/s)
" zwolnienie rąk użytkownika (równoległe wykonywanie innych czynności)
" komunikacja z komputerem w nietypowym środowisku (pod wodą, w statku kosmicznym)
" zmniejszenie czasu reakcji (szybsza reakcja werbalna niż manualna np. wyłączenie urządzenia w
przypadku awarii)
" korzystanie z komputerów przez osoby niepełnosprawne
3
Wyróżnia się następujące poziomy analizy języka naturalnego:
" akustyczny rytm i intonacja języka
" fonologiczny badanie struktury dzwiękowej języka (elementarne dzwięki fonemy, istnieje
międzynarodowy alfabet fonetyczny)
" morfologiczny badanie struktury słów (rdzenie, końcówki) syntaktyczny analiza
gramatyczna zdania (kategorie syntaktyczne wyrazów, reguły ich łączenia)
" semantyczny opis znaczenia wyrazów i zdań (np. sprawdzenie sensu zdania)
" pragmatyczny badanie znaczenia w zależności od kontekstu wypowiedzi
Do podstawowych problemów związanych z analizą języka naturalnego zalicza się:
" wieloznaczność syntaktyczną wyrazów np. wyraz "work" może oznaczać rzeczownik "praca" lub
czasownik "pracować"
" wieloznaczność semantyczną wyrazów np. czasownik "order" może posiadać jedno z
następujących znaczeń: "rozkazać", "zamówić", "uporządkować"
" wieloznaczność syntaktyczna na poziomie fraz (lub zdań) np.
John sent a package to New York
John booked a flight to New York
" problem odniesień anaforycznych
The airline bought the plane because it had already decided to do so earlier
" problem zakresu kwantyfikatorów i negacji
" wystąpienie w zdaniu nieznanych słów.
Przykładowe realizacje systemów NLP:
" SAD-SAM (R. Lindsay, 1963) system odpowiadający na pytania dotyczące stopnia
pokrewieństwa
" BASEBALL (B. Green i inni, 1963) system bazy danych, odpowiadający na pytania
dotyczące spotkań baseballowych
" LUNAR (W. A. Woods, 1972) system do wyszukiwania danych na temat próbek gruntu
księżycowego pobranych przez Apollo 11
" LADDER (G. Hendrix, 1978) system dialogowego dostępu do rozproszonych baz danych
" HAM-ANS (1981-86) i WISBER(1986-89) systemy prowadzące dialog na temat rezerwacji
hotelowej (w języku niemieckim)
4
" ORBIS (A. Colmerauer, 1983) system bazy danych, odpowiadający na pytania dotyczące
planet układu słonecznego
Schemat blokowy przykładowego systemu dialogowego (wg. MIT):
synteza generowanie
mowy wypowiedzi
Odpowiedz
układ
baza danych
sterujący
kontekst
rama
dialogu semantyczna
Pytanie
rozpoznanie
zrozumienie
mowy
wypowiedzi (języka)
Prace prowadzone w Massachusetts Institute of Technology (MIT):
JUPITER system informacji o pogodzie, dostęp przez telefon (około 500 miast)
MERCURY system rezerwacji lotów (dostęp przez telefon)
PEGASUS system informacji o lotach (odloty, przyloty)
VOYAGER system informacji o ruchu drogowym, pomoc w nawigacji (dotyczy Bostonu)
5

Wyszukiwarka

Podobne podstrony:
KEM w1
MN w1 Minimum funkcji
w1
SD przykłady do w1 13
tai w1 nstac www
BUDOWA ATOMOW W1
W1
metody numeryczne i w1
W1 Rzedy wielk i rekur
Analiza finansowa w1
IiP z w1
PMP w1
W1
ZWC w1 13 2014
6 TM w1
statystyka w1
ML1 W1

więcej podobnych podstron