WSPÓŁCZESNE TRENDY W BADANIACH NAUKOWYCH SZTUCZNEJ INTELIGENCJI 79
7. Metody grupowania danych
Przy ogromnej ilości informacji, aby "maszyny myślące” miały możliwość efektywniejszego dostępu do danych, wprowadzono metody grupowania danych. Podział danych powinien mieć następujące cechy:
a) homogeniczność w grupach, czyli dane w grupie powinny być podobne do siebie,
b) heterogeniczność pomiędzy grupami, czyli dane należące do różnych grup powinny się od siebie różnić.
Ponieważ zwykle dane opisują cechy obiektów w postaci liczbowej, najodpowiedniejszą miarą podobieństwa tych danych jest zmierzenie odległości pomiędzy obiektami (np. miara euklidesowa).
8. Eksploracja danych (data mining)
W różnych dziedzinach opracowuje się wszelkiego rodzaju programy do eksploracji danych z baz danych (data mining) i inteligentnego przetwarzania danych. Bardzo dobrym narzędziem wspomagającym data mining jest program Statistica 8.0. Odkrywanie wiedzy z baz danych (lub "dogłębna analiza danych”) sprowadza się do klasyfikacji danych, jak i sprecyzowania wszystkiego tego, co można uznać za wiedzę, pojętą jako podstawa podejmowanej decyzji. Pozwala to na wyodrębnienie wiedzy ekspertów, która miałaby największy wpływ na podejmowane decyzje. Odkrycie tej wiedzy może polegać również na wyszukiwaniu cech, które najlepiej odróżnią od siebie różne klasy, np. w medycynie bardzo istotnym jest kierowanie pacjentów na badania, które potrafią jak najszybciej, najtrafniej i najtaniej oraz możliwie bezinwazyjnie doprowadzić do właściwej diagnozy. Więcej na temat data mining czytelnik może znaleźć w [4].
9. Systemy ekspertowe
Systemy ekspertowe (SE) są programami komputerowymi, które potrafią odtworzyć i wykorzystać wiedzę ludzi-ekspertów do rozwiązywania praktycznych zagadnień z określonej dziedziny wiedzy. Można wymienić następujące etapy tworzenia systemów ekspertowych:
- zdefiniowanie problemu,
- gromadzenie wiedzy,
- wykorzystanie zgromadzonej wiedzy do rozwiązania problemu (realizacja),
- weryfikacja.
System ekspertowy zawiera bazę informacji, w której skład wchodzi baza danych (data base), baza reguł (rule base) oraz system wnioskowania (inference engine) oraz interfejs do komunikacji z użytkownikiem.
SE są bardzo podobne do klasycznych programów. Jedną z różnic, na którą należy zwrócić uwagę są instrukcje warunkowe "jeżeli ... to” gromadzone w osobnej bazie. Do wprowadzenia nowych reguł nie trzeba wówczas modyfikować całego programu. Bank danych gromadzi reguły, natomiast system wnioskowania pozwala wywodzić nowe fakty. Wnioskowanie trwa aż zostanie osiągnięty podany przez użytkownika cel lub aż zabraknie dostępnych reguł.