Sztuczna inteligencja wykład cz 5 1


1
Elementy teorii systemów informacyjnych
( w ujęciu prof. Zdzisława Pawlaka)
Definicja systemu jednowartościowego
Opracowano wiele różnych modeli systemu informacyjnego.
Omawiać będziemy model funkcyjny, którego prekursorem
jest prof. Zdzisław Pawlak i który rozwijany jest głównie w
Polsce (w Warszawie, Gliwicach, Białymstoku, Rzeszowie,
Poznaniu), ale również w USA, Kanadzie, Chinach, Indiach.
Model funkcyjny systemu informacyjnego stał się początkiem
rozwoju teorii zbiorów przybliżonych ( ang. rough sets ),
a następnie takich dziedzin zaliczanych do sztucznej
inteligencji, jak: reguły i tablice decyzyjne, regułowe bazy
wiedzy, granular computing, rough-neuro computing.
Przykłady zastosowań:
Medycyna: diagnostyka medyczna, podejmowanie
decyzji dotyczących postępowania terapeutycznego,
zabiegów chirurgicznych, a także rozpoznawanie
obrazów w zakresie medycyny (na przykład obrazów
tomografii komputerowej),
Ekonomia: wycena przedsiębiorstwa, strategie
marketingowe, polityka kredytowa, prognozowa-
nie rozwoju
Sterowanie: np. procesami produkcyjnymi
Kryminalistyka
Archeologia
i wiele, wiele innych ...
Na potrzeby tego wykładu uściślimy sobie pojęcie danych
lingwistycznych:
2
Dane lingwistyczne reprezentują tylko same siebie i nic
ponadto w sensie: typu, wartości, itp. Wartości danych
lingwistycznych są wyrażone za pomocą języka naturalnego.
Mają charakter nie ilościowy a jakościowy, bardzo często
subiektywny. Mogą tworzyć ciągi uporządkowane ( wysoki,
średni, niski ), lub nieuporządkowane ( pogodnie, mglisto,
wietrznie), nieraz wynikają z kwantyzacji danych liczbowych.
Metody statystyki  są za słabe do ich analizy.
A porcja smak słoność łatwość zawart. trwałość
smar. witam.
X [a1] [a2] [a3] [a4] [a5] [a6]
P1 250g dobry dobra wystar duża mała
P2 250g dobry ZS duża duża duża
P3 150g TO dobra średnia wystar duża
P4 500g dobry MS mała duża duża
Przykład systemu informacyjnego - opinie konsumentów na
temat jakości produktów pewnej firmy produkującej masło
(TO - trudno ocenić, ZS- za słone, MS- mało słone)
System informacyjny jest czwórką
S = < X, ę, V,  >
gdzie
X - jest skończonym zbiorem obiektów,
A - jest skończonym zbiorem atrybutów,
charakteryzujących obiekty,
V =
UVa
- jest skończonym zbiorem wartości atrybutów,
aA
Va - jest dziedziną atrybutu a A,
3
: X AV - jest funkcja informacji w systemie.
Żądamy, aby funkcja r była funkcją całkowitą, tzn. miała
wszędzie określone wartości.
Podana definicja dotyczy systemu informacyjnego
jednowartościowego.
W rzeczywistych systemach:
- niektóre atrybuty mogą przybierać wiele wartości -> systemy
wielowartościowe,
- wartości pewnych atrybutów nie można określić w sposób
jednoznaczny (możemy tylko podać zbiory możliwych
wartości) -> systemy przybliżone,
- zbiory obiektów są opisywane z pewnym zadanym stopniem
precyzji -> systemy zmienno-precyzyjne wg. Wong, Wang i
Yao,
- systemy podlegają pewnej dynamice polegającej na
zmianach
zawartości zbiorów: obiektów, atrybutów i ich wartości ->
modele dynamiczne.
Kanon teorii systemów informacyjnych i zbiorów
przybliżonych:
W statystyce i teorii zbiorów rozmytych dane charakteryzuje
się liczbowo. W teorii systemów informacyjnych i zbiorów
przybliżonych - za pomocą relacji nierozróżnialności i
zależności funkcyjnej między zbiorami atrybutów.
Def
Deskryptorem nazywać będziemy parę (a,v), gdzie a A jest
atrybutem, natomiast vV - jest wartością atrybutu a ze
a
zbioru wartości V
a.
4
Def
Informacja o obiekcie xX dana jest przez pełny zbiór
deskryptorów (a,v), tj. zbiór deskryptorów w którym
występują wszystkie atrybuty aA, a poszczególne v są
wartościami funkcji informacji r(x,a). Informację o obiekcie,
zwaną tez opisem obiektu, oznaczać będziemy przez rX.
Def
Informacją w systemie nazywać będziemy taki pełny zbiór
deskryptorów (a,v), w którym występują wszystkie atrybuty
aA, a poszczególne vV
a.
System, w którym każdej informacji odpowiada co najwyżej
jeden obiekt nazywać będziemy systemem selektywnym.
System, w którym każdej informacji odpowiada przynajmniej
jeden obiekt nazywać będziemy systemem kompletnym.
Def
Przez Inf(S) oznaczać będziemy zbiór wszystkich możliwych
informacji w ustalonym systemie S.
Zachodzi następująca prosta zależność:
card (Inf (S)) = )
card(Va
aA
Def
Mówimy, że informacja j jest w systemie S pusta, gdy Xj
jest zbiorem pustym. Podobnie, gdy Xj =X mówimy, że
informacja j jest prawdziwa.
5
A
X a b c d
x1 p z u k
x2 s z u l
x3 s z u l (1)
x4 q x u m
x5 r y w m
x6 r y w m
Przykład systemu informacyjnego.
Przykładem informacji w powyższym systemie jest zbiór
deskryptorów: (a,q) (b,z) (c,u) (d,m) (2)
Informacja ta jest w przykładowym systemie pusta.
Przykładowy system nie zawiera informacji prawdziwych.
System ten nie jest systemem selektywnym, nie jest też
systemem kompletnym.
Ilość wszystkich informacji w tym systemie wynosi aż 72
(dlaczego ?) (Zwykle ilość możliwych informacji w systemach
informacyjnych jest znacznie większa niż ilość obiektów.)
Każda informacja j wyznacza w systemie pewien zbiór
obiektów Xj , taki, że
Xj ={x X :j = rx}
Zbiór Xj może być pusty. Obiekty należące do niepustych
zbiorów Xj są w wewnątrz tych zbiorów wzajemnie
nierozróżnialne.
6
Przykładowy system informacyjny (1) zawiera cztery bloki
obiektów wewnątrz nierozróżnialnych.
Są to bloki : {x1}, {x2, x3}, {x4}, {x5, x6}. (3)
Pogłębimy teraz pojęcie nierozróżnialności obiektów.
Mówimy, że dwa obiekty x,yX są w systemie S
nierozróżnialne
- ze względu na atrybut aA (a-nierozróżnialne),
wtedy i tylko wtedy, gdy r(x,a)= r (y,a),
- ze względu na podzbiór atrybutów P A
(P-nierozróżnialne) wtedy i tylko wtedy, gdy
r (x, a ) = r (y,a )
"
aP
- ze względu na cały zbiór atrybutów A
(nierozróżnialne w S), wtedy i tylko wtedy gdy r = r
x y.
Wszystkie te relacje są relacjami nierozróżnialności w
produkcie kartezjańskim X2 i dzielą cały zbiór obiektów na
rozłączne klasy abstrakcji (równoważności), przy czym 
klasy równoważności otrzymane ze względu na cały zbiór
atrybutów nazywamy blokami elementarnymi lub
składowymi atomowymi.
- klasyczne oznaczenie klas abstrakcji systemu S ze
[s] ~
A
względu na cały zbiór atrybutów A.
W przykładowym systemie (1) nierozróżnialnymi ze względu
na atrybut d są obiekty {x4, x5, x6}, ze względu zaś na zbiór
atrybutów {b, c} obiekty {x1, x2, x3}. Blokami elementarnymi
systemu są wskazane w (3) zbiory obiektów.
7
x1 x2 x3
x4 x5 x6
Bloki elementarne przykładowego systemu
Stosowane na użytek tego wykładu zapisy:
~ ~
~
a S
P
oznaczać będą odpowiednio klasy równoważności: ze
względu na: atrybut a, ze względu na zbiór atrybutów PA,
oraz ze względu na cały zbiór atrybutów A.
Z każdym blokiem elementarnym związana jest jedna, i tylko
jedna informacja, przy czym:
~ =
I~
S a
aA
Bloki elementarne w systemie powstają poprzez wymnożenie
przez siebie klas równoważności dla wszystkich pojedynczych
atrybutów. Dla każdej informacji j zbiór X jest blokiem
j
elementarnym, albo zbiorem pustym.
Zależności między atrybutami
Def
Powiemy, że atrybut b zależy od atrybutu a ( a b ) wtedy i
tylko wtedy, gdy istnieje funkcja taka, że
(b) = fab (rx (a))
r
x
Własność

(a b)
~ ~
a b
8
Przykłady zależności funkcyjnych w rzeczywistych systemach
informacyjnych:
nr_tlf nr_kodu_pocztowego (w książce telefonicznej)
nazw_wykł, dzień_tyg, godz, sala wykład
W drugim przypadku mamy zależność pojedynczego atrybutu
wykład od zbioru atrybutów stojących po lewej stronie
operatora . Istnieje analogiczna własność

(B a)
Własność
~ ~
B a
Analogicznie możemy mówić o zależności aB, lub BC.
Wszystkim tym zależnościom funkcyjnym odpowiadają
równoważne zawierania miedzy odpowiednimi klasami
równoważności na zbiorach atrybutów stojących po lewej i
prawej stronie operatora .
Def
Powiemy, że atrybuty a i b są niezależne jeżeli nie zachodzi

ani ani
~ ~ ~ ~
b a
a b
Def
Powiemy, że atrybuty a i b są równoważne
(co zapiszemy a ~ b), jeżeli zachodzi
=
~ ~
a b
Algorytm badania zależności funkcyjnej między dwoma
dowolnymi zbiorami atrybutów B A oraz C A:
Zależność BC nie zachodzi, jeśli w tabeli funkcji
informacyjnej r(x,a) istnieją dwa wiersze o takich samych
wartościach atrybutów b , ... , b B lecz różnych wartościach
1 n
9
atrybutów c , ... , c C, w przeciwnym przypadku -
1 m
zależność funkcyjna zachodzi.
W systemie informacyjnym (1) zachodzi przykładowo
zależność funkcyjna (a, b) (c, d), natomiast nie zachodzi
(b, c) a. Zależności funkcyjne pozwalają na eliminacje w
systemie informacyjnych tych atrybutów, które są zależne
funkcyjnie od innych atrybutów.
Aatwo sprawdzić, że w systemie (1) klasy równoważności
generowane przez atrybuty (a, b) zawierają się (są nawet takie
same) w klasach równoważności generowanych przez
atrybuty (c, d). Natomiast klasy równoważności generowane
przez atrybuty (b, c) nie zawierają się w klasach
równoważności generowanych przez atrybut a, co widać na
poniższym rysunku
x1 x2 x3 x1 x2 x3
x4 x5 x6 x4 x5 x6
a) b)
a) - klasy równoważności generowane przez atrybuty (b, c)
b) - klasy równoważności generowane przez atrybut a
Redukt systemu informacyjnego
Def
Zbiór atrybutów B A nazywamy reduktem zbioru atrybutów
A wtedy i tylko wtedy, gdy = oraz nie istnieje
~ ~
B A
właściwy podzbiór B B, taki że =
~ ~
B' A
Redukt systemu pozwala na operowanie mniejsza ilością
atrybutów w opisie obiektów bez utraty informacji zawartej w
systemie. Może to mieć duże znaczenie dla praktyki.
10
Własność: Każdy system informacyjny może mieć więcej niż
jeden redukt.
Przykładowy system informacyjny (1) posiada redukty: {a} i
{b, d}.
Zbiory opisywalne
Def
Zbiorami opisywalnymi nazywać będziemy takie podzbiory
zbioru obiektów X, które dadzą się otrzymać poprzez złożenie
wybranych bloków elementarnych systemu. Opis tych
zbiorów jest sumą opisów poszczególnych bloków
elementarnych, wchodzących w skład zbioru opisywalnego.
W systemie informacyjnym (1) przykładowymi zbiorami
opisywalnymi są {x1}, {x2, x3, x4}, natomiast nie są zbiorami
opisywalnym zbiory {x1, x2}, {x2, x3, x5}.
Estymatory dokładności i efektywność opisu w systemie
Dokładność systemu informacyjnego S określimy za pomocą
wzoru
2k
lS = = 2k-card ( X )
2card ( X )
gdzie k jest liczbą bloków elementarnych w systemie, więc 2k
jest liczbą wszystkich zbiorów opisywalnych.
Im więcej mamy bloków elementarnych w systemie, tym
więcej otrzymamy zbiorów opisywalnych, a więc system
pozwala dokładniej opisywać podzbiory obiektów.
Współczynnik dokładności 0 < lS Ł 1 osiąga wartość
maksymalną 1 dla systemu selektywnego. W systemie
selektywnym wszystkie bloki elementarne są
jednoelementowe
11
Dla przykładowego systemu informacyjnego (1) mamy k=4,
więc
24
lS = = 2-2 = 0,25
26
System nie pozwala więc na zbyt dokładny opis obiektów.
Pojęcie efektywności opisu systemu wiąże się z oceną, jaka
część informacji zawartej w systemie może być faktycznie
używana do opisu zbiorów. W rzeczywistości bowiem
znaczna część informacji w systemie jest pusta, więc nie może
być wykorzystaną do opisu zbiorów.
Efektywność opisu określamy za pomocą wzoru
k
hS =
card (Va )
aA
W mianowniku tego wyrażenia znajduje się liczba wszystkich
możliwych informacji, natomiast licznik przedstawia liczbę
wszystkich niepustych informacji. Oczywiście 0 < hS Ł 1.
Wartość 1 współczynnik efektywności przyjmuje dla systemu
zupełnego. System zupełny nie zawiera pustych informacji.
Dla każdego innego systemu jest on mniejszy od jedności.
Dla przykładowego systemu informacyjnego (1) gdzie mamy
k=4 jest
4
hS = =0,056
72
Jest to bardzo niska efektywność opisu.


Wyszukiwarka

Podobne podstrony:
Sztuczna inteligencja wykład cz 1
Sztuczna inteligencja wykład cz2
Sztuczna inteligencja wykład cz7
Sztuczna inteligencja wykład cz8
sciaga okb wyklad 3 cz 6
Wykłady cz 6
gleby wykłady cz 1
WYKŁAD 5 cz 1
Wykład cz 2 Choroby zawodowe
Wyklad cz 2
E FILIPOWICZ I J KWIECIEă ANALIZA MO˝LIWO—CI ZASTOSOWANIA METOD SZTUCZNEJ INTELIGENCJI W MEDYCYNIE
sztuczna inteligencja logik rozmyta 0

więcej podobnych podstron