SI-Sprawozdanie4, pwsz


PWSZ w KROŚNIE

Informatyka

Nazwa przedmiotu: Sztuczna Inteligencja

Nr. spraw. 4

Imię i Nazwisko:

Banaś Mariusz

Nr albumu

17518

Temat: Klasyfikacja i predykcja na podstawie analizy skupień. System SCANKEE- moduł programowy VVT.

Gr. I

Rok: III dzienny

Ocena:

Data realizacji:

02.12.2013

Data oddania:

28.03.2014

I. Część teoretyczna.

VVT (Virtual Visualization Tool) - Podsystem Uczenia Komputera - jest to moduł służący do analizy i wizualizacji skupień oraz klasyfikacji i prognozowania właściwości obiektów. Wykorzystuje w tym Elu algorytm obliczeniowy oparty na metodzie SAHN.

Metoda SAHN czyli metody Sekwencyjne, Aglomeracyjne, Hierarchiczne, dające Niepokrywające się skupienie obiektów, dostarczają dużo informacji o strukturze zbioru przy minimalnej ingerencji w dane wejściowe.

Klasyfikacja oraz predykcja to metody, które są stosowane do analizy danych, ekstrakcji modeli opisujących klasy danych lub predykcji wartości wybranego atrybutu. Predykcja jest bardzo podobna do klasyfikacji z tym, że celem predykcji jest zamodelowanie funkcji ciągłej, która by odwzorowywała wartości atrybutu decyzyjnego.

II. Część praktyczna i Analiza uzyskanych wyników

Cel ćwiczenia: Celem ćwiczenia jest przeprowadzenie procesu klasyfikacji i predykcji na wybranej bazie modułu VVT.

1.W pierwszym punkcie, wybrałem bazę danych IRYS, jako tą na której chcę pracować

0x01 graphic

2.W drugim kroku ustawiam liczbę klas, metodę skupień oraz miarę odległości

0x01 graphic

3.W następnym kroku, uruchamiam procedurę klasyfikacyjną, w której program wylicza skupienie podobnych obiektów

0x01 graphic

4. Następnie tworzę nową bazę, w której ustawiam atrybuty, które ma wyliczyć program

0x01 graphic

5. W tym kroku, program dokonał klasyfikacji obiektów oraz wykonał predykcję oraz obliczył odchylenie standardowe.

0x01 graphic


















6. Następnie wykonuję klasyfikację oraz predykcję dla tej samej bazy, lecz wybierając inną metodę skupień oraz miarę odległości.

0x01 graphic

7. Wynik klasyfikacji oraz predykcji

0x01 graphic

III. Wnioski.

Do analizy skupień oraz klasyfikacji i prognozowania właściwości obiektów służy moduł VVT (Virtual Visualization Tool) programu SCANKEE. Moduł ten wykorzystuje m.in. Euklidesowy algorytm obliczeniowy oparty na metodzie SAHN.

Na proces uczenia i testowania wyraźny wpływ ma rodzaj wybranej miary odległości i metoda skupień. Na podstawie analizy wartości odchyleń standardowych dla tych samych atrybutów, lecz dla różnych badanych obiektów, stwierdziłem, że widać różnice w obu wynikach.

Po analizie wybranych przykładów stwierdziłem również, że wybór wektorów podczas etapu uczenia i testowania wyników predykcji i klasyfikacji, nie ma wpływu na otrzymane wyniki.

1 z 5



Wyszukiwarka