PWSZ w KROŚNIE Informatyka |
||||
Nazwa przedmiotu: Sztuczna Inteligencja |
Nr. spraw. 4 |
|||
Imię i Nazwisko: Banaś Mariusz
|
Nr albumu 17518 |
Temat: Klasyfikacja i predykcja na podstawie analizy skupień. System SCANKEE- moduł programowy VVT. |
Gr. I |
|
|
|
|
Rok: III dzienny |
|
|
|
Ocena: |
Data realizacji: 02.12.2013 |
Data oddania: 28.03.2014 |
I. Część teoretyczna.
VVT (Virtual Visualization Tool) - Podsystem Uczenia Komputera - jest to moduł służący do analizy i wizualizacji skupień oraz klasyfikacji i prognozowania właściwości obiektów. Wykorzystuje w tym Elu algorytm obliczeniowy oparty na metodzie SAHN.
Metoda SAHN czyli metody Sekwencyjne, Aglomeracyjne, Hierarchiczne, dające Niepokrywające się skupienie obiektów, dostarczają dużo informacji o strukturze zbioru przy minimalnej ingerencji w dane wejściowe.
Klasyfikacja oraz predykcja to metody, które są stosowane do analizy danych, ekstrakcji modeli opisujących klasy danych lub predykcji wartości wybranego atrybutu. Predykcja jest bardzo podobna do klasyfikacji z tym, że celem predykcji jest zamodelowanie funkcji ciągłej, która by odwzorowywała wartości atrybutu decyzyjnego.
II. Część praktyczna i Analiza uzyskanych wyników
Cel ćwiczenia: Celem ćwiczenia jest przeprowadzenie procesu klasyfikacji i predykcji na wybranej bazie modułu VVT.
1.W pierwszym punkcie, wybrałem bazę danych IRYS, jako tą na której chcę pracować
2.W drugim kroku ustawiam liczbę klas, metodę skupień oraz miarę odległości
3.W następnym kroku, uruchamiam procedurę klasyfikacyjną, w której program wylicza skupienie podobnych obiektów
4. Następnie tworzę nową bazę, w której ustawiam atrybuty, które ma wyliczyć program
5. W tym kroku, program dokonał klasyfikacji obiektów oraz wykonał predykcję oraz obliczył odchylenie standardowe.
6. Następnie wykonuję klasyfikację oraz predykcję dla tej samej bazy, lecz wybierając inną metodę skupień oraz miarę odległości.
7. Wynik klasyfikacji oraz predykcji
III. Wnioski.
Do analizy skupień oraz klasyfikacji i prognozowania właściwości obiektów służy moduł VVT (Virtual Visualization Tool) programu SCANKEE. Moduł ten wykorzystuje m.in. Euklidesowy algorytm obliczeniowy oparty na metodzie SAHN.
Na proces uczenia i testowania wyraźny wpływ ma rodzaj wybranej miary odległości i metoda skupień. Na podstawie analizy wartości odchyleń standardowych dla tych samych atrybutów, lecz dla różnych badanych obiektów, stwierdziłem, że widać różnice w obu wynikach.
Po analizie wybranych przykładów stwierdziłem również, że wybór wektorów podczas etapu uczenia i testowania wyników predykcji i klasyfikacji, nie ma wpływu na otrzymane wyniki.
1 z 5