98096

98096



DM - Data Mining (eksploracja danych)

Czynniki rozwoju DM: wzrost zbiorów danych; szeroki dostęp użytkowników do wiarygodnych danych; zwiększony dostęp do danych z intranetu i Internetu; zwiększanie udziału rynku w globalnej ekonomii wzrost dostępności do oprogramowania DM;

Podejście metodyczne CRISP-DM

Cykl życia DM: zrozumienie uwarunkowań biznesowych/badawczych, zrozumienie danych, przygotowanie danych, modelowanie, ewaluacja, wdrożenie (fazy interacyjne)

Zadania DM:

-opis wzorców i tendencji tkwiących w danych

-szacowanie, klasyfikacja; zmienna celu jest numeryczna, a nie jakościowa -przewidywanie; wynik dotyczy zawsze przyszłości -klasyfikacja; jakościowa zmienna celu

-grupowanie rekordów, obserwacji, przypadków w klasy podobnych obiektów; nie ma zmiennej celu; dzieli cały zbiór na zgodne podzbiory, tam maksymalizowane jest podobieństwo rekordów, a podobieństwo rekordów spoza grupy jest minimalizowane

-odkrywanie reguł; szukanie powiązanych ze sobą rekordów (które atrybuty rekordów są ze sobą powiązane); ilościowo określana relacja

DM modelowanie metody

METODY NIENADZOROWANE, nie ma zidentyfikowanej zmiennej celu;

-grupowanie

-tworzenie reguł asocjacyjnych (analiza koszyków zakupowych)

METODY NADZOROWANE; zmienna celu jest określona (+przykłady ze zmienną celu)

-regresja

-klasyfikacja

Drzew a decyzyjne - metoda klasyfikacji; zbiór węzłów decyzyjnych połączonych za pomocą gałęzi, rozchodzących się w dół od korzenia aż do kończących liści; atrybuty to korzenie, a każde możliwe wyjście to gałęzie, gałąź prowadzi albo do liścia albo kolejnego więzła decyzyjnego

-    gdy nie można dokonać nowych podziałów, brak nowych więzów Aby można było zastosować drzewo trzeba:

-wstępnie sklasyfikować zmienną celu i dostarczyć zbiór uczący zawierający wartość zmiennej celu -zbiór uczący ma być bogaty i różnorodny (reprezentatywna grupa rekordów)

-klasy zmiennej celu muszą być dyskretne (nie może być ciągła zmienna celu)

Drzewa klasyfikacyjne i regresyjne, CART, Breiman, 1984;

-ściśle binarne (dokładnie dwie gałęzie wychodzące z każdego więzła decyzyjnego)

DM reguły decyzyjne (zdolność interpretacji za pomocą reguł decyzyjnych);

-    budowane są przez przechodzenie dowolną ścieżką z korzenia do liścia -pełny zbiór reguł decyzyjnych jest równoważny z drzewem decyzyjnym -forma „jeżeli poprzednik, to następnik”

-WSPARCIE odnosi się do procentu rekordów w zbiorze danych, które są przypisane do danego liścia; UFNOŚĆ reguł wskazuje na procent rekordów w liściu, dla których reguła jest prawdziwa



Wyszukiwarka

Podobne podstrony:
Perspektywy baz danych - Data Mining Data Mining - Eksploracja danych (spotyka się również określeni
Czynniki rozwoju turystyki Wzrost zamożności obywateli Większa ilość czasu wolnego Rozwój
Wydział Zarządzania Uniwersytet Warszawski wybranych narzędzi BI, Eksploracja danych (data mining):
•    Eksploracja danych (data mining). •    Systemy wspomagania decyzj
FIEDUKOWICZ, Anna Wybrane metody eksploracyjnej analizy danych przestrzennych (Spatial Data Mining)
•    Eksploracja danych (data mining). •    Systemy wspomagania decyzj
12 PROBLEMY EKSPLOATACJI 2-2012 najbardziej znanym jest drążenie danych (Data Mining). W proces
Perspektywy baz danych - Data Mining Techniki i metody służące eksploracji danych wywodzą się główni
slajd1 (128) II    EKSPLORACJA DANYCHPrzygotowanie danych:    czy to t
• Metody odkrywania wiedzy w danych (data mining). Tutoriale na WCCI, IJCNN, ICANN, ICONIP, i innych
Slajd8 (2) IX EKSPLORACJA DANYCH Wizualizacja danych: klasyfikacja 1. one-dimensional Data to be
SZTUCZNA INTELIGENCJA: ROZWÓJ, SZANSE I ZAGROŻENIA •    Eksploracji danych - omawia
Załącznik 3PRZEDMIOTY REALIZOWANE NA STUDIACH PODYPLOMOWYCH ANALIZA DANYCH I DATA MINING1. Analiza
1. Nazwa studiów podyplomowych: ANALIZA DANYCH I DATA MINING 2.    Zwięzły opis: Stud
7. Efekty kształceniaEfekty kształcenia studiów podyplomowych Analiza Danych i Data Mining realizują
Slajd14 (2) IX EKSPLORACJA DANYCH źródło Data r David Fig. 4. Values of credit card purchases i

więcej podobnych podstron