2212791070

2212791070



ROZDZIAŁ 3. Metody eksploracji danych

Nowe technologie pozwalają na pomiary coraz nowszych wartości, które mogą być źródłem użytecznej wiedzy. Aby wydobyć istotne informacje z coraz większych baz danych, powstają algorytmy automatycznej analizy oraz eksploracji danych.

Eksploracja danych, jest technologią, dzięki której możliwe jest automatyczne, efektywne znajdowanie statystycznych zależności, reguł pomiędzy dużymi zbiorami danych. Dzięki takim metodom jak sieci neuronowe, metody uczenia maszynowego, metody ewolucyjne, logika rozmyta, zbiory przybliżeniowe można uzyskać odwzorowania opisujące nieliniowe relacje, które zachodzą pomiędzy parametrami wejściowymi, a wynikiem procesu. Eksploracja danych jest dziedziną nauki, która rozwija się bardzo szybko ze względu na swoją wartość ekonomiczną; jest wykorzystywana do pomocy przy podejmowaniu złożonych decyzji produkcyjnych, finansowych, marketingowych w przedsiębiorstwach.

3.1. Wstępne przetwarzanie danych

Dane, dostarczane przez przedsiębiorstwa charakteryzują się takimi cechami jak błędy pomiarowe, brakujące wartości w zbiorze danych, zniekształcenie podczas próbkowania. Mimo coraz nowszych technologii pomiarowych nie udaje się uzyskać idealnych wyników, dlatego wstępne przetwarzanie danych polega na przekształceniu ich w celu przygotowania do dalszych procesów (eksploracji). Poprawne, jednoznaczne zdefiniowanie danych wejściowych ma również ogromny wpływ na szybkość działania modelu oraz jego uogólnienie. Wstępne przetwarzanie danych jest niezbędne, ponieważ metody obliczeniowe, aby skutecznie działać wymagają poprawnie, jednoznacznie zdefiniowanych danych na wejściu, tak, aby ich błędy nie miały negatywnego wpływu na wynik. Metody, jakimi można posłużyć się do przygotowania danych do procesów ich eksploracji to standaryzacja, normalizacja, dyskretyzacja danych. Standaryzację oraz normalizację stosuje się, gdy przetwarzane dane wykorzystuje się w procesach regresji, w metodach opierających się na odległościach pomiędzy danymi, lub klasyfikacji liniowej. Metody te stosuje się w celu zmniejszenia wpływu zmiennych, których przedział wartości znacznie różnią się od pozostałych, co może mieć negatywny wpływ na wynik końcowy. Zaś przy estymacji rozkładów prawdopodobieństwa wykorzystuje się dyskretyzacje. Wybór metody wstępnego przetwarzania danych jest bardzo ważny, należy zwrócić uwagę, aby wszystkie istotne dla

15



Wyszukiwarka

Podobne podstrony:
latach 80-tych ubiegłego stulecia pojawiły się nowe technologie pozwalające na otrzymywanie czystych
Slajd16 (114) Układy trój sta nowe Rozwiązaniem pozwalającym na stosowanie szyn danych jest zastosow
rozdział (70) 376 Podstawy marketingu co pozwala na/wybór obiektów posiadających z góry ustalone ch
rozdział (70) 376 Podstawy marketingu co pozwala na/wybór obiektów posiadających z góry ustalone ch
IMAG0206 (3) Metody pozyskiwania danych > Metoda obserwacji    pielęg na świa
DHTML0068 Rozdział 3. Rozdział 3. Dekorowanie tekstuDekorowanie tekstu Dekorowanie tekstu pozwala na
Slajd20 (9) Obróbka danych Wysokospecjalistyczne oprogramowanie pozwala na uzyskanie wszelkich
Metody eksploracji danychReguły asocjacyjne -    Apriori, ECLAT - pakiet arulesReguły
18 Bazy danych Systemy komputerowe pozwalają na dostęp do danych wielu użytkownikom jednocześnie.
75 Rozdział 4 Konstrukcje stalowe WSKAŻ Przycisk WSKAŻ pozwala na wczytanie parametrów dowolnego inn
Metodyka badańLUKSOMIERZ L-100 Pozwala na: •    pomiar natężenia oświetlenia
Rozdział 2Zachowania autonomiczne Istnieje wiele systemów pozwalających na realizacje zachowań
Współczesne technologie pozwalają na dokonywanie pomiarów metodą bezlustrową, co umożliwia znaczne
działalność innowacyjno-badawczą oraz wdrożenia nowych technologii. Nowe technologie wpłynęły na
Cel projektu procesowego - Sporządzenie dokumentacji technologicznej pozwalającej na zaprojektowanie

więcej podobnych podstron