ANALIZA DUŻYCH MAGAZYNÓW INFORMACJI
STRESZCZENIE
Intensywnie rozwijająca się dziedzina odkrywania wiedzy w bazach danych (ang. Knowledge Discovery in Databases) oraz eksploracji danych (ang. Data Mining) jest odpowiedzią na gwałtowny wzrost ilości informacji gromadzonych w bazach i magazynach danych. Techniki eksploracji danych pozwalają na znajdowanie wcześniej nieznanych zależności i schematów, które mogą być wykorzystane do wspomagania podejmowania decyzji lub opisu dużych baz danych. Praca prezentuje podstawowa problematykę związaną z odkrywaniem wiedzy w bazach danych z uwzględnieniem procesu eksploracji danych. Zostały omówione techniki eksploracji danych i algorytmy służące temu celowi wraz identyfikacją implementacji tychże algorytmów i technik zawartych w SQL Server 2000. Przedstawiono również produkt komercyjny, jakim jest SQL Server 2000 w kontekście realizacji zadań procesu odkrywania wiedzy i eksploracji danych.
Dodatkowo przeanalizowane zostały metody tworzenia i analiza modelu eksploracji danych opartego na danych z rzeczywistych baz danych za pomocą dwóch algorytmów zgłębiani danych: algorytmu drzewa decyzji (ang. Microsoft Decision Tree) oraz algorytmu klasteryzacji (ang. Microsoft Clustering).
ANALYSIS OF LARGE WAREHOUSES OF INFORMATION
ABSTRACT
Intensively developing domain of Knowledge Discovery in Databases (KDD) and Data Mining is an respond on fast growth of information's stored in data bases and data warehouses. Technique of data mining is a powerful process that finds hidden, not know before, patterns and schemas, that can be useful for Decision Support Systems (DSS) or description of large data bases.
This M.Cs. presents basic problems connected with Knowledge Discovery in Databases involving data mining process. This paper consider data mining techniques and algorithms for this purpose, with identification of implemented algorithms and techniques for SQL Server 2000. Also is discussed commercial product, like SQL Server 2000, in context of realizing of Knowledge Discovery and Data Mining tasks. Additionally, M.Cs. presents methods of creating and analyzing data mining model from real world data bases using data mining algorithms: Microsoft Decision Tree and Microsoft Clustering.
Ola Olacka
Analiza dużych magazynów informacji