Jedną z najlepszych definicji określających czym jest hurtownia danych podał amerykański konsultant W. H. Inmon.
Hurtownia danych jest zorientowanym tematycznie, zintegrowanym, oznaczonym w czasie i ciągłym procesem zbierania danych dla wspomagania procesu decyzyjnego kierownictwa.
Obszarem, w którym hurtownie danych są najczęściej używane jest OLAP (On Linę Analytical Processing) czyli szybka analiza informacji wielowymiarowej. Termin OLAP odnosi się do technologii, która umożliwia użytkownikom wielowymiarowych baz danych interakcyjne generowanie opisowych lub porównawczych zestawień ("przekrojów") oraz innych zapytań analitycznych. Należy zauważyć, że analizy OLAP pomimo swej nazwy (on-line) nie muszą być przeprowadzane na bieżąco, ani w czasie rzeczywistym. Termin ten odnosi się do analizy wielowymiarowych baz danych (które oczywiście mogą zawierać informacje uaktualniane dynamicznie) poprzez wydajne zapytania wielowymiarowe dotyczące danych różnego typu.
Narzędzia OLAP mogą być integrowane z systemami baz danych (korporacyjnymi) i umożliwiają analitykom i menedżerom analizowanie wydajności przedsiębiorstwa (np. różnych aspektów procesu produkcyjnego lub ilości i rodzajów transakcji przeprowadzonych w różnych oddziałach) lub rynku. Rezultaty osiągane technikami OLAP mogą mieć bardzo prostą postać (np. tablice liczebności, statystyki opisowe, proste tabele krzyżowe) lub nieco bardziej złożoną (np. mogą uwzględniać korekty sezonowe, usuwanie nieadekwatnych obserwacji oraz inne formy "czyszczenia danych"). Systemy OLAP różnią się istotnie od systemów przetwarzania transakcji online (OLTP). Różnice pomiędzy OLAP a OLTP
OLTP |
OLAP | |
Przeznaczenie |
Wprowadzanie danych w czasie rzeczywistym |
Odczyt i analiza danych historycznych |
Wykonywanie aktualizacji |
Tak |
Nie-tylko odczyt |
Wykonywanie edycji |
Tak |
Nie |
Źródło danych |
Wpis danych |
Historyczne dane OLAP |
Skojarzona baza danych |
Operacyjna |
Analityczna, możliwa operacyjna |