Bazy danych
1
Hurtownie danych
Architektura hurtowni
danych
Zastosowania HD
BAZY DANYCH
Wykład 11
-
BAZY DANYCH W ZARZĄDZANIU.
HURTOWNIE DANYCH
Bazy danych
2
ISTOTA INFORMACJI
Cel nadrzędny każdej organizacji: trwanie - trwanie na rynku
konkurencji.
Dla zachowania konkurencyjności, współczesne korporacje
muszą być w stanie:
określić ryzyko w działalności korporacji;
zoptymalizować procesy zarządzania;
maksymalizować zysk na bardzo konkurencyjnym rynku ze świadomymi
klientami;
umieć określić i natychmiast odpowiadać na zmiany i możliwości, jakie
stwarza rynek;
adaptować się do zmian na rynku w technologii, bez konieczności
restrukturyzacji
całej korporacji.
Kluczowym elementem, pozwalającym wykonać te zadania jest posiadanie
prawidłowej informacji we właściwym czasie – możliwość podejmowania
właściwych decyzji.
Rozwiązanie
problematyki
-
system,
który
integrowałby
czynniki
technologiczne oraz umożliwiałby dostęp do informacji gromadzonej w różnych
źródłach.
Informacja ta musi być spójna i dokładna, posiadając jednocześnie wartość dla
przedsiębiorstwa.
Bazy danych
3
TYPY DANYCH
Dane operacyjne
– stanowią element dynamiczny, podlegający ciągłym
zmianom i aktualizacjom.
Dane te reprezentują informację aktualną w określonym momencie czasowym,
określają one więc stan bieżący, mogący ulegać zmianie w każdej chwili.
Dane analityczne
- dane historyczne, zwykle pozostające niezmienione. Ich
zmiana jest możliwa tylko w przypadku wykrycia błędu w danych oryginalnych.
Dane analityczne są zwykle budowane z danych operacyjnych (nie muszą jednak
pochodzić z samej korporacji) i mogą być używane do wyczerpującej analizy
procesów zachodzących w korporacji na przestrzeni czasu.
Dane analityczne gromadzone w analitycznych bazach danych są często
wykorzystywane do podejmowania decyzji (strategicznych, taktycznych).
Ponadto wymagane są jeszcze systemy informatyczne, pozwalające dokonywać
różnego
rodzaju
analiz
(np.
wyszukania
pewnych
prawidłowości,
przeprowadzenia obliczeń, wykonania symulacji).
Jedną z kategorii systemów informatycznych, które wykorzystują dane
analityczne do wspomagania decyzji są
informatyczne systemy wspomagania
decyzji
, czyli
systemy klasy DSS
.
Bazy danych
4
SYSTEMY DSS
System wspomagania podejmowania decyzji (DSS)
jest systemem, którego
zadaniem jest dostarczenie użytkownikowi informacji umożliwiających
zanalizowanie sytuacji i podjęcie decyzji (czyli wspomaganie pracowników w
podejmowaniu decyzji – czyniąc pracę bardziej efektywną).
Proces podejmowania decyzji może być długotrwały i mieć strategiczny
charakter (np. kilkuletnia analiza sprzedaży określonych produktów w celu
wprowadzenia na rynek nowych produktów i usług).
Proces podejmowania decyzji może być krótkotrwały i mieć charakter taktyczny
(np.
rewidowanie
i zmienianie liczby zalecanych zamówień danego produktu).
Systemy dostarczające informacje, które sprawiają, że pracownicy są lepiej
przygotowani do podejmowania przemyślanych decyzji, to systemy wspomagania
podejmowania decyzji.
Bazy danych
5
CELE SYSTEMÓW DSS
System wspomagania decyzji powinien realizować następujące
zasady:
1.
Głębia informacji - przegląd informacji od najwyższego do najniższego
poziomu; użytkownik może przeglądać zarówno globalne zestawienia
informacji, jak i najdrobniejsze szczegóły dotyczące jednostek wchodzących
w skład tych zestawień.
2.
Porównywanie informacji - łatwe porównywanie informacji na podstawie
wspólnych cech, (np. porównanie zarobków w zadanych okresach czasu, dla
określonej kategorii pracowników).
3.
Użyteczność informacji - zastosowanie w rozwiązywaniu problemów firmy,
musi być w jakiś sposób użyteczna dla firmy. Sama ilość zebranej informacji
nie gwarantuje jej użyteczności.
4.
Punktualność informacji - informacja użyteczna ze względu na treść, ale
uzyskana zbyt późno, może być bezwartościowa (np. podsumowanie I
kwartału roku wykonane na koniec II kwartału, wskazujące na ucieczkę
klientów do konkurencji, jest całkowicie bezwartościowe).
5.
Szybka analiza - analiza danych na wiele sposobów; każde zapytanie musi
być wykonane szybko, aby zestaw skomplikowanych zapytań był wykonany
w rozsądnym czasie.
6.
Dostępność informacji – prezentowanie informacji w języku biznesu, a nie
w języku systemów analitycznych (analizy przy użyciu słów i języka
zrozumiałego dla użytkownika).
Bazy danych
6
HURTOWNIE DANYCH
Hurtownia danych
(data warehouse, DW) to analityczna baza danych
wykorzystywana jako podstawa systemu wspomagającego podejmowanie decyzji.
Hurtownię projektuje się dla dużej liczby stałych danych. Zapewnia ona dostęp
do informacji, które będą wykorzystane podczas wypracowywania decyzji.
Hurtownia danych
jest zestawem narzędzi pozwalających kierownikom,
dyrektorom i analitykom szybciej i skuteczniej podejmować decyzje.
Podstawowym celem HD jest dostarczenie właściwych informacji, właściwym
kosztem, we właściwym miejscu i czasie, by na ich podstawie można było
podejmować właściwe decyzje.
Tradycyjne systemy transakcyjne (online transaction processing, OLTP) nie są
najskuteczniejszym narzędziem wspomagającym podejmowanie decyzji, z kolei
samo wykorzystanie szybkich połączeń sieciowych nie rozwiąże problemu
sprawnego dostępu do informacji.
Hurtownie danych stanowią platformę integrującą dane pochodzące z różnych
źródeł i umożliwiającą ich przetwarzanie analityczne (online analytic processing,
OLAP).
Bazy danych
7
HURTOWNIE DANYCH - UMIEJSCOWIENIE
Hurtownia danych gromadzi wybrane informacje i pozwala na szybszy, tańszy i
efektywniejszy do nich dostęp, stanowiąc rodzaj długookresowego bufora między
systemami OLTP a OLAP.
Rys. HD jako element pośredni między przetwarzaniem transakcyjnym a przetwarzaniem analitycznym
1. W jaki sposób ujednolicać strumień danych napływających z różnych źródeł?
2. Jak dostosować sposób przechowywania informacji do konkretnych
programów typu OLAP?
Budowa hurtowni danych determinowana jest kompromisem między tymi dwoma
zadaniami, zmieniającym się ciągle zgodnie z zapotrzebowaniem rynkowym.
Hurtownie danych nie mogą, więc być wytwarzanymi masowo „produktami z
półki" i zawsze wymagają indywidualnego zaprojektowania i optymalizacji z
uwzględnieniem potrzeb klienta.
Tradycyjne techniki projektowania baz danych nie uwzględniają wielu czynników
charakterystycznych dla HD, np. problem wyboru źródła danych, zależności
czasowe, agregacje, kontrola nadmiarowości.
Bazy danych
8
ARCHITEKTURA HURTOWNI DANYCH
Strukturę HD tworzą kolejne warstwy danych (dane jednej warstwy są
pochodnymi warstwy niższej).
Rys. Ogólna architektura HD
Źródła danych (operacyjne bazy danych) -
najniższa warstwa; usystematyzowane dane
przechowywane w otwartych systemach baz
danych, dane nieuporządkowane lub częściowo
uporządkowane, przechowywane w plikach.
Środkową warstwę zajmuje „globalna" hurtownia
danych, nazywana też hurtownią podstawową
lub
centralną
-
zbiór
zintegrowanych,
nieulotnych,
ukierunkowanych
baz
danych
stanowiący podstawę DSS (dane atomowe,
podsumowania).
Kolejną warstwę stanowią „lokalne" hurtownie
-
dane
silnie
zagregowane,
będące
podsumowaniem informacji z globalnej hurtowni.
Przeznaczone
są
do
bezpośredniego
wykorzystania
w
zarządzaniu,
planowaniu
długoterminowym,
analizach
historycznych,
analizach trendów, przetwarzaniu informacji i
analizach zintegrowanych.
Lokalne hurtownie danych, np.
hurtownie tematyczne (data marts, składnice
danych, hurtownie oddziałowe)
bazy danych OLAP.
Bazy danych
9
HURTOWNIE TEMATYCZNE
Hurtownie tematyczne
to niewielkie hurtownie, zawierające wycinek pełnej
informacji zgromadzonej w hurtowni globalnej.
Mogą być np. używane przez jeden z oddziałów firmy i dotyczyć tylko informacji
o tym oddziale (np. dział marketingu - informacje o klientach, transakcjach i
sprzedawanych produktach), podczas gdy globalna HD powinna też obejmować
dane na temat zatrudnionych w firmie, działach itp.
Tematyczne HD mogą być zaimplementowane jako relacyjne bazy danych lub
specjalne struktury wielowymiarowe.
Różnice pomiędzy globalnymi hurtowniami danych a lokalnymi
hurtowniami tematycznymi:
1.
Globalne HD - efekt złożonego procesu ekstrakcji, integracji i transformacji
danych;
Hurtownie tematyczne – wynik procesu transformacji i agregacji danych z
globalnej HD.
2.
Dane w globalnej HD - szczegółowe, obszerne, słabo zagregowane;
Dane w lokalnych hurtowniach tematycznych - silnie zagregowane, mniejsze
rozmiary.
Bazy danych
10
MAGAZYN DANYCH OPERACYJNYCH (ODS)
Magazyn danych operacyjnych
(operational data store, ODS) - warstwa
pośrednia pomiędzy warstwą danych źródłowych a globalną hurtownią danych.
Warstwa ODS zawiera zintegrowane dane tematyczne, aktualne (ulotne) i
szczegółowe.
ODS zawiera zwykle wyniki transformacji, integracji i agregacji danych ze
źródeł, podobnie jak globalna hurtownia danych (ODS jest zbiorem
zmaterializowanych perspektyw relacyjnych).
Główne różnice między ODS a hurtownią danych są następujące:
1.
ODS jest aktualizowany o wiele częściej niż hurtownia danych;
2.
zawiera znacznie aktualniejsze informacje;
3.
stopień agregacji (ziarnistości) danych jest znacznie mniejszy (dane mogą
być np. w niewielkim tylko stopniu podsumowane).
Baza metadanych jest pomocna zarówno dla administratora, jak i projektanta
hurtowni danych (duża złożoność HD - architektura (fizyczna i logiczna) może
być bardzo skomplikowana, ilość danych ogromna i mogą być stosowane różne
metody ekstrakcji, transformacji, agregacji, czyszczenia i przechowywania
informacji
Bazy danych
11
PROJEKTOWANIE HD
Projektowanie hurtowni danych jest trudnym zadaniem, należy rozwiązać
wiele problemów:
1.
pogodzić semantycznie informacje pochodzące z różnych źródeł i połączyć je
we wspólny model hurtowni danych przedsiębiorstwa
2.
zaprojektować logiczną strukturę relacji w podstawowej części hurtowni
danych;
3.
uwzględnić problemy techniczne związane z samym projektowaniem
(wybów sposobu reprezentacji tablic, procesów, indeksów, podziałów
danych, logicznego schematu hurtowni, zapewnienie sprawności całego
systemu);
4.
wyboru bazy sprzętowej i tworzenie oprogramowania.
Projektowanie HD nie kończy się z chwilą jej wdrożenia, ale stanowi stałą część
cyklu życia systemu.
Stosowane metodologie projektowania hurtowni danych: projektowanie metodą
zstępującą (top-down) i wstępującą (bottom-up).
Ogólny kształt ostatecznego schematu hurtowni danych:
1.
pierwsza warstwa - ODS (czyszczenie i transformację danych);
2.
zdenormalizowana, gwiaździsta baza danych – miejsce przechowywania
danych
Bazy danych
12
ZASILANIE DANYMI HD
Dostęp do danych z wielu różnorodnych źródeł informacji:
1.
systemów baz danych (relacyjnych, obiektowych, hierarchicznych,
sieciowych, itp.);
2.
źródeł
zewnętrznych
(np.
od
innych
przedsiębiorstw,
instytucji
gromadzących dane, itp.);
3.
plików standardowych typów (np. Microsoft Excel, programy napisane w
języku COBOL, itp.);
4.
innych dokumentów (Microsoft Word, strony WWW).
Programy do przenoszenia danych ze źródeł do HD:
1.
tłumaczące (wrappers)
2.
ładujące (loaders);
3.
integrujące (mediators).
Ponadto programy ekstrahujące dane mogą analizować informacje źródłowe pod
kątem przyczyn występowania wartości nietypowych (odstających), być może
błędnych.
Bazy danych
13
PROGRAMY ETL
Narzędzia z tej grupy, handlowo zwanej programami ekstrakcji-transformacji-
ładowania (ETL, extraction-transformation-load), automatyzują lub ułatwiają
następujące rodzaje zadań:
–
ekstrakcja (dostęp do różnorodnych źródeł danych),
–
czyszczenie (wykrywanie i rozwiązywanie niespójności danych źródłowych),
–
transformacje (np. pomiędzy różnymi formatami danych, językami),
–
ładowanie (wprowadzanie danych do hurtowni),
–
replikacja (tworzenie kopii danych źródłowych w hurtowni danych),
–
analiza (np. wykrywanie w danych wartości nieprawidłowych lub
nieoczekiwanych),
–
szybki transfer danych (ważne w przypadku bardzo dużych hurtowni
danych),
–
kontrola jakości danych (np. z punktu widzenia kompletności i
poprawności),
–
analiza metadanych (pod kątem wykorzystania ich w projektowaniu
hurtowni danych)
Bazy danych
14
WIELOWYMIAROWE DANE Z HD
Narzędziami pozwalającymi na dostęp i wykorzystanie informacji sumarycznych
zebranych w hurtowni są programy typu OLAP.
Zwykle uzyskanie sumarycznej informacji z bazy znormalizowanej za pomocą
narzędzi OLAP wymaga wielu złożonych zapytań z wielokrotnym łączeniem i
agregacjami, co powoduje przeciążenie relacyjnej bazy danych.
Typowe operacje wykonywane przez narzędzia OLAP obejmują:
–
raportowanie i wykonywanie zapytań,
–
wykorzystanie systemów informacji geograficznej (GIS),
–
eksplorację danych (data mining), czyli wykrywanie trendów i regularności
w danych,
–
wspieranie decyzji (decision support systems, DSS),
–
dostarczanie informacji kadrze zarządzającej (executive Information
systems, EIS),
–
analizy statystyczne.
–
zwijanie (roli up, podnoszenie poziomu agregacji, czyli uogólnienia danych),
–
rozwijanie (drill down, obniżanie poziomu agregacji danych),
–
selekcja (slice) i projekcja (dice) wymiarów,
–
tablice przestawne (pivot, obracanie kostek danych).
Poza tymi podstawowymi operacjami OLAP hurtownie danych umożliwiają:
Bazy danych
15
SZBD DLA HD
Wykorzystuje się dwa rodzaje SZBD dla HD:
–
systemy superrelacyjne,
–
systemy wielowymiarowe.
Superrelacyjne systemy zarządzania bazą danych
Rozszerzenie RDBMS w kierunku współpracy z narzędziami OLAP za pomocą
tzw. funkcji superrelacyjnych (rozszerzenie formatów przechowywania danych,
operacji relacyjnych i wyspecjalizowanych schematów indeksowania).
Zmniejszenie czasu wykonywania zapytań na potrzeby OLAP zostało osiągnięte
poprzez przechowywanie danych w strukturze gwiazdy (lub płatka śniegu).
Uzyskany w ten sposób model danych może być bardzo złożony (ukryta
złożoność za pomocą specjalnych mechanizmów ukierunkowanych na zapytania
(architektura ROLAP (Relational OLAP)).
Wielowymiarowe systemy baz danych (multidimensional database
systems, MDDB)
Wspieranie sposobu, w jaki narzędzia OLAP prezentują i przetwarzają dane.
OLAP - proces, który wymaga analizy dużej ilości złożonych, powiązanych
danych - tworzenie różnych przekrojów.
MDDB przechowuje dane w postaci kostek n-wymiarowych. Każdy wymiar
reprezentuje jedną perspektywę użytkownika.
Bazy danych
16
DESKTOP OLAP, HOLAP
Segment produktów tanich, czyli desktop OLAP, skupia się na efektywnej i
wygodnej dla użytkownika analizie względnie niewielkich kostek danych
przechowywanych na komputerach klienckich. W tym przypadku MDDB jest
jedynie pośrednikiem wykorzystującym dane zgromadzone w (relacyjnej)
hurtowni danych i oferującym użytkownikowi końcowemu możliwości
analityczne.
Segment produktów drogich, obejmujących rozwiązania typu HOLAP
(hybrydowe, hybrid OLAP), zapewnia pełną integrację relacyjnej hurtowni
danych (gdzie priorytetem jest skalowalność) z modelem wielowymiarowym
(gdzie priorytetem jest efektywność zadań OLAP) w ramach jednej, złożonej
architektury.
Bazy danych
17
SPECYFICZNE ZASTOSOWANIA OLAP
Dziedziny zastosowań systemów OLAP można podzielić ze względu na
zadania biznesowe:
–
raportowanie i przetwarzanie zapytań związanych z typowymi zadaniami
związanymi
z kierowaniem przedsiębiorstwa,
–
analiza problemów i możliwości (nazywana też Business Intelligence),
–
planowanie,
–
doraźne zadania z dziedziny eksploracji danych lub projektów analitycznych.
Dwie ważne dziedziny zastosowań:
–
analizy sprzedaży i obsługi klientów;
–
aporty i analizy finansowe oraz konsolidacja.
Bazy danych
18
STRUKTURA FIZYCZNA HD
Wyróżnia się trzy podstawowe kształty architektury hurtowni danych:
–
centralizowana,
–
federacyjna,
–
warstwowa.
Rys. Architektura scentralizowana HD
W architekturze scentralizowanej wszystkie dane wykorzystywane do analiz w
przedsiębiorstwie przechowywane są w jednej hurtowni danych.
Bazy danych
19
STRUKTURA FEDERACYJNA
Architektura zdecentralizowana przynosi korzyści jedynie w przypadku
rozproszonego przetwarzania danych operacyjnych.
Rys. Architektura federacyjna HD
Istotną cechą struktury federacyjnej jest to, że globalna hurtownia danych jest tworem wirtualnym.
Bazy danych
20
STRUKTURA WARSTWOWA HD
Architektura warstwowa zakłada, że hurtownia globalna jest rzeczywistą,
fizyczną bazą danych. Hurtownię globalną uzupełniają kolejne poziomy
lokalnych tematycznych hurtowni danych, zawierających kopie danych
poprzedniej warstwy lub ich podsumowania (z pominięciem szczegółów,
obecnych np. w strukturze federacyjnej).
Rys. Architektura warstwowa HD
Struktura warstwowa może również dotyczyć źródeł danych.
Bazy danych
21
KORZYŚCI Z ROZPROSZONEJ ARCHITEKTURY HD
Korzyści z rozproszonej architektury hurtowni danych obejmują:
a) krótszy czas działania, gdyż dane są umiejscowione bliżej użytkownika
końcowego,
b) zmniejszenie przeszukiwanego obszaru danych.
Konieczność
użycia
w
architekturze
rozproszonej
wielu
systemów
komputerowych może, wbrew pozorom, obniżyć koszty całego systemu ze
względu na niższe wymagania (tylko część danych przechowywana jest w
jednym miejscu, a zapytania wykonywane są równolegle na różnych
komputerach), a więc niższe ceny sprzętu i oprogramowania.
Duże znaczenie ma skalowalność systemów przeznaczonych do obsługi hurtowni
danych. Ze względu na to, że hurtownie danych nie są systemami statycznymi i
zwykle rosną z czasem, wybrana architektura musi zapewniać łatwość
rozszerzania i przebudowywania struktury systemu.
Bazy danych
22
METADANE
Metadane odgrywają istotną rolę w budowie i działaniu hurtowni danych. Aby
efektywnie uzyskać cenne informacje z hurtowni, konieczna jest wiedza o jej
zawartości i fizycznym rozmieszczeniu danych. Oprócz informacji o położeniu
poszukiwanych przez użytkownika danych, baza metadanych może zawierać:
–
słowniki danych, zawierające definicje baz danych i relacji między
elementami danych,
–
informacje o przepływie danych, np. o kierunku i częstotliwości napływu
nowych porcji,
–
informacje o transformacji danych, wykonywanej podczas ich przenoszenia,
–
numery wersji przechowywanych metadanych, informacje o modyfikacjach,
–
statystyki użycia danych (profil danych),
–
nazwy nadane poszczególnym polom w bazie
–
uprawnienia użytkowników dotyczące dostępu do danych.
Metadane są przechowywane w wydzielonej bazie danych, do której mają dostęp
wszystkie inne składniki HD. Ze względu na powszechność dostępu do
metadanych, zachodzi potrzeba ujednolicenia ich formatu.
Organizacja
Metadata
Coalition
zaproponowała
standard
Metadata
Interchange Specification, natomiast Microsoft wprowadził program
Microsoft Repository jako składnik pakietu Office, zawierające pewne modele
używane w HD.
Bazy danych
23
ZARZĄDZANIE PROJEKTEM
Projekty obejmujące stworzenie i wdrożenie hurtowni danych mogą mieć
rozmiary od średnich do bardzo dużych i ich prowadzenie ma często zasadniczy
wpływ na funkcjonowanie firmy.
Rozkład kosztów pomiędzy poszczególne zadania projektowe i administracyjne
jest zbliżony do zaprezentowanego na rys. poniżej.
Rys. Koszty projektowania HD
Przyczyny niepowodzeń projektowania HD:
- niedostatek literatury przedmiotu;
- niedoszacowanie wymagań sprzętowych i programowych;
Problemy techniczne narastają w miarę powiększania się wielkości HD i liczby
użytkowników.
Bazy danych
24
KORZYŚCI Z WDROŻENIA HD
Gdy zrozumie się, czym różni się hurtownia danych od tradycyjnego systemu
przetwarzania operacyjnego, pytaniem staje się:
– Dlaczego poświęcać czas, pracę i pieniądze na stworzenie takiego monstrum?
– Jakie nowe wartości wniesie do organizacji przedsiębiorstwa?
Główne korzyści ze stworzenia hurtowni danych są następujące:
– Zintegrowany i całościowy obraz przedsiębiorstwa.
– Dostęp do archiwalnej informacji o przedsiębiorstwie.
– Wewnątrz przedsiębiorstwa jednoznaczne źródło informacji, które jest godne
zaufania.
– Wspomaganie podejmowania decyzji bez ingerencji w systemy przetwarzania
operacyjnego.
Bazy danych
25
ZASTOSOWANIA HURTOWNI DANYCH
Hurtownia danych musi przynosić widoczne korzyści
w działalności firmy !!!
Najbardziej oczywiste korzyści dają zastosowania, które maksymalizują
dochodowość firmy w sposób umożliwiający jej zmierzenie i odniesienie
bezpośrednio do wyników finansowych firmy.
Hurtownie danych dostarczają informacji mających istotny wpływ na
działalność przedsiębiorstwa. Często modele biznesowe i strategie
opracowane dla hurtowni danych stają się częścią systemów
produkcyjnych.
Dobrze zaprojektowana hurtownia danych umożliwia więcej niż jedno jej
zastosowanie, tak więc zwrot nakładów nie ogranicza się do jednego
obszaru.
Bazy danych
26
WYKRYWANIE OSZUSTW
Pomysł polega na opracowaniu (na podstawie możliwości hurtowni)
algorytmu wykrywania oszustw, a następnie wykorzystania go w
systemach operacyjnych.
Wykorzystując dane archiwalne z hurtowni tworzy się modele do
przewidywania schematów oszustw, tak aby można je było wykryć przed
wystąpieniem wielkich strat z ich powodu.
Przykład:
Dokonywanie zakupów z wykorzystaniem kart kredytowych.
Posiadacze kart wykazują powtarzające się wzorce zachowań w tym, co kupują,
gdzie, kiedy i ile wydają.
Łatwo jest wykryć oszustwo, przyglądając się nieregularnościom w przyjętych
wzorcach zachowań (duże zakupy w krótkim czasie, inne miejsca zakupów, itp.)
Informacje z hurtowni danych wykorzystywane są w celu scharakteryzowania
wzorców oszustw i wzorców legalnego wykorzystania karty, a następnie
dostarczenie
odpowiednich
algorytmów
(oraz
kluczowych
zmiennych
archiwalnych) do systemów operacyjnych, aby zapobiegać oszustwom w czasie
rzeczywistym lub półrzeczywistym.
Bazy danych
27
UKIERUNKOWANY MARKETING
Hurtownia danych pozwala na indywidualizację rynku, w przeciwieństwie
do stosowanych strategii masowych.
Wykonanie skomplikowanych analiz informacji przechowywanej w
hurtowni danych umożliwia handlowcom ukierunkowanie sprzedaży na
wybrane grupy klientów, a nawet zindywidualizowaną sprzedaż.
Uzyskuje się informacje na temat demografii klientów, zachowań,
zapotrzebowań na produkt. Grupuje się klientów o podobnych cechach i
zachowaniu i dostosowuje się metody kontaktu z nimi.
Im więcej informacji z hurtowni danych będzie osiągalnych (z szerokiej
populacji klientów) oraz im lepsze zostaną zastosowane metody ich
efektywnego wykorzystania, tym stopień indywidualizacji marketingu
będzie wzrastał.
Gdy marketing jest ukierunkowany na pojedynczego osobnika,
prawdopodobieństwo pozytywnej reakcji wzrasta znacząco.
Bazy danych
28
ANALIZA RENTOWNOŚCI
Wykorzystanie hurtowni danych do określenia rentowności swojej firmy,
wskazania klientów dochodowych i niedochodowych.
Wykorzystując modele kosztów oparte na aktywności klientów i
szczegółowe informacje o ich dochodach, można ocenić dochodowość
każdego klienta.
Często bywa tak, że znaczny procent zysków firmy pochodzi od
niewielkiego procenta klientów (np. zasada 80/20).
Korzyściami stosowania hurtowni danych w tym przypadku jest
zidentyfikowanie mało rentownych klientów i opracowanie programów
umożliwiających przesunięcie ich do kategorii bardziej dochodowej.
Takie programy mogą polegać na:
zmianie cen i restrukturyzacji pewnych ofert
wykorzystaniu programów edukacyjnych do wpływania na zachowanie
klientów
wprowadzeniu nowych produktów i usług ukierunkowanych na
niedochodowych
klientów
ucieczce od niedochodowych klientów w celu poprawienia jakości
usług
dla
klientów dochodowych
Bazy danych
29
ZATRZYMYWANIE KLIENTÓW
Zatrzymanie istniejących klientów jest mniej kosztowne od zdobywania
nowych lub odzyskiwania klientów zabranych przez konkurencję.
Wykorzystując hurtownię danych, analitycy mogą opracować modele
oceny ryzyka, pozwalające na zidentyfikowanie klientów, którzy mogą
odejść zanim to się stanie.
Klienci wysyłają sygnały o swoich zamiarach na długo przed ich
spełnieniem – często zanim staną się tego świadomi.
Pytaniem dla usługodawcy jest, czy zbiera odpowiednie dane i czy
można je zinterpretować, tak aby były przydatne w programie
zatrzymywania klienta.
Modele oceny ryzyka mogą przewidywać dostatecznie wcześnie, co może
się zdarzyć w przyszłości, żeby temu zapobiec.
Program zatrzymywania klienta może polegać na specjalnych
promocjach, telefonach, listach z wyrazami uznania lub też na akcji
marketingowej mającej na celu uświadomienie i przypomnienie zalet
oferty firmy.
Bazy danych
30
ZARZĄDZANIE ZAPASAMI
Dobry handel polega na posiadaniu właściwych towarów we właściwym
miejscu, czasie i po właściwej cenie.
Kluczową sprawą dla efektywnego zarządzania zapasami jest dostęp do
informacji o wzorcach popytu i zachowaniu się dostawców, jak i
podstawowe informacje dotyczące marginesów zysku i wymagań na
powierzchnię magazynową.
Hurtownia danych wykorzystywana w zarządzaniu zapasami potrzebuje
danych historycznych z co najmniej 15 do 27 miesięcy, aby można było
określić długofalowe tendencje w sprzedaży dla poszczególnych
produktów i dla sklepu.
Zrozumienie wpływu sezonowości i możliwość odniesienia nowych
produktów do porównywalnych z przeszłości pozwala na całkiem
dokładne przewidywanie przyszłego popytu.
Dobry sprzedawca wykorzystuje różne analizy dla każdego sklepu
oddzielnie i ustala ofertę i jej wielkość dla lokalnych rynków.
Bazy danych
31
ANALIZA RYZYKA KREDYTOWEGO
Wraz z nasyceniem się rynku analiza ryzyka kredytowego staje się coraz
bardziej skomplikowana.
W celu dokładnego określenia ryzyka związanego z udzieleniem kredytu
każda większa firma kredytowa opracowuje modele ilościowe, oparte na
danych z przeszłości, umożliwiające przewidywanie zachowania się
osobników podczas spłacania kredytu.
Dokładniejsze modele opierają się na lepszej analityce i lepszym
dostępie do informacji o klientach występujących o kredyty.
Ocena ryzyka kredytowego może być szczególnie efektywna, gdy
standardowe dane biurowe uzupełnimy danymi pochodzącymi z
wewnętrznej hurtowni danych.
Przez zastosowanie poufnej wiedzy o zachowaniu klientów, pochodzącej z
wewnętrznych źródeł, możliwe jest opracowanie modeli przewyższających
dokładnością
oceny
oparte
na
informacjach
pozyskiwanych
z
zewnętrznych źródeł.
Zbieranie i utrzymywanie informacji z wielu systemów źródłowych w
hurtowni danych jest warunkiem powodzenia takiej strategii.
Bazy danych
32
DŁUGOTERMINOWA OCENA WARTOŚCI KLIENTA
Poznanie wartości związków z klientem, to coś znacznie więcej niż ocena
jego np. zeszłorocznej rentowności.
Mało dochodowy klient może stać się bardzo dochodowym lub
odwrotnie. Sztuką jest ocenienie który scenariusz jest bardziej
prawdopodobny.
Modele predykcyjne stosowane do oceny klienta są oparte na informacji
z hurtowni danych o zachowaniu się klienta, cechach psychologicznych,
demograficznych, itp.
Zachowanie klienta śledzi się w hurtowni danych poprzez takie
wydarzenia, jak zakupy, ankiety i inne kontakty z firmą.
Informacje o kliencie uzupełnia się również danymi pochodzącymi ze
źródeł zewnętrznych (skłonności do robienia zakupów, profile ryzyka,
itp.)
.
Hurtownia danych umożliwia zarówno ocenianie prognostyczne, jak i
dostarczanie informacji dla potrzeb marketingowych i do systemów
operacyjnych,
które
ułatwiają
zatrzymanie
potencjalnych
długoterminowych klientów.
Bazy danych
33
USTALANIE CENY
Ustalanie konkurencyjnej ceny zawiera w sobie rozpoznawanie popytu na
produkt, konkurencyjność rynku i granic rentowności.
Wszystkie te dane mogą pochodzić z hurtowni danych.
Popyt na produkt można określić na podstawie danych z przeszłości, z
uwzględnieniem warunków rynkowych i sezonowości. Ustalanie
konkurencyjnej ceny polega także na zbadaniu cen produktów
zastępczych i alternatywnych wyborów dokonywanych przez klientów.
W decyzjach dotyczących cen należy również brać pod uwagę granice
rentowności. Na podstawie informacji z hurtowni danych, często buduje
się skomplikowane modele pozwalające ustalić strukturę cen w taki
sposób, żeby zmaksymalizować dochody.
Bazy danych
34
LITERATURA
1. V. Poe, P. Klauer, S. Brobst – Tworzenie hurtowni
danych, WNT.
2. M. Jarke, M. Lenzerini, Y. Vassiliou, P. Vassiliadis,
Hurtownie danych, WSiP.
Bazy danych
35
KONIEC