2. ZARYS
BUDOWY
HURTOWNI
DANYCH
1. Cele i etapy budowy
2. Charakterystyka etapu
projektowania
3. Przykłady projektów
Hurtownia
Hurtownia
danych (HD)
danych (HD)
Przetwarzanie analityczne BD
i hurtownie danych
(zagadnienia)
• Porównanie przetwarzania
transakcyjnego i analitycznego
• Wielowymiarowość w przetwarzaniu
analitycznym
• Przegląd narzędzi wspomagających
przetwarzanie analityczne
• Przykłady zastosowań analiz
wielowymiarowych
• Koncepcje hurtowni danych
• Architektura i właściwości hurtowni
danych
1. Cele i etapy budowy
Cele HD (korzyści):
• dostarczanie rzetelnych danych
analitycznych
• wysoka produktywność rozwiązań
• wzrost konkurencyjności firmy
Hurtownia
Hurtownia
danych
danych
Uzyskane poprzez:
• kompleksowy i zintegrowany
obraz firmy
• dostęp do informacji
historycznych
• ujednolicone dane dotyczące firmy
• wyodrębnienie przetwarzania
analitycznego z przetwarzania
transakcyjnego
Dane
źródłowe
AB
C
Meta
dane
Dane
szczegół
owe
HD
Dane
podsumo
wane
Dane
global
ne
Kopie
danyc
h
Użytkownik
Narzędz
ia HD
WEJSCI
E
WYJSCIE
ZRZUT
AG
RE
GA
CJ
E
1. Cele i etapy budowy
1. Cele i etapy budowy
Typowe obszary zastosowań HD:
• „sterowany” marketing
• długoterminowa ocena wartości
klienta
• analiza rentowności
• analiza ryzyka kredytowego
• zarządzanie zapasami
• ustalanie ceny
Hurtownia
Hurtownia
danych
danych
Etapy budowy
(
Oracle Warehouse Builder
):
• Definiowanie
• Generowanie
• Ładowanie i administrowanie
• Raportowanie
1. Cele i etapy budowy
Hurtownia
Hurtownia
danych
danych
Cykl życia SIZ:
• identyfikacja i
analiza
• modelowanie
• projektowanie
• implementacja
• rozwój
Etapy budowy
(~PoeKlauerBrobst):
• Planowanie
• Zbieranie wymagań i modelowanie
• Projektowanie
• Zasilanie HD
• Automatyzowanie procesu zarządzania
danymi
• Generowanie raportów
• Testowanie i szkolenie
• Uruchomienie i rozwój
1. Cele i etapy budowy
Hurtownia
Hurtownia
danych
danych
Cykl życia SIZ:
• identyfikacja i
analiza
• modelowanie
• projektowanie
• implementacja
• rozwój
Specyfika planowania HD:
• definiowanie celu i zakresu
• określenie harmonogramu i
niezbędnych zasobów:
– strategie dot. składowych
HD
– platformy sprzętowo-
programowe
– technologie sieci
1. Cele i etapy budowy
Hurtownia
Hurtownia
danych
danych
PLAN
Specyfika modelowania
HD:
• identyfikacja wymagań
użytkowników (dane,
funkcje, poziom
agregacji)
• opracowanie
wielowymiarowego
modelu firmy
Hurtownia
Hurtownia
danych
danych
MODEL
1. Cele i etapy budowy
FAKTY
Sprzedaż
Zapasy
Koszty
...
Lokalizacja
Kanał
dystrybucyjny
Produkt
Czas
Przykład wielowymiarowego modelu
1. Cele i etapy budowy
Firma
Przykład hierarchii w wymiarze produktu
Dział
Klasa
Pozycja
Poziom
Specyfika projektowania
HD:
• opracowanie
schematów BD (obiekty,
klucze, indeksowanie)
• opracowanie strategii
gromadzenia i podziału
danych
1. Cele i etapy budowy
Hurtownia
Hurtownia
danych
danych
PROJEKT
Specyfika zasilania HD:
• zdefiniowanie źródeł
danych (formaty,
integracja)
• określenie zasad
konwersji
• opracowanie programów
zapełniających HD
Hurtownia
Hurtownia
danych
danych
WEJŚCIE
1. Cele i etapy budowy
Hurtownia
Hurtownia
danych
danych
Dane
Informacja
Transformacja
danych
Integracja
danych
(konsolidacja,
konwersja,
przenoszenie)
Specyfika ABD:
• tworzenie procedur
archiwizowania i
odzyskiwania
• automatyzacja
konwersji
1. Cele i etapy budowy
Hurtownia
Hurtownia
danych
danych
ABD
Specyfika generowania
raportów:
• opracowanie zasad
dostępu
• definiowanie raportów
Hurtownia
Hurtownia
danych
danych
WYJŚCIE
Specyfika uruchamiania HD:
• tworzenie struktur
pomocy użytkownikom
• opracowanie procedur
obsługujących integralność
danych
• definiowanie procedur
rozbudowy aplikacji i
zarządzania danymi
1. Cele i etapy budowy
Hurtownia
Hurtownia
danych
danych
START
2. Charakterystyka etapu
projektowania
Właściwości HD istotne przy
projektowaniu:
• klarowność struktur danych
• stabilność danych
• złożone zapytania SQL
• duże wolumeny danych WE i
informacji WY
• konieczność zapewnienia
bezpieczeństwa danych
Hurtownia
Hurtownia
danych
danych
Stosowanie schematu gwiaździstego (zalety):
• prosta struktura BD
• szybki czas reakcji
• opracowane narzędzia dostępu
• analogie do zastosowań użytkowników
•Sprzedawca
analizuje
przychody pod
kątem: klienta,
produktu, rynku i
czasu
•Marketing bada
dostawy pod
kątem: towaru,
rynku i czasu
2. Charakterystyka etapu
projektowania
Reprezentowanie danych w prostym
schemacie gwiaździstym:
• tabele zawierające fakty (TF)
• tabele wymiarów (TW)
Pole1
Pole2
Pole3
Pole4
Pole5
Pole6
...
TF
Pole1
Pole12
Pole13
Pole14
Pole15
Pole16
...
TW1
Pole2
Pole22
Pole23
Pole24
...
TW2
Pole3
Pole32
Pole33
Pole34
...
TW3
2. Charakterystyka etapu
projektowania
Przykład BD o prostym schemacie
gwiaździstym
Id rynku
Id okresu
Id
produktu
Jednostka
m.
Wielkość
sprzedaży
Wartość
sprzedaż
% obniżki
Sprzedaż
Rynki
Id rynku
Opis
rynku
Obszar
Region
Okresy
Id okresu
Opis
okresu
Kwartał
Rok
Produkty
Id
produktu
Opis
prod.
Klasa
Rozmiar
2. Charakterystyka etapu
projektowania
BD o schemacie gwiaździstym z
wielokrotną tabelą faktów
Id rynku
Id okresu
Id
produktu
Jednostka
m.
Wielkość
sprzedaży
Wartość
sprzedaż
% obniżki
Sprzedaż
Id rynku
Opis
rynku
Obszar
Region
Rynki
Id okresu
Opis
okresu
Kwartał
Rok
Okresy
Id
produktu
Opis
prod.
Klasa
Rozmiar
Produkty
Id rynku
Id okresu
Id
produktu
Jednostka
m.
Wielkość
sprzedaży
Wartość
sprzedaż
% obniżki
Sprzedaż 1
Id rynku
Id okresu
Id
produktu
Jednostka
m.
Wielkość
sprzedaży
Wartość
sprzedaż
% obniżki
Sprzedaż 2
2. Charakterystyka etapu
projektowania
BD o schemacie gwiaździstym z tabelą
asocjacyjną
Id rynku
Id okresu
Id
produktu
Jednostka
m.
Wielkość
sprzedaży
Wartość
sprzedaż
% obniżki
Sprzedaż
Id rynku
Opis
rynku
Obszar
Region
Rynki
Id okresu
Opis
okresu
Kwartał
Rok
Okresy
Id
produktu
Opis
prod.
Klasa
Rozmiar
Produkty
Id klasy
Opis
klasy
Klasa
Id
produktu
Id klasy
Klasa produktu
2. Charakterystyka etapu
projektowania
BD o schemacie gwiaździstym z tabelami zewnętrznymi
Id rynku
Id okresu
Id
produktu
Jednostka m.
Wielkość
sprzedaży
Wartość
sprzedaż
% obniżki
Sprzedaż
Id rynku
Opis
rynku
Id
obszaru
Id
regionu
Rynki
Id okresu
Opis okresu
Kwartał
Rok
Okresy
Id
produktu
Opis
prod.
Klasa
Rozmiar
Produkty
Id
obszaru
Opis
obszaru
Obszary
Id
regionu
Opis
regionu
Regiony
2. Charakterystyka etapu
projektowania
BD o schemacie gwiaździstym typu płatek śniegu
Sprzedaż
Obszary
Regiony
Okresy
Produkty
Kwartały
Lata
Klasy
Marki
Rynki
2. Charakterystyka etapu
projektowania
BD o schemacie wielogwiaździstym
Pozycja mag.
Sklepy
Oddział
Grupa
Transakcje
2. Charakterystyka etapu
projektowania
Wskazówki dotyczące projektowania HD:
• identyfikacja tabeli wymiarów jako
kryteriów formułowanych
• budowa hierarchii atrybutów ułatwia
"drążenie" i "zwijanie" danych
• wprowadzanie tabel "agregatów" dla
częstych uogólnień
• stosowanie umiarkowanej "denormalizacji"
poprawiającej wydajność przetwarzania
• ograniczoność schematów gwiaździstych
Data pocz.
Id usługi
Id promocji
Data końc.
3. Przykłady projektów -
Rezerwacja
Id usługi
Hotel
Liczba
pokoi
Miasto
Region
Typ
Usługi
Id pokoju
Typ łóżka
Status P/N
Opis pokoju
Wskaźnik
dod
Pokoje
Id promocji
Nazwa
Typ
Opis
Typy
promocji
Id kontroli
Id usługi
Kod klienta
Id pokoju
Potwierdzen
ie
Id promocji
Data
przybycia
Liczba nocl.
...
Stany
Data
wyjazdu
Id usługi
Kod klienta
Id pokoju
Potwierdzen
ie
Id promocji
Data
przybycia
Kod
przybycia
Liczba nocl.
Rezerwacje
Harmonogram
promocji
Id klienta
Nazwisko
Adres
Miasto
Typ klienta
Punkty
Klienci
Id okresu
Nazwisko
Adres
Miasto
Typ klienta
Punkty
Okresy
Id
okresu
Id działu
Id sklepu
Jednostki
Wartość
Zapasy
Koszty
3. Przykłady projektów– Sprzedaż
detaliczna
Id produktu
Opis
produktu
Rozmiar
Kolor
Kod klasy
Opis klasy
Dział
Oddział
Produkty
Id oddziału
Opis
oddziału
Id działu
Oddziały
Id działu
Opis działu
Działy
Id okresu
Id
produktu
Id sklepu
Jednostki
Wartość
Zapasy
Koszty
Stany
Id okresu
Tydzień
Miesiąc
Kwartał
Rok
Okresy
Id okresu
Id
oddziału
Id sklepu
Jednostki
Wartość
Zapasy
Koszty
Id
okresu
Id działu
Id sklepu
Jednostki
Wartość
Zapasy
Koszty
Id sklepu
Opis
sklepu
Kierownik
Wielkość
Id regionu
Sklepy
Id regionu
Opis
regionu
Id obszaru
Opis
obszaru
Regiony
3. Przykłady projektów – Koszty
(Oracle)
3. Przykłady projektów – Sprzedaż
(Oracle)