2. HD - Architektura i
2. HD - Architektura i
infrastruktury hurtowni
infrastruktury hurtowni
danych
danych
dr inż. Jerzy Stanik
dr inż. Jerzy Stanik
2.1. Ogólna
2.1. Ogólna
architektura hurtowni
architektura hurtowni
danych
danych
Pierwszym krokiem w wyjaśnieniu
Pierwszym krokiem w wyjaśnieniu
niejednoznaczności związanych z
niejednoznaczności związanych z
hurtownią danych jest zrozumienie jej
hurtownią danych jest zrozumienie jej
architektury.
architektury.
Architektura jest zbiorem zasad i struktur
Architektura jest zbiorem zasad i struktur
będącym szkieletem ogólnego projektu
będącym szkieletem ogólnego projektu
systemu czy hurtowni.
systemu czy hurtowni.
Wyróżniamy architektury:
Wyróżniamy architektury:
Sieciowe,
Sieciowe,
Klient serwer,
Klient serwer,
Architektury dla konkretnych obszarów
Architektury dla konkretnych obszarów
tematycznych,
tematycznych,
Architektury danych, funkcji, procesów,
Architektury danych, funkcji, procesów,
itp.
itp.
Architekturę danych, funkcji i procesów
Architekturę danych, funkcji i procesów
definiujemy poprzez rozpoznanie i
definiujemy poprzez rozpoznanie i
zrozumienie, w jaki sposób będą
zrozumienie, w jaki sposób będą
wykorzystywane te elementy wewnątrz
wykorzystywane te elementy wewnątrz
przedsiębiorstwa. W architekturze
przedsiębiorstwa. W architekturze
hurtowni danych podstawowym
hurtowni danych podstawowym
składnikiem jest baza danych używana
składnikiem jest baza danych używana
do wspomagania decyzji.
do wspomagania decyzji.
Architektura jest, więc szkieletem
Architektura jest, więc szkieletem
stworzonym z zasad i struktur (danych,
stworzonym z zasad i struktur (danych,
funkcji i procesów), na którym zostanie
funkcji i procesów), na którym zostanie
zbudowany system hurtowni danych.
zbudowany system hurtowni danych.
Architektura dla hurtowni danych ma
Architektura dla hurtowni danych ma
swoje własne cechy, które odróżniają ją
swoje własne cechy, które odróżniają ją
od innych systemów informatycznych.
od innych systemów informatycznych.
Podstawowa architektura hurtowni
Podstawowa architektura hurtowni
danych jest następująca.
danych jest następująca.
Ogólna architektura
Ogólna architektura
hurtowni danych
hurtowni danych
Ogólna architektura hurtowni
danych
Źródło
Źródło
Źródło
Źródło
Ekstrakcja
Transformacja
Ładowanie
Hurtownia
danych
przedsiębiorstwa
Użytkownik Użytkownik
Użytkownik
Przekształcanie danych
Środowi
sko
dostępu
do
danych
Cechy właściwe dla hurtowni danych są
Cechy właściwe dla hurtowni danych są
następujące:
następujące:
Dane są wydzielane z systemów
Dane są wydzielane z systemów
źródłowych, baz danych, plików, itp.,
źródłowych, baz danych, plików, itp.,
Dane z systemów źródłowych są
Dane z systemów źródłowych są
integrowane przed ich
integrowane przed ich
wprowadzeniem do hurtowni danych,
wprowadzeniem do hurtowni danych,
Hurtownia danych jest oddzielną, stałą
Hurtownia danych jest oddzielną, stałą
bazą danych zaprojektowaną
bazą danych zaprojektowaną
specjalnie do wspomagania
specjalnie do wspomagania
podejmowania decyzji,
podejmowania decyzji,
Użytkownicy mają dostęp do hurtowni
Użytkownicy mają dostęp do hurtowni
danych za pomocą „wysuniętych”
danych za pomocą „wysuniętych”
narzędzi i aplikacji.
narzędzi i aplikacji.
Ogólna architektura hurtowni
danych
Dane są wydzielane z
Dane są wydzielane z
systemów źródłowych, baz
systemów źródłowych, baz
danych, plików
danych, plików
Systemy działające w firmie są
Systemy działające w firmie są
dominującym źródłem informacji do
dominującym źródłem informacji do
hurtowni danych. Podstawowe dane
hurtowni danych. Podstawowe dane
(pola danych) potrzebne dla procesów
(pola danych) potrzebne dla procesów
wspomagania podejmowania decyzji
wspomagania podejmowania decyzji
zostaną wydzielone właśnie z tych
zostaną wydzielone właśnie z tych
systemów. Czasami nawet całe tabele
systemów. Czasami nawet całe tabele
lub pliki będą wydzielane, jeśli wszystkie
lub pliki będą wydzielane, jeśli wszystkie
w nich pola są potrzebne do
w nich pola są potrzebne do
przetwarzania wspomagającego
przetwarzania wspomagającego
podejmowanie decyzji. Pola źródłowe
podejmowanie decyzji. Pola źródłowe
mogą pochodzić z różnych baz danych,
mogą pochodzić z różnych baz danych,
różnych platform i zawierać dane
różnych platform i zawierać dane
różnych struktur, typów i formatu.
różnych struktur, typów i formatu.
Dane z systemów źródłowych są
Dane z systemów źródłowych są
integrowane przed ich
integrowane przed ich
wprowadzeniem do hurtowni
wprowadzeniem do hurtowni
danych
danych
Istotnym składnikiem architektury
Istotnym składnikiem architektury
hurtowni danych jest
hurtowni danych jest
integrowanie danych z wielu
integrowanie danych z wielu
źródeł przed ich wprowadzeniem
źródeł przed ich wprowadzeniem
do hurtowni danych. Jest to
do hurtowni danych. Jest to
bardzo ważna i często nie
bardzo ważna i często nie
doceniana cecha hurtowni. Jeśli
doceniana cecha hurtowni. Jeśli
dane pochodzą z wielu systemów
dane pochodzą z wielu systemów
informacyjnych, baz danych
informacyjnych, baz danych
systemów informatycznych oraz
systemów informatycznych oraz
platform i technologii, to pewne
platform i technologii, to pewne
formy integracji są niezbędne i
formy integracji są niezbędne i
konieczne.
konieczne.
Hurtownia danych jest oddzielną, stałą
Hurtownia danych jest oddzielną, stałą
bazą danych zaprojektowaną specjalnie do
bazą danych zaprojektowaną specjalnie do
wspomagania podejmowania decyzji
wspomagania podejmowania decyzji
Nieodłącznym dla architektury hurtowni danych
Nieodłącznym dla architektury hurtowni danych
jest, aby przetwarzanie operacyjne i
jest, aby przetwarzanie operacyjne i
wspomaganie podejmowania decyzji były
wspomaganie podejmowania decyzji były
rozłączne. Wynikiem przetwarzania
rozłączne. Wynikiem przetwarzania
wspomagającego podejmowanie decyzji są,
wspomagającego podejmowanie decyzji są,
podane w sposób przystępny, analityczne
podane w sposób przystępny, analityczne
informacje wykorzystywane w procesach
informacje wykorzystywane w procesach
podejmowania taktycznych i strategicznych
podejmowania taktycznych i strategicznych
decyzji. Procesy te często wymagają danych
decyzji. Procesy te często wymagają danych
historycznych (archiwalnych), które są
historycznych (archiwalnych), które są
wykorzystywane do analiz porównawczych i
wykorzystywane do analiz porównawczych i
pozwalają na śledzenie trendów i wzorców
pozwalają na śledzenie trendów i wzorców
informacji w czasie. Jedna baza danych nie
informacji w czasie. Jedna baza danych nie
może wydajnie służyć systemom przetwarzania
może wydajnie służyć systemom przetwarzania
danych operacyjnych i systemowi
danych operacyjnych i systemowi
wspomagania podejmowania decyzji. Dlatego
wspomagania podejmowania decyzji. Dlatego
oddzielna, stała baza danych jest podstawową
oddzielna, stała baza danych jest podstawową
składową architektury hurtowni danych.
składową architektury hurtowni danych.
Użytkownicy mają dostęp do
Użytkownicy mają dostęp do
hurtowni danych za pomocą
hurtowni danych za pomocą
„wysuniętych” narzędzi i aplikacji
„wysuniętych” narzędzi i aplikacji
W systemie hurtowni danych środowisko
W systemie hurtowni danych środowisko
dostępu do danych tworzy jeszcze
dostępu do danych tworzy jeszcze
jedną warstwę architektury hurtowni
jedną warstwę architektury hurtowni
danych.
danych.
Do tego środowiska zalicza się
Do tego środowiska zalicza się
„wysunięte” narzędzia, aplikacje,
„wysunięte” narzędzia, aplikacje,
szkolenie i pomoc niezbędne do
szkolenie i pomoc niezbędne do
uzyskiwania użytecznych i dostępnych
uzyskiwania użytecznych i dostępnych
informacji z hurtowni wspomagającej
informacji z hurtowni wspomagającej
podejmowanie decyzji
podejmowanie decyzji
Architektura hurtowni danych zawsze
Architektura hurtowni danych zawsze
zawiera środowisko dostępu da danych
zawiera środowisko dostępu da danych
wspomagający podejmowanie decyzji.
wspomagający podejmowanie decyzji.
2.2. Możliwe warianty, rozszerzenia
2.2. Możliwe warianty, rozszerzenia
ogólnej architektury hurtowni
ogólnej architektury hurtowni
danych jako propozycje rozwiązań
danych jako propozycje rozwiązań
dla UDT
dla UDT
Warianty architektur
Warianty architektur
Niezwykle ważne jest zrozumienie, że
Niezwykle ważne jest zrozumienie, że
składniki ogólnej architektury mogą
składniki ogólnej architektury mogą
być implementowane na różne
być implementowane na różne
sposoby, zorientowane na:
sposoby, zorientowane na:
proces integracji danych źródłowych
proces integracji danych źródłowych
w jedną standardową bazę danych,
w jedną standardową bazę danych,
obszary działalności przedsiębiorstwa,
obszary działalności przedsiębiorstwa,
aktualną strukturę organizacyjną.
aktualną strukturę organizacyjną.
W dalszej części wykładu zostały
W dalszej części wykładu zostały
przedstawione trzy warianty
przedstawione trzy warianty
architektur zorientowanych na
architektur zorientowanych na
powyższe zagadnienia.
powyższe zagadnienia.
Wariant 1. Zintegrowana baza danych
przekazująca dane hurtowni danych
Źródło
Źródło
Źródło
Źródło
Ekstrakcja
Transformacja
Ładowanie
Zintegrowana
baza
danych
Użytkownik
Użytkownik
Użytkownik
Hurtownia
danych
przedsiębiorstwa
Aktualizacje
Jest to dość skomplikowana architektura, w której
Jest to dość skomplikowana architektura, w której
dane są wydzielane z systemów źródłowych,
dane są wydzielane z systemów źródłowych,
podlegają integracji, a następnie są wprowadzane
podlegają integracji, a następnie są wprowadzane
do zintegrowanej bazy danych, która z reguły jest
do zintegrowanej bazy danych, która z reguły jest
w trzeciej postaci normalnej (bez redundancji
w trzeciej postaci normalnej (bez redundancji
danych). Taką postać bazy danych można uzyskać,
danych). Taką postać bazy danych można uzyskać,
gdy źródła danych są zrealizowane jako systemy
gdy źródła danych są zrealizowane jako systemy
informatyczne, wykorzystujące relacyjne bazy
informatyczne, wykorzystujące relacyjne bazy
danych. Informacje, które są wprowadzane do
danych. Informacje, które są wprowadzane do
zintegrowanej bazy danych, są niezmienialne.
zintegrowanej bazy danych, są niezmienialne.
Jednak inne dane źródłowe są dodawane do
Jednak inne dane źródłowe są dodawane do
zintegrowanej bazy danych poprzez aplikację
zintegrowanej bazy danych poprzez aplikację
umożliwiającą modyfikację nazw w celu uzyskania
umożliwiającą modyfikację nazw w celu uzyskania
określonego nazewnictwa lub przyjętego
określonego nazewnictwa lub przyjętego
standardu.
standardu.
Dlaczego firma chciałby używać takiej architektury?.
Dlaczego firma chciałby używać takiej architektury?.
To rozwiązanie umożliwia wykorzystywać
To rozwiązanie umożliwia wykorzystywać
zintegrowane dane do podejmowania
zintegrowane dane do podejmowania
codziennych decyzji
codziennych decyzji
związanych z jego
związanych z jego
działalnością.
działalnością.
Wariant 1. Zintegrowana baza
danych przekazująca dane hurtowni
danych
Zalety rozwiązania:
Zalety rozwiązania:
wspomaganie podejmowania decyzji operacyjnych
wspomaganie podejmowania decyzji operacyjnych
(codziennych), taktycznych i strategicznych,
(codziennych), taktycznych i strategicznych,
możliwość zasilania hurtowni danych informacjami o bardzo
możliwość zasilania hurtowni danych informacjami o bardzo
dużej jakości, ponieważ dane przeszły proces porządkowania i
dużej jakości, ponieważ dane przeszły proces porządkowania i
integracji, podczas tworzenia Zintegrowanej Bazy Danych UDT,
integracji, podczas tworzenia Zintegrowanej Bazy Danych UDT,
docieranie do informacji za pomocą niewielkiej liczby aplikacji i
docieranie do informacji za pomocą niewielkiej liczby aplikacji i
dość w krótkim czasie,
dość w krótkim czasie,
możliwość szybkiego skonstruowania systemu informowania
możliwość szybkiego skonstruowania systemu informowania
kierownictwa (SIK) oraz dedykowanego systemu
kierownictwa (SIK) oraz dedykowanego systemu
raportowania, również w zakresie codziennych czynności -
raportowania, również w zakresie codziennych czynności -
zadań, wykonywanych przez poszczególnych pracowników
zadań, wykonywanych przez poszczególnych pracowników
organizacji,
organizacji,
łatwość porządkowania i dodawania nowych pól do bazy
łatwość porządkowania i dodawania nowych pól do bazy
danych poprzez wykorzystanie aplikacji umożliwiającej
danych poprzez wykorzystanie aplikacji umożliwiającej
aktualizację i modyfikację danych, zawartych w zintegrowanej
aktualizację i modyfikację danych, zawartych w zintegrowanej
bazie danych
bazie danych
Wady rozwiązania:
Wady rozwiązania:
niekonwencjonalna architektura,
niekonwencjonalna architektura,
podwyższone koszty rozwiązania w zakresie infrastruktury,
podwyższone koszty rozwiązania w zakresie infrastruktury,
podwyższone koszty pielęgnacji i zarządzania konfiguracją.
podwyższone koszty pielęgnacji i zarządzania konfiguracją.
Wariant 1. Zintegrowana baza
danych przekazująca dane hurtowni
danych
- Zalety i wady
Wariant 2: Wydziałowe
Wariant 2: Wydziałowe
hurtownie danych
hurtownie danych
Podstawowym założeniem tego rozwiązania jest
Podstawowym założeniem tego rozwiązania jest
istnienie hurtowni danych dla całego
istnienie hurtowni danych dla całego
przedsiębiorstwa oraz hurtowni danych
przedsiębiorstwa oraz hurtowni danych
związanych z różnymi obszarami działalności
związanych z różnymi obszarami działalności
organizacji.
organizacji.
Jakie argumenty mogłyby przemawiać za takim
Jakie argumenty mogłyby przemawiać za takim
rozwiązaniem architektury dla firmy:
rozwiązaniem architektury dla firmy:
spełnienie strategicznego, początkowego
spełnienie strategicznego, początkowego
wymogu, by wszystkie bazy danych używały
wymogu, by wszystkie bazy danych używały
modelu danych organizacji jako podstawowego,
modelu danych organizacji jako podstawowego,
oddzielenie procesów integracji danych od
oddzielenie procesów integracji danych od
procesów projektowania baz danych i
procesów projektowania baz danych i
denormalizacji,
denormalizacji,
korzystanie z hurtowni danych firmy jako z
korzystanie z hurtowni danych firmy jako z
jednolitego źródła dla wszystkich odwzorowań
jednolitego źródła dla wszystkich odwzorowań
danych źródłowych
danych źródłowych
Wariant 2: Wydziałowe hurtownie danych
Wariant 2: Wydziałowe hurtownie danych
Źródło
Źródło
Źródło
Źródło
Ekstrakcja
Transformacja
Ładowanie
Hurtownia
danych
przedsiębiorstwa
Hurtownia
wydziałowa
Hurtownia
wydziałowa
Użytkownik UżytkownikUżytkownik
Przekształcanie danych
Środowis
ko
dostępu
do
danych
Zalety rozwiązania:
Zalety rozwiązania:
Elastyczność rozwiązania w zakresie
Elastyczność rozwiązania w zakresie
skalowalności (poziomej i pionowej)
skalowalności (poziomej i pionowej)
architektury, poprzez dokładanie lub
architektury, poprzez dokładanie lub
zamykanie poszczególnych hurtowni
zamykanie poszczególnych hurtowni
wydziałowych,
wydziałowych,
Jednolite źródło.tych samych danych dla
Jednolite źródło.tych samych danych dla
poszczególnych obszarów działalności UDT,
poszczególnych obszarów działalności UDT,
Zachowanie konwencjonalnej architektury.
Zachowanie konwencjonalnej architektury.
Wady rozwiązania
Wady rozwiązania
wysokie koszty rozwiązania w zakresie
wysokie koszty rozwiązania w zakresie
infrastruktury,
infrastruktury,
duże koszty pielęgnacji i zarządzania
duże koszty pielęgnacji i zarządzania
konfiguracją.
konfiguracją.
Wariant 2: Wydziałowe
Wariant 2: Wydziałowe
hurtownie danych
hurtownie danych
Wariant 3: Tematyczna
Wariant 3: Tematyczna
hurtownia danych
hurtownia danych
Jest to architektura hurtowni danych, w
Jest to architektura hurtowni danych, w
której dane są integrowane i
której dane są integrowane i
przeprojektowywane, a następnie
przeprojektowywane, a następnie
wprowadzane do oddzielnych hurtowni,
wprowadzane do oddzielnych hurtowni,
dla różnych obszarów tematycznych
dla różnych obszarów tematycznych
działalności przedsiębiorstwa. chociaż ta
działalności przedsiębiorstwa. chociaż ta
architektura nie ma jednej dużej bazy
architektura nie ma jednej dużej bazy
danych, to zawiera wszystkie podstawowe
danych, to zawiera wszystkie podstawowe
elementy, które sprawiają, że jest
elementy, które sprawiają, że jest
prawdziwą hurtownią danych Rozwiązanie
prawdziwą hurtownią danych Rozwiązanie
to różni się od rozwiązania poprzedniego
to różni się od rozwiązania poprzedniego
tym, że nie istnieje hurtownia danych dla
tym, że nie istnieje hurtownia danych dla
całego przedsiębiorstwa, stanowiąca
całego przedsiębiorstwa, stanowiąca
jedno jednolite źródło dla wszystkich
jedno jednolite źródło dla wszystkich
tematycznych hurtowni danych.
tematycznych hurtowni danych.
Źródło
Źródło
Źródło
Źródło
Ekstrakcja
Transformacja
Ładowanie
Hurtownia
wydziałowa
Hurtownia
wydziałowa
Użytkownik UżytkownikUżytkownik
Przekształcanie danych
Środowis
ko
dostępu
do
danych
Wariant 3: Tematyczna
Wariant 3: Tematyczna
hurtownia danych
hurtownia danych
Zalety rozwiązania:
Zalety rozwiązania:
Elastyczność rozwiązania w zakresie
Elastyczność rozwiązania w zakresie
skalowalności (poziomej i pionowej)
skalowalności (poziomej i pionowej)
architektury, poprzez dokładanie lub
architektury, poprzez dokładanie lub
zamykanie poszczególnych hurtowni
zamykanie poszczególnych hurtowni
wydziałowych,
wydziałowych,
Łatwość implementacji rozwiązania.
Łatwość implementacji rozwiązania.
Niższe niż dla pozostałych wariantów koszty
Niższe niż dla pozostałych wariantów koszty
rozwiązania w zakresie infrastruktury,
rozwiązania w zakresie infrastruktury,
Niższe niż dla pozostałych wariantów koszty
Niższe niż dla pozostałych wariantów koszty
pielęgnacji i zarządzania konfiguracją,
pielęgnacji i zarządzania konfiguracją,
Wady rozwiązania
Wady rozwiązania
Brak jednolitego źródła tych samych danych
Brak jednolitego źródła tych samych danych
dla poszczególnych obszarów działalności
dla poszczególnych obszarów działalności
firmy
firmy
Wariant 3: Tematyczna
Wariant 3: Tematyczna
hurtownia danych
hurtownia danych
Rodzaje implementacji HD
Rodzaje implementacji HD
Rodzaje implementacji HD
Rodzaje implementacji HD
2.3. Związki między
2.3. Związki między
infrastrukturami a
infrastrukturami a
architekturą
architekturą
Infrastruktury techniczne
Infrastruktury techniczne
Infrastruktury techniczne hurtowni danych
Infrastruktury techniczne hurtowni danych
są blisko związane z architekturą. Zalicza
są blisko związane z architekturą. Zalicza
się do nich:
się do nich:
technologie,
technologie,
platformy,
platformy,
bazy danych,
bazy danych,
platformy sprzętowe i systemowe
platformy sprzętowe i systemowe
oraz inne składniki niezbędne do tego,
oraz inne składniki niezbędne do tego,
aby architektura hurtowni była
aby architektura hurtowni była
funkcjonalna.
funkcjonalna.
Przyjęto, że za infrastrukturę techniczną
Przyjęto, że za infrastrukturę techniczną
też uważane jest szkolenie.
też uważane jest szkolenie.
Na kolejnym slajdzie zostały przedstawione
Na kolejnym slajdzie zostały przedstawione
przykłady infrastruktur technicznych.
przykłady infrastruktur technicznych.
Przykład relacji między architekturą a
infrastrukturami
Źródło
Źródło
Źródło
Źródło
Ekstrakcja
Transformacja
Ładowanie
Hurtownia
danych
przedsiębiorstwa
Użytkownik
Użytkownik
Użytkownik
Przekształc
anie danych
1
2
3
4 5
6
7
8
9
1. Szkolenie w zakresie
metodyki wspomagania
podejmowania decyzji
2. Szkolenie w zakresie
relacyjnych baz danych
3. Narzędzia konwersji
danych
4. Umiejętności
administratora bazy danych
5. Sprzęt i relacyjna baz
danych
6. Sieć lokalna,, łączność i
stacje robocze
7. Przeglądanie ofert
sprzedaży bram
8. Przegląd dostępnego,
wysuniętego
oprogramowania
9. Przegląd dostępnych
narzędzi nawigacji po
metadanych
Infrastruktury techniczne –narzędzia, platformy,
Infrastruktury techniczne –narzędzia, platformy,
komunikacja, bazy danych, szkolenia, itp. – wymagają
komunikacja, bazy danych, szkolenia, itp. – wymagają
sporo czasu na ich określenie, instalację i dostrojenie.
sporo czasu na ich określenie, instalację i dostrojenie.
Nowy sprzęt i oprogramowanie należy zakupić i
Nowy sprzęt i oprogramowanie należy zakupić i
uruchomić.
uruchomić.
Ponadto należy przejrzeć i wybrać narzędzia do integracji
Ponadto należy przejrzeć i wybrać narzędzia do integracji
danych, zorganizonizować sieci, bramy baz danych i
danych, zorganizonizować sieci, bramy baz danych i
komunikację.
komunikację.
Techniczne infrastruktury powinny zostać określone, w
Techniczne infrastruktury powinny zostać określone, w
zależności od przyjętej architektury hurtowni danych i
zależności od przyjętej architektury hurtowni danych i
być w fazie instalowania przed rozpoczęciem
być w fazie instalowania przed rozpoczęciem
tworzenia hurtowni danych.
tworzenia hurtowni danych.
Bardzo duży wpływ na wybór odpowiednich infrastruktur
Bardzo duży wpływ na wybór odpowiednich infrastruktur
technicznych ma aktualne środowisko przetwarzania
technicznych ma aktualne środowisko przetwarzania
danych, a mianowicie czy jest ono ustrukturalizowane
danych, a mianowicie czy jest ono ustrukturalizowane
(zintegrowane) czy niezintegrowane.
(zintegrowane) czy niezintegrowane.
Środowisko przetwarzania danych ma bardzo duży wpływ
Środowisko przetwarzania danych ma bardzo duży wpływ
na wybór metodyki (cyklu życia systemu hurtowni
na wybór metodyki (cyklu życia systemu hurtowni
danych) realizacji systemu wspomagania
danych) realizacji systemu wspomagania
podejmowania decyzji.
podejmowania decyzji.
Infrastruktury techniczne
Infrastruktury techniczne
1.
1.
Edukacja w zakresie wspomagania podejmowania
Edukacja w zakresie wspomagania podejmowania
decyzji,
decyzji,
2.
2.
Wybór narzędzi przekształcania danych
Wybór narzędzi przekształcania danych
3.
3.
Szkolenie w zakresie narzędzi przekształcania danych
Szkolenie w zakresie narzędzi przekształcania danych
4.
4.
Wybór bazy danych i platformy
Wybór bazy danych i platformy
5.
5.
Wiedza i umiejętności w zakresie baz danych i
Wiedza i umiejętności w zakresie baz danych i
platform
platform
6.
6.
Wybór bram
Wybór bram
7.
7.
Strategia replikacji danych
Strategia replikacji danych
8.
8.
Wybór narzędzi do replikacji
Wybór narzędzi do replikacji
9.
9.
Wiedza i umiejętności w zakresie projektowania bazy
Wiedza i umiejętności w zakresie projektowania bazy
dla hurtowni danych
dla hurtowni danych
10.
10.
Baza danych i platformy
Baza danych i platformy
11.
11.
Sieć i łączność
Sieć i łączność
12.
12.
Stacje robocze i oprogramowanie
Stacje robocze i oprogramowanie
13.
13.
Wybór narzędzi dostępu do danych
Wybór narzędzi dostępu do danych
14.
14.
Szkolenie użytkowników w zakresie dostępu do
Szkolenie użytkowników w zakresie dostępu do
danych
danych
15.
15.
Dostęp do meta danych
Dostęp do meta danych
16.
16.
Szkolenie w zakresie nawigowania po meta danych.
Szkolenie w zakresie nawigowania po meta danych.
Infrastruktury techniczne - lista
Infrastruktury techniczne - lista
docelowa
docelowa
Uwaga!. Przed przystąpieniem do
Uwaga!. Przed przystąpieniem do
budowy hurtowni danych musi być
budowy hurtowni danych musi być
ustalona architektura hurtowni
ustalona architektura hurtowni
danych (należy wybrać jeden
danych (należy wybrać jeden
konkretny wariant) oraz techniczne
konkretny wariant) oraz techniczne
infrastruktury dla tego wariantu.
infrastruktury dla tego wariantu.
Bez ustalenia właściwej
Bez ustalenia właściwej
architektury i infrastruktur
architektury i infrastruktur
technicznych budowa hurtowni
technicznych budowa hurtowni
danych z reguły kończy się
danych z reguły kończy się
niepowodzeniem.
niepowodzeniem.
Infrastruktury techniczne -
Infrastruktury techniczne -
lista docelowa
lista docelowa
2.4. Podsumowanie
2.4. Podsumowanie
Architektura jest zbiorem zasad i struktur
Architektura jest zbiorem zasad i struktur
będących szkieletem ogólnego projektu systemu.
będących szkieletem ogólnego projektu systemu.
Architekturę danych określa się przez ustalenie, w
Architekturę danych określa się przez ustalenie, w
jaki sposób dane powinny wędrować w systemie
jaki sposób dane powinny wędrować w systemie
hurtowni danych oraz jak będą wykorzystywane
hurtowni danych oraz jak będą wykorzystywane
wewnątrz przedsiębiorstwa.
wewnątrz przedsiębiorstwa.
Architektura danych dla hurtowni danych musi
Architektura danych dla hurtowni danych musi
posiadać następujące cechy:
posiadać następujące cechy:
Dane są wydzielone z systemów źródłowych, baz
Dane są wydzielone z systemów źródłowych, baz
danych i plików;
danych i plików;
Dane z systemów źródłowych są integrowane przed
Dane z systemów źródłowych są integrowane przed
wprowadzeniem do hurtowni danych;
wprowadzeniem do hurtowni danych;
Hurtownia danych jest oddzielną, stałą bazą danych,
Hurtownia danych jest oddzielną, stałą bazą danych,
zaprojektowaną specjalnie do przetwarzania
zaprojektowaną specjalnie do przetwarzania
analitycznego wspomagającego podejmowanie
analitycznego wspomagającego podejmowanie
decyzji, opartego na dużych ilościach danych;
decyzji, opartego na dużych ilościach danych;
Użytkownicy maja dostęp do hurtowni danych
Użytkownicy maja dostęp do hurtowni danych
poprzez wysunięte narzędzia i aplikacje (stacje
poprzez wysunięte narzędzia i aplikacje (stacje
robocze)
robocze)
Pola źródłowe dla hurtowni danych mogą pochodzić z
Pola źródłowe dla hurtowni danych mogą pochodzić z
różnych baz danych, różnych platform i różnić się
różnych baz danych, różnych platform i różnić się
strukturami, typami i formatami.
strukturami, typami i formatami.
Jedna baza danych nie może być „wspólna” zarówno w
Jedna baza danych nie może być „wspólna” zarówno w
przetwarzaniu operacyjnym, jak i wspomagającym
przetwarzaniu operacyjnym, jak i wspomagającym
podejmowanie decyzji.
podejmowanie decyzji.
Nie istnieje jeden dobry sposób implementacji hurtowni
Nie istnieje jeden dobry sposób implementacji hurtowni
danych za pomocą określonego zbioru infrastruktur
danych za pomocą określonego zbioru infrastruktur
technicznych; jednakże podstawowe składniki architektury
technicznych; jednakże podstawowe składniki architektury
hurtowni danych muszą zostać zrealizowane i dla nich
hurtowni danych muszą zostać zrealizowane i dla nich
muszą być zdefiniowane infrastruktury techniczne.
muszą być zdefiniowane infrastruktury techniczne.
Infrastruktury techniczne to techniki, narzędzia, platformy,
Infrastruktury techniczne to techniki, narzędzia, platformy,
bazy danych, bramy oraz inne elementy niezbędne do
bazy danych, bramy oraz inne elementy niezbędne do
zrealizowania wybranej architektury hurtowni danych.
zrealizowania wybranej architektury hurtowni danych.
Częścią zadania, jakim jest zbudowanie hurtowni danych,
Częścią zadania, jakim jest zbudowanie hurtowni danych,
jest znalezienie infrastruktur technicznych
jest znalezienie infrastruktur technicznych
odpowiadającym potrzebom wspomagania podejmowania
odpowiadającym potrzebom wspomagania podejmowania
decyzji, tak, aby stworzyć solidną architekturę
decyzji, tak, aby stworzyć solidną architekturę
umożliwiającą pracę w zadanych warunkach.
umożliwiającą pracę w zadanych warunkach.
Ta sama architektura hurtowni danych może zostać
Ta sama architektura hurtowni danych może zostać
zaimplementowana przy użyciu różnych infrastruktur.
zaimplementowana przy użyciu różnych infrastruktur.
Szkolenie techniczne jest bardzo ważną infrastrukturą
Szkolenie techniczne jest bardzo ważną infrastrukturą
techniczną.
techniczną.
Rozpoznanie właściwej architektury i infrastruktur powinno
Rozpoznanie właściwej architektury i infrastruktur powinno
być przedsięwzięciem oddzielnym od tworzenia hurtowni
być przedsięwzięciem oddzielnym od tworzenia hurtowni
danych.
danych.
2.4. Podsumowanie c.d.
2.4. Podsumowanie c.d.