Wprowadzenie do hurtowni danych
" Projektowanie hurtowni danych
Projektowanie bazy danych dla HD
" Wyjątkowo złożony proces, w którym projektant powinien znać odpowiedzi
m.in. na takie pytania jak:
Jakie wymagania użytkowników są najważniejsza?
Które dane powinny zostać najpierw przeanalizowane?
Jak ma być skala projektu:
" Składnica danych Mniejszy projekt (łatwiejszy w zarządzaniu) z infrastrukturą zdolną do
realizacji w końcowej fazie pełnoprawnej HD.
" Hurtownia danych Projekt spełniający jednocześnie wszystkie żądania różnych grup
" Hurtownia danych Projekt spełniający jednocześnie wszystkie żądania różnych grup
użytkowników.
" Etap zbierania i analizy wymagań w projekcie HD wymaga przeprowadzenia
wywiadów z:
Pracownikami działu marketing,
Pracownikami działu sprzedaży,
Pracownikami działu eksploracji,
Pracownikami odpowiedzialnymi za systemy OLAP Identyfikacja zródeł danych,
które mogą dostarczyć czystych, poprawnych i spójnych informacji (przez najbliższe kilka lat).
Członkami zarządu Określenie zbioru wymagań z uwzględnieniem priorytetów.
Autor opracowania: mgr inż. Grzegorz Szymczuk - Szymaniuk 2
Modelowanie wielowymiarowe HD
" Wywiady dostarczają niezbędnych (do dalszego procesu projektowania bazy HD)
informacji o tym jakie są:
Wymagania użytkowników
Dostępne zródła.
" Baza danych jako składnik HD opisywana jest za pomocą modelowania
wielowymiarowe (DM, ang. Dimensional Model) Techniki projektowania
logicznego, której celem jest prezentacja danych w standardowej, intuicyjnej formie
pozwalającej na wysoce wydajny dostęp.
pozwalającej na wysoce wydajny dostęp.
" Modelowanie wielowymiarowe korzysta z pojęć modelowania związków
encji (ER), ale z kilkoma ważnymi ograniczeniami.
Każdy model składa się z jednej tabeli (tabela faktów) ze złożonym kluczem
głównym oraz zbioru mniejszych tabel (tabel wymiaru).
Każda tabela wymiaru zawiera jeden prosty klucz główny, który odpowiada
jednemu segmentowi klucza złożonego w tabeli faktów.
" Czyli klucz główny tabeli faktów złożony jest co najmniej z dwóch kluczy obcych.
Wszystkie naturalne klucze zostały zastąpione kluczami zastępczymi
" Zatem każde złączenie tabeli faktów i tabeli wymiarów jest oparte na kluczach
zastępczych.
Autor opracowania: mgr inż. Grzegorz Szymczuk - Szymaniuk 3
Modelowanie wielowymiarowe HD cd.
" Każdy klucz zastępczy powinien mieć ogólna strukturę bazującą na prostych liczbach
całkowitych.
" Korzystanie z kluczy zastępczych w HD powoduje, że dane w HD są w pewnym
stopniu niezależne od danych używanych i produkowanych przez systemy OLTP.
Czas
KlientKupujący Personel Biuro
CzasID (PK)
KlientID (PK) PracownikID (PK)
BiuroID (PK)
Dzień
KlientNR PracownikNR
BiuroNR
Tydzień
KlientNazwisko PracImieNazwisko
TypBiura
Miesiąc
KlientTyp Stanowisko
Miasto
Rok
Miasto Płeć
Region
Region
Region Miasto
Region Miasto
Kraj
Kraj Region
Kraj
Promocja
PromocjaID (PK)
Promocja Nr
SprzedażNieruchomości
NazwaPromocji
TypPromocji
CzasID (FK)
NieruchomośćNaSprzedaż NieruchomościID (FK)
BiuroID (FK)
Właściciel
KlientID (FK)
NieruchomośćID (FK)
PromocjaID (FK)
NieruchomośćNr
WłaścicielID (PK)
PracownikID (FK)
Typ
WłaścielNr
WłaścicielID (FK)
Ulica
NazwaWłaściciela
CenaOferowana
Miasto
TypWłaściciela
CenaSprzedaży
KodPocztowy
Miasto
ProwizjaSprzedaży
Region
Region
DochódSprzedaży
Kraj
Kraj
Autor opracowania: mgr inż. Grzegorz Szymczuk - Szymaniuk 4
Modelowanie wielowymiarowe HD cd.
" Schemat gwiazdy Struktura logiczna, w centrum której występuje tabela
faktów zawierająca dane rzeczowe, a otaczają ją tabele wymiarów z danymi
referencyjnymi (mogą być zdenormalizowane).
Schemat gwiazdy wykorzystuje cechy danych rzeczowych:
" Fakty zostały wygenerowane przez zdarzenia zaistniałe w przeszłości
" Fakty prawdopodobnie nie ulegną zmianie (niezależnie od sposobu ich analizy).
Tabele faktów w porównaniu z tabelami wymiarów mogą być duże, ponieważ
większość danych w HD reprezentowana jest w postaci faktów.
większość danych w HD reprezentowana jest w postaci faktów.
" Dane rzeczowe powinny być traktowane jako referencyjne dane tylko do odczytu,
bez możliwości ich modyfikacji.
Najbardziej użyteczne są tabele faktów zawierające przynajmniej jedną
wartość numeryczną - Fakt występujący w każdym rekordzie. Np. dla projektu
Wymarzony Dom: CenaOfiarowania, CenaSprzedaży, ProwizjaSprzedaży, DochódSprzedaży
" Aplikacje HD zazwyczaj odwołują się do dużej liczby rekordów, a najlepszą operacją jaką można
wykonać na takiej liczbie rekordów jest agregacja wartości numerycznych.
Tabele wymiarów zawierają na ogół opisowe informacje tekstowe.
" Atrybuty tabel wymiarów są używane w warunkach ograniczających zapytania.
" Użyteczność HD jest proporcjonalna do stopnia dopasowania do wymagań danych
przechowywanych w tabelach wymiarów.
Autor opracowania: mgr inż. Grzegorz Szymczuk - Szymaniuk 5
Modelowanie wielowymiarowe HD cd.
" Wnioski:
Schemat gwiazdy można wykorzystać w celu przyspieszenia wykonania
zapytania poprzez denormalizację informacji referencyjnych do pojedynczej
tabeli wymiaru.
" Kiedy zdecydować się na denormalizację?
Gdy występuje pewna liczba encji powiązanych z daną tabelą wymiaru, do których są
częste odwołania.
W efekcie redukuje się nakład pracy konieczny do dodatkowego złączenia tabel,
którego celem byłby dostęp do żądanych atrybutów?
którego celem byłby dostęp do żądanych atrybutów?
" Kiedy zrezygnować z denormalizacji?
Gdy odwołania do dodatkowych danych nie występują zbyt często.
Nakład pracy związany ze skanowaniem rozszerzonych tabel może nie być
zrównoważony przez przyrost wydajności realizacji zapytań.
Autor opracowania: mgr inż. Grzegorz Szymczuk - Szymaniuk 6
Modelowanie wielowymiarowe HD cd.
" Schemat płatka śniegu - Odmiana schematu gwiazdy, w której tabele
wymiarów nie zawierają zdenormalizowanych danych.
Inaczej tabela wymiarów posiada własne wymiary.
SprzedażNieruchomości
SprzedażNieruchomości
CzasID (FK)
Region Miasto Biuro
NieruchomościID (FK)
BiuroID (FK)
KlientID (FK)
BiuroID (PK)
PromocjaID (FK)
Region (PK) Miasto (PK) BiuroNR
PracownikID (FK)
Kraj Region (FK) TypBiura
WłaścicielID (FK)
Miasto (FK)
CenaOferowana
CenaSprzedaży
ProwizjaSprzedaży
DochódSprzedaży
Autor opracowania: mgr inż. Grzegorz Szymczuk - Szymaniuk 7
Modelowanie wielowymiarowe HD cd.
" Schemat płatkowo gwiazdzisty Hybryda łącząca schemat gwiazdy i płatka
śniegu.
Niektóre wymiary mogą występować zarówno w schemacie gwiazdy i płatkowo
gwiazdzistym, aby zaspokoić różne wymagania zapytań.
" Zalety standardowej postaci modelu wielowymiarowego:
Efektywność Spójność odpowiedniej struktury umożliwia efektywny dostęp do danych
przez różnorodne narzędzia m.in. generatory raportów i narzędzia do zadawania zapytań.
Zdolność do obsługi zmieniających się wymagań Schemat gwiazdy może być
Zdolność do obsługi zmieniających się wymagań Schemat gwiazdy może być
dopasowywany do zmieniających się wymagań użytkowników, bo wszystkie wymiary są
równoważne ze względu na realizację dostępu do tabeli faktów.
" Taki projekt łatwo obsługuje zapytania ad hoc.
Rozszerzalność Model wielowymiarowy musi realizować typowe zmiany:
" Dodawanie nowych faktów Muszą być zgodne z podstawową szczegółowością tabeli faktów
" Dodawanie nowych wymiarów W każdym istniejącym fakcie musi wystąpić pojedyncza
wartość odpowiadająca temu wymiarowi.
" Dodawanie nowych atrybutów wymiarowych
" Podział istniejących rekordów wymiaru wg niższego poziomu szczegółowości,
poczynając od pewnego momentu w czasie.
Autor opracowania: mgr inż. Grzegorz Szymczuk - Szymaniuk 8
Modelowanie wielowymiarowe HD cd.
" Zalety standardowej postaci modelu wielowymiarowego:
Zdolność modelowania typowych sytuacji biznesowych Każda ze standardowych
sytuacji obsługi sytuacji w dziedzinie biznesu posiada dobrze przeanalizowany zbiór
alternatyw, które mogą być specyficznie zaprogramowane w:
" Generatorach raportów,
" Narzędziach do zadawania zapytań,
" Innych interfejsach użytkowników.
" Przykład: Wolno zmieniające się wymiary, w których stałe wymiary (Biuro, Personel), faktycznie
ewoluują wolno i asynchronicznie.
ewoluują wolno i asynchronicznie.
Przewidywalne przetwarzanie zapytań
" Aplikacje HD eksplorujące dane w dół będą dodawać większą liczbę atrybutów
wymiarowych z pojedynczego schematu gwiazdy.
" Aplikacje HD eksplorujące dane w poprzek będą łączyć ze sobą oddzielne tabele
faktów poprzez wspólne (zgodne) wymiary.
" Jeśli nawet pełny zestaw schematów gwiazdzistych w modelu wielowymiarowym jest
złożony, to przetwarzanie zapytań jest przewidywalne Każda tabela faktów powinna być
przeszukiwana niezależnie.
Autor opracowania: mgr inż. Grzegorz Szymczuk - Szymaniuk 9
Porównanie modeli wielowymiarowych i związków encji
" Model wielowymiarowy (DM):
Używany do projektowania baz danych HD
" Model związków encji (ER)
Używany do opisu baz danych przeznaczonych dla systemów OLTP
Służy do identyfikacji związków miedzy encjami.
Główne zadanie polega na usunięciu redundancji z danych, ponieważ
transakcje stają się prostsze.
Nie wspiera podstawowej zalety HD intuicyjnego i wysoce wydajnego
wyszukiwania danych.
Pojedynczy model ER można rozłożyć na wiele modeli DM.
" Modele te łączone są za pomocą wspólnych tabel wymiarów.
Autor opracowania: mgr inż. Grzegorz Szymczuk - Szymaniuk 10
Metoda projektowania bazy danych dla HD
" Metoda dziewięciu kroków R. Kimballa:
1. Wybór procesu
2. Wybór poziomu szczegółowości
3. Identyfikacja i uzgodnienie wymiarów
4. Wybór faktów
5. Umieszczenie wstępnych obliczeń w tabeli faktów
6. Zaokrąglenie tabel wymiarów
7. Wybór zakresu czasowego bazy danych
8. Śledzenie wolno zmieniających się wymiarów
9. Określenie priorytetów zapytań i trybów zapytań.
" Metoda dziewięciu kroków określa podstawowe działania wymagane przy
projektowaniu składnicy danych.
Prowadzi do powiązania ze sobą oddzielnych składnic danych tak, że z czasem
połączą się w spójną HD.
" Inne techniki projektowania HD
Rozłożenie
Autor opracowania: mgr inż. Grzegorz Szymczuk - Szymaniuk 11
Metoda projektowania bazy danych dla HD
" Inne techniki projektowania HD
Rozłożenie projektu HD na łatwiejsze w zarządzaniu elementy składnice
danych.
Suma zbiorów oddzielnych składnic danych:
" Zaimplementowanych w pewnym okresie czasu
" Przez różne zespoły projektowe,
" Na różnych platformach sprzętowych i programowych.
Autor opracowania: mgr inż. Grzegorz Szymczuk - Szymaniuk 12
Metoda 9 kroków: 1. Wybór procesu
" Proces (funkcja) Zakres podmiotowy danej składnicy danych.
" Na początku należy wybrać składnicę danych, która:
Ma największe szanse realizacji w terminie i bez przekraczania budżetu,
Będzie odpowiadała na najbardziej istotne (komercyjnie) pytania biznesowe.
" Najlepszy wybór to składnica powiązana ze sprzedażą, bo zródła danych będą
dostępne i będą wysokiej jakości.
" Przykład: Projekt Wymarzony Dom
Określamy występujące w firmie dyskretne procesy biznesowe:
Określamy występujące w firmie dyskretne procesy biznesowe:
" Sprzedaż nieruchomości WYBRANY PROCES,
" Wynajem nieruchomości (leasing),
" Prezentacja nieruchomości,
" Ogłaszanie nieruchomości,
" Konserwacja nieruchomości.
Wymagania wobec danych zostały zawarte w modelu ER.
" Model został uproszczony do etykiet encji i związków.
" Zacienione encje reprezentują główne fakty ww. procesach biznesowych.
Rys. 31.3, 31.4
Autor opracowania: mgr inż. Grzegorz Szymczuk - Szymaniuk 13
Metoda 9 kroków: 2. Wybór poziomu szczegółowości
" Wybór poziomu szczegółowości Decyzja określająca, co dokładnie będą
reprezentować rekordy w tabeli faktów.
Przykładowym poziomem szczegółowości jest jednostkowa sprzedaż nieruchomości, bo
encja SprzedażNieruchomości reprezentuje fakty dotyczące każdej sprzedanej
nieruchomości.
" Dopiero po wyborze poziomu szczegółowości można zidentyfikować
wymiary tabeli faktów.
Przykładowo encje: Biuro, Personel, Właściciel, KlientKupujący,
Przykładowo encje: Biuro, Personel, Właściciel, KlientKupujący,
NieruchomośćNaSprzedaż, Promocja.
" Dlatego stały się wymiarami w schemacie gwiazdy dla sprzedaży nieruchomości.
" Do ww. wymiarów należy dodać Czas, ponieważ jest on zawsze obecny w schemacie
gwiazdy.
" Wybór poziomu szczegółowości tabeli faktów wyznacza także poziom
szczegółowości tabel wymiarów.
Przykładowo dla ww. poziomu szczegółowości tabeli faktów, poziomem
szczegółowości wymiaru Klient są informacje o kliencie który kupił daną
nieruchomość.
Autor opracowania: mgr inż. Grzegorz Szymczuk - Szymaniuk 14
Metoda 9 kroków: 3. Identyfikacja i uzgodnienie wymiarów
" Kontekst dla zadawanych pytań o fakty znajdujące się w tabeli faktów
określają wymiary.
Dobrze zbudowany zbiór wymiarów sprawia, że składnica danych jest
zrozumiała i łatwa w użyciu.
Wymiary należy opisać na tyle dokładnie, aby na właściwym poziomie
szczegółowości opisać obiekty tj. klienci czy nieruchomości.
" Przykładowo opis klienta znajduje się w tabeli wymiaru KlientKupujący, do którego
użyte są atrybuty tj.: klientID, klientNr, klientNazwisko, klientTyp, miasto, region,
użyte są atrybuty tj.: klientID, klientNr, klientNazwisko, klientTyp, miasto, region,
kraj.
" Użyteczność składnicy danych będzie mniejsza, gdy będzie niekompletny lub zle
zaprojektowany zbiór wymiarów.
Jeżeli którykolwiek z wymiarów występuje w dwóch składnicach danych, to
muszą być identyczne lub jedna z nich jest podzbiorem drugiej.
" Jedyny sposób, aby dwie składnice mogły współdzielić jeden wymiar w tej samej
aplikacji.
" Wymiar zgodny Wymiar używany w więcej niż jednej składnicy danych.
Np. Czas, NieruchomośćNaSprzedaż, Biuro, Promocja
Rys. 31.5
Autor opracowania: mgr inż. Grzegorz Szymczuk - Szymaniuk 15
Metoda 9 kroków: 4. Wybór faktów
" Poziom szczegółowości określa jednoznacznie, które fakty mogą być
używane w składnicy danych.
Wszystkie fakty muszą zastać wyrażone na wybranym poziomie
szczegółowości.
" Zatem jeśli poziomem szczegółowości tabeli faktów jest jednostkowa sprzedaż
nieruchomości, wszystkie fakty numeryczne muszą odnosić się do jednej
konkretnej sprzedaży.
" Fakty powinny być numeryczne i addytywne.
" Fakty mogą być dołączane do tabeli faktów w dowolnym momencie pod
warunkiem, że są zgodne z poziomem szczegółowości tabeli.
Przykład Tabela faktów o złej strukturze
" Tabela faktów jest bezużyteczna z powodu:
Faktów nienumerycznych (nazwaPromocji, pracImieNazwisko),
Faktu nieaddytywnego (czynszMiesięczny),
Faktu o innym poziomie szczegółowości (dochódOstatniegoRoku).
Rys. 31.6
Autor opracowania: mgr inż. Grzegorz Szymczuk - Szymaniuk 16
Metoda 9 kroków:
5. Umieszczenie wstępnych obliczeń w tabeli faktów
Czas
KlientWynajmujący Personel Biuro
CzasID (PK)
KlientID (PK) PracownikID (PK)
BiuroID (PK)
Dzień
KlientNR PracownikNR
BiuroNR
Tydzień
KlientNazwisko PracImieNazwisko
TypBiura
Miesiąc
KlientTyp Stanowisko
Miasto
Rok
Miasto Płeć
Region
Region Miasto
Kraj
Kraj Region
Kraj
Promocja
PromocjaID (PK)
PromocjaID (PK)
Promocja Nr
Wynajęcie
NazwaPromocji
TypPromocji
CzasID (FK)
NieruchomościID (FK)
NieruchomośćDoWynajęcia
BiuroID (FK)
KlientID (FK)
Właściciel
NieruchomośćID (FK)
PromocjaID (FK)
NieruchomośćNr
PracownikID (FK)
WłaścicielID (PK)
Typ
WłaścicielID (FK)
WłaścielNr
Ulica
OkresNajmu
NazwaWłaściciela
Miasto
CzynszCałkowity
TypWłaściciela
KodPocztowy
BonifikataKlienta
Miasto
Region
ProwizjaPracownika
Region
Kraj
DochódCałkowity
Kraj
Autor opracowania: mgr inż. Grzegorz Szymczuk - Szymaniuk 17
Metoda 9 kroków:
5. Umieszczenie wstępnych obliczeń w tabeli faktów
" Po wyborze faktów, każdy z nich powinien zostać ponownie
przeanalizowany, w celu ustalenia możliwości dokonywania wstępnych
obliczeń.
Przykład: Rachunek zysków i strat można stworzyć na bazie faktów, których
tabela jest oparta na sprzedaży lub fakturach.
" Tabela faktów posiada atrybuty tj.: okresNajmu, czynszCałkowity,
bonifikataKlienta, prowizjaPracownika, dochódCałkowity.
Fakty tego rodzaju są użyteczne, bo są addytywne i na ich podstawie można
wyprowadzić wartościowe informacje (średnia bonifikataKlienta) bazując na agregacji
wyprowadzić wartościowe informacje (średnia bonifikataKlienta) bazując na agregacji
niektórych liczb.
W odniesieniu do pojedynczego wynajmu wartość
dochódCałkowity = czynszCałkowity (bonifikataKlienta + prowizjaPracownika)
Wartość dochódCałkowity można zawsze obliczyć na podstawie przechowywanych
wartości, ale zaleca się zachowanie jego wartość.
Konieczne w odniesieniu do wartości podstawowych przedsiębiorstwa lub aby
zagwarantować, że użytkownik nie dokona błędnych obliczeń.
Koszt błędnego obliczenia wartości dochódCałkowity równoważy drobny koszt
niewielkiej redundancji danych.
Autor opracowania: mgr inż. Grzegorz Szymczuk - Szymaniuk 18
Metoda 9 kroków: 6. Zaokrąglanie tabel wymiarów
" Do tabel wymiarów dodawanych jest maks. duża ilość opisów tekstowych.
" Opisy tekstowe powinny być intuicyjne i zrozumiałe dla użytkowników, ponieważ
użyteczność składnicy zależy od zakresu i atrybutów tabel wymiarów.
Autor opracowania: mgr inż. Grzegorz Szymczuk - Szymaniuk 19
Metoda 9 kroków: 7. Wybór zakresu czasowego bazy danych
" Zakres czasowy Najbardziej odległy moment w przeszłości, do którego odnoszą
się jednocześnie informacje w tabeli faktów.
W wielu firmach żąda się, aby wybrany okres czasowy można było zestawić z
odpowiadającym mu okresem sprzed roku lub dwóch.
Firmy ubezpieczeniowe (i nie tylko) muszą przechowywać dane przez
określony wymiar czasu np. z ostatnich 5 lat. W efekcie tabele faktów są
bardzo duże, dlatego w projekcie HD trzeba rozważyć następujące kwestie:
" Często występują problemy z pobraniem coraz starszych danych.
" Często występują problemy z pobraniem coraz starszych danych.
Im starsze dane tym większe trudności z odczytem nośników bądz interpretacją starych
plików czy taśm.
" Konieczne jest używanie starych wersji istotnych tabel wymiarów, a nie ich
aktualnych odpowiedników Problem wolno zmieniających się wymiarów.
Autor opracowania: mgr inż. Grzegorz Szymczuk - Szymaniuk 20
Metoda 9 kroków: 8. Śledzenie wolno zmieniających się wymiarów
" Problem wolno zmieniających się wymiarów oznacza np. odpowiedni opis
dawnego klienta i dawnego biura musi zostać użyty wraz z historią
dawnych transakcji.
Definiując takie istotne wymiary często trzeba przyporządkować im
uogólnione klucze w celu odróżnienia zmieniających się w czasie wersji danych
klientów czy biur.
Wyróżnia się 3 typy wolno zmieniających się wymiarów:
" Zmieniony atrybut wymiaru zastępuje poprzedni.
" Zmieniony atrybut wymiaru zastępuje poprzedni.
" Zmiana atrybutu powoduje utworzenie nowego rekordu wymiaru.
" Zmiana wartości atrybutu powoduje stworzenie alternatywnego atrybutu tak, że
obie wartości atrybutu (stara i nowa) są jednocześnie dostępne w tym samym
rekordzie wymiany.
Autor opracowania: mgr inż. Grzegorz Szymczuk - Szymaniuk 21
Metoda 9 kroków:
9. Określenie priorytetów zapytań i trybów zapytań
" W tym etapie należy rozważyć zagadnienia projektowania fizycznego.
Fizyczne uporządkowanie rekordów w tabeli faktów na dysku oraz obecność
wstępnie policzonych podsumowań lub agregacji - Najbardziej krytyczne
zagadnienia projektowania fizycznego HD.
Oprócz tych problemów istnieje wiele kwestii projektowania fizycznego, które
dotyczą:
" Administracji,
" Archiwizacji,
" Archiwizacji,
" Wydajności indeksowania,
" Bezpieczeństwa.
" Wynikiem realizacji metody 9 kroków jest projekt składnicy danych, która:
Będzie realizować wymagania konkretnego procesu biznesowego,
Będzie na tyle przystosowana do bezpośredniej integracji z innymi,
powiązanymi składnicami danych, by ostatecznie utworzyć HD obejmującą
całą firmę.
Autor opracowania: mgr inż. Grzegorz Szymczuk - Szymaniuk 22
Kryteria oceny wielowymiarowości HD
" Przystępując do oceny HD należy pamiętać, że nie wielu producentów
próbuje dostarczyć kompletne zintegrowane rozwiązania.
" HD jest kompleksowym systemem, dlatego należy stosować kryteria oceny
do kompleksowych i całościowych rozwiązań.
Nie należy stosować do oceny kolekcji rozłącznych pakietów, które nigdy nie
zostaną ze sobą dobrze zintegrowane.
" Kimball zdefiniował kryteria oceny wielowymiarowości, których celem było:
Ustalenie obiektywnego standardu, który oceniłby stopień realizacji
Ustalenie obiektywnego standardu, który oceniłby stopień realizacji
wielowymiarowego widzenia HD przez dany system.
Ustalenia wysokiego pułapu tak, aby producenci znali cel udoskonalania swoich
systemów.
" Zaleca się stosowanie dwustopniowej skali ocen: 0 lub 1, na każde kryterium.
" System otrzyma 1 tylko wtedy, gdy całkowicie spełnia definicję danego kryterium
Nie stosuje się ocen cząstkowych.
" Przykład
System oferuje zagregowaną nawigację dostępną tylko w pojedynczym narzędziu otrzyma
0, ponieważ zagregowana nawigacja nie jest powszechna.
Autor opracowania: mgr inż. Grzegorz Szymczuk - Szymaniuk 23
Kryteria oceny wielowymiarowości HD
" Trzy grupy kryteriów oceny zaproponowane przez Kimballa:
Kryteria architektoniczne Dotyczą podstawowych właściwości sposobu
zorganizowania całego systemu.
" Zakres tych systemów rozciąga się zazwyczaj od podsystemów zaplecza, przez SZBD
do podsystemów czołowych i komputerów użytkowników.
Kryteria administracyjne Są uważane za niezbędne dla sprawnego działania
wielowymiarowej HD.
" Kryteria dotyczą na ogół personelu informatycznego, który buduje i konserwuje HD.
" Kryteria dotyczą na ogół personelu informatycznego, który buduje i konserwuje HD.
Kryteria zdolności wyrażania Określają możliwości analityczne sytemu, które
są niezbędne w rzeczywistych sytuacjach.
" Dotyczą wszystkich rozwiązań, bez których nie jest możliwe pełne wykorzystanie
mocy systemu wielowymiarowego.
Autor opracowania: mgr inż. Grzegorz Szymczuk - Szymaniuk 24
Kryteria oceny wielowymiarowości HD
" Kryteria oceny zaproponowane przez Kimballa dzielą się na 3 grupy:
Architektoniczne
" Jawne deklaracje
" Zgodność wymiarów i faktów
" Integracja wymiarów
" Otwarta zagregowana nawigacja
" Symetria wymiarów
" Skalowalność wymiarów
" Skalowalność wymiarów
" Tolerancja rzadkości
Administracyjne
" Aagodne modyfikacje
" Powielanie wymiarów
" Powiadamianie o zmianie wymiarów
" Administracja kluczami zastępczymi
" Spójność międzynarodowa
Autor opracowania: mgr inż. Grzegorz Szymczuk - Szymaniuk 25
Kryteria oceny wielowymiarowości HD
Zdolności wyrażania
" Hierarchie wielowymiarowe
" Hierarchie nierównych wymiarów
" Wymiary wielowartościowe
" Wolno zmieniające się wymiary
" Role wymiarów
" Wymiary wymienne podczas pracy
"
" Natychmiastowe wymiary zakresu faktów
" Natychmiastowe wymiary behawioralne
" System, który spełnia wszystkie lub większość kryteriów będzie:
Prostszy, łatwiejszy w administracji.
Zdolny do spełniania wymagań wielu rzeczywistych aplikacji.
Autor opracowania: mgr inż. Grzegorz Szymczuk - Szymaniuk 26
Wyszukiwarka
Podobne podstrony:
pr pracy Monika Gładoch wyk3wyk3 dwyk3Fot wyk3 intWyk3 kalibracja komoryczesc1 wyk3IB wyk3Wyk3 termwyk3WYK3Wyk3wyk3md wyk3WYK3 optymalizacjawięcej podobnych podstron