Metody i narzędzia podejmowania decyzji – powtórka przed kolokwium
Systemy informatyczne wspomagające decyzje taktyczno-strategiczne:
DSS
BI
CRM
Składniki CRM w firmie:
Lojalność i odejście
Poznawanie
Segmentacja
Zarządzanie kampaniami
Personalizacja
Kontakt
Kostka danych – zawiera 3 wymiary: klient, czas, produkt
Schemat gwiazdy: tabela faktów + proste tabele wymiarów. Zdenormalizowany wymiar produktów
Schemat płatka śniegu: tabela faktów + znormalizowane tabele wymiarów + tabele podwymiarów. Nienaruszalność ze względu na aktualizację
Problemy wymagające DW:
analiza koszyka produktów – które produkty są sprzedawane razem. Można stworzyć system rekomendacyjny bądź stwierdzić, które zestawy przynoszą duże zyski
analiza migracji klientów – którzy klienci prawdopodobnie zrezygnują z usług firmy
analiza rynku – określenie segmentów przez grupowanie podobnych klientów. Wykorzystywane w analizie trendów i planowaniu kampanii reklamowych
prognozowanie – przewidywanie sprzedaży i zapasów magazynowych
eksploracja danych – lepsze poznanie klientów
analiza witryn internetowych – grupowanie wzorców zachowań na witrynie
analiza kampanii marketingowych – kierowanie kampanii do odpowiednich osób
kontrola danych
analiza tekstu
Zastosowania DW:
wykrywanie oszustw
ukierunkowany marketing
analiza rentowności klientów
zatrzymanie klientów
zarządzanie zapasami
analiza ryzyka kredytowego
długoterminowa ocena wartości klienta
ustalanie cen
Decyzja wymaga odpowiedzi na 3 pytania (wg. Deveya):
Jaki jest problem?
Jakie są warianty?
Który wariant jest najlepszy?
Decyzje dopuszczalne – wszystkie decyzje, które spełniają określone kryteria. Gdy zbiór decyzji dopuszczalnych jest zbiorem pustym to decyzja nie posiada rozwiązania. Gdy zbiór ten jest jednoelementowy to decyzja dopuszczalna jest jednocześnie optymalna
Decyzja optymalna – decyzja dopuszczalna i jednocześnie najlepsza ze względu na przyjęte kryteria. Gdy zbiór decyzji optymalnych jest wieloelementowy to problem decyzyjny jest nierozstrzygnięty. Gdy zbiór ten jest pusty to metoda wyboru różni się od metody oceny dopuszczalności
Trudności w bezpośrednim stosowaniu osiągnięć teorii decyzji wynikają z:
grupowego przygotowania decyzji
hierarchicznej i współzależnej struktury środowiska
Rodzaje decyzji menedżerskich:
według szczebla, horyzontu i zagregowania
strategiczne
taktyczne
operacyjne
według powtarzalności
zaprogramowane – kompletna struktura, powtarzalne, znane dane
nie zaprogramowane – niewyraźna struktura, rzadkie, potrzeba zgłębiania danych
według stopnia ryzyka
podejmowane w warunkach pewności
podejmowane w warunkach ryzyka
podejmowane w warunkach niepewności
według stopnia zależności i ról w procesie
niezależne
współzależne (sekwencyjnie zależne, sumarycznie zależne)
Proces podejmowania decyzji (Flakiewicz):
Przetworzenie informacji analiza informacji rozwiązanie problemu powzięcie decyzji ostatecznej
DSS = DBMS + MBMS +UIMS gdzie MBMS jest wyraźnie wyodrębniony
Metody podejmowania decyzji:
średnia użyteczność (Laplace’a) – macierz musi być unormowana, wszystkie stany natury są tak samo prawdopodobne
ważona użyteczność – macierz musi być unormowana, stany natury różnie prawdopodobne
kryterium Hurwicza (MaxMax) – skrajnie optymistyczna strategia, najlepsza jest największa wypłata
kryterium Walda (MaxMin) – największa spośród najgorszych wypłat. Gwarantuje najmniejszą stratę, maksymalizując przy tym zysk
DW pośredniczy między OLTP a OLAP
Cechy DW (wg. Inmona):
zorientowanie na temat
nieulotność – dane pozostają niezmienione
zintegrowanie – jednolitość danych
zmienność w czasie
Metadane:
metadane tabela_agregacji – lista wszystkich agregacji istniejących w hurtowni danych
Metadane Tabela mapa_kolumn – odwzorowania między kolumnami wyszczególnionymi w zapytaniu użytkownika a kolumnami dostępnymi w hurtowni danych
DW – klasy architektur:
scentralizowana – wszystkie dane w jednej DW. Mniejsza wydajność, ujednolicony model, prostszy projekt, budowa i konserwacja
federacyjna – fizycznie w różnych hurtowniach danych zlokalizowanych w jednym lub wielu systemach komputerowych
warstwowa – rzeczywista baza danych uzupełniana o kolejne poziomy lokalnych, tematycznych DW
Fakty sprzedaży:
sprzedawca – złożenie zamówienia
kierownik magazynu – pisemne polecenie wysłania zamówienia
księgowy – wystawienie faktury
Funkcje narzędzi ETL:
ekstrakcja (dostęp do różnorodnych źródeł danych)
czyszczenie (wykrywanie i rozwiązywanie niespójności danych źródłowych)
transformacje (np. pomiędzy różnymi formatami danych, językami)
ładowanie (wprowadzanie danych do DW)
replikacja (tworzenie kopii danych źródłowych w DW)
analiza
szybki transfer danych
kontrola jakości danych (kompletność i poprawność)
analiza meta danych
Źródła danych:
niewspółpracujące – bez mechanizmów automatycznego monitoringu i powiadamiania
współpracujące – z mechanizmami automatycznego monitoringu i powiadamiania
Metadane zawierają:
słowniki danych
informacje o przepływie danych
informacje o transformacji danych
numery wersji przechowywanych meta danych, informacje o modyfikacjach
statystyki użycia danych (profil danych)
nazwy nadane poszczególnym polom w DW
uprawnienia użytkowników
Metadane przechowuje się w wydzielonej bazie, do której mają dostęp pozostałe elementy DW
2 podejścia w modelu danych DW uwzględniającym zmiany w czasie:
podejście 1 – stare wartości atrybutów są zastępowane nowymi, nie ma konieczności przechowywania poprzednich wartości
podejście 2 – próba wiernego zapisu poprzedniej wartości atrybutów, stosuje się klucze zastępcze by zachować unikatowość klucza głównego
6 etapów cyklu życia DM (Metodologia CRISP – DM):
zrozumienie uwarunkowań biznesowych/badawczych
zrozumienie danych
przygotowanie danych
modelowanie
ewaluacja
wdrożenie
CRISP-DM jest procesem iteracyjnym i adaptacyjnym
Zadania data mining:
opis wzorców i tendencji tkwiących w danych
szacowanie (estymacja) czyli klasyfikacja, w której zmienna celu jest numeryczna a nie jakościowa
przewidywanie (predykcja) podobne do klasyfikacji i szacowania z uwzględnieniem założenia, że wynik dotyczy zawsze przyszłośći
klasyfikacja jest związana zawsze z jakościową zmienną celu
grupowanie rekordów, obserwacji lub przypadków w klasy podobnych obiektów. Nie ma tu zmiennej celu. Maksymalizowanie podobieństwa rekordów wewnątrz podzbiorów i minimalizacja podobieństwa rekordów spoza grupy
odkrywanie reguł – szukanie, które atrybuty rekordów są powiązane ze sobą. Szuka ilościowo określonej relacji razem z miarą wsparcia i dokładności lub ufności reguły
Metody modelowania:
nie nadzorowane
grupowanie
tworzenie reguł asocjacyjnych
nadzorowane
metody regresji
metody klasyfikacji (np. drzewa decyzyjne)
Przebieg modelowania nadzorowanego:
zbiór uczący model wstępny zbiór testujący poprawiony model eksploracji danych zbiór walidacyjny końcowy model eksploracji danych
Brak możliwości dokonania podziału węzła decyzyjnego:
zmienna celu jest jednowartościowa dla rekordów w tym węźle
różnorodne rekordy, ale mimo to się nie da dokonać podziału
Wsparcie reguł decyzyjnych – procent rekordów w bazie danych, które przypisane są do danego liscia
Ufność reguł decyzyjnych – procent rekordów w liściu, dla których reguła jest prawdziwa
Teoria podejmowania decyzji:
matematyczne podejście do teorii decyzji – poszukiwanie optymalnej decyzji odpowiadającej rzeczywistym warunkom
psychologiczna teoria decyzji – uwzględnianie predyspozycji i cech osobowych i pozaosobowych
naukowa metoda ustalania koncepcji decyzyjnych – ustalenie możliwości rozwiązania na drodze „od szczegółu do ogółu” i „od ogółu do szczegółu”
Metody podejmowania decyzji:
receptywne – dane każdemu przez naturę lub wykształcenie w procesie uczenia się np. metoda prób i błędów
asocjacyjne – intuicja człowieka, fantazja, pomysłowość, ciekawość, np. burza mózgów
zbierania i porządkowania – uporządkowane struktury lub pojęcia, np. drzewo decyzyjne
kombinowane – wszystkie elementy poprzednich, np. psychodrama
dedukcyjne – dążenie do logicznie uporządkowanych struktur
indukcyjne – nawiązują do rzeczywistości, ale są hipotezami np. eksperymenty
integratywne – elementy wcześniej omawianych, np. analiza wartości
różnicowane metody