wykłady, bazy danych Goluchowski-wyklady 2002


Wykłady Bazy danych dr J. Gołuchowski 16.02.2002-

Wykład nr 1 z dnia 16.02.2002

Baza danych- kolekcja danych odnosząca się do pewnego obszaru zainteresowań.

Baza danych dla informatyka-kolekcja zarządzana przez specjalistyczne oprogramowanie, system zarządzania bazą danych.

Oznaczenia:

baza danych- BD

system zarządzania bazą danych- SZBD

system bazy danych- SBD

BD+ SZBD= SBD

system informatyczny- SI

Pierwsze SBD- 60-te lata, hierarchiczne i sieciowe, w 70roku dr Codd opublikował artykuł o relacyjnych BD, przedstawił nową koncepcję BD- tabela lub zbiór tabel, z punktu matematycznego- zapisanie za pomocą relacji.

Dwa punkty widzenia relacyjnych BD (RBD):

Dzisiejsze BD- post relacyjne BD- wykraczają poza RBD z 70 roku, idą w kierunku obiektowości, temporalnych???, itp.

Dwa rodzaje SBD:

  1. SBD operacyjnych- stanowią podstawę systemów transakcyjnych.

transakcje- zbiór operacji, mają własność atomowości - zachodzi relacja w całości lub nie zachodzi w cale.

  1. SBD analitycznych- stanowią podstawę systemów analitycznych, hurtowni danych, OLAP.

OLAP, OLTP- odnoszą się do sposobu użytkowania SBD i interfejsu SBD

OLAP- interakcyjny system przetwarzania danych

Można korzystać z OLAP i OLTP w dwóch trybach:

  1. interakcyjny- gdy użytkownik zleca wykonanie pewnych działań w toku dialogu z SBD, za pomocą pewnych narzędzi.

  1. programowany- gdy zbiór narzędzi, poleceń jest przedstawiony na początku w postaci pliku, skrypty w trybie skompilowanym lub interpretowanym.

Oracle, Informix, Microsoft SOL serwer

System dedykowany- interfejs zaprojektowany do konkretnego SBD przez producenta.

System uniwersalny- interfejs ukierunkowany dla dowolnych BD.

  1. Narzędzia profesjonalne- Oracle, Informix, SQL.

  1. Narzędzia końcowego użytkownika- Access.

Systemy homogeniczne- Oracle serwer BD + Access- tu napiszemy oprogramowanie,
Banachowski „Projektowanie BD”

Motor BD, serwer BD, silnik BD

Architektury przetwarzania danych:

(jak, gdzie są przechowywane dane)

  1. Budowa BD.

  1. Budowa programów, aplikacji obsługujących BD.

Ewolucje SBD w kierunku niezależności:

1.

Najprostszy program w Basic, dane i metody są zaimplementowane w programie.

dane

Model

metoda

kompilacja- tłumaczenie w całości i dopiero wykonanie.

interpretacja- tłumaczenie każdego polecenia i uruchomienie i dopiero następne.

2.

powstał

model

Metoda

aby nie zmieniać programu przy zmianie danych, dane zostały zapisane na dysku. Ten sposób nadal miał wady, zmiana struktury danych nadal wymagała zmiany programu.

Model danych- sposób interpretacji danych.

Program w Cobol-u- 4 części:

  1. Dział identyfikacja programu.

  1. Dział opisu środowiska.

  1. Dział danych (zawiera model danych)

  1. opis danych, plików,

  1. opis pamięci, komórek roboczych.

  1. Dział procedur- opisuje algorytmy.

SBD- przechowuje model fizyczny BD i udostępnia je użytkownikom w postaci modelu logicznego, pośredniczy.

W programie musi zostać interfejs użytkownika-logika działania programu, model działania programu, logika.

Na zewnątrz można wyrzucić:

Modyfikacja BD- to zmiana opisu.

Wykład nr 2 z dnia 23.02.2002

Sposoby traktowania BD:

Zagadnienia odwzorowania wiedzy o dziedzinie przedmiotowej:

Inżynieria wiedzy (modelowanie rzeczywistości):

Etapy tworzenia BD:

  1. Analiza mini świata- konstrukcja modelu konceptualnego mini świata.

  1. Transformacja modelu konceptualnego do modelu relacyjnego.

  1. Normalizacja modelu danych.

  1. Wybór struktur logicznych i fizycznych.

  1. Strojenie systemu (system tuning).

Architektura logiczna systemu baz danych:

Są tu dwa ujęcia:

  1. Ujęcie ANSI/SPARC:

  1. zewnętrzny,

  1. konceptualny,

  1. wewnętrzny.

  1. Ujęcie innego modelu:

  1. konceptualny,

  1. logiczny,

  1. fizyczny.

  1. zewnętrzny- użytkownika, może być wyrażony za pomocą konceptualnego lub logicznego, np. BD- mężczyźni i kobiety, dla policji będzie istotna ze względu na ilość przestępców, a dla producenta odzieży ważna będzie ze względu na liczbę urodzin. Są to dwa różne spojrzenia zewnętrzne na tą BD:

d) konceptualny- poziom na którym zdefiniowany jest model świata w kategoriach pojęciowych użytkownika.

  1. poziom wewnętrzny- służy do niezawodnego i trwałego przechowywania fizycznych danych:

Powiązania:

Między nimi pośredniczy logiczny.

e) logiczny:

Ujęcie relacyjne.

Schemat relacyjny (relation schema)- zbiór nazw atrybutów, nagłówków tabeli, związków pomiędzy danymi a atrybutami:

Schemat relacji: atrybuty + zależności między danymi

Związki zależności między danymi:

Zależności funkcyjne:

Klucze główne:

Anomalie BD nieznormalizowanych:

Modele świata:

Po co tworzymy BD?:

Wyrażanie wiedzy o świecie rzeczywistym w języku naturalnym:

Język- zbiór znaków opisujących świat.

Syntaktyka języka naturalnego- prawidłowe słowotwórstwo.

Syntaktyka języka programowania- zasady tworzenia zdań, zasady gramatyczne.

Semantyka- znaczenie znaków, określa reguły znaczeniowe, zależności między znakami języka, a elementami rzeczywistości.

Pragmatyka- reguły stosowania wyrażeń językowych, zależności między znakami, a ich użytkownikami.

Kategorie składniowe (syntaktyczne):

  1. Zdania:

  1. Nazwy:

  1. Funktory- służą do tworzenia z wyrażeń elementarnych, wyrażeń złożonych.

Pojęcia i rzeczywistość:

Wykład nr3 z dnia 01.03.2002

Zaliczenie:

  1. praktyka- zaliczenie z ćwiczeń,

  1. teoria- na przedostatnim wykładzie, 10 pytań, w tym jedno z normalizacji.

Postacie normalne:

  1. 1 postać normalna- relacja jest w 1PN jeśli każdy jej atrybut ma wartości atomowe (i każdy atrybut niekluczowy jest funkcjonalnie zależny od klucza głównego (.

  1. 2 postać normalna- relacja jest w 2PN jeśli jest w 1PN i każdy jej atrybut niekluczowy jest w pełni funkcjonalnie zależny od klucza głównego.

  1. 3 postać normalna- relacja jest w 3PN jeśli jest w 2PN i każdy jej atrybut niekluczowy jest bezpośrednio, i nie przechodnio zależny od klucza głównego.

Przykład BD:

NazwiskoImię

Adres

Książka

DataWypożyczenia

Urban

Warszawa Wiejska

Marks Kapitał

22.07.80

Urban

Warszawa Wiejska

Goebells Pamiętniki

13.12.81

Jaruzelski

Warszawa Belwederska

SunSu Sztuka wojny

13.12.81

Wałęsa L.

Arłanow Oś. wyp. WP

Słownik języka polskiego

14.12.81

Wady BD:

  1. Redundancja- powtarzanie, gromadzenie ponowne tych samych danych, np. jeżeli chcielibyśmy wpisać następną książkę Urbanowi to musielibyśmy wpisać jeszcze raz każdą jego daną.

  1. Anomalia dołączania- wadą jest to, że musimy wpisywać wszystko albo nic, np. przychodzi Wałęsa, ale nic nie pożyczył więc nie możemy go wpisać, tym samym nie możemy zapisać jego wizyty.

  1. Anomalia automatyzacji- np. przychodzi Urban w czerwcu 1981 i z Wiejskiej przeprowadza się na Śliską, zmieniamy więc mu pierwsza pozycję i nagle zbrakło prądu. Reszta pozycji pozostała niezmieniona i powstała niezgodność w adresie. Jest pewna niespójność, sprzeczność.

  1. Anomalia usuwania- np. Mazowiecki zarządził, że odkreślamy wszystko, co było pożyczone przed 13.12.81, włącznie z 13.12.81. Wtedy tracimy wszystkie dane, np. te, że Urban i Jaruzelski buło w bibliotece.

  1. Redundancja.

  1. Anomalia dołączania.

  1. Anomalia aktualizacji.

  1. Anomalia usuwania.

Przykład trudności z atrybutem atomowości.

  1. Janusz Marek- mamy problem z interpretacją, jeśli nie rozbijemy to na dwie kolumny Imię i Nazwisko.

  1. Adres- zapisany w jednym polu może być wpisany w dowolnej kolejności (ulica dom, miasto itp.), można też z góry podzielić na kilka kolumn. (problem z wpisaniem numeru domu np. 23/24 lub 23 lub 24a lub 13/24 m. lub mieszkania 4).

  1. Przykład z hurtownią alkoholi- wódka oznaczana jako V, a wino jako W. Za V oznaczamy także alkohole wysokoprocentowe (powyżej 18%). Jeśli przyjdzie nam wino 20% to mamy problem ponieważ powinno figurować zarówno w V jak i W. Inny problem w takiej hurtowni to zarządzenie ministra, który zażądał sprawozdania sprzedaży alkoholi w przeliczeniu na alkohol 100%.

Wykład nr 4 z dnia 15.03.2002

(08.03- była wycieczka)

Modele

Cele tworzenia modeli organizacji gospodarczej w procesie informatyzacji:

Model- uproszczony obraz świata.

Zasady redukcji złożoności (kierowania złożonością):

Hasło wykładu:

Czy moglibyśmy czuć się szczęśliwi, gdy chociaż raz w całym życiu nie byliśmy nieszczęśliwi?”

dr J. Gołuchowski

Klasyczne podejścia do modelowania organizacji gospodarczej:

Nowe podejścia:

Dwa „Wielkie Kaniony” tworzenia BD:

  1. Problem:

  1. Rozwiązania:

Obiekty:

XXŕ kobieta, żona, matka, studentka, pracownik.

Nazwa:

Pogadanka o prawdzie, k... i takich tam.

Budując BD i BW stosujemy analizę języka.

To co w BD to nie informacja ale rzeczywistość.

Jeśli mężczyzna powie o kobiecie, że jest k..., to czy powiedział prawdę, czy wyraził swój stosunek?

Czym jest prawda? Prawda- opis świata, zgodność z rzeczywistością,

Jest jedna prawda czy wiele? Jedna!!!

(cytat z gazety: „Prawda jest jak dupa, każdym ma swoją”)

Wykład nr 5 z dnia 22.03.2002

Przykład

Zbudować model BD obsługujący sprzedaż i zapłaty (rozliczenia z dostawcami i odbiorcami), sprzedaż jest prowadzona przy kasie (telemarketing), gotówka dla małych klientów, dla stałych możliwość przelewu i kredytu, jest to hurtownia spożywcza, dołączyć magazyn (podział na produkty o krótkim i długim terminie spożycia).

Najpierw tworzymy listę:

  1. Rozl_z_dost

  1. Roz_z_odb

  1. Magazyn

  1. Sprzedaż

  1. Dostawcy

  1. Odbiorcy

  1. Artykuły

Mechanizm prezentacji powiązania obiektów.

  1. Reprezentacja węzłowa.

obiekt- prostokąt

powiązanie- linia

0x08 graphic
-obiekt podstawowy

-obiekt złożony

Model związków encji

Kryteria wyłączania obiektów:

  1. Jeśli inny jest zbiór argumentów (musi się różnić co najmniej jednym atrybutem, a nie wartością).

  1. Przyczyny technologiczne (inne produkty dla kobiet i mężczyzn).

Pogadanka na różne tematy.

Gdybyśmy mieli Adama i Ewę Rajskich, możemy przyjąć płeć za cechę stałą, konstytutywną, która dzieli na klasy. Jednak gdy Ewa zmieni płeć (oczywiście po osiągnięciu pełnoletności) to będą problemy (zgon, data urodzenia). Płeć może być także wartością atrybutu, np. obiektu Osoba.

Kilka tekstów pod adresem kobiet, równouprawnienia i historyjka o ustępowaniu miejsca młodszym kobietom.

Powrót do naszego przykładu.

  1. Utworzenie listy.

  1. Porządkowanie listy.

  1. Ustalenie obiektów, atrybutów, związków, wartości, O,A,Z,W.

Rozl_z_dost

Z

Roz_z_odb

Z

Magazyn (stan magazynu)

O,A,Z

Sprzedaż

Z

Dostawcy

O

Odbiorcy

O

Artykuły (towary)

O

Magazyn traktujemy jako stan magazynu, a nie jako budynek (można jako budynek gdyby było ich kilka). Można go traktować jako:

  1. jeśli interesują nas ilości, a nie ceny (wszystkie ceny zakupu są równe, jedna cena ewidencyjna).

O- (klasa obiektu) gdy jest jeden magazyn, lub jest jeden towar w magazynie, ceny ewidencyjne są różne, czyli ceny zakupu.

Z- gdy są np. 2 magazyny i 2 towary i są między nimi związki

Faktura:

Rejestr faktur Rejestr pozycji faktur

1 ----------- N

Wykład nr 6 z dnia 29.03.00

Modelowanie

Modele przepływu danych (procesów realizowanych w przedsiębiorstwie)

Easy Case 4.0 (3.0 Case dla ludzi)

Podejście procesowe

Zarządzanie zasobami (TQM- Total Quality Management) MRP, MRPII, ERP)

Podstawowym zasobem firmy jest wiedz w postaci procesów, najpierw modyfikować procesy a potem zasoby.

Cel zastosowania technologii WORKFLOW

Elastyczne rozwiązywanie problemów, dostosowywanie przedsiębiorstwa do zmian otoczenia.

Formy usprawnień organizacji:

Korzyści integracji prac za pomocą technologii WORKFLOW:

Przedmiot koncentracji zainteresowań informatyków w przedsiębiorstwie:

Systemy zarządzania dokumentami

Zarządzanie wiedzą:

  1. Systemy ekspertowe (wnioskujące),

  1. Internet.

  1. Systemy BD

Jak zarządzać wiedzą:

  1. Wspomagać indywidualnego użytkownika.

  1. Rozwiązywać problemy na poziomie jego grupy.

  1. Poziom organizacji i wiedzy organizacji

Hurtownie danych (BD analityczne)

Zbiór wiedzy gromadzonej w uporządkowany sposób.

Systemy wspomagania organizacji

Systemy wspomagania organizacji, docelowe

  1. Zintegrowane systemy zarządzania zespołową pracą, administrowania oraz analizy tych prac pod kątem:

  1. Zintegrowane przetwarzanie umożliwiające:

Narzędzia realizacji celów

Czym jest praca? Jak opisać pracę (procesy)?

0x08 graphic
0x08 graphic
PRZEPŁYW PRAC

Jawny i formalny opis procesu gospodarczego

Miejsce procesów gospodarczych w przedsiębiorstwie:

  1. Procesy materialne- łączenie (wytwarzanie) składników materialnych i dostarczanie produktów.

  1. Procesy informacyjne- tworzenie, przetwarzanie, zarządzanie i dystrybucja informacji.

  1. Procesy gospodarcze- zorientowane na klienta czynności informacyjne i/lub materialne.

Fazy komunikacji wykonawca - klient:

  1. Propozycja.

  1. Uzgodnienie dostarczanej usługi.

  1. Dostarczenie usługi.

  1. Akceptacja.

Rodzaje przepływów prac:

  1. Wykonanie samodzielne przez człowieka.

  1. W pełni zautomatyzowane.

  1. Wykonane w interakcji.

Metodologie modelowania przepływem:

  1. Zorientowane na komunikację.

  1. Zorientowane na działanie.

Przykład fragmentu procesu

0x08 graphic
0x08 graphic
0x08 graphic
otrzymuje zasoby i dok (wy) wymaga

0x08 graphic
Klient

0x08 graphic
0x08 graphic
dostarcza zasoby i dok(we) wymaga

Protoplasci koncepcji procesów gospodarczych (przepływ prac):

Zadania związane z procesami:

0x08 graphic
0x08 graphic
przygotowanie negocjacje

0x08 graphic
klient Pętla WORKFLOW wykonawca

0x08 graphic
0x08 graphic
0x08 graphic
akceptacja realizacja

Wykład nr 7 z dnia 05.04.2002

Diagramy przepływu danych

Diagramy przepływu danych- graficzny obraz procesów, które mogą być w części lub całości zautomatyzowane.

Składa się z 4 części:

  1. Obiekty zewnętrzne.

  1. Magazyny danych.

  1. Procesy.

  1. Przepływy danych.

Ad.1. Obiekty zewnętrzne.

Reprezentują źródła danych lub miejsca przeznaczenia (odbiór i dostarczanie informacji).

Ad.3. Procesy.

Odpowiadają składnikom systemu, które operują danymi. Otrzymują dane i operują nimi. Proces- program, procedura lub operacja ręczna- księgowanie.

Ad.4. Przepływy danych

Strumienie informacji przepływające między dostawcami i odbiorcami (2 obiekty). Na schemacie- linie ze strzałkami. Informacje przepływu od obiektu do procesu, od procesu do składnic.

Model logiczny- reprezentuje zasadnicze funkcje.

Model fizyczny- reprezentuje zasadnicze funkcje, a także szczegóły dotyczące implementacji.

Encje:

Diagram historii życia obiektów:

  1. Podejście strukturalne:

Zdarzenia:

II. Podejście obiektowe

1. Diagram klas i obiektów

Metoda OMT- tworzy się diagramy klas i obiektów, które służą do reprezentowania części składowych systemu i związków między nimi. Każdy obiekt to element dziedziny posiadający:

Klasa- wzorzec grupy obiektów, składa się z atrybutów i operacji.

Atrybuty- opisują obiekty klasy.

Metody- opisują operacje na atrybutach, polach.

Klasy- mogą występować w związku ze sobą. Związek istnieje gdy obiekty jednej z klas są powiązane z obiektami pozostałych klas.

Rodzaje związków:

  1. Generalizacja.

  1. Specjalizacja.

Specjalizacja jest rodzajem generalizacji. Generalizacja jest zatem uogólnieniem specjalizacji, może mieć wiele specjalizacji i odwrotnie.

Związki mogą być oznaczone krotnością. Krotności mogą być różnie oznaczone:

Związek opisujemy używając:

Rodzaje związków:

Obiekty mogą współdziałać ze sobą z pomocą komunikatów. Komunikat oznacza żądanie wykonania jednej z metod tej klasy (powoduje wywołanie metody). Komunikat może być wywołany przez obiekt, system zewnętrzny lub obiekt wewnętrzny (danej klasy). Wywołanie komunikatów może wiązać się z wysłaniem lub przesłaniem komunikatu.

Nazwa komunikatu = nazwa metody

2. Diagram interakcji

Diagram interakcji- opis komunikatu, scenariusz przepływu komunikatu między obiektem a systemem i\ lub obiektami rzeczywistymi. Opisuje sposób w jaki obiekty współpracują ze sobą w celu zrealizowania funkcji systemu, lub sposób realizacji procesu (złożonej metody). Informacje mogą być opisane za pomocą tekstu, opisujące czynności- skrypt.

3. Diagram przejść

Diagram przejść, transformacji stanów- służy do prezentowania zmiennych w czasie aspektów (dynamicznych); są to:

Diagramy obiektowe uzupełniają się specyfikacją, na nią składa się:

Klasyfikacja klasy:

Metody klasyfikuje się podając (klasyfikacja):

Opis zdarzeń???:

Proces tworzenia modeli obiektowych:

Dziedziczenie- wspólne własności klas obiektów podrzędnych, mogą być opisywane na poziomie klasy nadrzędnej i traktowane jako dziedziczne.

Wykład nr 8 z dnia 12.04.2002

Wykład nr 9 z dnia 19.04.2002

12 nie byłem ale Piter był nr 8, 7 05.04mam ale nie przepisałem

SQL

Podstawy języka BD:

  1. Algebra relacji.

  1. Rachunek predykatów.

algebra - określony zbiór na którym można wykonywać działania

A=<A,F>- nie wyprowadzają wartości poza zbiór

Grupy operacji:

  1. Zwyczajne działania algebry zbirów: suma, przecięcie (część wspólna), różnica.

  1. Operacje zawężania: selekcja, rzut (rzutowanie).

  1. Operacje komponowania krotek z innych krotek pochodzących z innych relacji np. iloczyn kartezjański.

  1. Operacje przemianowania- nie zmieniają krotek relacji ale jej schemat: nazwę atrybutu i/lub nazwę relacji.

Język zapytań buduje się z wyrażeń algebry.

Relacje można stosować gdy:

  1. Schematy relacji R i S są tego samego typu- identyczne zbiory atrybutów.

  1. Atrybuty w relacji S i R mają ten sam porządek (i schemat).

Przykład sumy relacji: podsumowanie miesięczne sprzedaży.

Przykład przecięcia relacji: towary kupione przez danych klientów.

Rzutowanie

Z operacji rzutowania korzysta się przy tworzeniu nowej relacji powstałej przez usunięcie z relacji pierwotnej pewnych kolumn.

klient

Towar

ilość

cena

A

B

1

1

A

A

2

2

B

B

1

1

B

C

2

2

Jakie towary w ogóle sprzedano w tym miesiącu?

Sprzedaż - relacja towary sprzedane, niepowtarzalne.

Klienci w miesiącu X.

Ceny w miesiącu X.

Proszę sobie zrobić to samemu, przecież to takie proste.

Hasło wykładu:

„Wszystko jest takie proste ale bardzo skomplikowane”

Selekcja

Trzeba zbudować operator selekcji. W wyniku selekcji w operacji pierwotnej powstaje nowa relacja do której należą krotki spełniające warunki selekcji (są różne ale spełniają warunki selekcji). Nie zmieniają typu. Operator łączy atrybut z pewną stałą lub atrybut z atrybutem. Np.: selekcja towarów o cenie powyżej 20.

Wszystkie atrybuty muszą wystąpić, bo nie zmieniają typu!!!

Selekcja może być połączona z rzutowaniem, selekcja + wymienienie atrybutów.

Rzutowanie a projekcja to, to samo.

Można też budować operacje na operacjach wtórnych

Iloczyn kartezjański

A= {1,3}

B= {2,4}

Zbiór wszystkich par uporządkowanych takich, że pierwszy element należy do zbioru A, a drugi do zbioru B.

12, 14, 32, 34

Przykład: „Każdy z każdą na prywatce”

Złączenie naturalne

R><S (R muszka S)- polega na połączeniu 2 krotek z relacji R i S, które mają identyczne wartości dla określonych atrybutów (atrybuty nie muszą występować w obu relacjach). Np. „Dalej prywatka, są kobiety i mężczyźni i dodatkowo dzielimy ich na umiejących tańczyć poloneza i walca. Proszę to sobie zrobić i zacząć myśleć. Kobity, zaczęłyście już myśleć?”

Złącze teta Ř

Mamy relacje R i S, wynik złączenia Ř R>< ŘS definicja:

„Proszę sobie zrobić przykład”

Predykat- funkcja składająca się z nazwy predykatu i atrybutów. Dla każdego predykatu liczba argumentów jest ustalona. Zapis predykatów z atrybutami- atom.

Selekcja- można podać predykat z atrybutami, albo za pomocą reguł.

Wykład nr 10 z dnia 26.04.2002

(pierwszy po świętach)

Więzy integralności

Integralność- zapewnia zgodność ze światem zewnętrznym. Jedna z ważniejszych cech BD, odpowiada czy BD jest dobrym odbiciem, odwzorowaniem rzeczywistości.

Integralność zapewnia się poprzez dobry schemat i węzy integralności. Integralność jest kontrolowana przede wszystkim przez więzy integralności, które mogą być wbudowane w schemat lub definiowane przez administratora. Definiowane więzy integralności to reguły, w jaki sposób BD ma być odbiciem rzeczywistości.

Więzy integralności:

  1. statyczne (niezmienniki stanu)- używane do sprawdzenia czy wykonywane operacje nie zmieniają stanu bazy w stan nieprawidłowy; wprowadzają ograniczenia na stanie BD np.: ograniczenie, że studenci mogą zaliczać tylko te przedmioty, które są i przypisane; zapobiegają powstawaniu nieprawidłowości, przejściu BD do nieprawidłowego stanu.

  1. dynamiczne (więzy przejść)- wyróżnia się w nich więzy temporalne (czasem dynamiczne i temporalne traktuje się tak samo); są to reguły, które wiążą kolejne stany BD; przejście jest zmianą stanu BD i musi być reprezentowane przez kilka słów; warunkują przejścia ze stanu S1 do S2.

Więzy relacji (inne spojrzenie)- więzy klucza, nakładane na klucz, nakładane na krotkę, nakładane na relację, nakładane na związek relacji.

Więzy integralności referencyjnej (szczególny przypadek)- integralność referencyjna nadaje sens związkom obiektów; wymaga ta reguła, aby istniał obiekt B jeśli jest on połączony z obiektem A- jest to istotne zwłaszcza dla kluczy obcych.

Więzy integralności- mogą być definiowane w algebrze relacji i SQL.

Proszę sobie przeczytać to w książce, aby zobaczyć jak są zdefiniowane więzy integralności w algebrze relacji i SQL, oraz DATALOGO- język predykatów

II System transakcji

BD musi być spójna, integralna, więc każda operacja, która narusza spójność musi być anulowana. Dlatego wprowadza się pojęcie transakcji i transakcji.

Transakcja- pewne zdarzenie, które powoduje zmianę stanu BD. Nowy stan BD jest ustalony poprzez wprowadzenie nowych danych do BD. Realizacja transakcji jest więc powiązana z integralnością, ale także transakcje mają tę wartość, że mogą być definiowane przez administratora, programistę i użytkownika, główne w systemach z wieloma użytkownikami. To przejście w inny stan musi być realizowane przez procedurę. Transakcja jest więc pewną procedurą jaką wykonuje użytkownik lub SBD.

Dwa typy transakcji:

  1. Aktywne- zmieniają stan BD (wprowadź, usuń, zaktualizuj).

  1. Bierne, pasywne- nie powodują zmianę stanu BD, są związane z realizacją zapytań do BD.

Moduł zarządzania transakcjami OLTP (monitor transakcji)- ten moduł różni się od modułu OLAP (moduł interakcyjnego przetwarzania danych?)

Transakcje:

  1. Realizowane wsadowo (wsadowe)- bez udziału użytkownika.

  1. Interakcyjne (realizowane przez OLTP)- realizowane na bieżąco, ich cechą jest koordynacja zmian BD, dokonywana przez wielu użytkowników.

  1. Długie- ten charakter maja operacje wyszukiwania w bardzo dużych BD (długi czas).

  1. Rozproszone- transakcje, które wykonywane są na kilu komputerach np.: 3 użytkowników musi wprowadzić dane, aby transakcja mogła być wykonana.

Pogadanka na temat historii:

OLAP- 93 rok

Technologia BD znana od lat 70- tych

Nie analizujcie historii, bo będziecie za dużo rozumieli

ACID- cechy transakcji:

Własność:

  1. niepodzielności- procedura składająca się ze zbioru akcji, a monitor ma zapewnić, że albo wszystkie akcje będą realizowane, albo żadna- atomowość.

  1. spójności- wszystkie transakcje muszą zapewniać spójność BD, a więc operacje modyfikujące nie powinny pozostawiać BD w stanie niespójnym np.: nie mogą być 2 rezerwacje na 1 miejsce.

  1. izolacji- jeśli transakcja modyfikuje dane wspólnie użytkowane, to takie dane mogą być tymczasowo niespójne, ale takie dane muszą być niedostępne dla innych transakcji, dopóki transakcja nie zakończy ich używać. Izoluje je monitor transakcji.

  1. trwałości- po zakończeniu transakcji, zmiany powinny być utrwalone.

Przykład

Na moje konta 100$ jednocześnie są wysłane 2 przelewy- 50 i 100$.

Atomowość- ponieważ przelewy były jednoczesne to może się zdarzyć, że 100$ zostanie zapisanych na miejsc 50$- wysłanie 50$ oznacza dla wysyłającego, że odjęto mu ale nie zapisano u nas, atomowość- przelew 50$ powinien odbyć się w całości albo wcale.

Niespójność- przelew 50$ odczytał stan konta 100$ i przesłał (mam 150$) ale przelew 100$ również odczytał 100 i zapisał drugie 100$ nie uwzględniając 50$. Mam więc tylko 200$ a nie 250$.

Izolacja- zostało przesłane 100$ i zaraz, podczas zapisania idzie od razu 50 i jest zapisane. Mam więc tylko 150$ a nie 250$.

Trwałość- doszły dwa przelewy prawidłowo, ale awaria prądu przed zapisaniem na dysk i pozostaje mi tylko znowu 100$.

Kontrola współbieżności

Kontrolę można przeprowadzić za pomocą blokad systemowych realizowanych przez SBD, przez monitor transakcji. Blokady mogą dotyczyć pliku (relacji), rekordu, pola. Rezultatem blokowania dostępu do zasobów jest szeregowanie, kolejkowanie dostępu

Blokady:

Zakleszczenie (dead lock)- 2 transakcje chcą dostęp do wspólnego zasobu i mają informacje potrzebne sobie nawzajem, w efekcie żadna nie może być kontynuowana.

3 stany transakcji- operacje:

  1. Operacja potwierdzenia- stan potwierdzony, comit, zmiany na stałe.

  1. Operacja cofnięcia- usunięcie wszelkich zmian wprowadzonych przez akcje składające się na transakcję, rollback, cofnięcie zmian przez użytkownika.

  1. Operacja samo cofnięcia- operacja wbudowana w SBD, w której transakcji zapisujemy warunek...- rollback lub break- tu zmiany cofa system, a nie użytkownik.

Wyzwalacz operacji- procedura, która jest bezpośrednio przypisana do tabeli, relacji i która jest automatycznie uruchamiana przez dane zdarzenie np.: w systemie zarządzania magazynem dokonujemy operacji sprzedaży, to po niej automatycznie wyzwalana jest procedura, która wysyła zamówienie do dostawcy, kiedy stan jest mniejszy od minimum- supermarkety i uzupełnianie towarów- ci co układają puszki na półkach nie biegają i nie sprawdzają stanu ale otrzymują informację gdzie trzeba uzupełnić.

Proszę niech sobie Państwo poczytają o tym.”

Wykład nr 11 z dnia 10.05.2002

Systemy rozproszone BD.

BD operacyjne i analityczne

Rozproszenie BD

Dla użytkowników BD rozpraszalność lub scentralizowanie nie powinny być dostrzegalne. Poziom transparencji.

To problem projektanta i administratora BD. Lata 90 cechują się rozwojem idei rozproszonych BD i ich realizacji w postaci różnych systemów BD. Rozproszone systemy BD to system BDS, w którym występuje rozłożenie BD poprzez ich fragmentaryzację (podział) lub replikację w różnych systemach sprzętowych i programistycznych, rozmieszczonych na ogół w różnych geograficznie miejscach organizacji.

Rozproszenie:

  1. Na poziomie logicznym 1 baza danych.

  1. Na poziomie fizycznym- rozproszona.

Fragmentaryzacja lub replikacja

Środowisko sprzętowe może być jednorodne lub różnorodne.

Rozproszenie geograficzne.

O systemach rozproszonych mówi się wtedy, gdy są na 1 systemie komputerowym ale podzielonym- baza rozproszona.

Fragmentaryzacja BD:

Replikacja:

Możemy też mówić o rozproszeniu funkcji BD (system typu klient- serwer)- systemy z rozproszonymi funkcjami.

Przezroczystość

1

16



Wyszukiwarka

Podobne podstrony:
Podstawy Informatyki Wykład XIX Bazy danych
ssciaga, Studia PŚK informatyka, Semestr 4, Bazy Danych 2, Bazy Danych Zaliczenie Wykladu, Bazy Dany
13 Bazy danych obiektowość wykładid 14617
Bazy Danych, STUDIA, SEMESTR III, Bazy Danych, Wykład
2 Bazy danych projektowanie wykład
bazy danych wyklad1 id 81713 Nieznany (2)
WYKLAD I - wprowadzenie modele baz danych, Uczelnia, sem V, bazy danych, wyklad Rudnik
BAZY DANYCH Streszczenie z wykładów (2)
3 Bazy danych SQL cz 1 wykład
Bazy danych - podstawowe kroki w projektowaniu cz 2 - wyklady, Zajęcia z Baz Danych - MS Access, cz
Bazy danych - podstawowe kroki w projektowaniu cz 2 - wyklady, Zajęcia z Baz Danych - MS Access, cz
13 Bazy danych obiektowość wykład
Bazy Danych wykład
wyklad kolos sciaga, POLITECHNIKA ŚLĄSKA Wydział Mechaniczny-Technologiczny - MiBM POLSL, Inżyniersk
10 Bazy danych obiektowość wykład
3 Bazy danych SQL cz 2 wykład
pierwsza czesc wykladu, SiMR, Inżynierskie Bazy Danych, IBD 2koło, od żółwia, od żółwia, Bazy danych
3 Bazy danych SQL cz 2 wykład

więcej podobnych podstron