Bazy danych - wyk, POLITECHNIKA ŚLĄSKA Wydział Mechaniczny-Technologiczny - MiBM POLSL, Inżynierskie, Semestr 3, Bazy danych, Od starosty, BAZY DANYCH, BAZY DANYCH x, wyklad


Encja - każde zjawisko lub stan, który potrafimy nazwać, odróżnić od innych obiektów. Ma ona atrybuty.

Atrybut - cecha encji, która wynika z jej natury, dający się wyrazić liczbami lub prostymi wyrażeniami.

Ograniczenia programów dedykowanych - separacja danych - użytkownik 1 systemu nie ma dostępu do danych zapisanych w plikach o formacie właściwym dla innych programów. Tym samym niemożliwe jest bezpośrednie przeniesienie danych z jednego programu do drugiego;

- redundancja danych - rozumowe wielokrotnie powtarzanie się danych opisujących te same obiekty (wady: potencjalne źródło niespójności danych, zwiększone zapotrzebowanie na pamięć, znaczne wydłużenie czasu przetwarzania danych, format danych zapisany jest bezpośrednio w programie, każda aktualizacja powoduje konieczność zmian w programie);

- niekompatybilne formaty danych - pliki z danymi zapisywane przez programy napisane w różnych językach programowania przy tej samej strukturze mogą mieć różną postać fizyczną

- zamknięty zbiór zapytań

Postacie B.D.

B.D.(fizyczna) B.D.Pojęciowa(logiczna)

Pliki,rekordy → definicje →(prerspektywy) →

Perspektywy - rekordy udostępniania użytkownikom informacji uzyskanych z danych zawartych w B.D.

Zalet systemu B.D.: a)kontrolowanych dostęp do danych: - system zabezpieczeń (użyt. nie ma dostępu) - system kontroli integralności danych (kompletność i formalna poprawność danych); - w ramach baz danych istnieją mechanizmy, które zapewniają możliwość współdziałania danych. Mechanizmy te zawierają np reguły rozwiązywania konfliktów przy jednoczesnych żądaniach aktualizacji danych, wyświetlania czy usuwania; - wbudowane mechanizmy odtwarzania stanu systemu sprzed awarii

b) wbudowane mechanizmy perspektyw;

c) wbudowane języki zwiększają wydajność pracy programistów

Wady B.D.: a) złożoność - występuje wiele funkcji, z których nie korzysta się nigdy w niektórych zastosowaniach;

b)rozmiar - ze względu na swoją złożoność, systemy zarządzania B.D. zajmują zawsze więcej pamięci niż dedykowane programy do przetwarzania danych; c)ze względu na swoją złożoność systemy zarządzania B.D. miały najczęściej wydajność niższą niż dedykowane oprogramowanie; d)ze względu na większą objętość oprogramowania i niektóre wbudowane funkcje związane z zabezpieczeniami systemu zarządzania B.D. mogące wymagać sprzętu komputerowego o znacznie wyższych parametrach nie były potrzebne w innych przypadkach.

Zalety oprogramowania dedykowanego: a) możliwość optymalizacji ze względu na rozmiar i/lub szybkość działania;

b)trwała integracja z innymi modułami oprogramowania.

Role użytkowników baz danych: a)użytkownicy (naiwni) mają dostęp do B.D. wyłącznie za pośrednictwem perspektyw;

b)programiści aplikacji - realizują poszczególne perspektywy z wykorzystaniem języka DML;

c)administrator - definiowanie postaci B.D., modelu logicznego oraz przydzielenie uprawnień poszczególnym użytkownikom

Przesłanki architektury systemu a)wszyscy użytkownicy powinni mieć dostęp do tych samych danych;

b)perspektywa konkretnego użytkownika może być modyfikowana w konkretny sposób co nie wpływa na perspektywy pozostałych użytkowników;

c)żaden użytkownik nie musi dysponować wiedzą o fizycznej strukturze B.D. (+użytkownik nie może danych popsuć lub usunąć; - użytkownik nie musi mieć wiedzy o miejscu i postaci zbioru z danymi) 3-poziomowa architektura systemu B.D.: 1użytkownicy naiwni; 2poziom pojęciowy - model logiczny B.D., atrybuty, rozwiązania; 3schemat wew.,model fizyczny B.D.,tu wiadomo gdzie zapisano dane.

Elementy modelu CIN: - jest on niearchaiczny;

-planowanie technologii;

-planowanie wykorzystania elementów:

-analiza technologii,

-analiza zamówień;

-poziom wykorzystania produkcyjnego;

-stanowiska robocze.

Trójpoziomowa architektura ANSI-SPARC

Powody wprowadzenia:

-wszyscy użytkownicy powinni mieć dostęp do tych samych danych;

-żaden z użytkowników nie musi znać fizycznej budowy B.D.;

-modyfikacje perspektyw dowolnych użytkowników nie ulegają zmianom przy modyfikacji perspektyw innych użytkowników

Na poziomie pojęciowym znajduje się model logiczny B.D., który najczęściej jest zapisywany w postaci diagramów. W poziomie zewnętrznym umieszczany jest szereg perspektyw użytkowników. Na warstwie fizycznej znajduje się fizyczny model B.D. pomiędzy warstwą zew i wew występuje logiczna niezależność danych, a pomiędzy warstwą pojęciową i wewnętrzną występuje fizyczna niezależność danych. W warstwie zewnętrznej można umieścić dane przetworzone z warstwy pojęciowej. Poszczególne perspektywy dają wyniki danych.

Zadania B.D. ANSI-SPARC -gromadzenie, udostępnienie i aktualizacja danych;

-system musi umożliwić współdziałanie danych (jednoczesne przeglądanie danych przez wielu użytkowników oraz rozwiązywanie problemów;

-system zapewnia pełną obsługę transakcji (system B.D. musi być tak skonstruowany aby zapewnić aktualizacje B.D. zgodnie z wprowadzonymi danymi albo nie może przeprowadzić zadanych zmian cząstkowych);

-wprowadzenie katalogu danych (wykaz wszystkich pojęć opisywanych w bazie danych);

-funkcje umożliwiające odtworzenie stanu B.D. sprzed awarii;

-system autoryzacji - zapewniający kontrolę uprawnień użytkowników w odniesieniu do danych i operacji jakie będą na nich wykonywane; -współpraca z oprogramowaniem do transmisji danych;

-zapewnienie mechanizmów, które powodują że modyfikacje danych zapisanych w B.D. oraz dane do niej wprowadzane są zgodne z pewnymi schematami.

Architektury 1.przetwarzanie zdalne -do centralnego komputera dużej mocy dołączony jest szereg terminali wczytujących zapytania przesyłane do centralnego komputera i wyświetlające odpowiedzi, centralny komp musi prowadzić pełną obsługę interfejsu użytkowników na wszystkich terminalach, jednocześnie realizuje wszystkie funkcje systemu zarządzania bazą danych oraz funkcje telekomunikacyjne związane z przesyłaniem danych;

2.Architektura serwera plików -bardzo komplikuje mechanizmy współdostępu do danych oraz odtworzenie stanu systemu sprzed awarii, spowodowane to jest tym, że każda ze stacji roboczych może teoretycznie realizować dowolne operacje na danych niezależnie od pozostałych stacji; tutaj pliki z danymi są zapisane na serwerze plików a na poszczególnych stacjach roboczych są zainstalowane odrębne kopie systemu zarządzania B.D.. W archiwum wszyscy mogą korzystać z tychsamych danych ale w przypadku każdego zapytania dane te są przesyłane z serwera plików poprzez sieć LAN do odpowiedniej stacji roboczej, tym samym stacja robocza, która odwołuje się do jakiś danych wielokrotnie spowoduje wielokrotne przesyłanie nawet tych samych danych;

3.Architektura serwera aplikacji - podwyższa ona efektywność pracy systemu, obniża koszty pracy i zwiększa spójność. Tutaj system zarządzania B.D. oraz dane rezydują na tym samym serwerze, oprogramowanie realizujące poszczególne perspektywy(klienci)przesyłają poprzez sieć zapytania do serwera. Na serwerze tym przetwarzaniem tych zapytań zajmuje się system zarządzania bazą danych, który do klienta odsyła wyniki.

Modele IDEFO pozwalają na opisanie struktury logicznej i fizycznej systemu, składają się one z bloków funkcjonalnych, do którego trafia strumień danych i elementów fizycznych z wejść. Dane te oraz elementy są przetwarzane w strumieniu wyjściowym przy wykorzystaniu informacji sterujących. Realizacja funkcji bloku funkcjonalnego może być wprowadzona z wykorzystaniem mechanizmu.

Modele DFD (Data Float Diagram) (modele przypływu danych) służą do reprezentowania wyłącznie struktury logicznej systemu, a w szczególności koncentrują się na opisie procesu. W skład modelu DFD wchodzi szereg obiektów różnego typu:

1.obiekty (kwadraty) zewnętrzne - określają zewnętrzne granice systemu;

2.prostokąty zaokrąglone - reprezentują procesy w systemie;

3.prostokąty nie zakończone - składanie danych.

Budowa modelu DFD rozpoczyna się od definiowania procesu, buduje się je na różnych poziomach szczegółowości przy czym na najniższym poziomie poszczególnym procesom odpowiadają rzeczywiste modele pracy. Modele DFD przedstawiają pewien wycinek rzeczywistości i należy je budować żeby w 1modelu nie było mniej niż 4a nie więcej niż 8procesów. Do i z każdego procesu muszą wychodzić strumienie danych, nie dopuszcza się procesów mających tylko jeden strumień we i wy danych. Wyjątkowo można je dopuścić tylko na najniższym poziomie ogólności. Wszystkie procesy noszą nazwy zaczynające się od czasowników. Obiekty fizyczne, struktury lub przepływy materiałów mogą pojawić się tylko jako obiekty zewnętrzne.

Encje dzielą się na:

-typu mocnego -to takie której elementy istnieją niezależnie od występowania dowolnych elementów, dowolnego innego typu encji np.:zbiór grup studenckich;

-typu słabego -to taka której elementy mogą istnieć wyłącznie wtedy gdy występują elementy pewnego innego typu encji np.:zbiór starostów (bo istnieje gdy jest grupa).

Atrybutem nazywamy własności encji lub związki pomiędzy encjami.

Dziedzina atrybutu - zbiór wartości jakie może przyjmować dany atrybut.

Atrybuty dzielimy na: -jednowartościowe -atrybut przyjmujący dla konkretnego elementu danego zbioru typu encji 1wartość np.masa danego człowieka; -wielowartościowe -może tych wartości mieć wiele np.:kolor jabłka (żółty, żółto-czerwony,czerwony).

Atrybuty pochodne -posiadają wartości wyznaczone na podstawie wartości innych atrybutów tej samej encji lub innego typu encji np.zbiór ocen ze średnią ocen, data ur.+nr.pesel.

Atrybuty dzielą się na: -proste -składa się z niezależnie występującego pojedyńczego składnika;

-złożone -składa się z wielu niezależnie istniejących składników.

Zbiór identyfikujący relacji -zbiór atrybutów danej relacji pozwalający na jednoznacznie zidentyfikowanie wszystkich elementów danej relacji i żaden z jego podzbiorów nie jest zbiorem identyfikującym relacji. encja-student | atrybut-nr.indeksu,nr.pesel,adres | zbiór identyfikujący-minimalny zbiór atrybutów np.:nr.indeksu,imie,nazwisko,pesel. Zbiorów identyfikujących relacji może być wiele dla danej relacji. innym określeniem zbioru identyfikacji jest klucz. Klucz może być prosty (jednoelementowy) lub złożony. Wszystkie klucze danej relacji nazywamy kluczami kandydującymi, ten spośród nich który został wybrany do dalszych operacji na relacji nazywamy kluczem głównym.

Związki encji -związki pomiędzy encjami przedstawia się w formie sieci semantycznej oraz diagramów związków encji.

Sieci semantryczne pozwalają na precyzyjne scharakteryzowanie sposobu powiązań pomiędzy encjami.

Encje mogą występować w związkach różnych stopni:

-2stopnia- właściciel > własność > nieruchomość;

-3stopnia - klient / pracownik > uzgodnienie > nieruchomość;

-4stopień - klient / umowa / pracownik > uzgodnienie > nieruchomość.

W praktyce często występują ograniczenia związane z liczbą elementów encji odpowiadającym elementom drugiej encji. Do niewłaściwych postaci związków pomiędzy encjami można zaliczyć związki rekursyjne. Nie wolno dopuszczać do sytuacji w której w jednej relacji zapiane będą elementy zapisane w różnych związkach.

Pułapka typu wachlarz - występuje gdy nie ma określonego przejścia pomiędzy elementami zbiorów encji, powiązanymi przez określone związki np.: [pracownicy]-M-<>-1-[wydział]-1-<>-n-katedry(źle), [wydział]-<>-[katedra]-<>-[pracownicy](dobże).

Pułapka typu luka

[oddział]=1=<>=M=[pracownicy]=1=<>= M=[nieruchomość](może być nieprzypisana)

Każdy projekt bazy danych wymaga analizowania natury związków pomiędzy encjami. W przypadku pułapki luka opisując wymagania dotyczące integralności danych należałoby np.dodać żę konkretną nieruchomością może zajmować się tylko pracownik tego działu do którego została przydzielona nieruchomość.

Celem normalizacji jest eliminacja redundancji danych. Poszczególne postaci normalne relacji mają pewne cechy charakterystyczne dziedziczone przy przechodzeniu do kolejnych wyższych postaci normalnych. Proces normalizacji opiera się na analizie zależności funkcjonalnych pomiędzy atrybutami danej relacji np.:

symbol pracownika →(wynika z tego ale nie na odwrót)→ stanowisko

Pierwszym krokiem normalizacji jest sprowadzenie relacji do pierwszej postaci normalnej. Postać znormalizowaną relacji rozpoznaje się po występujących w niej grupach powtórzeniowych. Relacja jest w pierwszej postaci normalnej jeżeli na przecięciu każdej tabeli,kolumny, każdego wiersza występują wyłącznie wartości elementarne. W toku normalizacji liczba relacji zawsze rośnie. Przejście do kolejnych wyższych postaci normalnych wymaga wykrycia i uwzględnienia zależności funkcjonalnych pomiędzy atrybutami danej relacji - przejście do drugiej postaci normalnej wymaga uwzględnienia pełnych zależności funkcjonalnych, -przejście do trzeciej postaci normalnej wymaga uwzględnienia poprzednich zależności funkcjonalnych



Wyszukiwarka

Podobne podstrony:
wyk 1, POLITECHNIKA ŚLĄSKA Wydział Mechaniczny-Technologiczny - MiBM POLSL, Inżynierskie, Semestr 2,
PKM sciaga, POLITECHNIKA ŚLĄSKA Wydział Mechaniczny-Technologiczny - MiBM POLSL, Inżynierskie, Semes
Pytania PKM 1wszy termin, POLITECHNIKA ŚLĄSKA Wydział Mechaniczny-Technologiczny - MiBM POLSL, Inżyn
PYTANIA-x, POLITECHNIKA ŚLĄSKA Wydział Mechaniczny-Technologiczny - MiBM POLSL, Inżynierskie, Semest
PKM Pytania 2, POLITECHNIKA ŚLĄSKA Wydział Mechaniczny-Technologiczny - MiBM POLSL, Inżynierskie, Se
PKM Pytania 1 i 2, POLITECHNIKA ŚLĄSKA Wydział Mechaniczny-Technologiczny - MiBM POLSL, Inżynierskie
pytania pkm OK !!!!!!!!!, POLITECHNIKA ŚLĄSKA Wydział Mechaniczny-Technologiczny - MiBM POLSL, Inżyn
PKM pytania ET I 2004, POLITECHNIKA ŚLĄSKA Wydział Mechaniczny-Technologiczny - MiBM POLSL, Inżynier
Pytania na egzamin 1, POLITECHNIKA ŚLĄSKA Wydział Mechaniczny-Technologiczny - MiBM POLSL, Inżyniers
PKM pyt, POLITECHNIKA ŚLĄSKA Wydział Mechaniczny-Technologiczny - MiBM POLSL, Inżynierskie, Semestr
Pkm Pytania, POLITECHNIKA ŚLĄSKA Wydział Mechaniczny-Technologiczny - MiBM POLSL, Inżynierskie, Seme
wyklad kolos sciaga, POLITECHNIKA ŚLĄSKA Wydział Mechaniczny-Technologiczny - MiBM POLSL, Inżyniersk
bazy, POLITECHNIKA ŚLĄSKA Wydział Mechaniczny-Technologiczny - MiBM POLSL, Inżynierskie, Semestr 3,
Bazy+Danych+wykady+semIII (1), POLITECHNIKA ŚLĄSKA Wydział Mechaniczny-Technologiczny - MiBM POLSL,
Rozk ad labów, POLITECHNIKA ŚLĄSKA Wydział Mechaniczny-Technologiczny - MiBM POLSL, Inżynierskie, Se
ZARZĄDZANIE ŚRODOWISKIEM, POLITECHNIKA ŚLĄSKA Wydział Mechaniczny-Technologiczny - MiBM POLSL, Inżyn

więcej podobnych podstron