Baza danych(ang. database), rodzaj komputerowego zbioru kartotek, magazyn danych o określonej budowie. Baza danych jest modelowym ujęciem fragmentu rzeczywistości będącego przedmiotem zainteresowania osób, instytucji, organizacji, firm, zakładów itp., reprezentującym fakty dotyczące tej rzeczywistości w formie umożliwiającej ich przetwarzanie w komputerze.
Wymagania stawiane systemom baz danych
•możliwośćutworzenia i określenie schematu bazy danych
•możliwośćtworzenia zapytańo dane oraz aktualizowania danych
•zapewnienie bezpiecznego przechowywania dużej liczby danych
•sterowanie jednoczesnym dostępem do danych przez wielu użytkowników
•szybki dostęp do informacji
Modele baz danych
•hierarchiczny
•sieciowy
•relacyjny
•obiektowy
Encja-byt, przedmiot fizyczny (lub abstrakcja) rozpoznawalny jako samodzielny i niezależny w organizacji rzeczywistości; rzecz znacząca. interesujący nas obiekt, coś co istnieje i jest rozróżnialne wśród innych obiektów tego samego typu
Atrybuty służą do nazywania kolumn relacji. Na ogół oddają znaczenie danych umieszczanych w kolumnach pod nimi
Pole podaje wartość atrybutu, którego dziedziną jest zbiór dopuszczalnych wartości jakie może przyjmować. (dane określonego typu, definiowane na etapie projektowania bazy danych -mają stały rozmiar i zwykle są to ogólnie znane typy proste -liczba, data, godzina, ciąg znaków, znak itp.)
Zasady projektowania
•Dokładność
Zbiory encji oraz ich atrybuty powinny odzwierciedlać świat rzeczywisty. Każdy element projektu powinien odpowiadać wiedzy o części świata rzeczywistego, którą reprezentuje
•Unikanie redundacji
Projekt nie może być nad miarowy, co wymaga unikania powtórzeń. Te same informacje nie mogą znajdować się jednocześnie w kilku miejscach.
•Prostota
W projekcie powinny znaleźć się tylko te elementy, które są naprawdę potrzebne
•Dobór właściwych elementów
Wybór rodzaju elementu (zbiór encji, atrybut, związek) opisującego obiekt ze świata rzeczywistego.
Klucze -atrybuty lub zbiory atrybutów, które jednoznacznie identyfikują encję wewnątrz zbioru encji. Klucz może być utworzony przez:
•wybór atrybutu spełniającego rolę klucza (np. Pesel, NIP)
•utworzenie specjalnego atrybutu spełniającego rolę klucza
więzy jednoznaczności -wymaganie, aby wartości w danym polu różniły się. W danej roli może występować tylko jedna wartość. Podstawowym przykładem więzów jednoznaczności są klucze
więzy integralności referencyjnej -narzucają wymaganie, aby wartość, którą wskazuje jakiś obiekt znajdowała się w bazie.
więzy domenowe -stanowią wymaganie, aby wartość atrybutu należała do określonego zbioru wartości lub znajdowała się w określonym zakresie.
więzy zasadnicze -arbitralnie narzucone warunki, spełnienie których musi być bezwzględnie przestrzegane w definiowanej bazie danych.
Zbiory słabych encji- występują, jeżeli niektóre lub wszystkie atrybuty klucza rozważanego zbioru encji wybiera się z innego zbioru encji.
Przyczyny występowania zbiorów słabych encji
•Zbiory encji układają się hierarchicznie
•Występują zbiory łączące
Własności relacji (tablicy)
•Krotki (wiersze) są unikalne
•Atrybuty (kolumny) są unikalne
•Kolejność krotek (wierszy) jest dowolna
•Kolejność atrybutów (kolumn) jest dowolna
•Wartości atrybutów (pól) są atomowe
Kluczem głównym(podstawowym) nazywane są kolumny jednoznacznie odróżniające rekordy relacji
Kolumny jednej tabeli są kluczem obcym, jeśli nie są kluczem głównym tej tabeli, ale ich wartości są wartościami klucza głównego innej tabeli.
Nadklucz- zbiór atrybutów zawierających klucz (spełniony jest jedynie warunek pierwszy)
Anomalie -problemy ze zbyt dużą liczbą danych w pojedynczej relacji
redundacja- dane niepotrzebnie powtarzają się w kilku rekordach
anomalie modyfikacji -podczas modyfikacji wartość danych nie zostanie poprawiona we wszystkich krotkach
anomalie usunięć- usunięcie wartości atrybutu może spowodować utratę części danych (całej krotki)
Dekompozycja relacji -podział atrybutów relacji R między dwa schematy nowych relacji
Normalizacja -proces przekształcania reprezentacji bazy danych (nazywany również rozkładem odwracalnym), polegający na odnajdywaniu logicznych związków między elementami danych. W każdym etapie normalizacja bazy strukturę danych dzieli się na coraz więcej tabel z zachowaniem podstawowych związków między elementami danych.
Denormalizacja- wprowadzenie kontrolowanej nadmiarowości do bazy danych w celu przyśpieszenia wykonywania na niej operacji (np. obsługiwania zapytań)
Pierwsza postać normalna (1NF) -relacja R jest w pierwszej postaci normalnej, jeśli wartości atrybutów są elementarne tzn. są to pojedyncze wartości określonego typu, a nie zbiory wartości
Druga postać normalna (2NF)-atrybuty nie wchodzące w skład klucza są zależne od całego klucza (nie tylko od jego części)
Trzecia postać normalna Relacja R jest w trzeciej postaci normalnej wtedy i tylko wtedy, gdy jest spełniony warunek: Jeśli A1, A2, ...., An->B jest zależnością nietrywialną to albo {A1, A2, ...., An} jest nadkluczem, albo B jest elementem pewnego klucza.
Role użytkowników systemów baz danych:
administrator bazy danych (projektuje on strukturę baz danych, przydziela uprawnienia poszczególnym użytkownikom, określa perspektywy użytkownika, oraz prowadzi systematyczne kopiowanie zawartości bazy danych dla umożliwienia odtworzenia stanu bazy danych sprzed awarii, w niektórych systemach można wyróżnić dwie funkcje: administrator danych, administrator bazy danych)
programiści aplikacji(budują oni procedury pozwalające na pozyskiwanie informacji z danych, a procedury te budowane są w języku DML)
,, użytkownicy naiwni „ (są to wszyscy użytkownicy bazy danych którzy dostęp do danych i informacji uzyskują za pośrednictwem mechanizmu perspektyw)
ODPOWIEDZI…..
Zestaw I
1) Normalizacja -proces przekształcania reprezentacji bazy danych (nazywany również rozkładem odwracalnym), polegający na odnajdywaniu logicznych związków między
elementami danych. W każdym etapie normalizacja bazy strukturę danych dzieli się na coraz więcej tabel z zachowaniem podstawowych związków między elementami danych.
3) Wprowadzanie danych do baz danych może odbywać się z wykorzystaniem szeregu technik
1. skanowanie - proces konwersji danych od formatu stosowanego w tworzonej bazie danych może obejmować przeniesienie danych z nośnika papierowego do postaci elektronicznej
seryjne skanowanie dokumentów o zunifikowanej strukturze (dane z biletów lotniczych)
skanowanie dokumentów o niejednorodnym formacie
2. Indeksowanie jest procesem opatrzenia dokumentu lub dodania do jego zawartości unifikalnego znaku, jest to klucz do relacji zawierających dane dokumenty
5) logiczny model danych - jeden z modeli przez pryzmat którego możemy patrzeć na dane. Utrzymanie danych w bazie tak aby były logicznie poprawne (czyli zgodne z modelem logicznym, sensowne z punktu widzenia ich interpretacji) to utrzymanie spójności danych. Zacznijmy jednak od początku. Jest to zapis informacji na temat tego jakie dane przechowywane są w bazie danych w kontekście konkretnego modelu danych - czyli z uwzględnieniem sposobu w jaki system zarządzania bazą danych udostępnia je dla użytkownika. Model logiczny służy głównie do lepszego zrozumienia przez programistę korzystającego z bazy sposobu w jaki dane są ze sobą powiązane (często jest to osoba inna niż projektant bazy) oraz przekłada się na informacje skierowane do bazy na temat powiązań pomiędzy rekordami danych, informacji dotyczących charakteru tych powiązań - na przykład tego czy powiązanie musi wystąpić czy jest opcjonalne oraz jaką ma krotność czyli jeśli występuje to czy może tylko pomiędzy jednym rekordem czy wieloma.
modelem pojęciowym. Model ten opisuje pojęcia właśnie - czyli to co znajduje się w bazie danych z uwzględnieniem sposobu w jaki system zarządzania bazą danych traktuje dane i jak udostępnia je użytkownikowi czyli z uwzględnieniem modelu danych. Współczesne systemy bazą danych opierają się najczęściej na modelu relacyjnym. Póki co możemy przyjąć iż oznacza to że dane przechowywane są w formie tabel w których każda kolumna to opis konkretnej cechy a wiersz to rekord czyli całościowy opis konkretnego elementu.
Zestaw II
1) Każda krotka odpowiada jednemu wierszowi tablicy. Każda krotka posiada co najmniej jeden atrybut odpowiadający pojedynczej kolumnie tablicy.
3) Przykład sieci semantycznej z pułapką typu wachlarz:
Pod pojęciem pułapki typu wachlarz rozumiemy sytuację, w której model odzwierciedla związek pomiędzy pewnymi typami encji ale droga pomiędzy niektórymi elementami obu typów encji jest nieokreślona.
Pułapka typu luka:
4) System zarządzania bazą danych może przechowywać informacje o modelu logicznym danych i posługiwać się nim w celu uniemożliwienia naruszenia spójności danych.
Architektura systemu zarządzania bazą danych z wielodostępem:
zdalne przetwarzanie - jest to rozwiązanie wychodzące z użycia charakteryzujące się tym że system zarządzania bazą danych, dane oraz oprogramowanie aplikacji realizujących poszczególne perspektywy wszystko to jest zapisane na centralnym komputerze dołączone są terminale za pośrednictwem których użytkownicy dostają dostęp do danych
architektura serwera plików - dane z których mogą korzystać użytkownicy za pośrednictwem swoich stacji roboczych. Baza danych zapisana jest na serwerze plików na poszczególnych stacjach roboczych zainstalowane są systemy zarządzana bazą danych jako odrębne kopie oraz programy realizujące poszczególne perspektywy. Wszystkie stacje robocze są połączone z serwerem plików za pośrednictwem sieci komputerowej
5) Pierwsza postać normalna (1NF) -relacja R jest w pierwszej postaci normalnej, jeśli wartości atrybutów są elementarne tzn. są to pojedyncze wartości określonego typu, a nie zbiory wartości
Trzecia postać normalna Relacja R jest w trzeciej postaci normalnej wtedy i tylko wtedy, gdy jest spełniony warunek: Jeśli A1, A2, ...., An->B jest zależnością nietrywialną to albo {A1, A2, ...., An} jest nadkluczem, albo B jest elementem pewnego klucza.
zestaw III
1)----------
2) Pierwsza postać normalna (1NF) -relacja R jest w pierwszej postaci normalnej, jeśli wartości atrybutów są elementarne tzn. są to pojedyncze wartości określonego typu, a nie zbiory wartości
Druga postać normalna (2NF)-atrybuty nie wchodzące w skład klucza są zależne od całego klucza (nie tylko od jego części)
3) System zarządzania bazą danych może przechowywać informacje o modelu logicznym danych i posługiwać się nim w celu uniemożliwienia naruszenia spójności danych.
Architektura systemu zarządzania bazą danych z wielodostępem:
zdalne przetwarzanie - jest to rozwiązanie wychodzące z użycia charakteryzujące się tym że system zarządzania bazą danych, dane oraz oprogramowanie aplikacji realizujących poszczególne perspektywy wszystko to jest zapisane na centralnym komputerze dołączone są terminale za pośrednictwem których użytkownicy dostają dostęp do danych
architektura serwera plików - dane z których mogą korzystać użytkownicy za pośrednictwem swoich stacji roboczych. Baza danych zapisana jest na serwerze plików na poszczególnych stacjach roboczych zainstalowane są systemy zarządzana bazą danych jako odrębne kopie oraz programy realizujące poszczególne perspektywy. Wszystkie stacje robocze są połączone z serwerem plików za pośrednictwem sieci komputerowej
4) Klucze -atrybuty lub zbiory atrybutów, które jednoznacznie identyfikują encję wewnątrz zbioru encji. Klucz może być utworzony przez:
•wybór atrybutu spełniającego rolę klucza (np. Pesel, NIP)
•utworzenie specjalnego atrybutu spełniającego rolę klucza
Kluczem głównym(podstawowym) nazywane są kolumny jednoznacznie odróżniające rekordy relacji
Kolumny jednej tabeli są kluczem obcym, jeśli nie są kluczem głównym tej tabeli, ale ich wartości są wartościami klucza głównego innej tabeli.
Nadklucz- zbiór atrybutów zawierających klucz (spełniony jest jedynie warunek pierwszy)
5) logiczny model danych - jeden z modeli przez pryzmat którego możemy patrzeć na dane. Utrzymanie danych w bazie tak aby były logicznie poprawne (czyli zgodne z modelem logicznym, sensowne z punktu widzenia ich interpretacji) to utrzymanie spójności danych. Zacznijmy jednak od początku. Jest to zapis informacji na temat tego jakie dane przechowywane są w bazie danych w kontekście konkretnego modelu danych - czyli z uwzględnieniem sposobu w jaki system zarządzania bazą danych udostępnia je dla użytkownika. Model logiczny służy głównie do lepszego zrozumienia przez programistę korzystającego z bazy sposobu w jaki dane są ze sobą powiązane (często jest to osoba inna niż projektant bazy) oraz przekłada się na informacje skierowane do bazy na temat powiązań pomiędzy rekordami danych, informacji dotyczących charakteru tych powiązań - na przykład tego czy powiązanie musi wystąpić czy jest opcjonalne oraz jaką ma krotność czyli jeśli występuje to czy może tylko pomiędzy jednym rekordem czy wieloma.
modelem pojęciowym. Model ten opisuje pojęcia właśnie - czyli to co znajduje się w bazie danych z uwzględnieniem sposobu w jaki system zarządzania bazą danych traktuje dane i jak udostępnia je użytkownikowi czyli z uwzględnieniem modelu danych. Współczesne systemy bazą danych opierają się najczęściej na modelu relacyjnym. Póki co możemy przyjąć iż oznacza to że dane przechowywane są w formie tabel w których każda kolumna to opis konkretnej cechy a wiersz to rekord czyli całościowy opis konkretnego elementu.
6) Anomalie -problemy ze zbyt dużą liczbą danych w pojedynczej relacji
redundacja- dane niepotrzebnie powtarzają się w kilku rekordach
anomalie modyfikacji -podczas modyfikacji wartość danych nie zostanie poprawiona we wszystkich krotkach
anomalie usunięć- usunięcie wartości atrybutu może spowodować utratę części danych (całej krotki)
sprzedaż
umowy
Moduł wejścia i raporty
Moduł wejścia i raporty
DBMS
DATABASE
Moduł zarządzania bazą danych
sprzedaż
umowy
Moduł wejścia i raporty
Moduł wejścia i raporty
DBMS
DATABASE
Moduł zarządzania bazą danych