BD - zbiór pamiętanych dan. używanycg przez systemy użytkowe pewnego przedsi. kolekcja pozycji pamiętanych tak, że minimalizowana jest redundancja dan. a sposób pamiętania umożliwia na późniejsze ich użytkowanie mimo, iż wcześniej nie precyzowano sposobu ich użycia. Jest zintegrowana gdy zawiera dane nie jednego a kilku użytkowników.
Rodzaje BD - 1.'60 systemy plików-stanowią poziom fizyczny BD 2. '70 Hierarchiczne-dane organizowane w struktury drzewiaste 3. '80 Sieciowe 4.'85 Relacyjne 5.'90 Nowej generacji
Dlaczego BD? - zmniejszenie redundancji pamiętanych dan. (integracja tych samych)-uniknięcie problemów niezgodności - dzielenie dan. między wielu użytkowników - wprowadzanie standardów - wprowadzanie ograniczenia dostępu do dan. - zachowanie integralności dan. -zapewnienie niezależności dan. od programów
SBD definicja formalna = <{S, BD, SO, SZBD, P}, R>; S-sprzęt bezpośrednio wykorzystywany do przechowywania BD; P zbiór poleceń użytkownika; R relacje; to BD zbiór programów wsadowych i interakcyjnych
Architektura SBD - poziomy (zewnętrzny = użytkownika, logiczny = modelu dan., wewnętrzny = fizyczny)
SZBD - to oprogramowanie bądź system informatyczny służący do zarządzania komputerowymi BD. SBD mogą być sieciowymi serwerami baz dan. lub udostępniać BD lokalnie.
Funkcje SZBD - 1. realizacja odwzorowań 2. oper. dostępu 3. zapewnienie integralności dan. 4. obsługa współbieżności i rozproszenia 5. ochrona dan. 6. śledzenie operacji 7. odtwarzanie po awariach
Umiejscowienie SZBD SZBD jest opracowany jako zbiór programów bibliotecznych i w czasie kompilacji jest łączony z programem użytkowym; SZBD jest rozszerzeniem tradycyjnego systemu zarządzania danymi systemu operacyjnego - jest więc w pełni zintegrowany z SO i dla programów użytkowych jawi się jako zestaw możliwości tego SO; SZBD zaprojektowany jest jako niezależne zadanie (proces), który wykonywany jest pod nadzorem systemu operacyjnego.
Redundancja inaczej nadmiarowość w stosunku do tego, co konieczne lub zwykłe.
Normalizacja - polega na redukcji - głównym celem jest zmniejszenie redundancji i uniknięcie pewnych trudności towarzyszących operacjom aktualizacji; w celu przyspieszania można denormalizować.
PN - można przetwarzać z jednej w drugą bez żadnych strat w dan. | 1PN - gdy wszystkie dziedziny podstawowe zawierają jedynie atrybuty atomowe (należy 1. usunąć atrybuty wielowartościowe do nowej encji 2. skopiować unikalny identyfikator) | 2PN - gdy jest w I i każdy atrybut niekluczowy jest w pełni funkcjonalnie zależny od klucza głównego (należy 1. usunąć wszystkie częściowo zależne atrybuty do nowej encji 2. skopiować część identyfikatora) | 3PN - gdy jest w II i każdy atrybut niekluczowy jest nietranzytywnie (nieprzejściowo) zależny od klucza głównego (należy 1. usunąć atrybuty niezależne do nowej encji 2. ustawić identyfikator nowej encji) | 4PN - „Jeden fakt w jednym miejscu”
Różnice pomiędzy info. a daną Info. to zinterpretowane dane. Dane to wycinek rzeczywistości służący do opisu innego wycinka rzeczywistości. Dane mogą przyjmować różną postać: znaki, mowa, wykresy. Różne dane mogą przedstawiać tę samą info. Dane są zatem pojęciem węższym niż info. chociaż potocznie tych pojęć używamy zamiennie.
Info. - info. to treść komunikatu przekazywanego za pomocą dan.. W teorii informacji Shannona, info. jest też mierzona jako prawdopod. zajścia zdarzenia. Zdarzenia mniej prawdopod. dają więcej info.. I=log2(1/p), gdzie I - liczba bitów info. (ilość info.), p - prawdopod. zajścia zdarzenia.
Dane - pojęcie wskazuje na to co jest nam dane. Obecnie należy głównie do słownika informatyki gdzie dane to zbiory liczb i tekstów o różnych formach. Są one używane przez komputery do obliczeń oraz są prezentowane, czy też przetwarzane cyfrowo. wg. meta-teorii TOGA dane są zdefiniowane jako "to wszystko co jest/może być przetwarzane umysłowo lub komputerowo".
Rodzaje dan. - alfanumeryczne binarne dzielone masowe numeryczne pakowane przeterminowane statystyczne pierwotne statystyczne wtórne tajne tekstowe wejściowe wirtualne wyjściowe
Legenda:
BD - bazy danych
SZBD - system zarządzania BD
Info. - informacja
RBD - rozproszona BD
PN = postać normalna
Dan. - danych
Oper - operacje
Prawdpod. - prawdopodobieństwo
Trans. - zbiór oper. na BD, które stanowią w istocie pewną całość i jako takie powinny być wykonane wszystkie lub żadna z nich. Warunki jakie powinny spełniać trans. szczegółowiej opisują zasady ACID: Atomowość, Spójność, Izolacja, Trwałość). Przykładem trans. może być trans. bankowa jaką jest przelew. Muszą tu zostać dokonane 2 oper. - zabranie pieniędzy z jednego konta oraz dopisanie ich do drugiego. W przypadku niepowodzenia żadna z tych operacji nie powinna być zatwierdzona, gdyż zajście tylko jednej powodowałoby nieprawidłowości w BD (pojawienie się lub zniknięcie pieniędzy). Trans. składa się zawsze z 3 etapów: rozpoczęcia, wykonania, zamknięcia Istotne jest, aby trans. trwała jak najkrócej, ponieważ równolegle może być dokonywanych wiele trans.i i część operacji musi zostać wykonana w pewnej kolejności. Każdy etap trans. jest logowany, dzięki czemu w razie awarii systemu można odtworzyć stan BD sprzed trans. która nie została zamknięta.
Model dan. - Pojęcie niejednoznaczne, którego znaczenie jest wypadkową następujących cech: * metajęzyk (pojęcia, terminologia) do mówienia o dan., o SBD i o przetwarzaniu dan.; * sposób rozumienia organizacji dan. i ideologiczne lub techniczne ograniczenia w zakresie konstrukcji, organizacji i dostępu do dan.; * języki opisu i przetwarzania dan., w szczególności: diagramy struktur dan., języki opisu dan. i języki zapytań; * ogólne założenia dotyczące architektury i języków systemu BD;* ograniczenia, ideologie lub teorie (matematyczne) dotyczące struktur dan. i dostępu do dan.
Baza analityczna - w odróżnieniu od operacyjnych są zazwyczaj stałe i nie pozwalają użytkownikom na modyfikację dan. Operator może dokonywać na systemie analitycznym tylko oper. odczytu. Systemy te przechowują całą historię działalności przedsiębiorstwa, podczas gdy bazy operacyjne tylko ostatnie lata. Utrzymywanie dan. jest optymalizowane pod kątem odpowiadania na złożone zapytania pochodzące od zarządzających oraz analityków. Dane są pozyskiwane z różnorodnych źródeł, przy czym zapewniona jest ich jednolitość. Systemy analityczne, sposoby ich wykorzystania w zarządzaniu strategicznym oraz perspektywy rozwoju są myślą przewodnią niniejszego artykułu. Jest podstawą budowy hurtowni dan., bazą systemu wspomagania decyzji
Baza operacyjna jest grupą aplikacji mającą wspomagać funkcjonowanie przedsiębiorstwa przez dokładne i efektywne realizowanie transakcji. Oper. wykonywane na tej bazie to odczyt, zapis, modyfikacja, usuwanie. Ma ona krytyczne znaczenie w działalności przedsiębiorstwa, ponieważ to właśnie w niej odbywa się ewidencjonowanie większości zdarzeń zachodzących w przedsiębiorstwie. realizacji wyżej wymienionych celów. Rzadko jest jednym systemem.
RBD - BD istniejąca fizycznie na dwóch lub większej liczbie komputerów, traktowana jednak jak jedna logiczna całość, dzięki czemu zmiany w zawartości bazy w jednym komputerze są uwzględniane również w innych maszynach. RBD są stosowane ze względu na zwiększoną wydajność przetwarzania na wielu komputerach jednocześnie.
Relacja - to dowolny podzbiór iloczynu kartezjańskiego nad danymi zbiorami. Nie musi być określona żadna relacja porządkowa. To dowolny, skończony podzbiór zbioru typu KROTKA(U).
Oper. na relacjach - rzutowanie, selekcja, złączenie, suma, różnica, produkt kartezjański
Relacja znormalizowana - to relacja, która spełnia warunek mówiący, że w tabelach na przecięciu kolumny i wiersza powinna być jedna wartość, a nie ich zbiór.
Klucz główny - atrybut, którego wartości jednoznacznie definiują krotki Klucz kandydujący - gdy kilka atrybutów ma własność identyfikacji Klucz obcy - jest nim pewien atrybut relacji R1, jeśli nie jest on kluczem głównym relacji R1 lecz jego wartości są wartościami klucza głównego innej relacji R2.
UPDATE `tab` SET `col1`='1', `col2`='2' WHERE `id`='5';
INSERT INTO `mytab` VALUES (1, 'a'), (2, 'b'), (3, 'c');
DELETE FROM `myTab` WHERE id=5;
SELECT COUNT(*) FROM `myTab`;
SELECT COUNT(*) FROM `myTab` WHERE `name`='marek';
ALTER TABLE `tab` ADD `col` int(11); //dodawanie kolumny
ALTER TABLE `tab` ADD `col` int(11) AFTER `col0`; // po col0
ALTER TABLE `tab` ADD `col` int(11) FIRST; // jako pierwszą
ALTER TABLE `tab` CHANGE `oldname` `newname` int(11);
SELECT * FROM `my_tab` ORDER BY random();
SELECT `col1` from `t1` UNION SELECT `col2` FROM `t2`;
DROP TABLE `table_1_name`, `table_2_name';
INSERT INTO nowatabela SELECT * FROM staratabela;