Backup i
archiwizacja
danych
K RY S T I A N C Y M E RY S
P R Z E M Y S Ł AW D U D A
W Y D Z I A Ł I N Ż Y N I E R I I M E TA L I I I N F O R M AT Y K I S T O S O WA N E J
I N F O R M AT Y K A S T O S O WA N A R O K 2
R O K A K A D E M I C K I 2 0 1 3 / 2 0 1 4
G R U PA A U DY T O RY J N A 1
Spis treści
•
Co to jest backup?
•
Czym jest archiwizacja danych?
•
Różnice pomiędzy nimi
•
Harmonogramy backupu
•
Narzędzia do wykonywania backupu i archiwizacji
•
Media archiwizujące
Co to jest backup?
•
Jest to kopia bezpieczeństwa (ang. backup copy)
•
Służy do odtworzenia oryginalnych danych w przypadku, kiedy
je utracimy lub dojdzie do ich uszkodzenia
•
Dobrze jest posiadać kopię zapasową danych sprzed zmian
•
Istnieją edytory oraz procesory tekstu, które wykonują taką
kopię automatycznie
•
Najczęściej mechanizm ten spotykamy w środowiskach
serwerowych
•
Możliwość utworzenia backupu na zewnętrznych nośnikach, jak
również poprzez Internet
Archiwizacja danych
•
W języku angielskim określana mianem DATA ARCHIVING
•
Jest to czynność przeniesienia danych w inne miejsce pamięci
masowej
•
Dane starsze, mniej używane podlegają archiwizacji
•
Przeprowadza się ją w określonych odstępach czasu
•
Aby zmniejszyć objętość archiwizowanych danych poddaje się
je kompresji i deduplikacji
•
Przed przystąpieniem do archiwizacji należy określić jej
parametry
Parametry archiwizacji danych
Do podstawowych parametrów zaliczamy:
•
okres jaki będzie podlegał archiwizacji
•
czas przechowywania danych lub jego brak
•
określenie czy archiwum będzie tylko do odczytu czy
również do zapisu
Sposób i rodzaj archiwizacji danych zależy od takich
czynników jak: potrzeby użytkownika, system operacyjny,
koszty czy dostępne oprogramowanie
Różnice pomiędzy backupem a
archiwizacją danych
KOPIA BEZPIECZEŃSTWA
•
Oznacza tworzenie kopii
zapasowych
•
Dane są kopiowane w
inne miejsce, przy czym
oryginalne zostają na
swoim miejscu
•
Nie są dostępne
bezpośrednio dla
użytkowników
ARCHIWIZACJA DANYCH
•
Oznacza proces tzw.
warstwowania danych
•
Dane można
zhierarchizować
•
Przenoszone na inne
nośniki, ale nadal
dostępne dla
użytkowników
Harmonogramy backupu
Możemy wyróżnić następujące typy kopii:
•
normalna (normal)
•
kopia (copy)
•
różnicowa (differential)
•
przyrostowa (incremental)
•
dzienna (daily)
Istnieją także kopie zapasowe łączone:
•
normalne i różnicowe kopie zapasowe
•
normalne i przyrostowe kopie zapasowe
Normalna kopia zapasowa
•
Kopiowane są wszystkie zaznaczone pliki
•
Atrybut archiwizacji jest zerowany
•
Wszystkie procedury tworzenia kopii zapasowej
zaczynają się od normalnej kopii zapasowej
•
Pochłania najwięcej czasu
•
Wymaga największej pojemności urządzeń
pamięciowych
•
Najbardziej wydajna podczas odtwarzania danych
Dzienna kopia zapasowa
•
Kopiowane są wszystkie wybrane pliki
•
Atrybut archiwizacji nie jest używany ani czyszczony
•
Przydatna do przenoszenia danych pomiędzy systemami
Kopia bezpieczeństwa typu kopia
•
Kopiowane są pliki i foldery modyfikowane tego samego
dnia
•
Atrybut archiwizacji nie jest używany ani zerowany
•
Lista plików powstaje w oparciu o datę modyfikacji
Różnicowa kopia zapasowa
•
Kopiowane są pliki mające włączony atrybut archiwizacji
•
Atrybut archiwizacji nie jest zerowany
•
Będzie zawierała pliki utworzone lub zmodyfikowane od
ostatniej kopii normalnej lub przyrostowej
•
Jest większa i jej tworzenie zajmuje więcej czasu niż
kopii przyrostowej, ale nadal mniejsza niż normalna
•
Wydajniejsza od przyrostowej podczas odtwarzania
danych
Przyrostowa kopia zapasowa
•
Kopiowane są wszystkie pliki zmodyfikowane od
ostatniej kopii normalnej lub przyrostowej
•
Zeruje atrybut archiwizacji
•
Jest najszybszym i zajmującym najmniej miejsca
rodzajem kopii zapasowej
•
Najmniej wygodna ze wszystkich typów kopii
zapasowych podczas odtwarzania danych
Normalne i przyrostowe kopie
zapasowe
•
W niedzielę wykonywana jest kopia normalna, a od
poniedziałku do piątku kopie przyrostowe
•
Metoda ta podczas tworzenia kopii zapasowych wymaga
mniej czasu, natomiast znacznie więcej podczas
odtwarzania
Normalne i różnicowe kopie zapasowe
•
W niedzielę wykonywana jest kopia normalna, a od
poniedziałku do piątku kopie różnicowe
•
Metoda ta podczas tworzenia kopii zapasowych wymaga
więcej czasu, natomiast znacznie mniej podczas odtwarzania
Różnica pomiędzy kopią różnicową a przyrostową
Strategie kopii zapasowych
•
Określają kolejność używania nośników
•
Liczba nośników nie powinna być zbyt duża
•
Strategia musi zapewniać dostęp do kopii zbiorów w określonym
przedziale czasu
•
Istnieją dwie podstawowe strategie:
•
strategia DZIADEK-OJCIEC-SYN (GRANDFATHER-FATHER-SON)
•
strategia WIEŻE HANOI
Strategia GFS
•
Zapewnia możliwość odtworzenia danych z dowolnego z pięciu ostatnich
dni, czterech ostatnich tygodni oraz dowolnego miesiąca
•
Schemat rotacji nośników wykorzystuje oznakowane taśmy dzienne,
oznakowane taśmy tygodniowe oraz po jednej taśmie na każdy kolejny
miesiąc
•
Zasada działania jest następująca:
•
SYN – każdego kolejnego dnia od poniedziałku do czwartku, na taśmie
oznaczonej nazwą dnia tygodnia zapisywana jest kopia przyrostowa
•
OJCIEC – w piątki wykorzystywana jest taśma oznaczona numerem kolejnego
piątku w miesiącu. Przechowuje kopię pełną
•
DZIADEK – taśma wykorzystywana ostatniego dnia miesiąca jest
wycofywana z zestawu taśm bieżących. Staje się wówczas elementem
dowolnej wielkości zbioru taśm miesięcznych
Schemat rotacji nośników strategii
GFS
Dzień tygodnia
(miesiąc 1)
Taśma
Dzień tygodnia
(miesiąc 1)
Taśma
Poniedziałek
Poniedziałek
Poniedziałek
Poniedziałek
Wtorek
Wtorek
Wtorek
Wtorek
Środa
Środa
Środa
Środa
Czwartek
Czwartek
Czwartek
Czwartek
Piątek
Piątek 1
Piątek
Piątek 3
Poniedziałek
Poniedziałek
Poniedziałek
Poniedziałek
Wtorek
Wtorek
Wtorek
Wtorek
Środa
Środa
Środa
Środa
Czwartek
Czwartek
Czwartek
Czwartek
Piątek
Piątek 2
Piątek
Piątek 4
Strategia Wieże Hanoi
•
Pozwala odtwarzać dane starsze w jednym cyklu taśm i
w bezpieczny sposób
•
Procedura jest skomplikowana
•
Celem korzystania jest ograniczenie zużycia taśm
•
Zasadą jest rotacja pewnej liczby taśm oparta na
zróżnicowanych okresach. Taśma A zawiera dane
zbliżone do aktualnych, a taśmy D i E przechowywane
są jako dane archiwalne, wykorzystywane w przypadku
uszkodzenia danych. Zastosowanie czterech taśm B
sprawi, że pełnić będą rolę podobną jak taśmy piątkowe
w GFS
Schemat rotacji nośników strategii
Wieże Hanoi
Dzień tygodnia (miesiąc
1)
Taśma
Dzień tygodnia (miesiąc
1)
Taśma
Poniedziałek
A
Poniedziałek
A
Wtorek
B
Wtorek
C
Środa
A
Środa
A
Czwartek
C
Czwartek
B
Piątek
A
Piątek
A
Poniedziałek
B
Poniedziałek
E
Wtorek
A
Wtorek
A
Środa
D
Środa
B
Czwartek
A
Czwartek
A
Piątek
B
Piątek
C
Narzędzia do backupu (Windows)
•
Istnieje wiele programów służących do wykonywania
kopii bezpieczeństwa w systemie Windows
•
Nawet sam system operacyjny posiada wbudowane
narzędzie o nazwie Kopia bezpieczeństwa
•
W systemie sieciowym Windows Server 2003 kopię
bezpieczeństwa możemy wykonać poleceniem Ntbackup
•
Ponadto bardzo popularne są takie programy jak: Norton
Ghost, EaseUS Todo Backup, Ferro Backup System i inne
Narzędzia do backupu (LINUX)
•
Podobnie jak system operacyjny Microsoft Windows,
także i Linux posiada wbudowane narzędzia do
wykonywania kopii zapasowej
•
Są to polecenia tar oraz cpio
•
Jednakże ich obsługa jest trochę inna niż narzędzia
systemowego Windowsa, ponieważ należy posługiwać
się poleceniami wprowadzanymi z linii poleceń np.:
•
Kopia pełna
tar –cf urządzenie_lub_plik
•
Istnieją również dodatkowe programy wykonujące
kopię zapasową m.in. Rsync, Mondo Rescue czy Deja
Dup
Narzędzia archiwizujące
•
Do systemu operacyjnego Microsoft Windows istnieje
wiele programów dokonujących archiwizacji danych
•
Niestety system nie posiada wbudowanego narzędzia do
archiwizacji
•
Najpopularniejsze to: WinRar, WinZip, 7-Zip
•
W przeciwieństwie do Windows, system Linux posiada
wbudowane aplikacje archiwizujące
•
Są to: Rar, tar, gzip
Media na których się archiwizuje
•
W obecnych czasach istnieje możliwość archiwizowania
danych na różnego rodzaju nośnikach, czy to fizycznych
czy wirtualnych
•
Do fizycznych nośników zaliczamy: płyty, dyski
zewnętrzne, macierze RAID, dyski twarde, pamięci
FLASH, taśmy magnetyczne
•
Do wirtualnych zaliczamy zaś: chmurę danych
•
Wyciągając wnioski idące z rozwoju przemysłu
informatycznego możemy spodziewać się coraz to
nowszych sposób archiwizacji, a co za tym idzie fizyczne
nośniki będą odchodzić „do lamusa”
Płyty
CD/DVD/Blu-
Ray
Pojemność od 700MB do
100GB
Żywotność od 5 do około 20
lat
Dyski
zewnętrzne
(USB)
Pojemność od 1GB do 1TB
Żywotność od 5 do 15 lat
Taśmy
magnetyczne
Pojemność do 3TB
Żywotność 20-30 lat
Dyski twarde
Pojemność do 2TB
Żywotność 5-10 lat
Pendrive
Pojemność do 512GB
Żywotność do 10 lat
Macierze
RAID
Pojemność zależna od
ilości dysków twardych,
gdyż RAID polega na
współpracy kilku dysków
twardych. Używa się ich w
celu
zwiększenia
odporności na awarie, czy
zwiększenia
przestrzeni
jako jednej całości.
Chmura
danych
Pojemność
jest
praktycznie
nieograniczona
(zależna
od serwera na którym się
znajduje), zaś żywotność
bliżej nieokreślona.
DZIĘKUJEMY ZA UWAGĘ