Macierze dyskowe RAID
Autorzy:
Marek Malczewski
Tomek Tomaszewski
Politechnika Łódzka 2003
SPIS TREŚCI
HOME
>>>
<<<
END
• Wstęp
• Podsumowanie
• Charakterystyka RAID:
RAID 0
RAID 1
RAID 0+1
RAID 10
RAID 2
RAID 3
RAID 4
RAID 5
RAID 6
RAID 53
• Zakończenie
WSTĘP
HOME
>>>
<<<
END
RAID – Redundant Array of Inexpensive (Independent) Disks –
Nadmiarowa Macierz Tanich (Niezależnych) Dysków.
Pojęcie to po raz pierwszy ujrzalo światło dzienne w 1988 r. w Berkeley
Papers – magazynie naukowym wydawanym przez Pattersona, Gibsona &
Katza – pracowników Uniwersytetu Kalifornii w Berkeley.
Wkrótce zastąpiono słowo Independent słowem Inexpensive.
Wyżej wymieniona trójka i inni zdefiniowali oraz skategoryzowali różne
modele mapowania oraz ochrony dysków.
Do rozróznienia różnych modeli RAID użyto słowa „level” czyli poziom.
Może to sugerować iż numer przy poziomie, oznacza wyższość modeli o
wyższym numerze nad tymi o numerze niższym. To nieprawda.
RAID 0
blokowa macierz bez sprawdzania błędów
• technika rozmieszczania danych na dyskach, skierowana głównie
na wzrost prędkości zapisu / odczytu;
• dane dzielone na bloki konfigurowalnej wielkości (4 B -128kB), każdy
zapisywany sekwencyjnie na innym dysku;
• brak kontroli błędów;
HOME
>>>
<<<
END
RAID 0
blokowa macierz bez sprawdzania błędów
Zalety:
• bardzo dobre osiągi, przy
zastosowaniu wielu dysków,
kanałów;
• największe prędkości
odczytu/zapisu przy użyciu
jednego napędu na jeden
kontroler;
• bardzo prosta technologia;
• proste w implementacji;
• zerowe „straty” miejsca na
dysku (100 GB przestrzeni
dyskowej pozwala na zapisanie
100 GB danych)
Wady:
• nie jest to prawdziwy RAID-
brak kontroli błędów;
• awaria jednego dysku z
macierzy powoduje utratę
wszystkich danych;
• nie powinno się go stosować w
systemach zawierających ważne
dane;
HOME
>>>
<<<
END
RAID 1
lustrzane odbicie
• dyski łaczone parami- na obu zapisywane identyczne kopie danych;
• w razie awarii jednego z dysków, dane przywracane z drugiego
napędu;
• zapis jest spowolniony, ale przy dobrej konfiguracji (dyski na
oddzielnych kontrolerach) prędkość zapisu niewiele niższa od
pojedyńczego dysku. Szybki odczyt- dane mogą być czytane na raz z
obu dysków;
HOME
>>>
<<<
END
RAID 1
lustrzane odbicie
Zalety:
• 100% odzyskiwalność danych-
w razie awarii jednego dysku
mamy idealną kopię na drugim;
• zwiększona prędkość odczytu;
• najprostszy w implementacji
spośrod wszystkich RAIDów;
• odporny na wielokrotne, losowe
awarie dyskowe
Wady:
• 50 % straty przestrzeni
dyskowej;
• najczęściej realizowany
programowo obciążając mocno
CPU/podzespoły. Implementacja
sprzętowa bardzo zalecana;
• brak obsługi technologii hot-
swap, w przypadku
implementacji software’wej;
HOME
>>>
<<<
END
RAID
0+1
dzielenie + duplikowanie
• macierz obsługująca jedynie parzyste ilości dysków;
• połaczenie macierzy typu 0 z macierzą typu 1. Dokładnie rzecz biorąc
jest to macierz typu 1, której duplikowanymi elementami są macierze
typu 0;
• zwiększona prędkośc zapisu/odczytu poprzez zastosowanie łączonych
dysków;
HOME
>>>
<<<
END
RAID 0+1
dzielenie + duplikowanie
Zalety:
• duża prędkośc zapisu/ odczytu;
• taka sama odporność na błędy
jak macierzy RAID 1;
• idealne rozwiązanie dla
użytkowników potrzebujących
dużej wydajności przy średniej
niezawodności;
Wady:
• awaria pojedyńczego dysku
powoduje zmianę macierzy w
RAID 0;
• bardzo drogie rozwiązanie ;
• niemożność dodawania
pojedyńczych dysków;
• mała skalowalność;
HOME
>>>
<<<
END
RAID 10
duplikowanie + dzielenie
• minimum 4 dyski;
• macierz typu 0, której elementami są macierze typu 1;
• bardzo dobre rozwiązanie dla firm, które zdecydowały się na RAID 1
ale potrzebują dodatkowego wzrostu wydajności;
HOME
>>>
<<<
END
RAID 10
dzielenie + duplikowanie
Zalety:
• duża prędkośc zapisu/ odczytu;
• taka sama odporność na błędy
jak macierzy RAID 1;
• pod pewnymi warunkami,
macierz typu 10 może przetrwać
awarię kilku dysków naraz;
Wady:
• wszystkie dyski muszą
pracować równolegle;
• bardzo drogie rozwiązanie ;
• mała skalowalność;
HOME
>>>
<<<
END
RAID 2
RAID 0 + korekcja ECC
• dane zapisywane jak w macierzy RAID typu 0, przy czym po zapisaniu
pełnego rzędu bitów do połączonych dysków, następuje wyliczenie
oraz zapis na specjalnie do tego przygotowane dyski wartości
wyliczonych z kodu Hamminga;
• korekcja ECC, oparta na kodzie Hamminga, po wykryciu błędu w
zapisanych danych następuje natychmiastowa korekcja;
HOME
>>>
<<<
END
RAID 2
RAID 0 + korekcja ECC
Zalety:
• korekcja błędów ‘on the fly’;
• możliwe bardzo duże transfery;
• wraz ze wzrostem ilości
wykorzystywanych dysków
rośnie stosunek ilości dysków z
danymi do ilości dysków z
informacją kontrolną
• relatywnie prosty kontroler w
porównaniu z RAID poziom
3,4,5;
Wady:
• przy małej ilości dysków, bardzo
duży stosunek dysków ECC do
dysków z danymi- nieopłacalne;
• nie istnieje komercyjna
implementacja sprzętowa
takiego rozwiązania ;
• bardzo wysokie koszty
wejściowe- opłacalne tylko w
przypadku zapotrzebowania na
duże szybkości transferów;
HOME
>>>
<<<
END
RAID 3
RAID 0 + bit parzystości
• wymagane minimum 3 dyski;
• analogicznie do macierzy typu 2, dane zapisywane blokami na kilku
dyskach połączonych w jeden wirtualny dysk, z każdego zapisywanego
bloku wyliczona jest suma kontrolna .Suma ta zapisywana jest na
dodatkowy dysk ( w odróżnieniu od RAID 2 jest to jeden dysk, a nie
kilka )
• zwiększona prędkośc zapisu/odczytu poprzez zastosowanie łączonych
dysków;
HOME
>>>
<<<
END
RAID 3
RAID 0 + bit parzystości
Zalety:
• duża prędkośc zapisu/ odczytu;
• awaria dysku nie ma znaczenia
dla całego ukladu;
• niski stosunek ilości dysków z
informacją kotrolną do ilości
dysków z danymi- duża
opłacalność;
Wady:
• złożona budowa kontrolera;
• bardzo trudne i zasobożerne do
zrealizowania programowego ;
HOME
>>>
<<<
END
RAID 4
1 dysk z informacją kontrolną
• minimum 3 dyski;
• rozwiązanie bardzo podobne do macierzy typu 2 i 3, z tą różnicą, że
zamiast pojedyńczych bajtów, na dyski zapisywane są całe bloki
danych ;
• na dodatkowym dysku zapisywana informacja kontrolna w postaci
bitów ECC;
HOME
>>>
<<<
END
RAID 4
1 dysk z informacją kontrolną
Zalety:
• bardzo duża pędkość odczytu;
• 1 dysk z informacją kontrolną –
niski stosunek do ilósci dysków z
danymi – duża opłacalność;
Wady:
• złożona budowa kontrolera;
• najniższe z wszystkich rodzajów
RAID’ów szybkości zapisu;
• w przypadku awarii
jakiegokolwiek dysku, trudne i
czasochłonne odzyskiwanie
danych;
• bardzo trudne do
zaimplementowania
programowego;
HOME
>>>
<<<
END
RAID 5
dane + bit parzystości na jednym dysku
• poziom 5 pracuje bardzo podobnie do poziomu 4 z tą różnicą, iż bity
parzystości nie są zapisywane na specjalnie do tego przeznaczonym
dysku, a są rozpraszane po całej strukturze macierzy;
• niezawodność – w razie awarii system odbuduje utracone dane,
zmniejszając jednak bieżącą wydajność macierzy. Po zamontowaniu
nowego dysku, macierz przeniesie na niego odtworzone dane-
wydajność systemu wraca do normy.
HOME
>>>
<<<
END
RAID 5
dane + bit parzystości na jednym dysku
Zalety:
• najwyższa prędkośc odczytu;
• duża prędkość zapisu;
• brak dysków przeznaczonych
wyłącznie na informację
kontrolną- duża opłacalność;
• duża niezawodnośc;
Wady:
• bardzo trudne rozwiązanie jeśli
chodzi o złożoność kontrolera;
• spory wpływ awarii jednego
dysku na wydajność całego
systemu;
HOME
>>>
<<<
END
RAID 6
podwójny zapis informacji kontrolnej
• jest to rozszerzenie macierzy typu 5;
• informacja kontrolna zapisywana na tych samych dyskach co dane,
zapis bitów parzystości dwukrotny, niezależnie od siebie;
• idealne rozwiązanie do wymagających krytycznej niezawodności
systemów;
HOME
>>>
<<<
END
RAID 6
podwójny zapis informacji kontrolnej
Zalety:
• duża prędkośc odczytu;
• bardzo wysoka odporność na
awarie- może znieść awarie kilku
dysków na raz;
• niezawodnoś, może być
stosowany nawet w systemach
wymagających krytycznej
niezawodności;
• średnia prędkość zapisu;
Wady:
• bardzo złożona budowa
kontrolera;
• obliczanie adresów informacji
kontrolnej wymaga wysokiej
ilości zasobów CPU/kontrolera;
• wymaga N+2 dysków do
zaimplementowania – podwójny
zapis informacji kontrolnej;
• dość drogie rozwiązanie;
HOME
>>>
<<<
END
RAID 53
weryfikacja danych + szybkość
• minimum 5 dysków do implementacji;
• naprawdę powinien nazywać się RAID 03- jest to macierz typu 0,
której elementami są macierze typu 3;
• zwiększona prędkośc zapisu/odczytu poprzez zastosowanie łączonych
dysków;
HOME
>>>
<<<
END
RAID 53
weryfikacja danych + szybkość
Zalety:
• duża prędkośc zapisu/ odczytu;
• taka sama odporność na błędy
jak macierzy RAID 3;
• idealne rozwiązanie dla
użytkowników potrzebujących
dużej wydajności przy średniej
niezawodności;
Wady:
• bardzo droga w implementacji;
• wszystkie dyski muszą być
zsynchronizowane, co zncznie
ogranicza ich wybór (muszą to
być podobne modele);
• duże straty przestrzeni
dyskowej;
• mała skalowalność;
HOME
>>>
<<<
END
PODSUMOWANIE
HOME
>>>
<<<
END
Technologia RAID stała się potężnym narzędziem przys- pieszania
wydajności podsystemu dyskowego i/lub zwiększania bezpieczeństwa
danych.
Sposób realizacji: sprzętowy oraz programowy. Oczywiście model
sprzętowy ze specjalnie zbudowanym w celu łączenia/ przeliczania danych
kontrolerem jest znacznie wydajniejszy od modelu czysto programowego.
Jest jednak dużo droższy.
Nakłady potrzebne na uruchomienie macierzy na serwerze często
przewyższają ewentulne koszty utraty danych.
Dodatkowym atutem stosowania macierzy jest likwidacja przestojów w
działaniu systemu- niektóre poziomy pozwalają na użycie technologii hot-
swap celem szybkiej wymiany uszkodzonego napędu, bez zatrzymania
pracy serwera.
Uzyskane podczas pracy z RAIDem parametry eksploatacyjne i
ekonomiczne są lepsze niż w przypadku użycia pojedyńczych dysków o
dużych pojemnościach.
KONIEC
Dziękujemy za poświęcony
czas.
HOME
>>>
<<<
END