Beowulf HOWTO: Wstęp
Następna strona
Poprzednia strona
Spis treści
2. Wstęp
Jako że wydajność sprzętu komputerowego i sieciowego wciąż rośnie, a jego
ceny spadają, bardziej praktyczne niż kupowanie bardzo kosztownego
superkomputera staje się budowanie równoległych systemów obliczeniowych ze
składników dostępnych w każdym sklepie. W rzeczywistości wskaźnik wydajności
do ceny maszyny typu Beowulf jest od trzech do dziesięciu razy wyższy niż
tradycyjnych superkomputerów. Architektura Beowulf jest łatwo skalowalna,
łatwa w budowie i płaci się jedynie za sprzęt, jako że większość
oprogramowania jest darmowa.
2.1 Kto powinien czytać ten dokument?
To HOWTO jest zaprojektowane dla osoby mającej przynajmniej podstawowe
doświadczenie z systemem operacyjnym Linux. Znajomość technologii Beowulf
czy rozumienie bardziej złożonych koncepcji związanych z systemami
operacyjnymi i sieciami nie jest konieczne, ale podstawowa wiedza o
przetwarzaniu równoległym będzie przydatna (w końcu musisz mieć jakiś powód,
czytając ten dokument). To HOWTO nie odpowie na wszystkie możliwe pytania na
temat Beowulf'a, ale być może da ci pomysły i poprowadzi we właściwym
kierunku. Celem tego dokumentu jest udzielenie podstawowych informacji,
oraz odnośników do bardziej zaawansowanych dokumentów.
2.2 Czym jest Beowulf?
Famed was this Beowulf: far flew the boast of him, son of Scyld,
in the Scandian lands. So becomes it a youth to quit him well with
his father's friends, by fee and gift, that to aid him, aged, in after
days, come warriors willing, should war draw nigh, liegemen loyal: by
lauded deeds shall an earl have honor in every clan. Beowulf to
najstarszy zachowany poemat epicki w języku angielskim. Jest to opowieść o
bohaterze dysponującym wielką siłą i odwagą, który pokonał potwora zwanego
Grendel. Patrz do działu
Historia aby dowiedzieć
się więcej o walecznym Beowulf'ie.
Prawdopodobnie istnieje co najmniej tyle definicji Beowulf'a, ile ludzi
którzy budowali lub korzystali z architektury superkomputera Beowulf.
Niektórzy twierdzą że system może zostać nazwany Beowulf tylko jeśli został
zbudowany tak samo, jak oryginalna maszyna NASA. Inni zmierzają do drugiej
skranności, nazywając imieniem Beowulf każdy system stacji roboczych
wykonujących kod równoległy. Moja definicja Beowulf'a mieści się mniej
więcej pośrodku, i jest oparta na wielu opiniach z listy dyskusyjnej
Beowulf'a:
Beowulf to wielo-komputerowa architektura która może zostać użyta do
obliczeń równoległych. Jest to system, który na ogól składa się z jednego
węzłą-serwera i jednego lub więcej węzła-klienta połączonego przez Ethernet
lub jakąś inną sieć. Jest to system zbudowany w oparciu o powszechnie
dostępne komponenty sprzętowe, jak każdy PC zdolny do uruchomienia Linuxa,
standardowe karty Ethernet i switch'e. Nie zawiera żadnych unikalnych
komponentów sprzętowych i jest łatwy w tworzeniu. Beowulf korzysta również
ze zwykłego oprogramowania, jak system operacyjny Linux, Parallel Virtual
Machine (PVM) oraz Message Passing Interface (MPI). Węzeł-serwer kontroluje
cały klaster i udostępnia pliki klientom. Pełni on także funkcję konsoli
klastra i jest jego bramą do zewnętrznego świata. Duże maszyny Beowulf mogą
posiadać więcej niż jeden węzeł-serwer, oraz inne węzły stworzone dla
specyficznych zadań, na przykład konsole lub stacje monitorujące. W
większości przypadków węzły-klienci w systemie Beowulf są głupie, im głupsze
tym lepiej. Węzły są konfigurowane i kontrolowane przez węzeł-serwer, i
robią tylko to, co kazano im robić. W konfiguracji bezdyskowej klienci nie
znają nawet swojego adresu IP lub nazwy, dopóki serwer im ich nie poda.
Jedną z podstawowych różnic pomiędzy Beowulf'em a architekturą Cluster of
Workstations (COW) jest to, że Beowulf zachowuje się bardziej jak jedna
maszyna, niż wiele stacji roboczych. W większości przypadków węzły-klienci
nie posiadają klawiatur czy monitorów, a dostęp do nich jest możliwy jedynie
przez odległe logowanie bądz opcjonalny terminal szeregowy. Wezły Beowulf
można sobie wyobrazić jako pakiej CPU + pamięć, który może zostać podłączony
do klastra, tak jak CPU czy moduł pamięci może zostać dołączony do płyty
głównej.
Beowulf to nie żaden specjalny pakiet oprogramowania, nowa topologia sieci
czy nowa nakładka na jądro. Beowulf to technologia łączenia komputerów Linux
aby utworzyć równoległy, wirtualny superkomputer. Chociaż istnieje wiele
pakietów oprogramowania, takich jak modyfikacje jądra, biblioteki PVM i MPI,
narzędzia konfiguracyjne, które przyspieszają architekturę Beowulf,
ułatwiają konfigurację i zwiększają użyteczność, jednak możliwe jest
zbudowanie maszyny Beowulf wykorzystując standardową dystrybucję Linux, bez
żadnego dodatkowego oprogramowania. Jeśli masz przynajmniej dwa usieciowione
komputery Linux które dzielą przynajmniej katalog /home poprzez
NFS, i ufają sobie nawzajem na tyle, aby uruchomić odległą powłokę (rsh),
możesz się upierać że dysponujesz prostą, dwu-węzłową maszyną Beowulf.
2.3 Klasyfikacja
Systemy Beowulf za konstruowane z różnorodnych części. W celu zwiększenia
możliowści obliczeniowych czasami korzysta cię z pewnych niedostępnych
powszechnie komponentów (tzn. produkowanych przez pojedynczego producenta).
W celu odróżnienia osiągów różnych typów systemów, i ułatwienia dyskusji na
ich temat, proponujemy następującą klasyfikację:
BEOWULF KLASY I:
Maszyna tej klasy jest zbudowana wyłącznie z powszechnie dostępnych
komponentów. W celu sprawdzenia powszechności elementów przeprowadzmy test
przy użyciu "Computer Shopper" (calowej grubości miesięcznika/katalogu
systemów PC i komponentów). Test ten wygląda następująco:
Beowulf KLASY I to maszyna, która może zostać skonstruowana z części
znalezionych przynajmiej w 3 krajowych/ogólnoświatowych katalogach
reklamowych.
Zalety systemów KLASY I to:
sprzęt dostępny z wielu źródel (niskie ceny, łatwa konserwacja)
niezależnośc od konkretnego producenta
wsparcie standardowych sterowników Linux
najczęściej oparte o standardy (SCSI, Ethernet itp.)
Wady systemów KLASY I to:
najlepsza wydajność może wymagać sprzętu KLASY II
BEOWULF KLASY II
Beowulf KLASY II to po prostu każda maszyna która nie przejdzie testu z
użyciem "Computer Shopper". To nie jest coś złego, jest to jedynie
klasyfikacja maszyny.
Zalety systemów KLASY II to:
całkiem dobra wydajność!
Wady systemów KLASY II to:
problemy ze sterownikami
zależność od konkretnego producenta
może być droższy niż system klasy I
Żadna KLASA nie jest lepsza niż inna. Wszystko zależy wyłącznie do potrzeb i
możliwości finansowych. Ta klasyfikacja została utworzona jedynie w celu
ułatwienia i większej zwięzłości dyskusji na temat systemów Beowulf. Dział
"Projektowanie systemu" może pomóc ustalić, który typ systemu pardziej
pasuje do twoich potrzeb.
Następna strona
Poprzednia strona
Spis treści
Wyszukiwarka
Podobne podstrony:
beowulf howto pl 3beowulf howto pl 1beowulf howto pl 6beowulf howto plBeowulf HOWTO plbeowulf howto pl 4beowulf howto pl 5beowulf howto plbootdisk howto pl 8PPP HOWTO pl 6 (2)NIS HOWTO pl 1 (2)cdrom howto pl 1jtz howto pl 5Keystroke HOWTO pl (2)PostgreSQL HOWTO pl 14printing howto pl 5debian apt howto plKernel HOWTO pl 12 (2)XFree86 HOWTO pl (3)więcej podobnych podstron