3582277772

3582277772



2.2.4 Faza redukcji

[14][15] Faza rediiccji rozpoczyna się niezależnie od skończenia fazy mapowania, oznacza to, że węzłom klastra dla każdego skończonego map task, może zostać przydzielony reduce task (podobnie jak map task z tą różnicą, że wykonuje funkcję redukującą), nie czekając aż pozostałe zostaną ukończone. Oczywistą korzyścią z takiego rozwiązania jest wzrost wydajności. Wejściem dla tego etapu są dane wynikowe fazy mapowania. Wartym wspomnienia jest również to, że ta faza jest opcjonalna i może zostać pominięta w zależności od potrzeb aplikacji.

Na proces redukcji składa się::

•    wejście, którym jest wynik poprzedniej fazy,

•    dla każdego wejścia tworzony jest reduce task i wykonywana jest funkcja redukująca na dostarczonych danych.

•    opcjonalnie, gdy pliki są zbyt rozprzestrzenione w skład procesu może wchodzić proces kopiowania plików, aby dostępne były lokalnie i późniejsze sortowanie danych.

•    interfejs OutputFormat. który (podobnie jak jego odpowiednik w fazie mapowania. InputFormat) opisuje specyfikację wyjścia • typy danych dla pary kluczawartość,

•    wynikiem każdego reduce task jest pik wynikowy zapisywany w systemie plików HDFS. pliki te zostają następnie scalone ze sobą, a dane redukowane po raz ostatni. Uproszczony schemat fazy redukcji można przedstawić w następujący sposób:

(2.10)


< key2,vatue2 > —> reduce ->< key3.mlue,2 >

Fazę redukcji można dodatkowo przyspieszyć oraz zminimalizować obciążenie sieci, poprzez zmniejszenie ilości danych przesyłanych między węzłami dzięki zastosowaniu funkcji łączącej zwanej Combiner function. Funkcja łącząca działa w ten sam sposób co funkcja redukująca, jednak działa ona tuż po wykonaniu fazy mapowania, przed wysłaniem utworzonej struktuy do węzłów wykonujących fazę redukcji.

Podsumowując, algorytm MapReduce jest powszechnie stosowany na dużych zbiorach danych, które w tradycyjny oraz sekwencjonalny sposób przetwarzane byłyby zdecydowanie dłużej. Rozbicie danych na mniejsze fragmenty i dystrybucja na węzły klastra pozwala na równoległe ich przetwarzanie co wiąże się ze znacznym wzrostem wydajności aplikacji opierającej się na tym algorytmie. Przykładem wykorzystania może być analiza dużych ilości tekstu pod kątem zliczania występujących w nim słów. To rozwiązanie najlepiej się sprawdza w takich przypadkach.

18


Wyszukiwarka

Podobne podstrony:
IMAG0683 (4) rurmd icidpii Każda faza leczenia rozpoczyna się sesją dydaktyczną, podczas której tera
DSC03455 ♦ Faza właściwa - rozpoczyna się po wprowadzeniu prac ki do pochwy a podczas wykonywania pe
DSCF0184 FAZA SPOCZYNKU rozpoczyna się z chwilą odłączenia bulwy od stolonu a kończy z chwilą
skanuj0001 FAZY ROZWOJOWE ROŚLIN STRĄCZKOWYCH 4 FAZA KIEŁKOWANIA Rozpoczyna się pobieraniem wody w i
skanuj0002 JL FAZA WSCHODÓW Faza wschodów rozpoczyna się od pojawienia liścieni (u roślin kiełkujący
opinie Q czwartek - piątek 14 -15 sierpnia 2014 r.Jak się zdrowo odżywiać? -porady znajdziesz w
In formacja tlo zadań 14.—15. W czystej wodzie ustala się stan równowagi reakcji autoprotolizy, któr
14 15 Policz, ile dzieci się kąpie.    Policz, ile babek z piasku zrobiła dziewczynka
14 15 Policz, ile dzieci się kąpie. Policz, ile babek z piasku zrobiła dziewczynka.
Pierwsza z nich to faza koncepcji. Sprowadza się ona od wyznaczenia ceny docelowej, zysku docelowego
Chromatografia planarna - cienkowarstwowa TLC Faza ruchoma porusza się dzięki silom kapilarnym. Fazy
SENAT Posiedzenie Senatu Akademickiego Politechniki Poznańskiej - 14 grudnia 2011 r. Senat rozpoczął
skanuj0007 (340) 15.    WYJAŚNIJ CZYM RÓŻNI SIĘ TERAKOTA OD GRESU Gres - płytki niesz
IMG194 (2) 2. Nowa sekwencja rozpoczyna się, zanim jeszcze skończy się pierwsza. Akcję przerywa

więcej podobnych podstron