Microsoft PowerPoint - or_wyklad

OBLICZENIA RÓWNOLEGŁE

I ROZPROSZONE

Temat 2:

Projektowanie algorytmów równoległych -

wprowadzenie

Prowadzący:

dr inż. Zbigniew TARAPATA

pok.225, 306, tel.: 83-95-04

e-mail:

Zbigniew.Tarapata@wat.edu.pl

http://

tarapata.

strefa

.pl

p_obliczenia_rownolegle_i_rozproszone

Z.Tarapata, Obliczenia równoległe i rozproszone, wykład nr 2,

http://tarapata.strefa.pl/p_obliczenia_rownolegle_i_rozproszone/

Plan wykładu

Algorytmy i systemy równoległe –
wprowadzenie;
Algorytmy i systemy równoległe – własności;
Algorytmy i systemy równoległe –

równoległość a

współbieżność, równoległość a rozproszoność;

Podstawowe pojęcia z teorii obliczeń
równoległych – graf AGS jako reprezentacja algorytmu
równoległego;
Podstawowe pojęcia z teorii obliczeń
równoległych – miary efektywności algorytmu
równoległego;

Z.Tarapata, Obliczenia równoległe i rozproszone, wykład nr 2,

http://tarapata.strefa.pl/p_obliczenia_rownolegle_i_rozproszone/

Metody zwiększania efektywności algorytmów -

przypomnienie

Wyróżniamy dwie zasadnicze

metody zwi

kszania

efektywno

ci algorytm

umiejętne zaprojektowanie algorytmu poprzez

stosowanie odpowiednich :
-

struktur danych

(listy, drzewa, kolejki, itp.),

technik projektowania algorytmów

(np. dziel i

zwyciężaj,

zrównoleglanie

, derekursywacja,

itp.);

optymalizacja kodu programu realizującego

algorytm

(zmniejszanie liczby pętli, zastępowanie operacji

arytmetycznych, eliminowanie zmiennych indeksowanych,

umieszczanie wartownika na końcu tablicy, przekazywanie parametrów

funkcji przez wskaźniki, itp.);

Z.Tarapata, Obliczenia równoległe i rozproszone, wykład nr 2,

http://tarapata.strefa.pl/p_obliczenia_rownolegle_i_rozproszone/

Przykład (sortowanie, n – rozmiar tablicy)

Umiejętne projektowanie algorytmów, przykład 1

wykorzystanie odpowiednich struktur danych

- wykorzystywane są kopce

binarne

(n) = O(n log n)

przez kopcowanie
(heapsort)

- działa „w miejscu”

- dla dużych tablic

- oparty o technikę „dziel i

zwyciężaj”

(n) =

Θ(n

)

(n) =

Θ(n log n)

szybkie (quicksort)

- nie działa w miejscu

- oparty o technikę „dziel i

zwyciężaj”

(n) =

Θ(n log n)

przez scalanie

- działa „w miejscu” (tzn. tylko

stała liczba elementów tablicy jest
przechowywana poza tablicą
podczas działania algorytmu)

- dla małych tablic

(n) =

Θ(n

)

- przez proste
wstawianie
- bąbelkowe

Uwagi

Złożoność

Nazwa algorytmu

Z.Tarapata, Obliczenia równoległe i rozproszone, wykład nr 2,

http://tarapata.strefa.pl/p_obliczenia_rownolegle_i_rozproszone/

Sortowanie bąbelkowe

– wykorzystując N/2 (=4)

procesorów przyspieszamy porównywanie
parami elementów tablicy

Umiejętne projektowanie algorytmów, przykład 2

wykorzystanie wielu procesorów = zrównoleglanie

Z.Tarapata, Obliczenia równoległe i rozproszone, wykład nr 2,

http://tarapata.strefa.pl/p_obliczenia_rownolegle_i_rozproszone/

Umiejętne projektowanie algorytmów, przykład 2,

c.d.

wykorzystanie wielu procesorów = zrównoleglanie

Z.Tarapata, Obliczenia równoległe i rozproszone, wykład nr 2,

http://tarapata.strefa.pl/p_obliczenia_rownolegle_i_rozproszone/

Umiejętne projektowanie algorytmów, przykład 2,

c.d.

wykorzystanie wielu procesorów = zrównoleglanie

WNIOSKI

Sekwencyjny algorytm sortowania bąbelkowego
tablicy N-elementowej potrzebuje w najgorszym
przypadku N

czasu.

Równoległy algorytm sortowania bąbelkowego
tablicy N-elementowej potrzebuje w najgorszym
przypadku N czasu

(pomijamy aspekty komunikacyjne między procesorami).

Sortowanie
bąbelkowe –

alg. sekwencyjny

Alg.

równoległy

O(N

)

O(N)

Z.Tarapata, Obliczenia równoległe i rozproszone, wykład nr 2,

http://tarapata.strefa.pl/p_obliczenia_rownolegle_i_rozproszone/

Algorytmy i systemy równoległe - wprowadzenie

CZAS NA BLIŻSZE PRZYJRZENIE SIĘ ALGORYTMOM

RÓWNOLEGŁYM ☺

Używamy wielu procesorów do rozwiązania
pojedynczego zadania (ang. task).
ISTOTA:

Dzielimy zadanie na mniejsze „kawałki”;
Wykonujemy obliczenia na wielu
procesorach (np. każdy „kawałek”
obliczany jest na oddzielnym procesorze);
Koordynujemy zadania cząstkowe i ich
wyniki przekazujemy do zadania
nadrzędnego (koordynującego).

Z.Tarapata, Obliczenia równoległe i rozproszone, wykład nr 2,

http://tarapata.strefa.pl/p_obliczenia_rownolegle_i_rozproszone/

Procesory

Zadania

Algorytmy i systemy równoległe - wprowadzenie,

c.d.

Z.Tarapata, Obliczenia równoległe i rozproszone, wykład nr 2,

http://tarapata.strefa.pl/p_obliczenia_rownolegle_i_rozproszone/

CPU

Pamięć

Interfejs
sieciowy

Algorytmy i systemy równoległe – wprowadzenie,

c.d. - struktura systemu obliczeń równoległych

Z.Tarapata, Obliczenia równoległe i rozproszone, wykład nr 2,

http://tarapata.strefa.pl/p_obliczenia_rownolegle_i_rozproszone/

Algorytmy i systemy równoległe - własności

Korzystanie z systemów obliczeń równoległych

nie

wyprowadza nas poza klasyfikacj

opart

ono

ci obliczeniowej

dla obliczeń

sekwencyjnych.

ywanie wielu procesor

przyspiesza (czasami ☺)

rozwiązywanie problemów lecz

nie zmienia

ich

przynale

ci do klasy z

ono

ci obliczeniowej

Jakich korzy

ci dostarcza zr

wnoleglenie oblicze

Mając algorytm działający w czasie O(N logN)

i log N procesorów, algorytm równoległy

będzie potrzebował

co najmniej

O(N) czasu.

Mając algorytm działający w czasie O(N

) i N

procesorów, algorytm równoległy będzie

potrzebował

co najmniej

O(N

) czasu.

Z.Tarapata, Obliczenia równoległe i rozproszone, wykład nr 2,

http://tarapata.strefa.pl/p_obliczenia_rownolegle_i_rozproszone/

Liczba procesorów jest ograniczona

sprzętowo

;

Zazwyczaj liczba procesorów jest potęgą

Wpływ dodawania nowych procesorów:

Program na jednym procesorze

Uruchamia się w czasie X;

Dodając dodatkowy procesor

Uruchamia się w czasie

nie mniejszym niż

X/2;

W praktyce: w czasie X/2 +

ε z powodu

„kosztów zrównoleglenia”

W skrajnych przypadkach, dodanie procesorów

może nie pomóc, a wręcz spowolnić działanie

programu !!!

Algorytmy i systemy równoległe – własności

Liczba procesorów

Z.Tarapata, Obliczenia równoległe i rozproszone, wykład nr 2,

http://tarapata.strefa.pl/p_obliczenia_rownolegle_i_rozproszone/

Algorytmy i systemy równoległe – własności

Koszty zrównoleglenia obliczeń

Zrównoleglenie

niesie za sobą pewne koszty

Procesory muszą być

sterowane i

koordynowane.

Musimy wskazać każdemu procesorowi, co w
każdej chwili ma robić; to wymaga

dodatkowego

wysiłku

(czasu, kosztu, itp.)

Często program musi być napisany w

specjalnym języku programowania

dla

systemów równoległych (np. w języku Modest).
Często program równoległy (np. z 2

procesorami) nie będzie pracował na innym
komputerze (np. z 2

procesorami).

Z.Tarapata, Obliczenia równoległe i rozproszone, wykład nr 2,

http://tarapata.strefa.pl/p_obliczenia_rownolegle_i_rozproszone/

Algorytmy i systemy równoległe –

Równoległość, a współbieżność

Współbieżność

polega na

wykonywaniu wielu zadań w tym
samym czasie, niezależnie od liczby
użytych procesorów.

Zrównoleglenie

polega na

wykonywaniu tego samego zadania
na wielu procesorach

Z.Tarapata, Obliczenia równoległe i rozproszone, wykład nr 2,

http://tarapata.strefa.pl/p_obliczenia_rownolegle_i_rozproszone/

Algorytmy i systemy równoległe –

Równoległość, a rozproszoność

Zazwyczaj nie do

pominięcia

Pomijalnie małe

nienia

komunikacyjne

mała

duża

Ingerencja sterowania

centralnego

mała

duża

Niezawodno

ść

pol

cze

Może ulegać

zmianom w czasie

Nie ulega zmianom

w czasie

Struktura po

łą

cze

Zazwyczaj duże

małe

Odleg

ci mi

dzy

procesorami

Syst

. oblicz.

rozproszonych

Syst

. oblicz.

wnoleg

ych

Rodzaj

Cechy

systemu

charakteryst.

Z.Tarapata, Obliczenia równoległe i rozproszone, wykład nr 2,

http://tarapata.strefa.pl/p_obliczenia_rownolegle_i_rozproszone/

Algorytmy i systemy równoległe –

Podstawowe kryteria podziału systemów równoległych

Liczba i rodzaj procesorów:

- tysiące procesorów;
- do 10-ciu procesorów;

Obecność sterowania centralnego:

- duża ingerencja systemu w pracę procesorów
(system decyduje co każdy procesor ma
wykonywać w każdej chwili);
- mała ingerencja systemu w pracę procesorów;

Obecność synchronizacji obliczeń:

- systemy synchroniczne;
- systemy asynchroniczne.

Z.Tarapata, Obliczenia równoległe i rozproszone, wykład nr 2,

http://tarapata.strefa.pl/p_obliczenia_rownolegle_i_rozproszone/

Algorytmy i systemy równoległe –

Podstawowe kryteria podziału systemów równoległych, c.d.

Wymiana informacji między procesorami
(komunikacja poprzez sieć połączeń –

wybór

struktury połączeń jest zadaniem projektowym

- podział wspólnej pamięci między procesory oraz
obecność systemu przełączającego;
- każdy procesor ma własną pamięć.

Z.Tarapata, Obliczenia równoległe i rozproszone, wykład nr 2,

http://tarapata.strefa.pl/p_obliczenia_rownolegle_i_rozproszone/

S – Single,
M – Multiple,
I – Instruction,
D – Data.

Rodzaj strumienia danych

pojedynczy grupowy

pojedynczy

SISD

SIMD

Rodzaj

strumienia

instrukcji

grupowy

MISD

MIMD

Algorytmy i systemy równoległe –

Podstawowe kryteria podziału systemów równoległych, c.d.

Z.Tarapata, Obliczenia równoległe i rozproszone, wykład nr 2,

http://tarapata.strefa.pl/p_obliczenia_rownolegle_i_rozproszone/

Algorytmy i systemy równoległe –

Podział komputerów typu MIMD

Sposób komunikacji poprzez

Wspólne

zmienne

Przesyłanie

komunikatów

globalna

GMSV

„Shared Memory”

GMMP

Sposób

organizacji

pamięci

rozproszona

DMSV

„Hybrid”

DMMP

„Message passing”

Z.Tarapata, Obliczenia równoległe i rozproszone, wykład nr 2,

http://tarapata.strefa.pl/p_obliczenia_rownolegle_i_rozproszone/

Intel ASCI Red

(Accelerated Strategic

Computing Initiative) – 1996-2010 r., do

modelowania zjawisk związanych

z zastosowaniem broni jądrowej

(9632 procesory P II Xeon 333 MHz,

moc: 2,3 T FLOPS

;

rozwiązanie układu 215 000 równań liniowych

zajęło 100 min., ale użyto procesorów 200 MHz

7 000);

dla porównania:

- procesor PENTIUM-IV 1 GHz ma moc

∼1,4 G FLOPS (1,4⋅10

FLOPS)

- moc Deep Blue z 1997 r.:

∼ 10 G FLOPS.

Algorytmy i systemy równoległe –

Przykłady zastosowań

Z.Tarapata, Obliczenia równoległe i rozproszone, wykład nr 2,

http://tarapata.strefa.pl/p_obliczenia_rownolegle_i_rozproszone/

IBM SP ASCI Blue Pacific

(Lawrence Livermore

National Laboratory) –system RS/6 000, 4

× 1464

Power PC 332 MHz,

moc: 2,1 T FLOPS
RAM: 2,6 TB,
koszt: 94 mln $,
powierzchnia: 740 m

Algorytmy i systemy równoległe –

Przykłady zastosowań

Z.Tarapata, Obliczenia równoległe i rozproszone, wykład nr 2,

http://tarapata.strefa.pl/p_obliczenia_rownolegle_i_rozproszone/

IBM ASCI White

: 8192 procesory IBM Power3-III

375 MHz,

moc: 10 T FLOPS,

RAM: 6TB (pamięć zewnętrzna: 160 TB),
koszt: 100 mln $,
powierzchnia: ok. 1000m

waga: 106 ton,
pobierany prąd: 1.2 MW

Ciekawostka nr 1:

wierne zasymulowanie wybuchu jądrowego

zajmuje ASCI White miesiąc !!!

Dla porównania Cray z 1995 roku liczyłby to

samo przez 60 tys. lat!!

Algorytmy i systemy równoległe –

Przykłady zastosowań

Z.Tarapata, Obliczenia równoległe i rozproszone, wykład nr 2,

http://tarapata.strefa.pl/p_obliczenia_rownolegle_i_rozproszone/

Najszybszy do niedawna system na świecie (od 2002r.-
do2007r.):

japoński Earth Simulator

(do symulacji

złożonych zjawisk geologicznych i pogodowych),

moc: 40 T FLOPS,
koszt: 350 mln $.

W ramach programu „Blue Gene” firmy IBM

powstał w 2007 r. (na bazie 212992 x PowerPC 440
770MHz);
73728 GB pamięci;
maszyna o wydajności 0,5 PFLOPS (0,5*10

FLOPS) do

analizy genomu ludzkiego

Źródło: http://www.top500.org.

Algorytmy i systemy równoległe –

Przykłady zastosowań

Z.Tarapata, Obliczenia równoległe i rozproszone, wykład nr 2,

http://tarapata.strefa.pl/p_obliczenia_rownolegle_i_rozproszone/

Najszybszy obecnie system na świecie (11.2008):

Roadrunner

BladeCenter

QS22

Cluster

Miejsce: DOE/NNSA/LANL (Los Alamos, USA);
129600 x PowerXCell 8i 3.2 Ghz, OS Linux;
moc: 1,1 PFLOPS (10

FLOPS) !!!!!!!

Najszybszy w Polsce system (łącznie z Polski 6 na liście top500,

11.2008):

Galera ACTION Cluster Xeon E5345 Infiniband (67 miejsce.

11.2008);
Politechnika Gdańska;
Pamięć: 5376 GB;
Procesory: 5336 x Intel EM64T Xeon 53xx (Clovertown) 2333

MHz (9.332 GFlops);
OS: Linux;
Moc: 38 GFLOPs;

Źródło: http://www.top500.org

Algorytmy i systemy równoległe –

Przykłady zastosowań

Z.Tarapata, Obliczenia równoległe i rozproszone, wykład nr 2,

http://tarapata.strefa.pl/p_obliczenia_rownolegle_i_rozproszone/

Podstawowe pojęcia z teorii obliczeń równoległych

Przykład

(problem doboru topologii sieci komunikacyjnej)

Topologie połączeń MIMD: a) pierścień b) siatka c) drzewo d) hipersześcian

Z.Tarapata, Obliczenia równoległe i rozproszone, wykład nr 2,

http://tarapata.strefa.pl/p_obliczenia_rownolegle_i_rozproszone/

Podstawowe pojęcia z teorii obliczeń równoległych

Przykład

(problem doboru topologii sieci komunikacyjnej), c.d.

Łączność (długość najkrótszej z dróg między dowolną parą wierzchołków)

w warunkach najgorszego przypadku

16 skoków

254 skoki

16384

11 skoków

126 skoków

2048

10 skoków

62 skoki

1024

8 skoków

30 skoków

256

4 skoki

6 skoków

Hipersześcian

Siatka

Liczba węzłów

Z.Tarapata, Obliczenia równoległe i rozproszone, wykład nr 2,

http://tarapata.strefa.pl/p_obliczenia_rownolegle_i_rozproszone/

Podstawowe pojęcia z teorii obliczeń równoległych

Przykład

(problem doboru topologii sieci komunikacyjnej), c.d.

Chcemy dodać do siebie 8 liczb x

, x

,...,x

(a)

(b)

Dwie możliwe topologie sieci komunikacyjnej: (a) i (b)

Porównanie topologii (a) i (b):

•Dla topologii

(a) uszkodzenie tylko jednego wierzchołka

(procesora) może spowodować, że

cała sieć

„rozpadnie się”

na dwie części nie mogące komunikować się między sobą.

Graf

z rysunku (b) może działać dalej nawet jeśli dwa procesory są uszkodzone

;

•Największa odległość między parą wierzchołków (mierzona za pomocą liczby krawędzi w drodze je
łączącej) w grafie (a) wynosi 4 (dla dwóch wierzchołków) podczas, gdy w grafie (b) ta odległość wynosi 3.

Z.Tarapata, Obliczenia równoległe i rozproszone, wykład nr 2,

http://tarapata.strefa.pl/p_obliczenia_rownolegle_i_rozproszone/

Zanurzenie sieci (a) w sieć (b).

Wierzchołki g, s, d są obrazami, odpowiednio,

wierzchołków górnego, środkowych i dolnych
grafu.

Podstawowe pojęcia z teorii obliczeń równoległych

Przykład

(problem doboru topologii sieci komunikacyjnej), c.d.

Z.Tarapata, Obliczenia równoległe i rozproszone, wykład nr 2,

http://tarapata.strefa.pl/p_obliczenia_rownolegle_i_rozproszone/

Podstawowe pojęcia z teorii obliczeń równoległych

AGS

- acykliczny graf skierowany G,

W - zbiór wierzchołków oznaczających
operacje wykonywane na danych,
A - zbiór łuków oznaczających zależności
między danymi,

Głębokością D

grafu AGS nazywamy

długość najdłuższej drogi w G.













∈

olku

w wierzch

operacji

wynik

ykorzystuj

wierzchol

operacja w

)

(

Z.Tarapata, Obliczenia równoległe i rozproszone, wykład nr 2,

http://tarapata.strefa.pl/p_obliczenia_rownolegle_i_rozproszone/

p – potęgowanie
* – mnożenie
+ – dodawanie

Weźmy zadanie obliczeniowe:

Przykładowy graf AGS:

( )

⋅

Podstawowe pojęcia z teorii obliczeń równoległych

Przykład 1

Z.Tarapata, Obliczenia równoległe i rozproszone, wykład nr 2,

http://tarapata.strefa.pl/p_obliczenia_rownolegle_i_rozproszone/

Podstawowe pojęcia z teorii obliczeń równoległych

Przyjmijmy oznaczenia:

- wynik operacji wykonywanej w wierzchołku

i grafu AGS;
f

- operacja związana z wierzchołkiem i;

- numer procesora przyporządkowanego do

wykonywania operacji w i-tym wierzchołku,

- zbiór wierzchołków wejściowych);

- chwila zakończenia operacji w i-tym

wierzchołku.

∈

Z.Tarapata, Obliczenia równoległe i rozproszone, wykład nr 2,

http://tarapata.strefa.pl/p_obliczenia_rownolegle_i_rozproszone/

Założenia:

wierzchołkom wejściowym nie są
przyporządkowane żadne procesory;
chwila t

zakończenia operacji w każdym

wierzchołku wejściowym jest równa 0;
każdy procesor wykonuje co najwyżej jedną
operację w danej chwili, tzn. jeżeli ,

oraz ,

to ;

jeżeli

, to

co oznacza, że

operacja związana z wierzchołkiem j może być
wykonana dopiero po wykonaniu operacji
związanej z i-tym wierzchołkiem.

∈

≠

Podstawowe pojęcia z teorii obliczeń równoległych

( )

∈

≥

Z.Tarapata, Obliczenia równoległe i rozproszone, wykład nr 2,

http://tarapata.strefa.pl/p_obliczenia_rownolegle_i_rozproszone/

Algorytm obliczeń równoległych jest zadany, gdy:

zadany jest graf AGS;

zadany jest harmonogram

( )

( ) (

)

{

}

≠

Podstawowe pojęcia z teorii obliczeń równoległych

Dysponując np. dwoma

procesorami jeden z możliwych

harmonogramów może wyglądać

następująco:

(

) (

)

(

) (

)













)

Z.Tarapata, Obliczenia równoległe i rozproszone, wykład nr 2,

http://tarapata.strefa.pl/p_obliczenia_rownolegle_i_rozproszone/

Złożonością

obliczeniową

algorytmu

Alg

reprezentowanego przez

AGS

i wykorzystującego p procesorów nazywamy
wielkość:

gdzie:

- czas realizacji harmonogramu H.

H – zbiór wszystkich harmonogramów realizujących

rozpatrywany algorytm równoległy Alg;

( )

∈

max

min

( )

∈

max

Podstawowe pojęcia z teorii obliczeń równoległych

Z.Tarapata, Obliczenia równoległe i rozproszone, wykład nr 2,

http://tarapata.strefa.pl/p_obliczenia_rownolegle_i_rozproszone/

Zdefiniujmy wielkość:

jest nierosnącą funkcją i ograniczoną od dołu

przez 0.

Istnieje taka liczba procesorów p

, że dla każdego

, zachodzi

złożoność obliczeniowa algorytmu reprezentowanego

przez G, gdy dostatecznie duża liczba procesorów jest

dostępna;

- złożoność obliczeniowa (czas) odpowiadająca

algorytmowi sekwencyjnemu na jednym procesorze, przy
czym

Podstawowe pojęcia z teorii obliczeń równoległych

min

≥

∞

≥

∞

= T

∞

Z.Tarapata, Obliczenia równoległe i rozproszone, wykład nr 2,

http://tarapata.strefa.pl/p_obliczenia_rownolegle_i_rozproszone/

Twierdzenie

• Wielkość

∞

jest równa głębokości

grafu AGS.

•

∞

≥

∀ p

Twierdzenie

Niech dla pewnego wierzchołka wyjściowego j istnieje droga z
każdego wierzchołka wejściowego.
Niech

∈

∀

zachodzi:

)

(

≤

gdzie

}

)

(

{

)

(

∈

- stopień wewnętrzny wierzchołka i.

Wówczas zachodzi:

log

≥

∞

Podstawowe pojęcia z teorii obliczeń równoległych

Z.Tarapata, Obliczenia równoległe i rozproszone, wykład nr 2,

http://tarapata.strefa.pl/p_obliczenia_rownolegle_i_rozproszone/

Wnioski:

Dla operacji arytmetycznych założenie, że

jest naturalne i dotyczy fizycznej

realizowalności operacji.
Głębokość AGS jest nie mniejsza niż logarytm
przy podstawie 2 z liczby wierzchołków
wejściowych w AGS.

)

(

≤

Podstawowe pojęcia z teorii obliczeń równoległych

Z.Tarapata, Obliczenia równoległe i rozproszone, wykład nr 2,

http://tarapata.strefa.pl/p_obliczenia_rownolegle_i_rozproszone/

Twierdzenie

Dla każdego

≥

zachodzi:

≤

∞

Podstawowe pojęcia z teorii obliczeń równoległych

Dowód:

Rozpatrzmy

harmonogram

∞

, którego realizacja trwa

∞

, tzn.

optymalny harmonogram realizacji obliczeń dla zadanego grafu G,
gdy dostatecznie duża liczba procesorów jest dostępna.
Dla dodatniej liczby całkowitej k wykorzystując harmonogram

∞

wprowadźmy zbiór:

}

{

∈

Z.Tarapata, Obliczenia równoległe i rozproszone, wykład nr 2,

http://tarapata.strefa.pl/p_obliczenia_rownolegle_i_rozproszone/

Dowód, c.d.

Zbudujemy etapowo dla tego samego grafu G harmonogram

, który

wykorzystuje tylko p procesorów.
W k-tym etapie tego nowego harmonogramu wykonamy operacje, które
w harmonogramie

∞

zakończyły się dokładnie w chwili k-tej.

Ponieważ tylko p procesorów jest dostępnych, k-ty etap będzie zrealizowany

w czasie









jednostek czasu.

Czas T

nie może być większy niż czas wymagany do zrealizowania

harmonogramu

Stąd:

∞





















≤

∑

∞

gdzie

∑

∞

c.n.d.

Podstawowe pojęcia z teorii obliczeń równoległych

Z.Tarapata, Obliczenia równoległe i rozproszone, wykład nr 2,

http://tarapata.strefa.pl/p_obliczenia_rownolegle_i_rozproszone/

Podstawowe pojęcia z teorii obliczeń równoległych

Przykład (dwie alternatywne reprezentacje AGS dla zadania)

Rozpatrzmy

zadanie:

(

) (

)

⋅

(

)(

)

∞

AGS 1

(

)(

)

∗

∞

AGS 2

WNIOSEK:

Dla tego samego
problemu może
istnieć wiele
reprezentacji w
postaci AGS
różniących się
wartościami

oraz

p*.

∞

Z.Tarapata, Obliczenia równoległe i rozproszone, wykład nr 2,

http://tarapata.strefa.pl/p_obliczenia_rownolegle_i_rozproszone/

Podstawowe pojęcia z teorii obliczeń równoległych

Niech G oznacza zbiór wszystkich możliwych

AGS-ów dla ustalonego problemu i ustalonej

liczby procesorów.

Wielkość

nazywamy

złożonością problemu

nazywamy

złożonością algorytmu równoległego

przy p procesorach

, a G* nazywamy

optymalnym grafem

reprezentującym algorytm

rozwiązania danego problemu przy ustalonej

liczbie p procesorów.

( )

min

∈

∗

( )

Z.Tarapata, Obliczenia równoległe i rozproszone, wykład nr 2,

http://tarapata.strefa.pl/p_obliczenia_rownolegle_i_rozproszone/

Przyspieszeniem

algorytmu równoległego nazywamy liczbę

efektywnością

algorytmu równoległego liczbę

gdzie:

(n) – złożoność najlepszego sekwencyjnego algorytmu

na jednym procesorze (jeśli mamy AGS, to T

(n) = T

(n));

(n) – złożoność algorytmu rozwiązywania problemu

o rozmiarze n na p procesorach.

( )

≤

∗

( )

≤

⋅

∗

Podstawowe pojęcia z teorii obliczeń równoległych

Z.Tarapata, Obliczenia równoległe i rozproszone, wykład nr 2,

http://tarapata.strefa.pl/p_obliczenia_rownolegle_i_rozproszone/

Zadanie obliczeniowe ma posta

Przy użyciu n

procesorów zadanie to można

rozwiązać w czasie

dwuetapowo

pierwszym etapie

każdy i-ty procesor oblicza

wartość

, a następnie

w drugim etapie

dodaje

n uzyskanych liczb w czasie

Najlepszy algorytm dla jednego procesora wymaga

czasu

Stąd przyspieszenie

i efektywność dla n procesorów:

Podstawowe pojęcia z teorii obliczeń równoległych

Przykład

ℜ

∈

⋅

∑

( )





log

⋅





log

( )

−

∗

( )





log

−

( )





(

)

log

−

Z.Tarapata, Obliczenia równoległe i rozproszone, wykład nr 2,

http://tarapata.strefa.pl/p_obliczenia_rownolegle_i_rozproszone/

np. dla n=3, mamy następujący AGS

Podstawowe pojęcia z teorii obliczeń równoległych

Przykład, c.d.

⋅

H*(G)={(7,1,1),(8,2,1),(9,3,1),(10,1,2),(11,1,3)}





log

⋅

∗

∞

( )

(

)

max

min

∈

Z.Tarapata, Obliczenia równoległe i rozproszone, wykład nr 2,

http://tarapata.strefa.pl/p_obliczenia_rownolegle_i_rozproszone/

Dziękuję za uwagę