11 MPI Definicja standardu 3

11. MPI: Definicja standardu

ęść

III

Operacje grupowe

Operacje grupowe

anga

ce wszystkie procesy

danego komunikatora
- domy

lnie, procesy nale

żą

MPI_COMM_WORLD

- programista odpowiada za to,

e wszystkie procesy

komunikatora uczestnicz

w operacjach grupowych

Rodzaje operacji grupowych

synchronizacja

(czekanie na osi

gni

cie zadanego punktu)

przesyłanie danych

(ró

ne rodzaje)

wspólne obliczenia

(redukcje)

Operacje grupowe (2)

Zasady ogólne

- operacje grupowe s

blokuj

- operacje grupowe nie korzystaj

z etykiet

komunikatów

- operacje na podzbiorach procesów wymagaj

uprzedniego utworzenia grup i przekształcenia ich
w nowe komunikatory

- nie mo

na stosowa

własnych typów danych

Operacje grupowe (3)

int MPI_Barrier (MPI_Comm comm)

zatrzymanie bie

żą

cego procesu a

do chwili, gdy wszystkie

procesy komunikatora

comm

wywołaj

funkcj

[

ródło: jedrzej.ulasiewicz.staff.iiar.pwr.wroc.pl/Progr-Wspol-i-Rozprosz/wyklad/MPI14.pdf

Operacje grupowe (4).

Rozg

aszanie

int MPI_Bcast(void *buffer,\
int count, MPI_Datatype datatype,\
int root, MPI_Comm comm)

rozgłaszanie komunikatu (ang. broadcast) z bufora

buffer

przez dowolny proces

root

do wszystkich procesów

komunikatora

comm

;

count

datatype

– liczba elementów

i typ wysyłanych danych

Proces 0

Proces 1

Proces P

Proces 0

Proces 1

Proces P

MPI_Bcast

Stan PO wykonaniu

procedury

#include <stdio.h>

#include <string.h>

#include <stdlib.h>

#include <mpi.h>

Oprac. LS na podstawie:

http://d3s.mff.cuni.cz/~ceres/sch/mwy/text/ch06s07s05.php

int main (int iArgC, char *apArgV [])

{

int iRank;

int iLength;

int iSize;

char *pMessage;

char acMessage [] = "Hello World !";

MPI_Init (&iArgC, &apArgV);

MPI_Comm_rank (MPI_COMM_WORLD, &iRank);

MPI_Comm_size (MPI_COMM_WORLD, &iSize);

if (iRank == 0)

{ iLength = sizeof (acMessage);

MPI_Bcast (&iLength, 1, MPI_INT, 0, MPI_COMM_WORLD);

MPI_Bcast (acMessage, iLength, MPI_CHAR, 0, MPI_COMM_WORLD);

printf ("Process 0: Message '%s' sent to %d recipient(s).\n", acMessage, iSize-1);

}

else

{

MPI_Bcast (&iLength, 1, MPI_INT, 0, MPI_COMM_WORLD);

pMessage = (char *) malloc (iLength);

MPI_Bcast (pMessage, iLength, MPI_CHAR, 0, MPI_COMM_WORLD);

printf ("Process %d: Message received '%s'\n", iRank, pMessage);

}

MPI_Finalize ();

return (0);

}

Program #1.

Broadcast

Kompilacja i uruchomienie. Program #1

[root@p205 openMPI]#

mpicc broadcast.c -o broadcast

[root@p205 openMPI]#

mpirun -n 1 --mca btl tcp,self broadcast

Process 0: Message 'Hello World !' sent to 0 recipient(s).

[root@p205 openMPI]#

mpirun -n 4 --mca btl tcp,self broadcast

Process 0: Message 'Hello World !' sent to 3 recipient(s).

Process 2: Message received 'Hello World !'

Process 1: Message received 'Hello World !'

Process 3: Message received 'Hello World !'

[root@p205 openMPI]#

Operacje grupowe (5).

Rozsy

anie

int MPI_Scatter( \
void *sendBuf,int sendCnt,MPI_Datatype sendType,\
void *recvBuf,int recvCnt,MPI_Datatype recvType,\
int root, MPI_Comm comm)

proces

root

dzieli dane z bufora nadawczego

sendBuf

na segmenty

o jednakowej długo

sendCnt

elementów i rozsyła je do buforów odbiorczych

recvBuf

wszystkich procesów komunikatora

comm

(ł

cznie z procesem-

nadawc

);

sendCnt/recvCnt

oraz

sendType/recvType

– odpowiednio

liczba elementów i typ danych wysyłanych/odbieranych

Proces 0

Proces 1

Proces P

Proces 0

Proces 1

Proces P

MPI_Scatter

Stan PO

wykonaniu

procedury

Dane

sendBuf

recvBuf

Operacje grupowe (6)

Przykładowe u

ycie

MPI_Scatter()

…

MPI_COMM comm;

// komunikator

int grpSize;

// liczba procesów

int *sendBuf;

// wsk. bufora nadawczego

int rootProc;

// nr procesu nadawczego,

int recvBuf[80];

// bufor odbiorczy

…

MPI_Comm_size(comm, &grpSize);

// pobranie liczby procesów

sendBuf = (int *)malloc(grpSize*80+sizeof(int));

//utworz. bufora nadawczego i przypisanie wska

nika

MPI_Scatter

(sendBuf,80,MPI_INT,recvBuf,80,MPI_INT,rootProc,comm);

//rozesłanie fragmentów danych po 80 liczb do procesów

Operacje grupowe (7).

Gromadzenie

int MPI_Gather( \

void *sendBuf,int sendCnt,MPI_Datatype sendType,\

void *recvBuf,int recvCnt,MPI_Datatype recvType,\

int root, MPI_Comm comm)

procesy nale

żą

ce do komunikatora

comm

przesył

do procesu

root

fragmenty

danych o długo

sendCnt

jednostek typu

sendType

z bufora

sendBuf

; proces

root

gromadzi (scala) te dane i umieszcza w buforze

recvBuf

w kolejno

numeracji procesów

MPI_Gather

Stan PO

wykonaniu

procedury

Proces 0

Proces 1

Proces P

Dane

Proces 0

Proces 1

Proces P

Dane

sendBuf

recvBuf

Operacje grupowe (8)

Przykładowe u

ycie

MPI_Gather()

…

MPI_COMM comm;

// komunikator

int grpSize;

// liczba procesów

int sendBuf[80];

// bufora nadawczy

int rootProc;

// nr procesu odbiorczego,

int procID;

// nr procesu bie

żą

cego

int *recvBuf;

// wsk. bufora odbiorczego

…

MPI_Comm_rank(comm, &procID);

if (procID == rootProc)

{ MPI_Comm_size(comm, &grpSize);

// pobranie liczby procesów

recvBuf = (int *)malloc(grpSize*80+sizeof(int));

//utworz. bufora nadawczego i przypisanie wska

nika

}

MPI_Gather
(sendBuf,80,MPI_INT,recvBuf,80,MPI_INT,rootProc,comm);

//pobranie fragmentów danych po 80 liczb od wszystkich procesów

//i umieszczenie ich kolejno w buforze

recvBuf

Inne operacje grupowe.

Redukcja

int MPI_Reduce ((void *)sendBuf,\

(void *)recvBuf, int cnt,\

MPI_Datatype dataType, MPI_Op opType,\

int root, MPI_Comm comm)

wykonanie przez proces

root

oblicze

na danych zwróconych

przez wszystkie procesy komunikatora

comm

w buforach

sendBuf

; obliczenia polegaj

na wykonaniu operacji typu

opType

na danych typu

dataType

o długo

cnt

, a wynik

umieszczany jest w buforze

recvBuf

Schemat post

powania przy podziale domeny

int buforDomeny[bufSize]

Domena wej

ciowa

(uporz

dkowany

zbiór danych)

buforFragmentu

Uporz

dkowany

zbiór poddomen

MPI_Bcast(bufSize, 1, MPI_INT,…)

MPI_Scatter(buforDomeny,&bufSize,MPI_INT,…,\

buforFragmentu,…)

Operacja
rozpraszania:

- Wielko

ci bufora,

- Danych wej

ciowych

Obliczenia

lokalne

Obliczenia

lokalne

Obliczenia

lokalne

MPI_Gather(buforWynikowyDomeny,&bufSize,\

MPI_INT,…,buforFragmentu,…)

int buforWynikowyDomeny[bufSize]

Domena wynikowa
(uporz

dkowany

zbiór wyników)

Operacja
scalania
Danych: np.
Gather, Reduce

#include <mpi.h>

#include <math.h>
#include <stdio.h>
/*
Oprac. LS na podstawie
http://www.mcs.anl.gov/research/projects/mpi/usingmpi/examples/simplempi/main.htm
*/
int main(int argc, char *argv[])
{

int n, myid, numprocs, i, rc;
double PI25DT = 3.141592653589793238462643;
double mypi, pi, h, sum, x, a;
double t_begin, t_end;

MPI_Init(&argc,&argv);
MPI_Comm_size(MPI_COMM_WORLD,&numprocs);
MPI_Comm_rank(MPI_COMM_WORLD,&myid);

while (1) // p

tla dla wielokrotnych oblicze

{ if (myid == 0)

{

printf("Enter the number of intervals: (0 quits)\n ");
scanf("%d",&n);

t_begin = MPI_Wtime();

}

MPI_Bcast(&n, 1, MPI_INT, 0, MPI_COMM_WORLD);

if (n == 0) break;
h = 1.0 / (double) n;
sum = 0.0;
for (i = myid + 1; i <= n; i += numprocs)
{ x = h * ((double)i - 0.5);

sum += 4.0 / (1.0 + x*x);

}
mypi = h * sum;

MPI_Reduce(&mypi, &pi, 1, MPI_DOUBLE, MPI_SUM, 0, MPI_COMM_WORLD);

if (myid == 0)
{ printf("pi is approximately %.16f, Error is %.16f\n", pi, fabs(pi - PI25DT));

t_end = MPI_Wtime();

printf("Time elapsed: %.12f [s]\n", t_end-t_begin);

}

MPI_Finalize();

return 0;

}

Program #2. Obliczanie

przez ca

kowanie

Kompilacja i uruchomienie. Program #2

[root@p205 openMPI]#

./mcc MPI-pi

[root@p205 openMPI]#

./mrun 2 MPI-pi