Ejemplos openMP. Hello World #include int main (int argc, char *argv[]) { int p,th_id;...

Ejemplos

openMP

Hello World• #include <omp.h>• #include <stdio.h>• • int main (int argc, char *argv[]) {• int p,th_id;• p=omp_get_num_procs(); • omp_set_num_threads(p);• #pragma omp parallel private(th_id);• {• th_id = omp_get_thread_num();• printf("Hello World from thread %d\n", th_id);• }• return 0;• }

El algoritmo de Floyd paralelizado

for (k= 0;k<n;k++) #pragma omp parallel for private(j)

for (i =0;i< n;i++)for (j= 0;j<n;j++)a[i,j] min (a[i,j], a[i,k] + a[k,j])

Mejor paralelizar el segundo bucle en vez del tercero para evitar el costo de “fork join” repetido

Aproximar π mediante la “regla de rectangulos”

• #include <omp.h>• #include <stdio.h>• #include<time.h>• #include<sys/time.h>• int main (int argc, char *argv[]) {• double area,x;• int i,n;• area = 0.0;• printf("n=");• scanf("%d",&n);• #pragma omp parallel for private(x) reduction(+:area);• for (i=0;i<n;i++) {• x=(i+0.5)/n; • area += 4.0/(1.0+x*x);• }• printf("pi = %lf\n", area/n);• return 0; • }

Aproximar pi por el método Monte Carlo

• #include<stdlib.h>• #include<stdio.h>• int main(int argc,char *argv[])• {• int count;• int i;• int local_count;• int samples;• int t;• int tid;• double x,y;• unsigned short xi[3];• samples=atoi(argv[1]);• omp_set_num_threads(atoi(argv[2]));• count=0;

Método Monte Carlo (cont)• #pragma omp parallel private(xi,t,i,x,y,local_count);• {• local_count=0;• xi[0]=atoi(argv[3]);• xi[1]=atoi(argv[4]);• xi[2]=tid=omp_get_thread_num();• t = omp_get_num_threads();• for (i=tid;i<samples;i += t){• x=erand48(xi);• y=erand48(xi);• if(x*x + y*y <= 1.0) local_count +=1;• }• #pragma omp critical• count += local_count;• }• printf("Estimate of pi: %7.5f\n",4.0*count/samples);• }

La multiplicación matríz-vector

• Para computar y = Ax = [aij]x donde A es

m X n y x es n X 1:

for (i=0;i<m;i++){ y[i] = 0; for (j=0;j<n;j++) y[i] = y[i] + A[i][j] * x[j]; }

Paralelizar el bucle exterior

#pragma omp parallel for private(j)for (i=0;i<m;i++){ y[i] = 0; for (j=0;j<n;j++) y[i] = y[i] + A[i][j] * x[j]; }

Paralelizar el bucle interior

for (i=0;i<m;i++){ tmp = 0.0;#pragma omp parallel for reduction(+:tmp)for (j=0;j<n;j++) tmp = tmp + A[i][j] * x[j];y[i]=tmp; }

Matrices Esparcidas

• Una matríz es esparcida si la mayoria de sus elementos son iguales a cero.

• Los algoritmos ordinarios aplicados a matrices esparicidas, no son lo mas eficientes pues ocupan mucho espacio y gastan operaciones de mas.

“Compressed Sparse Row Format”(CSR)

• El format de fila esparcida comprimida consiste de:

(1) Un arreglo, vals, de los elementos no cero de tamaño nz, donde nz es el número de elementos no cero.

(2) Un arreglo, cols, de tamaño nz de los números de columna en las cuales cada elemento de vals aparece.

(3) Un arreglo, filas, de tamaño n+1 donde los elementos de la fila i se encuentran en las posiciones fila[i], fila[i]+1,…, fila[i+1]-1 del arreglo vals y fila[n] contains nz.

La multiplicación de una matriz nXn en el formato CSR por un vector

for(i=0;i<n;i++){ y[i]=0;for(k=filas[i];k<filas[i+1];k++) {j=cols[k]; y[i] += vals[k]*x[j]; }}

Paralelizar el bucle exterior

#pragma omp parallel for private(j,k) for(i=0;i<n;i++){ y[i]=0; for(k=filas[i];k<filas[i+1];k++) {j=cols[k]; y[i] += vals[k]*x[j]; }

Paralelizar el bucle interior

for(i=0;i<n;i++){ y[i]=0;#pragma omp parallel for reduction(+:y[i]) for(k=filas[i];k<filas[i+1];k++) {j=cols[k]; y[i] += vals[k]*x[j]; }}

Experimentos

(1) Investigar el speedup para las dos versiones anteriores usando matrices aleatorias. Vease

sparsematvec.c

(2) Investigar el speedup en el caso de matrices donde la cantidad de elementos no cero varia mucho de una fila a otra. (Podria atrasar la ejecutación (“load imbalance”).

Se podria probar “scheduling”

Por ejemplo:

#pragma omp parallel for private(j,k) schedule(guided,4) for(i=0;i<n;i++){ y[i]=0; for(k=filas[i];k<filas[i+1];k++) {j=cols[k]; y[i] += vals[k]*x[j]; }

Otras posibilidades

• schedule(dynamic) iteraciones se asignan dinamícamente una a la vez a los hilos

• Schedule(dynamic,C) C iteraciones se asignan dinamícamente as los hijos

Un Programa openMP para Resolver el Problema de

Satisfacer un Circuito

4–19

NOT Gate

4–20

AND Gate

4–21

OR Gate

Circuitos Lógicos

• Los gates se combinan en circuitos usando la salida de un gate como la entrada de otra.

Determinar cuantas combinaciones de entradas satisfacen el circuito

Satisfacer un Circuito en openMP

#include <stdio.h>#include <omp.h>#include <stdlib.h>#include <time.h>//int check_circuit(int,int);int main (int argc, char *argv[]) { int global_solutions; int i; int id; int hilos; int solutions; int lo,hi; int N=65536; int check_circuit(int,int);//hilos=omp_get_num_threads( );global_solutions = 0;

Satisfacer un Circuito (cont)#pragma omp parallel private(lo,hi,id,i,solutions) reduction(+:global_solutions){ hilos=omp_get_num_threads( ); id = omp_get_thread_num( ); lo = id*N/hilos; hi = (id+1)*N/hilos; solutions=0; for (i=lo;i<hi;i++) solutions += check_circuit(id,i);global_solutions += solutions;}printf("El numero de soluciones es %d\n",global_solutions);return 0; }

check_circuit• /* Return 1 if 'i'th bit of 'n' is 1; 0 otherwise */• #define EXTRACT_BIT(n,i) ((n&(1<<i))?1:0)

• void check_circuit (int id, int z) {• int v[16]; /* Each element is a bit of z */• int i;

• for (i = 0; i < 16; i++) v[i] = EXTRACT_BIT(z,i);

• if ((v[0] || v[1]) && (!v[1] || !v[3]) && (v[2] || v[3])• && (!v[3] || !v[4]) && (v[4] || !v[5])• && (v[5] || !v[6]) && (v[5] || v[6])• && (v[6] || !v[15]) && (v[7] || !v[8])• && (!v[7] || !v[13]) && (v[8] || v[9])• && (v[8] || !v[9]) && (!v[9] || !v[10])• && (v[9] || v[11]) && (v[10] || v[11])• && (v[12] || v[13]) && (v[13] || !v[14])• && (v[14] || v[15])) {• printf ("%d) %d%d%d%d%d%d%d%d%d%d%d%d%d%d%d%d\n", id,• v[0],v[1],v[2],v[3],v[4],v[5],v[6],v[7],v[8],v[9],• v[10],v[11],v[12],v[13],v[14],v[15]);• fflush (stdout);• }• }

Otra solucion utilizando un bucle for paralelo

• #include <stdio.h>• #include <omp.h>• #include <stdlib.h>• #include <time.h>• //int check_circuit(int,int);• int main (int argc, char *argv[])• {• int global_solutions;• int i;• int id;• int hilos;• int solutions;• int lo,hi;• int N=65536;• int check_circuit(int,int);• //hilos=omp_get_num_threads( );• #pragma omp parallel for reduction(+:global_solutions)• for (i=0;i<N;i++)• global_solutions += check_circuit(id,i);• //global_solutions += solutions;• printf("El numero de soluciones es %d\n",global_solutions);• return 0;• }

Ejemplos openMP. Hello World #include int main (int argc, char *argv[]) { int p,th_id;...

Documents

Transcript of Ejemplos openMP. Hello World #include int main (int argc, char *argv[]) { int p,th_id;...

Leaflet FAIRYLAND Starter 1 2 3 4 INT Leaflet FAIRYLAND ...

ΥΠΟΜΝΗΜΑ - ametro.gr · p"®p"®p"®p"®p "®p"®p"®p"®p"®p"®p "®p "®p"®p"®p"®p o o i Νίκαια Σπάτα Παιανία Ζωγράφου Μοσχάτο Καλλιθέα

t; 2n , T(3He;np , and He( 3 2 Reactions at Low Energies · Reactions at Low Energies Carl R. Brune Ohio University 5 March 2015 INT Workshop INT 15-58W: Reactions and Structure of

Necesitatea inițierii insulinoterapiei pentru prevenirea ......Studii clinice – terapia intensivă vs convențională UKPDS 33 Int SU/INS UKPDS 34 Int MET ACCORD ADVANCE VADT Nr

INT 506/706: Total Quality Management

INT 3.000.B6/07 - HYDAC · Accumulator Technology Operating instructions ... (Tipo: SF) no trabajan con un relleno de gas y por ello no se recargan con gas. INT 3.000.B6/07.16 5 Técnica

GHI020-INT International Pathology Guidelines 4.1

Pe70 Taktikos a Fasi Int

Int lineabueno

ἔρως EROS - armoniedarte.com · iù ampia go sia per l'og perchè la ente puntua valore, ri semplice e nutile in ag era. pportato l stesso tem nile ma int i, quanto p ... Come

Controlul predictiv bazat pe modele int rare -stare -ie sirecaruntuc/MCP/Curs/ParteaIIRom/MCP_curs2.pdf · Matricea G P Q R≻ ≻ ≻ ≻0 daca 0, 0 si 0.= = ... θ→ → →U Q

3 Intégrales multiples, curvilignes et de surfacemath.univ-lyon1.fr/~frabetti/GeoL2/cours-geometrie-ch3.pdf · 3 Intégrales multiples, curvilignes et de surface 3.1 Intégrale

Dist Muestrales-Int. de Confianza

Sp ect ral G raph Theo ry Int ro d uctio n · Matrix Th eory and Sp ect ra l Gra p h Th eo ry Les lie Hogb en Int ro d uctio n IEPG Minimum R ank Ba sic prop ert ies T ree s Sp ec

Jenny Dooley - Virginia Evans · Jenny Dooley - Virginia Evans FROM GRAMMARWAY 3 GRAMMARWAY INT LEAFLET_GRAMMARWAY INT LEAFLET 23/03/2011 6:35 ΜΜ Page 17

Int. J. Biol. Sci. 2016, Vol. 12

ΣΧΕΔΙΟ ΑΝΑΠΤΥΞΗΣ ΓΡΑΜΜΩΝ ΜΕΤΡΟ ΑΘΗΝΑΣ · 2020. 7. 29. · p"®p "®p "®p"®p "®p "®p"®p"®p "®p o o i Νίκαια Σπάτα Παιανία

AME$60634$$ Int.$HeatTrans.$ Work Examplessst/teaching/AME60634/lectures/AME60634_F13_lectur… · AME$60634$$ Int.$HeatTrans.$ D.B.Go 9 Pure Substances, Compressible Systems seek

Jenny Dooley - Virginia Evans2 4 5 6 GRAMMARWAY INT LEAFLET_GRAMMARWAY INT LEAFLET 23/03/2011 6:34 ΜΜ Page 10 21 Use We use the past continuous: for an action which was in …

ΣΥΣΤΗΜΑ graphic ΑΠΟΧΕΤΕΥΣΗΣ Image PRAGMA · Οι εταιρείες solvay και wienerberger συνέστησαν στα τέλη του 1989, από κοινού