Download - Introducción a la Programación Paralela

Transcript
Page 1: Introducción a la Programación Paralela

Tipos de Programacion ParalelaParadigmas de Programacion Paralela

Entornos de Programacion Paralela

Proyecto Universidad-SecundariaIncorporacion de contenidos de programacion paralela en

la rama de tecnologıas informaticas

Facultad Informatica, Universidad de Murcia eInstituto de Ensenanza Secundaria Ingeniero Juan de la Cierva

Introduccion a laProgramacion Paralela

Univ de Murcia-IES Ing. de la Cierva Paralelismo en la rama de tecnologıas informaticas

Page 2: Introducción a la Programación Paralela

Tipos de Programacion ParalelaParadigmas de Programacion Paralela

Entornos de Programacion Paralela

Posible utilizacion

Modulo de Programacion, primero de Desarrollo deAplicaciones Multiplataforma

Modulo de Programacion, primero de Desarrollo deAplicaciones Web

Tecnologıas de la Informacion y de las Comunicaciones,primero de Bachillerato

Univ de Murcia-IES Ing. de la Cierva Paralelismo en la rama de tecnologıas informaticas

Page 3: Introducción a la Programación Paralela

Tipos de Programacion ParalelaParadigmas de Programacion Paralela

Entornos de Programacion Paralela

Contenido

1 Tipos de Programacion Paralela

2 Paradigmas de Programacion ParalelaProgramacion con Memoria CompartidaProgramacion con Paso de MensajesSimple Instruccion Multiple Dato (SIMD)

3 Entornos de Programacion ParalelaEjemplo de fork-join en CEjemplo de uso de hilos en JavaEjemplo de paralelismo con PthreadsEjemplos de paralelismo con OpenMPEjemplos de paralelismo con MPIEjemplos de CUDA

Univ de Murcia-IES Ing. de la Cierva Paralelismo en la rama de tecnologıas informaticas

Page 4: Introducción a la Programación Paralela

Tipos de Programacion ParalelaParadigmas de Programacion Paralela

Entornos de Programacion Paralela

Variedad de sistemas computacionales

Los sistemas computacionales actuales estan constituidos porvarios componentes, por lo que son sistemas paralelos,pero estos componentes estan organizados de formas distintas:

Sistemas con varios cores y una memoria comun a todos

Un sistema multicore con una tarjeta grafica con su propiamemoria

Redes de multicores, cada uno con su memoria yposiblemente su tarjeta grafica

Varias redes conectadas entre sı de forma remota

etc

Univ de Murcia-IES Ing. de la Cierva Paralelismo en la rama de tecnologıas informaticas

Page 5: Introducción a la Programación Paralela

Tipos de Programacion ParalelaParadigmas de Programacion Paralela

Entornos de Programacion Paralela

Variedad de estilos de programacion

Una unica secuencia de ejecucion de las instrucciones(programacion secuencial)

Una secuencia de ejecucion, con algunas instrucciones quemandan trabajo a realizar a otro componente computacional

Distintas secuencias que se ejecutaran en elementoscomputacionales distintos colaborando a traves de lamemoria

Distintas secuencias que se ejecutaran en elementoscomputacionales distintos colaborando intercambiandoinformacion por medio de mensajes

etc

Univ de Murcia-IES Ing. de la Cierva Paralelismo en la rama de tecnologıas informaticas

Page 6: Introducción a la Programación Paralela

Tipos de Programacion ParalelaParadigmas de Programacion Paralela

Entornos de Programacion Paralela

Tipos de paralelismo

Una unica secuencia de ejecucion de las instrucciones(programacion secuencial)

Una secuencia de ejecucion, con algunas instrucciones quemandan trabajo a realizar a otro componente computacional

Distintas secuencias que se ejecutaran en elementoscomputacionales distintos colaborando a traves de lamemoria

Distintas secuencias que se ejecutaran en elementoscomputacionales distintos colaborando intercambiandoinformacion por medio de mensajes

etc

Univ de Murcia-IES Ing. de la Cierva Paralelismo en la rama de tecnologıas informaticas

Page 7: Introducción a la Programación Paralela

Tipos de Programacion ParalelaParadigmas de Programacion Paralela

Entornos de Programacion Paralela

Conceptos de Programacion Paralela

Paralelismo en sistemas secuencialesConcurrencia - Programacion ConcurrenteParalelismo - Programacion ParalelaSistemas de tiempo real - Programacion en tiempo realSistemas multicoreTarjetas graficas, GPUAceleradores: Xeon Phi, FPGA, DSP...Redes de ordenadores, ClustersComputacion heterogeneaSupercomputacionComputacion de Altas Prestaciones, HPCProgramacion adaptativaComputacion distribuidaComputacion en la nube, CloudComputacion ubicuaVirtualizacionOtros tipos: Computacion Cuantica, Biologica...

Univ de Murcia-IES Ing. de la Cierva Paralelismo en la rama de tecnologıas informaticas

Page 8: Introducción a la Programación Paralela

Tipos de Programacion ParalelaParadigmas de Programacion Paralela

Entornos de Programacion Paralela

Paralelismo en sistemas secuenciales (I)

Los procesadores actuales consiguen acelerar la ejecucion haciendo uso delparalelismo de forma interna. Ejemplos:

Segmentacion encauzada (pipeline):division de la ejecucion de las instrucciones en etapasuna instruccion empieza a ejecutarse antes de que hayan terminado las anteriores

varias instrucciones se procesan simultaneamente

Univ de Murcia-IES Ing. de la Cierva Paralelismo en la rama de tecnologıas informaticas

Page 9: Introducción a la Programación Paralela

Tipos de Programacion ParalelaParadigmas de Programacion Paralela

Entornos de Programacion Paralela

Paralelismo en sistemas secuenciales (II)

Division de memoria en bloques:varios procesos pueden acceder a la vez a zonas de memoria distintas

Jerarqıa de memorias:varios niveles de cache,acceso mas rapido a las memorias mas cercanas

Univ de Murcia-IES Ing. de la Cierva Paralelismo en la rama de tecnologıas informaticas

Page 10: Introducción a la Programación Paralela

Tipos de Programacion ParalelaParadigmas de Programacion Paralela

Entornos de Programacion Paralela

Paralelismo en sistemas secuenciales (III)

Multiples unidades funcionales

por ejemplo varios sumadores o multiplicadores

Unidades vectoriales

se realizan operaciones simultaneas sobre conjuntos de datos

Univ de Murcia-IES Ing. de la Cierva Paralelismo en la rama de tecnologıas informaticas

Page 11: Introducción a la Programación Paralela

Tipos de Programacion ParalelaParadigmas de Programacion Paralela

Entornos de Programacion Paralela

Paralelismo en sistemas secuenciales (IV)

Multithreadingel sistema lanza varios threads (hilos) simultaneamente, quecomparten recursos

Univ de Murcia-IES Ing. de la Cierva Paralelismo en la rama de tecnologıas informaticas

Page 12: Introducción a la Programación Paralela

Tipos de Programacion ParalelaParadigmas de Programacion Paralela

Entornos de Programacion Paralela

Paralelismo en sistemas secuenciales (y V)

Paralelismo a nivel de instruccionreordenar las instrucciones para que se puedan ejecutar enparalelo sin afectar al resultado

Ejecucion fuera de ordense capturan los datos para estar disponibles cuando puedeejecutarse la instruccion

Especulaciondeterminar que resultados se van a necesitar y generarlosantes

Coprocesadores de E/Spermiten realizar entrada/salida mientras se computa

...

Univ de Murcia-IES Ing. de la Cierva Paralelismo en la rama de tecnologıas informaticas

Page 13: Introducción a la Programación Paralela

Tipos de Programacion ParalelaParadigmas de Programacion Paralela

Entornos de Programacion Paralela

Concurrencia - Paralelismo

Concurrencia, Programacion Concurrente

cuando varios elementos de proceso (hilos,procesos) trabajan de forma conjunta en laresolucion de un problema

Paralelismo, Programacion Paralela

lo mismo, pero se usan estos terminos cuando eltrabajo se utiliza para acelerar la resolucion de losproblemas

Univ de Murcia-IES Ing. de la Cierva Paralelismo en la rama de tecnologıas informaticas

Page 14: Introducción a la Programación Paralela

Tipos de Programacion ParalelaParadigmas de Programacion Paralela

Entornos de Programacion Paralela

Sistemas de tiempo real, Programacion de tiempo real

Para problemas que requieren respuesta en un espacio corto detiempopara lo que se necesita usar de manera eficiente los recursoscomputacionales,y por tanto realizar computacion paralela.Ejemplos:

Vıdeojuegos, Animaciones, que requieren generar al menos24 imagenes por segundo

Control, con informacion recogida por sensores, y el sistematiene que dar respuesta rapida

Robotica

Univ de Murcia-IES Ing. de la Cierva Paralelismo en la rama de tecnologıas informaticas

Page 15: Introducción a la Programación Paralela

Tipos de Programacion ParalelaParadigmas de Programacion Paralela

Entornos de Programacion Paralela

Multicore

Los sistemas multicore (multinucleo) contienen varios cores que tienen acceso a unespacio de memoria comun, organizado de forma jerarquica.En la actualidad son los sistemas computacionales estandar, y sistemas mascomplejos se obtienen combinando varios de ellos.Se programan a traves de hilos (threads), que comparten datos en la memoriacomun.

Univ de Murcia-IES Ing. de la Cierva Paralelismo en la rama de tecnologıas informaticas

Page 16: Introducción a la Programación Paralela

Tipos de Programacion ParalelaParadigmas de Programacion Paralela

Entornos de Programacion Paralela

Tarjetas graficas, GPU

Originariamente para vıdeojuegos, en la actualidad tambien para procesamiento deproposito general (GPGPU).Normalmente como coprocesadores con un sistema multicore, que dispone de una ovarias GPUs.El programa se ejecuta en CPU y manda trabajos a la GPU.Programacion dependiente del fabricante (CUDA) y tambien hay software portable(OpenCL).Constan de muchos cores de GPU, organizados en bloques, y con organizacionjerarquica de la memoria.Varios tipos de tarjetas con distintas capacidades computacionales (Gforce, Tesla,Kepler...)

Univ de Murcia-IES Ing. de la Cierva Paralelismo en la rama de tecnologıas informaticas

Page 17: Introducción a la Programación Paralela

Tipos de Programacion ParalelaParadigmas de Programacion Paralela

Entornos de Programacion Paralela

Otros aceleradores

Los aceleradores computacionales o coprocesadores se utilizan normalmentemandandoles trabajo desde la CPU para que se encarguen de realizar calculoscomputacionalmente costosos.Ademas de las GPUs hay algunos tipos mas:

Intel Xeon Phi:

Contiene hasta 61 cores, y cada core soporta 4 threads por hardware.

Programacion mas cercana que la de las GPUs a la estandar en paralelo.

FPGA (Field Programmable Gate Array):

Similares a circuitos integrados pero reprogramables.

Programacion distinta a la paralela estandar.

DSP (Digital Signal Processor):

Para tratamiento de senales y problemas en tiempo real.

Normalmente para operaciones matematicas que se repite continuamente.

Univ de Murcia-IES Ing. de la Cierva Paralelismo en la rama de tecnologıas informaticas

Page 18: Introducción a la Programación Paralela

Tipos de Programacion ParalelaParadigmas de Programacion Paralela

Entornos de Programacion Paralela

Clusters, Redes de ordenadores

Compuestos por varios componentes computacionales(nodos) conectados en red.

Los nodos pueden estar enrackados o de forma aislada.

En la actualidad los nodos suelen ser multicoresposiblemente con GPUs.

Pueden ser desde clusters pequenos formados por unospocos nodos hasta muchos nodos formando unsupercomputador.

En algunos casos los nodos comparten el sistema deficheros, que tambien puede ser distribuido.

Se suele usar un sistema de colas para mandar lostrabajos de los usuarios al sistema.

La programacion estandar es multihilo en los nodos ymultiprocesos entre nodos.

Univ de Murcia-IES Ing. de la Cierva Paralelismo en la rama de tecnologıas informaticas

Page 19: Introducción a la Programación Paralela

Tipos de Programacion ParalelaParadigmas de Programacion Paralela

Entornos de Programacion Paralela

Computacion heterogenea

Los componentes de un sistema computacional presentandistintas fuentes de heterogeneidad:

Memorias primarias y secundarias de distinta capacidad ycon distinta organizacion.Componentes computacionales con distinta velocidad.Componentes computacionales de distinta arquitectura(ejemplo, multicore+GPU).Redes de conexion a distinta velocidad....

lo que hace que haya que programarlos de forma especial paraaprovechar al maximo la capacidad de todos ellos, quizas conprogramacion paralela estandar pero asignacion balanceada detrabajos a los distintos componentes.

Univ de Murcia-IES Ing. de la Cierva Paralelismo en la rama de tecnologıas informaticas

Page 20: Introducción a la Programación Paralela

Tipos de Programacion ParalelaParadigmas de Programacion Paralela

Entornos de Programacion Paralela

Supercomputacion

La que se realiza en loscomputadores mas potentes pararesolver los problemas cientıficos conmayores necesidadescomputacionales (simulacionclimatica, analisis de ADN...)

Varıa historicamente. Lista Top500contiene los 500 mas rapidos delmundo, se actualiza cada seis meses.

Problemas de gestion, sistemas deenfriamiento, reduccion del consumode energıa (Green computing)...

Tianhe-2en el National Super Computer Center inGuangzhou, ChinaCluster de Intel Xeon + Xeon Phi3120000 corespotencia 17808 kwrendimiento maximo 54902.4 Tflops/seg

Univ de Murcia-IES Ing. de la Cierva Paralelismo en la rama de tecnologıas informaticas

Page 21: Introducción a la Programación Paralela

Tipos de Programacion ParalelaParadigmas de Programacion Paralela

Entornos de Programacion Paralela

HPC

La Computacion de Alto Rendimiento (o Altas Prestaciones,High Performance Computing) consiste en el aprovechamientoal maximo de las capacidades computacionales del sistema.

Normalmente en supercomputadores, pero tambien enclusters, multicores, y para tiempo real.

Programacion Adaptativa

Al compartirse los grandes sistemas o clusters entre variosusuarios las condiciones de los sistemas cambian a lo largodel tiempo.

Se pueden desarrollar programas que se adapten a lascondiciones del sistema durante su ejecucion.

Univ de Murcia-IES Ing. de la Cierva Paralelismo en la rama de tecnologıas informaticas

Page 22: Introducción a la Programación Paralela

Tipos de Programacion ParalelaParadigmas de Programacion Paralela

Entornos de Programacion Paralela

Computacion Distribuida - Computacion en Grid

Computacion Distribuida

Componentes computacionales organizados en red colaboranen la resolucion de un problema.

Las redes pueden ser geograficamente locales (clusters) odistribuidas.

Interaccionan con envıo de mensajes.

Computacion en Grid

Como la distribuida, pero los componentes computacionalesestan mas separados geograficamente, son heterogeneos, sededican a distintas tareas...

Univ de Murcia-IES Ing. de la Cierva Paralelismo en la rama de tecnologıas informaticas

Page 23: Introducción a la Programación Paralela

Tipos de Programacion ParalelaParadigmas de Programacion Paralela

Entornos de Programacion Paralela

Cloud computing - Virtualizacion

Computacion en la nube

Uso de recursos computacionales, de almacenamiento, de servicios... ofrecidos atraves de algun sistema como Internet.

Normalmente se refiere a la oferta de los servicios. Hay proveedores de espacio yservicios, incluyendo computacion (por ejemplo, Amazon).

Cuando se ofrece uso de elementos hardware el sistema ofrece esos recursos perono estan siempre asignados fısicamente al mismo hardware.

Virtualizacion

Consiste en la oferta y uso de entornos virtuales, ya sea de hardware, sistemas,redes...

Puede permitir un mayor aprovechamiento de los recursos, pues varias maquinasvirtuales pueden estar usando la misma maquina real disminuyenso ası los puntosmuertos.

Univ de Murcia-IES Ing. de la Cierva Paralelismo en la rama de tecnologıas informaticas

Page 24: Introducción a la Programación Paralela

Tipos de Programacion ParalelaParadigmas de Programacion Paralela

Entornos de Programacion Paralela

Computacion ubicua - Computacion voluntaria

Computacion ubicua

Se realiza en cualquier momento y con cualquier tipo de dispositivo (moviles,sensores, portatiles, clusters, supercomputadores...)

Puede incluir sistemas con autonomıa, por ejemplo, frigorıficos poniendoseen contacto directamente con la tienda.

Algunos conceptos relacionados: pervasive computing, computacion movil,Internet de las cosas...

Computacion voluntaria

Cuando los usuarios ofrecen sus recursos computacionales(almacenamiento y capacidad de computo) para la resolucion de problemas.

Univ de Murcia-IES Ing. de la Cierva Paralelismo en la rama de tecnologıas informaticas

Page 25: Introducción a la Programación Paralela

Tipos de Programacion ParalelaParadigmas de Programacion Paralela

Entornos de Programacion Paralela

Computacion no convencionalExisten otros tipos de computacion no convencionales que no estan totalmentedesarrollados y que intrınsecamente incluyen paralelismo.

Computacion cuantica

Basada en las propiedades de la fısica cuantica.

Podrıan realizarse multiples operaciones de forma simultanea.

Requiere forma de programacion distinta a la actual.

Hay ya algunos computadores cuanticos, de alto coste y poca capacidad de computoen terminos cuanticos, pero que resuelven algunos problemas determinados de formamucho mas rapida que con la computacion convencional.

Computacion biologica

Basada en la capacidad de elementos biologicos (moleculas, proteınas, ADN...) paraalmacenar y procesar datos.

Se usa en algunas aplicaciones biologicas y de medicina, pero esta lejos de podertener un uso generalizado.

Univ de Murcia-IES Ing. de la Cierva Paralelismo en la rama de tecnologıas informaticas

Page 26: Introducción a la Programación Paralela

Tipos de Programacion ParalelaParadigmas de Programacion Paralela

Entornos de Programacion Paralela

Programacion con Memoria CompartidaProgramacion con Paso de MensajesSimple Instruccion Multiple Dato (SIMD)

Consideramos tres paradigmas basicos que se pueden considerarlos estandares actuales:

Programacion con Memoria Compartida.

Programacion con Paso de Mensajes.

Simple Instruccion Multiple Dato (SIMD).

Univ de Murcia-IES Ing. de la Cierva Paralelismo en la rama de tecnologıas informaticas

Page 27: Introducción a la Programación Paralela

Tipos de Programacion ParalelaParadigmas de Programacion Paralela

Entornos de Programacion Paralela

Programacion con Memoria CompartidaProgramacion con Paso de MensajesSimple Instruccion Multiple Dato (SIMD)

MC- Sistemas

Los sistemas donde se realiza permitenver la memoria compartida por losdistintos elementos de computacion: losdistintos procesos o hilos,independientemente del procesador onucleo donde esten, tienen acceso directoa todas las posiciones de memoria.

Tıpicamente son sistemas multicore, conmemoria dividida en bloques y organizadajerarquicamente, pero en el programa seconsidera la memoria comun, aunquehabra distinto coste de acceso a los datosdependiendo de donde se encuentren.

Problemas de:coherencia de datos (resuelto por el sistemaoperativo)

y contencion (empeoran el tiempo de

ejecucion).

Univ de Murcia-IES Ing. de la Cierva Paralelismo en la rama de tecnologıas informaticas

Page 28: Introducción a la Programación Paralela

Tipos de Programacion ParalelaParadigmas de Programacion Paralela

Entornos de Programacion Paralela

Programacion con Memoria CompartidaProgramacion con Paso de MensajesSimple Instruccion Multiple Dato (SIMD)

MC- Hilos

Los elementos logicos de computacionson los hilos (threads).

Se asocian a elementos fısicos decomputacion, que son los nucleos(cores).

La asociacion hilos-cores se puederealizar de distintas formas.

Univ de Murcia-IES Ing. de la Cierva Paralelismo en la rama de tecnologıas informaticas

Page 29: Introducción a la Programación Paralela

Tipos de Programacion ParalelaParadigmas de Programacion Paralela

Entornos de Programacion Paralela

Programacion con Memoria CompartidaProgramacion con Paso de MensajesSimple Instruccion Multiple Dato (SIMD)

MC- Modelo programa

Modelo fork-join:

un hilo genera nuevos hilos (fork)

y los espera para sincronizarse (join)

Univ de Murcia-IES Ing. de la Cierva Paralelismo en la rama de tecnologıas informaticas

Page 30: Introducción a la Programación Paralela

Tipos de Programacion ParalelaParadigmas de Programacion Paralela

Entornos de Programacion Paralela

Programacion con Memoria CompartidaProgramacion con Paso de MensajesSimple Instruccion Multiple Dato (SIMD)

MC- Regiones crıticasCuando los hilos acceden a zonas comunes de datos para variarlos es necesariasincronizacion. Los entornos de programacion en memoria compartida proporcionanherramientas:

Seccion crıtica: solo un hilo puede estar ejecutando esa parte del codigo en unmomento dado.Llaves, semaforos: se puede acceder a esa zona de codigo cuando se cumple unacondicion.

Univ de Murcia-IES Ing. de la Cierva Paralelismo en la rama de tecnologıas informaticas

Page 31: Introducción a la Programación Paralela

Tipos de Programacion ParalelaParadigmas de Programacion Paralela

Entornos de Programacion Paralela

Programacion con Memoria CompartidaProgramacion con Paso de MensajesSimple Instruccion Multiple Dato (SIMD)

Entornos de programacion en Memoria Compartida

C, C++: tienen llamadas a rutinas del sistema, fork, join yotras.

Java: tiene bibliotecas de concurrencia.

Pthreads: interface de programacion (API) para trabajo conhilos.

OpenMP: especificacion de API para programacion paralelaen Memoria Compartida. Se puede considerar el estandarpara computacion en MC.Se encuentra en implementaciones de lenguajes, como gcc.

Univ de Murcia-IES Ing. de la Cierva Paralelismo en la rama de tecnologıas informaticas

Page 32: Introducción a la Programación Paralela

Tipos de Programacion ParalelaParadigmas de Programacion Paralela

Entornos de Programacion Paralela

Programacion con Memoria CompartidaProgramacion con Paso de MensajesSimple Instruccion Multiple Dato (SIMD)

PM- Sistemas

En los sistemas donde se realiza esta programacion no sepuede acceder a todas las posiciones de memoria desdetodos los elementos de proceso.Cada nodo o procesador tiene asociados unos bloques dememoria, a los que puede acceder directamente.Un proceso asignado a un procesador, para poder acceder adatos en bloques de memoria no accesibles desde eseprocesador, tiene que comunicarse con procesos enprocesadores a los que esta asociada esa memoria.Son redes (clusters) de ordenadores, formados por nodosmulticore conectados en red, sistemas distribuidos..., perotambien se puede usar programacion por paso de mensajesen sistemas de memoria compartida.

Univ de Murcia-IES Ing. de la Cierva Paralelismo en la rama de tecnologıas informaticas

Page 33: Introducción a la Programación Paralela

Tipos de Programacion ParalelaParadigmas de Programacion Paralela

Entornos de Programacion Paralela

Programacion con Memoria CompartidaProgramacion con Paso de MensajesSimple Instruccion Multiple Dato (SIMD)

PM- Procesos

Programa:

Puede haber un unico programa y ponerse en marcha variosprocesos con el mismo codigo. Modelo Simple ProgramaMultiple Dato (SPMD).Aunque sea el mismo programa los codigos que se ejecutanpueden ser distintos si se compila para arquitecturas distintas.Puede haber varios programas y generarse procesos concodigos distintos.

Generacion de procesos:

Generadion estatica: todos los procesos se ponen en marchaal mismo tiempo.Generacion dinamica: unos procesos ponen en marcha otrosdurante la ejecucion.

Univ de Murcia-IES Ing. de la Cierva Paralelismo en la rama de tecnologıas informaticas

Page 34: Introducción a la Programación Paralela

Tipos de Programacion ParalelaParadigmas de Programacion Paralela

Entornos de Programacion Paralela

Programacion con Memoria CompartidaProgramacion con Paso de MensajesSimple Instruccion Multiple Dato (SIMD)

PM- Memoria

Generacion estatica

Generacion dinamica

Univ de Murcia-IES Ing. de la Cierva Paralelismo en la rama de tecnologıas informaticas

Page 35: Introducción a la Programación Paralela

Tipos de Programacion ParalelaParadigmas de Programacion Paralela

Entornos de Programacion Paralela

Programacion con Memoria CompartidaProgramacion con Paso de MensajesSimple Instruccion Multiple Dato (SIMD)

PM- Mensajes

Los procesos se comunican con mensajes, que pueden ser:

Segun el numero de procesos:Punto a punto: un proceso envıa y otro recibe.Globales: intervienen varios procesos, posiblemente unoenviando o recibiendo datos de todos los demas.

Segun la sincronizacion:

Sıncronos: los procesos que intervienen se bloquean hastaque se realiza la comunicacion.Asıncronos: los procesos no se bloquean. El que envıamanda los datos y sigue trabajando, el que recibe, si no estandisponibles los datos continua con su trabajo.

Univ de Murcia-IES Ing. de la Cierva Paralelismo en la rama de tecnologıas informaticas

Page 36: Introducción a la Programación Paralela

Tipos de Programacion ParalelaParadigmas de Programacion Paralela

Entornos de Programacion Paralela

Programacion con Memoria CompartidaProgramacion con Paso de MensajesSimple Instruccion Multiple Dato (SIMD)

Entornos de programacion por Paso de Mensajes

Java: tiene bibliotecas de paso de mensajes.

MPI (Message Passing Interface): especificacion de API paraprogramacion con Paso de Mensajes. Se puede considerar elestandar para computacion en sistemas distribuidos.API para varios lenguajes: C/C++, Fortran...Varias implementaciones gratuitas: MPICH, LAMMPI,OpenMPI...

Univ de Murcia-IES Ing. de la Cierva Paralelismo en la rama de tecnologıas informaticas

Page 37: Introducción a la Programación Paralela

Tipos de Programacion ParalelaParadigmas de Programacion Paralela

Entornos de Programacion Paralela

Programacion con Memoria CompartidaProgramacion con Paso de MensajesSimple Instruccion Multiple Dato (SIMD)

SIMD- Sistemas

Modelo SIMD: muchas unidades de proceso, cada unarealizando la misma operacion (SI) y cada una sobre susdatos (MD).

En la actualidad podemos considerar sistemas SIMDcoprocesadores como:

tarjetas graficas (GPU), hasta ≈ 2500 cores. En los sistemaspara graficos, se pueden programar para proposito general.Intel Xeon Phi, entre 57 y 61 cores, cada uno hasta 4 threadspor hardware.

pero tambien hacen computacion de forma asıncrona,normalmente trabajo en CPU y se manda parte delprocesamiento al coprocesador.

Univ de Murcia-IES Ing. de la Cierva Paralelismo en la rama de tecnologıas informaticas

Page 38: Introducción a la Programación Paralela

Tipos de Programacion ParalelaParadigmas de Programacion Paralela

Entornos de Programacion Paralela

Programacion con Memoria CompartidaProgramacion con Paso de MensajesSimple Instruccion Multiple Dato (SIMD)

GPU- Estructura

Constan de varios Streaming Multiprocessors (SMs), cada unocon varios Streaming Processors (SPs):

Univ de Murcia-IES Ing. de la Cierva Paralelismo en la rama de tecnologıas informaticas

Page 39: Introducción a la Programación Paralela

Tipos de Programacion ParalelaParadigmas de Programacion Paralela

Entornos de Programacion Paralela

Programacion con Memoria CompartidaProgramacion con Paso de MensajesSimple Instruccion Multiple Dato (SIMD)

GPU- Memoria

Memorias independientes en CPU y GPU.Con jerarquıa de memoria en cada una.Mas compleja la de GPU: optimizar su uso para tener buenas prestaciones.Y necesario minimizar copias entre memorias de CPU y GPU, o solapar las copiascon computacion.

Univ de Murcia-IES Ing. de la Cierva Paralelismo en la rama de tecnologıas informaticas

Page 40: Introducción a la Programación Paralela

Tipos de Programacion ParalelaParadigmas de Programacion Paralela

Entornos de Programacion Paralela

Programacion con Memoria CompartidaProgramacion con Paso de MensajesSimple Instruccion Multiple Dato (SIMD)

GPU- Modelo programacion

Los procesadores (SPs) de un SM ejecutan hilos independientes, pero encada instante ejecutan la instruccion leıda por la Instruction Unit (IU).

En cada SM los hilos los gestiona el hardware: bajo coste.

kernel es la parte de codigo en la CPU que lanza ejecucion a GPU:

Descompone un problema ensubproblemas y lo mapea sobre un grid,que es un vector 1D o 2D de bloques dehilos.

Cada bloque es un vector 1D, 2D o 3D dehilos.

Los hilos usan su identificador de threaddentro de un bloque y de bloque dentro delgrid para determinar el trabajo que tienenque hacer.

Univ de Murcia-IES Ing. de la Cierva Paralelismo en la rama de tecnologıas informaticas

Page 41: Introducción a la Programación Paralela

Tipos de Programacion ParalelaParadigmas de Programacion Paralela

Entornos de Programacion Paralela

Programacion con Memoria CompartidaProgramacion con Paso de MensajesSimple Instruccion Multiple Dato (SIMD)

Entornos de programacion de sistemas SIMD

Programacion de GPU es programacion especıfica:

CUDA para tarjetas NVIDIAOpenCL es estandar para tarjetas de diferentes fabricantes.

En Intel Xeon Phi se puede usar OpenMP y MPI,con compilando diferenciada para CPU y para el Xeon Phi,peropudiendo trabajar de forma conjunta.

Univ de Murcia-IES Ing. de la Cierva Paralelismo en la rama de tecnologıas informaticas

Page 42: Introducción a la Programación Paralela

Tipos de Programacion ParalelaParadigmas de Programacion Paralela

Entornos de Programacion Paralela

Ejemplo de fork-join en CEjemplo de uso de hilos en JavaEjemplo de paralelismo con PthreadsEjemplos de paralelismo con OpenMPEjemplos de paralelismo con MPIEjemplos de CUDA

Veremos ejemplos basicos de programacion paralela en:

C/C++ con fork-join

Java

Pthreads

OpenMP

MPI

CUDA

Univ de Murcia-IES Ing. de la Cierva Paralelismo en la rama de tecnologıas informaticas

Page 43: Introducción a la Programación Paralela

Tipos de Programacion ParalelaParadigmas de Programacion Paralela

Entornos de Programacion Paralela

Ejemplo de fork-join en CEjemplo de uso de hilos en JavaEjemplo de paralelismo con PthreadsEjemplos de paralelismo con OpenMPEjemplos de paralelismo con MPIEjemplos de CUDA

Un proceso puede crear un proceso hijo con la funcion fork.

fork devuelve al proceso que lo llama el identificador delproceso hijo, y al hijo el valor cero.

El proceso hijo tiene una copia de las variables del procesopadre.

y ejecuta el mismo codigo del padre a partir de la zona enque se ha creado.

El padre puede usar la funcion wait para esperar que el hijoacabe.

Para que padre e hijo trabajen con datos compartidos hayque utilizar funciones de comparticion de memoria, como porejemplo la mmap.

Univ de Murcia-IES Ing. de la Cierva Paralelismo en la rama de tecnologıas informaticas

Page 44: Introducción a la Programación Paralela

Tipos de Programacion ParalelaParadigmas de Programacion Paralela

Entornos de Programacion Paralela

Ejemplo de fork-join en CEjemplo de uso de hilos en JavaEjemplo de paralelismo con PthreadsEjemplos de paralelismo con OpenMPEjemplos de paralelismo con MPIEjemplos de CUDA

Ejemplo: ordenacion con dos procesos

El programa en programas/C/ejemplofork.cpp realiza unaordenacion con dos procesos.Trabajar con el:

Compilarlo con y sin la opcion -D DEBUG. Si se quiereoptimizar el codigo hay que incluir la opcion -O3 en lacompilacion.

Entender su funcionamiento.

Explicar el trabajo de las funciones fork, wait y mmap.

Explicar los tiempos de ejecucion que se obtienen.

Hacer la reserva de espacio para los datos sin usar mmap yanalizar lo que ocurre en ese caso.

Univ de Murcia-IES Ing. de la Cierva Paralelismo en la rama de tecnologıas informaticas

Page 45: Introducción a la Programación Paralela

Tipos de Programacion ParalelaParadigmas de Programacion Paralela

Entornos de Programacion Paralela

Ejemplo de fork-join en CEjemplo de uso de hilos en JavaEjemplo de paralelismo con PthreadsEjemplos de paralelismo con OpenMPEjemplos de paralelismo con MPIEjemplos de CUDA

Se crea una clase (threadordenar) que implementaRunnable.

el metodo run llama a ordenar la segunda mitad del array.

Los datos y su tamano se declaran globales para que puedanacceder los dos hilos.

Se declara un hilo de esa clase: Thread t = newThread(new threadordenar());

y se inicia su ejecucion con t.start().

El hilo maestro espera mientras el hilo esclavo esta activo:t.isAlive().

En Java hay muchas otras posibilidades de gestionar laconcurrencia.

Univ de Murcia-IES Ing. de la Cierva Paralelismo en la rama de tecnologıas informaticas

Page 46: Introducción a la Programación Paralela

Tipos de Programacion ParalelaParadigmas de Programacion Paralela

Entornos de Programacion Paralela

Ejemplo de fork-join en CEjemplo de uso de hilos en JavaEjemplo de paralelismo con PthreadsEjemplos de paralelismo con OpenMPEjemplos de paralelismo con MPIEjemplos de CUDA

Ejemplo: ordenacion con dos hilos

El programa en programas/Java/ejemplojava.java realiza unaordenacion con dos hilos.Trabajar con el:

Compilarlo con javac.

Entender su funcionamiento.

Explicar el trabajo con hilos: run, start y isAlive.

Explicar los tiempos de ejecucion que se obtienen.

Comparar los tiempos con los obtenidos con C.

Univ de Murcia-IES Ing. de la Cierva Paralelismo en la rama de tecnologıas informaticas

Page 47: Introducción a la Programación Paralela

Tipos de Programacion ParalelaParadigmas de Programacion Paralela

Entornos de Programacion Paralela

Ejemplo de fork-join en CEjemplo de uso de hilos en JavaEjemplo de paralelismo con PthreadsEjemplos de paralelismo con OpenMPEjemplos de paralelismo con MPIEjemplos de CUDA

Se usa la librerıa pthreads.h

Se declara un array de hilos:pthread t threads[NUM THREADS]

Los hilos se ponen en marcha conpthread create

que recibe la direccion del hilo (&threads[i]), la direccion dememoria de la funcion que ejecuta el hilo, y la direccion de laestructura que contiene los parametros que se pasan a lafuncion ((void *) &thread data array[i])

Se espera a que acaben los hilos conpthread join(threads[i], &status)

Univ de Murcia-IES Ing. de la Cierva Paralelismo en la rama de tecnologıas informaticas

Page 48: Introducción a la Programación Paralela

Tipos de Programacion ParalelaParadigmas de Programacion Paralela

Entornos de Programacion Paralela

Ejemplo de fork-join en CEjemplo de uso de hilos en JavaEjemplo de paralelismo con PthreadsEjemplos de paralelismo con OpenMPEjemplos de paralelismo con MPIEjemplos de CUDA

Ejemplo: ordenacion con varios hilos

El programa en programas/Pthreads/ejemplopthreads.cpprealiza una ordenacion con varios hilos.Trabajar con el:

Compilarlo cong++ -O3 ejemplofork.cpp -fpermissive -lpthread.

Entender su funcionamiento.

Explicar el trabajo con hilos: pthread create y pthread join.

Variar el valor de NUM THREADS y explicar los tiempos deejecucion que se obtienen.

Comparar los tiempos con los obtenidos con C y Java.

Univ de Murcia-IES Ing. de la Cierva Paralelismo en la rama de tecnologıas informaticas

Page 49: Introducción a la Programación Paralela

Tipos de Programacion ParalelaParadigmas de Programacion Paralela

Entornos de Programacion Paralela

Ejemplo de fork-join en CEjemplo de uso de hilos en JavaEjemplo de paralelismo con PthreadsEjemplos de paralelismo con OpenMPEjemplos de paralelismo con MPIEjemplos de CUDA

Se usa la librerıa omp.h

Hay funciones para establecer el numero de hilos a poner enmarcha en una region paralela (omp set num threads) ypara que cada hilo obtenga su numero dentro de una regionparalela (omp get thread num)

Los hilos se ponen en marcha con#pragma omp parallel

Todos los hilos (incluido el maestro) ejecutan el mismo codigodentro de la region paralela, pero cada hilo hace cosasdistintas utilizando su identificador.

Los hilos se sincronizan al acabar la region paralela. A partirde ese punto sigue trabajando solo el hilo maestro.

Univ de Murcia-IES Ing. de la Cierva Paralelismo en la rama de tecnologıas informaticas

Page 50: Introducción a la Programación Paralela

Tipos de Programacion ParalelaParadigmas de Programacion Paralela

Entornos de Programacion Paralela

Ejemplo de fork-join en CEjemplo de uso de hilos en JavaEjemplo de paralelismo con PthreadsEjemplos de paralelismo con OpenMPEjemplos de paralelismo con MPIEjemplos de CUDA

Ejemplo: ordenacion con varios hilos

El programa enprogramas/OpenMP/ejemploOMPordenacion.cpp realiza unaordenacion con varios hilos.Trabajar con el:

Compilarlo cong++ -O3 ejemploOMPordenacion.cpp -fopenmp.Entender su funcionamiento.Explicar el uso de las funciones de OpenMP y del constructorparallel.Variar el valor de NUM THREADS y explicar los tiempos deejecucion que se obtienen.Comparar los tiempos con los obtenidos con C, Java ypthreads.

Univ de Murcia-IES Ing. de la Cierva Paralelismo en la rama de tecnologıas informaticas

Page 51: Introducción a la Programación Paralela

Tipos de Programacion ParalelaParadigmas de Programacion Paralela

Entornos de Programacion Paralela

Ejemplo de fork-join en CEjemplo de uso de hilos en JavaEjemplo de paralelismo con PthreadsEjemplos de paralelismo con OpenMPEjemplos de paralelismo con MPIEjemplos de CUDA

Ejemplo: ordenacion por mezcla

El programa en programas/OpenMP/codigo6-15.c es del libro de Introduccion a laProgramacion Paralela, de Almeida, Gimenez, Mantas y Vidal, Paraninfo 2008(http://www.paraninfo.es/catalogo/9788497326742/introduccion-a-la-programacion-paralela).Realiza una ordenacion con varios hilos con la tecnica mergesort, que es mas rapida quela utilizada hasta ahora.Trabajar con el:

Compilarlo y entender su funcionamiento.

Antes de ejecutar hay que establecer el numero de hilos que se van a usar en lasregiones paralelas con:export OMP NUM THREADS=nhilos (nhilos representa el numero de hilos)

Explicar las nuevas caracterısticas de OpenMP que aparecen en el programa.

Variar el numero de hilos y explicar los tiempos de ejecucion que se obtienen.

Comparar los tiempos con los obtenidos con el programa de ordenacion anterior.

Univ de Murcia-IES Ing. de la Cierva Paralelismo en la rama de tecnologıas informaticas

Page 52: Introducción a la Programación Paralela

Tipos de Programacion ParalelaParadigmas de Programacion Paralela

Entornos de Programacion Paralela

Ejemplo de fork-join en CEjemplo de uso de hilos en JavaEjemplo de paralelismo con PthreadsEjemplos de paralelismo con OpenMPEjemplos de paralelismo con MPIEjemplos de CUDA

Ejemplo: multiplicacion de matrices

El paralelismo en OpenMP se consigue muchas vecesdistribuyendo entre varios hilos el trabajo de un bucle.El programa en programas/OpenMP/codigo6-6.c (del librode IPP) muestra una multiplicacion de matrices entre varioshilos.Se ejecuta pasando como argumentos al programa trestamanos, el primero es el de la primera multiplicacion arealizar, el tercero el incremento de tamano y el segundo eltamano maximo.Compilarlo y entender su funcionamiento.Analizar la estructura del constructor parallel forVariar el numero de hilos y analizar los tiempos de ejecucionque se obtienen.

Univ de Murcia-IES Ing. de la Cierva Paralelismo en la rama de tecnologıas informaticas

Page 53: Introducción a la Programación Paralela

Tipos de Programacion ParalelaParadigmas de Programacion Paralela

Entornos de Programacion Paralela

Ejemplo de fork-join en CEjemplo de uso de hilos en JavaEjemplo de paralelismo con PthreadsEjemplos de paralelismo con OpenMPEjemplos de paralelismo con MPIEjemplos de CUDA

Problemas en el Concurso de Programacion Paralela

El Concurso de Programacion Paralela se celebra desde hace tres anos, yconsiste en realizar programas paralelos a partir de solucionessecuenciales.

En la pagina del concurso (luna.inf.um.es) se ha creado una pruebapara practicar con los ejemplos de OpenMP, MPI y CUDA de estapresentacion.Se entra al concurso desde Mooshak, seleccionando el PP FP2014.Hay que solicitar una cuenta a traves de alguno de los profesoresparticipantes en este proyecto UMU-IES.

Se puede practicar con los ejemplos de OpenMP (problemas A y B), MPI(C y D) y CUDA (E y F) de ordenacion (A, C y E) y multiplicacion dematrices (B, D y F).

La explicacion de como trabajar se da en un fichero al que se accededesde cada uno de los problemas de la prueba.

Ademas de estos problemas de ejemplo se pueden consultar los deediciones pasadas y sus records en la pagina del concurso.

Univ de Murcia-IES Ing. de la Cierva Paralelismo en la rama de tecnologıas informaticas

Page 54: Introducción a la Programación Paralela

Tipos de Programacion ParalelaParadigmas de Programacion Paralela

Entornos de Programacion Paralela

Ejemplo de fork-join en CEjemplo de uso de hilos en JavaEjemplo de paralelismo con PthreadsEjemplos de paralelismo con OpenMPEjemplos de paralelismo con MPIEjemplos de CUDA

Se usa la librerıa mpi.h

Es un programa C con llamadas a la librerıa MPI.

Las funciones empiezan con MPI .... Hay funciones de:

inicializacion (MPI Init) y finalizacion (MPI Finalize),para obtener el numero de procesos (MPI Comm size) y elidentificador de proceso (MPI Comm rank),de sincronizacion (MPI Barrier),de envıo (MPI Send) y recepcion (MPI Recv)y otras...

Univ de Murcia-IES Ing. de la Cierva Paralelismo en la rama de tecnologıas informaticas

Page 55: Introducción a la Programación Paralela

Tipos de Programacion ParalelaParadigmas de Programacion Paralela

Entornos de Programacion Paralela

Ejemplo de fork-join en CEjemplo de uso de hilos en JavaEjemplo de paralelismo con PthreadsEjemplos de paralelismo con OpenMPEjemplos de paralelismo con MPIEjemplos de CUDA

Ejemplo: ordenacion por mezcla con varios procesos

El programa en programas/MPI/codigo6-16.c (del libro IPP) realiza unaordenacion con varios procesos.Trabajar con el:

Compilarlo (hay que tener instalado algun MPI, como openmpi, mpich...)conmpicc -O3 codigo6-16.c

Se ejecuta conmpirun -np X ./a.out tam

donde X indica el numero de procesos a usar, y tam el numero de datos aordenar.

Entender su funcionamiento.

Explicar el uso de las funciones de MPI.

Variar el numero de procesos y explicar los tiempos de ejecucion que seobtienen.

Comparar los tiempos con los obtenidos con OpenMP.

Univ de Murcia-IES Ing. de la Cierva Paralelismo en la rama de tecnologıas informaticas

Page 56: Introducción a la Programación Paralela

Tipos de Programacion ParalelaParadigmas de Programacion Paralela

Entornos de Programacion Paralela

Ejemplo de fork-join en CEjemplo de uso de hilos en JavaEjemplo de paralelismo con PthreadsEjemplos de paralelismo con OpenMPEjemplos de paralelismo con MPIEjemplos de CUDA

Ejemplo: multiplicacion de matrices

El programa en programas/MPI/codigo6-10.c (del libro de IPP)muestra una multiplicacion de matrices con varios procesos.

Se ejecuta pasando como argumento el tamano de las matrices amultiplicar.

Ademas de las funciones anteriores utiliza la funcion MPI Bcast,para mandar datos de un proceso a todos los demas.

Compilarlo, ejecutarlo y entender su funcionamiento.

Variar el numero de procesos y analizar los tiempos de ejecucionque se obtienen.

Para los ejemplos de MPI se pueden utilizar los problemascorrespondientes de la prueba PP FP2014 del concurso de programacionparalela.

Univ de Murcia-IES Ing. de la Cierva Paralelismo en la rama de tecnologıas informaticas

Page 57: Introducción a la Programación Paralela

Tipos de Programacion ParalelaParadigmas de Programacion Paralela

Entornos de Programacion Paralela

Ejemplo de fork-join en CEjemplo de uso de hilos en JavaEjemplo de paralelismo con PthreadsEjemplos de paralelismo con OpenMPEjemplos de paralelismo con MPIEjemplos de CUDA

Se pueden encontrar ejemplos de programas en CUDA enNVIDIA GPU Computing SDK.Ahı hay, entre otros, ejemplos de ordenacion y multiplicacionde matrices.

La programacion de GPUs es mas compleja que la vistahasta ahora con OpenMP y MPI, por lo que veremos un parde ejemplos simplificados que incluyen ordenacion ymultiplicacion de matrices pero que son ligeramente distintosde los vistos hasta ahora.

Utilizamos ejemplos que estan en la lista de records delConcurso de Programacion Paralela, y se puede usar laprueba PP FP2014 para experimentar con ellos.

Univ de Murcia-IES Ing. de la Cierva Paralelismo en la rama de tecnologıas informaticas

Page 58: Introducción a la Programación Paralela

Tipos de Programacion ParalelaParadigmas de Programacion Paralela

Entornos de Programacion Paralela

Ejemplo de fork-join en CEjemplo de uso de hilos en JavaEjemplo de paralelismo con PthreadsEjemplos de paralelismo con OpenMPEjemplos de paralelismo con MPIEjemplos de CUDA

Ejemplo: ordenacion en CUDA

El programa en programas/CUDA/ordenacionCUDA.cu corresponde alproblema B del concurso de programacion paralela de 2012.El problema consiste en ordenar los datos de cada una de las filas deuna matriz y a continuacion los datos en cada una de las columnas.La solucion utiliza un metodo de ordenacion llamado radixsort.Trabajar con el:

Mandarlo al concurso PP FP2014 y comprobar su funcionamiento.

Identificar en el las funciones de CUDA (empiezan por cuda) y sufuncionamiento.

Identificar como se lanzan ejecuciones a la tarjeta grafica.

Analizar su tiempo de ejecucion viendo como varıa al variar eltamano de bloque, y comparar con soluciones que no utilizanCUDA (hay soluciones OpenMP y MPI+OpenMP en la tabla derecords del concurso).

Univ de Murcia-IES Ing. de la Cierva Paralelismo en la rama de tecnologıas informaticas

Page 59: Introducción a la Programación Paralela

Tipos de Programacion ParalelaParadigmas de Programacion Paralela

Entornos de Programacion Paralela

Ejemplo de fork-join en CEjemplo de uso de hilos en JavaEjemplo de paralelismo con PthreadsEjemplos de paralelismo con OpenMPEjemplos de paralelismo con MPIEjemplos de CUDA

Ejemplo: multiplicacion de matrices

El programa en programas/CUDA/multiplicacionCUDA.cu corresponde alproblema D del concurso de programacion paralela de 2011.El problema consiste en multiplicar cuatro matrices.Se van multiplicando dos a dos, por lo que el paralelismo se encuentra en lamultiplicacion de dos matrices.Cada hilo CUDA multiplica una fila de una matriz por una columna de otra. Losnumeros de fila y columna se obtienen en funcion de los identificadores del hiloCUDA.Trabajar con el:

Mandarlo al concurso PP FP2014 y comprobar su funcionamiento.

Analizar su tiempo de ejecucion viendo como varıa al variar losThreadsPerBlock.

Comparar con soluciones que no utilizan CUDA (hay soluciones OpenMP yMPI+OpenMP en la tabla de records del concurso).

Univ de Murcia-IES Ing. de la Cierva Paralelismo en la rama de tecnologıas informaticas