NOVA INFRAESTRUTURA DE ALMACENAMENTO 1604-1998 ISSN 1139-563X EDITA FUNDACIÓN CESGA ......

16
NOVA INFRAESTRUTURA DE ALMACENAMENTO Novas do Centro de Supercomputación de Galicia Decembro 2017 Infraestructuras Cientíticas y Tecnicas Singulares

Transcript of NOVA INFRAESTRUTURA DE ALMACENAMENTO 1604-1998 ISSN 1139-563X EDITA FUNDACIÓN CESGA ......

NOVA INFRAESTRUTURADE ALMACENAMENTO

Novas do Centro de Supercomputación de GaliciaDecembro 2017

InfraestructurasCientíticas y TecnicasSingulares

A Fundación CESGA é unha organización sen animo de lucro ao servizo da investiga-ción científica, o desenvolvemento tecnoló-xico e a innovación dende 1993. Participan na Fundación CESGA a Xunta de Galicia e o Consello Superior de Investigacións Científicas (CSIC).

As infraestruturas xestionadas pola Funda-ción CESGA foron parcialmente financiadas pola Unión Europea, a través do Fondo Europeo de Desenvolvemento Rexional (FEDER) e do Goberno de España, a través do Ministerio de Economía e Competitividade (MINECO), así como pola Xunta de Galicia e o CSIC.

A Fundación CESGA xestiona unha infraes-trutura integrada na Rede Española de Supercomputación, unha Infraestrutura Cien-tífico Tecnolóxica Singular (ICTS) do Estado.

2 díxitos decembro 2017

O Finisterrae, corazón tecnolóxico

do Centro de Supercomputación

de Galicia (CESGA), serviu de

apoio a un proxecto galardoado co

Premio Nobel de Física 2017, o proxecto

LiGO. O respaldo fornecido polo CES-

GA foi, ademais, de envergadura: tradu-

ciuse no subministro de 1,2 millóns de

horas de procesamento de altas presta-

cións para o desenvolvemento das ope-

racións de cálculo avanzados dos que

precisou LiGO. Esta iniciativa, para quen

non o saiba, diríxese a achar ondas gra-

vitacionais. A participación do CESGA

materializouse a través do doutor Sas-

cha Husa e dun grupo de investigación

adicado á Física Teórica da Universitat

das Illes Balears (entre cuxos usua-

rios está precisamente o doutor Husa).

Segundo explicou o devandito investi-

gador, no seu traballo cotiá tira proveito

das capacidades de cómputo avanzado

dos superordenadores para estudar os

sinais de ondas gravitacionais creadas

cando dous buratos negros chocan; nas

súas palabras “os eventos máis violentos

no universo”. O seu traballo en concreto

baséase en resolver ecuacións e calcu-

lar, utilizando cálculos moi extensos, que

aspecto teñen esas colisións, e como

son exactamente os sinais que emiten.

Por outra banda, cómpre ter en conta que

os investigadores que desenvolven o seu

labor ao abeiro de LiGO teñen que com-

parar, grazas á concorrencia dos super-

computadores, as predicións baseadas

nos cálculos dos mesmos cos datos ex-

perimentais que eles rexistran e atopar

que sistemas crearon eses sinais. Para

eses cálculos a comunidade de Física

Teórica precisa dispor de acceso a moi

grandes máquinas de computación de

altas prestacións, xa que sen elas este

tipo de avances en ciencia sería impen-

sable e non poderíamos chegar a com-

prender mellor o universo que habitamos.

O doutor Husa e o seu equipo de físicos

teóricos acceden a potentes máquinas

de cómputo como FinisTerrae a través

de diferentes convocatorias competitivas

da Rede Española de Supercomputación

(RES), á cal o CESGA achega o 20% do

superordenador galego. A RES, composta

por 13 nodos repartidos por todo o estado

é a Infraestrutura Científico Tecnolóxica

Singular en Computación de España.

Os cálculos en Física Teórica demandan

tantos recursos computacionais que ade-

mais do millón duascentas mil horas de

procesamento empregados no Centro de

Supercomputación de Galicia, o equipo

da UIB tamén utilizou os superodenado-

res Calendula, do Centro de Supercompu-

tación de Castela-León, MareNostrum no

Centro Nacional de Supercomputación ou

máquinas de PRACE a alianza europea

pola computación avanzada.

O CESGA contribuíu co seu cálculo ao desenvolvemento do proxecto galardoado este ano co Nobel de Física

1,2 millóns de horas de cálculo

Sala de control dos investigadores do proxecto LiGO

DIRECCIÓN

Javier García Tobío

COORDINACIÓN

Fernando Bouzas Sierra

COLABORANGrowcom

DESEÑO, GRAFISMO E MAQUETACIÓN

Grupo Código Cero Comunicación, S.L.

FOTOMECÁNICA E IMPRESIÓN

Gráficas Garabal, S.L.

DEPÓSITO LEGAL

C 1604-1998

ISSN

1139-563X

EDITAFUNDACIÓN CESGAAvenida de Vigo, s/n (Campus Vida)15705 Santiago de CompostelaTelf. 981 569 810 - Fax. 981 594 [email protected]

CONTIDOS

[ 2 ] 1,2 millóns de horas de cálculo

[ 3 ] Supercomputación biotecnolóxica

[ 4 - 5 ] O CESGA multiplica por 5 a capacidade

dos seus servidores de datos

[ 6 - 7 ] Faladoiros arredor do cálculo avanzado

[ 8 ] Simulación e HPC como vantaxes competitivas

[ 9 ] Sofisticadas quimiotecas para novos fármacos

[ 10 ] Montañas de datos para desvelar a historia do cancro

[ 11 ] Navegación de deseño contra vento e marea

[ 12 - 13 ] A importacia dos datos

[ 14 ] Educación rural na vangarda

[ 15 ] Novas do CESGA

Fundación Pública Galega Centro Tecnolóxico de Supercomputación de Galicia

InfraestructurasCientíticas y TecnicasSingulares

3decembro 2017 díxitos

O CESGA pon os seus recursos ao servizo das empresas de Bioga

O pasado venres 17 de novembro, o

Centro de Supercomputación de

Galicia acolleu unha xornada so-

bre cálculo avanzado e servizos na

nube en colaboración con Bioga, o Clúster

Tecnolóxico Empresarial das Ciencias da

Vida. A xornada, que se celebrou na sede

do CESGA en Santiago, serviu para mos-

trar as principais necesidades de computa-

ción das empresas integradas na entidade

e, tamén, para amosar o potencial e as

capacidades do Centro de Supercompu-

tación en materia de cálculo de alto ren-

demento e almacenamento de datos. Se-

gundo se fixo saber no encontro, o noso

sector “bio” consume a día de hoxe o 20%

da capacidade de computación do CESGA

e copa, ademais, o 30% dos recursos de

almacenamento do centro.

Na xornada interveu o director do CESGA,

Javier García Tobío, quen lembrou que o

centro “é unha ferramenta fundamental

para a competitividade do sector biotecno-

lóxico da nosa Comunidade”, un sector que

integra unhas empresas con “necesidades

moi relevantes de cálculo e de almacena-

mento de datos”. Segundo engadiu, ao día

de hoxe “algo máis dunha ducia de empre-

sas galegas deste ámbito traballan xa co

CESGA, así como diferentes grupos de

investigación das universidades galegas e

doutras Comunidades e do Centro Supe-

rior de Investigacións Científicas (CSIC)”.

Supercomputación biotecnolóxica

Entre estas empresas e grupos, recordou,

atópanse AllGenetics, MD Use!, Affinime-

ter o Glecex, cuxos casos de éxito foron

debullados no transcurso da xornada.

Segundo os cálculos de García Tobío, o

sector biotecnolóxico require dunha parte

importante dos recursos do CESGA, o que

vén motivado polas demandas especiais

de disciplinas como a xenómica ou a na-

nomedicina, ámbitos de investigación que

producen mancheas de datos que cómpre

almacenar para logo poder tratalos e tirar-

lles proveito.

Na xornada participaron medio centenar

de empresas de Bioga, abordando exem-

plos de computación, cloud e acubillos de

información. Impartiron charlas os douto-

res Aurelio Rodríguez e Carlos Fernandez,

técnico superior de Aplicacións e adminis-

trador da Área de Sistemas do CESGA,

respectivamente, tras unha presentación

de Ramón Basanta, responsable de Trans-

ferencia do centro. Os asistentes coñece-

ron diversos casos de uso e debateron

sobre as necesidades das empresas do

sector en computación, almacenamento

e comunicacións. O director do CESGA,

ao remate da xornada, mostrou as insta-

lacións.

Seguindo engadiu García Tobío, “para

estar na vangarda e sermos competitivos

é crucial que teñamos a capacidade de

manexar e almacenar información”. Neste

senso, engadiu, o CESGA ofrece o uso

de infraestruturas de computación e al-

macenamento de datos, define solucións

tecnolóxicas adaptadas ás necesidades

de cada empresa e fornece de consulto-

ría e asesoramento sobre plataformas de

computación, simulación, modelado, datos

inxentes (Big Data), aprendizaxe a distan-

cia (eLearning) ou GIS. Como exemplos

concretos destas demandas atendidas

das firmas de biotecnoloxías, puxo o foco

nas necesidades computacionais do dese-

ño de novos fármacos, un eido no que é

preciso coñecer a dinámica molecular ou

desenvolver novas moléculas, e para iso

“faise preciso elaborar simulacións sobre

cal vai ser o comportamento das mesmas”.

Segundo engadiu, no deseño de novos

medicamentos, antes e despois de probas

de laboratorio, cómpre levar a cabo centos

ou milleiros de simulacións.

Bioga é unha asociación empresarial sen

ánimo de lucro que aglutina ás organiza-

cións integradas na cadea de valor do sec-

tor biotecnolóxico que teñen a súa sede en

Galicia. O Clúster traballa para mellorar o

emprazamento competitivo do sector gale-

go, buscando melloras competitivas e a xe-

ración de negocio mediante o impulso de

accións e servizos directamente dirixidos

ás empresas deste ámbito.

4 díxitos decembro 2017

CESGA Centro de Supercomputación de Galicia

O CESGA multiplica por 5 a capacidade dos seus servidores de datos

As capacidades e a potencialidade de resposta do Centro de Super-computación de Galicia (CESGA) vanse ver reforzadas coa entrada

do novo ano. Máis polo miúdo, o centro afrontará a súa nova andaina con “azos” renovados en materia de traballo con grandes volumes de datos. O motivo? Pois a inclusión dun novo servidor de 1,54 millóns de xigabytes. Esta incorporación, financiada pola Consellería de Economía, Emprego e Industria, permitirá (entre ou-tras cousas) multiplicar por cinco a capa-cidade dos seus servidores de datos. En palabras do departamento da Xunta que dirixe Francisco Conde, o novo sistema tamén “aporta velocidade de acceso e fle-xibilidade na xestión da información”.

Máis en detalle, a tecnoloxía incorporada foi especialmente deseñada para facilitar un acceso inmediato á información alma-cenada, multiplicando por cinco a capa-cidade bruta do CESGA e, en concreto, a dos seus servidores de almacenamento de datos, ao dispor da comunidade cientí-fica e tecnolóxica usuaria do centro.

O novo equipamento, co-financiado con fondos FEDER (Fondo Europeo de Desen-volvemento Rexional), foi adquirido á mul-tinacional tecnolóxica Fujitsu e producido polos actuais líderes mundiais en almace-namento de datos, NetApp, e supuxo un investimento de 500.000 euros.

O equipo entrou a prestar servizo para a comunidade usuaria a principios de de-cembro. Neste sentido, permitirá a investi-gadores de institucións e empresas explo-tar de maneira máis eficiente os inxentes conxuntos de datos cos que traballan, xa que poderán acceder, procesar, manexar, explorar, ou comparar maiores cantida-des de datos a grande velocidade. Para facernos unha idea da importancia destas novidades, só ao longo do 2017 CESGA

A Xunta mellorou os servizos do centro cun novo equipo de 1,54 xigabytes

A tecnoloxía incorporada foi especialmente deseñada para facilitar un acceso inmediato á información almacenada, multiplicando por cinco a capacidade bruta do CESGA

5decembro 2017 díxitos

Centro de Supercomputación de Galicia CESGA

rexistrou máis de 50 grupos de usuarios traballando de maneira intensiva con grandes volumes de datos.

Entre as entidades que se beneficiarán deste sistema atopamos á Fundación Pú-blica Galega de Medicina Xenómica, de-pendente do SERGAS e dirixida por Ángel Carracedo, que precisa ampliar as súas capacidades de traballo con datos para dar resposta ás crecentes demandas im-postas polos avances en medicina perso-nalizada.

O servizo de predición meteorolóxica ga-lego, MeteoGalicia, ou o servizo europeo de predicións de estado do mar, Coper-nicus, liderado en España por Puertos del Estado, tamén se atopan entre as en-tidades que demandan capacidade para poder incrementar a resolución dos seus modelos e poder así mellorar a fiabilidade das súas predicións.

Investigadores galegos que participan na redacción dos informes do Panel Intergu-bernamental de Cambio Climático, como Juan Añel da Universidade de Vigo, pre-cisan igualmente manexar con axilidade maiores conxuntos de datos para testar e interrogar axeitadamente os modelos cos que traballan.

Pequenas empresas que medran a gran ritmo e que traballan na punta de lanza da innovación en Galicia, como a coruñe-sa Health in Code, especializada en pro-ver servizos de xenética médica, tamén demandan un acceso flexible a recursos especiais para seren quen de responder a picos de traballo.

Por outra banda, os centros do Instituto Español de Oceanografía (IEO) en Galicia contan con grupos de investigación que fan uso de complexos modelos oceano-gráficos nos que incorporan parámetros físicos e bioxeoquímicos para determinar o estado e predicir as dinámicas dos re-cursos mariños.

A maiores, grupos adicados a seguridade alimentaria e a mellora xenética animal e forestal do Instituto Nacional de Tecno-

loxía Agraria e Alimentaria (INIA) esperan dispor de servizos como os que fornece-rá o CESGA con esta infraestrutura para acelerar a súa produción de resultados.

De igual xeito, as novidades tecnolóxicas introducidas darán azos a proxectos de centros tecnolóxicos e de empresas da contorna de tres clústeres en Galicia; o Clúster Tecnolóxico Empresarial de Cien-cias da Vida (Bioga), o Clúster Audiovi-sual Galego (CLAG), e o Clúster TIC Ga-licia.

O Centro de Supercomputación de Gali-cia (CESGA) depende da Axencia Galega de Innovación (GAIN) da Consellería de Economía, Emprego e Industria da Xun-ta de Galicia e do Consello Superior de Investigacións Científicas (CSIC). É un or-ganismo cunha traxectoria de 24 anos. O seu obxecto é investigar, fomentar, difun-dir e prestar servizos de cálculo intensivo, almacenamento e comunicacións avan-zadas ás comunidades investigadoras galega e do CSIC, así como a empresas e institucións. Como nodo da Rede Es-pañola de Supercomputación, o Centro é recoñecido como Infraestrutura Científico Técnica Singular do Estado.

6 díxitos decembro 2017

O CESGA e a Rede Española de Supercomputación (RES) tive-ron unha importante actividade conxunta ao longo de 2017. Pri-

meiro, desenvolveuse en xullo un con-greso sobre as posibilidades do cómputo avanzado para incrementar o noso coñe-cemento sobre a atmosfera e os océanos e logo, en setembro, unha semana entei-ra de actividades de confraternización e intercambio de coñecemento e recursos. Esta “semana RES” incluíu un novo en-contro de investigadores arredor da su-percomputación e os océanos e, a xeito de culminación, a onceava edición da xornada anual de usuarios da Rede Es-pañola de Supercomputación (RES).

Respecto da cita de xullo, foi un semi-nario científico dirixido a avanzar no co-ñecemento do medio natural mediante simulación, cálculo de altas capacidades e outras metodoloxías TIC de deseño e predición de comportamentos, neste caso do sistema terrestre. Falamos do congre-so Computación de Altas Prestacións e Modelado de Ciencias da Atmosfera e do Océano. O seminario, que contou co apoio da Rede Española de Super-computación (RES), encamiñouse tamén a achandar o terreo (resolvendo retos, emendando posíbeis atrancos) para im-pulsar e estender o uso do modelado dos fenómenos da terra mediante sistemas de computación de altas prestacións, unha

práctica que, tendo en conta a deriva da Terra por mor da acción do home (princi-palmente o cambio climático), será cada vez máis demandada por todo tipo de entidades. O evento contou co apoio do Centro de Supercomputación de Galicia (CESGA) e da Universidade de Vigo, des-envolvéndose no Instituto de Investiga-cións Agrobiológicas-CSIC, no Campus Sur da Universidade de Santiago.

Respecto das actividades de setembro, incluíron como dixemos unha nova xeira de traballo arredor da supercomputación e os océanos. Foi, máis polo miúdo, un seminario científico que tivo como fío te-mático os Servizos mariños e a supercom-

putación, experiencias e retos futuros. A xornada, que se celebrou tamén na sede do Instituto de Investigacións Agrobioló-xicas de Santiago, dirixiuse a mostrar o amplo potencial do cómputo avanzado como ferramenta fundamental para as simulacións numéricas en oceanografía. Este potencial, impulsado pola mellora da potencia e da capacidade de almacena-mento dos equipos informáticos, xa per-mitiu o desenvolvemento de simulacións rexionais da circulación costeira a alta resolución e ao longo de períodos longos. Segundo se recordou na sesión de traba-

Faladoiros arredor do

cálculo avanzadoA Rede Española de Supercomputación e o CESGA afondaron nas posibilidades do cómputo para resolver os retos do noso mundo

Centro de Supercomputación de Galicia CESGA

7decembro 2017 díxitos

llo, a supercomputación está a posibilitar que varios usuarios da comunidade espa-ñola manteñan servizos de predición de curto prazo da circulación oceánica como o servizo IBI do programa Copernicus ma-riño ou servizos de predición autonómica en Galicia. Ademais o financiamento euro-peo e autonómico destes servizos permite o uso de cómputo avanzado dentro da RES (por exemplo os servizos devanditos execútanse no CESGA). Estes servizos de predición, así como simulacións costei-ras e rexionais están a utilizarse no des-envolvemento de solucións baseadas en observacións e modelados para distintos usuarios mariños (acuicultura, pesquei-ras, turismo...).

Polo que atinxe á onceava edición da xor-nada anual de usuarios da Rede Española de Supercomputación (RES), foi un rele-vante e multitudinario evento no que parti-ciparon unha manchea de investigadores de todos os recantos estatais, partillando

ideas e propostas para ampliar o que xa é de por si amplo: o abano de posibilida-des e aplicacións do cómputo avanzado en múltiples ámbitos do noso día a día. A xuntanza resultou de gran interese non só para os integrantes da RES e os seus usuarios (actuais e potenciais), senón ta-mén para a puxante comunidade de estu-dantes e investigadores en computación avanzada e, igualmente, para as empre-sas (cada vez máis) que precisan para os seus procedementos de potentes recur-sos de cálculo, predición e simulación. A xornada da RES celebrouse o 28 de setembro e complementouse, ao día se-guinte e tamén en Compostela, coa sexta Conferencia do HPC Advisory Council, as dúas citas organizadas polo CESGA.

No encontro da RES, amais de informar das novidades desta Rede Española, achegouse información de interese sobre os métodos de acceso aos recursos de seu e da PRACE (Partnership for Advan-

ced Computing in Europe). Na xornada fixeron acto de presenza, tamén, o con-selleiro de Economía, Francisco Conde, e a secretaria de Estado de Investigación, Carmen Vela, quen coincidiron en sa-lientar as importantes contribucións do CESGA ao impulso dos avances máis re-levantes que se están producindo en Ga-licia no ámbito da ciencia e a innovación. Conde engadiu que o labor do CESGA, é “unha proba do que a tecnoloxía contribúe á mellora da competitividade e da calida-de de vida”. Segundo fixo saber o gran

desafío do centro para os vindeiros anos é “fortalecerse como centro de excelen-cia en ciencia computacional aplicada, intensificar o grao de internacionalización da súa actividade e incrementar a súa presenza na industria para que o tecido empresarial galego poida beneficiarse

deste recurso, a supercomputación, que está detrás das previsións meteorolóxi-cas, a seguridade do tráfico marítimo, os estudos sobre cambio climático, o deseño de novos fármacos ou da dixi-talización da Industria 4.0, entre outros”. Tamén lembrou que o CESGA achega na actualidade un servizo diario a máis de 500 investigadores e tecnólogos das tres universidades galegas e do CSIC; par-ticipando en máis de 200 proxectos de I+D+i; manexando a maior plataforma de ensino en liña pública en Galicia e promo-vendo a xeración de talento formando a novos licenciados e profesionais de em-presas (“só o pasado ano colaborou con preto de 80 firmas”, dixo). Conde desta-cou tamén o papel do “buque insignia do CESGA”, o supercomputador Finisterrae, un dos 13 cos que conta a Rede Española de Supercomputación da que forma parte o CESGA desde hai 2 anos.

Polo que atinxe á sexta Reunión do HPC Advisory Council, tivo como fina-lidade promover a interacción entre as empresas e organizacións que traba-llan en tecnoloxías HPC (computación de alto rendemento polas súas siglas en inglés) cos usuarios finais, e abran-gueu un amplo rango de intereses e te-máticas como Deep Learning, Machine

Learning (aprendizaxe das máquinas) e Big Data (información a gran escala). O día 28 de setembro pola tarde, despois da Xornada de Usuarios, desenvolveuse unha actividade cultural que consistiu nunha visita guiada polo centro histórico de Santiago de Compostela.

O CESGA achega na actualidade un servizo diario a máis de 500 investigadores e tecnólogos das tres universidades galegas e do CSIC

Participantes na xuntanza anual da Rede Española de Supercomputación

8 díxitos decembro 2017

Simulación e HPC como vantaxes competitivas

Estufas, sistemas de ventilación e tubos de aceiro inoxidable integrados na paisaxe debuxan un novo panorama no consumo enerxético. A combus-

tión limpa chegou para quedar. Pero, como acadar chemineas sofisticadas e sostibles? Dinak, empresa galega punteira no sec-tor, recorre á simulación na nube mediante computación de alto rendemento (High Per-

formance Computing) como vantaxe com-petitiva. Este método de cálculo avanzado permítelle deseñar o produto máis axeitado para cada fogar ou industria nunha semana, minimizando o número de prototipos físicos necesarios.

Os gases liberados por estufas de gas, che-mineas de leña ou quentadores que funcio-nan mal poden chegar a ser moi perigosos. Calcúlase que cada ano en España sofren intoxicacións por monóxido de carbono (CO) entre 5.000 e 10.000 persoas. Pero o control dos gases e a procura dunha óptima ventilación é posible. O emprego de tecno-loxía de última xeración por parte do sector consegue emisións cero.

Onde está o segredo das novas chemineas? Na simulación numérica. A recreación da realidade empregando métodos matemáti-cos e potentes computadores permite xerar modelos a partir dunha serie de variables

A orixe dos traballos de Dinak está no seguinte: a necesidade de de avanzar na fabricación de chemineas modulares concéntricas de aceiro inoxidable cun cir-cuíto estanco de combustión. Para isto, e tendo en conta a elevada complexidade dos labores a desenvolver, Dinak apostou pola computación de altas prestacións con vistas a acadar unha simulación na nube o máis detallada posible, con pro-bas e visualizacións dixitais na procura do deseño máis axeitado para cada caso e sen necesidade de prototipos físicos.

A clave para acadar os ditos obxectivos residiu na concorrencia nun proxecto do Centro de Supercomputación de Galicia (CESGA), achegando unha solución tec-nolóxica baseada na simulación numéri-ca con código aberto OpenFoam. Deste xeito, Dinak foi quen de contar cun equi-pamento de cálculo exhaustivo e rápido para acadar chemineas optimizadas. O modelo de simulación deseñado polo Centro Tecnolóxico Aimen e a interface feita a medida polo Grupo de Arquitec-tura de Computadores da Universidade da Coruña permitiu a Dinak configurar as simulacións, executalas e visualizar os re-sultados de forma sinxela.

Tempos e custos inferiores

O máis sorprendente? Menos tempo e máis beneficios. Coa adopción da simu-lación numérica, a empresa pode aforrar máis dun 90% dos custos asociados ao deseño de cada modelo de nova chemi-nea. A maiores, o proceso pasa a realizar-se nunha semana cando antes levaba un mes. Actualmente Dinak, con presenza en sete países a través de delegacións en Francia, Italia, Bélxica, Alemaña, Rei-no Unido e Polonia, desenvolve entre tres e catro novos produtos ao ano.

A empresa galega Dinak deseñou chemineas á carta matematicamente respectuosas co medio ambiente

proporcionadas polo deseñador. A posibi-lidade de recrear e representar de forma virtual procesos e produtos sen necesida-de de prototipos físicos, tan custosos en tempo e diñeiro, empezou a incorporarse aos procesos industriais nos anos sesenta.

A empresa galega Dinak, con sede en Vigo e máis de tres décadas de andaina, atopou neste método a variña máxica para fabricar chemineas “á carta”. Buscaba unha solu-ción para gañar competitividade creando o deseño máis axeitado para cada fogar ou fábrica en función do espazo, as medidas, o aspecto e os estándares de calidade. Coa simulación dos seus deseños a través da computación de alto rendemento a em-presa é quen de aforrar, agora, ate 50.000 euros anuais e de obter o produto final nun-ha semana, cando antes tardaba ao redor dun mes.

O proxecto Fortissimo recebeu finaciamen-to do Séptimo Programa Marco para Inves-tigación, Desenvolvemento Tecnolóxico e Demostración da Unión Europea baixo o acordo Nº609029.

CESGA Centro de Supercomputación de Galicia

9

O CESGA dá soporte á inxente base de datos do grupo galego BioFarma

As primeiras probas de que os hu-

manos deixaron marcados os seus

dedos en tabliñas de arxila detec-

táronse nas antigas Babilonia e

Persia. Houbo que agardar a 1891 para a

auténtica descuberta do uso da pegada

dactilar, única en cada individuo e clave

para recoñecer persoas. O achado atribúe-

se ao policía arxentino Juan Vucetich. Un

ano despois, o seu equipo foi o primeiro en

identificar a unha asasina mediante rexistro

dactiloscópico.

A información que achegan as curvas da

pel dos dedos é moi sensible e por iso mes-

mo debe estar protexida. Esta esixencia de

confidencialidade non é exclusiva do ám-

bito da identificación das persoas. Trala re-

volución científica e tecnolóxica iniciada no

século XX e que continúa no actual, moitos

sectores xeran e manexan grandes volu-

mes de información, con necesidades para

a súa xestión e seguridade englobadas no

que hoxe coñecemos como Big Data. É o

caso do grupo galego de investigación Bio-

Farma, cunha base de datos que é un te-

souro para a industria farmacéutica.

O equipo dirixido por Mabel Loza, catedrá-

tica de Farmacoloxía da Universidade de

Santiago (USC), produce dende 1998 in-

formación para o descubrimento de novos

medicamentos. A tarefa dos máis de trinta

investigadores emprazados no Centro de

Investigación en Medicina Molecular e En-

Sofisticadas quimiotecas para novos fármacos

fermidades Crónicas (CiMUS) consiste en

identificar os compostos químicos máis

prometedores para o tratamento de pato-

loxías. “Creamos e gardamos a pegada

dactilar dos compostos”, explica cun símil

clarificador José Brea, responsable da

plataforma de cribado de fármacos (scree-

ning) do grupo.

Detectar os compostos que se activan so-

bre as células é clave, por exemplo, na pro-

cura de novos quimioterápicos para tratar o

cancro. A información de como reacciona

cada composto e a súa morfoloxía fica gar-

dada baixo chave a modo de historial. “De

cada composto almacenamos estrutura

química, procedencia, localización nas pla-

cas de ensaio e outros resultados obtidos”,

especifica José Manuel Santamaría, xestor

do grupo.

Con toda esta información, BioFarma foi

creando a súa propia quimioteca. Ao princi-

pio, cando o grupo traballaba con mostras

de 15.000 moléculas, o tratamento dos da-

tos non supoñía un problema no día a día

dos investigadores. Pero a actividade deste

equipo deu un paso de xigante a partir do

2012. Nacía InnoPharma, iniciativa galega

para o descubrimento temperá de fárma-

cos, na que participa tamén o equipo do

xenetista da USC Ángel Carracedo.

Cal era o reto? A busca de compostos

activos para desenvolver novas dianas

terapéuticas en neuroloxía, psiquiatría,

metabolismo, cancro, inflamación e enfer-

midades raras. O volume da quimioteca

disparouse xa que o grupo conseguiu reu-

nir para esta nova etapa 60.000 moléculas.

Con este panorama, BioFarma precisa-

ba máis capacidade para abordar tantas

análises de compostos e gardar toda a

información de xeito seguro. Como lembra

Santamaría, ao ampliarse a plataforma de

screening o grupo atopou a solución para

albergar os seus enormes volumes de da-

tos nos servidores do CESGA.

A actividade de BioFarma adquiríu outra

dimensión. O CESGA achegou a súa ex-

periencia en cálculo, computación de altas

prestacións e servizos avanzados para o

arranque de InnoPharma.

Pero, como foi a adaptación do traballo

no grupo? Brea fala de dous tipos de xes-

tión de datos, a través de dous servidores

aloxados no Centro de Supercomputación.

Un deles alberga a base de datos onde o

grupo almacena toda a información sobre

os compostos. O outro servidor emprégase

para a análise automatizada de imaxes de

microscopía e a súa almacenaxe.

BioFarma consegue con esta iniciativa re-

ducir a distancia entre a investigación bá-

sica en novos mecanismos terapéuticos e

a súa aplicación industrial. Trátase de que

as compañías farmacéuticas aproveiten o

know how dos científicos para apostar pola

elaboración de novos fármacos. A quimio-

teca ofrécelles sofisticada información de

partida para perfilar a potencia e o éxito

dun posible novo medicamento.

É moi probable que imaxes analizadas nos

últimos cinco anos no CiMUS sexan o piar

de fármacos para tratar o ictus, o cancro de

pulmón ou a asma nun futuro. A investiga-

ción e a tecnoloxía que o farán posible son

100% galegas.

decembro 2017 díxitos

CESGA Centro de Supercomputación de Galicia

10 díxitos decembro 2017

Montañas de datos para desvelar a historia do cancro

O equipo do xenetista David Posada, da Universidade de Vigo (UVigo), traballa nun escenario de informa-ción inxente, de datos que case su-

peran a nosa capacidade de análise e de coñecemento que xa non é posible enviar por Internet. Este é o “ambiente” no que traballa na actualidade o seu equipo, na análise de datos de secuenciado masivo (do termo orixinal en inglés Next Genera-

tion Sequencing ou NGS). David Posada foi o primeiro investigador galego que re-cibiu unha axuda europea Starting Grant hai unha década e no 2014 conseguía subir ao seguinte nivel coa Consolidator Grant.

Cunha longa traxectoria como biólogo evolutivo, Posada conseguiu os fondos de elite do Consello Europeo de Investiga-ción (ERC) para financiar o seu proxecto sobre a evolución somática das células canceríxenas. O enfoque da investigación é biolóxico, non médico. Trátase de exa-

Pero, como chegará o equipo de Posada á bioloxía básica do cancro? Con técnicas de xenómica de célula única. Se a maioría de estudos desta enfermidade analizan un anaco de tumor para lograr un xenoma promedio e comparalo con outros indivi-duos, neste caso o camiño é inverso. De cada persoa obteranse cen xenomas e o reto é estudar dez individuos. Isto permi-tirá ter datos da evolución da doenza en cada persoa, cun enfoque que permite ir cara a atrás no tempo e detectar as dife-renzas xenómicas. “Comparando os re-sultados cos de tecido san obteremos a película evolutiva”, apunta.

Nun exercicio aproximado, o secuenciado de mil xenomas tradúcese no manexo dun volume inxente de información. No grupo de Filoxenética, este equipo de investiga-dores traballa cun clúster propio de com-putación. Pero non era de abondo. Posada recorreu entón ao Centro de Supercompu-tación de Galicia (CESGA) por necesidade de “espazo, memoria e velocidade”. Este proxecto de grande alcance superou ex-pectativas no tratamento de datos.

Cada xenoma ten máis de 3.000 millóns de letras e, en termos de espazo, un xe-noma ocupa uns cen xigabytes. A xestión dos datos no CESGA permite ao grupo de Xenómica Evolutiva almacenar unha canti-dade de información que doutro xeito re-sultaría imposible, ademais de procesala a unha velocidade e tempo razoables. “Non podemos agardar tres anos para ter unha resposta a unha análise, por exemplo”, ex-plica o científico. Tanto é así que o plan de Posada é prescindir do clúster propio de supercomputación dentro de dous anos e trasladar toda a actividade computacional ao CESGA.

Este proxecto para entender a historia do cancro está no seu ecuador, pero a activi-dade do grupo de investigación co CES-GA continuará no tempo. Os resultados desvelarán se os tumores se producen só a partir da replicación de células nai ou en que fase aparece a metástase.

O CESGA subministra recursos ao equipo de David Posada (UVigo) para a súa análise de células tumorais

minar cando aparece un tumor e como foi o proceso de mutación celular para che-gar a esa alteración.

O estudo tamén permitirá comprobar se o cancro se manifestou dúas veces ou se o que se entende como metástase se corresponde co tumor primario. A través da análise de mostras de individuos con cancro, o grupo definirá o mapa histórico da enfermidade.

Unha das claves do comportamento dos tumores atópase na teoría de Darwin: as mutacións compiten entre si para repli-carse máis rápido. Conta o xenetista que, a través da bioloxía evolutiva, trazouse a traxectoria do espallamento da humani-dade polo planeta ou a chegada de de-terminadas especies a novos territorios, a partir dos xenomas. “Neste proxecto o corpo humano é o continente, os tumores primarios e secundarios o arquipélago e as células os individuos”, describe.

decembro 2017 díxitos 11

Vicusdt e Wavec botan man da computación avanzada para acadar a máxima seguridade nas estruturas flotantes

O transatlántico británico Olympic era xemelgo do Titanic. Me-

ses despois do afundimento deste último, no 1912, o Olym-

pic tiña que iniciar unha singradura dende Southampton, o

mesmo porto de partida do Titanic na fatídica viaxe trunca-

da polo choque contra un iceberg. Pero a tripulación do Olympic

negouse a navegar ata que se corrixisen os puntos febles en segu-

ridade, os mesmos cós do seu buque irmán accidentado, ao seren

de idéntica construción.

Logo de investigar o accidente, a Comisión Mersey do Reino Uni-

do redactou un informe con recomendacións sobre o deseño de

buques. Este documento supuxo o inicio das normativas sobre se-

guridade no mar.

No 1958 o enxeñeiro naval e matemático ruso Alekséi Krylov es-

cribía a definición de estabilidade, adoptada pola simulación nu-

mérica. Aplicou as matemáticas a problemas marítimos e as súas

táboas de inundabilidade empregáronse a partir daquela en todo

o mundo.

O panorama no que traballan hoxe empresas como Vicusdt e

Wavec é ben distinto. Están especializadas en servizos de consul-

toría e enxeñería para construción naval, armadores, plataformas

acuícolas e estruturas utilizadas polas industrias do petróleo e do

gas. E aplican os avances no estudo do comportamento dinámico

dun buque no mar, coñecido como seakeeping en inglés.

Navegación de deseño contra vento e marea

Vicusdt, compañía fundada en Vigo con experiencia na industria

pesqueira, e a lusa Wavec, máis centrada na industria das ener-

xías renovables mariñas, funcionan como auténticos laboratorios

de cálculo. Ambas empresas perseguen un mesmo horizonte:

conseguir a máxima seguridade, o maior rendemento e o deseño

máis sofisticado de buques e estruturas flotantes.

No seu día a día empregan modelos de simulación para reproducir

o deseño de barcos ou plataformas. Inclúen medicións e cálculos

obrigatorios e minimizan o número de prototipos físicos, de eleva-

do custo. Porén, neste camiño da experimentación, buscaban me-

llorar o proceso para seren máis competitivas. Desexaban unha fe-

rramenta de deseño poderosa, con maior potencia computacional.

Ambas compañías sabían que empregando computación de alto

rendemento na simulación avanzada obterían resultados en tem-

pos moi inferiores. Para ampliar a capacidade no manexo de da-

tos precisaban unha fonte externa e moi potente de recursos de

cálculo. Así entrou en escena neste experimento o Centro de Su-

percomputación de Galicia (CESGA), brindando as ferramentas

computacionais e un elevado volume de recursos para a simula-

ción considerando múltiples variables de comportamento no mar.

Unha vez localizadas as ferramentas, como incorporaron a com-

putación de altas prestacións nos seus procesos? Mediante a sin-

cronización integración do software de deseño e a plataforma de

simulación do CESGA. Para Wavec e Vicusdt, isto traduciuse na

implantación dunha interface o suficientemente intuitiva para que

o seu persoal o manexase sen dificultade dende os seus equipos.

A empresa catalana Compass (proveedora do software) e o Cen-

tro Internacional de Métodos Numéricos en Ingeniería (CIMNE)

fixeron posible a adaptación do software.

Vicusdt e Wavec estaban no certo. Os tempos para obter o produ-

to final reducíronse. Comprobaron que ao implementar a compu-

tación de alto rendemento resolven estes procesos ata 45 veces

máis rápido. Ademais, coa nova potencia son quen de realizar si-

mulacións que antes resultaban imposibles.

As vantaxes xeradas xa espertaron o interese do mercado eu-

ropeo. Os resultados da colaboración do CESGA con Vicusdt e

Wavec foron a base para ofertar un servizo de asesoramento e

análise do comportamento de barcos e estruturas flotantes no

"market place" nacido do proxecto Fortissimo. A fórmula? Un mo-

delo de pago por uso. Esta plataforma europea na nube simplifica

o acceso a simulacións de altas prestacións para pequenas e me-

dianas empresas de todo o mundo.

O proxecto Fortissimo recebeu finaciamento do Séptimo Programa Marco para Investigación, Desenvolvemento Tecnolóxico e Demos-tración da Unión Europea baixo o acordo Nº609029.

12 díxitos decembro 2017

CESGA Centro de Supercomputación de Galicia

A importancia dos datosA

transformación dixital ten un gran impacto no almacenamento requiri-do polas empresas. Máis fontes de datos xeran máis datos, que deben

consolidarase, transmitirse, procesarase e almacenarse. Os expertos predín un me-dre nos volumes de información por un factor de 10 nos vindeiros tres anos. Isto conducirá a máis esixentes demandas de almacenamento en termos de tempo de resposta, así como de maior e máis rápi-da capacidade de evolución. Para manter baixo control os custes deste explosivo crecemento, o prezo por terabyte de datos debe reducirse de maneira significativa.

Esta proliferación dos datos pode resultar difícil de xestionar se se empregan as fe-rramentas tradicionais de bases de datos relacionais. Para obter valor destes datos, é preciso contar cunha infraestrutura axei-tada para asumilos e acubillalos, e cunha plataforma analítica para extraer coñece-mento relevante deles.

As combinacións de tecnoloxías de Tercei-ra Plataforma están a transformar os sec-tores industriais, achegando acceso máis rápido á información de valor, potenciación do comercio dixital e habilitación dunha in-fraestrutura intelixente.

Para o devandito, é preciso que as novas tecnoloxías de xestión de datos permitan simplificar a infraestrutura tecnolóxica e reducir os custes, mello-rar o rendemento e a velocidade das análises de datos e mellorar a fiabilida-de e a visibilidade dos datos.

“NetApp estimula o rendemento de

aplicacións de Terceira Plataforma e

permite aos usuarios prosperar na

economía dixital” - Ashish Nadkarni, director de programas de IDC

Os sistemas de NetApp están dese-ñados para afrontar as necesidades desta terceira plataforma e conta con funcionalidades que subministran grandes vantaxes para o procesamen-to da información almacenada a través de ferramentas como Splunk, Hadoop ou Bases de datos NoSQL.

Splunk

A tecnoloxía de NetApp para Splunk ofrece un rendemento máis rápido, un TCO optimizado e unha fiabilidade me-llorada, en comparación con servido-res de consumo con almacenamento interno ou outras opcións.

Hai varias vantaxes a salientar:

•Aumento do rendemento de busca nun 69 %

•Optimización dos grupos de capacidade para os niveis de datos quente, tépedo, frío e conxelado de Splunk.

•107 % de media de aumento do rendemen-to das procuras en streaming fronte á dos servidores de consumo que teñen discos internos.

•Redución das copias de réplica de tres a dous, con fiabilidade mellorada.

•Escalado independente dos sistemas infor-máticos e do almacenamento para axustar mellor a carga de traballo das aplicacións.

•Cifrado de datos en repouso con pouco ou nulo impacto no rendemento.

“Dada a gran cantidade de datos xerados por

máquinas confiamos en E-Series de NetApp

para pór en marcha solucións de Splunk di-

rixidas a supervisar e resolver problemas nas

diferentes plataformas que se atopan na nosa

contorna”. - ING DIRECT Australia

Plataformas tecnolóxicas

Terceira plataformaTerceira plataforma

Primeira plataforma

Segunda plataforma

MILLÓNSDE APLIACIÓNS

DECENAS DE MILES DE APLIACIÓNS

CENTOS DE MILLÓNS DE USUARIOS

MILLÓNS DE USUARIOS

MILES DE APLIACIÓNS

MILES DE MILLÓNS

DE USUARIOS

Redes, móbil, análise, cloudDispositivos móbiles

LAN/Internet Cliente/ServidorPC

Cotorna mainframe, miniordenadorTerminais

E-series de NetAppSSD quente - SAS frío

50

45

40

35

30

25

20

15

10

5

Servidor xenéticoSSD quente - SAS frío

Denso Moi denso

NetApp® E5760(SSDs, NL-SAS)

Búsquedas densas

Búsquedas estáticas e de streaming (promedio)

Hot/Warm/Cold Data(searchableand actively

writing to disk)

Tem

po to

tal (

en s

)

Hadoop

Hadoop deseñouse pensando nas em-presas que querían xestionar, analizar e explotar o Big Data co fin de obter infor-mación relevante. Con Hadoop, agora é posible procesar e aproveitar datos sen estruturar ou estruturados de forma ma-siva. Cada vez máis empresas adoptan Hadoop para as súas aplicacións.

Porén, Hadoop presenta desafíos no ámbito empresarial, en termos de dis-poñibilidade, eficiencia e flexibilidade. E para iso NetApp fornece de solucións para o sistema de arquivos distribuí-dos de Hadoop (HDFS) que ofrecen un rendemento máis rápido, un tempo de inactividade inferior do clúster e capa-cidade evolutiva lineal cun conxunto de ferramentas moi variado para dar resposta á demanda de análise de Big

Data.

Esta solución optimizouse tendo en con-ta o equilibrio entre servidores e alma-cenamento, os custos, a fiabilidade e a capacidade de servizo, o rendemento e a densidade de almacenamento. A súa prioridade é proporcionar opcións flexibles baseadas en factores como o número de clústeres, os servidores e as opcións de soporte. As organizacións que utilizan Hadoop teñen con frecuen-cia servidores básicos con almacena-mento de acceso directo (DAS) interno.

A solución de NetAPP está deseñada para utilizar ou modelo de DAS exter-no, que fornece de almacenamento

O almacenamento All-flash de NetApp está deseñado para axudar aos clientes a crear solucións de alto rendemento, rendibles e de alta dispoñibilidade para bases de datos NoSQL. As bases de datos NoSQL valida-das a día de hoxe son Couchbase, Mongo-DB e Cassandra, aínda que tamén é com-patible con outras bases de datos NoSQL, como HBase, Redis e MarkLogic.

Entre as vantaxes que podemos obter deste tipo de almacenamento utilizado para Bases de Datos NoSQL podemos salientar as se-guintes:

•Rendemento superior e predicible.

•Acceso a datos de NoSQL con maior fre-cuencia.

• Escalado sinxelo con computación e al-macenamento desasociados.

• Menor número de servidores, así como de menor capacidade, reducindo o custe de propiedade.

dedicado e fiabilidade e escalabilida-de óptimas para empresas, ademais de reducir os custos operativos. O fir-mware RAID proporciona operacións transparentes e practicamente ininte-rrompidas sen a carga da replicación baseada en servidor, que adoita nece-sitar normalmente tres copias de datos para Hadoop. As solucións de NetApp para Hadoop soamente requiren dúas copias dos datos, polo que reducen a conxestión da rede e aumentan o ren-demento.

BBDD no SQL

NoSQL, que abrangue unha ampla gama de tecnoloxías e arquitecturas, busca resolver os problemas de esca-labilidade e rendemento de Big Data que as bases de datos relacionais non foron deseñadas para abordar. NoS-QL é especialmente útil cando unha empresa necesita acceder e analizar grandes cantidades de datos non es-truturados ou datos que se almacenan de maneira remota en varios servidores virtuais na nube.

MongoDB 3.0

On Premises

NetApp®SnapMirror®Backup/DR

to the Cloud

SnapMirror®Backup/DR

to the NPS/SecondaryNetApp Private Storage

AFF A300

MicrosoftAzure

MongoDB

RHELRHELONTAP

MongoDB

AmazonWeb Services

Google CloudPlatform

AFF A300

13decembro 2017 díxitos

Centro de Supercomputación de Galicia CESGA

Autor do artigo: Manuel Millares, Storage Technology Consultant Solution

Design de Fujitsu

HDFS as Primary and NFS as Secondary

Hadoop/Spark Cluster

HDFS NFS

Centro de Supercomputación de Galicia CESGA

E-Series de NetApp

E-Series de NetApp

E-Series de NetApp

Nodo de nombre

Nodo en espera

Softw

are

de H

adoo

p

Red

dat

aNod

e de

10

GB

NodosDatos

NodosDatos

SAS/ISCSI/

FC

SAS/ISCSI/

FC

SAS/ISCSI/

FC

NodosDatos

CESGA Centro de Supercomputación de Galicia

14 díxitos decembro 2017

Educación rural na vangarda

O proxecto Rede de Escolas na Nube vaise ampliar a todas as Es-colas Rurais Agrupadas de Gali-cia. Así o deu a coñecer en no-

vembro o Centro de Supercomputación de Galicia (CESGA), impulsor actual do proxecto xunto coa empresa Balidea e máis a Xunta (AMTEGA e a Consellería de Educación e Cultura). Como lembra-remos, a Rede foi creada hai case oito anos co obxectivo de explorar (e ex-plotar) as vantaxes da computación na nube (cloud computing) desenvolvidas na contorna das nosas pequenas esco-las rurais, os Centros Rurais Agrupados (CRA). O dito traballo foi posíbel na súa orixe grazas ao apoio financeiro que HP Labs emprestaba ao CESGA e en 2014 recibiu un importante pulo orzamenta-rio para un proxecto europeo de cara a validar e mellorar os achados obtidos noutras zonas rurais e illadas de Euro-pa. Agora, a Rede de Escolas de Nube (www.escolasnanube.es) volve recibir impulso coa posibilidade de espallarse a todo o noso rural.

Segundo se lembrou na xuntanza, a Rede de Escolas na Nube supón “un modelo de infraestrutura, servizos e metodoloxía de traballo baseado en computación cloud e software aberto ao servizo do ensino e a colaboración entre as escolas rurais dis-tribuídas, creando unha rede na que se poidan compartir de maneira segura expe-riencias educativas, materiais e aprendiza-xe, adaptada a contorna ás necesidades deste modelo de escola rural distribuída e multinivel”.

Asemade, fíxose fincapé nos bos prece-dentes abertos polo proxecto: “A Rede de Escolas na Nube é un claro exemplo dun-ha colaboración de éxito entre institucións públicas e privadas galegas”, unha inicia-tiva que, neste caso concreto, é quen de “repercutir nun beneficio directo para a so-ciedade, así como nunha aposta de futuro para a creación de produtos innovadores made in Galicia”.

Poboación dispersa

Entre os porqués da posta en marcha da Rede de Escolas na Nube atópase a nece-sidade dar resposta ás demandas de cali-dade educativa que esixe unha poboación tan espallada e dispersa coma a nosa. De feito, malia a importancia crecente das cidades e vilas grandes, é certo que o ru-ral aínda pesa moito e que neste ámbito viven moitas nenas e nenos que precisan ter as mesmas oportunidades formativas e tecnolóxicas cós demais. Esta foi a base orixinaria da iniciativa: loitar contra as eivas comunicativas, tecnolóxicas ou de ensino que puideran frear o desenvolvemento da ensinanza nestas áreas e engadir aínda máis distancia na chamada fenda dixital ur-bano-rural. As “armas” empregadas nestas loita foron, entre outras, a computación na nube e as tecnoloxías avanzadas de comu-nicación (por exemplo a videoconferencia), todo concibido dunha maneira aberta e sen cancelas (open source), prontas para ser adoptadas e aproveitadas noutras contor-nas semellantes.

A Rede de Escolas na Nube senta os alicerces para estenderse a todo o noso ámbito non urbano

A dita nova (o espallamento da iniciativa) deuse a coñecer nunha xuntanza entre a Consellería de Educación e AMTEGA, por unha banda, e os equipos directivos de todos os Centros Rurais Agrupados (CRAs) de Galicia. Na presentación da Rede de Escolas na Nube ofrecéuse-lles a posibilidade de incorporarse ao proxecto.

Como recordaremos, catro deles (o CRA Boqueixón - Vedra Neira Vilas, o CRA de Vilaboa Consuelo González Martínez, o CRA Amencer de Ribadavia, e o CRA Nosa Señora do Faro de Ponteceso) es-tán a participar desde 2012 como cen-tros piloto ao abeiro da iniciativa.

O proxecto de innovación educativa Rede de Escolas na Nube xurdiu como colaboración entre o CESGA, quen coor-dinou a iniciativa, a empresa galega Balidea Consulting & Programming, a Consellería de Educación e a Axencia de Modernización Tecnolóxica de Galicia da Xunta de Galicia (AMTEGA).

Tomás Fernández Pena

Entre o 6 e o 19 de novembro celebrouse en diferentes puntos do ámbito esta-tal e galego a Semana da Ciencia, edición 22. Houbo actividades de divulga-ción, visitas guiadas, obradoiros e conferencias en centros de investigación e universidades, co obxectivo de achegar a actividade científica á sociedade e concienciar da importancia da investigación e a innovación. Participaron neste programa de accións, moi envorcadas cos escolares, cinco centros da Rede Española de Supercomputación, entre os que se conta o CESGA, o Centro de Supercomputación de Castela e León, o CSUC de Barcelona, o Computaex de Estremadura e o IFCA de Cantabria. Polo que se refire ao CESGA, abriu as súas portas á cidadanía entre os días 13 e 17 de novembro en diferentes ho-rarios. Os participantes puideron visitar as instalacións do centro e coñecer o supercomputador Finisterrae II, os servidores de almacenamento de datos, os servidores que soportan a nube para cómputo científico e un dous principais nodos da Rede de Ciencia e Tecnoloxía de Galicia.

O Instituto NVIDIA de Deep Lear-ning (www.nvidia.co.uk/dli) está a poñer ao alcance dos desenvolve-dores, científicos da información e investigadores en xeral adestramen-to avanzado en aprendizaxe profun-da, o que se coñece, precisamente como Deep Learning. O obxectivo: que teñan a capacidade de solucio-nar todo tipo de problemas e retos vencellados coa análise e a inter-pretación avanzada da información. Froito deste compromiso foi a cita organizada o 20 de outubro no Cen-tro de Supercomputación de Gali-cia, de mans do devandito Instituto e da compañía Hewlett Packard. Resultou ser, en termos concretos, unha xornada de traballo con forma-to de obradoiro sobre Deep Lear-ning práctico. Na cita os asistentes recibiron formación en adestramen-to básico en DL empregando redes neuronais e en cuestións como a ex-perimentación cos datos, a prepa-ración de parámetros, as estruturas de redes e outras estratexias para incrementar rendemento e capaci-dade. Asemade, convidouse aos presentes a despregar as súas pro-pias redes para comezar a solucio-nar problemas reais da actualidade mundial. Como lembraremos, o concepto Deep Learning abrangue un conxunto de algoritmos de clase aprendizaxe automática (Machine Learning) que se dirixe a modelar abstraccións de alto nivel en da-tos usando arquitecturas compos-tas de transformacións non lineais múltiples.

O CESGA organizou os días pasados (21, 22, 23 e 24 de novembro) un curso sobre Big Data especialmente indica-do para investigadores e profesionais das uni-versidades, centros de investigación e PEME que queiran extraer o máximo partido aos seus grandes volumes de da-

tos. Con esta actividade, o CESGA quixo cumprir dous obxectivos: por unha banda dar resposta ás demandas formativas crecentes en materia de ana-lítica de grandes volumes de coñecemento (tecnoloxías fundamentais para o desenvolvemento de proxectos de I+D+i, tanto en universidades como en centros de investigación como en empresas), e pola outra, dar a coñe-cer as posibilidades da plataforma de Big Data do CESGA, que permite explorar eses grandes volumes de datos ou facer probas de concepto. No curso exploráronse as capacidades de análises estatísticas e de Machine

Learning da dita plataforma en particular e, en xeral, da plataforma Spark. Foi impartido polos profesores e investigadores Tomás Fernández Pena e David E. Losada.

Portas abertas na Semana da Ciencia

Todo o que quixemos saber sobre o Deep Learning

Curso Big Data (ou información inxente)

No

vas d

o C

ES

GA

15decembro 2017 díxitos

Centro de Supercomputación de Galicia CESGA

Acelere la investigación y desarrollo con HPC en su escritorio

Más potencia HPC, menos problemas

Intel Inside®. Para un mundo de nuevas posibilidades.

Usted es la clave para solucionar complejos problemas técnicos y científicos. Si trabaja con ingenieros o científicos, necesita proporcionarles potencia de computación para tomar las decisiones correctas. Ahora le resultará todavía más fácil darles lo que necesitan.

Ultrabook, Celeron, Celeron Inside, Core Inside, Intel, el logotipo de Intel, Intel Atom, Intel Atom Inside, Intel Core, Intel Inside, el logotipo de Intel Inside, Intel vPro, Itanium, Itanium Inside, Pentium, Pentium Inside, vPro Inside, Xeon, Xeon Phi y Xeon Inside son marcas registradas de Intel Corporation en Estados Unidos y/o en otros países.

Visite: bcis.es.fujitsu.com/HPC

Descubra cómo el Sistema Integrado FUJITSU PRIMEFLEX para HPC puede ayudarle:

■SimplifiqueHPC,aumentelaproductividadyestimuleelrendimiento■Despliegueclústeresrápidamenteynavegueconfacilidadporlastareasdiarias■ Flujos de trabajo automáticos para aplicaciones comunes

Equipadoconprocesador Intel® Xeon®.