Big Data en la nube: Tecnologías convergentes...Por qué debería leer este documento Este...

16
Por qué debería leer este documento Este documento describe cómo las tecnologías de Big Data y de nube están convergiendo para ofrecer un modelo de provisión económico para el análisis de Big Data basado en la nube. También incluye: Cómo la computación en la nube es un habilitador de análisis avanzado con Big Data Cómo TI puede asumir el liderazgo para el análisis de Big Data basado en la nube en la empresa convirtiéndose en un intermediario de los servicios de nube Modelos de análisis como servicio (Analytics-as-a-service, AaaS) para el análisis de Big Data basado en la nube Próximos pasos prácticos para que pueda comenzar su análisis de Big Data basado en la nube Informe de solución Big Data en la nube: Tecnologías convergentes Cómo crear una ventaja competitiva usando el análisis de Big Data basado en la nube FEBRERO 2013

Transcript of Big Data en la nube: Tecnologías convergentes...Por qué debería leer este documento Este...

Page 1: Big Data en la nube: Tecnologías convergentes...Por qué debería leer este documento Este documento describe cómo las tecnologías de Big Data y de nube están convergiendo para

Por qué debería leer este documento

Este documento describe cómo las tecnologías de Big Data y de nube están convergiendo para ofrecer un modelo de provisión económico para el análisis de Big Data basado en la nube. También incluye:

• Cómo la computación en la nube es un habilitador de análisis avanzado con Big Data

• Cómo TI puede asumir el liderazgo para el análisis de Big Data basado en la nube en la empresa convirtiéndose en un intermediario de los servicios de nube

• Modelos de análisis como servicio (Analytics-as-a-service, AaaS) para el análisis de Big Data basado en la nube

• Próximos pasos prácticos para que pueda comenzar su análisis de Big Data basado en la nube

Informe de solución

Big Data en la nube: Tecnologías convergentesCómo crear una ventaja competitiva usando el análisis de Big Data basado en la nube

FEBRERO 2013

Page 2: Big Data en la nube: Tecnologías convergentes...Por qué debería leer este documento Este documento describe cómo las tecnologías de Big Data y de nube están convergiendo para

FEBRERO 2013

Informe de solución

Big Data en la nube: Tecnologías convergentes Cómo crear una ventaja competitiva usando el análisis de Big Data basado en la nube

Page 3: Big Data en la nube: Tecnologías convergentes...Por qué debería leer este documento Este documento describe cómo las tecnologías de Big Data y de nube están convergiendo para

Contents

2 Intel IT Center Informe de solución | Big Data en la nube

3 La nube como habilitadora del análisis de Big Data

6 La nube y Big Data: Una combinación contundente

10 TI como un intermediario de los servicios de nube

13 Próximos pasos para TI

Contenido

Page 4: Big Data en la nube: Tecnologías convergentes...Por qué debería leer este documento Este documento describe cómo las tecnologías de Big Data y de nube están convergiendo para

3 Intel IT Center Solution Brief | Big Data in the Cloud

¿Qué es el análisis de Big Data?

Big Data se refiere a grandes conjuntos de datos que tienen órdenes de magnitud más grandes (volumen); son más diversos, incluyendo datos estructurados, semiestructurados y no estructurados (variedad); y que llegan más rápido (velocidad) que lo que usted o su organización ha tenido que procesar antes. Este flujo de datos está generado por dispositivos conectados, desde PCs y teléfonos inteligentes a sensores como lectores RFID y cámaras de tránsito. Además, es heterogéneo y viene en formatos, incluyendo textos, documentos, imágenes, videos y más.

El valor real de Big Data está en la información que produce cuando se la analiza: descubrir patrones, derivar significado e indicadores para decisiones y, en última instancia, la capacidad de responder al mundo con mayor inteligencia. El análisis de Big Data comprende un conjunto de tecnologías avanzadas diseñadas para trabajar con grandes volúmenes de datos heterogéneos. Usa métodos cuantitativos sofisticados como aprendizaje automatizado, redes neuronales, robótica, matemáticas computacional e inteligencia artificial para explorar los datos y descubrir interrelaciones y patrones.

Dos iniciativas de TI son en la actualidad prioridades para las organizaciones alrededor del mundo: análisis de Big Data y computación en la nube. El análisis de Big Data promete proporcionar información valiosa que puede crear ventajas competitivas, incentivar innovaciones y generar mayores ingresos. Como modelo de provisión de servicios de TI, la computación en la nube tiene el potencial de aumentar la agilidad y la productividad empresarial al mismo tiempo que permite lograr mayores eficiencias y menores costos.

Ambas tecnologías continúan evolucionando. Las organizaciones se están movilizando más allá de las preguntas sobre qué y cómo almacenar Big Data para abordar la manera de derivar análisis significativo que responda a las necesidades empresariales reales. A medida que continúa madurando la computación en la nube, un número creciente de empresas están construyendo ambientes de nube ágiles y eficientes y los proveedores de nube continúan expandiendo las ofertas de servicio.

Tiene sentido, entonces, que las organizaciones de TI miren a la computación en la nube como la estructura para respaldar sus proyectos de Big Data. Los ambientes de Big Data requieren clusters de servidores para soportar las herramientas que procesan los grandes volúmenes, la alta velocidad y los formatos variados de Big Data. Las nubes ya están implementadas en clústeres de servidores y recursos de almacenamiento y de redes; su tamaño puede aumentarse o reducirse como fuera necesario. La computación en la nube ofrece una forma económica de soportar las tecnologías de Big Data y las aplicaciones analíticas avanzadas que pueden impulsar el valor empresarial.

Este documento describirá:

• Cómo la computación en la nube es un habilitador de análisis avanzado con Big Data

• Cómo TI puede asumir el liderazgo para el análisis de Big Data basado en la nube en la empresa convirtiéndose en un intermediario de los servicios de nube

• Modelos de análisis como servicio para el análisis de Big Data basado en la nube

• Próximos pasos prácticos para que pueda comenzar su análisis de Big Data basado en la nube

Tendencias de Big Data ¿Qué hace que la computación en la nube sea un modelo de provisión tan económico para el análisis de Big Data? ¿Cómo están convergiendo las tecnologías de Big Data y de nube para convertir al análisis de Big Data en la nube en una opción razonable? Para el análisis de Big Data:

Los datos se vuelven más valiosos. Hoy la conversación se está desplazando de “¿Qué datos debemos almacenar?” a “¿Qué podemos hacer con los datos?” Las empresas están tratando de liberar el potencial oculto de los datos y lograr una ventaja competitiva. Gartner predice que los datos empresariales crecerán un 800 por ciento desde 2011 hasta 2015; un 80 por ciento de esos datos serán no estructurados (por ejemplo: mensajes de correo electrónico, documentos, videos, imágenes y contenido de redes sociales), y un 20 por ciento de esos datos serán estructurados (por ejemplo: transacciones de tarjetas de crédito e información de contacto).1

Con el potencial de que tantos datos revelen información que puede aumentar la competitividad, las compañías deben encontrar nuevas formas de abordar el procesamiento y de analizar sus datos, ya sea datos estructurados que se encuentran típicamente en sistemas de administración de bases de datos relacionales (RDBMS, por su sigla en inglés) o formatos más variados, no estructurados. Además, combinar fuentes y tipos de datos diversos tiene el potencial de descubrir algunos de los patrones y relaciones más interesantes aún no explorados.

La nube como habilitadora del análisis de Big Data

Intel IT Center Informe de solución | Big Data en la nube

Page 5: Big Data en la nube: Tecnologías convergentes...Por qué debería leer este documento Este documento describe cómo las tecnologías de Big Data y de nube están convergiendo para

4 Intel IT Center Solution Brief | Big Data in the Cloud

El análisis de datos está pasando del lote al tiempo real. La encuesta de 2012 de Intel de 200 administradores de TI en grandes empresas descubrió que mientras que hay una división pareja entre la cantidad de procesamiento en bache y el procesamiento en tiempo real, la tendencia se inclina hacia aumentar el tiempo real a dos tercios de la administración total de datos para 2015.2 Al mismo tiempo, la tecnología para procesar la información en tiempo real o en tiempo casi real está dejando atrás el entusiasmo desmedido e ingresando a etapas tempranas de madurez.

El tiempo real es compatible con el análisis predictivo. El análisis predictivo permite a las organizaciones adoptar una postura visionaria respecto de lo que vendrá y ofrecer a las organizaciones algunas de las oportunidades más valiosas para sacarle provecho a Big Data. Los datos en tiempo real brindan la perspectiva de análisis predictivo rápido, preciso y flexible que se adapta rápidamente a las cambiantes condiciones empresariales. Cuanto más rápido analice sus datos, más oportunos serán los resultados y mayor el valor predictivo.

El alcance del análisis de Big Data continúa expandiéndose. El interés en Big Data al principio se concentró principalmente en las fuentes de datos empresariales y sociales, como mensajes de correo electrónico, videos, tweets, publicaciones de Facebook*, revisiones y comportamiento Web. El alcance del interés en el análisis de Big Data está creciendo para incluir datos de sistemas inteligentes, como infoentretenimiento en los vehículos, medidores inteligentes y muchos otros, sensores de dispositivos en la frontera de las redes -algunos de los volúmenes más grandes, las reproducciones más rápidas y la mayor complejidad de Big Data. La conectividad ubicua, el crecimiento de sensores y sistemas inteligentes han abierto todo un nuevo lugar de almacenamiento de información valiosa. El interés

Big Data en contexto: ejemplo de una ciudad inteligente

Además de los datos

transaccionales, sociales

y de ubicación generados

por personas, los sensores

de dispositivos generan

en tiempo real algunos

de los Big Data de más

rápido crecimiento. El

procesamiento y el análisis

pueden aplicarse a estas

fuentes de datos valiosas

mediante infraestructura de TI

aprovisionada integrada, de

nube, o dedicada y soluciones

de almacenamiento y

de computación de alto

desempeño.

Intel IT Center Informe de solución | Big Data en la nube

Ciudad inteligente• Sensores de edificio inteligente• Sensores de red inteligente• Sensores meteorológicos• Sensores de contaminación

Caminos Inteligentes• Sensores en smartphones• Sensores en vehículos• Cámaras de tránsito• Sensores inductivos

Fábrica Inteligente• Sensores de automatización industrial• Medidores inteligentes

Hospital Inteligente• Sensores en ambulancia• Servicios de imágenes médicas portátiles

Page 6: Big Data en la nube: Tecnologías convergentes...Por qué debería leer este documento Este documento describe cómo las tecnologías de Big Data y de nube están convergiendo para

5 Intel IT Center Solution Brief | Big Data in the Cloud

en aplicar el análisis de Big Data a los datos desde sensores y sistemas inteligentes continúa aumentando, mientras las empresas procuran obtener información más rápida, más enriquecida y económica que en el pasado, mejorar la toma de decisiones automatizada y personalizar las experiencias del cliente.

Las tecnologías de nube maduranLa computación en la nube se está convirtiendo en una realidad para muchas empresas, con las implementaciones de nube privada a menudo liderando el camino. La tecnología de nube está madurando y resolviendo las barreras de adopción con mejoras en la seguridad y la integración de datos, mientras que las organizaciones de TI están evolucionando para dar soporte a la provisión de servicios en la nube. En consecuencia, las empresas están mostrando una creciente confianza en los modelos de provisión de servicios en la nube. Por ejemplo, una encuesta de Intel recientemente publicada de 200 administradores de TI descubrió que casi dos tercios de las empresas están mirando a la nube como un modelo de provisión de servicios para sistemas de misión crítica en los próximos cinco años.3

Las organizaciones continúan almacenando más y más datos en los ambientes de nube, que representan una fuente inmensa y valiosa de información para analizar. Además, las nubes ofrecen a los usuarios empresariales recursos escalables por demanda. Combinar los servidores basados en el procesador Intel® Xeon* y el almacenamiento, las unidades de disco Intel SSD y los recursos de red Intel 10 GbE usados en los ambientes de nube con herramientas de procesamiento de Big Data como el marco Apache Hadoop* proporciona la potencia de computación necesaria para analizar vastas cantidades de datos eficiente y económicamente. La ejecución de Hadoop* en ambientes virtualizados continúa.

Intel IT Center Informe de solución | Big Data en la nube

Page 7: Big Data en la nube: Tecnologías convergentes...Por qué debería leer este documento Este documento describe cómo las tecnologías de Big Data y de nube están convergiendo para

6 Intel IT Center Solution Brief | Big Data in the Cloud

Una encuesta reciente realizada por GigaSpaces reveló que el 80 por ciento de los ejecutivos de TI que piensan que el procesamiento de Big Data es importante están considerando mover su análisis de Big Data a uno o más modelos de provisión de servicios en la nube.4

Los modelos de provisión de servicios en la nube ofrecen flexibilidad excepcional, permitiendo a TI evaluar el mejor enfoque ante el pedido de cada usuario empresarial. Por ejemplo, las organizaciones que ya soportan un ambiente de nube privada interna pueden agregar análisis de Big Data a sus ofertas internas, usar un proveedor de servicios en la nube o construir una nube híbrida que proteja ciertos datos sensibles en una nube privada y, sin embargo, aprovechar las fuentes de datos y aplicaciones externas valiosas proporcionadas en nubes públicas.

Usar la infraestructura de nube para analizar Big Data tiene sentido porque:

Las inversiones en el análisis de Big Data pueden ser significativas e impulsar la necesidad de una infraestructura eficiente y económica. Los recursos para soportar modelos de computación distribuida internos, típicamente residen en centros de datos grandes y medianos. Las nubes privadas pueden ofrecer un modelo más eficiente y económico para implementar análisis de Big Data internamente y aumentar al mismo tiempo los recursos internos con servicios de nube pública. Esta opción de nube híbrida permite a las compañías utilizar espacio de almacenamiento y potencia de computación por demanda mediante servicios en la nube pública para ciertas iniciativas analíticas (por ejemplo,

proyectos de corto plazo) y brindar capacidad adicional y escalar cuando fuera necesario.

Big Data puede combinar fuentes internas y externas. Mientras que las empresas suelen mantener sus datos más sensibles internamente, se pueden colocar afuera grandes volúmenes de Big Data (de propiedad de la organización o generados por terceros o proveedores públicos), algunos de ellos ya en un ambiente de nube. Colocar fuentes de datos relevantes detrás de su firewall puede involucrar un compromiso significativo de recursos. Analizar los datos donde éstos residen —ya sea en centros de datos internos o en una nube pública, o en sistemas y dispositivos de clientes en su

frontera— suele tener más sentido.

Los servicios de datos se necesitan para extraer valor de Big Data. Dependiendo de los requerimientos y el escenario de uso, el mejor uso de su presupuesto de TI puede ser concentrarse en el análisis como servicio (AaaS)—soportado por su nube privada interna, una nube pública o un modelo híbrido.

Liberando el potencial de Big Data en la nubeLos modelos de computación en la nube pueden ayudar a acelerar el potencial de soluciones analíticas escalables. Las nubes ofrecen flexibilidad y eficiencias para acceder a los datos, brindar información y extraer valor. Sin embargo, el análisis de Big Data basado en la nube no es una solución única aplicable a todos.

Las organizaciones que usan infraestructura de nube para proveer AaaS tienen múltiples opciones. Al sopesar los factores de carga de trabajo, costo, seguridad e interoperabilidad de datos, TI puede elegir utilizar su nube privada para mitigar el riesgo y mantener el control; usar la infraestructura, plataforma o servicios analíticos de nube pública para aumentar aun más la escalabilidad; o implementar un modelo híbrido que combine los recursos y servicios de nube privada y pública.

El balance final: No importa qué modelo de provisión de servicios en la nube tenga más sentido, las empresas con diferentes necesidades y presupuestos pueden liberar el potencial de Big Data en los ambientes de nube.

La nube y Big Data: Una combinación contundente

Intel IT Center Informe de solución | Big Data en la nube

Page 8: Big Data en la nube: Tecnologías convergentes...Por qué debería leer este documento Este documento describe cómo las tecnologías de Big Data y de nube están convergiendo para

7 Intel IT Center Solution Brief | Big Data in the Cloud

Ejemplos de infraestructura como servicio (Infrastructure-as-a-Service, IaaS)

A continuación encontrará algunos ejemplos de soluciones de IaaS de proveedores en el ecosistema de tecnología de nube.• Amazon* Web Services• Citrix* CloudPlatform• Windows Azure* y

Microsoft* System Center• Software OpenStack* • Rackspace* • Savvis* • Verizon* Terremark*

El análisis como un marco de información de servicios Usted podrá responder a las necesidades de los usuarios a lo largo de un rango completo de requerimientos de análisis con AaaS basado en la nube, desde provisión y administración de datos a uso de datos. Al desarrollar una estrategia integral de Big Data basada en la nube, usted puede definir un marco de información y optimizar el valor total de los datos empresariales.

Un marco de información AaaS incluye las siguientes capacidades clave:

• Capturar y extraer los datos estructurados y no estructurados de fuentes confiables, incluyendo la priorización de los datos más críticos y la identificación de qué se debe retener y durante cuánto tiempo

• Administrar y controlar los datos bajo guías de política y gobernanza integrales en una empresa global y en cumplimiento con los requerimientos específicos de la industria

• Realizar integración, análisis, transformación y visualización de datos para brindar la información correcta en el lugar correcto y en el momento justo

Tipos de servicios en la nube para AaaS

AaaS puede implementarse en la nube basado en diferentes tipos de servicios de nube. Para determinar la combinación correcta de servicios se deberá considerar las necesidades del usuario y los recursos internos—como el ambiente de nube privada—que ya están implementados.

Los tipos de servicios en la nube para análisis como servicio incluyen infraestructura como servicio (IaaS), plataforma como servicio (PaaS) y software como servicio (SaaS).

Infraestructura como servicio (IaaS)

Implementada en las instalaciones o mediante un proveedor de nube, IaaS le permite asignar o adquirir tiempo en recursos de servidores compartidos, que suelen estar virtualizados, para hacer frente a las necesidades de computación y de almacenamiento para el análisis de Big Data. Los sistemas operativos en la nube administran servidores de alto desempeño y recursos de red y almacenamiento.

IaaS brinda la base para muchos servicios de nube de compañías. Sin embargo, IaaS también requiere mayor inversión de recursos de TI en el contexto de implementar el análisis de Big Data. Su organización será responsable de instalar su propio software, como el marco Hadoop o una base de datos NoSQL, como las tecnologías Apache Cassandra*, MongoDB* o Couchbase*. Su equipo también será responsable de administrar los recursos asignados, que pueden facilitarse con herramientas automatizadas de administración y orquestación de recursos.

Intel IT Center Informe de solución | Big Data en la nube

Page 9: Big Data en la nube: Tecnologías convergentes...Por qué debería leer este documento Este documento describe cómo las tecnologías de Big Data y de nube están convergiendo para

8 Intel IT Center Solution Brief | Big Data in the Cloud

Las tecnologías de infraestructura Intel para nube

y el análisis de Big Data Los servidores basados en las familias del procesador Intel® Xeon® E5 y E7 se encuentran en el corazón de la infraestructura que soporta tanto los ambientes de nube como los de Big Data proporcionando computación líder de la industria, altamente eficiente y de alto desempeño. Además:

• Los servidores de almacenamiento basados en la familia del procesador Intel Xeon E5 soportan capacidades avanzadas de almacenamiento como compresión, encripción, colocación automatizada de datos en niveles, de duplicación de datos, codificación de borrado y aprovisionamiento delgado y son ideales para almacenar y procesar grandes volúmenes de datos. Estas tareas de almacenamiento intensivas en computación brindan mejor seguridad, mayores eficiencias y mejor costo total de propiedad con una huella de almacenamiento reducida.

• Las unidades de estado sólido Intel® (Intel® Solid-State Drives, SSD) son discos de alto rendimiento y alta durabilidad para almacenamiento sin procesar.

• Los adaptadores de red convergente Intel Ethernet 10 Gigabit proporcionan conexiones de alto rendimiento para grandes conjuntos de datos.

Intel también brinda capacidades de seguridad mejoradas por hardware, incluyendo Intel Advanced Encryption Standard New Instructions (Intel AES-NI)5, que acelera la encripción y desencripción de datos hasta 10 veces.6,7 Además, Intel Trusted Execution Technology (Intel TXT)8 puede brindar una base de confianza de hardware para asegurar que los datos se procesen en -o se migren a- grupos de servidores

Platforma como servicio (PaaS)PaaS proporciona a los desarrolladores herramientas y bibliotecas para construir, probar, implementar y ejecutar aplicaciones en una infraestructura de nube. PaaS reduce la carga de trabajo de administración eliminando la necesidad de configurar y escalar los elementos de su implementación de Hadoop y sirve como una plataforma de desarrollo para aplicaciones de análisis avanzado.

Software como servicio (SaaS) Las aplicaciones específicas para el análisis de Big Data basado en la nube pueden aprovisionarse con SaaS. Usted puede utilizar múltiples aplicaciones SaaS para cubrir el espectro de escenarios que requieren los usuarios empresariales. Por ejemplo, el software que funciona bien para el análisis de situación puede no funcionar para la gestión de riesgo o desempeño de activos. SaaS puede ofrecerse como una aplicación independiente o como parte de una solución más grande de proveedor de nube. Por ejemplo, Karmasphere ofrece una aplicación con que se paga a medida que se usa que analiza los datos almacenados con Amazon* S3 usando Amazon Elastic MapReduce.

Ejemplos de software como servicio (Software-as-a-Service, SaaS)

A continuación encontrará algunos ejemplos de soluciones de SaaS de proveedores en el ecosistema de tecnología de nube.•Amazon* Elastic MapReduce•Cetas* de soluciones analíticas de VMWare* •Servicios Google* BigQuery•Servicio Rackspace* Hadoop

Ejemplos de plataformas como servicio (Platform-as-a-Service, PaaS)

A continuación encontrará algunos ejemplos de soluciones de PaaS de proveedores en el ecosistema de tecnología de nube.• Force.com • Google* App Engine • Red Hat* OpenShift* • Cloud Foundry de VMware • Windows Azure*

Intel IT Center Informe de solución | Big Data en la nube

Page 10: Big Data en la nube: Tecnologías convergentes...Por qué debería leer este documento Este documento describe cómo las tecnologías de Big Data y de nube están convergiendo para

9 Intel IT Center Solution Brief | Big Data in the Cloud

Intel y el marco Apache Hadoop*

El marco Apache Hadoop* es un software de código abierto que se ha constituido como la plataforma de hecho para administrar Big Data a escala. El software Hadoop* puede procesar grandes conjuntos de datos a lo largo de clusters de computadores usando modelos simples de programación.

Intel® Distribution para el software Apache Hadoop* (Intel Distribution) incluye Apache Hadoop y otros componentes de software optimizados por Intel con capacidades de seguridad y desempeño mejoradas por hardware. Diseñada para permitir un amplio espectro de análisis de datos en Apache Hadoop, Intel Distribution está optimizada para consultas de Apache Hive*, proporciona conectores para procesamiento estadístico R* y facilita el análisis de gráficos usando Intel Graph Builder para software Apache Hadoop, una biblioteca para plasmar grandes conjuntos de datos en gráficos con el fin de ayudar a visualizar relaciones entre datos. Incluido en Intel Distribution, Intel Manager para Apache Hadoop proporciona una consola de administración que simplifica la implementación, la configuración y el monitoreo de una implementación Hadoop.

Intel Distribution está disponible en todo el mundo para evaluación. El soporte técnico se brinda actualmente en los Estados Unidos, China y Singapur y se espera que otros países se agreguen más adelante durante este año.

Conozca más sobre Intel Distribution para software Apache Hadoop.

Intel IT Center Informe de solución | Big Data en la nube

Page 11: Big Data en la nube: Tecnologías convergentes...Por qué debería leer este documento Este documento describe cómo las tecnologías de Big Data y de nube están convergiendo para

10 Intel IT Center Solution Brief | Big Data in the Cloud

TI como intermediario de los servicios de nube

La computación en la nube y los muchos servicios de nube pública disponibles para empresas permitieron que dos de los usuarios más intensivos de análisis—propietarios de líneas de negocios y el Director de Comercialización—pudieran adquirir servicios directamente, sin tener que pasar por TI. Sin embargo, los usuarios empresariales no informados pueden verse tentados a comprar “análisis instantáneo”, pero los métodos ad hoc de adopción de servicios de nube pública en su organización pueden causar problemas significativos, como elegir al proveedor incorrecto, perder el control de sus datos sensibles y obtener un pobre retorno sobre la inversión, para mencionar unos pocos. TI ofrece servicios, perspectivas y habilidades específicas que pueden reducir el riesgo de usar nubes públicas y utilizar mejor los recursos de nube privada existentes.

Big Data también exige un conjunto nuevo de habilidades en la empresa; muchas de las cuales residen en TI. Los departamentos de TI ofrecen el conocimiento tecnológico para ayudar a hacer que la computación en la nube y Big Data funcionen en su organización, incluyendo a los administradores de Hadoop y los desarrolladores y especialistas en componentes de Hadoop como la base de datos Apache HBase*. Los proyectos de análisis de Big Data involucran equipos multidisciplinarios y los miembros de TI deben colaborar activamente con los científicos de datos, otro rol que surge relacionado con Big Data. Los científicos de datos son personas que aplican Big Data a problemas empresariales complejos e interpretan los resultados. Si bien pueden estar directamente en la línea de negocios, también pueden ser parte de la organización de TI.

Intel IT Center Informe de solución | Big Data en la nube

Page 12: Big Data en la nube: Tecnologías convergentes...Por qué debería leer este documento Este documento describe cómo las tecnologías de Big Data y de nube están convergiendo para

11 Intel IT Center Solution Brief | Big Data in the Cloud

Como el intermediario de servicios de nube, TI puede trabajar con los usuarios empresariales para obtener la mejor solución de análisis basada en la nube asegurando que se consideren las siguientes áreas importantes.

Area Preguntas

Administración de datos institucionales

¿Qué proveedores de nube se están evaluando? El potencial de datos a almacenar, administrar y analizar por múltiples proveedores sin supervisión es un gran riesgo?

Propiedad de los datos ¿Quién es el propietario de los datos que su proveedor almacena y administra? ¿Su compañía retiene la propiedad?

Seguridad ¿Qué nivel de seguridad se brinda y a qué niveles de la pirámide de la solución? Los proveedores con seguridad incorporada profundamente en la infraestructura y la plataforma, así como también a nivel de la aplicación pueden brindar mayor seguridad.

Cumplimiento con los requerimientos

¿Se abordan los problemas de cumplimiento de requerimientos en general, así como también en relación con su industria en particular? ¿Cómo se armonizan los datos para proteger la privacidad?

Integración de datos ¿Cómo se integran los datos y a qué costo?

Migración de datos ¿Cuántos datos es necesario movilizar, y a qué costo? Movilizar grandes volúmenes de datos desde y hacia la nube puede ser prohibitivo en términos de costos.

Reproducción de datos ¿La fuente de datos está reproduciendo información en tiempo real? Para administrar los datos en tiempo real se requieren enormes recursos; y los datos que se reproducen continuamente pueden manejarse mejor internamente.

Evaluación de la tecnología ¿Qué soluciones de almacenamiento, procesamiento y análisis de Big Data se proporcionan? ¿Cómo se optimizan los componentes para desempeño?

Requerimientos de habilidades ¿Qué habilidades se necesitan para identificar fuentes apropiadas de datos, aplicar los modelos estadísticos y de análisis correctos e interpretar los resultados? ¿El proveedor de servicios incluye acceso a la tecnología y soporte analítico? ¿A qué nivel? ¿Cómo eso complementa las habilidades internas?

ROI (retorno sobre la inversión) ¿Cuál es el retorno sobre la inversión para la tecnología, el modelo de provisión de servicios, la seguridad y los métodos de integración de datos?

Intel IT Center Informe de solución | Big Data en la nube

Page 13: Big Data en la nube: Tecnologías convergentes...Por qué debería leer este documento Este documento describe cómo las tecnologías de Big Data y de nube están convergiendo para

12 Intel IT Center Solution Brief | Big Data in the Cloud

TI juega para ganar con el análisis de Big DataEn un número creciente de compañías, los usuarios empresariales ya consumen TI como servicio. TI puede continuar extendiendo su rol de intermediario de los servicios de análisis de Big Data basado en la nube. Como un intermediario de los servicios en la nube, su rol es considerar las necesidades de los usuarios frente a las opciones de provisión de servicios disponibles para su organización. Esto significa desarrollar una estrategia para servicios privados, públicos e híbridos; infundir disciplina en la selección de proveedores de servicios de nube; negociar y establecer contratos con potenciales proveedores de servicios de nube, entre otras tareas similares. Desde el punto de vista organizativo, esto puede reducir el riesgo y utilizar mejor las inversiones existentes en tecnologías de nube privada. Los usuarios individuales se benefician porque obtienen la solución correcta para satisfacer sus necesidades.

TI puede demostrar rápidamente el valor para la empresa asociándose con los usuarios para:

• Seleccionar la implementación de la nube privada o pública correcta por sus necesidades definiendo los requerimientos tecnológicos, evaluando los riesgos y especificando los requerimientos de implementación basados en políticas de gobierno corporativo y cumplimiento de requerimientos regulatorios. Por ejemplo, ciertas cargas de trabajo pueden ser administradas en una nube privada en una ubicación específica.

• Construir o trabajar efectivamente con un socio de tecnología para desarrollar los servicios requeridos.

• Evaluar y verificar en los servicios externos el diseño, la provisión, la personalización, los precios, la privacidad, la integración, la seguridad y el soporte.

• Aprovisionar servicios desde fuentes internas y externas de modo que no presenten inconvenientes a los usuarios.

• Desarrollar relaciones con los proveedores de servicios de nube verificados.

• Administrar los servicios existentes, incluyendo los acuerdos de nivel de servicio (service level agreements, SLAs) y ciclo de vida de servicios.

Como un intermediario de servicios, TI colabora con la empresa de la mejor manera para usar la tecnología para una ventaja competitiva. Con el análisis de Big Data basado en la nube, el objetivo debe ser proporcionar la solución correcta para las necesidades de los usuarios equilibradas respecto de las políticas de gobierno corporativo, recursos existentes de TI, requerimientos de desempeño y objetivos generales empresariales. En la mayoría de los departamentos de TI hoy en día, proporcionar el enfoque consultor al servicio requerirá que TI se reorganice para eliminar silos, contratar o desarrollar nuevas habilidades en los miembros del equipo y alentar una fuerte asociación con la empresa.

El beneficio será significativo, especialmente para los proyectos de análisis de Big Data, que requieren colaboración entre expertos de tecnología de TI, científicos de datos y otros que puedan ayudar a desarrollar el plan de análisis y algoritmos apropiados para extraer información significativa de los datos.

Intel IT Center Informe de solución | Big Data en la nube

Page 14: Big Data en la nube: Tecnologías convergentes...Por qué debería leer este documento Este documento describe cómo las tecnologías de Big Data y de nube están convergiendo para

13 Intel IT Center Solution Brief | Big Data in the Cloud

TI está en una posición única en la organización. A pesar de—o quizás debido a—el crecimiento explosivo de los datos, las tecnologías emergentes y el cambio veloz, usted puede brindar el liderazgo que tanto necesita su organización para análisis de Big Data. En primer lugar, considere cómo TI puede evolucionar como intermediario de los servicios basados en la nube de análisis de Big Data para su empresa. Usted también puede:

• Asociarse con los propietarios del negocio ahora para ayudar a determinar cómo Big Data puede utilizarse para solucionar los problemas empresariales de su organización y alinearse respecto de las oportunidades. Como un socio completamente comprometido, usted puede ayudar a evaluar e influir en la selección de tecnología y establecer mejores prácticas.

• Explorar las opciones de tecnología para el análisis de Big Data basado en la nube, incluyendo modelos de provisión privados, públicos e híbridos. Manténgase actualizado con las tendencias, observe al mercado, y comprenda los costos.

• Crear o actualizar la estrategia existente de Big Data que define el proceso para involucrar a TI en proyectos de análisis de Big Data. Tenga en cuenta que usted facilitará y agilizará el proceso para que los usuarios puedan avanzar, o para que las unidades de negocios se hagan cargo de las cuestiones.

• Considerar cómo organizar a TI para involucrar más a los usuarios empresariales y colaborar y brindar asesoramiento en proyectos de Big Data.

Para conocer más sobre Big Data y la computación en la nube, aproveche los recursos disponibles en Intel IT Center. Visite: intel.com/bigdata e intel.com/cloudcomputing

Próximos pasos para TI

Intel IT Center Informe de solución | Big Data en la nube

Para información en su idioma, visite: DialogoTI.intel.com

Page 15: Big Data en la nube: Tecnologías convergentes...Por qué debería leer este documento Este documento describe cómo las tecnologías de Big Data y de nube están convergiendo para

14

Endnotes

Intel IT Center Solution Brief | Big Data in the Cloud

1. Groenfeldt, Tom. “Big Data—Big Money Says It is a Paradigm Buster”. Forbes (6 de enero de 2012). forbes.com/sites/tomgroenfeldt/2012/01/06/big-data-big-money-says-it-is-a-paradigm-buster/

2. Investigaciones de colegas: Análisis de Big Data: Encuesta de administradores de TI de Intel sobre cómo las organizaciones están usando Big Data (en inglés). Intel® IT Center (agosto de 2012).

3. Investigaciones de colegas: Migración de carga de trabajo de misión crítica (en inglés). Intel (enero de 2013). intel.com/content/www/us/en/risc-migration/mission-critical-workload-migration-peer-research-report.html

4. Gardner, Dana. “Encuesta de GigaSpaces nuestra la necesidad de herramientas para Big Data veloz, fuerte interés en Big Data en la nube” (en inglés) ZDNet BriefingsDirect (10 de diciembre de 2012). zdnet.com/gigaspaces-survey-shows-need-for-tools-for-fast-big-data-strong-interest-in-big-data-in-cloud-7000008581/

5. Intel® AES-NI requiere un sistema informático con un procesador habilitado para AES-NI, y también que el software que no sea de Intel ejecute las instrucciones en la secuencia correcta. AES-NI está disponible en procesadores Intel® Xeon®, la serie de procesadores para PCs de escritorio Intel® Core™ i5-600, la serie de procesadores móviles Intel® Core™ i7-600, y la serie de procesadores móviles Intel® Core™ i5-500. Con respecto a la disponibilidad, consulte a su revendedor o al fabricante de su sistema. Para obtener más información, visite: intel.com/content/www/us/en/architecture-and-technology/advanced-encryption-standard--aes-/data-protection-aes-general-technology.html

6. El software y las cargas de trabajo utilizadas en las pruebas de desempeño podrían haber sido optimizadas para desempeño únicamente en microprocesadores Intel. Las pruebas de desempeño, como SYSmark* y MobileMark*, se miden utilizando sistemas de computación, componentes, software, operaciones y funciones específicos. Cualquier cambio en alguno de estos factores puede dar lugar a que los resultados varíen. Debe consultar otra información y pruebas de desempeño que lo ayuden a evaluar en forma completa sus compras contempladas, incluido el desempeño de ese producto cuando se lo combina con otros productos.

7. Fuente: Pruebas con Oracle Database Enterprise Edition 11.2.0.2 con Transparent Data Encryption (TDE) AES-256 muestran una aceleración de hasta 10 veces cuando se insertan 1 millón de filas 30 veces en una tabla vacía con el procesador Intel Xeon X5680 (3,33 GHz, 36 MB de RAM) usando Intel Integrated Performance Primitives (IPP), en comparación con el procesador Intel Xeon X5560 (2,93 GHz, 36 MB de RAM) sin Intel IPP.

8. Ningún sistema de computación puede proporcionar seguridad absoluta en todas las condiciones. Intel® Trusted Execution Technology (Intel® TXT) requiere una computadora con Intel Virtualization Technology, un procesador habilitado para Intel TXT, un chipset y BIOS, módulos de código autenticados y un entorno iniciado y que se pueda medir (MLE- Measured Launched Environment) compatible con Intel TXT. Intel TXT también requiere que el sistema contenga TPM v1.s. Para obtener más Información, visite: intel.com/go/inteltxt

Notas finales

Intel IT Center Informe de solución | Big Data en la nube

Page 16: Big Data en la nube: Tecnologías convergentes...Por qué debería leer este documento Este documento describe cómo las tecnologías de Big Data y de nube están convergiendo para

Comparta con colegas

Este documento se ofrece con fines meramente informativos. ESTE DOCUMENTO SE SUMINISTRA “COMO ESTÁ” SIN INCLUIR NINGÚN TIPO DE GARANTÍA,

INCLUYENDO CUALQUIER GARANTÍA RELACIONADA CON LA COMERCIABILIDAD, LA NO INFRACCIÓN, LA IDONEIDAD PARA UN FIN DETERMINADO, O

CUALQUIER GARANTÍA QUE SURJA DE CUALQUIER TIPO DE PROPUESTA, ESPECIFICACIÓN O MUESTRA. Intel rechaza toda responsabilidad, incluyendo la

responsabilidad por infracción de derechos de propiedad, relacionados con el uso de esta información. Este documento no concede ninguna licencia, ni

expresa ni implícita, ni por exclusión ni de ninguna otra manera, sobre ningún derecho de propiedad intelectual.

Copyright © 2013 Intel Corporation. Todos los derechos reservados. Intel, el logotipo de Intel.

*Otros nombres y marcas pueden ser reclamados como propiedad de terceros.

Microsoft es marca comercial registrada de of Microsoft Corporation en los EE.UU. y/o en otros países

0313/RF/ME/PDF-USA 328762-001