200776951 Big Data Analytics

download 200776951 Big Data Analytics

of 14

Transcript of 200776951 Big Data Analytics

  • 7/22/2019 200776951 Big Data Analytics

    1/14

    BIG DATA

    ANALYTICS

  • 7/22/2019 200776951 Big Data Analytics

    2/14

    BIG DATA ANALYTICS

    QUE ES ?

    Es el tratamiento y anlisis de unagran cantidad de datos y una gran

    variedad de tipos que pueden

    estar estructurados.

  • 7/22/2019 200776951 Big Data Analytics

    3/14

    BIG DATA ANAlYTICS

    PARA QUE SIRVE ?

    Para Entregar informacin con fines

    predictivos en poco tiempo es decir, aprenderde lo sucedido y anticipar posibles situaciones

    para el futuro, y realizar una planeacin

    estratgica de riesgos ms precisa.

  • 7/22/2019 200776951 Big Data Analytics

    4/14

    BIG DATA ANALYTICS

    QU TIPOS DE DATOS DEBO EXPLORAR ?

    Frecuentemente las empresas se

    preguntan: Que informacin es la quese debe analizar?, Sin embargo, la

    pregunta debera estar enfocado a:

    Que problema se trata de Resolver?

  • 7/22/2019 200776951 Big Data Analytics

    5/14

    BIG DATA ANALYTICS

    TIPOS DE DATOS DE BIG DATA

    Web and Social Media

    Biometrics Machine-to-Machine

    Human Generate Big Transaction Data

  • 7/22/2019 200776951 Big Data Analytics

    6/14

    BIG DATA ANALYTICS

    TIPOS DE DATOS DE BIG DATA

  • 7/22/2019 200776951 Big Data Analytics

    7/14

    BIG DATA ANALYTICS

    COMPONENTES DE UNA PLATAFORMA BIG DATA

    Hadoop es la plataforma de

    cdigo abierto que tiene el

    liderazgo en trminos de

    popularidad para analizarenormes cantidades de

    informacin.

  • 7/22/2019 200776951 Big Data Analytics

    8/14

    BIG DATA ANALYTICS

    HADOOP

    Est inspirado en el proyecto de

    Google File System y en el paradigmade

    programacin MapReduce,(mapper

    reducer) para manipular los datos ydistribuirlos a nodos de un clster.

  • 7/22/2019 200776951 Big Data Analytics

    9/14

    BIG DATA AnALYTICS

    COMPONENTES DE HADOOP

    Hadoop Distributed FileSystem(HDFS) Hadoop MapReduce

    Hadoop Common

  • 7/22/2019 200776951 Big Data Analytics

    10/14

    BIG DATA AnALYTICS

    HADOOP DISTRIBUTED FILE SYSTEM (HDFS)

    Los datos son divididos en el clster de

    Hadoop en bloquesy son distribuidas a

    travs del clster; para ser ejecutadasen pequeos subconjuntos y esto

    provee la escalabilidad necesaria para

    el procesamiento de grandes

    volmenes.

  • 7/22/2019 200776951 Big Data Analytics

    11/14

    BIG DATA AnALYTICS

    HADOOP MAP REDUCE

    Proceso map: Toma un conjunto de

    datos y lo convierte en otro conjunto

    de tuplas (pares de llave/valor). Proceso reduce:obtiene la salida

    de map como datos de entrada y

    combina las tuplas en un conjunto mspequeo de las mismas.

  • 7/22/2019 200776951 Big Data Analytics

    12/14

  • 7/22/2019 200776951 Big Data Analytics

    13/14

    BIG DATA ANALYTICS

    HADOOP MAP REDUCE

  • 7/22/2019 200776951 Big Data Analytics

    14/14

    BIG DATA ANALYTICS

    HADOOP COMMON

    Hadoop Common Components son unconjunto de libreras que soportan

    varios subproyectos de Hadoop.