Haz que tus datos sean sexys

21
“Haz que tus datos sean sexys” Jorge López-Malla @jorgelopezmalla Sergio Gómez @Pulsarin MAD · NOV 24-25 · 2017

Transcript of Haz que tus datos sean sexys

Page 1: Haz que tus datos sean sexys

“Haz que tus datos sean sexys”

Jorge López-Malla@jorgelopezmalla

Sergio Gómez@Pulsarin

MAD · NOV 24-25 · 2017

Page 2: Haz que tus datos sean sexys

Jorge López-Malla @jorgelopezmalla - Sergio Gómez @pulsarin

Haz que tus datos sean sexys■ ¿Quienes somos?■ ¿De qué va esto?■ Tecnologías■ Conclusiones

Page 3: Haz que tus datos sean sexys

Jorge López-Malla @jorgelopezmalla - Sergio Gómez @pulsarin

Jorge López-MallaStratio Big Data

@jorgelopezmalla

linkedin.com/in/jorge-lopez-malla

Page 4: Haz que tus datos sean sexys

Jorge López-Malla @jorgelopezmalla - Sergio Gómez @pulsarin

Sergio GómezThingsO2

@Pulsarin

linkedin.com/in/bedeveloper

Page 5: Haz que tus datos sean sexys

Jorge López-Malla @jorgelopezmalla - Sergio Gómez @pulsarin

Machine Learning■ Entender el problema■ Entrenar un algoritmo■ Ejecutar a gran escala■ Representa tus datos

Page 6: Haz que tus datos sean sexys

Jorge López-Malla @jorgelopezmalla - Sergio Gómez @pulsarin

La red de vigías

Page 7: Haz que tus datos sean sexys

Jorge López-Malla @jorgelopezmalla - Sergio Gómez @pulsarin

Monstruos■ Uruk-hai 5.0■ Goblin,1.0■ Thug,0.5■ Orc,0.7■ Nazgul,10.0■ ******, 9999

Page 8: Haz que tus datos sean sexys

Jorge López-Malla @jorgelopezmalla - Sergio Gómez @pulsarin

Monstruos

Page 9: Haz que tus datos sean sexys

Jorge López-Malla @jorgelopezmalla - Sergio Gómez @pulsarin

El señor oscuro

Page 10: Haz que tus datos sean sexys

Jorge López-Malla @jorgelopezmalla - Sergio Gómez @pulsarin

K-MeansK-means es un método de agrupamiento, que tiene como objetivo la partición de un conjunto de n observaciones en k grupos en el que cada observación pertenece al grupo cuyo valor medio es más cercano.

Page 11: Haz que tus datos sean sexys

Jorge López-Malla @jorgelopezmalla - Sergio Gómez @pulsarin

K-MeansK-means es un método de agrupamiento, que tiene como objetivo la partición de un conjunto de n observaciones en k grupos en el que cada observación pertenece al grupo cuyo valor medio es más cercano.

Page 12: Haz que tus datos sean sexys

Jorge López-Malla @jorgelopezmalla - Sergio Gómez @pulsarin

La magia de los datos

Page 13: Haz que tus datos sean sexys

Jorge López-Malla @jorgelopezmalla - Sergio Gómez @pulsarin

Tenologías■ Docker■ Apache Spark■ Jupyter■ Notebook■ Apache Toree

Page 14: Haz que tus datos sean sexys

Jorge López-Malla @jorgelopezmalla - Sergio Gómez @pulsarin

¿Te has bajado el docker?

SPARK_OPTS=.....

fi

vi /opt/conda/share/jupyter/kernels/apache_toree_scala/bin/run.sh

SPARK_OPTS="--packages org.vegas-viz:vegas_2.11:0.3.11 "$SPARK_OPTS

if["${TOREE.....

Page 15: Haz que tus datos sean sexys

Jorge López-Malla @jorgelopezmalla - Sergio Gómez @pulsarin

¡Ejecuta!

docker run -it -p 8888:8888 --net host -v /home/sgomez/codemotion:/home/jovyan/work:rw jupyter/all-spark-notebook

Page 16: Haz que tus datos sean sexys

Jorge López-Malla @jorgelopezmalla - Sergio Gómez @pulsarin

¡Al lío!

Page 17: Haz que tus datos sean sexys

Jorge López-Malla @jorgelopezmalla - Sergio Gómez @pulsarin

Conclusiones

Page 18: Haz que tus datos sean sexys

[email protected] ARE HIRING

@StratioBD

Page 19: Haz que tus datos sean sexys

[email protected]¡Buscamos talento!

Page 20: Haz que tus datos sean sexys

Jorge López-Malla @jorgelopezmalla - Sergio Gómez @pulsarin

¡Gracias!(¿Preguntas?)