Haz que tus datos sean sexys
-
Upload
jorge-lopez-malla -
Category
Data & Analytics
-
view
25 -
download
0
Transcript of Haz que tus datos sean sexys
“Haz que tus datos sean sexys”
Jorge López-Malla@jorgelopezmalla
Sergio Gómez@Pulsarin
MAD · NOV 24-25 · 2017
Jorge López-Malla @jorgelopezmalla - Sergio Gómez @pulsarin
Haz que tus datos sean sexys■ ¿Quienes somos?■ ¿De qué va esto?■ Tecnologías■ Conclusiones
Jorge López-Malla @jorgelopezmalla - Sergio Gómez @pulsarin
Jorge López-MallaStratio Big Data
@jorgelopezmalla
linkedin.com/in/jorge-lopez-malla
Jorge López-Malla @jorgelopezmalla - Sergio Gómez @pulsarin
Sergio GómezThingsO2
@Pulsarin
linkedin.com/in/bedeveloper
Jorge López-Malla @jorgelopezmalla - Sergio Gómez @pulsarin
Machine Learning■ Entender el problema■ Entrenar un algoritmo■ Ejecutar a gran escala■ Representa tus datos
Jorge López-Malla @jorgelopezmalla - Sergio Gómez @pulsarin
La red de vigías
Jorge López-Malla @jorgelopezmalla - Sergio Gómez @pulsarin
Monstruos■ Uruk-hai 5.0■ Goblin,1.0■ Thug,0.5■ Orc,0.7■ Nazgul,10.0■ ******, 9999
Jorge López-Malla @jorgelopezmalla - Sergio Gómez @pulsarin
Monstruos
Jorge López-Malla @jorgelopezmalla - Sergio Gómez @pulsarin
El señor oscuro
Jorge López-Malla @jorgelopezmalla - Sergio Gómez @pulsarin
K-MeansK-means es un método de agrupamiento, que tiene como objetivo la partición de un conjunto de n observaciones en k grupos en el que cada observación pertenece al grupo cuyo valor medio es más cercano.
Jorge López-Malla @jorgelopezmalla - Sergio Gómez @pulsarin
K-MeansK-means es un método de agrupamiento, que tiene como objetivo la partición de un conjunto de n observaciones en k grupos en el que cada observación pertenece al grupo cuyo valor medio es más cercano.
Jorge López-Malla @jorgelopezmalla - Sergio Gómez @pulsarin
La magia de los datos
Jorge López-Malla @jorgelopezmalla - Sergio Gómez @pulsarin
Tenologías■ Docker■ Apache Spark■ Jupyter■ Notebook■ Apache Toree
Jorge López-Malla @jorgelopezmalla - Sergio Gómez @pulsarin
¿Te has bajado el docker?
…
SPARK_OPTS=.....
fi
vi /opt/conda/share/jupyter/kernels/apache_toree_scala/bin/run.sh
SPARK_OPTS="--packages org.vegas-viz:vegas_2.11:0.3.11 "$SPARK_OPTS
if["${TOREE.....
Jorge López-Malla @jorgelopezmalla - Sergio Gómez @pulsarin
¡Ejecuta!
docker run -it -p 8888:8888 --net host -v /home/sgomez/codemotion:/home/jovyan/work:rw jupyter/all-spark-notebook
Jorge López-Malla @jorgelopezmalla - Sergio Gómez @pulsarin
¡Al lío!
Jorge López-Malla @jorgelopezmalla - Sergio Gómez @pulsarin
Conclusiones
[email protected] ARE HIRING
@StratioBD
[email protected]¡Buscamos talento!
Jorge López-Malla @jorgelopezmalla - Sergio Gómez @pulsarin
¡Gracias!(¿Preguntas?)
Jorge López-Malla @jorgelopezmalla - Sergio Gómez @pulsarin
Enlaces
● Notebook● Dataset training● Dataset monsters● Dataset watchtower● Dataset sightings