Minería de datos

24
ería de Datos – 11 y12 de Junio de 2 Leonel Morales Día [email protected] [email protected] @litomd

description

Introducción a los temas de minería de datos y ciencia de datos, características de la gran data (big data), el proceso de la minería de datos.

Transcript of Minería de datos

Page 1: Minería de datos

Minería de Datos – 11 y12 de Junio de 2014

Leonel Morales Díazl e o n e l @ i n g e n i e r i a s i m p l e . c o ml m o ra l e s d @ u r l . e d u . gt@ l i t o m d

Page 2: Minería de datos

http://goo.gl/zozuBr

Por favor llenar encuesta:

Page 3: Minería de datos

Big Data

Page 4: Minería de datos

Big DataVe

locid

ad

Datos

por

segu

ndo

Rede

s: co

nduc

tore

s de d

atos

Volumen

MB -> GB -> TB

VariedadEstructurados

No estructuradosNúmeros, texto, fotos

Page 5: Minería de datos

Big DataVe

locid

ad

Datos

por

segu

ndo

Rede

s: co

nduc

tore

s de d

atos

Volumen

MB -> GB -> TB

VariedadEstructurados

No estructuradosNúmeros, texto, fotos

Valor¿Qué problemas puede resolver?

¿Qué nuevo conocimiento

provee?

Page 6: Minería de datos

Big DataVe

locid

ad

Datos

por

segu

ndo

Rede

s: co

nduc

tore

s de d

atos

Volumen

MB -> GB -> TB

VariedadEstructurados

No estructuradosNúmeros, texto, fotos

Valor¿Qué problemas puede resolver?

¿Qué nuevo conocimiento

provee?

Para obtener valor:CapturarlaLimpiarlaConocerlaAnalizarlaModelarla

Page 7: Minería de datos

Captura de Datos

N = Todos los datos

Page 8: Minería de datos

Captura de Datos

N = 1 dato

Page 9: Minería de datos

Conocer los Datos

Análisis Exploratoriode Datos

Page 10: Minería de datos

Modelar los Datos

Un modelo simplees mejor que ningún modelo

Page 11: Minería de datos

Minería de Datos

Saber delTema

Experiencia

Estudios

Familiaridad

Especialización

Page 12: Minería de datos

Minería de Datos

Usar

Estadísticas

Saber delTema

Experiencia

Estudios

Familiaridad

Especialización

Graficar

Calcular

Interpretar

Muestrear

Probabilidades

Page 13: Minería de datos

Minería de Datos

Usar

Estadísticas

Saber delTema

Experiencia

Estudios

Familiaridad

Especialización

Graficar

Calcular

Interpretar

Muestrear

Probabilidades

Investigación tradicional

Page 14: Minería de datos

Minería de Datos

Prog

ram

arHac

kear

Usar

Estadísticas

Saber delTema

Experiencia

Estudios

Familiaridad

Especialización

Graficar

Calcular

Interpretar

Muestrear

Probabilidades

Bajar Datos

Almacenarlos

Mezclarlos

Limpiarlos

Page 15: Minería de datos

Minería de Datos

Prog

ram

arHac

kear

Usar

Estadísticas

Saber delTema

Experiencia

Estudios

Familiaridad

Especialización

Graficar

Calcular

Interpretar

Muestrear

Probabilidades

Bajar Datos

Almacenarlos

Mezclarlos

Limpiarlos

Machine learningAprendizaje

automatizado

Page 16: Minería de datos

Minería de Datos

Prog

ram

arHac

kear

Usar

Estadísticas

Saber delTema

Experiencia

Estudios

Familiaridad

Especialización

Graficar

Calcular

Interpretar

Muestrear

Probabilidades

Bajar Datos

Almacenarlos

Mezclarlos

Limpiarlos

¡Peligro!

Page 17: Minería de datos

Minería de Datos

Prog

ram

arHac

kear

Usar

Estadísticas

Saber delTema

Experiencia

Estudios

Familiaridad

Especialización

Graficar

Calcular

Interpretar

Muestrear

Probabilidades

Bajar Datos

Almacenarlos

Mezclarlos

Limpiarlos Mineríade Datos

Page 18: Minería de datos

Proceso de Minería de Datos

Recolección de datos “crudos”

Procesa-miento de

datos

Datos limpios

Mundoreal

Page 19: Minería de datos

Proceso de Minería de Datos

Recolección de datos “crudos”

Procesa-miento de

datos

Datos limpios

Análisis exploratorio

de datosMundo

real

Page 20: Minería de datos

Proceso de Minería de Datos

Recolección de datos “crudos”

Procesa-miento de

datos

Datos limpios

Análisis exploratorio

de datosMundo

real

Identifica-ción

automática de patrones

Modelos estadísticos

ClasificarPredecirDescribir

Page 21: Minería de datos

Proceso de Minería de Datos

Recolección de datos “crudos”

Procesa-miento de

datos

Datos limpios

Análisis exploratorio

de datos

Sistema basado en

datos

Mundoreal

Identifica-ción

automática de patrones

Modelos estadísticos

ClasificarPredecirDescribir

Page 22: Minería de datos

Proceso de Minería de Datos

Recolección de datos “crudos”

Procesa-miento de

datos

Datos limpios

Análisis exploratorio

de datos

ComunicarVisualizarReportar

Sistema basado en

datos

Mundoreal

Identifica-ción

automática de patrones

Modelos estadísticos

ClasificarPredecirDescribir

Page 23: Minería de datos

Proceso de Minería de Datos

Recolección de datos “crudos”

Procesa-miento de

datos

Datos limpios

Análisis exploratorio

de datos

Identifica-ción

automática de patrones

Modelos estadísticos

ClasificarPredecirDescribir

ComunicarVisualizarReportar

Sistema basado en

datos

Decisiones

Mundoreal

Page 24: Minería de datos

Temas del Taller

• 1: Búsqueda de datos• 2: Descarga automática de datos• 3: Construcción de bases de datos• 4: Análisis exploratorio de datos• 5: Modelación