Introducción a weka

20
Introducción a Weka Colección de algoritmos y herramientas de machine learning para minería de datos. Christian Fernando Ariza Porras http://www.christian- ariza.net [email protected].

description

Pequeña introducción al laboratorio de Weka, para el curso BigData Analytics de la Universidad de los Andes, usando un ejemplo de clasificación de texto.

Transcript of Introducción a weka

Page 1: Introducción a weka

Introducción a Weka

Colección de algoritmos y herramientas de machine learning para minería de datos.

Christian Fernando Ariza Porrashttp://[email protected]@cronosnull

Page 2: Introducción a weka

Descarga:

http://www.cs.waikato.ac.nz/ml/weka/index.html

Page 3: Introducción a weka

Interfaz de usuario

Page 4: Introducción a weka

Explorer

Page 5: Introducción a weka

Experimenter

Page 6: Introducción a weka

Knowledge Flow

Page 7: Introducción a weka

Command Line Interface

Page 8: Introducción a weka

CLASIFICACIÓN DE TEXTOEjemplo práctico

Page 9: Introducción a weka

Cargar los datos

• Antes de poder entrenar el clasificado necesitamos llevar los datos a un formato adecuado.

• Utilizamos la pestaña preprocess de la interfaz experimenter.

• Weka admite formatos y fuentes variadas.

Page 10: Introducción a weka

Importar un directorio

• Cada subdirectorio corresponde a una categoría.

• Cada archivo corresponde a una instancia.

Page 11: Introducción a weka

Importar un directorio

• Cada subdirectorio corresponde a una categoría.

• Cada archivo corresponde a una instancia.

Page 12: Introducción a weka

Transformar los datos

Page 13: Introducción a weka

Transformar los datos: Filtros

Page 14: Introducción a weka

Transformar los datos: Filtros

Page 15: Introducción a weka

Transformar los datos: Filtros

Page 16: Introducción a weka

Entrenar y validar un clasificador

Page 17: Introducción a weka

Entrenar y validar un clasificador

Page 18: Introducción a weka

Cross Validation

• Técnica para estimar el desempeño de un predictor en un data set independiente.

Imagen tomada de: http://chrisjmccormick.wordpress.com/2013/07/31/k-fold-cross-validation-with-matlab-code/

Page 19: Introducción a weka

Precision y Recall

• True positive (TP)• False positive (FP)• True Negative (TN)• False Negative (FN)

• Precision: TP/(TP+FP)

• Recall: TP/(TP+FN)

Page 20: Introducción a weka

Usar el modelo entrenado en una aplicación externa.