orange mineria de datos

8
HTTP://ORANGE.BIOLAB.SI/FEATURES/ OMAR CÉSPEDES ESPINO ANGEL ALEJANDRO MANRIQUE RAMIREZ

Transcript of orange mineria de datos

Page 1: orange mineria de datos

HTTP://ORANGE.BIOLAB.SI/FEATURES/

OMAR CÉSPEDES ESPINOANGEL ALEJANDRO MANRIQUE RAMIREZ

Page 2: orange mineria de datos

INTRODUCCIÓN

programa informático para realizar minería de datos y análisis predictivo

desarrollado en la facultad de informática de la Universidad de Ljubljana (Eslovenia).

Consta de una serie de componentes desarrollados en C++ que implementan algoritmos de minería de datos, así como operaciones de preprocesamiento y representación gráfica de datos.

Los componentes pueden ser accedidos:

por medio de scripts desde Python

por medio de widgets (componentes GUI), desde el Canvas

Se distribuye bajo licencia GPL.

MULTIPLATAFORMA

Page 3: orange mineria de datos

COMPONENTES

Orange provee componentes para: Entrada/salida de datos, soporta los formatos C4.5, assistant, retis y tab(nativo).

Preprocesamiento de datos: selección, discretización, etc.

Modelado predictivo: árboles de clasificación, regresión logística, clasificador de Bayes, reglas de asociación, etc.

Métodos de descripción de datos: mapas autoorganizados, k-means clustering, etc.

Técnicas de validación del modelo: como validación cruzada.

Page 4: orange mineria de datos

INSTALACIÓN

REQUERIMIENTOS:

Python, para scripting.

Los paquetes Qt,PyQt, PyQwt, para usar Canvas y widgets.

El paquete GraphViz, para algunos widgets.

Para utilizar el Canvas puede ser necesario el modulo NumPy (paquete de funciones matemáticas).

Page 5: orange mineria de datos

FORMATOS

• C4.5 (.dat)

• ASSISTANT FILES (.dat)

• RETIS FILES (.rda .rdo)

• BASKET FILES (.basket)

• WEKA(.arff)

• MULAN (.xml)

• LIBSVM(.svm)

Page 6: orange mineria de datos

ACCESO POR CANVAS

Page 7: orange mineria de datos

ACCESO POR SCRIPT PYTHON

Page 8: orange mineria de datos

EJEMPLO