USO DE WEKA

11
qwertyuiopasdfghjklzxcvbnm qwertyuiopasdfghjklzxcvbnm qwertyuiopasdfghjklzxcvbnm qwertyuiopasdfghjklzxcvbnm qwertyuiopasdfghjklzxcvbnm qwertyuiopasdfghjklzxcvbnm qwertyuiopasdfghjklzxcvbnm qwertyuiopasdfghjklzxcvbnm qwertyuiopasdfghjklzxcvbnm qwertyuiopasdfghjklzxcvbnm qwertyuiopasdfghjklzxcvbnm qwertyuiopasdfghjklzxcvbnm qwertyuiopasdfghjklzxcvbnm qwertyuiopasdfghjklzxcvbnm qwertyuiopasdfghjklzxcvbnm Instituto Tecnológico De Piedras Negras Materia: Tópicos Avanzados de Bases de Datos Imparte: M.I. Juan Ramón Olague Sánchez TRABAJO FINAL—“WEKA” Alumno: Pedro Cruz Vázquez

description

ES UN TRABAJO IMPLEMENTANDO LA HERRAMIA WEKA PARA MINERIA DE DATOS

Transcript of USO DE WEKA

Page 1: USO DE WEKA

qwertyuiopasdfghjklzxcvbnmqwertyuiopasdfghjklzxcvbnmqwertyuiopasdfghjklzxcvbnmqwertyuiopasdfghjklzxcvbnmqwertyuiopasdfghjklzxcvbnmqwertyuiopasdfghjklzxcvbnmqwertyuiopasdfghjklzxcvbnmqwertyuiopasdfghjklzxcvbnmqwertyuiopasdfghjklzxcvbnmqwertyuiopasdfghjklzxcvbnmqwertyuiopasdfghjklzxcvbnmqwertyuiopasdfghjklzxcvbnmqwertyuiopasdfghjklzxcvbnmqwertyuiopasdfghjklzxcvbnmqwertyuiopasdfghjklzxcvbnmqwertyuiopasdfghjklzxcvbnmqwertyuiopasdfghjklzxcvbnmqwertyuiopasdfghjklzxcvbnmrtyuiopasdfghjklzxcvbnmqwertyuiopasdfghjklzxcvbnmqwertyuiopasdfghjklzxcvbnmqwertyuiopas

Instituto Tecnológico De Piedras Negras

Materia: Tópicos Avanzados de Bases de Datos

Imparte: M.I. Juan Ramón Olague Sánchez

TRABAJO FINAL—“WEKA”

Alumno: Pedro Cruz Vázquez

Page 2: USO DE WEKA

qwertyuiopasdfghjklzxcvbnmqwertyuiopasdfghjklzxcvbnmqwertyuiopasdfghjklzxcvbnmqwertyuiopasdfghjklzxcvbnmqwertyuiopasdfghjklzxcvbnmqwertyuiopasdfghjklzxcvbnmqwertyuiopasdfghjklzxcvbnmqwertyuiopasdfghjklzxcvbnmqwertyuiopasdfghjklzxcvbnmqwertyuiopasdfghjklzxcvbnmqwertyuiopasdfghjklzxcvbnmqwertyuiopasdfghjklzxcvbnmqwertyuiopasdfghjklzxcvbnmqwertyuiopasdfghjklzxcvbnmqwertyuiopasdfghjklzxcvbnmqwertyuiopasdfghjklzxcvbnmqwertyuiopasdfghjklzxcvbnmqwertyuiopasdfghjklzxcvbnmrtyuiopasdfghjklzxcvbnmqwertyuiopasdfghjklzxcvbnmqwertyuiopasdfghjklzxcvbnmqwertyuiopas

[ ] ISC

PARTE 1.

El Siguiente Trabajo tiene como fin Investigar una base de datos o tabla de datos depurada, en este caso de la INGI, la cual muestra los usuarios y suscriptores de servicios de telecomunicaciones en México, durante el periodo de 1998-2009, la siguiente imagen muestra la tabla y su contenido:

Tópicos Avanzados de Bases de Datos Página 2

Page 3: USO DE WEKA

[ ] ISC

PARTE 2

A continuación se busca realizar un análisis de minería de datos sobre un grupo de registros en particular, a fin de obtener uno o varios patrones que indiquen el estado general del grupo de registros estudiados, dicho análisis se desarrollara con el apoyo de la herramienta weka, la cual es entorno para Análisis del Conocimiento, es un conocido software para aprendizaje automático y minería de datos escrito en Java y desarrollado en la Universidad de Waikato. WEKA es un software libre distribuido bajo licencia GNU-GPL.

Weka, contiene una colección de herramientas de visualización y algoritmos para análisis de datos y modelado predictivo, unidos a una interfaz gráfica de usuario para acceder fácilmente a sus funcionalidades

Entorno de Trabajo Weka.

Weka cuanta con un entorno de trabajo grafico, el cual facilita la operación de aplicación, a continuación detallare los pasos que seguí para desarrollar mi trabajo final.

1. Esta es la ventana principal de weka para iniciar damos clic en el botón Explorer.

2. Ya estando dentro de la ventana weka explorer nos ubicamos El panel "Preprocess" el cual dispone de opciones para importar datos de una base de datos, de un fichero CSV, etc., y para pre procesar estos datos utilizando los denominados algoritmos de filtrado. Estos filtros se pueden utilizar para transformar los datos (por ejemplo convirtiendo datos numéricos en valores discretos) y para eliminar registros o atributos según ciertos criterios previamente especificados.

Tópicos Avanzados de Bases de Datos Página 3

Page 4: USO DE WEKA

[ ] ISC

3. Ahora Abrimos nuestro archivo, dando clic en el botón open file en la parte superior izquierda de la ventana. Seleccionamos la ruta de nuestro archivo el cual está en Excel con una extensión .csv (archivo delimitado por comas), para el mejor tratamiento de la información.

4. Ya que contamos con la tabla dentro de weka procedemos a seleccionar los campos con los que se va a trabajar para sacar el resultado.

Tópicos Avanzados de Bases de Datos Página 4

Page 5: USO DE WEKA

[ ] ISC

5. Ya seleccionados los campos nos vamos a El panel "Cluster" el cual da acceso a las técnicas de clustering o agrupamiento de Weka como por ejemplo el algoritmo K-means. Este es sólo una implementación del algoritmo expectación-maximización para aprender una mezcla de distribuciones normales.

Tópicos Avanzados de Bases de Datos Página 5

Page 6: USO DE WEKA

[ ] ISC

6. Yo utilizare el algoritmo FarthestFirst, para seleccionarlo presionamos el botón Choose y elegimos la opción del algoritmo FarthestFirst.

7. Ya seleccionado nuestro algoritmo presionamos en el cuadro de texto donde esta el nombre de FarthestFrist, para seleccionar el numero de clustres que deseamos en este caso 5 lo ponemos y damos clic en OK.

Tópicos Avanzados de Bases de Datos Página 6

Page 7: USO DE WEKA

[ ] ISC

8. Ya contando con los campos seleccionados, el algoritmo y el numero de Clusters, damos clic en el botón Start para hacer el análisis.

Tópicos Avanzados de Bases de Datos Página 7

Page 8: USO DE WEKA

[ ] ISC

9. Ahora ya con el resultado que nos arrojo solo nos queda interpretar los datos.

Grafica de Tabla de Porcentaje

Tópicos Avanzados de Bases de Datos Página 8

Page 9: USO DE WEKA

[ ] ISC

CONCLUSION

Los resultados obtenidos de la implementación de una herramienta como weka, en una minería de datos, en este caso los usuarios y suscriptores de telecomunicaciones, arrojan que en el año 2003 fue cuando se disparo el uso de las telecomunicaciones, principalmente las de la telefonía móvil televisión por satélite. Aunque también fue cuando algunas cosas fueron quedándose en el camino como los radiolocalizadores personales.

La utilización de una herramienta como weka es de gran apoyo cuando se trata de realizar trabajos con grandes cantidades de datos.

Tópicos Avanzados de Bases de Datos Página 9