Kdd
-
Upload
diego-olivera -
Category
Documents
-
view
109 -
download
5
description
Transcript of Kdd
![Page 1: Kdd](https://reader035.fdocuments.ec/reader035/viewer/2022081813/546e7b0faf7959ed6d8b69e1/html5/thumbnails/1.jpg)
PROCESOS DE
KDD
INSTITUTO TECNOLOGICO DE OAXACA
DIEGO OLIVERA GARCIA
![Page 2: Kdd](https://reader035.fdocuments.ec/reader035/viewer/2022081813/546e7b0faf7959ed6d8b69e1/html5/thumbnails/2.jpg)
Eta
pa 1
: Reco
lecc
ión
de D
ato
s
Las primeras fases del
KDD determinan que las
fases sucesivas sean
capaces de extraer conocimiento válido y útil
a partir de la información
original.En nuestro caso extraeremos los datos de
las bases de datos de
ventas de una agencia
automotriz.
![Page 3: Kdd](https://reader035.fdocuments.ec/reader035/viewer/2022081813/546e7b0faf7959ed6d8b69e1/html5/thumbnails/3.jpg)
Eta
pa 2
: Sele
cció
n,
Lim
pie
za y
Tr
ansf
orm
aci
ón d
e
Dato
s
Se deben eliminar el
mayor número posible
de datos erróneos o inconsistentes (limpieza)
e irrelevantes (criba).Solo se seleccionaran
datos que nos sean utilicen para nuestra
finalidad, y los datos que
no se ocupen no se contemplaran, para facilitar nuestra tarea.
![Page 4: Kdd](https://reader035.fdocuments.ec/reader035/viewer/2022081813/546e7b0faf7959ed6d8b69e1/html5/thumbnails/4.jpg)
Eta
pa 3
: La
M
inerí
a d
e D
ato
s
incluye la selección de la tarea de
descubrimiento a realizar, por
ejemplo, clasificación,
agrupamiento o clustering,
regresión, etc. La selección de él o
de los algoritmos a utilizar. La
transformación de los datos al
formato requerido por el algoritmo
específico de minería de datos.
Los patrones principales que se
ocuparan en nuestro caso son: los
diferentes automóviles y diferentes
agentes de ventas, para analizar
sus estadísticas y formas de pago
mas comunes estos se establecen
como los principales patrones a
encontrar.
![Page 5: Kdd](https://reader035.fdocuments.ec/reader035/viewer/2022081813/546e7b0faf7959ed6d8b69e1/html5/thumbnails/5.jpg)
Eta
pa 4
: Eva
luaci
ón
y va
lidaci
ón
La fase anterior produce
una o más hipótesis de
modelos.Para seleccionar y validar
estos modelos es necesario
el uso de criterios de
evaluación de hipótesis.
Aquí se deben evaluar si lo
elegido anteriormente
servirá para llegar a lo que
se requiere. O si es la forma
correcta como se debe
hacer.
![Page 6: Kdd](https://reader035.fdocuments.ec/reader035/viewer/2022081813/546e7b0faf7959ed6d8b69e1/html5/thumbnails/6.jpg)
Eta
pa 5
: In
terp
reta
ción y
D
ifusi
ón
El despliegue del modelo
a veces a veces es trivial
pero otras veces requiere
un proceso de implementación o interpretación.
Aquí se difunde la informacion obtenida en
las etapas anteriores
onteniendo los resultados
deseados.