1 Diplomado "Gestión de Negocios con Data Warehouse y Data Mining". Clase 2 Técnicas y conceptos...
-
Upload
moises-perla -
Category
Documents
-
view
221 -
download
0
Transcript of 1 Diplomado "Gestión de Negocios con Data Warehouse y Data Mining". Clase 2 Técnicas y conceptos...
![Page 1: 1 Diplomado "Gestión de Negocios con Data Warehouse y Data Mining". Clase 2 Técnicas y conceptos de modelamiento José Antonio Lipari A.](https://reader036.fdocuments.ec/reader036/viewer/2022062322/5665b4341a28abb57c8ff72e/html5/thumbnails/1.jpg)
1
Diplomado "Gestión de Negocios con Data Warehouse y Data
Mining".
Clase 2 Técnicas y conceptos de
modelamiento
José Antonio Lipari A.
![Page 2: 1 Diplomado "Gestión de Negocios con Data Warehouse y Data Mining". Clase 2 Técnicas y conceptos de modelamiento José Antonio Lipari A.](https://reader036.fdocuments.ec/reader036/viewer/2022062322/5665b4341a28abb57c8ff72e/html5/thumbnails/2.jpg)
2
Tipos de problemas en Data Mining
Problemas
ClasificaciónRegresión
Agrupamiento
Reglas de asociación
Análisis correlacional
Predictivos (supervisados)
Descriptivos
(no Supervisados)
![Page 3: 1 Diplomado "Gestión de Negocios con Data Warehouse y Data Mining". Clase 2 Técnicas y conceptos de modelamiento José Antonio Lipari A.](https://reader036.fdocuments.ec/reader036/viewer/2022062322/5665b4341a28abb57c8ff72e/html5/thumbnails/3.jpg)
3
Tipos de problemas
Predictivo
(Supervisado)
Descriptivo
(No supervisado)
Se sabe lo que se busca
No se sabe lo que se busca
Se utiliza información histórica para ajustar un modelo
Se utiliza información disponible en busca de recurrencias o similitudes
![Page 4: 1 Diplomado "Gestión de Negocios con Data Warehouse y Data Mining". Clase 2 Técnicas y conceptos de modelamiento José Antonio Lipari A.](https://reader036.fdocuments.ec/reader036/viewer/2022062322/5665b4341a28abb57c8ff72e/html5/thumbnails/4.jpg)
4
Problemas Predictivos o Supervisados
Modelos de Clasificación
Buscan Predecir un clase a partir de la información disponible
Modelos de regresión
Buscan predecir un valor continuo a partir de la información disponibles
![Page 5: 1 Diplomado "Gestión de Negocios con Data Warehouse y Data Mining". Clase 2 Técnicas y conceptos de modelamiento José Antonio Lipari A.](https://reader036.fdocuments.ec/reader036/viewer/2022062322/5665b4341a28abb57c8ff72e/html5/thumbnails/5.jpg)
5
Problemas Descriptivos no supervisados
Agrupamiento (clustering)
Busca formar grupos que reúnen a elementos con características comunes
Reglas de asociaciónBusca identificar reglas que involucran la ocurrencia de eventos simultáneos.
Análisis correlacionalBusca identificar correlaciones entre variables de interés
![Page 6: 1 Diplomado "Gestión de Negocios con Data Warehouse y Data Mining". Clase 2 Técnicas y conceptos de modelamiento José Antonio Lipari A.](https://reader036.fdocuments.ec/reader036/viewer/2022062322/5665b4341a28abb57c8ff72e/html5/thumbnails/6.jpg)
6
Ejemplos:
Se requiere conocer la demanda de yogurt de frutilla diaria en un supermercado Problema supervisado de
regresión
Se requiere saber con un mes de anticipación si un clientes renunciará a la compañía.Problema Predictivo de clasificación
Se requiere segmentar la base de clientes de un banco para ofrecer productos diferenciados
Problema no supervisado de agrupamiento
![Page 7: 1 Diplomado "Gestión de Negocios con Data Warehouse y Data Mining". Clase 2 Técnicas y conceptos de modelamiento José Antonio Lipari A.](https://reader036.fdocuments.ec/reader036/viewer/2022062322/5665b4341a28abb57c8ff72e/html5/thumbnails/7.jpg)
7
Ejemplos
Se requiere saber que productos se venden juntos en un supermercado
Problema descriptivo de reglas de asociación
Se requiere saber que factores influyen en el riesgo de contraer cáncer al pulmón
Modelo no supervisado de análisis correlacional
![Page 8: 1 Diplomado "Gestión de Negocios con Data Warehouse y Data Mining". Clase 2 Técnicas y conceptos de modelamiento José Antonio Lipari A.](https://reader036.fdocuments.ec/reader036/viewer/2022062322/5665b4341a28abb57c8ff72e/html5/thumbnails/8.jpg)
Método versus algoritmo
Un método es una forma de conceptualizar la resolución de un problema de Data Mining. Un método puede permitir la resolución de distintos problemas de Data Mining mediante el uso de distintos algoritmos
![Page 9: 1 Diplomado "Gestión de Negocios con Data Warehouse y Data Mining". Clase 2 Técnicas y conceptos de modelamiento José Antonio Lipari A.](https://reader036.fdocuments.ec/reader036/viewer/2022062322/5665b4341a28abb57c8ff72e/html5/thumbnails/9.jpg)
9
Árboles de decisión
Método Concepto
Realizar divisiones sucesivas al conjunto de datos disponible
Redes neuronales
Utilizar una simulación matemática de las neuronas que permiten el aprendizaje humano
Estimar un conjunto de constantes que pertenecen a un polinimio de grado 1
Regresión lineal
![Page 10: 1 Diplomado "Gestión de Negocios con Data Warehouse y Data Mining". Clase 2 Técnicas y conceptos de modelamiento José Antonio Lipari A.](https://reader036.fdocuments.ec/reader036/viewer/2022062322/5665b4341a28abb57c8ff72e/html5/thumbnails/10.jpg)
10
Concepto Algoritmo
Utilizar una simulación matemática de las neuronas que permiten el aprendizaje humano
Perceptron Multicapa ,utilizado en problemas supervisados
Mapas auto-organizados de Kohonen, utilizado en problemas no supervisados
“REDES NEURONALES”
![Page 11: 1 Diplomado "Gestión de Negocios con Data Warehouse y Data Mining". Clase 2 Técnicas y conceptos de modelamiento José Antonio Lipari A.](https://reader036.fdocuments.ec/reader036/viewer/2022062322/5665b4341a28abb57c8ff72e/html5/thumbnails/11.jpg)
11
El problema de identificar un patrón
Un patrón puede tener cualquier forma y complejidad, la elección del método adecuado puede hacer la diferencia entre identificar un patrón o No (la detección de un patrón puede requerir la elección de un método adecuado).
Por lo tanto, es importante entender en términos generales como funcionan los distintos métodos utilizados en Data Mining, y comprender sus ventajas y desventajas
![Page 12: 1 Diplomado "Gestión de Negocios con Data Warehouse y Data Mining". Clase 2 Técnicas y conceptos de modelamiento José Antonio Lipari A.](https://reader036.fdocuments.ec/reader036/viewer/2022062322/5665b4341a28abb57c8ff72e/html5/thumbnails/12.jpg)
12
Patrón discontinuo
![Page 13: 1 Diplomado "Gestión de Negocios con Data Warehouse y Data Mining". Clase 2 Técnicas y conceptos de modelamiento José Antonio Lipari A.](https://reader036.fdocuments.ec/reader036/viewer/2022062322/5665b4341a28abb57c8ff72e/html5/thumbnails/13.jpg)
13
Patrón Lineal
![Page 14: 1 Diplomado "Gestión de Negocios con Data Warehouse y Data Mining". Clase 2 Técnicas y conceptos de modelamiento José Antonio Lipari A.](https://reader036.fdocuments.ec/reader036/viewer/2022062322/5665b4341a28abb57c8ff72e/html5/thumbnails/14.jpg)
14
Patrón no lineal
![Page 15: 1 Diplomado "Gestión de Negocios con Data Warehouse y Data Mining". Clase 2 Técnicas y conceptos de modelamiento José Antonio Lipari A.](https://reader036.fdocuments.ec/reader036/viewer/2022062322/5665b4341a28abb57c8ff72e/html5/thumbnails/15.jpg)
15
Patrón en espiral
![Page 16: 1 Diplomado "Gestión de Negocios con Data Warehouse y Data Mining". Clase 2 Técnicas y conceptos de modelamiento José Antonio Lipari A.](https://reader036.fdocuments.ec/reader036/viewer/2022062322/5665b4341a28abb57c8ff72e/html5/thumbnails/16.jpg)
16
Conceptos importantes en la detección de patrones
Sobre ajuste: Situación en la que un modelo predictivo aprende con demasiada fidelidad el comportamiento de los datos perdiendo generalidad y por lo tanto disminuye la calidad de predicciones futurasPara enfrentar el sobre ajuste, por lo general, se dividen los datos disponibles en validación, entrenamiento y testeo, de esta formar se rescatan únicamente los patrones que aparecen en las bases de entrenamiento y validación, para finalmente evaluar el modelo con la base de testeo .
![Page 17: 1 Diplomado "Gestión de Negocios con Data Warehouse y Data Mining". Clase 2 Técnicas y conceptos de modelamiento José Antonio Lipari A.](https://reader036.fdocuments.ec/reader036/viewer/2022062322/5665b4341a28abb57c8ff72e/html5/thumbnails/17.jpg)
17
Conceptos importantes en la detección de patrones
Sobre Muestro: Técnica utilizada cuando la ocurrencia del fenómeno a predecir es muy baja, por ejemplo, la fuga de clientes es del orden de 0,5% contra un 99,5% de no fugados.
En este caso se acostumbra modificar la proporción de fugados (sobremuestreo) hasta llegar a 50% fugados y 50% no fugados. Por lo general esta técnica facilita la detección de patrones y disminuye los tiempos de proceso.
![Page 18: 1 Diplomado "Gestión de Negocios con Data Warehouse y Data Mining". Clase 2 Técnicas y conceptos de modelamiento José Antonio Lipari A.](https://reader036.fdocuments.ec/reader036/viewer/2022062322/5665b4341a28abb57c8ff72e/html5/thumbnails/18.jpg)
18
Conceptos importantes en la detección de patrones
Outliers o datos fuera de rango: Se trata de registros que presentan valores que se alejan por mucho de los rangos de normalidad. Por ejemplo, clientes con edades de 1.500 años
Esta clase de registros pueden distorsionar mucho el ajuste de los modelos predictivos , por lo que generalmente son eliminados
![Page 19: 1 Diplomado "Gestión de Negocios con Data Warehouse y Data Mining". Clase 2 Técnicas y conceptos de modelamiento José Antonio Lipari A.](https://reader036.fdocuments.ec/reader036/viewer/2022062322/5665b4341a28abb57c8ff72e/html5/thumbnails/19.jpg)
19
Principales métodos y algoritmos utilizados en Data Mining
K-medias
Árboles de decisión
Regresión Lineal y Logística
Redes Neuronales
Reglas de Asociación
Vector Suport Machine
![Page 20: 1 Diplomado "Gestión de Negocios con Data Warehouse y Data Mining". Clase 2 Técnicas y conceptos de modelamiento José Antonio Lipari A.](https://reader036.fdocuments.ec/reader036/viewer/2022062322/5665b4341a28abb57c8ff72e/html5/thumbnails/20.jpg)
20
Algoritmo K medias
El algoritmo K medias, identifica los centros de un número datos de grupos o cluster ( C ) , a partir de los cuales es posible asignar un grado de pertenencia de cada elemento del conjunto a cada uno de los C cluster definidos.
Este algoritmo es usado en problemas no supervisados de agrupamiento.
![Page 21: 1 Diplomado "Gestión de Negocios con Data Warehouse y Data Mining". Clase 2 Técnicas y conceptos de modelamiento José Antonio Lipari A.](https://reader036.fdocuments.ec/reader036/viewer/2022062322/5665b4341a28abb57c8ff72e/html5/thumbnails/21.jpg)
21
Concepto de lógica difusa o Fuzzy Logic
Este concepto da una definición “difusa” de pertenencia a un conjunto, a diferencia de la logica tradicional en que un elemento pertenece o no pertenece a un conjunto, en lógica difusa un elemento tiene distintos grados de pertenencia a todos los conjuntos.
![Page 22: 1 Diplomado "Gestión de Negocios con Data Warehouse y Data Mining". Clase 2 Técnicas y conceptos de modelamiento José Antonio Lipari A.](https://reader036.fdocuments.ec/reader036/viewer/2022062322/5665b4341a28abb57c8ff72e/html5/thumbnails/22.jpg)
22
Por ejemplo, si segmentamos la base clientes de un banco, según la edad.
Joven Adulto
25 18 30
Joven
Adulto
24 años 365 días25 años
50% joven 50%
adulto
49% joven 51%
adulto
Lógica tradicional Lógica difusa
![Page 23: 1 Diplomado "Gestión de Negocios con Data Warehouse y Data Mining". Clase 2 Técnicas y conceptos de modelamiento José Antonio Lipari A.](https://reader036.fdocuments.ec/reader036/viewer/2022062322/5665b4341a28abb57c8ff72e/html5/thumbnails/23.jpg)
23
1. Determina una matriz U con ui,j [0,1; =1
2. Determina los centros de las clases:
cj =
3. Actualiza los grados de pertenencia:
ui,j = Uk = matriz en iteración k
4. Criterio para detener: Uk+1 - Uk <
c
k ki
jim
cxdcxd
1
1
2
),(),(
1
n
i
ji
n
i
iji
m
m
u
xu
1
,
1
,
c
j
jiu1
,
Etapas del algoritmo K-medias
![Page 24: 1 Diplomado "Gestión de Negocios con Data Warehouse y Data Mining". Clase 2 Técnicas y conceptos de modelamiento José Antonio Lipari A.](https://reader036.fdocuments.ec/reader036/viewer/2022062322/5665b4341a28abb57c8ff72e/html5/thumbnails/24.jpg)
24
C= 2 (2 clases) Iteración 0
Se cuenta con un conjunto de datos y se desea encontrar 2 clases o cluster
![Page 25: 1 Diplomado "Gestión de Negocios con Data Warehouse y Data Mining". Clase 2 Técnicas y conceptos de modelamiento José Antonio Lipari A.](https://reader036.fdocuments.ec/reader036/viewer/2022062322/5665b4341a28abb57c8ff72e/html5/thumbnails/25.jpg)
25
C= 2 (2 clases) Iteración 1
C1
C2
En la primera iteración se asignan aleatóriamente 2 centros de cada clase y se asocia cada elemento como perteneciente a la clase del centro mas cercano.
![Page 26: 1 Diplomado "Gestión de Negocios con Data Warehouse y Data Mining". Clase 2 Técnicas y conceptos de modelamiento José Antonio Lipari A.](https://reader036.fdocuments.ec/reader036/viewer/2022062322/5665b4341a28abb57c8ff72e/html5/thumbnails/26.jpg)
26
C= 2 (2 clases) Iteración 2
C1
C2
En la segunda iteración se reposicionan los centros en las coordenadas promedio de los elementos pertenecientes a su clase y luego se reasignan los elementos pertenecientes a cada clase.
![Page 27: 1 Diplomado "Gestión de Negocios con Data Warehouse y Data Mining". Clase 2 Técnicas y conceptos de modelamiento José Antonio Lipari A.](https://reader036.fdocuments.ec/reader036/viewer/2022062322/5665b4341a28abb57c8ff72e/html5/thumbnails/27.jpg)
27
C= 2 (2 clases) Iteración 3
C1 C2
En la tercera iteración se repite lo mismo que en la iteración anterior y se seguirá repitiendo hasta que se cumpla con la condición de salida
![Page 28: 1 Diplomado "Gestión de Negocios con Data Warehouse y Data Mining". Clase 2 Técnicas y conceptos de modelamiento José Antonio Lipari A.](https://reader036.fdocuments.ec/reader036/viewer/2022062322/5665b4341a28abb57c8ff72e/html5/thumbnails/28.jpg)
28
C= 2 (2 clases) Iteración 4
C1C2
Finaliza el proceso iterativo porque los centros se mueven menos que un mínimo definido (condición salida)
![Page 29: 1 Diplomado "Gestión de Negocios con Data Warehouse y Data Mining". Clase 2 Técnicas y conceptos de modelamiento José Antonio Lipari A.](https://reader036.fdocuments.ec/reader036/viewer/2022062322/5665b4341a28abb57c8ff72e/html5/thumbnails/29.jpg)
29
Árboles de decisión
El método consiste en realizar sucesivas particiones o “ramificaciones” sobre los datos con el objetivo de formar subconjuntos de datos o “hojas” en las que existan, idealmente, elementos de solo una clase
Pueden ser usados en problemas supervisados tanto de regresión como de clasificación
![Page 30: 1 Diplomado "Gestión de Negocios con Data Warehouse y Data Mining". Clase 2 Técnicas y conceptos de modelamiento José Antonio Lipari A.](https://reader036.fdocuments.ec/reader036/viewer/2022062322/5665b4341a28abb57c8ff72e/html5/thumbnails/30.jpg)
30
Tronco
Ramas
Hojas
Todos los datos
Particiones
Subconjuntos de clases puras idealmente
![Page 31: 1 Diplomado "Gestión de Negocios con Data Warehouse y Data Mining". Clase 2 Técnicas y conceptos de modelamiento José Antonio Lipari A.](https://reader036.fdocuments.ec/reader036/viewer/2022062322/5665b4341a28abb57c8ff72e/html5/thumbnails/31.jpg)
31
Principales características (árboles de decisión)Son fáciles de entender
Las reglas extraídas son fácilmente programables por lo que es fácil aplicar las predicciones
Son poco intensivos en uso de recursos computacionales
Pueden ser utilizados con muchas variables y gran cantidad de datos
No se requieren datos muy depurados
En muchos casos se utilizan para seleccionar las variables de mayor importancia para realizar una predicción
![Page 32: 1 Diplomado "Gestión de Negocios con Data Warehouse y Data Mining". Clase 2 Técnicas y conceptos de modelamiento José Antonio Lipari A.](https://reader036.fdocuments.ec/reader036/viewer/2022062322/5665b4341a28abb57c8ff72e/html5/thumbnails/32.jpg)
32
Regresión lineal
El método consiste en ajustar un polinomio de grado 1 con los datos disponibles
Puede ser usada en problemas supervisados de clasificación y regresión.
![Page 33: 1 Diplomado "Gestión de Negocios con Data Warehouse y Data Mining". Clase 2 Técnicas y conceptos de modelamiento José Antonio Lipari A.](https://reader036.fdocuments.ec/reader036/viewer/2022062322/5665b4341a28abb57c8ff72e/html5/thumbnails/33.jpg)
33
![Page 34: 1 Diplomado "Gestión de Negocios con Data Warehouse y Data Mining". Clase 2 Técnicas y conceptos de modelamiento José Antonio Lipari A.](https://reader036.fdocuments.ec/reader036/viewer/2022062322/5665b4341a28abb57c8ff72e/html5/thumbnails/34.jpg)
34
Principales características de la regresión lineal
Una vez identificadas las constantes del polinomio son fáciles de implementar
Son bastante intensivas en uso de recursos computacionales
Entregan información adicional sobre correlaciones entre las variables utilizadas, lo que resulta muy útil para entender el fenómeno a predecir
![Page 35: 1 Diplomado "Gestión de Negocios con Data Warehouse y Data Mining". Clase 2 Técnicas y conceptos de modelamiento José Antonio Lipari A.](https://reader036.fdocuments.ec/reader036/viewer/2022062322/5665b4341a28abb57c8ff72e/html5/thumbnails/35.jpg)
35
Redes Neuronales
El método consiste en una simulación matemática del método de aprendizaje que ocurre en el cerebro humano
Se utiliza normalmente en problemas supervisados de clasificación y regresión, además hay algunas aplicaciones en problemas no supervisados de agrupamiento.
![Page 36: 1 Diplomado "Gestión de Negocios con Data Warehouse y Data Mining". Clase 2 Técnicas y conceptos de modelamiento José Antonio Lipari A.](https://reader036.fdocuments.ec/reader036/viewer/2022062322/5665b4341a28abb57c8ff72e/html5/thumbnails/36.jpg)
36
Natural
Conexiones con pesos
Neurona
Artificial
Redes Neuronales
![Page 37: 1 Diplomado "Gestión de Negocios con Data Warehouse y Data Mining". Clase 2 Técnicas y conceptos de modelamiento José Antonio Lipari A.](https://reader036.fdocuments.ec/reader036/viewer/2022062322/5665b4341a28abb57c8ff72e/html5/thumbnails/37.jpg)
37
Entrenamiento de una red neuronal
1 Se presentan los datos de un registro
4 Se repiten los pasos 123 para el siguiente registro
3 Se modifican los valores de la constantes
2 Se evalúa la diferencia con variable objetivo
5 Se repiten los pasos 1234 hasta que la diferencia del error entre validación y entrenamiento se mayor que un cierto límite
Conexiones con pesos
Neurona
![Page 38: 1 Diplomado "Gestión de Negocios con Data Warehouse y Data Mining". Clase 2 Técnicas y conceptos de modelamiento José Antonio Lipari A.](https://reader036.fdocuments.ec/reader036/viewer/2022062322/5665b4341a28abb57c8ff72e/html5/thumbnails/38.jpg)
38
Principales características
Si se utiliza una topología de red adecuada una red neuronal es capaz de ajustarse a cualquier función no lineal por lo que potencialmente son capaces hacer muy buenas predicciones
Son muy complejas de entender y no entregan información derivada para entender el problema
Las predicciones realizadas con redes neuronales son difíciles de implementar sin uso de un software adecuado
Son muy intensivas en uso de recursos
Su uso requiere datos muy depurados
![Page 39: 1 Diplomado "Gestión de Negocios con Data Warehouse y Data Mining". Clase 2 Técnicas y conceptos de modelamiento José Antonio Lipari A.](https://reader036.fdocuments.ec/reader036/viewer/2022062322/5665b4341a28abb57c8ff72e/html5/thumbnails/39.jpg)
39
Reglas de asociación
El método consiste en identificar un conjunto de reglas que se observan con cierta recurrencia en los datos, para seleccionar las reglas relevantes se utilizan dos conceptos que son la confianza y soporte.
Este método se utiliza en problemas no supervisados de reglas de asociación.
![Page 40: 1 Diplomado "Gestión de Negocios con Data Warehouse y Data Mining". Clase 2 Técnicas y conceptos de modelamiento José Antonio Lipari A.](https://reader036.fdocuments.ec/reader036/viewer/2022062322/5665b4341a28abb57c8ff72e/html5/thumbnails/40.jpg)
40
Reglas de asociación
“Confianza”: La regla X ==>Y tiene “confianza” c si c% de las transacciones en T con X también contienen Y.
Ejemplo: Productos : {1, 2, 3, 4, 5} Transacciones : T = {(1, 3, 4), (2, 3, 5), (1, 2, 3, 5), (2, 5)}(2, 3) ==> (5) tiene “confianza” 100% (2 de 2 transacciones que contienen (2, 3)
también contienen (5))
![Page 41: 1 Diplomado "Gestión de Negocios con Data Warehouse y Data Mining". Clase 2 Técnicas y conceptos de modelamiento José Antonio Lipari A.](https://reader036.fdocuments.ec/reader036/viewer/2022062322/5665b4341a28abb57c8ff72e/html5/thumbnails/41.jpg)
41
“Soporte”:La regla X==>Y tiene “soporte” s en el conjunto de transacciones D si s% de las transacciones en T contienen (X e Y).
Ejemplo: Productos : {1, 2, 3, 4, 5} Transacciones : T = {(1, 3, 4), (2, 3, 5), (1, 2, 3, 5), (2, 5)}
(2, 3) ==> (5) tiene “support” 50% (2 de 4 transacciones de T contienen (2, 3, 5))
Reglas de asociación
![Page 42: 1 Diplomado "Gestión de Negocios con Data Warehouse y Data Mining". Clase 2 Técnicas y conceptos de modelamiento José Antonio Lipari A.](https://reader036.fdocuments.ec/reader036/viewer/2022062322/5665b4341a28abb57c8ff72e/html5/thumbnails/42.jpg)
42
Podemos decir, entonces, que la Confianza nos indica que tan fiable es una regla y el Soporte nos indica cuan importante es esta regla dentro del total de transacciones.
Utilizando estos 2 indicadores podemos seleccionar las reglas que nos interezará gestionar.
Reglas de asociación
![Page 43: 1 Diplomado "Gestión de Negocios con Data Warehouse y Data Mining". Clase 2 Técnicas y conceptos de modelamiento José Antonio Lipari A.](https://reader036.fdocuments.ec/reader036/viewer/2022062322/5665b4341a28abb57c8ff72e/html5/thumbnails/43.jpg)
43
Son fáciles de entender, verificar y demostrar económicamente.
Son poco intensivas en uso de recursos
No requieren datos muy depurados
Principales características
![Page 44: 1 Diplomado "Gestión de Negocios con Data Warehouse y Data Mining". Clase 2 Técnicas y conceptos de modelamiento José Antonio Lipari A.](https://reader036.fdocuments.ec/reader036/viewer/2022062322/5665b4341a28abb57c8ff72e/html5/thumbnails/44.jpg)
44
Vector suport machine
(maquinas de soporte vectorial)
Este es un método busca mejorar lo realizado por los métodos mencionados antes, el objetivo es lograr la mejor clasificación consiguiendo además la mayor generalidad posible, es decir, minimizar el sobre ajuste.
Es usado por general en problemas supervisados de clasificación
![Page 45: 1 Diplomado "Gestión de Negocios con Data Warehouse y Data Mining". Clase 2 Técnicas y conceptos de modelamiento José Antonio Lipari A.](https://reader036.fdocuments.ec/reader036/viewer/2022062322/5665b4341a28abb57c8ff72e/html5/thumbnails/45.jpg)
45
V1
V2 Árbol 1 Árbol 2
Regresión 1
Regresión 2
?
![Page 46: 1 Diplomado "Gestión de Negocios con Data Warehouse y Data Mining". Clase 2 Técnicas y conceptos de modelamiento José Antonio Lipari A.](https://reader036.fdocuments.ec/reader036/viewer/2022062322/5665b4341a28abb57c8ff72e/html5/thumbnails/46.jpg)
46
V1
V2 Vector suport machine
D
D
Máxima generalidad en la solución
![Page 47: 1 Diplomado "Gestión de Negocios con Data Warehouse y Data Mining". Clase 2 Técnicas y conceptos de modelamiento José Antonio Lipari A.](https://reader036.fdocuments.ec/reader036/viewer/2022062322/5665b4341a28abb57c8ff72e/html5/thumbnails/47.jpg)
47
Principales características
Es intensivo en uso de recursos
Las reglas encontradas son difíciles de entender
Requiere datos depurados
La predicción es difícil de aplicar sin uso de software apropiado
Potencialmente es capaz de generar mejores modelos predictivos que los otros método estudiados
![Page 48: 1 Diplomado "Gestión de Negocios con Data Warehouse y Data Mining". Clase 2 Técnicas y conceptos de modelamiento José Antonio Lipari A.](https://reader036.fdocuments.ec/reader036/viewer/2022062322/5665b4341a28abb57c8ff72e/html5/thumbnails/48.jpg)
48
FIN