Data Mining

19
INTEGRANTES Orosco Villanueva, Drusila Seguin Zuñiga, Brenda Vega Roque, Jimena Huamani Durand, Thalia Pamela Noa Castillo,Brissethe

Transcript of Data Mining

Page 1: Data Mining

INTEGRANTES

Orosco Villanueva, Drusila

Seguin Zuñiga, Brenda

Vega Roque, Jimena

Huamani Durand, Thalia Pamela

Noa Castillo,Brissethe

Page 2: Data Mining

El mayor desafio desafío de las empresas hoy es mantener una cartera de clientes lucrativa , . No se trata solamente de organizar la producción ,reducir costos y atender bien.

Vencer en el mercado global y altamente competitivo ser capaz de interpretar sus objetivos, expectativas y deseos

Datos + Estadística → Información

Ser capaz de interpretar sus objetivos, expectativas y deseos

Page 3: Data Mining
Page 4: Data Mining

Determinación de los objetivos. 

Trata de la delimitación de los objetivos que el cliente desea bajo la orientación del especialista en data mining.

Pre procesamiento de los datos.

 Se refiere a la selección, la limpieza, el enriquecimiento, la reducción y la transformación de las bases de datos. Esta etapa consume generalmente alrededor del setenta por ciento del tiempo total de un proyecto de data mining

Page 5: Data Mining

Determinación del modelo.  Se comienza con análisis estadísticos

de los datos, y después se lleva a cabo una visualización gráfica de los mismos para tener una primera aproximación. Según los objetivos planteados y la tarea que debe llevarse a cabo, pueden utilizarse algoritmos desarrollados en diferentes áreas de la Inteligencia Artificial.

Análisis de los resultados. Verifica si los resultados obtenidos son coherentes y los coteja con los obtenidos por los análisis estadísticos y de visualización gráfica. El cliente determina si son novedosos y si le aportan un nuevo conocimiento que le permita considerar sus decisiones. 

Análisis de los resultados. Verifica si los resultados obtenidos son coherentes y los coteja con los obtenidos por los análisis estadísticos y de visualización gráfica. El cliente determina si son novedosos y si le aportan un nuevo conocimiento que le permita considerar sus decisiones. 

Page 6: Data Mining

Es la extracción de forma automática de Existen tres razones fundamentales por las cuales el Data Mining esuna realidad en nuestros días:

_ Avances tecnológicos en almacenamiento masivo de datos y CPU.

_ Existencia de nuevos algoritmos para extraer información en forma eficiente.

_ Existencia de herramientas automáticas que no hacen necesario el ser un estadísticas, redes neuronales, o algoritmos matemáticos para convertirse en un«DataMiner».

Es la extracción de forma automática de Existen tres razones fundamentales por las cuales el Data Mining esuna realidad en nuestros días:

_ Avances tecnológicos en almacenamiento masivo de datos y CPU.

_ Existencia de nuevos algoritmos para extraer información en forma eficiente.

_ Existencia de herramientas automáticas que no hacen necesario el ser un estadísticas, redes neuronales, o algoritmos matemáticos para convertirse en un«DataMiner».

Page 7: Data Mining

Selección del conjunto de datosSelección del conjunto de datos

Análisis de las propiedades de los datos

Análisis de las propiedades de los datos

Transformación del conjunto de datos de entrada

Transformación del conjunto de datos de entrada

Extracción de conocimientoExtracción de conocimiento

Interpretación y evaluación de datosInterpretación y evaluación de datos

Seleccionar y aplicar la técnica de minería de datos

Seleccionar y aplicar la técnica de minería de datos

Page 8: Data Mining

REDES NEURONALES ARTIFICIALES: 

Modelos predecible no-lineales que aprenden a través del entrenamiento y semejan la estructura de una red neuronal biológica.

ARBOLES DE DECISIÓN: Estructuras de forma de árbol que representan conjuntos de decisiones. Estas decisiones generan reglas para la clasificación de un conjunto de datos

Page 9: Data Mining

ALGORITMOS GENÉTICOS: 

Técnicas de optimización que usan procesos tales como combinaciones genéticas, mutaciones y selección natural en un diseño basado en los conceptos de evolución.

REGLA DE INDUCCIÓN: la extracción de reglas if-then de datos basados en significado estadístico

MÉTODO DEL VECINO MÁS CERCANO: una técnica que clasifica cada registro en un conjunto de datos basado en una combinación de las clases del/de los k registro (s) más similar/es a él en un conjunto de datos históricos (donde k  1).

Page 10: Data Mining

La técnica : Modelado es simplemente el acto de construir un modelo en una situación donde usted conoce la respuesta y luego la aplica en otra situación de la cual desconoce la respuesta.

 

Page 11: Data Mining

Ahorra grandes cantidades de dinero a una empresa y abre nuevas oportunidades de negocio 

Contribuye a la toma de decisiones tácticas y estratégicas proporcionando un sentido automatizado para identificar información clave desde volúmenes de datos generados por procesos tradicionales y de e-Business.

Permite a los usuarios dar prioridad a decisiones y acciones mostrando factores que tienen un mayor en un objetivo, qué segmentos de clientes son desechables y qué unidades de negocio son sobrepasados y por qué.

  Genera Modelos descriptivos:  en un contexto de objetivos definidos en los

negocios permite a empresas, sin tener en cuenta la industria o el tamaño, explorar automáticamente, visualizar y comprender los datos e identificar patrones, relaciones y dependencias que impactan en los resultados finales de la cuenta de resultados (tales como el aumento de los ingresos, incremento de los beneficios, contención de costes y gestión de riesgos).

Page 12: Data Mining

Algunas áreas de aplicación del DM son:

Toma de Decisiones. Ejemplos: banca, finanzas,

seguros, marketing, políticas sanitarias

o demográficas.

Procesos Industriales.

Investigación Científica Ejemplos:medicina,

epidemiología, bioinformática, psicología.

Soporte al Diseño de Bases de Datos.

Mejora de Calidad de Datos.

Mejora en el área de empresas de Consulting.

Page 13: Data Mining

a) Identificación de patrones de compra de los clientes.

b) Búsqueda de asociaciones entre clientes y características demográficas.

c) Predicción de respuesta a campañas de correo.d) Análisis de cestas de la compra.

Page 14: Data Mining

a) Detección de patrones de uso fraudulento de tarjetas de crédito.

b) Identificación de clientes leales.

c) Determinación del gasto de tarjeta de crédito por grupos.

d) Búsqueda de correlaciones entre indicadores financieros.

Page 15: Data Mining

a) Análisis de procedimientos médicos solicitados.

b) Predicción de qué clientes compran nuevas pólizas.

c) Identificación patrones de comportamiento para clientes con riesgo.

d) Identificación de comportamiento fraudulento.

3. Seguros y Salud Privada

Page 16: Data Mining

Supongamos un banco que otorga créditos y va a estudiar la concesión de un crédito. El banco tiene una serie histórica de datos de clientes y concesión de créditos con m x n casillas. Por ejemplo los datos disponibles pueden ser: Cliente / Edad / Estado civil / Trabaja / Nómina / Casa / Hipoteca / ¿Pagó?. Cada una de estas columnas se llama atributo. El campo ¿Pagó? es binario (solo puede tomar como valores sí o no) y es el atributo clave que tiene el banco para estudiar la concesión del crédito. No siempre existe un atributo clave. ¿Para qué le sirve la minería de datos al banco? Pues para decidir si concede el crédito o no: por ejemplo, estudiando y tratando los datos puede llegar a la conclusión de que los varones menores de 20 años que están casados estadísticamente tienen un alto porcentaje de impagos. Si el cliente corresponde a ese perfil la decisión puede ser denegar el crédito

Page 17: Data Mining

Supongamos un hipermercado. La minería de datos para grandes superficies se llama “análisis de cesta de la compra” o Market Basket Analysis. Por cada compra realizada, especialmente las realizadas con tarjeta, podría almacenar datos que le permite conocer los gustos de los clientes, qué es lo que más compran, qué cantidades compran, cómo se correlacionan los productos, etc. En una tabla de datos se podrían tener campos como Cliente / Gasto en leche / Gasto en pan / Gasto en cerveza / Gasto en pañales / Gasto en pescado. ¿Para qué le serviría la minería de datos a la gran superficie? Le permitiría tomar decisiones como que si por ejemplo la leche y el pan están muy correlacionados (cuando se compra leche se suele comprar pan), ambos productos se pueden colocar distanciados dentro del establecimiento para que el cliente recorra más distancia y al ver más productos compre más. Estas técnicas se incluyen dentro de lo que se llama “Marketing Basado en Minería de Datos” (en inglés, CRM, Client Relation Management) y son discutibles, pero de lo que no cabe duda es de que los grandes comercios estudian la psicología y hábitos de los clientes para tratar de sacarles partido. Otro ejemplo sería que si un producto tiene alta demanda se puede ofrecer con descuentos promocionales para servir de gancho y que el cliente acuda a ese hipermercado

Page 18: Data Mining

En conclusión, el data mining se presenta como una tecnología emergente, con varias ventajas: por un lado, resulta un buen punto de encuentro entre los investigadores y las personas de negocios; por otro, ahorra grandes cantidades de dinero a una empresa y abre nuevas oportunidades de negocios. Además, no hay duda de que trabajar con esta tecnología implica cuidar un sinnúmero de detalles debido a que el producto final involucra "toma de decisiones".

La aplicación del Data Mining en diferentes ámbitos, permite tener una visión a grande escala de los patrones que la información oculta. Permitiendo tomar decisiones asertivas a problemas, o para formular estrategias de mejora. Es importante tener en cuenta el Data Mining para cualquier estudio de información, así como estar en constante evolución, ya que la información varia con el transcurso del tiempo, y los patrones pueden cambiar.

Page 19: Data Mining

GRACIAS!!!!