Propuesta de Investigación Grupo Data Mining- KDDPeru2005 Curso-Taller Investigación en...
-
Upload
manuelita-magana -
Category
Documents
-
view
6 -
download
0
Transcript of Propuesta de Investigación Grupo Data Mining- KDDPeru2005 Curso-Taller Investigación en...
![Page 1: Propuesta de Investigación Grupo Data Mining- KDDPeru2005 Curso-Taller Investigación en Inteligencia Artificial MODELO DIFUSO DE LAS PREFERENCIAS DE CLIENTES.](https://reader033.fdocuments.ec/reader033/viewer/2022051515/54f5d0d04a79595c208b45ab/html5/thumbnails/1.jpg)
Propuesta de Investigación
Grupo Data Mining- KDDPeru2005
Curso-Taller Investigación en Inteligencia Artificial
MODELO DIFUSO DE LAS PREFERENCIAS DE CLIENTES DE UNA BASE DE DATOS:
APLICACIÓN A LA SELECCIÓN DEL OBJETIVO EN MARKETING DIRECTO
23 Julio 2005
![Page 2: Propuesta de Investigación Grupo Data Mining- KDDPeru2005 Curso-Taller Investigación en Inteligencia Artificial MODELO DIFUSO DE LAS PREFERENCIAS DE CLIENTES.](https://reader033.fdocuments.ec/reader033/viewer/2022051515/54f5d0d04a79595c208b45ab/html5/thumbnails/2.jpg)
Responsables• Iván Aquino Morales
– Estudiante de Ing. de Sistemas-UNI– 6to ciclo – [email protected]
• Karina Chávez Cuzcano – Estudiante de Ing. De Sistemas– 6to ciclo – [email protected]
• Cesar Pérez Pinche – Estudiante de Ing. de Sistemas-UNI– 6to ciclo – [email protected]
![Page 3: Propuesta de Investigación Grupo Data Mining- KDDPeru2005 Curso-Taller Investigación en Inteligencia Artificial MODELO DIFUSO DE LAS PREFERENCIAS DE CLIENTES.](https://reader033.fdocuments.ec/reader033/viewer/2022051515/54f5d0d04a79595c208b45ab/html5/thumbnails/3.jpg)
PROPUESTA DE LA INVESTIGACIÓN
![Page 4: Propuesta de Investigación Grupo Data Mining- KDDPeru2005 Curso-Taller Investigación en Inteligencia Artificial MODELO DIFUSO DE LAS PREFERENCIAS DE CLIENTES.](https://reader033.fdocuments.ec/reader033/viewer/2022051515/54f5d0d04a79595c208b45ab/html5/thumbnails/4.jpg)
TítuloMODELO DIFUSO DE LAS PREFERENCIAS DE CLIENTES DE
UNA BASE DE DATOS: APLICACIÓN A LA SELECCIÓN DEL OBJETIVO EN MARKETING
DIRECTO
![Page 5: Propuesta de Investigación Grupo Data Mining- KDDPeru2005 Curso-Taller Investigación en Inteligencia Artificial MODELO DIFUSO DE LAS PREFERENCIAS DE CLIENTES.](https://reader033.fdocuments.ec/reader033/viewer/2022051515/54f5d0d04a79595c208b45ab/html5/thumbnails/5.jpg)
Problema• ¿Hacia que clientes debemos dirigir una campaña de
Marketing directo relacionado a un producto?• ¿Qué productos ofrecer a cada cliente?• ¿Cómo reducir costos en campañas de marketing sin
provocar disminución en las ventas ?
![Page 6: Propuesta de Investigación Grupo Data Mining- KDDPeru2005 Curso-Taller Investigación en Inteligencia Artificial MODELO DIFUSO DE LAS PREFERENCIAS DE CLIENTES.](https://reader033.fdocuments.ec/reader033/viewer/2022051515/54f5d0d04a79595c208b45ab/html5/thumbnails/6.jpg)
Objetivo• GENERAL
Elaborar un Sistema Difuso de Selección Objetivo para mejorar la eficiencia, en ventas, de una campaña de Marketing Directo.
ESPECIFICOS
– Determinar la Data a ser usada por el Modelo propuesto.
– Determinar las características influyentes en la clasificación de los clientes (respondedores positivos, no respondedores).
– Determinar las reglas para la selección de clientes a quienes será dirigida una campaña de marketing.
![Page 7: Propuesta de Investigación Grupo Data Mining- KDDPeru2005 Curso-Taller Investigación en Inteligencia Artificial MODELO DIFUSO DE LAS PREFERENCIAS DE CLIENTES.](https://reader033.fdocuments.ec/reader033/viewer/2022051515/54f5d0d04a79595c208b45ab/html5/thumbnails/7.jpg)
![Page 8: Propuesta de Investigación Grupo Data Mining- KDDPeru2005 Curso-Taller Investigación en Inteligencia Artificial MODELO DIFUSO DE LAS PREFERENCIAS DE CLIENTES.](https://reader033.fdocuments.ec/reader033/viewer/2022051515/54f5d0d04a79595c208b45ab/html5/thumbnails/8.jpg)
DISEÑO DEL EXPERIMENTO
![Page 9: Propuesta de Investigación Grupo Data Mining- KDDPeru2005 Curso-Taller Investigación en Inteligencia Artificial MODELO DIFUSO DE LAS PREFERENCIAS DE CLIENTES.](https://reader033.fdocuments.ec/reader033/viewer/2022051515/54f5d0d04a79595c208b45ab/html5/thumbnails/9.jpg)
Diseño del Experimento• Se limpia la Data, eliminando valores nulos.
– Esto se hace mediante la el método de Conjuntos Difusos.
![Page 10: Propuesta de Investigación Grupo Data Mining- KDDPeru2005 Curso-Taller Investigación en Inteligencia Artificial MODELO DIFUSO DE LAS PREFERENCIAS DE CLIENTES.](https://reader033.fdocuments.ec/reader033/viewer/2022051515/54f5d0d04a79595c208b45ab/html5/thumbnails/10.jpg)
Diseño del Experimento• Se realiza el agrupamiento difuso por cada característica
de la data– Esto se hace mediante el algoritmo del Fuzzy c-means extendido
![Page 11: Propuesta de Investigación Grupo Data Mining- KDDPeru2005 Curso-Taller Investigación en Inteligencia Artificial MODELO DIFUSO DE LAS PREFERENCIAS DE CLIENTES.](https://reader033.fdocuments.ec/reader033/viewer/2022051515/54f5d0d04a79595c208b45ab/html5/thumbnails/11.jpg)
Diseño del Experimento• Se realiza un modelo jerárquico de las características
– Esto se hace mediante un árbol de decisión, con la características mas relevante en la raiz, y la menos relevante en el ultimo nodo
![Page 12: Propuesta de Investigación Grupo Data Mining- KDDPeru2005 Curso-Taller Investigación en Inteligencia Artificial MODELO DIFUSO DE LAS PREFERENCIAS DE CLIENTES.](https://reader033.fdocuments.ec/reader033/viewer/2022051515/54f5d0d04a79595c208b45ab/html5/thumbnails/12.jpg)
Diseño del Experimento• Se determina las reglas lingüísticas difusas para selección de
clientes objetivos teniendo como entrada los clusters.– Esto se hace mediante un motor de inferencia difuso
• La eficiencia del Modelo se determina mediante gain-charts.
![Page 13: Propuesta de Investigación Grupo Data Mining- KDDPeru2005 Curso-Taller Investigación en Inteligencia Artificial MODELO DIFUSO DE LAS PREFERENCIAS DE CLIENTES.](https://reader033.fdocuments.ec/reader033/viewer/2022051515/54f5d0d04a79595c208b45ab/html5/thumbnails/13.jpg)
Hipótesis
Ho. La eficiencia, en ventas, de una campaña de Marketing
aumenta con el uso de un Modelo Difuso sobre un modelo estadístico.
![Page 14: Propuesta de Investigación Grupo Data Mining- KDDPeru2005 Curso-Taller Investigación en Inteligencia Artificial MODELO DIFUSO DE LAS PREFERENCIAS DE CLIENTES.](https://reader033.fdocuments.ec/reader033/viewer/2022051515/54f5d0d04a79595c208b45ab/html5/thumbnails/14.jpg)
Antecedentes
• David J. Stracuzzi y Paul E.Utgoff (2004), Desarrollaron modelo para la selección de características relevantes a un determinado proceso de aprendizaje usando una red neuronal perceptron.
• Huan Liu (2005), propuso un avance de un metalgoritmo para la elección de algoritmos de selección de características de acuerdo al modelo que se quiere ajustar la data.
![Page 15: Propuesta de Investigación Grupo Data Mining- KDDPeru2005 Curso-Taller Investigación en Inteligencia Artificial MODELO DIFUSO DE LAS PREFERENCIAS DE CLIENTES.](https://reader033.fdocuments.ec/reader033/viewer/2022051515/54f5d0d04a79595c208b45ab/html5/thumbnails/15.jpg)
ANÁLISIS DE FACTIBILIDAD
![Page 16: Propuesta de Investigación Grupo Data Mining- KDDPeru2005 Curso-Taller Investigación en Inteligencia Artificial MODELO DIFUSO DE LAS PREFERENCIAS DE CLIENTES.](https://reader033.fdocuments.ec/reader033/viewer/2022051515/54f5d0d04a79595c208b45ab/html5/thumbnails/16.jpg)
Fuente de Datos• La data a usar es del KDDCUP98 obtenida de Internet;
– La data es de una organización sin fines de lucro cuyo fin es la ayuda a los americanos con enfermedades de parálisis o problemas de la medula ósea.
– La data posee una columna TARGET_B que vale 1 si es que el cliente respondió a la campaña de mail, y 0 si no.
![Page 17: Propuesta de Investigación Grupo Data Mining- KDDPeru2005 Curso-Taller Investigación en Inteligencia Artificial MODELO DIFUSO DE LAS PREFERENCIAS DE CLIENTES.](https://reader033.fdocuments.ec/reader033/viewer/2022051515/54f5d0d04a79595c208b45ab/html5/thumbnails/17.jpg)
RecursosTiempo.
– Dedicación de 3 horas diarias (7:00 PM – 10:00 PM)
Bibliografía.– Se requiere acceso a la BD de la IEEE, ACM.
Ingles.– Lectura de textos en ingles al 95%Equipos.– Se requiere 3 PC Pentium IV, en todo momento.– Internet.– Se requiere acceso a Internet en todo momento.
Herramientas de Software.– Se requiere MatLab, Látex, Clementine, SPSS, Java.
Conocimientos.– Análisis de Cluster difusos, Árboles de decisión, K-fold, Diseño
experimentos, Sistemas de inferencia Difuso.
![Page 18: Propuesta de Investigación Grupo Data Mining- KDDPeru2005 Curso-Taller Investigación en Inteligencia Artificial MODELO DIFUSO DE LAS PREFERENCIAS DE CLIENTES.](https://reader033.fdocuments.ec/reader033/viewer/2022051515/54f5d0d04a79595c208b45ab/html5/thumbnails/18.jpg)
Plan de Trabajo
S1
3
S4
6
S79
S1012
S1315
S1618
S1921
S2123
S2527
Revisión Bibliográfica
Preparación del Plan de Trabajo
Limpieza de la data
Diseño del modelo de solución
Diseño del prototipo
Pruebas y Corridas
Análisis de los resultados
Redacción del documento final
![Page 19: Propuesta de Investigación Grupo Data Mining- KDDPeru2005 Curso-Taller Investigación en Inteligencia Artificial MODELO DIFUSO DE LAS PREFERENCIAS DE CLIENTES.](https://reader033.fdocuments.ec/reader033/viewer/2022051515/54f5d0d04a79595c208b45ab/html5/thumbnails/19.jpg)
MARCO TEORICO
![Page 20: Propuesta de Investigación Grupo Data Mining- KDDPeru2005 Curso-Taller Investigación en Inteligencia Artificial MODELO DIFUSO DE LAS PREFERENCIAS DE CLIENTES.](https://reader033.fdocuments.ec/reader033/viewer/2022051515/54f5d0d04a79595c208b45ab/html5/thumbnails/20.jpg)
Análisis de Grupos Difusos• El agrupamiento de datos de manera difusa se basa en la
teoría de conjuntos difusos.• Esta teoría plantea que un objeto puede pertenecer a una
clase con un determinado grado de pertenencia.• Permite construir reglas lingüísticas comprensibles por el
experto.• Las reglas de inferencia difusa se construyen a partir de
conjuntos difusos.• La teoría de conjuntos difusos maneja un mayor grado de
abstracción de la realidad.
![Page 21: Propuesta de Investigación Grupo Data Mining- KDDPeru2005 Curso-Taller Investigación en Inteligencia Artificial MODELO DIFUSO DE LAS PREFERENCIAS DE CLIENTES.](https://reader033.fdocuments.ec/reader033/viewer/2022051515/54f5d0d04a79595c208b45ab/html5/thumbnails/21.jpg)
Conjuntos Difusos• Es aquel conjunto cuyos elementos pueden
pertenecer total o parcialmente a el.
![Page 22: Propuesta de Investigación Grupo Data Mining- KDDPeru2005 Curso-Taller Investigación en Inteligencia Artificial MODELO DIFUSO DE LAS PREFERENCIAS DE CLIENTES.](https://reader033.fdocuments.ec/reader033/viewer/2022051515/54f5d0d04a79595c208b45ab/html5/thumbnails/22.jpg)
CONCLUSIONES Y BIBLIOGRAFIA
![Page 23: Propuesta de Investigación Grupo Data Mining- KDDPeru2005 Curso-Taller Investigación en Inteligencia Artificial MODELO DIFUSO DE LAS PREFERENCIAS DE CLIENTES.](https://reader033.fdocuments.ec/reader033/viewer/2022051515/54f5d0d04a79595c208b45ab/html5/thumbnails/23.jpg)
Conclusiones• Se pretende desarrollar un experimento para determinar la
eficiencia del Modelo Difuso de Selección del Objetivo en Marketing Directo.
• Se pretende comparar los resultados con resultados arrojados por herramientas estadísticas como el Chaid
![Page 24: Propuesta de Investigación Grupo Data Mining- KDDPeru2005 Curso-Taller Investigación en Inteligencia Artificial MODELO DIFUSO DE LAS PREFERENCIAS DE CLIENTES.](https://reader033.fdocuments.ec/reader033/viewer/2022051515/54f5d0d04a79595c208b45ab/html5/thumbnails/24.jpg)
Bibliografía• [1] M. Setnes and U. Kaymak. Fuzzy modeling of client preference from large data sets: An application• to target selection in direct marketing. IEEE Transactions on Fuzzy Systems, 2001; 153(1).• [2] Lucio Soibelman, Hyunjoo Kim. “Data Preparation Process for Construccion Knowledge Generation through
Knowdledge Discovery in DataBases” Journal of Computing in Civil Engineering January 2002 ; 40(3). 3 “Feature Selection for Unsupervised Learning “, Technical Report for the Northeastern University , Jennifer G.Dy,
Carla E. Brodley 4 H. Liu and R. Setiono, "Feature Selection and Classification-A Probabilistic Wrapper Approach," Proc. Ninth Int'l
Conf. Industrial and Eng. Applications of AI and ES, T. Tanaka, S. Ohsuga, and M. Ali, eds., pp. 419-424, 1996.• [5] K.S. Ng and H. Liu, "Customer Retention via Data Mining," AI Rev., vol. 14, no. 6, pp. 569-590, 2000.• [6] "Adaptive Intrusión Detection. A data Mining Approach". AI rev, vol 14, no. 6, pp. 533-567, 2000.• [7] "Feature Selection for High-Dimensional Genomic Microarray Data". Proc 15th Int'l Conf. Machina Learning,
pp.601-608, 2001.• [8] "Redundancy Bases Feature Selection for Microarray Data". Proc. 10th ACM SIGKDD Conf. Knowledge Discovery
and Data Mining, 2004.• [9] "Text Classification from Labeled data and Unlabeled Documents using EM", Machine Learning, vol. 39, 103-134,
2000.• [10] "Efficient Content-Based Image Retrieval Using Automatic Feature Selection". IEEE Int'l Symp. Computer Vision,
pp. 85-90, 1995.• [11] Y. Rui, T.S. Huang, and S. Chang, "Image Retrieval: Current Techniques, Promising Directions and Open Issues,"
Visual Comm. and Image Representation, vol. 10, no. 4, pp. 39-62, 1999.• [12] N.Wyse, R. Dubes, and A. K. Jain. ”A critical evaluation of intrinsec dimensionality algorithms”, In E.Gelsema and
L.N.Kanal, editors, Pattern Recognition, pages 415-425. Morgan Kaufmann, 1980 • [13] Huan Liu, Lei Yu, “Toward Integrating Feature Selection Algoritms for Classification and Clustering” IEEE
Transactions on Knowledge and Data Engeneering Vol 17, No 4, April 2005.• [14] H.Liu and H.Motorola, “Feature Selection for Knowledge Discovery and Data Mining”. Boston: Kluwer Academy,
1998. • [15] David J. Stracuzzi, Paul E. Utgoff, “Randomized Variable Elimination”, Journal of Machine Learning Research 5
(2004) 1331–1362