Educational Data Mining : cerrando el círculo del proceso de aprendizaje en entornos virtuales

40
Educational Data Mining : cerrando el círculo del proceso de aprendizaje en entornos virtuales Julià Minguillón Universitat Oberta de Catalunya

description

Educational Data Mining : cerrando el círculo del proceso de aprendizaje en entornos virtuales. Julià Minguillón Universitat Oberta de Catalunya. Tabla de contenidos. Entornos Virtuales de Aprendizaje Educational Data Mining La UOC como laboratorio Niveles de análisis El proyecto MAVSEL - PowerPoint PPT Presentation

Transcript of Educational Data Mining : cerrando el círculo del proceso de aprendizaje en entornos virtuales

Page 1: Educational Data Mining :  cerrando el círculo del proceso de aprendizaje en entornos virtuales

Educational Data Mining: cerrando el círculo del proceso de aprendizaje en entornos virtuales

Julià Minguillón

Universitat Oberta de Catalunya

Page 2: Educational Data Mining :  cerrando el círculo del proceso de aprendizaje en entornos virtuales

Tabla de contenidos

• Entornos Virtuales de Aprendizaje• Educational Data Mining• La UOC como laboratorio• Niveles de análisis• El proyecto MAVSEL• Ejemplo: repositorio institucional• Conclusiones• Trabajo futuro

2SPDECE 2011, 15-17 de Junio, Ciudad Real

Page 3: Educational Data Mining :  cerrando el círculo del proceso de aprendizaje en entornos virtuales

Entornos Virtuales de Aprendizaje

Contenidos

Servicios

Usuarios

Proceso deaprendizaje

3SPDECE 2011, 15-17 de Junio, Ciudad Real

Page 4: Educational Data Mining :  cerrando el círculo del proceso de aprendizaje en entornos virtuales

Entornos Virtuales de Aprendizaje

Interacción

Capturar

EVA

UI

AnalizarActuar

4SPDECE 2011, 15-17 de Junio, Ciudad Real

Page 5: Educational Data Mining :  cerrando el círculo del proceso de aprendizaje en entornos virtuales

Educational Data Mining

• Desarrollo de métodos para explorar datos de escenarios educativos, para entender mejor el proceso de aprendizaje

• Área reciente de interés creciente:– Learning Analytics and Knowledge (LAK, 1st Ed.)– 4th International Conference on EDM– Journal of EDM– Special issue Journal of Educ., Tech. & Soc.– Conjuntos de datos abiertos

5SPDECE 2011, 15-17 de Junio, Ciudad Real

Page 6: Educational Data Mining :  cerrando el círculo del proceso de aprendizaje en entornos virtuales

Objetivos del EDM• Análisis y visualización de datos• Proporcionar feedback a docentes• Recomendaciones para estudiantes• Predicción del rendimiento de los estudiantes• Modelado de estudiantes• Detección de comportamientos indeseados• Agrupación de estudiantes• Análisis de redes sociales• Desarrollo de mapas conceptuales• Construcción de courseware• Planificación y organización

C. Romero, S. Ventura. Educational Data Mining: A Review of the State-of-the-Art. IEEE Transaction on Systems, Man, and Cybernetics, Part C: Applications and Reviews. 40(6), 601-618, 2010.

6SPDECE 2011, 15-17 de Junio, Ciudad Real

Page 7: Educational Data Mining :  cerrando el círculo del proceso de aprendizaje en entornos virtuales

Análisis de la interacción

• N-tuplas: el usuario U accede al servicio S mediante el dispositivo D sobre el objeto O en el momento T con resultado R

• Paradata: datos sobre un recurso generados durante su uso

• Análisis realizado mayoritariamente off-line pero toma de decisiones on-line

7SPDECE 2011, 15-17 de Junio, Ciudad Real

Page 8: Educational Data Mining :  cerrando el círculo del proceso de aprendizaje en entornos virtuales

Construcción del modelo

8SPDECE 2011, 15-17 de Junio, Ciudad Real

modeloparadata

EVAUI

usuario dispositivo

Page 9: Educational Data Mining :  cerrando el círculo del proceso de aprendizaje en entornos virtuales

Técnicas de minería de datos

• Supervisadas:– Clasificación / Predicción– Regresión

• No supervisadas:– Clustering– Reglas de asociación– Reducción de dimensionalidad

9SPDECE 2011, 15-17 de Junio, Ciudad Real

Page 10: Educational Data Mining :  cerrando el círculo del proceso de aprendizaje en entornos virtuales

Selección de un modelo

• No existe un “clasificador universal”• Aspectos importantes:– Número de parámetros (fine-tuning)– Coste computacional– Actualización on-line / off-line– Interpretación– Robustez

• Combinación de modelos → soluciones ad-hoc

SPDECE 2011, 15-17 de Junio, Ciudad Real 10

Page 11: Educational Data Mining :  cerrando el círculo del proceso de aprendizaje en entornos virtuales

Datos educativos

• Características:– Múltiples fuentes– Datos no estructurados (p.e. itinerarios)– Mayoritariamente categóricos– Valores perdidos– Imposible asumir independencia / normalidad– Distribuciones “long tail”

• Es necesario adaptar los algoritmos clásicos11SPDECE 2011, 15-17 de Junio, Ciudad Real

Page 12: Educational Data Mining :  cerrando el círculo del proceso de aprendizaje en entornos virtuales

Privacidad y seguridad

• Privacidad:– Los usuarios conocen que se recogen datos– Anonimización de los datos– No identificación de perfiles individuales– Atención a colectivos con necesidades especiales– El sistema recomienda, no obliga (poco intrusivo)

• Seguridad:– Manipulación del perfil de usuario– “Gaming the system”

12SPDECE 2011, 15-17 de Junio, Ciudad Real

Page 13: Educational Data Mining :  cerrando el círculo del proceso de aprendizaje en entornos virtuales

La UOC como laboratorio

• 1994 → 200 estudiantes; 2011 → > 40000• Completamente online / digital• Gestión de datos:– Servicios informáticos– Marketing– Área de planificación y evaluación

• Extracción de datos semi-automatizada• Falta de un modelo de datos completo

13SPDECE 2011, 15-17 de Junio, Ciudad Real

Page 14: Educational Data Mining :  cerrando el círculo del proceso de aprendizaje en entornos virtuales

Fuentes de datos

• Logs del sistema:– Múltiples servicios / servidores

• Análisis del contenido:– Manual / semi-automático

• Perfil socio-demográfico• Proceso de captación• Historial de matrícula• Rendimiento académico• Encuestas

14SPDECE 2011, 15-17 de Junio, Ciudad Real

Page 15: Educational Data Mining :  cerrando el círculo del proceso de aprendizaje en entornos virtuales

Niveles de análisis

• Nivel de sesión:– ¿Qué hace el usuario cuando se conecta?

• Nivel de actividad / curso / semestre:– ¿Qué hace el usuario en una serie de conexiones?

• Nivel de grado / lifelong learning:– ¿Cómo avanza el usuario en su carrera académica?

15SPDECE 2011, 15-17 de Junio, Ciudad Real

Page 16: Educational Data Mining :  cerrando el círculo del proceso de aprendizaje en entornos virtuales

Nivel de sesión

• ¿Qué hace el usuario cuando se conecta?– Datos y duración de la conexión– Dispositivo de acceso– Espacios visitados– Servicios utilizados– Patrón de navegación

• Análisis de la carga del sistema• Detección de fraude• Adaptación del formato de los contenidos

16SPDECE 2011, 15-17 de Junio, Ciudad Real

Page 17: Educational Data Mining :  cerrando el círculo del proceso de aprendizaje en entornos virtuales

Ejemplo: nivel de sesión

• Página de inicio de la UOC:– Acceso a diferentes partes del Campus Virtual– Información / accesos duplicados– Plataforma como gestor de correo (25 %)– Espacios nunca accedidos (nada bajo scrolling)– Rediseño basado en widgets personalizables

“Captura y análisis del comportamiento de los usuarios en entornos virtuales de aprendizaje: el Campus Virtual de la UOC”, Tesis presentada por Enric Mor, 16/6/2008

17SPDECE 2011, 15-17 de Junio, Ciudad Real

Page 18: Educational Data Mining :  cerrando el círculo del proceso de aprendizaje en entornos virtuales

Nivel de actividad

• ¿Qué hace el usuario en una serie de conexiones?• Itinerario formativo• Seguimiento de la evaluación continuada

• Visualización del grupo / individuo• Avisos y recordatorios• Detección de situaciones de riesgo

18SPDECE 2011, 15-17 de Junio, Ciudad Real

Page 19: Educational Data Mining :  cerrando el círculo del proceso de aprendizaje en entornos virtuales

Ejemplo: nivel de actividad

• Itinerarios formativos adaptativos:– Basados en IMS Learning Design– Sistema de recomendación de itinerarios– Perfiles de usuario: test inicial + intereses– Datos de seguimiento + rendimiento académico– Relación entre itinerario y rendimiento

“La especificación IMS-LD para la descripción formal de itinerarios formativos adaptativos”, Tesis presentada por Ana-Elena Guerrero, 5/4/2011

19SPDECE 2011, 15-17 de Junio, Ciudad Real

Page 20: Educational Data Mining :  cerrando el círculo del proceso de aprendizaje en entornos virtuales

Nivel de grado

• ¿Cómo avanza el usuario en su carrera académica?• Historial de matrícula• Rendimiento académico• Abandono

– Recomendación de matrícula– Detección de cuellos de botella

20SPDECE 2011, 15-17 de Junio, Ciudad Real

Page 21: Educational Data Mining :  cerrando el círculo del proceso de aprendizaje en entornos virtuales

Ejemplo: nivel de grado

• Definición de abandono (educación on-line):– Pre-requisitos y co-requisitos sólo cómo

recomendaciones– Normativa de permanencia muy laxa– Los estudiantes toman “descansos” de uno o más

semestres consecutivos– Definición de abandono oficial no compatible– Diferencias por programa / estudios– Perfil del estudiante que abandona

21SPDECE 2011, 15-17 de Junio, Ciudad Real

Page 22: Educational Data Mining :  cerrando el círculo del proceso de aprendizaje en entornos virtuales

El proyecto MAVSEL

MAVSEL: Minería, Análisis y Visualización de datos basada en modelos Sociales en E-Learning• Referencia: TIN2010-21715-C02-01 / 02 • Proyecto conjunto UAH / UOC• Desde 1/1/2011 hasta 31/12/2013• Actualmente:– Identificación de escenarios educativos relevantes– Literature review sobre Data Mining in E-Learning

22SPDECE 2011, 15-17 de Junio, Ciudad Real

Page 23: Educational Data Mining :  cerrando el círculo del proceso de aprendizaje en entornos virtuales

MAVSEL

• Objetivos:– Identificación de la interacción en escenarios

educativos:• Modelo conceptual de datos generados (paradata)• Estándares y especificaciones• Una nueva variable: dispositivos móviles

– Selección de técnicas de minería de datos– Integración en herramientas de software libre– Piloto: mejora del repositorio institucional

23SPDECE 2011, 15-17 de Junio, Ciudad Real

Page 24: Educational Data Mining :  cerrando el círculo del proceso de aprendizaje en entornos virtuales

Escenarios Educativos

• Definición: espacio (virtual / blended) donde confluyen usuarios, servicios y contenidos

• Se recogen datos de la interacción generada durante el proceso de aprendizaje

• ¿Cómo “actúan” los usuarios en el escenario?• ¿Cuáles son los puntos débiles del escenario?

24SPDECE 2011, 15-17 de Junio, Ciudad Real

Page 25: Educational Data Mining :  cerrando el círculo del proceso de aprendizaje en entornos virtuales

Planteamiento

• Conocer mejor a los usuarios:– “Tú no eres el usuario”

• Conocer mejor el propio escenario educativo• Mejora de un escenario educativo mediante:– Perfiles de usuario → Personalización– Sistemas de recomendación– Esquemas de reputación– Visualización de la interacción

25SPDECE 2011, 15-17 de Junio, Ciudad Real

Page 26: Educational Data Mining :  cerrando el círculo del proceso de aprendizaje en entornos virtuales

Ejemplos de escenarios

• Curso en Moodle• Aula virtual UOC• Grupo en Facebook• Seguimiento de un evento en twitter• Compartir recursos mediante delicious• Repositorio institucional• Sistema de recomendación de matrícula• …

26SPDECE 2011, 15-17 de Junio, Ciudad Real

Page 27: Educational Data Mining :  cerrando el círculo del proceso de aprendizaje en entornos virtuales

El modelo SIOC

27SPDECE 2011, 15-17 de Junio, Ciudad Real

Semantically Interlinked Online Communities

Page 28: Educational Data Mining :  cerrando el círculo del proceso de aprendizaje en entornos virtuales

Ejemplo: repositorio institucional

• Basado en tecnología DSpace• Modelo de metadatos: Dublin Core (q)• Tres áreas:– Docencia– Investigación– Institucional

• Gestionado por la Biblioteca pero los usuarios pueden “auto-archivar”, la Biblioteca valida

28SPDECE 2011, 15-17 de Junio, Ciudad Real

Page 29: Educational Data Mining :  cerrando el círculo del proceso de aprendizaje en entornos virtuales

O2 http://openaccess.uoc.edu

• Creado en Marzo de 2010• Más de 2100 documentos en abierto (↑↑↑)• Mandato institucional desde Noviembre 2010• Pero… (curso a personal docente colaborador):– 40 personas, ninguna conocía / usaba el repositorio– Algunas de ellas incluso tenían documentos (p.e.

TFC)• … aunque gran interés por utilizarlo

SPDECE 2011, 15-17 de Junio, Ciudad Real 29

Page 30: Educational Data Mining :  cerrando el círculo del proceso de aprendizaje en entornos virtuales

Servicios disponibles

• Búsqueda por:– Fecha de publicación– Título– Autor– Materias (palabras clave)

• Resultados en orden ascendente / descendente• Listado de recursos recientemente subidos• Descarga del contenido seleccionado

30SPDECE 2011, 15-17 de Junio, Ciudad Real

Page 31: Educational Data Mining :  cerrando el círculo del proceso de aprendizaje en entornos virtuales

Problemas conocidos

• Dos objetivos contradictorios:– Preservación (conservar la momia)– Diseminación (compartir la momia)

• Realidad: – Poco uso por parte de usuarios finales (profesores /

estudiantes / público en general)– Falta de integración en el proceso de aprendizaje– Interfaz de usuario poco amigable– Materiales docentes que no acaban de encajar

31SPDECE 2011, 15-17 de Junio, Ciudad Real

Page 32: Educational Data Mining :  cerrando el círculo del proceso de aprendizaje en entornos virtuales

Perspectiva docente

• El repositorio institucional es un mero sistema de gestión de documentos, no es parte del proceso de aprendizaje

• Ningún estudiante buscará por fecha o autor• No todos los recursos tienen un título claro• Recursos de granularidad y tipología diversas• Las palabras clave no están estructuradas• El rol del estudiante es completamente pasivo

SPDECE 2011, 15-17 de Junio, Ciudad Real 32

Page 33: Educational Data Mining :  cerrando el círculo del proceso de aprendizaje en entornos virtuales

Nuevos servicios

• Añadir comentarios• Valorar• Marcar como favorito• Compartir / “re-publicar” un recurso• Etiquetar un recurso• Subscripción a un recurso• Recursos interesantes / relacionados• Búsqueda facetada• Promover navegación sobre búsqueda

33SPDECE 2011, 15-17 de Junio, Ciudad Real

Page 34: Educational Data Mining :  cerrando el círculo del proceso de aprendizaje en entornos virtuales

Esquemas de reputación

• Respecto a los recursos:– Recurso más accedido / con más actividad– Recurso mejor valorado

• Respecto a los usuarios:– Usuario más activo– Usuarios “expertos” (aprendizaje P2P)

34SPDECE 2011, 15-17 de Junio, Ciudad Real

Page 35: Educational Data Mining :  cerrando el círculo del proceso de aprendizaje en entornos virtuales

Sistemas de recomendación

• Respecto a los recursos:– Recursos más “cercanos”:• Implícitamente: dc.relation• Explícitamente: descripción similar

– Otros recursos visitados (p.e. Amazon)

• Respecto a los usuarios:– “Colegas”– Expertos

35SPDECE 2011, 15-17 de Junio, Ciudad Real

Page 36: Educational Data Mining :  cerrando el círculo del proceso de aprendizaje en entornos virtuales

Búsqueda facetada

• Huir de búsquedas tipo Google• Búsqueda por diferentes parámetros al mismo

tiempo (filtrado)• Contextualizada:– Perfil del usuario– Dispositivo de acceso / uso previsto– Calendario académico

• Mejor 5 recursos realmente útiles que 50

36SPDECE 2011, 15-17 de Junio, Ciudad Real

Page 37: Educational Data Mining :  cerrando el círculo del proceso de aprendizaje en entornos virtuales

Interfaz de usuario

• Adaptada al perfil del usuario• Uso de taxonomías y vocabularios• Vínculo entre recursos y competencias• Resultados ordenados por interés • Recursos relacionados• Potenciar la navegación• Incluir los nuevos servicios • Recordar el historial de búsquedas

SPDECE 2011, 15-17 de Junio, Ciudad Real 37

Page 38: Educational Data Mining :  cerrando el círculo del proceso de aprendizaje en entornos virtuales

Conclusiones

• Evaluar el proceso de aprendizaje, no tan solo el resultado final

• Proceso de mejora continua del escenario educativo

• Incrementar el conocimiento sobre los estudiantes

• Es necesario recoger y preparar los datos• Faltan herramientas de propósito general

38SPDECE 2011, 15-17 de Junio, Ciudad Real

Page 39: Educational Data Mining :  cerrando el círculo del proceso de aprendizaje en entornos virtuales

Trabajo futuro

• Calendario del proyecto MAVSEL:– Añadir servicios al repositorio institucional– Recoger datos durante un semestre– Construir esquemas de reputación / sistemas de

recomendación– Evaluar y repetir

• Extender el modelo SIOC• Mejorar la construcción de modelos para EDM

39SPDECE 2011, 15-17 de Junio, Ciudad Real

Page 40: Educational Data Mining :  cerrando el círculo del proceso de aprendizaje en entornos virtuales

Muchas gracias!

Contacto: [email protected]/@jminguillona

http://mavsel.blastgroups.comhttp://personal.uoc.edu/MAVSEL

CC-BY-NC-SA40SPDECE 2011, 15-17 de Junio, Ciudad Real