Del Pino Johanna Salazar Gustavo. Estudiantes enfrentan semestre a semestre la dificultad de...

22
Análisis de Métricas de Similaridad Usadas en un Algoritmo de Filtro Colaborativo Basado en el Usuario Para Recomendar Materias de Pregrado Del Pino Johanna Salazar Gustavo

Transcript of Del Pino Johanna Salazar Gustavo. Estudiantes enfrentan semestre a semestre la dificultad de...

Page 1: Del Pino Johanna Salazar Gustavo.  Estudiantes enfrentan semestre a semestre la dificultad de decidir respecto a las materias que pueden tomar  La ESPOL.

Análisis de Métricas de Similaridad Usadas en un

Algoritmo de Filtro Colaborativo Basado en el Usuario Para Recomendar

Materias de Pregrado

Del Pino JohannaSalazar Gustavo

Page 2: Del Pino Johanna Salazar Gustavo.  Estudiantes enfrentan semestre a semestre la dificultad de decidir respecto a las materias que pueden tomar  La ESPOL.

Estudiantes enfrentan semestre a semestre la dificultad de decidir respecto a las materias que pueden tomar

La ESPOL no cuenta con una solución tecnológica que asista a sus estudiantes en esta tarea.

Descripción del Problema

Page 3: Del Pino Johanna Salazar Gustavo.  Estudiantes enfrentan semestre a semestre la dificultad de decidir respecto a las materias que pueden tomar  La ESPOL.

Aportar al desarrollo tecnológico de los servicios informáticos de la ESPOL.

Aprovechar la Información que posee la ESPOL de sus registros para ponerlo al servicio de sus estudiantes.

Aplicar una tecnología innovadora para resolver el problema expuesto.

Motivación

Page 4: Del Pino Johanna Salazar Gustavo.  Estudiantes enfrentan semestre a semestre la dificultad de decidir respecto a las materias que pueden tomar  La ESPOL.

Crear un recomendador de materias basado en el usuario

Adaptar el recomendador de materias para que realice comparaciones de historiales Académicos

Analizar el comportamiento del recomendador de materias con diferentes métricas de similaridad

Análisis de la Solución

Page 5: Del Pino Johanna Salazar Gustavo.  Estudiantes enfrentan semestre a semestre la dificultad de decidir respecto a las materias que pueden tomar  La ESPOL.

Lógica del Recomendador

?ALGEBRA

FISICA

CALCULO

LAB. FISICA

UTILITARIOS

Page 6: Del Pino Johanna Salazar Gustavo.  Estudiantes enfrentan semestre a semestre la dificultad de decidir respecto a las materias que pueden tomar  La ESPOL.

Limitaciones del Recomendador basado en el usuario

ESTUDIANTE A

VECINOS DE AESTUDIANTE BY B TAMBIEN

ESTUDIANTE A ESTUDIANTE B

1 1 1 1 1 2 2

2222

3

3

3

3 3 3

4

4 4

4

4

5 5

5 5

5

5

6 6 6 6 6

67

7

7

7 7

7

Page 7: Del Pino Johanna Salazar Gustavo.  Estudiantes enfrentan semestre a semestre la dificultad de decidir respecto a las materias que pueden tomar  La ESPOL.

Métricas de similaridad

Estudiante A Estudiante B

COEFICIENTE DE SIMILARIDAD DE TANIMOTON(A∩B)

N(A ∪B)=

2

9

Page 8: Del Pino Johanna Salazar Gustavo.  Estudiantes enfrentan semestre a semestre la dificultad de decidir respecto a las materias que pueden tomar  La ESPOL.

Métricas de similaridad

COEFICIENTE DE SIMILARIDAD LOGLIKELIHOOD

Estudiante A Estudiante B

k11

k22

k21k12

Page 9: Del Pino Johanna Salazar Gustavo.  Estudiantes enfrentan semestre a semestre la dificultad de decidir respecto a las materias que pueden tomar  La ESPOL.

Se crean vecindades comparando Historiales Académicos

◦ Se identifican tendencias en la forma de aprobar las materias del flujo de la carrera

Adaptación del Recomendador

Page 10: Del Pino Johanna Salazar Gustavo.  Estudiantes enfrentan semestre a semestre la dificultad de decidir respecto a las materias que pueden tomar  La ESPOL.

Proceso de Recomendación

Page 11: Del Pino Johanna Salazar Gustavo.  Estudiantes enfrentan semestre a semestre la dificultad de decidir respecto a las materias que pueden tomar  La ESPOL.

Proceso de Recomendación (II)

101 6

102 3

103 2

104 2

105 1

106 1

101 6

102 3

103 2

104 2

105 1

106 1

6 1

X 0,5

X = 0,5*6X = 3

Nearest - N Umbral

N = 4

Page 12: Del Pino Johanna Salazar Gustavo.  Estudiantes enfrentan semestre a semestre la dificultad de decidir respecto a las materias que pueden tomar  La ESPOL.

Proceso de Recomendación (III)

Fundamentos deProgramación

Page 13: Del Pino Johanna Salazar Gustavo.  Estudiantes enfrentan semestre a semestre la dificultad de decidir respecto a las materias que pueden tomar  La ESPOL.

Implementación

Page 14: Del Pino Johanna Salazar Gustavo.  Estudiantes enfrentan semestre a semestre la dificultad de decidir respecto a las materias que pueden tomar  La ESPOL.

Pruebas

SimilaridadVecindadEstudianteSemestre

Del segundo al

octavo

N cercanosN=2n ; 0 ≤ n ≤7 Tanimoto

LoglikelihoodUmbral

0.2 ->0.9

Ingreso desde el

2007

Aciertos

Recall

Page 15: Del Pino Johanna Salazar Gustavo.  Estudiantes enfrentan semestre a semestre la dificultad de decidir respecto a las materias que pueden tomar  La ESPOL.

Vecindades de Tipo N Cercanos

Resultados

Semestre 2 Semestre 5

Semestre 8

Page 16: Del Pino Johanna Salazar Gustavo.  Estudiantes enfrentan semestre a semestre la dificultad de decidir respecto a las materias que pueden tomar  La ESPOL.

Vecindades de Tipo Umbral

Resultados (II)

Semestre 2 Semestre 5

Semestre 8

Page 17: Del Pino Johanna Salazar Gustavo.  Estudiantes enfrentan semestre a semestre la dificultad de decidir respecto a las materias que pueden tomar  La ESPOL.

Loglikelihood

Resultados (III) Tanimoto

Page 18: Del Pino Johanna Salazar Gustavo.  Estudiantes enfrentan semestre a semestre la dificultad de decidir respecto a las materias que pueden tomar  La ESPOL.

Adaptación exitosa del recomendador con un valor de acierto de 0.83, métrica Loglikelihood y vecindad N Cercanos de Tamaño 64, similaridad promedio de 0.57, desviación estándar de 0.11

Loglikelihood comportamiento más certero y uniforme. Tanimoto comportamiento variable y acierto bajo en algunos semestres.

Conclusiones

Page 19: Del Pino Johanna Salazar Gustavo.  Estudiantes enfrentan semestre a semestre la dificultad de decidir respecto a las materias que pueden tomar  La ESPOL.

Vecindad de Tipo Umbral obtiene valores de acierto menores a vecindad de tipo N Cercanos

Recomendaciones optimas pero no ideales.

Tiempos de procesamiento por estudiante redondean los 10 seg.

Conclusiones (II)

Page 20: Del Pino Johanna Salazar Gustavo.  Estudiantes enfrentan semestre a semestre la dificultad de decidir respecto a las materias que pueden tomar  La ESPOL.

Encontrar el tamaño de vecindad óptimo dentro del rango [32,128)

Pruebas que midan la efectividad de las recomendaciones en base a decisiones posteriores a consulta

Considerar este trabajo como la base de implementación de una aplicación al alcance de los estudiantes

Recomendaciones

Page 21: Del Pino Johanna Salazar Gustavo.  Estudiantes enfrentan semestre a semestre la dificultad de decidir respecto a las materias que pueden tomar  La ESPOL.

considerar otros factores de criterio como: las notas de los estudiantes, valoraciones de los profesores en el CENACAD, etc.

Las recomendaciones deben ser calculadas de manera previa a la consulta de los estudiantes

Si se desea realizar recomendaciones en tiempo real se debe trasladar el recomendador de materias a un ambiente distribuido

Recomendaciones (II)

Page 22: Del Pino Johanna Salazar Gustavo.  Estudiantes enfrentan semestre a semestre la dificultad de decidir respecto a las materias que pueden tomar  La ESPOL.

Gracias por su atención!