Construcción en línea e incremental de Diccionarios Visuales

Post on 04-Jul-2015

287 views 1 download

description

Los diccionarios visuales son una de las herramientas que se utilizan para resolver los problemas relacionados con reconocimiento de clases (objetos o escenas) en visión por computador. Normalmente se crea un diccionario visual para un problema en particular y un grupo de clases. El proceso de creación del diccionario visual necesita de un periodo de aprendizaje para seleccionar las palabras visuales. Este aprendizaje, se vuelve una limitación cuando tenemos muchas clases de donde obtener las palabras visuales, o cuando queremos agregar una nueva clase a nuestro grupo actual de clases, dado que necesitaremos volver a crear el diccionario visual. Se presenta un algoritmo basado en técnicas de aprendizaje máquina, que permite crear diccionarios y además agregar nuevas clases sin necesidad de volver ejecutar el aprendizaje completo nuevamente.

Transcript of Construcción en línea e incremental de Diccionarios Visuales

CONSTRUCCIÓN EN

LÍNEA E INCREMENTAL

DE DICCIONARIOS

VISUALES

Cristóbal Rojas

Profesor Guía: Álvaro Soto

26 de octubre de 2012

Motivación

• Visión por computador, clasificación

• Escenas y objetos en imágenes

• Técnicas usadas

Diccionario Visual

• Visión por Computador

BoW (Bag of Word)

• Usado en Text Mining

• Queremos clasificar textos (según sus temas)

• Uso de Bag of Word (BoW)

Bag of Word

• Usando BoW para clasificar

Bag of Word

• Diccionario y representación usando BoW

Bag of Word

• ¿Basta solo con la representación BoW?

• Necesitamos un algoritmo de clasificación

ML (Machine Learning)

Diccionario Visual

• Palabras Visuales

• BoW

Palabras Visuales

Palabras Visuales

BoW

BoW

Diccionario Visual

• ¿Cómo formamos el BoW?

• Matching de puntos de interés

Matching de puntos de interés

• Actualmente es tratado como un problema de

clasificación de múltiples clases.

• Lepetit et al. (2005)

Randomized Tree for Real –Time

Keypoint Recognition

• Matching de puntos de interés, problema de clasificación

• Usa Random Forest

Randomized Tree for Real –Time

Keypoint Recognition

• Set de entrenamiento

Randomized Tree for Real –Time

Keypoint Recognition

Pregunta de Investigación

• ¿Podemos construir un algoritmo de matching de puntos

de interés que funcione en línea?

Propuesta

• ¿Podemos crear un diccionario visual que se pueda

actualizar en línea?

• ¿Qué necesitamos para permitir que esto ocurra?

Propuesta

• Buscamos Clasificador de múltiples clases que funcione

en línea

• ECOC

ECOC (Error Correcting Output Codes)

• Clasificador de múltiples clases.

• Separa el problema en muchas clasificaciones binarias.

• Un código ternario a cada clase

• Codificación, Decodificación, Matriz de códigos.

Matriz con Códigos

• Columnas como particiones y tantas filas como clases,

esta formada por 0, 1 y -1

Codificación

• Etapa que genera los códigos de cada clase.

• Existen diversas formas de realizar esta tarea

ECOC: Decodificación

• Etapa de inferencia

• Distintos métodos

ECOC online

• Podemos incluir clases al clasificador sin necesidad de

reentrenar todo el clasificador

ECOC online

Propuesta

• Construir sistema de Matching de puntos clave usando un

clasificador ECOC

Set de entrenamiento

• Datos de lugares del DCC

• Usando SIFT para encontrar puntos de interés

Set de entrenamiento

• Crear Set de clases de los puntos de interés usando

homografías

Codificación

• One vs One

Decodificación

• Weighted decoding

Limitaciones

• Complejidad (tiempo-espacio)

Pasos a seguir

• Terminar de formular un clasificador que puede agregar

puntos de interés de manera online

• Construir el algoritmo que permita verificar si un punto es

nuevo o no

CONSTRUCCIÓN EN

LÍNEA E INCREMENTAL

DE DICCIONARIOS

VISUALES

Cristóbal Rojas

Profesor Guía: Álvaro Soto

26 de octubre de 2012