Clasificación Jerárquica de Objetos en Imágenes

Post on 04-Jul-2015

822 views 1 download

description

El reconocimiento de objetos en imágenes es un tema de alto interés científico y práctico. En aplicaciones de interfaz humano-computador, vigilancia, robótica, entre otros, el módulo principal de procesamiento se compone de un identificador de los objetos de interés dentro de la escena, para que un algoritmo pueda razonar y ejecutar acciones útiles dependiendo de los objetos encontrados. Siendo un campo abierto en visión por computador, ha sido abordado en general por enfoques holísticos, donde se describe a la imagen completa, o en esquemas basado en pequeñas partes, ambos exitosos dependiendo de dónde sean aplicados, pero con problemas en imágenes más desafiantes. Se presenta un método que une las bondades de ambos enfoques, basado en técnicas de aprendizaje de máquina, donde en forma conjunta se encuentran las partes relevantes de las imágenes y cómo usar estas partes para conformar un clasificador de objetos a un nivel más alto.

Transcript of Clasificación Jerárquica de Objetos en Imágenes

CLASIFICACIÓN JERÁRQUICA DE IMÁGENES

Iván Lillo Vallés

Profesores supervisores: Domingo Mery – Álvaro SotoViernes 28 de septiembre de 2012

1

Pontificia Universidad Católica de ChileDepartamento de Ciencias de la Computación

Contenido

Motivación

Enfoques

Propuesta

Resultados preliminares

Trabajo futuro

Conclusiones

2

3

¿Para qué detectar objetos en imágenes?

Inspección

Vigilancia

Navegación

Interacción

Diversión

4

¿Para qué detectar objetos en imágenes?

5

¿Para qué detectar objetos en imágenes?

6

¿Para qué detectar objetos en imágenes?

© Google

http://techtalks.tv/talks/self-driving-cars/56391/

Contenido

Motivación

Enfoques

Propuesta

Resultados preliminares

Trabajo futuro

Conclusiones

7

8

Aprendizaje de máquina (Machine Learning)

BD entrenamiento

Algoritmo de aprendizaje

• Sesgo – conocimiento previo• Espacio de hipótesis• Esquema de búsqueda

Evaluación

Tarea

9

Aprendizaje de máquina (Machine Learning)

Algoritmo de aprendizaje

• Sesgo – conocimiento previo• Espacio de hipótesis• Esquema de búsqueda

Sesgo

• Descripción• Esquema• Relaciones

Espacio de hipótesis

• Cómo uso los datos• Esquema de clasificador

Esquema de búsqueda

• Optimización• Exhaustiva• Greedy

10

Aprendizaje de máquina (Machine Learning)

Sesgo

• Descripción• Esquema• Relaciones

Detección de personas

HoG denso, con traslape (holístico)

Dalal & Triggs, CVPR 2005

11

Aprendizaje de máquina (Machine Learning)

Sesgo

• Descripción• Esquema• Relaciones

Detección de personas

Partes con patrones repetitivos: Poselets

Bourdev et al, ECCV 2009

12

Aprendizaje de máquina (Machine Learning)

Sesgo

• Descripción• Esquema• Relaciones

Detección de objetos

Información característica: objeto + pocas partes : Object detector de Felzenszwalb

Felzenszwalb et al, 2010

13

Aprendizaje de máquina (Machine Learning)

Sesgo

• Descripción• Esquema• Relaciones

Clasificación de escenas

Información característica: pequeñas partes (patrones) repetitivos en las imágenes (diccionario visual)

14

Aprendizaje de máquina (Machine Learning)

Sesgo

• Descripción• Esquema• Relaciones

Clasificación de escenas

Información característica: pequeñas partes (patrones) repetitivos en las imágenes (diccionario visual)

15

Aprendizaje de máquina (Machine Learning)

Espacio de hipótesis

• Cómo uso los datos• Esquema de clasificador

MODELO

Lineales

No lineales

ÁrbolesRedes

neuronales

FUNCIÓN X Y

16

Aprendizaje de máquina (Machine Learning)

BD entrenamiento

Algoritmo de aprendizaje

• Sesgo – conocimiento previo• Espacio de hipótesis• Esquema de búsqueda

Evaluación

Tarea

Contenido

Motivación

Enfoques

Propuesta

Resultados preliminares

Trabajo futuro

Conclusiones

17

18

PROBLEMAS

Datos no estructurados Holístico

19

PROBLEMAS

Modelos de partes Anotaciones (poselets)

Sesgo (object detector Felzenszwalb)

Disjunción partes/clasificación

20

¿Es posible encontrar partes sin supervisión y que sean discriminativas?

Sin anotaciones

Útiles para clasificar

Sin sesgo que limite la búsqueda

Aprendizaje conjunto

21

Aprendizaje conjunto

PARTES

CLASIFICADORES CONSIDERANDO LAS PARTES

22

Aprendizaje conjunto

PARTES CLASIFICADORES CONSIDERANDO LAS PARTES

Regiones de imagen

Multiescala

Formas

Clasificadoreslineales

Puntaje (score) por cada región

23

Puntaje (score) para la imagen

Aprendizaje conjunto

PARTES CLASIFICADORES CONSIDERANDO LAS PARTES

Asignaciones de cada región

24

Regiones VectoresImagen

N regionesi = 1,…, N

fi describe región i

25

K partes

K clasificadores lineales (vectores)

L categorías

L clasificadores lineales (vectores)

Región i asignación 1,...,iz K

w

Descriptor: histograma de asignaciones ( )h z

Asignaciones unen partes y categorías

26

1

, ,i

NT T

y z i

i

E y

x z α h z w f

E° configuración

Definición de energía (score) por imagen

Score clasificadorimagen

Score partes contenidasen imagen= +

Imagen

Categoría

Asignaciones

Clasificadorcategoría

Histogramaasignaciones Clasificador

asignación zi

Descriptor región i

27

Tarea

E° configuracióncorrecta

E° configuraciónincorrecta>

1

, ,i

NT T

y z i

i

E y

x z α h z w f

, , , , ,j j j j i iE y E y i j x z x z

28

Búsqueda de parámetros optimización

, , , , ,j j j j i iE y E y i j x z x z

, , , ,j j j j i iE y E yx z x z , ,j i iy y z0 i j

2

21

L

l

l

αmin2

21

K

k

k

w

sujeto a

1

M

j

j

j

1 2 3

, 0j

29

Datos de entrada

M imágenes (xj ,yj), j = 1,…,M

Nj parches por imagen

Se busca

l, l = 1,…,L

wk, k = 1,…,K

zj, j = 1,…,M

30

Inferencia

* *

1,..., 11,...,

, arg maxN

T

i yk k ik K iy L

y z

w f

Dada imagen x, inferir categoría

31

Estimación inicial w0 , z0

Estimación |w, z

Actualizo z| ,w

Actualizo w| ,z

Estimación de parámetros

1

, ,i

NT T

y z i

i

E y

x z α h z w f

32

Estimación |w, z

Estimación de parámetros

, , , ,j j j j i iE y E yx z x z , ,j i iy y z i j

2

21

L

l

l

αmin

sujeto a

j

11

M

j

j

3

, 0j

33

Actualizo z| ,w

Estimación de parámetros

1

, ,i

NT T

y z i

i

E y

x z α h z w f

*

1,..., 1

arg maxN

T

i ys s is K i

z

w f

34

Actualizo w| ,z

Estimación de parámetros

, , , ,j j j j i iE y E yx z x z , ,j i iy y z i j

min

sujeto a

j

2

21

K

k

k

w1

M

j

j

2 3

, 0j

35

Estimación inicial w0 , z0

Estimación |w, z

Actualizo z| ,w

Actualizo w| ,z

Estimación de parámetros

Parámetros estimados

Contenido

Motivación

Enfoques

Propuesta

Resultados preliminares

Trabajo futuro

Conclusiones

36

37

Caltech-4 (crops)

4 categorías

K = 200 (partes)

Esquema piramidal consistencia espacial

50% datos entrenamiento / 50% prueba

99.93% rendimiento (1 error de 1500 imágenes)

38

airplanes_side

faces motorbikes_side

cars

39

airplanes_side

faces motorbikes_side

cars

40

41

42

15 scenes categories

15 categorías

K = 750 (partes)

Esquema piramidal consistencia espacial

100 datos entrenamiento / resto prueba

78% rendimiento (81% estado del arte)

43

bedroom suburb industrial kitcken livingroom

coast forest highway inside_city mountain

open_country street tallbuilding office store

44

open_country

bedroom

suburb

industrial

kitcken

livingroom

coast

forest

highway

inside_city

mountain

street

tallbuilding

store

office

Contenido

Motivación

Enfoques

Propuesta

Resultados preliminares

Trabajo futuro

Conclusiones

45

46

Mejorar modelo

Nivel intermedio jerarquía partes/objetos

Planteamiento y resolución

Partes variables, multiescala

Nuevas pruebas y bases de datos

Publicar

Contenido

Motivación

Enfoques

Propuesta

Resultados preliminares

Trabajo futuro

Conclusiones

47

48

Esquema jerárquicoposee ventajas

Aprender partesdiscriminativas

Necesidad: mejoresformulaciones y procedimientos

Por mejorar: overfitting