Classe 10 Visió

45
20391: Visió per Computador Apunts de l’assignatura Jordi Vitrià 20391: Visió per Computador 1 Classe 10 Reconeixement d’Objectes (II)

Transcript of Classe 10 Visió

Page 1: Classe 10 Visió

20391: Visió per ComputadorApunts de l’assignatura

Jordi Vitrià 20391: Visió per Computador 1

Classe 10

Reconeixement d’Objectes (II)

Page 2: Classe 10 Visió

20391: Visió per ComputadorApunts de l’assignaturaReconeixement basat en l’aparença

L’aparença...

I si enlloc de guardar característiques o models 3D guardéssim directament una col·lecció de vistes de l’objecte?

Jordi Vitrià 20391: Visió per Computador 2

Com podem emmagatzemar aquesta informació de forma compacta i eficient?

Com podem codificar en aquesta representació informació visual interessant?

Page 3: Classe 10 Visió

20391: Visió per ComputadorApunts de l’assignaturaReconeixement basat en l’aparença

Eina: Reducció de dimensionalitat de les dades originals.

;),,,,(),,,(: 2121 nmyyyxxxT mn <<→ KK

Jordi Vitrià 20391: Visió per Computador 3

... Conservant la informació necessària per a classificar, reconèixer, etc!

I eliminant – o minimitzant – aquella informació que no es rellevant (il·luminació, petites variacions..)

2121 mn

Page 4: Classe 10 Visió

20391: Visió per ComputadorApunts de l’assignaturaReconeixement basat en l’aparença

Eina: Anàlisi de Components Principals (PCA).

Jordi Vitrià 20391: Visió per Computador 4

Page 5: Classe 10 Visió

20391: Visió per ComputadorApunts de l’assignaturaReconeixement basat en l’aparença

Eina: Anàlisi de Components Principals (PCA).

Jordi Vitrià 20391: Visió per Computador 5

Page 6: Classe 10 Visió

20391: Visió per ComputadorApunts de l’assignaturaReconeixement basat en l’aparença

Eina: Anàlisi de Components Principals (PCA).

Jordi Vitrià 20391: Visió per Computador 6

Page 7: Classe 10 Visió

20391: Visió per ComputadorApunts de l’assignaturaReconeixement basat en l’aparença

Eina: Anàlisi de Components Principals (PCA).

ΣΦΦ=Λ t1

2

3

4

Jordi Vitrià 20391: Visió per Computador 7

-9 -8 -7 -6 -5 -4 -3 -2 -1-4

-3

-2

-1

0

Page 8: Classe 10 Visió

20391: Visió per ComputadorApunts de l’assignaturaReconeixement basat en l’aparença

Eina: Anàlisi de Components Principals (PCA).

Passos:1) Obtenir la matriu de covariança de les dades.

Jordi Vitrià 20391: Visió per Computador 8

T

XX=Σ

Page 9: Classe 10 Visió

20391: Visió per ComputadorApunts de l’assignaturaReconeixement basat en l’aparença

Eina: Anàlisi de Components Principals (PCA).

Passos:2) Trobar els eigenvectors v i eigenvalors λ de la matriu Σ.3) Ordenar els eigenvectors segons els seus eigenvalors i quedar-se amb els m primers.4) Crear la matriu V

[ ]mvvvV ||| 21 L=

Jordi Vitrià 20391: Visió per Computador 9

[ ]mvvvV ||| 21 L=

Page 10: Classe 10 Visió

20391: Visió per ComputadorApunts de l’assignaturaReconeixement basat en l’aparença

Eina: Anàlisi de Components Principals (PCA).

Passos:5) Quan tenim una nova dada (o les dades originals), la podem projectar al nou espai:

iTi

xVx =

Jordi Vitrià 20391: Visió per Computador 10

Page 11: Classe 10 Visió

20391: Visió per ComputadorApunts de l’assignaturaReconeixement basat en l’aparença

Exemple: Eigenfaces per reconèixer.

La tasca consisteix en reconèixer la identitat d’una persona (d’entre un conjunt donat de persones).

Jordi Vitrià 20391: Visió per Computador 11

?

?

Page 12: Classe 10 Visió

20391: Visió per ComputadorApunts de l’assignaturaReconeixement basat en l’aparença

Exemple: Eigenfaces.

Necessitem la mitja i els valors propis (eigenfaces) de la matriu de covariança de les cares:

Cara mitja

Jordi Vitrià 20391: Visió per Computador 12

Eigenfaces

Page 13: Classe 10 Visió

20391: Visió per ComputadorApunts de l’assignaturaReconeixement basat en l’aparença

Exemple: Eigenfaces.

Interpretació: Expressem una cara com a combinació lineal de cares.

Jordi Vitrià 20391: Visió per Computador 13

== y1 + y2 + y3

Page 14: Classe 10 Visió

20391: Visió per ComputadorApunts de l’assignaturaReconeixement basat en l’aparença

Exemple: Eigenfaces.

Classificarem a l’espai de dimensió reduïda.

Jordi Vitrià 20391: Visió per Computador 14

Eigenspace projection

Classificació segonsel veí més proper

Page 15: Classe 10 Visió

20391: Visió per ComputadorApunts de l’assignaturaReconeixement basat en l’aparença

Exemple: Eigenfaces.

Si tenim m dades d’aprenentatge de dimensió n, amb m<n, i no podem calcular els vectors propis (la matriu de covariança és de dimensió n x n)!

Jordi Vitrià 20391: Visió per Computador 15

Page 16: Classe 10 Visió

20391: Visió per ComputadorApunts de l’assignaturaReconeixement basat en l’aparença

Exemple: Eigenfaces per detectar.

L’espai definit per les eigenfaces es pot veure com un subespai de l’espai de les imatges. Sempre podem calcular la distància entre qualsevol imatge i aquest subespai! I utilitzar-ho com a criteri per decidir si és una cara o no.

Jordi Vitrià 20391: Visió per Computador 16

Page 17: Classe 10 Visió

20391: Visió per ComputadorApunts de l’assignaturaReconeixement basat en l’aparença

Exemple: Eigenfaces per detectar.

Jordi Vitrià 20391: Visió per Computador 17

Page 18: Classe 10 Visió

20391: Visió per ComputadorApunts de l’assignaturaReconeixement basat en l’aparença

Exemple: Detecció i reconeixement amb Eigenobjectes.

Jordi Vitrià 20391: Visió per Computador 18

Page 19: Classe 10 Visió

20391: Visió per ComputadorApunts de l’assignaturaReconeixement basat en l’aparença

Exemple: Detecció i reconeixement amb Eigenobjectes.

Jordi Vitrià 20391: Visió per Computador 19

Page 20: Classe 10 Visió

20391: Visió per ComputadorApunts de l’assignaturaReconeixement basat en l’aparença

Exemple: Detecció i reconeixement amb Eigenobjectes.

Jordi Vitrià 20391: Visió per Computador 20

Page 21: Classe 10 Visió

20391: Visió per ComputadorApunts de l’assignaturaReconeixement basat en l’aparença

Representacions paramètriques de l’aparença.

Aprenentatge visual de models d’objectes: adquirir un model compacte de l’aparença dels objectes sota diferents poses I il·luminacions.

Jordi Vitrià 20391: Visió per Computador 21

Visual workspace: Each appearance model is parametrized by the variables of the vision task at hand:(a) Object recognition → object pose and illumination parameters.(b) Tracking → the coordinates of the hand-eye system with respect to a moving object.

Page 22: Classe 10 Visió

20391: Visió per ComputadorApunts de l’assignaturaReconeixement basat en l’aparença

Representacions paramètriques de l’aparença.

We define the variables of a vision task as the visual degrees of freedom (DOF):

q=(q1, ..., qm)T

Jordi Vitrià 20391: Visió per Computador 22

1 m

where m is the total number of DOF at work. For any vector q, the vision sensor produces an image vector i.

Page 23: Classe 10 Visió

20391: Visió per ComputadorApunts de l’assignaturaReconeixement basat en l’aparença

Representacions paramètriques de l’aparença.

Images are normalized such that the total energy contained within is unity, and projected in their corresponding eigenspace.The result is a point f j in the eigenspace.The discrete points obtained by projecting all the discrete samples of the workspace can be assumed to lie on a manifold that represents a continuous appearance function.

Jordi Vitrià 20391: Visió per Computador 23

The discrete points can be interpolated using a standard quadratic B-spline interpolation algorithm. The resulting manifold can be expressed as

f(q) = f(q1 ,..., qm )

It resides in a low dimensional space and therefore is a compact representation of appearance as a function of the task DOF q.

Page 24: Classe 10 Visió

20391: Visió per ComputadorApunts de l’assignaturaReconeixement basat en l’aparença

Representacions paramètriques de l’aparença.

The parametric space representation enables us to accomplish object detection in a very efficient manner: looking for the closest point in the appearance manifold and measuring the distance.

Jordi Vitrià 20391: Visió per Computador 24

B-spline

d Projected

point

Visual Task parameters

Page 25: Classe 10 Visió

20391: Visió per ComputadorApunts de l’assignaturaReconeixement basat en l’aparença

Representacions paramètriques de l’aparença.

It can be used for 3D object recognition and pose estimation.

It can also be used for visual servoing: A sizable image window is selected that represents the

Jordi Vitrià 20391: Visió per Computador 25

image window is selected that represents the appearance of the object when the robot is in the desired position. A large set of object images isthen obtained by incrementally perturbing the robot end-effector with respect to the desired position. The appearance manifold in this case represents the mapping between camera image and robot displacement.

Page 26: Classe 10 Visió

20391: Visió per ComputadorApunts de l’assignaturaReconeixement basat en l’aparença

Representacions paramètriques de l’aparença.

Jordi Vitrià 20391: Visió per Computador 26

Page 27: Classe 10 Visió

20391: Visió per ComputadorApunts de l’assignaturaReconeixement basat en l’aparença

Interpretació: Expressem una imatge com a combinació lineal de eigenvectors.

Jordi Vitrià 20391: Visió per Computador 27

Page 28: Classe 10 Visió

20391: Visió per ComputadorApunts de l’assignaturaReconeixement basat en l’aparença

Representacions paramètriques de l’aparença.

Jordi Vitrià 20391: Visió per Computador 28

Page 29: Classe 10 Visió

20391: Visió per ComputadorApunts de l’assignaturaReconeixement basat en l’aparença

Representacions paramètriques de l’aparença.

Jordi Vitrià 20391: Visió per Computador 29

Page 30: Classe 10 Visió

20391: Visió per ComputadorApunts de l’assignaturaReconeixement basat en l’aparença

Representacions paramètriques de l’aparença.

Jordi Vitrià 20391: Visió per Computador 30

Page 31: Classe 10 Visió

20391: Visió per ComputadorApunts de l’assignaturaReconeixement basat en l’aparença

Representacions paramètriques de l’aparença.

Jordi Vitrià 20391: Visió per Computador 31

Page 32: Classe 10 Visió

20391: Visió per ComputadorApunts de l’assignaturaReconeixement basat en l’aparença

Representacions paramètriques de l’aparença.

Jordi Vitrià 20391: Visió per Computador 32

Page 33: Classe 10 Visió

20391: Visió per ComputadorApunts de l’assignaturaReconeixement basat en l’aparença

Representacions paramètriques de l’aparença.

Jordi Vitrià 20391: Visió per Computador 33

Page 34: Classe 10 Visió

20391: Visió per ComputadorApunts de l’assignaturaReconeixement basat en l’aparença

Representacions paramètriques de l’aparença.

Jordi Vitrià 20391: Visió per Computador 34

Page 35: Classe 10 Visió

20391: Visió per ComputadorApunts de l’assignaturaReconeixement basat en l’aparença

Representacions paramètriques de l’aparença.

Jordi Vitrià 20391: Visió per Computador 35

Page 36: Classe 10 Visió

20391: Visió per ComputadorApunts de l’assignaturaReconeixement basat en l’aparença

Representacions paramètriques de l’aparença.

Jordi Vitrià 20391: Visió per Computador 36

Page 37: Classe 10 Visió

20391: Visió per ComputadorApunts de l’assignatura

Eigenspaces for Navigation

Visual navigation requires fast and robust perception. Traditional reconstruction approaches have not provided and adequate solution for navigation.

Appearance-based vision techniques provides an alternative approach by defining simple processes which transform images

Reconeixement basat en l’aparença

Jordi Vitrià 20391: Visió per Computador 37

approach by defining simple processes which transform images into commands for displacement and steering and corrections to estimated position and orientation.

Page 38: Classe 10 Visió

20391: Visió per ComputadorApunts de l’assignatura

Eigenspaces for Navigation

ć�ǩ� Task :

Navigate from home position to an office in the first floor of our building.

The environment is

Reconeixement basat en l’aparença

Jordi Vitrià 20391: Visió per Computador 38

Pćō�PPṭǩ�ĀṭPṭō�ṣ

structured and stable, but not static.

Page 39: Classe 10 Visió

20391: Visió per ComputadorApunts de l’assignatura

Eigenspaces for Navigation

Reconeixement basat en l’aparença

Jordi Vitrià 20391: Visió per Computador 39

Page 40: Classe 10 Visió

20391: Visió per ComputadorApunts de l’assignatura

Eigenspaces for Navigation

Goal

Reconeixement basat en l’aparença

Jordi Vitrià 20391: Visió per Computador 40

Start

Page 41: Classe 10 Visió

20391: Visió per ComputadorApunts de l’assignatura

Eigenspaces for Navigation

Reconeixement basat en l’aparença

Jordi Vitrià 20391: Visió per Computador 41

Page 42: Classe 10 Visió

20391: Visió per ComputadorApunts de l’assignatura

Eigenspaces for Navigation

Reconeixement basat en l’aparença

Jordi Vitrià 20391: Visió per Computador 42

Page 43: Classe 10 Visió

20391: Visió per ComputadorApunts de l’assignatura

Eigenspaces for Navigation

Reconeixement basat en l’aparença

Jordi Vitrià 20391: Visió per Computador 43

Page 44: Classe 10 Visió

20391: Visió per ComputadorApunts de l’assignatura

Eigenspaces for Navigation

Reconeixement basat en l’aparença

Jordi Vitrià 20391: Visió per Computador 44

Room 1

Room 2Room 3

Page 45: Classe 10 Visió

20391: Visió per ComputadorApunts de l’assignatura

Exemple : Reconeixement de cares en temps real.

Jordi Vitrià 20391: Visió per Computador 45