Optimización de una Medida de Semejanza para … · de semejanza de objetos o figuras...

Computación y Sistemas Vol. 3 No.4 pp. 274 -286@ 2000, CIC -IPN. ISSN 1405-5546 Impreso en México

Optimización de una Medida de Semejanza para Objetos

Tridimensionales a Partir de Invariantes y Transformaciones

Hermilo Sánchez

Departamento en Ciencias de la ComputaciónInstituto de Investigaciones en Matemáticas Aplicadas y en Sistemas

Universidad Nacional Autónoma de MéxicoApdo. Postal 20- 726 Admon. No.20.

Delegación Alvaro Obregón.CP: 01000.

Ciudad Universitaria, D.F. México

[email protected]

Artículo recibido elB de noviembre. 1999: acevtado el2 de marzo. 2000

Resumen1 Introducción

Uno de /os prob/emas actua/es dentro de visión porcomputadora es e/ reconocimiento de /a forma de /osobjetos o figuras tridimensiona/es. En éste trabajo sepropone /a optimización de un método para /ograr esteobjetivo. Para e//o se uti/izan ros invariantes y /a teoríade gráficas que permiten //evar a cabo /a transformaciónde objetos irregu/ares de representación binaria y medirsu semejanza. Para obtener e/ parecido se presentancuatro invariantes para objetos tridimensiona/es; seobtiene e/ trabajo mínimo en su transformación a/ usar/a teoría de gráficas. En /a parte de asignación óptima y,como parte importante de/ reconocimjento después de/cá/cu/o de invariantes, se presenta e/ a/goritmo húngaro,que permite hacer dicha transformación de maneraóptima y obtener así una buena medida de semejanza.

Palabras clave: Medida de semejanza, slgoritmohúngaro, invariantes, momentos centrales, gráficasbipartitas, camino extendido, trabajo, ceros

independientes, apareo óptimo.

El objetivo del presente trabajo es optimizar una medidade semejanza de objetos o figuras tridimensionalesirregulares. El gasto o trabajo realizado en medir lasemejanza de las figuras debe ser el menor posible.

Para representar a nuestras figuras tridimensionales, seemplea la voxelizaciónl.

Como parte del proceso de reconocimiento de la forma,a través de la medida de similitud, se propone utilizarcuatro invariantes bajo transformaciones de traslación,cambio de escala y rotación. Para ello se hace un estudiode los momentos centrales. De esta manera se verá que elcálculo de los invariantes así como la transformación delos objetos permitirá obtener una medida de semejanza

óptima.Sobre el reconocimiento de la forma de objetos

tridimensionales, hasta ahora han existido algunosautores que han aplicado diferentes técnicas para lograrsu propósito, tales como Besl(1988), Besl & lain(1985),lain (1989), Boyse (1979), Brooks (1983) y Dickinson,Pentland & Rosenfeld (1992), entre otros, quienes basansus métodos de reconocimiento en el uso de primitivas,es decir, ciertas figuras geométricas que sirven comounidades para conformar a los objetos, tales como conos,conos truncados, cilindros, elipsoides, etc.

Otro tipo de técnica que se ha utilizado para representarla superficie de un sólido, es a través de curvas digitales(lonas and Kiryati, 1997). Sobre descripción de

IRepresentar a un objeto mediante voxels. Un voxel es un elemento devolumen representado por el vector: [propiedades, posición] donde laspropiedades son las características del voxel, tales como brillo, color,intensidad, densidad, etc. La posición esta dado por las coordenadasespaciales (x,y,z). Ver Ballard & Brown(1982).

Hermilo Sánchez: Optimización de una Medida de Semejanza para Objetos Tridimensionales...

Los momentos centrales son invariantes bajo translaciónal tener la siguiente transformación de coordenadas:

superficie de cuerpos sólidos a través de propiedades deinvariancia se puede ver a Cohen & Wang (1994).Sin embargo el método planteado en este trabajo se basa

en las ideas iniciadas por Bribiesca (1995), quien defmeuna métrica y una medida de similitud, susceptibles deaplicarse para la transformación de figurastridimensionales irregulares y no solo figuras regulares,como lo han venido haciendo los autores anteriores. Eneste artículo se logra optimizar el método de Bribiesca.

x' = x + a

y' = y + 13 con a y 13 constantes

7Los momentos dados por la siguiente relación:

(3)

.Upq J.lpq=

2 Teoría de los Invariantes .u ' (p+q)/2+1 .u (p+q)/2

2.1 Interpretación de loS Invariantes con p + q = 3,4, (4)

donde

.u = 1/ p(x,y) dxdy(5)

son invariantes bajo cambio de escala al tener lasiguiente transfonnación de coordenadas:

Considérese un objeto geométrico S en el espacio X. Sesupone un grupo de transformaciones admisibles G queactúa en el espacio X. Un invariante escalar de un objetoS es una cantidad que no cambia su valor cuando elobjeto S sufre cualquiera de las transformacionesadmisibles (tales como una rotación, traslación o biencambio de escala).

Supóngase que el objeto S tiene invariantes escalaresIl,I2,...,In. Considérese S'. Si S' se obtiene al transformarapropiadamente al objeto S usando transformacionesadmisibles, los valores de estos invariantes escalaresdeben ser idénticos. Sin embargó, en general, lo contrariono es cierto. Para ello se necesita la siguiente definición.

Definición: se dice que un conjunto de invariantes esuna base invariante si la coincidencia de invariantesescalares para dos objetos implica la existencia de unatransformación admisible que mapea uno al otro(Kanatani, 1990). Se sigue, entonces, que paratransformar a dos objetos es necesario calcular primerosus invariantes.

(6)x'=ax

y'=ay con a constante

2.3 Momentos Invariantes Ortogonales

Bajorotación se tiene:

transformaciones ortogonales deo

x

(7)y

2.2 Momentos CentralesCon el álgebra de invariantes, se llega a los 7 invariantesortogonales, los cuales fueron dados por primera vez porHu (1962):

Sea p ( x, y) ~ o una función real y acotada, definida en

una región !Jí'. Los momentos bidimensionales de orden

(p+q) se definen como:

I/xPy(jp dxdympq x tjJl = .U20 + .UO2, (8)

tjJ 2 = (.u20 -.UO2)2 + 4.u112 .

tjJ3 = (.U30 -3.u12)2 + (3.u21- .UO3)2.

tjJ4 = (.u30 + .U12J2 + (.u21 + .UO3)2.

tjJ 5 = (.U30 -3 .u 12J (.u30 + .U12)[(.u30 + .U12J2 -

.uo3;2] + (3.u21- .UO3)(.U21 -.UO3) [ (.u30

+ .u 12J2 -(.u21 + .UO3)2] ,tjJ 6 = (.U20 -.uo2J [ (.u30 + .U12J2 -(.u21 + .UO3)2] +

4.ull (.U30 + .U12) (.U21 + .UO3).

I)

91

Por otro lado, los momentos centrales bidimensionales

.Upq se definen como: 3<1121 +

.Upq = II (x-I';)P (y -1J)q p (x, y) dxdy

91

(2)donde ~ = m¡Jmoo,

p,q E N

11 = mol /m, y


Al considerar esta transfonnación de coordenadas y

utilizarlas en (12), se llega a que

rjJ 7 = (3.u21 -.UOJJ (.U30 + .U12J [(u30 + .U12J2 -3(u21

+ .UO3)2] -(u30 -3.u12J (u21 + .UO3)[3(u30 + .U12J2 -

(u21 + .uo3;2],, -p+q+r+3

'Upqr -a 'Upqr,.

Los momentos invariantes ortogonales absolutos, dados

por (8) pueden utilizarse directamente para identificar un

patrón independientemente de la posición y cambio de

escala.

Si p = q = r = O, tenemos que .u ' ooo=aJ .uOOO

Sea .uOOO = .u, entonces, de (15) y (16) se tiene el

siguiente invariante nonnalizado:

2.4 Análisis.u pqr

.u ' (p+q+r)/3+ 1Los momentos centrales en tres dimensiones se puede

definir como

=I1pqr

11 (p+q+r)/3+ 1 ,

con p + q + r = 3,4,.Upqr = II/ ( x-.;) P( y -17 ) q( z -c;)r p ( x,y,z ) dxdydz,

9lEl cual es invariante bajo cambios de escala. (Ver

Figura 1 y el apéndice, donde se muestran los valoresnuméricos calculados de los invariantes en traslación ycambio de escala, asi como el centro de masa de cada

objeto).

donde p,q,r � N. (9)

Sea p(x,y,z)=l, pues aquí no importarán lascaracterísticas de la imagen, tales como sus intensidadesde brillo, de color, etc. sino solo la posición de losvoxels. La ecuación anterior se reduce a

J.lpqr = /ff (x-~)P(y -17 )q( z -t;)r dxdydz,

!Ji(10)

.Ningún autor hasta ahora ha deducido invariantes en3-D utilizando el método de Hu.

.Se propondrá en este artículo utilizar los centros demasa y los ejes mayores de los objetos (que pasen por elcentro de masa) como los invariantes bajo rotación.

donde p.q,r � N .

En el caso discreto, la ecuación anterior se puedeescribir como --9

-9:::Jlpqr = LLL ( Xi-; )P( Yj -17 )q( zk -I;" )r ~Xi~Yj~Zk.

(11)x y z

Si se piensa en los voxels como cubos de lado unitario,

entonces Axj=Ayj=Azk=l. Así que la ecuación anterior

queda simplemente como

a)

.Upqr = LLL ( xi-I;)P( Y) -1] )q( zk -t;y, (12)x y z

la cual es invariante bajo traslación, al considerar la

siguiente transformación: 9x' = x + a

y' = y + 13 con a, 13 y y constantes.

z' = z + y.

Bajo cambio de escala se

transformación:

b)(13)

utiliza la siguienteFigura 1: a) Al aplicar una traslación sobre la figura (un

nueve), los momentos centrales se mantienen invariantes.b) Al aplicar un cambio en la escala, la ec. 4) se mantiene

invariante (ver apéndice para valores numéricos).x' =ax

y' =ayz' =az.

con a constante

(14)


3 Gráficas,

OptimaBipartitas Asignación 3.6 Problema de Asignación Óptimay

A continuación se presenta una introducción a la teoría degráficas para enseguida estudiar el algoritmo húngaro, basede la optimización de la medida de semejanza, propuestopor Bribiesca (1995).

3.1 Teoría de Gráficas

Una gráfica es un conjunto fmito, no vacío, compuestode un conjunto de vértices V. Sea E el conjunto de parejas(aristas) de la forma {u,v}. Una gráfica puede defmirsesimplemente a través de los conjuntos V y E como G =

G(v; E) (Chartrand, 1985).

Existe un método llamado método Húngaro (Bondy, 1976)(que es el método clásico), que pu~de encontrar apareos

perfectos.El problema de Asignación Óptima que se considerará

consiste en que la suma de las distancias que los voxels queconforman a un objeto tienen que recorrer, paratransformarlo en otro objeto, sea la menor de todas las

posibilidades.Sea una gráfica bipartita pesada completa con bipartición

(X;}), donde X={xl' x2, ...,xJ, y = {Y¡'Y2'...'YJ. El

conjunto X puede representar al conjunto de voxels de unobjeto a transformar Y el conjunto Ya los voxels del objetotransformado. Las aristas {Xi.Yj} tienen un peso Wjj =

W(XiYJ.En esta gráfica pesada, se debe encontrar un apareo

perfecto de peso mínimo, es decir, un Apareo Óptimo.3.2 Pesos en las Aristas

x y

)y¡X¡

X2 )y2

A cada arista de una gráfica G, se asocia un número realw(e), al cual se llamará su peso. En este sentido a G se lellama gráfica pesada.

Si H es una subgráfica de o, el peso w(H) de H es lasuma de los pesos de las aristas de H: ¿ w(e), donde

eEE(H).Cuando se desea que la suma de los pesos de las aristas

que conforman una subgráfica H sea la menor, estasubgráfica debe ser conectada y acíclica. .En este caso seobtiene un spanning tree de peso mínimo.

El peso mínimo de una gráfica es aquel tal que w(H) = ¿

w(e) sea el menor de todas las subgráficas conectadas de o.x

3Y3

3.4 Gráficas BipartitasX4( y+

Una gráfica G(V,E) es bipartita si existe una partición delos vértices en dos conjuntos U y V, tales que si (u, v) está

enEimplicaqueuEU y vEV(oalrevés).Figura 2: Un apareo óptimo, dado por las aristas remarcadas en

negro.

Bondy y Murty (1976), presentan un algoritmo queresuelve el problema de asignación al encontrar un apareoóptimo de peso máximo. Gould encuentra el apareo óptimode peso mínimo basado en el a[goritmo húngaro.

3.5 Apareo

Sea M ~ E un subconjunto de aristas de la gráfica G, elcual es llamado apareo en G si cada uno de sus vértices sonadyacentes a, a lo más, una arista de M. Se dice que unapareo M satura a un vértice v, que sea extremo de unaarista en M, entonces v está saturado si alguna arista de Mes adyacente a v, de otra forma, ves no saturado. Si todoslos vértices de G son M-saturados, el apareo M es perfecto.

Sea M un apareo en G, un camino alternante en G es uncamino cuyas aristas están alternativamente en E\M y en M.Un camino extendido es un camino alternante cuyo inicio yfinal no están saturados.

3.7 Algoritmo Húngaro

Sea el peso de un apareo M dado por W(M) = L w(e), eEM.

Una solución óptima es un apareo perfecto con W(M) comomínimo.I. Se representa a la gráfica bipartita en forma de matriz

de tamaño n x n, U = [Wij].

2. Minimizar la matriz de la siguiente manera:

Hermilo Sánchez: Optimización de una Medida de Semejanza para Objetos TridimensionaJes...

~YIXI0--0YI XI(

~X2~Y2

) Y2

)

X2

XJ YJ

X~ y~

vb)a)

Figura 3: a) Gráfica bipartita con vértices adyaoentes querepresentan los ceros de la matriz. b) Gráfica con un apareo

arbitrario elegido.

-Elegir el valor más pequefio de cada renglón y restarlo a

ese renglón.-Elegir el valor más pequefio de cada columna y restarlo a

esa columna.3. Al encontrar n ceros independientes, esto es, se etiquetann ceros, tales que no haya otro cero (etiquetado) en elrenglón y columna. Se seleccionan los númeroscorrespondientes a estos ceros en la matriz como solución.4. Sin embargo, la gráfica inicial puede ser tal que alminimizarla por primera vez no se puedan encontrar nceros independientes. Entonces, se marcan los renglonesy/o columnas que contengan ceros. La idea es "cubrir"todos los ceros (se utilizará el menor número de líneasposibles para marcar los ceros).5. Encontrar el número más pequefio, min, que esté en lasubmatriz, es decir que no esté en ninguno de los rengloneso columas marcados.6. a) Restar min a las columnas y renglones de lastiÉmatriz. b) Sumar min a los pesos que están doblemente

marcados.7. Enseguida una función (o rutina) checa si se puedenencontrar n ceros independientes. Si es así, el algoritmotermina satisfactoriamente y se llega a un apareo óptimo. Sino, se va otra vez al paso 4.8. Se suman los valores que estaban en la matriz original enla posición de los ceros independientes de la última matrizmodificada, obteniendo el valor buscado W(M). IZI

2.- Se toma un vértice raíz x de la gráfica bipartita.3.- A partir de este vértice raíz se van buscando todos loscaminos altemantes posibles.4.- Se repite el paso anterior con los vértices x's para losque las y's estaban saturadas.5.- Si alguna y no encuentra su respectiva x para sersaturada. entonces se ha encontrado un camino extendido.6.- Si hay otra x que no esté saturada (raíz) regresar a 3. Delo contrario se detiene el programa y se construye un nuevo

apareo M al usar el camino extendido. en el que seintercambian las x adyacentes a las y's que no estaban en el

apareo M anterior por un apareo nuevo (M). y viceversa. sesacan del apareo anterior la x-y que se encontraban bajo M.De esta manera se ha encontrado un apareo perfecto. es

decir un apareo óptimo.7.- Si nunca se encontró el camino extendido. regresar al

paso 1.En la figura 4 se muestra que el camino dado por

X4.Y2.X2.y4 es el camino extendido buscado.

El algoritmo presentado en este capítulo y que solucionael probl~ma de encontrar el peso mínimo en latransformación de los objetos se conoce como algoritmoHúngaro. La versión original (en la que no se habla demarcar los ceros como lo hace Gould, 1988) se debe a

Konig (1931) y Egerváry (1931).Una forma de implementar el algoritmo anterior de

manera eficiente es utilizando e11lamado Árbol Húngaro. camino extendido

/

Árbol Húngaro3.8

X2Una vez que se aplica el algoritmo Húngaro a la matrizoriginal, queda una matriz con posibles cerosindependientes, para buscarlos, se procede a construir alllamado árbol húngaro, y posteriormente se busca elllamado camino húngaro dado por un camino extendido.

J X3

Y3Y2

X21

Y2 ~y

X4

~

X4

'0

X4

Figura 4. Árbol húngaro y camino extendido.

1.- Para construir el árbol húngaro se visitan los ceros de la

matriz y se elige un apareo cualquiera.La figura 3 a) muestra el apareo obtenido a partir de los

ceros encontrados y la figura 3 b) la elección de un apareo

arbitrario.Así, el nuevo apareo queda como en la figura 5

Hermilo Sánchez: Optimización de una Medida de Semejanza para Objetos Tridimensionales.

XI0--0YISea Fi (la fuerza para mover los voxels) constante e igual a1 (un Newton o una dina, por ejemplo). Por el momento noimportará la masa de los voxels o la fricción que podría"obstaculizar" su movimiento. De manera que el trabajototal para transformar a los dos objetos será:

"w = L Si = D

i=1(en unidades de trabajo )

4 Transformación de un Objeto aOtro

Por tanto, el valor numérico del trabajo será, en esteartículo, igual a la distancia total recorrida. En general estono debe ser cierto, sin embargo para el propósito de esteartículo esto no traerá consecuencias negativas.

Para encontrar el trabajo al transformar dos objetos A yB:

En este capítulo se defmirá un concepto 'muy importante, eltrabajo. Debido a que en la transformación de un objeto aotro se tienen qu~ mover voxels, entonces se debe realizarun cierto trabajo al hacer dicha operación, Se verá que elvalor numérico del trabajo total (por haber movido losvoxeIs en la transformación) coincide numéricamente conla distancia recorrida total de los voxels involucrados en latransformación.

1.- Se superponen los dos objetos A y B. Esto es, una vezque son invariantes en escala (mismo número de voxels,todos del mismo tamaño) se hace una traslación de losobjetos de manera que coincidan sus centros de masa y susejes de simetría.

Al llevar a cabo la superposición, existen voxels que soncomunes a los dos objetos. Se debe considerar a losconjuntos Ia<r,c,k) e Ib(r,c,k) (donde (r,c,k) son lascoordenadas cartesianas de los voxels) que representan laimagen binaria 3-D de los cuerpos A y B respectivamente.

La superposición de los objetos, se define como laimagen binaria dada por el conjunto4.1 Trabajo Requerido para Transformar

a los ObjetosIs(c,r,k) = IA(r,c,k) n IB(r,c,k)

En la transformación, cada voxel se mueve de la posiciónX(Xl'X2'XJ) a la posición Y(YI'Y2'YJ)' lo que requiere de untrabajo realizado. De la física clásica el trabajo dW sedefine como

2.- Voxels positivos. Voxels negativos. Enseguida semueven los voxels del objeto A que no ocupan la posiciónrespectiva en el objeto B. En términos de la imagen binaria3-D se mueve:

dW = FdsIp(c,r,k) = IA(r,c,k) \ IB(r,c,k)

El trabajo total para transformar a los objetos esIp(c,r,k) representa a loS voxels positivos.

Los voxels negativos están d~dos por

IMc,r,k) = IB(r,c,k) \ IA(r,c,k)

Donde F; es la fuerza aplicada a cada voxel para moverlo

una distancia Si' Así, se puede construir una métrica para

IIW = L FiSi

i=1transformar un objeto A en un objeto B (W(A -+- B»:

W(A ~ B) = W(B~ A),

W(A ~ B) ~ O,W(A ~ B) = ° <:::> A = B, y

W(A~C)~ W(A~B)+ W(B~C).

3.- Se aplica el algoritmo húngaro para mover los voxels(de manera que el trabajo realizado en ello sea el mínimo).Se supondrá que al mover los voxels en la transformaciónde los objetos, la fuerza empleada al hacerlo es constante eigual a una unidad de fuerza (por ejemplo una dina o un

newton).El método usado en este trabajo, considera una gráfica G

bipartita con bipartición (Ip,IN) donde Ip = {ip),ip2'...'ip.} eIN = {iNl'iN2,...,iN.}.


4.2 Medida de SemejanzaUna vez que se han encontrado los invariantes (10 cual esuna parte crucial en el reconocimiento de la fQrma, puesdebemos construir una base invariante como se dijo en lasecc. 2.1, esto es, no se puede transformar sin antes habercalculado los invariantes) se procederá a transformar a losobjetos. La figura 6 muestra a los objetos utilizados pararealizar las siguientes transformaciones: A ~ B, A ~ C, B

~C,D~EyF~G.

El i-ésimo voxel recorrerá una distancia euclidiana Si =

d(Ai,BJ al moverse del objeto A al objeto B. Aquí, Aj es laposición del voxel positivo i, y Bj la posición del voxelnegativo correspondiente. De esta manera se puede definirla Medida de Semejanza como:

II II

D = LLd(Ai,~j)

i;1 j;1Las tablas I y 2 muestran los resultados de haber realizado

las transformaciones entre los objetos de la figura 6 en la

forma que se muestra en las figuras 7, 8 Y. 9. En estas

figuras aparecen las transformaciones en forma progresiva.

sc

2E

Transforn1ación Voxels comunes Voxels a mover

DoA

A-+B 24 8

A~C 28 4

8B~C 24

E F G D~E 75 12

Figura 6: Siete objetos diferentes a transformar una vezque son invariantes bajo traslación, cambio de escala y

rotación

F~G 75 12

Tabla Número de voxels comunes a ambos objetos y voxels

positivos a mover en cada transformación.Puesto que se ha considerado a la fuerza igual a 1, el

trabajo 1otal a transfonnar los objetos coincidirá

numéricamente con la desemejanza de los objetos.Se hace una comparación entre el método empleado en esteartículo y el utilizado por Bribiesca (1995). El método deBribiesca (1995) se basa en recorrer primero los voxels máscercanos y luego los más lejanos. En términos de gráficaspesadas bipartitas, significa encontrar un apareo tal queprimero se apareen los vértices cuyas aristas son de menorpeso, y luego, en orden creciente, los de mayor peso, hastatener un apareo completo. Lo anterior claramente no da unapareo óptimo, es decir, no se obtiene la menor distanciarecorrida por los voxels. En este trabajo se optimiza lamedida de semejanza propuesta por Bribiesca(1995).

4.3 Trabajo Realizado al Transformar losObjetos y Medida de Semejanza.

Los objetos se hicieron invariantes en traslación, cambiode escala, centro de masa y los ejes de simetría principalesque pasan por el centro, de masa. (ver los valores numéricosen .el apéndice). Ello permitirá dar una medida desemejanza óptima. Los objetos a transformar deben tener lamisma información (mismo número de voxels) lo querepresenta invariancia en escala; sus centros de masadeben coincidir después de una translación y por último sedeben alinear sus ejes de simetría.

Se puede observar que el trabajo realizado al hacer lastransformaciones empleando el método de Bribiesca (1995)es mayor o igual que el trabajo realizado al emplear elmétodo Húngaro.

.Cabe aclarar que fueron suficientes a lo más dos ejes perpendicularesque pas!ifan por el centro de masa. Además se alinearon de manera que elnúmero de voxels a mover fuese el menor posible.

Hermilo Sánchez: Optimización de una Medida de Semejanza para Objetos Tridimensionales..

Como se puede observar, ya no es posible trabajar con unasubmatriz que pemlita buscar los] O ceros ihdependientes.

Sin embargo, al hacerlo personalmente usando un ciertocriterio, uno cubriría los ceros de la manera en que semuestra en la figura 12. En ella podemos observar que seha empleado una línea más para poder marcar todos losceros y así seguir buscando los ceros independientes-

,.. ,

5 Discusión

Como se puede observar, el número de voxels a moverno excede los 12. ¿Qué sucede si queremos transformar elrobot en el primer avión? Ello significaría mover 58 voxels.¿Qué pasa si aumentamos la definición o el tamatlo de losobjetos? ¿por qué no transformamos algunos de estos

casos?Un estudio de la forma de cómo trabaja el algoritmo

implementado, nos permite ver por qué no se pudo aplicarel método a transformaciones en las que el número devoxels a mover excede a 12. Se ha llegado a los siguientesresultados y razones:.El método planteado e implementado para el

reconocimiento de objetos es consistente con la teoríay los métodos propuestos por la literatura, tal comopuede verse en Bondy (1976) y Gould (1988).

.No se tiene ningún problema con los inv~riantes detranslación y cambio de escala, pues la aplicación deestos puede hacerse con un número relativamentegrande de voxels (más de 3000). El problema aparececuando se aplica el algoritmo húngaro. Ello sucedecuando, en el transcurso de la búsqueda de los cerosindependientes, se llega a una etapa de la matriz comola presentada en la figura 10.

o A,. A", D.~ "" "le "., "'8 ",~ n

"~I "~~ "!~ "!1 n ".v "., ".. ".7 O

n.1 O n" n" n,. n" ".- "iR O ni 19

"" ",. I\ ",' ",~ "'v ",' I\ ",~ ",'v

nil ni~ n" O n.. O n., n.n n.n n.,n

"61 "6~ "6~ n "6~ n "6' "68 "6~ n618

A,. A,. O A" A,J "'u A" O "'7 "'.U

881 Q 88J 884 88) 8.0 Q 8.. Q Q

"7' "7. "7J ",' I\ "'V ",' "'U "7~ I\

o A¡V¿ A¡V" AIU't A¡V;) A¡VO A.Vf A,vo A¡V" O

Figura II: Matriz con todos sus ceros marcados con el mínimonúmero (10) de renglones y/o columnas.

/"

o nl2 n13 n14 n 15 n16 n17 nl8 n19 O

n21 n22 n23 n24 O n26 n27 n28 n29 O

n31 O n33 n34 n35 n36 n37 n38 O n310

n41 n42 O n44 n45 n46 n47 O n49 n410

n51 n52 n53 O n55 O n57 n58 n59 n51O

n61 n62 n63 O n65 O n67 n68 n69 n610

n71 n72 O n74 n75 n76 n77 O n79 n710

" "ns1 U DS3 DS4 DS5 DS6 U DS~ U U

D9l D92 D93 D94 O D96 D97 D9S D99 O

O D1O2 D1O3 Dl04 DlO5 D1O6 D1O7 DIOS D1O9 O

\

Figura 10: Matriz de 10xl0 en la que nij ~ Q./

Figura 12: Matriz con todos sus ceros marcados con 11 renglonesy/o columnas permitiendo que quede una submatriz.A la cual todavía no se le pueden extraer sus lO ceros

independientes.A través del método empleado aquí para encontrar los cerosindependientes, usando las ideas de Gould (1988), losrenglones y columnas a marcar quedan como se muestra en

la figura 11.

Ningún caso como el de la figura 12 sucedió en los

ejemplos experimentales.


expresadas para el mejoramiento del mismo. Tambiénquiero agradecer al Dr. Ernesto Bribiesca por suscomentarios y consejos durante la realización de esta

investigación.

6 Conclusiones

Referencias

Ballard, D. H. & Brown, C. M. Computer Vision. Prentice

Hall, Ennglewood Cliffs, New Jersey (1982).

Bondy, J. A. and Murty, U.S.R. Graph Theory withApplications. Departrnent of Combinatorics andOptimization, University of Waterloo, Ontario, Canada.1976.

Boyse, J. W ., Data Structure for Solid mode11er, NFS

Workshop on the Representation on Three-Dimensiona1

Objects, University of Pennsy1vania 1979.

Para lograr .el propósito de encontrar una medida desemejanza óptima, se vio que son suficientes y adecuadossólo 4 invariantes a encontrar en objetos tridimensionales adiferencia de los siete que deduce Hu (1962).

Para transformar a los objetos se implementó elAlgoritmo Húngaro, aplicándose a algunos ejemplos.

En la sección 4 se muestra que el trabajo realizado en latransformación de los objetos a través del método empleadoen este articulo, siempre es menor o igual que el utilizadopor Bribiesca en (1995).

Con lo anterior se tiene entonces que: con teoria deinvariantes y con Algoritmo Húngaro se obtiene unamedida de semejanza óptima entre objetos.

Por lo tanto, se ha resuelto un problema que Bribiescaplantea en (1995) para optimizar una medida de similitud osemejanza de figuras tridimensionales. En realidad talreconocimiento se hizo para objetos pequeños, como losplanteados en la sección 4.

Debido a la discusión dada en la sección 5 se concluyeque el método de Gould planteado en 1988 no esconsistente, y que el problema de elaborar un algoritmo queresuelva encontrar un apareo óptimo (para encontrar eltrabajo mínimo) y asi poder transformar objetos de granresolución sigue abierto. Sin embargo se considera que elmétodo aqui planteado, basado en los invariantes y en elconcepto de trabajo, es una buena línea de investigaciónque puede llevar a diferentes aplicaciones.

Besl P .J., Surfaces in range image Understanding. New

York Springer. 338 pp. 1988.

1988.

Besl, P. and Jain, R Three-dimensional Object

Recognition, ACM Comput. Surv. 17(1).75-145 (1985).

Bribiesca E., Measuring 3-D Shape Similarity Using

Progresive Transformations. Pattem Recognition, vol 29,

1995. pp. 1-13.7 Trabajo futuro

Brooks R., Model Based 3-0 Interpretations of 2-0

Images, IEEE Trans. Pattem Anal. Mach. Intell. 5(2), 1983.

pp 140-150.

Cohen, F. and Wang, J. Part I: Modeling images curvesusing invariant 3D object curve models a path to 3Drecognition and shape estimation from image contours,IEEE Trans. Patem Analysis Mach. Intell. PAMI-16(1), 1-12, 1994.

Chartrand, GaryPublications 1985.

Introductory Graph Teory, Dover

Respecto a los invariantes, un trabajo posterior debeplantear un algoritmo para automatizar la búsqueda de losejes mayores y rotar los objetos de manera de transformarobjetos grandes o de gran resolución. Con ello se reforzarála idea de si los 4 invariantes encontrados hasta ahora sonsuficientes para establecer nuestra medida de similitud o talvez podrían ser superados. Hasta ahora el cálculo de losinvariantes de rotación, sobre todo los ejes de simetría, noha representado problema, debido al relativo pequeñonúmero de voxels de los ejemplos expuestos.

Un trabajo posterior debe atacar el problema de marcarcorrectamente los ceros de la matriz. Tal trabajo debeencontrar un algoritmo que "sepa decidir" cómo marcartodos los ceros sin llegar a marcar todos los renglones (o

columnas).

Dickinson S. J., Pentland A. P. and Rosenfeld A., FromVolumes lo Views: an aproach lo 3-D Objecl Recognilion.CVGIP: Image Understanding 55,1992, pp 130-154.

Egerváry, J., Matrixok Kombinatorikus Tulajdonságairól.

Mathematika és Fizikai Lápok, vol 38 1931, pp 16-28.8 Agradecimientos

TheGould, R., Graph Theory, Ernory University,Benjarnin/Curnrnings Publishing Cornpany, Inc. 1988

Quiero agradecer a los revisores por sus acertados

comentarios acerca del trabajo, así como las sugerencias


J.lO3=O

J.l13=O

J.l04=13398

J.l14=O

oo

0.4088750

Bu M. K., Visual Pattern Recognition by MomentInvariants. lRE, vol 8, Feb 1962, pp 179- 187.

Jain K., Fundamentals of Digital Image Processing.Prentice Hall Information and System Sciences Series.Thomas Kailath, series Editor. 1989, pp 569. Objeto B

Invariancia en

traslación

endeJonas, A. and Kiryati, N., Digital Representations

Schemes for 3-D Curves, Pattem Recognition. 30, 1817-

1827,1997.

Invarianciacambioescala (esc1)

1

O

0.117188

0

0.020325

0

-0.058594

0

-0.011444

0.4375

0

0.048218

0

-0.023346

0.372009

~oo=32

~10=O

~20=120

~30=O

~40=666

~01=O

~11=-60

~21=O

~31=-375

~02=448

~12=O

~22=1580

~03=O

~13=-765

~04=12190

Kanatani K., Group of Theoretical Methods in Image

Understanding, 1990, Springer -Verlag.

Konig, D., Graphs and Matrices (Hungarian). Mat. Fig.

Lapok, vo138, 1931, pp 26-30.

Apéndice

Valores de los lnvariantes en traslación y cambio de escalade las figuras dadas en el artículo. Se han encontrado losmomentos hasta cuarto orden. Para los objetos querepresentan caracteres numéricos se calcularon invariantesbidimensionales por estar formados por una sola capa. Parael resto se calcularon invariantes tridimensionales.

Objeto CInvariancia entraslación

Invariancia encambio de escala

(esc1)Jloo =32

Jl10 =O

Jl20 =136.875

Jl30 =-66.796875

Jl40 =814.990417

JlO1 =0

Jl11 =23.125

Jl21 =-23.203125

Jl31 =159.509277

JlO2 =504.875

Jl12 =-91.796875Jl22 = 1948.927856

JlO3 =411.796875

Jl13=81.697189Jl04 =13422.617188

1

o

0.133667

-0.065231

0.024872

0

0.022583

-0.022659

0.004868

0.493042

-0.089645

0.059477

0.402145

0.002493

0.409626

.UpqSea escl =

.u (p+q)/2+1

.Upqry esc2 =

Jl (p+q+r)/3+1

Objeto A

Invariancia en

traslación

Invariancia encambio deescala (esc1)

1

O

0.15625

0

0.029236

0

0

0

0

0.515625

0

0.063782

1.100=32

1.110=0

1.120=160

1.130=0

1.140=958

1.101=0

1.111=0

1.121=0

1.131=0

1.102=528

1.112=0

1.122=2090

Objeto D

Invariancia en

traslación


(esc3)

~ooo=87

~1oo=9.536743e-O7

~2oo=1528.413818

~3oo=-386.004822

1

1.096177e-08

17.567975

-0.050998

Hermilo Sánchez: Optimización de una Medida de Semejanza para Objetos Tridimensionales..

/.l4oo=48168.535156

/.lo1o=4.48226ge-05

/.l11o=-88.413803

/.l21o=-183.213135

/.l31o=-2332.521973

/.lo2o=517.747131

/.l12o=107.466461

/.l22o=8633.792969

/.lo3o=-111.198029

/.l13o=-1112.552002

/.lo4o=6954.779297/.lOO1 =-2. 9563ge-05

/.l1o1=31.482759

/.l2o1=3.01742

/.l3o1=669.666077

/.lo11=71.183899

/.l111=82.959579

/.l211=1167.696045

/.lo21=192.381516

/.l121=368.438812

/.lo31=1214.243896

/.loo2=60.229862

/.l1o2=47.426472

/.l2o2=935.522705

/.lo12=169.04863

/.l11~=164.73587

/.lo22=762.975403

/.loo3=99.210197

/.l1o3=110.579216

/.lo13=405.54953

/.loo4=271.552673

6.363923

5.152034e-07

-1.016251

-0.024206

-0.308168

5.951116

0.014198

1.140678

-0.014691

-0.146988

0.91885

-3.39815e-07

0.361871

0.000399

0.088475

0.818206

0.01096

0.154273

0.025417

0.048677

0.160423

0.692297

0.006266

0.123599

0.022334

0.021765

0.100803

0.013107

0.014609

0.05358

0.035877

~201=68.729927

~3o1=162.995163

~o11=53.977005~111=37. 770649

~211=1206.491577

~o21=172.693817

~121=175.771103

~o31=941.933594~oo2=42 .436775

~1o2=19.03594

~2o2=836.585876

~o12=130.287491

~112=78.796211

~o22=598.626648

~oo3=78.399796

~103=61.977261

~o13~314.50766

~004=204.0616

0.00908

0.021535

0.620425

0.00499

0.159399

0.022816

0.023223

0.124446

0.487779

0.002515

0.110528

0.017213

0.01041

0.079089

0.010358

0.008188

0.041552

0.02696

Objeto F

Invariancia en

traslación

~ooo=87

~1oo=-8.58306ge-06

~2oo=1522.482666

~3oo=-23.772869

~4oo=47126.816406

~o1o=2.0504e-05

~110=137.655167

~210=129.255722

~310=2458.357666

~o2o=791.103333

~120=-216.197586

~220=13638.788086

~o3o=-400.223724

~130=2740.707764

~o4o=14045.150391

~001=-1.239777e-05

~101=-15.655175~201 =-21.370535

~301=-256.250793

~011=-116.103523

~111=158.415817

~211=-2118.086182

~021=167.936356

~121=-247.996201

~031=-2068.522217

~oo2=32.436764

~102=-31.001989

~202=543.349426

~012=-21.338438


(esc3)1

-9.865596e-0817.499801-0.0031416.226294

2.356781e-071.5822430.0170770.3247939.093142-0.0285641.801927-0.0528770.3620961.855615

-1.425031 e-07-0.179945-0.002823-0.033855-1.3345230.02093

-0.2798370.022187-0.032765-0.2732890.372836-0.0040960.071786-0.002819

Invariancia en cambiode escala (esc3)

1

1.096177e-07

17.459634

0.010652

6.465596

-3.507768e-07

-1.047034

-0.015931

-0.247726

5.508786

0.018792

1.058711

0.008154

-0.125004

0.775397

-6.577064e-08

0.077553

Objeto E

Invariancia en

traslación

~ooo=87

~1oo=9.536743e-06

~2oo=1518.988159

~3oo=80.621407

~4oo=48938.09375

~o1o=-3.051758e-05

~110=-91.091957

~210=-120.584312

~310=-1875.03479

~o2o=479.264404

~120=142.235382

~220=8013.384766~o3o=61. 720974

~130=-946.156433

~o4o=5868.976563

~oo1=-5.722046e-06

~101=6.747128


1.1112=80.559418

1.1022=487.449677

1.1003=0.874878

1.1103=-22.834366

1.1013=-118.999275

1.1113=163.780533

1.1004=32.01799

0.010643

0.064401

0.OC0116

-0.003017

-0.015722

0.021638

0.00423

BCDEFG

(613,0)

(6,3,0)

(5, 7,1 )

(517,1)

(5,3,2)

(5,3,2)

Nota: un cálculo preciso del centro de masa arroja valoresreales, pero como se consideran figuras discretas, sÓlo se hatomado la parte entera de dicho cálculo.

Invariancia en cambiode escala (esc3)

14.932798e-08

18.242039-0.0163626.811037

-3.288532e-07-2.859294-0.064917-1.296649.544985-0.0151391.8621510.027873-0.4660271.993171

4.275092e-070.2026690.0006650.123134-1.1533890.01492

-0.2780830.0119630.058297-0.2046840.390276-0.003030.0855470.000429-0.014058

4.527398e-050.002117-0.0132070.004482

~

Objeto G

Invariancia en

traslacion

~000=87

~100=4.291534e-06

~2oo=1587.057373

~3óo=-123.841103

~400=51552.738281

~o1o=-2.861023e-05

~110=-248.758621

~210=-491.359375

~310=-9814.264648

~o2o=830.413696

~120=-114.583534

~220=14094.620117

~o3o=210.970352

~130=-3527.358887~040= 15086.31 0547

~001=3.71933e-05

~101=17.632189

~201=5.036937

~301=932.001526

~011=-100.34481

~111=112.930664

~211=-2104.812256

~021=90.547813

~121=441.249573

~031=-1549.250488~002=33. 95401

~102=-22.936455~202=647 .508423

~012=3.248519

~112=-106.402809

~003=0.342679

~103=16.022408

~013=-99.961685

~004=33.923798

~

Hermilo Sánchez Cruz. Nació en la Ciudad de México.Actualmente es estudiante del doctorado en Ciencia eIngeniería en Computación de la Universidad NacionalAutónoma de México, con sede en el Instituto deInvestigaciones en Matemáticas Aplicadas y en Sistemas.Obtuvo el grado de Físico en la Facultad de Ciencias de laUNAM; en abril de 1995, el grado de maestro en Cienciasde la Computación en febrero de 1998, a través de laUnidad Académica de los Ciclos Profesional y dePosgrado del CCH. Sus áreas de interés son: Visión porComputadora y Reconocimiento de Patrones.

Figura

A

Centro de Masa

(6,3,0)

Optimización de una Medida de Semejanza para … · de semejanza de objetos o figuras...

Documents

Transcript of Optimización de una Medida de Semejanza para … · de semejanza de objetos o figuras...