Optimización de una Medida de Semejanza para … · de semejanza de objetos o figuras...
Transcript of Optimización de una Medida de Semejanza para … · de semejanza de objetos o figuras...
Computación y Sistemas Vol. 3 No.4 pp. 274 -286@ 2000, CIC -IPN. ISSN 1405-5546 Impreso en México
Optimización de una Medida de Semejanza para Objetos
Tridimensionales a Partir de Invariantes y Transformaciones
Hermilo Sánchez
Departamento en Ciencias de la ComputaciónInstituto de Investigaciones en Matemáticas Aplicadas y en Sistemas
Universidad Nacional Autónoma de MéxicoApdo. Postal 20- 726 Admon. No.20.
Delegación Alvaro Obregón.CP: 01000.
Ciudad Universitaria, D.F. México
Artículo recibido elB de noviembre. 1999: acevtado el2 de marzo. 2000
Resumen1 Introducción
Uno de /os prob/emas actua/es dentro de visión porcomputadora es e/ reconocimiento de /a forma de /osobjetos o figuras tridimensiona/es. En éste trabajo sepropone /a optimización de un método para /ograr esteobjetivo. Para e//o se uti/izan ros invariantes y /a teoríade gráficas que permiten //evar a cabo /a transformaciónde objetos irregu/ares de representación binaria y medirsu semejanza. Para obtener e/ parecido se presentancuatro invariantes para objetos tridimensiona/es; seobtiene e/ trabajo mínimo en su transformación a/ usar/a teoría de gráficas. En /a parte de asignación óptima y,como parte importante de/ reconocimjento después de/cá/cu/o de invariantes, se presenta e/ a/goritmo húngaro,que permite hacer dicha transformación de maneraóptima y obtener así una buena medida de semejanza.
Palabras clave: Medida de semejanza, slgoritmohúngaro, invariantes, momentos centrales, gráficasbipartitas, camino extendido, trabajo, ceros
independientes, apareo óptimo.
El objetivo del presente trabajo es optimizar una medidade semejanza de objetos o figuras tridimensionalesirregulares. El gasto o trabajo realizado en medir lasemejanza de las figuras debe ser el menor posible.
Para representar a nuestras figuras tridimensionales, seemplea la voxelizaciónl.
Como parte del proceso de reconocimiento de la forma,a través de la medida de similitud, se propone utilizarcuatro invariantes bajo transformaciones de traslación,cambio de escala y rotación. Para ello se hace un estudiode los momentos centrales. De esta manera se verá que elcálculo de los invariantes así como la transformación delos objetos permitirá obtener una medida de semejanza
óptima.Sobre el reconocimiento de la forma de objetos
tridimensionales, hasta ahora han existido algunosautores que han aplicado diferentes técnicas para lograrsu propósito, tales como Besl(1988), Besl & lain(1985),lain (1989), Boyse (1979), Brooks (1983) y Dickinson,Pentland & Rosenfeld (1992), entre otros, quienes basansus métodos de reconocimiento en el uso de primitivas,es decir, ciertas figuras geométricas que sirven comounidades para conformar a los objetos, tales como conos,conos truncados, cilindros, elipsoides, etc.
Otro tipo de técnica que se ha utilizado para representarla superficie de un sólido, es a través de curvas digitales(lonas and Kiryati, 1997). Sobre descripción de
IRepresentar a un objeto mediante voxels. Un voxel es un elemento devolumen representado por el vector: [propiedades, posición] donde laspropiedades son las características del voxel, tales como brillo, color,intensidad, densidad, etc. La posición esta dado por las coordenadasespaciales (x,y,z). Ver Ballard & Brown(1982).
Hermilo Sánchez: Optimización de una Medida de Semejanza para Objetos Tridimensionales...
Los momentos centrales son invariantes bajo translaciónal tener la siguiente transformación de coordenadas:
superficie de cuerpos sólidos a través de propiedades deinvariancia se puede ver a Cohen & Wang (1994).Sin embargo el método planteado en este trabajo se basa
en las ideas iniciadas por Bribiesca (1995), quien defmeuna métrica y una medida de similitud, susceptibles deaplicarse para la transformación de figurastridimensionales irregulares y no solo figuras regulares,como lo han venido haciendo los autores anteriores. Eneste artículo se logra optimizar el método de Bribiesca.
x' = x + a
y' = y + 13 con a y 13 constantes
7Los momentos dados por la siguiente relación:
(3)
.Upq J.lpq=
2 Teoría de los Invariantes .u ' (p+q)/2+1 .u (p+q)/2
2.1 Interpretación de loS Invariantes con p + q = 3,4, (4)
donde
.u = 1/ p(x,y) dxdy(5)
son invariantes bajo cambio de escala al tener lasiguiente transfonnación de coordenadas:
Considérese un objeto geométrico S en el espacio X. Sesupone un grupo de transformaciones admisibles G queactúa en el espacio X. Un invariante escalar de un objetoS es una cantidad que no cambia su valor cuando elobjeto S sufre cualquiera de las transformacionesadmisibles (tales como una rotación, traslación o biencambio de escala).
Supóngase que el objeto S tiene invariantes escalaresIl,I2,...,In. Considérese S'. Si S' se obtiene al transformarapropiadamente al objeto S usando transformacionesadmisibles, los valores de estos invariantes escalaresdeben ser idénticos. Sin embargó, en general, lo contrariono es cierto. Para ello se necesita la siguiente definición.
Definición: se dice que un conjunto de invariantes esuna base invariante si la coincidencia de invariantesescalares para dos objetos implica la existencia de unatransformación admisible que mapea uno al otro(Kanatani, 1990). Se sigue, entonces, que paratransformar a dos objetos es necesario calcular primerosus invariantes.
(6)x'=ax
y'=ay con a constante
2.3 Momentos Invariantes Ortogonales
Bajorotación se tiene:
transformaciones ortogonales deo
x
(7)y
2.2 Momentos CentralesCon el álgebra de invariantes, se llega a los 7 invariantesortogonales, los cuales fueron dados por primera vez porHu (1962):
Sea p ( x, y) ~ o una función real y acotada, definida en
una región !Jí'. Los momentos bidimensionales de orden
(p+q) se definen como:
I/xPy(jp dxdympq x tjJl = .U20 + .UO2, (8)
tjJ 2 = (.u20 -.UO2)2 + 4.u112 .
tjJ3 = (.U30 -3.u12)2 + (3.u21- .UO3)2.
tjJ4 = (.u30 + .U12J2 + (.u21 + .UO3)2.
tjJ 5 = (.U30 -3 .u 12J (.u30 + .U12)[(.u30 + .U12J2 -
.uo3;2] + (3.u21- .UO3)(.U21 -.UO3) [ (.u30
+ .u 12J2 -(.u21 + .UO3)2] ,tjJ 6 = (.U20 -.uo2J [ (.u30 + .U12J2 -(.u21 + .UO3)2] +
4.ull (.U30 + .U12) (.U21 + .UO3).
I)
91
Por otro lado, los momentos centrales bidimensionales
.Upq se definen como: 3<1121 +
.Upq = II (x-I';)P (y -1J)q p (x, y) dxdy
91
(2)donde ~ = m¡Jmoo,
p,q E N
11 = mol /m, y
Hermilo Sánchez: Optimización de una Medida de Semejanza para Objetos Tridimensionales...
Al considerar esta transfonnación de coordenadas y
utilizarlas en (12), se llega a que
rjJ 7 = (3.u21 -.UOJJ (.U30 + .U12J [(u30 + .U12J2 -3(u21
+ .UO3)2] -(u30 -3.u12J (u21 + .UO3)[3(u30 + .U12J2 -
(u21 + .uo3;2],, -p+q+r+3
'Upqr -a 'Upqr,.
Los momentos invariantes ortogonales absolutos, dados
por (8) pueden utilizarse directamente para identificar un
patrón independientemente de la posición y cambio de
escala.
Si p = q = r = O, tenemos que .u ' ooo=aJ .uOOO
Sea .uOOO = .u, entonces, de (15) y (16) se tiene el
siguiente invariante nonnalizado:
2.4 Análisis.u pqr
.u ' (p+q+r)/3+ 1Los momentos centrales en tres dimensiones se puede
definir como
=I1pqr
11 (p+q+r)/3+ 1 ,
con p + q + r = 3,4,.Upqr = II/ ( x-.;) P( y -17 ) q( z -c;)r p ( x,y,z ) dxdydz,
9lEl cual es invariante bajo cambios de escala. (Ver
Figura 1 y el apéndice, donde se muestran los valoresnuméricos calculados de los invariantes en traslación ycambio de escala, asi como el centro de masa de cada
objeto).
donde p,q,r � N. (9)
Sea p(x,y,z)=l, pues aquí no importarán lascaracterísticas de la imagen, tales como sus intensidadesde brillo, de color, etc. sino solo la posición de losvoxels. La ecuación anterior se reduce a
J.lpqr = /ff (x-~)P(y -17 )q( z -t;)r dxdydz,
!Ji(10)
.Ningún autor hasta ahora ha deducido invariantes en3-D utilizando el método de Hu.
.Se propondrá en este artículo utilizar los centros demasa y los ejes mayores de los objetos (que pasen por elcentro de masa) como los invariantes bajo rotación.
donde p.q,r � N .
En el caso discreto, la ecuación anterior se puedeescribir como --9
-9:::Jlpqr = LLL ( Xi-; )P( Yj -17 )q( zk -I;" )r ~Xi~Yj~Zk.
(11)x y z
Si se piensa en los voxels como cubos de lado unitario,
entonces Axj=Ayj=Azk=l. Así que la ecuación anterior
queda simplemente como
a)
.Upqr = LLL ( xi-I;)P( Y) -1] )q( zk -t;y, (12)x y z
la cual es invariante bajo traslación, al considerar la
siguiente transformación: 9x' = x + a
y' = y + 13 con a, 13 y y constantes.
z' = z + y.
Bajo cambio de escala se
transformación:
b)(13)
utiliza la siguienteFigura 1: a) Al aplicar una traslación sobre la figura (un
nueve), los momentos centrales se mantienen invariantes.b) Al aplicar un cambio en la escala, la ec. 4) se mantiene
invariante (ver apéndice para valores numéricos).x' =ax
y' =ayz' =az.
con a constante
(14)
Hermilo Sánchez: Optimización de una Medida de Semejanza para Objetos Tridimensionales...
3 Gráficas,
OptimaBipartitas Asignación 3.6 Problema de Asignación Óptimay
A continuación se presenta una introducción a la teoría degráficas para enseguida estudiar el algoritmo húngaro, basede la optimización de la medida de semejanza, propuestopor Bribiesca (1995).
3.1 Teoría de Gráficas
Una gráfica es un conjunto fmito, no vacío, compuestode un conjunto de vértices V. Sea E el conjunto de parejas(aristas) de la forma {u,v}. Una gráfica puede defmirsesimplemente a través de los conjuntos V y E como G =
G(v; E) (Chartrand, 1985).
Existe un método llamado método Húngaro (Bondy, 1976)(que es el método clásico), que pu~de encontrar apareos
perfectos.El problema de Asignación Óptima que se considerará
consiste en que la suma de las distancias que los voxels queconforman a un objeto tienen que recorrer, paratransformarlo en otro objeto, sea la menor de todas las
posibilidades.Sea una gráfica bipartita pesada completa con bipartición
(X;}), donde X={xl' x2, ...,xJ, y = {Y¡'Y2'...'YJ. El
conjunto X puede representar al conjunto de voxels de unobjeto a transformar Y el conjunto Ya los voxels del objetotransformado. Las aristas {Xi.Yj} tienen un peso Wjj =
W(XiYJ.En esta gráfica pesada, se debe encontrar un apareo
perfecto de peso mínimo, es decir, un Apareo Óptimo.3.2 Pesos en las Aristas
x y
)y¡X¡
X2 )y2
A cada arista de una gráfica G, se asocia un número realw(e), al cual se llamará su peso. En este sentido a G se lellama gráfica pesada.
Si H es una subgráfica de o, el peso w(H) de H es lasuma de los pesos de las aristas de H: ¿ w(e), donde
eEE(H).Cuando se desea que la suma de los pesos de las aristas
que conforman una subgráfica H sea la menor, estasubgráfica debe ser conectada y acíclica. .En este caso seobtiene un spanning tree de peso mínimo.
El peso mínimo de una gráfica es aquel tal que w(H) = ¿
w(e) sea el menor de todas las subgráficas conectadas de o.x
3Y3
3.4 Gráficas BipartitasX4( y+
Una gráfica G(V,E) es bipartita si existe una partición delos vértices en dos conjuntos U y V, tales que si (u, v) está
enEimplicaqueuEU y vEV(oalrevés).Figura 2: Un apareo óptimo, dado por las aristas remarcadas en
negro.
Bondy y Murty (1976), presentan un algoritmo queresuelve el problema de asignación al encontrar un apareoóptimo de peso máximo. Gould encuentra el apareo óptimode peso mínimo basado en el a[goritmo húngaro.
3.5 Apareo
Sea M ~ E un subconjunto de aristas de la gráfica G, elcual es llamado apareo en G si cada uno de sus vértices sonadyacentes a, a lo más, una arista de M. Se dice que unapareo M satura a un vértice v, que sea extremo de unaarista en M, entonces v está saturado si alguna arista de Mes adyacente a v, de otra forma, ves no saturado. Si todoslos vértices de G son M-saturados, el apareo M es perfecto.
Sea M un apareo en G, un camino alternante en G es uncamino cuyas aristas están alternativamente en E\M y en M.Un camino extendido es un camino alternante cuyo inicio yfinal no están saturados.
3.7 Algoritmo Húngaro
Sea el peso de un apareo M dado por W(M) = L w(e), eEM.
Una solución óptima es un apareo perfecto con W(M) comomínimo.I. Se representa a la gráfica bipartita en forma de matriz
de tamaño n x n, U = [Wij].
2. Minimizar la matriz de la siguiente manera:
Hermilo Sánchez: Optimización de una Medida de Semejanza para Objetos TridimensionaJes...
~YIXI0--0YI XI(
~X2~Y2
) Y2
)
X2
XJ YJ
X~ y~
vb)a)
Figura 3: a) Gráfica bipartita con vértices adyaoentes querepresentan los ceros de la matriz. b) Gráfica con un apareo
arbitrario elegido.
-Elegir el valor más pequefio de cada renglón y restarlo a
ese renglón.-Elegir el valor más pequefio de cada columna y restarlo a
esa columna.3. Al encontrar n ceros independientes, esto es, se etiquetann ceros, tales que no haya otro cero (etiquetado) en elrenglón y columna. Se seleccionan los númeroscorrespondientes a estos ceros en la matriz como solución.4. Sin embargo, la gráfica inicial puede ser tal que alminimizarla por primera vez no se puedan encontrar nceros independientes. Entonces, se marcan los renglonesy/o columnas que contengan ceros. La idea es "cubrir"todos los ceros (se utilizará el menor número de líneasposibles para marcar los ceros).5. Encontrar el número más pequefio, min, que esté en lasubmatriz, es decir que no esté en ninguno de los rengloneso columas marcados.6. a) Restar min a las columnas y renglones de lastiÉmatriz. b) Sumar min a los pesos que están doblemente
marcados.7. Enseguida una función (o rutina) checa si se puedenencontrar n ceros independientes. Si es así, el algoritmotermina satisfactoriamente y se llega a un apareo óptimo. Sino, se va otra vez al paso 4.8. Se suman los valores que estaban en la matriz original enla posición de los ceros independientes de la última matrizmodificada, obteniendo el valor buscado W(M). IZI
2.- Se toma un vértice raíz x de la gráfica bipartita.3.- A partir de este vértice raíz se van buscando todos loscaminos altemantes posibles.4.- Se repite el paso anterior con los vértices x's para losque las y's estaban saturadas.5.- Si alguna y no encuentra su respectiva x para sersaturada. entonces se ha encontrado un camino extendido.6.- Si hay otra x que no esté saturada (raíz) regresar a 3. Delo contrario se detiene el programa y se construye un nuevo
apareo M al usar el camino extendido. en el que seintercambian las x adyacentes a las y's que no estaban en el
apareo M anterior por un apareo nuevo (M). y viceversa. sesacan del apareo anterior la x-y que se encontraban bajo M.De esta manera se ha encontrado un apareo perfecto. es
decir un apareo óptimo.7.- Si nunca se encontró el camino extendido. regresar al
paso 1.En la figura 4 se muestra que el camino dado por
X4.Y2.X2.y4 es el camino extendido buscado.
El algoritmo presentado en este capítulo y que solucionael probl~ma de encontrar el peso mínimo en latransformación de los objetos se conoce como algoritmoHúngaro. La versión original (en la que no se habla demarcar los ceros como lo hace Gould, 1988) se debe a
Konig (1931) y Egerváry (1931).Una forma de implementar el algoritmo anterior de
manera eficiente es utilizando e11lamado Árbol Húngaro. camino extendido
/
Árbol Húngaro3.8
X2Una vez que se aplica el algoritmo Húngaro a la matrizoriginal, queda una matriz con posibles cerosindependientes, para buscarlos, se procede a construir alllamado árbol húngaro, y posteriormente se busca elllamado camino húngaro dado por un camino extendido.
J X3
Y3Y2
X21
Y2 ~y
X4
~
X4
'0
X4
Figura 4. Árbol húngaro y camino extendido.
1.- Para construir el árbol húngaro se visitan los ceros de la
matriz y se elige un apareo cualquiera.La figura 3 a) muestra el apareo obtenido a partir de los
ceros encontrados y la figura 3 b) la elección de un apareo
arbitrario.Así, el nuevo apareo queda como en la figura 5
Hermilo Sánchez: Optimización de una Medida de Semejanza para Objetos Tridimensionales.
XI0--0YISea Fi (la fuerza para mover los voxels) constante e igual a1 (un Newton o una dina, por ejemplo). Por el momento noimportará la masa de los voxels o la fricción que podría"obstaculizar" su movimiento. De manera que el trabajototal para transformar a los dos objetos será:
"w = L Si = D
i=1(en unidades de trabajo )
4 Transformación de un Objeto aOtro
Por tanto, el valor numérico del trabajo será, en esteartículo, igual a la distancia total recorrida. En general estono debe ser cierto, sin embargo para el propósito de esteartículo esto no traerá consecuencias negativas.
Para encontrar el trabajo al transformar dos objetos A yB:
En este capítulo se defmirá un concepto 'muy importante, eltrabajo. Debido a que en la transformación de un objeto aotro se tienen qu~ mover voxels, entonces se debe realizarun cierto trabajo al hacer dicha operación, Se verá que elvalor numérico del trabajo total (por haber movido losvoxeIs en la transformación) coincide numéricamente conla distancia recorrida total de los voxels involucrados en latransformación.
1.- Se superponen los dos objetos A y B. Esto es, una vezque son invariantes en escala (mismo número de voxels,todos del mismo tamaño) se hace una traslación de losobjetos de manera que coincidan sus centros de masa y susejes de simetría.
Al llevar a cabo la superposición, existen voxels que soncomunes a los dos objetos. Se debe considerar a losconjuntos Ia<r,c,k) e Ib(r,c,k) (donde (r,c,k) son lascoordenadas cartesianas de los voxels) que representan laimagen binaria 3-D de los cuerpos A y B respectivamente.
La superposición de los objetos, se define como laimagen binaria dada por el conjunto4.1 Trabajo Requerido para Transformar
a los ObjetosIs(c,r,k) = IA(r,c,k) n IB(r,c,k)
En la transformación, cada voxel se mueve de la posiciónX(Xl'X2'XJ) a la posición Y(YI'Y2'YJ)' lo que requiere de untrabajo realizado. De la física clásica el trabajo dW sedefine como
2.- Voxels positivos. Voxels negativos. Enseguida semueven los voxels del objeto A que no ocupan la posiciónrespectiva en el objeto B. En términos de la imagen binaria3-D se mueve:
dW = FdsIp(c,r,k) = IA(r,c,k) \ IB(r,c,k)
El trabajo total para transformar a los objetos esIp(c,r,k) representa a loS voxels positivos.
Los voxels negativos están d~dos por
IMc,r,k) = IB(r,c,k) \ IA(r,c,k)
Donde F; es la fuerza aplicada a cada voxel para moverlo
una distancia Si' Así, se puede construir una métrica para
IIW = L FiSi
i=1transformar un objeto A en un objeto B (W(A -+- B»:
W(A ~ B) = W(B~ A),
W(A ~ B) ~ O,W(A ~ B) = ° <:::> A = B, y
W(A~C)~ W(A~B)+ W(B~C).
3.- Se aplica el algoritmo húngaro para mover los voxels(de manera que el trabajo realizado en ello sea el mínimo).Se supondrá que al mover los voxels en la transformaciónde los objetos, la fuerza empleada al hacerlo es constante eigual a una unidad de fuerza (por ejemplo una dina o un
newton).El método usado en este trabajo, considera una gráfica G
bipartita con bipartición (Ip,IN) donde Ip = {ip),ip2'...'ip.} eIN = {iNl'iN2,...,iN.}.
Hermilo Sánchez: Optimización de una Medida de Semejanza para Objetos Tridimensionales...
4.2 Medida de SemejanzaUna vez que se han encontrado los invariantes (10 cual esuna parte crucial en el reconocimiento de la fQrma, puesdebemos construir una base invariante como se dijo en lasecc. 2.1, esto es, no se puede transformar sin antes habercalculado los invariantes) se procederá a transformar a losobjetos. La figura 6 muestra a los objetos utilizados pararealizar las siguientes transformaciones: A ~ B, A ~ C, B
~C,D~EyF~G.
El i-ésimo voxel recorrerá una distancia euclidiana Si =
d(Ai,BJ al moverse del objeto A al objeto B. Aquí, Aj es laposición del voxel positivo i, y Bj la posición del voxelnegativo correspondiente. De esta manera se puede definirla Medida de Semejanza como:
II II
D = LLd(Ai,~j)
i;1 j;1Las tablas I y 2 muestran los resultados de haber realizado
las transformaciones entre los objetos de la figura 6 en la
forma que se muestra en las figuras 7, 8 Y. 9. En estas
figuras aparecen las transformaciones en forma progresiva.
sc
2E
Transforn1ación Voxels comunes Voxels a mover
DoA
A-+B 24 8
A~C 28 4
8B~C 24
E F G D~E 75 12
Figura 6: Siete objetos diferentes a transformar una vezque son invariantes bajo traslación, cambio de escala y
rotación
F~G 75 12
Tabla Número de voxels comunes a ambos objetos y voxels
positivos a mover en cada transformación.Puesto que se ha considerado a la fuerza igual a 1, el
trabajo 1otal a transfonnar los objetos coincidirá
numéricamente con la desemejanza de los objetos.Se hace una comparación entre el método empleado en esteartículo y el utilizado por Bribiesca (1995). El método deBribiesca (1995) se basa en recorrer primero los voxels máscercanos y luego los más lejanos. En términos de gráficaspesadas bipartitas, significa encontrar un apareo tal queprimero se apareen los vértices cuyas aristas son de menorpeso, y luego, en orden creciente, los de mayor peso, hastatener un apareo completo. Lo anterior claramente no da unapareo óptimo, es decir, no se obtiene la menor distanciarecorrida por los voxels. En este trabajo se optimiza lamedida de semejanza propuesta por Bribiesca(1995).
4.3 Trabajo Realizado al Transformar losObjetos y Medida de Semejanza.
Los objetos se hicieron invariantes en traslación, cambiode escala, centro de masa y los ejes de simetría principalesque pasan por el centro, de masa. (ver los valores numéricosen .el apéndice). Ello permitirá dar una medida desemejanza óptima. Los objetos a transformar deben tener lamisma información (mismo número de voxels) lo querepresenta invariancia en escala; sus centros de masadeben coincidir después de una translación y por último sedeben alinear sus ejes de simetría.
Se puede observar que el trabajo realizado al hacer lastransformaciones empleando el método de Bribiesca (1995)es mayor o igual que el trabajo realizado al emplear elmétodo Húngaro.
.Cabe aclarar que fueron suficientes a lo más dos ejes perpendicularesque pas!ifan por el centro de masa. Además se alinearon de manera que elnúmero de voxels a mover fuese el menor posible.
Hermilo Sánchez: Optimización de una Medida de Semejanza para Objetos Tridimensionales..
Como se puede observar, ya no es posible trabajar con unasubmatriz que pemlita buscar los] O ceros ihdependientes.
Sin embargo, al hacerlo personalmente usando un ciertocriterio, uno cubriría los ceros de la manera en que semuestra en la figura 12. En ella podemos observar que seha empleado una línea más para poder marcar todos losceros y así seguir buscando los ceros independientes-
,.. ,
5 Discusión
Como se puede observar, el número de voxels a moverno excede los 12. ¿Qué sucede si queremos transformar elrobot en el primer avión? Ello significaría mover 58 voxels.¿Qué pasa si aumentamos la definición o el tamatlo de losobjetos? ¿por qué no transformamos algunos de estos
casos?Un estudio de la forma de cómo trabaja el algoritmo
implementado, nos permite ver por qué no se pudo aplicarel método a transformaciones en las que el número devoxels a mover excede a 12. Se ha llegado a los siguientesresultados y razones:.El método planteado e implementado para el
reconocimiento de objetos es consistente con la teoríay los métodos propuestos por la literatura, tal comopuede verse en Bondy (1976) y Gould (1988).
.No se tiene ningún problema con los inv~riantes detranslación y cambio de escala, pues la aplicación deestos puede hacerse con un número relativamentegrande de voxels (más de 3000). El problema aparececuando se aplica el algoritmo húngaro. Ello sucedecuando, en el transcurso de la búsqueda de los cerosindependientes, se llega a una etapa de la matriz comola presentada en la figura 10.
o A,. A", D.~ "" "le "., "'8 ",~ n
"~I "~~ "!~ "!1 n ".v "., ".. ".7 O
n.1 O n" n" n,. n" ".- "iR O ni 19
"" ",. I\ ",' ",~ "'v ",' I\ ",~ ",'v
nil ni~ n" O n.. O n., n.n n.n n.,n
"61 "6~ "6~ n "6~ n "6' "68 "6~ n618
A,. A,. O A" A,J "'u A" O "'7 "'.U
881 Q 88J 884 88) 8.0 Q 8.. Q Q
"7' "7. "7J ",' I\ "'V ",' "'U "7~ I\
o A¡V¿ A¡V" AIU't A¡V;) A¡VO A.Vf A,vo A¡V" O
Figura II: Matriz con todos sus ceros marcados con el mínimonúmero (10) de renglones y/o columnas.
/"
o nl2 n13 n14 n 15 n16 n17 nl8 n19 O
n21 n22 n23 n24 O n26 n27 n28 n29 O
n31 O n33 n34 n35 n36 n37 n38 O n310
n41 n42 O n44 n45 n46 n47 O n49 n410
n51 n52 n53 O n55 O n57 n58 n59 n51O
n61 n62 n63 O n65 O n67 n68 n69 n610
n71 n72 O n74 n75 n76 n77 O n79 n710
" "ns1 U DS3 DS4 DS5 DS6 U DS~ U U
D9l D92 D93 D94 O D96 D97 D9S D99 O
O D1O2 D1O3 Dl04 DlO5 D1O6 D1O7 DIOS D1O9 O
\
Figura 10: Matriz de 10xl0 en la que nij ~ Q./
Figura 12: Matriz con todos sus ceros marcados con 11 renglonesy/o columnas permitiendo que quede una submatriz.A la cual todavía no se le pueden extraer sus lO ceros
independientes.A través del método empleado aquí para encontrar los cerosindependientes, usando las ideas de Gould (1988), losrenglones y columnas a marcar quedan como se muestra en
la figura 11.
Ningún caso como el de la figura 12 sucedió en los
ejemplos experimentales.
Hermilo Sánchez: Optimización de una Medida de Semejanza para Objetos Tridimensionales...
expresadas para el mejoramiento del mismo. Tambiénquiero agradecer al Dr. Ernesto Bribiesca por suscomentarios y consejos durante la realización de esta
investigación.
6 Conclusiones
Referencias
Ballard, D. H. & Brown, C. M. Computer Vision. Prentice
Hall, Ennglewood Cliffs, New Jersey (1982).
Bondy, J. A. and Murty, U.S.R. Graph Theory withApplications. Departrnent of Combinatorics andOptimization, University of Waterloo, Ontario, Canada.1976.
Boyse, J. W ., Data Structure for Solid mode11er, NFS
Workshop on the Representation on Three-Dimensiona1
Objects, University of Pennsy1vania 1979.
Para lograr .el propósito de encontrar una medida desemejanza óptima, se vio que son suficientes y adecuadossólo 4 invariantes a encontrar en objetos tridimensionales adiferencia de los siete que deduce Hu (1962).
Para transformar a los objetos se implementó elAlgoritmo Húngaro, aplicándose a algunos ejemplos.
En la sección 4 se muestra que el trabajo realizado en latransformación de los objetos a través del método empleadoen este articulo, siempre es menor o igual que el utilizadopor Bribiesca en (1995).
Con lo anterior se tiene entonces que: con teoria deinvariantes y con Algoritmo Húngaro se obtiene unamedida de semejanza óptima entre objetos.
Por lo tanto, se ha resuelto un problema que Bribiescaplantea en (1995) para optimizar una medida de similitud osemejanza de figuras tridimensionales. En realidad talreconocimiento se hizo para objetos pequeños, como losplanteados en la sección 4.
Debido a la discusión dada en la sección 5 se concluyeque el método de Gould planteado en 1988 no esconsistente, y que el problema de elaborar un algoritmo queresuelva encontrar un apareo óptimo (para encontrar eltrabajo mínimo) y asi poder transformar objetos de granresolución sigue abierto. Sin embargo se considera que elmétodo aqui planteado, basado en los invariantes y en elconcepto de trabajo, es una buena línea de investigaciónque puede llevar a diferentes aplicaciones.
Besl P .J., Surfaces in range image Understanding. New
York Springer. 338 pp. 1988.
1988.
Besl, P. and Jain, R Three-dimensional Object
Recognition, ACM Comput. Surv. 17(1).75-145 (1985).
Bribiesca E., Measuring 3-D Shape Similarity Using
Progresive Transformations. Pattem Recognition, vol 29,
1995. pp. 1-13.7 Trabajo futuro
Brooks R., Model Based 3-0 Interpretations of 2-0
Images, IEEE Trans. Pattem Anal. Mach. Intell. 5(2), 1983.
pp 140-150.
Cohen, F. and Wang, J. Part I: Modeling images curvesusing invariant 3D object curve models a path to 3Drecognition and shape estimation from image contours,IEEE Trans. Patem Analysis Mach. Intell. PAMI-16(1), 1-12, 1994.
Chartrand, GaryPublications 1985.
Introductory Graph Teory, Dover
Respecto a los invariantes, un trabajo posterior debeplantear un algoritmo para automatizar la búsqueda de losejes mayores y rotar los objetos de manera de transformarobjetos grandes o de gran resolución. Con ello se reforzarála idea de si los 4 invariantes encontrados hasta ahora sonsuficientes para establecer nuestra medida de similitud o talvez podrían ser superados. Hasta ahora el cálculo de losinvariantes de rotación, sobre todo los ejes de simetría, noha representado problema, debido al relativo pequeñonúmero de voxels de los ejemplos expuestos.
Un trabajo posterior debe atacar el problema de marcarcorrectamente los ceros de la matriz. Tal trabajo debeencontrar un algoritmo que "sepa decidir" cómo marcartodos los ceros sin llegar a marcar todos los renglones (o
columnas).
Dickinson S. J., Pentland A. P. and Rosenfeld A., FromVolumes lo Views: an aproach lo 3-D Objecl Recognilion.CVGIP: Image Understanding 55,1992, pp 130-154.
Egerváry, J., Matrixok Kombinatorikus Tulajdonságairól.
Mathematika és Fizikai Lápok, vol 38 1931, pp 16-28.8 Agradecimientos
TheGould, R., Graph Theory, Ernory University,Benjarnin/Curnrnings Publishing Cornpany, Inc. 1988
Quiero agradecer a los revisores por sus acertados
comentarios acerca del trabajo, así como las sugerencias
Hermilo Sánchez: Optimización de una Medida de Semejanza para Objetos Tridimensionales...
J.lO3=O
J.l13=O
J.l04=13398
J.l14=O
oo
0.4088750
Bu M. K., Visual Pattern Recognition by MomentInvariants. lRE, vol 8, Feb 1962, pp 179- 187.
Jain K., Fundamentals of Digital Image Processing.Prentice Hall Information and System Sciences Series.Thomas Kailath, series Editor. 1989, pp 569. Objeto B
Invariancia en
traslación
endeJonas, A. and Kiryati, N., Digital Representations
Schemes for 3-D Curves, Pattem Recognition. 30, 1817-
1827,1997.
Invarianciacambioescala (esc1)
1
O
0.117188
0
0.020325
0
-0.058594
0
-0.011444
0.4375
0
0.048218
0
-0.023346
0.372009
~oo=32
~10=O
~20=120
~30=O
~40=666
~01=O
~11=-60
~21=O
~31=-375
~02=448
~12=O
~22=1580
~03=O
~13=-765
~04=12190
Kanatani K., Group of Theoretical Methods in Image
Understanding, 1990, Springer -Verlag.
Konig, D., Graphs and Matrices (Hungarian). Mat. Fig.
Lapok, vo138, 1931, pp 26-30.
Apéndice
Valores de los lnvariantes en traslación y cambio de escalade las figuras dadas en el artículo. Se han encontrado losmomentos hasta cuarto orden. Para los objetos querepresentan caracteres numéricos se calcularon invariantesbidimensionales por estar formados por una sola capa. Parael resto se calcularon invariantes tridimensionales.
Objeto CInvariancia entraslación
Invariancia encambio de escala
(esc1)Jloo =32
Jl10 =O
Jl20 =136.875
Jl30 =-66.796875
Jl40 =814.990417
JlO1 =0
Jl11 =23.125
Jl21 =-23.203125
Jl31 =159.509277
JlO2 =504.875
Jl12 =-91.796875Jl22 = 1948.927856
JlO3 =411.796875
Jl13=81.697189Jl04 =13422.617188
1
o
0.133667
-0.065231
0.024872
0
0.022583
-0.022659
0.004868
0.493042
-0.089645
0.059477
0.402145
0.002493
0.409626
.UpqSea escl =
.u (p+q)/2+1
.Upqry esc2 =
Jl (p+q+r)/3+1
Objeto A
Invariancia en
traslación
Invariancia encambio deescala (esc1)
1
O
0.15625
0
0.029236
0
0
0
0
0.515625
0
0.063782
1.100=32
1.110=0
1.120=160
1.130=0
1.140=958
1.101=0
1.111=0
1.121=0
1.131=0
1.102=528
1.112=0
1.122=2090
Objeto D
Invariancia en
traslación
Invariancia encambio de escala
(esc3)
~ooo=87
~1oo=9.536743e-O7
~2oo=1528.413818
~3oo=-386.004822
1
1.096177e-08
17.567975
-0.050998
Hermilo Sánchez: Optimización de una Medida de Semejanza para Objetos Tridimensionales..
/.l4oo=48168.535156
/.lo1o=4.48226ge-05
/.l11o=-88.413803
/.l21o=-183.213135
/.l31o=-2332.521973
/.lo2o=517.747131
/.l12o=107.466461
/.l22o=8633.792969
/.lo3o=-111.198029
/.l13o=-1112.552002
/.lo4o=6954.779297/.lOO1 =-2. 9563ge-05
/.l1o1=31.482759
/.l2o1=3.01742
/.l3o1=669.666077
/.lo11=71.183899
/.l111=82.959579
/.l211=1167.696045
/.lo21=192.381516
/.l121=368.438812
/.lo31=1214.243896
/.loo2=60.229862
/.l1o2=47.426472
/.l2o2=935.522705
/.lo12=169.04863
/.l11~=164.73587
/.lo22=762.975403
/.loo3=99.210197
/.l1o3=110.579216
/.lo13=405.54953
/.loo4=271.552673
6.363923
5.152034e-07
-1.016251
-0.024206
-0.308168
5.951116
0.014198
1.140678
-0.014691
-0.146988
0.91885
-3.39815e-07
0.361871
0.000399
0.088475
0.818206
0.01096
0.154273
0.025417
0.048677
0.160423
0.692297
0.006266
0.123599
0.022334
0.021765
0.100803
0.013107
0.014609
0.05358
0.035877
~201=68.729927
~3o1=162.995163
~o11=53.977005~111=37. 770649
~211=1206.491577
~o21=172.693817
~121=175.771103
~o31=941.933594~oo2=42 .436775
~1o2=19.03594
~2o2=836.585876
~o12=130.287491
~112=78.796211
~o22=598.626648
~oo3=78.399796
~103=61.977261
~o13~314.50766
~004=204.0616
0.00908
0.021535
0.620425
0.00499
0.159399
0.022816
0.023223
0.124446
0.487779
0.002515
0.110528
0.017213
0.01041
0.079089
0.010358
0.008188
0.041552
0.02696
Objeto F
Invariancia en
traslación
~ooo=87
~1oo=-8.58306ge-06
~2oo=1522.482666
~3oo=-23.772869
~4oo=47126.816406
~o1o=2.0504e-05
~110=137.655167
~210=129.255722
~310=2458.357666
~o2o=791.103333
~120=-216.197586
~220=13638.788086
~o3o=-400.223724
~130=2740.707764
~o4o=14045.150391
~001=-1.239777e-05
~101=-15.655175~201 =-21.370535
~301=-256.250793
~011=-116.103523
~111=158.415817
~211=-2118.086182
~021=167.936356
~121=-247.996201
~031=-2068.522217
~oo2=32.436764
~102=-31.001989
~202=543.349426
~012=-21.338438
Invariancia encambio de escala
(esc3)1
-9.865596e-0817.499801-0.0031416.226294
2.356781e-071.5822430.0170770.3247939.093142-0.0285641.801927-0.0528770.3620961.855615
-1.425031 e-07-0.179945-0.002823-0.033855-1.3345230.02093
-0.2798370.022187-0.032765-0.2732890.372836-0.0040960.071786-0.002819
Invariancia en cambiode escala (esc3)
1
1.096177e-07
17.459634
0.010652
6.465596
-3.507768e-07
-1.047034
-0.015931
-0.247726
5.508786
0.018792
1.058711
0.008154
-0.125004
0.775397
-6.577064e-08
0.077553
Objeto E
Invariancia en
traslación
~ooo=87
~1oo=9.536743e-06
~2oo=1518.988159
~3oo=80.621407
~4oo=48938.09375
~o1o=-3.051758e-05
~110=-91.091957
~210=-120.584312
~310=-1875.03479
~o2o=479.264404
~120=142.235382
~220=8013.384766~o3o=61. 720974
~130=-946.156433
~o4o=5868.976563
~oo1=-5.722046e-06
~101=6.747128
Hermilo Sánchez: Optimización de una Medida de Semejanza para Objetos Tridimensionales...
1.1112=80.559418
1.1022=487.449677
1.1003=0.874878
1.1103=-22.834366
1.1013=-118.999275
1.1113=163.780533
1.1004=32.01799
0.010643
0.064401
0.OC0116
-0.003017
-0.015722
0.021638
0.00423
BCDEFG
(613,0)
(6,3,0)
(5, 7,1 )
(517,1)
(5,3,2)
(5,3,2)
Nota: un cálculo preciso del centro de masa arroja valoresreales, pero como se consideran figuras discretas, sÓlo se hatomado la parte entera de dicho cálculo.
Invariancia en cambiode escala (esc3)
14.932798e-08
18.242039-0.0163626.811037
-3.288532e-07-2.859294-0.064917-1.296649.544985-0.0151391.8621510.027873-0.4660271.993171
4.275092e-070.2026690.0006650.123134-1.1533890.01492
-0.2780830.0119630.058297-0.2046840.390276-0.003030.0855470.000429-0.014058
4.527398e-050.002117-0.0132070.004482
~
Objeto G
Invariancia en
traslacion
~000=87
~100=4.291534e-06
~2oo=1587.057373
~3óo=-123.841103
~400=51552.738281
~o1o=-2.861023e-05
~110=-248.758621
~210=-491.359375
~310=-9814.264648
~o2o=830.413696
~120=-114.583534
~220=14094.620117
~o3o=210.970352
~130=-3527.358887~040= 15086.31 0547
~001=3.71933e-05
~101=17.632189
~201=5.036937
~301=932.001526
~011=-100.34481
~111=112.930664
~211=-2104.812256
~021=90.547813
~121=441.249573
~031=-1549.250488~002=33. 95401
~102=-22.936455~202=647 .508423
~012=3.248519
~112=-106.402809
~003=0.342679
~103=16.022408
~013=-99.961685
~004=33.923798
~
Hermilo Sánchez Cruz. Nació en la Ciudad de México.Actualmente es estudiante del doctorado en Ciencia eIngeniería en Computación de la Universidad NacionalAutónoma de México, con sede en el Instituto deInvestigaciones en Matemáticas Aplicadas y en Sistemas.Obtuvo el grado de Físico en la Facultad de Ciencias de laUNAM; en abril de 1995, el grado de maestro en Cienciasde la Computación en febrero de 1998, a través de laUnidad Académica de los Ciclos Profesional y dePosgrado del CCH. Sus áreas de interés son: Visión porComputadora y Reconocimiento de Patrones.
Figura
A
Centro de Masa
(6,3,0)