retrato+hablado (1)

6
Instituto Tecnológico de Chihuahua ELECTRO 2001 125 RECONOCIMIENTO E IDENTIFICACION DE ROSTROS USANDO ANALISIS DE LOS PRINCIPALES COMPONENTES Rose Gómez César Enrique Instituto Tecnológico de Hermosillo Departamento de Sistemas y Computación Avenida Tecnológico S/N Hermosillo, Sonora 83170 Tel. 2 60 65 00 [email protected] RESUMEN. La construcción de retratos hablados tiene como objetivo la identificación de personas basada en las características del rostro, si no se tiene un sistema computarizado, esta identificación puede ser muy laboriosa y tardada. Como complemento del sistema constructor de rostros se ha desarrollado un módulo para el reconocimiento de rostros que nos permite obtener las características principales y posteriormente obtener la identificación de los rostros más similares que se encuentren en una base de datos criminalista. 1. INTRODUCCION. Actualmente encontramos en el mercado internacional diversos sistemas comerciales para la creación de retratos hablados así como para su identificación en una escena o en una base de datos. Estos sistemas son muy costosos y tienen la gran desventaja de que están desarrollados para grupos étnicos que no contienen las características de la morfología facial de la población mexicana. Entre 1993 y 1996 a petición de la Procuraduría General de Justicia del Distrito Federal se desarrolló el proyecto “La cara del mexicano” por parte del Instituto de Investigaciones Antropológicas de la UNAM [3]. El producto final fue un acervo de imágenes con los rasgos más representativos de los rostros de los mexicanos. El uso que inicialmente se le dio a este acervo fue la elaboración de retratos hablados por medio de superposición de imágenes con el programa Adobe Photoshop, una solución viable, pero que consideramos no es lo más adecuado. Debido a lo anterior se ha desarrollado un sistema de cómputo que permite la construcción de retratos hablados y su posible identificación dentro de un conjunto de fotografías. Ya que nuestro objetivo es obtener los rostros más similares a alguno en cuestión, tenemos que considerar un método para la representación de los objetos, en este caso; rostros, y el mecanismo para la recuperación basada en contenido. 2. ESTRUCTURA DEL SISTEMA El sistema básicamente está constituido de dos subsistemas: el constructor de retratos hablados y el subsistema de búsqueda por similaridad como se muestra en la Figura 1. Figura 1 Módulos del Sistema 2.1. Constructor de retratos hablados. Ésta herramienta es en esencia un editor gráfico especializado en utilizar los elementos de rostros de “La cara del mexicano” para realizar imágenes compuestas de rostros y obtener un retrato hablado. La inclusión de los elementos del rostro se hace mediante un control que permite seleccionar rápidamente las imágenes deseadas, en este control se encuentran todas las imágenes que se pueden incluir en el retrato y se encuentran organizadas en las siguientes categorías: Constructor de Retratos Hablados Búsqueda por Similaridad Base de Datos Imágenes

Transcript of retrato+hablado (1)

  • Instituto Tecnolgico de Chihuahua ELECTRO 2001

    125

    RECONOCIMIENTO E IDENTIFICACION DE ROSTROS USANDO ANALISIS DE LOS PRINCIPALES COMPONENTES

    Rose Gmez Csar Enrique

    Instituto Tecnolgico de Hermosillo Departamento de Sistemas y Computacin

    Avenida Tecnolgico S/N Hermosillo, Sonora 83170

    Tel. 2 60 65 00 [email protected]

    RESUMEN. La construccin de retratos hablados tiene como objetivo la identificacin de personas basada en las caractersticas del rostro, si no se tiene un sistema computarizado, esta identificacin puede ser muy laboriosa y tardada. Como complemento del sistema constructor de rostros se ha desarrollado un mdulo para el reconocimiento de rostros que nos permite obtener las caractersticas principales y posteriormente obtener la identificacin de los rostros ms similares que se encuentren en una base de datos criminalista. 1. INTRODUCCION. Actualmente encontramos en el mercado internacional diversos sistemas comerciales para la creacin de retratos hablados as como para su identificacin en una escena o en una base de datos. Estos sistemas son muy costosos y tienen la gran desventaja de que estn desarrollados para grupos tnicos que no contienen las caractersticas de la morfologa facial de la poblacin mexicana. Entre 1993 y 1996 a peticin de la Procuradura General de Justicia del Distrito Federal se desarroll el proyecto La cara del mexicano por parte del Instituto de Investigaciones Antropolgicas de la UNAM [3]. El producto final fue un acervo de imgenes con los rasgos ms representativos de los rostros de los mexicanos. El uso que inicialmente se le dio a este acervo fue la elaboracin de retratos hablados por medio de superposicin de imgenes con el programa Adobe Photoshop, una solucin viable, pero que consideramos no es lo ms adecuado. Debido a lo anterior se ha desarrollado un sistema de cmputo que permite la construccin de retratos hablados y su posible identificacin dentro de un conjunto de fotografas. Ya que nuestro objetivo es obtener los rostros ms similares a alguno en cuestin, tenemos que considerar un mtodo para la representacin de los

    objetos, en este caso; rostros, y el mecanismo para la recuperacin basada en contenido. 2. ESTRUCTURA DEL SISTEMA El sistema bsicamente est constituido de dos subsistemas: el constructor de retratos hablados y el subsistema de bsqueda por similaridad como se muestra en la Figura 1.

    Figura 1 Mdulos del Sistema 2.1. Constructor de retratos hablados. sta herramienta es en esencia un editor grfico especializado en utilizar los elementos de rostros de La cara del mexicano para realizar imgenes compuestas de rostros y obtener un retrato hablado. La inclusin de los elementos del rostro se hace mediante un control que permite seleccionar rpidamente las imgenes deseadas, en este control se encuentran todas las imgenes que se pueden incluir en el retrato y se encuentran organizadas en las siguientes categoras:

    Constructor de RetratosHablados

    Bsqueda por Similaridad

    Base deDatos

    Imgenes

  • Instituto Tecnolgico de Chihuahua ELECTRO 2001

    126

    Cara. Orejas. Tipo de calvicie o cabellera. Pilosidad facial: bigotes y barbas. Cejas. Ojos. Nariz. Boca o labios. Arrugas y lneas faciales. Acn, verrugas, lunares, pecas y cicatrices. Papadas. Torus masculino. Barbilla partida u hoyo en el mentn. Accesorios: lentes, sombreros, aretes. Tambin se encuentran clasificadas por gnero (masculino o femenino). En la figura 2 se muestra una imagen de este tipo.

    Figura 2 Imagen de La cara del mexicano

    Las imgenes al ser cargadas se colocan en la posicin correcta de acuerdo al rostro, esto resuelve una problemtica que se presenta en el mtodo manual, que consiste en tener que seleccionar las partes de la cara en un orden establecido. Asimismo se pueden mover y ajustar en su tamao y aspecto segn se requiera, los cambios se pueden hacer por cada imagen o formando grupos y estas acciones pueden deshacerse si se cometen errores o se estaba probando algn cambio. En la figura 3 se muestra una secuencia de construccin de un retrato hablado. El sistema incluye algunas caractersticas de edicin avanzada, las imgenes se sobreponen usando un mezclado suave, el tono de la imagen se puede cambiar para retratos con piel clara y oscura, tambin se pueden hacer ligeras rotaciones y recortes en las imgenes para ajustarlas a la cara. El sistema permite al usuario visualizar en pequeos recuadros todas las imgenes de una misma categora, as el usuario y la persona que est describiendo el retrato pueden elegir el elemento del rostro que le sea ms adecuado. Algo importante a destacar es la capacidad de funcionamiento en dos monitores, esto hace posible que el usuario tenga a su disposicin todos

    Figura 3 Secuencia de construccin

    del retrato hablado

    los controles de edicin en su monitor, mientras la persona que est describiendo el retrato puede ver en el segundo monitor el retrato a pantalla completa. Los retratos creados pueden exportarse a los formatos JPEG y BMP para su utilizacin en otras aplicaciones, esta exportacin permite hacer cambios en la compresin, calidad y el tamao de las imgenes. 2.2. Bsqueda por similaridad Mucho del trabajo en el reconocimiento de rostros en computadora [1,2,4,8] se ha enfocado a la deteccin de caractersticas individuales tales como los ojos, nariz, boca y forma de la cabeza; y la definicin de un modelo del rostro por la posicin, tamao y relaciones entre estas caractersticas. Este enfoque es un tanto complejo y para algunas aplicaciones no es lo adecuado. Algunos otros trabajos tienen un reconocimiento automtico de rostros caracterizando un rostro por un conjunto de parmetros geomtricos y ejecutando el reconocimiento de patrones basado en estos parmetros. En la actualidad existen una gran diversidad de tendencias. El enfoque usado en este proyecto considera la representacin de la imagen extrayendo caractersticas [5,6,7,9], estas caractersticas pueden estar o no estar relacionadas a nuestra nocin intuitiva de caractersticas del rostro tales como ojos, nariz, boca y pelo. En el lenguaje de la teora de la informacin, se desea extraer la informacin relevante en una

  • Instituto Tecnolgico de Chihuahua ELECTRO 2001

    127

    imagen, codificarla tanto como sea posible y comparar un rostro codificado en un conjunto de modelos codificados de manera similar. Una tendencia simple para extraer la informacin contenida en una imagen de un rostro es capturar la variacin en una coleccin de imgenes, independientemente de cualquier juicio de caractersticas y usar esta informacin para codificar y comparar rostros individuales. En trminos matemticos, se desea encontrar los principales componentes de la distribucin de rostros, o los eigenvectores de la matriz de covarianza del conjunto de imgenes, tratando una imagen como un punto (o vector) en un espacio de muy alta dimensin. Los eigenvectores son ordenados, cada uno contando para una diferente cantidad de la variacin entre imgenes de los rostros. Estos eigenvectores pueden ser pensados como un conjunto de caractersticas que juntos caracterizan la variacin entre las imgenes. Cada imagen contribuye ms o menos a cada eigenvector, de modo que se puede desplegar el eigenvector como un grupo de caras fantasmales a las cuales se les llaman eigenrostros. Cada rostro individual puede ser representado exactamente en trminos de una combinacin lineal de los eigenrostros. Cada rostro puede ser tambin aproximado usando nicamente las mejores eigenrostros, aquellos que tienen los ms grandes eigenvalores y por lo tanto cuenta con la mayor varianza dentro del conjunto de imgenes. Los mejores M eigenrostros expande un subespacio de M-dimensiones de todas las posibles imgenes. 3. REPRESENTACIONES DE ROSTROS USANDO EL ANLISIS DE PRINCIPALES COMPONENTES (PCA) Un rostro es una imagen que puede ser vista como un vector. Si el ancho y la altura de la imagen son w y h pixeles respectivamente, el nmero de componentes de este vector ser w*h. Cada pixel est codificado por un componente del vector. La construccin de este vector desde una imagen es hecha por una simple concatenacin, las filas de la imagen son localizadas una tras otra. El vector del rostro pertenece a un espacio, le llamamos el espacio de imagen, y es donde se encuentran todas las imgenes cuya dimensin es w*h pixeles. El espacio completo de la imagen no es un espacio ptimo para la descripcin del rostro. La idea es construir un espacio del rostro que describa mejor los rostros. Los vectores bsicos de

    este espacio del rostro son llamados principales componentes. La dimensin del espacio de imagen es w*h. Por supuesto, no todos los pixeles del rostro son relevantes y cada pxel depende de sus vecinos. De modo que la dimensin del espacio del rostro es menor que la dimensin del espacio de la imagen. El objetivo del mtodo Anlisis de los Principales Componentes (PCA) es reducir la dimensin de un conjunto o espacio de modo que la nueva base describa mejor los modelos tpicos del conjunto. En nuestro caso los modelos son un conjunto de rostros de entrenamiento. Este mtodo involucra las siguientes operaciones iniciales: 1.-Adquirir un conjunto inicial de imgenes (el conjunto de entrenamiento). 2.- Calcular los eigenrostros del conjunto de entrenamiento, manteniendo nicamente las M imgenes que correspondan a los ms altos eigenvalores. Estas M imgenes definen el espacio del rostro. Cuando nuevos rostros son agregados, los eigenrostros deben ser actualizados o recalculados. 3.- Calcular la distribucin correspondiente en el espacio de pesos de M dimensiones para un individuo conocido, esto es, proyectando su rostro en el espacio de rostros. 3.1. Clculo de los eigenrostros Sea 1,2,3,...M el conjunto de entrenamiento de imgenes. El rostro promedio del conjunto es definido como =(1/M)( 1+2,+3+,...+M) donde cada imagen del conjunto de entrenamiento difiere del promedio por el vector i=i-. El conjunto de entrenamiento es considerado para el anlisis de los principales componentes, el cual busca un conjunto de M vectores ortogonales, n , los cuales describen la distribucin de los datos. El k-simo vector, k, es elegido tal que k=[(kT1)2+(kT2)2+..+(kTM)2]/M es un mximo, sujeto a

    lTk= lk={ 1, si l=k 0, de otra manera Los vectores k y escalares k son los eigenvectores y eigenvalores, respectivamente, de la matriz de covarianza C,

  • Instituto Tecnolgico de Chihuahua ELECTRO 2001

    128

    C=(11T+22T++ MMT)/M=AAT

    donde la matriz A=[12M]. La matriz C, sin embargo es N2 por N2 y determinar los N2 eigenvectores y eigenvalores es una tarea intratable para tamaos tpicos de imgenes. Se requiere un mtodo computacional eficiente para encontrar estos eigenvectores, el cual se describe a continuacin: Si el nmero de puntos de dato en el espacio imagen es menor que la dimensin del espacio (M < N2) habr nicamente M-1, en lugar de N2 eigenvectores. Considere los eigenvectores i de ATA tal que ATAi=ii Multiplicando ambos lados por A, tenemos A ATAi=iAi Donde podemos ver que Ai son los eigenvectores de C = AAT. Siguiendo este anlisis, construimos la matriz L = ATA de tamao M*M, donde Lmm=mTm y encuentra los M eigenvectores l de L. Estos vectores determinan combinaciones lineales del conjunto de entrenamiento para formar los eigenrostros l. l = (l11+l22+....+lMM) para l=1 hasta M. 4. PROCESO DE IDENTIFICACIN Una vez que los eigenrostros han sido calculados, el espacio del rostro ha sido poblado con rostros conocidos. Usualmente estos rostros son tomados del conjunto de entrenamiento. Cada rostro conocido es transformado al espacio del rostro y sus componentes almacenados en memoria. En este punto el proceso de identificacin puede iniciar. Este proceso es mostrado en la Figura 4. Un rostro desconocido es presentado al sistema. El rostro es identificado como el rostro ms cercano en el espacio del rostro. Existen varios mtodos para calcular la distancia entre vectores multidimensionales. En este proyecto, una forma de la distancia Euclidiana es usada. 5. NUESTROS RESULTADOS Para probar nuestro sistema se ha usado una base de datos con 336 imgenes, algunas de ellas se repiten y las imgenes tienen un tamao en el rango de 77 a 86 pixeles de ancho y 94 a 105 pixeles de largo, el lenguaje de programacin

    usado es Java, se ejecut en una computadora Pentium III, de 733 Mhz, con una memoria de 128 Mbytes, en la Tabla 1 se muestran resultados obtenidos usando una imagen a buscar que pertenece al mismo conjunto.

    Tabla 1. Resultados imagenes Conjunto de

    entrenamiento eigenrostros % xito

    en la bsqueda

    336 112 30 100 336 84 30 100 336 84 20 100 336 84 10 100 336 84 5 100 La construccin de retratos hablados con el mtodo manual es lenta y poco prctica, por lo tanto nuestro desarrollo hace ms eficiente este proceso. Adicionalmente el proceso de bsqueda junto con el proceso de construccin de un retrato hablado es de gran utilidad para las autoridades encargadas del combate a la criminalidad. Consideramos que las implicaciones y el impacto social del sistema aqu expuesto son muy importantes, ya que es una necesidad urgente de optimizar los medios para el combate de la delincuencia en nuestro estado y en el pas. 6. BIBLIOGRAFA [1] Huang J., Gutta S., Wechsler H., Detection of Human Faces Using Decision Trees, 2nd International Conference on Automated Face and Gesture Recognition [2] Lawrence S., Lee Giles C., Chung Tos A., Back A.D., Face Recognition: A Convolutional Neural Network Approach, IEEE Transactions on Neural Networks, Special Issue on Neural Networks and Pattern Recognition, Volume 8, Number 1, pp 98-113,1997 [3] Link Karl Franz, Villanueva Mara Sagrado, Quijada Jess Luy, Serrano Snchez Carlos, La Cara del Mexicano. Manual de usuario y referencia, Universidad Nacional Autnoma de Mxico., 1996. [4] Kruizinga P., Petkov N., Person identification based on multiscale matching of cortical images, Lecture Notes in Computer Science, Spinger Verlag 1995, pp 420-427 [5] Pentland A.P., Moghaddam B., Starner T., View-Based and Modular Eigenspaces for Face

  • Instituto Tecnolgico de Chihuahua ELECTRO 2001

    129

    Recognition, IEEE Conference on Computer Vision & Pattern Recognition, 1994 [6] Pentland A.P.,Picard R.W., Sclaroff S., Photobook: Contend-Based Manipulation of Image Databases, International Journal of Computer Vision, Fall 1995 [7] Romdhani S., Face Recognition Using Principal Components Analysis, Technical Report, University of Glasgow

    [8] Samaria F., Fallside F., Face Identification and Feature Extraction Using Hidden Markov Models, Cambridge University Engineering Department [9] Turk M.A., Pentland A.P., Eigenfaces for Recognition, Journal of Cognitive Neuroscience, 3(1); 71-86, 1991

    Figura 4 Proceso de Identificacin

  • Instituto Tecnolgico de Chihuahua ELECTRO 2001

    130