TESIS - Tecnológico Nacional de México campus CENIDET

99
I I SEP SEIT DGIT I I i I 1 TECNOL~GICO I I I SISTEMA DE VISIÓN ARTIFICIAL PARA LA VERIFICACI~N DEL LLENADO DE RECIPIENTES NO OPACOS UTILIZANDO REDES NEURONALES ARTIFICIALES 11 I QUE COMO REQUISITO PARA OBTENER EL GRADO DE i 1 I MAESTRO EN CIENCIAS EN CIENCIAS COMPUTACIONALES PRESENTA: &4TüaO DE INFORMiio, I -~..C~NIDET TESIS ii 1

Transcript of TESIS - Tecnológico Nacional de México campus CENIDET

Page 1: TESIS - Tecnológico Nacional de México campus CENIDET

I I

SEP SEIT DGIT I

I

i I

1 TECNOL~GICO

I I

I SISTEMA DE VISIÓN ARTIFICIAL PARA LA VERIFICACI~N DEL LLENADO DE RECIPIENTES NO OPACOS UTILIZANDO REDES

NEURONALES ARTIFICIALES 11

I

QUE COMO REQUISITO PARA OBTENER EL GRADO DE i 1 I MAESTRO EN CIENCIAS EN

CIENCIAS COMPUTACIONALES

PRESENTA:

&4TüaO DE INFORMiio, I

- ~ . . C ~ N I D E T

T E S I S

ii

1

Page 2: TESIS - Tecnológico Nacional de México campus CENIDET

// I SISTEMA NACIONAL DE INSTITUTOS TECNOL~GICOS

Centro Nacional de Investigación y Desarrollo Tecnológico I! I

FORMA A 3 REVISION DE TESIS

REV 12/97

Cuernavaca, Morelos a 23 de junio de 1998 11 1 ii M.C. Máximo López Sánchez

Presidente de la Academia de Ciencias Computacionales Presente

I Nos es grato comunicarle, que conforme a los lineamientos para la obtención del grado de

Maestro en Ciencias de este Centro, y después de haber sometido a revisión académica la tesis denominada: Sistema de visión artificial para la verificación del llenado de recipientes no ' 1 opacos utilizando redes nouronales artificiales, realizada por el C. Apolinar Velarde Martínez, I/ y habiendo cumplido con todas las correcciones que le fueron indicadas, acordamos no tener 'I objeción para que se le conceda la autorización de impresión de la tesis.

Sin otro particular, quedamos ¿e usted.

Atentamente

La comisión de revisión de tes

Dr. Francisco 3osé Mugica Aivarez

M.C. Patricia R a m l i e l a

. Dr. José Ruiz Ascencio

Asesor ccp Dr. Javier Ortn HernándezIJefe del Departamento de Ciencias Computacionalec

Institutos Tecnológicos ii ( iC0

/I ños de educación superior tecnolóc. ;a en

APARTADO POSiAL5164. CP 6Ñ51. CUERNAVACA. MOR. MhlCO. IEtS. 175112 2314.12 7613. FAX 173) 12 2434. Emit: cenidefI~infotel.nel.~''

Page 3: TESIS - Tecnológico Nacional de México campus CENIDET

D SISTEMA-:NACIONAL DE INSTITUTOS TECNOL~GICOS ;/

FORMA A4 AUTORIZACION DE IMPRESI6N DE TESIS

// REV. 12/97

I Cuernavaca, Morelos a 8 de julio de 1998 I I

/I C. Apolinar Velarde Martínez Candidato al grado de Maestro en Ciencias En Ciencias Computacionales Presente

I Después de haber atendido, las indicaciones sugeridas por la Comisión ' Revisora de la ,I Academia de Ciencias Computacionales en relación a su trabajo de tesis: Sistema de visión artificial para la verificacidn del llenado de recipientes no opacos utilizando redes neuronales , artificiales, me es grato comunicarle, que conforme a los lineamientos establecidos para la1 obtención del grado de Maestro en Ciencias en este Centro, se le concede la autorización

I !I para que proceda con la impresión de su tesis.

I!

I A t e n t a y k t e

Dr. Ja e i Ortiz Hernández Jefe del Departa nto de Ciencias Computacionales P

:'I 'I

1cptyMk*

APARTADO POSTAL 5.164 CP 6ZOSl. CUERWVACA. MOR. MCXICO- TELS. 173112 2314.12 7613, FAX (73) 12 2434. EMAIL: uoniaetlginfosel.net m

Page 4: TESIS - Tecnológico Nacional de México campus CENIDET

Agradecimientos

Al Consejo Nacional de Ciencia y Tecnología (CONACYT) y a la Secretaría de Educación Pública (SEP) por las becas académicas que me otorgó a traves de la Dirección General de Institutos Tecnológicos (DGIT).

Al Centro Nacional de Investigación y Desarrollo Tecnológico (cenidet) por brindarme la oportunidad de realizar mis estudios de posgrado en la maestría en Ciencias en Ciencias Computacionaies.

A mis asesores: M.C. Raúl Pinto Elías y DR. José Ruiz Ascencio por el apoyo brindado durante la realización de este trabajo.

Al Instituto Tecnológico de Aguascalientes, por brindarme la oportunidad de desanol ime como profesionista.

Page 5: TESIS - Tecnológico Nacional de México campus CENIDET

I 1'

',

Un manuscrito no solo Io realiza aquel que lo escribe, sino tambikn aquellos cuyo amor y sacrificio hacen posible su

realizacibn.

Con profundo agradecimiento

A mis padres: Apolinar y Eliazar

Mis Hermanos: Kata, Luz, Eva, Elia,

Eudalia, Anita, Arturo, Rosalía, Blanca y Aracely.

Los quiero mucho

Apolinar

Page 6: TESIS - Tecnológico Nacional de México campus CENIDET

CONTENIDO

CONTENIDO

............................... LISTA DE FIGURAS ........ LISTA DE IMÁGENES ................. ................................ LISTA DE TABLAS ..................... .................................... LISTA DE GRÁFICAS ................................ ....................... INTRODUCCI~N I . ESTADO ACTUAL DE LOS SISTEMAS DE INSPECCION VISUAL

1 .1 MOTIVACI~N .... ............................... 1.2 ANTECEDENTES ....................

1.4 OBJETIVO GENERAL DELPROYECTO ................... 1:s JUSTIFICACI~N DEL DESARROLLO DE UN SISTEMA DE

1.7 REFERENCIAS Y BIBLIOGRAF~A

2.1 INTRODUCCIÓN . . ...............................

......................................... .................................. ...........

.....................

2. VISIbN POR COMPUTADORA ................................... ....................

2.2.1 TRATAMIENTO DIGITAL DE IMÁGENES ......

2.2.2 RECONOCWENTO DE PATRONES (RP)

................ 2.2.1, I FASES DEL TRATAMIENTO DIGITA

................. 2.2.2.1 INTRODUCCI~N .................................. 2.2.2.2 FASES DELRF' ....................................... 2.2.2.3 PATRONES Y CARACTERiSTlCAS ....................... 2.2.2.4 RELACIÓN DEL RF' CON OTRAS AREAS 2.2.2.5 APLICACIONES DEL RF' ....................... 2.2.2.6 ESTRUCTURA DE UN SISTEMA TiPlCO DE RP

2.3 SISTEMA DE INSPECCIÓN VISUAL ................... ............................. 2.3.1 DEFINICIÓN ..................................................

3. PROCESAMIENTO DE IMÁGENES . .................................. 3. I INTRODUCCIÓN . ..........................

INSPECCIÓN VISUAL AUTOMATIZADO (SIVA) ........................................ 3.3 ILUh4INACIÓN ..............................................................

3.3.1 INTRODU ...............................................................

2.3.2 ESQUEMA DE UN SISTEMA DE INSPECCIÓN VISUAL .. 2.4 REFERENCIAS Y B1

3.2 CLASIFICACIÓN DE

3.3.2 &TODOS DE ILUMINACI~N .... 3.3.3 CONCLUSI~N DE LOS &TODOS DE ILUMINACI~N

3.4.1 INTRODUCCI~N ........ ..................................................

UTILIZADOS .................................................................................. .......................................... 3.4 TRATAMIENTO DIGITAL DE IMÁGENES

3.4.2 MEJORA DE LA IMAGEN BASADA EN rÉCNICAS DE PREPROCESAMIENTO

.3.4.2.1 MÉTODOS EN EL DOMINIO ESPACIAL . 3.4.2.2 MÉTODOS EN EL DOMINIO DE LA FREC 3.4.2.3 MORFOLOGíA MATEMÁTICA ... 3.4.2.4 UMBRALIZACIÓN ..............

3.4.2.4.1' INTRODUCCI~N 3.4.2.4.2 DESCRIF'CIÓN DE UNA TÉCNI

UMBRALIZACIÓN .............................. 3.4.3 SEGMENTACI~N DE IMÁGENES .........................................

3.4.3.1 INTRODUCCIÓN ...................... .......

Pdgina I

I I I1

i II 111 I I 2 3 7

7 8 10 I 1 I I I 1 I I 12 13 13 13 14 17 17

I 19 19 19 20 21 22 22 22

24 24 25

28 30 30

30 30 31 32 33 33

34 34 34

Page 7: TESIS - Tecnológico Nacional de México campus CENIDET

CONTENIDO

3.4.3.2 DETECCIÓN DE DISCONTINUIDADES ................... 3.4.3.2.1 DETECCIÓN DEPUNTOS ................... 3.4.3.2.2 DETECCIÓNDE LÍNEAS 3.4.3.2.3 DETECCIÓN DE BORDES .........................

DE LAS IMÁGENES UTILIZADAS POR EL SIVA ......................... 3.4.4.1 RESULTADO DE LA APLICACIÓN DE LAS TÉCNICAS

3.4.4.2 RESULTADOS DE LA APLICACIÓN DE LAS TÉCNICAS

3.4.4.3 RESULTADOS OBTENIDOS AL APLICAR EL &TODO

.......,.... <... ...

3.4.4 RESULTADOS OBTENIDOS CON EL PROCESAMIENTO DIGITAL

PARA EL PREPROCESAMIENTO DE LA IMAGEN .......

PARA EL MEJORAMIENTO DE BORDES

DE UMBRALIZACI~N

......

3.5 REFERENCIAS Y BIBLIOGRAFIA ...........

4.1 REPRESENTACIÓN Y DESCRIPCIÓN 4.2 TRANSFORMADA DE FOURIER .................................................... 4.3 EL RP Y LAS REDES NEURONALES ARTIFICIALES (RNA) ....................... 4.4 MECANISMOS DE APRENDIZAJE DE LAS RNA ................................ 4.5 VENTAJAS DE LAS REDES NEURONALES ARTIFICIALES .........................

4.RECONOCIMIENTODEPATRONESRP ...................._.<.......

4.6 MODELO DE APLICACIÓN ................................................ 4.7 CONCLUSIONES OBTENIDAS DE LA APLICACIÓN DE LAS TÉC

DE RP ..................................................................................... 4.7.1 RESULTADOS OBTENIDOS AL APLICAR LA FASE DE

4.7.2 RESULTADOS OBTENIDOS AL APLICAR LA FASE DE

4.6 REFERENCIAS Y BIBLIOGRAFIA ......................................................

5.1 INTRODUCCIÓN ........................................................................... 5.2 EXPERIMENTOS REALIZADOS CON EL SIVA ....... ............. ... 5.3 DISCUSiÓN SOBRE EL SISTEMA DE SOFTWARE DEL SIVA

._......._____................_.._.<........................ 6.1 CONCLUSIONES ................................................. 6.2 TRABAJOS FUTUROS

A. SISTEMA DEINSPECCI~N VISUAL ..................... a TERMINOLOC~A DE REDES NEURONALES ARTIFICIALES c. TERMINOLOG~A DEL SIVA ...................................

REPRESENTACIÓN Y DESCRIPCIÓN ..........................

RECONOCIMIENTO E INTERPRETACI~N ....................

5. EXPERIMENTA CIÓN . , , . . . . . . . . . , . , , . . . . . . . . . . . . . . . . . . . . . . . , . . , , . . . . , , . . . . . . . . . . . . . . . . . . . . . . .

6. CONCLUSIONES Y TRABAJOS FUTUROS

.......... <............... . ............ <<......<........ 7 APENDICES

35 36 36 36

37

37

38

40 42 43 43 43 45 45 46 47

51

51

54 57 58 58 62 69 71 71 73

74 84 86

Page 8: TESIS - Tecnológico Nacional de México campus CENIDET

LISTA DE FIGURAS

I

Page 9: TESIS - Tecnológico Nacional de México campus CENIDET

LISTA DE IMÁGENES, TABLAS Y GRÁFICAS

Tabla Descripción 4.1 4.2 4.3 5.1 Calidad del entrenamiento 5.2

Patrón objetivo para la forma del recipiente Patrón objetivo para el nivel del recipiente Patrón objetivo para la tapa del recipiente

Calidad del reconocimiento del sistema

Página 55 56 56 64 65

Gráfica Descripción 5.1 5.2

Gráfica de la calidad de entrenamiento Gráfica de la calidad de reconocimiento

I1

Página 65 66

Page 10: TESIS - Tecnológico Nacional de México campus CENIDET

de satélite. I

Las RNA son una metodología que pueden manejar las imprecisiones e incertidumbres en la información cuando se trata de resolver problemas relacionados con el mundo real (reconocimiento

implementación. 1

computación inspirados en el funcionhiento del cerebro humano. Estos sistemas que involucran

i i ! de formas, toma de decisiones, etcétera), ofrecen soluciones robustas y de relativamente fácil

A través del uso de redes neuronales artificiales se intenta expresar la solución de problemas complejos, no como una secuencia de pasos, sino como la evolución de unos sistemas de

una amalgama de investigaciones en diversos campos tales como la psicología, neurociencias, " ciencias cognoscitivas y teoría de sistemas, son la combinación de una gran cantidad de elementos

'I ~

I i

III

codificación, clasificación, control, optimización, etcétera.

El presente proyecto desarrolla un sistema de inspécción visual automatizada, apoyado en las tecnologías del TDI y las RNA, dirigido a la industria y dedicada al envasado de refrescos.

El trabajo está estructurado de la siguiente manera:

1 .

I '

Page 11: TESIS - Tecnológico Nacional de México campus CENIDET

INTRODUCCI~N & -

En el capítulo 3 se plantea una posible clasificación de objetos para el Sistema de Inspección Visual, los métodos de iluminación utilizados en entomos industriales, las técnicas para el trufamiento digitdde imágenes y las conclusiones de las pruebas realizadas con la aplicación de las técnicas propuestas.

Las técnicas para el reconocimiento depatrones se tratan en el capítulo 4, así como los mecanismos de aprendizaje de las redes neuronales, las ventajas de éstas y el modelo de RNA implementado en el Sistema de Inspección Visual Automatizado (SIVA) que se propone, as1 como su desarrollo.

La fase de experimentación se explica de forma detallada en el capitulo 5 y las conclusiones y trabajos futuros que se pueden derivar de este proyecto de tesis se exponen en el capitulo 6.

En el apéndice A, se explica en forma detallada el sistema general de archivos del SIVA, el funcionamiento general de este sistema y sus características.

En el apéndice B, se definen algunos de los términos relacionados con las RNA útiles para el mejor entendimiento del paradigma implementado en el SIVA.

Finalmente, los términos utilizados para describir el funcionamiento del STVA y algunos conceptos relacionados con el TDI se definen en el apéndice C.

IV

Page 12: TESIS - Tecnológico Nacional de México campus CENIDET

Capítulo 1 ESTADO ACTUAL DE LOS SISTEMAS DE INSPECCI~N VISUAL

CAPITULO 1 ESTADO ACTUAL DE LOSSISTEMAS DE

INSPECCI~N VISUAL 1.1 M O T I V A C I ~ N

En muchos procesos de manufactura con producción en masa se intenta obtener una calidad del 100% de todas las partes, subeiisamblados y productos terminados. Una de las tareas más dificiles en estas actividades es la inspección visual, que busca identificar defectos funcionales y cosméticos. Los adelantos en las altas velocidades de procesamiento. memorias cada vez más grandes y computadoias menos caras, además del desarrollo del procesamiento de imágenes, el reconocimiento de patrones y la inteligencia artificial, han dado como resultado la constmcción de equipos con hardware y @ w a r e mejores y más baratos para el análisis de imágenes industriales. Esto ha permitido que algunas industrias, como las dedicadas a la elaboración de tarjetas impresas para computadoras electrónicas, empleen inspeccihn visuai automatizada en procesos de fabricación y manufactura.

Acíualmente se requieren 20 actividades en el proceso de fabricación de tarjetas para computadoras electrónicas que implican el trabajo de vanos inspectores humanos. Ellos simplemente inspeccionan el trabajo visualmente según los estándares prescritos. Las decisiones hechas por los inspectores humanos regularmente involucran juicios subjetivos, es una labor intensa y por Io tanto costosa, mientras que los sistemas de inspección automatizada eliminan los aspectos subjetivos y suministran rapidez y calidad. Estos sistemas no tienden a cansarse, no sufren agotamientos y son invariables día tras día. Cuando un sistema de esta naturaleza se aplica apropiadamente en el proceso de ensamblado puede prevenir defectos, reducir costos de revisión y realizar pruebas (automáticamente) más eficientes. Todo esto puede sighticar la reducción de costos. Estas ventajas han propiciado el requerimiento de sistemas que vayan más allá de lo que la inspección visual humana (inspecci6n ocular) es capaz de realizar, dando lugar ai desarrollo de los Sistemas de Inspección Visual Automatizados (SIVA).

I

Page 13: TESIS - Tecnológico Nacional de México campus CENIDET

Capitulo I ESTADO ACTUAL DE LOS SISTEMAS DE INSPECCIÓN VISUAL

La inspección visual automatizada ha introducido mejoras, que han venido a ser parte del medio ambiente industrial moderno principalmente en las siguientes actividades:

En los procesos de manufactura que atentan contra la salud humana, En el control de calidad de las partes y del producto que ha sido elaborado, que el ser humano tiene dificultad de realizar, En la producción en masa donde la inspección habitual humana no es factible, por la velocidad y la cantidad de los productos que viajan a través de la banda transportadora. En la localización de defectos que presentan un alto grado de complejidad para su detección en los productos, y En la elaboración de productos donde son requeridas diferentes formas de inspección que implican fijar la vista del inspector por largo tiempo.

Uno de los aspectos del embotellado de las bebidas carbonatadas es la conservación de la calidad y uniformidad del producto [Zapata 19861. Esta calidad y uniformidad implican la verificación de recipientes (en industrias dedicadas al llenado de envases) una vez que han pasado por el proceso de llenado y tapado. Generalmente esta inspección se realiza de una forma habitual; la ejecutan diferentes inspectores en periodos de tiempo corto (20 a 30 minutos cada uno) para evitar la fatiga de la vista, pues no son capaces de soportar tiempos más largos y, aunque son remplazados, su capacidad de verificación regularmente retrasa el paso de envases llenos por la banda transportadora del producto.

Finalmente, cabe señalar que los procesos industriales que requieren una inspección visual por parte de seres humanos a menudo implican un esfuerzo considerable, por lo que los riesgos de la degradación de la vista humana son considerables. El fijar la vista por periodos de tiempo largos, conlleva a una serie de trastornos fisicos en los ojos de las personas, por lo que los trabajos que requieren este tipo de esfuerzos se consideran de alto riesgo, al demostrarse que el sentido de la vista es uno de los más importantes y delicados en la vida del ser humano.

1.2 ANTECEDENTES La necesidad de la mejora de las imágenes se remonta a. la década de los años 20 cuando por primera vez se transmitieron fotografías digitalizadas de periódicos, vía cable submarino, entre las ciudades de Londres y Nueva York, las cuales fue necesario mejorar mediante un equipo especializado de impresión. Este equipo codificaba las imágenes para transmisión por cable y luego las reconstmía en el extremo de recepción [González, 19963. Estos métodos de procesamiento para las imágenes digitales transmitidas continuaron durante los siguientes treinta y cinco años. Tiempo después, con el advenimiento combinado de las computadoras digitales de gran potencia y del programa espacial norteamericano, se puso de manifiesto el potencial de los conceptos del tratamiento digital de imágenes (TDI).

Desde la década de los años 60 hasta la actualidad las técnicas de tratamiento digital de imúgenes (TDI) han progresado vigorosamente, empleándose actualmente para resolver problemas muy diversos. El interés por éstas deriva de dos áreas principales de aplicación:

La mejora de la informaci6n pict6rica para la interpretación humana y, El procesamiento y extracción de los datos de la escena para la percepción autónoma por una máquina.

2

Page 14: TESIS - Tecnológico Nacional de México campus CENIDET

Capíiulo 1 ESTADO ACTUAL DE LOS SISTEMAS DE lNSPECCI6N VISUAL

Algunos campos de aplicación en la primera área están relacionados con [González, 19961: La medicina, Lageografla, La arqueología, La ffsica y campos afines, y Otras áreas como la astronomía, biología, medicina nuclear, investigaciones judiciales, defensa y aplicaciones industriales.

Algunos problemas típicos donde la percepción automatizada utiliza rutinariamente las técnicas de ”DI tienen que ver con:

Los reconocimientos militares, El reconocimiento automático de caracteres,

La identificación automática de‘huellas digitales, El análisis automático de imágenes de rayos X, El procesamiento automático de las imágenes aéreas y de satélite para la predicción de clima y la evolución de cultivos y, El ensamblado e inspección de productos industriales.

Las aplicaciones de la inspección v&ual aulomafizada en las fábricas son para mejorar el control de la calidad de los productos generados y para mejorar la calidad de la manufactura [Galbiati,l996].

1.3 ESTADO DEL ARTE

Aunque en la literatura se han encontrado varios proyectos relacionados con la visión por computadora y el reconocimiento de patrones visuales, se han seleccionado solamente cuatro trabajos por su estrecha relación con el proyecto de tesis. Estos son: “A Method for Automating the Visual Inspection of Printed Wiring Boards” [Jarvis, 19801

“Area Segmentation of images Using Edge Points” [Perkins, 19801 “Object Recognition of One-DOF Tools by Back-Propagation Neural Net” [Kim, 19951 “A Multiscale Assembly Inspection Algorithm” [Khawaja, 19961 J.F. Jarvis [Jarvis, 19801 plantea el desarrollo de un sistema de inspección visual que permite la verificación automática de la calidad de tarjetas impresas para computadoras. Este sistema permite encontrar características irregulares, es decir que no cumplen los requisitos de calidad establecidos. Para el funcionamiento del sistema se construyó una base de imágenes de 80 elementos de tamaño 5 12x5 12 pixeles, determinados al segmentar varias imágenes de tarjetas consideradas como patrones aceptables dentro de los estándares de calidad. Para la inspección de los objetos (tarjetas) se utiliza una estrategia de dos estados: en el primer estado se lleva a cabo una segmentación de la imagen de entrada. Estos segmentos se comparan con los objetos de la base de datos; aquellos que no se encuentren en la lista de objetos pasan al segundo estado donde se lleva a cabo un análisis detallado de aquellos patrones que no aparean con los almacenados. Este análisis utiliza un conjunto de características de los patrones, para determinar si el patrón de entrada es o 110

indicativo de una tarjeta con defectos. W.A. Perkins [Perkins, 19801 propone un método, que utiliza una técnica denominada expansión y contracción por los dos procesos que realiza,.que permite segmentar una imagen en un conjunto de regiones con niveles de gris uniforme, mediante los bordes de los objetos en las imágenes. El método propuesto implica encontrar discontinuidades bruscas basadas en criterios de disimilaridad (bordes) y las utiliza para realizar segmentaciones de regiones de intensidad uniforme, es decir, regiones de la imagen que presentan en sus pixeles valores semejantes o iguales, dado un criterio de comparación.

3

Page 15: TESIS - Tecnológico Nacional de México campus CENIDET

Capiiulo 1 ESTADO ACTUAL DE LOS SISTEMAS DE INSPECCIÓN VISUAL

El proceso de expansión se aplica a regiones de borde de la imagen, este proceso implica recorrer cada uno de los pixeles de las regiones de bordc de la imagen asignando una etiqueta a sus pixeles vecinos que tengan un valor muy semejante al mismo e ignorando los que tengan un valor distante, y el proceso de contracción es para separar aquellas regiones que han sido etiquetadas por el proceso anterior. Este método permite encontrar discontinuidades fuertes (cambio bruscos en los niveles de gris) que se utilizan para realizar una segmentación de regiones con intensidades uniformes.

En general el método se basa en la aplicación del operador de bordes de Sobel, el cual, se aplica sobre cada pixel de la imagen produciendo bordes fuertes y direcciones de borde. Los bordes generados se adelgazan, mediante la operación de adelgazamiento para producir crestas fuertes, realizando de esta manera un umbralizado automático. Los topes máximos separan regiones de diferentes intensidades. Finalmente la segmentación de regiones de intensidad uniforme, se realiza expandiendo las regiones de borde al etiquetar aquellas áreas que posean niveles de gris semejantes.

Kim [Kim, 19951 desarrolla un método de clasificación de herramientas con un grado de libertad. El procedimiento para llevar a cabo el reconocimiento del objeto es el siguiente: primero se obtiene una imagen del objeto con la ayuda de una cámara y se extraen sus bordes utilizando la técnica del operador de bordes de Sobel. Utilizando los coeficientes de Fourier de los datos de borde se obtiene un conjunto de descriptores de Fourier invariantes a la rotación, la traslación y el tamaño. Segundo, se entrena una red neuronal de retropropagación (Backpropagation) con el vector de características de algunos objetos muestra; de esta forma la red neuronal recibe como entrada, para el entrenamiento, el objeto que se desea reconocer.

Khawaja [Khawaja, 19961 presenta el desarrollo de un sistema para la automatización de la inspección del ensamblado de partes mecánicas utilizando un algoritmo de entrenamiento con imágenes simuladas de las partes que integran un objeto. Una característica importante del sistema es que, una vez entrenado el algoritmo, es posible detectar errores en las partes de un producto que está en proceso de ensamblado, examinando imágenes reales de sus partes y del producto completo. Este sistema está basado en la comparación de imágenes, con modelos de los objetos que incluyen variaciones en los niveles de gris, utilizando procesamiento digital de imágenes.

El proceso se inicia utilizando información de imágenes simuladas de entrenamiento similares a las utilizadas en el ensamblado del producto, pero incluyendo un rango de tolerancia aceptable en cuanto a defectos de las mismas. Estas imágenes se utilizan para crear un árbol del objeto como el que se muestra en lafigura 1.1, que describe cómo los errores de ensamblado pueden manifestarse en la imagen. El algoritmo de entrenamiento usa las imágenes y el árbol del objeto para determinar:

Un modelo de la escala de gris aceptable y, Las posiciones de las variaciones de una imagen en un ensamblado real.

4

Page 16: TESIS - Tecnológico Nacional de México campus CENIDET

Capiiulo 1 ESTADO ACTUAL DE LOS SISTEMAS DE INSPECCI~N VISUAL

lmsgenes sintkticas de entrenamienlo normalizada

modelo

Figura 1.1. Proceso para obtener los parámetros de un modelo.

El algoritmo de entrenamiento genera como resultado un conjunto de parámetros normalizados, que representa una descripción detallada del patrón. El proceso de inspección y pertenencia de una parte a un producto, empieza al construirse un bosquejo de la imagen de entrada y una plantilla de la misma para, de esta forma, calcular la probabilidad de pertenencia de la parte al objeto. Esta probabilidad se calcula mediante un proceso de búsqueda en el árbol del objeto, el cual arroja como resultado un conjunto de datos que expresan el grado de pertenencia de la parte en cuestión a la estructura del objeto. La búsqueda a través del árbol continúa hasta que un radio de probabilidad excede un umbral de decisión, en cuyo punto la búsqueda regresa al estado asociado con la posición de la parte que se analiza. La búsqueda termina en una condición de no semejanza si el proceso alcanza un punto donde todos los candidatos restantes tienen probabilidad menor que un umbral de rechazo.

El proceso de revisión minuciosa de estos trabajos nos permite obtener un panorama más amplio de los actuales proyectos en desarrollo, las tecnologías utilizadas y las metodologfas propuestas. De igual forma ofrece la posibilidad de saber si no se encuentra en desarrollo o ya se haya desarrollado un sistema semejante o igual al que se propone. La principal motivación de llevar a cabo esta revisión fue cubrir los dos puntos anteriores para, finalmente, presentar las siguientes conclusiones:

En la revisión del estado del arte se ha encontrado que los principales objetivos al desarrollar sistemas de inspección visual automatizados son el mejorar la calidad de los productos y disminuir los costos en la producción dentro de la industria, pues estos son cada vezmás importantes en los procesos de manufactura y tanto la exactitud como la inspección eficiente se toman críticas [Khawaja, 19961. Debido a la complejidad de los ensamblados eléctricos y mecánicos se ha alcanzado un punto donde el inspector humano se fatiga, no es seguro y el proceso se toma caro. Esto ha motivado a muchas empresas de manufactura el desarrollo de sistemas de inspección visiral automatizadas para el control de la calidad de diferentes productos, por ejemplo, los ana1,izados en las publicaciones mencionadas. Son varias las técnicas utilizadas para el reconocimiento de estos objetos pero, básicamente, las disciplinas en que se apoyan son el tratamiento digital de imágenes (TDI) y el reconocimiento depatrones. Los métodos propuestos para llegar al entendimiento de una imagen o reconocimiento de objetos presentes en una escena pueden, en general, resumirse en dos gmpos: los métodos basados en plantillas y los métodos basados en características.

Los métodos basados en plantillas realizan un proceso de comparaci6n, matching, entre un conjunto de imágenes almacenadas en una base de datos y una imagen de entrada. Estos métodos a través de los años se han visto 'como métodos caros computacionalmente [Khawaja, 19961. Sin embargo, para la operaci6n de comparación de los patrones se plantea la búsqueda binaria, la cual puede ser llevada a cabo con un número de operaciones menor o

5

Page 17: TESIS - Tecnológico Nacional de México campus CENIDET

capítulo I ESTADO ACTUAL DE LOS SISTEMAS DE INSPECCI~N VISUAL

igual a log2(N), donde N es el númen> de valores almacenados en la base de datos [Jarvis. 19801. También el desarrollo de algoritmos para accesos rápidos a las bases de datos han permitido hacerlos eficientes y para seguirse utilizando en la actualidad.

Los métodos basados en características permiten la aplicación de técnicas para extraer características complejas del objeto, tales como el área, la longitud de un borde del objeto en escena, el número de regiones distintas de un patrón individual y la longitud del, contorno del objeto [Jarvis. 1980]. Cada una de estas características se evalúa sobre el conjunto de patrones considerados como libres de defectos, para así obtener datos representativos de ellos y determinar, una vez calculadas también las Características del patrón de entrada, si los valores obtenidos están dentro de los límites planteados para considerarlo como aceptable y obtener así su correcta identificación.

Los métodos basados en plantillas llegan al reconocimiento de los objetos en escena directamente después de realizar el proceso de comparación, en tanto que los métodos basados en caracterisricas utilizan las propias extraídas de los objetos en escena y se apoyan en las técnicas de reconocimienio de patrones. En forma general, el reconocimiento de patrones es la ciencia que trata de la descripción y la clasificación (reconocimiento) basados en un sistema de características medibles [Schalkoff, 19921. El mktodo más ampliamente usado en la actualidad para el reconocimiento de patrones como clasificador, es sin duda el método neuronal, debido a que ha resultado sorprendentemente exitoso para aplicaciones en problemas cuya resolución no es adecuada mediante procesos secuenciales, por ejemplo en aplicaciones que:

Deben realizar complejas transformaciones de datos, que normalmente no poseen una función de correspondencia predefinida que describa el proceso de traducción o, Aquellas que deben proporcionar una "mejor aproximación" como salida cuando se les presentan datos de entrada con ruido o similares.

Las redes neuronales artificiales han resultado útiles para atacar problemas que requieren el reconocimiento de tramas complejas y la realización de funciones de correspondencia,no triviales.

Las redes clasificadoras que separan objetos con vanos grados de libertad contenidos en una imagen (el mismo objeto presenta diferentes posiciones en la imagen) son de gran utilidad pues el reconocimiento de objetos en diferentes posiciones es uno de los problemas que se enfrenta ai desamollar un sistema de reconocimiento de objetos, y 'una red neuronal con mas de 2 capas puede definir grupos no convexos [Kim, 19951.

En general, el objetivo final de los sistemas descritos ha sido el desarrollar sistemas de inspección visual automatizados para la verificación de productos en la industria mediante técnicas de tratamiento digital de imágenes, y de reconocimiento de patrones, con las cuales se obtengan parámetros que identifiquen el objeto en escena (reconocimiento) y. finalmente, verifiquen si el objeto en cuestión cumple con los estándares de calidad establecidos para su elaboración. Dentro de la bibliografía revisada no se ha encontrado un sistema aplicable al reconocimiento de recipientes como frascos o botellas. Por lo anterior, se ha llevado a cabo una investigación dirigida a las industrias que se dedican al llenado de recipientes y se plantea el desarrollo de un sistema que permita verificar, automáticamente, la forma del envase, el nivel de líquido contenido en él y la correcta colocación de la tapa.

'r

6

Page 18: TESIS - Tecnológico Nacional de México campus CENIDET

ESTADO ACTUAL DE L S SISTEMAS DE INSPECCIÓN VISUAL b Capítulo 1

El desarrollo de esta investigación involucra el uso de iluminación controlada, de las tknicas del procesamiento digital de imágenes y del reconocimiento de patrones, como lo muestra la figura 1.2. su utilización permiti6 impiementar el Sistema de visión artificial para la verificaci6n de recipientes no opacos utiiizando redes neuronales artinciales que presentamos en este trabajo.

1 para la verificación de recipientes no opacos

iitilizando redes neuronales

Figura 1.2. Esia figura muestra la forma en que se eStrucNra el sistema de visión artificial para la verificación de recipientes no opacos.

1.4 OBJETIVO GENERAL DEL PROYECTO

Diseñar un Sistema de Inspección Visual Automatizado, haciendo uso de las técnicas de tratamiento digital de imágenes y de reconocimiento de patrones, para la verificación del llenado de recipientes no opacos, detectando su forma, el nivel del líquido que contiene y la calidad del tapado de los mismos, así como el desarrollo de un ejemplo que muestra su viabilidad.

1.5 JUSTIFICACI~N DEL DESARROLLO DE UN SISTEMA DE INSPECCI~N VISUAL

Cuando es necesario desarrollar un proyecto que involucra la elaboración de programas de computadora, tenemos dos opciones para solucionarlo: adquirir un sistema que ya existe en el mercado o desarrollar un sistema propio [Davis, 19971. La primera opción nos permite, además de ahorrar tiempo y esfuerzo, reducir los costos de mano de obra, pero frecuentemente los sistemas que adquirimos que no son lo suficientemente flexibles para adaptarse a todos los cambios que una empresa o institución plantea. Por esta opción nos adaptamos a sistemas ngidos y forzamos una adecuación de herramientas a problemas existentes; además, trabajamos en los limites que imponen los sistemas que adquirimos y nos negamos la opominidad de desarrollar sistemas propios que se traducen en tecnología. La segunda opción nos ofrece la ventaja de construir nuestra propia tecnología, valorar la calidad del sistema y determinar en qué nivel de madurez lo podemos colocar. También, cuando construimos equipos y sof lare para problemas reales, es posible darse cuenta si solucionamos exitosamente el problema proyectado y si las necesidades de una empresa, institución o industria, traducidas como necesidades del cliente quedan satisfechas o, por el contrario, si fuialmente fallamos al intentar solucionar el problema y las necesidades del cliente no fueron satisfechas.

' I

I

Page 19: TESIS - Tecnológico Nacional de México campus CENIDET

Capítulo 1 ESTADO ACTUAL DE LOS SISTEMAS DE INSPECCIÓN VISUAL

Una indagación llevada a cabo en la industria dedicada al envasado de refrescos en la ciudad de Cuemavaca, Morelos, nos permitió verificar que no existe un sistema instalado que permita la verificación de la correcta colocación de la tapa, el nivel del líquido y la forma de recipientes no opacos ya llenados y tapados. En la industria esta inspección es hecha por empleados quienes ejecutan una inspección visual frente a una banda transportadora, utilizan un equipo dotado con iluminación adecuada para' que se observen todas las partes de las botellas, laboran en periodos de tiempo no mayores que 30 minutos para evitar la fatiga en la vista, 'en una labor que no permite distracciones. Estos inspectores observan las botellas llenas que pasan ante un fondo blanco, el cual tiende a cansar y degradar su vista. En una jornada laboral de 8 horas son necesarios 5 inspectores para desarrollar esta intensa labor, por lo que son cambiados con frecuencia para evitarles, además de su fatiga visual, su falta de concentración, que puede incidir desfavorablemente en la importante tarea de controlar la calidad del producto terminado.

Lo anterior pone de manifiesto la necesidad del desarrollo de un sistema de inspección visual automatizado, usando las técnicas del tratamiento digital de imágenes y el reconocimiento de patrones. que permita verificar:

La forma de un envase, (ver imagen i.i), pues las formas de los envases en la industria embotelladora regularmente varían en la forma e incluso en el tamaño, El ni,)eel de liquido, dado que la industria dedicada al envasado de líquidos fija un nivel mínimo y un nivel máximo admisibles en el llenado de los recipientes, L~ correcta colocación de la tapa, debido a que, después del proceso de llenado de 10s recipientes, las tapas coronas de la botella pueden quedar mal colocadas 0 romperse de la pafie superior de la botella ai pasar por la tolva de la h a d o r a 0 estar Presentes irregularidades en la botella misma.

.

.

.

Imagen 1.1. Muestra de un recipiente una vez que ha pasado por el proceso de llenado y tapado.

1.6 ALCANCE DEL SISTEMA DE INSPECCIÓN VISUAL AUTOMATIZADO El sistema propuesto en este proyecto de tesis consiste en el uso de tkcnicas para el .tratamiento digital de imágenes y el reconocimiento de patrones; estas técnicas las utiliza el sistema de cómputo automatizado diseñado para la verificación de la forma, el nivel y el tapado de recipientes no opacos (botellas de refresco), de los cuales se realiza una clasificación identificando aquellos con defectos y sin defectos.

El sistema de inspección visual automatizado tiene la capacidad de procesar imágenes de 105 columnas y 216 renglones de tamaño, lo que nos da un total de 22,680 pixeles por imagen, con 4 bits por pixel; el proceso de obtener imágenes de este tamaño se realiza, una vez capturada la imagen, mediante una cámara de video CCD.

I

8

Page 20: TESIS - Tecnológico Nacional de México campus CENIDET

. .

Capítulo 1 ESTADO ACTUAL DE LOS SISTEMAS DE MSPECCIÓN VISUAL

Dentro del sistema se ha contemplado un movimiento horizontal del objeto ya sea hacia la izquierda o hacia la derecha de aproximadamente 5 milímetros, lo que nos permite suponer quz el objeto no se encuentra perfectamente ubicado al centro de la imagen. Esto se hace con el fin de simular el movimiento de los recipientes en la banda transportadora, tomando en cuenta que las botellas son captadas en la realidad mediante la cámara con un corrimiento ya sea hacia la izquierda o hacia la derecha del centro de la imagen.

El sisfema de inspección visual aufornafiuido parte de la suposición de que existe un dispositivo de adquisición de imágenes frente a una banda transportadora de productos, que transmite a la computadora la imagen de un objeto en escena en que se realiza la verificación.

9

Page 21: TESIS - Tecnológico Nacional de México campus CENIDET

Capítulo 1 ESTADO ACTUAL DE LOS SISTEMAS DE INSPECCIÓN VISUAL

1.7 REFERENCIAS Y BIBLIOCRAFiA [Davis, 19971 Alan M. Davis, “Why Build Software?,” Software IEEE, Volume 14, number 1, pp. 4-5, January-February 1997.

[Galbiati, 19921 Louis J. Galbiati, Jr. Machine Vhion and Digital Image Processing Fundamentals, USA, Prentice Hall.

[González, 19961 Rafael C. González y Richard E. Woods, Tratamiento digital de imágenes. EUA. Addison- Wesley Iberoamericana.

[Janiis, 19801 J. F. Jarvis, “A Method for Automating the Visual inspection of Printed Wiring Boards,” IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. PAMI- January 1980.

NO. 1, pp. 77-82,

[Khawaja, 19961 Khalid W. Khawaja, Anthony A. Maciejewski, Daniel Tretier, and Charles A Bouman, “A Multiscale Assembly Inspection Algorithm,” IEEERobofics &Automation Magazine, Vol. 3, No. 2, pp. 15-21, June 1996.

[Kim, 19951 Hongbong Kim and Kwanghee Nam, “Object Recognition of One-DOF Tools by Back-Propagation Neural Net,” IEEE Transactions on neural networks, Vol. 6, NO. 2, pp. 757-761 March 1995.

[Perkins, 19801 W.A Perkins, “Area Segmentation of Images Using Edge Points,” IEEE Transactions on Pattern Analysis andMachhe Intelligence, Vol. PAMI-2, NO. I, pp. 8-14, January 1980.

[Sckalkoff, 19921 Robert J. Schalkoff Pattern Recognition: Statistical, Structural and Neural Approach. USA. John Wiley & Sons, Inc.

[Zapata, 19861 Juan Zapata Ruiz Manual práctico de bebidas para la industria del refresco, E.UA y México. All Americas Publishers Service, Inc. ’

10

Page 22: TESIS - Tecnológico Nacional de México campus CENIDET

VISIÓN POR COMPUTADORA Capíiulo2 ,

CAPITULO 2 VISZÓN PO3 COMPUTADORA

2.1 INTRODUCCI~N “La visión por computadora es multidisciplinaria en el sentido de que utiliza el conocimiento de la ingeniería tradicional y la programación de computadoras para los diferentes procesos que se involucran” [Galbiati, 19921. “En términos generales la visión por computadora comprende un amplio rango de hardware, sofmare y recursos tebricos” [González, 19961.

Se considera un sistema de visión por computadora a un sistema que pretende emular el funcionamiento del sistema de visión humana (SVH) por medio de dispositiFos eléctricos, electrónicos, ópticos y mecánicos.

El interés por desarrollar un sistema de visión por computadora es con el fin de extraer información de una imagen de forma conveniente para su procesamiento, es decir, encontrar la solución de problemas relacionados con la percepción automatizada remplazando al hombre de tareas tediosas y dificiles de llevar a cabo.

2.2 PARTES DE UN SISTEMA DE VISIÓN POR COMPUTADOU’ “Un sistema de visión por computadora consta de los elementos necesarios para obtener una representación digital de una imagen visual mediante las técnicas del tratamiento digitui de imágenes” [Galbiati, 19921, para representar y describir los datos de la misma y de la tecnología del reconocimiento de patrones para interpretarlos.

2.2.1 TRATAMIENTO DIGITAL DE IMÁGENES El interés por los métodos de tratamiento digital de imágenes deriva de dos áreas principales de aplicación [Gondlez, 19961:

o o

La mejora de la información pictórica para la interpretación humana y, El procesamiento de los datos de la escena para la percepción autónoma de las mismas por UM máquina.

9 8 - 0 7 5 1 -

Page 23: TESIS - Tecnológico Nacional de México campus CENIDET

Capítulo 2 VISIÓN POR COMPUTADORA

2.2.1.1 FASES DEL TRATAMIENTO DIGITAL DE -GENES En la literatura actual [Gonzáiez, 19961, se describe que el tratamiento digital de imágenes comprende cinco etapas: la adquisicibn de la imagen, el preprocesamiento, la segmentación, la representacibn y descripcibn, y el reconocimiento e interpretación. Para otros [Sckalkoff, 19921, la representacibn y descripción y el reconocimiento e interpretacibn no pertenecen al tratamiento digital de imágenes, sino al reconocimiento de patrones. Para este estudio se han ubicado las tres primeras etapas dentro del tratamiento digital de imágenes y las dos últimas en el reconocimiento de patrones, aunque se incluye la fase de segmentacibn en ambas partes.

La interrelacibn de las cinco fases, además de una base de conocimiento, se pueden observar en el diagrama en bloques de la figura 2.1 [González, 19961.

I

,

Segmentación -+ Repffisentacióny .. descripción

--+ I imáeenes w I mundo real Adquisición de

Figura 2.1. Partes que constituyen un Sistema de Visión Artificial [Gondlez, 19961. Las fases de adquisición de la imagen, elpreproceSamiento y la segmentación para este caso de estudio

se consideran dentro del fratamiento digital de imágenes (TDl); la segmentación, la representación y descripción, y el reconocimiento e inferpretación se consideran dentro de las

fases de reconocimiento depatrones (RP).

ADQUISICIÓN DE LA IMAGEN

La adquisición de la imagen es el proceso de obtener la representación digital de la imagen, para ello se necesita un dispositivo sensor de imágenes y la posibilidad de digitalizar la señal producida por el sensor. El sensor puede ser una chara de video CCD, una cámara de barrido de líneas o un dispositivo que permita lo anterior.

PREPROCESAMIENTO Una-vez que se ha obtenido y almacenado la imagen, la etapa siguiente trata del preprocesamiento o procesamiento digital de esa imagen.' La función básica del preprocesamiento es la de mejorar la imagen para que resulte más adecuada que la original para una aplicación especifica y de esta forma se aumenten la posibilidades de éxito en los procesos posteriores. Las técnicas utilizadas en esta fase pertenecen a dos categorías: los mkiodos en el dominio espacial y los métodos en el dominio de lafiecuencia. Ambos métodos se tratan en la sección 3.4.2.

12

Page 24: TESIS - Tecnológico Nacional de México campus CENIDET

I ‘I Capitulo 2 VISI6N POR COMPUL~DORA

SEGMENTACI6N La siguiente etapa se conoce como segmentación, “un barbarismo que resulta de la traducción literal del término segmentation del inglés, consagrado en la literatura técnica” [Maravall, 19941. Definida de una forma general, la segmentación divide la imagen de entrada en sus partes constituyentes u objetos con cierto sentido, pues los mismos aparecen normalmente mezclados entre sí, presentando incluso asociaciones e interacciones muy complejas. La operación de extraer los objetos individuales presentes en una imagen puede llegar a ser extremadamente dificil.

I; !I

“Para llevar a cabo esta etapa existen algoritmos para imágenes monocromáticas basados en las propiedades de los valores del nivel de gris conocidos como discontinuidnd y simi/aridad” [González, 19961. En la primera categoría, el método consiste en dividir una imagen basándose en los cambios bruscos de nivel de gris y, sus áreas de interés son la detección de puntos aislados y la detección de líneas y bordes de una imagen. Los métodos de la segunda categoría se basan en la umbralización, el crecimiento de regiones, y la división y fusión de regiones. En’la sección 3.4.3 se describen ambas categorías. En general, la segmentación autónoma es una de las labores mas dificiles del tratamiento digital de imágenes.

2.2.2 RECONOCIMIENTO DE PATRONES

2.2.2.1 INTRODUCCI~N Las técnicas de reconocimiento de patrones son a menudo un importante componente de los sistemas inteligentes. “En términos generales el reconocimiento de pulrones es la ciencia que trata., de la descripción y clasificación (reconocimiento) basado en un sistema de características medibles” [Sckalkoff, 19921.

2.2.2.2 FASES DEL RECONOCIMIENTO DE PATRONES

SEGMENTACI6N

Aunque la fase de segmentación regularmente se incluye dentro del tratamiento digital de imágenes, para este estudio se ha puesto también dentro del reconocimiento de patrones. “Dentro del reconocimiento de patrones la segmentación puede verse como el proceso de extraer un conjunto de pdmetros y características de un modelo haciendo uso de técnicas estadísticas, heuristicas y neuronales” [Sckalkoff, 19921.

REPRESENTACI~N Y DESCRIPCI~N Después del proceso de segmentación los pixeles de la imagen constituyen el contorno de una región o todos los puntos de una región determinada, por lo que es necesario convertir estos datos a una forma adecuada para el procesamiento por computadora. La primer decisión a tomar es si los datos se representarcin como un contorno o como una región completa. La representación como un contorno es la adecuada cuando el interés radica en las características de la forma exterior, como esquinas e inflexiones. La representación regional es adecuada cuando el interés se centra en propiedades internas, como la textura o la estmcturaci6n. “En algunas aplicaciones ambas representaciones coexisten” [González, 19961.

La representación es sólo una parte de la soluci6n que permite transformar los datos de los pixeles a una forma adecuada para que sean tratados por la computadora.

Es necesario también especificar un método para describir los datos de forma que se resalten los rasgos de interés. La descripción. también denominada selección de rasgos, consiste en extraer rasgos con alguna información cuantitativa o cualitativa de interés o que sean fundamentales para diferenciar un objeto o una clase de objetos de otra.

.

13

Page 25: TESIS - Tecnológico Nacional de México campus CENIDET

Capiiulo 2 VISIÓN POR COMPUTADORA

M C O K K I M E N T O E lNTERFRETACI6N

La última etapa incluye el reconocimiento e interpretación. ~1 reconociniiento es el proceso mediante el cual se asigna una etiqueta, nombre o identidad a un objeto basándose en la

ProPoKionada Por SUS descriptores. La interpretación implica asignar significado a un conjunto de objetos reconocidos. Trata de asignar significado a un conj,nto de entidades etiquetadas.

Estas dos últimas fases tienen un gran parecido por lo que normalmente se les conoce en conjunto como conocimiento inteligente. En términos generales, la metodología propuesta en este trabajo considera a estas dos últimas fases como pertenecientes al reconocimiento depatrones.

LA BASE DE CONOCIMIENTOS

Un sistema de visión por computadora interactúa constantemente con información relacionada con el problema, en los diferentes niveles del sistema. El conocimiento sobre el dominio del problema se codifica en un sistema de visión como una base de conocimientos. La base de conocimientos guía la operación de cada módulo de procesamiento y controla la interacción entre ellos. La comunicación entre módulos de procesamiento. se basa generalmente en el conocimiento previo de como debe ser el resultado. Este conocimiento no ~6l0,guía la operación del sistema de vlsión, sino también ayuda en las operaciones de realimentación entre módulos a través de la base de conocimientos.

2.2.2.3 PATRONES YCARACTERÍSTICAS

El reconocimiento depatrones está basado sobre patrones. Un patrón puede ser tan básico como un conjunto de medidas u observaciones quizá representado en una notación de vector o matriz. El USO de caracteristic. medibles presupone un preprocesamiento y un sistema complejo de instrumentación para su detección.

Mucha de la inforniación que nos rodea se manifiesta en forma de patrones. La facilidad con que los humanos clasifican y describen los patrones a menudo conduce a la incorrecta suposición de que esta capacidad es fácilmente automatizable. “Algunas veces la similaridad de un conjunto de patrones es inmediatamente evidente, mientras en otras ocasiones no lo es. El reconocimiento de caracteres es un ejemplo de lo anterior” [Sckalkoff, 19921.

Las caractm’sticas pueden ser simbólicas @or ejemplo el color de un objeto), numéricas (el peso de un objeto) o ambas. Las características pueden resultar de aplicar un algoritmo de extracción de caracteristicas o un operador local a los datos de entrada (la imagen). Las características pueden ser entidades de alto nivel, por ejemplo, los descriptores geométricos ya sea la región de una imagen o la apariencia de un objeto 3D en la imagen, el radio y el número de Euler. Otras h e m i e n t a s matemáticas como losdescriptores de Fourier se consideran dentro de este nivel. Las caractensticas de un objeto pueden ser representadas por variables continuas, discretas o discretas-binarias. Las características binarias pueden ser usadas para representar la presencia o ausencia de una característica en particular.

Los problemas relacionados con la selección y extracción de características deben estar al inicio del diseño de cualquier sistema de FW.

La selección de característicus es el proceso de escoger las caractensticas de entrada al sistema de RP involucrando.un cálculo aproximado. Por otro lado es importante que la extracción de características sea relevante para la tarea del reconocimiento de patrones que se desarrolla.

I

14

Page 26: TESIS - Tecnológico Nacional de México campus CENIDET

Capífulo 2 VISIÓN POR COMPUTADORA

Así, el reconocimiento de patrones no comprende un so10 método, sino está relacionado con conocimiento Y técnicas. En la literatura se han encontrado diferentes métúdos para el r~conocimiento de patrones los cuales se describen a continuación,

En [Sckalkoff, 19921, 10s métodos propuestos para el reconocimiento de patrones son el estadístjco (0 decisión tdnca), el sintáctico o estructural y el neuronal, basado en las redes neuronales artificiales (RXA).

En [Gondez, 19961 para el reconocimiento se proponen los siguientes métodos:

A. Métodos estadísticos O de decisión te+ca. Se basan en la representación.de patrones en forma vectorial y en la búsqueda posterior de aproximaciones que permitan agrupar y asignar estos patrones vectoriales a las diferentes clases de patrones. Las principales técnicas de este método son los clasificadores de distancia mínima, los correladores, los clasificadores de Bayes y las redes neuronales.

B. Métodos estructurales. En estos los patrones se presentan en forma simbólica (como cadenas y árboles). Las. técnicas de este método se basan en la comparación de símbolos como sentencias de un lenguaje formal.

Para proceder al reconocimiento automático de los objetos una vez que se ha realizado el proceso de segmentación y se han convertido en vectores numéricos [Maravall, 19941, propone tres reconocedores:

I . Sobre la base del uso de una función discriminante que divide un plano de características (espacio abstracto de las clases o patrones) en dos semiplanos. Este método se denomina regionalización del espacio de patrones.

2. Sobre la base de funciones discriminantes que manejan el concepto de distancia. Este tipo de reconocedores se basan en la distancia euclidea en dependencia de los centroides de las clases. Estos centroides se calculan como la media aritmética de los objetos de una clase. El diseño de este reconocedor es apriorístico, es decir, que toda la información necesaria y suficiente para diseñarlo se conoce apriori, en el sentido de que el cálculo de esos centroides exige disponer apriori de un conjunto de muestras de cada clase.

3. A diferencia del reconocedor anterior en los que se dispone a priori de toda la información necesaria y sufic'iente para su diseño, este tipo de reconocedor neuronal esta basado en un aprendizaje supervisado de tal manera que existe un maestro que se encarga de enseñar al sistema corrigiéndole cada vez que se equivoque, es decir cuando clasifique incorrectamente un objeto. Dentro de esta clase de reconocedores se ubican las redes neuronales artificiales.

Por problemas de reconocimiento de patrones en el enfosue Idgico-combinatorio propuesto en [Ruíz, 19951 se entienden todos aquellos relacionados con la clasificación de objetos y fenómenos y la determinación de los factores que inciden en los mismos.

En la ciencia del reconocimiento de patrones, en este enfoque se estudian cuatro familias de problemas que se denominan respectivamente:

.

1. Selección de rasgos; 2. Clasificación con aprendizaje (o supervisado); 3. Clasificación sin aprendizaje (o no supervisado); 4. Clasificación con aprendizaje parcial (o parcialmente supervisado).

Los problemas de selección de rasgos tienen dos objetivos fundamentales:

¡I

15

Page 27: TESIS - Tecnológico Nacional de México campus CENIDET

V I S I ~ N POR COMPUTADORA Capítulo 2

a) Reducir el número de rasgos en cuyos términos se deben describir los objetos en modo eficiente v

b) Encontrar de manera determinante los rasgos que inciden en el problema, En 10s Problemas de clasifcación con aprendizaje (clasificación supervisada) se conoce que un universo de Objetos Se agrupa en un número dado de clases de las cuales se tiene, de cada una, una muestra (no todos) de objetos que se sabe pertenecen a ella; el problema consiste en dado un nuevo objeto poder establecer su relación con cada una de dichas clases. En un problema de clasificación sin aprendizaje (clasificación no supervisada) no se conoce cómo se agrupan los objetos. Eo esta clasificación se pueden presentar dos variantes: una en la que por determinadas razones se sabe que los objetos se agrupan en un número dado de clases, pero no se tiene muestra alguna de las mismas y otra en la que ni eso sabemos. Estos problemas también se conocen en la literatura anglosajona bajo la denominación de análisis de grupos (cluster analysis).

El problema de clasifcacibn con aprendizaje parcial (clasifcacihn parcialmente supervisada) es análogo a la clasificación con aprendizaje, excepto que hay alguna clase de objetos de la que no tenemos una muestra. No obstante, el problema en general sigue siendo el mismo: dado un nuevo objeto, relacionarlo con los ya clasificados.

Recientemente, el surgimiento de varios paradigmas que se suman a la inteligencia artificial dan lugar a correspondientes métodos de reconocimiento de patrones. (como se define más delante en la sección 2.2.2.4. RELACIÓN DEL RECONOCIMIENTO DE PATRONES CON OTRAS &AS). En este trabajo se aplican algoritmos de RNA’s como algoritmos para el reconocimiento depatrones en una implementación de tipo “caja negra”.

En [SckalkoíY, 19921 se hace una comparación entre dos técnicas tradicionales que existen para solucionar el problema, de determinar la pertenencia de un objeto a una clase o conjunto tomando en cuenta las características del mismo; el método ingenieril y los métodos de reconocimiento de patrones basados en aprendizaje.

El método ingenieril para solucionar problemas involucra incorporar toda la información relevante disponible en una forma estructurada para formular una solución. Incluye el desarrollo O modificación de modelos que quizás incorporan estructuras e información a priori, y el entrenamiento de datos.

Los métodos de reconocimiento depatrones basados en aprendizaje se guían por tres preguntas: I . ¿Son las técnicas de reconocimiento de patrones capaces de resolver o al menos son aplicables

al problema que se maneja?, ¿Puede el problema ser solucionado?

2. ¿Es posible modificar o desarrollar modelos útiles para la situación y, si es posible, determinar los parámetros del modelo?

3. Si es así, ¿existen herramientas formales y heunsticas que pueden ser aplicadas? ¿existe un procedimiento de solución computacionalmente práctico?

Los métodos basados en el reconocimiento de patrones basados en aprendizaje obtienen la mejor técnica de un conjunto de ellas para llevar a cabo la solución de un problema, obtienen un conjunto de partmetros de un modelo (objeto) y, buscan herramientas formales y soluciones computacionalmente prácticas para llevar a cabo una decisión que, regularmente, es emitir una señal de reconocimiento o no reconocimiento de un objeto en una imagen y evitan así utilizar toda la información contenida dentro de la misma.

16

Page 28: TESIS - Tecnológico Nacional de México campus CENIDET

Capitulo 2 VISIdN POR COMPUTADORA

2-2.2.4 R E L A C I h DEL RECONOCZMZENTO DE PATRONES CON OTRAS AREAS

Procesamiento de señales, Inteligencia Artificial, Modelado Neuronal, Teoría de autómatas, Conjuntos Difusos, Modelado Estructural y Lenguajes Formales

Las t h i c a s de reconocimiento de patrones se auxilian de áreas tales como:

2.2.2.5 APLICACIONES DEL RECONOCIMIENTO DE PA TRONES

Como aplicaciones del reconocimiento de patrones se incluyen, entre otras, las siguientes:

Análisis sismico,

Reconocimiento de rostros,

Identificación de huellas digitales,

Diagnóstico médico.

Preprocesamiento, segmentación y análisis de imágenes en general

Análisis y clasificación de señales de radar,

Reconocimiento y entendimiento del habla,

Reconocimiento de caracteres (letras,‘números o símbolos),

“El reconocimiento de patrones puede caracterizarse como un proceso de reducción de información, mapeo de información o etiquetado de información” [Sckalkoff, 19921. Una visión abstracta del problema descripci6n/clasificación en el reconocimiento de pufrones se muestra en la figura 2.2. Se postula un mapeo entre un espacio de membresía de clases C y el espacio de patrones P. Este mapeo se hace vía una relación Gi, para cada clase y puede ser probabilístico. Cada clase Wi genera un subconjunto de “patrones” en el espacio de patrones P, donde el i-ésimo patrón es denotado por Pi. Se observa, sin embargo, que el subespacio solapado permite patrones de diferentes clases o formas de atributos. Otra relación M mapea los patrones de subespacios de P dentro de observaciones, características o medidas de los patrones denotadas mi. Usando este concepto la caracterización de muchos problemas de reconocimiento de patrones consisten simplemente en que, dada la medida mi, se desea un método que identifique e invierta mapeos M y Gi para toda i. Desafortunadamente este mapeo no es una función, pues si lo fuera, tendría una relaci6n 1 : I.

17

Page 29: TESIS - Tecnológico Nacional de México campus CENIDET

VISIÓN POR COMPUTADORA Capítulo 2

Membresia de clases o Espacio de patrones espacios de descripción (obtenidos) espacio de medidas

C P F

Observación del mundo o

Figura 2.2. Mapeos en una representación abstracta de sistemas de generación., clasificación e interpretación de patrones

El diseño del sistema de medidas d,: los patrones es un aspecto importante en los sistemas de Reconocimiento de Patrones. Un sistema de medidas extrae características del espacio de patrones, pero permite que sean extraídas medidas erróneas o incompletas que dificulten una buena ejecución del sistema de Reconocimiento de Patrones. Por ejemplo: si se considera un problema de dos clases donde W1 corresponde a la clase “manzana” y W2 corresponde a la clase “granada de mano”. En el resultado del espacio de patrones habría alguna diferencia entre el resultado pi de manzanas, ya que no todas las manzanas tienen el mismo tamaño, forma, peso, color y así sucesivamente. Sucede algo similar para la clase W2. También algunos patrones de “manzana” y “granada de mano” forman atributos similares por ejemplo masa, volumen y peso. Por lo tanto, si basamos el sistema de RP en una medida consistente, por ejemplo en el peso de los patrones, ocurrirá que:

Se clasifiquen algunas manzanas y granadas de mano como las mismas o, Se clasifique o distinga entre manzanas pesadas y manzanas ligeras.

Así el sistema de medidas de patrones para algunos problemas de Reconocimiento de Patrones no es lo suficientemente confiable, pues permite el traslape de información, la caracterización no confiable de los patrones y una ejecución limitada de los sistemas para el reconocimiento de patrones.

Actualmente, ha surgido un método alternativo para eliminar, entre otras cosas, este tipo de problemas. Este método, llamado en ocasiones “cajas negras”, se implementa utilizando redes neuronales urtifciules; intenta eliminar la necesidad de una detallada información del mapeo, requiriendo un buen conjunto de datos de entrenamiento (tomar una muestra del mapeo entre C y M) y un sistema que permita en base a este conjunto de datos reconocer nuevos objetos.

La alternativa de la computación neuronal emergió del intento de tratar de imitar cómo los sistemas neuronales biológicos almacenan y manipulan el conocimiento y la información en general. Esto conduce a una clase de sistemas neuronales artificiales denominado redes neuronales, las cuales involucran una amalgama de investigaciones en diversos campos tales como la psicologia, las neurociencias, la ciencia cognitiva y la teoría de sistemas.

18

Page 30: TESIS - Tecnológico Nacional de México campus CENIDET

Capítulo 2 VISIÓN POR COMPUTADORA

2.2.2.6 ESTRUCTURA DE UN SISTEMA TÍPICO DE RECONOCIMIENTO DE PATRONES

La estructura de un sistema típico de reconocimiento de patrones consiste, básicamente, de un mecanismo (algoritmo) de extracción de características, ubicado en la fase de representación y descripción, y un algoritmo de clasificación o de descripción, que se ubica en la fase de reconocimiento e interpretación. Esta estructura se muestra en la figura 2.3.

Figura 2.3. Esmictura de un sistema de reconocimiento de patrones. Después de aplicar un algoritmo de extracción de características a la imagen, el siguiente paso es aplicar otro algoritmo que permita llevar a cabo una clasificación de los objetos o un algoritmo de

descripción del objeto.

2.3 SISTEMA DE INSPECCIÓN VISUAL 23.1 DEFINICI~N

Un sistema de inspección visual se define como un proceso donde se aplica la visión humana (inspeccibn ocular) o la visión por computadora (visión industrial mecanizada) para la verificación de productos después que estos han pasado por un proceso de fabricación.

Un sistema de visi6n industrial mecanizada puede parecer complejo en un medio ambiente industrial debido a todo el equipo asociado en el proceso de manufactura utilizado en la aplicación. La complejidad se reduce cuando el sistema es visto en términos de sus componentes principales, los cuales se describen más adelante en este documento.

Las aplicaciones de automatización de la inspección visual en fábricas, involucra el USO de técnicas de visión por computadora y del reconocimiento depatrones en las actividades de:

0

Inspección para verificar la calidad de los productos, Colección de datos para el control de inventanos y, Mejoramiento de la calidad de manufactura (elaboración de productos, llenado de recipientes, etc.) en la productividad.

Los procesos que integran un sistema de visión industrid mecanizada aplicado a la inspección visual pueden ser subdivididos dentro de las siguientes actividades:

Obtener la representación digital de una imagen, Emplear técnicas comp utacionales para procesar o modificar los datos de la imagen, y Analizar y utilizar los resultados del procesamiento para guiar robots, o controlar un equipo automatizado, asegurando un nivel de calidad en los procesos de manufactura, o llevar a cabo análisis estadísticos en un sistema de manufactura asistido por computadora.

19

ii

Page 31: TESIS - Tecnológico Nacional de México campus CENIDET

Capítulo 2 VISIÓN POR COMPUTADORA

Cámara 1 Iluminación

2.3.2 ESQUEMA DE UN SISTEMA DE INSPECCIÓN VISUAL Un sistema de inspección: vkual utilizado para la automatización en una fábrica puede estar constituido por una sola cámara monitoreando una linea de ensamblado. El sistema de visión observa el objeto (adquiere la imagen), determina si se encuentra dentro de un rango de especificaciones (esthdares de calidad) y genera señales de acuerdo a los resultados obtenidos. El equipo de adquisición de la imagen incluye un sistema de iluminación y una cámara, así como algún dispositivo para desalojar los objetos de la línea de ensamblado. El equipo de procesamiento de la imagen incluye hardware y sofhvare y, el equipo de salida que es la interfaz electrónica del sistema para varias partes del proceso de manufactura. Algunos de estos sistemas son el controlador de procesos, el actuador, sistema de manufactura integrada (CIM System) y/o las alarmas. Este tipo de sistemas, toma objetos de la línea de ensamblado y los coloca en contenedores de aceptación o rechazo de acuerdo a la calidad que presenten. “Los datos que se obtienen del análisis del producto se transmiten al sistema de manufactura integrada por computadora para análisis estadísticos y de control de inventanos” [Galbiati, 19921.

Un sistema de inspección visual por computadora se ejemplifica en la figura 2.4.

sistema de procesamiento de imágenes

20

Page 32: TESIS - Tecnológico Nacional de México campus CENIDET

.-

‘I

Capítulo 2 VISi6N POR COMPUTADORA

2.4 REFERENCIAS Y BIBLIOGRAFíA [Galbiati, 19921 Louis J. Galbiati, JR. Machine Vision and Digital Image Processing Fundamentals, U.S.A. Ed. Prentice Hall

[González, 19961 Rafael C. González y Richard E. Woods Tratamiento digital de irnigenes. E. UA. Addison-Wesley Iberoamericana

[Maravall, 19941 Darío Maravall Gómez-Allende Reconocimiento de formas y visión artificial. E.U.A. Addison-Wesley Iberoamericana

[Ruíz, 19951 José Ruiz Shulcloper, Eduardo Alba Cortés y Grupo de Reconocimiento de Patrones CUBA-MÉXICO Introducción al Reconocimiento de Patrones, México CINVESTAV-IPN México, D.F.

[Sckalkoff, 19921 Robert J. Schalkoff Pattern Recognition: Statistical, Structural and Neural Approach, US.A. John Wiley & Sons, Inc.

.

21

Page 33: TESIS - Tecnológico Nacional de México campus CENIDET

TRATAMIENTO DIGITAL DE IMÁGENES Capitulo 3

CAPITULO 3 PROCESAMIENTO DE IMÁGENES

3.1 INTRODUCCI~N Llevar a cabo una clasificación de objetos que pasan a través de una banda transportadora no es fácil, pues es necesaria una meticulosa observación de los mismos para poder agniparlos correctamente. En la mayona de los casos los objetos presentan características poco susceptibles de detectar, pero que las diferencian de otros objetos, es decir, la similaridad no es evidente (ver sección 2.2.2.3 PATRONES Y CARACTERÍSTICAS). Estas características generalmente provocan una clasificación errónea, por lo que se hace necesaria una clasificación con aprendizaje haciendo uso de la participación de un experto quien a menudo es una persona que lleva a cabo la inspección ocular sobre los objetos a clasificar.

3.2 CLASIFICACI6N DE OBJETOS UTILIZADOS POR EL SlVA Para el sistema de sofmare diseñado para la verificación de recipientes no opacos, se lleva a cabo una clasificación tomando en consideración la forma, la tapa y el nivel del envase. Esta clasificación, que aparece en las imágenes 3.1 y 3.2, se realizó sobre la base de las observaciones llevadas a cabo en la industria del refresco Embotelladora Coca Colal de Cuernavaca y a las recomendaciones propuestas por el personal que labora en la misma. Tomando en consideracidn la forma del envase, la clasificación es: I ) Formas correctas: recipientes que corresponden al tipo de envase que el sistema verifica durante

2) Formas incorrectas: recipientes que no corresponden al tipo de envase que el sistema verifica. su ejecución, independientemente del nivel de líquido.

La imagen 3.1 muestra una línea de ensamblado en la que se verifican recipientes del tipo Coca Cola. El recipiente al centro no corresponde a la forma verificada, por lo que se detecta un recipiente extraño.

'Coca Cola y Fanta son marcas registrada de The Coca Colo Company.

22

Page 34: TESIS - Tecnológico Nacional de México campus CENIDET

Capítulo 3 ~ T A M I E N T O DIGITAL DE IMÁGENES :I

Tomando en consideración la tapa del envase, la clasificación es: I) Tapas bien colocadas, imagen 3.2a, 2) Tapas mal colocadas o ausentes, imagen 3.2b. - 3) Tapa desconocida al estar presente una tapa que no corresponde con el tipo de envase que se

verifica, imagen 3 .2~ . Tomando en consideración el nivel de líquido:

I ) Niveles correctos: alto, medio y bajo que aparecen en la imagen 3.3a, 3.3b y 3.3c, 2) Niveles incorrectos 1: cuando el nivel se encuentra exactamente en la línea inferior definida

como correcta; este ejemplo aparece en la imagen 3.2d, 3) Niveles incorrectos 2: el nivel de líquido se encuentra por debajo o por arriba de las líneas

superior e inferior que definen los niveles correctos como lo muestra la imagen 3.2e y 3.2f respectivamente.

Imagen 3.1 Una línea de producción en la que se detecta un recipiente extraño. El SIVA durante su funcionamiento (una vez que inicia la verificación de un tipo específico de botellas, que para este caso de ejemplo son recipientes del tipo Coca-Cola), detecta la existencia de recipientes extraños dentro de una línea de producción (para el caso de la imagen se detecta un recipiente extraño del

tipo Fania, el del centro).

a b C

Imagen 3.2 Clasificación tomando en consideración la tapa del envase. El objeto en la imagen a presenta la tapa colocada correctamente, el objeto de la imagen b presenta ausencia de ésta, y

finalmente el recipiente de la imagen c presenta una tapa diferente. De estos tres casos el sistema considera como correcto únicamente el primero.

i

i

I

23

Page 35: TESIS - Tecnológico Nacional de México campus CENIDET

Capitulo 3 TRATAMIENTO DIGITAL DE IMÁGENES

a b C d e f Imagen 3.3 Clasificación tomando en consideración el nivel de líquido. Las imágenes a,b y c

presentan un recipiente con nivel de líquido correcto (alto, medio o bajo). Los niveles incorrectos se presentan en las imágenes d, e y& dpresenta un nivel exaciamente donde se

coloca la línea inferior, por lo que al ser inspeccionada ese nivel no aparece; en la imagen e el nivel aparece por debajo de la línea, lo que puede indicar que el recipiente está vacío o, que no esta entre las líneas inferior y superior definidas por el usuario; finalmente la imagen/muestra

un nivel que sobrepasa ambas líneas indicando que el nivel está demasiado lleno.

3.3 ILUMINACI~N 3.3.1 INTRODUCCI~N

“La iluminaciÓn es un parámetro fundamental que afecta la entrada al sistema de visión de la computadora, ya que afecta directamente la calidad de los datos de entrada” [Galbiati, 19921. Es necesario preparar la iluminación para cada aplicación ya que no existe un equipo de iluminación estandarizado aplicable a todos los sistemas de visión por computadora. El método y la fuente específica de iluminación (lámpara o foco de donde surge la iluminación) afecta el procesamiento de la imagen y los resultados que se obtengan.

Los sistemas de visión por computadora industriales, también llamados sistemas de útspección visual automatizada para la automatización de tareas de inspección ocular (inspección llevada a cabopor seres humanos) [Jarvis, 19901, [Perkins, 19901 y [Kim, 19951 usan fuentes de iluminación adaptables al medio ambiente en que trabaja el sistema. Estos trabajos utilizan el denominado medio ambiente controlado, el cual permite mejorar los datos de entrada al sistema. En [Mmtn, 19971 se explica un sistema para la detección de vehículos utilizando una red neuronal implementada en hardware. En este sistema el medio ambiente no es controlado; una cámara adquiere las imágenes de vehículos a la intemperie en avenidas; el sistema no utiliza la tecnología deprocesamiento digital de imágenes, en su lugar procesa directamente la imagen obtenida para llevar a cabo un entrenamiento de la red neuronal; este trabajo presenta buenos resultados (en [Mantri, 19971) independientemente de la hora del día en que se adquiere la imagen (al amanecer o atardecer).

“Los cuatro tipos de fuentes de iluminación más frecuentemente usadas en un medio ambiente industrial para estos propósitos son” [Galbiati, 19901:

Incandescente, Fluorescente, Vapor de mercurio y, Vapor de sodio.

‘ j

‘I

!

I l .

i ‘I I

8 1 i ‘I

I i

I i i

i

I i ‘I

24

Page 36: TESIS - Tecnológico Nacional de México campus CENIDET

. .. .

Capitulo 3 TRATAMIENTO DIGITAL DE MÁGENES

También la iluminación mediante el USO de rayos x, rayos ultravioleta e infiarrojos, se aplican en

“Los Cuatro métodos de iluminación para aplicaciones industriales son’’

en 10s que las inspecciones no son posibles dentro del espectro visible,

19901: Iluminación atrás del objeto, Iluminación frente al objeto, Iluminacih estructurada, Iluminación estroboscópica.

Los problemas que se encuentran inherentes al elegir cualquiera de éstos cuatro métodos tienen lugar por la influencia de:

La iluminación ambiental,

Las variaciones de voltaje. Lasfuentes de iluminación general y ,

La iluminación ambiental afecta cualquier método de iluminación, alterando el nivel de luz sobre el objeto y provocando ruido en los datos de la imagen. Una forma de disminuir el efecto de la iluminación ambiental puede ser mediante el uso de pantallas que previenen o reducen la cantidad de radiación dispersa que entra al lente de la cámara.

Las fuentes de iluminación general regularmente n o son lo suficientemente estables para aseguramos una calidad en la imagen. La energía lumínica que produce lafuente varia debido a la edad y las características de operación de la lámpara. Por ejemplo, la salida de una lámpara fluorescente se decrementa aproximadamente 15% durante las primeras 100 horas y su porcentaje de decremento es menor día a día.

Las variaciones en la calidad de la imagen, también pueden ser causadas por variaciones de voltaje que generalmente resultan de la activación de otros equipos eléctricos cercanos.

3.3.2 &TODOS DE ILUMINACIÓN

“En general, los métodos de iluminación controlada utilizados por los sistemas de inspección visual han sido” [Galbiati, 19901:

Desde a t r h del objeto (trasera), o. Desde elfiente del objeto (delantera),

Estructurada y Estroboscdpica.

A continuación se describe cada uno de los métodos de iluminación. Para el caso del sistema de sofhynre se realizó un conjunto de pruebas con los dos primeros métodos; en la sección de conclusiones se presentan los resultados que se obtuvieron con estos.

EL MÉTODO DE ILUMLMACI~NDESDE ATRÁS DEL OBJETO. E¡ méwdo de iluminación desde atrás del objeto consiste en localizar el objeto entre la fuente de luz y la cámara. El resultado que se obtiene es una silueta del objeto por la luz no interceptada por un objeto opaco. En general es necesario usar un objeto translicido sobre la fuente de luz para producir una área difusa y evitar que entre al lente de la cámara un haz de luz muy brillante.

La iluminación desde atrás del objeto tiene la ventaja que produce una imagen de alto contraste en el perímetro de objetos opacos, lo que permite minimizar las tareas de procesamiento de la imagen y reducir la sensibilidad del sistema a las variaciones de la fuente de iluminación. ,

25 II

Page 37: TESIS - Tecnológico Nacional de México campus CENIDET

Capítulo 3 TRATAMIENTO DIGITAL DE IMÁGENEC

Este método es útil en tareas tales como el reconocimiento de perfiles y la detección de'defectos 0 adhesiones en el contorno, inspección de objetos vacíos tales como recipientes no opacos y la detección de fracturas en objetos transparentes.

Las características de la superficie y las características no visibles en la silueta, como la presencia de adhesiones en otras partes sobre el objeto, no son posibles de detectar mediante este método, También en ocasiones, los bordes del objeto no presentan grao diferencia con el fondo de la imagen, por lo que es recomendable el USO de un conocimiento a priori de la fonna del objeto y de sus medidas.

EL MÉTODO DE ILUMINACI~NDESDE EL FRENTE DEL OBJETO El método de iluminación desde el frente del objero se basa en la reflexión luminosa desde el objeto. La fuente de iluminación y la cámara están en el mismo lado que el objeto. Este método se usa para obtener información de la textura de la superficie, además de características como la dimensión del objeto. En este método se pueden usar técnicas de iluminación especular o difusa, dependiendo de la posición de la cámara respecto al objeto y la fuente de iluminación.

Las técnicas de iluminación especular consisten en una iluminación de campo: aparece un brillo sobre una superficie lisa. Los rayos de luz se reflejan directamente desde el objeto al lente de la cámara. Algunos ejemplos de este tipo de iluminación son: la reflexión de la luz del cuarto sobre la pantalla del monitor y el resplandor sobre la superficie de un escritorio. La figura 3.1 muestra la estnicturación de una iluminación de este tipo.

f ume de ilu11ina:i~ii cánara

SUERRUE ü s a m ORJETO

Figura 3.1 En esta figura aparece la forma en que se estructura una iluminación desde el frente del objeto, iluminación especular.

Las técnicas de iluminoción difusa consisten en una iluminación sobre la superficie de un objeto que contiene hendiduras. La superficie del objeto aparece oscura en tanto que las hendiduras aparecen claras. La cámara se coloca en un ánngulo perpendicular a esta superficie. Las hendiduras, de la superficie del objeto, esparcen la luz en varias direcciones permitiendo que la información del objeto sea sensada por la cámara. La figura 3.2 muestra la estnicturación de una iluminación de este tipo.

26

Page 38: TESIS - Tecnológico Nacional de México campus CENIDET

Capítulo 3 TRATAMIENTO DZGITAL DE ZMÁGENES

superficie del objeto Figuro 3.2 En esta figura aparece la forma en que se estruchlra una iluminación desde el frente del objeto, iluminación difusa. La fuente ilumina las hendiduras de la superficie del objeto, la luz esparcida es sensada por la cámara que se encuentm en un ángulo perpendicular at objeto. Entiéndase semarpor un dispositivo de adquisición (cámara) el hecho de adquirir una imagen

del objeto.

EL METODO DE ILUMINACI~N ESTRUCTURADA. En este método la iluminación del objeto es mediante el uso de una fuente de iluminación especial consistente de un haz de luz estructurado, formado generalmente mediante el uso de una rejilla; este tipo de iluminación permite obtener un patrón único que depende de la estructura luminosa creada, la forma de la superficie y el tamaño del. objeto. La figura 3.3 muestra la forma de este tipo de ilumhación. Mediante el uso de esta iluminación, es posible obtener características de la superficie del objeto.

fuente de iluminación cámara

n

Figuro 3.3. Figura que muestra una forma de iluminación estnicturada. La iluminación surge desde un dispositivo o fuente especial (que en ocasiones hace uso de una rejilla que permite

estructurar la luz esparcida sobre el objeto), que ilumina la superficie del objeto a ser inspeccionado. La cámara que adquiere las imágenes está colocada arriba del objeto.

EL METODO DE ILUMINACI~N ESTROBOSC~PICA En este método el objeto aparece por el uso de un pulso corto de iluminación (de 5 a 500 microsegundos de duración), suficiente para que la cámara adquiera la imagen del objeto. El uso de ese tipo de iluminación implica que la cámara y la fuente de iluminación estén perfectamente sincronizados. La figura 3.4 muestra la forma de este tipo de iluminación.

21

Page 39: TESIS - Tecnológico Nacional de México campus CENIDET

Capítulo 3 TRATAMIENTO DIGITAL DE IMÁGENES

C h w t A FUENTE DE ILUMMKION CON PULSOS COKrOS

SINCRONIZACIÓN 0 c.<;I ,

/ ”.-@-.

,. .,. w

‘. - . . . ,

. -. . -. . ‘.. ... OBJETO

/ -. ..

/

Figura 3.4. Figura que muestra una fornia de iluiriinacióii estioboscopica. La iluniinación surge desde una fuente especial por pulsos corios. hacia la superficie del objeto a ser inspeccionado.

3.3.3 CONCLUSI~N DE LOS MÉTODOS DE ILUMINACI~N UTILIZADOS

La’ iluminación en un Sistema de Inspección Visual Automatizado juega un papel muy importante. Las variaciones en los niveles de iluminación, de las fuentes de iluminación y del tipo de fuente son determinantes para el procesamiento digital de la imagen. Una iluminación pobre conlleva a obtener características de los objetos con poca brillantez o ruido que limita el reconocimiento y la obtención de las medidas de los objetos.

Con el objeto de obtener resultados satisfactorios al procesar la imagen de los recipientes con el sistema de inspección visunl propuesto, se realizaron experimentos haciendo uso de los métodos de iluminación desde elfrente del objeto e iluminación desde atrás del objeio.

Con el método de iluminación estructurada no se realizaron experimentos pues el objetivo no es obtener caractensticas de la superficie del recipiente que se verifica sino los contornos. De la misma manera, no se experimentó c,on el método de iluminación estroboscópica, debido a que no se cuenta con un sistema de sincronización entre la fuente de iluminación y la cámara.

Para Ilevaa a cabo pniebas con el método de iluminación frente al objeto se planteó e! uso de la iluminación especular, colocando las fuentes de iluminación y !a cámara frente al objeto. LOS

resultados obtenidos se describen a continuación.

En general con este método no se obtuvieron resultados satisfactorios, pues las fuentes de iluminación posicionadas frente al objeto generan reflejos al lente de la cámara producidos por su superficie lisa. Estos reflejos durante la fase de procesamiento de la imagen provocan “huecos” (islas) dentro de la silueta del objeto, nulificando así la aplicación de los métodos de medición que utiliza el sistema de inspeccih visiral propuesto para su reconocimiento, al aparentar ser parte del fondo de la imagen. También, mediante este tipo de iluminación existen problemas para la verificación del tapado del envase, pues la tapa es de un material metálico que facilita el reflejo de la fuente de iluminación y la aparición de un hueco en la parte alta de la botella. La imagen 3.4 muestra un recipiente con iluminación de este tipo.

En general, este método permite obtener contornos de los recipientes bien definidos. La iluminación posicionada al frente del mismo, provoca que entre el fondo y el objeto exista una clara distinción, pero siempre que el líquido del recipiente sea de color oscuro, pues para recipientes que contienen líquidos que no son muy oscuros el fondo se confunde con el objeto en escena.

28

Page 40: TESIS - Tecnológico Nacional de México campus CENIDET

. .. Capítulo 3 TRATAMIENTO DIGITAL DE IMÁGENES

Imagen 3.4 Muestra de un recipiente utilizando el método de iluminación frente al objeto, AI centro del recipiente existe un “hueco”, generado por la fuente de jlumjnacjón, que dificulta las

tareas del proceso de obtención de medidas utilizado por el sistema de inrpec&jn visua/. El método de iluminación desde atrás del objeto ofrece más ventajas, pues permite la obtención’de una silueta del recipiente, produciendo una imagen de alto contraste en el penmetro del mismo, que facilita las tareas de procesamiento de la imagen y reduce la sensibilidad del sistema a las variaciones de la fuente de iluminación.

AI diseñar este tipo de iluminación debe existir gran cuidado al colocar las fuentes de iluminación atrás del objeto, para evitar.que iluminen directamente la lente de la cámara. El objeto es colocado exactamente al frente de la cámara, la fuente de iluminación se encuentra detrás del objeto, y debe iluminar lo suficiente para que la silueta del objeto aparezca bien definida.

Las imágenes 3.1, 3.2 y 3.3 muestran ejemplos obtenidos con este método, en las cuales se observan los resultados que genera para el caso de la tapa y el nivel del líquido y como se muestra mas delante en este trabajo, estas imágenes ofrecen un procesamiento robusto y de fácil aplicación de las técnicas que permiten la detección de contornos.

Durante la experimentación, se decidió utilizar este método de iluminación para obtener las imágenes para el sistema de inspección visual automatizado propuesto. Este método se aplica para recipientes no opacos (traslúcidos) y llenados con’ líquidos que no son transparentes claros, y el sistema de inspección supone que siempre existe un recipiente entre la fuente de iluminación y la cámara. El tipo de fuente de iluminación utilizado fue el incandescente.

Las imágenes utilizadas por el sistema de inspección no fueron adquiridas en la industria, debido a que no existe la posibilidad de adquirirlas dentro de la industria por politicas que se manejan internamente en ellas; debido a esto tanto el .método de iluminación como los movimientos de traslación y escala fueron simulados. El método de iluminación se simuló con dos proyectores de acetatos que iluminaron la pared de un cuarto el cual se encontraba cubierto con cartulinas blancas para construir el fondo de la imagen, los movimientos de traslación colocando el recipiente manualmente hacia los lados del centro de la imagen y la escala colocando la cámara de adquisición de las imágenes a 1.5 y 2.5 metros de distancia del objeto.

RECOMENDACI~NEN CUANTO AL USO DE LWMÉTODO DE ILUMINACIÓN. Cualquier método de iluminación que se aplique a un sistema de inspección visual tiene inherentes un conjunto de problemas en su funcionamiento, dependientes o no del medio ambiente, por lo que es recomendable llevar a cabo una minuciosa verificación de los niveles de luz que imperan en el área de trabajo y asi darse cuenta si el sistema está operando dentro de los limites establecidos. Las vanaciones en las fuenteqde iluminación pueden dar lugar a que las imágenes transmitidas al sistema sufran cambios significativos, produciendo que los sistemas de verificación emitan juicios subjetivos.

i

29

Page 41: TESIS - Tecnológico Nacional de México campus CENIDET

Capítulo 3 TRATAMIENTO DIGITAL DE IMÁGENES

3.4 TRATAMIENTO DIGITAL DE IMAGENE~ 3.4.1 INTRODUCCIÓN

“El Principal objetivo de la segunda fase de un sistema de visión artificial es obtener Otra imagen que resulte mas adecuada que la original para una aplicación específica’: [González, 19961. EI conj,nto de tknicas aplicables en esta fase generalmente difieren entre ellas, por lo que una técnica útil para mejorar imágenes de.rayos X, generalmente no es la misma que para mejorar imágenes en un entorno de inspecci6n industrial,

En esta secci6n se describen las dos categorías a las que pertenecen las técnicas para la mejora de la imagen basadas en el preprocesamiento de la misma,

3.4.2 MEJORA DE LA IMAGEN BASADA EN TÉCNICAS DE PREPROCESAMIENTO

Las técnicas para el mejoramiento de una imagen pertenecen a una de las dos categorías siguientes” “

[González, 19961: 8 las técnicas en el dominio espacial y .

las técnicas en eldominio de lafrecuencia. Es posible el uso combinado de técnicas de ambas categorías para mejorar las imágenes mediante el tratamiento digital de las mismas.

3.4.2.1 MÉTODOS EN EL DOMINIO ESPACIAL [González, 19961

Las funciones de procesamiento de la imagen en el dominio espaciul pueden expresarse como:

gfxs Y ) = m. Y A

donde: f(x, y) es la imagen de entrada, g(. , y) es la imagen procesada y Tse define como un operador que actúa sobref; definido en algún entomo de (x. 7). operador T puede operar también sobre un conjunto de imágenes de entrada, como Por ejemplo,

para llevar a cabo la Suma pixel a pixel de M imágenes del mismo objeto Para reducir el mido.

para definir un entorno alrededor de (x. y) se emplea un área de subimagen cuadrada 0 rectangular centrada en (x. y), como la que se muestra en la figura 3.5.

Imagen

X

+ Y

Figura 3.5 Imagen dentro en un eje de coordenadas (X,Y), con un entorno de área de subimagen 3 X 3 cuadrada alrededor de un punto (X. Y).

30

Page 42: TESIS - Tecnológico Nacional de México campus CENIDET

Capíiulo 3 TRATAMIENTO DIGITAL DE IMÁGENES

El centro de la subimagen se traslada pixel a pixel comenzando, por ejemplo, en la esquina superior izquierda Y aplicando el operador en cada posición (x, y) para obtener g(x, y). La forma del operador T puede corresponder a un entorno 1 X I . En este caso g depende sólo del valor defen el punto (x, y), y así T, se convierte en unafunción de transformación del nivel de gris de la forma:

s = T(r) Donde:

Si T(r) tiene la forma de la figura 3.4a, el efecto de esta transformación es producir una imagen de mayor contraste que la inicial al oscurecer los niveles de gris por debajo de m e iluminar los niveles por encima de rn en la imagen original. En esta técnica, los valores de r inferiores a in se comprimen por la función de transformación en un margen de s desplazado hacia el negro; el efecto opuesto sucede por los valores de r siiperiores am. En la figura 3.4b, T(r) produce una imagen de dos niveles (binaria).

r y s son variables que indican el nivel de gris defy de g en cada punto fx, y).

c=T(r] s=T(r]

Oscuridad

Luz I

LUZ

r m r m Oswrldad - Luz

a Oscuridad t3 Luz

b

Figura 3.6 Gráficas que muestran el efecto de las funciones de transformación del nivel de gris para mejora del contraste. Efecto de transformar una imagen para obtener otra de mayor

contraste. Esta técnica es tambikn conocida con el nombre de técnica de aurnenfo de contrasfe.

En resumen, la idea general, consiste en determinarg en un punto fx, y) a partir de los valores de fen un entorno predefinido (un área dc la imagen) de (x, y). Una de las aproximaciones principales en este tipo de formulación se basa en el empleo de las denominadas máscaras (tambih llamadas plantillas, ventanas o filfros). Básicamente una máscara es una pequeña distribución bidimensional de por ejemplo 3x3 como la que aparece en la figura 3.5. En la máscara los coeficientes utilizados determinan la naturaleza del proceso, por ejemplo, la acentuación de los bordes. Las técnicas de mejora basadas en este tipo de aproximación se conocen a menudo como procesamiento por máscaros o filtrado.

3.4.2.2 MkTODOS EN EL DOMINIO DE LA FRECUENCIA

"La base de las técnicas en el dominio de la frecuencia es el teorema de convolución [González i996r. Sea g(x, y) una imagen formada por la convolución de una imagen f(x. y) y un operador lineal invanante de posición h(x, y), es decir:

g h Y ) = hfx, y) 'Jh Y)

Entonces por el teorema de convolucidn se cumple la siguiente relación en el dominio de la frecuencia:

'I

31

Page 43: TESIS - Tecnológico Nacional de México campus CENIDET

Capítulo 3 TRATMENTO DIGITAL DE I d G E N E C

G(u. v ) = H(u. v)F(u, v) donde G, H Y F son respectivamente las transformadas de Fourier de g, h yf: En una aplicación tipica de mejora de la imagen, f(x, y) es conocida y el objetivo, después de calcular F(u, v), es seleccionar H(u, v) de forma que la imagen deseada,

g(x, y) = ,?-l[H(u, v)F(u, v)]

presente resaltada alguna característica de f(x, y). Por ejemplo, se pueden acentuar los bordes de f(x,y) empleando una función H(u, v ) que ponga énfasis en las componentes de alta frecuencia de F(u. v).

En la figura 3.7, h(x, y) caracteriza un sistema cuya misión es la de producir una imagen de salida g(x,y) a partir de una imagen de entrada Xx, y). El sistema realiza la convolución de h(x. y) con la imagen de entrada y da el resultado como salida. El teorema de convolución permite una visión diferente del proceso en el sentido de que el mismo resultado se obtiene multiplicando F(u, v) por H(u, v) para dar G(u, v). Tomando la transformada de Fourier inversa de la salida se obtiene la imagen deseada.

Figuro 3.7 Funcionamiento de un sistema lineal. La salida del sistema es la convolución de fi(x,y) con la señal de entrada.

“El procesamiento de una imagen se realiza para llevar a cabo una interpretación visual o una percepción por máquinas. Para una interpretación visual el espectador es el juez f inh de la bondad de un determinado método,pues no existe una teoría general de la mejora de la imagen’’ [González, 19961. Cuando se trata de procesar imágenes para la percepción por máquinas, la tarea de evaluación se complica. Por ejemplo, en el caso de una aplicación para reconocimiento de objetos, el mejor método de procesamiento de la imagen será aquel que presente los mejores resultados de reconocimiento por parte de la máquina. Pero cabe señalar que aún en situaciones en las que el problema de interpretación o percepción admita la aplicación de una técnica específica, el analista se enfrenta a una cierta cantidad de pruebas previas, antes de establecer de forma definitiva una determinada técnica del procesamiento de la imagen.

3.4.2.3 MORFOLOCfA MATEdTICA

“Dentro del tratamiento digital de imágenes la morfología matemática, basada en la teoría de conjuntos, se usa como una herramienta para extraer componentes de una imagen que sean Útiles en la representación y descripción de la forma de una región tales, como contornos” [González, 19961. Las técnicas morfológicas tales como el filtrado morfológico, la reducción y el recortado son también de gran interés para el pre o postprocesado en el tratamiento de las imágenes. Dentro de estas técnicas morfológicas destacan los algontmos para:

a) La extracción del contorno mediante una operación de gradiente morfológico, b) Dividir regiones basándose en el contenido de textura, c) Suavizar y realzar las escalas de grises que son útiles en las etapas de pre o postprocesado.

La técnica morfológica que se describe a continuación es la dilaracibn, la cual se usa posteriormente dentro de este proyecto de tesis.

32

Page 44: TESIS - Tecnológico Nacional de México campus CENIDET

Capítulo 3 TRATAMIENTO DIGITAL DE IMÁGENES

El Planteamiento de la dilatación [González, 19961 se hace con imhgenes’digitales de la forma ,j(x,y) Y b(x,Y), donde/(x,y) es la imagen de entrada y b(x,y) es el elemento de estructura, una función subimagen. Las funcionesfy b asignan un valor de escala de grises (un número real o entero) a cada par de coordenadas (x,y).

La dilatación de escala de grises de fpor b (siendo ambas funciones bidimensionales), representada p o r f e b se define como:

(fe b)(s.t)=maxCf(s-x,t-y)+b(x,y) 1 (s-x),(t-y) ~Dj(x.y) €06)

,donde Dfy Db son los dominios d e f y b; b es el elemento de estructura del proceso morfológico expresado como una función y (s,t) son los parámetros de desplazamiento.

Para funciones undimensionales simples (funciones de una variable) la ecuación se reduce a la siguiente expresión:

(fa b)(s)==axC/(s-x)+b(x) I (s-x) s D j y xsDb

La condición de que el valor de (s-x) tiene que estar en el dominio de fy que el valor de x tiene que estar en el dominio de b implica quefy b se solapan.

En t h i n o s generales, el proceso de dilatación consiste en trasladar el elemento de estructura en la idagen a lo largo de un entorno definido eligiendo el valor máximo de f+b, por lo que los efectos generales de realizar dilataciones en una imagen de escala de grises son:

La imagen de salida tiende a ser más brillante que la de entrada si todos los valores del elemento de estructura son positivos, y Los detalles oscuros de la imagen se eliminan o se reducen, dependiendo de cómo se relacionen sus valores y formas con el elemento de estructura utilizado para la dilatación. .

3.4.2.4 UMBRALIZACI6N 3.4.2.4.1 INTRODUCCI6N

El objetivo clave de la umbralización es generar una imagen binaria (de dos niveles de gris) O temaria (de tres niveles de gris). La umbralización puede ser usada Únicamente para el mejoramiento de la imagen o tambib, a partir de este mejoramiento, para separar los objetos del fondo en una imagen haciendo uso del histograma (ver apéndice C “Terminología del SIVA”). “La aplicación de las técnicas de umbralización sobre una imagen, pueden verse como una operación que implica realizar comprobaciones frente a una función Tde la forma” [González, 19961:

T = r t X . ~ ~ ~ f x . ~ ) f ( x . ~ ) l

Donde: fix, y) es el nivel de gris del punto (x, y) y p(x, y) representa alguna propiedad local de este punto, por ejemplo, la media del nivel de gris de una vecindad centrada en (x, y). Una imagen binaria umbralizada g(x, y) se define como:

l s iJ (x ,y ) > T Osif(x ,y) I T

De este modo los pixeles marcados con el valor normalizado 1 (o con cualquier otro nivel de intensidad conveniente) corresponden a objetos, mientras que los pixeles marcados con O corresponden al fondo.

I ‘I

33

Page 45: TESIS - Tecnológico Nacional de México campus CENIDET

Capitulo 3 TRATAMIENTO DIGITAL DE Ih-IÁGENES

Cuando Tdepende solamente def(x.y), el umbral se denomina global. Si Tdepende a la vez de,flx,y) y p(x,y), el umbral se denomina local. Si, además, T depende de las coordenadas espaciales x e y, el umbral se denomina dinámico.

3.4.2.4.2 DESCRIPCIÓN DE UNA TÉCNICA DE UMBRALIZACI~N “La umbralización global se basa en un umbral único T” [Myler, 19931: se explora la imagen pixel a pixel etiquetando cada uno de ellos, en dependencia de su valor de nivel de gris, respecto a T.

Una forma de extraer los objetos mediante esta técnica es haciendo uso del histograma. Por ejemplo, la figura 3.8a puede corresponder a una imagen f(x, y), compuesta de objetos luminosos con un fondo oscuro, de manera que los pixeles del objeto y del fondo tienen los niveles de gris agrupados en dos modos dominantes. La forma de extraer los objetos es elegir el umbral T de forma’que separe dichos modos; así, cualquier punto (x, y) para el que f(x, y) > T se denomina punto de objeto y en caso contrario, punto del fondo o viceversa en dependencia de la elección del umbral T.

Un caso más genera1 [González, 19961 es el que muestra la figura 3.8b. Aquí los tres modos dominantes caracterizan el histograma de la imagen @or ejemplo dos tipos de objetos claros sobre un fondo oscuro). La misma aproximación básica clasifica un punto @,y) como integrante de la clase de uno de los objetos si T;Q(x,y)g2 ,a la otra clase de objetos sif(x.y)9’2. y al fondo siflx,y)STI. Este tipo de umbralización mulfinivel suele ser menos seguro que su contrapartida del umbral Único. La razón es la dificultad de establecer umbrales múltiples que aíslen efectivamente las regiones de inter&, sobre todo cuando el número de modos de los histogramas correspondientes es grande.

La umbralización global se puede esperar que tenga éxito en los entomos controlados, por ejemplo, en las aplicaciones de inspección industrial donde habitualmente es factible el control ‘de la iluminación.

T ‘k T2 ‘k T 1 Id M

Figura 3.8 Histogramas de imágenes que se pueden dividir en: (8) un umbral sencillo, y (b) umbrales múltiples.

3.4.3 SEGMENTACIÓN DE IMÁGENES 3.4.3.1 INTRODUCCI~N

“El primer paso en el análisis de imágenes consiste generalmente en segmentar la imagen’’ [González 19961. El proceso de segmentación subdivide una imagen en sus partes constituyentes u objetos. El nivel al que se lleva a cabo esta subdivisión depende del problema que se resuelve, por lo que la segmentación debe detenerse cuando los objetos de interés de una aplicación se hayan aislados.

li

34

Page 46: TESIS - Tecnológico Nacional de México campus CENIDET

Capltulo 3

- -. ~ ~.

TRATAMIENTO DIGITAL DE IMÁGENES

‘I

propiedades básicas de los valores del nivel de gris: Discontinuiaád,

8 Similaridad.

R=wlzl+W2z2+ ... +W929

Expresado en forma de sumatoca se tiene: 9

R = c w i z i Ecuación 3.1 is1

Figura 3.9 Una máscara general 3 X 3 para trasladarse en discontinuidades.

Donde: zi es el nivel de gris asociado con el coeficiente wi de la

35

la imagen y detectar las

máscara.

Page 47: TESIS - Tecnológico Nacional de México campus CENIDET

Capítulo 3 TRATAMIENTO DIGITAL DE IMÁGENES

La respuesta de la máscara se define con respecto a la posición de su centro. Cuando la máscara está centrada en un pixel del límite de la imagen (bordes de ésta), la respuesta se calcula utilizando el entorno parcial apropiado.

3.4.3.2.1DETECCIÓN DE PUNTOS La detección de puntos aislados en una imagen se puede realizar utilizando una máscara del tipo que se muestra en la figura 3.10. Se sabe que se ha detectado un punto en la posición en la que se centra la máscara si:

Pi> T Donde:

T es un umbral no negativo y R está dado por la respuesta de la máscara en un punto cualquiera haciendo uso de la ecuaci6n 3.1.

En términos generales esta formulación mide las diferencias ponderadas entre el punto central y sus vecinos.

Figura 3.10 Mhscara que se traslada en una imagen para detectar diferentes puntos aislados de un fondo constante..

3.43.2.2 DETECCIÓN DE LfNEAS

Las máscaras de la figura 3.1 I conducen a la detecci6n de líneas en una imagen. Si la primera máscara se traslada por toda una imagen, responde a lineas (secuencia continua de pixeles) orientadas horizontalmente. Con un fondo constante la respuesta máxima resulta cuando la línea pasa por la fila central de la mascara. La segunda máscara responde a líneas orientadas a 450; la tercera a las líneas verticales y finalmente'la cuarta a las líneas en la dirección de -450.

a) b) C) d)

Figura 3.11 Máscaras que se basladan por la imagen para detectar líneas a) horizontales, b) a +45", c) verticales y d) a -45".

3.4.3.23 DETECCI6N DE BORDES

La detección de bordes es el método más comun para detectar discontinuidades significativas en el nivel de gris. La mayor parte de las técnicas de detección de bordes es mediante el cálculo de un operador local de derivación [González, 19961. Para el caso de este trabajo de tesis no se aplican métodos de detección de bordes.

!

36

Page 48: TESIS - Tecnológico Nacional de México campus CENIDET

Capltulo 3 TRATAMIENTO DIGITAL DE IMÁGENES

3.4.4 RESULTADOS OBTENIDOS CON EL PROCESMENTO DIGITAL DE LAS

La finalidad de esta última sección en el capítulo es describir la forma en que se implernentó el SIVA en su fase de tratamiento digital de imágenes, una vez que se capturó y almacen6,la imagen. A continuación se presentan los resultados obtenidos al aplicar:

IMÁGENES UTILIZADAS POR EL SIVA

Los métodos de iluminación, o

o El método de umbralización.

Las técnicas para el preprocesamiento de la imagen, Las técnicas para el mejoramiento de bordes y

3.4.4.1 RESULTADO DE LA APLICACIbN DE LAS TÉCNICAS PARA EL PREPROCESAMIENTO DE LA IMAGEN

La realización de un conjunto de pruebas con dos diferentes métodos’de iluminación, tomando medidas de control sobre el entorno para realzar las características de los envases y así disminuir la contribución de componentes irrelevantes, condujo a utilizar el método de iluminación desde arrús del objeto.

Una vez obtenida la imagen y habiendo hecho la segmentación en la que se obtienen las subimágenes de la forma del envase, nivel de liquido y tapado de éste, pasamos a la segunda fase del procesamiento, para obtener otras imágenes que resulten más adecuadas que las originales. Las imágenes 3.5q 3 . 5 ~ y 3.6a muestran las subimágenes de tapa, nivel y forma.

Para el mejoramiento de las subimágenes se eligieron las técnicas basadas en métodos eniel dominio espacial es decir, el procesamiento por máscaras o filtrado. La primera técnica aplicada realiza una dilatación de cada una de las subimágenes que permite obtener otras subimágenes de mayor contraste. “Esta técnica actúa como una función de transformación que reduce los detalles oscuros” [Myler, 19931; para el caso de los recipientes las imágenes 3Sb, 3.Sd y 3.6b muestran los resultados obtenidos al aplicarla. Tanto la tapa, como el nivel y la forma aparecen más reducidas pero mejor definidas en la imagen. El elemento de estructura aplicado a cada una de las subimágenes aparece en la figura 3.12.

Figura 3.12 Elemento de esuuciura aplicado a las subimágenes para obtener la dilatación de cada una de ellas.

37

Page 49: TESIS - Tecnológico Nacional de México campus CENIDET

.. . - I1 I

Capítulo 3 TRATAMIENTO DIGITAL DE IMÁGENES

a b C d Imagen 3.5 La iubimagen a muestra la tapa del recipiente y la b muestra esta misma parte del recipiente después del proceso de dilatación; la subimagen c es la imagen original del nivel del

líquido, lad es la subimagen después del proceso de dilatación.

a b

Imagen 3.6 La imagen a muestra la subimagen original que representa la forma del recipiente, la imagen b representa la misma subimagen una vez que se aplicó el proceso de dilatación

utilizando la máscara de la tigura 3.12.

Una vez aplicado el proceso de dilatación, el cual permitió realzar las escalas de grises (una distinción mas clara entre el objeto y el fondo como se aprecia en las imágenes 3.5 y 3.6) se facilita la aplicación de las técnicas de filtrado para la detección de los contornos y lineas del objeto. Esto conduce a encontrar las características de forma, nivel de líquido y la presencia o ausencia de la tapa del envase.

3.4.4.2 RESULTADOS DE LA APLICACI~N DE LAS TÉCFJTCAS PARA EL MEJORAMIENTO DE BORDES

"Las máscaras utilizadas en este proceso son las máscaras Gradiente, también llamadas máscaras de Prewitt" [González 19961, las cuales permiten la detección de los bordes en direcciones especificas.

DETECCIÓN DE LA FORMA DEL ENVASE

Generalmente los recipientes que contienen líquidos presentan una serie de curvaturas tal que con la aplicación de un filtro no es posible detectar los contornos izquierdo y derecho del envase, por lo que se hace necesaria la aplicación de dos filtros en cascada: un filtro noreste para la detección del contorno derecho y, la aplicación de unjltro noroeste para la detección del contomo izquierdo.

La detección de la forma del envase se realiza de la siguiente manera: la máscara que se muestra en la figura 3.13a se traslada por toda la imagen dilatada respondiendo a líneas orientadas horizontalmente, lo que permite definir el contorno izquierdo como lo muestra el resultado en la imagen 3.7a. El filtro noroeste, que se define por la máscara de la figura 3.13b, para la detección del contorno derecho del envase, permite obtener el resultado que aparece en la imagen 3.7b.

!

38

Page 50: TESIS - Tecnológico Nacional de México campus CENIDET

Capítulo 3 TRATAMIENTO DIGITAL DE IMÁGENES

1 0 1 1 1 2 1 I n i

a b Figura 3.13 Máscaras que se irasladan a través de las subimágenes para la detección de líneas,

que conducen a la obtención de la forma, el nivel del líquido y la tapa del recipiente. La máscara a representa un filtro noreste en tanto que la máscara b representa uno noroeste.

a b

Imagen 3.7. Detección de los contornos del envase. Con la aplicación de las máscaras de las figuras 3.13a y 3.13b es posible obtener los contornos izquierdo y derecho del envase

mostrados en a y b respectivamente.

DETECCIÓN DEL NIVEL DE LÍQUIDO

Una vez detectada la forma completa del envase a partir del segmento de imagen que la contiene, el siguiente paso es llevar a 'cabo la detección del nivel de líquido, por lo cual se aplica la misma máscara que detecta el contorno izquierdo de la botella: el filtro noreste. Este filtro permite la localización de una línea horizontal en la parte alta, media o baja de la.subimagen, que representa el nivel del líquido en la botella. En caso de que esta línea aparezca incompleta o definitivamente no aparezca, indica que el nivel de liquido no se encuentra en la subimagen, indicando, por lo tanto, un caso de nivel de líquido erróneo (ver la sección 3.2). En la imagen 3.8a se puede ver la localización de un nivel de líquido correcto.

DETECCIÓN DE LA TAPA DEL ENVASE

Para la detección de la tapa del envase se aplica la máscara a de la figura 3.13. Esta máscara, que permite la detección de líneas horizontales y que se aplica también para el nivel de líquido, permite que:

Aparezca una línea horizontal tenue indicando la presencia de una tapa del tipo corcholata, Aparezca una línea horizontal mas gruesa indicando la presencia de una tapa de plástico o, No aparezca ningún tipo de línea resaltada indicando la ausencia de la tapa en el envase.

Uno de los dos primeros casos se considera correcto, dependiendo del tipo de tapa que el sistema esté verificando; el tercer caso se considera incorrecto (ver sección 3.2). La detección de una tapa correcta en un envase se puede ver en la imagen 3.8b.

39

Page 51: TESIS - Tecnológico Nacional de México campus CENIDET

Capitulo 3 TRATAMIENTO DIGITAL DE IMÁGENES

Imagen 3 .8 . Detección del nivel y la tapa del envase. En la imagen a, obtenida después de aplicar el filtro noreste a la imagen 3Sd, aparece resaltado el nivel de líquido del recipiente, que en este ejemplo es un nivel correcto. En la imagen b se puede observar la fomla en que

aparece la tapa del recipiente, una vez que se traslada la máscara de la figura 3.13a. Esta . máscara se aplica también a la imagen 3.5b.

3.4.4.3 RESULTADOS OBTENIDOS AL APLICAR EL MÉTODO DE UMBRALIZACIoN

De las imágenes anteriores todavía no es posible extraerles una representación que identifique al objeto, debido a la presencia de ruido en las mismas. Lo que se desea obtener,es una imagen con los contornos del objeto perfectamente definidos, por lo que se hace necesario un proceso previo de umbralización sobre las imágenes. “Para un proceso de este tipo, el histograma es una herramienta de gran utilidad en las escenas, que suelen aparecer en entornos industriales” [González 19961, sin embargo, no siempre es factible obtener tanta información del histograma, como en el caso de una umbralización múltiple explicada en la sección 3.4.2.4. En muchas aplicaciones, “su manipulación sólo permite aumentar o disminuir el contraste del objeto en la imagen y el margen dinámico de los niveles de gris” [Maravall, 19941. Para el caso del sistema que se implementa no se hace uso del histograma; en su lugar se hace uso de un.método de representación completo de la imagen.

La técnica de umbralización utilizada por el sistema es la descrita en la sección 3.4.2.4.2; El proceso se realiza localizando cada pixel de la imagen y etiquetando cada uno de ellos como perteneciente al objeto o ai fondo, dependiendo del valor encontrado en el mismo, si es mayor o menor que el valor de umbral T definido.

Este proceso de umbralización sobre cada una de las subimágenes permite:

.

Obtener otra imagen con una representación binariu, y Llevar a cabo la eliminación del ruido que aparece en las imágenes antenores 3.7 y 3.8.

Este proceso presenta buenos resultados debido al entorno controlado de la iluminación experimentalmente utilizada. Es válido aplicar el entorno controlado ya que la aplicación que se realiza es de inspección industrial.

Las imágenes resultantes después de aplicar la técnica de umbralización se pueden ver en las imágenes 3.9 para la forma del envase y 3. IO para el nivel de líquido y la tapa.

‘I

,! I ‘i

40

Page 52: TESIS - Tecnológico Nacional de México campus CENIDET

Capítulo 3 TRATAMIENTO DIGITAL DE IMÁGENES

a b

Imagen 3.9 La imagen a representa el contorno izquierdo del envase, una vez que se ha aplicado el proceso de umbralización a la imagen 3.6a; la imagen b representa el contorno derecho del envase. En estas imágenes se observa cómo desaparece el ruido presente de las

imágenes 3.6 y 3.7.

a b

Imagen 3.10. En la imagen a aparece el nivel de líquido del recipiente y en lab la presencia de la tapa del envase; ambas imágenes se obtienen después de aplicar el proceso de umbralizución

a las imágenes 3.7 a y b.

Hasta esta última fase de umbralización se considera el procesamiento de mejora de la imagen. La siguiente fase corresponde al reconocimiento de patrones, en el que se incluye la representación y descripción mediante un algoritmo de extracción de características (ver figura 2.2.2.6 ESTRUCTURA DE UN SISTEMA TiPICO DE RECONOCIMIENTO DE PATRONES). Posteriormente acometemos la etapa de clasificación, realizada de igual forma mediante un algoritmo. La etapa de reconocimiento de patrones se describe en el capítulo 4.

i

41

Page 53: TESIS - Tecnológico Nacional de México campus CENIDET

I

Capítulo 3 TRATAMIENTO DIGITAL DE IMÁGENES

3.5 REFERENCIAS Y BIBLIOGRAFíA [Galbiati, 19921 Louis J. Galbiati, JR. Machine Vision and Digital image Processing Fundamentals, U.S.A. Prentice Hall.

[González, 19961 Rafael C. González y Richard E. Woods Tratamiento digiid de imágenes, E.U.A. Addison-Wesley Iberoamericana.

[Hilera, 19961 José R. Hilera y Victor J. Martinez Redes Neuronales Artifciales. Fundamentos, modelos y aplicaciones, E.U.A. Addison-Wesley Iberoamericana,

[Maravall, 19941 Darío Maravall Górnez-Allende Reconocimiento de formas y visión artificial, E. CLA. Addison- Wesley Iberoamericana,

[Myler, 19931 Harley R. Myler y Arthur R. Weeks The pocket Handbook of imaging Processing Algorithms in C, U.S.A. PTR Prentice Hall.

[Parker, 19951 J. R Parker Practical Computer Vision Using C, U.S.A John Wiley & Sons, Inc.

42

Page 54: TESIS - Tecnológico Nacional de México campus CENIDET

CAPITULO 4 RECONOCIMIENTO DE PA TRONES

4.1 REPRESENTACIÓN Y DESCRIPCIÓN Una vez que los bordes han sido mejorados, continuar usando la represent.aci6n completa de la imagen conduce a un gran desperdicio de espacio en la memoria y mayor tiempo de procesamiento de la computadora. “Muchos pixeles ‘de la imagen son pixeles de fondo que no contienen información del objeto a ser analizado, por lo que se hace necesario el uso de una técnica para extraer las características del objeto en escena” [Parker 19951. Después de segmentar una imagen en regiones, el conjunto resultante de pixeles segmenturlos se

representa y describe normalmente en una forma adecuada para su posterior procesado por la computadora” [González, 19961. Una representación externa es útil cuando “el objetivo es obtener las características de forma de los objetos en escena, y una representación interna cuando el principal interés se centra en las propiedades de reflectividad, tales como color y textura” [González, 19961. En cualquier caso, las características seleccionadas como descriptores deben ser insensibles a variaciones de cambio de escala, traslación y rotación.

La elección de un esquema de representacibn e5 una parte de la tarea de hacer los datos útiles para una computadora. El siguiente paso es descr;bir la zona en la representación elegida.

Una región se puede representar sobre la base de sus caractensticas externas describiendo SU contorno por medio de su longitud, la distancia del centroide del objeto a un contorno (firma), la orientación de una línea recta que une puntos extremos, el número de concavidades, etcétera.

4.2 TRANSFORMADA DE FOURIER “Generalmente en los problemas de reconocimiento de patrones y como fase previa a una clasificación o reconocimiento de los mismos, se hace necesario limitar el número de características, a veces llamados descriptores que identifican a los patrones” [Hilera 19961. Este

C‘

43

Page 55: TESIS - Tecnológico Nacional de México campus CENIDET

Capítulo 4 RECONOCIMIENTO DE PATRONES

proceso delimitación permite disminuir el número de argumentos de entrada al algoritmo de reconocimiento o clasificación de los patrones y el número de características que identifican al patrón.

Las técnicas de segmentación producen datos en forma de pixeles de un contorno o de una región. Aunque algunas veces estos datos se utilizan directamente para obtener descriptores, la práctica normalizada es “utilizar esquemas que compacten los datos en representaciones más útiles para el cálculo de descriptores” [González 19961.

Un esquema de representación es el método de descomposición en series de Fourier. Esta técnica presenta una gran ventaja: existen algoritmos rápidos para su obtención, por lo que’resulta adecuada para implementaciones en sistemas que deben trabajar en tiempo real.

“Si una imagen está representada por un conjunto de valores discretos, la representación de x(n) en el dominio de la frecuencia se puede realizar mediante la transformada discreta de Fourier (DFT)”

I! ‘I;

[Hilera, 19961: l~

X ( k ) = y x ( n ) e - j 2 m k / N - - E x ( n ) W - “ ‘ ; k = 0,1, ..., N - 1, W = e- j 2 n l N

“=O

Donde: X(k) es el valor del espectro a la frecuencia:

n son los impulsos de la señal N el número total de muestras Te1 periodo de muestreo.

2&NT

Esta expresión permite calcular cada una de las k componentes de frecuencia del espectro a partir de Npuntos dex(n) ponderados por la función:

I ,e-/lmkiN

Se puede recuperar la señal original a partir de su espectro de frecuencias aplicando la transformada discreta inversa de Fourier (IDFT): f

La DFT y su inversa IDFT, son muy similares. La única diferencia es el factor I /N y la diferencia del signo en el exponente de la DFT y la IDFT. Esta similitud tiene un significado práctico importante, ya que permite que el desarrollo de un algoritmo o de un hardware para la DFT pueda ser utilizado para la IDFT con pequeñas modificaciones. Aprovechando las propiedades de simetría que aparecen en el exponente de la DFT, se han formulado diferentes algoritmos de computación, (estos algoritmos constituyen lo que se llama transformada rápida áefourier FFO, que permiten el ahorro sustancial de tiempo de cálculo frente a los algoritmos convencionales, al reducir considerablemente el número de operaciones algebraicas a realizar.

“La aplicación directa de la DFT, según su definición, requiere la ejecución de N multiplicaciones y N-1 adiciones para cada muestra. Para una transformación de N muestras, el número de operaciones es del orden de N2” [Hilera, 19961. Se hace necesario un procedimiento que permita disminuir esto. El procedimiento se basa en dividir el cómputo de la DFT en varias DFT de dimensiones sucesivamente más pequeñas (aprovechando la proporcionalidad del número de operaciones con N2) y cambiar después los resultados de forma adecuada. Si N es par, se puede componer primero

1

44

Page 56: TESIS - Tecnológico Nacional de México campus CENIDET

Capitulo 4 RECONOCIMIENTO DE PATRONES

una DFT de N/2 puntos sobre todas las muestras con pósición par y después sobre todas las de posición impar. A continuación la DFT requerida de mayor número de puntos se puede calcular a partir de los resultados de estas dos DFT más pequeñas. Si N/2 también es un número par se puede repetir este procedimiento. La máxima optimi@ón del proceso se da cuando N es una potencia de dos, ya que entonces se puede llegar a una DFT de dos puntos, de forma que el número total de operaciones es del orden de NlogzN, que es una reducción según un factor de N/M, donde M=logzN.

4.3 EL RECONOCIMIENTO DE PATRONES Y LAS REDES NEURONALES ARTIFICIALES

El reconocimiento visual de patrones es un problema que a través de los años se ha intentado resolver mediante métodos estadísticos, sintácticos y de Redes Neuronales Artificiales (RNA).

En términos generales, los métodos para el reconocimiento depafrones se pueden agnipar como: Aquellos que involucran incorporar toda la ivfirmación relevante disponible, incluyendo la modificación de modelos que incorporan estructuras e información a priori. En los algoritmos de estos métodos los patrones se modelan como vectores (prototipos Únicos), ya sea disponiendo a priori de toda la información necesaria para su diseño, o’mediante algoritmos que realizan un proceso de comparación entre un conjunto de imágenes almacenadas y una imagen de entrada. Los que evitan utilizar toda la información, planteando la modificación o desarrollo de modelos Útiles aplicables a la situación y determinando parámetros para tales modelos, para así buscar finalmente un procedimiento de solución computucionalmente práctico. En estos métodos podemos ubicar los algoritmos para extraer caractensticas complejas de los objetos, es decir, aquellos que utilizan el procesamiento digital de imágenes.

En el ámbito de esta clasificación las redes neuronales artificiales se ubican en el segundo gnipo. Generalmente los algoritmos asociados a las redes neuronales se aplican después de realizar un proceso previo a una imagen de entrada. En términos generales, “las redes neuronales son métodos de procesamiento capaces de examinar los pixeles de una imagen, segmentos de una imagen, o bien una representación de la misma en forma de vector en paralelo” [Freeman, 19931. Para lograr tal examen, estos sistemas no tienen que ser programados explícitamente, sino que se adaptan a sí mismos para “aprender” la relación entre un conjunto de ejemplos dados, la cual aplican posteriormente a nuevos ejemplos de entrada.

El aprendizaje en una red neuronal equivale a hallar un conjunto adecuado de pesos (valores de ponderación representados por Wi)

4.4 MECANISMOS DE APRENDIZAJE DE LAS R N A “El aprendizaje es el proceso mediante el cual una red neuronal modifica sus pesos en rkspuesta a una información de entrada” [Hilera, 19951. Los cambios en el proceso de aprendizaje pueden dar lugar a la destrucción, modificación y creación de conexiones entre las neuronas. Una conexión entre neuronas se crea cuando el peso de la misma obtiene un valor distinto de cero y una conexión se destruye cuando se obtiene para éste un valor de cero.

El proceso de aprendizaje implica cambios en lospesos de las conexiones de la red. Se dice que una red neuronal ha aprendido cuando los valores de los pesos permanecen estables (dwij/n’f=U). En el aprendizaje de las redes neuronales es irnpottante conocer cómo se modifican los valores de los pesos, es decir, determinar los criterios seguidos para cambiar el valor asignado a las conexiones cuando se pretende que la red aprenda una nueva información. Estos criterios determinan lo que se conoce como la regla de aprendizaje de la red.

45

Page 57: TESIS - Tecnológico Nacional de México campus CENIDET

Capítulo 4 RECONOCIMIENTO DE PATRONES

En general se consideran dos tipos de reglas de aprendizaje: supervisado 0 parcialmente SuPeWisadO, Y no w e n i s a d o . Esta clasificación de los tipos de aprendizaje da lugar a una de 1% ciasificaciones que se realizan de las redes neurona[es:

Redes neuronales con aprendizaje supervisado o parcialmente supervisado, Redes neuronales con aprendizaje no supervisado.

La diferencia entre ambos tipos está en la existencia o no, de un agente externo (supervisor) que controla el proceso de aprendizaje de la red.

REDES CON APRENDIWE SUPER VISADO O PARCIALMENTE SUPER VISADO

El aprendizaje supervisado se caracteriza porque el proceso de aprendizaje se realiza mediante un entrenamiento controlado por un agente externo (supervisor, maestro) que determina la respuesta que debería generar la red a partir de una entrada determinada. “El supervisor comprueba la salida de la red, y en el caso de que ésta no coincida con la deseada, se procede a modificar los pesos de las conexiones con el fin de conseguir>que la salida obtenida se aproxime a la deseada” [Hilera

Hay tres formas de realizar un aprendizaje supervisado:

19951.

Aprendizaje por corrección de error. Aprendizaje por refuerzo. Aprendizaje estocástico.

REDES CONAPREhViZAJE AJO SUPERVISADO

Este tipo de redes (también conocido como autosupervisado) no requieren influencia externa para ajustar los pesos de las conexiones entre sus neuronas. La red no recibe internamente realimentada información que le indique si la salida generada en respuesta a una entrada es o no correcta; por ello se dice que estas redes son capaces de autoorganizarse.

Estas redes deben encontrar las características, regularidades, correlaciones o categorías que se puedan establecer a partir de los datos que se presenten en su entrada. En general se consideran dos tipos de algoritmos que dan lugar a los aprendizajes:

Hebbianoy, Competitivo y cooperativo.

4.5 VENTAJAS DE LAS REDES NEURONALES ARTIFICIALES W A )

Las RNA ofrecen numerosas ventajas que permiten aplicarlas en múltiples áreas, por ejemplo, “son capaces de aprender de la experiencia al generalizar casos anteriores, de abstraer características esenciales a partir de sus entradas, de aprender nuevos ejemplos sin olvidar el conocimiento de ejemplos anteriores” [Fu, 19961. Estas ventajas se resumen como [Hilera, 19951:

Aprendizaje Adaptativo. Aprenden tareas mediante un entrenamiento con ejemplos ilustrativos, evitando así, elaborar modelos apriori. Autoorganización. Son capaces de crear su propia organización o representación de la información que recibe, mediante una etapa de aprendizaje, Operación en tiempo real. Operan en paralelo y pueden diseñarse y fabricarse con hahvare especial para obtener esta capacidad. En [Mantri, 19971, se describe la implementación de una red neuronal en hardware para la detección de vehículos utilizando el acelerador de reconocimiento NI1 000 “Recognition Accelerator” capaz de clasificar hasta 32,000 patrones por segundo.

46

Page 58: TESIS - Tecnológico Nacional de México campus CENIDET

Capitulo 4 RECONOCIMIENTO DE PATRONES 1: - 1

distribuyen los componentes del patr6n de entrada a la siguiente capa.

La segunda capa, la inteiinedia (que puede ser mas de una), es la que le sirve a la red para aproidtr a resolver el problema propuesto.

Fácil inserción dentro de la tecnologia existente. Se pueden obtener pastillas (chips) especializadas para redes neuronales que mejoran su capacidad en ciertas tareas, lo que puede facilitar la integración modular en los sistemas existentes.

4.6 MODELO DE APLICAC16N RED DE CONTRAPROPAGACI~N (BACKPROPAGATION)

Una red neuronal que ha resultado útil para atacar problemas que requieren el reconocimiento de tramas complejas y la realización de funciones de correspondencia no triviales es la red de contrapropagación ("backpropagation '3. "Esta red está diseñada para que funcione como red multicapa, con propagación hacia delante y hacia atrás, empleando el modo supervisado de aprendizaje" [Freeman, 19931.

capa de salida k

pesos j k

capa intermedia j

pesos ij

capa de. entrada i

Figura 4.1 Red neuronal de conirapropagoción de tres capas. La capa de entrada se identitica como una capa i , la capa intermedia c0mo.j y la capa de salida como k. Los pesos que se

aplican entre la capa de entrada y la capa intermedia se identifican como pesos ij y los pesos que se aplican en las conexiones de la capa intermedia y la de salida se identifican comopesos

Jk.

47

Page 59: TESIS - Tecnológico Nacional de México campus CENIDET

Capitulo 4 RECONOCIMIENTO DE PATRONES

F‘UNCIONAIWENTO DE LA RED NEURONAL DE CONTRA~RO~AGACI¿)N

El funcionamiento de la red se descnbe’en forma sintetizada mediante seis pasos: [Freeman, 19931 1) La red aprende a Panir de un conjunto predefinido de pares de entradas como ejemplo Y de

Sus salidas, empleando un Ciclo de propagación-adaptación de dos fases, una hacia delante y Otra hacia atrás. En el caso de la imagen 4.1 las entradas son puestas en la capa de entrada i y las salidas en la capa de salida k.

2) Una vez que se ha aplicado una trama de entrada como estímulo a la primera capa de unidades Y hecha la inic’ialización de la red, esta trama se va propagando a través de todas las capas superiores hasta generar una salida. La imagen 4.1 las capas superiores son: una única capa intermedia que se identifica como capa inrermediu j y la capa.de salida, para el caso de otra arquitectura el número de capas intermedias puede ser mas grande.

3) La señal de salida generada por la red se compara con la salida deseada, y se calcula una señal de error para cada unidad de salida. Para el caso de la figura 4.1 la capa de salida se representa por una sola unidad.

4) Las señales de error se transmiten hacia atrás, de ahí su nombre “backpropagalion”, partiendo de la capa de salida hacia todos los nodos de las capas intermedia y de entrada que contribuyen directamente a la salida. De la capa de salida k (en la figura 4. I ) las señales de error se transmiten hasta la capa de entrada i.

5 ) Las unidades de la capa intermedia sólo reciben una fracción de la señal total de error, basándose en la contribución relativa que haya aportado a la unidad a la salida original. Este proceso se repite, capa por capa, hasta que todos los nodos de la capa intermedia de red hayan recibido una señal de error que describa su contribución relativa al error total.

6) Basándose en la señal de error, se actualizan los pesos de conexión de cada unidad de la capa intermedia para hacer que la red converja (realice el aprendizaje) hacia un estado que permita codificar todas las tramas de entrenamiento.

Sobre esta base en las siguientes cuatro secciones se muestran las ecuaciones para el funcionamiento de la red. La sección de inicialización de la red, presenta una descripción de los pesos que deben ser inicializados antes de la fase de entrenamiento de la red. La sección paránierros de la red, presenta los parámetros que la red utiliza durante las fases de aprendizaje y de reconocimiento de los patrones. Estos parámetros permiten que la red aprenda de los ejemplos de entrada más rápidamente, es decir, aceleran el proceso de aprendizaje de la red. La sección enrrenamienío de la red, muestra las ecuaciones para las capas intermedias, para la capa de salida y para el cálculo del error en la salida de la red. La sección de mod$cación de pesos, muestra las ecuaciones necesarias para la modificación de los pesos de la red, es decir, la ecuaciones que permiten realizar el proceso de propagación del error desde la capa de salida hasta la capa de entrada. En el apéndice E “terminoiogiu de redes neuronuies“, se definen los términos relacionados con las redes neuronales artificiales que se utilizan en este trabajo. INICIALIZACI~NDE LA RED ~~t~~ del proceso de entrenamiento de la red, es necesario iniciaiizar 10s pesos de la misma. Esta fase de inicializacibn corresponde al paso uno de la sección de funcionamiento de la red ya descritos. Los pesos a inicializarse son:

1. Wij son valores aleatorios, ue generalmente se sitúan entre -0.3 y 0.3 [Freeman, 19931. En la figura 4.1 los pesos apar 1 cen representados como i j y jk entre la capa de entrada y la intermedia, y la capa inteledia y de salida, respectivamente.

48

Page 60: TESIS - Tecnológico Nacional de México campus CENIDET

Capítulo 4 RECONOCIMIENTO DE PATRONES

2. 9 los valores del vector de umbrales de las neuronas de la capa intermedia que se inician con

En las RNA se establecen dos parámetros. Los parámetros utilizados por la red en el proceso de aprendizaje y de reconocimiento de los patrones son:

Este parámetro tiene un efecto significativo en el rendimiento de la red. Norm2lmente debe ser muy pequeño (entre 0.5 y 0.25) para asegurar que la red converja a una solución. Un valor pequeño para 7 significa que la red tendrá que hacer un gran número de iteraciones antes de alcanzar su convergencia (aprendizaje de los patrones). Una forma de utilizar este parámetro es aumentar su valor a medida que progresa el aprendizaje, permitiendo así acelerar la convergencia, aunque este incremento puede dar lugar a que no se alcance un valor mínimo verdadero en caso de que r] llegara a ser demasiado grande.

2. Factor de momentum a. Este parámetro permite mantener los cambios de pesos de la red en la misma dirección, ur.a vez que han sido calculados.

números aleatonos en el orden de -0.005 y 0.005

I . Factor de aprendizaje

La inicialización de estos parámetros se realiza antes de comenzar la fase de aprendizaje de la red.

ENTRENAMIENTO DE LA RED

A continuación se presenta la descripción matemática del funcionamiento de la red de contrapropagación. Se presentan las ecuaciones para calcular la salida de cada neurona de la capa intermediaj, las ecuaciones para calcular las salidas de las neuronas de la capa k de la red y para calcular el error de su salida. Esta fase se corresponde con los paso dos al seis de la sección: "funcionamiento de la red neuronal".

La forma en que se calcula la salida Sj de cada neurona J de la capa intermedia, dado un patrón de entrada Si, es la siguiente:

rj = ej + C. T.S¡ I

1 sj = - - 0.5 i + e-q'

Donde:

El valor del exponente e genera una señal sigmoidal que se utiliza para mejorar el comportamiento de la neurona. Para el caso de la figura 4.1 esta ecuación se aplica entre la capa de entrada i y la capa intermedia j .

Para las capas intermedias (en el caso que sean mas de una), se sustituye Si por las salidas de las neuronas de la capa inferior a la capa que se desea calcular la salida. Para el caso de la figura 4.1 la salida de la neurona de la capa k (que es la capa de salida para este caso) queda determinada con las ecuaciones:

Sj representa la salida de la neurona J

0.5 Salida de la neurona K 1 i +e-?

s, =--

La aplicación de las dos ecuaciones anteriores corresponden a los pasos dos y tres del funcionamiento de la red neuronal.

Después de calcularse las salidas de cada neurona de la red, la verificación del error cuadrdico medio de la red (RMS) se calcula mediante la siguiente ecuación @aso 3 del funcionamiento de la red), tomando como referencia la clase deseada Tk del patrón de entrenamiento.

49

Page 61: TESIS - Tecnológico Nacional de México campus CENIDET

Capitulo 4 RECONOCIMIENTO DE PATRONES

Donde: p es el número de patrones y k el número de neuronas en la capa de salida de la red.

El error cuadrático medio de la red se calcula solamente después de cada época ("epoch") para revisar el error acumulado respecto a los patrones de entrenamiento.

Se dice que la red ha aprendido cuando se alcanza uno de los dos objetivos siguientes: 1. El número de épocas supera un valor límite de épocas establecido por el usuario, 2. El valor de RMS es igual a una tolerancia de error predefinida.

Mientras no se alcance uno de los dos objetivos anteriores se lleva a cabo el proceso de modificación de pesos de la red (aprendizaje de la red). Las ecuaciones para esta modificación se detallan a continuación.

MODIFICACI~NDE PESOS (APRENDIZAJE DE LA RED)

La modificación de pesos se lleva a cabo en un orden inverso al cual se calcula la salida de la red. Esta sección corresponde a los pasos cuatro, cinco y seis del funcionamiento de la red.

Para actualizar los pesos y umbrales de cada neurona k de la capa de salida se plantea:

6, =(T , - S k ) + ( S k +05) (0 .5 -Sk)

Donde:

6k es el incremento para afectar los pesos y los umbrales k de la capa de salida a la capa intermedia.

El cambio en los pesos y umbrales de la capa k se realiza mediante las siguientes ecuaciones: AWjk = q6,Si

TwuEvA - ' ~ ; ~ E R , o R + AY., A€', = 76,

'kNUEV.4 = €'MNTERiOñ +A€',. El incremento para actualizar los pesos y umbrales de cada neurona j de la capa intermedia se realiza mediante la ecuación:

-

Similarmente las ecuaciones para modificar los pesos y umbrales de la capa intermedia son:: - Ir,,,, - I rYAwERIoR + 76,s; ' jNUEY.4 - ' jAMElüOR + qd j -

Una mejora al algoritmo de contrapropagación se logra agregando un término relacionado con el momentum a a la etapa de modificación de pesos. El uso de este parámetro permite que el proceso de aprendizaje de la red varíe con el tiempo: el proceso de aprendizaje vana en un valor grande cuando no exista acercamiento al patrón objetivo y en un valor mínimo cuando exista acercamiento ai, patrón objetivo. Este parámetro es utilizado para acelerar la convergencia de la red y su uso es opcional.

50

Page 62: TESIS - Tecnológico Nacional de México campus CENIDET

RECONOCIMIENTO DE PATRONES CapiNio 4 . .

AI utilizar este padmetro es necesario almacenar los incrementos de peso y umbral anteriores para poder calcular un término medio entre los incrementos actuales y los anteriores. Las ecuaciones de la red neuronal para la versión usando el parámetro de momentum son:

A W j m u E v A = @,Sj + d W j u m E R / o R

A Q m u E v A r16, + d@uwmmR

AwvNUEVA = q 6 j s i ' dwijANTERIOR

A @ j N u E , = 176, + d @ j , w m m o R , 4.7 CONCLUSIONES OBTENIDAS DE LA APLICACI~N DE LAS TÉCNICAS DE RP 4.7.1 RESULTADOS OBTENIDOS AL APLICAR LA FASE DE REPRESENTACI~N Y

DESCRIPCI~N Para el sistema de so f iare después .del proceso de umbralización aplicado a las imágenes, es posible llevar a cabo las fases de representación y descripción de los recipientes.

Ya vimos que la fase de represenfación (ver sección 2.2.2.2 FASES DEL RECONOCIMIENTO DE PATRONES) de los objetos puede basarse en características externas e internas. En nuestro caso utilizaremos:

Una representación externa para obtener las características de la forma del envase y. Una representación interna para detectar la ausencia o existencia del nivel de líquido y de la tapa del envase.

Se traza una línea imaginaria al centro de la imagen como se observa en la imagen 4. la . Se mide la distancia horizontal en pixeles desde la línea imaginaria hasta el borde izquierdo de la forma, asignando el valor del centro de la imagen a una variable (contador) y decrementando ésta hasta llegar al borde del recipiente, o al inicio de la imagen. En forma gráfica se puede observar este proceso en la imagen 4.lb. En un vector se almacena esta medida de distancia izquierda, que se identificamos por dhi para su posterior uso.

La representación externa se lleva a cabo de la siguiente manera:

dhii Donde:

dhdi puede tomar el valor O en caso de que no se localice el pixel de borde, esto por ruido sobre la imagen, el cual no permitió definir perfectamente el contorno. Se asigna O a la medida de distancia cuando, en el proceso de decremento el contador alcanza un valor de cero indicando: el inicio de la imagen y la inexistencia del borde. El mismo proceso se aplica para obtener una representación del contorno derecho del envase, midiendo la distancia horizontal derecha que se identifica por dhddesde la linea imaginaria al borde derecho de la forma. Para este caso, a la variable se asigna el valor del centro de la imagen incrementando SU valor hasta localizar el borde del envase o el límite de la imagen. En forma gráfica este proceso se puede ver en la imagen 4 . 1 ~ .

i es el renglón que se procesa.

Page 63: TESIS - Tecnológico Nacional de México campus CENIDET

Capitulo 4 RECONOCIMIENTO DE PATRONES

a G C

Iniugen 4.1. En la imagen a aparece la línea que se traza al centro de la imagen para medir las distancias horizontales del centro, a los bordes derecho e izquierdo del recipiente. La imagen

b muestra el proceso de búsqueda del contorno izquierdo, y la imagen c el proceso de búsqueda del derecho.

Una vez obtenidos ambos vectores de distancias se lleva a cabo un promediado de los mismos para obtener un solo contorno del envase. Como los lados del recipiente son simétricos, se hace necesario este proceso para reducir el posible error debido al ruido en alguno de los dos contornos. -Ambos contornos en las coordenadas X e Y se muestran en la imagen 4.2a y su promedio de la distancia de la línea al contorno en la imagen 4.2b.

a .b

Imagen 4.2 Contornos de la imagen: la imagen a representa ambos contornos: izquierdo y derecho en el eje de coordenadas X e Y ; en la imagen b aparece el promedio de ambos.

La representacien interna utilizada para extraer los datos del nivel de líquido y de la tapa del recipiente, se realiza de la siguiente manera:

o Se cuentan todos los pixeles con valores diferentes de cero en cada una de las filas de la subimagen. Así obtenemos la longitud de cada renglón 19, mediante la expresión:

N

ir, = C M , ~ j = i,2 ,.._ n ,=I

Donde: ' N es el número de columnas de la subimagen,

j es el número de renglón que toma valores desde el renglón 1 hasta el total de renglones en la imagen.

0 Cada una de las longitudes "J, obtenida se almacena en el vector Ir, 0 Una vez que se ha aplicado el proceso de conteo en cada uno de los renglones de la imagen

se localiza el valor mayor dentro del vector y se almacena la posición donde se haya encontrado, lo cual permitirá extraer la línea de la subimagen.

52

.I

Page 64: TESIS - Tecnológico Nacional de México campus CENIDET

Capítulo 4 RECONOCIMIENTO DE PATRONES

Con la posición obtenida del vector se procede a extraer la región de la subimagen, haciendo corresponder cada posición del vector con cada columna 'de la imagen, de la forma siguiente: se calcula el número de renglones para constrnir el vector que contendrá la región del nivel o la tapa del envase; este cálculo es necesario porque dependiendo del número de columnas en la subimagen, será el número de renglones a ser colocados en el vector que representará la región a ser extraída (este vector que se procesa posteriormente, tiene una longitud fija de 64 posiciones), Finalmente, una vez que se ha definido la posición de la longitud mayor y el número de renglones se colocan directamente los valores de los pixeles en el vector.

En realidad, este Último proceso se centra en una de las propiedades de reflectividad de la imagen: el color. La extracción de la región depende de los valores de los pixeles.

En el siguiente ejemplo se describe en forma práctica la manera en que se obtiene la representación interna del envase.

La imagen 4.3 muestra los contornos del nivel de líquido y de la tapa de un envase. Una posible representación de alguna de estas imágenes como matriz se representaría de la forma en que aparece en la $guru 4.2, en la que también se representa el vector de longitudes de los pixeles diferentes de cero de todos los renglones. ,

- 1 . -1 2 .

a b

Imagen 4.3 En la imagen a se representan los renglones que constituyen a la subimagen del nivil de líquido y en la imagen~ b los renglones de la tapa del recipiente. El valor máximo den

en cada caso es el número de renglones en la imagen. REPRESENTACION MATRlClAL VECTOR DE 1,ONGITUDES

Figura 4.2 Una representación matricial supuesta de la imagen 4.3 del nivel líquido de un recipiente, y una representación gráfica del vector que contiene las longitudes de cada

renglón. Los renglones con mayor número de 1's representa la existencia de la línea en la imagen.

I! ii

53

Page 65: TESIS - Tecnológico Nacional de México campus CENIDET

Capítulo 4 RECONOCIMIENTO DE PATRONES I

Para este caso la longitud mayor se localiza en la posición 5 del vector de longitudes. Si el vector que conten& la región de la imagen, denominado vector de región, es de 30 posiciones, el sistema almacenará en éste los renglones 4, 5 y 6, el renglón mayor y sus dos vecinos, los cuales por sus propiedades de reflectividad (los valores de niveles de gris en la región), contienen las líneas horizontales que identifican al nivel o la tapa del recipiente. Los valores obtenidos en el vector pudieran no corresponder a una línea, como se explicó con anterioridad, pero la detección de esta corresponde a la fase del reconocimiento depatrones.

4.7.2 RESULTADOS OBTENIDOS AL APLICAR LA FASE DE RECONOCIMIENTO E INTERPRETACI6N

Una vez que se ha llevado a cabo el procesamiento digilal de la imagen y se ha obtenido una descripción sobre la base de la representación de los objetos en escena, el siguiente paso es aplicar un método que permita el reconocimiento de los mismos. En la mayoría de los casos la tarea no es Únicamente el reconocer o clasificar el objeto, sino también emitir un juicio al respecto. Para el caso de los sbtemas de inspección visual es necesario obtener información de las características de los productos verificados, una vez capturados mediante un dispositivo de adquisición de imágenes desde la banda transportadora. Esta información le permite al sistema automatizado decidir si el objeto se rechaza por tener defectos en su elaboración o si es aceptado como correcto.

El procesamiento digital de imágenes condujo a una representación de los recipientes a ser verificados. La aplicación de una segmentación automática, haciendo uso de un algoritmo de extracción de características (ver sección 2.2.2.6 ESTRUCTURA DE UN SISTEMA TfPICO DE RECONOCIMIENTO DE PATRONES), permitió extraer información sobre la forma, el nivel y la tapa de los envases, por lo que la representación de cada envase consta de 3 vectores.

En la sección 2.2.2.2 FASES DEL RECONOCIMIENTO DE PATRONES se dijo que la fase de segmentación se ubicó en el tratamiento digital de la imagen y en el reconocimiento de patrones. Esto se hizo así porque se lleva a cabo una doble aplicación de este proceso:

a) La primera dentro del TDI, cuando el usuario divide la imagen de los recipientes en las partes a controlar, es decir, cuando define tres ventanas en forma manual haciendo uso del mouse para indicar al sistema la forma del envase, la posición de la tapa y los límites del nivel de líquido aceptables como correctos.

b) La segunda, dentro del RP, cuando el sistema de manera automática realiza una extracción de las características de los envases, construyendo una representación en forma de vectores de cada parte de la botella permitiendo así, la aplicación posterior de un algoritmo para la clasificación del objeto.

La clasificación del objeto, como última etapa del sistema, será la encargada de determinar la aceptación o rechazo del producto. Esta clasificación, una vez obtenidas y almacenadas las caractensticas que describen al objeto en los vectores, puede realizarse:

3 Mediante el uso completo de los vectores (método ingenieril), considerando que &os contienen todavía mucha información del objeto, provocando una sobrecarga a la red neuronal y limitando una posible implementación en hardware del sistema, O bien,

3 Limitando, el número de características contenidas en los vectores. El proceso de limitar los descriptores mediante la transformada rápida de fourier, permite disminuir el número de entradas y el tiempo de entrenamiento de la red neuronal, reducir el tiempo de procesamiento de cada imagen en la etapa de reconocimiento y mejorar la respuesta del sistema. Dada la simetría de la DFT, es posible eliminar el 50% de los descriptores que se alimentan a la RNA.

54

Page 66: TESIS - Tecnológico Nacional de México campus CENIDET

Capitulo 4 RECONOCIMIENTO DE PATRONES

Dado que las imágenes adquiridas de los recipientes son en un tamaño de 105 columnas por 216 renglones o menos y la segmentación de la imagen realizada por el usuario son segmentos de la imagen original (ver sección VII.1.3),. los vectores resultantes que caracterizan' los objetos a clasificar son de 128 puntos para el caso de la forma y 64 para el nivel y la tapa del envase (ver imágenes 3.5 y 3.6).

La FFT se aplica sobre los vectores resultantes (los cuales representan una señal periódica en el tiempo); de los primeros 16 armónicos,.los cuales representan los componentes de la parte baja del espectro, se eligen como datos de entrada a la red neuronal de contrapropagación (número de neuronas de la capa de entrada). Este número de armónicos a utilizar se decidió buscando un equilibrio entre un valor lo suficientemente grande para caracterizar la señal, pero no demasiado elevado para poder conseguir una red neuronal robusta.

La arquitectura de la red neuronal artificial de contrapropagacion implementada se muestra en la figura 4.3. Una vez que se calcula la FFT, los primeros 16 arm6nicos se aplican a la entrada de la red neuronal. La capa intermedia esta compuesta por 25 neuronas y la capa de salida por 3. El número de neuronas en la entrada de la red puede variar; pero el tiempo de entrenamiento de la red entonces será mayor.

I O0

Figuro 4.3 Arquitectura de la red neuronal artificial de conhapropagación utilizada por el SIVA.

forma incorrecta

La forma en que se organiza la red en su capa de salida para la forma del envase se muestra en la tabla 4.1; el primer caso O01 engloba a todos aquellos recipientes que se consideran como casos correctos en la clasificación (ver imagen 3.3a, 3.3b y 3.3c), en los que la forma del objeto no es muy afectada por el ruido; el segundo caso 010 considera los casos cuando el recipiente carece de un nivel de liquido aceptable (ver imagen 3.3d, 3.3e y 3.20. Por último el caso incorrecto con código 100 se presenta cuando en la línea de producción aparece un recipiente extraño (ver imagen 3.1). 1

o 1 o

55

Page 67: TESIS - Tecnológico Nacional de México campus CENIDET

Capitulo 4 RECONOCIMIENTO DE PATRONES

I O0

Para el nivel de líquido la organización de la red se muestra en la tabla 4.2; los códigos se representan mediante tres dígitos que indican una forma correcta y dos incorrectas. Se considera un caso correcto, cuando el nivel se encuentra en los límites establecidos como correctos. El primer caso incorrecto se presenta cuando el recipiente tiene un nivel de líquido muy bajo y el segundo cuando el recipiente esth muy lleno (ver imagen 3.2).

1

Nivel correcto

Poco lleno

56

Page 68: TESIS - Tecnológico Nacional de México campus CENIDET

RECONOCIMIENTO DE PATRONES Capítulo 4

4.8 REFERENCIAS Y BIBLIOGRAFfA [Freeman, 19931 James A. Freeman y David M. SkapUra, Redes Neuronal-, Algoritmos. aplicaciones y tbcnicas de programacidn. E.U.A. Addison-Wesley Iberoamericana.

[Fu, 19931 Li Min Fu, Hui-Huang Hsu, and Jose C. Principe, “Incremental Barkpropagation Learning Networks,” IEEE Transactions On Neural Networks, Vol. 7, No. 3, pp 751-761, May 1996.

[González, 19961 Rafael C. González y Richard E. Woods Tratamiento dig’tal de imágenes, E.UA. Addison-Wesley Iberoamericana.

[Hilera, 19961 José R. Hilera y Victor J. Martinez, Redes Neuronales Artificiales, Fundamentos. modelos y aplicaciones, E. U.A Addison-Wesley iberoamericana.

[Mantri, 19931 Suryanarayana Mantn, Cincinnati Bell Information Systems, Darcy Bullock, Louisiana State University and James Garrett Jr., Carnegie Mellon University, “Vehicle Detection Using a Hardware-Implemented Neural Net,” IEEEEXPERT. pp. 15-21, January-February 1997.

[Parker, 19951 J. R. Parker Practical Computer Vision Using C, U.S.A John Wiley & Sons, inc.

57

li

Page 69: TESIS - Tecnológico Nacional de México campus CENIDET

E X P E R I M E N T A C I ~ N Capítulo 5

. . .

CAPÍTULO 5 EXPERIMENTA CIÓN

5.1 I N T R O D U C C I ~ N

L .periment; . . I C el sisi I de m f h u r e se llevó a cabo con cuatro bases de imágenes. Las

base de imágenes se constituyen de u n conjunto de imágenes de recipientes. En términos generales, cada base constituye un experimento. Los tipos de recipientes utilizados son del tipo Coco-Colal .I) Funra.

El experimento I y 2 siniulan una posición cercana de la cámara al objeto. en tanto que los experimentos 3 y 4 una posición mas alejada. Los dos diferentes tamaños de los recipientes son para simular el dispositivo de adquisición a diferentes distancias de la banda transportadora en la industria. La restricción es que la distancia no exceda los 2.5 metros. Cabe señalar que los tamafios de los recipientes no se refieren a diferentes escalas que el sistema soporta, es decir, no se trata de una inmunidad del sistema a los cambios de escala, sino que son los tipos de imágenes con las que el sistema fue entrenado.

Los experimentos se pueden resumir en la figura 5.1 en la cual se muestra el número de experimento, el tipo de recipiente y la posicióii de la cámara.

Fanta

Coca Cola

Faiita X

Figura 5. I Experimentos realizados coi1 el sistetiia de sofiware.

Page 70: TESIS - Tecnológico Nacional de México campus CENIDET

EXPERIMENTACI~N Capitulo 5

El tipo de recipiente se refiere al envase que el sistema verifica, Coca Cola o Fanta, cada una de las bases de imágenes contiene los dos tipos de recipientes. Se consideran recipientes correctos aquellos que pertenecen a la base de imágenes y recipientes incorrectos aquellos que no pertenecen a ésta. Por ejemplo: en la base de imágenes de Coca Cola los envases de este tipo son correctos y los envases de Fanta son incorrectos.

Todas las bases de imágenes incluyen las mismas variaciones de los recipientes en escena, apegadas a lo que realmente ocurre en una industria del llenado de refrescos. Esias variaciones fueron tomadas de las observaciones llevadas a cabo en la embotelladora Coca Cola de Cuernavaca, Morelos debidas a:

~

I 'i

i' El movimiento de traslación de la botella, El tapado de los envases, El nivel del liquido, El etiquetado de los envases, y La existencia de recipientes "extraños " en la banda transportadora.

La primera variación del recipiente se refiere al movimiento de traslación de la botella, el cual da lugar que la posición que pudiera presentar éste al viajar por la banda transportadora después del proceso de llenado y tapado, es decir, al momento de ser captada por la cámara, pueda ser:

~

' 1

AI centro de la imagen, Con un corrimiento a la izquierda, o Con un corrimiento a la derecha.

i

1 La imagen 5.1 muestra estas posibles variaciones.

I

IZQUIERDA CENTRO DERECHA

Imagen 5.1 Posiciones debidas al movimiento de traslación de los recipientes en la banda transportadora al ser captados por la cámara: izquierda, centro y derecha. El sistema simula que el

envase no se encuenha localizado exactamente al centro de la imagen, debido a su movimiento cuando son captadas por el sistema.

59

Page 71: TESIS - Tecnológico Nacional de México campus CENIDET

Capítulo 5 EXPERIMENTACI~N

Una segunda variación se presenta en el tapado de los envases. Los casos que un recipiente puede . presentar son:

a) Que la tapa esté bien colocada: el envase fue tapado correctamente después del proceso de llenado, es decir, la tapa en el envase no presenta problemas,

b) Que el envase no tenga tapa: en ocasiones, por la velocidad a la que viajan las botellas por la banda transportadora la máquina que lleva a cabo la tarea del tapado de la botella no tiene oportunidal de colocar la corcholata al envase, por lo que aparece sin ella. El SIVA, al detectar un problema de este tipo, emite una señal acústica indicando que se ha detectado un recipiente con una tapa defectuosa. La botella debe ser retirada por el inspecfor o por un sistema dedicado al desalojo de los productos de la banda transportadora (el sistema que lleva a cabo el desalojo de las botellas está fuera del contexto de este trabajo.

c) Que exista un tipo de tapa en la botella diferente al que se está verificando: si el sistema se encuentra detectando en una línea de producción el tipo de tapas metálicas y se presenta un recipiente con una tapa diferente como una de plástico, envía un mensaje de error.

En la imagen 3.1 en el capítulo 3 se muestran estos casos

La tercera variación está relacionada con el nivel de líquido en 13 botella. En la industria, la máquina encargada del llenado de los envases presenta variaciones durante su funcionamiento, que repercute en los niveles de llenado de líquido en los envases. Las botellas que presentan niveles muy altos o muy bajos de líquido son retiradas de la línea de producción por parte del inspector o por el sistema de desalojo una vez que son detectadas.

LOS posibles casos que un recipiente puede presentar una vez que se han definido los límites mínimo y máximo aceptables de liquido son:

La botella presenta un nivel de líquido correcto, el cual puede ser alto, bajo o estar al centro de los límites establecidos; la imagen 3.2a, 3.2b y 3 . 2 ~ muestran estas tres variaciones. La botella presenta un nivel incorrecto, exactamente a la altura de la línea que se definió como límite mínimo aceptable, por lo que el sistema debe indicar el retiro del producto de la banda transportadora. Este caso se muestra en la imagen 3.2d. El recipiente presenta uno de dos casos de nivel incorrecto: por arriba de la línea establecida como nivel máximo correcto o, por debajo de la línea establecida como nivel mínimo correcto. Cabe señalar que en la mayoría de las embotelladoras, el liberar productos con más Contenido del que se establece como límite máximo no es aceptable, pero en ocasiones por ahorro para la misma industria y por estética del producto sí se hace. Estos dos casos se muestran en las imágenes 3.2e y 3.2f.

La cuarta variación es la relacionada con el etiquetado del envase. Aunque inicialmente no se planteó el problema de la etiqueta, en la realidad es un problema que aparece como cualquiera otro pues cada tipo de recipiente trae comúnmente consigo una etiqueta que lo identifica y durante la transportación, desde la máquina llenadora hasta que son colocados en las rejas, los envases tienen un movimiento circular que provoca que al ser captados por la cámara, la etiqueta aparezca con variaciones en su presentación. Durante la fase de pruebas del SIVA se consideró un gran,número de situaciones, en particul,ar las que pudieran provocar más problemas. Por esta razón se integró la etiqueta como una variación más dentro del SIVA. Los tipos de etiquetas varían completamente de un recipiente a otro. El principal problema es que como éstas cubren parcialmente el nivel del líquido existe dificultad para la detección del mismo.

En el SIVA se consideran los casos que pudieran presentarse en relación con las etiquetas de una botella del refresco Fanfa modelo tomado para la realización de estas pniebas. Algunos de LOS posibles casos que se presentan en la realidad se muestran en la imagen 5.2.

60

Page 72: TESIS - Tecnológico Nacional de México campus CENIDET

EXPERIMENT A C I ~ N Capítulo 5

Imagen 5.2 Las variaciones relacionadas con las etiquetas de un recipiente prueban que afectan ai sistema durante su ejecución.

La quinta y última variación considerada es la posible existencia dentro de una línea de producción de recipientes extraños. El sistema se acondiciona para la verificación de una clase de recipientes, de los cuales verifica la forma, el nivel y la tapa. Si dentro de esta linea se detecta un envase que no corresponde al tipo verificado, el sistema indica la detección de un recipiente no reconocido el cual debe ser retirado de la banda transportadora. La imagen 3.1 muestra una línea de producción simulada en la que el recipiente del centro es un envase extraño. Si el sistema esta verificando envases del tipo Coca Cola y aparece un recipiente diferente al normal, se indica la detección del error.

RESULTADOS ESPERADOS

Para llevar a cabo el entrenamiento de la red neuronal, se escogió un conjunto de muestras que identifican las variaciones que un recipiente puede presentar en cuanto ai nivel, tapado y forma. Este conjunto es denominado conjunto de entrenamiento. Los recipientes que no fueron usados en el entrenamiento son considerados para pruebas del sistema y conforman el conjunto de trabajo.

El tipo de resultado para cada envase se considera: Correcto o positivo cuando no presenta ningún problema en alguna de las partes que se analiza: forma, nivel o tapado. Incorrecto o negativo cuando es detectado algún problema en alguno de estos análisis, Falso negativo cuando es considerado incorrecto y el envase no presenta ningún problema. Falso positivo cuando es considerado correcto y el envase presenta algún problema.

Los resultados esperados de todos los experimentos propuestos serán el obtener un reconocimiento del 100% de todos los recipientes del conjunto de entrenamiento (calidad del entrenamiento) y de todos los envases del conjunto de trabajo.

PRESENTACI~N DE LOS RESULTADOS

La presentación de los resultados en este trabajo se hace mediante dos tablas denominadas tabla de la calidad del entrenamiento de la red neuronal. Éstas muestran los resultados obtenidos una vez que se da como entrada al sistema los conjunto de entrenamiento y de trabajo respectivamente para la verificación y clasificación de cada objeto, además de las correspondientes gráficas construidas a partir de las mismas.

61

Page 73: TESIS - Tecnológico Nacional de México campus CENIDET

EXPERIMENTACI~N Capítulo 5

bs tablas muestran en la primera columna la base de imágenes utilizada, en la segunda el de las muestras y en las restantes el nombre del componente de la botella que fue verificado: forma, nivel Y tapa. para cada componente aparece el número real de muestras con que fue entrenada la r d ’ Y el

de muestras reconocidas como correctas e incorrectas (Rec.). Por ejemplo, Pam el caso de la base de imágenes COCAS2 (ver tabla 5.1) se usaron 25 ejemplos reales, de 10s cuales 19 eran correctos y 6 incorrectos. De este grupo de patrones, como reconocidos se obtuvieron 20 recipientes correctos y 5 inc.omctos, existiendo por tanto un falso positivo. Para el caso del nivel se usaron también 25 muestras, 14 correctas y 1 I incorrectas, de las cuales aparecen reconocidas exitosamente todas las mueshas. Los resultados para el caso de la tapa también fueron exitosos y se presentan de la misma forma. En la última columna de las tablas se presentan los porcentajes de reconocimiento, el cual se obtiene sumando todas las columnas del renglón de muestras reales.

Los resultados obtenidos con el sistema al hacer uso del conjunto de trabajo, se presentan en la tabla denominada tabla de f a calidad de reconocimiento. Los resultados se muestran de la misma forma que en la tabla de la calidad del entrenamiento.

Cada tabla se acompaña de una gráfica que muestra en el eje X, los tipos de muestras: correctas o incorrectasproporcionadus a la RNA (ver la griifica 5.1). Las barras en color negro representan el número de recipientes correctos o incorrectos reales presentados al sistema. En la tabla este número aparece en la columna Real. Las barras en color blanco representan el número de recipientes que el sistema reconoció como correctos e incorrectos durante su ejecución.

Las primeras seis barras de la gráfica 5.1, pertenecen a la fila de los recipientes correctos de la base de imágenes COCAS2. En esta gráfica, aparecen representados en la primer barra negra diecinueve (19) recipientes correctos para la forma, la segunda barra blanca indica el número de recipientes reconocidos, que para este caso son 20 patrones (el sistema detectó un falso positivo). La tercera y cuarta barra indican las cantidades reales y reconocidas para el nivel de líquido de los recipientes: 14 reales y 14 reconocidos. La quinta y sexta barra muestran la cantidad de tapas presentadas al sistema (en la columna Real) y la cantidad de éstas que fueron reconocidas (en la columna Rec). Los resultados obtenidos para la forma y el nivel de la botella, tanto para los recipientes reales como reconocidos, presentan cantidades iguales, lo que indica que los recipientes presentados al sistema son los que reconoció.

En el eje Y aparece: número de muesfrus que identifica las muestras presentadas a la red neuronal, correctas e incorrectas.

5.2 EXPERIMENTOS REALIZADOS CON EL SIVA A continuación se describen los cuatro experimentos llevados a cabo con el SIVA los cuales incluyen las 5 variaciones, descritas en la sección anterior. que un recipiente puede presentar, y la variación en la posición de la cámara. El primer experimento llevado a cabo con el SIVA incluyó una base de datos de 40 imágenes (ver la tabla 5.2). El tipo de recipiente pwa estas pruebas se muestra en la imagen 5.4. Las variaciones de los recipientes incluidas en este experimento fueron las siguientes:

. .

Vacíos, sin nivel de líquido, Llenos, con niveles correctos, Con tapas colocadas correctamente, Sin tapa, considerados como tapas mal colocadas y Con movimientos de traslación: izquierda, derecha y Centro de ]a imagen

62

Page 74: TESIS - Tecnológico Nacional de México campus CENIDET

Capítulo 5 EXPERIMENTACI~N

Este experimento se diseñó colocando la cámara cercana al recipiente. LOS objetos en la imagen aparecen de un tamaño grande. Experimentos posteriores muestran el recipiente más al fondo, lo que ofrece una idea de los diferentes tamaños que el sistema maneja.

El conjunto de muestras tomadas de la base de imágenes con las posibles variaciones fueron las siguientes:

0 Para el caso de la forma se consideraron 19 muestras como correctas y 6 muestras como incorrectas, Para el caso del nivel, 14 muestras como correctas y I 1 como incorrectas, Para el caso de la tapa, 10 correctas y 15 incorrectas.

Este conjunto de imágenes fue presentado al sistema para ser reconocidas como muestras aceptables, para que posteriormente el sistema hiciera la verificación con nuevos objetos. Los resultados obtenidos se muestran a continuación.

RESULTADOS OBTENIDOS CON EL EXPERIMENTO I Los resultados obtenidos con este experimento se muestran en la tabla 5. I . Esta base de imágenes se identifica como COCAS2. La tabla de la calidad de entrenarnie;ito para este experimento muestra en la columna de forma y renglón de envases correctos una cantidad de 19 recipientes como reales y la cantidad de 20 para objetos reconocidos, es decir, existe un falso positivo. Para el caso de las muestras incorrectas, aparecen en la fila de incorrectas como 6 reales y 5 reconocidas. En este caso el SWA reconoce un objeto incorrecto como correcto en la fase de entrenamiento de la red neuronal.

Para el caso del nivel y la tapa, la respuesta del sistema es en un 100% correcta, es decir, el número de envases mostrados al sistema para una verificación posterior son los que correctamente reconoce.

Una vez mostrados los recipientes al sistema de la base de entrenamiento, el siguiente paso h ie presentar el cunjunfo de trabaju para su verificación. Los resultados obtenidos se presentan en la tabla 5.2, denominada tabla de la calidad de respuesta del sistema. Para este caso los resultados obtenidos fueron:

El sistema no reconoce 2 de los 35 recipientes correctos; en la columna de reconocidos (Rec) arroja un resultado de 33 solamente y, Para el caso de recipientes incorrectos, de 5 dados como muestra, se obtiene un total de 7 envases reconocidos, es decir, existen 2 casos considerados comofalsos negativos.

En general, el resultado esperado para el caso de la forma y la tapa, el reconocimiento es ai 100%.

63

Page 75: TESIS - Tecnológico Nacional de México campus CENIDET

Capítulo 5 EWERIMENTACI~N

FANTAS

BASE DE IMÁGENES

Correctas 24 24 32 32 8 8 1 O0

Incorrectas 12 12 8 8 37 37 1 O0

l 1 I

64

Page 76: TESIS - Tecnológico Nacional de México campus CENIDET

EXPERIMENTACI~N Capítulo 5

Incorrectas 9 8 87 93 88 88 99 FANTAS Correctas 87 84 53 53 32 37 95

Incorrectas 13 16 47 47 68 63 97 -

GRAFlCA DE iA CALIDAD DE ENTRENAMIENTO DE LA RNA

3 40 c

30

Y 20 E O

2 10 Y 5 .- n - - 2 1 2 3 4 5 6 7 a

TIPOS DE MUESTRAS PROPORCIONADAS A LA RNA

Grajca 5.1 Gráfica de la calidad de entrenamiento. En el eje X se muestran los tipos de muestras proporcionados al sistema: correctos e incorrectos; las barras en color negro muestran las

cantidades de recipientes reales, correctos e incorrectos reales presentados al sistema y las barras blancas, el número de muestras reconocidas por el sistema.

65

Page 77: TESIS - Tecnológico Nacional de México campus CENIDET

EXPERIMENT ACIÓN Capítulo 5

GRAFlCA DE LA CALIDAD DE RESPUESTA DEL SIVA

i

1 2 3 4 5 6 7 8

TIPOS DE MUESTRAS PROPORCIONADAS A LA RNA

Gráfica 5.2 Gráfica de la calidad del sistema al utilizar el conjunto de trabajo constituido por las cuatro bases de imágenes.

El segundo experimenfo llevado a cabo con el SIVA incluyó una base de imágenes de 49 recipientes. El tipo de recipiente para estas pruebas se muestra en la imagen 5.5 . Las variaciones de los recipientes fueron las mismas presen:adas en el primer experimento, así como la posición de la cámara.

Las muestras tomadas para ser presentadas al sistema fueron: Para el caso de la forma se consideraron 12 muestras como correctas y 24 muestras como incorrectas,

,* Para el caso del nivel, 12 muestras como correctas y 14 como incorrectas, Para el caso del tapa, I2 correctas y 24 incorrectas.

RESULTADOS OBTENIDOS CON EL EXPERIMENTO 2 Los resultados obtenidos con este experimento fueron: para el caso de la calidad del entrenamiento (ver la tabla 5.1) el sistema reconoció las mismas muestras que le fueron presentadas para el entrenamiento de cada parte de la botella.

Para el caso de la calidad de reconocimiento con el conjunto de trabajo los resultados obtenidos son: Existe una disminución en la cantidad de formas correctas (4): son presentadas 33 muestras y reconocidas 29; se detectan 4falsos negativos.

0 En los resultados del nivel del recipiente, no se presentan casos de falsos negativos o falsos positivos: de las 14 incorrectas, 14 se detectaron como tales. Para el caso de las tapas, existe un aumento en las muestras presentadas como correctas, de 19 presentadas se obtuvieron 24; por lo tanto se obtienen 5 falsospositivos.

66

It

Page 78: TESIS - Tecnológico Nacional de México campus CENIDET

EWERIMENTACI~N Capitulo 5

Objetos de prueba

Imagen 5.5 Modelos de objetos de prueba de la base de imágenes FANTAS2.

El tercer experimento llevado a cabo con el SIVA difiere de los dos anteriores: . Incluye todas las diferentes variaciones en los niveles de líquido,

Sepresentan variaciones en las tapas de los envases, Se consideran todos los movimientos de traslación de la botella, No se tomaron en cuenta los problemas que pudiera p;esentar la etiqueta, pues se tiene en cuenta en el siguiente experimento.

En este caso la cámara se colocó más alejada de los objetos, lo que permite obtener imágenes de éstos más reducidos en tamaño. Estas variaciones de posición de la cámara han sido consideradas con el fin de simular las diferentes colocaciones de la misma frente a la línea de producción en una industria. Cabe señalar que la velocidad de verificación (en tiempo real) tendrá un cambio considerable: cuando los recipientes.se encuentren muy cercanos a 'la cámara, tendrán una velocidad diferente a la que se presentará cuando el dispositivo de adquisición se encuentre alejado de la misma.

Esta base de imágenes está constituida por 118 recipientes; como el que se muestran en la imagen 5.6.

Las muestras presentadas al sistema fueron: Para el caso de la forma se presentaron 28 muestras como correctas y 1 I como incorrectas, Para el nivel, 12 muestras como correctas y 24 muestras como incorrectas, Para el caso de la tapa, 12 muestras como correctas y 24 como incorrectas.

RESULTADOS OBTENIDOS CON EL EXPERIMENTO 3

Para la calidad del entrenamiento se obtiene un reconocimiento del loo%, todas las muestras presentadas al sistema son reconocidas al ser verificadas nuevamente.

Para el caso del conjunto de trabajo los resultados se toman favorables: Para el caso de la forma, de 109 muestras presentadas se reconocen 110, es decir un único falso positivo dado por el sistema; Para los niveles, existe una disminución de 6 muestras en el caso de las correctas, se presentan ai sistema 31 y obtiene Únicamente 25, aparecen ófalsos negativos; LOS resultados para las muestras de las tapas no presentan ningún problema.

61

Page 79: TESIS - Tecnológico Nacional de México campus CENIDET

I - EXPERIMENTACI~N 1

Capítulo 5

! Objetos prueba

Imagen 5.6 Modelos de objetos de pdeba de la base de imágenes COCAS. Para este experimento 10s recipientes aparecen reducidos en su tamaño, debido a que la posición de la cámara es más alejada de la banda

transportadora. Las pruebas en este experimento muestran, entre otras variaciones, diferentes niveles de líquido.

El cuarto experimento llevado a cabo con el SIVA incluyó una base de datos de 100 imágenes. El tipo de recipiente para estas pruebas se muestra en la imagen 5.7,;Este experimento presenta una variación importante en la verificación de los recipientes: la etiqueta. La etiqueta en los envases del refresco Funtu puede aparecer en diferentes posiciones, por lo que es necesaria una revisión meticulosa para incluir en el conjunto de entrenamiento un gran número de variaciones en relación con la etiqueta.

Las variaciones en los recipientes para este caso fueron las mismas que se consideraron en el tercer experimento.

El conjunto de muestras presentadas al sistema son:

~

, '! 'I

Para el caso de la forma 24 correctos y 12 incorrectos, Para los casos del nivel de líquido 32 correctos y 8 incorrectos, Para los casos de la tapa fueron 8 como correctos y 37 como incorrectos.

RESULTADOS OBTENIDOS CON EL EXPERIMENTO 4 Para la calidad del entrenamiento los recipientes mostrados al sistema fueron los mismos que determinó como correctos e incorrectos. La tabla 5.1 muestra estos resultados, que también aparecen en la gráfica 5.1. Los resultados para el caso de la calidad de reconocimiento del sistema son los

Se presentaron 87 formas correctas de las que el sistema detectó 110 colocando las 3 faltantes en el renglón de formas incorrectas. Para el caso del nivel tanto las muestras correctas como las incorrectas presentadas al SIVA fueron detectadas sin ningún problema. El número de muestras para las tapas correctas fueron de 32, de las cuales el sistema reconoce 37, es decir, determinó Sfulsospositivos.

'

siguientes (ver la tabla 5.2): 1

68

Page 80: TESIS - Tecnológico Nacional de México campus CENIDET

Capitulo 5 EXPERIMENTACI~N

Objetos prueba

ZmugenS. 7 Modelos de objetos de prueba de la base de imágenes FANTAS

5.3 DISCUSIÓN SOBRE EL SISTEMA DE SOFTWARE DEL SIVA

A continuación se discuten los algoritmos que llevan a cabo la selección de los descriptores de Fourier y la inspección completa de los recipientes. Se incluyen sus resultados en cuanto al tiempo de ejecución y verificación de los niveles incluyendo las posiciones de la etiqueta, la. influencia de la velocidad durante la verificación de los recipientes, y de la iluminación utilizada.

El algoritmo del sistema de so f tare se ejecuta bajo el sistema operativo DOS, haciendo uso del lenguaje Turbo C++. El sistema puede trabajar con diferentes tamaños de imágenes: para las columnas, menor o igual a 105 pixeles y para los renglones menor o igual a 216 pixeles; el sistema utiliza imágenes almacenadas en un dispositivo de almacenamiento secundario (disco duro), el cual simula que las imágenes provienen de un dispositivo físico de adquisición extemo a la computadora.

Para la selección de los descriptores de Fourier que mejor reconstruyen la imagen, se utilizó un programa en lenguaje C, el cual permite visualizar con diferente número de descriptores, <128 para la forma y <64 para el nivel y la tapa, la reconstrucción de las partes de la botella. En base a este programa se pudo seleccionar el número de descnptores que representan la entrada a la red. Básicamente, el proceso de selección fue el ir eliminando secuencialmente bloques de descnptores e ir reconstruyendo la señal con los restantes, para finalmente determinar aquellos que mejor identifiquen a la señal.

LOS tiempos de verificación completa del sistema, fueron medidos en una computadora con procesador 486 a una velocidad de 100 Mhz. El tiempo que se consume por cada recipiente es del 7% de segundo en una escala de O a IO, es decir el sistema puede verificar aproximadamente tres recipientes cada dos segundos con este tipo de hardware. En la industria del refresco se verifican en forma manual aproximadam.ente dos recipientes por segundo; este número puede variar porque depende del tipo de recipiente que se verifique, por ejemplo en la embotelladora Coca Cola, para el refresco Funta, e inclusive el mismo de Coca Cola, existen dos tamaños de envase retomable y no retomable, para el primero la verificación es más rápida: 2 envases por segundo, para el no retomable es de aproximadamente 3 envases cada dos segundos, además de requerir dos inspectores para este tipo de envase.

Un factor que afecta la velocidad de verificación de los recipientes y que debe considerarse en el diseño del sistema al manejar el tiempo real dentro del mismo es la profundidad de la banda transportadora en relación con el dispositivo de adquisición. En particular, el sistema de sofmare aún no contempla el movimiento de los recipientes en la banda transportadora, por lo que no se presentan resultados sobre las diferentes velocidades que el sistema manejaría al utilizarla.

69

Page 81: TESIS - Tecnológico Nacional de México campus CENIDET

EXPERIMENTACI~N Capitulo 5

EI manejo del tiempo real no se plantea como una necesidad para este proyecto, debido a W e es necesario solamente tener una sincronía entre la cámara y el dispositivo de verificación. Cuando el recipiente se encuentre exactamente frente a la cámara se adquiere la imagen, se procesa y se emite el resultado.

La iluminación que el sistema utiliza, es similar al de la industria; ésta fue simulada dentro de un salón de clase, utilizando dos retroproyectores de acetatos. Aunque no se utilizaron los mismos' dispositivos que :a industria tiene instalados, el sistema arroja buenos resultados, pero cabe señalar que la iluminación pudiera mejorarse al utilizar lámparas similares a las que utilizan los inspectores y un difusor traslúcido.

La etiqueta que el envase trae consigo, es un problema presente en la Verificación, que el sistema de sofnuare detecta en la ejecución. Debido a la gran variedad de éstas no es posible manejar un estándar, por lo que el sistema permite que el usuario defina los 'casos en los que la etiqueta se confunde con el nivel de líquido, y sean presentados a la red neuronal como incorrectos.

De los resultados que se obtuvieron con las etiquetas se puede decir que de los casos mostrados en la imagen 5.2 recipientes a, b y c, y todos aquellos similares a éstos, el sistema los detecta como incorrectos, pero cuando la etiqueta cubre totalmente el área del nivel de líquido se presenta una confusión al detectarse un nivel inexistente.

Las estadísticas2 de verificación existentes en la industria son: La existencia de al menos 4 recipiente con defecto en el nivel de líquido entre I y 2 minutos, Problemas en el tapado del envase: I recipiente en al menos 3 minutos, Recipientes extraños en la banda transportadora I o 2 en 30 minutos.

Los sistemas de verificación de recipientes que existen en la industria, únicamente verifican los niveles de líquido o las tapas de los recipientes, pero no existe alguno que verifique de forma conjunta las dos partes y mucho menos las tres que el sistema de software desarrollado verifica.

'Estas estadisticas fueron proporcionadas por empleados de la embotelladora de Cocri Colo Las Trojes, Aguascalientes, Ags.

70

Page 82: TESIS - Tecnológico Nacional de México campus CENIDET

Capitulo 6 CONCLUSIONES Y TRABAJOS FUTUROS

CAPÍTULO 6 CONCLUSIONES Y TRABAJOS FUTUROS

6.1 CONCLUSIONES

El desarrollo de este proyecto de tesis, consiste en la construcción de un sislema de inspección visual automatizada, sobre la base del esbozo de una metodología para la verificación de recipientes no opacos utilizando el paradigma de redes neuronales artifciales. La metodología consta de tres fases para llegar a la verificación de los recipientes:

o La primera fase selecciona un método de iluminación adecuado para el sistema en un entorno industrial, La segunda fase usa las técnicas del tratamiento digitalde imágenes para su mejoramiento, y

0 La tercera usa las técnicas de reconocimiento de patrones para obtener una clasificación de las muestras que se le presentan al sistema.

En términos generales, el sistema de iluminación fue una simulación de la forma utilizada en la industria para la inspección de las botellas, pero aunque se implement6 una simulación, los resultados de la verificación se consideran favorables. Para el caso de las variaciones en la iluminación no se consideraron cambios en los niveles de voltaje. La fase de tratamiento digital de imágenes, que tiene la función de mejorar la imagen, incluyó un conjunto de pruebas con diferentes técnicas para poder facilitar la extracción de características de los recipientes. En esta fase se aplican las técnicas de dilatación, mejoramiento de bordes y umbralización. También se consideró la velocidad de ejecución, es decir, se implementaron tknicas que no consumieran demasiado tiempo de procesador, para así agilizar la verificación. Los resultados obtenidos con las técnicas aplicadas se consideran satisfactorias en cuanto a los resultados y tiempo de verificación. Una vez que la imagen ha sido tratada, que los bordes de los objetos han sido detectados y que su representación ha sido obtenida, se hace necesario el uso de un método para la detección y valoración de los objetos (verificación). La finalidad de esta tesis no es precisamente llevar a cabo una valoración de todas las existentes, sino poner a prueba la funcionalidad de las redes neuronales

71

Page 83: TESIS - Tecnológico Nacional de México campus CENIDET

.. .

Capitulo 6 CONCLUSIONES Y TRABAJOS FUTUROS

para la identificación de objetos en escena, cuando SabemOS'qUe estos, Por cualquiera de las propuestas en el capitulo 3, sección 3.2, pueda Presentar ruido. Las redes

neuronales son una técnica de clasificación de posible implementación en hardware, 10 que facilita el disefio del SIVA en un dispositivo que permita integrar los métodos principales que constituyen el sistema: el TDI y el RP.

En general, las tknicas utilizadas en cada una de las fases fueron diseñadas para que el SIVA tenga la capacidad de vcrificar cualquier tipo de recipiente no opaco, ya sea con contenido de liquido O sin el liquido.

El sistema responde con un buen reconocimiento a las muestras presentadas, y en cuanto al tiempo de ejecución, el sistema puede verificar hasta dos recipientes por segundo, lo que se puede mejorar en procesadores con velocidades amba de los 166 Mhz. El SIVA no detecta problemas en la colocación de la tapa, por ejemplo, si ésta se encuentra colocada en la botella, pero tiene problemas tales como:

Una colocación incorrecta, o La máquina encargada de realizar el proceso de tapado ejerció demasiada presión en el cuello de la botella que produjo una fractura en la misma.

El SIVA presupone un subsistema dedicado a adquirir imágenes de botellas desde la linea de producción.

En este trabajo se llevaron a cabo experimentos con diferentes posiciones simuladas de la cámara frente a la línea de producción. Los primeros dos experimentos llevados a cabo muestran un acercamiento al objeto, en tanto que los dos últimos experimentos muestran al objeto más alejado de ésta, lo que ofrece una idea de las posibles imágenes que el sistema puede reconocer.

Podemos decir que el sistema trabaja, en forma general, en dos etapas: La primera, denominada entrenamiento, en la cual se presentan muestras al sistema para llevar a cabo la fase de entrenamiento de la red neuronal artificial. Esta etapa implica una observación previa por parte del usuario para determinar los recipientes que mejor caractericen los caws que pudieran presentarse en una verificación real en la industria. La segunda, denominada explotación o producción que lleva a cabo la verificación de los recipientes desde una base de imágenes, donde puede o no incluir a los recipientes que fueron mostrados en el entrenamiento del sistema.

Las cantidades de muestras presentadas varían de acuerdo a los casos que se presenten; es decir, si para el caso del nivel se hacen necesarias más muestras de entrenamiento para la red neuronal, esta cantidad puede variar; para el caso de las tapas las cantidades de las muestras de entrenamiento pueden ser menores. Estas cantidades pueden variar debido a que cada entrenamiento se ejecuta en forma separada. Los procesos de entrenamiento son independientes,

Finalmente. podemos concluir que la construcción del sistema de inspección v ~ u a l automatizado además de ser útil para cualquier tipo de recipiente, no solamente del tipo Coca Cola y Fanta, permite el esbozo de una metodología para la verificación de recipientes no opacos.

72

Page 84: TESIS - Tecnológico Nacional de México campus CENIDET

Capitulo 6 CONCLUSIONES Y TRABAJOS FUTUROS

6.2 TRABAJOS FUTUROS El desarrollo completo de un sistema de inspección visual, propuesto en el capitulo 2, sección 2.5, contempla vanas fases. En general, el SIVA incluye únicamente una parte de este, por lo se plantean algunos trabajos futuros que se pueden derivar a partir de este proyecto de tesis. Como síntesis los trabajos que se propone desarrollar son:

1. La realización de un proceso formal para la selección de los descriptores de Fourier que

2. La programación para un procesador digital de las señales de cada una de las partes de la

3. El diseño de un dispositivo que permita la sincronía entre la cámara, y la computadora o

4. Implementación en hardware de las redes neuronales que el sistema utiliza. 5 . El diseño e implementación de un sistema que integre el hardware del algoritmo de la

6. Un sistema de sofmare al cual se definan los resultados correctos para todo el conjunto de

identifican a cada una de las partes del recipiente.

botella.

dispositivo de verificación.

transformada rápida de Fourier y el hardware de las redes neuronales.

entrenamiento y lleve a cabo la supervisión del mismo (entrenamiento).

73

Page 85: TESIS - Tecnológico Nacional de México campus CENIDET

SISTEMA DE INSPECCI~N VISUAL Apéndice A

APÉNDXE A SISTEMA DE INSPECCI~N VISUAL

INTRODUCCI~N El desarrollo de esta tesis plantea el desarrollo de un SIVA para la verificación de la forma, el nivel de líquido y el tapado de recipientes no opacos. El desarrollo de este apéndice describe su funcionamiento, la estructura general de los archivos y el conjunto de subsistemas que los constituyen y que permiten llevar a cabo la verificación.

A continuación se describe la estructura general de archivos y el funcionamiento general del sistema mediante diagramas de bloques.

ESTRUCTURA GENERAL DE LOS ARCHIVOS DEL SIVA La primera base de archivos necesaria para el funcionamiento del sistema es BASE-IMSDAT. Esta base de datos incluye los nombres de las bases de imágenes con los nombres de los archivos de imágenes. En este caso, como lo muestra la figura 7.1.1, los archivos hi fantadat contienen un conjunto de nombres de archivos de imágenes del refresco Fanta; hi-cocas.dar contiene un conjunto de nombres de archivos de imágenes del refresco Coca Cola, y así sucesivamente. Todas las bases de imágenes existentes debe& estar dadas de alta en el archivo BASE-1MS.DAT.

74

Page 86: TESIS - Tecnológico Nacional de México campus CENIDET

I

BASE-IMS.DA7

Figuro 7.1.1 Estructura de la base de datos de imágenes BASE-IMS.DAT,

Una segunda base de archivos, la base de ventanas buse-vfs.duf, tiene también la función de verificar la existencia lógica de los archivos de ventanas, que el usuario define sobre el tipo de recipiente a verificar, y que se aplican a cada objeto en la imagen. Para el ejemplo de la figura 7. I .2, el archivo Y funfa.duf contiene los parámetros aplicables a los recipientes contenidos en la base de imágenes bi funfu.daf, y de igual forma el archivo v-cocas.daf. puede contener los parámetros, aplicables a los recipientes contenidos en la base de imágenes bi-cocus.dui. Esta segunda base de archivos, buse-vts.duf, y cada uno de los archivos que contienen los parámetros, se crean una vez que se ejecuta el programa para la creación de las ventanas. Cabe mencionar que la base se crea solamente un vez; en subsecuentes ocasiones únicamente los archivos se dan de alta dentro de ella.

v-fanla.da1 v-cocas.da1

i

bi-Cocas.da1 bi-tanlas.da1

base-vts.dat

Figura 7.1.2 Estructura de la base de archivos de parámetros base-vfs.dai para las ventanas aplicables a cada tipo de objeto.

Una vez que se han construido las ventanas aplicables a cada tipo de objeto, el siguiente paso es obtener un conjunto de datos de las muestras seleccionadas que caracterizan a un conjunto de imágenes que en el caso del sistema de inspección visual son los objetos que caracterizan a una línea de producción, para llevar a cabo el entrenamiento de la red neuronal. Las muestras se seleccionan para cada parte de la imagen, es decir, deben existir muestras para la forma, el nivel y la tapa, por lo que se construyen 3 archivos de entrenamiento para tipo de envase.

La base BASE AE.DAT tiene la función de verificar la existencia lógica de los ar$hivos de entrenamiento, k l e s para cada una de las redes neuronales. Para el caso del ejemplo de la figura 7.1.3 se muestran los archivos ae formJdaf, ae-niveJdat y, ue-tapaJdar, que corresponden a los

I

15

Page 87: TESIS - Tecnológico Nacional de México campus CENIDET

SISTEMA DE INSPECCIÓN VISUAL Apéndice A

archivos de entrenamiento. Al igual que la base de ventanas, la base de archivos base-ae.dat se de fama automhtica'cuando se constniye por primera vez. Cada uno de 10s a ~ h i v o s es dado

de alta de la misma forma en esta base.

base-ae.dat

Figura 7.1.3 Estructura de la base de archivos para el entrenamiento necesarios para la red neuronal Una vez que la red neuronal ha sido entrenada, los pesos de la misma son almacenados para su posterior utilización en el reconocimiento de los objetos. La base de archivos BASE-E.DAT lleva un control lógico de los archivos de entrenamiento que han sido creados. Esta base se accesa una vez que se procede al reconocimiento de los objetos y su construcción es llevada a cabo de forma automática cuando los archivos de entrenamiento son dados de alta por primera vez. En el ejemplo que se muestra en la figura 7.1.4, el bloque de tres archivos e formJdat, e-niveJdat y e-tapaJdai conesponden al entrenamiento de una forma de envase especifico (al envase de Fanta).

76

Page 88: TESIS - Tecnológico Nacional de México campus CENIDET

11 SISTEMA DE INSPECCI~N VISUAL I

/I Apéndice A

'!

base-e.dat e-nivec dai

e-tapac.da1

Figura 7.1.4 Estructura de la base de archivos obtenidos después del entrenamiento de la red neuronal.

FUNCIONAMIENTO GENERAL DEL SISTEMA A continuación se explica el funcionamiento general del Sistema de Inspección Visual Automatizado en donde, cada diagrama de flujo representa el funcionamiento de cada módulo del sistema. El SIVA se compone de cinco módulos principales, cada uno de ellos con una función específica. El primer módulo permite la visualización de las imágenes en pantalla contenidas en una 1

/1

I

I ~

base de imágenes; un segundo módulo permite la creación de las ventanas (parámetros) aplicables a cada uno de los diferentes tipos de envase; el tercer módulo lleva a cabo la constmcción de los 'I archivos de entrenamiento que senin utilizados por cada una de las redes neuronales. El entrenamiento de tales redes es llevado a cabo por el cuarto módulo, el cual genera como salida tres archivos que representan los pesos de las redes; el quinto y último módulo permite la verificación en serie de los objetos contenidos en las imágenes de una base de imágenes dada como entrada.

La figura 7.1.5 muestra el primer módulo del sistema, el cual permite el desplegado de cada una de las imágenes contenidas en la base de imágenes que se da como entrada al mismo. 'El funcionamiento de este módulo es el siguiente: se hace una verificación lógica en el archivo base-im.dat, la cual puede generar como resultado:

Que la base de imágenes que se desee accesar no exista; en este caso se envía un mensaje indicando lo anterior o bien,

para poder accesarlo. De igual forma este archivo fisico puede o no existir; en caso de existir se procede a desplegar en pantalla cada una de las imágenes de la base dada como entrada.

,i II

,j ll

i Que sí exista la base referenciada, por lo que se hace una verificación fisica de tal archivo ,I

j ( ,

I1 I/

I!

Page 89: TESIS - Tecnológico Nacional de México campus CENIDET

SISTEMA DE INsPECCIÓN VISUAL Apéndice A

. ~-5- <- Q l - i I I I X . d a ~

.t !i

Figura 7.1.5 Diagrama del sistema para el desplegado de las imágenes de una base de imágenes dada como entrada.

El funcionamiento del módulo del sistema que permite la creación de las ventanas (parametros) aplicables a cada tipo de envase, se presenta en la figura 7.1.6. Este módulo realiza un acceso a la base base-imsdat para la verificación de la existencia lógica del archivo que contiene los nombres de las imágenes. Los dos posibles casos después de esta verificación son:

Que no exista tal base de imágenes, en cuyo caso se envía un mensaje indicando lo anterior O, Que la base de imágenes referenciada esté dada de alta. Si esto sucede se procede a la verificación fisica del archivo.

Una vez que se verific6 la existencia del archivo físicamente, se despliega la primera imagen de éste, para proceder a dibujar cada una de las ventanas de la forma, el nivel y la tapa. En caso de existir un error por parte del usuario al construir los parámetros, el sistema ofrece la posibilidad de volver a dibujar las ventanas, preguntando si éstas fueron construidas correctamente o no.

/ base-ims (. bi -xxxx ' \ 1 .dat 1.

P R O Y I O

Figura 7.1.6 Diagrama en bloques del sistema para la construcción de las ventanas aplicables a cada tipo de envase.

78

Page 90: TESIS - Tecnológico Nacional de México campus CENIDET

Apéndice A SISTEMA DE TNSPECCI~N VISUAL

La salida generada por este módulo, una vez que se han creado las ventanas, se presenta en la imagen 7. I . 1. Esta salida muestra también los parámetros impresos que corresponden a cada una de las ventanas. La pregunta impresa al final de la imagen ¿Es correcta la segmentación [sin]? permite al usuario salvar los parámetros (en caso de responder afirmativamente la pregunta) o volver a construir las ventanas (en caso de no ser correctas).

Imugen 7.1.1 Salida producida por el módulo de creación de ventanas. Una vez que se han definido las ventanas (parámetros), se lleva a cabo la construcción de los archivos que contendrán las datos necesarios para el entrenamiento de la red neuronal. La creación de estos archivos se lleva a cabo por el módulo que aparece en la figura 7.1.7. Este módulo realiza la verificación lógica del archivo que contiene los parámetros en la base base vts.dut y la verificación de la existencia lógica de la base de imágenes buse-ims.dut.. Si ambos nombres existen lógicamente, se procede a realizar la verificación física de los mismos, la cual al ser correcta se procede a solicitar los nombres de los archivos con que se identificará cada muestra de entrenamiento.

Las salidas que se obtienen de este subsistema consisten de tres archivos físicos que son dados de alta automáticamente en la base de archivos de entrenamiento. Cada archivo fisico contiene 16 descriptores de cada envase y tres datos más que identifican las neuronas de salida de la red.

LOS nombres ueJXxn, ue-nxur y ue-txxx en la figura 7.1.7 pueden representar nombres que identifican a los archivos de salida.

-

'I

i:

li

79

Page 91: TESIS - Tecnológico Nacional de México campus CENIDET

ae-fxxx

ae-txxx

entrenamiento y los archivos que se generan una vez entrenada la red neuronal.

La salida que se obtiene después de haber ejecutado el sistema son la creación de tres archivos que

li

80

!

Page 92: TESIS - Tecnológico Nacional de México campus CENIDET

SISTEMA DE INSPECCI~N VISUAL Apéndice A

C T ( (%( I 1 -

base-ae

.L & & J (-q<-q-pq==J bare-e.dal

Figura 7.1.8 Diagrama del subsistema para el entrenamiento de la red neuronal.

El último subsistema del SIVA es el que permite llevar a cabo la verificación de los recipientes. El funcionamiento de este subsistema es el siguiente:

Se realiza un acceso al archivo base-ims.daf para la verificación de la existencia lógica de la base de imágenes, la cual también se verifica fisicamente. El nombre de la base de imágenes es proporcionado por el usuario, es decir, el usuario es quien decide qué tipo de envase se va a verificar y cual es la base que contiene las imágenes para ese tipo de envase. La no existencia fisica o lógica de la base de imágenes se indica al usuario inmediatamente. Se accesa al archivo base-vfs.dat para la verificación de la existencia lógica y fisica de la base de ventanas (parámetros aplicables a cada recipiente a verificar). La no existencia de este archivo indica que el archivo no ha sido creado aún, por lo que se hace necesario la ejecución del segundo subsistema para la creación de éstas. Se accesa al archivo base-e.dat para verificar la existencia de los archivos de entrenamiento de las redes neuronales creados con el subsistema anterior. Cabe destacar aquí el cuidado que se debe tener al proporcionar los nombres de los archivos de entrenamiento, debido a que los nombres que se indiquen serán los que el sistema abrirá para realizar la verificación. Cada archivo debe corresponder correctamente a cada parte del envase que se verifica. Finalmente, se solicita al usuario el nombre de los objetos a reconocer. Este nombre regulamente se adapta al tipo de envase que el sistema verifica (Coca Cola, Fania, etcétera). El nombre aceptado como entrada es el que se desplegará en la verificación en caso de que ésta haya sido exitosa.

La estructura de este subsistema se muestra en la figura 7.1.9. Como se observa, el bloque final o salida del sistema es básicamente un resultado de verificación de aceptacibn o rechazo. La imagen 7.1.2 muestra el resultado obtenido después de la ejecucion de este subsistema. Los resultados que se obtienen son:

I

81

Page 93: TESIS - Tecnológico Nacional de México campus CENIDET

Apéndice A SISTEMA DE INSPECCION VISUAL

El número de imagen de la base de imagenes que se verificó. El Sistema lleva una contabilización del número de imágenes verificadas. Verificación de la forma del envase. En caso de ser reconocido el objeto que la imagen presenta, el sistema envía como salida el nombre del objeto a reconocer que fue proporcionado por el usuario indicando un reconocimiento exitoso. En caso contrario, se envía un mensaje de que el objeto nofue reconocido. Verificación sobre el nivel de líquido: correcto o incorrecto. Correcto si éste se encuentra dentro de los límites establecidos por el usuario, es decir, el nivel de líquido del envase se localiza en una posición'correcta, es decir, que el nivel no está por debajo ni por arriba de los límites que se establecieron como correctos. Verificación sobre la tapa del envase, la cual puede estar: bien colocada (el envase tiene la tapa colocada correctamente) en cuyo caso el sistema envía el mensaje de lupa bien colocada. Se despliega un mensaje de mal colocada si el envase no tiene la tapa colocada, es decir, carece de tapa o, si se detectó un tipo de tapa diferente a la que corresponde a esa clase de envase.

En cualquiera de las tres verificaciones, al detectarse un problema el sistema envía una señal acústica indicando éste, lo que simula una alarma en un sistema de inspección industrial.

Después de cualquier verificación el proceso se puede detener o continuar. La tecla ESC permite salir del proceso de verificación, en tanto que la de Enfer permite continuarlo.

Figura 7.1.9 Diagrama del subsistema que permite llevar a cabo la verificación de los recipientes de una base de imágenes en serie.

82

Page 94: TESIS - Tecnológico Nacional de México campus CENIDET

SISTEMA DE INSPECCI~N VISUAL Apéndice A

Imagen 7.1.2. Salida producida por el módulo que lleva a cabo la verificación de los recipientes de una base imágenes.

Una vez que el sistema ha terminado de llevar a cabo la verificación para una base de imágenes, se realiza el desplegado de una tabla en la que se pueden visualizar las estadísticas de la verificación para cada parte del envase, como se muestra en la figura 7.1.1 O.

~

Correctos

Incorrectos

Figura 7.1.10 Ejemplo de la estadística de laverificación llevada a cabo sobre una base de imágenes.

CARACTER~TICAS DEL SISTEMA DE INSPECCI~N VISUAL AUTOMATIZADO El Sistema de Inspección Visual Automatizado se ejecuta bajo una plataforma del sistema operativo MS-DOS. Los requerimientos de ejecución son en gran parte mínimos, pues es posible ejecutarlo con un microprocesador 386, 486 o cualquier otro subsecuente. La memoria RAM de la computadora puede ser de 4 o más megabytes.

En general, la respuesta durante el proceso de verificación depende en gran parte de la velocidad del procesador.

Es importante destacar que el sistema trabaja bajo una base de'datos física de imágenes, pero la idea fundamental es tener un sistema que permita enviar imágenes de recipientes a la computadora, la cual mediante el sistema de inspección propuesto pueda llevar a cabo la verificación de los mismos.

! . i

'I

b

83

Page 95: TESIS - Tecnológico Nacional de México campus CENIDET

Apéndice B TERMINOLOGiA DE REDES NEURONALES

APÉNDICE B TERMINOLOGíA DE REDES NEURONALES

En esta sección se definen algunos de los términos relacionados con las redes neuronales artificiales (RNA). Para establecer estas definiciones se hace uso de un eíernenfo de procesamiento (EP) también llamado neurona artificial, nodo o unidad; una RNA se puede constituir de un EP berceptrón) o de un conjunto de EPs (redes muíticapas).

La figura 7.2.1 muestra un modelo del elemento de procesamiento que se identifica como el i-ésimo EP. Un EP tiene muchas entradas (procedentes de otros EP) pero una sola salida, la cual se puede aplicar a otros EP de una red [Freeman, 19931. La entrada que recibe el i-ésimo EP procedente del j-ésirno elemento se indica en la forma Xj. Cada conexión con el i-ésimo EP tiene asociada una magnitud llamada peso. El peso de la conexión procedente del j-ésimo nodo y que llega al i-ésimo nodo se identifica por W,j.

Una conexión de entrada puede ser excitatoria o inhibitoria. Las conexiones excifatorias tienen pesos positivos y las conexiones inhibitonas tienen pesos negativos.

Cada EP determina un valor de entrada neto basándose en todas las conexiones de entrada. Este valor de entrada se calcula sumando los valores de entrada multiplicados por sus pesos correspondientes.

84

I!

Page 96: TESIS - Tecnológico Nacional de México campus CENIDET

ApCndice B TERhUNOLOGh DE REDES NEURONALES

t Salida

X I Xn

'j Entradas

Figura 7.2.1 Estructura de un elemento de procesamiento (EP). Las conexiones de entrada se representan como flechas procedentes de otros elementos de procesamiento. Cada conexión de entrada tiene asociada una cantidad Wij que se denomina peso. Existe un único valor de salida

que se puede aplicar a otras'unidadcs.

La entrada neta de la i-ésima unidad se puede escribir en la forma:

neta, = x j ~ , j

donde el índice j recorre todas las conexiones que posea el EP. Una vez que la entrada neta se calcula, se transforma en el valor de activación o simplemente activación para ese elemento de procesamiento. En este ejemplo, el elemento de procesamiento se identifica como el i-ésimo. La ecuación para definir el término de activación esta dada como:

ai(t)=Fi(ui(t- I ),netai(t)) El término ai(t-1) indica que la activación de la neurona i-ésima puede depender del valor anterior de la activación. En ocasiones la activación y la entrada neta son idénticas y los términos suelen emplearse de manera intercambiable.

El valor de salida se calcula mediante la siguiente ecuación:

xi=h(netai,

La razón por la cual se hace diferencia entre el término de activación y la entrada de la neurona, es debido a que el término función de activación se utiliza para referenciar a la función 1;: que transforma el valor de la entrada netai en el valor de salida del nodo xi . En el proceso de descripción del paradigma de aplicación (sección 4.4), se utiliza el término valor de salida del nodo.

BIBLIOGRAFíA [Freeman, 19931 James A. Freeman y David M. Skapura, Redes Neuronales. Algoritmos. aplicaciones y técnicas depr3gramacibn. E. U.A Addison- Wesley Iberoamericana.

!

85

Page 97: TESIS - Tecnológico Nacional de México campus CENIDET

Apéndice C TERMINOLOGiA DEL SIVA ir

APÉNDICE c TERMINOLOGÍA DEL SISTEMA DE INSPECCIÓN

VISUAL AUTOMATIZADA (SIVA) IMAGEN. Es una función bidimensional de intensidad de luz f(x.y), donde x e y representan las coordenadas espaciales y donde el valor de f en un punto cualquiera (x,y) es proporcional ai brillo (nivel de gris o color) de la imagen en ese punto.

IMAGEN DIGITAL. Es una imagen que se ha discretizado tanto en las coordenadas espaciales como en el brillo. Una imagen digital, puede considerarse como una matriz cuyos índices de fila y columna identifican un punto de la imagen, y el valor del correspondiente elemento de la matriz indica el nivel de gris o color en ese punto.

PIXELES O PELS (del inglés Picture Element). Son los elementos de una distribución digital, es decir, cada punto de la imagen. Se caracterizan por su posición (x . y) y su nivel de gris. Una imagen se indica por la funci6nf(x. y), y un pixel se referencia comop o q.

VECINOS DE UN PiXEL (x, y). Un pixel p de coordenadas (x. y) tiene cuatro vecinos: dos horizontales y dos verticales, cuyas coordenadas vienen dadas por:'

fx+I.y).fx-I.y). ~x.y+I).(x,y-I) donde el conjunto de pixeles se denomina los 4-vecinos de p y se representa por N&). Cada pixel está a una unidad de distancia de (x,y). Algunos de los vecinos d e p caen fuera de la imagen digital cuando (x, y) está en el borde de la imagen.

Los cuatro vecinos en diagonal del píxelp tienen las coordenadas:

~x+I,y+I~.(x+I,y-I).(x-I.y+I),(x-I.y-I)

y se representan por No@). Estos puntos junto a los 4-vecinos, se denominan los 8-vecinos de p y se representan por N&).

86

Page 98: TESIS - Tecnológico Nacional de México campus CENIDET

TERh4lNOLOGh DEL SIVA Apéndice C

4-CONECTNIDAD, 8-CONECTIVIDAD, M-CONECTIVIDAD. La conectividad establece los límites de los objetos y los componentes de área en una imagen. Para determinar si dos pixeles están conectados, debe determinarse si son adyacentes en'algíin sentido (como ser 4-vecinos) y si sus niveles de gris cumplen un criterio especificado de similaridad.

Sea Vel conjunto de valores de niveles de gris empleados para definir la conectividad; por ejemplo si V=l define la conectividad entre pixeles con valor I , entonces se consideran 3 tipos de conectividad

4-conecfividad. Dos pixelesp y q con valores dentro de V están 4-conectados si q pertenece

8-Conecfividad. Dos pixelesp y q con valores dentro de Vestán 8-conectados si q pertenece a N8@). M-conecfividad. (Conectividad mixta). Dos pixeles p y q con valores dentro de V están m- conectados i) si q peeenme a N4@), o bien i¡) si q pertenece a ND@) y además el conjunto N4@) n N4(q) es vacío. Es el conjunto de pixeles que son 4-vecinos de p y de q cuyos valores están en V.

DISCONTINUIDADES EN UNA IMAGEN. Las discontinuidades de una imagen son los cambios bruscos en los niveles de gris. Los tres tipos de discontinuidades de una imagen digital son: puntos, líneas y bordes.

PUNTOS EN UNA IMAGEN. Un punto se presenta cuando el nivel de gris en esa coordenada de la imagen es bastante diferente del de sus vecinos.

BORDES EN UNA IMAGEN. Un borde es la frontera entre dos regiones con propiedades de nivel de gris relativamente distintas.

LÍNEAS EN UNA IMAGEN. Una línea en una imagen es un conjunto de pixeles continuos orientados a) horizontalmente b) a +450, c) verticalmente o d) a -450. Las máscaras de la figura 7.3.1 se utilizan para su detección.

a N4W.

- I - 1 - 1 1 -

-1 I -1 I 2

a b C d . Figura 7.3.1 Máscaras que muestran los diferentes tipos de lineas en una imagen.

REGIÓN. Agrupación de pixeles con el mismo o muy semejante nivel de gris.

LA LONGITUD DE UN CONTORNO. La longitud de un contorno en una imagen es el número de pixeles a lo largo del contorno que nos da una idea del tamaño del objeto. DESCRIPTORES DE REGIÓN CARACTER~STZCAS GEOMETRICAS:

ÁREA. Es el número de pixeles contenido dentro de su contorno, PERÍMETRO. Es el número de pixeles que conforma su contorno. Aunque área y perímetro se usan como descriptores, su aplicación principal es cuando el tamaño de los objetos es variable. DENSIDAD. La densidad de una región se define como @erímefro)2/área.

I

87

Page 99: TESIS - Tecnológico Nacional de México campus CENIDET

Apéndice C TERMINOLOGiA DEL SlVA

OPERADOR LINEAL INVARIANTE DE POSICIÓN. Es aquel cuyo resultado depende sólo del valor de f(x,y) en un punto de la imagen y no de la posición del punto.

HISTOGRAMA. El histograma de una imagen digital con niveles de gris en el rango [O, L-11, es una función discreta:

P(rk)=ndn Donde:

rk es el k-ésimo nivel de gris,

nk es el número de pixeles de la imagen con ese nivel de gris,

n es el número total de pixeles de la imagen, y

k-0,1,2, ..., L-I. Se puede decir quep(rp da una idea del valor de la probabilidad de que aparezca el nivel de gris rk. La representación gráfica de esta función para todos los valores de k proporcionan una descripción global de la apariencia de la imagen. La figura 7.3.2 muestra el histograma básico de una imagen en el cual los niveles de gris se concentran hacia el extremo oscuro del rango de la escala de gris.

P(rki T

Figura 7.3.2 Histograrna básico de una imagenen el cual, los niveles de gris se concentran hacia el extremo oscuro del rango de la escala de gris.

BIBLIOGRAF~A [González, 19961 Rafael C. González y Richard E. Woods Tratamiento digital de imdgenes, E. UA. Addison-Wesley Iberoamericana.

[Myler, 19931 Harley R. Myler y Arthur R. Weeks The pocket Handbook of imaging Processing Algorithms in C, U.S.A. PTR Prentice Hall.

[Parker, 19951 J. R. Parker Practical Computer Vision Using C. US.A John Wiley & Sons, Inc.