Propuesta Proyecto de Grado Ing 2007.

UNIVERSIDAD DISTRITAL“Francisco José de Caldas”

Facultad Tecnológica

Propuesta de Proyecto de Grado deIngeniería en Control e Instrumentación Electrónica.

TITULO PROPUESTARECONOCIMIENTO DEL LENGUAJE DE GESTOS MANUALES ALFABÉTICOS

MEDIANTE VISIÓN ARTIFICIAL

AUTOROSCAR JAVIER CORTÉS BAGUI COD: 20032083007

DIRECTORFRANK NIXON GIRALDO

REFERENCIA AL CONSEJOEste proyecto busca realizar el reconocimiento del lenguaje de señas empleado por personas con incapacidad para hablar o escuchar. Este lenguaje se desarrolla mediante gesturas hechas a través de las manos, con las cuales se puede simbolizar el alfabeto completo realizando símbolos estándar de comunicación no audible.Mediante la incorporación de la electrónica, se busca implementar un sistema en la capacidad de reconocer el símbolo que esta representando la mano, para ser identificado como una letra del alfabeto ante el usuario. De esta manera se pretende realizar un sistema de comunicación entre personas que se comunican a través de gesturas que describan el alfabeto con personas que se comunican de modo oral.

I. DATOS DE ENLACEPagina WEB:

E-mail: [email protected] [email protected]

Versión del Documento: 1.0 Código Documento: _________________________________________________________________________________________________________________________Espacio Exclusivo Consejo Curricular

APROBADO MODIFICAR RECHAZADO

mailto:[email protected]


HOJA DE ACEPTACIÓN

Observaciones

_________________________________________________________

_________________________________________________________

_________________________________________________________

_________________________________________________________

_________________________________________________________

_________________________________________________________

_________________________________________________________

_________________________________________________________

_______________________________ Representante Consejo Curricular

_______________________________ Director del Proyecto

_______________________________ Revisor del Proyecto

Fecha de Presentación

1.0. INFORMACIÓN GENERAL DEL PROYECTO

Título: RECONOCIMIENTO DEL LENGUAJE DE GESTOS MANUALES MEDIANTE VISIÓN ARTIFICIALEstudiantes Proponentes:Oscar Javier Cortés Bagui Código: 20032083007Total de Estudiantes (número): 1Nombre del Grupo de Investigación:Línea de Investigación:Representante Legal: Cédula de ciudadanía #:Entidad:

Tipo de Entidad:

Universidad Pública: X Universidad Privada: Instituto de Investigación Público:Centro de Investigación Privado: Organizaciones Gubernamentales: ONG:Empresa, Centro Empresarial o Gremio de la Producción:Dirección:Teléfono: Fax:Correo Electrónico:Sede de la Entidad: Nit: Ciudad: Departamento:

Tipo de contribuyente:Entidad de derecho público Entidad de economía mixta Entidad industrial y comercial del estado

Lugar de Ejecución del Proyecto: Ciudad: Bogotá Departamento: CundinamarcaDuración del Proyecto (meses): 8 (ocho)Tipo de Proyecto: Aplicación de redes neuronales para visión artificial

Investigación Básica: Investigación Aplicada: X Desarrollo Tecnológico o Experimental:Valor total del Proyecto: $ 2’630.000Descriptores / Palabras claves: Visión artificial, procesamiento de imágenes, reconocimiento de imágenes, redes neuronales, entrenamiento, algoritmos, JAVA, WebCam, gesturas.

Observaciones

2.0 RESUMEN EJECUTIVO

La comunicación entre personas se realiza predominantemente, por medio de la expresión oral, y consiste en la transmisión y recepción alternativa de mensajes. En su función esencial, esta comunicación es acústica, por esta razón, cuando no es posible utilizar el canal auditivo para establecer la comunicación, se buscan sistemas alternativos, como son: la labio lectura, la lengua de signos u otros. El deterioro del canal auditivo no es, por tanto, un impedimento para la comunicación, gracias a que se puede utilizar el canal visual como elemento de sustitución para la recepción del mensaje oral, signado o escrito.

Cuando se entabla una comunicación a través de signos, es necesario que los interlocutores tengan un previo conocimiento de la simbología que se está tratando, de este modo los mensajes son entendidos por los participantes de la comunicación. Sin embargo cuando se pretende realizar una comunicación mediante símbolos entre personas que no posean conocimiento de la simbología, los mensajes no son captados, o por lo menos no de modo correcto. Está es la razón por la cual se propone elaborar un sistema que permita la comunicación a través de las manos (con gesturas) entre personas sordomudas y personas de habla oral, sin la necesidad de que estás últimas conozcan previamente los signos manuales del alfabeto.

El sistema propuesto, consiste en la incorporación de la electrónica a través de un computador personal y una WebCam para realizar la traducción de signos elaborados con la mano al lenguaje alfabético convencional. El objetivo, es diseñar una interfaz en la capacidad de realizar dicha traducción. Para conseguir esto, se propone implementar un software de alto desempeño, en la capacidad de correr bajo cualquier plataforma, esto con el fin de brindar al usuario versatilidad de uso, y no restringirlo a correr la aplicación bajo Windows por ser el sistema operativo más común. Como lenguaje de programación, se ha escogido JAVA por ser bastante robusto y estructurado comparado con lenguajes como C, Visual Basic, pascal, Delphi entre otros. JAVA, como lenguaje y como plataforma de diseño, ofrece como ventajas adicionales, la posibilidad de realizar aplicaciones de alto rendimiento, realizar una programación con un excelente estructuramiento, y además sus compiladores son gratuitos, de este modo la aplicación que se realice no tendrá problemas de licencia de ningún tipo y podrá correr en cualquier PC, siempre y cuando sea instalada la JVM (Maquina virtual de JAVA) previamente.

Para realizar la adquisición de las imágenes se empleara una WebCam USB, y para el reconocimiento de las mismas, se hará uso de las redes neuronales artificiales, por presentar alto desempeño frente a este tipo de aplicaciones y ser una de las herramientas más poderosas y versátiles en la actualidad.

El tiempo establecido para la elaboración de este proyecto es de 5 meses. La aplicación final será bastante económica para el usuario, pues tan solo necesita de un computador personal y cualquier WebCam USB. La traducción de símbolos será casi en tiempo real, es decir al momento de mostrar el símbolo frente a la cámara a través de la mano, el computador mostrará a que letra del alfabeto corresponde el mismo, con un retardo de tiempo muy pequeño, de este modo, se pueden entablar comunicaciones sencillas entre personas que no conocen la comunicación ni el significado de los símbolos alfabéticos, además es útil para las personas que se inician en la comunicación de este tipo.

http://www.monografias.com/trabajos/lacomunica/lacomunica.shtml

http://www.monografias.com/trabajos7/mafu/mafu.shtml

3.0 DESCRIPCIÓN DEL PROYECTO

3.1 Planteamiento del Problema3.1.1 Descripción del problema

Durante siglos las personas sordomudas han sido consideradas como disminuidas y privadas de las capacidades mentales que poseen las personas que hablan y oyen. Este prejuicio está tan arraigado que algunos idiomas designan con la misma palabra “tonto” y “mudo”. Esto debido a la gran brecha que se ha formado entre las personas sordomudas y el mundo de habla oral, pues las primeras son discriminadas al no poder comunicarse con el resto de las personas por la carencia de un sistema de comunicación conocido por ambos diferente al escrito, que permita entablar diálogos. La sordera es aislamiento: impide que otros se comuniquen mediante las palabras y los sonidos con quien la padece, y a su vez, también evita que el sordo interactúe con los demás de la misma manera.

Varias cosas se han hecho por parte de los sordomudos y sus familias para tratar de disminuir esta limitante. El lenguaje de señas es uno de ellos, tal vez el más importante. Cuando a los gestos y a los movimientos de las manos se les ha podido dar un significado, las personas que comparten ese lenguaje pueden entenderse y dialogar. Parecería una solución ideal.

Desafortunadamente, la mayor parte de las personas que no están afectadas por la sordera, o no tienen un familiar que la sufra, no están interesadas en aprender un lenguaje de este tipo. Así el número de interlocutores que puede encontrar un sordomudo que emplee el lenguaje de las señas es realmente reducido. Generalmente sólo otros amigos sordomudos y sus familiares. El aislamiento es menor, pero sigue siendo aislamiento.

Muchos sordos, usuarios de la lengua de signos, consideran que la información en lenguaje simbólico se percibe de forma más confortable, para ellos, que la información transmitida en lenguaje escrito. Para algunos usuarios de este lenguaje, la información en signos es el único medio que puede usarse para transmitir información de manera fiable.

La limitante de las personas sordomudas es bastante clara, pues no pueden expresar lo que quieren decir y ser entendidos sus mensajes por personas que no conozcan previamente el significado de los signos realizados, en otras palabras, no pueden ser escuchados por cualquier persona.3.1.2 Identificación de Problemas

PROBLEMA DESCRIPCIÓN

1. Carencia de un sistema de comunicación efectivo entre personas sordomudas y personas de habla oral.

La existencia de sistemas que permitan efectuar comunicación entre personas con incapacidad para hablar y el mundo secular es limitada, tan solo se cuenta con el lenguaje escrito, pero para algunas personas sordomudas es difícil la comunicación a través de este medio. Existen métodos como la labio lectura y el lenguaje de signos, sin embargo estos métodos son conocidos por muy pocas personas, lo que limita la interacción entre personas sordomudas y la sociedad.

2. Falta de interés por parte de las personas que

No existe interés por aprender el sistema de comunicación para sordomudos por la sociedad,

pueden escuchar y hablar, por aprender el sistema de comunicación para personas sordomudas.

produciendo discriminación hacia las personas con incapacidad para hablar y oír. Estos sistemas de comunicación tan solo son aprendidos por los familiares y amigos cercanos a las personas con la discapacidad.

3. Tiempo demasiado extenso para aprender el lenguaje de labio lectura o de signos.

Para el adiestramiento en el dominio de lenguajes como labio lectura y lenguaje de signos, se requiere de un tiempo aproximado entre dos y seis meses dependiendo de la edad del paciente y de la práctica ejercida.

4. Costos elevados en academias que prestan el servicio de capacitación en el lenguaje de signos y labio lectura.

Las entidades que presentan servicios de capacitaciones para el dominio de lenguajes para sordomudos son pocas, por lo general, las capacitaciones son dictan por las mismas instituciones médicas que atienden a los pacientes sordomudos, pero esto se hace enfocado hacia los familiares. De este modo, una persona que desee aprender el lenguaje de signos o labio lectura debe instruirse en academias particulares y asumir los costos de la capacitación.

5. Cuando el lenguaje de signos no es utilizado de modo rutinario se olvida al cabo del tiempo.

Si una persona no practica de modo continuo los lenguajes para sordomudos, esto se olvida y se pierde el tiempo invertido en capacitación. Es necesario entender que los lenguajes para sordomudos necesitan de una práctica continua para su dominio y perfeccionamiento al igual que ocurre cuando se desea aprender alguna lengua extranjera.

6. Brecha en la comunicación entre personas sordomudas y personas de habla oral. (Discriminación).

La personas con discapacidad para hablar y oír han sido discriminadas por la sociedad, a falta de un medio de comunicación efectivo que le permita expresarse con cualquier persona. La comunicación de las personas sordo mudas se ve restringida a unos cuantos que conocen su lenguaje.

7. Carencia de un sistema de entrenamiento y práctica para personas que se capaciten en el lenguaje de signos.

Como fue explicado anteriormente, si no se practica de modo rutinario el lenguaje aprendido, este al cabo del tiempo se olvida. Se hace necesario que exista un sistema de práctica para reforzar y perfeccionar el nuevo lenguaje aprendido.

3.1.3 Formulación del problema.

Carencia de un sistema de comunicación efectivo entre personas sordomudas y personas de habla oral.

Se hace evidente que la existencia de lenguajes para la comunicación de personas sordomudas, no es una herramienta suficiente para que estas se comuniquen con el resto de la sociedad. Es necesario buscar alternativas en sistemas que permitan realizar comunicaciones entre personas sordomudas y personas de habla oral que no conocen los lenguajes de signos o labio lectura.

Falta de interés por parte de las personas que pueden escuchar y hablar, por aprender el sistema de comunicación para personas sordomudas.

Para las personas que pueden hablar y escuchar, no es una prioridad aprender sistemas de comunicación para sordomudos, así como su lenguaje. Solo es de interés en el caso de tener algún familiar y/o amigo cercano con estas discapacidades.

Debido a esto existe un aislamiento hacia las personas sordomudas y son desconectados de la sociedad, al no poder emitir mensajes y hacerse entender de forma clara con cualquier persona.

Cuando el lenguaje de signos no es utilizado de modo rutinario se olvida al cabo del tiempo.

Si una persona adquiere adiestramiento en lenguajes de comunicación para sordomudos y no lo práctica de modo rutinario, este al cabo del tiempo se olvida, pues estas lenguas al igual que las extranjeras requieren de una práctica continua. Como consecuencia al entablar un dialogo con una persona sordomuda, los mensajes no son captados de modo correcto, causando frustración.

Ver anexos 1 y 1.1 (Análisis del problema y ubicación de problemas)

3.2 IMPACTO ESPERADO

3.2.1 Impacto Social

Con el desarrollo de este proyecto se pretende brindar una herramienta para que las personas con incapacidad para hablar y oír, puedan comunicarse con la sociedad mediante la incorporación de la electrónica.

Se espera atenuar la brecha de la comunicación existente para personas sordomudas, y brindarles una alternativa de comunicación útil, empleando un lenguaje ya conocido por ellos (lenguaje de signos). Para las personas que no conocen el lenguaje de signos y desean comunicarse con una persona sordomuda, se le brinda una alternativa para que lo pueda hacer sin la necesidad de un previo conocimiento ni capacitación sobre este lenguaje. Es decir, el sistema propuesto le permitirá interpretar los signos alfabéticos elaborados a través de la mano por la persona con incapacidad para hablar y le será traducido por escrito en su lengua habitual.

El impacto esperado en la sociedad, será la disminución en la discriminación hacia las personas sordomudas, y la vinculación de las mismas para interactuar con la sociedad.

3.2.2 Impacto Económico

A través del sistema propuesto se espera que personas en la necesidad o con el interés por aprender el lenguaje de signos puedan hacerlo de modo prácticamente gratuito, pues tan solo requerirán de un computador personal y una WebCam USB y la aplicación desarrollada. La principal justificación por implementar el sistema desde JAVA es para hacerlo asequible a los usuarios finales y evitar problemas por licencias costosas.

El impacto directo sobre la economía del usuario, radica en que el aprendizaje se hace de modo autodidacta, evitando inscripciones a capacitaciones para aprender el lenguaje de signos, que resultan costosas y requieren de un tiempo de aprendizaje extenso. Además, una de las ventajas del sistema de reconocimiento de signos a través del PC es que si se olvida el conocimiento adquirido debido a la falta de práctica al transcurrir del tiempo, la aplicación permitirá un continuo entrenamiento sin costos adicionales.

3.2.3 Impacto Tecnológico

La elaboración de este proyecto implica conocimientos e investigación en el campo de procesamiento de imágenes y reconocimiento de imágenes a través de visión artificial, una de las ramas con mayor explotación en la actualidad. Para realizar el reconocimiento de imágenes se hará uso de las redes neuronales artificiales, también conocida como una herramienta robusta de múltiples aplicaciones y de gran auge.

Con la elaboración del proyecto y la aplicación de las ramas mencionadas anteriormente se pretende generar una aplicación útil, versátil y eficiente que permita a los usuarios realizar comunicaciones entre personas de habla oral y personas sordomudas que se comuniquen a través del lenguaje de signos.

La finalidad además de lograr la comunicación entre personas discapacitadas del habla, es la introducción de herramientas que faciliten la elaboración de tareas complejas o de larga ejecución al hombre, mediante la incorporación de tecnología en el hogar.

3.3 Usuarios directos e indirectos potenciales de los resultados de la investigación.

El usuario directo del sistema de reconocimiento de gesturas alfabéticas, es principalmente el individuo en la necesidad de comunicarse con una persona sordomuda que no posea conocimientos previos del lenguaje de signos.

También el sistema esta dispuesto para las personas que no lo practican el lenguaje continuamente puedan realizar entrenamiento y perfeccionamiento sobre el mismo.

3.4 MARCOS DE REFERENCIA3.4.1 Marco teórico

LA COMUNICACIÓN PARA PERSONAS SORDOMUDAS

INTRODUCCIÓN

La comunicación es un acto o proceso de paso de información a través de mensajes, significativos entre fuentes y destinatarios en interacción, que partiendo de un código y contextos comunes y usando estrategias adecuadas alcanza el efecto de hacerlos partícipes de sus respectivas intenciones y/o estado, la comunicación entre personas se realiza, predominantemente, por medio de la lengua oral, y consiste en la transmisión y recepción alternativa de mensajes, por medio de dicha lengua.

En su función esencial, esta comunicación es acústica. Por esta razón, cuando no es posible utilizar el canal auditivo para establecer la comunicación, se buscan sistemas alternativos, como son: la labio lectura, la lengua de signos u otros. El deterioro del canal auditivo no es, por tanto, un impedimento para la comunicación, gracias a que se puede utilizar el canal visual como elemento de sustitución para la recepción del mensaje oral, signado o escrito.

El lenguaje es la capacidad del ser humano para comunicarse mediante un sistema de signos o lengua para ello. No se debe confundir con lengua o idioma, que es la representación de dicha capacidad. La comunicación humana es de manera principal mediante el lenguaje oral o escrito, pero no exclusivamente, ya que para las personas incapacitadas en muchas ocasiones no puedes ser utilizar estos medios para informar sus necesidades. De esta manera establecen la comunicación por otros medios tales como visuales (señales de la circulación, lenguaje de sordomudos o de banderas, fotografías, dibujos, gestos, etc.) y táctiles (presiones con la mano o con el pie, lectura de los ciegos mediante el sistema Braille, etc.).

El lenguaje utilizado por los sordomudos y por los ciegos es un lenguaje icónico, denominado lenguaje signado, en él se engloban muchas formas de comunicación no verbal, es decir movimientos corporales con valor significativo. Los gestos son otras variantes del código no lingüístico son el código no lingüístico gestual y el código no lingüístico auditivo y dactil.

ALFABETO DACTILOLÓGICO INTERNACIONAL

La Federación Mundial de Sordos ha fijado un alfabeto dactilológico internacional. El diagrama muestra los movimientos de las manos que representan cada letra del alfabeto. Este lenguaje por signos es reconocido con facilidad por una persona sorda, en especial cuando se acompaña de gestos que significan palabras o ideas específicas, lo que le permite entablar una conversación con otras personas.

El alfabeto actual con pocas variaciones fue introducido por el Español Juan Pablo Bonet en 1620 para utilizarlo en la educación de una persona sorda. Permite la trascripción literal letra a letra del mensaje con las mismas estructuras lingüísticas del código fonético-auditivo.

http://www.monografias.com/trabajos15/todorov/todorov.shtml#INTRO

http://www.monografias.com/Educacion/index.shtml

http://www.monografias.com/trabajos11/tebas/tebas.shtml

http://www.monografias.com/trabajos14/flujograma/flujograma.shtml

http://www.monografias.com/trabajos14/nuevmicro/nuevmicro.shtml

http://www.monografias.com/trabajos14/watzlawick/watzlawick.shtml

http://www.monografias.com/trabajos11/teosis/teosis.shtml

http://www.monografias.com/trabajos14/textos-escrit/textos-escrit.shtml

http://www.monografias.com/trabajos13/histarte/histarte.shtml#ORIGEN

http://www.monografias.com/trabajos14/medios-comunicacion/medios-comunicacion.shtml

http://es.wikipedia.org/wiki/Idioma/oIdioma

http://es.wikipedia.org/wiki/Lengua/oLengua

http://es.wikipedia.org/wiki/Lengua/oLengua

http://es.wikipedia.org/w/index.php?title=Sistema_de_signos&action=edit/oSistema%20de%20signos

http://www.monografias.com/trabajos16/desarrollo-del-lenguaje/desarrollo-del-lenguaje.shtml

http://www.monografias.com/trabajos/lacomunica/lacomunica.shtml

http://www.monografias.com/trabajos7/mafu/mafu.shtml

http://www.monografias.com/trabajos16/desarrollo-del-lenguaje/desarrollo-del-lenguaje.shtml

http://www.monografias.com/trabajos12/elorigest/elorigest.shtml

http://www.monografias.com/trabajos11/henrym/henrym.shtml

http://www.monografias.com/trabajos12/eticaplic/eticaplic.shtml

http://www.monografias.com/trabajos10/formulac/formulac.shtml#FUNC

http://www.monografias.com/trabajos7/sisinf/sisinf.shtml

http://www.monografias.com/trabajos14/administ-procesos/administ-procesos.shtml#PROCE

Figura 3.4.1.1

Prácticamente todos los alfabetos existentes emplean una sola mano a excepción del utilizado en Gran Bretaña y en algunas de sus antiguas colonias, donde se emplea un alfabeto de dos manos (ver ilustración 3.4.1.2).

Figura 3.4.1.2

VISIÓN ARTIFICIAL

La Visión artificial, también conocida como Visión por Computador (del inglés Computer Vision) o Visión técnica, es un sub campo de la inteligencia artificial. El propósito de la visión artificial es programar un computador para que "entienda" una escena o las características de

http://es.wikipedia.org/wiki/Computador

http://es.wikipedia.org/wiki/Inteligencia_artificial

http://es.wikipedia.org/wiki/Ingl%C3%A9s

una imagen.

Esquema de relaciones entre visión por computadora y otras áreas afines.

Los objetivos típicos de la visión artificial incluyen:

La detección, segmentación, localización y reconocimiento de ciertos objetos en imágenes (por ejemplo, caras humanas).

La evaluación de los resultados (ej.: segmentación, registro). Registro de diferentes imágenes de una misma escena u objeto, i.e., hacer concordar

un mismo objeto en diversas imágenes. Seguimiento de un objeto en una secuencia de imágenes. Mapeo de una escena para generar un modelo tridimensional de la escena; tal modelo

podría ser usado por un robot para navegar por la escena. Estimación de las posturas tridimensionales de humanos. Búsqueda de imágenes digitales por su contenido.

Estos objetivos se consiguen por medio de reconocimiento de patrones, aprendizaje estadístico, geometría de proyección, procesado de imágenes, teoría de grafos y otros campos. La visión artificial cognitiva está muy relacionada con la psicología cognitiva y la computación biológica.

Figura 3.4.1.3

El inicio de la visión artificial, desde el punto de vista práctico, fue marcado por Larry Roberts, el cual, en 1961 creó un programa que podía "ver" una estructura de bloques, analizar su

http://es.wikipedia.org/w/index.php?title=Computaci%C3%B3n_biol%C3%B3gica&action=edit

http://es.wikipedia.org/wiki/Psicolog%C3%ADa_cognitiva

http://es.wikipedia.org/w/index.php?title=Visi%C3%B3n_artificial_cognitiva&action=edit

http://es.wikipedia.org/wiki/Teor%C3%ADa_de_grafos

http://es.wikipedia.org/w/index.php?title=Procesado_de_im%C3%A1genes&action=edit

http://es.wikipedia.org/w/index.php?title=Geometr%C3%ADa_de_proyecci%C3%B3n&action=edit

http://es.wikipedia.org/w/index.php?title=Aprendizaje_estad%C3%ADstico&action=edit

http://es.wikipedia.org/w/index.php?title=Aprendizaje_estad%C3%ADstico&action=edit

http://es.wikipedia.org/wiki/Reconocimiento_de_patrones

http://es.wikipedia.org/w/index.php?title=Imagen_digital&action=edit

http://es.wikipedia.org/w/index.php?title=Navegar&action=edit

http://es.wikipedia.org/wiki/Robot

http://es.wikipedia.org/wiki/Modelo

http://es.wikipedia.org/wiki/Imagen:CVoverview2-ES.jpg

contenido y reproducirla desde otra perspectiva, demostrando así a los espectadores que esa información visual que había sido mandada al ordenador por una cámara, había sido procesada adecuadamente por el. El programa buscaba transiciones bruscas entre valores de grises, lo que correspondería a los bordes de los objetos, a continuación encajaba las líneas rectas con los puntos identificados como esquinas, las cuales utilizaba para delimitar las caras de los bloques, después determinaba que caras se juntaban para formar cada bloque, corregía sus perspectiva para mostrar la figura desde otro enfoque y calculaba la distancia a la cámara. Pero, claro, si el programa buscaba "transiciones bruscas entre los valores de grises", este programa no solo no valdría con los cubos negros, sino que no valdría con casi ningún cubo, solo, con los que se fabricasen para la experimentación de este proceso, es decir, era la visión del micromundo por excelencia.

Pero la visión de cubos, o de cualquier figura geométrica, cuando estas están al borde de perder esa definición en el mundo real ¿vale realmente para algo?. Es una pregunta difícil de contestar, porque todo va en función de las circunstancias, pero SÍ, la respuesta es sí, porque ¿qué sería de la experimentación científica si no se abordasen todos los caminos posibles, aunque a primera instancia parezcan ser callejones sin salida?.

Gerald Sussman, estudiante de primer año del MIT hacia 1966, fue contratado por Marvin Minsky para que solucionara "de una vez por todas" el problema de la visión artificial. Con este encargo parecía como si Minsky quisiera quitarse de encima uno de los más difíciles problemas de la I.A., tratando este asunto como uno más. El enunciado según Minsky, es sencillo: "Conectar una cámara de televisión a un ordenador y hacer que este describiera lo que la cámara captaba", lo que ahora cualquier investigador de inteligencia artificial describiría como "¡casi ná!". Pero este tipo de aventuras eran, justamente, en las que se embarcaban todos los científicos de I.A. por esas épocas, así pues no debemos asustarnos de tanta ingenuidad, solo aprender de sus errores y saber que nada es tan fácil como parece y que todo es más complejo de lo que pensamos. Al final este proyecto se tubo que paralizar, y Minsky creó otro proyecto asociado, llamado "micromundo de bloques".

Por supuesto que un sistema capaz de visualizar su entorno, y no solo eso, claro, sino poder describirlo y entenderlo: llegar a una comprensión de esa información, sería algo espectacular y grandioso en I.A., pero el mundo que se percibe desde lo real (los sentidos), no es más que una representación abstracta de algo, que contiene funciones reales, que si no son abstractas, poco les falta, es decir: una mesa en si misma, no tiene características propias de mesa, porque la mesa, como algo absoluto con características universales, no existe, ¿quién me dice a mi que esa masa de ahí no es una mesa?, claro, todo es materia "desordenada" hasta que se encuentra una función para cada una si yo, me imagino sentado cerca de esa "masa", y observo que en efecto, esta me llega al pecho, pues si... puede que se trate de una mesa. Nosotros, los humanos, por nuestra parte, vivimos en un entorno de percepción, asociación y comprensión, pero a la vez, pretendemos que el ordenador no asocie su entorno de la misma forma lógica, sino que su trabajo sea mecánico, que cuando vea una mesa, diga: MESA, porque sí, porque es lo que es, pero... ¿qué es una mesa?, ¿y una mesa al revés?... ¿qué es una mesa al revés? ¿eh?... son meros utensilios que hemos creado, con cierta ingeniería de lo útil, para que nos facilite la vida y nos la haga más cómoda, cuando uno de estos utensilios se nos es presentado por primera vez, podremos dudar cual es su funcionamiento, pero al final acabamos buscándole una función, que, claro está, es para la que ha sido creado (aunque no siempre debe ser así: hay libros que sujetan camas cojas...). Entonces, el ordenador debe, por analogía lógica, percibir el mundo de esta misma forma, asociar como se pueden utilizar los objetos, y designar, por esa condición qué son, teniendo su utilidad como mayor seña de su identidad. Pero... si un sistema de inteligencia artificial, es, pongamos por caso, un ordenador conectado a una cámara y un par de sensores de distancia... ¿qué va ha significar una mesa

para el?, el, que nunca se ha sentado, que no la necesita, y que es más... no tiene cuerpo, no solo adecuado para sentarse, sino que este, no es móvil. Pues bien, y aunque esta pregunta es algo complicada, porque cada sistema inteligente tiene su función..., pongamos por caso que la función de este fuera identificar "cosas", el ordenador debería saber (o haber aprendido) que el mundo, es, primordialmente del ser humano, entonces, ya debería haber conocido que y como es una persona y, por consiguiente, asociar un mundo hecho por y para personas con las que lo pueblan. Pero ese ejemplo también le valdría a el si tuviese autonomía móvil, pues el mundo le ofrece un sinfín de utensilios que a el le pueden servir como el libro de 45 páginas a la pata coja de una cama.

PROCESAMIENTO DIGITAL DE IMÁGENES

Adquisición de la imagenLa primera tarea de un sistema de inspección visual automático es la adquisición de la imagen, mediante una cámara de vídeo y su óptica asociada, y su transferencia a la memoria del sistema de procesamiento, utilizando un digitalizador de imagen (frame grabber). Todas las aplicaciones de inspección visual, obtienen información de característica de interés, a través delcontraste de la escena. El contraste es creado por variaciones en los niveles de gris o cambios en color. La técnica usada para distinguir estos cambios es función del sensor óptico y la iluminación. La técnica de iluminación elegida, por las características de la inspección fue la de iluminación posterior difusa. La experiencia en el desarrollo de sistema de medición de frascos medicinales (Castro y Nasisi, 1994) fue fundamental en esta elección. Esta técnica de iluminación permite resaltar los defectos del vidrio.

PreprocesamientoEn la etapa de preprocesamiento se pretende mejorar la calidad de la imagen para posteriormente realizar la segmentación. Dentro de esta categoría de procesamiento se puede citar:

Eliminación de ruidoDebido a la disponibilidad de poco tiempo para el procesamiento digital es de suma importancia optimizar las técnicas de iluminación, con el fin de hacer casi innecesario la utilización de filtros pasabajos para la eliminación de ruido. La utilización de algoritmos de segmentación simples y rápidos como la binarización, disminuye la sensibilidad a los ruidos con respecto a otros algoritmos como ser el de la derivada.

Eliminación de fondoUna forma de detección de defectos superficiales es tomando imágenes en la misma posición del objeto para compararlo con una imagen del objeto libre de errores. Esto hace que se obtenga un fondo aproximadamente constante que puede ser eliminado fácilmente restando de la imagen adquirida la imagen del fondo obtenida previamente. Se logra de esta forma contrastar fuertemente el objeto del fondo, pero pequeñas diferencias en la posición del objeto pueden provocar errores en la detección.

SegmentaciónEl propósito de la segmentación es realizar una partición de la imagen en objetos o regiones sgnificativas. Los métodos de segmentación asumen que las regiones a extraer poseen una homogeneidad en algunas características (variables). En las técnicas utilizadas en la segmentación (Pratt, 1979) se localiza los contornos de las regiones (edge segmentation), o se agrupan pixels de similares características (región segmentation). Desde el punto de vista

de la inspección visual la segmentación por contornos es la más útil (por velocidad) y para ello se dispone de dos alternativas:

BinarizaciónEn ciertos casos existe una forma natural y muy sencilla de diferenciar, dentro de la escena detalles de interés. Esto se produce cuando el nivel de gris de los objetos a analizar se encuentra en un determinado rango de valores. Esta técnica de segmentación tiene enormes ventajas, dada la simplicidad tanto del hard como del sofá requeridos para su implementación. Sin embargo, tiene el grave inconveniente de la dificultad que representa elegir un buen umbral de binarización. Para poder utilizar binarización es imprescindible que el defecto resalte visualmente con respecto a la pieza a inspeccionar (tenga distinta luminosidad), esto se consigue con una técnica de iluminación adecuada. Para la selección del umbral de binarización se utiliza la información obtenida del histograma. Este último condensa los datos de la imagen eliminando la información espacial (solo interesa detectar los defectos, no su ubicación). Por lo tanto se reduce el tiempo de cálculo, muy escaso en aplicaciones industriales.

Extractores de contornosLos extractores de contorno fundamentan su actuación en el estudio del contexto de cada punto de la imagen. Utilizan como herramienta la derivada, tanto la derivada primera como, la derivada segunda que presenta las ventajas, frente a la primera, de no ser direccional, y de proporcionar mejores resultados cuando los cambios espaciales del nivel de gris son lentos.

Segmentación utilizadaEn la práctica se utiliza combinaciones de los distintos métodos de segmentación. El principal inconveniente de la binarización, es que la selección del umbral es extremadamente dependiente de la iluminación. Los métodos de las derivadas incrementan el ruido a la vez que requieren más tiempo para el procesamiento. En este trabajo la propuesta fue utilizar la binarización para la detección de los defectos, por la velocidad del algoritmo, y métodos de derivada en pequeñas franjas de la imagen para detectar la ubicación del objeto dentro de la escena, ver (Castro y Nasisi, 1994). Hay que tener en cuenta que hay que inspeccionar los 360grados de la superficie del frasco en menos de 300mseg.

REDES NEURONALES

La Neurona

A finales del siglo 19 se logró una mayor claridad sobre el trabajo del cerebro debido a los trabajos de Ramón y Cajal en España y Sherrington en Inglaterra. El primero trabajó en la anatomía de las neuronas y el segundo en los puntos de conexión de las mismas o sinápsis.

El tejido nervioso es el más diferenciado del organismo y está constituido por células nerviosas, fibras nerviosas y la neuroglia, que está formada por varias clases de células. La célula nerviosa se denomina neurona, que es la unidad funcional del sistema nervioso. Hay neuronas bipolares, con dos prolongaciones de fibras y multipolares, con numerosas prolongaciones. Pueden ser neuronas sensoriales, motoras y de asociación.

Se estima que en cada milímetro del cerebro hay cerca de 50.000 neuronas. El cuerpo de la neurona o Soma contiene el núcleo. Se encarga de todas las actividades metabólicas de la neurona y recibe la información de otras neuronas vecinas a través de las conexiones


http://www.monografias.com/trabajos/redesneuro/redesneuro.shtml


http://www.monografias.com/trabajos13/acerca/acerca.shtml

http://www.monografias.com/trabajos11/sisne/sisne.shtml


http://www.monografias.com/trabajos/celula/celula.shtml




http://www.monografias.com/Anatomia/index.shtml

http://www.monografias.com/trabajos6/laerac/laerac.shtml

http://www.monografias.com/trabajos6/hies/hies.shtml

http://www.monografias.com/trabajos11/memoram/memoram.shtml


http://www.monografias.com/trabajos/fintrabajo/fintrabajo.shtml

sinápticas.

Las dendritas son las conexiones de entrada de la neurona. Por su parte el axón es la "salida" de la neurona y se utiliza para enviar impulsos o señales a otras células nerviosas. Cuando el axón esta cerca de sus células destino se divide en muchas ramificaciones que forman sinápsis con el soma o axones de otras células. Esta unión puede ser "inhibidora" o "excitadora" según el transmisor que las libere. Cada neurona recibe de 10.000 a 100.000 sinápsis y el axón realiza una cantidad de conexiones similar.

La transmisión de una señal de una célula a otra por medio de la sinápsis es un proceso químico. En él se liberan substancias transmisoras en el lado del emisor de la unión. El efecto es elevar o disminuir el potencial eléctrico dentro del cuerpo de la célula receptora. Si su potencial alcanza el umbral se envía un pulso o potencial de acción por el axón. Se dice, entonces, que la célula se disparó. Este pulso alcanza otras neuronas a través de la distribuciones de los axones.

La Red Neuronal

El sistema de neuronas biológico esta compuesto por neuronas de entrada (censores) conectados a una compleja red de neuronas "calculadoras" (neuronas ocultas), las cuales, a su vez, están conectadas a las neuronas de salidas que controlan, por ejemplo, los músculos. Los sensores pueden ser señales de los oídos, ojos, etc. las respuestas de las neuronas de salida activan los músculos correspondientes. En el cerebro hay una gigantesca red de neuronas "calculadoras" u ocultas que realizan la computación necesaria. De esta manera similar, una red neuronal artificial debe ser compuesta por censores del tipo mecánico o eléctrico.

Historia De Redes Neuronales Artificiales

Los intentos por imitar el funcionamiento del cerebro han seguido la evolución del estado de la tecnología. Por ejemplo, al finalizar el siglo 19 se le comparó con la operación de la bomba hidráulica; durante la década de 1920 a 1930 se intento utilizar la teoría de la conmutación telefónica como punto de partida de un sistema de conocimiento similar al del cerebro. Entre 1940 y 1950 los científicos comenzaron a pensar seriamente en las redes neuronales utilizando como concepto la noción de que las neuronas del cerebro funcionan como interruptores digitales (on - off) de manera también similar al recién desarrollado computador digital. Así nace la idea de "revolución cibernética" que maneja la analogía entre el cerebro y el computador digital.

1943 Teoría de las Redes Neuronales Artificiales

Walter Pitts junto a Bertran Russell y Warren McCulloch intentaron explicar el funcionamiento del cerebro humano, por medio de una red de células conectadas entre sí, para experimentar ejecutando operaciones lógicas. Partiendo del menor suceso psíquico (estimado por ellos): el impulso todo/nada, generado por una célula nerviosa.

El bucle "sentidos - cerebro - músculos", mediante la retroalimentación producirían una reacción positiva si los músculos reducen la diferencia entre una condición percibida por los sentidos y un estado físico impuesto por el cerebro.

También definieron la memoria como un conjunto de ondas que reverberan en un circuito

http://www.monografias.com/trabajos5/elso/elso.shtml#ondas

http://www.monografias.com/trabajos16/memorias/memorias.shtml

http://www.monografias.com/trabajos7/impu/impu.shtml


http://www.monografias.com/trabajos12/orsen/orsen.shtml

http://www.monografias.com/trabajos12/orsen/orsen.shtml

http://www.monografias.com/trabajos11/lacelul/lacelul.shtml

http://www.monografias.com/trabajos6/diop/diop.shtml

http://www.monografias.com/Computacion/Redes/


http://www.monografias.com/trabajos4/epistemologia/epistemologia.shtml

http://www.monografias.com/trabajos15/computadoras/computadoras.shtml

http://www.monografias.com/trabajos/cibernetica/cibernetica.shtml

http://www.monografias.com/trabajos10/era/era.shtml


http://www.monografias.com/trabajos10/teca/teca.shtml



http://www.monografias.com/trabajos/epistemologia2/epistemologia2.shtml


http://www.monografias.com/trabajos4/epistemologia/epistemologia.shtml

http://www.monografias.com/Tecnologia/index.shtml


http://www.monografias.com/trabajos16/teoria-sintetica-darwin/teoria-sintetica-darwin.shtml




http://www.monografias.com/Computacion/index.shtml








http://www.monografias.com/trabajos14/administ-procesos/administ-procesos.shtml#PROCE

http://www.monografias.com/trabajos11/lacelul/lacelul.shtml





cerrado de neuronas.

1949 Conductividad de la sinápsis en las Redes Neuronales.

Seis años después de que McCulloch y Pitts mostraran sus Redes Neuronales, el fisiólogo Donald O. Hebb (de la McGill University) expuso que estas (las redes neuronales) podían aprender. Su propuesta tenia que ver con la conductividad de la sinápsis, es decir, con las conexiones entre neuronas. Hebb expuso que la repetida activación de una neurona por otra a través de una sinápsis determinada, aumenta su conductividad, y la hacia más propensa a ser activada sucesivamente, induciendo a la formación de un circuito de neuronas estrechamente conectadas entre sí.

1951 Primera Red Neuronal

El extraordinario estudiante de Harvard, Marvin Minsky conoció al científico Burrhus Frederic Skinner, con el que trabajó algún tiempo ayudándole en el diseño y creación de máquinas para sus experimentos. Minsky se inspiró en Skinner para gestar su primera idea "oficial" sobre inteligencia artificial, su Red Neuronal. Por aquel entonces entabló amistad con otro brillante estudiante, Dean Edmonds, el cual estaba interesado en el estudio de una nueva ciencia llamada Electrónica.

Durante el verano de 1951, Minsky y Edmonds montaron la primera máquina de redes neuronales, compuesta básicamente de 300 tubos de vacío y un piloto automático de un bombardero B-24. Llamaron a su creación "Sharc", se trataba nada menos que de una red de 40 neuronas artificiales que imitaban el cerebro de una rata. Cada neurona hacia el papel de una posición del laberinto y cuando se activaba daba a entender que la "rata" sabia en que punto del laberinto estaba. Las neuronas que estaban conectadas alrededor de la activada, hacían la función de alternativas que seguir por el cerebro, la activación de la siguiente neurona, es decir, la elección entre "derecha" o "izquierda" en este caso estaría dada por la fuerza de sus conexiones con la neurona activada. Por ejemplo, la "rata" completaba bien el recorrido eligiendo a partir de la quinta neurona la opción "izquierda" (que correspondería a la sexta), es entonces cuando las conexiones entre la quinta y sexta se hacen más fuertes (dicha conexión era realizada por el piloto automático), haciendo desde este momento más propensa esta decisión en un futuro. Pero las técnicas Skinnerianas (que eran las que se habían puesto en funcionamiento en esta red neuronal) no podrían llevar muy lejos a este nuevo engendro, la razón pasa porque esto, en sí, no es inteligencia, pues la red neuronal nunca llegaría a trazar un plan.

Después de su Red Neuronal, Minsky escribió su tesis doctoral acerca de esta, en ella describía "cerebros mucho mayores", exponiendo que si se realizaba este proyecto a gran escala, con miles o millones de neuronas más y con diferentes censores y tipos de retroalimentación… la máquina podría ser capaz de razonar, mas el sabia que la realización de esta Red Neuronal era imposible y decidió buscar otra forma de crear inteligencia…

Las Redes Neuronales Artificiales

Un método más avanzado para representar el conocimiento, es el sistema experto. Típicamente está compuesto por varias clases de información almacenada: Las reglas If - Then le dicen al sistema como se debe reaccionar ante los estados del "mundo". Una regla del sistema experto puede ser if Y es un hombre, Then Y es mortal. Los hechos describen el estado del "mundo". Por ejemplo: Juan es mortal. Por último, una máquina de inferencia



http://www.monografias.com/trabajos15/fundamento-ontologico/fundamento-ontologico.shtml






http://www.monografias.com/trabajos11/metods/metods.shtml


http://www.monografias.com/trabajos15/inteligencia-emocional/inteligencia-emocional.shtml

http://www.monografias.com/trabajos6/dige/dige.shtml#evo

http://www.monografias.com/trabajos12/pmbok/pmbok.shtml

http://www.monografias.com/trabajos/tesisgrado/tesisgrado.shtml

http://www.monografias.com/trabajos7/plane/plane.shtml

http://www.monografias.com/trabajos15/inteligencia-emocional/inteligencia-emocional.shtml

http://www.monografias.com/trabajos12/eleynewt/eleynewt.shtml

http://www.monografias.com/trabajos5/recicla/recicla.shtml#papel


http://www.monografias.com/trabajos5/electro/electro.shtml

http://www.monografias.com/trabajos10/fciencia/fciencia.shtml

http://www.monografias.com/trabajos10/afam/afam.shtml#in

http://www.monografias.com/trabajos16/la-inteligencia-artificial/la-inteligencia-artificial.shtml

http://www.monografias.com/trabajos15/pavlov-skinner/pavlov-skinner.shtml#parad

http://www.monografias.com/trabajos10/cuasi/cuasi.shtml

http://www.monografias.com/trabajos13/diseprod/diseprod.shtml

http://www.monografias.com/trabajos6/meti/meti.shtml

http://www.monografias.com/trabajos15/pavlov-skinner/pavlov-skinner.shtml#parad




relaciona los hechos conocidos con las reglas If - Then y genera una conclusión. En el ejemplo: Juan es mortal. Esta nueva conclusión se añade a la colección de hechos que se almacena en los medios ópticos o magnéticos del computador digital. De esta forma, un sistema experto sintetiza nuevo conocimiento a partir de su "entendimiento" del mundo que le rodea. De esta forma, un sistema experto es un método de representación y procesamiento del conocimiento, mucho más rico y poderoso que un simple programa de computador. Sin embargo, con respecto a la manera en que opera el cerebro humano, las limitaciones son múltiples. Los problemas planteados en términos difusos o ambiguos , por ejemplo, son muy complejos de analizar o "conocer" con sistemas de procesamiento simbólico, como los sistemas expertos o programas de computador.

Interpretación De La Neurona Por Computadora

Una neurona se puede comparar con una caja negra compuesta por varias entradas y una salida.

La Neurona Artificial

Un circuito eléctrico que realice la suma ponderada de las diferentes señales que recibe de otras unidades iguales y produzca en la salida un uno o un cero según el resultado de la suma con relación al umbral o nivel de disparo, conforma una buena representación de lo que es una neurona artificial. La función de transferencia para la activación o disparo de la neurona puede ser de umbral lógico (figura 3.4.1.4A) o de limitación dura (figura 3.4.1.4B) o de función tipo s (figura 3.4.1.4C).

Figura 3.4.1.4

La neurona artificial es un dispositivo eléctrico que responde a señales eléctricas. La respuesta la produce el circuito activo o función de transferencia que forma parte del cuerpo de la neurona. Las "dendritas" llevan las señales eléctricas al cuerpo de la misma. Estas señales provienen de censores o son salidas de neuronas vecinas. Las señales por las dendritas pueden ser voltajes positivos o negativos; los voltajes positivos contribuyen a la excitación del cuerpo y los voltajes negativos contribuyen a inhibir la respuesta de la neurona. Figura 3.4.1.5.

A B C


http://www.monografias.com/Computacion/Programacion/

http://www.monografias.com/trabajos16/sistemas-expertos/sistemas-expertos.shtml


http://www.monografias.com/trabajos15/calidad-serv/calidad-serv.shtml#PLANT


http://www.monografias.com/Computacion/Programacion/


http://www.monografias.com/trabajos11/metods/metods.shtml



http://www.monografias.com/trabajos14/medios-comunicacion/medios-comunicacion.shtml

Figura 3.4.1.5

Entrenamiento.

Cuando el sistema humano de neuronas, los ojos captan un objeto A, por ejemplo, algunos de los censores de la visión se activan y envían señales a las neuronas ocultas. Las neuronas que se disparan con la señal de entrada aumentan el grado de conexión de ellas. Si el mismo objeto A se presenta una y otra vez, la interconexión de neuronas se refuerza y, por lo tanto, el conocimiento del objeto.

Si se le presenta a la red anterior el objeto A modificado la unión de las neuronas para el conocimiento de tal objeto, es débil. Las neuronas deben entrenarse para reconocer el objeto A en esta nueva presentación. Luego de algunas sesiones de entrenamiento, el sistema neuronal es capaz de reconocer el objeto A en todas sus formas. Si el objeto cambia nuevamente la red de neuronas y el conocimiento se actualizan.

Este entrenamiento, repetido para todos los valores de entrada y salida que se quiera, origina una representación interna del objeto en la red, que considera todas las irregularidades y generalidades del mismo.

Figura 3.4.1.6

En la figura 3.4.1.6 se presenta el esquema de una neurona artificial durante la etapa de aprendizaje. Una vez establecidos los pesos definitivos de interconexión, la neurona adquiere su forma tradicional.

http://www.monografias.com/trabajos5/teap/teap.shtml

http://www.monografias.com/trabajos14/nuevmicro/nuevmicro.shtml

http://www.monografias.com/trabajos14/mocom/mocom.shtml


http://www.monografias.com/trabajos14/mocom/mocom.shtml





3.4.2 Estado del arte

Existen numerosos desarrollos en el área del reconocimiento de imágenes a través de visión artificial, con diferentes aplicaciones, sin embargo en el campo de interpretación de signos para sordomudos, los desarrollos no son tan numerosos. A continuación se mencionan algunos:

SIGN LANGUAGE RECOGNITIONElaborado por Dublin City University en el 2001.

HAND TRACKING AND RECOGNITION OF BIMANUAL MOVEMENTSElaborado por Dublin City University en el 2003.

RECONOCIMIENTO DE LENGUAJES DE SIGNOS UTILIZANDO GUANTES DE DATOSElaborado por la Escuela Universitaria de Informática de la Universidad Politécnica de Madrid en el 2003

3.5 Objetivos

3.5.1 General

Realizar un sistema en la capacidad de reconocer signos manuales propios del lenguaje para sordomudos que describan el alfabeto a través de una web cam conectada a un PC, el cual debe interpretar el signo mostrado frente a la cámara en tiempo real, traduciendo el signo hecho con al mano a la letra del alfabeto correspondiente.

3.5.2 Específicos

Realizar un sistema en la capacidad adquirir, reconocer e interpretar imágenes mediante una web cam a través de un computador personal.

Realizar un software capaz de realizar el procesamiento de las imágenes adquiridas, así como su respectiva interpretación.

Implementar un algoritmo para realizar el procesamiento y reconocimiento de imágenes en tiempo real.

3.6 Alternativa de Solución3.6.1 Descripción:

Frente a la problemática descrita en la comunicación entre personas con discapacidad de comunicarse a través de medio oral con su entorno, se plantea como alternativa de solución la creación de un sistema que permita realizar intercambio de información mediante un traductor del lenguaje de signos empleado por personas sordomudas y personas de habla oral.

El sistema debe obtener la imagen elaborada por la persona, que mediante un signo representa alguna letra del alfabeto, y traducirla a lenguaje escrito de forma virtual, es decir a través de un computador personal, se debe visualizar la letra descrita mediante lenguaje de signos. Tal sistema debe permitir el entrenamiento para personas interesadas en aprender el lenguaje de signos, de un modo práctico y económico, pues para acceder al sistema tan solo será necesario contar con una web cam y un computador personal, el software será gratuito y con la posibilidad de correr bajo cualquier sistema operativo.

Elemento de captura

Para adquirir la imagen correspondiente al gesto manual realizado por el usuario es necesario contar con un dispositivo que capture y digitalice la imagen. Para esto el sistema funcionará con una Web Cam de interfaz de comunicación USB, esto para brindar mayor versatilidad. El dispositivo como requisitos mínimos debe manejar una resolución de 640x480 píxeles a una velocidad de 30 fps. Se escoge como elemento de captura una Web Cam por ser más económica frente a una cámara digital.

Captura de imagen

Una vez la imagen ha sido digitalizada y transmitida al PC a través del puerto USB, es

Web Cam

Elemento a travésdel cual se obtiene

la imagen

Algoritmo para elprocesamientode imágenes

Algoritmo para elreconocimientode imágenes

Algoritmo deentrenamientoRed neuronal

INTERFAZ DEUSUARIO

Captura deimagen

Software

necesario capturar la imagen en el software desarrollado. En este proceso se debe generar un código que busque el driver de la Web Cam y permita visualizar y leer la imagen.

Procesamiento de imagen

Al obtener la imagen digitalizada, es necesario realizar un procesamiento previo a la imagen, para filtrar ruido y obtener tan solo la información necesaria, entre el procesamiento previo se encuentra pasar la imagen a escala de grises, aplicar operadores para filtrar, aplicar operadores para resaltar contornos, entre otros.

Reconocimiento de imagen

El siguiente paso consiste en pasar la imagen al algoritmo de reconocimiento de imagen, el cual previamente ha sido patronado y entrenado. Este algoritmo consta de una red neuronal capaz de reconocer la imagen presente.

Interfaz de usuario

La interfaz de usuario es la presentación final brindada al usuario, finalmente este debe acceder a un computador personal y trabajar con el sistema desarrollado. La presentación debe ser lo más agradable posible y de fácil acceso para guiar al usuario en el proceso.

Entrenamiento de la red neuronal

El entrenamiento de la red neuronal es un proceso previo, en el cual se realiza el patronamiento de las imágenes a ser reconocidas, la topología de red neuronal a ser implementada debe reconocer las imágenes correspondientes a los patrones y en caso de desconocer la imagen, reconocerla como un nuevo patrón.

3.7 Metodología Propuesta

Para elaborar este proyecto, es necesario realizar una subdivisión de las diferentes etapas que incorporan su desarrollo. A continuación se presenta la explicación de cada una de las etapas con su respectivo diagrama de flujo:

Documentación general: El desarrollo del proyecto inicia con la documentación general de los temas y herramientas a trabajar. Dentro de la documentación general se encuentra el estudio de proyectos similares así como el estado del arte de los mismos. Como fuentes de información en esta etapa se cuenta principalmente con Internet y publicaciones en revistas de tecnología.

Documentación en captura de imágenes: La documentación en captura, es la etapa donde se adquiere el conocimiento sobre como capturar imágenes desde una Web Cam para trabajarla y descomponerla desde el programa seleccionado para realizar el desarrollo.

Desarrollo de algoritmo de adquisición de imágenes: AL poseer los conocimientos necesarios para realizar la captura de la imagen, se procederá a implementar el algoritmo para adquirir la imagen, guardarla y leerla.

Documentación en procesamiento de imágenes: En esta etapa, se realiza la documentación concerniente al procesamiento previo aplicado a la imagen digitalizada. Este estudio consta de los pasos a seguir para mejorar una imagen, filtrarla y obtener

la mayor cantidad de información posible con un mínimo de datos.

Desarrollo de algoritmo en procesamiento de imágenes: El algoritmo a implementar, deberá leer la imagen obtenida, y aplicar las operaciones necesarias para el mejoramiento y extracción de la imagen.

Documentación en redes neuronales: Esta etapa es de alta prioridad y dedicación, pues se deben adquirir los conocimientos generales sobre el tema de redes neuronales, así como los específicos sobre topologías y rendimiento. También se debe realizar la selección del tipo de red neuronal a ser implementada.

Desarrollo de algoritmo red neuronal: Una vez seleccionada la red neuronal a ser utilizada, se realizarán algoritmos que verifiquen su óptimo funcionamiento, revisando parámetros como velocidad de respuesta y eficiencia.

Patronamiento red Neuronal: El siguiente paso consistirá en realizar el patronamiento de la red neuronal con las imágenes de interés, para el caso los patrones consisten en fotografías de los signos alfabéticos representados con la mano.

Entrenamiento red neuronal: Al obtener los patrones deseados y una topología de red con un funcionamiento óptimo, se procederá a entrenar la red neuronal, hasta que esta adquiera la capacidad de reconocer los signos alfabéticos elaborados con la mano en su totalidad.

Integración de algoritmos: La integración de algoritmos consiste en unir los códigos desarrollados anteriormente, como son la captura de imágenes, el procesamiento y la red neuronal.

Desarrollo interfaz de usuario: Esta etapa consiste en diseñar la presentación para el usuario final, en donde se deben tener en cuenta factores como, facilidad de acceso, ayudas, menús, armonía, entre otros.

Pruebas finales: Las pruebas finales se realizaran para verificar un optimo funcionamiento del desarrollo así como para buscar y corregir errores. Una vez las pruebas finales se han superado, el sistema estará listo para ser presentado.

3.8 Resultados Esperados

Una vez el proyecto sea finalizado, se espera obtener un sistema didáctico, versátil, de fácil uso, que cumpla con las expectativas de los usuarios finales. Durante la elaboración del proyecto se espera generar y desarrollar algoritmos de óptimo desempeño, los cuales podrán ser aplicados no solo en la aplicación que se desarrollará, sino en general para desarrollos posteriores en temas relacionados con visión artificial.

3.9 Estrategia de Comunicación

Poster de presentaciónArticulo IEEEPresentación en Público, mediante exposición.

3.10 Trayectoria del Grupo Investigador y presentación del equipo de investigadores

3.11 Cronograma de Actividades

4.0 PRESUPUESTO

PRESUPUESTO GLOBAL DE LA PROPUESTA POR FUENTES DE FINANCIACIÓN(En miles de $)

RUBROSFUENTES TOTAL

Colciencias Univ. Distrital ContrapartidaPERSONAL ----------- ----------- 100 100EQUIPO ----------- ----------- 2200 2200MATERIALES ----------- ----------- 150 150SALIDAS DE CAMPO ----------- ----------- ----------- -----------VIAJES ----------- ----------- ----------- -----------BIBLIOGRAFÍA ----------- ----------- 180 180SOFTWARE ----------- ----------- ----------- -----------PUBLICACIONES ----------- ----------- ----------- -----------SERVICIOS TÉCNICOS

----------- ----------- ----------- -----------

CONSTRUCCIONES ----------- ----------- ----------- -----------MANTENIMIENTO ----------- ----------- ----------- -----------ADMINISTRACIÓN ----------- ----------- ----------- -----------

TOTAL ----------- ----------- 2630 2630

DESCRIPCIÓN DE LOS GASTOS DE PERSONAL(En miles de $)

INVESTIGADOR

/AUXILIARFORMACIÓN

PUBLICACIONES (1)

Nal Intern

FUNCIÓN DENTRO DEL PROYECTO

DEDICACIÓN

TOTAL

En miles de $

Frank Giraldo Ingeniero Tutor 1 hora semanal

Oscar Cortés IngenieroDiseño e

implementación

20 Horas Semanales

50

TOTAL 50

DESCRIPCIÓN Y CUANTIFICACIÓN DE LOS EQUIPOS DE USO PROPIO(En miles de $)

EQUIPO VALOR (CONTRAPARTIDA)

COMPUTADOR PERSONAL 2.200WEB CAM 65

TOTAL 2.265

MATERIALES Y SUMINISTROS(En miles de $)

Materiales* ValorCABLE DE EXTENSIÓN USB 5

CD’s 10Papelería y tinta 15

TOTAL 30

HOJA DE VIDA (RESUMEN)

1. ESTUDIANTE

Apellidos: Cortés Bagui Nombre: Oscar Javier

Fecha de Nacimiento: 18 de Mayo de 1983 Nacionalidad: Colombiana

Correo Electrónico: [email protected] Tel/Fax: 7160886

Entidad donde Labora: Cargo Actual:

2. Títulos Obtenidos (Area/disciplina, Universidad, Año):

Tecnólogo en Electrónica, Universidad Distrital FJC FT, 2003


3. Experiencia. Campos de la ciencia y la tecnología en los cuales es experto

Programación a bajo y alto nivel, desarrollo y diseño electrónico para automatización.

4. Cargos Desempeñados (Tipo de posición, Institución, Fecha) en los últimos 5 años:

Electrónico, en la empresa Coca-Cola, de enero de 2005 a marzo de 2006Monitor de laboratorio electrónico, Universidad Distrital FT, Enero de 2002 a diciembre de 2003Técnico en mantenimiento a equipo electrónico, Mundo electrónico digital, Febrero de 2003 a abril de 2004

ANEXO 1

ANALISIS DEL PROBLEMA.

PROBLEMA 1 2 3 4 5 6 7Total Activos

1. Carencia de un sistema de comunicación efectivo entre personas sordomudas y personas de habla oral.

0 2 0 1 2 2 07

2. Falta de interés por parte de las personas que pueden escuchar y hablar, por aprender el sistema de comunicación para personas sordomudas.

3 0 0 2 1 1 0

73. Tiempo demasiado extenso para aprender el lenguaje de labio lectura o de signos. 3 1 0 1 2 1 3

114. Costos elevados en academias que prestan el servicio de capacitación en el lenguaje de signos y labio lectura.

0 2 0 0 0 1 03

5. Cuando el lenguaje de signos no es utilizado de modo rutinario se olvida al cabo del tiempo.

0 1 3 0 0 1 05

6. Brecha en la comunicación entre personas sordomudas y personas de habla oral. (Discriminación).

3 3 0 1 1 0 19

7. Carencia de un sistema de entrenamiento y práctica para personas que se capaciten en el lenguaje de signos.

0 2 3 1 3 2 011

Total Pasivos 9 11 6 6 9 8 4 53

Anexo 1.1Grafico

Propuesta Proyecto de Grado Ing 2007.

Documents

Transcript of Propuesta Proyecto de Grado Ing 2007.