ESCUELA POLITÉCNICA NACIONAL - Repositorio...

146
ESCUELA POLITÉCNICA NACIONAL ESCUELA DE INGENIERÍA "CONTROL POR VOZ DE UN ROBOT EXPLORADOR TIPO ORUGA" PROYECTO PREVIO A LA OBTENCIÓN DEL TITULO DE INGENIERO EN ELECTRÓNICA Y CONTROL AREVALO LUZURIAGA MARCELO JAVIER PINO CHAVEZ MIGUEL ÁNGEL DIRECTOR: ING. NELSON SOTOMAYOR Quito, OCTUBRE 2004

Transcript of ESCUELA POLITÉCNICA NACIONAL - Repositorio...

Page 1: ESCUELA POLITÉCNICA NACIONAL - Repositorio …bibdigital.epn.edu.ec/bitstream/15000/11809/1/T2300.pdf · de audio y video implementado en el robot, hacia un receptor remoto o televisor

ESCUELA POLITÉCNICA NACIONAL

ESCUELA DE INGENIERÍA

"CONTROL POR VOZ DE UN ROBOT EXPLORADOR TIPOORUGA"

PROYECTO PREVIO A LA OBTENCIÓN DEL TITULO DE INGENIERO ENELECTRÓNICA Y CONTROL

AREVALO LUZURIAGA MARCELO JAVIERPINO CHAVEZ MIGUEL ÁNGEL

DIRECTOR: ING. NELSON SOTOMAYOR

Quito, OCTUBRE 2004

Page 2: ESCUELA POLITÉCNICA NACIONAL - Repositorio …bibdigital.epn.edu.ec/bitstream/15000/11809/1/T2300.pdf · de audio y video implementado en el robot, hacia un receptor remoto o televisor

Nosotros, MARCELO JAVIER AREVALO LUZURIAGA y MIGUEL ÁNGEL PINOCHAVEZ, declaramos bajo juramento que el trabajo aquí descrito es de nuestraautoría; que no ha sido previamente presentada para ningún grado o calificaciónprofesional; y, que hemos consultado las referencias bibliográficas que se incluyenen este documento.

A través de la presente declaración cedemos nuestros derechos de propiedadintelectual correspondientes a este trabajo, a la Escuela Politécnica Nacional, segúnlo establecido por la Ley de Propiedad Intelectual, por su Reglamento y por lanormatividad institucional vigente.

Javier Arévalo Ángel Pino

Page 3: ESCUELA POLITÉCNICA NACIONAL - Repositorio …bibdigital.epn.edu.ec/bitstream/15000/11809/1/T2300.pdf · de audio y video implementado en el robot, hacia un receptor remoto o televisor

CERTIFICACIÓN

Certifico que e! presente trabajo fue desarrollado por MARCELO JAVIER AREVALOLUXURIAGA y MIGUEL ÁNGEL PINO CHAVEZ, bajo mi supervisión.

Ing. Nelscn Sotomayor

Page 4: ESCUELA POLITÉCNICA NACIONAL - Repositorio …bibdigital.epn.edu.ec/bitstream/15000/11809/1/T2300.pdf · de audio y video implementado en el robot, hacia un receptor remoto o televisor

AGRADECIMIENTO

Primeramente a Dios por darme la salud para finalizar este proyecto, y regalarmesus bendiciones a cada instante, a mi esposa y compañera Anita que ha luchado ami lado en todo momento, a mi querido hijo Marcelito que es e! motor de mi vida ,a mis padres Mario y Margoth que me brindan todo su amor y apoyo, a missuegros Gonzalo y Magdalena que me han acompañado en los momentos masdifíciles, a mis hermanos Maribel, Maritza y Fernán que me dan su cariño y ayudaincondicional.

A todos los amigos que la vida ha puesto en mi camino que son muchos y muyvaliosos, al Laboratorio de Control Industrial en especial a! Ing. Ricardo Parreño unverdadero amigo, a Miguel Ángel mi copiloto en el proyecto y que es un amigomuy valioso, y por ultimo pero no menos importante al Ing. Nelson Sotomayor, porsu ayuda desinteresada y continua en el desarrollo del proyecto

Page 5: ESCUELA POLITÉCNICA NACIONAL - Repositorio …bibdigital.epn.edu.ec/bitstream/15000/11809/1/T2300.pdf · de audio y video implementado en el robot, hacia un receptor remoto o televisor

DEDICATORIA

Con mucho cariño a la luz de mi vida, mi hijo MARCELÍTO JAVIER que es lapersona mas importante y mi motivación para vencer cualquier obstáculo,

A mi esposa Aníta, a mis padres, suegros, hermanos y a todos mis grandesamigos que nunca me han fallado y siguen siempre a mi lado.

MARCELO

Page 6: ESCUELA POLITÉCNICA NACIONAL - Repositorio …bibdigital.epn.edu.ec/bitstream/15000/11809/1/T2300.pdf · de audio y video implementado en el robot, hacia un receptor remoto o televisor

AGRADECIMIENTO

A mi padre Dios, por todo lo que me a dado en la vida, la fuerza y tenacidad paraseguir adelante, a mis padres Luís y Luisa, que sin ellos este proyecto no sehubiera sido posible, a mis hermanos por su apoyo constante, a mí tío Marco y asu esposa por colaborarme siempre, a mis primos por creer constantemente enmí,

De manera muy especial a mi compañero y amigo Marcelo, que gracias a susinsistencias y empuje logramos culminar la carrera. A ti pequecita, que siempreestuviste allí con ese apoyo, en los momentos mas difíciles.

Al Ing. Nelson Sotomayor, por su ayuda desinteresada y acertada conducción enel desarrollo del proyecto. A todos mis amigos, compañeros de trabajo, y a todasesas personas que de una u otra forma colaboraron en la culminación de esteproyecto.

Al Ing. Ricardo Parreño, por brindarnos sus conocimientos y apoyo desinteresado.A todos mis tíos que de una u otra forma colaboraron en la culminación de micarrera.

Gracias a todos.

MIGUEL ÁNGEL

Page 7: ESCUELA POLITÉCNICA NACIONAL - Repositorio …bibdigital.epn.edu.ec/bitstream/15000/11809/1/T2300.pdf · de audio y video implementado en el robot, hacia un receptor remoto o televisor

DEDICATORIA

Con mucho cariño a mis padres: Luís y Luisa, por ser los mejores padres quealguien puede pedir, por su amor, comprensión, apoyo y concejos que han hechode mí una mejor persona; y a la memoria de tres personas que ya no están masjunto a mi: Abuelita Dina, a mi primo Enrique y mi tía Melida. Descansen en paz

MIGUEL ÁNGEL

Page 8: ESCUELA POLITÉCNICA NACIONAL - Repositorio …bibdigital.epn.edu.ec/bitstream/15000/11809/1/T2300.pdf · de audio y video implementado en el robot, hacia un receptor remoto o televisor

CONTENIDO

CONTENIDO i

RESUMEN...................................... iv

PRESENTACIÓN.! vi

1.1 FUNDAMENTOS BÁSICOS SOBRE EL RECONOCIMIENTO DE VOZ .... 1

1.1.1 RECONOCIMIENTO DE VOZ AUTOMÁTICO 1

1.1.2 SISTEMAS DE RECONOCIMIENTO DEPENDIENTES,INDEPENDIENTES Y ADAPTABLES AL HABLANTE 2

1.1.3 TRATAMIENTO DEL HABLA.......

1.1.4 RECONOCIMIENTOS LA VOZ

1.1.5 KIT DE RECONOCIMIENTO AUTOMÁTICO DE VOZ "VOI CEDÍRECTir..... 9

1.1.6 ENTRENAMIENTO DEL MODULO DE RECONOCIMIENTO DEVOZ............. 13

1.1.7 RECONOCIMIENTO DE LAS PALABRAS EN EL MODULO........ 20

1.2 FUNDAMENTOS BÁSICOS SOBRE EL FUNCIONAMIENTO DE LOSSENSORES DE PROXIMIDAD 24

1.2.1 SENSORES DE PROXIMIDAD DE FIN DE CARRERA. 24

1.2.2 SENSORES DE PROXIMIDAD POR MEDIO DE ULTRASONIDO 25

1.2.3 SENSORES DE PROXIMIDAD CON LUZ INFRAROJA 26

1.2.4 SENSORES DE VIDEO. 28

1.3 PROPOTIPOS YA IMPLEMENTADOS QUE UTILIZAN SISTEMAS DEVIDEO 29

Page 9: ESCUELA POLITÉCNICA NACIONAL - Repositorio …bibdigital.epn.edu.ec/bitstream/15000/11809/1/T2300.pdf · de audio y video implementado en el robot, hacia un receptor remoto o televisor

CAPITULO 2

2 DISEÑO DESARROLLO E IMPLEMENTACION DELHARDWARE

2.1 FUNCIONAMIENTO GENERAL 33

2.2 REQUERIMIENTOS MECÁNICOS.......... 34

2.2.1 IMPLEMENTACION DE VEHÍCULO MOTORIZADO TIPO ORUGA.... 34

2.2.2 CÁMARA MÓVIL 36

2.2.3 IMPLEMENTACION PINZA PARA SUJETAR OBJETOS 37

2.3 REQUERIMIENTOS ELÉCTRICOS Y ELECTRÓNICOS 38

2.3.1 DISEÑO DE TARJETA MADRE DE CONTROL 39

2.3.2 IMPLEMENTACION DEL CONTROL POR VOZ................ 43

2.3.3 DISEÑO DE SENSORES INFRARROJOS DE PROXIMIDAD 45

2.3.4 IMPLEMENTACION DEL TRANSMISOR DE AUDIO Y VIDEO PARALA CÁMARA 46

2.3.5 IMPLEMENTACION DEL TRANSMISOR DE AUDIO Y VIDEO PARALA CÁMARA 47

2.3.6 IMPLEMENTACION DEL TRANSMISOR DE AUDIO 49

2.3.7 DISEÑO DE CIRCUITO CONTROLADOR DE SERVOMOTORES 50

2.3.8 IMPLEMENTACION DEL TRASMISOR DE DATOS 52

2.3.9 RECARGA DE BATERÍAS... 52

2.3.10 ENSAMBLAJE DEL ROBOT EXPLORADOR TIPO ORUGA 55

2.3.11 FUNCIONAMIENTO DEL ROBOT TIPO ORUGA.. 66

Page 10: ESCUELA POLITÉCNICA NACIONAL - Repositorio …bibdigital.epn.edu.ec/bitstream/15000/11809/1/T2300.pdf · de audio y video implementado en el robot, hacia un receptor remoto o televisor

CAPITULO 3

3 DISEÑO DESAEROLLO DEL SOFTWARE

3.1 GENERALIDADES... - 723.2 PROGRAMACIÓN DEL MICROCONTROLADOR PIC16F876.... 73

3.2.1 DESARROLLO DEL FLUJOGRAMA GENERAL DEPROGRAMACIÓN 74

3.3 ESTRUCTURA DEL SOFTWARE PARA MANEJO DE PERIFÉRICOS DEENTRADA Y SALIDA.. 85

CAPITULO 4

4 PRUEBAS Y RESULTADOS

4.1 PRUEBAS........... 864.2 RESULTADOS....... 904.3 LISTADO DE ELEMENTOS Y COSTO 94

CAPITULO 5

5 CONCLUCIONES Y RECOMENDACIONES

5.1 CONCLUSIONES Y RECOMENDACIONES. 99

REFERENCIAS BIBLIOGRÁFICAS 102

ANEXOS 103

Page 11: ESCUELA POLITÉCNICA NACIONAL - Repositorio …bibdigital.epn.edu.ec/bitstream/15000/11809/1/T2300.pdf · de audio y video implementado en el robot, hacia un receptor remoto o televisor

RESUMEN

El siguiente proyecto de titilación presenta el diseño y construcción de un robot

explorador tipo oruga controlado mediante comandos de voz, el cual basa su

funcionamiento en un microcontrolador PIC 16F876 y un kit de reconocimiento

de voz como interfaz entre el usuario y el mismo.

Dicho prototipo cuenta con un chasis tipo oruga con tracción diferencial que le

permite una locomoción adaptable a cualquier terreno. De igual manera cuenta

con una cámara infrarroja, la cual envía una señal medíante un transmisor UHF

de audio y video implementado en el robot, hacia un receptor remoto o televisor

común, todo de manera inalámbrica.

El robot posee también una pinza en su parte posterior, la misma que íe

permite recolectar pequeños objetos y trasladarlos de un lugar a otro. A todo

esto le sumamos un conjunto de 9 sensores infrarrojos que le ayudan al

prototipo a realizar una exploración automática, evadiendo obstáculos y

abismos durante toda su trayectoria.

Por último se señala que el robot explorador tipo oruga es capaz de realizar 18

acciones diferentes de control con 15 comandos de voz, los cuales deberán ser

ingresados previamente por el usuario y luego enviados por medio de un

micrófono inalámbrico.

IV

Page 12: ESCUELA POLITÉCNICA NACIONAL - Repositorio …bibdigital.epn.edu.ec/bitstream/15000/11809/1/T2300.pdf · de audio y video implementado en el robot, hacia un receptor remoto o televisor

PRESENTACIÓN

En el siglo XXI la tecnología se ha adelantado a la imaginación y ha convertido

lo que eran sueños en algo posible y de hecho el control por voz es en la

actualidad una área en evolución que no se ha desarrollado aun en el país, por

lo que este proyecto plantea como alcance el de ser el pionero en investigar y

aplicar este tipo de control en la vida diaria de las personas, con este prototipo

se quiere conseguir e iniciar el desarrollo de esta tecnología en e! Ecuador.

Dentro de la robótica existen un sin numero de dispositivos electrónicos

capaces de realizar acciones y movimientos definidos. Para gobernar a estos

dispositivos se necesita de un elemento inteligente programable que permita

administrar y controlar todas estas acciones y movimientos. En este caso el

prototipo trabaja con un microcontrolador PIC 16F876 por su facilidad en la

programación y bajo costo ofrece todo lo necesario para realizar el control del

mismo.

Como ínterfaz entre el usuario y el microcontrolador se utiliza un kit de

reconocimiento de voz, donde se programan previamente las ordenes

(palabras) que son almacenadas en localidades de memoria y al recibir

cualquiera de las instrucciones enviadas por el usuario, éste compara con la

señal almacenada, y envía un dato como señal de control hacia el

microcontrolador PIC, que por su parte es eí encargado de administrar y

controlar todos los actuadores que intervienen en el cumplimiento de dicha

orden. Dentro de estas ordenes esta la de exploración deforma autónoma en

la que el prototipo evadirá obstáculos en su trayectoria automáticamente

usando para esto los sensores infrarrojos con el circuito integrado Sharp

IS471F el cual transmitirá una señal al microcontroíador en el momento que

encuentre un obstáculo en la trayectoria del robot.

Este reporte consta de 5 capítulos, el primer capítulo presenta los

fundamentos básicos de funcionamiento y control que realizan todos los

elementos programables que intervienen en el prototipo, además se hablará

v

Page 13: ESCUELA POLITÉCNICA NACIONAL - Repositorio …bibdigital.epn.edu.ec/bitstream/15000/11809/1/T2300.pdf · de audio y video implementado en el robot, hacia un receptor remoto o televisor

de los sensores y actuadores que permiten realizar el control con todas sus

características y condiciones de funcionamiento y justificando la selección de

los elementos.

En el capitulo segundo comprende el diseño del hardware y de la ubicación

física que este tiene dentro de! prototipo, con todos los requerimientos

propuestos en el proyecto. En el capitulo tercero por su parte se encuentra el

desarrollo del software y los criterios con los que se realizó la programación

para conseguir los mejores resultados.

El capitulo cuarto presenta las pruebas desarrolladas con el prototipo y los

resultados obtenidos de las mismas.

Por ultimo se tiene el capitulo quinto que presentara las conclusiones que se

han generado del trabajo realizado durante todo el proceso de construcción del

prototipo, aclarando las partes del mismo que pueden ser aplicadas a futuros

proyectos por sus óptimos resultados, las etapas que pueden ser mejoradas

por futuras generaciones, y las partes que deberán ser desarrolladas de

manera diferente para lograr mejores resultados.

"VI

Page 14: ESCUELA POLITÉCNICA NACIONAL - Repositorio …bibdigital.epn.edu.ec/bitstream/15000/11809/1/T2300.pdf · de audio y video implementado en el robot, hacia un receptor remoto o televisor

CAPITULO 1

1 FUNDAMENTOS TEÓRICOS

1.1 FUNDAMENTOS BÁSICOS SOBRE EL RECONOCIMIENTO

DE VOZ

En un futuro cercano, el reconocimiento de la voz se convertirá en el método

más usado para realizar el control de todas las actividades cotidianas que realiza

el hombre que van desde las más simples y usuales como encender las luces de

la casa, hasta las más complejas e inimaginables, como realizar cirugías con

instrucciones de voz; de hecho en los países del primer mundo el reconocimiento

de voz ya es aplicado para labores dentro de las industrias como manejo de

maquinarias, edificios inteligentes, control de vehículos, etc.

En este capitulo se introduce los tipos de reconocimiento de voz que existen hasta

la actualidad y como funcionan los mismos para conseguir lo que hace años era

solo un sueño el de poder comunicarnos con las máquinas por medio de señales

audibles. Las máquinas por si solas no son capaces de reconocer la voz, mas sí

estas están conectadas a un elemento "inteligente" todo es posible.

1.1.1 RECONOCIMIENTO DE VOZ AUTOMÁTICO

El reconocimiento de voz automático es el proceso por el cual un computador

convierte una señal acústica de voz a texto. La comprensión automática del

lenguaje es el proceso por el cual un computador convierte una señal acústica de

voz en alguna forma de expresión abstracta del lenguaje.

Page 15: ESCUELA POLITÉCNICA NACIONAL - Repositorio …bibdigital.epn.edu.ec/bitstream/15000/11809/1/T2300.pdf · de audio y video implementado en el robot, hacia un receptor remoto o televisor

1.1.2 SISTEMAS DE RECONOCIMIENTO DEPENDIENTES,

INDEPENDIENTES Y ADAPTABLES AL HABLANTE

Un sistema dependiente del hablante es desarrollado para funcionar para un sólo

hablante, estos sistemas, normalmente, son más fáciles de desarrollar, baratos

de comprar, y precisos, pero no tan flexibles como los sistemas adaptables al

hablante o los sistemas independientes del hablante.

Un sistema independiente del hablante es desarrollado para funcionar con

cualquier hablante de un determinado tipo (por ejemplo, Inglés Americano). Estos

sistemas son complicados de desarrollar, caros y la precisión es menor que la

de los sistemas dependientes del hablante; sin embargo son más flexibles.

Un sistema adaptable al hablante es desarrollado para adecuar su

funcionamiento a las características de nuevos hablantes. Su dificultad reside en

alguna zona entre los sistemas independientes del hablante y los dependientes

de él, [1]

1.1.2.1 Vocabulario pequeño, mediano, grande, muy grande

El tamaño del vocabulario de un sistema de reconocimiento de voz afecta a su

complejidad, requerimientos de proceso y precisión del sistema.

Algunas aplicaciones sólo requieren unas pocas palabras (por ejemplo,

únicamente cifras), otros requieren diccionarios enormes (por ejemplo, máquinas

de dictado). No hay definiciones establecidas, sin embargo se suele utilizar la

siguiente clasificación:

• vocabulario pequeño - decenas de palabras

• vocabulario mediano - cientos de palabras

• vocabulario grande - miles de palabras

Page 16: ESCUELA POLITÉCNICA NACIONAL - Repositorio …bibdigital.epn.edu.ec/bitstream/15000/11809/1/T2300.pdf · de audio y video implementado en el robot, hacia un receptor remoto o televisor

• vocabulario muy grande - decenas de miles de palabras

1.1.2.2 Reconocimiento continuo y discreto

Un sistema de reconocimiento discreto funciona con palabras simples,

necesitando de una pausa entre la dicción de cada palabra. Esta es la forma más

sencilla de reconocimiento para llevar a cabo ya que los puntos de finalización

son fáciles de encontrar y la pronunciación de una palabra no afecta a las demás.

De este modo, y ya que las ocurrencias de las palabras son consistentes, es más

fácil reconocerlas.

Un sistema de reconocimiento continuo funciona sobre un lenguaje en el que las

palabras están conectadas, es decir, no están separadas por pausas. El lenguaje

continuo es más difícil de tratar debido a la variedad de efectos, primero, es difícil

encontrar el comienzo y el final de las palabras, otro problema es la

coarticulacíón, la generación de cada fonema se ve afectada por la generación de

los fonemas adyacentes, y de modo parecido, el comienzo y final de las palabras

se ven afectados por las palabras que íes preceden y suceden. El reconocimiento

del lenguaje continuo también se ve condicionado por la frecuencia de habla (un

discurso rápido suele ser más difícil de reconocer). [2]

1.1.23 Técnicas de reconocimiento

Se utilizan una gran variedad de técnicas para llevar a cabo el reconocimiento de

voz, y a su vez hay diversos tipos de análisis y comprensión.

Típicamente el reconocimiento comienza con el muestreo digital de la voz, el

siguiente paso es el proceso de la señal acústica. Las técnicas más

frecuentes incluyen el análisis espectral; por ejemplo, análisis LPC (Linear

Predictive Coding, codificación lineal predictiva), MFCC (Mel Frequency Cepstral

Coefficíents), y otras.[3]

Page 17: ESCUELA POLITÉCNICA NACIONAL - Repositorio …bibdigital.epn.edu.ec/bitstream/15000/11809/1/T2300.pdf · de audio y video implementado en el robot, hacia un receptor remoto o televisor

El siguiente paso es el reconocimiento de fonemas, grupos de fonemas y

palabras. Este paso puede ejecutarse de varias formas, mediante DTW (Dynamic

Time Warping), HMM (Hidden Markov Modelling), NNs (Neural Networks, redes

neudonales), sistemas expertos y combinación de técnicas. Actualmente los

sistemas basados en HMMs son los más frecuentemente utilizados y la

aproximación más exitosa.

La mayoría de los sistemas se ayudan de algún tipo de conocimiento sobre el

lenguaje para ayudar al proceso de reconocimiento.

1.1.2.4 Reconocimiento del hablante (verificación y validación)

El reconocimiento del hablante es el proceso de reconocer automáticamente

quién está hablando en base a información individual incluida en las señales del

lenguaje. Pueden dividirse en identificación y verificación del hablante. La

identificación del hablante determina cuál de los hablantes registrados

proporciona un patrón dado de entre un grupo de hablantes conocidos. La

verificación del hablante acepta o rechaza la petición de identidad del hablante.

¿Es el hablante la persona que dice que es?

La tecnología de reconocimiento del hablante hace posible que la voz de un

hablante controle el acceso a servicios restringidos, por ejemplo, acceso

telefónico a la banca, servicios de base de datos, compras o correo de voz, y

acceso a material seguro.

Ambas tecnologías requieren que el usuario se registre en el sistema, es decir,

que de ejemplos de su lenguaje al sistema de modo que este pueda caracterizar o

aprender su patrón de voz. [4]

Page 18: ESCUELA POLITÉCNICA NACIONAL - Repositorio …bibdigital.epn.edu.ec/bitstream/15000/11809/1/T2300.pdf · de audio y video implementado en el robot, hacia un receptor remoto o televisor

1.1.3 TRATAMIENTO DEL HABLA

Se entiende como tratamiento de la palabra al conjunto de disciplinas que

estudian la manera de trasladar la forma de comunicación que se conoce como el

lenguaje hablado hacia las máquinas.

El Tratamiento de la palabra esta dividido entres partes importantes;

• Síntesis

• Codificación

• Reconocimiento

1.1.3.1 Síntesis de la señal vocal

Viene a ser la creación de señal vocal sintética, se desea que una máquina sea

capaz de expresarse emitiendo sonidos que se pueda entender como palabras

u oraciones. Esto conlleva a la comprensión total del proceso del habla, implica la

interacción de disciplinas en las que están incluidas la fisiología del órgano

humano así como también la lingüística.[5]

1.1.3.2 Codificación

La computadora debe ser capaz de procesar la información de tal forma que le

permita disponer de la posibilidad de almacenar señal vocal de una forma

eficiente y así comprimir la señal y/o transmitirla por un medio de ancho de

banda limitado.

1.1.3.3 Reconocimiento

Tal vez esta es la parte más complicada del tratamiento de la palabra, hacer

posible que la computadora sea capaz de escuchar y reconocer las palabras

emitidas por una persona. Involucra el desarrollo de algoritmos que sean capaces

Page 19: ESCUELA POLITÉCNICA NACIONAL - Repositorio …bibdigital.epn.edu.ec/bitstream/15000/11809/1/T2300.pdf · de audio y video implementado en el robot, hacia un receptor remoto o televisor

de realizar la comparación de patrones de voz entre palabras pronunciadas y las

palabras de un diccionario predeterminado

1.1.4 RECONOCEVUENTO DE LA VOZ

El reconocimiento de la voz constituye una parte importante del tratamiento def

habla. Las técnicas de reconocimiento más desarrolladas son aquellas

comúnmente usadas para el idioma inglés las cuales incluyen el Análisis de

Predicción Lineal (LPC) y el Alineamiento Temporal (DTW), estos algoritmos han

tenido éxito habiendo sido sometidos a pruebas bajo diversos ambientes.[6]

Debe tenerse en cuenta la importancia de desarrollar estas técnicas para el

idioma español pues las características lingüísticas difieren en forma marcada

cuando se requiera llevar hacia un reconocimiento más completo. El enfoque que

se ha dado en un principio ha sido el reconocer palabras aisladas, es decir que

las palabras se pronuncian entre pausas pequeñas de tal forma que el

procesamiento se realiza teniendo como unidades lingüísticas las palabras de un

vocabulario específico. Las unidades lingüísticas de cualquier idioma vienen a ser

más bien los fonemas y los dífonos por lo tanto un enfoque en este sentido seria

tal vez más apropiado si es que se desea llegar a vocabularios extensos. Sin

embargo el desarrollo aquí descrito puede considerarse en aplicaciones donde el

vocabulario no exceda de 50 palabras.

1.1.4.1 Naturaleza de la señal vocal

El análisis de la señal vocal se lleva cabo medíante un modelo que describe el

proceso del habla clasificando las señales en dos tipos:

« Las señales sonoras que se caracterizan por tener alta energía y contenido

frecuencial en el rango de los 300 Hz a 4 KHz las cuales se generan por

intermedio de las cuerdas vocales y además presentan cierta periodicidad

como se muestra en la Figura 1.1

Page 20: ESCUELA POLITÉCNICA NACIONAL - Repositorio …bibdigital.epn.edu.ec/bitstream/15000/11809/1/T2300.pdf · de audio y video implementado en el robot, hacia un receptor remoto o televisor

Figura 1.1 Señal sonora

Las señales no sonoras también conocidas como fricativas se caracterizan

por tener baja energía y espectro de frecuencia uniforme presentando

contaminación de ruido blanco como se muestra en la Figura 1.2

-^^II ' ' *Vlh\rt\ r|

Figura 1.2 Señal no sonora

Es así como la señal, dividida en dos partes, se modela como dos fuentes de

excitación que alimentan al sistema acústico que conforma el tracto vocal.

1.1.4.2 Modelado del tracto vocal

El modelado del tracto vocal se manifiesta como un filtro variable en el tiempo

cuyos parámetros varían de igual manera en función de ía acción consciente

que se realiza al pronunciar una palabra.

Ei filtro variable en el tiempo tiene dos posibles señales de entrada que

dependerán del tipo de señal, sonora o no sonora. Para señales sonoras la

excitación será un tren de impulsos de frecuencia controlada, mientras que para

las señales no sonoras la excitación será ruido blanco.

Page 21: ESCUELA POLITÉCNICA NACIONAL - Repositorio …bibdigital.epn.edu.ec/bitstream/15000/11809/1/T2300.pdf · de audio y video implementado en el robot, hacia un receptor remoto o televisor

El espectro de frecuencia de la señal vocal puede obtenerse a partir del producto

del espectro de ía excitación por la repuesta en frecuencia deí filtro.

El tracto vocal manifiesta un número muy grande de resonancias, sin embargo se

consideran solo las tres o cuatro primeras que toman el nombre de 'formantes' y

cubren un rango de -frecuencias entre TOOhz y 3,5 khz. Esto debido a que las

resonancias de alta frecuencia son atenuadas por ía característica frecuencia! deí

tracto que tiende a actuar como un filtro pasabajo con una caída de

aproximadamente -12 dB por octava.

Este modelo es una simplificación del proceso deí había. Los son idos fricativos no

se filtran por el tracto con la misma extensión en que lo hacen las señales sonoras

por ío que el modelo no es muy preciso para este tipo de señales. Además el

modelo supone que las dos señales pueden separarse sin considerar ninguna

interacción entre ellas, lo cual no es cierto ya que ía vibración de cuerdas vocales

es afectada por (as ondas de presión dentro deí tracto. Sin embargo estas

consideraciones pueden ser ignoradas resuítando el modelo lo suficientemente

adecuado. [7]

TONO:FUNDAMENTAL

GENERADOSDEJMPÜLSOS

PARÁMETROSDEL TRACTO

VOCAL

\} r

- '

PILTRO VARIABLEEN EL TIEMPO

voz

Figura 1.3 Modelo del tracto vocal

El kit posee dos modos de funcionamiento:

. El modo de ENTRENAMIENTO: permite grabar las palabras que

deberán ser reconocidas y que además no podrán ser fonéticamente

similares porque esto podrá ocasionar un conflicto y una mala

respuesta de reconocimiento; el tiempo de duración estimado para

cada palabra es de 2 segundos y la capacidad de palabras vana de

Page 22: ESCUELA POLITÉCNICA NACIONAL - Repositorio …bibdigital.epn.edu.ec/bitstream/15000/11809/1/T2300.pdf · de audio y video implementado en el robot, hacia un receptor remoto o televisor

10

acuerdo con el modo de reconocimiento que se quiera tener

(dependiente e independiente),

• El modo de ESCUCHAR CONTINUO es el que permite realizar e!

reconocimiento mismo de las palabras y permite siempre estar alerta de

la palabra ingresada al kit. Únicamente en este modo se podrá tener

señales de salida,

1.1.5.1 Características delKít

Este kit cuenta con una entrada de micrófono y una salida de parlante. La entrada

de micrófono permitirá que se le adiestre al sistema con las palabras que serán

reconocidas, mientras que el padante emitirá el numero de la posición en el cual

se encuentra ubicada la palabra reconocida. Este kit tiene la capacidad de

reconocer hasta 60 palabras en modo esclavo, y 15 palabras en modo stand

alone que puede estar dividido en 3 set de 5 palabras. Lo que permitiría construir

bancos de 5 palabras, es decir brindaría 15 señales de control con 15 palabras

reconocidas. Las palabras tendrán una duración de 2 seg. Siendo de fácil

adaptación para el instructor.

RSC-300/364Watchdqg

Tímer

\fQ PropositoGenera!

MemoriaExterna

Figura 1.4 Esquema del kií de reconocimiento de voz

Page 23: ESCUELA POLITÉCNICA NACIONAL - Repositorio …bibdigital.epn.edu.ec/bitstream/15000/11809/1/T2300.pdf · de audio y video implementado en el robot, hacia un receptor remoto o televisor

1.1.5.2 El RSC 300

11

*- o<1 -^

* - c v f O - = - w < O r > S -5o o a a p o a f i - 5 -

UJ

-tO ?5Q K*

3 * a £

A5E

A3[

^.......0.--»

3

4

56

7

8 RSC-300/3640 (64-lead TQFP}10

11

12

13

14

15

18l ^ £ £ $ í 8 í N P i ? 3 r t o i 8 & 8 8

47

46

45

44

4342

41

40

39

36

37

38

35

34

338 *" £í

«1PDN

|GND

O tft ~^ t^

O. O- D, CL

*" O t^ <O tíl•r- »- O o Oa a, ÍC a &

Figura 1.5 Esquema físico del mícrocontrolador RSC - 300

Este chip es utilizado para el reconocimiento de voz, como se puede observar en

el la Figura 1.5 cuenta con: conversores analógicos digitales, 2 señales de salida

tipo PWM, bus de datos y bus de direcciones de 64k y 2 puertos, PO y P1. Es

especialmente utilizado para el reconocimiento y reproducción de voz. Tiene una

gran similitud con el microcontrolador 8051 de Intel, además su set de

instrucciones (51 instrucciones) son similares y de igual uso que el

microcontrolador antes mencionado. [9]

1.1.5.3 Montaje de kit

En el montaje del kit se debe tomar muy en cuenta el lugar y la forma como se lo

va a ubicar, así el kit debe contar con una alimentación de 5 voltios o de 3

baterías de 1.5 V, para mayor seguridad conectar un diodo en serie antes de la

Page 24: ESCUELA POLITÉCNICA NACIONAL - Repositorio …bibdigital.epn.edu.ec/bitstream/15000/11809/1/T2300.pdf · de audio y video implementado en el robot, hacia un receptor remoto o televisor

12

entrada al sistema, de esta forma se protegerá de polarizaciones invertidas.

Además se debe tomar en cuenta los elementos extemos que van a estar

conectados, es decir, motores, osciladores externos, etc. Que afectaran a! kit en

su trabajo normal. Se tiene que tomar en cuenta la conexión de alimentación y

del parlante, estas deben estar colocadas de forma opuesta. Para evitar

problemas de reflejo electromagnético.

Otra condición del kit de reconocimiento de voz es que, las salidas tienen un

tiempo de 1 segundo en alto para reconocer la señal de control, por lo que será

necesario la instalación de un LATCH, el mismo que permitirá tener el dato

enviado por el kit, por más tiempo. Al momento de encender el sistema, este

tendrá las salidas en 1 lógico por alrededor de un segundo, característica que

puede afectar al resto de! sistema. Por esta razón el LATCH deberá ser habilitado

íuego de por lo menos 1 segundo de ser energizado el kit evitándose así cualquier

Falsa señal hacia el controiador principal.

1.1.5.4 Modos de operación

Dependiendo de cómo se origine las señales los modos de reconocimientos son:

• Dependiente del parlante (SD)

• Escuchando continuamente (CL)

Hay dos tipos de modo escuchando continuamente, palabra simple y palabra

múltiple.

Existen 3 pines de selección y actuación:

• Entrenamiento (TRAIN)

• Entrenamiento CL (CLTRAIN)

• Reconocimiento (RECOG)

Page 25: ESCUELA POLITÉCNICA NACIONAL - Repositorio …bibdigital.epn.edu.ec/bitstream/15000/11809/1/T2300.pdf · de audio y video implementado en el robot, hacia un receptor remoto o televisor

13

Estos pines serán accionados cuando el kit sea peseteado, así cuando se desee

cambiar de modo será necesario resetear o apagar e! módulo y de esta forma el

kit sabrá en que modo nuevo debe trabajar.

Tabla 1.1 Configuración de Pines

PIN

TRAIN

Circuito abierto

TRAIN a tierra con

R = 100Kohmios

CLTRAIN

A tierra con

R = 47kohmios

CLTRAIN

A tierra con

R = 680kohmios

RECOG

Circuito abierto

RECOG a tierra

R = 100Kohmios

TRABAJO

Entrenamiento SD relajado, más fácil de entrenar,

de sonidos similares

Entrenamiento SD estricto, más difícil de entrenar

similares, pero el reconocimiento es más exacto

no acepta palabras

no acepta sonido

Entrenamiento CL relajado

Entrenamiento estricto

Reconocimiento relajado SD CL, reconoce más palabras equivocadas

Reconocimiento estricto CL SD, reconoce menos

despreciar palabras entrenadas

palabras y podría

De acuerdo a esta tabla tanto el modo SD como el modo CL pueden trabajar con

niveles de exactitud denominados "relajado" y "estricto" donde dependiendo de la

aplicación serán de menor o mayor utilidad. Teniendo en cuenta que mientras

mayor exactitud en el reconocimiento de la palabra se requiera mayor será el

tiempo de respuesta del sistema para cualquiera de los dos modos. [10]

1.1.6 ENTRENAMIENTO DEL MODULO DE RECONOCIMIENTO DE VOZ

1.1.6.1 Modo SD

Para el entrenamiento en este modo el kit deberá ser configurado como tal,

cuando el pin de entrenamiento sea llevado a tierra por más de 10 mseg. El

entrenamiento comenzará, entonces, el Voice Direct iniciará el proceso de

Page 26: ESCUELA POLITÉCNICA NACIONAL - Repositorio …bibdigital.epn.edu.ec/bitstream/15000/11809/1/T2300.pdf · de audio y video implementado en el robot, hacia un receptor remoto o televisor

14

entrenamiento diciendo," say word X" donde X es el número de la palabra o frase

a ser entrenada, ía cual como se anota anteriormente no deberá ser mayor a 2

segundos y no podrá tener silencios mayores a 0.5 segundo.

Existen 4 razones por las cuales eí entrenamiento terminará, estas se citan a

continuación;

• Si no se responde con una palabra en el momento que el módulo lo

requiera (tiempo máximo de espera del modulo 3 segundos).

• Cuando e! pin de entrenamiento es presionado una segunda vez durante el

proceso adiestramiento.

• Cuando tres errores concurrieran durante el proceso de entrenamiento,

siendo considerados como errores palabras fonéticamente similares,

palabras con recepción de mala calidad, palabras demasiado largas.

• O simplemente cuando todas las palabras ya han sido entrenadas.

Para volver al modo de entrenamiento o reentrenar al módulo es necesario llevar

al pin de entrenamiento a tierra por más de 100 milisegundos. Si el módulo ya ha

sido entrenado con todas las palabras ingresará a un modo de reentrenamiento

caso contrario entrenara las palabras faltantes para completar el set de 15

instrucciones.

El módulo no permitirá realizar el borrado de una palabra independientemente de

la otras, la única posibilidad que presta es la de borrar en conjunto todo el set de

15 instrucciones.

Page 27: ESCUELA POLITÉCNICA NACIONAL - Repositorio …bibdigital.epn.edu.ec/bitstream/15000/11809/1/T2300.pdf · de audio y video implementado en el robot, hacia un receptor remoto o televisor

i

MODO DE OPERACIÓN SD

Botón dereconocimientode palabra

Figura 1.6 Operación en modo SD

Luego de haber ingresado la primera palabra al módulo este dirá "repeat",

entonces se deberá ingresar nuevamente la palabra. Y si la misma es aceptada el

Voice Direct II continuará diciendo "say word X+1". Si la palabra no fue aceptada

por el módulo este dará un mensaje causal de error y la salida o pin de error se

pondrá en alto por un segundo. El usuario tiene 3 intentos para ingresar la palabra

antes de que el módulo salga del modo de entrenamiento. Así mismo e! usuario

podrá salir de este modo en cualquier momento llevando el pin de entrenamiento

a tierra o llevando el pin de reconocimiento también a tierra.

Page 28: ESCUELA POLITÉCNICA NACIONAL - Repositorio …bibdigital.epn.edu.ec/bitstream/15000/11809/1/T2300.pdf · de audio y video implementado en el robot, hacia un receptor remoto o televisor

16

Tabla 1.2 Ejemplo de entrenamiento en modo SD

ACCIÓN

Voice Direct II:

Usuario:

Voice Direct II:

Usuario:

Voice Direct II:

Usuario:

Voíce Direct II:

Usuario:

Voice Direct II:

Usuario:

Voice Direct I i:

Usuario:

ACCIÓN

PRESIONAR BOTÓN ENTRENAMIENTO

"Say word one"

"encender"

"Repeat"

"encender"

"Say word two"

"apagar"

"Repeat"

"apagar"

"Say word Three"

"luces"

"Repeat"

"luces"

PRESIONAR BOTÓN ENTRENAMIENTO

INICIO DEENTRENAMIENTO

Entrenando palabra SD 1

Entrenando palabra SD 2

Entrenando palabra SD 3

PARA ENTRENAMIENTO

1.1.6,2 Modo CL de palabra simple

En este modo de entrenamiento será necesario utilizar 2 pines, el pin de

entrenamiento y eí pin de entrenamiento CD. Este modo permite que e! usuario

tenga una palabra de inicio para el reconocimiento de las 15 instrucciones. Para

iniciar el entrenamiento CL por más de 100 mili segundos seguidamente el kít de

conocimiento de voz, pedirá que se ingrese la palabra de entrenamiento CL. Una

vez aceptada esta palabra se deberá llevar el pin de entrenamiento a tierra e

ingresar la palabra de entrenamiento SD; para entrenar una nueva palabra SD se

debe tomar en cuenta que el pin de entrenamiento nuevamente sea llevado a

tierra.

Page 29: ESCUELA POLITÉCNICA NACIONAL - Repositorio …bibdigital.epn.edu.ec/bitstream/15000/11809/1/T2300.pdf · de audio y video implementado en el robot, hacia un receptor remoto o televisor

17

OPERACIÓN EN MODOSIMPLE PALABRA. PALABRA SD1

PALABRA SD

PALABRA SD 3

Figura 1.7 Operación en modo CL de simple palabra

Tabla1.3 Ejemplo de entrenamiento en modo CL de simple palabra

ACCIÓNVoice Direct II:

Usuario:

Voice Direct 11:

Usuario:

ACCIÓN

Voice Direct II:

Usuario:

Voice Direcí II:

Usuario:

ACCIÓN

Voice Direct II:

Usuario:

PRESIONAR BOTÓN ENTRENAMIENTOCL

"Say word one"

"sistema"

"Repeat"

"sistema"

PRESIONAR BOTÓN ENTRENAMIENTOSD

"Say word one"

"encender"

"Repeat"

"encender"

PRESIONAR BOTÓN ENTRENAMIENTOSD

"Say word two"

"apagar11

INICIO DE ENTRENAMIENTOCL

Entrenando palabra CL

INICIO DE ENTRENAMIENTOSD

Entrenando palabra SD 1en e) set

INICIO DE ENTRENAMIENTOSD

Entrenando palabra SD 2en el set

Page 30: ESCUELA POLITÉCNICA NACIONAL - Repositorio …bibdigital.epn.edu.ec/bitstream/15000/11809/1/T2300.pdf · de audio y video implementado en el robot, hacia un receptor remoto o televisor

Voice Direct II:

Usuario:

ACCIÓN

Voice Direct II:

Usuario:

Voice Direct II:

Usuario:

"Repeat"

"apagar"

PRESIONAR BOTÓN ENTRENAMIENTOSD

"SaywordThree"

"luces"

"Repeat"

"luces"

INICIO DE ENTRENAMIENTOSD

Entrenando palabra SD 3en el seí

1.1.6.3 Modo CL de múltiple palabra

La secuencia de entrenamiento en este modo es similar a la del modo de

entrenamiento CL de simple palabra con la única diferencia de que en este caso

se tiene la posibilidad de ingresar 3 palabras CL, después de cada una de las

cuales se pueden entrenar hasta 5 palabras CL, formando 3 set de 5 palabras SD

cada una.

Una de las precauciones que hay que tener en cuenta en este modo de

entrenamiento es que lastres palabras CL deberán ser fonéticamente diferentes y

preferentemente de diferente número de silabas. La similitud de las palabras SD

no tendrá importancia si se produce en diferentes sets de entrenamiento ya que,

el módulo es este modo verificará similitud de las palabras SD solamente dentro

de cada set de 5 palabras.

Page 31: ESCUELA POLITÉCNICA NACIONAL - Repositorio …bibdigital.epn.edu.ec/bitstream/15000/11809/1/T2300.pdf · de audio y video implementado en el robot, hacia un receptor remoto o televisor

19

MODO DE OPERACIÓN CLMULTIPALABRA

PALABRA CL1

PALABRA CL

PALABRA CL3

Fígura1.8 Operación en modo CL de múltiple palabra

Tabla1.4 Ejemplo de entrenamiento en modo CL de múltiple palabra

ACCIÓN

Voice Dírect II:

Usuario:

Voice Direct U:

Usuario:

ACCIÓN

Voice Direct II:

Usuario:

Voice Direcí II:

Usuario:

ACCIÓN

Voice Direct II:

Usuario:

PRESIONAR BOTÓN ENTRENAMIENTOCL

"Say word one"

"sistema"

"Repeat"

"sistema"

PRESIONAR BOTÓN ENTRENAMIENTOSD

"Say word one"

"encender"

"Repeaí"

"encender"

PRESIONAR BOTÓN ENTRENAMIENTOSD

"Say word two"

"apagar"

INICIO DE ENTRENAMIENTOCL

Entrenando palabra CL delprimer seí

INICIO DE ENTRENAMIENTOSD

Entrenando palabra SD 1en el set 1

INICIO DE ENTRENAMIENTOSD

Entrenando palabra SD 2en el sel 1

Page 32: ESCUELA POLITÉCNICA NACIONAL - Repositorio …bibdigital.epn.edu.ec/bitstream/15000/11809/1/T2300.pdf · de audio y video implementado en el robot, hacia un receptor remoto o televisor

20

Voice Direct 11:

Usuario:

ACCIÓN

Voice Direct II:

Usuario:

Voice Direct II:

Usuario:

ACCIÓNVoice Direct II:

Usuario:

Voice Direct II:

Usuario;

"Repeat"

"apagar"

PRESIONAR BOTÓN ENTRENAMIENTOSD

"Say word Three"

"luces"

"Repeat"

"luces"

PRESIONAR BOTÓN ENTRENAMIENTOCL

"Say word one"

"sistema"

"Repeat"

"sistema"

INICIO DE ENTRENAMIENTOSD

Entrenando palabra SD 3en el set 1

INICIO DE ENTRENAMIENTOCL

Entrenando palabra CL delsegundo set

1.1.7 RECONOCIMIENTO DE LAS PALABRAS EN EL MODULO

1.1.7.1 Modo SD

Para realizar el reconocimiento en este modo se deberá llevar el pin de

reconocimiento a tierra por al menos 100 [ms]. El reconocimiento empezará

cuando el módulo diga "say a word", si la respuesta dada por el usuario no es

reconocida el Voice Direct dirá "word not reconoízed", y automáticamente saldrá

del modo de reconocimiento. Por el contrario si concuerda con una de las

palabras entrenadas uno o dos de los 8 pines de salida se activará y un mensaje

de voz indicara la respuesta concordante.

Si el conjunto contiene 8 o menos elementos de reconocimiento las salidas serán

directas caso contrario deberán ser codificadas.

Page 33: ESCUELA POLITÉCNICA NACIONAL - Repositorio …bibdigital.epn.edu.ec/bitstream/15000/11809/1/T2300.pdf · de audio y video implementado en el robot, hacia un receptor remoto o televisor

21

Para cada palabra SD que el módulo deberá reconocer, el chip monitoreará el

nivel de ruido de fondo, y dará una alerta de voz si el ruido es demasiado alto

como para reconocer una palabra. Cave señalar que el Voice Direct II trabaja bien

con altos niveles de ruido de fondo estables, por encima de los 80 dB pero puede

presentar errores si el ruido no es estable.

Tabla 1,5 Salidas de control del módulo en modo SD

RECONOCIMIENTODE PALABRA

PALABRA 01 SD

PALABRA 02 SD

PALABRA 03 SD

PALABRA 04 SD

PALABRA 05 SD

PALABRA 06 SD

PALABRA 07 SD

PALABRA 08 SD

PALABRA 09 SD

PALABRA 10SD

PALABRA 1 1 SD

PALABRA 12 SD

PALABRA 1 3 SD

PALABRA 1 4 SD

PALABRA 1 5 SD

SAL1

A

A

SAL2

A

A

SAL3

A

A

SAL4

A

A

SAL5

A

A

SAL6

A

A

SAL7

A

A

SAL8

A

A

A

.A

A

A

A

ANota: la letra "A" indica que la salida esta activa.

1.1.7.2 Modo CL de simple palabra

De igual manera que en el modo anterior el pin de reconocimiento deberá ser

llevado a tierra para que el proceso se inicie, e! cual requerirá que el usuario

ingrese la palabra CL únicamente, caso contrario se producirá un error y el

módulo se saldrá de este modo. Si la palabra CL fue ingresada con éxito se abrirá

una ventana de espera de 3 segundos para ingresar cualquiera de las palabras

SD entrenadas, de igual manera, de no tener éxito con la palabra SD se producirá

un error y automáticamente se saldrá de este modo.

Page 34: ESCUELA POLITÉCNICA NACIONAL - Repositorio …bibdigital.epn.edu.ec/bitstream/15000/11809/1/T2300.pdf · de audio y video implementado en el robot, hacia un receptor remoto o televisor

Tabla 1.7 Salidas de control del módulo en modo CL de múltiple palabra

PALABRA CL

PALABRA CL

A

PALABRA CL

A

PALABRA CL

A

PALABRA CL

A

PALABRA CL

A

PALABRA CL

B

PALABRA CL

B

PALABRA CL

B

PALABRA CL

B

PALABRA CL

B

PALABRA CL

C

PALABRA CL

C

PALABRA CL

C

PALABRA CL

C

PALABRA CL

C

PALABRA SD

PALABRA -SD

1

PALABRA SD

2

PALABRA SD

3

PALABRA SD

4

PALABRA SD

5

PALABRA SD

1

PALABRA SD

2

PALABRA SD

3

PALABRA SD

4

PALABRA SD

5

PALABRASD

1

PALABRA SD

2

PALABRA SD

3

PALABRA SD

4

PALABRA SD

5

SAL1

A

A

A

A

A

SAL2

A

A

A

A

A

SAL3

A

A

A

A

A

SAL4

A

A

A

SAL5

A

A

A

SAL6

A

A

A

SAL7

A

A

A

SAL8

A

A

A

Nota; la letra "A" indica que la salida esta activa.

Page 35: ESCUELA POLITÉCNICA NACIONAL - Repositorio …bibdigital.epn.edu.ec/bitstream/15000/11809/1/T2300.pdf · de audio y video implementado en el robot, hacia un receptor remoto o televisor

24

1.1.7.4 Borrado de las plantillas

Para realizar el borrado de fas instrucciones entrenadas en el módulo se debe

llevar a tierra ambos pines el de entrenamiento y el de reconocimiento por más de

100 milisegundos; luego de lo cual el Voíce Direct II dirá "Memory Erased",

además e! pin de error se activara por un segundo, cabe señalar que no se puede

realizar el borrado de palabras individuales.

1.2 MJNDAMENTOS BÁSICOS SOBRE EL EÜNCiONAMÍENTO

DE LOS SENSORES DE PROXIMIDAD

Tal como una persona necesita de sus sentidos para guiarse, un mecanismo

robótico necesita de sensores para saber en donde esta. Así en el mercado

existen gran cantidad de sensores que permiten realizar estas funciones, como

los sensores de proximidad de fin de carrera, sensores de proximidad por medio

de ultrasonido, sensores de proximidad con luz infrarroja, sensores de proximidad

de video. A continuación se realizará un análisis de cada uno de los sensores,

enfocando más en los sensores de proximidad de luz infrarroja, sensores que son

los usados en este prototipo.

1.2.1 SENSORES DE PROXIMIDAD DE FIN DE CARRERA

Los sensores de proximidad de tipo fin de carrera son los más utilizados en los

mecanismos móviles, ya que poseen un modo sencillo de funcionamiento basado

en un interruptor, siendo así más versátiles al momento de ser instalados, pero el

inconveniente que presentan para el prototipo es que debe necesariamente tener

contacto físico con un obstáculo para reaccionar, lo que implicaría que el prototipo

debería chocar con los obstáculos para luego evadirlos. Además necesita de un

circuito eliminador de rebotes para que el receptor, tome la señal correcta en el

momento del accionamiento.

Page 36: ESCUELA POLITÉCNICA NACIONAL - Repositorio …bibdigital.epn.edu.ec/bitstream/15000/11809/1/T2300.pdf · de audio y video implementado en el robot, hacia un receptor remoto o televisor

25

Vcc

SENALEMITIDA

CIRCUITO —ELIMINADOR DE

REBOTES

Figura1.9 Esquema deí funcionamiento y circuito de un sensor de fin de carrera

Como se puede observar en la figura 1.9 este sensor consta de dos contactos,

uno normalmente abierto y uno normalmente cerrado, ios cuales proporcionaran

la salida deseada* luego de ser activados.

1.2.2 SENSORES DE PROXIMIDAD POR MEDIO DE ULTRASONIDO

Este upo de sensores en la actualidad son los de mayor uso, pues permiten una

mejor guía a los robots autómatas. Así mismo estos sensores trabajan con el

principio de guía que tienen los murciélagos, entonces necesitan generar una

señal en alta frecuencia que es emitida al espacio y luego recibirla tomando en

cuenta el tiempo y ia intensidad de la señal de retorno; y de acuerdo a estos

datos se conocerá cual es la distancia a la que se encuentra un posible obstáculo.

La ventaja de este sobre el de final de carrera es que no necesita contacto físico

con el objeto para saber que el mismo esta cerca, además se puede tener una

noción de como es el entorno en el que el prototipo se encuentra.

Page 37: ESCUELA POLITÉCNICA NACIONAL - Repositorio …bibdigital.epn.edu.ec/bitstream/15000/11809/1/T2300.pdf · de audio y video implementado en el robot, hacia un receptor remoto o televisor

26

SENSOR

EMISOR

FIGURA 1.10 Sensores de ultrasonido

RECEPTOR

La desventaja de este tipo de sensores dentro del diseño del prototipo

ímplementado tiene que ver básicamente con el tema de espacio físico, consumo

de energía, sobre dimensíonamiento y costo que implica tener uno de estos

sensores en el mismo, ya que primeramente el generar y recibir señales de alta

frecuencia obliga a utilizar amplificadores que aumentan la circuitería, ocupando

más espacio físico dentro del prototipo, además toda esta circuitería ocasionará

mayor consumo de energía. Por último el prototipo utilizará los sensores de

proximidad solo en un funcionamiento autónomo que no será el más utilizado,

pues todo el control se realiza en modo manual haciendo que estos sensores

sean usados momentáneamente y por ende todas sus virtudes desperdiciadas.

Sin tomar en cuenta también que su costo es más elevado que el de los sensores

implementados en el prototipo.

1.2.3 SENSORES DE PROXIMIDAD CON LUZ MFRAROJA

Este tipo de sensores basan su funcionamiento en la generación y recepción de

luz infrarroja utilizando un diodo emisor y un fototransistor que recibe dicha luz. Al

ser ubicados ambos dispositivos en un mismo punto podrán detectar objetos

próximos con el rebote que la luz hace sobre el posible obstáculo.

Antiguamente este tipo se sensores se veía afectado por la luz externa del

ambiente, mas con los adelantos de la tecnología este ya no es un problema ya

que se construyo un circuito integrado que es insensible al ambiente extemo

proporcionando mayor confianza y versatilidad en los sensores por infrarrojo.

Page 38: ESCUELA POLITÉCNICA NACIONAL - Repositorio …bibdigital.epn.edu.ec/bitstream/15000/11809/1/T2300.pdf · de audio y video implementado en el robot, hacia un receptor remoto o televisor

27

Este circuito integrado es el ISF471 de la Sharp. [11] que además de proporcionar

esta ventaja posee internamente el oscilador que requiere el diodo emisor

reduciendo ef circuito del sensor a un potenciómetro de calibración de la distancia

de detección deseada. Por último cabe señalar que el consumo de energía es

mínimo y el voltaje de alimentación pequeño.

SENSOR

Figura! 11 Esquema y tamaño de un sensor de tipo infrarrojo

1.2.3.1 Descripción del funcionamiento del integrado ISF471

VccSV

ENCAPSUUADO

Figura 1.12 Diagrama de instalación del circuito, y encapsulado del mismo

El sensor basado en el dispositivo Sharp IS471F, tiene la facultad de ser inmune

a interferencias de luz del ambiente. Además este sensor incorpora un

modulador/demodulador integrado en su carcasa a través del cual se controla al

diodo emisor de infrarrojo externo, modulando la señal que este emitirá y que será

captada por el mismo. Cuando un objeto se sitúa frente del conjunto

emisor/receptor parte de la luz emitida es reflejada y demodulada para activar la

salida total que pasará a nivel bajo si la señal captada es suficientemente fuerte.

Page 39: ESCUELA POLITÉCNICA NACIONAL - Repositorio …bibdigital.epn.edu.ec/bitstream/15000/11809/1/T2300.pdf · de audio y video implementado en el robot, hacia un receptor remoto o televisor

28

El uso de luz IR modulada tiene por objeto hacer al sensor relativamente inmune

a las interferencias causadas por la luz normal de una bombilla o la luz del sol.

Como puede verse en la figura 1.12, el sensor se alimenta por los pines 1 y 3 los

cuales corresponden a Vcc y Gnd respectivamente, el pin 2 es ia salida del

conjunto o salida de control y el pin 4 es la salida que modula al led emisor

externo.

Mediante el potenciómetro P1 se varia la distancia a ia que es detectado el objeto,

mientras más baja sea la resistencia de este potenciómetro, más intensa será la

luz emitida por el diodo de IR y por lo tanto mayor la distancia a la que puede

detectar el objeto,

1.2.4 SENSORES DE VIDEO

Este tipo de sensores son los más sofisticados en la actualidad y los de mayor

costo y mayor tamaño. Se basan en el tratamiento de imágenes mediante un

microcontrolador. Este microcontrolador trabaja de manera muy rápida

comparando las señales del instante con señales anteriores, es decir que utiliza

tecnología de inteligencia artificial. Por esta razón se deberá iniciaImente proceder

al adiestramiento del sistema, luego este podrá reconocer las imágenes.

El método desarrollado barre la imagen buscando aquellos píxeles con una

textura correspondiente a la de la imagen guardada, determinando cuales de ellos

constituyen una hipótesis aceptable de imagen.

Page 40: ESCUELA POLITÉCNICA NACIONAL - Repositorio …bibdigital.epn.edu.ec/bitstream/15000/11809/1/T2300.pdf · de audio y video implementado en el robot, hacia un receptor remoto o televisor

29

Figura 1.13 Forma de digitalización en los sensores de video.

Entonces mediante filtros se logrará ir tomando las raíces del gráfico. Para así en

ei momento en ei que se produzca la comparación, realizarla con una que tenga

la misma forma, o los mismos píxeles. [12]

1.3 PROTOTIPOS YA IMPLEMENTADOS QUE UTILIZAN

SISTEMAS DE VIDEO

Dentro de la rebotica mundial existen prototipos ya implementados que utilizan

sistemas de video parecidos al desarrollado en este proyecto. A continuación se

citan algunos de ellos con su respectivo funcionamiento:

El RMTO I (Robot Móvil Teleoperado) fue ei resultado del proyecto de grado en

Ingeniería de sistemas desarrollado por Alexander Cerón en la Universidad

Nacional de Colombia Sede Bogotá, está equipado con una cámara de video y es

operado a distancia por medio de un enlace inalámbrico de radiofrecuencia. La

operación del vehículo se realiza a través de un programa de computador dotado

de una interfaz gráfica de usuario que permite enviar comandos de movimiento al

i i>_< w M i iicíi it«_* ticr ica- u¿ai t iai a j - ^ - ui l

radio frecuencia para la transmisión al computador. El tipo de enlace es el sistema

Page 41: ESCUELA POLITÉCNICA NACIONAL - Repositorio …bibdigital.epn.edu.ec/bitstream/15000/11809/1/T2300.pdf · de audio y video implementado en el robot, hacia un receptor remoto o televisor

de desarrollo GP_Bot dispone de un conector para un módulo de radio Aurel y en

el CRMcon los radio-modem disponibles en el mercado

Figura 1.15 Observer (Foto tomada de la referencia [13])

El proyecto más relevante en este tiempo es el prototipo enviado a Marte llamado

ROVER SPiRIT. Este sistema cuenta con 3 cámaras ubicadas estratégicamente,

las cuales envían las señales de video hacia la tierra, para ser estudiados. Este

sistema fue construido por científicos de la NASA, los mismos que crearon dos

prototipos similares, para la exploración espacial, el Spirií y el Oportunity[14].

M» VÍT* ff.

Figura 1.16 Spirit (Foto tomada de la pagina web de la nasa)

Page 42: ESCUELA POLITÉCNICA NACIONAL - Repositorio …bibdigital.epn.edu.ec/bitstream/15000/11809/1/T2300.pdf · de audio y video implementado en el robot, hacia un receptor remoto o televisor

32

Estos son algunos de los prototipos construidos para la exploración, como el

presentado en este proyecto de titulación.

Page 43: ESCUELA POLITÉCNICA NACIONAL - Repositorio …bibdigital.epn.edu.ec/bitstream/15000/11809/1/T2300.pdf · de audio y video implementado en el robot, hacia un receptor remoto o televisor

33

CAPITULO 2

2 DISEÑO DESABOLLO E 1MPLEMENTACION BEL

HARDWARE

2.1 FUNCIONAMIENTO GENERAL

Dentro de este capítulo se explicará todo acerca de los diseños realizados y las

partes implementadas en el prototipo hasta conseguir su ensamblaje tota!.

Primeramente hay que señalar todas las funciones que deber cumplir el

prototipo por medio de órdenes de voz dadas por el usuario

• El prototipo tiene 2 modos de funcionamiento que son manual y

automático, estos modos son seleccionados por el usuario medíante

comandos de voz

• En el modo automático el robot explorará el medio de manera autónoma

evadiendo objetos en su recorrido para lo cual se deberá utilizar

sensores de proximidad e ímplementarlos dentro de los puntos más

representativos de su estructura, estos indicarán la presencia de

obstáculos al microcontrolador el cual tomará la decisión de movimiento

para evadirlos. Además deberá realizar la transmisión de audio y video

del medio donde se encuentre, para lo cual se colocará una cámara con

un transmisor de audio y video inalámbrico, el mismo que transmitirá la

señal constantemente a un receptor, que podrá ser un televisor

cualquiera.

• En modo manual el prototipo debe esperar las ordenes del usuario

dando la posibilidad de avanzar: adelante: atrás; derecha; izquierda;

para lo cual se debe diseñar los controladores para los motores de que

permiten e! movimiento del mismo. Además durante este modo la

cámara tiene la capacidad de moverse -en los dos grados de libertad,

permitiendo así una panorámica del ambiente en el que se encuentra

Page 44: ESCUELA POLITÉCNICA NACIONAL - Repositorio …bibdigital.epn.edu.ec/bitstream/15000/11809/1/T2300.pdf · de audio y video implementado en el robot, hacia un receptor remoto o televisor

34

explorando el prototipo. Este movimiento se lo realiza medíante dos

servomotores que gobiernan los 2 grados de libertad de la cámara.

En este modo se podrá sujetar objetos con una pinza, la cual posee 1

grado de libertad y el movimiento que permite abrir y cerrar la misma. Al

igual que la cámara estos movimientos son controlados por medio de

. dos servomotores que están acoplados a la pinza

De igual manera en este modo el prototipo deberá transmitir audío y

video continuamente.

2.2 íffiQÜEIUMDENTOS MECÁNICOS

El prototipo desarrollado en e! presente proyecto posee elementos mecánicos y

electromecánicos que le permiten realizar todos los movimientos, tanto de

locomoción en cuatro direcciones, como los movimientos de la cámara en

cuatro direcciones y de la pinza en 2 direcciones.

2.2.1 EVJPLEMENTACION DE VEHÍCULO MOTORIZADO TJÍO ORUGA

El robot explorador utiliza como chasis de su estructura el caparazón de un

vehículo tipo oruga con tracción diferencial, es decir un motor DC con juego de

piñones (motor-reductor) para cada oruga. Este chasis se constituye en el

soporte del robot, en donde es ensamblarán todos los elementos constitutivos

del prototipo.

Page 45: ESCUELA POLITÉCNICA NACIONAL - Repositorio …bibdigital.epn.edu.ec/bitstream/15000/11809/1/T2300.pdf · de audio y video implementado en el robot, hacia un receptor remoto o televisor

35

Figura 2.1 Chasis del Robot; relación de tamaño con un marcador común

Figura 2.2 Chasis dei robot vista frontal

Figura 2.3 Chasis del robot vista posterior

Page 46: ESCUELA POLITÉCNICA NACIONAL - Repositorio …bibdigital.epn.edu.ec/bitstream/15000/11809/1/T2300.pdf · de audio y video implementado en el robot, hacia un receptor remoto o televisor

36 12.2.2 CÁMARA MÓVIL

Este prototipo utiliza una cámara infrarroja para visión nocturna del tipo SXKSX

300 ensamblada en una estructura constituida por dos servomotores que

permiten a la misma realizar un giro posicionado de arriba hacia abajo y de

vista delantera y posterior respecto del vehículo en un ángulo máximo de 180

grados. A continuación se indican características técnicas de la cámara.

Tabla 2.1 Características Técnicas de la Cámara

MODELO

ALIMENTACIÓN

CORRIENTE

MAX

ENFOQUE

SXKSX 300 VISION NOCTURNA

6 LEDS INFRARROJOS

12VDC

25mA

MANUAL

Figura 2.4 Cámara Infrarroja; relación tamaño con un marcador común

Page 47: ESCUELA POLITÉCNICA NACIONAL - Repositorio …bibdigital.epn.edu.ec/bitstream/15000/11809/1/T2300.pdf · de audio y video implementado en el robot, hacia un receptor remoto o televisor

37

2.2.3 IMPLEMENTACION PINZA PARA SUJETAR OBJETOS

La pinza implementada para sujetar objetos esta constituida por un juego de

dos servomotores ensamblados en una estructura móvil en forma de pinza que

permite sujetar un pequeño objeto de un diámetro máximo de 32mm, Posee

dos movimientos, uno que le permite abrir o cerrar la pinza. Y otro permite girar

(a pinza para sujetar objetos dispuestos paralelamente a la abertura de ia

misma.

Figura 2.5 Pinza para sujetar objetos; relación tamaño con un marcador común

Figura 2,6 Pinza para sujetar objetos (2 movimientos) vista frontal

Page 48: ESCUELA POLITÉCNICA NACIONAL - Repositorio …bibdigital.epn.edu.ec/bitstream/15000/11809/1/T2300.pdf · de audio y video implementado en el robot, hacia un receptor remoto o televisor

38

2.3 IffiQlJEJRlMlENTOS ELÉCTRICOS Y ELECTRÓNICOS

Todos los elementos electromecánicos y electrónicos que permiten el

funcionamiento conjunto del prototipo están gobernados por un

microcontroiador PIC que será el encargado de administrar el funcionamiento

de los actuadores obedeciendo las órdenes recibidas a través del kít de

reconocimiento de voz que a su vez será la interfaz entre el usuario y el robot.

f APAGADO PARAALIMENTACIÓN OEI LOS SENSORES .

MICRO

R RA ¿ B

,.16F

r

ONTROL

iDOR

ru

i ,i

ii

v 1

1]11

fI

"7T~V _

74LS373

MtCRGPRGCESADORDE

RECONOCIMIENTODE VOZ

VOtCEDIRECTH

E N T R A D A

74LS24

SENSORESEXTERNOS

SENSOREStNFRARQJOSY DE FINALDE CARRERA

74LS373

MOTORESSERVO

MOTORES

S A L Í D A

.Figura 2.7 Esquema del Hardware del Robot Explorador tipo Oruga

Page 49: ESCUELA POLITÉCNICA NACIONAL - Repositorio …bibdigital.epn.edu.ec/bitstream/15000/11809/1/T2300.pdf · de audio y video implementado en el robot, hacia un receptor remoto o televisor

2.3.1 DISEÑO DE TARJETA DE CONTROL MADRE

La tarjeta madre es la que realiza el control del robot y permite tomar las

decisiones de movimiento de acuerdo con la lógica de programación del

elemento "inteligente" que para este caso es el controlador PIC 16F876.

2.3.1.1 PIC 16F876

A continuación se describe ei nombre y la función de cada uno de los pines

que conforman el microcontrofador Pie 16F876

Tabla 2.2 Recursos Utilizados

(NOMBRE DEL PIN) Na DEL PIN |TIPO

ODC1/CLKIN

OSC2/CLKOUT

MCLR/Vpp

9

10

1

I

O

I/P

TIPO DEAMPLIFICACIÓN

ST/CMOS

ST

DESCRIPCIÓN

Entrada del cristaloscilador/entrada externa de lafuente del reloj

salida del cristal oscilador

reset del chip cuando esta enbajo/voltaje de entrada deprogramación

PUERTO A B1D1RECCIONAL I/O

RAO/ANO

RA1/AN1

RA2/AN2/VREF-

RA3/AN3A/REF+

RA4/TOCK1

RA5/SS/AN4

2

3

4

5

6

7

I/O

I/O

I/O

I/O

I/O

I/O

TTL

TTL

TTL

TTL

ST

TTL

Activación de sensoresinfrarrojos

Activación de recepción depalabra del kit de reconocimiento

de voz

Activación de servomotores

Sensor de final de carrera de lapinza

Aviso de envió de palabra del kitde reconocimiento de voz

Encendido/ Apagado

PUERTO B BIDIRECCIONAL I/O

Page 50: ESCUELA POLITÉCNICA NACIONAL - Repositorio …bibdigital.epn.edu.ec/bitstream/15000/11809/1/T2300.pdf · de audio y video implementado en el robot, hacia un receptor remoto o televisor

40

RBO/INT

RB1

RB2

RB3/PGM

RB4

RB5

RB6/PGC

RB7/PGD

21

22

23

24

25

26

27

28

I/O

I/O

I/O

I/O

I/O

I/O

!/O

I/O

TTL/ST

TIL

TTL

TTL

TTL

TTL

TTL/ST

TTL/ST

Pin 1 Voice Direct/Aviso deObstáculo al Frente

Pin 2 Voice Direct/Aviso deObstáculo o hueco a la derecha

Pin 3 Voice Direct/Aviso deObstáculo o hueco a la izquierda

Pin 4 Voice Direct

Pin 5 Voice Direcí

Pin 6 Voice Direct

Pin 7 Voice Direct

Pin 8 Voíce Direct

PUERTO C BIDIRECCIONAL I/O

RCO/T1OSO/T1CK1

RCimOSi/CCP2

RC2/CCP1

RC3/SCK/SCL

RC4/SCK/SCÍ/SDA

RC5/SDO

RC6/TX/CK

RC7/RX/DT

VSS

VDD

11

12

13

14

15

16

17

18

8,19

20

I/O

I/O

I/O

l/O

I/O

l/O

l/O

l/O

P

P

ST

ST

ST

ST

ST

ST

ST

ST

Activa motor DC Izquierdo

Activa motor DC Derecho

Activa reversa en motor CDIzquierdo

Activa reversa en motor CDDerecho

Servomotor de Pinza(Abrir Cerrar)

Servomotor de Pinza(Horizontal Vertical)

Servomotor de Cámara(Arriba Medio Abajo)

Servomotor de Cámara(Frente Posterior)

Referencia o Tierra

Voltaje de polarización

Page 51: ESCUELA POLITÉCNICA NACIONAL - Repositorio …bibdigital.epn.edu.ec/bitstream/15000/11809/1/T2300.pdf · de audio y video implementado en el robot, hacia un receptor remoto o televisor

41

I: EntradasO: SalidasI/O: Entrada/SalidaTTL: Entrada TTLP: AlimentaciónST: Entrada Schmitt Trigger

MCLR/VPP-RAO/ANO-RA1/AN1

RA2/AN2/VREF--RA3/AN3A/REF-*-"

RA4/TQCKI-RA5/AN4/SS'

VSS-OSC1/CLKIN-

OSC2/CLKOUT-RcomosorriCKi-

RC1/T1OSI/CCP2*

RC2/CCP1-RC3/SCK/SCL-

cccccccccccccc

"12

34

5

6789

101112

1314

w

co

oo

££oo1 1LL_

oQ.

28|2726

25|24Í23Í22Í21 120|19]

17|16|

1S|

RB7/PGDRB6/PGCRB5RB4RB3/PGMRB2RB1RBO/INTVDDVssRC7/RX/DTRC6/TX/CK

RC5ÍSDO

RC4/SDI/SDA

Figura 2.8 Mícrocontrolador pie 16F876

Además se han colocado BUFFERs y LATCHs que se tomarán como entradas

y salidas del mícrocontrolador; en las entradas para ampliar su número, y en

las salidas para proteger los pines del mícrocontrolador Pie de posibles sobre

corrientes por cortocircuitos. Teniéndose así el diagrama esquemático

mostrado en la figura 2.9

Page 52: ESCUELA POLITÉCNICA NACIONAL - Repositorio …bibdigital.epn.edu.ec/bitstream/15000/11809/1/T2300.pdf · de audio y video implementado en el robot, hacia un receptor remoto o televisor

m

Fig

ura

2.9

Dia

gram

a E

squem

átic

o d

e la

Tar

jeta

Mad

re

Page 53: ESCUELA POLITÉCNICA NACIONAL - Repositorio …bibdigital.epn.edu.ec/bitstream/15000/11809/1/T2300.pdf · de audio y video implementado en el robot, hacia un receptor remoto o televisor

E! diagrama esquemático muestra varios conectores designados como: RCO;

RC1; RC2; RC3; RC4; RC5; RC6; RC7; RC8.

Los mismos que realizan las siguientes funciones:

• RCO conector de alimentación de la tarjeta madre.

• RC1 conector externo del pórtico A de! PIC. Aquí se conectan señales

de entrada ya descritas en ía tabla 2.2; el pin 1 de! conector es e! pin 3

del puerto A (RA3).

• RC2 bus de entrada de la palabra reconocida por el kit de

reconocimiento de voz.

• RC3 bus de control de motores DC y servomotores del robot.

• RC4, RC5, RC6 bus de entrada para sensores infrarrojos (Frente,

Abismo, Derecha e Izquierda).

• RC7 entrada auxiliar al prototipo (No utilizada).

• RC8 salida de activación de sensores infrarrojos.

2.3.2 EVCPLEMENTACION DEL CONTROL POR VOZ

Como ínterfaz entre el usuario y el microcontrolador se ha implementado en el

prototipo el control por voz, utilizando el "VOICE DIRECT II" que recibirá las

ordenes del usuario en forma de palabras y como resultado de! reconocimiento

envía los datos a través de un bus al microcontrolador que toma las decisiones

correspondientes.

El kit cuenta con una entrada de audio para ingresar las palabras, así como de

una salida de audio que repetirá las palabras reconocidas y también dará

mensajes audibles hacia el usuario. Además posee una memoria de programa

y una memoria de datos, la primera para su programación, y la segunda para

almacenar las palabras entrenadas para el reconocimiento.

E! bus de salida de datos hacia el microcontrolador es de 8 bits y la capacidad

de reconocimiento del kit es de quince palabras. El tiempo de activación de las

salidas una vez reconocida una palabra es de un segundo por lo que se usa un

LATCH para mantener esta señal por más tiempo.

Page 54: ESCUELA POLITÉCNICA NACIONAL - Repositorio …bibdigital.epn.edu.ec/bitstream/15000/11809/1/T2300.pdf · de audio y video implementado en el robot, hacia un receptor remoto o televisor

44

Figura 2.10 Kit de Reconocimiento de Voz

1 í 1

. í•^ -c-

í¿f> fx - . , •.-.! . - .X'Aí^l&yvrt.'^•fe^'-i'-x^éww^-^i j £& - í'.lffiS^o^l^;- ^Bf pS'31

Figura 2.11 Microprocesador de reconocimiento de voz

Page 55: ESCUELA POLITÉCNICA NACIONAL - Repositorio …bibdigital.epn.edu.ec/bitstream/15000/11809/1/T2300.pdf · de audio y video implementado en el robot, hacia un receptor remoto o televisor

45

2.3.3 DISEÑO DE SENSORES INFRARROJOS DE PROXIMIDAD

Tal como se indico en el capítulo anterior el vehículo podrá realizar una

exploración autónoma del entorno donde se encuentra para lo cual debe evadir

los obstáculos próximos dentro de su trayectoria por lo que se diseñaron

sensores infrarrojos de proximidad que están ubicados en lugares estratégicos

para evitar que el robot se choque contra algo o lo que es peor caiga dentro de

algún abismo de donde no pueda salir.

Estos sensores utilizan como principio de funcionamiento el de emitir una señal

infrarroja hacia el frente esperando que ésta rebote en algún cuerpo y sea

percibida por el receptor dando entonces una señal de presencia de objeto.

Para el diseño se ha utilizado un circuito integrado SHARP IS471F que posee

en su encapsulado todo el circuito receptor, necesitando para su

funcionamiento solamente un diodo emisor y para la calibración de la distancia

un potenciómetro que aumenta o disminuye la corriente en dicho diodo,

haciéndolo más o menos sensible al sensor.

Las características del dispositivo Sharp IS471F se describen a continuación:

Tabla 2.3 Características Técnicas del Chip IS471F

MODELO

ALIMENTACIÓN

(VCC)

TEMPERATURA DE

FUNCIONAMIENTO

VOLTAJE DE

SALIDA

CORRIENTE DE

SALIDA

POTENCIA DE

DISIPACIÓN

SHARP IS471F

DE 4.5 [V]

DE -25°C

a!6[V]

a60°C

Vcc

50[mA]

250[mW]

Page 56: ESCUELA POLITÉCNICA NACIONAL - Repositorio …bibdigital.epn.edu.ec/bitstream/15000/11809/1/T2300.pdf · de audio y video implementado en el robot, hacia un receptor remoto o televisor

46

El diagrama del circuito es:

VccSV

SalhU

GtHD DEL

Figura 2.12 Circuito Acondicionador del sensor SHARP IS471F

Para la calibración se uso un potenciómetro de 100 ohmios que se lo varía

desde 20 ohmios hasta un máximo de 60 ohmios. Así:

corriente, en d diodo :

Vcc 5\V\ = - = • — L J ^ = 50/77^4

1 R 100[n]

VccId~~

2— ~ :

R 280[Q]

Mayor Distancia (10 ciri)

Menor Dis~ten.cia (3 cm)

2.3.4 IMPLEMENTACION DEL CBRCÜITO CONTROLADOR DE LOS

MOTORES DC

Para controlar al accionamiento de los motores de se utiliza un circuito

propuesto en anteriores proyectos puesto que ha presentado excelentes

resultados, permitiendo controlar su accionamiento y cambio de giro sin afectar

al funcionamiento normal del microcontrolador pie.

Page 57: ESCUELA POLITÉCNICA NACIONAL - Repositorio …bibdigital.epn.edu.ec/bitstream/15000/11809/1/T2300.pdf · de audio y video implementado en el robot, hacia un receptor remoto o televisor

47

A continuación se presenta el circuito con todos los elementos ya calculados en

los anteriores proyectos [14] para motores similares al utilizado en el prototipo:

Vcc

señal de control 1

señal de control S-^ww-

4

1

k-.1 X 1

*UI J

1t'-l

í T„ ... i . ^i

-..

i

•il

»°j

_™t

2

\"^,

X_' 3 J

.,,._

c

1 1 'Wvv

O,,

>

-j

i — i

^

2

i

Figura 2.13 Esquemático Circuito controlador motores DC

La señal de control 1 permite invertir la polaridad de la entrada de alimentación

hacia el motor DC, mientras que la señal de control 2 alimenta directamente al

motor DC.

2.3.5 IMPLEMENTACION DEL TRANSMISOR DE AUDIO Y VIDEO

PARA LA CÁMARA

Este prototipo utiliza un Transmisor de audio y video NIPÓN WV-300 para

enviar la señal desde el prototipo hacia el receptor que será cualquier receptor

de televisión, para la calibración de la frecuencia de la transmisión se debe

sintonizar al televisor en un canal cualquiera desde el 14 al 31 (en UHF) e ir

modulando el control de ajuste de canal del transmisor hasta obtener la mejor

señal en el receptor

Las características del transmisor se describen a continuación:

Page 58: ESCUELA POLITÉCNICA NACIONAL - Repositorio …bibdigital.epn.edu.ec/bitstream/15000/11809/1/T2300.pdf · de audio y video implementado en el robot, hacia un receptor remoto o televisor

48

Tabla 2.4 Características Técnicas del Transmisor de Audio y Video

MODELO NIPÓN WV-300

ALIMENTACIÓN 12VDC

CORRÉENTE MAX lOOmA

ALCANCE MAX500 PIES / 152m (en línea de

vista)

CARACTERÍSTICAS

ADICIONALES

Control de volumen, brillo, yfrecuencia de transmisiónajustables

Figura 2.14 Transmisor Audio-Video; relación tamaño con un marcador común

Page 59: ESCUELA POLITÉCNICA NACIONAL - Repositorio …bibdigital.epn.edu.ec/bitstream/15000/11809/1/T2300.pdf · de audio y video implementado en el robot, hacia un receptor remoto o televisor

49

2.3.6 IMPLEMENTACION DEL TRANSMISOR DE AUDIO

Para la transmisión de las instrucciones de audio desde eí lugar donde se

encuentra el usuario hasta el prototipo se ha implementado un transmisor de

radio en la banda FM constituido por un micrófono-transmisor y un receptor-

FM que esta ubicado en el robot y que se conecta a la entrada de audio del kit

de reconocimiento de voz para hacer funcionar al prototipo.

Tabla 2.5 Características Técnicas del Transmisor de Audio

MODELO

ALIMENTACIÓN1.5VDC

CORRIENTE MAXlOmA

ALCANCE MAX15m (en línea de vista)

CARACTERÍSTICAS

ADICIONALES

Control de frecuencia, Funciónalámbrica e inalámbrica

Figura 2.15 Micrófono trasmísor de audio

Page 60: ESCUELA POLITÉCNICA NACIONAL - Repositorio …bibdigital.epn.edu.ec/bitstream/15000/11809/1/T2300.pdf · de audio y video implementado en el robot, hacia un receptor remoto o televisor

50

Figura 2.16 Transmisor Audio; relación tamaño con un marcador común

2.3.7 DISEÑO DE CIRCUITO CONTROLADOR DE SERVOMOTORES

Para el control de ios servomotores que gobiernan el movimiento de la cámara

en 2 ejes y de la pinza también en 2 ejes se utiliza solamente un transistor

hacia el motor que será disparado directamente por eí píe el tiempo que sea

necesario para poder llegar a la posición esperada

Los servomotores utilizados tanto en la pinza como en la cámara son

HOBBICO y sus características técnicas así como las señales que lo controlan

son:

Page 61: ESCUELA POLITÉCNICA NACIONAL - Repositorio …bibdigital.epn.edu.ec/bitstream/15000/11809/1/T2300.pdf · de audio y video implementado en el robot, hacia un receptor remoto o televisor

Tabla 2.6 Características Técnicas de Servomotor

MODELO

ALIMENTACIÓN

(VCC)

TORQUE MÁXIMO

VOLTAJE DE

CONTROL

CORRIENTE MAX

HOBBICO M25

DE 4.5|Y] a 6[V]

3.56 kg.cm

DE 4.5[V] a 6[V]

50[mA]

1.50 rns:Neutni!o J*

o y90° GRADOS

J,.25ms:-0desreesp p H H

O N W N)O vi u ví

3 S c^ S 0° GRADOS

1.75 ms: ISO degrees

0 t«1 I

180° GRADOS

Figura 2.17 Esquema de pulsos para el servomotor

Figura 2.18 Servomotores Vista Frontal Y Lateral

Page 62: ESCUELA POLITÉCNICA NACIONAL - Repositorio …bibdigital.epn.edu.ec/bitstream/15000/11809/1/T2300.pdf · de audio y video implementado en el robot, hacia un receptor remoto o televisor

52

2.3.8 IMPLEMENTACION DEL TRASMISOR DE DATOS

Para enviar las instrucciones de ENCENDIDO/APAGADO, RESET, INGRESO

DE PALABRA, BORRAR MEMORIA, Y RECONOCER PALABRA desde el

usuario al robot se utilizó un trasmisor receptor de radio frecuencia que permite

enviar cinco señales de control. Este transmisor no fue implementado en el

proyecto sino se lo uso como un elemento funcional predeterminado.

Figura 2.19 Control remoto del robot explorador

2.3.9 RECARGA DE BATERÍAS

Dentro del diseño del prototipo se utilizaron treinta baterías recargables de 1.2

voltios (1.5 a máxima carga) las cuales se agruparon de la siguiente manera:

• Cuatro baterías recargables en serie (5.2 voltios aprox.) que alimentan la

tarjeta madre de control, el kit de reconocimiento de voz, el receptor de

datos, y el receptor de audío.

* Cuatro baterías recargables en serie (5.2 voltios aprox.) que alimentan el

motor DC1 encargado de la locomoción del prototipo en el flanco

derecho.

. - 11 1I1

1

A_ _ .

r~i

i

i " — i — ' ji

GNO /O V+(Sy)

Ptjg do cargade

Figura 2.20 Diagrama en bloques de! circuito de conexión de baterías.

Page 63: ESCUELA POLITÉCNICA NACIONAL - Repositorio …bibdigital.epn.edu.ec/bitstream/15000/11809/1/T2300.pdf · de audio y video implementado en el robot, hacia un receptor remoto o televisor

54

2.3.9.1 Procedimiento para recargar las baterías

• Para recargar las baterías de 12 voltios, que alimenta tanto a la cámara,

como ai transmisor; se debe colocar el interruptor numero O en posición

apagado, entonces se puede alimentar al robot con una fuente de 12

voltios por la entrada prevista para ello.

A \^ffip—•**.

(a)

Figura 2.21 (a) Interruptor #0 (b) Entrada de 12 voltios

(b)

Para recargar las baterías de 5 voltios, el robot debe estar apagado

previamente y dependiendo de la posición de los interruptores laterales

se aumentará uno u otro sector del mismo. En la tabla 2.7 se puede ver

la posición de los interruptores (ON, OFF) para cargar las baterías que

se encuentran en el vehicuio explorador

Tabla 2.7 Posición de interruptores

SECTOR

MOTORES

DC

SENSORES

Y SERVOS

TARJETAS

CONTROL

INTERRUPTOR

OFF

ON

ON

INTERRUPTOR

OFF

ON

ON

INTERRUPTOR

ON

OFF

ON

Page 64: ESCUELA POLITÉCNICA NACIONAL - Repositorio …bibdigital.epn.edu.ec/bitstream/15000/11809/1/T2300.pdf · de audio y video implementado en el robot, hacia un receptor remoto o televisor

55

a) (b)

Figura 2.22 (a) Interruptores #2 Y #3 (b) Entrada de 5 voltios

2.3.10 ENSAMBLAJE DEL ROBOT EXPLORADOR TIPO ORUGA

El ensamblaje del prototipo se io realizó conforme se indica a continuación

teniendo en cuenta que cada elemento que se adicionaba al robot debía ser

probado previamente y en conjunto con ios anteriores para verificar su

funcionamiento, de igual manera debían ser consideradas sus dimensiones y

eí rediseño de ser necesario por el tamaño compacto que tiene el prototipo en

conjunto, utilizando todo su espacio interior y exterior para este objetivo.

2.3.10.1 Estructura original o chasis del robot

El chasis del robot es el carapacho de un vehículo motorizado tipo oruga que

contiene en su interior dos motores DC acopiados a un conjunto de piñones o

engranajes solidarios cuya única función es transformar la velocidad del motor

en torque capaz de mover toda la estructura, convirtiéndolos en motor-

reductores

Page 65: ESCUELA POLITÉCNICA NACIONAL - Repositorio …bibdigital.epn.edu.ec/bitstream/15000/11809/1/T2300.pdf · de audio y video implementado en el robot, hacia un receptor remoto o televisor

56

Caja MotorReductor

Figura 2.23 Ubicación de los motores DC dentro del chasis de! prototipo

2.3.10.2 PCI Circuito controlador de los motores DC

Este circuito posee 4 entradas y 4 salidas en pares que sirven para controlar el

accionamiento y cambio de sentido de giro de cada uno de los 2 motores DC

que permiten la locomoción del vehículo. E! cambio de sentido se realiza por

medio de un transistor que dispara un relé que polariza inversamente las

entradas al motor:

Las dimensiones de esta plaqueta son:

Ancho: 4cm

Largo: 6.5cm

Figura 2.24 Tarjeta de control para motores DC

Page 66: ESCUELA POLITÉCNICA NACIONAL - Repositorio …bibdigital.epn.edu.ec/bitstream/15000/11809/1/T2300.pdf · de audio y video implementado en el robot, hacia un receptor remoto o televisor

57

REV

Figura 2.25 Diagrama esquemático de la tarjeta de control para motores DC

2.3.10.3 PC2 Tarjeta de control madre

Esta tarjeta contiene al microcontrolador PIC encargado de realizar el control

sobre todos los movimientos del robot, así mismo posee buífers conectados al

PIC que permiten la ampliación de puertos del mismo para mayor número de

entradas y salidas, posee 16 entradas y 14 salidas

Sus dimensiones son:

Largo: 9.5cm

Ancho: 6.8cm

Figura 2.26 Tarjeta madre de control

Page 67: ESCUELA POLITÉCNICA NACIONAL - Repositorio …bibdigital.epn.edu.ec/bitstream/15000/11809/1/T2300.pdf · de audio y video implementado en el robot, hacia un receptor remoto o televisor

58

2.3.10.4 PC3 Tarjeta madre del kit de reconocimiento de voz

Dentro de esta tarjeta se encuentra el micro RSC300 que permite realizar el

reconocimiento de las palabras posee una entrada de audio, salida de audio

(speakers), 8 pines de control.

Sus dimensiones son:

Largo: 14.1cm

Ancho: 8.3cm

B*~«J i, 'i [ T^S-ltEtS^jOé3i ¡*-~?-r i' '•'-C' gF-i-ft! Lí-u ií - - «J.,

Figura 2.27 Tarjeta de reconocimiento de voz

Page 68: ESCUELA POLITÉCNICA NACIONAL - Repositorio …bibdigital.epn.edu.ec/bitstream/15000/11809/1/T2300.pdf · de audio y video implementado en el robot, hacia un receptor remoto o televisor

1 J

T0

1->

ca

o =t=

cz?

3

1 1U

D,f

Fig

ura

2.28

P

C2

Dia

gram

a es

quem

átic

o de

l kit

de v

oz

part

ea)

Page 69: ESCUELA POLITÉCNICA NACIONAL - Repositorio …bibdigital.epn.edu.ec/bitstream/15000/11809/1/T2300.pdf · de audio y video implementado en el robot, hacia un receptor remoto o televisor

VDEÍ

Ví»

PV-rt

py-fi

¡••v

-J'í'irt

'•'•?.

X

í:>f

r™

< .? • •;1 í;í •%<>

i

S1 í* •*»

H »:..

>•»

,,;;

»;../

>•.-;

, iv;

v«"

.ffif

c""?

- í7í

T •«•

—"•%

"1

r.¿W

UX

A-y

\:

J I

^

y^a«

y-

¿íi i* {¿

f-i *3*i3

> lltí

ft* y

í!»,r |

.^

!s..

!

íftl

ií^

4V.Í »

Fig

ura 2

.29

PC

2 D

iagr

ama

esqu

emát

ico

del k

it de

voz

pa

rte b

)

Page 70: ESCUELA POLITÉCNICA NACIONAL - Repositorio …bibdigital.epn.edu.ec/bitstream/15000/11809/1/T2300.pdf · de audio y video implementado en el robot, hacia un receptor remoto o televisor

61

2.3.10.5 PC4-PC11 Circuito Sensor Infrarrojo de proximidad

Dentro de esta tarjeta se encuentra el circuito emisor-receptor infrarrojo que

permite detectar objetos sobre la trayectoria del robot, posee una salida digital

que ingresa al PIC para que este realice el control sobre los movimientos del

prototipo y evite que el mismo choque o caiga.

Sus dimensiones son:

Largo: 2.2cm

Ancho: 1.8cm

r ,Ví7^--v;* s • Hi -.o • :•»>; '-* ""'

> '.

Figura 2,30 Tarjeta de sensor Infrarrojo vista lateral

Figura 2,31 Tarjeta de sensor Infrarrojo vista frontal

Page 71: ESCUELA POLITÉCNICA NACIONAL - Repositorio …bibdigital.epn.edu.ec/bitstream/15000/11809/1/T2300.pdf · de audio y video implementado en el robot, hacia un receptor remoto o televisor

62

2.3.10.6 PC12 Tarjeta alimentadora de ios Sensores y Servomotores

Esta tarjeta tiene como función activar o desactivar la alimentación de los

sensores infrarrojos, esto para que solo funcionen en el modo automático de

exploración evitándose así un gasto innecesario de energía cuando el prototipo

se encuentra explorando en forma manual, donde estrictamente realiza los

movimientos requeridos por el usuario. Posee como entrada una señal de

control del PIC que indica sí se quiere o no alimentar a los sensores y una

única salida que controla el suministro de energía hacia los mismos.

Sus dimensiones son:

Largo; 3.4cm

Ancho: 2.5cm

+5 Vcc

SENSORES

SENSORES 1

PIN RAO

PINRAfl

SERVOMOTORES

Figura 2.32 Diagrama esquemático para control de sensores

Page 72: ESCUELA POLITÉCNICA NACIONAL - Repositorio …bibdigital.epn.edu.ec/bitstream/15000/11809/1/T2300.pdf · de audio y video implementado en el robot, hacia un receptor remoto o televisor

63

2.3.10.7 PC13 Tarjeta transmisor de Audio y Video

Esta tarjeta contiene e! transmisor de Audio-Video para la cámara que envía

señales al receptor que será cualquier televisor

Sus dimensiones son:

Largo: 14cm

Ancho: 9cm

Figura 2.33 PC13 Tarjeta Transmisor Audio-Video

2.3.10.8 PC14 Circuito Receptor de Audio

Dentro de esta tarjeta se encuentra ei receptor de audio que recibe todas las

órdenes del usuario y las ingresa a la entrada del kit de reconocimiento de voz

que las decodificara transformándolas en señales digitales para que sean

leídas por e! microcontrolador.

Sus dimensiones son:

Largo: 6.5cm

Ancho: 2.7cm

Page 73: ESCUELA POLITÉCNICA NACIONAL - Repositorio …bibdigital.epn.edu.ec/bitstream/15000/11809/1/T2300.pdf · de audio y video implementado en el robot, hacia un receptor remoto o televisor

64

Figura 2.34 PC14 Tarjeta Receptor de Audio

23.10.9 PC16 Circuito Transmisor de Audio y de Datos(externo)

Dentro de esta tarjeta está el transmisor de audio en FM que envía las señales

de la voz de! usuario hasta el receptor remoto colocado en e! prototipo, además

también se tiene la tarjeta de transmisión de datos que envía señales de

encendido / apagado así como de ingreso, borrado, reseteo y reconocimiento

de palabra al robot.

Sus dimensiones son:

Trasmisor de Audio:

Largo: 5cm

Ancho: 2cm

Page 74: ESCUELA POLITÉCNICA NACIONAL - Repositorio …bibdigital.epn.edu.ec/bitstream/15000/11809/1/T2300.pdf · de audio y video implementado en el robot, hacia un receptor remoto o televisor

65

Figura 2.35 PC16 Tarjeta Transmisor Audio (Externa)

Trasmisor de Datos:

Largo: 6.5cm

Ancho: 4.8cm

Figura 2.36 PC16 Tarjeta Transmisor Audio (Externa)

2.3.10.10 Ubicación de las tarjetas dentro del chasis

En la Figura 2.37 se presenta !a distribución de las tarjetas de hardware sobre

e! vehículo.

Page 75: ESCUELA POLITÉCNICA NACIONAL - Repositorio …bibdigital.epn.edu.ec/bitstream/15000/11809/1/T2300.pdf · de audio y video implementado en el robot, hacia un receptor remoto o televisor

66

TARJETADE

RECONOCIMIEDE VOZ

O

//Qrugasvx

~J" 'li, Tb"*"<<l*l!lí :'" ^*jl

TARJETAMADRE

TARJETADE

CONTROLDE

MOTORES

QCI=ZJl'rij)lNSMISOR DE AUDIO Y~\\O

Figura 2.37 Distribución de tarjetas en el vehículo

2.3.11 PROCEDIMIENTO PARA MANEJAR AL ROBOT EXPLORADOR

TIPO ORUGA

Para poner en funcionamiento al prototipo se requiere seguir la secuencia de

acciones detallada a continuación:

Page 76: ESCUELA POLITÉCNICA NACIONAL - Repositorio …bibdigital.epn.edu.ec/bitstream/15000/11809/1/T2300.pdf · de audio y video implementado en el robot, hacia un receptor remoto o televisor

67

2.3.11.1 Encendido del robot

El robot explorador tipo oruga cuenta con dos interruptores principales de

alimentación, el primero alimenta a toda la parte motriz del mismo y se

encuentra ubicado en su parte inferior izquierda como se muestra en la Figura

2.38

Figura 2.38 Ubicación del interruptor principal #1

El segundo interruptor es el encargado de alimentar al transmisor de audio y

vídeo que enlaza las imágenes de la posición de robot con el receptor del

usuario. Este se encuentra en la parte frontal como se muestra en la Figura

2.39

Figura 2.39 Ubicación del interruptor #0 de encendido del transmisor

Page 77: ESCUELA POLITÉCNICA NACIONAL - Repositorio …bibdigital.epn.edu.ec/bitstream/15000/11809/1/T2300.pdf · de audio y video implementado en el robot, hacia un receptor remoto o televisor

68

En el momento en que este interruptor es accionado se encenderá una luz

piloto que indica que el transmisor empezó a enviar la señal generada por la

cámara, sin necesidad que la parte motriz del robot este activada aún. El

receptor (televisor) debe estar inicialmente sintonizado en el canal 19, más esto

no es una exigencia pues puede ser calibrado para otro canal de la banda de

UHF mediante el potenciómetro que posee el transmisor, el cual se muestra en

la Figura 2.40

Figura 2.40 Ubicación del potenciómetro para calibración de la frecuencia del transmisor

Una vez obtenida una recepción apropiada de la señal en el televisor, se

puede energizar la parte motriz del robot, momento en el cual se enciende

también el kit de reconocimiento y envía un zumbido hacía el transmisor de

audio y video que puede ser oído en el televisor. En este momento el robot esta

listo para iniciar su funcionamiento.

Como ultima acción para dejar al robot en espera de una orden se usa el

control remoto, pulsando el botón de encendido / apagado, con lo cual el

prototipo despierta, acomoda la cámara y la pinza dejándolas en la posición

inicial y espera que el usuario envié las instrucciones.

Page 78: ESCUELA POLITÉCNICA NACIONAL - Repositorio …bibdigital.epn.edu.ec/bitstream/15000/11809/1/T2300.pdf · de audio y video implementado en el robot, hacia un receptor remoto o televisor

69

Figura 2,41 Control remoto de! explorador

Botón 1 graba comandos de voz como instrucciones

Botón 2 ingreso de orden a! robot

Botón 3 encendido / apagado de la parte móvil del robot

Botón 4 resetea a la tarjeta de reconocimiento de voz

Botón 5 borra todas los comandos de voz (15 palabras) almacenadas en

la memoria del robot

Figura 2.42 Micrófono para enviar ios comandos de voz al robot

11 interruptor de encendido del micrófono.

Page 79: ESCUELA POLITÉCNICA NACIONAL - Repositorio …bibdigital.epn.edu.ec/bitstream/15000/11809/1/T2300.pdf · de audio y video implementado en el robot, hacia un receptor remoto o televisor

70

2.3.11.2 Manejo del robot

Para poder comandar todos los movimientos que efectúa el robot se deben

primero conocer las ordenes de voz que los gobiernan, una vez encontrado el

comando requerido se presiona el botón dos del control remoto, momento en el

cual se escucha una voz en el televisor que índica que se puede ingresar la

palabra u orden de acción; sí la palabra es ingresada y reconocida como

acertada el robot ejecuta el comando relacionado a la misma caso contrario

envía un mensaje de fallo en eí reconocimiento.

Tabla 2.8 Comandos de voz

N° i Descripción de la Orden123456789101112131415

Modo automáticoMovimiento por pasosCámara vista abajoCámara vista arribaCámara vista al medioMovimiento hacia delanteMovimiento hacia atrásGiro a la izquierdaGiro a ia derechaAbre pinzaCierra la pinzaPinza en posición horizontalPinza en posición verticalCámara con vista al frenteCámara con vista atrás

PALABRAAutoPasosAbajoArribaMedio

AdelanteAtrás

IzquierdaDerecha

AbrirCerrar

HorizontalVerticalFrente

Posterior

Para conocer si el robot ha reconocido acertadamente la palabra y no hubo un

reconocimiento falso, se puede comparar la respuesta del robot e! momento

que ha reconocido acertadamente una orden, esta respuesta es un número

entre el 1 y 15, el cual se puede comparar con el número de la instrucción o

comando de voz.

Ei usuario puede controlar tres objetos en el robot; la cámara, la pinza, y el

movimiento en si. La cámara tiene cinco movimientos; Arriba, Medio, Abajo,

Frente, Posterior, la posición original es al frente en posición rnodls.

Page 80: ESCUELA POLITÉCNICA NACIONAL - Repositorio …bibdigital.epn.edu.ec/bitstream/15000/11809/1/T2300.pdf · de audio y video implementado en el robot, hacia un receptor remoto o televisor

71

La pinza puede realizar los siguientes movimientos: abrir, cerrar, este último

será hasta sentir presencia del objeto a sujetar, colocarse de forma horizontal y

colocarse de forma vertical. La posición original es horizontal y abierta.

Por último el robot puede moverse de dos maneras de forma continua y a

pasos, dentro de estas opciones podrá avanzar, regresar, girar hacia la

derecha y girar hacia la izquierda. Adicionaimente puede realizar movimientos

de manera autónoma donde evade los obstáculos dentro de su trayectoria.

Para poder detener al robot en cualquier momento basta solo con presionar el

botón dos o de ingreso de palabra y no dar orden alguna o en su defecto

apagar los movimientos del mismo con el botón encendido / apagado.

2.3.11.3 Apagado del vehículo

Para el apagado temporal de robot, solo basta pulsar el botón de encendido /

apagado, de esta forma el prototipo se mantendrá en modo de consumo

mínimo, pero siempre trasmitiendo vídeo y audio hacia el usuario, pendiente

de cualquier comando de voz.

En caso de querer apagar completamente al robot, se debe colocar

manualmente e! interruptor uno en la posición OFF, entonces el prototipo deja

de recibir órdenes, para luego por último desconectar el trasmisor mediante el

interruptor cero, terminando así su funcionamiento.

En el siguiente capítulo se habla a cerca del software desarrollado para

controlar el funcionamiento del robot explorador tipo oruga.

Page 81: ESCUELA POLITÉCNICA NACIONAL - Repositorio …bibdigital.epn.edu.ec/bitstream/15000/11809/1/T2300.pdf · de audio y video implementado en el robot, hacia un receptor remoto o televisor

72

CAPITULO 3

3 DESARROLLO DEL SOFTWARE

3.1 GENERALIDADES

Dentro de este capítulo se explica todo acerca de la configuración y estructura

del software realizado para conseguir el funcionamiento del prototipo. Como ya

se detalló en el capítulo anterior el robot debe realizar varias actividades dentro

de su funcionamiento, las cuales estarán gobernadas por un mícrocontrolador

PIC que sigue una lógica de programación que esta estructurada de acuerdo

con los requerimientos que debe satisfacer el mismo.

Dicho software esta capacitado para controlar el accionamiento de los motores

que permiten la locomoción del robot, el ángulo de operación de los

servomotores que mueven tanto la cámara como la pinza, detectar la presencia

de obstáculos dentro de la trayectoria y evadirlos, y controlar el accionamiento

del kit de voz. La respuesta rápida del PIC hace que el control del sistema sea

inmediato y eficaz.

El software desarrollado para el sistema de exploración se constituye en una

serie de secuencias lógicas que permiten el manejo del robot haciendo que

cada una de sus funciones sean confiables; detectando instrucciones falsas o

vacías y protegiéndolo mecíante la inmovilización hasta que se ingresen

instrucciones acertadas, evitando cfioques e incluso caídas que puedan

destruir la estructura del mismo.

Page 82: ESCUELA POLITÉCNICA NACIONAL - Repositorio …bibdigital.epn.edu.ec/bitstream/15000/11809/1/T2300.pdf · de audio y video implementado en el robot, hacia un receptor remoto o televisor

3.2 PROGRAMACIÓN DEL MICROCONTROJLADOR

PIC16F876

El Microcontrolador PIC16F876, es el elemento que realiza el control total del

robot, el mismo posee 28 pines de los cuales 24 son útiles como periféricos de

entrada y/o salida, siendo estos suficientes para realizar todas las actividades

que conforman el funcionamiento del prototipo, de igual manera la memoria de

programación que brinda este PIC (4k) rebasa ampliamente el conjunto de

instrucciones que constituyen el software del sistema, dando la posibilidad de

ampliar su estructura en un futuro si se lo requiriere.

Dentro de las actividades que desarrolla el microcontrolador se tiene las

siguientes:

> Manejo de Periféricos

• Entradas:

• Encendido / Apagado

• Kit de reconocimiento de voz

• Sensores Infrarrojos de detección de obstáculos

• Sensor de final de carrera para cerrado de pinza

• Salidas:

• Activación de Motores (on / off)

• Activación de los,Servomotores(PWM)

• Activación de los Sensores Infrarrojos (on / off)

• Activación del control de voz (on / off)

• Luces de Señalización

> Identificación de las palabras u ordenes

> Detección y Evasión de obstáculos sobre trayectoria de prototipo

> Manejo de Servomotores (Pinza y Cámara)

> Manejo de Motores DC (Locomoción del robot)

Page 83: ESCUELA POLITÉCNICA NACIONAL - Repositorio …bibdigital.epn.edu.ec/bitstream/15000/11809/1/T2300.pdf · de audio y video implementado en el robot, hacia un receptor remoto o televisor

74

3.2.1 DESARROLLO DEL FLUJOGRAMA GENERAL DE

PROGRAMACIÓN

El diseño del software basa su funcionamiento en un programa constituido de

las siguientes partes principales:

> Inicio

> Lazo Principal

> Identificación de Palabras u Ordenes

> Subrutinas de Acción

3.2.1.1 Inicio

Durante esta parte del programa se realiza !a configuración de los puertos del

microcontrolador como entradas o salidas respectivamente, así mismo se

inicializan fas variables que intervienen en el programa y por último se

estructura una pequeña subruttna que tiene como objetivo dejar al prototipo en

condiciones iniciales para su funcionamiento, esto quiere decir posicionamiento

inicial de la cámara hacía el frente y de la pinza en posición vertical.

Page 84: ESCUELA POLITÉCNICA NACIONAL - Repositorio …bibdigital.epn.edu.ec/bitstream/15000/11809/1/T2300.pdf · de audio y video implementado en el robot, hacia un receptor remoto o televisor

75

CONFIGURACIÓN DE PUERTOSCOMO ENTRADAS Y SALIDAS AADE INICIALIZACION DE VARIABLES

LAZO PRINCIPAL

Figura 3.1 Subrutína de Inicio

3.2.1.2 Lazo Principal

Como su nombre lo indica este iazo se constituye en el punto de partida del

control del robot y es en donde el microcontrolador pasa la mayor parte del

tiempo, aquí se encuentran establecidos los tres estados primarios del prototipo

que son:

> Encendido - Apagado

> Encendido - Escuchando

> Encendido - Explorando

El Encendido - Apagado es el estado en que el prototipo esta energizado pero

en reposo es decir no atiende a ninguna palabra u orden de control hasta

recibir una activación manual por parte del usuario mediante un pulso en el

botón ON/OFF, si bien este estado consume energía que al parecer es

innecesaria, permite que el prototipo tenga tiempo para inicializar e!

posicíonamiento de sus partes constitutivas como son; la cámara que índica al

Page 85: ESCUELA POLITÉCNICA NACIONAL - Repositorio …bibdigital.epn.edu.ec/bitstream/15000/11809/1/T2300.pdf · de audio y video implementado en el robot, hacia un receptor remoto o televisor

76

usuario en donde se encuentra el robot y la pinza que permite tomar objetos del

medio externo en e! cual se encuentre, de igual manera ofrece el tiempo

necesario e indefinido para la calibración del receptor que se utiliza durante el

proceso de exploración (sintonización del canal en el TV ), así como también

permite sí es el caso borrar y reprogramar las palabras u ordenes de acción

dentro del Voíce Direct, teniendo en cuenta que dichas ordenes podrán tener

otro nombre, más la acción de control será la misma.

Una vez realizada todas las calibraciones necesarias para obtener una señal

nítida en el receptor y haber grabado todas las quince instrucciones para el

funcionamiento del prototipo se pulsa el botón ON/OFF, aquí el

microcontroíador empieza su funcionamiento especifico en donde entra en

modo de escucha continuo e identifica cualquiera de las palabras u ordenes de

acción que lo llevan a su último estado, el de exploración propiamente dicho.

El Encendido - Escuchando es el estado en el que el microcontroíador

paraliza su actividad para esperar una orden o nueva orden del usuario, en

este momento el prototipo deja la exploración y únicamente espera que se

ingrese una palabra u orden de acción, el motivo de dejar al robot sin

movimientos es para proteger su integridad en el caso de que la palabra

ingresada por el usuario no sea reconocida como correcta en primera instancia

y sea necesario un segundo intento de reconocimiento.

Una vez que alguna palabra u orden de acción sea ingresada por el usuario el

prototipo sale de este modo e ingresa al modo de exploración.

El Encendido - Explorando es el estado en el que el microcontroíador esta

apto para identificar cualquiera las quince palabras u ordenes de control que

conforman las funciones de exploración del robot, así el microcontroíador

verificará una a una todas las posibles palabras u ordenes de acción dadas por

el usuario y al identificar alguna de ellas como acertada realizará la subrutina

de acción asociada a dicha orden, de lo contrario regresará al modo de

Encendido - Escuchando para esperar una nueva palabra del usuario.

Page 86: ESCUELA POLITÉCNICA NACIONAL - Repositorio …bibdigital.epn.edu.ec/bitstream/15000/11809/1/T2300.pdf · de audio y video implementado en el robot, hacia un receptor remoto o televisor

77

Cabe señalar que el robot puede ser apagado en cualquier momento y en

cualquier modo en que se encuentre pulsando nuevamente el botón ON/OFF

que deja al prototipo en modo Encendido -Apagado.

LAZOPRINCIPAL

COMPRUEBAENCEDIDO

REVISA SIINGRESAORDEN

SALTA AIDENTIFICAR

PALABRA

SALTAASUBRUTINADE ACCIÓN

Figura 3.2 Subrutina de Lazo Principal

3.2.1.3 Identificación de Palabras u Ordenes

Esta parte del programa se ocupa de identificar correctamente las quince

palabras u ordenes de control que intervienen en el funcionamiento del

prototipo, llevándose a cabo únicamente cuando el mismo se encuentra en

estado Encendido - Explorando que es el estado que permite tener e! completo

control del robot. Para realizar la identificación de las palabras el

Page 87: ESCUELA POLITÉCNICA NACIONAL - Repositorio …bibdigital.epn.edu.ec/bitstream/15000/11809/1/T2300.pdf · de audio y video implementado en el robot, hacia un receptor remoto o televisor

78

mícrocontrolador revisa pin a pin el estado de su pórtico de entrada hasta

conseguir una identificación acertada que lo llevará a las subrutinas de acción

Para realizar el manejo del robot se tiene quince palabras u ordenes de control

preestablecidas y almacenadas en el VOICE DIRECT que podrán ser borradas

y reprograrnadas al gusto del usuario en cualquier momento, más el orden de

cada una de estas dentro del microcontrolador llevan al prototipo hacia una

subrutina de acción específica y única que no puede ser alterada por el

usuario. Todas estas subrutinas de acciones específicas y únicas se escriben a

continuación:

Tabla 3.1 Palabras u Ordenes de Control

PALABRASPREESTABLECIDA

AUTOMÁTICO

ADELANTE

ATRÁSDERECHA

IZQUIERDAPASOS

AREBAABAJOMEDIO

FRENTE

POSTERIORABRIR

CERRARVERTICAL

HORIZONTAL

SUBRUTJNA DE ACCIÓNEL ROBOT EXPLORA AUTOMÁTICAMENTE

ACTIVA MOTORES DC ADELANTE

ACTIVA MOTORES DC ATRÁSACTIVA MOTORES DC DERECHA

ACTIVA MOTORES DC IZQUIERDAACTIVA O DESACTIVA MOVIMIENTOS DEL

ROBOT PASO APASOMUEVE CÁMARA ARRIBAMUEVE CÁMARA ABAJOMUEVE CÁMARA MEDIO

MUEVE CÁMARA AL FRENTE

MUEVE CÁMARA HACIA ATRÁSABRE LA PINZA

CIERRA LA PINZAMUEVE LA PINZA VERTICALMENTE

MUEVE LA PINZA HORIZONTALMENTE

Page 88: ESCUELA POLITÉCNICA NACIONAL - Repositorio …bibdigital.epn.edu.ec/bitstream/15000/11809/1/T2300.pdf · de audio y video implementado en el robot, hacia un receptor remoto o televisor

SA

LTO

AS

UB

RU

TIN

A. D

EA

CC

ON

Fig

ura

3.3

Sub

rutin

a Id

entif

icac

ión

de P

alab

ras

vo

Page 89: ESCUELA POLITÉCNICA NACIONAL - Repositorio …bibdigital.epn.edu.ec/bitstream/15000/11809/1/T2300.pdf · de audio y video implementado en el robot, hacia un receptor remoto o televisor

SA

LTO

AS

UB

RLm

|\ÍA

DE

AC

CÍO

N

SALT

O A

SU

BR

UTI

NA

DE

AC

CO

N

Con

tinua

ción

Fig

ura

3.3

co o

Page 90: ESCUELA POLITÉCNICA NACIONAL - Repositorio …bibdigital.epn.edu.ec/bitstream/15000/11809/1/T2300.pdf · de audio y video implementado en el robot, hacia un receptor remoto o televisor

w>

SALT

O A

SU

BR

UT1

NA

DE

AC

CO

N

SA

LTO

AS

UB

Rlm

NA

DE

AC

CO

N

00

Con

tinua

ción

Fig

ura 3

.3

Page 91: ESCUELA POLITÉCNICA NACIONAL - Repositorio …bibdigital.epn.edu.ec/bitstream/15000/11809/1/T2300.pdf · de audio y video implementado en el robot, hacia un receptor remoto o televisor

82

Dentro del diagrama de flujo se utiliza como nomenclatura de cada orden de

acción la palabra 1 hasta la palabra 15, esto indica que la instrucción puede

tener cualquier nombre dado por el usuario, mas su reconocimiento tiene-un

orden especifico dentro del software y lleva a una única acción de control en el

robot, este orden especifico se detalla continuación:

Tabla 3.2 Acción de control de cada palabra

NUMERO DEPALABRAPAL ABRA 1PALABRA 2

PALABRAS

PALABRA 4PALABRAS

PAL ABRA 6PALABRA?PALABRASPAL ABRA 9

PALABRA 10PALABRA 11

PALABRA 12PALABRA 13PALABRA 14PALABRA 15

SUBRUTINA DE ACCIÓNEL ROBOT EXPLORA AUTOMÁTICAMENTEACTIVA 0 DESACTIVA MOVIMIENTOS DEL

ROBOT PASO A PASO

MUEVE CÁMARA ARRIBA

MUEVE CÁMARA ABAJOMUEVE CÁMARA MEDIO

ACTIVA MOTORES DC ADELANTEACTIVA MOTORES DC ATRÁS

ACTIVA MOTORES DC IZQUIERDAACTIVA MOTORES DC DERECHA

ABRE LA PINZACIERRA LA PINZA

MUEVE LA PINZA HORIZONTÁLMENTEMUEVE LA PINZA VERTICALMENTE

MUEVE CÁMARA AL FRENTEMUEVE CÁMARA HACIA ATRÁS

3.2.1.4 Subrutinas de Acción

Esta parte del programa es la encargada de manejar los periféricos de salida

del microcontrolador, los cuales manejan a los actuadores que permiten el

correcto desempeño del prototipo. Así se tiene:

> SUBRUTINA DE ACCIÓN AUTOMÁTICO

> SUBRUTINAS DE ACCIÓN MANUAL

La SUBRUTINA DE ACCIÓN AUTOMÁTICO esta diseñada para controlar los

movimientos de! prototipo de manera autónoma guiando los mismos de

acuerdo al estado de los ojos electrónicos (sensores infrarrojos) que

Page 92: ESCUELA POLITÉCNICA NACIONAL - Repositorio …bibdigital.epn.edu.ec/bitstream/15000/11809/1/T2300.pdf · de audio y video implementado en el robot, hacia un receptor remoto o televisor

83

proporcionan la información necesaria para evadir obstáculos o abismos dentro

de la trayectoria de exploración del robot.

El movimiento que realiza el robot es siempre hacia adelante; evadiendo

obstáculos y abismos durante su trayectoria mediante giros de su estructura

hacia la derecha o izquierda sobre su propio eje de manera aleatoria, los

mismos que duran hasta que todos los ojos electrónicos (sensores infrarrojos)

indiquen un camino seguro para el recorrido.

REVIZARSENSOR FRONTAL

OBSTAOLO

1

X

r

nove?ROBOT

ADB.ANTE

Figura 3.4 Subruíína de Acción Automática

Page 93: ESCUELA POLITÉCNICA NACIONAL - Repositorio …bibdigital.epn.edu.ec/bitstream/15000/11809/1/T2300.pdf · de audio y video implementado en el robot, hacia un receptor remoto o televisor

84

Las SUBRUTINAS DE ACCIÓN MANUAL son las encargadas de realizar la

labor puntual que indique la palabra u orden reconocida por el sistema como

correcta dada por el usuario y funcionan como interruptores de los actuadores,

es decir activan directamente un conjunto de los mismos en una secuencia

determinada dando como resultado una acción física del prototipo.

Estas son:

• Movimientos del robot

• Movimientos de la pinza y

• Movimientos de la cámara

SUBRUTINADE

ACCIÓN DEL MODOMANUAL

ACCIÓN PUNTUAL DADA

POR EL USUARIO

REGRESAR

Figura 3.5 Subrutína de Acción del Modo Manual

Los Movimientos del Robot están dados por el accionamiento de 2 motores

DC, uno para cada flanco, permitiéndole al prototipo girar sobre su propio eje,

es decir en espacios reducidos.

Page 94: ESCUELA POLITÉCNICA NACIONAL - Repositorio …bibdigital.epn.edu.ec/bitstream/15000/11809/1/T2300.pdf · de audio y video implementado en el robot, hacia un receptor remoto o televisor

85

Los Movimientos de la Pinza se realizan enviando un tren de pulsos hacia los

servomotores que controlan la misma, la posición esta dada por el ancho de!

pulso y sus giros son de hasta un ángulo de 180° como máximo.

Los Movimientos de la Cámara de igual manera que la pinza se realizan por

medio de dos servomotores y su control esta dado por la relación de trabajo de

un tren de pulsos a sus terminales.

3.3

El manejo de los periféricos dentro del programa constituye la base del

funcionamiento del robot pues permite distribuir todos los pines del

microcontrolador hacia los actuadotes o salidas dependiendo del estado de los

sensores o entradas.

Dentro del programa existen periféricos múltiples, es decir que permiten el

ingreso de varias señales por una misma línea de entrada, en otras palabras se

utiliza una ampliación de puertos con la ayuda de buffers. Al realizar las

ampliaciones de puertos se consigue extraer el máximo provecho de las

utilidades del microcontrolador aunque esto influya un poco en la complejidad

del programa, razón por la cual en la mayoría de los casos el programador

prefiere usar un microcontrolador de mayor numero de Entradas / Salidas.

Dentro de los periféricos de entrada están los sensores infrarrojos que son del

tipo ON/OFF y entregan una señal de uno lógico o cero lógico al

microcontrolador, encargado de discernir las acciones que se deben tomar de

acuerdo al estado de cada uno de estos sensores. De igual manera ocurre con

el sensor de final de carrera de la pinza que indica la existencia de un objeto

dentro de sus paredes, permitiendo que el microcontrolador sujete al objeto sin

maltratarlo.

En el siguiente capítulo se habla de las pruebas y resultados que se obtuvieron

durante el proceso de ensamblaje y puesta en funcionamiento del robot.

Page 95: ESCUELA POLITÉCNICA NACIONAL - Repositorio …bibdigital.epn.edu.ec/bitstream/15000/11809/1/T2300.pdf · de audio y video implementado en el robot, hacia un receptor remoto o televisor

86

CAPITULO 4

4 PRUEBAS Y RESULTADOS

4.1 PRUEBAS

Durante el desarrollo del proyecto se hicieron pruebas del funcionamiento del

prototipo para obtener al final el mayor rendimiento de la energía, la mayor

rapidez en el control y la mejor calidad de transmisión desde el robot y hacia el

mismo. Para todas las pruebas realizadas se usaron criterios basados en tres

parámetros importantes que debe cumplir el prototipo; eficiencia del sistema de

exploración, confiabilidad del sistema, costo del proyecto.

Primeramente la energía que utiliza eí robot es independiente para cada área

del mismo, y se la implemento de esta manera luego de experimentar con cada

función que cumple, observando cual de estas es más crítica y por ende

necesita ser tratada de manera especial en caso de descarga de baterías. Para

conocer el consumo de cada área se realizó una prueba que indica cuanta

energía necesita cada elemento que conforma el robot, y el tiempo aproximado

de funcionamiento que tiene utilizando las baterías recargables de 1.5 V a

1800mA utilizadas en el proyecto.

Los resultados de esta prueba se describen el la tabla 4.1 y fueron tomados

asumiendo que cada elemento posee una fuente independiente de 1800mA

Tabla 4.1 Consumo de Energía en cada área de trabajo del Robot

Área

Tarjeta de

Control y Kit de voz

Tarjeta de

recepción de datos

Voltaje de

Alimentación

5M

Consumo

Mínimo

110mA

Consumo

Máximo

140mA

Tiempo

Estimado

20horas

Page 96: ESCUELA POLITÉCNICA NACIONAL - Repositorio …bibdigital.epn.edu.ec/bitstream/15000/11809/1/T2300.pdf · de audio y video implementado en el robot, hacia un receptor remoto o televisor

87

y audíoi

Motores DC

Servomotores DC

Sensores infrarrojos

Transmisor de

Audio y Video

5M

5M

5M

5[V]

700mA

100mA

450mA

100mA

1200mA

500mA

450mA

100mA

2horas

Ghoras

4horas

18horas

Como se puede observar existe diversidad de consumo en cada área de

trabajo del robot, siendo como se dijo anteriormente unas áreas más críticas

que otras. Para la distribución de las fuentes de alimentación se realizó un

estudio analizando que áreas y porque son más críticas que otras así:

Tabla 4.2 Áreas Criticas de trabajo del Robot

Área

Tarjeta de

Control y Kit de

voz

Motores DC

Servomotores

DC

Sensores

Infrarrojos

Transmisor de

Audio y Video

Receptor de

Audio y Datos

Nivel de Importancia

Muy

Critico

X

X

X

Critico

X

No muy

Critico

X

X

Razón

Siempre se debe tener comunicación

con el robot para tratar de ayudarlo en

caso de fallas

En caso de fallas es importante que

se pueda mover al robot para traerlo

de vuelta mas no es lo más

importante

En caso de fallas no interesa que

recoja objetos o mueva la cámara a la

posición frontal

Los sensores pueden quedar sin

energía en caso de averías y esto no

afectara al funcionamiento del robot

Se requiere una Imagen del lugar

donde esta el robot para poder

encontrarlo en caso de averías.

En caso de averías estos elementos

son la única forma de tener

comunicación con eí robot

Page 97: ESCUELA POLITÉCNICA NACIONAL - Repositorio …bibdigital.epn.edu.ec/bitstream/15000/11809/1/T2300.pdf · de audio y video implementado en el robot, hacia un receptor remoto o televisor

De acuerdo con este estudio y con el consumo que tiene cada área de trabajo

del robot se realizó la división de fuentes de energía, teniendo en cuenta que

las áreas más criticas llevan fuentes independientes para garantizar que su

funcionamiento sea el correcto y no se vea afectado por el consumo de otras

áreas menos importantes en el caso de existir descargas de batería.

En ía tabla 4.3 se especifica la distribución de las fuentes de energía en cada

área de trabajo del robot.

Tabla 4.3 Distribución de Baterías dentro del robot

Área

Tarjeta de Control y

Voice Direct

Receptor de datos y

audio

Motores DC c/u

Servomotores DC

Sensores Infrarrojos

Transmisor de Audio

y Video

Numero de Baterías

Voltaje

Packl

1.5*4=-6[V]

Pack2

1.5*4=6[V]

PackS

1.5*4=6[V]

Pack4

1.5*4=6[V]

PackS

1.5*10= 13[V]

Corriente

1800mA

1800mA

1800mA

1800mA

1800mA

Tiempo Estimado

17 horas

2horas

2horas

2horas

18horas

En lo que tiene que ver con la carga de las baterías se lo debe hacer luego de

que el robot haya funcionado el tiempo estimado de 2 horas a máximo

desgaste o 4 horas con uso intermitente y por un promedio de 4 horas tanto

para las fuentes de 6 [V] como para la fuente de 12[V].

A continuación se habla de lo referente a la rapidez de la respuesta del control

para lo cual se hizo pruebas en el prototipo para llegar a optimizar los tiempos y

Page 98: ESCUELA POLITÉCNICA NACIONAL - Repositorio …bibdigital.epn.edu.ec/bitstream/15000/11809/1/T2300.pdf · de audio y video implementado en el robot, hacia un receptor remoto o televisor

89

conseguir que el robot funciones lo más rápido posible después de recibir una

orden.

En la tabla 4.4 se indica el resultado de las pruebas de la rapidez con que el kit

de voz reconoce una palabra

Tabla 4.4 Tiempo de respuesta del kit de reconocimiento de voz

Acción

Requerimiento de

Palabra

Palabra del usuario

Requerimiento de

Repetición(Ocasional)

Reingreso de Palabra

del usuario

Confirmación del

Reconocimiento

Total

Tipo de orden del usuario

Normal o

Acertada

2.5[s]

2.5[s]max.

2.5[s]

2.5[s]max

2[S]

8-1 2 [s]

Errónea o

Equivocada

2.5[s]

2.5[s]max.

2.5[s]

2.5[s]max

2[s]

8-1 2 [s]

Vacía o

Sin instrucción

2.5[s]

-

2.5[s]

-

2[s]

7[s]

Como se observa en la tabla el tiempo de respuesta del reconocimiento de la

palabra u orden del usuario varia entre 8 y 12 segundos por lo que es sistema

no es muy rápido, más el proceso no amerita mayor rapidez ya que la

exploración y los movimientos son de manera pausada y no necesitan

velocidad sino precisión.

Cabe señalar que por las pruebas realizadas con el kit de reconocimiento de

voz y las característica técnicas que este proporciona es recomendable no

utilizar palabras fonéticamente similares, así como también palabras muy

largas o muy cortas es decir de una silaba o de más de 3 sílabas; todo esto

para evitar errores o falsos reconocimientos por parte del Voice Direct.

Page 99: ESCUELA POLITÉCNICA NACIONAL - Repositorio …bibdigital.epn.edu.ec/bitstream/15000/11809/1/T2300.pdf · de audio y video implementado en el robot, hacia un receptor remoto o televisor

90

Por ultimo se hablará de la transmisión de imagen y audio hacia el usuario,

esta parte constituye la de mayor conflicto dentro del desarrollo del proyecto,

ya que las pruebas de distancia de transmisión sobre los equipos arrogaron los

datos que se describen en la tabla 4.5

Tabla 4.5 Alcance de ios elementos transmisores del robot

Trasmisor de Audio y

video

Trasmisor de Audio

para instrucciones

Trasmisor de Datos

para instrucciones

distancia

Real

20m

5m

7m

Dada por el Fabricante

150m

20m

10m

Como se puede observar los datos obtenidos realmente indican una diferencia

muy alta con respecto a los datos del fabricante, esto se debe a la calidad de

los equipos ya que ai ser genéricos y de bajo costo no ofrecen las garantías

que si las brindan equipos especializados y de un mayor valor; mas por tratarse

de un prototipo en e! cual la distancia de transmisión no es un aspecto critico se

dejaron estos equipos con las características reales que presentaron.

4.2 RESULTADOS

Se ha construido un Robot innovador en el país, capaz de obedecer a

comandos de voz, enviar una imagen de su posicionamíento y también de

recoger objetos dentro de su exploración.

Este adelanto robotico nunca antes desarrollado en nuestro país consta de las

siguientes partes constitutivas.

> Tarjeta madre de control o cerebro de robot, montada dentro del chasis

del vehículo y encargada del control total de los movimientos del

prototipo, esta formada por un mícrocontrolador PIC de 28 pines que de

Page 100: ESCUELA POLITÉCNICA NACIONAL - Repositorio …bibdigital.epn.edu.ec/bitstream/15000/11809/1/T2300.pdf · de audio y video implementado en el robot, hacia un receptor remoto o televisor

91

manera inteligente conduce ai robot hacia la exploración según las

ordenes del usuario

Figura 4,1 tarjeta de control

> Kit de reconocimiento de voz (Voice Direct), montado sobre la tarjeta de

control y encargado de realizar el reconocimiento de las palabras u

ordenes del usuario, así como también permite almacenar los comandos

de voz que identifican dichas ordenes. Esta formado por un

microcontrolador RSC-300 de la sensory que gobierna el reconocimiento

de las palabras constituyéndose en una ¡nterfaz entre el usuario y el PIC

Figura 4,2 Kit de reconocimiento de voz

Page 101: ESCUELA POLITÉCNICA NACIONAL - Repositorio …bibdigital.epn.edu.ec/bitstream/15000/11809/1/T2300.pdf · de audio y video implementado en el robot, hacia un receptor remoto o televisor

92

Transmisor de Audio y Video montado en la parte superior del chasis del

vehículo es el encargado de transmitir la imagen del lugar donde el robot

esta realizando la exploración, asi como transmitir el audio del kit de

reconocimiento de voz para conocer si el mismo fue acertado o no. Este

elemento no fue implementado en el proyecto únicamente se lo incluyó

como componente o medio de transmisor en el cual se ingresan señales

de video de ia cámara y el audio de! kit y este a su vez transmite hacia

el receptor en !a banda de UHF.

ESí

Figura 4,3 Transmisor de video

Cámara infrarroja de video, montada sobre servomotores que a su vez

se encuentran encima de unas bases de aluminio en io alto del robot. Su

principal función es la de transmitir la imagen hacia el usuario sin

importar la oscuridad del ambiente ya que posee visión nocturna,

transmite una señal UHF.

Page 102: ESCUELA POLITÉCNICA NACIONAL - Repositorio …bibdigital.epn.edu.ec/bitstream/15000/11809/1/T2300.pdf · de audio y video implementado en el robot, hacia un receptor remoto o televisor

93

Figura 4.4 Cámara de Infrarroja de video

> Pinza recoge objetos, montada en el extremo posterior dei robot, es la

encargada de recoger objetos de mediano peso para transportarlos

hacía el exterior del medio de exploración esta formada por una

estructura de acrilico y dos servomotores que permiten 2 grados de

libertad en los movimientos de la misma.

Figura 4.5 Pinza recoge objetos

Page 103: ESCUELA POLITÉCNICA NACIONAL - Repositorio …bibdigital.epn.edu.ec/bitstream/15000/11809/1/T2300.pdf · de audio y video implementado en el robot, hacia un receptor remoto o televisor

94

> Panel de transmisión y grabación de ordenes, este es el panel que esta

con el usuario y por medio de! cual el mismo hace uso dei explorador

grabando ordenes o enviando las mismas para ser reconocidas. Posee

cinco pulsadores, uno para encender al robot, el segundo para ingresar

una orden al robot, el tercero para ingresar una orden a la memoria del

kit de reconocimiento de voz, e! cuarto para resetear al kit en caso de

ser necesario y ei quinto para borrar la memoria dei kit de

reconocimiento de voz.

-.-:-• ..-i.--.-Vj / v• í'-tf'WK " ' -' f 1u..; ~::-¿Ky~M¿a,.\rtr.-í -.

Figura 4.6 Control Remoto

4.3 LISTADO DE ELEMENTOS Y COSTOS

A continuación se presenta un listado con ios elementos utilizados en e!

presente proyecto y el costo de los mismos en dólares americanos:

Page 104: ESCUELA POLITÉCNICA NACIONAL - Repositorio …bibdigital.epn.edu.ec/bitstream/15000/11809/1/T2300.pdf · de audio y video implementado en el robot, hacia un receptor remoto o televisor

Tabla 4.6 Listado de elementos de la tarjeta madre con costos.

Elemento

Mícrocontrolador pie 16F876Cl 74LS373CI 74LS244CI74LS04Cl 74LS32Cristal 4MhzPulsadorCapacitores 0,1 uFCapacitores 22 nFTerminales de salidaCircuito impresoResistencia 1Kohm

Cantidad

121221142811

costo/unidad

$10,00$1,00$1,00$0,40$0,50$0,40$0,20$0,10$0,10$0,05

$10,00$0,02

Total

CostoTotal

$10,00$2,00$1,00$0,80$1,00$0,40$0,20$0,40$0,20$0,40

$10,00$0,02$26,42

Tabla 4.7 Listado de elementos del sistema de sensores con costos

Elemento

Cl IS471FResistencia 100 ohm.Led emisor de luzCapacitores 0,1 uFTerminales de salidaCircuito impresoTransistor Tip1 20Transistor 2N3904Resistencias 1KohmCircuito impreso*

Cantidad

9994991131

costo/unidad

$4,00$0,02$0,50$0,10$0,02$1,00$0,40$0,10$0,03$2,00

Total

CostoTotal

$36,00$0,18$4,50$0,40$0,18$9,00$0,40$0,10$0,08$2,00$52,84

*Circuito impreso utilizado también en la desconexión de los servomotores

Tabla 4.8 Listado de elementos del sistema de servomotores con costos

Elementos

ServomotoresPinza (incluida servomotores)Soporte para servomotoresSoporte para pinzaTransistor TIP1 20Transistor 2N3904Resistencia 1 KohmTerminales de salida

Cantidad

2111113

2

costo/unidad

$17,00$120,00$1,00$0,40$0,40$0,10$0,02$0,05

Total

CostoTotal

$34,00$120,00$1,00$0,40$0,40$0,10$0,06$0,10

$156,06

Page 105: ESCUELA POLITÉCNICA NACIONAL - Repositorio …bibdigital.epn.edu.ec/bitstream/15000/11809/1/T2300.pdf · de audio y video implementado en el robot, hacia un receptor remoto o televisor

96

Tabla 4.9 Listado de elementos de la tarjeta de control de los motores DC concostos

Elemento

Relés 5V

Transistor TI P 120

Transistor 2N3904Resistencia 1Kohm; 4,7Kohm

Diodos 1N41 48Diodos 1 N4007Terminales de salida

Circuito impresoCapacitores 0,1 uF

Cantidad

22

4108

2

5

12

costo/unidad

$1,50

$0,40

$0,10$0,02$0,10

$0,15

$0,05

$5,00$0,15

Total

CostoTotal

$3,00$0,80

$0,40$0,20

$0,80

$0,30

$0,25

$5,00$0,30

$11,05

Tabla 4.10 Listado de elementos de la tarjeta de aislamiento de tierras en losmotores DC con costos

I Elemento

Opto acopladores

Resistencia 1 KohmCircuito impreso

Cantidad

4

8

1

costo/unidad

$0,80

$0,02$4,00

Total

CostoTotal

$3,20

$0,16$4,00

$7,36

Tabla 4.11 Listado de elementos del sistema de baterías con costos

Elemento

Baterías 1,2 Voltios 1800mA

Baterías 1,2 Voltios 1300mA

Terminales para cargaTerminales de conexión de bateríasInterruptores

Cantidad2010

2

105

costo/unidad

$1,80

$2,20

$0,25

$0,05$0,25

Total

CostoTotal

$36,00

$22,00$0,50

$0,50

$1,25

$60,25

Tabla 4.12 Listado de elementos Sistema de transmisión de audio y video con

costos

Elemento

Transmisor de UHFCámara monocromática con luzinfrarrojaTerminales de conexión

Cantidad

1

14

costo/unidad

$40,00

$70,00

$0,05Total

CostoTotal

$40,00

$70,00$0,20

$110,20

Page 106: ESCUELA POLITÉCNICA NACIONAL - Repositorio …bibdigital.epn.edu.ec/bitstream/15000/11809/1/T2300.pdf · de audio y video implementado en el robot, hacia un receptor remoto o televisor

97

Tabla 4.13 Listado de elementos Sistema de Recepción y Transmisión dedatos con costos

Elemento

Transmisor y receptor de datosTransistores 1 N3904Leds indicadoresTerminales de conexiónPulsadoresFuente de alimentación de 8VInterruptoresCaja para transmisor de datosCircuito impreso

Cantidad

144441211

costo/unidad

$11,00$0,10$0,40$0,05$0,25$4,00$0,25

$10,00$3,00

Total

CostoTotal

$11,00$0,40$1,60$0,20$1,00$4,00$0,50

$10,00$3,00

$31,70

Tabla 4.14 Listado de elementos Sistema de Recepción y Transmisión deaudio con costos

Elemento

Micrófono con receptorCircuito para reducir voltaje a 1 ,5VTerminales de conexiónCaja para aislar circuito

Cantidad

1121

costo/unidad

$8,00$1,00$0,05$2,00

Total

CostoTotal

$8,00$1,00$0,10$2,00$11,10

Tabla 4.15 Listado de elementos Sistema de reconocimiento de voz concostos

Elemento

Kit de reconocimiento de vozTerminales de conexiónCaja para aislar circuito

Cantidad

161

costo/unidad

$70,00$0,05$4,00

CostoTotal

$70,00L_ $0,30

$4,00Total $74,30

Tabla 4.16 Listado de elementos de los artículos varios con costos

Elemento

Chasis para ensamblajeLeds de IluminaciónCable de bus de datosPlancha de acrílicoCircuito oscilador para luces

Cantidad

16211

costo/unidad

$75,00$0,40$0,80$3,00$3,00

Total

CostoTotal

$75,00$2,40$1,60$3,00$3,00

$85,00

Total de costo en materiales $626,28

Page 107: ESCUELA POLITÉCNICA NACIONAL - Repositorio …bibdigital.epn.edu.ec/bitstream/15000/11809/1/T2300.pdf · de audio y video implementado en el robot, hacia un receptor remoto o televisor

98

Una vez presentado el costo de materiales utilizados en el proyecto, hay que

hacer un análisis de costo de investigación y desarrollo, para lo cual se toma en

cuenta el tiempo utilizado en el diseño y la construcción de todos los

componentes del vehículo. Así en la tabla 4.7 se presenta el costo de

ingeniería:

Tabla 4.17 Costos de mano de obra

Actividad

Diseño de hardwareDiseño de software

tiempo(meses)

23

Costomensual

$400,00$400,00

total

$800,00$1.200,00

Total $2.000,00

Por ío tanto el costo total estaría luego de ia suma del valor de los costos de

ingeniería y de los materias, así se tiene un costo total de $2.626,28.

Page 108: ESCUELA POLITÉCNICA NACIONAL - Repositorio …bibdigital.epn.edu.ec/bitstream/15000/11809/1/T2300.pdf · de audio y video implementado en el robot, hacia un receptor remoto o televisor

99

CAPITULO 5

5 CONCLUSIONES Y RECOMENDACIONES

• El robot explorador tipo oruga controlado por voz es una realidad y

permite recorrer caminos difíciles para otro tipo de vehículo, así como

recoger muestras del lugar de exploración. Su costo es relativamente

alto ya que esta constituido por elementos y partes no existentes dentro

del mercado ecuatoriano, más si se compara el mismo con el del único

modelo de robot similar actualmente como es el Spírit(USA) se puede

decir que es muy barato.

Se ha comprobado que el reconocimiento de voz es una gran

herramienta que no ha sido desarrollada aun en nuestro país, y que

ofrece una verdadera comunicación directa y confiable entre el hombre y

la maquina, cosa que antiguamente se constituía en un sueño, ya que la

manera de comunicación con la maquina era por medio de interfaces

gráficas, botones o hmi's que necesitaban de acciones físicas del

usuario. Mas ahora se puede controlar a todo tipo de maquinaria por

medio de nuestra voz y con palabras comunes como si se estuviera

hablando con un operario más dentro de la industria.

Este sistema de exploración posee ventajas sobre los otros sistemas

existentes, pues en este caso el usuario no necesita más que su voz

para poder realizarlo, permitiendo de esta manera la libertad de tener las

manos ocupadas en otra actividad si eso se requiere, o lo que es mejor

permite que sea manejado por personas físicamente discapacitadas que

sin este sistema nunca pudieran ser tomadas en cuenta para dicho

proceso.

Page 109: ESCUELA POLITÉCNICA NACIONAL - Repositorio …bibdigital.epn.edu.ec/bitstream/15000/11809/1/T2300.pdf · de audio y video implementado en el robot, hacia un receptor remoto o televisor

100

Dentro del prototipo no se implanto un circuito indicador del estado de

las baterías ya que el robot por lo general estará lejos del usuario y este

no tendrá la capacidad de observar este indicador ni siquiera por medio

de la cámara pues es a blanco y negro, por esta razón se prefirió dar un

tiempo estimado de funcionamiento basado en las pruebas, que será de

mayor utilidad para conocer cuando y cuanto tiempo el robot podrá

funcionar eficientemente y así mismo que tiempo deberá ser recargado

de energía antes de una nueva exploración.

Se puede mejorar el sistema corrigiendo la única falencia actual del

robot que es el alcance, con un transmisor de mayor potencia y mejores

características que el implementado actualmente; esto brindaría la

posibilidad de enviar al explorador a varios kilómetros de distancia,

pudiendo ser utilizado para explorar partes peligrosas como zonas de

derrumbes o zonas con explosivos.

La respuesta del control no es rápida y se debe a la programación de

fábrica con la que viene el RSC-300 dentro del kit de voz, a pesar de

esta lentitud esto se compensa con el alto grado de amigabilidad que

posee el sistema, ya que el usuario llega a familiarizarse mucho con el

robot. De todas maneras para evitar que esta demora del

reconocimiento de las palabras u ordenes afecte al prototipo se

desarrollo en el software la condición de que el robot deje su actividad y

se quede inmóvil al recibir la señal de ingreso de palabra u orden de

acción.

Para futuros proyectos que utilizan transmisión de audio y video se

recomienda utilizar equipos de mejor calidad que no presenten

interferencias y que brinden el alcance esperado pues este fue el único

Page 110: ESCUELA POLITÉCNICA NACIONAL - Repositorio …bibdigital.epn.edu.ec/bitstream/15000/11809/1/T2300.pdf · de audio y video implementado en el robot, hacia un receptor remoto o televisor

101

inconveniente que se presento durante el desarrollo del proyecto; así

mismo se espera que este prototipo sea eí pionero en la investigación

del manejo de la voz en el país, área en la que lastimosamente no existe

ningún tipo de desarrollo.

Se recomienda seguir trabajando con el microcontrolador RSC-300 de la

sensory que posee grandes cualidades entre ellas la del manejo de la

voz, muchas de estas cualidades no se las pudieron usar en todo su

esplendor en el robot, pero sin duda constituyen un potencial de trabajo

e investigación; para lo cual se requieren herramientas como son el

ensamblador y el hardware de programación, que lastimosamente no

existen en el país en la actualidad.

Para el manejo correcto del prototipo se recomienda leer el manual de

usuario que se encuentra en el Anexo A para evitar de esta manera un

mal uso del robot que lo llevaría a un deterioro temprano y lo que es

peor a una mala exploración del medio.

Por ultimo se logro contribuir con el avance tecnológico del Ecuador,

creando un robot acorde con los avances científicos del nuevo milenio;

se espera que esto sirva de ejemplo para generaciones futuras, ya que

con esfuerzo y dedicación se pueden cumplir todas las metas trazadas.

Page 111: ESCUELA POLITÉCNICA NACIONAL - Repositorio …bibdigital.epn.edu.ec/bitstream/15000/11809/1/T2300.pdf · de audio y video implementado en el robot, hacia un receptor remoto o televisor

102

REFERENCIAS BIBLIOGRÁFICAS

[1] http://w\AW.euskalnet.net/iosus/speech/recoq.html

Ron Colé, "Aplicaciones de reconocimiento de voz", Oregon Instituto,

2000

Revisado 15/03/2004

Esta página trata sobre ei tipo de reconocimientos que se han

establecidos hasta la actualidad (primera parte).

[2] http://www.euskalnet.net/iosus/speech/recog.htmi

J.M. Montero*, J. Gutiérrez-Arriola*. J. Colas*, J. Macías-Guarasa*, E.

Enríquez**, J.M. Pardo*, "desarrollo de un sintetizador de habla en

español", Universidad Politécnica de Madrid

Revisado 10/03/2004

Esta página trata sobre el tipo de reconocimientos que se han

establecidos hasta la actualidad (segunda parte).

[3] http://www.euskalnet.net/iosus/speech/recoq.html

Ing. Andrés Flores Espinoza, "Reconocimiento de voz", Octubre 1998.

Revisado 10/03/2004

Esta página trata sobre las técnicas que se utilizan para realizar el

reconocimiento.

[4] http://www.euskalnet.net/iosus/speech/habla.html

Revisado 10/03/2004

Esta página trata sobre como el proceso reconoce al hablante.

[5] http://www.euskalnet.net/iosus/speech/habla.html

Revisado 10/03/2004

Esta página trata sobre como el proceso reconoce al hablante.

[6] http://www.euskalnet.net/iosus/speech/recQq2.html

Revisado 10/03/2004

Esta página trata sobre el reconocimiento de la voz.

[7] http://www.euskalnet.net/iosus/speech/recoq2.html

Revisado 10/03/2004

Esta página trata sobre como se hace un modelo del tracto vocal.

Page 112: ESCUELA POLITÉCNICA NACIONAL - Repositorio …bibdigital.epn.edu.ec/bitstream/15000/11809/1/T2300.pdf · de audio y video implementado en el robot, hacia un receptor remoto o televisor

f103

[8] http://www.sensorvinc.com/htmi/products/rsc364.html

http://www.sensorvinc.com/

Revisado 05/02/2004

Especificaciones del kit de reconocimiento de voz

[9] Hoja de especificaciones técnicas del microcontrolador RSC 300/364 de la

sensoryinc

^ Vigente desde 2002, fabricado por la Sensory.inc, Adquirido en Jameco,

tiene 42 hojas de características técnicas.

[10] Hoja de especificaciones técnicas del Voice Direct II , "speech

recognition kit "de la sensoryinc

[11] Hoja de especificaciones técnicas del Sensor Infrarrojo SHARP ISF471

Daniel Martín, "sensores", 2001-2004

[12] http://www.sapiensman.com/color digital/

Revisado 24/04/2004

Esta página trata sobre los métodos que utilizan los sensores de vídeo

para digitalizar las imágenes.

[13] http://www.ii.uam. es/~mecatron/índex.php3

I Revisado 20/04/2004

Presenta algunos proyectos de sistemas robóticos construidos en la

Universidad Nacional de Colombia. Muestra la forma de construcción del

robot observer

[14] http://www.nasa.com

Revisado 20/04/2004

Presenta la hoja con los trabajos de la NASA

[15] Nelson Sotomayor, L Andrango, "Simulación y Ensamblaje de un

Prototipo para control y navegación de un robot móvir, EPN, 1999.

Page 113: ESCUELA POLITÉCNICA NACIONAL - Repositorio …bibdigital.epn.edu.ec/bitstream/15000/11809/1/T2300.pdf · de audio y video implementado en el robot, hacia un receptor remoto o televisor

104

ANEXOS

Page 114: ESCUELA POLITÉCNICA NACIONAL - Repositorio …bibdigital.epn.edu.ec/bitstream/15000/11809/1/T2300.pdf · de audio y video implementado en el robot, hacia un receptor remoto o televisor
Page 115: ESCUELA POLITÉCNICA NACIONAL - Repositorio …bibdigital.epn.edu.ec/bitstream/15000/11809/1/T2300.pdf · de audio y video implementado en el robot, hacia un receptor remoto o televisor

A continuación se enlistaran una serie de posibles fallas en el funcionamiento

normal del robot, así como las soluciones para mantenerlo siempre funcionado

correctamente.

FALLA

• No hay recepción clara de la señal emitida por el robot

SOLUCIÓN

• Puede ser que la antena no este levantada, o que a su vez esta fue

removida de su lugar, lo que produce una pésima recepción. Además'es

posible que el canal receptor no se encuentre bien sintonizado. Favor

sintonizar bien el receptor o a su vez el transmisor del vehículo.

FALLA

• Existe recepción en video pero no en audio.

SOLUCIÓN

1. El control remoto no esta encendido, proceda a encenderlo.

2. El plug de salida de audio del kit de reconocimiento de voz esta

desconectado. Proceda a conectaren la posición indicada.

FALLA

• La orden de voz llega al robot, pero éste no realiza la orden.

SOLUCIÓN

• El robot esta apagado. Proceda a encenderlo presionando el botón 3 del

control remoto, de esta forma el robot colocara la cámara y la pinza en

posición inicial, entonces podrá receptar ordenes.

FALLA

• El robot esta en modo automático. Y empieza a girar en círculo.

Page 116: ESCUELA POLITÉCNICA NACIONAL - Repositorio …bibdigital.epn.edu.ec/bitstream/15000/11809/1/T2300.pdf · de audio y video implementado en el robot, hacia un receptor remoto o televisor

SOLUCIÓN

1. El robot esta con una oruga trabada. Por favor gire la oruga de modo

que esta saiga de! bloqueo,

2. Uno de los sensores esta desconectado, la señal no llega

correctamente a la tarjeta madre, proceda a revisar la conexión de

cada uno de los sensores, de esta forma todas las señales llegaran a

la tarjeta.

3. La batería de una de las orugas esta descargada. Proceda a cargar

las baterías.

FALLA

• El transmisor esta encendido pero la señal del robot no aparece.

SOLUCIÓN

• Se necesita sintonizar correctamente el canal en el receptor de televisión,

Recuerde que la señal de transmisión esta en UHF, así que el usuario

puede encontrar en esta banda la señal transmitida.

FALLA

• El transmisor no enciende.

SOLUCIÓN

• La batería del mismo esta descargada. Favor proceder a cargar con el

voltaje especificado.

FALLA

• El robot enciende pero los servomotores no se accionan.

SOLUCIÓN

1. Los interruptores de carga de batería están en modo carga (posición

OFF) procederá colocarlos en posición ON.

2. Las baterías están descargadas, proceder a cargarlas de acuerdo a

lo antes mencionado.

Page 117: ESCUELA POLITÉCNICA NACIONAL - Repositorio …bibdigital.epn.edu.ec/bitstream/15000/11809/1/T2300.pdf · de audio y video implementado en el robot, hacia un receptor remoto o televisor

Nota

Esta falla puede afectar también a los sensores, por lo que se debe proceder a

colocar en posición ON el interruptor 3

FALLA

• El robot esta en modo automático. Y existen objetos que no los esquiva.

SOLUCIÓN

• Cuando la manipulación de vehículo es constante los sensores tienden a

moverse de su posición original. Por lo que pierde la capacidad de divisar

todos los obstáculos que se puedan atravesar en su camino. Por lo que se

debe enderezar los soportes de los sensores para que estos vuelvan a

detectar los obstáculos dentro de la trayectoria explorada.

FALLA

• El usuario presiona el botón 2 del control remoto, y el robot responde

"memoria borrada"

SOLUCIÓN

. Debido a que el transmisor de datos del robot, es uno convencional, y se

encuentra en badas de trabajo común en el medio, puede ser que se filtren

señales y el robot las entienda como ordenes, entonces este procederá a

realizarlas de acuerdo a lo ya programado, Y en este caso a borrar la

memoria. Entonces se solicita al usuario cargar nuevamente la lista de

palabras en el orden ya descrito en capítulos anteriores.

FALLA

• La pinza no siente objeto el momento de cerrar.

SOLUCIÓN

• El sensor de fin de carrera de la pinza esta desconectado y la misma no

reconoce un objeto. Proceda a revisar este sensor. Recuerde que el mismo

se encuentra conectado en el pin 2 del conector numero 9.

Page 118: ESCUELA POLITÉCNICA NACIONAL - Repositorio …bibdigital.epn.edu.ec/bitstream/15000/11809/1/T2300.pdf · de audio y video implementado en el robot, hacia un receptor remoto o televisor

ANEXO BCIRCUITOS IMPRESOS Y

ELEMENTOS UTILIZADOS

Page 119: ESCUELA POLITÉCNICA NACIONAL - Repositorio …bibdigital.epn.edu.ec/bitstream/15000/11809/1/T2300.pdf · de audio y video implementado en el robot, hacia un receptor remoto o televisor

Figura B - 1 Tarjeta madre lado A

Figura B ~ 2 Tarjeta madre lado B

Page 120: ESCUELA POLITÉCNICA NACIONAL - Repositorio …bibdigital.epn.edu.ec/bitstream/15000/11809/1/T2300.pdf · de audio y video implementado en el robot, hacia un receptor remoto o televisor

*+

3-so *»+

O

O O

«P'sfc»

v«r

g

"o

o »

o oo «4

€*e -O

IHO

Figura B - 3 Ubicación de los elementos de ia tapeta madre

Los elementos que están utilizados en la tarjeta son los siguientes:

ElementoMicroconírolador pie 16F876CI74LS373Cl74LS244CI74LS04CI74LS32Cristal 4MhzPulsadorCapacitores 0,1 uFCapacitores 22 nFResistencia 1 Kohm

Cantidad1212211421

Page 121: ESCUELA POLITÉCNICA NACIONAL - Repositorio …bibdigital.epn.edu.ec/bitstream/15000/11809/1/T2300.pdf · de audio y video implementado en el robot, hacia un receptor remoto o televisor

Figura B - 4 Tarjeta de acondicionamiento de las señales del transmisor de datos

JP2

lR1

R12

Figura B - 5 Ubicación de los elementos en la tarjeta

Los elementos que están utilizados en la tarjeta son los siguientes:

ElementoTransistores 1N3904Resistencias 1 KohmLeds indicadores

Cantidad5124

Page 122: ESCUELA POLITÉCNICA NACIONAL - Repositorio …bibdigital.epn.edu.ec/bitstream/15000/11809/1/T2300.pdf · de audio y video implementado en el robot, hacia un receptor remoto o televisor

Figura B - 6 Tarjeta de activado de los servomotores y sensores

MtfH

Figura B - 7 Ubicación de los elementos en la tarjeta

Los elementos que están utilizados en la tarjeta son los siguientes:

ElementoTransistor 2N3904Transistor TIP120Resistencia 1 Kohm

cantidad113

Page 123: ESCUELA POLITÉCNICA NACIONAL - Repositorio …bibdigital.epn.edu.ec/bitstream/15000/11809/1/T2300.pdf · de audio y video implementado en el robot, hacia un receptor remoto o televisor

Figura B - 8 Tarjeta de los sensores

(oÜJojc-i

Figura B - 9 Ubicación de los elementos en la tarjeta

Figura B - 10 Tarjeta de control de los motores DC lado A

Page 124: ESCUELA POLITÉCNICA NACIONAL - Repositorio …bibdigital.epn.edu.ec/bitstream/15000/11809/1/T2300.pdf · de audio y video implementado en el robot, hacia un receptor remoto o televisor

Figura B -11 Tarjeta de control de los motores DC lado B

Figura B -12 Ubicación de los elementos en la tarjeta de control de los motores DC

Esta tarjeta cuenta con:

Relés 5V 2Transistor Ti P 120 2Trransistor 2N3904 4Resistencia 1Kohm; 4t7Kohm 10Diodos 1N4148 8Diodos 1N4007 2Capacitores O.TuF 2

Page 125: ESCUELA POLITÉCNICA NACIONAL - Repositorio …bibdigital.epn.edu.ec/bitstream/15000/11809/1/T2300.pdf · de audio y video implementado en el robot, hacia un receptor remoto o televisor

ANEXO CESPECIFICACIONES TÉCNICAS

Page 126: ESCUELA POLITÉCNICA NACIONAL - Repositorio …bibdigital.epn.edu.ec/bitstream/15000/11809/1/T2300.pdf · de audio y video implementado en el robot, hacia un receptor remoto o televisor

SI-MXRF» IS471F

IS471F OPIC Light Detector with Built-in SignalProcessing Circuit for Light Modulation System

• Features

1. JLmpervious to extemal disturbing lightsdue to HghtTnodulatíon system

2. Buüt-in pulse driver circuit and sync.detector circuit on the emítter side

3. A wide range of operating supply voltage(Vcc:4.5tol6V)

• Applications

1. Optoelectronic switches

2. Copiers= printers3. Facsímiles

Outline Dimensíons (Unít: mm)Internal connection diagram

Voltsge regulator

*"OPIC " (Optical 1C) !s a trademailc of the SHARP Corporanon.Aa OPIC coaslsts of a líght-deíectüig eiemcní and sígnal-processíng circuit íntcgrated onto a single cbip.

Absolute Máximum Ratings (Ta-25°C)Parameter

Supply voltage

Output

M GL oulpul

Output voltageOutput currcntOutput voltage

Power dissipaííonOperating temperatureStorage temperature

^ Soldering temperature

SymbolVccVolo

VGLP

J opc

T^TMJ

Rating-0^ to 16

1650

16250

-25to+60-40to+100

260

UnitVV

mAV

mW•c•c*C

Resin poríion

/ .— Soldering portíon/ (Immersed up to bendíng portíon)

* I Applícs lo GL un terminai*2 For 5 seconds at the positíon shown in the right figure

Page 127: ESCUELA POLITÉCNICA NACIONAL - Repositorio …bibdigital.epn.edu.ec/bitstream/15000/11809/1/T2300.pdf · de audio y video implementado en el robot, hacia un receptor remoto o televisor

SHARP IS471F

Electro-óptica! Characteristics (V«r= 5V, Ta= 25°C)

Parameter

Operating supply vollage

Supply cutrent

Ouíput

GLoutput

Lowlevcl otiíput vollage

High leve! outpui voJíage

GutpiA shori circuí carenl

Low level output current

'*Pulse cycle

""Pulse width

*5"Low-íHigh " threshold irradiance

>5"High->Low" thrcshold inadiaEce

Hysteresís

Responso

time

" High—» Low"propagación dclay lime" Lo w— » High"propagación deafy time

*7 Externa! dislurbing light illumínance

Symbol

VccIce

Vor,VOH

los

IGL

ÍPtw

Eel-Líl

EePHt

E ePLH /E ePRL

tpRL

tpLH

EVDX

Condítions

-Vo, GL «i termináis shall be opead.

loL=l6mA,Evp=500lx,BvD=0'í

EVD= .Evp= 0-3

Evp= EVD= 0"J

VOL= 1.2V

-_

£eD= O'3Light croittingdiode ÍX p= 940nm )"6

*6*6Eep=7¿llWftnni2,'J).ii=940nra

MIN.4.5--

4.97

0.2S4070

4.4--

0.45--

2000

TYP. | MAX.-

3.50.15

-

0.5551308

0.4

0.70.65400400

7500

167.0

0.35-

1.0

7022013.72.66

2,80.95670670.

Unit

VmA

VV

mAmA.^s\ÍS

liW/mm2

|lW/mm2

-Jts\LS

Ix

*3 Hcp represcnts illiirainance of signal ligbt in sync with the low level timing of output a

EtD represents illumínance of DC Ught. Foc detall, see Fíg. 1.

Light source: Ijifrared Ught emittíng diode CX p= 940nm )

Evp represents illurainance of signal light ín sync wíth the low level timing of output a

terminal.

emsínal.

EVD reprcsentsilluminanceof DC Hght. Note Üiat the líght source ís CIÉ standard lígh) soiirceA.

Fig.1

Time (Note) Fig. 1 shows Ihe oulpuf waveíbrra at GL outterminal with IS471F connected as slwwn ínfíg.3.

Output wavefomiai GL out tennina!

*4 Pulse cycle(t $, pulse width (t w) are defined as shown in Fig. 2.The wavcfonnshowninFig. 2 ístbe output voUagewavcforraatGLom terminal with IS471F connectcdasshown Ín Fig. 3

Fig.2 Fig.3

5V

ov

*5 Defined as Eq, that causes the output to go" Low to High" Cor" High to Low" ).

Page 128: ESCUELA POLITÉCNICA NACIONAL - Repositorio …bibdigital.epn.edu.ec/bitstream/15000/11809/1/T2300.pdf · de audio y video implementado en el robot, hacia un receptor remoto o televisor

SHARP IS471F

*6 Test círcuitfor response lime, thieshold írradiance is shown in Fig. 4.

Fig. 4Vin

Switch

Ughtemittingdiode

IS471F

2BOílSwitch

GND

_Q.33nFT5V

JLight emitting diode: peakemÍssionwavelenghXj.= 940nm

*7 £ VDX-Dcfíncdas thcEvo atthcliraíl of normal opciation range.

OFF

Fig. 5 Power Dissipation vs.Ambient Temperature

250

200

50

0

\\5 0 25 50 60 75 100 i;

Ambíent lemperature T^ (*C)

Fig. 7 Low Level Output Voltage vs.Ambient Temperature

o.i

-25 O 25 50 75

Ambient temperaíure Ta ("C)

Fig. 6 Low Level Output Voltage vs.Low Level Output Current

0.1

± 0.05

0.02

0.0 1

VCC= 5VT,= 25'C

L 2 5 10 20 50 100

Low level output currcnt J QL (mA)

Fig. 8 Supply Current vs. Supply Voftage

2 4 6 S 10 12 14 16

Supply voltage Va-(V)

Page 129: ESCUELA POLITÉCNICA NACIONAL - Repositorio …bibdigital.epn.edu.ec/bitstream/15000/11809/1/T2300.pdf · de audio y video implementado en el robot, hacia un receptor remoto o televisor

SHARP IS471F

Fig. 9 Low Level Output Currentvs.Supply Voltage

Fíg.10 Sensitivity Diagram (T, = 25'C)

^ 70

~ 60o

i 503 -10£•

1 30

"í 20

2 4 6 8 10 12 14 16 18

Supply voltage Vcc (V)

Fig.11 Spectral Sensitivity

JOO

90

80,

'! 50

2 40_>I 30oí

20

10

O400 500 600 700 800 900 IOOQ 1103 1200 BQQ 1400

Wavelength X (nm)

-HO* +20*

Angular displaccmaií 6

Basic Circuit

Infrared üghtemitting diode

# la ordcr lo stabi'Iize powcr supply Une, connect a by-pass capacitor ofQ33}iformorc bctwcen Vcc and GNP near the dcvícc.

i Flease refer lo the chapter "Frccautíons for Use."

Page 130: ESCUELA POLITÉCNICA NACIONAL - Repositorio …bibdigital.epn.edu.ec/bitstream/15000/11809/1/T2300.pdf · de audio y video implementado en el robot, hacia un receptor remoto o televisor

(*

Vo

ice D

ire

ct™

II

Spe

ech

Rec

ogni

tion

Kit

Qu

íckS

tart

Man

ual

S E

N

S

O

R

Y

© 2

003

Senso

r/,

Inc.

P/N

80-

0240

-A

Page 131: ESCUELA POLITÉCNICA NACIONAL - Repositorio …bibdigital.epn.edu.ec/bitstream/15000/11809/1/T2300.pdf · de audio y video implementado en el robot, hacia un receptor remoto o televisor

Vot

ce D

lrect

™ II

Spe

ech

Rec

og

nltl

on

Kit

Qui

ck S

tart

Man

ual

CO

iV5T

/ít/C

770A

'-..—

....

. ...M

...

....—

M

...M

.,..,..., -

-

...„...._..............«

4

OU

TPU

TS*. ....................

...................

„..,.

„...„

„ ..

, „._

.....

., .....

„.„.

,- ™

,^.~,

. ...„

-..»

............

~.................

5

SYST

EMD

ESÍG

N .

~

3

6. iM

olhe

rbna

rd a

nd M

odul

e l'l

mm

l and

Cha

ract

erli

tlu

—„.

__

.._

_-

___.

..,_

_„.

__„—

..—

_

. f>

MO

DES

ELEC

T10N

.....:.

, 9

TRAl

XING

AND

RECO

GNf

flONS

ELEC

TJW

T}'.

9

MO

DU

LE P

MC

HAR

ACTE

RiST

lCS

* ¡O

7.T

rtln

lnB

Vol

ccI)

lrec

trMII

.

.. ,.

U

EDG

E-TJ

tIGG

ERED

SI

NGLE

-REC

OG

N1T1

0N (

ESR)

Í.1

0DE.

~.

U

MU

L7t-T

RlG

GER

CO

tJTl

NU

OU

SLlS

TE¿/

lNG

(f,tC

L)M

OD

E ..

12

SlN

GLE

-TRl

GG

ERW

QRD

.SP0

7TM

GM

QD

E(S»

'S)íl

tDD

E 13

EDG

&TR

IGG

ERED

SlN

GLE

-REC

OG

NffJ

QN

(ESR

) M

QD

E ,

13

StN

GLE

-TRI

GG

ERC

ON

TliV

UO

USL

lSTE

fiMG

pCLJ

MO

DE.

_

/-f

MU

Ln-T

R¡G

GER

CQ

NTI

t¿U

QU

SUST

&m

G

(MCI

) M

OD

E „

15

SING

LE-T

RJG

GER

W

ORD

-SP0

1TJN

G

(SK'

S) M

OD

E 16

10.T

.!p*

for

Opl

lttul

Per

form

ance

»™

_...,

_—

. ™

—...

.. .

......

......

...

.—„.

,_.

.17

11. S

chci

natlc

í for

Vol

ee IH

rect

™ U

Mod

ule

and

Mol

herb

o»rd

._

, ._

.„.„

.„

. .......

. „

18

13. V

olee

Dir

ect"

1 II S

|W«h

Kec

ognl

tlon

Kil

Lim

ited

War

ranf

y v

20

14. S

ENSO

RY

Sof

twar

e En

d U

wr

Licc

nse A

gree

nicn

t „_.

«.

_.

-„

, .~

.-™

_—~.

—.2

1

15.T

he I

nter

activ

eSiK

Wh^

'líro

ducl

Une

.—

.--.

23

P/N

80

-02

40

-A©

200

3 S

enso

ry I

nc.

Qul

ck S

tart

Man

ual

Vol

ee D

lrec

t™ II

Spe

ech

Reco

gnltl

on

Klt

15,

The

Inte

ract

ive

Spe

ech™

Pro

duct

Lin

eTh

e In

tera

ctiv

e S

peec

h Un

e of

)C

s an

d so

ftwar

e w

as d

evel

oped

to

"brln

g U

fe to

pro

ducí

s" t

hrou

gh a

dvan

ced

spee

ch r

ecog

nltlo

n an

d au

dio

tech

nolo

gy,

The

Int

erac

tive

Spe

ech

Pro

duct

Une

was

des

lgne

d fo

r co

nsum

er t

elep

hony

pro

duct

s an

d co

st-s

ensl

t]ve

cons

umer

ele

ctro

nlc

appl

lcat

lons

suc

h as

hom

e el

ectro

nlcs

, pe

rson

al s

ecur

lty,

and

pers

onal

com

mun

lcat

lon.

The

prod

uct

Une

Incl

udes

aw

ard-

wln

nlng

RSC

ser

les

gene

ral-p

urpo

se m

lcro

cont

rolle

rs a

nd to

ols,

SC

ser

les

ofsp

eech

mlc

roco

ntro

llers

, pl

us a

Une

of

easy

-to-

lmpl

emen

t ch

lps

that

can

be p

ln-c

onflg

ured

or

cont

rolle

d by

an e

xter

nal

host

mlc

roco

ntro

ller,

Sen

sory

's s

oftw

are

tech

nolo

gles

run

on

a va

rlety

of

mlc

roco

ntro

llers

and

DSP

s.

RSC

Mlc

roco

ntr

olle

rs a

nd T

oo

lsT

he R

SC

pro

duct

Une

con

taln

s lo

w-c

ost

8-b

lt sp

eech

-opt

lmlz

ed m

lcro

cont

rolle

rs d

eslg

ned

for

use

ln c

onsu

mer

el

ectron

es,

All

mem

bers

of

the

RS

C fa

mlly

ar

e fu

lly I

nteg

rate

d an

dIn

clud

e A

/D,

pre-

ampl

lfler

, D

/A,

RO

M, a

nd R

AM

clrc

ultr

y. T

he R

SC

fam

lly c

an p

erfo

rm a

ful!

rang

e of

spe

ech/

audl

o fu

nctlo

ns I

nclu

dlng

spe

ech

reco

gnltl

on,

spea

ker v

erlfl

catío

n, s

peec

han

d m

uslc

sy

nthe

sls,

an

d vo

lee

reco

rd/p

layb

ack.

Th

e fa

mlly

Is

su

ppor

ted

by

a co

mpl

ete

sulte

of

eval

uatlo

n to

ols

and

deve

lopm

ent

klts

,

SC M

lcro

contr

olle

rs a

nd T

ools

The

SC

-6x

prod

uct

Une

feat

ures

the

hlg

hest

qua

llty

spee

ch s

ynth

esls

IC

s at

the

low

est d

ata

rate

in t

heIn

dust

ry. T

he U

ne in

dude

s a

12.3

^ M

IPS

pro

cess

or f

or h

lgh-

qual

ity [

ow d

ata-

rate

spe

ech

com

pres

slon

and

MID

I m

uslc

syn

thes

ls, w

lth p

lent

y of

pow

er le

ft ov

er f

or o

ther

pro

cess

or a

nd c

ontr

ol f

unct

lons

, M

embe

rsof

the

5C

-6x

Une

can

sto

re a

s m

uch

as 3

7 m

inut

es o

f sp

eech

on

chlp

and

Indu

de a

s m

uch

as

64 I/

O p

lns

for

exte

rnal

Int

erfa

clng

. In

tegr

atln

g t

hls

broa

d ra

nge

of f

eatu

res

onto

a s

ingl

e ch

lp e

nabl

es d

evel

oper

s to

créa

te p

rodu

cts

wlth

hlg

h q

uallt

y, lo

ng d

urat

lon

spee

ch a

t ver

y co

mpe

tltlv

e pd

ce p

olnt

s.

Applic

atio

n S

pecl

flc S

tand

ard

Pro

duct

s (A

SS

Ps)

» V

olee

O/rect

'" II

pr

ovld

es in

expe

nsiv

e sp

eake

r-de

pend

ent

spee

ch r

ecog

nltlo

n an

d sp

eech

syn

thes

ls,

Thl

s ea

sy-t

o-us

e,

pln-

conf

lgur

able

chl

p re

qulre

s no

cus

torn

pro

gram

mln

g an

d ca

n re

cogn

lze

up t

o 15

Wor

ds I

n 4

pln-

prog

ram

mab

le m

odes

, Id

eal

for

spea

ker-

depe

nden

t co

mm

and

and

cont

rol

of h

ouse

hold

cons

umer

pro

duct

s, V

olee

Dlre

ct™

11

|s p

arí

of a

com

plet

e pr

oduc

t Un

e th

at in

clud

es th

e IC

, m

odul

e, a

ndV

olee

Dlre

ct"1

II S

peec

h R

ecog

nltjo

n K

lt,•

Vol

ee extrem

e'"

sim

pllfl

es t

he c

reat

lon

of f

ully

cus

tom

spe

ech-

enab

led

prod

ucts

by

offe

rlng

deve

lope

rs th

e ca

pabl

llty

of p

rogr

amm

fng

the

chip

In a

hlg

h-Ie

vel

C-ll

ke l

angu

age.

Pro

gram

cod

e, s

peec

h da

ta,

and

even

rec

ord

and

play

back

Info

rmat

ion

can

be s

tore

d on

asi

ngle

of

f-ch

lp

Flas

h m

erno

ry.

Bas

ed

on

Sen

sory

's

RS

C-3

64

spee

ch p

roce

ssor

, V

olee

Ext

rem

e In

clud

es

a hl

ghly

ef

flcle

nt

on-c

hlp

co

de

Inte

rpre

ter,

an

d I

s su

ppor

ted

by

aco

mpr

ehen

sive

sul

te o

f lo

w-c

ost d

evel

opm

ent

tool

s.

So

ftw

are

an

d T

ech

nolo

gy

• V

olee

Act

íva

tto

n™

mic

ro f

ootp

rlnt

softw

are

prov

ldes

adv

ance

d sp

eech

tec

hnol

ogy

on a

varle

ty

of

mlc

roco

ntro

ller

and

DS

P p

latfo

rms.

A

fle

xibl

e de

slgn

w

lth

a br

oad

rang

e of

tech

nolo

gles

al

low

s m

anuf

actu

ren

to

easl

ly

Inté

grat

e sp

eech

fun

ctlo

nallt

y In

to

cons

umer

elec

tronl

c pr

oduc

ts.

+ F

luent

Spe

ech1

" sm

all f

ootp

rlnt

soft

war

e re

cogn

lzes

up

to 5

0,00

0 w

ords

; of

fers

Anl

mat

ed S

peec

h w

lthth

e ab

lllty

to

auto

mat

e en

uncl

atlo

n an

d ar

tlcul

atlo

n; p

erfo

rms

text

-to-

spee

ch s

ynth

esls

In e

lther

mal

e or

fem

ale

vole

es;

prov

ides

nol

se a

nd e

cho

canc

ella

tlon,

per

form

s W

ords

pottl

ng f

or n

atur

al l

angu

age

usag

e;of

fers

tel

epho

ne b

arge

-ln;

and

prov

ldes

con

tlnuo

us d

lglt

reco

gnltl

on.

Import

ant

rod

ees

Rea

sona

ble

effo

rts

have

bee

n m

ade

to v

erlfy

the

acc

urac

y of

Inf

orm

atio

n c

onta

lned

her

eln,

how

ever

no

guar

ante

e ca

n be

m

ade

of

accu

racy

or

ap

pllc

ablll

ty.

Sen

sory

re

serv

es

the

rlght

to

ch

ange

an

ysp

eclfi

catlo

n or

desc

riptlo

n co

ntal

ned

here

ln.

© 2

003

Sen

sory

Inc

.P

/N 8

0-0

24

D-A

23

Page 132: ESCUELA POLITÉCNICA NACIONAL - Repositorio …bibdigital.epn.edu.ec/bitstream/15000/11809/1/T2300.pdf · de audio y video implementado en el robot, hacia un receptor remoto o televisor

Vo

lca

PIrect

™ U

Sp

eech

Rec

og

nlt

lon

Kit

Qui

ck S

tart

Man

ual

foun

d to

hav

e fa

lied

of it

s es

sent

ía)

purp

ose,

(a)

Sen

sory

's to

tal l

labl

lity

to y

ou fo

r ac

tual

dar

nage

s fo

r an

y ca

use

wha

tsoe

ver

will

be

limlte

d to

the

gre

ater

of

$500

us d

olla

rs o

r th

e am

ount

pal

d by

you

for

the

softw

are

that

cau

sed

such

dar

naae

.(b

) (U

SA

onl

y)

som

e st

ates

do

not

aito

w t

he l

lmita

tion

or

excl

usió

n of

lla

bilit

y fo

r In

cide

ntal

of

con

sequ

entla

lda

mag

es,

so t

he a

bove

tfm

itatfo

n or

exd

uslo

n m

ay n

ot a

pply

to

you

and

you

may

als

o ha

ve o

ther

leg

al r

tght

sth

at v

ary

from

sta

te to

sta

te,

9.

Bat

ís o

f Bar

galn

The

Um

lted

War

rant

y, E

xdus

ive

Rem

edie

s an

d U

mite

d U

abitl

ty s

et f

orth

abo

ve a

re fu

ndam

enta

l el

emen

ts o

f th

e ba

sls

ofth

e ag

reem

ent

betw

een

Sen

sory

and

you

, S

enso

ry w

ould

not

be

able

to

próv

ido

the

Sof

twar

e on

an

econ

omle

bas

tsw

lthou

tsuc

h llm

itatio

ns,

10.

U.S

. GO

VCR

NM

ENT

RES

TRIC

TEO

RIG

HTS

LEG

END

This

Sof

twar

e an

d th

e do

cum

enta

tío n

are

pro

víde

d w

lth "

RES

TRIC

TED

RIG

HTS

", U

se,

dupl

krat

ion,

or

dlsd

csur

e by

the

U.S,

G

over

nmen

t is

sub

ject

to

rest

rictio

ns a

s se

t fo

rth

In

thls

EU

LA a

nd a

s pr

ovid

ed i

n DF

ARS

227.

7202

-l{a)

and

227.

72D

2-3(

a) (

1995

), D

FAR

S 2

52.2

27-7

013

(c)(

Í)(l¡)

(OC

T 1

9B8)

, FA

R 1

2.21

2(a)

(199

5},

FAR

52.

227-

19, o

r FA

R 5

2.22

7-14

, as

appl

lcab

le. M

anuf

actu

ren

Sen

sory

, Inc

., 19

91 R

usse

ll A

ve.,

San

ta d

ará

, CA

950

54.

11.

Con

sum

ar E

nd U

san

Onl

y (o

utsl

da o

f the

USA

)Th

e llm

ltatío

ns o

r ex

dusl

ons

of w

arra

ntie

s an

d H

abllit

y co

ntai

ned

In t

hls

EULA

do

not

affe

ct o

r pr

ejud

lce

the

stat

utor

yrlg

hts

of a

con

sum

er, I

.e,,

a p

erso

n ac

qulrl

ng g

oods

oth

erw

ise

than

in t

he c

ours

e of

a b

ustn

ess.

12.

Gen

eral

Pro

visi

ón*

Thls

EUU

A sh

all

be g

over

ned

by t

he f

ntem

al la

ws

of t

he S

tate

of

Cal

iforn

ia.

This

EUL

A co

ntal

ns t

he c

ompl

ete

agre

emen

tbe

twee

n th

e pa

rties

With

res

pect

to t

he s

ubje

ct m

atte

r he

reof

, an

d su

pers

edes

al|

prio

r or

con

tem

pera

neou

s ag

reem

ents

or u

nder

stan

ding

s, w

heth

er o

ral o

r w

ritte

n, A

H qu

estio

ns c

once

mln

g th

ls E

UW

sha

ll be

dire

cted

to:

San»rv

, In

c.,

1991

Rui

selt

Ave

., S

anta

Cla

ra,

CA

950

54.

Alte

n tío

n: G

ener

al C

ouns

el.

P/N

80

-02

40

-A©

2003

Sen

sory

In

c.

Qui

ck s

tart

Man

ual

Vo

lee D

lrec

t™ II

Sp

eech

Rec

og

nlt

ion K

lt

1. I

ntr

od

uct

lon

Thank

you f

or

purc

hasl

ng the

Vol

ee D

lrecc

™ I

I S

peec

h R

ecog

nltlo

n K

lt. W

e a

re s

ure

th

at

you

wlll

appre

date

how

eas

lly b

aslc

vol

ee r

eco

gnltl

on c

apab

llltle

s ca

n b

e a

dded

to v

our

elec

tron

lc p

roje

ct.

For

mor

e I

n-d

epth

deve

lopm

ent,

we

sugg

est

you

up

grad

e to

th

e

Vol

ee

Ext

rem

e"1

Toolk

lt, w

hic

h

offe

rs

addl

tlona

l sp

eech

tech

nolo

gles

and

a s

tan

d-a

lon

e m

icro

controlle

r.

Thl

s Q

uick

Set

up G

ulde

Is

Inte

nded

to p

rovl

de

a b

aste

re

fere

nce

for

the

cap

ablll

tles

of t

he V

olee

Dire

ct™

US

RK

, an

d w

lll h

elp

sta

rt y

ou o

n t

he w

ay t

o utll

lzln

g v

olee

act

ivatlo

n q

uick

ly a

nd e

aslly

, F

or m

ore

det

alle

dte

chnlc

al

Info

rmatio

n a

bo

ut

the

Vol

ee D

irect

™ I

I m

odul

e a

nd

Senso

ry's

aw

ard

wln

nln

g s

peec

h re

cogn

ltlon

tech

nolo

gle

s, p

leas

e vl

slt

ou

rwe

b s

ite a

t w

ww

.se

nso

rYln

c.co

m.

2. F

eatu

res

• E

dge-

Trlg

gere

d, C

ontln

uous

Lls

tenl

ng a

nd

Wo

rd-S

po

ttln

g s

peec

h re

cognltl

on te

chnolo

gle

s•

Mín

ima!

ext

em

al

com

pone

nts

Rec

ognl

zes

up to

15

wor

ds o

r ph

rase

s (b

roke

n In

to 1

, 2 o

r 3

set

s)O

ver

99%

reco

gnltl

on

acc

urac

y w

lth p

roper

desl

gn•

Phr

ase

reco

gnltl

on u

p to

2.5

sec

onds

• U

ser-

frie

ndly

spe

ech p

rom

ptln

gQ

uick

setu

p t

ime

3. C

on

ten

tsO

ne V

olee

Dire

ct™

II

Moth

erb

oard

One

Vol

ee D

irect

™ II

Mod

ule

One

Batte

ry C

lipT

hree

lO

Kre

sist

ors

One

470

ohm

resi

stor

Thr

ee R

ed L

ED

sO

ne Y

ello

w L

ED

One

Qulc

ksta

rt M

anua

l

4. A

bo

ut

Sp

eech

Rec

og

nít

ion

Vol

ee D

irect

™ I

I perf

orm

s sp

ea

ker-

de

pe

nd

en

t dls

crete

wo

rd r

eco

gnic

ión b

y co

mparlng a

patte

rn g

enera

ted In

real

tim

e w

ith p

revl

ousl

y tr

aln

ed

wo

rd t

em

pla

tes,

The p

attern

genera

ted b

y V

olee

Dire

ct™

II

Is b

ased

on

adig

ital

reco

nst

ruct

lon

of

the

vol

ee c

om

ma

nd

. E

ach

word

to

be

rec

ognl

zed

must

flrst

be

tra

lne

d,

Dur

lng

traln

lng,

Vol

ee D

irect

™ I

I co

nst

ruct

s a

tém

pla

te r

epre

sent

lng t

he I

ndiv

idual

spea

kere

s un

lque

sound p

att

em

for

each

spe

clflc

wo

rd o

r phra

ss t

o

be r

eco

gnlz

ed.

Tem

plat

es

are s

tore

d I

n n

on-v

ola

tlle

fla

sh m

em

ory

,D

urln

g r

eco

gnltl

on

a n

ew t

ém

pla

te I

s pr

oduc

ed a

nd c

om

pa

red

to t

he s

tore

d t

em

pla

tes

to d

ete

rmin

e W

hich

wo

rd w

as

spoke

n.

Vol

ee D

irect

™ I

I fe

atu

res

Inte

grat

ed s

peec

h pro

mptln

g f

or

both

tra

lnln

g a

nd

reco

gnltl

on

oper

atlo

ns,

allo

wln

g th

e d

evel

opm

enc

of

sophls

tlcate

d Inte

ract

ive

pro

duct

s w

lth m

lnlm

al p

rogra

mm

lng.

Vol

eeD

irect

™ II

perf

orm

s th

e fo

llow

lng o

pera

tlons

wh

en re

cogn

lzln

g a

wo

rd:

1.

The

aud

lo s

lgnal (

spok

en w

ord

or

phra

se)

Is e

xte

ma

lly a

mpllf

led

and

fllte

red

and

then

sup

plle

d to

the

anal

og Inputs

of t

he

Vol

ee D

irect

™ I

I, w

hich

conve

rts

the

ana

log

wa

vefo

rms

to d

igita

l sam

ple

s.2.

V

olee

D

irect

™ I

I an

alyz

es

the

sp

eech

sl

gnal

sam

ples

and

gen

erat

es

a t

ém

pla

te

of

Info

rmatio

nre

pres

entln

g s

lgnlfl

cant

spee

ch e

lem

ents

.3.

V

olee

Dire

ct™

II

Incr

ease

s or

decr

ease

s th

e g

aln

of

the

ext

em

al

am

pllf

ler

as

need

ed t

o m

aln

taln

slgn

al q

uallt

y.4.

T

he u

nkn

ow

n té

mp

late

Is c

om

pa

red

to e

ach

of t

he t

rain

ed

tem

pla

tes

to d

eter

min

e t

he o

ne t

ém

pla

teth

at

prov

ldes

the

bes

t m

atc

h.

5.

If t

he

bes

t m

atc

h té

mpla

te g

lves

a s

core

abo

ve a

pre

-defln

ed t

hre

shold

, V

olee

Dire

ct™

II

choo

ses

the

word

ass

ocla

ted

wlth

the

c té

mpl

ate.

If

no té

mp

late

pro

vlde

s a m

atc

h a

bove

thre

shold

, a s

pecl

al "

nom

atc

h"

valu

é ¡s

cho

sen.

© 2

003 S

enso

ry I

nc.

P/N

80

-Q2

40

-A

Page 133: ESCUELA POLITÉCNICA NACIONAL - Repositorio …bibdigital.epn.edu.ec/bitstream/15000/11809/1/T2300.pdf · de audio y video implementado en el robot, hacia un receptor remoto o televisor

Vole

e D

irect

™ U

Sp

eech

jteco

gn

ltlo

n K

itQ

uic

kSta

rt M

anua

l

Ste

ps 1

-3 a

bove

are

rep

eate

d f

or e

ach

wor

d d

urin

g t

raln

lng.

Vol

ee D

Irect

™ 1

1 st

ores

the

av

erag

e of

tw

otr

aln

lng p

atte

rns

for

each

wo

rd t

o I

mpro

ve a

ccur

acy.

B

efor

e a n

ew t

ém

pla

te I

s st

ore

d, It

ls c

ompa

red

wlth

the

exl

stin

g t

ém

pla

les

In t

he s

et.

The

new

can

dída

te w

ord

wll!

not

be

acc

epte

d If

It !

s to

o s

imila

r to

an

exls

tlng

wor

d (

for

exa

mple

, "B

ill S

mlth

" and

MU

Í S

mlth

").

Vol

ee D

Irect

™ I

I,

llke

all

oth

er

spee

ch r

ecog

nltlo

n s

yste

ms,

¡s

nece

ssar

lly s

ubje

ct t

o t

wo

typ

es

of

err

ors

;re

ject

s (fallu

re to

rec

ognl

ze a

word

In th

e v

oca

bula

ry}

and

su

bst

ítu

tlon

s {c

onfu

sión

of t

wo v

oca

bula

ry w

ord

s,or

rec

ognl

tlon

of a

non

-voc

abu!

ary

wo

rd),

The

rela

tive

Irnport

ance

of

each

typ

e o

f err

ar

may

dep

end

on t

heap

pllc

atlo

n. V

olee

DIre

ct™

II

prov

ldes

sele

ctlv

lty l

eVel

s th

at

allo

w t

he

use

r to

optim

lze t

he

tra

de

off

be

twee

nth

ese

two

typ

es o

f re

cognltt

on e

rrors

. W

hen

the r

eco

gnltl

on s

ele

ctlv

lty l

evel

ls

set

to Its

hlg

hest

valu

é,

Vol

eeD

lrect

II

mln

lmlz

es

subst

ltutlo

n

erro

rs

but

may

prod

uce

m

ore

reje

ctlo

n

err

ors

. W

hen

the

traln

lng

sele

ctlv

lty l

evel

ls

set

to Its

hlg

hest

val

ué,

Vol

ee D

!rec

tTH I

I m

lnlm

lzes

both

subst

ltutlo

n a

nd reje

ctlo

n e

rrors

by r

eje

ctln

g w

ords

th

at

are

too

sim

ilar

soun

dlng

, pote

ntla

tly I

ncre

asln

g re

cog

nltl

on

acc

urac

y. T

hese

set

tings

are b

est

esta

blls

hed

by

exp

erlm

entln

g w

lth y

ou

row

n a

ppllc

atlo

n an

d e

nvl

ronrn

ent,

5. B

uitd

lng

a B

asic

Ap

plic

atio

nC

ON

ST

RU

CT

JON

TaV

e In

to c

on

sid

era

ron t

he f

lxtu

re o

ptlo

ns f

or

the

Vol

ee D

Irect

™ I

I m

oth

erb

oard

an

d/o

r m

odule

. Y

ou m

ay

mount

the m

oth

erb

oard

and m

odul

e t

ogeth

er,

or

deta

ch t

he

mod

ule

and

Inst

all

It b

y Its

elf,

Usl

ng t

he m

odul

eal

one

may

Inc

reas

e th

e a

ddltl

onal

par

ts r

equl

red

for

opera

tlon,

Oth

er f

acto

rs w

ill a

lso

Incl

ude

the

slz

e of

your

appl

lcat

lon,

and

how

com

pact

and tr

ansp

ort

able

It w

lll n

eed

to b

e.

* O

ne

pos

slbl

e m

etho

d o

f co

nst

ruct

lon l

s to

use

a s

ímil

pro

ject

box

, m

ountln

g t

he

spe

aker

, m

lcro

phon

e,push

butto

ns,

and

moth

erb

oard

an

d/o

r m

odul

e (

on s

tand

offs

) In

the

box

. F

or c

onne

ctlo

ns,

30 A

WG

wlre

-w

rap

wlr

e ca

n b

e

sold

ered

dlre

ctly

fr

om

th

e

top

(no

n-c

on

ne

cto

r si

de)

of

the

mod

ule

to

th

e

oth

er

com

pone

nts.

+

An a

ltérn

ate

meth

od

of

const

ruct

lon

Is

to u

se a

ple

ce o

f p

erf

ora

ted o

r pro

toty

pln

g b

oard

(a

pp

rox,

2"x

5")

,m

ount

lng

mal

e h

eader

strlp

s (0

.1"

cent

ers)

to

the

perf

boa

rd

to

acco

mm

odat

e th

e m

odule

, T

he

perf

boar

d c

an a

lso

be u

sed

to m

ount

the

push

butto

ns,

as

well

as a

ny o

ther

com

pone

nts

requlre

d b

y yo

ur

appl

lcat

lon.

1/

8"

mon

o ph

one

jack

s an

d p

lugs

are

use

ful

for

qulc

kly

conn

ectln

g an

d d

lsco

nnec

tlng

the

spea

ker,

mic

roph

one

and

pow

er fro

m t

he r

est

of

the c

lrcu

ltry.

PO

WE

RT

he

Vol

ee D

Irect

™ I

I m

odul

e (

the

small

boar

d t

hat

is p

lugg

ed I

nto t

he

moth

erb

oard

) is

des

lgne

d t

o r

un a

t3.

3V, T

wo

i.SV

batte

rles

In a

plá

stic

hold

er

or a

lab

supp

ly c

an b

e us

ed a

s a

pow

er s

ourc

e. A

pow

er s

wltc

h In

serle

s w

lth o

ne o

f th

e p

ower

le

ads

wlll

maxl

mlz

e b

attery

Ufe

by

allo

wln

g y

ou t

o po

wer

dow

n t

he m

odul

eW

hen

not

In u

se.

Inco

rpora

tlng

a p

rote

ctlo

n d

lode

In

ser

les

wlth

the

pow

er s

uppl

y w

lll a

vold

dam

age

to t

heci

rcuít If

batterles

are

Inse

rted w

lth t

he

wro

ng p

ola

rlty

.

The

Vol

ee D

Irect

™ II

moth

erb

oard

(th

e la

rge

boa

rd t

ha

t th

e m

odul

e p

tugs

In

to}

has

a 3

.3V

regula

tor

Inst

alle

don

It, s

o I

t ca

n b

e p

ower

ed b

y th

e In

clud

ed 9

V b

attery

clip

. R

efer

to

figure i

for

Inst

ruct

lons

on

sol

derln

g th

eIn

clud

ed 9

V b

attery

clip

to

the

Vol

ee D

Irect

™ II

mo

the

rbo

ard

,

DA

NG

ER

!: I

F Y

OU

UN

PL

UG

TH

E V

01C

E

DIR

EC

T™

II

MO

DU

LE

AN

D R

UN

IT I

ND

EP

EN

OE

NT

LY

FR

OM

TH

E M

OT

HE

RB

OA

RD

, D

O N

OT

AT

TE

MP

T T

O P

OW

ER

IT

AB

OV

E 3

.3V

OR

IT W

ILL

BE

DA

MA

GE

DI

P/N

80

-02

40

-A©

200

3 Se

nsor

y In

c.

Qui

cíc

Sta

rt M

anua

lV

ole

e D

Irect

™ II

Speech

Recogniti

on K

it

14.

SE

NS

OR

Y S

oft

wa

re E

nd U

ser

tíce

nse

Ag

ree

me

nt

1. D

efln

ftlo

m(a

) "S

enso

ry" m

eans

Sen

sory

, Inc

. an

d Its

sup

plie

rs a

nd ll

cens

ors,

If a

ny.

(b)

"Not

For

Res

ale

(NFR

) V

ersi

ón"

mea

ns a

ver

sión

of

the

Sof

twar

e, so

Hen

tifie

d, t

o be

use

d to

rev

iew

and

eva

lúat

eth

e S

oftw

are,

onl

y.(c

) "S

oftw

are"

mea

ns t

he s

oftw

are

prog

ram

sup

plle

d by

Sen

sory

her

ewlth

, w

hlch

may

als

o In

dude

doc

u m

enta

tlon,

asso

date

d m

edía

, pr

inte

d m

ater

lals

, ano

1 onl

ine

and

elec

tronl

c do

cum

enta

ron .

2.

Llca

ns*

This

EUL

A at

low

s yo

u to

:(a

) In

stal

l and

use

the

Sof

twar

e on

a s

ingl

e co

mpg

ter;

OR

Inst

all a

nd s

tore

the.

Sof

twar

e on

a s

tora

ge d

evic

e, s

udí a

sa

netw

ork

serv

er,

used

onl

y to

run

or

inst

all t

he S

oftw

are

on y

our

othe

r co

mpu

ters

ove

r an

Inta

mal

net

wor

k,pr

ovld

ed y

ou h

ave

a llc

ense

for

eac

h se

pára

te c

ompu

ter

on w

hích

the

Sof

twar

e ls

Ins

talle

d or

run

fro

m t

hest

orag

e de

vice

, A lic

ense

for

the

Sof

twar

e m

ay n

ot b

e sh

ared

or

used

con

curr

entty

on

diffe

renC

com

pute

rs.

(b)

Mak

e on

e co

py o

f th

e S

oftw

are

In m

achi

ne-r

eada

We

form

sol

ely

for

back

up p

urpo

ses,

Yau

mus

t re

prod

uce

on a

nysu

dí c

opy

all c

opyr

ight

not

lces

and

any

oth

er p

ropr

ieta

ry le

gend

s on

the

orig

inal

cop

y of

me

Sof

twar

e.

3.

Uce

nse

Re*

trie

tlon

»(a

) O

ther

tha

n as

set

for

th I

n S

ectta

n 2,

you

may

not

mak

e or

dis

tribu

te

copi

es o

f th

e S

oftw

are,

or

elec

troni

cally

trans

fer

the

Sof

twar

e fr

orn

one

com

pute

r to

anot

her

or o

ver a

net

wor

k.(b

) Y

ou m

ay

not

deco

mpi

le,

reve

rse

engí

neer

, dl

sass

embl

e,

or

othe

rwis

e re

duce

the

S

oftw

are

to

a hu

man

-pe

rcel

vabl

efor

m.

(c)

You

may

not

sel

l, re

nt,

léas

e, tr

ansf

er o

r su

tílce

nse

the

Sof

twar

e,(d

) Y

ou m

ay n

ot m

odify

the

Softw

are

or c

réat

e de

rivat

lve

wor

ks b

ased

upo

n th

e S

oftw

are,

(e)

You

may

not

exp

ort t

he S

oftw

are

¡nto

any

cou

ntry

pro

hlbl

ted

by th

e U

nite

d S

tate

s E

xpor

t Adm

lnís

tratlo

n A

rt a

ndth

e re

gula

tions

ther

e un

der

(f)

In t

tie e

vent

that

you

fail

to c

ompf

y w

lth t

his

EULA

, S

enso

ry m

ay t

erm

ínat

e tri

e llc

ense

and

you

mus

t de

stro

y al

lco

pies

of

the

Sof

twar

e.

4. U

pgra

des

If t

his

copy

of

the

Sof

twar

e is

an

upgr

ade

from

an

earli

er v

ersi

ón o

f th

e S

oftw

are,

it

Is p

rovl

ded

to y

ou o

n a

licen

seex

chan

ge b

asls

, Y

ou a

gree

by

your

Inst

alla

tton

and

use

of t

hls

copy

of

the

Sof

twar

e to

vol

unta

riry

term

ínat

e yo

ur e

arlie

rEU

LA a

nd th

at y

ou w

lll n

ot c

ontin

ué t

o us

e th

e ea

rlier

ver

sión

of t

he S

oftw

are

or tr

ansf

er It

to a

noth

er p

erso

n or

ent

ity,

5.

Ow

ners

hlp

The

fore

goln

g lic

ense

giv

es y

ou ll

mlte

d r

ight

s to

use

the

Sof

twar

e, S

enso

ry a

nd It

s su

pplie

rs r

etal

n a

ll rlg

ht,

title a

nd[n

tere

st,

Indu

dlng

all

copy

rfght

s, I

n an

d to

the

Sof

twar

e an

d al

l cop

ies

ther

eof,

All

right

s no

t sp

edflc

alty

gra

nted

In t

hls

EULA

, Inc

ludi

ng F

eder

al a

nd In

tern

atio

nal

Cop

yrig

hts,

are

rese

rved

by

Sen

sory

and

its

supp

liers

,

6.

Lim

ited

war

ran

ty a

nd c

flccl

ilmer

(a)

Um

ited

war

rant

y. S

enso

ry w

arra

nts

that

, fo

r a

perio

d of

nin

ety

(90)

day

s fr

om th

e da

te o

f de

liver

y (a

s ev

iden

ced

by a

cop

y of

you

r re

ceip

t); (1

) w

hen

used

wlth

a r

ecom

men

ded

hard

war

e co

nfig

ura

tlon,

the

softw

are

wlll

per

form

In s

ubst

anci

al c

onfo

rman

ce w

ith t

he d

oaim

enta

tian

supp

lied

wlth

the

sof

twar

e; a

nd (

U) t

hat

the

phys

lcal

med

iaon

whi

ch th

e so

ftwar

e Is

fum

lshe

d w

lll b

e fr

ee fr

om d

efec

ts In

mat

eria

ls a

nd w

orkm

ansh

'p u

nder

nor

mal

use

.(b

) N

o ot

her

war

rant

y, e

xcep

t as

set

for

th 'm

the

for

egoi

ng Ü

mlte

d w

arra

nty,

sen

sory

and

its

sup

plie

rs d

lscl

aim

all

othe

r w

arra

ntle

s, e

lttie

r ex

pres

e or

Im

plie

d, o

r ot

herw

ise

Indu

dlng

the

war

rant

ies

of m

erdi

anta

bllit

y an

d fit

ness

for

a pa

rticu

lar

purp

ose,

Als

o, m

ere

ís n

o w

arra

nty

of n

onln

fring

emen

t, tit

le o

r qu

iet

enjo

yrne

nt,

If ap

pllc

able

law

impt

les

any

war

rant

ies

wlth

res

pect

to t

he s

oftw

are,

all

such

war

rant

ies

are

llmite

d [n

dur

atto

n to

nin

ety

(90)

day

sfro

m c

he d

ate

of d

eliv

ery,

No

oral

or

writ

ten

Inf

orm

atio

n or

adv

lce

give

n fa

y se

nsor

y, I

ts d

eale

rs,

dist

ribut

ora,

agen

ts o

r em

ploy

ees

shsl

l cré

ate

a w

arra

nty

or In

any

way

incr

ease

the

scop

e of

thls

war

rant

y,(c

) S

ome

stat

es (

US

A on

ly)

do n

ot a

llow

tíie

exd

usto

n of

impl

led

war

rant

les,

so

the

abov

e ex

dusl

on m

ay n

ot a

pply

toyo

u. T

nls

war

rant

y gi

ves

you

spec

lfic

lega

l rig

hts

and

you

may

als

o ha

ve o

ther

lega

l rig

hts

that

var

y fr

om s

tate

tost

ate.

of th

e S

oftw

are

wím

oth

er m

an a

reco

mm

ende

d ha

rdw

are

conf

igur

atío

n.

© 2

003

Sen

sory

In

c.P

/N 8

0-0

24

0-A

21

Page 134: ESCUELA POLITÉCNICA NACIONAL - Repositorio …bibdigital.epn.edu.ec/bitstream/15000/11809/1/T2300.pdf · de audio y video implementado en el robot, hacia un receptor remoto o televisor

Vo

lca

PIr

act™

H S

pee

ch R

eco

enlt

lon

K!t

Qui

ck S

tart

Man

ual

12,

Dís

clai

mer

sW

ARNI

NGTh

ls k

it Is

Inte

nded

for

use

by

cons

umer

e w

lth e

xper

íenc

e In

dec

tronl

c de

sign

. As

wlth

any

ete

ctro

nlc

klt,

cau

tion

shou

M b

eex

erds

ed d

urtn

g as

sem

bly,

and

all

cann

ectío

ns s

houl

d be

dou

ble-

chec

ked

that

they

are

cle

an,

safe

and

pro

perly

sol

dere

dbe

fare

app

fyln

g an

y po

wer

sou

rce.

IMP

OR

TÁIS

DIS

CU

AIM

ERTo

the

Mle

st e

xten

t pe

rmitt

ed b

y ac

cept

afal

e la

w,

Sen

sory

, In

c. e

xpre

ssly

dls

clai

ms

the

Impl

led

war

rant

y of

fltn

ess

for

apa

rticu

lar

purp

ose.

Cus

tom

er s

houl

d un

ders

tand

mat

Sen

sory

doe

s no

t m

ake

any

repr

esen

tatlc

n th

at p

rodu

cís

purd

iase

dw

lll s

uit

cust

omer

's p

art

purp

ose,

Cus

tom

er r

nust

ret

y on

cus

tom

er's

ovm

ski

ll or

judg

men

t ín

sel

ectln

g su

ltabl

e pr

oduc

ísfo

r C

usto

mer

. To

the

exte

nt w

arra

nty

Is a

ppllc

able

, suc

h w

arra

nty

shal

l be

lirni

ted

lo 9

0 da

ys fr

om th

e da

te o

f pur

chas

e.

13.

Vo

lee D

irect™

II

Speech

Reco

gnlti

on K

it L

imite

d W

arr

an

tyTh

e V

olca

Dlre

ct1"

II

[5 w

arra

nted

aga

inst

def

ects

and

wor

kman

ship

for

a p

erio

d of

90

daya

fro

m t

be d

ate

of p

rodu

ctpu

rcha

se. S

enso

ry, In

c. w

lll,

at It

s op

tion,

«Ith

er r

epal

r or

repl

ace

a pr

oduc

t tha

t pro

vea

to b

e de

fect

ive

elth

er u

pon

rece

fpt

or th

roug

h no

rmal

usa

ge, if

a S

enso

ry S

peec

h R

ecog

nlllo

n K

it pr

oduc

t ha

s be

corn

e ob

sote

te o

r Is

no

long

er In

pro

duct

lon

and

deem

ed Ir

repa

rabl

e, S

enso

ry w

lll,

at ¡

ts o

ptio

n, p

rovl

de a

n eq

ulva

lent

pro

duct

or

syst

em fo

r a

nom

inal

fee

.S

enso

ry,

Inc,

w

arra

nts

this

S

peec

h R

ecog

nitío

n K

it pr

oduc

t, w

hen

prop

erly

In

staB

ed

and

used

, w

ill

exec

ute

Itspr

ogra

mm

ed i

nstru

ctlo

ns,

How

ever

, S

enso

ry,

Inc.

doe

s na

t w

arra

nt t

hat

the

oper

atto

n of

the

Pro

duct

, Its

firm

war

e an

dso

ftwar

e w

lll b

e un

lnte

rrup

ted

or t

otal

ly e

rror

fre

e. T

he P

rodu

ct m

ust

be r

etur

ned

to S

enso

ry,

Inc.

for

war

rant

y se

rvke

witliin

the

war

rant

y pe

ríod

to th

e fo

llow

ing

addr

ess:

199

1 R

uuall

Ava

., S

anta

Cla

ra,

CA

95054. T

he B

uyer

wHI

pay

a|l

ship

ping

and

oth

er c

harle

s or

ass

essm

ents

for

the

retu

rn o

f the

Pro

duct

to S

enso

ry,

Inc.

Um

ltaM

on o

f War

ran

tyTh I mi

:

Um

itatio

n o

f U

abllf

tyS

enso

ry's

liab

llity

shal

l be

lim

lted

to t

he r

epai

r or

rep

lace

men

t of

defe

ctiv

e pr

oduc

ís ¡

n ac

cord

ance

with

the

Vol

ca o

frecí

1"

II S

p«ec

h R

ecog

nltto

n K

it U

mlte

d W

arra

nty.

Sen

sory

sha

ll no

t be

Hab

le f

or a

ny in

cide

ntal

, sp

edal

or

cons

eque

ntía

lda

mag

es f

or

brea

ch o

f an

y w

arra

nty,

ex

pres

sed

or

Impl

led,

di

rect

ly

or

indl

rect

ly

arhs

ing

out

of S

enso

ry's

sal

e of

mer

chap

dlse

, In

dudl

ng a

ny fa

ilure

to

dellv

er a

ny m

erch

andl

se,

or a

rísln

g ou

t of

cus

tom

er's

¡ns

talla

tíon

or u

se,

whe

ther

prop

er o

r im

prop

er,

of th

e pr

oduc

t, se

para

tery

or

in c

ombl

natio

n w

lth o

ther

equ

lpm

ent,

or fr

om a

ny o

ther

cau

se. P

rodu

cts

sold

by

Sen

sory

are

not

aut

horlz

ed fo

r us

e as

oití

cal c

ompo

nent

s In

Ufe

supp

ort

devi

ces

or s

yste

ms.

IMP

OR

TAN

T N

OTI

CE

SS

enso

ry r

eser

ves

the

rig

ht to

mak

e ch

ange

s to

or

to d

isco

ntin

ué a

ny p

rodu

ct o

r se

rvic

e id

entif

ica

In th

ls p

ublk

atkm

at a

nytim

e w

lmou

t no

tíce

in

orde

r to

im

prov

e de

slgn

and

sup

pty

the

best

pos

sibl

e pr

oduc

t. S

enso

ry

does

not

ass

ume

resp

onsl

blllt

y fo

r us

e of

any

drc

uitry

othe

r th

an d

rcul

try e

ntíre

ly e

mbo

dled

In

a S

enso

ry p

rodu

ct.

Info

rmat

ion

cont

alne

dhe

reln

Is p

rovi

ded

grat

ufto

usly

and

wrth

out l

iabl

llty

to a

ny u

ser.

Rea

sona

ble

effo

rts h

ave

been

mad

e [o

ver

ify t

he a

ccur

acy

of t

his

Info

rmat

ion

but

no g

uara

ntee

wha

tsoe

ver

Is g

tven

as

to t

he a

ccur

acy

or a

s to

its

app

llcaW

Hty

to

parti

cula

r us

es.

App

tlcat

ions

de

scrib

ed I

n th

is

data

sh

eet

are

for

Hlu

stra

tive

purp

oses

onl

y, a

nd S

enso

ry

mak

es

no w

arra

ntle

s or

repr

esen

tatto

ns t

hat

the

RS

C s

erle

s of

pro

ducí

s w

tll b

e su

ltabl

e fo

r su

ch a

ppllc

atío

ns.

In e

very

Ins

tanc

e, !

t m

ust

be t

here

spon

sibi

llty

of t

he u

ser

to d

eter

min

e th

e su

itabl

llty

of t

he p

rodu

cís

for

each

app

llcat

lan,

Sen

sory

pro

ducí

s ar

e no

tau

lhor

ized

for

use

as c

ritic

a! c

ompo

nent

s |n

ufe

sup

port

devt

ces

or s

yste

ms.

Sen

sory

con

veys

no

licen

se o

r tít

fe,

elth

erex

pres

sed

or Im

plie

d, u

nder

any

pat

ent,

copy

right

, or

mas

k w

ork

right

to

the

RS

C s

erle

s of

pro

ducí

s, a

nd S

enso

ry m

akes

bala

nce

betw

een

reco

gnltí

on a

nd s

ynth

esis

no

war

rant

ies

or r

epre

sent

atio

ns t

hat

the

RS

C s

erie

s of

pro

ducí

s ar

e fre

e fro

mpa

tent

, co

pyrig

ht,

or m

ask

wor

k rig

ht ¡

nfrin

gem

ent,

unle

ss

othe

rwis

e sp

edfie

d,

Not

hlng

con

taln

ed

here

ln

shal

l be

cons

trued

as

a re

com

men

datio

n to

use

any

pro

duct

In v

lola

tion

of

exls

ting

pate

nts

or o

ther

rig

hts

of t

hlrd

par

tles,

The

sal

eof

any

Sen

sory

pro

duct

|s s

ubje

ct to

all

Sen

sory

Ter

ms

and

Con

dltio

ns o

f Sal

es a

nd S

ales

Pol

ldes

,

20P

/N S

O-0

24

0-A

© 2

003

Sen

sory

Inc.

Qui

ck S

tart

Man

ual

Vo

lee D

trect"M

:i S

pee

ch R

eco

gn

ltío

n K

tt

Fig

ure

1 -

insta

llln

g T

he

Inclu

dad

Ba

tte

ry C

lip

VD

II

Ho

ther

bo

ard

(Bo

tto

m

Vie

w)

Batt

ery

C

lip

In a

ddltl

on

to

the I

nclu

ded

batte

ry c

lip,

the

use

r ha

s th

e o

ptfo

n o

f us

tng a

sta

ndard

9V

wall

adapte

r (n

ot

Induded).

The

wa

ll adapte

r ca

n b

e p

lugg

ed Into

J7

dlre

ctly

ellm

tnatln

g t

he

nee

d fo

r us

ing

the faatte

ry c

lip.

OU

TP

UT

S

* C

onsl

der

wh

at

typ

es

of

load

s yo

u a

re g

olng

to b

e d

rlvln

g w

lth t

he o

utp

uts

. M

ost

type

s of

load

s (L

ED

s,m

oto

rs,

rela

ys,

etc

.) w

lll r

equlre

som

e ty

pe o

f outp

ut

drlve

r cl

rcultr

y. A

dis

cuss

lon

of t

hese

clrc

ults

Is

beyo

nd t

he s

cope

of th

ls g

utde

, bu

t a

gre

at

plac

e to

sta

rt lo

okl

ng

Is I

n t

he d

atab

ooks

, appllc

atlo

n n

otes

,and o

n t

he

web

pag

es o

f m

ajo

r se

mic

onduct

or

manufa

cture

rs.

For

more

Info

rmatio

n,

refe

r to

the

DC

Cha

ract

erís

tlcs

In S

ectio

n 6

,

+

Kee

p In

mln

d t

hat

tha

t th

e o

utp

uts

onl

y to

gg

le h

!gh

for

1 s

econ

d. I

f yo

u w

an

t th

em

to

sta

y ht

gh,

you c

an

add

a la

tchln

g o

utp

ut

drlv

er.

The

outp

uts

als

o to

ggle

as

part

of

the p

ow

er

up I

nltl

allz

atto

n s

eque

nce,

so

bear

]n m

lnd

how

that

may

affe

ct y

our

appllc

atlo

n.

* B

ecau

se V

olee

Dire

ct™

Jl

can

rec

ognl

ze 15

wor

ds I

n s

tan

d-a

lon

e m

ode,

but

has

onl

y 8 o

utp

uts

, so

me

deco

dlng

clrc

ultr

y Is

requlre

d if

the a

ppllc

atlo

n requlre

s m

ore

than

8 w

ord

s to

be

reco

gnS

zed.

The form

at

of t

he o

utp

utted

wo

rds

Is d

lscu

ssed

under

"Rec

ognl

zlng

Word

s".

SY

ST

EM

DE

SIG

N+

If

the m

odul

e I

s us

ed I

n a

sys

tem

wlth

oth

er

dig

ital

dock

s (s

wltc

hln

g p

ower

sup

plle

s, L

CD

drl

verj

etc

,)ta

ke s

pecl

al c

are

to p

reve

nt

these

sig

náis

fro

m b

elng

cou

pled

Int

o t

he

aud

lo d

rcultr

y o

f Vol

ee D

irect

™ I

I.

+

Wlth

pro

per

pro

duct

const

ruct

lon,

Vol

ee D

irect

"" II

m

eets

th

e C

E r

equlre

rnents

fo

r el

ectr

omag

netlc

radla

tlon

and Im

munlty

. T

o m

lnlm

lze

radla

ted

em

lssl

ons,

speake

r w

lres

should

be

less

than 3

" lo

ng.

Inaddltl

on,

the

spe

aker

cab

le a

nd p

ower

cab

le s

houl

d b

e o

rlente

d o

n o

ppos

lte s

ldes

of

the m

odul

e.

MIC

RO

PH

ON

E C

ON

SID

ER

AT

ION

SF

or

most

ap

pllc

atío

ns,

an I

nexp

ensl

ve

om

nl-d

lrect

lonal

ele

ctre

t ca

paci

tor

mlc

roph

one w

lth

a

mín

imum

sensl

tlvlty

af

-60

dB

Is

ad

eq

ua

te.

In s

ome

appl

lcat

lons

, a d

lrect

lonal

mlc

roph

one m

lght

be m

ore

sulta

ble

If

the

slgn

al c

omes

fro

m a

dlff

ere

nt

dlre

ctlo

n t

ha

n t

he

audl

o no

lse.

Sln

ce dlre

ctlo

nal

mlc

roph

ones

ha

ve a

freq

uenc

y re

spon

so t

haC

dep

ends

on thelr

dts

tanc

e fr

om

the

sou

nd s

ourc

e, s

uch m

lcro

phon

es s

houl

d b

e u

sed

wlth

cautio

n.

For

bes

t perf

orm

ance

, sp

eech

reco

gnltí

on

pro

duct

s sh

ould

be

use

d In

a q

ulet

envl

ronm

ent

wlth

the

spe

aker

's m

outh

In

ció

se p

roxl

mlty

to

the

mlc

roph

one.

© 2

003

Sen

sory

Inc

.P

/N 8

0-0

24

0-A

Page 135: ESCUELA POLITÉCNICA NACIONAL - Repositorio …bibdigital.epn.edu.ec/bitstream/15000/11809/1/T2300.pdf · de audio y video implementado en el robot, hacia un receptor remoto o televisor

Vol

ee D

Irec

t1"

II S

pecc

h R

eco

gn

llio

n í

íitQ

ulck

Sta

rt M

anua

l

Import

ant

mec

ha n

i ca

l Iss

ues

pert

ain

lng

to m

lcro

phone

ass

em

bly

:

# FI

RS

T: In

the

pro

duct

, th

e m

lcro

phon

e ei

emen

t sh

ould

be

posl

tlone

d as

ció

se t

o th

e m

ount

lng

surf

ace

aspo

sslb

le a

nd s

houl

d be

fully

sea

ted

In a

ny h

ousl

ng.

The

re m

ust

be N

O a

lrspa

ce b

etw

een

the

mlc

roph

one

elem

enc

and

the

hous

lng,

as

thls

can

lead

to a

cous

tic r

eson

ance

, w

htch

can

redu

ce re

cogn

ltlon

acc

urac

y.

* S

EC

ON

D;

The

áre

a In

fro

nt

of t

he m

lcro

phon

e ei

emen

t m

ust

be k

ept

clea

r of

obs

truc

tlons

to

avol

dIn

terfe

renc

e w

lth

reco

gnltl

on.

In

gene

ral,

the

dlam

eter

of

the

ho

le

!n t

he

hous

lng

In f

ront

of

th

em

lcro

phon

e sh

ould

be

aC le

ast

5 m

m.

Any

nec

essa

ry p

lást

ic s

urfa

ce In

fro

nt o

f th

e m

lcro

phon

e sh

ould

be

very

thln

, no

mor

e th

an 0

,7 m

m If

pos

slbl

e,

+ TH

IRD

: T

he m

lcro

phon

e sh

ould

be

acou

stlc

ally

Iso

late

d fr

om t

he

hous

lng

In s

ame

way

. Th

ls c

an b

eac

com

plis

hed

by s

urro

undl

ng t

he m

lcro

phon

e ei

emen

t w

lth a

spo

ngy

mat

eria

l su

ch a

s ru

bber

or

foam

,M

ount

ing I

t w

!th

a p

llabl

e, n

on-h

arde

nlng

adh

esiv

a Is

ano

ther

pos

slbl

llty.

The

pur

pose

Is

to p

reve

ntau

dito

ry n

olse

s pr

oduc

ed b

y ha

ndlln

g or

Jar

rlng

the

prod

uct

from

bel

ng "

plck

ed U

p" b

y th

e m

lcro

phon

e,S

uch

extr

aneo

us n

olse

s ca

n re

duce

reco

gnltl

on a

ccur

acy.

6. M

oth

erb

oar

d a

nd

Mo

du

le p

inou

t an

d C

har

acte

rlst

ics

Fig

ure

2 -

Vol

ee D

lrect

™ II

Mod

ule

Tab

le 1

- V

olee

Dlr

eet™

II

Mod

ule P

in A

sslg

nm

ents

i ro

und

eonr

ettfa

n

^^c(

0|H

lo^e

InpJt

Con

nect

lon

Use

d - U i

Ooe

n

g ou

tput

[udbuflc

eaj

;roun

d e

onre

ctio

n

r co

nnei

tlon

(ne

fl«tlv

e)

r am

nect

uxi (p

o*Iily

e)

<o( U

ied -

Lea

ve O

pen

Use

d -

Leitf

Ope

n

íot U

icd-L

e««

Ope

n

Soft

Rcs

ít oí

VD

K*

fflre

tr II

(Act

ive

to

1.3

Vol

t (+

) po

wer

wpp

ly e

onn«

«tan

^ot

Use

d -

Uavt

Opc

n

P/N

8D

-024

0-A

© 2

003

Sen

sory

Inc

.

Qul

ck S

tart

Man

ual

Vo

lee

Plr

ect™

II S

peec

h R

ecog

nltlo

n K

lt

© 2

003

Sen

sory

Inc

.P

/N 8

0-02

4D-A

Page 136: ESCUELA POLITÉCNICA NACIONAL - Repositorio …bibdigital.epn.edu.ec/bitstream/15000/11809/1/T2300.pdf · de audio y video implementado en el robot, hacia un receptor remoto o televisor

(*'

Vol

ee D

irect

1" II

Spe

ech

Rec

og

nlti

on

Ktt

Qut

ck S

tart

Man

ual

Qu'

ck S

tart

Man

ual

11. S

chem

atic

s fo

r V

oic

e D

irec

t ™

II

Mod

ule

and

Mo

ther

bo

ard

(An

elec

tron

lc v

ersi

ón o

f ch

is m

anua

l wltb

MI

slze

sch

emat

ics

can

be d

ownl

oade

d fro

mht

tD://

wví

w.s

enso

tvIn

c.co

m/h

tmlj'

suD

Dar

t/doc

umen

tatlo

n.ht

mn

Vol

ee D

irect

™ II

Spe

ech

Reco

gnlti

on K

lt

17 18 19 10 31

22

33 M 35

26 37

38 39 30

31

32 33 34

ouru

po.o

j

DU

TK

P0.

1)

cura

ra.*)

tXJP

(PO

J)

OU

TS

IP0.

4) ' '

r*ut(po.7

)

•TR

AIN

tPl.O

)

-BE

CO

G[P

1.1)

-TR

1G T

RA

INIM

.JJ

DU

T61P

U3J

3UT

7(P

1.4)

OU

TS

tPl.5

)

MO

OE

l(Pl.a

)

MQ

DE

ItPl.7

)

5ND

GN

D

Oul

Bui l

of 9

l*t

tlv«

nig

n)

Out

nut

3 0

' 10

lA

clty

í 1*

8»)

cwip

ut

3 o

' L

i [fet\

msn

j

Out

put4

ori3

[Act

lver

fgh)

Outp

ul S

o' U

l*c

t*e

«91)

NM

UM

Ú '

le

tvt

Ope

n

NM

UM

d - U

aw

Op«

n

Oul

put A

ctiv

e H

lflH

WH

«n V

oia

Olratt"

11 H

Uite

nbfl F

o( U

«er

Spe

«cn

Sta

rt S

O T

Min

Cns/

Confif

lure

TfiI

nlP

í/Reco

flnllion

Ser

vtíB

vüy

S«tM

lQW

)

St*

t R

ttofli

rtio

n /

Con

figur

e H

icro

pnon

e S

»fl»

'lMty

[ÍM

oe(£

Sla

rt T

riw

er

Wor

d T

iiWns (S

O,

HO

-, S

WS

moO

tí o

nty

) /

Con

figur

a C

L P

er fo

rma

nte

(M

R b

etow

)O

utw

tfi

or H

[A

ctlv

í W

íti)

Oulw

l? o

r 15

(A

elh

* W

B")

Ouip

ui B

(A

ítfv

e íilg

rí)

•Icxt

e S

ele

aio

n P

in 1

Hod

« S

tiect

íon

Pin

3

G r

ound

con

nect

ton

G r

ound

cun

nect

tefi

O 0 0 o o • - o 1 1 1 o o o I I I I

Figu

re 3

- V

olee

Dir

ect™

II

Mot

herf

aoar

d

54

SS

(R»w

t)

(noc

iu*d

)

O

O O

SI

S2

S3

(Tniln

) (R

óeo

s)

(O.

Trai

n)

Vok»

DV

ect"

II M

odute

l&O

.BfW

jU

* I

hlE

nlIrt

c)^

[—

I

18P

/N 8

0-0

24

0-A

© 2

003

Sen

sory

Inc

200

3 Se

nsor

y In

c-P

/N 8

0-Q

240-

A

Page 137: ESCUELA POLITÉCNICA NACIONAL - Repositorio …bibdigital.epn.edu.ec/bitstream/15000/11809/1/T2300.pdf · de audio y video implementado en el robot, hacia un receptor remoto o televisor

Vole

e D

lrec

t™ I

I S

pee

ch R

eco

gn

ltlo

n K

ltQ

uick

sta

rt M

anua

lQ

uick

Sta

rt M

anua

lV

ole

e D

lrec

t™ n

Sp

eech

Ree

og

nlt

ion

Table

1 ~

Vo

lca D

lrect

™ II

Ho

therb

oard

Pin

Ass

lgnm

ents

Jl Jl n Ji ji Ji Jt jt ji Ji Ji Jl ji ji ji Ji Ji ji Ji Ji ¡s JS JS JS Jfi

J6 J6 je ja J6 J6 J6 Jo ja

DI

01

0] w os os 07 08 09 10 11 12 13 14 1S 16 17 IB 19 20 01

02

03 04 01

02 03 04 05 06 07 06 09 10

fJ.J

V

f3,3

V

OU

TUP

O.O

)

TM

INyU

JJ

OU

T3(

PO

.IJ

AE

CO

G(P

l.I)

QU

TJ(

PO

.J)

7RIG

TR

AJN

(P1.

2)

OU

HtP

O.3

)

OU

T6(

P1.

3)

OU

T5(

P0.

4)

DU

T71

P1.

4)

OU

TB

[Pl,5

)

•100U

IF1.6

)

rALK

(P0.

7)

>iO

Da[P

l.7)

GhD

GN

D

5AC

OU

T

;- 3ND

MO

t3.3

V

XJT

KP

O.O

)

RE

SÍT

TU

M.O

)

f3.3

V

3NO

3ND

.3 V

o>t i+

j po

w«f

«jp

o'y

corm

«e«n

,3 V

olt

{+]

pow

er «

uppl

Y tonníe

tton

Oulp

ul l

of 9

(A

cttv

* m

aní

lart

50

Tra

tnin

s f

Confíate

T

ríln

lng/R

eeoflr

utto

n S

ensl

Uvf

tyK

WÍW

lew

)

Qutp

ui i

or 10

(A

ctiv

e W

on)

St»

rt R

ítognU

tof; / c

ondouie

Hfc

ropn

on» S

*ns'U

vliy l««

OC

kM]

Oulp

ui 3

or

U (

MU

ve

tilgti)

Sta

ttT

flga«f

Wort

Tf»

W<n

g (S

O,

MC

L, S

WS m

odti o

nly

) /

Con

Tou

ic C

L P

erfo

rman

ce (

ttf

belo

xlO

utpu

t 4

of 1!

[Act

ive

hfg

n)

Out

put

6 o

r 14

(A

ctN

e n

lgn)

Oulp

ut

5 o

f 13

(A

ítiv

e ti

IctO

ouip

ut

7 o

r 15

(A

ctrv

í tif

gn)

NoH

Jie

d-L

e»»eO

jen

Ou

tpu

t 8

(A

ctiv

e h

lon)

Mol

Uie

d -

Les

vc O

pen

hVM

e S

ílíitt

oo

Pin 1

Dutp

ut

Act

ive H

lgh

Wde

n V

tfce D

lrect

" 11

Is

Uile

nhfl F

or U

ier

SP

íecn

1od«

S*!

(rtton

Pin

2

G ro

und c

om

edió

n

Gnju

ml co

nnec

tion

Uig

tog o

utp

ut tu

ttDul

fere

dJ

tot u«tf -

Lea

.e O

pen

«il

Ute

d -

Lea

ve O

pen

*>(

UiM

- U

* v

e O

p*n

imund

con

necl

tod

Sro

und

cortt

ieet

ton

J.3

Voii

(•*•

) po

w«r

tjp

píy

oiiir«

c«M

iulp

ul

1 o

r 9 (A

ttta

hio

li)

áofl

Rent

oí V

tfc«

Dire

ct™

11 (

Act

ive

tow

)

Wt

Utc

ú -

Lelv

e O

pen

>ut

put

1 o

r 9

(A

ctiv

e h

lgti)

U

Vo

lt {-

f } p

oner

wptfy c

onre

ctto

n

íround

coin

ect

ion

iiound

cofi«

Ucfi

1 I O 1 o I o 1 0 o o o • o • I 0 1 I 1 o • • • 1 I ] o 1 • o I I I

9. E

rasi

ng t

he

Tem

pla

tes

Whe

n b

oth

th

e -T

RA

IN a

nd

-RE

CO

G p

in a

re p

ulle

d to

GN

D fo

r at

lea

st l

OO

mS

, V

olee

DIre

ct™

II w

lll e

rase

all

tral

ned

tem

ple

tes,

Vol

ee D

Irec

t™ n

w

lll s

ay '

'Mem

ory

era

sed"

, an

d t

hen

exl

t th

e er

ase

mo

de.

In

div

idu

alw

ords

or

sets

can

not

be e

rase

d se

par

atel

y,

10.

Tlps

fo

r O

pti

mal

Per

form

ance

Suc

cess

ful

reco

gnltl

on b

egln

s w

lth t

he

care

ful se

lect

lon

of

word

s fo

r ea

ch r

eco

gnlti

on

se

t. S

ever

al f

act

ors

contr

lbute

to s

ele

ctln

g a

n o

ptlm

al

reco

gnltl

on

set

. P

robl

emat

lc r

eco

gnltl

on

set

s ca

n o

fte

n be

corr

ect

ed

by

repla

clng

one o

r m

ore

wor

ds w

lth a

syn

onym

, or

appro

xlm

ate

syn

onym

(se

e e

xam

ples

, be

tow

), w

lthout

requlrl

ng

any

othe

r ch

ange

s, T

he s

ma

llert

he

set

, th

e h

lghe

r th

e r

ecog

nltlo

n r

ate

Thc

uptim

al

s<-t

consis

ls o

f:

Avitid

sets

lik

e:

Aim

fot

st-t

s lih

(?:

Dls

slm

llar

soun

dlng

wor

ds

Var

ylng

num

bers

of s

ylla

bles

hat/ca

t/ra

tho

me

ph

on

e/o

fflc

e p

hone

ora

nge/a

pple

/cherr

y

hat/k

ltten/m

ouse

ho

me

/off

lce

ora

nge/w

ate

rmelo

n/ g

rap

e

Kay

co

nsid

era

tlo

ns f

or

succ

ess

ful v

oic

e re

cord

lng:

• T

he

equ

lpm

ent

use

d to

tra

ln t

he

vol

ee r

ecor

dlng

s sh

ould

ma

tch t

he e

qulp

ment

used

dur

ing r

eco

gnltl

on.

Dlff

eren

ces

In m

lcro

phone,

mlc

roph

one h

ousi

ng,

etc

. w

lll a

dver

sely

aff

ect

reco

gnltl

on,

• T

he

condltl

ons

and

env

ironm

ent

In w

hich

tíie

vol

ee r

ecor

dlng

s are

made s

houl

d r

efie

ct t

he

con

dltío

ns a

nd

envl

ronm

ent In

whi

ch the

end

pro

duct

wlll

be

use

d,

»)

Dls

tance

, T

he d

ista

nce

of

the

míc

raph

one

from

the

spe

aker

's m

outh

must

be th

e s

am

e du

ring

reco

rdln

g a

nd d

urin

g e

nd-p

roduct

use

. F

or e

xam

ple,

a d

olí

Is t

yplc

ally

hel

d w

lthln

arm

's l

ength

,so

the

vol

ee re

cord

lng

mlc

roph

one s

hould

be

hel

d acc

ord

lngly

.b)

N

atu

ral

Vole

es.

S

ubje

cts

shou

ld s

peak

In

a n

orm

al

vole

e a

nd b

e d

lsco

urag

ed f

rom

so

undí

ngun

usua

l by

Im

ltatln

g

a f

ore

lgn

ac

cent

or

us

lng

an

y unnatu

ral

Into

natto

n.

The

y sh

ould

be

pro

mpte

d b

y m

eans

of

som

e n

on-V

erba

l so

urce

(plc

ture

s or

fla

shca

rds,

for

exa

mple

), s

o as

not

to u

ncon

sclo

usly

mlm

lc t

he

vole

e o

f th

e p

erso

n d

olng

the p

rom

ptln

g.

c)

Phys

lcal

Sta

tes.

P

hysl

cal s

tate

s sh

ould

be

cons

lder

ed.

For

exa

mp

le, t

o co

llect

vol

ee r

eco

rdln

gs

to a

ctív

ate

an

exe

rcis

e m

achi

ne, It

wou

ld b

e s

tron

gly

reco

mm

ended to

reco

rd p

eopl

e w

ho s

ound

out

of

bre

ath

.tí)

E

motíonal

Sta

tes.

E

mot

lona

l st

ate

s sh

ould

be

con

slde

red.

W

lll t

he

end

use

rs be r

ela

tlvely

qule

t and

ca

lm (

say,

for

an

off

ice

prod

uct)

or

loud

and

exc

lted

(say

, fo

r a

play

grou

nd t

oy)

?e)

E

nvlronm

ent

/ B

ack

gro

und N

ols

e.

Envl

ronm

enta

l no

lse

mus

t be

con

side

rad.

F

or e

xam

ple

, apr

oduc

t In

tend

ed f

or u

se Ins

lde

a r

novl

ng v

ehlc

le w

ould

beneflt

fro

m s

ampl

lngs

made

Insl

de a

car

wlth

the

m

oto

r ru

nnln

g.

Nev

erth

eles

s, th

e re

cord

lngs

mus

t be

mad

e I

n a

rea

sona

bly

qule

ten

vlro

nmen

t. T

he

spe

ech

slgn

al m

ust

be p

rom

lnent

rela

tiva

to

faack

gro

und

nol

se a

nd

there

shou

ld n

ot b

e a

ny a

bru

pt, l

oud

nol

ses.

Vole

e r

ecor

dlng

s sh

ould

not

be m

ad

e I

n a

sou

ndpr

oof

room

. T

hese

roo

ms

lend

an u

nnatu

ral

back

grou

nd s

llenc

e t

o th

e r

ecor

dlng

s,

whic

h d

oes

not

refie

ct t

he r

eal-w

orld e

nvl

ronm

ent In

whi

ch t

he e

nd p

rodu

ct w

lll b

e u

sed.

P/N

80-0

240-A

© 2

003

Sen

sory

In

c.©

2003

Sen

sory

Inc-

P/N

80-0

240-A

17

Page 138: ESCUELA POLITÉCNICA NACIONAL - Repositorio …bibdigital.epn.edu.ec/bitstream/15000/11809/1/T2300.pdf · de audio y video implementado en el robot, hacia un receptor remoto o televisor

Qul

ck S

tart

Man

ual

SIN

GL

E-T

RIG

GE

RW

OR

D-S

PO

TT

ING

(S

WS

) M

OD

EW

hen

conf

lgur

ed f

or

SI n

gle-

Trlg

ger

Word

-Spottln

g m

ode,

the

Vol

ee D

lrect

™ U

w|||

, up

on p

ower

-Up

or

rese

t,ch

eck

to s

ee

!f a

ny w

ords

hav

e b

een t

raln

ed.

If s

o, th

en

Vol

ee D

lrect

™ II

wlll

Imm

edla

teiy

sta

rt llst

enln

g (

lnw

ord

-spottl

ng

mod

e) f

or

the

trlg

ger

word

. If

no

wo

rds

ha

ve b

een t

raln

ed,

then t

he

Voi

ce D

lrect

™ I

I w

lll w

a|t

for

the

use

r to

tra

ln o

ne o

r m

ore

wo

rds.

Aft

er

traln

ing,

the

-R

EC

OG

pin

can b

e b

rought

low

to i

nlti

ate

Wo

rd-

Spo

tting

reco

gnltl

on,

Jt Is

Im

port

ant

to n

ote

that

the

mod

ule

Is

only

llst

enln

g w

hen t

he T

Al-K

LE

D Is

llt.

Use

the

LE

D a

s an

Indlc

ata

rof

w

hen

you ca

n s

peak

the trlg

ger

and c

omm

and

wo

rds,

es

pecl

ally

whe

n f

irst

usl

ng t

he

module

, A

fte

rsu

cces

sful

reco

gnltl

on o

f th

e t

rigger

word

, th

ere

Is

a 3

sec

ond

wfn

dow

du

rlng

whl

ch V

olee

Dlre

ct™

II

lslls

tenln

g f

or

a c

om

ma

nd

wo

rd (

If a

ny

are

tra

ined).

If

no

co

mm

an

d w

ord

s are

tra

lned,

then

a s

ucce

ssfu

lre

cognltl

on

of

the t

rlgger

wor

d w

lll c

ause

the o

utp

uts

to

beh

ave

as

If t

he f

irst

com

man

d w

ord

had

bee

nre

cogn

lzed

(O

UT1

wo

uld

toggle

hlg

h).

Thl

s fe

atu

re l

s us

efut

If

only

a s

ingl

e t

rlgger

Wor

d ls

requlre

d.

Not

eth

at

Vol

ee D

lrect

™ I

I do

es n

ot

need

to

wa

lt th

e full

3 s

econ

ds I

f It

hea

rs y

our

com

ma

nd

wo

rd o

nce

It d

ete

cts

the

slle

nce a

t th

e e

nd

of y

our

uttera

nce

, re

cogn

ltlon

pro

cess

lng

wlll

beg

ln Im

media

tely

,

Whe

n a

tral

ned

seq

uenc

e of

wo

rds

(trlgger

wo

rdP

in(s

) w

lll p

ulse

hlg

h f

or

1 s

eco

nd:

com

man

d w

ord

) ls

reco

gnlz

ed,

the

ap

pro

prl

ate

Outp

ut

Recognitio

n W

ord

O

J

I i)>

." '

0."

" -;

C

U'

-I

OJ'

> (i

.'"^

íl.r

.

.'-il

.-!

Tri8

g«r +

Com

m«n

d W

ort o

j(o

rTrl

flse

r-t

Mo

Com

man

dW

ord»

Tra

lned)

Trt

go«r

4- C

omm

and

Wor

t) 0

2

Trl

gg

cf -

f co

mm

and

Wor

d o

s

Trlflf

l«r

4-C

om

trw

nd

Word

04

Trtflg

«r

4- C

omm

and

Word

05

trlg

gar

4-C

omm

and

Wor

d 0

6

Tf iggtr

4- C

omm

and W

ord

07

Trlg

gvr

4- C

omm

and W

ottl

OS

TrlB

Ber

4- C

ornm

and W

ord

09

Trlflg

«r4

-Com

m«nd

Wor

d 1

0

Tra

gar

-f C

omm

and

Wor

d lí

Trlg

oer

4- C

Om

man

d W

ord

12

Trlflo

er +

Com

man

d W

ord

13

Trlíg

er +

Com

man

d W

ord 1

4

Trt

agtr

4- C

omm

and W

ord

16

A A

A A

A A

A A

A A

A A

A A

A A A A A A A A

t*:

"fl'f

ndfa

tes

that

tho

out

puts

ara

"A

ctiv

e-hl

yh~ P

/N S

O-0

24

0-A

© 2

003

Sen

sory

Inc

.

Qui

ck S

tart

Man

ual

Vo

lee

Dir

ect"

" U

Sp

eech

Rec

og

nít

lon

Klt

Fig

ure

4 -

Bas

ic A

pp

licat

ion S

chem

atlc

, ^

y//

7AIK

(P0.

7) I3

~J

P

j ""

i

YaL

OW

LEO

oim

101

ni I

*

^J*^

^uun

(T

O-ü

]L__

j>

Vi

RE

D L

ED

ntir-

rm

ni

^

WU

UM

(ru

.ljl

¿r

W1

REO

LE

O

RED

LED

<

' OJ

T1DK

AL

(3«

tafil

a 3

) '

' O

ofim

s '

' O

oíw

ra

'

i es

MO

tai

'|

(B« t

abl* 4

) <

, 1Q

K '

-REC

OO (P

l.l] f~

^>

1

^V

^

!

i 10

K

'

-TR

IO T

RAI

N {P

1.2

)CH

>

• ^/V

*

•1Q

K

'

> 300

MO

DE

SE

LE

CT

IOH

The

re a

re 4

maln

opera

ting

mod

es f

or

the

Vol

ee D

lrect

™ II

mod

ule t

hat

can b

e s

ele

cted

dependln

g o

n h

ow

vole

e re

cogn

ltlon

w

lll I

nte

ract

wlth

your

appllc

atlo

n.

The

se a

re

Edg

e-T

rlgge

red

Sin

gle

Rec

ognl

tlon

(ES

R)

mode,

Sln

gle

-Trlg

ger

Con

tlnuo

us U

sten

ing

(5

CL)

mod

e, M

uitl

-Trig

ger

Con

tlnuo

us U

sten

ing

(M

CL)

mod

e, a

ndS

I ngle

-Trlg

ger

Wo

rd-S

po

ttin

g (

SW

S)

mode.

The

MO

DE

1 an

d M

OD

E2

plns

are

use

d to

sel

ect

the

desi

red

oper

atin

g

mod

e.

The

ope

ratin

g

mod

e

¡s s

et

when t

he

Vol

ee D

lrect

™ I

I ls

fir

st

pow

ered

up

(o

r re

set)

acco

rdln

g to

th

e fo

llow

lng

tab

te;

Tib

ie 3

- V

oic

e D

irec

f™ I

IM

ude

Cu n

f¡gura

tion

pin

Con

tigo

ral i

onO

per.

-itm

q M

ode

l op

en d

reult

NO

DE

2 op

en d

rcult

hOO

Ei

pirtl

ed lo

wM

OO

EJ

open

drc

ult

Edg

e-trl

gger

ed S

ingl

e R

ecog

nltlo

n IE

SR

) mod

e

{Sin

gle-

Tríg

ger

Con

tínuo

us U

sten

ing

(S

CL)

mod

e

en d

rcU

tM

OD

E2

pulle

d lo

w

HO

DEl pu

lled

low

MO

DE

2 pu

lleü

iow

¡MuW

-Trlg

ger C

ontln

uous

Ust

enin

g (

MC

L) m

ode

]Sln

gle-

Tí1

gger

Won

í-Spo

ttlng

(SW

S)

mod

e

Ope

ratin

g In

stnJ

ctlo

ns c

an b

e fo

und ln

sec

tlons

-i,

5 a

nd 6

of th

ls m

anual.

TR

AIN

ING

AN

D R

EC

OG

NIT

ION

SE

LE

CT

IVIT

YT

he -

TR

AIN

, -T

RIS

TR

AIN

and

-R

EC

OG

pln

s co

ntr

ol

the

sele

ctlv

lty a

nd

sensl

tlvlty

of

the

Vol

ee D

lrect

II,T

he c

onfig

ura

ron

par

arne

ters

are

set

when t

he

Vol

ee D

lrect

™ II

ls f

lrst

po

we

red u

p (

or

rese

t) a

ccor

dlng

to

the

follo

win

g t

able

:

© 2

003

Sen

sory

Inc.

P/N

80-

02^

0-A

Page 139: ESCUELA POLITÉCNICA NACIONAL - Repositorio …bibdigital.epn.edu.ec/bitstream/15000/11809/1/T2300.pdf · de audio y video implementado en el robot, hacia un receptor remoto o televisor

Vol

co P

irect

™ II

Spe

ech R

eco

gnltl

on K

ltQ

uick

Sta

rt M

anua

l

T.th

ln 4

- V

oicf

i D

irce

l™ II

Scn

siti

vily

Thr

nsho

ldC

iitifi

nu

ratio

n P

in ('n

iilig

ur.it

mr»

TRA

IN o

pen

drc

ult

Tra

fnln

g/R

ecog

nltlo

n

- E

atta

r Co

traln

, ac

cept

s m

ore

slrn

llai

sour

xitn

g w

ord

i, R

ecog

nlie

s m

ore w

ords

, m

ay s

omeü

mes

(U

tBüt

ute

th«

Tt] jio

rds

(few

er•T

RA

IN p

u'lw

l t»

GN

D w

ith e

1DK

re

sist

or¡trt«

Tra

lnln

g/R

ecog

nltiQ

n -

Har

der to

Crtí

n, reje

cti

mor

e s

imila

ror

ds.

Rec

ognl

ies

few

cr

ytan

ls,

may

so

rneü

mes

re

ject

tra

it>ed

w

ords

tew

er s

ubst

itutto

ns}.

•TR

IG T

flAIN

ope

o cl

rcul

t:a

ster

SC

L/H

CL/

SW

S T

rlgge

r W

ord

perfo

rman

ce

- R

ecog

nlie

s trig

gen

•nor

e qu

lcW

y,

may

so

rnet

lmes

su

bstit

ute

tti

e W

rong

w

ords

(fe

wet

•eje

ctio

ns).

-TR

IG

TRA1

N

pulle

d

ta

GN

D

Wlth

B

esf

itor

«r

5CL/

MC

L/S

WS

Trig

Qer

Wor

d R

ecog

nlüo

n -

Rec

ognU

es tr

lgge

rs m

or*

|y,

may

sor

neU

mes

rej

ect

traln

ed w

ords

(fe

wer

sut

jsttt

utto

nsj.

•Ucr

opíw

rw s

ensl

trvíty

con

flgur

ed fo

r up

to a

rm's

teo

gtti

opür

oaJ

fllst

ance

•REC

OG

pol

led

to G

ND

wlth

e 1

DK res

isto

r•U

crop

hone

sen

sJtfv

lty e

onfig

ured

for

up

to 6

feet

ópt

ima!

dis

tant

e

Som

e ap

pllc

atlo

ns o

f C

ontln

uous

Lls

tenl

ng o

r W

ord-

Spo

ttlng

req

ulre

máx

imum

ac

cura

cy w

lth t

he f

ewes

tfa

lse

trlg

gers

. Thl

s co

nngu

ratlo

n ls

app

ropr

late

for

an

appl

icat

lon

such

as

a llg

ht s

wltc

h, w

here

a fa

lse

trlg

ger

may

be

mor

e th

an a

mln

or in

conv

enle

nce,

Fur

ther

, th

e SC

L, M

CL

or S

WS

reco

gnlz

er in

suc

h an

app

licat

lon

hear

s a

grea

t man

y ph

rase

s th

at

are

not

trig

ger

phra

ses,

so

ther

e a

re m

any

oppo

rtun

lties

for

fal

se t

rigge

rsan

d a

hlgh

le

vel

of

accu

racy

ls

de

slre

d.

A

cons

eque

nce

of

thls

hl

gh

accu

racy

Is

re

latlv

ely

slow

resp

onsl

vene

ss.

Oth

er a

ppllc

atlo

ns -

ga

mes

, for

exam

ple

- ca

n a

ccep

t occ

aslo

nal f

alse

trig

gers

, but

need

fas

t re

spon

se. I

nth

ese

appl

lcat

lons

the

rela

tlve

frequ

ency

of

trlg

ger

phra

ses

may

be

quite

hlg

h, s

o fa

lse

trlg

gerln

g ac

cura

cy ls

less

of

a co

ncer

n.

It sh

ould

be

note

d th

at I

f an

y of

the

thre

e pu

shbu

ttons

Si,

52

or

S3

are

held

dow

n du

rlng

res

et o

r po

wer

-on,

the

Vol

ee D

irect

™ II

wlll

Inte

rpre

t thl

s as

If th

e re

slst

ors

are

In c

ircul

e an

d w

lll c

onfig

ure

Itsel

f to

use

the

strlc

tse

ttlng

for

that

pin.

MO

DU

LE P

IN C

HA

RA

CTE

RIS

TIC

SA

bsol

ute

Máx

imum

Rat

lngs

WA

RH

ING

: S

tnss

lng

the

Vole

e D

írect

™ /

/ be

yotrü

the

'A

bsdu

te

Máx

imum

Rat

íngs

1" "

"X «

use p

erm

ínefít

cla

mas

e. T

Ties

e ar

e s

tres

sra

tings

oflt

y. O

pera

ción

be

ywd

the

"O

pera

tlng

Con

dltio

ns' !

s no

t te

com

tnen

üed

and

exte

nded

exp

osur

e b

eyon

d th

e ~O

pera

tlns

Con

dlO

ons'

may

affe

ftdev

ice

reíla

bim

y.0

.1V

tQ+

6.5

V20

°C t

o +

70°C

1W 20°C

to+7

0°C

;V

po^z

.y-s

.ev

Vss

=O

V

Any

pin

tO

pera

tlng

tem

pera

ture

(T0)

:P

ower

dls

slpa

tlon:

Ope

ratln

g C

ondl

tíons

:

DC

Cha

ract

eris

tlcs

, =

-20

°C to

+70

°C( V

dd =

3.3

V )

SY

MI1

0L

SA

ME

TE

» M

1N

TV

P

MA

X

UN

1TS

C

OM

Dm

oN

S

^ *wtV

ík!>

4.S

)

"a ^CM

inputL

ow

Volta

oe

PD

.O-P

1.7,

-R

ESET

Input H

lgti

Vol

tage

PO

.O-P

Í.7,

'RE

SE

T

Out

put L

ow V

olta

geP

O.O

-PI.7

Out

put H

lgh

Vol

tage

PO

.D-P

1.7

-0.1 3.0

0.8

- Vdd

0.3

D.S

*Vdd

0.75

Vdd

4-

0.3

Q.rV

rJd

V V V V

U-Z

rnA

i»--

* m

A

10

p/N

80

-Q2

40

-A©

200

3 Se

nsor

y In

c.

Qui

ck S

tart

Man

ual

Vo

lca_

PIr

ect

™II

Spe

ech

Reco

gnltl

on K

lt

Rocognititm

Word

Ü

LH

I (K

M."

1 u.r

í

(M -i

O;i

. (¡jin

o,"

/

fui

M

Trlggtr

4- G

omm

and W

ord

01

(or

Trlftger

+ N

o C

omm

and

Wor

d» T

rato

ed)

Trlg

aer

+ C

omm

and

Word

02

Trlflf

l«r

4- C

omm

and

Word

03

Trlgger

4- C

omm

and W

ord

04

Trlggw +

Com

man

d W

ord 0

5

Trlg

ger

4- C

omm

and

Word

06

Trlg

ger +

Com

man

d W

ord

0?

Trlgger

4- C

omm

and

Word

Ofl

Trt

gger

4- C

omm

and

Wor

d 0

9

Trf

cfle

r-f

Com

man

d W

ord 1

0

Trlggcr

4- C

omm

and

Word

11

Trlg

ger

4- C

omm

and

Word

12

Trlg

ger

4- C

omm

and

Word

13

Trlgger

+• C

omm

and

Wor

d 1

4

Trlgger

4- C

omm

and W

ord

15

A A

A A

A A

A A

A A

A A

A A

A A A A A A A A

Not

».*

"A">

nd

lc*t

*s t

hat

th

e o

utp

ut*

are

"A

ctív

&4i

lgt\~

MU

LT

I-T

RIG

GE

RC

ON

TIN

UO

US

US

TE

NIN

G (

MC

L)

MO

OE

MC

L m

ode

wor

lts in

a s

imila

r fa

shlo

n to

SC

L m

ode,

exc

ept t

hat

the

mod

ule

ls c

ontln

uous

ly m

onlto

rlng

for

upto

thr

ee t

rlgge

r w

ords

at t

he s

ame

time.

The

com

man

d w

ord

follo

wín

g th

e M

CL

trlg

ger

wor

d w

lll b

e m

atch

ed o

nly

agal

nst

the

tem

plat

es l

n th

eco

rres

pond

lng

set,

If n

o co

mm

and

wor

ds a

re tr

alne

d, t

hen

a su

cces

sful

rec

ognl

tlon

of o

ne o

f th

e M

CL

trlg

ger

wor

ds w

lll c

ause

the

out

puts

to

beha

ve a

s If

the

flrst

com

man

d w

ord

ln t

hat

set

had

been

rec

ognl

zed,

por

exam

ple,

If

no c

omm

and

wor

ds w

ere

traln

ed f

or S

et B

, the

n O

LJT2

and

OU

T4 w

ould

tog

gle

hlgh

. Thl

s fe

atur

els

use

ful l

n ap

pllc

atlo

ns r

equl

rlng

up

to 3

trlg

gers

but

no

com

man

d w

ords

, or

whe

re th

ere

are

múl

tiple

use

rs.

Trtgfle

r W

ord

1

Com

man

d W

ord

1

Triggcr

Word

1

Com

man

d W

ord

2

Trlgger

Word

í

Com

man

d W

ord

3

TrlQ

ícr

Wor

d í

C

omm

and

Word

4

Trlg

ger

Word

1

Com

man

d W

ord

5

Trlogot

Word

2

Com

man

d W

ord

1

Trlgfle

r W

ord

a

Com

man

d W

ord

2

Trt

gg

orW

ort

l3

Com

man

d W

ord

3

Trlg

ger

Wo

rd 2

C

omm

and W

ord

4

Trí

gpar

Word

1

Com

man

d W

ord

5

Trios e

r W

ord

3

Com

man

d W

ord

1

Trlgaer

Word

3

Com

man

d W

ord

a

Trt

gger

Word

3

Com

man

d W

ord

3

Tr$

gger

Word

3

Com

man

d W

ord

4

Trt

gye

rWa

rd 3

C

omm

and

Word

5

A A A A A

A A A A A

A A A A A

A A A

A A A

A A A

A A A

A A AN

onti

"A

"In

dlc

ttfs

tb

at t

he

ou

tptr

ít t

re

"Act

tvft

ilyh

~,

© 2

003

Sens

ory

Inc.

P/N

80

-02

40

-A15

Page 140: ESCUELA POLITÉCNICA NACIONAL - Repositorio …bibdigital.epn.edu.ec/bitstream/15000/11809/1/T2300.pdf · de audio y video implementado en el robot, hacia un receptor remoto o televisor

Vo

lee

plrect

™ II

Sp

eech

Reco

gn

ltlo

nK

¡tQ

ul c

kSta

rt M

anua

l

If t

he s

et

conta

lns

8 o

r fe

wer

el

emen

ts,

these

pln

s m

ay

be

use

d t

o c

ontr

ol

actío

ns dlrect

ly.

If

the s

et

cont

alns

mor

e t

han 8

ele

men

ts,

deco

dlng

Is

nece

ssar

y. T

he l

oglc

al

form

at

of t

he o

utp

uts

Is

show

n In

the

table

bel

ow.

Roco

gniti

un

Wo

rrt

O,) i

OLÍ

1,'

(Xii

: u.í

t <

u¡'

s i)

.1 h

ti

;1 ;

O

ti .-;

Co

mm

an

d W

ord

01

Com

mand W

ord

02

Com

mand W

ord

03

Com

mand W

ord

04

Co

mm

an

d W

ord

05

Com

mand W

ord

06

Com

mand W

ord

07

Com

mand W

ord

06

Com

mand W

ord

09

Com

mand W

ord

10

Com

mand W

ord

11

Com

man

d W

ord

12

Com

nia

nd

Word

13

Com

mand W

ord

14

Co

mm

an

d W

ord

15

A A

A A

A A

A A

A A

A A

A A

A A A A A -A A AN

ote

: "A

"/o

tffc

aies

tft

at t

ha

ou

tpu

ts a

n

"Act

tvc-

htg

h".

If

an e

rror

occu

rs during r

eco

gnltl

on (

exc

ep

t fo

r "W

ord

not

reco

gnlz

ed")

, th

en t

he

er

rar

wlll

be

spo

ken

"Spo

ke to

o s

oon"

, "P

icas

e ta

lk louder"

, e

tc.

If t

he

sp

oke

n w

ord

Is n

ot

reco

gnlz

ed f

or

any

reaso

n, n

one o

f th

epl

ns a

re a

ctlv

ated

and

an a

ppro

priate

vol

ee m

essa

ge, "

wo

rd n

ot r

eco

gniz

ed",

Is s

ynth

esl

zed,

For

eac

h co

mm

and w

ord,

Vol

ee D

lrect

™ II

monlto

rs t

he

ba

ckg

rou

nd

nol

se leve

l. V

olee

Dlre

ct™

II

work

s w

ell

wlth

hlg

h (

abou

t 80

dB

) le

véis

of

stea

dy b

ackg

roun

d n

olse

(su

ch a

s a f

an),

but

It

may

ma

ke e

rror

s at

lo

we

rle

véis

If

the

back

grou

nd n

ols

e Is

no

t st

eady

(for

exam

ple,

a T

V s

et)

. B

est

resu

lts w

lll b

e o

bta

lned l

n a

rela

tlvely

qule

t lo

catlo

n.

War

nlng

s m

ay

also

ap

pe

arl

f th

e w

ord

Is

spok

en too s

oftly

, to

o lo

udly

, o

rto

o q

ulck

ly a

fte

r th

e p

rom

pt.

SIN

GLE

-TR

IGG

ER

CO

NTIN

UO

US

US

TE

NIN

G (

SC

L)

MO

DE

Whe

n co

nfig

ure

d fo

r S

CL

mod

e, t

he

Vol

ee D

lrect

™ I

I w

lll,

upon

pow

er-u

p or

rese

t, c

heck

to

see

If a

ny

wor

dsha

ve b

een

traln

ed,

If s

o,

then

Vol

ee D

lrect

™ I

I w

lll I

mm

edla

tely

sta

rt l

lste

nln

g f

or

the

trlgger

word

. If n

ow

ords

tia

ve b

een t

raln

ed,

then t

he

Vol

ee D

lrect

™ I

I w

lll w

alt

for

the

use

r to

tra

ln o

ne

or

mor

e w

ord

s. A

fte

rtraln

lng,

the

-R

EC

OG

pin

can

be b

rought

low

to I

nltl

ate

con

tlnuo

us ll

sten

lng o

pera

tlon.

It Is

Import

ant

to n

ote

tha

t th

e m

odule

ls o

nly

llste

nlng

whe

n th

e T

ALK

LE

D I

s llt.

Use

the

LE

D a

s an

Indl

cato

rof

when

you

can

sp

eak

the tr

igger

and c

om

mand w

ord

s, e

spec

lally

whe

n f

lrst

usl

ng t

he m

odul

e.

Aft

er

succ

essf

ul r

eco

gnltl

on

of

the t

rigger

word

, th

ere

ls

a 3

sec

ond w

lndo

w d

urin

g w

hic

h V

olee

Dlre

ct™

U Is

llste

nlng

for

a c

omm

and w

ord

(If

any

are t

ratn

ed). lf

no

com

man

d w

ord

s ar

e t

raln

ed,

then

a s

ucce

ssfu

lre

cogn

itlon

of

the

trlg

ger

wo

rd w

ill c

ause

the o

utp

uts

to

beh

ave

as

If t

he f

irst

com

mand w

ord

had

bee

nre

cogn

lzed

(O

UT

1 w

ould

toggle

hlg

h).

Thl

s fe

atu

re l

s us

eful

If

only

a s

ingle

trlgger

Wor

d ls

requlre

d.

Note

that

Vol

ee D

lrect

™ I

I do

es n

ot

need

to w

alt

the full

3 s

econ

ds lf

It

hear

s yo

ur

com

man

d w

ord

onc

e It d

ete

cts

the sl

lenc

e a

t th

e en

d o

f yo

ur

uttera

nce

, re

cognltl

on

pr

oces

sIng

w

lll

begl

n I

mm

edla

tely

.When

a

tral

ned

sequ

ence

of

word

s (C

L w

ord

-}•

SD

word

) Is

rec

ognl

zed,

the

appro

priate

Out

put

Pln

(s)

wlll

pul

se h

lgh

for

1se

cond

;

P/N

80

-02

40

-A©

200

3 S

enso

ry I

nc.

Qul

ck S

tart

Man

ual

VüI

cejH

rect

"' I

I Sp

eech

Rec

ognl

tlon

Klt

k Coc

í

w Bpu

Lojfc

"! 0

Input C

urre

nt

Sup

piy

Curren!, O

pera

ting

Sup

ply

curr

ent,

Qul

esce

nt

puH

-up r

esl

ftance

,P

Q.O

-P1.

75,

80,

Hl-Z

<1

37 4

6,5

, 2D

D,

HI-Z

10 IDü 6

uA mA

mA

K-o

hrn

</»

<V

»,<V

N

•fl-Z

Out

puts

HI-Z

Out

puts

Sei

ecttf

d w

lch

softw

are

7. T

rain

lng

Voi

ce D

lrec

t™ I

IE

DG

E-T

RIG

GE

RE

D S

ING

LE

-RE

CO

GN

ITIO

N (

ES

R)

MO

DE

The

mod

ule s

houl

d b

e c

onfig

ured

for

SD

Mod

a. W

hen

the -

TR

AIN

pin

Is

pulle

d t

o G

ND

for

at l

east

lO

Om

S(s

uch a

s by

pus

hlng

a m

om

enta

ry p

ush

butto

n,

labele

d ¡n

fig

ure 2

as

"Sl

(Tra

ln)"

), t

raln

lng w

lll b

egln

. V

olee

Dlre

ct™ II

wlll

pro

mpt

"Say

wo

rd x

" (w

here

x c

orre

spon

ds t

o the

wo

rd to b

e tr

aln

ed).

A tra

lned

wor

d o

r ph

rase

must

be n

o lo

nger

than

2.5

sec

onds

and m

ay

not

conta

ln s

lfenc

es lon

ger

than

0.5

seco

nds.

For

exa

mple

, th

e ña

me

"Doh

n S

mlth

" w

ould

be

an a

cce

pta

ble

phr

ase

as lo

ng a

s th

e tw

o w

ord

s ar

eno

t se

para

ted

by a

larg

e p

ause

. Tra

lnln

g t

erm

lnate

s w

hen

no w

ord

Is s

poke

n In

resp

onse

to a

pro

mpt,

when

any

push

butto

n I

s pre

ssed

a s

econ

d tim

e d

urin

g t

raln

lng,

wh

en th

ree e

rror

s ha

ve o

ccurr

ed d

urin

g tra

lnln

g,

orafter

atl is

wo

rds

ha

ve b

een tr

aln

ed.

Brin

glng

the

-T

RA

IN p

in l

ow a

t a l

ate

r tim

e r

esum

es t

raln

lng.

New

wor

ds a

re a

dded

to

the

end

of

the

set

atre

ady

reco

rde

d,

New

wor

ds m

ay b

e a

dded

to t

he s

et a

t an

y tim

e, u

p t

o a

máxi

mum

of

LS w

ord

s. Indiv

idual

wor

ds from

the s

et

may

not

be d

ele

ted a

r ove

rwrttte

n,

but

the entlr

e s

et

can b

e e

rase

d (

see "

Era

sing

Tem

ple

tes"

, se

ctlo

n 7

), T

he

use

r sa

ys t

he f

lrst

wo

rd to

be tr

aln

ed,

then

Vol

ee D

irect

™ II

pro

mpts

aga

ln w

lth"P

ep

ea

r. T

he

use

r re

peats

the

word

, and

Vol

ee D

lrect

™ II

wlll

retu

rn "

Acc

ep

ted

" If

the

wo

rd h

as

been

succ

essf

ully

tra

lned.

Oth

erw

lse,

It

wlll

ind

ícat

e t

he

cau

se o

f th

e t

raln

lng

err

or,

If a

n e

rror

occu

rs d

urin

gtraln

lng,

then t

he

err

or w

lll b

e s

poke

n "

Spoke

too s

oon"

, "P

leas

e ta

lk louder"

, etc

, T

he

use

r w

lll g

et

thre

ea

tte

mp

ts t

o tra

ln e

ach

WQ

rd b

efo

re V

olee

Dlre

ct™

II e

xlts

tra

lnln

g m

ode,

and

say

s "T

rain

lng

com

ple

te".

The

use

r ca

n e

xlt

traln

lng

ac

any

time

by

brin

gln

g t

he -

TR

AIN

or

the

-R

EC

OG

pin

low

, by

not

res

pond

lng

to

a"S

ay

wo

rd x

" o

r"R

ep

ea

t" p

rom

pt, o

r w

hen s

il 15

word

s h

ave

bee

n tra

lned.

Exa

mp

le (

SO

):

Act

lon:

Vol

ee D

lrect

™ H

:U

ser:

Vok

e D

lrect

™ II:

Use

n

Vol

ee D

irect

™ I

I:U

ser:

Vol

ee D

lrect

™ I

I;U

ser:

Vol

ee D

lrect

™ 11

;U

ser:

Vol

ee D

irect

™ 1

1;U

ser;

Brln

g -T

RA

IN p

in lo

w"S

ay w

ord

one"

•Sta

rt"

"Rep

eat"

"Sta

rt"

"Say

wor

d tw

o"

"Shu

tdow

n""R

epea

t""S

hutd

own"

"Say

won

J th

ree"

"Ugh

ts"

"Rep

eat"

"Ugh

ts-

Act

lon:

Brín

g -T

RA

IN p

in lo

w

Sta

rt

tral

nlng

Tral

nlng

fírs

t co

mm

and

Wor

d

Tral

nlng

sec

ond

com

man

d w

ord

Trai

nlng

thl

rd c

omm

and

won

í

Sto

p t

raln

lng

Not

e; V

olee

Dlre

ct1"

II

wiH

con

tinué

to

prom

pt fo

r ne

w w

crds

to

traln

unt

il al

l IS

mem

ory

loca

tíons

hav

e be

en fH

Ied.

To

stop

tra

lnln

g, b

rfng

the

-TR

AIN

pin

IQW

aga

ln.

SIN

GLE

-TR

IGG

ER

CO

NT

INU

ÓO

S L

IST

EN

ING

(S

CL)

MO

DE

The

mod

ule s

houl

d b

e c

onfig

ure

d f

or S

CL

Mod

e. I

n t

hls

mod

e, s

epár

ate

plns

are

use

d to

tra

ln t

he

trlg

ger

wo

rd (

-TR

1G T

RA

IN p

in)

and t

he c

omm

and

wo

rds

(-T

RA

IN p

in).

Aft

er

traln

lng

the

trlgger

Wor

d, u

p t

o 1

5co

mm

and

wor

ds c

an b

e tr

aln

ed.

© 2

003

Sen

sory

Iri

c.P

/N 8

D-Q

24P

-A

Page 141: ESCUELA POLITÉCNICA NACIONAL - Repositorio …bibdigital.epn.edu.ec/bitstream/15000/11809/1/T2300.pdf · de audio y video implementado en el robot, hacia un receptor remoto o televisor

Vo

lca

Dir

ect1

* IX

Sp

eech

Ree

og

nlt

lon

Kit

Qui

ck S

tart

Man

ual

Exa

mp

le (

SC

L):

Act

lon:

Voi

ce D

irect

™ I

I:U

ser;

Voi

ce D

irect

™ II:

Use

n

Act

lon:

Vol

ee D

Irec

t™ I

I;U

ser:

Vol

ee D

irect

™ I

I:U

ser:

Vol

ee D

irect

™ I

I:U

ser:

Vol

ee D

irect

™ II;

Use

r:

Voi

ce Q

irect

™ I

I:U

sen

Voi

ce D

Irect

™ I

I:U

ser:

Brin

g -T

RIG

TR

AIN

pin

loW

"Say

wor

d on

e""S

ound

Sys

tem

*"R

epea

t""S

ound

Sys

tem

"

Brin

g -T

RA

IN p

in lo

w"S

ay w

ord

one"

"Sta

rt"

"Rep

eaf

"Sta

rt"

"Say

wor

d tw

o""S

hutd

own"

"Rep

eat"

"Shu

tdow

n"

"Say

wor

d th

ree"

"Ugh

ts"

"Rep

eat"

"Llg

hts

"

Sta

rt t

rlgg

er

wor

d tr

alni

ngTr

alni

ng t

rigge

r w

ord

Sta

rt c

omm

and

wor

ds t

rain

lng

Tral

ning

firs

t co

mm

and

wor

d

Traí

nlng

sec

ond

com

man

d w

ord

Tral

ning

thl

rd c

omm

and

wor

d

Act

lon:

B

ring

-TR

AIN

pin

low

S

top

tral

ning

Mgt

fi¿ V

olee

DIre

ct™

II w

HI c

ontin

ué t

o pr

ompt

for

new

wor

ds t

o tra

ln u

ntil

all

15 m

emor

y lo

catlo

ns h

ave

been

filie

d. T

ost

op tr

alnl

ng,

brin

g th

e -T

RA

IN p

in lo

w a

galn

.

MU

LT

I-T

RIG

GE

R C

ON

TIN

UO

US

LIS

T6N

ING

(M

CL

) M

OD

ET

he m

odul

e sh

ould

be

co

nflg

ure

d fo

r M

CL

Mod

e. T

he t

raln

ing

seq

uenc

e Is

ve

ry s

imila

r to

SC

L m

ode,

exc

ept

that

3 s

epár

ate

trlg

ger

wo

rds

can

be t

raln

ed,

Aft

er

traln

ing

ea

ch trlg

ger,

up

to

-5 c

om

ma

nd

wor

ds c

an b

etr

ain

ed

whl

ch a

re a

ssoc

late

d W

ith t

ha

t tr

igger

wor

d. i

t Is

Im

po

rta

nt

to n

ote

th

at

each

co

mm

and

set

mu

be

tral

ned

¡m

med

late

ty

follo

wln

g

the

corr

csp

on

dln

g

trlg

ger

w

ord

. O

nce

the

nex

t tr

ígg

erw

ord

Is

tral

ned

, th

en

is

no

way

to

go

ba

ck

an

d r

e-t

rain

a c

om

man

d s

ef w

lth

ou

t er

asln

g t

he

en

tlre

mem

ory

. T

ryln

g t

o t

raln

tw

o s

imila

r tr

igger

wor

ds w

ill r

esu

lt In

a "

too

sim

ilar"

err

or.

Dur

lng

the t

raln

ing

of

the

com

man

d se

t, ea

ch c

om

ma

nd

wo

rd I

s ch

ecke

d fo

r sl

mlla

rtty

to o

ther

com

ma

nd

wo

rds

In It

s se

t, bu

t na

tag

alns

t th

ose

In o

ther

set

s.

MC

L m

ode

can

be u

sefu

l fo

r a

sing

le

user

pro

duce

usl

ng m

últi

ple

ga

tew

ay

com

man

ds,

or f

or

multl

-use

rap

pllc

atlo

ns w

her

e ea

ch u

ser

would

tra

ln n

¡s o

r he

r ow

n trlg

ger

and

co

mm

an

d w

ord

s,

Exa

mp

le (

MC

L):

Act

lon:

Voi

ce D

irect

™ I

I:U

ser:

Vol

ee D

irert™

II:

Use

r:

Act

lon:

Vot

ce D

irect

™ II;

Use

nV

olee

Dire

ct™

II:

Use

r:

Vol

ee D

irect

™ I

I:U

ser:

Vol

ee D

irect

™ II:

Use

r:

Act

lon

:

Act

lon;

Vole

e D

Irect

™ II:

Brin

g -

TR

IG T

RA

IN p

in lo

w"S

ay w

ord

one"

"Sou

nd S

yste

m"

"Rep

eat"

"Sou

nd S

yste

m"

Brin

g -

TR

AIN

pin

low

"Say

wor

d on

e-on

e""S

tart

""R

epea

t""S

tart

"

"Say

wor

d on

e-tw

o""S

hutd

own"

"Rep

eaf

"Shu

tdow

n"

Brin

g -T

RA

IN p

in lo

w

Brin

g -T

RIG

TR

AIN

pin

low

"Say

wor

d on

e"

Sta

rtsetl

rr

/ffjj

er

wor

d tr

alni

ngTr

alni

ng s

et 1

tríg

ger

wor

d

Sta

rt s

et 1

com

man

d w

ords

tra

lnin

gTr

alni

ng s

eí 1

fírs

t com

ffand

wor

d

Tral

ning

se

t i s

econ

d co

mm

and

wor

d

Sto

p tr

alni

ng

Sta

rt s

et

3 t

rlgge

r w

ord

tral

ning

Tral

ning

set

2 t

rigge

r w

ord

P/N

80

-02

40

-A©

200

3 S

enso

ry I

nc.

Qui

ete

Sta

rt M

anua

lV

olee

jMre

ct™ II

spe

ech

Rec

ognl

tlon

Klt

Use

r:Vo

lee

DIre

ct™ II;

Use

n

Act

lon:

Voi

ce D

Irect

™ I

I:U

ser;

Voi

ce D

Irect

™ II

:U

ser;

Voi

ce O

lrect

™ II:

Use

rjV

oice

DIre

ct™

II:

Use

r;

Act

lon:

"Sou

nd S

yste

m"

"Rep

eat"

"Sou

nd S

yste

m"

Brin

g -T

RA

IN p

in lo

w"S

ay w

ord

two-

one"

"Sta

rt"

"Rep

eat"

"Sta

rt'

"Say

wor

d tw

o-tw

o""S

hutd

own"

"Rep

eat"

"Shutd

ow

n"

Brin

g -T

RA

IN p

in lo

w

Sta

rt s

et 2

cam

man

d w

ords

tra

lnin

gTr

alni

ng s

et 2

firs

t co

mm

and

wor

d

Tral

ning

set

2 s

econ

d co

mm

and

wor

d

Sto

p tr

alní

ng

Í V

oice

Dire

ct™

1! w

lll c

ontin

ué to

pro

mpt

for

new

wor

ds t

o tra

ln U

ntil

all S

mem

ory

loca

trons

for

eac

h tri

gger

wor

dha

ve b

een

filie

d. T

o st

op t

rain

lng,

brin

g th

e -T

RA

IN p

in lo

w a

gain

.

SIN

GL

E-T

RIG

GE

RW

OR

D-S

PO

TT

ING

MO

DE

(S

WS

) M

OD

ET

he m

odul

e sh

ould

be

con

figur

ad f

or

Wo

rd-S

po

ttln

g M

ode.

In

thl

s m

ode,

se

rate

pln

s ar

e u

sed

to t

raln

the

trig

ger

wo

rd (

-TR

IG T

RA

IN p

in)

and th

e c

om

ma

nd

wor

ds (

-TR

AIN

p]n

). A

fte

r tr

aln

ing

the t

rigger

word

, up t

o15

com

man

d w

ords

can

be

tra

lned

, T

he m

aln d

lffere

nce

bet

wee

n th

e t

wo

co

ntln

uous

Ils

tenl

ng m

odes

(S

CL

and

MC

L) a

nd s

lng

le-t

ríg

ge

rwo

rd-s

po

ttln

g (

SW

S) I

s th

at

a cc

ntin

uous

Ilste

nln

g trlg

ger

wor

d m

ust

be

spok

enby

Its

elf,

wlth

i at

leas

t ,2

5s o

f sl

lenc

e b

oth

bef

are

and

aft

er

the

wor

d, w

hlle

wo

rd-s

po

ttln

g t

rlgger

wo

rds

may

be e

mbe

dded

ln t

he m

lddl

e o

f a

sen

tenc

e,, I.e

. no

bef

are

and

aft

er

slle

nce

Is n

eede

d.

Exa

mple

(S

lngle

-Trlgger

Word

-Spottln

g):

Act

lon

:V

oice

DIr

ect™

I!;

Use

r:V

oice

DIr

ect™

II:

Use

r:

Act

lon:

Voic

e D

Irect

™ II;

Use

r:V

oice

DIre

ct™

Use

r:

Voi

ce D

Irect

™ II:

Use

r:V

olee

DIre

ct™

II:

Use

r:

Vol

ee D

irect

™ U

:U

ser:

Vol

ee D

irect

™ U

:U

ser:

Act

iom

Brin

g -

TR

IG T

RA

IN p

in lo

w"S

ay w

ord

one"

"Sou

nd S

yste

m"

"Rep

eat"

"Sau

nd S

yste

m"

Brin

g -

TR

AIN

pin

low

"Say

wor

d on

e""S

tart

""R

epea

t""S

tart

"

"Say

wor

d tw

o""S

hutd

own"

"Rep

eat"

"Shu

tdow

n"

"Say

Wor

d th

ree"

"Ugh

ts"

"Rep

eat"

"LIg

hts

*

Bri

ng

-TR

AIN

pin

low

Sta

rt t

rigg

ar w

ord

tral

ntn

gTr

alni

ng t

rigge

r w

ord

Sta

rt c

omm

and

wor

ds t

rain

lng

Tral

ning

firs

t co

mm

and

wor

rf

Tral

ning

sec

ond

com

man

d w

ord

Tral

ning

tnl

rd c

omm

and

wor

d

Sto

p tr

alni

ng

eí V

oice

Dire

ct™

II w

ilf c

ontin

ué t

o pr

ompt

for

new

wor

ds t

o tra

ln U

ntll

al[

15 c

omm

and

wor

ds h

ave

been

tra

ined

. To

stop

tral

ning

, brin

g th

e -T

RA

IN pi

n lo

w a

gain

.

8. R

eco

gn

izin

g W

ord

sE

DG

C-T

RIG

GE

RE

D S

ING

L6

-RE

CO

GN

ITIO

N (

ES

R)

MO

DE

Whe

n th

e -

RE

CO

G p

in I

s pu

lled t

o

GN

D f

or at

lea

st l

OO

mS

, re

cognltl

on w

lll b

egin

. V

olee

Dire

ct™

II

wlll

pro

mpt

"Say

a w

ord

". If

the

res

pons

e Is

not

rec

ognl

zed,

Vol

ee D

irect

™ II

wlll

say

"W

ord

not

reco

gnlz

ed"

and

exit

reco

gnltl

on

mod

e.

If th

e sp

oken

wor

d m

atc

he

s a

sto

red

tém

pla

te,

one

or

two

of

8 outp

ut

plns

ar

ea

ctlv

ate

d (p

ulle

d h

lgh

for

ap

pro

xlm

ate

ly o

ne s

econ

d) a

nd a

vol

ee m

essa

ge In

dlca

tes

the

matc

hln

g r

espo

nse.

© 2

003

Sen

sory

In

c.P

/N S

D-0

24

0-A

13

Page 142: ESCUELA POLITÉCNICA NACIONAL - Repositorio …bibdigital.epn.edu.ec/bitstream/15000/11809/1/T2300.pdf · de audio y video implementado en el robot, hacia un receptor remoto o televisor

S E N S O R Y RSC-300/364Speech Recognition Microcontroller

DATA SHEET

General DescriptionThe RSC-300/364, from the Interactive Speech ™family of producís, ¡s designed specifically forspeech applícations ¡n consumer electronicproducts.

The RSC-300/364 combines an 8-bit processor withneural-net algorithms to provide high-qualityspeaker-independent speech recognition, speaker-dependent speech recognition, and speakerverification. The chip also supports speechsynthesis, voice record/playback, 4-voice musicsyníhesis, and system control. This CMOS deviceincludes on-ch¡p RAM, ROM (RSC-364 only), 16general-purpose I/O unes, A/D and D/A converters,a microphone pre-amplifier, and a 4-MIPS dedicatedprocessor. The RSC-300 ¡s designed for ROM-Iessappücations that need more ROM space andconsequently use off-chip memory.

In addition ío providing the horsepower needed toperform speech recogniíion and speech synthesis,the processor has suffícient cycles available forgeneral-purpose product control. The RSC-300/364Development Kit allows developers to créatecustom applicaíions. The Development Kit includesan assembler, linker, simulator, hardwaredevelopment platform, and library of Sensorytechnology object code.

The highly integrated nature of this chip reducesexternal parís count. A complete system may bebuilt with only a few passive components in additionto a batíery, speaker, and microphone. Low powerrequirements and low-voitage operation make theRSC-300/364 an ideal solution for battery-poweredand hand-held devices.

The RSC-300/364 uses a pre-trained neuralnetwork to perform speaker-independent speechrecognition, while high-quality speech synthesis isachíeved using a time-domaín compression schemethaí improves on conventional ADPCM. Four-voicemusic synthesis allows múltiple, simultaneous¡nstruments for harmonizing. Automatic GainControl can compénsate for people not optimallypositioned with respect to the microphone or forpeople who speak too softly or loudly.

FeaturesHigh-Performance Processor

y 4-MIPS performance at 14.32 MHzy 16 general purpose I/O linesy Interrupts, timers and countersy Fully static operation; clock rate: DC to 14.32

MHz

Highly-lntegrated Single-Chíp Solutiony Internal 64 kB of ROM (364 only), 2.5 kB of

RAMy 12 bit A/D (Analog to Digital) convertery Microphone Pre-amplifiery Internal 32kHz secondary timery 24 x 24 Multipliery Can store 6 Speaker Dependent words on-

chíp

Low Power Requirementsy Requíres single 2.85V to 5.25V power supplyy ~1 OmA operating current at 3Vy Low Power 32kHz oscillatory Power-down current less than 5 joA

High-Quality Recognition and Synthesis> Recognition accuracy; better than 97%

(Speaker Independent) and 99% (SpeakerDependent).

y Synthesis data rates from 5,000-15,000 bitsper second

y 4-voice music synthesis capabilitiesy AGC control compénsales for variations in

input signal

Easily Expanded to Larger-Scale Systemsy Sepárate 16-bit Address and 8-bit Data

buses compatible with common memorycomponents

y Sepárate Code and Data address spacesand memory strobes

> 2001 Sensory Inc. P/N 80-0165-O

Page 143: ESCUELA POLITÉCNICA NACIONAL - Repositorio …bibdigital.epn.edu.ec/bitstream/15000/11809/1/T2300.pdf · de audio y video implementado en el robot, hacia un receptor remoto o televisor

RSC-3QO/364

IntroductionThe RSC-300/364 is íhe newest member in a family of high-performance 8-bit microprocessors featuring a highlevel of integration, targeted ío high-accuracy, low-cost speech recognítion applications. The RSC-300/364 isdesignad to bring accuracy, fast response time and versatility to low-cost, power-sensitive consumerapplications.

A design goal of the RSC-300/364 was to reduce total system cost while increasing system performance. Byincluding microphone signal amplification, data conversión, recognition and synthesis functionality, and ROMstorage (RSC-364 only) with a CPU core on a single chip, dramatíc cost and power reductions are achieved.Thus, the RSC-300/364 is able to provide 4 MIPS of integer performance at 14,32 MHz. This allows customerapplications to achieve máximum performance at mínimum cost.

The CPU core embedded in the RSC-300/364 is an 8-bit, variable-length-instruction, microprocessor. Theinstruction seí is most similar to the 8051 family of microcontrollers. The RSC-300/364 processor avoids thelimitatíons of dedicated registers by havíng compieteiy symmetrical source and destinations for all instructions.Of the 2.5 Kbytes of ¡nternal SRAM, 2 Kbytes are organízed as a Data Space, and 0.5 Kbytes is for registerspace. All ariíhmeíic operation ¡nstructions may be applied to any register. Any pair of adjacent registers (at aneven address) may be used as the 16-bít pointer to either the source or desíination for a data movementinstruction. Instrucííon classes allow the pointer to access internal or external Code Space, internal RegisterSpace, or external Data Space.

Architecturally, the RSC-300/364's sepárate data and address buses allow use of standard EPROMs, ROMs,and SRAMs with little or no additional decoding. Provisión for sepárate read and write signáis for each externalmemory space further simplifies interfacing.

Creating applications using the RSC-300/364 requires the development of electronic circuitry, software code,and speech/music data files ("linguistics"). This document provides detailed ¡nformation on those aspects of theRSC-300/364 architecture that are important to product designers and programmers. It describes the physicalinterface ío the chip, printed circuit board layout and other design considerations, the RSC-300/364's ínsíructionseí, and memory organizaron. Refer ío the RSC-300/364 Development Kií Manual for information on usingSensory's technology code for speech recognition, speaker verifícation, speech syníhesis, and voice record andplayback. Descripíion of vocabulary developmení ("linguisíics") informaíion is beyond the scope of thisdocument and ¡s covered in a Design Note.

Custom Mask Capabilities ofthe RSC-364The RSC-300 provides significant and flexible expansión capabilities through the use of external RAM or ROMProducts using the custom-mask versión of the chip, the RSC-364, may save considerable per-unit cost byavoiding the need for other active devices. The RSC-300 requires an external Code Space ROM memory tocontain the program instructions, synthesis data, and Speaker Independent recognition weights. The custom-masked RSC-364 with no additional external memory devices must rely on the fixed internal memory for all of ítsROM and RAM requirements. The internal ROM in íhe RSC-364 ¡s applicatíon specific, with the amountavailable for user applications decreasing as the number of synthesis words or other technology usageincreases.

These finite resources resírict íhe capabilities of producís based on íhe RSC-364. The product specifícaíion foríhe RSC-364 must be carefully crafíed in consultaíion with Sensory to maximize the use of on-chip memory.Each application will have iís own specific limitaíkms, buí the table below summarizes some useful guidelinesfor planning purposes. Not all ofthe máximums can be achieved in a single custom-masked RSC-364 design.For example, a recogniíion vocabulary of 40 words may limit the speech synthesis ío substantially less than 25seconds.

Note: The RSC-364 (Custom Mask) column assumes no external memory.

> 2002 Sensory Inc. P/N 80-0165-O

Page 144: ESCUELA POLITÉCNICA NACIONAL - Repositorio …bibdigital.epn.edu.ec/bitstream/15000/11809/1/T2300.pdf · de audio y video implementado en el robot, hacia un receptor remoto o televisor

RSC-300/364 Data Sheet

Description RSC-300 RSC-364(Custom Mask )1

Capabilities:

Speaker independen! (SI) recognitionSpeaker dependení (SD) recognitionSpeech syníhesis and special sound effects

Speaker verificationFour-voice music generation

Voice record and playback

ssss•/s

sLimited

^•/

Limited supportNotsupported6

SI Recognition Capacity :

Máximum number of words per recognition set1Total recognítion vocabulary sfce in words, all sets

15Unlimited

1540 words3

SD Recognition Capacity :

Máximum number of words per recognition set1Total recognition vocabulary size in words, all sets

642

Unlimited6J/64"

6-75124

Speaker Verification Capacity:Number of speakers identified per set1 642 17644

Synthesized Speech Capacity:Máximum total length of all messages Unlimited 25 seconds

Music Synthesis CapacityNumber of simultaneous independent musicalvoicesNumber of musical octaves availableNumber of musical tunes available Unlimited

Reguirement for custom ROM masks:

Custom-masked parís (RSC-364) are not stockedby Sensory

No Internal ROM Custom maskedROM required

1. Software forthe RSC-364 (Cusiom Masked) applications may be completely developed and verified using the RSC-300/364Development Kit and an external 64K ROM memory before committing to an RSC-364 custom ROM rnask.

2. Practical limitations ío mainíain accuracy above 95%.3. Assumes íhe use of on-chip ROM/RAM only4. Assumes external serial EEPROM memory.5. Depends on choice of musical instrument.6. Requires external storage for recordings.

P/N80-0165-O ©2002 Sensory Inc.

Page 145: ESCUELA POLITÉCNICA NACIONAL - Repositorio …bibdigital.epn.edu.ec/bitstream/15000/11809/1/T2300.pdf · de audio y video implementado en el robot, hacia un receptor remoto o televisor

Data Sheet RSC-300/364

Rsc-300/364 Hardware Specifications

Architectural Overview of the RSC-300/364The RSC-300/364 ¡s a highly integrated devicethat combines:

• An 8-b¡í RISC microprocessor.• On-chip ROM (64 Kbytes, RSC-364 only),

Register RAM (448 bytes), Data RAM (2Kbytes) and the ability to address off-chipRAM or ROM.

• Analog-to-digital converter, digital-to-analog converter, and a pulse widthmodulator.

• A microphone pre-amplifier

The RSC-300/364 has an external memoryínterface for accessing external RAMs, ROMsor other parallel memory devices. The RSC-364 also has an internal ROM that can beenabied or disabled (partially or fully) by pininputs (signáis -XMH, -XML; See figure 4). ).When the internal ROM of the RSC-364 isdisabled, its performance is identical to theRSC-300. With the RSC-364, the entireprogram must reside in the internal maskedROM. Externa! memory can only be used tostore data.

The 8-bit processor can directly access 448on~ch¡p general-purpose registers (RAM), and32 additional Special Functions Regísíers(SFRs). The instruction set accessing theseregisters ¡s completely symmetrical, allowingmovs, arithmetic, and logical operations withany register as the destination. Two bi-directional ports provide 16 general-purpose I/O pins to communicatewiíh external devices (See page 9). The RSC-300/364 has a high frequency (14.32 MHz) oscillator as well as alow frequency (32,768 Hz) oscillator. The processor clock can be selected from eíther source, with a selectabiedivider valué. Sensory's technology code requires the use of the 14.32 MHz clock. There are twoprogrammable 8-bÍt couníers / timers, one derived from each oscillator. A variety of wait state configurationsallow fast code execution and easy ¡nterfacing to slow peripheral memories.

An inexpensive electret microphone connects directly to the microphone input of the RSC-300/364. The internalpreamplifier converts the tiny microphone signal to a level suitable for Analog-to-Digital Conversión. (ADC), TheRSC-300/364 uses a Sample and Hold (SH) circuit and ADC converter to convert the ampiified analog speechsignal into digital data. The chip may also be used with line-leveí inpuís. The output audio signal of the RSC-300/364 is derived eitherfrom a DAC (Digital-to-Analog Converter) or a PWM (Pulse Width Modulator).

In addition to its on-chip ROM (RSC-364 only) and RAM, the RSC-300/364 has 8 data lines (D[7:0]) and 16address lines (A[15:0]), along with associated control signáis (-RDC, -RDD, -WRC, -WRD, -XML, -XMH) for¡nterfacing to external memory. The memory control signáis on the RSC-300/364 and the processor instructionset provide independent Code and Data spaces, allowing configuration of systems up to 192 Kbytes with noaddííional hardware decoding. The RSC-300/364 features 16 general-purpose I/O pins (Px.y) for product andmemory bank control.

P1.0-P1.7

Figure 1 - RSC-300/364 Block Diagram

© 2002 Sensory Inc. P/N 80-0165-O

Page 146: ESCUELA POLITÉCNICA NACIONAL - Repositorio …bibdigital.epn.edu.ec/bitstream/15000/11809/1/T2300.pdf · de audio y video implementado en el robot, hacia un receptor remoto o televisor

RSC-300/364 Data Sheet

Using the RSC-300/364Creating applications using the RSC-300/364 requires the development of electronic circuitry, software code,and speech/music data files. Software code for the RSC-300/364 can be developed by Sensory or by externalprogrammers using the RSC-300/364 Development Kit For more Information about development tools andservices, please contact Sensory, or visit www.Sensorylnc.com. A typical product will require about $0.30 -$1.00 (in high volume) of addítionai components, in addition to the RSC-300/364.

The foliowing sample circuit provides an example of how the RSC-300/364 might be used in a iow volumeconsumer electronic product. The external ROM coníains the applicaíion program, recognítion weights, andspeech data. A high volume application would likeiy use an RSC-364 (custom-masked ROM), and would notrequire the sepárate ROM.

•í >EXTERMA1_ AMPUF1ER (OPT1ONAL)

(*) See 'Analog Desígn" section

n The RSC-364 OFP has a diñaren! pinout

(***) This oscillator ¡s availabla only wlh RSC-364 d 0 package

Figure 2 - Reference Circuit

Woíe; Applications using the PWM outpuí may not meet FCC or CE (such as EN55022 Class A or B) standards for radiated emisslons. Forapplications tnat musí meet these standards, Sensory recommends turning off the PWM in the application software, and using an externalaudio power ampllfier connected to the DAC ouíput. Please refer to Sensory's Application Note 80-0105 "DAC Output" for sample circuitsand design guídelines.

P/N 80-0165-O 12002 Sensory Inc.