Conceptos basicos ocr

Post on 05-Aug-2015

286 views 0 download

Transcript of Conceptos basicos ocr

OCROptical Character Recognition

(Reconocimiento Óptico de Caracteres)

Octubre 2011 – Lima - PerúYabed José Contreras Zambrano

Comentarios y/o sugerencias: yabedc@gmail.com

Definición

• Proceso mediante el cual, con la ayuda de programas especializados, se logra “leer” identificar y/o reconocer los caracteres contenidos en una imagen de manera automática. El resultado final de aplicar el proceso de OCR a una imagen es por lo general un archivo texto con las palabras contenidas en la imagen como si hubieran sido digitadas.

Beneficios potenciales de utilizar OCR• Ahorro de tiempo para ingresar datos que habitualmente se

procesan manualmente.• Reduce el número de personal que es necesario para

ingresar gran cantidad de datos.• Permite acceder a las opciones de algunos programas usados

para leer archivos escaneados. Por ejemplo: Búsqueda de texto, cortar y pegar, copiar, resaltar texto, diccionario.

• A partir del OCR se desprende una serie de posibilidades para implementar un sistema inteligente de gestión de documentos.

• Brinda menos dificultades al crear contenido para personas con discapacidad visual, al complementar la tecnología OCR con la TTS (Text To Speech).

Consideraciones

• Cada vez disminuyen los costos de implementar una solución OCR.

• Existen diversos sistemas OCR, los cuales permiten abordar diversos tipos de escenarios, lo que implica evaluar con detenimiento que sistema usar.

• Los sistemas OCR están en continua investigación, aún queda por superar grandes desafíos como ejemplo: el reconocimiento de un manuscrito.

Algunos escenarios en los que se podría aplicar OCR

• Se requiere buscar texto en documentos escaneados.• Ingreso automático de datos a través de formularios llenados

de forma manual.• Extraer texto desde imágenes.• Identificar los caracteres de las placas de los vehículos en

pleno movimiento.• Control de acceso y/o identificación, lectura automática de

cheques.• Facilitar a bajo costo obras literarias a ciegos a través de

software de lectura automática (TTS).• Automatizar procesos de traducción de documentos basados

en software.