Conceptos basicos ocr
-
Upload
yabed-contreras-zambrano -
Category
Documents
-
view
278 -
download
0
Transcript of Conceptos basicos ocr
OCROptical Character Recognition
(Reconocimiento Óptico de Caracteres)
Octubre 2011 – Lima - PerúYabed José Contreras Zambrano
Comentarios y/o sugerencias: [email protected]
Definición
• Proceso mediante el cual, con la ayuda de programas especializados, se logra “leer” identificar y/o reconocer los caracteres contenidos en una imagen de manera automática. El resultado final de aplicar el proceso de OCR a una imagen es por lo general un archivo texto con las palabras contenidas en la imagen como si hubieran sido digitadas.
Beneficios potenciales de utilizar OCR• Ahorro de tiempo para ingresar datos que habitualmente se
procesan manualmente.• Reduce el número de personal que es necesario para
ingresar gran cantidad de datos.• Permite acceder a las opciones de algunos programas usados
para leer archivos escaneados. Por ejemplo: Búsqueda de texto, cortar y pegar, copiar, resaltar texto, diccionario.
• A partir del OCR se desprende una serie de posibilidades para implementar un sistema inteligente de gestión de documentos.
• Brinda menos dificultades al crear contenido para personas con discapacidad visual, al complementar la tecnología OCR con la TTS (Text To Speech).
Consideraciones
• Cada vez disminuyen los costos de implementar una solución OCR.
• Existen diversos sistemas OCR, los cuales permiten abordar diversos tipos de escenarios, lo que implica evaluar con detenimiento que sistema usar.
• Los sistemas OCR están en continua investigación, aún queda por superar grandes desafíos como ejemplo: el reconocimiento de un manuscrito.
Algunos escenarios en los que se podría aplicar OCR
• Se requiere buscar texto en documentos escaneados.• Ingreso automático de datos a través de formularios llenados
de forma manual.• Extraer texto desde imágenes.• Identificar los caracteres de las placas de los vehículos en
pleno movimiento.• Control de acceso y/o identificación, lectura automática de
cheques.• Facilitar a bajo costo obras literarias a ciegos a través de
software de lectura automática (TTS).• Automatizar procesos de traducción de documentos basados
en software.
Enlaces con información relevante
• http://en.wikipedia.org/wiki/Optical_character_recognition
• http://es.wikipedia.org/wiki/Reconocimiento_%C3%B3ptico_de_caracteres
• http://www.iti.es/media/about/docs/tic/13/articulo2.pdf