Conceptos basicos ocr

6
OCR Optical Character Recognition (Reconocimiento Óptico de Caracteres) Octubre 2011 – Lima - Perú Yabed José Contreras Zambrano Comentarios y/o sugerencias: [email protected]

Transcript of Conceptos basicos ocr

Page 1: Conceptos basicos ocr

OCROptical Character Recognition

(Reconocimiento Óptico de Caracteres)

Octubre 2011 – Lima - PerúYabed José Contreras Zambrano

Comentarios y/o sugerencias: [email protected]

Page 2: Conceptos basicos ocr

Definición

• Proceso mediante el cual, con la ayuda de programas especializados, se logra “leer” identificar y/o reconocer los caracteres contenidos en una imagen de manera automática. El resultado final de aplicar el proceso de OCR a una imagen es por lo general un archivo texto con las palabras contenidas en la imagen como si hubieran sido digitadas.

Page 3: Conceptos basicos ocr

Beneficios potenciales de utilizar OCR• Ahorro de tiempo para ingresar datos que habitualmente se

procesan manualmente.• Reduce el número de personal que es necesario para

ingresar gran cantidad de datos.• Permite acceder a las opciones de algunos programas usados

para leer archivos escaneados. Por ejemplo: Búsqueda de texto, cortar y pegar, copiar, resaltar texto, diccionario.

• A partir del OCR se desprende una serie de posibilidades para implementar un sistema inteligente de gestión de documentos.

• Brinda menos dificultades al crear contenido para personas con discapacidad visual, al complementar la tecnología OCR con la TTS (Text To Speech).

Page 4: Conceptos basicos ocr

Consideraciones

• Cada vez disminuyen los costos de implementar una solución OCR.

• Existen diversos sistemas OCR, los cuales permiten abordar diversos tipos de escenarios, lo que implica evaluar con detenimiento que sistema usar.

• Los sistemas OCR están en continua investigación, aún queda por superar grandes desafíos como ejemplo: el reconocimiento de un manuscrito.

Page 5: Conceptos basicos ocr

Algunos escenarios en los que se podría aplicar OCR

• Se requiere buscar texto en documentos escaneados.• Ingreso automático de datos a través de formularios llenados

de forma manual.• Extraer texto desde imágenes.• Identificar los caracteres de las placas de los vehículos en

pleno movimiento.• Control de acceso y/o identificación, lectura automática de

cheques.• Facilitar a bajo costo obras literarias a ciegos a través de

software de lectura automática (TTS).• Automatizar procesos de traducción de documentos basados

en software.