Articulo reconocimiento optico de caracteres.pdf

Universidad de la Amazonia

Grupo de Investigación GIECOM

1

Resumen— En este artículo se describirán las

técnicas de Reconocimiento Óptico de Caracteres

OCR (Optical Character Recognition) las cuales son

utilizadas para desarrollar programas orientados al

OCR, que se encargan de dar solución a problemas

que se presentan hoy en día. Teniendo en cuenta

proyectos que se han desarrollado a través de la

utilización del reconocimiento de OCR. El uso del

reconocimiento de patrones ha sido un avance

tecnológico innovador que la humanidad ha podido

llegar a tener a su alcance, sin embrago para la

realización de programas que perciban la gran

cantidad de información que se maneja en

materiales escritos como libros escritos antiguos o

algún otro tipo de material es necesario hacer uso de

técnicas o tareas específicas que contribuyan al

desarrollo exitoso de estos programas de

reconocimiento de caracteres.

Palabras claves— Reconocimiento Óptico de

Caracteres OCR, Análisis de Imágenes, técnicas,

clasificador de mínima distancia, reconocimiento de

patrones, esqueletización, red neuronal.

I. INTRODUCCIÓN

Hoy en día automatizar los procesos que se llevan a

cabo es una de las principales actividades que se

tienen en cuenta, es por eso que las nuevas

tecnologías han permitido desarrollar programas

software orientado al Reconocimiento Óptico De

Caracteres con el fin de minimizar el tiempo de

ejecución de algunas tareas realizadas manualmente

por seres humanos. Entre uno de los aspectos más

importantes a destacar en el presente escrito son la

gran variedad de proyectos que se han llevado a

cabo a través del uso de las diferentes técnicas y

algoritmos característicos que presentan los OCR.

II. MARCO TEORICO

La digitalización de la información se ha convertido

en los últimos años en un punto creciente de interés

y de gran atención en beneficio para la sociedad. En

el caso específico de los textos, existen y se generan

continuamente grandes cantidades de información

escrita, tipográfica o manuscrita. [41] Por tal razón

se debe poder automatizar la introducción de

caracteres evitando la entrada por teclado, implica

un importante ahorro de recursos humanos y un

aumento de la productividad, al mismo tiempo que

se mantiene, o hasta se mejora, la calidad de

muchos servicios.

Las redes neuronales son un paradigma de

aprendizaje y procesamiento de datos, perteneciente

a la disciplina de la Inteligencia Artificial, inspirado

en la forma en que funciona el cerebro humano.

Una red neuronal está compuesta por la

interconexión de neuronas artificiales (estructuras

de programación) que presentan un comportamiento

individual simple, pero que en su conjunto pueden

manifestar un comportamiento global de alta

complejidad. Para lograr este funcionamiento

global, las redes neuronales deben ser entrenadas,

de forma que se configuren las interconexiones

entre sus nodos. Su funcionamiento puede verse

como el de una caja negra, en cuanto a que, tanto

para su entrenamiento como para su utilización, no

es necesario conocer su configuración. [44]

Las Redes Neuronales son sistemas de computación

que permiten la resolución de problemas que no

pueden ser descritos fácilmente mediante un

enfoque algorítmico tradicional, como, por ejemplo,

Carolina Silva Barreto

Universidad de la amazonia

Florencia, Colombia

{c.silva}@udla.edu.co

RECONOCIMIENTO OPTICO DE CARACTERES OCR

mailto:%7bc.silva%[email protected]



2

ocurre en el reconocimiento de formas. Con las

redes se expresa las soluciones en un problema, no

como una secuencia de pasos, sino como la

evolución en un sistema inspirado en el

funcionamiento del cerebro y dotado, por tanto, de

cierta "inteligencia". Tal sistema no es sino la

combinación de una gran cantidad de elementos

simples de proceso (nodos o neuronas)

interconectados que, operando de forma

masivamente paralela, consiguen resolver el

problema. [35]

El Reconocimiento Óptico de Caracteres (ROC), así

como el reconocimiento de texto, en general son

aplicaciones dirigidas a la digitalización de textos.

Identifican automáticamente símbolos o caracteres

que pertenecen a un determinado alfabeto, a partir

de una imagen para almacenarla en forma de datos

con los que podremos interactuar mediante un

programa de edición de texto o similar. Con

frecuencia se abrevia en textos escritos en español

utilizando el acrónico a partir del inglés OCR. [28]

Los OCR son un tipo de software que se encarga del

reconocimiento óptico de caracteres. Se encarga de

extraer de una imagen los caracteres de un texto y

los guarda en un formato que pueda editarse como

texto. Sirve para guardar en forma de texto

imágenes escaneadas de un libro sin digitalizarlo, o

sea ingresar carácter por carácter en un editor de

texto. Los sistemas son relativamente fiables

aunque suelen fallar si las imágenes o las letras no

son claras. Para identificar los caracteres, el sistema

analiza la imagen pixel a pixel, buscando formas que

coincidan con las características de los caracteres. El

software buscará coincidencias con los caracteres y

fuentes disponibles en el sistema, o tratará de

identificar los caracteres a través del análisis de sus

características, de forma que el reconocimiento de los

mismos no se limite exclusivamente a un determinado

número de fuentes. [41]

El reconocimiento óptico de caracteres, es un área

de investigación importante en reconocimiento de

patrones. El objetivo de un sistema OCR, es

reconocer letras del alfabeto, números y otros

caracteres, que están en forma de imágenes

digitales sin ninguna intervención humana. [46] este

sistema óptico de caracteres es una aplicación

específica del reconocimiento de patrones, que

hasta la actualidad no tiene un modelo de solución

absolutamente superior. En su lugar, existen

numerosos métodos de clasificación automática,

cada uno con sus ventajas y desventajas, que han

sido adaptados al reconocimiento de caracteres. Los

métodos de clasificación provienen de las

investigaciones en varios campos tales como: Redes

Neurales, Sistemas Difusos, Estadística y Sistemas

Expertos, entre otros. Debe aclararse que estos

campos de estudio tienen también otras aplicaciones

además del reconocimiento de patrones. [26]

El OCR intenta identificar las palabras por medido

de la proximidad de caracteres y reconstruirlas

según la disposición de la página original. El

software se basa en algoritmos que convierten las

letras representadas en una imagen digital en

caracteres ASCII, lenguaje que puede

posteriormente ser leído y editado por algún

procesador de textos común y corriente. De esta

manera se puede ahorrar una gran cantidad de

recursos humanos y se posibilita la búsqueda y

recuperación de texto a través de una computadora.

[19]

Para poder llevar a cabo el desarrollo de programas

orientado a los OCR es necesario utilizar algoritmos

de Reconocimiento Óptico de Caracteres los cuales

tienen la finalidad de poder diferenciar un texto de

una imagen cualquiera. Para hacerlo se basan en 4

etapas: Binarización, Fragmentación o

Segmentación de la imagen, Adelgazamiento de los

componentes y Comparación con patrones.

BINARIZACIÓN

La binarización de una imagen digital consiste en

convertir la imagen digital en una imagen en blanco y

negro, de tal manera que se preserven las propiedades

esenciales de la imagen. [41]

Por lo tanto es conveniente convertir una imagen de

escala de grises, o una de color, en una imagen en

blanco y negro, de tal forma que se preserven las

propiedades esenciales de la imagen. Mediante este

proceso obtenemos una imagen en blanco y negro

donde quedan claramente marcados los contornos

de los caracteres y símbolos que contiene la imagen.

A partir de aquí podemos aislar las partes de la

imagen que contienen texto (más transiciones entre

blanco y negro). [28]

FRAGMENTACIÓN O SEGMENTACIÓN

http://es.wikipedia.org/wiki/Fragmentaci%C3%B3n



3

Es una manera bastante efectiva de extraer

caracteres de una imagen en blanco y negro es

buscar los conjuntos de píxeles que cumplen una

relación de conexión entre sí. Este método

proporciona caracteres bien segmentados que

pueden analizarse sin problemas en el módulo de

reconocimiento. [40]

La fragmentación permite la descomposición de un

texto en diferentes entidades lógicas, que han de ser

suficientemente invariables, para ser independientes

del escritor, y suficientemente significativas para su

reconocimiento.

ADELGAZAMIENTO DE LOS COMPONENTES

Es un procedimiento que consiste en ir borrando

sucesivamente los puntos de los contornos de cada

componente de forma que se conserve su tipología.

La eliminación de los puntos ha de seguir un

esquema de barridos sucesivos para que la imagen

continúe teniendo las mismas proporciones que la

original y así conseguir que no quede deforme. Es

necesario hacer un barrido en paralelo, más

claramente, señalar los píxeles borrables para

eliminarlos todos a la vez. Este proceso se lleva a

cabo para hacer posible la clasificación y

reconocimiento, simplificando la forma de las

componentes. [28]

COMPARACION CON PATRONES

Es un proceso mediante el cual se compara los

caracteres obtenidos anteriormente con unos

teóricos (patrones) almacenados en una base de

datos. El buen funcionamiento del ROC se basa en

gran medida a una buena definición de esta etapa.

La aplicación de los algoritmos de Reconocimiento

Óptico de Caracteres han hecho un gran aporte a

los servicios en donde se han introducido estos

procesos para aumentar su rendimiento y otros que

se basan completamente en estas tecnologías.

El reconocimiento de escritura en línea gana

nuevamente interés, no solo por el número de

aplicaciones donde este recurso es utilizado, sino

por el aumento de nuevos dispositivos de captura

que han sido desarrollados en la actualidad. Las

metodologías generales en reconocimiento de

patrones y procesamiento de imágenes se analizan,

mientras que las empleadas en el reconocimiento de

caracteres en línea se revisan [4]

Hoy en día se maneja una gran cantidad de

información en las organizaciones u otras entidades,

a pesar que el avance de las tecnologías permite

hacer uso de herramientas que facilitan el

almacenamiento de datos, todavía se utilizan los

materiales impresos donde se guarda información o

textos escritos los cuales todavía son importantes

para llevar a cabo actividades. Sin embargo en

búsqueda de soluciones a los problemas y optimizar

tiempo y recursos ha surgido el Reconocimiento

Óptico de Caracteres OCR (Optical Character

Recognition) se define como una herramienta de

software que convierte los caracteres alfanuméricos

capturados por medio del scanner, a códigos ASCII,

con el fin de posibilitar el proceso de indexado de lo

que se almacena [2]

Los programas OCR pueden lograr capturar toda la

información que se requiere de un texto escrito y

almacenarla en dispositivos sin necesidad de

realizar la ardua tarea de transcribir a la maquina los

datos existentes en papel. El OCR tiene infinidad de

campos de aplicación, con la única certeza que

ayuda o mejora muchas de las actividades que se

llevan a cabo por seres humanos.

El principal propósito que tiene el Reconocimiento

de Caracteres es el análisis de imágenes que se

conoce como un proceso que consiste en descubrir,

identificar y comprender los patrones que son

relevantes en el rendimiento de un trabajo basado en

imágenes. Uno de los principales objetivos del

análisis de imágenes por computadora consiste en

dotar a una máquina, en algún sentido, de la

capacidad de aproximación, similar a la de los seres

humanos. [1]

Teniendo en cuenta lo anterior mencionado para

lograr el desarrollo de programas orientados al

Reconocimiento Óptico de Caracteres es necesario

conocer las técnicas utilizadas en este campo.

III. TECNICAS Y ALGORITMOS PARA EL

RECONOCIEMNTO DE CARACTERES

Con el auge de las nuevas tecnologías y los

formatos electrónicos para los documentos, mejorar

y avanzan también las técnicas de reconocimiento

óptico de caracteres (OCR) con las que es un poco



4

más fácil realizar los procesos de desarrollar

programas que estén orientados al (OCR), a

continuación se describen algunas técnicas

aplicables en el tema anteriormente mencionado.

i. CLASIFICADOR DE MÍNIMA DISTANCIA

Esta técnica se utiliza para el reconocimiento de

dígitos numéricos, la cual consiste en convertir e

interpretar una imagen capturada como un dígito

entre cero y nueve. Entonces si se quiere desarrollar

un programa orientado al Reconociento Óptico de

caracteres, es necesario digitalizar una imagen con

la representación en una matriz de ceros y unos

donde cero es blanco y un uno negro. A

continuación se explica cómo realizar el proceso.

El primer problema que tenemos es encontrar unos

buenos descriptores para cada imagen, que

describan con bastante exactitud el patrón de la

imagen correspondiente, y que además nos permita

calcular con facilidad la distancia de ese patrón a

cualquier otro patrón de descriptores.

Pensamos que un buen patrón para describir una

imagen binaria con exactitud y considerando esa

imagen binaria como una matriz de unos y ceros, es

el número de unos que tiene cada columna, es decir,

si la primera columna de esta matriz tiene un

número ‗n‘ de unos, el primer valor del vector será

‗n‘. Siguiendo con este barrido horizontal de la

matriz (de izquierda a derecha) obtenemos un

vector con unos valores (descriptores) que describen

esa imagen binaria de una manera bastante

fidedigna. [1]

Figura 1. Imagen que representa el número de unos en cada

columna

A pesar que se tienen dos imágenes binarias

distintas con dos vectores iguales, se puede observar

en la siguiente figura

Figura 2. Dos imágenes distintas con el mismo patrón

ii. RECONOCIMIENTO DE PATRONES

Dentro del Reconocimiento Óptico de Caracteres

se da a conocer también la técnica de

reconocimiento de patrones, la cual consiste en el

estudio de los mecanismos por los que las señales

externas estimulan los órganos sensoriales y se

convierten en experiencias perceptibles

significativas.

El reconocimiento patrones es una disciplina en

continuo desarrollo en los últimos años, sobre todo

en el campo del análisis de imágenes y la visión por

computador. Las redes neuronales artificiales son

una herramienta muy potente dentro de este campo,

particularmente los mapas auto organizados de

Kohonen (SOFM) (1997), ya que son capaces de

detectar la topología y la distribución de

probabilidad de los patrones de entrada. [3]



5

La técnica de reconocimiento de patrones maneja

tres procesos:

1. Adquisición y preproceso de datos.

2. Extracción de características.

3. Toma de decisiones o agrupamiento como se

muestra en la siguiente figura. [2]

Figura 3. Imagen que representa el proceso de

reconocimiento de patrones

El reconocimiento de patrones utiliza el método de

capturar una imagen con cualquier aparato scanner

y después continuar con sus fases de proceso para

lograr desarrollar el sistema que identifique los

patrones que se desean analizar. Esta técnica es muy

utilizada y recae cada día más en aplicaciones para

sistemas educativos.

iii. ESQUELETIZACION

La esqueletización (palabra técnica procedente del

vocablo inglés ―skeletonization‖) es un proceso

mediante el cual se transforma una determinada

forma u objeto de una imagen digital, compuesta de

una determinada cantidad de pixeles, en un objeto

basado en líneas, de forma que las propiedades

topológicas del objeto se preserven. Este objeto

resultante constituido por líneas se denomina

esqueleto. [12]

Los esqueletos son muy útiles a la hora de

reconocer, dentro de una imagen, objetos o patrones

que sean alargados o con una determinada forma

como por ejemplo caracteres, polígonos, patrones

cromosómicos, etc. Los esqueletos proporcionan

una abstracción de las características topológicas y

geométricas del objeto, de forma que al almacenarse

sólo una determinada información estructural de los

objetos en estudio, la esqueletización puede verse

también como un proceso de compresión de

datos.[3]

Esta técnica se toma en cuenta para proyectos que

se relacionan con la captura e interpretación de

datos numéricos, ya que proporciona gracias a las

medidas que toma de separar cada patrón y

estudiarlo para posteriormente unir u y poder

conocer el análisis del esqueleto recopilado en la

primera fase.

iv. TÉCNICA PARA EL RECONOCIMIENTO

DE CARACTERES GOCR

Desarrollada por Joerg Schulenburg, se basa en un

conjunto de reglas, es portable a diferentes sistemas

operativos, el tamaño de las fuentes que soporta esta

técnica es entre 20 - 60 píxeles y acepta muchos

formatos de imágenes, como pnm, PBM, pgm, ppm,

pcx, tga. Sin embargo, tiene inconvenientes con

letras cursivas, texto escrito a mano, adicionalmente

es muy sensible a imágenes que contenga ruido y

grandes ángulos de inclinación, por lo que se

necesita de un gráfico de alta calidad para conseguir

buenos resultados.[7]

v. BACKPROPAGATION

El desarrollo del algoritmo back propagation

proporciona un método eficiente para entrenar este

tipo de redes. Su importancia está en su capacidad

de auto adaptar los pesos de las neuronas

intermedias para aprender la relación que existe

entre el conjunto de vectores o patrones de entrada

y su correspondiente salida, y poder aplicar esa

relación después del entrenamiento a nuevos

vectores de entrada imperfectos o con ruido.[50]

La propagación hacia atrás de errores o retro

propagación es un algoritmo de aprendizaje

supervisado que se usa para entrenar redes

neuronales artificiales. El algoritmo consiste en

minimizar un error (comúnmente cuadrático) por

medio de gradiente descendiente, por lo que la parte

esencial del algoritmo es cálculo de las derivadas

parciales de dicho error con respecto a los

parámetros de la red neuronal. [33]

vi. ALGORITMO DE CLASIFICACIÓN



6

Consiste en la extracción de características

multicanal o basadas en filtros; el falsificador K-NN

es la ubicación de sus vecinos cercanos. Se

determinan las dos clases más probables, donde K

es el número natural especificado por el usuario. El

desarrollo de estos algoritmos nos permite la

búsqueda de nuevas alternativas y mejoras a los

sistemas de identificación biométrica. [5]

vii. EXTRACCIÓN DE CARACTERÍSTICAS

La información contenida en el mapa de bits de una imagen no es adecuada para el procesado digital. Debido a esto, es necesario describir un carácter de otra manera. La descripción del carácter debería ser invariable hacia el tipo de fuente usado, o deformaciones causadas por el proceso de centrado. Además, en todos los casos del mismo carácter debería tener una descripción similar. Una descripción del carácter consiste un vector de valores numerales, llamados “descriptores” o “patrones”. Generalmente, la descripción de una región de la imagen está basada en su representación interna y externa. La representación interna está basada en sus propiedades regionales, como el color o textura. La descripción de caracteres normalizados está basada en sus características externas, ya que solo afectan a propiedades como la forma del carácter. [17]

IV. APLICACIONES

En los últimos años la digitalización de la

información (textos, imágenes, sonido, etc.) ha sido

un punto de interés para la sociedad. Un caso

concreto es el de los textos, existen y se generan

continuamente grandes cantidades de información

escrita, tipográfica o manuscrita en todo tipo de

soportes.

Existen varios proyectos que han sido desarrollados

haciendo uso del Reconocimiento de caracteres

OCR desarrollado como lo expone el articulo

Aplicación de Redes Neurales en el reconocimiento

óptico de caracteres en donde se buscaba desarrollar

dos aplicaciones. La primera, miniOCR, será una

aplicación capaz de reconocer dígitos aislados

dibujados a mano en la misma a través del mouse.

Luego, se desarrollará Calculadora, una segunda

aplicación basada en miniOCR, que permita aplicar

a un caso de ejemplo las conclusiones del primer

desarrollo. En esta, el usuario podrá obtener

respuestas de la computadora a operaciones

aritméticas simples dibujadas en su interfaz de

usuario. Teniendo como resultado final la primera

aplicación miniOCR desarrollada que es capaz de

reconocer dígitos dibujados manualmente utilizando

el mouse. Abarca todo el proceso necesario para

llegar a dicho fin. [6]

La importancia de utilizar redes neuronales en el

desarrollo de proyectos se ve reflejado en el artículo

escrito por Aurelio Velazquez y dos compañeros

más denominado Reconociendo Eficiente de

Caracteres Alfanuméricos Provenientes de Mapas

Raster por Medio de Clasificadores Neuronales, el

cual consiste en analizar mapas cartográficos con

leyendas en español por lo cual su artículo describe

una técnica simple pero eficiente para el aprendizaje

de clasificadores neuronales, Redes Neuronales

(RNA) en este caso, Gracias al estudio y las pruebas

que se realizaron para lograr su objetivo se

concluyó que el conjunto de RNA entrenado, puede

identificar cualquier tipo de caracteres [30] teniendo

en cuenta el estudio realizado para el

reconocimiento de mapas raster se puede decir que

es de vital importancia la utilización de las redes

neuronales en el reconocimiento de caracteres de

igual manera un programa que identifique y

minimice el tiempo de identificar este tipo de mapas

es de mucha utilidad.

Dentro la clasificación de herramientas que se han

diseñado a partir de los OCR encontramos la

miniOCR una aplicación capaz de reconocer dígitos

aislados dibujados a mano en pantalla por el usuario

a través del mouse. Utiliza una red neuronal

convencional adaptada para este fin. Comprende

también la recolección de muestras, el

entrenamiento y medición de Rendimiento,

fundamentada en el artículo de Gabriel Constenla y

Sergio Omar Aguilera [6] acerca de esta aplicación

desarrollada se nota la agilidad que tiene para poder

captar los dígitos dibujados manualmente utilizando

el mouse.



7

Un aporte interesante es el que se da a conocer en el

artículo de Cristian pozo en donde se denominado

Desarrollo de Algoritmos de Reconocimiento de

Placas de Vehículos presentado, en donde se

desarrolló un algoritmo confiable para el

reconocimiento de placas vehiculares en la entrada

a un parqueadero mediante el procesamiento digital

de imágenes. Su propuesta consiste en que el

software localiza la placa vehicular dentro de la

imagen del vehículo y reconoce los caracteres y

números que se encuentran dentro la misma. Para la

localización de la placa se emplea la estrategia

denominada ―Búsqueda de Patrones‖ con la cual es

posible encontrar la palabra ―Ecuador‖ presente en

el país. [9] este proyecto desarrollado en el país de

ecuador es una fiel afirmación que la aplicación de

los algoritmos de reconocimiento óptico de

caracteres es de mucha importancia ya que permite

que estacionamientos como parqueaderos sea

confiables.

El articulo Desarrollo de un modelo para el

seguimiento de patrones mediante reconocimiento

óptico, presenta el desarrollo de un sistema de

seguimiento de patrones por medio del

procesamiento de imágenes que pueda aplicarse en

cualquier ámbito, únicamente variando las

características del objeto que se desea seguir, lo

cual permitiría la aplicación de diversos campos

donde se usen cámaras y sea necesario el

seguimiento de alguna característica de un sujeto u

objeto. Tiene aplicación en diferentes contextos

como sistemas de seguridad, filmación automática

de eventos deportivos (con una cámara programada

siguiendo un balón de fútbol a un jugador

específico), entre otras. [10] el desarrollo de

aplicaciones como la anteriormente mencionadas

son útiles para la sociedad ya que aumentan la

seguridad en establecimientos públicos y a su vez

permite a los aficionados de la televisión ver más

detalladamente sus programas favoritos.

El reconocimiento óptico de caracteres tiene

infinidad de campos de aplicación, un ejemplo claro

para demostrar esta afirmación es el artículo

―Detección automática de presencia/ausencia de

atún en imágenes obtenidas mediante sonar de largo

alcance a bordo de buques pesqueros‖ en donde se

presenta una metodología para el análisis

automatizado de las señales del sonar de largo

alcance y una aplicación basada en la técnica de

OCR, consiste en el análisis de imágenes de sonar

mediante técnicas de procesamiento de imágenes.

[11] es importante resaltar que los campos de

aplicación de OCR no tiene delimitaciones lo

importante es identificar el problema que se quiere

solucionar y adecuar la mejor técnica o algoritmo

para su desarrollo.

En un trabajo presentado en el 2011 como tesis de

grado, presentado por Edgar Barragán consistía en

diseñar e implementar un sistema de control y

seguridad vehicular mediante la captura de la placa

del vehículo con una cámara infrarroja que puede

grabar video en cualquier condición ambiental. [14]

lo que se buscaba con el desarrollo de este

programa de reconocimiento óptico de caracteres es

implementar una base de datos donde estén

registradas las placas vehiculares, con el fin de que

sea más segura y confiable la entrada y salida de los

autos en lugares públicos.

En el 2014 se desarrolló el sistema DocLux que

permite el tratamiento de imágenes digitalizadas

por lotes; DocLux permite aplicar una serie de

filtros que posibilitan mejorar la calidad de las

imágenes. Se desarrolló un prototipo de aplicación

DocLux que permite reconocer y trascribir las

vocales minúsculas sin tilde del lenguaje español.

Utilizando el motor Tesseract [15] el anterior

programa se llevó a cabo ya que se necesitaba

recopilar la información que se encontraba en textos

antiguos pero por el paso del tiempo se encontraban

en muy mal estado y no se podía leer la información

por tal razón fue necesario desarrollar esta

aplicación a través del reconocimiento óptico de

caracteres.

En el artículo ―Herramienta de transcripción

automática de partituras musicales de importancia

dentro del patrimonio documental andaluz mediante

reconocimiento óptico de caracteres musicales‖

buscaba como objetivo global del Proyecto de

Investigación desarrollar una herramienta de

transcripción automática de partituras musicales

escritas, tanto en grafía antigua como moderna, que

permite transcribir partituras musicales de

importancia, dentro del patrimonio documental



8

andaluz mediante reconocimiento óptico de

caracteres. Para desarrollar dicha herramienta [16]

Según el artículo Reconocedor Óptico De

Caracteres Manuscritos (ROCM) por medio de

redes neuronales realizado como opción de grado

buscaba elaborar un programa que convierta la

información manuscrita, contenida en un archivo de

imagen, a formato texto para que el usuario pueda

manipularla con algún procesador o editor de texto

convencional; dicha conversión será hecha con un

alto grado de fiabilidad usando redes neuronales

para la identificación de caracteres.[22] este trabajo

que fue desarrollado tuvo éxito con los resultados

que esperaban ya que obtuvieron un nueva función

a través del reconocimiento de OCR.

Figura 4.Etapas del Programa Reconocedor Óptico De

Caracteres Manuscritos [22]

En México se desarrolló un proyecto para la

construcción de un sistema de reconocimiento

óptico de caracteres basado en redes neuronales

artificiales (RNA) y otros componentes de

inteligencia computacional y entendimiento de

lenguaje, especializado en el reconocimiento de

textos manuscritos y textos antiguos. EL objetivo de

PRISCUS es desarrollar un software inteligente

integral, que supere la problemática intrínseca que

se presenta en los reconocedores convencionales al

trabajar con letra cursiva y textos antiguos. Para

poder llevar a cabo lo que se buscaba se necesitó

aplicar el modelo o PRISCUS se compone de las

siguientes partes:

• Digitalización. Creación de una imagen digital del

documento a color o escala de grises.

• Pre-Procesamiento. Clarificar la imagen, eliminar

ruido, convertir la imagen en blanco y negro.

• Segmentación de palabras. A partir del mapa de

bits de todo el documento, obtener las palabras

presentes. [23]

Figura 5.Modelo PRISCUS [23]

Para resaltar el uso de las técnicas más utilizadas

para el Reconociendo de caracteres como se

evidencia en el artículo realizado por Carlos Javier

y Victor Sandonis indica que normalmente, las

técnicas de OCR son útiles para digitalizar textos de

algún libro (caracteres impresos) o formularios

rellenados manualmente (caracteres manuscritos).

Tanto en un caso como en el otro el desglose de los

caracteres individuales es mucho más sencillo que

en el caso de texto manuscrito continuo, para el que

es necesario la aplicación de técnicas de pre proceso

y segmentación más complejas que en el caso de

OCR. Una vez pre procesada la imagen se deberá

fragmentar o segmentar en las diferentes

componentes conexas (parte de la imagen donde

todos los píxeles son adyacentes entre sí) que la

componen. La fragmentación o segmentación de la

imagen constituye una de las mayores dificultades

del reconocimiento, y se hace necesaria para poder

reconocer cada uno de los caracteres de la imagen

binaria [31]

El articulo realizado por Carlos Chaoz denominado

―Normalización de imágenes de placas vehiculares

a través de corrección geométrica‖ se enfocó en



9

implementar un sistema de control de acceso

vehicular mediante el reconocimiento del número

de placa de manera automática usando una cámara y

algoritmos de procesamiento de imágenes

incluyendo Reconocimiento Óptico de Caracteres

(OCR). Para el reconocimiento de las placas se

tomara una imagen al vehículo al momento de

entrar a un parqueadero específico. [20] gracias a lo

anterior expuesto podemos recalcar la importancia

de hacer uso de este sistema de reconocimiento

óptico de caracteres y los beneficios que se

obtienen.

Hoy en día se dispone de mucha información que se

encuentra documentada en medios físicos, por eso

es tan importante desarrollar proyectos como el que

se desarrolló en el artículo realizado por Eduardo,

Miguel; Gómez, Flores en donde se buscaba

elaborar un programa que convierta la información

manuscrita, contenida en un archivo de imagen, a

formato texto para que el usuario pueda manipularla

con algún procesador o editor de texto

convencional; dicha conversión será hecha con un

alto grado de fiabilidad usando redes neuronales

para la identificación de caracteres. [22]

El reconocimiento de caracteres ópticos se ha

convertido en un reto de la tecnología

contemporánea debido a las inmensas cantidades de

aplicaciones que abracan el tema y a lo sofisticada

que es técnica. Su popularidad radica en su

versatilidad y uso, que permite convertir material

impreso, mecanografiado o escrito manualmente

por medios computacionales sin necesidad de

digitar la información. [29]

El articulo Reconocimiento Automático de

Caracteres Manuscritos y Marcas, Orientado al

Procesado de Encuestas se enfoca en la

implementación de un sistema de reconocimiento de

caracteres manuscritos y marcas, relevante para la

toma de información del contenido de grandes

volúmenes de formularios (encuestas), la cual será

utilizado por la Escuela de Ingenierías Eléctrica,

Electrónica y de Telecomunicaciones de la

Universidad. [24] gracias al desarrollo de este

programa se pudo implementar un sistema de

carácter cooperativo capaz de extraer

automáticamente la información de una encuesta

que contiene datos de marcas y/o letras mayúsculas

y números; el sistema tiene una precisión para

reconocimiento de marcas del 100% y del 90% para

caracteres.

En el 2009 se hizo un estudio importante ya que se

desarrolló y utilización de firmas vectoriales para el

reconocimiento de imágenes, aprovechando las

propiedades que presentan las transformadas de

Escala y de Fourier. Como primer caso, se

analizaron los dígitos del sistema decimal, escrito

cada uno en color blanco con fondo negro, tipo

Arial en tamaño 144; a ellos se les aplicaron

rotaciones de 360 grados con variación de un grado

y cambios de escala de 80 % a 120 % con

incrementos de 0.5 %. Como segundo caso, se

tomaron imágenes de 9 diferentes formas de hojas

de plantas, con variaciones en rotación y escala

similares al caso anterior. Para cada imagen se

realizaron diferentes transformaciones matemáticas

que permitieron obtener dos firmas vectoriales; para

encontrar el grado de semejanza entre las imágenes,

se compararon sus firmas vectoriales mediante la

Distancia euclidiana. [25] el programa que se

desarrollo fue de gran importancia es una de las

muestras de la gran cantidad de opciones que

tenemos a la mano para automatizar los procesos

que llevamos a diario.

Un proyecto destacado es el que se presenta en el

artículo denominado Sistema Control de Acceso a

Estacionamiento por Medio de Reconocimiento de

Placas Vehiculares que fue desarrollado en el 2012;

El dicho estudio se basó en diseñar y desarrollar un

sistema de cómputo para permitir el acceso a

estacionamientos, basado en reconocimiento de

placas automóviles [47] desde mi punto de vista

contemplo que este tipo de proyectos que van de la

mano con la tecnología es de vital importancia en la

sociedad de hoy ya que permite tener más seguridad

y menos riesgos.

Es de gran importancia resaltar los proyectos que se

han desarrollado gracias al uso del Reconocimiento

Óptico de Caracteres, un ejemplo de este caso es el

representado en el artículo Sistema de Conteo,

Identificación y Clasificación de Vehículos en un

Peaje en donde se desarrolló de un sistema que

permite identificar, contar y clasificar de manera

automática los vehículos presentes en un carril de

un peaje a partir de un video capturado del mismo.

Para ello el sistema detecta la llegada de un



10

vehículo al peaje mediante la detección de sus

luces, localiza la placa del vehículo, separa sus

caracteres, además de detectar y contar el número

de llantas del mismo. [36]

A raíz de la variedad de técnicas y algoritmos que el

sistema OCR presenta se determinan un sin número

de aplicaciones, entre estas encontramos la expuesta

en el articulo Sistema de Control Vehicular

Utilizando Reconocimiento Óptico de Caracteres en

donde su objetivo es realizar un control vehicular

mediante el Reconocimiento Óptico de Caracteres

(OCR) de la Placa de un vehículo, utilizando una

cámara USB y posteriormente procesada en la

Plataforma de desarrollo National Instruments

Labview 8.2 en tiempo real. [38]

El avance de las nuevas tecnologías hoy en día

acapara todos los ámbitos de desarrollo educativos

que existen, por ejemplo en el artículo presentado

por Milton Baque desarrolla un sistema que permite

verificar y evaluar los caracteres y trazos

manuscritos utilizando la tecnología en pantalla

táctil para captar las actividades que realiza un

estudiantes en la etapa de educación inicial. [39] el

sistema desarrollado anteriormente me parece que

es uno de los mejores métodos en donde se

involucran las tecnologías y aplicación del

Reconocimiento Óptico de Caracteres y los mas

beneficioso es que se involucra a los menores en sus

primeros ciclos de educación.

En el artículo referenciado por Ivan Ruiz describe

el algoritmo de in OCR para un sistema

Automático de acceso mediante el reconocimiento

de matrículas vehiculares, a través de las técnicas de

visión computacional. El software de ANPR utiliza

el reconocimiento óptico de caracteres, extrae de

una imagen los caracteres que componen un texto

para almacenarlos en un formato con el cual

puedan interactuar programas de edición de texto.

[48]

Los sistemas de Reconocimiento Óptico de

Caracteres hoy en día se han convertido en una

herramienta muy importante para agilizar algunos

procesos; una de estas se encuentra a servicio de

cualquier tipo de usuario, se conoce como Free-

OCR.com es una herramienta gratuita en línea de

OCR (Optical Character Recognition). Permite

utilizar este servicio para extraer el texto de

cualquier imagen que el usuario provee.

Es un servicio gratuito, sin necesidad de

registrarse. No se necesita dirección de correo

electrónico.

La única condición es subir archivos de

imágenes. Free-OCR toma ya sea un archivo JPG,

GIF, TIFF BMP o PDF (sólo la primera página).

La única restricción es que las imágenes no deben

ser más grandes que 2 MB, no más ancha o más alta

que 5.000 píxeles y hay un límite de 10 archivos de

imagen por hora.

V. CONCLUSION

Los Sistemas OCR es uno de los campos de

investigación más importantes en el área de

reconocimiento de patrones ya que a raíz de su

infinidad de aplicaciones aportan a mejorar y

automatizar los procesos; a través de la

investigación realizada se puede concluir que en la

actualidad muchas organizaciones ya hacen uso del

Reconocimiento Óptico de caracteres gracias a su

efectividad.

También es importante concluir que el manejo de

programas software que realicen el reconocimiento

de patrones se puede realizar en cualquier lenguaje

de programación e incluso ya existen aplicaciones

que permiten solamente ejecutar las acciones y

obtener lo que se necesita.

REFERENCIAS

[1] Universidad de Sevilla – España ―Reconocedor

por Mínima Distancia‖,

http://www.sav.us.es/formaciononline/asignatur

as/asigpid/apartados/textos/recursos/rmd/docu

mentacion.zip, Noviembre-2003

[2] Facultad Politécnica, Universidad Nacional del

Este–Ciudad del Este, Paraguay―Reconocimiento de

Patrones. Una propuesta de Corrección Automática

de Test de Selección Múltiple‖autores – Laura

Leticia Valenzuela Valenzuela y Gustavo Javier

Báez Villar

[3]. J.A. Gómez Ruiz, J. Muñoz Pérez, M.A. García

Bernal, E. López Rubio ―Detección de esqueletos

de caracteres mediante una red neuronal

competitiva basada en segmentos



11

Inteligencia Artificial‖. Revista Iberoamericana de

Inteligencia Artificial, vol. 6, núm. 17, 18, 2002, pp.

7-22, Asociación Española para la Inteligencia

Artificial España

[4] Karina Toscano, Humberto Sossa, Ricardo

Barrón, Gabriel Sánchez ―Reconocimiento de

caracteres manuscritos mediante información del

proceso inverso en la realización de su trazo‖-

[5] ACHING SAMATELO, Jorge L.; ROJAS

VIGO, David A. Algoritmos para el reconocimiento

de imágenes de huellas dactilares. Electrónica-

UNMSM, 2014, no 12, p. 11-20.

[6] AGUILERA, Sergio; CONSTENLA, Gabriel.

Aplicación de Redes Neurales en el reconocimiento

óptico de caracteres. En XII Workshop de

Investigadores en Ciencias de la Computación.

2010.

[7] GUTIERREZ, Richard, et al. Aplicación de

Visión por Computador para el Reconocimiento

Automático de Placas Vehiculares utilizando

OCR‘s Convencionales. 2011.

[8] FIGUEROA, Yumis, et al. APLICACIÓN WEB

DEL ICA PARA LA CONSTRUCCIÓN DE UNA

BASE DE DATOS DE MICROORGANISMOS

DEL RUMEN, BASADA EN UN RÁPIDO

ALGORITMO DE RECONOCIMIENTO DE

CARACTERES.

[9] TASIGUANO POZO, Cristian

Andrés. Desarrollo de algoritmos de reconocimiento

de placas de vehículos. 2011. Tesis Doctoral.

QUITO/EPN/2011.

[10] LUNA, Rodrigo Andrés Franco; OSORIO,

José Andrés Chaves. Desarrollo de un modelo para

el seguimiento de patrones mediante

reconocimiento óptico.Scientia Et Technica, 2012,

vol. 17, no 50, p. 199-204.

[11] URANGA AIZPURUA, Jon. Detección

automática de presencia/ausencia de atún en

imágenes obtenidas mediante sonar de largo alcance

a bordo de buques pesqueros y aplicación de

Optical Character Recognition (OCR) para la

extracción de parámetros. 2013; 5, 2013.

[12] RUIZ, JA Gómez, et al. Detección de

esqueletos de caracteres mediante una red neuronal

competitiva basada en segmentos. Inteligencia

Artificial, Revista Iberoamericana de Inteligencia

Artificial, 2002, no 17, p. 7-21.

[13] MONGE OSORIO, Manuel Alejandro. Diseño

de una arquitectura para una red neuronal artificial

perceptron multicapa sobre una FPGA aplicada al

reconocimiento de caracteres. 2011.

[14] BARRAGÁN DEL POZO, Edgar Edison.

Diseño e Implementación de un Sistema de Control

Vehicular Utilizando Reconocimiento Optico de

Caracteres en el Laboratorio de Automatización

Industrial de la EIS. 2012.

[15] CANTERO, Lisbet Milagros Guerra; LAGO,

Eriberto Vanegas. Doclux OCR: Software libre para

la restauración y transcripción de imágenes

archivísticas.3C Tecnología, 2014, vol. 3, no 1.

[16] PÉREZ, Isabel Barbancho, et al. Herramientas

de transcripción automática de partituras musicales

de importancia dentro del Patrimonio Documental

Andaluz mediante reconocimiento óptico de

caracteres musicales. Papeles del Festival de

Música Española de Cádiz., 2007, no 3, p. 247-333.

[17] CEBALLOS JIMÉNEZ, Samuel Enrique.

Identificación y reconocimiento de matrículas de

automóviles con MATLAB. 2012.

[18] PILLAJO, Tituaña; POLO, Tito. Lógica difusa

y extracción de rasgos topológicos para el

reconocimiento de caracteres manuscritos. 1997.

Tesis Doctoral. QUITO/EPN/1997.

[19] BALLESTEROS ESTRADA, Silvia Socorro.

Los problemas de identificación de caracteres OCR

para la recuperación de texto en el libro antiguo: un

análisis de caso en el Fondo Antiguo de la

Biblioteca Central, UNAM. Biblioteca

Universitaria, vol. 15, no 1, p. 25-34.

[20] CHOEZ ÁLVAREZ, Carlos Leonardo;

SALAS GUERRERO, Steve Fernando;

VINTIMILLA, Boris X. Normalización de

imágenes de placas vehiculares a través de

corrección geométrica. 2013.

[21] AYALA CHARCA, Giancarlo. Reconocedor

óptico de caracteres de placas de automóviles

empleando técnicas de procesamiento digital de

imágenes. 2007.

[22] EDUARDO, MIGUEL; GÓMEZ,

FLORES. RECONOCEDOR ÓPTICO DE

CARACTERES MANUSCRITOS (ROCM) POR

MEDIO DE REDES NEURONALES. 2004. Tesis

Doctoral.

[23] FARFÁN, Eduardo Cuevas; GÓMEZ-GIL,

Pilar. PRISCUS: Reconocedor Óptico de Caracteres

Manuscritos y Antiguos.

[24] DE ARMAS DOMÍNGUEZ, Roberto Carlos;

RODRÍGUEZ, Lener Samuel Bautista.

RECONOCIMIENTO AUTOMÁTICO DE



12

CARACTERES MANUSCRITOS Y MARCAS,

ORIENTADO AL PROCESADO DE

ENCUESTAS. 2005.

[25] LERMA, Jesús R.; ÁLVAREZ, Josué.

RECONOCIMIENTO DE CARACTERES

BASADO EN FIRMAS VECTORIALES. e-

Gnosis, 2009, p. 1-7.

[26] ALBUJA DELGADO, Jorge. Reconocimiento

de caracteres manuscritos por medio de redes

neurales y neuro-difusas artificiales. 1995. Tesis

Doctoral. QUITO/EPN/2005.

[27] BONILLA MARTÍNEZ, Eduardo

Gabriel. Reconocimiento de caracteres mediante

redes neuronales con MATLAB. 2005. Tesis

Doctoral. QUITO/EPN/2005.

[28] ALVARADO, Lucía Chacón. Reconocimiento

de Caracteres Ópticos Aplicaciones en

Bibliotecas. Bibliotecas: Revista de la Escuela de

Bibliotecología, Documentación e Información,

1989, vol. 7, no 2.

[29] DURÁN GÓMEZ, Mauricio. Reconocimiento

de caracteres ópticos OCR por medio de correlación

y redes neuronales. 2013.

[30] VELÁZQUEZ, Aurelio; SOSSA, Humberto;

LEVACHKINE, Serguei. Reconocimiento Eficiente

de Caracteres Alfanuméricos Provenientes de

Mapas Ráster por Medio de Clasificadores

Neuronales. Test journal, 2002, vol. 6, no 1.

[31] SANCHEZ, carlos; Reconocimiento Óptico de

Caracteres (OCR) revistar universidad carlos lll

[32] EL RECONOCIMIENTO ÓPTICO DE

CARACTERES, O. C. R. 2. Reconocimiento

Óptico de Caracteres. Directora General, p. 42.

[33] ORDOÑEZ, Juan, RECONOCIMIENTO

OPTICO DE CARACTERES OCR CON REDES

NEURONALES ESTADO DEL ARTE,

universidad de loja.

[34] SARI, Toufik; KEFALI, Abderrahmane.

Recognition-free Retrieval of Old Arabic Document

Images. Computación y Sistemas, 2011, vol. 15, no

2, p. 195-208.

[35] CALLISAYA UCHANI, Zenón Amado.

REDES NEURONALES EN OCR CON

RECONOCIMIENTO DE IMAGENES. Revista de

Información, Tecnología y Sociedad, 2009, p. 78.

[36] QUINTERO, Juan Manuel; QUINTERO,

Pablo Andrés; SEPÚLVEDA, Julián Quiroga.

Sistema de Conteo, Identificación y Clasificación

de Vehículos en un Peaje.

[37] ANDRADE MIRANDA, Gustavo; LOPEZ

ENCALADA, Jose. Sistema De Control Vehicular

Utilizando Reconocimiento Optico De Caracteres.

2009. Tesis Doctoral.

[38] MIRANDA GUSTAVO, Andrade; LOPEZ

ENCALADA, Jose; CHAVEZ BURBANO,

Patricia. Sistema De Control Vehicular Utilizando

Reconocimiento Óptico De Caracteres. 2009.

[39] AGURTO BAQUE, Milton, et al. Sistema de

evaluación de actividades en la educación inicial,

usando como medio el reconocimiento y

verificación on-line de caracteres y trazos

manuscritos. 2011.

[40] GUPTA, Amar; HIELSCHER, Rafael Palacios.

Sistema de reconocimiento de caracteres para la

lectura automática de cheques. En anales de

mecánica y electricidad. Asociacion de Ingenieros

del ICAI, 2003. p. 26-30.

[41] BETANCOURT SALAZAR, Silvana del

Rocío; PONCE PROAÑO, Miguel Alejandro.

Sistema de reconocimiento óptico de caracteres,

como solución al procesamiento digital de la

información en la Facultad de Ingeniería, Ciencias

Físicas y Matemática Especialidad-Informática.

2012.

[42] MARI-DOMENEC, Francesca; BIA-PLATAS,

Alejandro. Técnicas de producción masiva de

contenidos para bibliotecas digitales. 2002.

[43] RODRÍGUEZ, Gustavo Adolfo Lara. Técnicas

de reconocimiento de imágenes para la creación de

fotomosaicos.

[44] CONSTENLA, Gabriel Roberto.

Reconocimiento Óptico de Dígitos con Redes

Neuronales. 2010.

[45] ARLANDIS, Joaquím, et al. Grupo de

Reconocimiento de Imágenes y Visión Artificial

(RIVA).

[46] MAYTA CHURA, William. Reconocimiento

automático de dígitos manuscritos en base a

prototipos multivaluados. 2010.

[47] SALDANA PEREZ, A. N. A.;

MAGDALENA, MARIA; XOCHIGUA JORGE,

ALEJANDRO. SISTEMA CONTROL DE

ACCESO A ESTACIONAMIENTO POR MEDIO

DE RECONOCIMIENTO DE PLACAS

VEHICULARES. 2012. Tesis Doctoral.

[48] RUIZ DELGADO, IVAN ABEL. SISTEMA

DE IDENTIFICACION DE PLACAS

VEHICULARES CON TECNICAS DE VISION

COMPUTACIONAL. 2012. Tesis Doctoral.



13

[49] FDEZ, Juan M. López, et al.

RECONOCIMIENTO AUTOMÁTICO DE

MATRÍCULAS USANDO OPERADORES

MORFOLÓGICOS Y MÚLTIPLES REDES

NEURONALES.

[50] PLATA CHEJE, Rubén Wismark. MatLab &

Redes Neuronales. Revista de Información,

Tecnología y Sociedad, 2008, p. 96.

Autores Carolina Silva Barreto, estudiante de Ingeniería de

Sistemas de la Universidad de la Amazonía

Florencia – Caquetá.

Articulo reconocimiento optico de caracteres.pdf

Documents

Transcript of Articulo reconocimiento optico de caracteres.pdf