Articulo reconocimiento optico de caracteres.pdf
Transcript of Articulo reconocimiento optico de caracteres.pdf
Universidad de la Amazonia
Grupo de Investigación GIECOM
1
Resumen— En este artículo se describirán las
técnicas de Reconocimiento Óptico de Caracteres
OCR (Optical Character Recognition) las cuales son
utilizadas para desarrollar programas orientados al
OCR, que se encargan de dar solución a problemas
que se presentan hoy en día. Teniendo en cuenta
proyectos que se han desarrollado a través de la
utilización del reconocimiento de OCR. El uso del
reconocimiento de patrones ha sido un avance
tecnológico innovador que la humanidad ha podido
llegar a tener a su alcance, sin embrago para la
realización de programas que perciban la gran
cantidad de información que se maneja en
materiales escritos como libros escritos antiguos o
algún otro tipo de material es necesario hacer uso de
técnicas o tareas específicas que contribuyan al
desarrollo exitoso de estos programas de
reconocimiento de caracteres.
Palabras claves— Reconocimiento Óptico de
Caracteres OCR, Análisis de Imágenes, técnicas,
clasificador de mínima distancia, reconocimiento de
patrones, esqueletización, red neuronal.
I. INTRODUCCIÓN
Hoy en día automatizar los procesos que se llevan a
cabo es una de las principales actividades que se
tienen en cuenta, es por eso que las nuevas
tecnologías han permitido desarrollar programas
software orientado al Reconocimiento Óptico De
Caracteres con el fin de minimizar el tiempo de
ejecución de algunas tareas realizadas manualmente
por seres humanos. Entre uno de los aspectos más
importantes a destacar en el presente escrito son la
gran variedad de proyectos que se han llevado a
cabo a través del uso de las diferentes técnicas y
algoritmos característicos que presentan los OCR.
II. MARCO TEORICO
La digitalización de la información se ha convertido
en los últimos años en un punto creciente de interés
y de gran atención en beneficio para la sociedad. En
el caso específico de los textos, existen y se generan
continuamente grandes cantidades de información
escrita, tipográfica o manuscrita. [41] Por tal razón
se debe poder automatizar la introducción de
caracteres evitando la entrada por teclado, implica
un importante ahorro de recursos humanos y un
aumento de la productividad, al mismo tiempo que
se mantiene, o hasta se mejora, la calidad de
muchos servicios.
Las redes neuronales son un paradigma de
aprendizaje y procesamiento de datos, perteneciente
a la disciplina de la Inteligencia Artificial, inspirado
en la forma en que funciona el cerebro humano.
Una red neuronal está compuesta por la
interconexión de neuronas artificiales (estructuras
de programación) que presentan un comportamiento
individual simple, pero que en su conjunto pueden
manifestar un comportamiento global de alta
complejidad. Para lograr este funcionamiento
global, las redes neuronales deben ser entrenadas,
de forma que se configuren las interconexiones
entre sus nodos. Su funcionamiento puede verse
como el de una caja negra, en cuanto a que, tanto
para su entrenamiento como para su utilización, no
es necesario conocer su configuración. [44]
Las Redes Neuronales son sistemas de computación
que permiten la resolución de problemas que no
pueden ser descritos fácilmente mediante un
enfoque algorítmico tradicional, como, por ejemplo,
Carolina Silva Barreto
Universidad de la amazonia
Florencia, Colombia
{c.silva}@udla.edu.co
RECONOCIMIENTO OPTICO DE CARACTERES OCR
Universidad de la Amazonia
Grupo de Investigación GIECOM
2
ocurre en el reconocimiento de formas. Con las
redes se expresa las soluciones en un problema, no
como una secuencia de pasos, sino como la
evolución en un sistema inspirado en el
funcionamiento del cerebro y dotado, por tanto, de
cierta "inteligencia". Tal sistema no es sino la
combinación de una gran cantidad de elementos
simples de proceso (nodos o neuronas)
interconectados que, operando de forma
masivamente paralela, consiguen resolver el
problema. [35]
El Reconocimiento Óptico de Caracteres (ROC), así
como el reconocimiento de texto, en general son
aplicaciones dirigidas a la digitalización de textos.
Identifican automáticamente símbolos o caracteres
que pertenecen a un determinado alfabeto, a partir
de una imagen para almacenarla en forma de datos
con los que podremos interactuar mediante un
programa de edición de texto o similar. Con
frecuencia se abrevia en textos escritos en español
utilizando el acrónico a partir del inglés OCR. [28]
Los OCR son un tipo de software que se encarga del
reconocimiento óptico de caracteres. Se encarga de
extraer de una imagen los caracteres de un texto y
los guarda en un formato que pueda editarse como
texto. Sirve para guardar en forma de texto
imágenes escaneadas de un libro sin digitalizarlo, o
sea ingresar carácter por carácter en un editor de
texto. Los sistemas son relativamente fiables
aunque suelen fallar si las imágenes o las letras no
son claras. Para identificar los caracteres, el sistema
analiza la imagen pixel a pixel, buscando formas que
coincidan con las características de los caracteres. El
software buscará coincidencias con los caracteres y
fuentes disponibles en el sistema, o tratará de
identificar los caracteres a través del análisis de sus
características, de forma que el reconocimiento de los
mismos no se limite exclusivamente a un determinado
número de fuentes. [41]
El reconocimiento óptico de caracteres, es un área
de investigación importante en reconocimiento de
patrones. El objetivo de un sistema OCR, es
reconocer letras del alfabeto, números y otros
caracteres, que están en forma de imágenes
digitales sin ninguna intervención humana. [46] este
sistema óptico de caracteres es una aplicación
específica del reconocimiento de patrones, que
hasta la actualidad no tiene un modelo de solución
absolutamente superior. En su lugar, existen
numerosos métodos de clasificación automática,
cada uno con sus ventajas y desventajas, que han
sido adaptados al reconocimiento de caracteres. Los
métodos de clasificación provienen de las
investigaciones en varios campos tales como: Redes
Neurales, Sistemas Difusos, Estadística y Sistemas
Expertos, entre otros. Debe aclararse que estos
campos de estudio tienen también otras aplicaciones
además del reconocimiento de patrones. [26]
El OCR intenta identificar las palabras por medido
de la proximidad de caracteres y reconstruirlas
según la disposición de la página original. El
software se basa en algoritmos que convierten las
letras representadas en una imagen digital en
caracteres ASCII, lenguaje que puede
posteriormente ser leído y editado por algún
procesador de textos común y corriente. De esta
manera se puede ahorrar una gran cantidad de
recursos humanos y se posibilita la búsqueda y
recuperación de texto a través de una computadora.
[19]
Para poder llevar a cabo el desarrollo de programas
orientado a los OCR es necesario utilizar algoritmos
de Reconocimiento Óptico de Caracteres los cuales
tienen la finalidad de poder diferenciar un texto de
una imagen cualquiera. Para hacerlo se basan en 4
etapas: Binarización, Fragmentación o
Segmentación de la imagen, Adelgazamiento de los
componentes y Comparación con patrones.
BINARIZACIÓN
La binarización de una imagen digital consiste en
convertir la imagen digital en una imagen en blanco y
negro, de tal manera que se preserven las propiedades
esenciales de la imagen. [41]
Por lo tanto es conveniente convertir una imagen de
escala de grises, o una de color, en una imagen en
blanco y negro, de tal forma que se preserven las
propiedades esenciales de la imagen. Mediante este
proceso obtenemos una imagen en blanco y negro
donde quedan claramente marcados los contornos
de los caracteres y símbolos que contiene la imagen.
A partir de aquí podemos aislar las partes de la
imagen que contienen texto (más transiciones entre
blanco y negro). [28]
FRAGMENTACIÓN O SEGMENTACIÓN
Universidad de la Amazonia
Grupo de Investigación GIECOM
3
Es una manera bastante efectiva de extraer
caracteres de una imagen en blanco y negro es
buscar los conjuntos de píxeles que cumplen una
relación de conexión entre sí. Este método
proporciona caracteres bien segmentados que
pueden analizarse sin problemas en el módulo de
reconocimiento. [40]
La fragmentación permite la descomposición de un
texto en diferentes entidades lógicas, que han de ser
suficientemente invariables, para ser independientes
del escritor, y suficientemente significativas para su
reconocimiento.
ADELGAZAMIENTO DE LOS COMPONENTES
Es un procedimiento que consiste en ir borrando
sucesivamente los puntos de los contornos de cada
componente de forma que se conserve su tipología.
La eliminación de los puntos ha de seguir un
esquema de barridos sucesivos para que la imagen
continúe teniendo las mismas proporciones que la
original y así conseguir que no quede deforme. Es
necesario hacer un barrido en paralelo, más
claramente, señalar los píxeles borrables para
eliminarlos todos a la vez. Este proceso se lleva a
cabo para hacer posible la clasificación y
reconocimiento, simplificando la forma de las
componentes. [28]
COMPARACION CON PATRONES
Es un proceso mediante el cual se compara los
caracteres obtenidos anteriormente con unos
teóricos (patrones) almacenados en una base de
datos. El buen funcionamiento del ROC se basa en
gran medida a una buena definición de esta etapa.
La aplicación de los algoritmos de Reconocimiento
Óptico de Caracteres han hecho un gran aporte a
los servicios en donde se han introducido estos
procesos para aumentar su rendimiento y otros que
se basan completamente en estas tecnologías.
El reconocimiento de escritura en línea gana
nuevamente interés, no solo por el número de
aplicaciones donde este recurso es utilizado, sino
por el aumento de nuevos dispositivos de captura
que han sido desarrollados en la actualidad. Las
metodologías generales en reconocimiento de
patrones y procesamiento de imágenes se analizan,
mientras que las empleadas en el reconocimiento de
caracteres en línea se revisan [4]
Hoy en día se maneja una gran cantidad de
información en las organizaciones u otras entidades,
a pesar que el avance de las tecnologías permite
hacer uso de herramientas que facilitan el
almacenamiento de datos, todavía se utilizan los
materiales impresos donde se guarda información o
textos escritos los cuales todavía son importantes
para llevar a cabo actividades. Sin embargo en
búsqueda de soluciones a los problemas y optimizar
tiempo y recursos ha surgido el Reconocimiento
Óptico de Caracteres OCR (Optical Character
Recognition) se define como una herramienta de
software que convierte los caracteres alfanuméricos
capturados por medio del scanner, a códigos ASCII,
con el fin de posibilitar el proceso de indexado de lo
que se almacena [2]
Los programas OCR pueden lograr capturar toda la
información que se requiere de un texto escrito y
almacenarla en dispositivos sin necesidad de
realizar la ardua tarea de transcribir a la maquina los
datos existentes en papel. El OCR tiene infinidad de
campos de aplicación, con la única certeza que
ayuda o mejora muchas de las actividades que se
llevan a cabo por seres humanos.
El principal propósito que tiene el Reconocimiento
de Caracteres es el análisis de imágenes que se
conoce como un proceso que consiste en descubrir,
identificar y comprender los patrones que son
relevantes en el rendimiento de un trabajo basado en
imágenes. Uno de los principales objetivos del
análisis de imágenes por computadora consiste en
dotar a una máquina, en algún sentido, de la
capacidad de aproximación, similar a la de los seres
humanos. [1]
Teniendo en cuenta lo anterior mencionado para
lograr el desarrollo de programas orientados al
Reconocimiento Óptico de Caracteres es necesario
conocer las técnicas utilizadas en este campo.
III. TECNICAS Y ALGORITMOS PARA EL
RECONOCIEMNTO DE CARACTERES
Con el auge de las nuevas tecnologías y los
formatos electrónicos para los documentos, mejorar
y avanzan también las técnicas de reconocimiento
óptico de caracteres (OCR) con las que es un poco
Universidad de la Amazonia
Grupo de Investigación GIECOM
4
más fácil realizar los procesos de desarrollar
programas que estén orientados al (OCR), a
continuación se describen algunas técnicas
aplicables en el tema anteriormente mencionado.
i. CLASIFICADOR DE MÍNIMA DISTANCIA
Esta técnica se utiliza para el reconocimiento de
dígitos numéricos, la cual consiste en convertir e
interpretar una imagen capturada como un dígito
entre cero y nueve. Entonces si se quiere desarrollar
un programa orientado al Reconociento Óptico de
caracteres, es necesario digitalizar una imagen con
la representación en una matriz de ceros y unos
donde cero es blanco y un uno negro. A
continuación se explica cómo realizar el proceso.
El primer problema que tenemos es encontrar unos
buenos descriptores para cada imagen, que
describan con bastante exactitud el patrón de la
imagen correspondiente, y que además nos permita
calcular con facilidad la distancia de ese patrón a
cualquier otro patrón de descriptores.
Pensamos que un buen patrón para describir una
imagen binaria con exactitud y considerando esa
imagen binaria como una matriz de unos y ceros, es
el número de unos que tiene cada columna, es decir,
si la primera columna de esta matriz tiene un
número ‗n‘ de unos, el primer valor del vector será
‗n‘. Siguiendo con este barrido horizontal de la
matriz (de izquierda a derecha) obtenemos un
vector con unos valores (descriptores) que describen
esa imagen binaria de una manera bastante
fidedigna. [1]
Figura 1. Imagen que representa el número de unos en cada
columna
A pesar que se tienen dos imágenes binarias
distintas con dos vectores iguales, se puede observar
en la siguiente figura
Figura 2. Dos imágenes distintas con el mismo patrón
ii. RECONOCIMIENTO DE PATRONES
Dentro del Reconocimiento Óptico de Caracteres
se da a conocer también la técnica de
reconocimiento de patrones, la cual consiste en el
estudio de los mecanismos por los que las señales
externas estimulan los órganos sensoriales y se
convierten en experiencias perceptibles
significativas.
El reconocimiento patrones es una disciplina en
continuo desarrollo en los últimos años, sobre todo
en el campo del análisis de imágenes y la visión por
computador. Las redes neuronales artificiales son
una herramienta muy potente dentro de este campo,
particularmente los mapas auto organizados de
Kohonen (SOFM) (1997), ya que son capaces de
detectar la topología y la distribución de
probabilidad de los patrones de entrada. [3]
Universidad de la Amazonia
Grupo de Investigación GIECOM
5
La técnica de reconocimiento de patrones maneja
tres procesos:
1. Adquisición y preproceso de datos.
2. Extracción de características.
3. Toma de decisiones o agrupamiento como se
muestra en la siguiente figura. [2]
Figura 3. Imagen que representa el proceso de
reconocimiento de patrones
El reconocimiento de patrones utiliza el método de
capturar una imagen con cualquier aparato scanner
y después continuar con sus fases de proceso para
lograr desarrollar el sistema que identifique los
patrones que se desean analizar. Esta técnica es muy
utilizada y recae cada día más en aplicaciones para
sistemas educativos.
iii. ESQUELETIZACION
La esqueletización (palabra técnica procedente del
vocablo inglés ―skeletonization‖) es un proceso
mediante el cual se transforma una determinada
forma u objeto de una imagen digital, compuesta de
una determinada cantidad de pixeles, en un objeto
basado en líneas, de forma que las propiedades
topológicas del objeto se preserven. Este objeto
resultante constituido por líneas se denomina
esqueleto. [12]
Los esqueletos son muy útiles a la hora de
reconocer, dentro de una imagen, objetos o patrones
que sean alargados o con una determinada forma
como por ejemplo caracteres, polígonos, patrones
cromosómicos, etc. Los esqueletos proporcionan
una abstracción de las características topológicas y
geométricas del objeto, de forma que al almacenarse
sólo una determinada información estructural de los
objetos en estudio, la esqueletización puede verse
también como un proceso de compresión de
datos.[3]
Esta técnica se toma en cuenta para proyectos que
se relacionan con la captura e interpretación de
datos numéricos, ya que proporciona gracias a las
medidas que toma de separar cada patrón y
estudiarlo para posteriormente unir u y poder
conocer el análisis del esqueleto recopilado en la
primera fase.
iv. TÉCNICA PARA EL RECONOCIMIENTO
DE CARACTERES GOCR
Desarrollada por Joerg Schulenburg, se basa en un
conjunto de reglas, es portable a diferentes sistemas
operativos, el tamaño de las fuentes que soporta esta
técnica es entre 20 - 60 píxeles y acepta muchos
formatos de imágenes, como pnm, PBM, pgm, ppm,
pcx, tga. Sin embargo, tiene inconvenientes con
letras cursivas, texto escrito a mano, adicionalmente
es muy sensible a imágenes que contenga ruido y
grandes ángulos de inclinación, por lo que se
necesita de un gráfico de alta calidad para conseguir
buenos resultados.[7]
v. BACKPROPAGATION
El desarrollo del algoritmo back propagation
proporciona un método eficiente para entrenar este
tipo de redes. Su importancia está en su capacidad
de auto adaptar los pesos de las neuronas
intermedias para aprender la relación que existe
entre el conjunto de vectores o patrones de entrada
y su correspondiente salida, y poder aplicar esa
relación después del entrenamiento a nuevos
vectores de entrada imperfectos o con ruido.[50]
La propagación hacia atrás de errores o retro
propagación es un algoritmo de aprendizaje
supervisado que se usa para entrenar redes
neuronales artificiales. El algoritmo consiste en
minimizar un error (comúnmente cuadrático) por
medio de gradiente descendiente, por lo que la parte
esencial del algoritmo es cálculo de las derivadas
parciales de dicho error con respecto a los
parámetros de la red neuronal. [33]
vi. ALGORITMO DE CLASIFICACIÓN
Universidad de la Amazonia
Grupo de Investigación GIECOM
6
Consiste en la extracción de características
multicanal o basadas en filtros; el falsificador K-NN
es la ubicación de sus vecinos cercanos. Se
determinan las dos clases más probables, donde K
es el número natural especificado por el usuario. El
desarrollo de estos algoritmos nos permite la
búsqueda de nuevas alternativas y mejoras a los
sistemas de identificación biométrica. [5]
vii. EXTRACCIÓN DE CARACTERÍSTICAS
La información contenida en el mapa de bits de una imagen no es adecuada para el procesado digital. Debido a esto, es necesario describir un carácter de otra manera. La descripción del carácter debería ser invariable hacia el tipo de fuente usado, o deformaciones causadas por el proceso de centrado. Además, en todos los casos del mismo carácter debería tener una descripción similar. Una descripción del carácter consiste un vector de valores numerales, llamados “descriptores” o “patrones”. Generalmente, la descripción de una región de la imagen está basada en su representación interna y externa. La representación interna está basada en sus propiedades regionales, como el color o textura. La descripción de caracteres normalizados está basada en sus características externas, ya que solo afectan a propiedades como la forma del carácter. [17]
IV. APLICACIONES
En los últimos años la digitalización de la
información (textos, imágenes, sonido, etc.) ha sido
un punto de interés para la sociedad. Un caso
concreto es el de los textos, existen y se generan
continuamente grandes cantidades de información
escrita, tipográfica o manuscrita en todo tipo de
soportes.
Existen varios proyectos que han sido desarrollados
haciendo uso del Reconocimiento de caracteres
OCR desarrollado como lo expone el articulo
Aplicación de Redes Neurales en el reconocimiento
óptico de caracteres en donde se buscaba desarrollar
dos aplicaciones. La primera, miniOCR, será una
aplicación capaz de reconocer dígitos aislados
dibujados a mano en la misma a través del mouse.
Luego, se desarrollará Calculadora, una segunda
aplicación basada en miniOCR, que permita aplicar
a un caso de ejemplo las conclusiones del primer
desarrollo. En esta, el usuario podrá obtener
respuestas de la computadora a operaciones
aritméticas simples dibujadas en su interfaz de
usuario. Teniendo como resultado final la primera
aplicación miniOCR desarrollada que es capaz de
reconocer dígitos dibujados manualmente utilizando
el mouse. Abarca todo el proceso necesario para
llegar a dicho fin. [6]
La importancia de utilizar redes neuronales en el
desarrollo de proyectos se ve reflejado en el artículo
escrito por Aurelio Velazquez y dos compañeros
más denominado Reconociendo Eficiente de
Caracteres Alfanuméricos Provenientes de Mapas
Raster por Medio de Clasificadores Neuronales, el
cual consiste en analizar mapas cartográficos con
leyendas en español por lo cual su artículo describe
una técnica simple pero eficiente para el aprendizaje
de clasificadores neuronales, Redes Neuronales
(RNA) en este caso, Gracias al estudio y las pruebas
que se realizaron para lograr su objetivo se
concluyó que el conjunto de RNA entrenado, puede
identificar cualquier tipo de caracteres [30] teniendo
en cuenta el estudio realizado para el
reconocimiento de mapas raster se puede decir que
es de vital importancia la utilización de las redes
neuronales en el reconocimiento de caracteres de
igual manera un programa que identifique y
minimice el tiempo de identificar este tipo de mapas
es de mucha utilidad.
Dentro la clasificación de herramientas que se han
diseñado a partir de los OCR encontramos la
miniOCR una aplicación capaz de reconocer dígitos
aislados dibujados a mano en pantalla por el usuario
a través del mouse. Utiliza una red neuronal
convencional adaptada para este fin. Comprende
también la recolección de muestras, el
entrenamiento y medición de Rendimiento,
fundamentada en el artículo de Gabriel Constenla y
Sergio Omar Aguilera [6] acerca de esta aplicación
desarrollada se nota la agilidad que tiene para poder
captar los dígitos dibujados manualmente utilizando
el mouse.
Universidad de la Amazonia
Grupo de Investigación GIECOM
7
Un aporte interesante es el que se da a conocer en el
artículo de Cristian pozo en donde se denominado
Desarrollo de Algoritmos de Reconocimiento de
Placas de Vehículos presentado, en donde se
desarrolló un algoritmo confiable para el
reconocimiento de placas vehiculares en la entrada
a un parqueadero mediante el procesamiento digital
de imágenes. Su propuesta consiste en que el
software localiza la placa vehicular dentro de la
imagen del vehículo y reconoce los caracteres y
números que se encuentran dentro la misma. Para la
localización de la placa se emplea la estrategia
denominada ―Búsqueda de Patrones‖ con la cual es
posible encontrar la palabra ―Ecuador‖ presente en
el país. [9] este proyecto desarrollado en el país de
ecuador es una fiel afirmación que la aplicación de
los algoritmos de reconocimiento óptico de
caracteres es de mucha importancia ya que permite
que estacionamientos como parqueaderos sea
confiables.
El articulo Desarrollo de un modelo para el
seguimiento de patrones mediante reconocimiento
óptico, presenta el desarrollo de un sistema de
seguimiento de patrones por medio del
procesamiento de imágenes que pueda aplicarse en
cualquier ámbito, únicamente variando las
características del objeto que se desea seguir, lo
cual permitiría la aplicación de diversos campos
donde se usen cámaras y sea necesario el
seguimiento de alguna característica de un sujeto u
objeto. Tiene aplicación en diferentes contextos
como sistemas de seguridad, filmación automática
de eventos deportivos (con una cámara programada
siguiendo un balón de fútbol a un jugador
específico), entre otras. [10] el desarrollo de
aplicaciones como la anteriormente mencionadas
son útiles para la sociedad ya que aumentan la
seguridad en establecimientos públicos y a su vez
permite a los aficionados de la televisión ver más
detalladamente sus programas favoritos.
El reconocimiento óptico de caracteres tiene
infinidad de campos de aplicación, un ejemplo claro
para demostrar esta afirmación es el artículo
―Detección automática de presencia/ausencia de
atún en imágenes obtenidas mediante sonar de largo
alcance a bordo de buques pesqueros‖ en donde se
presenta una metodología para el análisis
automatizado de las señales del sonar de largo
alcance y una aplicación basada en la técnica de
OCR, consiste en el análisis de imágenes de sonar
mediante técnicas de procesamiento de imágenes.
[11] es importante resaltar que los campos de
aplicación de OCR no tiene delimitaciones lo
importante es identificar el problema que se quiere
solucionar y adecuar la mejor técnica o algoritmo
para su desarrollo.
En un trabajo presentado en el 2011 como tesis de
grado, presentado por Edgar Barragán consistía en
diseñar e implementar un sistema de control y
seguridad vehicular mediante la captura de la placa
del vehículo con una cámara infrarroja que puede
grabar video en cualquier condición ambiental. [14]
lo que se buscaba con el desarrollo de este
programa de reconocimiento óptico de caracteres es
implementar una base de datos donde estén
registradas las placas vehiculares, con el fin de que
sea más segura y confiable la entrada y salida de los
autos en lugares públicos.
En el 2014 se desarrolló el sistema DocLux que
permite el tratamiento de imágenes digitalizadas
por lotes; DocLux permite aplicar una serie de
filtros que posibilitan mejorar la calidad de las
imágenes. Se desarrolló un prototipo de aplicación
DocLux que permite reconocer y trascribir las
vocales minúsculas sin tilde del lenguaje español.
Utilizando el motor Tesseract [15] el anterior
programa se llevó a cabo ya que se necesitaba
recopilar la información que se encontraba en textos
antiguos pero por el paso del tiempo se encontraban
en muy mal estado y no se podía leer la información
por tal razón fue necesario desarrollar esta
aplicación a través del reconocimiento óptico de
caracteres.
En el artículo ―Herramienta de transcripción
automática de partituras musicales de importancia
dentro del patrimonio documental andaluz mediante
reconocimiento óptico de caracteres musicales‖
buscaba como objetivo global del Proyecto de
Investigación desarrollar una herramienta de
transcripción automática de partituras musicales
escritas, tanto en grafía antigua como moderna, que
permite transcribir partituras musicales de
importancia, dentro del patrimonio documental
Universidad de la Amazonia
Grupo de Investigación GIECOM
8
andaluz mediante reconocimiento óptico de
caracteres. Para desarrollar dicha herramienta [16]
Según el artículo Reconocedor Óptico De
Caracteres Manuscritos (ROCM) por medio de
redes neuronales realizado como opción de grado
buscaba elaborar un programa que convierta la
información manuscrita, contenida en un archivo de
imagen, a formato texto para que el usuario pueda
manipularla con algún procesador o editor de texto
convencional; dicha conversión será hecha con un
alto grado de fiabilidad usando redes neuronales
para la identificación de caracteres.[22] este trabajo
que fue desarrollado tuvo éxito con los resultados
que esperaban ya que obtuvieron un nueva función
a través del reconocimiento de OCR.
Figura 4.Etapas del Programa Reconocedor Óptico De
Caracteres Manuscritos [22]
En México se desarrolló un proyecto para la
construcción de un sistema de reconocimiento
óptico de caracteres basado en redes neuronales
artificiales (RNA) y otros componentes de
inteligencia computacional y entendimiento de
lenguaje, especializado en el reconocimiento de
textos manuscritos y textos antiguos. EL objetivo de
PRISCUS es desarrollar un software inteligente
integral, que supere la problemática intrínseca que
se presenta en los reconocedores convencionales al
trabajar con letra cursiva y textos antiguos. Para
poder llevar a cabo lo que se buscaba se necesitó
aplicar el modelo o PRISCUS se compone de las
siguientes partes:
• Digitalización. Creación de una imagen digital del
documento a color o escala de grises.
• Pre-Procesamiento. Clarificar la imagen, eliminar
ruido, convertir la imagen en blanco y negro.
• Segmentación de palabras. A partir del mapa de
bits de todo el documento, obtener las palabras
presentes. [23]
Figura 5.Modelo PRISCUS [23]
Para resaltar el uso de las técnicas más utilizadas
para el Reconociendo de caracteres como se
evidencia en el artículo realizado por Carlos Javier
y Victor Sandonis indica que normalmente, las
técnicas de OCR son útiles para digitalizar textos de
algún libro (caracteres impresos) o formularios
rellenados manualmente (caracteres manuscritos).
Tanto en un caso como en el otro el desglose de los
caracteres individuales es mucho más sencillo que
en el caso de texto manuscrito continuo, para el que
es necesario la aplicación de técnicas de pre proceso
y segmentación más complejas que en el caso de
OCR. Una vez pre procesada la imagen se deberá
fragmentar o segmentar en las diferentes
componentes conexas (parte de la imagen donde
todos los píxeles son adyacentes entre sí) que la
componen. La fragmentación o segmentación de la
imagen constituye una de las mayores dificultades
del reconocimiento, y se hace necesaria para poder
reconocer cada uno de los caracteres de la imagen
binaria [31]
El articulo realizado por Carlos Chaoz denominado
―Normalización de imágenes de placas vehiculares
a través de corrección geométrica‖ se enfocó en
Universidad de la Amazonia
Grupo de Investigación GIECOM
9
implementar un sistema de control de acceso
vehicular mediante el reconocimiento del número
de placa de manera automática usando una cámara y
algoritmos de procesamiento de imágenes
incluyendo Reconocimiento Óptico de Caracteres
(OCR). Para el reconocimiento de las placas se
tomara una imagen al vehículo al momento de
entrar a un parqueadero específico. [20] gracias a lo
anterior expuesto podemos recalcar la importancia
de hacer uso de este sistema de reconocimiento
óptico de caracteres y los beneficios que se
obtienen.
Hoy en día se dispone de mucha información que se
encuentra documentada en medios físicos, por eso
es tan importante desarrollar proyectos como el que
se desarrolló en el artículo realizado por Eduardo,
Miguel; Gómez, Flores en donde se buscaba
elaborar un programa que convierta la información
manuscrita, contenida en un archivo de imagen, a
formato texto para que el usuario pueda manipularla
con algún procesador o editor de texto
convencional; dicha conversión será hecha con un
alto grado de fiabilidad usando redes neuronales
para la identificación de caracteres. [22]
El reconocimiento de caracteres ópticos se ha
convertido en un reto de la tecnología
contemporánea debido a las inmensas cantidades de
aplicaciones que abracan el tema y a lo sofisticada
que es técnica. Su popularidad radica en su
versatilidad y uso, que permite convertir material
impreso, mecanografiado o escrito manualmente
por medios computacionales sin necesidad de
digitar la información. [29]
El articulo Reconocimiento Automático de
Caracteres Manuscritos y Marcas, Orientado al
Procesado de Encuestas se enfoca en la
implementación de un sistema de reconocimiento de
caracteres manuscritos y marcas, relevante para la
toma de información del contenido de grandes
volúmenes de formularios (encuestas), la cual será
utilizado por la Escuela de Ingenierías Eléctrica,
Electrónica y de Telecomunicaciones de la
Universidad. [24] gracias al desarrollo de este
programa se pudo implementar un sistema de
carácter cooperativo capaz de extraer
automáticamente la información de una encuesta
que contiene datos de marcas y/o letras mayúsculas
y números; el sistema tiene una precisión para
reconocimiento de marcas del 100% y del 90% para
caracteres.
En el 2009 se hizo un estudio importante ya que se
desarrolló y utilización de firmas vectoriales para el
reconocimiento de imágenes, aprovechando las
propiedades que presentan las transformadas de
Escala y de Fourier. Como primer caso, se
analizaron los dígitos del sistema decimal, escrito
cada uno en color blanco con fondo negro, tipo
Arial en tamaño 144; a ellos se les aplicaron
rotaciones de 360 grados con variación de un grado
y cambios de escala de 80 % a 120 % con
incrementos de 0.5 %. Como segundo caso, se
tomaron imágenes de 9 diferentes formas de hojas
de plantas, con variaciones en rotación y escala
similares al caso anterior. Para cada imagen se
realizaron diferentes transformaciones matemáticas
que permitieron obtener dos firmas vectoriales; para
encontrar el grado de semejanza entre las imágenes,
se compararon sus firmas vectoriales mediante la
Distancia euclidiana. [25] el programa que se
desarrollo fue de gran importancia es una de las
muestras de la gran cantidad de opciones que
tenemos a la mano para automatizar los procesos
que llevamos a diario.
Un proyecto destacado es el que se presenta en el
artículo denominado Sistema Control de Acceso a
Estacionamiento por Medio de Reconocimiento de
Placas Vehiculares que fue desarrollado en el 2012;
El dicho estudio se basó en diseñar y desarrollar un
sistema de cómputo para permitir el acceso a
estacionamientos, basado en reconocimiento de
placas automóviles [47] desde mi punto de vista
contemplo que este tipo de proyectos que van de la
mano con la tecnología es de vital importancia en la
sociedad de hoy ya que permite tener más seguridad
y menos riesgos.
Es de gran importancia resaltar los proyectos que se
han desarrollado gracias al uso del Reconocimiento
Óptico de Caracteres, un ejemplo de este caso es el
representado en el artículo Sistema de Conteo,
Identificación y Clasificación de Vehículos en un
Peaje en donde se desarrolló de un sistema que
permite identificar, contar y clasificar de manera
automática los vehículos presentes en un carril de
un peaje a partir de un video capturado del mismo.
Para ello el sistema detecta la llegada de un
Universidad de la Amazonia
Grupo de Investigación GIECOM
10
vehículo al peaje mediante la detección de sus
luces, localiza la placa del vehículo, separa sus
caracteres, además de detectar y contar el número
de llantas del mismo. [36]
A raíz de la variedad de técnicas y algoritmos que el
sistema OCR presenta se determinan un sin número
de aplicaciones, entre estas encontramos la expuesta
en el articulo Sistema de Control Vehicular
Utilizando Reconocimiento Óptico de Caracteres en
donde su objetivo es realizar un control vehicular
mediante el Reconocimiento Óptico de Caracteres
(OCR) de la Placa de un vehículo, utilizando una
cámara USB y posteriormente procesada en la
Plataforma de desarrollo National Instruments
Labview 8.2 en tiempo real. [38]
El avance de las nuevas tecnologías hoy en día
acapara todos los ámbitos de desarrollo educativos
que existen, por ejemplo en el artículo presentado
por Milton Baque desarrolla un sistema que permite
verificar y evaluar los caracteres y trazos
manuscritos utilizando la tecnología en pantalla
táctil para captar las actividades que realiza un
estudiantes en la etapa de educación inicial. [39] el
sistema desarrollado anteriormente me parece que
es uno de los mejores métodos en donde se
involucran las tecnologías y aplicación del
Reconocimiento Óptico de Caracteres y los mas
beneficioso es que se involucra a los menores en sus
primeros ciclos de educación.
En el artículo referenciado por Ivan Ruiz describe
el algoritmo de in OCR para un sistema
Automático de acceso mediante el reconocimiento
de matrículas vehiculares, a través de las técnicas de
visión computacional. El software de ANPR utiliza
el reconocimiento óptico de caracteres, extrae de
una imagen los caracteres que componen un texto
para almacenarlos en un formato con el cual
puedan interactuar programas de edición de texto.
[48]
Los sistemas de Reconocimiento Óptico de
Caracteres hoy en día se han convertido en una
herramienta muy importante para agilizar algunos
procesos; una de estas se encuentra a servicio de
cualquier tipo de usuario, se conoce como Free-
OCR.com es una herramienta gratuita en línea de
OCR (Optical Character Recognition). Permite
utilizar este servicio para extraer el texto de
cualquier imagen que el usuario provee.
Es un servicio gratuito, sin necesidad de
registrarse. No se necesita dirección de correo
electrónico.
La única condición es subir archivos de
imágenes. Free-OCR toma ya sea un archivo JPG,
GIF, TIFF BMP o PDF (sólo la primera página).
La única restricción es que las imágenes no deben
ser más grandes que 2 MB, no más ancha o más alta
que 5.000 píxeles y hay un límite de 10 archivos de
imagen por hora.
V. CONCLUSION
Los Sistemas OCR es uno de los campos de
investigación más importantes en el área de
reconocimiento de patrones ya que a raíz de su
infinidad de aplicaciones aportan a mejorar y
automatizar los procesos; a través de la
investigación realizada se puede concluir que en la
actualidad muchas organizaciones ya hacen uso del
Reconocimiento Óptico de caracteres gracias a su
efectividad.
También es importante concluir que el manejo de
programas software que realicen el reconocimiento
de patrones se puede realizar en cualquier lenguaje
de programación e incluso ya existen aplicaciones
que permiten solamente ejecutar las acciones y
obtener lo que se necesita.
REFERENCIAS
[1] Universidad de Sevilla – España ―Reconocedor
por Mínima Distancia‖,
http://www.sav.us.es/formaciononline/asignatur
as/asigpid/apartados/textos/recursos/rmd/docu
mentacion.zip, Noviembre-2003
[2] Facultad Politécnica, Universidad Nacional del
Este–Ciudad del Este, Paraguay―Reconocimiento de
Patrones. Una propuesta de Corrección Automática
de Test de Selección Múltiple‖autores – Laura
Leticia Valenzuela Valenzuela y Gustavo Javier
Báez Villar
[3]. J.A. Gómez Ruiz, J. Muñoz Pérez, M.A. García
Bernal, E. López Rubio ―Detección de esqueletos
de caracteres mediante una red neuronal
competitiva basada en segmentos
Universidad de la Amazonia
Grupo de Investigación GIECOM
11
Inteligencia Artificial‖. Revista Iberoamericana de
Inteligencia Artificial, vol. 6, núm. 17, 18, 2002, pp.
7-22, Asociación Española para la Inteligencia
Artificial España
[4] Karina Toscano, Humberto Sossa, Ricardo
Barrón, Gabriel Sánchez ―Reconocimiento de
caracteres manuscritos mediante información del
proceso inverso en la realización de su trazo‖-
[5] ACHING SAMATELO, Jorge L.; ROJAS
VIGO, David A. Algoritmos para el reconocimiento
de imágenes de huellas dactilares. Electrónica-
UNMSM, 2014, no 12, p. 11-20.
[6] AGUILERA, Sergio; CONSTENLA, Gabriel.
Aplicación de Redes Neurales en el reconocimiento
óptico de caracteres. En XII Workshop de
Investigadores en Ciencias de la Computación.
2010.
[7] GUTIERREZ, Richard, et al. Aplicación de
Visión por Computador para el Reconocimiento
Automático de Placas Vehiculares utilizando
OCR‘s Convencionales. 2011.
[8] FIGUEROA, Yumis, et al. APLICACIÓN WEB
DEL ICA PARA LA CONSTRUCCIÓN DE UNA
BASE DE DATOS DE MICROORGANISMOS
DEL RUMEN, BASADA EN UN RÁPIDO
ALGORITMO DE RECONOCIMIENTO DE
CARACTERES.
[9] TASIGUANO POZO, Cristian
Andrés. Desarrollo de algoritmos de reconocimiento
de placas de vehículos. 2011. Tesis Doctoral.
QUITO/EPN/2011.
[10] LUNA, Rodrigo Andrés Franco; OSORIO,
José Andrés Chaves. Desarrollo de un modelo para
el seguimiento de patrones mediante
reconocimiento óptico.Scientia Et Technica, 2012,
vol. 17, no 50, p. 199-204.
[11] URANGA AIZPURUA, Jon. Detección
automática de presencia/ausencia de atún en
imágenes obtenidas mediante sonar de largo alcance
a bordo de buques pesqueros y aplicación de
Optical Character Recognition (OCR) para la
extracción de parámetros. 2013; 5, 2013.
[12] RUIZ, JA Gómez, et al. Detección de
esqueletos de caracteres mediante una red neuronal
competitiva basada en segmentos. Inteligencia
Artificial, Revista Iberoamericana de Inteligencia
Artificial, 2002, no 17, p. 7-21.
[13] MONGE OSORIO, Manuel Alejandro. Diseño
de una arquitectura para una red neuronal artificial
perceptron multicapa sobre una FPGA aplicada al
reconocimiento de caracteres. 2011.
[14] BARRAGÁN DEL POZO, Edgar Edison.
Diseño e Implementación de un Sistema de Control
Vehicular Utilizando Reconocimiento Optico de
Caracteres en el Laboratorio de Automatización
Industrial de la EIS. 2012.
[15] CANTERO, Lisbet Milagros Guerra; LAGO,
Eriberto Vanegas. Doclux OCR: Software libre para
la restauración y transcripción de imágenes
archivísticas.3C Tecnología, 2014, vol. 3, no 1.
[16] PÉREZ, Isabel Barbancho, et al. Herramientas
de transcripción automática de partituras musicales
de importancia dentro del Patrimonio Documental
Andaluz mediante reconocimiento óptico de
caracteres musicales. Papeles del Festival de
Música Española de Cádiz., 2007, no 3, p. 247-333.
[17] CEBALLOS JIMÉNEZ, Samuel Enrique.
Identificación y reconocimiento de matrículas de
automóviles con MATLAB. 2012.
[18] PILLAJO, Tituaña; POLO, Tito. Lógica difusa
y extracción de rasgos topológicos para el
reconocimiento de caracteres manuscritos. 1997.
Tesis Doctoral. QUITO/EPN/1997.
[19] BALLESTEROS ESTRADA, Silvia Socorro.
Los problemas de identificación de caracteres OCR
para la recuperación de texto en el libro antiguo: un
análisis de caso en el Fondo Antiguo de la
Biblioteca Central, UNAM. Biblioteca
Universitaria, vol. 15, no 1, p. 25-34.
[20] CHOEZ ÁLVAREZ, Carlos Leonardo;
SALAS GUERRERO, Steve Fernando;
VINTIMILLA, Boris X. Normalización de
imágenes de placas vehiculares a través de
corrección geométrica. 2013.
[21] AYALA CHARCA, Giancarlo. Reconocedor
óptico de caracteres de placas de automóviles
empleando técnicas de procesamiento digital de
imágenes. 2007.
[22] EDUARDO, MIGUEL; GÓMEZ,
FLORES. RECONOCEDOR ÓPTICO DE
CARACTERES MANUSCRITOS (ROCM) POR
MEDIO DE REDES NEURONALES. 2004. Tesis
Doctoral.
[23] FARFÁN, Eduardo Cuevas; GÓMEZ-GIL,
Pilar. PRISCUS: Reconocedor Óptico de Caracteres
Manuscritos y Antiguos.
[24] DE ARMAS DOMÍNGUEZ, Roberto Carlos;
RODRÍGUEZ, Lener Samuel Bautista.
RECONOCIMIENTO AUTOMÁTICO DE
Universidad de la Amazonia
Grupo de Investigación GIECOM
12
CARACTERES MANUSCRITOS Y MARCAS,
ORIENTADO AL PROCESADO DE
ENCUESTAS. 2005.
[25] LERMA, Jesús R.; ÁLVAREZ, Josué.
RECONOCIMIENTO DE CARACTERES
BASADO EN FIRMAS VECTORIALES. e-
Gnosis, 2009, p. 1-7.
[26] ALBUJA DELGADO, Jorge. Reconocimiento
de caracteres manuscritos por medio de redes
neurales y neuro-difusas artificiales. 1995. Tesis
Doctoral. QUITO/EPN/2005.
[27] BONILLA MARTÍNEZ, Eduardo
Gabriel. Reconocimiento de caracteres mediante
redes neuronales con MATLAB. 2005. Tesis
Doctoral. QUITO/EPN/2005.
[28] ALVARADO, Lucía Chacón. Reconocimiento
de Caracteres Ópticos Aplicaciones en
Bibliotecas. Bibliotecas: Revista de la Escuela de
Bibliotecología, Documentación e Información,
1989, vol. 7, no 2.
[29] DURÁN GÓMEZ, Mauricio. Reconocimiento
de caracteres ópticos OCR por medio de correlación
y redes neuronales. 2013.
[30] VELÁZQUEZ, Aurelio; SOSSA, Humberto;
LEVACHKINE, Serguei. Reconocimiento Eficiente
de Caracteres Alfanuméricos Provenientes de
Mapas Ráster por Medio de Clasificadores
Neuronales. Test journal, 2002, vol. 6, no 1.
[31] SANCHEZ, carlos; Reconocimiento Óptico de
Caracteres (OCR) revistar universidad carlos lll
[32] EL RECONOCIMIENTO ÓPTICO DE
CARACTERES, O. C. R. 2. Reconocimiento
Óptico de Caracteres. Directora General, p. 42.
[33] ORDOÑEZ, Juan, RECONOCIMIENTO
OPTICO DE CARACTERES OCR CON REDES
NEURONALES ESTADO DEL ARTE,
universidad de loja.
[34] SARI, Toufik; KEFALI, Abderrahmane.
Recognition-free Retrieval of Old Arabic Document
Images. Computación y Sistemas, 2011, vol. 15, no
2, p. 195-208.
[35] CALLISAYA UCHANI, Zenón Amado.
REDES NEURONALES EN OCR CON
RECONOCIMIENTO DE IMAGENES. Revista de
Información, Tecnología y Sociedad, 2009, p. 78.
[36] QUINTERO, Juan Manuel; QUINTERO,
Pablo Andrés; SEPÚLVEDA, Julián Quiroga.
Sistema de Conteo, Identificación y Clasificación
de Vehículos en un Peaje.
[37] ANDRADE MIRANDA, Gustavo; LOPEZ
ENCALADA, Jose. Sistema De Control Vehicular
Utilizando Reconocimiento Optico De Caracteres.
2009. Tesis Doctoral.
[38] MIRANDA GUSTAVO, Andrade; LOPEZ
ENCALADA, Jose; CHAVEZ BURBANO,
Patricia. Sistema De Control Vehicular Utilizando
Reconocimiento Óptico De Caracteres. 2009.
[39] AGURTO BAQUE, Milton, et al. Sistema de
evaluación de actividades en la educación inicial,
usando como medio el reconocimiento y
verificación on-line de caracteres y trazos
manuscritos. 2011.
[40] GUPTA, Amar; HIELSCHER, Rafael Palacios.
Sistema de reconocimiento de caracteres para la
lectura automática de cheques. En anales de
mecánica y electricidad. Asociacion de Ingenieros
del ICAI, 2003. p. 26-30.
[41] BETANCOURT SALAZAR, Silvana del
Rocío; PONCE PROAÑO, Miguel Alejandro.
Sistema de reconocimiento óptico de caracteres,
como solución al procesamiento digital de la
información en la Facultad de Ingeniería, Ciencias
Físicas y Matemática Especialidad-Informática.
2012.
[42] MARI-DOMENEC, Francesca; BIA-PLATAS,
Alejandro. Técnicas de producción masiva de
contenidos para bibliotecas digitales. 2002.
[43] RODRÍGUEZ, Gustavo Adolfo Lara. Técnicas
de reconocimiento de imágenes para la creación de
fotomosaicos.
[44] CONSTENLA, Gabriel Roberto.
Reconocimiento Óptico de Dígitos con Redes
Neuronales. 2010.
[45] ARLANDIS, Joaquím, et al. Grupo de
Reconocimiento de Imágenes y Visión Artificial
(RIVA).
[46] MAYTA CHURA, William. Reconocimiento
automático de dígitos manuscritos en base a
prototipos multivaluados. 2010.
[47] SALDANA PEREZ, A. N. A.;
MAGDALENA, MARIA; XOCHIGUA JORGE,
ALEJANDRO. SISTEMA CONTROL DE
ACCESO A ESTACIONAMIENTO POR MEDIO
DE RECONOCIMIENTO DE PLACAS
VEHICULARES. 2012. Tesis Doctoral.
[48] RUIZ DELGADO, IVAN ABEL. SISTEMA
DE IDENTIFICACION DE PLACAS
VEHICULARES CON TECNICAS DE VISION
COMPUTACIONAL. 2012. Tesis Doctoral.
Universidad de la Amazonia
Grupo de Investigación GIECOM
13
[49] FDEZ, Juan M. López, et al.
RECONOCIMIENTO AUTOMÁTICO DE
MATRÍCULAS USANDO OPERADORES
MORFOLÓGICOS Y MÚLTIPLES REDES
NEURONALES.
[50] PLATA CHEJE, Rubén Wismark. MatLab &
Redes Neuronales. Revista de Información,
Tecnología y Sociedad, 2008, p. 96.
Autores Carolina Silva Barreto, estudiante de Ingeniería de
Sistemas de la Universidad de la Amazonía
Florencia – Caquetá.