UNIVERSIDAD AUTÓNOMA DE NUEVO LEÓN ... -...

118
UNIVERSIDAD AUTÓNOMA DE NUEVO LEÓN FACULTAD DE INGENIERÍA MECÁNICA Y ELÉCTRICA DIVISIÓN DE ESTUDIOS DE POSGRADO CARACTERIZACIÓN DEL TRÁNSITO VEHICULAR A TRAVÉS DEL PROCESAMIENTO DE INFORMACIÓN DE IMÁGENES DE VIDEO POR FIDENCIO SÁNCHEZ RUEDA TESIS EN OPCIÓN AL GRADO DE DOCTOR EN INGENIERÍA CON ORIENTACIÓN EN INGENIERÍA DE SISTEMAS SAN NICOLÁS DE LOS GARZA, N. L., JULIO DEL 2008

Transcript of UNIVERSIDAD AUTÓNOMA DE NUEVO LEÓN ... -...

UNIVERSIDAD AUTÓNOMA DE NUEVO LEÓN

FACULTAD DE INGENIERÍA MECÁNICA Y ELÉCTRICA

DIVISIÓN DE ESTUDIOS DE POSGRADO

CARACTERIZACIÓN DEL TRÁNSITO VEHICULAR A TRAVÉS DEL

PROCESAMIENTO DE INFORMACIÓN DE IMÁGENES DE VIDEO

POR

FIDENCIO SÁNCHEZ RUEDA

TESIS

EN OPCIÓN AL GRADO DE DOCTOR EN INGENIERÍA CON

ORIENTACIÓN EN INGENIERÍA DE SISTEMAS

SAN NICOLÁS DE LOS GARZA, N. L., JULIO DEL 2008

ii

UNIVERSIDAD AUTÓNOMA DE NUEVO LEÓN

FACULTAD DE INGENIERÍA MECÁNICA Y ELÉCTRICA

DIVISIÓN DE ESTUDIOS DE POSGRADO

CARACTERIZACIÓN DEL TRÁNSITO VEHICULAR A TRAVÉS DEL

PROCESAMIENTO DE INFORMACIÓN DE IMÁGENES DE VIDEO

POR

FIDENCIO SÁNCHEZ RUEDA

TESIS

EN OPCIÓN AL GRADO DE DOCTOR EN INGENIERÍA CON ORIENTACIÓN

EN INGENIERÍA DE SISTEMAS

SAN NICOLÁS DE LOS GARZA, N. L., JULIO DEL 2008

iii

Universidad Autónoma de Nuevo León Facultad de Ingeniería Mecánica y Eléctrica

División de Estudios de Posgrado

Los miembros del Comité de Tesis recomendamos que la tesis

“Caracterización de flujo vehicular a través del procesamiento de información de

imágenes de video”, realizada por el alumno Fidencio Sánchez

Rueda_____________________ con número de matrícula 172533 sea aceptada para

su defensa como opción al grado de Doctor en Ingeniería con Orientación en

Ingeniería de Sistemas.

El Comité de Tesis

_______________________________

Dr. César Emilio Villarreal Rodríguez

Asesor de Tesis

_____________________________ ___________________________

Dra. Ada Margarita Álvarez Socarrás Dr. Arturo Berrones Santos

Revisor Revisor

_____________________________ ___________________________

Dr. Igor S. Litvinchev Dr. Fernando López Irarragorri

Revisor Revisor

________________________________

Dr. Guadalupe Alan Castillo Rodríguez

División de Estudios de Posgrado

Ciudad Universitaria, a 2 de Julio del 2008

DEDICATORIA

Con todo cariño dedico este estudio a todos los que con su apoyo, me impulsaron

a llegar a mi meta por tanto tiempo buscada:

A mis padres (†),

A mis hermanos y mis sobrinos,

A mi esposa y a mis hijos,

A mis maestros,

A mis amigos,

A mis compañeros de trabajo,

A mis compañeros de clase,

A todos los que se interesaron por mis avances…

AGRADECIMIENTOS.

El autor desea dar las gracias a los integrantes del Comité de Tesis, por su

decidido apoyo en la conclusión de este trabajo, así como al equipo de profesores del

Programa de Postgrado en Ingeniería de Sistemas por sus importantes observaciones

en el desarrollo de la tesis; en especial, a la Doctora Elisa Schaeffer pues gracias a su

decidido apoyo y confianza ha sido posible llegar a esta meta, sin olvidar al Dr. César

Villarreal y al Dr. Arturo Berrones, que semana a semana estuvieron al pendiente del

avance del trabajo desarrollado; asimismo expreso mi sincero agradecimiento a la

Universidad Autónoma de Nuevo León y al Consejo Nacional de Tecnología por la

beca concedida para la realización de mis estudios; así como al Sistema Integral del

Transporte Metropolitano (SINTRAM) por sus valiosas aportaciones, al Centro de

Calidad Ambiental y a la Dirección de Informática del ITESM, y a la Preparatoria

número 16 de la UANL. No podría olvidar agradecer a mis padres Porfirio (†) y María

Ruperto (†) y a mis hermanos Fernando (†), María Isabel (†), María del Refugio,

Antonio, María de la Paz, Martha Patricia y particularmente a mi hermana Irma

Guadalupe, quienes en diferentes etapas me apoyaron, impulsaron y motivaron para

salir adelante. Agradezco profundamente a mi esposa Francisca y a mis hijos Daniel

Adrián, Jocksan Alejandro, Gilberto Mario, Juan Arturo y Felipe de Jesús por la

paciencia que han tenido en el transcurso del desarrollo de mis estudios doctorales.

Finalmente, también expreso mi agradecimiento a todos mis compañeros de trabajo así

como a mis amigos, que siempre estuvieron al pendiente de mis estudios en PISIS.

También, deseo expresar mi agradecimiento al Instituto Tecnológico de Nuevo

León por las facilidades otorgadas para la escritura de esta tesis, y al Lic. Virgilio

Mena Becerra, Director de Desarrollo Laboral y Social del grupo FEMSA, por el

apoyo brindado para la culminación de este estudio.

Tampoco podría olvidar expresar mi agradecimiento a Dios por haberme

permitido lograr esta meta que me había propuesto desde hace muchos años y me

brindó la oportunidad y los medios para llegar a ella.

vi

PREFACIO.

Este trabajo es el fruto de una larga etapa de selección de mi tema de tesis, en

la cual estuvieron contemplados cuatro diferentes temas. Cuando inicié en el Programa

de Postgrado en Ingeniería de Sistemas (PISIS) presenté como anteproyecto ''La

elaboración de un método para la optimización del programa de corte de materia

prima'', el cual posteriormente fue descartado debido a que después de algunas

investigaciones se llegó a la conclusión de era un problema muy estudiado y no tenía

mucha área de oportunidad.

Más tarde, empecé a trabajar en la investigación sobre la metaheurística

Búsqueda Dispersa (Scatter Search) en la cual dediqué bastante tiempo haciendo

investigación bibliográfica y de la cual preparé una plática para presentar en clase de

Optimización de Flujo en Redes, logrando un avance considerable en esta dirección.

Después, se me sugirió trabajara en el tema ''Optimización en Tiempo Real'',

ya que se requería para participar en el desarrollo de un proyecto del área de Ingeniería

Eléctrica. Me dediqué a buscar información y encontré que los conceptos que se

manejaban no eran lo suficientemente claros, por lo que cuando me tocó el turno de

presentar una plática del tema en un seminario del PISIS, me pareció una experiencia

desagradable pues creo que no tenía la información necesaria para contestar las

preguntas que se plantearon.

Mi sentir en esos momentos era que realmente no tenía un tema de tesis bien

definido y firme, por lo que me enfoqué a buscar algo que fuera más práctico y

relacionado con los temas y experiencias que anteriormente ya había trabajado. Para

esto me entrevisté con el Dr. César Villarreal, planteándole la problemática en la que

me encontraba y solicitándole su apoyo para sacar adelante mi tema de tesis. Él me

sugirió trabajar en un problema de monitoreo de tránsito de coches en un tramo de

ciertas calles del Área Metropolitana de Monterrey; y yo le propuse agregarle la parte

de contaminación del ambiente, tratando de adaptarla a mi tema de tesis de Maestría.

Así empecé a documentarme en este tema y a empezar a darle forma al proyecto,

estableciendo contacto con el SINTRAM, el Departamento de Protección Ambiental

vii

del Tecnológico de Monterrey, así como otras dependencias del Gobierno del Estado

y la empresa privada SEMEX, encargada del diseño y colocación de los semáforos.

Después, se me invita a participar en un proyecto del Instituto de Ingeniería

Civil que consistía en el conteo de vehículos por trayectoria en una intersección, en el

que accedí a entrar por considerarlo muy relacionado y adecuado para mi proyecto que

en ese momento ya estaba manejando.

Desafortunadamente, encontré que no estaba obteniendo la información que yo

necesitaba para el avance de mi tesis, por lo que determinamos trabajar en forma

independiente, como inicialmente lo habíamos planteado, con el enfoque solo de

desarrollar el algoritmo para la detección de los coches en movimiento, su seguimiento

y su conteo por trayectoria en una intersección, con lo cual se cumpliría con los

objetivos planteados para mi tesis y los del Instituto, por lo cual no había

contraposición, sólo en la forma de trabajar.

De esta manera, y con esta idea preparé la presentación de mi propuesta de

tesis formal al Comité de Tesis, a la cual se le denominó ''Desarrollo de un algoritmo

para procesamiento de información de imágenes para la detección del movimiento de

coches, seguimiento y conteo por trayectorias en una intersección'', del que emanaron

una serie de sugerencias.

Continué con mi preparación para desarrollar el tema, enfocado al estudio de la

Visión Computacional, pues había encontrado que en esta disciplina existían

algoritmos muy adecuados para aplicarlos en la solución de este problema.

Actualmente, me permito manifestar y reafirmar mi mejor intención de lograr

una preparación académica que me permita ofrecer un mejor desempeño en lo

académico y en los proyectos de investigación que se me confieran, para beneficio de

las generaciones actuales y las que están por venir.

Primavera del 2008.

viii

RESUMEN

Fidencio Sánchez Rueda

Candidato a Doctor en Ingeniería con Orientación en Ingeniería de Sistemas

Facultad de Ingeniería Mecánica y Eléctrica

Universidad Autónoma de Nuevo León.

Título del estudio: Caracterización del tránsito vehicular a través del

procesamiento de imágenes de video.

Número de páginas: 118.

Objetivos y métodos de Investigación.

Este estudio se enfoca al análisis de la información obtenida a través de la

observación de imágenes de video de tres puntos seleccionados de avenidas del Área

Metropolitana de Monterrey, para calcular los valores de tres de las variables utilizadas

en el diagrama fundamental de la teoría de tránsito, que relaciona las variables flujo,

densidad y velocidad.

La razón del estudio es la preocupación que surge ante los problemas de tránsito

que enfrenta la ciudad de Monterrey y la idea es a través de esta investigación

identificar relaciones de causa a efecto que proporcionen información para apoyar la

planificación y la toma de decisiones relacionadas con la infraestructura vial.

La metodología utilizada es totalmente manual, pero simultáneamente se

desarrolla un modelo para automatizar la obtención de los valores de nuestras variables

de interés; desafortunadamente, la parte de automatización no se concreta por enfocar

el esfuerzo directamente a la parte manual o visual. Adicionalmente, se desarrolló un

simulador para verificar el funcionamiento del modelo de detección automática.

ix

Los resultados obtenidos en forma manual son procesados y graficados,

efectuando los análisis necesarios para llegar a conclusiones importantes de acuerdo a

los objetivos planteados.

Adicionalmente a la caracterización por medio de las variables flujo, densidad y

velocidad, se introduce otra variable que se ha considerado de gran importancia en el

comportamiento del tránsito vehicular: los cambios de carril.

El análisis efectuado nos conduce a comprobar que efectivamente los cambios de

carril tienen una influencia directa en el tránsito.

Recientemente, varios investigadores han desarrollado diferentes tipos de

modelos en los cuales consideran los cambios de carriles y se encuentran resultados

interesantes.

En nuestra investigación, se calculan los valores de los cambios de carril en los

mismos rangos de tiempo en los que se calculan las tres variables mencionadas, y se

realiza el análisis del comportamiento del tránsito considerando el flujo contra cambios

de carril, densidad contra cambios de carril y velocidad contra cambios de carril,

obteniéndose importantes conclusiones.

Contribuciones y conclusiones.

Este proyecto de investigación tiene una serie de contribuciones de carácter

social, económico, tecnológico, seguridad y científico.

En el aspecto social, por el impacto que tiene en la mejora de la calidad de vida

de los conductores al contar con una vialidad más fluida, pues si bien este proyecto no

conduce directamente a ese logro, sí pretende apoyar las decisiones en ese sentido.

En el aspecto económico, apoyará la toma de decisiones para la inversión de los

recursos públicos en una infraestructura vial más de acuerdo a las necesidades viales.

En el aspecto tecnológico, porque se aplican técnicas modernas de Ciencias

Computacionales, particularmente de visión computacional, en el desarrollo de un

modelo para la detección automatizada de vehículos en movimiento y su conteo.

x

En cuestiones de seguridad, pues la infraestructura generada como

consecuencia de apoyo en la toma de decisiones, será un elemento importante en el

incremento de la seguridad de los conductores y de los peatones, sin contar el apoyo en

el seguimiento a vehículos de interés para las autoridades.

Finalmente, en el aspecto científico se realiza un importante análisis de las

interrelaciones de las variables clásicas de la teoría de tránsito con una nueva variable

que representa los cambios de carriles y que según la literatura no ha sido

suficientemente estudiada, lográndose conclusiones importantes.

Por otro lado, es importante también señalar que se está aportando el diseño de

un modelo automatizado para el análisis de los videos y un simulador de tránsito, éste

último desarrollado por la Doctora Elisa Schaeffer en Java.

FIRMA DEL ASESOR: _______________________________________

Dr. César Emilio Villarreal Rodríguez.

xi

Indice

PREFACIO................................................................................................................. vi

RESUMEN ............................................................................................................... viii Objetivos y métodos de Investigación............................................................................................. viii Contribuciones y conclusiones. ..........................................................................................................ix

CAPÍTULO 1 ............................................................................................................... 1

INTRODUCCIÓN ....................................................................................................... 1

1.1 Objetivos del proyecto...................................................................................................1

1.2 Hipótesis..........................................................................................................................4

1.3 Justificación. ...................................................................................................................4

1.4 Metodología. ...................................................................................................................5

1.5 Contribución...................................................................................................................6

1.6 Estructura de la tesis. ....................................................................................................7

CAPÍTULO 2 ............................................................................................................... 9

ANTECEDENTES GENERALES.............................................................................. 9

2.1 Visión Computacional. ..................................................................................................9 2.1.1 Origen.....................................................................................................................................9

2.1.2 Dispositivos de adquisición de imágenes. ................................................................................12 2.1.3 Elementos de un sistema de procesamiento de imágenes. .......................................................14

2.2 Geometría de imágenes. ..............................................................................................16 2.2.1 Importancia de la perspectiva en el procesamiento de imágenes. ...........................................16 2.2.2 Tipos de perspectiva..................................................................................................................16

2.3 Métodos de procesamiento de imágenes. ..................................................................19 2.3.1 Representación digital de la imagen.........................................................................................20 2.3.2 Almacenamiento de imágenes. .................................................................................................20 2.3.3 Restauración y mejora de imágenes .........................................................................................23 2.3.4 Segmentación. ...........................................................................................................................26

2.3.4.1 Métodos de segmentación.................................................................................................28 2.3.5 Sustracción de Fondo................................................................................................................34 2.3.6 Distintos tipos de transformadas aplicadas a imágenes. ..........................................................38 2.3.7 Transformada de Hough. ..........................................................................................................39

2.4 Teoría de tránsito.........................................................................................................42 2.4.1 Antecedentes. ............................................................................................................................42

2.4.2 Modelos de Tránsito. ....................................................................................................42

CAPÍTULO 3 ............................................................................................................. 46

DETECCIÓN Y CONTEO DE CAMBIOS DE CARRILES. ................................... 46

3.1 Antecedentes del problema.........................................................................................46

3.2 Trabajo Relacionado. ..................................................................................................46

xii

3.3 Justificación. .................................................................................................................48

3.4 Solución Propuesta. .....................................................................................................49 3.4.1 Condiciones del entorno de los videos. ....................................................................................49 3.4.2 Detección de coches en movimiento. .......................................................................................49 3.4.3 Descripción de la solución propuesta. ......................................................................................50

CAPÍTULO 4 ............................................................................................................. 53

EXPERIMENTOS..................................................................................................... 53

4.1 Análisis por conteo manual. .......................................................................................53 4.1.1 Resultados del análisis del tramo de Constitución a la altura de Gonzalitos, dirección Puente Atirantado a Monterrey. .....................................................................................................................54 4.1.2 Análisis del Tramo Constitución-Venustiano Carranza a la altura de la Loma Larga............63 4.1.3 Análisis de la avenida José Eleuterio González(Gonzalitos)...................................................67

CAPÍTULO 5 ............................................................................................................. 74

CONCLUSIONES. .................................................................................................... 74

5.1 Resultados.....................................................................................................................74

5.2 Trabajo futuro. ............................................................................................................75

APÉNDICE A.- SINTRAM....................................................................................... 77

APÉNDICE B. Código .............................................................................................. 82

APENDICE C. Herramientas.................................................................................... 87

C.1 Herramientas de procesamiento de las secuencias de imágenes. ..............................87

C.2 Conceptos clave del conjunto de bloques.....................................................................89

APÉNDICE D.- Modelo. ........................................................................................... 95

GLOSARIO ............................................................................................................... 98

BIBLIOGRAFÍA ..................................................................................................... 100

FICHA AUTOBIOGRÁFICA................................................................................. 106

1

CAPÍTULO 1

INTRODUCCIÓN 1.1 Objetivos del proyecto.

El campo del tratamiento digital de imágenes es, sin duda, un tema muy

interesante que ha sido estudiado y trabajado desde hace mucho tiempo, por lo cual ha

merecido un avance considerable en este campo y las disciplinas relacionadas. En la

actualidad el acceso a las imágenes digitales y a las imágenes por computadora, ha

traído como consecuencia un gran crecimiento, de tal forma que, actualmente es

relativamente fácil tener acceso a las herramientas necesarias, tanto de hardware como

de software, para trabajar con las imágenes cosa que hace unos años no era tan

alcanzable.

En la presente investigación se aplican algunas de las técnicas del tratamiento

digital de imágenes, en el diseño de soluciones al problema que se está planteando.

Las grandes ciudades enfrentan diferentes tipos de problemas debido

esencialmente a la gran cantidad de habitantes que poseen. Uno de ellos es

precisamente el control del tránsito de vehículos en los diferentes sectores que

conforman el área urbana y suburbana.

Diariamente aparecen en los medios de comunicación, ya sean prensa, radio o

televisión, que en tal o cual parte de la ciudad hay mucho congestionamiento y que se

recomienda tomar rutas alternas para evitar esa parte donde hay amontonamiento de

vehículos por diferentes circunstancias. Particularmente, la radio y la televisión aportan

un excelente apoyo en el esfuerzo que se realiza para controlar eficientemente el

tránsito buscando las consecuencias mínimas al informar en tiempo real la situación

del tránsito en las diferentes avenidas.

Sin embargo, observamos que existen muchas áreas de oportunidad en este

sentido, empezando por la educación de los conductores.

2

El crecimiento del parque vehicular ha sido consecuencia natural del

crecimiento demográfico y de la complejidad de las actividades humanas.

En el área metropolitana de la ciudad de Monterrey el problema del tránsito se

torna aún más fuerte por su tamaño y la cantidad de vehículos que la conforman, esto

sin contar con otros problemas de contaminación y la serie de problemas de salud que

ésta trae consigo.

A nivel mundial, el 86% de los vehículos se localizan en ciudades

industrializadas [36]. En 1994, 43 áreas urbanas tenían más de un millón de habitantes.

En 2010, se estiman 52 áreas urbanas con más de un millón. En 1950, había 53

millones de vehículos, mientras que en 1990, se estimaron 430 millones lo cual

significa un crecimiento aproximado del 800%.

En lo que se refiere a la población del Área Metropolitana de Monterrey, en

1990 era de 2´627,000 y 3´426,000 al final de esa década, como se muestra en la

gráfica 1.

2,627,000

3,426,000

4,000,000

0

500000

1000000

1500000

2000000

2500000

3000000

3500000

4000000

4500000

1990 1999 2008

Población

Gráfica 1. Crecimiento de la población de Monterrey

En el año 2003 la flota de vehículos en el Área Metropolitana de Monterrey era

de 1´121,333 vehículos, entre privados, transporte público y vehículos foráneos

registrados en el estado; incluía 200,000 vehículos legalizados entre 2001 y 2002.

3

La flota actual tiene un alto porcentaje de vehículos viejos. Se estima que

200,000 vehículos viejos procedentes de EE. UU. fueron introducidos entre el año

2000 y 2001, cuyas condiciones mecánicas se desconocen.

La grafica 2 muestra el número de vehículos en la ciudad de Monterrey y su área

metropolitana en los años 2003 y 2006

Vehículos

1,121,333

1,400,000

0

200000

400000

600000

800000

1000000

1200000

1400000

1600000

2003 2006

Figura 2. Número de vehículos en los años 2003 y 2006

En este proyecto nos vamos a limitar a estudiar el problema del tránsito

vehicular, ya que consideramos que este problema se ha vuelto cada vez más crítico a

medida que núcleos urbanos han ido creciendo y es necesario contar con modelos de

control de tránsito vehicular más eficientes, además de que es un problema complejo

en el cual intervienen muchas variables, para lo cual es conveniente efectuar un

análisis cuidadoso y que en un momento dado se puedan contar con soluciones

óptimas al control de tránsito vehicular.

Generalmente los problemas de tránsito son generados por factores relacionados

con la forma de manejar del automovilista debido a diferentes hechos tales como prisa

por llegar tarde a su destino, generalmente a los centros de trabajo, cambios repentinos

de carril, manejo a exceso velocidad o a velocidad muy lenta en bulevares de cierta

velocidad máxima, falta de experiencia y precaución al manejar, todo esto ocasionando

accidentes de tránsito o altas probabilidades de que ocurran por el congestionamiento

4

de los mismos, molestias a los automovilistas por sus retrasos, por estar esperando o

por la lentitud en el avance.

1.2 Hipótesis.

Este análisis está fundamentado en la hipótesis de que los problemas de

tránsito vehicular se deben principalmente a los estilos de manejo y conductas de los

conductores [16], principalmente al momento de decidir modificar sus rutas cuando

van en plena vía de alta velocidad, o incluso en vías de velocidad normal, lo cual trae

como consecuencia que en forma repentina traten de cambiar de carril, provocando

también cambios de velocidad repentinos de los automovilistas que están cerca. En

vías de alta velocidad esto provoca una rápida congestión de vehículos precisamente

debido a la velocidad que traen y hacen que rápidamente se vayan amontonando

coches en la zona donde se está produciendo este evento de cambio de carril;

adicionalmente a esto hay un incremento en la probabilidad de un accidente, choque,

entre los vehículos involucrados ya sea al atravesarse repentinamente en la trayectoria

de los vehículos que circulan en el carril a donde se desean pasar o bien por alcance

entre los coches de diferentes carriles.

Por otro lado, es conveniente analizar el comportamiento del tránsito vehicular

en función de la teoría del tránsito vehicular [16,17, 27] , para saber las interrelaciones

entre ellas y como influyen en dicho comportamiento, de tal manera que sea posible

determinar en una forma realista un plan de desarrollo de la infraestructura urbana de

avenidas, puentes, pasos a desnivel, semaforización y en general todos los aspectos

relacionados con el tránsito de vehículos, de tal manera que las autoridades

responsables de su administración puedan contar con una herramienta que les facilite

la toma de decisiones.

Uno de los objetivos principales de nuestro estudio es investigar los cambios de

carril ya que es otra de las variables que deben ser consideradas en el comportamiento

del tránsito vehicular, pues hay una relación directa con las variables que intervienen,

como son el flujo, la densidad y la velocidad.

1.3 Justificación.

5

Es importante contar con una metodología mediante la cual sea posible

obtener la información de las variables que caracterizan el tránsito vehicular tanto en

forma manual como automática, de manera que se puedan estimar los parámetros que

se utilizan en los modelos que se diseñan para la caracterización del tránsito vehicular.

De acuerdo a la hipótesis planteada, esta investigación está enfocada al

análisis y caracterización del movimiento de los vehículos en una vía, en la que como

se explicó anteriormente, los estilos y conductas de los choferes provocan problemas

de distinta índole, principalmente debido a los cambios repentinos de carril, obligando

a los otros conductores a frenar también repentinamente y generando los

congestionamientos y la mayoría de las veces accidentes que pueden ser fatales.

1.4 Metodología.

La metodología que se presenta tiene dos etapas fundamentales; la primera, está

enfocada a la obtención en forma manual de la información de los valores promedio de

las variables que describen el comportamiento del tránsito vehicular, a través del

análisis y observación directamente de los videos, de tal manera que faciliten el

análisis del mismo, así como su interpretación con el apoyo de la información

recopilada y analizada, la cual posteriormente es comparada con la que se obtiene del

modelo de detección automática.

Esta metodología está basada en el procesamiento de las imágenes obtenidas por

medio de las cámaras de monitoreo vial del SINTRAM, dependencia oficial del

gobierno del Estado de Nuevo León, encargada del monitoreo y operación del Sistema

de Transporte en el Área de Monterrey, así como de otras grabaciones realizadas en

forma independiente.

En la segunda etapa, las imágenes obtenidas de las cámaras son convertidas a

formato digital para procesarse en la computadora, donde sirven de entrada a las

funciones de MATLAB, un lenguaje de programación de tipo científico cuyos

elementos esenciales son matrices (MATrix LABoratory) y que cuenta con una serie

de módulos orientados a diferentes aplicaciones científicas y de ingeniería. Entre los

módulos de Matlab se cuenta SIMULINK, una herramienta para el desarrollo de

6

modelos de simulación, el cual será utilizado para el procesamiento de las secuencias

de imágenes.

El análisis realizado se centra en una de las vías de mayor tránsito como es el

boulevard Constitución, por considerarse más representativo del problema que nos

ocupa, sin embargo, la aplicación de esta metodología es posible en cualquier avenida,

así como la aplicación del modelo de detección automática, una vez realizados los

ajustes de los parámetros en forma adecuada.

1.5 Contribución.

El desarrollo de esta investigación contribuye en los diferentes aspectos:

a).- Social.

- Proporcionará información que apoyará la toma de decisiones sobre la

construcción de complejos viales, lo cual ayudará en la agilización del tránsito y

consecuentemente el ciudadano llegará más rápido a su destino.

- Al contar con información del flujo vial en forma automatizada y confiable,

apoyará en el diseño de las redes viales, logrando un tránsito vehicular más fluido.

b).- Económico.

- Al proporcionar la información del flujo vehicular en los diferentes puntos

donde se aplique la metodología, apoyará los procesos de planeación de la

infraestructura vial y facilitará la toma de decisiones sobre las inversiones en la

construcción de complejos viales, puentes peatonales, instalación de semáforos.

c).- Tecnológico.

- Dada la necesidad de contar con procedimientos automatizados, surge la

necesidad de la aplicación de tecnología de vanguardia en el monitoreo vehicular, al

emplear herramientas y dispositivos electrónicos que capturan información de

imágenes, las convierten a forma digital, las transmiten, almacenan, procesan, facilitan

la toma de decisiones y determinar señales de ajuste y control en los semáforos, y al

apoyar a los responsables del sistema de transporte para alertar a los conductores.

7

d).- Seguridad.

La información proporcionada por este sistema facilitará a los responsables la

implementación de mecanismos, tales como recomendaciones confiables a través de

los medios de comunicación, diseño y aplicación de planes de contingencia, que

ayuden a minimizar los accidentes viales e incrementar las seguridad vial en las

diferentes vías del área metropolitana de Monterrey.

d) Científico.

- Desde el punto de vista científico, la contribución es que se contará con un

algoritmo en el que se utilizan técnicas de visión computacional, que efectúa la

detección vehículos en movimiento, permita caracterizar el movimiento de los

vehículos a través de las variables flujo, densidad y velocidad, así como el análisis de

los cambios de carril y sus consecuencias.

- Permite contar con una herramienta, mediante la cual se obtendrán las variables

uqe describen el comportamiento del tránsito vehicular, con lo cual permitirá y

facilitará el análisis de su comportamiento en las diferentes avenidas e intersecciones

del Área Metropolitana de Monterrey.

1.6 Estructura de la tesis.

Este documento de tesis está estructurado de la siguiente manera: en este

capítulo se describe cual son los objetivos y la motivación para su desarrollo, así como

su contribución e impacto; en el capítulo dos se hace una revisión del marco teórico en

el que se fundamenta la investigación y el desarrollo del proyecto; se describen las

distintas metodologías y algoritmos utilizados en la implementación de la solución; en

el capítulo tres se hace una descripción del problema de detección y conteo de los

cambios de carriles en carretera, dando una explicación resumida de sus antecedentes

los cuales ya fueron descritos en el capítulo uno; también se hace una revisión de los

trabajos desarrollados y relacionados con el problema que nos ocupa.; en el capítulo

cuatro se describen los distintos procesos desarrollados para llegar a la solución del

problema y se presentan los resultados encontrados; en el capítulo cinco se presentan

las conclusiones de la investigación, haciéndose una evaluación de la solución donde

8

se mencionan los hallazgos en cada experimento realizado, así como un comparativo

con los resultados obtenidos.

Adicionalmente, se establecen las áreas de oportunidad detectadas para el

trabajo futuro, así como recomendaciones para los interesados en continuar

investigando sobre este tema.

9

CAPÍTULO 2

ANTECEDENTES GENERALES. 2.1 Visión Computacional.

Una herramienta muy importante para el desarrollo de proyectos de

automatización de análisis de escenas a través de secuencias de videos es la visión

computacional [49]. En este capítulo se presentan los conceptos más importantes de

esta importante rama del conocimiento, lo cual es básico para el desarrollo del

proyecto de investigación.

2.1.1 Origen.

Existen en la literatura muchas definiciones de Visión Computacional, también

llamada visión de máquina y visión artificial.

El objetivo de la visión computacional [10,43] es obtener las imágenes del

mundo, realizar un proceso de identificación y reconocimiento y tomar las decisiones y

acciones adecuadas a la situación particular que se presenta.

De acuerdo con esto, se pretende realizar las mismas funciones que realiza la

visión humana: a través del ojo recibe las imágenes, las procesa a través de la retina,

las envía al nervio óptico y éste las envía al cerebro, quien finalmente identifica el

objeto u objetos que conforman la imagen e interpreta su significado y toma las

decisiones necesarias en su caso.

La diferencia entre las dos formas es obvia: El sistema de visión humano consta

de millones de elementos, los llamados conos y bastones, que son los que se encargan

de procesar la información de las imágenes que reciben del mundo exterior y envían al

cerebro las señales correspondientes a través del nervio óptico.

10

Esta diferencia por supuesto, es producto de la evolución de la especie humana

desde su aparición sobre la tierra, por lo que va a ser un esfuerzo considerable y de más

largo plazo para poder siquiera acercarse un poco a su capacidad de visión en forma

artificial.

Aún así, y a pesar de la extraordinaria capacidad, no debemos pasar por alto que

nuestro sistema de visión humano no está exento de fallas, como se muestra en muchos

ejemplos, algunos de los cuales se observan en la figura 2.1.

a) b)

Figura 2.1.- La visión humana [4], no es infalible como se puede observar en estos ejemplos.

<>

><

<>

><

a) La espiral de Frasier. Lo que parece una espiral son círculos concéntricos; en b) el rostro de una joven y el de una anciana.

c) Dos segmentos de línea de longitud diferente, ideado por Franz Müller-Lyer en 1889.

d) Cuadrado con lados aparentemente distorsionados.

11

Así como estos existen muchos otros ejemplos de ilusiones ópticas debido a la

tendencia del cerebro de seguir ciertos patrones, lo cual lo lleva a interpretar imágenes

en forma errónea.

El surgimiento de la visión artificial tiene lugar a partir de los estudios de D.

Marr [32], que redefine y revitaliza el estudio de la visión humana y de máquina. Marr

en su propuesta presentó una metodología para el procesamiento de la información de

la imagen que se percibe. Esta metodología consta de tres niveles que son los

siguientes:

El Nivel ,2D llamado también esbozo primitivo, es una estructura que distingue

los rasgos básicos presentes en la imagen (bordes, líneas, arcos, manchas).

El Nivel ,2

12 D consiste de la construcción de las superficies que forman parte

de la imagen vista por el observador, utilizando la información proporcionada por el

esbozo primitivo y la información tridimensional estereoscópica, sombreado,

reflectancia, iluminación.

El Nivel ,3D es la construcción del modelo para representar los objetos en el

espacio, lo cual permitirá clasificarlos y compararlos con información previamente

almacenada.

Tenenbaum y Barrow (1976) presentaron una propuesta similar donde

consideraron modelos en los que el proceso de transformación de la información está

definido por un ciclo en el que intervienen los datos observados y un proceso dirigido

por la información ya conocida tratando de ajustar las observaciones a esta

información.

Un punto de interés en el terreno de la investigación se refiere a la forma en la

cual la información pasa del más bajo nivel (donde no hay carga semántica) al nivel

más alto (alta carga semántica) o sea, es necesario definir cuál es el proceso para pasar

la información medida a información simbólica con un alto nivel semántico.

12

Sobre este último punto, ha habido estudios recientes y propuestas sobre como

podría realizarse este proceso, en particular los trabajos de Terzopoulos (1983,1988) y

Blake y Zisserman (1987) sobre construcción de superficies y otros basados en

modelos de segmentación que utilizan campos aleatorios markovianos.

Los trabajos desarrollados a partir de las teorías de Marr y sus colaboradores, ha

dado origen a esta nueva especialidad que se denomina Visión Computacional, la cual

trata de explicar los mecanismos de cálculo de la visión humana mediante

procedimientos y métodos de la teoría matemáticas de procesamiento de información.

Dado lo anterior, podemos considerar la visión computacionalcomo una

disciplina con mucho potencial de desarrollo y con posibilidades muy diversas, ya que

por supuesto los problemas de visión computacional son de diferente índole y por lo

tanto se han diseñado muchos métodos diferentes para resolver los problemas que se

han ido presentando para resolver cuestiones muy particulares. Estas mismas

metodologías desarrolladas han servido como base para resolver otros problemas y así

sucesivamente.

2.1.2 Dispositivos de adquisición de imágenes.

Existen diferentes tipos de dispositivos de captación de imágenes; algunos están

equipados con lentes y otros no. Los primeros modelos de la cámara obscura inventada

en el siglo 16 no tenían lentes, pero en su lugar constaba de un hoyo para enfocar los

rayos de luz en una pared o placa transparente para demostrar las leyes de perspectiva

descubiertas un siglo antes por Brunelleschi. Posteriormente los hoyos fueron

remplazados por lentes cada vez más sofisticados, la cámara fotográfica moderna o

digital es esencialmente una cámara obscura con la capacidad de registrar la cantidad

de luz que incide en el área de su plano posterior.

Cámaras CCD.

La cámara CCD (Charge Coupled Device) es un sensor de imagen que utiliza

elementos semiconductores fotosensibles en forma de arreglos matriciales, en el cual

los receptores activos de este arreglo son distribuidos en píxeles individuales. En un

sensor CCD se transforma le energía de la luz incidente en energía eléctrica. La carga

13

eléctrica almacenada en la celda posteriormente se transporta mediante un registro

de desplazamiento (shift register) para conformar una señal de video. En las cámaras

CCD se discretiza la imagen en pixeles, sin embargo el valor de la carga eléctrica

almacenada en cada celda no se digitaliza en el arreglo CCD sino en una conversión

posterior realizada por un convertidor análogo-digital.

Las cámaras CCD son consideradas como dispositivos que poseen una muy baja

deformación geométrica de la imagen, una muy buena sensibilidad a la luz y una muy

buena resolución, llegando típicamente a los 400,000 pixeles. El tiempo de captura de

la imagen es típicamente en el rango de 1/60 s y 1/10000 s.

La formación geométrica de la imagen se considera como una transformación de

las coordenadas yx, en un nuevo sistema de coordenadas vu, .Para esta

transformación se consideran básicamente cuatro aspectos:

1.- Cambio de escala: Las coordenadas de una imagen están expresadas en

unidades métricas distintas a las utilizadas en el mundo real. Generalmente la imagen

se expresa en pixeles y el espacio 3D en milímetros, por lo que es necesario utilizar un

factor de escala, además, dado que los píxeles no son cuadrados sino rectangulares, el

factor de escala es distinto para cada eje de la imagen. Los factores de escala son

expresado en pixeles/Mm.

2.- Traslación del origen. Se introducen las variables ),( 00 yx para denotar el

punto principal de la imagen en el nuevo sistema de coordenadas, es decir

00 , vvuu == corresponden al punto 0,0 == yx .

3.- Rotación de los ejes. Los ejes yx, y los ejes vu, no tienen la misma

orientación. En la modelación de la cámara existen dos métodos: uno que considera un

ángulo θ de rotación y otro que asume que este ángulo es cero y que el ajuste debe

hacerse en los ejes X, Y, Z del sistema de coordenadas 3D. En este segundo método el

eje Z sigue siendo el eje óptico de la proyección y los ejes yx, siguen siendo paralelos

a los ejes X, Y; sin embargo se hace coincidir, mediante una rotación del eje Z, la

orientación de los ejes yx, con los ejes vu, .

14

4.- Factor de torcimiento. En muchos casos, los ejes vu, no son ortogonales

debido a que los pixeles en los arreglos no son rectangulares. En este caso es necesario

introducir al modelo de la cámara un factor de torcimiento (inglés: skew factor) s . En

la mayoría de las cámaras s es cero.

Resumiendo los cuatro aspectos enunciados previamente y tomando en cuenta

que la orientación de vu, y yx, es la misma, tenemos que la transformación de

coordenadas quedaría definida por la siguiente ecuación matricial:

=

1100

0

10

0

y

x

v

us

v

u

y

x

α

α

(2.1)

O bien,

Kmw = (2.2)

con [ ] [ ]TTyxmvuw 1,1 == y K es la matriz 3x3 en la ecuación 2.1 y es

conocida como la matriz de calibración de la cámara.

2.1.3 Elementos de un sistema de procesamiento de imágenes.

En la figura 2.2 se muestran los elementos que constituyen un sistema de

procesamiento de imágenes [41], los cuales se describen a continuación.

Adquisición de imágenes. Esta primera etapa requiere un sensor y la posibilidad

de digitalizar la imagen adquirida por el sensor. El sensor puede ser una cámara de

televisión, a color o monocromática, que provee una imagen del dominio del problema

en cuestión cada cierto intervalo de tiempo, normalmente cada 1/30 de segundo.

También puede ser una cámara de barrido de líneas que produzca una línea de la

imagen.

Preprocesado. Una vez digitalizada la imagen el paso siguiente es el

preprocesado. El objetivo del preprocesado o preprocesamiento es mejorar la imagen

de tal forma que el propósito final tenga una mayor posibilidad de éxito. Utiliza

técnicas que tratan de suprimir el ruido, mejorar el contraste y aislar las regiones que

por sus características nos ayuden a resolver el problema.

15

Segmentación. El objetivo de la segmentación o fragmentación es dividir la

imagen en partes que la constituyen u objetos que la conforman. Se considera uno de

los problemas más difíciles en el procesamiento de imágenes, pues una buena

segmentación nos facilitará la solución del problema de reconocimiento, mientras que

una mala segmentación nos producirá muchas fallas.

Representación y descripción. La salida del proceso de segmentación es una

imagen que contiene la frontera de la región o puntos de la misma. Se requiere

convertir los datos a una forma que sea apropiada para la computadora, por lo que es

necesario decidir si se va a utilizar la información por frontera o por regiones. Esta

decisión depende de la aplicación en particular.

La representación por frontera se utiliza cuando el objetivo se centra en

características de la forma externa como las esquinas o concavidades y convexidades.

La representación por regiones se utiliza cuando el interés es en propiedades

internas como la textura y el esqueleto.

Existen aplicaciones donde podrían utilizarse ambas representaciones. Sin

embargo, la representación es sólo una etapa del proceso de transformación de los

datos de entrada, pues adicionalmente es necesario especificar un método que se

encargue de extraer los datos que son relevantes para el problema en cuestión. La

descripción, llamada también selección de características, se encarga de extraer las

características que proporcionan información de interés o que son básicas para poder

diferenciar un objeto de otro.

Reconocimiento e interpretación [12, 13, 45]. Este es el último paso en el

procesamiento de imágenes. El reconocimiento es un proceso que asigna una etiqueta a

cada objeto basado en la información de los descriptores. La interpretación asigna un

significado a los objetos reconocidos y permite dar significado a la escena que se está

analizando.

Base de conocimientos. El conocimiento sobre el dominio del problema es

codificado en la base de conocimiento. Este conocimiento puede consistir en explicar a

detalle cuales son las regiones de la imagen donde la información de interés se

16

encuentra, lo cual ayuda a enfocar la búsqueda a los objetos que son de interés para

la aplicación.

Figura 2.2 Elementos de un sistema de procesamiento de imágenes.

2.2 Geometría de imágenes.

Es importante saber como se forman las imágenes 2D a partir de las imágenes

tridimensionales, ya que esto permite entender los métodos de recuperación de

información tridimensional a partir de las imágenes. Dos cuestiones muy importantes

en la formación de imágenes es determinar la ubicación de la imagen de un punto dado

y qué es lo que determina la brillantez de una superficie.

2.2.1 Importancia de la perspectiva en el procesamiento de imágenes.

Para el procesamiento de imágenes en forma digital es muy importante la

perspectiva, pues debemos tener en cuenta que las imágenes del mundo real

(tridimensionales) son procesadas en un mundo bidimensional (2D), por lo que al

procesarlas es necesario saber como influye en la interpretación de la imagen del

mundo real a partir de la imagen en dos dimensiones.

2.2.2 Tipos de perspectiva.

Proyección en perspectiva.

BASE DE

CONOCIMIENTOS

Adquisición de imagen

Preprocesado

Segmentación

Representación

y descripción

Reconocimiento e

interpretación

Dominio del problema

17

En la figura 2.3, consideremos un agujero ideal a una distancia fija del plano

de la imagen, en la que se considera que solo la luz que viene del ojo de la aguja llega

al plano de la imagen. Como la luz viaja en línea recta, cada punto en la imagen

corresponde a una dirección particular definida por un rayo desde el punto a través del

ojo de la aguja. Sea el eje óptico la perpendicular al plano de la imagen que pasa a

través del ojo de la aguja. Colocamos un sistema de coordenadas cuyo origen coincide

con el ojo de la aguja y de tal manera que el eje z coincida con el eje óptico y orientado

hacia la imagen. De esta manera los puntos hacia los que observa la cámara tienen

componente z negativa.

Se desea calcular donde aparecerá la imagen P′ del punto P que está ubicado

sobre un objeto que está enfrente de la cámara, como se muestra en la Figura. No

existe ningún otro objeto entre el punto P y el ojo de la aguja.

Sea ),,( zyxr = t el vector que une P y O y ),,( zyxr ′′′=′ el que une O y P′ .

En la Figura se observa que el rayo PP ′ forma un ángulo α con el eje óptico,

por lo que podemos deducir que:

r

zrˆ)cos( −=α (2.3)

Donde z es un vector unitario en la dirección del eje óptico. Los puntos delante

de la cámara tienen componente z negativa, y también se cumple que

r

f ')cos( −=α (2.4)

Por lo tanto,

zr

r

f

r

ˆ'

'= (2.5)

Lo cual nos conduce, utilizando las coordenadas, a

18

z

x

f

x=

'

'

z

y

f

y=

'

'(2.6)

Figura 2.3 - Un agujero muy pequeño (ojo de aguja) O, a una distancia fija f del plano de proyección.

Proyección Ortográfica.

Consideremos la proyección de perspectiva donde el plano de la imagen se

encuentra en 0=z , el ojo de la aguja en fz = y el plano en zz = , con zf > .Las

ecuaciones de la proyección de perspectiva serían:

zf

x

f

x

−=

' y

zf

y

f

y

−=

' (2.7)

Con la z proyectada igual a cero en todos los casos.

Proyección de perspectiva débil.

Como se presentó en la sección anterior, la perspectiva “pinhole” es solamente

una aproximación de la geometría del proceso de imágenes. Aquí se presenta una

forma de aproximación más burda, llamada modelo de proyección afín, que también es

útil en ocasiones. Este tipo de aproximación se clasifica en otros dos modelos:

proyección de perspectiva débil y la proyección ortográfica, ya tratada anteriormente.

19

Como se muestra en la Figura 2.4, se tiene un plano ∏0definido por 0zz = .

Para cualquier punto P en ∏0la proyección en perspectiva se puede escribir como

myy

mxx

−=

−=

'

' (2.8)

con 0

'

z

fm −= (2.9)

Las restricciones físicas exigen que 0z sea negativo (el plano debe estar en frente

del pinhole), de tal forma que el factor de magnificación m asociado con el plano sea

positiva. Sean los puntos P y Q y sus imágenes P′ y Q′ , (Figura 2.4).Como

podemos observar los vectores >−−−

''QP y >−−−

PQ son paralelos y tenemos que

>−−−

''QP =>−−−

PQm .

Cuando la profundidad de la escena es pequeña respecto a la distancia promedio

desde la cámara, el factor de magnificación puede ser considerado constante. Este

modelo se proyección es llamado perspectiva débil o escalado.

Figura 2.4 Esquema de la proyección en perspectiva débil: todos los segmentos de

línea son proyectados con la misma magnificación.

2.3 Métodos de procesamiento de imágenes.

Q

P

Q’

P’

π0 π1

j

i

f’ -z0’

O k

20

Desde el inicio del procesamiento de información en forma digital ha existido

un creciente interés por el desarrollo de algoritmos que faciliten los procesos

implementados en la computadora; los en lo que se refiere a imágenes no ha sido la

excepción y muchos investigadores han enfocado sus esfuerzos en el diseño de

algoritmos para el procesamiento de imágenes por medio de la computadora.

2.3.1 Representación digital de la imagen

Una vez que una imagen es adquirida por medio de un dispositivo, es necesario

realizar un proceso de conversión al formato que la computadora maneja: el formato

digital.

Las escenas que se muestran en las secciones subsiguientes, donde aparecen

imágenes de vehículos, la mayoría fueron proporcionadas por el SINTRAM.

2.3.2 Almacenamiento de imágenes.

Al seleccionar un formato de almacenamiento de las imágenes digitales es

necesario considerar dos características fundamentales [19], como son la profundidad

del color y la compresión.

Cuando hablamos de la profundidad del color nos referimos al número máximo

de colores que puede tener una imagen en determinado formato. Para el número de

colores se requieren cierto número bits, por ejemplo para una imagen blanco y negro

(binaria) sólo se necesita un bit. Al principio las tarjetas de video sólo soportaban 16

colores, posteriormente hasta 256 y actualmente están en el orden de 16 millones de

colores.

Al hablar de compresión, se entiende si la imagen se va almacenar en forma

original o bien va a pasar por un proceso de compactación.

El compromiso entre comprimir o no comprimir una imagen no representa en

realidad problema alguno ya que el proceso de efectuar la compresión al grabarlas y

descomprimirlas cuando se leen no implica un tiempo considerable. Hay que

mencionar también que una imagen comprimida ocupa menos espacio.

21

En realidad el problema que se debe considerar es si es una compresión con

pérdida o sin pérdida.

El mecanismo de compresión con pérdida involucra un proceso de compactación

de la información de la imagen digital que trae como consecuencia pérdida de

información y consecuentemente pérdida de calidad de la imagen. El algoritmo de

codificación tiene como objetivo representar la información de la imagen utilizando

una menor cantidad de la misma, de manera que no es posible la reconstrucción exacta

de la imagen original. Este mecanismo por lo tanto sólo será útil cuando la

reconstrucción exacta no es necesaria para que la información tenga sentido, pues la

información reconstruida es solamente una aproximación de la original. La ventaja que

tienen son las altas tasas de compresión.

Las técnicas más comunes de compresión con pérdida son:

a) Por códecs de transformación: Los datos se transforman de manera que se

simplifican y no pueden regresar a los datos originales, y se crea un nuevo conjunto de

datos con altas tasas de compresión.

b).- Por códecs predictivos: los datos originales se analizan con el fin de poder

predecir su comportamiento, comparándose la predicción con la realidad, se codifica el

error y la información necesaria para la reconstrucción.

JPEG (Joint Photographic Experts Group) es un algoritmo diseñado para

comprimir imágenes con 24 bits de profundidad o en escala de grises. También se le

llama así al formato de los ficheros que utilizan este algoritmo de compresión de

imágenes JPEG se utiliza para imágenes fijas, pero también existe un estándar llamado

MPEG para videos. JPEG se abrevia algunas veces como JPG debido a que algunos

sistemas operativos sólo aceptan tres letras como extensión.

Los algoritmos de compresión sin pérdida son procedimientos de codificación

que representan la información sin utilizar una menor cantidad de la misma, lo cual

permite la reconstrucción exacta de los datos. La compresión sin pérdida es necesaria

cuando se requiere conservar íntegramente la información original de las imágenes.

22

La compresión sin pérdida se utiliza en compresores de archivo como RAR,

Gzip, Bzip, zip, 7z, en imágenes (PNG) y también en algunos formatos de audio como

WAV.

TIFF (Tagged Image File Format): es uno de los formatos de almacenamiento

sin pérdidas utilizado por muchas cámaras digitales. Es usado también en los

programas de retoque de imágenes digitales. Este formato de almacenamiento es de la

más alta calidad. Admite una profundidad de color de 64 bits, aunque gracias al uso del

algoritmo de compresión sin pérdidas consigue reducir su nivel de espacio.

RAW: Es un formato alternativo a TIFF. En este mecanismo se almacena

directamente la información que procede del sensor de la cámara digital. Si se tuviera

la necesidad de convertirla a TIFF el proceso requeriría mayor tiempo y mayor espacio

de almacenamiento. Hay diferencias en los formatos RAW de un fabricante a otro.

Como inconveniente tiene que para poder trabajar con las imágenes en un PC o para

imprimirlas hay que llevar a cabo su conversión a otro formato estándar, lo cual lleva

un cierto tiempo. Sin embargo, el nivel de calidad que tienen las imágenes en RAW es

semejante al de las imágenes TIFF .

GIF es otro de los formatos muy conocidos por los usuarios de Internet. Utiliza

un algoritmo de compresión sin pérdidas. Sin embargo, la calidad en las imágenes no

llega a ser muy alta por su limitada profundidad de color el cual es de sólo 8 bits.

Permite transparencias e imágenes rodantes a los cuales se les llama GIF’s animados.

PNG (Portable Network Graphics), es un formato de almacenamiento de

imágenes que se basa en un algoritmo de compresión sin pérdida para bitmaps. Fue

desarrollado para resolver las deficiencias del formato GIF, permitiendo almacenar

imágenes con una mayor profundidad de contraste, hasta de 48 bits.

PCX: (PiCture Xchange) es un formato de imagen digital que usa la codificación

run-length (un tipo de compresión sin pérdidas). Fue el formato para el programa

Paintbrush, uno de los primeros programas gráficos muy populares.

PDF: (Portable Document Format) es un formato para el almacenamiento de

documentos y fue desarrollado por Adobe Systems, diseñado para documentos que van

23

a ser impresos, pues especifica la información necesaria para la presentación final

del documento y determinando todos los detalles. Ha obtenido mucha popularidad, por

la calidad de las fuentes que utiliza y a las facilidades que ofrece.

BMP (BitMaP) o mapa de bits: Es el formato utilizado por el programa

Microsoft Paint, el cual viene con el sistema operativo Windows. Puede manejar hasta

224 (16 millones de colores), con compresión sin pérdida de calidad a través del

algoritmo RLE (Run Length Encoding). Se caracterizan por ser poco eficientes en el

uso del espacio en disco, pero a cambio pueden mostrar un buen nivel de calidad de la

imagen; al ser reescalados a un tamaño mayor pierden calidad.

2.3.3 Restauración y mejora de imágenes

Mejora de imágenes. El objetivo de un procedimiento de mejora de imágenes es

procesar una imagen de tal manera que resulte mejor que la original para una

aplicación dada; al hablar de una aplicación dada significa que las técnicas que se

utilicen serán orientadas a la solución del problema en cuestión y quizá no servirán

para otro problema distinto.

Normalmente los métodos son de dos tipos [3]: los orientados al dominio del

espacio y los orientados al dominio de la frecuencia.

Métodos en el dominio espacial.

Las técnicas basadas en el dominio espacial trabajan sobre el plano de la imagen

y realizan la manipulación de los píxeles, mientras que los procedimientos del dominio

de la frecuencia realizan operaciones sobre la transformada de Fourier.

El dominio espacial se refiere a los píxeles que constituyen la imagen y los

métodos en el dominio espacial son los procedimientos que operan en ese dominio.

Las funciones que operan en este dominio tienen la forma

{ ),(),( yxfTyxg = } (2.9)

24

En la que { }),( yxf representa la imagen de entrada, ),( yxg es la imagen

procesada, y T es una función de transformación que actúa sobre f, definido en algún

entorno válido de f .

En la Figura 2.5 se muestra un entorno de 3x3 alrededor del píxel ).,( yx

figura 2.5.- En este esquema se muestra un entorno de 3x3

alrededor del píxel ).,( yx

El centro de la sub imagen se va desplazando píxel por píxel empezando por la

esquina superior izquierda; operando en cada píxel para ir obteniendo los pixeles de g.

Algunas veces el entorno es una aproximación circular, pero normalmente son

cuadradas o rectangulares. Una de las aproximaciones principales se basa en el empleo

de las máscaras, también llamadas plantillas, ventanas o filtros. Una máscara es una

distribución bidimensional, generalmente de 3x3 (Figura 2.5) en la que los valores

determinan el tipo de operación que se va a realizar sobre la imagen, por ejemplo, la

acentuación de los bordes. Estas técnicas de mejora se conocen como procesamiento

por máscaras o filtrado.

),( yx

25

Métodos en el dominio de la frecuencia.

Estas técnicas tienen su base en el teorema de convolución. Sea ),( yxg una

imagen formada por una convolución de una imagen f (x, y) y un operador lineal

invariante h(x, y), es decir,

),(*),(),( yxfyxhyxg = (2.10)

Un operador lineal invariante, es aquel cuyo resultado depende solo del valor de

),( yxf en un punto de la imagen y no de la posición del punto.

Por el teorema de convolución se tiene la siguiente relación en el dominio de la

frecuencia:

),(*),(),( vuFvuHvuG = (2.11)

Donde FHG ,, son las transformadas de Fourier de las funciones fhg ,, ,

respectivamente.

figura 2.6.- Esquema de un sistema lineal

En la teoría de los sistemas lineales, a ),( vuH se le conoce como función de

transferencia del proceso.(figura 2.6).

Para una aplicación dada, ),( yxf es conocida y el objetivo es que, una vez que

se obtuvo su transformada de Fourier, ),( vuF , se seleccione ),( vuH de tal forma que

),( vuG ),( vuH ),( vuF

26

la imagen deseada, la cual es la transformada de Fourier inversa, de ),( vuG , tenga

alguna característica de ),( yxf resaltada, es decir,

)),(*),((),( 1 vuFvuHyxg −ℑ= (2.12)

Por ejemplo se podrían resaltar los bordes de una imagen si seleccionamos la

función de transferencia ),( vuH de tal manera que haga énfasis en los componentes

de alta frecuencia de la función ),( vuF en el dominio de Fourier.

El filtrado de imágenes se puede realizar en el dominio espacial como se

describió utilizando una máscara, lo cual representa una convolución en el dominio

espacial. De acuerdo al teorema de convolución, realizar la convolución en el dominio

espacial es lo mismo que multiplicar sus espectros en el dominio de la frecuencia, el

filtrado se podría realizar en el dominio de la frecuencia realizando los siguientes

pasos:

a).- Transformar los datos al dominio de la frecuencia mediante la transformada

de Fourier.

b).- Multiplicar el espectro de la imagen por una máscara de filtrado

seleccionada.

c).- Transformar el espectro al dominio espacial mediante la transformada de

Fourier inversa.

Para el filtrado, existen muchos tipos de filtros, los cuales se clasifican en filtros

de paso bajo, paso alto y filtros banda. Los filtros de paso bajo, dejan pasar las

frecuencias bajas y atenúan las frecuencias altas; los filtros de paso alto, permiten el

paso de frecuencias altas y atenúan las bajas frecuencias; los filtros paso banda sólo

permiten las frecuencias dentro de un rango especificado.

2.3.4 Segmentación.

La segmentación [19, 31, 50] es un proceso mediante el cual se busca agrupar

regiones que reúnan ciertas condiciones de proximidad, similitud, continuidad de tal

manera que se les pueda asignar un significado.

27

La segmentación es la parte fundamental del proceso de visión computacional,

pues una buena segmentación facilitará los siguientes pasos del proceso.

Existen diferentes tipos de segmentación como son las siguientes:

Segmentación a bajo nivel, que utilizan la medida de intensidad de los pixeles

como medida de similitud. Entre las técnicas más utilizadas se encuentran los métodos

orientados a píxel, los métodos orientados a contorno y los métodos orientados a

regiones.

Los métodos orientados a píxel utilizan la intensidad del píxel como un criterio

de pertenencia a una cierta clase en conjunción con un umbral que podría ser

adaptativo. Este método tiene la desventaja de que ignora la conectividad y la

proximidad.

Los métodos orientados a contorno utilizan la noción de conectividad para

asociar regiones que tienen niveles de intensidad similares y que pertenecen a

entidades distintas en la imagen.

Los métodos orientados a contorno suponen que hay una correspondencia entre

la continuidad de la intensidad y los contornos o bordes de los objetos que aparecen en

la imagen. Sin embargo, la información utilizada no siempre es suficiente, por lo que

conduce a ambigüedades en la interpretación de la imagen o a inconsistencias en la

misma.

Segmentación a nivel medio, realizan la agrupación de los pixeles asignados de

acuerdo a una estructura de datos propia de cada entidad, de manera que describa el

contenido de la imagen. Las entidades extraídas deben cumplir con ciertas condiciones,

por ejemplo que los contornos sean continuos y conexos, y que las regiones sean

conexas y cerradas.

Los métodos utilizados en este nivel son: Métodos de preprocesado de pixeles

asignados a clases, métodos de agrupación de pixeles a entidades y métodos de

postprocesado de entidades.

28

Segmentación de alto nivel, este tipo de segmentación tiene como propósito la

interpretación de la escena, por lo que el desarrollo de un sistema de segmentación a

este nivel constituye un problema con nivel de complejidad muy elevado.

2.3.4.1 Métodos de segmentación.

Se han dividido los métodos de segmentación de imágenes [19] en varias

categorías entre las más importantes destacan las siguientes:

Métodos de umbralización, métodos de región creciente, clasificadores, métodos

de agrupamiento (inglés: clustering methods), modelos de campos aleatorios de

Markov, redes neurales artificiales, modelos deformables y métodos guiados por

plantillas. los de umbralización, clasificación, agrupamiento, y campos aleatorios de

Markov, pueden considerarse métodos de clasificación de pixeles.

Es conveniente destacar que la mayoría de los métodos de segmentación pueden

ser vistos como problemas de optimización donde la segmentación deseada es la que

minimiza alguna función de energía o de costo, definida para una aplicación en

particular. La ventaja de ver la segmentación como un problema de optimización es

que define de manera precisa los aspectos deseables de la segmentación. También es

necesario observar que, para diferentes aplicaciones, se necesitan diferentes funciones

de energía o costo.

Umbralización.

La umbralización (Inglés: thresholding) es un método para segmentar imágenes

creando una partición binaria de las intensidades de las imágenes. Una umbralización

trata de determinar un valor de intensidad, llamado umbral (threshold), que separa la

clases deseadas. La segmentación se logra agrupando todos los pixeles con mayor

intensidad al umbral en una clase, y todos los otros pixeles en otra clase. La figura 2.7

muestra un histograma de una imagen que aparentemente posee tres clases, lo cual nos

deja dos posibles valores de umbral, en los valles del histograma. La determinación de

más de un valor umbral es un proceso llamado multiumbralización (inglés:

multithresholding).

29

figura 2.7 En la gráfica de la izquierda se muestra el histograma de intensidades de

grises en la imagen donde se observan los posibles umbrales. En el dibujo de

la derecha se observa la imagen con sus diferentes niveles de gris.

La umbralización es una técnica efectiva para obtener la segmentación de

imágenes donde estructuras diferentes tienen intensidades contrastantes u otras

características diferenciables. La partición usualmente es generada interactivamente,

pero también existen métodos automáticos. Para imágenes escalares, los métodos

interactivos pueden estar basados en la apreciación visual del usuario ya que la

operación de umbralización es implementable en tiempo real.

Generalmente, la umbralización es el paso inicial de una secuencia de

operaciones de procesamiento de imágenes. Su principal limitación es que en su forma

más simple solo se generan dos clases y por lo tanto no se puede aplicar a imágenes

multicanal. En adición, la umbralización usualmente no toma en cuenta las

características espaciales de la imagen.

Esto causa que sea sensible al ruido y no homogeneidades de intensidad, las

cuales pueden ocurrir en imágenes de resonancia magnética. Estos factores corrompen

el histograma de la imagen, haciendo la separación más difícil.

Región Creciente.

Región creciente (inglés: region growing) es una técnica para extraer regiones de

la imagen que están conectadas según cierto criterio predefinido. Este criterio puede

30

estar basado en información de intensidades y/o bordes de la imagen. En su forma

más simple, este método requiere un punto semilla (inglés: seed point) que es

seleccionado manualmente por el usuario, y extrae todos los pixeles conectados a la

semilla, que tengan el mismo valor de intensidad. La figura 2.8 muestra un ejemplo

donde se utiliza el método de región creciente para aislar una estructura de la figura 2.7

del lado izquierdo.

Figura 2.8. En el dibujo de la izquierda se muestra una imagen con la semilla inicial.

En la gráfica de la derecha se muestra la clasificación utilizando el método de

región creciente.

Al igual que la umbralización, por lo general no se utiliza la región creciente

solamente en una imagen, sino que se utiliza como parte de un conjunto de operaciones

de procesamiento de imágenes, particularmente en la delineación de pequeñas y

simples estructuras. Su desventaja principal es que requiere interacción manual para

obtener el punto semilla. Los algoritmos de división y mezcla (inglés: split and merge)

están relacionados con la región creciente pero no requieren una semilla. La región

creciente también puede ser sensible al ruido, causando que las regiones extraídas

tengan agujeros e inclusive que se desconecten.

Clasificadores.

Los métodos clasificadores son técnicas de reconocimiento de patrones [13, 15,

34] que realizan una partición de un espacio característico derivado de la imagen

usando datos con etiquetas conocidas. Un espacio característico es un rango espacial

31

de cualquier función de la imagen, siendo las intensidades de la imagen el más

común de los espacios característicos.

Un histograma, como el de la figura 2.4 del lado izquierdo, es un ejemplo de un

espacio característico 1D. La figura 2.5 derecha muestra un ejemplo de un espacio

característico 2D particionado en dos clases aparentes. Todos los pixeles cuyas

características estén en el lado derecho de la partición serían agrupados en una clase.

Los clasificadores son conocidos como métodos supervisados debido a que

requieren datos de entrenamiento que son segmentados manualmente, para luego ser

utilizados en la segmentación automática de nuevos datos. Hay una gran cantidad de

maneras en las que los datos de entrenamiento pueden ser aplicados en los métodos de

clasificación. Un clasificador simple es el clasificador del vecino más cercano, donde

cada píxel o voxel es clasificado en la misma clase que el dato de entrenamiento con la

intensidad más cercana. Los k vecinos más cercanos (kNN – k Nearest Neighbor) (Fix

y Hodges, 1951) es una generalización de este método. Otros clasificadores utilizados

son la ventana de Parzen [28] y el clasificador de Bayes[18,47]. Los clasificadores

estándar requieren que la estructura a ser segmentada posea características

cuantificables distintas. Debido a que los datos de entrenamiento pueden ser

etiquetados, los clasificadores pueden transferir estas etiquetas a los nuevos datos

siempre que el espacio característico distinga cada etiqueta lo suficiente. No son

iterativos, por lo que son relativamente eficientes computacionalmente y pueden ser

aplicados a imágenes multicanal. Una desventaja de los clasificadores es que no

obedecen a ningún modelo espacial. Otra desventaja es la necesidad de la interacción

manual para obtener los datos de entrenamiento. Los conjuntos de entrenamiento

pueden ser adquiridos para cada imagen que requiera segmentación, pero esto puede

tomar mucho tiempo y esfuerzo. En adición, el uso del mismo conjunto de

entrenamiento para un gran número de imágenes puede llevar a resultados viciados, ya

que no toman en cuenta las variaciones entre diferentes tipos de objetos.

Algoritmos de agrupamiento.

Los algoritmos de agrupamiento llevan a cabo esencialmente la misma función

que los métodos clasificadores, pero sin utilizar datos de entrenamiento. Por lo tanto,

32

son métodos no supervisados. Para compensar la falta de los datos de entrenamiento,

los métodos de agrupamiento iteran entre segmentar la imagen y caracterizar las

propiedades de cada clase. En este sentido, los métodos de agrupamiento se entrenan a

si mismos usando los datos disponibles. Un algoritmo de agrupamiento común es el

algoritmo de las K-medias [35] o algoritmo ISODATA (Ridler y Calvard, 1978). Este

algoritmo agrupa datos calculando iterativamente la media de la intensidad para cada

clase y segmentando la imagen mediante la clasificación de cada píxel en la clase con

la media más cercana. La figura 2.8 (b) muestra el resultado de aplicar [8] el algoritmo

de las K-medias a un corte del cerebro en la figura 2.8(a) . En este ejemplo se asumió

que el número de clases era tres, representando (de gris oscuro a blanco) el fluido

cerebroespinal, materia gris y materia blanca.

Aunque los algoritmos de agrupamiento no requieren que los datos se entrenen,

si requieren un segmentación inicial (o de manera equivalente, requiere parámetros

iniciales).

Como los métodos de clasificación, los algoritmos de agrupamiento no

incorporan directamente un modelo espacial. De cualquier forma, esta falta de

modelado espacial puede proveer ventajas significativas para realizar los cálculos

velozmente. Es posible incorporar robustez al ruido usando campos aleatorios de

Markov [11], como se describe en la sección siguiente.

Figura 2.8 a) Imagen original.- b).- Segmentación utilizando el algoritmo de

las K-medias.

33

Campos aleatorios de Markov.

Los modelos de campos aleatorios de Markov (MRF – inglés: Markov Random

Fields) son un modelo estadístico que puede ser usado dentro de los métodos de

segmentación. Los MRF permiten modelar las interacciones espaciales entre vecinos o

pixeles cercanos. Estas correlaciones locales proporcionan un mecanismo para modelar

las propiedades de la imagen. En el tratamiento de imágenes médicas, se utilizan

frecuentemente para tomar en cuenta el hecho que la mayoría de los pixeles pertenecen

a la misma clase a la que pertenecen sus pixeles vecinos. En términos físicos, esto

implica que bajo la asunción del MRF, cualquier estructura anatómica que consista de

un solo píxel tiene una probabilidad muy baja de ocurrir.

Los MRF son incorporados frecuentemente en los algoritmos de segmentación

por agrupamiento, como las K-medias bajo un modelo Bayesiano previo. La

segmentación es obtenida maximizando la probabilidad a posteriori de la segmentación

a partir de los datos de la imagen, obtenidos mediante métodos iterativos como los

Modos Condicionales Iterados, presentados por Besag [2], o el Templado Simulado,

presentado por Geman et al [18]. La figura 2.9b muestra la robustez de la

segmentación frente al ruido, resultante de un MRF previo. La segmentación es más

suave que el resultado sin MRF de la figura 2.8b.

Una dificultad asociada con los modelos MRF es la selección apropiada de los

parámetros que controlan la fuerza de las interacciones espaciales. Una selección muy

alta puede resultar en segmentación excesivamente suave y una pérdida de los detalles

estructurales. En adición, los métodos MRF usualmente requieren algoritmos

computacionalmente intensivos. A pesar de estas desventajas, los MRF son

ampliamente utilizados no solo para modelar clases de segmentación, sino también

para modelar propiedades de texturas y no homogeneidades de las intensidades.

34

Figura 2.9 a) Imagen original, b) Segmentación mediante el algoritmo de K-medias y

usando un MRF previo.

2.3.5 Sustracción de Fondo.

Uno de los problemas principales en el procesamiento de secuencias de

imágenes es cómo separar los objetos principales o de interés del resto de los objetos

que aparecen en la imagen o imágenes. Es decir, dada una secuencia de imágenes

obtenidas en este caso por una cámara fija, cómo detectar los objetos que podemos

considerar como foreground (esto es, los objetos que están en primer plano,

considerados como los que están más cerca del espectador u observador).

Una forma muy sencilla de realizar este proceso, considerada como una

aproximación ingenua en la literatura, es calcular la diferencia entre el fotograma

actual y una imagen del background (fondo) estático de la escena bajo análisis, como

se muestra en la siguiente fórmula:

umbralfondofotogramai >− (2.13)

Esto nos conduce rápidamente a preguntarnos dos cosas, la primera relacionada

con cómo obtener la imagen del fondo estático y la segunda como calcular el umbral

apropiado.

35

El problema de background es algo muy delicado porque está influenciado por

muchos factores del medio ambiente, como pueden ser:

Cambios en la iluminación.

Presencia de nubes.

Hora del día.

Movimientos de la cámara por el viento, aún cuando esté fija en el poste.

Movimiento de objetos del fondo, como las oscilaciones de las hojas de los

árboles.

Posibles cambios en la estructura geométrica del fondo; por ejemplo, objetos que

estaban fijos, y se quitaron en algún momento de la grabación del video.

a).- Un método para calcular el fondo es por simple diferencia de fotogramas:

Umbralfotogramafotograma ii >− −1 (2.14)

en el que podemos observar el fondo estimado que se está utilizando es

justamente el fotograma previo. Cabe observar que este método [1] funciona solamente

en condiciones particulares de velocidad de los objetos y tasa de fotogramas.

b).- Otro método utiliza el promedio o la mediana de un cierto número n de

fotogramas previos; en este caso se obtiene el promedio (o la mediana) de los valores

de intensidad de cada píxel correspondiente en cada fotograma.

c).- Otro método de cálculo utiliza el fotograma actual y el fondo previo para

calcular el fondo actual, mediante la siguiente fórmula:

iii BframeB *)1(*1 αα −+=+ (2.14)

donde α , llamada tasa de aprendizaje, se le asigna un valor de .05

36

d).- Otros métodos más sofisticados, proporcionan un cálculo explícito del

umbral, como el Running Gaussian Average [19], donde se ajusta una curva normal al

histograma y esto da el background, de acuerdo a la fórmula:

ttt F µααµ *)1(*1 −+=+ (2.15)

2221 )1()( tttt F σαµασ −+−=+ (2.16)

Métodos más recientes, mezcla de gaussianas, estimadores de kernel, estimación

basada en el corrimiento de la media y estimación de eigenbackgrounds (backgrounds

propios).

Una aplicación del método promedios de sustracción de fondo (figura 2.11) para

detectar los vehículos en movimiento (figura 2.10) utilizando Matlab, se realizó para

aislar los objetos en movimiento (figura 2.12) de una escena utilizando secuencias de

imágenes de video.

Figura 2.10 Escena que muestra coches en movimiento.

37

El objetivo de este análisis fue detectar cuales eran los objetos que se estaban

moviendo en la escena, por lo que el primer paso fue obtener el fondo de la escena,

utilizando el promedio de fotogramas. Posteriormente, se obtiene la diferencia de cada

fotograma con el fondo obtenido (píxel a píxel), comparar contra un umbral que

también es necesario definir utilizando algún criterio y de esa manera obtener solo los

pixeles que se están moviendo. En este ejemplo el umbral utilizado fue de 140, para

decidir si un píxel dado corresponde al fondo o al primer nivel.

Figura 2.11 En esta escena se utilizó el método de promedio de cada píxel correspondiente en 200 fotogramas para obtener el fondo estático.

38

Figura 2.12.- Escena procesada donde se ha aplicado el método de sustracción de fondo para aislar los objetos en movimiento.

2.3.6 Distintos tipos de transformadas aplicadas a imágenes.

Existen un conjunto de transformaciones u operaciones [33, 41, 46] que se

pueden realizar sobre las imágenes, en seguida se presenta un bosquejo de las distintas

transformaciones más importantes.

Operaciones aritméticas. Las imágenes se pueden sumar, restar, multiplicar y

dividir; para ello se realizan las operaciones con los valores del nivel de gris de cada

píxel. Por ejemplo, para hacer la suma, se toma el valor del nivel de gris del píxel en

una imagen y el valor del nivel del nivel de gris del píxel correspondiente en la imagen

que se está sumando, y el resultado es el que corresponde al píxel en la imagen

resultado. De la misma manera se realizan las otras operaciones aritméticas.

Operaciones lógicas (booleanas). Las operaciones lógicas se realizan de la

misma forma que las aritméticas, excepto que en este caso los valores de los pixeles

deben ser binarios ( 0 ,1). Las operaciones que se pueden realizar son AND, OR, XOR

, NOT.

Operaciones morfológicas. Este tipo de operaciones simplifican los datos de la

imagen, preservan características que son importantes y eliminan los irrelevantes. Al

usarse, constituyen un paso intermedio en la secuencia del procesamiento de las

imágenes. El lenguaje que utiliza la morfología matemática es la teoría de conjuntos.

Las principales operaciones morfológicas son la dilatación y la erosión y a partir

de ellas surgen otras operaciones llamadas apertura y clausura.

La operación de erosión consiste en la eliminación de los pixeles vecinos a un

píxel dado, poniéndolos en cero, a través de un criterio de conectividad.

La operación de dilatación consiste en la incorporación de pixeles vecinos a un

píxel dado, poniéndolos en uno, de la misma manera utilizando un criterio de

conectividad; hace crecer los objetos por su periferia y rellena los agujeros pequeños.

39

Estas operaciones producen la disminución o el aumento del área de la

imagen, y producen cambios importantes en las regiones delgadas de los objetos,

cambian el perímetro y la forma, y el número de agujeros del objeto. Se pueden

combinar para restaurar las disminuciones o adiciones de los pixeles periféricos tras

haberse realizado la operación contraria, pero no siempre es exitosa esta restauración.

Una apertura encadena una operación de erosión seguida de una dilatación y una

operación de clausura, encadena una erosión con una dilatación.

2.3.7 Transformada de Hough.

La transformada de Hough [10] es una técnica que se utiliza para aislar

características en una imagen. Es de gran importancia para detectar características tales

como líneas y círculos, y parámetros relevantes de las imágenes.

La transformada de Hough clásica es utilizada para detectar características

regulares como líneas, círculos y elipses. La transformada de Hough Generalizada es

utilizada en aplicaciones donde no se cuenta con una descripción analítica sencilla de

una característica.

La transformada es útil para calcular una descripción global de una

característica, donde el número de soluciones no necesitan conocerse a priori. En el

caso de detección de líneas, la técnica tiene la motivación de que cada medida, por

ejemplo las coordenadas de un punto, contribuye a una solución global consistente,

que es la línea a la que conduce ese punto de la imagen.

En la figura 2.13 se presenta un ejemplo sencillo que consiste en ajustar líneas a

un conjunto de puntos de una imagen (por ejemplo, lo que sería la salida en un detector

de bordes), los cuales se muestran en la parte izquierda de la figura; a la derecha se

muestran algunas posibles líneas para esos puntos.

40

.

. .

.

.

.

. .

.

.

..

. .

.

.

.

. .

.

.

.

. .

.

.

.

. .

.

.

.

Figura 2.13.- Ajuste de líneas a un conjunto de puntos.

El algoritmo de la transformada Hough utiliza un arreglo al que se le llama

acumulador, para detectar líneas bmxy += ; las dimensiones del arreglo dependen del

número de parámetros desconocidos del problema. En el caso de las líneas son dos: m

y b . Para cada píxel y su vecindario, la transformada Hough determina si pertenece a

un borde; si es así, calcula los parámetros de esa línea y busca en los depósitos del

acumulador en el que esos parámetros caen, incrementando su valor; posteriormente

encuentra cual es el depósito con los valores máximos y de esa manera determina las

líneas que mejor ajustan a los puntos dados.

Cualquier línea recta en el espacio yx, es representada por un punto en el

espacio de parámetros θρ , y todos los puntos de esa línea recta son transformados a

ese mismo punto, de acuerdo con la ecuación:

θθρ senyx ii += cos (2.17)

donde ρ es la distancia de la línea recta al origen y θ es el ángulo que forma la

normal a la recta con el eje .x

En la figura 2.14 se muestra esta dualidad entre el espacio yx, y el espacio de

parámetros ρθ , .

41

y

Figura 2.14.- Los puntos que forman la línea recta en la gráfica de la izquierda son transformados en curvas senoidales en el plano ρθ , ; los puntos de intersección de las curvas senoidales corresponden a la recta en el plano yx,

Para ejemplificar en forma sencilla, consideremos los datos de la tabla 2.1

correspondientes a la ecuación de la recta 23 += xy . En el cuadro 2.2 se muestran

distintos valores de los ángulos para transformar al espacio ρθ , ; en ese cuadro

observamos que está resaltado el renglón correspondiente a los parámetros de la línea

recta y son los valores 06.161=θ y 63.0=ρ , como se puede verificar de la ecuación

de la recta cuya pendiente es 3 y por lo tanto su recíproco y de signo contrario es 3

1− y

corresponde a un ángulo de 161.6560. Al graficar cada uno de esos puntos con los

valores dados de los parámetros en el plano ρθ , , veríamos que las curvas

correspondientes se intersectarían en ese punto (161.6,.63), de acuerdo con la gráfica

2.14.

.

.

.

.

. x

ρ

θ

42

Cuadro 2.1 Conjunto de datos

Cuadro 2.2. Espacio de parámetros para los puntos del cuadro 2.1

2.4 Teoría de tránsito.

2.4.1 Antecedentes.

El problema de tránsito en las ciudades, se origina en el hecho de que los

automóviles avanzan despacio o bien porque se detienen, normalmente porque ocurren

accidentes en las vías. Esto normalmente en las llamadas horas pico, porque los

conductores quieren llegar a tiempo a sus centros de trabajo o a sus domicilios, es decir

hay un flujo grande de vehículos en esas horas pico.

Otra variable importante es la capacidad disponible en las calles para permitir el

paso rápido y continuo de los automóviles.

2.4.2 Modelos de Tránsito.

Existen diversas aproximaciones matemáticas que intentan explicar y modelar el

flujo de tránsito vehicular en términos de alguna de sus características. Todas ellas

Punto x y=3x+2

I -1 -1

II 0 2

III 1 5

IV 2 8

V 3 11

Punto I Punto II Punto III Punto IV Punto V

Angulo Distancia Distancia Distancia Distancia Distancia

0.0 -1.00 0.00 1.00 2.00 3.00

45.0 -1.41 1.41 4.24 7.07 9.90

160.0 0.60 0.68 0.77 0.86 0.94

161.6 0.63 0.63 0.63 0.63 0.63

163.0 0.66 0.58 0.51 0.43 0.35

43

responden con cierto grado de apego a la realidad, midiendo alguna o algunas

características del flujo vehicular.

Existen tres enfoques para modelar flujo de tránsito vehicular:

• Los modelos macroscópicos. Este tipo de modelos se enfocan hacia las

relaciones globales del flujo de tránsito, tales como velocidad de los vehículos,

flujo vehicular y densidad de tránsito. Por su naturaleza, son modelos

continuos, que hacen uso extensivo de ecuaciones diferenciales. Incluye a los

modelos de gases cinéticos y los hidrodinámicos. Dirk Helbing, M. Treiber y

L. A. Pipes son algunos de los investigadores de mayor renombre en esta área.

Dentro de los modelos macroscópicos existen modelos puramente empíricos,

denominados modelos de capacidad y nivel de servicio, que no utilizan la

precisión de las ecuaciones diferenciales y sólo establecen relaciones empíricas

entre las principales variables bajo control del diseñador.

• Los modelos microscópicos se enfocan en la descripción del

comportamiento del flujo del tránsito vehicular mediante la descripción de las

entidades discretas individuales y atómicas que interactúan unas con otras (en

este caso cada vehículo individual). Son modelos por lo general discretos.

Incluye a los modelos de carro siguiente y los modelos con autómatas celulares

(de los cuales los más importantes son los modelos Nagel-Schreckenberg y

Fukui-Ishibashi). Kai Nagel, Michael Schreckenberg, M. Bando, P. G. Gipps,

M. Fukui y Y. Ishibashi son algunos de los mayores investigadores en esta

área.

• Los modelos mesoscópicos (cinéticos) definen una función que expresa

la probabilidad de que un vehículo a determinada velocidad se encuentre en

cierto tiempo en determinada posición. Utilizan por lo general métodos de la

mecánica estadística.

Un ejemplo de los modelos microscópicos es el diseñado por Nagel y

Schrekenberg (Na-Sch) (1992) que modela el tránsito vehicular usando un autómata

celular, donde las células del autómata corresponden a un vehículo que se mueve con

una cierta velocidad v , o a un espacio vacío de la avenida donde se mueve el vehículo.

44

Este modelo es de espacio y tiempo discretos y ha servido para modelar

congestionamientos en autopistas.

Fenómenos del flujo vehicular analizados.

Los fenómenos más importantes que se analizan del flujo de tránsito vehicular,

son:

• Congestión vehicular.

• Cruces en avenidas.

• Uso de semáforos.

• Accidente de tránsito

El primero de ellos y que es uno de los objetivos de este estudio , es el

relacionado con el congestionamiento vehicular (el cual también se le conoce como

embotellamiento) se refiere tanto en el aspecto urbano como interurbano, a la

condición de un flujo vehicular que se ve saturado debido a una sobredemanda de las

arterias viales, lo cual da como resultado que se produzcan incrementos en los tiempos

de viaje y obviamente congestionamientos. Este fenómeno se produce en las llamadas

horas pico, y representan serios problemas y disgustos para los automovilistas, ya que

traen como consecuencia pérdidas de tiempo.

Las consecuencias de las congestiones vehiculares se ven reflejadas en

accidentes, a pesar que los automóviles no pueden circular a gran velocidad, debido a

que el automovilista pierde la calma al encontrarse estático por mucho tiempo en un

lugar de la vía. Esto también deriva en violencia vial, por otro lado reduce la gravedad

de los accidentes ya que los vehículos no se desplazan a una velocidad importante para

ser víctima de daños o lesiones de mayor gravedad. Otra cuestión importante es que los

vehículos gastan innecesariamente combustible debido a que está inactivo por mucho

tiempo en un mismo lugar, sin avanzar en el trayecto de un punto a otro.

Algunas de las maneras para evitar congestiones vehiculares son, el habilitar

modos de pago automatizados cuando la congestión se produce debido a la existencia

de peajes en las rutas, así como la organización de las entradas y salidas en forma

diferida de horas laborales, con la finalidad de que no se produzcan grandes

movilizaciones de automóviles a una misma hora o como lo que sucede cuando se

45

producen retornos masivos de personas que están de vacaciones en un punto de

veraneo a sus ciudades de residencia.

Adicionalmente, hay otro aspecto que se debe tomar muy en cuenta, que son los

hábitos de conducir de la gente, ya que también tiene efectos importantes en el flujo

vehicular.

Todos estos factores que se identifican como causas del flujo lento, deberían ser

considerados en el diseño de modelos que permitan apoyar la solución del problema de

tránsito vehicular, pues es necesario fundamentar la hipótesis de que hay muchos

coches en circulación y resultan insuficientes las calles disponibles para satisfacer las

necesidades de un tránsito fluido.

46

CAPÍTULO 3

DETECCIÓN Y CONTEO DE CAMBIOS DE CARRILES.

3.1 Antecedentes del problema.

Mencionamos en la sección (2.4) que existen una serie de causas de los

congestionamientos viales [29]. En la literatura se encuentran referencias a

investigaciones [40, 54] que se han realizado con el objeto de modelar de una forma lo

más realista posible el comportamiento del tránsito en diferentes situaciones. Una de

las causas que se mencionan es el efecto que tienen los cambios de carriles sobre los

congestionamientos y es causa de análisis en el presente trabajo para medir cuales son

esos efectos sobre las variables consideradas como son flujo, velocidad y densidad.

3.2 Trabajo Relacionado.

Respecto a la detección [51] y clasificación de vehículos [21,22] se ha intentado

a partir de imágenes estáticas; sin embargo, el análisis de los vehículos en movimiento

[14,16,20] presentan un grado de dificultad mayor debido a los detalles adicionales que

hay que tomar en cuenta para establecer una conclusión.

En una intersección o crucero, las vueltas afectan considerablemente el flujo de

tránsito (por ejemplo, reducen la velocidad de tránsito), y subsecuentemente puede

traer como consecuencia la afectación del tránsito en zonas aledañas.

Muchos métodos se han diseñado para la identificación y clasificación de

vehículos [25, 53], ya sea estáticos o en movimiento, bajo distintas condiciones y

enfoques.

En el caso de vehículos con obstrucción, existen algunos métodos que utilizan

información del conocimiento de calibración de cámara y suponen que los vehículos

47

están en el plano del suelo. Proyectan modelos de vehículos 3D simplificados en

imágenes 2D para analizar gradientes de la imagen para detección y clasificación de

vehículos.

Otros métodos usan el perfil 2D para rastrear vehículos en videos aéreos donde

la oclusión entre vehículos no es importante.

En cuanto a obstrucción D. Koller et al [9], S. Kamijo et al [26], F. Oberti et al

[42], utilizan el contorno, puntos característicos y la teoría de campo aleatorio de

Markov [11]. Sin embargo, hacen uso de una región de interés, en la cual los coches

puedan ser identificados separadamente antes de que sean obstruidos.

C.C. Pang et al [44], trabajan en imágenes en primer plano, para detectar

obstrucción y separar vehículos mezclados, pero su método es sensitivo al ruido y no

maneja cambios en la orientación

Existen otros métodos para rastrear el movimiento [23] de manchas sin usar

modelos de perfiles.

I. Cohen et al [7], extraen rastros representando manchas en marcos continuos

como grafos, lo cual ayuda a filtrar mezclas de corto tiempo o partir de las manchas,

pero no puede separar vehículos que están mezclados por largos intervalos tales como

cuando dos vehículos se obstruyen y se mueven juntos.

S. Gupte et al [21], aplican seguimiento a manchas para detección y clasificación

de vehículos pero la mezcla de manchas es la mayor causa de errores de detección y

clasificación en su sistema.

En cuanto al problema de tránsito, en los últimos setenta años se han estado

realizando esfuerzos para contar con mecanismos para el control del tránsito vehicular,

algunos de los modelos se mencionaron en el capítulo dos.

Chowdury et al [6], desarrollan un modelo de tránsito de dos carriles con dos

diferentes tipos de vehículos, los cuales son caracterizados por dos valores diferentes

de la velocidad máxima permitida.

48

Laval y Leclercq [27] desarrollan un modelo microscópico para tratar el

problema de vehículos entrantes a un autopista, en el cual los cambios de carril se

realizan de acuerdo a un proceso estocástico que se valida en el campo y cuyo valor

medio es calculado a partir de una función macroscópica de cambios de carril.

Jia et al [24], proponen un autómata celular para dos carriles y muestran que

cuando un vehículo impide el paso de otro y éste le suena la bocina para que cambie de

carril y le permita el paso no tiene efecto en tránsito homogéneo pero refuerza el flujo

en régimen de densidad intermedio en tránsito heterogéneo.

Chetverusckin et al [5], desarrollan un modelo de congestión de flujos de tránsito

basado en el enfoque continuo y la analogía con los esquemas KCFD (Diferencias

finitas cinéticamente consistentes).

Sven Maerivoet y Bart De Moor [30] desarrollan un análisis retrospectivo de

los modelos de planeación de transporte y los modelos de flujo de tránsito.

Wen-Long Jin [57], aborda la problemática de los cambios de carril desde

diferentes enfoques y presenta una teoría cinemática de la dinámica de los cambios

de carril.

3.3 Justificación.

El origen fundamental de que se haya empezado a abordar este problema surge

de la concurrencia de dos situaciones particulares.

1.- En Junio del 2005, estábamos empezando a trabajar en un proyecto para

medir las características de movimiento de vehículos en el tramo de Cuauhtémoc desde

Constitución hasta Madero, haciendo consideraciones de velocidades y tiempos de los

semáforos. Adicionalmente se pensó en agregar un módulo que midiera los niveles de

contaminación debido a los vehículos. Este proyecto sería mi tesis para obtener el

grado.

Para hacer esto se empezaron a establecer contactos con dependencias

gubernamentales y particulares para la obtención de la información y apoyo necesario

para llevar a cabo el proyecto. Entre éstas se tiene al SINTRAM que es un sistema

49

centralizado para el control de la operación o funcionamiento de semáforos del Área

Metropolitana de Monterrey, el Centro de Calidad Ambiental del Tecnológico de

Monterrey y SIMA (Sistema Integral de Monitoreo Ambiental) encargada de medir los

niveles de contaminación en distintos puntos del área metropolitana de Monterrey;

cabe destacar que esta dependencia proporcionó además información real para la

realización de un proyecto en el curso de Diseño de Experimentos relacionado con ese

tema.

2.- En septiembre del 2005, surge una solicitud al PISIS por parte de otra

dependencia de la UANL, de trabajar en un proyecto para la detección de vehículos en

las intersecciones y contarlos por trayectoria que seguían, pues en ese momento lo

hacían manualmente y los resultados no sentían que fueran confiables. De esa manera,

se vió la posibilidad de enfocar el desarrollo del proyecto ya iniciado hacia la solución

solicitada, ya que se veía como muy afines ambos proyectos.

Una vez que se empezó a trabajar en este segundo proyecto, se fue enfocando

exclusivamente en ese aspecto por lo que se abandonaron las ideas iniciales.

Es así como a partir de entonces se empezó a estructurar este proyecto y a

obtener información sobre el tema, principalmente documentación sobre temas de

visión computacional desde sus orígenes, las diferentes técnicas y modelos

matemáticos que se han implementado para la solución a problemas relacionados con

esta nueva disciplina

3.4 Solución Propuesta.

3.4.1 Condiciones del entorno de los videos.

Como materia prima en la solución del problema se utilizó la información

obtenida a través de los videos, los cuales fueron proporcionados por el SINTRAM en

su mayor parte, y algunos fueron grabados en forma independiente. Es conveniente

resaltar que el medio ambiente influye mucho en la calidad de la grabación, ya que se

genera mucho ruido, dependiendo de las condiciones del medio ambiente, lo cual trae

como consecuencia pérdida en la calidad de las imágenes que se obtienen.

3.4.2 Detección de coches en movimiento.

50

Se diseñó un algoritmo para detectar los coches que se mueven en la escena

bajo estudio, y aislarlos del resto de los objetos presentes en la escena, obteniendo las

manchas correspondientes a los mismos. Esto se hace a través de un método de

segmentación, los cuales se describen en el capítulo dos.

Para la implementación del algoritmo se hace uso de las herramientas

proporcionadas por SIMULINK uno de los módulos de Matlab.

3.4.3 Descripción de la solución propuesta.

La solución propuesta consta de tres partes: una parte manual, que consiste en el

conteo y medición de las variables de interés, lo cual se realiza en forma visual por

medio de los videos grabados de los diferentes sitios seleccionados. En esta parte se

calculan las medias del flujo, la densidad, la velocidad y los cambios de carril, según el

procedimiento siguiente:

Para el cálculo del flujo se cuenta el número de vehículos que pasan por un

punto dado de la avenida en cada minuto, obteniéndose el promedio de todos los

minutos que se tienen grabados.

Para el cálculo de la densidad, se define una región en la escena, calculándose un

tramo de 100 metros; de cada minuto se detiene el video cada 10 segundos y se cuenta

el número de vehículos que permanecen en el tramo de 100 metros bajo consideración;

después se obtiene el promedio de las seis observaciones, obteniéndose la densidad en

ese minuto; posteriormente se obtiene el promedio de la densidad obtenida en todos los

minutos, lo cual constituye la densidad promedio.

Para el cálculo de la velocidad, se selecciona un coche desde el inicio del tramo

bajo observación y se mide el tiempo que tarda en recorrerlo, y se procede a registrar

ese tiempo; posteriormente se selecciona otro vehículo y se procede igual, hasta que se

termina el minuto actual; al final del minuto se calcula el promedio y se obtiene la

velocidad promedio por minuto.

Finalmente se realiza el conteo del número de cambios de carril en cada minuto.

51

Una vez obtenidos los valores de las variables mencionadas, se realizan las

gráficas para analizar las interrelaciones de las variables.

Un punto interesante es verificar qué tanto se cumple la relación que nos dice

que el flujo es igual a la velocidad por la densidad de flujo, lo cual lo hemos verificado

por medio de los datos obtenidos, y se ha aplicado una prueba F [37, 38, 52] para

determinar si estadísticamente es válido.

Otra parte de la solución propuesta es la obtención de los valores de las variables

en forma automática. Para ello, se desarrolló un modelo en Simulink, utilizando las

herramientas con las que cuenta para el procesamiento de imágenes a través de

bloques.

El problema con el modelo es que los videos con los que se cuenta tienen mucho

ruido del medio ambiente, de tal manera que detecta manchas en movimiento que no

corresponden a los vehículos que se están moviendo y los resultados obtenidos no son

tan exactos como nosotros esperábamos; un área de oportunidad para el futuro es el

desarrollo de algoritmos y técnicas que permitan detectar con exactitud las manchas de

los coches y haya un mínimo porcentaje de falsos positivos.

La tercera parte de la solución es el empleo de un simulador que genere los

coches en movimiento, se almacene como un video y esto sirva como entrada al

modelo; la idea es verificar que el modelo está funcionando en forma correcta y que en

la medida que se tenga una grabación de buena calidad, nos va a generar resultados

correctos y deben ser los mismos o muy aproximados a los que se obtengan

manualmente por observación de los videos.

En el apéndice C se muestra el modelo para la detección automática desarrollado

en Simulink.

Para el caso del simulador, se desarrolló un programa en Java para generar

coches en forma aleatoria, utilizando una distribución Poisson en diferentes carriles.

Esto permite contar con un experimento controlado donde sea posible obtener los datos

del número de coches generados, la velocidad de los coches, calcular la densidad

promedio y los cambios de carriles.

52

El mecanismo consiste en generar un video a partir de las pantallas donde van

apareciendo las cajas que representan los coches que se van generando a través del

simulador, y posteriormente ese video sirva de entrada al modelo en Simulink para ver

si arroja los mismos valores que nos da el programa simulador.

53

CAPÍTULO 4

EXPERIMENTOS. 4.1 Análisis por conteo manual.

A partir de las secuencias de videos, se realizó la recopilación de los valores de

las variables por cada minuto de grabación que se tiene en los videos, para lo cual se

efectuó un conteo visual del número de coches que pasan por los tramos considerados

en las avenidas seleccionadas para hacer el estudio. Los estudios que se presentan

corresponden a grabaciones realizadas en Constitución a la altura de la Avenida

Gonzalitos en la orientación al Poniente-Oriente, Constitución a la altura de

Venustiano Carranza y el túnel de la Loma Larga en dirección Oriente-Poniente y la

Avenida José Eleuterio González (Gonzalitos) en la dirección Norte-Sur entre la

Avenida Pablo González y Boulevard Constitución, este último a una hora pico.

Es conveniente mencionar que también se recopiló una grabación de

Cuauhtémoc a la altura de Juan Ignacio Ramón, y no se analizó debido a que la escena

estaba muy deficiente para realizar el conteo de vehículos. La figura 4.1 muestra una

escena de la avenida mencionada donde se puede apreciar que la escena no es muy

apropiada para el objetivo que se busca de realizar un análisis visual del

comportamiento del tránsito vehicular.

También es conveniente señalar que los videos también pasaron por un proceso

de conversión del formato de video a formato digital para poder ser leído y procesado

por la computadora; particularmente por el programa Matlab y el módulo Simulink,

que fueron utilizados en el desarrollo de programas para el procesamiento de los

videos una vez que fueron digitalizados.

El proceso de conversión a formato digital implica también una considerable

inversión de tiempo por los programas que lo realizan, para lo cual también fue

54

necesario buscar programas que efectuaran este tipo de tareas para contar con la

misma información en el formato apropiado para ser leídos desde Matlab y Simulink.

4.1.1 Resultados del análisis del tramo de Constitución a la altura de Gonzalitos, dirección Puente Atirantado a Monterrey.

Inicialmente se realizó el estudio del tramo de Constitución cruzando la avenida

José Eleuterio González, comúnmente conocida como Gonzalitos, pasando el puente

se consideró un tramo de cien metros en la escena. La Figura 4.2 muestra un escena de

ese sector. Aún en estas escenas no se contaba con la suficiente calidad para su

procesamiento en forma automatizada.

Figura 4.1 Escena de la muestra tomada de Cuauhtémoc y Juan

IgnacioRamón

55

Figura 4.2 Vista del tramo de Constitución a la altura de Gonzalitos.

Los resultados del conteo de flujo vehicular en intervalos de un minuto se

muestran en la figura 4.3:

56

Figura 4.3. Comportamiento del flujo vehicular en intervalos de un minuto.

El análisis de los datos nos conduce al valor de flujo promedio en el tramo

considerado de Constitución y Gonzalitos que es de 40 coches por minuto, así como

los valores de las variables consideradas en el diagrama fundamental de la teoría del

tránsito.

Este análisis consistió en realizar un conteo por períodos de un minuto , en el

cual se midió el flujo (q ), la velocidad (v ) y la densidad de tránsito ( ρ ), cantidades

que definimos de la siguiente manera:

Flujo vs Tiempo

0

10

20

30

40

50

60

70

0 20 40 60 80 100 120 140

Minutos

Flu

jo

57

El flujo de tránsito ( q ) se define como el número de vehículos que pasan por

un punto dado de la avenida en cierta unidad de tiempo, en nuestro estudio un minuto,

por lo cual tenemos que q estaría dado por

Número de vehículos/Tiempo promedio=τ

n (4.1)

La velocidad promediov se calcula en forma normal, tomando la longitud del

tramo bajo consideración y el tiempo promedio que tardan los vehículos en recorrer el

tramo, de donde tenemos la ecuación

Velocidad promedio =τ

λ (4.2)

Respecto a la densidad de tránsito ρ la cual se calcula como el número promedio

de vehículos en un instante dado en el tramo bajo análisis dividido por la longitud del

tramo, tenemos la siguiente igualdad:

Número de vehículos/distancia considerada=λ

n (4.3)

De estas relaciones se obtiene una nueva relación

v =ρ

q (4.4)

o bien ρvq = , es decir, el flujo de vehículos está dado por el producto de la

velocidad promedio y la densidad de tránsito, tal y como lo enuncia la teoría del

tránsito.

Las cantidades físicas mencionadas (velocidad, flujo y densidad) son utilizadas

en la teoría de tránsito, desde el punto de vista macroscópico.

Respecto al procedimiento para la recopilación de los datos, el método de conteo

empleado fue el siguiente:

Para el flujo: Se definió una línea transversal en un tramo de la carretera que

sirvió como referencia para realizar el conteo, los vehículos que cruzaban esa línea

fueron contados durante un intervalo de un minuto y se anota, en el siguiente minuto

58

empieza de nuevo el conteo hasta que se termina el archivo; esto se realizó en cada

uno de los cinco archivos disponibles de aproximadamente treinta minutos cada uno.

De esta manera al final se obtiene el flujo promedio por minuto, considerando el total

de observaciones hechas en cada minuto.

Para medir la velocidad, se consideró el punto de inicio del tramo y el punto

donde finaliza. En cada inicio de minuto se seleccionó un vehículo y se le dio

seguimiento hasta que llegaba al punto final del tramo, midiendo el tiempo que tardaba

en recorrer dichos puntos. Esto haciendo un muestreo de entre cuatro y seis vehículos

por minuto. Finalmente se obtiene el tiempo promedio por vehículo para recorrer el

tramo y de ahí se calcula la velocidad promedio en ese tramo de cien metros.

En el caso de la densidad de flujo, se utilizó un procedimiento similar, de cada

intervalo considerado se detenía el video cada diez segundos y se contó cuántos

vehículos quedaban en la imagen dentro del tramo bajo observación, de esta manera se

tiene un muestreo muy aceptable en cada minuto del intervalo bajo estudio. De igual

forma que las otras dos variables, se obtiene un promedio del número de vehículos que

hay en ese tramo en cada minuto considerado.

De acuerdo a los datos recopilados siguiendo los procedimientos antes

descritos, se obtuvieron las siguientes gráficas.

La Figura 4.4 presenta la gráfica que representa la relación entre la densidad de

tránsito y el flujo; aquí podemos constatar lo predicho por la teoría de tránsito que a

densidades bajas hay una correlación entre el flujo y la densidad, lo cual no ocurre a

medida que aumenta la densidad.

En esta gráfica se ha dibujado la línea de tendencia en la nube de puntos

ubicada en el lado izquierdo de la gráfica, que corresponden a valores de densidad de 2

a 5 así como en los puntos dispersos en el lado derecho, que corresponde a valores de

la densidad de 6 a 12, Podemos observar que efectivamente, el flujo tiende a aumentar

a medida que aumenta la densidad, pero también observamos que a medida que la

densidad aumenta más es correlación se pierde y el flujo tiende a bajar.

59

0

10

20

30

40

50

60

- 2.00 4.00 6.00 8.00 10.00 12.00 14.00

Densidad

Flu

jo

Figura 4.4 Gráfica que muestra valores del flujo observado contra los

valores observados de la densidad

No obstante, la gráfica anterior nos permite verificar otras afirmaciones de la

teoría de tránsito [17]: 1°) que cuando la densidad de flujo es cero el flujo es cero, lo

cual indica que no hay coches en la vía; 2.-) que al aumentar la densidad, aumenta el

flujo hasta llegar a cierto valor en el que el flujo empieza a disminuir; 3.-) Al llegar la

densidad a un valor, denominado densidad de congestionamiento, el flujo es cero. La

geometría de la situación descrita se muestra en la Figura 4.5.

60

0

20

40

60

80

100

120

0 5 10 15 20 25

densidad

flu

jo

Figura 4.5 Gráfica de la Geometría del comportamiento del flujo contra densidad,

según la teoría de tránsito.

La figura 4.6 muestra la gráfica del comportamiento de la densidad de tránsito

y el flujo en el tiempo. El eje principal muestra la densidad de flujo y el eje secundario,

lado derecho, muestra el flujo.

0

2

4

6

8

10

12

14

1:44

1:00

2:05

2:10

3:00

3:05

3:10

3:15

3:20

4:04

4:09

4:14

5:01

5:06

de

ns

ida

d

0

10

20

30

40

50

60

flu

jo

densidad flujo

Figura 4.6. Gráfica que muestra el comportamiento de la densidad y el flujo.

La grafica que se muestra en la Figura 4.6 presenta el comportamiento de la

densidad de tránsito y el flujo en el tiempo, observándose como están correlacionadas

61

en el transcurso del tiempo. El eje del lado izquierdo presenta la densidad y el eje

secundario, del lado derecho, presenta el flujo.

Otro de los aspectos interesantes que se encontró en este estudio es que la

relación (4.4) velocidad, flujo y densidad, vemos que experimentalmente se satisface

como se muestra en la tabla 4.1.

Tabla 4.1 Observaciones preliminares del estudio.

Grupos de v q v ρ ρ

Densidad ( ρ )

Observaciones Tiempo (seg.)

M/seg. Vehículos

Prom. (Vehí/tramo) (Vehi/m)

1 5.76 17.35 33 56 5.4 0.054 2 5.64 17.74 34 39 3.6 0.036 3 5.80 17.24 34 39 3.8 0.038 4 5.51 18.15 32 37 3.4 0.034 5 5.05 19.81 33 38 3.2 0.032 6 5.21 19.19 37 40 3.4 0.035

En esta tabla se muestra el conteo visual del tránsito de acuerdo al mecanismo

que se describió anteriormente, y el resultado de aplicar la ecuación (4.4), ρvq = ,

donde se verifica que, excepto en el primer renglón, los resultados son muy similares.

Hacemos la aclaración que hay una diferencia grande en el primer renglón debido a

que el cálculo de la densidad en ese caso se hizo en intervalos de un minuto mientras

que en el resto de los renglones el intervalo fue de diez segundos.

Para asegurar estadísticamente que se cumple la relación (4.4) respecto a que el

flujo calculado es igual al producto de la velocidad promedio calculada y la densidad

promedio calculada, se aplicó la prueba F a los datos de la tabla correspondientes al

flujo observado y al flujo calculado con la relación (4.4), obteniéndose los siguientes

resultados:

Varianza del flujo observado: 3.5

Varianza del flujo calculado con la fórmula: 1.3

62

Valor del cociente de las varianzas, considerando el numerador como la

varianza mayor: 2.69 (Fprueba).

La hipótesis nula H0: las varianzas son iguales, se rechazaría si Fprueba es menor

que F(.025,4,4) o Fprueba es mayor que F(.975,4,4). Los valores que arroja la tabla

Fisher son: F(.025,4,4) = 9.60 y F(.975,4,4)=0.104.

De acuerdo con esto, puesto que Fprueba no es menor que F(.025,4,4) ni mayor

que F(0.975,4,4), entonces se concluye que no hay evidencia suficiente para rechazar

la hipótesis nula.

También se hace la aclaración de que el cálculo se hizo considerando sólo cuatro

grados de libertad, debido a que no se consideró el primer renglón de la tabla por

haberse obtenido bajo condiciones experimentales diferentes.

En este primer análisis de los resultados del tramo Constitución y Gonzalitos, se

ha observado un tránsito estable, con aumentos en el flujo en forma periódica, pero la

velocidad promedio de los vehículos no tiene mucha variación, por lo que concluímos

que en esta parte no hay problemas de congestionamientos ni bloqueos. Sin embargo,

hemos tenido la oportunidad de verificar algunas de las predicciones de la teoría de

tránsito, lo cual nos permite a partir de estos resultados, tener los fundamentos teóricos

para continuar adelante en el estudio de los próximos tramos de la vía objeto del

análisis.

Otros puntos interesantes a considerar serían los tramos de Constitución, a la

altura de Venustiano Carranza, el tramo comprendido de Constituyentes del 57 hasta

Felix U. Gómez, en la parte de Oriente a Poniente, pues se ha observado que en esa

parte se forman muchos congestionamientos, generándose densidades muy altas y flujo

pequeño, muchas veces debido al ingreso de vehículos que se incorporan a

Constitución, cambios de carril , generación de percances debido al congestionamiento

, a la impericia en el manejo o a la desesperación de los conductores.

Asimismo, puntos también interesantes son otras vías de comunicación en el que

se observan problemas de tránsito, entre las que podríamos considerar Morones Prieto

en su intersección con León Guzmán, Gonzalitos entre Fidel Velásquez y Constitución

63

en ambos sentidos. Otras avenidas podrían ser Cuauhtémoc desde Ocampo hasta

Madero, Pino Suárez desde Madero hasta Ocampo, Nogalar desde Félix U. Gómez

hasta Avenida Universidad, Félix U. Gómez desde Colón hasta Ruiz Cortines.

En todas estas avenidas se observan embotellamientos en las horas pico y

muchas veces, incluso en horas que no son pico.

Los resultados de estos análisis permitirán establecer relaciones entre los

distintas rutas y poder predecir a través de un modelo el comportamiento del tránsito

en horas posteriores, dadas las condiciones actuales en los distintos rumbos.

4.1.2 Análisis del Tramo Constitución-Venustiano Carranza a la altura de la Loma Larga.

Figura 4.7 Tramo de Constitución y Venustiano Carranza.

Esta metodología se aplicó al tramo de Constitución a la altura de Venustiano

Carranza (figura 4.7), particularmente en la parte correspondiente a la subida del

puente a la altura del túnel de la Loma Larga, obteniéndose los siguientes resultados.

En la figura 4.8 se muestra el comportamiento de la densidad y el flujo en el

tiempo, observándose un comportamiento similar a lo observado en el análisis anterior.

64

En la figura 4.9 observamos la gráfica densidad vs flujo. Los datos recopilados

no nos permiten ver qué sucede a densidades altas, en la cual el flujo decrece a partir

de la densidad de embotellamiento, según lo predice la teoría del tránsito.También se

debe resaltar el hecho de que el flujo y las densidades observadas son altas.

En la figura 4.10 se agrega una variable adicional bajo estudio, como lo es el

cambio de carril. Esta gráfica presenta el comportamiento del flujo de tránsito frente a

los cambios de carril. Se observa una tendencia del flujo a aumentar, al aumentar los

cambios de carril.

Figura 4.8 En esta gráfica se muestra el comportamiento de las variables densidad y flujo frente al tiempo, tramo Constitución Venustiano carranza.

En la figura 4.11 se presenta el comportamiento de la densidad contra los

cambios de carriles. De la misma manera que el flujo, la densidad tiende a aumentar,

esto de manera lógica por la correlación existente entre el flujo y la densidad.

Finalmente en la figura 4.12 se muestra el comportamiento de la velocidad frente

a los cambios de carril.

Densidad y flujo vs tiempo

0.00

2.00

4.00

6.00

8.00

10.00

12.00

14.00

16.00

0 20 40 60 80 100 120

Minutos

Den

sid

ad

0

20

40

60

80

100

120

140

160

180

Flu

jo

65

Figura 4.9.- Gráfica que muestra cómo el flujo de tránsito aumenta al aumentar la

densidad de tránsito.

Figura 4.10 Comportamiento de flujo vs cambios de carril.

Tramo Constitución-V.Carranza

0

20

40

60

80

100

120

140

160

180

0.00 5.00 10.00 15.00

Densidad

Flu

jo

Cambios de carril vs flujo

0

20

40

60

80

100

120

140

160

180

0 2 4 6 8 10 12 14 16

Cambios de carril

Flu

jo

66

Cambios de carril vs densidad

0.00

2.00

4.00

6.00

8.00

10.00

12.00

14.00

16.00

0 2 4 6 8 10 12 14 16

Cambios de carril

Den

sid

ad

.

Figura 4.11 Comportamiento de la densidad frente a los cambios de carril

Cambios de carril vs velocidad

0.00

5.00

10.00

15.00

20.00

25.00

0 2 4 6 8 10 12 14 16

Cambios de carril

Ve

locid

ad

(m/s

)

Figura 4.12 Comportamiento de la velocidad frente a los cambios de carril

67

Otro análisis que se efectuó es la prueba estadística F para verificar que el

flujo observado es igual al producto de la velocidad por la densidad, obteniéndose que

efectivamente podemos afirmar que provienen de la misma población , de acuerdo a

los siguientes resultados.

La varianza del flujo observado es 391.31

La varianza del flujo calculado por la fórmula es 301.21

El valor del cociente 391.31/301.21 es 1.299

F.025,98,98=1.489

F.975,98,98=0.671

De donde concluímos que puesto que el valor del cociente no es menor que

0.671 ni mayor que 1.489, entonces no tenemos evidencia para rechazar la hipótesis

nula de que las muestras provienen de la misma población.

De acuerdo con este análisis estaremos en posibilidad de verificar los resultados

que se obtengan contra lo que predice la teoría de tránsito lo cual debe ser congruente.

Otro conteo visual que se presenta el de los cambios de carril en esos tramos que

se observen para las velocidades, flujo y las densidades promedio.

Se presentó el análisis del comportamiento de la velocidad y la densidad cuando

se producen cambios de carril en la avenida, de manera que es necesario realizar el

conteo visual de los cambios de carril que ocurran en los tramos en los que se observe

las velocidades y las densidades promedio, para poder establecer las relaciones de

causa-efecto entre las 3 variables.

4.1.3 Análisis de la avenida José Eleuterio González(Gonzalitos).

Se realizó el análisis del comportamiento vehicular en un tramo de Gonzalitos

entre la Avenida Pablo González y Constitución a una hora pico, de 7 pm. a 8 pm.,

aproximadamente, obteniéndose los resultados que enseguida se presentan.

68

Figura 4.13 Tránsito vehicular en Gonzalitos.

Como es de esperarse, el comportamiento vehicular es diferente en una hora

pico, ya que los valores del flujo y densidad son altos mientras que la velocidad

disminuye.

En esta parte se presentan los resultados de comparar los cambios de carriles

contra las variables velocidad, densidad y flujo.

La figura 4.14 muestra el flujo y la densidad frente al tiempo a medida que

transcurre la grabación. Se observa un comportamiento similar en ambas variables a

medida que transcurre el tiempo.

En la figura 4.15 se observa una tendencia a disminuir el flujo a medida que la

densidad aumenta, Esto es cierto pues como afirma la teoría de tránsito [6, 17] a

medida que aumenta la densidad aumenta el flujo, pero a valores altos de la densidad,

como es el caso que se está analizando (una hora pico), el flujo empieza a disminuir, de

hecho puede llegar a ser cero, es decir no hay avance de coches, pues se pasa a un

estado de bloqueo o congestionamiento.

69

En la figura 4.16 se muestra la gráfica densidad contra velocidad; aquí

observamos nuevamente una tendencia a la baja medida que crece la densidad, es

decir los coches tienden a ir cada vez más lentos y la densidad va creciendo

precisamente porque tienden a permanecer en el mismo lugar de la avenida.

La figura 4.17 muestra el comportamiento del flujo frente a los cambios de

carril; en esta gráfica se observa que al incrementarse el número de cambios de carril

hay una tendencia a aumentar el flujo, como es de esperarse pues los cambios de carril

se generan por la necesidad de los conductores a avanzar más rápido por lo que al

cambiar de carril dejan un espacio que es ocupado por el que está atrás de él.

La figura 4.18 muestra la gráfica de cambio de carril contra densidad de flujo. Se

observa una ligera tendencia a disminuir, esto es debido a que al cambiar de carril, hay

un desplazamiento más rápido de los coches tanto los que cambian de carril como de

los que los vienen detrás de ellos, por lo que la densidad tiende a disminuir, aunque

muy ligeramente.

La figura 4.19 muestra la relación cambios de carril vs. velocidad; la gráfica

muestra una tendencia a aumentar la velocidad, dado que al cambiar de carril es

necesario incrementar la velocidad, lo cual trae como consecuencia que la velocidad

promedio observada se incremente también.

70

Figura 4.14 Esta gráfica muestra el comportamiento del flujo y la densidad frente al

tiempo

Figura 4.15 Gráfica que muestra la densidad vs. el flujo

Densidad y flujo vs tiempo

0

20

40

60

80

100

120

140

0 20 40 60 80 100

Tiempo(minutos)

Flu

jo

0

2

4

6

8

10

12

14

16

18

20

De

ns

ida

d

Flujo

densidad

Densidad vs Flujo

0

20

40

60

80

100

120

140

0 2 4 6 8 10 12 14 16 18 20

Densidad

Flu

jo

71

Figura 4.16 Gráfica que muestra como la velocidad va disminuyendo a medida que la

densidad crece.

Figura 4.17 Los cambios de carril favorecen el aumento del flujo, como se muestra en la

gráfica

Densidad Vs Velocidad

0.00

1.00

2.00

3.00

4.00

5.00

6.00

7.00

8.00

0 5 10 15 20

Densidad

Velo

cid

ad

Cambios de carril vs flujo

0

20

40

60

80

100

120

140

0 5 10 15 20 25

Cambios de Carril

Flu

jo

72

Cambios de carril vs densidad

0

5

10

15

20

0 5 10 15 20 25

Cambios de carril

De

nsid

ad

Figura 4.18 Gráfica donde se muestra como se comporta la densidad con los cambios de carril.

Cambios de carril vs velocidad

0.00

1.00

2.00

3.00

4.00

5.00

6.00

7.00

8.00

0 5 10 15 20 25

Cambios de carril

Ve

loc

idad

Figura 4.19 Gráfica donde se muestra el efecto de los cambios de carril sobre la velocidad.

Finalmente, en este análisis también se realizó la prueba F para verificar que el

flujo puede calcularse a partir de la ecuación (4.4). Los resultados que se obtuvieron

muestran que los valores observados y los calculados mediante la ecuación provienen

de la misma población.

Varianza de los datos observados: 253

73

Varianza de los datos calculados: 230.4

Fprueba (cociente 253/230.4): 1.10

F.025,78,78=1.56

F.975,78,78=0.639

Y dado que el valor del cociente Fprueba no está en la región de rechazo de la

hipótesis nula, no se rechaza esta hipótesis, de que provienen de la misma población.

74

CAPÍTULO 5

CONCLUSIONES. 5.1 Resultados.

El análisis de la información obtenida a partir de los videos nos ha permitido

contar con los parámetros que caracterizan el flujo de vehículos en ciertos puntos

específicos del Boulevard Constitución; esto nos permite, por una parte conocer el

comportamiento del tránsito vehicular a lo largo de esa avenida; por otro lado es

importante destacar que el estudio del comportamiento del tránsito vehicular ha sido

objeto de estudio de investigadores interesados en el tema en los últimos setenta años,

que es la época de crecimiento de la industria automotriz; en este lapso de tiempo, se

ha establecido una teoría que trata de explicar desde distintos enfoques y a través de

modelos el comportamiento del tránsito de vehículos; esta teoría es la llamada “Teoría

del Tránsito”, la cual fundamentalmente hace uso de las variables que hemos utilizado

en nuestro experimento: el flujo de vehículos, la densidad del tránsito y la velocidad

promedio.

Asimismo, esta investigación se ha enfocado a verificar la validez experimental

de la “teoría del tránsito” en algunos tramos de la avenida Constitución, por

considerarse muy representativa del comportamiento del tránsito en Monterrey.

Como se presentó en el análisis, se han obtenido las gráficas que muestran las

relaciones entre las diferentes variables bajo consideración, como son flujo contra

densidad, densidad y flujo contra tiempo, así como el comportamiento de la densidad y

el flujo a través del tiempo, todo esto como resultado de los experimentos realizados.

Asimismo, hemos caracterizado el movimiento vehículos por medio de una

variable adicional, los cambios de carril, en el que recientemente se han realizado

investigaciones [6] en diferentes tipos de modelos para saber cual es su influencia en el

comportamiento del tránsito vehicular.

75

Por otro lado, hemos verificado la validez de la ecuación de la teoría de

tránsito, en la que se establece que hay una relación directa entre el flujo y el producto

de la densidad y la velocidad; la teoría del tránsito afirma que a ciertas densidades esta

relación es válida, como lo podemos constatar en la gráfica 4.2. Observamos en la

gráfica que hay un valor de la densidad en la que la relación se pierde; este valor en

nuestro experimento está alrededor de seis; sin embargo, hay evidencia [17], que este

valor debe ser alrededor de 25. Debemos hacer notar que nuestro análisis está basado

en observaciones de algunas horas del día; los tiempos de observación utilizados en

otros experimentos es de un mes, e incluso hasta varios meses con tramos de vía más

grandes [48]; sin embargo, hemos observado que los resultados obtenidos tienden

estadísticamente a los mismos valores.

5.2 Trabajo futuro.

De este proyecto de investigación aún hay mucho trabajo por hacer, pues se

quedan como parte del proyecto la realización de experimentos adicionales aplicando

la metodología presentada en otros puntos del área metropolitana, donde las

condiciones del medio ambiente podrían ser más difíciles, lo cual dificultaría aún más

la parte de la detección automática en lo referente al análisis del tránsito. Otro tema de

investigación, sería analizar la interrelación entre puntos aledaños del área

metropolitana y ver el comportamiento de las variables bajo estudio y como influyen

entre sí.

La validación del modelo mediante el simulador de tránsito vehicular es otro de

los puntos que quedan en espera para saber si el modelo desarrollado en Simulink está

operando correctamente.

Por el lado de la visión computacional, es necesario mejorar el modelo de

detección de coches en movimiento, a través del uso de tecnologías de procesamiento

de imágenes más adecuadas y el diseño de algoritmos que permitan hacer eficiente el

proceso de detección de las manchas de interés y eliminar las manchas que nos

producen falsos positivos.

También por el lado de la visión computacional, es de interés poder identificar

no sólo el movimiento del vehículo, sino también poder clasificar el tipo de vehículo,

76

que es una tarea todavía más difícil; adicionalmente ser capaz de identificar

características del vehículo, así como detección de placas. Esto permitiría en un

momento dado, darle seguimiento a través de la red de cámaras instaladas en puntos

estratégicos de la ciudad, y se estará en posibilidad de ubicar algún vehículo de interés

para las autoridades.

77

APÉNDICE A.- SINTRAM

El SINTRAM (SISTEMA INTEGRAL DE TRANSITO METROPOLITANO,

es un sistema formado por 547 intersecciones sincronizadas en red cuya objetivo

principal es otorgar fluidez al tránsito vehicular, dicho sistema inicia sus operaciones

formalmente en el año 2001 y tiene cobertura sobre 7 municipios del Área

Metropolitana de Monterrey.

Cuenta con dos sistemas auxiliares uno formado por 20 cámaras que monitorean

los principales puntos de la ciudad y otro de 20 paneles electrónicos para dar

información a los conductores.

Participación Municipal:

La tabla A.1 muestra la información por municipio en lo que se refiere al número

de cruceros con semáforos, cruceros centralizados en el sistema SINTRAM, así como

su porcentaje de participación en el sistema SINTRAM.

78

Tabla A.1

MUNICIPIOS

CRUCERO CON

SEMÁFOROS

CRUCEROS

CENTRALIZADOS

PORCENTAJES DE

PARTICIPACIÓN

MONTERREY 570 363 66.36%

GUADALUPE 87 59 10.79%

SAN NICOLAS 87 57 10.42%

SAN PEDRO 58 46 8.41%

SANTA CATARINA

14 10 1.83%

ESCOBEDO 8 8 1.46%

APODACA 5 4 0.73%

TOTAL 829 547 100%

Para el funcionamiento más completo del sistema cuenta con otros elementos de

apoyo, como son los cruceros centralizados, las cámaras de video y los paneles

dinámicos, los cuales han permitido estructurar el sistema integral de monitoreo, como

se muestra en la tabla A.2.

Podemos observar que el municipio de Monterrey actualmente participa en el

sistema SINTRAM con 363 cruceros de un total de 547. También cuenta con 12

paneles informativos y 12 cámaras de monitoreo.

79

Tabla A.2.- Elementos de apoyo

MUNICIPIOS CRUCEROS CENTRALIZADOS

CÁMARAS DE

VIDEO

PANELES DINAMICOS

MONTERREY 363

12 12

GUADALUPE 59 2 2

SAN NICOLAS 57 2 2

SAN PEDRO 46 2 2

SANTA CATARINA

10 1 1

ESCOBEDO 8 1 1

APODACA 4 0 0

TOTAL 547 20 20

FUNCIONAMIENTO

El sistema está diseñado para proporcionar el tiempo de verde en los semáforos

necesario para cada rama de una intersección, para lo cual toma en cuenta el volumen

de tránsito vehicular y sus características y reparte el tiempo de ciclo restante según

comportamiento del tránsito en cada momento.

Para lograr este propósito, el sistema hace uso de una serie de detectores que

cada segundo envían información a una computadora central del comportamiento de la

vialidad, los volúmenes de tránsito vehiculares, la formación de filas de vehículos y el

intervalo vehicular.

Esta información le permite al sistema determinar en intervalos de segundos en

forma automática qué luces deben estar en verde y cuales no.

TECNOLOGÍA SINTRAM COMPONENTES.

La tabla A.3 muestra los componentes con los que cuenta el sistema, así como el

número que determina la cantidad o la longitud de cada uno de ellos.

80

Tabla A.3 Componentes

COMPONENTE Numero

CONTROLADORES 300

ESPIRAS DETECTORAS 2,000

CABLE DE FIBRA ÓPTICA 80 KM

CABLE DE COBRE TIPO TELEFÓNICO

200 KM

CANALIZACIÓN 85 KM

INFORMÁTICA COMPUTADORAS CENTRALES (SERVIDORES HP) COMPUTADORAS HP KAYAK • TERMINALES • MÓDEMS • EQUIPOS PERIFÉRICOS • VIDEO PROYECTORES • OPERADORES DEL SISTEMA • DECISIONES DIARIAS POR CRUCERO

4 3 4

350 7 3 7

86,400

DECISIONES DIARIA TOTALES 47´260,800

DATOS TRATADOS DIARIAMENTE PARA PROCESAR Y DIRIGIR

183´600,000

Existen 547 intersecciones conectadas al sistema con detectores que envían la

información sobre volumen y fluidez del tránsito al centro de control.

La figura A.3 muestra los niveles de saturación de la asignación vehicular, según

reporte del Consejo de Transporte y Vialidad.

La meta del SINTRAM es lograr un 24% de mejora en los tiempos de recorrido,

y esto se evalúa a través la medición de los tiempos de las rutas y a través del apoyo

del Instituto de Ingeniería de la UANL se ha encontrado una disminución promedio de

25% a pesar del incremento del aforo vehicular .

Para medir el porcentaje de mejora, el SINTRAM tiene como referencia los

resultados de un modelo que realiza los cálculos de los tiempos de recorrido de las

quince rutas, bajo la suposición de que no existiera el sistema SINTRAM.

81

Figura A.3 Niveles de saturación.

En la figura A.4 se muestra la ubicación de los componentes del sistema en el

área metropolitana de Monterrey.

Figura A.4 Cobertura del SINTRAM

82

APÉNDICE B. Código

En este apéndice se presenta el código más importante desarrollado en Matlab para

el procesamiento de las imágenes. Se aclara que finalmente se utilizaron las facilidades de

Simulink para el desarrollo del modelo.

Programa para convertir las imágenes con estructura de video en formato avi a arreglos tridimensionales, donde cada plano contiene un fotograma.

clear all tic readerobj = mmreader('D:\SINTRAM2.avi'); %Lee los fotogramas en el video. vidFrames = read(readerobj,[1 200]); %Determina el número de fotogramas en el video. numFrames = get(readerobj, 'NumberOfFrames'); %Create a MATLAB movie struct from the video frames. for k = 1 : 200 mov = vidFrames(:,:,:,k); K(:,:,k)=rgb2gray(mov); end toc Programa para generar la caja limitante (bounding box), a partir de la

información proporcionada por Matlab en el campo BoundingBox de la estructura de datos.

imshow(I); hold on; for i=1:numObjects z(i,:)=graindata(i).BoundingBox; end for i=1:numObjects plot([z(i,1) z(i,1)+z(i,3) z(i,1)+z(i,3) z(i,1) z(i,1)],[z(i,2) z(i,2) z(i,2)+z(i,4)

z(i,2)+z(i,4) z(i,2)]) hold on end %programa para % leer del video los frames % quitar el background % checar pixel por pixel para poner o o 1 dependiendo si es background o

83

% foreground tic tiempoinicial=cputime close all, imtool close all %lee y despliega la imagen en escala de grises frame=1 for frame=1:45 M(:,:,frame)=imread(cat(2,'D:\USB

Shikatroniks\Movehi2\bad_0',num2str(frame,'%02d'),'.gif')); end t=cputime media=mean(M,3); cputime-t figure,imshow(uint8(media)), title ('esta es la media de todos los frames'); % pixeles correspondientes en 0,1 %Mstd=std(double(M),0,3); %C=zeros(512,512); Resta=imsubtract(M(:,:,1),uint8(media)); mediaframe=mean(mean(M(:,:,1))) desvst=std(std(double(M(:,:,1)))) CC=(Resta>(mediaframe*.75)); Matriz=Resta.*uint8(CC); figure,imshow(Matriz) toc %for I=1:512 % for J=1:512 % suma=0; % for k=1:45 % suma=suma+(M(I,J,k)-media(I,J))^2; % end % if M(I,J,1)>=(media(I,J)+ Mstd(I,J)) C(I,J)=M(I,J,1); % end % I,J % end %end %figure,imshow(C) cputime-tiempoinicial toc

Programa para probar los resultados de los diferentes tipos de filtros,

disponibles para el procesamiento de las imágenes.

frame=1 for frame=1:45

84

M(:,:,frame)=imread(cat(2,'C:\Proyecto de Tesis\Movehi\dt_00',num2str(frame,'%02d'),'.gif'));

end I=M(:,:,1); Imed33=medfilt2(I,[9 9]); figure, imshow(Imed33),title('filtro medfilt2 con 9 9') %For example, Bconordfilt2 = ordfilt2(I,5,ones(3,3)); %implements a 3-by-3 median filter; figure,imshow(Bconordfilt2),title('filtro mediana con ordfilt2'); Bmin = ordfilt2(I,1,ones(3,3)); %implements a 3-by-3 minimum filter; figure,imshow(Bmin),title('filtro mínimo 3 x 3'); %and Bmax = ordfilt2(I,9,ones(3,3)); figure,imshow(Bmax),title('filtro máximo 3x3'); %implements a 3-by-3 maximum filter. % Bnswe = ordfilt2(I,1,[0 1 0; 1 0 1; 0 1 0]); figure,imshow(Bnswe),title('filtro minimo norte, sur, este oeste NSWE'); %replaces each element in A by the minimum of its north, east, south, and

west neighbors. bminsobel=edge(Bmin,'Sobel'); bmincanny=edge(Bmin,'canny'); bminprewitt=edge(Bmin,'prewitt'); bminroberts=edge(Bmin,'roberts'); bminlog=edge(Bmin,'log'); bminzerocross=edge(Bmin,'zerocross',.27,'log'); subplot(2,1,1),imshow(bminsobel),title('filtro minimo con

sobel'),subplot(2,1,2),imshow(bmincanny),title... ('filtro minimo con canny'), subplot(2,2,1),imshow(bminprewitt),title('filtro

minimo con prewitt'), ... subplot(2,2,2),imshow(bminroberts),title('filtro minimo con roberts')

Programa para el proceso de imágenes, obteniendo las estadísticas de los objetos encontrados

close all, imtool close all % lee y despliega la imagen en escala de grises. tic frame=1 for frame=1:45 M(:,:,frame)=imread(cat(2,'C:\Proyecto de

Tesis\Movehi\dt_00',num2str(frame,'%02d'),'.gif')); end

85

I=M(:,:,1); imshow(I),title('imagen original') %estima el valor de los pixeles del background background = imopen(I,strel('rectangle',[3 3])); figure, imshow(background),title('con elemento estructurante rectangle [3 3]') % ver la aproximación del background como una superficie figure, surf(double(background(1:8:end,1:8:end))),zlim([0 255]); set(gca,'ydir','reverse'); %crear imagen con background uniforme I2 = imsubtract(I,background); figure, imshow(I2),title('imagen con background uniforme'); %Ajustar el contraste en la imagen procesada I3 = imadjust(I2); figure, imshow(I3),title('Ajuste de contraste con adjuste'); %crear una version binaroa de la imagen level = graythresh(I3); bw = im2bw(I3,level); figure, imshow(bw), title('versión binaria de la imagen') %Determina el numero de objetos en la imagen [labeled,numObjects] = bwlabel(bw,4); numObjects %examina la mtriz de etiquetas figure, imshow(labeled),title('examina matriz de etiquetas'); impixelregion %Desplegando la matriz de etiquetas como una imagen indexed con

pseudocolor pseudo_color = label2rgb(labeled, @spring, 'c', 'shuffle'); figure, imshow(pseudo_color),title('despliega la matriz de etiquetas como

imagen indexada con pseudocolor'); %Step 10: Measure Object Properties in the Image graindata = regionprops(labeled,'basic'); area51 = graindata(51).Area graindata(51).BoundingBox, graindata(51).Centroid %Step 11: Compute Statistical Properties of Objects in the Image maxArea = max([graindata.Area]) biggestGrain = find([graindata.Area]==maxArea) meanArea = mean([graindata.Area]) hist([graindata.Area],20) toc

%programa para % leer el video los frames % quitar el background % checar pixel por pixel para poner o o 1 dependiendo si es background o % foreground tic

86

tiempoinicial=cputime close all, imtool close all %Lee y despliega la imagen en escala de gris. frame=1 for frame=1:45 M(:,:,frame)=imread(cat(2,'D:\USBShikatroniks\Movehi2\bad_0',num2str(fra

me,'%02d'),'.gif')); end t=cputime media=mean(M,3); cputime-t figure,imshow(uint8(media)), title ('esta es la media de todos los frames'); % pixeles correspondientes en 0,1 %Mstd=std(double(M),0,3); %C=zeros(512,512); Resta=imsubtract(M(:,:,1),uint8(media)); mediaframe=mean(mean(M(:,:,1))) desvst=std(std(double(M(:,:,1)))) CC=(Resta>(mediaframe*.75)); Matriz=Resta.*uint8(CC); figure,imshow(Matriz) toc %for I=1:512 % for J=1:512 % suma=0; % for k=1:45 % suma=suma+(M(I,J,k)-media(I,J))^2; % end % if M(I,J,1)>=(media(I,J)+ Mstd(I,J)) C(I,J)=M(I,J,1); % end % I,J % end %end %figure,imshow(C) cputime-tiempoinicial toc

87

APENDICE C. Herramientas. C.1 Herramientas de procesamiento de las secuencias de imágenes.

Como se ha comentado, la herramienta utilizada para la visualización y

procesamiento de la información de los videos es MATLAB, particularmente el

módulo denominado SIMULINK, y de este módulo algo que podríamos llamar un sub

módulo denominado Video and Image Processing Blockset (un conjunto de bloques

para el procesamiento de video e imágenes). Nos enfocaremos a hablar un poco de

estos dos últimos, que es donde nos apoyamos para el desarrollo del proyecto de

investigación.

SIMULINK, es un software desarrollado por Mathworks Corporation [37] para

modelar, simular y analizar sistemas dinámicos.

SIMULINK es útil para construir modelos o bien para modificar y adecuar

modelos ya existentes. Soporta sistemas lineales y no lineales modelados en tiempo

continuo o discreto o bien en forma híbrida. Es utilizado por científicos e ingenieros

para modelar problemas de distintos tipos. Algunas de sus aplicaciones son:

Industria aeroespacial y defensa

Automotriz.

Comunicaciones

Electrónica y procesamiento de señales

Instrumentación médica.

SIMULINK provee un interfase gráfica de usuario(GUI) constituida por un

conjunto de bloques que permiten dibujar los modelos muy fácilmente.

88

Adicionalmente incluye una biblioteca de bloques que constituyen sus

componentes principales; pero además el usuario tiene la facilidad de construir sus

propios bloques si éstos no le son lo suficientemente útiles.

SIMULINK tiene una fuerte interacción con MATLAB, pues es necesario entrar

a MATLAB para que pueda correr; pero además utiliza características funcionales de

MATLAB para entrar datos al modelo, almacenar resultados para su visualización

desde MATLAB, realiza funciones dentro del modelo mediante llamadas integradas a

funciones y operadores de MATLAB.

Una vez que se arranca SIMULINK desde la línea de comandos de MATLAB,

se despliega una ventana con todos los submódulos que pueden ser utilizados. Si se

desea crear un modelo o abrir uno ya existente, se utiliza el menú File de SIMULINK,

creándose un a ventana con el modelo que se abre o bien una ventanita vacía con el

nombre untitled cuando es nuevo.

A partir de este momento el modelo puede ser creado o modificado según sea el

caso.

Uno de los submódulos a los que hacemos referencia es el llamado Video and

image processing blockset.

En seguida damos una explicación general de los elementos que integran este

submódulo.

El conjunto de bloques de video y procesamiento de imágenes (Inglés: Video

and Image Processing Blockset) es una herramienta para el procesamiento de imágenes

y video en el medio ambiente de Simulink® . En esta sección se dará una breve

introducción a este módulo de conjunto de bloques.

El módulo de conjunto de bloques para video e imágenes es una herramienta

usada para el diseño rápido, realización de prototipos, simulación gráfica, y generación

de código eficiente de algoritmos de procesamiento de video. Los bloques de Video

and Image Processing Blockset pueden importar secuencias de video en el medio

89

ambiente Simulink y realizar filtración en dos dimensiones, transformadas

geométricas y de frecuencia, procesamiento de bloques, estimación de movimiento,

detección de bordes y otros algoritmos de procesamiento de señales. También es

posibles usar el blockset junto con Real-time Workshop para generar automáticamente

código empotrable en C para ejecución en tiempo real.

El conjunto de bloques de Video and Image Processing Blockset soporta tipos de

datos en punto flotante, entero, y punto fijo. Para usar cualquier tipo de datos distintos

a doble precisión y punto flotante de precisión sencilla, es necesario instalar Simulink

Fixed point, otro de los módulos de Simulink.

C.2 Conceptos clave del conjunto de bloques.

El modulo Video and Image Processing Blockset interpreta matrices y arreglos

de entrada. Las imagines son conjuntos de datos de color o intensidad real valorados.

Los bloques interpretan las matrices de entrada como imágenes, donde cada elemento

de la matriz corresponde a un píxel en la imagen desplegada. Datos de video son una

serie de imágenes en el tiempo. Todos los blocks en el módulo pueden procesar

imágenes o videos.

Tipos de imágenes.

Las imágenes pueden ser binarias, intensidad (escala de gris) o RGB.

Imágenes binarias. Las imágenes binarias son representadas por una matriz

booleana de 0’s y 1’s, que corresponden a los pixeles negro y blanco respectivamente.

Se puede obtener más información en la caja de herramientas de procesamiento

de imágenes (Inglés: Image Processing Toolbox)

Imágenes de Intensidad. Son representadas por una matriz de valores de

intensidad. Mientras las imágenes de intensidad no sean almacenadas con colormaps,

se puede utilizar un colormap gris para desplegarlas.

Imágenes RGB.

90

Las imágenes RGB son también conocidas como imágenes true-color . Esas

imágenes son representadas por un arreglo de tres planos, donde el primer plano

representan las intensidades en rojo del píxel, el segundo plano representa las

intensidades en verde y el tercero las intensidades en azul. Los bloques que realizan

operaciones en color, esperan tres matrices de entrada, una para cada componente de

color.

Los módulos que son utilizados en este trabajo se listan en seguida.

Análisis y mejora consta de diez bloques:

1.- Block matching (correspondencia de bloques):

Estima el movimiento entre dos imágenes o dos cuadros

de video usando el método de correspondencia de

2.- Contrast adjustment (ajuste de contraste):

Ajusta el contraste de una imagen escalando linealmente

los valores de pixeles entre valores inferiores y

3.- Detector de esquinas: localiza esquinas y

número de esquinas.

4.- Deinterlacing (convierte video entrelazado a

una forma no entrelazada). Remueve artefactos en

movimiento de imágenes compuestas de campos tejidos

5.-Detector de bordes. Encuentra los bordes en una

imagen de entrada usando métodos Sobel, Prewitt,

Roberts o Canny. El block saca una imagen binaria, una

matriz de valores booleanos, donde valores de píxel igual

a 1 corresponde a bordes. Para los primeros tres métodos,

6.- Equalización de histograma. Resalta el contraste

de la imagen de entrada usando ecualización de

histograma. 7.- Filtro Mediana: efectúa filtración mediana de la

matriz de entrada I

91

El módulo de umbralización consta de siete bloques.

8.- Flujo Óptico: estima el flujo óptico a través de

dos o más videoframes.

9.- SAD: Calcula la suma 2D de diferencias

absolutas(SAD) desplazando la plantilla de la imagen en

incrementos de un píxel a través del interior de la imagen

I. Se puede usar el puerto ROI para definir una región de

10.- Trazo de fronteras: traza las fronteras de

objetos en una imagen binaria BW, en la cual pixeles

diferentes de cero pertenecen a un objeto y pixeles cero

11.- Autoumbral. Automáticamente convierte una

imagen de intensidad a una imagen binaria. Usa el

método de Otsu, el cual determina el umbral partiendo el

histograma de la imagen de entrada tal que la varianza

para cada grupo de pixeles sea minimizada.

12.- Remuestreo de color: Muestrea hacia arriba o

hacia abajo los componentes de una señal YCbCr para

reducir el ancho de banda o requerimientos de 13.- Conversión del espacio de colores: Convierte

información de color entre espacios de colores.

14.- Demosaic: Realiza el demosaicing de una

imagen de entrada en formato Bayer con el alineamiento

especificado. El alineamiento es identificado como la

secuencia de R,G y B pixeles en los cuatro pixeles de la

izquierda en el tope de la imagen en orden por filas.

92

El submódulo de Filtración consta de cuatro bloques.

El sub módulo de Transformaciones Geométricas tiene 5 bloques:

15.- Corrección Gamma: Aplica o remueve

corrección Gamma.

16.- Complemento de imagen: Calcula el

complemento de una imagen binaria o de intensidad. Para

imágenes binarias, el block remplaza ceros por unos y

unos por ceros, en la imagen de salida el negro y blanco

son intercambiados. Para imágenes de intensidad, el

block resta el valor de cada píxel del valor máximo que

puede ser representado por el tipo de datos de la entrada y

sca la diferencia. En la imagen de salida, las áreas

oscuras se ven más claras y las áreas claras más oscuras.

17.- Image Data Type Conversión. Convierte y

escala la imagen de entrada al tipo de datos de salida

18.- 2-D Conversión: Realiza la convolución

bidimensional sobre dos entradas.

19.- 2-D FIR Filter: Realiza filtración

bidimensional FIR de la matriz I usando el filtro de

20.- Kalman Filter: Estima el estado de un sistema

dinámico de una serie de medidas incompletas y/o

ruidosas. Este block usa el estado previamente estimado

para predecir el estado actual. También puede usar la

medida del estado actual y el estado predicho para

21.- Median Filter: efectúa la filtración mediana de

la matriz de entrada I.

22.- Projective Transformation: Convierte una

imagen rectangular a una cuadrilateral, cuadrilateral a

rectangular o imagen cuadrilateral a otra imagen

cuadrilateral.

93

Las operaciones morfológicas son siete:

23.- Resize: Cambia el tamaño de una imagen o de

una región de interés dentro de una imagen.

24.- Rotate: Gira una imagen un cierto ángulo en

radianes. Este ángulo se puede especificar usando la caja

de diálogo o un puerto de entrada. 25.- Shear: desplaza cada renglón o columna de

una imagen por una distancia aumentante o decreciente

linealmente.

26.- Translate: Mueve una imagen arriba o abajo,

izquierda o derecha.

27.- Bottom-hat: Realiza la operación morfológica

bottom-hat sobre una imagen de intensidad o binaria.

29.- Close: Realiza closing morfológico sobre una

imagen binaria o de intensidad.

28.- Dilate: Realiza dilation morfológico sobre una

imagen binaria o de intensidad.

30.- Erode: Realiza la operación morfológica

erosión sobre una imagen de intensidad o binaria.

31.- Label: Etiqueta y cuenta componentes

conectados en una imagen binaria.

32.- Open: efectúa la operación morfológica

opening sobre una imagen binaria o de intensidad.

94

Librería Links, contiene 6 bloques. :

33.- Top-hat: Realiza la operación morfológica top-

hat sobre una imagen binaria o de intensidad

35.- Frame rate display: Calcula y despliega la tasa

de frames de la señal de entrada.

34.- To multimedia file: Escribe muestras de

frames de video y/o de audio a un archivo multimedia..

36.- To video display: Envía datos de video en vivo

a un dispositivo de salida de video, cámara, monitor

conectado al sistema

37.- Video to workspace: Escribe la entrada a un

arreglo especificado en el workspace de Matlab. El

arreglo no está disponible hasta que la simulación para.

39.- Video Viewer: Despliega imágenes o video

38.- Write binary file: Escribe datos binario de

video a un archivo en el formato especificado

95

APÉNDICE D.- Modelo.

En seguida se anexan algunos módulos del modelo para la detección y conteo de

vehículos en movimiento.

Sistema de caracterización de flujo vehicular

Limpia la imagen

I

Th. Img

Count

BoundBox

Vel

Input

RGB

EOF

I

Display Results

Th. Img

Count

BBox

Vel

Video In

Message

Show_Polygon

Vel

4

BoundBox

3

Count

2

Th . Img

1

Thresholding and

Region Filtering

Vel

Th. Img

Count

BBox

Optical Flow

(Horn -Schunck)II VV

2-D FIR Filter

2-D FIR

FilterI

I

1

BBox

3

Count

2

Th . Img

1

Velocity Threshold

Vel Th. Vel

>=

Region Filtering

BW

Count

Regions

Median

FilterI

|u|2

Closing

CloseVel

1

96

Threshold

To Video

DisplayImageImageImage

Switch

single ([1 0 0 ;1 0 0 ; 0 0 0 ;0 0 0 ])

Results

To Video

DisplayImageImageImage

Original

To Video

DisplayImageImageImage

Optical Flow Lines

vel .Values vel .Lines Motion Vector

To Video

DisplayImageImageImage

Insert Text

' ...'

ImageImageImage

Select

Image

Color

ImageImage

Draw

Lines

Image

Pts

Draw

Lines

Image

Pts

Draw

Lines

Image

Pts

Draw

Lines

Image

Pts

Draw

Lines

Image

Pts

Draw Polygon 3

,170 ,440 ,110

Draw Polygon 2

236 ,440Draw Polygon 1

210 ,440Draw Polygon

270 ,440

Display bounding boxes

and number of cars

Count

BBox

Video In

Video Out u+0

Show _Polygon

7

Message

6

Video In

5

Vel

4

BBox

3

Count

2

Th . Img

1

97

Black background

for count

Create white

line

Video Out

1

Insert Text

'%4d'

ImageImageImageImage

Variables

ImageImageImage

Draw Shapes 2

Draw

Lines

Image

Pts

Draw Shapes 1

Draw

Polygons

Image

Pts

Draw Shapes

Draw

Rectangles

Image

Pts -C-

1

[1x4]

0

1

Assignment 2

Y0

UY

Assignment 1

Y0

UYA

Assignment

Y0

UY

Video In

3

BBox

2

Count

1

98

GLOSARIO

Algoritmo ISODATA. Es un algoritmo iterativo para el estimado de umbrales.

A partir de la primera estimación de un umbral, se van recalculando los parámetros y

nuevos umbrales sucesivamente.

Autómata celular. Modelo matemático para sistemas dinámicos que

evolucionan en pasos discretos. Se utilizan para la modelación de sistemas naturales

que contienen una colección masiva de objetos y que interactúan entre sí en forma

local. Algunas de sus aplicaciones son en modelación de tránsito vehicular y peatones,

fluidos y evolución de células.

Calibración de la cámara. Método mediante el cual se estiman los parámetros

intrínsecos y extrínsecos de la cámara, así como los parámetros del manipulador.

También es posible calcular los parámetros del modelo de distorsión del lente de la

cámara.

Clasificación. Proceso de agrupar los píxeles en un número finito de clases

individuales o de categorías de datos con base en los niveles digitales de los datos. Si

un píxel satisface cierto criterio, entonces el píxel es asignado a la clase que

corresponda a este criterio.

Detección de movimiento. Proceso por el cual se determina cuales son los

objetos que están en movimiento en una imagen.

Imagen. Colección de medidas o valores en el espacio bidimensional (2D) o

tridimensional (3D).

Píxel. Cada uno de los puntos que constituyen una imagen en la memoria de la

computadora o en la pantalla.

Procesamiento Digital de Señales. Área de la ingeniería que se dedica al

análisis y procesamiento de señales discretas (audio, voz, imágenes, video). Por lo

99

general las señales en la naturaleza son en forma analógica, existen situaciones en

las que son por su naturaleza digitales, por ejemplo, el número de personas en una cola

de espera, el estado de una puerta (abierta/cerrada).

Rayos X. Forma de energía electromagnética con longitud de onda que van de

los 10 a los 10-2 nanómetros y que son usados para diagnósticos médicos y en

cristalografía.

Reconocimiento de patrones. Dado un conjunto de datos, determinar su

comportamiento (patrón) y en base a ello tomar una acción.

Región de Interés (ROI). Parte seleccionada de la imagen para propósitos de

análisis.

Segmentación de imágenes. Partición de una imagen en regiones

constituyentes no solapadas, las cuales son homogéneas con respecto a alguna

característica como una intensidad o una textura.

Umbralización (thresholding). Método que busca segmentar imágenes

creando una partición binaria de las intensidades de las imágenes. Trata de

determinar un valor de intensidad, llamado umbral (threshold), que separa las clases

deseadas.

Visión de máquina. Estudio de métodos y técnicas a partir de los cuales

puedan construirse sistemas de visión artificial y que puedan ser aplicados a la

solución de problemas prácticos.

100

BIBLIOGRAFÍA

[1] Aysen, T.; Kucukkececi, C. Techniques for background subtraction in urban traffic

videos, Computer Engineering Department, Bilkent University, Ankara, Turkey.

(2000).

[2] Besag, J. On the statistical analysis of dirty pictures, Journal Royal Statistical

Society B, Vol. 48, No. 3, pp. 259–302. (1986).

[3] Bezdek, J. C.; Pal, S. K. Fuzzy Models for Pattern Recognition, Methods that

search structure in data. Pal IEEE Press. (1992).

[4] Brito, D. Imágenes que confunden a la vista y a la mente,

http://serdis.dis.ulpgc.es/~ii-dgc/David/Ilusiones/ilusiones.html

[5] Chetverushkin, B. N.; Churbanova, N. G.; Karamzin, Y. N. y Trapeznikova, M. A.

A two-dimensional macroscopic model of traffic flows based on KCFD-schemes;

European Conference on Computational Fluid Dynamics ECCOMAS CFD 2006;

P. Wesseling, E. Oñate, J. Périaux (Eds),TU Delft, The Netherlands, (2006).

[6] Chowdhury, D.; Wolf, D.E.; Schreckenberg, M. Particle hopping models for two-

lane traffic with two kinds of vehicles: Effects of lane-changing rules, Physica A

235 pp. 417-439. (1997).

[7] Cohen, I.; Medioni, G. Detecting and Tracking Moving Objects for Video

Surveillance. Proc. IEEE Conf. Computer Vision and Pattern Recognition, Vol. 2,

pp. 2319-2326. (1999).

[8] Coto, E. Métodos de segmentación de imágenes médicas, Lecturas en Ciencias de

la Computación. Universidad Central de Venezuela, Facultad de Ciencias, Escuela

de Computación, Laboratorio de Computación Gráfica. (2003).

[9] Koller, D.; Weber, J. y Malik, J. Robust multiple car tracking with occlusion

reasoning. In Proc. European Conf. on Computer Vision, pp. 189-196. (1994).

101

[10] Davies, E. R. Machine Vision: Theory, Algorithms, Practicalities, Elsevier,

(2005).

[11] De la Rosa, J. I.; Villa, J. J.; Miramontes, G.; Gracia, E.; Araiza, A.; Sifuentes, C.

Campos de Markov, criterios convexos y no convexos para la restauración de

imágenes, Encuentro de Investigación en Ingeniería Eléctrica, Universidad

Autónoma de Zacatecas, Zacatecas, México. (2005).

[12] Devijver, P.A.; Kittler, J.V. Pattern Recognition. A statistical approach, Prentice

Hall Englewoods, Cliffs. (1982).

[13] Duda R. y Hart P. Pattern Classification and Scene Analysis, John Wiley & Sons.

(1973).

[14] Fernández, A.; Montoya, M.; Fernández, M. A. y Gómez, F. J. Un enfoque

neuronal al seguimiento de un objeto a través de su tamaño y localización,

Universidad de Castilla-La Mancha; Albacete, España. (2000).

[15] Fukunaga K. Introduction to Statistical Pattern Recognition, 2a edición, Academic

Press. (1990).

[16] Fujiyoshi, H.; Lipton, A.J.; Patil, R.S. Moving target classification and tracking

from real-time video. Proceedings of the Workshop on Application of Computer

Vision, IEEE, pp. 8 – 14. (1998).

[17] Garber J. N.; Lester A. J. Ingeniería de Tránsito en Carreteras, 3a edición,

Universidad de Virginia, Cengage Learning. (2005).

[18] Geman, S.; Geman, D. Stochastic relaxation, Gibbs distribution, and the Bayesian

restoration of images. IEEE Transactions on Pattern Analysis and Machine

Intelligence: Vol. 6, pp. 721–741. (1984).

[19] González, R., Woods, R., Tratamiento Digital de Imágenes, Addison Wesley.

(1996).

102

[20] Guasch, T.; Puig, V.; Figueras, J.; Ramos, J. J. Simulación de procesos

logísticos y retos para la optimización de flotas en tiempo real; LogiSim. (2002).

[21] Gupte, S.; Masoud, O.; Martin, R. F. K.; Papanikolopoulos, N.P. Detection and

Classification of Vehicles, IEEE Trans. On Intelligent Transportation Systems,

Vol. 3, No.1. (2002).

[22] Hand D.J. Discrimination and Classification, John Wiley and Sons. (1981).

[23] Hongeng, S.; Nevatia, R.; Bremond, F. Video-based event recognition: Activity

representantion and probabilistic recognition methods. Institute for Robotics and

Intelligent Systems, University of Southern California, Los Ángeles, CA, U.S.A.

(2004).

[24] Jia, B.; Jiang, R.; Wu, Q.; Hub, M. Honk effect in the two-lane cellular automaton model for traffic flow, Physica A 348 pp. 544–552. DOI: 10.1016/j.physa.2004.09.034 (2005).

[25] Jinman, K.; Cohen, I.; Medioni, G.; Yuan, Ch. Detection and Tracking of Moving

objects from a Moving Platform in Presence of Strong Parallax. Institute of

Robotics and Intelligent Systems. University of Southern California, USA. (2005).

[26] Kamijo, S.; Matsushita, Y.; Ikeuchi, K.; Sakauchi, M. Occlusion robust tracking

utilizing spatio-temporal markov random field model. In Proc. IEEE 15th Int. Conf.

Pattern Recognition, Vol. 1, pp. 140-144. (2000).

[27] Laval, J.A.; Leclercq, L. Microscopic modeling of the relaxation phenomenon

using a macroscopic lane-changing model, Transportation Research Part B

doi:10.1016/j.trb.2007.10.004. (2007).

[28] Leventon, M. E.; Grimson, W. E. L.; Faugeras, O.; Well, W. M. Level set based

segmentation with intensity and curvature priors. III Biomedical Imaging, 5th IEEE

EMBS International Summer School on Volume, D.O.I.

10.1109/SSBI.2002.1233988, pp. 15-23, (2002).

[29] Lozano, A., Torres V., Antún, J. P. Tránsito vehicular en zonas urbanas; Revista

Ciencias 70. (2003).

103

[30] Maerivoet, S.; De Moor, B.Transportation Planning and Traffic Flow Models,

arXiv:physics/0507127v1 [physics.soc-ph] , (2005).

[31] Maravall, D. Reconocimiento de Formas y Visión Artificial, Editorial Ra-Ma.

(1993).

[32] Marr, D. Vision: A Computational Investigation into the Human Representation

and Processing of Visual Information. (1982).

[33] MathWorks, Inc. http://www.mathworks.com.

[34] McLachlan, G. J. Discriminant Analysis and Statistical Pattern Recognition, John

Wiley and Sons. (1992).

[35] MacQueen, J. B. Some methods for classification and analysis of multivariate

observations, Proceedings of 5-th Berkeley Symposium on Mathematical Statistics

and Probability, Berkeley, University of California Press, 1:281-297. (1967).

[36] Mejía, G.; Sánchez, J.; Obregón, F.; Daumerie J.; Horne. J.; Burnette, A. Mobile

source emission inventory of the Monterrey Metropolitan Area using the Mobile 5

model”, Proceedings of the 97th A and WMA Annual Conference and Exhibition,

Indianapolis, Indiana, June 22 - 25, 2004. ISBN: 0-923204-63-6. (2004).

[37] Michie, D.; Halter, D.J.; Taylor, C. C. Machine Learning, Neural and Statistical

Classification, Ellis Horwood Series in AI, Ellis Horwood, New York, N.Y.

(1994).

[38] Montgomery, D. C.; Runger, G. C. Probabilidad y Estadística Aplicadas a la

Ingeniería, Primera Edición, Mc Graw Hill. (1996).

[39] Murat, T.A. Digital Video Processing , Prentice Hall Signal Processing Series.

(2005)

[40] Nagel, K.; Wagner, P.; Woesler, R. Still Flowing: Approaches to traffic flow and

traffic jam modeling. Operations Research 51(5): 681-710. (2003).

104

[41] Molina, R. Introducción al procesamiento de imágenes digitales,

Departamento de Ciencias de la Computación, Universidad de Granada. (2005).

[42] Oberti, F.; Calcagno, S.; Zara, M.; Regazzoni, C. Robust Tracking of Humans and

Vehicles in Cluttered Scenes with Occlusion. International Conference on Image

Processing. (2002).

[43] Osborne, H. S. Artificial Intelligence using C, McGraw Hill. (1987).

[44] Pang, C. C.; Lam, W.L.; Yung, H. C. A novel method for resolving vehicle

occlusion in a monocular traffic-image sequence. IEEE Trans. on Intelligent

Transportation Systems. Vol. 5, No. 3. (2004).

[45] Passarello, G. Imágenes médicas, adquisición, análisis, procesamiento e

interpretación, Editorial Equinoccio. (1998).

[46] Parker, J. R., Algorithms for Image Processing and Computer Vision,

Pattern Recognition Letters, John Wiley and sons. (1997).

[47] Sauer, K.; Bouman, C. Bayesian Estimation of Transmission Tomograms Using

Segmentation Based Optimization, IEEE Trans. on Image Processing, Vol. 2, No.

3, pp. 296-310, July (1993).

[48] Schönof, M.; Helbin, D. Empirical features of congested traffic states and their

implications for traffic modeling. Transportation Science 41(20): 135-166. (2007).

[49] Shapiro, L.G; Stockman, G.C. Computer Vision, Prentice Hall. (2001).

[50] Song, X.; Nevatia, R. A Model-based vehicle segmentation method for tracking.

;Institute for Robotics and Intelligence System, University of Southern California,

Los Angeles. (2000).

[51] Viola, P.; Jones, M. Robust real-time object detection, Second international

workshop on statistical and computational theories of vision, modeling, learning,

computing and sampling; Vancouver, Canada. (2001).

105

[52] Walpole, R. E.; Myers, R. H.; Myers, S.L. Probabilidad y Estadística para

Ingenieros, Sexta Edición, Prentice Hall. (1998).

[53] Wang, Y.; Loe, K.F.; Wu, J.K. A dynamic conditional random field model for

foreground and shadow segmentation. IEEE Trans Pattern Anal Mach Intell.

28(2):279-89. (2006).

[54] Wen-Long J. A kinematic wave theory of lane-changing vehicular traffic,

arXiv.org > math > arXiv:math/0503036v1. (2005).

106

FICHA AUTOBIOGRÁFICA.

Fidencio Sánchez Rueda nació en la ciudad de Monclova, Coahuila, el 12 de

Agosto de 1952 y vivió sus primeros 19 años en Ciudad Frontera, a 5 kilómetros de

Monclova; su padre, Porfirio Sánchez Saldaña (†) fue trabajador de Ferrocarriles

Nacionales de México, empresa paraestatal ya desaparecida, y su madre, María

Ruperta Rueda Santibáñez, se dedicó las labores del hogar. Tuvo 2 hermanos (Antonio

y Fernando), y 5 hermanas (María Isabel, María del Refugio, María de la Paz, Martha

Patricia e Irma Guadalupe).

Estudió la instrucción primaria en la Escuela Ferrocarriles Nacionales Artículo 123

en Ciudad Frontera (1960-1966), y la secundaria y preparatoria en la Escuela

Secundaria y Preparatoria Federal Número 24 de Monclova (1966-1971).

Posteriormente se trasladó a la Ciudad de Monterrey, Nuevo León, donde por

medio de una beca estudió en el Instituto Tecnológico y de Estudios Superiores de

Monterrey la carrera de Ingeniero en Sistemas Computacionales(1971-1975) y la

carrera de Licenciado en Ciencias Físicas(1972-1976) en la Facultad de Ciencias

Físico Matemáticas de la Universidad Autónoma de Nuevo León; asimismo, ya

incorporado a la fuerza laboral, estudió la Maestría en Sistemas en la Facultad de

Ciencias Químicas de la UANL y la Maestría en Administración con especialidad en

Relaciones Industriales en la Facultad de Ingeniería Mecánica y Eléctrica de la UANL.

Viajó a la Ciudad de México, donde estuvo un poco más de dos años (1976-1978)

laborando en empresas de servicios de sistemas.

Desde 1979 ha trabajado en diversos grupos industriales de Monterrey e

impartiendo clases en la Universidad Autónoma de Nuevo León, estando actualmente

asignado a la Preparatoria 16.

A partir del año 2000 se ha dedicado exclusivamente a las labores docentes, en

ocasiones realizando consultorías de sistemas y del área de compensaciones en algunas

empresas de Monterrey y el área metropolitana, enfocando sus esfuerzos en el logro de

una de sus metas más importantes: Obtener el Doctorado con especialización en áreas

afines a sus estudios de licenciatura y maestría.