An¶alisis de la in°uencia de las aberraciones del sistema ...

33
Grup de Recerca en ` Optica F´ ısica Departament de F´ ısica Aplicada i ` Optica Universitat de Barcelona An´ alisis de la influencia de las aberraciones del sistema difractor en el reconocimiento de im´ agenes por correlaci´on´optica Julio D. P´ erez Tudela Junio de 2006

Transcript of An¶alisis de la in°uencia de las aberraciones del sistema ...

Page 1: An¶alisis de la in°uencia de las aberraciones del sistema ...

Grup de Recerca en Optica Fısica

Departament de Fısica Aplicada i Optica

Universitat de Barcelona

Analisis de la influencia de las aberraciones del sistemadifractor en el reconocimiento de imagenes por

correlacion optica

Julio D. Perez TudelaJunio de 2006

Page 2: An¶alisis de la in°uencia de las aberraciones del sistema ...

Parte I

Fundamentacion teorica

9

Page 3: An¶alisis de la in°uencia de las aberraciones del sistema ...
Page 4: An¶alisis de la in°uencia de las aberraciones del sistema ...

Capıtulo 1

Reconocimiento de formas por

correlacion optica

1.1. Introduccion

Dentro de la denominacion “reconocimiento de formas” se engloban todos aquellosmetodos mediante los cuales es posible detectar la presencia de una determinada ima-gen, denominada imagen de referencia, dentro de otra imagen compleja, que recibe elnombre de escena. En el caso en que dicha imagen de referencia se encuentre presenteen la escena, algunos de estos metodos permiten ademas determinar su posicion. Estadisciplina ha ido adquiriendo en los ultimos anos una relevancia especial dentro delcampo del procesado de imagenes debido principalmente a la constante y progresi-va automatizacion de la mayorıa de procesos industriales, ası como al desarrollo denuevas lıneas de innovacion tecnologica, tales como la inteligencia artificial, la visionpor computador o la teledeteccion.

Existe una gran variedad de tecnicas asociadas al reconocimiento de formas y altratamiento de imagenes, y en funcion de los elementos que utilizan podemos cla-sificarlas en tecnicas opticas, digitales e hıbridas. El primer tipo, como su propionombre indica, utiliza un conjunto de elementos opticos para realizar el procesado, loque garantiza una alta velocidad de procesado, pero plantean problemas debido a sulimitada flexibilidad. Por el contrario, las tecnicas digitales basan su funcionamientofundamentalmente en algoritmos ejecutados en un ordenador, aunque el alto costetemporal de algunos de ellos se contrapone a su flexibilidad y potencia. Una buenaposibilidad resulta trabajar con tecnicas hıbridas, las cuales intentan aprovechar las

Page 5: An¶alisis de la in°uencia de las aberraciones del sistema ...

12 Reconocimiento de formas por correlacion optica

ventajas de cada uno de ambos metodos y al mismo tiempo minimizar los efectos desus inconvenientes.

Dentro del conjunto de tecnicas opticas, destacan especialmente aquellas basadas enla comparacion entre los elementos de la escena y la imagen que se quiere detec-tar. Esta comparacion se realiza fundamentalmente mediante el desplazamiento de laimagen de referencia a lo largo y ancho de la imagen, de manera que se obtiene unconjunto de valores, tanto mas elevados cuanto mas similares son dicha imagen y laimagen correspondiente presente en la escena compleja. De este modo, la posicion delvalor maximo obtenido permite determinar la presencia de la imagen a detectar. Esteproceso de comparacion y asignacion posterior de valores recibe el nombre de corre-lacion. Presenta una serie de inconvenientes, como por ejemplo que unicamente sepuede utilizar para detectar formas del mismo tamano e identica orientacion, aunqueexiten metodos [HG78, CL78b, HA82a, HA82b] que solventan dichas dificultades.

1.2. Fundamentos de la correlacion optica

La correlacion entre dos funciones se puede expresar como:

(f ⊗ g)(r) =∫

Rn

f(r′)g∗(r′ − r)dr′ (1.1)

A partir de esta expresion se puede observar como la correlacion se obtiene al despla-zar la funcion g∗ (conjugada de g), multiplicar su valor en cada punto r

′por el valor

de la funcion f en dicho punto y realizar la suma para todos los puntos considerados.Los diferentes sumandos seran no nulos solo si al desplazar la funcion g∗ a un puntocualquiera r0 existe una zona comun entre ambas funciones. Ademas, cuanto mayorsea el parecido, mayor sera su contribucion al total de la suma.

En el caso de que tanto f como g representen imagenes, estas seran descritas unica-mente mediante funciones bidimensionales, f(x, y) y g(x, y). Puesto que el conceptoclasico de imagen va asociado a una distribucion bidimensional de valores de trans-mision, estas dos funciones tomaran unicamente valores reales, y seran, por tanto,reales. En este caso, g∗(x, y) = g(x, y), y por lo tanto, como se ha comentado ante-riormente, tanto mayor sera el valor de la correlacion cuanto mayor sea la similitudentre las funciones f(x, y) y g(x, y) trasladada. Ası pues, la correlacion resulta a prio-ri un buen mecanismo para reconocer un objeto determinado dentro de una escenaformada por varios elementos.

Page 6: An¶alisis de la in°uencia de las aberraciones del sistema ...

1.3. Difractometros 13

Una de las propiedades matematicas de esta operacion es el denominado Teoremade Convolucion [Goo68], el cual permite obtener la correlacion de dos funcionesf(x, y) y g(x, y) a partir del producto en el espacio complejo de sus transformadasde Fourier respectivas, F (u, v) y G(u, v).

TF{f(x, y)⊗ g(x, y)} = F (u, v)G∗(u, v) (1.2)

Por lo tanto, es posible realizar este producto en el espacio de Fourier, y posterior-mente, mediante una transformada inversa, obtener el valor de f(x, y) ⊗ g(x, y) sinnecesidad de realizar la integral reflejada en la expresion 1.1.

La posibilidad de utilizar lentes para realizar las transformadas de Fourier permitedisenar montajes opticos relativamente simples que posibilitan la obtencion practica-mente en tiempo real de la correlacion. Esta propiedad de las lentes podrıa generali-zarse del siguiente modo:

al iluminar un objeto f(x, y) situado frente a una lente se obtiene, enel plano focal de la misma, el espectro de frecuencias de dicho objeto,es decir, la amplitud de la transformada de Fourier, multiplicado poruna serie de factores de fase que unicamente dependen de las posicionesrelativas entre el objeto y la lente. En general se obtendra una funciondel tipo:

TF(u, v) ∝ F (x

λd,

y

λd) (1.3)

donde se han omitido terminos de proporcionalidad, y el valor de d de-pende de la configuracion utilizada (lente anterior o posterior al objeto,iluminacion convergente o paralela ...).

1.3. Difractometros

En condiciones de optica paraxial, se puede considerar el efecto de una lente en unfrente de onda incidente como la modificacion de dicho frente de onda mediante lainclusion de un termino de fase cuadratico de la forma tf (x, y) = e

−j k2f (x2+y2), donde

f representa la distancia focal de la lente, con signo positivo o negativo segun elconvenio de signos utilizado. Dicho termino de fase se puede considerar como unaaproximacion cuadratica a una onda esferica. Si la distancia focal f es positiva, laonda esferica es convergente hacia un punto situado en el eje optico a una distancia

Page 7: An¶alisis de la in°uencia de las aberraciones del sistema ...

14 Reconocimiento de formas por correlacion optica

f posterior a la lente, mientras que si la distancia focal f es negativa, la onda esfericadiverge desde un punto situado a una distancia f antes de la lente.

(a) Objeto pegado a la lente.

(b) Objeto anterior a la lente.

(c) Objeto posterior a la lente.

Figura 1.1: Configuraciones basicas de difractometros.

Como se ha comentado anteriormente, una de las propiedades mas importantes yutiles de las lentes es la posibilidad que ofrecen para realizar transformadas de Fou-rier bidimensionales de forma extremadamente simple, aprovechando las leyes de lapropagacion y la difraccion de la luz. Para ello se utilizan diversas configuraciones, la

Page 8: An¶alisis de la in°uencia de las aberraciones del sistema ...

1.3. Difractometros 15

geometrıa basica de tres de las cuales se presenta en la figura 1.1. En los apartados1.3.1 y 1.3.2 se va a describir el comportamiento de cada una de estas configuraciones,siguiendo el esquema que se puede encontrar en [Goo68].

En los tres casos se utiliza una iluminacion monocromatica, que se propaga en formade onda plana colimada, y la funcion a transformar es introducida en el sistema me-diante la utilizacion de un dispositivo con una transmision de amplitud proporcionalal valor de dicha funcion. Estos dispositivos pueden consistir en una simple trans-parencia fotografica, o bien puede utilizarse SLM. Tanto en un caso como en otro,unicamente se consideraran como soportes fısicos de la funcion de la cual queremosobtener su transformada.

1.3.1. Objeto anterior a la lente

Se tratara en primer lugar la situacion descrita en la figura 1.1(a), donde el objetose encuentra situado junto a la lente y podemos considerarlo una funcion t(x, y), quedescribe la amplitud de transmision en un punto de coordenadas (x, y), y que seencuentra uniformemente iluminado por una onda plana de amplitud A que incidede forma perpendicular. Por lo tanto, en la lente incide una distribucion de luz dadapor:

Ul(x, y) = At(x, y) (1.4)

Las dimensiones finitas de la lente pueden ser representadas asociando a la lente unafuncion de pupila P (x, y) del tipo:

P (x, y) =

1 dentro de la lente

0 en otro caso

(1.5)

Por lo tanto, podemos escribir la distribucion de amplitud detras de la lente como:

U ′l (x, y) = Ul(x, y)P (x, y)e[−j k

2f(x2+y2)] (1.6)

Para calcular la distribucion Uf (u, v) en el plano focal de la lente, aplicamos la ex-presion para la difraccion de Fresnel [Mah01]:

Uf (u, v) = e[jkf ] e[j k

2f(u2+v2)]

jλf×

+∞∫∫

−∞U ′

l (x, y)e[j k2f

(x2+y2)]e[−j 2π

λf(xu+yv)]

dxdy (1.7)

Page 9: An¶alisis de la in°uencia de las aberraciones del sistema ...

16 Reconocimiento de formas por correlacion optica

Sustituyendo en esta expresion la correspondiente a la distribucion U ′l (x, y), obtene-

mos:

Uf (u, v) = e[jkf ] e[j k

2f(u2+v2)]

jλf×

+∞∫∫

−∞Ul(x, y)P (x, y)e[−j 2π

λf(xu+yv)]

dxdy (1.8)

En el caso en que el objeto sea menor que la apertura de la lente, podemos obviar eltermino P (x, y), y por lo tanto:

Uf (u, v) = e[jkf ] e[j k

2f(u2+v2)]

jλf×

+∞∫∫

−∞Ul(x, y)e[−j 2π

λf(xu+yv)]

dxdy (1.9)

lo que quiere decir que la distribucion de amplitud compleja en el plano focal de lalente equivale a la transformada de Fourier de la distribucion de luz transmitida porel objeto, excepto por los terminos de fase que preceden a la integral. Estos termi-nos pueden despreciarse en el caso en que lo que nos interese sea la distribucion deintensidad, y no la amplitud compleja.

En el caso mostrado en la figura 1.1(b) el objeto se encuentra situado tambien en unaposicion anterior a la lente, pero a una distancia d de la misma. Si representamos porFo(fx, fy) el espectro de Fourier de la luz transmitida a traves del objeto (At(x, y)), ypor Fl(fx, fy) el de la luz incidente en la lente (Ul), y asumimos que la aproximacionde Fresnel es valida para la propagacion del frente de onda a lo largo de la distanciad, podemos escribir:

Fl(fx, fy) = Fo(fx, fy)e−jπλd(f2x+f2

y ) (1.10)

donde por simplificacion se ha omitido un termino de fase.

Si, por el momento, no tenemos en cuenta las dimensiones finitas de la lente (P = 1para cualquier valor de x e y), resulta:

Uf (u, v) =e[j k

2f(u2+v2)]

jλfFl(

u

λf,

v

λf) (1.11)

o, sustituyendo la expresion para Fl:

Uf (u, v) =e[j k

2f(1− d

f)(u2+v2)]

jλfFo(

u

λf,

v

λf) (1.12)

Page 10: An¶alisis de la in°uencia de las aberraciones del sistema ...

1.3. Difractometros 17

Finalmente, esto equivale a escribir:

Uf (u, v) =Ae

[j k2f

(1− df)(u2+v2)]

jλf×

+∞∫∫

−∞t(ξ, η)e[−j 2π

λf(ξu+ηv)]

dξdη (1.13)

Ası, la amplitud y la fase de la luz en un punto de coordenadas (u, v) se encuentranrelacionadas con la amplitud y la fase del espectro de entrada correspondiente a lasfrecuencias (

u

λf,

v

λf). La integral se encuentra multiplicada por un termino de fase

cuadratico que se anula en el caso en que d = f , es decir, cuando el objeto se encuentrasituado en el plano focal objeto de la lente. En este caso, el resultado que se obtienees exactamente la transformada de Fourier del objeto.

1.3.2. Objeto posterior a la lente

Consideremos ahora el caso en el que el objeto se encuentra situado en una posicionposterior a la lente, tal y como se muestra en la figura 1.1(c). El objeto, situado auna distancia d del plano focal imagen de la lente, se puede considerar, al igual queen el caso anterior, como una funcion t(x, y). La lente, a su vez, es iluminada perpen-dicularmente de manera uniforme por una onda plana monocromatica de amplitudA. Por lo tanto, la onda incidente en el objeto sera una onda esferica convergente consu centro en el punto donde el plano focal imagen de la lente intersecte al eje optico.

Considerando optica geometrica, la amplitud de la onda esferica que incide en el ob-

jeto tiene un valor de Af

d, puesto que las dimensiones geometricas del cono de luz se

han reducido en un factord

f, mientras que su energıa se ha conservado. La region del

objeto que es iluminada viene determinada por la interseccion de dicho cono de luzcon el plano donde se encuentra situado el objeto. Si la lente es circular y de diametro

l, dicha region es circular y con un diametrold

f.

Las dimensiones finitas del area iluminada pueden ser descritas utilizando una funcion

de pupila del tipo P [ξf

d, η

f

d]. Trabajando en la aproximacion paraxial, la amplitud

de la onda transmitida por el objeto viene descrita por la expresion:

U0(ξ, η) ={

Af

dP

(ξf

d, η

f

d

)e[−j k

2d(ξ2+η2)]

}t(ξ, η) (1.14)

Si consideramos difraccion de Fresnel desde el plano objeto hasta el plano focal ima-gen, el termino cuadratico en (ξ, η) presente en la ecuacion 1.14 cancela exactamente

Page 11: An¶alisis de la in°uencia de las aberraciones del sistema ...

18 Reconocimiento de formas por correlacion optica

el termino cuadratico que aparece en la integral de difraccion de Fresnel, y por lotanto:

Uf (u, v) =Ae[j k

2d(u2+v2)]

jλd

f

+∞∫∫

−∞t(ξ, η)P

(ξf

d, η

f

d

)e[−j 2π

λd(ξu+ηv)]dξdη (1.15)

Lo cual muestra que, excepto un termino de fase cuadratico, la distribucion de ampli-tud en el plano focal es la transformada de Fourier de la region del objeto iluminadapor el cono de luz que atraviesa la lente.

1.4. Arquitecturas basicas de correlacion

1.4.1. Correlador 4f y correlador convergente

En el apartado 1.3.1 hemos visto como al iluminar con ondas planas un objeto situadoen el plano focal objeto de una lente convergente, se obtenıa en el plano focal imagenla transformada de Fourier exacta de dicho objeto. Una de las propiedades de latransformada de Fourier [Goo68] nos dice que:

TF[TF[f(x, y)]] = f(−x,−y) (1.16)

y por lo tanto, acoplando en cascada dos sistemas como el anterior serıa posible re-construir la imagen inicial.

Figura 1.2: Esquema del correlador 4f.

El esquema propuesto es el que se muestra en la figura 1.2, y fue el primer montajepropuesto por VanderLugt en 1964 [Lug64]. Este esquema es el que se utiliza como

Page 12: An¶alisis de la in°uencia de las aberraciones del sistema ...

1.4. Arquitecturas basicas de correlacion 19

base para desarrollar los dispositivos de filtrado y tratamiento de imagenes mediantemetodos opticos, y debe su nombre (correlador 4f) a la distancia entre el plano deentrada, donde se coloca la escena, y el de salida, o plano de correlacion. Esta dis-tancia, en el caso en que trabajemos con dos sistemas opticos identicos, equivale acuatro veces la distancia focal de las lentes.

La escena (funcion f(x, y)) se situa, como ya hemos dicho, en el plano focal objetodel primer difractometro, y el filtro codificado (G∗(u, v)), que sera el encargado demodular la informacion de la transformada de la escena (ver ecuacion 1.2), en el planofocal imagen de la primera lente. Como se ha visto anteriormente, con esta configu-racion se obtiene en este plano la transformada de Fourier exacta de la escena, porlo que es aquı donde se realiza el producto F (u, v)G∗(u, v). Al realizarse la segundatransformacion con la segunda lente se obtiene en su plano imagen el producto decorrelacion f ⊗ g.

A la simplicidad que presenta este dispositivo se ha de contraponer una serie de in-convenientes, la mayorıa de los cuales son de tipo practico, ya que, por ejemplo, lalongitud total del montaje es siempre de cuatro veces la focal de las lentes, supo-niendolas iguales. Ademas, el acoplamiento de las escalas de la primera transformaday el filtro utilizado para modificar la informacion resulta un problema nada trivial.Finalmente, y tal vez la dificultad mas importante que plantea este montaje, encon-tramos la imposibilidad de modificar la escala de la transformada de Fourier de laescena, puesto que esta viene determinada por la distancia entre ella y la lente 1, quenecesariamente ha de coincidir con la distancia focal del sistema optico. Puesto queesta escala debe coincidir con la escala del filtro, el no poder modificarla sin reem-plazar el sistema optico reduce considerablemente la versatilidad del dispositivo.

Para solventar este conjunto de dificultades se puede trabajar con un procesador alter-nativo, el denominado correlador convergente. Dicho dispositivo es el que se muestraen la figura 1.3 y se trata tambien de un sistema optico con dos lentes convergentesde focales f ′1 y f ′2, pero que en este caso no se encuentran acopladas por su focal.El objeto se encuentra situado despues de la primera lente, y su transformada deFourier se forma en el plano imagen de la fuente de luz a traves de la primera lente.Es en este mismo plano donde se coloca el filtro. Finalmente, la imagen procesada esobtenida en el plano imagen del objeto a traves de la segunda lente.

Page 13: An¶alisis de la in°uencia de las aberraciones del sistema ...

20 Reconocimiento de formas por correlacion optica

Figura 1.3: Esquema del correlador convergente de Vander Lugt.

Para que el sistema funcione de forma adecuada es necesario, a su vez, que las dis-tancias entre los diferentes planos se encuentren relacionadas segun:

1d1 + d2

− 1d

=1f ′1

− 1d2 + d3

+1d′

=1f ′2

(1.17)

El comportamiento de este correlador se puede describir de manera intuitiva del si-guiente modo: el objeto, iluminado por la onda convergente proveniente de la lente 1,forma su imagen a traves de la lente 2. En el plano de Fourier obtenemos la figura dedifraccion del objeto, que incluye su transformada de Fourier, y es donde se coloca lainformacion del filtro. Por lo tanto, en el plano de correlacion se formara la imagendel objeto modificada por dicho filtro.

Este procesador presenta una ventaja importante respecto del correlador 4f, y es quela posicion del plano de entrada puede desplazarse, y puesto que la transformada delobjeto tiene un factor de escala λd2, se puede encontrar una distancia d2 que se ajustea la escala para la cual se ha calculado el filtro. Evidentemente, la modificacion de ladistancia d2 implica tambien la variacion de la posicion del plano de correlacion, demanera que se verifique la ecuacion 1.17

Page 14: An¶alisis de la in°uencia de las aberraciones del sistema ...

1.4. Arquitecturas basicas de correlacion 21

1.4.2. Generacion de filtros

Hemos visto anteriormente que para obtener la correlacion cruzada entre la imagenf(x, y) y la referencia a detectar g(x, y) utilizando un correlador 4f se ha de disenar elfiltro G∗(u, v). Ası, en el plano de Fourier de la primera lente se obtiene el productoF (u, v)G∗(u, v) y en el plano imagen de la segunda lente el termino f ⊗ g. Ahorabien, en general, la funcion G∗(u, v) es una funcion compleja, y su codificacion re-quiere metodos especiales, bien de holografıa optica o de holografıa digital.

La holografıa optica fue introducida por Gabor en 1949 [Gab49] como un metodo pa-ra “registrar y reconstruir frentes de onda”. Dicho metodo consistıa en iluminar unobjeto con un haz de luz monocromatico y coherente, denominado haz de referencia,y registrar en un soporte adecuado las interferencias entre dicho haz de referencia yel proveniente directamente de la misma fuente de luz.

Actualmente las tecnicas de holografıa digital generada por ordenador permiten codi-ficar funciones complejas, pero fue VanderLugt [Lug64] en 1964 el primero en describirun experimento de correlacion utilizando tecnicas opticas de holografıa para codifi-car el filtro. Para ello, se necesita generar previamente mediante un difractometro,tal y como se muestra en la figura 1.4, la transformada de Fourier (G(u, v)) de laimagen de referencia (g(x, y)) : en el plano objeto de la lente se coloca dicha imagende referencia, de modo que en el plano focal imagen se obtiene la transformada deFourier exacta. En dicho plano se coloca un registro fotografico que sera el encargadode registrar las interferencias entre la funcion G(u, v) y una onda plana de amplitudA que incide segun una direccion de propagacion que forma un angulo θ con el ejeoptico.

Figura 1.4: Generacion de un filtro de VanderLugt.

Page 15: An¶alisis de la in°uencia de las aberraciones del sistema ...

22 Reconocimiento de formas por correlacion optica

Por lo tanto, el registro de la placa es:

I(u, v) =∣∣G(u′, v′) + Ae(−j2παv)

∣∣2= |G(u′, v′)|2 + A2 + AG(u′, v′)e(j2παv) + AG∗(u′, v′)e(−j2παv)

(1.18)

donde se ha definido α = sin θλ .

Una vez realizado el proceso de revelado de la placa fotografica, se situa esta en elplano de Fourier de un procesador 4f en cuyo plano objeto se encuentra la imagenf(x, y). Para que las escalas de las transformadas de Fourier opticas coincidan esnecesario que la focal de la lente con la que se ha generado el filtro y la focal delprimer difractometro del correlador 4f coincidan.

Finalmente, en el plano focal imagen del segundo difractometro se obtiene:

U(u, v) = F (u, v)[|G(u, v)|2 + A2

]

+ Ae(j2παv)F (u, v)G(u, v)+ Ae(−j2παv)F (u, v)G∗(u, v)

(1.19)

Los tres terminos anteriores se pueden interpretar como:

1. El primer termino, o termino centrado, no aporta informacion relevante y sedifracta en la direccion del eje optico.

2. El segundo termino corresponde al producto de convolucion de las funciones f

y g, y al encontrarse modulado por una onda plana dirigida segun la direccionpositiva del eje v, se encontrara situado en uno de los laterales del terminocentral

3. El tercer termino incluye la correlacion entre la funciones f y g, y se encuentrasituado de forma simetrica al termino de convolucion respecto del eje optico.

1.4.3. Correlador de transformadas conjuntas

Una arquitectura alternativa al correlador de VanderLugt es el denominado correla-dor de transformadas conjuntas o JTC. La caracterıstica principal de este dispositivola determina el hecho de que no sea necesario disenar ningun filtro en el espacio deFourier, tal y como pasaba en el caso anterior, puesto que la introduccion de la escenay el objeto a detectar se realiza en el mismo plano de entrada.

Page 16: An¶alisis de la in°uencia de las aberraciones del sistema ...

1.4. Arquitecturas basicas de correlacion 23

Por otra parte, este correlador no puede trabajar en tiempo real, ya que se hacenecesario registrar la intensidad del plano de Fourier en un soporte fısico. De todosmodos, gracias a la evolucion de la tecnologıa de los dispositivos de cristal lıquido(o LCD1) y su uso conjunto con camaras de vıdeo (o CCD2), esta dificultad ya norepresenta un verdadero problema.

Figura 1.5: Esquema del correlador de transformadas conjuntas convencional.

Simplificando el proceso, se podrıa decir que en un primer paso se registra la dis-tribucion de intensidad producida por la transformada de Fourier optica del planode entrada o JPS. Esta distribucion es nuevamente transformada opticamente en unsegundo paso, y de este modo se obtiene la correlacion entre el motivo y la escena.

Ası, el procesador (figura 1.5) consiste en un sistema difractor en el que un haz deondas planas de longitud de onda λ ilumina conjuntamente la escena f(x, y) y lareferencia g(x, y), las cuales se encuentran situadas en el mismo plano, separadas unadistancia 2a. Este plano se encuentra situado a una distancia arbitraria d de unalente de focal f , en cuyo plano focal se registra de forma simultanea la informacionproveniente tanto de la escena como de la referencia.

1Liquid Crystal Devices2Charged-Coupled Device

Page 17: An¶alisis de la in°uencia de las aberraciones del sistema ...

24 Reconocimiento de formas por correlacion optica

Esta distribucion se reintroduce en el plano de entrada, de manera que al iluminarde nuevo el sistema, en el plano focal de la lente se obtiene la siguiente distribucion:

U(x, y) = f(−x,−y)⊗ f(−x,−y) + g(−x,−y)⊗ g(−x,−y)+ f(−x,−y)⊗ g(−x,−y) ∗ δ(x− 2a, y)+ g(−x,−y)⊗ f(−x,−y) ∗ δ(x + 2a, y)

(1.20)

Analizando el resultado, se observa como se obtienen los terminos de autocorrelacionde escena y referencia centrados y, de forma simetrica y centrados en los puntos decoordenadas (±2a, 0), los dos terminos de correlacion cruzada entre escena y referen-cia.

Page 18: An¶alisis de la in°uencia de las aberraciones del sistema ...

Capıtulo 2

Aberraciones geometricas en

sistemas opticos

Conocidas las caracterısticas geometricas (radios de curvatura y espesores) y opticas(ındice de refraccion) de las lentes que forman un sistema optico es posible deter-minar la posicion y tamano de la imagen de un objeto concreto [Hec00]. Incluso esposible calcular tambien la distribucion de intensidad de la imagen si, ademas, tantola posicion como el tamano de las pupilas de salida y de entrada son valores conocidos.

En el caso de que los sistemas opticos utilizados presenten simetrıa de revolucion yse cumplan las condiciones de optica paraxial, es posible obtener una representacionoptica perfecta entre pares de puntos. Ahora bien, estas condiciones de trabajo sonespecialmente restrictivas en lo que respecta a los valores de abertura y campo, demodo que resulta complicado cenirse a ellas. Esto hace que en el caso mas general,esta correspondencia exacta entre objeto e imagen se pierda, y las imagenes empie-cen a presentar ”defectos”: ası, los planos imagen se curvan, las imagenes se vuelvenmenos nıtidas, la semejanza total entre objeto e imagen desaparece ... Este conjuntode alteraciones que sufre la imagen son debidas principalmente a las caracterısticasfısicas del sistema optico y a sus condiciones de trabajo, y reciben el nombre de abe-rraciones geometricas.

Como idea previa, se podrıa definir la aberracion de un sistema para un determinadoobjeto puntual como la desviacion que experimenta el frente de onda en la pupila desalida respecto del frente de onda ideal. En el caso de aberracion nula, este frentede onda ideal es esferico, de modo que todos los rayos provenientes del punto objeto

Page 19: An¶alisis de la in°uencia de las aberraciones del sistema ...

26 Aberraciones geometricas en sistemas opticos

convergen en el punto imagen, y el resultado es una imagen puntual. En general,al trabajar con sistemas reales, dicha onda convergente sera solo aproximadamenteesferica, y por lo tanto esta correspondencia entre puntos no se conserva. Se puedeconsiderar, por lo tanto, que la calidad de la imagen vendra determinada por lasaberraciones del sistema optico.

2.1. Aberraciones de rayo y onda

La optica geometrica basa su estudio de la propagacion de la luz en dos concep-tos fundamentales: el de rayo luminoso para caracterizar a la luz, y el de ındice derefraccion para definir los medios materiales a traves de los cuales se realiza dichapropagacion. Ambos conceptos se complementan con tres leyes, las cuales rigen lapropagacion de los rayos en los medios: propagacion rectilınea, refraccion y reflexion.Estas tres leyes no son mas que consecuencias del principio de Fermat [Hec00].

Si un rayo de luz recorre un trayecto de longitud s en un medio homogeneo de ındicede refraccion n, se define el camino optico < L > de dicho rayo como el producto delındice de refraccion del medio y la longitud recorrida:

< L >= n · s (2.1)

Si en su trayectoria atraviesa diferentes medios de ındice de refraccion ni, y recorreen cada uno de ellos un trayecto de longitud si, el camino optico total sera:

< L >= n1 · s1 + n2 · s2 + ... =∑

i

ni · si (2.2)

De todos los rayos trazados desde el punto objeto, se denomina rayo principal aaquel rayo que atraviesa el centro del diafragma de apertura y pasa, real o virtual-mente, por los centros de la pupila de entrada y de la pupila de salida. Si cada uno delos rayos provenientes del objeto es trazado de modo que recorran el mismo caminooptico que el recorrido por el rayo principal, el extremo de cada uno de dichos rayosforma una superficie que recibe el nombre de frente de onda del sistema optico.

Si tras atravesar el sistema optico dicha superficie es esferica con su centro de curvatu-ra en la posicion de la imagen paraxial del punto objeto, la imagen sera perfecta. Ası,los rayos trazados a traves del sistema al propagarse desde el punto objeto P hasta el

Page 20: An¶alisis de la in°uencia de las aberraciones del sistema ...

2.1. Aberraciones de rayo y onda 27

punto imagen P′ recorren el mismo camino optico, y todos ellos pasan por P′. Ahorabien, si el frente de onda se desvıa respecto del frente de ondas esferico, tambiendenominado esfera de referencia, diremos entonces que la imagen esta aberrada.En esta situacion, los rayos no recorren el mismo camino optico, y su interseccion conel plano imagen paraxial ya no es el punto P′, sino puntos mas o menos cercanos ael. La distancia entre dichos puntos y la posicion de la imagen paraxial se denominaaberracion del rayo.

Por otro lado, se define [Mah98] la aberracion de onda correspondiente a un ra-yo determinado en el punto Q, donde intersecta a la esfera de referencia, como ladiferencia de caminos opticos recorridos por el rayo considerado y el rayo principalal desplazarse ambos desde el punto objeto hasta la interseccion con dicha esfera dereferencia.

Figura 2.1: Frente de onda aberrado para un objeto puntual situado sobre el ejeoptico.

La figura 2.1 muestra el esquema anterior para el caso de un objeto puntual situadosobre el eje optico: un rayo arbitrario RG intersecta a la esfera de referencia ER y alfrente de onda aberrado FO en los puntos Q y Q, respectivamente, y al plano imagengaussiano en el punto P ′′. En esta figura se aprecia como la esfera de referencia, de

Page 21: An¶alisis de la in°uencia de las aberraciones del sistema ...

28 Aberraciones geometricas en sistemas opticos

radio de curvatura R, se encuentra centrada en el punto imagen gaussiano, P ′, ycomo tanto el frente de onda aberrado como la esfera de referencia pasan ambos porel centro O de la pupila de salida.

En base a la definicion anterior de frente de onda, la longitud del camino optico delrayo emergente del punto objeto y con final en Q es la misma que la del rayo principalcon final en el punto O (centro de la pupila de salida). De este modo, el productonQQ proporciona la aberracion de onda del rayo considerado, W .

Ahora bien, existe una definicion alternativa [Ray64] para la aberracion de onda. Eneste caso, la aberracion de onda se define para un punto Q del frente de onda, en vezde para un punto Q de la esfera de referencia. Segun esta definicion, la aberracion sedefine como la distancia entre Q y la esfera de referencia medida a lo largo del radiode la esfera que pasa por el punto Q (AQP ′). Esta sera la definicion que utilizaremosen el siguiente apartado para establecer una relacion entre la aberracion de rayo y laaberracion de onda.

2.1.1. Relacion entre aberracion de rayo y aberracion de onda

La figura 2.2 muestra de forma mas simple el esquema de la figura 2.1. Ası, FO

representa parte de un frente de onda aberrado (propagandose hacia la izquierda)en la pupila de salida del sistema, mientras que ER representa parte de la esfera dereferencia. Ambos presentan un punto en comun en el centro de la pupila de salidaO. El centro P ′ de la esfera de referencia coincide con el punto imagen gausiano,de modo que el radio de la esfera de referencia es R = OP ′ = AP ′. El sistema decoordenadas esta elegido de tal manera que el eje z coincide con el eje optico, el planoxy es el plano imagen y H = PP ′ es la altura de la imagen.

Un rayo cualquiera perpendicular al frente de onda en un punto Q de coordenadas(x, y, z) intersecta al plano imagen en el punto P ′′, de modo que P ′P ′′ es la aberracionde rayo, y (X, Y ) sus coordenadas ortogonales sobre el plano imagen. La distanciadesde el centro de la esfera hasta este punto en el frente de onda es r = P ′Q, y puestoque hemos definido la aberracion de onda como la distancia desde ese punto hasta laesfera de referencia, podemos escribir:

W (x, y) = R− r = AP ′ − P ′Q (2.3)

A partir de esta definicion, la aberracion de onda puede ser considerada como la

Page 22: An¶alisis de la in°uencia de las aberraciones del sistema ...

2.1. Aberraciones de rayo y onda 29

Figura 2.2: Esfera de referencia (ER) y frente de onda (FO).

ecuacion del frente de onda en el sistema de coordenadas Pxyr, y por lo tanto,obtener la relacion entre la aberracion de onda y la de rayo se reduce a un problemade derivadas parciales y cambio de variables. Las variables x, y, z, r se encuentranrelacionadas segun la expresion pitagorica:

x2 + (y −H)2 + z2 = r2 (2.4)

que tambien se puede expresar como:

G(x, y, z, r) = 0 (2.5)

El frente de onda se puede definir a partir de las expresiones:

F (x, y, z) = 0 , z = f(x, y) (2.6)

Si eliminamos la variable z de las ecuaciones 2.4 y 2.6, podemos obtener una nuevaexpresion para el frente de onda:

r = g(x, y) (2.7)

Los diferenciales de las funciones f y g seran, por tanto:

dz =∂z

∂xdx +

∂z

∂ydy

dr =∂r

∂xdx +

∂r

∂ydy

(2.8)

Page 23: An¶alisis de la in°uencia de las aberraciones del sistema ...

30 Aberraciones geometricas en sistemas opticos

Y de manera similar, para las funciones F y G:

∂F

∂xdx +

∂F

∂ydy +

∂F

∂zdz = 0

∂G

∂xdx +

∂G

∂ydy +

∂G

∂zdz +

∂G

∂rdr = 0

(2.9)

Sustituimos en la ecuacion anterior las expresiones para dz y dr, y despues de agruparterminos: (

∂F

∂x+

∂F

∂z

∂z

∂x

)dx +

(∂F

∂y+

∂F

∂z

∂z

∂y

)dy = 0

(∂G

∂x+

∂G

∂z

∂z

∂x+

∂G

∂r

∂r

∂x

)dx +

(∂G

∂y+

∂G

∂z

∂z

∂y+

∂G

∂r

∂r

∂y

)dy = 0

(2.10)

Puesto que dx y dy son infinitesimos independientes, los coeficientes que les acom-panan han de ser nulos, y por lo tanto:

∂F

∂x+

∂F

∂z

∂z

∂x= 0

∂F

∂y+

∂F

∂z

∂z

∂y= 0

∂G

∂x+

∂G

∂z

∂z

∂x+

∂G

∂r

∂r

∂x= 0

∂G

∂y+

∂G

∂z

∂z

∂y+

∂G

∂r

∂r

∂y= 0

(2.11)

La solucion del sistema nos lleva a:

∂r

∂x=

1∂G∂r

(∂G

∂z

∂F∂x∂F∂z

− ∂G

∂x

)

∂r

∂y=

1∂G∂r

(∂G

∂z

∂F∂y

∂F∂z

− ∂G

∂y

) (2.12)

Ahora bien, de la ecuacion 2.4 tenemos que:

∂G

∂x= 2x,

∂G

∂y= 2(y −H),

∂G

∂z= 2z,

∂G

∂r= −2r (2.13)

Por otro lado, las derivadas parciales de F y los cosenos directores de la direccionperpendicular en Q (es decir, del rayo) se encuentran relacionados segun la expresion:

∂F

∂x:∂F

∂y:∂F

∂z= cosα : cos β : cos γ (2.14)

Page 24: An¶alisis de la in°uencia de las aberraciones del sistema ...

2.2. Funcion de aberracion de un sistema con simetrıa de revolucion 31

Y a partir de la geometrıa de la figura 2.2:

cosα

cos γ=

x−X

z,

cosβ

cos γ=

y − (H + Y )z

(2.15)

Por lo tanto, sustituyendo estos valores en las ecuaciones 2.12, obtenemos:

∂r

∂x=

X

r,

∂r

∂y=

Y

r(2.16)

Si recordamos la definicion de aberracion de onda (ecuacion 2.3), r = R −W , y porlo tanto:

∂r

∂x= −∂W

∂x,

∂r

∂y= −∂W

y(2.17)

Por lo que finalmente llegamos a las relaciones exactas entre la aberracion de onda yla aberracion de rayo:

∂W

∂x= − X

R−W,

∂W

∂y= − Y

R−W(2.18)

2.2. Funcion de aberracion de un sistema con simetrıa

de revolucion

Una vez definidos formalmente los conceptos de aberracion de rayo y de onda,ası como la relacion entre ambos, pasaremos a analizar las aberraciones de un sis-tema optico con simetrıa de revolucion. Para ello, el primer paso sera determinar laexpresion analıtica de la aberracion de onda, ya sea como un desarrollo de potenciasen funcion de coordenadas cartesianas, o bien mediante coordenadas polares.

Mediante la introduccion de la funcion caracterıstica de Hamilton, se puede demos-trar [BW99] que la aberracion de onda depende unicamente de cuatro variables: lascoordenadas del rayo en el punto objeto (x0, y0) y sus coordenadas en la interseccionen la pupila de salida (x, y). De este modo, la funcion de aberracion del sistema parael punto objecto considerado, W (~r0), se puede escribir en su forma mas general comouna serie de potencias en terminos de las coordenadas de los dos puntos anteriores,el punto objeto y el situado en la pupila, segun la expresion:

W (x0, y0; x, y) =∞∑

j=0

xj0

∞∑

k=0

yk0

∞∑

l=0

xl∞∑

m=0

ymajklm (2.19)

donde el termino ajklm representa los coeficientes de la expansion, los cuales dependende parametros del sistema optico tales como el radio de curvatura de las superficies,

Page 25: An¶alisis de la in°uencia de las aberraciones del sistema ...

32 Aberraciones geometricas en sistemas opticos

los ındices de refraccion de los medios y el grosor de los mismos, y todas las potenciaspresentan exponentes enteros no negativos.

Ahora bien, si tenemos en cuenta la simetrıa del sistema, esta dependencia se reduceunicamente a tres combinaciones: x2

0 + y20, x2 + y2 y x0x + y0y. Para comprobar

esto resulta mas adecuado trabajar en coordenadas polares. Sean (r0, θ0) y (r, θ)las coordenadas polares correspondientes a las coordenadas rectangulares (x0, y0) y(x, y), respectivamente, del punto objeto y del situado en el plano de la pupila. Lasrelaciones entre ambos sistemas de coordenadas seran:

{(x0, y0) = r0(cos θ0, sin θ0)(x, y) = r(cos θ, sin θ)

(2.20)

De este modo, la aberracion depende ahora de r0, r, θ y θ0, o lo que es lo mismo,r0, r, θ0 − θ y θ. Ahora bien, si rotamos ambos sistemas de referencia un mismoangulo, las tres primeras variables permaneceran inalteradas, pero no ası el valor deθ. Esto entrarıa en contradiccion con el hecho de que W sea invariante a rotaciones,lo que significa que la aberracion no puede depender del valor de θ, y por lo tanto,tan solo es funcion de r0, r, θ0 − θ. Esto quiere decir que la funcion de aberracion sepuede expresar en funcion de los tres productos escalares de los vectores ~r0(x0, y0)y ~r(x, y), que constituyen los denominados invariantes rotacionales de la funcion deaberracion:

|~r0|2 = r20 =

√x2

0 + y20

|~r|2 = r2 =√

x2 + y2

~r0 · ~r = r0r cos(θ − θ0) = x0x + y0y

(2.21)

Por lo tanto, si W se expresa mediante un desarrollo en serie de potencias de lascuatro coordenadas, la expansion unicamente contendra terminos de grado par, demanera que sera del tipo [BW99]:

W = c(x20 + y2

0) + W (4) + W (6) + · · · (2.22)

donde c es una constante y W (2k) representa un polinomio de grado 2k en las coorde-nadas, y contiene estas coordenadas unicamente en potencias de los tres invariantes.Las aberraciones de orden mas bajo, representadas por el polinomio W (4) son denomi-nadas generalmente aberraciones primarias o aberraciones de Seidel. Este polinomioincluye cinco terminos, el coeficiente de cada uno de los cuales corresponde a la dis-torsion, la curvatura de campo, el astigmatismo, el coma y la aberracion esferica.

Page 26: An¶alisis de la in°uencia de las aberraciones del sistema ...

2.2. Funcion de aberracion de un sistema con simetrıa de revolucion 33

2.2.1. Polinomios y coeficientes de Zernike

Ya hemos visto en el apartado anterior como para un objeto determinado, la funcionde aberracion W (ρ, θ) de un sistema optico simetrico respecto de la rotacion alrededordel eje optico puede ser expresada en funcion de un conjunto completo1 de polino-mios. Existen muchos conjuntos de polinomios con estas caracterısticas, pero uno deellos, introducido por primera vez por F. Zernike [Zer34], resulta especialmente util.

Los polinomios de Zernike presentan una serie de caracterısticas singulares, puestoque son los unicos que, expresados en dos variables, ρ y θ, son ortogonales en el cırcu-lo unidad. Esta ortogonalidad provoca que el hecho de anadir o suprimir cualquiertermino del desarrollo no modifica el ajuste optimo de la expresion analıtica de laaberracion con respecto del polinomio real de aberracion. Por otra parte, incluyen unpolinomio para cada valor permitido de m y n, los cuales representan la dependenciael grado del polinomio radial y el ındice de la dependencia angular, respectivamente.Finalmente, son invariantes respecto a rotaciones de los ejes alrededor del origen. Engeneral, y como serıa de esperar, los polinomios de Zernike circulares son adecuadospara representar la funcion de aberracion de sistemas opticos con simetrıa circular.

Estos polinomios Rmn (ρ) cosmθ, expresados en coordenadas polares (ρ, θ), permiten

escribir la funcion de aberracion W (ρ, θ) como:

W (ρ, θ) =∞∑

n=0

n∑

m=0

cnm

√2(n + 1)1 + δm0

Rmn (ρ) cos mθ (2.23)

donde cnm son los coeficientes de la expansion, n y m son enteros positivos (incluidoel cero), de manera que n−m ≥ 0 y par, δij es una delta de Kronecker y

Rmn (ρ) =

n−m2∑

s=0

(−1)s(n− s)!

s!(

n + m

s− s

)!(

n−m

s− s

)!ρn−2s (2.24)

es un polinomio de grado n en ρ con terminos en ρn, ρn−2, ... ,ρm. El hecho de queno aparezcan terminos dependientes de sinmθ es debido a que todos sus coeficientesson nulos debido a la simetrıa de rotacion del sistema optico alrededor del eje.

1El termino completo indica que cualquier funcion continua puede ser expresada como una com-

binacion de las funciones del conjunto. Para una definicion mas precisa se puede consultar [CH53].

Page 27: An¶alisis de la in°uencia de las aberraciones del sistema ...

34 Aberraciones geometricas en sistemas opticos

Debido a su ortogonalidad, generalmente los diferentes terminos del desarrollo dela aberracion en funcion de los polinomios de Zernike suelen denominarse de formagenerica como aberraciones ortogonales. Algunos de los terminos de las aberra-ciones ortonormales de Zernike se muestran en la tabla 2.1. En esta tabla sedefine Zm

n (ρ, θ) como:

Zmn (ρ, θ) =

√2(n + 1)1 + δm0

Rmn (ρ) cos mθ (2.25)

n m Zmn (ρ, θ)

0 0 1

1 1 ρ cos θ

2 0√

3(2ρ2 − 1)

2 2√

6ρ2 cos 2θ

3 1√

8(3ρ3 − 2ρ) cos θ

3 3√

8ρ3 cos 3θ

4 0√

5(6ρ4 − 6ρ2 + 1)

4 2√

10(4ρ4 − 3ρ2) cos 2θ

4 4√

10ρ4 cos 4θ

... ... ...

Tabla 2.1: Aberraciones ortonormales de Zernike (n ≤ 4).

2.3. Propagacion de imagenes aberradas

En los apartados anteriores se han analizado tanto la definicion como la expresionanalıtica de la aberracion de onda asociada a un sistema optico para un punto objetosituado en el eje optico. Para ello, se ha utilizado la optica geometrica, a partir delestudio de la marcha de los rayos provenientes del objeto hasta el plano imagen, yrelacionando la aberracion de rayo en el plano imagen con la aberracion de onda enel plano de la pupila de salida. Hasta este momento no se han considerado los efec-tos difractivos asociados a los diferentes elementos que conforman el sistema optico.Sera en este apartado donde se tendran en cuenta estos efectos, agrupandolos de for-ma global en la pupila de salida, y de este modo se calculara la distribucion de luzen ella para un sistema aberrado, y posteriormente se realizara su propagacion hastaun plano arbitrario.

Page 28: An¶alisis de la in°uencia de las aberraciones del sistema ...

2.3. Propagacion de imagenes aberradas 35

El primero en asociar estos efectos a la pupila de salida fue Lord Rayleigh en 1896[Ray96], aunque ya anteriormente Ernst Abbe en 1873 [Abb73] los habıa agrupado enla pupila de entrada. Ambos metodos son equivalentes, puesto que ambas pupilas sonimagenes una de la otra, y utilizan la optica geometrica para describir la propagacionde la luz entre la pupila de entrada y la de salida del sistema, mientras que los efectosdifractivos unicamente se consideran durante la propagacion desde el objeto hasta lapupila de entrada o, de forma alternativa, desde la pupila de salida hasta el planoimagen. El desarrollo que se presenta en este apartado sigue fundamentalmente lanotacion y el esquema que se puede hallar en [Mah01].

2.3.1. Distribucion de luz en la pupila de salida

Consideremos un objeto puntual situado en la posicion (~r0; z0), tal y como se mues-tra en la figura 2.3. Una onda esferica divergente, con su centro de curvatura en elobjeto, incide en la pupila de entrada. Si el sistema no tiene aberracion, una ondaesferica de la forma e(−ikr

R), donde R es su radio de curvatura, emerge de la pupila

de salida convergiendo a la imagen gaussiana (o paraxial) del objeto, situada en laposicion (~rg; zg). En el caso real de que el sistema optico presente aberraciones, estefrente de onda emergente ya no sera esferico, sino que se distorsionara, tal y como seha comentado anteriormente.

Figura 2.3: Esquema de formacion de la imagen gaussiana para un objeto puntual.

Fijemos nuestra atencion en uno de los multiples rayos que, provenientes del objeto,atraviesan el sistema optico, y sea W (~rp; ~r0) la aberracion de onda de un rayo quepasa por el plano de la pupila de salida por un punto Pp cuya posicion viene deter-minada por el vector ~rp, tal y como muestra la figura 2.4.

Page 29: An¶alisis de la in°uencia de las aberraciones del sistema ...

36 Aberraciones geometricas en sistemas opticos

Figura 2.4: Sistema de coordenadas en la pupila de salida, en el plano de imagengaussiana y en un plano imagen cualquiera.

La amplitud compleja en Pp debida a un elemento ∆~r0 centrado en ~r0 se puedeescribir como:

∆Uex(~rp; ~r0) = P (~rp; ~r0)e(−iks) (2.26)

donde s representa la distancia entre el punto considerado y el punto correspondienteen el plano imagen gausiano, Pg, es decir:

s =√

z2g + |~rp − ~rg|2 (2.27)

mientras que P (~rp;~r0), definida como:

P (~rp;~r0) = A(~rp;~r0)e[ikW (~rp;~r0)] , en el interior de la pupila de salida= 0 , en el exterior de la pupila de salida

(2.28)

recibe el nombre de funcion de pupila del sistema. La funcion de amplitud A(~rp;~r0),denominada funcion de apodizacion, representa la variacion de amplitud de la on-da a lo largo de la pupila de salida.

Page 30: An¶alisis de la in°uencia de las aberraciones del sistema ...

2.3. Propagacion de imagenes aberradas 37

La intensidad en el punto Pp del plano de la pupila de salida debida al elemento ∆~r0

considerado viene determinada por:

Ip(~rp;~r0) = |∆Uex(~rp;~r0)|2 = |P (~rp;~r0)|2 = A2(~rp;~r0) (2.29)

y la potencia correspondiente en la pupila de salida se obtiene integrando la intensidadpara toda la pupila:

Pex(~r0) =∫|P (~rp;~r0)|2d~rp =

∫A2(~rp;~r0)d~rp (2.30)

2.3.2. Distribucion de luz en un plano arbitrario

Consideremos ahora la propagacion de una onda desde el plano de la pupila de salidahasta un plano de observacion situado a una distancia arbitraria zi. Para ello utili-zaremos la formula de Rayleigh - Sommerfeld [BW99] para describir la propagacionde una onda desde un plano z = 0 hasta un plano cualquiera situado a distancia z,tal y como se muestra en la figura 2.5.

Figura 2.5: Propagacion de una onda. Calculo de la amplitud compleja en el plano z

a partir de la amplitud compleja en el plano z = 0.

Esta relacion se puede expresar como:

U(~r; z) =1λ

∫U(~r′; 0)

(1kl− i

)z

l

eikl

ld~r′ (2.31)

donde l representa la distancia P ′P entre el punto origen (~r′; 0) y el punto de obser-vacion (~r; z), es decir:

l =√

z2 + |~r − ~r′|2 (2.32)

Page 31: An¶alisis de la in°uencia de las aberraciones del sistema ...

38 Aberraciones geometricas en sistemas opticos

Para valores grandes de z, kl >> 1, y l ≈ z, y por lo tanto, podemos realizar lassiguientes aproximaciones:

1. despreciar el valor de 1kl frente a la unidad,

2. considerar el valor de zl equivalente a la unidad,

3. sustituir l por z (excepto en el exponente, donde se encuentra multiplicado pork) para valores de z mucho mayores que el tamano de la pupila de salida.

Si ahora sustituimos la ecuacion 2.26 en la expresion 2.31, podemos escribir la am-plitud compleja en el plano zi como:

∆Ui(~ri;~r0; zi) = − 1λzi

∫P (~rp;~r0)e[ik(l−s)]d~rp (2.33)

donde l corresponde a la distancia desde el punto de observacio Pi hasta el punto Pp

situado en la pupila de salida:

l =√

zi2 + |~rp − ~ri|2 (2.34)

Si ahora desarrollamos el termino l − s obtenemos:

l − s = (zi − zg) +12

(r2i

zi− r2

g

zg

)− 1

zi~rp ·

(~ri − zi

zg~rg

)+

12

(1zi− 1

zg

)r2p

−18

(r4i

z3i

− r4g

z3g

)− 1

8

(1z3i

− 1z3g

)r4p

+12r3p

(ri

z3i

cos θpi − rg

z3g

cos θpg

)− 1

2r2p

(r2i

z3i

cos θ2pi −

r2g

z3g

cos θ2pg

)

−14r2p

(r2i

z3i

− r2g

z3g

)+

12rp

(r3i

z3i

cos θpi −r3g

z3g

cos θpg

)+ · · ·

(2.35)

Cada uno de los terminos presentes en el desarrollo depende de las posiciones delplano imagen gaussiano zg y del plano de observacion zi, y equivale a un terminode fase al multiplicarse por k, aunque no todos ellos representan aberraciones en elsentido clasico de la acepcion. Es interesante destacar el termino

Wd(~rp;~ri;~rg) = l − s +1zi

~rp ·(

~ri − zi

zg~rg

)(2.36)

denominado aberracion de la onda difractada [HS78], puesto que esta aberra-cion se encuentra relacionada unicamente con la propagacion de la onda, y no conlas caracterısticas fısicas del sistema optico.

Page 32: An¶alisis de la in°uencia de las aberraciones del sistema ...

2.3. Propagacion de imagenes aberradas 39

De la expresion 2.35 podemos despreciar todos los terminos excepto los cuatro pri-meros en el caso de que se cumpla que:

(1z3i

− 1z3g

)a4 <

λ

8(2.37)

donde a es el maximo valor de rp. Esta condicion equivale a imponer que la contri-bucion de la aberracion esferica sea menor a λ

8 . En este caso, la amplitud complejapuede escribirse como:

∆Ui(~ri;~r0; zi) = − iλzi

exp{

ik

[(zi − zg) + 1

2

(r2i

zi− r2

g

zg

)]}

× ∫P (~rp;~r0; zi) exp

[−2πi

λzi~rp ·

(~ri − zi

zg~rg

)]d~rp

(2.38)

En esta expresion, P (~rp;~r0; zi) corresponde a la denominada funcion desenfocadade pupila, e indica que la imagen es observada en un plano diferente del plano ima-gen paraxial.

P (~rp;~r0; zi) = P (~rp;~r0) exp[ik

2

(1zi− 1

zg

)r2p

](2.39)

Analizando la expresion 2.39, se puede considerar que se encuentra compuesta de dosterminos claramente diferenciados: por un lado, la funcion pupila del sistema:

P (~rp;~r0) = A(~rp;~r0)e[ikW (~rp;~r0)] , en el interior de la pupila de salida= 0 , en el exterior de la pupila de salida

(2.40)

donde W (~rp;~r0) indica la diferencia de caminos opticos entre un rayo cualesquieray el rayo principal al propagarse hasta la esfera de referencia gaussiana. Por otraparte, en el supuesto de que el plano de observacion no coincida con el plano paraxial,aparece el termino de desenfoque, el cual representa la longitud del camino opticoanadido que debe recorrer un rayo hasta la nueva esfera de referencia desenfocada,centrada ahora en el nuevo plano de observacion:

∆W =12

(1zi− 1

zg

)r2p (2.41)

Ası, puesto que el plano de observacion no corresponde al paraxial, sino que se en-cuentra desplazado respecto a este una distancia ∆z = zi− zg, la esfera de referenciaestara centrada en la posicion de dicho plano de observacion, con lo que zi = R. Sedebe tener en cuenta, ademas, que si el objeto es puntual y se encuentra situado sobreel eje optico, la posicion de su imagen gaussiana sera ~rg = (0, 0).

Page 33: An¶alisis de la in°uencia de las aberraciones del sistema ...

40 Aberraciones geometricas en sistemas opticos

Por lo tanto, considerando todos estos aspectos, la expresion 2.38 se puede reescribircomo:

∆Ui = − i

λziexp

{ik

[(zi − zg) +

r2i

2zi

]}∫P (~rp;~r0; zi) exp

[−2πi

λzi~rp · ~ri

]d~rp =

− i

λziexp

[ik∆z

]exp

[ik

x2i + y2

i

2zi

] ∫P (~rp;~r0; zi) exp

[−2πi

(xpxi + ypyi

λzi

)]d~rp =

− i

λRexp

[2πi

λ∆z

]exp

[2πi

λ

x2i + y2

i

2R

] ∫P (~rp;~r0; zi) exp

[−2πi

(xpxi + ypyi

λR

)]d~rp

(2.42)

Dejando de lado terminos constantes irrelevantes, de manera que las expresiones sesimplifiquen, y si a partir de ahora denominamos a las coordenadas (xp, yp) simple-mente como (x, y) la distribucion de luz en el plano imagen se puede escribir como[HY70]:

U(xi, yi) = exp[2πi

λ

x2i + y2

i

2R

] ∫

AberturaP (x, y) exp

[−2πi

(xxi + yyi

λR

)]dxdy (2.43)

donde P(x,y) corresponde a la funcion generalizada de pupila:

P (x, y) = A(x, y)ei 2πλ

W (x,y) (2.44)

En esta ultima expresion, A(x, y) representa la transmitancia de la pupila (que corres-pondera a la imagen mostrada en el modulador) y W(x,y) la aberracion de onda. Porotro lado, el termino de fase cuadratica presente en la expresion 2.43 se anula en lasegunda etapa de la difraccion en un correlador, de manera que de las ecuaciones 2.43y 2.44 resulta que la calidad de la transformada de Fourier de A(x, y) dependera unicay exclusivamente de la aberracion de onda del sistema.