Espacios de Hilbertrpaya/documentos/Funcional/2019-20/Hilbert.pdf · Espacios de Hilbert Este...

24
Tema 11 Espacios de Hilbert Este último tema está dedicado a los espacios de Banach más perfectos desde un punto de vista geométrico, pues verifican todos los postulados de la geometría euclídea. Con el estudio, por parte de David Hilbert (1862-1943) y su escuela, de las formas cuadráticas en infinitas variables, aparecen los primeros espacios de Hilbert de dimensión infinita, y puede decirse que arranca, en los albores del siglo XX, la prehistoria del Análisis Funcional. Como primer resultado relevante, caracterizamos los espacios de Hilbert, entre los espacios de Banach, mediante la identidad del paralelogramo, para pasar inmediatamente al estudio del resultado sin duda más importante: el teorema de la proyección ortogonal. Como consecuencia más destacable, probamos el teorema de Riesz-Fréchet, que permite identificar cada espacio de Hilbert con su dual. Finalmente usamos el concepto de base ortonormal, para probar que todo espacio de Hilbert separable de dimensión infinita es isométricamente isomorfo a l 2 . Esta es la versión abstracta del principal resultado acerca de las series de Fourier en L 2 (T) . 11.1. Formas sexquilineales y formas cuadráticas Necesitamos algunas nociones básicas bien sencillas, que nos llevarán a la definición de los espacios de Hilbert. En lo que sigue, para evitar repeticiones, fijamos un espacio vectorial X . Una forma sexquilineal en X es una aplicación ϕ : X × X K que verifica las siguientes dos condiciones: (i) Es lineal en la primera variable, es decir, para cada y X se tiene: ϕ ( λ x + z , y ) = λϕ ( x , y ) + ϕ ( z , y ) x, z X , λ K (ii) Es conjugado-lineal en la segunda variable, es decir, para cada x X se tiene: ϕ ( x , λ y + z ) = λϕ ( x , y ) + ϕ ( x , z ) y , z X , λ K 129

Transcript of Espacios de Hilbertrpaya/documentos/Funcional/2019-20/Hilbert.pdf · Espacios de Hilbert Este...

Page 1: Espacios de Hilbertrpaya/documentos/Funcional/2019-20/Hilbert.pdf · Espacios de Hilbert Este último tema está dedicado a los espacios de Banach más perfectos desde un punto de

Tema 11Espacios de Hilbert

Este último tema está dedicado a los espacios de Banach más perfectos desde un punto devista geométrico, pues verifican todos los postulados de la geometría euclídea. Con el estudio,por parte de David Hilbert (1862-1943) y su escuela, de las formas cuadráticas en infinitasvariables, aparecen los primeros espacios de Hilbert de dimensión infinita, y puede decirse quearranca, en los albores del siglo XX, la prehistoria del Análisis Funcional.

Como primer resultado relevante, caracterizamos los espacios de Hilbert, entre los espaciosde Banach, mediante la identidad del paralelogramo, para pasar inmediatamente al estudio delresultado sin duda más importante: el teorema de la proyección ortogonal. Como consecuenciamás destacable, probamos el teorema de Riesz-Fréchet, que permite identificar cada espacio deHilbert con su dual.

Finalmente usamos el concepto de base ortonormal, para probar que todo espacio de Hilbertseparable de dimensión infinita es isométricamente isomorfo a l2 . Esta es la versión abstractadel principal resultado acerca de las series de Fourier en L2(T) .

11.1. Formas sexquilineales y formas cuadráticas

Necesitamos algunas nociones básicas bien sencillas, que nos llevarán a la definición de losespacios de Hilbert. En lo que sigue, para evitar repeticiones, fijamos un espacio vectorial X .

Una forma sexquilineal en X es una aplicación ϕ : X ×X →K que verifica las siguientesdos condiciones:

(i) Es lineal en la primera variable, es decir, para cada y ∈ X se tiene:

ϕ(

λx + z , y)

= λ ϕ(

x , y)

+ ϕ(

z , y)

∀x,z ∈ X , ∀λ ∈K

(ii) Es conjugado-lineal en la segunda variable, es decir, para cada x ∈ X se tiene:

ϕ(

x , λy + z)

= λ ϕ(

x , y)

+ ϕ(

x , z)

∀y,z ∈ X , ∀λ ∈K

129

Page 2: Espacios de Hilbertrpaya/documentos/Funcional/2019-20/Hilbert.pdf · Espacios de Hilbert Este último tema está dedicado a los espacios de Banach más perfectos desde un punto de

11. Espacios de Hilbert 130

Como es habitual, para λ ∈ K , estamos denotando por λ al escalar conjugado de λ . En elcaso real, se tiene λ = λ para todo λ ∈ R , luego una forma sexquilineal no es otra cosa queuna forma bilineal, es decir, lineal en cada variable.

Se dice ahora que la forma sexquilineal ϕ es hermítica, cuando verifica que:

ϕ(

y , x)

= ϕ(

x , y)

∀x,y ∈ X

En el caso real, esto es tanto como decir que ϕ es una forma bilineal simétrica.

Si ϕ es una forma sexquilineal hermítica, es claro que ϕ(

x , x)∈ R para todo x ∈ X . Se

dice entonces que la aplicación

Q : X → R , Q(x) = ϕ(

x , x)

∀x ∈ X

es la forma cuadrática asociada a ϕ . Se entiende por tanto que, una aplicación Q : X → R esuna forma cuadrática en X , cuando existe una forma sexquilineal hermítica ϕ en X , verificandoque Q(x) = ϕ

(x , x

)para todo x∈X . Vamos a comprobar que entonces ϕ es única y se obtiene

fácilmente a partir de Q .

Identidad de polarización. Sea Q la forma cuadrática asociada a una forma sexquilinealhermítica ϕ . Se tiene entonces

4 Re ϕ(

x , y)

= Q(x+ y)−Q(x− y) ∀x,y ∈ X (1)

y por tanto, ϕ es la única forma sexquilineal hermítica cuya forma cuadrática asociada es Q .

Demostración. La igualdad (1) es inmediata, pues para x,y ∈ X se tiene

Q(x+ y) − Q(x− y) = ϕ(

x+ y , x+ y)− ϕ

(x− y , x− y

)= 2ϕ

(x , y

)+ 2ϕ

(y , x

)= 2ϕ

(x , y

)+ 2ϕ

(x , y

)= 4 Re ϕ

(x , y

)En el caso real, está ya bien claro que ϕ queda determinada por Q .

En el caso complejo, también para x,y ∈ X se tiene

Im ϕ(

x , y)

= Re[− iϕ

(x , y

)]= Re ϕ

(x , i y

)luego usando (1) deducimos que

4 Im ϕ(

x , y)

= Q(x+ iy)−Q(x− iy) ∀x,y ∈ X

Se tiene por tanto,

4 ϕ(

x , y)

= Q(x+ y) − Q(x− y) + i Q(x+ i y) − i Q(x− i y) ∀x,y ∈ X

y esto prueba que ϕ queda determinada por Q , también en el caso complejo.

De esta forma, hemos obtenido una correspondencia biunívoca entre formas sexquilinealeshermíticas y formas cuadráticas. Usaremos solamente un tipo particular de formas cuadráticas,que enseguida vamos a definir.

Page 3: Espacios de Hilbertrpaya/documentos/Funcional/2019-20/Hilbert.pdf · Espacios de Hilbert Este último tema está dedicado a los espacios de Banach más perfectos desde un punto de

11. Espacios de Hilbert 131

11.2. Productos escalares y espacios de Hilbert

Seguimos manteniendo fijo el espacio vectorial X en el que trabajamos. Se dice que unaforma cuadrática Q : X → R es positiva, cuando Q(x) ∈ R+

0 para todo x ∈ X . La siguientepropiedad clave de las formas cuadráticas positivas es el punto de partida obligado para elestudio de los espacios de Hilbert.

Desigualdad de Cauchy-Schwartz. Sea ϕ una forma sexquilineal hermítica en X , cuyaforma cuadrática asociada Q es positiva. Entonces:∣∣ϕ(x , y

)∣∣ 6 Q(x)1/2 Q(y)1/2 ∀x,y ∈ X (2)

Como consecuencia, la función x 7→ Q(x)1/2 es una seminorma en X .

Demostración. Fijados x,y ∈ X , para todo t ∈ R tenemos claramente

0 6 Q(x− ty) = ϕ(

x , x)− t ϕ

(x , y

)− t ϕ

(y , x

)+ t 2

ϕ(

y , y)

= Q(x) − 2 t Re ϕ(

x , y)

+ t 2 Q(y)

o lo que es lo mismo,

2 t Re ϕ(

x , y)

6 Q(x) + t 2 Q(y) ∀ t ∈ R (3)

Si Q(y) > 0, tomando t = Re ϕ(

x , y)/Q(y) , obtenemos claramente∣∣ Re ϕ

(x , y)

∣∣ 6 Q(x)1/2 Q(y)1/2 (4)

Pero si Q(y) = 0, se ha de tener Re ϕ(

x , y)

= 0, pues en otro caso podríamos tomar t ∈ Rde forma que 2 t Re ϕ

(x , y

)> Q(x) , lo que contradice (3) . Así pues, se verifica (4) para

cualesquiera x,y ∈ X , luego hemos probado (2) en caso real.

En caso complejo, fijando de nuevo x,y ∈ X , tomamos α ∈ C con |α| = 1 de forma quese tenga

∣∣ϕ(x , y)∣∣ = α ϕ

(x , y

)= ϕ

(αx , y

). Es claro entonces que ϕ

(αx , y

)∈ R+

0 , asícomo que Q(αx) = Q(x) , luego usando (4) con αx en lugar de x , obtenemos∣∣ϕ(x , y

)∣∣ = ϕ(

αx , y)

=∣∣ Re ϕ

(αx , y

)∣∣ 6 Q(αx)1/2 Q(y)1/2 = Q(x)1/2 Q(y)1/2

y hemos probado (2) en caso complejo.

Para ver que la función x 7→ Q(x)1/2 es una seminorma en X , la desigualdad triangular esya inmediata, pues para cualesquiera x,y ∈ X se tiene

Q(x+ y) = Q(x) + Q(y) + 2 Re ϕ(

x , y)

6 Q(x) + Q(y) + 2∣∣ϕ(x , y

)∣∣6 Q(x) + Q(y) + 2Q(x)1/2 Q(y)1/2 =

(Q(x)1/2 + Q(y)1/2 )2

Finalmente es claro que, para x ∈ X y α ∈K , se tiene Q(αx) = |α|2 Q(x) .

Está bien clara la condición que nos permite obtener una norma en X . Se dice que una formacuadrática Q es definida positiva, cuando Q(x)∈R+ para todo x∈ X \0 . Como toda formacuadrática Q verifica que Q(0) = 0, si Q es definida positiva, vemos que Q es positiva.

Page 4: Espacios de Hilbertrpaya/documentos/Funcional/2019-20/Hilbert.pdf · Espacios de Hilbert Este último tema está dedicado a los espacios de Banach más perfectos desde un punto de

11. Espacios de Hilbert 132

Pues bien, un producto escalar en X es una forma sexquilineal hermítica ϕ en X , cuyaforma cuadrática asociada es definida positiva. Habitualmente, un producto escalar se denotapor (x,y) 7→

(x∣∣y) , para x,y ∈ X , y se dice que

(x∣∣y) es el producto escalar de x por y .

La anterior definición de producto escalar es redundante, pues al ser una forma lineal en laprimera variable, la condición para ser hermítica ya hace que sea conjugado-lineal en la segundavariable. Vemos por tanto que una aplicación (x,y) 7→

(x∣∣y) , de X ×X →K , es un producto

escalar en X si, y sólo si, verifica las tres condiciones siguientes:

(a)(

λx + z∣∣y) = λ

(x∣∣y) +

(z∣∣y) ∀x,y,z ∈ X , ∀λ ∈K

(b)(

y∣∣x) =

(x∣∣y) ∀x,y ∈ X

(c)(

x∣∣x) ∈ R+ ∀x ∈ X \0

Un espacio pre-hilbertiano es un espacio vectorial X , dotado de un producto escalar. Seconsidera automáticamente a X como un espacio normado, cuya norma viene dada por

‖x‖ =(

x∣∣x)1/2 ∀x ∈ X

Así pues, un espacio pre-hilbertiano no es más que un espacio normado X , cuya norma procedede un producto escalar, mediante la igualdad anterior. A su vez, el producto escalar de X vienedeterminado por su norma, mediante la identidad de polarización, que toma la forma:

4 Re(

x∣∣y) = ‖x+ y‖2 − ‖x− y‖2 ∀x,y ∈ X

En el caso complejo, basta observar que Im(

x∣∣y) = Re

(x∣∣ i y)

para cualesquiera x,y ∈ X .

Deducimos claramente que, si Y es otro espacio pre-hilbertiano, cuyos producto escalar ynorma denotamos como los de X , y T : X → Y es un operador lineal isométrico, entonces Tpreserva el producto escalar, es decir,

(T (x)

∣∣T (z))

=(

x∣∣z) para cualesquiera x,z ∈ X . En

particular, si T es un isomorfismo isométrico, entonces T identifica totalmente X con Y , nosólo como espacios normados, sino también como espacios pre-hilbertianos.

En un espacio pre-hilbertiano X , la desigualdad de Cauchy-Schwartz toma la forma∣∣(x∣∣y)∣∣ 6

∥∥x∥∥ ∥∥y

∥∥ ∀x,y ∈ X

que nos permite obtener la siguiente consecuencia.

El producto escalar de un espacio pre-hilbertiano X es una función continua en X ×X .

Basta observar que, fijados u,v ∈ X , para cualesquiera x,y ∈ X se tiene(x∣∣y)− (u

∣∣v) =(

x−u∣∣y) +

(u∣∣y− v

)y la desigualdad de Cauchy-Schwartz nos dice que∣∣(x

∣∣y) − (u∣∣v)∣∣ 6

∥∥x−u∥∥ ∥∥y

∥∥ +∥∥u∥∥ ∥∥v− y

∥∥lo que implica claramente que el producto escalar es continuo en el punto (u,v) .

Por otra parte, para cualquier espacio pre-hilbertiano, vamos a discutir la posibilidad de quese tenga la igualdad en la desigualdad de Cauchy-Schwartz, o en la triangular.

Page 5: Espacios de Hilbertrpaya/documentos/Funcional/2019-20/Hilbert.pdf · Espacios de Hilbert Este último tema está dedicado a los espacios de Banach más perfectos desde un punto de

11. Espacios de Hilbert 133

Sea X un espacio pre-hilbertiano y x,y ∈ X con y 6= 0 . Entonces:

(i) |(x |y) | = ‖x‖ ‖y‖ ⇐⇒ ∃ λ ∈K : x = λy

(ii) ‖x+ y‖ = ‖x‖ + ‖y‖ ⇐⇒ ∃ ρ ∈ R+0 : x = ρy

(i) Suponiendo que |(x |y) | = ‖x‖ ‖y‖ , basta tomar λ = (x |y)/‖y‖2 . En efecto, setiene |λ |2 = |(x |y) |2 /‖y‖4 = ‖x‖2 /‖y‖2 y también λ(x |y) = ‖x‖2, de donde

‖x − λy‖2 = ‖x‖2 + |λ |2 ‖y‖2 − 2 Re(

λ(x, |y))

= 0

luego x = λy como se quería. El recíproco es aún más fácil, pues si x = λy con λ ∈ K , setiene ‖x‖ = |λ | ‖y‖ , de donde |(x |y) | = |(λy |y) | = |λ | ‖y‖2 = ‖x‖ ‖y‖ .

(ii) Recordamos la prueba de la desigualdad triangular. basada en la de Cauchy-Schwartz:

‖x+ y‖2 = ‖x‖2 + ‖y‖2 + 2 Re(x |y) 6 ‖x‖2 + ‖y‖2 + 2∣∣(x |y)

∣∣6 ‖x‖2 + ‖y‖2 + 2 ‖x‖ ‖y‖ =

(‖x‖ + ‖y‖

)2

Entonces, ‖x + y‖ = ‖x‖ + ‖y‖ equivale a que se tenga Re(x |y) = |(x |y) | = ‖x‖ ‖y‖ .Usando (i) la segunda igualdad equivale a x = ρy con ρ ∈K , pero entonces (x |y) = ρ‖y‖2

y la primera igualdad equivale a que se tenga ρ‖y‖2 ∈ R+0 , es decir, ρ ∈ R+

0 .

Presentamos ya los espacios que más nos interesan. Un espacio de Hilbert es un espaciopre-hilbertiano cuya norma es completa, o lo que es lo mismo, un espacio de Banach cuya normaprocede de un producto escalar. Seguidamente vamos a mostrar varios ejemplos concretos deespacios de Hilbert. Para el primero, basta recordar el producto escalar usual en RN , cuyaversión en caso complejo es fácil de adivinar. Obtenemos claramente el siguiente resultado:

Para todo N ∈ N , se tiene que l N2 es un espacio de Hilbert, cuyo producto escalar es:

(x∣∣y) =

N

∑k=1

x(k) y(k) ∀x,y ∈ l N2

Obsérvese que la desigualdad de Cauchy-Schwartz en el espacio l N2 es caso particular de la

de Hölder, pues la segunda nos permite escribir:

∣∣(x∣∣y)∣∣ 6

N

∑k=1

∣∣x(k) ∣∣ ∣∣y(k) ∣∣ =N

∑k=1

∣∣x(k) ∣∣ ∣∣y(k) ∣∣ 6 ‖x‖2 ‖y‖2 ∀x,y ∈KN

Razonando con sucesiones de forma análoga a como lo hemos hecho en KN , encontramosel primer ejemplo de espacio de Hilbert de dimensión infinita. Para x,y ∈ l2 , sabemos que laserie ∑

n>1x(n) y(n) es absolutamente convergente, lo que permite claramente definir un producto

escalar en l2 que da lugar a su norma.

Page 6: Espacios de Hilbertrpaya/documentos/Funcional/2019-20/Hilbert.pdf · Espacios de Hilbert Este último tema está dedicado a los espacios de Banach más perfectos desde un punto de

11. Espacios de Hilbert 134

El espacio de sucesiones l2 es un espacio de Hilbert, con el producto escalar dado por

(x∣∣y) =

∑n=1

x(n) y(n) ∀x,y ∈ l2

Recordemos que el subespacio K(N) ⊂ l2 , formado por las sucesiones de soporte finito, esdenso en l2 pero no es cerrado, lo que nos da el primer ejemplo de un espacio pre-hilbertianoque no es completo.

Como se puede ya adivinar, nuestro tercer ejemplo de espacio de Hilbert es el espacio deLebesgue L2 . Para f ,g ∈ L2 , la desigualdad integral de Hölder nos dice que f g ∈ L1 , y estopermite claramente definir un producto escalar en L2 que da lugar a su norma:

El espacio de Lebesgue L2 es un espacio de Hilbert, con el producto escalar dado por(f∣∣g) =

∫Ω

f (t) g(t) dt ∀ f ,g ∈ L2

Nótese que la desigualdad de Cauchy-Schwartz en el espacio de Hilbert L2 no es más quela desigualdad integral de Hölder para p = 2. Puesto que C[0,1] puede verse como subespaciodenso en L2 , que no es cerrado, tenemos que C[0,1] , no con su norma natural que es la delmáximo, sino con la inducida por L2 , es otro ejemplo de espacio pre-hilbertiano no completo.

11.3. La identidad del paralelogramo

Es natural buscar una caracterización de los espacios pre-hilbertianos entre los espaciosnormados, o lo que es lo mismo, una caracterización de las normas que proceden de un productoescalar. Entre las muchas respuestas que se conocen a esta pregunta, veremos la más clásica.

Si X es un espacio pre-hilbertiano, se tiene claramente∥∥x+ y∥∥2 =

(x+ y

∣∣x+ y)

=∥∥x∥∥2 +

∥∥y∥∥2 + 2 Re

(x∣∣y) ∀x,y ∈ X

Hacemos desaparecer el producto escalar, sumando miembro a miembro esta igualdad con laque se obtiene al sustituir y por −y , con lo que tenemos∥∥x+ y

∥∥2 +∥∥x− y

∥∥2 = 2∥∥x∥∥2 + 2

∥∥y∥∥2 ∀x,y ∈ X (5)

Esta propiedad recibe el nombre de identidad del paralelogramo, por su obvia interpretacióngeométrica: en todo paralelogramo, la suma de los cuadrados de las diagonales coincide con lasuma de los cuadrados de los lados.

Pero lo importante de la igualdad (5) es que en ella no aparece el producto escalar de X ,sino solamente su norma. Podemos decir que un espacio normado X verifica la identidad delparalelogramo cuando se cumple (5) . Tenemos así una condición necesaria para que una normaproceda de un producto escalar. Como la forma de obtenerla ha sido tan sencilla, no parece quetal condición pueda ser suficiente, pero vamos a probar que sí lo es.

Page 7: Espacios de Hilbertrpaya/documentos/Funcional/2019-20/Hilbert.pdf · Espacios de Hilbert Este último tema está dedicado a los espacios de Banach más perfectos desde un punto de

11. Espacios de Hilbert 135

Teorema (Jordan-Von Neumann, 1935). Un espacio normado es pre-hilbertiano si, y sólosi, verifica la identidad del paralelogramo.

Demostración. Como ya conocemos una implicación, dado un espacio normado X , queverifica la identidad del paralelogramo, se trata de probar que la norma de X procede de unproducto escalar. En vista de la identidad de polarización, está claro que debemos considerar laaplicación ϕ : X ×X → R definida por

4 ϕ(

x , y)

= ‖x+ y‖2 − ‖x− y‖2 ∀x,y ∈ X (6)

pues en el caso real, el producto escalar que buscamos no puede ser otro que ϕ , mientras queen el caso complejo, ϕ ha de ser la parte real de dicho producto escalar.

Dados u,v,y ∈ X la identidad del paralelogramo nos dice que

4ϕ(

u+ v , y)

= ‖u+ v+ y‖2 − ‖u+ v− y‖2

= 2‖u+ y‖2 +2‖v‖2−‖u+ y− v‖2−2‖u‖2−2‖v− y‖2 +‖u− v+ y‖2

= 2‖u+ y‖2 +2‖v‖2−2‖u‖2−2‖v− y‖2

Sumando esta igualdad con la que se obtiene al intercambiar u y v , vemos que

8ϕ(

u+ v , y)

= 2‖u+ y‖2−2‖u− y‖2 + 2‖v+ y‖2−2‖v− y‖2

El segundo miembro es, por definición, 8ϕ(

u ,y)

+ 8ϕ(

v , y)

, luego hemos probado que

ϕ(

u+ v , y)

= ϕ(

u , y)

+ ϕ(

v , y)

∀u,v,y ∈ X (7)

Consideramos ahora el conjunto

E =

α ∈ R : ϕ(αx , y)

= αϕ(

x , y)∀x,y ∈ X

que no es vacío, pues 0,1 ∈ E. Dados α,β ∈ E y x,y ∈ X , usando (7) se tiene

ϕ((α−β)x , y

)+ β ϕ

(x , y

)= ϕ

((α−β)x , y

)+ ϕ

(βx , y

)= ϕ

(αx , y

)= α ϕ

(x , y

)de donde se deduce que α−β ∈ E . Pero además, si β 6= 0, observamos que

β ϕ((α/β)x , y

)= ϕ

(β(α/β)x , y

)= ϕ

(αx , y

)= α ϕ

(x , y

)y deducimos que α/β ∈ E. En resumen, E es un subcuerpo de R , luego se tiene Q⊂ E .

Fijados x,y ∈ X , usamos la función fxy : R→ R definida, para todo α ∈ R por

fxy(α) =(

αx∣∣y) − α

(x∣∣y) = (1/4)‖αx + y‖2 − (1/4)‖αx − y‖2 − α

(x∣∣y)

La continuidad de la suma, el producto por escalares y la norma de X nos dicen que fxy es unafunción continua, luego el conjunto Exy = f−1

xy(0

)es cerrado en R . Ahora bien, E es la

intersección de todos los conjuntos de la forma Exy con x,y ∈ X , luego E también es cerrado.Como Q⊂ E , concluimos que E = R . Esto significa que

ϕ(

αx , y)

= α ϕ(

x , y)

∀α ∈ R , ∀x,y ∈ X (8)

Page 8: Espacios de Hilbertrpaya/documentos/Funcional/2019-20/Hilbert.pdf · Espacios de Hilbert Este último tema está dedicado a los espacios de Banach más perfectos desde un punto de

11. Espacios de Hilbert 136

En el caso real, es ya fácil completar la demostración. En (7) y (8) tenemos que ϕ eslineal en la primera variable, pero en (6) vemos claramente que ϕ

(x , y

)= ϕ

(y , x

)para

cualesquiera x,y ∈ X , luego ϕ es una forma bilineal simétrica en X . Pero de nuevo (6) nosdice que ϕ

(x , x

)= ‖x‖2 para todo x ∈ X , luego la forma cuadrática asociada a ϕ es definida

positiva, y ϕ es el producto escalar que buscábamos.

En el caso complejo, debemos considerar la aplicación ψ : X ×X → C dada por

ψ(

x , y)

= ϕ(

x , y)

+ iϕ(x , i y

)∀x,y ∈ R (9)

pues ψ ha de ser el producto escalar que buscamos. Las propiedades que ψ debe verificar,se deducirán de las de ϕ , con una observación clave: para x,y ∈ X , como X es un espacionormado complejo, se tiene ‖x + i y‖ = ‖ i x − y‖ , así como ‖x − i y‖ = ‖ i x + y‖ , luego

ϕ(

x , i y)

= −ϕ(

i x , y)

∀x,y ∈ X (10)

Veamos entonces que ψ es lineal en la primera variable, sin olvidar que ahora K = C . Paracualesquiera x,y,z ∈ X y α ∈ R , de (7) y (8) deducimos claramente que

ψ(

x+ z , y)

= ψ(

x , y)

+ ψ(

z , y)

y ψ(

αx , y)

= α ψ(

x , y)

luego sólo queda comprobar que ψ(

i x , y)

= i ψ(

x , y)

, pero esto se deduce de (10) , ya que

ψ(

i x , y)

= ϕ(

i x , y)

+ i ϕ(

i x , i y)

= −ϕ(

x , i y)− i ϕ

(x ,−y

)= i

[i ϕ(

x , i y)

+ ϕ(

x , y)]

= i ψ(

x , y)

Por otra parte, para x,y ∈ X , también deducimos de (10) que

ψ(

y , x)

= ϕ(

y , x)

+ i ϕ(

y , i x)

= ϕ(

x , y)− i ϕ

(x , i y

)= ψ

(x , y

)Como ya teníamos linealidad en la primera variable, la última igualdad nos dice que ψ es

una forma sexquilineal hermítica. Finalmente, para x ∈ X , usando (10) y el hecho de que ϕ essimétrica, obtenemos ϕ

(x , i x

)= −ϕ

(i x , x

)= −ϕ

(x , i x

), luego ϕ

(x , i x

)= 0, de donde

ψ(

x , x)

= ϕ(

x , x)

+ i ϕ(

x , i x)

= ‖x‖2 ∀x ∈ X

Por tanto, la forma cuadrática asociada a ψ es definida positiva, luego ψ es el producto escalarque buscábamos.

El teorema anterior tiene varias consecuencias inmediatas que conviene destacar. Para laprimera de ellas, dado un espacio normado X , usaremos el espacio real subyacente XR , queobviamente es también un espacio normado, con la misma norma que X . Como la identidad delparalelogramo no involucra el producto por escalares, se tiene:

Un espacio normado complejo X es pre-hilbertiano si, y sólo si, lo es XR .

Page 9: Espacios de Hilbertrpaya/documentos/Funcional/2019-20/Hilbert.pdf · Espacios de Hilbert Este último tema está dedicado a los espacios de Banach más perfectos desde un punto de

11. Espacios de Hilbert 137

Conviene aclarar que, cuando X y XR son espacios pre-hilbertianos, aunque ambos tienen lamisma norma, sus productos escalares no pueden coincidir. Esto puede verse en la demostracióndel teorema anterior, pues el producto escalar de XR es la aplicación ϕ definida en (6) , mientrasque el de X es la aplicación ψ , dada por (9) . Por tanto, la relación entre ambos productosescalares está bien clara: para cualesquiera x,y ∈ X se tiene

ψ(

x , y)

= ϕ(

x , y)

+ i ϕ(

x , i y), o bien, ϕ

(x , y

)= Re ψ

(x , y

)Por otra parte, como la identidad del paralelogramo sólo involucra dos vectores de nuestro

espacio normado, deducimos lo siguiente:

Un espacio normado es pre-hilbertiano si, y sólo si, lo son todos sus subespacios dedimensión 2 .

Uniendo las dos observaciones anteriores, para saber si un espacio normado X , es o no unespacio pre-hilbertiano, sólo tenemos que examinar los subespacios bidimensionales de XR .

Para una tercera observación, sea M un subespacio de un espacio normado X , con la normainducida. Si X es pre-hilbertiano, está claro que M también lo es, pues al restringir a M×M elproducto escalar de X , se tiene un producto escalar en M que obviamente da lugar a la normainducida. El teorema anterior nos permite comprobar que el recíproco es cierto, siempre que Msea denso en X . Para ello basta ver los dos miembros de la identidad del paralelogramo comofunciones continuas de dos variables, x,y ∈ X , definidas en X×X , con lo que el conjunto E delos pares (x,y) ∈ X ×X que verifican dicha identidad es cerrado. Como M es pre-hilbertiano,tenemos M×M ⊂ E , pero por ser M denso en X , también M×M es denso en X × X yconcluimos que E = X ×X . Hemos probado:

Sea X un espacio normado y M un subespacio denso en X . Si M, con la norma inducidapor X , es un espacio pre-hilbertiano, entonces X también lo es. Equivalentemente, lacompletación de un espacio pre-hilbertiano es un espacio de Hilbert.

Podemos ahora averiguar fácilmente, cuáles de los espacios de Banach presentados en sumomento como ejemplos, son espacios de Hilbert. Para N ∈N con N > 1 y 1 6 p 6 ∞ , usemoslos dos primeros vectores, e1 y e2 , en la base usual de KN . Es claro que ‖e1 ‖p = ‖e2 ‖p = 1,mientras que ‖e1 ± e2 ‖p = 21/p si p < ∞ , y ‖e1 ± e2 ‖∞ = 1. Vemos entonces que(

‖e1 + e2 ‖∞

)2 +(‖e1 − e2 ‖∞

)2 = 2 6= 4 = 2(‖e1 ‖∞

)2 + 2(‖e2 ‖∞

)2

luego l N∞ no verifica la identidad del paralelogramo. Si 1 6 p < ∞ y l N

p la verifica, tenemos

2 · 22/p =(‖e1 + e2 ‖p

)2 +(‖e1 − e2 ‖p

)2 = 2(‖e1 ‖p

)2 + 2(‖e2 ‖p

)2 = 4

de donde se deduce que p = 2 y hemos obtenido el resultado que sigue.

Para N ∈ N con N > 2 y 1 6 p 6 ∞ , l Np es un espacio de Hilbert si, y sólo si, p = 2 .

Page 10: Espacios de Hilbertrpaya/documentos/Funcional/2019-20/Hilbert.pdf · Espacios de Hilbert Este último tema está dedicado a los espacios de Banach más perfectos desde un punto de

11. Espacios de Hilbert 138

Observemos ahora que para 1 6 p < ∞ , el espacio de sucesiones lp contiene un subespacioisométricamente isomorfo a l 2

p , luego lp sólo puede ser un espacio de Hilbert para p = 2. Enel caso p = ∞ , vemos también que l 2

∞ es isométricamente isomorfo a un subespacio de c0 ,luego c0 no es un espacio de Hilbert, y por tanto l∞ tampoco puede serlo. En resumen, para losespacios clásicos de sucesiones, tenemos:

Para 1 6 p 6 ∞ , se tiene que lp es un espacio de Hilbert si, y sólo si, p = 2 . Por suparte, c0 tampoco es un espacio de Hilbert.

En cuanto a los espacios de Lebesgue, para 1 6 p 6 ∞ sabemos que lp es isométricamenteisomorfo a un subespacio de Lp . Por tanto:

Para 1 6 p 6 ∞ se tiene que Lp es un espacio de Hilbert si, y sólo si, p = 2 .

Si Γ es un conjunto no numerable, está claro que el espacio de funciones acotadas l∞(Γ)contiene un subespacio isométricamente isomorfo a l 2

∞ , por lo que l∞(Γ) no es un espacio deHilbert, como ocurría cuando Γ es numerable.

Comentemos finalmente que el espacio de Banach C[0,1] , con la norma del máximo, noes un espacio de Hilbert. Para verlo, basta considerar por ejemplo las funciones f ,g ∈C[0,1]definidas por f (t) = 1 y g(t) = t para todo t ∈ [0,1] . Se tiene claramente que

‖ f +g‖2 + ‖ f −g‖2 = 5 6= 4 = 2‖ f ‖2 + 2‖g‖2

luego C[0,1] no verifica la identidad del paralelogramo. De hecho, no es difícil comprobar que,si K es un espacio topológico compacto y de Hausdorff, que no se reduce a un punto, entoncesel espacio de Banach C(K) no es un espacio de Hilbert.

11.4. Mejor aproximación en espacios de Hilbert

La identidad del paralelogramo permite obtener muy fácilmente un resultado clave, sobreexistencia y unicidad de mejores aproximaciones en espacios de Hilbert, que nos llevará despuésal teorema más importante referente a dichos espacios. A partir de ahora trabajaremos siempreen un espacio de Hilbert, con lo que casi nunca se pierde generalidad, pues en el caso de unespacio pre-hilbertiano no completo, siempre podemos considerar su completación.

Teorema de aproximación óptima. Sea M un subconjunto no vacío, convexo y cerrado,de un espacio de Hilbert H. Entonces, cada x ∈ H tiene una única mejor aproximación en M ,es decir: para cada x ∈ H , existe un único y ∈M verificando que ‖x− y‖ = d(x,M) .

Demostración. Fijado x ∈ H , para y,z ∈M , la identidad del paralelogramo nos dice que∥∥z− y∥∥2 =

∥∥(x− y)− (x− z)∥∥2 = 2

∥∥x− y∥∥2 + 2

∥∥x− z∥∥2 − 4

∥∥∥∥x − y+ z2

∥∥∥∥2

Por ser M convexo, tenemos (y+ z)/2 ∈M , y de la igualdad anterior deducimos que

‖z− y‖2 6 2 ‖x− y‖2 + 2 ‖x− z‖2 − 4 d(x,M)2 ∀a,b ∈M (11)

desigualdad que será la clave de la demostración.

Page 11: Espacios de Hilbertrpaya/documentos/Funcional/2019-20/Hilbert.pdf · Espacios de Hilbert Este último tema está dedicado a los espacios de Banach más perfectos desde un punto de

11. Espacios de Hilbert 139

Fijamos una sucesión yn de puntos de M tal que‖x− yn ‖

→ d(x,M) . Dado ε > 0,

existe n0 ∈ N tal que, para k > n0 se tiene ‖x− yk ‖2 < d(x,M)2 +(

ε2 /4). Para n,m > n0 ,

podemos entonces usar (11) , con y = ym y z = yn , para obtener que

‖yn− ym ‖2 6 2‖x− ym ‖2 + 2‖x− yn ‖2 − 4 d(x,M)2 < ε2

luego yn es una sucesión de Cauchy. Como H es completo y M cerrado, tenemos por tantoque yn→ y ∈M . La continuidad de la norma de H nos dice entonces que

‖x− y‖ = lımn→∞

‖x− yn ‖ = d(x,M)

de modo que y es una mejor aproximación de x en M. Es la única, pues si z ∈ M tambiénverifica que ‖x− z‖ = d(x,M) , la desigualdad (11) nos dice que z = y .

Merece la pena discutir brevemente el papel que juegan las hipótesis del teorema anterior,por una parte para la existencia, y por otra para la unicidad, de las mejores aproximaciones.

Empezando por la existencia, para que todo x ∈H tenga al menos una mejor aproximaciónen M, es decir, para que M sea proximinal en H, es necesario que M sea cerrado, luego estahipótesis no se puede suprimir.

Más importante es observar que la convexidad de M tampoco se puede suprimir. Así pues,a diferencia de lo que ocurría en los espacios normados de dimensión finita, un subconjuntocerrado A de un espacio de Hilbert H puede no ser proximinal en H , como veremos con elsiguiente ejemplo.

Sea en la sucesión de vectores unidad en l2 , y sea yn = (n+1)en /n para todo n∈N .Entonces el conjunto A =

yn : n ∈ N

es cerrado, pero no es proximinal en l2 .

Para n,m∈N , con n 6= m , se tiene ‖yn−ym ‖ >√

2, de donde se deduce que A es cerrado,pues toda sucesión convergente de puntos de A es constante a partir de un término en adelante,luego converge a un punto de A .

Por otra parte, comprobamos que 0 no tiene ninguna mejor aproximación en A , pues bastaobservar que d(0,A) = ınf

‖yn ‖ : n ∈ N

= 1, pero ‖yn ‖> 1 para todo n ∈ N .

En resumen, para asegurar la existencia de mejores aproximaciones, no podemos suprimirninguna de las hipótesis del teorema anterior. Para la unicidad, la situación es completamentediferente, como vamos a ver.

En la demostración del teorema, la unicidad se deduce de la desigualdad (11) , obtenidausando solamente que M es convexo, luego no se precisa que M sea cerrado. Por tanto, si Mes un subconjunto no vacío y convexo de un espacio de Hilbert H, entonces cada x ∈H tiene alo sumo una mejor aproximación en M . Finalmente está bien claro que la convexidad de M nose puede suprimir, pues basta pensar lo que ocurre cuando M tiene exactamente dos puntos.

Page 12: Espacios de Hilbertrpaya/documentos/Funcional/2019-20/Hilbert.pdf · Espacios de Hilbert Este último tema está dedicado a los espacios de Banach más perfectos desde un punto de

11. Espacios de Hilbert 140

11.5. Ortogonalidad

Para llegar al principal resultado en la teoría de los espacios de Hilbert, sólo nos quedaobtener una caracterización de las mejores aproximaciones, que es independiente del teoremaanterior, y acorde con la intuición geométrica.

Sea M un subconjunto no vacío de un espacio de Hilbert H. Entonces y0 ∈M es una mejoraproximación de un x ∈ H en M si, y sólo si, verifica que

‖x− y0 ‖2 6 ‖x− z‖2 ∀z ∈M (12)

Ahora bien, para todo z ∈M se tiene

‖x− z‖2 = ‖(x− y0)− (z− y0)‖2 = ‖x− y0‖2 + ‖z− y0‖2 − 2 Re(

x− y0∣∣z− y0

)luego la condición (12) equivale a

2 Re(

x− y0∣∣z− y0

)6∥∥z− y0

∥∥2 ∀z ∈M (13)

Si M es convexo, dados y ∈ M y t ∈ ]0 ,1 [ , usamos (13) con z = (1− t)y0 + t y ∈ M ,con lo que z− y0 = t (y− y0) , y obtenemos

2 t Re(

x− y0∣∣y− y0

)6 t 2∥∥y− y0

∥∥2

Dividiendo ambos miembros por t > 0, y haciendo t → 0, deducimos que

Re(

x− y0∣∣y− y0

)6 0 ∀y ∈M (14)

Recíprocamente, de (14) se deduce (13) , o lo que es lo mismo (12) , sin más que tomar y = z .

La condición (14) se simplifica notablemente cuando M es un subespacio de H. De hecho,para todo z ∈M , usando (14) con y = y0± z ∈M , obtenemos que Re

(x− y0

∣∣z) = 0. En elcaso complejo, tenemos también Im

(x− y0

∣∣z) = Re(

x− y0∣∣ i z)

= 0 para todo z ∈M . Asípues, en cualquier caso, de (14) hemos deducido que(

x− y0∣∣z) = 0 ∀z ∈M (15)

Recíprocamente, de (15) deducimos (14) tomando z = y− y0 . El siguiente enunciado recogelas equivalencias recién probadas.

Caracterización de las mejores aproximaciones. Sea M un subconjunto convexo de unespacio de Hilbert H . Para x ∈ H e y0 ∈M , se tiene:∥∥x− y0

∥∥ 6∥∥x− y

∥∥ ∀y ∈M ⇐⇒ Re(

x− y0∣∣y− y0

)6 0 ∀y ∈M

Si M es de hecho un subespacio de H , se tiene también:∥∥x− y0∥∥ 6

∥∥x− y∥∥ ∀y ∈M ⇐⇒

(x− y0

∣∣y) = 0 ∀y ∈M

Page 13: Espacios de Hilbertrpaya/documentos/Funcional/2019-20/Hilbert.pdf · Espacios de Hilbert Este último tema está dedicado a los espacios de Banach más perfectos desde un punto de

11. Espacios de Hilbert 141

Para interpretar geométricamente estas equivalencias, usamos una nomenclatura, motivadapor la segunda, que a partir de ahora será muy conveniente. Si H es un espacio de Hilbert,para x,y ∈ H decimos que x es ortogonal a y , cuando se tiene que

(x∣∣y) = 0, en cuyo

caso escribimos x⊥y . También podemos decir que x e y son ortogonales, pues se trata de unarelación simétrica: x⊥y ⇔ y⊥ x . Si ahora E es un subconjunto no vacío de H, definimos

E⊥ =

x ∈ H : x⊥y ∀y ∈ E

=

x ∈ H :(

x∣∣y)= 0 ∀y ∈ E

Por la linealidad y continuidad del producto escalar en la primera variable, vemos que E⊥ esun subespacio cerrado de H. Se dice que E⊥ es el subespacio ortogonal a E . La notaciónes la misma que usábamos para el anulador de un subconjunto de un espacio normado X , queera un subespacio cerrado del espacio dual X ∗. Pronto veremos que es perfectamente coherenteemplear la misma notación en ambas situaciones.

Iterando el paso de E a E⊥ , es natural escribir E⊥⊥ =(

E⊥ )⊥. Es claro que E ⊂ E⊥⊥,pero E⊥⊥ es un subespacio cerrado de H, luego Lin E ⊂ E⊥⊥.

Para entender geométricamente la ortogonalidad, basta pensar en el teorema de Pitágoras:dos vectores x,y son perpendiculares cuando ‖x+ y‖2 = ‖x‖2 +‖y‖2 . Si H es un espacio deHilbert, para x,y ∈ H se tiene

‖x+ y‖2 = ‖x‖2 + ‖y‖2 + 2 Re(

x∣∣y)

luego x e y son perpendiculares si, y sólo si, Re(

x∣∣y) = 0, lo que en caso real, equivale a

que x e y sean ortogonales. En caso complejo, tenemos Im(

x∣∣y) = Re

(x∣∣ i y)

, luego x e yson ortogonales cuando x es perpendicular tanto a y como a i y , es decir, cuando el vector x esperpendicular al plano (real) determinado por y e i y . Por tanto, la interpretación geométrica dela ortogonalidad queda resumida en el enunciado que sigue.

Si H es un espacio de Hilbert, para x,y ∈ H se tiene:

(i) En caso real: x⊥y ⇐⇒∥∥x+ y

∥∥2 =∥∥x∥∥2 +

∥∥y∥∥2

(ii) En caso complejo: x⊥y ⇐⇒∥∥x+ y

∥∥2 =∥∥x+ iy

∥∥2 =∥∥x∥∥2 +

∥∥y∥∥2

La caracterización de las mejores aproximaciones tiene ya una interpretación geométricamuy intuitiva. Si M es un subespacio del espacio de Hilbert H, vimos que y0 ∈M es la mejoraproximación de x ∈ H en M si, y sólo si, x− y0 ∈ M⊥ . Esto equivale a que x− y0 seaperpendicular al subespacio M, o que el punto y0 sea el pie de la perpendicular a M que pasapor el punto x , lo que está totalmente de acuerdo con la intuición geométrica.

Para un conjunto convexo M ⊂ H , la interpretación es también intuitiva, aunque no tansencilla. La hacemos en caso real, pues si H es complejo, basta pensar que M es un subconjuntoconvexo de HR . Fijado x ∈ H, vimos que y0 ∈ M es la mejor aproximación de x en M si, ysólo si,

(x−y0

∣∣y−y0)

6 0 para todo y ∈M. Tomando α0 =(

x−y0∣∣y0)∈R , esto equivale

a(

x−y0∣∣y) 6 α0 para todo y ∈M . Como

(x−y0

∣∣x−y0)

> 0, tenemos(

x−y0∣∣x) > α0 .

Por tanto, el conjunto Z =

z ∈ H :(

x− y0∣∣z)= α0

es un hiperplano afín, que pasa por el

punto y0 , ya que y0 ∈ Z , deja el punto x a un lado, y el conjunto M al otro. En particular, elfuncional lineal y continuo z 7→

(x− y0

∣∣z) , o si se quiere el hiperplano Z , separa x de M.

Page 14: Espacios de Hilbertrpaya/documentos/Funcional/2019-20/Hilbert.pdf · Espacios de Hilbert Este último tema está dedicado a los espacios de Banach más perfectos desde un punto de

11. Espacios de Hilbert 142

Conviene describir mejor el hiperplano Z . Para z1,z2 ∈ Z se tiene(

x− y0∣∣z1− z2

)= 0,

así que x− y0 es perpendicular a todas las rectas contenidas en Z , es un vector normal alhiperplano Z . En resumen, el único hiperplano que pasa por y0 y tiene a x− y0 como vectornormal, separa x de M . Que esta condición caracterice a la mejor aproximación de x en M ,vuelve a estar de acuerdo con la intuición geométrica.

11.6. Teorema de la proyección ortogonal

Enlazando el teorema de aproximación óptima, que garantiza la existencia y unicidad demejores aproximaciones, con la caracterización de las mismas en términos de ortogonalidad,obtenemos el resultado más importante en el estudio de los espacios de Hilbert:

Teorema de la proyección ortogonal. Si M es un subespacio cerrado de un espacio deHilbert H , se tiene H = M ⊕ M⊥, y esta suma es topológico-directa.

De hecho, si PM es la única proyección lineal de H sobre M cuyo núcleo es M⊥, se tiene:∥∥x∥∥2 =

∥∥PM(x)∥∥2 +

∥∥x−PM(x)∥∥2 ∀x ∈ X (16)

luego PM es continua y ‖PM‖= 1 , a menos que M = 0 . Además, para cada x ∈ H, se tieneque PM(x) es la única mejor aproximación de x en M . Finalmente, se verifica que M⊥⊥ = M .

Demostración. Cada x ∈ H tiene una única mejor aproximación en M que, adelantandoacontecimientos, denotamos por PM(x) . Sabemos que PM(x) ∈ M se caracteriza por verificarque x−PM(x) ∈M⊥.

Se tiene entonces que x = PM(x) +(

x−PM(x))∈ M + M⊥ para todo x ∈ H. Además,

vemos que M∩M⊥ = 0 , pues para todo y ∈M∩M⊥ se tiene y⊥y , luego y = 0. Por tantotenemos H = M ⊕M⊥ y efectivamente, PM es la única proyección lineal de X sobre M cuyonúcleo es M⊥.

La igualdad (16) se debe a que PM(x)⊥(

x−PM(x))

para todo x ∈H , y de ella deducimosque ‖PM(x)‖ 6 ‖x‖ para todo x ∈ H , luego PM es continua con ‖PM‖ 6 1. Si M 6= 0 , alser PM(y) = y para todo y ∈M , se ha de tener ‖PM‖= 1. Sabemos que la continuidad de PMequivale a que la suma directa H = M ⊕ M⊥ sea topológico-directa.

Finalmente, para z ∈M⊥⊥ se tiene PM(z) ∈M ⊂M⊥⊥ , de donde z−PM(z) ∈M⊥⊥ , perotambién z−PM(z) ∈M⊥ , así que z−PM(z) ∈M⊥⊥∩M⊥ = 0 . Por tanto z = PM(z) ∈M yhemos probado que M⊥⊥ ⊂M , pero la otra inclusión es sabida.

Con la notación del teorema anterior, se dice que PM es la proyección ortogonal de Hsobre M , cuya interpretación geométrica está bien clara. Nótese que M⊥ está en la mismasituación que M , pues también es subespacio cerrado de H. Tenemos por tanto las proyeccionesortogonales PM y PM⊥ , de H sobre M y M⊥ respectivamente. Como ker PM⊥ = M⊥⊥ = M ,dichas proyecciones son complementarias: PM(x)+PM⊥(x) = x para todo x ∈ H.

Antes de estudiar la principal consecuencia del teorema anterior, generalizamos su últimaafirmación, sustituyendo el subespacio cerrado M por un conjunto no vacío arbitrario.

Page 15: Espacios de Hilbertrpaya/documentos/Funcional/2019-20/Hilbert.pdf · Espacios de Hilbert Este último tema está dedicado a los espacios de Banach más perfectos desde un punto de

11. Espacios de Hilbert 143

Si E es un subconjunto no vacío de un espacio de Hilbert H, se tiene que E⊥⊥ = Lin E .En particular, si Y es un subespacio de H, se tiene Y = Y ⊥⊥ , luego Y es denso en H si,y sólo si, Y ⊥ = 0 .

Tomando M = Lin E , tenemos M ⊂ E⊥⊥ . Ahora bien, de E ⊂ M se deduce M⊥ ⊂ E⊥ ,luego E⊥⊥ ⊂M⊥⊥ , pero como M es un subespacio cerrado de H, el teorema anterior nos diceque M⊥⊥ = M , luego E⊥⊥ ⊂M. Por tanto, E⊥⊥ = M , como se quería.

Si Y es subespacio de H, se tiene obviamente Y ⊥⊥ = LinY = Y . Por tanto, si Y ⊥ = 0tendremos Y = 0⊥ = H, luego Y es denso en H. Recíprocamente, si Y es denso en H,tenemos Y ⊥⊥ = H, de donde Y ⊥ = Y ⊥∩Y ⊥⊥ = 0 .

El teorema de la proyección ortogonal se debe a la escuela de Hilbert, aparece ya en untrabajo de E. Schmidt, su más directo colaborador, publicado en 1908. Como una consecuenciamuy relevante, F. Riesz y M. Fréchet probaron poco después la autodualidad de los espacios deHilbert, resultado que ahora vamos a estudiar.

Recordemos que todos los espacios de Hilbert, que hemos presentado como ejemplos, seidentifican con su espacio dual. Para N ∈N , sabemos que

(l N2)∗ es isométricamente isomorfo

a l N2 , y análogamente, l∗2 se identifica con l2 . Aunque no dimos una demostración completa,

también sabemos que L∗2 se identifica con L2 . Pues bien, estos resultados no son más quecasos particulares de un teorema general que permite en cierto modo identificar todo espacio deHilbert H con su dual H ∗ . Veamos paso a paso cómo se consigue dicha identificación.

Si X es un espacio pre-hilbertiano, fijado y ∈ X , podemos definir

y : X → K , y(x) =(

x∣∣y) ∀x ∈ X

La linealidad y continuidad del producto escalar en la primera variable, significan que y ∈ X ∗,y vamos a calcular fácilmente la norma dual de y . La desigualdad de Cauchy-Schwartz nos diceque

∣∣ y(x)∣∣ 6

∥∥x∥∥ ∥∥y

∥∥ para todo x ∈ X , es decir,∥∥ y∥∥ 6

∥∥y∥∥ , pero de hecho tenemos la

igualdad, ya que∥∥y∥∥2 = y(y) 6

∥∥ y∥∥ ∥∥y

∥∥ . Consideramos ahora la aplicación

Ψ : X → X ∗ , Ψ(y) = y ∀y ∈ X

Como el producto escalar es conjugado-lineal en la segunda variable, vemos que Ψ también esconjugado-lineal, es decir, para y,z ∈ X y λ ∈ K , se tiene que Ψ(λy + z) = λΨ(y) + Ψ(z) .Claro está que, en el caso real, Ψ es lineal.

En cualquier caso, sabemos que Ψ preserva la norma, luego es isométrica: para y,z ∈ X , setiene que ‖Ψ(y)−Ψ(z)‖ = ‖Ψ(y− z)‖ = ‖y− z‖ . Para que Ψ sea sobreyectiva, X ha de sercompleto, puesto que X ∗ lo es. Pero lo más interesante es el recíproco.

Teorema de Riesz-Fréchet. Si H un espacio de Hilbert y f ∈ H ∗ , existe y ∈ H tal que

f (x) =(

x∣∣y) ∀x ∈ H

Por tanto, si para y ∈H escribimos y(x) = (x |y) para todo x ∈H, definiendo Ψ(y) = y paratodo y ∈ H, se tiene que Ψ es una biyección conjugado-lineal e isométrica de H sobre H ∗ .

Page 16: Espacios de Hilbertrpaya/documentos/Funcional/2019-20/Hilbert.pdf · Espacios de Hilbert Este último tema está dedicado a los espacios de Banach más perfectos desde un punto de

11. Espacios de Hilbert 144

Demostración. Sólo hay que comprobar la primera afirmación: la sobreyectividad de Ψ .Dado f ∈H ∗ \0 , tenemos que ker f es un subespacio cerrado de H, al que podemos aplicarel teorema de la proyección ortogonal. Como ker f 6= H , existe u ∈ (ker f )⊥ tal que ‖u‖ = 1.Para x ∈ H se tiene que f (x)u − f (u)x ∈ ker f , de donde

0 =(

f (x)u− f (u)x∣∣u) = f (x)‖u‖2 − f (u)

(x∣∣u) = f (x) −

(x∣∣ f (u)u

)y tomando y = f (u)u , se tiene f (x) = (x |y) para todo x ∈ H , como se quería.

Vemos que todo espacio de Hilbert real H se identifica con su espacio dual H ∗, pues Ψ

es un isomorfismo isométrico de H sobre H∗. En cambio, cuando H es complejo, Ψ no eslineal, sino conjugado-lineal. Aunque no vamos a hacerlo, se puede probar que, también encaso complejo, existe un isomorfismo isométrico Φ de H sobre H ∗. Sin embargo, mientrasque la aplicación Ψ es canónica, porque su definición sólo involucra el producto escalar de H,el isomorfismo Φ no puede serlo.

La existencia del isomorfismo isométrico Φ es fácil de comprobar en los casos particularesque conocemos. En el caso H = l N

2 con N ∈ N , para todo y ∈ l N2 se define Φ(y) = Ψ(y) ,

donde y(k) = y(k) para todo k ∈ 1,2, . . . ,N . Análogamente, cuando H = l2 , para y ∈ l2 sedefine Φ(y) = Ψ(y) donde y ∈ l2 viene dado por y(n) = y(n) para todo n ∈N . Por último, enel caso H = L2 , para toda g ∈ L2 se define Φ(g) = Ψ(g) donde g(t) = g(t) p.c.t. t ∈ [0,1] .En los tres casos vemos claramente que Φ es un isomorfismo isométrico de H sobre H ∗, quefue exactamente el que usamos en su momento para identificar estos dos espacios.

Conviene resaltar que, en el caso H = L2 , hemos probado que Ψ y Φ son sobreyectivas,gracias al teorema anterior, sin usar ningún resultado de Teoría de la Medida.

Dado un subconjunto no vacío E de un espacio de Hilbert H, aclaremos ahora la cuestiónde notación planteada al definir el subespacio ortogonal E⊥. Cuando identificamos H con H ∗

mediante Ψ , vemos que E⊥ se identifica con el subespacio cerrado de H∗ dado por

Ψ(E⊥)

=

y : y ∈ E⊥ =

f ∈ H∗ : f (x) = 0 ∀x ∈ E que es precisamente el anulador de E , tal y como se definió, para subconjuntos de cualquierespacio normado, en el estudio de la dualidad. Así pues, al identificar H con H ∗ hacemoscoincidir las dos definiciones de E⊥ , luego al usar la misma notación para ambas nociones, nohay peligro de confusión.

Comentemos finalmente la consecuencia más clara del teorema de la proyección ortogonal.Si M es un subespacio cerrado de un espacio de Hilbert H, entonces M⊥ es un complementotopológico canónico de M y, consecuentemente, el espacio cociente H/M carece de interés.En particular, en cualquier espacio de Hilbert H, todo subespacio cerrado está complementado,y es claro que esta propiedad de H se conserva por isomorfismos:

Si un espacio de Banach X es isomorfo a un espacio de Hilbert, todo subespacio cerradode X está complementado en X .

En 1971, J. Lindenstrauss y L. Tzafriri probaron el recíproco del resultado anterior: si todosubespacio cerrado de un espacio de Banach X está complementado en X, entonces X esisomorfo a un espacio de Hilbert. Resolvieron así un problema que había permanecido abiertodurante varias décadas, conocido como el problema del subespacio complementado.

Page 17: Espacios de Hilbertrpaya/documentos/Funcional/2019-20/Hilbert.pdf · Espacios de Hilbert Este último tema está dedicado a los espacios de Banach más perfectos desde un punto de

11. Espacios de Hilbert 145

11.7. Sistemas y bases ortonormales

Iniciamos ahora el camino hacia una descripción de todos los espacios de Hilbert separables.La clave para ello es la siguiente noción, que está claramente inspirada en lo que le ocurre acualquier conjunto formado por vectores unidad del espacio de Hilbert l2 .

Un sistema ortonormal en un espacio de Hilbert H es un conjunto no vacío E ⊂ H, queestá formado por vectores de norma 1, dos a dos ortogonales, es decir,

‖u‖ = 1 ∀u ∈ E y u,v ∈ E , u 6= v =⇒ u ⊥ v

Conviene hacer la siguiente observación, casi inmediata:

Todo sistema ortonormal en un espacio de Hilbert es un conjunto de vectores linealmenteindependientes.

Sea E un sistema ortonormal en un espacio de Hilbert H, y supongamos que u ∈ E verificaque u ∈ Lin

(E \ u

), para llegar a una contradicción. Por definición de sistema ortonormal

tenemos que E \u ⊂ u⊥ , pero u⊥ es un subespacio de H, luego Lin(E \u

)⊂ u⊥

y en particular u⊥u , es decir, u = 0. Esto es una contradicción, pues por definición de sistemaortonormal, se tiene ‖u‖ = 1.

La siguiente propiedad de los sistemas ortonormales finitos es la clave de los resultados quevamos a obtener:

Sistemas ortonormales finitos. Sea E = u1,u2, . . . ,un un sistema ortonormal en unespacio de Hilbert H y M = Lin E. Entonces, la proyección ortogonal de H sobre Mviene dada por

PM(x) =n

∑k=1

(x∣∣uk)

uk ∀x ∈ H (17)

Como consecuencia, para todo x ∈ H se tiene:

d(x,M) =∥∥∥∥x −

n

∑k=1

(x∣∣uk)

uk

∥∥∥∥ y ‖x‖2 =n

∑k=1

∣∣(x∣∣uk)∣∣2 + d(x,M)2 (18)

Fijado x ∈ H , denotamos por y al segundo miembro de (17) , para probar que PM(x) = y .Es claro que y ∈M y, para todo j ∈ 1,2, . . . ,n tenemos

(x− y

∣∣ u j)

=(

x∣∣u j)−

n

∑k=1

(x∣∣uk) (

uk∣∣u j)

=(

x∣∣u j)−(

x∣∣u j)‖u j ‖2 = 0

es decir, E ⊂ (x−y)⊥ , pero (x−y)⊥ es un subespacio de H, luego M ⊂ (x−y)⊥ , o lo que eslo mismo, x− y ∈ M⊥ . Ahora bien, PM(x) es el único vector de M tal que x−PM(x) ∈ M⊥ ,luego se ha de tener y = PM(x) , como se quería.

Page 18: Espacios de Hilbertrpaya/documentos/Funcional/2019-20/Hilbert.pdf · Espacios de Hilbert Este último tema está dedicado a los espacios de Banach más perfectos desde un punto de

11. Espacios de Hilbert 146

Como PM(x) es la mejor aproximación de x en M, tenemos la primera igualdad de (18) .Para la segunda, calculamos la norma de PM(x) de la siguiente forma:

‖PM(x)‖2 =(

PM(x)∣∣PM(x)

)=

n

∑k=1

n

∑j=1

(x∣∣uk) (

x∣∣u j) (

uk∣∣u j)

=n

∑k=1

∣∣(x∣∣uk)∣∣2

Basta ahora tener en cuenta que PM(x)⊥(x−PM(x)

)para obtener

‖x‖2 = ‖PM(x)‖2 + ‖x−PM(x)‖2 =n

∑k=1

∣∣(x ∣∣uk)∣∣2 + d(x,M)2

que es la segunda igualdad de (18) .

Las igualdades (18) serán especialmente útiles cuando d(x,M) = 0 para todo x ∈ H, esdecir, cuando M = H, con lo que E es una base algebraica de H. De manera más general, paraaprovecharlas también en dimensión infinita, introducimos la siguiente noción.

Una base ortonormal en un espacio de Hilbert H es un sistema ortonormal E ⊂ H quegenera un subespacio denso en H, es decir, tal que H = Lin E .

Si un espacio de Hilbert H tiene una base ortonormal numerable E , está claro que H hade ser separable, ya que Lin E tiene dimensión numerable y es denso en H. Nuestro objetivoes probar que, recíprocamente, todo espacio de Hilbert separable admite una base ortonormalnumerable, lo que permitirá describir perfectamente el espacio. Empezamos por el caso mássencillo.

11.8. Espacios de Hilbert de dimensión finita

La existencia de bases ortonormales en los espacios de Hilbert de dimensión finita se pruebafácilmente por inducción, mediante el siguiente resultado:

Método de Gramm-Schmidt. Sea E un sistema ortonormal finito en un espacio deHilbert H. Supongamos que Lin E 6= H y sea x ∈ H \Lin E. Entonces existe w ∈ H talque E ∪w es un sistema ortonormal en H y Lin

(E ∪w

)= Lin

(E ∪x

).

Tomamos v = x − ∑u∈E

(x∣∣u)u , y usando que E es un sistema ortonormal, comprobamos

que v ∈ E⊥, pues para todo z ∈ E , se tiene claramente(v∣∣z) =

(x∣∣z) − ∑

u∈E

(x∣∣u)(u

∣∣z) =(

x∣∣z) − (x

∣∣z)‖z‖2 = 0

Como x /∈ Lin E , tenemos v 6= 0, y comprobaremos que basta tomar w = v/‖v‖ .

Por ser E es un sistema ortonormal y w ∈ E⊥ , vemos claramente que E ∪w también esun sistema ortonormal. La definición de v nos dice que x ∈ Lin

(E ∪v

)= Lin

(E ∪w

),

luego Lin(

E ∪x)⊂ Lin

(E ∪w . Pero por otra parte, es claro que w ∈ Lin

(E ∪x

), de

donde Lin(

E ∪w)⊂ Lin

(E ∪ x

).

Page 19: Espacios de Hilbertrpaya/documentos/Funcional/2019-20/Hilbert.pdf · Espacios de Hilbert Este último tema está dedicado a los espacios de Banach más perfectos desde un punto de

11. Espacios de Hilbert 147

Podemos ya comprobar que, para cada N ∈ N existe, salvo isomorfismos isométricos, unúnico espacio de Hilbert de dimensión N.

Si N ∈ N y H es un espacio de Hilbert de dimensión N , entonces H tiene una baseortonormal u1,u2, . . . ,uN , formada por N vectores. Por tanto, para todo x∈H se tiene

x =N

∑k=1

(x∣∣uk)

uk y ‖x‖2 =N

∑k=1

∣∣(x∣∣uk)∣∣2 (19)

Como consecuencia, H es isométricamente isomorfo a lN2 .

La primera parte del enunciado se prueba por inducción sobre N , siendo obvia para N = 1.Fijado N ∈ N , supongamos demostrado que todo espacio de Hilbert de dimensión N tiene unabase ortonormal con N vectores, y sea X un espacio de Hilbert de dimensión N + 1. Fijadoentonces x ∈ X \ 0 , podemos escribir X = H ⊕ Kx , donde H es un espacio de Hilbert dedimensión N , que tendrá una base ortonormal E con N vectores. Como x /∈ H = Lin E , elmétodo de Gramm-Schmidt nos da un w ∈ X tal que F = E ∪w es un sistema ortonormalcon Lin F = Lin

(E ∪x

)= X , luego F es una base ortonormal de X , con N +1 vectores.

Fijado N ∈ N , sea H un espacio de Hilbert de dimensión N y sea E = u1,u2, . . . ,uNuna base ortonormal de H. Como E es un sistema ortonormal finito, podemos usar el resultadoprobado previamente, pero teniendo en cuenta que Lin E = H. Las dos igualdades que aparecenen (18) nos dan directamente (19) .

Esto prueba que la aplicación lineal

Φ : H → l N2 ,

(Φ(x)

)(k) =

(x∣∣uk)

∀k ∈ 1,2 . . . ,N , ∀x ∈ H

es isométrica, y en particular inyectiva, pero H y lN2 tienen la misma dimensión, luego también

es sobreyectiva. Por tanto, Φ es un isomorfismo isométrico.

11.9. Espacios de Hilbert separables

Con un razonamiento bastante similar al recién empleado en dimensión finita, probamosahora que el espacio de sucesiones l2 es, salvo isomorfismos isométricos, el único espacio deHilbert separable, de dimensión infinita.

Teorema. Si H es un espacio de Hilbert separable, de dimensión infinita, entonces H tieneuna base ortonormal infinita y numerable un : n ∈N . Por tanto, para todo x ∈H se tiene quela serie ∑

n>1

(x∣∣un)

un es convergente con:

x =∞

∑n=1

(x∣∣un)

un y ‖x‖2 =∞

∑n=1

∣∣(x∣∣un)∣∣2 (20)

Como consecuencia, H es isométricamente isomorfo a l2 .

Page 20: Espacios de Hilbertrpaya/documentos/Funcional/2019-20/Hilbert.pdf · Espacios de Hilbert Este último tema está dedicado a los espacios de Banach más perfectos desde un punto de

11. Espacios de Hilbert 148

Demostración. Sea Y un subespacio de dimensión numerable, denso en H, para el quefijamos una base algebraica yn : n∈N . Para cada n∈N escribimos Yn = Lin y1,y2, . . . ,yn .Por inducción, definimos ahora otra sucesión un , en la forma que pasamos a explicar.

Empezamos tomando u1 = y1 /‖y1 ‖ , con lo que E1 = u1 es base ortonormal de Y1 .Dado n ∈ N , supongamos que ya hemos definido una base ortonormal En = u1,u2, . . . ,unde Yn . Como yn+1 /∈ Yn = Lin En , podemos entonces usar el método de Gramm-Schmidt, paraobtener un vector un+1 ∈ H, verificando que En+1 = En ∪un+1 es un sistema ortonormaltal que Lin En+1 = Lin

(En∪yn+1

)= Yn+1 , luego En+1 es una base ortonormal de Yn+1 .

Por inducción, tenemos una sucesión un verificando que En = u1,u2, . . . ,un es una baseortonormal de Yn para todo n ∈ N . Veremos ahora muy fácilmente que E = un : n ∈ N esuna base ortonormal de H.

Para n,m ∈ N con n < m , se tiene um,un ∈ Em y, como Em es un sistema ortonormal,vemos que ‖un ‖ = 1 y un⊥um . Esto prueba que E es un sistema ortonormal en H. Además,dado y ∈ Y , existe n ∈ N con y ∈ Yn = Lin En ⊂ Lin E , luego Y ⊂ Lin E . Por tanto Lin E esdenso en H, luego E es una base ortonormal de H, como se quería.

Fijados x ∈ H y n ∈ N , como En es un sistema ortonormal en H con Lin En = Yn , lasigualdades (18) nos dicen que

d(x,Yn) =

∥∥∥∥∥x −n

∑k=1

(x∣∣un)

un

∥∥∥∥∥ y ‖x‖2 =n

∑k=1

∣∣(x∣∣un)∣∣2 + d(x,Yn)2 (21)

Ahora bien, dado ε < 0, como Y es denso en H, podemos tomar y∈Y tal que ‖x−y‖ < ε ,y existe m∈N tal que y∈Ym . Para n∈N con n > m se tiene entonces d(x,Yn) 6 ‖x−y‖ < ε ,luego d(x,Yn)→ 0. De (21) deducimos entonces que la serie ∑

n>1

(x∣∣un)

un es convergente,

y que se verifica (20) .

Podemos ahora considerar la aplicación

Φ : H → l2 ,(

Φ(x))(n) =

(x∣∣un)

∀n ∈ N , ∀x ∈ H

Está claro que Φ es lineal, y la segunda igualdad de (20) nos dice que Φ es isométrica. Portanto, Φ(H) es completo, luego es subespacio cerrado de l2 . Ahora bien, para cada n ∈ N , setiene que Φ(un) = en es el n-ésimo vector unidad, luego Φ(H) contiene a todas las sucesionesde soporte finito, que forman un subespacio denso de l2 , Por tanto, Φ(H) = l2 , luego Φ es unisomorfismo isométrico de H sobre l2 .

Recordando que L2 es separable, llegamos al siguiente resultado:

Los espacios de Hilbert L2 y l2 son isométricamente isomorfos.

Como se puede fácilmente comprender, a la hora de estudiar el espacio de Hilbert L2 , ocualquier otro espacio de Hilbert separable y de dimensión infinita H que nos pueda interesar,la identificación con l2 sólo tendrá verdadera utilidad, cuando conozcamos explícitamente unabase ortonormal de H. Vamos a presentar a continuación una base ortonormal de L2 , perousando la notación típica del Análisis de Fourier. Obtendremos así un resultado clásico, quehistóricamente no es una consecuencia del teorema anterior, sino el precedente en que se inspira.

Page 21: Espacios de Hilbertrpaya/documentos/Funcional/2019-20/Hilbert.pdf · Espacios de Hilbert Este último tema está dedicado a los espacios de Banach más perfectos desde un punto de

11. Espacios de Hilbert 149

11.10. Series de Fourier en L2(T)

Usaremos el espacio de Hilbert complejo L2(T) , que como sabemos es isométricamenteisomorfo a L2 . Su producto escalar y su norma vienen dados, para f ,g ∈ L2(T) , por

(f∣∣g) =

12π

∫π

−π

f (t)g(t)dt y∥∥ f∥∥ =

(1

∫π

−π

∣∣ f (t)∣∣2 dt

)1/2

Por otra parte, veamos la definición de los coeficientes de Fourier y las series de Fourier,que hasta ahora sólo hemos manejado en el caso particular de una función continua. De maneramás general, los coeficientes de Fourier de f ∈ L1(T) vienen dados por

f (n) =1

∫π

−π

f (t)e−int dt ∀n ∈ Z

Usando dichos coeficientes, se define la serie de Fourier de f , que es la sucesión Sn( f ) defunciones de R en C definida por

Sn( f , t) =n

∑k=−n

f (k)e i k t ∀ t ∈ R , ∀n ∈ N∪0

donde, como es habitual, se abrevia la notación, escribiendo Sn( f , t) en vez de(

Sn( f ))(t) .

En el estudio de las series de Fourier, el objetivo es obtener, a partir de la sucesión Sn( f ) ,toda la información posible sobre f . Ello es factible, gracias al siguiente resultado básico, queno vamos a demostrar. Asegura que cada clase de equivalencia f ∈ L1(T) queda determinadapor sus coeficientes de Fourier.

Teorema de unicidad para las series de Fourier. Si f ∈ L1(T) verifica que f (n) = 0para todo n ∈ Z , entonces f (t) = 0 para casi todo t ∈ R .

Es por tanto natural plantearse la posibilidad de obtener explícitamente f a partir de suscoeficientes de Fourier, y en particular, es natural preguntarse si la serie de Fourier Sn( f )converge a f en algún sentido. En lo que sigue vamos a resolver estas cuestiones, de formabastante satisfactoria, en el caso particular de que se tenga f ∈ L2(T) . Ni que decir tiene, esoserá posible gracias a que L2(T) es un espacio de Hilbert. La clave está en observar que, paracada n ∈ Z , el coeficiente de Fourier f (n) es el producto escalar de f por una función a la queahora vamos a prestar atención.

Para cada n ∈ Z consideramos la función un : R→ C definida por

un(t) = e int ∀ t ∈ R

Es claro que un es continua y 2π-periódica, luego entendiéndola como clase de equivalencia,tenemos un ∈ L2(T) . El conjunto un : n ∈ Z se conoce como sistema trigonométrico y,como ya hemos comentado, se tiene

f (n) =(

f∣∣un)

∀n ∈ Z , ∀ f ∈ L2(T)

Page 22: Espacios de Hilbertrpaya/documentos/Funcional/2019-20/Hilbert.pdf · Espacios de Hilbert Este último tema está dedicado a los espacios de Banach más perfectos desde un punto de

11. Espacios de Hilbert 150

Comprobaremos ahora que el sistema trigonométrico es una base ortonormal de L2(T) , ycomo veremos, esto facilita enormemente el estudio de las series de Fourier en L2(T) .

Para n,m ∈ Z con n 6= m tenemos claramente

(un∣∣um

)=

12π

∫π

−π

e i(n−m) t dt =

[e i(n−m) t

i(n−m)

−π

= 0

mientras que

‖un ‖2 =(

un∣∣un)

=1

∫π

−π

e i(n−n) t dt =1

∫π

−π

dt = 1

luego un es un sistema ortonormal en L2(T) .

Denotando ahora por M al cierre del subespacio engendrado por el sistema trigonométrico,se trata de probar que M = L2(T) . Ahora bien, para f ∈M⊥ se tiene que f (n) =

(f∣∣un)

= 0para todo n ∈ Z , y el teorema de unicidad nos dice que f = 0 c.p.d. Por tanto M⊥ = 0 , yusando el teorema de la proyección ortogonal, obtenemos que L2(T) = M como queríamos.

Podemos ahora repetir, en L2(T) con la base ortonormal recién hallada, el razonamientoque antes hemos hecho para cualquier base ortonormal numerable en un espacio de Hilbert. Laúnica diferencia estriba en que el sistema trigonométrico se numera usando Z en vez de N ,pero salvo la notación, el razonamiento es exactamente el mismo, como se verá.

Fijado n ∈ N∪0 , consideramos el sistema ortonormal finito uk : k ∈ Z , |k | 6 n ,que genera un subespacio Yn ⊂ L2(T) que tiene dimensión 2n + 1. Denotando por Pn a laproyección ortogonal de L2(T) sobre Yn , sabemos que, para toda f ∈ L2(T) , se tiene:

Pn( f ) =n

∑k=−n

(f∣∣uk)

uk =n

∑k=−n

f (k)uk = Sn( f )

que es precisamente el n-ésimo término de la serie de Fourier de f . Las igualdades (18) tomanpor tanto la forma

d( f ,Yn) =∥∥ f − Sn( f )

∥∥ y ‖ f ‖2 =n

∑k=−n

∣∣ f (k)∣∣2 + d( f ,Yn)2 (22)

El subespacio engendrado por el sistema trigonométrico, que viene dado por Y =∞⋃

n=0Yn , es

denso en L2(T) . Por tanto, dados f ∈ L1(T) y ε > 0, existe g ∈Y con ‖ f −g‖ < ε y m ∈Ntal que g ∈ Ym . Para n ∈ N con n > m se tiene entonces que d( f ,Yn) 6 d( f ,Ym) < ε , y estoprueba que

d( f ,Yn)

→ 0. Usando la primera igualdad de (22) obtenemos que Sn( f )→ f ,

es decir, la serie de Fourier de f converge a f en L2(T) , lo cual es válido para toda f ∈ L2(T) .

Para expresar mejor lo que se obtiene de la segunda igualdad de (22) , introducimos una

notación adecuada. Para toda función α : Z → R+0 , la sucesión

n

∑k=−n

α(k)

es creciente, lo

que nos permite definir+∞

∑n=−∞

α(n) = lımn→∞

n

∑k=−n

α(k) ∈ R+0 ∪+∞

Page 23: Espacios de Hilbertrpaya/documentos/Funcional/2019-20/Hilbert.pdf · Espacios de Hilbert Este último tema está dedicado a los espacios de Banach más perfectos desde un punto de

11. Espacios de Hilbert 151

Pues bien, usando la segunda igualdad de (22) obtenemos que

‖ f ‖2 = lımn→∞

n

∑k=−n

∣∣ f (k)∣∣2 =

+∞

∑n=−∞

∣∣ f (n)∣∣2 (23)

Esta igualdad nos permitirá probar que la aplicación f 7→ f es un isomorfismo isométricode L2(T) sobre el espacio de Hilbert que describimos a continuación, que no es más que l2 ,con un cambio de notación.

Consideremos la aplicación biyectiva τ : N→ Z dada por

τ(1) = 0 , τ(2n) = n y τ(2n+1) = −n ∀n ∈ N

Usaremos τ para convertir funciones de Z en C en sucesiones de números complejos. Másconcretamente, la aplicación Φ : CZ→CN definida por Φ(x) = xτ para toda función x∈CZ ,es lineal y biyectiva. Considerando entonces el subespacio de CZ dado por l2(Z) = Φ−1(l2) ,vemos que Φ establece una biyección lineal de l2(Z) sobre l2 . Esto permite trasladar a l2(Z)la estructura de l2 , para convertir a l2(Z) en un espacio de Hilbert, idéntico a l2 .

Vemos que, para n ∈ N , se tiene que

k ∈ Z : |k | 6 n

=

τ( j) : j ∈ N , j 6 2n+1

.Por tanto, para toda función x ∈ CZ obtenemos

∑n=1

∣∣x(τ(n))∣∣2 = lım

n→∞

2n+1

∑j=1

∣∣x(τ( j))∣∣2 = lım

n→∞

n

∑k=−n

∣∣x(k) ∣∣2 =+∞

∑n=−∞

∣∣x(k) ∣∣2y esto nos permite dar una definición directa de l2(Z) , que es enteramente análoga a la de l2 :

l2(Z) =

x ∈ CZ :

+∞

∑n=−∞

∣∣x(k) ∣∣2 < ∞

Además, es claro que la norma de l2(Z) viene dada por

‖x‖ =

(+∞

∑n=−∞

∣∣x(k) ∣∣2)1/2

∀x ∈ l2(Z)

Así pues, con esta norma, l2(Z) es un espacio de Hilbert y Φ nos da un isomorfismo isométricode l2(Z) sobre l2 .

Para tener un subespacio denso de l2(Z) , observemos ahora los elementos de l2(Z) que secorresponden con los vectores unidad en : n ∈ N ⊂ l2 . Para cada m ∈ Z sea χm ∈ CZ lafunción característica del conjunto m , es decir,

χm(m) = 1 y χm(k) = 0 ∀k ∈ Z\m

Es fácil comprobar que, tomando n = τ−1(m) ∈ N , se tiene Φ(χm) = χm τ = en . Por tanto,tenemos

χm : m ∈ Z

= Φ−1(en : n ∈ N

), y deducimos que el subespacio engendrado

por el conjunto χm : m ∈ Z es denso en l2(Z) .

Page 24: Espacios de Hilbertrpaya/documentos/Funcional/2019-20/Hilbert.pdf · Espacios de Hilbert Este último tema está dedicado a los espacios de Banach más perfectos desde un punto de

11. Espacios de Hilbert 152

Pues bien, en la igualdad (23) vemos que la aplicación lineal f 7→ f , de L2(T) en l2(Z) ,es isométrica, y concluiremos nuestra discusión probando que también es sobreyectiva. Seapues X =

f : f ∈ L2(T)

la imagen de dicha aplicación. Entonces X es completo, por ser

isométricamente isomorfo a L2(T) , luego X es un subespacio cerrado de l2(Z) . Pero comoel sistema trigonométrico es ortonormal, vemos que um = χm para todo m ∈ Z , de dondededucimos que χm : m ∈ Z ⊂ X . Por tanto, X también es denso en l2(Z) , luego X = l2(Z) ,como queríamos demostrar.

Agrupamos todos los resultados que hemos ido obteniendo en un sólo enunciado, que puedeconsiderarse como el teorema fundamental sobre las series de Fourier en L2(T) .

Teorema. El sistema trigonométrico un : n ∈ Z es una base ortonormal del espacio deHilbert L2(T) , verificando que f (n) =

(f∣∣un)

para todo n ∈ Z . Por tanto, se tiene:

(i) Para cada f ∈ L2(T) , la serie de Fourier Sn( f ) converge a f en L2(T) , es decir:

lımn→∞

∥∥ f −Sn( f )∥∥2 = lım

n→∞

12π

∫π

−π

∣∣∣∣ f (t) −n

∑k=−n

f (k)e i k t∣∣∣∣2 dt = 0

(ii) También para cada f ∈ L2(T) , se tiene que f ∈ l2(Z) con

∥∥ f∥∥2 =

∫π

−π

| f (t) |2 dt =+∞

∑n=−∞

| f (n)∣∣2 =

∥∥ f∥∥2

Finalmente, para cada y ∈ l2(Z) existe f ∈ L2(T) tal que f = y , luego la aplicación f 7→ fes un isomorfismo isométrico de L2(T) sobre l2(Z) .