El eoremaT de Morse-Sard para las funciones de Sobolev

88

Transcript of El eoremaT de Morse-Sard para las funciones de Sobolev

UNIVERSIDAD COMPLUTENSE DE MADRID

TRABAJO DE FIN DE MÁSTER:

El Teorema de Morse-Sard para las funciones de Sobolev

Miguel García Bravo

Trabajo dirigido por el profesor:Daniel Azagra Rueda

Julio 2016

Índice general

0. Introducción 1

1. Preliminares 51.1. Notaciones y deniciones básicas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51.2. Lema del Recubrimiento de Vitali . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81.3. Teorema de Kneser-Glaeser . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 91.4. Teorema de diferenciabilidad de Lebesgue . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 151.5. Medida y contenido de Hausdor . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 171.6. Continuidad absoluta de la integral . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18

2. Espacios de Sobolev 212.1. Conceptos previos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21

2.1.1. Funciones Test . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 212.1.2. Derivada débil . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21

2.2. Espacios de Sobolev . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 222.2.1. Aproximación por funciones C∞ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23

2.3. Desigualdad de Morrey . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 272.4. Secciones de Sobolev . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 312.5. Composición e inversa de funciones de Sobolev . . . . . . . . . . . . . . . . . . . . . . . . . . 342.6. Otras normas equivalentes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36

3. Teorema de Morse-Sard (De Pascale) 393.1. Caso n = m . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 393.2. Teorema de Morse-Sard . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42

4. Teorema de Morse-Sard (Bourgain-Korobkov-Kristesen) 534.1. Valores cercanos a los críticos de polinomios . . . . . . . . . . . . . . . . . . . . . . . . . . . . 534.2. Aproximación por polinomios de funciones L1 . . . . . . . . . . . . . . . . . . . . . . . . . . . 55

4.2.1. Polinomio de aproximación . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 564.3. Propiedad de aproximación de tipo Luzin para W l,1 . . . . . . . . . . . . . . . . . . . . . . . 654.4. Imágenes de conjuntos de contenido Hausdor pequeño . . . . . . . . . . . . . . . . . . . . . . 684.5. Teorema de Morse-Sard . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 734.6. Aplicación a los conjuntos de nivel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79

Bibliografía 82

I

Capítulo 0

Introducción

El Teorema de Morse-Sard trata sobre el tamaño de la imagen de los puntos críticos de una funcióndiferenciable.

Teorema 0.1. (Morse-Sard, 1942) Sea f : Rn −→ Rm una función de clase Ck con k ≥ max n−m+ 1, 1.Entonces Lm(f(Cf )) = 0 donde Cf denota el conjunto de puntos críticos de f , es decir,

Cf = x ∈ Rn : rangoDf(x) < m ,

y Lm denota la medida de Lebesgue m−dimensional.

Un famoso ejemplo de Whitney muestra que este resultado es óptimo en la escala Cj . Sin embargo desdeentonces varias generalizaciones del Teorema para otras clases de funciones han aparecido en la literatu-ra, incluyendo los espacios de Hölder y los espacios de Sobolev. Para el primer caso, Bates ([5], 1993) llegaal mismo resultado que el Teorema 0.1 para funciones Ck−1,1, aunque en general falla para Ck−1,α con α < 1.

El primer resultado del Teorema de Morse-Sard para espacios de Sobolev conocido se debe a De Pascale([15], 2001). Se tiene que si f ∈W k,p

loc (Rn;Rm) con n ≥ m, k = n−m+ 1 y p > n entonces Lm(f(Cf )) = 0.Y mucho más reciente, Bourgain, Korobkov y Kristensen ([8], 2015) dan una versión del Teorema para elespacio Wn,1(Rn;R) utilizando técnicas totalmente diferentes.

Esta memoria se centra en probar estos dos últimos resultados, así como toda la teoría previa relativa alos espacios de Sobolev necesaria para sus demostraciones.

Comenzaremos revisando diversos resultados de carácter general que usaremos a lo largo de la memoria.Entre ellos está el Teorema del Recubrimiento de Vitali y el Teorema de Kneser-Glaeser. Además se intro-duce la medida y contenido Hausdor que renan la medida usual de Lebesgue. Esto se hace en el Capítulo 1.

El Capítulo 2 está dedicado a los espacios de Sobolev. Estos espacios son a los que queremos extender elTeorema de Morse-Sard por lo que se requiere un cierto conocimiento de ellos así como de alguna de suspropiedades.

Vemos primero la denición a partir del concepto de derivada débil y a continuación damos algunosresultados de aproximación por funciones C∞. En concreto veremos que el espacio C∞c (Rn;Rm) es denso enW k,p(Rn;Rm), 1 ≤ p <∞, con la norma de este espacio.Probamos la desigualdad de Morrey necesaria para la prueba del Teorema de De Pascale: Sean n < p <∞,

1

2 CAPÍTULO 0. INTRODUCCIÓN

Ω ⊂ Rn un subconjunto abierto y B(x, r) una bola (abierta) contenida en Ω. Entonces para Ln-casi todo y,z ∈ B(x, r) se tiene que existe C > 0, constante que sólo depende de n y p, tal que

|f(y)− f(z)| ≤ Cr1−np

(∫B(x,r)

|Df(w)|p dw

) 1p

∀f ∈W 1,p(Ω;Rm).

También es importante conocer la caracterización de las funciones de Sobolev por ser aquellas que están enLp, que son absolutamente continuas en compactos en casi todas las líneas paralelas a los ejes coordenadosy cuyas derivadas (usuales) en estas líneas están en Lp.

El Teorema de Morse-Sard de De Pascale (2001) fue revisado por Figalli ([19], 2008) que da una pruebadiferente, algo más sencilla y con la ventaja de ser independiente del Teorema de Morse-Sard clásico. Enel Capítulo 3 damos la demostración de este resultado, distinguiendo el caso n = m, para el que se siguentécnicas introducidas por Azagra, Ferrera y Gómez-Gil en [3].

Para el caso escalar m = 1 se conoce (ver Dorronsoro [13]) que las funciones f ∈ Wn,1(Rn) admiten unrepresentante continuo que es diferenciable (Fréchet) en H1−casi todo punto. El conjunto de puntos críticosse dene como el conjunto de los puntos x donde f es diferenciable (Fréchet) y f ′(x) = 0. Como resultadoprincipal del último Capítulo probamos que L1(f(Cf )) = 0.

También mostramos que para toda f ∈ Wn,1(Rn) y todo ε > 0 existe δ > 0 tal que para todos losconjuntos E ⊂ Rn con H1

∞(E) < δ entonces L1(f(E)) < ε. En particular se tiene que si H1(E) = 0 entoncesL1(f(E)) = 0. Por lo tanto, la imagen de los puntos donde la diferencial no está denida tiene medida nula.

Presentamos por otra parte resultados nuevos de aproximación de tipo Luzin para espacios de Sobolev:sean k, l ∈ 1, . . . , n, k ≤ l y f ∈ W l,1(Rn), entonces para todo ε > 0 existe un conjunto abierto U ⊂ Rn(conjunto excepcional) y una función g ∈ Ck tal que Hn−l+k∞ (U) < ε y f = g, Dmf = Dmg en Rn \ U param = 1, . . . , k.

Las demostraciones que damos en este último Capítulo se basan en los siguientes resultados:

1) Estimación de los valores cercanos a los críticos de polinomios (sección 4.1):

Para todo polinomio P : Rn −→ R de grado como mucho k, para toda bola B ⊂ Rn de radio r > 0 ypara todo ε > 0 se tiene que

Ent(εr, P (x) : x ∈ B, |DP (x)| ≤ ε) ≤ C

donde la constante C sólo depende de n y de k, y donde Ent(λ,A) denota al menor número de bolasde radio λ que recubren A.

2) Integrales de Choquet de funciones maximales de Hardy-Littlewood con respecto al contenido Haus-dor (sección 4.2):

Si f ∈W k,1(Rn, donde k ∈ 1, . . . , n− 1, entonces∫ ∞0Hn−k∞ (x ∈ Rn : Mf(x) ≥ λ) dλ ≤ C

∫Rn|∇kf(y)| dy,

donde C depende sólo de n y k.

3

3) Versiones avanzadas del Teorema de inclusiones de Sobolev (sección 4.4):

Si f ∈ W l,1(Rn) y µ es una medida positiva en Rn que tiene la propiedad de que µ(I) ≤ `(I)n−l paratodo I = [a, b]n ⊂ Rn, entonces ∫

Rn|f(x)|dµ(x) ≤ C‖∇lf‖L1(Rn) (1)

donde C es una constante positiva que no depende de µ ni de f .

ABSTRACT

We establish two versions of the Morse-Sard Theorem for Sobolev spaces. On the one hand, De Pascaleresult for the space W k,p(Rn;Rm), k ≥ max n−m+ 1, 1 , p > n. And on the other hand Bourgain-Korobkov-Kristensen result for Wn,1(Rn;R). For the proofs we revise some theory of the Sobolev spaces,including a recent Luzin-type approximation result for W l,1 functions by Ck functions k ≤ l, where theexceptional set is of small Hausdor content.

4 CAPÍTULO 0. INTRODUCCIÓN

Capítulo 1

Preliminares

Dedicaremos el primer capítulo del trabajo a hacer una recopilación de resultados de carácter general quenecesitaremos más adelante.

En primer lugar introducimos las notaciones con las que se trabajará así como ciertas deniciones quedeben ser conocidas, pero que merece la pena comentar para jar desde el principio (polinomios de Taylor,multíndices, normas,....).

Luego continúan sucesivas secciones tratando temas de diferente consideración.

Quizás cabe reseñar el muy importante Teorema de Extensión de Whitney 1.2, incluido en la sección1.3 así como el Teorema de Kneser Glaeser 1.3. El primero de ellos podemos decir que es una de lasgrandes claves para poder desarrollar todos los resultados del trabajo. Y el segundo (cuya demostración sebasa en el primero) es de gran utilidad para la redemostración debida a Figalli de la versión de De Pascaledel Teorema de Morse-Sard para el espacio de Sobolev W k,p(Rn,Rm) (p > n, k ≥ max n−m+ 1, 1). Porese motivo se dará una prueba detallada del Teorema de Kneser-Glaeser en esa misma sección.

1.1. Notaciones y deniciones básicas

Bolas: Por B(x, r) nos referiremos a la bola abierta n−dimensional de centro x y radio r > 0.

Intervalos n-dimensionales: Un intervalo n-dimensional es un cubo cerrado I = [a, b]n ⊂ Rn conlados paralelos a los ejes coordenados. Además escribiremos `(I) = b− a para la longitud del lado.Dedicaremos las letras I, Q y J para trabajar con intervalos n−dimensionales, que serán necesariospara la segunda parte del trabajo.

Equivalencia de cantidades: Dos cantidades son equivalentes a ∼ b si existen constantes C1 yC2 tales que C1a ≤ b ≤ C2a. Un ejemplo de dos cantidades equivalentes es la medida de la bolan-dimensional y la medida del intervalo n-dimensional de lado el diámetro de la bola.

Constantes: Cuando trabajemos con desigualdades en las que aparezcan constantes en muchas oca-siones abusaremos de notación al usar la misma letra de la constante en mucho pasos aún cuando éstava cambiando. En general estas contantes dependen de la dimensión casi siempre y de otras variablesen función del caso. Escribiremos C(n, ...) o bien simplemente C.

Espacios: Las funciones que consideremos a lo largo del trabajo irán desde algún espacio Rn a Ro a Rm para cierto m ≥ 2. En el primer caso, dependiendo si estamos en un espacio de funciones

5

6 CAPÍTULO 1. PRELIMINARES

continuas, en algún Lp, espacio de Sobolev,...,etc, escribiremos que las funciones están en C(Rn;R),Lp(Rn;R),W k,p(Rn;R),...,etc, o bien C(Rn), Lp(Rn),W k,p(Rn)...,etc, indistintamente. En el segundocaso escribiremos C(Rn;Rm), Lp(Rn;Rm), W k,p(Rn;Rm),...,etc. En ambos casos habrá situaciones enlas que se dé por hecho entre qué espacios están actuando las funciones y se escribirá simplemente C,Lp, W k,p,...,etc.

Medida de Lebesgue: Trabajamos siempre con la medida de Lebesgue en Rn (Ln). Entonces sidecimos que algo se cumple para casi todo punto x ∈ Rn sin especicar la medida sobre la quetrabajamos siempre entenderemos que ésta es la medida de Lebesgue.

Normas: Para denotar normas de vectores en Rn usaremos simplemente | · | para denotar la normaeuclídea. Por ejemplo |x| = |(x1 . . . , xn)| =

√x2

1 + · · ·+ x2n. Y para normas de espacios funcionales F ,

‖ · ‖F .

Puntos/valores críticos: Dado Ω ⊂ Rn abierto y f : Ω −→ Rm una función de clase C1, un puntox ∈ Ω se dice punto crítico si Df(x) no tiene rango máximo. Un punto y ∈ f(Ω) será un valor críticosi y = f(x) para un punto crítico x. Al conjunto de puntos críticos se le llama conjunto crítico y lodenotamos por Cf .

Espacios Lp: Consideramos (Rn,Ln) un espacio de medida. Como es usual, identicaremos funcionesque coinciden salvo en un conjunto de medida cero. Será ésta la relación de equivalencia que nospermitirá introducir los espacios normados Lp. Se dene ahora el espacio de Lebesgue Lp(Rn;R) comoel espacio formado por todas las clases de equivalencia de funciones medibles que cumplen:

‖f‖Lp(Rn) :=

(∫Rn|f(x)|p dx

)1/p

si 1 ≤ p <∞

‖f‖L∞(Rn) := ess sup|f | = ınf M ≥ 0 : Ln (x ∈ Rn |f(x)| > M) = 0 si p =∞

(1.1)

El caso L∞(Rn) está formado por todas las funciones medibles acotadas en casi todo punto de Rn.Se puede comprobar que estos espacios, con las normas que acabamos de introducir son normadosy completos. Hacemos constar que esta clase de funciones también se puede denir sobre un abiertoΩ ⊂ Rn.Además los espacios Lploc(R

n) están formados por aquellas funciones tal que para todo compacto Kestán en Lp(K).

Multíndices: Los multíndices se usan comúnmente para simplicar la escritura de las derivadas par-ciales de funciones. Un multíndice es un vector α = (α1, . . . , αn) ∈ (N ∪ 0)n. Llamamos orden de αa |α| = α1 + · · ·+ αn. Tendrán una serie de notaciones especícas para ellos. En general,

Dαf =∂|α|f

∂α1x1 · · · ∂αnxn,

aunque en ocasiones podemos escribir Dk reriéndonos con esto al vector formado por todas las fun-ciones Dα con α recorriendo todos los posibles multíndices de orden k.

Cuando trabajemos con vectores en Rn y tengamos algún multíndice α = (α1 . . . , αn) escribiremos(x)α = (x1)α1 · · · (xn)αn y si sabemos que k = |α| en ocasiones abusando de notación escribiremossimplemente (x)k. Es importante observar que (x)α ≤ |x||α|.

1.1. NOTACIONES Y DEFINICIONES BÁSICAS 7

Cuando tengamos sumatorios del tipo 0 ≤ k ≤ r y k se está reriendo al orden de multíndices signicaque sumamos sobre todos los posibles multíndices α tales que |α| = k. Es decir por ejemplo si n = 2 yr = 2 tenemos que

2∑k=0

Dkf(x) = f(x) + [D(1,0)f(x) +D(0,1)f(x)] + [D(2,0)f(x) +D(1,1)f(x) +D(0,2)f(x)].

También escribimos α! = α1! · · ·αn!. Es importante observar que α! ≤ |α|!.

Polinomios de Taylor: Denimos el polinomio de Taylor de orden r de una función f : Rn −→ Rm,Cr, centrado en un punto x ∈ Rn como

T rf(x, y) =

r∑k=0

Dkf(x)

k!(y − x)k. (1.2)

Hay dos formas de entender esta expresión:

(1a) Los Dkf(x) son aplicaciones k−multilineales, es decir,

Dkf : Rn −→ Lks(Rn;Rm)

donde Lks(Rn;Rm) denota el espacio vectorial de aplicaciones k−multilineales y simétricas.Por ejemplo D2f(x) es la aplicación bilineal que admite la representación en forma de matrizsimétrica que sigue

D2f(x) =

∂2f∂x21

(x) ∂2f∂x1∂x2

(x)

∂2f∂x2∂x1

(x) ∂2f∂x22

(x)

.

(2a) Vemos los k = 0, . . . , r como el orden de multíndices. Entonces realmente la expresión (1.2) seleería de la siguiente manera:

T rf(x, y) =

r∑|α|=0

Dαf(x)

α!(y − x)α

con las notaciones de multíndices ya introducidos. Por ejemplo para r = 2,

T 2f(x, y) = f(x) +

[∂f

∂x1(x)(y1 − x1) +

∂f

∂x2(x)(y2 − x2)

]+

+

[1

2

∂2f

∂x21

(x)(y1 − x1)2 +∂2f

∂x1∂x2(x)(y1 − x1)(y2 − x2) +

1

2

∂2f

∂x22

(x)(y2 − x2)2

].

Ambas maneras de entender el desarrollo coinciden, pero en general emplearemos la notación de mul-tíndices por la mayor comodidad de trabajar con funciones y no con aplicaciones multilineales.El resto de Taylor de orden r de una función f : Rn −→ Rm, Cr, centrado en un punto x ∈ Rn sedene como Rrf(x, y) = f(y)− T rf(x, y).Además dado un α con 0 ≤ |α| ≤ r, llamamos

T rαf(x, y) =

r−|α|∑|β|=0

Dα+βf(x)

α!(y − x)β

y su correspondiente resto por Rrαf(x, y) = Dαf(y)− T rαf(x, y).

8 CAPÍTULO 1. PRELIMINARES

Jet: En ocasiones no tendremos una función sino una colección de ellas llamada jet, fαr|α|=0, f = f0.Denotaremos a esta familia de funciones por f simplemente, y también tendremos un polinomio deTaylor asociado y su resto,

T rf(x, y) =

r∑|α|=0

fα(x)

α!(y − x)α ; Rrf(x, y) = f(y)− T rf(x, y).

Indicamos que podríamos haber denotado al jet por fkrk=0 donde fk : Rn −→ Lks(Rn;Rm).

Además si 0 ≤ |α| ≤ r escribimos Dαf = fα+βr−|α||β|=0 .

Por último si tenemos una función f de clase Cr tenemos asociado de manera natural el jet f =Dαfr|α|=0 .

Funciones absolutamente continuas: Sea I un intervalo de Rn. Una función f : I −→ R s abso-lutamente continua en I si para cada número positivo ε > 0, existe un número δ > 0 tal que paracualquier sucesión nita de subintervalos disjuntos (xj , yj)pj=1 de I que satisface

∑pj=1(bj − aj) < δ

entoncesp∑j=1

|f(bj)− f(aj)| ≤ ε.

En general dado un abierto Ω ⊂ R una función f : Ω −→ Rn es absolutamente continua sobre compactossi es absolutamente en I para todo I ⊂ Ω intervalo.

1.2. Lema del Recubrimiento de Vitali

Como ya se ha dicho recordamos que a lo largo de todo el trabajo vamos a a estar trabajando con lamedida de Lebesgue Ln en Rn usual. El Lema del Recubrimiento de Vitali 1.1 nos permite escoger deentre una colección de bolas un número nito de ellas disjuntas, y de tal manera que la suma de sus medidasno se aleje demasiado de la medida de la colección inicial de bolas.Si quisiésemos trabajar con medidas de Radon µ en Rn arbitrarias deberíamos probar el mucho más difícilLema del Recubrimiento de Besicovitch (ver Evans -Gariepy [17]) que daría un resultado análogo al de Vitali.Como ya se ha indicado, sólo estamos interesados en la medida de Lebesgue por lo que sólo veremos el primerode estos teoremas.

Teorema 1.1. (Lema del Recubrimiento de Vitali) Sea F una colección no degenerada de bolas cerradas enRn con

sup diamB : B ∈ F <∞.

Entonces existe una familia contable o nita G de bolas disjuntas en F tales que⋃B∈F

B ⊂⋃B∈G

B,

donde B denota la bola cerrada concéntrica a B de radio cinco veces mayor.

Demostración. Llamemos D = sup diamB : B ∈ F y consideremos los conjuntos

Fj =

B ∈ F :

D

2j< diamB ≤ D

2j−1

para j ∈ N. Deniremos G ⊂ F de manera recursiva como sigue:

1.3. TEOREMA DE KNESER-GLAESER 9

1. G1 será cualquier colección maximal de bolas disjuntas en F1.

2. Suponiendo que G1, . . . ,Gk−1 han sido denidos, elegimos Gk como una subcolección maximal de bolasdisjuntas en B ∈ Fk : B ∩B′ = ∅ para todo B′ ∈

k−1⋃j=1

Gj

.

Denimos pues G =⋃∞j=1 Gj . Claramente se trata de una colección de bolas disjuntas y G ⊂ F . Armamos

ahora que para cada B ∈ F existe una bola B′ ∈ G tal que B ∩B′ 6= ∅ y B ⊂ B′.

En efecto, jemos B ∈ F . Entonces existe k ∈ N tal que B ∈ Fk. Por la maximalidad de Gk existe unabola B′ ∈

⋃kj=1 Gj con B ∩B′ 6= ∅ (si no existiese el elemento B podría añadirse a la familia Gk).

Por otro lado diamB′ > D2k, pues B′ ∈

⋃kj=1 Gj ⊂

⋃kj=1Fj , y además diamB ≤ D

2k−1 . Así diamB ≤ D2k−1 =

2D2k< 2diamB′. Y todo esto implica que si x ∈ B e y ∈ B ∩B′ entonces

dist(x, centroB′) ≤ dist(x, y) + radioB′ ≤ diamB + radioB′ < 2diamB′ + radioB′ = 5radioB′.

Observación: El teorema es igualmente válido trabajando con bolas abiertas en vez de con cerradas.

1.3. Teorema de Kneser-Glaeser

Comenzamos revisando el famoso Teorema de Extensión de Whitney. Podemos decir que es un resultadoinverso al Teorema de Taylor. Hablando sin mucha precisión, el teorema nos dará las condiciones que debesatisfacer una función denida en un conjunto cerrado A de Rn para poder extenderse a todo el espacio demanera diferenciable. Es un resultado profundo del Análisis que data del 1934.

Teorema 1.2. (Teorema de Extensión de Whitney) Sea A ⊂ Rm un conjunto cerrado y sea fαr|α|=0

(f0 = f) una familia de funciones denidas en A y tomando valores en Rp. Recordemos que α recorre todoslos multíndices α = (α1, . . . , αn) con |α| = α1 + · · ·+ αn ≤ r.Supongamos además que se verican las siguientes condiciones para todo multíndice α con 0 ≤ |α| ≤ r,

(Wα) ≡ lımx,y→x0x,y∈A

|Rrαf(x, y)||x− y|r−|α|

= 0 ∀x0 ∈ A. (1.3)

Entonces existe una extensión F : Rm → Rp satisfaciendo que

F ∈ Cr(Rm;Rp).

Para cada multíndice α con 0 ≤ |α| ≤ r, se tiene que DαF (x) = fα(x) ∀x ∈ A.

Una demostración completa y detallada de este teorema tan importante puede encontrarse en el libro deAbraham-Robbin [1], o en el de Stein [29], o en el de Malgrange [22], o en el de Federer [18].

Las condiciones (Wα) para |α| = 0, . . . , r arman que

Rrαf(x, y) = o(|x− y|r−|α|) ∀ x, y ∈ A cuando |x− y| → 0 uniformemente en compactos de A. (1.4)

Veremos ahora un lema que nos dará una condición suciente (también es necesaria) para que (1.4) sesatisfaga (suponiendo A acotado).Llamaremos módulo de continuidad a una función ω : [0,∞)→ [0,∞) con ω(0) = 0, creciente y continua.

10 CAPÍTULO 1. PRELIMINARES

Lema 1.1. Sea h = hαr|α|=0 un jet. Supongamos que existe un módulo de continuidad ω1 tal que

|T rh(x, z)− T rh(y, z)| ≤ ω1(|x− y|)(|x− z|r + |y − z|r)

para x, y ∈ A, z ∈ B ⊂ Rm (B es una bola sucientemente grande para que A ⊂ B). Entonces se cumple elaserto (1.4) (ó (1.3)).

Demostración. Usaremos un par de igualdades triviales sobre los desarrollos de Taylor de un jet y de susrestos.

(a) Para cada 0 ≤ |α| ≤ r,

Dα (T rh(x, y)) = Dα

r∑|β|=0

(y − x)β

β!hβ(x)

=r∑

|α|≤|β|≤r

(y − x)β−α

(β − α)!hβ(x) =

r−|α|∑|γ|=0

(y − x)γ

γ!hγ+α(x) =

= T r−|α|(Dαh)(x, y) = T rαh(x, y).

(b) Rrαh(x, ·) = hα − T r−|α|(Dαh)(x, ·) para 0 ≤ |α| ≤ r.Es automático por la denición de los restos de Taylor, y por el apartado (a).

Probaremos ahora la siguiente igualdad

T rh(x, z)− T rh(y, z) =r∑|α|=0

(z − x)α

α!Rrαh(y, x). (1.5)

Para ver esto en primer lugar mediante la utilización de los apartados anteriores (b) y (a) se obtiene lasiguiente cadena de igualdades,

r∑|α|=0

(z − x)α

α!Rrαh(y, x) =

r∑|α|=0

(z − x)α

α!

[hα(x)− T r−|α|(Dαh)(y, x)

]=

=

r∑|α|=0

(z − x)α

α!hα(x)−

r∑|α|=0

(z − x)α

α!

[T r−|α|(Dαh)(y, x)

]=

= T rh(x, z)−r∑|α|=0

(z − x)α

α!DαT rh(y, x).

En segundo lugar se puede utilizar un argumento de inducción sobre r para ver que

r∑|α|=0

(z − x)α

α!DαT rh(y, x) = T rh(y, z)

y así queda probada la igualdad buscada (1.5).Por todo esto podemos escribir ahora usando las hipótesis que nos da el lema que,∣∣∣∣∣∣

r∑|α|=0

(z − x)α

α!Rrαh(x, y)

∣∣∣∣∣∣ ≤ ω1(|x− y|)(|x− z|r + |y − z|r).

1.3. TEOREMA DE KNESER-GLAESER 11

Si escribimos z − x = |x− y|(z′ − x) para cierto z′ ∈ Rm y llamamos λ = |x− y|, tenemos∣∣∣∣∣∣r∑|α|=0

λ|α|

α!(z′ − x)αRrαh(x, y)

∣∣∣∣∣∣ ≤ ω1(|x− y|)(|x− z|r + |y − z|r) ≤

≤ Cω1(|x− y|)λr(1 + |z′ − x|r). (1.6)

En esta última desigualdad se usa que existe una constante C > 0 tal que

|x− z|r + |y − z|r ≤ C|x− y|r(

1 +|z − x|r

|x− y|r

).

Explicamos esto con más detalle. En primer lugar conviene observar que el caso x = y no lo consideramospues el Lema 1.1 sería automático. Los casos x = z ó y = z son triviales. Luego sean x, y, z distintos entresí. Llamamos |x− y| = l1, |x− z| = l2, |y − z| = l3, que son números positivos tales que en particular por ladesigualdad triangular l3 ≤ l1 + l2. Por lo tanto para todo r ≥ 1

l2r + l3

r ≤ l2r + (l1 + l2)r ≤ l2r + C(l2r + l1

r) ≤ (C + 1)(l2r + l1

r).

Observemos ahora la última expresión (1.6) y jemos x, y ∈ A. Veamos∑r|α|=0

λ|α|

α! (z′ − x)αRrαh(x, y)

como un polinomio en z′ − x. Es importante aquí darse cuenta que los coecientes de este polinomio vienendeterminados por la evaluación del polinomio en ciertos valores z′ − x. Se tratará de un conjunto nito deellos, pues hay un número nito de coecientes. Digamos que este conjunto de puntos viene dado por losvalores z′1, . . . , z

′l, y llamemos N = max |z′1 − x|r, . . . , |z′l − x|r. Así,

Cω1(|x− y|)λr(1 + |z′i − x|r) ≤ Cω1(|x− y|)λr(1 +N) ≤ C1ω1(|x− y|)λr ∀i = 1, . . . , l.

Sea ahora 0 ≤ |α| ≤ r, entonces se tiene que λ|α|

α! Rrαh(x, y) es un coeciente del polinomio mencionado

anteriormente, es decir, existirá i = 1, . . . , l tal que λ|α|

α! Rrαh(x, y) =

∑r|α|=0

λα

α! (z′i − x)αRrαh(x, y) y por lotanto ∣∣∣∣∣λ|α|α!

Rrαh(x, y)

∣∣∣∣∣ ≤ Cω1(|x− y|)λr(1 + |z′i − x|r) ≤ C1ω1(|x− y|)λr.

Se deduce de lo anterior que para todo 0 ≤ |α ≤ r y x, y ∈ A

|Rrαh(x, y)| ≤ C1α!ω1(|x− y|)|x− y|r−|α|,

y así se puede concluir que

Rrαh(x, y) = o(|x− y|r−|α|) para todo x, y ∈ A y |α| = 0, . . . , r cuando |x− y| → 0.

Denición 1.1. Sea f ∈ Cr(Rn,Rp), con A ⊂ Rn. Diremos que f es s−plana en A si y sólo si Djf(x) = 0para todo j = 1, . . . , s, x ∈ A.

La idea del Teorema de Kneser-Glaeser es que bajo ciertas condiciones, la composición de una funciónmala con una suave y sucientemente plana es suave.

Teorema 1.3. (Teorema de Composición de Kneser-Glaeser) Sean W ⊂ Rm, V ⊂ Rn abiertos, y seantambién A∗ ⊂ W con A∗ cerrado relativo a W y A ⊂ V . Supongamos que tenemos la función f : V → Rpde clase Cr en V y s−plana en A y la función g : W → V de clase Cr−s con g(A∗) ⊂ A.Entonces existe H : W → Rp satisfaciendo

12 CAPÍTULO 1. PRELIMINARES

1. H ∈ Cr(W ;Rp).

2. H(x) = f(g(x)) ∀x ∈ A∗.

3. H es s-plana en A∗.

Demostración. Supongamos en un primer momento que g es de clase Cr y denamos para cada x ∈ A∗ yk = 0, . . . , r

hk(x) = Dk(f g)(x),

que tiene perfecto sentido. De esta manera, utilizando la regla de la cadena para derivadas de orden superior(consultar Abraham-Robbin [1]) tendríamos que

hk(x) =k∑q=0

∑1≤i1,...,iqi1+···+iq=k

σk(i1 . . . , iq)Dqf(g(x))Di1g(x) · · ·Diqg(x) para x ∈ A∗. (1.7)

Para una denición precisa de las constantes σk(i1, . . . , ij) puede verse la página 3 del libro de Abraham-Robbin [1]. Sin embargo gracias a la hipótesis de que f es s−plana en A∗ y g(A∗) ⊂ A la expresión anteriorse reduce a

hk(x) =k∑

q=s+1

∑1≤i1,...,iqi1+···+iq=k

σk(i1 . . . , iq)Dqf(g(x))Di1g(x) · · ·Diqg(x) para x ∈ A∗. (1.8)

Comprobaremos ahora que esta última ecuación está bien denida aún en el caso de que g sea de clase Cr−s

como en el enunciado del Teorema.En efecto tomemos s < q ≤ k y supongamos que i1 . . . , iq son enteros mayores o iguales que 1 y ademástales que i1 + · · ·+ iq = k,. Sea ahora j = 1, . . . , q y armamos que ij ≤ k − q + 1. Si no fuese así se tendríai1 + · · · + iq ≥ (q − 1) + ij > (q − 1) + k − q + 1 = k lo que es una contradicción. Además por otro ladok − q + 1 ≤ r − q + 1 ≤ r − s (pues s < q). Tenemos por tanto que ij ≤ r − s para todo j = 1, . . . , q ypor tanto los términos de la forma Di1g(x) · · ·Diqg(x) están bien denidos para x ∈ A∗ cuando g es de claseCr−s.Denimos ahora las funciones hk : A∗ → Lks(Rm;Rp), k = 0, . . . , r de la siguiente forma:

h = h0 = f ghk = 0 si k ≤ shk = como en (1.8) si s < k ≤ r

Por la manera en la que estamos trabajando consideraremos en vez de los hkrk=0 como familia de aplica-ciones multilineales, la familia correspondiente de funciones fαr|α|=0.Para nalizar la demostración del Teorema basta ver que se verican las condiciones para poder aplicar elTeorema de extensión de Whitney 1.2, es decir (Wα).

Observación: Aparte de considerar A∗ cerrado lo consideraremos acotado, pues en caso contrario ayudán-donos de razonamientos típicos con particiones de la unidad podemos ir deniendo la extensión localmentey luego extender a todo W .

Esta parte de la prueba es algo más liosa y se usará como guía la demostración dada en el libro de Mal-grange [22].

1.3. TEOREMA DE KNESER-GLAESER 13

Para probar que se cumplen las condiciones del Teorema de extensión de Whitney 1.2 tenemos quecomprobar que

Rrαh(x, y) = o(|x− y|r−|α|) para todo x, y ∈ A∗ y |α| = 0, . . . , r cuando |x− y| → 0 (1.9)

o mejor dicho, la condición que nos dá el Lema 1.1. Es decir, basta encontrar cierto módulo de continuidadω tal que

|T r(f g)(y1, z)− T r(f g)(y2, z)| ≤ ω(|y1 − y2|)(|y1 − z|r + |y2 − z|r) (1.10)

para y1, y2 ∈ A∗, z ∈ B (B bola sucientemente grande para que A∗ ⊂ B).

(1) Es suciente establecer la fórmula

|T rf(x1, T

r−sg(y1, z))− T rf

(x2, T

r−sg(y2, z))| ≤ ω(|y1 − y2|)(|y1 − z|r + |y2 − z|r) (1.11)

para y1, y2 ∈ A∗, x1 = g(y1), x2 = g(y2), z ∈ B y un cierto módulo de continuidad ω.En efecto, para ver que esto es suciente comprobaremos que los términos del miembro de la izquierdaen las expresiones (1.10) y (1.11) dieren sólo en términos que satisfacen la desigualdad requerida.

Como hα = (f g)α = 0 si |α| ≤ s,

T rh(y1, z) =∑

0≤|α|≤r

(z − y1)α

α!hα(y1) =

∑s+1≤|α|≤r

(z − y1)α

α!hα(y1)

y por ser f s−plana en A∗

T rf(x1, T

r−sg(y1, z))

=∑

0≤|α|≤r

(∑0≤|β|≤r−s

(z−y1)β

β! gβ(y1)− x1

)αα!

fα(x1) =

=∑

s+1≤|α|≤r

(∑1≤|β|≤r−s

(z−y1)β

β! gβ(y1))α

α!fα(x1).

(Recordamos que fα = Dαf , gβ = Dβg). En ambos casos la expresión resultante se puede ponercomo suma de funciones continuas respecto de y1 multiplicadas por términos de la forma (z−y1)α

con |α| ≥ s+ 1. Hasta |α| ≤ r, lo coecientes que acompañan a las potencias (z − y1)α coincidenen ambos desarrollos. Así la diferencia entre los términos de la izquierda en (1.10) y (1.11) es dela forma h(y1)(z − y1)α − h(y2)(z − y2)α con h continua y |α| > r.Lo escribimos como [h(y1)− h(y2)] (z− y1)α+h(y2) [(z − y1)α − (z − y2)α]. Escrito de esta formapodemos mayorar los dos términos de la manera obvia y obtenemos el resultado (obsérvese que larestricción z ∈ B es esencial puesto que |α| > r).

(2) Probemos que se tiene (1.11).Escribimos el término de la izquierda de esa expresión como[T rf

(x1, T

r−sg(y1, z))− T rf

(x1, T

r−sg(y2, z))]

+[T rf

(x1, T

r−sg(y2, z))− T rf

(x2, T

r−sg(y2, z))].

Llamamos al primer sumando S1 y al segundo S2.

(2.1) S2 está mayorado en norma por

ω(|x2 − x1|)(|x2 − x1|r +

∣∣T r−sg(y2, z)− x2

∣∣r) .

14 CAPÍTULO 1. PRELIMINARES

Como r − s ≥ 1, g ∈ Cr−s(A∗) y A∗ es compacto podemos tomar

C = supy∈A∗

1≤|α|≤r−s

|Dαg(y)| <∞.

Por un lado viendo esa C como constante de Lipschitz de g se sigue |x1 − x2| = |g(y1)− g(y2)| ≤C|y1− y2|. Y como ω es una función creciente ω(|x1−x2|) ≤ ω(C|y1− y2|) = ω1(|y1− y2|), dondeω1 es otro módulo de continuidad. Además por otro lado

∣∣T r−sg(y2, z)− x2

∣∣ =

∣∣∣∣∣∣∑

1≤|α|≤r−s

(z − y2)α

α!Dαg(y2)

∣∣∣∣∣∣ ≤ C∣∣∣∣∣∣∑

1≤|α|≤r−s

(z − y2)α

α!

∣∣∣∣∣∣ ≤ C|z − y2|.

(1.12)

En la última desigualdad se está usando que A∗ es compacto, y obviamente C es una constantepositiva. Obtenemos

ω(|x2 − x1|)(|x2 − x1|r +

∣∣T r−sg(y2, z)− x2

∣∣r) ≤ ω1(|y1 − y2|) (Cr|y1 − y2|r + C|z − y2|r) ≤≤ Cω1(|y1 − y2|) (|y1 − z|r + |z − y2|r) .

para todo y1, y2 ∈ A∗ y z ∈ B.

(2.2) Mayoremos el sumando S1.Denotando T r−sg(yi, z) = ui (i = 1, 2) tenemos

T rf(x1, u1)− T rf(x1, u2) =∑

0≤|α|≤r

(u1 − x1)α

α!Dαf(x1)−

∑0≤|α|≤r

(u2 − x1)α

α!Dαf(x1) =

=∑

1≤|α|≤s

(u1 − x1)α − (u2 − x2)α

α!Dαf(x1) =

=∑

1≤|α|≤r

1

α!Dαu1T

rf(x1, u1)(u1 − u2)α. (1.13)

y por el mismo argumento utilizado en el apartado anterior (2.1)

|u1 − u2| ≤ ω(|y2 − y1|)(|z − y1|r−s + |z − y2|r−s). (1.14)

Nuestro objetivo es mayorar en norma cada uno de los sumandos de la expresión (1.13) y paraello distinguiremos dos casos:

Caso 1 ≤ |α| ≤ s.

|Dαu1T

rf(x1, u1)| = |T r−|α|(Dαf)(x1, u1)| =

∣∣∣∣∣∣∑

0≤|β|≤r−|α|

(u1 − x1)β

β!Dα+βf(x1)

∣∣∣∣∣∣ =

=

∣∣∣∣∣∣∑

s−|α|<|β|≤r−|α|

(u1 − x1)β

β!Dα+βf(x1)

∣∣∣∣∣∣ ≤ C|u1 − x1|s−|α|+1

(Dαu1 denota que derivamos respecto de la variable u1). Se está utilizando el hecho de que f es

s−plana en A∗ junto a la acotación de términos de la forma Dα+βf , |β| ≤ r− |α| y términos

1.4. TEOREMA DE DIFERENCIABILIDAD DE LEBESGUE 15

de la forma |u1 − x1||β|, |β| ≥ s − |α| + 1 ( para esto se usan argumentos ya utilizados conanterioridad en esta demostración en los que la acotación de B ⊃ A∗ es esencial).Además por (1.12) también podemos escribir

|Dαu1T

rf(x1, u1)| ≤ C|z − y1|s−|α|+1.

Ahora usando esta estimación junto con la acotación de los términos de la forma |u1 − u2|dada en (1.14) se puede obtener la acotación de la expresión (1.13) de la manera deseada.

Caso |α| ≥ s+ 1.Ya sabemos que por un lado tenemos la estimación |u2 − u1||α| ≤ C|u2 − u1|s+1. Además,puesto que (r − s)(s+ 1) ≥ r se sigue que

|u2−u1||α| ≤ ω1(|y2−y1|)(|z−y1|(r−s)(s+1)+|z−y2|(r−s)(s+1)) ≤ ω1(|y2−y1|)(|z−y1|r+|z−y2|r).

Si también acotamos por alguna constante los términos |Dαu1T

rf(x1, u1)| con s+ 1 ≤ |α| ≤ r,volvemos a tener que la expresión (1.13) está acotada por lo que se pretendía.

1.4. Teorema de diferenciabilidad de Lebesgue

El operador maximal de Hardy-Littlewood es un operador no lineal que manda funciones integrablesf ∈ L1(Rn) en las funciones

Mf(x) = supr>0

r−n∫B(x,r)

|f(y)| dy.

A la funciónMf se la conoce por el nombre de función maximal de Hardy-Littlewood.En muchos libros y artículos se presenta la denición alternativa

Mf(x) = supr>0

1

Ln(B(x, r))

∫B(x,r)

|f(y)| dy.

Para nuestros propósitos es irrelevante cuál se utilice pues trataremos resultados en los que se dan estima-ciones salvo constantes dependientes de la dimensión del espacio n. Y justamente una constante dependientede n es lo que diferencia a las dos deniciones.En general no es cierto queMf ∈ L1(Rn) pero sí se tiene queMf(x) <∞ para casi todo x ∈ Rn y que esuna función medible. Se trata de un concepto clave para probar resultados muy importantes como el Teoremade Diferenciablidad de Lebesgue o el Teorema de Rademacher.

Pasamos ahora a enunciar el Teorema de Diferenciabilidad de Lebesgue .

Denotaremos por −∫Af a la media integral, es decir, −

∫Af =

1

Ln(A)

∫Af .

Teorema 1.4. (Teorema de Diferenciablidad de Lebesgue)

(1) Dada f ∈ L1(Rn) tenemos

lımr→0−∫B(x,r)

f(y) dy = f(x)

para casi todo x ∈ Rn.

16 CAPÍTULO 1. PRELIMINARES

(2) Dada f ∈ L1(Rn) tenemos

lımr→0−∫B(x,r)

|f(y)− f(x)| dy = 0

para casi todo x ∈ Rn.

(3) Dada f ∈ Lp(Rn) tenemos

lımr→0−∫B(x,r)

|f(y)− f(x)|p dy = 0

para casi todo x ∈ Rn.

Cada caso requiere la utilización de una función maximal de Hardy-Littlewood diferente, además del Le-ma del Recubrimiento de Vitali 1.1.Cabe señalar que en los tres casos (1), (2) y (3) podemos cambiar los límites de la siguiente manera: en vez detomar bolas cada vez más pequeñas centradas en x se puede tomar el límite sobre bolas B que simplementecontengan a x (no hace falta que estén centradas en x).Además también se podría trabajar con intervalos n−dimensionales en vez de con bolas debido a la equiva-lencia entre la medida de estos dos conjuntos salvo constantes dependientes de la dimensión.

Observación: También existe el Teorema de Diferenciablidad de Lebesgue-Besicovitch que usa medidasde Radon µ en Rn arbitrarias. Sin embargo se necesita para su prueba el Teorema del Recubrimiento deBesicovitch que no hemos visto en el trabajo. Ambos teoremas pueden encontrarse en el libro de Evans-Gariepy [17].

Denición 1.2. Dada una función f ∈ Lp(Rn) (1 ≤ p < ∞), diremos que un punto x ∈ Rn es un puntoLp−Lebesgue de f (con respecto a la medida de Lebesgue Ln) si

lımr→0−∫B(x,r)

|f(y)− f(x)|p dy = 0.

Gracias al Teorema de Difrenciabilidad de Lebesgue sabemos que casi todo punto x es puntoLp−Lebesgue de f . Si un punto es L1−Lebesgue se dirá simplemente que es un punto de Lebesgue.Observación: Todo punto es Lp-Lebesgue para una función continua.

Lema 1.2. Sea f ∈ L1(Rn). Entonces para todo punto x de Lebesgue de f se tiene

|f(x)| ≤ Mf(x),

dondeMf(x) es la función maximal de Hardy-Littlewood que se dene como

Mf(x) = supr>0−∫B(x,r)

|f(y)| dy.

Demostración. Supongamos por reducción al absurdo que dado un punto de Lebesgue x ∈ Rn de f sesatisfaceMf(x) > |f(x)|.Tomamos ε = Mf(x)−|f(x)|

2 > 0. Entonces por el Teorema de Diferenciabilidad de Lebesgue 1.4 existiráun r1 > 0 tal que

−∫B(x,r1)

|f(y)| dy ≥ |f(x)| − ε >Mf(x).

Pero esto es una contradicción con la denición deMf(x).

1.5. MEDIDA Y CONTENIDO DE HAUSDORFF 17

Denición 1.3. Dado un conjunto E ⊂ Rn, diremos que x ∈ Rn es un punto de densidad de E si

lımr→0

Ln(B(x, r) ∩ E)

Ln(B(x, r))= 1.

Es casi inmediato observar que si aplicamos el Teorema de Diferenciablidad de Lebesgue 1.4 a lafunción XE se deduce que casi todo punto x ∈ E es de densidad.

Denición 1.4. Si f ∈ L1(Rn) , entonces

f∗(x) :=

lımr→0 −

∫B(x,r) f(y) dy si el límite existe

0 en otro caso

es el representante preciso de f .

Claramente si f∗ ∈ L1(Rn) tenemos por el Teorema de Diferenciabilidad de Lebesgue 1.4 quef∗ = f en casi todo punto. La importancia de este concepto radica en que al tratar funciones de Sobolev,éstas coincidirán con su representante preciso salvo en un conjunto de medida Hausdor pequeño.

1.5. Medida y contenido de Hausdor

Es necesario para nuestros propósitos renar más la medida de Lebesgue e introducir por tanto las medidasHausdor. Daremos la denición de estas medidas así como algunas de sus propiedades básicas que más nosinteresan.

Denición 1.5. Para cada F ⊂ Rn, 0 ≤ s <∞, 0 < δ ≤ ∞ denimos

Hsδ := ınf

∞∑j=1

(diamFj)s : F ⊆

∞⋃j=1

Fj , diamFj ≤ δ

.

Cuando δ =∞, llamaremos a Hs∞ el contenido Hausdor s-dimensional en Rn.Además llamaremos medida de Hausdor s−dimensional en Rn a Hs donde

Hs(F ) := lımδ→0Hsδ(F ) = sup

δ>0(F ).

Propiedades:

(1) Hs es una medida regular de Borel en Rn para todo 0 ≤ s <∞. Consultar Evans-Gariepy [17] (páginas61-63) para una demostración.Advertencia: El contenido Hausdor no es regular de Borel y además Hs no es medida de Radon si0 ≤ s < n porque Rn no es σ−nito con respecto a Hs.

(2) Hs(F ) = 0 si y sólo si Hs∞(F ) = 0 (0 ≤ s <∞) para todo F ⊂ Rn.Es decir, estamos diciendo que la medida Hausdor y el contenido Hausdor tienen los mismos conjun-tos nulos. Este hecho es esencial. Cuando veamos resultados en casi todo punto involucrando medidasHausdor podremos estudiarlos usando el contenido Hausdor. Claramente a la hora de realizar esti-maciones es más sencillo utilizar el contenido Hausdor que utilizar la medida Hausdor.

18 CAPÍTULO 1. PRELIMINARES

Demostración. Seguimos la demostración dada en Evans-Gariepy [17].Si s = 0, sabemos que H0 es la medida de contar, por lo que el resultado es obvio.Suponemos s > 0. La implicación (⇒) es clara por denición de medida Hausdor. Nos centramosentonces en (⇐).Fijemos ε > 0. Entonces existen conjuntos Fj∞j=1 tales que F ⊂

⋃∞j=1 Fj y

∞∑j=1

(diamFj)s ≤ ε.

En particular para cada i ∈ N, diamFi ≤ ε1/s, luego

Hsε1/s

(F ) ≤ ε.

Si hacemos tender ε −→ 0 se sigue que Hs(F ) = 0.

(3) Hn ∼ Hn∞ ∼ Ln en Rn.Recuérdese que ser equivalentes Hn ∼ Hn∞ signica que existen constantes C1 y C2, que en este casodependerán de n, tales que

C1Hn(F ) ≤ Hn∞(F ) ≤ C2Hn(F )

para todo F ⊂ Rn. Sin embargo realmente tenemos algo mucho más fuerte:

(3.1) Hn = Hn∞ en Rn por denición.

(3.2) Ln = C(n)Hn∞, donde C(n) es una constante que depende de n. Esto es claro por la denición deambas medidas (Ln es una media exterior regular).También se podía haber usado la desigualdad isodiamétrica (Evans-Gariepy [17], pág. 65) paraobtener Hn = C(n)Ln.

1.6. Continuidad absoluta de la integral

Damos en esta sección un resultado básico sobre la continuidad absoluta de la integral.(X,Ω, µ) será un espacio de medida.

Teorema 1.5. Dada f ≥ 0 medible e integrable, para todo ε > 0 existe δ > 0 tal que si µ(A) < δ, siendo Aconjunto medible, entonces

∫A f dµ < ε.

Demostración.Sea En = x ∈ X : f(x) < n. Denimos gn = fXEn , entonces como En ⊆ En+1 y XEn ≤ XEn+1 para todon ∈ N, se tiene gn ≤ gn+1 para cada n ∈ N. Además lımn→∞En = X luego lımn→∞ gn = f . Usando elTeorema de Convergencia Monótona se obtiene

lımn→∞

∫En

f dµ = lımn→∞

∫XfXEn dµ = lım

n→∞

∫Xgn dµ =

∫X

lımn→∞

gn dµ =

∫Xf dµ.

Por otro lado∫X f dµ =

∫Enf dµ+

∫X\En f dµ. Pasando al límite se tiene

lımn→∞

∫(En)c

f dµ = 0.

1.6. CONTINUIDAD ABSOLUTA DE LA INTEGRAL 19

Entonces dado ε > 0 existe n0 ∈ N tal que para todo n ≥ n0,∫

(En)c f dµ <ε2 . Ahora jado el n0,∫

Af dµ =

∫A∩En0

f dµ+

∫A∩(En0 )c

f dµ ≤ n0

∫A∩En0

f dµ+

∫(En)c

f dµ ≤

≤ n0µ(A ∩ En0) +ε

2≤ n0µ(A) +

ε

2.

Tomando δ = ε2n0

se tiene que si µ(A) < δ entonces∫Af dµ ≤ n0µ(A) +

ε

2≤ n0δ +

ε

2≤ ε

2+ε

2= ε.

20 CAPÍTULO 1. PRELIMINARES

Capítulo 2

Espacios de Sobolev

A lo largo de todo este capítulo Ω denotará un conjunto abierto de Rn para cierto n ∈ N.

Desarrollamos parte de la teoría de los espacios de Sobolev. Estos serán subespacios vectoriales de espa-cios Lp y cuyas derivadas (débiles) hasta cierto orden están también en Lp. Estos espacios surgen de maneranatural en la teoría relativa a ecuaciones en derivadas parciales. En efecto, se trata del espacio funcionalapropiado en el que considerar los valores de contorno e iniciales de una ecuación diferencial porque en ellosse pueden aplicar los potentes resultados del Análisis Funcional abstracto. La idea es tener un espacio defunciones en el que haya un equilibrio entre funciones suaves y que no lo sean. A pesar de ello nosotros noestamos interesados en las aplicaciones a las ecuaciones en derivadas parciales sino simplemente en estudiarun espacio de funciones que satisfará ciertas propiedades.

Hacemos constar que en el Capítulo 4, sección 4.3, se incluye un resultado relativo a la aproximación defunciones de Sobolev for funciones Ck y que se podía haber incluido en el presente Capítulo. Se ha decididoincluirlo aparte, porque para su demostración se emplean técnicas más avanzadas, que están relacionadas conlos resultados del Capítulo 4. Luego parecía natural no dar ese resultado en este Capítulo para no despistaral lector. Además es un resultado que no se necesita para la prueba del Teorema de Morse-Sard del Capítulo3.Las referencias que se han tomado para desarrollar el capítulo son los libros de Brezis [9], Evans-Gariepy[17], Evans [16], Maz'ya [24] y Ziemer [32].

2.1. Conceptos previos

2.1.1. Funciones Test

Denición 2.1. (Funciones Test). Por C∞c (Ω) denotaremos el espacio de funciones innitamente diferen-ciables ϕ : Ω → R con soporte compacto en Ω (sop(ϕ) := x ∈ Ω : φ(x) 6= 0 ⊂ Ω). Llamaremos a estasfunciones ϕ ∈ C∞c (Ω) funciones test.

2.1.2. Derivada débil

Dada una función f ∈ C1(Ω) si cogemos ϕ ∈ C∞c (Ω) por la fórmula de integración por partes se tiene que∫Ωf∂ϕ

∂xidx = −

∫Ω

∂f

∂xiϕdx (2.1)

para cada i = 1, . . . , n (no aparece la integral sobre la frontera ∂Ω ya que ϕ tiene soporte compacto en Ω).Más en general si k ∈ N, f ∈ Ck(Rn), α = (α1, . . . , αn) es un multíndice de orden |α| = α1 + · · ·+ αn = k,

21

22 CAPÍTULO 2. ESPACIOS DE SOBOLEV

entonces si Dα := ∂|α|

∂xα11 ···∂x

αnn, ∫

ΩfDαϕdx = (−1)|α|

∫ΩDαfϕ dx. (2.2)

Se obtiene aplicando (2.1) k = |α| veces.

Notación: Dado k ∈ N denotamos por Dkf a alguna derivada Dαf con |α| = k.

Observando estas expresiones, en concreto (2.2), vemos que el término de la izquierda tiene sentido si sólopedimos que f sea L1

loc(Ω). Y observar el término de la derecha nos conduce a la noción de derivada débilde funciones L1

loc(Ω).

Denición 2.2. Sean f, g ∈ L1loc(Ω) y α un multíndice. Diremos que g es la αth−derivada parcial débil de

f , escrito

Dαf = g,

si se tiene ∫ΩfDαϕdx = (−1)|α|

∫Ωgϕ dx, ∀ϕ ∈ C∞c (Ω).

Observación 1: Si existe la αth− derivada débil de f esta es única salvo quizás en un conjunto de medidacero.

Observación 2: Si en particular f ∈ C1(Ω) se tiene que la derivada en el sentido usual coincide con laderivada en sentido débil salvo quizás en un conjunto de medida cero.

Observación 3: Si escribimos simplemente Df nos estamos reriendo a cierta derivada de f para ciertomultíndice de orden 1. En otras ocasiones con Df denotamos la matriz de primeras derivadas parciales. Encualquier caso esto quedará claro por el contexto.

2.2. Espacios de Sobolev

Esta parte del capítulo está dedicada a denir las funciones de Sobolev, así como algunas de sus propie-dades básicas. En la mayoría de los casos al tratarse de conceptos ya estudiados a nivel de grado se omitiránlas pruebas. El lector interesado puede echar un vistazo al libro de Evans [16] o el de Brezis [9], los cualestratan estos temas de manera sencilla y clara.

Sea 1 ≤ p ≤ ∞ y k un entero no negativo. La idea para denir los espacios de Sobolev es considerarfunciones con derivadas débiles de varios órdenes y todas ellas en algún espacio Lp.

Denición 2.3. El espacio de Sobolev W k,p(Ω) = W k,p(Ω;R) consiste de las funciones f : Ω → R enL1loc(Ω) tales que para cada multíndice α con |α| ≤ k, Dαf existe en sentido débil y pertenece a Lp(Ω)

(W 0,p(Ω) = Lp(Ω)).

El espacio W k,ploc (Ω) consistirá en las funciones que están en W k,p(V ) para todo V ⊂ Ω abierto con V ⊂ Ω

compacto. El espacio W k,p(Ω;Rm) con m ∈ N consiste en el conjunto de aquellas funciones f tales que lasfunciones componentes f1, . . . , fm ∈W k,p(Ω).

Observación: A lo largo del trabajo se estudiará en muchas ocasiones la pertenencia o no de ciertafunción f al espacio de Sobolev W k,p(Ω;Rm), y para ello bastará comprobar que cada función componentef1, . . . , fm lo está. De esta forma cuando se traten espacios W k,p(Ω;Rm) podemos pensar automáticamente

2.2. ESPACIOS DE SOBOLEV 23

en W k,p(Ω) donde las funciones toman valores escalares.

Notación: El caso especial p = 2 se suele escribir como Hk(Ω) = W k,2(Ω), k = 0, 1, 2, . . . . La letra H,de Hilbert, viene del hecho de que estos espacios (con norma aún por denir) serán Hilbert.

Obviamente al igual que en Lp identicamos funciones en W k,p(Ω) que coinciden en casi todo punto.Dotamos a estos espacios vectoriales de las normas

‖f‖Wk,p(Ω) :=

∑0≤|α|≤k

∫Ω|Dαf |p dx

1/p

, 1 ≤ p <∞

‖f‖Wk,∞(Ω) :=∑

0≤|α|≤k

ess supΩ|Dαf |.

donde el supremo esencial se dene como ess supΩf := ınf λ ∈ R : Ln(x : f(x) > λ) = 0 .

Observación: La norma que hemos dado para W k,p(Ω) con 1 ≤ p < ∞ es equivalente a ‖f‖Wk,p(Ω) :=∑0≤|α|≤k ‖Dαf‖Lp(Ω). (Más adelante daremos un método para denir otra gran variedad de normas equiva-

lentes a estas).

Teorema 2.1. Para cada k = 0, 1, 2 . . . , 1 ≤ p ≤ ∞, el espacio de Sobolev(W k,p(Ω), ‖ · ‖Wk,p(Ω)

)es un

espacio de Banach (de ahora en adelante escribiremos solamente W k,p(Ω) sobreentendiendo la norma).

Teorema 2.2. W k,p(Ω) es reexivo para 1 < p <∞ y separable para 1 ≤ p <∞.

Teorema 2.3. W k,2(Ω) = Hk(Ω) es un espacio de Hilbert.

2.2.1. Aproximación por funciones C∞

Notación: Dado ε > 0 escribiremos Ωε := x ∈ Ω : dist (x, ∂Ω) > ε.

Denición 2.4. Sea δ : Rn → R función C∞ denida como

δ(x) :=

Ce

1|x|2−1 si |x| < 1

0 si |x| ≥ 1

siendo C una constante positiva ajustada para que∫Rn δ(x) dx = 1. Se dene ahora δε(x) = 1

εn δ(xε ), que se

conoce por el nombre de mollier. Se observa que δε es C∞ y satisface

∫Rn δε(x) = 1 y sop(δε) = B(0, ε).

Denición 2.5. Si f : Ω→ R está en L1loc(Ω) se dene la función f ε := δε ∗ f en Ωε como

f ε(x) =

∫Ωδε(x− y)f(y) dy =

∫B(0,ε)

δε(y)f(x− y) dy =

∫B(0,1)

δ(y)f(x− εz) dz.

Es trabajoso volver siempre a la denición de derivada débil a la hora de trabajar con funciones de Sobolev,por lo que necesitamos desarrollar algunos procedimientos sistemáticos para aproximar funciones de Sobolevpor funciones suaves. Estas funciones, los molliers, proporcionan una técnica muy buena para aproximarfunciones de Sobolev por funciones C∞.Tenemos en primer lugar el siguiente resultado:

24 CAPÍTULO 2. ESPACIOS DE SOBOLEV

Teorema 2.4. Sea f ∈ L1loc(Ω), entonces se cumplen los siguientes apartados:

1. Para cada ε > 0, f ε ∈ C∞(Ωε).

2. Si f ∈ C(Ω) entonces f ε → f uniformemente en subconjuntos compactos de Ω.

3. Si f ∈ Lploc(Ω) para cierto 1 ≤ p <∞ entonces f ε → f en Lploc(Ω).

4. Si f ∈W k,ploc (Ω) para cierto 1 ≤ p <∞ y k ≥ 1 entonces f ε → f en W k,p

loc (Ω).

Demostración.

1. Fijemos x ∈ Ωε, 1 ≤ i ≤ n y h sucientemente pequeño para que x + hei ∈ Ωε (ei denota el vectori-ésimo de la base canónica de Rn). Entonces

f ε(x+ hei)− f ε

h=

∫Ω

[δε(x+ hei − y)− δε(x− y)

h

]f(y) dy =

=1

εn

∫Ω

δ(x+hei−y

ε

)− δ

(x−yε

)h

f(y) dy

=1

εn

∫V

δ(x+hei−y

ε

)− δ

(x−yε

)h

f(y) dy (2.3)

para cierto V ⊂⊂ Ω (con esta notación querremos decir que V ⊂ Ω es abierto y que V ⊂ Ω escompacto). El poder restringir la integral a cierto V se debe al hecho de cómo son los soportes de lasfunciones δ que actúan en la integral.Ahora por las propiedades de regularidad de δ,

lımh→0

1

h

(x− yε

+heiε

)− δ

(x− yε

)]=

1

ε

∂δ

∂xi

(x− yε

)= εn

∂δε∂xi

(x− y)

uniformemente en y ∈ V .Además con vistas a utilizar el Teorema de la Convergencia Dominada de Lebesgue observamos que elvalor absoluto del integrando está acotado.

1

h

∣∣∣∣δ(x+ hei − yε

)− δ

(x− yε

)∣∣∣∣ |f(y)| ≤ 1

h|Dδ(ξ)|

∣∣∣∣x+ hei − yε

− x− yε

∣∣∣∣ |f(y)| ≤

≤ 1

h‖Dδ‖L∞

∣∣∣∣heiε∣∣∣∣ |f(y)| ≤ 1

ε‖Dδ‖L∞ |f(y)| ∈ L1(V )

donde ξ está en el segmento que une x−yε y x+hei−y

ε .Podemos usar por tanto el Teorema de Convergencia Dominada de Lebesgue en (2.3) para concluir que

∂fε

∂xi(x) = lım

h→0

f ε(x+ hei)− f ε(x)

h=

∫Ω

∂δε∂xi

(x− y)f(y) dy.

Un argumento similar demuestra que todas las derivadas parciales de f ε de todos los órdenes existeny son continuas en cada punto de Ωε.

2.2. ESPACIOS DE SOBOLEV 25

2. Sea V ⊂⊂ Ω y sea V ⊂⊂W ⊂⊂ Ω. Para cada y ∈ V ,

f ε(x) =1

εn

∫B(x,ε)

δ

(x− yε

)f(y) dy =

∫B(0,1)

δ(z)f(x− εz) dz.

Puesto que∫B(0,1) δ(z) dz = 1,

|f ε(x)− f(x)| ≤∫B(0,1)

δ(z)|f(x− εz)− f(x)| dz.

Además f es uniformemente continua en W (f ∈ C(Ω)) y como para ε > 0 sucientemente pequeñof(x− εz) ∈W (x ∈ V , z ∈ B(0, 1)) se concluye que f ε → f uniformemente en V .

3. Cojamos un conjunto abierto V ⊂⊂ Ω y además otro abierto W de manera que V ⊂⊂ W ⊂⊂ Ω.Armamos que para ε > 0 sucientemente pequeño

‖f ε‖Lp(V ) ≤ ‖f‖Lp(W ). (2.4)

En primer lugar vemos que si 1 < p <∞ y x ∈ V tenemos

|f ε(x)| =

∣∣∣∣∣∫B(0,1)

δ(z)f(x− εz) dz

∣∣∣∣∣ ≤∫B(0,1)

δ(z)|f(x− εz)| dz =

=

∫B(0,1)

δ(z)1− 1

p δ(z)1p |f(x− εz)| dz ≤

(∫B(0,1)

δ(z) dz

)1− 1p(∫

B(0,1)δ(z)|f(x− εz)|p dz

)1/p

.

Ahora tomando 1 ≤ p <∞ se tiene∫V|f ε(x)|p dx ≤

∫V

(∫B(0,1)

δ(z)|f(x− εz)|p dz

)dx =

=

∫B(0,1)

δ(z)

(∫V|f(x− εz)|p dx

)dz ≤

∫B(0,1)

δ(z)

(∫W|f(y)|p dy

)dz =

∫W|f(y)|p dy

para ε > 0 sucientemente pequeño. Se obtiene así (2.4).Sea δ > 0. Puesto que f ∈ Lp(W ) podemos elegir g ∈ C(W ) de manera que ‖f − g‖Lp(W ) < δ (véaseresultado de densidad de las funciones continuas en los espacios Lp, 1 ≤ p < ∞ en [27], pág. 69). Porlo tanto podemos escribir lo siguiente

‖f ε − f‖Lp(V ) ≤ ‖f ε − gε‖Lp(V ) + ‖gε − g‖Lp(V ) + ‖g − f‖Lp(V ) ≤≤ ‖f − g‖Lp(W ) + ‖gε − g‖Lp(V ) + ‖g − f‖Lp(V ) ≤≤ 2δ + ‖gε − g‖Lp(V ).

Gracias a que g ∈ C(W ) por el apartado 2., se tiene que gε → g uniformemente en V ⊂⊂W y entoncesgε → g en Lp(V ). Así lım supε→0 ‖f ε − f‖Lp(V ) ≤ 2δ y como δ > 0 era arbitrario se tiene que f ε → fen Lploc(Ω).

4. Veamos primero

(Dαf)ε = δε ∗Dαf en Ωε si 0 ≤ |α| ≤ k. (2.5)

26 CAPÍTULO 2. ESPACIOS DE SOBOLEV

En efecto si tomamos x ∈ Ωε gracias a que δε(x−y) ∈ C∞c (Ω) para toda y ∈ Ω y aplicando integraciónpor partes

(Dαf)ε (x) = Dα

∫Ωδε(x− y)f(y) dy =

∫ΩDαx δε(x− y)f(y) dy =

= (−1)|α|∫

ΩDαy δε(x− y)f(y) dy = (−1)|α|(−1)|α|

∫Ωδε(x− y)Dαf(y) dy =

= (δε ∗Dαf) (x).

Sea ahora V ⊂⊂ Ω, como Dαf ∈ Lp(V ) (pues f ∈ Lploc(Ω)) entonces

(Dαf)ε = δε ∗Dαf −−−→ε→0

Dαf en Lp(V )

para cada 0 ≤ |α| ≤ k. Por consiguiente

‖f ε − f‖pWk,p(V )

=∑

0≤|α|≤k

‖Dαf ε −Dαf‖pLp(V ) −−−→ε→00.

Observación: Si Ω = Rn y f ∈W k,p(Rn), el mismo argumento que en (4) puede seguirse para demostrarque f ε → f en W k,p(Rn). En este caso f ε ∈ C∞c (Rn).

Un resultado algo más fuerte en el que se aproxima en W k,p(Ω) y no sólo en W k,ploc (Ω) es el siguiente.

Consultar Evans-Gariepy [17] (pág. 125) o Evans [16] (pág. 251).

Teorema 2.5. (Teorema de aproximación local por funciones C∞) Supongamos que f ∈W k,p(Ω) para algún1 ≤ p <∞. Entonces existe una sucesión fi∞i=1 ⊂W k,p(Ω) ∩ C∞(Ω) tal que

fi −−−→i→∞

f en W k,p(Ω).

Demostración. DenimosΩk =

x ∈ Ω : dist(x, ∂Ω) > 1

k

∩B(0, k), k = 1, 2, . . .

Ω0 = ∅

y escribimos Vk = Ωk+1 \ Ωk−1, k = 1, 2 . . . , cuya clausura es compacta en Ω.Fijemos ε > 0 y sea ξk∞k=1 una partición diferenciable de la unidad subordinada a los conjuntos abiertosVk∞k=1, es decir,

ξk ∈ C∞c (Vk), k = 1, 2 . . .0 ≤ ξk ≤ 1, k = 1, 2, . . .∑∞

k=1 ξk = 1 en Ω

Para cada k = 1, 2 . . . tenemos fξk ∈ W k,p(Ω). En efecto, esto puede comprobarse directamente por ladenición, primero para el caso de multíndices de orden |α| = 1 y luego aplicando inducción (véase Evans[16] pág. 261).

Y además sop(fξk) ⊂ Vk, luego usando el resultado anterior sobre convergencia en W k,ploc (Ω) (Teorema 2.4)

existirá εk > 0 tal que sop(δεk ∗ (fξk)) ⊂ Vk‖δεk ∗ (fξk)− fξk‖Wk,p(Ω) ≤ ε

2k

Denimos fε =∑∞

k=1 δεk ∗ (fξk) y se tiene

2.3. DESIGUALDAD DE MORREY 27

fε ∈ C∞(Ω) pues para cada punto x ∈ Ω sólo hay un número nito de sumandos que no valen cero.

Como f =∑∞

k=1 fξk,

‖fε − f‖Wk,p(Ω) = ‖∞∑k=1

(δεk ∗ (fξk)− fξk)‖Wk,p(Ω) ≤∞∑k=1

ε

2k= ε.

Se tiene así el resultado. Es decir que W k,p(Ω) ∩ C∞(Ω) es denso en W k,p(Ω).

2.3. Desigualdad de Morrey

Teorema 2.6. (Desigualdad de Morrey) Supongamos n < p < ∞. Sea además Ω ⊂ Rn un subconjuntoabierto y sea B(x, r) una bola (abierta) contenida en Ω. Entonces para Ln-casi todo y, z ∈ B(x, r) se tieneque existe C > 0, constante que sólo depende de n y p, tal que

|f(y)− f(z)| ≤ Cr1−np

(∫B(x,r)

|Df(w)|p dw

) 1p

∀f ∈W 1,p(Ω;Rm). (2.6)

Antes de pasar a la demostración necesitaremos un sencillo lema previo:

Lema 2.1. Sea f : Rn → R con f ∈ C1(B(x, r)). Para cada 1 ≤ p < ∞ existe C > 0 (dependiendo sólo den y p) tal que ∫

B(x,r)|f(y)− f(z)|p dy ≤ Crn+p−1

∫B(x,r)

|Df(y)|p|y − z|1−n dy

para toda B(x, r) ⊂ Rn y z ∈ B(x, r).

Demostración. Si tomamos y, z ∈ B(x, r) usando que f ∈ C1(B(x, r)) se tiene que

f(y)− f(z) =

∫ 1

0

d

dtf(z + t(y − z)) dt =

∫ 1

0Df(z + t(y − z)) · (y − z) dt =

∫ 1

0Df(z + t(y − z)) dt · (y − z).

Entonces

|f(y)− f(z)|p ≤ |y − z|p∫ 1

0|Df(z + t(y − z))|p dt

y así para s > 0,∫B(x,r)∩∂B(z,s)

|f(y)− f(z)|p dHn−1(y) ≤∫B(x,r)∩∂B(z,s)

|y − z|p(∫ 1

0|Df(z + t(y − z))|p dt

)dHn−1(y) =

= sp∫B(x,r)∩∂B(z,s)

(∫ 1

0|Df(z + t(y − z))|p dt

)dHn−1(y).

Haciendo el cambio de variable w = z + t(y − z) (|w − z| = ts), tenemos dHn−1(y) = 1tn−1dHn−1(w) y por

tanto∫B(x,r)∩∂B(z,s)

|f(y)− f(z)|p dHn−1(y) ≤ sp∫ 1

0

1

tn−1

(∫B(x,r)∩∂B(z,ts)

|Df(w)|p dHn−1(w)

)dt

= sn+p−1

∫ 1

0

(∫B(x,r)∩∂B(z,ts)

|Df(w)|p|w − z|1−n dHn−1(w)

)dt.

28 CAPÍTULO 2. ESPACIOS DE SOBOLEV

Utilizando ahora la fórmula del cambio a coordenadas polares (véase Evans-Gariepy [17], pág 118) se sigueque ∫

B(x,r)∩∂B(z,s)|f(y)− f(z)|p dHn−1(y) = sn+p−2

∫B(x,r)∩B(z,s)

|Df(w)|p|w − z|1−n dw.

Y otra vez por la fórmula del cambio a polares y el hecho de que s > 0 era arbitrario se concluye que∫B(x,r)

|f(y)− f(z)|p dy ≤ Crn+p−1

∫B(x,r)

|Df(w)|p|w − z|1−n dw,

donde C es una constante positiva que sólo depende de n y de p (no de r).

Demostración. ( Desigualdad de Morrey)Supongamos primero que f ∈ C1(Ω). Más adelante, con un argumento de aproximación generalizaremos alcaso W 1,p(Ω).Sean y, z ∈ B(x, r). Puesto que f ∈ C1(Ω), aplicando el Lema 2.1 con p = 1 tenemos lo siguiente

|f(y)− f(z)| = −∫B(x,r)

|f(y)− f(z)| dw ≤ −∫B(x,r)

|f(y)− f(w)|+ |f(w)− f(z)| dw ≤

≤ Crn

Ln(B(x, r))

∫B(x,r)

|Df(w)|(|y − w|1−n + |w − z|1−n

)dw.

Recordemos que Ln(B(x, r)) = V ol(B(x, r)) = πn/2rn

Γ(n2

+1) = Crn, donde C es una constante que depende sólo

de n, y Γ es la conocida función gamma. Así,

|f(y)− f(z)| ≤ C∫B(x,r)

|Df(w)|(|y − w|1−n + |w − z|1−n

)dw ≤

≤︸︷︷︸Hölder

C

(∫B(x,r)

(|y − w|1−n + |w − z|1−n

) pp−1 dw

) p−1p(∫

B(x,r)|Df(w)|p dw

) 1p

Observemos ahora que como y, z ∈ B(x, r), |y − w| ≤ 2r, |z − w| ≤ 2r, luego∫B(x,r)

(|y − w|1−n + |z − w|1−n

) pp−1 dw ≤

∫B(x,r)

((2r)1−n + (2r)1−n) p

p−1 dw =

=(2(2r)1−n) p

p−1

∫B(x,r)

dw = 2(2−n) p

p−1 r(1−n) p

p−1Ln(B(x, r)) =

= Crn−(n−1) p

p−1 ,

donde C sólo depende de n y de p.Volviendo ahora a nuestra expresión anterior podemos escribir

|f(y)− f(z)| ≤ Cr(n−(n−1) p

p−1

)p−1p

(∫B(x,r)

|Df(w)|p dw

) 1p

= Cr1−n

p

(∫B(x,r)

|Df(w)|p dw

) 1p

,

nalizando así la prueba para el caso f ∈ C1(Ω).

2.3. DESIGUALDAD DE MORREY 29

Consideramos ahora el caso en el que f ∈ W 1,p(Ω). Por el Teorema 2.5 podemos aproximarla (p < ∞)por funciones de clase C1 convergiendo en la norma de W 1,p. Es decir que existe fi∞i=1 ⊂ C1(Ω) tal quefi −−−→

i→∞f en W 1,p(Ω). Para estas funciones fi sí se cumple la desigualdad de Morrey que ya hemos probado.

|fi(y)− fi(x)| ≤ Cr1−np

(∫B(x,r)

|Dfi(w)|p dw

) 1p

= Cr1−n

p ‖Dfi‖Lp(B(x,r))

Además recordando la forma que tenían las fi y aplicando las propiedades básicas de la convolución juntocon (2.5) podemos escribir

Dfi = D (δεi ∗ f) = δεi ∗Df donde εi → 0

y

‖Dfi‖Lp(B(x,r)) ≤ ‖δεi‖L1(Rn)‖Df‖Lp(B(x,r)) = ‖Df‖Lp(B(x,r)).

Así tenemos que

|fi(y)− fi(x)| ≤ Cr1−np ‖Df‖Lp(B(x,r)).

Por otro lado fi es una familia equicontinua de funciones y aplicando el Teorema de Ascoli-Arzelà existiráuna subsucesión

fijque converge uniformemente, digamos a cierto f . La convergencia uniforme implica

la convergencia en Lploc y por la unicidad de límite en Lploc se concluye que f = f en casi todo punto.

Se tiene por consiguiente que el resultado es válido también en el espacio W 1,p(Ω).

Algunas observaciones sobre el resultado anterior son:

1. Una consecuencia clara del resultado anterior es que si f ∈W 1,p(Ω) (n < p <∞) tenemos

|f(y)− f(z)| ≤ C|y − z|1−np ‖Df‖W 1,p(Ω)

para todo y, z ∈ Ω, donde C sólo depende de n y p.Si llamamos α(p) := 1− n

p obtenemos

‖f‖C0,α(p)(Ω) := supy 6=z

|f(y)− f(z)||y − z|α(p)

≤ C‖f‖W 1,p(Ω) (2.7)

para toda f ∈W 1,p(Ω).Es decir, resumiendo, una importante consecuencia de la Desigualdad de Morrey es que las funcionesf ∈W 1,p(Ω) son de hecho Hölder-continuas con exponente α(p), tras posiblemente haberlas redenidoen un conjunto de medida cero. A partir de ahora siempre que trabajemos con una función en W 1,p(Ω)pensaremos en este representante continuo.Hacemos constar que todo lo anterior vale para el caso Ω = Rn.

2. En la demostración de la Desigualdad de Morrey, por razonamientos análogos y usando también elLema 2.1 podíamos haber visto que se tiene

‖f‖L∞(Rn) ≤ C‖f‖W 1,p(Rn).

3. Para el caso p =∞ tenemos el siguiente resultado que damos sin demostración (véase Brezis [9]).

Teorema 2.7. Si denotamos por Lip(Rn) al espacio de las funciones Lipschitz entonces W 1,∞(Rn) =Lip(Rn) ∩ L∞(Rn). Además para toda f ∈W 1,∞(Rn), Lip(f) = ‖Df‖L∞(Rn).

30 CAPÍTULO 2. ESPACIOS DE SOBOLEV

Mediante el Teorema de Diferenciabilidad de Lebesgue 1.4 y la Desigualdad de Morrey 2.6podemos probar el siguiente resultado.

Teorema 2.8. (Teorema de Rademacher) Si f ∈ W 1,p(Rn), n < p ≤ ∞ (o bien n = p = 1), entonces f esdiferenciable en casi todo punto. Más precisamente, si x es un punto Lp−Lebesgue de la derivada débil de f ,entonces f es diferenciable en x y la derivada débil coincide con la derivada usual.

Se trata de un resultado básico en el análisis no lineal que puede verse por ejemplo en el libro de Evans-Gariepy [17]. Además la versión que acabamos de dar es más general que el siguiente resultado más clásicoal que se sigue llamando también Teorema de Rademacher.

Corolario 2.9. (Teorema de Rademacher clásico) Si f ∈ Lip(Rn) entonces f es diferenciable en casi todopunto.

Aprovechamos para enunciar la fórmula del área, que se usará en el siguiente Capítulo.

Teorema 2.10. (Fórmula del área) Sea f : Rn → Rn Lipschitz. Entonces para cada subconjunto medibleA ⊂ Rn se tiene que

∫A

√det(D(f(x)) dx =

∫Rn H

0(A ∩ f−1(x)) dx.

Por último, pensando en la demostración del Teorema de Morse-Sard del Capítulo 3 nos conviene teneren mente el siguiente corolario.

Corolario 2.11. Sea Ω ⊂ Rn un conjunto abierto. Supongamos n < p ≤ ∞ y f ∈ W k,p(Ω) con k ≥ 1.Entonces existe una función f∗ ∈ Ck−1,α(p)(Ω) con f = f∗ en casi todo punto y α(p) := 1− n

p que satisface

‖f∗‖Ck−1,α(p)(Ω) ≤ C‖f‖Wk,p(Ω).

La constante C sólo depende de n, p y Ω. Es decir, otra manera de decir esto es que se tiene la inclusióncontinua

W k,p(Ω) → Ck−1,α(p)(Ω).

Demostración. Lo probamos por inducción sobre k ≥ 1.

El caso k = 1 ya está visto por los resultados anteriores (ver (2.7)).

Supongamos el resultado cierto para k− 1 y lo probamos para k. Claramente podemos suponer k ≥ 2.Sea f ∈ W k,p(Ω) entonces Df ∈ W k−1,p(Ω), luego por la hipótesis de inducción Df será una funciónCk−2 cuyas derivadas débiles de orden k − 2 son Hölder continuas de exponente α(p),

‖Df‖Ck−2,α(p)(Ω) ≤ C‖Df‖Wk−1,p(Ω).

Por otro lado como f ∈ W k,p(Ω) y p > n por el Teorema de Rademacher 2.8 f será diferenciableen todo punto Lp-Lebesgue, y esa derivada en sentido usual coincide con la derivada débil Df . Perocomo también tenemos que f es continua, todos los puntos de Ω son Lp-Lebesgue y esto implica quef tiene que ser Ck−1. Luego podemos concluir

‖f‖Ck−1,α(p)(Ω) = ‖Df‖Ck−2,α(p)(Ω) ≤ C‖Df‖Wk−1,p(Ω) ≤ C‖f‖Wk,p(Ω).

Observación: Recordemos que considerar Rm como espacio de llegada en vez de R no modica losargumentos anteriores.

2.4. SECCIONES DE SOBOLEV 31

2.4. Secciones de Sobolev

El resultado que pretendemos probar en esta sección dice lo siguiente:

Teorema 2.12. Sea V ⊂ Rn abierto acotado. Sea g : V −→ Rm, g ∈W k,p(V ;Rm) y 1 ≤ i ≤ n−1. Entoncespara Li−casi todo (y1 . . . , yi) la función g|(y1...,yi) : V(y1,...,yn) −→ Rm está en el espacio W k,p(V(y1,...,yi),R

m),donde

g|(y1...,yi)(yi+1, . . . , yn) = g(y1, . . . , yn)

V(y1,...,yi) =

(z1, . . . , zn−i) ∈ Rn−i : (y1, . . . , yi, z1, . . . , zn−i) ∈ V

En ocasiones se conoce a este resultado por el nombre de Teorema de Secciones de Sobolev.

Será suciente que probemos el resultado para el espacio W 1,p(V ;R) por dos motivos. En primer lugarrecordamos que las funcionesW 1,p(V ;Rm) son aquellas tales que todas sus componentes están enW 1,p(V,R).Y en segundo lugar si g ∈W k,p(V ;R) entonces para cada multíndice α = (0, . . . , 0, αi+1, . . . , αn) con |α| < ktenemos Dαg ∈ W 1,p(V,R), y podemos aplicar a estas funciones el Teorema 2.12. Si ahora llamamos α =(αi+1, . . . , αn) basta con comprobar que para Li−casi todo (y1, . . . , yi) se tieneD

αg|(y1,...,yi) = Dα(g|(y1,...,yi)).

Necesitamos previamente un resultado sobre la diferenciabilidad en casi todas las lineas de las funcionesde Sobolev. Es decir, acabaremos viendo que las funciones del espacio W 1,p(V ) se pueden caracterizar porser aquellas funciones que están en Lp, que tienen un representante cuya restricción a casi toda línea paralelaa los ejes es absolutamente continua en compactos y tal que la derivada usual de este representante a lolargo de esas líneas existe en L1−casi todo punto y está en Lp(V ). Como referencia se ha seguido el libro deZiemer [32].

Teorema 2.13. Sea V ⊂ Rn, f ∈ Lp(V ) y sea p ≥ 1. Entonces f ∈ W 1,p(V ) si y sólo si f tiene unrepresentante f∗ que es absolutamente continuo en compactos en Ln−1−casi todas las líneas de V paralelasa los ejes coordenados y cuyas derivadas parciales (clásicas) están en Lp(V ).

Demostración.

(⇒) Sea f ∈W 1,p(V ). Sabemos que por el Teorema 2.4

f ε = δε ∗ f −→ f en W 1,ploc (V ).

Escribiremos x = (x′, t) ∈ V donde x′ ∈ Rn−1 y t ∈ [−L,L]. Basta probar el teorema para la línea quedeja jo x′ y mueve t.Por el Teorema de Fubini, tomamos una sucesión εkk≥1 tal que si llamamos fk = f εk tenemos

lımk→∞

∫ L

−L|fk(x′, t)− f(x′, t)|p + |Dfk(x′, t)−Df(x′, t)|p dt = 0

para Ln−1−casi todo x′. Aquí D = ∂∂t .

Como las funciones fk son C∞, para todo b ∈ [−L,L],

|fk(x′, b)− fk(x′,−L)| ≤∫ L

−L|Dfk(x′, t)| dt.

Además como convergencia en Lp([−L,L]) implica convergencia en L1([−L,L]), para cada η > 0 existeM > 0 tal que si b ∈ [−L,L] entonces

|fk(x′, b)− fk(x′,−L)| ≤∫ L

−L|Dfk(x′, t)| dt ≤

∫ L

−L|Df(x′, t)| dt+ η (2.8)

32 CAPÍTULO 2. ESPACIOS DE SOBOLEV

para todo k ≥M . Nos quedaremos con la subsucesión fkk≥M .

(a) Podemos suponer sin pérdida de generalidad que fk(x′,−L)k≥1 converge.

(b) Por (a) y (2.8) la sucesión fk(x′, ·)k≥1 está uniformemente acotada en [−L,L].

(c) Las funciones fk son C∞ respecto de t, luego son absolutamente continuas. Y más importanteaún, lo serán uniformemente respecto de k. Esto se debe a la convergencia en L1 de Dfk a Df .

Lo comprobamos directamente por la denición de continuidad absoluta. Dado ε > 0, existe δ > 0tal que si L1(E) < δ entonces

∫E |Df(x′, t)| dt < ε

2 (ver continuidad absoluta de la integral,Teorema 1.5). La convergencia en L1 de Dfk a Df nos da la existencia de un k sucientementegrande tal que a partir de él ∫

E|Dfk(x′, t)| dt < ε.

Nos volveremos a quedar con esta subsucesión de fk empezando por el k tan grande como marqueel argumento anterior.El δ > 0 encontrado es el que nos sirve para la continuidad absoluta de todas las funciones fk. Sea(aj , bj)pj=1 una sucesión nita de intervalos disjuntos en [−L,L] tales que

∑pj=1(bj − aj) < δ.

Entonces

p∑j=1

|fk(x′, bj)− fk(x′, aj)| ≤p∑j=1

∫ bk

ak

|Dfk(x′, t)| dt ≤∫ L

−L|Dfk(x′, t)| dt < ε.

(d) fk(x′, ·)k≥1 es una sucesión de funciones absolutamente continuas uniformemente en k luego enparticular es una familia de funciones equicontinua.

(e) Por (b) y (d) usando el Teorema de Ascoli-Arzelà existirá una subsucesión de fk(x′, ·), que de-

notamos igual, tal que converge uniformemente a una función g. Y gracias a que la familia defunciones absolutamente continuas lo es uniformemente en k (ver (c)), entonces se deduce que ges también absolutamente continua.

(f) Como la convergencia uniforme implica la convergencia en L1([−L,L]) y sabemos que fk −→ fen L1([−L,L]) entonces f = g en casi todo punto.

Se concluye así la existencia del representante f∗ buscado.

(⇐) Supongamos que f tiene el representante que describe el resultado y lo llamamos g. Denotemos ala proyección de V sobre su última coordenada por F . Para cada ϕ ∈ C∞c (V ), como las funcionesabsolutamente continuas son diferenciables en casi todo punto y satisfacen la fórmula de integraciónpor partes, ∫

Vf∂ϕ

∂xndx =

∫Vg∂ϕ

∂xndx =

∫πn−1(V )

(∫Fg(x′, t)Dϕ(x′, t) dt

)dx′ =

= −∫πn−1(V )

(∫FDg(x′, t)ϕ(x′, t) dt

)dx′ = −

∫VDg(x)ϕ(x) dx.

Así tenemos que ∂nf = Dg ∈ Lp(V ) para casi todo punto. Se concluye que f ∈W 1,p(V ).

2.4. SECCIONES DE SOBOLEV 33

Observación: Es interesante darse cuenta que la prueba del teorema revela que los molliers f ε convergena f en todo punto para casi todas las líneas paralelas a los ejes. Si f no fuese un elemento de W 1,p(V ), sinosólo un elemento de Lp(V ) el teorema de Fubini nos diría que la convergencia de los molliers es sólo enH1-casi todo punto (no en todos los puntos), para casi todas las líneas.

Demostramos para acabar el Teorema 2.12.

Demostración. (Teorema 2.12)Denotaremos por

πj(V ) =

(y1, . . . , yj) ∈ Rj : ∃(z1 . . . , zn−j) con (y1 . . . , yj , z1, . . . , zn−j) ∈ V

a la proyección de V sobre sus j primeras coordenadas.Tomemos i ∈ 1, . . . , n jo.

(1o) Existe un conjunto C1 ⊂ πi(V ) tal que Li(C1) = 0 y g|(y1,...,yi) ∈ Lp(V(y1,...,yi)) para todo (y1, . . . , yi) ∈πi(V ) \ C1.

Simplemente cogemos C1 =

(y1, . . . , yi) ∈ πi(V ) : g|(y1...,yi) /∈ Lp(V(y1...,yi)). Usando que g ∈ Lp(V )

y el Teorema de Fubini se ve fácilmente que Li(C1) = 0.

(2o) Usando que g ∈ W 1,p(V ) y por el Teorema 2.13 existirá D ⊂ πn−1(V ) con Ln−1(D) = 0 y tal queg(y1 . . . , yn−1, t) es absolutamente continua en t en subconjuntos compactos para todo (y1, . . . , yn−1) /∈D. Consideramos

C2 =

(y1, . . . , yi) ∈ πi(D) : Ln−i−1(D(y1,...,yi)) > 0

que satisface que tiene Li medida nula. Tomamos entonces C = C1 ∪ C2.

(3o) Para todo (y1, . . . , yi) /∈ C existe un conjunto E ⊂ πn−i−1(V(y1...,yi)) ⊂ Rn−i−1 tal que Ln−i−1(E) = 0y de manera que g|(y1...,yi)(yi−1, . . . , yn−1, t) es absolutamente continua en t en subconjuntos compactos.

El conjunto buscado es E = D(y1,...,yi) que tiene medida Ln−i−1 nula porque (y1 . . . , yi) /∈ C2.

(4o) Si (y1 . . . , yi) ∈ C entonces ∂∂tg|(y1...,yi)(yi+1, . . . , yn−1, t) = ∂

∂tg(y1 . . . , yn−1, y) ∈ Lp(V ).

Esto es así porque g ∈ W 1,p(V ) y podemos volver a utilizar el Teorema 2.13. Además por unrazonamiento análogo a (1o) podemos también decir que ∂

∂tg|(y1...,yi)(yi+1, . . . , yn−1, t) ∈ Lp(V(y1,...,yi))(añadiendo a C un conjunto de medida Li-nula si fuese necesario).

Tanto en el apartado (3o) como en (4o) si considerásemos la posición del t en otra que no sea la últimacoordenada, los mismos resultados se siguen por un reordenamiento de coordenadas.Juntando toda esta información, si aplicamos el Teorema 2.13 obtenemos que para Li−casi todo punto(y1, . . . , yi) ∈ πi(V ) entonces g|(y1,...,yi) ∈W 1,p(V(y1...,yi)).

Tendrá para nosotros gran interés el siguiente lema que nos dice que al igual que ocurre para las funcionesCk, las funciones de Sobolev cuyas derivadas débiles se anulan para cierto orden son polinomios de ordenmenor.

Corolario 2.14. Sea V ⊂ Rn un abierto conexo y sea f ∈ W k,p(Rn) tal que todas sus derivadas débiles deorden k se anulan en V . Entonces la función f es un polinomio de grado a lo sumo k − 1 en V .

34 CAPÍTULO 2. ESPACIOS DE SOBOLEV

Demostración. Primero se prueba el resultado para el caso k = 1 y luego se aplica inducción en el casogeneral. El caso k = 1 se deduce automáticamente del Teorema 2.13 pues f tendrá un representanteabsolutamente continuo cuyas derivadas (que existen para casi todo punto) se anulan a lo largo de casi todaslas líneas paralelas a los ejes coordenados. Entonces ese representante toma un valor constante en casi todasesas líneas, lo que implica el resultado.

2.5. Composición e inversa de funciones de Sobolev

Veremos en primer lugar que el producto de funciones en W l,ploc(Ω) con l ≥ 1 sigue estando en el mismo

espacio siempre que p > n. Este resultado previo será clave para la demostración de las Proposiciones 2.1y 2.2, de mayor interés para nosotros.

El suponer en toda esta sección que p > n es condición imprescindible puesto que se requiere de la utili-zación de la Desigualdad de Morrey. También será una de las hipótesis del futuro Teorema de Morse-Sardde De Pascale.

Las demostraciones de todos los resultados siguientes están basadas en el trabajo de Hajlasz y Zimmerman[21].

Lema 2.2. Sea Ω ⊂ Rn abierto. Si g, h ∈W l,ploc(Ω) donde p > n y l ≥ 1, entonces gh ∈W l,p

loc(Ω).

Demostración. Basta probar que Dβ(gh) ∈W 1,ploc (Ω) con |β| = l − 1 ya que g, h ∈ C l−1(Ω) (usar Corolario

2.11) y por tanto gh ∈ C l−1(Ω) ⊂ W l−1,ploc (Ω). Se está usando aquí el hecho de que toda función continua

en Ω esta en Lploc(Ω) para todo 1 ≤ p ≤ ∞ pues para cualquier subconjunto compacto K ⊂ Ω se tieneC(K) ⊂ L∞(K) ⊂ Lp(K) (1 ≤ p <∞).Por la regla del producto para funciones C l−1(Ω) se sigue

Dβ(gh) =∑

γ+δ=β

β!

γ!δ!DγgDδh.

(Observemos que si l = 1 entonces β = 0 y Dβ(gh) = gh). Cada función Dγg, Dδh es absolutamentecontinua en casi todas las líneas paralelas a los ejes coordenados (usar resultado sobre secciones de Sobolev2.13 porque como |β| = l − 1, tanto Dγg como Dδh están en el espacio W 1,p

loc (Ω) ). Por lo tanto el productoDγgDδh también son absolutamente continuas1 en casi todas las líneas paralelas a los ejes coordenados, paratodo 0 ≤ |γ|, |δ| ≤ |β|. Una combinación lineal de este tipo de funciones absolutamente continuas tambiénes absolutamente continua y por tanto Dβ(gh) lo es automáticamente en casi todas las líneas paralelas alos ejes coordenados. Otra vez por la caracterización de los espacios W 1,p

loc (Ω) por la continuidad absoluta enlas líneas (ver resultado sobre secciones de Sobolev 2.13), sabemos que gh ∈ C l−1(Ω) entonces Dβ(gh) soncontinuas y estarán en Lploc(Ω). Esto indica que será suciente mostrar que las derivadas parciales de orden

1 de Dβ(gh) están en Lploc(Ω). Con esto se podrá concluir que Dβ(gh) ∈W 1,ploc (Ω) para todo β, |β| = l − 1 y

así gh ∈W l,ploc(Ω).

Sea Dα = DδiDβ , donde 1 ≤ i ≤ n y Dδi denota la derivada en sentido débil respecto de la variable xi (deorden 1). Escribimos

Dα(gh) =∑

γ+δ=α

α!

γ!δ!DγgDδh.

1El producto de funciones absolutamente continuas en un compacto es absolutamente continuo. Esto se puede ver directa-mente por la denición y usando que las funciones estarán acotadas en ese compacto.

2.5. COMPOSICIÓN E INVERSA DE FUNCIONES DE SOBOLEV 35

Si |γ| < |α| = l y |δ| < |α| = l, la función DγgDδh es continua y así está en Lploc(Ω).

El resto de términos son hDαg+gDαh. Claramente esta función pertenece a Lploc(Ω) porque las funciones

g, h son continuas (g, h ∈W l,plov(Ω) ⊂ C l−1(Ω), l ≥ 1) y Dαg,Dαh ∈ Lploc. Como además el producto de

una función continua por otra en Lploc está en Lploc se concluye que hDαg + gDαh está en Lploc(Ω).

Veamos ahora en qué condiciones la inversa de una función de Sobolev es de Sobolev. Sin embargo no damosun resultado de carácter general en este sentido. La proposición que se presenta está orientada totalmente alcaso en el que se utilizará en el Teorema de Morse-Sard del Capítulo 3. Esto conlleva algunos inconvenientespara el lector pues la notación y las hipótesis pueden parecer a simple vista algo articiales, y de esta maneraconfundirnos. Por otro lado la ventaja de presentar el resultado de tal forma permite su aplicación a nuestrocaso más adelante de manera directa.

Proposición 2.1. Sea f ∈W k,ploc (V ;Rm) con V ⊂ Rn abierto (p > n) y k ≥ 2 ,y sea

Y (x) = (f1(x), . . . , fi(x), xi+1, . . . , xn) para todo x ∈ V y para cierto 1 ≤ i ≤ n.

Supongamos que rango (DY (x0)) = n para cierto x0 ∈ V y que en V , Y es un difeomorsmo de clase Ck−1.

Entonces Y −1 ∈W k,ploc (V ;Rn), donde V = Y (V ) ⊂ Rn.

Demostración. Puesto que Y es un difeomorsmo de clase Ck−1 (k ≥ 2), en particular Y −1 es de clase Ck−1

y podemos escribir

D(Y −1)(y) =[DY (Y −1(y))

]−1para cada y ∈ V . (2.9)

Bastará que probemos que D(Y −1) ∈W k−1,ploc .

Por la expresión (2.9) y la fórmula de la matriz inversa se tiene que

D(Y −1) =

(P1(Df)

P2(Df)

) Y −1

donde P2(Df) = detDY y tanto P1 como P2 son polinomios cuyas variables son las derivadas parcialesdébiles de f .

1. f ∈W k,ploc luego Df ∈W k−1,p

loc y como p > n por el Lema 2.2,

P1(Df), P2(Df) ∈W k−1,ploc .

2. P2(Df) ∈W k−1,ploc es una función que en un entorno de x0 está alejada del 0 y de ∞, entonces compo-

niéndola con la función x→ x−1, que es diferenciable lejos del 0, se sigue que

1

P2(Df)∈W k−1,p

loc .

3. Por los apartados anteriores y aplicando el Lema 2.2 de nuevo llegamos a que

P1(Df)

P2(Df)∈W k−1,p

loc .

4. Finalmente, si componemos con un difeomorsmos de clase Ck−1 (como es el caso de Y −1) se preserva

el hecho de pertenecer al espacio W k−1,ploc por lo que

D(Y −1) =P1(Df)

P2(Df) Y −1 ∈W k−1,p

loc .

36 CAPÍTULO 2. ESPACIOS DE SOBOLEV

Siguiendo con las notaciones del enunciado de este lema anterior podemos escribir

f(Y −1(x)) = (x1, . . . , xi, g(x))

para todo x ∈ V y alguna función g : V → Rm−i. Nos gustaría probar que g ∈W k,ploc (V ,Rm−i). Pero eso será

una consecuencia inmediata de la siguiente proposición que nos da una condición suciente para que unafunción compuesta con una de Sobolev sea de Sobolev.

Proposición 2.2. Sea V ⊂ Rn un conjunto abierto, p > n y k ≥ 1. Si Φ ∈W k,ploc (V ;Rn) es un difeomorsmo

y u ∈W k,ploc (Φ(V )), entonces u Φ ∈W k,p

loc (V ).

Demostración. El caso k = 1 es obvio ya que los difeomorsmos preservanW 1,ploc . Asumiremos pues que k ≥ 2.

Entonces, como ya venimos haciendo al tener p > n se obtiene que Φ ∈ Ck−1(V ,Rn) por lo que Φ es undifeomorsmo de clase Ck−1. También u ∈ Ck−1 ⊂ C1 (k ≥ 2) y entonces utilizando la clásica regla de lacadena,

D(u Φ) = ((Du) Φ) ·DΦ.

Debido a que Du ∈W k−1,ploc (Φ(V );Rn) y Φ es un difeomorsmo de clase Ck−1 se sigue que (Du) Φ ∈

W k−1,ploc (V ,Rn).

Claramente DΦ ∈W k−1,ploc (V ;Rn).

Gracias a estos puntos y aplicando el Lema 2.2 se llega a que D(u Φ) ∈ W k−1,ploc (V ,Rn) y por tanto

u Φ ∈W k,ploc (V ), nalizándose así la demostración.

2.6. Otras normas equivalentes

Esta sección expone resultados que sólo se utilizarán en el Capítulo 4. Se aconseja pues al lector que lodesee, saltarse esta parte y pasar directamente al Capítulo 3 y la demostración del Teorema de Morse-Sardde De Pascale.

En los espacios de Sobolev, así como en cualquier otro espacio de Banach, pueden denirse diferentesnormas. En general las normas ya denidas son las más útiles. Pero puede darse el caso de querer realizarestimaciones de la norma respecto a ciertas cantidades y darse la casualidad de que esas cantidades puedenser vistas como normas del mismo espacio. Poseer un resultado que nos dé formas de obtener otras normasen los espacios de Sobolev, siendo equivalentes a las que usamos normalmente (‖ · ‖Wk,p(Rn)), tiene entoncessu interés.El siguiente Teorema lleva este camino. Consultar Maz'ya [24] (1.1.15).

Teorema 2.15. Sea Ω un conjunto abierto y acotado de Rn con frontera que cumpla la propiedad del cono2

(en particular los intervalos n−dimensionales lo cumplen). Sea S : W k,p(Rn) −→ [0,∞) una seminormacontinua tal que S−1(0) (Pk−1 \0). Es decir para todo polinomio P del espacio Pk−1 se tiene que S(P ) = 0si y sólo si P = 0. Entonces la norma

|||f ||| := ‖Dkf‖Lp(Rn) + S(f), (2.10)

es equivalente a la norma usual de W k,p(Ω).

2 Par ver una denición de este tipo de frontera véase Maz'ya [24]. En particular las fronteras que son C1 o son Lipschitztienen la propiedad del cono.

2.6. OTRAS NORMAS EQUIVALENTES 37

Demostración. Daremos un esquema de la prueba.Lo primero de todo es comprobar que en efecto la expresión (2.10) dene una norma en el espacio deSobolev. Al ser S(·) una seminorma lo único que hay que comprobar es que si ‖Dkf‖L1(Rn) + S(f) = 0 en-tonces f = 0. Pero para que esto sea así los dos sumandos han de ser cero, luego en particular f ha de ser unpolinomio de grado a lo sumo k−1 (ver Corolario 2.14). Por la propiedad que cumple S se sigue que f = 0.

La idea ahora es comprobar que el operador identidad I : (W k,p(Rn), ‖ · ‖Wk,p(Rn))) −→ (W k,p|||·|||

, ||| · |||)

es un isomorsmo topológico, donde W k,p|||·|||

es el completado del espacio (W k,p(Rn) en la norma que da laexpresión (2.10).

Linealidad, inyectividad y continuidad son claras.

Sobreyectividad (ver 1.1.13 de Maz`ya [24]).

La aplicación del Teorema de la Aplicación Abierta naliza la prueba.

38 CAPÍTULO 2. ESPACIOS DE SOBOLEV

Capítulo 3

Teorema de Morse-Sard (De Pascale)

En la demostración que presenta Figalli ([19]) no se demuestra el caso en el que la dimensión del espaciode llegada sea igual a la de salida n = m. Dedicaremos primero un poco de esfuerzo en tratar esta situacióny luego ya damos la prueba del Teorema de More-Sard para el caso n < m.

3.1. Caso n = m

Enunciamos y probamos la siguiente proposición que nos será muy útil a la hora de afrontar el caso en elque n = m en la demostración del Teorema de De Pascale 3.2. Se ha seguido como referencia el artículode Azagra, Ferrera y Gómez-Gil [3]. Otro camino alternativo que podía haberse seguido es utilizar la fórmuladel área para funciones de Sobolev1 (ver [23]), como aconseja el artículo de Figalli.

Proposición 3.1. Sea f : Rn → Rn una función. Denamos

V =

x ∈ Rn : lım sup

h→0

|f(x+ h)− f(x)||h|

<∞

y asumamos que V 6= ∅. Entonces Ln(f(Cf )) = 0.

Demostración. Recordemos la denición de límite superior de una función g : Rn → Rn.

lım supx→0

|g(x)| = lımh→0

(sup|x|<|h|

|g(x)|

)(3.1)

Además en las condiciones de la proposición la denición del conjunto de puntos críticos es la siguiente:

Cf = x ∈ Rn : Df(x) existe y rango(Df(x)) < n .

En primer lugar el teorema de Stepanov nos dice que f es diferenciable para casi todo x ∈ V . Este teoremase puede deducir fácilmente del Teorema de Rademacher, y una prueba se puede encontrar por ejemplo enFederer [18]. De hecho, en la demostración de la propia Proposición 3.1 hay implícita una demostración

1La fórmula del área para funciones de Sobolev puede probarse usando los siguientes hechos:

Por la demostración del Teorema de Morse-Sard veremos que si f ∈ W 1,ploc (Ω;Rn) con p > n y E tiene medida nula

entonces Ln(f(E)) = 0.

La fórmula clásica del área para funciones Lipschitz.

Aproximación estándar de funciones en W 1,p por funciones Lipschitz (ver Evans-Gariepy [17] pág. 254).

39

40 CAPÍTULO 3. TEOREMA DE MORSE-SARD (DE PASCALE)

del teorema de Stepanov.Por otro lado, si Df(x) existe, entonces lımh→0

|f(x+h)−f(x)||h| existe y en particular x ∈ V . Así se tiene que

Cf ⊂ V .

Caso 1: Supondremos primero que f está acotada en Rn, es decir, supx∈Rn |f(x)| = ‖f‖L∞(Rn) <∞.

Denimos Bj = x ∈ Rn : |f(x+ h)− f(x)| ≤ j|h|, ∀h ∈ Rn para cada j ∈ N.Tenemos V =

⋃∞j=1Bj :

(⊆) Dado x ∈ V , por la denición de límite superior, existiráM > 0 y δ > 0 tal que |f(x+h)−f(x)| ≤M |h| para todo |h| ≤ δ. Además por otro lado si |h| ≥ δ entonces podemos obtener la estimación

|f(x+ h)− f(x)| ≤ 2‖f‖∞ ≤ 2‖f‖∞δ |h|. Basta pues con coger j = max

M, 2‖f‖∞

δ

y así se tiene

que x ∈ Bj .

(⊇) Trivial.

Considerando las restricciones f|Bj: Bj → Rn vemos que son Lipschitz de constante j, para cada j ∈ N.

Se conoce ahora que existen extensiones fj : Rn → Rn, de cada f|Bj, que son Lipschitz de constante

j√n para cada j ∈ N respectivamente (véase Evans-Gariepy [17] pág. 80). Indicamos que se podría

conseguir que las constantes de Lipschitz fuesen simplemente j con un argumento algo más complicado(Teorema de Kirszbraun, [18] 2.10.43), pero no nos será necesario este renamiento.Ahora por el Teorema de Rademacher 2.8 cada fj será diferenciable en Rn\Nj con Ln(Nj) = 0. Deigual forma aplicando el Corolario 2.9 a la función distancia d(·, Bj), que es Lipschitz de constante1, se sigue que d(·, Bj) es diferenciable en Rn \Mj con Ln(Mj) = 0.Llamando N :=

⋃∞j=1Nj ∪Mj se tiene pues que

Ln(N) ≤∞∑n=1

Ln(Nj ∪Mj) ≤∞∑n=1

(Ln(Nj) + Ln(Mj)) = 0.

Más aún,Ln(f(N)) = 0. (3.2)

Hay varias maneras de probar esto pero una de ellas se encuentra desarrollada en el paso (a.2) dela demostración del Teorema 3.2. Sin embargo presentamos ahora una demostración alternativa demomento.

I Es claro que N ⊂⋃∞j=1Bj , luego basta que veamos que Ln(f(N ∩Bj)) = 0 para cada j.

Fijemos j ∈ N y ε > 0. Como Ln(N) = 0, para cada i ∈ N existe una sucesión Qiαα de intervalosn-dimensionales con diam (Qiα) ≤ 1

i , N ⊆⋃αQiα , y∑

α

vol(Qiα) ≤ ε

nn/2(j + 1)nα(n)

donde α(n) denota el volumen de la bola unidad de Rn.Denimos ahora

Di =

x ∈ Bj ∩N : f(x+ h) ≥ f(x)− (j + 1)|h| cuando |h| < 1

i

.

Se puede comprobar fácilmente que Di ⊆ Di+1 para cada i, y que Bj ∩N =⋃∞i=1Di.

Sean ahora x, y ∈ Di∩Qiα. Tenemos |f(x)− f(y)| ≤ (j+ 1)|x− y| ≤ (j+ 1)diam (Qiα). Entonces

Ln(f(Di ∩Qiα)) ≤ (j + 1)nnn/2α(n)vol(Qiα).

3.1. CASO N = M 41

Podemos concluir,

Ln(f(Bj ∩N)) = lımi→∞Ln(f(Di)) ≤ lım sup

i→∞

∑α

Ln(f(Di ∩Qiα)) ≤

≤ lım supi→∞

∑α

(j + 1)nnn/2vol(Qiα) ≤ ε.

Ahora basta hacer tender ε −→ 0 y ya tenemos (3.2).

Necesitamos ahora usar la fórmula del área (o de la coárea) (ver Teorema 2.10) para funciones entreespacios de la misma dimensión. En nuestro caso las fj son Lipschitz y si considero los conjuntos

Cj = x ∈ Rn : Dfj(x) existe y rangoDfj(x) < n ∀j ∈ N (3.3)

entonces∫Cj

√det(D(fj(x)) dx = 0, luego

∫Rn H

0(Cj ∩ f−1j (x) dx =

∫fj(Cj)

H0(Cj ∩ f−1j (x) dx = 0. Y

esto último sólo pasa si y sólo siLn(fj(Cj)) = 0. (3.4)

Para acabar viendo que Ln(f(Cf )) = 0 se comprueba fácilmente que bastará que

f(Cf ) ⊆ f(N) ∪∞⋃j=1

fj(Cj).

(Usar (3.2) y (3.4)).Para probar esta inclusión tomemos x ∈ Cf \N . Sabemos que fi y d(·, Ai) son diferenciables en x paracada i ∈ N. Además Cf ⊂ V =

⋃∞i=1Bi, luego existe j ∈ N tal que x ∈ Bj (este j será mi candidato

para que f(x) = fj(x)). Para cada h ∈ Rn se tiene d(x+ h,Bj) ≤ d(x+ h, y) con y ∈ Bj . Así podemoscoger un yh ∈ Bj de manera que d(x+h, yh) esté tan cerca como se quiera de d(x+h,Bj). En particularse puede conseguir que d(x+ h, yh)− d(x+ h,Bj) ≤ d(x+ h,Bj). Recordando que f = fj en Bj y ladenición de Bj ,

|f(x+ h)− fj(x+ h)| ≤ |f(x+ h)− f(yh)|+ |fj(yh)− fj(x+ h)| ≤≤√nj|x+ h− yh|+

√nj|yh − (x+ h)| =

= 2√nj|x+ h− yh| ≤

≤ 4√njd(x+ h,Bj).

Puesto que la función ψj(·) := d(·, Bj) es diferenciable en x y Dψj(x) = 0 se deduce que

|f(x+ h)− f(x)−Dfj(x)(h)| ≤ |f(x+ h)− fj(x+ h)|+ |fj(x+ h)− fj(x)−Dfj(x)(h)| ≤≤ 4√njd(x+ h,Bj) + |Dfj(x)(h) + fj(x)− fj(x+ h)| ≤

≤ 4√nj|ψj(x+ h)− ψj(x)|+ |Dfj(x)(h) + fj(x)− fj(x+ h)| = o(h),

donde en la última línea estamos usando que ψj(x) = 0. Se sigue pues automáticamente que Df(x) =Djf(x). Por hipótesis habíamos tomado x ∈ Cf luego rangoDf(x) = rangoDfj(x) < n, y así x ∈ Cj .En particular fj(x) = f(x) ∈ fj(Cj).

Caso 2: Supongamos ahora que f no está acotada. Para cada j ∈ N denimos

gj(x) =

f(x) si |f(x)| ≤ j

0 otro caso.

42 CAPÍTULO 3. TEOREMA DE MORSE-SARD (DE PASCALE)

Como cada gj es acotada tenemos por el Caso 1 que Ln(gj(Cgj )) = 0. Luego nos bastaría probar lasiguiente inclusión

f(Cj) ⊆∞⋃j=1

gj(Cgj ).

En efecto si x ∈ Cf en particular f es diferenciable en x y existirá un entorno abierto V de x tal quef es acotada ahí. Esto es que existe j = jx tal que f está acotada por j en V y así f = gj en V . Porotro lado Cf ⊆ Cgj trivialmente concluyéndose así lo que se buscaba.

Corolario 3.1. Sea Ω ⊂ Rn abierto acotado y sea f : Ω→ Rn una función en W 1,p(Ω), con p > n. Entoncesel conjunto de valores críticos de f tiene medida de Lebesgue Ln igual a cero.

Demostración. Por el Teorema de Rademacher 2.8 las funciones f ∈ W 1,p(Rn) con n < p ≤ ∞ sondiferenciables para casi todo punto y las derivadas son iguales a las derivadas débiles. Esto implica que Ω∩Vsea no vacío (V denido como en la proposición anterior) y por la Proposición 3.1 anterior se concluye queLn(f(Cf )) = 0.

3.2. Teorema de Morse-Sard

Teorema 3.2. (Teorema de De Pascale) Sea Ω ⊂ Rn abierto y sea f : Ω → Rm una función en el espacioWn−m+1,ploc (Ω;Rm) con p > n ≥ m. Entonces el conjunto de valores críticos de f tiene medida de LebesgueLm igual a cero.

Demostración. (Prueba de Figali [19], 2008)Observación: Puesto que tenemos la inclusión continua Wn−m+1,p(Ω;Rm) → Cn−m,α(p)(Ω;Rm) siemprenos referiremos al representante del espacio Cn−m,α(p)(Ω;Rm) (véase Corolario 2.11).

Por la denición de Wn−m+1,ploc (Ω;Rm) es claro que es suciente probar el Teorema para f restringida a

cada subconjunto compacto de Ω. Por este motivo se puede suponer directamente que Ω es acotado y quef ∈Wn−m+1,p(Ω;Rm).

Para simplicar la notación denimos k := n −m + 1. Indicamos que en el caso n = m el resultado essimplemente el Corolario 3.1. A partir de ahora entonces se asumirá que n > m, o lo que es lo mismo k ≥ 2.Este hecho hace que en particular el conjunto de puntos críticos está bien denido pues el representante quehemos tomado sería del espacio Ck−1,α(p)(Ω;Rm) ⊆ C1(Ω;Rm).Denimos ahora los conjuntos

As :=x ∈ Ω : Dif(x) = 0 para 1 ≤ i ≤ s

1 ≤ s ≤ n−m

yK := x ∈ Ω : 1 ≤ rangoDf(x) ≤ m− 1 .

Se tiene que An−m ⊂ An−m−1 ⊂ · · · ⊂ A2 ⊂ A1 y además podemos ver el conjunto de puntos críticos de lasiguiente manera

Cf = K ∪A1 = K ∪

n−m−1⋃j=1

(Aj \Aj+1) ∪An−m

que es una unión disjunta (si n = m+ 1 simplemente Cf = K ∪A1).Dividiremos la prueba en tres pasos:

3.2. TEOREMA DE MORSE-SARD 43

Paso 1: Veremos que siempre podemos asumir K = ∅, es decir, que Cf = x ∈ Ω : Df(x) = 0 =A1 =

⋃n−m−1j=1 (Aj \Aj+1) ∪An−m.

Paso 2: Veremos que Lm(f(An−m)) = 0. Si tuviéramos n = m + 1, habríamos concluido la pruebapues Cf = K ∪A1 = K ∪An−m.

Paso 3: Gracias al paso 2 podemos comenzar un argumento de inducción sobre n−m, empezando lainducción con n−m = 12. Se asumirá que se cumple el teorema para funciones en Wn−m,k(V ;Rm) conV ⊂ Rn−1 abierto. Entonces gracias al Teorema de la Función Implícita y al Teorema de Kneser-Glaeserse reducirá la dimensión de n a n− 1 y se habrá concluido la prueba por la hipótesis de inducción.

1. (Paso 1: podemos asumir K = ∅)Tenemos que K =

⋃m−1i=1 Ki donde

Ki = x ∈ Ω : rangoDf(x) = i para cada 1 ≤ i ≤ m− 1.

Cada Ki es compacto (es cerrado y está en Ω que es acotado). Fijemos i = 1, . . . ,m − 1 y tomemosx ∈ Ki.Probaremos que

Existe un entorno abierto V x de x tal que Lm(f(V x ∩Ki

))= 0. (3.5)

Por otro lado cogiendo todos los x ∈ Ki y considerando los V x correspondientes tenemos que Ki ⊆⋃x∈Ki

(V x ∩Ki

). Entonces hay un subrecubrimiento nito y así por (3.5) y por la aditividad de la

medida de Lebesgue se concluirá que Lm(f(Ki)) = 0 y en consecuencia que Lm(f(K)) = 0.Comprobemos (3.5):

Por la denición de Ki, Df(x) tiene un menor de orden i no nulo y reordenando las coordenadas y lascomponentes de f(x) = (f1(x1, . . . , xn), . . . , fm(x1 . . . , xn)) podemos suponer que

det

(∂(f1, . . . , fi)

∂(x1, . . . , xi)(x)

)= det

∂f1∂x1

(x) · · · ∂f1∂xi

(x)...

. . ....

∂fi∂x1

(x) · · · ∂fi∂xi

(x)

6= 0.

Sea puesY (x) = Y (x1, . . . , xn) = (y1 . . . , yn) := (f1(x), . . . , fi(x), xi+1, . . . , xn).

Y es de clase Ck−1 pues cada componente de f lo es. También rangoDY (x) = n por lo que existiráun pequeño entorno V x = V de x donde Y será un Ck−1-difeomorsmo. Llamemos Y (V ) = V .Consideramos también X = Y −1 y entonces

f(X(y)) = (y1, . . . , yi, g(y1, . . . , yn))

siendo g : Rn → Rm−i una función. Necesitamos ahora usar dos hechos fundamentales.

(a) X ∈W k,p(V ,Rn

). Utilícese Proposición 2.1.

(b) g ∈W k,p(V ,Rm−i

). Es consecuencia inmediata de la Proposición 2.2.

2No se puede comenzar la inducción en n−m = 0. Como se verá en el desarrollo del paso 3 se necesitará aplicar el Teoremade la Función Implícita a una derivada parcial de orden uno, pero esto no se puede hacer si n −m = 1 (o k = 2) porque bajonuestras hipótesis la función está en W 2,p y su derivada parcial de orden uno tendrá derivada débil, pero no clásica.

44 CAPÍTULO 3. TEOREMA DE MORSE-SARD (DE PASCALE)

Por lo tanto en estas coordenadas

D(f X)(y) =

(Idi 0∗ D(g|(y1,...,yi))(y)

),

donde g|(y1,...,yi) : V(y1,...,yi) → Rm−i se dene por g|(y1,...,yi)(yi+1, . . . , yn) = g(y1, . . . , yn), con V(y1,...,yi) =(z1, . . . , zn−i) ∈ Rn−i : (y1, . . . , yi, z1, . . . , zn−i) ∈ V

3. Puesto que X = Y −1 es un difeomorsmo el

rango de D(f X) coincide con el de Df que es i, luego se ha de tener que D(g|(y1,...,yi)) = 0 en

V(y1,...,yi) ∩ πn−i(Y (Ki))4.

Observemos también

(c) Gracias al Teorema sobre secciones de Sobolev (véase Teorema 2.12) y usando que sabemos

que g ∈W k,p(V ;Rm−i

)se sigue que g|(y1,...,yi) ∈W k,p

(V(y1,...,yi);R

m−i)para Li-casi todo punto

(y1, . . . , yi).

Es decir, g|(y1...,yi) : V(y1,...,yi) → Rm−i satisface las hipótesis del Teorema siendo el conjunto de puntos

críticos Cg|(y1,...,yi)= V(y1,...,yi) ∩ πn−i(Y (Ki)) y siendo

z ∈ V(y1,...,yi) : 1 ≤ rangoDg|(y1,...,yi)(z) ≤ m− i

= ∅.

Por tanto si suponemos que se ha probado el teorema para el caso K = ∅ se tendría que

Lm−i(g|(y1,...,yi)

(V(y1,...,yi) ∩ π

n−i(Y (Ki))))

= 0 para casi todo (y1, . . . , yi) ∈ Ri. (3.6)

Entonces aplicando el Teorema de Fubini,

Lm(

(f X)(V ∩ Y (Ki)))

=

∫(fX)(V ∩Y (Ki))

1 dy1 . . . dym =

=

∫V(yi+1,...,yn)∩πi(Y (Ki))

(∫g|(y1,...,yi)(V(y1,...,yi)∩π

n−i(Y (Ki)))1 dyi+1 . . . dym

)dy1 . . . dyi =

=

∫V(yi+1,...,yn)∩πi(Y (Ki))

0 dy1 . . . dyi = 0.

Luego Lm(

(f X)(V ∩ Y (Ki)))

= Lm (f (V ∩Ki)) = 0, obteniéndose de esta forma (3.5).

2. (Paso 2: Lm(f(An−m)) = 0)Sea x ∈ An−m = Ak−1 y sea r > 0 tal que B(x, r) ⊂ Ω. Por hipótesis f ∈ W k,p(Ω;Rm), luegoDk−1f ∈W 1,p(Ω;Rm). Usando primero la fórmula integral del desarrollo de Taylor (todos los términosson cero excepto el resto que lo presentamos en su forma integral) y después la Desigualdad de

3Con V(yi+1,...,yn) nos referiremos al conjunto

(z1, . . . , zi) ∈ Ri : (z1, . . . , zi, yi+1, . . . , yn) ∈ V.

4πn−i denota la proyección sobre las n− i últimas coordenadas. Y por otro lado πi denota la proyección sobre las i primerascoordenadas.

3.2. TEOREMA DE MORSE-SARD 45

Morrey 2.6 se tiene que para y ∈ B(x, r),

|f(x)− f(y)| ≤∫ 1

0

(1− t)k−2

(k − 2)!|Dk−1f(x+ t(y − x))−Dk−1f(x)||y − x|k−1 dt ≤

≤∫ 1

0

(1− t)k−2

(k − 2)!Cr

k−np

(∫B(x,r)

|Dkf(z)|p dz

)1/p

dt =

= C1

(n−m)!rk−n

p

(∫B(x,r)

|Dkf(z)|p dz

)1/p

= Crk−n

p

(∫B(x,r)

|Dkf(z)|p dz

)1/p

.

(3.7)

Elevamos a m esta expresión y usamos la desigualdad de Young5 con exponentes pp−m y p

m . Ademásconsideramos r = |x− y|. Entonces

|f(y)− f(x)|m ≤ C|x− y|p

p−mm(k−np

)+ C

(∫B(x,r)

|Dkf(z)|p dz

).

Como k = n−m+ 1 y m(k − 1) ≥ k − 1 se sigue que km ≥ k +m− 1 = n. Por otro lado

pm

p−m(k − n

p) =

p

p−m(mk − mn

p) ≥ p

p−m(n− mn

p) =

pn−mnp−m

=n(p−m)

p−m= n.

Si suponemos entonces que |y − x| = r ≤ 1 tenemos que |x − y|pmp−m (k−n

p) ≤ rn y por consiguiente,

recordando la expresión del volumen de la bola n−dimensional de radio r, podemos escribir

|f(y)− f(x)|m ≤ Crn + C

(∫B(x,r)

|Dkf(z)|p dz

)≤ CLn(B(x, r)) + C

(∫B(x,r)

|Dkf(z)|p dz

)

≤ C

(∫B(x,r)

(1 + |Dkf(z)|p

)dz

).

Resumiendo todo esto podemos realizar la siguiente armación, que nos será extremadamente útil:

|f(y)− f(x)|m ≤ C

(∫B(x,r)

(1 + |Dkf(z)|p

)dz

)para todo x ∈ An−m, y ∈ Ω

con r = |x− y| tal que B(x, r) ⊂ Ω. (3.8)

Escribimos ahora An−m = F1 ∪ F2 donde

F1 := puntos de densidad de An−m ∩puntos de Lebesgue de |Dkf |p

y

F2 := An−m \ F1

Deberemos probar que tanto f(F1) como f(F2) tienen medida de Lebesgue Lm nula. Emplearemosmétodos diferentes para cada caso.

5Desigualdad de Young: Si 1 < r, q < ∞ y 1r

+ 1q

= 1 entonces para todo a, b ≥ 0 y ε > 0 se tiene ab ≤ εar + C(ε)bq

donde C(ε) = (εr)−q/rq−1.

46 CAPÍTULO 3. TEOREMA DE MORSE-SARD (DE PASCALE)

(a) Lm(f(F2)) = 0.

(a.1) Ln(F2) = 0.

Esto es inmediato por las deniciones de punto de densidad de un conjunto y de puntos deLebesgue de una función.Por un lado, el ser punto de densidad para el conjunto Ln-medible An−m signica que

lımr→∞

Ln(B(x, r) ∩An−m)

Ln(B(x, r))= 1.

y es una propiedad que se cumple para Ln − casi todo x ∈ An−m (ver preliminares, sección1.4). Luego existe N ⊆ An−m, con Ln(N) = 0, tal que ptos dens. de An−m = An−m \N .Por otro lado, el ser punto de Lebesgue de |Dkf |p se cumple para Ln-casi todo punto. Asíexiste M con Ln(M) = 0 de manera que para todo x ∈ An−m \M , x es punto de Lebesguede |Dkf |p.La conclusión de estos dos hechos es que

F1 = puntos de densidad de An−m ∩puntos de Lebesgue de |Dkf |p

=

= An−m \N ∩ An−m \M = An−m \ (N ∪M) ,

y por lo tanto

Ln(F2) = Ln (An−m \ F1) = Ln (N ∪M) = 0

como se pretendía.

(a.2) Como F2 ⊆ Ω es un subconjunto medible tal que Ln(F2) = 0 entonces Lm(f(F2)) = 0.

Fijemos ε > 0 pequeño. Se tiene Ln(F2) = 0, luego existe un conjunto abierto Eε ⊃ F2 talque Eε ⊂ Ω y Ln(Eε) ≤ ε. Para cada x ∈ F2 tomemos una bola Bx = B(x, rx) tal queBx ⊂ Eε. Denimos ρx := diamf(Bx) = sup |z − y| : z, y ∈ f(Bx). Ahora nos gustaríaaplicar el Lema del Recubrimiento de Vitali 1.1 con el recubrimiento de f(F2) dadopor F = B(f(x), ρx)x∈F2

(sin pérdida de generalidad supondremos que ρx ≤ 1). La únicahipótesis que requiere este Lema es que

supx∈F2

ρx <∞. (3.9)

Podremos suponer en general que f es acotada en Ω. En efecto, escribimos Ω =⋃∞j=1Gj

con Gj =x ∈ Ω : d(x,Rn \ Ω) ≤ 1

j , |x| ≤ j

= Ωj compactos. Tenemos que f(Cf∩Ω) =⋃∞j=1 f(Cf ∩ Ωj). Como f es continua, f |Ωj es acotada y entonces podrá suponerse sin

pérdida de generalidad (por la subaditividad de la medida de Lebesgue) que Ω = Ωj talque f es acotada en Ω.Veamos ahora que supx∈F2

ρx <∞:

Supongamos que existe (xn)n≥1 ⊂ F2 tal que ρxn −−−→n→∞∞. Es decir existen yn, zn ∈

Bxn = B(xn, rxn) ⊂ Eε tales que |f(yn)− f(zn)| −−−→n→∞

∞. Luego o bien |f(yn)| −−−→k→∞

∞o bien |f(zn)| −−−→

k→∞∞. Pero esto es una contradicción con nuestra hipótesis de que f es

acotada.

3.2. TEOREMA DE MORSE-SARD 47

Podemos entonces aplicar el Lema del Recubrimiento de Vitali que nos dice que existeG = B(f(xi), ρxi)i∈I una colección nita o contable de bolas disjuntas de manera que

F2 ⊂⋃i∈I

B(f(xi), 5ρxi).

-Observación: f(Bxi) ⊂ B(f(xi), ρxi).En efecto, supongamos f(x) ∈ f(Bxi). Como claramente se tiene que f(xi) ∈ f(Bxi),por la denición de ρxi se sigue automáticamente que |f(x) − f(xi)| ≤ ρxi . Luego f(x) ∈B(f(xi), ρxi).

La consecuencia de esto es que las bolas Bxi son disjuntas. Si existiesen i, j ∈ I i 6= j talesque Bxi ∩Bxj 6= ∅ entonces f(Bxi)∩ f(Bxj ) 6= ∅, pero entonces por la observación se seguiríaque B(f(xi), ρxi) ∩ B(f(xj), ρxj ) 6= ∅, contradiciéndose que la familia G dada por el Lemadel Recubrimiento de Vitali era disjunta.Se obtiene ahora que por (3.8) (recuérdese que x ∈ F2 ⊆ An−m y ρxi ≤ 1 ∀i ∈ I),

Lm(f(F2)) ≤∑i∈ILm(B(f(xi), 5ρxi)) = 5mLm(B(0, 1))

∑i∈I

(diamf(Bxi))m ≤

≤ 5mLm(B(0, 1))∑i∈I

∫Bxi

(1 + |Dkf(z)|p

)dz ≤

≤ 5mLm(B(0, 1))

∫Eε

(1 + |Dkf(z)|p

)dz

Si hacemos tender ε→ 0, como Ln(Eε) ≤ ε, se obtiene lo que se pretendía Ln(f(F2)) = 0.

(b) Lm(f(F1)) = 0.

En este caso no se tiene Ln(F1) = 0 en general por lo que no se puede razonar como en el casoanterior. En lugar de eso aprovecharemos el hecho de que F1 está formado por puntos de densidady de Lebesgue para obtener otras estimaciones sobre |f(y) − f(x)|, que realmente serán mejoresque las del caso (a). Para nalizar el argumento se usarán estas estimaciones junto con el Lemadel Recubrimiento de Vitali de una manera parecida al caso (a).

Fijemos P ∈ N grande y sea x ∈ F1.

Como x es un punto de densidad para An−m se tiene que

lımr→0

Ln(B(x, r) ∩An−m)

Ln(B(x, r))= 1.

Puesto que ya sabemos que Ln(F2) = 0 es claro que

Ln(B(x, r) ∩An−m) = Ln ((B(x, r) ∩ F1) ∪ (B(x, r) ∩ F2) = Ln(B(x, r) ∩ F1)

Por lo tanto podemos coger un r1x > 0 sucientemente pequeño para que B(x, 2r1

x) ⊂ Ω y

Ln(B(x, r) ∩ F1)

Ln(B(x, r))≥ 1− 1

2(2P )n≥ 1

2(3.10)

48 CAPÍTULO 3. TEOREMA DE MORSE-SARD (DE PASCALE)

Como x es punto de Lebesgue de |Dkf |p ∈ L1(Ω;Rm) entonces

lımr→0−∫B(x,r)

|Dkf(z)|p dz = |Dkf(x)|p.

Podemos entonces coger r2x > 0 sucientemente pequeño para que B(x, 2r2

x) ⊂ Ω y poderescribir

−∫B(x,2r2x)

(1 + |Dkf(z)|p

)dz ≤ 2

(1 + |Dkf(x)|p

). (3.11)

También podemos coger un r3x > 0 sucientemente pequeño tal que

1

2

(1 + |Dkf(x)|p

)≤ −∫B(x,r3x)∩F1

(1 + |Dkf(z)|p

)dz. (3.12)

Para que se cumplan las tres desigualdades obtenidas a la vez tomaremos rx = mınr1x, r

2x, r

3x

,

cumpliéndose también que B(x, 2rx) ⊂ Ω. Tenemos por tanto la siguiente propiedad: si x ∈ F1,entonces ∫

B(x,2rx)

(1 + |Dkf(z)|p

)dz = 2nLn(B(x, rx))−

∫B(x,2rx)

(1 + |Dkf(z)|p

)dz ≤

≤︸︷︷︸(3.11)

2n+1Ln(B(x, rx))(

1 + |Dkf(x)|p)≤

≤︸︷︷︸(3.10)

2n+2Ln(B(x, rx) ∩ F1)(

1 + |Dkf(x)|p)≤

≤︸︷︷︸(3.12)

2n+3

∫B(x,rx)∩F1

(1 + |Dkf(z)|p

)dz. (3.13)

Además para cada y ∈ B(x, rx) existen P + 1 puntos x0, . . . , xP con x0 = y, xP = x tales quex1, . . . , xP ⊂ F1 y también

|xi − xi−1| ≤2rxP∀1 ≤ i ≤ P.

Esto se puede conseguir de la siguiente manera:Tomar primero y1 . . . , , yP−1 puntos del segmento [y, x] tales que |yi−yi−1| = |y−x|

P , ∀2 ≤ i ≤ P−1.Observaciones:

- B(yi,

rx2P

)⊂ B(x, rx) para cada 1 ≤ i ≤ P − 1.

Sea z ∈ B(yi,

rx2P

)entonces |z − yi| ≤ rx

2P . Por otro lado podemos escribir |yi − x| = i|y−x|P .

Así se concluye que

|z − x| ≤ |z − yi|+ |yi − x| ≤rx2P

+i|y − x|P

≤ rx2P

+irxP

=

(i+

1

2

)rxP< rx

- Ln(B(yi,

rx2P

)∩ F1

)> 0 para cada 1 ≤ i ≤ P − 1.

Por reducción al absurdo supongamos que Ln(B(yi,

rx2P

)∩ F1

)= 0.

(1o) Ln (B (x, rx) ∩ F1) = Ln((B(x, rx) \B

(yi,

rx2P

))∩ F1

).

3.2. TEOREMA DE MORSE-SARD 49

(2o) Usando (3.10) se sigue

Ln (B(x, rx) ∩ F1) ≥ Ln(B(x, rx))− 1

2

(1

2P

)nLn(B(x, rx)) =

= Ln(B(x, rx))− 1

2Ln(B(yi,

rx2P

))>

> Ln(B(x, rx) \B

(yi,

rx2P

))Por (1o) y (2o) tenemos que

Ln((B(x, rx) \B

(yi,

rx2P

))∩ F1

)> Ln

(B(x, rx) \B

(yi,

rx2P

)).

Pero esto es una contradicción porque((B(x, rx) \B

(yi,

rx2P

))∩ F1

)⊂(B(x, rx) \B

(yi,

rx2P

)).

Podemos entonces tomar xi ∈ B(yi,

rx2P

)∩ F1 para cada 1 ≤ i ≤ P − 1 (se puede comprobar que

se tiene |xi − xi−1| ≤ 2rxP ). Por esto y por (3.7) se sigue que para todo y ∈ B(x, rx),

|f(x0)− f(xP )| = |f(y)− f(x)| ≤P∑i=1

|f(xi)− f(xi−1)| ≤

≤P∑i=1

C|xi − xi−1|k−np

(∫B(xi, 2rxP )

|Dkf(z)|p dz

)1/p

≤ CP∑i=1

(2rxP

)k−np

(∫B(x,2rx)

|Dkf(z)|p dz

)1/p

=

= CP

(1−k+n

p

)(2rx)

k−np

(∫B(x,2rx)

|Dkf(z)|p dz

)1/p

.

Elevando todo a m y aplicando la desigualdad de Young con exponentes pp−m y p

m conseguimos

(obsérvese que CP

(1−k+n

p

)es independiente de x e y, luego se entiende como constante)

|f(y)− f(x)|m ≤ CPm(

1−k+np

) ∫B(x,2rx)

(1 + |Dkf(z)|p

)dz ∀y ∈ B(x, rx).

Se está cogiendo un rx pequeño para que 2rx ≤ 1 y el hecho de que n ≤ m(k − np ) p

p−m .Usando ahora (3.13) se obtiene que para todo x ∈ F1,

|f(y)− f(x)|m ≤ CPm(

1−k+np

) ∫B(x,rx)∩F1

(1 + |Dkf(z)|p

dz ∀y ∈ B(x, rx). (3.14)

(Recordamos que en C se meten todas las contantes que dependan de n y de p).

Podemos ya por n pasar a probar que Lm(f(F1)) = 0, que será en parte análoga a la del casode F1.Para cada x ∈ F1 sea Bx = B(x, rx) donde rx se denió anteriormente. Denimos tambiénρx := diamf(Bx∩F1) y consideramos el recubrimiento de f(F1) dado por F = B(f(x), ρx)x∈F1

.Usamos, como en el caso de F2, el Lema del Recubrimiento de Vitali que nos da la existenciade G = B((f(xi), ρxi)i∈I una familia nita o contable de bolas disjuntas de F tal que

F1 ⊂⋃i∈I

B(f(xi), 5ρxi).

50 CAPÍTULO 3. TEOREMA DE MORSE-SARD (DE PASCALE)

El lector puede comprobar de manera simple que de nuevo, al igual que para el caso de F2, pode-mos aplicar el Lema puesto que supx∈F1

ρx <∞, usando que f está acotada.-Observación: f(Bxi ∩ F1) ⊂ B(f(xi), ρxi)).

La consecuencia de esto es que los conjuntos Bxi ∩ F1 son disjuntos. Se obtiene ahora por (3.14)y razonando como en el caso (a) que

Lm(f(F1)) ≤∑i∈ILm (B(f(xi), 5ρxi)) = 5mLm(B(0, 1))

∑i∈I

(diamf(Bxi ∩ F1))m ≤

≤ 5mLm(B(0, 1))CPm(

1−k+np

)∑i∈I

∫Bxi∩F1

(1 + |Dkf(z)|p

)dz ≤

≤ CPm(

1−k+np

) ∫Ω

(1 + |Dkf(z)|p

)dz

Concluimos el argumento haciendo tender P a innito y usando que k ≥ 2 > 1 + np .

3. (Paso 3: Lm (f(As−1 \As)) = 0 para 2 ≤ s ≤ k − 1)

Como ya se dijo, por inducción se supondrá que el Teorema es cierto para funciones f : W → Rm conW ⊂ Rn−1 abierto, f ∈Wn−m,p y p > n− 1 ≥ m.

Sea x ∈ As−1 \ As para cierto s = 2, . . . , k − 1. Para probar el resultado bastará mostrar que existeun entorno abierto V de x tal que Lm (f((As−1 \As) ∩ V )) = 0. Recordemos que siempre estamosconsiderando el representante f ∈ Ck−1,α(p)(Ω,Rm).El hecho de que x ∈ As−1 y la denición de As−1 nos dicen que todas las derivadas parciales de ordens− 1 de f son cero en x. Sin embargo x no está en As luego existirá alguna derivada parcial de ordens de f que no es cero. Podemos suponer entonces sin pérdida de generalidad que

∂n∂i1 , . . . , ∂is−1f(x) 6= 0, ∂i1 , . . . , ∂is−1f(x) = 0.

Llamemos w(x) := ∂i1 , . . . , ∂is−1f(x). Sabemos que w ∈ Ck−s,α(p)(Ω;Rm) ⊂ C1(Ω;Rm), luego podemosusar el Teorema de la Función Implícita: existe un entorno abierto V de x tal que V ∩ w = 0es un grafo (n − 1)−dimensional y de clase Ck−s,α(p). Esto es que existe g ∈ Ck−s,α(p)(W,Rn) cong(W ) = V ∩ w = 0, donde W ⊂ Rn−1 es un abierto.Se tiene en particular que V ∩As−1 ⊂ g(W ). Denimos ahora el subconjunto

A∗ := x ∈W : g(x) ∈ As−1 ⊂W.

Comprobemos que estamos en las hipótesis para utilizar el Teorema de Kneser-Glaeser 1.3:

W ⊂ Rn−1 y V ⊂ Rn son abiertos con A∗ ⊂ W y As−1 ⊂ V . Además As−1 es cerrado y A∗ escerrado relativo a W .

f : V → Rm de clase Ck−1 en V y (s− 1)-plana en As−1.

g : W → V de clase Ck−s con g(A∗) ⊂ As−1.

El teorema nos dice entonces que hay una función F : W → Rm de clase Ck−1 tal que

a) F (x) = f(g(x)) para todo x ∈ A∗.b) F es (s− 1)-plana en A∗. En particular, como s ≥ 2, DF (x) = 0 con x ∈ A∗.

3.2. TEOREMA DE MORSE-SARD 51

Denotamos por CF el conjunto de puntos críticos de F y comprobemos que se tiene que

f(As−1 ∩ V ) ⊂ F (CF ∩W ). (3.15)

Sea x ∈ (As−1 ∩ V ) y como se tenía que As−1 ∩ V ⊂ g(W ), existirá z ∈ W con g(z) = x. Enparticular ese z satisface que g(z) ∈ As−1 y por la denición de A∗ se sigue que z ∈ A∗. Por b) en-tonces z ∈ CF . Y resumiendo todo lo anterior tenemos que hemos encontrado un z ∈ CF ∩W tal quef(x) = f(g(z)) = F (z), por lo que (3.15) queda probado.

Basta probar para nalizar este último paso que Lm(F (CF ∩W )) = 0. Pero esto es inmediato utilizandola hipótesis de inducción. El hecho que permiten aplicar la inducción son los siguientes:

F es una función de clase Ck−1 y por tanto W k−1,p(= Wn−m) que va de un abierto W ⊂ Rn−1 aRm. Además p > n > n− 1.

52 CAPÍTULO 3. TEOREMA DE MORSE-SARD (DE PASCALE)

Capítulo 4

Teorema de Morse-Sard(Bourgain-Korobkov-Kristesen)

Todo este capítulo está dedicado a demostrar el Teorema de Morse-Sard para el espacio de funcionesWn,1(Rn;R). De ahora en adelante simplemente escribimos Wn,1(Rn) sabiendo que el espacio de llegada essiempre R.

Las secciones 4.1, 4.2, 4.3, 4.4 recogen todo tipo de resultados previos a la demostración del Teorema.Quizás cabe destacar cuatro de estos resultados que conforman la base de la prueba que dan Bourgain,Korobkov y Kristesen en [8].

1. Estimación de los valores cercanos a los críticos de polinomios (sección 4.1).

2. Integrales de Choquet de funciones maximales de Hardy-Littlewood con respecto al contenido Hausdor(sección 4.2).

3. Propiedad de tipo Luzin para el espacio W l,1(Rn) (sección 4.3).

4. Versiones avanzadas del Teorema de inclusiones de Sobolev (sección 4.4).

4.1. Valores cercanos a los críticos de polinomios

La referencia básica para el desarrollo de esta sección es el artículo de Yomdin [31], teniendo como objetivodemostrar el Teorema 1.6 del artículo de Bourgain-Korobkov-Kristensen [8].

Una bien conocida y extendida propiedad de los valores críticos de funciones diferenciables es, como quedade maniesto a lo largo del trabajo, el Teorema de Morse-Sard.Sin embargo en muchos casos aplicar el Teorema de Morse-Sard no da resultados satisfactorios por diversasrazones:

En primer lugar, las consecuencias del teorema son mayormente cualitativas (tras una pequeña pertur-bación se puede conseguir que el rango de la diferencial sea máximo). Pero nos gustaría conocer cómo degrande ha de ser esa perturbación si queremos que los valores de la diferencial sean más pequeños que ciertasconstantes dadas. Para este tipo de conclusiones se necesita una cota superior para la medida no sólo de losvalores críticos sino de los valores cercanos a los críticos. Relacionado con este tema aquí daremos un resul-tado válido para polinomios. Esto es esencial para la demostración de la versión del Teorema de Morse-Sard

53

54 CAPÍTULO 4. TEOREMA DE MORSE-SARD (BOURGAIN-KOROBKOV-KRISTESEN)

de Bourgain-Korobkov-Kristensen (sección 4.5).

En segundo lugar, la propiedad de tener medida de Lebesgue cero es demasiado débil. En muchas ocasio-nes se conoce mucho más sobre los valores críticos, como que son subvariedades diferenciales de dimensionesadecuadas.

Para dar nuestro resultado necesitamos primero introducir la noción de valores cercanos a los críticos.Se dene primero el conjunto cercano al crítico como el conjunto de puntos donde el valor de la diferencialtiene norma menor que ciertas constantes dadas. Los valores cercanos a los críticos serán la imagen de esteconjunto cercano al crítico.

Denición 4.1. Dado un conjunto A ⊂ Rn y un número λ > 0 entonces llamaremos Ent(λ,A) al menornúmero de bolas de radio λ que recubren A.

-Nota: El logaritmo de este número se llama la λ-entropía del conjunto ( de ahí el nombre). Este conceptolo introdujo por primera vez Kolmogorov en el 1956, y resultó ser muy útil en diversas cuestiones relativas afunciones diferenciables. Tal es su importancia, que en toda la literatura posterior sobre el estudio de valorescríticos de funciones diferenciables se comprueba que la entropía es una noción más adecuada y más fuerteque las nociones de medida de Lebesgue y de medida Hausdor.Fijaremos para el resto del capítulo una bola B ⊂ Rn de radio r > 0 y un polinomio P : Rn −→ R de gradocomo mucho k.Para cada ε > 0 denimos el conjunto de valores cercanos a los críticos de P ,

Σ(ε) := x ∈ B : |DP (x)| ≤ ε .

Denición 4.2. Un conjunto A ⊂ Rn se dice semialgebraico si se puede representar como unión e intersec-ción de un número nito de conjuntos de la forma g = 0 , h > 0 donde g, h son polinomios en Rn.Llamaremos diagrama de A al conjunto de fórmulas que representan al conjunto junto con la dimensión delespacio ambiente n y el grado de los polinomios que intervienen en la representación.

Claramente Σ(ε) es un conjunto semialgebraico.

Proposición 4.1. Sea A ⊂ Rn un conjunto semialgebraico. Sean x, y ∈ A y supongamos que ambos estánen la misma componente conexa de A. Entonces x, y pueden ser unidos en A por un camino semialgebraicode longitud no más grande que C1r, donde C1 depende del diagrama de A.

Proposición 4.2. (Versión del Teorema de Seidenber-Tarski [11]) Sea A ⊂ Rn un conjunto semialgebraicoy P : Rn −→ R polinomio de grado k. Entonces P (A) es un conjunto semialgebraico en R y su diagramasólo depende del diagrama de A.

Tenemos gracias a este último resultado que P (Σ(ε)) es un conjunto semialgebraico.Además los conjuntos semialgebraicos tienen un número de componentes conexas controlado.

Proposición 4.3. El número de componentes conexas de un conjunto semialgebraico A ⊂ Rn está acotadopor una constante C2 que sólo depende del diagrama de A.

Para el lector interesado en las demostraciones de estos resultados sobre conjuntos semialgebraicos, lasreferencias [26] y [30] pueden servir de ayuda.

Con toda esta información podemos probar el siguiente teorema y un corolario inmediato suyo, el cualserá el que utilicemos más adelante.

4.2. APROXIMACIÓN POR POLINOMIOS DE FUNCIONES L1 55

Teorema 4.1. Existen constantes A0 y A1, dependientes sólo de n y de k tales que para todo polinomioP : Rn −→ R de grado k y para todo r > 0, λ > 0 y ε > 0,

Ent(λ, P (Σ(ε))) ≤ A0 +A1ε( rλ

).

Demostración. El número de componentes conexas de Σ(ε) está acotado por una constante C2 que dependesólo de n y k (Proposición 4.3). Tomamos x, y ∈ P (Σ(ε)) en la misma componente conexa y sean x, y ∈ Σ(ε)tales que P (x) = x y P (y) = y. Entonces x e y están en la misma componente conexa de Σ(ε) y por laProposición 4.1 existirá un camino semialgebraico s que los une de longitud menor o igual que C1r (C1

sólo depende de n y de k). Así,

|P (x)− P (y)| = |∫sDP (z) dz| ≤ ε · long(s) ≤ εC1r.

Como P (Σ(ε)) esta recubierta por a lo sumo C2 componentes conexas, podremos recubrir el conjunto totalpor no más de C2(1 + εC1

rλ) intervalos de longitud λ. Esto es, existe un recubrimiento de P (Σ(ε)) ⊂ R por

no más deC2

2(1 + εC1

r

λ) = A0 +A1ε

( rλ

)bolas de radio λ.

Corolario 4.2. Para todo polinomio P : Rn −→ R de grado como mucho k, para toda bola B ⊂ Rn de radior > 0 y para todo ε > 0 se tiene que

Ent(εr, P (Σ(ε))) ≤ C

donde la constante C sólo depende de n y de k.

Demostración. Basta tomar λ = εr en el Teorema 4.1 anterior.

4.2. Aproximación por polinomios de funciones L1

Presentamos primero un resultado sobre integrales de Choquet de funciones maximales de Hardy-Littlewoowcon respecto al contenido Hausdor. De nuevo se trata de un resultado que juega un papel importante en laversión que daremos del teorema de Morse-Sard en el espacio de Sobolev Wn,1(Rn).A lo largo del presente capítulo trabajaremos con la función maximal usual de Hardy-Littlewood, que sedenía como sigue:

Denición 4.3. El operador maximal de Hardy-Littlewood es un operador no lineal que manda funcionesintegrables f ∈ L1(Rn) en

Mf(x) = supr>0

r−n∫B(x,r)

|f(y)| dy

El Teorema que enunciamos a continuación nos estima la integral (en el sentido de Choquet) de funcionesmaximales de Hardy-Littlewood con respecto al contenido Hausdor.

Teorema 4.3. Si f ∈W k,1(Rn), donde k ∈ 1, . . . , n− 1, entonces∫ ∞0Hn−k∞ (x ∈ Rn : Mf(x) ≥ λ) dλ ≤ C

∫Rn|∇kf(y)| dy,

donde C depende sólo de n y k.

56 CAPÍTULO 4. TEOREMA DE MORSE-SARD (BOURGAIN-KOROBKOV-KRISTESEN)

Una demostración completa de este resultado se puede encontrar en el artículo de Adams [2] de 1988.Debido a la complejidad de la prueba y a que su contenido se escapa un poco del objetivo del presentetrabajo no desarrollaremos la demostración aquí.

A la hora de aplicar el anterior teorema necesitamos también de los siguientes resultados. Pero antes deenunciarlos debemos denir el polinomio que mejor aproxima a una función integrable en cierto sentido quedetallaremos en la siguiente sección. Nosotros trabajamos únicamente enW k,1 pero los conceptos introducidosasí como la mayoría de resultados se pueden probar para W k,p en general.

4.2.1. Polinomio de aproximación

Denición 4.4. El espacio vectorial de polinomios reales P : Rn → R con grado menor o igual que ciertonatural k dado lo denotaremos por

Pk :=∑

aαxα : 0 ≤ |α| ≤ k

.

Sea Q0 = [0, 1]n el intervalo n-dimensional unidad de Rn. El espacio de polinomios Pk es un espacio deHilbert con el producto escalar

(f, g) =

∫Q0

f(y)g(y) dy ∀f, g ∈ Pk.

Consideramos la base ortonormal (nita pues Pk es un espacio de dimensión nita) φα(y)0≤|α|≤k que resultade aplicar el proceso de ortogonalización de Gram-Schmidt a las funciones yα0≤|α|≤k dadas en cierto orden.

Denimos entonces el siguiente operador lineal PQ0,k : L1(Q0) −→ Pk como

PQ0,k[f ](x) :=∑

0≤|α|≤k

(f, φα)φα(x).

Para otro intervalo n-dimensional cualquiera Q = [a, b]n el operador PQ0,k nos induce otro operador PQ,k :L1(Q) −→ Pk por un simple reescalamiento,

PQ,k[f ](x) := PQ0,k[g](x) donde g(x) = f(x(b− a) + (a, . . . , a)) ∀x ∈ Q0.

A tal polinomio lo llamaremos polinomio de aproximación de f . Es importante observar que PQ,k es unoperador continuo (‖PQ,k[f ]‖L∞(Q) ≤ sup0≤α≤k ‖φα‖L∞(Q)‖f‖L1(Q)). Y por tanto es una proyección.Estableceremos más concretamente el sentido en el que PQ,k aproxima a f en el Lema 4.2.A modo de ejemplo cuando k = 0, PQ,0[f ](x) = −

∫Q f(y) dy para todo x ∈ Q.

El siguiente lema nos da una caracterización alternativa del polinomio de aproximación. Es la que se utilizaen Dorronsoro, [13] y [14], para denir estos polinomios.

Lema 4.1. Dada f ∈ L1(Q) y Q intervalo n-dimensional entonces PQ,k[f ] es el único polinomio de gradomenor o igual que k tal que ∫

Qyα(f(y)− PQ,k[f ](y)) dy = 0, ∀0 ≤ |α| ≤ k. (4.1)

Demostración. Veamos en primer lugar que PQ,k satisface la propiedad (4.1). Sabemos que por ser φα(y)0≤|α|≤kuna base de Hilbert de Pk, el polinomio de aproximación puede escribirse de manera única como

PQ,k[f ](x) =∑

0≤|α|≤k

(PQ,k[f ], φα)φα(x).

4.2. APROXIMACIÓN POR POLINOMIOS DE FUNCIONES L1 57

Pero por la unicidad de representación en un espacio de Hilbert y viendo la denición de PQ,k[f ] se ha detener que los coecientes coinciden. Es decir para todo 0 ≤ |α| ≤ k,

(PQ,k[f ], φα) = (f, φα).

Luego en particular como las funciones yα se pueden escribir como combinación lineal de la base φα(y)0≤|α|≤kse deduce automáticamente la propiedad (4.1).

En segundo lugar necesitamos comprobar que si un polinomio P ∈ Pk satisface (4.1) entonces P = PQ,k[f ]en Q. En efecto si se cumple (4.1) se sigue que para todo α multíndice 0 ≤ |α| ≤ k, (P, φα) = (f, φα). Porotro lado como φα(y)0≤|α|≤k es base de Hilbert, P se escribe de manera única como

P (x) =∑

0≤|α|≤k

(P, φα)φα(x).

Tenemos así probado lo que buscábamos.

El sentido en el que entendemos que el polinomio de aproximación aproxima a la función esta recogidoen el siguiente resultado y en su corolario.

Lema 4.2. Existe una constante C(n, k) > 0 tal que para toda f ∈ L1(Q) y todo Q intervalo n-dimensionalentonces

−∫Q|f(y)− PQ,k[f ](y)| dy ≤ C(n, k) ınf

P∈Pk−∫Q|f(y)− P (y)| dy.

Demostración. Fijemos P ∈ Pk. Se tiene que PQ,k[P ] = P y gracias a la linealidad del polinomio de aproxi-mación, ∫

Q|f(y)− PQ,k[f ](y)| dy ≤

∫Q|f(y)− P (y)| dy +

∫Q|P (y)− PQ,k[f ](y)| dy =

=

∫Q|f(y)− P (y)| dy +

∫Q|PQ,k[P − f ](y)| dy ≤

≤∫Q|f(y)− P (y)| dy + Ln(Q)‖PQ,k[P − f ]‖L∞(Q).

Armamos ahora que

‖PQ,k[P − f ]‖L∞(Q) ≤ C(n, k)−∫Q|P (y)− f(y)| dy. (4.2)

Para demostrar esto supongamos primero que Q = Q0 = [0, 1]n y sea x ∈ Q0,

|PQ0,k[f ](x)| ≤∑

0≤|α|≤k

‖φα‖2L∞(Q0)

∫Q0

|f(y)| dy ≤ C(n, k)

∫Q0

|f(y)| dy.

Para el caso general Q = [a, b]n denimos g(y) = f(y(b− a) + (a . . . , a)) para todo y ∈ Q0. Así mediante uncambio de variables para todo x ∈ Q,

|PQ,k[f ](x)| = |PQ0,k[g](x)| ≤ C(n, k)

∫Q0

|g(y)| dy = C(n, k)−∫Q|f(y)| dy.

58 CAPÍTULO 4. TEOREMA DE MORSE-SARD (BOURGAIN-KOROBKOV-KRISTESEN)

Continuando con la demostración del lema concluimos∫Q|f(y)− PQ,k[f ](y)| dy ≤ C(n, k)

∫Q|f(y)− P (y)| dy.

Corolario 4.4.

ınfP∈Pk

∫Q|f(y)− P (y)| dy ∼

∫Q|f(y)− PQ,k[f ](y)| dy,

donde las constantes de la equivalencia dependen de n y de k.

Si tomamos el polinomio de aproximación PQ,k[f ] de cierta función f y se hace Q cada vez más pequeñopero siempre con un cierto x ∈ Q, ¾ será cierto que PQ,k[f ](x) converge a f(x)?. La respuesta será armativa.Dado x ∈ Q, usando la linealidad del polinomio de aproximación y la propiedad (4.2) anterior,

|f(x)− PQ,k[f ](x)| ≤ |f(x)−−∫Qf(y) dy|+ |−

∫Qf(y) dy − PQ,k[f ](x)| =

= |f(x)−−∫Qf(y) dy|+ |PQ,k

[−∫Qf(y) dy − f

](x)| ≤

≤ |f(x)−−∫Qf(y) dy|+ C(n, k)−

∫Q

∣∣∣∣−∫Qf(z) dz − f(y)

∣∣∣∣ dySi hacemos tender Q → x y usamos el Teorema de Diferenciabilidad de Lebesgue 1.4 concluimosque para casi todo x ∈ Q

lımQ→x

PQ,k[f ](x) = f(x). (4.3)

Enunciamos ahora dos últimos lemas sobre el polinomio de aproximación que necesitamos para la pruebadel teorema que más nos interesa (Teorema 4.5). Como referencia se ha usado el libro de Devore-Sharpley[12].

Lema 4.3. Dada una función integrable f ∈ L1(Rn), dado Q intervalo n−dimensional, dado x ∈ Q y dadom ≤ k se satisface

|DmPQ,k[f ](x)|Ln(Q)mn ≤ C(n, k)−

∫Q|f(y)| dy.

(Recúerdese que Dm denota Dβ para cierto multíndice de orden m).

Demostración. Nos será suciente demostrar que para todo polinomio P de grado menor o igual que k,x ∈ Q, que podemos escribir como

P (y) =∑

0≤|α|≤k

cα(y − x)α, y ∈ Q

se tiene que ∑0≤|α|≤k

|cα|Ln(Q)|α|n ≤ C(n, k)‖P‖L∞(Q). (4.4)

En efecto esto es suciente por dos motivos:

4.2. APROXIMACIÓN POR POLINOMIOS DE FUNCIONES L1 59

1. Tenemos que DβP (x) = β!cβ para todo multíndice 0 ≤ |β| ≤ k. Obviamente una vez probado (4.4), si|β| = m,

|DβP (x)|Ln(Q)mn ≤ (k!)n

∣∣∣∣DβP (x)

β!

∣∣∣∣Lm(Q)mn ≤

≤ (k!)n∑

0≤|α|≤k

∣∣∣∣DαP (x)

α!

∣∣∣∣Ln(Q)|α|n ≤

≤ C(n, k)‖P‖L∞(Q).

2. Por otro lado por la propiedad (4.2)

‖PQ,k[f ]‖L∞(Q) ≤ C(n, k)−∫Q|f(y)| dy.

Para probar (4.4) iremos del caso más simple Q = [−1, 1]n al caso más general Q = [a, b]n. En cualquier casosin pérdida de generalidad, trasladando el intervalo, suponemos x = 0 ∈ Q.

Q = Q1 = [−1, 1]n: ∑

0≤|α|≤k |cα|2|α| es norma de Pk

‖P‖L∞(Q1) es norma de PkComo el espacio vectorial Pk es nito dimensional, todas las normas son equivalentes, luego existeC(n, k) tal que se tiene el resultado.

Q = [−λ, λ]n:Se deduce del caso anterior por un cambio de variable. Sea

G(y) := P (λy), ∀y ∈ Q1.

Se tiene por un lado P (y) =∑

0≤|α|≤k cαyα y por otro G(y) =

∑0≤|α|≤k λ

|α|cαyα. Entonces

∑0≤|α|≤k

|cα|Ln(Q)|α|n =

∑0≤|α|≤k

1

λ|α|λ|α||cα|Ln(Q)

|α|n =

=∑

0≤|α|≤k

1

λ|α|λ|α||cα|2|α|λ|α| ≤ C(n, k)‖G‖L∞(Q1) = C(n, k)‖F‖L∞(Q).

Q = [a, b]n:Recordamos que x = 0 ∈ Q luego a < 0, b > 0. Consideremos Q = [a − b, b − a]. Entonces usando elcaso anterior para Q, ∑

0≤|α|≤k

|cα|(b− a)|α| ≤ C(n, k)

2|α|‖P‖L∞(Q) ≤ C(n, k)‖P‖L∞(Q).

Para λ > 0 denotamos λQ el intervalo n-dimensional con mismo centro que Q y con lado λ vecesmayor. Podemos comprobar que tenemos que

‖P‖L∞(λQ) ≤ C(n, k)‖P‖L∞(Q) ∀λ > 0.

60 CAPÍTULO 4. TEOREMA DE MORSE-SARD (BOURGAIN-KOROBKOV-KRISTESEN)

Para el caso Q = [0, 1]n se usa el hecho de que todas las normas en Pk−1 son equivalentes y pa-ra el caso general Q = [c, d]n se deduce del caso anterior mediante un cambio de variables del tipoG(y) = P (y(d− c) + (c, . . . , c)) con y ∈ [0, 1]n.

Usando que Q ⊂ 3Q, podemos nalmente escribir∑0≤|α|≤k

|cα|(b− a)|α| ≤ C(n, k)‖P‖L∞(Q) ≤ C(n, k)‖P‖L∞(3Q) ≤ C(n, k)‖P‖L∞(Q),

que es justamente (4.4).

Lema 4.4. Sea f ∈ W k,1(Rn), k ≤ n. Entonces existe C dependiendo sólo de n y k tal que para cualquierintervalo n-dimensional Q,∫

Q|f(y)− PQ,k−1[f ](y)| dy ≤ C`(Q)k

∫Q|Dkf(y)| dy.

Demostración. Sin pérdida de generalidad supondremos Q = Q0 = [0, 1]n el cubo unidad puesto que el casogeneral se deduce de éste tras un cambio lineal de variables.Lo probamos por reducción al absurdo. Gracias a que PQ0,k−1[f ] es el polinomio que mejor aproxima a f enel sentido del Corolario 4.4, podemos encontrar una sucesión de funciones (fj)

∞j=1 en W k,1 tal que

ınfP∈Pk−1

∫Q0

|fj(y)− P (y)| dy ≥ j∫Q0

|Dkfj(y)| dy.

Si suponemos que tal ínmo se alcanza en Pj , es decir

ınfP∈Pk−1

∫Q0

|fj(y)− P (y)| dy =

∫Q0

|fj(y)− Pj(y)| dy,

y reescalando si es necesario, existirán funciones gj = λj(fj − Pj) tales que

1 = ınfP∈Pk−1

∫Q0

|gj(y)− P (y)| dy =

∫Q0

|gj(y)| dy ≥ j∫Q0

|Dkgj(y)| dy.

La sucesión (gj)∞j=1 es acotada en W k,1(Q0). Por el Teorema de Compacidad de Rellich Kondrachov 1

garantizamos la existencia de una subsucesión convergente en L1(Q0), que denotamos igual.

gj −→ g en L1(Q0).

Además ∫Q0

|Dkgj(y)| dy −→ 0.

Por consiguiente se deduce que Dkg = 0 en Q0 y esto equivale a decir que g es un polinomio de gradomenor o igual que k− 1 (utilizar Corolario 2.14). Y claramente hemos llegado a una contradicción con que1 = ınfP∈Pk−1

∫Q0|g(y)− P (y)| dy.

1Teorema de Rellich Kondrachov: Sea Ω un subconjunto abierto y acotado de Rn con frontera sucientemente regular(en particular los intervalos n−dimensionales valen), entonces para cada 1 ≤ p < np

n−p el espacio W 1,p(Ω) está compactamenteembedido en Lp(Ω). Ver el libro de Evans [16] o de Brezis [9].

4.2. APROXIMACIÓN POR POLINOMIOS DE FUNCIONES L1 61

El teorema esencial que buscamos probar (Teorema 4.5) se puede ver en Dorronsoro ([13], Lema 2),aunque el resultado es más general de lo que nosotros necesitamos al probarse para funciones de variaciónacotada BVn, que incluyen al espacio Wn,1(Rn). No se dan muchos detalles de la prueba en ese artículo en elque se hacen varias referencias a otros dos artículos, uno de Dorronsoro [14] y otro de Devore-Sharpley [12].Es sobre este último esencialmente sobre el que nos hemos guiado para dar la demostración que presentamosa continuación.El teorema nos viene a decir que la diferencia entre las derivadas de una función f ∈ W k,1(Rn) y las de supolinomio de aproximación de grado k− 1 en cierto punto de un intervalo n-dimensional están acotadas porconstantes que dependen de n, del grado del polinomio, del intervalo n-dimensional y de la función maximalde Hardy-Littlewood de ∇kf .Debemos apreciar que existe un cambio de notación en el teorema a la hora de referirnos a los intervalosn-dimensionales. Esto se debe al hecho de que lo visto hasta ahora sobre polinomios aproximantes se puedeconsiderar una introducción con vistas a probar este teorema que es el más importante para nosotros, y queestá en concordancia con la notación de los siguientes capítulos sobre intervalos n−dimensionales.

Teorema 4.5. Sea f ∈W k,1(Rn) y sea k ≤ n. Entonces para todo intervalo n- dimensional I, x ∈ I y paratodo m = 0, 1 . . . , k − 1 se tiene la estimación

|Dmf(x)−DmPI,k−1[f ](x)| ≤ C`(I)k−m(MDkf)(x)

donde la constante C sólo depende de n y k.

Demostración. Consideremos una sucesión de intervalos n−dimensionales encajados I0 = I ⊃ I1 ⊃ · · · ⊃IN = Q′ siendo N un número natural, tales que `(Ii) = 2−i`(I) para todo i = 0, . . . , N y con x ∈ IN .Observamos claramente que

Ln(Ii+1) = 2−nLn(Ii) ∀i = 0, . . . , N − 1.

Probaremos a continuación que existe una constante C(n, k) > 0 tal que∣∣DmPI′,k−1[f ](x)−DmPI,k−1[f ](x)∣∣ ≤ C`(I)k−m(MDkf)(x). (4.5)

Y esto será suciente para nalizar la demostración puesto que podemos hacer tender N a innito, y usarlas propiedades del polinomio de aproximación PI′,k−1[f ] (ver (4.3)) que nos dice que

PI′,k−1[f ](x) −−−−−→`(I′)→0

f(x).

Como Ii+1 ⊂ Ii para todo i, y por la linealidad del polinomio de aproximación, PIi+1,k−1 [f − PIi,k−1[f ]] (x) =PIi+1,k−1[f ](x)− PIi,k−1[f ](x), tenemos

∣∣DmPI′,k−1[f ](x)−DmPI,k−1[f ](x)∣∣ ≤ N−1∑

i=0

∣∣DmPIi+1,k−1[f ](x)−DmPIi,k−1[f ](x)∣∣ =

=

N−1∑i=0

∣∣Dm(PIi+1,k−1[f ]− PIi,k−1[f ])(x)∣∣ =

=N−1∑i=0

∣∣Dm(PIi+1,k−1 [f − PIi,k−1[f ]])(x)∣∣ .

62 CAPÍTULO 4. TEOREMA DE MORSE-SARD (BOURGAIN-KOROBKOV-KRISTESEN)

Se usará ahora el Lema 4.3 para obtener la siguiente estimación:

∣∣DmPI′,k−1[f ](x)−DmPI,k−1[f ](x)∣∣ ≤ N−1∑

i=0

C1Ln(Ii+1)−mn −∫Ii+1

|f(y)− PIi,k−1[f ](y)| dy ≤

≤N−1∑i=0

C1Ln(Ii+1)−mn

1

Ln(Ii+1)

∫Ii

|f(y)− PIi,k−1[f ](y)| dy.

Y por el Lema 4.4.

∣∣DmPI′,k−1[f ](x)−DmPI,k−1[f ](x)∣∣ ≤ N−1∑

i=0

C1Ln(Ii+1)−mn−1C2`(Ii)

k

∫Ii

|Dkf(y)| dy =

=N−1∑i=0

C1C2Ln(Ii+1)−mn−1`(Ii)

kLn(Ii)−∫Ii

|Dkf(y)| dy =

=N−1∑i=0

C1C22n+m`(Ii)k−m−

∫Ii

|Dkf(y)| dy ≤

≤N−1∑i=0

C(2−i`(I))k−m(MDkf)(x).

La última igualdad se trata simplemente de la denición de función maximal de Hardy-Littlewood sabiendoque las diversas deniciones que permite este concepto son equivalentes entre sí salvo constantes dependientesde la dimensión n.Ya prácticamente hemos acabado la demostración del teorema. Simplemente basta ver

N−1∑i=0

(2−i`(I))k−m ≤ 2`(I)k−m,

lo cual se cumple si y sólo siN−1∑i=0

((1

2)k−m)i ≤ 2.

Como k −m ∈ 1, . . . , k y entonces (12)k−m ≤ 1

2 , por tratarse de una suma geométrica,

N−1∑i=0

((1

2)k−m)i ≤

N−1∑i=0

(1

2)i =

1−(

12

)N1− 1

2

= 2−(

1

2

)N−1

≤ 2.

Será conveniente tener en mente también el siguiente caso particular del teorema anterior.

Corolario 4.6. Sea f ∈W 1,1(Rn). Entonces para toda bola B(z, r) ⊂ Rn, x ∈ B(z, r) se cumple que∣∣∣∣∣f(x)−−∫B(z,r)

f(y) dy

∣∣∣∣∣ ≤ Cr(MDf)(x),

donde C depende sólo de n.

4.2. APROXIMACIÓN POR POLINOMIOS DE FUNCIONES L1 63

Demostración. El hecho de utilizar bolas en vez de intervalos n-dimensionales no supone mayor problemaya que ambos conjuntos están relacionados siempre por constantes que dependen de la dimensión. Una vezaclarado esto el corolario se sigue del teorema anterior para el caso particular en el que k = 1, m = 0.

Corolario 4.7. Sea f ∈ W 1,1(Rn). Entonces para toda bola B ⊂ Rn de radio r > 0 y para todo ε > 0 sesatisface

diam (f(x) : x ∈ B, (MDf)(x) ≤ ε) ≤ Cεr,

donde C sólo depende de n.

Demostración. Sean x, y ∈ B con (MDf)(x) ≤ ε y (MDf)(y) ≤ ε. Entonces por el Corolario 4.6 anterior,

|f(x)− f(y)| ≤ |f(x)−−∫Bf(z) dz|+ |f(y)−−

∫Bf(z) dz| ≤

≤ Cr(MDf)(x) + Cr(MDf)(y) ≤ Cr(ε+ ε) ≤ Crε.

Acabamos la sección con un último lema técnico.

Lema 4.5. Sea f ∈ Wn,1(Rn). Entonces f es una función continua y para cada k = 0, . . . , n − 1 y cadaintervalo n−dimensional I ⊂ Rn,

supy∈I|f(y)− PI,k[f ](y)| ≤ C1

(‖Dk+1f‖L1(I)

`(I)n−k−1+ ‖Dnf‖L1(I)

)(4.6)

donde C1 depende sólo de n. Además si llamamos fI,k(y) = f(y) − PI,k[f ](y), y ∈ I, esta función puedeextenderse a todo Rn tal que fI,k ∈Wn,1(Rn) y

‖DnfI,k‖L1(Rn) ≤ C2R(I, k) (4.7)

donde C2 depende también sólo de n y R(I, k) =

(‖Dk+1f‖L1(I)

`(I)n−k−1 + ‖Dnf‖L1(I)

)Demostración. La existencia de un representante continuo para f se puede encontrar en Maz'ya [24] (1.4.5,Remark 2).Es suciente que probemos (4.6) y (4.7) para el intervalo unidad I = I0 = [0, 1]n, gracias a un cambio devariables. Veamos por ejemplo que es suciente para (4.6)

Asumamos que hemos probado el resultado para el intervalo unidad y cojamos un intervalo n−dimensionalI = [a, b]n cualquiera. Denimos g(y) = f(y(b− a) + (a, . . . , a)), y ∈ I0. Así

supy∈I|f(y)− PI,k[f ](y)| = sup

y∈I0|g(y)− PI,k[g](y)| ≤ C1

(∫I0

|Dk+1g(x)| dx+

∫I0

|Dng(x)| dx)

=

= C1

(∫I

∣∣∣∣Dk+1g

(z − (a, . . . , a)

(b− a)

)∣∣∣∣ 1

(b− a)ndz+

+

∫I

∣∣∣∣Dng

(z − (a, . . . , a)

(b− a)

)∣∣∣∣ 1

(b− a)ndx

)=

= C1

(∫I

∣∣∣Dk+1f(z)∣∣∣ (b− a)k+1

(b− a)ndz +

∫I|Dnf(z)| (b− a)n

(b− a)ndx

)=

= C1

(‖Dk+1f‖L1(I)

`(I)n−k−1+ ‖Dnf‖L1(I)

).

64 CAPÍTULO 4. TEOREMA DE MORSE-SARD (BOURGAIN-KOROBKOV-KRISTESEN)

Trabajamos entonces con I0. Sea f ∈Wn,1(I0). Tenemos la siguiente estimación:

supy∈I|f(y)| ≤︸︷︷︸

(1)

C‖f‖Wn,1(I) ≤︸︷︷︸(2)

C(‖PI,k[f ]‖L1(I) + ‖Dk+1f‖L1(I) + ‖Dnf‖L1(I)). (4.8)

(1) Dada una función ϕ ∈ C∞c (Rn) podemos escribir

ϕ(y1, . . . , yn) =

∫ y1

−∞· · ·∫ yn

−∞

∂nϕ

∂x1 · · · ∂xn(x1, . . . , xn) dx1 . . . dxn.

Por consiguiente, con los métodos típicos de aproximación por funciones C∞,

supy∈Rn

|f(y)| ≤ ‖f‖Wn,1(Rn).

(2) Haremos uso del Teorema 2.15 sobre equivalencia de normas en espacios de Sobolev.

En nuestro caso deniremos

S(f) := ‖PI,k[f ]‖L1(I) + ‖Dk+1f‖L1(I).

Supongamos primero que P ∈ Pn−1 y S(P ) = 0. En particular tendremos que ‖Dk+1P‖L1(I) = 0 luegoP ∈ Pk y así PI,k[P ] = P . Como también se satisface ‖PI,k[P ]‖L1(I) = 0 concluimos que P = 0.

Veamos por otro lado que S(·) dene una seminorma continua:

S(f) ≥ 0 para toda f ∈Wn,1(I) es obvio.

S(λf) = |λ|S(f) para todo f ∈Wn,1(I) y λ ∈ R es por la linealidad del polinomio de aproximacióny de la derivada.

S(f + g) ≤ S(f) + S(g) para todas f, g ∈ Wn,1(I) también es por la linealidad del polinomio deaproximación y de la derivada, y por la desigualdad triangular de la norma ‖ · ‖L1(I).

La continuidad también está clara por la continuidad de las funciones involucradas en la deniciónde S.

Aplicando el Teorema 2.15 existirá una constante C1 tal que

‖h‖Wn,1(I) ≤ C1

(‖PI,k[h]‖L1(I) + ‖Dk+1h‖L1(I) + ‖Dnh‖L1(I)

)para toda h ∈Wn,1(I). Basta tomar ahora h(y) = f(y)− PI,k[f ](y) para concluir que

‖f − PI,k[f ]‖Wn,1(I) ≤ C1

(‖Dk+1f‖L1(I) + ‖Dnf‖L1(I)

).

Ya hemos probado (2).

Para demostrar la desigualdad (4.7) utilizamos el siguiente hecho: toda función f ∈Wn,1(I) puede extendersea una función f ∈ Wn,1(Rn) tal que ‖Dnf‖L1(Rn) ≤ C(n)‖f‖Wn,1(I). Para ver un prueba de este resultado,en el que básicamente se usan argumentos típicos de reexión para extender la función, puede consultarse ellibro de Stein [29]. En ocasiones se denomina a este resultado Teorema de Extensión de Stein.

4.3. PROPIEDAD DE APROXIMACIÓN DE TIPO LUZIN PARA WL,1 65

4.3. Propiedad de aproximación de tipo Luzin para W l,1

A parte de los resultados más básicos sobre aproximación que hemos visto en el Capítulo 2 existen otrosque en ocasiones sirven de gran ayuda. Ya sabemos que si una función f está en W l,p y p > n entonces fes en particular Ck−1. Si ahora nos centramos en el espacio W l,1 ya no tenemos que 1 > n. Pero por otrolado seguiremos siendo capaces de encontrar una buena aproximación de ella. Veremos que para todo k ≤ l ypara todo ε > 0 habrá una función g de clase C l tal que g = f , Df = Dg, . . . ,Dkg = Dkf para todo puntode Rn salvo en un abierto de medida Hausdor (n− l + k)−dimensional menor que ε.

Existe muchas literatura en los últimos años sobre este tema. Por orden cronológico una lista de referenciasimportantes podría ser Calderón-Zygmund [10] (1961), Bagby-Ziemer [4] (1974), Liu [20] (1977) y nalmenteBojarski-Hajlasz-Strzelecki [6] (2002). El libro de Ziemer [32] también es muy recomendable.

Aunque no damos la demostración en este trabajo para mayor brevedad, es importante tener en menteciertos resultados de diferenciabilidad de las funciones del espacio W l,1(Rn). Del artículo de Dorronsoro [13]presentamos una recopilación de los resultados que emplearemos nosotros.

Teorema 4.8. 1. Si f ∈ W l,1(Rn) con l ≤ n, entonces Df(x), . . . , Dkf(x) (k < l) están bien denidos,en el sentido clásico, para Hn−l+k-casi todo punto x ∈ Rn.

2. Si f ∈ Wn,1(Rn), entonces Dnf(x) está bien denido en Hn-casi todo punto. Es más por el puntoanterior tomando l = n, realmente tenemos que Dkf(x) está bien denido para Hk-casi todo puntox ∈ Rn, donde 1 ≤ k ≤ n.

La demostración del Teorema que enunciamos a continuación sigue los pasos del artículo de Bourgain-Korobkov-Kristensen [8], excepto el caso más simple que lo omitiremos.

Teorema 4.9. Sean k, l ∈ 1 . . . , n, k ≤ l. Entonces para cada f ∈ W l,1(Rn) y para cada ε > 0 existe unconjunto abierto U ⊂ Rn y una función g ∈ Ck(Rn) tales que Hn−l+k∞ (U) < ε y f = g, Dmf = Dmg enRn \ U para todo m = 1, . . . , k.

Demostración. La clave de la prueba está en el Teorema de Extensión de Whitney 1.2 y en el artículode Dorronsoro [13].

Caso k=l:Se trata del caso más sencillo del que hay mucha literatura. Puede consultarse [6], [20] o [32]. En lademostración hay que combinar el resultado de Luzin clásico para identicar funciones medibles porcontinuas salvo en un conjunto de medida pequeño, con el Teorema de Egorov y utilizar el Teorema deExtensión de Whitney que es el que en última instancia nos construirá la función con la regularidadbuscada Ck.

Caso k<l:Los gradientes Dmf(x), m ≤ k están bien denidos para todo x ∈ Rn \ Ak, donde Hn−l+k(Ak) = 0(ver Dorronsoro [13], Theorem 1). Para cada multíndice α con |α| ≤ k denotaremos por Tα(f, x, y) alpolinomio de Taylor de orden k − |α| de la función Dαf con centro en x.

Tα(f, x, y) =∑

0≤|β|≤k−|α|

1

β!Dα+βf(x) · (y − x)β

Debe observarse que existe un cambio de notación con respecto al uso de los polinomios de Taylor dela sección que trataba sobre el Teorema de Knesser-Glaeser ( Capítulo 1).

66 CAPÍTULO 4. TEOREMA DE MORSE-SARD (BOURGAIN-KOROBKOV-KRISTESEN)

Gracias al Teorema de extensión de Whitney 1.2 acabaríamos la prueba del presente teorema siencontrásemos U ⊂ Rn abierto, siendo Hn−l+k∞ (U) sucientemente pequeño y comprobásemos que paratodo multíndice |α| ≤ k los restos de Taylor

Dαf(y)− Tα(f, x, y) = (|x− y|)k−|α|)

uniformemente en x, y ∈ Rn \ U .

Como C∞0 (Rn) ⊂ L1(Rn) es denso y Dlf ∈ L1(Rn), existe una sucesión (fi)∞i=1 ⊂ C∞0 (Rn) tal que

‖Dlfi −Dlf‖L1(Rn) < 4−i. Denotamos fi = f − fi ∈W l,1(Rn).Sean también

Bi :=x ∈ Rn : (MDkfi)(x) > 2−i

Gi := Ak ∪

∞⋃j=i

Bj

.

Es conveniente aclarar que a la hora de denir los conjuntos Gi estamos incluyendo los puntos delconjunto Akporque nos interesa tener desarrollos de Taylor para la función en puntos Rn \Gi.Para cada i tenemos la siguiente estimación del contenido Hausdor de estos conjuntos:

1. Hn−l+k∞ (Bi) ≤ C2−i.

Por un lado la función Hn−l+k∞

(x ∈ Rn :

(MDkfi

)(x) > λ

)es decreciente en λ. Así

2−iHn−l+k∞ (Bi) ≤∫ ∞

0Hn−l+k∞

(x ∈ Rn :

(MDkfi

)(x) > λ

)dλ.

Por otro lado podemos aplicar el Teorema 4.3 a la función Dkfi ∈W l−k,1(Rn) y obtener∫ ∞0Hn−l+k∞

(x ∈ Rn :

(MDkfi

)(x) > λ

)dλ ≤ C

∫Rn|Dlfi(y)| dy = C‖Dlfi‖L1(Rn) < C4−i,

donde C es una constante que depende de k, l y n.

2. Hn−l+k∞ (Gi) ≤ 2C2−i.Recordando que Hn−l+k∞ (Ak) = 0 (gracias a la equivalencia Hn−l+k∞ ∼ Hn−l+k en Rn),

Hn−l+k∞ (Gi) ≤∞∑j=i

Hn−l+k∞ (Bj) <∞∑j=i

C2−j = 2C2−i.

Además por construcción|Dkfj(x)| ≤ 2−j , ∀x ∈ Rn \Gi, ∀j ≥ i. (4.9)

En efecto si x ∈ Rn \Gi entonces x /∈⋃∞j=iBj y así

(MDkfj

)(x) ≤ 2−j para todo j ≥ i. Para obtener

ahora (4.9) basta simplemente aplicar el Lema 1.2.

Introduciremos ahora nueva notación relativa a los polinomios de Taylor. Para cada multíndice α con|α| ≤ k − 1 denotamos por

Tα,k−1(f, x, y) =∑

0≤|β|≤k−1−|α|

1

β!Dα+βf(x) · (y − x)β

4.3. PROPIEDAD DE APROXIMACIÓN DE TIPO LUZIN PARA WL,1 67

al polinomio de Taylor de orden k− 1− |α| para la función Dαf con centro en x. En nuestra notaciónintroducida con anterioridad,

Tα(f, x, y) = Tα,k−1(f, x, y) +∑

|β|=k−|α|

1

β!Dα+βf(x) · (y − x)β.

Cojamos ahora x, y ∈ Rn \Gi, j ≥ i y sea I un intervalo n-dimensional tal que x, y ∈ I, |x− y| ∼ `(I).

|Dαf(y)− Tα(f, x, y)| = |Dαfj(y) +Dαfj(y)− Tα(fj , x, y)− Tα(fj , x, y)| ≤≤ |Dαfj(y)− Tα(fj , x, y)|+ |Dαfj(y)− Tα(fj , x, y)| == |Dαfj(y)− Tα(fj , x, y)|+ (|x− y|)k−|α|

En la última igualdad se usa el hecho de que las funciones fj son funciones C∞.Hemos de distinguir llegados a este punto el caso más simple |α| = k del caso |α| < k.

Si |α| = k se tiene simplemente Tα(fj , x, y) = Dαfj(x) y por lo tanto

|Dαfj(y)− Tα(fj , x, y)| ≤ |Dαfj(y)−Dαfj(x)| ≤ |Dαfj(y)|+ |Dαfj(x)| ≤︸︷︷︸(4.9)

2−j+1.

(Veremos al nal del caso |α| < k que esta estimación es suciente para concluir el resultado).

Si |α| < k procedemos como sigue:

|Dαfj(y)− Tα(fj , x, y)| ≤ |Dαfj(y)− Tα,k−1(fj , x, y)|+∑

|β|=k−|α|

1

β!|Dα+β fj(x)||y − x||β| ≤

≤ |Dαfj(y)− Tα,k−1(fj , x, y)|+ |Dkfj(x)||y − x|k−|α| ≤≤︸︷︷︸

(4.9)

|Dαfj(y)− Tα,k−1(fj , x, y)|+ 2−j |y − x|k−|α|. (4.10)

Dedicaremos ahora algo de esfuerzo a estimar el primer sumando de la expresión anterior.

1. Como y ∈ Rn \Gi, ya sabemos que (MDkfj)(x) ≤ 2−j para todo j ≥ i.

2. Aplicando el Teorema 4.5 con las funciones fj ∈W l,1(Rn) obtenemos

|Dαfj(y)−DαPI,k−1[fj ](y)| ≤ C`(I)k−|α|(MDkfj)(y) ≤ C|x− y|k−|α|2−j ,

donde C sólo depende de l y de n.

3. Podemos escribir las derivadas del polinomio de aproximación de fj de orden k − 1 en I como

DαPI,k−1[fj ](y) =∑

0≤|β|≤k−1−|α|

1

β!Dα+βPI,k−1[fj ](x) · (y − x)β.

68 CAPÍTULO 4. TEOREMA DE MORSE-SARD (BOURGAIN-KOROBKOV-KRISTESEN)

Entonces, usando de nuevo el Teorema 4.5,

|DαPI,k−1[fj ](y)− Tα,k−1(fj , x, y)| ≤∑

0≤|β|≤k−1−|α|

1

β!

∣∣∣Dα+βPI,k−1[fj ](x)−Dα+β fj(x)∣∣∣ |y − x||β| ≤

≤∑

0≤|β|≤k−1−|α|

1

β!C`(I)(k−|α|−|β|)(MDkfj)(x)|y − x||β| ≤

≤∑

0≤|β|≤k−1−|α|

1

β!C|x− y|(k−|α|−|β|)2−j |y − x||β| ≤

≤ C12−j |x− y|k−|α|.

Si juntamos la información que nos dan estos tres aparatados anteriores deducimos

|Dαfj(y)− Tα,k−1(fj , x, y)| ≤ |Dαfj(y)−DαPI,k−1[fj ](y)|+ |DαPI,k−1[fj ](y)− Tα,k−1(fj , x, y)| ≤≤ C2−j |x− y|k−|α| + C12−j |x− y|k−|α| ≤≤ C22−j |x− y|k−|α|.

Podemos enlazar ahora con la expresión (4.10) para obtener

|Dαfj(y)− Tα(fj , x, y)| ≤ C22−j |x− y|k−|α| + 2−j |y − x|k−|α| = C32−j |y − x|k−|α|.

Resumiendo, lo que hemos visto hasta ahora es lo siguiente: Dados x, y ∈ Rn \ Gi, j ≥ i y dado I unintervalo n-dimensional tal que x, y ∈ I, |x− y| ∼ `(I),

|Dαf(y)− Tα(f, x, y)| ≤

2−j+1 + (|x− y|)k−|α| si |α| = k

C32−j |y − x|k−|α| + (|x− y|)k−|α| si |α| < k

con las constantes dependientes de k, l y n.Gracias a esta última expresión ya estamos en disposición de demostrar el teorema. Dado ε > 0 existiráun i ∈ N tal que 2−i < ε. Conocemos la estimación Hn−l+k∞ (Gi) < C2−i, por lo que podemos coger unconjunto abierto de Rn, Gi ⊂ U tal que Hn−l+k∞ (U) < C2−i < Cε. Se sigue que

|Dαf(y)− Tα(f, x, y)| ≤ C42−j (|x− y|)k−|α|

para todo j ≥ i, |α| ≤ k, x, y ∈ Rn \ U . Si hacemos tender j −→ ∞ y |x − y| −→ 0 la expresiónanterior tiende a cero. Es decir, los restos de Taylor tienen el decaimiento requerido para poder aplicarel Teorema de Extensión de Whitney 1.2 y nalizar la demostración.

4.4. Imágenes de conjuntos de contenido Hausdor pequeño

Modicaremos a partir de ahora un poco la notación respecto a las derivadas parciales Dk. Llamaremos∇kf a la función que toma valores vectoriales que consta de todas las derivadas parciales de orden k de fen cierto orden. Por ejemplo ∇f denota el gradiente y ∇f = (De1 , . . . , Den) donde ei son los vectores de labase canónica. Además si escribimos ‖∇f‖L1 nos referimos a ‖De1f‖L1 + · · ·+ ‖Denf‖L1 . Indicamos que losresultados de la sección 4.2 no se ven afectados si sustituimos Dkf por ∇kf .

4.4. IMÁGENES DE CONJUNTOS DE CONTENIDO HAUSDORFF PEQUEÑO 69

Denición 4.5. Dada una medida positiva µ en Rn diremos que µ tiene la propiedad (∗ − l) para ciertol ≤ n si

µ(I) ≤ `(I)n−l

para todo intervalo n-dimensional I ⊂ Rn.

Veremos ahora un teorema avanzado de desigualdades de espacios de Sobolev. Una prueba del mismopuede seguirse en Maz'ya [24] (1.4.3).

Teorema 4.10. Si f ∈W l,1(Rn) y µ tiene la propiedad (∗ − l) entonces∫Rn|f(x)|dµ(x) ≤ C‖∇lf‖L1(Rn) (4.11)

donde C es una constante positiva que no depende de µ ni de f .

El objetivo de esta sección es probar la siguiente propiedad que cumplen las funciones de Sobolev delespacio Wn,1(Rn).

Teorema 4.11. Sea f ∈ Wn,1(Rn). Entonces para cada ε > 0 existe δ > 0 tal que para cualquier conjuntoE ⊂ Rn si H1

∞(E) < δ entonces H1(f(E)) < ε. En particular si H1(E) = 0 entonces H1(f(E)) = 0.

Recuérdese que como el espacio de llegada de f es R, podríamos escribir H1(f(E)) ó L1(f(E)) indistin-tamente.El caso más simple n = 2 fue probado por primera vez por Bourgain, Korovkov y Kristensen en su artículode 2013 On the Morse-Sard property and level sets of Sobolev and BV functions ([7]). Y el caso general datadel 2015 y fue probado por los mismos autores en el artículo que nos está sirviendo de referencia esencial paraeste capítulo ([8]). En la prueba que ofrecemos en este trabajo se siguen los pasos de este último artículo.Para ello se necesitan varios lemas de carácter geométrico.

El primer lema que necesitamos es básico y nos da la existencia de un número nito de intervalos diádicoscon lados controlados que recubren un intervalo n-dimensional I.

Lema 4.6. Para cada intervalo n-dimensional I ⊂ Rn existen intervalos diádicos Q1, . . . , Q2n tales queI ⊂

⋃2n

i=1Qi y `(Qi) ≤ 2`(I) para todo i = 1, . . . , 2n.

Demostración. Sea un intervalo n-dimensional I = [a, b]n ⊂ Rn. Escojamos m ∈ Z como el menor entero talque

(b− a) <1

2m. (4.12)

Es decir hemos de tener que 12m ≤ 2(b− a) < 1

2m−1 . Tomamos además k como el entero más grande tal quek

2m ≤ a. Es decir se tienek

2m ≤ a <k+12m . Obsérvese que:

(1) a < k+12m .

(2) b < k+22m . En efecto k+2

2m = k+12m + 1

2m > a+ 12m > b gracias a (4.12).

Por lo tanto [a, b] ⊂ [ k2m ,k+12m ] ∪ [k+1

2m , k+22m ]. Si ahora llamamos I ′ = [ k2m ,

k+12m ], I ′′ = [k+1

2m , k+22m ] y construimos

todos los posibles intervalos diádicos n-dimensionales usando sólo I ′ e I ′′ obtenemos 2n intervalos diádicosQ1, . . . , Q2n

2 que recubren todo I. Además todos ellos satisfacen que `(Qi) = 12m ≤ 2(b− a) = 2`(I).

2Ejemplo para n = 2: Q1 = I ′ × I ′, Q2 = I ′ × I ′′, Q3 = I ′′ × I ′, Q4 = I ′′ × I ′′

70 CAPÍTULO 4. TEOREMA DE MORSE-SARD (BOURGAIN-KOROBKOV-KRISTESEN)

Denición 4.6. Dada una familia Iαα∈A de intervalos diádicos n-dimensionales diremos que es unafamilia k−regular si para cada intervalos n-dimensional Q se satisface la siguiente desigualdad∑

α∈A: Iα⊆Q

`(Iα)k ≤ `(Q)k.

El siguiente lema nos permitirá transformar una familia de intervalos diádicos n-dimensionales en unak-regular, para k ∈ 1, . . . , n, siendo la nueva familia un recubrimiento de la anterior y satisfaciendo lapropiedad (4.13) (ver lema).

Lema 4.7. Sea k ∈ 1, . . . , n y sea Iαα∈A una familia de intervalos diádicos n-dimensionales tales quesu unión está acotada. Entonces existe una familia k−regular y disjunta Jββ∈B de intervalos diádicos

n-dimensionales tales que⋃α∈A Iα ⊆

⋃β∈B Jβ y∑β∈B

`(Iβ)k ≤∑α∈A

`(Iα)k. (4.13)

Demostración. Denamos F =J : J ⊂ Rn intervalo diádico con

∑α∈A: Iα⊆J `(Iα)k ≥ `(J)k

.

Observación: Dados dos elementos de F , por ser intervalos diádicos, o bien sus interiores son disjuntos obien uno está incluido en el otro.Claramente

⋃α∈A Iα ⊂ F . Denotaremos por F∗ = Jββ∈B a la colección maximal3 de elementos de F que

será la candidata a solución. Por ser maximal⋃β∈B Jβ =

⋃J∈F J y por tanto

⋃α∈A Iα ⊆

⋃β∈B Jβ (es clave

que la unión de intervalos Iα esté acotada para hacer esto).Además por la observación anterior y la maximalidad se deduce que los interiores de los Jβ son disjuntos dosa dos. Por denición de F , ∑

β∈B`(Iβ)k ≤

∑β∈B

∑α∈A: Iα⊆Jβ

`(Iα)k ≤∑α∈A

`(Iα)k,

lo que prueba (4.13).Para ver ahora que la familia es k-regular tomemos un intervalo diádico cualquiera Q ⊂ Rn. Veamos que setiene que ∑

β∈B: Jβ⊆Q`(Jβ)k ≤ `(Q)k.

Si no existe β ∈ B con Jβ ⊂ Q claramente 0 ≤ `(Q)k.

Si existe β ∈ B con Jβ ⊆ Q entonces o bien Jβ = Q, o bien Jβ ( Q. En el primer caso la desigualdad estáclara y en el segundo tenemos que Q 6∈ F (por la maximalidad de F∗). Así

∑α∈A: Iα⊆J `(Iα)k < `(Q)k,

por denición de F , y podemos entonces concluir∑β∈B: Jβ⊆Q

`(Iβ)k ≤∑

β∈B: Jβ⊆Q

∑α∈A: Iα⊆Jβ

`(Iα)k ≤∑

α∈A: Iα⊆Q

`(Iα)k < `(Q)k.

3Entendemos por colección maximal de elementos de F a una subfamilia suya G tal que no haya dos elementos de G queestén uno incluido en el otro. Y es maximal en el sentido de que cualquier elementos de F \ G ha de estar incluido en alguno deG (si no lo está se le añade)

4.4. IMÁGENES DE CONJUNTOS DE CONTENIDO HAUSDORFF PEQUEÑO 71

Lema 4.8. Sea f ∈ Wn,1(Rn) y sea k = 0, . . . , n − 1. Entonces para cada ε > 0 existe δ = δ(ε, f, k) >0 tal que para cada familia (k + 1)-regular disjunta Iαα∈A de intervalos diádicos n-dimensionales con∑

α∈A `(Iα)k+1 < δ entonces∑

α∈AR(Iα, k) < ε.

Recordemos que R(Iα, k) =

(‖∇k+1f‖L1(Iα)

`(Iα)n−k−1 + ‖∇nf‖L1(Iα)

).

Demostración. Fijemos ε > 0 y sea Iαα∈A una familia satisfaciendo las hipótesis del enunciado con δ > 0aún por determinar.En primer lugar gracias al Teorema 2.5 existirá una descomposición f = f0 + f1 donde f0 ∈ C∞c (Rn),f1 ∈Wn,1(Rn) y tal que ‖f1‖Wn,1(Rn) < ε. En particular

‖∇nf1‖L1(Rn) < ε (4.14)

y además por ser f0 una función C∞ de soporte compacto existirá K = K(ε, f) > 0 tal que

‖∇jf0‖L∞(Rn) ≤ K ∀j = 0, 1 . . . , n. (4.15)

Impongamos δ ≤ δ1 = 1k+1ε y así tenemos∑

α∈A

`(Iα)k+1 < δ ≤ 1

k + 1ε. (4.16)

Denimos ahora la siguiente medida positiva como sigue

µ(C) :=∑α∈A

1

`(Iα)n−k−1Ln(C ∩ Iα) ∀C ⊆ Rn Ln −medible.

1. µ es una medida positiva.En efecto pues es una combinación lineal de restricciones de la medida de Lebesgue a ciertos conjuntosmedibles y todas son medidas positivas.

2. 12n+k+2µ tiene la propiedad (∗ − [n− (k + 1)]).Sea Q un intervalo diádico cualquiera. Como dado α ∈ A ó bien Q ⊂ Iα, ó bien Iα ⊆ Q (véaseobservación de la página anterior), escribimos

µ(Q) =∑

α∈A: Iα⊆Q

1

`(Iα)n−k−1Ln(Q ∩ Iα) +

∑α∈A:Q⊂Iα

1

`(Iα)n−k−1Ln(Q ∩ Iα) =

=∑

α∈A: Iα⊆Q

Ln(Iα)

`(Iα)n−k−1+

∑α∈A:Q⊂Iα

Ln(Q)

`(Iα)n−k−1=

=∑

α∈A: Iα⊆Q

`(Iα)k+1 +∑

α∈A:Q⊂Iα

Ln(Q)

`(Iα)n−k−1.

Ahora como Iαα∈A es una familia (k + 1)−regular,

µ(Q) = `(Q)k+1 +∑

α∈A:Q⊂Iα

Ln(Q)

`(Iα)n−k−1.

Por ser una familia disjunta y gracias otra vez a la observación sabemos que Q ⊂ Iα para como muchoun α. Si no se tiene para ningún α tenemos trivialmente µ(Q) ≤ 2`(Q)k+1, y si sí que se tiene, digamospara α1 ∈ A,

µ(Q) = `(Q)k+1 +Ln(Q)

`(Iα1)n−k−1≤ `(Q)k+1 +

`(Iα1)n

`(Iα1)n−k−1= 2`(Q)k+1.

72 CAPÍTULO 4. TEOREMA DE MORSE-SARD (BOURGAIN-KOROBKOV-KRISTESEN)

Cogemos ahora un intervalo n−dimensional I. Entonces usando el Lema 4.6 existen intervalos diádicosQ1, . . . , Q2n tales que I ⊆

⋃2n

j=1Qj y `(Qj) ≤ 2`(I) para todo j = 1, . . . , 2n. Tenemos así la estimación

µ(I) ≤2n∑j=1

µ(Qj) ≤2n∑j=1

2`(Qj)k+1 ≤

2n∑j=1

2k+2`(I)k+1 = 2n+k+2`(I)k+1.

Antes de nalmente pasar a estimar la cantidad∑

α∈AR(Iα, k) debemos renar aún más nuestra elecciónde δ > 0. Gracias a la continuidad absoluta de la integral de Lebesgue , como |∇nf | es medible e integrable,dado ε > 0 existe δ2 > 0 tal que si Ln(C) < δ2 entonces

∫C |∇

nf(x)| dx < ε. Si cogemos pues un 0 < δ2 < 1que nos da este hecho y suponemos que

∑α∈A `(Iα)k+1 < δ2 (así `(Iα) < 1 ∀α ∈ A), tenemos que

Ln(⋃α∈A

)=∑α∈ALn(Iα) =

∑α∈A

`(Iα)n ≤∑α∈A

`(Iα)k+1 < δ2

y por tanto ∫⋃α∈A Iα

|∇nf(x)| dx =∑α∈A‖∇nf‖L1(Iα) < ε.

Tomaremos δ = mın δ1, δ2. Con todo lo visto hasta ahora ya podemos escribir

∑α∈A

R(Iα, k) =∑α∈A‖∇nf‖L1(Iα) +

∑α∈A

‖∇k+1f‖L1(Iα)

`(Iα)n−k−1< ε+

∑α∈A

1

`(Iα)n−k−1

∫Iα

|∇k+1(f0 + f1)(x)| dx ≤

≤ ε+∑α∈A

1

`(Iα)n−k−1

∫Iα

|∇k+1f0(x)| dx+∑α∈A

1

`(Iα)n−k−1

∫Iα

|∇k+1f1(x)| dx ≤

≤︸︷︷︸(4.15)

ε+∑α∈A

KLn(Iα)

`(Iα)n−k−1+∑α∈A

1

`(Iα)n−k−1

∫Iα

|∇k+1f1(x)| dx =

= ε+∑α∈A

K`(Iα)k+1 +∑α∈A

1

`(Iα)n−k−1

∫Iα

|∇k+1f1(x)| dx ≤

≤︸︷︷︸(4.16)

ε+K

K + 1ε+

∑α∈A

1

`(Iα)n−k−1

∫Iα

|∇k+1f1(x)| dx =

≤ 2ε+

∫Rn|∇k+1f1(x)| dµ(x).

Recordamos llegados a este punto que ∇k+1f1 ∈ Wn−k−1,1(Rn) y que la medida positiva 12n+k+2µ tiene la

propiedad (∗ − [n− k − 1]). Podemos entonces aplicar el Teorema 4.10 y concluir que∑α∈A

R(Iα, k) ≤ 2ε+ 2n+k+2C

∫Rn|∇nf1(x)| dx ≤︸︷︷︸

(4.14)

C1ε.

donde C1 depende de n y de k. Pero ε > 0 era arbitrario luego podemos reajustar los cálculos efectuadospara obtener ∑

α∈AR(Iα, k) ≤ ε.

4.5. TEOREMA DE MORSE-SARD 73

Demostración. ( Teorema 4.11)En primer lugar veremos que si I es un intervalo diádico n-dimensional se tiene la siguiente estimación

diamf(I) ≤ CR(I, 0) donde la constante C depende sólo de n.

En efecto si tomamos x, y ∈ I, sabiendo que PI,0[f ] es constante en I y aplicando el Lema 4.5,

diamf(I) = supx,y∈I

|f(x)− f(y)| ≤ supx,y∈I

[|f(x)− PI,0[f ](x)|+ |f(y)− PI,0[f ](y)|] =

= supx∈I|f(x)− PI,0[f ](x)|+ sup

y∈I|f(y)− PI,0[f ](y)| ≤ 2C(n)R(I, 0).

Dado ahora ε > 0 jo tomaremos δ = δ(ε,f,0)2 > 0 siendo δ(ε, f, 0) el que nos da el Lema 4.8. Así para

cada familia 1-regular de intervalos diádicos n-dimensionales Iαα∈A con∑

α∈A `(Iα) < δ(ε, f, 0) entonces∑α∈AR(Iα, 0) < ε y por tanto ∑

α∈Adiamf(Iα) < Cε. (4.17)

Sea E ⊂ Rn tal que H1∞(E) = ınf

∑∞j=1 diamCj : E ⊆

⋃∞j=1Cj

< δ. Entonces existe un recubrimiento

E ⊆⋃∞j=1Dj tal que

∑∞j=1 diamDj < δ. Consideremos Bj∞j=1 una colección de bolas tales que Dj ⊆ Bj

y diamDj = diamBj para todo j ∈ N. Y a su vez tomamos Qj∞j=1 colección de intervalos diádicos n-

dimensionales tales que diamBj ≤ `(Qj) ≤ 2 diamBj y Bj ⊂ Qj para todo j ∈ N. Así sabemos que⋃∞j=1Qj

sigue siendo un recubrimiento de E y que∑∞

j=1 `(Qj) ≤ 2∑∞

j=1 diamBj = 2∑∞

j=1 diamDj < 2δ = δ(ε, f, 0).Aplicamos ahora el Lema 4.7 (para k = 1) a la familia Qj∞j=1 y entonces existirá una familia 1-regular

Iαα∈A de intervalos diádicos n-d1mensionales tales que⋃∞j=1Qj ⊆

⋃α∈A Iα y

∑α∈A

`(Iα) ≤∞∑j=1

`(Qj) < δ(ε, f, 0).

Por consiguiente usando (4.17) ∑α∈A

diam (f(Iα)) < Cε.

Estamos ya en disposición de estimar la medida Hausdor 1-dimensional del conjunto f(E). Observar enprimer lugar que gracias a que H1 ∼ H1

∞ en R,

H1(E) ≤ C1H1∞(f(E)).

Y además f(E) ⊆⋃α∈A f(Iα), por lo que por denición de contenido Hausdor concluimos

H1(f(E)) ≤ C1

∑α∈A

diamf(Iα) ≤ C1Cε.

4.5. Teorema de Morse-Sard

Recuérdese que si f ∈ Wn,1(Rn) y k = 1, . . . , n entonces ∇kf(x) está bien denido para Hk-casi todox ∈ Rn (ver Dorronsoro [13] o Teorema 4.8). En particular, f es diferenciable (en el sentido clásico deFréchet) y la derivada clásica coincide con ∇f(x) = lımx→0 −

∫B(x,r)∇f(y) dy en todos los puntos x ∈ Rn \Af

74 CAPÍTULO 4. TEOREMA DE MORSE-SARD (BOURGAIN-KOROBKOV-KRISTESEN)

donde H1(Af ) = 0 (los puntos de Lebesgue de ∇f son puntos de diferenciabilidad). Por lo tanto, en vistadel Teorema 4.11, H1(f(Af )) = 0.Denamos el conjunto de puntos críticos de f ∈Wn,1(Rn) como sigue

Cf := x ∈ Rn \Af : ∇f(x) = 0 .

Nuestro objetivo en esta sección es probar el siguiente teorema de Morse-Sard para funciones en Wn,1(Rn).

Teorema 4.12. Si f ∈Wn,1(Rn), entonces H1(f(Cf )) = 0 (recordar H1 = L1 en R).

Observación: Es bastante claro que el caso Wn,1(Rn) no está incluido en el Teorema de Morse-Sard deDe Pascale (Teorema 3.2) para espacios W k,p(Rn;R) con k ≥ n y p > n. En nuestro caso p = 1.

La clave para probar el Teorema 4.12 reside en el siguiente lema que enunciamos a continuación.

Lema 4.9. Sea f ∈Wn,1(Rn). Para cada intervalo n-dimensional I ⊂ Rn se verica la siguiente estimación

H1(f(Cf ∩ I)) ≤ C‖∇nf‖L1(I)

donde C > 0 es una constante que sólo depende de n.

Demostración. Fijamos I ⊂ Rn intervalo n-dimensional. Veremos en primer lugar que es suciente queprobemos

H1(f(Cf ∩ I)) ≤ C‖∇nfI,n−1‖L1(Rn)

para cierta constante C = C(n) > 0 y donde fI,n−1(y) = f(y) − PI,n−1[f ](y) para todo y ∈ I. En efecto sisimplemente aplicamos el Lema 4.5 en el caso n− 1,

‖∇nfI,n−1‖L1(Rn) ≤ C0(n)R(I, n− 1) ≤ C0(n)

(‖∇nf‖L1(I)

`(I)0+ ‖∇nf‖L1(I)

)= 2C0(n)‖∇nf‖L1(I).

La idea de la prueba será descomponer el conjunto Cf ∩ I en conjuntos en los que sea más fácil calcular lamedida Hausdor, como por ejemplo conjuntos A tales que H1

∞(A) = 0 pues entonces podremos aplicar elTeorema 4.11 y tener H1(f(A)) = 0.Para simplicar la notación a lo largo de la demostración escribiremos

fI = fI,n−1 = f − PI,n−1[f ]

PI = PI,n−1[f ].

También denotaremos

σ = ‖∇nfI‖L1(Rn) ≤ 2C0(n)‖∇nf‖L1(I) <∞Ej =

x ∈ Rn : (M∇fI(x) ∈ (2j−1, 2j ]

, ∀j ∈ Z

Además llamamos δj al contenido Hausdor 1-dimensional de Ej , es decir,

δj = H1∞(Ej), ∀j ∈ Z.

Estas cantidades están bien denidas porque si aplicamos el Teorema 4.3 a la función ∇fI ∈ Wn−1,1(Rn)para cada j ∈ Z podemos escribir

H1∞(Ej) ≤ H1

∞(x ∈ Rn : (M∇fI)(x) > 2j−1

)=

1

2j−2

∫ 2j−1

2j−2

H1∞(x ∈ Rn : (M∇fI)(x) > 2j−1

)dλ ≤

≤ 1

2j−2

∫ 2j−1

2j−2

H1∞ (x ∈ Rn : (M∇fI)(x) > λ) dλ ≤

≤ 1

2j−2

∫ ∞0H1∞ (x ∈ Rn : (M∇fI)(x) > λ) dλ ≤︸︷︷︸

Teo 4.3

1

2j−2C1‖∇nfI‖L1(Rn) <∞.

4.5. TEOREMA DE MORSE-SARD 75

Pero podemos decir aún mucho más, pues mediante argumento similares y usando de nuevo de manera claveel Teorema 4.3 se obtiene también

+∞∑j=−∞

H1∞(Ej)2

j =+∞∑j=−∞

2j

2j−2

∫ 2j−1

2j−2

H1∞(x ∈ Rn : (M∇fI(x) ∈ (2j−1, 2j ]

)dλ ≤

≤+∞∑j=−∞

4

∫ 2j−1

2j−2

H1∞(x ∈ Rn : (M∇fI(x) > 2j−1

)dλ ≤

≤+∞∑j=−∞

4

∫ 2j−1

2j−2

H1∞ (x ∈ Rn : (M∇fI(x) > λ) dλ =

= 4

∫ ∞0H1∞ (x ∈ Rn : (M∇fI(x) > λ) dλ ≤ 4C1σ = C2σ. (4.18)

donde C2 depende sólo4 de n.Probemos ahora el siguiente aserto:

Aserto: Para cada j ∈ Z tal que δj = H1∞(Ej) > 0 existe una familia de bolas n- dimensionales

Bij∞i=1 de radios rij > 0 y tales que

Ej ⊆∞⋃i=1

Bij y∞∑i=1

rij ≤ 2δj .

Fijemos un j como indica el enunciado y consideremos la cantidad 2δj que es estrictamente mayorque δj . Por la denición de contenido Hausdor 1-dimensional aseguramos entonces la existencia deun recubrimiento de Ej , digamos Fij∞i=1, tal que

∑∞i=1(diamFij) ≤ 2δj . Ahora para cada Fij ⊆ Rn

tomamos Bij bola con radio rij = diamFij y con Fij ⊆ Bij (conviene advertir que no es cierto en generalque un conjunto cualquiera con cierto diámetro esté incluido en una bola del mismo diámetro, piénsesepor ejemplo en un triángulo equilátero en R2). Entonces Ej ⊆

⋃∞i=1Bij y además

∑∞i=1 diamFij =∑∞

i=1 rij ≤ 2δj , lo que naliza la prueba del aserto.

Denimos los siguientes conjuntos

Cij := Cf ∩ I ∩ Ej ∩Bij , ∀i ∈ N ∀j ∈ Z

C∞ := Cf ∩ I \

∞⋃i=1

j=−∞

Cij

.

De esta forma ya tenemos descompuesto Cf ∪ I = C∞ ∪⋃∞i=1

⋃∞j=−∞Cij de una manera óptima que nos

permitirá demostrar el lema. Observemos en un primer momento los siguientes hechos:

(1) C∞ ⊆ x ∈ Rn : (M∇fI)(x) =∞.

Si x ∈ C∞ entonces x /∈⋃∞i=1

⋃∞j=−∞Cij . Por lo tanto como x ∈ C∞ también implica que x ∈ Cf ∩ I

entonces x /∈⋃∞j=−∞Ej =

⋃∞i=1

⋃∞j=−∞CijEj ∩ Bij . Así x /∈ Ej para todo j ∈ Z, y por la denición

de los conjuntos Ej ya tenemos que (M∇fI)(x) =∞.

4Realmente la constante del Teorema 4.3 depende de n y de k, pero en nuestro caso estamos aplicando el teorema conk = n− 1 luego la constante sólo depende de n.

76 CAPÍTULO 4. TEOREMA DE MORSE-SARD (BOURGAIN-KOROBKOV-KRISTESEN)

(2) H1∞(C∞) = 0.

Por reducción al absurdo, supongamos que H1∞ > 0, entonces tendríamos∫ ∞

0H1∞ (x ∈ Rn : (M∇fI)(x) > λ) dλ ≥

∫ ∞0H1∞ (x ∈ Rn : (M∇fI)(x) =∞) dλ ≥

≥︸︷︷︸(1)

∫ ∞0H1∞(C∞) dλ =∞.

Pero esto contradice el Teorema 4.3, el cual nos dice que∫ ∞0H1∞ (x ∈ Rn : (M∇fI)(x) > λ) dλ ≤ C1σ <∞.

(3) H1∞(C∞) = 0.

Basta aplicar el Teorema 4.11 y el apartado (2).

(4) Si H1∞(Ej) = 0 entonces H1(f(Cij)) = 0 para todo i ∈ N.

En efecto si H1∞(Ej) = 0 entonces como Cij ⊆ Ej para todo i ∈ N, se tiene que H1

∞(Cij) = 0 paracada i ∈ N. Aplicando de nuevo el Teorema 4.11 se obtiene el resultado.

La subaditividad numerable de la medida Hausdor nos permite escribir

H1(f(Cf ∩ I)) = H1(f(Cf ∪∞⋃i=1

j=−∞

Cij)) = H1(f(C∞) ∪ f(∞⋃i=1

j=−∞

Cij)) =

= H1(f(C∞)) +H1(f(∞⋃i=1

j=−∞

Cij)) ≤ 0 +∞∑i=1

j=−∞

H1(f(Cij)). (4.19)

Por este motivo y gracias a (4) será suciente estimar H1(f(Cij)) para i ∈ N, j ∈ Z y con δj = H1∞(Ej) > 0

(podremos así usar el Aserto).Fijemos entonces i ∈ N y j ∈ Z, tal que δj > 0, hasta el nal de la demostración. Para cada x ∈ Cf ∩ Itenemos ∇PI(x) = −∇fI(x) (∇f(x) = 0). Se cumple la siguiente inclusión

Cij ⊆x ∈ Bij : |∇PI(x)| = |∇fI(x)| ≤ (M∇fI)(x) ≤ 2j

. (4.20)

En efecto, sea x ∈ Cij :

(a) x ∈ Bij

(b) x ∈ Cf ∩ I luego |∇PI(x)| = |∇fI(x)|.

(c) x ∈ Ej luego (M∇fI)(x) ≤ 2j .

(d) Si tomamos por denición función maximal de Hardy-Littlewood (lo que no modica nada de lo ante-rior)

(M∇fI)(x) = supr>o−∫B(x,r)

|∇fI(y)| dy,

por el Lema 1.2 se deduce que |∇fI(x)| ≤ (M∇fI)(x).

4.5. TEOREMA DE MORSE-SARD 77

Encontraremos para acabar un buen recubrimiento por bolas del conjunto f(Cf ∩ I). Para ello entran enescena de manera muy importante el Corolario 4.2 y el Corolario 4.7 de secciones anteriores.

Utilizando las notaciones del Corolario 4.2 aplicaremos este resultado al polinomio PI de grado comomucho n− 1 y siendo

B = Bij ; r = rij ; ε = 2j .

Entonces Ent(2jrij ,

PI(x) : x ∈ Bij , |∇PI(x)| ≤ 2j

)≤ C3, donde C3 sólo depende de n. Es decir que

gracias a que PI(Cij) ⊆PI(x) : x ∈ Bij , |∇PI(x)| ≤ 2j

((4.20)) podemos encontrar un conjunto nito de

bolas TkC3k=1 en R de radios menores o iguales que 2jrij que recubren a PI(Cij).

Por otro lado, si aplicamos el Corolario 4.7 a la función fI ∈ Wn,1(Rn) y siguiendo las notaciones delcorolario tomamos

B = Bij ; r = rij ; ε = 2j ,

entonces diamfI(x) : x ∈ Bij , (M∇fI)(x) ≤ 2j

≤ C42jrij donde C4 depende sólo de n. Por lo tanto otra

vez gracias a (4.20) podemos decir que para todo x, y ∈ Cij

|fI(x)− fI(y)| ≤ C42jrij .

Sea ahora y′ un punto cualquiera de Cij y consideremos la familia de bolas T ′kC3

k=1 en R tales que centro T ′k =(centro Tk + fI(y

′)) y con radios (1 + C4)2jrij . Comprobemos entonces que

f(Cij) ⊆C3⋃k=1

T ′k. (4.21)

En efecto, sea y ∈ Cij . Sea k1 ∈ 1, . . . , C3 tal que PI(y) ∈ Tk1 . Entonces∣∣f(y)−(centro Tk1 + fI(y

′))∣∣ ≤ |PI(y)− centro Tk1 |+ |fI(y)− fI(y′)| ≤ 2jrij + C42jrij = (1 + C4)2jrij .

Y concluyendo ya la prueba, usando el recubrimiento dado por (4.21) y que = L1(T ′k) = 2radio T ′k,

H1(f(Cij)) = L1(f(Cij) ≤C3∑k=1

L1(T ′k) ≤C3∑k=1

2radio T ′k =

C3∑k=1

2C3(1 + C4)2jrij .

Por consiguiente

H1(f(Cf ∩ I)) ≤︸︷︷︸(4.19)

∞∑i=1

j=−∞

H1(f(Cij)) ≤∞∑i=1

j=−∞

2C3(1 + C4)2jrij = 2C3(1 + C4)

∞∑j=−∞

2j∞∑i=1

rij ≤

≤︸︷︷︸Aserto

2C3(1 + C4)

∞∑j=−∞

2j2δj ≤ 4C3(1 + C4)∞∑

j=−∞2jδj ≤︸︷︷︸

(4.18)

C5σ.

Antes de encarar la demostración del Teorema de Morse-Sard para el espacio de SobolevWn,1(Rn), veamosun par de corolarios del lema anterior.

Corolario 4.13. Sea f ∈ Wn,1(Rn). Para cada ε > 0 existe δ > 0 tal que para todo conjunto E ⊂ Rn, siHn∞(E) ≤ δ entonces H1(f(Cf ∩ E)) ≤ ε. En particular H1(f(Cf ∩ E)) = 0 para cualquier E ⊂ Rn conHn∞(E) = 0.

78 CAPÍTULO 4. TEOREMA DE MORSE-SARD (BOURGAIN-KOROBKOV-KRISTESEN)

Demostración. La segunda parte del enunciado es clara.

Para la primera parte jemos ε > 0. |∇nf | es una función positiva, medible e integrable por lo queaplicando la continuidad absoluta de la integral de Lebesgue (véase Teorema 1.5) se tiene que existe δ > 0tal que si Ln(A) < C1δ (C1 es la constante que da la equivalencia Ln ∼ Hn∞ en Rn en el sentido de queLn(A) ≤ C1Hn∞(A) para todo A ⊆ Rn) entonces∫

A|∇nf(x)| dx < ε

C,

donde C es la constante que da el Lema 4.9.Cojamos ahora un conjunto E ⊂ Rn tal que Hn∞(E) ≤ δ. Se sigue que Ln(E) ≤ C1Hn∞(E) ≤ C1δ y porconsiguiente

∫E |∇

nf(x)| dx ≤ εC .

Con intención de usar el lema anterior recubriremosE por una cantidad numerable de intervalos n-dimensionalescon interiores disjuntos, digamos E ⊆

⋃∞i=1 Ii. Así podemos escribir nalmente

H1(f(Cf ∩ E)) ≤ H1(f(Cf ∩∞⋃i=1

Ii)) = H1(∞⋃i=1

(Cf ∩ Ii)) ≤∞∑i=1

H1(f(Cf ∩ Ii)) ≤

≤︸︷︷︸Lema 4.9

∞∑i=1

C‖∇nf‖L1(Ii) ≤ C∫E|∇nf(x)| dx ≤ C ε

C= ε.

Corolario 4.14. Sea f ∈Wn,1(Rn). Existe un conjunto C0,f de medida de Lebesgue n-dimensional nula talque H1(f(Cf \ C0,f )) = 0. En particular, H1(f(Cf )) = H1(f(C0,f )).

Demostración.

1a Parte:Para cada j ∈ Nn nos jamos en 1

j > 0 y como f ∈ Wn,1(Rn) podemos aplicar el Teorema 4.9 ( conk = l = n en las notaciones del teorema) y asegurar la existencia de un conjunto abierto Uj ⊂ Rn yuna función gj ∈ Cn(Rn) tales que Hn∞(Uj) < C1

1j (donde C1 es la misma constante que en el lema

anterior) y f = gj , ∇mf = ∇mgj para todo m = 1, . . . , n en Rn \ Uj .De esta forma los puntos críticos de f y de gj coinciden en Rn \ Uj .

Cf ∩ (Rn \ Uj) = Cgj ∩ (Rn \ Uj).

La idea es que ahora para cada j ∈ N podemos aplicar el Teorema de Morse- Sard Clásico a las funcionesgj para establecer que

H1(gj(Cgj )) = L1(gj(Cgj )) = 0.

Así H1(gj(Cgj ∩ (Rn \ Uj))) = 0 y entonces

H1(f(Cf ∩ (Rn \ Uj))) = H1(f(Cf \ Uj)) = 0.

Denimos entonces

C0,f = Cf ∩∞⋂j=1

Uj

4.6. APLICACIÓN A LOS CONJUNTOS DE NIVEL 79

1. Ln(C0,f ) ≤ Ln(⋂∞j=1 Uj) ≤ Ln(Uk) ≤ C1Hn∞(Uk) ≤ C1

1k para todo k ∈ N. Entonces es claro que

Ln(C0,f ) = 0.

2. H1(f(Cf \C0,f )) = H1(f(Cf∩(⋂∞j=1 Uj)

c)) = H1(f(Cf∩(⋃∞j=1 U

cj ))) ≤

∑∞j=1H1(f(Cf \Uj)) = 0.

2a Parte:Gracias a que C0,f ⊆ Cf (por denición) se sigue automáticamente usando la primera parte que

H1(f(Cf )) = H1(f(C0,f ∪ (Cf \ C0,f ))) = H1(f(C0,f )) +H1(f(Cf \ C0,f )) = H1(f(C0,f )).

Demostración. (Teorema 4.12)Dada f ∈Wn,1(Rn) por el Corolario 4.14 existirá un conjunto C0,f ⊆ Cf tal que

Ln(C0,f ) = 0 y H1(f(Cf \ C0,f )) = 0. (4.22)

Ahora por el Corolario 4.13, como Hn∞(C0,f ) = 0, se obtiene

H1(f(Cf ∩ C0,f )) = H1(f(C0,f )) = 0. (4.23)

Juntando estos dos hechos, (4.22) y (4.23), se naliza la prueba.

Cabe resaltar en la demostración que hemos presentado que se utiliza en ella el Teorema de Morse-Sardclásico, luego no se trata de una prueba alternativa de este teorema. Sin embargo el Teorema de Morse-Sarddado en el Capítulo 3 no utiliza el teorema clásico en ningún momento luego la prueba presentada ahí sí queserviría como una demostración diferente de éste.

4.6. Aplicación a los conjuntos de nivel

Denición 4.7. Dada una función f : Rn −→ R, un conjunto de nivel de f es un conjunto de la forma

Sc(f) = x ∈ Rn : f(x) = c , c ∈ R,

es decir el conjunto de puntos de Rn donde la función toma el valor constante c ∈ R.

Conocer la estructura de los conjuntos de nivel tiene multitud de aplicaciones en todas las ramas de lasmatemáticas.

Por ejemplo para funciones g : Rn −→ R que son C1 y cuyo gradiente en los puntos de cierto conjunto denivel no es cero se conoce, por el Teorema de la Función Implícita, que el susodicho conjunto de nivel es unavariedad (n− 1)−dimensional y sin borde.

Nosotros buscamos dar un resultado sobre la estructura de estos conjuntos para funciones que están en elespacio Wn,1(Rn). El lector puede encontrar en el artículo de Bourgain-Korobkov-Kristensen [8] los resulta-dos que presentamos a continuación.

En primer lugar el Teorema 4.9 aplicado al caso k = 1, l = n implica:

Teorema 4.15. Sea f ∈ Wn,1(Rn). Entonces para todo ε > 0 existe un conjunto abierto U ⊂ Rn y unafunción g ∈ C1(Rn) tal que H1

∞(U) < ε y f = g, Df = Dg en Rn \ U .

80 CAPÍTULO 4. TEOREMA DE MORSE-SARD (BOURGAIN-KOROBKOV-KRISTESEN)

Corolario 4.16. Sea f ∈ Wn,1(Rn). Entonces para todo ε > 0 existe un conjunto abierto V ⊂ Rn y unafunción g ∈ C1(Rn) tal que H1(V ) < ε, f(Af ) ⊂ V y f |f−1(R\U = g|f−1(R\U , Df |f−1(R\U) = Dg|f−1(R\U) 6= 0.

Demostración. El resultado será una consecuencia del Teorema 4.15, Teorema 4.11 y Teorema 4.12.El conjunto Af ya apareció con anterioridad y denota el conjunto de puntos donde Df(x) no está denidaen el sentido clásico de Fréchet. Además H1(Af ) = 0 (ver Teorema 4.8).Por el Teorema 4.12 sabemos que H1(f(Cf )) = 0 donde recordamos

Cf = x ∈ Rn \Af : Df(x) = 0 .

Fijemos ε > 0. Por el Teorema 4.11 existirá δ > 0 tal que para cualquier conjunto E ⊂ Rn con H1∞ < δ

entonces H1(f(E)) < ε. Para ese δ > 0, utilizamos el Teorema 4.15 para garantizar la existencia de unconjunto abierto U ⊂ Rn y una función g ∈ C1(Rn) tal que H1

∞(U) < δ y f = g, Df = Dg en Rn \ U .Denimos entonces

V = f(U ∪Af ∪ Cf ).

(1o) Tenemos H1∞(U ∪Af ) ≤ H1

∞(U) +H1∞(Af ) = H1

∞ < δ. Entonces H1(f(U ∪Af )) < ε y por lo tanto

H1(V ) ≤ H1(f(U ∪Af )) +H1(f(Cf )) = H1(f(U ∪Af )) + 0 < ε.

(2o) f(Af ) ⊆ f(U ∪Af ∪ Cf ) = V .

(3o) Si x /∈ f−1(R \ V ) entonces x /∈ (U ∪Af ∪Cf ). En particular Df(x) está bien denido y como x /∈ U ,f(x) = g(x) y Df(x) = Dg(x). Además x /∈ Cf luego Df(x) = Dg(x) 6= 0.

Finalmente tenemos el resultado que buscábamos:

Teorema 4.17. Sea f ∈Wn,1(Rn). Entonces para casi todo y ∈ R, la preimagen f−1(y) es una unión nitadisjunta de variedades compactas sin frontera de dimensión (n− 1) y C1.

Demostración.

1. Para cada ε > 0 existe Rε > 0 tal que |f(x)| < ε para todo x ∈ Rn \B(0, Rε).

Por el Lema 4.5 f tiene un representante continuo. Además

∫Rn|f(x)| dx <∞. Esto demuestra el

aserto.

Fijemos ahora ε > 0 y cojamos el correspondiente conjunto V y la función g ∈ C1(Rn) que nos da elCorolario 4.16. Sea también 0 6= y ∈ f(Rn) \ V . Denotaremos por Pf = f−1(y) y Pg = g−1(y) a laspreimágenes de y respecto de f y de g respectivamente.Armamos que se cumplen las siguientes propiedades en estos conjuntos:

2. Pf es un conjunto compacto.En efecto al ser la imagen inversa de un conjunto cerrado por una función continua es cerrado. Y seráacotado por la propiedad 1..

3. Pf ⊆ Pf .Tomemos x ∈ Rn tal que f(x) = y. Como y ∈ f(Rn)\V entonces x /∈ F−1(V ), es decir, x ∈ f−1(R\V )y por lo tanto por el Corolario 4.16, f(x) = g(x) = y.

4.6. APLICACIÓN A LOS CONJUNTOS DE NIVEL 81

4. Df = Dg 6= 0 en Pf .Sea x ∈ Rn tal que f(x) = y. Por un razonamiento análogo al anterior tenemos que x ∈ f−1(R \ V ) ypor el Corolario 4.16, Df(x) = Dg(x) 6= 0.

5. La función f es diferenciable en sentido clásico en cada x ∈ Pf y la derivada clásica coincide conDf(x) = limr→0−

∫B(x,r)Df(z) dz.

Sabemos que f(Af ) ⊂ V . Si tomamos x ∈ Rn tal que f(x) = y /∈ V entonces x /∈ Af y así Df(x) estábien denida. En particular, por el artículo de Dorronsoro [13], Df(x) = limr→0−

∫B(x,r)Df(z) dz.

6. Para cada x0 ∈ Pf existe r > 0 tal que Pf ∩B(x0, r) = Pg ∩B(x0, r).Sea x0 ∈ Pf y por reducción al absurdo supongamos que existe una sucesión de xi∞i=1 con xi ∈ Pg \Pfy tal que xi → x0. Denotamos por Ix al segmento de longitud r con centro en x y paralelo al vector( ∂f∂x1 (x0), . . . , ∂f∂xn (x0)) = ∇f(x0) = ∇g(x0). Claramente existirá un r > 0 sucientemente pequeño demanera que para todo x ∈ Pg ∩B(x0, r) entonces Ix ∩Pg = x. Además por construcción, si cogemosi sucientemente grande para que xi ∈ Pg ∩ B(x0, r) se tiene que Ixi ∩ Pf = ∅. En el segmento Ixi óbien f > y ó bien f < y. Suponemos sin pérdida de generalidad el caso f > y en Ixi para todo i ∈ N,y tomando el límite establecemos que f ≥ y = f(x0) en Ix0 . Pero esto es una contradicción clara conlos apartados 4. y 5. (una función C1 que tiene un mínimo local en la línea paralela a su gradiente enese punto implica que el gradiente debe de ser nulo).

Obviamente por las propiedades 2.-6. y usando lo que sabemos sobre los conjuntos de nivel de funciones C1

concluimos que Pf = f−1(y) es una unión nita (observar que un compacto siempre está formado por a losumo una cantidad nita de componentes conexas) disjunta de variedades compactas sin borde de dimensión(n− 1) y C1 (*).Ahora es inmediato comprobar que realmente para casi todo y ∈ R se cumple (*):

En primer lugar si y /∈ f(Rn) se supone automáticamente que se cumple (*), pues estaríamos trabajandocon el conjunto vacío. Suponemos pues sin pérdida de generalidad que f(Rn) = R.Por reducción al absurdo supongamos que existe N ⊂ R con H1(N) = ε > 0 y tal que f−1(y) no cumple (*)con y ∈ N . Pero en este caso si tomamos ε = ε

2 > 0 usando lo que ya hemos probado existe V ⊂ R tal queH1(V ) < ε y f−1(y) cumple (*) en R\V . Entonces deberíamos tener N ⊂ V lo que es una contradicción.

82 CAPÍTULO 4. TEOREMA DE MORSE-SARD (BOURGAIN-KOROBKOV-KRISTESEN)

Bibliografía

[1] R. Abraham, J.Robbin, Transversal mappings and ows, W. A. Benjamin, Inc., New York-Amsterdam,1967.

[2] D. R. Adams, A note on Choquet integrals with respect to Hausdro capacity, in: Functions spaces andapplications (Lund 1986), Lecture Notes in Math. 1302, Springer (1988), 115-124.

[3] D. Azagra, J. Ferrera, J. Gómez-Gil, The Morse-Sard theorem reviseted, preprint, arXiv:1511.05822v1,18 Nov 2015.

[4] T. Bagby y W. P. Ziemer, Pointwise dierentiability and absolute continuity, Trans. Amer. Math. Soc.19 (1974), 129-148.

[5] S. M. Bates , Toward a precise smoothness hypothesis in Sards theorem,Proc. Amer. Math. Soc. 117(1993),no. 1, 279-283.

[6] B. Bojarski, P. Hajlasz y P. Strzelecki, Improved Ck,λ approximation of higher order Sobolev functionsin norm and capacity, Indiana Univ. Math. J. 51 (2002), no. 3, 507-540.

[7] J. Bourgain, M. V. Korobkov y J. Kristensen, On the Morse-Sard property and level sets of Sobolev andBV functions, Rev. Mat. Iberoam. 29 (2013), no. 1, 1-23.

[8] J. Bourgain, M. V. Korobkov y J. Kristensen, On the Morse-Sard property and level sets ofWn,1 Sobolevfunctions on Rn, J. Reine Angew. Math. 700 (2015), 93-112.

[9] H. Brezis Functional analysis, Sobolev spaces and partial dierential equations, Springer, New York,2011.

[10] A. P. Calderón y A. Zygmund Local properties of solutions of elliptic partial dierential equations,Studia Math. 62 (1961), 171-225.

[11] M. Coste , Ensembles semi-alegriques. In: Geometrie algebrique relle et formes quadratiques, LectureNotes in Mathematics, Vol. 952, 109-138, Berlin, Heidelberg, New York, 1982.

[12] R. Devore y R. Sharpley Maximal operators and smoothness, Mem. Amer. Math. Soc. 293 (1984).

[13] J. R. Dorronsoro Dierentiability properties of functions with bounded variation, Indiana Univ. Math.J. 38 (1989), no. 4, 1027-1045.

[14] J. R. Dorronsoro Poisson integrals of regular functions, Trans. Amer. Math. Soc. 297 (1986), 669-685.

[15] L. De Pascale, The Morse-Sard theorem in Sobolev sapces, Indiana Univ. Math. J. 50 (2001), 1371-1386.

[16] L. C. Evans Partial dierential equations (second edition) Gradiate Textd in Mathematics, Volume19, Amer. Mtah. Soc. 2010.

83

84 BIBLIOGRAFÍA

[17] L. C. Evans y R. F. Gariepy, Measure theory and ne properties of functions, Studies in AdvancedMathematics. CRC Press, Boca Raton, FL, 1992.

[18] H. Federer, Geoemtric measure theory, Springer, New York, 1969.

[19] A. Figalli, A simple proof of the Morse-Sard theorem in Sobolev spaces, Proc.Amer. Math. Soc. 136(2008), no. 10, 3675-3681.

[20] Fon Che Liu, A Luzin type property of Sobolev functions Indiana Univ. Math. J. 26 (1977), 645-651.

[21] P. Hajlasz y S. Zimmerman, Dubovitskij-Sard theorem for Sobolev mappings, preprint, ar-Xiv:1506.00025.

[22] B. Malgrange , Ideals of dierentiable functions, Tata Institute of Fundamental Research (1966).

[23] J. Malý, D. Swanson y W. P. Ziemer, The co-area formula for Sobolev mappings, Trans. Amer. Math.Soc. 355 (2003) no 2, 477-492.

[24] V. G. Maz'ya, Sobolev spaces, Springer, Berlin, 1985.

[25] A. P. Morse, The behavior of a function on its critical set, Ann. of Math. 40 (1939), 62-70.

[26] S. Lojasiewicz, Ensembles semi-analytiques, IHES Lecture notes 1965.

[27] W. Rudin, Real and Complex Analysis, Third Edition, McGraw-Hill 1987.

[28] A. Sard, The measure of the critical values of dierentiable maps, Bull. Amer. Math. Soc. 48(1942),883-890.

[29] E.M. Stein, Singular integrals and dierentiability properties of functions, Princeton University Press,Princeton, 1970.

[30] H. Whitney, Elemenatry structure of real algebraic varieties, Ann. Math. 66, 545-556(1957).

[31] Y. Yomdin, The geometry of critical and near-critical value of dierentiable mappings, Math. Ann.264 (1983), no. 4, 495-515.

[32] W. P. Ziemer , Weakly dierentiable functions. Sobolev spaces and functions of bounded variation,Graduate Texts in Mathematics, 120. Springer-Verlag, New York, 1989.