002 cap 2 conceptos basicos

44
Conceptos Básicos En este capítulo se revisan los conceptos y resultados básicos del cálculo diferencial. Su contenido no refleja la forma en que el autor piensa que debe enseñarse el Cálculo, sino más bien lo que éste cree que un profesor de Cálculo debería saber. Un curso de Cálculo para estudiantes que lo vean por primera vez requeriría de mucha más motivación, ejemplos y ejercicios. Además, el grado de formalidad y rigor debería adaptarse al nivel y objetivos del curso. No debe olvidarse que la mayor parte del Cálculo se desarrolló antes de poseer definiciones formales de los conceptos básicos (como los de número real y límite), y por lo tanto un curso para estudiantes interesados en aplicar el cálculo no necesita detenerse en los aspectos más sutiles de su fundamentación. Como se supone que el lector ya está más o menos familiarizado con estos temas, las demostraciones que se incluyen son bastante concisas y esquemáticas. Los ejercicios, más que a desarrollar habilidades específicas, están destinados a refrescar la memoria del lector o a llamar la atención sobre puntos interesantes o delicados. Para una exposición más completa el lector puede consultar la bibliografía, por ejemplo [2], [9] o [13]. 2.1. Los números reales Para el desarrollo riguroso del cálculo son imprescindibles los números reales. Pero hasta la segunda mitad del siglo XIX no hubo una definición formal ni un tratamiento riguroso de los números reales, de modo que se puede decir que los creadores del cálculo y los matemáticos que lo desarrollaron en sus primeros dos siglos, lo hicieron a pesar de poseer tan sólo una comprensión intuitiva de los números reales. Esta noción intuitiva asimilaba un número real a la medida de una magnitud (longitud, área, tiempo, etc.) e incluía la posibilidad de aproximarlo con cualquier grado de precisión mediante fracciones, o mediante expresiones decimales finitas. También se aceptaba que, fijados un origen O y un punto A en una recta, a cada punto B de la recta se le puede hacer corresponder www.Matematica1.com

Transcript of 002 cap 2 conceptos basicos

Page 1: 002 cap 2 conceptos basicos

Capítulo 2

Conceptos Básicos

En este capítulo se revisan los conceptos y resultados básicos del cálculodiferencial. Su contenido no refleja la forma en que el autor piensa que debeenseñarse el Cálculo, sino más bien lo que éste cree que un profesor de Cálculodebería saber.

Un curso de Cálculo para estudiantes que lo vean por primera vez requeriríade mucha más motivación, ejemplos y ejercicios. Además, el grado de formalidady rigor debería adaptarse al nivel y objetivos del curso. No debe olvidarse quela mayor parte del Cálculo se desarrolló antes de poseer definiciones formalesde los conceptos básicos (como los de número real y límite), y por lo tanto uncurso para estudiantes interesados en aplicar el cálculo no necesita detenerse enlos aspectos más sutiles de su fundamentación.

Como se supone que el lector ya está más o menos familiarizado con estostemas, las demostraciones que se incluyen son bastante concisas y esquemáticas.Los ejercicios, más que a desarrollar habilidades específicas, están destinados arefrescar la memoria del lector o a llamar la atención sobre puntos interesanteso delicados. Para una exposición más completa el lector puede consultar labibliografía, por ejemplo [2], [9] o [13].

2.1. Los números reales

Para el desarrollo riguroso del cálculo son imprescindibles los números reales.Pero hasta la segunda mitad del siglo XIX no hubo una definición formal niun tratamiento riguroso de los números reales, de modo que se puede decirque los creadores del cálculo y los matemáticos que lo desarrollaron en susprimeros dos siglos, lo hicieron a pesar de poseer tan sólo una comprensiónintuitiva de los números reales. Esta noción intuitiva asimilaba un número real ala medida de una magnitud (longitud, área, tiempo, etc.) e incluía la posibilidadde aproximarlo con cualquier grado de precisión mediante fracciones, o medianteexpresiones decimales finitas. También se aceptaba que, fijados un origen O y unpunto A en una recta, a cada punto B de la recta se le puede hacer corresponder

www.Mate

matica

1.com

Page 2: 002 cap 2 conceptos basicos

12 Conceptos Básicos

un número real igual a la medida del segmento OB respecto a la unidad OA,y que recíprocamente para cada número real x existe un único punto B en larecta tal que la medida del segmento OB respecto a la unidad OA es x.

En la enseñanza media los números reales se definen como expresiones deci-males infinitas g, a1a2a3 . . ., donde g es un número entero (posiblemente prece-dido de un signo + ó −) y a1, a2, a3, . . . son dígitos. Las expresiones decimalesfinitas pueden identificarse con expresiones decimales infinitas agregándoles in-finitos ceros a la derecha. También se enseña que a cada número racional lecorresponde o bien una expresión decimal finita o bien una expresión decimalinfinita periódica, mientras que las expresiones decimales infinitas no periódicasson números irracionales.

Este enfoque, aunque aceptable, presenta varios problemas, entre los cualesse pueden mencionar los siguientes:

1. Hace depender a los números reales del sistema decimal. Una buena defi-nición debería ser independiente de la base en que se representen.

2. Hay expresiones diferentes que corresponden al mismo número, por ejem-plo 1,5 = 1,4999 . . .

3. Definir las operaciones básicas (la suma, y especialmente el producto) conexpresiones decimales infinitas, presenta ciertas dificultades.

4. Tampoco es sencillo demostrar las propiedades básicas de las operaciones(asociatividad, distributividad, etc.)

Por esas razones en la segunda mitad del siglo XIX varios matemáticos (entreellos Cantor, Méray, Dedekind y Weierstrass) trabajaron para poner al núme-ro real sobre bases más sólidas, proponiendo diversas formas de construirlos apartir de los racionales. Entre los métodos propuestos se pueden mencionar lascortaduras de Dedekind, los pares de clases contiguas, los pares de sucesionesmonótonas contiguas y las sucesiones de Cauchy.

Veamos brevemente el método de las cortaduras (para más detalles vea [8]).Una cortadura es un par (I, S) de subconjuntos no vacíos del conjunto Q de losnúmeros racionales, tales que

1. I ∪ S = Q, I ∩ S = ∅.

2. si x ∈ I y y ∈ S, entonces x < y.

3. I no tiene elemento máximo.

Al conjunto I se le llama clase inferior y al S clase superior de la cortadura.Observe que la clase inferior I determina completamente la cortadura, ya quela clase superior S es el complement6o de I en Q.

Para cada número racional q se puede construir una cortadura (Iq, Sq) po-niendo Iq = {x ∈ Q : x < q}, Sq = {x ∈ Q : x ≥ q}. Observe que en estacortadura q es el mínimo de la clase superior.

www.Mate

matica

1.com

Page 3: 002 cap 2 conceptos basicos

2.1 Los números reales 13

Un ejemplo más interesante es el siguiente: I = {x ∈ Q : x < 0 ó x2 < 2},S = {x ∈ Q : x > 0y x2 ≥ 2}. En esta cortadura, ni la clase inferior tiene máxi-mo ni la clase superior tiene mínimo. Si supiéramos qué cosa es

√2, podríamos

decir que la clase inferior contiene todas las aproximaciones por defecto de esenúmero, y la clase superior todas las aproximaciones por exceso. La idea de De-dekind fue sencillamente definir

√2 mediante esa cortadura. En otras palabras,

para Dedekind un número real es una cortadura.El conjunto de todos los números reales se denota R. En R es muy fácil definir

un orden: si α = (I, S) y α′ = (I ′, S′) son números reales, se dice que α ≤ α′

si I ⊆ I ′. Es inmediato verificar que ≤ es una relación reflexiva, transitiva yantisimétrica.

La suma α + α′ es la cortadura cuya clase inferior es I + I ′ = {x+ x′ : x ∈I, x′ ∈ I ′}. Es inmediato probar que la adición es conmutativa y asociativa, yque el cero (definido por la cortadura con clase inferior {x ∈ Q : x < 0}) es unelemento neutro para esta operación.

También se puede definir el producto y probar las leyes asociativa, conmu-tativa y distributiva.

Lamentablemente para analizar en detalle cualquiera de las construcciones delos números reales se requiere un tiempo del que generalmente no se dispone enlos cursos de cálculo. Además exige un esfuerzo que tal vez sólo se les puede pedira los estudiantes matemáticamente orientados. La alternativa más corriente hoyen día consiste en introducir los números reales axiomáticamente. La ventajade este método, además de la rapidez, es que el estudiante dispone de entradade una lista de propiedades básicas de los números reales, que puede usar comopunto de partida para demostrar otras.

Axiomas del sistema de los números reales

En el enfoque axiomático se supone dado un conjunto R que contiene doselementos distinguidos 0 y 1, en el cual están definidas dos operaciones binarias+ y · (suma y producto) y una relación <, de manera tal que se cumplen lossiguientes axiomas:

A1. a+ (b + c) = (a+ b) + c para todos los a, b, c ∈ R.

A2. a+ b = b+ a para todos los a, b ∈ R.

A3. a+ 0 = a para todo a ∈ R.

A4. Para todo a ∈ R existe −a ∈ R tal que a+ (−a) = 0.

A5. a · (b · c) = (a · b) · c para todos los a, b, c ∈ R.

A6. a · b = b · a para todos los a, b ∈ R.

A7. a · 1 = a para todo a ∈ R.

A8. Para todo a ∈ R \ {0} existe un a−1 ∈ R tal que a · a−1 = a−1 · a = 1.

www.Mate

matica

1.com

Page 4: 002 cap 2 conceptos basicos

14 Conceptos Básicos

A9. 1 6= 0.

A10. a · (b + c) = a · b + a · c para todos los a, b, c ∈ R.

A11. Para a, b, c ∈ R, si a < b y b < c entonces a < c.

A12. Si a, b ∈ R, una y sólo una de las siguientes afirmaciones es cierta:(i) a < b, (ii) a = b, (iii) b < a.

A13. Para a, b, c ∈ R, si a < b entonces a+ c < b+ c.

A14. Para a, b, c ∈ R, si a < b y 0 < c entonces a · c < b · c.

A15. Cualquier subconjunto de R no vacío y acotado superiormente tiene unacota superior mínima.

La mayoría de estos axiomas corresponden a conocidas propiedades: A1 yA2 son las propiedades asociativa y conmutativa de la suma, A3 dice que el 0es neutro para la suma, A4 afirma la existencia de un opuesto aditivo para cadaa ∈ R, A5 y A6 son las propiedades asociativa y conmutativa para el producto,A7 dice que 1 es neutro para el producto, A8 afirma la existencia de un inversomultiplicativo para cada a 6= 0, A10 es la propiedad distributiva, A11 es latransitividad de <, A12 es la tricotomía, A13 y A14 son la monotonía de <respecto a la suma y el producto, y A15 es el axioma de completitud, tambiénllamado principio del supremo.

Los axiomas A1...A10 caracterizan la estructura algebraica llamada cuerpo.A11 y A12 son los axiomas de una relación de orden. A13 y A14 relacionanel orden con la estructura algebraica. Los axiomas A1...A14 caracterizan a losllamados cuerpos ordenados. Si se pone el cuerpo Q de los números racionalesen lugar de R en los axiomas A1...A14, todos se satisfacen. El axioma A15 encambio es característico de los números reales, y enseguida lo trataremos conmayor detenimiento.

El enfoque axiomático plantea varias preguntas importantes, entre las cualescabe destacar: (1) ¿Existe algún conjunto R con las propiedades especificadaspor los axiomas? (2) Admitiendo que exista, ¿es esencialmente único? (3) ¿Losaxiomas son consistentes?, es decir, ¿no podrá derivarse de ellos alguna contra-dicción?

La respuesta a la primer pregunta es que, a partir del sistema de los númerosnaturales o de la teoría de conjuntos, se pueden construir modelos de R quesatisfacen todos los axiomas. Esto da una respuesta parcial a la tercera pregunta,ya que reduce la consistencia del sistema de los números reales a la consistenciade la aritmética, o de la teoría de conjuntos. Y decimos que la respuesta esparcial porque estas dos últimas teorías no se sabe si son consistentes.

La respuesta a la segunda pregunta es que estos axiomas realmente caracte-rizan a los números reales, en el sentido de que cualquier par de sistemas que lossatisfagan son isomorfos, tanto algebraicamente como desde el punto de vistadel orden.

www.Mate

matica

1.com

Page 5: 002 cap 2 conceptos basicos

2.1 Los números reales 15

Ejercicio 2.1. Sea Q(√

2) = {a+ b√

2 : a, b ∈ Q}. Pruebe que poniendo Q(√

2)en lugar de R en los axiomas A1...A14, todos ellos se satisfacen.

Recordemos ahora algunas definiciones:

Definición 2.1. Un número real c es cota superior de un conjunto A ⊂ R, sipara todo a ∈ A se cumple a ≤ c. En este caso se dice que A está acotadosuperiormente. Un número real M es máximo de A ⊂ R, si M es cota superiorde A y además M ∈ R. Análogamente d ∈ R es cota inferior de A si para todoa ∈ A se cumple d ≤ a (en este caso se dice que A está acotado inferiormente) ym ∈ R es mínimo de A, si m es cota inferior de A y además m ∈ R. Un conjuntoes acotado si lo está tanto superior como inferiormente. Si el conjunto de las cotassuperiores de un conjunto A tiene mínimo, a ese mínimo se le llama supremo oextremo superior de A y se denota supA. Análogamente, si el conjunto de lascotas inferiores de A tiene máximo, a ese máximo se le llama ínfimo o extremoinferior de A, y se denota ınf A.

Es claro que el máximo y el mínimo de un conjunto, si existen, son únicos.

Ejemplo 2.1. Sea R+ = {x ∈ R : x > 0} la semirecta real positiva. R+ notiene ninguna cota superior, pero cualquier número real c ≤ 0 es cota inferior.El 0 es la mayor cota inferior, por lo tanto 0 es el ínfimo de R+. Como 0 6∈ R+,R+ no tiene mínimo.

Ejemplo 2.2. Sea X = {−3,−1, 0,√

2, 2, π}. Entonces −5 es cota inferior, 5 escota superior, -3 es mínimo y π es máximo de X .

Ejercicio 2.2. Pruebe que c = supA si y sólo si c es cota superior de A y, paratodo b < c, existe a ∈ A tal que b < a ≤ c. Enuncie y pruebe una condiciónsimilar para los ínfimos.

El axioma A15 se puede enunciar de la siguiente manera.

Principio del supremo: Todo conjunto no vacío y acotado superiormente denúmeros reales tiene supremo.

En el conjunto Q de los números racionales el Principio del supremo novale. Por ejemplo, el conjunto A = {x ∈ Q : x < 0 ó x2 < 2} es acotadosuperiormente por 3/2 (ya que si x ≥ 3/2 entonces x2 ≥ 9/4 > 2 y x 6∈ A), perono tiene supremo en Q.

Para probarlo, comencemos por recordar la conocida demostración de que2 no es el cuadrado de ningún número racional. Supongamos, por absurdo, queexistiese un número racional cuyo cuadrado sea 2, y expresémoslo mediante unafracción irreducible p/q. Entonces (p/q)2 = 2, de donde p2 = 2q2 y p2 seríapar. Pero entonces p debe ser par y lo podemos escribir como p = 2r, paraalgún entero r. Como (2r)2 = 2q2, es decir 4r2 = 2q2, se sigue que 2r2 = q2, yresulta que q también debería ser par, contradiciendo el hecho de que p/q erauna fracción irreducible.

www.Mate

matica

1.com

Page 6: 002 cap 2 conceptos basicos

16 Conceptos Básicos

En segundo lugar probaremos que para todo x ∈ A existe otro x′ ∈ A talque x′ > x. En efecto, si x < 1 basta tomar x′ = 1. Si x ≥ 1, sea h = (2−x2)/4.Como 1 ≤ x2 < 2 se tiene 0 < h ≤ 1/4. Entonces (x + h)2 = x2 + (2x + h)h <x2 + (3 + 1/4)h < x2 + 4h = 2. Es decir que si tomamos x′ = x + h se tienex′ ∈ A y x′ > x.

También se cumple que, si y > 0 y y2 > 2, entonces existe y′ tal que 0 <y′ < y y y2 > 2. En efecto, si ponemos x = 2/y se tiene x2 = 4/y2 < 4/2 = 2,y entonces como acabamos de ver existe x′ ∈ A tal que x′ > x. Si tomamosy′ = 2/x′ entonces y′ = 2/x′ < 2/x = y y y′2 = 4/x′2 > 4/2 = 2.

Ahora es fácil probar que A no tiene supremo en Q. En efecto, si c < 0 óc > 0 y c2 < 2, entonces c ∈ A, y como vimos existe un c′ ∈ A tal que c′ > c,por lo tanto c no puede ser cota superior de A.

Si c > 0 y c2 > 2, entonces ciertamente c es cota superior de A, pero comoexiste c′ tal que 0 < c′ < c y c′2 > 2, c no es cota superior mínima de A.

El único caso que quedaría por examinar es cuando c > 0 y c2 = 2, pero esoya vimos que no es posible.

En el conjunto de los números reales R, el conjunto A debe tener un supremoc > 0. Como ya sabemos que no puede ser c2 < 2 ni c2 > 2, la única posibilidadque queda es c2 = 2, y ese es el número que llamamos

√2.

Por razones de simetría, existe también un

Principio del ínfimo: Todo conjunto no vacío y acotado inferiormente denúmeros reales tiene ínfimo.

El Principio del ínfimo y el Principio del supremo son equivalentes (verejercicios).

Prueba del Principio del Supremo

Cuando los números reales se construyen a partir de los números raciona-les, el principio del Supremo puede y debe demostrarse. Usando cortaduras deDedekind es muy fácil: Si A ⊂ R es no vacío y acotado superiormente, y cadaa ∈ A es una cortadura (Ia, Sa), entonces la cortadura cuya clase inferior es∪a∈AIa es el supremo de A (la verificación es inmediata).

Si los reales se definen como expresiones decimales infinitas, la prueba tam-bién es fácil pero más trabajosa. La haremos sólo para el caso en que A tengaalgún elemento no negativo, dejando el otro caso como ejercicio.

Condideremos el conjunto A0 formado por las partes enteras de los elementosde A. Como A es acotado superiormente, A0 contiene sólo un número finitode elementos no negativos, y por lo tanto tiene un elemento máximo g ≥ 0.Condideremos ahora el conjunto A1 formado por todos los elementos de A quetienen parte entera g. Sea a1 el mayor dígito que aparezca como primer cifradecimal de algún elemento de A1. Sea A2 el conjunto formado por todos loselementos de A1 que comienzan con g, a1. Sea a2 el mayor dígito que aparezcacomo segunda cifra decimal de algún elemento de A2. Continuando de este modose obtiene un real g, a1a2 . . . que es el supremo de A.

www.Mate

matica

1.com

Page 7: 002 cap 2 conceptos basicos

2.1 Los números reales 17

Como ejemplo, sea A = {x ∈ Q : x < 0 ó x2 < 2}. Entonces A0 ={. . . ,−2,−1, 0, 1} y g = 1. Ahora A1 = {1+x : x ∈ Q, 0 ≤ x < 1, (1+x)2 < 2}.Como 1, 42 = 1, 96 < 2 pero 1, 52 > 2, es claro que a1 = 4. Del mismo modo,como 1, 412 = 1, 9881 < 2 pero 1, 422 = 2, 0164 > 2, resulta a1 = 1. Prosiguien-do de esta manera se van obteniendo las cifras del supremo: 1, 4142 . . . (que porsupuesto es

√2).

Sean a, b ∈ R con a ≤ b. Llamaremos intervalo abierto con extremos a y b alconjunto

(a, b) = {x ∈ R : a < x < b}.Análogamente se define el intervalo cerrado con extremos a y b como

[a, b] = {x ∈ R : a ≤ x ≤ b},

y los intervalos semiabiertos (o semicerrados): [a, b) = {x ∈ R : a ≤ x < b} y(a, b] = {x ∈ R : a < x ≤ b}.

También consideraremos los intervalos no acotados abiertos (a,+∞) = {x ∈R : a < x} y (−∞, a) = {x ∈ R : x < a}, y los cerrados: [a,+∞) = {x ∈ R : a ≤x} y (−∞, a] = {x ∈ R : x ≤ a}. En general llamaremos intervalo a cualquierade los anteriores y al propio R. El interior de un intervalo I es el mayor intervaloabierto contenido en él, y se denota I◦. Por ejemplo [a, b]◦ = [a, b)◦ = (a, b]◦ =(a, b), [a,+∞)◦ = (a,+∞).

Un subconjunto A de R se dice que es convexo si para cualquier par deelementos a < b de A se cumple [a, b] ⊂ A.

Ejercicio 2.3. Pruebe que los subconjuntos convexos de R son precisamentelos intervalos.

Si a ∈ R y δ > 0, se llamará entorno abierto de centro a y radio δ al intervaloUa(δ) = (a−δ, a+δ). Aunque el término entorno se utiliza a veces en un sentidomás general, en estas notas se entenderá siempre por entorno de a un entornoabierto de centro a. Llamaremos semientorno derecho (resp. izquierdo) de a aun intervalo de la forma [a, a+ δ) (resp. (a− δ, a]).

Se llamará entorno reducido abierto de centro a y radio δ al conjunto U∗a (δ) =

Ua(δ)\{a} = (a−δ, a)∪(a, a+δ), que se obtiene de Ua(δ) suprimiendo al propioa. Análogamente, se llama semientorno reducido derecho (resp. izquierdo) de aa un intercalo de la forma (a, a+ δ) (resp. (a− δ, a)).

Ejercicio 2.4. Si A ⊂ R llamemos −A al conjunto {−x : x ∈ A}. (a) Pruebeque c ∈ R es cota superior de A si y sólo si −c es cota inferior de −A. (b) Pruebeque c = supA si y sólo si −c = ınf −A.

Ejercicio 2.5. Demuestre el Principio del ínfimo a partir del Principio delsupremo, y viceversa.

Ejercicio 2.6. Si A,B ⊂ R son acotados superiormente, entonces sup(A+B) =supA+ supB.

www.Mate

matica

1.com

Page 8: 002 cap 2 conceptos basicos

18 Conceptos Básicos

2.2. Funciones

El concepto de función se fue clarificando durante el siglo XIX, a través de lostrabajos de Cauchy, Dirichlet, Fourier y Weierstrass, entre otros, hasta que ensu forma moderna y general (función como correspondencia arbitraria) apareceexplícitamente a comienzos del siglo XX en el Cours d’analyse mathématique deGoursat.

Si A y B son dos conjuntos, se define el producto cartesiano A×B de amboscomo el conjunto de todos los pares ordenados (a, b) con a en A y b en B, esdecir

A×B = {(a, b) : a ∈ A, b ∈ B}.A×A se abrevia A2, y por inducción se definen A3 = A2 ×A, A4 = A3 ×A,. . . ,An = An−1 ×A.

Una relación de A en B es un subconjunto de A×B.Las funciones son un tipo especial de relaciones. Más precisamente, una

relación f de A en B es una función si se cumple que, para cada a ∈ A, existeun único b ∈ B tal que (a, b) ∈ f . O dicho de otra manera, si (a, b) ∈ f y(a, b′) ∈ f entonces b = b′. Para indicar que f es una función de A en B seutiliza la notación f : A → B. Al conjunto A se le llama dominio de la funcióny a B codominio. Si (a, b) ∈ f entonces se escribe f(a) = b, y se dice que b es laimagen de a por f . También se dice que a es una preimagen de b por f . Observeque cada elemento a ∈ A tiene exactamente una imagen por f , mientras que unelemento b ∈ B puede tener una, ninguna o muchas preimágenes por f .

Intuitivamente, una función de A en B no es más que una correspondenciaque a cada elemento a ∈ A le asocia un único elemento f(a) ∈ B. La definiciónque hemos presentado no es más que el resultado de un largo esfuerzo por tratarde formalizar el concepto intuitivo pero algo vago de correspondencia.

Al conjunto f(A) = {f(x) : x ∈ A} se le llama recorrido de f ; en general esun subconjunto del codominio B. En el caso de que f(A) = B, se dice que fes sobreyectiva, o simplemente sobre. Esto equivale a decir que para cada b ∈ Bexiste algún a ∈ A tal que f(a) = b.

f : A → B es inyectiva o uno a uno si las imágenes de elementos diferentesde A son diferentes, es decir si x 6= y implica f(x) 6= f(y).

Si f es tanto inyectiva como sobreyectiva entonces se dice que es biyectiva.En este caso, el conjunto de pares ordenados {(b, a) ∈ B × A : (a, b) ∈ f} estambién una función, que se denomina inversa de f y se denota f−1.

Ejercicio 2.7. Para cualquier conjunto A se define la función identidad IA :A→ A como IA(x) = x para todo x ∈ A. Pruebe que IA es biyectiva.

Ejercicio 2.8. Pruebe que si f : A → B es biyectiva, entonces el conjunto depares ordenados {(b, a) ∈ B ×A : (a, b) ∈ f} es también una función.

En estas notas se consideran principalmente funciones del tipo f : I → R,cuyo dominio es un intervalo I de R (o una unión de intervalos) y cuyo codominioes R. Estas funciones se conocen como funciones reales de una variable real. A

www.Mate

matica

1.com

Page 9: 002 cap 2 conceptos basicos

2.2 Funciones 19

las funciones g : A → R donde A ⊂ Rn se les llama funciones reales de nvariables reales.

Ejemplo 2.3. Si c ∈ R, a la función f : R → R definida mediante f(x) = cpara todo x ∈ R se le llama función constante.

Ejemplo 2.4. Si a, b ∈ R, a la función g : R → R definida mediante g(x) =ax+ b se le llama función lineal (o afín).

Ejemplo 2.5. Si a, b, c ∈ R, a la función h : R → R definida mediante h(x) =ax2+bx+c se le llama función cuadrática. Análogamente se definen las funcionespolinómicas de grado superior.

Ejemplo 2.6. k : (0,+∞) → R definida mediante k(x) = log x es la funciónlogaritmo natural.

En muchos textos se suele dar una expresión analítica, por ejemplo√

1 − x2

2x− 1,

y se pide “hallar el dominio”. Estrictamente hablando esto no tiene mucho senti-do, pues para que una función esté bien definida, se debe especificar cuáles sonsu dominio y su codominio. En realidad lo que se pretende en estos casos es quese halle el subconjunto más grande posible de R en el cual la expresión dadapermita definir una función. Por ejemplo la expresión anterior tiene sentido si1 − x2 ≥ 0 y 2x − 1 6= 0, es decir si |x| ≤ 1 y x 6= 1/2. Por lo tanto se puededefinir una función f con dominio [−1, 1/2) ∪ (1/2, 1] y codominio R mediantef(x) =

√1 − x2/(2x− 1).

2.2.1. Operaciones con funciones

Las funciones a valores reales pueden combinarse mediante operaciones arit-méticas para formar nuevas funciones. Así, si f es una función y c ∈ R unaconstante, se definen las funciones −f y cf (con el mismo dominio que f) me-diante (−f)(x) = −f(x) y (cf)(x) = cf(x). Si f y g son funciones reales condominios Df y Dg, respectivamente, se definen f + g y fg en Df ∩Dg mediante(f + g)(x) = f(x) + g(x) y (fg)(x) = f(x)g(x). También se puede definir f/gmediante (f/g)(x) = f(x)/g(x), en Df ∩ {x ∈ Dg : g(x) 6= 0}.

Dadas dos funciones g : A → B y f : C → D, supongamos que g(A) ⊂ C.Entonces se puede definir la composición de f y g, denotada f ◦ g, mediante(f ◦g)(x) = f(g(x)). Por ejemplo si f(x) = x2 +3x−1 y g(x) = 2x+1, entonces(f ◦ g)(x) = f(g(x)) = f(2x+ 1) = (2x+ 1)2 + 3(2x+ 1) − 1 = 4x2 + 10x+ 3.

La composición de funciones es asociativa, es decir que (f ◦g)◦h = f ◦(g◦h).

Ejercicio 2.9. Si f : A → B es biyectiva y f−1 es su inversa, pruebe quef−1 ◦ f = IdA y f ◦ f−1 = IdB.

Ejercicio 2.10. Sea f : A→ B. Pruebe que

www.Mate

matica

1.com

Page 10: 002 cap 2 conceptos basicos

20 Conceptos Básicos

1. f es inyectiva si y sólo si existe g : B → A tal que g ◦ f = IdA.

2. f es sobreyectiva si y sólo si existe g : B → A tal que f ◦ g = IdB .

2.2.2. Extremos, crecimiento y decrecimiento de funciones

Las nociones de cota, máximo, mínimo, supremo e ínfimo que se definieronpara conjuntos de números reales en la sección 2.1 pueden trasladarse a funcionesf : I → R, aplicándolas al conjunto f(I). Por ejemplo: se dice que f es acotadasuperiormente si f(I) lo es, es decir si existe c ∈ R tal que f(x) ≤ c para todox ∈ I. Del mismo modo, se dice que f tiene máximo si f(I) lo tiene, o sea siexiste un real M tal que f(x) ≤ M para todo x ∈ I y M ∈ f(I). También sedice que f alcanza su máximo en a o que a es un punto máximo de f si f(a)es el máximo de f . Observe que el máximo de una función, si existe, es único.Expresiones análogas se usan para cotas inferiores y mínimos.

Sea f : I → R y a ∈ I. Si existe un entorno V de a tal que f(x) ≤ f(a) paratodo x ∈ V ∩ I, entonces se dice que f(a) es un máximo local, y a es un puntomáximo local.

Observe que una función puede tener varios máximos locales (también puedetener sólo uno, o ninguno).

A los máximos locales algunos autores les llaman máximos relativos, y en-tonces al máximo le llaman máximo absoluto.

De manera análoga se define el concepto de mínimo local. A los máximos ymínimos locales se les llama extremos locales (o relativos).

Definición 2.2. Una función f : I → R se dice que esmonótona creciente si x ≤ y implica f(x) ≤ f(y), para todo x, y ∈ I,estrictamente creciente si x < y implica f(x) < f(y) para todo x, y ∈ I,monótona decreciente si x ≤ y implica f(x) ≥ f(y), para todo x, y ∈ I, yestrictamente decreciente si x < y implica f(x) > f(y) para todo x, y ∈ I.

A las funciones monótonas crecientes o decrecientes se les llama conjunta-mente monótonas.

Ejercicio 2.11. Si f : I → R no es monótona, pruebe que existen a < b < c enI tales que, o bien f(a) > f(b) < f(c), o bien f(a) < f(b) > f(c).

En estas notas se usarán los términos creciente y decreciente como formasabreviadas de monótona creciente y monótona decreciente, respectivamente, pe-ro advertimos al lector que algunos autores utilizan estos términos como sinóni-mos de estrictamente creciente y estrictamente decreciente. Otros autores llamanno-decrecientes a las funciones monótonas crecientes, y entonces a las monóto-nas decrecientes les llaman no-crecientes, terminología desafortunada pues unafunción que no es creciente no tiene porqué ser no-creciente.

www.Mate

matica

1.com

Page 11: 002 cap 2 conceptos basicos

2.3 Límites 21

2.3. Límites

El concepto de límite es la noción fundamental del cálculo, en su formulaciónmoderna. Sea f una función real definida en un entorno reducido de c ∈ R.Informalmente se dice que el límite de f(x) cuando x tiende a c es L, y seescribe lımx→c f(x) = L, cuando la diferencia entre f(x) y L puede hacerse tanpequeña como se quiera, en valor absoluto, tomando x suficientemente próximoa c. Más formalmente:

Definición 2.3 (Límites con entornos).Se dice que lımx→c f(x) = L si, dado cualquier entorno U de L, existe un

entorno reducido V ∗ de c tal que f(V ∗) ⊂ U .

Recordando que UL(ǫ) = (L − ǫ, L + ǫ) y U∗c (δ) = (c − δ, c + δ) \ {c}, la

definición anterior es equivalente a la siguiente:

Definición 2.4 (Límites con desigualdades).Se dice que lımx→c f(x) = L si, dado cualquier ǫ > 0, existe un δ > 0 tal que si0 < |x− c| < δ, entonces |f(x) − L| < ǫ.

Observe que para la existencia de lımx→c f(x) no hace falta que f esté defi-nida en c, sino tan solo en un entorno reducido de c.

Ejercicio 2.12. Si f : R → R es la función de valor constante k (es decir f(x) =k para todo x ∈ R), pruebe que para cualquier c ∈ R se tiene lımx→c f(x) = k.

Ejercicio 2.13. g : R → R es la función identidad (es decir g(x) = x para todox ∈ R), pruebe que para cualquier c ∈ R es tiene lımx→c g(x) = c.

Ejercicio 2.14. Si h : R → R se define mediante

h(x) =

{

1 si x ∈ Q,

0 si x 6∈ Q,

pruebe que no existe lımx→c h(x) para ningún c ∈ R.

Ejercicio 2.15. Sea k(x) = sen 1x para x 6= 0. Pruebe que no existe lımx→0 k(x).

Ejercicio 2.16. Si f(x) ≤ g(x) en un entorno reducido de c pruebe que, siambos límites existen, entonces lımx→c f(x) ≤ lımx→c g(x).

2.3.1. Límites laterales e infinitos

Si f está definida en un intervalo (c, b), se puede definir el límite de f cuandox tiende a c por la derecha sustituyendo en la definición 2.3 los entornos redu-cidos de c por semientornos reducidos de la forma (c, c+ δ). O, en términos dedesigualdades,

www.Mate

matica

1.com

Page 12: 002 cap 2 conceptos basicos

22 Conceptos Básicos

Definición 2.5. Se dice que el límite de f cuando x tiende a c por la derechaes L, y se escribe lımx→c+ f(x) = L o lımx↓c f(x) = L, si dado cualquier ǫ > 0existe un δ > 0 tal que, si c < x < c+ δ, entonces |f(x) − L| < ǫ.

Análogamente se dice que el límite de f cuando x tiende a c por la izquierdaes L, y se escribe lımx→c− f(x) = L o bien lımx↑c f(x) = L, si dado cualquierǫ > 0 existe un δ > 0 tal que, si c− δ < x < c, entonces |f(x) − L| < ǫ.

Ejemplo 2.7. Si f : R → R es la función escalón

f(x) =

{

0 si x < 0,

1 si x ≥ 0,

entonces lımx→0 f(x) no existe, pero lımx→0− f(x) = 0 y lımx→0+ f(x) = 1.

Ejercicio 2.17. La función parte entera o piso de x se denota ⌊x⌋ y se definecomo el mayor entero que es menor o igual a x. En otras palabras, ⌊x⌋ es elúnico entero tal que ⌊x⌋ ≤ x < ⌊x⌋ + 1. Estudie los límites laterales de f paracada c ∈ R.

Ejercicio 2.18. Pruebe que lımx→c f(x) existe si y sólo si lımx→c+ f(x) ylımx→c− f(x) existen y son iguales.

Ejercicio 2.19. Si f : (a, b) → R es monótona creciente, pruebe que existenlımx→a+ f(x) (y es finito si f es acotada inferiormente) y lımx→b− f(x) (y es fini-to si f es acotada superiormente). Un resultado análogo vale para las funcionesmonótonas decrecientes.

La definición de límite lımx→c f(x) = L se puede extender al caso en que c,L o ambos sean infinitos, con o sin signo. Para ello llamaremos entorno de +∞a cualquier intervalo de la forma (H,+∞) = {x : x > H}, entorno de −∞ acualquier intervalo de la forma (−∞, H) = {x : x < H}, y entorno de ∞ a launión de intervalos (−∞,−H) ∪ (H,+∞) = {x : |x| > H}.

Por ejemplo lımx→c f(x) = +∞ si para cualquier intervalo (H,+∞) existeun entorno reducido V ∗ de c tal que, si x ∈ V ∗ entonces f(x) ∈ (H,+∞).Expresado con desigualdades esto equivale a:

lımx→c f(x) = +∞ si para cualquier H ∈ R existe un δ > 0 tal que, si0 < |x− c| < δ, entonces f(x) > H .

Análogamente lımx→c f(x) = −∞ si dado cualquier H ∈ R existe δ > 0 talque, si 0 < |x − c| < δ, entonces f(x) < H , y lımx→c f(x) = ∞ (sin signo)si dado cualquier H ∈ R existe δ > 0 tal que, si 0 < |x − c| < δ, entonces|f(x)| > H . Observe que lımx→c f(x) = ∞ equivale a lımx→c |f(x)| = +∞.

Si f está definida en una semirecta (a,+∞), la definición de límite de f(x)cuando x tiende a +∞ queda así: lımx→+∞ f(x) = L si dado cualquier ǫ > 0existe H ∈ R tal que, si x > H , entonces |f(x) − L| < ǫ.

Ejercicio 2.20. Exprese mediante desigualdades las definiciones correspon-dientes a lımx→−∞ f(x) = L, lımx→+∞ f(x) = +∞, lımx→+∞ f(x) = −∞,lımx→−∞ f(x) = +∞, lımx→−∞ f(x) = −∞.

www.Mate

matica

1.com

Page 13: 002 cap 2 conceptos basicos

2.3 Límites 23

De la misma manera se pueden definir límites laterales infinitos, por ejemplolımx→c+ f(x) = +∞ si dado cualquier H ∈ R existe un δ > 0 tal que, si0 < x < c+ δ, entonces f(x) > H .

Ejercicio 2.21. Exprese mediante desigualdades las definiciones correspondien-tes a lımx→c− f(x) = +∞, lımx→c+ f(x) = −∞ y lımx→c− f(x) = ∞.

Ejercicio 2.22. Sea f(x) = anxn + an−1x

n−1 + · · · + a1x + a0 una funciónpolinómica de grado n > 0, con an > 0. Pruebe que lımx→+∞ f(x) = +∞, yque

lımx→−∞

f(x) =

{

+∞ si n es par,

−∞ si n es impar.

2.3.2. Operaciones con límites

Los límites se comportan bien con respecto a las operaciones que se puedenrealizar con funciones, tales como suma, producto, composición, etc. Sin em-bargo, hay algunos detalles que hay que tomar en cuenta para no incurrir enerrores.

Teorema 2.1. Dadas f : U∗c → R y g : U∗

a → U∗c , si lımx→a g(x) = c y

lımx→c f(x) = L, entonces lımx→a f(g(x)) = L.

Demostración. Dado un entorno W de L, como lımx→c f(x) = L, existe unentorno reducido V ∗

c ⊂ U∗c tal que f(V ∗

c ) ⊂W . Y como lımx→a g(x) = c, existeun entorno reducido V ∗

a ⊂ U∗a tal que g(V ∗

a ) ⊂ Vc, y más aún g(V ∗a ⊂ V ∗

c .Entonces (f ◦ g)(V ∗

a ) = f(g(V ∗a )) ⊂ f(V ∗

c ) ⊂W .

Ejercicio 2.23. Sea f : R → R definida como f(x) = 1 si x 6= 0 y f(0) = 0,y sea g : R → R la función constante g(x) = 0. Entonces lımx→0 g(x) = 0 ylımx→0 f(x) = 1, pero lımx→0 f(g(x)) = 0. ¿Contradice esto al Teorema 2.1?

Teorema 2.2. Sean f y g funciones reales definidas en un entorno reducido dec. Si existen lımx→c f(x) = K y lımx→c g(x) = L, entonces

lımx→c

(f(x) + g(x)) = K + L,

lımx→c

(f(x) − g(x)) = K − L,

lımx→c

(f(x)g(x)) = KL.

Si además L 6= 0, entonces también

lımx→c

f(x)

g(x)=K

L.

Y si K > 0, entonces

lımx→c

f(x)g(x) = KL.

www.Mate

matica

1.com

Page 14: 002 cap 2 conceptos basicos

24 Conceptos Básicos

La prueba de este teorema es estándar y puede hallarse en cualquier texto.

Si uno o ambos de los límites de f y g son infinitos, en algunos casos sepueden deducir los límites de las operaciones entre f y g, pero en otros casosno se puede. Por ejemplo:

Si lımx→c f(x) = +∞ y lımx→c g(x) es finito o +∞, entonces lımx→c(f(x)+g(x)) = +∞. Un resultado análogo se tiene si se cambia +∞ por −∞.

Sin embargo, si lımx→c f(x) = +∞ y lımx→c g(x) = −∞, no se puede afirmarnada a priori sobre lımx→c(f(x) + g(x)). Esto se expresa a veces diciendo que∞−∞ es una “forma indeterminada”. Esto sólo significa que el límite no quedadeterminado por los límites de las funciones coomponentes f y g. Pero es unaexpresión poco afortunada, ya que lleva a muchos alumnos a pensar que unlímite de este tipo “no se puede determinar”, y por lo tanto no se puede hacernada con él. Es preciso enfatizar que lo indeterminado es la forma en general,pero no cada límite en particular. En realidad puede ocurrir que el límite de lasuma no exista, o que exista y sea finito, o que exista y sea infinito. Pero paraaveriguar cuál es el caso hace falta un análisis más profundo.

Ejemplo 2.8. Si en R definimos f(x) = x, g1(x) = −x, g2(x) = −2x y g3(x) =−⌊x⌋, entonces lımx→+∞ f(x) = +∞ y lımx→+∞ g1(x) = lımx→+∞ g2(x) =lımx→+∞ g3(x) = −∞, y se tiene que

lımx→+∞(f(x) + g1(x) = 0,lımx→+∞(f(x) + g2(x) = −∞,mientras que lımx→+∞(f(x) + g3(x)) no existe.

Si lımx→c f(x) = +∞ y lımx→c g(x) es finito y positivo o +∞, entonceslımx→c f(x)g(x) = +∞. Análogamente si lımx→c f(x) = −∞ y lımx→c g(x) esfinito y positivo o +∞, entonces lımx→c f(x)g(x) = −∞.

En general se puede decir que si el límite de una función es +∞ o −∞ y elde la otra es +∞, −∞ o un real distinto de 0, entonces el límite del productoes +∞ o −∞, y el signo se determina mediante la regla usual de los signos.

En cambio si lımx→c f(x) = +∞ y lımx→c g(x) = 0, no se puede afirmarnada a priori sobre lımx→c f(x)g(x). Esto se expresa diciendo que ∞ · 0 es una“forma indeterminada”, expresión para la cual valen los mismos comentarios quehicimos para ∞−∞. Y como en el caso de la suma, aquí también puede ocurrirque el límite del producto no exista, o que exista y sea finito, o que exista y seainfinito, siendo necesario un análisis más profundo para averiguar qué es lo queen realidad ocurre.

Ejercicio 2.24. Proporcione ejemplos de cada una de las tres posibilidadesdescriptas para la forma ∞ · 0.

Para el cociente, si lımx→c f(x) = +∞ y lımx→c g(x) es finito y positi-vo, entonces lımx→c f(x)/g(x) = +∞. Si en cambio lımx→c f(x) es finito ylımx→c g(x) = ∞ (con o sin signo), entonces lımx→c f(x)/g(x) = 0.

Si tanto f como g tienen límites infinitos, o si ambas tienen límite 0, no sepuede afirmar nada a priori sobre lımx→c f(x)/g(x). Es decir que se tienen dos“indeterminaciones” más: ∞/∞ y 0/0.

www.Mate

matica

1.com

Page 15: 002 cap 2 conceptos basicos

2.3 Límites 25

Ejercicio 2.25. Proporcione ejemplos de la forma ∞/∞ y 0/0 para los cualesel límite a) no exista, b) exista y sea finito, y c) exista y sea infinito.

Un resultado sencillo pero muy útil es el siguiente:

Teorema 2.3 (Teorema del sándwich). Si f , g y h son funciones definidas enun entorno reducido V de c tales que g(x) esté siempre comprendido entre f(x)y h(x) (es decir, f(x) ≤ g(x) ≤ h(x) o h(x) ≤ g(x) ≤ f(x) para todo x ∈ V ), ysi lımx→c f(x) = lımx→c h(x) = L, entonces lımx→c g(x) existe y es igual a L.

Demostración. Dado un entorno de L existen entornos reducidos V ∗1 y V ∗

2 de ctales que f(V ∗

1 ) ⊂ U y h(V ∗2 ) ⊂ U . Si tomamos V ∗ = V ∗

1 ∩ V ∗2 entonces, para

cualquier x ∈ V ∗, se tiene que tanto f(x) como h(x) están en U , por lo tantotodo el intervalo de extremos f(x) y h(x) está contenido en U , y en particularg(x) ∈ U .

Figura 2.1: Límite de (senx)/x.

Ejemplo 2.9. Para calcular lımx→0 senx/x consideremos un círculo de centroO y radio OA = 1. Sea B otro punto de la circunferencia. Si el ángulo ∠AOB se

mide en radianes, entonces su medida x es igual a la longitud del arco⌢

AB. Elsegmento de perpendicular desde B al radio OA mide senx, y el segmento ADde la tangente a la circunferencia en A, comprendido entre A y la recta OB,mide tg x. Como el triángulo OAB está contenido en el sector circular OABy éste en el triángulo OAD, comparando sus áreas se obtiene que (senx)/2 <x/2 < (tg x)/2, es decir senx < x < tg x. Dividiendo entre senx (suponiendo

www.Mate

matica

1.com

Page 16: 002 cap 2 conceptos basicos

26 Conceptos Básicos

x > 0) se tiene entonces que

1 <x

senx<

1

cosx.

De aquí se deduce, por el teorema del sándwich, que lımx→0+ x/ senx = 1 ypor tanto, también lımx→0+(senx)/x = 1. Como la función (senx)/x es par, sesigue que lımx→0(senx)/x = 1.

Ejercicio 2.26. Probar que

(a) lımx→0

tg x

x= 1, (b) lım

x→0

1 − cosx

x2=

1

2, (c) lım

x→0

1 − cosx

x= 0.

Para lımx→c f(x)g(x), si el límite de de f o el de g (o ambos) son infinitos, seplantean algunos casos fáciles de decidir y otros que requieren un análisis másprofundo. Si lımx→c f(x) = +∞ y lımx→c g(x) es positivo (finito o infinito),entonces lımx→c f(x)g(x) = +∞. Lo mismo ocurre si lımx→c f(x) = K > 1 ylımx→c g(x) = +∞. Si 0 < lımx→c f(x) < 1 y lımx→c g(x) = +∞, entonceslımx→c f(x)g(x) = 0.

En cambio no se puede afirmar nada a priori si lımx→c f(x) = 1 y lımx→c g(x)= +∞. Esto se conoce como la “forma indeterminada” 1∞. Un ejemplo impor-tante es lımx→0(1 + x)1/x = e.

Ejercicio 2.27. Proporcione ejemplos de la forms 1∞ en los cuales el límite a)no exista, b) exista y sea finito, y c) exista y sea infinito.

Otro caso delicado se presenta cuando lımx→c f(x) = 0. Suponiendo quef(x) ≥ 0 en un entorno reducido de 0 (de lo contrario f(x)g(x) podría no estar si-quiera definido), si lımx→c g(x) = L > 0 entonces es claro que lımx→c f(x)g(x) =0. Y si L < 0, entonces lımx→c f(x)g(x) = +∞. Pero si L = 0 aparece una nueva“forma indeterminada” que se representa como 00.

2.3.3. Asíntotas

Diremos que una recta r de ecuación y = mx+n es asíntota de la gráfica deuna función f , si la distancia del punto (x, f(x)) a r tiende a 0 cuando x tiendea +∞ o a −∞. Para que esto ocurra, por ejemplo para x → +∞, debe serlımx→+∞(f(x)−mx−n) = 0 y por lo tanto lımx→+∞(f(x)−mx) = n. Ademáslımx→+∞ f(x)/x = lımx→+∞(f(x) −mx)/x+m = m. Por lo tanto para hallaruna asíntota para x → +∞ debemos calcular primero m = lımx→+∞ f(x)/x,y si existe se calcula luego n = lımx→+∞(f(x) − mx). Si este segundo límitetambién existe, entonces y = mx+ n es una asíntota.

Si existe lımx→+∞ f(x) = n entonces automáticamente lımx→+∞ f(x)/x =0, y se tiene una asíntota horizontal y = n.

Si existe m = lımx→+∞ f(x)/x, pero no existe lımx→+∞(f(x)−mx), se diceque y = mx es una dirección asintótica.

De modo análogo se buscan asíntotas para x→ −∞.Una asíntota vertical es una recta x = a tal que lımx→a+ f(x) o lımx→a− f(x)

sea ∞ (con o sin signo).

www.Mate

matica

1.com

Page 17: 002 cap 2 conceptos basicos

2.3 Límites 27

Ejemplo 2.10. Sea f(x) = x/(1 + e−x) + x/(x − 1). Obviamente hay unaasíntota vertical x = 1. Como

lımx→+∞

f(x)

x= lım

x→+∞

1

1 + e−x+ lımx→+∞

1

x− 1= 1 + 0 = 1,

y

lımx→+∞

(f(x) − x) = lımx→+∞

(

x

1 + e−x+

x

x− 1− x

)

= lımx→+∞

( −xe−x1 + e−x

+x

x− 1

)

= 0 + 1 = 1,

se tiene la asíntota oblicua y = x+ 1 para x→ +∞. Por otra parte

lımx→−∞

f(x)

x= lım

x→−∞

1

1 + e−x+ lımx→+∞

1

x− 1= 0 + 0 = 0,

y

lımx→−∞

f(x) = lımx→−∞

(

x

1 + e−x+

x

x− 1

)

= 0 + 1 = 1,

por lo tanto se tiene una asíntota horizontal y = 1 para x→ −∞.

Figura 2.2: Asíntotas

2.3.4. Límites de sucesiones

En esta sección recordamos brevemente el concepto de límite de una sucesióny su relación con el límite de funciones.

www.Mate

matica

1.com

Page 18: 002 cap 2 conceptos basicos

28 Conceptos Básicos

Una sucesión de números reales es una función x : N → R del conjunto delos números naturales N = {1, 2, 3, . . .} en los reales. El valor x(n) que toma estafunción en el natural n suele denotarse más comúnmente como xn, y la sucesiónmisma como x1, x2, x3,. . . , o más concisamente {xn}n∈N. Se dice que la sucesióntiene límite L cuando n tiende a infinito, y se escribe lımn→+∞ xn = L, si dadocualquier ǫ > 0 existe un natural K tal que |xn − L| < ǫ para todo n ≥ K.

Ejercicio 2.28. Si x1 ≤ x2 ≤ x3 ≤ · · · es una sucesión monótona crecien-te y acotada superiormente, pruebe que es convergente y que lımn→+∞ xn =sup{xn : n = 1, 2, 3, . . .}.

Ejercicio 2.29. Sea x1 =√

2, x2 =√

2 +√

2, x3 =

2 +√

2 +√

2, . . . Pruebeque esta sucesión tiene límite y calcúlelo.

Teorema 2.4. Sea f una función definida en un entorno reducido de a talque lımx→a f(x) = L. Entonces para cualquier sucesión {xn} con valores en eldominio de f , se cumple lımn→+∞ f(xn) = L.

La demostración es inmediata y se deja como ejercicio.

Ejemplo 2.11. Como lımx→0(sinx)/x = 1 y lımn→+∞ 1/n = 0, entonceslımn→+∞ n sen(1/n) = 1.

También vale una forma de recíproco:

Teorema 2.5. Sea f una función definida en un entorno reducido de a y L ∈R. Si para cualquier sucesión {xn} con valores en el dominio de f y tal quelımn→+∞ xn = a se cumple lımn→+∞ f(xn) = L, entonces lımx→a f(x) = L.

Una serie de números reales es una expresión de la forma x1 +x2 +x3 + · · ·+xn + · · · donde {xn}n∈N es una sucesión de números reales. A toda serie se leasocia una sucesión de sumas parciales, definida como X1 = x1, X2 = x1 + x2,X3 = x1 + x2 + x3,. . . y en general Xn =

∑nk=1 xk. Si existe lımn→∞Xn = S,

entonces se dice que la serie es convergente y que su suma es S. En ese caso seescribe x1 + x2 + x3 + · · · = S. Por ejemplo

1

2+

1

4+

1

8+ · · · 1

2n+ · · · = 1,

ya que las sumas parciales son Xn =∑n

k=1 1/2k = 1 − (1/2)n+1 (suma de unaprogresión geométrica) y lımn→∞Xn = lımn→∞(1 − (1/2)n+1) = 1 − 0 = 1.

2.4. Continuidad

Intuitivamente, una función es continua si su gráfica se puede dibujar sinlevantar el lápiz del papel. Sin embargo no fue fácil convertir esta noción vagaen la definición precisa actual:

www.Mate

matica

1.com

Page 19: 002 cap 2 conceptos basicos

2.4 Continuidad 29

Definición 2.6. Una función f es continua en a si lımx→a f(x) = f(a). Silımx→a+ f(x) = f(a) se dice que f es continua por la derecha en a, y si lımx→a−

f(x) = f(a) se dice que f es continua por la izquierda en a. Si f no es continua ena entonces se dice que es discontinua en a, o que presenta una discontinuidad ena. Una función es continua en un intervalo si lo es en cada punto de ese intervalo,entendiendo que si el intervalo incluye extremo izquierdo (resp. derecho), en élse exigirá continuidad por la derecha (resp. izquierda).

La definición de continuidad en un punto se puede desglosar así: f es continuaen a si

1. f está definida en un entorno de a.

2. Existe lımx→a f(x).

3. f(a) y lımx→a f(x) son iguales.

Si recordamos la definición de límites por entornos, la definición de continui-dad se puede reformular así:

f es continua en a si, dado cualquier entorno U de f(a), existe unentorno V de a tal que, si x ∈ V entonces f(x) ∈ U .

Del mismo modo, recordando la definición de límites por desigualdades, podemosdecir que

f es continua en a si, dado cualquier ǫ > 0, existe un δ > 0 tal quesi |x− c| < δ, entonces |f(x) − f(c)| < ǫ.

Las consideraciones anteriores pueden adaptarse de la manera obvia parael caso de la continuidad por la derecha o por la la izquierda, considerandosemientornos.

Si lımx→a f(x) existe, pero es distinto de f(a), se dice que f presenta unadiscontinuidad evitable en a. En este caso la discontinuidad se puede “evitar”redefiniendo f en a como lımx→a f(x).

Si existen los límites laterales lımx→a+ f(x) y lımx→a− f(x), pero son dife-rentes, entonces se dice que f presenta una discontinuidad de salto en a.

Ejercicio 2.30. Pruebe que las funciones f(x) = 1 y g(x) = x son continuasen todo a ∈ R.

Ejercicio 2.31. Estudie la continuidad de la función h(x) = ⌊x⌋.

Ejercicio 2.32. Estudie la continuidad de la función

k(x) =

{

x sen 1x si x 6= 0,

0 si x = 0.

www.Mate

matica

1.com

Page 20: 002 cap 2 conceptos basicos

30 Conceptos Básicos

2.4.1. Operaciones con funciones continuas

De las propiedades correspondientes para los límites se deduce fácilmenteque la suma, diferencia, producto y composición de funciones continuas soncontinuas. El cociente de funciones continuas es continua en los puntos dondeesté definido (es decir donde no se anule el denominador).

Como la identidad y las funciones constantes son continuas, de lo anteriorse sigue que las funciones polinómicas son continuas, y las funciones racionalesson continuas en los puntos en que no se anule el denominador.

También las demás funciones elementales (la exponencial, el logaritmo, laspotencias de exponente real, las funciones trigonométricas directas e inversas)son continuas donde estén definidas, y por lo tanto todas las funciones que sepuedan obtener combinándolas por medio de las operaciones anteriormente des-criptas son continuas. Por estas consideraciones podemos afirmar, por ejemplo,que la función

f(x) = log(x4 + 5) − sen

(

ex +cos(x)3√x2 + 1

)

es continua.

Ejemplo 2.12. De lımx→0(1 + x)1/x = e y por la continuidad del logaritmo sededuce que lımx→0 log((1 + x)1/x) = log(e) = 1, es decir

lımx→0

log(1 + x)

x= 1.

Haciendo en este últimi límite el cambio de variable x = et − 1 se obtienelımt→0 log(et)/(et − 1) = 1, es decir lımt→0 t/(e

t − 1) = 1, y por lo tanto

lımx→0

ex − 1

x= 1.

2.4.2. Propiedades de las funciones continuas

A continuación se enuncian algunos de los resultados más importantes rela-cionados con funciones continuas.

Teorema 2.6 (Constancia local del signo).Si f : I → R es continua, c ∈ I y f(c) > 0, entonces existe un entorno V dec tal que f(x) > 0 para todo x ∈ V . Análogamente, si f(c) < 0 entonces existeun entorno V de c tal que f(x) < 0 para todo x ∈ V .

La prueba es muy sencilla. Si f(c) > 0 entonces, tomando ǫ = f(c), porla continuidad de f se tiene que existe δ > 0 tal que, si |x − c| < δ, entonces|f(x) − f(c)| < ǫ = f(c), es decir −f(c) < f(x) − f(c) < f(c), de donde0 < f(x) < 2f(c). Por lo tanto si |x − c| < δ, ewntonces f(x) > 0. La pruebapara el caso f(c) < 0 es análoga.

www.Mate

matica

1.com

Page 21: 002 cap 2 conceptos basicos

2.4 Continuidad 31

Teorema 2.7 (Teorema de Bolzano).Si f : [a, b] → R es continua y f(a)f(b) < 0, entonces existe por lo menos un

punto c ∈ (a, b) para el cual f(c) = 0.

En otras palabras este teorema afirma que si una función continua toma valo-res de signo opuesto en los extremos de un intervalo, entonces se anula en algúnpunto interior al mismo. Para probarlo, supongamos por ejemplo que f(a) < 0y f(b) > 0 y consideremos el conjunto A = {x ∈ [a, b] : f es negativa en [a, x]}.Como A obviamente es no vacío y acotado, existe c = supA. usando el teoremaanterior es fácil ver que no puede ser f(c) < 0 (pues entonces habría puntosde A mayores que c) ni f(c) > 0 (pues entonces habría cotas superiores de Amenores que c), por lo tanto f(c) = 0.

Otra demostración popular se basa en el llamado método de bisección. Seac = (a + b)/2. Si f(c) = 0 no hay más nada que hacer. Si f(c) > 0 pongamosa1 = a y b1 = c; si en cambio f(c) < 0 pongamos a1 = c y b1 = b. En amboscasos se verifica que f(a1)f(b1) < 0. Sea ahora c1 = (a1 + b1)/2. Si f(c1) = 0ya está. Si f(c1) > 0 pongamos a2 = a1 y b2 = c1; si en cambio f(c1) < 0pongamos a2 = c1 y b2 = b1, y se verifica que f(a2)f(b2) < 0. Prosiguiendo deesta manera, o encontramos un cero de f o se generan dos sucesiones monótonasa ≤ a1 ≤ a2 ≤ · · · y b ≥ b1 ≥ b2 ≥ · · · tales que bn − an = (b − a)/2n.

Sean A = {an : n = 1, 2, . . .} y B = {bn : n = 1, 2, . . .}. Es claro que paraíndices cualesquiera i, j se tiene ai ≤ bj, de donde se sigue que ai ≤ ınf B paratodo i y supA ≤ ınf B. Pero como an ≤ supA ≤ ınf B ≤ bn, se tiene que0 ≤ ınf B − supA ≤ bn − an = (b− a)/2n para todo n, de donde supA = ınf B.Sea c el valor común de supA y ınf B.

Probaremos que f(c) = 0. En efecto, si fuese f(c) > 0, entonces por elteorema anterior f sería positiva en todo un entorno (c − ǫ, c + ǫ), para ciertoǫ > 0, y ese entorno no podría contener ningún an (ya que f(an) < 0 porconstrucción), contradiciendo el hecho de que c es el supremo de A. De manerasimilar, si f(c) < 0 f sería negativa en todo un entorno (c − ǫ, c + ǫ), paracierto ǫ > 0, y ese entorno no podría contener ningún bn (ya que f(bn) > 0 porconstrucción), contradiciendo el hecho de que c es el ínfimo de B.

La única posibilidad que queda es f(c) = 0.

La prueba anterior tiene la ventaja de ser constructiva, y por lo tanto propor-ciona una manera efectiva de calcular aproximadamente raíces de ecuaciones.

Ejemplo 2.13. Supongamos que se desea hallar una raíz aproximada de laecuación x3 + x − 1 = 0. Como la función f(x) = x3 + x − 1 es continua,f(0) = −1 < 0 y f(1) = 1 > 0, el teorema de Bolzano nos dice que existe unaraíz entre 1 y 2. Más aún, como f(1/2) = −3/8 < 0, hay una raíz en [1/2, 1].Y como f(3/4) = 11/64 > 0, hay una raíz en [1/2, 3/4]. Prosiguiendo de estamanera se podría hallar la raíz con cualquier grado de precisión deseado (existensin embargo métodos más eficientes).

Ejercicio 2.33. Un lago tiene un muelle desde el cual salen lanchas de paseo.Francisca sale en una lancha a las 3pm y regresa a las 5pm. Gabriel sale en otra

www.Mate

matica

1.com

Page 22: 002 cap 2 conceptos basicos

32 Conceptos Básicos

lancha a las 4pm y regresa a las 6pm. Pruebe que en algún momento entre las4pm y las 5pm Francisca y Gabriel se encuentran a igual distancia del muelle.

Ejercicio 2.34. Pruebe que si f : I → R es continua, entonces tiene la Pro-piedad de Darboux , es decir que dado cualquier intervalo [a, b] ⊂ I, f toma en[a, b] todos los valores comprendidos entre f(a) y f(b).

Ejercicio 2.35. Pruebe que si I es un intervalo y f : I → R es continua (omás en general, si tiene la propiedad de Darboux) entonces f(I) es también unintervalo.

Ejercicio 2.36. Sea f : I → R continua e inyectiva. Pruebe entonces que f esestrictamente monótona, y que su inversa f−1 : f(I) → I también es continua.

Ejercicio 2.37. Podría pensarse que la Propiedad de Darboux caracteriza a lasfunciones continuas. Pruebe que no es así, construyendo una función que tengadicha propiedad pero que no sea continua, al menos en un punto.�

¿Existirá alguna función f : [0, 1] → R con la propiedad de Darboux que nosea continua en ningún punto?

Ejercicio 2.38. Sea f : I → R una función continua. Sean x1, x2, . . . , xn puntosde I. Pruebe que existe un punto c ∈ I tal que

f(c) =f(x1) + f(x2) + · · · + f(xn)

n.

Teorema 2.8.Si f : [a, b] → R es continua entonces es acotada.

Demostración. Sea A = {x ∈ [a, b] : f([a, x]) es acotado}. Como a ∈ A, A noes vacío, y está acotado superiormente por b. Entonces existe c = supA. Por lacontinuidad de f existe un δ > 0 tal que |f(x) − f(c)| < 1 si |x− c| < δ. Por laproiedad del supremo debe existir x ∈ (c−δ, c]∩A. Como f está acotada en [a, x]y también en [x, c+δ)∩[a, b], se sigue que está acotada en [a, c+δ)∩[a, b]. Si fuesec < b entonces f estaría acotada en un intervalo [a, d] con d > c, contradiciendola definición de c. Por lo tanto c = b f está acotada en [a, b].

Una consecuencia importante de este resultado es el siguiente:

Teorema 2.9 (Weierstrass).Si f : [a, b] → R es continua entonces tiene máximo y mínimo en [a, b].

Demostración. Como f([a, b]) es acotado, existen M = sup f([a, b]) y m =ınf f([a, b]). Hay que probar que f efectivamente toma los valores M y m. Su-pongamos por absurdo que f(x) 6= M para todo x ∈ [a, b]. Entonces la funcióng(x) = 1/(M − f(x)) sería continua en [a, b], pero obviamente no acotada, con-tradiciendo el teorema anterior. Análogamente se llega a una contradicción si sesupone que f(x) 6= m para todo x ∈ [a, b].

Finalmente enunciaremos sin demostración el siguiente teorema:

www.Mate

matica

1.com

Page 23: 002 cap 2 conceptos basicos

2.5 Derivadas 33

Teorema 2.10 (Heine-Cantor).Si f : [a, b] → R es continua, entonces es uniformemente continua, es decir,

para todo ǫ > 0 existe un δ > 0 tal que, si x, y ∈ [a, b] y |x − y| < δ, entonces|f(x) − f(y)| < ǫ.

En estas notas no utilizaremos este resultado, que sin embargo es muy im-portante en el Cálculo integral y en otras áreas del análisis matemático.

2.5. Derivadas

Definición 2.7. Sea f una función definida en un intervalo abierto que contengaal número real a. Si existe

lımx→a

f(x) − f(a)

x− a

y es finito, se dice que f es derivable en a; al valor del límite se le llama derivadade f en a y se denota f ′(a). Si el límite es infinito se dice que f tiene derivadainfinita en a.

Efectuando el cambio de variable h = x − a, la derivada puede definirse enforma equivalente como

f ′(a) = lımh→0

f(a+ h) − f(a)

h.

Si f es derivable en cada punto de su dominio, entonces se dice simplementeque f es derivable, y a la función f ′ que a cada x le hace corresponder el valorf ′(x) se le llama función derivada de f .

Es inmediato que si f es derivable en a entonces también es continua en a,ya que

lımx→a

(f(x) − f(a)) = lımx→a

(x − a)f(x) − f(a)

x− a

= lımx→a

(x − a) lımx→a

f(x) − f(a)

x− a= 0 · f ′(a) = 0.

Ejemplo 2.14. a) Sea φ una función constante. Entonces

φ′(x) = lımh→0

φ(x+ h) − φ(x)

h= lımh→0

0 = 0.

b) Sea f(x) = x. Entonces

f ′(x) = lımh→0

f(x+ h) − f(x)

h= lımh→0

x+ h− x

h= lım

h→01 = 1.

c) Sea g(x) = x2, entonces

g′(x) = lımh→0

(x + h)2 − x2

h= lım

h→0

2hx− h2

h= lım

h→0(2x− h) = 2x.

www.Mate

matica

1.com

Page 24: 002 cap 2 conceptos basicos

34 Conceptos Básicos

d) Sea k(x) = ex. Entonces

k′(x) = lımh→0

ex+h − ex

h= lım

h→0exeh − 1

h= ex.

e) Sea h(x) = senx. Como sen(x+ h) = senx cosh+ senh cosx se tiene

h(x+ h) − h(x)

h=

senh

hcosx− 1 − cosh

hsenx

y por lo tanto

h′(x) = lımh→0

senh

hcosx− lım

h→0

1 − cosh

hsenx = 1 · cosx− 0 · senx = cosx.

Ejercicio 2.39. Calcular, a partir de la definición, las funciones derivadas de1/x,

√x, cos(x) y log(x).

2.5.1. Derivadas laterales

Si f está definida en [a, b) y existe

lımx→a+

f(x) − f(a)

x− a,

al valor del límite se le llama derivada por la derecha de f en a y se denotaf ′(a+). Análogamente se define la derivada por la izquierda. Es claro que f esderivable en a si y sólo si existen ambas derivadas laterales y son iguales.

Ejemplo 2.15. Sea f(x) = |x|. Entonces lımx→0+ f(x)/x = lımx→0+ x/x = 1y lımx→0− f(x)/x = lımx→0−(−x)/x = −1.

2.5.2. Interpretación geométrica

Recordando lo que vimos en el primer capítulo, f ′(a) puede interpretarsecomo la pendiente de la recta tangente a la gráfica de f en el punto (a, f(a))(ver Figura 1.2, pág. 4). En efecto, (f(x) − f(a))/(x − a) es la pendiente de larecta secante que pasa por los puntos (a, f(a)) y (x, f(x)), y si estas secantestienden a una posición límite cuando x → a, la pendiente de esa recta serálımx→a(f(x) − f(a))/(x − a) = f ′(a). La ecuación de la recta tangente seráentonces y = f(a) + f ′(a)(x − a).

En realidad, dadas las dificultades existentes para definir en términos geo-métricos la noción de recta tangente, se puede usar la derivada para definirlaanalíticamente. Es decir que si existe f ′(a) entonces la recta tangente a la gráficade f en el punto (a, f(a)) será, por definición, y = f(a) + f ′(a)(x − a).

Los a para los cuales f ′(a) = 0 se llaman puntos críticos o singulares de f .Geométricamente se pueden caracterizar como los puntos en los cuales la gráficade f es horizontal (es decir paralela al eje Ox).

www.Mate

matica

1.com

Page 25: 002 cap 2 conceptos basicos

2.5 Derivadas 35

Si f tiene derivada infinita en a, entonces la tangente a la gráfica de f en elpunto (a, f(a)) es la recta vertical x = a.

Si f está definida en un intervalo [a, b] y existe la derivada lateral f ′(a+),entonces la tangente a la gráfica de f en el punto (a, f(a)) será y = f(a) +f ′(a+)(x − a). Del mismo modo, si existe f ′(b−), la tangente a la gráfica de fen el punto (b, f(b)) será y = f(b) + f ′(b−)(x− b).

Ejemplo 2.16. Consideremos una parábola de foco F y directriz d. Los griegossabían que la tangente a esta curva en un punto P es la bisectriz del ánguloformado por el radio vector FP y la paralela al eje por P . Para comprobar esteresultado usando el cálculo, tomemos un sistema de coordenadas con origenO enel vértice de la parábola, eje Ox paralelo a la directriz y como eje Oy, el eje de laparábola. Si tomamos como unidad de medida la distancia del foco a la directriz,entonces las coordenadas del foco son (0, 1/2) y la ecuación de la directriz esy = −1/2. La distancia del foco al punto P = (x, y) es

x2 + (y − 1/2)2, y ladistancia de P a la directriz es y + 1/2. Por lo tanto la ecuación de la parábolaes√

x2 + (y − 1/2)2 = y + 1/2. Elevando al cuadrado nos queda

x2 + (y − 1

2)2 = (y +

1

2)2,

y luego de desarrollar los cuadrados y simplificar queda x2 = 2y, o y = x2/2.Por lo tanto y′ = x y la ecuación de la tangente en P = (a, a2/2) es

y =a2

2+ a(x− a) = ax− a2

2.

Ahora bien, si α es el ángulo que forma la recta FP con el eje Ox, entoncestgα = (a2/2− 1/2)/a = a/2− 1/(2a), y si β es el ángulo que forma la tangentecon el eje Ox, entonces tg β = a. Por lo tanto

tg(∠MPN) = tg(β − α) =tg(β) − tg(α)

1 + tg(β) tg(α)=

a2 + 1

2a12 + a2

2

=a+ 1

a

1 + a2=

1

a= tg(

π

2− β) = tg(∠NPQ),

y entonces ∠MPN = ∠NPQ.De aquí se deduce la conocida propiedad de los espejos parabólicos: los rayos

paralelos al eje, una vez reflejados pasan por el foco. Según Plutarco, Arquímedesutilizó esta propiedad para defender a Siracusa, su ciudad natal, de los romanos:hizo construir grandes espejos en forma de paraboloides de revolución, capacesde concentrar los rayos solares sobre las naves enemigas hasta quemarlas.

2.5.3. Interpretación cinemática

Consideremos un punto que se mueve sobre una línea recta. Fijando unorigen y una unidad de medida en la recta, la posición del punto móvil en elinstante t queda determinada por su abscisa x(t), que será función del tiempo.

www.Mate

matica

1.com

Page 26: 002 cap 2 conceptos basicos

36 Conceptos Básicos

Figura 2.3: Tangentes a la parábola

La distancia recorrida por el móvil desde el instante t hasta el t + h esx(t+h)−x(t); esta distancia es orientada: puede ser positiva, si el móvil avanzaen el sentido de las x crecientes, o negativa en caso contrario. La velocidad mediaes (x(t+h)−x(t))/h; observe que depende del intervalo de tiempo considerado,es decir del valor de h. Al límite (si existe) de la velocidad media cuando t → 0,es decir a la derivada de x(t), se le llama velocidad instantánea. Siguiendo latradición newtoniana, en física se acostumbra denotar la derivada respecto altiempo con un punto en vez de un apóstrofo, es decir x(t).

Lo anterior se puede generalizar al movimiento en dos o más dimensiones.En el plano, por ejemplo, el movimiento de un punto P se puede describir dandosu abscisa y su ordenada en función del tiempo, digamos P (t) = (x(t), y(t)). Eneste caso la velocidad es el vector P (t) = (x(t), y(t)).

2.5.4. Propiedades de las funciones derivables

Reglas de derivación

Las siguientes afirmaciones son bien conocidas y se prueban fácilmente apartir de la definición de la derivada y las propiedades de los límites.

1. Si f es derivable en a y k es una constante, entonces kf es derivable en ay (kf)′(a) = kf ′(a).

2. Si f y g son derivables en a entonces f+g es derivable en a y (f+g)′(a) =f ′(a) + g′(a).

www.Mate

matica

1.com

Page 27: 002 cap 2 conceptos basicos

2.5 Derivadas 37

3. Si f y g son derivables en a entonces fg es derivable en a y (fg)′(a) =f ′(a)g(a) + f(a)g′(a).

4. Si f y g son derivables en a, g(a) 6= 0 y g′(a) 6= 0, entonces f/g es derivableen a y (f/g)′(a) = (f ′(a)g(a) − f(a)g′(a))/(g(a))2.

Demostremos como ejemplo la 3: como

(fg)(a+ h) − (fg)(a) = (f(a+ h) − f(a))g(a+ h) + f(a)(g(a+ h) − g(a)),

y como g es continua en a por ser derivable, se tiene

lımx→0

(fg)(a+ h) − (fg)(a)

h

= lımx→0

f(a+ h) − f(a)

hlımx→0

g(a+ h) + f(a) lımx→0

g(a+ h) − g(a)

h

= f ′(a)g(a) + f(a)g′(a).

Las dos primeras propiedades nos dicen que la derivación es una operaciónlineal. De ellas se deduce, por inducción, que si f1, f2,. . . ,fn son funciones de-rivables en a y k1, k2,. . . ,kn son constantes, entonces

(k1f1 + k2f2 + · · · + knfn)′(a) = k1f

′1(a) + k2f

′2(a) + · · · + knf

′n(a).

Ejemplo 2.17. Como (senx)′ = cosx y (cosx)′ = − senx, entonces

(tg x)′ =( senx

cosx

)′=

(senx)′ cosx− senx(cosx)′

cos2 x

=cos2 x+ sen2 x

cos2 x=

1

cos2 x= sec2 x = tg2 x+ 1.

Teoremas de Rolle y Lagrange

Lema 2.1. Si f : (a, b) → R es una función derivable y presenta un extremolocal en c ∈ (a, b), entonces f ′(c) = 0.

Demostración. Hagamos la prueba para un máximo local (para mínimo local essimilar). Sea (c− ǫ, c+ ǫ) ⊂ (a, b) un entorno de c tal que f(x) ≤ f(c) para todox ∈ (c− ǫ, c+ ǫ). Entonces para c < x < c+ ǫ se tiene (f(x)− f(c))/(x− c) ≤ 0,y por lo tanto lımx→c+(f(x) − f(c))/(x − c) ≤ 0. Para c − ǫ < x < c se tiene(f(x) − f(c))/(x− c) ≥ 0, y por lo tanto lımx→c−(f(x) − f(c))/(x − c) ≥ 0.

Pero ambos límites laterales deben ser iguales a f ′(c), por tanto 0 ≤ f ′(c) ≤ 0y f ′(c) = 0.

Teorema 2.11 (Teorema de Rolle).Si f es una función continua en el intervalo [a, b], derivable en (a, b) y tal quef(a) = f(b) = 0, entonces existe un c ∈ (a, b) tal que f ′(c) = 0.

www.Mate

matica

1.com

Page 28: 002 cap 2 conceptos basicos

38 Conceptos Básicos

Demostración. Por el teorema 2.9 f tiene máximo M y mínimo m. Si el máximose alcanza en un punto c ∈ (a, b), entonces por el lema anterior f ′(c) = 0. Lomismo si el mínimo se alcanza en un punto d ∈ (a, b). En caso contrario, máximoy mínimo se alcanzan en los extremos del intervalo, y por lo tanto son ambos0. Entonces f(x) = 0 para todo x ∈ [a, b] y por ser constante cumple f ′(c) = 0para cualquier c ∈ (a, b).

La interpretación geométrica del teorema de Rolle es sencilla: si se satisfa-cen las hipótesis del teorema, entonces en algún punto interior del intervalo latangente a la gráfica de f es horizontal.

El siguiente teorema, también conocido como teorema de los incrementosfinitos o teorema de Lagrange, es una generalización del teorema de Rolle y seconsidera como uno de los más importantes del cálculo diferencial.

Teorema 2.12 (Teorema del valor medio).Si f es una función continua en el intervalo [a, b] y derivable en (a, b), entoncesexiste un c ∈ (a, b) tal que

f(b) − f(a)

b− a= f ′(c).

Demostración. En términos geométricos este teorema afirma que para algúnc ∈ (a, b), la tangente a la gráfica de f en el punto C = (c, f(c)) es paralela a larecta secante que pasa por los puntos A = (a, f(a)) y B = (b, f(b)). En efecto,(f(b)−f(a))/(b−a) es la pendiente de la recta secante y f ′(c) es la pendiente dela recta tangente, por lo tanto el teorema afirma la igualdad de esas pendientes,que es equivalente al paralelismo de ambas rectas. Aunque el teorema de Rolle

Figura 2.4: Teorema del valor medio

es un caso particular de este teorema, cuando f(a) = f(b) = 0, en realidad son

www.Mate

matica

1.com

Page 29: 002 cap 2 conceptos basicos

2.5 Derivadas 39

equivalentes ya que se puede demostrar el teorema del valor medio a partir delteorema de Rolle. Para ello consideremos la función auxiliar

g(x) = (b− a)(f(x) − f(a)) − (f(b) − f(a))(x − a).

Como g(a) = g(b) = 0, por el teorema de Rolle g′(c) = 0 para algún c ∈ (a, b).Pero g′(x) = (b−a)f ′(x)−(f(b)−f(a)), por lo tanto (b−a)f ′(c)−(f(b)−f(a)) =0, y f ′(c) = (f(b) − f(a))/(b− a).

Ejemplo 2.18. Los excesos de velocidad en las carreteras generalmente se de-tectan mediante sistemas de radar basados en el efecto Doppler, o medianterayos infrarrojos, pero se ha propuesto otro sistema basado en el teorema delvalor medio. Si se colocan en una autopista dos cámaras fotográficas separadas,por ejemplo, 10 kilómetros, y se detecta que un automóvil tarda menos de 5minutos en recorrer esos 10 km, sabremos que su velocidad media es mayor que120 km/h, y entonces en algún punto del recorrido su velocidad instantáneahabrá tenido que superar los 120 km/h.

Ejercicio 2.40. Pruebe que la función derivada no puede tener discontinuidadesevitables. Más precisamente: si f es derivable en (a, b) y para un c ∈ (a, b) existelımx→c f

′(x) = L, entonces f ′(c) = L.

Derivación de funciones compuestas

Teorema 2.13 (Regla de la cadena).Si g es derivable en a y f es derivable en g(a), entonces f ◦ g es derivable ena y

(f ◦ g)′(a) = f ′(g(a))g′(a).

Demostración. Por el teorema del valor medio, para cada h existe algún ξ(h)comprendido entre g(a) y g(a+ h) tal que

f(g(a+ h)) − f(g(a)) = f ′(ξ(h))(g(a + h) − g(a)),

por lo tanto

lımh→0

f(g(a+ h)) − f(g(a))

h= lım

h→0f ′(ξ(h)) lım

h→0

g(a+ h) − g(a)

h= f ′(g(a))g′(a).

Ejemplo 2.19. Como (senx)′ = cosx y (x2+1)′ = 2x, por la regla de la cadenase tiene que (sen(x2 + 1))′ = 2x cos(x2 + 1).

Ejercicio 2.41. ¿Es válido probar la regla de la cadena tomando límites cuandoh→ 0 a ambos lados de la igualdad

f(g(a+ h)) − f(g(a))

h=f(g(a+ h)) − f(g(a))

g(a+ h) − g(a)· g(a+ h) − g(a)

h?

www.Mate

matica

1.com

Page 30: 002 cap 2 conceptos basicos

40 Conceptos Básicos

Derivada de la función inversa

Teorema 2.14. Sea f : I → J continua y con inversa f−1. Si f ′(a) existe yno es nula en un punto c interior a I, entonces también existe (f−1)′(f(c)) yse cumple

(f−1)′(f(c)) =1

f ′(c)

Demostración. Por el teorema 2.1 de cambio de variables en límites (pág. 23),y puesto que lımx→c f(x) = f(c) (por ser f continua) se tiene

lımy→f(c)

f−1(y) − f−1(f(c))

y − f(c)= lım

x→c

f−1(f(x)) − f−1(f(c))

f(x) − f(c)

= lımx→c

x− c

f(x) − f(c)=

1

f ′(c).

Por lo tanto existe (f−1)′(f(c)) y es igual a 1/f ′(c).

Ejemplo 2.20. Como (tg x)′ = 1 + tg2 x, se tiene

(arc tg x)′ =1

1 + tg2(arc tg x)=

1

1 + x2.

De igual modo, como

(shx)′ =

(

ex − e−x

2

)′

=ex + e−x

2= chx,

se tiene

(argshx)′ =1

ch(argshx)=

1√

1 + (sh(argshx))2=

1√1 + x2

.

Teorema de Cauchy y Regla de L’Hôpital

El siguiente teorema es una generalización del teorema de Lagrange, pero sudemostración es igual de sencilla.

Teorema 2.15 (Teorema del valor medio de Cauchy).Si f y g son funciones continuas en el intervalo [a, b] y derivables en (a, b),

entonces existe c ∈ (a, b) tal que

(f(b) − f(a))g′(c) = (g(b) − g(a))f ′(c).

Demostración. Sea h(x) = (g(b)−g(a))f(x)−(f(b)−f(a))g(x). Entonces h(a) =g(b)f(a)− f(b)g(a) = h(b) y por el teorema del valor medio existe c ∈ (a, b) talque h′(c) = 0, es decir (g(b) − g(a))f ′(c) − (f(b) − f(a))g′(c) = 0.

www.Mate

matica

1.com

Page 31: 002 cap 2 conceptos basicos

2.5 Derivadas 41

Si g(b)− g(a) 6= 0 y g′(c) 6= 0 entonces la conclusión del teorema de Cauchypuede expresarse en la forma

f(b) − f(a)

g(b) − g(a)=f ′(c)

g′(c).

Una consecuencia interesante del teorema de Cauchy es la llamada regla deL’Hôpital (o L’Hospital), muy usada para calcular límites de formas indetermi-nadas.

Teorema 2.16 (Regla de L’Hôpital). Sean f y g funciones continuas que seanulan en a ∈ R, y supongamos que g no se anula en un entorno reducido dea. Entonces;

(a) Si existen f ′(a) y g′(a) y g′(a) 6= 0, entonces

lımx→a

f(x)

g(x)=f ′(a)

g′(a).

(b) Si las derivadas f ′ y g′ existen y no se anulan ni se hacen infinitas simultá-neamente en un entorno reducido de a y existe lımx→a f

′(x)/g′(x), entoncestambién existe lımx→a f(x)/g(x) y se cumple

lımx→a

f(x)

g(x)= lım

x→a

f ′(x)

g′(x).

Demostración. (a)

lımx→a

f(x)

g(x)= lım

x→a

(f(x) − f(a))/(x− a)

(g(x) − g(a)/(x− a)=f ′(a)

g′(a).

(b) Por el teorema de Cauchy aplicado al intervalo (a, x) se tiene

f(x)

g(x)=f(x) − f(a)

g(x) − g(a)=f ′(c)

g′(c)

para algún c entre a y x, y como c → a cuando x → a y lımx→a f′(x)/g′(x)

existe, entonces también existe lımx→a f(x)/g(x) y son iguales.

Esta regla deriva su nombre de Guillaume François Antoine, Marqués deL’Hôpital (1661–1704), quien es considerado como el autor del primer libro detexto de Cálculo. Allí publicó la regla que lleva su nombre, aunque en reali-dad parece que la misma fue hallada por Johann Bernoulli, a quién L’Hôpitalcontrató para que le enseñara el Cálculo.

Ejemplo 2.21. Un ejemplo clásico de aplicación de esta regla es

lımx→0

senx

x= lım

x→0

cosx

1= 1.

Pero en realidad no es un ejemplo muy afortunado, ya que para probar que(senx)′ = cosx hay que usar el hecho de que lımx→0(senx)/x = 1, cayendo enun razonamiento circular. Por eso es necesaria una prueba de este último límiteque sea independiente de la regla de L’Hôpital, como se hizo en el ejemplo 2.9.

www.Mate

matica

1.com

Page 32: 002 cap 2 conceptos basicos

42 Conceptos Básicos

Ejemplo 2.22.

lımx→0

x− tg x

x3= lım

x→0

1 − (1 + tg2 x)

3x2= lım

x→0−1

3

(

tg x

x

)2

= −1

3.

La regla de L’Hôpital se suele aplicar dos o más veces en forma consecutiva:

lımx→0

x− senx

x3= lım

x→0

1 − cosx

3x2= lım

x→0

senx

6x=

1

6.

La regla de L’Hôpital se puede aplicar también a límites infinitos. Las pruebasse dejan como ejercicio.

Ejercicio 2.42. Si lımx→∞ f(x) = lımx→∞ g(x) = 0 y lımx→∞ f ′(x)/g′(x)existe, entonces también existe lımx→∞ f(x)/g(x) y es igual. Valen resultadosanálogos si x tiende a +∞ o −∞.

Ejercicio 2.43. Si lımx→a f(x) = lımx→a g(x) = ∞, g no se anula en unentorno reducido de a, y existe lımx→a f

′(x)/g′(x), entonces también existelımx→a f(x)/g(x) y es igual. También vale si a es infinito.

Muchos estudiantes, al aprender la regla de L’Hôpital, llegan a creer que esuna panacea que permite resolver cualquier límite de la forma 0/0 o ∞/∞. Peroveamos qué pasa al aplicarla a lımx→+∞ x/

√x2 + 1:

lımx→+∞

x√x2 + 1

= lımx→+∞

12x

2√x2+1

= lımx→+∞

√x2 + 1

x.

Y si se aplica una vez más, resulta

lımx→+∞

√x2 + 1

x= lım

x→+∞

x√x2 + 1

,

y volvemos al principio. Sin embargo este límite es elemental:

lımx→+∞

x√x2 + 1

= lımx→+∞

1√

1 + 1x2

= 1.

Al tratar de aplicar la regla de L’Hôpital puede suceder que lım f ′(x)/g′(x)no exista. En ese caso no se debe concluir apresuradamente que lım f(x)/g(x)tampoco existe, Por ejemplo,

lımx→0

x2 sen 1x

senx= lım

x→0

x

senx(x sen

1

x) = 1 · 0 = 0.

Pero si se intenta aplicar L’Hôpital derivando numerador y denominador queda

lımx→0

(x2 sen 1x )′

(senx)′= lımx→0

2x sen 1x − cos 1

x

cosx

que no existe, por no existir lımx→0 cos(1/x).

www.Mate

matica

1.com

Page 33: 002 cap 2 conceptos basicos

2.5 Derivadas 43

Primitivas

Teorema 2.17. Si f : I → R es continua y derivable en I◦, entonces f ′(x) = 0para todo x ∈ I◦ si y sólo si f es constante.

Demostración. Ya vimos que una función constante tiene derivada nula. Recí-procamente, si f ′(x) = 0 para todo x ∈ I◦ y f no fuese constante, entoncesexistirían reales a < b tales que f(a) 6= f(b), y por el teorema del valor mediopara algún punto c entre a y b se tendría f ′(c) = (f(b) − f(a))/(b − a) 6= 0, locual es absurdo.

Definición 2.8. Una función F es primitiva de otra f , si F es derivable yF ′ = f .

Teorema 2.18. Si F es una primitiva de f , entonces G también lo es si y sólosi G− F es constante.

Demostración. Si F es primitiva de f y G− F = C (constante) entonces G′ =(F +C)′ = F ′ = f , y G es también primitiva de f . Recíprocamente, si tanto Fcomo G son primitivas de f , entonces (G−F )′ = G′ −F ′ = f − f = 0, y por elcorolario anterior G− F es constante.

Este teorema nos muestra que para conocer todas las primitivas de una fun-ción f , es suficiente conocer una cualquiera de ellas, digamos F . Todas las demásson de la forma F + C, donde C ∈ R es una constante arbitraria.

Ejemplo 2.23. x2 es una primitiva de 2x, ya que (x2)′ = 2x. Entonces lasprimitivas de 2x son todas las funciones de la forma x2 + C, donde C es unaconstante arbitraria.

Ejercicio 2.44. Halle una primitiva de 3x2 − 5 que en 2 tome el valor 7.

2.5.5. Derivadas de orden superior

Si f es derivable y su función derivada f ′ es a su vez derivable, entonces a(f ′)′ se le llama derivada segunda de f y se denota mediante f ′′. Del mismomodo se definen (si existen) f ′′′ = (f ′′)′, f IV = (f ′′′)′, . . . La derivada n-simase denota f (n).

Si x(t) representa la posición de un punto que se mueve sobre una línea recta,ya vimos que la derivada primera x(t) corresponde a la velocidad. Entoncesla aceleración, que se define como la tasa de variación de la velocidad, quedarepresentada por la derivada segunda x(t).

Si u y v son derivables dos veces, entonces a partir de la regla de derivacióndel producto,

(uv)′ = u′v + uv′,

derivando una vez más se obtiene

(uv)′′ = (u′v + uv′) = u′′v + u′v′ + u′v′ + uv′′ = u′′v + 2u′v′ + uv′′.

www.Mate

matica

1.com

Page 34: 002 cap 2 conceptos basicos

44 Conceptos Básicos

Si u y v son derivables n veces, entonces por inducción se prueba fácilmente lallamada Regla de Leibniz, que recuerda al binomio de Newton:

(uv)(n) = u(n)v +

(

n

1

)

u(n−1)v′ +

(

n

2

)

u(n−2)v′′ + · · · + uv(n)

o, poniendo u(0) = u, v(0) = v,

(uv)(n) =

n∑

k=0

(

n

k

)

u(n−k)v(k).

2.5.6. Infinitésimos e infinitos

Definición 2.9. Una función f definida en un entorno reducido de a es uninfinitésimo cuando x tiende a a si lımx→a f(x) = 0. Si lımx→a f(x) = ∞ (cono sin signo) se dice que es un infinito. Estas definiciones se aplican también,mutatis mutandis, sustituyendo a por ∞ con o sin signo, a+ o a−.

Ejemplo 2.24. x, senx, 1− cosx, log(1 + x), ex− 1 y e−1/x2

son infinitésimoscuando x tiende a 0.

1/x, e−1/x y√x+ 1 −√

x son infinitésimos cuando x→ +∞.tg x es un infinito para x→ π/2.x, log x, ex son infinitos para x→ +∞.1/

√x es un infinito para x→ 0+.

Comparación de infinitésimos e infinitos

Si f y g son funciones definidas en un entorno reducido de a (que puedeser ∞, +∞ o −∞), la notación de Landau f = O(g) para x → a significa queexisten un entorno reducido V de a y una constanteK tales que |f(x)| ≤ K|g(x)|para todo x ∈ V . Por ejemplo senx = O(x) para x→ 0 ya que | senx| ≤ |x| paratodo x 6= 0. Hay que tener algo de cuidado con esta notación, ya que muchasfunciones pueden ser O(g), ¡pero esto no quiere decir que sean iguales!

Si f y g son infinitésimos o infinitos definidos en un entorno reducido de a,entonces se dice que son del mismo orden si f es O(g) y g es O(f) . Esto sucede,en particular, si existe lımx→a f(x)/g(x) 6= 0.

f es de orden n respecto a g si f es del mismo orden que gn. Por ejemplo1 − cosx es de segundo orden respecto a x, para x → 0, ya que lımx→a(1 −cosx)/x2 = 1/2 6= 0.

Si lımx→a f(x)/g(x) = 1 entonces se dice que f y g son equivalentes y seescribe f ∼ g. Observe que si lımx→a f(x)/g(x) = α 6= 0 entonces f(x) ∼ αg(x).

Si f y g son infinitésimos definidos en un entorno reducido de a en el cual gno se anula, y se cumple que lımx→a f(x)/g(x) = 0, entonces se dice que f es uninfinitésimo de orden superior a g, y se escribe f = o(g). Si lımx→a f(x)/gn(x) =0 entonces se dice que f es de orden al menos n respecto a g.

www.Mate

matica

1.com

Page 35: 002 cap 2 conceptos basicos

2.5 Derivadas 45

Por ejemplo sen(x3) = o(x2) cuando x → 0, ya que lımx→0 sen(x3)/x2 =lımx→0 x sen(x3)/x3 = 0 · 1 = 0, por lo tanto sen(x3) es al menos de orden 2respecto a x (en realidad es de orden 3).

Para infinitos f y g definidos en un entorno reducido de a, se dice quef es de orden inferior a g si f = o(g). Note la diferencia con la definicióncorrespondiente para infinitésimos: para que f sea de orden superior a g debeser lımx→a f(x)/g(x) = ∞.

Ejemplo 2.25. Si n es un natural, aplicando la regla de L’Hôpital n veces setiene

lımx→+∞

xn

ex= lımx→+∞

nxn−1

ex= · · · = lım

x→+∞

n!

ex= 0,

por lo tanto xn = o(ex) para x → +∞, es decir que xn es un infinito de ordeninferior a ex, y ex es de orden superior a xn, para cualquier n natural.

Ejercicio 2.45. Pruebe que x es un infinito de orden superior a (log(x))n

cuando x→ +∞, para cuaquier natural n.

Teorema 2.19. Si f(a) = f ′(a) = f ′′(a) = · · · = f (n)(a) = 0, entonces f(x) =o((x− a)n) para x→ a.

Demostración. Aplicando n−1 veces consecutivas la regla de L’Hôpital y luegola definición de derivada, resulta

lımx→a

f(x)

(x− a)n= lım

x→a

f ′(x)

n(x− a)n−1= lım

x→a

f ′′(x)

n(n− 1)(x− a)n−2= · · ·

= lımx→a

f (n−1)(x)

n!(x− a)=

1

n!lımx→a

f (n−1)(x) − f (n−1)(a)

x− a

= f (n)(a) = 0.

2.5.7. Fórmula de Taylor

Si f es n veces derivable en a, entonces al polinomio

Tn;f ;a(x) =

n∑

k=0

(x− a)k

k!f (k)(a)

= f(a) + (x− a)f ′(a) +(x− a)2

2!f ′′(a) + · · · + (x− a)n

n!f (n)(a)

se le llama polinomio de Taylor de grado n de la función f en a.Es claro que si se pone Rn;f ;a(x) = f(x) − Tn;f ;a(x) entonces

f(x) = Tn;f ;a(x) +Rn;f ;a(x).

A esta igualdad se le llama Fórmula de Taylor, en honor al matemático inglésBrook Taylor (1685–1731). A Rn;f ;a(x) se le llama resto o término complemen-tario. Es claro que esta fórmula no es más que una tautología: se cumple porque

www.Mate

matica

1.com

Page 36: 002 cap 2 conceptos basicos

46 Conceptos Básicos

Rn;f ;a(x) se ha definido para que se cumpla. Pero si se logra identificar algunapropiedad interesante de Rn;f ;a(x) entonces se tiene una forma del Teorema deTaylor. Aquí sólo veremos dos variantes de este teorema.

Teorema 2.20 (Teorema de Taylor I).Si f es n veces derivable en un entorno de a, entonces

f(x) = Tn;f ;a(x) + o((x − a)n).

Demostración. Puesto que

T(j)n;f ;a(x) =

n∑

k=j

(x− a)k−j

(k − j)!f (k)(a)

resulta que T (j)n;f ;a(a) = f (j)(a) para j = 0, 1, . . . , n, y la prueba se completa

aplicando el teorema 2.19 a la diferencia f(x) − Tn;f ;a(x).

Este teorema equivale a afirmar que Rn;f ;a(x) = o((x − a)n), y a esto se lellama forma infinitesimal del término complementario.

Es fácil ver que Tn;f ;a(x) es el único polinomio de grado ≤ n tal que f(x) −Tn;f ;a(x) = o((x − a)n), en otras palabras es el que mejor aproxima localmentea f cerca de a. En particular, T1;f ;a(x) = f(a) + f ′(a)(x − a) es la mejoraproximación lineal a f cerca de a. La gráfica de T2;f ;a(x) es una parábola,que se conoce como parábola osculadora u osculatriz de f en a.

Ejemplo 2.26. Sea f(x) = cosx. Como f(0) = cos 0 = 1, f ′(0) = − sen 0 = 0,f ′′(0) = − cos 0 = −1, f ′′′(0) = sen 0 = 0, f IV (0) = cos 0 = 1, f (5)(0) =− sen 0 = 0, resulta

cosx = 1 − x2

2!+x4

4!+ o(x5)

cuando x→ 0.

Teorema 2.21 (Teorema de Taylor II).Si f es n + 1 veces derivable en un entorno de a, entonces existe un puntointermedio c entre a y x para el cual

f(x) = Tn;f ;a(x) +f (n+1)(c)

(n+ 1)!(x− a)n+1.

Demostración. Para a y x fijos sea R = Rn;f ;a(x) y definamos

F (t) = f(t)+(x− t)f ′(t)+(x− t)2

2!f ′′(t)+ · · ·+ (x − t)n

n!f (n)(t)+

(x− t)n+1

(x− a)n+1R.

Derivando respecto a t resulta

F ′(t) = f ′(t) − f ′(t) + (x− t)f ′′(t) − (x − t)f ′′(t) +(x− t)2

2!f ′′′(t) − · · ·

− (x − t)n−1

(n− 1)!f (n)(t) +

(x− t)n

n!f (n+1)(t) − (n+ 1)

(x − t)n

(x − a)n+1R

=(x− t)n

n!f (n+1)(t) − (n+ 1)

(x− t)n

(x− a)n+1R.

www.Mate

matica

1.com

Page 37: 002 cap 2 conceptos basicos

2.5 Derivadas 47

Pero observemos que F (a) = F (x) = f(x), entonces por el teorema del valormedio F ′(c) = 0 para algún c entre a y x, es decir que

0 =(x − c)n

n!f (n+1)(c) − (n+ 1)

(x− c)n

(x− a)n+1R

y finalmente

R =(x − a)n+1

(n+ 1)!f (n+1)(c).

A la forma del término complementario que se presenta en el teorema anteriorse le llama forma de Lagrange.

Si f tiene derivadas de todos los órdenes en a entonces se le puede asociarla serie infinita

∞∑

k=0

(x− a)k

k!f (k)(a) = f(a) + (x− a)f ′(a) +

(x− a)2

2!f ′′(a) + · · ·

a la cual se le llama serie de Taylor de la función f en a (o serie de Maclaurin sia = 0). Muchas funciones importantes se pueden desarrollar en serie de Taylor,por ejemplo

1

1 − x=

∞∑

n=0

xn = 1 + x+ x2 + · · · para |x| < 1

x

(1 − x)2=

∞∑

n=1

nxn = x+ 2x2 + 3x3 + · · · para |x| < 1

√1 + x =

∞∑

n=0

(−1)n(2n)!

(1 − 2n)4n(n!)2xn = 1 +

x

2− x2

8+x3

16− · · · para |x| < 1

(1 + x)α =

∞∑

n=0

α(α − 1) · · · (α− n+ 1)

n!xn para |x| < 1

ex =

∞∑

n=0

xn

n!= 1 +

x

1!+x2

2!+x3

3!+ · · · para todo x ∈ R

log(1 + x) = −∞∑

n=1

(−1)n

nxn = x− x2

2+x3

3− x4

4+ · · · para |x| < 1

senx =

∞∑

n=0

(−1)n

(2n+ 1)!x2n+1 =

x

1!− x3

3!+x5

5!− · · · para todo x ∈ R

cosx =∞∑

n=0

(−1)n

(2n)!x2n = 1 − x2

2!+x4

4!− · · · para todo x ∈ R

arc tg x =

∞∑

n=0

(−1)n

2n+ 1x2n+1 = x− x3

3+x5

5− · · · para |x| ≤ 1

www.Mate

matica

1.com

Page 38: 002 cap 2 conceptos basicos

48 Conceptos Básicos

Lagrange y otros matemáticos creyeron que toda función “decente” podíaexpresarse, al menos localmente, mediante su serie de Taylor. Pero esto no escierto, ya que la serie puede no converger, o converger pero no a la función f .Un ejemplo notable lo proporciona la función de Cauchy

f(x) =

{

e−1/x2

si x 6= 0,

0 si x = 0.

Para x 6= 0 tiene derivadas de todos los órdenes, por ejemplo

f ′(x) =2

x3e−1/x2

, f ′′(x) =

(

− 6

x4+

4

x6

)

e−1/x2

,

f ′′′(x) =

(

24

x5− 36

x7+

8

x9

)

e−1/x2

, . . .

y en general es claro que f (n)(x) = Pn(1/x)e−1/x2

, donde Pn es un polinomio.Pero con el cambio de variable u = 1/x2 se ve que, para cualquier natural m,

lımx→0

e−1/x2

x2m= lım

u→+∞

um

eu= 0,

y también lımx→0 e−1/x2

/x2m−1 = lımx→0 xe−1/x2

/x2m = 0, por lo tanto

lımx→0

Pn(1/x)e−1/x2

= 0.

Esto prueba que f tiene derivadas de todos los órdenes en 0, y todas son nulas.Por lo tanto la serie de Taylor de f es 0 + 0 + 0 + · · · = 0, y no es igual a f sinoen 0.

2.6. Funciones convexas

Definición 2.10. Una función f : I → R se dice que es convexa si para cualquierpar de puntos x, y ∈ I y cualquier real t tal que 0 < t < 1, se cumple

f((1 − t)x+ ty) ≤ (1 − t)f(x) + tf(y).

Si la desigualdad es estricta se dice que la función es estrictamente convexa.

Para cada z ∈ I sea P (z) al punto (z, f(z)) de la gráfica de f . Entonces ladefinición de convexidad significa, geométricamente, que el punto P ((1−t)x+ty)queda por debajo (o en) la recta P (x)P (y), para 0 < t < 1. O lo que es lo mismo,la porción de la gráfica de f en el intervalo (x, y) queda por debajo de la rectasecante P (x)P (y).

Si u = (1 − t)x + ty, entonces la convexidad se puede caracterizar tambiéndiciendo que la pendiente de P (x)P (u) es menor o igual que la de P (u)P (y).

www.Mate

matica

1.com

Page 39: 002 cap 2 conceptos basicos

2.6 Funciones convexas 49

Figura 2.5: Función convexa

Esto es geométricamente obvio, y se puede probar analíticamente sustituyendot = (u − x)/(y − x) en la desigualdad f(u) ≤ (1 − t)f(x) + tf(y) para obtener

f(u) ≤ y − u

y − xf(x) +

u− x

y − xf(y),

que después de algunas manipulaciones algebraicas se convierte en

f(u) − f(x)

u− x≤ f(y) − f(u)

y − u.

Si b, d > 0 entonces las desigualdades entre fracciones a/b < c/d, a/b < (a +c)/(b+ d) y (a+ c)/(b+ d) < c/d son equivalentes, por lo tanto se tiene que:

Teorema 2.22. f : I → R es convexa si y sólo si para puntos x, u, y cualesquie-ra en I tales que x < u < y, se cumple alguna de las desigualdades equivalentessiguientes

f(u) − f(x)

u− x≤ f(y) − f(x)

y − x,

f(u) − f(x)

u− x≤ f(y) − f(u)

y − u,

f(y) − f(u)

y − u≤ f(y) − f(u)

y − u.

Las funciones estrictamente convexas se caracterizan por las correspondientesdesigualdades estrictas.

Esto nos muestra que si f : I → R es (estrictamente) convexa y se toma unpunto interior x en el intervalo I, el cual se deja fijo, entonces (f(y)−f(x))/(y−

www.Mate

matica

1.com

Page 40: 002 cap 2 conceptos basicos

50 Conceptos Básicos

x) es una función (estrictamente) creciente de y, y por lo tanto (ver ejercicio2.19) existe lımy→x+(f(y)−f(x))(y−x) = f ′(x+). De manera análoga se pruebala existencia de f ′(x−). Por lo tanto, en todo punto interior existen las derivadaslaterales, y además éstas son (estrictamente) crecientes, ya que si x < y entoncesse verifican las desigualdades

f ′(x−) ≤ f ′(x+) ≤ f(y) − f(x)

y − x≤ f ′(y−) ≤ f ′(y+)

(si f es estrictamente convexa entonces las desigualdades interiores son estric-tas).

Teorema 2.23. f : (a, b) → R es derivable, entonces es (estrictamente) convexasi y sólo si f ′ es (estrictamente) creciente.

Demostración. Si f es (estrictamente) convexa entonces como acabamos de verf ′ es (estrictamente) creciente. Recíprocamente, si f ′ es creciente y x < u < y,entonces por el teorema del valor medio existen c ∈ (x, u) y d ∈ (u, y) tales que(f(u) − f(x))/(u − x) = f ′(c) y (f(y) − f(u))/(y − u) = f ′(d), por lo tanto

f(u) − f(x)

u− x= f ′(c) ≤ f ′(d) =

f(y) − f(u)

y − u,

(con la desigualdad estricta si f es estrictamente convexa), y por el teorema2.22 f es (estrictamente) convexa.

Corolario 2.1. f : (a, b) → R es derivable dos veces, entonces es convexa si ysólo si f ′′(x) ≥ 0 para todo x ∈ (a, b). Si f ′′(x) > 0 para todo x ∈ (a, b) entoncesf es estrictamente convexa.

Demostración. f es convexa si y sólo si f ′ es monótona creciente, pero por elteorema 3.1 esto ocurre si y sólo si Si f ′′(x) ≥ 0 para todo x ∈ (a, b). Si f ′′(x) > 0para todo x ∈ (a, b) entonces f es estrictamente creciente y por lo tanto f esestrictamente convexa.

El concepto simétrico de la convexidad es la concavidad.

Definición 2.11. Una función f es (estrictamente) cóncava si −f es (estricta-mente) convexa.

Naturalmente que todas las caracterizaciones dadas para funciones convexasse pueden adaptar a las cóncavas, cambiando el sentido de las desigualdades.

De las funciones convexas se dice que tienen la concavidad hacia arriba, esdecir en el sentido de las y positivas, mientras que las funciones cóncavas tienenla concavidad hacia abajo.

A los puntos en los cuales cambia el sentido de la concavidad se les llamapuntos de inflexión. Más precisamente:

Definición 2.12. c es punto de inflexión de f si existe δ > 0 tal que f es estric-tamente convexa en [a− δ, a] y estrictamente cóncava en [a, a+ δ], o viceversa.

www.Mate

matica

1.com

Page 41: 002 cap 2 conceptos basicos

2.7 Teorema fundamental del Cálculo 51

Figura 2.6: Punto de inflexión

Observe que en un punto de inflexión la curva es atravesada por la rectatangente.

Teorema 2.24. Si f es dos veces derivable en (c−δ, c+δ y f ′′(x) es positiva en(c−δ, c) y negativa en (c, c+δ), o viceversa, entonces c es un punto de inflexión.

La demostración es inmediata.Observemos que si f admite derivada segunda continua y c es un punto de

inflexión, como f ′′ debe tener signos diferentes a uno y otro lado de c, debe serf ′′(c) = 0. Pero esta condición no es suficiente, por ejemplo para f(x) = x4 setiene f ′′(0) = 0, pero 0 no es punto de inflexión ya que f ′′(x) = 12x2 es positivatanto para x < 0 como para x > 0.

Ejercicio 2.46. Si f es n veces derivable, f ′′(c) = f ′′′(c) = · · · = f (n−1)(c) = 0y f (n)(c) 6= 0, entonces c es un punto de inflexión si y sólo si n es impar.

2.7. Teorema fundamental del Cálculo

Aunque el cálculo de áreas, y más aún la definición precisa de este concepto,son objeto del Cálculo Integral, que no trataremos en estas notas, para lo quesigue es suficiente una comprensión intuitiva de la noción de área.

Teorema 2.25 (Teorema fundamental del Cálculo).Sea f una función continua y no negativa en [a, b], y sea A(x) el área limitadapor la gráfica de f , el eje Ox y las rectas verticales de abscisas a y x. Entoncesla derivada del área bajo la gráfica de f en el punto x es igual a f(x), es decir

A′(x) = f(x),

para todo x ∈ (a, b).

www.Mate

matica

1.com

Page 42: 002 cap 2 conceptos basicos

52 Conceptos Básicos

a x x + h

C

D

K(x,v)H(x+h,v)

y = f ( x )

A ( x )

b

Figura 2.7: Teorema Fundamental del Cálculo

Demostración. Esencialmente repetiremos el argumento de Newton citado en1.2, pág. 6. Sean C = (x, f(x)) y D = (x+ h, f(x+ h)) dos puntos de la curva.Como el área es aditiva, el área de la región limitada por la curva, el eje Ox y lasrectas verticales de abscisas x y x+h es igual a A(x+h)−A(x). Tomemos v demanera que el rectángulo de vértices (x, 0), (x+h, 0), K = (x, v) y H = (x+h, v)tenga igual área que la región mencionada. Entonces A(x + h) − A(x) = vh,y como es claro que v = (A(x + h) − A(x))/h está comprendido entre f(x) yf(x+h), si se toman límites cuando h→ 0 resulta, por el teorema del sándwich,A′(x) = f(x).

Este teorema también es válido si f toma valores negativos, pero las porcio-nes de área bajo el eje de Ox deben considerarse negativas.

Corolario 2.2 (Regla de Barrow).Si f : [a, b] → R es continua y F es una primitiva de f , entonces el área

limitada por la gráfica de f , el eje Ox y las rectas verticales de abscisas a y bes F (b) − F (a).

Demostración. Si F es una primitiva de f , como por el teorema 2.25 z(x) tam-bién lo es, en virtud del teorema 2.18 se tiene que A(x)−F (x) = C (constante).Como A(a) = 0, poniendo x = a queda C = A(a) − F (a) = −F (a) y por lotanto A(x) = F (x) − F (a) y en particular A(b) = F (b) − F (a).

Esta regla debe su nombre a Isaac Barrow (1630-1677), teólogo y matemáticoinglés que tuvo a Newton como discípulo. Nos muestra que para calcular el áreabajo la gráfica de una función f es suficiente conocer una de sus primitivas.Aunque el cálculo de primitivas es uno de los problemas que trata el Cálculointegral, sin necesidad de conocer sus técnicas, si uno encuentra por cualquiermétodo (por ejemplo examinando una tabla de derivadas, o por ensayo y error)una primitiva F de f , entonces la regla de Barrow nos permite calcular el área.

Ejemplo 2.27. Calcular el área limitada por la parábola y = x2, el eje Ox ylas rectas x = 1 y x = 2.Solución: Como (x3/3)′ = x2, por la regla de Barrow el área pedida es 23/3 −13/3 = 5/3.

www.Mate

matica

1.com

Page 43: 002 cap 2 conceptos basicos

2.7 Teorema fundamental del Cálculo 53

Utilizando la propiedad aditiva del área puede calcularse también el área deregiones comprendidas entre dos curvas.

Ejemplo 2.28. Hallar el área de la región comprendida entre las gráficas def(x) = x2 + 1 y g(x) = −x2 + 2x+ 5.

Figura 2.8: Área de una región

Solución: Primero hallamos los puntos de intersección de ambas curvas resol-viendo x2 + 1 = −x2 + 2x + 5, lo cual nos da x1 = −1 y x2 = 2. Luegohallamos las primitivas F (x) = x3/3 + x de f y G(x) = −x3/3 + x2 + 5xde g. El área bajo y = f(x) entre x = −1 y x = 2 es entonces F (2) −F (−1) = 8/3 + 2 − (−1/3 − 1) = 6, mientras que para y = g(x) el resulta-do es G(2) −G(−1) = −8/3 + 4 + 10 − (1/3 + 1 − 5) = 15. El área de la regióncomprendida entre ambas es la diferencia 15 − 6 = 9.

Ejercicio 2.47. Se llama segmento parabólico a la región comprendida entreuna parábola y una recta que la corta en dos puntos A y B. Sea C el puntodel arco de parábola AB más alejado del segmento AB. Probar que el área delsegmento parabólico es igual a dos tercios del área del triángulo ABC. Esteresultado fue hallado por Arquímedes ¡hace más de 2200 años!

Ejemplo 2.29. Calcular el área limitada por la elipse x2/a2 + y2/b2 = 1.Solución: Este problema es algo más complicado, en primer lugar porque la elipseno es la gráfica de una función. Sin embargo por razones de simetría es suficientecalcular el área de la porción que se encuentra en el semiplano superior, y luegomultiplicar por dos, o mejor aún calcular el área de la porción contenida en el

www.Mate

matica

1.com

Page 44: 002 cap 2 conceptos basicos

54 Conceptos Básicos

Figura 2.9: Área de la elipse

primer cuadrante, y luego multiplicar por cuatro. El arco de elipse contenidoen el primer cuadrante es la gráfica de la función f(x) = b

1 − x2/b2.´Estafunción no tiene una primitiva que se vea a simple vista, pero si se hace elcambio de variable x = a sen t, 0 ≤ t ≤ π/2, entonces

d

dtA(a sen t) = A′(a sen t)a cos t = f(a sen t)a cos t

= ab√

1 − sen2 t cos t = ab cos2 t =ab

2(1 − cos(2t)),

por lo tanto

A(a sen t) =ab

2(t− sen(2t)

2) + C,

donde C es constante. Evaluando en t = 0 se tiene 0 = A(0) = C, y entonces

A(a) = A(a senπ

2) =

ab

2(π

2− sen(π)

2) =

πab

4,

y multiplicando por cuatro se obtiene que el área de la elipse es πab.

Otra forma de obtener este resultado es la siguiente: la elipse es la imagende la circunferencia x2 + y2 = a2 por la transformación T : R2 → R2 definidacomo T (x, y) = (x, by/a). Esta transformación es una contracción (suponiendob < a) en la dirección Oy, por un factor b/a. Los rectángulos de lados paralelosa los ejes se transforman por T en rectángulos de igual ancho y altura reducidaen el factor b/a, por lo tanto su área se reduce en ese mismo factor. Como lacircunferencia de área πa2 puede aproximarse tanto como se desee medianterectángulos, sus transformados por T aproximan el área de la elipse, que por lotanto será πa2(b/a) = πab.

www.Mate

matica

1.com