(eBook) Teoria de Numeros y Conjuntos

Indice general

0. El principio de induccion 10.1. Revision de los numeros naturales . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10.2. Principio de induccion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20.3. Principio de induccion ‘completa’ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60.4. Principio de induccion ‘desplazada’ . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70.5. Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70.6. APENDICE: Definiciones recursivas. . . . . . . . . . . . . . . . . . . . . . . . . . . . 9

1. Conjuntos 131.1. Conjuntos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13

1.1.1. Idea intuitiva de conjunto: pertenencia. Igualdad e inclusion entre conjuntos.Conjunto potencia. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13

1.1.2. Operaciones con conjuntos: union, interseccion, complemento. . . . . . . . . 161.2. Pares ordenados. Producto cartesiano de conjuntos. . . . . . . . . . . . . . . . . . . . 191.3. Correspondencias y aplicaciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20

1.3.1. Comentarios previos: Ideas intuitivas y ejemplos. . . . . . . . . . . . . . . . . 201.3.2. Aplicaciones: dominio, codominio, grafica. . . . . . . . . . . . . . . . . . . . . 221.3.3. Imagen y antiimagen de un conjunto. . . . . . . . . . . . . . . . . . . . . . . 231.3.4. Aplicaciones inyectivas, suprayectivas, biyectivas. . . . . . . . . . . . . . . . . 241.3.5. Mas sobre familias de conjuntos . . . . . . . . . . . . . . . . . . . . . . . . . . 251.3.6. Composicion de aplicaciones. . . . . . . . . . . . . . . . . . . . . . . . . . . . 261.3.7. Inversa de una aplicacion biyectiva. Inyectividad e inversa parcial. . . . . . . 27

1.4. Relaciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 321.4.1. Relaciones de equivalencia y particiones. Conjunto cociente. . . . . . . . . . . 321.4.2. Relaciones de orden. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35

1.5. Conjuntos finitos y numerables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 381.5.1. Conjuntos finitos y numerables. Conjuntos equipotentes. . . . . . . . . . . . . 381.5.2. APENDICE: Un mınimo de combinatoria. . . . . . . . . . . . . . . . . . . . . 40

2. Numeros naturales y enteros 492.1. Numeros naturales. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49

2.1.1. Lectura preliminar . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 492.1.2. Los axiomas de Peano . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 502.1.3. El principio de buena ordenacion. . . . . . . . . . . . . . . . . . . . . . . . . . 52

2.2. Numeros enteros. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 522.2.1. Necesidad de los enteros. Propiedades de Z. Idea de anillo. . . . . . . . . . . 522.2.2. Division entera. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 552.2.3. Representacion decimal y binaria. Bases de numeracion . . . . . . . . . . . . 572.2.4. Maximo comun divisor. Algoritmo de Euclides. . . . . . . . . . . . . . . . . . 622.2.5. Numeros primos y factorizacion. Teorema fundamental de la Aritmetica. . . . 712.2.6. Congruencias. Aritmetica modular. . . . . . . . . . . . . . . . . . . . . . . . . 75

i

ii INDICE GENERAL

3. Numeros racionales. Polinomios. 893.1. Numeros racionales. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 89

3.1.1. Insuficiencia de Z. Fracciones. . . . . . . . . . . . . . . . . . . . . . . . . . . . 893.1.2. Construccion de Q . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 90

3.2. Polinomios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 963.2.1. Definiciones. Suma y producto de polinomios. . . . . . . . . . . . . . . . . . . 963.2.2. Division de polinomios. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 983.2.3. Maximo comun divisor. Algoritmo de Euclides. . . . . . . . . . . . . . . . . . 993.2.4. Funciones polinomicas. Raıces de polinomios. . . . . . . . . . . . . . . . . . . 1033.2.5. Factorizacion de polinomios. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1073.2.6. Polinomios, maple y Mathematica . . . . . . . . . . . . . . . . . . . . . . . 111

4. Numeros reales 1194.1. Construcciones de los numeros reales . . . . . . . . . . . . . . . . . . . . . . . . . . . 119

4.1.1. Insuficiencia de Q . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1194.1.2. Construcciones de R a partir de Q. . . . . . . . . . . . . . . . . . . . . . . . . 120

4.2. Axiomatica de R . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1214.3. Representacion decimal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 122

4.3.1. Aperitivo. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1224.3.2. Representacion decimal canonica . . . . . . . . . . . . . . . . . . . . . . . . . 1224.3.3. Decimales periodicos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 127

4.4. Representacion en otras bases . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1294.4.1. Representacion binaria . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1294.4.2. Representaciones en bases distintas de 10 y 2 . . . . . . . . . . . . . . . . . . 130

5. Numeros complejos 1335.1. El cuerpo complejo. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1335.2. El plano complejo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1385.3. Polinomios en C y en R. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 141

5.3.1. Potencias y raıces de un numero complejo . . . . . . . . . . . . . . . . . . . . 1425.3.2. Teorema fundamental del Algebra y sus consecuencias . . . . . . . . . . . . . 144

5.4. Fracciones racionales. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1475.4.1. Funciones racionales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1485.4.2. Fracciones simples . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 149

5.5. Numeros complejos y geometrıa plana . . . . . . . . . . . . . . . . . . . . . . . . . . 151

6. Aritmetica de punto flotante. 1556.1. Aperitivo. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1556.2. Representacion en punto flotante . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 156

6.2.1. Numeros de maquina . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1566.2.2. Aproximacion por redondeo . . . . . . . . . . . . . . . . . . . . . . . . . . . . 159

6.3. Aritmetica ‘aproximada’ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1626.4. Estrategias de calculo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 168

6.4.1. Reformulacion del problema: Ejemplos . . . . . . . . . . . . . . . . . . . . . . 1686.4.2. Refinamientos en la representacion y en la precision . . . . . . . . . . . . . . 1716.4.3. Buscar algoritmos estables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1736.4.4. Compensaciones estadısticas . . . . . . . . . . . . . . . . . . . . . . . . . . . 176

Capıtulo 0

El principio de induccion

El objetivo fundamental de este capıtulo es familiarizarnos con el principio de induccion ycomenzar a utilizarlo en algunos ejemplos, ya que sera una herramienta necesaria a lo largo de todala asignatura —y de las demas asignaturas, no solo de este curso.

Al final del capıtulo se incluyen una serie de referencias en las que podran completarse algunosde los temas que aquı se esbozan; en casi todas ellas hay ejercicios adicionales (a veces, resueltos)para practicar con el principio de induccion, pero es bastante mas formativo tratar de resolver afondo personalmente unos pocos ejercicios que leer muchas soluciones ajenas.

0.1. Revision de los numeros naturales

Para comenzar a llevar a cabo nuestro plan de revision, empezaremos por reflexionar sobrelos objetos matematicos mas sencillos o, mejor dicho, que nos son mas familiares: los numerosnaturales.

Previamente, pongamonos de acuerdo en un punto:¿Cual es el primer numero natural?

La cuestion no es tan trivial como aparenta. De hecho, en algunos libros se da como respuesta 1(especialmente en los de Analisis matematico) pero en otros se contesta que es 0 (especialmente enlos de Algebra).

Esta pluralidad de respuestas obedece, fundamentalmente, al uso que vaya a hacerse de losnumeros naturales. Simplificando burdamente, podrıamos decir que incluir 0 entre los numerosnaturales responde al deseo de operar con ellos de una manera similar para la suma y el producto;es decir, que igual que para el producto se dispone de un numero que multiplicado por cualquierotro deja como resultado el mismo numero, puede parecer conveniente que haya tambien un numeroque sumado con cualquier otro deje este ultimo como resultado.

Tambien puede argumentarse que con el cero podemos representar el numero de elementos deun conjunto vacıo, de un conjunto sin elementos. Pero en la vida cotidiana, cuando contamos,contamos “algo”, y empezamos por el 1; escribimos normalmente 〈〈1o〉〉 por 〈〈primero〉〉, 〈〈2o〉〉 porsegundo, . . . (El 0 parece mas ‘artificial’ que ‘natural’, valga el juego de palabras. De hecho, el 0 hatenido una larga y complicada historia: fue introducido inicialmente como un sımbolo y no comoun “verdadero” numero, ver [3]).

Que en libros ‘serios’ se adopte tanto una como otra posibilidad y en ambos casos se desarrolleuna teorıa coherente de los numeros naturales, parece sugerir que el quid de la cuestion no esta enlas operaciones aritmeticas, sino en la propia genesis de los numeros naturales, en la manera de‘fabricarlos’. En este sentido, podrıamos preguntar ‘ingenuamente’

¿Cual es la propiedad mas importante de los numeros naturales?

Tal vez lo esencial no es que ‘el primer’ numero natural sea el 0 o el 1, sino que haya un primernumero natural, al cual sigue otro, y a este otro, y a este otro, . . . , y ası sucesivamente, sin tope,

1

2 CAPITULO 0. EL PRINCIPIO DE INDUCCION

y que de esta manera podemos ‘atrapar’ todos los numeros naturales sin que escape ninguno.Dicho en la jerga profesional, lo que importa es la propiedad de induccion del conjunto de

los numeros naturales. Antes de desarrollar esta idea, introducimos la siguiente

Notacion.

En lo sucesivo, denotaremos con N el conjunto de los numeros naturales o enteros positivos

1, 2, 3, . . .

y con N0 el conjunto de los numeros enteros no negativos

0, 1, 2, 3, . . .

Acordada esta notacion, volvamos al asunto de la induccion en N. Tenemos en N, pues, unelemento inicial que denotamos con 1, al que sigue otro elemento que denotamos con 2, al quesigue otro elemento que denotamos con 3, al que sigue . . . . Es decir, como propiedad basica deN consideramos que, en general, cada numero natural tiene un siguiente o sucesor, y N se generapartiendo de 1 y pasando repetitivamente al siguiente de 1, al siguiente del siguiente de 1, alsiguiente del siguiente del siguiente de 1, y ası sucesivamente. Pero esta descripcion plantea unproblema, la insatisfactoria ‘repeticion infinita’ que deja abierta el 〈〈y ası sucesivamente〉〉 anterior(una sucesion de definiciones que no acaba nunca). Dejando el analisis profundo para los filosofos,con Aristoteles a la cabeza, este problema se zanja en Matematicas aplicando el siguiente principio:

Induccion matematica. Un conjunto de numeros naturales que contenga a 1 y quecon cada n contenga al siguiente, debe contener a todos los numeros naturales.

Mas informal: para probar que un conjunto de numeros naturales abarca todo N, basta que nosaseguremos de que el 1 esta en el, y que demostremos que si admitimos que esta n, se deduce quenecesariamente ha de estar tambien n+ 1 (el siguiente de n).

Esta propiedad es la base de muchas definiciones (definiciones recursivas o inductivas) y demuchas demostraciones (demostraciones por induccion) que involucran a los numeros naturales.Comencemos por presentarla de modo que facilite su uso practico en demostraciones.

0.2. Principio de induccion

La ‘propiedad de induccion’ de N, en la practica, suele formularse en terminos de proposiciones(enunciados que tienen sentido en un cierto contexto, y que pueden resultar ciertos o pueden resultarfalsos). Si para cada n ∈ N tenemos una proposicion Pn, entonces Pn puede ser verdadera paraalgunos valores de n y falsa para otros. Por ejemplo, si Pn es la proposicion: 〈〈 n2 = n 〉〉, entoncesP1 es verdadera (ciertamente 12 = 1), mientras que Pn es falsa para todo n 6= 1, n ∈ N (¿podrıasjustificar por que?); si Pn es la proposicion:

〈〈 1 + 2 + 3 + · · ·+ n =n (n+ 1)

2〉〉

entonces Pn es verdadera para todo n ∈ N, porque denotando con s la suma del primer termino dela igualdad,

s = 1 + 2 + 3 + · · · + (n− 1) + n+)

s = n + (n− 1) + (n− 2) + · · · + 2 + 1

2s = (n+ 1) + (n+ 1) + (n+ 1) + · · · + (n+ 1) + (n+ 1) = n (n+ 1)

y ası s =n (n+ 1)

2, como querıamos probar.

0.2. PRINCIPIO DE INDUCCION 3

¿Que hacer si no hay demostracion ‘a la vista’? Supongamos ahora que la proposicion Pn es lallamada desigualdad de Bernoulli :

dado n ∈ N, para todo numero real x ≥ −1 se verifica (1 + x)n ≥ 1 + nx.

No hay una estrategia directa de exito claro: podrıamos pensar en el desarrollo de (1+x)n mediantela formula del binomio, que comenzarıa por 1+nx+1

2 n (n−1)x2+· · · , pero la aparicion de sumandosposiblemente negativos (donde haya potencias impares de x cuando consideremos 0 > x ≥ −1)dificulta el control del tamano del resultado.

Sin embargo, es muy sencillo probar que si para algun n es cierta Pn, es decir, se cumple

(1 + x)n ≥ 1 + nx (∗)

entonces tambien es cierta Pn+1, es decir, se cumple

(1 + x)n+1 ≥ 1 + (n+ 1)x.

En efecto: multiplicando los dos terminos de la desigualdad (∗) por el numero real no negativo1 + x, se mantiene el sentido de la desigualdad y ası

(1 + x)n+1 = (1 + x)n (1 + x) ≥ (1 + nx) (1 + x) = 1 + (n+ 1)x+ nx2,

y como nx2 ≥ 0, tendremos 1 + (n+ 1)x+ nx2 ≥ 1 + (n+ 1)x y finalmente

(1 + x)n+1 ≥ 1 + (n+ 1)x.

¿No habra alguna forma de sacarle partido a este hecho? Pensemos un momento: el conjunto de losnumeros naturales para los que Pn se cumple tiene la propiedad de que con cada n que este en el,debe estar tambien n+ 1. De acuerdo con la inductividad de N, bastarıa que 1 estuviese en dichoconjunto, para que todos los numeros naturales estuviesen en dicho conjunto —lo que significarıaque Pn serıa cierta para todo numero natural n. Pero P1 dice que ha de ser (1 + x)1 ≥ 1 + 1 · x,o sea, 1 + x ≥ 1 + x, trivialmente cierto (incluso para cualquier numero real x sin restriccion).Ası pues, acabamos de demostrar que Pn es cierta para todo numero natural n.

Por tanto, ¡hemos encontrado una demostracion indirecta, mas abordable, del resultado quebuscabamos probar!

Esta misma situacion se repite suficientes veces como para que el metodo empleado merecezcaun enunciado destacado, con nombre propio.

1. Principio de induccion. Para cada numero natural n, sea Pn una proposicion que puede sercierta o falsa, de tal manera que

P1 es cierta, y

para cada n ∈ N, suponiendo que Pn es cierta se puede demostrar que Pn+1 es cierta.

Entonces se cumple que

F Pn es cierta para todo n ∈ N.

Veamos la aplicacion de este principio en algunos ejemplos.Ejemplos.

1. Demostrar que, cualquiera que sea el numero natural n,

n∑k=1

k2 =n (n+ 1) (2n+ 1)

6.

(La expresionn∑k=1

k2 es una manera abreviada de indicar 12 + 22 + · · ·+ k2 + · · ·+ n2.)


No se ve una manera obvia de calcular directamente la suma que nos proponen (lo que no quieredecir que no exista). Pero sı podemos probar facilmente por induccion que se cumple la igualdadpara todo n. Para ello, tomemos como Pn la proposicion del enunciado:

Pn ::n∑k=1

k2 =n (n+ 1) (2n+ 1)

6.

P1 es cierta: para n = 1,1∑

k=1

k2 = 12 = 1, mientras quen (n+ 1) (2n+ 1)

6=

1 (1 + 1) (2 · 1 + 1)6

=

1 · 2 · 36

= 1.

Si es cierta Pn para un n, ¿tambien es cierta Pn+1?

Pn+1 ::n+1∑k=1

k2 =(n+ 1) (n+ 1 + 1) (2(n+ 1) + 1)

6=

(n+ 1) (n+ 2) (2n+ 3)6

Sı: porque

n+1∑k=1

k2 = 12 + 22 + · · ·+ k2 + · · ·+ n2 + (n+ 1)2

=n∑k=1

k2 + (n+ 1)2 ∗=n (n+ 1) (2n+ 1)

6+ (n+ 1)2

=n (n+ 1) (2n+ 1) + 6(n+ 1)2

6=

(n+ 1) [n (2n+ 1) + 6(n+ 1)]6

=(n+ 1) [2n2 + n+ 6n+ 6]

6=

(n+ 1) [2n2 + 7n+ 6]6

.

En la igualdad ∗= hemos empleado la 〈〈hipotesis de induccion〉〉 (esto es, que suponemos Pn cierta).Y por ultimo, tambien

(n+ 1) (n+ 2) (2n+ 3)6

=(n+ 1) [(n+ 2) (2n+ 3)]

6=

(n+ 1) [2n2 + 7n+ 6]6

.

2. Demostrar que, cualquiera que sea el numero natural n,

(i) 42n+1 + 3n+2 es divisible por 13;

(ii) 22n + 5 es divisible por 3;

(iii) 22n + 15n− 1 es divisible por 9.

(i) Para cada numero natural n, tomamos

Pn :: 42n+1 + 3n+2 es divisible por 13.

Para n = 1, 42+1 + 31+2 = 64 + 27 = 91 = 13 · 7 (P1 es cierta).Dado un numero natural n arbitrario, supongamos cierta la propiedad para n. Pasando a n+1,

42(n+1)+1+3(n+1)+2 = 16 ·42n+1+3 ·3n+2 = (13+3) ·42n+1+3 ·3n+2 = 13 ·42n+1+3(42n+1 + 3n+2

),

que, aplicando la hipotesis de induccion, es multiplo de 13 por ser suma de multiplos de 13.(ii) Para cada numero natural n, tomamos

Pn :: 22n + 5 es divisible por 3.

0.2. PRINCIPIO DE INDUCCION 5

para n = 1, 22 + 5 = 4 + 5 = 3 · 3,

y si es cierto para un n que 22n + 5 es multiplo de 3, pasando a n+ 1,

22(n+1) + 5 = 4 · 22n + 5 = (3 + 1) · 22n + 5 = 3 · 22n +(22n + 5

),

suma de multiplos de 3.

(iii) Para cada numero natural n, tomamos

Pn :: 22n + 15n− 1 es divisible por 9.

Para n = 1, 22 + 15− 1 = 18 = 9 · 2 (P1 es cierta).Dado un numero natural n arbitrario, supongamos cierta la propiedad para n, de modo que

exista un k ∈ N tal que 22n + 15n− 1 = 9k. Pasando a n+ 1,

22(n+1)+15(n+1)−1 = 4·22n+15n+14 = 4(9k−15n+1)+15n+14 = 4·9k−3·15n+18 = 9(4k−5n+2).

Alternativamente:

22(n+1) + 15(n+ 1)− 1 = 4(22n + 15n− 1

)− 45n+ 18, que sera divisible por 9.

O incluso de otra forma:

22(n+1)+15(n+1)−1 = 4·22n+15n+15−1 = 22n+3·22n+15n−1+15 = 22n+15n−1+3(22n + 5

),

y como 22n + 5 es multiplo de 3 segun hemos probado, lo anterior sea multiplo de 9 (aplicando lahipotesis de induccion).

3. Observese que

1− 12

=12,(

1− 12

)(1− 1

3

)=

13,(

1− 12

)(1− 1

3

)(1− 1

4

)=

14.

Se pide: conjeturar una ley general sencilla que incluya las anteriores como casos particulares, ydemostrarla mediante el principio de induccion.

Parece que se cumple

Pn ::(

1− 12

)(1− 1

3

)(1− 1

4

)· · ·(

1− 1n

) (1− 1

n+ 1

)=

1n+ 1

.

Veamos si podemos probarlo por induccion.

P1 es cierta, trivialmente 1− 12

=12.

Supongamos cierta Pn. Entonces(1− 1

2

)(1− 1

3

)(1− 1

4

)· · ·(

1− 1n

)(1− 1

n+ 1

)(1− 1

n+ 2

)∗=

1n+ 1

(1− 1

n+ 2

)=

1n+ 1

(n+ 2)− 1n+ 2

=1

n+ 1n+ 1n+ 2

=1

n+ 2,

es decir, resulta cierta Pn+1 (hemos aplicado la hipotesis de induccion para escribir ∗=).


0.3. Principio de induccion ‘completa’

A veces, la ayuda que proporciona suponer cierta Pn para demostrar Pn+1 es insuficiente, y sehace necesario un “apoyo mas amplio”. No es difıcil ver que, cuando interese, se puede modificarel principio de induccion para usar como “hipotesis de induccion” que son ciertas todas las pro-posiciones P1, . . . , Pn, y deducir de ellas Pn+1. El resultado es lo que algunos textos denominan elprincipio de induccion ‘fuerte’ (ver [D’A-W]) o principio de induccion ‘completa’.1

2. Principio de induccion ‘completa’. Para cada numero natural n, sea Pn una proposicion,cierta o falsa, de tal manera que

P1 es cierta, y

para cada n ∈ N, suponiendo que P1, P2, . . . , Pn son ciertas se puede demostrar que Pn+1 escierta.


F Pn es cierta para todo n ∈ N.

Veamos la ventaja conseguida en un ejemplo. Recordemos que un numero natural p distintode 1 es primo si no tiene mas divisores en N que 1 y el propio p; abordemos ahora el siguienteejercicio:

4. Probar que para todo numero natural n ≥ 2 existe un numero primo p que divide a n.Con el principio de induccion utilizado como hasta ahora, un intento razonable serıa tomar

Pn :: n = 1 o n ≥ 2 y existe un numero primo p que divide a n.

Trivialmente, P1 es cierta. Pero si para un n es cierta Pn, ¿debera ser cierta Pn+1? ¿de que sirveque n sea divisible por un numero primo p, si eso no implica que p divida a n + 1, ni que ningunnumero primo ligado con p (el siguiente, por ejemplo) divida a n+ 1?

Sin embargo, pasemos al principio de induccion completa: ahora, partimos de un n tal que nosolo es cierta Pn, sino tambien P1, P2, y Pk para cualquier k ≤ n. Entonces:— si n+ 1 es primo, basta tomar p = n+ 1 para ver que Pn+1 es cierta;— y si n+ 1 no es primo, tendra un divisor positivo k distinto de 1 y de n+ 1; pero los divisoresde un numero son menores o iguales que dicho numero (¿por que?); ası pues, sera k < n+1, por loque k valdra a lo mas n. En consecuencia, Pk es cierta, por nuestra ‘nueva’ hipotesis de induccion.Y como k 6= 1, esto significa que k admite un divisor primo p, que a su vez sera divisor de n + 1;por tanto Pn+1 es igualmente cierta en este caso. En consecuencia, Pn es cierta para todo n, comoquerıamos demostrar.

Comentarios

La estrategia de demostracion que el principio de induccion proporciona recuerda lo que losfranceses llaman reculer pour mieux sauter, retroceder para saltar mas. Comparando las dos versio-nes que hemos enunciado, podrıamos decir que en la primera tomamos una “pequena carrerilla”,de un solo paso, mientras que en la induccion completa la “carrerilla”se toma desde el principio.

Siguiendo con las comparaciones, tambien se llama al ‘primer’ principio de induccion el principiode las fichas de domino: si pensamos en una coleccion infinita de fichas de domino puestas una trasotra, para tirarlas todas basta con asegurarse de que cae la primera y de que esten colocadas deforma que cada ficha tire a la siguiente.

1Su justificacion es sencilla: basta observar que el conjunto S = {n ∈ N : P1, P2, . . . , Pn son todas ciertas}cumple que 1 ∈ S y que n ∈ S implica n + 1 ∈ S; o aplicar el principio de induccion “normal” a la proposicionQn = P1 “y” P2 “y” . . . “y” Pn, denotada en logica proposicional por Qn = P1 ∧ P2 ∧ · · · ∧ Pn, que es ciertacuando y solo cuando cada una de las P1, . . . , Pn son ciertas.

0.4. PRINCIPIO DE INDUCCION ‘DESPLAZADA’ 7

0.4. Principio de induccion ‘desplazada’

Sigamos considerando una coleccion de proposiciones P1, P2, P3, . . . (una para cada numeronatural). A veces se cumple que Pn+1 es cierta siempre que lo sea Pn, aunque P1 sea falsa. Porejemplo, consideremos Pn: 〈〈n = n+ 1〉〉; obviamente, de n = n+ 1 se sigue que n+ 1 = (n+ 1) + 1,que es Pn+1, mientras que 1 6= 2.

¿Que conclusiones cabe extraer de este ejemplo trivial? La primera, algo que no hay que olvidarnunca en Matematicas: los enunciados matematicos dicen exactamente lo que dicen, y hasta queno hayamos comprobado todas las hipotesis, no podemos afirmar ninguna tesis. Y concretamenteen el principio de induccion, no hay que lanzarse sin mas a probar que Pn implica Pn+1 olvidandoprobar que P1 es cierta (lo que sucede con cierta frecuencia).

La segunda conclusion (ahora que ya nos hemos vuelto extremadamente cuidadosos) es que siPn implica Pn+1 para todo n ∈ N y P1 es falsa, quiza Pn no sea cierta para ningun n.

¿Por que quiza solamente? Porque podrıa suceder que para algun valor n1 la correspondienteproposicion Pn1 fuese cierta. Por ejemplo, examinemos Pn: 〈〈n2 > n+ 2 〉〉. Que Pn implica Pn+1 essencillo de probar: de n2 > n+ 2 (n ∈ N) se sigue que (n+ 1)2 = n2 + 2n+ 1 > n+ 2 + 2n+ 1 >(n+ 1) + 2; y 12 no es estrictamente mayor que 1 + 2, con lo que P1 es falsa. Pero 42 > 4 + 2, luegoP4 es cierta. ¿Que provecho se saca de esta informacion? Que Pn es cierta al menos para n ≥ 4,segun se deduce aplicando el principio de induccion a la proposicion Qn = Pn+3. ¿Solo para estosn es cierta Pn? En este caso no: tambien es cierta P3.

Por tanto, resumiendo: cuando se cumple que Pn+1 es cierta siempre que lo sea Pn, o bien Pnes falsa para todo n o, en caso contrario, hay al menos un valor n1 tal que Pn1 es cierta, y en estesupuesto, procediendo como antes, se prueba lo que suele llamarse el principio de induccion‘desplazada’ (no es una denominacion estandar).

3. Principio de induccion “desplazada”. Sea n1 un numero natural dado, y para cada numeronatural n ≥ n1 sea Pn una proposicion, cierta o falsa, de tal manera que

Pn1 es cierta, y

para cada numero natural n ≥ n1, admitiendo que Pn es cierta se puede demostrar que Pn+1

es es cierta,


F Pn es cierta para todo n ≥ n1.

Con esta nueva herramienta y las anteriores, el lector puede abordar por su cuenta los ejerciciosdel apartado siguiente.

0.5. Ejercicios

0.1. Demostrar que para cada numero natural n tal que n2 + 5n + 1 es un numero par, tambien(n+1)2 +5(n+1)+1 es un numero par. ¿Se sigue de aquı por induccion que n2 +5n+1 es siempreun numero par? ¿Cual es la conclusion correcta? Demostrarlo.

0.2. ¿Para que numeros naturales n es cierta la desigualdad 2n > n2? Demostrarlo por induccion.

0.3. Sea S = {n ∈ N : 2n < 2n}. Probar que n+1 ∈ S siempre que n ∈ S. ¿Se deduce de aquı queS = N? ¿Por que? Si no, ¿quien es S? ¿Por que?

0.4. Demostrar que para todo n ∈ N,

n∑k=1

k3 =(n(n+ 1)

2

)2

.


0.5. Demostrar que para todo n ∈ N,

2n∑k=n+1

1k

=2n∑k=1

(−1)k+1

k.

0.6. Observar que

1 = 1;1− 4 = −(1 + 2);

1− 4 + 9 = 1 + 2 + 3;1− 4 + 9− 16 = −(1 + 2 + 3 + 4).

Conjeturar una formula general sencilla que incluya las anteriores como casos particulares, y de-mostrarla mediante el principio de induccion.

0.7. Definamos los numeros a1, a2, a3, . . . por a1 = 9, a2 = 36, an+1 = 6an − 9an−1 si n ≥ 2.Probar que an esta bien definido para todo n y que an = 3n(n+ 2).

0.8. Sea u1 = 2, u2 = 3, un+1 = 3un − 2un−1 si n ≥ 2. Probar que un esta bien definido para todon y que un = 2n−1 + 1.

0.9. (a) Conjetura una formula para 1 + 3 + · · ·+ (2n− 1) evaluando la suma para n = 1, 2, 3 y 4.(b) Prueba tu formula usando el principio de induccion.

0.10. (a) Conjetura una formula que simplifique el producto(1− 1

4

)(1− 1

9

)(1− 1

16

)· · ·(

1− 1n2

).

(b) Prueba tu formula usando el principio de induccion.

Para finalizar el capıtulo, un ‘clasico’.0.11. Evaluar el siguiente resultado:

Teorema. En cualquier examen, todos los alumnos presentados obtienen la misma calificacion.Demostracion : La haremos por induccion. Para cada n ∈ N, sea Pn la proposicion

〈〈 todo conjunto de n alumnos distintos, al realizar un examen, obtiene una unica calificacion.〉〉

Evidentemente, P1 es cierta. Veamos como de Pn se sigue Pn+1.Supongamos que tenemos un conjunto {A1, A2, . . . , An, An+1} de n+ 1 alumnos distintos, con

calificaciones a1, a2, . . . , an, an+1.Considerando {A1, A2, . . . , An}, tenemos un conjunto de n alumnos distintos, luego por la

hipotesis de induccion (estamos admitiendo que Pn es cierta) se tendra a1 = a2 = · · · = an.Considerando ahora {A2, . . . , An, An+1}, tenemos igualmente un conjunto de n alumnos distin-

tos, de donde a2 = · · · = an = an+1.Por tanto, hemos encontrado que

a1 = a2 = · · · = ana2 = · · · = an = an+1

}luego a1 = a2 = · · · = an = an+1 ,

es decir, los n+ 1 alumnos han obtenido la misma calificacion, como querıamos demostrar.

0.6. APENDICE: DEFINICIONES RECURSIVAS. 9

0.6. APENDICE: Definiciones recursivas.

Ocupemonos ahora de la induccion como medio de construir definiciones. Exponer una descrip-cion general del ‘metodo de definicion inductiva’ es competencia de la Logica matematica o de lateorıa de programacion de ordenadores, por lo que aquı nos limitaremos a mostrar algunos ejemplosy senalar sus caracterısticas mas destacadas. Esta seccion debe verse mas como tema de lectura quecomo ‘objeto de estudio’, si bien trata una cuestion importante que no suele comentarse con muchodetenimiento y que, por eso mismo, puede servir de buena ayuda para entender ciertos aspectosque de otra manera originarıan confusion.

En apartados anteriores nos hemos tropezado, sin prestarles especial atencion, con expresionescomo 1 + 2 + 3 + · · · + n, o

∑nk=1 k

2 de la que, decıamos, era 〈〈una manera abreviada de indicar12 + 22 + · · ·+ k2 + · · ·+ n2〉〉. Usualmente, una descripcion de este tipo suele bastar para aclarar aque nos referimos; no obstante, al menos las primeras veces que uno se encuentra con ellas, suele sernecesaria una explicacion mas detallada de su significado, y no digamos si se trata de implementarun procedimiento de calculo de las mismas en un ordenador.

Esto indica que las descripciones “mediante puntos suspensivos · · · ” conllevan una cierta am-biguedad, como ocurrıa con los “y ası sucesivamente” que hemos comentado al comienzo del capıtu-lo. Generalmente, esta ambiguedad se evita dando una definicion recursiva o inductiva; veamos unprimer ejemplo.

Cuando se necesita dar una definicion inequıvoca de una expresion comoSn = 12 + 22 + · · ·+ n2,

basta observar como pasamos de cada valor de n al siguiente:Sn+1 = 12 + 22 + · · ·+ n2 + (n+ 1)2 = Sn + (n+ 1)2,

con lo cual el problema se solventa facilmente usando la propiedad de induccion de N; no hay masque definir Sn haciendo

S1 = 12 y Sn+1 = Sn + (n+ 1)2 para cada n ∈ N.

¿Para que numeros naturales esta bien definido Sn mediante la formula anterior? Desde luego para1, y tambien para el siguiente de cada numero natural para el que este bien definido; es decir, paratodos los numeros naturales, por induccion.

Analogamente, si se trata de definir la expresion an para un numero dado a y un exponenten ∈ N cualquiera, en vez de plantearla como “el producto de n factores iguales a a”, podemosdefinir recursivamente

a1 = a, an+1 = an · a,

y vale repetir el argumento anterior para concluir que ası an esta bien definido para todo n ∈ N.Estos ejemplos muestran que en una definicion recursiva, la construccion del objeto que se

define se hace siguiendo siempre unas mismas reglas, pero estas reglas hacen referencia al propioobjeto. Por ello, para no caer en un cırculo vicioso, el primero o primeros casos se definen siempre demanera expresa, sin apelar a las reglas. Consecuentemente, en cada definicion recursiva encontramossiempre dos partes,

la base, que nos dice ‘como comenzar’;

la recursion, que nos dice como proseguir paso a paso.

Por ejemplo, si para cada n ∈ N hemos fijado un cierto numero an, y definimos recursivamente∑nk=1 ak mediante

1∑k=1

ak = a1 yn+1∑k=1

ak =n∑k=1

ak + an+1 para cada n ∈ N,


la base es∑1

k=1 ak = a1 y la recursion∑n+1

k=1 ak =∑n

k=1 ak+an+1. De paso, observemos que el ındicek puede sustituirse por cualquier otro sımbolo, es en realidad un ‘ındice mudo’, y lo mismo significa∑n

k=1 ak que∑n

m=1 am o∑n

t=1 at: en definitiva, se trata del numero Sn construido recursivamentea partir de S1 = a1, Sn+1 = Sn + an+1.

Curiosamente, aparecen definiciones recursivas incluso ‘en la vida misma’. Por ejemplo, ‘perte-necen a la realeza los reyes o los hijos de algun miembro de la realeza’.

Otros ejemplos mas ‘matematicos’, son los siguientes:

Progresion aritmetica de primer termino a y razon d, dada pora1 = a, an+1 = an + d.

‘Obviamente’ an = a+(n−1) d; una demostracion completa y cuidadosa es facil por induccion.

Progresion geometrica de primer termino a y razon r, dada pora1 = a, an+1 = r · an.

‘Obviamente’ an = a · rn−1; podemos ‘asegurarnos’ usando induccion.

Un ejemplo famosısimo [4]: la sucesion de Fibonacci 1, 1, 2, 3, 5, 8, 13, 21, . . . , en la quecada termino es suma de los dos anteriores (y los dos primeros son iguales a 1). Su definicionrecursiva es

φ1 = 1, φ2 = 1, φn+1 = φn + φn−1 si n ≥ 2.

NOTA. Estos ejemplos no deben llevar a la conclusion de que cualquier formula proporciona unadefinicion recursiva. Basta observar lo que ocurre si ponemos

a1 =32, an+1 =

1an − 1

.

Entonces a2 =1

(3/2)− 1= 2, a3 =

12− 1

= 1, a4 =1

1− 1=???.

El factorial de un numero natural n, denotado por n! y definido inductivamente por1! = 1, (n+ 1)! = (n+ 1) · n!,

que suele introducirse habitualmente como 〈〈el producto n · (n− 1) · · · 3 · 2 · 1〉〉.

Como se senala en [G-H], 〈〈cuando el reemplazamiento de los puntos suspensivos es una tarearutinaria para los seres humanos, a menudo los puntos sustituyen la definicion inductiva que seespera que de el lector. El uso de puntos suspensivos hace a menudo que las formulas sean masfaciles de entender, pero, nuevamente, solo para lectores humanos. Y en trabajos mas avanzados [omas cuidadosos], la definicion por induccion tiene que ser dada [explıcitamente].〉〉

Por lo que a los ordenadores se refiere, hay lenguajes de programacion como C que admitenprocesos recursivos y otros, como algunos ‘dialectos’ de Fortran, que no los admiten. En esta ultimasituacion, hay que transformar los procesos recursivos en procesos iterativos, de caracter cıclico,que hacen uso de bucles en los que intervienen valores calculados en el ciclo previo. Todo programarecursivo puede reescribirse como un programa iterativo, aunque ciertos problemas se resuelvende manera mas simple y natural mediante recursion (generalmente, a costa de mayor consumo dememoria). Un ejemplo muy ilustrativo es el conocido problema ‘de la torre de Hanoi’, que puedeverse en [5] o [6].

Bibliografıa

[B-S] Bartle, R. G.- Sherbert, D. R.: Introduccion al Analisis Matematico de una Variable.Limusa, Mexico, 1990.

Trata el principio de induccion en la Seccion 1.3 (pags. 31 a 35). Muy detallado en sus comentarios.

Tiene una buena seleccion de ejemplos y ejercicios.

[D’A-W] D’Angelo, J. P.; West, D. B.: Mathematical Thinking. Problem-Solving and Proofs.Prentice-Hall, Upper Saddle River, NJ, 1997.

Dedica al principio de induccion su capıtulo 4 (pags. 56 a 73). Es un libro muy original en su plantea-

miento, y contiene una gran cantidad de ejercicios y problemas (algunos con cierto grado de dificultad).

[Ebb] Ebbinghaus, H.-D. & al.: Numbers. Springer, New York, 1991.

Es un excelente libro de consulta, a medio camino entre la historia de las ideas sobre los numeros y

la exposicion ‘de teoremas’. Alcanza niveles que superan ampliamente el contenido de este curso, pero

merece la pena conocerlo. En la pag. 15 se encuentra el principio de induccion. No tiene ejercicios.

[G-H] Griffits, H. B.; Hilton, P. J.: Classical Mathematics. Van Nostrand Reinhold, London,1970.

Una obra ambiciosa: el tıtulo completo es A Comprehensive Textbook of Classical Mathematics. A

Contemporary Interpretation. Baste con decir que cumple sobradamente su proposito. Tanto su plan-

teamiento como su exposicion no han perdido nada de su valor con el tiempo, sino todo lo contrario.

Excelentes comentarios y ejercicios. Imprescindibles y mas completos de lo habitual su tratamiento y

comentarios sobre induccion, a la que dedica el capıtulo 5.

[Lieb] Liebeck, M.: A Concise Introduction to Pure Mathematics. Chapman & Hall/CRC, BocaRaton, 2000.

De planteamiento muy similar al de esta asignatura, difiere en algunos contenidos y en el orden de expo-

sicion. El principio de induccion aparece su capıtulo 8 (pags. 55 a 68). Tiene ejercicios muy interesantes,

y el capıtulo 9 esta dedicado a demostrar por induccion la formula de Euler 〈〈caras + vertices = aristas

+2〉〉, que aplica luego al estudio de los cinco solidos platonicos (cubo, tetraedro, octaedro, icosaedro y

dodecaedro).

[Pest] Pestana, D. & al.: Curso practico de Calculo y Precalculo. Ariel, Barcelona, 2000.

Orientado fundamentalmente a servir de base para el Analisis matematico, parte de su contenido coincide

con el de nuestra asignatura. Muy claro y muy practico, explica el principio de induccion en la pagina

30, dentro de un capıtulo titulado Metodos de demostracion que merece ser leıdo en su totalidad.

11

12 BIBLIOGRAFIA

Documentos en Internet

[1] Interactive Real Analysis, Seton Hall University:

http://www.shu.edu/projects/reals/infinity/index.html

[2] ¿Es el 0 un numero natural?: Math.Sci FAQ,

http://db.uwaterloo.ca/~alopez-o/math-faq/node12.html#SECTION00321000000000000000

[3] Historia del cero, The MacTutor History of Mathematics archive, St Andrews University,Escocia.

http://www-groups.dcs.st-and.ac.uk/~history/HistTopics/Zero.html

[4] Sobre la sucesion de Fibonacci.

http://www.arrakis.es/~mcj/fibonacc.htm

[5] Recursion y la torre de Hanoi, Universidad de Malaga.

http://www.lcc.uma.es/~pepeg/modula/temas/tema11.pdf

[6] S. Romero, La recursividad.

http://pinsa.escomposlinux.org/sromero/prog/recursividad.html

http://www.shu.edu/projects/reals/infinity/index.html


http://www-groups.dcs.st-and.ac.uk/~history/HistTopics/Zero.html

http://www.arrakis.es/~mcj/fibonacc.htm

http://www.lcc.uma.es/~pepeg/modula/temas/tema11.pdf

http://pinsa.escomposlinux.org/sromero/prog/recursividad.html

Capıtulo 1

Introduccion a la teorıa de conjuntos.

En Matematicas, los conjuntos aparecen inevitablemente, bien de forma explıcita o bien de formaimplıcita, y podemos encontrar ejemplos en abundancia. Acabamos de examinar una propiedad ‘delos numeros naturales’, el principio de induccion, que no es una propiedad de cada numero natural(del 1, o del 2, o del 46) sino del conjunto de los numeros naturales. Igualmente, cuando se diceque hay “infinitos numeros primos”, no expresamos una propiedad de cada numero primo, sino delconjunto que forman: “el conjunto de los numeros primos es infinito”. Muchos objetos geometricosson conjuntos: rectas, planos, circunferencias, cualquier figura geometrica es un conjunto de puntos;hablamos del “conjunto de soluciones” de una ecuacion o de un sistema de ecuaciones; un espaciovectorial es un conjunto en el que se ha definido una suma y un producto por escalares que cumplenunas ciertas reglas, etc.

Sin embargo, el estudio de los conjuntos como objetos matematicos en sı mismos, es decir, laTeorıa de conjuntos como disciplina matematica, no aparece hasta la segunda mitad del siglo XIX,creada por G. Cantor.

La formalizacion de la Teorıa de conjuntos como una teorıa axiomatica resulto extremadamentedifıcil, pese a lo simple y poco problematica que parecıa la nocion de conjunto. Sus primerosdesarrollos hicieron aparecer las famosas paradojas de Burali-Forti, de Cantor, de Russell; lasdiscusiones sobre el axioma de eleccion y la hipotesis del continuo . . . (ver [GJPR], [Ap])

Pero lo que a nosotros nos interesa de la Teorıa de conjuntos es que proporciona un lenguajebasico para formular enunciados y argumentos que el lenguaje ordinario harıa farragosos o incom-prensibles. No nos vamos a enfrentar a ella como “estudiosos”, sino como “usuarios”: nos vamos alimitar a una Teorıa intuitiva de conjuntos, planteando este capıtulo sustancialmente como el texto[D-H]. Para completar las explicaciones y ver mas ejemplos, son interesantes [D’A-W], [G-H],[Ham],[Lieb], [S-T], ası como [Lip], [O.U.], etc., y es esencial [GJPR].

1.1. Conjuntos.

1.1.1. Idea intuitiva de conjunto: pertenencia. Igualdad e inclusion entre con-juntos. Conjunto potencia.

En un enfoque intuitivo de la teorıa de conjuntos, como el que aquı vamos a emplear, la nocion deconjunto no difiere esencialmente de lo que por tal se entiende en el lenguaje ordinario: una coleccionde objetos, reales o abstractos (los elementos del conjunto) agrupados como un todo, percibidossimultaneamente como un nuevo objeto. Desde el punto de vista matematico, esta descripcion delo que entendemos como conjunto no sirve como definicion: es demasiado vaga e imprecisa, y utilizaotras palabras (‘coleccion’, ‘agrupamiento’) que no son mas que sinonimos de la palabra ‘conjunto’.

13

http://www-history.mcs.st-and.ac.uk/history/HistTopics/Beginnings_of_set_theory.html#5

http://www-history.mcs.st-and.ac.uk/history/Mathematicians/Cantor.html

http://www.uwec.edu/Academic/Curric/andersrn/zfweb.htm

http://www.aug.edu/dvskel/Johnston1998.htm

http://www.u.arizona.edu/~miller/finalreport/node3.html

http://plato.stanford.edu/entries/russell-paradox/

http://db.uwaterloo.ca/~alopez-o/math-faq/node68.html


14 CAPITULO 1. CONJUNTOS

Tampoco nos ayuda recurrir a los diccionarios; en el de la Real Academia Espanola, por ejemplo,encontramos lo siguiente:conjunto : . . . ‖ 4. m. Agregado de varias personas o cosas. ‖ . . . ‖ 6. La totalidad de los elementoso cosas poseedores de una propiedad comun, que los distingue de otros. Por ejemplo, los numerospares. ‖ . . . ‖ 9. (Mat.) La totalidad de los entes matematicos que tienen determinada propiedad.El CONJUNTO de los numeros primos. ‖ . . .

Es muy difıcil plantear una definicion de ‘conjunto’ que no recurra a sinonimos hasta caer enun cırculo vicioso: es un concepto tan basico que solo podemos dar descripciones aproximativas delmismo. De hecho, cuando fue preciso establecer una teorıa de conjuntos rigurosa desde el puntode vista matematico, una Teorıa axiomatica de conjuntos, la nocion de ‘conjunto’ quedo entre losterminos no definidos.1

Proseguiremos, entonces, con nuestras ideas intuitivas de conjunto y de elementos de un con-junto. Si A es un conjunto y a es uno de sus elementos, diremos que a pertenece a A, y escribiremos

a ∈ A,

mientras que la notaciona /∈ A

indicara que a no pertenece (no es un elemento) de A.Cuando A es un conjunto con pocos elementos, por ejemplo el de los cinco primeros enteros

positivos pares, suele indicarse listando sus elementos entre llaves,

A = {2, 4, 6, 8, 10}.

Pero lo mas habitual es que los conjuntos vengan descritos por una propiedad que caracteriza asus elementos: por ejemplo, como citaba el diccionario, el conjunto de todos los enteros positivospares. Este conjunto se escribe

{x : x es un entero positivo par },

y se lee el conjunto de los x tales que x es un entero positivo par.En general, si tenemos una propiedad P (x) relativa a ciertos x,

{x : P (x) es cierta },

es el conjunto de los x tales que x es cierta.1Cuando una determinada rama de las matematicas se desarrolla axiomaticamente, se toman como punto de

partida(1) unos terminos no definidos(2) unas relaciones no definidas(3) unos axiomas que relacionan los terminos no definidos y las relaciones no definidas.A partir de ellos, se van definiendo nuevos terminos y se desarrollan teoremas basados en los axiomas o en teoremas

anteriores. Por ejemplo, en la geometrıa plana euclıdea, ‘punto’ y ‘recta’ son terminos no definidos, ‘punto que esta enuna recta’ o, lo que es equivalente, ‘recta que pasa por un punto’, es una relacion no definida, y son axiomas, entreotros:

‘Dos puntos distintos estan en una y una sola recta’ (equivalentemente, ‘por dos puntos distintos pasa una recta yuna sola’)

‘Dos rectas distintas no pueden tener mas de un punto comun’.

En la Teorıa axiomatica de conjuntos, son terminos no definidos ‘elemento’ y ‘conjunto’, la relacion no definida es‘pertenencia de un elemento a un conjunto’, y son axiomas, entre otros,

Axioma de extension. Dos conjuntos A y B son iguales si y solo si cada elemento que pertenece a A tambienpertenece a B y cada elemento que pertenece a B tambien pertenece a A.

Axioma de especificacion. Sea P (x) una afirmacion y sea A un conjunto. Existe entonces un conjunto al quepertenecen exactamente los elementos a que pertenecen a A para los que el enunciado P (a) es cierto.

Puede verse un comentario mas amplio sobre los sistemas axiomaticos en la pagina web de la asignatura.

1.1. CONJUNTOS. 15

Frecuentemente, los x son elementos de un conjunto U fijado de antemano (los enteros, ennuestro primer ejemplo). En vez de escribir entonces {x : x ∈ U y P (x) es cierta }, se emplea lanotacion.

{x ∈ U : P (x) es cierta }.

Por otra parte, pensar que todos los elementos que se van a manejar quedan dentro de unconjunto “universal” (el universo del discurso) permite eliminar paradojas de caracter logico, comola no existencia del ‘conjunto de todos los conjuntos’ o la paradoja de Russell, que no hace al casocomentar aquı. (Ver [Ham], p. 111 y ss., donde se explica como la axiomatica de Zermelo-Fraenkelresuelve estas paradojas; otra solucion, la axiomatica de von Neumann-Bernays-Godel, se apuntaen [S-T], cap. 13, p. 252 y ss.)

Los elementos de un conjunto determinan el conjunto. Precisemos esta idea.Criterio de igualdad de conjuntos. Dos conjuntos A y B son iguales si y solo si constan delos mismos elementos, es decir:

(1) para cada x ∈ A tambien x ∈ B;(2) para cada x ∈ B tambien x ∈ A.

Un conjunto muy particular es el conjunto vacıo, que no posee ningun elemento. Se representapor el sımbolo ∅.

Los conjuntos con un solo elemento suelen denominarse conjuntos unipuntuales (o tambien‘singuletes’, por la denominacion inglesa ‘singletons’).

Definicion 1.1.1. Dados dos conjuntos A y B, diremos que A es un subconjunto de B si cadaelemento de A es tambien elemento de B, es decir, si x ∈ A implica x ∈ B.

Para indicar que A es un subconjunto de B escribiremos A ⊆ B. Tambien se lee 〈〈A esta con-tenido en B〉〉.¡Atencion! Algunos libros usan la notacion A ⊂ B para indicar que A esta contenido en B,mientras que en otros A ⊂ B significa que 〈〈A esta contenido en B y es distinto de B〉〉. Para evitarconfusiones, en este ultimo caso nosotros pondremos A⊂6= B, leıdo 〈〈A contenido estrictamente enB〉〉.

El criterio de igualdad de conjuntos puede reformularse en terminos de subconjuntos de maneraobvia.

Corolario 1.1.2. Dos conjuntos A y B son iguales si y solo si A ⊆ B y B ⊆ A.

Ejemplos. Para cualquier conjunto A, trivialmente A ⊆ A y ∅ ⊆ A. Que x ∈ A es equivalente aque {x} ⊆ A (¡pero, en general, no a x ⊆ A ni a {x} ∈ A!). Veremos ejemplos mas interesantes enejercicios posteriores.

Definicion 1.1.3. Dado un conjunto A, el conjunto

℘(A) = {S : S ⊆ A}

cuyos elementos son justamente los subconjuntos de A se denomina conjunto potencia de A oconjunto de partes de A.

Ejercicios

1.1. Sea A = {2n+ 1 : n ∈ N}. Decir si las siguientes afirmaciones son ciertas o falsas, justificandola respuesta:

(i) si x = (2n+ 1)2 para algun n ∈ N, entonces x ∈ A.

(ii) si x ∈ A, entonces x = (2n+ 1)2 para algun n ∈ N.


(iii) si existen y ∈ A, z ∈ A tales que x = yz, entonces x ∈ A.

(iv) si x ∈ A, entonces existen y ∈ A, z ∈ A tales que x = yz.

1.2. Probar que {a} = {b, c} si y solo si a = b = c.

1.3. Probar que {{a}, {a, b}} = {{c}, {c, d}} si y solo si a = c y b = d.

1.4. ¿Cuales de los conjuntos A = {x ∈ R : x2 = 1}, B = {x ∈ R : x4 = 1}, C = {x ∈ C : x2 = 1},D = {x ∈ C : x4 = 1} son iguales y cuales son distintos? ¿Por que? ¿Cuales son subconjuntos deotros?

1.5. Demostrar las siguientes igualdades entre conjuntos:

(i) {x ∈ R : x3 − x > 0} = {x ∈ R : −1 < x < 0 o x > 1}.

(ii) {(x, y, z) ∈ R3 : x = y, x+ y + z = 1}= {(x, y, z) ∈ R3 : x = t/2, y = t/2, z = 1− t para algun t ∈ R}.

1.6. Dados tres conjuntos A, B, C, si A ⊆ B y B ⊆ C entonces A ⊆ C.

1.7. ¿Es cierto que A ⊆ B si y solo si ℘(A) ⊆ ℘(B)? ¿Por que?

1.8. Sea A0 = ∅, An = ℘(An−1), n ∈ N. Describir explıcitamente A1, A2, A3, A4. ¿Cuantoselementos tiene cada uno de estos conjuntos? ¿Cuantos elementos crees que tendra An para un narbitrario?

1.1.2. Operaciones con conjuntos: union, interseccion, complemento.

Definicion 1.1.4. Dados dos conjuntos A y B, su union es el conjunto

A ∪B = {x : x ∈ A o x ∈ B},

formado por los elementos que pertenecen al menos a uno de los dos conjuntos (pueden pertenecera los dos).

La interseccion de A y B es el conjunto

A ∩B = {x : x ∈ A y x ∈ B},

formado por los elementos que pertenecen simultaneamente a ambos conjuntos.Si A ∩B = ∅, diremos que A es disjunto con B (y entonces tambien B es disjunto con A).El complementario de B respecto de A es el conjunto

A \B = {x : x ∈ A y x /∈ B},

formado por los elementos de A que no pertenecen a B. Se le denomina tambien la diferenciaentre A y B.

Cuando todos los conjuntos que se manejan son subconjuntos de un conjunto X dado explıci-tamente o inequıvocamente sobreentendido, se pone Ac en vez de X \ A, abreviando 〈〈el comple-mentario de A respecto de X〉〉 por el complementario de A, sin mas.

Diagramas de Venn. Las operaciones con conjuntos permiten realizar “calculos” que se intuyenmejor utilizando diagramas de Venn , que consisten en dibujar en el plano regiones, limitadas porcircunferencias o curvas adecuadas, que representan a los conjuntos. Por ejemplo, en los diagramas

1.1. CONJUNTOS. 17

hemos representado dos conjuntos A y B como las regiones limitadas por una elipse grande y unacircunferencia pequena. Las zonas rayadas representan, sucesivamente, A, B, A∪B, A∩B, A \B.

Los “calculos” con conjuntos comparten algunas reglas (¡no todas!) con las operaciones entrenumeros.

Proposicion 1.1.5. Dados tres conjuntos cualesquiera A, B y C, se tienen las siguientes igualda-des:

(i) (A ∪B) ∪ C = A ∪ (B ∪ C).

(ii) (A ∩B) ∩ C = A ∩ (B ∩ C).

(iii) A ∩ (B ∪ C) = (A ∩B) ∪ (A ∩ C).

(iv) A ∪ (B ∩ C) = (A ∪B) ∩ (A ∪ C).

Demostracion. Ver [D-H], pp. 10-11.

Proposicion 1.1.6. Leyes de De Morgan. Sean A, B, subconjuntos de un conjunto X. Entonces

(i) (A ∪B)c = Ac ∩Bc.

(ii) (A ∩B)c = Ac ∪Bc.

Demostracion. Ejercicio.

Las definiciones de union e interseccion de dos conjuntos pueden ampliarse a una coleccionarbitraria de conjuntos.

Definicion 1.1.7. Sea C una coleccion no vacıa de conjuntos (un conjunto no vacıo cuyos elementosson a su vez conjuntos). La union de C es el conjunto⋃

C =⋃A∈C

A = {x : x ∈ A para algun A ∈ C},

formado por los elementos x que pertenecen a uno al menos de los conjuntos de C.La interseccion de C es el conjunto⋂

C =⋂A∈C

A = {x : x ∈ A para todos A ∈ C},

formado por los elementos x que pertenecen a todos los conjuntos de C.

En particular, cuando C = {A,B} reencontramos las definiciones de A ∪B y A ∩B.En el caso de que sea C = {A1, A2, . . . , Ak}, se emplea la notacion

k⋃n=1

An,

k⋂n=1

An,


en vez de⋃C,⋂C, respectivamente. Ası mismo, cuando C = {An : n ∈ N}, suele emplearse⋃

n∈N

An,⋂n∈N

An,

o alguna otra notacion similar.

En ocasiones se manejan ‘conjuntos de ındices’ cualesquiera, no solamente N: por ejemplo,C = {Ax : x ∈ R}, donde Ax = (−∞, x) = {y ∈ R : y < x}.

En general, si I es un conjunto no vacıo arbitrario, y para cada i ∈ I tenemos dado un ciertoconjunto Ai, podemos considerar C = {Ai : i ∈ I} y definir⋃

i∈IAi =

⋃C =

⋃{Ai : i ∈ I},

⋂i∈I

Ai =⋂C =

⋂{Ai : i ∈ I},

de manera que resultara ⋃i∈I

Ai = {x : x ∈ Ai para algun ındice i ∈ I}, (1.1)⋂i∈I

Ai = {x : x ∈ Ai para todos ındices i ∈ I}. (1.2)

Cuando C viene dado de este modo, diremos que se trata de una familia de conjuntosparametrizada por I o con conjunto de ındices I. Daremos una definicion mas ‘formal’posteriormente.

Proposicion 1.1.8. Leyes de De Morgan. Dado un conjunto X, sea C = {Ai : i ∈ I} unafamilia de subconjuntos de X [es decir, C ⊆ ℘(X)] con conjunto de ındices I. Entonces

(1)(⋃

i∈I Ai)c =

⋂i∈I A

ci .

(2)(⋂

i∈I Ai)c =

⋃i∈I A

ci .


Ejercicios

2.1. Sea A un subconjunto de un conjunto dado X. Comprobar que (Ac)c = A.

2.2. Probar que dados dos subconjuntos A, B de un conjunto X, entonces X \ A = B si y solo siA ∪B = X, A ∩B = ∅.

2.3. Dados dos conjuntos A, B, demostrar que:(1) A ⊆ B si y solo si A ∪B = B.(2) A ⊆ B si y solo si A ∩B = A.(3) A ⊆ B si y solo si A \B = ∅.

2.4. Sean A, B, C, D conjuntos tales que A ⊆ B y C ⊆ D. Probar que A ∪ C ⊆ B ∪ D yA ∩ C ⊆ B ∩D.

2.5. Dado un conjunto X, sean A, B, C ⊆ X.(1) Probar que A \B = A ∩Bc.(2) Aplicando lo anterior y las leyes de De Morgan, dar otra expresion de A \ (B \ C).(3) ¿Es lo mismo A \ (B \ C) que (A \B) \ C? ¿Por que?

2.6. Dados dos conjuntos A, B, probar que (A \B) ∪ (B \ A) = (A ∪B) \ (A ∩B) (este conjuntose denomina diferencia simetrica o discrepancia de A y B.)

1.2. PARES ORDENADOS. PRODUCTO CARTESIANO DE CONJUNTOS. 19

2.7. Sea A0 = ∅, An = An−1 ∪ {An−1}, n ∈ N. Describir explıcitamente A1, A2, A3, A4. ¿Cuantoselementos tiene cada uno de estos conjuntos? ¿Cuantos elementos crees que tendra An para un narbitrario? ¿Como probarıas tu conjetura?

2.8. Sea A1 un conjunto arbitrario, y definamos An+1 = ℘(An), n ∈ N, A =⋃nAn. ¿Es cierto que

B ⊆ A si y solo si ℘(B) ∈ A?

2.9. Para cada k ∈ N, sea Ak = {n ∈ Z : n ≥ k}. Comprobar que

A1 ⊇ A2 ⊇ . . . ⊇ Ak ⊇ Ak+1 ⊇ . . .

y, por tanto,⋂kn=1An = Ak 6= ∅ cualquiera que sea k ∈ N.

Sin embargo,⋂n∈N

An = ∅.

2.10. Para cada n ∈ N, sea An =[0, 1− 1

2n

], Bn =

[0, 1− 1

3n

]. Comprobar que An esta estricta-

mente contenido en Bn para todo n. ¿Esta la union de los An estrictamente contenida en la unionde los Bn?

(No: probar que⋃n∈N

An =⋃n∈N

Bn = [0, 1).)

1.2. Pares ordenados. Producto cartesiano de conjuntos.

El lector ha manejado ya pares ordenados en situaciones concretas: al introducir un sistema decoordenadas en el plano, por ejemplo, cada punto viene representado por un par ordenado (x, y)de numeros reales. La diferencia esencial entre el par ‘ordenado’ (x, y) y el conjunto {x, y} (el ‘parsin ordenar’) es que distinguimos (x, y) de (y, x), considerando iguales dos pares (x, y) y (u, v)si y solo si x = u, y = v. Ampliando esta idea, podemos considerar pares ordenados (a, b) cuyoprimer elemento a pertenezca a un conjunto cualquiera A y su segundo elemento b pertenezca a unconjunto cualquiera B, manteniendo su ‘propiedad caracterıstica’:Criterio de igualdad de pares ordenados. Dados dos conjuntos arbitrarios A, B, y dos paresordenados (a, b), (a′, b′), con a, a′ ∈ A, b, b′ ∈ B, es

(a, b) = (a′, b′) si y solo si a = a′ y b = b′.

(Como curiosidad, senalemos que es posible dar una definicion de par ordenado en terminos deconjuntos.2)

Definicion 1.2.1. El producto cartesiano de dos conjuntos A y B es el conjunto

A×B = {(a, b) : a ∈ A, b ∈ B}

formado por todos los pares ordenados cuyo primer elemento esta en A y el segundo en B.

Ejemplos. El conjunto de las coordenadas de los puntos del plano es R×R. Pero quiza el primerproducto cartesiano de su vida (de un conjunto de letras por un conjunto de numeros) lo hayamanejado el lector en el ‘juego de los barcos’. (Mas ejemplos en [G-H], cap. 3.)

Ejercicio. Dados tres conjuntos A, B, C, probar que

(i) A× (B ∪ C) = (A×B) ∪ (A× C).

(ii) A× (B ∩ C) = (A×B) ∩ (A× C).

(iii) A× (B \ C) = (A×B) \ (A× C).2 Concretamente, Kuratowski dio la siguiente definicion formal:

(a, b) = {{a}, {a, b}}.

Si se revisa el ejercicio 1.3, se vera como esta definicion encaja adecuadamente con la idea intuitiva.


1.3. Correspondencias y aplicaciones entre conjuntos

1.3.1. Comentarios previos: Ideas intuitivas y ejemplos.

¿Cuantas matematicas hay en una guıa telefonica? Mas de las que parece. Contiene un conjuntode numeros (de telefono), por supuesto, y un conjunto de nombres de usuarios (personas, institu-ciones, empresas, etc.). Pero lo mas interesante es que cada numero aparece asociado al nombre delabonado; es decir, la guıa es una ‘herramienta’ que permite establecer una correspondencia entreel conjunto de los nombres de los abonados y el conjunto de los numeros de telefonos de la red,haciendo corresponder a cada nombre su numero (o sus numeros) de telefono.

¿Cual es el interes matematico de esta observacion? Una de las grandes lıneas de progreso delas Matematicas consiste en descubrir patrones generales que engloben la mayor cantidad posiblede conceptos y situaciones particulares aparentemente distintas, proporcionando un marco teoricofructıfero para su estudio unificado. Pues bien: hay multitud de situaciones heterogeneas que respo-den al patron que acabamos de considerar, es decir, que pueden describirse como correspondenciasentre conjuntos. Veamos algunas muestras:— la asignacion del NIP hace corresponder a cada alumno de la Universidad de Zaragoza su Numerode Identificacion Personal;— en las tablas de datos recogidos en un experimento, se empareja cada valor de una ‘variableindependiente’ que vamos modificando a voluntad (por ejemplo, el tiempo), con el que alcanza una‘variable dependiente’ ligada a la anterior (por ejemplo, la distancia recorrida durante ese tiempopor una bola que se desplaza sobre un plano inclinado);— una traslacion por un vector ~v hace corresponder a cada punto P el punto Q tal que

−−→PQ = ~v;

— un giro de centro C y angulo α ‘transforma’ un punto P del plano en el punto Q tal que losvectores

−−→CP ,

−−→CQ tienen el mismo modulo y forman entre sı un angulo α;

— un mapa es una representacion de un trozo de la superficie terrestre que hace corresponder acada punto de ella un punto del mapa;— una funcion como la raız cuadrada (real), por ejemplo, hace corresponder a cada numero realno negativo a otro numero real no negativo b cuyo cuadrado b2 es a;— la relacion de paternidad entre personas empareja una persona P con otra persona Q si y solosi P es el padre de Q;— la relacion de orden ≤ entre numeros reales empareja un numero real dado a con cada numeroreal b tal que a ≤ b;— ciertos programas informaticos (‘procedures’, ‘functions’) asocian a cada input admisible de undeterminado tipo de datos, un output del mismo tipo o de otro tipo distinto.

En todos los casos disponemos de un conjunto A del que tomar los objetos (alumnos, numeros,puntos, etc.) a los que ‘se hace corresponder’ elementos de un conjunto B (numeros, etc.) ‘me-diante un criterio determinado’. Para dar una definicion matematicamente satisfactoria, habra queconcretar mejor lo que queremos decir con ‘hacer corresponder mediante un criterio determinado’.Y aquı viene en nuestra ayuda el concepto de par ordenado, puesto que, en definitiva, lo quehacemos, eliminando detalles accesorios, es “emparejar cada elemento x de A con cierto (o ciertos)elementos y de B” y “no emparejarlo” con otros: es decir, dentro del conjunto A × B de paresordenados con primer elemento en A y segundo elemento en B, seleccionamos un subconjunto Gde manera que a un x ∈ A corresponda un y ∈ B si y solo si (x, y) ∈ G. Por ejemplo, en el caso delNIP, el conjunto A es el de los alumnos de la Universidad de Zaragoza, B puede ser el conjunto delos numeros naturales y G = {(x, y) ∈ A×B : y es el NIP de x}; en la traslacion por un vector ~v,A es el conjunto de los puntos del espacio, B tambien (B = A), y G = {(P,Q) ∈ A×B :

−−→PQ = ~v};

en la relacion de orden entre numeros reales, A = B = R, G = {(x, y) ∈ R× R : x ≤ y}, etc.

Como se ve, la nocion de correspondencia entre conjuntos, dada por un primer conjunto A,un segundo conjunto B y un subconjunto G de A × B, es muy general, casi ‘demasiado’ general.Enseguida se advierten diferencias entre las distintas correspondencias que hemos examinado. En

1.3. CORRESPONDENCIAS Y APLICACIONES 21

algunas de ellas, un mismo elemento del conjunto A esta en correspondencia con mas de un elementode B, por lo que podrıamos decir que, en cierto modo, son correspondencias ‘ambiguas’ o ‘pocoajustadas’: ¿cual es ‘el’ numero de telefono de un abonado que tenga mas de un telefono? ¿comopensar que una variable fısica y ‘depende’ de otra variable fısica x si a un mismo valor de x lepueden corresponder varios valores distintos de y?

En una correspondencia entre dos conjuntos A y B que evite esa ‘ambiguedad’, cada elementode A tendra asociado un solo elemento de B; cuando esto suceda, diremos que la correspondenciaes una aplicacion. En otras palabras, una aplicacion de un conjunto A en un conjunto B es unaterna formada por A, B, y un subconjunto G de A×B que cumple la siguiente condicion:

para cada x ∈ A hay un y ∈ B, y solo uno, tal que (x, y) ∈ G. (∗)Dicho de otro modo, han de cumplirse dos cosas: (1) a cada x ∈ A, sin excepcion, le correspondeun elemento y ∈ B tal que (x, y) ∈ G, (2) pero uno nada mas.

El modelo paradigmatico de aplicaciones son las funciones, que no son otra cosa que las aplica-ciones entre conjuntos de numeros. Buena parte de la nomenclatura y notaciones que usaremos enel estudio de las aplicaciones esta copiada de las que tradicionalmente empleamos para funciones.Por ejemplo, indicaremos que f es una aplicacion entre un conjunto A y un conjunto B poniendof : A → B, llamaremos a G la grafica de f , y en vez de decir que a un x ∈ A le corresponde uny ∈ B mediante la aplicacion f , diremos que y es el valor de f en x, escrito y = f(x). Con estanotacion, la condicion (∗) que caracteriza a las correspondencias que son aplicaciones se expresa aveces poniendo que

— f(x) esta definido cuando y solo cuando x ∈ A,— si x1, x2 ∈ A son tales que x1 = x2, forzosamente f(x1) = f(x2).

(Suele decirse que f esta bien definida en A para indicar abreviadamente que se cumplen estas doscondiciones.)

Las transformaciones geometricas tambien son ejemplos de aplicaciones, y proporcionan otramanera de interpretar lo que hace una aplicacion: una traslacion transforma o “convierte” un puntoen su trasladado, etc. La idea de transformacion o conversion aparece tambien en contextos nogeometricos, donde se tienen procesos que pueden representarse mediante un esquema denominado‘de caja negra’,

entrada−→

cajanegra

salida−→

en el que introducimos una ‘entrada admisible’ en la caja negra y obtenemos (sin que nos importecomo) una ‘salida’: la ‘caja negra’ puede ser una transformacion geometrica o una funcion o unatabla, pero tambien puede ser un amplificador, por el que entra una onda y da como respuestaotra onda, o puede ser la cuerda de un instrumento musical, que producira al pulsarla, golpearlao frotarla un sonido diferente segun sea su longitud, o . . . (el lector puede inventar sus propiosejemplos). Lo sustancial es la existencia de un conjunto predeterminado de entradas admisibles, yde un emparejamiento de cada uno de ellos con una salida bien definida, perteneciente al mismo oa otro conjunto.

Esta interpretacion de las aplicaciones tiene su incidencia en el lenguaje: nos referiremos indis-tintamente a f(x) como el valor de f en x o como la imagen de x por f .

Por supuesto, hay correspondencias que no son aplicaciones: la correspondencia entre el nombrede una persona y la persona NO es una aplicacion (y por eso en el DNI es necesario anadir el numerosi queremos identificarla); en cambio, SI es una aplicacion la correspondencia entre la persona y sunombre ‘autentico’.

La nocion general de aplicacion juega un papel unificador entre las diferentes variantes de lamisma que estan presentes en todas partes de las Matematicas: ademas de las funciones y de lastransformaciones geometricas, encontramos las aplicaciones lineales en Algebra lineal, las aplica-ciones continuas en Topologıa, los homomorfismos en Algebra abstracta, las variables aleatorias enProbabilidad, etc. De las propiedades comunes a todas ellas nos ocupamos a continuacion.


1.3.2. Aplicaciones: dominio, codominio, grafica.

En terminos conjuntistas,

Definicion 1.3.1. Una correspondencia entre dos conjuntos A y B es una terna (A,B,G)formada por el conjunto A, el conjunto B y un subconjunto G del producto cartesiano A×B.

Definicion 1.3.2. Una aplicacion f : A→ B es una terna (A,B,Gf ), donde A, B son conjuntosdados, llamados respectivamente el dominio o conjunto inicial y el codominio o conjuntofinal de f , y Gf , denominado grafico o grafica de f , es un subconjunto del producto cartesianoA×B tal que para todo x ∈ A existe un elemento unico y ∈ B de modo que (x, y) ∈ Gf .

El elemento y unıvocamente asociado a x suele denotarse por f(x) y se llama valor de laaplicacion f en el punto x o imagen de x por f .

En lo sucesivo, pondremos como es costumbre y = f(x) en vez de (x, y) ∈ Gf .Informalmente, dar una aplicacion f supone dar:

su dominio de definicion A = dom f ;

su codominio B;

una regla de correspondencia o regla de definicion que permita asignar inequıvocamente acada elemento x de A, sin excepcion, un elemento f(x) de B perfectamente determinado porx y f .

Cambiar una cualquiera de estas tres cosas (el dominio, el conjunto final o la “regla de de-finicion”) hace que la aplicacion cambie. Por ejemplo, si tenemos una aplicacion f : A → B yconsideramos un subconjunto S de A, la restriccion de f a S es la aplicacion f |S : S → B talque f |S(x) = f(x) para cada x ∈ S, que no es la misma aplicacion f (se ha cambiado el dominio),aunque venga dada por “la misma regla de correspondencia” (a cada x de S, la restriccion f |S hacecorresponder el mismo valor que f ¡pero f |S(x) no esta definida para x /∈ S!).

Como acabamos de ver, en la practica raras veces se muestra una aplicacion como una terna,tal como requerirıa su definicion formal: lo habitual es especificar su dominio, su codominio y laregla que permite determinar el valor de la aplicacion en cada elemento del dominio.

Suele chocar al principiante que a veces la regla de definicion de una aplicacion aparece divididaen varias subreglas parciales (expresadas frecuentemente, cuando intervienen conjuntos numericos,mediante formulas), tendiendo a interpretar incorrectamente que se han definido tantas aplicacionescuantas subreglas se enuncien. Por ejemplo, la aplicacion f : R→ R tal que

f(x) =

{x, si x ≥ 0;−x, si x < 0,

es una sola aplicacion, la funcion valor absoluto, y no dos funciones, aunque sus valores coincidanen parte de su dominio (¡no en todo!) con los que toman las dos aplicaciones distintas g : x ∈ R→g(x) = x ∈ R y h : x ∈ R→ h(x) = −x ∈ R.

En resumen:Criterio de igualdad de aplicaciones. Dos aplicaciones f : A → B, g : C → D son iguales siy solo si

1. A = C (f y g tienen el mismo dominio);

2. B = D (f y g tienen el mismo conjunto de llegada);

3. para todo x ∈ A(= C), f(x) = g(x) (f y g toman el mismo valor en cada elemento de sudominio comun)


Ejercicio. Estudiar si son o no iguales las aplicaciones f : R→ R, g : R→ R dadas por

f(x) = 2x; g(x) = |x− 1|+ |x+ 1|.

¿Cambia la respuesta si comparamos las restricciones de f y g al intervalo [1,+∞)? ¿Y comparandolas restricciones a otros subconjuntos de R?

Ejercicio. Sea A = (0,+∞) = {x ∈ R : x > 0} y B = R. ¿Queda definida una aplicacionf : A→ B si para cada x ∈ A ponemos

f(x) = log(log(senx))?

¿Por que?

Ejercicio. ¿En que condiciones la correspondencia que asocia cada punto de una transparenciacon su proyeccion en la pantalla es una aplicacion entre la transparencia y la pantalla?

1.3.3. Imagen y antiimagen de un conjunto.

La idea visual del ejercicio anterior se acomoda perfectamente con la nomenclatura que vamosa introducir a continuacion.

Definicion 1.3.3. Sea f : A → B una aplicacion y sean S ⊆ A, T ⊆ B. Llamamos conjuntoimagen de S por f al conjunto

f(S) = {f(x) : x ∈ S} , o, mas explıcitamente, f(S) = {y ∈ B : existe x ∈ S tal que y = f(x)},

y conjunto antiimagen de T por f al conjunto

f−1(T ) = {x : f(x) ∈ T},

que sera un subconjunto (eventualmente vacıo) de A.El conjunto imagen del dominio de f suele denominarse, simplemente, conjunto imagen de

f o rango de f , y se denota a veces im f o rang f ; por tanto, se tiene

im f = f(A) = f(dom f) = {f(x) : x ∈ dom f} .

Proposicion 1.3.4. Dada f : A→ B, sean A1, A2 ⊆ A, B1, B2 ⊆ B. Entonces:

(i) si A1 ⊆ A2, tambien f(A1) ⊆ f(A2);

(ii) si B1 ⊆ B2, tambien f−1(B1) ⊆ f−1(B2).


Proposicion 1.3.5. Dada f : A→ B, sean A1, A2 ⊆ A, B1, B2 ⊆ B. Entonces:

(i) f (A1 ∪A2) = f(A1) ∪ f(A2).

(ii) f (A1 ∩A2) ⊆ f(A1) ∩ f(A2), pudiendo ser f (A1 ∩A2) 6= f(A1) ∩ f(A2).

(iii) f−1 (B1 ∪B2) = f−1(B1) ∪ f−1(B2).

(iv) f−1 (B1 ∩B2) = f−1(B1) ∩ f−1(B2).


Demostracion. Probaremos solamente (ii), dejando la demostracion de (i), (iii), (iv) como ejercicio.De acuerdo con las definiciones anteriores, sera:

y ∈ f(A1 ∩A2) ⇐⇒ existe x ∈ A1 ∩A2 tal que f(x) = y; (1.3)

y ∈ f(A1) ∩ f(A2) ⇐⇒ y ∈ f(A1) e y ∈ f(A2) ⇐⇒

{existe a ∈ A1 tal que f(a) = y,

existe b ∈ A2 tal que f(b) = y.(1.4)

A su vez, (1.3) significa que existe un mismo x, que esta tanto en A1 como en A2, tal que f(x) = y.Por tanto, comparando vemos que (1.3) =⇒ (1.4) sin mas que tomar a = b = x. Ası pues,

y ∈ f(A1 ∩A2) =⇒ y ∈ f(A1) ∩ f(A2), o lo que es lo mismo,

f(A1 ∩A2) ⊆ f(A1) ∩ f(A2) como querıamos probar.

Por contra, no esta claro que funcione la implicacion inversa, ya que (en principio al menos)podrıamos encontrar f(a) = y = f(b) sin que a = b.

'

&

$

%'

&

$

%

'

&

$

%

'

&

$

%

A f

A1

A2

a

c

b

y

y′

BXXXXXXXz

PPPPPPPq��

��*

•

•

•

•

•

¿Tenemos algun contraejemplo sencillo a (1.4) =⇒ (1.3)? Sı: cualquier aplicacion que tenga almenos dos elementos a 6= b para los que f(a) = f(b); tomando A1 = {a}, A2 = {b}, es A1∩A2 = ∅,f(A1 ∩A2) = ∅, f(A1) = {f(a)} = {f(b)} = f(A2), por lo que

f(A1) ∩ f(A2) = {f(a)} 6⊆ ∅ = f(A1 ∩A2).

Si queremos dar ejemplos concretos, f puede ser una aplicacion constante en un conjunto con masde un elemento, o puede ser f : x ∈ R → f(x) = x2 ∈ R, y entonces podrıamos tomar incluso A1

y A2 con infinitos elementos e interseccion no vacıa: por ejemplo, A1 = (−∞, 1), A2 = (−1,+∞),f(A1 ∩A2) = f((−1, 1)) = [0, 1), f(A1) ∩ f(A2) = [0,+∞).

Ejercicio. Con las notaciones de la proposicion anterior, ¿que relaciones hay entre f(A1 \ A2) yf(A1) \ f(A2)? ¿y entre f−1 (B1 \B2) y f−1(B1) \ f−1(B2)?

1.3.4. Aplicaciones inyectivas, suprayectivas, biyectivas.

Definicion 1.3.6. Una aplicacion f se dice inyectiva si elementos distintos de su dominio tienenimagenes distintas: es decir, si dados x, y ∈ dom f , de x 6= y se sigue f(x) 6= f(y); o, equivalente-mente, si dados x, y ∈ dom f , de f(x) = f(y) se sigue x = y.

Una aplicacion f : A→ B se dice suprayectiva si f(A) = B (si el conjunto final y el conjuntoimagen de f coinciden) ; dicho de otra forma, si cada elemento de B es imagen de algun (o algunos)elemento(s) de A, o sea, si para todo b ∈ B existe al menos un a ∈ A tal que f(a) = b.

Una aplicacion se dice biyectiva si es simultaneamente inyectiva y suprayectiva. Equivalente-mente, si para todo b ∈ B existe un a ∈ A , y uno solo, tal que f(a) = b.


Ejemplos. Para cualquier conjunto A, la aplicacion identidad idA : x ∈ A → idA(x) = x ∈ A estrivialmente biyectiva.

La aplicacion f : N→ N tal que f(x) = x2 para cada x ∈ N es inyectiva, pero no suprayectiva(¿por que?); sin embargo, la aplicacion g : Z → Z dada por la misma formula no es inyectiva.La aplicacion E : R → R tal que F (x) = ex para cada x ∈ R es inyectiva pero no suprayectiva:su conjunto imagen F (R) es el intervalo (0,+∞). Sı es suprayectiva (e inyectiva) la aplicacionG : R→ (0,+∞) dada por G(x) = ex para x ∈ R.

Este ultimo ejemplo ilustra la necesidad de prestar atencion al codominio de la funcion: el cambiorealizado lleva de una aplicacion que no es suprayectiva a otra que sı lo es. Ademas, nos da la pistapara transformar cualquier aplicacion no suprayectiva en otra ‘casi igual’ que sea suprayectiva:basta pasar de f : A → B a f : A → f(A) dada por f(a) = f(a) para cada a ∈ A, ajustandosolamente el conjunto de llegada (f es la suprayeccion asociada a f ; cuando f es inyectiva, fes biyectiva, la biyeccion asociada a f).

Proposicion 1.3.7. Dada f : A→ B, sean A1, A2 ⊆ A. Si f es inyectiva, entonces:

f (A1 ∩A2) = f(A1) ∩ f(A2).

Demostracion. Como ya hemos visto, se verifica ciertamente que f(A1∩A2) ⊆ f(A1)∩f(A2). Perola inyectividad de f da que tambien f(A1) ∩ f(A2) ⊆ f(A1 ∩ A2), puesto que y ∈ f(A1) ∩ f(A2)implica que existe a ∈ A1 tal que f(a) = y y que existe b ∈ A2 tal que f(b) = y, lo que por ser finyectiva obliga a que a = b, y por tanto a = b ∈ A1 ∩A2 =⇒ y = f(a) ∈ f(A1 ∩A2).

En consecuencia, f(A1 ∩A2) = f(A1) ∩ f(A2) en este caso.

Releyendo atentamente las proposiciones y contraejemplos anteriores vemos que hemos conseguido real-mente un resultado mas preciso: la inyectividad de f es necesaria (contraejemplos previos) y suficiente (ultimaproposicion) para que la igualdad de los conjuntos del enunciado se verifique sin excepciones.

Ejercicio. Con las notaciones de la proposicion anterior, ¿afecta a las relaciones entre f(A1 \A2)y f(A1) \ f(A2) que f sea inyectiva o suprayectiva? La misma pregunta para f−1 (B1 \B2) yf−1(B1) \ f−1(B2).

1.3.5. Mas sobre familias de conjuntos

Podemos extender resultados anteriores si en vez de considerar solo dos conjuntos consideramosfamilias arbitrarias de conjuntos. Ademas, ahora podemos dar una definicion mas precisa y masgeneral de lo que es una familia parametrizada por un conjunto de ındices I.

Definicion 1.3.8. Sean A, I conjuntos arbitrarios. Diremos que (ai)i∈I es una familia de ele-mentos de A con conjunto de ındices I o parametrizada por I si hay una aplicacionf : I → A con f(i) = ai para cada i ∈ I.

Los elementos de A pueden ser a su vez conjuntos, y tenemos entonces una familia indexada(o parametrizada) de conjuntos.

Realmente, en este “cambio de escritura” lo unico que varıa es el punto de vista: se destacan losvalores de la aplicacion f , y se dejan la aplicacion y los elementos del dominio en segundo plano.

Habıamos introducido la union y la interseccion de una familia cualquiera de conjuntos en (1.1)y (1.2), pagina 18. Veamos que sus imagenes y antiimagenes por una aplicacion funcionan igualque para dos conjuntos.

Proposicion 1.3.9. Dada f : A→ B, sea (Ai)i∈I una familia de subconjuntos de A, (Bi)i∈I unafamilia de subconjuntos de B. Entonces:

(i) f(⋃

i∈I Ai)

=⋃i∈I f(Ai).


(ii) f(⋂

i∈I Ai)⊆⋂i∈I f(Ai).

(iii) Si f es inyectiva,

f

(⋂i∈I

Ai

)=⋂i∈I

f(Ai).

En caso contrario, el contenido del apartado anterior puede ser estricto.

(iv) f−1(⋃

i∈I Bi)

=⋃i∈I f

−1(Bi).

(v) f−1(⋂

i∈I Bi)

=⋂i∈I f

−1(Bi).

Demostracion. Examinemos con detalle el caso mas delicado, la imagen de la interseccion (losdemas se dejan como ejercicios).

Segun las definiciones,

f

(⋂i∈I

Ai

)= {f(x) : x ∈

⋂i∈I

Ai} = {f(x) : x ∈ Ai para todos ındices i ∈ I},

mientras que⋂i∈I

f(Ai) = {y : y ∈ f(Ai) para todos ındices i ∈ I}

= {y : hay un x ∈ Ai tal que y = f(x), para todos ındices i ∈ I}.

A simple vista, los dos conjuntos parecen iguales, pero hay una diferencia fundamental: leıdocon todo cuidado, observamos que el primer conjunto consta de los elementos y de B que son de laforma y = f(x) para un mismo x que esta simultaneamente en todos los conjuntos Ai cualquieraque sea i ∈ I, mientras que el segundo consta de los elementos y de B tales que para cada i ∈ Ihay un x ∈ Ai, posiblemente distinto para cada i, con y = f(x); empleando cuantificadores en vezdel lenguaje ordinario, expresemos de manera mas clara la ‘pequena’ diferencia: dado y ∈ B,

y ∈ f

(⋂i∈I

Ai

)si y solo si ∃x ∈ A tal que y = f(x) y ∀i ∈ I, x ∈ Ai ;

y ∈⋂i∈I

f(Ai) si y solo si ∀i ∈ I, ∃xi ∈ Ai tal que y = f(xi).

La conclusion entonces es que se verifica siempre el contenido de (ii).¿Que anade la condicion de que f sea inyectiva? Que, desde el momento en que se verifique

f(xi) = f(xj) con xi ∈ Ai, xj ∈ Aj , necesariamente xi = xj ; ahora sı podrıamos asegurar que siy ∈

⋂i∈I f(Ai), existe un solo x tal que x ∈ Ai e y = f(x), y los dos conjuntos son iguales.

Pero si suprimimos la inyectividad, ya hemos visto contraejemplos sencillos para familias {A1, A2}de dos conjuntos.

1.3.6. Composicion de aplicaciones.

Definicion 1.3.10. Sean A, B, C conjuntos arbitrarios. Dadas dos aplicaciones f : A → B yg : B → C, la composicion de f y g, denotada g ◦ f , es la aplicacion g ◦ f : A→ C dada por

(g ◦ f)(x) = g (f(x))

para cada x ∈ A.

Notese que, efectivamente, es una aplicacion bien definida. En palabras poco precisas, podrıamosdecir que es el resultado de hacer actuar primero a f y luego a g.


Graficamente, podrıamos reflejar la construccion de g ◦ f en el siguiente diagrama:

'

&

$

%

'

&

$

%

'

&

$

%

A B Cf

s

gs

x r y = f(x)r z = g(y) = g(f(x))r

g ◦ f

�

Nota. En otros contextos, especialmente en Analisis matematico, se usa una definicion mas generalde la composicion: dadas dos aplicaciones f : A→ B y g : C → D, se define g◦f como la aplicacioncon dominio

dom(g ◦ f) = f−1(C) = f−1(dom g)

y codominio D dada por

(g ◦ f)(x) = g (f(x))

para cada x ∈ dom(g ◦ f). Observese que tales x son justamente aquellos elementos de A para losque g (f(x)) “tiene sentido”.

Ejemplo. Si f : R → R esta dada por f(x) = x2 y g : R → R por g(x) =x√

x2 + 1, g ◦ f y f ◦ g

son las aplicaciones de R en R dadas respectivamente por

(g ◦ f)(x) = g(f(x)) =x2

√x4 + 1

, (f ◦ g)(x) = f(g(x)) =x2

x2 + 1,

distintas. Hay que ser cuidadoso, por tanto, con el orden de escritura en la composicion.

1.3.7. Inversa de una aplicacion biyectiva. Inyectividad e inversa parcial.

Consideraciones previas

Una correspondencia entre un conjunto A y un conjunto B puede ser “leıda al reves” paraobtener una correspondencia entre B y A. Por ejemplo, si A es un conjunto de mujeres, B elconjunto de todos sus parientes femeninos, y a cada x ∈ A asociamos un y ∈ B si y solo si x es hijade y, la correspondencia inversa asociarıa un y ∈ B con un x ∈ A si y solo si y es la madre de x.

Este ejemplo pone de manifiesto que aun cuando la correspondencia inicial sea una aplicacion,no siempre la correspondencia inversa es tambien una aplicacion: para y ∈ B, es posible que en Aencontremos mas de una hija de y o, en el extremo contrario, puede que no haya en A ninguna hijade y.

Vemos ası que, si queremos hablar de la aplicacion inversa de una aplicacion dada f : A → Bpuede haber dificultades por partida doble: bien porque un elemento y de B aparezca como imagenpor f de mas de un elemento de A (es decir, porque f no sea inyectiva), o bien porque algun y deB no sea imagen por f de ningun elemento de A (es decir, porque f no sea suprayectiva).

Hace falta, pues, que f sea biyectiva, y en tal caso podemos construir la aplicacion inversa, quedenotaremos por f−1, con dominio B = codom f y codominio A = dom f , ‘deshaciendo’ la accionde f , como mostramos en el siguiente esquema.


'

&

$

%

'

&

$

%

Af-

brB

Dado b ∈ B . . .

'

&

$

%

'

&

$

%

Af

s

a r× brB

. . . como f es biyectiva, existe un a ∈ A y uno solotal que f(a) = b . . .

'

&

$

%

'

&

$

%

Af

s

a r× brB

f−1}

. . . y, por definicion, f−1(b) es este unico a ∈ A.

Notese como la construccion de la inversa esta ligada a la resolucion de ecuaciones: f−1 tiene sentido(es decir, f es biyectiva) si y solo si para cada b ∈ B la ecuacion f(x) = b tiene solucion unica,y justamente dicha solucion es f−1(b). Y viceversa: si una ecuacion puede expresarse en la formaf(x) = b (b dato, x incognita) para una aplicacion f que tiene una inversa conocida, la ecuaciontiene una y una sola solucion, que es x = f−1(b).

Definiciones y propiedades

Definicion 1.3.11 (aplicacion inversa). Dada una aplicacion biyectiva f : A→ B, llamaremosaplicacion inversa de f a la aplicacion f−1 : B → A tal que para cada b ∈ B, f−1(b) es el unicoelemento a ∈ A para el que f(a) = b.

En terminos mas formales, f−1 serıa la aplicacion dada por la terna (B,A,Gf−1), dondeGf−1 = {(b, a) : (a, b) ∈ Gf}, y Gf es, por supuesto, la grafica de f .

Que f−1 es una aplicacion de B en A bien definida es consecuencia directa de la biyectividadde f , porque para cualquier b ∈ B existira al menos un elemento a ∈ A tal que b = f(a) por ser fsuprayectiva, y ese a es unico por ser f inyectiva, con lo que cada elemento de B sin excepcion secorresponde con un elemento inequıvocamente determinado de A.

Nota. En los textos de Analisis matematico suele hablarse de la aplicacion inversa de cualquieraplicacion inyectiva, definiendola como la aplicacion f−1 : f(A) → A tal que f−1(y) = x si ysolo si f(x) = y. Observese que, en cualquier caso, esta serıa la aplicacion inversa de la biyeccionasociada a f , es decir, de la aplicacion biyectiva f : A→ f(A) tal que f(x) = f(x).

Ejemplos.

(i) La funcion raız cuadrada no es la inversa de la aplicacion f : x ∈ R → f(x) = x2 ∈ R,sino de la aplicacion g : x ∈ [0,+∞) → g(x) = x2 ∈ [0,+∞), que tecnicamente es —ojo altrabalenguas— la biyeccion asociada a la restriccion de f a [0,+∞). En la practica no haynecesidad de ser tan riguroso con el lenguaje, siempre y cuando no se genere confusion. De

manera similar, la funcion logaritmo no es la inversa de la aplicacion f : x ∈ R → f(x) =ex ∈ R, sino de la aplicacion g : x ∈ R→ g(x) = ex ∈ (0,+∞).


(ii) Analogamente, la funcion arco seno no es la inversa de la aplicacion f : x ∈ R → f(x) =senx ∈ R, sino de la aplicacion g : x ∈ [−π/2, π/2]→ g(x) = senx ∈ [−1, 1].

Proposicion 1.3.12. Dadas una aplicacion f : A→ B y una aplicacion g, entonces f es biyectivay g es la inversa de f si y solo si se cumplen las siguientes condiciones:

1. dom g = B y codom g = A, es decir, g : B → A;

2. g(f(a)) = a para todo a ∈ A, es decir, g ◦ f = idA;

3. f(g(b)) = b para todo b ∈ B, es decir, f ◦ g = idB.

Demostracion. =⇒Hemos de probar que dadas una aplicacion biyectiva f : A→ B y la aplicacion g = f−1 inversa def , han de cumplirse las condiciones 1, 2, 3.

De acuerdo con la definicion previa, g = f−1 ha de tener dominio B y codominio A, es decir,se cumple la condicion 1.

Para ver que se cumple tambien 2, tomemos un a ∈ A arbitrario: f(a) sera un cierto elementob de B, y g(b) = f−1(b) sera el unico elemento de A cuya imagen por f sea b, es decir, el a departida. Por tanto

g(f(a)) = g(b) = a,

como querıamos probar. En terminos de composiciones, g ◦ f = idA (ambas son aplicaciones de Aen A que transforman cada a ∈ A en el mismo a).

Veamos ahora que es cierto 3. Para b ∈ B arbitrario, g(b) = f−1(b) sera el unico elemento a ∈ Acuya imagen por f sea b, es decir, aquel para el que tengamos f(a) = b. Entonces

f(g(b)) = f(a) = b,

y ası f ◦ g = idB puesto que ambas son aplicaciones de B en B que transforman cada b ∈ B en elpropio b.

⇐=Recıprocamente, supongamos ahora que tenemos aplicaciones f : A → B y g que satisfacen lascondiciones 1,2,3. Veamos que f es biyectiva y que su inversa es g.

f es inyectiva.- Pues sean a1, a2 ∈ A tales que f(a1) = f(a2). Entonces, aplicando 2,

a1 = g(f(a1)) = g(f(a2)) = a2,

y ası efectivamente f es inyectiva.f es suprayectiva.- Pues sea b ∈ B cualquiera. ¿De que elemento de A sera imagen por f?

Obviamente, de a = g(b) ∈ A, ya que por la eleccion de a resulta de 3 que

f(a) = f(g(b)) = b.

g es la inversa de f .- Como acabamos de probar, f es biyectiva, luego tiene aplicacion inversaf−1. ¿Coinciden f−1 y g? Para ello han de tener el mismo dominio, el mismo codominio, y lamisma regla de correspondencia (es decir, tiene que ser f−1(x) = g(x) para cada x del dominio).Por definicion de inversa, f−1 tiene dominio B y codominio A, igual que g segun la condicion 1;y para cada b ∈ B, como f(g(b)) = b (condicion 3), g(b) es el (unico) elemento de A cuya imagenpor f es b, o sea, f−1(b):

g(b) = f−1(b) para cada b ∈ B,

y finalmente g = f−1.

Cualitativamente, este resultado viene a decir que lo que hace una aplicacion (biyectiva) lodeshace su inversa. Ademas, como los papeles de f y g son intercambiables, se sigue que si f esbiyectiva y g es la inversa de f , tambien g es biyectiva y f es la inversa de g.


Ejercicio. Estudiar para que valores de x ∈ R es

(√x)2 = x;

√x2 = x;

sen(arc senx) = x; arc sen(senx) = x.

¿Como encajan los resultados obtenidos con los de la proposicion anterior?Ejercicio. Sea E un espacio vectorial de dimension 2 sobre un cuerpo K, {~i,~j} una base de E, ya cada ~v ∈ E de la forma ~v = x~i + y~j (x, y ∈ K) hagamos corresponder el vector ~w = y~i + x~j.Probar que esta correspondencia es una aplicacion bien definida de E en E, que es biyectiva, yhallar su inversa.

Si E es el plano real e~i, ~j son vectores perpendiculares de modulo 1, ¿cual serıa la interpretaciongeometrica de f?

Concluimos esta seccion probando un resultado que nos sirve de excusa para presentar uno delos axiomas mas controvertidos de la Teorıa de conjuntos, el axioma de eleccion.

Proposicion 1.3.13. Una aplicacion f : A→ B es suprayectiva si y solo si existe una aplicaciong : B → A tal que f ◦ g = idB.

Demostracion. ⇐=Todo b ∈ B es imagen por f de algun elemento a ∈ A: en efecto, bastara tomar a = g(b) paraobtener f(a) = f(g(b)) = idB(b) = b.

=⇒Para todo b ∈ B es f−1({b}) = {a ∈ A : f(a) = b} 6= ∅ por ser f suprayectiva. Dado, pues, b ∈ B,elegimos un a ∈ f−1({b}) que denotamos g(b). Tenemos ası bien definida una aplicacion g : B → A,tal que para cada b ∈ B es f(g(b)) = b por la propia construccion de g, luego f ◦ g = idB para estaaplicacion g.

Nota importante: el Axioma de Eleccion. Esta “inocente” eleccion de un elemento deter-minado en cada conjunto f−1({b}), b ∈ B, comporta mas dificultades de las que parece (cf. [G-H],pp. 96 y ss.). De hecho, en la Teorıa axiomatica de conjuntos se requiere un nuevo axioma parallevar a cabo este proceso, el llamado AXIOMA DE ELECCION (abreviado AC, Axiom of Choiceen ingles), una de cuyas multiples formulaciones es:

Axioma de eleccion . Dada una familia {Ai : i ∈ I} de conjuntos no vacıos disjuntos dos ados, existe un conjunto S que consiste exactamente en un elemento de cada Ai.

Por evidente que parezca este enunciado, se deducen de el (en Algebra, en Analisis, en Topologıa,en . . . ) una serie de consecuencias tan sorprendentes que a su utilizacion por Zermelo en 1904siguio una discusion que no se aplaco hasta los resultados de Godel en 1940 y de Cohen en 1966.Ver una excelente explicacion en [C-H], pp. 241 y ss.; mas conciso, [Ap], pp. 312–313 y [GJPR], pp.66–67.

Buscando en Internet “Axiom of Choice” se obtiene una lista inacabable de referencias. Paraempezar, recomendamos [1], [2].

Ejercicios

3.1. Dados dos conjuntos X e Y , expresar como subconjuntos de X × Y las aplicaciones definidasde la siguiente manera:(1) la aplicacion que hace corresponder a todos los x ∈ X un unico punto b ∈ Y (la aplicacionconstante con valor fijo b).(2) supuesto X = Y , la aplicacion que hace corresponder a cada x ∈ X el mismo x (la aplicacionidentidad).


(3) supuesto X ⊆ Y , la aplicacion que hace corresponder a cada x ∈ X el mismo x (la aplicacioninclusion de X en Y ). ¿Es igual a la anterior?(4) supuesto X = A×B, Y = A la aplicacion que hace corresponder a cada (a, b) ∈ X su primeracomponente a (la proyeccion sobre la primera componente).(5) supuesto X = A×B, Y = B la aplicacion que hace corresponder a cada (a, b) ∈ X su segundacomponente b (la proyeccion sobre la segunda componente).

3.2. Sean A y B conjuntos no vacıos y f : A→ B. Para cada una de las condiciones:(T1) Para todo b ∈ B existe a ∈ A tal que f(a) = b;(T2) existe a ∈ A tal que f(a) = b para todo b ∈ B;(T3) para todo a ∈ A existe b ∈ B tal que f(a) = b;(T4) existe b ∈ B tal que f(a) = b para todo a ∈ A;(T5) para todo b ∈ B existe un unico a ∈ A tal que f(a) = b;(T6) para todo a ∈ A existe un unico b ∈ B tal que f(a) = b;(T7) para todos a1, a2 ∈ A es f(a1) 6= f(a2);(T8) para todos a1, a2 ∈ A, si f(a1) = f(a2) entonces a1 = a2;(T9) para todos a1, a2 ∈ A, si f(a1) 6= f(a2) entonces a1 6= a2,explicar cuales de las hipotesis siguientes las implican:(H1) f es inyectiva;(H2) f es suprayectiva;(H3) f es biyectiva;(H4) f es constante;(H5) f es arbitraria;(H8) ninguna f lo cumple;(H7) el conjunto B de llegada verifica . . . (completar).

(Por ejemplo: (H2) =⇒ (T1) porque, segun la definicion, f es suprayectiva cuando etc.)

3.3. Sean f : A1 → B1, g : A2 → B2. Definamos h : A1 ×A2 → B1 ×B2 poniendoh(x, y) = (f(x), g(y)) para cada (x, y) ∈ A1×A2. Probar que h esta bien definida. ¿Que condicionessobre f y g permiten asegurar que h es inyectiva? ¿y que es suprayectiva? ¿y que es biyectiva?

3.4. Sean A ⊆ X y f : X → Y . Sea i : A → X la inclusion de A en X, definida por i(x) = xpara cada x ∈ A. Probar que

(i) f |A = f ◦ i;

(ii) si g = f |A, para cada B ⊆ Y es g−1(B) = A ∩ f−1(B).

3.5. Dada f : A→ B, probar:(1) para cada S ⊆ A, S ⊆ f−1[f(S)]. ¿Que condicion sobre f garantizarıa que f−1[f(S)] = S?.Dar un contraejemplo que pruebe que esta igualdad no es cierta en general.(2) para cada S ⊆ A y T ⊆ B, f [f−1(T )∩ S] = T ∩ f(S); en particular, f [f−1(T )] = T ∩ f(A).

3.6. Sea f : x ∈ R → f(x) =x√

1 + x2. Calcular f ◦ f . En general, si se define por recurrencia

f1 = f y fn+1 = f ◦ fn, n ∈ N, calcular fn.

3.7. Para conjuntos A, B, C, D y aplicaciones f : A → B, g : B → C, h : C → D, probar queh ◦ (g ◦ f) = (h ◦ g) ◦ f .

3.8. Sean f : A → B, g : B → C biyectivas. Probar que g ◦ f : A → C es biyectiva y que(g ◦ f)−1 = f−1 ◦ g−1.

3.9. Sean f : A→ B y g : B → A tales que g ◦ f = idA. Probar que entonces f es inyectiva y g essuprayectiva.


1.4. Relaciones

Para las correspondencias entre un conjunto A y el mismo suele emplearse el nombre de re-laciones. Una vez mas, el cambio de nombre refleja un cambio (mas psicologico que matematico)en la manera de ‘percibir’ estas particulares correspondencias. Nos detendremos especialmente endos clases de relaciones: las relaciones de equivalencia, cuyo modelo de referencia es la relacion deigualdad entre los elementos de un conjunto, y las relaciones de orden, de las que ya es conocida almenos la relacion ≤ entre numeros reales. Pasemos a la definicion formal.

Definicion 1.4.1. Una relacion binaria en un conjunto A es un subconjunto R del productocartesiano A×A de A por sı mismo.

En vez de (a, b) ∈ R , escribiremos aR b, leıdo 〈〈a esta relacionado con b en la relacion R 〉〉.

Ejemplos.(1) Sea R el conjunto de las rectas del plano. Se define en R la relacion de incidencia poniendo:

para dos rectas r, s ∈ R, es rR s cuando y solo cuando r y s tienen algun punto comun.(Esta relacion se expresa brevemente diciendo 〈〈r corta a s〉〉)

(2) En el mismo conjunto, se define la relacion de paralelismo ‖ poniendo:para dos rectas r, s ∈ R, es r‖s cuando y solo cuando r y s son paralelas,

es decir, o no tienen ningun punto comun o coinciden.

(3) Sea C el conjunto de las circunferencias del plano. Se define en C la relacion de tangenciaponiendo:

para dos circunferencias C1, C2 ∈ C, es C1RC2 cuando y solo cuando C1 y C2 son tangentes.

(4) En N, se define la relacion de divisibilidad | poniendo:para m, n ∈ N, es m |n cuando y solo cuando m divide a n (i.e., n es un multiplo de m).

(5) Analogamente se define la relacion de divisibilidad en Z.

(6) Dado un conjunto X, se define en ℘(X) la relacion de inclusion ⊆ poniendo:para A, B ∈ ℘(X), es A ⊆ B cuando y solo cuando A es un subconjunto de B.

Las propiedades mas interesantes de las relaciones se recogen en la siguiente definicion.

Definicion 1.4.2. Sea R una relacion (binaria) en un conjunto A. Diremos que R es

• reflexiva si para todo a ∈ A es aR a;

• simetrica si siempre que para a, b ∈ A es aR b, tambien es bR a;

• antisimetrica si para a, b ∈ A, que sea simultaneamente aR b y bR a obliga a que a = b;

• transitiva si siempre que para a, b, c ∈ A es aR b y bR c, tambien es aR c.

Ejercicio. ¿Cuales de estas propiedades, y cuales no, tienen las relaciones que hemos definidoanteriormente?

1.4.1. Relaciones de equivalencia y particiones. Conjunto cociente.

Definicion 1.4.3. Una relacion de equivalencia en un conjunto A es una relacion (binaria)en A que tiene las propiedades reflexiva, simetrica y transitiva.

Ejemplos.1.- El prototipo es la relacion de igualdad en cualquier conjunto: aR b cuando a = b.2.- La relacion de paralelismo entre rectas es la unica relacion de equivalencia de las seis quehabıamos definido en el apartado anterior.

1.4. RELACIONES 33

3.- Dados dos vectores fijos del plano−−−→MN ,

−−→PQ , pongamos

−−−→MN ∼

−−→PQ si y solo si

−−−→MN y

−−→PQ

tienen el mismo modulo, direccion y sentido (se dice entonces que son vectores equipolentes). Larelacion de equipolencia ∼ es una relacion de equivalencia.4.- La relacion entre fracciones equivalentes, como puede hacer sospechar su propio nombre, es unarelacion de equivalencia. (Recordemos que dos fracciones m/n y p/q son equivalentes si mq = np.Comentaremos esta relacion mas adelante, cuando hablemos de los numeros racionales.)5.- Un importante ejemplo de relacion de equivalencia, que estudiaremos con mas detalle posterior-mente, es la congruencia en Z modulo m: fijado m ∈ N con m ≥ 2, diremos que dos enteros a, b ∈ Zson congruentes modulo m, en sımbolos a ≡ b (mod m), cuando m | (b − a) es decir, cuandoexista un k ∈ Z tal que b− a = km. Puesto que a− a = 0 ·m, b− a = km implica a− b = (−k)m,y de b− a = km, c− b = `m se sigue c− a = (c− b) + (b− a) = (`+ k)m, vemos que esta relaciontiene efectivamente las propiedades reflexiva, simetrica y transitiva.

Las congruencias son 〈〈 las matematicas del tiempo〉〉: la esfera del reloj marca las horas modulo12, los dıas de la semana van segun congruencias modulo 7, los meses modulo 12 (el decimotercermes vuelve a ser enero); pero tambien conocemos ejemplos de otro tipo: los cuentakilometros delos coches funcionan segun congruencias modulo 100 000.

Como se indica en [D-H], “el interes de las relaciones de equivalencia esta en el hecho de que cons-tituyen una abstraccion de los procesos ordinarios de clasificacion”: permiten repartir el conjuntoen ‘bloques’ disjuntos, las llamadas clases de equivalencia. A su vez, cada uno de esos ‘bloques’puede considerarse como elemento de un nuevo conjunto, el conjunto cociente, ‘igualando’ (nodistinguiendo entre) los diferentes componentes de un mismo bloque. Pasemos a explicar estosaspectos.

Definicion 1.4.4. Sea R una relacion de equivalencia en un conjunto A. Dado a ∈ A, la clasede equivalencia de a en la relacion R es el conjunto

[a] = {b ∈ A : aR b}.

Cada b ∈ [a] se dice que es un representante de la clase [a].El conjunto cuyos elementos son las clases de equivalencia de R es el conjunto cociente de

A por R , denotado por A/R , con lo cual

A/R = {[a] : a ∈ A},

y ası A/R ⊆ ℘(A).

Notemos que siempre a ∈ [a], por la propiedad reflexiva de R .Ejemplos. Examinemos cuales son las clases de equivalencia en las relaciones que hemos vistoanteriormente.1.- Si aR b cuando y solo cuando a = b, [a] consta del unico elemento a, es decir, [a] = {a} eneste caso. El conjunto cociente es el conjunto de los subconjuntos unipuntuales de A (que no es lomismo que A, aunque casi lo parezca).2.- En la relacion de paralelismo, cada clase de equivalencia consta de una recta y todas sus paralelas(es lo que se llama un haz de rectas paralelas), todas las que tienen ‘la misma direccion’. Hay, pues,tantas clases de equivalencia como ‘direcciones’.3.- Cada clase de vectores equipolentes es lo que se denomina un vector libre .4.- Las clases de equivalencia de fracciones las forman las fracciones ‘que representan un mismonumero racional’. De hecho, un numero racional es una clase de equivalencia de fracciones y elconjunto Q de los numeros racionales es el conjunto cociente del conjunto de fracciones por estarelacion de equivalencia. (Ver capıtulo 3.)5.- En la relacion de congruencia modulo m, para cada a ∈ Z es

[a] = a+mZ = {b ∈ Z : b = a+ km para algun k ∈ Z}.


Estas clases de equivalencia suelen denominarse clases de restos modulo m, porque dos enteros ay b estan en la misma clase si y solo si dan el mismo resto al ser divididos por m, es decir, si y solosi a = pm + r, b = qm + r para enteros adecuados p, q y r, con 0 ≤ r < m (comprobarlo). Param = 2, encontramos dos clases de equivalencia: el conjunto de los enteros pares y el conjunto delos enteros impares.

En general, el conjunto cociente, que se denota por Zm, ¿cuantos elementos tiene? Tantos comorestos encontramos al dividir por m: 0, 1, . . . m− 1; es decir, m elementos.6.- Un ejemplo mas cotidiano: consideremos un conjunto de folios de papel de distintos colores(perfectamente diferenciables), y digamos que dos folios son equivalentes si son de igual color.Formar una clase de equivalencia es formar un conjunto (un ‘cuaderno’) con las hojas de un mismocolor. El conjunto cociente sera un conjunto de cuadernos, cada uno de los cuales tiene sus hojasde un determinado color, diferente del color de las hojas de los demas cuadernos.

Una relacion de equivalencia permite ‘partir en trozos’ el conjunto, tomando cada clase deequivalencia como uno de los trozos. Concretamente, se tiene:

Proposicion 1.4.5. Sea R una relacion de equivalencia en un conjunto no vacıo A. Entoncescada elemento de A esta en una y solo una de las clases de equivalencia definidas por R .

Para probarlo, nos apoyaremos en el siguiente

Lema 1.4.6. Sea R una relacion de equivalencia en un conjunto no vacıo A. Dados b, c ∈ A es[b] = [c] si y solo si bR c.

Demostracion. Suponiendo [b] = [c], como c ∈ [c] = [b], se sigue que bR c.Recıprocamente, sea bR c. Si x ∈ [b], serıa bRx, que con cR b (propiedad simetrica de R )

darıa cRx por transitividad, o sea, x ∈ [c]; y analogamente, de x ∈ [c] obtenemos cRx, que conbR c da bRx y finalmente x ∈ [b].

Ahora podemos demostrar la proposicion anterior.

Demostracion de la proposicion 1.4.5.Obviamente, cada elemento de A esta al menos en una clase de equivalencia: a ∈ [a] para cadaa ∈ A por ser R reflexiva. Y no puede estar en mas de una: si a ∈ [b] y a ∈ [c], esto significarıa quebR a y cR a (por definicion), luego aR c (propiedad simetrica de R ) y finalmente bR c (propiedadtransitiva), con lo que aplicando el lema [b] = [c].

La ‘descomposicion en bloques’ de un conjunto se denomina particion del conjunto.

Definicion 1.4.7. Una particion de un conjunto no vacıo A es una coleccion C de subconjuntosno vacıos de A tal que cada x ∈ A pertenece a uno y uno solo de los S ∈ C. En otras palabras, Cverifica que:

1. C ⊆ ℘(A) \ {∅},⋃S∈C S = A,

2. si S, T ∈ C y S 6= T , S ∩ T = ∅.

Puesto que cada clase de equivalencia [a] contiene al menos al elemento a, la proposicion 1.4.5nos dice que el conjunto cociente A/R (el conjunto de clases de equivalencia) es una particion deA. Que definir una relacion de equivalencia o definir una particion es ‘practicamente lo mismo’ seprueba en el siguiente teorema.

Teorema 1.4.8. Sea R una relacion de equivalencia en un conjunto no vacıo A. Entonces, elconjunto de las clases de equivalencia es una particion de A.

Recıprocamente, si C es una particion de A, existe una relacion de equivalencia R (y una sola)tal que las clases de eqivalencia de R son exactamente los conjuntos de la particion C.

1.4. RELACIONES 35

Demostracion. Solo falta probar el recıproco.Supongamos, pues, que tenemos una particion C de A. ‘Arrancando’ de C, hemos de llegar a

construir una relacion de equivalencia R sobre A cuyas clases de equivalencia sean precisamentelos conjuntos S ⊆ A que forman la particion C. Revisando el lema 1.4.6, no es difıcil pensar en larelacion siguiente:

• pondremos aR b para dos elementos a, b ∈ A, si y solo si existe un S ∈ C tal que a ∈ S y b ∈ S.

¿Tenemos ası ciertamente una relacion de equivalencia? Dado a ∈ A, como C es una particion,existe S ∈ C tal que a ∈ S, luego aR a cualquiera que sea a y ası R es reflexiva. De la propiadefinicion se sigue que es simetrica. Para ver que es transitiva, observemos que si aR b existe unS ∈ C tal que a ∈ S y b ∈ S, y si bR c existe un T ∈ C tal que b ∈ T y c ∈ T ; pero entoncesb ∈ S ∩ T , lo que por ser C una particion obliga a que S = T , deduciendose que a, c ∈ S = T yaR c.

¿Son las clases de equivalencia de R exactamente los S ∈ C? Es decir: ¿cada clase de equiva-lencia de R esta en C? ¿y cada S ∈ C es una clase de equivalencia de R ?

Notemos que dados a ∈ A, S ∈ C, se tiene

a ∈ S si y solo si [a] = S.

En efecto, trivialmente a ∈ [a] siempre, luego si [a] = S, a ∈ [a] = S Recıprocamente, si a ∈ S,todo b ∈ S cumple aR b y por tanto b ∈ [a]; y al reves, si b ∈ [a], segun la definicion de R existeun T ∈ C tal que a, b ∈ T ; pero entonces a ∈ S ∩ T , luego S = T y b ∈ S.

En consecuencia:

Dado a ∈ A, es [a] ∈ C, pues como C es una particion de A, debe existir S ∈ C tal que a ∈ S,y ası [a] = S.

Dado S ∈ C, S = [a] para algun a ∈ A, pues S es no vacıo y habra al menos un a ∈ S, con locual S = [a] para este a.

Finalmente, si queremos comprobar que la relacion R que hemos construido es la unica quetiene estas clases de equivalencia, basta aplicar el lema 1.4.6.

Ejemplos.

1. Sea A el conjunto de los numeros enteros pares y B el conjunto de los numeros enterosimpares. Entonces {A,B} es una particion de Z, y la relacion de equivalencia que define esla congruencia modulo 2.

2. Poniendo A = {x ∈ R : x > 0}, B = {0}, C = {x ∈ R : x < 0}, {A,B,C} es una particion deR. Si R es la relacion de equivalencia que define, es xR y si y solo si x = y = 0 o x 6= 0 6= yy x e y tienen el mismo signo.

Ejercicio. Compruebese, para cada una de las relaciones de equivalencia que hemos encontrado,que las clases forman una particion del correspondiente conjunto.

1.4.2. Relaciones de orden.

Definicion 1.4.9. Una relacion de orden en un conjunto A es una relacion (binaria) en A quetiene las propiedades reflexiva, antisimetrica y transitiva.

Ejemplos.1.- El prototipo es la relacion de orden en cualquier subconjunto de R: aR b cuando a ≤ b.


2.- En todo conjunto se puede definir una relacion de orden trivial: la igualdad, aR b si y solo sia = b.3.- Dado un conjunto X, la inclusion entre subconjuntos de X es una relacion de orden en ℘(X).4.- La relacion de divisibilidad en N es una relacion de orden, pero no lo es la divisibilidad en Z(falla ‘por poco’ la propiedad antisimetrica).5.- En C puede definirse el orden lexicografico de la siguiente manera:para z1, z2 ∈ C, es z1 ≤ z2 cuando y solo cuando <e z1 < <e z2, o <e z1 = <e z2 y =m z1 ≤ =m z2.

Es facil comprobar que tiene las propiedades reflexiva, antisimetrica y transitiva. ¿Cual es larepresentacion grafica del conjunto {z ∈ C : 0 ≤ z}?6.- Ası mismo, en C puede definirse el orden producto de la siguiente manera:

para z1, z2 ∈ C, es z1 ≤ z2 cuando y solo cuando <e z1 ≤ <e z2 y =m z1 ≤ =m z2.Tambien tiene las propiedades reflexiva, antisimetrica y transitiva. ¿Cual es ahora la represen-

tacion grafica del conjunto {z ∈ C : 0 ≤ z}?

Definicion 1.4.10. Un conjunto ordenado es un conjunto A dotado de una relacion de orden.

De una manera mas formal, un conjunto ordenado serıa un par (A, R ), donde A es un conjunto yR una relacion de orden en A. Por ejemplo, (N,≤) y (N, | ) son dos conjuntos ordenados (distintos,aunque tengan el mismo conjunto base).

Definicion 1.4.11. Una relacion de orden R en un conjunto A es un orden total si para todopar a, b de elementos de A se tiene que o bien aR b o bien bR a; en caso contrario, R es unorden parcial .

Ejercicio. Dar ejempos de ordenes totales y de ordenes parciales.

Diagramas de Hasse. Las relaciones de orden R en conjuntos finitos pequenos F se puedenvisualizar comodamente mediante diagramas de Hasse , que consisten en un dibujo en el que loselementos del conjunto estan representados por puntos, colocados de manera que si x, y ∈ F sontales que xR y, el punto que representa a x queda por debajo del punto que representa a y; ademas,dos puntos del diagrama se unen mediante un segmento cuando y solo cuando representan a elemen-tos x, y ∈ F tales que xR y pero no existe z ∈ F tal que xR z, zR y (es decir, cuando la relacionentre x e y no puede deducirse por transitividad). Por ejemplo, si F = {2, 3, 4, 5, 6, 7, 8, 15, 30}, larelacion de divisibilidad | en F podrıa reflejarse ası:

2s@

@@

@@

��

��

�

3s@

@@

��

5s@

@@

@@

7s

4s 6 s 15s8s 30s

Ejercicio. ¿Como se verıa en un diagrama de Hasse que la relacion representada es un orden total?

Elementos distinguidos en una relacion de orden

Algunos conceptos que el lector conoce para el orden de R pueden definirse igualmente en unconjunto ordenado arbitrario.

Definiciones 1.4.12. Sea A un conjunto ordenado, y denotemos por ≤ su relacion de orden. SeaS un subconjunto de A.

Si para algun a ∈ A es a ≤ s para todo s ∈ S, diremos que a es una cota inferior de S y queS esta acotado inferiormente (por a).

Si para algun b ∈ A fuese b ≥ s para todo s ∈ S, diremos que b es una cota superior de S yque S esta acotado superiormente (por b).

1.4. RELACIONES 37

Cuando S esta acotado a la vez superior e inferiormente, se dice que S esta acotado.Un m ∈ A es mınimo de un conjunto S si pertenece al conjunto y es una cota inferior del

mismo. Es decir, si m ∈ S y m ≤ s para todo s ∈ S. Pondremos entonces m = mınS.Un M ∈ A es maximo de un conjunto S si pertenece al conjunto y es una cota superior del

mismo. Es decir, si M ∈ S y M ≥ s para todo s ∈ S. Pondremos entonces M = maxS.Un elemento a ∈ A es ınfimo de un conjunto S si es el maximo del conjunto de cotas inferiores

de S. Pondremos entonces a = inf S.Notese que si a = inf S, sera a = mınS si y solo si a ∈ S.Un elemento b ∈ A es supremo de un conjunto S si es el mınimo del conjunto de cotas

superiores de S. Pondremos entonces b = supSNotese que si b = supS, sera b = maxS si y solo si a ∈ S.

Otros conceptos importantes en las relaciones de orden son los siguientes.

Definicion 1.4.13. Dado un conjunto ordenado (A,≤) y un subconjunto S de A, un elementox ∈ S se dice maximal si para cada a ∈ S tal que x ≤ a, debe ser x = a; un elemento y ∈ S sedice minimal si para cada b ∈ S tal que b ≤ y, debe ser b = y.

En un conjunto ordenado puede no haber elementos maximales o minimales, igual que nosiempre hay maximos o mınimos (Ver [D-H], p. 13; [GJPR], p. 29). En el diagrama de Hasse quehemos dibujado anteriormente, son elementos minimales el 2, el 3, el 5 y el 7; son elementosmaximales el 7, el 8 y el 30; no hay un elemento maximo ni un elemento mınimo, ni tampocosupremo ni ınfimo.

Ejercicios

4.1. Dados dos conjuntos A y B, probar que A×B = ∅ si y solo si A = ∅ o B = ∅.4.2. Sean A y B dos conjuntos. Si A × B 6= ∅, probar que A × B ⊆ C ×D cuando y solo cuandoA ⊆ C y B ⊆ D. ¿Por que hemos necesitado suponer A×B 6= ∅?4.3. Sea R una relacion en un conjunto A. ¿Es cierto que para todo a ∈ A hay al menos un b ∈ Btal que aR b? ¿Por que?

4.4. Para cada punto P del plano, el haz de rectas de vertice P es el conjunto de las rectasque pasan por P . ¿Pueden ser los haces de rectas las clases de equivalencia de alguna relacion deequivalencia? ¿Por que?

4.5. Sea R la relacion definida en N× N de la siguiente manera:dados dos pares (m,n), (p, q) ∈ N× N, es (m,n)R (p, q) cuando y solo cuando m+ q = p+ n.

Estudiar si R es reflexiva, simetrica, antisimetrica, transitiva. ¿Es R una relacion de equivalen-cia? En caso afirmativo, ¿cuales son las correspondientes clases de equivalencia? Representarlasgraficamente en el plano.

4.6. Sea R una relacion en un conjunto A y S un subconjunto de A. Consideremos en S la relacionR ′ definida por: aR ′b para a, b ∈ S si y solo si aR b (la restriccion de R a S). Probar que siR es un relacion de equivalencia en A, R ′ es una relacion de equivalencia en S; y que si R es unarelacion de orden en A, R ′ es una relacion de orden en S.

4.7. Sea A un conjunto cualquiera y R una relacion de orden en A. Definimos la relacion inversaR−1 poniendo

para x, y ∈ A, es x R−1 y cuando y solo cuando y R x.Probar que R−1 es tambien una relacion de orden en A (el llamado orden inverso de R).Si R es un orden total, ¿es R−1 un orden total? ¿por que?

4.8. Sea A un conjunto ordenado y S un subconjunto de A. Probar que si existe el maximo o elmınimo de S, es unico.


4.9. ¿Que puede decirse sobre la unicidad de los elementos maximales o minimales en una relacionde orden segun sea o no un orden total?

4.10. Sea S = {z = x+iy ∈ C : x, y ∈ R, x2+y2 ≤ 1} el cırculo de centro 0 y radio 1. Considerandoen C el orden producto definido anteriormente, ¿tiene S elemento maximo? ¿y elemento mınimo?¿y elementos maximales? ¿y elementos minimales? ¿cuales son? ¿por que?

Responder las preguntas anteriores considerando en C el orden lexicografico.

1.5. Conjuntos finitos y numerables

1.5.1. Conjuntos finitos y numerables. Conjuntos equipotentes.

¿Cuantas letras minusculas tiene el alfabeto griego? Veinticuatro. ¿Como lo sabemos? Las po-nemos en una lista

α, β, γ, δ, ε, ζ, η, θ, ι, κ, λ, µ, ν, ξ, o, π, %, σ, τ , υ, ϕ, χ, ψ, ω,y, simplemente, contamos:

uno, dos, tres, cuatro, cinco, . . . , veinticuatro.¿Que estamos haciendo desde el punto de vista matematico? Emparejamos cada una de las

letras con los numeros naturales correlativos,

α β γ δ ε ζ η θ ι κ λ µ ν ξ o π % σ τ υ ϕ χ ψ ω

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24

“una letra ↔ un numero”, consecutivamente, teniendo buen cuidado de no repetir letras ni sal-tar numeros, hasta agotar todas las letras disponibles. En definitiva, estamos estableciendo unaaplicacion biyectiva entre el conjunto “alfabeto griego” y el conjunto de “los veinticuatro primerosnumeros naturales”, o viceversa (si nos fijamos en la aplicacion inversa). Generalizando esta idea,definiremos los conjuntos finitos y el numero de elementos de un conjunto finito.Notacion. Para n ∈ N, pongamos N(n) = {k ∈ N : k ≤ n}.

Definicion 1.5.1. Diremos que un conjunto A es finito si es vacıo o existe un n ∈ N tal que hayuna biyeccion f : N(n)→ A.

Que es el numero de elementos de un conjunto ası es ‘casi’ obvio. Solo casi, porque nuestraexperiencia contando conjuntos muy grandes nos dice que no siempre se llega a la misma respuesta(si vuestros amigos contaran los asistentes al ultimo concierto de vuestro grupo favorito, ¿obtendrıantodos el mismo numero?) El lema siguiente garantizara que si al contar el numero de elementos deun mismo conjunto se obtienen valores diferentes, es que hay un error.

Lema 1.5.2. Sean m, n ∈ N. Si existe una biyeccion f : N(m)→ N(n), entonces m = n.

Demostracion. Procederemos por induccion sobre el enunciadoPn: Para todo m ∈ N, si existe una biyeccion f : N(m)→ N(n), entonces m = n.

P1 es cierto: si f : N(m) → N(1) = {1} es una biyeccion, sera f(x) = 1 para un unicox ∈ N(m); y si m 6= 1, N(m) tiene al menos un elemento y 6= x, para el que forzosamente f(y) = 1,contradiciendo la inyectividad de f . Por tanto, m = 1.

Supuesto cierto Pn, tambien es cierto Pn+1. Pues si para un m ∈ N existe una biyeccionf : N(m)→ N(n+1), entoncesm 6= 1 (en caso contrario, f(N(m)) = f(N(1)) = {f(1)}, y en N(n+1)habrıa elementos distintos de f(1) que no estarıan en la imagen de f), y ademas f(x) = n+1 paraun unico x ∈ N(m). La aplicacion f ′ : N(m) \ {x} → N(n) dada por f ′(k) = f(k), k ∈ N(m) \ {x},esta bien definida y es biyectiva (¿por que?). Definiendo ahora h : N(m− 1)→ N(m) \ {x} por

h(k) =

{k si k < x,

k + 1 si x < k ≤ m− 1,

1.5. CONJUNTOS FINITOS Y NUMERABLES 39

tambien h esta bien definida y es biyectiva (¿por que?), de modo que

g = f ′ ◦ h : N(m− 1)→ N(n),

composicion de dos aplicaciones biyectivas, es biyectiva (¿por que?). Por la hipotesis de induccion,esto obliga a que m− 1 = n, y ası m = n+ 1.

Definicion 1.5.3. Dado un conjunto finito A, el numero de elementos de A es 0, si A = ∅, oel unico numero natural n para el que existe una biyeccion f : N(n)→ A. Suele indicarse por |A|o por #A o por cardA.

La unicidad de n es consecuencia del lema anterior: si A es finito y no vacıo y existen biyeccionesf : N(n)→ A, g : N(m)→ A, entonces f−1 ◦ g : N(m)→ N(n) es una biyeccion y por tanto m = n.

Ejercicio. Probar que si A ⊆ B y B es un conjunto finito, entonces A tambien es un conjuntofinito y |A| ≤ |B|, siendo |A| = |B| si y solo si A = B.

Pasemos a los conjuntos infinitos. Igual que hay conjuntos finitos con distinto cardinal (condistinto numero de elementos), se puede establecer una nocion de cardinal para conjuntos infinitosque permite “comparar el tamano” de los conjuntos infinitos. La teorıa de cardinales sobrepasa lospropositos de este curso y, afortunadamente, esta expuesta excelentemente en [GJPR], cap. 2, a unnivel asequible. Pero al menos, definiremos aquı los cardinales infinitos mas sencillos.

Definicion 1.5.4. Diremos que un conjunto A es numerable o que tiene cardinal ℵ0 si existeuna biyeccion f : N→ A.

Diremos que A es contable si es finito o numerable.

Ejemplos. (Cf. [GJPR], pp. 57 y ss.)— El conjunto A = {2n : n ∈ N} de los numeros naturales pares es numerable.— El conjunto A = {n2 : n ∈ N} de los cuadrados de los numeros naturales es numerable (paradojade Galileo).— Los conjuntos finitos no son numerables.— El conjunto Z de los numeros enteros es numerable.— El conjunto Q de los numeros racionales ¡es numerable! (enumeracion diagonal de Cantor ; v.[4]).— El conjunto R de los numeros reales no es numerable. (Lo probaremos mas adelante).

Definicion 1.5.5. Dados dos conjuntos A y B, si existe una biyeccion f : A→ B diremos que Ay B son equipotentes (escrito A ∼ B) o que tienen el mismo cardinal (escrito |A| = |B| o#A = #B o cardA = cardB).

Como entonces f−1 : B → A es tambien una biyeccion, B ∼ A siempre que A ∼ B. Ası mismo,hay reflexividad y transitividad (la identidad es una biyeccion, y la composicion de dos biyeccioneses una biyeccion).3

Los conjuntos numerables (de cardinal ℵ0) son los equipotentes a N. Los conjuntos equipotentesa R se dice que tienen el cardinal del continuo c.

Ejemplos. Los siguientes conjuntos tienen el cardinal del continuo (v. [GJPR], pp. 60 y ss.):— cualquier subintervalo de R con mas de un punto;— el conjunto C de los numeros complejos;— cualquier espacio vectorial de dimension finita sobre R.

3 Pero ∼ no es una relacion de equivalencia en ‘el conjunto de todos los conjuntos’, que no existe. Si nos limitamosa los subconjuntos de un conjunto universal U , ∼ es una relacion de equivalencia en ℘(U).


1.5.2. APENDICE: Un mınimo de combinatoria.

En una descripcion burda, la combinatoria se ocupa de contar de distintas maneras el numerode elementos de los conjuntos finitos. Es una parte muy importante de las Matematicas, y susaplicaciones no cesan de aumentar. Aquı enunciaremos algunos de sus resultados mas elementales, lamayorıa sin demostracion. Para completar las demostraciones y ver mas aplicaciones y comentarios,recomendamos [D’A-W], [Lieb], y el capıtulo sobre combinatoria de [1, pp. 94 y ss.].

Comenzaremos con dos de los temas mas ‘clasicos’ de la Combinatoria.

Permutaciones

¿De cuantas maneras diferentes se pueden poner cuatro neumaticos a un coche? Hay cuatro posicio-nes posibles: 1) delantera izquierda, 2) delantera derecha, 3) trasera izquierda, 4) trasera derecha.Inicialmente, en la posicion 1) podemos colocar uno cualquiera de los neumaticos, que distingui-remos con las letras a, b, c, d: hay cuatro posibilidades diferentes. Elegida una de las cuatro, enla posicion 2) podemos colocar uno cualquiera de los tres neumaticos restantes: eso da 4 · 3 = 12posibilidades. A partir de cada una de ellas, la eleccion de uno de los dos neumaticos restantes paraocupar la posicion 3) nos lleva a 12 · 2 = 24 posibilidades, y para la posicion 4) ya solo dispone-mos de un neumatico, ası que hay finalmente 4 · 3 · 2 · 1 = 4! = 24 maneras distintas de colocarlos neumaticos. Cada una de ellas se obtiene de las demas ‘intercambiando’ o ‘permutando’ losneumaticos de lugar.

1) a b c d2) b c d a c d a b d a b c3) c d b d b c c d a d a c b d a d a b b c a c a b4) d c d b c b d c d a c a d b d a b a c b c a b a

En los textos antiguos, las permutaciones de elementos de un conjunto se definıan como ‘lasdiversas ordenaciones que podemos formar con los elementos del conjunto, sin repetirlos ni olvidarninguno, de manera que dos cualesquiera contienen los mismos objetos y difieren solamente en elorden de colocacion de estos’ (cf., por ejemplo, [Rey-P-T]). Por tanto, el paso de una permutaciona otra puede identificarse con una biyeccion del conjunto en sı mismo, que es la definicion actual.

Definicion 1.5.6. Una permutacion de un conjunto A es una biyeccion de A en sı mismo.

Generalizando el razonamiento del ejemplo inicial, se obtiene:

Proposicion 1.5.7. El numero de permutaciones de un conjunto A con n elementos es n!.

Combinaciones

En el texto citado anteriormente, [Rey-P-T], p. 157, se lee: 〈〈combinaciones de orden n de m objetos:a1, a2, . . . , am, (o combinaciones n-arias), son los grupos de n objetos que se pueden formar con ellos,de modo que dos cualesquiera difieran en algun objeto. Ası como las variaciones son sucesiones quese diferencian entre sı por la naturaleza de sus objetos, o por su colocacion, aquı esta es indiferente,y solo aquella importa.〉〉

Si pensamos esta definicion en terminos de conjuntos, vemos que se esta hablando simplementede los distintos subconjuntos de n elementos que tiene un conjunto con m elementos. El numero deellos se cuenta mediante los numeros combinatorios, que pasamos a definir. (Usaremos el conveniode que 0! = 1.)


Definicion 1.5.8. Dados dos enteros no negativos n y k, con n ≥ k, el numero combinatorio(n

k

), leıdo n sobre k, es el numero

(n

k

)=

n!k!(n− k)!

.

Pongamos ahora Cnk para denotar el numero de subconjuntos con k elementos de un conjuntocon n elementos (el numero de combinaciones de n elementos tomados de k en k). Como A ⊆ Bimplica que |A| ≤ |B| (¿por que?), esto supone que si k > n, Cnk = 0. Si k = n, obviamente Cnk = 1,ası como Cn0 = 1. En los restantes casos,

Proposicion 1.5.9. Dados dos enteros no negativos n y k con n ≥ k,

Cnk =n!

k!(n− k)!=(n

k

),

donde Cnk denota el numero de combinaciones de n elementos tomados de k en k.

Demostracion. Consideremos un conjunto A que conste de n elementos. Contaremos todas laspermutaciones de A en las siguientes etapas.(1) Elegimos un subconjunto {a1, a2, . . . , ak} de A de k elementos: esto puede hacerse de Cnk manerasdistintas.(2) Permutamos los elementos de cada uno de los subconjuntos anteriores de todas las manerasposibles: esto puede hacerse de k! formas distintas para cada uno de los subconjuntos seleccionados.(3) A cada uno de los resultados anteriores, anadimos los n − k elementos que quedan de A,ak+1, ak+2, . . . , an, en cada una de las (n− k)! formas posibles.

Obtenemos ası todas y cada una de las n! permutaciones de los elementos de A, sin repetirninguna. Por tanto n! = Cnk · k! · (n− k)!, de donde

Cnk =n!

k!(n− k)!=(n

k

).

Hay muchısimas relaciones entre los numeros combinatorios, que expondremos segun las vaya-mos necesitando. Por ejemplo, es obvio que(

n

n− k

)=

n!(n− k)!(n− (n− k))!

=n!

k!(n− k)!=(n

k

),

que responde a la idea de que con cada subconjunto B de A de k elementos tenemos emparejadoel subconjunto A \B de n− k elementos (y viceversa), con lo cual tantos hay de un tipo como delotro.

Otra expresion util es la siguiente:(n

k

)=n(n− 1) · · · (n− k + 1)

k!,

que se obtiene dividiendo por (n− k)! el numerador y el denominador en la formula inicial. Ası esobvio que (

n+ 1k

)=

n+ 1(n+ 1)− k

(n

k

)o que

(n+ 1k + 1

)=n+ 1k

(n

k

).

Los numeros combinatorios se llaman tambien coeficientes binomicos, debido al siguiente resul-tado.


Proposicion 1.5.10 (Formula del binomio de Newton). Dados n ∈ N y x, y ∈ R,

(x+ y)n =n∑k=0

(n

k

)xkyn−k.

Demostracion. Por definicion, (x + y)n es el producto de n factores iguales a (x + y). Al desarro-llar el producto, obtenemos solamente terminos (repetidos) de la forma xkyn−k, provenientes demultiplicar sumandos x tomados (¡una sola vez!) en k factores (0 ≤ k ≤ n) y sumandos y tomadosen los n− k restantes; por consiguiente, obtendremos

(nk

)sumandos iguales a xkyn−k, y quedara la

formula del enunciado.

(Posteriormente damos una demostracion por induccion.)

Para obtener los coeficientes del binomio (los numeros combinatorios) se puede emplear elllamado triangulo de Pascal o de Tartaglia, v. [6]:

11 1

1 2 11 3 3 1

1 4 6 4 11 5 10 10 5 1

1 6 15 20 15 6 11 7 21 35 35 21 7 1

1 8 28 56 70 56 28 8 1

etc. Detras de este procedimiento de construccion esta la igualdad(n

k

)+(

n

k + 1

)=

n!k!(n− k)!

+n!

(k + 1)!(n− k − 1)!=

n!k!(n− k − 1)!

(1

n− k+

1k + 1

)=

n!k!(n− k − 1)!

· k + 1 + n− k(n− k)(k + 1)

=n!(n+ 1)

k!(k + 1) · (n− k − 1)!(n− k)

=(n+ 1)!

(k + 1)!(n− k)!=(n+ 1k + 1

),

que permite pasar de una fila a la siguiente obteniendo cada elemento como suma de los dos quetiene encima.

Esta identidad justamente es la que se necesita para dar una demostracion alternativa de laformula del binomio mediante induccion.

En efecto: dados n ∈ N y x, y ∈ R, sea Pn el enunciado

(x+ y)n =n∑k=0

(n

k

)xkyn−k.

Para n = 1, P1 afirma que (x + y)1 =∑1

k=0

(1k

)xk y1−k = 1 · x0 y1 + 1 · x1 y0, es decir, que

x+ y = y + x, lo cual es obviamente cierto.

http://redescolar.ilce.edu.mx/redescolar/act_permanentes/mate/ma2_01.htm


Dado un numero natural n arbitrario, supongamos que Pn es cierta. Entonces

(x+ y)n+1 = (x+ y)n (x+ y) = (n∑k=0

(n

k

)xk yn−k) (x+ y)

=(yn +

(n

1

)x yn−1 + · · ·+

(n

k

)xk yn−k + · · ·+

(n

n− 1

)xn−1 y + xn

)(x+ y)

=(x yn +

(n

1

)x2 yn−1 + · · ·+

(n

k

)xk+1 yn−k + · · ·+

(n

n− 1

)xn y + xn+1

)+(yn+1 +

(n

1

)x yn + · · ·+

(n

k

)xk yn−k+1 + · · ·+

(n

n− 1

)xn−1 y2 + xn y

)= yn+1 +

[(n

0

)+(n

1

)]x yn + · · ·+

[(n

k − 1

)+(n

k

)]xk yn−k+1 + · · ·

+[(

n

n− 1

)+(n

n

)]xn y + xn+1

= yn+1 +(n+ 1

1

)x yn + · · ·+

(n+ 1k

)xk yn−k+1 + · · ·+

(n+ 1n

)xn y + xn+1

=n+1∑k=0

(n+ 1k

)xk yn−k+1

que es lo que afirma Pn+1.

Principios generales

Como muestran los apartados anteriores, para contar los elementos de ciertos conjuntos finitossuele interesar, en general, organizarlos de manera que se pueda disenar una estrategia simple quefacilite el recuento. En el nivel mas sencillo de aplicacion de esta idea hay algunos principios basicosque recogemos a continuacion; para mas detalles, nos remitimos a las referencias ya citadas ([1],[D’A-W], [Lieb]).

Para empezar, veamos como se cuenta el numero de elementos de un conjunto ‘por trozos’.

Lema 1.5.11. Sean A y B dos conjuntos finitos. Entonces

|A ∪B| = |A|+ |B| − |A ∩B|.

En particular, si A y B son disjuntos,

|A ∪B| = |A|+ |B|.

Proposicion 1.5.12 (Principio de adicion). Sean A1, . . . , An conjuntos finitos disjuntos dosa dos, es decir,

Ai ∩Aj = ∅ si i 6= j, 1 ≤ i, j ≤ n.

Entonces

|A1 ∪A2 ∪ · · · ∪An| = |A1|+ |A2|+ · · ·+ |An|.


Proposicion 1.5.13 (Principio de inclusion y exclusion). Sean A1, . . . , An conjuntos finitos.Si

α1 = |A1|+ |A2|+ · · ·+ |An|α2 = |A1 ∩A2|+ |A1 ∩A3|+ · · ·+ |An−1 ∩An|,α3 = |A1 ∩A2 ∩A3|+ |A1 ∩A2 ∩A4|+ · · ·+ |An−2 ∩An−1 ∩An|,

...αn = |A1 ∩A2 ∩ · · · ∩An|

entonces|A1 ∪A2 ∪ · · · ∪An| = α1 − α2 + · · ·+ (−1)n+1αn.

Los ejercicios siguientes ilustran como el manejo del lenguaje de la teorıa de conjuntos esutilısimo en el analisis de situaciones que a primera vista no se relacionarıan con dicha teorıa.

Ejercicios

5.1. ¿Puede creerse a un investigador que informa que, de cada 1000 habitantes, a 816 les gusta elazucar; a 723, el helado; a 645, los pasteles; y asimismo que a 562 les gusta el azucar y el helado; a463, el azucar y los pasteles, y a 470, los pasteles y el helado, y solo a 310 les gustan las tres cosas?

5.2. Tres monedas, una de cobre, otra de nıquel y otra de plata, son lanzadas simultaneamenteal aire, y esto 100 veces. La de cobre muestra cara en 70 ocasiones, la de nıquel muestra cara en50 pruebas y la de plata muestra cara en 56 pruebas. La de cobre y la de nıquel han mostradosimultaneamente cara 31 veces y la de nıquel y de plata han presentado tal circunstancaia 28 veces.Probar que las tres monedas han mostrado cara simultaneamente por lo menos 9 veces y que lastres han mostrado simultaneamente cruz a lo mas 11 veces.

5.3. En una encarnizada batalla, por lo menos el 70 por ciento de los combatientes pierde un ojo;al menos un 75 por ciento, una oreja; al menos un 80 por ciento, un brazo, y al menos un 85 porciento, una pierna. ¿Cuantos por lo menos han perdido las cuatro cosas? (Lewis Carroll.)

5.4. (Frases matematicas celebres) Las matematicas se componen de un 50 % de formulas, de un50 % de demostraciones y de un 50 % de imaginacion.

Proposicion 1.5.14 (Principio de las cajas o principio del palomar). Si queremos repartirn objetos en m cajas con rm < n, al menos una caja ha de recibir mas de r objetos.

La demostracion (muy facil) junto con ejemplos y ejercicios de aplicacion del mismo puede verseen [D’A-W], cap. 10, pp. 158–162 y 167–169.

En el calculo del numero de permutaciones de n elementos hemos usado implıcitamente unprocedimiento que [Lieb, p. 116] expone ası:

Proposicion 1.5.15 (Principio de multiplicacion). Sea P un proceso que consta de n etapas, ysupongamos que para cada r, la etapa resima puede llevarse a cabo de ar maneras distintas. EntoncesP puede llevarse a cabo de a1 a2 · · · an maneras distintas.

Ejemplo. Un sistema de seguridad usa palabras clave que constan de dos letras seguidas por dosdıgitos (decimales). ¿Cuantas palabras clave distintas pueden formarse?

Respuesta. 27 × 27 × 10 × 10, incluyendo la n y excluyendo la ch y la ll, que constan de doscaracteres. (Cf. [Lieb, p. 115].)


Usando este principio, o directamente por induccion, se comprueba:

Proposicion 1.5.16 (Cardinal de un producto). Sean A y B dos conjuntos finitos, y A × Bsu producto cartesiano. Entonces

|A×B| = |A| · |B|.

Contar en tablas. Para contar los elementos de un conjunto es a veces conveniente expresar elconjunto como subconjunto de un producto cartesiano, representandolo en una tabla. Ası, el numerototal de elementos del conjunto puede obtenerse sumando el numero de elementos del conjunto quehay en cada una de las filas, o bien sumando el numero de elementos del conjunto que hay en cadauna de las columnas.4 Con una idea tan simple pueden contestarse preguntas como la siguiente:Ejemplo. De los alumnos de una clase 32 son varones y cada uno de ellos conoce exactamente a5 companeras. Si cada alumna conoce exactamente a 8 companeros, ¿cuantas alumnas hay en laclase?Respuesta. 32× 5 = n× 8 =⇒ n = 20. (V. [1, pp. 96–97])

Hay multitud de problemas curiosos que se resuelven usando los metodos ‘combinatorios’ ex-puestos en este apartado. Como pasatiempo de vacaciones, recomendamos especialmente los de[D’A-W] (repartidos por todo el libro) y [Lieb], cap. 15.

4 Este resultado, cuya demostracion rigurosa es mas complicada de formular de lo que en principio cabrıa suponer,puede verse como ‘un anticipo en version finita’ del teorema de Fubini, un resultado muy importante sobre integracionque se estudiara en cursos superiores de Analisis matematico.

Bibliografıa

[Ap] Apery, R. & al.: Pensar la matematica. Tusquets, Barcelona, 1984.

[C-H] Cohen, P. J.; Hersh, R.: Teorıa de conjuntos no cantoriana. En [Kl], pp. 238–247.


[D-H] Dorronsoro, J.; Hernandez, E.: Numeros, grupos y anillos. Addison-Wesley/UAM,Madrid, 1996.

[GJPR] Goberna, M. A.; Jornet, V.; Puente, R.; Rodrıguez, M.: Algebra y fundamentos.Una introduccion. Ariel, Barcelona, 2000.

[G-H] Griffits, H. B.; Hilton, P. J.: Classical Mathematics. Van Nostrand Reinhold, London,1970.

[Ham] Hamilton, A. G.: Numbers, sets and axioms: the apparatus of mathematics. CambridgeUniv. Press, 1982.

[Kl] Kline, M. (ed.): Matematicas en el mundo moderno. Blume, Madrid, 1974.

[Lieb] Liebeck, M.: A Concise Introduction to Pure Mathematics. Chapman & Hall/CRC,Boca Raton, 2000.

[Lip] Lipschutz, S.: Teorıa de Conjuntos y temas afines. (Col. Schaum) McGraw-Hill, Mexi-co, 1969.

[O.U.] Open University: Introduccion al calculo y al algebra (vol. 3: Algebra). Reverte, Bar-celona, 1977.

[Rey-P-T] Rey Pastor, J.; Pi Calleja, P.; Trejo. C. A.: Analisis matematico vol. I. Kapelusz,Buenos Aires, (7a. ed.), 1963.

[S-T] Stewart, I.; Tall, D.: The Foundations of Mathematics. Oxford Univ. Press, 1977.


[1] Eric Schechter, a home page for the Axiom of Choice.

http://math.vanderbilt.edu/~schectex/ccc/choice.html

[2] Nancy McGough, Relevance of the Axiom of Choice (FAQ).


[3] F. J. Cobos: Curso de Introduccion a la Matematica Discreta. Universidad de Sevilla,2002-2003..

http://ma1.eii.us.es/Docencia/apuntes/ap imd.PDF

47

http://math.vanderbilt.edu/~schectex/ccc/choice.html


http://ma1.eii.us.es/Docencia/apuntes/ap_imd.PDF

48 BIBLIOGRAFIA

[4] Numerabilidad de Q, Math Forum Famous Problems.

http://mathforum.org/isaac/problems/cantor2.html

[5] Proceso diagonal de Cantor, desde un punto de vista computacional:

http://delta.cs.cinvestav.mx/~gmorales/complex/node7.html

[6] El triangulo de Pascal y alguna curiosidad adicional.

http://mathworld.wolfram.com/PascalsTriangle.html

http://mathforum.org/isaac/problems/cantor2.html

http://delta.cs.cinvestav.mx/~gmorales/complex/node7.html

http://mathworld.wolfram.com/PascalsTriangle.html

Capıtulo 2

Numeros naturales y enteros.

En el desarrollo del tema de los numeros enteros seguiremos basicamente el texto [D-H]. Sobrenumeros naturales, si es necesario puede ser util como libro de consulta [S-T].

Los restantes libros de la bibliografıa sirven de complemento en algunos puntos concretos quesenalaremos en su momento.

2.1. Numeros naturales.

Ya tuvimos una primera toma de contacto con el conjunto de los numeros naturales y una desus propiedades esenciales, el principio de induccion. Ahora que nos hemos familiarizado con losconceptos basicos de la teorıa de conjuntos, serıa el momento oportuno de entrar en una funda-mentacion axiomatica rigurosa de los numeros naturales basada, como es habitual, en los axiomasde Peano, que (creemos) todo aspirante a matematico debe conocer. Sin embargo, la extensiondel programa nos impide disponer del tiempo necesario para llevar a cabo este proposito; comosolucion intermedia, recogeremos aquı como lectura complementaria de lo visto en clase dichosaxiomas, junto con algunas definiciones y propiedades de los numeros naturales (enunciadas sindemostraciones), destacando las que nos seran necesarias posteriormente para el estudio de losnumeros enteros.

2.1.1. Lectura preliminar

¿Que ocurrirıa si al ir profundizando en nuestros conocimientos matematicos observasemosincongruencias en algunos de los conceptos que tenıamos por ‘intuitivamente claros’ o de los resul-tados que tenıamos por ‘evidentemente ciertos’? ¿No comenzarıamos a dudar de todo y a intentar“reconstruir el edificio de nuestros conocimientos”, cimentandolo sobre una base lo mas explıcita ymas solida posible?

Esto les sucedio a los matematicos del siglo XIX. Imaginemos la situacion: desconfianza en“todo lo previamente sabido”, hay que replantearlo empezando de cero. Ası comenzo un analisisradical de los fundamentos de las matematicas y la entronizacion del metodo axiomatico.

Adoptemos, pues, la misma postura radical que nuestros predecesores decimononicos: olvidemos(o hagamos como que nos olvidamos de) nuestras intuiciones geometricas, nuestros conocimientosde los numeros enteros, racionales, etc., y concentremosnos en los numeros naturales. Cuestionemosincluso los mismos numeros naturales. ¿Como reconstruir ahora toda la aritmetica, la ‘ciencia delos numeros naturales’, con la mayor economıa de medios, partiendo de unos supuestos mınimos?

〈〈Dedekind, y Peano siguiendole, diseccionaron el concepto de la progresion de los numerosnaturales y formularon una fundamentacion axiomatica de la aritmetica, conocida ahora, impro-piamente, como los axiomas de Peano.〉〉 ([3]; ver tambien [2] y las referencias allı citadas.)

La idea esencial es esta: para ‘ir fabricando’ los numeros naturales, solo necesitamos disponerdel primero, el 1 en nuestro convenio, y de una manera de pasar al siguiente, de este al siguiente,

49

http://www.unizar.es/analisis_matematico/numyconj/axiomatica.html

50 CAPITULO 2. NUMEROS NATURALES Y ENTEROS

de este al siguiente, etc. Ahora que disponemos del lenguaje de la teorıa de conjuntos, usemoslopara expresar este proceso.

Olvidando la suma (ya la reconstruiremos despues), pongamos sgt (n) en vez de n + 1 para el‘siguiente’ a n. ‘Pasar de un numero natural al siguiente’ es asociar a cada n su siguiente sgt (n),lo que en el lenguaje conjuntista no es mas que definir una aplicacion sgt : n ∈ N → sgt (n) ∈ N.Obviamente, esta aplicacion es inyectiva: si m 6= n, sgt (m) 6= sgt (n). Que 1 es ‘el primer numeronatural’ es decir que no sigue a ninguno, 1 6= sgt (n) cualquiera que sea n ∈ N; o, en otros terminos,1 no esta en el conjunto imagen de la aplicacion sgt , 1 ∈ N \ sgt (N). Tambien sabemos que elprincipio de induccion tiene un enunciado ‘conjuntista’ en terminos de esta aplicacion:

dado S ⊆ N tal que 1 ∈ S y sgt (n) ∈ N siempre que n ∈ N, necesariamente S = N,y gracias a el podemos cerrar el proceso, como descubrieran R. Dedekind [Ddk] y G. Peano[Peano] entre otros.

2.1.2. Los axiomas de Peano

Los conceptos primitivos y las ‘propiedades fundamentales’ (axiomas) que permiten describiraxiomaticamente los numeros naturales estan recogidos en el enunciado que sigue:

Existen un conjunto N, cuyos elementos se denominan numeros naturales, que contieneun elemento distinguido 1, y una aplicacion sgt : N→ N tal que

(S1) sgt es inyectiva,

(S2) 1 /∈ sgt (N),

(S3) dado S ⊆ N con 1 ∈ S y sgt (S) ⊆ S, necesariamente S = N.

Es un hecho notable, y un tanto sorprendente, que todas las propiedades usuales de los numerosnaturales pueden deducirse de estas, como puso de manifiesto el matematico italiano G. Peano ensu obra [Peano]. Aunque Dedekind habıa planteado con anterioridad un sistema similar (si bien mascomplicado, ver [Ddk]), hoy se llaman en su honor axiomas de Peano para los numeros naturales.En una formulacion mas ‘clasica’, mas proxima a la original de Peano,1 suelen enunciarse ası:

Existe un conjunto N, cuyos elementos se denominan numeros naturales, tal queP1. Para todo numero natural n existe otro numero natural, sgt (n), que llamaremos siguiente o

sucesor de n.P2. Existe un numero natural, que denotamos por 1, tal que sgt (n) 6= 1 cualquiera que sea el

numero natural n.P3. Para numeros naturales cualesquiera m y n, es sgt (m) = sgt (n) si y solo si m = n.P4. (Axioma de induccion matematica). Un conjunto de numeros naturales que contenga a

1 y que con cada n contenga a sgt (n), debe incluir a todos los numeros naturales. Es decir,dado S ⊆ N tal que 1 ∈ S y sgt (n) ∈ S siempre que n ∈ S, es S = N.

Que 1 es el unico elemento de N que no esta en el conjunto imagen de la aplicacion sgt puededemostrarse por induccion; ası, el conjunto imagen de dicha aplicacion es exactamente N \ {1} (V.[S-T], p. 147).

Como es presumible, el ‘siguiente’ de un n ∈ N sera n+ 1 . . . ¡pero solo cuando sepamos lo quesignifica ese signo 〈〈+〉〉, que habremos de definir a partir de los axiomas anteriores!

Pasemos a ver como se construyen por recurrencia las operaciones de suma y producto.

1En alguna version posterior, como la publicada en 1895 que reproducimos en [2], Peano parte de 0 como primernumero natural. Ası se hace tambien en las referencias [S-T], [Ham].

2.1. NUMEROS NATURALES. 51

Proposicion 2.1.1 (Suma en N). Dado un numero natural m, definimos:

(i) m+ 1 = sgt (m)

(ii) para cada n ∈ N, m+ sgt (n) = sgt (m+ n).

Entonces, dados dos numeros naturales cualesquiera m y n, m + n es un numero natural per-fectamente definido.

Demostracion. Dado m, consideremos

S = {k ∈ N : ∃|x ∈ N tal que m+ k = x}.

Evidentemente, 1 ∈ S. Y si k ∈ S, tambien sgt (k) ∈ S. Por el principio de induccion, S = N.En particular, n ∈ S, como querıamos demostrar.

¡Hemos dado una definicion recurrente de la suma! Tambien el producto puede definirse porrecurrencia, apoyandonos en la suma que acabamos de construir:

Proposicion 2.1.2 (Producto en N). Dado un numero natural m, definimos:

(i) m · 1 = m

(ii) para cada n ∈ N, m · sgt (n) = m · n+m.

Entonces, dados dos numeros naturales cualesquiera m y n, m · n es un numero natural perfec-tamente definido (que se denotara simplemente por mn en vez de m ·n si no ha lugar a confusion).

Ya vimos que, en la practica, el principio de induccion suele aplicarse en terminos de “propieda-des” mas que en terminos de conjuntos. Justificada ya la notacion n+ 1 para sgt (n), recuperamoslos enunciados tradicionales que utilizamos a principio de curso.

Empleando adecuadamente el principio de induccion se comprueba que las operaciones de sumay producto de numeros naturales, es decir, las aplicaciones del producto cartesiano N × N en Ndadas por

+ : (m,n) ∈ N× N→ m+ n ∈ N, · : (m,n) ∈ N× N→ mn ∈ N.

tienen las propiedades fundamentales que a continuacion transcribimos.

Propiedades de la suma y el producto en N. Dados numeros naturales cualesquiera m, n,p, se cumplen

N1. Propiedad asociativa de la suma. (m+ n) + p = m+ (n+ p).N2. Propiedad conmutativa de la suma. m+ n = n+m.

N3. Propiedad cancelativa de la suma. m+ n = m+ p implica n = p.

N4. Propiedad asociativa del producto. (mn) p = m (n p).N5. Propiedad conmutativa del producto. mn = nm.

N6. Existencia de elemento neutro (identidad) para el producto. Hay un numero natural,que denotamos por 1, tal que 1 · n = n · 1 = n.

N7. Propiedad cancelativa del producto. mn = mp implica n = p.

N8. Propiedad distributiva del producto respecto de la suma. m (n+ p) = mn+mp.


2.1.3. El principio de buena ordenacion.

Para “comparar el tamano” de dos numeros naturales cualesquiera se define en N una ordenacionpartiendo de la suma.

Definicion 2.1.3. Dados dos numeros naturales cualesquiera m, n, escribiremos m ≤ n y diremosque m es menor o igual que n (o lo que es lo mismo, que n es mayor o igual que m, lo que seescribe n ≥ m), cuando m = n o n = m+ p para algun numero natural p.

Pondremos m < n (o n > m) para expresar que m es estrictamente menor que n (o sea,que m es menor y distinto que n).

Como propiedades fundamentales de esta relacion tenemos:

Propiedades del orden en N. Dados numeros naturales cualesquiera m, n, p, se cumplenN9. Propiedad reflexiva. m ≤ m.N10. Propiedad antisimetrica. si m ≤ n y n ≤ m, entonces m = n.N11. Propiedad transitiva. si m ≤ n y n ≤ p, entonces m ≤ p.

N12. Propiedad de orden total. siempre es m ≤ n o n ≤ m.

La propiedad 12 significa, segun la definicion, que dados dos numeros naturales cualesquiera m,n, o bien es m = n, o n = m + p para algun numero natural p, o m = n + p para algun numeronatural p.

Recordemos que no todas las relaciones de orden son totales, en el sentido que indica la citadapropiedad: no lo era, por ejemplo, la relacion de inclusion entre conjuntos. Pero la propiedad mascaracterıstica de la relacion de orden en N, que la distingue de manera especial, es la de ser unabuena ordenacion, lo que significa exactamente lo siguiente:

Proposicion 2.1.4. Principio de buena ordenacion. Todo conjunto no vacıo de numerosnaturales posee un elemento mınimo, es decir, dado S ⊆ N no vacıo, existe un elemento m en Stal que m ≤ n para todo n ∈ S.

Tambien son interesantes las siguientes propiedades de la ordenacion de numeros naturales.Pueden probarse por induccion, y/o como consecuencia de las que le preceden.

Otras propiedades

(1) Todos los numeros naturales son mayores o iguales que 1. Es decir, mın N = 1.(Aplıquese el principio de induccion a la proposicion Pn : n ≥ 1.)

(2) Dados m, n ∈ N, se tiene m > n si y solo si existe p ∈ N tal que m = n+p, lo que abreviaremosponiendo 〈〈 m− n ∈ N 〉〉.

(En este caso, todo es evidente salvo que m = n + p para algun p ∈ N implica m 6= n; paraprobarlo, vease primero por induccion sobre m que m 6= m+1 cualquiera que sea m ∈ N, y despuesque para todo m ∈ N, m 6= m+ p por induccion sobre p.)(3) Dados m, n ∈ N, no puede verificarse n < m < n+1. En palabras, entre dos numeros naturalesconsecutivos no hay ningun numero natural.

(Puesto que si m ∈ N serıa m− n ∈ N por (2) y m− n < 1, contradiciendo (1).)

2.2. Numeros enteros.

2.2.1. Necesidad de los enteros. Propiedades de Z. Idea de anillo.

La “resta” m − n de numeros naturales no siempre es posible, segun se desprende de las pro-piedades que hemos visto anteriormente. Dicho de otra forma, la ecuacion

x+ a = b,

2.2. NUMEROS ENTEROS. 53

a, b ∈ N, no siempre tiene solucion x ∈ N. Lo que hacemos entonces es “inventarnos” las solucionesy anadirlas como numeros: ası definimos 〈〈el cero 0〉〉 como un nuevo numero, solucion de x+ a = a,y los 〈〈enteros negativos −n〉〉 (numeros falsos, los llamaba Descartes) como solucion de x + a = bcuando a = b+ n. Nos encontramos ası con los conocidos

. . . ,−3,−2,−1, 0, 1, 2, 3, . . . ,

cuya representacion grafica como puntos de una recta nos es tambien familiar.

Aunque puede darse una construccion ‘algebraico-conjuntista’ de los numeros enteros (ver[GJPR], pp. 91 y ss.), nosotros nos contentaremos de momento con esta idea ‘ingenua’ adoptando(al menos por ahora) la siguiente descripcion.

Definicion 2.2.1 (Descripcion de los numeros enteros). Diremos que un x es un numeroentero si x ∈ N o si x = 0 o si x = −n con n ∈ N.

El conjunto formado por todos los numeros enteros se denota por Z.

Si ponemos N0 = N ∪ {0}, −N = {x = −n : n ∈ N}, se tiene Z = N ∪ {0} ∪ (−N) = N0 ∪ (−N).Nos referiremos a N0 como al conjunto de los enteros no negativos y a −N como al conjunto de losenteros negativos, siendo el conjunto N de los numeros naturales el de los enteros positivos.

El lector recordara que la suma y el producto de numeros naturales se amplıa a una suma yproducto de numeros enteros,

+ : (m,n) ∈ Z× Z→ m+ n ∈ Z, · : (m,n) ∈ Z× Z→ mn ∈ Z,

con las propiedades fundamentales que a continuacion enunciamos.

Propiedades de la suma y el producto en Z. Dados numeros enteros cualesquiera m, n, p,se cumplenZ1. Propiedad asociativa de la suma. (m+ n) + p = m+ (n+ p).Z2. Propiedad conmutativa de la suma. m+ n = n+m.Z3. Existencia de elemento neutro (cero) para la suma. Hay un numero entero, que

denotamos por 0, tal que 0 + n = n+ 0 = n.Z4. Existencia de elemento opuesto para la suma. Hay un numero entero (y uno solo), que

denotamos por −n, tal que (−n) + n = n+ (−n) = 0.

Las propiedades Z1 a Z4 pueden resumirse diciendo que Z es un grupo conmutativo para lasuma. La propiedad cancelativa de la suma en Z va incluida en Z4 (¿por que?)

Z5. Propiedad asociativa del producto. (mn) p = m (n p).Z6. Propiedad conmutativa del producto. mn = nm.Z7. Existencia de elemento neutro (identidad) para el producto. Hay un numero entero,

que denotamos por 1, tal que 1 · n = n · 1 = n.

Z8. Propiedad distributiva del producto respecto de la suma. m (n+ p) = mn+mp.

Las propiedades Z1 a Z8 pueden resumirse diciendo que Z, para la suma y el producto, es unanillo conmutativo con unidad. Otros ejemplos de anillos: matrices n×n, funciones reales sobre unmismo dominio, polinomios, . . .

Z9. Propiedad cancelativa del producto. mn = mp implica n = p.

Los sistemas algebraicos que tienen las propiedades Z1 a Z9 se llaman dominios de integridad.NO son dominios de integridad los anillos de matrices n× n para n ≥ 2, de funciones reales sobreun dominio con mas de un punto (¿por que?).

La relacion de orden en N puede extenderse a Z.


Definicion 2.2.2. Dados dos numeros enteros cualesquiera m, n, escribiremos m ≤ n y diremosque m es menor o igual que n (o lo que es lo mismo, que n es mayor o igual que m, lo quese escribe n ≥ m), cuando m = n o n = m + p para algun numero natural p; equivalentemente,cuando exista p ∈ N0 tal que n = m+ p.

Pondremos m < n (o n > m) para expresar que m es estrictamente menor que n (o sea,que m es menor y distinto que n).

Con esta notacion,

N = {n ∈ Z : n > 0}, N0 = {n ∈ Z : n ≥ 0}, −N = {n ∈ Z : n < 0}.

Como propiedades fundamentales de la relacion de orden en Z tenemos:

Propiedades del orden en Z. Dados numeros naturales cualesquiera m, n, p, se cumplenZ10. Propiedad reflexiva. m ≤ m.Z11. Propiedad antisimetrica. Si m ≤ n y n ≤ m, entonces m = n.Z12. Propiedad transitiva. Si m ≤ n y n ≤ p, entonces m ≤ p.

Z13. Propiedad de orden total. Siempre es m ≤ n o n ≤ m.

Notese que no va a ser valido un principio de buena ordenacion igual que para los numerosnaturales: por ejemplo, el propio conjunto Z no tiene elemento mınimo, pues para cada n ∈ Z esn− 1 < n. Sin embargo, vamos a tener una propiedad analoga para cierta clase de subconjuntos:

Z14. Principio de buena ordenacion de los conjuntos minorados (principio del mınimo).Todo conjunto no vacıo de numeros enteros acotado inferiormente posee un elemento mınimo,es decir, dado S ⊆ Z no vacıo tal que para algun k ∈ Z es k ≤ n para todo n ∈ S, existe unelemento m en S tal que m ≤ n para todo n ∈ S.

Simetricamente:Z15. Principio del maximo. Todo conjunto no vacıo de numeros enteros acotado superiormente

posee un elemento maximo, es decir, dado S ⊆ Z no vacıo tal que para algun k ∈ Z es k ≥ npara todo n ∈ S, existe un elemento M en S tal que M ≥ n para todo n ∈ S.

Por ejemplo, max(−N) = −1.

En Z puede hablarse del “siguiente” a un numero entero, en el sentido de que entre n y n+1 nohay ningun otro numero entero (¿por que?). No se cumple, sin embargo, el principio de induccion,sino una propiedad similar aunque mas debil:

Z16. Un conjunto de numeros enteros que contenga un numero k y que con cada n contenga an + 1, debe contener a todos los numeros enteros mayores o iguales que k. Es decir, dadoS ⊆ Z tal que k ∈ S y n+ 1 ∈ S siempre que n ∈ S, se tiene S ⊇ {n ∈ Z : n ≥ k}.

(Puede precisarse un poco mas: dados S ⊆ Z y k ∈ Z, se tiene S = {n ∈ Z : n ≥ k} si y solo sik − 1 /∈ S, k ∈ S y n+ 1 ∈ S siempre que n ∈ S.)

Esta 〈〈 induccion que comienza en un entero arbitrario〉〉 justifica usar definiciones recurrentesque tengan base igualmente en un entero arbitrario, y no necesariamente en 1.

Otras propiedades y conceptos en torno a la ordenacion de Z son similares a las que el lectorestara manejando en R. Por ejemplo,

Z17. Relacion con la suma. a ≤ b =⇒ a+ c ≤ b+ c.Z18. Relacion con el producto. Si c ≥ 0, a ≤ b =⇒ a c ≤ b c. Si c < 0, a ≤ b =⇒ a c ≥ b c.

El valor absoluto de un numero entero a es el numero entero no negativo

|a| =

{a, si a ≥ 0;−a, si a ≤ 0.


Con esta definicion, si a, b, denotan numeros enteros cualesquiera, se verifican, entre otras, lassiguientes relaciones:

|1| = 1; | − 1| = 1.

| − a| = |a|.

−|a| ≤ a ≤ |a|.

|a b| = |a| |b|.

Ejercicios

6.1. En las propiedades basicas de Z hemos senalado que todo n ∈ Z tiene un opuesto −n tal quen+ (−n) = (−n) + n = 0. ¿Puede haber algun otro m ∈ Z tal que n+m = m+ n = 0? ¿Por que?

Sugerencia: ¿quien serıa m+ n+ (−n)?

6.2. Por definicion, −1 es el opuesto de 1. Probar que la igualdad (−1)(−1) = 1 es una consecuenciade la propiedad distributiva.

6.3. Dado un entero cualquiera n, probar que (−1) · n es el opuesto de n.

6.4. Dado un entero arbitrario a, definimos

a0 = 1 ; an+1 = an · a.

Probar que an esta bien definido para todo n ∈ N0.

2.2.2. Division entera.

Una herramienta importante en el estudio de Z es la ‘division con resto’.

Proposicion 2.2.3 (Existencia de la division entera). Dados a, b ∈ Z, con b 6= 0, existen dosnumeros enteros c y r tales que

a = cb+ r, 0 ≤ r < |b|.

Los enteros c y r, denominados respectivamente cociente y resto de la division entera de a porb, son unicos. Ademas, si a y b son numeros naturales, c tiene que ser un numero positivo o nulo.

Demostracion. Veamos primero el caso b > 0. Entonces b ∈ N, y b ≥ 1.Sea

F = {z ∈ Z : zb ≤ a}.

Este es un conjunto no vacıo, pues si a ≥ 0 contiene a 0 y si a < 0 contiene a a, porque de b ≥ 1,multiplicando por a (que es negativo) se sigue ab ≤ a. Ademas, esta acotado superiormente por |a|,puesto que si z ∈ F y z ≥ 0, de 1 ≤ b se pasa a z ≤ zb = a, y si z < 0 trivialmente z < 0 ≤ |a|.

Aplicando el principio del maximo, existe c = maxF . Ası c ∈ F y c+1 /∈ F (ver la construcciongrafica en la nota posterior); por tanto

cb ≤ a, (c+ 1)b > a, o sea cb+ b > a.

Tomando r = a− cb, se deduce de estas desigualdades que 0 ≤ r < b = |b| y a = cb+ r.Para demostrar la unicidad del cociente y del resto, supongamos que hemos encontrado enteros

c1, c2, r1, r2 tales que

c1b+ r1 = a = c2b+ r2, 0 ≤ r1 < |b| = b, 0 ≤ r2 < |b| = b.


De las dos igualdades se sigue quer2 − r1 = (c1 − c2)b.

Pero tambien resulta −b < −r1 ≤ r2 − r1 ≤ r2 < b, y ası −b < r2 − r1 = (c1 − c2)b < b, lo cualsolo es posible si c1 − c2 = 0 (¿por que?) En definitiva, c1 = c2 y en consecuencia r1 = r2, comoquerıamos probar.

El caso b < 0 se reduce al anterior sin mas que observar que a = cb+r si y solo si a = (−c)(−b)+r.

Nota. Las figuras que siguen ilustran graficamente la situacion. Para a ≥ 0, se ve que, simplemente,‘estamos midiendo a con b como unidad de medida’, trasladando un segmento de longitud b haciala derecha el numero maximo de veces que podamos, sin llegar a sobrepasar a (por la derecha);para a < 0, trasladarıamos la unidad de medida hacia la izquierda, justo hasta igualar o sobrepasara (por la izquierda).

Ejemplo. La division entera de 1 por 2 da cociente 0 y resto 1; la de −1 por 2 da cociente −1 yresto 1; la de 1 por −2, cociente 0 y resto 1, y la de −1 por −2, cociente 1 y resto 1.

La division entera en maple y Mathematica

Los programas de calculo simbolico, como maple y Mathematica , permiten obtener sin difi-cultad el cociente y el resto de una division entera cuando el dividendo y el divisor no son negativos.En caso contrario, las cosas se complican.• maple :— El cociente entero de un entero no negativo m por un entero no nulo n se obtiene escribiendo

iquo(m,n);(‘integer quotient’ de m y n);— El resto de la division entera de un entero no negativo m por un entero no nulo n se obtieneescribiendo

irem(m,n);(‘integer remainder’ de m y n);— si m es un entero negativo, iquo(m,n) e irem(m,n) dan los enteros q y r tales que m = n · q+ r,|r| < |n| y r ≤ 0. ¿Como podremos entonces conseguir el cociente y el resto que hemos definidonosotros? Pienselo el lector.


• Mathematica :— El cociente entero de un entero cualquiera m por un entero positivo n se obtiene escribiendo

Quotient[m,n]— El resto de la division entera de un entero cualquiera m por un entero positivo n se obtieneescribiendo

Mod[m,n]— si n es un entero negativo, Quotient[m,n] y Mod[m,n] dan los enteros q y r tales quem = n·q+r,|r| < |n| y r ≤ 0.

En el ejemplo anteriormente comentado, resultarıa:

maple Mathematica

m n cociente resto iquo(m,n) irem(m,n) Quotient[m,n] Mod[m,n]

1 2 0 1 0 1 0 1−1 2 −1 1 0 −1 −1 11 −2 0 1 0 1 −1 −1−1 −2 1 1 0 −1 0 −1

Ejercicios

7.1. Sea a un entero cualquiera y sean b y m enteros positivos. Si q es el cociente y r es el resto dela division entera de a por b, probar que q es el cociente y mr es el resto de la division entera dema por mb.

7.2. Sean a, b, c enteros con b > 0, c > 0. Si q es el cociente de la division entera de a por b y q′ esel cociente de la division entera de q por c, probar que q′ es el cociente de la division entera de apor bc.

7.3. Demostrar, utilizando el algoritmo de la division, que si un numero entero es a la vez uncuadrado y un cubo, entonces se puede escribir en la forma 7k o 7k + 1.

2.2.3. Representacion decimal y binaria. Bases de numeracion

Cuando escribimos 〈〈 el numero 1984 〉〉 , estamos usando una notacion abreviada para el numero4+8 ·10+9 ·102 +1 ·103. Con el convenio subyacente, nos bastan las diez cifras o dıgitos decimales〈〈 0, 1, 2, 3, 4, 5, 6,7, 8, 9 〉〉 para representar cualquier numero entero no negativo (para representarun numero entero negativo arbitrario, anadimos un signo 〈〈 − 〉〉 a la izquierda de la representacionde su valor absoluto). Pero, ¿por que utilizar esta representacion precisamente? El propio nombredıgito sugiere la respuesta clasica: porque contamos con los dedos, y eso hace aparecer el 10 comoun numero base razonable. Sin embargo, nada impide intentar una representacion binaria en lugarde la decimal, es decir, que usemos los dıgitos binarios 〈〈 0, 1 〉〉 para reescribir

1984 = c0 + c1 · 2 + c2 · 22 + · · ·+ cn · 2n,

con ck = 0 o 1. Observando que

N = c0 + c1 · 2 + c2 · 22 + · · ·+ cn · 2n = c0 + (c1 + c2 · 2 + · · ·+ cn · 2n−1) · 2= c0 + (c1 + (c2 + · · ·+ cn · 2n−2) · 2) · 2 = · · · = c0 + (c1 + (c2 + (· · ·+ (cn · 2) · · · 2) · 2) · 2,

se vislumbra un procedimiento para ir obteniendo los ck: c0 es el resto de la division de N por 2; siN1 es el cociente, c1 es el resto de la division de N1 por 2; si N2 es el cociente resultante, c2 es elresto de la division de N2 por 2; si . . . etc., hasta cn−1, mientras que cn es el ultimo cociente. Portanto, dividiendo por 2 sucesivamente,


1984 992 496 248 124 62 31 15 7 3 1restos 0 0 0 0 0 0 1 1 1 1

lo que deja

1984 = 0 + 0 · 2 + 0 · 22 + 0 · 23 + 0 · 24 + 0 · 25 + 1 · 26 + 1 · 27 + 1 · 28 + 1 · 29,

que por analogıa escribirıamos11111000000(2

o con alguna notacion similar que destaque que se trata de una representacion binaria.¿Que interes puede tener una representacion ası, disponiendo como disponemos de nuestra

‘confortable’ notacion decimal? El creador del sistema binario, Leibniz, lo veıa, entre otras cosas,como una imagen del ‘misterio de la creacion’: el 1 representaba a Dios y el 0 la Nada, de la quetodas las cosas fueron creadas. Trescientos anos mas tarde, resulta que la mayorıa de los ordenadoresactuales manejan los numeros a traves de su representacion binaria, que luego convierten en decimal.La ventaja que esto ofrece es que cada numero se registra en “bits” (binary digits) y cada bit secorresponde con uno de dos estados posibles (pasa corriente o no pasa). Estas dos condicionescorresponden a los valores 1 y 0, respectivamente. Ası, un numero representado por una sucesionde 1 y 0 puede almacenarse en un ordenador como una cadena de bits.

Pero la gran ventaja del sistema binario, que solo necesita dos caracteres, es a veces su graninconveniente: incluso los numeros pequenos requieren muchas cifras en su escritura. Los numerosen representacion binaria son, por tanto, muy largos y de manejo incomodo. Pese a ello, como losordenadores estan formados por dispositivos digitales que solo tienen dos estados estables posibles,asimilados a 0 y a 1, puede decirse que casi todos ellos ‘trabajan’ en sistema binario.

Para paliar los inconvenientes del sistema binario hay distintas soluciones. Como comprobaremosinmediatamente, cualquier entero b mayor o igual que 2 puede tomarse como base de un sistema denumeracion. Si la base b es una potencia de 2, la ‘traduccion’ del sistema binario a esta base es muycomoda. Por esto, algunos programas de ordenador, sobre todo cuando se trabaja en lenguajes deensambladores o en lenguajes de alto nivel como C, emplean el sistema octal (base 8), con dıgitos〈〈 0, 1, 2, 3, 4, 5, 6, 7 〉〉, o el hexadecimal, usado tambien en el mundo de la comunicacion (las cifrashexadecimales son 〈〈 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, A, B, C, D, E, F 〉〉).

Todas estas representaciones son ejemplos particulares de notaciones posicionales: un mismosımbolo (un dıgito) tiene distinto valor segun la posicion que ocupe. Cada ‘lugar’ tiene un ‘peso’,que en nuestro caso corresponde a las potencias sucesivas 1 = b0, b = b1, b2, b3, . . . , de la base b. 2

Que es posible usar cualquier entero b mayor o igual que 2 como base de un sistema de nume-racion se sigue de una aplicacion reiterada de la division entera.

Proposicion 2.2.4 (Teorema fundamental de la numeracion). Dado un entero b ≥ 2, todoentero positivo n se escribe de manera unica en la forma

n = ckbk + ck−1b

k−1 + · · ·+ c1b+ c0, (2.1)

con cj ∈ Z, 0 ≤ cj < b (1 ≤ j ≤ k) y ck 6= 0. Para indicar esta igualdad escribiremos

n = (ckck−1 . . . c1c0)b, o tambien n = ckck−1 . . . c1c0(b,

y diremos que esta es la representacion de n en la base b.

2El lector conoce representaciones que no son posicionales: la numeracion romana, la ‘notacion cientıfica’. Observeseque todas representaciones son convencionales, y es la clase de uso y manipulacion a la que estan destinadas la quemarca su conveniencia y utilidad.


Demostracion. Probaremos la existencia de representacion mediante el principio de induccion com-pleta. Llamemos Pn al enunciado

n admite una representacion del tipo (2.1).Entonces P1 es cierta, con k = 0 y c0 = 1.Supongamos cierta Pm para todo m ≤ n, y demostremos que es cierta Pn+1.Dividiendo n+ 1 por b, obtendremos n+ 1 = mb+ r, con 0 ≤ r < b y m ≥ 0.Pero forzosamente m ≤ n, ya que en caso contrario serıa m > n, luego m ≥ n+1, y en tal caso

mb ≥ (n+ 1)b > n+ 1 (recordemos que b ≥ 2), con lo cual

n+ 1 = mb+ r ≥ mb > n+ 1,

imposible.Ası pues, si m = 0, n + 1 = r con 0 < r < b, que es una representacion del tipo (2.1). Y si

m 6= 0, por la hipotesis de induccion tendremos

m = ckbk + ck−1b

k−1 + · · ·+ c1b+ c0,

con 0 ≤ cj < b (1 ≤ j ≤ k) y ck 6= 0, luego

n+ 1 = mb+ r = ckbk+1 + ck−1b

k + · · ·+ c1b2 + c0b+ r,

que nos da la representacion del tipo (2.1) que estabamos buscando.

Comprobada la existencia de representacion, demostremos su unicidad. Como

n = ckbk + ck−1b

k−1 + · · ·+ c1b+ c0 = (ckbk−1 + ck−1bk−2 + · · ·+ c1)b+ c0, 0 ≤ c0 < b,

resulta que c0 es el resto de la division entera de n por b, determinado unıvocamente por n y b,luego c0 es unico. A su vez, el cociente de esa division, unıvocamente determinado por n y b, es

q = ckbk−1 + ck−1b

k−2 + · · ·+ c1,

y reiterando el argumento anterior vamos obteniendo que los c1, . . . , ck−1 estan unıvocamentedeterminados como restos de las sucesivas divisiones por b, y ck como cociente de la ultima division,que se produce cuando llegamos a un cociente < b. Esto prueba la unicidad.

La demostracion anterior proporciona ademas un algoritmo ‘teorico’ para calcular los cj me-diante divisiones sucesivas ‘en escalera’ por la base b; esquematicamente

n |bc0 n1 |b

c1 n2. . . |b

nk−1 |bck−1 ck |b

ck 0

En direccion contraria, de la representacion de un numero en base b podemos obtener el valor‘teorico’ directamente de la propia definicion

n = ckbk + ck−1b

k−1 + · · ·+ c1b+ c0

o, con un menor numero de operaciones, mediante el conocido algoritmo de Horner-Ruffini:

b)ck ck−1 ck−2 · · · c1 c0

ckb ckb2 + ck−1b · · · ckb

k−1 + · · ·+ c2b ckbk + · · ·+ c1b

ck ckb+ ck−1 ckb2 + ck−1b+ ck−2 · · · ckb

k−1 + · · ·+ c1 ckbk + · · ·+ c1b+ c0

Pero, en la practica, los calculos ‘de verdad’ con numeros ¡se realizan sobre sus representaciones!Eso supone disponer de buenos algoritmos para llevar a cabo las operaciones aritmeticas (i.e., parasumar, restar, multiplicar, dividir). En base 10, sabemos como efectuar estas operaciones, aunquequiza no nos hayamos preguntado el por que de ese como. Ahora es buen momento.


Si se tiene presente el significado de la representacion en base b, las ‘reglas tradicionales’ paraefectuar las operaciones aritmeticas en base 10 quedan perfectamente justificadas (sumar “llevan-do”, multiplicar por un numero de varias cifras en filas sucesivas desplazadas un lugar a la izquierda,etc.) Y, lo que es aun mejor, vemos que las mismas reglas son adaptables para efectuar estas ope-raciones en cualquier base. Por ejemplo, como en base 2 es 0 + 0 = 0, 1 + 0 = 1, pero 1 + 1 = 10, sisumamos dos numeros de varias cifras a la manera tradicional, solo hemos de tener la precaucion de“llevar 1” cuando sumemos 1+1. Supongamos que se trata de calcular m+n, donde m = 100110(2

y n = 11011(2; entonces

m+ n = (1 · 25 + 0 · 24 + 0 · 23 + 1 · 22 + 1 · 21 + 0) + (1 · 24 + 1 · 23 + 0 · 22 + 1 · 21 + 1)= (1 + 0) · 25 + (0 + 1) · 24 + (0 + 1) · 23 + (1 + 0) · 22 + (1 + 1) · 21 + (0 + 1)= (1 + 0) · 25 + (0 + 1) · 24 + (0 + 1) · 23 + (1 + 0) · 22 + (1 + 1) · 21 + 1= (1 + 0) · 25 + (0 + 1) · 24 + (0 + 1) · 23 + (1 + 0) · 22 + (1 · 2 + 0) · 21 + 1= (1 + 0) · 25 + (0 + 1) · 24 + (0 + 1) · 23 + (1 + (1 + 0)) · 22 + 0 · 21 + 1= (1 + 0) · 25 + (0 + 1) · 24 + (0 + 1) · 23 + (1 · 2 + 0) · 22 + 0 · 21 + 1= (1 + 0) · 25 + (0 + 1) · 24 + (1 + (0 + 1)) · 23 + 0 · 22 + 0 · 21 + 1= etc.,

que es lo que que realmente queremos indicar cuando escribimos, prescindiendo del subındice (2 porcomodidad,

“llevo” : +1 +1 +1 +1 +1

m : 1 0 0 1 1 0n : 1 1 0 1 1

m+ n : 1 0 0 0 0 0 1

Analogamente se van adaptando las operaciones mas complicadas.

Cambios de base

Establecida la existencia y unicidad de representacion en cualquier base b ≥ 2, la cuestion quese suscita inmediatamente es: ¿como pasar de la representacion de un numero n en una base b ala representacion en una nueva base β? Cuando entre b y β no haya ninguna relacion ‘especial’, nopodemos apelar a mas recursos que los que hemos senalado en el apartado anterior. Por ejemplo,ya hemos visto como expresar el numero decimal 1984 en base 2, y si nos dan un numero binariocomo 11010011(2, su representacion decimal serıa

2)1 1 0 1 0 0 1 1

2 6 12 26 52 104 2101 3 6 13 26 52 105 211

Pero en circunstancias especiales puede haber simplificaciones. Esto sucede, en particular, siuna de las bases es una potencia de la otra, como es el caso cuando se considera b = 2 y β = 8 = 23,o b = 2 y β = 16 = 24. En la primera situacion, como

n = c0 + c1 · 2 + c2 · 22 + c3 · 23 + c4 · 24 + c5 · 25 + c6 · 26 + c7 · 27 + c8 · 28 + c9 · 29 + · · ·= (c0 + c1 · 2 + c2 · 22) + (c3 + c4 · 2 + c5 · 22) · 23 + (c6 + c7 · 2 + c8 · 22) · (23)2 + · · · ,

con los cj = 0 o 1, es obvio que si n = d0 + d1 · 8 + d2 · 82 + · · · , con los dk enteros no negativos< 8, por la unicidad de representacion, necesariamente

d0 = c0 + c1 · 2 + c2 · 22, d1 = c3 + c4 · 2 + c5 · 22, d2 = c6 + c7 · 2 + c8 · 22, . . .

lo que nos lleva a la siguiente regla:


para cambiar la representacion de un numero en base 2 a base 8, se agrupan las ci-fras binarias de tres en tres, de derecha a izquierda, y se sustituye cada grupo por suexpresion en base 8.

Por ejemplo:1100100101010(2 → [1][100][100][101][010]→ 14452(8 .

Y recıprocamente,

para cambiar la representacion de un numero en base 8 a base 2, cada dıgito octal sesustituye por las tres cifras binarias que lo representan en base 2 (incluyendo ceros a laizquierda cuando sea preciso).

Por ejemplo,

537264(8 → [101][011][111][010][110][100]→ 101011111010110100(2 .

Razonando analogamente, cuando b = 2, β = 16, se agrupan/sustituyen cifras en/por blo-ques de cuatro. Facilita las cosas disponer de una tabla de ‘equivalencias en binario’ de las cifrashexadecimales (D significa ‘decimal’, B ‘binario’, H ‘hexadecimal’):

D 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15B 0 1 10 11 100 101 110 111 1000 1001 1010 1011 1100 1101 1110 1111H 0 1 2 3 4 5 6 7 8 9 A B C D E F

Recursos informaticos

Los programas de calculo permiten, por lo general, obtener las cifras de cualquier representacionen una base dentro de tamanos ‘no disparatados’.

En maple , se dispone de la ordenconvert(n,base,β);

donde n es un numero decimal y β la nueva base, que da una lista con los dıgitos de la representaciondel numero en base β. Por ejemplo, convert(17,base,3); da [2,2,1]. Otra opcion es

convert(`,base,α,β);

donde ` es una lista de cifras en base α y β la nueva base, que devuelve una lista con los dıgitos enbase β que representan el mismo numero. Por ejemplo, convert([2,2,1],base,3,10); da [7,1].

En Mathematica , la ordenIntegerDigits[n,b]

da una lista de los dıgitos en base b del numero decimal n, mientras queb^^n

donde n es la representacion en base b de un numero, da el valor decimal del numero. Por ejemplo,IntegerDigits[10!] da {3, 6, 2, 8, 8, 0, 0},IntegerDigits[10!,2] da {1,1,0,1,1,1,0,1,0,1,1,1,1,1,0,0,0,0,0,0,0,0},y 16^^16c91a3 da 23892387.

En la red es facil encontrar applets de Java que realizan conversiones de base interactivamente.P. ej., en la siguiente direccion puede pasarse ‘instantaneamente’ de base decimal a base binaria yviceversa.http://www.vincesplace.com/TraditionalCourses/cis121/assignments/BinaryNum/BinaryNum.htm

http://www.vincesplace.com/TraditionalCourses/cis121/assignments/BinaryNum/BinaryNum.htm


Ejercicios

8.1. Convertir a sistema decimal y binario los numeros hexadecimales ACABA y FE0.

8.2. En el sistema hexadecimal, ¿es cierto que B0B0 + A0A = BABA?

8.3. Sin pasar a representacion decimal, ¿como efectuarıas en base 2 las sumas 1011(2 + 11(2 y101110(2 + 100011(2?

Para debatir. Puesto que 2 + 2 = 11 en base 3 y 2 + 2 = 10 en base 4, ¿habra que cambiar lafrase hecha 〈〈esto es tan cierto como que dos y dos son cuatro〉〉 a 〈〈esto es tan cierto como que dosy dos son cuatro . . . en base diez〉〉? (Una buena discusion deberıa empezar con la distincion entre‘sımbolo’ o ‘representacion’ y ‘cosa representada’.)

2.2.4. Maximo comun divisor. Algoritmo de Euclides.

Definicion 2.2.5. Sean a, b ∈ Z. Decimos que a divide a b, o que a es un divisor o un factorde b, o que b es multiplo de a, escrito a|b, si existe c ∈ Z tal que b = ac; expresado de otra forma,si el resto de la division de b por a es 0. Diremos entonces que c es el cociente exacto b/a o elcofactor de a.

Proposicion 2.2.6. La divisibilidad tiene las siguientes propiedades: dados enteros arbitrarios a,b, d, m, n,

(i) n|n (propiedad reflexiva)(ii) d|n y n|m implica d|m (propiedad transitiva)(iii) d|n y d|m implica d|(an+ bm) (propiedad de linealidad)(iv) d|n implica ad|an (propiedad de multiplicacion)(v) ad|an y a 6= 0 implica d|n (ley de cancelacion)(vi) 1|n, −1|n (1 y −1 dividen a cualquier entero)(vii) m|n ⇐⇒ −m|n ⇐⇒ m| − n (y ası m|n ⇐⇒ |m|||n|)(viii) n|0 (todo entero divide a 0)(ix) 0|n implica n = 0 (0 solo divide a 0)(x) d|n y n 6= 0 implica |d| ≤ |n| (propiedad de comparacion)(xi) d|n y n|d implica |d| = |n| (antisimetrıa ‘parcial’)(xii) d|n y d 6= 0 implica (n/d)|n (n/d se llama tambien divisor conjugado de d)

Demostracion. Probemos, por ejemplo, (x). Si d|n y n 6= 0, |n| = |d| ·m para algun m ∈ Z; peronecesariamente m ≥ 0 y m 6= 0, luego m ≥ 1 y |n| ≥ |d|.

Maximo comun divisor

Si a, b, son numeros enteros no nulos, existe m = maxF , donde F = {k ∈ Z : k|a, k|b} (1 y −1 ∈ F ,y k ∈ F =⇒ k ≤ mın{|a|, |b|}, y podemos aplicar el principio del maximo). Ademas, m ≥ 1 (1 ∈ F ),luego m ∈ N; de hecho, m = max{k ∈ N : k|a, k|b}. Esto justifica la siguiente definicion.

Definicion 2.2.7. Sean a, b, numeros enteros no nulos. Su maximo comun divisor es el mayornumero, natural siempre, que divide a a y b simultaneamente. Lo denotaremos por mcd(a, b).

A veces se amplıa la definicion poniendo mcd(a, 0) = |a|, mcd(0, 0) = 0.

Para calcular el maximo comun divisor de dos numeros no hace falta mas herramienta que ladivision entera, como justifican los siguientes resultados.

Lema 2.2.8. Si a, b, son numeros enteros no nulos tales que a = cb+ r, se tiene que mcd(a, b) =mcd(b, r).


Demostracion. Si k es un divisor comun de a y b, como r = a − cb, por la propiedad (iii) delinealidad k es un divisor de r, y por tanto todo divisor comun de a y b es un divisor comun de by r.

Recıprocamente, si k′ es un divisor comun de b y r, como a = cb + r, nuevamente por lapropiedad (iii) de linealidad k′ es un divisor de a, y por tanto todo divisor comun de b y r es undivisor comun de a y b.

En consecuencia, el conjunto de divisores comunes a a y b es el mismo que el de divisorescomunes a b y r. Aplicando la definicion, mcd(a, b) = mcd(b, r), como querıamos probar.

Lema 2.2.9. Si a, b, son numeros enteros no nulos tales que b | a, entonces mcd(a, b) = |b|.

Demostracion. Ciertamente |b| es un divisor comun de b y a en estas circunstancias; y si k es unentero positivo que divide a b, k ≤ |b| segun hemos senalado anteriormente, luego mcd(a, b) = |b|.

Supongamos ahora que tratamos de calcular el maximo comun divisor de dos numeros de buentamano, 1769 y 551 por ejemplo. Haciendo la division entera, 1769 = 3×551+116, y segun el primerlema, d = mcd(1769, 551) = mcd(551, 116). A su vez, 551 = 4× 116 + 87, luego d = mcd(116, 87).Pero 116 = 87 + 29 y 87 = 3 × 29, con lo que finalmente d = mcd(87, 29) = 29 (segundo lema).¿Hemos tenido suerte? Si reflexionamos un momento sobre el proceso seguido, vemos que puedeaplicarse a enteros positivos arbitrarios a y b: pues tomando como a el mayor y b el menor (si soniguales no necesitamos hacer cuentas), al efectuar la division entera de a por b obtenemos un restono negativo r1 estrictamente menor que b; si r1 = 0, ya tenemos el maximo comun divisor de ay b (= b, segundo lema); si no, d = mcd(a, b) = mcd(b, r1), con la ventaja de que hemos pasado anumeros mas pequenos, y dividiendo b por r1 pasarıamos a d = mcd(a, b) = mcd(r1, r2), donde r2es el resto de la division de b por r1, estrictamente menor que r1. Reiterando, puesto que en elpeor de los casos ira disminuyendo al menos en 1 el valor de los restos, al cabo de un numero finitode pasos hemos de llegar a resto 0, y podemos aplicar el segundo lema para concluir que el divisoractual (resto del paso anterior) es el maximo comun divisor.

Formalizando este proceso, conocido ya por Euclides, tenemos (ver [C-C-S]):

Definicion 2.2.10. Algoritmo de Euclides.

• Input: dos enteros positivos a y b.

• Output: el maximo comun divisor de a y b.

Paso 1: Reemplazar (simultaneamente)

� a por b, y� b por el resto de la division de a por b.

Paso 2: Repetir el Paso 1 hasta que b sea 0.

Paso 3: Devolver a.

Podemos esquematizarlo de la siguiente manera:

restos ↘ r1 r2 r3 · · · · · · rn−1 0dividendos ← divisores a b r1 r2 · · · · · · rn−2 rn−1 = d

cocientes c1 c2 c3 · · · · · · cn−1 cn

y entonces d = mcd(a, b) como hemos probado anteriormente.


Proposicion 2.2.11. Algoritmo de Euclides. Dados dos numeros enteros positivos a y b cona > b, obtenemos su maximo comun divisor d = mcd(a, b) procediendo por divisiones enterassucesivas, como se ha indicado anteriormente, hasta obtener resto nulo. El maximo comun divisorde a y b es entonces el ultimo resto no nulo.

La hipotesis de que a y b sean enteros positivos no supone ninguna restriccion esencial, dadoque mcd(a, b) = mcd(|a|, |b|). Por tanto, el algoritmo de Euclides basta para poder calcular elmaximo comun divisor de dos enteros no nulos arbitrarios. Hay ademas una informacion importantecontenida en el, que merece la pena destacar como se vera en aplicaciones posteriores: el maximocomun divisor de a y b es una “combinacion lineal de a y b con coeficientes enteros”.

Proposicion 2.2.12. Identidad de Bezout. Sean a y b enteros no nulos, y d = mcd(a, b).Entonces existen enteros u, v tales que

d = ua+ vb.

Demostracion. Supongamos primero que a y b son positivos, y apliquemosles el algoritmo de Eu-clides, de modo que con la notacion previa

r1 = a− c1b, r2 = b− c2r1, rk = rk−2 − ckrk−1 (3 ≤ k < n),

siendo precisamente d = rn−1. Por tanto

d = rn−1 = rn−3 − cn−1rn−2 = sn−1rn−3 + tn−1rn−2 = sn−1rn−3 + tn−1(rn−4 − cn−2rn−3)= sn−2rn−4 + tn−2rn−3 = · · · = skrk−2 + tkrk−1 = · · · = s1a+ t1b,

donde todos los sk, tk son enteros. Por tanto, u = s1, v = t1 cumplen la tesis.Si a o b son negativos, recordemos que tambien d = mcd(|a|, |b|), y si p. ej. a < 0, b > 0, sabiendo

que d = u|a|+ v|b|, sera igualmente d = (−u)(−a) + vb. De la misma forma pueden resolverse loscasos restantes.

Nota. Los coeficientes u y v no son unicos: observese, por ejemplo, que

d = ua+ vb = (u+ nb)a+ (v − na)b

cualquiera que sea n ∈ Z.

Una variante de la demostracion anterior, mas farragosa, permite fabricar un algoritmo para elcalculo de unos valores de u, v. Manteniendo la notacion para los cocientes y restos, y comenzandopor el principio,

a = 1 · a+ 0 · b = u0a+ v0b, b = 0 · a+ 1 · b = u1a+ v1b, r1 = 1 · a− c1b = u2a+ v2b,

r2 = −c2a+ (1 + c1c2)b = u3a+ v3b,

y, en general, si rk = uk+1a+ vk+1b, rk+1 = uk+2a+ vk+2b, tambien

rk+2 = rk − ck+2rk+1 = (uk+1 − ck+2uk+2)a+ (vk+1 − ck+2vk+2)b = uk+3a+ vk+3b

si ponemos uk+3 = uk+1 − ck+2uk+2, vk+3 = vk+1 − ck+2vk+2.Para que intervengan solo dos ındices consecutivos, introducimos xk = uk+1, yk = vk+1, con lo

que quedaxk+2 = uk+1 − ck+2xk+1, yk+2 = vk+1 − ck+2yk+1,

y finalmented = rn−1 = xn−1a+ yn−1b = una+ vnb.

Ordenando el proceso anterior se obtiene el siguiente algoritmo:


Definicion 2.2.13. Algoritmo de Euclides extendido (Euclides-Bezout).

• Input: dos enteros positivos a y b.

• Output: dos enteros u y v tales que mcd(a, b) = ua+ vb.

Paso 1: Hacer u = y = 1 y v = x = 0.

Paso 2: Determinar c y r tales que a = cb+ r y 0 ≤ r < b.Reemplazar

� a por b, y b por r,� u por x y v por y,� x por u− cx e y por v − cy.


Paso 4: Devolver u y v.

Visualizado en forma de tabla:


cocientes c c1 c2 c3 · · · · · · cn−1 cnuk+1 =xk 1 0 1 · · · · · · · · · un−1 uvk+1 =yk 0 1 −c1 · · · · · · · · · vn−1 v

xk+1 =uk−ck+1xk 0 1 −c2 · · · · · · · · · xn−1 = uyk+1 =vk−ck+1yk 1 −c1 1 + c1c2 · · · · · · · · · yn−1 =v

Ejemplo. Apliquemos este algoritmo a los numeros considerados anteriormente, a = 1769, b = 551,para los que ya hemos visto que mcd(a, b) = 29 (volveremos a obtenerlo).

restos ↘ 116 87 29 0dividendos ← divisores 1769 551 116 87 29

cocientes c 3 4 1 3uk+1 =xk 1 0 1 −4 5vk+1 =yk 0 1 −3 13 -16

xk+1 =uk−ck+1xk 0 1 −4 5 —yk+1 =vk−ck+1yk 1 −3 13 -16 —

Efectivamente, 29 = 5 · 1769− 16 · 551.

El recıproco de la proposicion 3.2.15 no es cierto en general: por ejemplo, 441 − 18 · 24 = 9,mientras que mcd(441, 24) = 3. Sin embargo, lo es en una situacion especial.

Definicion 2.2.14. Dos numeros enteros no nulos a y b se dicen relativamente primos oprimos entre sı si no tienen mas divisores comunes que 1 y −1, es decir, si mcd(a, b) = 1.

Corolario 2.2.15. Dos numeros enteros no nulos a y b son relativamente primos si y solo siexisten dos numeros enteros u y v tales que ua+ vb = 1.

Demostracion. Si a y b son relativamente primos, la igualdad del enunciado es un caso particularde la identidad de Bezout.

Supongamos ahora que tenemos enteros u y v para los que se verifica ua + vb = 1. Si k es undivisor comun de a y b, por linealidad k es un divisor de 1 y por tanto |k| = 1 y mcd(a, b) = 1.


Ejemplo. Puesto que para todo entero positivo k es

−3(5k + 3) + 5(3k + 2) = 1,

se sigue que 5k + 3 y 3k + 2 son relativamente primos.Ejercicio. Dados dos numeros enteros no nulos a y b relativamente primos, probar que el maximocomun divisor de a+ b y a− b es 1 o 2.Respuesta. Existen u, v ∈ Z tales que ua+ vb = 1. Si k es un divisor comun de a+ b y a− b, porlinealidad k divide a (a+ b) + (a− b) = 2a y a (a+ b)− (a− b) = 2b; nuevamente por linealidad,dividira a 2au+ 2bv = 2. Por tanto |k| = 1 o |k| = 2, de donde se sigue que mcd(a+ b, a− b) = 1 omcd(a+ b, a− b) = 2.

Ecuaciones diofanticas lineales

Una aplicacion importante de la identidad de Bezout es el estudio de las soluciones de las ecuaciones(lineales) diofanticas, es decir, ecuaciones en las que se buscan solamente soluciones enteras, queaparecen en contextos mas serios pero tambien en acertijos como el siguiente:

〈〈 ¿Puede llenarse exactamente un deposito de agua de 56 l. transportandola con un cubo de 6 l.y otro de 9 l.? ¿Y un deposito de 57 l.? En caso afirmativo, ¿cual es el numero mınimo de viajesque hay que realizar con los cubos para llenar el deposito? 〉〉

Planteamiento: ¿6x + 9y = 56 tiene soluciones x, y ∈ N0? ¿6x + 9y = 57 tiene soluciones x,y ∈ N0? ¿cuales?

Para responder en general, comenzamos por un lema.

Lema 2.2.16. Sean a, b, d, m, p, q numeros enteros, ab 6= 0.

(i) si d = mcd(a, b), a = pd, b = qd, entonces mcd(p, q) = 1 (es decir, p y q son relativamenteprimos).

(ii) si mcd(p, q) = 1 y p | qm, entonces p |m.

Demostracion.(i) Existen u, v ∈ Z tales que ua + vb = d, luego d(up + vq) = d; cancelando d se deduce queup+ vq = 1, y por tanto que mcd(p, q) = 1.(ii) Existen u, v ∈ Z tales que up + vq = 1, con lo cual upm + vqm = m. A su vez, existe n ∈ Ztal que pn = qm. Sustituyendo qm por pn y sacando factor comun p resulta p(um + vn) = m, esdecir, p divide a m como querıamos demostrar.

Corolario 2.2.17 (Resolubilidad de ecuaciones diofanticas). Sean a 6= 0, b 6= 0, c, tresnumeros enteros y d = mcd(a, b). La ecuacion

ax+ by = c

tiene soluciones enteras si y solo si d|c.

Demostracion. Sea ax+ by = c para ciertos enteros x, y. Como d|a y d|b, por la propiedad (iii) delinealidad, d|c.

Recıprocamente, supongamos que d|c, es decir, c = kd para algun k ∈ Z. Puesto que existenenteros u, v, para los que d = ua+vb, multiplicando por k obtenemos c = kd = kua+kvb, es decir,x = ku, y = kv nos da una solucion de la ecuacion propuesta.

Notese que la segunda parte de la demostracion nos proporciona una solucion concreta mediantela identidad de Bezout. ¿Habra otras? Vamos a comprobar que o bien no existe solucion o bien hayinfinitas, que se pueden construir a partir de una cualquiera de ellas.


Proposicion 2.2.18. Sean a 6= 0, b 6= 0, c, tres numeros enteros; si el par (x0, y0) ∈ Z × Zconstituye una solucion particular de la ecuacion diofantica ax + by = c, todas las solucionesenteras de esta ecuacion son de la forma

x = x0 + (b/d)n, y = y0 − (a/d)n, n ∈ Z,

donde d = mcd(a, b).

Demostracion. Pongamos p = a/d, q = b/d.Si ax0 + by0 = c, los x, y del enunciado son soluciones de la ecuacion, es decir, si x = x0 + qn e

y = y0 − pn para algun entero n,

ax+ by = a(x0 + qn) + b(y0 − pn) = (ax0 + by0) + aqn− bpn = c+ (pd)qn− (qd)pn = c.

Recıprocamente, si x, y son soluciones enteras de la ecuacion, son de la forma especificada enel enunciado. En efecto: de

ax0 + by0 = c, ax+ by = c, se sigue a(x− x0) + b(y − y0) = 0;

por tanto, dividiendo por d = mcd(a, b), podemos reescribir la ultima igualdad como

p(x− x0) = q(y0 − y). [∗]

Ası, p divide a q(y0 − y). Pero, aplicando las dos partes del lema, mcd(p, q) = 1 y en consecuenciap divide a y0 − y. Existe, pues, un n ∈ Z tal que y0 − y = pn, es decir, y = y0 − pn. Sustituyendoeste valor de y en la ecuacion [∗], resulta finalmente x = x0 + qn, como querıamos probar.

Ejemplo. De las ecuaciones que habıamos dejado planteadas, 6x + 9y = 56 no tendra solucion y6x+ 9y = 57 sı, puesto que mcd(6, 9) = 3. Como 57 = 19 · 3, 9 = 6 + 3, (−1)6 + 9 = 3, se sigue que(−19)6 + 19 · 9 = 57, lo que da como unicas soluciones con coeficientes positivos

n 7 8 9x = −19 + 3n 2 5 8y = 19− 2n 5 3 1

La primera combinacion es la que requiere menor numero de viajes.

Nota. Sistematizando el proceso desarrollado en las paginas anteriores, obtenemos (v. [C-C-S], pp.5–6) el siguiente

Algoritmo de resolucion de ecuaciones diofanticas lineales

• Input: enteros a, b, c, con a y b no ambos nulos.

• Output: todas las soluciones enteras x, y de la ecuacion xa+ yb = c.

Paso 1: Encontrar, usando el algoritmo de Euclides extendido, enteros u, v tales qued := mcd(a, b) = ua+ vb.

Paso 2: Si d no divide a c, devolver ‘NO HAY SOLUCIONES DE LA ECUACION’.

Paso 3: Si d divide a c, devolver entonces x = (uc− nb)/d y y = (vc+ na)/d, con n ∈ Z.


Mınimo comun multiplo

Emparejado con el concepto de maximo comun divisor suele ir el de mınimo comun multiplo.Dados a, b ∈ Z \ {0}, siempre hay enteros positivos que son multiplos simultaneamente de a y b:por ejemplo, |ab|. El conjunto F = {z ∈ N : a|z, b|z} es, pues, no vacıo; por el principio de buenaordenacion, existe m = mınF , por lo que podemos enunciar la definicion siguiente.

Definicion 2.2.19. Sean a, b, numeros enteros no nulos. Su mınimo comun multiplo es elmenor numero entero positivo que es multiplo de a y b simultaneamente. Se escribe mcm(a, b).

(Si ab = 0, se pone a veces mcm(a, b) = 0.)

Si ab 6= 0 y a < 0 o b < 0, podemos reducir el calculo de su mınimo comun multiplo al de losnumeros positivos |a|, |b|; y cuando a y b son positivos, podemos hallar su mınimo comun multiploconociendo el maximo comun divisor, gracias a:

Proposicion 2.2.20. Sean a, b, numeros enteros positivos. Entonces

mcm(a, b) ·mcd(a, b) = ab.

Demostracion. Sea d = mcd(a, b), a = pd, b = qd, con lo cual mcd(p, q) = 1.Si n = p′a = q′b es cualquier multiplo (positivo) comun de a y b, sera n = p′pd = q′qd, de donde

p′p = q′q, luego p|q′q siendo p y q relativamente primos, y en consecuencia p|q′. Entonces q′ = cppara algun c y sustituyendo, n = cpb = c(ab/d), con lo que (ab/d) ≤ n.

Como (ab/d) = pb = qa es un multiplo comun de a y b, se sigue que mcm(a, b) = (ab/d).

Ejemplo. mcm(1769, 551) =1769× 551

29= 61× 551 = 33611.

Calculos con maple y Mathematica

Finalizamos este apartado indicando una serie de recursos de maple y Mathematica quegeneralmente sustituyen con ventaja el calculo ‘a mano’ de los objetos encontrados a lo largo delmismo. Esto hace innecesario insistir en los ejercicios que se reducen a un mero calculo, pero todomatematico debe estar en condiciones de resolverlos incluso cuando falla el suministro electrico,por lo que recomendamos ejercitarse manualmente (sin exagerar) en los algoritmos que hemos idoexponiendo, y utilizar el ordenador para comprobar los resultados.

La explicacion detallada del funcionamiento de las ordenes aquı recogidas se encuentra en losmanuales o en la ayuda de los propios programas.

• maple (a, b, c,. . . datos)

entrada salida comentario

igcd(a,b,...); mcd(a, b, . . . )ilcm(a,b,...); mcm(a, b, . . . )

igcdex(a,b,’s’,’t’);s;t;mcd(a, b)

st

mcd(a, b) = sa+ tb

isolve(a*x+b*y=c,x,y); {x = x0 − b0 Z1, y = y0 + a0 Z1}

(x0, y0) solucion particular,b0 = b/d, a0 = a/d,(d = mcd(a, b)),Z1 entero arbitrario


• Mathematica (a, b, c,. . . datos)

entrada salida comentario

GCD[a,b,...] mcd(a, b, . . . )LCM[a,b,...] mcm(a, b, . . . ){g,{r,s}}=ExtendedGCD[n=a,m=b,...] g, r, s g = mcd(a, b) = ra+ sb

Solve[a*x==c && Modulus==b,x] (ver ejemplo) algunos x soluciones de ax+ by = c

Solve[b*y==c && Modulus==a,y] (ver ejemplo) algunos y soluciones de ax+ by = c

Ejemplos.(1) Identidad de Bezout con maple :

igcdex(1027,712,’s’,’t’);s;t;1-165238

(2) Identidad de Bezout con Mathematica :

In[1]:= {g, {r, s}} = ExtendedGCD[n = 1027, m = 712]

Out[1]= {1, {-165, 238}}

(3) Ecuaciones diofanticas lineales con maple :

isolve(8*x+12*y=20);

{x = 1 - 3 _Z1, y = 1 + 2 _Z1}

(4) Ecuaciones diofanticas lineales con Mathematica :

In[1]:=Solve[8 x == 20 && Modulus == 12, x ]

Out[1]={{Modulus -> 12, x -> 1}, {Modulus -> 12, x -> 4},{Modulus -> 12, x -> 7}, {Modulus -> 12, x -> 10}}

In[2]:=Solve[12 y == 20 && Modulus == 8, y ]

Out[2]={{Modulus -> 8, y -> 1}, {Modulus -> 8, y -> 3},{Modulus -> 8, y -> 5}, {Modulus -> 8, y -> 7}}

Ejercicios

9.1. Probar que c|a, c|b =⇒ c|mcd(a, b); a|c, b|c =⇒ mcm(a, b)|c.(N.B. Estas propiedades no estan incluidas en las definiciones: hablamos en ellas de maximo y

mınimo para la relacion de orden, y lo que se pide aquı es probar que son igualmente maximo ymınimo para la relacion de divisibilidad en N)

9.2. Calcular d = mcd(1320, 714) y escribir d = 1320x+ 714y con x, y ∈ Z.


9.3. Calcular mcd(a, b) y encontrar todas las soluciones de ax + by = mcd(a, b) en los siguientescasos:

(1) a = 63, b = 49; (2) a = 619, b = 93; (3) a = 521, b = 2187.

9.4. Hallar todas las soluciones enteras de las ecuaciones

(1) 2x+ 3y = 7; (2) 21x− 35y = −14.

9.5. Definir el maximo comun divisor y el mınimo comun multipo de tres numeros, mcd(a, b, c) ymcm(a, b, c). Hallar mcd(1485, 71148, 7882875), mcm(1485, 71148, 7882875).

9.6. Calcular d = mcd(60, 126, 44) y encontrar enteros x, y, z que verifiquen d = 60x+126y+44z.

9.7. Para cada entero positivo n, calcular mcd(n, n+ 1) y mcd(n, n+ 2).

9.8. Demostrar que 3m+ 11 y 2m+ 7 son relativamente primos cualquiera que sea m ∈ N.

9.9. Sean a y b dos enteros positivos. Probar que si m = mcm(a, b), entonces mcd(m/a,m/b) = 1.

9.10. Dados a, b ∈ N, si d = mcd(a, b), probar que

{ax+ by : x, y ∈ Z} = {dz : z ∈ Z}.

(Este ultimo conjunto suele denotarse por dZ y el primero por aZ + bZ, con lo que la igualdadanterior queda aZ + bZ = dZ.)

9.11. Si a, b son enteros relativamente primos, ¿quien es mcm(a, b)? ¿Por que?

9.12. Si a, b son enteros relativamente primos y c es un entero tal que a|c y b|c, probar que ab|c.¿Que sucede si a, b no son relativamente primos? ¿por que?

9.13. Una persona desea comprar 430 dolares en cheques de viaje. Estos solamente existen encheques de 20 y 50 dolares. ¿Cuantos cheques de cada cantidad debera adquirir?

9.14. ¿De cuantas formas posibles se pueden tener 325 pesetas repartidas en monedas de 10 y de25 pesetas?

9.15. Un tren sale de Parıs a Niza cada 7 horas, a una hora en punto. Probar que algunos dıas esposible tomar este tren a las 9 de la manana.

Siempre que hay un tren a las 9 de la manana, Pierre lo coge para ir a visitar a su tıa Marie.¿Cada cuanto tiempo ve Marie a su sobrino?

Discutir el mismo problema con el tren a Burdeos, que sale de Parıs cada 14 horas.

9.16. Demostrar que un cajero automatico cargado de billetes de veinte y de cincuenta euros puededispensar cualquier cantidad de euros multiplo de 10 que sea superior o igual a 40 euros.

Sugerencia: puede probarse por induccion, teniendo en cuenta que 2(−2) + 5 = 1 = 2 · 3− 5.

9.17. El problema de los cocos. Cinco marineros suspicaces emplean el dıa en recoger un montonde cocos. Agotados, posponen el reparto del monton hasta la manana siguiente. Desconfiados, cadauno decide coger su parte durante la noche. El primer marinero divide el monton en cinco partesiguales mas un coco extra, que da a un mono. Coge un monton y deja el resto en un unico monton.Mas tarde, el segundo marinero hace lo mismo; y, de nuevo, el mono recibe un coco sobrante. Eltercero, cuarto y quinto marineros tambien lo hacen; todas las veces queda un coco, que recibeel mono. Por la manana, dividen los cocos restantes en cinco montones iguales, y cada marinerorecibe su “parte”. (Cada marinero sabe que faltan algunos, pero nadie protesta, porque ¡todos sonculpables!) ¿Cual es el menor numero posible de cocos en el monton original?

(Este problema aparecio en el Saturday Evening Post el 9 de octubre de 1926.)

Y para (que disfruten) los mas atrevidos:


9.18. Consideremos la sucesion de Fibonacci, definida por recurrencia mediante las formulas

φ0 = 0, φ1 = 1, φn = φn−1 + φn−2, n ≥ 2.

Probar que:

(i) mcd(φn, φn+1) = 1 para todo n ≥ 1;

(ii) φn+m = φn−1φm + φnφm+1 para todo n ≥ 1, m ≥ 0;

(iii) si r > 0, φn|φnr para todo n ≥ 1;

(iv) si mcd(m,n) = d, entonces mcd(φm, φn) = φd.

9.19. Sea mcd(a, b) = 1. Probar que mcd(a+ b, a2 − ab+ b2) es 1 o 3.

9.20. Considerese una diana para dardos con dos regiones, una que vale a puntos y la otra b puntos,donde a y b son enteros positivos sin factores comunes. ¿Cual es la mayor puntuacion total que nopuede obtenerse lanzando dardos a la diana?

9.21. Sean a, b enteros positivos primos entre sı. Pobar que cualquier entero c ≥ (a − 1)(b − 1)tiene la forma ax + by, donde x e y son enteros no negativos. Probar que el entero ab − a − b notiene esta forma.

(Teorema de Sylvester, v. [D’A-W] pp. 98 y ss.)

2.2.5. Numeros primos y factorizacion. Teorema fundamental de la Aritmetica.

Definicion 2.2.21. Un numero entero positivo p distinto de 1 se dice primo si no tiene masdivisores positivos que el mismo y la unidad; en caso contrario diremos que es compuesto.

Dicho de otra forma, p es primo si p ∈ N \ {1} y a ∈ N, a|p, implica a = 1 o a = p.Que un numero n sea compuesto significa, segun la definicion, que admite al menos un divisor

positivo a tal que 1 < a < n.

Lema 2.2.22. Para todo entero n ≥ 2 existe un numero primo p tal que p|n.(Se dice entonces que p es un factor primo de n.)

Demostracion. Ya lo probamos por induccion. Veamos como podrıa formularse la demostracioncon otra apariencia.

Si n es primo, basta tomar p = n. Si no lo es, admite un divisor positivo a1 tal que 1 < a1 < n.Si a1 es primo, basta tomar p = a1. Si no lo es, admite un divisor positivo a2 tal que 1 < a2 < a1,que a su vez sera divisor de n. Si a2 es primo, basta tomar p = a2. Si no lo es, podemos continuarel proceso: pero como cada vez vamos obteniendo divisores ak tales que 1 < ak < ak−1, es decir,cada uno estrictamente menor que el anterior, al cabo de un numero finito de pasos encontraremosun divisor primo (= 2, en el peor de los casos).

Teorema 2.2.23 (Euclides). El conjunto de los numeros primos es infinito.

Demostracion. Supongamos, por el contrario, que fuese finito, y que p1, p2, . . . , pn fuesen todoslos diferentes numeros primos (n ∈ N). El numero

N = p1p2 · · · pn + 1

no figura en esa lista, pues es estrictamente mayor que cada uno de sus elementos (¿por que?), ytendrıa que ser divisible por alguno de ellos segun el lema anterior. Pero

N = pk(p1p2 · · · pk−1pk+1 · · · pn) + 1


da resto 1 al dividirlo por cada pk, y no resto 0, luego N no tendrıa factores primos, contradiccion.

Un procedimiento casico para hallar los numero primos menores o iguales que un entero positivon es la criba de Eratostenes, que consiste en ir suprimiendo de la lista de los n primeros numerosnaturales los que son multiplos de 2, luego los que son multiplos de 3, de 5, etc. (v. [D-H], p. 34.)Lo presentamos aquı en forma de algoritmo.

Definicion 2.2.24. Algoritmo: La criba de Eratostenes.

• Input: un entero positivo n.

• Output: la lista de primos menores o iguales que n.

Paso 1: Construir la lista L := [2, . . . , n] y la lista vacıa M .

Paso 2: Sea m el menor elemento de L.

� Anadir m a M .� Suprimir de L todos los multiplos de m.

Paso 3: Repetir el Paso 2 hasta que L este vacıa.

Paso 4: Devolver M .

En Internet abundan los applets de Java que ejecutan este proceso interactivamente. Por ejem-plo, ver estas direcciones:

http://www.win.tue.nl/~ida/demo/c1s4ja.htmlhttp://www.faust.fr.bw.schule.de/mhb/eratosiv.htmhttp://www.shodor.org/succeedhi/succeedhi/sieve/model.html

Lema 2.2.25. Sean a y b numeros enteros no nulos y p un numero primo tal que p|ab. Entoncesp|a o p|b.

Demostracion. Puesto que p es primo, no tiene mas divisores positivos que 1 y p. Por tanto, sip 6 |a, mcd(p, a) = 1. Podemos entonces aplicar la parte (ii) del lema 2.2.16 para concluir que p|b.

Teorema 2.2.26 (Teorema fundamental de la aritmetica). Todo numero entero positivodistinto de 1 puede descomponerse como producto de factores primos de manera unica, salvo elorden de dichos factores.

Demostracion. Comencemos probando la existencia de la factorizacion. (Una presentacion alterna-tiva se encuentra en [D-H], p. 35.)

Notemos que si p es primo, admite la factorizacion trivial p = p. Sea Pn el enunciado〈〈 n ≥ 2 y los numeros enteros desde 2 hasta n admiten una descomposicion en factores primos 〉〉.

Puesto que 2 es primo, P2 es cierta. Supongamos ahora que es cierta para un n ≥ 2. Si n+ 1 esprimo, Pn+1 es cierta; si no lo es, podremos descomponerlo en n + 1 = n1n2 con 1 < n1 < n + 1,1 < n2 < n+1. Pero entonces 2 ≤ n1 ≤ n, 2 ≤ n2 ≤ n, y por la hipotesis de induccion n1 = p1 · · · pj ,n2 = pj+1 · · · pk, con p1,. . . , pj , pj+1, . . . , pk primos. Por tanto

n+ 1 = p1 · · · pjpj+1 · · · pk

es una factorizacion de n+ 1 como producto de primos, es decir, Pn+1 es cierta.Pasemos a probar la unicidad. (Tambien podrıa hacerse por induccion). Supongamos que

n = p1p2 · · · pj = q1q2 · · · qk

http://www.win.tue.nl/~ida/demo/c1s4ja.html

http://www.faust.fr.bw.schule.de/mhb/eratosiv.htm

http://www.shodor.org/succeedhi/succeedhi/sieve/model.html


son dos descomposiciones de n en factores primos. Entonces p1|q1(q2 · · · qk) luego por el lema previo,p1|q1 o p1|(q2 · · · qk): en el primer caso, como p1 y q1 son primos, necesariamente p1 = q1; enel segundo caso p1|q2 o p1|(q3 · · · qk). Repitiendo el argumento anterior, en k pasos a lo sumoencontraremos un factor qk1 igual a p1. Lo mismo podemos hacer con p2, . . . , pk, que nos llevarana factores qk2 = p2, . . . , qkj

= pj . Si no hubiesemos obtenido ası todos los factores de la segundadescomposicion, podrıamos cancelar los factores comunes y quedarıa

1 = q′1 · · · q′`,

lo que es imposible. Por tanto, las dos factorizaciones coinciden, salvo quiza en el orden.

El lector habra obtenido ya anteriormente factorizaciones de numerosos ejemplos, por lo queno insistimos en este punto. Ademas, nada nuevo podemos anadir a lo que ya conoce: no hayun algoritmo general para factorizar numeros que sea realmente efectivo, por lo que seguiremosrecurriendo a la division por los primeros primos 2, 3, 5, etc., aliviada ligeramente si se aplicancriterios de divisibilidad (hablaremos de ellos mas adelante).

Dejamos como ejercicio la comprobacion de que la descomposicion en factores primos permiteobtener el maximo comun divisor y el mınimo comun multiplo de la forma ya sabida.Ejercicio. Sean a = pr11 · · · p

rkk , b = ps11 · · · p

skk las descomposiciones en factores primos distintos de

a y b, “arregladas” para que aparezcan los mismos factores tomando, si es necesario, exponentesnulos. Pongamos mj = mın{rj , sj}, Mj = max{rj , sj}. Demostrar que

mcd(a, b) = pm11 · · · p

mkk , mcm(a, b) = pM1

1 · · · pMkk ,

es decir, el maximo comun divisor de a y b se obtiene 〈〈multiplicando los factores primos comuneselevados al menor exponente〉〉, y el mınimo comun multiplo de a y b se obtiene 〈〈multiplicando losfactores primos comunes y no comunes elevados al mayor exponente〉〉.

Factorizacion con ordenador

Existen diferentes algoritmos para hallar los factores primos de un numero. Si el numero noes demasiado grande, se usa la “busqueda directa”, haciendo sucesivamente la division por losprimeros numeros primos, como lo hacemos sin ordenador.

Para numeros mas grandes, hay distintos algoritmos (ninguno de caracter ‘general’) que aprove-chan las caracterısticas especiales del numero que se intenta factorizar, usando Teorıa de Numerosavanzada. Hay mas informacion en [5].

En maple se obtienen los factores primos de un numero con las ordenes ifactor e ifactors,y en Mathematica , con FactorInteger o con FactorIntegerECM (requiere cargar el paquete‘FactorIntegerECM‘). Su sintaxis precisa y las diferentes opciones disponibles pueden consultarse enlos manuales o en la ayuda de los programas.

Como cabe suponer, tambien en este punto abundan en Internet applets de Java que realizanla factorizacion. Por ejemplo, en espanol, el ‘alpertron’ del argentino Darıo Alpern [4], descrito ası:

〈〈 Applet capaz de encontrar factores de 20 o 30 dıgitos de numeros o expresiones numericas dehasta 1000 dıgitos. Calcula ademas la cantidad y suma de los divisores, el indicador de Eulery la funcion Moebius del numero y su descomposicion como suma de hasta cuatro cuadradosperfectos. 〉〉

Lectura: Conjetura de Goldbach.Uno de los aspectos mas fascinantes de la Teorıa de Numeros —enteros— es que abunda en

problemas sencillos de enunciar que, sin embargo, son tremendamente difıciles de resolver, hastael punto de que algunos de ellos llevan planteados varios siglos y aun no han sido resueltos. Por


ejemplo, Christian Goldbach (1690–1764) envio en 1742 una carta a su amigo Euler, en la que, trascomprobar unos pocos casos particulares, afirmaba:

todo numero natural par distinto de 2 es suma de dos numeros primos.Todavıa no se sabe si esta afirmacion es cierta o falsa. Una excelente novela de Apostolos

Doxiadis, El tıo Petros y la conjetura deGoldbach, refleja (entre otras cosas) los esfuerzos paraprobarla. Y, para animar a quien tenga buenas ideas sobre esta cuestion, las editoriales de la novela,Bloomsbury Publishing Company (Estados Unidos) y Faber and Faber Limited (Gran Bretana),ofrecıan un premio de un millon de dolares a quien obtuviese una solucion antes de marzo de 2002.Creo que la oferta no ha sido renovada.

Lectura: Conjetura de Fermat/Teorema de Wiles.Quiza el problema mas famoso en este terreno es el llamado “ultimo teorema de Fermat”. Pierre

de Fermat, contemporaneo de Descartes y tan buen o mejor matematico que el, estudiaba hacia1637 un ejemplar de la edicion de G. C. Bachet de la Arithmetica de Diofanto, y tenıa por costumbreincluir comentarios propios en el margen del libro. En una pagina escribio:

Descomponer un cubo en suma de otros dos cubos, una cuarta potencia, o en general cualquierpotencia en suma de dos potencias del mismo orden mientras sea mayor al segundo, es imposible,y ciertamente he encontrado una demostracion magnıfica de esto, pero el margen es demasiadoestrecho para contenerla.

¿Era un farol? Algunas otras de sus afirmaciones contenıan las ideas de las demostraciones,todas ellas de gran originalidad. Lo cierto es que solo pudieron darse respuestas parciales paravalores particulares del exponente (hay abundantes referencias sobre ellas: una reciente, el capıtulo5 de [Casti]). En junio de 1993, el matematico ingles Andrew Wiles presento en una conferenciaen Cambridge la demostracion de un resultado —la conjetura de Shimura-Taniyama-Weil— queimplicarıa que la afirmacion de Fermat era cierta. La comunidad matematica vivio una etapa de‘suspense’ cuando se descubrio un fallo que Wiles no pudo solucionar hasta 1994, publicando juntocon Richard Taylor en 1995 un artıculo de mas de 130 paginas, que parece haber vencido finalmentetodas las dificultades.

El teorema de Fermat tambien ha sido fuente de inspiracion literaria: una novela de DenisGuedj, El teorema del loro, da un repaso a la historia de las matematicas mientras desarrolla unaintriga montada alrededor del loro de un hipotetico ‘demostrador’ del teorema.

Ejercicios

10.1. Demostrar que si n ≥ 2 y n no es primo, entonces debe existir un primo p tal que p|n yp2 ≤ n. ¿Que interes tiene este resultado en relacion con la criba de Eratostenes?

10.2. Demostrar que todo numero primo mayor que 3 es de la forma 6n+ 1 o 6n+ 5.

10.3. Demostrar que un entero de la forma 4n+ 3 admite un divisor primo de esa forma y deducirque existen infinitos numeros primos de la forma 4n+ 3.

10.4. Probar que cualquier numero primo p 6= 3 es de la forma 3q + 1 o 3q + 2 para algun enteroq. Probar que existen infinitos primos de la forma 3q + 2.

10.5. Si p es primo, probar que p divide al coeficiente binomico(p

k

), 1 ≤ k ≤ p− 1.

Encontrar un contraejemplo para el caso de que p no sea primo.

10.6. Sean p, a, n ∈ Z. Demostrar que si p es primo y n es positivo y se verifica que p|an, entoncesp|a y, por tanto, pn|an. ¿Vale tambien si p es compuesto?

http://www.apostolosdoxiadis.com/page

http://www.apostolosdoxiadis.com/page


10.7. Si mcd(a, b) = 1 y a2 − b2 es un cuadrado perfecto, probar que a + b y a − b son amboscuadrados perfectos o bien dobles de cuadrados perfectos.

10.8. ¿Cual es la relacion entre el numero de ceros en que termina la expresion decimal de unentero n y su descomposicion en factores primos?

10.9. Probar que si 2n− 1 es primo, entonces n es primo. (Los primos de la forma 2n− 1 se llamanprimos de Mersenne ; se conocen 35 primos ası.)

Sugerencia: ¿que sucede si n no es primo?

2.2.6. Congruencias. Aritmetica modular.

Volvemos sobre una importante relacion que habıamos introducido anteriormente.

Definicion 2.2.27. Fijado un entero m ≥ 2, dos numeros enteros a y b son congruentes modulom, a ≡ b (mod m), si m|(b− a).

Equivalentemente, a ≡ b (mod m) si y solo si a y b dan el mismo resto al dividirlos por m:pues si a = pm + r, b = qm + r, 0 ≤ r < m, resulta b − a = (q − p)m; y recıprocamente, sia ≡ b (mod m), para algun entero k es b − a = km, luego si a = pm + r, 0 ≤ r < m, entoncesb = a+ km = (p+ k)m+ r, 0 ≤ r < m, y ası r es igualmente el resto de dividir b por m (estamosusando la unicidad del resto en la division entera).

Proposicion 2.2.28. Para cada entero m ≥ 2, la relacion de congruencia es una relacion deequivalencia en Z.

Demostracion. Ya lo hemos probado en el capıtulo anterior.

Por consiguiente, fijado m, Z queda ‘partido’ en una coleccion disjunta de clases de equivalencia[a] = {b ∈ Z : a ≡ b (mod m)}, que se denominan clases de restos modulo m.

Si representamos en un sistema cartesiano larelacion de congruencia, es decir, el conjunto delos puntos (a, b) del retıculo Z × Z tales que a ≡b (mod m) para m = 3, por ejemplo, comprobamosque aparecen exactamente los puntos de coordena-das enteras que estan sobre las rectas de pendiente1 que cortan al eje OX en los valores enteros multi-plos de 3, o sea, sobre las rectas y = x+ 3n, n ∈ Z.

Para representar ‘horizontalmente’ la clase [a0]correspondiente a un a0 ∈ Z, aprovecharemos que,por simetrıa, [a0] = {x ∈ Z : x ≡ a (mod m)},y ası tenemos que buscar los puntos (x, a0), queaparecen sobre la recta y = a0 paralela al eje OX,distanciados consecutivamente en 3 unidades (verfigura anterior); sus proyecciones sobre el eje OXson los puntos x de la clase de equivalencia [a0](figura adjunta). Como se puede observar, hay tansolo tres clases distintas:

• las proyecciones de los puntos marcados con cua-drados (los multiplos de 3),

• las de los puntos marcados con cırculos (los an-teriores mas 1 unidad) y

• las de los puntos marcados con triangulos (losprimeros mas 2 unidades).


La situacion general es similar:

Proposicion 2.2.29. Para cada entero m ≥ 2, dado a ∈ Z, la clase de restos de a modulo m es

[a] = {a+mz : z ∈ Z} = a+mZ.

Demostracion. Evidentemente, si b = a + mz, z ∈ Z, es a ≡ b (mod m) por la definicion decongruencia. Y si a ≡ b (mod m), por lo mismo debe existir un z ∈ Z tal que b− a = mz, es decir,b = a+mz.

Definicion 2.2.30. Fijado m ≥ 2, el conjunto de las clases de restos modulo m se denota por Zmo Z/mZ.

Se trata, pues, del conjunto cociente de Z respecto de la relacion de congruencia modulo m.

Proposicion 2.2.31. Dado m ≥ 2,

Zm = {[0], [1], . . . , [m− 1]}.

Demostracion. Para cada a ∈ Z, [a] = [r] para uno y un solo entero r tal que 0 ≤ r < m: el restode la division entera de a por m, segun hemos comentado previamente.

Ademas del interes de las clases de restos en muchos usos de la vida cotidiana (la esfera delreloj, los meses, los dıas de la semana, los cuentakilometros de los coches) y de sus aplicacionesen cuestiones relacionadas con la divisibilidad, los conjuntos Zm son importantes porque puedendotarse de una estructura algebraica (de una suma y un producto). Esta estructura es suficiente-mente similar a la de Z como para que nos sintamos comodos operando en ella, y suficientementedistinta como para proporcionar ejemplos sencillos de situaciones insospechadas: fallos a veces enla propiedad cancelativa, con la existencia de ‘divisores de cero’, frente a la existencia, en otrasocasiones, de inverso para el producto como en Q, R y C.

La definicion de suma y producto de clases de restos es completamente natural: [a]+ [b], [a] · [b],‘deben ser’ [a + b], [a · b]. Pero un momento de reflexion basta para darse cuenta que necesitamosun ajuste previo. Si a′ es otro representante de [a] y b′ es otro representante de [b], de modo que[a] = [a′], [b] = [b′], ¿llegamos al mismo resultado que antes si tomamos [a′ + b′], [a′ · b′]? El objetivodel siguiente lema es comprobar que la respuesta es afirmativa.

Lema 2.2.32. Dado m ≥ 2, sean a ≡ a′ (mod m), b ≡ b′ (mod m). Entonces

a+ b ≡ a′ + b′ (mod m), ab ≡ a′b′ (mod m).

Demostracion. Que a ≡ a′ (mod m), b ≡ b′ (mod m), significa que existen p, q ∈ Z tales quea′ − a = pm, b′ − b = qm. En consecuencia

(a′ + b′)− (a+ b) = a′ − a+ b′ − b = (p− q)m,

y ası a+ b ≡ a′ + b′ (mod m).

Analogamente,a′b′ = (a+ pm)(b+ qm) = ab+ (aq + pb+ pqm)m,

de donde ab ≡ a′b′ (mod m).

Definicion 2.2.33. Dado m ≥ 2, sean [a], [b] ∈ Zm. Definimos [a] + [b] = [a+ b], [a] · [b] = [a · b]

Notemos que segun el lema previo, la aplicacion suma (respectivamente, producto) de Zm×Zmen Zm que hace corresponder a ([a], [b]) ∈ Zm×Zm la clase [a+ b] (respectivamente, [ab]) esta biendefinida.


Proposicion 2.2.34. Con la suma y el producto que acabamos de definir, Zm es un anillo conmu-tativo con unidad.

Demostracion. Que Zm es un anillo conmutativo con unidad significa que se cumple, cualesquieraque sean las clases [a], [b], [c] ∈ Zm,1. Propiedad asociativa de la suma. ([a] + [b]) + [c] = [a] + ([b] + [c]).

(Cierto: ambas son la clase [a+ b+ c].)2. Propiedad conmutativa de la suma. [a] + [b] = [b] + [a].

(Puesto que a+ b = b+ a.)3. Existencia de elemento neutro (cero) para la suma. Hay una clase, [0] concretamente,

tal que [0] + [a] = [a] + [0] = [a].(Puesto que 0 + a = a+ 0 = a.)

4. Existencia de elemento opuesto para la suma. para cada [a] ∈ Z hay una clase (y unasola), la clase [−a], tal que [−a] + [a] = [a] + [−a] = [0].(Evidente.)

5. Propiedad asociativa del producto. ([a] [b]) [c] = [a] ([b] [c]).(Ambas son la clase [abc].)

6. Propiedad conmutativa del producto. [a] [b] = [b] [a].(Inmediato.)

7. Existencia de elemento neutro (identidad) para el producto. Hay una clase, concreta-mente [1], tal que [1] · [a] = [a] · [1] = [a].(Inmediato.)

8. Propiedad distributiva del producto respecto de la suma. [a] ([b]+ [c]) = [a] [b]+ [a] [c].(Ambas son la clase [a(b+ c)] = [ab+ ac].)

Ejemplos. Veamos las tablas completas de sumar y multiplicar para m = 6 y m = 7 (en el interiorde la tabla, por comodidad, hemos representado las clases sin los corchetes [ , ].)

+ [0] [1] [2] [3] [4] [5][0] 0 1 2 3 4 5[1] 1 2 3 4 5 0[2] 2 3 4 5 0 1[3] 3 4 5 0 1 2[4] 4 5 0 1 2 3[5] 5 0 1 2 3 4

Suma yproductomodulo 6

× [0] [1] [2] [3] [4] [5][0] 0 0 0 0 0 0[1] 0 1 2 3 4 5[2] 0 2 4 0 2 4[3] 0 3 0 3 0 3[4] 0 4 2 0 4 2[5] 0 5 4 3 2 1

+ [0] [1] [2] [3] [4] [5] [6][0] 0 1 2 3 4 5 6[1] 1 2 3 4 5 6 0[2] 2 3 4 5 6 0 1[3] 3 4 5 6 0 1 2[4] 4 5 6 0 1 2 3[5] 5 6 0 1 2 3 4[6] 6 0 1 2 3 4 5

Suma yproductomodulo 7

× [0] [1] [2] [3] [4] [5] [6][0] 0 0 0 0 0 0 0[1] 0 1 2 3 4 5 6[2] 0 2 4 6 1 3 5[3] 0 3 6 2 5 1 4[4] 0 4 1 5 2 6 3[5] 0 5 3 1 6 4 2[6] 0 6 5 4 3 2 1

Se observara que entre las tablas de sumar hay bastantes analogıas: son simetricas respecto ala diagonal principal, por ejemplo (¿debido a que?), y en cada fila y cada columna aparece unapermutacion de Zm (estan todas las clases sin excepcion, una sola vez, en ordenaciones diferentes:¿hay alguna causa?). En las tablas de multiplicar hay mayores discrepancias, e incluso “fenomenosextranos”. Descontando la anomalıa que siempre introduce el [0] en la multiplicacion, la tablade multiplicacion modulo 7 mantiene las caracterısticas anteriores; por el contrario, en Z6 hay


“aberraciones” tales como que el producto de dos clases no nulas, [2] por [3] y otras, ¡es la clasenula! Sin embargo, la multiplicacion por [5] produce una permutacion en Z6 como en la suma, eincluso “tiene inversa”, la propia clase [5], de modo que [5]2 = [1] (lo cual es menos chocante si sepiensa que [5] = [−1]).

La explicacion de estos hechos esta en los resultados que vienen a continuacion.

Lema 2.2.35. Sean a, b, m enteros y m ≥ 2. Si d = mcd(a,m), entonces la congruencia lineal

ax ≡ b (mod m) (Ξ)

tiene solucion si, y solo si, d|b.Cuando d divida a b, si x0 es una solucion, la solucion general viene dada por

x = x0 + (m/d)n, n ∈ Z

En particular, las soluciones forman, exactamente, d clases de restos modulo m, con representantes

x0, x0 + (m/d), x0 + 2(m/d), . . . , x0 + (d− 1)(m/d).

Demostracion. Un x ∈ Z es solucion de la ecuacion (Ξ) si y solo si m divide a b− ax, lo cual a suvez equivale a que exista un y ∈ Z tal que b−ax = my, o sea, ax+my = b : en otras palabras, x essolucion de (Ξ) si y solo si es solucion (junto con algun y) de la ecuacion diofantica ax+my = b.Como ya sabemos, existe tal solucion si y solo si d = mcd(a,m)|b, y si hay solucion, las infinitassoluciones se deducen de una de ellas x0 (con su pareja y0) a traves de las formulas x = x0+(m/d)n(con y = y0 − (a/d)n), n ∈ Z.

La unica novedad en el enunciado es, por tanto, la afirmacion final. Para probarla, observemosprimero que cada numero x0 + k(m/d), 0 ≤ k ≤ d − 1 esta en una clase de restos distinta, puesx0 + j(m/d) ≡ x0 + k(m/d) (mod m) con 0 ≤ j < k ≤ d− 1 implicarıa que m|(k− j)(m/d), siendo0 ≤ (k − j)(m/d) ≤ k(m/d) < m, lo cual es imposible.

Por ultimo, dada una solucion cualquiera x = x0 + (m/d)n, n ∈ Z, dividiendo n por d resultan = qd+ r, q ∈ Z, 0 ≤ r ≤ d− 1, y ası x0 + (m/d)n = x0 + qm+ r(m/d) ≡ x0 + r(m/d) (mod m).

Corolario 2.2.36. Sean a, b, m enteros y m ≥ 2. Si a y m son relativamente primos, entonces lacongruencia lineal

ax ≡ b (mod m) (Ξ)

tiene una y una sola solucion modulo m.

Demostracion. Basta aplicar el lema anterior teniendo en cuenta que, por hipotesis, mcd(a,m) = 1.

Corolario 2.2.37. Sean a, m enteros y m ≥ 2. La congruencia

ax ≡ 1 (mod m)

tiene solucion si, y solo si, mcd(a,m) = 1, en cuyo caso, hay una sola solucion modulo m.

Formulando los resultados anteriores dentro de Zm, encontramos las causas de los fenomenosobservados en las tablas de multiplicar en Z6 y Z7.

Corolario 2.2.38. Sean a, b, m enteros y m ≥ 2. Si d = mcd(a,m), entonces la ecuacion en Zm

[a] · x = [b]

tiene solucion x en Zm si, y solo si, d|b.Cuando d divida a b, hay exactamente d soluciones distintas en Zm, y si x0 ∈ Zm es una de

ellas, dichas soluciones son

x0,x0 + [(m/d)],x0 + [2(m/d)], . . . ,x0 + [(d− 1)(m/d)].


Demostracion. Es otra forma de enunciar el lema 2.2.35.

Corolario 2.2.39. Sean a y m enteros relativamente primos, y m ≥ 2. Entonces la aplicacionM : Zm → Zm dada por M(x) = [a] · x (la multiplicacion por [a]) es una biyeccion.

Demostracion. Segun el corolario anterior, para cada [b] ∈ Zm existe un x ∈ Zm y uno solo tal que[a] · x = [b], es decir, tal que M(x) = [b], y por tanto M es biyectiva.

Esto explica las ‘permutaciones’. Los ceros ‘anomalos’ provienen de lo siguiente:

Corolario 2.2.40. Sean a y m enteros tales que m ≥ 2 y [a] 6= [0] en Zm. Si d = mcd(a,m) ≥ 2,existe x ∈ Zm \ {[0]} tal que

[a] · x = [0].

(Decimos entonces que [a] y x son divisores de cero en Zm: su producto es nulo, pese a queambos son distintos de cero.)

Demostracion. Tomando b = 0 y x0 = [0] en el corolario 2.2.38, vemos que la ecuacion

[a] · x = [0]

tiene d− 1 (≥ 1) soluciones distintas de x0 = [0], que son

[(m/d)], [2(m/d)], . . . , [(d− 1)(m/d)].

Si en un anillo con unidad A todo elemento no nulo tiene inverso (o sea, hay un elemento quemultiplicado por el da la unidad), se dice que A es un cuerpo.

Teorema 2.2.41. Sea m un entero mayor o igual que 2. Entonces Zm es un cuerpo si y solo sim es primo.

Demostracion. Que una clase [a] 6= [0] tenga inverso quiere decir que existe x ∈ Zm tal que[a] · x = [1].

Pero si m es primo, como m 6 | a ya que [a] 6= [0], se sigue que mcd(a,m) = 1 y la ecuacion[a] · x = [1] tiene solucion Zm (unica, ademas).

En cambio, si m es compuesto, m = ab con 1 < a < m, 1 < b < m, por lo cual tiene que ser[a] 6= [0] 6= [b]; y sin embargo [a] no tiene inverso, pues mcd(a,m) = a 6= 1 (mas todavıa: [a] y [b]son divisores de cero, ya que [a][b] = [0], aunque [a] y [b] sean los dos distintos de [0], y esto esimposible cuando [a] tiene inverso).

Nota. En los anillos de matrices tambien se encuentran divisores de cero. Por ejemplo, si A =(1 01 0

), B =

(0 01 1

), AB =

(0 00 0

)sin que ninguno de los factores se anule.

Resolucion de ecuaciones en congruencias con ordenador

En maple se dispone de msolve(eqns,m), donde eqns es una ecuacion (no necesariamentetan sencilla como las que hemos estudiado) o un conjunto de ecuaciones. La respuesta es una listade valores enteros no negativos, cada uno en una clase de restos modulo m, que dan 〈〈 todas lassoluciones modulo m〉〉 de la ecuacion. Ejemplo:

msolve(8*x=20,12);{x = 1}, {x = 4}, {x = 7}, {x = 10}


En Mathematica habıamos encontrado ya la orden Solve[a*x==c && Modulus==b,x], cuyarespuesta (ahora lo vemos) es similar a la de maple . Ejemplo:

In[1]:=Solve[8 x == 20 && Modulus == 12, x ]

Out[1]={{Modulus -> 12, x -> 1}, {Modulus -> 12, x -> 4},{Modulus -> 12, x -> 7}, {Modulus -> 12, x -> 10}}

APLICACIONES

Criterios de divisibilidad.Algunas aplicaciones de las congruencias nos son familiares desde bastantes anos atras.〈〈 Un numero es divisible por 2 cuando termina en 0 o cifra par. 〉〉

〈〈 Un numero es divisible por 5 cuando termina en 0 o en 5. 〉〉

¿Suena conocido?〈〈 Un numero es divisible por 3 cuando la suma de sus cifras es multiplo de 3. 〉〉

〈〈 Un numero es divisible por 9 cuando la suma de sus cifras es multiplo de 9. 〉〉

La razon de estas reglas es ahora muy evidente. Partimos de un numero N escrito cncn−1 . . . c1c0en base decimal, de manera que

N = c0 + c1 · 10 + · · ·+ cn−1 · 10n−1 + cn · 10n, cn 6= 0.

Que sea divisible por m equivale a que sea congruente con 0 (mod m). Observando que

10 ≡ 0, 102 ≡ 0, . . . , 10n ≡ 0, . . . (mod 2),10 ≡ 0, 102 ≡ 0, . . . , 10n ≡ 0, . . . (mod 5),10 ≡ 1, 102 ≡ 1, . . . , 10n ≡ 1, . . . (mod 3),10 ≡ 1, 102 ≡ 1, . . . , 10n ≡ 1, . . . (mod 9),

se deduce

N ≡ c0 (mod 2), N ≡ c0 (mod 5), N ≡ c0+c1+c2+· · · (mod 3), N ≡ c0+c1+c2+· · · (mod 9),

y de aquı los criterios de divisibilidad que hemos recordado.Tambien se justifica ası la olvidada “prueba del nueve” para la division: al efectuar ‘a mano’

la division entera entre numeros grandes a y b, es facil cometer errores tanto de calculo comode escritura. Una prueba comoda (¡aunque no infalible!) para detectarlos, si hemos obtenido uncociente c y un resto r, consiste en trazar un aspa como en la figura, y poner en a′ el resultadode sumar las cifras de a. Si esta es mayor que 9, sustituimos a′ por la suma de sus cifras, y sies 9 ponemos un cero; repitiendo este proceso si es necesario, llegaremos en unos cuantos pasosa un valor menor que 9 que pondremos en la casilla de a′ (el valor final es, obviamente, el uniconumero entre 0 y 8 congruente con a modulo 9; por ejemplo, para a = 87462371, irıamos obteniendo8+7+4+6+2+3+7+1 = 38, 3+8 = 11, 1+1 = 2 —o mas facil, 8+7+4+6+2+3+7+1 =(8 + 1) + (7 + 2) + 4 + (6 + 3) + 7 ≡ 4 + 7 = 11).

��

�

@@

@a′ (c′b′ + r)′c′

b′

r c

a bCon el mismo metodo de ‘reduccion’ sumando cifras, ponemos enb′ el unico numero entre 0 y 8 congruente con a modulo 9, en c′ el‘reducido’ de c. Multiplicamos c′ por b′, ‘reducimos’ el resultado,y lo sumamos con las cifras de r prosiguiendo la reduccion; la cifraque se obtenga al final debe coincidir con a′. Si no es ası, hay unerror con toda seguridad; pero si coinciden, podrıa haber todavıaun error, aunque sea ‘un poco menos probable’.


La razon: lo que se comprueba en el proceso anterior es si de a ≡ a′, b ≡ b′, c ≡ c′ (mod 9),y a = cb + r, se sigue a′ ≡ c′b′ + r (mod 9). Si no es ası, por supuesto debe haber un erroren los numeros, porque de la igualdad se sigue la equivalencia; pero si se da la equivalencia, noesta garantizada la correccion del resultado.

��

�

@@

@3 4

6

8¡MAL!

424

�� 128617526 431

42

��

�

@@

@3 3

6

8¿BIEN?

�� 324

�� 128617526 431

42

��

�

@@

@3 3

4

8REVISADA

286286

17526 43140

Ejercicio. Probar que un numero es divisible por 11 si y solo si la suma de las cifras de lugar parmenos la suma de las cifras de lugar impar es multiplo de 11.

Sugerencia: 10 ≡ −1 (mod 11).

Ejercicio. Probar que un numero es divisible por 25 si y solo si termina en 00, 25, 50 o 75.

Ejercicio. ¿Por que nunca se enuncia un criterio sencillo de divisibilidad por 7, similar a los quehemos considerado? (No obstante, ver [6].)

Dıgitos de control. Las congruencias inciden en nuestra vida diaria de forma invisible, peroconstante, y en las situaciones mas insospechadas. Ası lo explica el prof. M. Gasca ([G]):

〈〈 Se dice que estamos en la Era de la Informacion. Veamos algunas de las cuestiones surgidas entorno a ella y que en el fondo son problemas matematicos mas o menos intrincados. Se usanmucho los codigos de barras para identificar un producto. Se trata de barras blancas y negrasque al ser leıdas rapidamente por laser se traducen en ceros y unos, sistema binario, que asu vez se traducen a numeracion decimal. En el caso del Codigo Universal de Productos, elmas frecuente, son unos 12 dıgitos decimales, de los que uno advierte del grupo de productosde que se trata, el grupo siguiente identifica al fabricante, otro grupo da idea del productoconcreto, a veces de su tamano, etc., y el ultimo dıgito es de control.

Si han observado los numeros de sus cuentas bancarias de 20 dıgitos, los 4 primeros son laentidad, 4 para la Agencia, 2 de control y luego 10 para su cuenta personal. Observaran queen ambos casos hablamos de dıgitos de control. Es muy facil al transmitir tantos numerosbailar su orden o confundir una cifra. Mediante un algoritmo matematico muy simple elordenador detecta el error. Se entendera mejor con el NIF. Hacienda tenıa graves problemascon la gente que daba, intencionadamente, un numero erroneo de DNI, sin poder demostrar laintencionalidad del error. Un algoritmo muy simple asigna a cada numero de DNI una letra,dando lugar al NIF. Para ello, Hacienda selecciono 23 letras del alfabeto eliminando i, n, o yu por causar confusiones, y les asigno un numero aleatorio entre 0 y 22: la A tiene el 3, la Wel 2, etc. Dividiendo el numero del DNI entre 23, prescindiendo de decimales en el cocientey volviendo a multiplicar por 23, se obtiene un numero igual o menor que el del DNI. Ladiferencia entre el DNI y ese nuevo numero es el que decide la letra. Si ahora Vd. cambiaraalgo en su numero de DNI, como bailar dos dıgitos, es sumamente probable que la letra finalno saldrıa la misma y el ordenador avisara del error. Entendiendo el proceso serıa facilısimocambiar el numero y a la vez cambiar la letra para que concuerden y el ordenador no detecteel error, pero si posteriormente se descubre, ya hay manifiesta mala fe.

En el caso de la cuenta bancaria, los dıgitos son 2 porque se usa uno para el grupo de cifrasBanco-Agencia y otro para el numero de la cuenta. 〉〉

Por supuesto, podemos anadir otros ejemplos (ver [C-C-S], pp. 46 y ss.):


• ISBN

El ISBN es el International Standard Book Number, el NIF de los libros podrıamos decir. Es uncodigo que se asigna a cada publicacion que lo solicita, que permite identificarla rapidamente.Consiste en 9 dıgitos, seguidos de un decimo sımbolo que puede ser otro dıgito (de 0 a 9) ouna X. Los nueve primeros dıgitos dan la informacion del libro, como el ano y el lugar depublicacion, y el sımbolo final es de control. Si el ISBN de un libro es a1a2 . . . a9b, se elige bde manera que a1 +2a2 + · · ·+9a9 ≡ b (mod 11), correspondiendo X al resto 10. En este casohay posibilidad de corregir pequenos errores: si en el n-esimo sımbolo hay un error de +1 o−1, entonces a1 + 2a2 + · · ·+ 9a9 + 10b (mod 11) es igual a +n o −n, respectivamente.

• Musica digitalizada

En los CD’s, la musica se almacena codificada en listas de ceros y unos. Usando un rayolaser, el lector de CD’s lee la informacion del disco y la convierte en la senal que terminatransformada en sonido en los altavoces. Hay muchas causas que pueden originar errores delectura: rayas, suciedad o polvo en la superficie del disco, el rayo laser deja de apuntar allugar adecuado, etc. El almacenamiento de la informacion ha de hacerse de manera que ellector pueda detectar y corregir esos errores.

• Comunicaciones

En todos los canales de comunicacion hay que contar con el ‘ruido’, alteraciones de todo tipoque hacen que la senal recibida no sea igual que la emitida: transmisiones de television otelefonıa por satelite, lıneas de telefono, fax, e-mails, television, etc. mediante cable,. . .

Para crear codigos que permitan corregir errores, se han utilizado ¡espacios vectoriales sobrecuerpos Zp! (ver Los codigos correctores, de G. Lachaud-S. Vladut y La doble correccion,de C. Berrou y cols., en [MC1]).

En [COMAP], pp. 586 y ss., pueden verse tambien algunos detalles sobre correccion de erroresy compresion de datos.

El pequeno teorema de Fermat

Otra aplicacion importante de las congruencias es que ciertos resultados permiten responderafirmativamente a la pregunta: ¿es posible probar que un numero no es primo sin conocer susfactores? Veamos como (criterios de primalidad).

Teorema 2.2.42 (El pequeno teorema de Fermat). Dado un numero primo p, sea a ∈ N talque p no divide a a. Entonces ap−1 ≡ 1 (mod p).

Demostracion. Aplicando el corolario 2.2.39,Zp = {[0], [1], . . . , [p− 1]} = {[0 · a], [1 · a], . . . , [(p− 1) · a]}.Por tanto

0 6≡ 1 · 2 · · · (p− 1) ≡ a · 2a · · · (p− 1)a ≡ 1 · 2 · · · (p− 1)ap−1 (mod p)

y cancelando 1 ≡ ap−1 (mod p).

Corolario 2.2.43. Dado un numero primo p, para cualquier a ∈ N es ap ≡ a (mod p).

Demostracion. Si p|a, ap ≡ 0 ≡ a (mod p). En caso contrario, basta multiplicar por a ambosterminos de la equivalencia ap−1 ≡ 1 (mod p).

Por tanto, si encontramos valores de a para los que no se cumplen las equivalencias anteriores,p NO podra ser primo.


Ejemplos.

1. 63 no es primo: si lo fuera, 262 ≡ 1 (mod 63), y sin embargo

262 = 260 · 22 = (26)10 · 22 = (64)10 · 22 ≡ 4 (mod 63).

2. 341 no es primo: si lo fuese, como 73 = 343 ≡ 2 (mod 341) y 210 = 1024 ≡ 1 (mod 341), severificarıa 7340 = 73·113+1 ≡ 2113 7 ≡ 2110+3 7 ≡ 8 ·7 ≡ 56 (mod 341). Como 56 6≡ 1 (mod 341),341 no puede ser primo.

Ver comentarios en [D’A-W], p. 114.

La congruencia de Fermat tambien sirve, obviamente, para hallar restos.Ejemplo. Como 31 es primo, 1130 ≡ 1 (mod 31), y ası

11902 = 1130·30+2 = (1130)30 · 112 ≡ 130 · 112 ≡ 121 ≡ 28 (mod 31).Criptografıa.El pequeno teorema de Fermat, o sus generalizaciones como el teorema de Euler, estan en la basede algunos sistemas modernos de criptografıa.

〈〈 ¿Como transmitir mensajes secretos asegurandose que no seran comprendidos por un eventualenemigo? Tal es el objetivo de la criptografıa. En principio, el mensaje a transmitir tiene quecodificarse previamente por medio de una clave que el emisor y el receptor mantienen ensecreto. En general, esta clave puede ser facilmente 〈〈 invertida〉〉, por lo que sirve tanto paracifrar el mensaje inicial como para descifrar el mensaje cifrado. En tal caso, que es el clasico, elemisor y el receptor comparten un mismo secreto, la clave que sirve para cifrar y descifrar. Elprincipio de la criptografıa de clave publica, inventado en 1976 por Whitfield Diffie y MartinHellman, de la Universidad de Stanford, es muy distinto. El metodo supone que la clave delcifrado no puede ser facilmente invertida para hallar la clave del desciframiento. La primerapuede ser publica, mientras que solo el receptor puede conocer la segunda. La seguridad esentonces mucho mayor. Supongamos que Alicia quiere enviar a Bernardo un mensaje secretopor medio de una clave publica. En tal caso, Bernardo tiene que comunicar a Alicia unaclave de cifrado que puede ser conocida por todo el mundo (es la clave publica). Alicia lautiliza para cifrar su mensaje, que luego envıa a Bernardo. Para descifrar el mensaje en clave,Bernardo utiliza su clave privada, que es el unico en conocer.

El sistema de cifrado de clave publica mas conocido y utilizado es probablemente el siste-ma RSA, inventado en 1978 por Ronald Rivest, Adi Shamir y Leonard Adelman, del MIT(Massachusetts Institute of Technology, Estados Unidos). 〉〉

[· · · ]〈〈Desde aproximadamente 1980, es bastante facil averiguar si un numero, aunque sea muygrande, es o no primo. En cambio, es mucho mas difıcil descomponer un numero grande enfactores primos. En esta diferencia de dificultad se basan precisamente los modernos metodosde criptografıa. Muy esquematicamente, la idea consiste en construir la clave del cifrado(no secreta) por medio de un numero N producto p × q de dos numeros primos grandes.El desciframiento, en cambio, requiere el conocimiento de p y q por separado, unos valoresque solo se comunican a las personas autorizadas. Para descifrar un mensaje en clave, unespıa tendrıa que encontrar, conociendo N , sus dos factores primos p y q. Ahora bien, paraN lo bastante grande (digamos que del orden de 150 cifras) y convenientemente elegido, esimposible realizar esta operacion inversa en un tiempo aceptable. 〉〉

[· · · ]〈〈La importancia de la teorıa de numeros en criptografıa es tal que los matematicos se venconfrontados a problemas deontologicos. Por ejemplo, si uno de ellos descubre un metodo de


factorizacion numerica mucho mas eficaz que los precedentes, ¿que debe hacer? ¿Comunicarloal primer ministro, exponerlo publicamente en una conferencia internacional para que nadiepueda aprovecharse de el a expensas de otros o venderlo al mejor postor? Afortunadamen-te, hasta donde se sabe, las mejoras encontradas por los matematicos no son lo bastanterevolucionarias como para que el problema se plantee en toda su acuidad. 〉〉

(fragmentos del artıculo La intriga de los numeros primos, de Henri Cohen, publicado en [MC1].)En [C-C-S], pp. 15–16, se da la siguiente descripcion simplificada, a modo de receta culinaria,

del sistema RSA.ingredientes necesarios:

dos numeros primos p y q

un numero de codificacion v y otro de descodificacion w tales que

vw ≡ 1 (mod (p− 1)(q − 1)).

Los primos p y q y el numero de descodificacion w son secretos. El numero de codificacion vy el modulo m = p · q no hace falta que sean secretos, pueden ser publicos.

Codificar un numero x transformandolo en otro y mediante

y ≡ xv (mod m).

Descodificar y recuperando x mediante

x ≡ yw (mod m).

¿Que justifica la ultima afirmacion? Se supone que p y q son muy grandes, y que x es menor queellos. Por eso (xq−1)p−1 ≡ 1 (mod p), (xp−1)q−1 ≡ 1 (mod q), de donde x(p−1)(q−1) ≡ 1 (mod pq)(¿por que?), y ası

yw ≡ xvw ≡ xa(p−1)(q−1)+1 ≡ (x(p−1)(q−1))a · x ≡ x (mod m).

Ver otra descripcion ‘aproximada’ en [COMAP], pp. 580–584. Para mayor precision, consultaren la direccion [1] los apuntes de Fco. Javier Cobos Gavala, Universidad de Sevilla.

Ejercicios

11.1. A lo largo del texto se ha usado que para todo n ∈ N, de a ≡ b (mod m) se sigue an ≡bn (mod m). Demostrarlo.

11.2. Demostrar, utilizando congruencias, que si un numero entero es a la vez un cuadrado y uncubo, entonces se puede escribir en la forma 7k o 7k + 1.

11.3. Probar que las seis primeras potencias de 10 pertenecen a distintas clases de congruenciasmodulo 7. (Comentario: Gauss pregunto si las potencias de 10 dan n − 1 clases de congruenciasdistintas modulo n para infinitos n; la pregunta sigue sin contestar. Los modulos 5 y 13 fallan, apesar incluso de que son primos.)

11.4. Sea k un numero impar. Probar que k2 ≡ 1 (mod 8).

11.5. ¿Hay algun cuadrado perfecto (entero de la forma k2, k ∈ Z), que sea congruente con 2modulo 3? ¿Por que?

11.6. Si x2 + y2 = z2, demostrar:

(i) al menos uno de los valores x, y o z es divisible por 3;


(ii) xyz es un multiplo de 4;

(iii) al menos uno de los valores x, y o z es divisible por 5;

(iv) xyz es un multiplo de 60.

(Los enteros x, y, z que cumplen la ecuacion dada se llaman, por razones obvias, ternas pitagori-cas.)

11.7. Dado un entero n ≥ 2, probar que en cada clase de restos modulo n hay exactamente unentero r que cumple −n/2 < r ≤ n/2.

(Estos numeros se llaman menores restos absolutos modulo n; cuando n es impar, son 0,±1, ±2, . . . , ±(n− 1)/2; cuando n es par, 0, ±1, ±2, . . . , ±(n− 2)/2, n/2.)

11.8. Usando el problema anterior, hallar el menor resto no negativo de 28× 33 (mod 35).

11.9. Decimos que k es un cuadrado modulo n si k ≡ j2 (mod n) para algun j. Supongamos quen = m2 + 1 para algun m ∈ N. Probar que si k es un cuadrado modulo n, tambien −k es uncuadrado modulo n.

11.10. Si p es un primo, probar por induccion en n que np ≡ n (mod p). Deducir el pequenoteorema de Fermat.

11.11. Calcular 132231 (mod 7), 246218 (mod 11), 145197 (mod 13).

11.12. Hallar los inversos de 13 en Z21 y Z31.

11.13. Hallar los inversos de 4 y 12 en Z19.

Bibliografıa

[Casti] J. L. Casti: Mathematical Mountaintops: The Five Most Famous Problems of All Time.Oxford U. P., 2001.

[C-C-S] Cohen, A. M.; Cuypers, H.; Sterk, H.: Algebra Interactive! (Learning algebra in anexciting way). Springer, Berlin, 1999.

Version on line:

http://www.win.tue.nl/~ida/home.html

[COMAP] COMAP: Principles and Practice of Mathematics. Springer, New York, 1997.


[Ddk] Dedekind, R.: ¿Que son y para que sirven los numeros?. (edicion e introduccion de J.Ferreiros) Alianza Editorial, Madrid, 1998.


[G] Gasca, M.: Las Matematicas en la vida del ano 2000, Monografıas de la Academia deCiencias de Zaragoza 19 (37–44) 1996.




[MC1] Mundo Cientıfico: El universo de los numeros: Matematicas para interpretar el mundo.Extra num. 1, s.f..

[Peano] Peano, G.: Arithmetices principia nova methodo exposita. Bocca, Romæ-Florentiæ, 1889..


Un libro de problemas resueltos muy interesante con muchos ejercicios accesibles, pero queen buena parte requiere un mayor conocimiento en Teorıa de Numeros, es

[Si] Sierpinski, W.: 250 Problems in Elementary Number Theory. Elsevier, New York; PWN,Warszawa, 1970.

87

http://www.win.tue.nl/~ida/home.html

88 BIBLIOGRAFIA


[1] F. J. Cobos: Curso de Introduccion a la Matematica Discreta. Universidad de Sevilla,2002-2003.

http://ma1.eii.us.es/Docencia/apuntes/ap imd.PDF

[2] Axiomas de Peano.

http://www.unizar.es/analisis matematico/numyconj/axpeano.pdf

[3] Fundamentos de la aritmetica, The Oxford Companion to Philosophy.

http://www.xrefer.com/entry/551320

[4] D. Alpern, Factorizacion usando curvas elıpticas.

http://www.alpertron.com.ar/ECMC.HTM

[5] MathWorld, Prime Factorization Algorithms.

http://mathworld.wolfram.com/PrimeFactorizationAlgorithms.html

[6] Can it divide?, criterios de divisibilidad por veintidos numeros.

http://www.geocities.com/krishnakoradas/lesson11.htm

http://ma1.eii.us.es/Docencia/apuntes/ap_imd.PDF

http://www.unizar.es/analisis_matematico/numyconj/axpeano.pdf

http://www.xrefer.com/entry/551320

http://www.alpertron.com.ar/ECMC.HTM

http://mathworld.wolfram.com/PrimeFactorizationAlgorithms.html

http://www.geocities.com/krishnakoradas/lesson11.htm

Capıtulo 3

Numeros racionales. Polinomios.

Sobre los numeros racionales y su construccion seguimos fundamentalmente el texto [D’A-W].Sobre polinomios, ver [Pest] y [GJPR]. Si bien [D-H] trata en detalle los polinomios, lo hace a unnivel mas elevado del que corresponde a este curso.

En cada momento daremos las referencias complementarias que sean pertinentes.

3.1. Numeros racionales.

La idea y el manejo de los numeros racionales, y mas concretamente de las fracciones, nos es so-bradamente familiar. Lo que pretendemos ahora es reflexionar sobre el significado de las fraccionesapoyados en la base conjuntista que poseemos actualmente, explicando el sentido de las manipu-laciones que hemos aprendido ‘por decreto’ y sentando las bases para construcciones similares encontextos mas generales, que se utilizaran en otras asignaturas.

3.1.1. Insuficiencia de Z. Fracciones.

Consideremos los dos problemas siguientes:(a) Hay que repartir veinte abrigos equitativamente, en igual numero, entre seis familias.

¿Cuantos hay que dar a cada una?(b) Se dividen veinte metros de tela a partes iguales entre seis sastres. ¿Cuanta tela tendra cada

uno?Ambos problemas se traducen matematicamente en:

‘Hallar x tal que 6x = 20’.¿Vale para ambos la misma respuesta? Evidentemente, no. En el primer caso, daremos tres

abrigos a cada familia (y sobraran dos, no hay ‘solucion exacta’); en el segundo, no podemos expresarla respuesta satisfactoriamente con valores enteros, Z resulta insuficiente en estas y otras situacionesen las que hay que resolver exactamente ecuaciones de la forma ax = b, a 6= 0. Lo que hacemoses ‘sacar de la nada’ una solucion, la ‘fraccion’ que representamos por 〈〈b/a〉〉. Para otra ecuaciona′y = b′ tendrıamos la solucion y = b′/a′. ¿Habra, pues, tantas soluciones distintas como ecuacionesdistintas? Volviendo sobre el ejemplo de la tela, la experiencia nos dice que si se repartieran diezmetros entre solo tres sastres, cada uno recibirıa la misma cantidad que antes, y lo mismo sucederıarepartiendo treinta metros entre nueve, etc. Para reflejar fielmente esta situacion, habra que ‘igualar’soluciones identicas aunque provengan de ecuaciones distintas. ¿Bajo que criterio? Si los nuevosentes van a comportarse de manera coherente con los viejos numeros enteros, como x = b/a significaque ax = b e y = b′/a′ significa a′y = b′, tambien serıa a′ax = a′b, aa′y = ab′, y ası x = y debecorresponderse justamente con ba′ = b′a. Llamamos fracciones equivalentes a las que verifican estarelacion, y decimos que definen el mismo numero racional.

¿Que estamos haciendo, desde nuestra perspectiva actual? Descorriendo todos los velos, en estoqueda el misterio de las fracciones: tomamos pares ordenados (m,n) ∈ Z× (Z\{0}) y establecemos

89

90 CAPITULO 3. NUMEROS RACIONALES. POLINOMIOS.

una ‘equivalencia’: (m,n) ∼ (p, q) si mq = np; si es una verdadera relacion de equivalencia, laidentificacion posterior no supone otra cosa que el paso a las clases de equivalencia (un numeroracional = una clase de equivalencia de fracciones) y al conjunto cociente (este serıa Q).

La manera de operar con los nuevos objetos esta completamente determinada si no queremosromper nuestras comodas leyes. Para sumar fracciones, recurrimos al ‘arreglo’ anterior: x = b/a,y = b′/a′ lleva a a′ax = a′b, aa′y = ab′, y esto fuerza que aa′(x + y) = a′b + b′a, es decir,x+ y = (ba′ + b′a)/(aa′). El producto es mas directo: de ax = b y a′y = b′ se pasa, multiplicando,a aa′xy = bb′, que deja xy = bb′/aa′.

¿“Pasan” estas operaciones a las clases de equivalencia, como sucedıa en el caso de las congruen-cias? Habra que comprobar, igual que entonces, que sumando fracciones equivalentes se obtienensumas equivalentes, y que multiplicando fracciones equivalentes se obtienen productos equivalentes.Enseguida nos ocuparemos de ello.

Para complementar esta vision ‘algebraica’ de los numeros racionales, puede verse una inter-pretacion geometrica como pendientes de rectas, en [D’A-W] pp. 123–124 o en [GJPR] p. 127, porejemplo.

3.1.2. Construccion de Q

Formalicemos las consideraciones anteriores.

Lema 3.1.1. Sea F = Z× (Z \ {0}), y ∼ la relacion en F dada por(m,n) ∼ (p, q) cuando y solo cuando mq = pn.

Entonces ∼ es una relacion de equivalencia en F .

Demostracion. La relacion ∼ es:

Reflexiva, pues (m,n) ∼ (m,n) cualquiera que sea (m,n) ∈ F , ya que trivialmente mn = mn

Simetrica, siempre que (m,n) ∼ (p, q) resulta (p, q) ∼ (m,n) porque lo primero significa quemq = pn y lo segundo que pn = mq.

Transitiva, de (m,n) ∼ (p, q) y (p, q) ∼ (r, s) se sigue (m,n) ∼ (r, s), porque si mq = pn yps = rq, tambien mqps = pnrq. Si p 6= 0, como q 6= 0, cancelando pq ya queda ms = nr;mientras que si p = 0, forzosamente m = 0 y r = 0, y en este caso ms = 0 = nr.

A los elementos de F los denominaremos fracciones.

Definicion 3.1.2. El conjunto de los numeros racionales es el conjunto cociente Q = F/ ∼.Sus elementos, los numeros racionales, son por tanto las clases de equivalencia [(m,n)].

Nota. Evitando arrastrar las poco intuitivas notaciones (m,n) para lo que siempre hemos escritom

no m/n, y [(m,n)] para lo que estamos acostumbrados a representar igualmente por

m

no m/n, de

aquı en adelante volvemos a la notacion clasica. No obstante, no hay que perder de vista entoncesque tenemos una misma notacion para dos objetos distintos: la fraccion (m,n) y el numero racional[(m,n)] del cual la fraccion anterior es un representante. En cualquier caso, lo que no ha originadoconfusion hasta ahora no deberıa causarla tampoco de ahora en adelante.

Cuando sea necesario, indicaremos explıcitamente si nos estamos refiriendo a una fraccion o aun numero racional. Por ejemplo:

Definicion 3.1.3. Una fraccion m/n se dice irreducible si n > 0 y mcd(m,n) = 1.

Ejercicio. Probar que toda fraccion es equivalente a una y una sola fraccion irreducible; dichode otro modo, que todo numero racional admite un unico representante que sea una fraccionirreducible.

3.1. NUMEROS RACIONALES. 91

Definicion 3.1.4. Dadas dos fraccionesm

n,p

qllamaremos suma de ambas a la fraccion

m

n+p

q=mq + pn

nq

y producto a la fraccionm

n

p

q=mp

nq

Para definir la suma y el producto en Q dependemos del siguiente lema.

Lema 3.1.5. Dadas fraccionesm

n,m′

n′,p

q,p′

q′tales que

m

n∼ m′

n′,p

q∼ p′

q′, se verifica

m

n+p

q∼ m′

n′+p′

q′,

m

n

p

q∼ m′

n′p′

q′.

Demostracion. Por hipotesis, mn′ = m′n, pq′ = p′q. Por definicion

m

n+p

q=mq + pn

nq,

m′

n′+p′

q′=m′q′ + p′n′

n′q′,

luego

(mq + pn)(n′q′) = mqn′q′ + pnn′q′ = (mn′)(qq′) + (pq′)(nn′),(m′q′ + p′n′)(nq) = m′q′nq + p′n′nq = (m′n)(qq′) + (p′q)(nn′)

son iguales, que es lo que necesitabamos probar.Para el producto la demostracion se deja como ejercicio.

Definicion 3.1.6. Dados dos numeros racionalesm

n,p

q∈ Q, llamaremos suma de ambos al

numero racionalm

n+p

q=mq + pn

nq

y producto al numero racionalm

n

p

q=mp

nq

Notemos que segun el lema previo, la aplicacion suma (respectivamente, producto) de Q×Q en

Q que hace corresponder a(m

n,p

q

)∈ Q×Q el numero racional

mq + np

nq(respectivamente,

mp

nq)

esta bien definida.

Proposicion 3.1.7. Con la suma y el producto que hemos definido, Q es un cuerpo conmutativo.

Demostracion. Enunciamos las propiedades a comprobar, esbozando las demostraciones.

1. Propiedad asociativa de la suma.(m

n+p

q

)+r

s=m

n+(p

q+r

s

).

(Cierto: ambas operaciones dan como resultadomqs+ nps+ nqr

nqs.)

2. Propiedad conmutativa de la suma.m

n+p

q=p

q+m

n.

(Inmediato.)3. Existencia de elemento neutro (cero) para la suma. Hay un numero racional, que

denotamos provisionalmente por [0], tal que [0] +m

n=m

n+ [0] =

m

n.

(Vale tomar [0] = 0/1.)


4. Existencia de elemento opuesto para la suma. Para cadam

n∈ Q hay un numero racional

(y uno solo), el numero racional−mn

, tal que−mn

+m

n=m

n+−mn

= [0].

(Evidente.)

5. Propiedad asociativa del producto.(m

n

p

q

)r

s=m

n

(p

q

r

s

).

(Ambos son el numero racionalmpr

nqs.)

6. Propiedad conmutativa del producto.m

n

p

q=p

q

m

n.

(Inmediato.)7. Existencia de elemento neutro (identidad) para el producto. Hay un numero racional,

denotado provisionalmente por [1], tal que [1] · mn

=m

n· [1] =

m

n.

(Tomar [1] = 1/1.)4. Existencia de elemento inverso para el producto. Para cada

m

n∈ Q\{0} hay un elemento

(y uno solo) en Q, el numero racionaln

m, tal que

n

m

m

n=m

n

n

m= [1].

(Tiene sentido porque m 6= 0.)

8. Propiedad distributiva del producto respecto de la suma.m

n

(p

q+r

s

)=m

n

p

q+m

n

r

s.

(Ambos son iguales am(ps+ qr)

nqs=mpns+mrnq

nqns.)

Los enteros como racionales.

¿Es inevitable la distincion entre 〈〈el cero de Q〉〉, [0], y 〈〈el cero de Z〉〉, 0? ¿o entre 〈〈el uno deQ〉〉 y 〈〈el uno de Z〉〉? ¿No hemos creıdo siempre que los numeros enteros estaban incluıdos en losracionales? ¿Quien no pondrıa 6/3=2? Sin embargo, nos estamos refiriendo a objetos de naturalezadistinta: un numero racional es nada menos que un conjunto de pares de numeros enteros. Perodesde que aprendimos las fracciones hemos ‘identificado’ 0/1 con 0; 1/1 con 1 o, en general, m/1con m cualquiera que sea m ∈ Z. ¿Es incorrecto matematicamente? No: hay una buena razon parahacerlo, que se basa en el siguiente resultado.

Proposicion 3.1.8. La aplicacion h : Z→ Q dada por

h(m) = m/1 ∈ Q, m ∈ Z,

tiene las siguiente propiedades:

(i) es inyectiva, h(m) 6= h(n) si m 6= n;

(ii) transforma sumas en sumas, h(m+ n) = h(m) + h(n);

(iii) transforma productos en productos, h(mn) = h(m)h(n).


Es decir, h es un isomorfismo entre Z y h(Z), lo que significa que para todo lo referido aoperaciones algebraicas (con sumas, restas, productos, potencias) Z y h(Z) son indistinguibles:toda ‘operacion’ en uno de estos sistemas puede ser reproducida fielmente en el otro, lo que haceinnecesario a estos efectos diferenciar m de h(m). Por ello, desde este momento, consideramos

Z ⊆ Q y m = m/1 para todo m ∈ Z.


La idea de isomorfismo, “identificacion de dos sistemas matematicos que tienen las mismasformas (de operar)”, abstrayendo ası su “esencia matematica”, es muy importante y esta por todaspartes en Matematicas. Uno y otro sistema puede verse como un ‘modelo’ distinto de un mismo‘sistema abstracto’, dos caras de una misma moneda.(*)

Nota. Si se revisan cuidadosamente las demostraciones anteriores, se observara que, de entre todaslas propiedades de Z, solo hemos necesitado las propiedades de la suma y el producto que hacen deZ un dominio de integridad. Por tanto, la idea de sumergir un dominio de integridad en un ‘cuerpode fracciones’ es reutilizable en toda situacion similar (por ejemplo, al tratar con polinomios). Ver[GJPR], pp. 115 y ss.

La relacion de orden en Z se puede extender a una relacion de orden en Q.

Lema 3.1.9. Sean m/n, m′/n′ fracciones equivalentes. Entonces mn > 0 si y solo si m′n′ > 0.

Demostracion. Por hipotesis mn′ = m′n, luego mnn′ = m′n2; como n2 > 0, si mn > 0 se sigue quem′ y n′ son ambos positivos o ambos negativos (no pueden ser nulos —¿por que?), y en cualquiercaso m′n′ > 0.

Definicion 3.1.10. Sea m/n ∈ Q. Diremos que m/n es positivo si mn > 0.Dados m/n, p/q ∈ Q, diremos que m/n es menor o igual que p/q, escrito m/n ≤ p/q, si

p/q −m/n es positivo o 0.

Observese que el concepto de numero racional positivo esta bien definido, en virtud del lemaanterior. Tambien, que un numero racional m/n es positivo si y solo si m/n > 0 (o sea, 0 ≤ m/ny 0 6= m/n).

Proposicion 3.1.11. La relacion ≤ es una relacion de orden en Q, y es un orden total.

Demostracion. La manera mas comoda de comprobarlo pasa por examinar previamente algunaspropiedades del conjunto de los numeros racionales positivos, que denotaremos aquı por P (lanotacion habitual es Q+

∗ , demasiado complicada).Primero, veamos que para todo numero racional m/n se verifica una y solo una de estas tres

alternativas: m/n = 0, m/n ∈ P , −m/n ∈ P (ley de tricotomıa). En efecto, si no es m/n = 0,tendremos que o bien mn > 0 (en cuyo caso m/n ∈ P ), o bien mn < 0, en cuyo caso (−m)n > 0 y−m/n ∈ P ; y las alternativas son claramente excluyentes.

Despues, P es estable o cerrado para la suma, es decir, si m/n, p/q ∈ P , tambien m/n+p/q ∈ P .Supongamos m > 0, n > 0, p > 0, q > 0 (si no es ası, basta sustituir la fraccion m/n por la fraccionequivalente mn/n2, o p/q por pq/q2). Entonces m/n + p/q = (mq + pn)/pq ∈ P claramente, pues(mq + pn)pq es un producto de enteros positivos.

Con esto, la relacion ≤ es:

Reflexiva, pues m/n ≤ m/n cualquiera que sea m/n ∈ Q, ya que trivialmente m/n−m/n = 0.

Antisimetrica, siempre que m/n ≤ p/q y p/q ≤ m/n simultaneamente, ha de ser m/n = p/q,porque en caso contrario, p/q −m/n y su opuesto m/n− p/q deberıan ser simultaneamentepositivos, imposible.

(*)Generalmente se identifican ambos modelos, como hemos hecho aquı. Pero en algunas ocasiones, disponer devarios ‘modelos’ sirve para ‘transferir intuicion’ de uno a otro. La ventaja es obvia: si dos juegos distintos obedecena las mismas reglas, ganaremos con mayor facilidad jugando el que tenga la estrategia mas evidente. Hay un ejemploprecioso de ello en M. Gardner: Inspiracion ¡aja!. Labor, Barcelona, 1981 (reed. 1992)., pp. 116 y ss. Un feriantetiene un mostrador con casillas numeradas del 1 al 9, y el juego consiste en ir poniendo monedas por turno (de 50pesetas el feriante, de 5 pesetas el otro jugador); se lleva todo el dinero de la mesa el que primero ocupe tres casillasdistintas cuyos numeros sumen 15. El feriante gana siempre que quiere, porque sabe que, disponiendo los numeros enun cuadrado magico, el juego resulta isomorfo al ‘tres en raya’, sencillısimo de jugar (merece la pena leer la exposicionoriginal y los comentarios del maestro Martin Gardner).


Transitiva, de m/n ≤ p/q y p/q ≤ r/s se sigue m/n ≤ r/s; esto es evidente si m/n = p/q op/q = r/s. Si no es este el caso, tendremos r/s−m/n = (r/s− p/q) + (p/q−m/n), suma dedos racionales positivos, luego positivo.

Un orden total, pues dados m/n, p/q ∈ Q, o p/q −m/n es 0 (con lo cual m/n = p/q), o espositivo (y ası m/n ≤ p/q) o −(p/q−m/n) = m/n− p/q es positivo (lo que da p/q ≤ m/n)

Nota. ¿Se respeta el orden antiguo en Z? Puesto que hemos identificado m ∈ Z con m/1 ∈ Q,dados m y n ∈ Z disponemos de dos ‘criterios’ para escribir m ≤ n. Pero en la nueva definicion,m ≤ n significa literalmente m/1 ≤ n/1, o sea, que n/1 − m/1 = (n − m)/1 es 0 (en cuyo cason−m = 0, i.e. n = m) o es un numero racional positivo, es decir, que (n−m) · 1 > 0, i.e., n > m;en cualquier caso, m ≤ n en la relacion de orden de Z.

En consecuencia, la aplicacion h : Z→ Q que permitıa identificar Z con h(Z) conserva tambienlas desigualdades, por lo que Z y h(Z) son ası mismo ‘indistinguibles’ (isomorfos) por lo que respectaa las propiedades de orden.

Es importante saber como “se suman y multiplican desigualdades”. Las reglas fundamentalesson las siguientes.

Proposicion 3.1.12. Dados m/n, p/q, r/s ∈ Q, se tiene:

(Compatibilidad del orden con la suma) si m/n ≤ p/q, entonces m/n+ r/s ≤ p/q + r/s;

(Compatibilidad del orden con el producto por elementos no negativos) si m/n ≤ p/q, yademas r/s ≥ 0, entonces m/n · r/s ≤ p/q · r/s.

En particular, de m/n ≥ 0 y p/q ≥ 0 se sigue m/np/q ≥ 0.

Demostracion. Para la suma basta tener en cuenta que (p/q + r/s)− (m/n+ r/s) = p/q −m/n yaplicar la definicion.

Para el producto, notemos primero que si a/b y c/d son numeros racionales positivos, tambiena/b · c/d = ac/bd es positivo, ya que (ac)(bd) = (ab)(cd) > 0. Por tanto, si m/n ≤ p/q, y r/s ≥ 0,como

p/q · r/s−m/n · r/s = (p/q −m/n) · r/s,

el segundo termino es un producto de factores positivos o nulos, y por lo anterior es positivo o nulo.

Un cuerpo en el que se ha definido un orden total que tenga las dos propiedades anteriores sellama cuerpo conmutativo totalmente ordenado. Podemos resumir entonces las propiedadesvistas diciendo

Q es un cuerpo conmutativo totalmente ordenado.

La enumeracion diagonal de Cantor hizo plausible la existencia de una aplicacion biyectiva entreN y Q (i. e., que Q es numerable). Sin embargo, aunque en este sentido N y Q tienen ‘la mismacantidad de elementos’, los tienen ‘repartidos’ de manera totalmente distinta, como muestran lossiguientes resultados.

Proposicion 3.1.13. Entre dos numeros racionales hay otro numero racional.

Demostracion. Dados a, b ∈ Q, si a < b es a <a+ b

2< b, porque

a+ b

2− a =

a+ b− 2a2

=b− a

2= (b− a) 1

2> 0,


ya que b− a > 0 por hipotesis y 1/2 > 0 (¿por que?). Analogamente

b− a+ b

2=

2b− (a+ b)2

=b− a

2> 0.

Proposicion 3.1.14. En Q no se cumplen los principios del maximo ni del mınimo.

Demostracion. Por ejemplo, A = {x ∈ Q : 0 < x < 1} es un conjunto no vacıo (¿por que?) acotadosuperiormente por 1 e inferiormente por 0. Pero no tiene elemento maximo ni elemento mınimo: sifuese M = maxA, serıa M ∈ A y por tanto 0 < M < 1; pero segun acabamos de probar, existirıax ∈ Q entre M y 1, con lo cual 0 < M < x < 1, es decir, x ∈M y x > M , por lo que M no puedeser el maximo de A. Analogamente se prueba con el mınimo.

Ejercicios

12.1. Hallar las fracciones irreducibles equivalentes a 36/50, 444/33, 231 107/999 999 989.

12.2. Sean a/m y b/n fracciones irreducibles. Probar que (an+ bm)/(mn) es irreducible si y solosi m y n son relativamente primos.

12.3. Probar que en todo cuerpo K totalmente ordenado (en particular, en Q) se verifica:

(i) x2 ≥ 0 para cada x ∈ K, y x2 = 0 si y solo si x = 0.

(ii) 1 > 0 (unidad y cero de K).

(iii) Para 2 = 1 + 1 (en K) y 1/2 = inverso de 2 en K, 0 < 1/2 < 1.

12.4. Sean m, n, p, q enteros positivos tales que m ≤ p ≤ q y p/q ≤ m/n. Probar que n−m ≤ q−p.Comprobar que esta conclusion no siempre es cierta si m ≤ q < p y p/q ≤ m/n.

12.5. Sean m, n, p, q enteros positivos tales que m/n < p/q. Probar que

m/n < (m+ p)/(n+ q) < p/q.

12.6. Paradoja de Simpson. En un curso hay dos grupos, el grupo de la manana y el grupode la tarde. En el grupo de la manana hay A chicas y B chicos, y en el de la tarde hay C chicasy D chicos. En el primer examen aprueban a chicas y b chicos del grupo de la manana, y en elde la tarde aprueban c chicas y d chicos. Tanto en el grupo de la manana como en el de la tardeel porcentaje de chicas aprobadas es menor que el de chicos aprobados. ¿Podemos afirmar que elporcentaje global de aprobados sera menor para las chicas que para los chicos?

Examinar el caso A = 14, B = 6, C = 6, D = 19, a = 11, b = 5, c = 2, d = 7. ¿Como se explicaesto?

(Ver [D’A-W], pp. 129–130, y [1].)


3.2. Polinomios

Ya es de sobras conocido que las expresiones tales como

x2 + 1, −x3 − (5/2)x+ 1, (47/8)x6 − 3x2 + (6/5)x+ 2, . . .

y, en general,anx

n + an−1xn−1 + · · ·+ a1x+ a0,

donde n ∈ N, a0,. . . , an ∈ Q, reciben el nombre de polinomios sobre Q o polinomios con coefi-cientes racionales. Pero el nombre ‘polinomio’ encubre, en realidad, dos conceptos diferentes: el depolinomio formal o polinomio en sentido estricto y el de funcion polinomica. En el primer sentido,manejamos los polinomios como ‘formulas’ o ‘expresiones simbolicas’, sin darle a x ningun conte-nido determinado —dejando la x ‘indeterminada’— y operando con ella, por ası decir, como unobjeto ‘que no se mezcla’ con los coeficientes.(**) En el segundo sentido, se piensa en la funcionque a cada x de un cierto conjunto de numeros (u otros objetos: clases de restos, matrices, . . . )hace corresponder el numero (o . . . ) que resulta al calcular anxn + an−1x

n−1 + · · ·+ a1x+ a0.Distinguiremos, pues, entre estos conceptos, reservando el nombre de polinomio para el primero

y llamando funcion polinomica al segundo.A lo largo del curso, en esta y otras asignaturas, se manejaran no solamente polinomios con

coeficientes en Q, sino tambien polinomios con coeficientes reales y complejos. Muchas de las pro-piedades de los polinomios son comunes en todos estos casos, dependen unicamente de que loscoeficientes pertenezcan a un cuerpo. Para dejarlo mas claramente de manifiesto, trataremos porello inicialmente con polinomios sobre un cuerpo conmutativo arbitrario K, que podra ser en su mo-mento Q, R o C (sin olvidar los cuerpos Zp, tan importantes en aplicaciones). Cuando sea oportuno,iremos estudiando algunas propiedades especıficas de los polinomios con coeficientes racionales.

Mientras no se indique lo contrario, de aquı en adelante K representa un cuerpo conmutativocualquiera y X una indeterminada.

3.2.1. Definiciones. Suma y producto de polinomios.

Definicion 3.2.1. Un polinomio sobre K en la indeterminada X es una expresion de laforma

p(X) = a0 + a1X + · · ·+ an−1Xn−1 + anX

n,

donde n ∈ N, a0,. . . , an ∈ K.Para 1 ≤ k ≤ n, el elemento ak se llama coeficiente de Xk en p = p(X); a0 es el termino

independiente o constante de p (puede verse como el coeficiente de X0); si k > n, se entiende(cuando sea conveniente) que el coeficiente de Xk en p es 0.

Cuando ak = 1 solo se pone Xk, y −Xk si ak = −1; cuando ak = 0 el termino +0 · Xk

suele omitirse (ası, para cada a ∈ K, a puede entenderse tambien como el polinomio ‘constante’a+ 0 ·X + 0 ·X2 + 0 ·X3 + · · · ).

El polinomio nulo o cero es aquel cuyos coeficientes son todos cero; se denotara por 0.

Dados dos polinomios

p(X) = a0 + a1X + · · ·+ an−1Xn−1 + anX

n, q(X) = b0 + b1X + · · ·+ bm−1Xm−1 + amX

m,

que p(X) y q(X) sean iguales significa que a0 = b0, a1 = b1 y, en general, ak = bk para todo k ∈ N,teniendo en cuenta el convenio anterior de que ak = 0 si k > n y bk = 0 si k > m.(**)Es posible dar un sentido preciso a estas nociones un tanto vagas de expresiones simbolicas o formales y deindeterminada; nosotros nos conformaremos con la idea intuitiva, remitiendo para una definicion mas rigurosa p. ej.al libro de Godement, R.: Cours d’algebre. Hermann, Paris, 1963., p. 353.

3.2. POLINOMIOS 97

Al conjunto de los polinomios sobre K en la indeterminada X (tambien llamados polinomioscon coeficientes en K) lo denotaremos por K[X].

Definicion 3.2.2. Si un polinomio p(X) no tiene todos los coeficientes nulos, su grado es elmaximo n tal que an 6= 0, y este coeficiente an recibe entonces el nombre de coeficiente director .Si el coeficiente director es igual a 1, se dice que p(X) es un polinomio monico.

El grado de un polinomio p suele denotarse por deg p.Observemos que al polinomio nulo no le asignamos ningun grado (en algunos textos se considera

deg 0 = −∞). Los polinomios de grado cero o constantes se corresponden con los elementos no nulosde K.

La suma de polinomios se define sumando ordenadamente los coeficientes correspondientes a lamisma potencia de X. Concretamente,

Definicion 3.2.3. Dados dos polinomios en K[X],

p = a0 + a1X + a2X2 + · · ·+ anX

n, q = b0 + b1X + b2X2 + · · ·+ bmX

m,

su suma es el polinomio

p+ q = (a0 + b0) + (a1 + b1)X + (a2 + b2)X2 + · · ·

(se entiende ak = 0 o bk = 0 donde sea necesario).

Nota. Es comodo disponer de una cierta flexibilidad a la hora de escribir polinomios, sin tener queestar sujetos a la rigidez de la forma

p(X) = a0 + a1X + · · ·+ an−1Xn−1 + anX

n

que exige en principio nuestra definicion.Tras la introduccion de la suma, es claro que el polinomio p(X) podra escribirse igualmente

comop(X) = anX

n + an−1Xn−1 + · · ·+ a1X + a0

por ejemplo, sin mas que interpretar el segundo termino como el polinomio suma de los polinomiosanX

n, an−1Xn−1, . . . , a1X, a0. Lo mismo puede decirse si los sumandos aparecen en cualquier otro

orden.

Aprovechando esta situacion, en lo sucesivo emplearemos el siguiente

convenio: cuando escribamos un polinomio no nulo p 6= 0 en la forma

anXn + an−1X

n−1 + · · ·+ a1X + a0,

sobreentenderemos que an es su coeficiente director, es decir, que n es su grado y que an 6= 0.

Ejercicio. Si p, q, p+ q ∈ K[X] \ {0}, y

p(X) = anXn + an−1X

n−1 + · · ·+ a1X + a0, q(x) = bmXm + bm−1X

m−1 + · · ·+ b1X + b0,

probar que el grado de p+ q es menor o igual que max{n,m}, siendo el menor estricto solamentecuando p y q tienen el mismo grado (n = m) y sus coeficientes directores son opuestos, i.e.,an + bn = 0.

El producto de polinomios se define por la ley aiXi · bjXj = aibjX

i+j , y buscando que seadistributivo. Concretamente,


Definicion 3.2.4. Dados dos polinomios en K[X],

p = a0 + a1X + a2X2 + · · ·+ anX

n, q = b0 + b1X + b2X2 + · · ·+ bmX

m,

su producto es el polinomio

p · q = c0 + c1X + c2X2 + · · ·+ cn+mX

n+m,

donde ck =∑

i+j=k aibj, es decir, que si 0 ≤ k ≤ n+m, ck = a0bk + a1bk−1 + · · ·+ ak−1b1 + akb0,conviniendo como antes que si alguno de los coeficientes ai, bj no aparecen en p o en q, los tomamosiguales a cero.

Observese que p · 0 = 0 = 0 · p y que si p y q no son nulos, el coeficiente director de pq es elproducto del coeficiente director de p por el coeficiente director de q (ası que tambien pq 6= 0) y elgrado de pq es la suma del grado de p mas el grado de q, deg(pq) = deg p+ deg q .

Proposicion 3.2.5. Con las operaciones suma y producto anteriores, K[X] es un dominio deintegridad.

Demostracion. Se deja como ejercicio el comprobar las diferentes propiedades. Por ejemplo, elpolinomio nulo es el elemento neutro para la suma; el polinomio constante 1 es la identidad parael producto. La propiedad cancelativa se sigue de que pr = qr es lo mismo que (p− q)r = 0, y esteproducto solo puede ser 0 si r = 0 o p− q = 0.

El espacio vectorial K[X]. En K[X] tenemos definida una suma, y disponemos ademas de un producto porescalares ‘natural’: dados a ∈ K, p ∈ K[X], podemos definir a · p como el producto del polinomio constantea por p. Es facil comprobar que con esta suma y este producto por escalares, K[X] es un espacio vectorialsobre K. En cierto sentido, es “el menor espacio vectorial sobre K de dimension infinita”: una base obviaesta formada por la sucesion de polinomios

1, X,X2, . . . , Xn, . . .

3.2.2. Division de polinomios.

Proposicion 3.2.6 (Division euclıdea). Dados p, q ∈ K[X] con q no nulo, existen dos polino-mios c y r tales que

p = cq + r, con r nulo o de grado estrictamente menor que q.

Con esta condicion, los polinomios c y r, denominados respectivamente cociente y resto de ladivision de p por q, son unicos.

Demostracion.Existencia. Si p = 0 o el grado de p es estrictamente menor que el de q, claramente p = 0 · q + p,y se sigue lo pedido.

Suponiendo, pues, deg p ≥ deg q, procedemos por induccion sobre el grado de p. Si deg p = 0 (yen consecuencia deg q = 0), tendrıamos p = a0, q = b0 6= 0, p = a0b

−10 q + 0.

Si el enunciado es cierto cuando el grado del dividendo es menor o igual que n − 1, n ∈ N,veamos que tambien lo es cuando deg p = n. Sean an y bm los coeficientes directores de p y qrespectivamente. El polinomio p1 = p− anb−1

m Xn−mq tiene obviamente grado estrictamente menoral de p. Si p1 = 0 o deg p1 < deg q, tomar c = anb

−1m Xn−m, r = p1 resuelve la cuestion; y

si deg p1 ≥ deg q, por la hipotesis de induccion el resultado es cierto para p1, luego existen c1,r ∈ K[X] tales que p1 = c1q + r con r = 0 o con r de grado estrictamente menor que el de q.

3.2. POLINOMIOS 99

Denotemos por c = anb−1m Xn−m+c1. Entonces p = cq+r, siendo r = 0 o de grado estrictamente

menor que el de q, como querıamos.Unicidad. Sean c, c, r, r ∈ K[X] tales que cq + r = p = cq + r con r = 0 o deg r < deg q, y r = 0o deg r < deg q. Entonces

r − r = (c− c)q,

y si r − r 6= 0, por las propiedades de los grados anteriormente senaladas deberıa ser

deg q ≤ deg(c− c) + deg q = deg((c− c)q) = deg(r − r) ≤ max{deg r, deg r} < deg q,

imposible.Por lo tanto r = r, y ası (c− c)q = 0; pero q 6= 0, luego c = c.

Notese que el grado proporciona, para la division de polinomios, el control del tamano del restoque para los enteros nos daba la condicion 0 ≤ r < |q|.

La propia demostracion sugiere el metodo habitual para efectuar la division, obteniendo suce-sivamente los terminos del cociente de mayor a menor grado.Ejemplos. Dividir p(X) por q(X) en los siguientes casos:

• p(X) = −6X4 + 4X2 +X − 5, q(X) = 2X2 − 1;

• p(X) = X6 + 2X5 + 5X4 + 7X3 +X2 + 3X + 5, q(X) = X3 + 5X + 3;

• p(X) = X7 + 1, q(X) = X + 1.

3.2.3. Maximo comun divisor. Algoritmo de Euclides.

Definicion 3.2.7. Sean p, q ∈ K[X]. Decimos que p divide a q, o que p es un divisor o factorde q, o que q es multiplo de p, escrito p|q, si existe c ∈ K[X] tal que q = pc; expresado de otraforma, si el resto de la division de q por p es 0. Diremos entonces que c es el cociente exacto q/po el cofactor de p.

Observaciones. Como consecuencias inmediatas de la definicion, se obtienen: dados polinomiosarbitrarios p, q, r, s, t ∈ K[X], y a ∈ K[X] de grado 0 (i.e., constante y no nulo)

(i) p|p (propiedad reflexiva)(ii) p|q y q|r implica p|r (propiedad transitiva)(iii) p|q y p|r implica p|(sq + tr) (propiedad de linealidad)(iv) p|q implica pr|qr (propiedad de multiplicacion)(v) pr|qr y r 6= 0 implica p|q (ley de cancelacion)(vi) p|0 (todo polinomio divide a 0)(vii) 0|p implica p = 0 (0 solo divide a 0)(viii) p|q y q 6= 0 implica deg p ≤ deg q (propiedad de comparacion)(ix) a|p siempre que deg a = 0 (los polinomios de grado 0 dividen a

cualquier polinomio)(x) p|q y q|p si y solo si p = aq para algun a de grado 0.

La situacion reflejada en (x) se corresponde, en Z, con el hecho de que p|q y q|p simultaneamentesi y solo si p = aq para a = 1 o a = −1. Con polinomios encontramos un mayor numero deposibilidades, lo que provoca una cierta ambiguedad en la definicion de conceptos tales como el demaximo comun divisor o mınimo comun multiplo.

Definicion 3.2.8. Dados p, q ∈ K[X], diremos que d ∈ K[X] es un maximo comun divisorde p y q si d|p, d|q, y si d′ ∈ K[X] tambien cumple d′|p, d′|q, entonces d′|d (en palabras, si d es undivisor comun de p y q que a su vez es multiplo de todos los divisores comunes de p y q).


Observese que hemos definido un maximo comun divisor, y no el maximo comun divisor, porquesi d cumple la condicion del enunciado, tambien la cumple ad para cualquier a de grado 0, dadoque d|ad y ad|d. Para seleccionar entre todos ellos un unico polinomio, basta exigir ‘en condicionesnormales’ que sea monico (con coeficiente director 1).

Lema 3.2.9. Dados p, q ∈ K[X] tales que p 6= 0 o q 6= 0, si d, d ∈ K[X] son maximos comunesdivisores de p y q, existe a ∈ K[X] de grado 0 (i.e., un polinomio constante no nulo) tal que d = ad.Por tanto, si d y d son monicos, entonces d = d.

Demostracion. Aplicando la definicion, necesariamente d 6= 0, d 6= 0, d|d y d|d. Por tanto, d = adpara algun a de grado 0, y deg d = deg d; si estos polinomios son de grado n, y ambos fuesen monicos,tendrıamos d = Xn + bn−1X

n−1 + · · · = ad = a(Xn + cn−1Xn−1 + · · · ) = aXn + acn−1X

n−1 + · · · ,y forzosamente a = 1, d = d.

Examinando el caso excluido, p = q = 0, vemos que la definicion dejarıa como maximo comundivisor de p y q tan solo al 0.

Definicion 3.2.10. Dados p, q ∈ K[X] tales que p 6= 0 o q 6= 0, pondremos mcd(p, q) = d si d esun (el) maximo comun divisor monico de p y q. Para p = q = 0, pondremos mcd(p, q) = 0.

Atencion: la existencia de algun maximo comun divisor no esta garantizada todavıa; la demos-tracion que hicimos en Z no es traspasable sin mas a los polinomios. Afortunadamente, el algoritmode Euclides sigue siendo aplicable con el mismo esquema.

Lema 3.2.11. Si p, q, r, c ∈ K[X] son tales que p = cq + r, se tiene que mcd(p, q) = mcd(q, r).

Demostracion. El caso q = 0 es trivial. Si q 6= 0, bastara ver que p y q tienen los mismos divisorescomunes que q y r, lo cual es cierto por la propiedad de linealidad.

Lema 3.2.12. Dados p, q ∈ K[X] tales que q|p, q es un maximo comun divisor de p y q. Enparticular, q es un maximo comun divisor de q y 0.

Demostracion. Consecuencia trivial de la definicion.

Definicion 3.2.13. Algoritmo de Euclides para polinomios.

• Input: dos polinomios a y b.

• Output: un maximo comun divisor de a y b.

Paso 1: Reemplazar

� a por b, y� b por el resto de la division de a por b.


Paso 3: Devolver a.

Proposicion 3.2.14. Algoritmo de Euclides. Dados dos polinomios no nulos a y b con deg a ≥deg b, obtenemos un maximo comun divisor procediendo por divisiones enteras sucesivas, como seha indicado anteriormente, hasta obtener resto nulo. El ultimo resto no nulo es un maximo comundivisor de a y b.

Demostracion. Aplicar los lemas.

El caso de polinomios nulos ya lo hemos comentado.

Por las mismas razones que en Z se tiene una ‘identidad de Bezout’ (repasar las demostraciones).

3.2. POLINOMIOS 101

Proposicion 3.2.15. Identidad de Bezout. Sean p y q ∈ K[X] no nulos, y d = mcd(p, q).Entonces existen polinomios u, v tales que

d = up+ vq.

Tenemos igualmente:

Definicion 3.2.16. Algoritmo de Euclides extendido (Euclides-Bezout) para polinomios.

• Input: dos polinomios a y b.

• Output: dos polinomios u y v tales que, salvo constantes, mcd(a, b) = ua+ vb.

Paso 1: Hacer u = y = 1 e v = x = 0.

Paso 2: Determinar c y r tales que a = cb+ r y r = 0 o deg r < deg b.Reemplazar

� a por b, y b por r,� u por x y v por y,� x por u− cx e y por v − cy.


Paso 4: Devolver u y v.

Visualizado en forma de tabla:


cocientes c c1 c2 c3 · · · · · · cn−1 cnuk+1 =xk 1 0 1 · · · · · · · · · un−1 uvk+1 =yk 0 1 −c1 · · · · · · · · · vn−1 v

xk+1 =uk−ck+1xk 0 1 −c2 · · · · · · · · · xn−1 = uyk+1 =vk−ck+1yk 1 −c1 1 + c1c2 · · · · · · · · · yn−1 =v

Ejercicios. Aplicar el algoritmo de Euclides-Bezout a los polinomios

• p(X) = X6− 2X5 + 3X4− 4X3 + 3X2− 2X + 1, q(X) = 3X5− 5X4 + 6X3− 6X2 + 3X − 1;

• p(X) = X5 +X4 + 2X3 − 2X + 3, q(X) = X4 + 3X3 + 7X2 + 8X + 6.

Midiendo el tamano de los polinomios por el grado, tambien los maximos comunes divisores son‘maximos’ en este sentido.

Proposicion 3.2.17. Sean p, q, r ∈ K[X]. Si pq 6= 0 y r es un divisor comun de p y q de gradomaximo, entonces r es un maximo comun divisor de p y q.

Demostracion. Sea d = mcd(p, q). Segun la definicion, r|d, y en consecuencia deg r ≤ deg d. Peropor hipotesis deg d ≤ deg r, luego r = ad para algun a de grado 0 y r es un maximo comun divisorde p y q.

Los resultados sobre enteros que obtuvimos como consecuencia de la identidad de Bezout puedenprobarse para polinomios adaptando las demostraciones (comprobarlo).

Definicion 3.2.18. Dos polinomios no nulos p y q se dicen relativamente primos o primosentre sı si no tienen mas divisores comunes que los polinomios de grado 0, es decir, si mcd(p, q) =1.


Corolario 3.2.19. Dos polinomios no nulos p y q son relativamente primos si y solo si existendos polinomios u y v tales que up+ vq = 1.

Tambien:

Proposicion 3.2.20. Sean p, q, d, r, s, t ∈ K[X], pq 6= 0.

(i) si d = mcd(p, q), p = dr, q = ds, entonces mcd(r, s) = 1 (es decir, r y s son relativamenteprimos).

(ii) si mcd(r, s) = 1 y r | st, entonces r | t.

El concepto de maximo comun divisor es aplicable a un numero finito arbitrario de polinomios.

Definicion 3.2.21. Sea {p1, p2, . . . , pm} una familia finita de polinomios de K[X] no nulos. Dire-mos que un polinomio p ∈ K[X] es un maximo comun divisor de la familia {p1, p2, . . . , pm}si verifica:

(i) p divide a pi para i = 1, 2, . . . ,m, y

(ii) si q ∈ K[X] divide a pi, para todo i = 1, 2, . . . ,m, entonces q divide p.

Ası p es el “mayor” de los divisores comunes de todos los pi.

Igual que en Z, para hallar un maximo comun divisor de una familia {p1, p2, . . . , pm} basta irobteniendo un maximo comun divisor q1 de p1 y p2, un maximo comun divisor q2 de q1 y p3, unmaximo comun divisor q3 de q2 y p4, . . .

Se puede probar:

Proposicion 3.2.22. En K[X] existe un maximo comun divisor de cualquier familia finita depolinomios no nulos {p1, p2, . . . , pm}. Ademas podemos elegir un tal maximo comun divisor que seamonico, y entonces es unico.

Proposicion 3.2.23 (Identidad de Bezout general). . Si p es un maximo comun divisor de lafamilia {p1, p2, . . . , pm}, entonces existen g1, . . . , gm ∈ K[X] tales que p = g1p1 + · · ·+ gmpm.

Como en Z, en K[X] puede definirse tambien el mınimo comun multiplo de dos polinomios (ode una familia finita).

Definicion 3.2.24. Un polinomio m se dice que es un mınimo comun multiplo de la familiafinita de polinomios no nulos {p1, p2, . . . , pr} si verifica:

1. pi divide a m para i = 1, 2, . . . , r, y

2. si q ∈ K[X] verifica que pi divide a q, (i = 1, 2, . . . , r), entonces m divide q.

Ası, m es el “menor” de los multiplos comunes de todos los pi.

Proposicion 3.2.25. En K[X] existe un mınimo comun multiplo de cualquier familia finita depolinomios no nulos {p1, p2, . . . , pr}. Ademas entre todos ellos existe uno y solo uno que es monico.

Ejercicio. Dados p, q ∈ K[X] tales que pq 6= 0, ¿es cierto que

mcm(p, q) ·mcd(p, q) = pq?

En caso negativo, ¿que relacion es cierta?

3.2. POLINOMIOS 103

3.2.4. Funciones polinomicas. Raıces de polinomios.

Definicion 3.2.26. Sea p(X) = a0 + a1X + a2X2 + · · · + anX

n ∈ K[X] un polinomio y a unelemento de K. La evaluacion o el valor de p(X) en a es el elemento de K, denotado por p(a),dado por

p(a) = a0 + a1a+ a2a2 + · · ·+ ana

n

(obtenido ‘sustituyendo la indeterminada X por el elemento a en la expresion del polinomio’).

La aplicacion de K en K que a cada x ∈ K hace corresponder el valor de p(X) en x es lafuncion polinomica correspondiente al polinomio p, y suele denotarse igualmente con p si no esmotivo de confusion.

Un elemento c ∈ K se dice que es un cero o una raız del polinomio p si p(c) = 0.

Notas.

• La suma y el producto de polinomios estan definidos justamente para que, cualesquiera quesean p, q ∈ K[X], a ∈ K, se obtenga

(p+ q)(a) = p(a) + q(a), (pq)(a) = p(a) q(a).

• En general, la funcion polinomica no determina el polinomio que la define: dos polinomiosdistintos pueden dar lugar a la misma funcion (y esta es una razon mas para distinguir ambosconceptos). Por ejemplo, para K = Zp, p entero primo, el pequeno teorema de Fermat nosdice que las funciones polinomicas corespondientes a los polinomios Xp y X son iguales, oque la asociada al polinomio no nulo Xp −X es la funcion nula.

• El valor de un polinomio en un a ∈ K se halla mediante el conocido algoritmo de Hor-ner/Ruffini, habida cuenta que

p(a) = a0 + a1a+ a2a2 + · · ·+ ana

n = a0 + a(a1 + a(a2 + a(· · ·+ a(an−1 + aan) · · · ))).

Los calculos se disponen segun el esquema

an an−1 . . . ak . . . a1 a0

a) a an . . . a bk+1 . . . a b2 a b1an bn−1 . . . bk . . . b1 ( b0

donde bk = a bk+1 +ak y b0 = a0 +a b1 = a0 +a (a1 +a b2) = a0 +a (a1 +a (a2 +a b3)) = . . . = p(a).Ası se efectuan solamente n multiplicaciones y n sumas, mientras que el calculo directo supone

n(n + 1)/2 multiplicaciones y n sumas; este algoritmo es facil de programar y es muy establenumericamente (‘pequenos errores en los datos producen errores pequenos en el resultado’).

Teorema 3.2.27 (Teorema del resto). Sea p(X) ∈ K[X], a ∈ K. El resto de dividir p por X−aes p(a). Consecuentemente, a es raız de p si y solo si X − a divide a p.

Demostracion. Por el algoritmo de la division, existen c, r ∈ K[X] tales quep(X) = c(X)(X − a) + r(X), con r = 0 o deg r < deg(X − a) = 1,y ası r tiene que ser constante . Por tanto p(a) = c(a)(a− a) + r = r, de donde se sigue lo pedido.

Nota. El cociente es anXn−1 + bn−1Xn−2 + · · · + bkX

k−1 + · · · + b1 con los bk del algoritmo deHorner/Ruffini (comprobarlo multiplicando este polinomio por X − a).Ejemplo. Sean p(X) = 7 − 9X + 4X3 − 8X4, q(X) = 2X − 3. Para hallar el cociente y el restode la division de p por q, tendremos en cuenta que q(X) = 2(X − 3/2) y p = cq + r si y solo si

p = 2c · 12q + r, luego usando el algoritmo de Horner/Ruffini


−8 4 0 −9 73/2) −12 −12 −18 −81/2

−8 −8 −12 −27 (−67/2

con lo cual r = −67/2, 2c = −8X3 − 8X2 − 12X − 27, c = −4X3 − 4X2 − 6X − 27/2.

Ejercicios.

1. Sean p, q ∈ Q[X] dados por p(X) = X4 − 6X3 + 2X2 + 3X − 4, q(X) = X2 − X − 2 =(X + 1)(X − 2). Probar que q no divide a p sin efectuar la division.

2. Si se divide un cierto polinomio p por X − 1 el resto es −2; si lo dividimos por X + 2 el restoes 79. ¿Cual es el resto que se obtiene al dividirlo por (X − 1)(X + 2)?

Corolario 3.2.28. Un polinomio de grado n puede tener a lo mas n raıces distintas.

Demostracion. Puesto que si c1, . . . , ck son raıces distintas de un polinomio p, este es divisible por(X − c1) · · · (X − ck), y por tanto debe tener grado mayor o igual que k.

Corolario 3.2.29. Sean p, q ∈ K[X] de la forma

p(X) = a0 + a1X + · · ·+ anXn, q(X) = b0 + b1X + · · ·+ bnX

n,

y supongamos que K tiene por lo menos n+ 1 elementos distintos. Entonces:

(i) p es el polinomio nulo si y solo si la funcion polinomica p se anula en n+ 1 puntos distintos.

(ii) los polinomios p y q son iguales si y solo si las funciones polinomicas p y q toman el mismovalor en n+ 1 puntos distintos.

Demostracion.(i) Si no fuese p = 0 tendrıamos un polinomio de grado menor o igual que n con n + 1 raıcesdistintas.(ii) La funcion polinomica p− q se anula en n+ 1 puntos distintos.

Las funciones polinomicas (especialmente sobre R y C) son muy utiles en las aplicaciones,debido sobre todo a que es facil calcular con ellas, y ademas sirven para aproximar funcionesmas complicadas. Por ejemplo, siempre es posible encontrar explıcitamente un polinomio que tomevalores arbitrarios en una coleccion finita de puntos prescritos de antemano, como muestra elsiguiente resultado.

Proposicion 3.2.30 (Teorema de interpolacion de Lagrange). Dados n elementos distintosx1, . . . , xn ∈ K y n valores arbitrarios y1, . . . , yn ∈ K (n ∈ N), existe un polinomio p ∈ K[X]nulo o de grado n − 1 a lo mas, y uno solo, tal que p(x1) = y1, . . . , p(xn) = yn. Dicho polinomioviene dado por la formula de interpolacion de Lagrange

p(X) = y1(X − x2) · · · (X − xn)(x1 − x2) · · · (x1 − xn)

+ · · ·+ yk(X − x1) · · · (X − xk−1)(X − xk+1) · · · (X − xn)(xk − x1) · · · (xk − xk−1)(xk − xk+1) · · · (xk − xn)

+ · · ·+ yn(X − x1) · · · (X − xn−1)(xn − x1) · · · (xn − xn−1)

.

Demostracion. El polinomio del enunciado es de grado n − 1 a lo mas (o nulo si los yk son todosnulos), y para cada k, 1 ≤ k ≤ n, cumple que f(xk) = yk (todos los sumandos son nulos salvo elk-esimo, que es yk · 1).

La unicidad es consecuencia del corolario anterior.

Ejercicio. ¿Que valores han de tener a, b, c ∈ Q para que p(X) = aX2+bX+c cumpla p(−1) = 1,p(−2) = 2, p(−3) = 7?

3.2. POLINOMIOS 105

Raıces multiples.

Sea c una raız de un polinomio no nulo p ∈ K[X]. Segun hemos probado, tendremos p =(X − c)p1 para algun p1 ∈ K[X]. Si c fuese tambien raız de p1, analogamente p1 = (X − c)p2 yp = (X − c)2p2. Reiterando, llegaremos a encontrar un m ∈ N tal que p = (X − c)mpm y c ya NOes raız de pm (va incluida la posibilidad de que pm sea constante).

Definicion 3.2.31. Sea c una raız de un polinomio p ∈ K[X]. Diremos que c es una raız demultiplicidad m si p = (X − c)mq para algun q ∈ K[X] tal que q(c) 6= 0; dicho de otro modo, sim es el mayor numero natural tal que (X − c)m|p.

Cuando m = 1, suele decirse que a es una raız simple ; cuando m = 2, que es una raız doble ;cuando m = 3, que es una raız triple , etc.

Diremos que a es una raız multiple para indicar que su multiplicidad es mayor o igual que 2(o sea, que no es simple).

Se sigue inmediatamente que para un polinomio p cuyas raıces sean c1, . . . , ck, con multiplici-dades respectivas m1 . . . , mk, hay una factorizacion

p = (X − c1)m1 · · · (X − ck)mkq, donde q es un polinomio que no tiene raıces en K.

(cuando K = C, esto obliga a que q sea constante, como comentaremos posteriormente.)

Una herramienta importante en el estudio de las raıces multiples es la derivacion de polinomios,que puede definirse ‘formalmente’ para cualquier polinomio sin necesidad del concepto de lımite, yque obedece a las reglas conocidas para la derivacion de los polinomios reales.

Definicion 3.2.32. Dado un polinomio

p(X) = a0 + a1X + a2X2 + · · ·+ anX

n ∈ K[X],

su polinomio derivado es

p′(X) = a1 + 2a2X + 3a3X2 + · · ·+ nanX

n−1 ∈ K[X].

El polinomio derivado de p′ es el segundo derivado p′′ de p, y reiterando se obtienen los sucesivosderivados p′′′, . . . , p(k), . . .

Las funciones polinomicas asociadas a estos polinomios son la derivada primera de la funcionpolinomica p, la derivada segunda, . . . , la derivada k-esima, . . .

Lema 3.2.33. Dados p, q, a ∈ K[X], se tiene

(i) (p+ q)′ = p′ + q′;

(ii) (pq)′ = p′q + q′p;

(iii) si a constante, a′ = 0 y (ap)′ = ap′ .

Demostracion. Basta aplicar (con paciencia) la definicion.

Proposicion 3.2.34. Sea K un cuerpo conmutativo que contiene a Q. Dado p ∈ K[X] no nulo,

(i) las raıces multiples de p, con multiplicidad m, son raıces de p′ con multiplicidad m− 1;

(ii) las raıces multiples de p son exactamente las raıces del maximo comun divisor de p y p′; yun c ∈ K es raız de p con multiplicidad m si y solo si es raız de mcd(p, p′) con multiplicidadm− 1;

(iii) c ∈ K es una raız de p de orden m ≥ 1 si y solo si la primera derivada no nula de p en c esla de orden m:

p(c) = 0, p′(c) = 0, . . . , p(m−1)(c) = 0, p(m)(c) 6= 0.


Demostracion.

(i) c ∈ K es una raız de p de orden m ≥ 1 si y solo si p = (X− c)mq con q(c) 6= 0; pero entonces,cuando m ≥ 2, p′ = m(X−c)m−1q+(X−c)mq′ = (X−c)m−1[mq+(X−c)q′] = (X−c)m−1q1y q1(c) = mq(c) + 0 · q′(c) = mq(c) 6= 0 ya que m 6= 0, con lo cual c es una raız de p′ demultiplicidad m− 1.

(ii) Si c ∈ K es una raız de p de multiplicidad m, es raız de p′ de multiplicidad m − 1 segunacabamos de probar, y (X − c)m−1 divide por tanto a p y a p′, pero (X − c)m no, luego(X − c)m−1 tambien divide a mcd(p, p′) y (X − c)m no lo divide, es decir, c es una raız demcd(p, p′) de multiplicidad m− 1.

Recıprocamente, si c es una raız de d = mcd(p, p′) de multiplicidad k, (X − c)k divide a d ypor tanto divide a p y a p′, o sea, c es raız de p y p′ de multiplicidad al menos k, luego c esentonces una raız de p de multiplicidad necesariamente igual a k + 1.

(iii) Si c ∈ K es una raız de p de orden m, aplicando reiteradamente (i), es una raız de ordenm− 1 de p′, de orden m− 2 de p′′, . . . , de orden 1 de p(m−1). En consecuencia, p(m−1)(c) = 0,p(m)(c) 6= 0.

Supongamos ahora que

p(c) = 0, p′(c) = 0, . . . , p(m−1)(c) = 0, p(m)(c) 6= 0.

Recorriendo a la inversa el camino anterior, c es una raız de p(m−1) necesariamente simple,una raız de p(m−2) forzosamente doble, . . . , una raız de p obligatoriamente de multiplicidadm.

Notese que p′ puede tener raıces que no son raıces de p: por ejemplo, si p = X2 − 1, p′ = 2X.

Ejercicio. Hallar todas las raıces multiples de X5 + 3X4 + 4X3 + 4X2 + 3X + 1.

Raıces en Q.

El estudio y localizacion (exacta o aproximada) de los ceros de los polinomios es de granimportancia en numerosos ambitos de las Matematicas, como ira comprobando el lector a lo largode sus estudios. La determinacion de los valores que alcanzan las funciones polinomicas es tambien,esencialmente, un problema de ceros, puesto que p(x) = y ∈ K para algun x ∈ K si y solo sip(x)−y = 0, i.e., si x es un cero del polinomio p(X)−y. En estos tipos de cuestiones intervienen demanera decisiva las propiedades especıficas del cuerpo que se considera. Por ejemplo, en cualquiercuerpo totalmente ordenado (Q, R, . . . ) se tiene para todo x ∈ K que x2 ≥ 0, x2 + 1 ≥ 1 > 0,luego X2 + 1 no tiene ningun cero en estos cuerpos. Tampoco X2− 2 tiene ceros en Q (¿por que?),aunque los tiene en R como sabemos.

No hay, en general, formulas ‘razonables’ que permitan expresar las raıces de un polinomiocualquiera en funcion de sus coeficientes (la busqueda de tales formulas ha desempenado un papelimportantısimo en la historia de las Matematicas, ver p. ej. [2], [3], [4], [5]). En este apartadoexpondremos algunos criterios muy sencillos que permiten limitar la busqueda de las raıces de lospolinomios en Q. La herramienta basica es la divisibilidad de numeros enteros, dado que podemosconocer las raıces de un polinomio en Q hallando las de un polinomio con coeficientes en Z. Enefecto, si tenemos un polinomio

p(X) = a0 + a1X + a2X2 + · · ·+ anX

n ∈ Q[X],

y los coeficientes a0, . . . , an se expresan como fracciones bk/m con un denominador comun m, locual siempre es posible, sera p(c) = 0 si y solo si q(c) = 0, donde

q(X) = b0 + b1X + · · ·+ bnXn,

con coeficientes b0, . . . , bn ∈ Z.

3.2. POLINOMIOS 107

Proposicion 3.2.35. Sea q(X) = bnXn+ bn−1X

n−1 + · · ·+ b1X+ b0 un polinomio con coeficientesb0, . . . , bn ∈ Z, de grado n ≥ 1. Los ceros enteros de q son divisores del termino independiente b0.Si c = a/b ∈ Q es un cero de q escrito en forma irreducible [es decir, a, b ∈ Z y mcd(a, b) = 1], elnumerador a divide al termino independiente b0, y el denominador b divide al coeficiente directorbn.

Demostracion. Si c ∈ Z es tal que q(c) = 0, se deduce que b0 = c(−bncn−1 − · · · − b1) y por tantoc divide a b0.

Si q(c) = 0 para c = a/b, a, b ∈ Z y mcd(a, b) = 1, sustituyendo y multiplicando por bn resulta

0 = bnan + bn−1a

n−1b+ · · ·+ b1abn−1 + b0b

n = a(bnan−1 + bn−1an−2b+ · · ·+ b1b

n−1) + b0bn,

luego a divide a b0bn, lo que solo es posible si a divide a b0; y analogamente b divide a bnan, luegoa bn.

Las raıces enteras deben cumplir otras condiciones faciles de comprobar.

Proposicion 3.2.36. Sea q(X) = bnXn+ bn−1X

n−1 + · · ·+ b1X+ b0 un polinomio con coeficientesb0, . . . , bn ∈ Z, de grado n. Si c ∈ Z es un cero de q, necesariamente (c− 1)|q(1) y (c+ 1)|q(−1).

Demostracion. Aplicando el teorema del resto, q(X) = (X − c)q1(X), lo que implicaq(1) = (1− c)q1(1) = (c− 1)(−q1(1)) y (c− 1)|q(1).Analogamente q(−1) = (−1− c)q1(−1) = (c+ 1)(−q1(−1)) y (c+ 1)|q(−1).

Corolario 3.2.37. En Q hay polinomios sin raıces de grado arbitrario (≥ 2).

Demostracion. Aplicar lo anterior a los polinomios Xn − 2, por ejemplo.

Ejercicio. Hallar las raıces de18X3 + 3X2 − 4X − 1.

3.2.5. Factorizacion de polinomios.

El papel jugado en Z por los numeros primos lo desempenan enK[X] los polinomios irreducibles.

Definicion 3.2.38. Diremos que un polinomio p no constante es irreducible si cuando p = rspara polinomios r, s, necesariamente deg r = 0 o deg s = 0.

Dicho de otra forma, p es irreducible si es no constante y para cada polinomio no constante q,q|p implica que p/q es constante.

Obviamente, los polinomios de grado 1 (polinomios lineales) son irreducibles. Los polinomiosque no son irreducibles deben admitir una factorizacion como producto de polinomios de gradomayor o igual que 1.

Corolario 3.2.39. Dado p ∈ K[X],

(i) si p es un polinomio cuadratico (de grado 2), entonces p es irreducible si y solo si no tieneraıces en K;

(ii) si p es un polinomio cubico (de grado 3), entonces p es irreducible si y solo si no tiene raıcesen K;

(iii) si p es de grado mayor o igual que 4, entonces para que p sea irreducible es condicion nece-saria, pero no suficiente, que p no tenga raıces en K.



Ejercicio. Sea a ∈ K tal que 4a 6= 0. Probar que el polinomio p(X) = aX2 + bX + c ∈ K[X] tieneraıces en K si y solo si su discriminante ∆ = b2 − 4ac es un cuadrado perfecto en K, es decir,

si existe δ ∈ K tal que δ2 = ∆, en cuyo caso las raıces de p(X) son−b+ δ

2a,−b− δ

2a(que suelen

escribirse conjuntamente en la formula tradicional

−b±√b2 − 4ac

2a. )

Indicacion. Para x ∈ K,

p(x) = 0 ⇐⇒ 4ap(x) = 0 ⇐⇒ 4a2x2 + 4abx+ 4ac = 0 ⇐⇒ (2ax+ b)2 − b2 + 4ac = 0⇐⇒ (2ax+ b)2 −∆ = 0 ⇐⇒ (2ax+ b)2 = ∆ ⇐⇒

⇐⇒

{NUNCA cuando ∆ /∈ K2 := {t2 : t ∈ K}, o bien⇐⇒ (2ax+ b)2 = δ2 ⇐⇒ 2ax+ b = δ o 2ax+ b = −δ.

– — o 0 o — –

La naturaleza de los polinomios irreducibles es muy variable, dependiendo del cuerpo particularque se considere, y en general no se sabe como son los polinomios irreducibles sobre un cuerpocualquiera. No es este el lugar para un estudio amplio del tema: por lo que a nosotros respecta, lainformacion fundamental es que en C[X] los polinomios irreducibles son los lineales (de grado 1),debido al llamado Teorema fundamental del algebra (D’Alembert-Gauss):

Todo polinomio no constante con coeficientes complejos posee una raız en C.

Como consecuencia, se puede afirmar:

[1] Todos los polinomios irreducibles de C[X] son de grado uno. Este hecho se indica diciendoque C es algebraicamente cerrado. En particular, los polinomios monicos irreducibles deC[X] son de la forma X − t con t ∈ C.

[2] Los polinomios monicos irreducibles de R[X] son de dos formas:

• de grado uno, de la forma X − t con t ∈ R.• de grado dos, de la forma (X − t)2 + r2 con t, r ∈ R, r 6= 0.

[3] En Q[X] hay polinomios irreducibles del grado que se desee.

– — o 0 o — –

Sobre el esquema empleado en Z, puede probarse la existencia (con los ajustes pertinentes) dedescomposicion de un polinomio en producto de factores irreducibles.

Lema 3.2.40. Un polinomio p no constante es irreducible si y solo si cuando p|rs, necesariamentep|r o p|s (en palabras, cuando divide a un producto de polinomios tiene que dividir al menos a unode los factores)

Demostracion. Si p es irreducible y divide a rs, o bien mcd(p, r) = 1 (y entonces p|s segun la

Proposicion 3.2.20), o bien mcd(p, r) = d 6= 1, con lo cual p = ad, a constante no nula, y d =1ap;

entonces, para algun q, r = qd = q1ap =

(1aq

)p, es decir, p|r.

Recıprocamente, si p cumple la condicion del enunciado tiene que ser irreducible, pues de p = rsse sigue que p|rs, luego o bien p|r (y como r|p es deg p = deg r y por tanto deg s = 0) o bien p|s (yanalogamente deg r = 0).

3.2. POLINOMIOS 109

Corolario 3.2.41. Sean p, q ∈ K[X] monicos e irreducibles tales que p divide a q. Entonces p = q.

Demostracion. Puesto que p es irreducible, no es una constante, luego q = ap donde forzosamentedeg a = 0, puesto que q es irreducible. Como p y q son monicos, necesariamente a = 1 y p = q.

Correspondiendo al teorema fundamental de la Aritmetica tenemos el siguiente, que podrıallamarse ‘teorema fundamental de la aritmetica de polinomios’.

Teorema 3.2.42 (de factorizacion unica). Para todo polinomio p ∈ K[X] no constante existena constante y q1, . . . , qm ∈ K[X] monicos e irreducibles tales que

p = aq1 · · · qm.

Ademas, a y los qj son unicos para cada p.En palabras, p puede descomponerse como producto de una constante por factores monicos

irreducibles de manera unica, salvo el orden de dichos factores.(Esto se expresa diciendo que el dominio de integridad K[X] es de factorizacion unica .)

Demostracion. Sea a el coeficiente director de p, entonces p = a−1p es monico y p = ap. Veamosque todo polinomio monico no constante p se puede expresar como producto de polinomios monicosirreducibles. Para ello procedamos por induccion sobre el grado deg p ≥ 1.Si deg p = 1, es claro que p es irreducible.Supongamos que deg p > 1, y que el resultado es cierto para todo polinomio monico de gradoinferior al de p.Si p es irreducible, se sigue lo pedido.En caso contrario, se puede expresar p = g1g2 con g1, g2 ∈ K[X] no constantes, esto es, de gradono inferior a 1. Ademas podemos elegirlos monicos pues el producto de los coeficientes directoresde ambos polinomios vale 1. Puesto que deg g1,deg g2 < deg p, por hipotesis de induccion g1 y g2se pueden expresar como producto de polinomios monicos irreducibles, luego lo mismo sucede conp = g1g2.Veamos la unicidad: sean aq1q2 · · · qm = p = bp1p2 · · · pr dos descomposiciones como las delenunciado, donde qi, pj ∈ K[X] monicos e irreducibles, a, b ∈ K. Puesto que el producto depolinomios monicos es monico se sigue que a = b es el coeficiente director de p. Por tantoq1q2 · · · qm = p1p2 · · · pr. Ahora q1 divide p1p2 · · · pr, y como q1 es irreducible, divide a algun pj .Cambiando la numeracion, si es preciso, podemos suponer que q1 divide p1, y como p1 y q1 sonmonicos, por el corolario anterior se sigue que p1 = q1. Simplificando nos queda q2 · · · qm = p2 · · · pr.Procediendo analogamente con q2 y reiterando el proceso se sigue que m = r y salvo el orden esp2 = q2, p3 = q3, . . . , pm = qm.

Ejemplo. Factoricemos p(X) = 14X5 − 25X4 − 85X3 + 285X2 − 179X + 30 en Q[X]. Buscamosprimero sus raıces enteras, que pueden ser ±1, ±2, ±3, ±5, ±6, ±10, ±15, ±30; pero p(1) = 40,p(−1) = 550 (utilizar el algoritmo de Ruffini), luego solo −3 es una posible raız; de nuevo medianteel algoritmo de Ruffini comprobamos que p(−3) = 0 y que

q(X) = p(X)/(X + 3) = 14X4 − 67X3 + 116X2 − 63X + 10,

polinomio que ya no puede tener raıces enteras y cuyas posibles raıces fraccionarias son ±1/2, ±5/2,±1/7, ±2/7, etc. Afortunadamente, probando primero 1/2 resulta q(1/2) = 0,

r(X) = q(X)/(X − 1/2) = 14X3 − 60X2 + 86X − 20 = 2(7X3 − 30X2 + 43X − 10),

que solo puede tener raıces fraccionarias entre ±1/7, ±2/7, etc. Probando nuevamente se obtiener(2/7) = 0, (1/2)r(X)/(X − 2/7) = 7X2 − 28X + 35 = 7(X2 − 4X + 5) = 7[(X − 2)2 + 1], que yano puede tener raıces en Q (¿por que?) y por tanto es irreducible (¿por que?). Finalmente, pues,

p(X) = 14X5 − 25X4 − 85X3 + 285X2 − 179X + 30 = 14(X + 3)(X − 12)(X − 2

7)(X2 − 4X + 5).


Corolario 3.2.43. Sean p1, . . . , pm ∈ K[X] no nulos, factorizados como potencias de polinomiosmonicos irreducibles (distintos). Entonces:

(i) El mcm(p1, . . . pm) es el producto de los factores comunes y no comunes con mayor exponente.

(ii) El mcd(p1, . . . pm) es el producto de los factores comunes con menor exponente.

Demostracion. Es una comprobacion directa utilizando las definiciones y las propiedades anteriores.

Ejemplo. Sean p, q ∈ Q[X] los polinomios:

p(X) = X5 + 3X4 + 4X3 + 4X2 + 3X + 1, q(X) = X6 +X4 −X2 − 1.

Determinemos mcd(p, q), mcm(p, q) a partir de su factorizacion. Procediendo como antes es facilver que

p(X) = (X + 1)3(X2 + 1), q(X) = (X + 1)(X − 1)(X2 + 1)2,

y asımcd(p, q) = (X + 1)(X2 + 1), mcm(p, q) = (X + 1)3(X − 1)(X2 + 1)2.

Ejercicios

En los ejercicios siguientes, si no se especifica nada sobre K se supone K = Q.13.1. Sea p ∈ Q[X] tal que p(1) = 1, p(2) = 4. Sea q(X) = X2− 3X + 2. Determinar el resto de ladivision de p por q.

13.2. Hallar el cociente y el resto de la division de X2, X3, X4 y X5 por el polinomio q(X) =X3 − 2X2 + 3X − 1.

13.3. Determinar polinomios u y v tales que

X3 u(X) + (1−X)2 v(X) = 1

(i) utilizando el algoritmo de Euclides-Bezout;

(ii) desarrollando (X + (1−X))4 por la formula del binomio de Newton.

13.4. ¿Cuales son las raıces del polinomio

p(X) = 1− 11!X +

12!X(X − 1) + · · ·+ (−1)n

1n!X(X − 1) · · · (X − n+ 1)

para cada n ∈ N?Indicacion : ¿Quien es (1− t)m?

13.5. Demostrar que si c/d es una fraccion irreducible que representa uno de los ceros del polinomiode coeficientes enteros

p(X) = anXn + · · ·+ a1X + a0,

entonces c−md es un divisor de p(m) para todo entero m.

Determinar los ceros racionales del polinomio

p(X) = X4 − 2X3 − 8X2 + 13X − 24.

13.6. Hallar un polinomio de grado 3 que al dividirlo por X−1, X−2 y X+5 da, respectivamente,restos 2, 1, 8. ¿Hay mas de una solucion?

13.7. ¿Puede ser un polinomio divisible por su derivada? Justificar la respuesta.

3.2. POLINOMIOS 111

13.8. Sean p(X) = X5 + 2X3 − 5X − 3, q(X) = X2 − 2X − 12. Hallar el cociente y el resto de ladivision de p por q, y deducir que p y q son relativamente primos.

13.9. Hallar el maximo comun divisor y el mınimo comun multiplo de los polinomios

p(X) = 2X4 +X3 − 8X2 −X + 6, q(X) = 2X3 − 7X2 + 8X − 3.

¿Cuales son las raıces de p y q?

13.10. (1) Expresar el polinomio p(X) = 3X4 − 5X3 + 6X2 + 7X − 5 como combinacion lineal depotencias de X − 2.

(Indicacion : Dividir sucesivamente por X − 2.)(2) ¿Cuanto valen p(2), p′(2), p′′(2), p′′′(2), p(iv)(2)?

13.11. Formula de Taylor. Sea p ∈ Q(X) un polinomio de grado n y a ∈ Q. Probar que

p(X) =n∑k=0

p(k)(a)k!

(X − a)k.

13.12. Derivada n-esima de un producto (Leibniz). Sea K un cuerpo cualquiera y p, q ∈K[X]. Probar por induccion que

(pq)(n) =n∑k=0

(n

k

)p(k)q(n−k).

13.13. Sea K un cuerpo cualquiera. Demostrar que si anXn + an−1X

n−1 + · · ·+ a1X + a0 ∈ K[X]es irreducible, tambien lo es an + an−1X + · · ·+ a1X

n−1 + a0Xn.

13.14. Descomponer el polinomio X4 − 5X2 + 6 en factores irreducibles en Q[X].

13.15. Probar que p(X) = X4 + 4 no tiene raıces en Q y que puede factorizarse (en Q[X]) comoproducto de dos polinomios de grado 2.

3.2.6. Polinomios, maple y Mathematica

Los polinomios aparecen en casi todas las areas de la Matematica en una o varias de susmultiples facetas. Son tambien de fundamental importancia en numerosısimas aplicaciones a lasdemas ciencias. Por tanto, no es de extranar que los programas de calculo simbolico dispongan deuna amplia cantidad de recursos para su manipulacion.

Como senala D. Duval en [Duval], 〈〈 los polinomios constituyen elementos basicos para el calculoformal; [· · · ] figuran explıcita o implıcitamente en todos los calculos, por lo que es imprescindiblesaber manejarlos lo mas eficazmente posible.〉〉

Es imposible dar una descripcion breve de las ordenes de maple y Mathematica que seencargan del manejo de los polinomios, y menos de los matices que admiten muchas de ellas. Enconsecuencia, resenaremos las mas basicas y nos remitimos a los manuales o al menu de ayuda decada programa para mas informacion.

En lo que sigue, A, B, etc., indican polinomios en una indeterminada x.


Diferentes representaciones de un polinomio

maple Matematica RESULTADOcollect(A,x); Collect[A,x] Reorganiza el polinomio de manera que x sea

“la indeterminada dominante”, aunque hayaotros “parametros variables”.

expand(A); Expand[A] Desarrolla productos y potencias.? FactorTerms[A] Si lo hay, saca factor comun numerico.? FactorTerms[A,x] Si lo hay, saca factor comun que no dependa

de x.simplify(A); Simplify[A] “Simplifica” (a veces) la expresion de A.

Ejemplos: maple

collect(x + 4*y + 5*x*y, x); (1 + 5 y)x+ 4 ycollect(x + 4*y + 5*x*y, y); (4 + 5x) y + xexpand((2 + 4*x^2)^2*(x - 1)^3); 52x3 − 28x2 + 12x− 4 + 64x5 − 64x4 + 16x7 − 48x6

simplify((x - 1)^2 + 4*x); x2 + 2x+ 1

Ejemplos: Matematica

Collect[x + 4 y + 5 x y, x] 4y + x(1 + 5y)Collect[x + 4 y + 5 x y, y] x+ (4 + 5x)yExpand[(2 + 4 x^2)^2 (x - 1)^3] −4 + 12 x− 28 x2 + 52 x3 − 64 x4 + 64 x5 − 48 x6 + 16 x7

FactorTerms[2 + 4 x^2] 2 (1 + 2x2)FactorTerms[2 a b + 4 a x^2, x] 2 a (b+ 2x2)Simplify[(x - 1)^2 + 4 x] (1 + x)2

Division, mcd, mcm, identidad de Bezout. Derivacion.

maple Matematica RESULTADOquo(A,B,x); PolynomialQuotient[A,B,x] Cociente de la division de A por B.rem(A,B,x); PolynomialRemainder[A,B,x] Resto de la division de A por B.gcd(A,B); PolynomialGCD[A,B] Maximo comun divisor de A y B.lcm(A,B); PolynomialLCM[A,B] Mınimo comun multiplo de A y B.gcdex(A,B,x,’s’,’t’);s,t;

? Maximo comun divisor de A y By coeficientes de la identidad deBezout.

diff(A, x) D[A, x] A′, polinomio derivado de A.

Ejemplos: maple

Para A:=2*x^4+x^3-8*x^2-x-6; y B:=2*x^3-7*x^2+8*x-3;

3.2. POLINOMIOS 113

quo(A,B); x+ 4rem(A,B); 6 + 12x2 − 30xgcd(A,B); 1lcm(A,B); (2x4 + x3 − 8x2 − x− 6)(2x3 − 7x2 + 8x− 3)

gcdex(A,B,x,’u’,’v’); u,v;1

−524 +

524x− 1

12x2,

112− 1

8x+

18x2 +

112x3

diff((x + 1)^2*(x - 1)^3,x); 2(x+ 1)(x− 1)3 + 3(x+ 1)2(x− 1)2

diff(expand((x + 1)^2*(x - 1)^3),x); 5x4 − 4x3 − 6x2 + 4x+ 1expand(diff((x + 1)^2*(x - 1)^3,x)); 5x4 − 4x3 − 6x2 + 4x+ 1


Para A=2 x^4+x^3-8 x^2-x-6, B=2 x^3-7 x^2+8 x-3,

PolynomialQuotient[A,B, x] 4 + xPolynomialRemainder[A,B, x] 6− 30x+ 12x2

PolynomialGCD[A,B] 1PolynomialLCM[A,B] (−3+8x−7x2 +2x3)(−6−x−8x2 +x3 +2x4)D[(x + 1)^2*(x - 1)^3,x] 2 (−1 + x)3 (1 + x) + 3 (−1 + x)2 (1 + x)2

D[Expand[(x + 1)^2*(x - 1)^3],x] 1 + 4x− 6x2 − 4x3 + 5x4

Expand[D[(x + 1)^2*(x - 1)^3,x]] 1 + 4x− 6x2 − 4x3 + 5x4

Raıces

Aquı aumenta la complicacion de manera considerable. Ambos programas permiten distintostipos de busqueda de raıces, sea en diferentes cuerpos, sea proporcionando valores numericos apro-ximados si no hay o no interesan valores simbolicos ‘exactos’. Nos limitamos, por ello, a recoger lasordenes mas simples.

maple Matematica RESULTADOroots(A,x); Da las raıces (racionales) y su multiplicidad. Puede

omitirse la variable si es la ‘evidente’.Roots[A == 0, x] Ver ejemplos. Puede omitirse la variable si es la

‘evidente’.solve(A=0,x); Solve[A == 0, x] Ver ejemplos. Puede omitirse la variable si no hay

ambiguedad.fsolve(A=0,x); NSolve[A == 0, x] (Puede omitirse la x si es la variable ‘evidente’.)

Busca soluciones aproximadas usando aritmeticade punto flotante, con diferentes opciones.

Ejemplos: maple

roots(x^3 + x^2 - 12); [[2, 1]]

solve(x^3 + x^2 - 12=0); 2,−32

+12I√

15,−32− 1

2I√

15

fsolve(x^3 + x^2 - 12=0); 2.fsolve(x^3 + x^2 - 12=0,x,complex); −1.500000000− 1.936491673 I,

−1.500000000 + 1.936491673 I, 2.



Roots[x^3 + x^2 - 12 == 0] x ==12(−3− ıı

√15)|| x ==

12(−3 + ıı

√15)|| x == 2

Solve[x^3 + x^2 - 12 == 0]

{{x→ 2},

{x→ 1

2(−3− ıı

√15)},

{x→ 1

2(−3 + ıı

√15)}}

NSolve[x^3 + x^2 - 12 == 0] {{x→ −1.5− 1.93649 ıı}, {x→ −1.5 + 1.93649 ıı}, {x→ 2.}}

Factorizacion

Como las raıces, la factorizacion de polinomios depende del cuerpo en el que se toman loscoeficientes. La cantidad de situaciones posibles es inmensa, y solo podemos dar idea somera dealgunas de ellas mediante ejemplos.

maple Matematica RESULTADOfactor(A); Factoriza respecto al menor cuerpo que contiene a los

coeficientes. Admite opciones.Factor[A] 〈〈Factoriza sobre los enteros〉〉, dice el manual. Ver

ejemplos.irreduc(A); true si A es irreducible sobre el menor cuerpo que

contiene a los coeficientes, false si es reducible. Ad-mite opciones.

Ejemplos: maple

factor(4*x^2-1);

(2x− 1)(2x+ 1)

factor(x^2 - 2*sqrt(2)*x + 2);

(x−√

2)2

factor(x^6-12*x^4+44*x^2-48);

(x− 2)(x+ 2)(x2 − 6)(x2 − 2)

factor(sqrt(2)*(x^6-12*x^4+44*x^2-48));√

2 (x2 − 6)(x+√

2)(x−√

2)(x+ 2)(x− 2)

factor(sqrt(2)*sqrt(3)*(x^6-12*x^4+44*x^2-48));√

3√

2 (x−√

3√

2)(x+√

3√

2) (x+√

2)(x−√

2)(x+2)(x− 2)

factor(x^6-12*x^4+44*x^2-48,{sqrt(2),sqrt(3)}); (mas ‘ortodoxo’)

(x−√

3√

2)(x+√

3√

2) (x+√

2)(x−√

2)(x+ 2)(x− 2)

irreduc(x^3+5);

true

irreduc(x^3+5,5^(1/3));

false

factor(x^3+5,5^(1/3));

(x2 − x 5(1/3) + 5(2/3)) (x+ 5(1/3))

3.2. POLINOMIOS 115

Ejemplos: Mathematica

Factor[4 x^2 + 1]

(−1 + 2x) (1 + 2x)

Factor[x^2 - 2 Sqrt[2] x + 2]

2− 2x+ x2

Factor[x^2 - 2 Sqrt[2] x + 2, Extension -> Sqrt[2]]

(√

2− x)2

Factor[x^6 - 12 x^4 + 44 x^2 - 48]

(−2 + x) (2 + x) (−6 + x2) (−2 + x2)

Factor[Sqrt[2] (x^6 - 12 x^4 + 44 x^2 - 48)]√

2 (−2 + x) (2 + x) (−6 + x2) (−2 + x2)

Factor[x^6 - 12 x^4 + 44 x^2 - 48, Extension -> {Sqrt[2],Sqrt[3]}]

(√

2−x) (√

6−x) (−2+x) (2+x) (√

2+x) (√

6+x) (x+√

2)(x−√

2)(x+2)(x−2)

(Para entender que significan las extensiones de cuerpos y por que son importantes, ver elcapıtulo 7 de [GJPR].)

Bibliografıa

[C-C-S] Cohen, A. M.; Cuypers, H.; Sterk, H.: Algebra Interactive! (Learning algebra in anexciting way). Springer, Berlin, 1999.



[Duval] Duval, D.: Calculo simbolico y automatizacion. Mundo cientıfico, Extra 1: El universo delos numeros, pp. 78–86.



El apartado sobre factorizacion de polinomios esta en buena parte tomado de

[Bern] Bernal, E.: Algebra Lineal. Apuntes de la asignatura, Zaragoza, 1998–99.


[1] M. Conthe: La paradoja de Simpson. Expansion, 08/10/2002.

http://www.expansiondirecto.com/edicion/componentes/noticia/

VersionImprimirExp cmp/0,3240,184488,00.html

http://www.expansiondirecto.com/edicion/componentes/noticia/

VersionImprimirExp cmp/0,3240,192294,00.html

(Cada una de las direcciones debe ir escrita en una sola lınea.)

[2] J. M. Albaiges, Abel-Galois: dos vidas, un destino.

http://www.grijalvo.com/Albaig%E8s/b JMAiO ABEL GALOIS.htm

[3] The MacTutor History of Mathematics archive: Quadratic, cubic and quartic equa-tions.

http://www-history.mcs.st-and.ac.uk/history/HistTopics/Quadratic etc equations.html

[4] The MacTutor History of Mathematics archive: The development of group theory.

http://www-history.mcs.st-and.ac.uk/history/HistTopics/Development group theory.html

[5] E. T. Bell, Los grandes matematicos: Abel.

http://www.geocities.com/grandesmatematicos/cap17.html

117

http://www.expansiondirecto.com/edicion/componentes/noticia/VersionImprimirExp_cmp/0,3240,184488,00.html

http://www.expansiondirecto.com/edicion/componentes/noticia/VersionImprimirExp_cmp/0,3240,192294,00.html

http://www.grijalvo.com/Albaig%E8s/b_JMAiO_ABEL_GALOIS.htm

http://www-history.mcs.st-and.ac.uk/history/HistTopics/Quadratic_etc_equations.html

http://www-history.mcs.st-and.ac.uk/history/HistTopics/Development_group_theory.html

http://www.geocities.com/grandesmatematicos/cap17.html

118 BIBLIOGRAFIA

Capıtulo 4

Numeros reales

En la asignatura de Analisis matematico I se han tratado las propiedades basicas de los numerosreales desde un planteamiento axiomatico mas o menos explıcito. Aquı nos limitaremos, por tanto,a describir a grandes rasgos las distintas construcciones de R a partir de Q y la caracterizacionaxiomatica de R, y estudiaremos brevemente la representacion decimal (y otras) de los numerosreales. La bibliografıa oportuna se ira citando a lo largo de la exposicion.

4.1. LECTURA: Construcciones de los numeros reales.

4.1.1. Insuficiencia de Q

Ya hemos visto que desde el punto de vista algebraico, el sistema de los numeros racionales esbastante incompleto: si bien en Q es posible resolver siempre ecuaciones del tipo ax + b = 0, cona 6= 0, hay ecuaciones tan simples como x2 = 2 que no tienen solucion. Esto fue descubierto yapor los pitagoricos en el siglo V antes de nuestra era, en su formulacion geometrica, en terminosde conmensurabilidad e inconmensurabilidad de longitudes (ver notas historicas en [Ebb], cap. 2;tambien, [Kl1], p. 79 y pp. 103–109). Dos segmentos AB y CD son conmensurables si pueden sermedidos exactamente con una unidad de longitud comun u, es decir, si hay un numero “exacto”m ∈N de segmentos de longitud u que colocados uno tras otro sin solaparse cubren AB, y lo mismoun numero n de segmentos para CD; la razon o proporcion entre las longitudes de los segmentosAB y CD es la misma que la razon (el cociente) entre los numeros m y n. En caso contrario, soninconmensurables.

2/5 3/5 4/5 X

Q

1

P

1/50 D s t

s

t

A

C

Bu

?

?

Capıtulo 4

Numeros reales

En la asignatura de Analisis matematico I se han tratado las propiedades basicas de los numerosreales desde un planteamiento axiomatico mas o menos explıcito. Aquı nos limitaremos, por tanto,a describir a grandes rasgos las distintas construcciones de R a partir de Q y la caracterizacionaxiomatica de R, y estudiaremos brevemente la representacion decimal (y otras) de los numerosreales. La bibliografıa oportuna se ira citando a lo largo de la exposicion.

4.1 LECTURA: Construcciones de los numeros reales.

4.1.1 Insuficiencia de Q

Ya hemos visto que desde el punto de vista algebraico, el sistema de los numeros racionales esbastante incompleto: si bien en Q es posible resolver siempre ecuaciones del tipo ax + b = 0, cona �= 0, hay ecuaciones tan simples como x2 = 2 que no tienen solucion. Esto fue descubierto yapor los pitagoricos en el siglo V antes de nuestra era, en su formulacion geometrica, en terminosde conmensurabilidad e inconmensurabilidad de longitudes (ver notas historicas en [Ebb], cap. 2;tambien, [Kl1], p. 79 y pp. 103–109). Dos segmentos AB y CD son conmensurables si puedenser medidos exactamente con una unidad de longitud comun u, es decir, si hay un numero “exacto”m ∈ N de segmentos de longitud u que colocados uno tras otro sin solaparse cubren AB, y lo mismoun numero n de sementos para CD; la razon o proporcion entre las longitudes de los segmentosAB y CD es la misma que la razon (el cociente) entre los numeros m y n. En caso contrario, soninconmensurables.

Figura 1 Figura 2 Figura 3

Fijado un segmento cualquiera, es facil construir por semejanza de triangulos un nuevo segmentocuya razon con el primero sea igual a un valor m/n arbitrariamente dado (en la figura 1 se muestra

107

Figura 1 Figura 2 Figura 3

Fijado un segmento cualquiera, es facil construir por semejanza de triangulos un nuevo segmentocuya razon con el primero sea igual a un valor m/n arbitrariamente dado (en la figura 1 se muestra

119

120 CAPITULO 4. NUMEROS REALES

la construccion de un segmento de longitud 1/5: la recta OPQ y el segmento OP son arbitrarios;el punto Q se obtiene trasladando OP cinco veces a lo largo de dicha recta; la paralela por P alsegmento que une Q con 1 corta a la recta OX en un punto a distancia 1/5 de O). En sentidocontrario, no es descabellado pensar que dos segmentos cualesquiera siempre son conmensurables:el algoritmo de Euclides, con la division interpretada como “sustraccion repetida de segmentosiguales”, lleva graficamente a una unidad de medida comun —hasta donde el ojo puede apreciar, almenos. Por ejemplo, en la figura 2, quitando a AB un segmento de longitud igual a CD queda unsegmento s, de longitud menor que CD; quitando a CD dos segmentos de longitud igual a s, quedaun segmento t, de longitud menor que s; quitando a s un segmento de longitud igual a t, quedaun segmento u tal que la longitud de t es exactamente tres veces la longitud de u (en t encajanperfectamente tres segmentos de longitud u). Por tanto, u ‘mide’ a AB y CD (en el lenguaje clasico,u es una parte alıcuota comun de AB y CD): la longitud de AB es 15 veces la longitud de u y lalongitud de CD es 11 veces la longitud de u; la proporcion entre las longitudes de los segmentosAB y CD es, en este caso, de 15 a 11.

Sin embargo, la intuicion que el ojo sugiere es desmentida por la razon, y como es bien sabido, elteorema de Pitagoras obliga a descartar la hipotesis de ‘conmensurabilidad universal’: la diagonaldel cuadrado (figura 3), de la que no dudamos que tenga una longitud, resulta inconmensurablecon el lado, pues si este tiene una longitud m respecto de cualquier unidad, la diagonal ha de teneruna longitud n tal que n2 = m2 +m2 = 2m2, lo cual lleva a un absurdo tras eliminar sucesivamentefactores 2 en m y n. (Ver la discusion sobre Aritmetica y Geometrıa en [A-K], p. 43).

Hizo falta mucho talento para solucionar este inconveniente (lo logro Eudoxo, contemporaneode Platon, con su teorıa de las proporciones). Mucho mas tarde, cuando la fiabilidad de la intuiciongeometrica fue puesta en cuestion nuevamente tras el asentamiento de las geometrıas no euclıdeasy la crisis subsiguiente, se hizo necesaria una fundamentacion del continuo, i.e., del conjunto de losnumeros reales (v. [Dur], pp. 70 y ss; [Kl3], cap. 41, pp. 1292 y ss.; [Ebb], cap. 2, pp. 34 y ss.).

No es este el lugar para recorrer la larguısima evolucion historica del concepto de numero (real)hasta las ideas actuales, por lo demas excelentemente expuesta en [Dur], pp. 60 y ss, o [Ebb], pp. 24y ss, por ejemplo. Nos limitaremos en lo que sigue a senalar los principales puntos que subyacen auna presentacion rigurosa de los numeros reales, que quedan abiertos para tratar en una asignaturaposterior sobre Fundamentos de Analisis matematico.

4.1.2. Construcciones de R a partir de Q.

En la ampliacion de un sistema numerico para llegar a otro mayor que subsane alguna deficiencia,la idea directriz es ‘anadir lo mınimo que le falta’. Ası, para construir Z a partir de N ‘se anaden’los opuestos de los numeros naturales (y el 0, si no esta incluido en N); para construir Q a partirde Z, ‘se anaden’ los cocientes de enteros (con denominador no nulo). Para construir R a partir deQ, hay dos procedimientos destacados:

• metodo de Cantor-Meray de las sucesiones fundamentales. Trata de suplir la inexis-tencia de lımite de algunas sucesiones de Cauchy de numeros racionales no convergentes en Q,identificando las sucesiones de Cauchy que “deberıan converger a un mismo valor hipotetico”,porque sus diferencias convergen a 0, con ese “valor”. Se define ası una relacion de equiva-lencia en el conjunto de las sucesiones de Cauchy de numeros racionales: son equivalentesaquellas cuya diferencia tenga lımite 0, de manera que R es el conjunto cociente y un numeroreal es una clase de equivalencia (que va a jugar el papel de ‘lımite’ de todas las sucesionesde la clase). Las operaciones de suma y producto en R se definen a partir de las operacionesde suma y producto de sucesiones, y se demuestra que con ellas R es un cuerpo. Hay quedefinir ası mismo una relacion de orden entre las sucesiones de Cauchy de Q, que permiteluego definir una ordenacion en R con la cual resulta ser un cuerpo totalmente ordenado com-pleto (en el sentido de que todo conjunto no vacıo acotado superiormente posee supremo).El desarrollo en detalle de este proceso se entiende mejor cuando se ha estudiado teorıa de

4.2. AXIOMATICA DE R 121

anillos e ideales. Puede verse, por ejemplo, en [GJPR], [Ebb], [Ham], [S-T] (aquı hay ademasun interesante apartado sobre la ‘conexion con la intuicion’, p. 204).

Este es el metodo mas empleado generalmente, sobre todo porque permite usar construccionesparecidas en otras situaciones (complecion de espacios metricos en Topologıa, por ejemplo.)

• metodo de Dedekind de las cortaduras. Se dirige a conseguir que se cumpla ‘el axiomadel supremo’, no valido en Q. Se parte de las cortaduras en Q, que son pares (A,B) desubconjuntos de Q tales que:

• A y B son complementarios, A ∪B = Q y A ∩B = ∅;• A 6= ∅ 6= B;• cada elemento de A es menor que cada elemento de B.

Cada cortadura esta determinada por A o por B (v. comentarios en [Ebb]), de modo quepodemos quedarnos, por ejemplo, con el conjunto A, y decir como en [Spv], que

un numero real es un conjunto A de numeros racionales con las propiedades siguientes:

• si x ∈ A e y ∈ Q es tal que y < x, entonces tambien y ∈ A;• ∅ 6= A 6= Q;• no hay un elemento maximo en A, de manera que si x ∈ A, existe algun y ∈ A tal quey > x.

De que modo se definen la suma, el producto y la ordenacion en el conjunto R de los numerosreales puede verse en [Spv], pp. 811 y ss.; ver tambien [Ebb], pp. 36 y ss.

• otros metodos. ¿Por que no usar “los decimales” para construir R? Es posible, pero tienemas inconvenientes ‘tecnicos’ que los metodos anteriores. La manera de hacerlo esta indicadaen [Spv], pp. 826–827, ejercicio 2.

Tambien se han empleado intervalos encajados o, equivalentemente, pares de sucesionesmonotonas —los extremos de los intervalos— (v. [Ebb], especialmente el comentario final,p. 46).

4.2. LECTURA: Axiomatica de R.

No se planteo explıcitamente un ‘sistema axiomatico para los numeros reales’ hasta que fue for-mulado esencialmente por Hilbert hacia 1900, en su obra Grundlagen der Geometrie (Fundamentosde Geometrıa). Actualmente, la descripcion axiomatica de R se resume en:

• R es un cuerpo conmutativo totalmente ordenado completo, es decir, tal que todo conjuntono vacıo acotado superiormente tiene supremo.

Ası se introduce R en la mayorıa de los textos de Analisis matematico, para comenzar a estudiarsus propiedades de manera inmediata. Una buena muestra es [Ap].

Unicidad y minimalidad de R.

En las sucesivas ampliaciones de los numeros se busca siempre, como hemos senalado anterior-mente, solucionar algun defecto, pero con una propiedad de minimalidad. Ası, en los contenidos

N ⊂ Z ⊂ Q,

Z es el menor grupo que contiene a N y Q es el menor cuerpo que contiene a Z; ahora, R nosolo es el menor cuerpo completo que contiene a Q, sino que es el unico salvo isomorfismos.Una explicacion detallada de este hecho puede verse en [Spv], cap. 29, y en [Ebb], p. 50; tambien,en [S-T], cap. 10.


4.3. Representacion decimal de los numeros reales

Estudiaremos el significado de la representacion decimal de los numeros reales, justificandoalgunos de los resultados que son conocidos desde la ensenanza secundaria.

En toda esta seccion, cuando no se especifica lo contrario, 〈〈numero〉〉 significa numero real.

4.3.1. Aperitivo.

Lee atentamente estos enunciados:

(1) 0.999 . . . es el numero inmediatamente anterior a 1.

(2) 0.333 · · · = 1/3.

(3) Sea x = 0.999 . . . Entonces 10x = 9.999 . . ., de modo que 10x− x = 9.999 . . .− 0.999 . . . = 9

y de aquı 9x = 9, luego x =99

= 1, es decir, 1 = 0.999 . . .

Responde ahora cuidadosamente a estas cuestiones:

(i) ¿Es cierto (1)?

SI ut NO ut NO SE ut

(ii) ¿Es cierto (2)? Si lo es, ¿por que?


(iii) ¿Es cierto el resultado de (3)?


¿Que consecuencias sacas?

Con los numeros decimales no valen las mismas reglas de operacion que con los demas numerosut

Los numeros reales no pueden manejarse como las letras en el Algebra ut

Otras (explicarlas) ut

4.3.2. Representacion decimal canonica

Las preguntas del apartado anterior tienen por objeto hacernos reflexionar, para que nos plan-teemos la necesidad de aclarar esta cuestion:

¿en que consiste la representacion decimal de un numero real?

Cuando el numero real, en particular, es un entero, la cuestion quedo completamente dilucidada.Pasar de los enteros a los racionales a/b con a ∈ N y b = 10n para algun n ∈ N (*) es ‘casi

automatico’: por ejemplo,

123456789105

= 1 · 103 + 2 · 102 + 3 · 101 + 4 · 100 +510

+6

102+

7103

+8

104+

9105

consta de una ‘parte entera’ 1 ·103 +2 ·102 +3 ·101 +4 ·100, que hemos convenido en representar por1234, y de una ‘parte fraccionaria’ 5 ·10−1 +6 ·10−2 +7 ·10−3 +8 ·10−4 +9 ·10−5, que parece logicoescribir a continuacion de lo anterior como 56789, con algun “separador” en medio que indique que

(*)a/b es una fraccion decimal, no necesariamente irreducible, como en 25/100.

4.3. REPRESENTACION DECIMAL 123

ahora las cifras son los coeficientes de las potencias negativas decrecientes de 10. En la tipografıalatina el separador tradicional es una coma, y en la anglosajona un punto; bajo la influencia delos ordenadores se ha extendido el uso de este ultimo y sera el que (a reganadientes) adoptaremosaquı. Ası pues, la representacion decimal del numero inicial sera 〈〈1234.56789 〉〉.

Al igual que para los enteros, 〈〈−1234.56789 〉〉 representara el numero opuesto del anterior,−123456789/105.

Mantenemos, pues, una notacion posicional, en la que cada cifra va multiplicada segun suposicion por un factor (un peso), que en el caso de los enteros es una potencia positiva o nula de

10, admitiendose ahora pesos fraccionarios del tipo1

10n= 10−n (i.e., potencias negativas de 10).

Pero ası se escriben solo algunos numeros reales muy especiales: en general, una representaciondecimal finita emem−1 . . . e1e0.d1d2 . . . dn (m entero no negativo, n ∈ N, con ek, dj entre 0 y 9 para0 ≤ k ≤ m, 1 ≤ j ≤ n), corresponde a

em · 10m + · · ·+ e1 · 10 + e0 +d1

10+

d2

102+ · · ·+ dn

10n

=em · 10n+m + · · ·+ e1 · 10n+1 + e0 · 10n + d1 · 10n−1 + d2 · 10n−2 + · · ·+ dn

10n.

(analogo para 〈〈−emetc. 〉〉 tomando los opuestos). Se trata, por supuesto, de numeros racionales;sin embargo, no todos numeros racionales tendran una representacion decimal finita: esto es ciertotan solo para los que puedan expresarse como cociente de un entero por una potencia de 10.

Notemos, de paso, que cuando emem−1 . . . e1e0.d1d2 . . . dn sea la expresion decimal de un numerox, entonces emem−1 . . . e1e0d1d2 . . . dn (sin punto decimal) es justamente la representacion en base10 del numero entero 10n x.

La etapa siguiente, inevitable como vemos, es pasar a “decimales infinitos”. Ahora bien: resulta

mas complicado aclarar que queremos decir, por ejemplo, cuando escribimos 3√

2 = 1.2599210499 . . . .¿Que significan los puntos suspensivos? ¿Por que no es 3

√2 = 9.9401299521 . . . o cualquier otra ex-

presion similar? ¿Con que criterio se han elegido las cifras?Recapacitando un momento, hemos comenzado escribiendo ‘la parte entera’ de 3

√2, que es 1;

luego hemos anadido la mayor cifra decimal, 2, tal que 1.2 no sobrepasa a 3√

2; despues anadimosla mayor cifra decimal, 5, tal que 1.25 no sobrepasa a 3

√2; y ası continuamos anadiendo cifras:

1 ≤ 3√

2 < 21.2 ≤ 3

√2 < 1.3

1.25 ≤ 3√

2 < 1.26

1.259 ≤ 3√

2 < 1.2601.2599 ≤ 3

√2 < 1.2600

1.25992 ≤ 3√

2 < 1.25993

1.259921 ≤ 3√

2 < 1.2599221.2599210 ≤ 3

√2 < 1.2599211

etc.

En resumen, vamos haciendo la seleccion de los dıgitos de modo que se formen sucesivamentedecimales finitos, cada vez con una cifra mas, de tal manera que dichos decimales finitos sean encada paso los que “mejor ajusten por abajo”, los que constituyan la aproximacion inferior optimadel numero a representar.

La herramienta fundamental en este proceso de construir la representacion decimal de cualquiernumero real es la nocion de parte entera de un numero real arbitrario. Recordemos su definicion.

Lema 4.3.1 (Parte entera de un numero real). Dado x ∈ R, existe un numero entero (y unosolo), que suele denotarse con bxc, tal que

bxc ≤ x < bxc+ 1.

Denominaremos a bxc la parte entera de x.Dicho en palabras, bxc es el mayor numero entero menor o igual que x.


Demostracion. Ver [1], pag. 8, Teor. 1.2.3.

La traduccion grafica de este resultado es simple: cada numero real x queda en uno y solo unode los intervalos [N,N + 1), N ∈ Z, o dicho de otro modo, R =

⋃N∈Z

[N,N + 1) (union disjunta:estos intervalos constituyen una particion de R). Cuando x ∈ [N,N + 1), y solo entonces, N es laparte entera de x.

Tenemos ası una pista para construir graficamente, en general, las cifras decimales sucesivasde cualquier numero real x ≥ 0. Pues si ponemos N = bxc y d1 es la primera cifra decimal de

x, determinada por la condicion de que N +d1

10≤ x < N +

d1 + 110

, esto significara que x ∈

[N +d1

10, N +

d1 + 110

), luego dividiendo el intervalo [N,N + 1) en diez subintervalos disjuntos, del

mismo tipo, de longitud110

,

[N,N +110

), [N +110, N +

210

), . . . , [N +810, N +

910

), [N +910, N + 1),

basta localizar entre ellos el unico que contiene a x.

[ )[ ) • • • • • [ ) • • • • • [ )[ )N N + 1

10 N + 210 N + d1

10 N + d1+110 N + 8

10 N + 910 N + 1

x×

Observese que si ‘ampliamos 10 veces la escala’, resulta 10N + d1 ≤ 10x < 10N + d1 + 1, demodo que justamente 10N+d1 = b10xc, y obtenemos por tanto d1 = b10xc−10N = b10xc−10bxc.

Para hallar el segundo decimal, repetimos el proceso: el intervalo [N+d1

10, N+

d1 + 110

) se divide

en diez subintervalos cerrados a izquierda y abiertos a derecha, disjuntos, cada uno de longitud1

100,

y localizamos el unico de ellos que contiene a x. Sea este [N+d1

10+d2

100, N+

d1

10+d2 + 1100

); entonces

N +d1

10+

d2

100≤ x < N +

d1

10+d2 + 1100

, y multiplicando por 100,

100N + 10d1 + d2 ≤ 100x < 100N + 10d1 + d2 + 1,

es decir,

100N + 10d1 + d2 = b100xc y d2 = b100xc − 10(10N + d1) = b102xc − 10b10xc.

Reiterando el proceso iremos obteniendo los sucesivos decimales de x. Analogamente, llegaremos a

N +d1

10+

d2

102+ · · ·+ dn

10n≤ x < N +

d1

10+

d2

102+ · · ·+ dn + 1

10ny dn = b10nxc − 10b10n−1xc.

Esta va a ser la definicion ‘oficial’ de las cifras decimales de un numero real cualquiera.

Definicion 4.3.2 (Cifras decimales). Dado un numero real x ≥ 0 y n ∈ N, la n-esima cifradecimal de x es

dn = b10nxc − 10b10n−1xc.

Si x ≥ 0 y emem−1 . . . e1e0 es la representacion en base 10 de bxc(bxc = em10m+· · ·+e110+e0,

ei ∈ {0, 1, 2, 3, 4, 5, 6, 7, 8, 9} (0 ≤ i ≤ m), em 6= 0 si bxc 6= 0), la expresion

emem−1 . . . e1e0.d1d2 . . . dn . . .

recibe el nombre de representacion decimal o desarrollo decimal de x.Cuando hay un M tal que dn = 0 para todo n > M , el desarrollo se abrevia simplemente a

x = emem−1 . . . e1e0.d1d2 . . . dM .Para x < 0, se toma la representacion decimal de |x| con un signo − delante.


No hay que dejarse impresionar por esta definicion; las sucesivas cifras decimales de x puedenirse obteniendo recursivamente como en el comentario previo, segun justificamos a continuacion.

Proposicion 4.3.3. Dado un numero real x ≥ 0 y una sucesion (dn) de numeros enteros, sea (qn)la sucesion definida por

qn = bxc+d1

10+ · · ·+ dn

10n, n ∈ N.

Las siguientes propiedades son equivalentes:

(i) para todo n ∈ N, dn = b10nxc − 10b10n−1xc.

(ii) para todo n ∈ N, qn ≤ x < qn +1

10n.

Demostracion. (i) =⇒ (ii).

Habra que probar que qn ≤ x < qn +1

10n, o lo que es lo mismo, que 10nqn ≤ 10nx < 10nqn + 1,

lo que a su vez, puesto que 10nqn es entero, es lo mismo que decir que 10nqn = b10nxc. Pero

10nqn = 10nbxc+ 10n−1d1 + 10n−2d2 + · · ·+ 10dn−1 + dn

= 10nbxc+ 10n−1(b10xc − 10bxc) + 10n−2(b102xc − 10b10xc)+ · · ·+ 10(b10n−1xc − 10b10n−2xc) + (b10nxc − 10b10n−1xc)

= 10nbxc+ 10n−1b10xc − 10nbxc+ 10n−2b102xc − 10n−1b10xc+ · · ·+ 10b10n−1xc − 102b10n−2xc+ b10nxc − 10b10n−1xc

= b10nxc,

que es lo que querıamos demostrar. (**)

(ii) =⇒ (i).Como para todo n ∈ N es 10nqn un entero que segun la hipotesis (ii) verifica

10nqn ≤ 10nx < 10nqn + 1,resulta 10nqn = b10nxc.

Puesto que obviamente qn = qn−1 +dn10n

(anadiendo q0 = bxc si es necesario),se sigue que

dn = 10nqn − 10nqn−1 = 10nqn − 10 · 10n−1qn−1 = b10nxc − 10b10n−1xc.

Ejemplo. Calculo de las cifras decimales de un numero racional por division.Para hallar las sucesivas cifras decimales de 57/13, por ejemplo, en la escuela procedıamos ası:

57 |13 57. |13 57. |13 57. |135 4 50 4.3 50 4.38 50 4.384

11 110 1106 60

8 etc.(**)Tambien puede hacerse por induccion: para n = 1,

10q1 = 10bxc+ d1 = 10bxc+ (b10xc − 10bxc) = b10xc,

y si 10nqn = b10nxc,

10n+1qn+1 = 10n+1(qn +dn+1

10n+1) = 10 · 10nqn + dn+1 = 10b10nxc+ (b10n+1xc − 10b10nxc) = b10n+1xc.


¿Por que ‘funciona’ este algoritmo? Analicemoslo en general. Supongamos que tenemos un numerox = a/b > 0 con a, b ∈ N (para simplificar). Efectuando la division entera de a por b, obtendrıamosa = Nb + r0 con 0 ≤ r0 < b. Entonces N = ba/bc, porque de la condicion sobre r0 se deduce queNb ≤ a < Nb+N = (N + 1)b y de aquı que N ≤ a/b < N + 1.

Para continuar, “bajamos un cero” que anadimos al resto r0, y dividimos por b: es decir,efectuamos la division entera de 10r0 por b, 10r0 = d1b+ r1, 0 ≤ r1 < b. Como antes,

d1b ≤ 10r0 < d1b+ b = (d1 + 1)b, y puesto que r0 = a−Nb, esto dad1b ≤ 10a− 10Nb < (d1 + 1)b,10Nb+ d1b ≤ 10a < 10Nb+ (d1 + 1)b,10N + d1 ≤ 10(a/b) < 10N + d1 + 1,

y dividiendo or 10,

N +d1

10≤ a

b< N +

d1

10+

110

,

lo que prueba que el cociente d1 es la primera cifra decimal de a/b. Prosiguiendo de manera analoga,los sucesivos cocientes son, efectivamente, las siguientes cifras decimales de a/b.

Corolario 4.3.4. Dado x ≥ 0, si para cada n ∈ N es dn su n-esima cifra decimal, poniendo

qn = bxc+d1

10+ · · ·+ dn

10n, se tiene

x = sup{qn = bxc+d1

10+ · · ·+ dn

10n: n ∈ N} = lım

nqn.

Demostracion. Deqn ≤ x < qn +

110n

.

se sigue que

|x− qn| <1

10n→ 0 cuando n→ +∞,

y asılımnqn = x.

Ademas (qn) es una sucesion monotona no decreciente (¿quien es qn+1− qn y que signo tiene?), conlo cual tambien sup{qn : n ∈ N} = lımn qn = x.

Hay ‘expresiones decimales’ que no aparecen como representacion decimal de ningun numerosegun nuestra definicion. Por ejemplo, 0.999 . . . , puesto que, con la notacion anterior,

lımnqn = lım

n

(910

+9

102+ · · ·+ 9

10n

)= lım

n

910− 9

10n· 910

1− 110

=

910910

= 1,

mientras que 1 = 1.000 . . . . Pero cualquier ‘expresion decimal’ ±emem−1 . . . e1e0.d1d2 . . . dn . . . que‘no acabe en una sucesion de nueves’ (i.e., que no cumpla dn = 9 para todos n mayores o igualesque un cierto n0), es el desarrollo decimal de algun numero real (¿te atreves a demostrarlo?).

Interpretaremos las ‘expresiones decimales anomalas’ como un lımite, igual que en el ejemploanterior. Para que no haya ambiguedad, si es necesario llamaremos a la representacion decimal de xtal como la hemos definido la representacion decimal canonica de x. (Comparar con [B-S], pp. 73 yss., y [D’A-W], pp. 231 y ss.)Ejercicio. Para cada n ∈ N, sean an, bn ∈ {0, 1, 2, 3, 4, 5, 6, 7, 8, 9}, y supongamos que

lımn

(a1

10+

a2

102+ · · ·+ an

10n)

= lımn

(b110

+b2102

+ · · ·+ bn10n

).

Probar que an = bn para todo n o, en caso contrario, existe un N ∈ N tal que an = bn para todon ≤ N y an = 0, bn = 9 (o an = 9, bn = 0) para todo n > N .

(Cf. [Lieb], p. 19.)


Una aplicacion de la representacion decimal (‘canonica’) es la demostracion clasica de Cantorde la no numerabilidad de R.

Proposicion 4.3.5. R no es numerable.

Demostracion. Ya vimos que si I es un intervalo en R, card I = card R. Basta, pues, probar que[0, 1) no es numerable.

Supongamos lo contrario, es decir, que existe una biyeccion entre N y [0, 1), o sea, que hay unasucesion (xn) sin terminos repetidos cuya imagen es [0, 1). Escribamos sus expresiones decimales,

x1 = 0.d1,1d1,2d1,3 . . .

x2 = 0.d2,1d2,2d2,3 . . .

x3 = 0.d3,1d3,2d3,3 . . .

......

y definamos entonces

dn =

{1 si dn,n = 00 en caso contrario.

La sucesion (qn) definida por

qn =d1

10+ · · ·+ dn

10n, n ∈ N,

es una sucesion monotona no decreciente (¿quien es qn+1 − qn y que signo tiene?) acotada supe-riormente por

sup{

110

+ · · ·+ 110n

: n ∈ N}

=19,

luego convergente. Seax = lım

nqn.

Como 0 ≤ qn ≤ 1/9, tambien 0 ≤ x ≤ 1/9, y ası x ∈ [0, 1), por lo que x debe estar en la lista delos xn. Pero la n-esima cifra decimal de x es dn (¿por que?), y la n-esima cifra decimal de xn esdn,n 6= dn por construccion, luego x 6= xn cualquiera que sea n y la aplicacion de partida entre N y[0, 1) no es suprayectiva, contra lo supuesto.

4.3.3. Decimales periodicos

¿Existe algun criterio para decidir si un numero real es o no racional a partir de su desarrollodecimal? La respuesta es conocida: veamos ahora la explicacion.

Definicion 4.3.6. Un decimal periodico es una expresion decimal de la forma

±emem−1 . . . e1e0.d1d2 . . . dj p1p2 . . . pk p1p2 . . . pk . . . p1p2 . . . pk . . .

en la que hay un grupo de cifras decimales p1p2 . . . pk que se repite siempre desde un determinadolugar. El grupo p1p2 . . . pk es el periodo, y d1d2 . . . dj es la parte no periodica , bien entendidoque el periodo se toma de tamano mınimo y que no coincide con el final de la parte no periodica.

Suele abreviarse esta expresion poniendo ±emem−1 . . . e1e0.d1d2 . . . djp1p2 . . . pk.

Ejemplo.23322

= 10.5909090909 · · · = 10.5 90 tiene parte entera 10, parte no periodica 5 y parteperiodica 90.

Proposicion 4.3.7. La representacion decimal de cada numero racional es periodica. Recıproca-mente, cada decimal periodico es la representacion decimal de un numero racional.


Demostracion. Sea x ∈ Q. Como 0 = 0.0 es periodico y el caso x < 0 se reduce de manera obvia alcaso −x (> 0), podemos suponer que x = a/b, a, b ∈ N.

Como ya sabemos, podemos hallar las cifras decimales de x mediante divisiones enteras sucesi-vas. Dividiendo a por b obtendremos un cociente N ≥ 0 y un resto r0 con 0 ≤ r0 < n. Si r0 = 0, laexpresion decimal de a/b sera emem−1 . . . e1e0.0, donde emem−1 . . . e1e0 es la representacion decimalde N .

En caso contrario, si fuese r0 6= 0, sea 10r0 = d1b + r1, 0 ≤ r1 < b. Si r1 = 0, a/b =emem−1 . . . e1e0.a10; si r1 6= 0, 10r1 = d1b+ r2, y seguimos el proceso inductivamente si no apareceningun resto 0.

En tal caso, cada resto (no nulo) r0, r1, . . . , rk, . . . , debe ser uno de los b − 1 enteros de quedisponemos entre 1 y b − 1. Por tanto, inevitablemente aparecera en algun momento un resto (enel peor de los casos, rb−1) que ya haya aparecido previamente. Las cifras decimales obtenidas entreestas dos apariciones se repetiran ya indefinidamente, es decir, si j y k son los menores enteros talesque rj = rk (j < k), dj+1 . . . dk sera el periodo.

Partamos ahora de un decimal periodico

emem−1 . . . e1e0.d1d2 . . . djp1p2 . . . pk

(lo suponemos positivo por comodidad). Construyamos como ya hemos hecho anteriormente unnumero real x cuyo desarrollo decimal coincida con el dado, y consideremos

r = em10m + · · ·+ e110 + e0 +d1

10+ · · ·+ dj

10j∈ Q, s =

p1

10j+1+ · · ·+ pk

10j+k∈ Q.

Entonces

x = lımn

(r + s+ s

110k

+ s1

102k+ · · ·+ s

110nk

)= r +

s

1− (1/10k)∈ Q,

como querıamos probar. Pero ademas

x = r +s

1− (1/10k)=

(10k − 1)r + 10ks10k − 1

=10k(r + s)− r

10k − 1=

10j+k(r + s)− 10jr(10k − 1)10j

que examinado atentamente contiene la regla de conversion de los decimales periodicos en fraccio-nes: ‘se forma el numerador escribiendo primero la parte entera seguida de la parte no periodicay luego la parte periodica, restando despues la parte entera seguida de la parte no periodica, y eldenominador escribiendo tantos nueves como cifras tiene la parte periodica seguido de tantos ceroscomo cifras tiene la parte no periodica’.(***)

Ejercicios

14.1. ¿Puede expresarse√

2 como decimal periodico? ¿Por que?

14.2. Expresar 1/7 y 2/19 como decimales periodicos.

14.3. Encontrar el numero racional representado por los decimales periodicos 1.25 137 y 37.14 653.

14.4. ¿Puede existir un numero racional que tenga como desarrollo decimal

0.101001000100001000001 . . .?

(A cada cifra 1 sigue un bloque de ceros, con un cero mas en cada paso.)

(***) Pues 10j+k(r + s) = em10m+j+k + · · ·+ e010j+k + d110j+k−1 + · · ·+ dj10k + p110k−1 + · · ·+ pk,10jr = em10m+j + · · ·+ e010j + d110j−1 + · · ·+ dj , 10k − 1 = 9 · 10k−1 + · · ·+ 9 · 10 + 9.

4.4. REPRESENTACION EN OTRAS BASES 129

Y para los que tengan tiempo libre:

14.5. ([Lieb], p. 22.) El crıtico cinematografico Ivor Pocoseso esta viendo la pelıcula ‘11.9 Hombressin Piedad’. Pero se aburre, y empieza a preguntarse exactamente que numeros racionales tienenexpresiones decimales que acaban en 000 . . . (o sea, en ceros repetidos indefinidamente). Nota queeste es el caso si el denominador es 2, 4, 5, 8, 10, y se plantea si habra una regla general sencillaque diga que racionales tienen esta propiedad.

Ayuda a Ivor demostrando que un numero racional m/n (en forma irreducible) tiene expresiondecimal que acaba en ceros repetidos indefinidamente si y solo si el denominador n es de la forma2p5q, donde p y q son enteros no negativos.

4.4. Representacion en otras bases

Al igual que en la representacion de los numeros enteros, es necesario contemplar la represen-tacion de los numeros reales en bases distintas de 10.

4.4.1. Representacion binaria

Como cabe suponer, si en vez de usar potencias enteras de 10 se utilizan potencias enterasde 2, se obtiene la representacion binaria de los numeros reales de una manera totalmenteanaloga. Para buscarla graficamente, si bxc = N , el intervalo [N,N + 1) se dividira ahora en dossubintervalos [N,N + 1

2), [N + 12 , N + 1), aquel de ellos en el que este x en otros dos de longitud

122

, etc., llegandose ası a una representacion para los x ≥ 0 de la forma

amam−1 . . . a1a0.b1b2 . . . bn . . .

en la que bxc = am2m + · · · + a12 + a0, ai ∈ {0, 1} (0 ≤ i ≤ m), am 6= 0 si bxc 6= 0, y bn ∈ {0, 1}(n-esima cifra binaria de x) viene dada por bn = b2nxc − 2b2n−1xc, de modo que si

qn = bxc+b12

+ · · ·+ bn2n, n ∈ N,

se verificaqn ≤ x < qn +

12n,

yx = sup{qn : n ∈ N} = lım

nqn.

Igual que en el caso decimal, x es racional si y solo si su representacion binaria es periodica.Pero los racionales cuya representacion binaria tiene nulas todas las cifras a partir de un ciertolugar no son exactamente los mismos que gozan de esta propiedad en su desarrollo decimal: porejemplo,

35

= 0.6 0(10 = 0.1001(2.

Nota. Ya vimos como expresar los numeros enteros en base 2, mediante divisiones sucesivas por2. Para hallar ahora el desarrollo binario de x − bxc a partir de su desarrolo decimal, basta irmultiplicando por 2 retirando la parte entera del producto; en el ejemplo anterior,

NUMERO DECIMAL 0.6000 . . .2 ∗ resto 1.2 0.4 0.8 1.6 1.2 0.4 . . .

resto 0.2 0.4 0.8 0.6 0.2 0.4 . . .

CIFRAS BINARIAS 1 0 0 1 1 0 . . .

y observamos como ya se va repitiendo obligadamente el bloque ‘1001’, de modo que35

= 0.1001.

(Para los mas atrevidos: ¿cual es la justificacion de este procedimiento?)


11.00000. . . |1010 0 1000 0.10011. . .001001100010000100100· · · · · ·00100· · · · · ·

Tambien podrıamos llegar al mismo resultado dividiendo 3por 5 en base 2, lo que se hace como en base decimal, con laprecaucion de que ahora 1 + 1 = 10. Por ejemplo, 3 = 11(2

se dividirıa por 5 = 101(2como muestra la figura, teniendoen cuenta que en base 2 es 101 + 1 = 110, 101 + 11 = 1000;ponemos ceros en el cociente y ‘bajamos ceros del dividendo’en la manera acostumbrada.

A la inversa, si partimos de la expresion binaria ±amam−1 . . . a1a0.b1b2 . . . bn . . . de un numerox, tendremos que hallar (expresando los numeros en base 10)

± lımn

(am2m + · · ·+ a12 + a0 +

b12

+ · · ·+ bn2n

).

Cuando x sea racional, y por tanto su desarrollo sea periodico, podemos calcular este lımite comohicimos en la demostracion de que todo decimal periodico es el desarrollo de un numero racional.Por ejemplo, si

x = −1010.0010 101(2,

escribiendo todos los numeros ahora en base 10,

x = − lımn

[23 + 21 +

123

+(

125

+127

)+(

128

+1

210

)+(

1211

+1

213

)+(

1214

+1

216

)+ · · ·

· · · +(

123n+5

+1

23n+7

)]= − lım

n

[8 + 2 +

18

+(

125

+127

)+

123

(125

+127

)+

126

(125

+127

)+

129

(125

+127

)+ · · ·

· · · + 123n

(125

+127

)]= − lım

n

[8 + 2 +

18

+(

125

+127

)(1 +

123

+126

+129

+ · · ·+ 123n

)]

= −

818

+(

125

+127

)lımn

1− 123n+1

1− 123

= −

818

+527

123 − 1

23

= −[818

+5

24 · 7

]

= −81 · 14 + 516 · 7

= −1139112

.

Ejercicios

15.1. Hallar la representacion binaria de los numeros cuya expresion decimal es:(i) 2.0078125 (ii) 0.8 6 (iii) 3.141592654 . . .

15.2. Hallar la representacion decimal de los numeros cuya expresion binaria es:(i) 11.01 (ii) 1.0 10 (iii) 0.100011101 . . .

4.4.2. Representaciones en bases distintas de 10 y 2

Por las mismas razones expuestas al hablar de las bases de numeracion para representar numerosenteros, se emplean a veces el sistema octal (base 8) y el sistema hexadecimal (base 16).

Nada especial hay que anadir sobre la representacion de numeros reales en estos sistemas. Sonuna vez mas, como el decimal y el binario, sistemas posicionales: el valor de cada cifra dependede su posicion. Para buscar la expresion de un numero real en estos sistemas, o para pasar lasrepresentaciones de un numero de una base a otra, basta adaptar las ideas que hemos empleadoanteriormente.

Bibliografıa

[A-K] Aleksandrov. A. D.; Kolmogorov, A. N.; Laurentiev, M. A. & al.: La matematica:su contenido, metodos y significado (vol. I). Alianza Editorial, Madrid, 1973.

[Ap] Apostol, T.M.: Analisis Matematico (segunda edicion). Reverte, Barcelona, 1991.

[B-S] Bartle, R. G.- Sherbert, D. R.: Introduccion al Analisis Matematico de una Variable.Limusa, Mexico, 1990.


[Dur] Duran, A. J.: Historia, con personajes, de los conceptos del calculo. Alianza, Madrid,1996.




[Kl1] Kline, M.: El pensamiento matematico de la Antiguedad a nuestros dıas, I. AlianzaEditorial, Madrid, 1992.

[Kl3] Kline, M.: El pensamiento matematico de la Antiguedad a nuestros dıas, III. AlianzaEditorial, Madrid, 1992.



[Spv] Spivak, M.: Calculus. Calculo Infinitesimal. (segunda edicion) Reverte, Barcelona, 1990.



[1] Curso de Analisis matematico I. Capıtulo 1: Numeros reales. Univ. de Zaragoza.

http://www.unizar.es/analisis matematico/analisis1/apuntes/01-reales.pdf

131

http://www.unizar.es/analisis_matematico/analisis1/apuntes/01-reales.pdf

132 BIBLIOGRAFIA

Capıtulo 5

Numeros complejos.

Nuestra presentacion de los numeros complejos es basicamente la del texto [Ap], completadocon [ApC]. Vease tambien [GJPR], [Her], cap. 4, [D’A-W], cap. 18; [Lieb], cap. 6. Para ejercicios(resueltos y propuestos) son utiles [Spg], [Wil], ası como [D’A-W] y [Lieb].

5.1. El cuerpo complejo.

Como senala [Her], p. 195, 〈〈 las sucesivas ampliaciones de los sistemas de numeros se hanrealizado para acomodar resultados sorprendentes en los sistemas de numeros conocidos. Estosresultados sorprendentes provienen, en la mayor parte de los casos, de la resolucion de ecuacionesalgebraicas.

Por ejemplo, la ecuacion x+ 7 = 5, en la que solamente aparecen numeros naturales, no poseeningun numero natural como solucion; su solucion es el numero negativo −2. Los numeros naturales,junto con los numeros negativos, forman el sistema de los numeros enteros. Este sistema de numeroses insuficiente para resolver todas las ecuaciones algebraicas; la ecuacion 3x = 5 no posee comosolucion ningun numero entero; su solucion es el numero fraccionario 5/3. Los numeros enteros,junto con los numeros fraccionarios, forman el conjunto de los numeros racionales. Estos numerosresultan insuficientes para resolver ecuaciones cuadraticas; por ejemplo, la ecuacion x2 = 2 no tieneun numero racional como solucion; sus soluciones son los numeros irracionales

√2 y −

√2. Los

numeros racionales, junto con los irracionales, forman el sistema de los numeros reales.〉〉Entre los numeros irracionales hay, incluso, muchos que no son raıces de polinomios con coefi-

cientes racionales. Pese a ello, R no es ‘suficientemente completo’ desde el punto de vista algebraico:un polinomio tan sencillo como X2 +1 sigue sin tener raıces en R. En pleno Renacimiento, los alge-bristas italianos del siglo XVI (Tartaglia, Cardano, Bombelli: v. [Ebb], cap. 3), en su busqueda deraıces reales de ecuaciones cubicas (de polinomios de grado 3), comenzaron un calculo formal conexpresiones ‘imaginarias’, ‘ficticias’, en las que aparecıan raıces cuadradas de numeros negativos,comprobando que, aunque ignoraban que significado atribuir a dichas expresiones, los resultadosque obtenıan a partir de ellas eran consistentes y satisfactorios, resolviendo ası problemas de raıcesde ecuaciones de segundo y tercer grado en R. La ‘inevitabilidad’ de estas expresiones llevarıa, trasperiodos de discusion y desconfianza sobre su naturaleza, a la introduccion y aceptacion final delos numeros complejos. (Ver [GJPR], pp. 155–156.)

Definicion 5.1.1. El cuerpo de los numeros complejos es el conjunto

C = {(a, b) : a, b ∈ R}

dotado de las operaciones

• suma: (a, b) + (c, d) = (a+ c, b+ d)

• producto: (a, b) (c, d) = (ac− bd, bc+ ad).

133

134 CAPITULO 5. NUMEROS COMPLEJOS

Los elementos de C reciben el nombre de numeros complejos.

Como conjunto, pues, C es simplemente R2 = R × R, que conocemos como espacio vectorialsobre R, con la misma suma que acabamos de definir. La novedad (absolutamente trascendentecomo veremos) esta en la introduccion de un producto ‘interno’, que aplica C × C en C (en R2

tenemos el producto por escalares ‘externos’, que aplica R× R2 en R2).

Veamos que esta justificado llamar a C el cuerpo de los numeros complejos.

Proposicion 5.1.2. Con la suma y el producto que hemos definido, C es un cuerpo conmutativo.

Demostracion. Una vez mas, enunciamos las propiedades a comprobar, si bien dejamos las demos-traciones como ejercicio. (Ver [ApC], pp. 438 y ss.)1. Propiedad asociativa de la suma. ((a1, b1)+(a2, b2))+(a3, b3) = (a1, b1)+((a2, b2)+(a3, b3)).2. Propiedad conmutativa de la suma. (a1, b1) + (a2, b2) = (a2, b2) + (a1, b1).3. Existencia de elemento neutro (cero) para la suma. Hay un numero complejo, el (0, 0),

tal que para todo (a, b) ∈ C, (0, 0) + (a, b) = (a, b) + (0, 0) = (a, b).4. Existencia de elemento opuesto para la suma. Para cada (a, b) ∈ C hay un numero

complejo (y uno solo), el numero complejo (−a,−b), tal que(−a,−b) + (a, b) = (a, b) + (−a,−b) = (0, 0).

5. Propiedad asociativa del producto. ((a1, b1) (a2, b2)) (a3, b3) = (a1, b1) ((a2, b2) (a3, b3)).6. Propiedad conmutativa del producto. (a1, b1) (a2, b2) = (a2, b2) (a1, b1).7. Existencia de elemento neutro (identidad) para el producto. Hay un numero complejo,

el (1, 0), tal que para todo (a, b) ∈ C es (1, 0) (a, b) = (a, b) (1, 0) = (a, b).8. Existencia de elemento inverso para el producto. Para cada (a, b) ∈ C \ {0} hay un

elemento (y uno solo) en C, el numero complejo

(a

a2 + b2,−b

a2 + b2

), tal que

(a

a2 + b2,−b

a2 + b2) (a, b) = (a, b) (

a

a2 + b2,−b

a2 + b2) = (1, 0).

(Tiene sentido porque a 6= 0 o b 6= 0.)

9. Propiedad distributiva del producto respecto de la suma. (a1, b1) ((a2, b2)+ (a3, b3)) =(a1, b1) (a2, b2) + (a1, b1) (a3, b3).

El cuerpo C contiene un subconjunto que es ‘una copia isomorfa’ al cuerpo R, que identificaremoscon R. Precisemos esta afirmacion:

Proposicion 5.1.3. La aplicacion h : R→ C dada por

h(a) = (a, 0), a ∈ R,

es inyectiva y para cualesquiera a, b ∈ R cumple

• h(a+ b) = h(a) + h(b);

• h(a b) = h(a)h(b)


Procedemos, pues, a la identificacion de a ∈ R con h(a) ∈ C, lo que nos permite usar la notacionsimplificada a = (a, 0). Observando que todo elemento (a, b) ∈ C se puede escribir en la forma

(a, b) = (a, 0) + (b, 0)(0, 1),

si definimos la unidad imaginaria i como

i = (0, 1),

5.1. EL CUERPO COMPLEJO. 135

con esta nueva notacion tenemos(a, b) = a+ ib.

Esta manera de escribir un numero complejo (forma binomica) se corresponde con la repre-sentacion del vector (a, b) de R2 en la base canonica {(1, 0), (0, 1)}. Por tanto, si a + ib = a′ + ib′

con a y b reales, necesariamente a = a′ y b = b′. Como es sabido, la primera componente a delnumero complejo z = (a, b) = a + ib se denomina la parte real de z, en sımbolos a = <e z, y lasegunda componente b se denomina la parte imaginaria de z, en sımbolos b = =m z. Ası, tantola parte real como la parte imaginaria son numeros reales.

Los numeros reales estan, pues, caracterizados como los z ∈ C tales que =m z = 0. La condicion<e z = 0 caracteriza a los llamados numeros imaginarios (imaginarios puros, en algunos textos).

Una ventaja de expresar los numeros complejos en forma binomica es que se hace mas facil lamultiplicacion. En efecto, teniendo en cuenta que

i2 = (0, 1)(0, 1) = (−1, 0) = −1

comprobamos que la ‘extrana formula’

(a, b) (c, d) = (ac− bd, bc+ ad)

se traduce en la mas ‘natural’

(a+ ib)(c+ id) = ac− bd+ i(bc+ ad),

donde para hacer esta operacion solo hace falta usar las reglas habituales de la multiplicacion y lasidentificaciones anteriormente expuestas. De pasada, hemos comprobado que el numero complejo ies una raız de X2 + 1 en C (‘la otra’ es −i).

Ninguna de las relaciones de orden que pueden definirse en C hacen de el un cuerpo totalmenteordenado: no hay posibilidad niguna de que se mantengan las mismas propiedades que en Q y enR ligan la ordenacion con la suma y el producto.(En efecto: en todo cuerpo totalmente ordenado es x2 + 1 > 0 para cualquier elemento x, mientrasque en C tenemos i2 + 1 = 0.)

Conjugacion. Modulo de un complejo.

Un instrumento muy importante en el manejo de los numeros complejos es la conjugacion.

Definicion 5.1.4. Dado un numero complejo z, su complejo conjugado, denotado por z, esta da-do por

z = <e z − i=m z.

Proposicion 5.1.5. La aplicacion de C en C que asocia a cada numero complejo su conjugado,llamada conjugacion , tiene las siguientes propiedades.

(i) Es un isomorfismo de cuerpo, es decir, es biyectiva y para cualesquiera z, w ∈ C se verifica

• z + w = z + w

• zw = z w

(ii) Es una involucion, o sea, aplicada dos veces vuelve al elemento de partida:

z = z para todo z ∈ C.

(iii) Deja fijos exactamente los numeros reales:

z = z si y solo si z ∈ R.


Demostracion. Son consecuencias directas de la definicion (comprobarlo).

Mediante el conjugado se puede expresar algebraicamente la parte real y la parte imaginaria decada z ∈ C,

<e z =z + z

2, =m z =

z − z2i

.

Tambien permite expresar algebraicamente su modulo, que pasamos a definir, lo que facilita muchasde las operaciones que deberemos efectuar con los numeros complejos.

Definicion 5.1.6. El modulo de un numero complejo z es el numero real no negativo

|z| =√z z =

√(<e z)2 + (=m z)2.

Por tanto, |z|2 = z z. Notese ası mismo que |z| = |z|.

Ejercicio. Para z 6= 0, probar que su inverso esz

|z|2=<e z|z|2

− i =m z

|z|2.

Las propiedades mas importantes del modulo, que comparte con el valor absoluto en R, son lassiguientes:

Proposicion 5.1.7. Dados z, w ∈ C,

(i) |z| ≥ 0 siempre, y |z| = 0 si y solo si z = 0.

(ii) |zw| = |z||w|.

(iii) |z + w| ≤ |z|+ |w| (desigualdad triangular).

Demostracion.

(i) Por la propia definicion, |z| ≥ 0 para todo z ∈ C y |0| = 0. Si ahora z = a+ ib (a, b ∈ R) estal que |z| = 0, es a2 + b2 = |z|2 = 0, y puesto que 0 ≤ a2 ≤ a2 + b2 = 0, a2 = 0 y a = 0(simetricamente, b = 0).

(ii) |zw|2 = (zw)(zw) = (zw)(z w) = z z ww = |z|2|w|2 = (|z||w|)2, y como |zw| y |z||w| sonnumeros reales no negativos, forzosamente |zw| = |z||w|.

(iii) |z+w|2 = (z+w)(z + w) = (z+w)(z+w) = z z+ z w+w z+ww = |z|2 + z w+ z w+ |w|2 =|z|2 + 2<e (z w) + |w|2,mientras que

(|z|+ |w|)2 = |z|2 + 2|z||w|+ |w|2 = |z|2 + 2|z w|+ |w|2,y como (ver lema siguiente) <e (z w) ≤ |<e (z w)| ≤ |z w|,se obtiene la desigualdad buscada.

En la demostracion de la desigualdad triangular hemos necesitado:

Lema 5.1.8. Para cada z ∈ C,

<e z ≤ |<e z| ≤ |z|, =m z ≤ |=m z| ≤ |z|.

Demostracion. Pongamos a = <e z, b = =m z. De

a2 ≤ a2 + b2 = |z|2, b2 ≤ a2 + b2 = |z|2,

se sigue |a| ≤ |z|, |b| ≤ |z|, y finalmente

a ≤ |a| ≤ |z|, b ≤ |b| ≤ |z|.

Como en R, se prueba:

5.1. EL CUERPO COMPLEJO. 137

Corolario 5.1.9 (desigualdad triangular inversa). Dados z, w ∈ C,

|z − w| ≥ ||z| − |w||.


Ejercicios

16.1. Expresar los siguientes numeros complejos en la forma a+ ib, con a, b ∈ R:

a) (1 + i)3 ; b)2 + 3i3− 4i

; c)i4 + i9 + i16

2− i5 + i10 − i15; d)

(1 + i√

2

)5

.

16.2. Calcular4n∑m=1

(1− i1 + i

)m.

Indicacion. Calcular primero (1−i)/(1+i) y recordar que (1−w)(1+w+w2+· · ·+wN ) = 1−wN+1.

16.3. Dado z =3− 2ai4− 3i

, con a ∈ R, determinar el valor de a para que z ∈ R y calcular entonces el

valor de z.

16.4. Calcular dos complejos cuya suma sea 1 + 4i, cuyo cociente sea imaginario y de manera quela parte real de uno de ellos sea −1.

16.5. Hallar x, y ∈ R tales que z = x+iy sea una raız cuadrada de 2−5i, es decir, (x+iy)2 = 2−5i.En general, dados a, b ∈ R, si z = x+ iy es una raız cuadrada de a+ bi, es decir, (x+ iy)2 = a+ bi,expresar x e y en funcion de a, b.

16.6. Sea z ∈ C con z 6= 1. Probar que1 + z

1− zes imaginario si y solo si |z| = 1.

16.7. Sean w, z ∈ C tales que w =z − aaz − 1

con 0 < a < 1. Probar que |w| < 1 si y solo si |z| < 1.

16.8. Probar que si |a| = 1 o |b| = 1, entonces

∣∣∣∣ a− b1− ab

∣∣∣∣ = 1. ¿Que excepcion debe hacerse si

|a| = |b| = 1?

16.9. Sea w =1 + z

1− zcon w = u+ iv y z = x+ iy (x, y, u, v ∈ R). Probar que

x =u2 + v2 − 1

(u+ 1)2 + v2; y =

2v(u+ 1)2 + v2

.

16.10. Sea z = a+ ib (a, b ∈ R). Demostrar que existen p, m y n independientes de z (z 6= 0, −1)tales que

(a2 + b2)(a2 + b2 + 2a+ 1)a2 − b2 + a− (1 + 2a)bi

= p+mz + nz2.

Hallar p, m y n.


5.2. El plano complejo

En este apartado utilizaremos frecuentemente un lenguaje geometrico meramente intuitivo, sinatenernos estrictamente al estilo mas deductivo del planteamiento del resto del curso. Ası, porejemplo, hablaremos de angulos, o daremos por bueno que las funciones seno y coseno del Analisismatematico se corresponden con las funciones definidas graficamente en Trigonometrıa, aunque paraello no tengamos ninguna justificacion rigurosa. Si hemos de ser totalmente honestos, ni siquieratenemos hasta ahora una definicion rigurosa de las funciones seno y coseno: nos hemos conformadocon admitir su existencia y propiedades. Es tarea de cursos superiores la construccion y el estudiode estas y otras funciones elementales basicas, por lo que seguiremos usandolas como hasta ahora.

La idea de partida en esta seccion es que todo numero complejo z = a+ib (a, b ∈ R) lo podemosrepresentar en el plano como el punto de coordenadas (a, b), su afijo.(*)

Esto supone que tenemos fijado en el plano un sistema cartesiano de ejes coordenados. Lospuntos del eje de abscisas seran los complejos (x, 0), o sea, los numeros reales, por lo que llamaremosa este eje el eje real . Analogamente, el eje de ordenadas estara formado por los puntos (0, y), losnumeros imaginarios puros iy, y denominaremos a este eje el eje imaginario. Nos referiremos aeste sistema con el nombre de diagrama de Argand.

En este contexto, la distancia euclıdea en el plano, por ejemplo, permitira definir la distanciaentre dos complejos z y w, que vendra dada por

d(z, w) = |z − w|,

ya que si z = x+iy, w = u+iv, (x, y, u, v ∈ R), ambas cantidades son iguales a√

(x− u)2 + (y − v)2.En particular, para cada z ∈ C, su modulo mide la distancia de z a 0.

Analogamente, puesto que todo punto del plano z 6= 0 queda unıvocamente determinado porsus coordenadas polares, es decir, su distancia al origen (i.e., su modulo) y por el angulo polar (elque forma el segmento de extremos 0 y z con el eje real), podremos utilizar para tales z la llamadarepresentacion polar o modulo-argumental. La medida del angulo polar (en radianes) es loque llamaremos argumento de z.

b= Im z

O a = Re z

| z |

φ

z=(a,b )


1.2 El plano complejo

Para abordar este apartado utilizaremos frecuentemente un lenguaje geometrico meramente intui-tivo, sin atenernos estrictamente al estilo mas deductivo del planteamiento del resto del curso. Ası,por ejemplo, hablaremos de angulos, o daremos por bueno que las funciones seno y coseno delAnalisis matematico se corresponden con las funciones definidas graficamente en Trigonometrıa,aunque para ello no tengamos ninguna justificacion rigurosa. Si hemos de ser totalmente honestos,ni siquiera tenemos hasta ahora una definicion rigurosa de las funciones seno y coseno: nos hemosconformado con admitir su existencia y propiedades. Es tarea de cursos superiores la construcciony el estudio de estas y otras funciones elementales basicas, por lo que seguiremos usandolas comohasta ahora.

La idea de partida en esta seccion es que todo numero complejo z = a+ib (a, b ∈ R) lo podemosrepresentar en el plano como el punto de coordenadas (a, b), su afijo.1

Esto supone que tenemos fijado en el plano un sistema cartesiano de ejes coordenados. Lospuntos del eje de abscisas seran los complejos (x, 0), o sea, los numeros reales, por lo que llamaremosa este eje el eje real . Analogamente, el eje de ordenadas estara formado por los puntos (0, y), losnumeros imaginarios puros iy, y denominaremos a este eje el eje imaginario. Nos referiremos aeste sistema con el nombre de diagrama de Argand.

En este contexto, la distancia euclıdea en el plano, por ejemplo, permitira definir la distanciaentre dos complejos z y w, que vendra dada por

d(z, w) = |z − w|,

ya que si z = x+iy, w = u+iv, (x, y, u, v ∈ R), ambas cantidades son iguales a√

(x− u)2 + (y − v)2.En particular, para cada z ∈ C, su modulo mide la distancia de z a 0.

Analogamente, puesto que todo punto del plano z �= 0 queda unıvocamente determinado porsus coordenadas polares, es decir, su distancia al origen (i.e., su modulo) y por el angulo polar (elque forma el segmento de extremos 0 y z con el eje real), podremos utilizar para tales z la llamadarepresentacion polar o modulo-argumental. La medida del angulo polar (en radianes) es loque llamaremos argumento de z.

Pongamos en orden estos conceptos.Observando la figura, tenemos las igualdades

�e z = |z| cosφ, �m z = |z| senφ,de donde

z = |z|(cosφ+ i senφ).Como siempre sucede con la medida de angulos, hay aquı unaambiguedad, puesto que φ y φ+2kπ con k ∈ Z hacen el mismopapel de cara a las igualdades anteriores. Esto nos hace abordarlas siguientes precisiones sobre la definicion de argumento.

Definicion 1.2.1 (Argumentos). Dado z ∈ C \ {0}, un argumento de z es cualquier φ tal que

z = |z| cosφ, z = |z| senφ.

El conjunto de los argumentos de z lo denotaremos por arg z, es decir,

arg z = {φ ∈ R : cosφ = �e z/|z|, senφ = �m z/|z|}.1 Esta observacion fue hecha repetidamente por matematicos que no lograron eco suficiente en la comunidad

matematica (entre ellos Argand, a cuyo nombre ha quedado asociada), hasta que fue adoptada por Gauss en 1831 ymas tarde por Cauchy, zanjando ası la polemica sobre la legitimidad de los numeros complejos (ver [DD-P], pp. 254y ss.)

Pongamos en orden estos conceptos.Observando la figura, tenemos las igualdades

<e z = |z| cosφ, =m z = |z| senφ,de donde

z = |z|(cosφ+ i senφ).Como siempre sucede con la medida de angulos, hay aquı unaambiguedad, puesto que φ y φ+2kπ con k ∈ Z hacen el mismopapel de cara a las igualdades anteriores. Esto nos hace abordarlas siguientes precisiones sobre la definicion de argumento.

Definicion 5.2.1 (Argumentos). Dado z ∈ C \ {0}, un argumento de z es cualquier φ tal que

<e z = |z| cosφ, =m z = |z| senφ.

El conjunto de los argumentos de z lo denotaremos por arg z, es decir,

arg z = {φ ∈ R : cosφ = <e z/|z|, senφ = =m z/|z|}.(*) Esta observacion fue hecha repetidamente por matematicos que no lograron eco suficiente en la comunidad

matematica (entre ellos Argand, a cuyo nombre ha quedado asociada), hasta que fue adoptada por Gauss en 1831 ymas tarde por Cauchy, zanjando ası la polemica sobre la legitimidad de los numeros complejos (ver [DD-P], pp. 254y ss.)

5.2. EL PLANO COMPLEJO 139

Entonces, arg z es un conjunto! Pero ‘es obvio’ que si para dos valores φ0, φ ∈ R, se cumple

cosφ = cosφ0, senφ = senφ0,

debe existir un k ∈ Z de manera queφ = φ0 + 2kπ;

en otras palabras, el conjunto arg z puede describirse, conocido uno cualquiera de sus elementos,de la siguiente manera:

{φ0 + 2kπ : φ0 ∈ arg z, k ∈ Z} = φ0 + 2πZ.

De esta forma, en cualquier intervalo semiabierto de longitud 2π, por ejemplo (−π, π], existe ununico elemento perteneciente al conjunto arg z. A este elemento se le denota por

Arg z,

y se le llama argumento principal (precaucion: en algunos textos se llama argumento principalal que esta en el intervalo [0, 2π)). Por tanto, para nosotros:

Definicion 5.2.2 (Argumento principal). Dado z ∈ C \ {0},

Arg z = φ si y solo si φ ∈ (−π, π] y cosφ = <e z/|z|, senφ = =m z/|z|.

Definicion 5.2.3. La representacion polar o modulo-argumental de un numero complejo nonulo viene dada por su modulo y uno cualquiera de sus argumentos.

Para presentarla de una manera mas compacta, introducimos la siguiente notacion.

Definicion 5.2.4. Dado φ ∈ R, pondremos

eiφ = cosφ+ i senφ.

Por tanto, dado z ∈ C \ {0}, si φ ∈ arg z sera

z = |z| eiφ

(representacion exponencial de un numero complejo).

Notese que para z = 0 se tiene z = |z| eiφ cualquiera que sea φ ∈ R.

Ejercicio. Para cada φ ∈ R, |eiφ| = 1. Recıprocamente, para todo z ∈ C con |z| = 1 existe φ ∈ Rtal que z = eiφ.

Ejercicio. Si φ ∈ R, entonces eiφ = 1 si y solo si existe k ∈ Z tal que φ = 2kπ.

Ejercicio. Comprobar la formula de Euler

eiπ + 1 = 0.

(Se ha dicho que esta es una de las mas bellas formulas de las Matematicas, porque liga los numerosfundamentales del Algebra, la Geometrıa y el Analisis).

Proposicion 5.2.5 (Representacion exponencial del producto de dos numeros comple-jos). Dados z1, z2 ∈ C, si z1 = |z1| eiφ1, z2 = |z2| eiφ2, con φ1, φ2 ∈ R, se tiene

z1 z2 = |z1z2| ei(φ1+φ2) = |z1| |z2| ei(φ1+φ2).


Demostracion. Ya probamos que |z1z2| = |z1| |z2|.Operando

eiφ1 eiφ2 = (cosφ1 + i senφ1) (cosφ2 + i senφ2)= cosφ1 cosφ2 − senφ1 senφ2 + i(cosφ1 senφ2 + senφ1 cosφ2)= cos(φ1 + φ2) + i sen(φ1 + φ2) = ei(φ1+φ2),

y queda finalmentez1 z2 = |z1| |z2| ei(φ1+φ2) = |z1z2| ei(φ1+φ2).

Por tanto, mientras que la suma y la resta de numeros complejos no son otra cosa que la sumay la resta de vectores en el plano, que no necesita graficamente mas que la traslacion de segmentos(ver figura 1), la construccion grafica del producto de dos numeros complejos es un poco mascomplicada (ver figura 2):

0

z

z +w

w

z - w

w - z

0

z w

z .w

1

uz

u1


Demostracion. Ya probamos que |z1z2| = |z1| |z2|.Operando

eiφ1 eiφ2 = (cosφ1 + i senφ1) (cosφ2 + i senφ2)= cosφ1 cosφ2 − senφ1 senφ2 + i(cosφ1 senφ2 + senφ1 cosφ2)= cos(φ1 + φ2) + i sen(φ1 + φ2) = ei(φ1+φ2),

y queda finalmentez1 z2 = |z1| |z2| ei(φ1+φ2) = |z1z2| ei(φ1+φ2).

Por tanto, mientras que la suma y la resta de numeros complejos no son otra cosa que la sumay la resta de vectores en el plano, que no necesita graficamente mas que la traslacion de segmentos(ver figura 1), la construccion grafica del producto de dos vectores es un poco mas complicada (verfigura 2):

Figura 1 Figura 2

dados z, w = |w| eiφ ∈ C, para construir z · w hemos de girar z un angulo φ (con centro de giro enel origen) y efectuar una homotecia que multiplique el modulo de z por el de w. Como se muestraen la figura, para llevar esto a cabo basta girar el triangulo de vertices 0, 1, z hasta que el segmentode extremos 0 y 1 tenga la direccion del segmento de extremos 0 y w, obteniendose ası el triangulode vertices 0, u1, uz; z · w es el punto de corte de la recta que pasa por 0 y uz con la paralela porw a la recta que pasa por u1 y uz (¿por que?)

Corolario 1.2.6 (Representacion exponencial del cociente de dos numeros complejos).Dados z1, z2 ∈ C, si z1 = |z1| eiφ1, z2 = |z2| eiφ2 �= 0, se tiene

z1z2

=|z1||z2|

ei(φ1−φ2).

Demostracion. Basta tener en cuenta que, segun lo que acabamos de probar,

|z1||z2|

ei(φ1−φ2) z2 =|z1||z2||z2| ei(φ1−φ2+φ2) = |z1| eiφ1 = z1.

Nota. La expresion eiφ, φ ∈ R, comparte propiedades algebraicas de la exponencial real:

eiφeiψ = ei(φ+ψ), φ, ψ ∈ R,

(eiφ)−1 = ei(−φ), φ ∈ R.

Figura 1 Figura 2

dados z, w = |w| eiφ ∈ C, para construir z ·w hemos de girar z un angulo φ (con centro de giro en elorigen) y efectuar una homotecia que multiplique el modulo de z por el de w. Como se muestra enla figura, para llevar esto a cabo basta girar el triangulo de vertices 0, 1, z hasta que el segmentode extremos 0 y 1 tenga la direccion del segmento de extremos 0 y w, obteniendose ası el triangulode vertices 0, u1, uz; z · w es el punto de corte de la recta que pasa por 0 y uz con la paralela porw a la recta que pasa por u1 y uz (¿por que?)

Corolario 5.2.6 (Representacion exponencial del cociente de dos numeros complejos).Dados z1, z2 ∈ C, si z1 = |z1| eiφ1, z2 = |z2| eiφ2 6= 0, se tiene

z1z2

=|z1||z2|

ei(φ1−φ2).

Demostracion. Basta tener en cuenta que, segun lo que acabamos de probar,

|z1||z2|

ei(φ1−φ2) z2 =|z1||z2||z2| ei(φ1−φ2+φ2) = |z1| eiφ1 = z1.

Nota. La expresion eiφ, φ ∈ R, comparte propiedades algebraicas de la exponencial real:

eiφeiψ = ei(φ+ψ), φ, ψ ∈ R,

(eiφ)−1 = ei(−φ), φ ∈ R.

5.3. POLINOMIOS EN C Y EN R. 141

Ejercicios

17.1. Hallar los modulos y los argumentos de los numeros complejos: −2x (x ∈ R \ {0}), iy(y ∈ R \ {0}), 1 + i, −1− i, (1 + i)(1 + i

√3)(√

3− i), 2 + 5i, 2− 5i, −2 + 5i, −2− 5i (estos ultimos,en funcion del arc tg(5/2)). ¿Cual es el argumento principal?

17.2. Si φ, ψ ∈ R, entonces eiφ = eiψ si y solo si existe k ∈ Z tal que φ− ψ = 2kπ.

17.3. Hallar el modulo y el argumento principal de 1 + cosφ+ i senφ, donde −π ≤ φ ≤ π.

17.4. Hallar la parte real y la imaginaria, el modulo y un argumento de1 + cosx+ i senx1 + cos y + i sen y

.

17.5. Sean α ∈ R y a ∈ C tales que 2 cosα = a+1a. Obtener 2 cosnα en funcion de a.

Indicacion. ¿Que vale(eiα − a

)(eiα − 1

a

)?

17.6. Si x+ iy = (2 + cosα+ i senα)−1 con α, x, y ∈ R, hallar x e y en funcion de α y probar queel punto (x, y) esta siempre en la circunferencia de diametro el segmento que une los puntos (1

3 , 0)y (1, 0).

17.7. Sean z1, z2, z3 ∈ C distintos dos a dos. Explicar el significado geometrico de las relaciones:

(i) =mz3 − z1z2 − z1

= 0 ; (ii) <ez3 − z1z2 − z1

= 0 .

17.8. Sean z1, z2 ∈ C con z1 6= 0. Probar quez2z1

es imaginario si y solo si |z1 + z2| = |z1 − z2|.Deducir que un paralelogramo tiene sus diagonales iguales si y solo si es un rectangulo.

17.9. Demostrar que |z1 − z2|2 + |z1 + z2|2 = 2|z1|2 + 2|z2|2 . Deducir que “un cuadrilatero es unparalelogramo si y solo si la suma de los cuadrados de las longitudes de sus diagonales es igual a lasuma de los cuadrados de las longitudes de todos sus lados” (ley del paralelogramo).

17.10. Demostrar que el triangulo cuyos vertices son los puntos z1, z2, z3 sobre el diagrama deArgand es equilatero si y solo si

z21 + z2

2 + z23 = z1z2 + z2z3 + z3z1.

17.11. ¿Cual es el lugar geometrico de los puntos del plano complejo tales que |z + 16| = 4|z + 1|?

5.3. Polinomios en C y en R.

Reflexionando sobre lo que hemos hecho hasta ahora, parece que nuestros logros son mas bienmodestos. Hemos anadido a R basicamente un numero, i, que nos genera ‘linealmente’ C, y que esuna raız del polinomio concreto X2 + 1. ¿Que sucedera con los demas polinomios? Lo que pasa loexpone estupendamente el premio Nobel de Fısica, Richard Feynman, en un capıtulo llamadoAlgebra (de lectura absolutamente recomendada en su totalidad) de su libro [Fey], p. 22-10:

〈〈 Ahora ustedes diran: “¡Esto puede seguir indefinidamente! Hemos definido las potencias delos imaginarios y todo lo demas y cuando estamos listos, viene alguien con otra ecuacionque no puede ser resuelta como x6 + 3x2 = −2. ¡Entonces tenemos que generalizar todo denuevo!” Pero resulta que con esta invencion adicional que es simplemente la raız cuadradade −1, ¡toda ecuacion algebraica puede ser resuelta! Este es un hecho fantastico que debemosdejar que lo demuestre el Departamento de Matematicas. Las demostraciones son hermosasy muy interesantes, pero ciertamente no son evidentes por sı mismas. De hecho, la suposicionmas evidente es que vamos a tener que inventar de nuevo, de nuevo y de nuevo. Pero el


milagro mas grande es que no tenemos que hacerlo. Esta es la ultima invencion. Despuesde esta invencion de los numeros complejos, encontramos que las reglas siguen funcionandocon los numeros complejos y hemos terminado de inventar cosas nuevas. Podemos encontrarla potencia compleja de cualquier numero complejo, podemos resolver cualquier ecuacionescrita algebraicamente en terminos de un numero finito de esos sımbolos. No encontramosmas numeros nuevos. 〉〉

5.3.1. Potencias y raıces de un numero complejo

Comenzaremos construyendo las raıces de unos polinomios muy particulares, los de la formaXn − z para un z cualquiera de C. Nuestro desarrollo de esta parte es, esencialmente, el de [Ap],pp. 26–28.

Definicion 5.3.1. Dados z ∈ C y n ∈ Z, se define{z0 = 1, zn+1 = zn z si n ≥ 0,zn =

(z−1)−n si n < 0 y z 6= 0.

Corolario 5.3.2 (Formula de De Moivre.). Dado φ ∈ R, para todo n ∈ N es

(cosφ+ i senφ)n = cos(nφ) + i sen(nφ).

Demostracion. Escrita en forma exponencial,

(eiφ)n = einφ,

se obtiene comodamente por induccion. Para n = 1 es trivialmente cierta, y si es cierta para un n,entonces

(eiφ)n+1 = (eiφ)n eiφ = einφ eiφ = einφ+iφ = ei(n+1)φ.

Ejercicio. ¿Que ocurre con la formula de De Moivre para n ∈ Z?

Proposicion 5.3.3. Dados dos enteros m y n, tenemos, siempre que esten definidas las potencias,

zm zn = zm+n, (zm)n = zmn, (z1z2)n = zn1 zn2 .

Demostracion. Para m, n ≥ 0, es un ejercicio de induccion (hacerlo). Para m o n < 0, aplicar ladefinicion y los resultados para exponentes no negativos (cf. [Ap], Teorema 1.50).

Teorema 5.3.4. Si z 6= 0 y n ∈ N, existen exactamente n numeros complejos distintos z0, z1, . . . ,zn−1 (llamados raıces n-esimas de z), tales que

znk = z

para cada k = 0, 1, . . . , n− 1.Ademas, si α es un argumento de z, estas raıces estan dadas por las formulas

zk = r eiϕk , k = 0, 1, . . . , n− 1,

donder = |z|1/n, ϕk =

α

n+

2kπn

(k = 0, 1, . . . , n− 1).


Demostracion. (Cf. [Ap], pags 27–28)Los n numeros complejos r eiϕk , k = 0, 1, . . . , n − 1, son distintos entre sı: pues si tomamos

enteros k, j, con 0 ≤ k ≤ n−1, 0 ≤ j ≤ n−1, de r eiϕk = r eiϕj se sigue ei(ϕk−ϕj) = 1 [porque r 6= 0y basta multiplicar por (1/r) e−iϕj ] y de aquı ϕk − ϕj = 2mπ para algun m ∈ Z; pero entoncesα

n+

2kπn− α

n− 2jπ

n= 2mπ, es decir,

k − jn

= m es un entero, y dado que

−1 <−(n− 1)

n=

0− (n− 1)n

≤ k − jn≤ (n− 1)− 0

n=n− 1n

< 1,

eso solo puede cumplirse sik − jn

= 0, es decir, si k = j.Ademas, cada uno de tales numeros es una raız n-esima de z:

(r eiϕk)n = rn einϕk = |z| ei(α+2kπ) = |z| eiα = z.

Por ultimo, no hay otras raıces n-esimas de z distintas de las anteriores, pues un polinomio degrado n puede tener a lo mas n raıces distintas, y las raıces n-esimas de z son justamente las raıcesdel polinomio P (X) = Xn − z.

Observese que todas las raıces n-esimas de un complejo z tienen el mismo modulo, |z|1/n, y que

eπi/5

1 0

e 2πi/5

e -2πi/5

e -πi/5

π/5


Demostracion. (Cf. [Ap], pags 27–28)Los n numeros complejos r eiϕk , k = 0, 1, . . . , n − 1, son distintos entre sı: pues si tomamos

enteros k, j, con 0 ≤ k ≤ n−1, 0 ≤ j ≤ n−1, de r eiϕk = r eiϕj se sigue ei(ϕk−ϕj) = 1 [porque r �= 0y basta multiplicar por (1/r) e−iϕj ] y de aquı ϕk − ϕj = 2mπ para algun m ∈ Z; pero entoncesα

n+

2kπn− α

n− 2jπ

n= 2mπ, es decir,

k − jn

= m es un entero, y dado que

−1 <−(n− 1)

n=

0− (n− 1)n

≤ k − jn≤ (n− 1)− 0

n=n− 1n

< 1,

eso solo puede cumplirse sik − jn

= 0, es decir, si k = j.Ademas, cada uno de tales numeros es una raız n-esima de z:

(r eiϕk)n = rn einϕk = |z| ei(α+2kπ) = |z| eiα = z.

Por ultimo, no hay otras raıces n-esimas de z distintas de las anteriores, pues un polinomio degrado n puede tener a lo mas n raıces distintas, y las raıces n-esimas de z son justamente las raıcesdel polinomio P (X) = Xn − z.

Observese que todas las raıces n-esimas de un complejo z tienen el mismo modulo, |z|1/n, y quesus argumentos difieren en multiplos de 2π/n radianes, de modoque sus afijos estan sobre una circunferencia de centro el origeny radio |z|1/n, ocupando los vertices de un polıgono regular den lados.Ejemplo. Para cada n ∈ N existen n raıces n-esimas de launidad , los numeros 1, e2πi/n, . . . , e2(n−1)πi/n, situados sobrelos vertices de un polıgono regular de n lados inscrito en lacircunferencia unidad, de centro el origen y radio 1. Ademas,el polıgono es simetrico respecto del eje real. Estas raıces sonlas potencias sucesivas de e2πi/n, y pueden obtenerse numerosasrelaciones algebraicas entre ellas.

Problemas de notacion para las raıces. Si queremos mantener las notaciones z1/n o n√z que

empleabamos para las raıces n-esimas no negativas de los numeros reales no negativos, ¿como pro-ceder ahora, que para cada z ∈ C\{0} tenemos n raıces diferentes sin ningun criterio incontestablepara distinguir entre ellas? En particular: ¿que significa z1/2? ¿que significa

√z?

Podrıamos reservar el sımbolo z1/n o n√z para la raız n-esima principal de z, definida como

|z|1/n ei(Arg z)/n,

donde Arg z indica el argumento principal de z (el que queda entre −π y π), o utilizar uno de ellos(o los dos) para el conjunto de todas las raıces n-esimas de z.

Los convenios utilizados varıan de unos textos a otros, por lo cual, para no caer en ambiguedades,merece la pena explicitar siempre el significado exacto atribuido a los sımbolos que se estenmanejando, sin necesidad de decantarse por ninguno. Por ejemplo, pondrıamos:

• para a, b, c ∈ R, a �= 0,az2 + bz + c = 0

si y solo si

z =−b±

√b2 − 4ac

2a,

es decir,

z =−b+

√b2 − 4ac

2ao z =

−b−√b2 − 4ac

2a,

donde√b2 − 4ac indica una cualquiera de las raıces cuadradas del complejo b2 − 4ac.

sus argumentos difieren en multiplos de 2π/n radianes, de modoque sus afijos estan sobre una circunferencia de centro el origeny radio |z|1/n, ocupando los vertices de un polıgono regular den lados.Ejemplo. Para cada n ∈ N existen n raıces n-esimas de launidad , los numeros 1, e2πi/n, . . . , e2(n−1)πi/n, situados sobrelos vertices de un polıgono regular de n lados inscrito en lacircunferencia unidad, de centro el origen y radio 1. Ademas,el polıgono es simetrico respecto del eje real. Estas raıces sonlas potencias sucesivas de e2πi/n, y pueden obtenerse numerosasrelaciones algebraicas entre ellas.

Problemas de notacion para las raıces. Si queremos mantener las notaciones z1/n o n√z que

empleabamos para las raıces n-esimas no negativas de los numeros reales no negativos, ¿como pro-ceder ahora, que para cada z ∈ C\{0} tenemos n raıces diferentes sin ningun criterio incontestablepara distinguir entre ellas? En particular: ¿que significa z1/2? ¿que significa

√z?

Podrıamos reservar el sımbolo z1/n o n√z para la raız n-esima principal de z, definida como

|z|1/n ei(Arg z)/n,

donde Arg z indica el argumento principal de z (el que queda entre −π y π), o utilizar uno de ellos(o los dos) para el conjunto de todas las raıces n-esimas de z.

Los convenios utilizados varıan de unos textos a otros, por lo cual, para no caer en ambiguedades,merece la pena explicitar siempre el significado exacto atribuido a los sımbolos que se estenmanejando, sin necesidad de decantarse por ninguno. Por ejemplo, pondrıamos:

• para a, b, c ∈ R, a 6= 0,az2 + bz + c = 0

si y solo si

z =−b±

√b2 − 4ac

2a,

es decir,

z =−b+

√b2 − 4ac

2ao z =

−b−√b2 − 4ac

2a,

donde√b2 − 4ac indica una cualquiera de las raıces cuadradas del complejo b2 − 4ac.


Ejemplo. Cuando z sea un numero real no negativo, z ∈ [0,+∞), como z = 0 o Arg z = 0, seobtiene como raız cuadrada principal de z justamente su raız cuadrada real no negativa

Ejercicios

18.1. Dado x ∈ R, hallar la parte real y la imaginaria de:a) (1 + cosx+ i senx)n;

b)

(1 + cosx+ i senx1 + cos y + i sen y

)n.

18.2. Calcular

(1 + sen a+ i cos a1 + sen a− i cos a

)n, n ∈ N y a ∈ R.

18.3. Calcular todos los valores de 4√−1, 6√

1 + i.

18.4. Hallar los numeros complejos que son iguales a la potencia n-esima de sus conjugados.

18.5. Probar que la suma de las potencias n-esimas de las raıces k-esimas de la unidad es k o 0,segun n sea o no multiplo de k.

18.6. Probar que 1 + cos2π5

+ cos4π5

+ cos6π5

+ cos8π5

= 0 y dar una interpretacion geometrica.

Probar que

cosπ

5=√

5 + 14

, cos2π5

=√

5− 14

.

18.7. Probar que

1− cosπ

5+ cos

2π5− cos

3π5

+ cos4π5

= 0

− senπ

5+ sen

2π5− sen

3π5

+ sen4π5

= 0

18.8. Probar que si n ∈ N se tiene(1 + i tan

π

12

)n+(1− i tan

π

12

)n= 2

(√6−√

2)n

cosnπ

12

18.9. Hallar la suma 1 + 2 cos θ + 2 cos 2θ + · · ·+ 2 cosnθ.

18.10. Expresar en potencias de cos θ (θ ∈ R): cos 6θ, cos 3θ,sen 6θsen θ

,sen 5θsen θ

.

Expresar en en potencias de sen θ(θ ∈ R): sen 3θ, sen 7θ.

18.11. Sea ω = e2πi/13. Probar que ω + ω3 + ω4 + ω9 + ω10 + ω12 =√

13− 12

.

Indicacion: Si S es la suma, ¿quien es (2S + 1)2?

18.12. Sea z = e2πi/7. Calcular

6∑n=1

zn2.

5.3.2. Teorema fundamental del Algebra y sus consecuencias

Desde el punto de vista algebraico, la principal ventaja del cuerpo complejo es que, al contrarioque R, C es algebraicamente cerrado, i.e., todo polinomio no constante con coeficientes complejostiene una raız en C.(**) Este hecho fue ‘presentido’ antes de que se llegara a formular adecuadamente(**)Sigue dandose una condicion de minimalidad: C es el menor cuerpo algebraicamente cerrado que contiene a R .Con mayor precision, si un cuerpo algebraicamente cerrado contiene un subcuerpo isomorfo a R , debe contener unsubcuerpo isomorfo a C .


y mucho antes de que se lograra una demostracion incuestionable (ver [DD-P], pp. 248–253). No esun resultado facil de demostrar con argumentos elementales pero, en cursos posteriores, sera unaconsecuencia sencilla del analisis de las funciones complejas de variable compleja. No obstante,puede verse una demostracion relativamente asequible (bastante larga) en [A-K], pp. 344–352; vertambien [D’A-W], pp. 324 y ss.

Aquı nos limitaremos a dar su enunciado y a deducir las consecuencias que de el se derivan enrelacion con el estudio de las raıces y de la factorizacion de los polinomios en C[X] y en R[X].

Teorema 5.3.5 (D’Alembert-Gauss). Todo polinomio no constante con coeficientes complejosadmite al menos una raız en C.

Corolario 5.3.6. Los polinomios irreducibles en C[X] son los de grado 1 (lineales), de manera quetodo polinomio en C[X] de grado n, n ∈ N, admite una factorizacion como producto de n factoreslineales.

Demostracion. Ya comentamos que los polinomios de grado 1 son siempre irreducibles. Cualquierotro polinomio p en C[X] de mayor grado ya no es irreducible, pues tendrıa una raız z ∈ C y serıapor tanto de la forma p(X) = (X − z) q(X), con deg q = deg p− 1 6= 0.

La segunda conclusion se sigue del teorema de factorizacion unica: necesariamente,

p(X) = a(X − z1) · · · (X − zn)

a 6= 0, z1, . . . , zn ∈ C si deg p = n.

Corolario 5.3.7. Sea n ∈ N. Todo polinomio en C[X] de grado n posee exactamente n raıces, sise cuenta cada una de ellas tantas veces como indique su multiplicidad.

Demostracion. Dado p ∈ C[X] de grado n, agrupando los factores X − z repetidos en la descom-posicion anterior, si z1, . . . , zk, son las distintas raıces de p, con multiplicidades m1, . . . , mk,resulta

p(X) = a(X − z1)m1 · · · (X − zk)mk

y por tanto m1 + · · ·+mk = n.

Pasemos ahora a caracterizar los polinomios irreducibles en R[X].

Lema 5.3.8. Dado p ∈ R[X], si z ∈ C es tal que p(z) = 0, entonces p(z) = 0. En palabras, siun polinomio con coeficientes reales tiene una raız compleja z, tambien su conjugado z es raız delpolinomio.

Demostracion. Por las propiedades de la conjugacion, si p(X) = a0 + a1X + · · ·+ anXn, y a0, a1,

. . . , an ∈ R, para todo z ∈ C es

p(z) = a0 + a1z + · · ·+ anzn = a0 + a1 z + · · ·+ an zn = a0 + a1 z + · · ·+ an z

n = p(z).

En particular, p(z) = 0 implica p(z) = p(z) = 0.

Corolario 5.3.9. Los polinomios irreducibles en R[X] son los polinomios lineales y los polinomioscuadraticos de la forma

a[(X − b)2 + c2],

con a, b, c ∈ R, a 6= 0 y c 6= 0 (que son los polinomios cuadraticos sin raıces en R).


Demostracion. Los polinomios lineales son siempre irreducibles, y los polinomios cuadraticos delenunciado son irreducibles en R[X] por ser de segundo grado y no tener raıces en R (notese que lasraıces en C de a[(X − b)2 + c2] son b+ ic y b− ic).

Cualquier polinomio irreducible q en R[X] es de esta forma. Pues si tiene alguna raız en R,es lineal. Y si no, mirado en C[X], admitira al menos una raız compleja b + ic con c 6= 0; perotambien tendra por raız b − ic segun el lema. Por tanto, es divisible (en principio en C[X]) por(X − (b + ic))(X − (b − ic)) = (X − b)2 + c2, que tiene coeficientes reales; el cociente de q por(X − b)2 + c2 es el mismo en C[X] que en R[X] (¿por que?), luego debe ser un a ∈ R[X] condeg a = 0, o sea, una constante real no nula.

Nota. Los polinomios de segundo grado irreducibles en R[X] son, equivalentemente, los de la formaAX2 +BX + C con B2 − 4AC < 0 (¿por que?).

Ejercicios

19.1. Factorizar X4 + 1 y X4 + 4 en C[X], en R[X] y en Q[X].

19.2. Descomponer en factores irreducibles el polinomio Xn +Xn−1 + · · ·+X + 1(i) en C[X];

(ii) en R[X].

19.3. Mediante factorizacion, probar que todo polinomio real de grado impar admite al menos unaraız real.

19.4. Hallar dos numeros complejos cuya suma sea 4 y cuyo producto sea 8.Indicacion. ¿Quien es (X − a)(X − b)?

19.5. Si z1, z2 son las dos soluciones de la ecuacion az2 + bz + c = 0, donde a, b, c ∈ R, demostrarque zn1 + zn2 ∈ R para todo n ∈ N. Si la ecuacion es en particular z2 − 2z + 2 = 0, calcular zn1 + zn2 .

19.6. Sabiendo que la ecuacion z2 − (√

3 + i√

3)z + p = 0 tiene por solucion z = −1 + i, hallar p yla otra raız.

19.7. ¿Que condicion han de cumplir los numeros reales a, b, c, d para que la ecuacionz3 + az2 + (b+ ic)z + b+ id = 0 admita una raız real?

19.8. Comprobar que z = 3 + 4i es una solucion de la ecuacion z4 − 10z3 + 62z2 − 178z + 325 = 0y hallar las otras tres raıces.

19.9. Considerese la ecuacion z3− 2z+ c = 0, donde c ∈ R. Hallar sus soluciones sabiendo que unade ellas esta en la bisectriz del primer cuadrante del plano complejo.

19.10. Resolver la ecuacion (iz + 1)5 = (1− z)5.19.11. Demostrar que el polinomio (X+i)n−(X−i)n tiene todas sus raıces reales y determinarlas.

19.12.

(i) Demostrar que si a ∈ R,

(z + a)2m − (z − a)2m = 4amzm−1∏k=1

(z2 + a2 cotg2 kπ

2m

).

(ii) Usando el apartado anterior, probar que

m−1∏k=1

cotgkπ

2m= 1.

(N∏k=1

zk significa z1 · · · zN .)

5.4. FRACCIONES RACIONALES. 147

5.4. Fracciones racionales. Fracciones simples.

Como senalabamos al construir los numeros racionales a partir de los enteros, la misma cons-truccion puede llevarse a cabo partiendo de cualquier dominio de integridad, para sumergirlo en un‘cuerpo de fracciones’. En particular, el metodo puede aplicarse al dominio K[X] de los polinomiosen la indeterminada X con coeficientes en un cuerpo conmutativo K, obteniendose ası el cuerpo delas fracciones racionales (tambien llamado ‘de las fracciones algebraicas’, ver [Pest]). No daremosninguna demostracion, puesto que basta repetir las empleadas en la construccion de Q, cambiandosimplemente ‘numero entero’ por ‘polinomio’ (el lector puede comprobarlo en algun caso para unamejor comprension del proceso).

Lema 5.4.1. Sea Φ = K[X]× (K[X] \ {0}), y ∼ la relacion en Φ dada por(p1, q1) ∼ (p2, q2) cuando y solo cuando p1q2 = p2q1.

Entonces ∼ es una relacion de equivalencia en Φ.

A los elementos de Φ los denominaremos fracciones algebraicas en la indeterminada X, concoeficientes en K.

Definicion 5.4.2. El cuerpo de las fracciones racionales es el conjunto cociente K(X) =Φ/ ∼. Sus elementos, que denominaremos fracciones racionales, son las clases de equivalencia[(p, q)].

Nota sobre nomenclatura y notacion. No hay una denominacion estandar universalmenteutilizada para los elementos de Φ y de K(X): es habitual llamar indistintamente a unos y otros‘fracciones algebraicas’ o ‘fracciones racionales’. Para mayor complicacion, el sımbolo empleadonormalmente para la relacion de equivalencia ∼ en Φ es =. Igualmente, se emplea la notacionclasica p/q para los dos objetos distintos (p, q) ∈ Φ o [(p, q)] ∈ K(X). A veces, se dice que unafraccion racional admite una representacion p/q para indicar que (p, q) es un representante de laclase de equivalencia que constituye dicha fraccion.

Es realmente notable que a pesar de todos estos ‘abusos’, no haya dificultades serias de enten-dimiento si se considera en cada situacion cual es el sentido adecuado al contexto.

El lector queda advertido, pues, de que poco a poco iremos relajando la precision adhiriendonosa la practica habitual, aunque en este primer apartado intentaremos ser fieles a la notacion ynomenclatura introducidas. Como muestra, por ejemplo:

Definicion 5.4.3. Una fraccion algebraica p/q se dice irreducible si p y q son relativamenteprimos, es decir, si mcd(p, q) = 1.

(Evidentemente, aquı p/q ∈ Φ, aunque no se indique explıcitamente.)

Ejercicio. Probar que toda fraccion algebraica es equivalente a una fraccion irreducible; dicho deotro modo, que toda fraccion racional admite un representante que es una fraccion irreducible.Concretamente, dados polinomios p, q ∈ K[X] con q 6= 0 y mcd(p, q) = d, si p = p1d, q = q1d,p/q ∼ p1/q1 y p1/q1 es irreducible.

Definicion 5.4.4. Dadasp1

q1,p2

q2∈ Φ, su suma es

p1

q1+p2

q2=p1q2 + p2q1

q1q2(∈ Φ),

y su productop1

q1

p2

q2=p1p2

q1q2(∈ Φ).


Lema 5.4.5. Dadosp1

q1,r1s1

,p2

q2,r2s2

en Φ tales quep1

q1∼ r1s1

,p2

q2∼ r2s2

, se verifica

p1

q1+p2

q2∼ r1s1

+r2s2,

p1

q1

p2

q2∼ r1s1

r2s2.

Definicion 5.4.6. Dadas dos fracciones racionalesp1

q1,p2

q2∈ K(X), llamaremos suma de ambas

a la fraccion racionalp1

q1+p2

q2=p1q2 + p2q1

q1q2[∈ K(X)],

y producto a la fraccion racional

p1

q1

p2

q 2

=p1p2

q1q2[∈ K(X)].

Segun el lema previo, la aplicacion suma (respectivamente, producto) de K(X)×K(X) en K(X)

que hace corresponder a(p1

q1,p2

q2

)∈ K(X) ×K(X) la fraccion racional

p1q2 + p2q1q1q2

(respectiva-

mente,p1p2

q1q2

)esta bien definida.

Proposicion 5.4.7. Con la suma y el producto que hemos definido, K(X) es un cuerpo conmuta-tivo.

Proposicion 5.4.8. La aplicacion h : K[X]→ K(X) dada por

h(p) = p/1 ∈ K(X), p ∈ K[X],

tiene las siguientes propiedades:

(i) es inyectiva, h(p1) 6= h(p2) si p1 6= p2;

(ii) transforma sumas en sumas, h(p1 + p2) = h(p1) + h(p2);

(iii) transforma productos en productos, h(p1 p2) = h(p1)h(p2).

Es decir, h es un isomorfismo entre K[X] y h(K[X]) por lo que, desde este momento, conside-ramos

K[X] ⊆ K(X) y p = p/1 para todo p ∈ K[X].

5.4.1. LECTURA: funciones racionales.

Igual que hemos hablado de funciones polinomicas, obtenidas mediante evaluacion de polino-mios, ¿podemos definir funciones racionales mediante evaluacion de fracciones racionales? Ahoralas cosas se complican: mientras que no hay ningun problema en evaluar p(x) para cada p ∈ K[X]y x ∈ K, no podemos decir lo mismo sobre la evaluacion de p/q ∈ K(X) en cualquier x ∈ K. Sibien hemos exigido que q 6= 0, eso no impide que puedan existir x ∈ K para los que q(x) = 0 (lasposibles raıces de q), lo que hace que p(x)/q(x) no tenga sentido en K. Es, pues, necesario ajustarnuestro planteamiento.

Definicion 5.4.9. Una funcion racional es un cociente de funciones polinomicas.Por tanto, su dominio sera todo K salvo un numero finito de elementos, a lo mas (los que anulenal denominador).

5.4. FRACCIONES RACIONALES. 149

En consecuencia, dos representantes distintos de una misma fraccion racional originan dos

funciones racionales diferentes: por ejemplo, mientras que las fracciones racionalesX + 1X2 − 1

y

X − 2X2 − 3X + 2

son iguales, las funciones racionales f y g, cocientes respectivamente de las funciones

polinomicas x + 1 y x2 − 1, x − 2 y x2 − 3x + 2, son distintas puesto que dom f = K \ {1,−1},dom g = K \ {1, 2}. Evidentemente, en los x pertenecientes a la interseccion de sus dominios

ambas toman el mismo valor, igual a su vez a1

x− 1.

Esto es lo que sucede en general:Sea p/q ∈ Φ y r/s una fraccion irreducible equivalente a p/q; el conjunto S de ceros de s esta con-tenido en el conjunto de ceros de q, y la funcion racional asociada a p/q es la restriccion a K \ Sde la funcion racional asociada a r/s.

5.4.2. Fracciones simples

Las fracciones racionales admiten una representacion ‘estandar’ que es muy util en ciertasaplicaciones. En lo que sigue, para simplificar los enunciados, suponemos que deg p ≤ deg q significa〈〈p = 0 o deg p ≤ deg q〉〉.

Lema 5.4.10. Dada una fraccion p(X)/q(X), existen polinomios p0(X), p1(X) unıvocamente de-terminados tales que deg p1 < deg q y

p(X)q(X)

= p0(X) +p1(X)q(X)

.

Demostracion. La igualdad del enunciado puede reescribirse

p(X)q(X)

=p0(X)q(X) + p1(X)

q(X),

lo que significa, por definicion, que (***)

p(X)q(X) = [p0(X)q(X) + p1(X)]q(X),

que equivale, cancelando q (o, para la implicacion inversa, multiplicando por q), a

p(X) = p0(X)q(X) + p1(X).

Por tanto, el lema es solo otra manera de enunciar la existencia y unicidad de la division depolinomios.

Lema 5.4.11. Si q(X) ∈ K[X] es de la forma q(X) = q1(X)q2(X) con mcd(q1, q2) = 1, todafraccion racional p(X)/q(X) puede descomponerse en suma de fracciones con denominadores q1 yq2; es decir, existen polinomios p1 y p2 tales que

p(X)q(X)

=p1(X)q1(X)

+p2(X)q2(X)

.

Demostracion. Puesto que existen dos polinomios u y v tales que uq1 + vq2 = 1,

p

q=p(uq1 + vq2)

q1q2=p v

q1+p u

q2.

(***)Aquı estamos mirando p/q como elemento de K(X).


Ejemplo. En R(X),1

X4 + 1=

1(X2 +

√2X + 1)(X2 −

√2X + 1)

.

Llamemos A = X2 +√

2X + 1, B = X2 −√

2X + 1. Puesto que

A = B + 2√

2X, B = (X −√

2)X + 1,

(algoritmo de Euclides ‘salvo constantes’) se sigue que

1 = B − (X −√

2)X = B − (X −√

2)1

2√

2(A−B) = B(1 +

X −√

22√

2)−A X −

√2

2√

2

=X +

√2

2√

2B − X −

√2

2√

2A,

y de aquı

1X4 + 1

=(X +

√2)B

2√

2AB− (X −

√2)A

2√

2AB=

12√

2X +

√2

X2 +√

2X + 1− 1

2√

2X −

√2

X2 −√

2X + 1.

—Analogamente, paraX + 1X3 − 1

=X + 1

(X − 1)(X2 +X + 1),

de X2 +X + 1 = (X − 1)(X + 2) + 3 se sigue que

X + 1X3 − 1

=13X + 1X − 1

− 13

(X + 1)(X + 2)X2 +X + 1

=13

(X − 1) + 2X − 1

− 13

(X2 +X + 1) + (2X + 1)X2 +X + 1

=13

2X − 1

− 13

2X + 1X2 +X + 1

.

Este segundo ejemplo sugiere que el lema anterior puede refinarse cuando el numerador es unpolinomio de menor grado que el denominador .

Lema 5.4.12. Si q(X) ∈ K[X] es de la forma q(X) = q1(X)q2(X) con mcd(q1, q2) = 1, todafraccion algebraica p(X)/q(X) con deg p < deg q puede descomponerse, de manera unica, ensuma de fracciones con denominadores q1 y q2 y numeradores p1 y p2 tales que deg p1 < deg q1,deg p2 < deg q2; es decir, existen polinomios unıvocamente determinados p1 y p2 tales quedeg p1 < deg q1, deg p2 < deg q2 y

p(X)q(X)

=p1(X)q1(X)

+p2(X)q2(X)

.

Demostracion. Sean p1 y p2 como en el lema anterior. Si deg p1 ≥ deg q o deg p2 ≥ deg q, dividiendoserıa p1 = c1q1 + r1, p2 = c2q2 + r2, deg r1 < deg q1, deg r2 < deg q2 o nulos. Haciendo operaciones

p = (c1+c2)q+r1q2+r2q1; deg(r1q2) < deg q1+deg q2 = deg q, deg(r2q1) < deg q2+deg q1 = deg q,

lo que significa que c1 + c2 es el cociente de la division de p por q, necesariamente nulo porquedeg p < deg q (el resto serıa r1q2 + r2q1). Por tanto

p(X)q(X)

=r1(X)q1(X)

+r2(X)q2(X)

, deg r1 < deg q1, deg r2 < deg q2.

La unicidad se sigue de que si tambien

p(X)q(X)

=s1(X)q1(X)

+s2(X)q2(X)

, deg p1 < deg q1, deg s2 < deg q2,

se deduce que r1q2 + r2q1 = s1q2 + s2q1, es decir, (r2 − s2)q1 = (s1 − r1)q2, y como q1 y q2 sonrelativamente primos, q1|(s1 − r1); pero entonces s1 − r1 = 0, pues en caso contrario,

deg q1 ≤ deg(s1− r1) ≤ max{deg s1,deg r1} < deg q1, imposible. Por lo mismo, r2− s2 = 0.

5.5. NUMEROS COMPLEJOS Y GEOMETRIA PLANA 151

Lema 5.4.13. Toda fraccion racional de la forma p(X)/[q(X)]m puede expresarse como

p(X)[q(X)]m

= p0(X) +p1(X)q(X)

+ · · ·+ pk(X)[q(X)]k

+ · · ·+ pm(x)[q(X)]m

con deg pk < deg q, 1 ≤ k ≤ m.

Demostracion. Dividiendo repetidamente por q se obtiene

p = c1q + pm = (c2q + pm−1)q + pm = · · · = (· · · (p0q + p1)q + · · ·+ pm−1)q + pm,

con deg pk < deg q, 1 ≤ k ≤ m, lo que equivale a la igualdad del enunciado.

Nota. Los polinomios p0, p1, . . . , pm estan unıvocamente determinados (probarlo como ejercicio).

Definicion 5.4.14. Un elemento de K(X) es una fraccion simple si puede escribirse en la formap(X)/[q(X)]k, donde q(X) es irreducible en K[X] y el grado de p(X) ∈ K[X] es estrictamentemenor que el de q(X).

Ejemplo. En C(X) las fracciones simples son solo de la formaa

(X − b)k, con a, b ∈ C. En R(X)

aparecen ademas fracciones del tipoa1 + a2X

[(X − b)2 + c2]k, a1, a2, b, c ∈ R.

Proposicion 5.4.15 (Descomposicion en fracciones simples). Todo elemento p/q de K(X)admite una expresion unica como suma de un polinomio en X mas una suma de fracciones simples.

Demostracion. Es consecuencia de los lemas anteriores.

Ejercicio. Simplificar y descomponer en fracciones simples en C(X) y en R(X) las siguientesfracciones:

(a)(X + 1)3

X2 − 1; (b)

X3 − 27X2 − 9

; (c)X2 + 5X + 6

X2 − 4;

(d)2X − 3

(X − 1)(X − 2)(X − 3); (e)

1(X2 − 9)2

; (f)X5 + 5X3 −X + 6

X3 − 1.

Nota. Los programas de calculo simbolico (maple, Mathematica) permiten generalmente efec-tuar estas operaciones. Por ello, recomendamos calcular ‘a mano’ los coeficientes numericos pedidosen alguno de los ejercicios anteriores, y plantear cuando menos la forma del resultado en todos losdemas. Solo despues es aconsejable pasar al ordenador.

(Para maple , la sintaxis es 〈〈convert((a0 + a1 ∗ x+ · · · )/(b0 + b1 ∗ x+ · · · ),parfrac,x);〉〉 ypara Mathematica , 〈〈Apart[(a0 + a1 x+ · · · )/(b0 + b1 x+ · · · )]〉〉)

5.5. LECTURA: Numeros complejos y geometrıa plana.

En los ejercicios de un apartado anterior hemos apuntado tımidamente la interrelacion entre lageometrıa del plano y el calculo con numeros complejos. Lamentablemente, no podemos extendernosen esta direccion, pero como un autentico regalo para cualquier aficionado a las Matematicas pro-ponemos la lectura de un libro muy especial, Liang-shin Hahn: Complex Numbers and Geometry.Mathematical Association of America, 1994., (que contiene resultados geometricos mas profundosque los que aparecen aquı), y ofrecemos una lista de ejercicios suplementarios ‘fuera de con-curso’para esos ratos en los que apetece salirse de la rutina (algunos de ellos pertenecen a otro librointeresante en este aspecto, [Wil]).


Ejercicios

20.1. Desigualdades triangulares. Probar que la longitud del lado de un triangulo es menorque la suma de las longitudes de los otros dos y mayor que su diferencia.

20.2. Mediatriz de un segmento. Probar que “el lugar geometrico de los puntos que equidistande dos puntos fijos A y B es la recta perpendicular al segmento AB por su punto medio.”

20.3. Demostrar que:

(i) Si z1 + z2 + z3 = 0 y |z1| = |z2| = |z3| = 1, los puntos z1, z2 y z3 son vertices de un trianguloequilatero inscrito en la circunferencia unidad.

(ii) Si z1 + z2 + z3 + z4 = 0 y |z1| = |z2| = |z3| = |z4|, los puntos z1, z2, z3 y z4 o bien son verticesde un rectangulo o bien coinciden de dos en dos.

20.4. ¿Bajo que condicion tres puntos z1, z2 y z3, distintos dos a dos, estaran sobre una mismarecta?

20.5. ¿Bajo que condicion cuatro puntos z1, z2, z3 y z4, distintos dos a dos, estaran sobre unamisma circunferencia o sobre una misma recta?

20.6. Demostrar que las alturas de un triangulo son concurrentes (es decir, que las tres se cortanen un mismo punto, el ortocentro del triangulo).

20.7. ¿Puede probarse algebraicamente que un paralelogramo tiene las diagonales perpendicularessi y solo si es un rombo? ¿Y que tiene las diagonales iguales si y solo si es un rectangulo?

Bibliografıa

[A-K] Aleksandrov. A. D.; Kolmogorov, A. N.; Laurentiev, M. A. & al.: La matematica:su contenido, metodos y significado (vol. I). Alianza Editorial, Madrid, 1973.

[ApC] Apostol, T.M.: Calculus, vol. I (segunda edicion). Reverte, Barcelona, 1989.

[Ap] Apostol, T.M.: Analisis Matematico (segunda edicion). Reverte, Barcelona, 1991.

[DD-P] Dahan-Dalmedico, A.; Peiffer, J.: Une histoire des mathematiques. Editions du Seuil,Paris, 1986.



[Fey] Feynman, R. & al.: Fısica. Volumen I: Mecanica, radiacion y calor. Addison-WesleyIberoamericana, Wilmington, Delaware, 1987.


[Her] Hernandez, E.: Algebra y geometrıa. Addison-Wesley/UAM, Madrid, 1994.



[Spg] Spiegel, M.R.: Variable compleja. McGraw Hill (coleccion Schaum), 1971..


[Wil] Williams, J.: Algebra de numeros complejos. Limusa-Wiley, Mexico, 1974.

153

154 BIBLIOGRAFIA

Capıtulo 6

Aritmetica de punto flotante.

Estudiaremos (muy superficialmente) la representacion de los numeros reales en los ordenadoresy su ‘aritmetica’. Las referencias pertinentes a la bibliografıa iran apareciendo a lo largo de laexposicion.

En todo este capıtulo, cuando no se especifica lo contrario, 〈〈numero〉〉 significa numero real.

6.1. Aperitivo.

Lee atentamente estos enunciados:

(1) Segun tu calculadora, ¿que vale

13

+13

+13, 1− 1

3− 1

3− 1

3?

(2) Comprueba con tu calculadora que

a) a =1 +√

52

= 1, 6180339 . . .

b) b =a− 12− a

=

1 +√

52

− 1

2− 1 +√

52

=0, 6180339 . . .0, 3819661 . . .

= 1, 6180333 . . .,

de modo que a > b.

Responde ahora cuidadosamente a estas cuestiones:

(i) ¿Como se explica el resultado de (1)?

(ii) ¿Son correctas las operaciones de (2)?


(iii) En (2), lo cierto es que:

a > b ut a = b ut a < b ut .

¿Que consecuencias sacas?

155

156 CAPITULO 6. ARITMETICA DE PUNTO FLOTANTE.

6.2. Representacion en punto flotante

En una reunion se plantea la siguiente pregunta:“¿Cuanto vale π?”

El ingeniero dice: “Es aproximadamente 3 y 1/7.”El fısico responde: “Es 3.141592.”El matematico piensa un momento, y replica:

“Es igual a π.”(Del folklore)

Hemos mostrado la posibilidad teorica de representar los numeros reales mediante sucesiones dedıgitos en distintas bases. Ahora vamos a enfrentarnos con su representacion practica en un orde-nador, con las limitaciones efectivas que la realidad impone.

6.2.1. Numeros de maquina

El conjunto de los numeros reales no puede representarse plenamente en un ordenador (¡nisiquiera el de los numeros enteros!). Si queremos guardar las cifras decimales (o mas frecuentemente,binarias) de un numero en un ordenador, solo disponemos de un numero finito de ‘huecos’ parahacerlo. Podemos, simplemente, ignorar las cifras del desarrollo a partir de un cierto lugar; pero seaprovecha mejor el espacio evitando “ceros innecesarios” como en la ‘notacion cientıfica’, con unarepresentacion en punto flotante:

numero = signo × mantisa × base exponente

Por ejemplo, para la constante de gravitacion universal G = 6.673× 10−11, la mantisa es 6.673, labase es 10 y el exponente −11.

Este y otros ejemplos de magnitudes muy grandes o muy pequenas, como

Masa del electron 9.109× 10−28 g.Masa del sol 1.989× 1030 kg.Constante de Plank 6.626× 10−34 J·sNumero de Avogadro 6.022× 1023 mol−1

ponen de manifiesto el ahorro de cifras que conlleva esta notacion.Pero cada numero admite infinitas representaciones de este tipo:

−111/2 = −55.5× 100 = −5.55× 101 = −0.555× 102 = . . ., o tambien−111/2 = −555× 10−1 = −5550× 10−2 = . . .

Para tener unicidad hace falta normalizar la representacion. Habitualmente, como hemos hechoen los ejemplos de notacion cientıfica,

el primer dıgito no nulo de la mantisa aparece a la izquierda del punto,

la parte entera del valor absoluto consta de una sola cifra: −111/2 = −5.55× 101.Esto excluye el numero 0, que queda como excepcion, y ha de ser representado aparte.

En matematicas es tambien frecuente otra normalizacion,colocando la primera cifra no nula inmediatamente despues del punto;

el valor absoluto de la mantisa es siempre menor o igual que 1 y su parte entera es nula:−111/2 = −0.555× 102.

La diferencia entre ambas normalizaciones es inesencial: todo se reduce a sumar o restar 1 alexponente. Lo importante es que el punto decimal flota para eliminar los ceros ‘innecesarios’:

2/111 = 0.018018018 . . . = 1.8018018× 10−2, o bien 2/111 = 0.18018018× 10−1.

6.2. REPRESENTACION EN PUNTO FLOTANTE 157

La normalizacion ahorra espacio: Si se emplea base 2 en vez de base 10, como todas las mantisascomenzaran por 〈〈1. etc.〉〉, podemos sobreentender no solo el punto, sino tambien el 1 (‘tecnicadel bit fantasma’). En la segunda normalizacion, todas las mantisas —en cualquier base— van acomenzar por 〈〈0. etc.〉〉, lo que hace innecesario explicitar el 0 y el punto.

Finalmente, el tamano de las palabras del ordenador fuerza a limitar:

la precision, la cantidad p de dıgitos disponibles para colocar en ellos la mantisa;

la cantidad p′ de dıgitos disponibles para el exponente, que estara por tanto comprendidoentre un valor mınimo y un valor maximo.

Con tales condicionantes, fijada una base β, los numeros de maquina , verdaderamente dis-ponibles en el ordenador, seran

y = ±βE(d1 +

d2

β+d3

β2+ · · ·+ dp

βp−1

),

donde cada dıgito dk satisface 0 ≤ dk ≤ β − 1 y d1 6= 0, y el exponente E toma sus valores entreun mınimo Emin y un maximo Emax.

Paralelamente, con la segunda normalizacion obtendrıamos

y = ±βe(d1

β+d2

β2+ · · ·+ dp

βp

),

con 0 ≤ dk ≤ β − 1 y d1 6= 0, y emin ≤ e ≤ emax. Se pasa de una a otra, por tanto, tomandoe = E + 1. Ambas son equivalentes, en el sentido de que generan exactamente los mismos numeros(con la relacion senalada entre los exponentes, y con Emin = emin − 1, Emax = emax − 1).

Aun ası:— hay multitud de implementaciones posibles— cada fabricante elige la que mejor le parece— esto dificulta enormemente la transportabilidad de los programas de calculo.Para unificar, se han propuesto diversas estandarizaciones:

norma IEEE 754 (completada con la IEEE 854); denominada tambien IEC 559. Es la masutilizada. Hay en la red ‘applets’ que muestran el formato archivado por el ordenador ([2]). Lanormalizacion elegida para la mantisa (denominada significando en esta norma) es la primera,d1.d2 . . . dp, con β = 2 o β = 10 como bases permitidas.

norma ISO/IEC 10967-1 Language Independent Aritmetic, Part 1 [LIA-1], posterior y menosrestrictiva. Usa la segunda normalizacion 0.d1d2 . . . dp para la mantisa (denominada ahorafraccion), y admite cualquier base β que sea un numero natural par.

Sistemas numericos en punto flotante

Para analizar las dificultades y la complejidad de la representacion y manejo en el ordenadorde numeros en punto flotante, se establecen ‘modelos ideales’, que sean ‘simples pero realistas’.Siguiendo a Higham (v. [Hig] §2.1, pp. 40 y ss.), usaremos lo que el denomina sistemas numericosen punto flotante.

Previamente, notemos: cuando escribimos

y = ±βe(d1

β+d2

β2+ · · ·+ dp

βp

),

la fraccion f =d1

β+d2

β2+ · · · + dp

βpse puede representar tambien como m × β−p, donde m es un

entero de p dıgitos del intervalo [βp−1, βp− 1]; concretamente m = d1 βp−1 + d2 β

p−2 + · · ·+ dp. Ası

y = ±f × βe = ±(m× β−p)× βe = ±m× βe−p.


Por ser la notacion mas comoda, esta es la forma de los valores que vamos a usar para definir lossistemas numericos en punto flotante.

Definicion 6.2.1. Un sistema numerico en punto flotante es un subconjunto finito de R,F = F (β, p, emin, emax), caracterizado por cuatro parametros enteros:

• β ∈ Z (la base o radix de F )• p ∈ Z (la precision de F )• emin ∈ Z (el menor exponente de F )• emax ∈ Z (el mayor exponente de F )

Dados valores especıficos de β, p, emin, emax, se define

FN = {y = ±m× βe−p : m, e ∈ Z, βp−1 ≤ m ≤ βp − 1, emin ≤ e ≤ emax},

y finalmente

F = {0} ∪ FN

El mayor y el menor numero positivo de F son

fmax := max{y ∈ F : y > 0} = βemax(1− β−p)fminN := mın{y ∈ FN : y > 0} = βemin−1

Llamaremos rango de F al conjunto [−fmax,−fminN ]∪ {0} ∪ [fminN , fmax] (que contienea F estrictamente).

Notese que ahora la mantisa m de un numero y = 0.d1d2 . . . dp × βe de FN es el enterod1d2 . . . dp (escritos en base β).

Llamaremos a d1 el dıgito mas significativo y a dp el dıgito menos significativo de y.

En la norma LIA-1, los parametros β y p han de satisfacer

β ≥ 2 y p ≥ 2,

y β tiene que ser par.Ası mismo, “para que haya bastantes elementos en F”, los parametros emin, emax y p han de

satisfacer

p− 2 ≤ −emin ≤ βp − 1,p ≤ emax ≤ βp − 1.

En IEEE 754 y 854 se consideran cuatro formatos distintos: precision simple, precision doble,precision simple extendida, precision doble extendida, con valores para los parametros (ver [Hig],p. 41):

formato β p emin emax

IEEE simple 2 24 −125 128IEEE doble 2 53 −1021 1024IEEE simple extendida 2 ≥ 32 ≤ −1021 ≥ 1024IEEE doble extendida 2 ≥ 64 ≤ −16381 ≥ 16384

(reajustados a la normalizacion 〈〈0.d1 . . .〉〉).


Ejemplos

1.- Si β = 2, p = 5 [= 22 + 1], y = 11/2 = 22 + 1 + 1/2 = 23(2−1 + 2−3 + 2−4), tendrıamos(con mantisa y exponente en base 2, escrito el cero como O y el uno como I para distinguir)y = O.IOIIO × 2II = IOIIO × 2II−IOI ; la mantisa m es IOIIO y el exponente e es II.2.- ‘Minimodelo’ con β = 2, p = 3, emin = −1, emax = 3. Los numeros no negativos de F serıan (enescritura decimal) el 0 y

fraccion1/2 1/2 + 1/8 1/2 + 1/4 1/2 + 1/4 + 1/8 exponente0.25 0.3125 0.3750 0.4375 × 2−1

0.5 0.625 0.750 0.875 × 20

1.0 1.25 1.50 1.75 × 21

2.0 2.5 3.0 3.5 × 22

4.0 5.0 6.0 7.0 × 23

que se distribuyen graficamente ası:

0 0.25 0.5 1.0 2.0 3.0 4.0 5.0 6.0 7.0

Junto con sus opuestos (los simetricos respecto del origen) forman el sistema F = F (2, 3,−1, 3).Este ejemplo ilustra como el espaciado de los numeros de F salta un factor 2 (= β) con cada

potencia de 2 (= β).

6.2.2. Aproximacion por redondeo

Elegido un determinado sistema numerico en punto flotante para implementar en el ordenador,el resto de los numeros reales (¡casi todos!) no existen para el. Esta situacion no es nueva enabsoluto: cada vez que hemos usado un valor numerico de π, hemos puesto π = 3.14, o π = 3.1416,o π = 3.141592654 (cuando disponemos de calculadora); no hemos podido manejar su ‘valor exacto’,que, como decıa el matematico, ‘es π’. La realidad fuerza inevitablemente a tomar aproximaciones,por lo que, si no podemos evitar los errores que generan, tratemos al menos de minimizarlos.

Eso hacemos cuando ponemos π = 3.1416 (aproximacion por exceso) y no π = 3.1415 (aproxi-macion por defecto o por corte): tomamos el valor mas proximo a π entre los que tienen cinco cifrasdecimales.

Para simplificar(*), definiremos:

Definicion 6.2.2 (Redondeo y desbordamiento.). Dado F = F (β, p, emin, emax), el redondeo( respecto de F ) es la aplicacion fl : R→ F ∪ {overflow,underflow} dada por

fl(x) = overflow si |x| > fmax = maxF

(hay un desbordamiento por exceso)

fl(x) = underflow si 0 < |x| < fminN = mın{|y| : y ∈ F, y 6= 0}(hay un desbordamiento por defecto).

fl(x) = elemento de F mas proximo a x si x esta en el rango de F .

Cuando haya dos numeros en F a la misma distancia de x, convendremos en tomar comofl(x) el que tenga el ultimo dıgito dp par.

(*)La norma IEEE 754 contempla distintos modos de redondeo: redondeo hacia +∞ (round down), redondeo hacia−∞ (round up), redondeo hacia 0 (round towards zero) y redondeo al mas proximo (round to nearest). Ver [Gold]


Ejercicio. Para x, y en el rango de F ,

(i) x ≤ y implica fl(x) ≤ fl(y);

(ii) fl(−x) = − fl(x);

(iii) fl(βn · x) = βn · fl(x) (supuesto βn · x en el rango de F ).

Ejemplos. (1) En nuestro ‘minimodelo’ con β = 2, p = 3, emin = −1, emax = 3, se producedesbordamiento por exceso siempre que |x| > 7, y por defecto si 0 < |x| < 0.25.

underflow overflow

0 0.25 0.5 1.0 2.0 3.0 4.0 5.0 6.0 7.0

Para x = 4.5, serıa fl(x) = 4; para x = 5.5, serıa fl(x) = 6 (¿por que?).

(2) Para β = 10, p = 6:

a = 0.31415926525 . . .× 101 fl(a) = 0.314159× 101

b = −0.81412781 fl(b) = −0.814128× 100

c = 0.112399972 fl(c) = 0.124000× 100

d = 0.999999721 fl(d) = 0.100000× 101

Observese como el ultimo dıgito de la mantisa de b ha sido modificado. El cambio puede afectarincluso a varios dıgitos (como en c) y a veces hasta al exponente, como en el ejemplo d.

Medidas del error de redondeo

Al redondear un numero, es decir, al sustituir un x ∈ R por fl(x) como valor aproximado,cometemos un error cuyo tamano conviene saber controlar. Puesto que cada x en el rango deF que no pertenezca a F estara en un intervalo (y1, y2) con extremos en F y uno solo, y fl(x)sera precisamente uno de esos extremos,

y1 —————————————— y2

x

el valor de | fl(x)− x| = mın{|x− y| : y ∈ F} sera, en el peor de los casos, la mitad de la longitudy2 − y1 del intervalo. Basta, por tanto, controlar el espaciado entre los numeros de F . En general,se observa que el espaciado es uniforme entre potencias consecutivas de β, y que se multiplica porβ al saltar a una nueva potencia de β.

Para concretar mas, se utiliza el epsilon de la maquina, que es la distancia εM desde 1.0 alsiguiente numero de F mas grande que el. Por tanto,

Definicion 6.2.3. Epsilon de la maquina . Para un sistema numerico en punto flotante F =F (β, p, emin, emax), el epsilon de la maquina es el numero

εM = β1−p,

Por tanto, εM es el espaciado de los numeros en punto flotante entre 1.0 y β, mientras que elespaciado de los numeros entre 1.0 y 1/β es β−p = εM/β. En general,

Lema 6.2.4. La distancia entre un numero en punto flotante normalizado y y otro numero enpunto flotante normalizado adyacente a y es como mınimo β−1εM |y| y como maximo εM |y| (salvoque uno de ellos sea cero).

Demostracion. Ver [Hig], pp. 41.


Pero segun dice [Hig], ‘la cantidad mas util asociada con F , que esta por todas partes en elmundo del analisis de los errores de redondeo’, es la llamada unidad de redondeo, que no es otracosa que la mitad del epsilon de la maquina.

Definicion 6.2.5. Dado un sistema numerico en punto flotante F = F (β, p, emin, emax), el numero

u =12β1−p =

12εM se llama unidad de redondeo del sistema F .

En el estandar IEEE con simple precision se tiene u = 2−24 ≈ 5.96× 10−8; en doble precision,u = 2−53 ≈ 1.11× 10−16.

A partir del lema anterior, se obtiene:

Proposicion 6.2.6. Si x ∈ R esta en el rango de F , entonces

| fl(x)− x| ≤ u |x| = 12β1−p |x|;

precisando mas,

fl(x) = x(1 + δ), |δ| < u =12β1−p.

Demostracion. Ver [Hig], p. 42, Th. 2.2.

Esta proposicion nos da cotas superiores del error absoluto y del error relativo en la aproxima-cion de x por fl(x). Recordamos la definicion de estos conceptos.

Definicion 6.2.7. Sea x un numero real. Si x es otro numero real, que tomamos como una aproxi-macion de x, se llama error absoluto (de la aproximacion) a la diferencia

Ea(x) = |x− x|,

y error relativo (cuando x 6= 0) al cociente

Er(x) =Ea(x)|x|

=|x− x||x|

=∣∣∣∣1− x

x

∣∣∣∣ = ∣∣∣∣ xx − 1∣∣∣∣ .

Ası x = x+ α con |α| = Ea(x); y para x 6= 0, x = x(1 + ρ) con |ρ| = Er(x).

La proposicion 6.2.6 significa, por tanto, que el error relativo del redondeo es siempre estricta-mente menor que la unidad de redondeo.

Nota. En algunos textos, el error se expresa en terminos de la unidad en el ultimo lugar, que sedefine para un y ∈ F por

ulp(y) = ulp(±0.d1d2 . . . dp × βe) = 0.00 . . . 01× βe = βe−p

(ulp: unity in the last place). Ası, por ejemplo, si F corresponde a β = 10 y p = 3, y se redondea.0314159 a .314× 10−1, entonces hay un error de .159 unidades en el ultimo lugar. Dada la distri-bucion de los elementos de F , es preferible usar el error relativo, mas preciso; mientras que parax = 0.9994999999 tendrıamos fl(x) = 0.999× 100, con ulp(fl(x)) = 10−3 y un error de 0.4999999ulp ≈ 0.5 ulp, el error relativo es 0.0005002502252 ≈ 0.1u, y sin embargo para x = 1.005 serıafl(x) = 0.100 × 101, con ulp(fl(x)) = 10−2, un error de 0.5 ulp igualmente, pero el error relativocorrespondiente serıa 0.004975124378 ≈ u, aproximadamente diez veces mayor que el anterior (estees el fenomeno llamado wobbling precision, ‘precision bamboleante’ u ‘oscilante’).


6.3. Aritmetica ‘aproximada’

Practicamente en todas las operaciones que realiza un ordenador los datos llegan inevitablemen-te afectados de errores, o se generan errores de redondeo en el curso de los calculos. Al efectuar lasoperaciones mas elementales, las aritmeticas (sumas, restas, multiplicaciones, divisiones) los erroresde los resultados ¿son del mismo orden que los iniciales o, por el contrario, se produce un aumentosignificativo en los mismos? ¿son las propias operaciones una nueva fuente de error, se realicencomo se realicen? Responder con precision a esta pregunta es una tarea ciertamente complicada, yes el objeto de estudios especıficos fuera de lugar en esta asignatura. Pero podemos hacernos unaidea de las dificultades y los problemas que se suscitan examinando que sucede en nuestro modelode sistemas de numeros en punto flotante.

Para empezar, ¿como se propagan los errores en una suma?

Lema 6.3.1. Sean x, y, αx, αy, εa(x), εa(y), numeros reales tales que |αx| ≤ εa(x), |αy| ≤ εa(y),y sean

x = x+ αxy = y + αy

}. Entonces Ea = |(x+ y)− (x+ y)| ≤ |αx|+ |αy|,

pudiendo tomar Ea cualquier valor desde Ea = 0 hasta Ea = εa(x) + εa(y).Analogamente, si x+ y 6= 0, y para ρx, ρy, es

x = x(1 + ρx)y = y(1 + ρy)

}, entonces Er =

|(x+ y)− (x+ y)||x+ y|

=|x ρx + y ρy||x+ y|

,

y nada puede decirse en general: Er puede tomar cualquier valor en [0,+∞).

Demostracion. Por la desigualdad triangular

Ea = |(x+ y)− (x+ y)| = | − (αx + αy)| ≤ |αx|+ |αy|.

Como cualquier valor r ∈ [0, εa(x) + εa(y)] puede ponerse en la forma r = s+ t con 0 ≤ s ≤ εa(x),0 ≤ t ≤ εa(y) (¿por que?), Ea puede alcanzar el valor r.

En cuanto a Er, sustituyendo x y y por su expresion en terminos de x e y aparece la igualdaddel enunciado. Que Er puede alcanzar cualquier valor no negativo es claro: tomemos, por ejemplo,x > 0, h > 0 cualesquiera, y = −x+ h, ρx ≥ 0 arbitrario, ρy = 0; ası x+ y = h y

Er =xρxh,

que puede tomar tanto el valor Er = 0 para ρx = 0 como cualquier valor positivo R (basta que seaρx > 0, h =

xρxR

).

Vemos, pues, que aunque el error absoluto de los sumandos este acotado por un cierto εa, el de lasuma puede llegar a ser 2εa, y al cabo de N sumas, Nεa, y que el error relativo queda descontrolado.Como generalmente lo que importa es el error relativo, afinaremos el resultado anterior.

Proposicion 6.3.2. Sean x, y, ρx, ρy, εr(x), εr(y), numeros reales tales que x + y 6= 0 y |ρx| ≤εr(x), |ρy| ≤ εr(y), y sean

x = x(1 + ρx)y = y(1 + ρy)

}.

Si x e y tienen el mismo signo,

Er ≤ max{|ρx|, |ρy|},

pudiendo tomar Er cualquier valor desde Er = 0 hasta Er = max{εr(x), εr(y)}.

6.3. ARITMETICA ‘APROXIMADA’ 163

Demostracion. Cuando x e y tienen el mismo signo, |x + y| = |x| + |y| (¿por que?). Poniendomax{|ρx|, |ρy|} = ρ, aplicando la igualdad previa y la desigualdad triangular

Er =|x ρx + y ρy||x|+ |y|

≤ |x| |ρx|+ |y| |ρy||x|+ |y|

≤ |x| ρ+ |y| ρ|x|+ |y|

= ρ.

Para concluir, tomando x = y 6= 0, ρx = ρy = ρ con ρ ∈ [0,max{εr(x), εr(y)}] arbitrario, seobtiene Er = ρ.

En este caso, vemos que el error de la suma de datos erroneos no supera el error de los sumandos.Por contra, con x e y de signos opuestos el desastre es total.

Proposicion 6.3.3. Sean x, y, ρx, ρy, numeros reales tales que x+ y 6= 0 y

x = x(1 + ρx)y = y(1 + ρy)

}.

Si x e y tienen signos opuestos, y no hay circunstancias especiales en los valores de los datos,Er puede tomar cualquier valor no negativo, por grande que este sea.

Demostracion. Revisar la demostracion del lema 6.3.1.

Esta es una causa de error insalvable, ‘intrınseca’ a la operacion, que ningun ordenador niprograma alguno pueden evitar.

Observese la disparidad del comportamiento cuando los sumandos ‘se anaden o refuerzan’ (tie-nen el mismo signo) o ‘se oponen’ (tienen signos opuestos). En el primer caso el error relativo de lasuma es, como mucho, el del ‘peor’ de los sumandos; en el segundo caso, el error relativo de la sumase dispara cuando la suma es ‘casi cero’, aun con pequenısmos errores relativos en los sumandos(suele llamarse a este fenomeno cancelacion catastrofica).

Para empeorar un poco mas las cosas, cuando manejamos un sistema F de numeros en puntoflotante, y es x = fl(x), y = fl(y), no siempre resulta x + y ∈ F (el resultado exacto de la sumade dos numeros de F no siempre esta en F ), con lo cual necesitara ser redondeado, y lo mejor quela maquina podra ofrecer como suma de estos numeros, sera fl(x+ y) (la situacion real puede sermas complicada). En la construccion ‘mas favorable’ de la ‘suma de maquina’, tendrıamos, pues,

x⊕ y = fl(fl(x) + fl(y)),

anadiendo otro error al que puede achacarse exclusivamente al redondeo de x e y (y suponiendoque no haya desbordamiento).

Similarmente, la ‘mejor version’ en este planteamiento de las restantes operaciones aritmeti-cas(**), corresponderıa a

x y = fl(fl(x)− fl(y))x� y = fl(fl(x) · fl(y))x� y = fl(fl(x)/ fl(y))

(Para que tengan sentido, se supone que todos los numeros que intervienen estan en el rango deF : es trivial dar ejemplos en los que x, y cumplen esta condicion, mientras que x � y da overflowo underflow para � = alguna de las operaciones anteriores.)(**)En la aritmetica de punto flotante del estandar IEEE se estipula que, al menos para elementos de F , 〈〈cadaoperacion debe ser efectuada como si produjese primero un resultado intermedio correcto en precision infinita y conrango no acotado, y luego se ajustase este resultado intermedio a la precision destinada 〉〉, de modo que finalmentese obtenga la respuesta exacta correctamente redondeada.


Veamos algunos ejemplos de los errores que se originan al realizar estas operaciones. Con base10 y precision p = 5, tomamos

y = 5/7 fl(y) = 0.71428×100

u = 0.714251 fl(u) = 0.71425×100

v = 98765.9 fl(v) = 0.98765×105

w = 0.111111×10−4 fl(w) = 0.11111×10−4

Calculando, obtenemos:

Operacion Resultado Error absoluto Error relativoy u 0.30000× 10−4 0.472× 10−5 0.136

(y u)� w 0.27000× 101 0.425 0.136(y u)� w 0.29629× 101 0.466 0.136

u⊕ v 0.98766× 105 0.162× 101 0.164× 10−4

y � w 0.64286× 105 0.779 0.122×10−4

Se observa que el comportamiento es bastante desigual. Ademas, con estas nuevas operacionesse pierden algunas de las buenısimas propiedades algebraicas y estructurales de R. Comprobemoslo.

Siguiendo con base 10 y precision p = 5, prescindiendo del 0 previo al punto por comodidad deescritura, tomamos

x = 1000000 fl(x) = .10000× 107

y = −1000000 fl(y) = −.10000× 107

z = 1 fl(z) = .10000× 101

Calculando, resulta:

x+ y x⊕ y y + z y ⊕ z x+ y + z (x⊕ y)⊕ z x⊕ (y ⊕ z)0 .00000× 100 −999999 −.10000× 107 1 .10000× 101(= 1) .00000× 100(= 0)

¡No hay asociatividad para la ‘suma flotante’ ⊕! Ni funciona tampoco la propiedad cancelativa: eneste mismo ejemplo,

y ⊕ z = y ⊕ 0 6=⇒ z = 0.

Tambien podemos observar que para x = 3× 107, por ejemplo,

fl(1/x) = .33333× 10−7, x� (1/x) = fl((.30000× 108)(.33333× 10−7)) = .99999,

mientras que si y = .33334× 10−7, z = .33335× 10−7,

x� y = y � x = x� z = z � x = .10000× 101 = 1.

Esto implica que tampoco el producto es asociativo: para estos valores,

z � (x� y) = z � 1 = z 6= y = 1� y = (z � x)� y.

Ademas, x tiene dos inversos, y y z, ninguno de los cuales coincide, por cierto, con fl(1/x).


Comparando, en general, con las propiedades fundamentales de R, encontramos:

PROPIEDADES VALIDEZde cuerpo

Suma cerrada NO Puede haber underflow/overflowSuma asociativa NO a veces (a⊕ b)⊕ c 6= a⊕ (b⊕ c)Suma conmutativa SI siempre a⊕ b = b⊕ aElemento neutro SI siempre 0 ∈ F y a⊕ 0 = 0⊕ a = a para todo aElemento opuesto SI siempre −a ∈ F y a⊕ (−a) = (−a)⊕ a = 0

Producto cerrado NO Puede haber underflow/overflowProducto asociativo NO a veces (a� b)� c 6= a� (b� c)Producto conmutativo SI siempre a� b = b� aElemento unidad SI siempre 1 ∈ F y 1� a = a� 1 = a para todo aElemento inverso ?? ???

Distributiva NO a veces a� (b⊕ c) 6= (a� b)⊕ (a� c)de cuerpo ordenado

Reflexiva SI siempre a ≤ aSimetrica SI siempre a ≤ b y b ≤ a implica a = b (a, b ∈ F )Transitiva SI siempre a ≤ b, b ≤ c implica a ≤ cInvariancia por traslacion SI siempre a ≤ b implica a⊕ c ≤ b⊕ cInvariancia por escalado SI siempre a ≤ b, 0 ≤ c implica a� c ≤ b� cCompletitud SI trivial: F es finitoArquimediana SI trivial: F es acotadoDensidad NO F es finito

topologicasConexion NO todos los puntos son aislados

Revisemos ahora el funcionamiento de estas operaciones y el error cometido al tomarlas comoaproximaciones de las operaciones exactas.

Errores en sumas y restas

Estudiaremos solamente x ⊕ y y x y cuando x y y son elementos positivos del rango de F ,porque todos los demas casos puede reducirse a este teniendo en cuenta que fl(−x) = − fl(x),x y = x⊕ (−y), etc.

Proposicion 6.3.4. Dados x, y ≥ fminN , tales que x⊕ y ∈ F , si

fl(x) = x(1 + ρx) (|ρx| < u),f l(y) = y(1 + ρy) (|ρy| < u),

se tieneEr =

|(x+ y)− (x⊕ y)||x+ y|

< 2u+ u2,

y asıx⊕ y = (x+ y)(1 + ρ), |ρ| < 2u+ u2 ≈ εM .

Demostracion. Si z = fl(x) + fl(y) = x + y + xρx + yρy, x ⊕ y = fl(z) = z(1 + ρz) = z + zρz(|ρz| < u), sera

x⊕ y − (x+ y) = x⊕ y − z + z − (x+ y) = zρz + xρx + yρy

= (x+ y + xρx + yρy)ρz + xρx + yρy = (x+ y)ρz + (xρx + yρy)(ρz + 1),


de donde

Er =|(x⊕ y)− (x+ y)|

|x+ y|=∣∣∣∣ρz +

xρx + yρyx+ y

(1 + ρz)∣∣∣∣ ≤ |ρz|+ max{|ρx|, |ρy|}(1 + |ρz|)

< u+ u(1 + u) = 2u+ u2 ≈ 2u = εM (u2 ≈ 0).

Esta es una estimacion ‘pesimista’ del error, que puede mejorarse en circunstancias especiales.Ası, cuando x, y ∈ FN (⇐⇒ ρx = ρy = 0), Er = |ρz| < u; o si ρz = 0 (i.e., si fl(x) + fl(y) ∈ FN ),Er ≤ max{|ρx|, |ρy|} < u. Sin embargo, en otras circunstancias, el error puede superar a u.Ejemplos.1.- Para β = 10, p = 5, x = y = 1.00005, Er = .4999750012× 10−4 ≈ u.2.- Para β = 2, p = 3 (cf. ‘minimodelo’), x ligeramente mayor que 1.125 (con lo cual fl(x) = 1.25),y ligeramente mayor que 4.5 (con lo cual fl(y) = 5), x+y ‘ligeramente mayor’ que 5.625, x⊕y = 7,queda Er ≈ 0.244 ≈ 2u = εM = 0.25

En la sustraccion habra que imponer restricciones adicionales, si hemos de evitar cancelacionescatastroficas. Si x, y ∈ F , obviamente solo hay error de redondeo y el error relativo de x yestara acotado por u. Pero, en general, el resultado puede presentar un error relativo desmesurada-mente grande: si a = fmax = βemax(1−β−p), d = βemax−p es la distancia de a al anterior elemento

de F , b = a− d es tal elemento, c =a+ b

2el punto medio del segmento[b, a],

b —————————————— ay c x

tomando cualquier h > 0 menor que d/2, para x = c+h

2, y = c− h

2, serıa (ver figura)

x− y = h, fl(x) = a, fl(y) = b, x y = fl(d) = d,

y por tanto

Er =|(x− y)− (x y)|

|x− y|=|h− d||h|

=d

h− 1,

que tiende a +∞ cuando h tiende a 0+ (el argumento puede trasladarse a otros intervalos de F ).

Vemos ası que la cancelacion catastrofica es insalvable cuando se manejan datos aproximados,por ejemplo datos que sean resultados redondeados (aproximados) de una operacion anterior.

Notese que incluso si x e y (distintos) son ‘suficientemente proximos’ y estan ‘adecuadamentesituados’ para que fl(x) = fl(y), con lo cual x y = 0, el error relativo alcanza un desastroso100 %: Er = 1 en este caso.

En general, cuando (x + y)/(|x − y|) no es ‘demasiado grande’, hay cancelacion benigna, queno aumenta exageradamente el error previo, puesto que, conservando la notacion anterior y proce-diendo de la forma acostumbrada,

Er =∣∣∣∣x yx− y

− 1∣∣∣∣ = ∣∣∣∣ρz +

xρx − yρyx− y

(1 + ρz)∣∣∣∣ ≤ |ρz|+ x+ y

|x− y|max{|ρx|, |ρy|} (1 + |ρz|)

< u+x+ y

|x− y|u(1 + u) = u+

x+ y

|x− y|(u+ u2).

Errores en productos y cocientes

La notacion en punto flotante esta mejor adaptada al producto que a la suma, en cierto sentido,y jugando con los exponentes es mas facil evitar el desbordamiento. Pero hemos de pensar queincluso partiendo de numeros de F su producto exacto tiene ‘demasiadas cifras’, y casi siempresera necesario el redondeo. Analicemos el tamano del error relativo que introduce la operacion �.


Proposicion 6.3.5. Dados numeros reales no nulos x e y, tales que x� y ∈ F , si


se tiene

Er =|(x y)− (x� y)|

|x y|< 3u+ 3u2 + u3,

o sea

x� y = (x y)(1 + ρ), |ρ| < 3u+ 3u2 + u3 ≈ 3u.

Demostracion. Poniendo z = fl(x) fl(y) = xy(1+ρx)(1+ρy), x�y = fl(z) = z(1+ρz) (|ρz| < u),queda x� y = xy(1 + ρx)(1 + ρy)(1 + ρz), y ası

Er =|(x� y)− (x y)|

|x y|= |(1 + ρx)(1 + ρy)(1 + ρz)− 1|

= |ρx + ρy + ρz + ρxρy + ρxρz + ρyρz + ρxρyρz|< 3u+ 3u2 + u3 ≈ 3u,

suponiendo 3u2 + u3 ≈ 0.

Analogamente, para la operacion �:

Proposicion 6.3.6. Dados numeros reales x e y, tales que x� y ∈ F , si


se tiene

Er =|(x/y)− (x� y)|

|x/y|<

3u+ u2

1− u,

o sea

x� y = (x/y)(1 + ρ), |ρ| < 3u+ u2

1− u≈ 3u.

Demostracion. Poniendo z = fl(x)/ fl(y) = (x/y)1 + ρx1 + ρy

, x � y = fl(z) = z(1 + ρz) (|ρz| < u),

queda x� y = (x/y)(1 + ρx)(1 + ρz)

1 + ρy, y ası, usando que |1 + ρy| ≥ 1− |ρy| > 1− u > 0,

Er =|(x� y)− (x/y)|

|x/y|=∣∣∣∣(1 + ρx)(1 + ρz)

1 + ρy− 1∣∣∣∣

=∣∣∣∣(1 + ρx)(1 + ρz)− (1 + ρy)

1 + ρy

∣∣∣∣ = ∣∣∣∣ρx + ρz − ρy + ρxρz1 + ρy

∣∣∣∣<

3u+ u2

1− u≈ 3u

suponiendo 4u2/(1− u) ≈ 0.


6.4. Estrategias de calculo para reducir los errores de redondeo

La computacion en punto flotante es inexacta por naturaleza, y no es difıcilutilizarla mal de modo que las respuestas computadas consistan casi enteramenteen ‘ruido’.

Uno de los principales problemas del analisis numerico es determinar comoseran de exactos los resultados de ciertos metodos numericos; aquı esta involu-crado un problema de ‘salto de credibilidad’: no sabemos cuantas respuestas delordenador creer.

Los usuarios novatos del ordenador resuelven este problema confiando implıci-tamente en el ordenador como autoridad infalible; tienden a creer que todos losdıgitos de una respuesta impresa son significativos.

Los usuarios desilusionados del ordenador mantienen justamente la actitudopuesta, constantemente temen que sus respuestas carezcan casi de sentido.

(D. E. Knuth)El analisis elemental de las operaciones que acabamos de efectuar muestra que es necesario un

estudio previo a cualquier proceso de calculo con ordenador, para evitar una acumulacion exage-rada de errores, especialmente cuando haya que realizar operaciones consecutivas (a veces en grannumero) con el ordenador. Hay tarea para personas con ingenio hasta en los casos mas simples,como senala J. M. Muller en su artıculo Ordenadores en busca de aritmetica [MC1, pp. 92–99], al-tamente recomendable: 〈〈 . . . Si el lector deduce que no hay que depositar jamas una confianza ciegaen los resultados facilitados por un ordenador y que la implantacion rapida de una operacion tanelemental como la suma compete todavıa al campo de la investigacion, me dare por absolutamentesatisfecho. 〉〉

Los ejemplos siguientes ilustran algunas de las dificultades y muestran caminos para paliar susconsecuencias.

6.4.1. Reformulacion del problema: Ejemplos

Calculo de una diferencia de cuadrados

Consideremos la evaluacion de x2 − y2 cuando x = 1.21, y = 1.20 en un sistema con β = 10 yp = 3. Resulta

x y x2 y2 x2 − y2 Error relativoValor exacto 1.21 1.20 1.4641 1.4400 0.0241Redondeo 0.121× 10 0.120× 10 0.146 0.144 0.200× 10−1 0, 170 . . . ≈ 34u

ya que en este caso u =12

10−2 = 0.005.

Pero x2−y2 = (x−y)(x+y). ¿Que sucede si rehacemos el calculo usando la segunda expresion?

x y x− y x+ y (x− y)(x+ y) Error relativoValor exacto 1.21 1.20 0.01 2.41 0.0241Redondeo 0.121× 10 0.120× 10 0.1× 10−1 0.241× 10 0.241× 10−1 0

¡El resultado es exacto! Todas las cantidades x, y, x + y, x − y, (x + y)(x − y) son ‘numeros demaquina’ y no hemos introducido ningun error, mientras que al calcular x� x ha sido necesario elredondeo y x � x − y � y ha originado una cancelacion con los dos ultimos dıgitos falsos. Si bienel ejemplo es un poco ‘tramposo’, incluso cuando x e y deban redondearse la segunda expresion espreferible para el calculo, puesto que si fl(x) y fl(y) tienen varias cifras iniciales coincidentes, suscuadrados tendran iguales doble numero de dıgitos, y la cancelacion es ‘aun mas catastrofica’.

6.4. ESTRATEGIAS DE CALCULO 169

Raıces de una ecuacion de segundo grado

Para resolver una ecuacion de segundo grado con raıces reales

ax2 + bx+ c = 0,

a, b, c ∈ R, a 6= 0, b2 − 4ac ≥ 0, disponemos de las conocidısimas formulas

x1 =−b+

√b2 − 4ac

2a, x2 =

−b−√b2 − 4ac

2a.

¿Que problemas podra haber en el calculo efectivo con unas formulas tan familiares? Comenzandopor el discriminante b2 − 4ac, vemos la amenaza de una ‘cancelacion catastrofica’ cuando b2 y 4actengan valores parecidos. ¿La salvaremos como antes, reescribiendo b2−4ac = (b−

√4ac)(b+

√4ac)?

Los resultados no son muy halaguenos. Incluso ignorando el problema del calculo de una raızcuadrada aproximada, los resultados en ambos casos pueden ser muy mediocres. Siguiendo conβ = 10, p = 3 como antes, veamos que sucede en el siguiente ejemplo:

a b c b2 4ac b2 − 4ac Error relativoV.E. 1.22 3.34 2.28 11.1556 11.1264 0.0292P.F. 0.122× 10 0.334× 10 0.228× 10 0.112× 102 0.111× 102 0.100 485u

(en la primera fila estan los valores exactos, en la segunda los resultados en punto flotante). Analo-gamente

4ac S ≈√

4ac b− S b+ S (b− S)(b+ S)V.E. 11.1264 3.335625878 0.004374122 6.675625878 0.02920000202P.F. 0.111× 102 0.333× 10 0.1× 10−1 0.667× 10 0.667× 10−1

¡No coincide ni la primera cifra significativa! (aunque al menos ha disminuido el error a 257u,aproximadamente).

Queda otra cancelacion catastrofica al acecho. ¿Que sucede si b2 es mucho mayor que 4ac?Entonces

√b2 − 4ac ≈ |b|, con lo cual, si b > 0, podemos tener dificultades con la formula para x1,

y si b < 0, con la formula para x2.Afortunadamente, este problema es mas sencillo de solventar. Supongamos, por ejemplo, que

b > 0. Entonces D = b +√b2 − 4ac es una suma de cantidades positivas, con lo que el error no

superara al error de los datos en mucho mas de 2u, y pasaremos a calcular x2 = −D/2a. Para elcalculo de x1 disponemos de otras formulas mas adecuadas:

x1 =c

ax2=

−2cb+√b2 − 4ac

.

Cuando b < 0, basta usar la formula tradicional para x1 y hallar x2 a partir de

x2 =c

ax1=

2c−b+

√b2 − 4ac

.

Sumas en cadena

Los errores en una sola operacion (no ‘catastrofica’) en punto flotante se amplifican segun sevan encadenando mas y mas operaciones, si bien el aumento es en general tan pequeno que hacefalta un numero muy grande de operaciones inexactas para llegar a errores visibles. No obstante,puesto que no hay asociatividad, incluso en sumas de varios sumandos positivos no es indiferentela manera de llevar a cabo las operaciones: el orden y la manera de agrupar puede inicidir en queel error final sea mas grande o mas pequeno.


Veamos una ilustracion clara (muy simplificada). Con precision p = 3 y base 10, y sumandos100, 0.9, 0.9, 0.9, podemos proceder ası:

(((100⊕ 0.9)⊕ 0.9)⊕ 0.9 = (100⊕ 0.9)⊕ 0.9 = 100⊕ 0.9 = 100(100⊕ 0.9)⊕ (0.9⊕ 0.9) = 100⊕ 1.8 = 102((0.9⊕ 0.9)⊕ 0.9)⊕ 100 = (1.8⊕ 0.9)⊕ 100 = 2.7⊕ 100 = 103

valor exacto: 100 + 0.9 + 0.9 + 0.9 = 100.9 + 0.9 + 0.9 = 101.8 + 0.9 = 102.7

En las evaluaciones primera y tercera hemos procedido recurrentemente: en cada etapa sumamosla suma parcial previa con el sumando siguiente. En la segunda hemos emparejado los sumandos,reduciendo el numero de operaciones.

Observamos que el primer procedimiento da mayor error, el segundo es ‘menos costoso’, y queel tercero da el valor redondeado del resultado exacto, el mejor valor posible.

La causa del exito final es aquı muy aparente: al sumar numeros de tamano muy distinto, hayque tener precaucion de que ‘el pez grande no se coma al chico’, como sucede en la evaluacion100 ⊕ 0.9 = 100. Parece conveniente ordenar los sumandos de menor a mayor para homogeneizartamanos en la medida de lo posible, permitiendo ası que la adicion de los sumandos pequenoslleve a un valor que no desaparezca cuando lleguen los sumandos ‘grandes’. (Esta es una pequenamuestra de las dificultades que tienen que superar los programadores incluso en situaciones que noparecen a priori tan complicadas). Ademas, los dos primeros sumandos esta involucrados en n− 1operaciones y el ultimo en una sola, con lo que el error absoluto final es menor.

Por otra parte, cuando la rapidez de calculo es importante, la opcion del emparejamiento pareceventajosa. Ademas, al disminuir el numero de operaciones efecuadas, cabe suponer que disminuira elcrecimiento de los errores (con datos de magnitudes similares, al menos). Notese que en una sumade n = 2k sumandos, cada sumando estarıa ahora involucrado en k = log2(n) operaciones, lo quelleva a un error absoluto del orden de n log2(n) veces el maximo de los errores de los sumandos,ver [1] p. 15.

Sobre las dificultades de la implementacion de algoritmos eficaces en la adicion de muchossumandos, ver mas detalles en [3], Floating point summation, y [4], ası como en el artıculo de J. P.Muller ya citado [MC1]. En [Brz], pp. 10–11, hay un ejemplo de ‘correccion de la aritmetica’ paraefectuar sumas.

Costo operativo y eficiencia: Evaluacion de polinomios

〈〈 Un mismo problema suele poder resolverse por diversos metodos numericos. ¿Como decidirsepor uno? El tamano de los errores es ciertamente un criterio util: podrıamos elegir el metodoque diese menores errores. No obstante hay un criterio mejor: nos quedaremos con el metodoque, dando errores dentro de unos lımites predeterminados, necesite el menor trabajo. Estapreocupacion por estudiar la eficiencia de los diversos metodos es un rasgo distintivo delanalisis numerico. La eficiencia depende tanto del tamano de los errores como del costo ope-rativo del metodo. Aquellas tareas para las que, en un momento historico dado, no se disponede un metodo aceptablemente eficiente no se pueden llevar a cabo.

Ejemplo. Metodo de Horner (1744–1834) para evaluar polinomios. Supongamos que desea-mos hallar el valor de un polinomio cuartico a0 +a1x+a2x

2 +a3x3 +a4x

4 (los ai son numerosreales conocidos) para un valor dado de x0 de la variable x. El metodo mas ingenuo hallasucesivamente los productos x2

0 = x0 ∗x0, x30 = x2

0 ∗x0, x40 = x3

0 ∗x0 con un coste operativo detres multiplicaciones, luego los productos ai ∗xi0 (otras cuatro multiplicaciones), y finalmentehace las cuatro sumas/restas. (Que sean efectivamente sumas o restas depende del signo con-creto que vayan teniendo los sumandos; para sumar 48 y -27 hay que restar.) En total cuatrosumas/restas y siete multiplicaciones. Sin embargo haciendo las operaciones en orden

a0 + x0 ∗[a1 + x0 ∗

[a2 + x0 ∗ [a3 + x0 ∗ a4]

]](1.6)


solo son precisas cuatro sumas/restas y cuatro multiplicaciones. Para un polinomio de gradoN el metodo ingenuo requiere N sumas/restas y 2N − 1 multiplicaciones, el metodo (1.6)llamado de Horner o de multiplicacion encajada usa N sumas/restas y N multiplicaciones.Como ninguno de los dos metodos genera errores —excepto los derivados de usar mantisa delongitud finita— el de Horner, que tiene menor costo operativo es mas eficiente. Si solo se vaa evaluar una vez un polinomio y se usa un ordenador no hay diferencia entre usar uno u otrometodo. Si, como a veces ocurre, dentro de un programa grande hay que evaluar millones deveces, usar uno u otro metodo puede significar tener que esperar el resultado dos horas o solouna. Si calculamos con papel y lapiz en un examen usar un mal metodo puede implicar notener el resultado a tiempo. 〉〉

([S-S], pp. 13 y 14.)

6.4.2. Refinamientos en la representacion y en la precision

Dos recursos que permiten mejorar la exactitud de los calculos son el uso de numeros desnorma-lizados y de precision multiple.

Numeros desnormalizados

Para paliar los problemas que ocasiona el redondeo de numeros ‘cercanos al cero’, se amplıaa veces el sistema F de numeros en punto flotante incluyendo los numeros desnormalizados(tambien llamados subnormales en ingles). Tanto los estandares IEEE 754 y 854 como LIA-1 y unascuantas implementaciones ‘no-IEEE’ incluyen numeros desnormalizados. Siguiendo con la notacionhabitual, un numero en punto flotante desnormalizado es un numero real de la forma

y = ±m× βemin−p

donde m es un entero del intervalo [1, βp−1−1]. La fraccion correspondiente g queda en el intervalo[β−p, 1/β−β−p]; su dıgito mas significativo es 0, y su exponente emin. Los numeros desnormalizadosrellenan parcialmente los “huecos de subdesbordamiento” que se producen entre ±βemin−1 y 0.Tomados juntos, componen el conjunto que en LIA-1 se denota FD. La admision o no de numerosdesnormalizados se controla mediante el parametro booleano denorm, que toma el valor true o falsesegun se permitan numeros desnormalizados o no. En el primer caso, se redefine F = {0}∪FN ∪FD;en el segundo, se mantiene la definicion previa.

El mınimo numero positivo en punto flotante desnormalizado es βemin−p = fminN · εM . Losvalores de FD estan igualmente espaciados, con el mismo espacio que el de los numeros de F entreβemin−1 y βemin , que es βemin−p = fminN · εM . Volviendo al ejemplo con β = 2, p = 3, emin = −1,emax = 3, la representacion grafica de F con los numeros desnormalizados incluidos (2−4 = 0.0625,2× 2−4 = 0.125, 3× 2−4 = 0.1875) serıa

0.0625↓

0 0.25 0.5 1.0 2.0 3.0 4.0 5.0 6.0 7.0

Los valores de FD tienen un maximo absoluto de error de representacion de βemin−p. Sin embargo,como los numeros desnormalizados tienen menos de p dıgitos de precision, el error relativo derepresentacion puede variar ampliamente. Este error relativo va desde εM = β1−p en el extremosuperior de FD hasta 1 en el extremo inferior de FD. Cerca de 0, el error relativo crece sin tope.

Siempre que una adicion o sustraccion de numeros de F produce un resultado en FD, dichoresultado es exacto, el error relativo es cero. Un ejemplo trivial: en el modelo anterior,

1 0.875 = 0.125 con numeros desnormalizados incluidos, 1 0.875 = 0 en caso contrario.


〈〈 Incluso para una “sustraccion efectiva” no se pierde exactitud, porque la disminucion delnumero de dıgitos significativos es exactamente la misma que el numero de dıgitos canceladosen la sustraccion. Para la multiplicacion, division, escalado, y algunas conversiones, los dıgitossignificativos (y por tanto la exactitud) pueden perderse si el resultado esta en FD. 〉〉 ([LIA-1],p. 33.)

La ventaja fundamental que proporcionan los numeros desnormalizados es la siguiente:

Incluyendo en F los numeros desnormalizados, si x, y ∈ F , para que x y = 0 esnecesario y suficiente que x = y.

Obviamente, esto no es cierto cuando F no contiene a FD.

Mayor precision

Mientras que habitualmente es posible disponer de dıgitos extra en una computacion (aumen-tando la precision p, pasando por ejemplo de precision simple a doble precision), esto siempre escostoso en tiempo y en espacio. Ademas, aunque intuitivamente al aumentar la precision parecelogico esperar que la exactitud aumente, esto no siempre es ası. En muchos casos el error estimadode un algoritmo es efectivamente proporcional a la precision, como hemos visto en casi todas lasoperaciones aritmeticas; pero como las cotas del error no siempre se alcanzan, no hay garantıa deque un resultado concreto calculado con precision p sea menos exacto que el calculado con preci-sion p+ q mayor (v. [Hig], pp. 19–20). No obstante, es una tecnica frecuente en la estimacion de laexactitud recalcular (al menos en la ‘etapa de ensayo’ de un algoritmo) aumentando la precision yobservar cuantos dıgitos de la respuesta ası obtenida coinciden con la original.

Dıgitos de seguridad (Guard digits)

Cuando se entra en los pormenores de la implementacion efectiva de las operaciones en puntoflotante, las complicaciones aumentan tremendamente. Por ejemplo, contra lo que cabrıa suponer,la suma es mucho mas complicada que la multiplicacion y la division. Para empezar, no se conoce apriori el exponente del resultado, y hay que proceder a redondeos y reescalados para determinarlos;basicamente, el ordenador procede como nosotros, reescalando las mantisas para poder ‘alinearlas’ysumarlas a continuacion; el resultado puede tener una mantisa que comience por 0 (perdiendola normalizacion) y/o mas de p cifras. Se ve la necesidad de anadir cifras extras en las etapasintermedias para disminuir errores. Ası se describe el proceso en [Brz], pp. 33 y ss.:

〈〈 Cada operacion aritmetica efectuada con el ordenador esta igualmente manchada por un errorde afectacion. Es decir, que se tiene:

|(a � b)− fl(a � b)| ≤ 5|(a � b)|10−p,

donde � designa una de las cuatro operaciones aritmeticas (suma, resta, multiplicacion, divi-sion). Este resultado da la diferencia maxima que puede existir entre el resultado exacto deuna operacion aritmetica y el resultado encontrado por el ordenador. Ası, para un ordenadorque trabaje con mantisas de ocho dıgitos, el error relativo es inferior a 5 · 10−8. Se puedepensar que este es un error muy debil, despreciable incluso, y sin embargo vamos a ver quesus consecuencias puede ser catastroficas (no siempre, afortunadamente para nosotros). Paracomprender bien lo que pasa, hay que saber que las operaciones aritmeticas se efectuan enmemorias especiales, el acumulador , cuyas mantisas comportan al menos p + 1 dıgitos.Se completan los operandos con ceros a la derecha, se efectua la operacion en el acumula-dor, y despues se reenvıa el resultado a la memoria redondeandolo. Este error de redondeoes preponderante sobre el que se hace en el acumulador, lo que explica que cada operacion


este manchada solamente con un error de afectacion. Demos un ejemplo para ilustrar nuestroproposito: calculemos a = b× c

memoria acumuladorb 0.842345 → 0.8423450c 0.516287 · 10−2 → 0.5162870 · 10−2

a 0.434892 · 10−2 ← 0.4348917 · 10−2

Para una suma, tras la transferencia de los operandos al acumulador, el ordenador comienzapor modificar el exponente del operando menor (en valor absoluto) para que tenga el mismovalor que el de el mas grande; de hecho, el ordenador alinea como nosotros las cifras de laspotencias identicas de 10, unas sobre otras:

memoria acumuladorb 0.842345 → 0.8423450c 0.516287 · 10−2 → 0.0051629a 0.847508 ← 0.8475079

Y lo mismo, evidentemente, para una sustraccion. 〉〉

Extranamente, hay fabricantes (como cray) que construyen algunas de sus maquinas sin au-mentar los bits disponibles para los datos intermedios, limitandose a recortar estos al tamanocorrespondiente a la precision, lo que puede suponer un error relativo anadido hasta de β − 1, esdecir, del 100 % cuando β = 2 y del 900 % cuando β = 10. En efecto:

[Gold] Con sumandos en F :

Proposicion 6.4.1. Usando un formato de punto flotante con parametros β y p, y computandodiferencias usando p dıgitos, el error relativo del resultado puede llegar a ser β − 1.

Demostracion. Para x =1β

= 0.10 · · · 0× 100, α = β − 1, y =α

β2+ · · ·+ α

βp+1= 0.αα · · ·α× 10−1

resulta x− y = β−p−1, x y = β−p, Er = β − 1.

En cambio:

Proposicion 6.4.2. Si x e y son numeros en punto flotante en un formato con parametros β yp, y si la sustraccion se hace con p+ 1 dıgitos (i.e., con un dıgito ‘de seguridad’) entonces el errorrelativo de redondeo del resultado es menor que 2ε, donde ε es el epsilon de la maquina.

(La adicion esta incluida en el teorema anterior ya que x e y pueden ser positivos o negativos.)

Para maquinas que trabajan sin dıgitos extras hay muchos algoritmos que dejan de funcionarcorrectamente, como lo hacen en caso contrario. Existen ademas resultados como el siguiente,validos cuando se opera con digitos ‘de seguridad’ (v. [Hig], p. 50):

Teorema 6.4.3 (Sterbenz). Sean x e y numeros en punto flotante con y/2 ≤ x ≤ 2y. Si lasustraccion se realiza con un dıgito de seguridad, entonces x− y es computado exactamente (supo-niendo que |x− y| ≥ fminN .)

6.4.3. Buscar algoritmos estables

〈〈 Se puede oir a veces el siguiente argumento ingenuo:

¿Por que perder el tiempo con todos esos pequenos errores de punto flotante? InclusoIEEE en precision simple nos da 7 dıgitos significativos por lo menos, y seguro queesto es suficiente para la mayorıa de las aplicaciones, y ademas esta la precisiondoble, y seguramente esta tiene que bastar.


Un contraargumento es que los errores pueden propagarse y crecer rapidamente, y comoson inevitables “pequenos” errores de redondeo, existe siempre el peligro de que nuestrascomputaciones produzcan basura.

Los problemas que tienen una tendencia inherente a la “amplificacion de errores” se llamanmal condicionados; requieren usar paquetes de aritmetica multiprecision y un estrecho controlde errores.

Un ejemplo clasico de problema mal condicionado es cierto polinomio de grado 20; tras multi-plicar uno de sus coeficientes (el que multiplica a la potencia 19) por un factor 1.0000000005,la localizacion de la mayor parte de las raıces cambia completamente.

En el anterior ejemplo, simplemente entrar los datos (los coeficientes del polinomio) en elordenador puede ser suficiente para estropear todo el calculo, por cuanto la conversion dela representacion decimal externa a la interna, binaria, puede introducir errores demasiadograndes.

Un problema bien condicionado puede tener un algoritmo que amplifique los errores: talalgoritmo se dice que es inestable. En terminos sencillos, un algoritmo inestable transformaun “pequeno” cambio en las cantidades de entrada en un cambio “grande” en las cantidadesde salida. 〉〉

([4], § 4-7.)

La estabilidad de un algoritmo es una de sus propiedades mas importantes, pero no es sencillade definir con precision. En [1], p. 13, se describe ası:

〈〈 Supongamos que g(x) es la solucion exacta de un problema con inputs x, y g∗(x) es el valorcalculado por un algoritmo particular. La solucion calculada g∗(x) puede ser pensada a menudocomo la solucion exacta de un problema perturbado con inputs x, esto es, g∗(x) = g(x). Si siemprehay un x cercano a x tal que g∗(x) = g(x), entonces el algoritmo se dice estable . Si no, el algoritmoes inestable . 〉〉

Notese que la estabilidad es una propiedad relativa al algoritmo empleado para resolver un pro-blema, mientras que el condicionamiento se refiere al propio problema: un problema de computacionse dice mal condicionado si pequenas perturbaciones en el problema producen perturbacionesgrandes en la solucion exacta. Ademas del ejemplo anteriormente senalado sobre calculo de raıcesde un polinomio, otro problema tıpico mal condicionado es el de la resolucion de un sistema linealcuando la matriz de los coeficientes es casi singular: pequenos cambios en dichos coeficientes o en losterminos independientes pueden llevar a soluciones exactas muy diferentes; como al almacenar losdatos en la maquina se producen errores de redondeo, es sustancialmente imposible dar solucionesprecisas a los problemas mal condicionados con cualquier algoritmo que se utilice. Por contra, aveces un algoritmo inestable puede modificarse convenientemente para lograr uno estable.

Estos son los consejos a los programadores de un experto ([Hig], pp. 30 y 31):

〈〈 Diseno de algoritmos estables

No hay una receta simple para disenar algoritmos numericamente estables. Mientras que estoayuda a mantener a los analistas numericos en el negocio (¡incluso probando que los algoritmos delos demas son inestables!) no es una buena noticia para los cientıficos computacionales en general.El mejor consejo es ser consciente de la necesidad de la estabillidad numerica cuando se disena unalgoritmo y no concentrarse exclusivamente en otros aspectos, tales como el costo computacionaly la paralelizabilidad.

Se pueden dar unas pocas pautas.

1. Intentar evitar restar cantidades contaminadas de error (aunque tales restas pueden ser ine-vitables).


2. Minimizar el tamano de las cantidades intermedias en relacion a la solucion final. La razones que si las cantidades intermedias son muy grandes, entonces la respuesta final puede serel resultado de cancelacion sustractiva danina. Mirandolo de otra manera, los numeros in-termedios grandes arrollan los datos iniciales, con el resultado de perdida de informacion.El ejemplo clasico de algoritmo en el que esta consideracion es importante es la eliminaciongaussiana, pero un ejemplo aun mas simple es la sumacion recursiva.

3. Buscar diferentes formulaciones de una computacion que sean matematicamente pero nonumericamente equivalentes. Por ejemplo, el metodo clasico de Gram-Schmidt es inestable,pero una modificacion trivial produce el metodo de Gram-Schmidt estable modificado (MGS).Hay dos maneras de usar el metodo MGS para resolver un problema de mınimos cuadrados,el mas obvio de los cuales es inestable.

4. Es ventajoso expresar la actualizacion de formulas como

valor nuevo = valor viejo + pequena correccion

si la pequena correccion puede calcularse con muchas cifras significativas correctas. Los meto-dos numericos a menudo estan expresados de manera natural en esta forma; los ejemplosincluyen metodos para resolver ecuaciones diferenciales ordinarias, donde la correccion esproporcional al tamano de paso, y el metodo de Newton para resolver un sistema no lineal.Un ejemplo clasico del uso de esta estrategia de actualizacion es el refinamiento iterativopara mejorar la solucion calculada de un sistema lineal Ax = b, en el que calculando resi-duos r = b− Ay en precision extendida y resolviendo ecuaciones actualizadas que tienen losresiduos como terminos independientes es posible calcular una solucion con un alto grado deexactitud. Para otro ejemplo (en el que la correccion no es necesariamente pequena), ver elProblema . . .

5. Usar solo transformaciones bien condicionadas del problema. En calculos matriciales, estoviene a ser multiplicar por matrices ortogonales donde sea posible, en vez de no ortogonales,y posiblemente, matrices mal condicionadas. Ver §6.2 para una explicacion simple de esteconsejo en terminos de normas.

6. Tomar precauciones para evitar desbordamientos innecesarios.

Concerniente al segundo punto, una buena recomendacion es mirar los numeros generadosdurante una computacion. Esto era practica comun en los primeros tiempos del calculo electronico.¡En algunas maquinas era inevitable, porque los contenidos almacenados se mostraban como luces omonitores! Wilkinson gano en penetracion sobre la estabilidad numerica inspeccionando el progresode un algoritmo, y alterando a veces su curso (para un proceso iterativo con parametros) . . . 〉〉

〈〈 Concepciones equivocadas

Algunos mitos y concepciones equivocadas comunes han sido senalados en este capıtulo (ningunode ellos por vez primera—ver notas y referencias). Los destacamos en la siguiente lista.

1. La cancelacion en la sustraccion de dos numeros casi iguales es siempre una mala cosa.

2. Los errores de redondeo pueden cargarse una computacion solo si se acumulan un vastonumero de ellos.

3. Una computacion corta libre de cancelacion y desbordamiento tiene que ser exacta.

4. Aumentar la precision con la que se efectua una computacion aumenta la exactitud de larespuesta.


5. La respuesta final calculada a partir de un algoritmo no puede ser mas exacta que ningunade las cantidades intermedias, esto es, los errores no pueden cancelarse.

6. Los errores de redondeo solo pueden estorbar, no ayudar, al exito de un calculo. 〉〉

De marcado caracter practico son tambien las recomendaciones y consejos que se encuentran alo largo del manual [4], dirigidas especıficamente a los usuarios de FORTRAN.

6.4.4. Compensaciones estadısticas

Hemos buscado hasta aquı las situaciones mas desfavorables, para poner de manifiesto los pro-blemas que puede originar la computacion con ordenadores. 〈〈 Afortunadamente, en numerosos casospracticos, los errores se compensan de una operacion a otra. 〉〉 ([Brz]) Suele hacerse la hipotesisde que los errores relativos en cada operacion aritmetica en punto flotante se distribuyen ‘uni-formemente’ desde el punto de vista estadıstico en el intervalo (−εM , εM ), y que los errores sonindependientes, lo que lleva a una distribucion normal que sugiere un error tıpico en N operacionesde tamano N1/2εM —la desviacion estandar—, muy inferior al tamano N2εM de las estimaciones‘mas pesimistas’. Sin embargo, los errores no tienden a ser independientes, y la estimacion N1/2εMes, en general, demasiado ‘optimista’.

En todo caso, los siguientes parrafos parecen dejar las cosas en el punto justo:

[Hig], p. 16: 〈〈 Desde que se desarrollaron las primeras computadoras electronicas en los 1940s, seha hecho a menudo comentarios del tipo siguiente: “La enorme velocidad de las maquinas actualessignifica que en un problema tıpico se efectuan muchos millones de operaciones en punto flotante.Esto significa a su vez que los errores de redondeo pueden acumularse potencialmente de maneradesatrosa”. Este sentimiento es cierto, pero enganoso. Las mas de las veces, la inestabilidad noesta causada por la acumulacion de millones de errores de redondeo, sino por el crecimiento insidiosode tan solo unos pocos errores de redondeo. 〉〉

[Hig], pp. 21–22: 〈〈 No es inusual que los errores de redondeo se cancelen en algoritmos estables,con el resultado de que la respuesta final computada es mucho mas exacta que las cantidadesintermedias. Este fenomeno no es apreciado universalmente, quizas porque tendemos a mirar losnumeros intermedios en un algoritmo solo cuando algo va mal, no cuando la respuesta computadaes satisfactoria. 〉〉

[Hig], p. 29: 〈〈 Los errores de redondeo, y su efecto acumulado en una computacion, no son alea-torios. Este hecho subyace en el exito de muchas computaciones, [· · · ] Aquı daremos simplementeun ejemplo numerico revelador (debido a W. Kahan).

Defınase la funcion racional

r(x) =622− x(751− x(324− x(59− 4x)))112− x(151− x(72− x(14− x)))

,

que esta expresada en una forma que corresponde a la evaluacion de los polinomios cuarticosdel numerador y el denominador mediante la regla de Horner. Hemos calculado r(x) mediante laregla de Horner en aritmetica de doble precision para 361 numeros en punto flotante consecutivoscomenzando con a = 1.606, o sea x = a+ (k − 1)2−52, k = 1 : 361; la funcion r(x) es virtualmenteconstante en este intervalo. La figura 1.6 dibuja los valores computados de la funcion junto conuna aproximacion mucho mas exacta a r(x) (calculada a partir de una representacion en fraccioncontinua). El patron sorprendente formado por los valores calculados mediante la regla de Hornermuestra claramente que los errores de redondeo en este ejemplo no son aleatorios. 〉〉

(Ver tambien [Hig], p. 52–53).

Bibliografıa

[Brz] Brezinski, C.: Introduction a la pratique du calcul numerique. Dunod/Bordas, Paris, 1988.

[Hig] Higham, N.: Accuracy and Stability of Numerical Algorithms. SIAM, Philadelphia, 1996.

[MC1] Mundo Cientıfico: El universo de los numeros: Matematicas para interpretar el mundo.Extra num. 1, s.f..

[S-S] Sanz-Serna, J. M.: Diez lecciones de Calculo Numerico. Universidad de Valladolid, 1998.


[Gold] Goldberg, D.: What Every Computer Scientist Should Know About Floating-Point Arit-hmetic. Computing Surveys, 1991.

http://docs.sun.com/db/doc/800-7895La referencia universal.

[LIA-1] ISO/IEC: Information technology – language independent arithmetic. Part 1: Integer andfloating point arithmetic, 1994. ISO/IEC 10967-1:1994(E).

ftp://crl.dec.com/pub/misc/lia-1-is.ps.Z.– — o O o — –

[1] Gray, R.: Advanced Statistical Computing. Course Notes, 2002.

http://biowww.dfci.harvard.edu/~gray/248-02/report.pdf

[2] IEEE-754 Floating-Point Conversion: From Decimal Floating-Point To 32-bit and 64-bitHexadecimal Representations Along with Their Binary Equivalents (1998)

http://babbage.cs.qc.edu/courses/cs341/IEEE-754.html

[3] Moore, D.: Introduction to Computacional Science. CAAM 420, Lecture Notes, 2000.

http://www.owlnet.rice.edu/~caam420/lectures

[4] UNFP: User Notes on Fortran Programming. (An open cooperative practical guide),1998.

http://www.ibiblio.org/pub/languages/fortran/ch4-6.html

177

http://docs.sun.com/db/doc/800-7895

ftp://crl.dec.com/pub/misc/lia-1-is.ps.Z.

http://biowww.dfci.harvard.edu/~gray/248-02/report.pdf

http://babbage.cs.qc.edu/courses/cs341/IEEE-754.html

http://www.owlnet.rice.edu/~caam420/lectures

http://www.ibiblio.org/pub/languages/fortran/ch4-6.html

(eBook) Teoria de Numeros y Conjuntos

Documents

Transcript of (eBook) Teoria de Numeros y Conjuntos