matematica.ues.edu.svmatematica.ues.edu.sv/gachr/tn/tn2019_v1.pdf · Introducción Presentación...

67
TEORÍA DE NÚMEROS 2019 Gabriel Chicas Reyes Escuela de Matemática Facultad de Ciencias Naturales y Matemática Universidad de El Salvador San Salvador, 3 de noviembre de 2019

Transcript of matematica.ues.edu.svmatematica.ues.edu.sv/gachr/tn/tn2019_v1.pdf · Introducción Presentación...

TEORÍA DE NÚMEROS 2019

Gabriel Chicas ReyesEscuela de Matemática

Facultad de Ciencias Naturales y MatemáticaUniversidad de El Salvador

San Salvador, 3 de noviembre de 2019

Índice general

Índice general II

Introducción III

I Preliminares 1I.1. Inducción matemática . . . . . . . . . . . . . . . . . . . . . . . . . . . 1I.2. Identidades algebraicas . . . . . . . . . . . . . . . . . . . . . . . . . . . 3I.3. Números de Fibonacci . . . . . . . . . . . . . . . . . . . . . . . . . . . 7I.4. Polinomios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13I.5. Números complejos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19I.6. Raíces de la unidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22

II Divisibilidad 26II.1. Definiciones y propiedades básicas . . . . . . . . . . . . . . . . . . . . 26II.2. Números primos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30II.3. Máximo común divisor y mínimo común múltiplo . . . . . . . . . . 31

III Congruencias 38III.1. Definiciones básicas . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38III.2. Teoremas de Fermat, Euler y Wilson . . . . . . . . . . . . . . . . . . . 42III.3. Resolución de congruencias . . . . . . . . . . . . . . . . . . . . . . . . 48

Bibliografía 64

II

Introducción

Presentación

Las presentes notas acompañan al curso “Teoría de números” impartido en laEscuela de Matemática durante el ciclo impar 2019. Versión en progreso.

Agradecimientos a: Alexey Beshenov por su ayuda en el diseño de diagramas,Marvin Ferman Bell por la revisión y mejora del texto.

Contenidos

Repaso de álgebra.

Divisibilidad.

Congruencias.

Raíces primitivas.

Reciprocidad cuadrática.

Funciones aritméticas.

Ecuaciones diofánticas.

Acerca de

Gabriel Alexander Chicas Reyes

Escuela de Matemática, Facultad de Ciencias Naturales y Matemática, Univer-sidad de El Salvador, Final Av. “Mártires Estudiantes del 30 de julio”, Ciudad Univer-sitaria, San Salvador, El Salvador.

Correo electrónico: [email protected]

Página institucional: http://www.matematica.ues.edu.sv/gachr/

III

Capítulo I

Preliminares

Dedicaremos esta unidad a un breve repaso de álgebra básica. Comenzamosprimero por inducción matemática, que es un método de demostración amplia-mente utilizado. A modo de aplicación, establecemos algunas identidades alge-braicas de uso común, y asimismo propiedades de las relaciones de recurrencia.La segunda parte del preámbulo consiste en un repaso de la teoría de polinomiosen una variable real, y números complejos.

Referencias de interés: [1], cap. 3 y 7.

I.1. Inducción matemática

El principio de inducción matemática

Recordemos que los objetos de estudio de la lógica matemática elemental sonlas proposiciones, es decir afirmaciones que pueden ser demostradas o refutadas.La inducción matemática es un método que permite establecer la veracidad de unacolección de proposiciones enumeradas por los números naturales.

Tal método está basado en la siguiente propiedad de los números naturales, aprimera vista bastante obvia:

Teorema I.1 (Principio del buen orden) Todo subconjunto no vacío de los númerosnaturales posee un elemento mínimo.

Pronto tendremos la ocasión de hacer uso explícito de esta propiedad; de mo-mento nos contentaremos con indicar que existe otra versión de la misma.

Teorema I.2 (Principio de inducción) Sea S un conjunto de enteros positivos talesque

1 ∈ S.

Si n ∈ S, entonces n +1 ∈ S.

Entonces todos los enteros positivos pertenecen a S.

1

CAPÍTULO I. PRELIMINARES 2

Nota I.3 Hablando en rigor, ambos principios son axiomas satisfechos por los núme-ros naturales, que de hecho son equivalentes entre sí. Por ejemplo, en los axiomas dePeano el principio de inducción se toma como axioma, y a partir de él se demuestrael principio del buen orden. ¡Inténtelo!

Teorema I.4 (Inducción débil) Suponga que

P (1),P (2), . . . ,P (n), . . .

es una colección de proposiciones tales que:

P (1) es verdadera.

Si P (n) es verdadera entonces P (n +1) es verdadera.

Entonces P (n) es verdadera para todo n ≥ 1.

Demostración. Considere el conjunto

S = {n ≥ 1 : P (n) es verdadera}

Por hipótesis 1 ∈ S, y además si n ∈ S entonces n +1 ∈ S. El principio de inducciónnos permite concluir que S contiene a todos los enteros positivos, es decir P (n) esverdadera para todo n. ■

Recordemos que la terminología habitual en una demostración por inducciónes la siguiente: la veracidad de P (1) es la base inductiva, la suposición de que P (n)es verdadera es la hipótesis inductiva y la implicación de la veracidad de P (n+1) apartir de la de P (n) es el paso o salto inductivo.

Variantes del principio de inducción matemática

El principio de inducción tal cual lo hemos introducido es en extremo impor-tante. Sin embargo, en la práctica es útil saber que este enunciado básico admitediversas variantes.

La primera es muy sencilla, y nos dice que podemos tomar el caso base a con-veniencia (no necesariamente comenzando desde 1).

Teorema I.5 (Inducción débil, caso base arbitrario) Suponga que

P (1),P (2), . . . ,P (n), . . .

es una colección de proposiciones tales que:

P (k) es verdadera.

Si P (n) es verdadera entonces P (n +1) es verdadera.

Entonces P (n) es verdadera para todo n ≥ k.

CAPÍTULO I. PRELIMINARES 3

Otra variante es el llamado principio de inducción fuerte, llamado así debidoa que asume como hipótesis todos los casos previos:

Teorema I.6 (Inducción fuerte) Suponga que

P (1),P (2), . . . ,P (n), . . .

es una colección de proposiciones tales que:

P (1) es verdadera.

P (i ) es verdadera para todo i < n.

Entonces P (n) es verdadera para todo n ≥ 1.

Existe otra variante muy común de la inducción fuerte.

Teorema I.7 (Inducción fuerte, segunda versión) Suponga que

P (1),P (2), . . . ,P (n), . . .

es una colección de proposiciones tales que:

P (1), . . . ,P (r ) es verdadera.

Si P (n), . . . ,P (n + r −1) son verdaderas, entonces P (n + r ) es verdadera.

Entonces P (n) es verdadera para todo n ≥ 1.

Por supuesto, ambas versiones son válidas para un caso base arbitrario; deja-mos los enunciados correspondientes al lector.

I.2. Identidades algebraicas

Como aplicaciones concretas del método inductivo, en este apartado deseamosestablecer rigurosamente diversas identidades de tipo general que son muy comu-nes y útiles en toda manipulación algebraica.

Una de las sumas más simples posibles la encontramos desde la escuela.

Proposición I.8 (Suma geométrica) Para todo número complejo x 6= 1 y para todoentero positivo n se cumple

1+x +·· ·+xn = xn+1 −1

x −1.

Demostración. Por inducción débil sobre n. Para n = 1 se debe comprobar que

1+x = x2 −1

x −1

lo cual es cierto por diferencia de cuadrados.

CAPÍTULO I. PRELIMINARES 4

Ahora supongamos que la fórmula se tiene para algún n. Entonces

1+x +·· ·+xn+1 = (1+x +·· ·+xn)+xn+1

= xn −1

x −1+xn+1

= xn −1+xn+1(x −1)

x −1

= xn+2 −1

x −1

por lo cual la fórmula para n +1 se cumple, y con esto concluye la prueba. ■Corolario I.9 (Suma de una progresión geométrica) Para cualesquiera números ay r 6= 1, y para todo entero positivo n se cumple que

a +ar +·· ·+ar n−1 = a(r n −1)

r −1.

Ahora pasamos a revisar una fórmula equivalente a la anterior, presentada aho-ra como una factorización muy útil.

Proposición I.10 (Suma y diferencia de potencias) Para cualesquiera números com-plejos a, b y para todo entero n ≥ 2 se cumple que

an −bn = (a −b)(an−1 +an−2b +·· ·+abn−2 +bn−1).

Más aún, si n es impar se cumple además que

an +bn = (a +b)(an−1 −an−2b +·· ·−abn−2 +bn−1).

Demostración. Por inducción débil sobre n.Para expresar an+1 −bn+1 en términos de an −bn , podemos observar que

an+1 −bn+1 = an(a −b)+b(an −bn)

Aplicando la hipótesis inductiva y factorizando el resultado:

an+1 −bn+1 = an(a −b)+b(an −bn)

= an(a −b)+b(a −b)(an−1 +an−2b +·· ·+bn−1)

= (a −b)(an +an−1b +an−2b +·· ·+bn)

En cuanto a la factorización de an +bn basta sustituir b por −b en la identidad yademostrada, o bien realizar directamente una inducción sobre n impar. ■Nota I.11 La Proposición I.10 puede demostrarse sin inducción. A manera de ejerci-cio, compruebe que puede deducirse a partir de la Proposición I.8.

Como un último ejemplo de identidades algebraicas, podemos mencionar lasfórmulas clásicas para sumas de potencias de los enteros positivos. Aquí mencio-naremos únicamente los primeros tres casos.

CAPÍTULO I. PRELIMINARES 5

Proposición I.12 Para todo entero positivo n son válidas las siguientes identidades:

1+2+·· ·+n = n(n +1)

2

12 +22 +·· ·+n2 = n(n +1)(2n +1)

6

13 +23 +·· ·+n3 =(

n(n +1)

2

)2

Demostración. Veamos la primera identidad, conocida habitualmente como la su-ma de Gauss. Para n = 1 se afirma que 1 = 1(1+1)/2, lo cual es cierto. Supongamosque la fórmula es válida para cierto n. Sumando n +1 a ambos lados resulta que

1+2+·· ·+n + (n +1) = n(n +1)

2+ (n +1)

n(n +1)+2(n +1)

2(n +1)(n +2)

2.

Veamos ahora la segunda. Para n = 1 se afirma que 12 = 1(1+1)(2 ·1+1)/6, locual es cierto. Supongamos que la fórmula es válida para cierto n. Sumando (n+1)2

a ambos lados resulta que

12 +22 +·· ·+n2 + (n +1)2 = n(n +1)(2n +1)

6+ (n +1)2

= n(n +1)(2n +1)+6(n +1)2

6

= (n +1)(n(2n +1)+6(n +1))

6

= (n +1)(n +2)(2n +3)

6

Finalizamos con la suma de cubos. Para n = 1 se afirma que 13 = (1(1+1)/2)2, locual es cierto. Supongamos que la fórmula es válida para cierto n. Sumando (n+1)3

a ambos lados resulta que

13 +23 +·· ·+n3 + (n +1)3 =(

n(n +1)

2

)2

+ (n +1)3

= n2(n +1)2 +4(n +1)3

4

= (n +1)2(n2 +4(n +1))

4

= (n +1)2(n +2)2

4

=(

(n +1)(n +2)

4

)2

. ■

CAPÍTULO I. PRELIMINARES 6

Corolario I.13 (Suma de una progresión aritmética) Para cualesquiera números a,d y para todo entero positivo n se cumple que

a + (a +d)+·· ·+ (a + (n −1)d)) = na + n(n −1)

2d .

Nota I.14 Del ejemplo anterior es aparente que la fórmula para 1k+2k+·· ·+nk es unpolinomio en n. Dicha fórmula fue abordada en general por Bernoulli* e indepen-diente por Kowa†; involucra los llamados números de Bernoulli, los cuales formanuna de las sucesiones más bellas e interesantes de la teoría de números.

Finalizamos esta sección con una importante identidad que involucra a otrasucesión especial: los coeficientes binomiales. Algebraicamente, los coeficientesbinomiales se caracterizan por obedecer una recurrencia en dos parámetros.

Definición I.15 Los coeficientes binomiales o números combinatorios son la única

sucesión de enteros positivos

(n

k

), definida para n,k ≥ 0, que satisfacen las siguientes

condiciones:

(I)

(n

0

)=

(n

n

)= 1 para todo n ≥ 0.

(II) (Identidad de Pascal) Para cualesquiera n > k > 0

(n

k

)=

(n −1

k

)+

(n −1

k −1

).

Para manipulaciones algebraicas, es conveniente recordar la convención

(n

k

)=

0 para los casos k < 0, o bien k > n.

Teorema I.16 (Binomio de Newton) Para todo x ∈C y n ≥ 0

(1+x)n =n∑

k=0

(n

k

)xk .

Demostración. Procedemos por inducción sobre n. Para n = 0 el resultado es válidopuesto que

(00

)= 1. Supongamos el resultado cierto para algún n. Entonces

(1+x)n+1 = (1+x)(1+x)n = (1+x)n∑

k=0

(n

k

)xk .

*Jakob Bernoulli (1605-1755), matemático suizo y miembro de la ilustre familia Bernoulli.†Seki Kowa [関孝和 ] (1642-1708), matemático japonés cuya influencia le ganó el sobrenombre

“Newton del Japón”.

CAPÍTULO I. PRELIMINARES 7

Distribuyendo el producto de la derecha vemos que

(1+x)n∑

k=0

(n

k

)xk =

n∑k=0

(n

k

)xk +

n∑k=0

(n

k

)xk+1 =

(n

0

)+

n∑k=1

[(n

k

)+

(n

k −1

)]xk +

(n

n

)xn+1.

Pero

(n

0

)=

(n

n

)= 1, y por la identidad de Pascal

(n

k

)+

(n

k −1

)=

(n +1

k

). Se sigue que

(1+x)n+1 = 1+n∑

k=1

(n +1

k

)xk +xn+1 =

n+1∑k=0

(n +1

k

)xk . ■

Tenemos también una versión equivalente y asimismo muy común.

Corolario I.17 Para cualesquiera x, y ∈C y todo n ≥ 0

(x + y)n =n∑

k=0

(n

k

)xk yn−k .

Nota I.18 La definición algebraica señalada arriba caracteriza al binomio de New-ton. En otras palabras, si c(n,k) es otra sucesión definida para n,k ≥ 0 que satisfacepara todo n ≥ 0

(1+x)n =k∑

n=0c(n,k)xk

entonces c(n,k) =(

n

k

)para cualesquiera n,k ≥ 0. (Compruébelo.)

I.3. Números de Fibonacci

Relaciones de recurrencia

Recordemos que una sucesión con valores en un conjunto cualquiera S es unafunción a : N→ S. En este contexto, el valor a(n) suele denotarse como an . En lamayoría de casos, para nosotros S =Z,Q, R o C.

Puesto que el dominio de tal función es N, podemos simplemente enumerartodos los valores tomados por a en una lista

a0, a1, a2, a3, . . . ∈ S

lo cual coincide con nuestra idea intuitiva de sucesión.La definición previa es muy general, y no es posible decir mucho sobre una

sucesión arbitraria. Sin embargo, hay familias de sucesiones muy bien estudiadas;en este apartado nos interesan aquellas definidas por relaciones de recurrencialineal.

Definición I.19 Sea {an} una sucesión (en C). Una relación de recurrencia lineal deorden d es una relación de la forma

an + c1an−1 +·· ·+cd an−d = 0

válida para todo n ≥ d, y donde c0, . . . ,cd son constantes.

CAPÍTULO I. PRELIMINARES 8

Una observación importante es que una relación de recurrencia por sí mismano determina de manera única a una sucesión: se requiere conocer sus valoresiniciales. Este es un buen ejercicio de inducción matemática:

Proposición I.20 Para toda elección de constantes b0,b1, . . . ,bd−1 (valores iniciales),existe una única sucesión {an} tal que an = bn para todo i = 0, . . . ,d −1 y

an + c1an−1 +·· ·+cd an−d = 0

para todo n ≥ d.

Demostración. Razonamos por inducción fuerte sobre n. El caso base consiste encomprobar que los primeros d valores de la sucesión están únicamente definidos;esto es cierto ya que por hipótesis an = bn para todo n = 0, . . . ,d −1.

Ahora supongamos que los d valores ak , ak+1, . . . , ak+d−1 están únicamente de-terminados. Aplicando la relación de recurrencia para n = k +d vemos que

ak+d =−c1ak+d−1 − c2ak+d−2 −·· ·−cd ak

y por lo tanto ak+d también está únicamente determinado. ■Ahora veamos algunos ejemplos concretos.

Ejemplo I.21 Una recurrencia de primer orden está definida por una relación de laforma

an = kan−1 (n ≥ 1)

para alguna constante k, junto con el valor inicial a0. Una inducción sencilla esta-blece que la fórmula general para an es

an = kn a0.

Como vimos, el caso d = 1 es elemental. En cambio, para d ≥ 2 se requiere deun poco más de trabajo.

Ejemplo I.22 Una recurrencia lineal de segundo orden está definida mediante unarelación de la forma

an = r an−1 + san−2 (n ≥ 2)

junto con los valores iniciales a0, a1. La expresión de an en términos de n requiere dela resolución de una ecuación auxiliar, llamada polinomio característico:

x2 = r x + s.

Sean σ y τ las raíces (complejas) de este polinomio. Si σ 6= τ, puede demostrarse queexisten constantes U , V tales que para todo n ≥ 0

an =Uσn +V τn .

Tales constantes quedan únicamente determinadas por los valores iniciales de la su-cesión; en efecto, para n = 0,1 se tiene un sistema de ecuaciones lineales

U +V = a0

Uσ+V τ= a1

cuya solución es única bajo la hipótesis σ−τ 6= 0.

CAPÍTULO I. PRELIMINARES 9

Números de Fibonacci y Lucas

Definición I.23 La sucesión de Fibonacci {Fn}n≥0 se define como sigue: F1 = F2 = 1,y para todo n ≥ 3

Fn = Fn−1 +Fn−2.

A continuación mostramos los primeros términos. Son muy comunes en mate-máticas: ¡por favor recuérdelos!

n 1 2 3 4 5 6 7 8 9 10Fn 1 1 2 3 5 8 13 21 34 55

Nota I.24 Una convención bastante útil es definir F0 = 0; en efecto, este es el úni-co valor que satisface F0 +F1 = F2.‡ Muchos textos definen la sucesión comenzandodesde el índice 1 debido a la interpretación original de la sucesión (debida al propioFibonacci) usando conejos.§

A continuación establecemos una fórmula exacta para Fn en función de n. Estees un caso particular de la teoría de relaciones de recurrencia lineales mencionadaen el Ejemplo anterior.

Proposición I.25 (Fórmula de Binet) Sean α= (1+p5)/2, β= (1−p

5)/2. Entoncespara todo n ≥ 0 se cumple que

Fn = αn −βn

p5

.

Demostración. La fórmula es claramente cierta para n = 0, pues F0 = 0. Suponga-mos que esta fórmula es cierta para n−1 y n−2, y verifiquemos que se cumple paran. Partiendo de

Fn−2 = αn−2 −βn−2

p5

Fn−1 = αn−1 −βn−1

p5

Sumando término a término y teniendo en cuenta que α, β son raíces del polino-mio t 2 − t −1 queda

Fn = Fn−1 +Fn−2 = (αn−1 +αn−2)− (βn−1 +βn−2)p5

= αn−2(α2 +1)−βn−2(β2 +1)p5

= αn −βn

p5

. ■‡El lector astuto observará que, de así desearlo, podría usar la relación de recurrencia para seguir

“retrocediendo” en la sucesión y definir sus valores en −1,−2,−3. . . Empero, no obtendrá nada nuevopuesto que F−n = (−1)n+1Fn para todo n ≥ 0. ¡Compruébelo!

§Fibonacci (“hijo de Bonacci”; c. 1170 - c. 1250) fue un matemático italiano de la Alta Edad Media,que contribuyó a popularizar en Europa los numerales arábigos.

CAPÍTULO I. PRELIMINARES 10

Si en la relación que define a la sucesión de Fibonacci tomamos a 1 y 3 comovalores iniciales, obtenemos los llamados números de Lucas: L1 = 1, L2 = 3 y Ln =Ln−1 +Ln−2 para todo n ≥ 2. Esta sucesión está íntimamente ligada a los númerosde Fibonacci; el lector podrá comprobar sin problemas el siguiente análogo de lafórmula de Binet.

Proposición I.26 Ln =αn +βn para todo n ≥ 0.

Ejemplos de identidades con números de Fibonacci

A continuación revisaremos varios ejemplos de identidades que involucran lasucesión de Fibonacci. Esta es un área de investigación activa; existe incluso unarevista arbitrada dedicada exclusivamente a estas cuestiones: Fibonacci Quarterly.

Proposición I.27n∑

k=0Fk = Fn+2 −1

Demostración. Usamos inducción sobre n. Para el caso base n = 0, se afirma queF0 = F2 −1, es decir 0 = 1−1, lo cual es cierto. Supongamos la identidad cierta paraalgún n. Sumando Fn+1 a ambos lados queda

n+1∑k=0

Fk = Fn+2 +Fn+1 −1

= Fn+3 −1

con lo cual se ha establecido la identidad correspondiente a n +1. ■Nota I.28 Si se desea una prueba directa, la fórmula de Binet junto con la suma geo-métrica pueden usarse de la siguiente manera:

n∑k=1

Fk =n∑

k=1

αn −βn

p5

= 1p5

(n∑

k=1αk −

n∑k=1

βk

)

= 1p5

(αn+1 −1

α−1− βn+1 −1

β−1

)= 1p

5

(αn+1 −1)(β−1)− (βn+1 −1)(α−1)

(α−1)(β−1)

= 1p5

αn+1β−αn+1 −β−αβn+1 +α+βn+1

αβ−α−β+1

= 1p5

αβ(αn −βn)− (αn+1 −βn+1)+ (α−β)

αβ− (α+β)+1.

CAPÍTULO I. PRELIMINARES 11

Mediante un cálculo directo observamos queα+β= 1 ,α−β=p5 yαβ=−1. Esto

junto con la fórmula de Binet nos permite simplificar la expresión anterior comosigue:

n∑k=1

Fk = 1p5

−(αn −βn)− (αn+1 −βn+1)+p5

−1

= Fn +Fn+1 −1

= Fn+2 −1.

A manera de desafío, se reta al lector a brindar demostraciones no inductivas delos ejemplos del resto de la sección usando la fórmula de Binet (en los casos que seaposible).

Proposición I.29n∑

k=0F 2

k = FnFn+1.

Demostración. Por inducción sobre n. Para n = 0 tenemos que F 20 = F0F1 pues F0 =

0. Supongamos que la igualdad es cierta para algún n. Sumando F 2n+1 a ambos lados

queda

n+1∑k=0

F 2k = FnFn+1 +F 2

n+1

= Fn+1(Fn +Fn+1)

= Fn+1Fn+2. ■

Proposición I.30 (Identidad de Cassini) Para todo entero positivo n

Fn−1Fn+1 −F 2n = (−1)n .

Demostración. Para n = 1 tenemos que F0F1−F 21 = (−1)1. Supongamos la igualdad

cierta para algún n. Entonces

FnFn+2 −F 2n+1 = FnFn+2 +Fn−1Fn+1 −Fn−1Fn+1 −F 2

n+1

= FnFn+2 −Fn+1Fn −Fn−1Fn+1

= F 2n −Fn−1Fn+1

=−(−1)n

= (−1)n+1. ■

Proposición I.31 Fn+m = FmFn+1 +Fm−1Fn para cualesquiera m ≥ 1, n ≥ 0.

Demostración. La idea consiste en considerar m fijo y hacer una inducción fuertesobre n. Para el caso n = 0 tenemos que comprobar que

Fm = FmF1 +Fm−1F0

CAPÍTULO I. PRELIMINARES 12

lo cual es cierto por la relación de recurrencia. Ahora supongamos que la igualdades cierta para n −1 y n −2, es decir

Fn+m−1 = FmFn +Fm−1Fn−1

Fn+m = FmFn−1 +Fm−1Fn−2

Sumando miembro a miembro obtenemos

Fn+m +Fn+m−1 = Fm(Fn +Fn−1)+Fm−1(Fn−1 +Fn−2)

y usando la relación de recurrencia concluimos que

Fn+m+1 = FmFn+1 +Fm−1Fn . ■

Proposición I.32 Para todo entero positivo n(1 11 0

)n

=(Fn+1 Fn

Fn Fn−1

)Demostración. Por inducción sobre n. Para n = 1 es claro, pues(

F2 F1

F1 F0

)=

(1 11 0

).

Ahora supongamos la igualdad cierta para algún n. Multiplicando ambos lados por(1 11 0

)y operando vemos que

(1 11 0

)n+1

=(Fn+1 Fn

Fn Fn−1

)(1 11 0

)=

(Fn+1 +Fn Fn+1

Fn +Fn−1 Fn

)=

(Fn+2 Fn+1

Fn+1 Fn

). ■

Teorema I.33 (Zeckendorf ) Todo entero positivo n posee una única representación

n =r∑

i=1Fki

donde los números de Fibonacci son no consecutivos, es decir los índices son enterospositivos que satisfacen ki −kk+1 ≥ 2 para todo 1 ≤ i ≤ r −1.

Antes de comenzar la demostración, observemos que la condición ki −kk+1 ≥ 2es necesaria para tener unicidad, ya que dos números de Fibonacci consecutivospueden ser combinados en otro número de Fibonacci a través de la recurrencia.Por conveniencia, llamamos a esta una representación de Zeckendorf para n.

CAPÍTULO I. PRELIMINARES 13

Demostración. Probaremos primero la existencia por inducción fuerte sobre n. Pa-ra n = 1, tenemos que 1 = F1. Ahora supongamos que todo entero menor que algúnn > 1 tiene una representación de Zeckendorf.

Comenzamos dividiendo en dos casos. Primero, si n es un número de FibonacciFk basta tomar r = 1 y k1 = k. Luego podemos suponer que n no es un número deFibonacci. Sea k1 el mayor índice tal que Fk1 < n < Fk1+1. Entonces n −Fk1 es unentero positivo al cual podemos aplicar la hipótesis inductiva: se tiene

n −Fk1 = Fk2 +·· ·+Fkr

donde ki −ki+2 ≥ 2 para todo 2 ≤ i ≤ r −1. Despejando n obtendremos

n = Fk1 +Fk2 +·· ·+Fkr

y nos queda comprobar que k1 −k2 ≥ 2. En efecto, sabemos que n −Fk1 < Fk1+1 −Fk1 = Fk1−1, pero además n−Fk1 ≥ Fk2 . Luego Fk2 < Fk1−1, y puesto que la sucesiónde Fibonacci es creciente (¡compruébelo!) concluimos que k2 < k1 −1.

Por último, mostramos la unicidad de la representación mediante un lema.

Lema I.34 Sean c1,c2, . . . ,cr una sucesión de enteros positivos tal que c1 ≥ 2 y ci −ci+1 ≥ 2 para todo 1 ≤ i ≤ r −1. Entonces

r∑i=1

Fci < Fcr +1.

Demostración. Como un bonito ejercicio (de inducción) para el lector. äEn fin, supongamos que un entero positivo posee dos representaciones∑

s∈SFs =

∑t∈T

Ft .

Removiendo términos repetidos a ambos lados, podemos asumir que S ∩T = ;.Sean u y v los mayores índices que aparecen en S y T , respectivamente; sin perdergeneralidad u < v . Por el Lema anterior, vemos que

∑s∈S Fs < Fu+1. Luego

Fv < ∑t∈T

Ft =∑s∈S

Fs < Fu+1

lo cual contradice que la sucesión de Fibonacci sea creciente. ■

I.4. Polinomios

La noción de polinomio requiere de un conjunto de coeficientes, que para nues-tros propósitos estará restringido a los siguientes casos: A =Z,Q,R o C.¶

¶Más adelante también incluiremos a Fp (el conjunto de clases de congruencia módulo p).

CAPÍTULO I. PRELIMINARES 14

Definición I.35 Un polinomio con coeficientes en A es una expresión de la forma

n∑k=0

ak X k

donde an 6= 0. Decimos que:

a0, . . . , an ∈ A son los coeficientes de P

n ≥ 0 es el grado de P, denotado por degP.

ak X k son los monomios que conforman a P.

Ejemplo I.36

El polinomio nulo es aquel cuyos coeficientes son todos cero. En este caso, sesuele decir formalmente que su grado es −∞, o bien que tiene grado menor quecualquier otro polinomio.

Los polinomios constantes no nulos poseen grado 0.

Los polinomios lineales, cuadráticos, cúbicos, cuárticos, etc. poseen grado 1,2, 3, 4, etc. respectivamente.

Definición I.37 Dos polinomios f (X ) = ∑k≥0 ak X k y g (X ) = ∑

k≥0 bk X k son idénti-cos si ak = bk para todo k. En este caso escribimos f = g , o bien f ≡ g .||

Definición I.38 La suma y multiplicación de dos polinomios f (X ) = ∑k≥0 ak X k y

g (X ) =∑k≥0 bk X k se definen como

( f + g )(X ) = ∑k≥0

(ak +bk )X k

( f g )(X ) = ∑k≥0

k∑j=0

a j bk− j X k

Nota I.39 Desde el punto de vista del álgebra moderna, puede comprobarse que elconjunto A[X ] dotado de las operaciones de suma y multiplicación recibe la estruc-tura de anillo conmutativo con unidad.

La siguiente propiedad es usada con frecuencia para demostrar la igualdad en-tre polinomios.

Proposición I.40 Dos polinomios f y g son idénticos si y sólo si f − g es idéntico alpolinomio nulo.

Ahora revisamos algunas propiedades útiles del grado. Para incluir al polinomionulo entre los posibles casos, recordemos la convención deg0 =−∞.

||Observamos que, a priori, esta noción de igualdad de polinomios es distinta de la igualdad comofunciones, es decir f (x) = g (x) para todo x ∈ A. Véase la siguiente subsección.

CAPÍTULO I. PRELIMINARES 15

Proposición I.41

(I) deg f g = deg f +deg g .

(II) deg( f + g ) ≤ max{deg f ,deg g } con igualdad si y sólo si deg f 6= deg g .

Demostración. Si alguno entre f , g es nulo, entonces ambas propiedades son tri-vialmente ciertas. Luego asumamos que f (X ) =∑m

k=0 ak X k , g (X ) =∑nk=0 bk X k son

ambos polinomios no nulos.(i) Al multiplicar dos monomios ak X k y b`X `, el mayor valor posible del grado

k +` corresponde a k = m y ` = n. Más aún, puesto que am 6= 0 y bn 6= 0, resultaque ambn 6= 0. Por tanto el monomio ambn X m+n sí aparece en la expansión def (X )g (X ), y así de este producto es m +n.

(ii) Supongamos que m ≤ n. Entonces

( f + g )(X ) =m∑

k=0(ak +bk )X k +

n∑k=m+1

bk X k .

■Corolario I.42 Suponga que f g = 0. Entonces f = 0 o g = 0.

Demostración. Veamos la contrapositiva. Supongamos que f , g son ambos no nu-los. Puesto que deg f g = deg f +deg g y deg f ,deg g son finitos, se sigue que deg f ges finito y por tanto f g 6= 0. ■

Ahora pasamos a formalizar la existencia de la división con residuo para poli-nomios.

Teorema I.43 (Algoritmo de la división) Sea A un cuerpo. Para cualesquiera po-linomios f , g ∈ A[X ] con g 6= 0 existen únicos q,r ∈ A[X ] tales que f = g q + r ydegr < deg g . En el caso r = 0, decimos que g divide a f y escribimos g | f .

Demostración. Veamos primero la existencia. Sean m = deg f , n = deg g . Si m <n, podemos tomar q = 0, f = r . Luego basta considerar m ≥ n. Procedemos porinducción sobre deg f = m.

Para el caso base, consideramos f (X ) = ∑nk=0 ak X k y g (X ) = ∑n

k=0 bk X k , conan ,bn 6= 0. Entonces podemos tomar

q(X ) = an

bn, r (X ) =

n−1∑k=0

(ak −

anbk

bn

)X k

donde degr = n −1 < n.Supongamos que la propiedad es cierta para todo f de grado menor que m. Sea

h = am/bn X m−n . Entonces hg − f no tiene término en X m , por lo cual su grado esa lo sumo m −1. Aplicando la hipótesis inductiva a f −hg existen s, r tales que

f −hg = g s + r

es decir f = g (h + s)+ r .Para la unicidad, si f = g q+r = g q ′+r ′, entonces r −r ′ = g (q−q ′), pero deg(r −

r ′) < deg(q −q ′). Por tanto r = r ′ y q = q ′. ■

CAPÍTULO I. PRELIMINARES 16

Corolario I.44 Si α ∈ K , entonces el residuo en la división de f por X −α es f (α).

Demostración. Tomando g = X −α tenemos f (X ) = (X −α)g + r , donde degr = 0o −∞, es decir r es constante. Sustituyendo X = α vemos que el valor de dichaconstante debe coincidir con f (α). ■

Raíces de polinomios

Sea K un conjunto que contiene al conjunto de coeficientes A.

Definición I.45 Decimos α ∈ K es una raíz de F ∈ A[X ] si F (α) = 0.

Proposición I.46 Si G|F , entonces toda raíz de G es una raíz de F .

Demostración. Se tiene F =G H para algún H ∈ A[X ]. Sustituyendo una raíz α de Gse tiene F (α) =G(α)H(α) = 0, de donde F (α) = 0, así que α es raíz de F . ■

Del Corolario I.44, tenemos una caracterización muy útil.

Corolario I.47 α ∈ A es una raíz de F si y sólo si X −α|F .

Una propiedad fundamental es que, en general, el número de raíces de un po-linomio no nulo está acotado por su grado.

Teorema I.48 Un polinomio no nulo F ∈ A[X ] posee a lo sumo n raíces en A.

Demostración. Por inducción, asumimos que todos los polinomios de grado me-nor que k < n poseen a lo sumo k raíces. Sea F de grado n. Si no tiene raíces,entonces se cumple trivialmente lo pedido. Si tiene una raíz, entonces por el al-goritmo de la división F = (X −α)F , donde F es de grado n−1, y aplica la hipótesisinductiva. Por tanto F tiene a lo sumo 1+ (n −1) = n raíces. ■Corolario I.49 (Teorema de la identidad) Suponga que el conjunto de coeficientesA es infinito. Entonces P,Q ∈ A[X ] son idénticos si y sólo si P (α) = Q(α) para todoα ∈ A.

Demostración. Por hipótesis, el polinomio P−Q posee infinitas raíces, y por el teo-rema anterior esto sólo es posible si P −Q = 0, es decir P =Q. ■

Notamos que no sabemos nada aún sobre la existencia de raíces. En los casosZ,Q,R,C tenemos el siguiente resultado clásico.

Teorema I.50 (Teorema fundamental del álgebra) Todo polinomio no constante enC[X ] posee una raíz en C. Equivalentemente, todo polinomio no constante de gradon posee exactamente n raíces (posiblemente repetidas).

CAPÍTULO I. PRELIMINARES 17

Relaciones de Vieta Sea f =∑k≥0 bk X k un polinomio de grado n. Cuando se co-

nocen sus n raíces α1, . . . ,αn ∈ K , es posible expresar los b j en términos de los α j .Para enunciar el resultado en su mayor generalidad, conviene introducir la si-

guiente notación. Dadas las variables formales X1, . . . , Xn , el k-ésimo polinomiosimétrico elemental se define como la suma de todos los posibles monomios ob-tenidos al escoger k variables distintas y multiplicarlas entre sí. Explícitamente:

σ1(X1, . . . , Xn) =n∑

k=1Xk

σ2(X1, . . . , Xn) =n∑

j<kX j Xk

...

σn(X1, . . . , Xn) = X1 . . . Xn .

Teorema I.51 (Relaciones de Vieta) Para 0 ≤ k ≤ n denótese por σk el k-ésimo poli-nomio simétrico elemental en n variables. Entonces

bk

bn= (−1)n−kσn−k (α1, . . . ,αn).

Demostración. Partimos de la factorización

f (x) = bn

n∏j=1

(X −αk ).

La idea consiste en comparar los coeficientes de X k a ambos lados. Por definición,en el lado izquierdo es bk . Por otro lado, en el lado derecho, observamos que todomonomio se obtiene eligiendo X o −α j en cada uno de los n factores, y multipli-cando por bn al final. Se obtiene un monomio de grado k precisamente cuandose elige X en k de los factores, y por ende deben elegirse −α j en los n − k facto-res restantes. Al multiplicar todo, el resultado es (−1)n−kα j1 . . .α jk X k para ciertosíndices j1 < ·· · < jk . Sumando sobre todas las posibles combinaciones de índi-ces y multiplicando por bn concluimos que el coeficiente de X k al lado derechoes (−1)n−k bnσn−k (α1, . . . ,αk ). ■Ejemplo I.52 Encuentre un polinomio cuadrático y mónico cuyas raíces sean 1+4

p3

y 1−4p

3.

Solución. Buscamos un polinomio de la forma x2 + bx + c. Para encontrar b y cutilizamos las relaciones de Vieta. Tenemos que

b =−(1+4p

3+1−4p

3) =−2

c = (1+4p

3)(1−4p

3) =−47.

Así, el polinomio buscado es x2 −2x −47. ■

CAPÍTULO I. PRELIMINARES 18

Multiplicidad y derivadas El teorema fundamental del álgebra permite factorizarcompletamente un polinomio en factores lineales, posiblemente repetidos.

Corolario I.53 Todo polinomio no constante f (X ) ∈ C[X ] de grado n factoriza demanera única como

f (X ) = c(X −α1)k1 (X −α2)k2 · · · (X −αm)km

donde α1, . . . ,αm ∈C son las raíces distintas de f , y k1, . . . ,km ≥ 1 son enteros positi-vos tales que k1 +·· ·+km = n.

El entero no negativo k j recibe el nombre de multiplicidad de la raíz α j . Pordefinición, α ∈ K es de multiplicidad positiva si y sólo si es raíz de f .

Existe una herramienta técnica, la derivada, que permite detectar la multiplici-dad de una raíz.

Definición I.54 La derivada formal de f (X ) =∑k≥0 ak X k se define como

f ′(X ) = ∑k≥0

kak X k−1.

La k-ésima iteración de la derivada suele denotarse como f (k).

Las siguientes propiedades son sencillas y se confían al lector.

Proposición I.55

f ′ = 0 si y sólo si f es constante.

(λ f )′ =λ f ′ y ( f + g )′ = f ′+ g ′.

(Identidad de Leibniz) ( f g )′ = f ′g + f g ′.

Teorema I.56 Un número α ∈ K es una raíz de f de multiplicidad ` si y sólo si

f (α) = f ′(α) = ·· · = f (`−1)(α) = 0

y f (`)(α) 6= 0.

Demostración. Supongamos primero que α es una raíz de f con multiplicidad `.Por definición, f = (X −α)`g para algún g tal que no contiene ningún factor X −α.Derivando queda

f ′ = `(X −α)`−1g + (X −α)`g ′ = (X −α)`−1(`g + (X −α)g ′).

Puesto que g no es divisible por X −α, se sigue que el factor `g +(X −α)g ′ tampocolo es. Se sigue que α es una raíz de f ′ con multiplicidad `−1. Iterando este razo-namiento, concluimos que α es una raíz de f ( j ) con multiplicidad `− j para todo1 ≤ j ≤ `. En particular, f ( j )(α) = 0 para todo 1 ≤ j ≤ ` y f (`)(α) 6= 0.

El recíproco es inmediato y se confía al lector. ■

CAPÍTULO I. PRELIMINARES 19

I.5. Números complejos

Definiciones básicas. Forma rectangular

Definición I.57 Sea i un símbolo tal que i 2 = −1. Un número complejo es una ex-presión de la forma a +bi , donde a,b ∈ R. El conjunto de los números complejos sedenota por C, esto es

C= {a +bi : a,b ∈R}.

La suma de dos números complejos a+bi y c +di se define como (a+b)+ (c +d)i . El producto de dos números complejos a +bi y c +di se define como (ac −bd)+ (ad +bc)i . Es bien sabido que, al ser dotado de las operaciones anteriores, Csatisface los axiomas de la estructura algebraica llamada cuerpo.

Los números reales pueden ser vistos como números complejos a +bi con b =0;** luegoC contiene aR de forma natural, y además las operaciones deC extiendena las operaciones de R. Es en este sentido que C es una extensión de R.

Definición I.58 Si z = a+bi es un número complejo, a y b son llamados la parte realy parte imaginaria de z, denotadas por Re z y Im z, respectivamente. Esta represen-tación se conoce como la forma rectangular de z.

En lo que sigue, se enumerarán (sin prueba) diversas propiedades básicas.

Proposición I.59

(a) z = 0 si y sólo si Re = Im z = 0, y z = w si y sólo si Re z = Re w y Im z = Im w.

(b) z es real si y sólo si Im z = 0, y es puramente imaginario si y sólo si Re z = 0.

(c) Re(z +w) = Re z +Re w y Im(z +w) = Im z + Im w.

Definición I.60 El conjugado de z = a+bi ∈C es el número complejo definido comoz = a −bi .

Proposición I.61 Para cualesquiera números complejos z y w se cumple que:

(a) Re z = (z + z)/2 y Im z = (z − z)/2i .

(b) z = z si y sólo si z es real, y z =−z si y sólo si z es puramente imaginario.

(c) z = z.

(d) z +w = z +w y zw = z w.

Definición I.62 El módulo o valor absoluto de z es el número real definido como|z| =

pa2 +b2.††

**Por otro lado, los números complejos con a = 0 (es decir de la forma bi ) se denominan puramenteimaginarios.

††El lector tendrá a bien recordar que dado un número real x, el símbolop

x denota al número realno negativo cuyo cuadrado es igual a x. El significado de expresiones de la forma

pz con z complejo

será elucidado posteriormente.

CAPÍTULO I. PRELIMINARES 20

Notemos que el módulo de un número complejo es siempre real, pues la can-tidad a2 +b2 es no negativa para cualesquiera a,b reales y por tanto tiene raícescuadradas reales. Más aún, tenemos las siguientes propiedades.

Proposición I.63 Para cualesquiera números complejos z y w se cumple que:

(a) |z| ≥ 0 con igualdad si y sólo si z = 0.

(b) zz = |z|2.

(c) |z| = |− z| = |z|.(d) |zw | = |z||w |.(e) |Re z| ≤ |z| y | Im z| ≤ |z|.(f ) (Desigualdad triangular) |z + w | ≤ |z| + |w | con igualdad si y sólo si w o z es

cero, o bien w =λz para alguna constante real λ> 0.

El plano complejo El nombre “forma rectangular” proviene de la interpretacióngeométrica de los números complejos como puntos en el plano complejo: todonúmero complejo x + yi corresponde de manera única a un punto (x, y) de R2 ex-presado en coordenadas cartesianas (o rectangulares). Esta manera de visualizarlos números complejos suele atribuirse al francés Jean-Robert Argand (1768-1822)y por ello recibe a veces el nombre de diagrama de Argand.

Notemos que el conjugado y el módulo de un número complejo admiten unaclara interpretación geométrica en el plano complejo: si z = x + yi , entonces zcorresponde a la reflexión del punto (x, y) sobre el eje de las abcisas, mientras que|z| es la distancia del punto (x, y) al origen.

Forma polar y exponencial

Forma polar Todo punto en el plano es únicamente determinado por sus coor-denadas cartesianas; este es el principio fundamental de la geometría analítica. Sinembargo, también es posible determinar un punto P mediante otras dos cantida-des: su distancia r al origen O y el ángulo θ que forma el radio vector ~OP con el ejede las abcisas.‡‡ Esta pareja de números reales (r,θ) recibe el nombre de coordena-das polares del punto P .§§

Notemos que por definición r es un número real no negativo y está únicamentedeterminado por P . No obstante, θ no está bien definido, pues θ+2πn representa elmismo ángulo que θ para cualquier valor de n ∈Z. Luego, a diferencia de las coor-denadas cartesianas, dos parejas diferentes (r,θ) y (r ′,θ′) pueden definir el mismopunto, y esto sucede si y sólo si r = r ′ y θ−θ′ = 2πn para algún entero n.

Es posible relacionar las coordenadas cartesianas y polares de un número com-plejo mediante la interpretación geométrica mencionada arriba. Consideremos un

‡‡Por convención, la medida positiva de este ángulo se hace en sentido antihorario.§§El origen O suele ser excluido de este sistema de coordenadas, pues en tal caso r = 0 mas θ no está

determinado.

CAPÍTULO I. PRELIMINARES 21

número complejo z = x + yi como un punto P en el plano cuyas coordenadas po-lares (r,θ). Entonces, tal y como dijimos anteriormente, se cumple que r = |z|. Porotro lado, por trigonometría elemental vemos que x = r cosθ e y = r senθ. Luegopodemos escribir

z = r cosθ+ i r senθ = r (cosθ+ i senθ).

Definición I.64 La forma polar de un número complejo z es z = r (cosθ+ i senθ),donde (r,θ) son coordendas polares de z. El ángulo θ es el argumento de z, deno-tado por arg z y el valor tal que 0 ≤ θ < 2π se conoce como el valor principal delargumento, denotado por Arg z.

Proposición I.65

(a) |cosθ+ i senθ| = 1 para cualquier θ.

(b) Si z = cosθ+ i senθ entonces z−1 = z = cosθ− i senθ.

Una ventaja de esta representación es que la sencillez de la multiplicación.

Proposición I.66 Si z = r (cosθ+ i senθ) y w = s(cosφ+ i senφ) entonces

zw = r s(cos(θ+φ)+ i sen(θ+φ)).

Nota I.67 (Interpretación geométrica de la multiplicación compleja) Todo z ∈ Cdefine una transformación del plano complejo φ : C→ C, w 7→ zw. Escribiendo z =r (cosθ+ i senθ), la Proposición anterior muestra que φ es una composición de unahomotecia de razón r y una rotación de ángulo θ, ambas centradas en el origen.

Como consecuencia de lo anterior tenemos un resultado clásico atribuido alfrancés Abraham de Moivre (1667-1754):

Teorema I.68 (De Moivre) Para cualesquiera θ ∈R y n ∈Z se cumple que

(cosθ+ i senθ)n = cosnθ+ i sennθ.

Demostración. Si n ≥ 0, el resultado se deduce al aplicar repetidamente la proposi-ción anterior al producto zn = z · z · . . . · z. Para abordar el caso n =−m < 0 notemosque (cosθ+i senθ)−1 = cosθ−i senθ = cos(−θ)+i sen(−θ), y aplicando el resultadopara m ≥ 0 queda

zn = (z−1)m = (cos(−θ)+ i sen(−θ))m = cos(−mθ)+ i sen(−mθ) = cosnθ+ i sennθ.■

El teorema de De Moivre es especialmente útil a la hora de calcular potenciasde números complejos.

Corolario I.69 Si z = r (cosθ+ i senθ) entonces zn = r n(cosnθ+ i sennθ).

CAPÍTULO I. PRELIMINARES 22

Forma exponencial Existe un formalismo muy útil a la hora de manipular núme-ros complejos, basado en una fórmula debida al gran Leonhard Euler (1707-1783):para todo número real θ se tiene la igualdad

e iθ = cosθ+ i senθ.

El lector que se encuentre por primera vez con esta fórmula seguramente sepreocupará por el significado del símbolo e iθ . Aquí es conveniente aclarar que lafunción exponencial real puede ser extendida a una función exponencial comple-ja. Son propiedades fundamentales:

e0 = 1.

ez 6= 0 para todo z complejo.

ezw = ez ew para cualesquiera números complejos z y w .

(ez )n = enz para todo z complejo y n entero.

La fórmula de Euler implica que la forma polar de un número complejo z puedereescribirse como z = r (cosθ+ i senθ) = r e iθ. Esta es nuestra “forma exponencial”.

Definición I.70 La forma exponencial de un número complejo z es z = r e iθ , donde(r,θ) son coordenadas polares de z.¶¶

Proposición I.71

|e iθ| = 1 para cualquier θ.

z = e−iθ.

Ejemplo I.72 Si z = r e iθ y w = se iφ entonces zw = r e iθ · se iφ = r se iθ+iφ = r se i (θ+φ),cuya forma polar es r s(cos(θ+φ)+i sen(θ+φ)). Este es el resultado de la ProposiciónI.66. Asimismo el Teorema de De Moivre I.68 se demuestra sencillamente al observarque si t = cosθ+ i senθ = e iθ y n es entero entonces t n = (e iθ)n = e i nθ , cuya formapolar cosnθ+ i sennθ.

I.6. Raíces de la unidad

Ya podemos resolver cierto tipo de ecuaciones algebraicas en C.

Proposición I.73 Sea n un entero positivo. Entonces el polinomio X n −1 tiene comoraíces a e2iπk/n , k = 0,1, . . . ,n −1.

Demostración. En efecto, si αn = 1, entonces comparando los módulos de amboslados vemos que |α|n = |αn | = 1, de donde |α| = 1. Luego, escribiendo α= e iθ paraalgún θ tenemos que e i nθ = 1 = e0, de donde nθ = 2πk, o bien θ = 2πk/n, donde kes entero. Ya que los n valores k = 0,1, . . . ,n −1 corresponden a n distintos valoresde α, se sigue que e2iπk/n , k = 0,1, . . . ,n −1 son las n raíces de X n −1 = 0. ■

¶¶Es importante aclarar que esta “forma exponencial” contiene exactamente la misma informaciónque la forma polar, por lo cual el lector que tenga dificultades con la misma puede evitar su uso.

CAPÍTULO I. PRELIMINARES 23

Las raíces n-ésimas de la unidad poseen una visualización atractiva en el planocomplejo: son los vértices de un n-ágono regular inscrito en el círculo unitario. Enefecto, notemos que todos las ζk = e2πki /n , k = 0,1, . . . ,n −1 son potencias de ζ1 =e2π/n . Pero sabemos que e2πi /n representa una rotación de ángulo 2π/n en el planocomplejo, por lo que los puntos ζ0, . . . ,ζn−1 equidistan del origen y forman un n-ágono regular.

Ahora podemos resolver un tipo más general de ecuaciones: aquellas que defi-nen las raíces n-ésimas de un número complejo. En general, las soluciones seránlos vértices de un polígono regular, mas no necesariamente centrado en el origen.

Proposición I.74 Sean n un entero positivo y α= r e iθ un número complejo. Enton-ces la ecuación X n =α tiene n soluciones distintas

np

r e i (θ+2πi k)/n , k = 0,1, . . . ,n −1.

Por otro lado, las raíces de la unidad también están relacionadas con la factori-zación de ciertos polinomios.

Proposición I.75 Sean ζk = e2πk/n , k = 0,1, . . . ,n−1 las raíces n-ésimas de la unidad.Entonces se tienen las factorizaciones

(I) X n −1 = (X −ζ0)(X −ζ1) · · · (X −ζn−1).

(II) X n−1 +X n−2 +·· ·+1 = (X −ζ1)(X −ζ2) · · · (X −ζn−1).

Re

Im

1

i

−1

−i

Figura I.1: Raíces cuartas de la unidad.

Ejemplo I.76 Las raíces cuartas de la unidad pueden expresarse de manera sencilla:son 1, −1, i y −i . Algebraicamente, podemos deducir esto a partir de la factorización

X 4 −1 = (X 2 −1)(X 2 +1) = (X −1)(X +1)(X − i )(X + i ).

CAPÍTULO I. PRELIMINARES 24

Ejemplo I.77 Sean ω= e2πi /3 y ζ= eπi /3. Bajo esta notación, las raíces cúbicas de launidad son 1,ω,ω2. Algebraicamente, tenemos la factorización

X 3 −1 = (X −1)(X 2 +X +1)

donde ω, ω2 son las raíces de X 2 +X +1. Notamos asimismo las relaciones

ω2 =ω=ω−1.

Además, las raíces sextas de la unidad son 1,ω2,ω3,ω4,ω5. Observamos que

ζ2 =ω, ζ3 =−1, ζ4 =ω2.

Geométricamente, se comprueba que las raíces sextas corresponden a un hexá-gono regular inscrito en la circunferencia unitaria, y las raíces cúbicas correspondena un triángulo equilátero formado por tres de sus vértices.

Algebraicamente, tenemos la factorización

X 6 −1 = (X 3 −1)(X 3 +1) = (X −1)(X 2 +X +1)(X +1)(X 2 −X +1)

de donde ζ y ζ5 son las raíces de X 2 −X +1.

Re

Im

1

ζζ2

−1

ζ4 ζ5

Figura I.2: Raíces cúbicas y sextas de la unidad.

Ejemplo I.78 Veamos el caso n = 5. Sea ζ = e2πi /5; entonces las raíces quintas de launidad son 1,ζ,ζ2,ζ3,ζ4. Notamos las relaciones

ζ4 = ζ= ζ−1; ζ3 = ζ2 = ζ−2.

Algebraicamente, se tiene la factorización

X 5 −1 = (X −1)(X 4 +X 3 +X 2 +X +1).

CAPÍTULO I. PRELIMINARES 25

A diferencia de los casos anteriores, no es posible factorizar X 4 + X 3 + X 2 + X + 1como producto de polinomios de coeficientes enteros (¡compruébelo!). Por otro lado,sí existe una factorización de coeficientes reales. Para encontrarla, notamos primero:

Lema I.79 Para todo α ∈C, se cumple que α y α son raíces de la ecuación cuadráticacon coeficientes reales

X 2 −2(Reα)X +|α|2.

Ahora bien, las cuatro raíces de X 4+X 3+X 2+X +1 vienen en parejas conjugadasζ, ζ4 y ζ2, ζ3. Luego

(X −ζ)(X −ζ4) = X 2 − (Reζ)X +1

(X −ζ2)(X −ζ3) = X 2 − (Reζ2)X +1

Nos queda calcular Reζ y Reζ2. Escribiendo x = ζ+ζ4 vemos que x2 = ζ2+ζ3+2.Sustituyendo en la relación ζ4+ζ3+ζ2+ζ+1 = 0 obtenemos x2+x−1 = 0. Resolviendoesta ecuación cuadrática y teniendo en cuenta que x > 0 concluimos que

x =p

5−1

2.

Por último, usando la relación ζ2 +ζ3 = x2 −2 concluimos que

Reζ2 = 1+p5

2.

Concluimos que la factorización deseada es

X 4 +X 3 +X 2 +X +1 =(

X 2 + 1−p5

2X +1

)(X 2 + 1+p

5

2X +1

).

Re

Im

1

ζ

ζ2

ζ3

ζ4

Figura I.3: Raíces quintas de la unidad.

Capítulo II

Divisibilidad

A partir de ahora comenzamos con el estudio de la aritmética de Z. Partiendode algunas propiedades generales de la relación de divisibilidad, estableceremosel algoritmo de la división, factorización única en primos y existencia de MCD yMCM.

Referencias de interés: [2], [3].

II.1. Definiciones y propiedades básicas

Definición II.1 Sean a,b enteros con a 6= 0. Decimos que a divide a b, y escribimosa|b, si existe un entero k tal que b = ak. Si a no divide a b, escribimos a 6 |b.

El lenguaje nos permite expresar la afirmación a|b de muchas maneras:

a es factor de b.

a es divisor de b.

b es divisible por a.

b es múltiplo de a.

Algunas observaciones sencillas:

Notemos que la definición abarca a todos los enteros; por ejemplo, es perfec-tamente válido afirmar que 2 divide a −100.

La relación a|b no está definida para a = 0, es decir 0 no puede dividir a nin-gún número. Sin embargo, b = 0 es permitido, y de hecho para todo a 6= 0tenemos que a ·0 = 0. Luego todos los enteros no nulos dividen a 0.

Las siguientes propiedades generales se siguen directamente de la definición ysu demostración se confía al lector.

Proposición II.2

26

CAPÍTULO II. DIVISIBILIDAD 27

(I) Si a|b, entonces a|bc para todo entero c.

(II) Si a|b y b|c, entonces a|c.

(III) Si a|b y a|c, entonces a|bx + c y para cualesquiera enteros x, y. En particulara|b + c y a|b − c.

(IV) Si a|b y b|a, entonces a =±b.

(V) Si a|b y a,b son positivos, entonces a ≤ b.

(VI) Si a|b, entonces ma|mb para todo entero m 6= 0.

En este curso nos interesa no sólo construir la teoría formal, sino ilustrar su uso.Por ello trataremos de revisar varios ejemplos.

Ejemplo II.3 Demuestre que 4n −1 es divisible por 3 para todo n ≥ 1.

Demostración. Ofrecemos tres métodos diferentes: uno inductivo, y otros dos ba-sados en identidades algebraicas.

Solución 1. Razonamos por inducción sobre n. Para n = 1 es claro pues 41−1 = 3.Ahora notamos que

4n+1 −1 = 4(4n −1)+3

de donde 3|4n −1 implica 3|4n+1 −1, y así se completa el paso inductivo.Solución 2. Usando la factorización de diferencia de potencias vemos que

4n −1 = (3−1)(3n−1 +3n−2 +·· ·+1).

Solución 3. Por el teorema del binomio

4n −1 = (3+1)n −1 =n∑

k=1

(n

k

)3k .

Puesto que en el lado derecho cada sumando es múltiplo de 3, se concluye que4n −1 también. ■Nota II.4 Generalizando la segunda solución, se tiene la importante propiedad parados enteros a, b cualesquiera: a −b|an −bn para todo n, y a +b|an +bn para todo nimpar.

Ejemplo II.5 Demuestre que para todo entero n:

(a) n2 −n es par.

(b) n3 −n es divisible por 6.

(c) n5 −n es divisible por 30.

CAPÍTULO II. DIVISIBILIDAD 28

Demostración. En cada caso, razonamos inductivamente sobre n. El caso base n =0 es trivial.

(a) Notamos que

(n +1)2 − (n +1) = (n2 −n)+2n.

Por la hipótesis inductiva sabemos que n2−n es par, así que su suma con el númeropar 2n también es par.

(b) Notamos que

(n +1)3 − (n +1) = (n3 −n)+3n(n +1).

Por la hipótesis inductiva sabemos que 6|n3−n; además n(n+1) = (n+1)2−(n+1)es par, así que 6|3n(n +1). Se sigue que sus suma es divisible por 6.

(c) Notamos que

(n +1)5 − (n +1) = (n5 −n)+ (5n4 +10n3 +10n2 +5n).

Para obtener la conclusión deseada, es suficiente demostrar que 6|n4+2n3+2n2+n.Ahora observamos astutamente que

n4 +2n3 +2n2 +n = (n +2)(n3 −n)+3n(n +1).

Por (a) y (b) sabemos que 6|n3−n y 2|n(n+1), por lo cual obtenemos la divisibilidadbuscada. ■

La definición de divisibilidad recién introducida corresponde a la división exac-ta entre dos enteros. Pasamos a estudiar ahora la división con residuo.

Teorema II.6 (Algoritmo de la división) Para a,b enteros, donde a es positivo, exis-ten únicos q, r tales que

b = aq + r

y 0 ≤ r < a. Además r = 0 si y sólo si b es divisible por a.

Demostración. Primero vamos a demostrar el teorema asumiendo que b > 0.Existencia. Consideremos el conjunto

S = {a −nb : n ∈Z, a −nb ≥ 0}.

Claramente este conjunto contiene elementos positivos (por ejemplo a). Por elprincipio del buen orden existe q ∈Z tal que a−qb es mínimo. Denotemos este ele-mento como r = a −qb; entonces a = bq + r . Por definición 0 ≤ r ; además, puestoque a−(q+1)b < a−qb, por la minimalidad de r debe cumplirse que a−(q+1)b < 0,así que a < (q +1)b y en consecuencia a −qb < b. Por tanto 0 ≤ r < b, tal y como sepedía.

Unicidad. Supongamos que existen q1,r1 ∈Z tal que a = bq1 + r1 con 0 ≤ r1 < by a = bq + r con 0 ≤ r < b. Esto implica b(q1 −q) = r − r1, de donde b|(r − r1). Pero0 ≤ r − r1 < r < b, por lo que debemos tener r − r1 = 0, es decir r = r1. Por último, apartir de b(q1 −q) = r − r1 = 0 y b 6= 0 vemos que q1 −q = 0, es decir q1 = q .

Finalmente, veamos el caso b < 0. Por lo ya establecido existen únicos q,r ∈ Ztales que a = |b|q + r con 0 ≤ r < |b|, de donde a = b (−q)+ r con 0 ≤ r < |b|. ■

CAPÍTULO II. DIVISIBILIDAD 29

Definición II.7 Decimos que r es el residuo en la división de b por a. Por definiciónr es un número entero entre 0 y a −1.

Gracias al algoritmo de la división, todo entero posee un único residuo en ladivisión por a. Esto garantiza —al menos en teoría— que una propiedad válidapara todo entero b pueda comprobarse dividiendo en casos, según el residuo quetengan en la división por un entero adecuado a.

Ejemplo II.8 Veamos cómo el algoritmo de la división ayuda a resolver el EjemploII.5.

(a) Notamos la factorización n2−n = n(n−1).* Por el algoritmo de la división, nes de la forma 2k o 2k +1. En el primer caso, n(n −1) = 2k(2k −1), mientras que enel segundo n(n −1) = (2k +1) ·2k. Luego n2 −n es para para todo entero n.

(b) Notamos la factorización n3 −n = (n −1)n(n +1).† Este producto es par gra-cias a (a), pues contiene enteros consecutivos. Veamos ahora que este producto esmúltiplo de 3. Para ello, usamos el algoritmo de la división y dividimos en tres casos.

Si n = 3k, entonces n3 −n = 3k(3k −1)(3k +1).

Si n = 3k +1, entonces n3 −n = 3k(3k +1)(3k +2).

Si n = 3k +2, entonces n3 −n = (3k +1)(3k +2) ·3k.

En conclusión 3|n3 −n para todo n, y como ya sabemos que 2|n3 −n concluimosque 6|n3 −n.‡

(c) Notamos la factorización n5−n = (n−1)n(n+1)(n2+1). Puesto que este pro-ducto contiene tres enteros consecutivos, gracias a (b) sabemos que 6|n5 −n. Ahoraveamos que 5|n5−n. Usando el algoritmo de la división, tenemos cinco casos; la ideaes mostrar que en cada caso al menos uno de los factores es divisible por 5.

Si n = 5k, entonces 5|n.

Si n = 5k +1, entonces 5|n −1.

Si n = 5k +2, entonces 5|n2 +1. En efecto, (5k +2)2 +1 = 5(5k2 +4k +1).

Si n = 5k +3, entonces 5|n2 +1. En efecto, (5k +3)2 +1 = 5(5k2 +6k +2).

Si n = 5k +4, entonces 5|n +1.

Finalmente, puesto que 5|n5 −n y 6|n5 −n, concluimos que 30|n5 −n.

*El problema afirma que el producto de dos enteros consecutivos cualesquiera es par.†El problema afirma que el producto de tres enteros consecutivos cualesquiera es múltiplo de 6.‡Notemos que de manera tácita estamos aceptando la validez el siguiente razonamiento: si p, q son

dos primos distintos y p|n y q|n, entonces pq |n. Más adelante veremos que esto es cierto.

CAPÍTULO II. DIVISIBILIDAD 30

II.2. Números primos

Definición II.9 Un número entero p es primo si posee exactamente cuatro divisores:1, −1, p y −p. Un número primo que no es ni 0, ni 1 ni −1 se dice compuesto.

Notamos que, a priori, un número primo puede ser positivo o negativo. Em-pero, suele seguirse la convención de trabajar únicamente con primos positivos,puesto que desde el punto de vista aritmético p y −p poseen la misma informa-ción.§ De ahora en adelante, se asumirá que todos nuestros primos son positivos.

Teorema II.10 (Existencia de factorización en primos) Todo entero n distinto de 0,1 y −1 puede expresarse como producto de primos (posiblemente con un solo factor).

Demostración. Razonamos por inducción fuerte sobre n. Para n = 2 es claro. Su-pongamos que todo k < n es producto de primos. Si n es primo, su factorizaciónconsta de un solo factor (él mismo). En caso contrario no es primo, se tiene n =n1n2 donde n1,n2 < n. Aplicando la hipótesis inductiva se sigue que n1 y n2 sonproductos de primos, y por tanto n también. ■

A continuación presentamos un resultado conocido desde la antigüedad clási-ca, a saber la infinitud de los primos.

Teorema II.11 (Euclides) Existen infinitos primos.

Demostración. Denotamos por p1, p2, . . . pr los primeros r primos. Consideramosel entero

n = 1+p1p2 · · ·pr .

Observamos que pi |n implica pi |1, lo cual contradice la definición de primo. Luegon no es divisible por pi para ningún i = 1, . . . ,r . En consecuencia n posee un divisorprimo distinto de p1, . . . , pr . Podemos continuar de manera inductiva y generar unasucesión infinita de primos p1, p2, . . . , pr , pr+1, pr+2, . . . y por tanto el número deprimos es necesariamente infinito. ■

Los números primos son objetos de la mayor importancia e interés en la teo-ría de números y toda la matemática. Luego, es natural que sean sometidos a unestudio intenso: existen numerosos problemas y conjeturas relacionadas.

Se sabe que preguntas de apariencia sencilla como determinar el n-ésimo nú-mero primo, o bien determinar el número de primos en un intervalo, no tienen res-puesta satisfactoria. Por ello, la teoría de números moderna toma un enfoque máscualitativo y se dedica a describir propiedades de la distribución de los númerosprimos.

Un concepto fácil de entender es el brechas entre primos,¶ lo cual se refiere ala diferencia entre dos primos consecutivos. Por ejemplo, dos primos p, q tales quep −q = 2 reciben el nombre de primos gemelos.

El siguiente resultado muestra que el tamaño de las brechas entre primos puedeser arbitrariamente grande.

§En efecto, p|n si y sólo si −p|n.¶Prime gap, siguiendo la terminología anglosajona.

CAPÍTULO II. DIVISIBILIDAD 31

Teorema II.12 Dado cualquier entero positivo k, existen k enteros compuestos con-secutivos.

Demostración. Considere los enteros consecutivos

(k +1)!+2,(k +1)!+3, · · · , (k +1)!+k, (k +1)!+k +1.

Cada uno de éstos es compuesto porque j |(k +1)!+ j si 2 ≤ j ≤ k +1. ■En contraste, el problema de determinar si una brecha ocurre infinitas veces es

en extremo difícil; por ejemplo, aún no se sabe si existen infinitos primos gemelos.Como muestra de la relevancia del tema, en un avance muy reciente diversos auto-res (Yitang Zhang, James Maynard) mostraron que existe cierta brecha que ocurreinfinitas veces.

Existen otras propiedades de la distribución de los primos cuyo estudio perte-nece propiamente a la rama de la teoría de números analítica. No entraremos enmayor detalle por el momento.

II.3. Máximo común divisor y mínimo común múltiplo

MCD

Definición II.13 Decimos que un entero a es divisor común de b y c si a|b y a|c.El máximo común divisor de dos enteros b y c, que no son ambos nulos, se definecomo su mayor divisor común, y se denota por (b,c). Se define de manera análogael máximo común divisor de un número arbitrario de enteros b1, . . . ,bn , no todosnulos, y se denota por (b1, . . . ,bn).

Veamos primero las siguientes propiedades generales.

Teorema II.14 (a,b) = (b, a) = (a,−b) = (a,b +ax) para todo entero x.

Demostración. Por la simetría de la definición, es obvio que (a,b) = (b, a). Por otrolado, también es claro que (a,b) = (a,−b) puesto que b y −b comparten los mismosdivisores.

Veamos ahora que (a,b) = (a,b+ax). En efecto, si d |a y d |b, entonces d |(b+ax)para todo x. Recíprocamente, si d |a y d |b + ax para todo x, entonces d |ax, y asíd |(b +ax)−ax = b. Se sigue que a comparte los mismos divisores con b y b +ax ypor tanto (a,b) = (a,b +ax). ■Teorema II.15 (Bézout) Si g = (b,c), entonces existen enteros x0, y0 tales que

bx0 + c y0 = g .

Esta es la llamada relación de Bézout.

CAPÍTULO II. DIVISIBILIDAD 32

Demostración. Consideramos el conjunto S = {bx + c y : x, y ∈ Z}. Evidentemente,este conjunto contiene elementos positivos. Por el principio del buen orden, S po-see un mínimo elemento positivo `= bx0 + c y0.

Afirmamos que ` es un divisor común de b y c. En efecto, supongamos por ab-surdo que ` 6 |b. Por el algoritmo de la división, podemos escribir b = `q + r , donde0 < r < `. Pero entonces

r = `−bq = b −q(bx0 + c y0) = b(1−qx0)+ c(−q y0)

de donde r ∈ S, lo cual contradice la minimalidad de `. Por tanto `|b, y de maneraanáloga se comprueba que `|c. Finalmente, la definición de máximo común divisorimplica que `≤ g .

Ahora bien, por definición g |b y g |c, así que g |bx + c y para cualesquiera ente-ros x, y . En particular g |bx0 + c y0 = `. Puesto que g y ` son ambos positivos, estoimplica que g ≤ `. Por tanto g = `, y así g = bx0 + c y0. ■Corolario II.16 Dados enteros b,c, no ambos nulos, su máximo común divisor puedecaracterizarse de las siguientes formas:

(a) Es el mínimo entero positivo que puede expresarse como bx + c y, donde x, y sonenteros.

(b) Es el divisor común positivo de b y c que es divisible por todos los divisores co-munes de b y c.

Demostración. La parte (a) fue establecida en el teorema anterior. En cuanto a (b),observamos que si g = (b,c), por la relación de Bézout todo divisor común de b y cdivide a g . Recíprocamente, si d es un divisor común de b y c tal que e|d para tododivisor común e, la desigualdad e ≤ d implica que d es el mayor divisor común deb y c, como queríamos. ■

Un argumento idéntico al anterior establece caracterizaciones análogas del MCDde un número arbitrario de enteros.

Teorema II.17 Dados enteros b1, . . . ,bn , no todos nulos, sea g su máximo común di-visor. Existen enteros x1, . . . , xn tales que

n∑j=1

b j x j = g .

Más aún, g puede ser caracterizado como el mínimo entero positivo de la forma∑nj=1 b j y j , donde y1, . . . , yn son enteros; asimismo, g es el divisor común positivo de

b1, . . . ,bn que es divisible por todos los divisores comunes de b1, . . . ,bn .

El momento es oportuno para observar que las tres definiciones equivalentesde MCD recién discutidas no dependen de la factorización única en primos. Es unbuen ejercicio de técnica intentar demostrar las siguientes propiedades sin recurrira dicha propiedad de factorización única.

CAPÍTULO II. DIVISIBILIDAD 33

Teorema II.18 (ma,mb) = m(a,b) para m > 0.

Demostración. Si g = (a,b) entonces g |a y g |b, de donde mg |ma y mg |mb. Se si-gue que mg |(ma,mb). Recíprocamente, partimos de la relacion de Bézout para a yb:

ax +by = g .

Alternativamente, podemos dar una prueba más conceptual usando el Corola-rio II.16 (b): tenemos que

(ma,mb) = mınx,y∈Z

(max +mby) = m mınx,y∈Z

(ax +by) = m(a,b). ■

Definición II.19 Decimos que los enteros a1, . . . , an son coprimos o primos relativossi (a1, . . . , an) = 1. Por otro lado, decimos que son coprimos o primos relativos dos ados si (ai , a j ) = 1 para cualesquiera 1 ≤ i < j ≤ n.

Teorema II.20 Para d un divisor común positivo de a y b,(a

d,

b

d

)= 1

d(a,b).

En particular, para (a,b) = g (a

g,

b

g

)= 1.

Demostración. Por el teorema anterior,

(a,b) =(d · a

d,d · b

d

)= d

(a

d,

b

d

).

En particular, si elegimos d = g = (a,b) obtenemos (a/g ,b/g ) = 1. ■Teorema II.21 Si (a,m) = (b,m) = 1, entonces (ab,m) = 1.

Demostración. Por la relación de Bézout, existen enteros x0, y0, x1, y1 tales que

ax0 +my0 = bx1 +my1 = 1.

Expandiendo y reordenando (ax0 +my0)(bx1 +my1) = 1 obtenemos una relaciónde la forma

abx0x1 +my2 = 1

donde y2 = ax0 y1 +bx1 y0 +my0 y1. En consecuencia, todo divisor común de ab ym debe dividir a 1, y por lo tanto (ab,m) = 1.|| ■Teorema II.22 Si c|ab y (b,c) = 1, entonces c|a.

||Usando el mismo razonamiento, si dos enteros m, n satisfacen mx+ny = 1 para ciertos enteros x,y , entonces (m,n) = 1. En consecuencia, dos enteros m y n son coprimos si y sólo si existen enteros x, ytales que mx +ny = 1.

CAPÍTULO II. DIVISIBILIDAD 34

Demostración. Ya sabemos que (ab, ac) = a(b,c); esto junto con la hipótesis (b,c) =1 implica que (ab, ac) = a. Por otro lado, c|ab y c|ac, de donde c|(ab, ac) = a. ■Ejemplo II.23 Supongamos que r |m y s|m, donde r y s son coprimos. Entonces r s|m.En efecto, tenemos que m = r k para algún k. Entonces s|r k, y por el teorema anteriors|k, es decir k = sl para algún l . Luego m = r sl , y así r s|m.

El teorema anterior permite deducir una propiedad en extremo importante delos números primos.

Teorema II.24 (Lema de Euclides) Para todo primo p, si p|ab entonces p|a o p|b.

Demostración. Supongamos que p 6 |a. Puesto que p es primo, esto es equivalentea decir que (p, a) = 1. Del teorema anterior se desprende que p|b. ■Nota II.25 Mediante una inducción sencilla, puede establecerse una propiedad másgeneral: si p|a1 · · ·an , entonces p|ai para algún 1 ≤ i ≤ n.

Aprovechando este lema, podemos establecer de manera formal la pieza faltan-te en la demostración de la factorización única en primos.

Teorema II.26 (Unicidad de factorización en primos) La factorización en primosde todo entero (distinto de 0 o ±1) es única salvo el signo y orden de los factores.

Demostración. Supongamos que p1 · · ·pr = q1 · · ·qs son dos factorizaciones en pri-mos del mismo entero. Cancelando factores repetidos de ser necesario, podemosasumir que no hay primos en común entre el lado izquierdo y el derecho.

Ahora bien, tenemos que p1|q1 · · ·qs . El lema de Euclides implica que p1 dividea qi para algún i . Luego p1|qi , pero dado que p1 y qi son primos, forzosamente p1 =qi , lo cual contradice la hipótesis anterior. Por tanto, todas las factorizaciones de unentero contienen los mismos primos, difiriendo únicamente en signo y orden. ■

La factorización única en primos permite realizar diversos argumentos aritmé-ticos usando la llamada representación canónica de un entero (distinto de 0 y ±1):

n =±m∏

i=1pαi

i

donde los pi son primos (positivos) distintos dos a dos, y los exponentes αi sonenteros no negativos.

Ejemplo II.27 Comprobemos que n|m si y sólo si pαii |m para todo i . Puesto que

pαii |n, una implicación es obvia por transitividad. Supongamos que pαi

i para to-

do i . Puesto que distintas potencias pαii , p

α j

j son coprimas entre sí, el Ejemplo II.23

implica que∏m

i=1 pαii |m, tal y como se quería.

CAPÍTULO II. DIVISIBILIDAD 35

Cálculo del MCD. Algoritmo de Euclides

Un problema que merece especial atención es el cálculo práctico del MCD. No-tamos que las propiedades estudiadas hasta el momento son formales y no danmayor indicación sobre posibles métodos de cálculo.

Gracias a la factorización única sí tenemos una fórmula explícita que suele en-señarse en las escuelas.

Proposición II.28 Sean a =±∏mi=1 pαi

i , b =±∏mi=1 pβi

i . Entonces

(a,b) =m∏

i=1pγi

i

donde γi = mın{αi ,βi }.

Esta fórmula tiene la grave desventaja de presuponer como conocidas las facto-rizaciones en primos de a y b. Por otro lado, para números muy grande, el problemade calcular dicha factorización es en general inviable.

Por fortuna para nosotros, existe un bonito método —nuevamente debido aEuclides— que permite un cálculo eficiente del MCD. Hablando en rigor, no se tra-ta de una fórmula explícita, sino de un algoritmo, es decir una sucesión finita deoperaciones.

Teorema II.29 (Algoritmo de Euclides) Dados dos enteros b y c ≥ 0, se hace unaaplicación repetida del algoritmo de la división para obtener las ecuaciones

b = cq1 + r1, 0 < r1 < cc = r1q2 + r2, 0 < r2 < r1

r1 = r2q3 + r3, 0 < r3 < r2...

r j−2 = r j−1q j + r j , 0 < r j < r j−1

r j−1 = r j q j+1

Bajo esta notación se cumple que (b,c) = r j . Más aún, los coeficientes x0 ,y0 dela relación de Bézout (b,c) = bx0 + c y0 pueden obtenerse eliminando sucesivamenter j−1, . . . ,r1 del conjunto de ecuaciones.

Demostración. El primer paso es comprender por qué el algoritmo termina. Enefecto, en cada iteración vemos que se obtienen residuos sujetos a las desigual-dades

c > r1 > r2 > r3 > ·· ·Al ser esta una sucesión estrictamente decreciente de enteros no negativos, nece-sariamente debe ocurrir que r j+1 = 0 para algún j .

El siguiente paso es comprobar que r j = (b,c). En efecto, (b,c) = (b − cq1,c) =(r1,c). Repitiendo este razonamiento vemos que (r1,c) = (r1,c − r1q2) = (r1,r2). Ite-rando llegamos a

(b,c) = (r j−1,r j ) = (r j ,0) = r j . ■

CAPÍTULO II. DIVISIBILIDAD 36

Ejemplo II.30 Calcule el MCD de 4147 y 10672.

Solución. Tenemos que

10672 = 4147 ·2+2378

4147 = 2378 ·1+1769

2378 = 1769 ·1+609

1769 = 609 ·2+551

609 = 551 ·1+58

551 = 58 ·9+29

58 = 29 ·2.

Por lo tanto, (4147,10672) = 29. ■Ejemplo II.31 Calcule el MCD de 345688 y 245994.

Demostración. Tenemos que

345688 = 245994 ·1+99694

245994 = 99694 ·2+46606

99694 = 46606 ·2+6482

46606 = 6482 ·7+1232

6482 = 1232 ·5+322

1232 = 322 ·3+266

322 = 266 ·1+56

266 = 56 ·4+42

56 = 42 ·1+14

42 = 14 ·3

Por lo tanto, (345688,245994) = 14.■

MCM

Definición II.32 Decimos que un entero a es múltiplo común de b y c si b|a y c|a.El máximo común divisor de dos enteros b y c, que no son ambos nulos, se definecomo su menor múltiplo común positivo, y se denota por [b,c]. Se define de maneraanáloga el mínimo común múltiplo de un número arbitrario de enteros b1, . . . ,bn ,no todos nulos, y se denota por [b1, . . . ,bn].

Teorema II.33 Si b es un múltiplo común de a1, . . . , an , entonces [a1, . . . , an]|b. Enotras palabras, si h = [a1, . . . , an] entonces los múltiplos comunes de a1, . . . , an sonprecisamente los múltiplos de h.

Teorema II.34

CAPÍTULO II. DIVISIBILIDAD 37

(I) Para m > 0, [ma,mb] = m[a,b].

(II) [a,b](a,b) = |ab|.Demostración. (i) Sean H = [ma,mb] y h = [a,b]. Por definición, a|h, b|h, de don-de ma|mh y mb|mh. Luego mh es un múltiplo común de ma y mb, así que pordefinición de MCM se cumple mh ≥ H . Por otro lado, ma|H , mb|H implican quea|H/m y b|H/m, de donde H/m es un múltiplo común de a y b. Nuevamente porla definición de MCM se sigue que H ≥ mh. Por tanto H = mh tal y como se pedía.

(ii) Podemos asumir que a,b > 0 pues el valor del MCM no cambia. Suponga-mos primero que (a,b) = 1. Por definición [a,b] = ka para algún k. Al ser [a,b] múl-tiplo común de a y b, se tiene además b|ka. Pero a y b son coprimos, de donde b|k.En particular b ≤ k y así ba ≤ ak = [a,b]. Por la minimalidad del MCM debemostener la igualdad, es decir ab = [a,b]. Finalmente, para el caso general (a,b) = g ,recordamos la propiedad (a/g ,b/g ) = 1, y por lo anteriormente demostrado(

a

g,

b

g

)[a

g,

b

g

]= a

g

b

g.

Multiplicando ambos lados por g 2 concluimos que (a,b)[a,b] = ab, tal y como sequería. ■

Es interesante notar que el literal (b) del Teorema anterior nos da una manerade calcular el MCM en función de a, b y (a,b). Por otro lado, la factorización únicaen primos nos da la siguiente fórmula explícita.

Proposición II.35 Sean a =±∏mi=1 pαi

i , b =±∏mi=1 pβi

i . Entonces

(a,b) =m∏

i=1pδi

i

donde δi = max{αi ,βi }.

Capítulo III

Congruencias

La noción de congruencias fue introducida por Gauss en su célebre obra Dis-quisitiones Arithmeticae, la cual fue el primer tratamiento sistemático de la teoríade números como una disciplina formal.

III.1. Definiciones básicas

Definición III.1 Sea m > 0. Decimos que dos enteros a y b son congruentes módulom, y escribimos a ≡ b (mod m), si m|a −b.

Observaciones: la relación anterior está definida para enteros cualesquiera (nonecesariamente enteros positivos). Esta es una ventaja a la hora de realizar cálcu-los, pues conviene trabajar con números pequeños en valor absoluto.

Ejemplos sencillos:

4 ≡−1 (mod 5),2019 ≡ 19 mod 10,−7 ≡−3 (mod 4)

Proposición III.2

(I) (Reflexividad) a ≡ a (mod m).

(II) (Simetría) a ≡ b (mod m) si y sólo si b ≡ a (mod m).

(III) (Transitividad) Si a ≡ b (mod m) y b ≡ c (mod m), entonces a ≡ c (mod m).

(IV) a ≡ b (mod m) si y sólo si a −b ≡ 0 (mod m). En particular a ≡ 0 (mod m) siy sólo si m|a.

(V) Si r es el residuo en la división de a por m, entonces a ≡ r (mod m).

(VI) (Suma de congruencias) Si a ≡ b (mod m) y c ≡ d (mod m), entonces a ±b ≡c ±d (mod m).

(VII) (Multiplicación de congruencias) Si a ≡ b (mod m) y c ≡ d (mod m), entoncesab ≡ cd (mod m).

38

CAPÍTULO III. CONGRUENCIAS 39

(VIII) Si a ≡ b (mod m) y d |m, d > 0, entonces a ≡ b (mod d).

(IX) Si a ≡ b (mod m), entonces ak ≡ bk (mod m) para todo k ∈Z.

Ahora revisamos otras propiedades interesantes.

Teorema III.3 Para todo polinomio de coeficientes enteros f , si a ≡ b (mod m) en-tonces f (a) ≡ f (b) (mod m).

Demostración. Primero, notamos que ak ≡ bk (mod m) para todo k. Luego, si f (X ) =∑nk=0 ck X k entonces multiplicamos por ck la congruencia anterior y sumamos so-

bre k. ■Ahora bien, ya comentamos que x ≡ y (mod m) implica que kx ≡ k y (mod m).

El recíproco en general es falso. Por ejemplo, 6 ≡ 2 (mod 4), pero al intentar can-celar el factor común 2 obtenemos incorrectamente 3 ≡ 1 (mod 4). En contraste,tenemos lo siguiente.

Proposición III.4

(I) ax ≡ ay (mod m) si y sólo si

x ≡ y (mod m/d)

donde d = (a,m).

(II) En particular, si a es coprimo con m se cumple la ley de cancelación: ax ≡ ay(mod m) si y sólo si x ≡ y (mod m).

(III) x ≡ y (mod mi ), i = 1, . . . ,r si y sólo si x ≡ y (mod M), donde M = [m1, . . . ,mr ].En particular, si m1, . . . ,mn son coprimos dos a dos se cumple que el sistema decongruencias x ≡ y (mod mi ), i = 1, . . . ,r es equivalente a

x ≡ y (mod m1 · · ·mr ).

Demostración.(i) ax ≡ ay (mod m) si y sólo si m|a(x − y), es decir a(x − y) = mz para algún z.

Dividiendo por (a,m) queda

a

(a,m)(x − y) = m

(a,m)z.

Pero m/(a,m) es coprimo con a/(a,m), de donde m/(a,m) divide a x − y .(ii) Basta tomar d = 1 en el literal anterior.(iii) x ≡ y (mod mi ) si y sólo si mi |x− y para todo i ; por propiedades del MCM,

esto ocurre si y sólo si [m1, . . . ,mr ]|x − y .Recíprocamente, si x ≡ y (mod M), entonces x ≡ y (mod mi ) puesto que mi |M .Por último, si los mi son coprimos dos a dos, entonces M = m1 · · ·mr . ■Veamos ahora algunos ejemplos numéricos.

CAPÍTULO III. CONGRUENCIAS 40

Ejemplo III.5 Demuestre que 7|32n+1 +2n+2 para todo n ≥ 0.

Solución. Observamos que 32 ≡ 2 (mod 7). Sustituyendo queda

32n+1 +2n+2 ≡ 3 ·2n +2n+1 ≡ 7 ·2n ≡ 0 (mod 7). ■

Muchos problemas involucran la representación decimal de un entero positi-vo:

N = an · · ·a0 =n∑

k=010k ak

donde 0 ≤ a0, . . . , an ≤ 9 son sus dígitos. Un ejemplo clásico son los criterios dedivisibilidad que suelen enseñarse en las escuelas.

Ejemplo III.6 Un entero positivo es divisible por 3 (o 9) si y sólo si la suma de susdígitos es divisible por 3 (o 9).

Solución. Notamos que 10 ≡ 1 (mod 3), de donde 10k ≡ 1 (mod 3) para todo k.Luego

N =n∑

k=010k ak ≡

n∑k=0

ak (mod 3)

y por transitividad se concluye que N ≡ 0 (mod 3) si y sólo si∑n

k=0 ak ≡ 0 (mod 3).El mismo argumento vale al partir de 10 ≡ 1 (mod 9), y así se obtiene el criterio

de divisibilidad por 9. ■Ejemplo III.7 Un entero positivo N =∑n

k=0 10k ak es divisible por 11 si y sólo si

n∑k=0

(−1)k ak

es divisible por 11.

Demostración. Partimos de la observación 10 ≡−1 (mod 11). Entonces 10k ≡ (−1)k

(mod 11) para todo k, y en consecuencia

N =n∑

k=010k ak ≡

n∑k=0

(−1)k ak (mod 11).

Por tanto N ≡ 0 (mod 11) si y sólo si∑n

k=0(−1)k ak ≡ 0 (mod 11). ■A manera de ejercicio, se sugiere al lector enunciar y demostrar rigurosamente

criterios de divisibilidad por: 4, 5, 8, 16, 25.Otro tipo de problemas consisten en determinar dígitos de unidades, decenas,

etc. Usando congruencias, puede procederse de manera indirecta: para todo N =∑nk=0 10k ak , el dígito de las unidades a0 es el residuo de N en la división por 10; el

número a1a0 formado por decenas y unidades es el residuo de N en la división por100, y así sucesivamente.

Ejemplo III.8 Calcule el dígito de las unidades de 777.

CAPÍTULO III. CONGRUENCIAS 41

Solución. Partimos de 72 ≡−1 (mod 10). Entonces 72k ≡ (−1)k (mod 10), y asimis-mo 72k+1 ≡ 7(−1)k (mod 10). Teniendo en cuenta la paridad de k, tenemos el con-veniente cálculo

7n ≡

1 (mod 10) si n ≡ 0 (mod 4)

7 (mod 10) si n ≡ 1 (mod 4)

9 (mod 10) si n ≡ 2 (mod 4)

3 (mod 10) si n ≡ 3 (mod 4)

Resta hallar 77 mod 4. En efecto, 7 ≡−1 (mod 4), así que 77 ≡ (−1)7 ≡−1 (mod 4).Por tanto la respuesta al problema es 3. ■

Por último, algunos ejemplos más conceptuales.

Ejemplo III.9 Sea p primo. Si a ≡ b (mod p), entonces ap ≡ bp (mod p2).

Demostración. Partimos de la factorización

ap −bp = (a −b)(ap−1 +ap−2b +·· ·+abp−2 +bp−1).

Por hipótesis a ≡ b (mod p), es decir p|a −b. Por otro lado,

ap−1 +ap−2b +·· ·+abp−2 +ap−1 ≡ ap−1 +ap−1 +·· ·+bp−1 ≡ pbp−1 ≡ 0 (mod p).

En consecuencia p|ap−1 +ap−2b +·· ·+abp−2 +ap−1, y por tanto p2|ap −bp . ■Ejemplo III.10 Para p primo impar, demuestre que

13 +23 +·· ·+ (p −1)3 ≡ 0 (mod p)2.

Demostración. Mostramos dos maneras distintas de razonar. Primero, podemosargumentar directamente recurriendo a la identidad algebraica

13 +23 +·· ·+ (p −1)3 =[

p(p −1)

2

]2

.

Puesto que p es impar, el factor p2 del numerador no puede cancelarse con el de-nominador, y así se deduce que el lado derecho es un entero divisible por p2.

Ahora presentamos una solución alternativa. La idea consiste en realizar unemparejamiento como sigue: para 1 ≤ j ≤ (p −1)/2 notamos que

j 3 + (p − j )3 = j 3 +p3 −3p2 j +3p j 2 − j 3 ≡ 3p j 2 (mod p2).

Por otro lado, puesto que j 2 ≡ (p − j )2 (mod p), se sigue que

2(13 +23 +·· ·+ (p −1)3) ≡ 3p(12 +22 +·· ·+ (p −1)2) (mod p2).

Ahora bien, afirmamos que

3p(12 +22 +·· ·+ (p −1)2) ≡ 0 (mod p2).

CAPÍTULO III. CONGRUENCIAS 42

En efecto, cancelando el factor p en toda la congruencia esto equivale a

3(12 +22 +·· ·+ (p −1)2) ≡ 0 (mod p).

Recordando la identidad algebraica

12 +22 +·· ·+ (p −1)2 = p(p −1)(2p −1)

6

vemos que si p > 3 el factor p del numerador no puede cancelarse con el denomi-nador, por lo cual el miembro derecho es un entero divisible por p. Por último, enel caso p = 3 es evidente que 3(12 +22) ≡ 0 (mod 3).

De esta manera concluimos que 2(13+23+·· ·+(p−1)3) ≡ 0 (mod p2), y puestoque p es impar, podemos cancelar el factor 2 para obtener 13+23+·· ·+ (p −1)3 ≡ 0(mod p2). ■

El lector perspicaz notará que varios ejemplos parten de la reducción módulo mde una potencia, lo cual simplifica enormemente los cálculos. Tal reducción, que enlos casos mostrados fue encontrada a prueba y error, puede ser realizada de formasistemática recurriendo a teoremas de la siguiente sección (Fermat y Euler).

III.2. Teoremas de Fermat, Euler y Wilson

Esta sección consta de resultados fundamentales en la teoría de congruenciasy que forman parte de todo curso de teoría de números.

Pequeño teorema de Fermat

El primer resultado es atribuido al célebre Pierre de Fermat.

Teorema III.11 (Pequeño teorema de Fermat) Sea p un primo. Para todo a coprimocon p

ap−1 ≡ 1 (mod p).

Demostración. Probaremos la siguiente versión más general: para todo entero a secumple que

ap ≡ a (mod p).

En efecto, si a es coprimo con p, por la ley de cancelación la congruencia se reducea ap−1 ≡ 1 (mod p). Por otro lado, si a no es coprimo con p, puesto que p es primodebe cumplirse que a es múltiplo de p, de donde la congruencia se convierte en0 ≡ 0 (mod p), lo cual es trivialmente cierto.

Para un entero positivo a, mostraremos lo pedido por inducción sobre a. Pa-ra a = 0 el resultado es trivial. Supongamos que ap ≡ a (mod p). Del teorema delbinomio tenemos que

(a +1)p =p∑

k=0

(p

k

)ak .

Ahora observamos una propiedad muy importante:

CAPÍTULO III. CONGRUENCIAS 43

Lema III.12 Para 1 ≤ k ≤ p −1, el coeficiente binomial

(p

k

)es múltiplo de p.

Demostración. En efecto, (p

k

)= p(p −1) · · · (p −k +1)

k !

y como k < p, vemos que el factor p del numerador no puede cancelarse con algúnfactor del denominador. ä

Regresando al teorema en cuestión, se sigue que

(a +1)p ≡ ap +1 (mod p).

Finalmente, por la hipótesis inductiva sabemos que ap ≡ a (mod p). Por lo tanto

(a +1)p ≡ a +1 (mod p)

y la inducción está completa.Para finalizar la prueba, debemos razonar la validez del teorema para a < 0. Si

p = 2 el resultado es claro. Si p es impar, entonces (−a)p =−ap , de donde (−a)p ≡−a (mod p) es equivalente a ap ≡ a (mod p) para a > 0. ■

El teorema de Fermat en su versión original ap−1 ≡ 1 (mod p) admite una se-gunda prueba basada en congruencias. Sea a coprimo con p. Consideremos el lis-tado de números

a,2a,3a, . . . , (p −1)a.

Hacemos las siguientes observaciones:

Hay p −1 números en la lista.

Todos los números de la lista son coprimos con p. En efecto, por el lema deEuclides p|ka implica que p|k o p|a. Pero la primera es imposible pues 1 ≤k ≤ p −1, mientras que la segunda no ocurre pues a es coprimo con p.

No hay dos números en la lista congruentes módulo p. En efecto si tuviéramosi a ≡ j a (mod p) para distintos i , j , entonces p|(i − j )a, y nuevamente por ellema de Euclides p|i − j o p|a. Pero 0 < |i − j | < p, por lo cual la primeraopción es imposible; más aún p|a es imposible al ser a coprimo con p.

En conclusión, tenemos p−1 números coprimos con p, cuyos residuos en la di-visión por p son todos distintos. Por tanto, dichos residuos deben ser exactamente1, . . . , p −1 en algún orden, así que al multiplicarlos entre sí el resultado debe ser elmismo módulo p, es decir

a ·2a · · · · · (p −1)a ≡ 1 ·2 · · · · · (p −1) (mod p).

CAPÍTULO III. CONGRUENCIAS 44

Reagrupando obtenemos

(p −1)!ap−1 ≡ (p −1)! (mod p).

Nuevamente por el lema de Euclides (p − 1)! es coprimo con p, así que podemoscancelarlo a ambos lados de la congruencia para obtener

ap−1 ≡ 1 (mod p).

Función phi y teorema de Euler

Si bien la primera demostración del pequeño teorema de Fermat es comple-tamente elemental, la segunda contiene un refinamiento que permite generalizara congruencias de cualquier módulo. Para definir precisamente el exponente de lacongruencia, necesitamos introducir una función especial de la teoría de números.

Definición III.13 La función de Eulerφ(n) es el número de elementos en el conjunto{1, . . . ,n} que son coprimos con n.

Ejemplo III.14 φ(p) = p −1 y en general φ(pk ) = pk −pk−1.

Demostración. Sea n = p primo. De la definición de primo el único número entre1 y p que no es coprimo con p es p, de donde φ(p) = p − 1. De forma un pocomás general, sea n = pk . Notamos que d |pk si y sólo si d = p` con `≤ k. Luego unentero es coprimo con pk si y sólo si es coprimo con p, es decir si y sólo si no esun múltiplo de p. Puesto que hay pk−1 múltiplos de p entre 1 y p, se concluye queφ(pk ) = pk −pk−1. ■Lema III.15 Si b ≡ c (mod m), entonces (b,m) = (c,m).

Demostración. Por definición, c = bm+x. Luego por propiedades del MCD, (c,m) =(bm +x,m) = (b,m). ■Teorema III.16 (Euler) Para todo a coprimo con n

aφ(n) ≡ 1 (mod n)

donde φ(n) denota a la función de Euler.

Demostración. Denotamos por r1, . . . ,rφ(n) a los números del 1 al n coprimos conn. Consideramos la lista

ar1, . . . , arφ(n).

Afirmamos que los residuos en la división por n de estos números son r1, . . . ,rn enalgún orden. Primero notamos que todos los números ar1, . . . , arφ(n) son coprimoscon n. En efecto, si n|ari , puesto que a y n son coprimos necesariamente n|ri , peroesto es imposible puesto que 0 < ri < n.

Por otro lado, no hay dos números en la lista congruentes módulo n. En efecto,si tuviéramos ari ≡ ar j (mod n) con i < j , esto equivale a n|a(ri −r j ). Nuevamente

CAPÍTULO III. CONGRUENCIAS 45

al ser a coprimo con n se tiene que n|ri − r j , pero esto es absurdo puesto que 0 <|ri − r j | < n.

Finalmente, gracias al Lema anterior sabemos que los residuos en la divisiónpor n de ar1, . . . , arφ(n) son coprimos con n. Como todos estos residuos están entre0 y n − 1, son coprimos con n y además hay φ(n) de ellos, concluimos que estosson precisamente r1, . . . ,rφ(n) en algún orden. Por tanto, al multiplicar ambas listasdeducimos la congruencia

r1 . . .rφ(n)aφ(n) ≡ r1 . . .rφ(n) (mod n).

Puesto que cada ri es coprimo con n, su producto r1 . . .rφ(n) también es coprimocon n, e invocando la propiedad de cancelación concluimos que

aφ(n) ≡ 1 (mod n). ■

Teorema de Wilson

Teorema III.17 La congruencia aX ≡ 1 (mod m) tiene solución si y sólo si (a,m) = 1.Dicha solución es única módulo m.

Demostración. Si (a,m) = 1, por la relación de Bézout existen x, y tales que ax +my = 1; reduciendo módulo m obtenemos ax ≡ 1 (mod m). Recíprocamente siax ≡ 1 (mod m) para algún x, entonces m|ax−1, es decir existe y tal que ax+my =1 y en consecuencia (a,m) = 1.

Veamos ahora la unicidad. Si ax ≡ 1 (mod m) y ax ′ ≡ 1 (mod m), por transiti-vidad ax ≡ ax ′ (mod m), de donde m|a(x −x ′). Puesto que (a,m) = 1, esto implicaque m|x −x ′, es decir x ≡ x ′ (mod m). ■Nota III.18 Un entero que satisfaga la congruencia ax ≡ 1 (mod m) recibe el nombrede inverso multiplicativo de a módulo m. El teorema anterior muestra que todo en-tero a coprimo con m posee un inverso multiplicativo módulo m, y que dicho inversoes único módulo m.

Lema III.19 x2 ≡ 1 (mod p) si y sólo si x ≡ 1 o bien x ≡−1 (mod p).

Demostración. Por definición, x2 ≡ 1 (mod p) si y sólo si p|x2−1 = (x−1)(x+1). Porel lema de Euclides, esto implica que p|x −1 o bien p|x +1, es decir x ≡ 1 (mod p)o bien x ≡−1 (mod p). ■Teorema III.20 (Wilson) Para todo p primo

(p −1)! ≡−1 (mod p).

Demostración. Si p = 2 o 3, la conclusión es inmediata. Supongamos entonces quep ≥ 5. La idea consiste en realizar un emparejamiento de los números 1,2, . . . , p−1de acuerdo a la siguiente regla: cada 1 ≤ j ≤ p −1 es emparejado con k, su inversomultiplicativo módulo p. Este existe según el Teorema III.17 puesto que ( j , p) = 1.Más aún, ya que dicho inverso es único módulo p, podemos escogerlo de modoque 1 ≤ k ≤ p −1.

CAPÍTULO III. CONGRUENCIAS 46

De acuerdo al lema anterior, se cumple que k 6= j excepto para j = 1 o p − 1.Luego los números del 2 al p−2 pueden agruparse en exactamente (p−3)/2 parejas,siendo 1 el producto de los números en cada una de ellas. Al multiplicar todas lasparejas obtenemos

2 ·3 · · · · (p −2) ≡ 1 (mod p).

Por lo tanto(p −1)! ≡ 1 ·2 · · · · · (p −2)(p −1) ≡−1 (mod p). ■

Notamos como corolario una variante del teorema de Wilson.

Corolario III.21 Para todo p primo

(p −2)! ≡ 1 (mod p).

Nota III.22 Es interesante observar que el teorema de Wilson posee un recíproco: si nsatisface la congruencia (n −1)! ≡−1 (mod n), entonces n es primo (compruébelo).Luego el teorema de Wilson brinda —desde el punto de vista teórico— un criteriopara determinar si un entero dado es primo o no. Lamentablemente, los cálculosinvolucrados son en extremo ineficientes desde el punto de vista computacional.

Finalizamos la sección con algunos ejemplos.

Ejemplo III.23 Calcule el residuo en la división por 13 de 21431.

Demostración. Como 13 - 2, por el pequeño teorema de Fermat

212 ≡ 1 (mód 13).

Ahora, por el algoritmo de la división,

1431 = 12 ·119+3.

Luego 21431 = 2119·12+3 = (212)119 ·23. Por lo tanto,

21431 ≡ 1119 ·23 ≡ 8 (mód 13).

Concluimos que 21431 ≡ 8 (mód 13). ■Ejemplo III.24 Sea p primo. Demuestre que p divide a abp −bap para cualesquieraenteros a y b.

Demostración. Tenemos que abp −bap = ab(bp−1 − ap−1). Si p | ab, entonces p |abp −bap . Si p - ab, entonces (p, a) = (p,b) = 1. Luego, por el pequeño teorema deFermat, ap−1 ≡ 1 ≡ bp−1 (mód p), y en consecuencia p | bp−1 − ap−1. Por lo tanto,p | abp −bap para todo p. ■Ejemplo III.25 Encuentre los dos últimos dígitos de 3333344444.

CAPÍTULO III. CONGRUENCIAS 47

Demostración. Para encontrar los dos últimos dígitos basta reducir 3333344444 mó-dulo 100. Tenemos que (33333,100) = 1. Ahora,φ(100) =φ(22)φ(52) = 40. Entonces,por el teorema de Euler, 3333340 ≡ 1 (mód 100). Por el algoritmo de la división,44444 = 40 ·1111+4. Es decir que 3333344444 = (3333340)1111 ·333334. Por lo tanto,

3333344444 ≡ 11111 ·333334 ≡ 334 ≡ 10892 ≡ 892 ≡ 7921 ≡ 21 (mód 100).

Concluimos que 3333344444 termina en 21. ■Ejemplo III.26 Calcule el inverso multiplicativo de 161 módulo 167.

Demostración. Tenemos que:

167 = 161 ·1+6

161 = 6 ·26+5

6 = 5+1.

Efectuando sucesivas sustituciones desde la última igualdad hasta la primera:

1 = 6−5 ·1

= 6− (161−6 ·26) ·1

= 6−161+6 ·26

= 6 ·27−161

= (167−161 ·1) ·27−161

= 167 ·27−161 ·28.

Así, −28 ≡ 139 (mód 167) es el inverso multiplicativo de 161 módulo 167. ■Ejemplo III.27 Encuentre el residuo de la división por 167 de 163!.

Demostración. Por el teorema de Wilson sabemos que 166! ≡−1 (mód 167). Enton-ces

166 ·165 ·164 ·163! ≡−1 (mód 167)

(−1)(−2)(−3) ·163! ≡−1 (mód 167)

−6 ·163! ≡−1 (mód 167)

(−28) · (−6) ·163! ≡ (−28)(−1) (mód 167)

168 ·163! ≡ 28 (mód 167)

163! ≡ 28 (mód 167).

Así, el residuo buscado es 28. ■Ejemplo III.28 Sea p primo. Muestre que para todo a coprimo con p

ap(p−1) ≡ 1 mod p2.

CAPÍTULO III. CONGRUENCIAS 48

Demostración. Notamos que φ(p2) = p2 −p = p(p −1). Luego el teorema de Eulernos da inmediatamente lo pedido.

Cabe preguntarse cómo proceder sin el teorema de Euler. El truco consiste enrecordar el Ejemplo III.9, que a partir de la congruencia de Fermat

ap−1 ≡ 1 (mod p)

nos daap(p−1) ≡ 1 (mod p2)

tal y como se pedía. ■Ahora presentamos un cálculo relacionado al Ejemplo III.10.

Ejemplo III.29 Para p primo impar, demuestre que

1p−2 +2p−2 +·· ·+ (p −1)p−2 ≡ 0 mod p.

Demostración. Para 1 ≤ a ≤ p−1, escribimos la congruencia de Fermat como sigue:

a ·ap−2 ≡ 1 (mod p).

Esto muestra que ap−2 es el inverso multiplicativo módulo p de a. Debido a que elinverso multiplicativo es único (y distinto de cero), al reducir módulo p la lista

1p−2,2p−2, . . . , (p −1)p−2

se obtiene una permutación de los residuos 1,2, . . . , p −1. Por tanto

1p−2 +2p−2 +·· ·+ (p −1)p−2 ≡ 1+2+·· ·+ (p −1) (mod p).

Finalmente, por la suma de Gauss el miembro derecho es igual a p(p −1)/2, elcual es un entero divisible por p, y hemos terminado. ■

III.3. Resolución de congruencias

Definición III.30 Sea f (x) = an X n + ·· · + a0 un polinomio de coeficientes enteros.Una congruencia algebraica es una expresión de la forma

f (X ) ≡ 0 (mod m).

Una solución a la congruencia anterior es una clase de congruencia a módulo m talque

f (a) ≡ 0 (mod m).

El grado de la congruencia es el mayor índice j tal que a j 6≡ 0 (mod m). Si tal j noexiste, se dice que la congruencia es nula y no se le asigna grado.

Notamos que la propiedad de ser solución está bien definida sobre las clases decongruencia módulo m, pues ya sabemos que si a ≡ b (mod m) entonces f (a) ≡f (b) (mod m) para todo polinomio f de coeficientes enteros.

CAPÍTULO III. CONGRUENCIAS 49

Ejemplo III.31 Consideremos el polinomio 6X 3−3X 2+4X −7. Variando el módulo,obtenemos congruencias diferentes.

X 3 +X 2 +1 ≡ 0 (mod 2)

X −1 ≡ 0 (mod 3)

3X 2 +4X −1 ≡ 0 (mod 6)

Como se puede observar, el grado de una congruencia depende del módulo escogido,y en general puede ser distinto del grado del polinomio inicial.

Por resolver una congruencia algebraica f (X ) ≡ 0 (mod m) entendemos al-gún procedimiento sistemático que permita encontrar todas sus soluciones. Esteproblema es en principio demasiado general y suele subdividirse en varios tipos.Dos criterios que suelen emplearse son:

El grado de la congruencia: Al igual que en el caso de las ecuaciones algebrai-cas, hablamos de congruencias lineales, congruencias cuadráticas, etc.

El módulo de la congruencia: Como veremos más adelante, los casos de mó-dulo primo y módulo potencia de primo suelen ser más fáciles de abordar.

Por último observamos que, por la mera definición, una congruencia algebrai-ca módulo m puede tener a lo sumo m soluciones, simplemente debido a que haym clases de congruencia módulo m. Luego, un posible método de solución podríaconsistir en comprobar una por una cuáles son soluciones. Si bien esto es viableen casos muy concretos (por ejemplo, para m pequeño), para una congruencia ar-bitraria es en extremo ineficiente; esto debería de ser motivación para apreciar lateoría a desarrollar.

Congruencias lineales

Teorema III.32 Sean a, b enteros cualesquiera, y d = (a,b). La congruencia lineal

aX ≡ b (mod m)

tiene solución si y sólo si d |b. Si esta condición se cumple, entonces existen d solucio-nes distintas a la congruencia.

Demostración. Pasando a divisibilidad, vemos que la congruencia planteada es equi-valente a encontrar enteros x, y tales que

ax +my = b.

Notamos que el lado izquierdo es divisible por d , por lo que d |b es una condiciónnecesaria para la existencia de soluciones.

Escribamos a = d a′, b = db′, m = dm′; de paso notamos que por propiedadesdel MCD se sabe que a′ y m′ son coprimos. La congruencia original equivale a

a′X ≡ b′ (mod m′).

CAPÍTULO III. CONGRUENCIAS 50

En vista de que a′ y m′ son coprimos, a′ posee un inverso multiplicativo módulom′, es decir existe a tal que aa ≡ 1 (mod m). Multiplicando por a ambos lados dela congruencia resulta que podemos despejar X :

X ≡ ab′ (mod m′).

Se sigue que todas las soluciones de la congruencia necesariamente son de la forma

x = ab′+m′k

para k ∈Z. Recíprocamente, está claro que todos los x de la forma mostrada satis-facen la congruencia.

Por último, supongamos que ab′+m′k ≡ x = ab′+m′` (mod m). Esto equivalea m|m′(k −`), y puesto que m = m′d esto es lo mismo que d |k −`, es decir k ≡ `

(mod d). Por tanto existen d soluciones distintas módulo m. ■Ejemplo III.33 Resuelva 23X ≡ 7 (mod 91).

Solución. Comprobamos que (23,91) = 1, así que hay solución única a la congruencia-Notamos convenientemente que 4 ·23−91 = 1, a partir de lo cual se deduce que elinverso multiplicativo de 23 módulo 91 es 4. Así, X ≡ 4 ·7 ≡ 28 (mod 91). ■Ejemplo III.34 Resuelva 186X ≡ 374 (mod 422).

Solución. Comprobamos que (186,422) = 2, el cual divide a 374; se sigue que haydos soluciones. Dividiendo toda la congruencia por 2 llegamos a

93X ≡ 187 (mod 211).

Mediante el algoritmo de Euclides, deducimos que (93,211) = 1 y la correspondien-te relación de Bézout es 59 ·93−26 ·211 = 1. Se sigue que el inverso multiplicativode 93 módulo 211 es 59. Así,

X ≡ 59 ·187 ≡ 61 (mod 211).

Por tanto las dos soluciones buscadas son X ≡ 61 y X ≡ 61+211 ≡ 272 (mod 422).■

Teorema chino del resto

Un problema común en el álgebra a nivel escolar es la resolución de sistemas deecuaciones. De manera análoga, podemos preguntarnos sobre métodos de resolu-ción de sistemas de congruencias. El resultado más importante en esta direcciónconcierne a la resolución de sistemas de congruencias lineales: este es el famosoteorema chino del resto.*

*La atribución china en el nombre se debe a que la resolución completa del problema fue abordadaen el texto 數書九章 (“Tratado matemático en nueve secciones”) en el s. XIII.

CAPÍTULO III. CONGRUENCIAS 51

Teorema III.35 (Teorema chino del resto) Sean m1, . . . ,mr enteros positivos copri-mos dos a dos. Para cualesquiera enteros a1, . . . , ar el sistema de congruencias

X ≡ a1 (mod m1)

X ≡ a2 (mod m2)

...

X ≡ ar (mod mr )

posee una solución única módulo m1 · · ·mr .

Demostración. Sea m = m1 · · ·mr . Entonces m/m j es entero para cada j = 1, . . . ,r ,y además es coprimo con m j al ser producto de enteros coprimos con m j . Luegoexiste b j tal que

m

m jb j ≡ 1 (mod m j ).

Por otro lado, puesto que para todo i 6= j se cumple que mi |(m/m j ), está claro que

m

m jb j ≡ 0 (mod mi ).

Consideramos ahora el entero

x0 =r∑

j=1

m

m jb j a j .

En vista de las observaciones anteriores, x0 satisface para todo i = 1, . . . ,r

x0 ≡ m

mibi ai ≡ ai (mod mi ).

Por tanto x0 es una solución al sistema de congruencias. En cuanto a la unicidad,notamos que si x0, x1 son dos soluciones, por hipótesis se cumple que x0 ≡ x0 ≡ x1

(mod mi ) para todo i = 1, . . . ,r , y puesto que los módulos son coprimos podemosmultiplicarlos para obtener x0 ≡ x1 (mod m), que es lo que se pedía. ■Nota III.36 Los valores de a1, a2,. . . y de b1, b2, . . . son únicos salvo congruencia mó-dulo m1, m2, . . . por lo cual para aplicar el algoritmo podemos elegir cualesquieraenteros congruentes con ellos módulo m1, m2, . . . y siempre obtendremos la mismarespuesta, única módulo m. Esta elección es de utilidad a la hora de realizar cálculos.

Observemos que la condición de que los módulos del sistema sean coprimosdos a dos es necesaria: al no cumplirse esta condición, un sistema puede no tenersoluciones, o bien carecer de solución única.

Ejemplo III.37 Consideramos

X ≡ 29 (mod 52)

X ≡ 19 (mod 72)

CAPÍTULO III. CONGRUENCIAS 52

Notamos que (52,72) = 2. La primera congruencia implica que X ≡ 29 ≡ 1 (mod 4),mientras que la segunda X ≡ 19 ≡ 3 (mod 8). A su vez esto implica que X ≡ 3 (mod 4),lo cual es absurdo. Luego el sistema no tiene solución.

Ahora procedemos a revisar diversos ejemplos del algoritmo presentado duran-te la demostración del teorema.

Ejemplo III.38 Encuentre el menor positivo que resuelve el sistema

X ≡ 5 (mod 7)

X ≡ 7 (mod 11)

X ≡ 3 (mod 13)

Solución. Ante todo, comprobamos que los módulos son coprimos dos a dos. Usan-do la notación del teorema, tenemos que m1 = 7, m2 = 11, m3 = 13. Ahora escoge-mos a1 = 5, a2 = 7, a3 = 3. Los valores de b1, b2, b3 están determinados por lascongruencias

143b1 ≡ 1 (mod 7)

91b2 ≡ 1 (mod 11)

77b3 ≡ 1 (mod 13)

Despejando resulta que

b1 ≡−2 (mod 7)

b2 ≡ 4 (mod 11)

b3 ≡−1 (mod 13)

por lo cual podemos elegir b1 =−2, b2 = 4, b3 =−1. Por último, calculamos

x0 = 143(−2)(5)+91 ·4 ·7+77(−1)3 = 887.

Ya que la solución es única módulo 7·11·13 = 1001, concluimos que este es el menorentero positivo que resuelve el sistema. ä

Ahora veamos un segundo método elemental que suele ser una alternativa másrápida que el algoritmo en cálculos manuales. La idea consiste en sustitucionessucesivas: comenzamos expresando una de las congruencias como una igualdad,la sustituimos en otra, simplificamos y repetimos el proceso.†

Demostración. Partiendo de X ≡ 3 (mod 13) vemos que x = 13u+3 para algún en-tero u. Sustituyendo en la segunda congruencia queda

13u +3 ≡ 7 (mod 11)

†Nuevamente enfatizamos que los valores de a1, a2, . . . son únicos salvo congruencia, es decir pue-den ser reemplazados por otros valores con los que sean congruentes módulo m1, m2, . . . Por otro lado,el orden en que las congruencias son eliminadas es irrelevante, pero conviene tener en cuenta de queeliminar primero los módulos más grandes puede facilitar los cálculos.

CAPÍTULO III. CONGRUENCIAS 53

la cual se reduce a 2u ≡ 4 (mod 11), y cancelando el factor 2 queda u ≡ 2 (mod 11).Así, u = 11k + 2 para algún entero k, y sustituyendo en la ecuación inicial para xresulta que

x = 13(11k +2)+3 = 143k +29.

Sustituyendo esta igualdad en la primera congruencia queda

143k +29 ≡ 5 (mod 7)

la cual se reduce a 3k ≡ 4 (mod 7), y despejando queda k ≡ 5 ·4 ≡ 6 (mod 7). Estosignifica que k = 7`+6 para algún entero `. Concluimos que

x = 143(7`+6)+29 = 1001`+887. ■Ahora veamos cómo abordar sistemas que no satisfacen que los módulos sean

coprimos dos a dos.

Ejemplo III.39 Resuelva el sistema

X ≡ 3 (mod 10)

X ≡ 8 (mod 15)

X ≡ 5 (mod 84)

Demostración. Factorizando en primos cada módulo y separando cada congruen-cia obtenemos un segundo sistema

X ≡ 3 (mod 2)

X ≡ 3 (mod 5)

X ≡ 8 (mod 3)

X ≡ 8 (mod 5)

X ≡ 5 (mod 3)

X ≡ 5 (mod 4)

X ≡ 5 (mod 7)

Removiendo de esta lista aquellas congruencias que son redundantes, obtenemosun sistema para el cual sí aplica el teorema chino del resto:

X ≡ 2 (mod 3)

X ≡ 1 (mod 4)

X ≡ 3 (mod 5)

X ≡ 5 (mod 7)

Sean m1 = 3, m2 = 4, m3 = 5, m4 = 7. Escogemos a1 =−1, a2 = 1, a3 =−2, a4 =−2.Los valores de b1, b2, b3, b4 están determinados por las congruencias

140b1 ≡ 1 (mod 3)

105b2 ≡ 1 (mod 4)

84b3 ≡ 1 (mod 5)

60b4 ≡ 1 (mod 7)

CAPÍTULO III. CONGRUENCIAS 54

Despejando obtenemos

b1 ≡−1 (mod 3)

b2 ≡ 1 (mod 4)

b3 ≡−1 (mod 5)

b4 ≡ 2 (mod 7)

Así, podemos tomar b1 =−1, b2 = 1, b3 =−1, b4 = 2. Por tanto

x0 = 140(−1)(−1)+105 ·1 ·1+84(−1)(−2)+60 ·2(−2) = 173.

En vista de que 3·4·5·7 = 420, concluimos que el sistema original admite una únicasolución x ≡ 173 (mod 420). ä

El procedimiento anterior tiene el inconveniente de posiblemente aumentarel número de congruencias del sistema. En contraste, el método de sustitucionessucesivas puede ser más eficaz.

Demostración. Partiendo de X ≡ 5 (mod 84) escribimos x = 84u+5 para algún en-tero u. Sustituyendo en la segunda congruencia queda

84u +5 ≡ 8 (mod 15)

o bien 9u ≡ 3 (mod 15); dividiendo toda la congruencia por 3 resulta que 3u ≡ 1(mod 5), es decir u ≡ 2 (mod 5). Luego u = 5v +2 para algún entero v . Así,

x = 84(5v +2)+5 = 420v +173.

Sustituyendo en la primera congruencia queda 420v +73 ≡ 3 (mod 10), lo cual esuna congruencia idéntica, es decir válida para todo entero v . Concluimos que lasolución al sistema es x ≡ 173 (mod 420). ■

Notamos dos peculiaridades en el ejemplo anterior, que en general ocurren ensistemas que donde los módulos no son coprimos dos a dos: primero, la unicidadde la solución no es módulo m = m1 . . .mr , sino módulo [m1, . . . ,mr ]. Por otro lado,al efectuar las sustituciones sucesivas hubo algunas congruencias (la primera eneste caso) que fueron innecesarias para determinar la solución; esto se debe a quedicha congruencia puede deducirse a partir de las demás.

El teorema chino del resto y clases de congruencia

Veamos una manera más abstracta de plantear el teorema chino del resto. Paraello conviene introducir la noción formal de clase de congruencia.

Recordemos que hemos definido la relación de congruencia (módulo n) entredos enteros a y b como a ≡ b (mod n) si y sólo si n|a −b. Puede comprobarse queesta es una relación de equivalencia (reflexiva, simétrica y transitiva). Esto significa

CAPÍTULO III. CONGRUENCIAS 55

que la totalidad de los enteros queda dividida en clases de equivalencia, que ennuestro caso reciben el nombre de clases de congruencia módulo n:

0 = {−3n,−2n,−n,0,n,2n,3n, . . . }

1 = {−3n +1,−2n +1,−n +1,1,n +1,2n +1,3n +1, . . . }

2 = {−3n +2,−2n +2,−n +2,2,n +2,2n +2,3n +2, . . . }

...

n −1 = {−2n −1,−n −1,−1,n −1,2n −1,3n −1, . . . }

Observamos lo siguiente:

Todos los elementos en una misma clase son congruentes entre sí.

Cada entero pertenece a una y sólo una clase.

La unión de todas las clases es igual a Z.

Hay n clases de congruencia módulo n, cada una correspondiendo a un resi-duo en la división por n.

En la notación a, hemos elegido por conveniencia un representante de clase0 ≤ a < n, pero en principio podemos representar la misma clase por cual-quier otro elemento. Por ejemplo, n −1 =−1.

Definición III.40 Se define Z/nZ como el conjunto de clases de equivalencia de losenteros bajo la relación de congruencia módulo n. Usando la notación anterior,

Z/nZ= {0,1, . . . ,n −1}.

Regresando a la discusión del teorema chino del resto, supongamos que m1, . . . ,mr

son coprimos dos a dos y fijos, y sea m = m1 . . .mr . Dado un entero cualquiera x,podemos reducirlo módulo mi , obteniendo b ≡ ai (mod mi ) para cada i = 1, . . . ,r .Puesto que mi |m para todo i , vemos que los ai dependen sólo de la clase de x mó-dulo m. Luego tenemos una aplicación

Z/mZ→Z/m1Z×·· ·×Z/mrZ

x 7→ (a1, . . . , ar )

Dada una r -upla (a1, . . . , ar ), una inversa para esta aplicación no es otra cosa queuna solución al sistema de congruencias

X ≡ a1 (mod m1)

X ≡ a2 (mod m2)

...

X ≡ ar (mod mr )

El teorema chino del resto garantiza la existencia y unicidad de dicha solución. Enotras palabras, la aplicación mostrada arriba es biyectiva.

CAPÍTULO III. CONGRUENCIAS 56

Ejemplo III.41 Comprobemos la biyección Z/15Z ∼= Z/3Z×Z/5Z. La tabla a conti-nuación muestra los residuos módulo 15, ordenados de acuerdo a su residuo módulo3 (horizontal) y módulo 5 (vertical).

0 1 20 0 10 151 6 1 112 12 7 23 3 13 84 9 4 14

Concluimos la sección con una propiedad muy importante de la función deEuler.

Teorema III.42 La función de Euler es multiplicativa; en otras palabras, para cua-lesquiera enteros positivos coprimos m1 y m2

φ(m1m2) =φ(m1)φ(m2).

Demostración. Denotemos por (Z/mZ)∗ el conjunto de todas las clases a módulom tales que (a,m) = 1. Por el Lema III.15, sabemos que esta propiedad no depen-de del representante de la clase de congruencia. Notamos que la cardinalidad de(Z/mZ)∗ es justamente φ(m).

Ahora bien, para m = m1m2, el teorema chino del resto nos da una biyección

Z/mZ→Z/m1Z×Z/m2Z

Restringiéndose a las clases coprimas con m, obtenemos una biyección

(Z/mZ)∗ → (Z/m1Z)∗× (Z/m2Z)∗

Aquí el lado izquierdo tiene cardinalidad φ(m), mientras que el producto del ladoderecho tiene cardinalidad φ(m1)φ(m2). Por tanto φ(m) =φ(m1)φ(m2). ■

Lema de Hensel

La filosofía de Hensel es uno de los pilares de la teoría de números moderna, yaque introdujo el concepto de número p-ádico a las matemáticas.

Teorema III.43 (Hensel) Sea f ∈ Z[X ]. Suponga que a es una solución de f (X ) ≡ 0(mod p j ) que además satisface f ′(a) 6≡ 0 (mod p). Entonces existe t , único módulop, tal que

f (a + t p j ) ≡ 0 (mod p j+1).

Demostración.

CAPÍTULO III. CONGRUENCIAS 57

Lema III.44 (Expansión de Taylor) Para f ∈ Z[X ] de grado n y todo a ∈ Z existencoeficientes ck ∈Z tales que

f (X ) =n∑

k=0ck (X −a)k

donde los ck obedecen la fórmula

ck = f (k)(a)

k !.

Demostración. Mostramos primero la afirmación para las potencias f (X ) = X n . Enefecto, del teorema del binomio tenemos que

X n = (X −a +a)n =n∑

k=0

(n

k

)an−k (X −a)k

de donde podemos tomar ck = (nk

)an−k ; claramente todos estos coeficientes son

enteros. Ahora comprobamos la relación con las derivadas de f . En efecto,

f (k)(X ) = n(n −1) . . . (n −k +1)X n−k

de dondef (k)(a)

k !=

(n

k

)an−k = ck .

Para monomios f (X ) = bX n , simplemente multiplicamos la expansión anteriorpor b:

bX n =n∑

k=0

(n

k

)ban−k (X −a)k .

Así podemos tomar ck = (nk

)ban−k . Notamos que se sigue cumpliendo que ck ∈Z y

además ck = f (k)(a)/k ! puesto que la derivada es lineal.Finalmente, para polinomios arbitrarios, que son suma de varios monomios,

simplemente sumamos y reordenamos las expansiones de cada uno de ellos. Loscoeficientes correspondientes serán enteros, y la fórmula ck = f (k)/k ! seguirá sien-do válida por la linealidad de la derivada. äLema III.45 f (a + t p j ) ≡ f (a)+ t p j f ′(a) (mod p j+1).

Demostración. Aplicando la expansión del lema anterior y sustituyendo conve-nientemente X = a + t p j tenemos que

f (a + t p j ) =n∑

k=0ck p j k t k .

Vemos de inmediato que ck p j k ≡ 0 (mod p j+1) para k ≥ 2, de donde al reducir mó-dulo p j+1 quedan únicamente los términos correspondientes a k = 0,1, los cualesson f (a) y p j f ′(a)t . ä

CAPÍTULO III. CONGRUENCIAS 58

Regresando al Teorema, gracias al Lema anterior vemos que encontrar solucio-nes a la congruencia f (a+ t p j ) ≡ 0 (mod p j+1) es equivalente a encontrar solucio-nes de

f (a)+ f ′(a)p j t ≡ 0 (mod p j+1).

Pero por hipótesis a satisface f (a) ≡ (mod p j ), es decir f (a)/p j es entero. Luego,podemos dividir toda la congruencia por p j y reordenar para obtener

f ′(a)t ≡− f (a)

p j(mod p).

Esta es una congruencia lineal, que posee solución única puesto que f ′(a) es copri-mo con p. Llamando t0 a la solución para dicha congruencia, se sigue que a + t0p j

es una solución para f (X ) ≡ 0 (mod p j+1). ■Nota III.46 La solución x = a+t p j es única módulo p j+1. En efecto, si t ≡ t ′ (mod p)entonces a + t p j ≡ a + t ′p j (mod p j+1). Además, por construcción esta solución sa-tisface x ≡ a (mod p j ).

Para obtener un valor entero particular de t , podemos usar la fórmula

t = a − f (a)[ f ′(a)]−1

donde [ f ′(a)]−1 denota un entero que es inverso múltiplicativo módulo p de f ′(a).

La construcción realizada en la demostración anterior sugiere la siguiente ter-minología.

Definición III.47 Sean j < k. Sea a una solución de la congruencia f (X ) ≡ 0 (mod p j ).Decimos que una solución b de la congruencia f (X ) ≡ 0 (mod pk ) es un levanta-miento de a si b ≡ a (mod p j ).

Bajo esta terminología, el lema de Hensel da una receta para levantar una solu-ción módulo p j a una única solución módulo p j+1. Más, aplicando repetidas vecesel lema podemos levantar soluciones de f (X ) ≡ 0 (mod p) a soluciones módulopk .

Teorema III.48 Sea a una solución a la congruencia f (X ) ≡ 0 (mod p) tal que f ′(a) 6≡0 (mod p). Entonces para todo k existe una única solución b a la congruencia f (X ) ≡0 (mod pk ) que es un levantamiento de a.

Demostración. Sea a1 = a. Por hipótesis f ′(a1) 6≡ 0 (mod p), así que por el lema deHensel existe un único levantamiento a2 ≡ a1 (mod p) tal que f (a2) ≡ 0 (mod p2).

Ahora bien, la condición a2 ≡ a1 (mod p) implica que

f ′(a2) ≡ f ′(a1) 6= 0 (mod p),

así que podemos aplicar nuevamente el lema de Hensel para obtener un levanta-miento a3 ≡ a2 (mod p2) tal que f (a3) ≡ 0 (mod p3).

Iterando el procedimiento mostrado, obtenemos una sucesión a j tal que a1 =a, y para todo j ≥ 2 se cumple que a j ≡ a j−1 (mod p j−1) y f (a j ) ≡ 0 (mod p j ). Encada paso, cada levantamiento es único módulo p j y satisface a j ≡ a j−1 ≡ ·· · ≡ a1

(mod p). ■

CAPÍTULO III. CONGRUENCIAS 59

Es importante comprender que el teorema anterior nos dice cómo obtener to-das las soluciones de la congruencia f (X ) ≡ 0 (mod pk ), puesto que toda soluciónx a dicha congruencia es levantamiento de una solución a f (X ) ≡ 0 (mod p), asaber la reducción de x módulo p. Luego, al levantar las soluciones de f (X ) ≡ 0(mod p) obtendremos todas las soluciones a f (X ) ≡ 0 (mod pk ), y además la co-rrespondencia es biunívoca.

Nota III.49 (Método de Newton) La sucesión de enteros {a j } puede describirse demanera explícita a través de la relación de recurrencia a1 = a y

a j+1 = a j − f (a j ) f ′(a j )−1

donde f ′(a j )−1 denota el inverso módulo p de f ′(a j ). Esta ecuación sugiere una ana-logía con el método de Newton para encontrar aproximaciones a soluciones de ecua-ciones de la forma f (X ) = 0, donde f es una función diferenciable.

Ejemplo III.50 Encuentre una solución a la congruencia

X 2 +X +47 ≡ 0 (mod 343).

Solución. Comenzamos buscando soluciones a X 2 + X +47 ≡ 0 (mod 7). Hay dosde ellas: X ≡ 1,−2 (mod 7). Escogemos a1 = 1. Puesto que f ′(X ) = 2X +1, compro-bamos que se satisface f ′(a1) ≡ 3 6≡ 0 (mod 7), y más aún [ f ′(a1)]−1 ≡−2 (mod 7).Aplicando el lema de Hensel

a2 = 1−49 · (−2) ≡ 1 (mod 49).

Luego podemos elegir a2 = 1. Iterando una vez más resulta que

a3 = 1−49 · (−2) ≡ 99 (mod 343). ■

Ejemplo III.51 Decimos que un entero x es una raíz n-ésima de la unidad módulopk si xn ≡ 1 (mod pk ). Demuestre que para todo k ≥ 1 existen p − 1 raíces p − 1-ésimas de la unidad distintas módulo pk .

Demostración. Para k = 1, el pequeño teorema de Fermat garantiza que la con-gruencia X p−1 ≡ 1 (mod p) posee p − 1 soluciones. Sea a una de ellas; entonces(a, p) = 1. Definiendo f (X ) = X p−1 − 1 tenemos que f ′(X ) = (p − 1)X p−2, y asíf ′(a) ≡ −ap−2 6≡ 0 (mod p). Luego el Teorema III.48 garantiza que existe un úni-co levantamiento de a módulo pk . Por tanto la congruencia X p−1−1 ≡ 0 (mod pk )posee p − 1 soluciones, cada una de ellas congruente a un único residuo no nulomódulo p. ■

Congruencias módulo primo

Finalizamos con algunos comentarios generales sobre la resolución de con-gruencias módulo p. En general no existen métodos sistemáticos de resolución,pero se tienen varias propiedades interesantes.

CAPÍTULO III. CONGRUENCIAS 60

Recordemos que Z/pZ = {0, 1, . . . , p −1} denota el conjunto de clases de con-gruencia módulo p. En este contexto, suele usarse también la notación Fp .

La primera propiedad nos dice que, en general, es suficiente considerar con-gruencias de grado menor que p.

Teorema III.52 Suponga que

f (X ) ≡ 0 (mod p) (?)

es una congruencia de grado mayor que p. Entonces o bien es una congruencia idén-tica (es decir válida para todo x), o bien existe un polinomio g (X ) de coeficientesenteros tal que la congruencia g (X ) ≡ 0 (mod p) es de grado menor que p y posee lasmismas soluciones que (?).

Demostración. La prueba parte de la siguiente observación: existe un polinomiodistinguido, a saber

F (X ) = X p −X

tal que F (X ) ≡ 0 mod p es una congruencia idéntica. (Esto no es otra cosa que elpequeño teorema de Fermat.)

Ahora bien, efectuemos la división de f por X p −X para obtener

f (X ) = (X p −X )q(X )+ r (X )

donde q , r son polinomios de coeficientes enteros tales que r = 0 o bien 0 ≤ degr <p. Reduciendo módulo p, vemos que f (x) ≡ 0 (mod p) si y sólo si r (x) ≡ 0 (mod p),de donde la congruencia r (X ) ≡ 0 (mod p) posee las mismas soluciones que (?).

Por otro lado, al reducir r módulo p, tenemos dos posibilidades:

Todos los coeficientes de r son nulos módulo p. En este caso, r (X ) ≡ 0 (mod p)es idéntica, y por tanto (?) también.

Al menos un coeficiente de r es no nulo módulo p. En este caso, la congruen-cia r (X ) ≡ 0 (mod p) posee un grado bien definido, que es menor que p puesde entrada degr < p. ■

Ahora veamos que, módulo p, el número de soluciones de una congruencia estáacotado por su grado.

Teorema III.53 (Lagrange) Toda congruencia f (X ) ≡ 0 (mod p) de grado n posee alo sumo n soluciones.

Demostración. ■Deducimos un análogo del teorema de la identidad para polinomios de coefi-

cientes reales.

Corolario III.54 (Teorema de la identidad) Si f (X ) =∑nj=0 b j X j ≡ 0 (mod p) posee

más de n soluciones, entonces f es idénticamente nulo módulo p.

CAPÍTULO III. CONGRUENCIAS 61

Demostración. Supongamos que f no es idénticamente nulo módulo p. Entoncesexiste algún índice 0 ≤ k ≤ n tal que bk 6≡ 0 (mod p). Entonces la congruencia tienegrado a lo sumo k ≤ n. Por el teorema de Lagrange, puede tener a lo sumo k ≤ nsoluciones. Pero esto contradice la hipótesis de que existen más de n soluciones.

■Teorema III.55 La congruencia f (X ) ≡ 0 (mod p), con f mónico de grado n, poseen soluciones si y sólo si es un factor a X p −X módulo p, es decir

X p −X = f (X )q(X )+ps(X )

para ciertos polinomios de coeficientes enteros q y s.

Demostración. Primero asumimos que f (X ) ≡ 0 (mod p) posee n soluciones; en-tonces n ≤ p. Efectuando la división de X p −X por f , vemos que

X p −X = f (X )q(X )+ r (X ).

A partir de esta relación vemos que la congruencia original y r (X ) ≡ 0 (mod p) tie-nen las mismas soluciones. Pero r (X ) ≡ 0 (mod p) es una congruencia de gradomenor que n, pero tiene n soluciones. Luego por el teorema de la identidad r esidénticamente nulo módulo p, es decir r (X ) = ps(X ) para algún polinomio de co-eficientes enteros s(X ).

Ahora supongamos que X p − X = f (X )q(X )+ ps(X ). Usando el algoritmo dela división de ser necesario, podemos asumir que deg s < deg f . Ahora fijémonosen los monomios de mayor grado. A la izquierda tenemos a X p . A la derecha eltérmino de mayor grado en f es X n , y por tanto el término de mayor grado en q(X )es X p−n . Luego por el teorema de Lagrange las congruencias f (X ) ≡ 0 (mod p)y q(X ) ≡ 0 (mod p) poseen a lo sumo n y p −n soluciones, respectivamente. Porotro lado, por el teorema de Fermat la congruencia f (X )q(X ) ≡ 0 (mod p) posee psoluciones, pero por el lema de Euclides cada una de estas soluciones es soluciónde f (X ) ≡ 0 (mod p) o bien q(X ) ≡ 0 (mod p). Por tanto el número de solucionesde estas congruencias es exactamente n y p −n, respectivamente. ■Corolario III.56 Si d |p −1, entonces X d ≡ 1 (mod p) posee d soluciones.

Demostración. Puede comprobarse que X d −1|X p −X . ■Ejemplo III.57 (Teorema de Wolstenholme) Sea p ≥ 5. Suponga que

1

1+ 1

2+·· ·+ 1

p −1= a

b.

Demuestre que p2|a.

Demostración. Daremos dos pruebas: una ilustrando las técnicas recién discuti-das, y otra elemental pero mucho más ingeniosa.

CAPÍTULO III. CONGRUENCIAS 62

Comenzamos notando que al efectuar la suma de las fracciones en cuestiónobtenemos

1

1+ 1

2+·· ·+ 1

p −1= σp−2

(p −1)!,

donde σp−2 denota las sumas de todos los posibles productos de p − 2 númerostomados de entre 1,2, . . . , p −1.

Ahora bien, puesto que (p − 1)! no posee ningún factor p, para establecer elresultado es suficiente establecer que p2|σp−2. Para ello definimos el polinomio

f (X ) = X (X −1)(X −2) . . . (X −p +1).

Este es un polinomio mónico de grado p, que por construcción tiene p raíces 0,1, . . . , p−1. Invocando el Teorema III.55 deducimos que

X p −X = f (X )q(X )+ps(X )

para ciertos polinomios q y s con deg s < deg f . Pero f es mónico de grado p, porlo cual forzosamente q(X ) = 1. Esto quiere decir que

X p −X ≡ X (X −1)(X −2) . . . (X −p +1) (mod p).

Cancelando el factor común X a ambos lados obtenemos asimismo

X p−1 −1 ≡ (X −1)(X −2) . . . (X −p +1) (mod p).

Ahora expandimos el producto del lado derecho usando las relaciones de Vieta:

X (X −1)(X −2) . . . (X −p +1) = X p−1 −σ1X p−2 +·· ·−σp−2X + (p −1)!

Sustituyendo X = p a ambos lados obtenemos

(p −1)! = pp−1 −σ1pp−2 +·· ·−σp−2p + (p −1)!

y cancelando (p −1)! a ambos lados resulta que

pp−1 −σ1pp−2 +·· ·+σp−3p3 −σp−2p = 0.

Cancelando el factor p común p en el lado izquierdo arribamos a

pp−2 −σ1pp−3 +·· ·+σp−3p2 −σp−2 = 0.

Ya que todos los términos aparte de σp−2 son divisibles por p2, se concluye queσp−2 también es divisible por p2. äDemostración. La segunda demostración contiene ideas similares al Ejemplo III.10.Para 1 ≤ j ≤ (p −1)/2, consideramos el emparejamiento

1

j+ 1

p − j= p

j (p − j ).

CAPÍTULO III. CONGRUENCIAS 63

Se sigue quep−1∑j=1

1

j= p

(p−1)/2∑j=1

1

j (p − j ).

Luego para establecer lo pedido, es suficiente demostrar que

(p−1)/2∑j=1

1

j (p − j )≡ 0 (mod p)

donde notamos que todas las fracciones del miembro izquierdo están definidasmódulo p, al ser todos los denominadores coprimos con p. Reduciendo cada frac-ción módulo p obtenemos

(p−1)/2∑j=1

1

j (p − j )≡−

(p−1)/2∑j=1

1

j 2 (mod p). (?)

Por otro lado, notamos que todo cuadrado no nulo módulo p debe ser congruentea

12,22, . . . ,

(p −1

2

)2

.

En particular, cada 1/ j 2 = (1/ j )2 es congruente a uno de estos residuos. Más aún,si dos índices j ,k satisfacen 1/ j 2 ≡ 1/k2 (mod p), entonces j 2 ≡ k2 (mod p), esdecir j ≡ k or j ≡ −k (mod p), pero la segunda alternativa es imposible pues 1 ≤j ,k ≤ (p −1)/2. En conclusión, los p −1 números 1/ j 2, donde 1 ≤ j ≤ (p −1)/2, sontodos distintos módulos p, y por lo tanto al reducirlos módulo p obtendremos unapermutación de los residuos (?). En particular,

(p−1)/2∑j=1

1

j 2 ≡(p−1)/2∑

j=1j 2 ≡ p(p −1)(p +1)

24(mod p).

Finalmente, puesto que p ≥ 5, el factor p del numerador no se cancela con el de-nominador, así que concluimos que

(p−1)/2∑j=1

1

j 2 ≡ 0 (mod p). ■

Bibliografía

[1] John P. D’Angelo and Douglas B. West, Mathematical thinking: Problem-solvingand proofs, 2 ed., Prentice Hall, 2000.

[2] Enzo R. Gentile, Aritmética elemental, Serie de Matemática, no. 25, SecretaríaGeneral de la Organización de los Estados Americanos, Programa Regional deDesarrollo Científico y Tecnológico, 1985.

[3] Ivan Niven, Herbert S. Zuckerman, and Hugh L. Montgomery, An introductionto the theory of numbers, 5 ed., John Wiley & Sons, 1991.

64