Sie sind auf Seite 1von 64

Apuntes de Teorı́a Elemental de Números

Giancarlo Lucchini
2018

Índice
1. Los enteros 2
1.1. Buen orden e inducción . . . . . . . . . . . . . . . . . . . . . . . . . 2
1.2. División euclideana y divisibilidad . . . . . . . . . . . . . . . . . . . 3
1.3. La identidad de Bézout . . . . . . . . . . . . . . . . . . . . . . . . . 6
1.4. El Teorema Fundamental de la Aritmética . . . . . . . . . . . . . . 10
1.5. Valuación p-ádica . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
1.6. Más sobre números primos . . . . . . . . . . . . . . . . . . . . . . . 14

2. Congruencias 18
2.1. Definiciones y propiedades básicas . . . . . . . . . . . . . . . . . . . 18
2.2. Inversos e idempotentes módulo n . . . . . . . . . . . . . . . . . . . 20
2.3. El Teorema Chino de los Restos . . . . . . . . . . . . . . . . . . . . 23
2.4. El Lema de Hensel . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
2.5. El grupo (Z/nZ)∗ de unidades módulo n . . . . . . . . . . . . . . . 33

3. Cuadrados 39
3.1. Triples pitagóricos . . . . . . . . . . . . . . . . . . . . . . . . . . . 40
3.2. Descenso infinito y la ecuación de Fermat . . . . . . . . . . . . . . . 43
3.3. Sumas de dos cuadrados . . . . . . . . . . . . . . . . . . . . . . . . 45
3.4. Los enteros de Gauss . . . . . . . . . . . . . . . . . . . . . . . . . . 49
3.5. Interludio: Piezas de ajedrez y algoritmo de la división . . . . . . . 58
3.6. De vuelta a las sumas de dos cuadrados . . . . . . . . . . . . . . . . 59
3.7. Sumas de cuatro cuadrados . . . . . . . . . . . . . . . . . . . . . . 62

1
1. Los enteros
Los enteros naturales son el conjunto ordenado N = {1, 2, 3, . . .}. Es sobre este
conjunto, o más generalmente sobre el anillo (conmutativo, unitario) de los enteros
Z = {. . . , −2, −1, 0, 1, 2, . . .} que se basa toda la aritmética.

1.1. Buen orden e inducción


Todo comienza con el siguiente axioma, que como todo axioma, admitiremos
sin mayor discusión:

Axioma (Axioma del buen orden). Para todo subconjunto no vacı́o S ⊂ N, existe
un elemento minimal, es decir un x ∈ S tal que, para todo y ∈ S, x ≤ y.

A partir de este axioma, podemos demostrar el famoso principio de inducción.


Dada una propiedad P de los enteros naturales, escribimos P (n) si n verifica P y
P̄ (n) si no.

Teorema 1.1.1 (Principio de inducción). Sea P una propiedad de los enteros


naturales. Supongamos que

1. P (1);

2. P (k) ⇒ P (k + 1) para todo k ∈ N.

Entonces tenemos P (k) para todo k ∈ N.

Demostración. Supongamos por contradicción que existen enteros k ∈ N para los


cuales P̄ (k) y sea S el subconjunto de todos ellos. Tenemos entonces que S es no
vacı́o por hipótesis. El axioma del buen orden nos dice ahora que existe un k0 ∈ S
minimal. Como sabemos que P (1) por la primera propiedad, vemos que k0 6= 1,
por lo que k0 − 1 ∈ N. Además, k0 − 1 6∈ S ya que k0 es minimal. Esto implica que
P (k0 − 1) y por lo tanto, por la segunda propiedad, P (k0 ), pero esto contradice
P̄ (k0 ), lo que concluye la demostración. ^¨

Ejercicio. De forma similar, demuestre el principio de inducción generalizado:


Sea P una propiedad de los enteros naturales. Supongamos que

1. P (1);

2. P (1), P (2), . . . , P (k) ⇒ P (k + 1) para todo k ∈ N.

Entonces tenemos P (k) para todo k ∈ N.

2
Observación.
El axioma del buen orden y el principio de inducción generalizado son de hecho
equivalentes, por lo que uno puede tomar el segundo como axioma si le parece más
sensato y demostrar el primero a partir de él como sigue:
Probaremos que, si S no admite un elemento minimal, entonces S = ∅. Clare-
mente 1 6∈ S, ya que de lo contrario 1 serı́a un elemento minimal. Por otra parte,
supongamos que n 6∈ S para todo 1 ≤ n ≤ k. Entonces, para todo m ∈ S, se tiene
que k + 1 ≤ m. Por lo tanto, si k + 1 ∈ S, vemos que k + 1 es un elemento minimal,
lo cual no es posible. Concluimos pues que k + 1 6∈ S si n 6∈ S para todo 1 ≤ n ≤ k.
El principio de inducción generalizado aplicado a la propiedad P (k) =“k 6∈ S”, nos
dice entonces que k 6∈ S para todo k ∈ N, lo que equivale a decir que S = ∅.

1.2. División euclideana y divisibilidad


Habiendo demostrado el principio de inducción en sus dos versiones, estamos
listos para probar uno de los teoremas más fundamentales de la aritmética de N.
Teorema 1.2.1 (División euclideana). Sean a, b ∈ N. Entonces existen únicos
enteros q, r ≥ 0 tales que
a = qb + r, 0 ≤ r < b.
Demostración. Para b = 1, la existencia es evidente: r = 0 y q = a. Fijemos
entonces b ≥ 2. Usaremos el principio de inducción generalizado sobre a para
probar la existencia de q y r.
Si a = 1, entonces podemos tomar q = 0 y r = 1. Supongamos ahora que el
enunciado es cierto para todo valor más pequeño que a y probemos que es cierto
para a. Si a < b, basta com tomar q = 0 y r = a. Si a = b, basta con tomar q = 1
y r = 0. Y si a > b, podemos considerar a − b ∈ N, que es menor que a, por lo que
existen q 0 , r0 ∈ N0 tales que
a − b = q 0 b + r0 , 0 ≤ r0 < b.
Vemos entonces que
a = (q 0 + 1)b + r0 , 0 ≤ r0 < b.
Esto prueba que el enunciado es cierto también para a y concluye la demostración
por inducción.

Para probar la unicidad de q y r, supongamos que


a = qb + r = q 0 b + r0 , 0, ≤ r, r0 < b.
Sin pérdida de generalidad, supongamos que q ≥ q 0 . Entonces (q − q 0 )b = r0 − r,
pero r0 − r ≤ r0 < b y (q − q 0 )b ≥ b si q > q 0 , lo que contradice la igualdad. Vemos

3
entonces que q = q 0 , por lo que r0 − r = 0, es decir r = r0 , lo que prueba la unicidad
del par q, r. ^¨

Concentrémonos ahora en el caso particular donde r = 0.

Definición 1.2.2. Sean a, b ∈ Z. Decimos que b divide a a y escribimos b|a si


existe q ∈ Z tal que a = qb. También podemos decir que a es un múltiplo de b, o
que a es divisible por b, o incluso que b es un divisor de a.
Decimos que un entero p ≥ 2 es un número primo si los únicos divisores de p
son el conjunto {1, −1, p, −p}. De lo contrario, decimos que p es compuesto.

Proposición 1.2.3. La divisibilidad posee las siguientes propiedades:

1. Todo a ∈ Z divide a 0.

2. Todo a ∈ Z es un múltiplo de 1 y de −1.

3. Todo a ∈ Z es divisible por a y por −a.

4. Si a|b y b|c, entonces a|c.


Pn
5. Si a|b1 , . . . , a|bn , entonces a|( i=1 ci bi ) para toda elección de c1 , . . . , cn ∈ Z.

6. Si a|b y a, b > 0, entonces a ≤ b.

7. Si a|b y b|a, entonces a = ±b.

Demostración. Ejercicio ^
¨ ^
¨

Ejercicio. Sean x, y ∈ N. Demuestre que 2x + 3y es divisible por 7 si y sólo si


5x + 4y lo es.

Ejercicio. ¿Cuáles son los n ∈ N tales que n2 + 1 divide a n + 1?

Recordemos ahora el concepto de máximo común divisor.

Proposición 1.2.4. Sean a, b ∈ N. Entonces existe un único d ∈ N tal que:

1. d|a y d|b;

2. para todo e ∈ N tal que e|a y e|b, e ≤ d.

Para demostrar esta proposición necesitaremos el siguiente algoritmo:

4
Algoritmo de división euclideana

Comenzamos con u0 := a y v0 := b y escribimos u0 = q0 v0 + r0 con 0 ≤ r0 <


v0 , como nos lo permite la división euclideana.

Para cada i ≥ 0, definimos ui+1 := vi y vi+1 := ri y escribimos ui+1 =


qi+1 vi+1 + ri+1 con 0 ≤ ri+1 < vi+1 . Nótese que esto sólo se puede hacer si
vi+1 = ri 6= 0.

Por lo tanto, detenemos el algoritmo cuando rj = 0 para algún j ∈ N.

Lema 1.2.5. El algoritmo de división euclideana se detiene, es decir, existe j ∈ N


tal que rj = 0.

Demostración. Nótese que ri+1 < vi+1 = ri y por lo tanto ri+1 ≤ ri − 1 para todo
i ≥ 0. Vemos entonces que el algoritmo se detendrá en a lo más r0 + 1 pasos. ^ ¨

Demostración de la Proposición 1.2.4. La unicidad de d surge de forma evidente


de su propiedad 2: si d y d0 son dos números que verifican 1 y 2, entonces d ≤ d0 y
d0 ≤ d, por lo que d = d0 . Debemos pues mostrar la existencia de d. Apliquemos el
algoritmo de división euclideana a a y b y definamos j ∈ N de forma que rj = 0.
Queremos demostrar que d = vj .
Demostraremos primero que vj |ui y vj |vi para todo 0 ≤ i ≤ j. Por definición
de j, tenemos que uj = qj vj , por lo que vj |uj y claramente vj |vj . Supongamos
ahora que vj |uj−i y vj |vj−i para algún i ≥ 0. Como vj−(i+1) = uj−i , tenemos que
vj |vj−(i+1) y además

uj−(i+1) = qj−(i+1) vj−(i+1) + rj−(i+1) = qj−(i+1) vj−(i+1) + vj−1 ,

por lo que vj |ui−1 . Por inducción, obtenemos la afirmación del comienzo. Como
a = u0 y b = v0 , obtenemos que vj |a y vj |b.
Sea ahora e ∈ N tal que e|a y e|b. Debemos demostrar que e ≤ vj . Demostra-
remos por inducción que e|ui y e|vi para todo 0 ≤ i ≤ j. Por definición, tenemos
que e|u0 y e|v0 . Supongamos ahora que e|ui y e|vi para algún i. Como ui+1 = vi ,
tenemos que e|ui+1 y además

vi+1 = ri = ui − qi vi ,

por lo que e|vi+1 . Esto concluye la inducción, por lo que probamos en particular
que e|vj y entonces e ≤ vj , lo que concluye la demostración de d = vj . ^
¨

Dada la unicidad del número d de la Proposición 1.2.4, podemos dar la siguiente


definición.

5
Definición 1.2.6. Sean a, b ∈ N. Definimos el máximo común divisor de a y b,
anotado mcd(a, b) o simplemente (a, b), como el d ∈ N de la Proposición 1.2.4, es
decir el más grande d ∈ N tal que d|a y d|b.

Observación.
Nótese que, dada la demostración de la existencia de (a, b), el algoritmo de división
euclideana nos permite calcular explı́citamente este número a partir de a y b:
se trata del último resto no nulo (vj = rj−1 ). Esto nos dice rápidamente que
(a, b) = (b, r) si a = qb + r con q, r ∈ N y 0 ≤ r < b. Una generalización es la
siguiente proposición.

Proposición 1.2.7. Sean a, b ∈ N y supongamos que a = qb + r con q, r ∈ N.


Entonces (a, b) = (b, r).

Demostración. Definamos d := (a, b) y demostremos que es también el mcd de b y


r. Como d|a y d|b, vemos inmediatamente que d|r. Sea ahora e ∈ N tal que e|b y
e|r. Entonces claramente e|a y e|b, por lo que e ≤ d ya que d es el mcd de a y b.
Esto prueba que (b, r) = d. ^¨

De forma análoga podemos definir el mı́nimo común múltiplo, pero la demostra-


ción de su existencia será mucho más fácil cuando hayamos demostrado el Teorema
Fundamental de la Aritmética. Para llegar a esto, necesitaremos unos cuantos re-
sultados suplementarios. Nótese que la definición del mcd podrı́a haber esperado
también hasta ese punto, pero la demostración de su existencia usando la división
euclideana tiene un interés propio.

Ejercicio. Demuestre que (x, y)|(ax+by, cx+dy)|(ad−bc)(x, y) para a, b, c, d, x, y ∈


N.

1.3. La identidad de Bézout


El primer resultado suplementario se trata de una aplicación de la última pro-
posición.

Teorema 1.3.1 (Bézout). Sean a, b, c ∈ N. Entonces existen m, n ∈ Z tales que


am + bn = c si y sólo si (a, b)|c.

Demostración. Definamos d := (a, b) y supongamos que tenemos la igualdad am +


bn = c. Como d|a y d|b, vemos inmediatamente que d|c, lo que prueba un sentido
del teorema.
Veamos ahora el sentido opuesto. Demostraremos primero que existen m, n ∈ N
tales que am + bn = d y luego veremos el caso de un c cualquiera tal que d|c.
Procederemos por inducción sobre el valor de la suma k := a + b, comenzando
por k = 2. Claramente en este caso a = b = 1 y por tanto d = 1, en cuyo caso m = 1

6
y n = 0 bastan para obtener la igualdad deseada. Supongamos ahora que a + b = k
y que el teorema vale para todo par a0 , b0 ∈ N tales que a0 + b0 < k. Sin pérdida
de generalidad, supongamos que a ≥ b y escribamos a = qb + r con 0 ≤ r < b (y
por lo tanto q > 0). La Proposición 1.2.7 nos dice entonces que d = (b, r). Como
r < b ≤ a, tenemos que b + r < k y podemos aplicar la hipótesis de inducción a
este par. Existen pues m0 , n0 ∈ Z tales que bm0 + rn0 = d. Reemplazando r por
a − qb obtenemos entonces

bm0 + (a − qb)n0 = d
an0 + b(m0 − q)d,

y por lo tanto tenemos la igualdad con m = n0 ∈ Z y n = m0 − q ∈ Z.


Veamos finalmente el caso de c ∈ N tal que d|c. Podemos escribir entonces
c = de con e ∈ N y am + bn = d para ciertos m, n ∈ Z. Tenemos entonces
inmediatamente que ame + bne = de = c y me, ne ∈ Z, lo que concluye la demos-
tración. ^
¨

La identidad de Bézout es precisamente la igualdad

am + bn = d,

donde d = (a, b). El problema de la demostración precedente es que no nos ofrece


una manera de encontrar explı́citamente los enteros m, n ∈ Z de la identidad de
Bézout. Sin embargo, si uno mira en detalle la demostración por inducción y la
desglosa completamente, uno se da cuenta de que estamos usando el algoritmo de
división euclideana para obtener dichos enteros. En efecto, pasar del par u0 = a,
v0 = b al par u1 = b, v1 = r es exactamente el primer paso del algoritmo. Al repetir
esto hasta llegar a un par uj , vj en el cual rj = 0, vemos fácilmente que (uj , vj ) = vj
y a partir de éste se calculan los otros mcd.

Ejemplo 1.3.2. Calculemos el máximo común divisor de 148 y 256. Comenzamos


dividiendo 256 por 148.
256 = 1 · 148 + 108.
A continuación dividimos el divisor por el resto, e iteramos:

148 = 1 · 108 + 40
108 = 2 · 40 + 28
40 = 1 · 28 + 12
28 = 2 · 12 + 4
12 = 3 · 4 + 0.

7
Vemos entonces que el máximo común divisor de 148 y 256 es 4. Para encontrar
m y n podemos proceder de la siguiente manera:
4 = 1 · 28 − 2 · 12
4 = 1 · 28 − 2 · (1 · 40 − 1 · 28) = 3 · 28 − 2 · 40
4 = −2 · 40 + 3 · (1 · 108 − 2 · 40) = 3 · 108 − 8 · 40,
4 = 3 · 108 − 8 · (1 · 148 − 1 · 108) = 11 · 108 − 8 · 148
4 = −8 · 148 + 11 · (1 · 256 − 1 · 148) = 11 · 256 − 19 · 148.
Luego 4 = 11 · 256 − 19 · 148.
Ejercicio. Sean a, b, c ∈ N tales que ningún entero d ≥ 2 divide simultáneamente
a los tres. Pruebe que existen `, m, n ∈ Z tales que a` + bm + cn = 1.

Un algoritmo simplificado Existe sin embargo una forma más rápida de pro-
ceder, la cual toma cuenta de los reemplazos hechos en la segunda parte a medida
que bajamos en la primera (y por ende nos evita tener que “bajar y subir”). La idea
es ir escribiendo cada uno de los restos ri como combinación lineal ami + bni = ri ,
partiendo por r0 = u0 − q0 v0 = a − q0 b. Para lograrlo, tenemos que mantener un
registro de los qi que hasta ahora habı́amos ignorado. En efecto, sabemos que
ui+1 = qi+1 vi+1 + ri+1 , con vi+1 = ri , ui+1 = ri−1 .
Entonces, si ya definimos mi , ni , mi−1 , ni−1 , vemos que
ri+1 = ui+1 − qi+1 vi+1 = ri−1 − qi+1 ri
= ami−1 + bni−1 − qi+1 (ami + bni )
= a(mi−1 − qi+1 mi ) + b(ni−1 − qi+1 ni ),
por lo que obtenemos la relación de recurrencia
mi+1 := mi−1 − qi+1 mi , ni+1 := ni−1 − qi+1 ni . (1)
Evidentemente, esto sólo tiene sentido si i ≥ 1 ya que comenzamos en r0 con m0 = 1
y n0 = −q0 . Pero si recordamos que ri−1 = vi durante todo el algoritmo, entonces
vemos claramente que el r−1 que nos hace falta es nada menos que b = 0 · a + 1 · b,
por lo que m−1 = 0 y n−1 = 1 bastan para lograr el trabajo. Aplicando la misma
idea, podemos ver que r−2 = a y por ende podemos definir m−2 = 1 y n−2 = 0,
con lo que llegamos a un algoritmo que comienza con la siguiente tabla
Cociente Resto mi ni
i = −2 a 1 0
i = −1 b 0 1
.. ..
i=0 q0 r0 . .

8
Y ası́, en la (i + 1)-ésima fila, agregamos el cociente qi+1 , el resto ri+1 , y los
nuevos valores mi+1 y ni+1 según lo indicado en la fórmula de recurrencia (1).

Ahora que sabemos bajo qué condiciones podemos encontrar m, n ∈ Z tales


que am + bn = c, podemos preguntarnos lo siguiente: ¿Cuál es el conjunto S de
soluciones de esta ecuación? El Teorema 1.3.1 nos dice que S 6= ∅ si y sólo si (a, b)|c.
Supongamos pues que d := (a, b) divide a c y consideremos dos soluciones {m0 , n0 }
y {m1 , n1 } en S. Podemos entonces restar las dos igualdades para obtener:
a(m0 − m1 ) + b(n0 − n1 ) = c − c = 0.
Sean a0 , b0 ∈ N tales que a = da0 y b = db0 . Entonces, dividiendo por d tenemos
que:
a0 (m0 − m1 ) + b0 (n0 − n1 ) = 0.
Nótese ahora que (a0 , b0 ) = 1. En efecto, d(a0 , b0 ) divide tanto a a = da0 como
a b = db0 , por lo que d(a0 , b0 ) ≤ d y entonces (a0 , b0 ) = 1. Vemos entonces que
todo divisor primo de b0 no divide a a0 , pero divide a a0 (m0 − m1 ), por lo que
divide a m0 − m1 por el Lema de Gauss (Lema 1.4.2, el cual demostraremos en la
siguiente sección). Iterando este procedimiento, tenemos que b0 |(m0 − m1 ), es decir
m0 − m1 = b0 e con e ∈ Z, con lo que obtenemos
a0 b0 e + b0 (n0 − n1 ) = 0,
y por lo tanto
n1 − n0 = a0 e.
Vemos entonces que, para toda solución {m1 , n1 } ∈ S,
m1 = m0 − b0 e y n1 = n0 + a0 e.
Con esto, hemos demostrado la parte más difı́cil de la siguiente proposición.
Proposición 1.3.3. Sean a, b, c ∈ N tales que (a, b)|c y sean m0 , n0 ∈ Z tales que
am0 + bm0 = c. Entonces el conjunto S de los pares m, n ∈ Z tales que am + bn = c
está dado por
S = {{m0 − b0 e, n0 + a0 e} | e ∈ Z},
donde a0 = a
(a,b)
y b0 = b
(a,b)
.
Demostración. El análisis que precede nos demuestra que S está contenido en el
conjunto de la derecha. Ahora, sea e ∈ Z. Tenemos que
a(m0 − b0 e) + b(n0 + a0 e) = am0 + bn 0 − ab0 e + ba0 e = c − ab0 e + ba0 e.
Recordando que a = a0 (a, b) y b0 = b(a, b), obtenemos finalmente
a(m0 − b0 e) + b(n0 + a0 e) = c − a0 b0 (a, b)e + a0 b0 (a, b)e = c,
lo que prueba que {m0 − b0 e, n0 + a0 e} ∈ S y tenemos por lo tanto la igualdad. ^
¨

9
1.4. El Teorema Fundamental de la Aritmética
Se trata del siguiente enunciado, que uno tiende a tomar por evidente, pero que
necesita todo el trabajo previo.
Teorema 1.4.1 (Teorema Fundamental de la Aritmética). Sea n Q∈
m
N con n ≥ 2.
Entonces existen p1 , . . . , pm ∈ N números primos tales que n = i=1 pi . Además,
esta escritura es única salvo reordenamiento, es decir, si
m
Y k
Y
n= pi = qj ,
i=1 j=1

con q1 , . . . , qj primos, entonces m = k y, salvo reordenamiento, pi = qi para todo


1 ≤ i ≤ m.
Observación.
Evidentemente, todo tal producto se puede escribir de la forma n = ki=1 pαi i
Q
agrupando los primos iguales entre sı́. Si optamos por esta presentación es para
volver más cómoda la demostración que sigue.
Demostración. Demostremos primero la existencia de una tal descomposición en
producto de primos. Haremos esto por inducción. Notemos que 2 es un número
primo y por ende la descomposición existe para él (m = 1, p1 = 2). Supongamos
ahora que la descomposición existe para todo entero estrictemente menor que n y
demostremos su existencia para n.
Si n es primo, entonces tenemos la existencia por la misma razón que para 2.
De lo contrario, n es compuesto, lo que significa que tiene un divisor natural a
distinto de 1 y n. En particular, tenemos que b := na ∈ N y 1 < a, b < n. Por
hipótesis de inducción, sabemos que a = ki=1 qi b = `j=1 rj para ciertos primos
Q Q
q1 , . . . , qk , r1 , . . . , r` . Tenemos entonces que
m
Y
n = ab = q1 · · · qk r1 · · · r` = pi ,
i=1

con pi = qi para 1 ≤ i ≤ k y pi = ri−k para k + 1 ≤ i ≤ k + `. Esto prueba la


existencia de la descomposición en números primos.

Veamos ahora la unicidad. Para esto necesitamos el siguiente:


Lema 1.4.2 (Lema de Gauss). Sean a, b, p ∈ N con p primo. Si p|ab, entonces p|a
ó p|b.
Demostración. Si p|a, terminamos la demostración, por lo que podemos suponer
que p - a y debemos demostrar que p|b. Como p no es un divisor de a y los únicos

10
divisores en N de p son 1 y p, vemos que (a, p) = 1. El Teorema de Bézout 1.3.1
nos dice entonces que existen m, n ∈ Z tales que am + pn = 1. Multiplicando por
b obtenemos:
abm + pbn = b.
Ahora, p|ab y p|p, por lo que p divide al lado izquierdo de la ecuación. Concluimos
pues que p|b como querı́amos demostrar. ^
¨

Con el Lema de Gauss a la mano, demostremos ahora la unicidad por inducción.


Para n = 2, esto es evidente ya que se trata de un número primo. Consideremos
ahora un n ∈ N cualquiera y supongamos demostrada la unicidad para todo m < n.
Supongamos que hay dos posibles escrituras de n como producto de primos:
m
Y k
Y
n= pi = qj .
i=1 j=1

Vemos entonces que pm |n y por lo tanto pm | kj=1 qj . Una aplicación iterada del
Q
Lema de Gauss (que podrán mostrar como ejercicio) nos dice entonces que existe
un 1 ≤ j0 ≤ k tal que pm |qj0 . Como qj0 es primo, sus únicos divisores en N son 1 y
qj0 y, como pm es primo, pm 6= 1, por lo que pm = qj0 . Reordenando el conjunto de
los qj , podemos suponer que j0 = k, por lo que pm = qk . Definiendo n0 := pnm = qnk ,
vemos que
m−1
Y k−1
Y
0
n = pi = qj .
i=1 j=1

Como n0 < n (recordemos que pm > 1), la hipótesis de inducción nos dice que
m − 1 = k − 1 y, salvo reordenamiento, pi = qi para todo 1 ≤ i ≤ m − 1. Esto más
la igualdad pm = qk prueban la unicidad. ^¨

1.5. Valuación p-ádica


La valuación p-ádica es una herramienta muy útil para ciertos argumentos en
teorı́a de números y está a la base de los famosos números p-ádicos. Si bien no
hablaremos de éstos últimos en este curso (véase los apuntes de cursos anteriores
dados por Luis Arenas), vale la pena detenerse en este concepto un segundo ahora
que demostramos el Teorema Fundamental de la Aritmética.

Definición 1.5.1. Sean p, n ∈ N con p primo. La valuación p-ádica de n es el


entero k ∈ N0 más grande tal que pk |n. Se le denota por vp (n). Si n = 0, se dice
que vp (0) = ∞ por convención.

Veamos algunas propiedades de esta valuación.

11
Proposición 1.5.2. Sea p un número primo y sean m, n ∈ N.
Qk
1. Si la descomposición de n en factores primos es n = i=1 pαi i , entonces
vp (n) = αi si p = pi y vp (n) = 0 si p 6= pi para todo i

2. Si m|n, entonces vp (m) ≤ vp (n). En sentido inverso, si vp (m) ≤ vp (n) para


todo primo p, entonces m|n.

3. vp ((m, n)) = mı́n(vp (m), vp (n)).

4. vp (mn) = vp (m) + vp (n).

5. vp (m + n) ≥ mı́n(vp (m), vp (n)).

Demostración. La propiedad 1 es inmediata y la propiedad 2 se deduce fácilmente


del Teorema Fundamental de la Aritmética y del Lema de Gauss. La propiedad 3
se deduce de la propiedad 2 y de la definición del mcd. La propiedad 4 viene de la
propiedad 1.
Finalmente, para la propiedad 5, sea ` = mı́n(vp (m), vp (n)). Como pvp (m) |m y
pvp (n) |n, tenemos que p` divide a m y a n, por lo que divide a m + n. Esto prueba
que vp (m + n) ≥ `. ^¨

Con estas propiedades, la definición del mı́nimo común múltiplo se vuelve una
trivialidad.

Proposición 1.5.3. Sean a, b ∈ N. Entonces existe un único m ∈ N tal que:

1. a|m y b|m;

2. para todo n ∈ N tal que a|n y b|n, m ≤ n.

Demostración. Sean p1 , . . . , pk los primos que dividen a ab. Basta entonces con
considerar
k
máx(vpi (a),vpi (b))
Y
m := pi .
i=1

Verificar que m posee las dos propiedades es un ejercicio inmediato a partir de las
propiedades de las valuaciones. La unicidad es inmediata a partir de la propiedad
2, al igual que con el mcd. ^
¨

Definición 1.5.4. Sean a, b ∈ N. Definimos el mı́nimo común múltiplo de a y b,


anotado mcm(a, b), como el m ∈ N de la Proposición 1.5.3, es decir el más pequeño
m ∈ N tal que a|m y b|m.
ab
Ejercicio. Sean a, b ∈ N. Pruebe que mcm(a, b) = (a,b)
.

12
Podemos además demostrar las siguientes propiedades, cuyas demostraciones
son engorrosas si no se cuenta con valuaciones.
Proposición 1.5.5. Sean a, b, c ∈ N. Entonces:
(an , bn ) = (a, b)n para todo n ∈ N;
mcd(a, mcm(b, c)) = mcm(mcd(a, b), mcd(a, c));
mcm(a, mcd(b, c)) = mcd(mcm(a, b), mcm(a, c)).
Demostración. Ejercicio ^.
¨ ^
¨

Un resultado no trivial que usa valuaciones y que podremos usar más adelante es
la fórmula de Legendre. Recordemos que la función “parte entera” es una función
b·c : R → Z que a un número real x le asocia el único entero bxc ∈ Z tal que
0 ≤ x − bxc < 1.
Teorema 1.5.6 (Fórmula de Legendre). Sean p, n ∈ N con p primo. Entonces
∞  
X n
vp (n!) =
i=1
pi

Observación.
Nótese
j kque la suma es en verdad finita, ya que para todo i tal que pi > n tenemos
que pni = 0.

Demostración. Para todo i, definamos ni como el número de enteros entre 1 y n


cuya valuación p-ádica es exactamente i. Entonces, usando las propiedades de la
valuación,
vp (n!) = n1 + 2n2 + 3n3 + · · · .
Por otra parte, si contamos los enteros entre 1 y n cuya valuación p-ádica es mayor
i
oj igual
k a i, vemos que se trata de los múltiplos de p , de los cuales hay exactamente
n
pi
entre 1 y n. En otras palabras,
 
n
= ni + ni+1 + ni+2 + · · · .
pi
Sumando esta última igualdad para todo i ∈ N, obtenemos
∞   ∞
X n X
i
= (ni + ni+1 + ni+2 + · · · ) = n1 + 2n2 + 3n3 + · · · = vp (n!),
i=1
p i=1

lo que concluye la demostración. ^


¨

Ejercicio. ¿Con cuántos 0 termina el número 2018! ? Hint: 10 = 2 · 5.

13
1.6. Más sobre números primos
Ya vimos que los números primos son los bloques fundamentales en aritmética.
Estudiemos algunas de sus propiedades. Comencemos por el siguiente teorema
demostrado por Euclides:
Teorema 1.6.1. Existe una infinidad de números primos.
Demostración. Supongamos que existe una cantidad finita n de números primos
y lleguemos a una contradicción. Sean p1 , . . . , pn dichos números primos y consi-
deremos el número N = p1 · · · pn + 1. El Teorema Fundamental de la Aritmética
nos dice que existe (al menos) un primo q que divide a N . Ahora, si N = pi para
algún 1 ≤ i ≤ n, tenemos que q|N y q|p1 · · · pn , por lo que q|(N − p1 · · · pn ) = 1.
Esto contradice el hecho de que q es primo y por ende ≥ 2, lo que concluye la
demostración. ^
¨

Uno puede usar un argumento similar para probar enunciados más precisos:
Proposición 1.6.2. Existe una infinidad de números primos de las formas
4k + 3 con k ∈ N;
6k + 5 con k ∈ N.
Demostración. Ejercicio ^
¨ (será más fácil usando congruencias). ^
¨

Si bien hay una infinidad de primos, éstos se hace cada vez más escasos a medida
que uno avanza en el conjunto N. De hecho, tenemos el siguiente resultado:
Proposición 1.6.3. Existen conjuntos arbitrariamente largos de enteros compues-
tos consecutivos. En otras palabras, para todo k ∈ N existe un n ∈ N tal que
n + 1, . . . , n + k son todos compuestos.
Demostración. Basta con considerar n = (k + 1)! + 1. En ese caso, tenemos que
n + i = (k + 1)! + (i + 1). Si i ≤ k, tenemos entonces que i + 1|(k + 1)! y por lo
tanto i + 1|n + i (y claramente 1 < i + 1 < n + i si i ≥ 1). Esto prueba que n + i
es compuesto para todo 1 ≤ i ≤ k. ^
¨

Y por el contrario, a pesar de esta escasez, uno puede controlar también el


espacio antes de que aparezca el siguiente:
Teorema 1.6.4 (Postulado de Bertrand). Sea n ∈ N. Entonces existe un número
primo entre n y 2n.
La demostración de este teorema es larga, pero usa tan sólo conocimientos bási-
cos como los que hemos visto hasta ahora y un poco de números combinatorios. Fue
encontrada por Paul Erdős cuando tenı́a tan solo 19 años (la primera demostración
data de 1850, por Chebyshev).

14
Demostración. La prueba tiene varios pasos intermedios y consiste en aproximar
de dos maneras el número 2nn
, las cuales serán contradictorias si no hay primos
entre n y 2n. El primer paso es el siguiente lema sobre el producto de números
primos:
Lema 1.6.5. Sea x ∈ R mayor o igual a 2. Entonces
Y
p ≤ 4x−1
p≤x

La notación del producto de acá arriba debe ser interpretada como el producto
de los números primos menores o iguales a x. Usaremos esta notación en toda la
demostración del teorema (y no sólo de este lema).
Demostración. Sea q el más grande primo menor o igual a x. Entonces
Y Y
p= p y 4q−1 ≤ 4x−1 ,
p≤q p≤x

por lo que bastará con demostrar la desigualdad para x = q primo. Procedemos


por inducción sobre el conjunto de los números primos.
Para q = 2, tenemos 2 ≤ 4, por lo que el enunciado vale. Sea ahora q = 2m+1 un
número primo impar y supongamos que el enunciado vale para los primos menores
que q. Podemos entonces dividir el producto de la siguiente manera:
Y Y Y
p= p · p.
p≤2m+1 p≤m+1 m+1<p≤2m+1

p ≤ 4m , mientras que
Q
Por inducción, tenemos que p≤m+1
 
Y 2m + 1
p≤ .
m+1<p≤2m+1
m

En efecto, los primos entre m + 2 y 2m + 1 dividen todos a (2m + 1)!, pero ninguno
de ellos divide al denominador m!(m + 1)!. Por lo tanto todos estos primos dividen
a 2m+1
m
, que es un entero. Juntando todo, tenemos que
 
m 2m + 1
Y
p≤4 ≤ 4m 22m = 42m ,
p≤2m+1
m
2m+1

lo que concluye la demostración. Nótese que la desigualdad m
≤ 22m es debido
a que 2m+1 = 2m+1
 
m m+1
y estos son los más grandes términos en la suma
2m+1
X 2m + 1
· 1k · 12m+1−k = (1 + 1)2m+1 = 22m+1 .
k=0
k

Pero también se puede demostrar fácilmente por inducción sobre m ≥ 1. ^


¨

15
2n

Continuamos con el siguiente lema sobre los divisores primos de n
.
2n

Lema 1.6.6. Sea p un número primo y sea mp la valuación p-ádica de n
. En-
tonces:

1. pmp ≤ 2n;

2. si p está en el intervalo ] 23 n, n], entonces mp = 0.

Demostración. Usaremos la fórmula de Legendre (Teorema 1.5.6). Ésta nos dice


que
  X ∞    
2n 2n n
mp = vp = k
−2 k .
n k=1
p p
Notemos ahora que
     
2n n 2n n
− 2 k < k − 2 k − 1 = 2,
pk p p p

por lo que cada término de la suma infinita es a lo más igual a 1 y claramente igual
a 0 si pk > 2n. Si definimos r0 = máx{r | pr ≤ 2n}, vemos entonces que
∞     r0    
X 2n n X 2n n
mp = −2 k = −2 k ≤ r0 ,
k=1
pk p k=1
pk p

lo que equivale a la primera afirmación del lema.


Para la segunda afirmación, notemos que si 23 n < p ≤ n, entonces 3p > 2n, por
lo que p y 2p son los únicos múltiplos de p que aparecen en (2n)!. Pero como p ≤ n,
entonces también aparecedos veces en n! · n!, por lo que desaparece
 completamente
de la fracción (2n)!
n!·n!
= 2n
n
. Esto prueba que p no divide a 2n
n
y por ende mp =
0. ^
¨

El Lema 1.6.6 nos dice que, si escribimos 2n



n
como producto de números pri-
mos, podemos separar el producto como sigue:
 
2n Y Y Y
= pmp · pmp · pm p ,
n √ √ 2 n<p≤2n
p≤ 2n 2n<p≤ 3 n

y ver que los exponentes mp para los dos últimos productos son 0 ó 1. Como además
pmp ≤ 2n para todo p, vemos que
 
2n Y Y Y
≤ 2n · p · p.
n √ √ 2 n<p≤2n
p≤ 2n 2n<p≤ 3 n

16
Por otra parte, tenemos que
4n
 
2n
≥ ,
n 2n
ya sea por un argumento similar al que usamos al final del Lema 1.6.5 o bien por
inducción sobre n ≥ 1. Juntando las dos desigualdades, tenemos que
Y Y Y
4n ≤ 2n · 2n · p · p.
√ √
p≤ 2n 2n<p≤ 23 n n<p≤2n

√ √
Y como no hay más de 2n primos inferiores o iguales a 2n,
√ Y Y
4n ≤ (2n)1+ 2n · p · p.

2n<p≤ 23 n n<p≤2n

Supongamos ahora que no hay primos entre n y 2n. Entonces el último producto
del lado derecho desaparece. Y gracias al Lema 1.6.5, obtenemos
√ Y √ 2
4n ≤ (2n)1+ 2n · p ≤ (2n)1+ 2n · 4 3 n ,

2n<p≤ 23 n

y por lo tanto, elevando al cubo y simplificando,



4n ≤ (2n)3(1+ 2n)
.

¡Pero esto es falso para n suficientemente grande! Usemos de hecho


√ una aproxima-

6
ción burda como a + 1 < 2 para a ≥ 2 para probar que 2n = ( 2n)6 < 26 2n y
a 6

ası́ obtener √
6 √
4n = 22n < 2 2n(18+18 2n) .

Si suponemos ahora que n ≥ 50 para que 18 < 2 2n, podemos ver que
√ √
2n 6 2n 2/3
22n < 220 = 220(2n) .

Esto prueba que 2n < 20(2n)2/3 o bien (2n)1/3 < 20, es decir n < 4000.

Con todo este trabajo, probamos que el postulado de Bertrand es verdadero


para todo n ≥ 4000. Falta asegurarse de que no hay un contraejemplo en los
números pequeños. Pero esto es fácil: consideremos la sucesión

2, 3, 5, 7, 13, 23, 43, 83, 163, 317, 631, 1259, 2503, 4001.

Como todos estos números son primos y cada uno es menor que el doble del anterior,
vemos fácilmente que siempre habrá un primo entre n y 2n para todo n < 4000, lo
que concluye la demostración. ^
¨

17
Concluyamos esta sección enunciando dos teoremas sobre los números primos
cuyas demostraciones están muy por encima del alcance de este curso, pero que es
bueno conocer por cultura general.

Teorema 1.6.7 (Teorema de los números primos). Sea π(x) la cantidad de núme-
ros primos inferiores o iguales a x para x ∈ R. Entonces la función π(x) crece
como logx x cuando x tiende a infinito. Es decir:

π(x)
lı́m x = 1.
x→∞
log x

Este teorema debe interpretarse de la siguiente manera: si π(x) es la función que


cuenta números primos hasta x, entonces π(x)x
es la función que cuenta la proporción
de números primos hasta x. El teorema nos dice entonces que la proporción de
números primos hasta x es de log1 x . En otras palabras, los primos se vuelven cada
vez más escasos a medida que avanzamos por la recta real.

Teorema 1.6.8 (Dirichlet). Sean a, b ∈ N dos naturales coprimos. Entonces la


sucesión (an + b)n∈N contiene una infinidad de números primos.

2. Congruencias
La noción de congruencia módulo n puede ser abordada con el lenguaje de
anillos. Sin embargo, trataremos de abordarla de forma elemental en una primera
instancia. Durante toda esta sección, fijaremos n ∈ N un entero ≥ 2.

2.1. Definiciones y propiedades básicas


Comencemos por recordar la definición de congruencia módulo n.

Definición 2.1.1. Sea a, b ∈ Z. Decimos que a es congruente a b módulo n y


anotamos
a ≡ b (mód n),
si n|(a − b), es decir, si existe k ∈ Z tal que a = b + kn.

Notemos que esta definición es una relación de equivalencia en Z. En efecto:

Lema 2.1.2. Sean a, b, c ∈ Z. Entonces:

a ≡ a (mód n);

a ≡ b (mód n) si y sólo si b ≡ a (mód n);

18
a ≡ b (mód n) y b ≡ c (mód n) ⇒ a ≡ c (mód n).
Demostración. Ejercicio ^.
¨ ^
¨

Tratándose de una relación de equivalencia, podemos dar la siguiente definición.


Definición 2.1.3. Definimos Z/nZ como el conjunto de clases de equivalencia
módulo n, es decir, como el cociente de la relación de equivalencia dada más arriba.
La clase de a en Z/nZ será denotada por ā o a + nZ si el contexto hace necesario
explicitar el n.
Nótese que todo entero es congruente a a módulo n para algún a ∈ {0, 1, . . . , n−
1}. En efecto, basta con tomar el resto de la división euclideana de a por n. Éste
último conjunto es lo que se llama un sistema completo de residuos módulo n. Otros
sistemas posibles son, por ejemplo, {− n2 + 1, . . . , n2 } si n es par, o {− n−1
2
, . . . , n−1
2
}
si n es impar.

La propiedad esencial de la noción de congruencia es que “se porta bien” con


respecto a la suma y la multiplicación, en el sentido siguiente.
Proposición 2.1.4. Sean a, b, c, d ∈ Z tales que a ≡ b (mód n) y c ≡ d (mód n).
Entonces
a + c ≡ b + d (mód n);
ac ≡ bd (mód n).
Demostración. Por definición, sabemos que n|(a − b) y n|(c − d). Entonces
n|(a − b + c − d) = (a + c) − (b + d).
Esto prueba la primera afirmación. Para la segunda, vemos que a = b + kn y
c = d + `n para ciertos k, ` ∈ Z, por lo que
ac = (b + kn)(d + `n) = bd + n(kd + `b + k`n),
lo que prueba que ac ≡ bd (mód n). ^
¨

Observación.
En el lenguaje de anillos, tenemos que Z es un anillo y los elementos de la forma
{kn | k ∈ Z} corresponden al ideal de Z generado por n. La definición de con-
gruencia módulo que acabamos de dar corresponde entonces al cociente de Z por
el ideal nZ, lo que justifica la notación para este conjunto. La proposición anterior
prueba que Z/nZ posee en efecto una estructura de anillo, conmutativo y unitario
como Z, en la cual ā + b̄ = a + b y āb̄ = ab.
Ejercicio. Demuestre que un entero es divisible por 9 si y sólo si la suma de sus
dı́gitos es múltiplo de 9.

19
2.2. Inversos e idempotentes módulo n
Pudiendo sumar y multiplicar en Z/nZ, es natural preguntarse por los inversos
respectivos. Para el inverso aditivo no hay mayor misterio, ya que se trata del
mismo que en Z. Sin embargo, en Z/nZ pueden aparecer inversos multiplicativos
que no tienen sentido alguno en Z.

Definición 2.2.1. Decimos que a ∈ Z es invertible módulo n si existe b ∈ Z tal


que ab ≡ 1 (mód n). También decimos que ā es invertible en Z/nZ.

El hecho de que a sea invertible nos incita a definir b como el inverso de a


módulo n. Pero para ello debemos asegurarnos que éste es único. Pero claramente
no lo es, ya que b + n también funciona. Pero cabe preguntarse si la clase b̄ de b
es única. Veamos pues el siguiente resultado, consecuencia de lo que vimos en el
capı́tulo anterior.

Proposición 2.2.2. Sea a ∈ Z. Entonces

1. ā es invertible en Z/nZ si y sólo si (a, n) = 1.

2. si ā es invertible, entonces existe una única clase b̄ ∈ Z/nZ tal que āb̄ = 1̄.

Demostración. Por definición, ā es invertible en Z/nZ si y sólo si existe b ∈ Z


tal que ab ≡ 1 (mód n). Ahora, esto equivale a ab = 1 + kn para algún k ∈ Z.
Tenemos entonces que ā es invertible en Z/nZ si y sólo si existen b, k ∈ Z tales
que ab − kn = 1. Pero esto ocurre sı́ y sólo si (a, n)|1 (o bien (a, b) = 1) según el
Teorema de Bézout. Esto prueba la primera afirmación.

Supongamos ahora que (a, n) = 1, de forma que a sea invertible. Sean b, b0 ∈ Z


tales que āb̄ = āb̄0 = 1̄. Vemos entonces que ab = ab0 + kn para algún k ∈ Z, es
decir a(b − b0 ) = kn. Pero como (a, n) = 1, el Lema de Gauss (usado de forma
iterada) nos dice que a|k, por lo que b − b0 = ka n con ka ∈ Z y por lo tanto b ≡ b0
(mód n), lo que concluye la demostración. ^¨

Ahora ya podemos definir de forma concreta la noción de inverso.

Definición 2.2.3. Sea a ∈ Z un elemento invertible módulo n. Definimos el inverso


de a módulo n como la clase ā−1 ∈ Z/nZ tal que āā−1 = 1̄. La Proposición 2.2.2
asegura que ésta es única. Definimos también la notación ā−k := (ā−1 )k
Definimos el órden de a módulo n como el más peqeño k ∈ N tal que ak ≡ 1
(mód n). Lo denotamos por ordn (a) o simplemente ord(a) si n está implı́cito.

Nótese que un tal entero siempre existe para a invertible módulo n. En efecto,
si a es invertible, entonces toda potencia ak de a es invertible (su inverso es ā−k ).
Como sólo hay n clases módulo n, tiene que haber dos potencias de a que sean

20
congruentes módulo n, es decir āk = ā` con k < `. Multiplicando por ā−k , tenemos
que ā`−k = 1̄. Teniendo al menos una potencia que cumple con lo pedido, sabemos
por el Axioma del Buen Orden que podemos tomar la de exponente más pequeño.

La Proposición 2.2.2 es en el fondo una traducción del Teorema de Bézout en


términos de congruencias. El siguiente resultado, corolario de ésta, es un equivalente
al Lema de Gauss en este contexto.

Proposición 2.2.4. Sean a, b, c ∈ Z tales que ac ≡ bc (mód n). Si (c, n) = 1,


entonces a ≡ b (mód n).

Demostración. Basta con notar que, gracias a la proposición precedente, existe


d ∈ Z tal que cd ≡ 1 (mód 1). En ese caso, tenemos que

a ≡ acd ≡ bcd ≡ b (mód n).

^
¨

Ejercicio. Demuestre el siguiente resultado más general: Sean a, b, c ∈ Z. Entonces


n
ac ≡ bc (mód n) si y sólo si a ≡ b (mód (c,n) ).

Pasemos ahora a los elementos idempotentes. Éstos son elementos son en cierto
modo lo opuesto a los invertibles.

Definición 2.2.5. Decimos que a ∈ Z es idempotente módulo n si a2 ≡ a (mód n).


También decimos que ā es idempotente en Z/nZ. A los elementos idempotentes 0̄
y 1̄ se les llama idempotentes triviales.

Notemos que, como mencionábamos, ningún elemento invertible puede ser idem-
potente salvo la excepción trivial de 1̄. En efecto, si ā2 = ā y además āb̄ = 1̄ para
cierta clase b̄, entonces
1̄ = āb̄ = ā2 b̄ = āāb̄ = ā.
¿Existen otros elementos idempotentes? Veamos algunos ejemplos:

Ejemplo 2.2.6. Consideremos Z/30Z. Entonces

62 = 36 ≡ 6 (mód 30)
102 = 100 ≡ 10 (mód 30);
152 = 225 ≡ 15 (mód 30);

por lo que 6, 10 y 15 son idempotentes módulo 30. Nótese que todos son divisores
de 30.

21
Ejemplo 2.2.7. Consideremos Z/77Z. Entonces

562 ≡ (−21)2 ≡ 441 ≡ 56 (mód 77);


222 ≡ 484 ≡ 22 (mód 77);

por lo que 22 y 56 son idempotentes módulo 77. Aquı́ ya no se trata de divisores de


77, pero vemos al menos que (56, 77) = 7 y (22, 77) = 11, por lo que no se puede
tratar de elementos invertibles.
Vemos entonces con estos ejemplos que la existencia de idempotentes no trivia-
les tiene que ver el hecho de que n admita divisores no triviales. Esto quedará más
claro en la siguiente sección, cuando veamos el Teorema chino de los restos. Por
ahora, veamos un resultado que nos permitirá poner ese teorema en perspectiva.

Sean m, n ∈ Z. Entonces (Z/mZ) × (Z/nZ) es naturalmente un anillo:


(ā, ā0 ) + (b̄, b̄0 ) = (ā + b̄, ā0 + b̄0 );
(ā, ā0 )(b̄, b̄0 ) = (āb̄, ā0 b̄0 );
para ā, b̄ ∈ Z/mZ y ā0 , b̄0 ∈ Z/nZ. La existencia de idempotentes se relaciona fuer-
temente con esta estructura. En efecto, en (Z/mZ) × (Z/nZ) tenemos los idempo-
tentes no triviales (1̄, 0̄) y (0̄, 1̄) (recuerde que el 0 de este anillo es (0̄, 0̄) y su 1 es
(1̄, 1̄)). Por otra parte, tenemos la siguiente
Proposición 2.2.8. Si a es un idempotente no trivial módulo n, entonces 1 − a
también lo es y existe un isomorfismo de anillos

Z/nZ ' Z/n1 Z × Z/n2 Z,


n n
donde n1 = (a,n)
y n2 = (1−a,n)
.
Demostración. Comencemos por demostrar que 1 − a también es idempotente
módulo n. Tenemos que

(1 − a)2 = 1 − 2a + a2 ≡ 1 − 2a + a = 1 − a (mód n).

Consideremos ahora el subconjunto

aZ/nZ := {am | m ∈ Z}.

Recordando que (Z/nZ, +) es un grupo cı́clico de orden n, vemos que aZ/nZ es


n
un subgrupo de orden n1 = (a,n) , es decir, isomorfo a (Z/n1 Z, +) vı́a la biyección

Z/n1 Z → aZ/nZ,
b + n1 Z 7→ ba + nZ.

22
Esto es un resultado del curso de Estructuras Algebraicas (¡que usa el Teorema de
Bézout!). Además, como a2 ≡ a (mód n), vemos que bb0 + n1 Z es enviado a

bb0 a + n1 Z = bb0 a2 + nZ = bab0 a + nZ = (ba + nZ)(b0 a + nZ),

por lo que se trata en realidad de un isomorfismo de anillos.


Evidentemente el mismo razonamiento se aplica a 1 − a, por lo que todo lo que
queda por demostrar es que

Z/nZ = aZ/nZ × (1 − a)Z/nZ.

Esto equivale a decir que:

todo elemento b̄ ∈ Z/nZ se escribe de forma única como b̄1 + b̄2 con b̄1 ∈
aZ/nZ y b̄2 ∈ (1 − a)Z/nZ (isomorfismo de grupos);

si c̄ = c̄1 + c̄2 con c̄1 ∈ aZ/nZ y c̄2 ∈ (1 − a)Z/nZ, entonces b̄c̄ = b̄1 c̄1 + b̄2 c̄2
(isomorfismo de anillos).

Ahora, vemos inmediatamente que b̄1 = āb̄ y b̄2 = (1̄ − ā)b̄ funciona. Debemos
pues mostrar la unicidad de esta escritura. Supongamos que b̄ = ād¯1 + (1̄ − ā)d¯2
con d¯1 , d¯2 ∈ Z/nZ. Entonces

0̄ = b̄ − ād¯1 − (1̄ − ā)d¯2 = āb̄ + (1̄ − ā)b̄ − ād¯1 − (1̄ − ā)d¯2 = ā(b̄ − d¯1 ) + (1̄ − ā)(b̄ − d¯2 ),

por lo que x̄ := ā(b̄ − d¯1 ) = −(1̄ − ā)(b̄ − d¯2 ) verifica lo siguiente:

x̄ = āx̄ ya que ā2 = ā;

x̄ = (1̄ − ā)x̄ ya que (1̄ − ā)2 = 1̄ − ā.

Por lo tanto, x̄ = āx̄ = ā(1̄ − ā)x̄ = (ā2 − ā)x̄ = 0̄ y por ende āb̄ − ād¯1 = 0 y
(1̄ − ā)b̄ − (1̄ − ā)d¯2 = 0, lo que prueba la unicidad de b̄1 y b̄2 .
Finalmente, si escribimos b̄ = āb̄ + (1̄ − ā)b̄ y c̄ = āc̄ + (1̄ − ā)c̄, vemos que

b̄c̄ = āb̄c̄ + (1̄ − ā)b̄c̄ = ā2 b̄c̄ + (1̄ − ā)2 b̄c̄ = (āb̄)(āc̄) + ((1̄ − ā)b̄)((1̄ − ā)c̄).

^
¨

2.3. El Teorema Chino de los Restos


El teorema chino de los restos es un resultado que nos permite simplificar el
cálculo con congruencias módulo n al reducirlo a un cálculo con congruencias módu-
lo números más pequeños. También puede ser visto como una forma de resolver
sistemas de congruencias lineales. El enunciado es el siguiente:

23
Teorema 2.3.1 (Teorema chino de los restos). Sean n1 , . . . , nr ∈ N enteros ≥
2 tales que (ni , nj ) = 1 si i 6= j. Sean a1 , . . . , ar ∈ Z. Entonces el sistema de
congruencias

x ≡ a1 (mód n1 );
..
.
x ≡ ar (mód nr ).
Qr
tiene una solución a ∈ Z. Además, si anotamos n := i=1 ni , entonces dos solu-
ciones de este sistema son congruentes módulo n.

Observación.
Nótese que, sin hipótesis sobre los ni , existe un homomorfismo natural de anillos

φ : Z/nZ → Z/n1 Z × · · · × Z/nr Z,


a + nZ 7→ (a + n1 Z, . . . , a + nr Z).

El teorema nos dice entonces que, bajo la hipótesis (ni , nj ) = 1 si i 6= j, este


homomorfismo es un isomorfismo. En efecto, el sistema de ecuaciones equivale a
preguntarse por un x ∈ Z tal que φ(x + nZ) = (a1 + n1 Z, . . . , ar + nr Z), lo que
equivale a la epiyectividad de la flecha. La inyectividad sigue enseguida ya que
ambos anillos tienen el mismo cardinal y esto prueba en particular la “unicidad
módulo n” de la que habla el teorema.

La teorı́a de los elementos idempotentes permite una demostración muy rápida


de este resultado, la cual sólo daremos para r = 2, pero que se puede obtener en
general por inducción.
Demostración rápida para r = 2. Queremos probar que Z/nZ ' Z/n1 Z × Z/n2 Z.
Según la Proposición 2.2.8, bastará entonces con encontrar los idempotentes ade-
cuados.
Como (n1 , n2 ) = 1, el Teorema de Bézout nos dice que existen s, t ∈ Z tales que
sn1 + tn2 = 1. Nótese que en particular (s, n2 ) = (t, n1 ) = 1 y por lo tanto, como
n n
n = n1 n2 , tenemos que (n,sn 1)
= n2 y (n,tn 2)
= n1 . Definamos entonces a = tn2 , de
forma que 1 − a = sn1 , y notemos que a(1 − a) = tn2 sn1 ≡ 0 (mód n). Es decir,
a ≡ a2 (mód n), lo que prueba que a es un idempotente y por lo tanto, por la
Proposición 2.2.8,
Z/nZ ' Z/n1 Z × Z/n2 Z.
^
¨

Veamos ahora una demostración más “pedestre”.

24
Demostración. El principio de la demostración es el mismo y utiliza la identidad
de Bézout como herramienta clave. Un lema que será útil para entender la idea de
la demostración es el siguiente.
Lema 2.3.2. Sean n1 , . . . , nr ∈ N y a1 , . . . , ar ∈ Z como en el teorema y sea además
b1 , . . . , br ∈ Z otra familia como los ai . Supongamos que existe una solución a para
el sistema del teorema y una solución b para el sistema que se obtiene poniendo los
bi en lugar de los ai . Entonces, para todo λ ∈ Z, λa + b es una solución del sistema
que se obtiene reemplazando los ai por λai + bi .
Este lema es evidente a partir de las propiedades de las congruencias (en par-
ticular, no lo demostraremos), pero es el principio director de la demostración.
En efecto, el lema nos permite considerar combinaciones lineales de “vectores”
(a1 , . . . , ar ) ∈ Zr , con lo que se vuelve evidente que el teorema estará demostrado
si lo demostramos para la “base canónica”. En otras palabras, debemos concen-
trarnos en demostrar la existencia de una solución para los sistemas
x≡1 (mód ni );
x≡0 (mód nj ) para todo j 6= i.
Veamos ahora un segundo lema bastante evidente.
Lema 2.3.3. Sean n1 , . . . , nr ∈ N y n como en el teorema. Entonces x ≡ 0
(mód ni ) para todo 1 ≤ i ≤ r si y sólo si x ≡ 0 (mód n).
Demostración. Esto es equivalente a n|x si y sólo si ni |x para todo 1 ≤ i ≤ r.
Como tenemos (ni , nj ) = 1 si i 6= j, esto es una mera aplicación reiterada del Lema
de Gauss, la cual dejamos como ejercicio al lector. ^
¨

Este lema nos dice que, si definimos mi := j6=i nj = nni , el sistema de más
Q
arriba es equivalente al siguiente
x≡1 (mód ni );
x≡0 (mód mi ).
Y es éste sistema el cual es fácil de resolver gracias al Teorema de Bézout. En
efecto, las hipótesis del enunciado nos dicen que (mi , ni ) = 1, por lo que existen
bi , ci ∈ Z tales que bi mi + ci ni = 1. Vemos entonces que bi mi ≡ 1 (mód ni ) y
bi mi ≡ 0 (mód mi ), lo que demuestra el teorema en este caso.
Recordando entonces que
(a1 , . . . , ar ) = a1 (1, 0, . . . , 0) + · · · + ar (0, . . . , 0, 1),
vemos gracias al Lema 2.3.2 que x := ri=1 ai bi mi es una solución del sistema ori-
P
ginal, lo que demuestra la existencia de una solución.

25
La unicidad de esta solución módulo n se demuestra usando ambos lemas nue-
vamente. Supongamos en efecto que x1 y x2 son dos soluciones del sistema original.
Entonces x1 − x2 es una solución del sistema trivial
x≡0 (mód ni ), ∀1 ≤ i ≤ r.
Vemos entonces que x1 − x2 ≡ 0 (mód n), lo que prueba la unicidad de la solución
y concluye la demostración del teorema. ^
¨

El corolario importante que uno obtiene a partir de este teorema, es que las
congruencias importantes son aquéllas en las que n es una potencia de un número
primo. En efecto:
Corolario 2.3.4. Sea n ∈ N y sea n = ri=1 pαi i su factorización en números pri-
Q
mos (con pi 6= pj si i 6= j). Entonces resolver congruencias módulo n es equivalente
a resolver congruencias módulo pαi i para todo 1 ≤ i ≤ r. En otras palabras,
r
Y
Z/nZ ' Z/pαi i Z.
i=1
α
Demostración. Basta con notar que (pαi i , pj j ) = 1 si i 6= j. ^
¨

Observación.
Es éste resultado el que lleva a la teorı́a de números a interesarse en valuaciones
p-ádicas y números p-ádicos, ya que estos traducen lo que uno ve “módulo pα ”. Y
tener información módulo pα para todo p primo y todo α ∈ N equivale entonces
a tener información módulo n para todo n ∈ N, que es lo más que uno le puede
pedir a las congruencias.
Veamos ahora lo que ocurre en el caso de un sistema de ecuaciones como el del
enunciado del Teorema chino de los restos, pero en el cual no tenemos la hipótesis
(ni , nj ) = 1 si i 6= j. Consideremos pues un tal sistema:

x ≡ a1 (mód n1 );
..
.
x ≡ ar (mód nr ).
Usando el Teorema chino de los restos, sabemos que cada una de las congruen-
cias es equivalente a un sistema de la forma
α
x ≡ ai (mód p1,i1,i );
..
.
α
x ≡ ai (mód pk,ik,i ).

26
Juntando todas estas equivalencias en un solo sistema y renombrando los distintos
elementos, obtenemos finalmente un nuevo sistema de la forma
x ≡ b1 (mód pα1 1 );
..
.
x ≡ bs (mód pαs s );
en el cual no necesariamente pi 6= pj si i 6= j. Si este fuera el caso, entonces el
mismo Teorema chino de los restos nos dirı́a que basta solucionar cada una de ellas
para obtener una solución general. Pero de no ser ası́, debemos ocuparnos, primo
por primo, de un sistema de la forma
x ≡ c1 (mód pα1 );
..
.
x ≡ ct (mód pαt ).
Ahora, es fácil saber si un tal sistema tiene soluciones. Supongamos que los αi están
ordenados de mayor a menor. Entonces si x debe ser congruente a c1 (mód pα1 ),
vemos que x tiene que ser congruente a c1 módulo pαi para todo i. Por lo tanto,
si ci 6≡ c1 (mód pαi ), tenemos una contradicción y por ende no existen soluciones
al sistema. Y si ci ≡ c1 (mód pαi ), entonces la i-ésima congruencia no nos aporta
nada nuevo y podemos olvidarla.
Nótese finalmente que, de haber soluciones, éstas son únicas módulo el producto
de las mayores potencias de primos que pudimos encontrar. Recordando la noción
de valuación p-ádica y su relación con el mcd y el mcm, vemos que las soluciones de
un sistema de congruencias lineales son únicas módulo el mı́nimo común múltiplo
de los ni .
Ejemplo 2.3.5. Veamos todo esto en un ejemplo. Consideremos el sistema
x ≡ a (mód 30);
x ≡ b (mód 25);
x ≡ c (mód 18).
Descomponiendo con el Teorema chino de los restos, vemos que este sistema es
equivalente al sistema
x≡a (mód 2);
x≡a (mód 3);
x≡a (mód 5);
x≡b (mód 25);
x≡c (mód 2);
x≡c (mód 9).

27
Vemos entonces que si b 6≡ a (mód 5), entonces no hay soluciones al sistema. Lo
mismo ocurre si c 6≡ a (mód 2) o si c 6≡ a (mód 3). Un ejemplo de eso serı́a con
a = 1, b = 7 y c = 7. Nótese que las congruencias entre a y c son compatibles, pero
es la congruencia entre a y b que trae problemas. Un sistema que sı́ tiene solucion
serı́a por ejemplo a = 7, b = 12 y c = 13. En este caso tendrı́amos

x ≡ 7 ≡ 1 (mód 2);
x ≡ 7 ≡ 1 (mód 3);
x ≡ 7 ≡ 2 (mód 5);
x ≡ 12 (mód 25);
x ≡ 13 ≡ 1 (mód 2);
x ≡ 13 ≡ 4 (mód 9);

lo que, eliminando las congruencias “inútiles” nos deja

x ≡ 1 (mód 2);
x ≡ 4 (mód 9);
x ≡ 12 (mód 25).

Una solución de este sistema es 337 y es única módulo 450. Notemos finalmente
que realmente resolvimos el sistema inicial ya que

337 ≡ 7 (mód 30);


337 ≡ 12 (mód 25);
337 ≡ 13 (mód 18).

Y de paso, notemos que 450 es el mı́nimo común múltiplo de 30, 25 y 18.

2.4. El Lema de Hensel


Con el Teorema chino de los restos vimos que las congruencias que son im-
portantes de resolver son módulo una potencia de primo. El Lema de Hensel que
veremos ahora permite, muy a menudo, reducir el resolver estas congruencias al
caso de la potencia de exponente 1, es decir, al caso de congruencias módulo un
número primo. Durante toda esta sección pues, p denota un número primo dado.

Para entender lo que se esconde detrás del “muy a menudo” en el párrafo


anterior, debemos entender la noción de “punto crı́tico” de un polinomio módulo
p. Para ello necesitamos la siguiente definición.

28
Definición 2.4.1. Sea A un anillo conmutativo y unitario P
(como Z o Z/nZ) y sea
P ∈ A[x] un polinomio con coeficientes en A de la forma ni=0 ai xi . Definimos la
derivada formal de P con respecto a x como el polinomio
n
X n−1
X
0 i−1
P := iai x = (i + 1)ai+1 xi .
i=1 i=0

En particular, vemos que la derivada de xn es nxn−1 . También podemos verificar


lo siguiente:

Proposición 2.4.2. La derivada formal posee las siguientes propiedades

(P + Q)0 = P 0 + Q0 para P, Q ∈ A[x];

(P Q)0 = P 0 Q + P Q0 para P, Q ∈ A[x].

Demostración. La primera
P propiedad es evidente de la definición. Para la segunda,
recordemos que si P = ni=0 ai xi y Q = m j
P
b
j=0 j x , entonces

m+n
!
X X
PQ = ai b j xk .
k=0 i+j=k

Por lo tanto, !
m+n−1
X X
0
(P Q) = (k + 1) ai b j xk .
k=0 i+j=k+1

Por otra parte, usando las definiciones de P 0 , Q0 y el producto,


m+n−1
! m+n−1
!
X X X X
P 0 Q + P Q0 = (i + 1)ai+1 bj xk + (j + 1)ai bj+1 xk .
k=0 i+j=k k=0 i+j=k

Sólo falta demostrar entonces que, para todo 0 ≤ k ≤ m + n − 1,


!
X X X
(i + 1)ai+1 bj + (j + 1)ai bj+1 = (k + 1) ai b j ,
i+j=k i+j=k i+j=k+1

lo cual es un simple ejercicio que dejamos al lector. ^


¨

La derivada formal nos permite saber si un polinomio mónico tiene raı́ces re-
petidas. En efecto, si a ∈ A es una raı́z de P , entonces (x − a) divide a P (para
esto se usa el algoritmo de división euclideana en polinomios). Una raı́z repetida,
o “punto crı́tico”, corresponde a un elemento a ∈ A tal que (x − a)2 divide a P .

29
Lema 2.4.3. Sea A un anillo conmutativo y unitario y sea P ∈ A[x] un polinomio.
Sea a ∈ A una raı́z de P (i.e. P (a) = 0). Entonces (x − a)2 divide a P si y sólo si
P 0 (a) = 0 ∈ A.
Demostración. Supongamos que (x − a)2 divide a P . Entonces P = P1 P2 con
P1 = (x − a)2 y P2 ∈ A[x]. Un cálculo rápido nos dice que P10 = 2(x − a), por lo
tanto

P 0 = P10 P2 + P1 P20 = 2(x − a)P2 + (x − a)P20 = (x − a)(2P2 + P20 ).

Vemos claramente entonces que P 0 (a) = 0 en este caso.


Supongamos ahora que P 0 (a) = 0 y escribamos P = Q1 Q2 con Q1 = x − a
(recuerde que P (a) = 0 por hipótesis) y Q2 ∈ A[x]. Entonces, como claramente
Q01 = 1,
P 0 = Q01 Q2 + Q1 Q02 = Q2 + (x − a)Q02 .
Sabiendo que P 0 (a) = 0, vemos entonces que Q2 (a) = 0, por lo que x − a divide a
Q2 y por lo tanto (x − a)2 divide a P . ^
¨

Ejercicio. Sea P ∈ Z[x] un polinomio y sea n ∈ N. Pruebe que a ≡ b (mód n) ⇒


P (a) ≡ P (b) (mód n).
Habiendo introducido el material necesario, veamos ahora el enunciado del Le-
ma de Hensel.
Teorema 2.4.4 (Lema de Hensel). Sea P ∈ Z[x], p ∈ N un primo y a ∈ Z un
elemento tal que:
1. P (a) ≡ 0 (mód p);

2. P 0 (a) 6≡ 0 (mód p).


Entonces, para todo n ∈ N, existe un único ān ∈ Z/pn Z tal que P (an ) ≡ 0 (mód pn )
y an ≡ a (mód p).
Demostración. La condición P 0 (a) 6≡ 0 (mód p) nos dice que (P 0 (a), p) = 1 y por
lo tanto P 0 (a) es invertible módulo p. Sea k ∈ Z un representante de este inverso.
Definimos la sucesión {an }n∈N de la siguiente manera:
1. a1 := a;

2. an+1 = an − kP (an ).
Demostremos pues que esta sucesión posee las propiedades del enunciado. Ante
todo, vemos que

an − an+1 = kP (an ) ≡ kP (a) ≡ 0 (mód p),

30
por lo que an ≡ a (mód p) por inducción sobre n.
Demostremos ahora por inducción que P (an ) ≡ 0 (mód pn ). Para n = 1 esto
es evidente por hipótesis, por lo que podemos suponer la congruencia cierta para
n y debemos demostrarla para n + 1. Sabemos pues que pn |P (an ), por lo que
P (an )m ≡ 0 (mód pn+1 ) para m ≥ 2 y por lo tanto
m  
m m
X m m−i
an+1 = (an −kP (an )) = an (−k)i P (an )i ≡ am m−1
n −man kP (an ) (mód pn+1 ).
i=0
i

Verificando directamente, vemosPademás que la congruencia también es cierta para


m = 0, 1. En particular, si P = ri=0 bi xi , tenemos que
r
X r
X
P (an+1 ) = bi ain+1 = bi (an − kP (an ))i
i=0 i=0
r
X
≡ bi (ain − iai−1
n kP (an )) (mód pn+1 )
i=0
r
X r
X
≡ bi ain − ibi ai−1
n kP (an ) (mód pn+1 )
i=0 i=1
0
≡ P (an ) − P (an )kP (an ) (mód pn+1 )
≡ P (an )(1 − P 0 (an )k) (mód pn+1 ).
Y como k es el inverso de P 0 (an ) módulo p, vemos que p|(1 − P 0 (an )k), mientras
que pn |P (an ). Esto prueba que P (an+1 ) ≡ 0 (mód pn+1 ).
Veamos ahora la unicidad, la cual demostraremos también por inducción. Para
n = 1, esto es evidente, por lo que podemos asumir la unicidad de an módulo pn
y debemos demostrar la unicidad de an+1 módulo pn+1 . Ahora, como P (an+1 ) ≡ 0
(mód pn ), la unicidad de an nos asegura que an+1 ≡ an (mód pn ). Vemos entonces
que an+1 = an + tpn y por lo tanto, usando los mismos argumentos que antes,
r
X
n
P (an+1 ) = P (an + tp ) = bi (an + tpn )i ≡ P (an ) + P 0 (an )tpn (mód pn+1 ).
i=0

Como queremos que P (an+1 ) ≡ 0 (mód pn+1 ) y como pn |P (an ), lo que queremos
es
P (an )
+ P 0 (an )t ≡ 0 (mód p).
pn
Esto nos da t ≡ −k P (a
pn
n)
(mód p) y por lo tanto tpn ≡ −kP (an ) (mód pn+1 ),
probando la unicidad de an+1 módulo pn+1 . ^¨

Una consecuencia fácil del Lema de Hensel es una descripción de los invertibles
módulo pn .

31
Corolario 2.4.5. Si a es invertible en Z/pZ, entonces a es invertible en Z/pn Z
para todo n ∈ N.

Demostración. Basta aplicar el Lema de Hensel al polinomio P = ax − 1, cuya raı́z


serı́a precisamente el inverso de a. Como este polinomio admite una raı́z módulo p
(a saber, el inverso de a módulo p) y su polinomio derivado es P 0 = a 6= 0, vemos
que el polinomio tiene una raı́z módulo pn para todo n. ^
¨

Veamos otro ejemplo de aplicación:

Ejemplo 2.4.6. Si p 6= 2, entonces un elemento invertible ā ∈ Z/pn Z es un


cuadrado si y sólo si es un cuadrado en Z/pZ. En efecto, basta con considerar
el polinomio P = x2 − a. Si este polinomio tiene soluciones en Z/pn Z, entonces
claramente tiene en Z/pZ. Por otra parte, si tiene soluciones en Z/pZ, entonces el
Lema de Hensel nos dice que tiene soluciones en Z/pn Z ya que P 0 = 2x y por ende
P 0 (b) = 2b 6≡ 0 (mód p) para b tal que b̄2 = ā.

Esto no es más que un caso particular del siguiente resultado.

Proposición 2.4.7. Sean a, k ∈ Z enteros coprimos con p. Entonces a es una


potencia k-ésima módulo pn si y sólo si lo es módulo p.

Demostración. Nuevamente, basta con considerar el polinomio P = xk − a. Si este


polinomio tiene soluciones en Z/pn Z, entonces claramente tiene en Z/pZ. Por otra
parte, si tiene soluciones en Z/pZ, entonces el Lema de Hensel nos dice que tiene
soluciones en Z/pn Z ya que P 0 = kxk−1 y por ende P 0 (b) = kbk−1 6≡ 0 (mód p)
para b tal que b̄k = ā. ^¨

¿Y qué pasa en el caso k = p? En este caso debemos ajustar un poco el Lema


de Hensel. Existen de hecho varias versiones más fuertes del Lema de Hensel que
relajan de una u otra forma la hipótesis sobre los puntos crı́ticos. Esta vez, nos
contentaremos con una demostración ad hoc del enunciado siguiente.

Proposición 2.4.8. Sea a ∈ Z un entero coprimo con p y sea n ≥ 3. Entonces a


es una potencia p-ésima módulo pn si y sólo si lo es módulo p3 .

Demostración. Es evidente que si a es un potencia p-ésima módulo pn , entonces


lo es módulo p3 . Supongamos entonces que a ≡ bk (mód p3 ) y sigamos un razona-
miento “a la Hensel”. Sea P el polinomio xp − a.
Construiremos una sucesión {bn }n≥3 de enteros tales que P (bn ) ≡ 0 (mód pn )
y bn ≡ b (mód p3 ). Para esto usamos la fórmula de recurrencia

1. b3 := b;
P (bn )
2. bn+1 = bn − p
.

32
Suponiendo entonces que bn posee las propiedades que queremos (lo cual es obvio
para n = 3), tenemos que
p p  
P (bn )i
  
P (bn ) P (bn ) X p p−i
P (bn+1 ) = P bn − = bn − −a = bn (−1)i − a.
p p i=0
i pi
P (bn ) P (bn )
Pero como P (bn ) ≡ 0 (mód pn ), tenemos que p
∈ Z y además p
≡ 0
P (bn )i
(mód pn−1 ). Y como n ≥ 3, pi
≡ 0 (mód pn+1 ) para i ≥ 2. Vemos entonces que
 
p p p−1 P (bn )
P (bn+1 ) ≡ bn − b − a (mód pn+1 )
1 n p
≡ P (bn ) − bp−1
n P (bn ) (mód pn+1 )
≡ P (bn )(1 − bnp−1 ) (mód pn+1 ).

Como bn 6= 0 (mód p), el pequeño teorema de Fermat (que veremos en la siguiente


sección) nos dice que p|(1 − bnp−1 ). Y como pn |P (bn ), vemos que P (bn+1 ) ≡ 0
(mód pn+1 ), lo que concluye la demostración. ^¨

2.5. El grupo (Z/nZ)∗ de unidades módulo n


En esta sección estudiaremos más en detalle el conjunto de los elementos in-
vertibles módulo n. La razón para postergar este estudio hasta este momento es
porque el Teorema chino de los restos y el Lema de Hensel nos lo harán más fácil.
Definición 2.5.1. Definimos el conjunto (Z/nZ)∗ como el subconjunto de Z/nZ
formado por las clases ā tales que a es invertible módulo n, es decir:

(Z/nZ)∗ := {ā ∈ Z/nZ | ∃b̄ ∈ Z/nZ, āb̄ = 1̄}.

Definimos la función ϕ de Euler como la función que a n ≥ 2 le asocia ϕ(n) :=


#(Z/nZ)∗ , el cardinal del conjunto de elementos invertibles módulo n. Por razones
estéticas (o prácticas), definimos también ϕ(1) := 1.
La primera propiedad que uno debe obtener de este conjunto es la siguiente (y
esta propiedad vale de hecho para todo anillo conmutativo unitario).
Proposición 2.5.2. El conjunto (Z/nZ)∗ es un grupo conmutativo finito para la
multiplicación.
Demostración. En efecto, si ā, ā0 ∈ Z/nZ son invertibles, entonces existen b̄, b̄0 ∈
Z/nZ tales que āb̄ = ā0 b̄0 = 1̄, lo que prueba que (āā)(b̄b̄0 ) = 1̄ y por lo tanto āā0 es
invertible. La asociatividad y conmutatividad de de la multiplicación son entonces
automáticas, al igual que la existencia del neutro 1̄. Por último, la existencia de un
inverso es evidente por definición. ^
¨

33
Habiendo probado que (Z/nZ)∗ es un grupo, vemos que la noción de orden de
un elemento invertible que definimos anteriormente es precisamente la noción de
orden de un elemento en el grupo (Z/nZ)∗ . Usando el clásico Teorema de Lagrange
en teorı́a de grupos, obtenemos inmediatamente un resultado famoso en el mundo
de las congruencias.
Teorema 2.5.3 (Euler-Fermat). Sea a ∈ Z tal que (a, n) = 1. Entonces aϕ(n) ≡ 1
(mód n).
Demostración. El Teorema de Lagrange nos dice que el orden de un elemento en un
grupo divide al orden del grupo. Sabemos entonces que el orden d de ā ∈ (Z/nZ)∗
divide a ϕ(n), i.e. ϕ(n) = dk. Por lo tanto,

āϕ(n) = ādk = (ād )k = 1̄k = 1̄.

^
¨

Observación.
La versión que usualmente se cita como el pequeño teorema de Fermat es que para
todo a ∈ Z y para p primo, ap ≡ a (mód p). Ahora, si exceptuamos el caso obvio
de a ≡ 0 (mód p), entonces a es invertible en Z/pZ y por lo tanto recuperamos
ap−1 ≡ 1 (mód p), que equivale al enunciado de arriba para n = p.
Cabe preguntarse ahora sobre la estructura del grupo (Z/nZ)∗ y el Q Teorema
chino de los restos nos ayuda bastante al respecto. En efecto, si n = ki=1 pαi i ,
entonces
(Z/nZ)∗ ' (Z/pα1 1 Z)∗ × · · · × (Z/pαk k Z)∗ .
En particular, ϕ(n) = ki=1 ϕ(pαi i ).
Q
Para convencerse de esto, basta con ver que si A y A0 son anillos, entonces
(A × A0 )∗ = A∗ × A0 ∗ . Ahora, esto se puede ver también sin invocar teorı́a de
anillos. En efecto, consideremos la función biyectiva que nos da el Teorema chino
de los restos:

φ : Z/nZ → Z/pα1 1 Z × · · · × Z/pαk k Z,


a + nZ 7→ (a + pα1 1 Z, . . . , a + pαk k Z).

Esta función claramente envı́a un elemento invertible a una k-tupla de elementos


invertibles, ya que si ab ≡ 1 (mód n), entonces también ab ≡ 1 (mód d) para todo
divisor d de n. Como sabemos que esta función es inyectiva, sólo nos queda mostrar
que a toda k-tupla
a := (a1 + pα1 1 Z, . . . , ak + pαk k Z),
con ai invertible para todo i, el elemento a + nZ tal que φ(a + nZ) = a es invertible
en Z/nZ. Pero esto es fácil, ya que si b1 , . . . , bk son tales que ai bi ≡ 1 (mód p)αi i ,

34
i
entonces existe un entero b ∈ Z tal que b ≡ bi (mód p)αi para todo 1 ≤ i ≤ k por
el mismo teorema. Por lo tanto, ab ≡ ai bi ≡ 1 (mód p)αi i para todo 1 ≤ i ≤ k, lo
que equivale una vez más a ab ≡ 1 (mód n), lo que prueba que a es invertible.

Ejercicio. Pruebe de forma más general que si (m, n) = 1, entonces ϕ(mn) =


ϕ(m)ϕ(n).

Todo este análisis nos prueba que el caso interesante que debemos estudiar es
el grupo (Z/pα Z)∗ para un número primo p y un exponente α ≥ 1. Comencemos
pues con el caso de α = 1, es decir, con el grupo (Z/pZ)∗ .

Para analizar el grupo (Z/pZ)∗ , debemos recordar que Z/pZ es un cuerpo,


también denotado por Fp . En efecto, por la Proposición 2.2.2, todo elemento no
nulo es invertible en Z/pZ ya que todo entero 1 ≤ a ≤ p − 1 es tal que (a, p) = 1.
En particular, vemos que ϕ(p) = p − 1, lo que nos dice al menos el orden del grupo
(Z/pZ)∗ . Nuestro plan ahora es demostrar la siguiente proposición:

Proposición 2.5.4. El grupo (Z/pZ)∗ es ćiclico.

Para demostrar esto, necesitaremos el siguiente lema sobre grupos cı́clicos, el


cual se relaciona con la función ϕ.

Lema 2.5.5. Sean m, n ∈ N tales que m|n. Entonces existen ϕ(m) elementos de
orden m en el grupo cı́clico (aditivo) Cn = Z/nZ.

Demostración. El orden del elemento ā es m si y sólo si m es el menor entero tal


que mā = 0̄, es decir tal que n|ma. En otras palabras, ma es el menor múltiplo de
a que es también un múltiplo de n. Por lo tanto, el orden de ā es m si y sólo si
an n
ma = mcm(a, n) = ⇔ m= .
(a, n) (a, n)

Si definimos m0 := m n
, esto también es equivalente a decir que m0 = (a, n), o incluso
a n a
( m0 , m0 ) = ( m0 , m) = 1.
Pero hay exactamente ϕ(m) posibilidades para ma0 módulo m, lo que nos da
exactamente ϕ(m) posibilidades para a módulo mm0 = n. ^
¨

Recordando que el orden de un elemento siempre divide al orden del grupo (que
en este caso es n), obtenemos el siguiente corolario de forma inmediata.

Corolario 2.5.6. Para todo n ≥ 2 tenemos que


X
ϕ(d) = n.
d|n

35
Con esto ya podemos demostrar el siguiente resultado, el cual nos da la Propo-
sición 2.5.4 como un corolario evidente.

Proposición 2.5.7. Sea K un cuerpo y G un subgrupo finito de K ∗ . Entonces G


es cı́clico.

Demostración. Sea N = |G|. Bastará entonces con ver que existe un elemento de
orden N en G. Para cada n ∈ N, sea ψ(n) el número de elementos de orden n en
G. Entonces, usando el corolario anterior,
X X
ψ(n) = N = ϕ(n).
n|N n|N

Supongamos por contradicción que no existe un elemento de orden N , es decir,


ψ(N ) = 0. Vista la suma anterior, existe entonces algún divisor n de N con ψ(n) >
ϕ(n). En particular ψ(n) > 0 y por lo tanto existe al menos un elemento de orden
n en G. El subgrupo generado por este elemento es entonces isomorfo a Z/nZ y por
lo tanto hay al menos ϕ(d) elementos de orden d en G para todo d que divide a n,
es decir ψ(d) ≥ ϕ(d). Sumando sobre todos los divisores de n, obtenemos entonces
que X X
ψ(d) > ϕ(d) = n,
d|n d|n

es decir, hay más de n elementos x ∈ G cuyo orden divide a n, i.e. tales que xn = 1.
En otras palabras, la ecuación xn − 1 = 0 tiene más de n soluciones en el cuerpo
K. Pero sabemos que un polinomio de grado n sobre un cuerpo no puede tener
más de n raices, por lo que llegamos a una contradicción. ^
¨

Habiendo entendido que (Z/pZ)∗ es un grupo cı́clico de orden p − 1, pasemos


pues a (Z/pα Z)∗ . Juntando la última proposición con el Lema de Hensel, obtenemos
ya el siguiente resultado.

Corolario 2.5.8. Para todo α ∈ N, el grupo (Z/pα Z)∗ contiene un elemento de


orden p − 1.

Demostración. Basta con aplicar el Lema de Hensel al polinomio P = xp−1 − 1,


cuyo polinomio derivado P 0 = (p − 1)xp−2 es no nulo para todo x ∈ (Z/pZ)∗ . ^
¨

Evidentemente, esto no es suficiente para describir el grupo (Z/pα Z)∗ , pero es


un comienzo y una pieza importante del resultado final. Veamos ahora el orden de
este grupo.

Proposición 2.5.9. Para todo α ≥ 1, ϕ(pα ) = pα−1 (p − 1).

36
Demostración. En efecto, como el único primo que divide a pα es p, tenemos que
(a, pα ) 6= 1 si y sólo si p|a. Esto nos dice que las clases en Z/pα Z que no son
invertibles son aquellas representadas por un múltiplo de p. Ahora, los múltiplos
de p entre 1 y pα son:
p, 2p, 3p, . . . , pα−1 p.
Vemos pues que hay exactamente pα−1 múltiplos de p, por lo que hay pα − pα−1
elementos invertibles en Z/pα Z, es decir ϕ(pα ) = pα−1 (p − 1). ^
¨

El corolario anterior nos dio un elemento de orden p − 1. Ahora intentaremos


encontrar un elemento de orden pα−1 . Para ello demostramos el siguiente resultado.

Lema 2.5.10. Sea k ∈ N y p un primo. Si se cumple al menos una de las condi-


ciones siguientes:

1. p es impar;

2. k ≥ 2;

entonces para cada entero t relativamente primo con p se tiene (1+tpk )p = 1+spk+1
para algún entero s relativamente primo con p.

Demostración. Usando la fórmula del binomio de Newton,


p  
k p
X p i ki
(1 + tp ) = tp .
i=0
i

Ahora, es fácil ver que pk+1 |pki para todo i ≥ 2, mientras que el término para i = 1
es tpk+1 . Por lo tanto,
p  
!
X p
(1 + tpk )p = 1 + pk+1 t + ti pki−(k+1) .
i=2
i

El lema se demuestra entonces notando que:

1. Si p es impar, entonces p2 es divisible por p y para todo i ≥ 3 tenemos que




ki − (k + 1) > 0, por lo que la suma completa es divisible por p.

2. Si k ≥ 2, tenemos que ki − (k + 1) > 0 para todo i ≥ 2, por lo que la suma


completa es divisible por p.
P
Por lo tanto s = t + es el entero coprimo a p que buscamos. ^
¨

La aplicación no se hace esperar.

37
Corolario 2.5.11. Si p es un primo impar, entonces (Z/pα Z)∗ tiene un elemento
de orden pr−1 para cada entero positivo r ≤ α.

Demostración. Por el Lema 2.5.10, sabemos que 1 + spα−1 representa una clase de
orden p en (Z/pα Z)∗ para todo s coprimo a p.
Ahora, si suponemos que 1+spα−k representa una clase de orden pk en (Z/pα Z)∗
para todo s coprimo a p, entonces el Lema 2.5.10 nos dice también que 1 + tpα−k−1
representa una clase de orden pk+1 en (Z/pα Z)∗ para todo t coprimo a p. Esto
prueba el corolario por inducción. ^
¨

Con esto ya tenemos todo lo necesario para probar resultado final en el caso de
p primo impar.

Proposición 2.5.12. Si p es un primo impar, entonces (Z/pα Z)∗ es cı́clico de


orden ϕ(pα ) = pα−1 (p − 1).

Demostración. Notemos que, como (pα−1 , p − 1) = 1, el Teorema chino de los


restos nos dice que un grupo cı́clico de orden pα−1 (p − 1) es isomorfo al producto
Z/pα−1 Z × Z/(p − 1)Z. Por lo tanto, basta con encontrar elementos ā, b̄ ∈ (Z/pα Z)∗
de órdenes respectivos pα−1 y p − 1. El Lema 2.5.10 nos dice que ā = 1̄ + p̄ cumple
con lo pedido, mientras que el Corolario 2.5.8 asegura la existencia de b̄ (sin darnos
por tanto un elemento explı́cito). Esto concluye la demostración. ^
¨

Veamos ahora el caso de p = 2, donde la estructura de grupo de (Z/2α Z)∗ no se


porta tan bien como en el caso impar. Notemos ante todo que (Z/2Z)∗ es el grupo
trivial y que (Z/4Z)∗ es un grupo de orden 2, por ende cı́clico. Pero es ahı́ donde
se acaban los grupos cı́clicos.

Proposición 2.5.13. Para todo entero α > 2, el grupo (Z/2α Z)∗ es el producto
de dos grupos cı́clicos de orden 2 y 2α−2 respectivamente. Además, el primer grupo
está generado por −1 y el segundo grupo está generado por 5.

Demostración. Usando el Lema 2.5.10, podemos demostrar por inducción sobre k


que
k
5k = (1 + 1 · 22 )2 = 1 + sk 2k+2 ,
con sk impar, para todo k ≥ 0. Esto prueba que el orden de 5 es 2α−2 . Además,
como 5 ≡ 1 (mód 4), sabemos que toda potencia de 5 es congruente a 1 módulo 4.
α
Pero claramente hay 24 = 2α−2 clases en Z/2α Z representadas por tales elementos,
por lo que las potencias de 5 las cubren todas.
Para concluir, basta con notar entonces que toda clase ā ∈ (Z/2α Z)∗ es tal que a
es impar y por ende, o bien a ≡ 1 (mód 4), o a ≡ 3 (mód 4) y por lo tanto −a ≡ 1
(mód 4). Esto prueba que el grupo es el producto de los subgrupos generados por
5 y −1, de órdenes respectivos 2α−2 y 2. ^
¨

38
Juntando todos estos resultados con la descomposición dada por el Teorema
chino de los restos, obtenemos el siguiente resultado general.

Teorema 2.5.14. Sea n ∈ N y supongamos que n = 2r ki=1 pαi i con r ≥ 0, pi


Q
primo impar, αi ≥ 1 y pi 6= pj si i 6= j. Entonces, recordando que ϕ(pαi i ) =
pαi i −1 (pi − 1).

Si r ∈ {0, 1}, ϕ(n) = ki=1 pαi i −1 (pi − 1) y


Q

k
Y
(Z/nZ)∗ ' Z/ϕ(pαi i )Z.
i=1

Qk
Si r ≥ 2, ϕ(n) = 2r−1 i=1 pαi i −1 (pi − 1) y
k
Y

(Z/nZ) ' Z/2Z × Z/2 r−2
Z× Z/ϕ(pαi i )Z.
i=1

En particular, tenemos el siguiente corolario.

Corolario 2.5.15. El grupo (Z/nZ)∗ es cı́clico si y sólo si n ∈ {2, 4, pα , 2pα } donde


p es un primo impar y α ≥ 1.

Demostración. El hecho de que (Z/nZ)∗ es cı́clico en los 4 casos es inmediato


a partir del teorema precedente. Para ver que en los otros casos el grupo no es
cı́clico, basta con notar que hay más de un elemento de orden 2, lo que contradice
la ciclicidad por el Lema 2.5.5. Si r ≥ 3, tenemos 2 tales elementos ya en Z/2Z ×
Z/2r−2 Z. Por otra parte, hay un elemento de orden 2 en cada factor Z/ϕ(pαi i )Z ya
que 2|(pi − 1). Por lo tanto, si k ≥ 2, o si r = 2 y k = 1, tenemos al menos dos
elementos de orden 2 también. ^¨

3. Cuadrados
Uno de los primeros objetos de interés en teorı́a de números son los cuadrados.
En esta sección los estudiaremos de diversas maneras, tanto en el mundo de los
enteros como en el mundo de las congruencias. Comenzaremos con varios tipos de
ecuaciones diofánticas (i.e. ecuaciones con coeficientes enteros y cuyas soluciones
se buscan en los enteros).

39
3.1. Triples pitagóricos
Los triples pitagóricos son los triples de enteros (x, y, z) ∈ N3 tales que

x2 + y 2 = z 2 .

El más famoso (y el más pequeño) de éstos es el triple (3, 4, 5). Le sigue de cer-
ca el triple (5, 12, 13). Seguramente el lector conoce unos cuantos más. Pero cabe
preguntarse cuantos hay realmente (probablemente una infinidad) y si podemos
describirlos de alguna manera. Este es el objetivo de esta sección.

Comencemos pues por lo obvio: existe en efecto una infinidad de triples pi-
tagóricos ya que siempre podemos multiplicar el famoso triángulo (3, 4, 5) por un
entero y obtener, por ejemplo, los triples (6, 8, 10) o (9, 12, 15). Más precisamente,
tenemos el resultado siguiente, cuya demostración es obvia:

Lema 3.1.1. Si (a, b, c) es un triple pitagórico, entonces (λa, λb, λc) también lo es
para todo λ ∈ N. Además, si d|a, d|b y d|c, entonces ( ad , db , dc ) también es un triple
pitagórico.

Esto nos hace replantear la pregunta sobre la infinidad de soluciones de la


siguiente manera.

Definición 3.1.2. Decimos que un triple pitagórico (a, b, c) es simple o reducido


si no existe un divisor común a a, b y c.

¿Existirá entonces una infinidad de triples pitagóricos simples? La respuesta


aquı́ es nuevamente sı́, pero por razones un poco menos obvias.

Lema 3.1.3. Para todo número impar n = 2m + 1 ∈ N, existen r, s ∈ N tales que


r2 − s2 = n.

Demostración. En efecto, basta con tomar r = m + 1 y s = m. Tenemos entonces


que
r2 − s2 = (m + 1)2 − m2 = 2m + 1 = n.
^
¨

Usando este lema es fácil notar que, para todo entero impar n ∈ N podemos
escribir n2 = 2m + 1 y, según el lema, el triple (n, m, m + 1) es pitagórico. Como
además (m, m + 1) = 1, vemos que el triple es reducido, por lo que hay realmente
una infinidad de triples reducidos. Los triples que mencionamos antes, (3, 4, 5) y
(5, 12, 13) son precisamente de este tipo. Pero basta con nombrar el triple reducido
(8, 15, 17) para ver que este no es el fin de la historia. El final se ve más o menos
ası́:

40
Teorema 3.1.4. Sea (x, y, z) un triple pitagórico reducido. Entonces o x es par
o y es par. En el caso en que x es par, existen enteros m, n ∈ N de paridades
opuestas tales que m > n, (m, n) = 1 y
x = 2mn, y = m2 − n2 , z = m2 + n2 .
Además, para todo par de enteros m, n ∈ N de paridades opuestas y tales que m > n
y (m, n) = 1, estas fórmulas generan un triple pitagórico reducido.
Este resultado nos da entonces una parametrización biunı́voca de los triples
pitagóricos simples vı́a los pares (m, n) que satisfacen las condiciones pedidas (evi-
dentemente, módulo intercambio de x e y). Agregando los múltiplos de éstos, te-
nemos una clasificación completa de los triples pitagóricos.
Demostración. Supongamos que tanto x como y son impares. Entonces x2 e y 2 son
congruentes a 1 módulo 4, por lo que z 2 ≡ 2 (mód 4). Pero esto es imposible ya
que todo cuadrado par es un múltiplo de 4. Vemos pues que al menos uno de x e y
debe ser par. Como además el triple es reducido, vemos que (x, y) = 1, por lo que
el otro número debe ser impar, al igual que z. De ahora en adelante, supondremos
que es x el número par.
Como x es par, podemos escribir x = 2x0 . La ecuación original se puede rees-
cribir entonces como
2
4x0 = (z + y)(z − y).
Ahora, como y y z son ambos impares, los términos z + y y z − y tienen la misma
paridad, lo que implica que ambos son pares. Además, si d es un divisor común de
z + y y z − y, entonces d divide a 2z y 2y, por lo que d|2 ya que (y, z) = 1. En
otras palabras, los enteros z+y
2
y z−y
2
son coprimos. Como el producto de ellos es
un cuadrado, vemos que cada uno debe ser un cuadrado (esto se ve por ejemplo
con las valuaciones p-ádicas de cada uno). Podemos escribir entonces
z+y z−y
= m2 , = n2 ,
2 2
con m, n ∈ N y (m, n) = 1. En particular, y = m2 − n2 y z = m2 + n2 , por lo que
si m y n fuesen ambos impares tendrı́amos que y y z serı́an pares, lo que no puede
ser. Vemos pues que m y n tienen además paridades opuestas. Reemplazando estos
nuevos términos en la ecuación original, tenemos que
x2 = 4m2 n2 ,
es decir x = 2mn ya que x, m, n ∈ N.
Para concluir la demostración del teorema, sean m, n ∈ N de paridades opues-
tas, coprimos y tales que m > n. Vemos entonces que (x, y, z) := (2mn, m2 −
n2 , m2 + n2 ) es un triple pitagórico ya que
(2mn)2 + (m2 − n2 ) = 4m2 n2 + m4 − 2m2 n2 + n4 = m4 + 2m2 n2 + n4 = (m2 + n2 )2 .

41
Además el triple es reducido: Si d es un divisor común de y y z, entonces d|2m2
y d|2n2 , por lo que d|2 ya que (m2 , n2 ) = (m, n) = 1. Pero como m y n son de
paridades opuestas, tenemos que y y z son impares, por lo que d debe ser impar y
por ende d = 1, es decir (y, z) = 1. La afirmación final sobre los triples pitagóricos
en general es evidente a partir de lo que hemos hecho. ^
¨

La demostración que acabamos de ver usa tan sólo propiedades de los núme-
ros enteros. Pero como la ecuación que estamos mirando es homogénea, podemos
estudiarla de otra manera usando los números racionales. En efecto, a todo tri-
ple pitagórico (a, b, c) podemos asociar el par de números racionales ( ac , cb ) que es
solución de la ecuación
x2 + y 2 = 1. (2)
En sentido inverso, toda solución racional de esta ecuación puede ser escrita de
la forma ( ac , cb ) con a, b, c ∈ Z (basta con poner ambas fracciones con el mismo
denominador), lo que nos da, salvo signos, el triple pitagórico (a, b, c), el cual es
además reducido si suponemos que al menos una de las fracciones es reducida.

Veamos pues una segunda demostración del último teorema, esta vez usando
métodos geométricos sobre los racionales.
Segunda demostración del Teorema 3.1.4. Demostraremos que, aparte de la solu-
ción obvia (0, 1), toda solución racional de la ecuación (2) es de la forma

2t 1 − t2
 
(x, y) = , , t ∈ Q.
1 + t2 1 + t2
n
Nótese que si escribimos t = m
con m, n ∈ Z, recuperamos las fórmulas de la
demostración precedente.

La idea principal detrás de la demostración es la siguiente: si (x, y) es una


solución racional de la ecuación (2), entonces la recta que une el punto (x, y) con
el punto (0, 1) tiene que tener pendiente racional. Esto es un hecho básico de la
geometrı́a del colegio, por lo que no ahondaremos en detalles.
Lo interesante es que la afirmación recı́proca también es cierta: si L es una
recta que pasa por (0, 1) y que tiene pendiente racional, entonces su intersección
con el cı́rculo será un punto con coordenadas racionales. En efecto, sea −t ∈ Q la
pendiente de L (tomamos pendiente negativa para obtener un x positivo: haga un
dibujo para convencerse). Entonces la ecuación de L es y = −tx + 1 y el punto
que buscamos es la intersección de L y el cı́rculo dado por (2). Reemplazando

42
obtenemos

x2 + (−tx + 1)2 = 1
x2 + t2 x2 − 2tx + 1 = 1
x((1 + t2 )x − 2t) = 0.

El factor x de la izquierda corresponde a la solución obvia (x, y) = (0, 1) que tam-


bién está en la intersección de L y el cı́rculo. En el otro caso, obtenemos finalmente
2t 1−t2
x = 1+t 2 y reemplazando en la ecuación de L vemos que y = 1+t2 . Esto prueba

la afirmación y de paso que toda solución racional del cı́rculo debe ser de esta
forma. ^
¨

3.2. Descenso infinito y la ecuación de Fermat


El “descenso infinito” es una manera de probar la inexistencia de soluciones
enteras a diversas ecuaciones bajo el siguiente principio: si a partir de una solución
puedo fabricar una “más pequeña” (en algún buen sentido de la palabra), entonces
al iterar este proceso fabricaremos una sucesión infinita de soluciones cada vez más
pequeñas, lo que será una contradicción con (alguna versión de) el Axioma del
buen orden.

Ejemplo 3.2.1. Veamos todo esto en un ejemplo que data de la época de Pitágoras
(i.e. cerca del 500 AC). Consideremos la ecuación

x2 = 2y 2 .

Queremos demostrar que no existe una solución de esta ecuación en números ente-
ros positivos. Supongamos pues que existe una tal solución (a, b) ∈ N2 y notemos
que en ese caso 2|a2 , por lo que 2|a y por ende a = 2a0 con a0 ∈ N. Por lo tanto
2 2
4a0 = 2b2 , y entonces 2a0 = b2 ,

por lo que 2|b2 y por ende b = 2b0 como ocurrió con a. Por lo tanto,
2 2 2 2
2a0 = 4b0 , y entonces a0 = 2b0 ,

lo que nos dice que (a0 , b0 ) ∈ N2 es una solución más pequeña de la ecuación.
Iterando el proceso, tenemos una sucesión de soluciones {(an , bn )}n∈N con an+1 < an
para todo n ∈ N y esto es claramente una contradicción, probando ası́ que no
existen soluciones.
Evidentemente, hoy esto nos parece obvio ya que una solución nos darı́a ( xy )2 =

2, con lo que 2 serı́a racional. Pero es √ precisamente el descenso infinito el que
permite demostrar la irracionalidad de 2.

43
Esta idea de descenso infinito fue transformada en un método efectivo y usada
regularmente por Fermat, hace poco menos de 400 años. Armado con este método,
Fermat enunció en el borde de un libro el siguiente resultado. . . sin demostración.

Teorema 3.2.2 (Teorema de Fermat-Wiles). Sea n ∈ N con n ≥ 3. Entonces no


existen soluciones (x, y, z) ∈ N3 de la ecuación

xn + y n = z n .

Nótese que este teorema contrasta radicalmente con el caso n = 2, en el cual


encontramos una infinidad de soluciones y fuimos capaces de clasificarlas sin mucho
esfuerzo. Wiles demostró este teorema1 recién en 1994, más de 350 años después de
que fuera enunciado por Fermat, quien afirmaba por cierto conocer una demostra-
ción. Sin embargo, hoy creemos que su idea era usar su método de descenso infinito,
en cuyo caso se equivocó al pensar que su método se aplicaba para cualquier n.
Pero al menos el método sı́ funciona para n = 4, por lo que aquı́ demostraremos lo
siguiente.

Teorema 3.2.3 (Fermat). No existen soluciones (x, y, z) ∈ N3 de la ecuación

x4 + y 4 = z 4 .

Demostración. De hecho, demostraremos algo un poco más fuerte, a saber que


no hay soluciones de la ecuación x4 + y 4 = z 2 . Supongamos pues que existe una
solución (a, b, c) ∈ N3 y fabriquemos una más pequeña. Si (a, b) = d > 1, entonces
d4 |c2 y por lo tanto d2 |c, por lo que ( ad , db , dc2 ) es una solución más pequeña. Si
no, (a, b) = 1, en cuyo caso podemos aplicar el Teorema 3.1.4 al triple pitagórico
reducido (a2 , b2 , c) y obtener enteros m, n ∈ N2 coprimos, de paridades opuestas
tales que, salvo intercambiar a y b,

a2 = 2mn, b2 = m2 − n2 c = m2 + n2 .

De la segunda igualdad, como (m, n) = 1, sacamos el triple pitagórico reducido


(b, n, m). Además, sabemos que b es impar (ya que a es par), por lo que el Teorema
3.1.4 nos dice ahora que existen enteros u, v ∈ N2 coprimos, de paridades opuestas
tales que
n = 2uv, b = u2 − v 2 , m = u2 + v 2 .
Volviendo a a, tenemos entonces que

a2 = 4uv(u2 + v 2 ),
1
Para entender su demostración, saque primero un doctorado en matemáticas con especialidad
en teorı́a de números y geometrı́a algebraica ^
¨

44
y además (u, u2 + v 2 ) = (v, u2 + v 2 ) = (u, v) = 1. En otras palabras, tenemos un
producto de números coprimos dos a dos que es un cuadrado. Esto significa que
cada uno de estos enteros es un cuadrado, es decir
2 2 2
u = a0 , v = b0 , u2 + v 2 = c0 .
Y esto nos da inmediatamente que
4 4 2
a0 + b 0 = c 0 ,
pero además c0 < c ya que
2
c0 ≤ c0 = u2 + v 2 = m < m2 + n2 = c.
Iterando este procedimiento, obtenemos una contradicción ya que no podemos tener
c0 < c indefinidamente. ^
¨

Ejercicio. Pruebe que no existen soluciones en enteros positivos a la ecuación


x3 + 9y 3 = 3z 3 .
Observación.
El método geométrico-algebraico que vimos en la sección precedente también se
aplica bastante para fabricar argumentos de descenso infinito. En efecto, partiendo
de una solución racional y tomando una recta con pendiente racional, uno puede
encontrar más soluciones racionales de una ecuación dada. Y si uno escoje bien
estas pendientes, se puede lograr que la nueva solución sea “más pequeña” en
algún sentido (usualmente, se busca que la cantidad máx(|a|, |b|) para una fracción
a
b
disminuya).
Otra ecuación en la que interviene el proceso de descenso infinito es la ecuación
de Pell, que estudiaremos más adelante.

3.3. Sumas de dos cuadrados


Luego de ver los triples pitagóricos, podemos preguntarnos en general cuales
son los números n ∈ N que se expresan como suma de dos cuadrados. En otras
palabras, buscamos resolver la ecuación
x2 + y 2 = n,
con x, y, n ∈ N0 . Evidentemente, si n = m2 para algún m ∈ N0 , siempre podemos
escoger x = m e y = 0, por lo que la cosa se pone interesante cuando n no es un
cuadrado.

Cuando se trata de resolver ecuaciones con soluciones enteras, las congruencias


suelen ser muy útiles para encontrar criterios negativos. Por ejemplo, tenemos el
siguiente resultado:

45
Proposición 3.3.1. Supongamos que n ≡ 3 (mód 4). Entonces n no puede ser
expresado como suma de cuadrados.
Demostración. En efecto, si x, y ∈ N0 son tales que x2 +y 2 = n, entonces x2 +y 2 ≡ n
(mód 4). Ahora, sabemos bien que 02 ≡ 22 ≡ 0 (mód 4) y que 12 ≡ 32 ≡ 1
(mód 4), por lo que x2 + y 2 es congruente a 0, 1 ó 2 módulo 4. En particular, vemos
que n no puede ser congruente a 3 módulo 4. ^
¨

Pero ¿qué hay de las otras 3 posibilidades? Es difı́cil decidirlo ası́ como ası́.
Veamos pues un resultado parcial, demostrado por Fermat (sı́, él una vez más).
Teorema 3.3.2 (Fermat). Sea p ∈ N un número primo que no es congruente a 3
módulo 4. Entonces p se puede expresar como suma de dos cuadrados.
Demostración. Evidentemente, 2 = 12 + 12 , por lo que podemos suponer que p es
impar. Como se nos dice que p 6≡ 3 (mód 4), debemos usar esta información de
alguna manera. El primer paso es el siguiente
Lema 3.3.3. La clase de −1 es un cuadrado módulo p si y sólo si p 6≡ 3 (mód 4).
Este lema se puede demostrar de (al menos) dos maneras. Una usando lo que ya
sabemos de teorı́a de grupos, y otra que no requiere ningún conocimiento particular
en este sentido. Veamos ambas demostraciones. En ambos casos nos concentramos
en un primo p impar ya que el caso p = 2 es obvio (y de todas formas ya probamos
el teorema para p = 2).
Primera demostración. Sabemos que la clase de −1 tiene orden 2 en (Z/pZ)∗ y
que este grupo es cı́clico. Recordemos que el Lema 2.5.5 nos dice que hay tan sólo
un elemento de orden 2 en un grupo cı́clico. Esto quiere decir que, si encontramos
un elemento s de orden 4, entonces s2 = −1̄ ya que s2 tiene orden 2. Ahora, como
ϕ(p) = p − 1 y p ≡ 1 (mód 4), vemos que 4|(p − 1) y el mismo Lema 2.5.5 nos dice
entonces que hay ϕ(4) = 2 elementos de orden 4 en (Z/pZ)∗ , lo que prueba que
−1̄ es un cuadrado módulo p.
Por otra parte, si p ≡ 3 (mód 4), entonces 4 - (p − 1), por lo que no hay
elementos de orden 4 en (Z/pZ)∗ . Pero si s2 = −1 entonces s es de orden 4, por lo
que un tal s no existe en este caso. ^¨

Segunda demostración. Consideremos la relación R en (Z/pZ)∗ dada por

xRy ⇔ x = y, ó x = −y, ó x = y −1 , ó x = −y −1 .

Es evidente que esta relación es reflexiva y simétrica. También es transitiva, lo que


se verifica rápidamente caso por caso. Por lo tanto, R es una relación de equivalencia
cuyas clases se ven generalmente como

{x, −x, x−1 , −x−1 }.

46
Sin embargo, es posible que algunos de estos 4 elementos sean iguales entre sı́.
Estudiemos esta posibilidad caso por caso:

Si x = −x, entonces 2x = 0̄ y por ende x = 0̄ ya que (p, 2) = 1. Esa opción


es por lo tanto imposible.

Si x = x−1 , entonces x2 = 1̄, por lo que x = ±1̄. Esto da lugar a la clase


{1̄, −1̄}, la cual tiene 2 elementos en lugar de tener 4.

Si x = −x−1 , entonces x2 = −1̄. En este caso, claramente tenemos que


(−x)2 = −1̄, por lo que obtenemos una clase {x, −x} de 2 elementos también.

Vemos entonces que la relación R particiona a (Z/pZ)∗ en varios subconjuntos de 4


elementos y uno o dos subconjuntos de 2 elementos. Nótese además que la tercera
posibilidad sólo ocurre si −1̄ es un cuadrado en Z/pZ. Vemos entonces que −1̄
no es un cuadrado en Z/pZ si y sólo si hay exactamente una clase de R con dos
elementos cada una, lo cual ocurre si y sólo si (Z/pZ)∗ tiene 4k + 2 elementos para
algún k ∈ N. Pero esto es equivalente a p = 4k + 3, por lo que −1̄ es un cuadrado
en Z/pZ si y sólo si p 6≡ 3 (mód 4). ^
¨

Habiendo demostrado el lema, consideremos el conjunto



C := {(x0 , y 0 ) ∈ Z2 | 0 ≤ x0 , y 0 < p},

√ p ≡√1 (mód
para √4) primo. Nótese que p claramente no es un√ entero,
 por lo que
p < p< p + 1.√Vemos fácilmente entonces que hay ( p + 1)2 parejas
√ 2 
en C. Pero p = p < ( p + 1)2 , por lo que hay estrictamente más de p parejas
en C.
Sea ahora s ∈ Z tal que s2 ≡ −1 (mód p). Un tal entero existe gracias al lema
anterior. Si consideramos entonces los valores x0 − sy 0 para (x0 , y 0 ) ∈ C, tenemos
que hay más de p valores distintos. El principio del palomar nos dice entonces que
existen dos valores que son congruentes módulo p, es decir, existen pares distintos
(x0 , y 0 ), (x00 , y 00 ) ∈ C tales que

x0 − sy 0 ≡ x00 − sy 00 (mód p).

En particular, x0 − x00 ≡ s(y 0 − y 00 ) (mód p). Definamos entonces

x := |x0 − x00 | e y := |y 0 − y 00 |,

para obtener un par (x, y) ∈ C tal que (x, y) 6= (0, 0) y x ≡ ±sy (mód p). Basta
ahora con elevar al cuadrado para obtener

x2 ≡ −y 2 (mód p), o bien x2 + y 2 ≡ 0 (mód p).

47

Recordando ahora que tanto x como y son menores que p, vemos que x2 +y 2 < 2p.
Por otra parte, sabemos que x2 + y 2 > 0 ya que (x, y) 6= (0, 0). El único múltiplo
de p que queda entre 0 y 2p es p, por lo que obtenemos finalmente x2 + y 2 = p, lo
que concluye la demostración del teorema. ^
¨

Observación.
Existe una demostración de este teorema en una frase. Ésta fue dada por Don
Zagier en 1990 y será estudiada en ayudantı́a. La frase dice más o menos ası́:

La involución del conjunto finito S := {(x, y, z) ∈ N3 | x2 + 4yz = p} dada por



(x + 2z, z, y − x − z) si x < y − z

(x, y, z) 7→ (2y − x, y, x − y + z) si y − z < x < 2y

(x + 2y, x − y + z, y) si x > 2y

tiene exactamente un punto fijo, por lo que |S| es impar y la involución dada por
(x, y, z) 7→ (x, z, y) tiene también un punto fijo.
Con este resultado a la mano, podemos intentar atacar el problema general. Ne-
cesitaremos sin embargo un lema cuya demostración parece “sacada del sombrero”
(pronto veremos que no es tan ası́).
Lema 3.3.4. El producto de dos números que se expresan como suma de dos
cuadrados es una suma de dos cuadrados.
Demostración. Basta con notar que

(a2 + b2 )(x2 + y 2 ) = (ax − by)2 + (ay + bx)2 .

^
¨

Con este lema ya tenemos la mitad del siguiente enunciado, el cual responde a
la pregunta general.
Teorema 3.3.5. Un entero n ∈ N se puede escribir como suma de cuadrados si y
sólo si vp (n) es par para todo p ≡ 3 (mód 4).
Demostración. Supongamos que n posee la hipótesis sobre vp para p ≡ 3 (mód 4).
Veamos la factorización prima de n de la siguiente manera:
Y Y
n= pvp (n) · pvp (n) .
p6≡3 mod 4 p≡3 mod 4

Todo elemento del primer producto es una suma de cuadrados por el Teorema 3.3.2.
El Lema 3.3.4 nos dice entonces que el primer producto es una suma a2 + b2 con

48
a, b ∈ N0 . Ahora, del otro lado tenemos que todo exponente es par por hipótesis,
por lo que se trata de un cuadrado, digamos c2 . Vemos entonces que
n = (a2 + b2 )c2 = (ac)2 + (bc)2 .
Supongamos ahora que n = a2 + b2 . Debemos probar que vp (n) es par para
todo primo p ≡ 3 (mód 4) y lo haremos por inducción sobre n. Evidentemente,
esto es cierto para los p que no dividen a n. En particular es cierto para todo p si
n = 1, lo que nos permite iniciar la inducción. Supongamos pues que p|n para un
n arbitrario. Tenemos entonces que
a2 + b 2 = n ≡ 0 (mód p).
Supongamos que (b, p) = 1, de forma que b sea invertible módulo p. Multiplicando
por un representante b0 de su inverso tenemos entonces a2 b0 2 + 1 ≡ 0 (mód p),
es decir, (ab0 )2 ≡ −1 (mód p). Pero sabemos que esto es imposible por el Lema
3.3.3 ya que p ≡ 3 (mód 4). Vemos entonces que nuestra hipótesis (b, p) = 1
es falsa, es decir p|b. El mismo argumento se aplica naturalmente a a y vemos
entonces que p2 |a2 y p2 |b2 , por lo que p2 |n. Si definimos ahora m := pn2 , tenemos
que m = ( ap )2 + ( pb )2 y vp (m) = vp (n) − 2. Por hipótesis de inducción, tenemos que
vp (m) es par y por lo tanto vp (n) = vp (m) + 2 también es par, lo que concluye la
demostración. ^¨

3.4. Los enteros de Gauss


Los enteros de Gauss están fuertemente relacionados con las sumas de cuadra-
dos, como lo veremos enseguida. Se trata del subanillo de C dado por
Z[i] := {a + bi | a, b ∈ Z},
donde i representa, como de costumbre, una raı́z cuadrada de −1. Nótese que se
trata realmente de un subanillo, ya que
(a + bi) + (c + di) = (a + c) + (b + d)i;
(a + bi)(c + di) = (ac − bd) + (ad + bc)i;
y claramente los complejos de la derecha están en Z[i] también. Evidentemente
también Z ⊂ Z[i], por lo que podemos preguntarnos hasta qué punto los resultados
que hemos probado en este curso sobre Z (divisibilidad, división euclideana, Lema
de Gauss, Teorema de Bézout, Teorema fundamental de la aritmética) se extienden
al anillo Z[i].
Pero antes de pasar a los teoremas, veamos si las definiciones tienen sentido en
este anillo. La noción de divisibilidad tiene sentido en cualquier anillo ya que sólo
usa la multiplicación, pero ¿qué hay de la definición de número primo?

49
Definición 3.4.1. Decimos que un entero de Gauss u ∈ Z[i] es una unidad si u
es invertible en Z[i], es decir, si existe u0 ∈ Z[i] tal que uu0 = 1. El conjunto de las
unidades es denotado por Z[i]∗ y el inverso u0 es denotado u−1 .
Decimos que un entero de Gauss π ∈ Z[i] es primo si π 6∈ Z[i]∗ y los únicos
divisores de π son unidades o elementos de la forma uπ con u ∈ Z[i]∗ .
Notación. Como veremos más adelante, un primo p ∈ Z puede ser primo en Z y
no en Z[i] o bien ser primo en ambos anillos. Es por esto que hablaremos de primo
de Gauss cuando se trate de un elemento de Z[i] y reservaremos la nomenclatura
“primo” a secas para los enteros.
Nótese que esta definición de número primo es realmente una buena generaliza-
ción de la noción de primo sobre Z. En efecto, considerando la definición de unidad
sobre Z, es fácil ver que Z∗ = {±1}, por lo que nuestra definición de número primo
es realmente la misma que acabamos de dar (a saber, un número p ∈ Z divisible
por nadie más que ±1 y ±p). Por otra parte, todo número es divisible por al menos
estos números ya que para todo u ∈ Z[i]∗ , π = u(u−1 π) con u−1 ∈ Z[i], por lo que
nuestra definición de primo describe realmente a un elemento “multiplicativamente
minimal”.
Pero ¿cuántos divisores tiene un primo de Gauss? Esto nos lo dice sl siguiente
lema:
Lema 3.4.2. Tenemos la igualdad Z[i]∗ = {±1, ±i}. En particular, un entero de
Gauss es primo si y sólo si tiene exactamente 8 divisores.
Demostración. Como Z[i] es un subanillo de C, sabemos que todo elemento z ∈ Z[i]
posee un inverso multiplicativo z −1 en C. La pregunta es entonces si dicho inverso
se encuentra en Z[i]. Para ser más precisos, sabemos que
1 a b
(a + bi)−1 = (a − bi) = 2 − 2 i,
a2 +b 2 a +b 2 a + b2
a b
y la pregunta se vuelve entonces averiguar si a2 +b 2 y a2 +b2 están en Z cuando

a, b ∈ Z.
Ahora, es fácil ver que si |a| > 1, entonces |a| < a2 ≤ a2 + b2 , por lo que
a
a2 +b2
6∈ Z. Lo mismo corre para b, por lo que a, b ∈ {−1, 0, 1}. Esto nos deja 9
posibilidades para z = a + bi ∈ Z[i]∗ , que se dividen en 3 casos:
si a = b = 0, entonces z = a + bi = 0 y claramente no es invertible;

si a = ±1 y b = ±1, entonces a2 + b2 = 2 y vemos que z −1 6∈ Z[i];

si no, z ∈ {1, −1, i, −i} y todos estos elementos son claramente invertibles.
^
¨

50
Tenemos pues las nociones de divisibilidad y de números primos en este nuevo
anillo. Veamos ahora como nos va con la división euclideana. Para ello, necesitamos
una noción de tamaño de un entero de Gauss y usaremos para esto una variación
del caso complejo.
Definición 3.4.3. Definimos la norma de un entero de Gauss z = a + bi ∈ Z[i]
como el entero N (z) = a2 + b2 ∈ N0 .
Observación.
Nótese
√ que esto corresponde al cuadrado de la norma compleja clásica |a + bi| =
a2 + b2 . Las razones para este cambio son más profundas que el contenido de este
curso, ası́ que en este marco se trata más bien de una convención por comodidad
(por ejemplo, para no entrar al mundo de los números irracionales). Nótese también
que esta convención no afecta en nada el tamaño relativo de los elementos ya que
|a + bi| ≤ |c + di| si y sólo si a2 + b2 ≤ c2 + d2 .
Por último, nótese que la norma es una suma de dos cuadrados. Es de esta forma
que se relacionan los enteros de Gauss con la pregunta que nos planteábamos en la
sección anterior. En efecto: un entero positivo n ∈ N es una suma de dos cuadrados
si y sólo si existe un entero de Gauss z tal que N (z) = n.
Volveremos a esta última observación más adelante. Por ahora, notemos una
propiedad crucial de la norma, la cual explica finalmente el Lema 3.3.4.
Lema 3.4.4. La norma es multiplicativa, es decir, N (zz 0 ) = N (z)N (z 0 ) para todo
z, z 0 ∈ Z[i].
Demostración. Esto es una mera consecuencia de la multiplicatividad de la norma
compleja. En efecto, sabemos que |zz 0 | = |z||z 0 |, por lo que, elevando al cuadrado,
obtenemos la igualdad del enunciado. ^
¨

Corolario 3.4.5. El producto de dos números que se expresan como suma de dos
cuadrados es una suma de dos cuadrados.
Demostración. En efecto, un tal número es el producto de dos normas de enteros
de Gauss y, como tal, corresponde a la norma del producto de dichos enteros. ^¨

Observación.
Sea dicho de paso, la fórmula explı́cita con la que probamos el Lema 3.3.4 corres-
ponde precisamente a la norma del producto de dos enteros de Gauss.
Teniendo esta nueva noción de tamaño y su propiedad de multiplicatividad,
podemos demostrar lo siguiente:
Teorema 3.4.6 (División euclideana). Sean z, z 0 ∈ Z[i]. Entonces existen enteros
de Gauss q, r ∈ Z[i] tales que
z = qz 0 + r, N (r) < N (z 0 ).

51
Demostración. Una vez más, nos aprovechamos del hecho que Z[i] es un subanillo
de C para simplificar la demostración. A saber, consideraremos el número complejo
z
z0
∈ C.
Queremos probar que z = qz 0 + r con q, r ∈ Z[i] y N (r) < N (z 0 ). Pero esto
último es equivalente a |r| < |z 0 | o incluso a | zr0 | < 1. En otras palabras, queremos
encontrar q, r ∈ Z[i] tales que
z r r
= q + , 0 < 1.

z0 z0 z
Como zr0 = zz0 − q, su módulo expresa la distancia entre zz0 y q. Debemos encontrar
pues un entero de Gauss q ∈ Z[i] que esté a distancia menor que 1 de zz0 . Pero esto
es evidente a partir de la siguiente figura, en la cual se ve que todo complejo x ∈ C
está a distancia a lo más √12 de algún entero de Gauss.

iR 6
i 1+i 2+i 3+i
q q q q
√1
2

q
1
2
+ 2i

q q q q -
0 1 2 3 R
Figura 1: Números complejos y enteros de Gauss

Una vez encontrado dicho q ∈ Z[i], tenemos que z = qz 0 + r con r ∈ Z[i]


sencillamente porque q, z, z 0 ∈ Z[i]. Y claramente N (r) < N (z 0 ) por construcción
ya que |r| < |z 0 | porque | zr0 | = | zz0 − q| < 1. ^
¨

Teniendo una buena noción de tamaño y un teorema de división euclideana


bastante análogo al que tenı́amos sobre N, podemos intentar recuperar la noción
de máximo común divisor y el Teorema de Bézout que va adjunto. Comencemos
por la definición correspondiente.

Definición 3.4.7. Sean z, z 0 ∈ Z[i]. Decimos que d ∈ Z[i] es un máximo común


divisor de z y z 0 si:

1. d|z y d|z 0 ;

2. para todo e ∈ Z[i] tal que e|z y e|z 0 , N (e) ≤ N (d).

Para demostrar la existencia (y la unicidad) de un máximo común divisor,


al igual que en el caso de los naturales, necesitaremos el algoritmo de división
euclideana, el cual recordamos aquı́.

52
Algoritmo de división euclideana

Comenzamos con u0 := z y v0 := z 0 y escribimos u0 = q0 v0 + r0 con N (r0 ) <


N (v0 ), como nos lo permite la división euclideana.

Para cada j ≥ 0, definimos uj+1 := vj y vj+1 := rj y escribimos uj+1 =


qj+1 vj+1 + rj+1 con N (rj+1 ) < N (vj+1 ). Nótese que esto sólo se puede hacer
si vj+1 = rj 6= 0.

Por lo tanto, detenemos el algoritmo cuando rk = 0 para algún k ∈ N.

Ejercicio. Demuestre que el algoritmo de división euclideana se detiene, es decir


que existe k ∈ N tal que rk = 0.

Veamos ahora el enunciado del Teorema de Bézout y de la existencia del máximo


común divisor.

Teorema 3.4.8. Sean z, z 0 ∈ Z[i]. Entonces existe d ∈ Z[i] tal que el conjunto

X = {mz + nz 0 | m, n ∈ Z[i]} ⊂ Z[i],

corresponde al conjunto de los múltiplos de d en Z[i]. En particular:

d es un máximo común divisor de z y z 0 ;

éste es único salvo unidades;

existen r, s ∈ Z[i] tales que d = rz + sz 0 .

Demostración. Apliquemos el algoritmo de división euclideana a z y z 0 . Éste nos


fabrica entonces elementos uj , vj ∈ Z[i] tales que:

1. u0 = z y v0 = z 0 ;

2. uj+1 = vj para todo 0 ≤ j ≤ k;

3. vj+1 = uj − qj vj para cierto qj ∈ Z[i] y para todo 0 ≤ j ≤ k;

donde k es el primer entero natural tal que vk+1 = 0. Si definimos entonces

Cj := {muj + nvj | m, n ∈ Z[i]},

para 0 ≤ j ≤ k, las propieades 2 y 3 nos aseguran que Cj+1 = Cj para todo


0 ≤ j ≤ k. Por otra parte, la propiedad 1 nos asegura que C0 = X. Tenemos
entonces que

X = C0 = C1 = · · · = Ck+1 = {muk+1 + nvk+1 | m, n ∈ Z[i]} = {mvk | m ∈ Z[i]},

53
donde la última igualdad viene del hecho que uk+1 = vk y vk+1 = 0. Definiendo
entonces d := vk , demostramos la primera afirmación del teorema.

Una consecuencia inmediata de lo que acabamos de demostrar es que existen


r, s ∈ Z[i] tales que d = rz + sz 0 . En efecto, d es múltiplo de d trivialmente, por
lo que d ∈ X. Demostremos ahora que d es un máximo común divisor de z y z 0 ,
único salvo unidades.
Como z = 1 · z + 0 · z 0 , tenemos que z ∈ X y por lo tanto z es un múltiplo de
d. Lo mismo funciona para z 0 mutatis mutandis, por lo que se trata de un divisor
común de z y z 0 . Sea ahora e otro divisor común de z y z 0 . Entonces e divide a
rz + sz 0 = d, es decir, d = ef con f ∈ Z[i]. La multiplicatividad de la norma
nos dice entonces que N (d) = N (e)N (f ) y, como N (f ) = 0 si y sólo si f = 0,
tenemos que N (e) ≤ N (d). Esto prueba que d es un máximo común divisor de z
y z 0 y que todo divisor común de z y z 0 divide a d. En particular, si d0 es otro
máximo común divisor, tenemos que d = d0 f para cierto f ∈ Z[i] y por lo tanto
N (d) = N (d0 )N (f ). Pero como d0 también es máximo, tenemos que N (d) ≤ N (d0 ),
por lo que N (f ) = 1 y por lo tanto f ∈ Z[i]∗ (esto último es un ejercicio fácil sobre
la norma), lo que prueba que d es único salvo multiplicación por una unidad. ^ ¨

Notación. Este último resultado nos permite hablar de el máximo común divisor
de dos elementos z, z 0 como un elemento (z, z 0 ) ∈ Z[i] que está definido salvo mul-
tiplicación por una unidad (es decir, hay 4 elecciones posibles). Nos permitiremos
este abuso de notación ya que en general no afecta los razonamientos. En parti-
cular, podremos escribir (z, z 0 ) = 1 para significar que z y z 0 no tienen factores
comunes aparte de las unidades (en otras palabras, son coprimos).
Siguiendo el camino que tomamos en Z, nos toca demostrar el equivalente del
Lema de Gauss en los enteros de Gauss.
Lema 3.4.9. Sean z, z 0 , π ∈ Z[i] con π primo de Gauss. Si π|zz 0 , entonces π|z ó
π|z 0 .
Demostración. Si π|z, terminamos la demostración, por lo que podemos suponer
que π - z y debemos demostrar que π|z 0 . Como π no es un divisor de z y los
únicos divisores en Z[i] de π son 1 y π salvo unidades, vemos que (z, π) = 1. El
Teorema 3.4.8 nos dice entonces que existen m, n ∈ Z[i] tales que mz + nπ = 1.
Multiplicando por z 0 obtenemos:

mzz 0 + nπz 0 = z 0 .

Ahora, π|zz 0 y π|π, por lo que π|z 0 . ^


¨

Y concluimos el camino con el Teorema Fundamental de la Aritmética para


enteros de Gauss.

54
Teorema 3.4.10. Sea z ∈ Z[i] conQ N (z) > 1. Entonces existen π1 , . . . , πm ∈ Z[i]
primos de Gauss tales que z = m j=1 πj . Además, esta escritura es única salvo
reordenamiento y unidades, es decir, si
m
Y n
Y
z= πj = ρk ,
j=1 k=1

con ρ1 , . . . , ρn primos de Gauss, entonces n = m y, salvo reordenamiento, πj = uj ρj


con uj ∈ Z[i]∗ para todo 1 ≤ j ≤ m.
Demostración. Al igual que en el caso de N, demostremos primero la existencia
de una tal descomposición por inducción sobre N (z). Notemos que N (z) = 2 si
y sólo si z = ±1 + ±i y estos cuatro números difieren por una unidad. Además,
todo divisor de 1 + i debe tener norma ≤ 2 por multiplicatividad de la norma,
por lo que los únicos divisores d que quedan son aquéllos tales que N (d) = 1, es
decir, d ∈ Z[i]∗ . Vemos pues que 1 + i tiene 8 divisores y es por lo tanto un número
primo, lo que prueba la existencia del producto en este caso (n = 1, π1 = 1 + i).
Evidentemente, lo mismo vale para los otros elementos de norma 2 ya que difieren
todos por una unidad. Supongamos ahora que la descomposición existe para todo
entero de Gauss z 0 tal que N (z 0 ) < N (z) y demostremos su existencia para z.
Si z es un primo de Gauss, entonces tenemos la existencia por la misma razón
que para 1 + i. De lo contrario, z es compuesto, lo que significa que tiene un
divisor d fuera de {±1, ±i, ±z, ±iz}. En particular, tenemos que e := dz ∈ Z[i] y
1 < N (d), N (e) < N (z) = `. En efecto, N (d) > 1 por hipótesis y, si N (e) = 1,
entonces e es una unidad y por lo tanto d = e−1 z, lo cual está descartado Qm por
hipótesis
Qn también. Entonces, por hipótesis de inducción, sabemos que d = j=1 πj ,
e = k=1 ρk para ciertos primos π1 , . . . , πm , ρ1 , . . . , ρn . Tenemos entonces que
m+n
Y
z = de = π1 · · · πm · ρ1 · · · ρn = π` ,
`=1

con π` = ρ`−m para m + 1 ≤ ` ≤ m + n. Esto prueba la existencia de la descom-


posición en números primos.

Usemos ahora nuestra nueva versión del Lema de Gauss para demostrar la
unicidad por inducción sobre N (z). Para N (z) = 2, esto es evidente ya que se trata
de un número primo. Consideremos ahora un z ∈ Z[i] cualquiera y supongamos
demostrada la unicidad para todo z 0 con N (z 0 ) < N (z). Supongamos que hay dos
posibles escrituras de z como producto de primos:
m
Y n
Y
z= πj = ρk ,
j=1 k=1

55
Vemos entonces que πm |z y por lo tanto πm | nk=1 ρk . Una aplicación iterada del
Q
Lema de Gauss nos dice entonces que existe un 1 ≤ k0 ≤ n tal que πm |ρk0 . Como
ρk0 es primo, sus únicos divisores son las unidades y uρk0 para u ∈ Z[i]∗ . Como πm
es primo, N (πm ) 6= 1, por lo que πm = uρk0 para cierto u ∈ Z[i]. Reordenando el
conjunto de los ρk , podemos suponer que k0 = n, por lo que πm = uρn . Definiendo
z 0 := πzm = uρzn , vemos que

m−1
Y n−1
Y
0 −1
z = πj = u ρk .
j=1 k=1

Y reemplazando ρ1 por u−1 ρ1 (que también es primo), podemos olvidarnos del


u−1 en el lado derecho de la ecuación. Ahora, como N (πm ) > 1, tenemos que
N (z 0 ) < N (z) por multiplicatividad de la norma. La hipótesis de inducción nos
dice entonces que m − 1 = n − 1 y, salvo reordenamiento, πj = uj ρj para todo
1 ≤ i ≤ m − 1. Esto más la igualdad πm = ρn prueban la unicidad. ^
¨

Este resultado es un perfecto análogo del Teorema Fundamental de la Aritméti-


ca en Z. Sin embargo, cuesta ver dónde entra el “salvo unidades” en Z. Esto es
porque estamos acostumbrados a ver los números primos como positivos y por ende
−3 no aparecerá nunca en una tal factorización. Lo que hacemos si n es negativo
es dejar el signo afuera (i.e. factorizar por −1) y luego ocuparse de los números
positivos sencillamente. Esto también puede hacerse en el caso de los enteros de
Gauss. Basta con ponerse de acuerdo con la noción de “positivo”.

Definición 3.4.11. Decimos que un entero de Gauss z ∈ Z[i] es positivo si z =


a + bi con a ≥ |b| ≥ 0, con igualdad a = |b| si y sólo si b ≥ 0.

Esta definición (que no es para nada estándar), nos permite reenunciar el último
teorema como sigue:

Teorema 3.4.12. Sea z ∈ Z[i] con N (z) > 1. Entonces existen Q π1 , . . . , πm ∈ Z[i]
primos de Gauss positivos y una unidad u ∈ Z[i] tales que z = u m

j=1 πj . Además,
u es única y los πj son únicos salvo reordenamiento, es decir, si
m
Y n
Y
z=u πj = u0 ρk ,
j=1 k=1

con ρ1 , . . . , ρn primos de Gauss positivos, entonces u0 = u, n = m y, salvo reorde-


namiento, πj = ρj para todo 1 ≤ j ≤ m.

Demostración. Ejercicio ^
¨ ^
¨

56
Bien, ahora sabemos que la factorización única en primos sigue siendo válida
en Z[i]. Pero ¿cuáles son estos primos de Gauss de los que venimos hablando
hace un tiempo? ¿Podemos clasificarlos? Para llegar ahı́, veamos algunas de sus
propiedades:

Lema 3.4.13. Sea z ∈ Z[i] un entero de Gauss tal que N (z) es primo. Entonces
z es un primo de Gauss. En sentido inverso, si π ∈ Z[i] es un primo de Gauss,
entonces N (π) divide a p2 para algún primo p ∈ Z. En particular, π|p.

Demostración. La primera afirmación es fácil de ver por contradicción. Si z no es


un primo de Gauss, entonces z = xy con x, y ∈ Z[i] no unidades, i.e. de norma
> 1. Tenemos entonces que N (z) = N (xy) = N (x)N (y) con N (x), N (y) > 1, lo
que es imposible si N (z) es primo.
Para la segunda afirmación, notemos que N (z) = z z̄, donde z̄ es el conjugado
complejo de z. Por lo tanto, π divide a N (π) y, por el Lema 3.4.9, π divide a algún
factor primo p ∈ Z de N (π). Por multiplicatividad de la norma obtenemos entonces
N (π)|N (p) = p2 . ^
¨

El lema nos dice entonces que para buscar los primos de Gauss debemos buscar
los divisores de los primos p ∈ Z. Ahora, si estamos en el caso de un primo de
Gauss π de norma p, vemos que p = N (π) = ππ̄ = N (π̄), lo que nos dice que π̄
también es un primo de Gauss. Por lo tanto, ya escribimos p como producto de
primos de Gauss y vemos que se crearon (a lo más) dos nuevos primos de Gauss
a partir del primo p, el cual deja de ser primo en Z[i]. El lema nos dice también
que el único caso restante es N (π) = p2 . En este caso, como π|p, tenemos que
N (p) 2
N ( πp ) = N (π)
= pp2 = 1, es decir, πp es una unidad, lo que nos dice que p = πp π sigue
siendo primo en Z[i].

Todo este análisis se resume en el siguiente resultado:

Teorema 3.4.14. Sea π ∈ Z[i] un primo de Gauss. Entonces una y sólo una de
las siguientes afirmaciones se cumple:

1. π = u(1 + i) con u ∈ Z[i]∗ , en cuyo caso N (π) = 2;

2. ππ̄ = p con p ≡ 1 (mód 4) primo en Z, en cuyo caso N (π) = p;

3. π = up con u ∈ Z[i]∗ y p ≡ 3 (mód 4) primo en Z, en cuyo caso N (π) = p2 .

En particular, los primos de Gauss positivos son:

1. 1 + i;

2. a + bi y a − bi con a > b > 0 y a2 + b2 = p con p primo en Z;

57
3. p con p ≡ 3 (mód 4) primo positivo en Z.

Observación.
Nótese que el argumento anterior demuestra de paso que existe una única forma
de escribir un primo p ≡ 1 (mód 4) como suma de dos cuadrados (salvo orden).
En efecto, escribir p = a2 + b2 implica poder escribir p = (a + bi)(a − bi) y por lo
tanto π = a + bi y π̄ = a − bi, que son primos de Gauss, son únicos salvo unidades
por el Teorema 3.4.10 (y claramente un cambio por una unidad no modifica el par
{a2 , b2 }).

Demostración. Como vimos, si π es un primo de Gauss, entonces π|p para cierto


p ∈ Z primo.
Si p = 2, como 2 = 12 + 12 , vemos que 2 = (1 + i)(1 − i), lo que se traduce por
2 = −i(1 + i)2 . Con lo ya visto sabemos que 1 + i es primo de Gauss y es por ende
el único primo de Gauss que divide a 2 salvo unidades.
Si p ≡ 1 (mód 4), entonces sabemos que p = a2 + b2 para ciertos a, b ∈ N, por
lo que p = ππ̄ con π = a + bi primo de Gauss dado el análisis de las normas que
realizamos más arriba. De la última observación deducimos que ambos primos de
Gauss son únicos salvo unidades.
Si p ≡ 3 (mód 4), entonces es imposible escribir p como suma de cuadrados.
Ahora, si π es un primo de Gauss que divide a p, entonces N (π)|p2 . Pero si N (π) =
p, entonces p = a2 + b2 con π = a + bi. Vemos pues que esto es imposible y por lo
tanto N (π) = p2 , en cuyo caso ya vimos que π = up con u ∈ Z[i]∗ . ^
¨

3.5. Interludio: Piezas de ajedrez y algoritmo de la división


Esta sección fue redactada por Luis Arenas

La idea de modelar problemas que involucran tableros de ajedrez utilizando


enteros de Gauss es bastante natural, dado que el tablero de ajedrez tiene un
grupo de simetrı́as traslacionales que corresponde, precisamente al grupo aditivo
Z[i] considerado como un subgrupo del plano complejo. Más aún, sus simetrı́as
rotacionales son precisamente las que tiene el anillo Z[i], y que corresponden a la
multiplicación por unidades en dicho anillo. Una manera de hacer esta conección
explı́cita es numerar cada casilla del tablero con un entero de Gauss, de modo que
si una casilla esta numerada con un entero a, la casilla inmediatamente encima de
esta está numerada a + i, mientras que la que se encuentra a su derecha recibe
la numeración a + 1. Nótese que una rotación en 90o , centrada en la casilla 0,
corresponde a multiplicar por la unidad i.
Tomemos un caballo de ajedrez y coloquemoslo en la posición 0. El caballo
puede moverse a cualquiera de las posiciones (±1 ± 2i) o (±2 ± i). De hecho esto
corresponde a las casillas de la forma u(1 + 2i) o u(1 − 2i) donde u es una de

58
las cuatro unidades, ±1 o ±i. Más generalmente, si el caballo se encuentra en la
posición b puede moverse, en un turno, a cualquiera de las posiciones b + u(1 + 2i)
o b + u(1 − 2i). Se concluye, dado que cada entero de Gauss es suma de unidades,
que el conjunto de casillas que el caballo puede recorrer es el conjunto de casillas
con una numeración de la forma m(1 + 2i) + n(1 − 2i) donde m y n son enteros de
Gauss. Dado que 1 + 2i y 1 − 2i son relativamente primos, dicho ideal es el anillo
completo Z[i]. De hecho, para resolver el problema de encontrar una trayectoria
que permita llevar el caballo a una posición x dada, es suficiente con resolver la
ecuación x = m(1 + 2i) + n(1 − 2i), lo que puede hacerse utilizando el algoritmo
de Euclides.
Si en lugar de tener un caballo común, tuviesemos uno que sólo puede avanzar
dos casillas en una dirección arbitraria y luego doblar a la izquierda para avanzar
una casilla adicional, tenemos un caballo izquierdo. El caballo izquierdo sólo puede
moverse por las casillas cuyas numeraciones son múltiplos de 2 + i. El caballo
derecho se define análogamente.
El camello es una pieza exótica que se mueve tres casillas en una dirección
y luego una casilla en una dirección ortogonal a la primera. Las casillas que el
camello puede visitar corresponden a los elementos del ideal (3 + i, 3 − i). El lector
puede utilizar el algoritmo de la división para comprobar que se trata del ideal
principal (1 + i). Las casillas enumeradas con elementos de ese ideal son las casillas
del mismo color que el origen, es un tablero usual, por lo que el camello recorre
todas las casillas de su color.
Agreguemos una pieza aún más exótica, por ejemplo el hipogrifo, que puede
moverse tres casillas en una dirección y luego realizar cualquiera de las dos acciones
siguientes:
1. Doblar a la izquierda 90o y avanzar una casilla.
2. Doblar a la derecha y avanzar cuatro casillas.
El hipogrifo puede moverse por todas las casillas del ideal (3 + i, 3 − 4i) = (2 − i).
Concluimos que el hipogrifo es equivalente a un caballo derecho.

3.6. De vuelta a las sumas de dos cuadrados


Veamos ahora cómo podemos aplicar estos conocimientos sobre los enteros de
Gauss a las sumas de dos cuadrados en Z. Comencemos por algunos ejemplos:
Ejemplo 3.6.1. Para resolver la ecuación
x2 + y 2 = 245 = 5 × 72 ,
factorizamos para obtener
(x + yi)(x − yi) = 5 × 72 .

59
Como 7 ≡ 3 (mód 4), se trata de un primo de Gauss, por lo que algún factor al
lado izquierdo debe ser divisible por 7, y por lo tanto ambos. En efecto, si z|z 0
entonces z̄|z̄ 0 y aquı́ 7̄ = 7. Vemos entonces que x + yi = 7(a + bi) con a2 + b2 = 5.
Una posible solución es a = 2 y b = 1, lo que dá x + yi = 14 + 7i y por lo tanto
142 + 72 = 245. También es fácil ver que hay 7 otras posibilidades para a y b, pero
todas dan la misma suma de cuadrados al final.
Ejemplo 3.6.2. Para resolver la ecuación

x2 + y 2 = 175 = 52 × 7,

factorizamos x2 + y 2 = (x + yi)(x − yi) de la misma manera que en el ejemplo


anterior. Como 7 es un primo de Gauss, divide a alguno de los dos factores de
la izquierda y por lo tanto a ambos ya que son conjugados. Esto contradice la
factorización única en primos de Gauss ya que no hay ningún 7 escondido en el
52 = 25 restante. Deducimos pues que la ecuación planteada no tiene solución.
Ejemplo 3.6.3. Resolvamos ahora la ecuación x2 + y 2 = z 2 factorizando de la
misma manera:
(x + yi)(x − yi) = z 2 .
Ahora, nótese que cualquier divisor común de z = (x + yi) y z 0 = (x − yi) es
un divisor de 2x = z + z 0 y de 2y = −i(z − z 0 ). Por lo tanto, si suponemos que
(x, y) = 1, todo divisor común de z y z 0 es un divisor de 2 = (1 + i)2 . Pero si

x + yi = (1 + i)(a + bi) = (a − b) + (a + b)i,

entonces x e y tienen la misma paridad. Si x e y fuesen ambos impares, tendrı́amos


x2 + y 2 ≡ 2 (mód 4) y por lo tanto no serı́a un cuadrado. Por lo tanto x e y deben
ser ambos pares, lo que contradice (x, y) = 1. Concluimos entonces que (x + yi) y
(x − yi) son relativamente primos y por lo tanto cada uno de ellos es de la forma
u(a + bi)2 con u ∈ Z[i]∗ . Por lo tanto, salvo orden y signo, x + yi = (a2 − b2 ) + 2abi
y por ende x = a2 − b2 e y = 2ab, recuperando ası́ las fórmulas del Teorema 3.1.4.
Estudiemos ahora la cantidad de soluciones enteras que puede tener la ecuación
x2 + y 2 = n para n ∈ N. Recordemos que dxe define al entero a ∈ Z más pequeño
tal que x ≤ a.
Teorema 3.6.4. La ecuación x2 + y 2 = n para n ∈ N tiene soluciones enteras no
negativas si y sólo si vp (n) es par para todo p ≡ 3 (mód 4).
Además, si definimos
Y
r= (vp (n) + 1),
p≡1 mod 4

entonces, salvo orden, existen d 2r e soluciones distintas a la ecuación.

60
Demostración. Nótese que la primera parte ya es sabida para todo n ∈ N por el
Teorema 3.3.5. Ahora, para un n que sı́ admite soluciones, escribir n = a2 + b2
corresponde a factorizar n como un producto (a + bi)(a − bi) en Z[i]. Claramente,
si cambiamos ambos elementos por una unidad, obtenemos los mismos cuadrados
a2 y b2 salvo orden y lo mismo ocurre si conjugamos ambos elementos. Vemos pues
que, en el análisis que haremos a continuación, tenemos derecho a modificar todo
número por una unidad o por su conjugado y obtener el mismo resultado. Esto
será importante para el conteo final.

Escribamos la factorización prima de n en Z de la siguiente manera:


Y Y
n = 2v2 (n) · pvp (n) · pvp (n) .
p≡1 mod 4 p≡3 mod 4

Usando el Teorema 3.4.14, vemos entonces que n se factoriza en Z[i] como


Y Y
n = u(1 + i)2v2 (n) · πpvp (n) π̄pvp (n) · pvp (n) ,
p≡1 mod 4 p≡3 mod 4

donde πp es el único primo positivo que se encuentra en el primer cuadrante y


que divide a p (y evidentemente π̄p es el único primo positivo que divide a p en el
cuarto cuadrante) y u ∈ Z[i]∗ es una cierta unidad (que podemos ignorar dado lo
que mencionamos al comienzo).
Como cada uno de estos primos divide a n = (a + bi)(a − bi), el Lema 3.4.9 nos
dice que cada uno divide a alguno de los dos factores. La cantidad de pares de cua-
drados (a2 , b2 ) que podemos fabricar dependerá entonces de cuantas posibilidades
tenemos para distribuir estos distintos primos en el producto. Vayamos caso por
caso:

Para los primos de la forma (1+i), si suponemos por ejemplo que (1+i)m |(a+bi),
tenemos que (1 − i)m |(a − bi). Pero como 1 + i = i(1 − i), vemos que (1 + i)m |(a − bi)
también. Evidentemente, esto se aplica en ambos sentidos y deducimos que, pase
lo que pase, (1 + i)v2 (n) |(a + bi) y (1 + i)v2 (n) |(a − bi). En otras palabras, no tenemos
elección con estos primos a la hora de factorizar n como (a + bi)(a − bi).
Para los primos de la forma p ≡ 3 (mód 4), sabemos que vp (n) es par. Si
suponemos entonces, por ejemplo, que pm |(a + bi), tenemos que p̄m = pm |(a − bi).
Deducimos entonces que, pase lo que pase, pvp (n)/2 |(a + bi) y pvp (n)/2 |(a − bi). Por
lo tanto, en este caso tampoco tenemos elección a la hora de factorizar n.
En particular, si no hay primos de la forma p ≡ 1 (mód 4) que dividen a n (i.e. si
r = 1), existe una única manera de factorizar n como producto (a + bi)(a − bi) en
Z[i] salvo unidades y conjugación, lo que nos da una única suma de cuadrados.

61
Finalmente, para los primos de la forma πp y π̄p con p ≡ 1 (mód 4), vemos que
si πpm |(a + bi), entonces π̄pm |(a − bi) y, de forma equivalente, si π̄pm |(a + bi), entonces
πpm |(a − bi). De esto deducimos que

πpm π̄pvp (n)−m |(a + bi) y πpvp (n)−m π̄pm |(a − bi),

para cierto 0 ≤ m ≤ vp (n) que podemos elegir a discreción. Esto nos da vp (n) + 1
posibilidades para a + bi. Y como estas elecciones se hacen para cada primo p ≡ 1
(mód 4), obtenemos finalmente r posibilidades en total. Sin embargo, estamos ol-
vidando que queremos considerar las posibilidades salvo conjugación (las unidades
ya las ignoramos al obligar a los primos πp a ser positivos). Entonces, una vez que
escogimos un valor mp para cada primo p, vemos que al cambiar todos ellos por
vp (n) − mp sencillamente intercambiamos los primos que dividen a (a + bi) con los
de (a − bi). Esto nos fuerza a dividir r por 2 para obtener el conteo total.
Esto concluye la demostración si r es par ya que en ese caso d 2r e = 2r . Ahora,
si r es impar, esto quiere decir que todos los vp (n) + 1 son impares y por lo tanto
todos los vp (n) son pares. En este caso, cuando escogemos mp = vp2(n) para todo p,
v (n)/2 vp (n)/2
vemos que el aporte de estos primos a a + bi es πpp π̄p y el aporte a a − bi
es exactamente el mismo. En otras palabras, salvo unidades, a + bi = a − bi, lo que
explica que la conjugación no divide por dos este caso. Es por esto que debemos
tomar d 2r e en este último caso particular. ^¨

3.7. Sumas de cuatro cuadrados


Habiendo resuelto completamente el problema de las sumas de dos cuadrados,
podemos intentar ver qué ocurre con sumas de más cuadrados. El caso de las su-
mas de tres cuadrados es bastante clásico también, pero su nivel de dificultad es
un poco más alto que los objetivos de este curso. Pasaremos pues a las sumas de
cuatro cuadrados, que sı́ son más fáciles de estudiar gracias a un lema “sacado del
sombrero”, al igual que en el caso de las sumas de dos cuadrados.

Ante todo, enunciemos el resultado general sobre estas sumas, demostrado ini-
cialmente por Lagrange en 1770:

Teorema 3.7.1. Todo entero n ∈ N se puede expresar como suma de cuatro


cuadrados en Z.

El lema que nos ayudará en gran medida es el siguiente:

Lema 3.7.2. El producto de dos números que se expresan como suma de cuatro
cuadrados es una suma de cuatro cuadrados.

62
Demostración. Basta con notar que

(a2 + b2 + c2 + d2 )(x2 + y 2 + z 2 + t2 ) = (ax + by + cz + dt)2


+ (ay − bx − ct + dz)2 + (az + bt − cx − dy)2 + (at − bz + cy − dx)2 .

^
¨

Dado este lema, todo lo que tenemos que hacer es probar el Teorema 3.7.1 para
un número primo p. Es lo que haremos a conitnuación.
Demostración del Teorema 3.7.1. Sea p un número primo. Si p = 2, entonces 2 =
12 + 12 + 02 + 02 . Si p ≡ 1 (mód 4), sabemos que existen a, b ∈ N tales que
p = a2 + b2 + 02 + 02 . Falta entonces ver el caso de los primos p ≡ 3 (mód 4). Para
ello, demostremos primero el siguiente lema:
Lema 3.7.3. Existen a, b ∈ N tales que a2 + b2 + 1 ≡ 0 (mód p) y |a|, |b| < p2 .
Demostración. Consideremos el conjunto S de los cuadrados módulo p. Tenemos
claramente que la clase de 0 está en S. Por otra parte, S ∩ (Z/pZ)∗ corresponde a
la imagen del homomorfismo de grupos

(Z/pZ)∗ → (Z/pZ)∗ : x 7→ x2 ,

cuyo núcleo es claramente {±1}. Como el núcleo es de orden 2 y (Z/pZ)∗ es de


orden p − 1, tenemos que la imagen S ∩ (Z/pZ)∗ es de orden p−1 2
. Agregando la
p+1
clase de 0, tenemos que S tiene 2 elementos.
Consideremos ahora el conjunto S 0 = {−1 − x | x ∈ S}. Este conjunto tiene
claramente la misma cantidad de elementos que S, es decir p+1 2
. Como hay tan
solo p elementos en Z/pZ, tenemos que existe un elemento z que pertenece a S
y a S 0 , es decir z ≡ a2 (mód p) y z ≡ −1 − b2 (mód p) para ciertos a, b ∈ N.
Juntando ambas congruencias tenemos la solución que buscábamos. El tamaño de
a y b puede siempre ser escogido menor que p2 ya que siempre podemos escoger
0 ≤ a, b < p y, si |a| > p2 , entonces |p − a| < p2 y p − a ≡ −a (mód p) también sirve
para la solución de la congruencia. Lo mismo corre para b. ^
¨

Tenemos entonces que existen a, b ∈ N tales que a2 +b2 +1 = pm para cierto m ∈


N con |a|, |b| < p2 . Si m = 1, entonces ya escribimos p como suma de 3 cuadrados
2 2
y terminamos. Si no, por el tamaño de a y b tenemos que pm < 1 + p4 + p4 < p2 y
por lo tanto a2 + b2 + 12 + 02 = pm con m < p. El plan consistirá ahora en construir
otra suma de cuatro cuadrados que dé pm con un m más pequeño a partir de ésta.
Sean entonces (x1 , x2 , x3 , x4 ) ∈ N tales que

x21 + x22 + x23 + x24 = pm, (3)

63
con 1 < m < p y construyamos una nueva suma de cuatro cuadrados como sigue:
Definimos yi de forma que yi ≡ xi (mód m) con − m2 < yi ≤ m2 . Entonces, como
la suma (3) es congruente a 0 (mód m), tenemos que

y12 + y22 + y32 + y42 = rm, (4)

para cierto r ≥ 0. Pero por construcción

m2 m2 m2 m2
rm ≤ + + + = m2 ,
4 4 4 4
por lo que r ≤ m. Por otra parte, r 6= 0 ya que de lo contrario tendrı́amos yi = 0
para todo i y entonces m|xi , lo que implica m2 |x2i y finalmente m2 |mp, lo que no
puede ocurrir ya que m < p. De la misma manera, r 6= m ya que de lo contrario
tendrı́amos yi = m2 para todo i y entonces xi = m2 + mki para cierto ki ∈ Z, lo que
2
implica x2i ≡ m4 (mód m2 ) y finalmente mp ≡ m2 ≡ 0 (mód m2 ), lo que no puede
ocurrir ya que m < p.
Multiplicando las igualdades (3) y (4), la fórmula con la que demostramos el
Lema 3.7.2 nos dice que:

prm2 = (x1 y1 + x2 y2 + x3 y3 + x4 y4 )2 + (x1 y2 − x2 y1 − x3 y4 + x4 y3 )2


+ (x1 y3 + x2 y4 − x3 y1 − x4 y2 )2 + (x1 y4 − x2 y3 + x3 y2 − x4 y1 )2 .

Si recordamos ahora que xi ≡ yi (mód m), vemos rápidamente que los 3 últimos
paréntesis en el lado derecho son múltiplos de m, por lo que sus cuadrados son
múltiplos de m2 . Si a eso agregamos la igualdad (3), tenemos la misma conclusión
para el primer término. Podemos entonces dividir cada término por m2 para obtener
una expresión de pr como suma de cuatro cuadrados. Como r < m, obtenemos la
suma más pequeña que buscábamos. Iterando este proceso, llegaremos tarde o
temprano a m = 1, lo que nos prueba que p se escribe como suma de cuatro
cuadrados. ^
¨

64

Das könnte Ihnen auch gefallen