Sie sind auf Seite 1von 289

Rincón

Álgebra superior tiene como propósito principal poner a disposición de


los lectores un cúmulo de conocimientos básicos comprendidos en los
cursos de álgebra superior a nivel universitario. La selección de los
contenidos, objetivos de aprendizaje y, en especial, la determinación
de la extensión y profundidad de lo abordado, así como la manera de
presentar los temas, son resultado de la vasta experiencia de los autores
como docentes y de un largo proceso de discusión académica.
Los autores tomaron como directriz fundamental producir un texto que
facilitara el aprendizaje a las personas interesadas en los temas de esta
materia, transmitiendo los conceptos de una forma precisa, pero con un
adecuado balance entre la formalidad deseada y el nivel académico de
los usuarios de esta obra.
Una de las bondades de este material es que reúne, en un solo documento,
temas que se tratan de forma aislada en la mayoría de los libros
convencionales de álgebra superior. En él se desarrollan los temas de: lógica
matemática y teoría de conjuntos; sistemas de ecuaciones lineales, matrices
y determinantes; sistemas numéricos, números reales y complejos; teoría de
ecuaciones y fundamentos de álgebra lineal. Adicionalmente el material
anterior está enriquecido con la inclusión de un conjunto de aplicaciones,
tales como: balanceo de ecuaciones químicas, análisis dimensional, solución
analítica de ecuaciones de tercer y cuarto grados, solución numérica de
ecuaciones de grado superior como la de Van Der Waals, así como de
ecuaciones trascendentes.

César Alejandro Rincón Orta • Amado Salvador Granados Aguilar


Eugenio León Fautsch Tapia • Susana Yalú Leticia Rubín Rivero
978-607-15-1002-0
Manuel Vázquez Islas • Antonio Francisco Díaz García
Álgebra
superior
Álgebra
superior

César Alejandro Rincón Orta


Amado Salvador Granados Aguilar
Eugenio León Fautsch Tapia
Susana Yalú Leticia Rubín Rivero
Manuel Vázquez Islas
Antonio Francisco Díaz García

Departamento de Matemáticas
Facultad de Química
Universidad Nacional Autónoma de México

MÉXICO • BOGOTÁ • BUENOS AIRES • CARACAS • GUATEMALA • MADRID • NUEVA YORK


SAN JUAN • SANTIAGO • SAO PAULO • AUCKLAND • LONDRES • MILÁN • MONTREAL
NUEVA DELHI • SAN FRANCISCO • SINGAPUR • ST. LOUIS • SIDNEY • TORONTO
Director general México: Miguel Ángel Toledo Castellanos
Editor sponsor: Pablo E. Roig Vázquez
Coordinadora editorial: Marcela I. Rocha Martínez
Editora de desarrollo: María Teresa Zapata Terrazas
Supervisor de producción: Zeferino García García

ÁLGEBRA SUPERIOR

Prohibida la reproducción total o parcial de esta obra,


por cualquier medio, sin la autorización escrita del editor.

DERECHOS RESERVADOS © 2014 respecto a la primera edición por


McGRAW-HILL/INTERAMERICANA EDITORES, S.A. DE C.V.
Edificio Punta Santa Fe
Prolongación Paseo de la Reforma 1015, Torre A,
Pisos 16 y 17, Colonia Desarrollo Santa Fe,
Delegación Álvaro Obregón
C.P. 01376, México, D. F.
Miembro de la Cámara Nacional de la Industria Editorial Mexicana, Reg. Núm. 736

ISBN: 978-607-15-1002-0

1234567890 2356789014

Impreso en México Printed in Mexico


Contenido

Acerca de los autores . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ix


Prólogo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xi

Unidad 1  Lógica y conjuntos . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1


1.1 Lógica matemática . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2
Definición de proposición . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
Tautologías y absurdos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
Proposiciones equivalentes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
Argumentos y demostraciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
Algunas propiedades del símbolo “⊢–” (se puede demostrar) . . . . . . . . . . . . . . . . . 15
El cálculo proposicional es consistente y completo . . . . . . . . . . . . . . . . . . . . . . 15
Cuantificadores . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
1.2 Conjuntos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20
Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20
1.3 Conceptos primitivos, definiciones, axiomas y teoremas . . . . . . . . . . . . . . . . . . . . 22
Contención de conjuntos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22
Nuevos conjuntos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
El conjunto vacío y el conjunto universal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
Familia de conjuntos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
Uniones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
1.4 Álgebra de conjuntos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
Intersecciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
Diferencias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
Complemento . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
El conjunto potencia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
1.5 Producto cartesiano . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
Pareja ordenada . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
Relaciones y funciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26
Algunas propiedades del producto cartesiano . . . . . . . . . . . . . . . . . . . . . . . . . 27
1.6 Suma y producto booleanos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
Una representación gráfica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
1.7 Algunas demostraciones en la teoría de conjuntos . . . . . . . . . . . . . . . . . . . . . . . 31
1.8 El concepto de función . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32
Álgebra de funciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33

Unidad 2  Sistemas de ecuaciones lineales, matrices y determinantes . . . 35


2.1 Sistemas de ecuaciones lineales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36
Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36
2.2 Matrices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41
Igualdad de matrices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42
Algunos tipos de matrices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42
Operaciones con matrices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44
Operaciones elementales en los renglones . . . . . . . . . . . . . . . . . . . . . . . . . . . 46
Sistemas de ecuaciones lineales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47
Cómo seleccionar los parámetros . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53
v
vi Contenido

Aplicaciones de los sistemas de ecuaciones . . . . . . . . . . . . . . . . . . . . . . . . . . 55


Representación generalizada . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58
Balanceo de ecuaciones químicas. Método algebraico . . . . . . . . . . . . . . . . . . . . 58
Ejemplos de balanceo de reacciones químicas . . . . . . . . . . . . . . . . . . . . . . . . . 59
2.3 Análisis dimensional . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71
Dimensión . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71
Método de Rayleigh . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72
Método de Buckingham . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74
2.4 Determinantes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80
Cálculo de determinantes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 82

Unidad 3  Sistemas numéricos . . . . . . . . . . . . . . . . . . . . . . . . . . . 85


3.1 El sistema de los números reales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 86
Axiomas de campo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 86
Algunas propiedades de campo de los números reales . . . . . . . . . . . . . . . . . . . . 89
Axiomas de orden . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 95
Subsistemas de los números reales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 98
Axioma de completez . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 100
Algunas representaciones de los números reales . . . . . . . . . . . . . . . . . . . . . . . 102
3.2 Números complejos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 110
El modelo de Gauss y la inmersión de  en  . . . . . . . . . . . . . . . . . . . . . . . . . . 113
La conjugación . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 114
La norma . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 116
La ecuación general de segundo grado . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 117
Sistemas de ecuaciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 120
Representación geométrica de los números complejos . . . . . . . . . . . . . . . . . . . . 122
Raíces n-ésimas de un número complejo . . . . . . . . . . . . . . . . . . . . . . . . . . . . 126
El argumento de un número complejo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 128
La función exponencial compleja . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 128
Representación geométrica de algunas rectas bajo la transformación E . . . . . . . . 130
La función logaritmo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 131
Las funciones trigonométricas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 132

Unidad 4  Polinomios y teoría de ecuaciones . . . . . . . . . . . . . . . . . . 135


4.1 Polinomios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 136
Suma y multiplicación . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 136
Grado . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 137
Inmersión de K en K [x] . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 138
Algoritmo de la división . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 139
4.2 Funciones polinomiales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 140
Teorema del residuo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 141
Raíces de ecuaciones polinomiales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 141
Teorema del factor . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 142
Algoritmo de la división sintética . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 143
Raíces complejas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 148
Raíces “surd” . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 149
Las ecuaciones generales de 2°, 3° y 4° grados . . . . . . . . . . . . . . . . . . . . . . . . . 155
4.3 Algunos resultados de la teoría de números y su aplicación a los polinomios
y a las funciones polinomiales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 159
Máximo común divisor de dos enteros (algoritmo de Euclides) . . . . . . . . . . . . . . . . 164
Fracciones parciales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 166
4.4 Métodos numéricos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 168
Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 168
Contenido vii

Error . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 168
Cálculo de raíces de ecuaciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 170
Método de iteración de punto fijo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 171
Método de bisección . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 175
Método de Newton-Raphson . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 178
Aplicaciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 181
Estimación de las constantes de la ecuación de estado de Van der Waals . . . . . . . . . 193

Unidad 5  Álgebra lineal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 197


5.1 Grupos abelianos (o conmutativos) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 198
5.2 Anillos, dominios enteros y campos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 199
5.3 Homomorfismos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 200
5.4 Espacios vectoriales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 201
Dependencia e independencia lineal. Bases y dimensión . . . . . . . . . . . . . . . . . . . 203
Dimensión . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 204
5.5 Producto escalar, norma y métrica en Rn . . . . . . . . . . . . . . . . . . . . . . . . . . . . 205
Norma . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 205
Distancia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 207
Ángulos y ortogonalidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 207
Conjuntos y bases ortogonales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 209
Proyecciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 210
Aplicaciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 212
5.6 Producto vectorial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 213
Definición . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 213
Analogía con la solución como determinante . . . . . . . . . . . . . . . . . . . . . . . . . . 214
Interpretación geométrica de la norma del producto vectorial . . . . . . . . . . . . . . . . 215
Algunas propiedades del producto vectorial . . . . . . . . . . . . . . . . . . . . . . . . . . . 216
5.7 Triple producto escalar . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 217
Definiciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 217
Interpretación geométrica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 217
5.8 Rectas y planos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 218
Las rectas en n . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 218
Una ecuación de la recta que pasa por dos puntos . . . . . . . . . . . . . . . . . . . . . . . 218
Ángulo entre rectas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 219
Planos en 3 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 219
Una ecuación del plano que pasa por tres puntos no colineales . . . . . . . . . . . . . . . 220
Ecuación normal del plano . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 220
Ángulo entre planos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 220
Ángulo entre recta y plano . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 220
5.9 Transformaciones lineales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 221

Anexo 1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 225
Combinatoria . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 225
Principio fundamental del conteo (PFC) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 226
Permutaciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 227
Número de subconjuntos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 229

Anexo 2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 230
La función determinante . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 230
Sobre la existencia de la función determinante . . . . . . . . . . . . . . . . . . . . . . . . . 233
Regla de Cramer . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 234
viii Contenido

Anexo 3 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 236
Teoremas sobre funciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 236
Demostraciones de los teoremas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 236
Funciones inducidas por una función . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 239

Anexo 4 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 240
Relaciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 240
Relaciones de orden . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 241
Relaciones de equivalencia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 243
Relaciones de equivalencia y particiones . . . . . . . . . . . . . . . . . . . . . . . . . . . . 244
Tres ejemplos importantes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 245
Una representación de relaciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 245

Anexo 5 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 247
Transformaciones lineales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 247
Núcleo o kernel e imagen de una transformación lineal . . . . . . . . . . . . . . . . . . . . 249
Matriz asociada a una transformación lineal . . . . . . . . . . . . . . . . . . . . . . . . . . 252

Respuestas a los ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 255

Índice analítico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 271


Acerca de los autores
César Alejandro Rincón Orta
Es profesor emérito de la UNAM. Se graduó como químico metalúrgico
y matemático por la Universidad Nacional Autónoma de México
(UNAM). Acreditó las asignaturas del plan de estudios del doctorado
de Matemáticas.
Es fundador del primer laboratorio de Geocronometría en México y
también de la Maestría de Matemáticas, en la Universidad Autónoma
de Querétaro.
Es docente en la UNAM desde 1958, en donde ha impartido las
asignaturas de Álgebra superior I y II, Álgebra lineal I y II, Álgebra
moderna I y II, Cálculo I y II, Ecuaciones diferenciales, Análisis de
variable compleja, Análisis matemático I y II, tanto en la Facultad de Química como en la Facul-
tad de Ciencias.
Es coautor de varios libros, entre los que destacan: Álgebra superior, Las Prensas de Ciencias,
Facultad de Ciencias, UNAM, 2006; Métodos matemáticos de la termodinámica, Facultad de Quí-
mica, UNAM, 1978, reeditado por el Departamento de Publicaciones del Instituto de Matemáti-
cas, UNAM, 1996; Lógica matemática, UNAM, 2005.
Asimismo, ha publicado diversos artículos de Geocronometría en los boletines del Instituto
de Geología.

Amado Salvador Granados Aguilar


Se graduó como ingeniero químico por la Benemérita Universidad
Autónoma de Puebla (BUAP) y en la maestría y el doctorado en Ingenie-
ría Química por la UNAM.
Es profesor de la Facultad de Química de la UNAM desde 1990, en
la que ha impartido las asignaturas de Álgebra superior, Cálculo I y II, y
Ecuaciones diferenciales a nivel licenciatura; así como Matemáticas apli-
cadas en el posgrado de Ingeniería.
Es autor del libro Ejemplario: Ecuaciones diferenciales ordinarias (en
proceso de publicación por la Facultad de Química, UNAM).

Eugenio León Fautsch Tapia


Se graduó como ingeniero químico por la Universidad Nacional Autó-
noma de México (UNAM) y es pasante de la Maestría en Educación en
Matemáticas (UACPYP del CCH, UNAM).
Fue asesor en el proceso de fundación de la Universidad Autónoma
de la Ciudad de México (UACM) e impartió clases de matemáticas a
nivel bachillerato en el Centro Universitario México por más de veinticin-
co años. Desde 1972 es profesor en la Facultad de Química de la UNAM,
en la que ha impartido los cursos de Álgebra, Álgebra superior, Cálculo
de funciones de una variable (Cálculo I), Cálculo de funciones de varias
variables (Cálculo II) y Ecuaciones diferenciales a nivel licenciatura.
Es coautor con Marco A. Flores Meyer de los libros: Temas selectos de matemáticas (1981),
Cálculo básico (1982), Geometría analítica básica (1991), todos publicados y reeditados por la
Editorial Progreso, México. También es coautor con Rincón y otros del libro Lógica matemática,
UNAM, 2005.
Ha diseñado desde el año 2000 diversas páginas de internet, como apoyo a sus actividades
docentes.
ix
x Acerca de los autores

Susana Yalú Leticia Rubín Rivero


Es ingeniera química metalúrgica por la UNAM. Ha sido profesora de
la Facultad de Química de la UNAM desde 1984, en donde ha imparti-
do las asignaturas de Ecuaciones diferenciales, Estadística, Álgebra
superior y Cálculo.
Es coautora con Rincón y otros del libro Lógica matemática, UNAM,
2005.

Manuel Vázquez Islas


Es ingeniero químico y pasante de la maestría en Investigación de Ope-
raciones, de la Facultad de Ingeniería de la UNAM.
Desde 1973 es docente de la Facultad de Química de la UNAM, en
donde ha impartido los cursos de Álgebra, Cálculo I, Cálculo II, Ecua-
ciones diferenciales, Métodos numéricos, Matemáticas aplicadas II; y, en
el posgrado, Matemáticas aplicadas y Matemáticas avanzadas.
Fue distinguido con la cátedra “Andrés Manuel del Río” en 1989 y
con el Reconocimiento al Mérito por el AAPAUNAM en 1997.

Antonio Francisco Díaz García


Ingeniero Químico, Licenciado en Derecho y Maestro en Enseñanza en
Matemáticas por la UNAM.
Profesor de Matemáticas en la Facultad de Química desde 1973 ha
impartido diversas asignaturas del área. También cuenta con experien-
cia como profesor en la Facultad de Derecho y en el posgrado de Cien-
cias de la Administración de la UNAM. Ha publicado diversos artículos
y es autor de algunos libros.
Prólogo

El conocimiento científico necesita “matematizarse” para poder avanzar y expresarse adecuada-


mente en forma cuantitativa y, como lo indica el término entrecomillado, es la matemática lo que
se requiere para tal propósito.
Independientemente de su utilidad, el estudio de la matemática —que es bellísima— es un
ingrediente esencial en la formación de los marcos conceptuales necesarios para el correcto fun-
cionamiento de la mente, además de que proporciona el placer del orden y de lo bien estructurado.
Einstein afirmó que quien no disfrute de una buena demostración geométrica, no nació para
científico.
A pesar del impresionante avance de la tecnología y de las ciencias de la computación, en
cuya base aparece en forma muy significativa la lógica matemática, el álgebra no ha perdido ni un
ápice de su lugar de ser el conocimiento básico sobre el que se construye la matemática toda. Es por
esta razón que en los primeros semestres de las carreras científicas y en algunas de las humanísti-
cas, aparece el álgebra como una de las materias curriculares obligatorias.
Una de las dificultades con que tropiezan los maestros que imparten los primeros cursos de
esta materia es la gran cantidad de material que debe cubrirse en ellos. Es necesario precisar la
extensión (el tiempo que debe dedicarse a cada tema) y el rigor que resulte adecuado al heterogé-
neo nivel de los alumnos y que, a la vez, sea consistente con la formalidad matemática que su
orientación profesional requiere.
La experiencia de los autores al impartir estos cursos durante varios años ha guiado la exten-
sión del desarrollo de cada tema, sus aplicaciones y la forma que les pareció adecuada para este
nivel. La selección, tanto de los temas como de las aplicaciones, se hizo con el propósito de reunir
en un solo volumen el contenido integral del programa de álgebra superior, y así ayudar a resolver
la problemática que tienen los profesores y los estudiantes al tener que utilizar una bibliografía
amplia y, en general, poco accesible, ya sea por su costo, su falta de disponibilidad en el mercado
o su insuficiente existencia en el acervo de las bibliotecas.
A continuación se presenta una breve introducción al contenido de cada capítulo y su inten-
ción:
Capítulo 1  Se atienden los temas básicos de lógica, considerando que el alumno debe desa-
rrollar un pensamiento matemático bien ordenado, en el cual emplee correctamente el lenguaje
preciso que proporciona la matemática, que es el utilizado en la ciencia. Se enfatiza el análisis de
argumentos que es esencial para determinar la validez de éstos. La inclusión de los temas elemen-
tales de la teoría de conjuntos se basa en la importancia que ésta tiene en la construcción de mode-
los para un gran número de problemas de la matemática.
Capítulo 2  Se desarrolla el tema de sistemas de ecuaciones, debido al gran número de proble-
mas cuyo modelado y solución los requiere. Además del tratamiento que generalmente se le da,
se considera el balanceo de ecuaciones químicas y el análisis dimensional, ambas aplicaciones
importantes. Con objeto de sustentar la teoría que se ocupa en este capítulo, se adjunta un breve
tratamiento de matrices y determinantes.
Capítulo 3  Se formaliza la estructura del álgebra de ecuaciones, mediante la construcción
axiomática del campo de los números reales y sus subconjuntos más importantes —naturales,
enteros y racionales—, cuyas propiedades se utilizan cotidianamente sin expresión explícita, así
como su extensión al campo de los números complejos. El campo de los números reales, es el
hábitat natural del cálculo de variable real, por lo que su estudio resulta indispensable en este
nivel. En opinión de los autores, la problemática para el aprendizaje del cálculo se encuentra alta-
mente influida por la falta de dominio adecuado del álgebra, razón que justifica el desarrollo del
tema.

xi
xii Prólogo

La propiedad que tienen los números complejos de contener a todas las raíces de sus ecuacio-
nes —ser algebraicamente cerrados— los hace especialmente adecuados para el estudio del álge-
bra y de sus aplicaciones en algunos temas de la matemática superior (geometría algebraica, por
ejemplo).
Capítulo 4  Se formaliza la definición de polinomio y de sus operaciones. Se estudian las fun-
ciones polinomiales y algunos de sus teoremas clásicos como el teorema del residuo, el teorema
del factor y multiplicidad de raíces, entre otros. Se describen algunos métodos para encontrar las
raíces de las ecuaciones o aproximarlas por métodos numéricos, cuando sea el caso.
Capítulo 5  Se dedica a la parte más elemental del álgebra lineal, necesaria para el manejo
adecuado de la matemática en cursos posteriores. Se da la definición de grupo, campo, espacio
vectorial y subespacio generado. Utilizando el lema de Zorn, se demuestran los teoremas relacio-
nados con la dependencia e independencia lineal, existencia de bases y se justifica la definición de
dimensión de un espacio vectorial. Se utiliza el producto punto para aplicar el álgebra lineal en la
geometría —rectas y planos—.
Anexos  En los anexos se incluyen algunos temas y demostraciones (un poco más formales)
con el objeto de llenar las lagunas que se dejaron —deliberadamente— en algunos capítulos.
Además, se presenta un buen número de ejercicios como ayuda para que los estudiantes se
familiaricen con los temas tratados y puedan adquirir una razonable comprensión de éstos, de
manera que puedan autoevaluar el nivel de dominio adquirido al estudiarlos.
 1

Lógica y
1.1  Lógica matemática
Unidad
•  Definición de proposición
•  Tautologías y absurdos
•  Proposiciones equivalentes
•  Argumentos y demostraciones
•  Algunas propiedades del símbolo “⊢–” (se puede demostrar)
•  El cálculo proposicional es consistente y completo
•  Cuantificadores
1.2 Conjuntos
•  Introducción

con
1.3 Conceptos primitivos, definiciones, axiomas y teoremas
•  Contención de conjuntos
•  Nuevos conjuntos
•  El conjunto vacío y el conjunto universal
•  Familia de conjuntos

juntos
•  Uniones
1.4  Álgebra de conjuntos
•  Intersecciones
•  Diferencias
•  Complemento
•  El conjunto potencia
1.5  Producto cartesiano
•  Pareja ordenada
•  Relaciones y funciones
•  Algunas propiedades del producto cartesiano
1.6 Suma y producto booleanos
•  Una representación gráfica
1.7 Algunas demostraciones en la teoría de conjuntos
1.8  El concepto de función
•  Álgebra de funciones
2 Unidad 1  Lógica y conjuntos

1.1  Lógica matemática


La lógica matemática puede considerarse como una parte de la filosofía que tiene como uno de sus
objetivos centrales la clasificación de los principios y leyes que rigen a los razonamientos válidos. Se
apellida matemática porque en su desarrollo se utiliza el método axiomático-deductivo, que es
característico de esta rama del conocimiento y que ha trascendido al estudio de gran parte de las
teorías científicas y humanísticas, las cuales deben matematizarse, para poder expresar correcta-
mente sus conceptos y enriquecer sus resultados.
Entre los componentes básicos de esta lógica está el cálculo proposicional que, enriquecido
convenientemente con algunos conceptos y resultados del cálculo de predicados, permite interpre-
tar con toda precisión las nociones básicas de la matemática.
En esta unidad se hace una breve exposición del cálculo proposicional, el cual comienza des-
cribiendo cuáles son los elementos que lo constituyen y la forma en que éstos se combinan (con-
ceptos y relaciones primitivas),1 las propiedades que estos objetos y relaciones tienen (axiomas o
postulados)2 y la forma (correcta) en la cual se demuestran sus conclusiones, que una vez incorpo-
radas al lenguaje lógico de la matemática se conocen como teoremas.
En el álgebra, cuando se trata de números particulares, se usan símbolos para representarlos
(sus numerales), por ejemplo, 0, 2, − 1 / 2, 7 , π , 4 − 7i, pero cuando no se especifica de qué núme-
ros se trata, pueden utilizarse variables (como x, y, z) para referirse a ellos, los cuales en casos
particulares pueden tomar valores que coinciden entre sí. Por ejemplo, si se desea encontrar los
números x, y, z tales que su suma sea 9 ( x + y + z = 9 ), una interpretación podría ser x = y = z = 3
y otra x = y = 4, z = 1, entre una infinidad de posibilidades.
En el cálculo proposicional (CP) existen las proposiciones simples (𝒫S) y los conectivos lógi-
cos, que son conceptos primitivos de la teoría, en tanto que no se definen, y permiten precisar lo
que son las proposiciones (𝒫) en general. También son primitivos los valores de verdad —{0, 1} o {F , V }—
—{0, 1}oo {F , V }— , los cuales asignan a cada proposición simple su carácter de falsa o verdadera, asigna-
ción que, como se verá más adelante, se extiende al conjunto de las proposiciones por medio de las
tablas de verdad. El hecho de que los valores de verdad sean dos y sólo dos, confiere a esta lógica
su carácter de lógica binaria (en contraste con la lógica de la vida, que no lo es, ¿se entiende?).
Las proposiciones simples pueden interpretarse como expresiones de las que puede decirse
con precisión que son falsas o verdaderas. Se representan con las letras P, Q, …, y cuando se
requiere considerar proposiciones simples no especificadas, pueden usarse las variables proposicio-
nales A, B, C, …
En el cálculo proposicional, cuando se usan letras distintas, éstas representan proposiciones
simples diferentes, pero, al igual que en el álgebra, diversas variables proposicionales pueden estar
representando proposiciones iguales.
Los conectivos lógicos que aparecen en esta unidad tienen como función representar los
correspondientes conectivos del lenguaje (español), los cuales se usan para reunir varias frases en
una sola. Son no, y, o e implica.
Algunos autores consideran también el conectivo si y sólo si, que aquí se define como una
doble implicación, por lo cual no se incluye en las anteriores. Los símbolos usados para represen-
tar estos conectivos son:
1. para no: ¬, ∼ o ′
2. para y: ∧, ⋅, o &
3. para o: ∨
4. para implica que también se conoce como si… entonces…, →
De los valores de verdad, como ya se dijo, se utilizan:
1. para falso: 0 o F.
2. para verdadero: 1 o V.

1 En una teoría axiomática se llaman primitivos (o primitivas) los conceptos y relaciones que aparecen sin definición y a partir de
los que se explica el significado de otros conceptos y relaciones, por la cual reciben el calificativo de definidas.
2 Los axiomas, o postulados, de una teoría, son definiciones implícitas de los objetos y relaciones de ésta. Dichas definiciones se

logran al asignar a los objetos y relaciones las propiedades que se les suponen y que, de alguna manera, deben caracterizarlos.
1.1  Lógica matemática 3

Definición de proposición
1. Toda proposición simple es una proposición.
2. Si A y B son proposiciones, ¬ A, A ∧ B, A ∨ B y A → B también son proposiciones.
3. Una fórmula (colección de símbolos de proposiciones simples y/o conectivos lógicos) es pro-
posición si y sólo si tiene tal carácter justificado por las reglas 1 o 2.
La regla 1 proporciona una base inicial de proposiciones (las simples).
La regla 2 permite utilizar los conectivos lógicos para formar nuevas proposiciones a partir de
las ya existentes.
La regla 3 asegura que las únicas fórmulas que pueden considerarse proposiciones son las que
se construyen usando las reglas 1 o 2.
La definición anterior se resume utilizando el simbolismo matemático de la siguiente manera:

Definición 1.1.1
Sean 𝒫S las proposiciones simples y 𝒫 las proposiciones; entonces:
1. 𝒫S ⊂ 𝒫
2. A, B, ∈ 𝒫 ⇒ ¬ A, A ∧ B, A ∨ B y A → B ∈ 𝒫
3. y son todas (una fórmula está en 𝒫 si y sólo si lo es vía las reglas 1 o 2).

Como ya se mencionó en párrafos anteriores, las proposiciones simples se


usan para representar frases del idioma, las cuales deben tener un valor de verdad Note que estos adjetivos solamente
bien determinado (deben ser falsas o ciertas). En el cálculo proposicional, este fin son los nombres de las etiquetas que
las proposiciones simples tienen, y
se alcanza postulando que a cada proposición simple se le asocia un valor de ver-
son independientes de las definiciones
dad 0 o 1 según deba considerarse falsa o verdadera. (filosóficas) de falso y verdadero,
Los valores de verdad que corresponden a las proposiciones compuestas por aunque están concebidas con objeto
más de una proposición simple dependen de los que tengan éstas y se determinan de representarlas.
aplicando las tablas de verdad, las cuales son definiciones implícitas de la forma en
que actúan los conectivos lógicos, que, por supuesto, deben ser análogas a las que
cumplen, en el idioma, los conectivos que estos símbolos representan. Así, el conectivo no cambia
el valor de verdad de la proposición a la cual está asociado. En efecto, por tratarse de una lógica
binaria, resulta que si una proposición P es cierta, su negación (¬P) tiene que ser falsa y, recípro-
camente, la negación de una proposición falsa debe ser cierta. Por esta razón, la tabla de verdad
del conectivo no se define así:

P ¬P
0 1
1 0

en la cual el primer renglón ilustra lo que sucede cuando P es falsa y el segundo lo hace cuando P
es cierta. La tabla tiene sólo esos dos renglones (uno para cada valor de verdad de P), y con ellos
cubre todas las posibles situaciones que puedan darse.
Los otros tres conectivos son binarios, cada uno conecta dos proposiciones y, por lo tanto,
generan cuatro maneras de combinar los valores de verdad que puedan tener las proposiciones
que conectan,3 a saber, (0, 0), (0, 1), (1, 0), (1, 1), y por lo tanto, las tablas de verdad que los definen,
deben tener cuatro renglones, uno por cada combinación.
Las tablas siguientes son las definiciones del efecto que cada conectivo produce en las propo-
siciones que se forman con ellos.

3 Un principio fundamental de numeración establece que si dos eventos pueden efectuarse independientemente de m y n mane-

ras, respectivamente, la pareja puede hacerlo de m · n formas.


4 Unidad 1  Lógica y conjuntos

P Q P∧Q P∨Q P→Q


0 0 0 0 1
0 1 0 1 1
1 0 0 1 0
1 1 1 1 1

Observaciones
1. De la tabla de la negación se infiere que en el cálculo proposicional, la doble negación afirma
(lo que no sucede en el idioma español en el que la doble negación enfatiza; por ejemplo, él no
sabe nada, no le dije nada a nadie, …).
2. El conectivo “∧” produce proposiciones que siempre resultan falsas, excepto en el caso en el
que las dos proposiciones que la forman son ciertas.
3. La tabla del conectivo “∨” corresponde al uso del o incluyente del idioma. La proposición no
es cierta sólo en el caso de que tanto A como B sean ambas falsas.
4. La tabla de la implicación, cuya validez es menos evidente que las de los otros conectivos, dice
que de una proposición falsa puede seguirse lo que sea, falso o cierto, sin que la proposición
completa (la implicación) pierda su valor de verdad. Por ejemplo, si P → Q representa la
afirmación siguiente:
Si x es un alumno de la universidad (P)
Entonces x estudia (Q)
sólo sería falsa si existiera algún estudiante que siendo universitario (P cierta) no estudiara (Q
falsa). La verdad de la proposición anterior es independiente de la existencia de personas que no
siendo universitarias (P falsa) estudian (Q cierta), o que no lo hacen (Q falsa).
Un caso particular, que aparece con frecuencia en los argumentos matemáticos, es el referido
a las propiedades de los elementos que pudieran estar en el conjunto vacío (no hay ninguno) y a
los cuales, por lo tanto, puede suponérseles cualquier cosa. Así, de las implicaciones que comien-
zan con la proposición x ∈∅ se dice que son ciertas por vacuidad, independientemente del valor
de verdad de la conclusión. Por ejemplo, las dos proposiciones siguientes son ciertas (por vacui-
dad):
a)  7 ∈ ∅ → 7 es un número par
b)  7 ∈ ∅ → 7 no es un número par
Note que no se contradicen; es decir, una no es la negación de la otra (ver equivalencias más
adelante).
La proposición P → Q, entre otras formas, se expresa como:
1. P implica Q
2. Si P entonces Q
3. Si P, Q
4. Q si P
5. Q es una condición necesaria para P
6. P es una condición suficiente para Q
Las tablas de verdad permiten conocer el valor de verdad que tiene cada proposición com-
puesta, el cual depende de la combinación de los valores de verdad de sus componentes. Con
objeto de construirlas, se procede paso a paso, aplicando iteradamente las tablas de verdad bási-
cas, que son las correspondientes a los conectivos lógicos que aparecen en ella.

Ejemplo 1.1.1
Se desea conocer la tabla de verdad de la proposición P → (Q ∧ R ) .
1. Puesto que se trata de una proposición compuesta por tres proposiciones simples, sus valores
de verdad, dos para cada una de ellas, producen ocho posibles combinaciones ( 2 ⋅ 2 ⋅ 2 ) .
Entonces la tabla que los considere debe tener ocho renglones. Constrúyase ésta.
1.1  Lógica matemática 5

P Q R Q∧R P → (Q ∧ R)
0 0 0 0 1
0 0 1 0 1
0 1 0 0 1
0 1 1 1 1
1 0 0 0 0
1 0 1 0 0
1 1 0 0 0
1 1 1 1 1

2. Se asigna valores a cada proposición simple y así se llenan las primeras tres columnas, las
cuales exhiben las ocho posibles combinaciones de ellos, que, por supuesto, pueden registrar-
se en cualquier orden, aunque es recomendable utilizar una manera específica para acomo-
darlas. Note que la que se usó tiene la ventaja de dejar numerados, en notación binaria, los
renglones y además permite comprobar fácilmente que no falta ninguno y que no hay repeti-
ciones, lo cual no es fácil de conseguir cuando la tabla tiene muchos renglones.
3. La tabla que se desea construir corresponde a una implicación y, por lo tanto, su valor depen-
de de sus componentes P y (Q ∧ R). El paréntesis es un signo de agrupación que afirma que
Q ∧ R es una sola proposición, a la cual se debe asignar su valor de verdad y que, por lo tanto,
debe conocerse. Luego, se procede a determinarlo (columna 4).
4. Tomando en cuenta los valores de P y de Q ∧ R, se llena la columna 5 usando la tabla de la
implicación.
Con base en lo anterior, y para construir la tabla de verdad de una fórmula que consta de n pro-
posiciones simples:
1. Considere 2n renglones, en cada uno de los cuales debe aparecer una posible combinación de
valores de verdad de las proposiciones simples. Es recomendable, según la observación hecha
con anterioridad, comenzar con 2n − 1 ceros y luego con 2n − 1 unos en la primera columna. En
la segunda se alternan 2n − 2 ceros con igual número de unos. La tercera columna se llena de
arriba hacia abajo alternando ceros y unos, cada “paquete” con 2n − 3 elementos, y así sucesi-
vamente, hasta llegar a la columna n-ésima para la que se usa la sucesión 0, 1, 0, 1, ... , 0, 1,
siempre de arriba hacia abajo. Así, para n = 4 el arreglo de los 24 = 16 renglones debe ser el
siguiente:

Notación binaria Notación


P1 P2 P3 P4 decimal
0 0 0 0 0
0 0 0 1 1
0 0 1 0 2
0 0 1 1 3
0 1 0 0 4
0 1 0 1 5
0 1 1 0 6
0 1 1 1 7
1 0 0 0 8
1 0 0 1 9
1 0 1 0 10
1 0 1 1 11
1 1 0 0 12
1 1 0 1 13
1 1 1 0 14
1 1 1 1 15
6 Unidad 1  Lógica y conjuntos

La última columna de la tabla anterior tiene la numeración decimal que corresponde a los
arreglos de ceros y unos de los renglones (notación binaria).
2. Usando las tablas básicas, asigne valores de verdad a las proposiciones compuestas, empezan-
do por las negaciones directas y luego por las que no tengan paréntesis dentro de ellas.
3. Prosiga la construcción de adentro hacia fuera de las proposiciones más interiores hacia las
exteriores de las que forman parte, hasta terminar.

Tautologías y absurdos
Cuando se construyen las tablas de verdad de algunas proposiciones se nota que, independiente-
mente de los valores de verdad que puedan tener sus componentes, éstas son siempre ciertas. Se
conocen como tautologías, y entre ellas destacan, por su utilidad en las demostraciones, los casos
particulares de los ocho esquemas,4 los cuales reciben el nombre de esquemas de las tautologías
básicas (o simplemente tautologías básicas).

Esquemas de las tautologías básicas


T1 A → ( B → A)

T2 ( A → B ) → [( A → ( B → C )) → ( A → C )]

T3 A → ( B → ( A ∧ B ))

T4 A ∧ B → A, A ∧ B → B

T5 ( A → C ) → [( B → C ) → [( A ∨ B ) → C ]]

T6 A → A ∨ B, B → A ∨ B

T7 ( A → B ) → [( A → ¬B ) → ¬A]
T8 ¬¬A → A

La negación de una tautología o los casos particulares del esquema A ∧ ¬A son proposicio-
nes que siempre son falsas y se llaman absurdos.

Proposiciones equivalentes
Las parejas de proposiciones X y Y tales que una es cierta si y sólo si la otra lo es (tienen tablas de
verdad iguales) se llaman equivalentes. La lista siguiente enumera una colección de esquemas 
de parejas de proposiciones equivalentes. Para ellas se usa la notación X ≡ Y. La equivalencia
corresponde a la doble implicación Y → X y Y → X, que, como se señaló, también puede deno-
tarse como X ↔ Y. Más adelante se dice que X es equivalente a Y si y sólo si a partir de X puede
demostrarse Y y a partir de Y puede demostrarse X. Ambas definiciones son equivalentes.

X Y Nombre
1. A→ B ¬B → ¬A Ley de la contrapuesta
2. A→ B ¬A ∨ B Equivalencia de la implicación

3. ¬( A → B ) A ∧ ¬B Negación de la implicación

4. (A ∨ B) ∨ C A ∨ (B ∨ C ) Ley asociativa para la disyunción

5. (A ∧ B) ∧ C A ∧ (B ∧ C ) Ley asociativa para la conjunción

4Un caso particular de un esquema es el resultado de sustituir las variables proposicionales por proposiciones. Por ejemplo, 
P → ((Q ∧ R) → P) es un caso particular del esquema A → (B → A), en el que A se ha sustituido por P y B por Q ∧ R.
1.1  Lógica matemática 7

X Y Nombre
  6. A∨B B∨A Ley conmutativa para la disyunción
  7. A∧B B∧A Ley conmutativa para la conjunción

  8. A ∧ (B ∨ C ) (A ∧ B) ∨ (A ∧ C ) Ley distributiva de la conjunción respecto a la disyunción

  9. A ∨ (B ∧ C ) A( A ∨ B ) ∧ ( B ∨ C ) Ley distributiva de la disyunción respecto a la conjunción

10. ¬( A ∨ B ) ¬A ∧ ¬B Ley de De Morgan; negación de la disyunción

11. ¬( A ∧ B ) ¬A ∨ ¬B Ley de De Morgan; negación de la conjunción

12. A ∨T T
13. A ∧T A
Leyes de idempotencia
14. A∨∅ A
15. A∧∅ ∅
16. ¬¬A A Ley de la doble negación

En esta tabla, T es una tautología y ∅ un absurdo.


La equivalencia de los tres primeros esquemas se utiliza en las demostraciones y la de los
demás esquemas, en las aplicaciones del cálculo proposicional a la teoría de conjuntos (como se
explica más adelante en esta unidad).

Argumentos y demostraciones
Los objetos que estudia la matemática no tienen realidad física. Se representan por medio de sím-
bolos o dibujos, pero no existen en el mundo real. Son creaciones (¿o descubrimientos?) de la
mente humana.5 Nadie ha visto un círculo, un triángulo ni un número, y por esta razón, las afir-
maciones hechas acerca de los entes matemáticos y de sus propiedades —por ejemplo, los teore-
mas del álgebra o de la geometría— no pueden demostrarse mediante experimentos. En el mundo
científico, una demostración es un mecanismo de convencimiento, un proceso informal destinado
al consumo humano, formulado en lenguaje humano, en el que se permite utilizar todas las com-
plejidades y sutilezas de la inteligencia, así como las argucias del arte de persuadir.
La persistente regularidad con que se presentan algunos fenómenos naturales ha permitido
postular muchas leyes de la física, la química, la biología y la economía, y para comprobarlas los
científicos diseñan experimentos que, cuando dan resultados coincidentes con lo esperado por
ellos, se dice que tal resultado confirma la teoría o la demuestra. La aparición de nuevas evidencias
obliga a que estas leyes y sus demostraciones deban modificarse. En la matemática esto no puede
suceder. Sus teoremas son eternos. Por ejemplo, el teorema de Pitágoras tiene una vigencia mucho
más larga que los resultados de la mecánica celeste de Newton o que la teoría de la relatividad de
Einstein.
El notable avance de las ciencias de la computación ha permitido comprobar un gran número
de resultados de cálculos numéricos, los cuales apoyan y fortalecen algunas conjeturas aritméticas,
pero no las demuestran. Por ejemplo, si quisiera demostrarse que todo número natural es menor o
igual a 100 000 000 —lo cual es falso—, se podrían exhibir más de cien millones de ejemplos (0, 1,
2, . . ., 100 000 000) que cumplen con lo que la proposición asegura y, sin embargo, a pesar del mul-
titudinario cúmulo de testigos, la falsedad del enunciado queda en evidencia al considerar el núme-
ro 100 000 001, o cualquiera del infinito número de sus sucesores, 100 000 001 + n, n = 1, 2, . . .

5Platón decía que los objetos de la matemática existen en un mundo ideal y que algunas veces se muestran a humanos geniales o
dotados de gran talento, que son quienes los descubren.
8 Unidad 1  Lógica y conjuntos

René Thom afirma que


René Thom (1923-2002). Matemático
y topólogo francés, que destacó por la demostración de una proposición Q debe ser como un camino que, partiendo de una
su trabajo en el desarrollo de la teoría situación aceptada y que, por lo tanto, deba ser comprendida por todos, conduzca, a través
de las catástrofes, la cual está de pasos sucesivos, hasta un estado psicológico en el que la verdad de la proposición resul-
relacionada con sistemas dinámicos te evidente [y agrega que] el rigor de esta demostración se basa en el hecho de que cada
que no pueden modelarse adecuada- paso sea perfectamente claro, simplemente tomando en cuenta las extensiones de significa-
mente mediante el cálculo diferencial. do que se han ido efectuando en pasos previos.

Puede estarse de acuerdo con lo anterior, pero las fórmulas de la matemática, las
cuales por supuesto pueden interpretarse, son entes abstractos. ¿Cómo comprender la demostración
de una colección de símbolos que pueden no tener significado alguno? ¿Cuáles pueden ser las claras
extensiones de significados que se han dado en pasos previos? Debe tenerse una formulación precisa
de estas ideas dentro de la lógica matemática.
En la ciencia se razona por medio de argumentos, que son reglas aceptadas que permiten
obtener conclusiones a partir de ciertas hipótesis (las premisas). En lógica matemática se define un
argumento como una pareja (Γ, Q), donde Γ es un conjunto de fórmulas (proposiciones) llamadas
hipótesis y Q es una fórmula que se conoce como la conclusión.
Se dice que un argumento (Γ, Q) es válido cuando la verdad de cada una de sus premisas fuer-
za a que la conclusión deba ser cierta. En un argumento válido no puede suceder que al ser ciertas
las premisas, la conclusión no lo sea. En ese caso se dice que las premisas implican lógicamente la
conclusión o que Γ → Q es una tautología, y de acuerdo con esta definición es claro que los argu-
mentos válidos preservan el valor de verdad en el sentido de que a partir de premisas ciertas siempre
se obtienen conclusiones ciertas.
La definición anterior da origen a dos métodos prácticos para determinar la validez de un
argumento.

Método directo
Considere todos los valores de verdad que hagan ciertas las hipótesis, asignándolos a las proposi-
ciones simples que las conforman, en el orden conveniente para que las disyunciones y las impli-
caciones sólo tengan una manera de ser ciertas. La asignación debe ser congruente, de manera que
si a una proposición simple se le asigna un valor de verdad, debe conservarlo en todas sus apari-
ciones en el argumento. Si este procedimiento obliga a la conclusión a ser cierta (no que pueda ser,
sino que tenga que ser), entonces el argumento es válido, y, en caso contrario, no válido. Dado que
los casos en que las hipótesis sean ciertas pueden ser varios (y entonces hay que considerar cada
uno de ellos), conviene iniciar asignando valores a aquellas proposiciones que sólo tienen una
combinación de valores que las hace ciertas, como las que están solas, las negaciones de una pro-
posición y las conjunciones (por ejemplo, ¬B, R y M ∧ N).

Método indirecto
Se asignan valores de verdad a las proposiciones simples que hagan falsa la conclusión y se incor-
poran esos valores a las que aparezcan en las hipótesis. Se continúa asignando valores de verdad
a las proposiciones simples restantes de manera que hagan ciertas las hipótesis, si eso no es posible
y alguna de las hipótesis falla (resulta falsa), entonces el argumento es válido. Si pudiera suceder
que, siendo falsa la conclusión, todas las hipótesis resultaran ciertas, el argumento es inválido.
Una manera de proceder es usar 1 para cierto y 0 para falso, en la forma de superíndice en
cada proposición simple, como se ilustra en los ejemplos siguientes.

Ejemplo 1.1.2
Demostrar la validez del argumento siguiente utilizando el método directo.
C∧P
P → (E ∨ L)
E → ¬C
∴L
1.1  Lógica matemática 9

Otra manera de escribir el argumento es:


C ∧ P, P → (E ∨ L), E → ¬C, ∴ L, o también
〈(C ∧ P) ∧ [P → (E ∨ L)] ∧ (E → ¬C)〉 → L
En este caso, se comienza haciendo cierta la proposición (C ∧ P). La única manera en que
esto pase es que tanto C como P sean ciertas. Luego, a C y a P les corresponde un uno.
C ∧P
1 1
La P de la segunda hipótesis también debe ser cierta.
P → (E ∨ L)
1

En la tercera hipótesis hay una ¬C que resulta falsa, ya que C es cierta.


E → ¬C
0
Para ser cierta, esta última hipótesis obliga a la E a ser falsa.
E → ¬C
0 0
Cuando se aplica este valor a la proposición P → ( E ∨ L ) se obtiene:
P → (E ∨ L)
1 0
que para ser cierta fuerza a que L (la conclusión) tenga que ser cierta. Esto prueba la validez del
argumento.
P → (E ∨ L)
1 0 1

Ejemplo 1.1.3
Demostrar la validez del siguiente argumento utilizando el método indirecto.
I →P
C ∨ ¬P
¬C
∴ ¬I
o bien,
( I → P ) ∧ (C ∨ ¬P ) ∧ ( ¬ C )  → ¬ I

Para que la conclusión sea falsa se asigna a I el valor uno.


¬I
0
Luego, para que la primera hipótesis resulte cierta, P también debe tener valor uno.
I→P
1    1
En la segunda hipótesis, ¬P es falsa y, por lo tanto, C tiene que ser cierta.
C ∨ ¬P
1   0
10 Unidad 1  Lógica y conjuntos

Así, la tercera hipótesis, ¬C, no puede ser cierta.


¬C
0
Por lo tanto, el argumento es válido.

Algunos argumentos válidos aparecen en las demostraciones con tal frecuencia que merecen
ser señalados explícitamente (como los productos notables en el álgebra), y se les llama reglas váli-
das de inferencia. El ejemplo clásico es el conocido como modus ponendo ponens (modus ponens),
el cual asegura que a partir de las hipótesis A y A → B se puede concluir B. Se denota como MP y
se acostumbra representar con el esquema
A, A → B
B
en el que las premisas se han escrito en el renglón de arriba y la conclusión en el de abajo. Siguien-
do esa convención, se presentan los tres siguientes argumentos, que también son válidos y que,
junto con el primero, forman las reglas válidas de inferencia usadas con más frecuencia en las
demostraciones de la lógica proposicional:
A → B, B → C
Regla del silogismo hipotético (SH)
A→C

A ∨ B, ¬ A
Regla de disyunción o modus tollendo ponens (disy)
B
A, ¬ A
Regla de reducción al absurdo (RAA)
B
Cuando (Γ, Q) es un argumento, se dice que Q es consecuencia inmediata de Γ. En el caso del
modus ponens, disyunción o absurdo de los esquemas anteriores, B es consecuencia inmediata de
sus respectivas premisas.
En teorías axiomáticas es frecuente suponer que, además de los axiomas, son ciertas algunas
otras fórmulas, y en esos casos, considerar las que, debido a esa suposición (hipótesis), resultan
también verdaderas. Por ejemplo, en la geometría de Euclides, puede suponerse que las rectas l y
m son paralelas a una tercera recta k y concluir que entonces l y m son paralelas entre sí. En los
casos análogos, cuando al suponer las hipótesis Γ puede concluirse Q, se dice que, en esa teoría,
Q puede deducirse a partir de las hipótesis Γ.
Tomando en cuenta las consideraciones anteriores se da la siguiente definición:

Definición 1.1.2
La deducción de una fórmula Q en una teoría axiomática 𝒯, a partir de la hipótesis Γ, es una
lista ordenada de fórmulas B1, B2, . . ., Bn tal que cada una de ellas es:
1. un axioma de la teoría.
2. una hipótesis de Γ.
3. una tautología6 (o cualquier proposición equivalente a ella).7
4. la consecuencia inmediata de una regla válida de inferencia, cuyas premisas ya están en la
lista (son anteriores).
5. Bn es Q (cuya presencia también debe estar justificada8 por las condiciones 1 a 4).

6 Para evitar el uso de las tablas de verdad con objeto de justificar que alguna proposición que se desea utilizar es tautología, en
este libro sólo se utilizarán casos particulares de las ocho tautologías básicas.
7 Se está utilizando la ley del reemplazo en la siguiente versión: Sea F(A) una fórmula que contiene a la proposición A y F(B), la

que resulta de sustituir A por B en F. Entonces A ≡ B ⇒ F(A) ≡ F(B). En particular, F(A) se puede demostrar si y sólo si F(B) se
puede demostrar. Esta ley permite sustituir cualquier fórmula de una deducción por otra equivalente (o anexar renglones).
8 Cuando una deducción se hace sin usar hipótesis (Γ = ∅) se dice que se trata de una demostración. En este libro no se hace tal

distinción, de manera que se usará demostración o deducción como sinónimos.


1.1  Lógica matemática 11

Cuando se construye la deducción de una fórmula es conveniente numerar las proposiciones


que van formándose para poder referirse a ellas sin ambigüedad; además, se acostumbra agregar
una breve justificación de la presencia de cada fórmula de la cadena (en general, se escribe una
demostración con objeto de comunicarla, o de recordar después cómo se hizo, y en esos casos la
justificación mencionada ayuda a este propósito).
No existen algoritmos que permitan indicar cómo hacer una demostración. Es un arte cuyos
productos no siempre son fáciles de conseguir. Debe seleccionarse el camino y decidir cómo debe
ser cada paso, qué tautologías deben usarse y cómo descubrir las reglas válidas de inferencia cuyas
premisas van apareciendo.
Una ayuda que facilita la labor de los demostradores consiste en recordar que las tautologías
básicas son esquemas que expresan las relaciones que los conectivos tienen entre sí.
Las tautologías 1 y 2 definen las propiedades esenciales de la implicación (son equivalentes a
su tabla de verdad). Las tautologías 3 y 4 relacionan la implicación con el conectivo “y”; la 5 y la
6 con el “o” y la 7 y la 8 con el “no”. Estas relaciones sugieren los esquemas de tautologías que
pueden usarse en cada caso. En los ejemplos 1.1.4 y 1.1.5, que se muestran a continuación, el
único conectivo que aparece es la implicación; para construir sus demostraciones se aconseja
tener en cuenta las dos primeras tautologías: la primera, A → (B → A), permite considerar cual-
quier proposición cierta A como consecuencia de cualquier premisa B, y la segunda,
(A → B) → [(A → (B → C)) → (A → C)],
afirma, de alguna manera, que la implicación es transitiva.
En el ejemplo 1.1.6 aparece el conectivo no y, por lo tanto, es recomendable considerar, ade-
más de los esquemas 1 y 2, el 7 y el 8, e interpretar adecuadamente lo que dicen. El esquema 7, 
(A → B) → [(A → ¬ B) → ¬ A], asegura que toda proposición A, que genera inconsistencias 
(B y ¬ B), debe ser falsa (¬A).
¬¬A establece que, en el cálculo proposicional, la doble negación afirma.
Es conveniente recordar las cuatro reglas válidas de inferencia y los esquemas de sus premisas
para poder identificar los casos particulares de éstas, que van apareciendo en la lista, y así poder
anotar en ella sus consecuencias inmediatas (sus conclusiones).
Utilizando modus ponens como la única regla válida de inferencia, como sucede en algunos
libros de lógica matemática, pueden justificarse las reglas de silogismo hipotético, reducción al
absurdo y disyunción, que en este caso se llaman reglas derivadas. Los ejemplos 1.1.5 y 1.1.6
demuestran las primeras dos.
El ejemplo 1.1.4 corresponde a un teorema que conviene considerar por la aplicación que
tiene en otro teorema.
Ejemplo 1.1.4
⊢– P → P (En este caso se trata de una deducción a partir de cero hipótesis.)
1. P → (P → P ) T1 ( A = B = P )
2. ( P → ( P → P ) ) → ( P → ( ( P → P ) → P ) ) → ( P → P )  T2 ( A = C = P, B = P → P )
3. ( P → ( ( P → P ) → P )) → ( P → P ) MP (1, 2)
4. P → ( (P → P ) → P ) T1 ( A = P, B = P → P )
5. P→P MP (4, 3)

Ejemplo 1.1.5
( P → Q ) , (Q → R ) ⊢– ( P → R )
1. P →Q Hipótesis
2. ( P → Q ) → ( P → (Q → R )) → ( P → R )  T2 ( A = P, B = Q, C = R )
3. ( P → (Q → R )) → ( P → R ) MP (1, 2)
4. (Q → R ) → [ P → (Q → R )] T1 ( A = Q → R, B = P )
5. Q→R Hipótesis
6. P → (Q → R ) MP (5, 4)
7. P →R MP (6, 3)
12 Unidad 1  Lógica y conjuntos

Ejemplo 1.1.6
A, ¬ A ⊢– B
1. A → ( ¬ B → A) T1 ( A = A, ¬ B = B )
2. A Hipótesis
3. ¬B → A MP (2, 1)
4. ¬ A → ( ¬ B → ¬ A) T1 ( ¬ A = A, ¬ B = B )
5. ¬A Hipótesis
6. ¬B → ¬A MP (5, 4)
7. (¬ B → A) → (¬ B → ¬ A) → ¬¬ B  T7 ( A = ¬ B, B = A)
8. (¬ B → ¬ A) → ¬¬ B MP (3, 7)
9. ¬¬ B MP (6, 8)
10. ¬¬ B → B T8
11. B MP (9, 10)

Una gran cantidad de demostraciones del cálculo proposicional, y la mayoría de las de la


matemática, no son fáciles y casi siempre son demasiado largas. Es el precio que se paga por el
deseo de analizar con todo detalle cada paso. Sin embargo, cuando la deducción de algún renglón
es muy simple y salta a la vista, o es el resultado de un teorema cuyas hipótesis ya figuran en la
lista, estas conclusiones pueden escribirse directamente como una abreviatura de sus deducciones.
Por ejemplo, si se sabe (están en la lista) que a y b son catetos de un triángulo rectángulo de hipo-
tenusa c, se puede escribir directamente que a2 + b2 = c2 sin tener que escribir la deducción com-
pleta del teorema de Pitágoras.
En las demostraciones pueden omitirse algunos pasos, si éstos son muy obvios9 y si tal sim-
plificación no hace que se pierda la idea general de la demostración. En álgebra suele decirse que
lo que está sumando pasa restando o lo que está multiplicando y no es cero, pasa dividiendo, y así
usar estas afirmaciones que son resultado de procesos deductivos muy simples:
Si ax + b = c , ax + b − b debe ser igual a c − b, y como la suma es asociativa ( b − b = 0 ), y
ax + 0 = ax, resulta finalmente que ax = c − b .
En el cálculo proposicional, de la hipótesis A ∧ B puede deducirse fácilmente A y B. En efecto:
1. A ∧ B → A T4 1. A ∧ B → B T4
2. A ∧ B Hipótesis 2. A ∧ B Hipótesis
3. A MP (2, 1) 3. B MP (2, 1)
Ambas deducciones pueden omitirse, de modo que cuando esté entre las hipótesis A ∧ B en
una demostración, se vale usar cualquiera de ellas (A o B) sin escribir los tres pasos anteriores,
anexando la justificación simplificación de la hipótesis…
La mayoría de los teoremas de la matemática son de la forma si … entonces … (o pueden
expresarse así). Por ejemplo: Si ab = 0, entonces a = 0 o b = 0; si ABC es un triángulo rectángulo,
entonces la suma de las medidas de sus ángulos agudos es π/2...; son implicaciones cuya demostra-
ción comienza por lo general suponiendo que se cumplen las premisas (la parte si …), lo cual
cambia el problema de demostrar la implicación (P → Q) por el que consiste en suponer P y
demostrar Q. Este procedimiento suele justificarse con argumentos como el siguiente:
Para probar la implicación P → Q, sólo debe considerarse el caso en que P es verdadera, ya que cuando no
lo es, la implicación total es automáticamente cierta (toda implicación que parte de una premisa falsa es
cierta por definición).

La validez del argumento anterior se encuentra en el teorema de la deducción, que junto con
el de reducción al absurdo, son una herramienta fundamental en la demostración de los teoremas
de la matemática.

9 La obviedad depende de la capacidad de análisis, la vista y el nivel de conocimiento de quien juzga.


1.1  Lógica matemática 13

 Teorema  1.1.1
Teorema de la deducción
En una teoría axiomática 𝒯, a partir de Γ se puede deducir que P → Q si y sólo si a partir de Γ y
P se puede demostrar Q. En símbolos:
(Γ ⊢– P → Q) ⇔ (Γ, P ⊢– Q)

 Teorema 1.1.2
Teorema de la reducción al absurdo
En una teoría axiomática 𝒯, a partir de Γ y de no P se puede deducir un absurdo ( ) si y sólo si a
partir de Γ se puede deducir P. En símbolos:
(Γ, ¬P) ⊢– ⇔ Γ ⊢– P

La validez de estos teoremas se apoya en el análisis de las tablas de verdad, las cuales repre-
sentan los enunciados de éstos y que se muestran a continuación:
Tabla 1.1  Comprobación de la equivalencia de las proposiciones (Γ ∧ P) → Q y Γ → (P → Q)

(Γ ∧ P) → Q Γ → (P → Q)
0 0 0 1 0 0 1 0 1 0
0 0 0 1 1 0 1 0 1 1
0 0 1 1 0 0 1 1 0 0
0 0 1 1 1 0 1 1 1 1
1 0 0 1 0 1 1 0 1 0
1 0 0 1 1 1 1 0 1 1
1 1 1 0 0 1 0 1 0 0
1 1 1 1 1 1 1 1 1 1

La tabla 1.1 asegura que las proposiciones (Γ ∧ P) → Q y Γ → (P → Q) son equivalentes 


—una es cierta si y sólo si la otra lo es— y, por lo tanto, si una es tautología,10 la otra también 
lo es. Es decir, (Γ ∧ P) implica lógicamente a Q si y sólo si Γ implica lógicamente (P → Q), como 
lo afirma el teorema. De manera análoga:

Tabla 1.2  Comprobación de la equivalencia de las proposiciones ¬P ∧ Γ → yΓ→P

(¬P ∧ Γ) → Γ → P
1 0 0 1 0 0 1 0
1 1 1 0 0 1 0 0
0 0 0 1 0 0 1 1
0 0 1 1 0 1 1 1

La tabla 1.2 ilustra la equivalencia de las proposiciones ¬P ∧ Γ → y Γ → P, lo que demuestra


la validez del teorema de la reducción al absurdo.
Para ilustrar la forma en que el teorema de la deducción (1.1.1) simplifica algunas demostra-
ciones, se repiten los problemas de los ejemplos 1.1.4 y 1.1.5, pero ahora usando el teorema men-
cionado.

10 Cuando se afirma que una proposición es tautología, se debe entender que no pueden darse los casos en que la proposición
es falsa. En el caso que se ilustra, debe entenderse que la combinación de valores del renglón 7, que dice que las hipótesis son
ciertas y la conclusión falsa, no puede suceder dado que se afirma que el argumento es válido.
14 Unidad 1  Lógica y conjuntos

1. ⊢– P → P se transforma en el que dice:


P ⊢– P cuya deducción consta de un solo paso:
i) P Hipótesis (adicional)
2. P → Q, Q → R ⊢– P → R que se cambia en:
P, P → Q, Q → R ⊢– R  La deducción de este último puede ser:
i) P → Q Hipótesis
ii) P Hipótesis adicional
iii) Q MP (2, 1)
iv) Q → R Hipótesis
v) R MP (3, 4)
Compare estas deducciones con las hechas anteriormente y compruebe que además de
ser más cortas son mucho más sencillas y en ellas se ve más fácilmente cómo construirlas.
El uso del teorema de reducción al absurdo (1.1.2) se ejemplifica en las tres importantes
deducciones siguientes:
3. P, ¬P ⊢– Q, que se cambia por:

P, ¬P, ¬Q ⊢–     Una deducción puede ser:


i) P Hipótesis
ii) ¬P Hipótesis
iii) P ∧ ¬ P (1, 2)
Observe que la proposición Q no intervino en la deducción, lo cual prueba que una teoría
axiomática en la que existe una proposición P y su negación ¬P entre sus teoremas es incon-
sistente.11 Cualquier fórmula puede demostrarse y su negación también, lo cual las hace inúti-
les y, por lo tanto, se rechazan.
4. ⊢– ¬ ( P ∧ ¬ P ) (El cálculo proposicional es simplemente consistente.)
Suponga lo contrario de lo que se desea probar, es decir, P ∧ ¬ P . Entonces
i) P ∧ ¬ P Hipótesis
que es absurda y, por lo tanto, prueba lo contrario de lo que se supuso, lo cual es lo que se
debía demostrar.
5. ⊢– P ∨ ¬ P (Ley del tercero excluido.)
El problema se cambia por:
¬ ( P ∨ ¬ P ) ⊢–
Observe que de ¬( P ∨¬ P ) , P puede derivarse un absurdo:
i) P Hipótesis
ii) P → ( P ∨ ¬ P ) T6
iii) P ∨ ¬ P MP (1, 2)
iv) ¬ ( P ∨ ¬ P ) Hipótesis
v) ( P ∨ ¬ P ) ∧ ¬ ( P ∨ ¬ P ) (3, 4)
por lo que ¬ ( P ∨ ¬ P ) ¬ ¬P Teorema reducción al absurdo

Análogamente, ¬ ( P ∨ ¬ P ) ¬ P ⊢–
i) ¬ P Hipótesis
ii) ¬ P → ( P ∨ ¬ P ) T6
iii) P ∨ ¬ P MP (1, 2)

11
Una teoría axiomática con negación es inconsistente si y sólo si existe en ella una fórmula tal que ella y su negación son teore-
mas. A este tipo de inconsistencia se le llama simple.
1.1  Lógica matemática 15

iv) ¬ ( P ∨ ¬ P ) Hipótesis
v) ( P ∨ ¬ P ) ∧ ¬ ( P ∨ ¬ P ) (3, 4)
lo cual señala que ¬ ( P ∨ ¬ P ) ⊢– P Teorema reducción al absurdo
y de los dos resultados anteriores se sigue que ¬ ( P ∨ ¬ P ) ⊢– ¬ P ∧ P
es decir,  ⊢– P ∨ ¬ P Teorema reducción al absurdo

Algunas propiedades del símbolo “⊢–”


(se puede demostrar)
De la discusión realizada sobre las demostraciones se derivan, o pueden derivarse fácilmente, las
propiedades del símbolo ⊢–, algunas de las cuales se enumeran a continuación y se usarán libre-
mente para argumentar acerca de las demostraciones y sus métodos.
1. Toda tautología, hipótesis o axioma puede demostrarse (demostración de un solo paso) (∀Q,
hipótesis, axioma o tautología) ⊢– Q.
2. Si de las fórmulas de un conjunto M se puede demostrar cada una de las de otro conjunto N,
y con las de éste se puede probar Q, entonces de M se puede probar Q. Si N es un subconjun-
to de M, a partir de M puede demostrarse cada fórmula de N.
(M ⊢– N) ∧ (N ⊢– Q) ⇒ M ⊢– Q
3. Si de Γ y P puede deducirse que Q y P es un teorema cuya demostración no requiere de nin-
guna hipótesis, entonces de Γ (solamente) puede deducirse Q (por ejemplo, si se supiera que
Γ, (P ∨ ¬P) ⊢– Q, entonces Γ ⊢– Q).
(Γ, P ⊢– Q) ∧ (⊢– P) ⇒ Γ ⊢– Q
4. Si de Γ pueden deducirse tanto P como Q, entonces de Γ puede deducirse P ∧ Q.

(Γ ⊢– P, Γ ⊢– Q ⇒ Γ ⊢– P ∧ Q)
5. Si de P puede deducirse R y de Q también puede deducirse R, entonces de P o Q puede dedu-
cirse R:
(P ⊢– R) ∧ (Q ⊢– R) ⇒ (P ∨ Q) ⊢– R.

Ejercicio 1.1

1.  Demuestre la equivalencia de las parejas de proposiciones:


( P → Q ) ≡ (¬Q → ¬ P )
P → Q ≡ ¬P ∨Q
¬ ( P → Q ) ≡ P ∧ ¬Q
haciendo ver que, en cada caso, de una de ellas se puede demostrar la otra (dos demostraciones).

El cálculo proposicional es consistente y completo


El cálculo proposicional tiene por objeto formalizar la manera en que se razona y, por lo tanto, es
una teoría axiomática intuitiva12 de la cual se puede decir que es consistente y completa con res-
pecto a la propiedad de ser cierta, de acuerdo con las siguientes definiciones:

12 Se llama así a toda teoría cuyo objetivo es formalizar una parte de la realidad de la que se tiene alguna idea (que generalmente
es imprecisa).
16 Unidad 1  Lógica y conjuntos

Definición 1.1.3
Una teoría axiomática es consistente con respecto a una propiedad P, si todos sus teoremas la
tienen.

Si la propiedad es ser cierta, una teoría axiomática resulta consistente si y sólo si todos sus
teoremas son ciertos. Recuerde que en el cálculo proposicional, todo renglón de una demostra-
ción, incluido el último, es cierto de origen (es tautología, hipótesis o axioma), o es consecuencia
de una regla válida de inferencia, que cuando parte de premisas ciertas, produce conclusiones
ciertas; es decir, el cálculo proposicional es consistente con respecto a la propiedad de ser cierto.
Todos sus teoremas resultan tautologías.

Definición 1.1.4
Una teoría axiomática es completa con respecto a una propiedad P, si toda fórmula que la
tenga es demostrable (es un teorema).

Para justificar la afirmación de que el cálculo proposicional es completo con respecto a la


propiedad de ser cierto, se debe demostrar que toda tautología es teorema, como lo muestra 
el siguiente lema.

Lema
Observe que cada renglón de una tabla de verdad puede interpretarse como un argumento
válido del cálculo proposicional.

Suponga que se da un renglón de la tabla de verdad de una proposición Q que tiene n premi-
sas P1, . . ., Pn. La manera de construir el teorema que corresponde a ese renglón es considerar el
argumento:

B1, B2, . . ., Bn, ∴ C

en donde cada Bi es Pi si en ese renglón el valor de verdad de la proposición Pi es 1 y es ¬Pi si Pi


es falsa. C es Q si Q es cierta y ¬Q si es falsa. Por ejemplo, suponga que la tabla correspondiente
a la proposición Q tiene los siguientes valores:

P1 P2 P3 P4 Q
1 1 0 1 0

En este caso, el teorema asociado es: P1, P2, ¬ P3, P4 ⊢– ¬Q.


La tabla de verdad del conectivo ¬ es la siguiente:

P ¬P
0 1

1 0

Y genera estos dos teoremas:


¬P ⊢– ¬P, que corresponde al primer renglón, y
P ⊢– ¬ ¬P que corresponde al segundo.
1.1  Lógica matemática 17

Cada uno de los otros tres conectivos lógicos, cuyas tablas de verdad tienen cuatro renglones,
da lugar a cuatro teoremas, uno para cada renglón, que se demuestran fácilmente. Se da un ejem-
plo de cada uno de ellos y se dejan los otros nueve como ejercicios.

Ejemplo 1.1.7
El renglón 2 de la siguiente tabla de implicación

P Q P→Q
1 0 0

señala que de P y no Q puede demostrarse ¬ (P → Q), es decir:

P, ¬Q ⊢– ¬ (P → Q)

que puede deducirse por reducción al absurdo, suponiendo lo contrario de lo que se quiere demos-
trar y derivando una contradicción. Es decir, se cambia el problema original por el siguiente:

P, ¬Q, P → Q ⊢– 

Una deducción puede ser:


1. P Hipótesis
2. P → Q Hipótesis adicional
3. Q MP (1, 2)
4. ¬Q Hipótesis
5. Q ∧ ¬Q (3, 4)

Ejemplo 1.1.8
El renglón 3 del conectivo ∧ es:

P Q P∧Q
1 1 1

Es decir: P, Q ⊢– P ∧ Q
1. P Hipótesis
2. Q Hipótesis
3. P → [Q →(P ∧ Q)] T3
4. Q → (P ∧ Q) MP (1, 3)
5. P ∧ Q MP (2, 4)

Ejemplo 1.1.9
El renglón 0 del conectivo ∨ es:

P Q P∨Q
0 0 0

que corresponde al teorema: ¬P, ¬Q ⊢– ¬(P ∨ Q) y que puede demostrarse por reducción al
absurdo al notar que
¬P, ¬Q, P ⊢– P ∧ ¬P
¬P, ¬Q, Q ⊢– Q ∧ ¬Q

Así, ¬P, ¬Q, P ∨ Q ⊢– , lo que confirma la aserción del teorema.


1.1  Lógica matemática
18 Unidad 1  Lógica y conjuntos

La demostración de los 14 teoremas correspondientes a los renglones de las tablas de verdad


de los conectivos lógicos muestran que, puesto que las tablas de verdad de toda fórmula se cons-
truyen aplicando iteradamente las de los conectivos lógicos que intervienen en ellas, cada renglón
de cualquier tabla es un argumento válido deducible. La observación anterior es la base de la
demostración del siguiente teorema:

 Teorema  1.1.3
En el cálculo proposicional toda tautología es demostrable.

Se ilustra el teorema para el caso de una tautología que esté formada por dos proposiciones,
y cuya tabla de verdad resulta ser:

P Q T
0 0 1
0 1 1
1 0 1
1 1 1

De acuerdo con el lema anterior, para cada renglón se tienen los siguientes teoremas:
1. ¬P, ¬Q  ⊢– T 3. P, ¬Q ⊢– T
2. ¬P, Q,     ⊢– T 4. P, Q ⊢– T
De 1 y 2 se concluye que:

¬P, (Q ∨ ¬Q) ⊢– T  ∴  ¬P  ⊢– T (1.1.3)


(Q ∨ ¬Q es teorema)
Análogamente, de 3 y 4:
P, (Q ∨ ¬Q) ⊢– T  ∴  P  ⊢– T (1.1.4)

Finalmente, de (1.1.3) y (1.1.4): P ∨ ¬P  ⊢– T  ∴  ⊢– T.

La demostración formal puede hacerse por inducción (aquí no se da), pero el paso inductivo
se ejemplifica para una tautología con tres fórmulas P, Q y R, que muestra la manera como se
pasa del caso 2 al caso 3.
Sea T una tautología compuesta con las tres fórmulas P, Q y R. Su tabla, de ocho renglones,
puede partirse en dos mitades, la primera de las cuales comienza con un cero para P y que, en
conjunto, muestra todos los casos para los valores de Q y R, por lo que, de acuerdo con el resul-
tado anterior (caso de dos fórmulas), de esta mitad se concluye:
¬P ⊢– T
El resultado de la segunda mitad, en donde los cuatro renglones empiezan con uno para el
valor de P, afirma:
P ⊢– T
y, por lo tanto, de la tabla completa se deduce que ¬P, P ⊢– T, de donde finalmente se obtiene ⊢– T.

Cuantificadores
Suponga que A = {a, b, c} es un conjunto y P una propiedad que cada elemento de A puede o no
tener. Se denota como P(x) a la proposición x tiene la propiedad P y ¬P(x) cuando x no la tiene.
Entonces la afirmación P(a) ∧ P(b) ∧ P(c) es cierta si y sólo si cada elemento de A tiene la propie-
dad P.
1.1  Lógica matemática 19

Cuando tal situación se da en conjuntos con un número grande de elementos, la expresión


anterior no es práctica. Se recurre entonces a notaciones más compactas, entre las que se destaca
la que introduce el uso del llamado cuantificador universal ∀, que se lee como para todo o para
cada, según convenga a la interpretación de la proposición a la cual se aplica. Note que, en este
caso, ∀ es la abreviatura de un ∧ generalizado.
La afirmación todo elemento de A tiene la propiedad P es falsa si y sólo si existe algún elemen-
to de A que no la tenga. Entonces es natural definir la negación de un para todo con un existe. En
símbolos:
¬(∀ x ∈ A, P ( x ) ) ≡ ∃ x ∈ A∋ ¬P ( x )

∃ es el cuantificador existencial que se lee existe. Algunas veces se usa la notación ∃! para afir-
mar que algo existe y es único.
Recíprocamente, si la proposición es existe un x (al menos uno) en A que tiene la propiedad P
(que es un ∨ generalizado), entonces su negación es: Todo elemento de A carece de (no tiene) la
propiedad P. En símbolos:
¬[ ∃ x ∈ A∋ P ( x )] ≡ ∀ x ∈ A, ¬ P ( x )

Como se señala a continuación, las definiciones anteriores son una generalización de las leyes
de De Morgan.

Ley de De Morgan Generalización Notación13

¬(A ∧ B) ≡ ¬ A ∨ ¬ B ( )
¬ A 1 ∧  ∧ An ≡ ¬ A 1∨  ∨¬ An ¬(∧i ∈ I Ai ) ≡ ∨i ∈ I (¬ Ai )

¬(A ∨ B) ≡ ¬ A ∧ ¬ B ¬( A1 ∨  ∨ An ) ≡ ¬ A 1∧  ∧¬ An ¬(∨i ∈ I Ai ) ≡ ∧i ∈ I (¬ Ai )

Se puede abreviar así: la negación de un para todo es un existe y la negación de un existe es un


para todo.
Es necesario decir que cuando se agregan cuantificadores al cálculo proposicional, se incur-
siona en el cálculo de predicados, lo cual requiere de nuevos conceptos, nuevas relaciones y, con-
secuentemente, nuevas reglas de inferencia. El uso de variables en el cálculo proposicional
ampliado complica la asignación de valores de verdad de las fórmulas, que ahora depende de los
dominios de interpretación de las variables y de los objetos particulares que se sustituyen, pero a
cambio de eso este cálculo ampliado permite representar en él la mayor parte de las proposiciones
de la matemática.

Ejercicios 1.1.

2. Señale si las siguientes frases pueden considerarse proposiciones (es decir, si aceptan uno y sólo
uno de los dos valores de verdad: falso o verdadero).
a)  El número 30 es divisible entre 8. e)  Esto es falso.
b)  La montaña nevada. f)  Mejor vete a freír espárragos.
c) 13 ≥ 2 + 8. g)  Todas las x son verdes.
d)  No hay regla sin excepción. h)  x + y = 10.
3.  Escriba en forma simbólica las siguientes proposiciones.
a) La matemática es sencilla y la lógica divertida.
b) (2 + 2 = 4) o (7 × 8 = 46).
c) Un elemento pertenece a la intersección de dos conjuntos si y sólo si pertenece a cada uno
de ellos.
d) Todo número real es algebraico o trascendente.

13 En las expresiones ∧ … ∧ A y A ∨ … ∨ A , se utiliza la notación i ∈ I para indicar


i∈I Ai y ∨i∈I Ai, que son simplificaciones de Ai ∧ n i n
que I es una colección de índices. Esto puede hacerse solamente cuando I es un conjunto.
20 Unidad 1  Lógica y conjuntos

4. Identifique el conectivo lógico utilizado en cada uno de los incisos. Use letras para designar
proposiciones simples y finalmente reescriba en símbolos las proposiciones.
a) Los osos no comen en invierno.
b) Si Petra baila, es feliz.
c) La materia favorita de todos es Lógica matemática.
d) Si la envidia fuera tiña, todos andaríamos tiñosos.
e) Si las miradas mataran, entonces ya estarías muerto.
f ) (x + y = 1 y 2x − y = 4) o (z > 3).
5. Utilice:
p: a es menor que b q: a es menor o igual que b
r: b es menor que c s: c es igual a d
t: a es menor que c
para escribir en lenguaje común las siguientes proposiciones:
a)  ( p ∨ ¬r ) → t c)  ( q → r ) → ¬t
b)  [ ¬( p ∨ ¬q ) ∧ r ] → t d )  (t ∧ s ) ↔ [( r ∧ ¬p ) → t )]
6.  Construya las tablas de verdad para las ocho tautologías básicas.
7. Si p y r son verdaderas y q es falsa, indique si las siguientes proposiciones son o no verdaderas.
a)  ( p ∧ q ) → p d)  ( p → q ) ↔ ¬( q → p )
b)  ( p ∨ q ) → ¬( q ∧ p ) e 
)  ( p ∨ q ) → r
c)  ( p → q ) → q
8. Diga cuáles de los siguientes argumentos son válidos. Analice con unos y ceros.
a)  ¬P ∨ Q, ¬P → ¬R, Q → R ∴ P d)  ¬( ¬P ∧ ¬Q ) , P ∨ ¬Q ∴ P
b)  ¬P → Q, Q → ¬R, ¬R ∴ P e  )  Q → ¬P, Q ∨ R, ¬R ∴ ¬P
c)  P ∧ Q, R ∧ P ∴ P
  9. Haga una deducción de los siguientes argumentos.
a) S ∧ Q b) ¬Q → H c) D → (¬F → G) d) L → O
R ∧ S H → ¬ F ¬E ∨ D M→D
∴ S F ∨ S ¬F ¬(D ∧ O) ∨ Z
¬S ∴ E → G ¬Z
∴ Q ∴ L → ¬M
10. Determine el valor de verdad de los siguientes enunciados y niéguelos sin anteponer un no.
a)  ∀ x ∈ , x 2 = x d 
)  ∀ x ∈ , x 2 = 4 → x = 2
b)  ∃ x ∈ , 2 x = x e)  ∀ x ∈ , ∃ y ∈ ; x + y = 0
c)  ∀ x ∈ , x = x f  )  ∃ y ∈  ∋ ∀ x ∈ , x + y = 0

g)  Sean A = {−2, − 1, 0, 3, 5} y B = {−1, 0, 1}, ∃ y ∈ A∋ ∀ x ∈ B, x + y ≤ −1

1.2 Conjuntos
Introducción
Se presentan algunos ejemplos que muestran un breve panorama del tema de conjuntos y una
parte donde se describe el sustento matemático (axiomas y teoremas) de la teoría. Para ello se
usan algunos resultados y métodos de la lógica matemática. En esta sección se
jugará con unos “juguetes” llamados conjuntos.
La matemática se estructura en
forma análoga a muchos juegos, en Aunque el concepto conjunto no se define (se considera primitivo), puede des-
los que se dispone de objetos cribirse intuitivamente como una colección de objetos que tienen alguna caracterís-
(juguetes) y reglas para jugar. tica común bien definida; es decir, un conjunto puede considerarse como la colección
de elementos que forman parte de (pertenecen a, están en, …) ese conjunto.
1.2 Conjuntos 21

Se acostumbra describir los conjuntos encerrando entre llaves sus elementos, separándolos
por comas, cuando se pueden listar. Por ejemplo, si A es el conjunto formado por los números 1,
2 y 3, se puede representar en la forma:

A = {1, 2, 3}

Como se puede observar, el elemento 1 está en el conjunto A, lo que se denota como 1 ∈A y 4


no está, es decir, 4 ∉A.
Si se considera el conjunto B, formado por los enteros comprendidos entre 0 y 4, al analizar
cuáles enteros cumplen esta condición, se observa que son los mismos del conjunto A. Cuando
esto suceda, se dirá que los conjuntos son iguales. Si éste es el caso, se usa la notación A = B.
Sea C = {0, 3, 4, 1, 2}. Se puede notar que todos los elementos de A también son elementos
de C. Cuando esto sucede se dice que A está contenido en C y se usa la notación A ⊂ C.

A ⊂ C resulta una proposición verdadera

Sea D = {0, 2, 5}. Entonces D no está contenido en C, pues el 5 no es elemento de C, aunque


0 y 2 sí lo sean. La definición de contención requiere que todos los elementos del primero lo sean
también del segundo.
La proposición D ⊂ C es falsa y, por lo tanto, su negación D ⊄ C resulta verdadera.
Al comparar los conjuntos A y C se observa que no tienen los mismos elementos, es decir,
A ≠ C.
Dado un conjunto, ¿se podrán construir otros? La respuesta es afirmativa. Por ejemplo, a
partir de A se puede formar E como el conjunto de aquellos elementos x de A que hagan cierta la
ecuación x − 3 = 0. El único elemento de A que la satisface es 3, y así E = {3}. Otra manera de
representarlo es

Cuando se utiliza una proposición o condición P(x) como la anterior para construir un con-
junto E a partir de otro A, se dice que un elemento pertenece al primero si y sólo si, estando en el
segundo, hace verdadera esta proposición. P(x) también suele llamarse regla de formación del
conjunto E. Lo anterior se puede expresar como E = {x ∈A; P(x)}; entonces:

es verdadera)
es falsa)

En resumen, los conjuntos se pueden expresar:

1. En forma enunciativa o por comprensión: E = {x ∈A; P(x)}.


2. En forma tabular o por extensión: E = { elemento1, elemento2, … }.

Si F = {x ∈A; x − 5 = 0} y A = {1, 2, 3}, ¿qué elementos tiene F? ¿Es un conjunto o no lo es?


En la teoría de conjuntos existe uno llamado conjunto vacío, que no tiene elementos. Dicho
conjunto se denota con el símbolo ∅.
Note que ∅ ≠ {∅}, ∅ ⊂ {∅}, ∅ ∈{∅}, ∅ ∉∅, ∅ ⊂ ∅ y {∅} ⊄ ∅.
Al comparar los conjuntos G = {1, 2, 3, 4} y H = {0, 2, 4, 5} se puede ver que 2 y 4 están en
ambos. Puede pensarse en la colección formada por los elementos comunes a éstos. Este nuevo
conjunto se denota como G ∩ H = {2, 4} y se llama la intersección de G y H.
Al eliminar del conjunto H aquellos elementos que son comunes con G se obtiene el conjunto
{0, 5}, el cual se conoce como la diferencia de H menos G, y se denota H − G. Este conjunto tam-
bién se conoce como el complemento de G con respecto a H.
Para mayor claridad, H − G es el conjunto de todos los elementos de H que no están en G.
Al unir los elementos de G con los de H se obtiene el conjunto {0, 1, 2, 3, 4, 5}, que se conoce
como la unión de G y H, y se denota por G ∪ H.
22 Unidad 1  Lógica y conjuntos

Al formar el conjunto K como la colección de los conjuntos A, B, C, …, se obtiene


K = {A, B, C, . . .}.
¡Un conjunto de conjuntos!
Con los elementos de E = {a, b, c} se puede formar un nuevo conjunto, cuyos elementos sean
los subconjuntos de E:
{∅, {a}, {b}, {c}, {a, b}, {a, c}, {b, c}, {a, b, c}}
el cual se conoce como conjunto potencia de E, 2E o 𝒫(E).
Si M = {a, e} y N = {b, d}, ¿qué “palabras” de dos letras se pueden formar si la primera de
izquierda a derecha es del conjunto A y la segunda del conjunto N?
Respuesta: ab, ad, eb, ed.
Considere ahora el conjunto de parejas formadas por los elementos de los conjuntos M y N con
la condición anterior, es decir, que el primer elemento sea de M y el segundo de N. Así se obtiene {(a,
b), (a, d), (e, b), (e, d)}, que se conoce como el producto cartesiano de M y N y se denota como M × N.
Sean I = {♣, ♦, ♥, ♠} y F = {A, D, E, C}. Puede pensarse en una correspondencia (función f
de I en F) tal que Xi = f (i), y si además f (♣) = A, f (♦) = D, f (♥) = E y f (♠) = C, el conjunto F
también puede representarse como {Xi}i∈I. Como puede observarse, cada elemento de F quedó
etiquetado con un elemento de I.
¿Habrá un conjunto que tenga como elementos a todos los conjuntos, incluso a él mismo?
¿Cómo entran en la matemática las consideraciones anteriores? ¿Embonan o son un parche mal
puesto? ¡Es necesario construirles un sustento! Se requiere formalizar.

1.3 Conceptos primitivos, definiciones,


axiomas y teoremas
Son conceptos primitivos conjunto y elemento. La única relación primitiva es estar en.
Se postula que existen conjuntos (si no, ¿de qué se estaría tratando? Sería un juego vacío).

Axioma 1.3.1
Axioma de existencia
Existe, al menos, un conjunto.

Axioma 1.3.2
Axioma de extensión
Dos conjuntos son iguales si y sólo si tienen los mismos elementos.

O bien: A = B ⇔ ∀x, ( x ∈A → x ∈B ) ∧ ( x ∈B → x ∈A )

Observación
Si A y B fueran conjuntos sin elementos, satisfarían la doble condición que da la igualdad (por
vacuidad); luego, serían iguales, es decir, tal conjunto sería único. Su existencia se demostrará
después del axioma de especificación (1.3.3).

Contención de conjuntos
Definición 1.3.1
Sean A y B conjuntos. A está contenido en B si y sólo si todo elemento de A es también un
elemento de B. Asimismo, se dice que B contiene a A o que A es un subconjunto de B.
A ⊂ B ⇔ ∀x, x ∈A → x ∈B
1.3  Conceptos primitivos, definiciones, axiomas y teoremas 23

Si A fuera un conjunto sin elementos, estaría contenido en cualquier conjunto (ya que satis-
faría la condición anterior por vacuidad).

Definición 1.3.2
Si A y B son dos conjuntos tales que A ⊂ B y A ≠ B, que se abrevia A ⊈ B, se dice que A es un
subconjunto propio de B.

Note que la pertenencia se refiere a una relación elemento-conjunto. x ∈A se lee x es elemento


de A, es decir, x pertenece al conjunto A. La contención se refiere a una relación conjunto-conjunto.
A ⊂ B se lee como A es un subconjunto de B, o A está contenido en B. B ⊃ A es equivalente a A ⊂ B.

Nuevos conjuntos
Considere una proposición abierta P(x) que tiene sentido cuando se seleccionan elementos x de
un conjunto A. La construcción del conjunto de elementos que hacen verdadera la proposición P
está garantizada por el axioma de especificación.

Axioma 1.3.3
Axioma de especificación
A todo conjunto A y a toda condición P(x) para A, corresponde un conjunto B cuyos ele-
mentos son precisamente aquellos elementos x de A que satisfacen la proposición P. (P(x) es
cierta.)

Para usar una notación de lectura apropiada se utiliza B = {x ∈A; P(x)} y se lee: “B es el con-
junto de los elementos x que están en A y cumplen la condición P”.

El conjunto vacío y el conjunto universal


Sea A un conjunto (que existe según el axioma 1.3.1) y P(x) la proposición x ≠ x, que no se puede
satisfacer. Entonces {x ∈A; P(x)} que, según el axioma 1.3.3, es conjunto y no tiene elementos.
Este conjunto se conoce como el conjunto vacío y se denota por ∅. Como ya se vio, es único y está
contenido en cualquier otro conjunto, incluido él mismo.
Con respecto a la pregunta formulada en la introducción (¿habrá algún conjunto que tenga
como elementos a todos los conjuntos, incluido él mismo?), ¿existe el conjunto universal?
El teorema siguiente afirma que no es así.

 Teorema  1.3.1
Para cualquier conjunto A hay un conjunto B que no es elemento de A.

La demostración de este teorema puede hacerse por reducción al absurdo.

Demostración
Suponga que A es un conjunto cuyos elementos son conjuntos y sea B = {x ∈A; x ∉x}; entonces:
Si B estuviera en A, aplicando la condición que lo define resultaría:

B ∈B ⇒ B ∉B ∴ B ∉B,
B ∉B ⇒ B ∈B ∴ B ∈B,

es decir B ∈B y B ∉B
24 Unidad 1  Lógica y conjuntos

La contradicción se obtuvo de la hipótesis B ∈A, lo que prueba que B ∉A.


El teorema 1.3.1 muestra que todo conjunto de conjuntos es incompleto. Siempre hay conjun-
tos que no están en él. Luego, no existe el conjunto de todos los conjuntos. La colección de todos
los conjuntos no es un conjunto.
A pesar de que no existe el conjunto universal, se acostumbra definir conjuntos universales
para cada problema específico, que se refieren a todos los objetos que interesan en ese estudio
particular.
En seguida se plantean algunas preguntas:
¿Habrá suficientes conjuntos para garantizar que todo conjunto es un elemento de algún
conjunto?
¿Será cierto que para cualquier número de conjuntos existe otro al cual pertenecen todos?
¿Existe alguno que los contiene?
Se necesitan nuevos principios de construcción.

Axioma 1.3.4
Axioma de las parejas
Para dos conjuntos cualesquiera, existe un conjunto al cual pertenecen ambos.

El axioma 1.3.4 garantiza que para cualesquiera dos conjuntos A y B existe un conjunto C tal
que
C = {A, B, . . .}
Se puede aplicar a C el axioma de especificación (1.3.3), en el que P(x) es x ∈A ∨ x ∈B. El
resultado es el conjunto

y se llama la pareja no ordenada formada por A y B.


Note que si A = B, entonces D = {A}.

Nota: Se utilizan las familias de Familia de conjuntos


conjuntos (haciendo énfasis en que la
Sea I un conjunto (de índices) y C una colección de conjuntos. Se llama familia de
colección de índices es un conjunto)
para poder aplicar en ellas (las
conjuntos a toda función η : I → C. Si η (i) = Ai, se acostumbra denotar a la familia
familias) las operaciones conjuntistas, como {Ai}i∈I.
las cuales se definen más adelante
(uniones, intersecciones, diferencias, Uniones
complementos, etcétera).
Dada una familia de conjuntos, es posible formar otro que tiene como elementos a
los elementos de cada uno de los conjuntos de la familia (axioma 1.3.5).

Axioma 1.3.5
Axioma de las uniones
Para toda colección 𝒯 de conjuntos existe un conjunto C que contiene a todos los elementos
que pertenecen cuando menos a uno de los conjuntos de la colección 𝒯.

Lo que el axioma 1.3.5 asegura es la existencia de un conjunto que contiene a cada uno de los
conjuntos de la familia. Al aplicar el axioma de especificación (1.3.3) se obtiene un conjunto lla-
mado la unión de la familia, la cual está formada por los elementos de los conjuntos de la familia
y sólo ésos.
U = {x ∈C; x ∈A para algún A ∈ 𝒯}
Si 𝒯 = {A, B} entonces U = A ∪ B
A ∪ B = {x ∈C; x ∈A ∨ x ∈B}
1.5  Producto cartesiano 25

1.4  Álgebra de conjuntos


Intersecciones
De manera similar a la anterior, podemos pensar en los elementos que están en cada miembro de
la colección 𝒯 y formar lo que se conoce como intersección de la familia:

Si 𝒯 = {A, B} entonces J = A ∩ B
;

Diferencias
Si A y B son dos conjuntos, la diferencia entre A y B, también conocida como el complemento de
B con respecto a A, es el conjunto A − B definido como:

Complemento
Sea U un conjunto universal (particular) y A un subconjunto de U.
La diferencia U − A se llama complemento de A, y si se conoce el conjunto universal, el com-
plemento de A se denota por Ac o por A′.
Considere ahora los subconjuntos de un conjunto A. ¿Existe un conjunto cuyos elementos
sean estos subconjuntos? El axioma 1.4.1 garantiza que la respuesta es afirmativa.

El conjunto potencia
Axioma 1.4.1
Axioma de las partes
Para cada conjunto A existe un conjunto C que tiene entre sus elementos a todos los subcon-
juntos del conjunto dado (es decir, B ⊂ A → B ∈C ).

El axioma de especificación (1.3.3) permite formar el conjunto potencia de


A: 𝒫(A) = {B ∈C : B ⊂ A},
que también se denota como 2A, lo cual expresa el hecho de que todo conjunto A con n elementos
tiene 2n subconjuntos (al número de diferentes elementos de un conjunto se le llama cardinalidad,
y se acostumbra denotarlo como #A, n(A) o |A|; por ejemplo, si A = {a, a, a, b, b} su cardinalidad
es |A| = 2, ya que A = {a, b}).

1.5  Producto cartesiano


Pareja ordenada
El orden en que aparecen los elementos de un conjunto es irrelevante. Si se quiere construir un
conjunto con dos elementos de tal manera que se pueda distinguir cuál es el primero, necesita
definirse una pareja ordenada:

Definición 1.5.1

(a, b) = {{a} , {a, b}}


26 Unidad 1  Lógica y conjuntos

Los elementos a y b se llaman primera y segunda coordenadas (o componentes), respectivamente.


Con esto se consigue la propiedad esencial: (a, b) = (c, d ) ⇔ a = c ∧ b = d, cuya demostración es la
siguiente:

⇒  Suponga que: (a, b) = (c, d)

esto es: {{a}, {a, b}} = {{c}, {c, d}}

Dado que estos conjuntos son iguales, sus elementos deben ser iguales, con lo cual aparecen dos
posibilidades:

{a} = {c} ∧ {a, b} = {c, d} (1.5.1) {a} = {c, d} ∧ {a, b} = {c} (1.5.2)
de donde, a=c∧a=d
en donde, a = c  y  b = d
y: a = c ∧ b = c
entonces: a=b=c=d

En ambos casos resulta

a=c∧b=d

⇐ La demostración es inmediata.

Relaciones y funciones
Si A y B son conjuntos, ¿existe un conjunto que contiene a todas las parejas ordenadas (a, b) con a
en A y b en B? La respuesta es afirmativa y es el conjunto conocido como el producto cartesiano de
A y B, el cual se define como:

A × B = {(a, b): a ∈A ∧ b ∈B}

Las parejas ordenadas (a, b) son elementos de 𝒫(𝒫(A ∪ B)). Cualquier subconjunto de A × B
se conoce como una relación del conjunto A en el conjunto B.
La más importante de las relaciones en la matemática es la de función, que se definirá más
adelante.
Cuando A = B, una relación de A en B se llama una relación en A y entre ellas se destacan las
de orden y las de equivalencia.
Sea ℜ una relación de A en B. Si la pareja (a, b) está en ℜ, también se puede denotar como
aℜ b, y si no está, aℜ b. Si aℜ b se dice que a está en ℜ relacionado con b.
El par ordenado (x, y) puede interpretarse como las coordenadas de un punto en el plano;
inclusive, puede usarse esta idea para establecer una representación de tal par. En particular, ya
que  es el conjunto de los números reales, se tiene:

 ×  = {(x, y); x ∈ ∧ y ∈}

 × , que también se denota como 2, resulta el conjunto de todas las parejas de números reales y
su representación gráfica es el plano cartesiano (ver figura 1.1).
Como se puede observar, existe una correspondencia biunívoca entre el producto cartesiano
 ×  y el conjunto de puntos del plano, asociándose de esta forma el par ordenado (x, y) con el
punto P(x, y).
1.5  Producto cartesiano 27

Ejemplo 1.5.1
Sean los conjuntos
y P (x, y)
A = {1, 3}   y   B = {2, 4, 6}
El producto cartesiano A × B es:
A × B = {(1, 2), (1, 4), (1, 6), (3, 2), (3, 4), (3, 6)}
y se ilustra en la figura 1.2.

Ejemplo 1.5.2
Sean los conjuntos x

A = {x ∈  : 2 < x ≤ 4}  y  B = {y ∈ : −1 ≤ y < 1}


Figura 1.1  Representación del punto
Una representación gráfica de A × B se muestra en la figura 1.3. P(x, y) en el plano cartesiano.
A × B es el conjunto de puntos interiores al rectángulo PQRS más los
puntos que pertenecen a los segmentos QR y RS.

Ejemplo 1.5.3
Sean los conjuntos 6

A = {x ∈N : 1 ≤ x < 4}  y  B = {y ∈ : 1 ≤ y ≤ 5} 5
4
La representación de A × B en el plano cartesiano se presenta en la 3
figura 1.4.
2
1
La definición de producto cartesiano puede generalizarse al producto
entre n conjuntos mediante la función f de los índices en la unión de estos 1 2 3
conjuntos. Así, si f :{1, 2}→ A1 ∪ A2 es tal que f (1) ∈A1 y f (2) ∈A2, la pare-
ja (f (1), f (2)) es uno de los elementos del producto A1 × A2, de manera que Figura 1.2  Representación de la relación
este producto es el conjunto de todas esas funciones. Generalizando, el pro- A × B.
ducto cartesiano entre los conjuntos
A1, A2, A3, . . .
es ×

que es el conjunto formado por todas las n-adas ordenadas (conjunto de las imágenes de cada f,
ordenadas con el orden inducido por el correspondiente orden de los índices):
f = (a1, a2, a3, . . . an);
tales que ai ∈Ai, i = 1, 2, 3, . . ., n. Cada ai es f (i).
Este producto cartesiano también se denota como
A1 × A2 × . . . × An o An
1 P S
Algunas propiedades del producto cartesiano
1 2 3 4
i) A ⊂ X ∧ B ⊂ Y ⇔ A × B ⊂ X ×Y −1
ii) A× B = ∅ ⇔ A = ∅ ∨ B = ∅ Q R
iii) A ≠ B ∧ A× B ≠ ∅ ⇒ A× B ≠ B × A
iv) A × (B ∩ C ) = ( A × B ) ∩ ( A ×C )
v) A × (B ∪ C ) = ( A × B ) ∪ ( A ×C )
Figura 1.3  Representación de la relación
A × B.
28 Unidad 1  Lógica y conjuntos

Se demuestran algunas y las demás se dejan como ejercicio al lector.


ii)  ⇒
A × B = ∅ ⊢– A = ∅ ∨ B = ∅
Es decir, se supone A × B = ∅. Por demostrar A = ∅ ∨ B = ∅.
5
Por reducción al absurdo, se supone lo contrario de lo que se quiere
4 demostrar, es decir:
3 A ≠ ∅ ∧ B ≠ ∅
2
Entonces existen elementos a y b tales que
1
a ∈A ∧ b ∈B
1 2 3 Luego la pareja (a, b) ∈A × B
en contradicción con la hipótesis de que
Figura 1.4  Representación de la relación
A × B. A×B=∅

A = ∅ ∨ B = ∅ ⊢– A × B = ∅
En contraposición, A×B≠∅

Por lo tanto, ∃ (a, b)

tal que, (a, b) ∈A × B

es decir: a ∈A y b ∈B

Entonces A≠∅∧B≠∅

iv)  A × (B ∩ C) = (A × B) ∩ (A × C)
(x, y) ∈ A × (B ∩ C ) ⇔ x ∈ A ∧ y ∈B ∩ C )

x ∈ A ∧ y ∈ B ∩ C ⇔ x ∈ A ∧ (y ∈B ∧ y ∈C )

x ∈ A ∧ (y ∈ B ∧ y ∈C) ⇔ (x ∈ A ∧ y ∈B) ∧ (x ∈A ∧ y ∈C )

(x ∈ A ∧ y ∈ B) ∧ (x ∈ A ∧ y ∈C) ⇔ (x, y) ∈ A × B ∧ (x, y) ∈A × C

(x, y) ∈ A × B ∧ (x, y) ∈ A × C ⇔ (x, y) ∈ (A × B) ∩ (A × C)


Note que todos los conectivos anteriores si y sólo si, y por lo tanto,
A × (B ∩ C) = (A × B) ∩ (A × C)

1.6  Suma y producto booleanos


La diferencia simétrica de A y B es (A − B) ∪ (B − A), que es igual a (A ∪ B) − (A ∩ B) y se deno-
ta como A + B, que es la suma booleana de A y B.
El producto booleano de A y B es la intersección de estos conjuntos: AB = (A ∩ B).

Una representación gráfica


Si se representa una familia de conjuntos no vacíos en un plano (diagrama Venn-Euler) de manera
que ilustre todas las regiones en las cuales pueda estar un elemento x, entonces cada región puede
hacerse corresponder con los números, en notación binaria, que se obtienen de la tabla de “perte-
nencia” cuando ésta se construye en la forma ordenada que se usó para las tablas de verdad de las
proposiciones. Por ejemplo, si A, B y C son conjuntos y las letras a, b, c representan las proposicio-
nes x ∈A, x ∈B y x ∈C, respectivamente, se tiene la situación que se ilustra en la figura 1.5.
1.6  Suma y producto booleanos 29

A B a b c Región
0 0 0 0
0 0 1 1

6 0 1 0 2
4 2
0 1 1 3
7
5 3 1 0 0 4
1 0 1 5
1
0 1 1 0 6
C 1 1 1 7

Figura 1.5  Diagrama de Venn-Euler y tabla asociada para tres conjuntos.

Cuando se usa este método, la suma y el producto booleanos quedan representados por las
siguientes figuras (figuras 1.6 y 1.7).

A B A + B = (A ∪ B) − (A ∩ B)

a b (a ∨ b) ∧ ¬ (a ∧ b)
0 0 0
0 1 1
1 0 1
1 1 0
A+B “en uno o en otro, pero no en ambos”

Figura 1.6  Diagrama de Venn-Euler y tabla asociada para la suma booleana.

AB = (A ∩ B)
A B
a b (a ∧ b)
0 0 0
0 1 0
1 0 0
1 1 1

AB “en ambos”

Figura 1.7  Diagrama de Venn-Euler y tabla asociada para el producto booleano.

 Teorema 1.6.1
La suma booleana:
1. Es asociativa A + (B + C) = (A + B) + C
2. Tiene elemento idéntico igual al conjunto vacío, A + ∅ = A
3. Cada elemento tiene inverso que es él mismo, A + A = ∅
4. Es conmutativa (A + B) = B + A

El producto booleano:
5. Es asociativo A(BC) = (AB)C
6. Es conmutativo AB = BA
7. Tiene elemento idéntico que es el conjunto universal, AU = A
8. Se distribuye sobre la suma A(B + C) = AB + AC 
30 Unidad 1  Lógica y conjuntos

Las observaciones anteriores muestran que los subconjuntos de un conjunto universal U, con la
suma y el producto booleano, forman un anillo conmutativo con uno (como se verá más adelante).
Como ilustración del resultado anterior se probarán las proposiciones 1 y 8. Para esto
es conveniente recordar la forma en que se demostraron algunas proposiciones de lógica, es decir,
construyendo las tablas de verdad correspondientes. La igualdad de las tablas mostrará la igual-
dad de los conjuntos que las proposiciones caracterizan.
Sean A, B y C subconjuntos de U. Las letras a, b y c representan las proposiciones:

Entonces,
Tabla 1.3  Comprobación de la propiedad asociativa de la suma booleana

a b c A+B (A + B) + C B+C A + (B + C)
0 0 0 0 0 0 0
0 0 1 0 1 1 1
0 1 0 1 1 1 1
0 1 1 1 0 0 0
1 0 0 1 1 0 1
1 0 1 1 0 1 0
1 1 0 0 0 1 0
1 1 1 0 1 0 1

La igualdad de las columnas 5 y 7 prueba la afirmación del teorema correspondiente.

Tabla 1.4  Comprobación de la propiedad distributiva del


producto sobre la suma booleana
a b c B+C A (B + C) AB AC AB + AC
0 0 0 0 0 0 0 0
0 0 1 1 0 0 0 0
0 1 0 1 0 0 0 0
0 1 1 0 0 0 0 0
1 0 0 0 0 0 0 0
1 0 1 1 1 0 1 1
1 1 0 1 1 1 0 1
1 1 1 0 0 1 1 0

Note que las columnas 5 y 8 son iguales.

Ejemplo 1.6.1

Sean A = {1, 2, 3} y B = {a, 1, b}; entonces:

A − B = {2, 3} B − A = {a, b}

A ∪ B = {1, 2, 3, a, b}     A ∩ B = {1}

De manera que A + B = {2, 3, a, b} = (A ∪ B) − (A ∩ B) = (A − B) ∪ (B − A)


y AB = {1} = (A ∩ B).
1.7  Algunas demostraciones en la teoría de conjuntos 31

Ejemplo 1.6.2

Sean A = {m, n} y B = {1, m}; entonces:


A − B = {n} B − A = {1}
A ∪ B = {1, m, n} A ∩ B = {m}

De manera que A + B = {1, n} y AB = {m}.

1.7  Algunas demostraciones en la teoría de conjuntos


Para demostrar proposiciones en la teoría de conjuntos usando la técnica de las tablas de verdad
se requiere definir una relación entre las proposiciones de esta teoría y las correspondientes de la
lógica matemática.
De esta manera, sean A, B y C subconjuntos de U. Con las letras a, b, c y t y con el símbolo ∅
se definen las siguientes proposiciones:
a:x∈A
b:x ∈ B
c:x ∈C
t : x ∈U
∅:x ∈∅
Así, las operaciones con conjuntos quedarían definidas de la forma siguiente:

Tabla 1.5  Relación entre las


operaciones de la lógica
y las de los conjuntos
Ac ¬a
A=B a↔b
A⊂B a→b
A∩B a∧b
A∪B a∨b
A−B a ∧ ¬b

Ejemplo 1.7.1

( A ∩ B = A) ⇒ A ⊂ B

a b a∧b ↔ a ⇒ a→b
0 0 0 1 0 1 1
0 1 0 1 0 1 1
1 0 0 0 1 1 0
1 1 1 1 1 1 1

Ejemplo 1.7.2
( A ⊂ B ) ⇔ ( B c ⊂ Ac ) ⇔ ( A ∪ B = B )

a b ¬a ¬b a→b ⇔ ¬b→¬a ⇔ (a ∨ b) ↔ b
0 0 1 1 1 1 1 1 1
0 1 1 0 1 1 1 1 1
1 0 0 1 0 1 0 1 0
1 1 0 0 1 1 1 1 1
32 Unidad 1  Lógica y conjuntos

Ejercicios 1.7

1.  ¿El conjunto (a, a) es igual al conjunto {{a}}? Explique.


2.  Encuentre en cada caso los valores de x y y que hacen verdaderas las siguientes igualdades:

 x + y, 1  = 1, x − y
  ( )
 2

( x + 2, y ) = ( 3 y, 2 x )
3.  Demuestre las propiedades i), iii) y v) del producto cartesiano.
4.  Demuestre que (A × B) ∩ (C × D) = (A × D) ∩ (C × B).
5. ¿Cómo deben ser los conjuntos A y B para que en el conjunto A × B existan parejas cuyos dos
componentes sean iguales?
6.  Demuestre que:
a)  ( A ∪ B )c = Ac ∩ B c c)  ( A − B ) − C = A − ( B ∪ C )
b)  ( A ∩ B )c = Ac ∪ B c d )  A ⊂ B ⇒ ([ A ∩ ( B ∩ C )] = [ ( A ∩ B ) ∩ C ])

1.8  El concepto de función


Una función f del conjunto A en el conjunto B, que se denota f  : A → B, es una relación de A en B
que satisface las condiciones siguientes:

1. ∀a ∈A , ∃b ∈ B∋ ( a, b ) ∈ f
2. (( a, b ) ∈ f ∧ (( a, c ) ∈ f )) → ( b = c )

Sea f una función de A en B. Los conjuntos A y B se llaman dominio y contradominio de f, respec-


tivamente. Al conjunto de todas las segundas componentes de f se le llama rango de la función o
imagen de A bajo f. El conjunto de todas las parejas —la función misma— es la gráfica de la fun-
ción.
Cuando el contradominio de f es el conjunto , se dice que la función es real, y si el dominio
es un subconjunto de , es de variable real; por lo tanto, una función real de variable real es un
conjunto de parejas de números reales que puede representarse en el plano cartesiano. A esta
representación se le denomina dibujo de la gráfica f.
Una manera de clasificar a las funciones es separarlas como:
Inyectivas o “uno a uno”.
Suprayectivas o “sobre”.
Biyectivas o “uno a uno y sobre”, que se definen de la manera siguiente:
Sea f una función de A en B.
f es inyectiva si y sólo si f (a) = f (b) → a = b, o por contrapuesta a ≠ b → f (a) ≠ f (b), por lo cual
se dice que las funciones inyectivas son las que mandan puntos distintos en puntos distintos.
f es suprayectiva si y sólo si ∀b ∈B, ∃a ∈A∋ (a, b) ∈ f; es decir, si el rango de f es todo B.
f es biyectiva si y sólo si es inyectiva y suprayectiva. Las funciones biyectivas se caracterizan
por ser las únicas que tienen función inversa.
Si g  : A → B y f  : B → C y si R(g) ⊆ D(f ) = B, entonces la función compuesta f ° g es la función
de A a C definida por [f ° g](x) = f (g(x)) para toda x ∈A.
Si f : A → B es una biyección de A sobre B, entonces g = {(b, a) ∈ B × A; (a, b) ∈ f } es una
función de B en A. Esta función se denomina función inversa de f y se denota por f −1; con objeto
de no confundirla con la expresión 1/f, se suele usar f * para representarla.
Cuando la función inversa existe, las composiciones f ° g y g ° f son posibles y cada una de
ellas resulta ser la identidad en su dominio. f ° g es la identidad en B y g ° f en A.
La relación entre f y su inversa f −1 se caracteriza por b = f (a) si y sólo si a = f −1(b).
1.8  El concepto de función 33

Álgebra de funciones
Las funciones que se considerarán en esta sección son funciones reales de variable real.
Sean f : Df → , g  : Dg →  funciones reales y c una constante. Se define:
1. Multiplicación por un escalar
[c · f ] ( x ) = c · f ( x ) Dc ⋅ f = D f
2. Suma
[ f + g ] ( x ) = f ( x ) + g ( x ) D f + g = D f ∩ Dg
3. Resta
[ f − g ] ( x ) = f ( x ) − g ( x ) D f − g = D f ∩ Dg
4. Multiplicación
[f · g ] ( x ) = f ( x ) · g ( x ) D f · g = D f ∩ Dg
5. División
[ f / g ] ( x ) = f ( x ) / g ( x ) D f / g = D f ∩ Dg cuando g ( x ) ≠ 0, ∀x ∈Dg
6. Composición
[ f  g ] ( x ) = f ( g ( x )) cuando R ( g ) ⊆ D f D f  g = Dg

Ejercicios 1.8

1. De una encuesta a 60 personas, 30 de ellas respondieron que habían utilizado camión para
transportarse ese día, 15 dijeron que habían utilizado el tren subterráneo y 20 manifestaron que
no utilizaron tren ni camión. ¿Cuántos utilizaron camión y tren ese día? ¿Cuántos utilizaron
camión o tren?
2. Al verificar la inscripción de 537 alumnos en una escuela se encontró que 224 de ellos estaban
inscritos en cálculo, 97 en álgebra y 250 en física; 200 no cursaban ninguna de esas tres asigna-
turas y sólo 20 llevaban las tres. 30 llevaban álgebra y física, pero no cálculo. Estudian física
sólo 51. ¿Cuántos alumnos llevan cálculo y física? ¿Cuántos llevan cálculo y física, pero no
álgebra?
3. Sea A = {a, b, c, d}. Defina una partición para A y encuentre la relación de equivalencia que
induce.
4. Se define en  la congruencia módulo 5 de la manera siguiente:
n ≡ m (5) si y sólo si m − n es un múltiplo de 5 (5 divide a m − n)
Demuestre que la relación es de equivalencia y encuentre la partición que induce.
5. Sea A = {{a}, {b}, {c}, {a, b}, {b, c}, {d, e, f}} ordenado por contención. Encuentre:
i) El mayor iii) Máximos y mínimos
ii) El menor iv) Una cadena
¿O algunos no existen? (Ver anexo 4).
6. Sean f = {(1, 0), (2, 1), (3, 2), (4, 3)} y g = {(0, 0), (1, 1), (2, 4), (3, 9)}. Exprese los conjuntos que
representan las siguientes operaciones:
f + g, f − g, f ⋅ g, f / g, f  g y g  f
7. Si f (x) = x + 1 y g ( x ) = x , determine las expresiones para las funciones f ° g y g ° f.
2

8. Si f (x) = x2 − 1, obtenga h(x) = f 2 (x) + 3f (x).

9. Sean f y g funciones inyectivas, . Demuestre que g ° f es inyectiva.


 35

Sistema
matrices
2.1 Sistemas de ecuaciones lineales
Unidad
•  Introducción
2.2 Matrices
•  Igualdad de matrices
•  Algunos tipos de matrices
•  Operaciones con matrices
•  Operaciones elementales en los renglones
•  Sistemas de ecuaciones lineales
•  Cómo seleccionar los parámetros

s de ecu
•  Aplicaciones de los sistemas de ecuaciones
•  Representación generalizada

y determ
•  Balanceo de ecuaciones químicas. Método algebraico
•  Ejemplos de balanceo de reacciones químicas
2.3  Análisis dimensional
•  Dimensión
•  Método de Rayleigh
•  Método de Buckingham
2.4 Determinantes
•  Cálculo de determinantes

aciones
inantes
lineales
,
36 Unidad 2  Sistemas de ecuaciones lineales, matrices y determinantes

2.1  Sistemas de ecuaciones lineales


Introducción
El modelado de un buen número de problemas que dependen de más de una variable no puede
conseguirse con una sola ecuación. En estos casos deben considerarse diferentes condiciones que
el problema debe satisfacer de manera simultánea, lo que da origen a una colección de ecuaciones
que constituyen los llamados sistemas de ecuaciones.
A continuación se propone una serie de problemas cuya solución se obtiene al resolver un
sistema de ecuaciones que, por contener solamente términos constantes o algebraicos de grado
uno, se conocen como ecuaciones lineales. Se discute sólo la solución de los dos primeros.

Problema 2.1.1 Dos veces la edad de Juan más cuatro veces la edad de Lucía suman 40 años. ¿Cuáles son las eda-
des de cada uno?

Problema 2.1.2 Dos veces la edad de Juan más cuatro veces la edad de Lucía suman 40 años, y cuatro veces la edad
de Juan menos la edad de Lucía es igual a 35 años. ¿Cuántos años tiene cada uno?

Problema 2.1.3 Si en el problema anterior se añade la condición de que la edad de Juan más la edad de Lucía es
20, ¿cuáles son las edades de cada uno?

Problema 2.1.4 Hay dos cajas: una blanca y otra verde; en cada caja hay bolsitas que tienen letras de madera. En
la caja blanca cada bolsita tiene exclusivamente una letra a y dos letras b. Cada bolsita de la caja
verde tiene una letra c y dos letras b nada más. Se desea formar dos tipos de bolsas; las primeras
deben tener una letra a y cuatro letras b; las segundas, dos letras c y dos b. ¿Cuál es el mínimo
número de bolsitas de la caja blanca y la verde para formar, al menos, una de cada una de las
bolsas con las características deseadas? Y con ese mínimo, ¿cuántas se obtienen de cada tipo?

Problema 2.1.5 Sean A = LT−1, B = ML−1 T−1, C = ML−3, D = L2 T−1, E = LT−2, F = L monomios. ¿A qué poten-
cias a, b, c, d, e, f se deberán elevar A, B, C, D, E, F, respectivamente, para que el producto de ellos
sea L0 M0 T0? ¿Esa solución es única?

Problema 2.1.6 F es una mezcla formada por las sustancias A, B y C. La fracción, en peso, de cada una de ellas es
0.1, 0.5 y 0.4, respectivamente. Una descomposición de F genera dos porciones, una V y otra L.
Las fracciones de A, B y C en V son 0.5, 0.2, 0.3, y las correspondientes en L son 0.6, 0.3, 0.1. Si 
F = 100, ¿cuánto se obtendrá de V y L?

Planteamiento y solución del problema 2.1.1


Sea J la edad, en años, de Juan, y L la de Lucía. Simbólicamente, el problema queda planteado
así:
2J + 4L = 40
Se dice que una expresión de este estilo es una ecuación lineal con coeficientes reales en las
incógnitas J y L. Una solución para ella es una pareja de números (s1, s2) tal que, al sustituirlos en
la ecuación, la satisfacen. Es decir, 2s1 + 4s2 = 40.
Por ejemplo, J = 10, L = 5 es una solución particular, ya que 2 (10) + 4 (5) = 40.
Diofanto de Alejandría (200-284 d.C.) Se dice entonces que la pareja (10, 5) satisface la ecuación.
Matemático griego considerado por
Por otro lado, si L = α y se despeja J en términos de L, se tiene que J = (40 −
algunos como el padre del álgebra.
Ejerció una influencia muy notable 4 α)/2. Así, resulta lo que se llama la solución general de la ecuación.
tanto sobre el desarrollo del álgebra Observe que si α es un número entero, las soluciones son parejas de números
como en la teoría de números. enteros (las ecuaciones con coeficientes enteros, de las que se pide que las solucio-
nes sean enteras, se conocen como ecuaciones de Diofanto o diofantinas).
2.1  Sistemas de ecuaciones lineales 37

La solución general se puede expresar de la siguiente manera:


[J, L] = [20 − 2α, α] con α ∈ 
o bien [J, L] = [20, 0] + α[−2, 1] con α ∈ 
Note que las representaciones anteriores son un arreglo rectangular de elementos. Este tipo de
arreglos se conocen como matrices, y su igualdad, así como sus operaciones —suma, multiplica-
ción por un escalar (elemento de un campo K) y multiplicación— se definen, en este caso particu-
lar, como sigue:
1. [a, b] = [c, d] ⇔ a = c ∧ b = d
2. [a, b] + [c, d] = [a + c, b + d]
3. α[a, b] = [αa, αb]
c 
4. [a, b]   = [ac + bd] = ac + bd 1
d 
Las definiciones generales se darán más adelante.
De acuerdo con el inciso 4, la ecuación 2J + 4L = 40 también se podrá representar en la forma
siguiente:
J 
[ 2 4 ]   = [ 40 ]
L
Una manera cómoda de ilustrar esta multiplicación (de matrices) es:
J 
L
 
[2 4] [2J +4L ]

Observe que la matriz resultante tiene el número de renglones de la matriz izquierda y tantas
columnas como las de la matriz derecha. Esto no es casual. En efecto, para poder multiplicar
matrices es necesario que el número de columnas de la matriz de la izquierda sea igual al número
de renglones de la matriz de la derecha. Cuando se multiplica una matriz m × n (m renglones y n
columnas) por otra n × k, el resultado es una matriz m × k.
A continuación se ilustra la multiplicación de una matriz 2 × 2 por una 2 × 3 (el resultado es
una matriz 2 × 3).
3 −1 2
0 4 1
 
1 2 3 7 4
0 1 0 4 1
   
En general,
x z  y
p r  q

a b  ax + bp ay + bq az + br
c d  cx + dp cy + dq cz + dr 
   

La matriz A se puede representar en la forma A = (aij ), en donde aij representa al elemento


que está en el i-ésimo renglón y la j-ésima columna. Por ejemplo, los elementos a21, a23 y el a11
de la matriz
3 7 4
 
0 4 1 

son 0, 1 y 3, respectivamente.

1 Cuando una matriz consta de un solo elemento, se identifica con ese elemento; por ejemplo, [5] = 5.
38 Unidad 2  Sistemas de ecuaciones lineales, matrices y determinantes

Como se verá más adelante, cuando se haya definido el producto punto de vectores, el pro-
ducto de matrices se puede definir de la siguiente manera:
Sean A = (aij ) una matriz m × n con renglones Ai i = 1,, m, y B = (bij ) una matriz n × p con
columnas B j j = 1,, p. Entonces, AB = (cij ) es la matriz m × p tal que cij = Ai · B j.

Planteamiento y solución del problema 2.1.2


Nuevamente, sea J los años que tiene Juan y L los que tiene Lucía. El problema se establece de la
siguiente manera:
2J + 4L = 40 (2.1.1)
4J − 1L = 35 (2.1.2)
expresión que se conoce como un sistema de dos ecuaciones con coeficientes reales en las incógni-
tas J y L.
Un procedimiento de solución es éste: si se resta a la ecuación 2.1.2 el doble de la ecuación
2.1.1, el sistema se transforma en
2J + 4L = 40 (2.1.1)
−9L = − 45 (2.1.2′)
De la nueva ecuación (2.1.2′) se puede ver que L = 5. Si este valor se sustituye en la ecuación
2.1.1, resulta
2J + 4(5) = 40
de donde se obtiene J = 10.
La solución al problema es (J, L) = (10, 5), que en este caso es única.
El arreglo de los coeficientes de las incógnitas se llama matriz del sistema o matriz de coeficien-
tes, que para el problema 2.1.2 es
2 4 
 
4 −1
40
Y si se le añaden, como columna, los términos independientes  , se obtiene la matriz
aumentada 35

2 4 40
 
4 −1 35

La multiplicación de matrices ilustrada previamente permite expresar el sistema anterior en la


forma matricial

2 4   J  40
   =  
4 −1 L  35

En efecto, ya que

J 
L
 
2 4   2J +4L 
4 −1 4J − 1L
   

esta expresión matricial representa el sistema


2J + 4L = 40
4J − L = 35
2.1  Sistemas de ecuaciones lineales 39

que es de la forma
a11x1 + a12 x2 = b1
      (*)
a21x1 + a22 x2 = b2
a11 a12  a11 a12 b1 
donde la matriz del sistema es   y la matriz aumentada es  .
a21 a22  a21 a22 b2 

El sistema (*) se puede representar en forma matricial de la siguiente manera:


a11 a12   x1   b1 
   =  
a21 a22  x2  b2 

ya que
 x1 
 
x2 
a11 a12   a11x1+a12 x2   b1 
    = 
a21 a22  a21x1+a22 x2  b2 

El sistema (*) se resuelve de manera análoga al problema 2.1.2.


El término a21x1 se elimina de la ecuación 2.1.2 multiplicando la ecuación 2.1.1 por −a21 y la
ecuación 2.1.2 por a11 , y luego sumando el resultado de la ecuación 2.1.1 al de la ecuación 2.1.2. Es
decir,

− a21a11x1 + − a21a12 x2 = − a21b1


a11a21x1 + a11a22 x2 = a11b2

y sumando a11a22 x2 − a21a12 x2 = a11b2 − a21b1

se factoriza ( )
x2 : a11a22 − a21a12 x2 = a11b2 − a21b1

Si a11a22 − a21a12 ≠ 0, entonces x2 = (a11b2 − a21b1 ) (a11a22 − a21a12 )

Análogamente, eliminando x2 del sistema se obtiene x1 = (a22 b1 − a12 b2 ) (a11a22 − a21a12 ).


Como puede notarse, el denominador de x1 y de x2 está formado por los elementos de la
matriz del sistema. Es el número a11a22 − a21a12 y se denota por Δ, Δ(A), •A•, D(A) o det (A). Este
número se llama determinante, ya que determina la naturaleza del conjunto de soluciones. Para
diferenciar la matriz (un arreglo) del determinante de la matriz (un escalar) se usan barras en
lugar de corchetes o paréntesis. Así,
a11 a12  a11 a12
si A =   , entonces Δ(A) = = a11 a22 − a21 a12
a21 a22  a21 a22
Note lo siguiente:
1 0
=1
0 1

αa11 a12
= α a11a22 − α a21a12 = α (a11a22 − a21a12 ) = α ∆
αa21 a22

a11 αa12
= a11α a22 − a21α a12 = α (a11a22 − a21a12 ) = α ∆
a21 αa22

′ a12
a11 + a11
= (a11 + a11
′ ) a22 − (a21 + a2′ 1 ) a12 = (a11a22 − a21a12 ) + (a11 ′ a12 ) = ∆ + ∆′
′ a22 − a21
′ a22
a21 + a21
40 Unidad 2  Sistemas de ecuaciones lineales, matrices y determinantes


a11 a12 + a12
= a11 (a22 + a22
′ ) − a21 (a12 + a12
′ ) = (a11a22 − a21a12 ) + (a11a22 ′ ) = ∆ + ∆′
′ − a21a12

a21 a22 + a22

Trate de contestar las siguientes preguntas:


1. ¿Todo sistema de ecuaciones lineales tiene solución?
2. Si un sistema tiene solución, ¿la solución es única o tiene muchas soluciones?
3. ¿Dos matrices cualesquiera se pueden sumar?
4. ¿Dos matrices cualesquiera se pueden multiplicar?
5. Dada la matriz A, ¿habrá alguna matriz B tal que A × B = I?
6. Dada la matriz A, ¿habrá alguna matriz B tal que B × A = I?
7. Sea B la matriz que resulta de intercambiar renglones por columnas de una matriz A. ¿Cuán-
do B es igual con A? ¿Cuándo A = −B?
8. ¿Toda matriz tiene determinante?
Una ecuación lineal puede tener:
  i) una solución
  ii) un número infinito de soluciones
iii) ninguna solución
En los primeros dos casos se dice que la ecuación es consistente y en el último que es inconsis-
tente.
La expresión (a2 − 1)x = a + 1 permite ilustrar los tres casos anteriores dando valores ade-
cuados a la a. Así,
1. Si a = 1, la ecuación no tiene solución.
2. Si a = −1, la ecuación tiene un número infinito de soluciones.
3. Si a no es 1 ni −1, la ecuación tiene solución única.

Las ecuaciones lineales se pueden resolver despejando cualquiera de las variables cuyo coefi-
ciente sea distinto de cero. Algunas veces a ésta se le llama variable delantera y, en ese caso, a las
demás, variables libres. Siempre que una ecuación tenga variables libres, tiene un número infinito
de soluciones.
El conjunto de todas las soluciones se denomina conjunto solución, y la solución general es la,
condición que define al conjunto solución.
{
En el problema 2.1.1, el conjunto solución es [J , L] ∈  2 ; [J , L] = [20, 0] + α[−2,1], α ∈  .   }
La solución general es [J, L] = [20, 0] + α[−2, 1] con α ε .

Ejercicios 2.1

1. Escriba las ecuaciones siguientes en la forma general ax + by + cz = d, en los casos en que sea
posible.
  i) Para cada una escriba sus coeficientes y su término constante.
  ii) Diga cuál es la variable delantera y cuáles son las variables libres.
iii) Determine la solución general de cada una y, si es posible, dos particulares.

1. 4x −3−x = 3x + 2y + 3
2. 5x + 2y − x = x + 2y − 6
3. 2 + 5x + 7y − 7x = 2
4. x + y + z = 6 + y
5. xy +3z = x − y ... ¿se puede?
2. Encuentre todos los valores reales de s, tales que cada una de las siguientes ecuaciones tenga
a) un número infinito de soluciones, o b) ninguna solución.
i) 2s(x + y) − 9x − 9y − s + 3 = 0
ii) sx − 5y − s + 5 + sy − 5x = 0
2.2 Matrices 41

2.2 Matrices
Definición 2.2.1
Una matriz A de m × n sobre un campo K es un arreglo rectangular de m × n elementos aij ∈K
en m renglones y n columnas, con i = 1, 2, …, m y j = 1, 2, …, n.

 a11 a12  a1n 


 
a a22  a2 n 
A =  21
     
 
am1 am 2  amn 

Ejemplo 2.2.1

1 2 0 −2
2 3 −1 1
1 0 3 5
−1 1 0 2

Esta matriz es de 4 × 4 y tiene (4)(4) = 16 elementos.


Ejemplo 2.2.2

1 2 0 −2

Esta es una matriz de 1 × 4 y tiene cuatro elementos.


Ejemplo 2.2.3

1
2
1
−1

Esta es una matriz de 4 × 1 y tiene cuatro elementos.


Los renglones de la matriz A de m × n se denotarán como A1, A2, ..., Am y sus columnas
como A1, A2 ,…, An . 

Ejemplo 2.2.4

1 0 −1
 
Si A = 0 1 2, entonces
1 2 4 

A1 = [1 0 −1] , A2 = [0 1 2] y A3 = [1 2 4]

1 0 −1


 
A = 0,, A2 = 1 , A3 =  2  ,      a23 = 2,    a = 1
1
31
1 2   4
   
42 Unidad 2  Sistemas de ecuaciones lineales, matrices y determinantes

Se llamará Mm × n(K), o simplemente Mm × n, al conjunto de las matrices de m × n sobre el


campo 𝕂.

Igualdad de matrices
Dos matrices son iguales si tienen el mismo tamaño (igual número de renglones en cada una y el
mismo número de columnas en cada una) y sus elementos correspondientes son iguales. Es decir:

Definición 2.2.2
Dos matrices A, B ∈ Mm × n son iguales si y sólo si ∀ i, j, aij = bij .

Algunos tipos de matrices

Definición 2.2.3
Sea A ∈ Mm × n. Se dice que A es una matriz cuadrada si y sólo si n = m.

Ejemplo 2.2.5

2 3
1 5

Una matriz diagonal es una matriz cuadrada en la que los elementos distintos de a11, a22, …,
ann son cero. Formalmente:

Definición 2.2.4
Sea A ∈ Mm × n. Se dice que A es una matriz diagonal si y sólo si ∀i ≠ j, aij = 0.

Ejemplo 2.2.6

1 0 0 0
0 3 0 0
A=
0 0 3 0
0 0 0 2

Ejemplo 2.2.7

0 0 0 0
0 0 0 0
B=
0 0 0 0
0 0 0 0

Una matriz triangular superior es una matriz cuadrada en la que los elementos que están aba-
jo de la diagonal son cero.
2.2 Matrices 43

Definición 2.2.5
Sea A ∈ Mm × n. Se dice que A es una matriz triangular superior si y sólo si ∀ i > j, aij = 0.

Ejemplo 2.2.8

1 2 0 −2
0 3 −1 1
A=
0 0 3 5
0 0 0 2

Una matriz triangular inferior es una matriz cuadrada en la que los elementos que están arri-
ba de la diagonal son cero.

Definición 2.2.6
Sea A ∈ Mm × n. Se dice que A es una matriz triangular inferior si y sólo si ∀ j > i, aij = 0.

Ejemplo 2.2.9

1 0 0 0
2 3 0 0
A=
1 0 3 0
−1 1 0 2

Cuando los renglones de una matriz A se intercambian con sus columnas, se obtiene la trans-
puesta de A, que se denota por At.

Definición 2.2.7
Sea A ∈ Mm × n. La transpuesta de A, denotada por At, es la matriz B ∈ Mn × m de elementos bij,
tales que
bij = aji.

Ejemplo 2.2.10

1 2 0
1 2 1 1
2 3 1
A= At = 2 3 0 1
1 0 3
0 1 3 0
1 1 0

Definición 2.2.8
Sea A ∈ Mn × n. Se dice que A es una matriz simétrica si y sólo si A = At.
44 Unidad 2  Sistemas de ecuaciones lineales, matrices y determinantes

Ejemplo 2.2.11

1 2 1 −2 1 2 1 −2
2 3 0 1 2 3 0 1
A= At =
1 0 3 0 1 0 3 0
−2 1 0 2 −2 1 0 2

Definición 2.2.9
Sea A ∈ Mn × n. Se dice que A es una matriz antisimétrica si y sólo si At = −A.

Ejemplo 2.2.12

0 −2 1 −2 0 2 −1 2
2 0 2 5 −2 0 −2 −5
A= At = = −A
−1 −2 0 −3 1 2 0 3
2 −5 3 0 −2 5 −3 0

Operaciones con matrices


La multiplicación de una matriz por un escalar se lleva a cabo multiplicando cada elemento de la
matriz por el escalar.

Definición 2.2.10
Sea A ∈ Mm × n. La multiplicación de la matriz A por un escalar α se denota por αA y se define
como la matriz B ∈ Mm × n, tal que
si A = (aij), entonces B = α A = (α aij).

Ejemplo 2.1.13

1 0 −1 3 0 −3
   
3 0 1 2 = 0 3 6
1 2 4  3 6 12 

Dadas dos matrices del mismo tamaño, la suma de ellas se realiza elemento a elemento. For-
malmente:

Definición 2.2.11
Sean A, B ∈ Mm × n. La suma de las matrices A y B se denota por A + B y se define como la
matriz C ∈ Mm × n de elementos cij, tales que
cij = aij + bij

Ejemplo 2.2.14

1 0 −1 2 1 −3 3 1 −4


     
0 1 2 + 1 3 1 = 1 4 3
1 2 4 3 6 1 4 8 5 
2.2 Matrices 45

Para multiplicar dos matrices A y B es necesario que el número de columnas de A sea igual al
número de renglones de B. La matriz resultante, C, tendrá el número de renglones de A y el núme-
ro de columnas de B. Así, el elemento cij de C = AB se obtiene de la operación Ai · B j.

Definición 2.2.12
Sean A ∈ Mm × p y B ∈ Mp × n. El producto de las matrices A y B, que se denota por AB, se defi-
ne como la matriz C ∈ Mm × n de elementos cij, tales que
p
cij = Ai · B j = ∑ aik bkj
k =1

Ejemplo 2.2.15

 1 2
 
 0 1
−1 0
_______________________________ _____________________
 1 2 –1  2 4
 0 −3 2  −2 −3
   
−2 5 0  −2 1 
   
 1 0 1  0 2

Definición 2.2.13
Sea A ∈ Mm × n y Ai el i-ésimo renglón de A. El orden de Ai se denota por Or(Ai) y se define como
min{ j ; aij ≠ 0, j = 1, 2,..., n}, si Ai ≠ 0
Or( Ai ) = 
 n + i , si Ai = 0

Ejemplo 2.2.16
1 2 0 −2
 
0 3 −1 1 
Sea A = 
0 0 0 5
 
0 0 0 0 
Or(A1) = 1, Or(A2) = 2, Or(A3) = 4, Or(A4) = 8

Definición 2.2.14
Se dice que A ∈ Mm × n está escalonada por renglones si

∀ i, k, i < k → Or(Ai) < Or(Ak)

Ejemplo 2.2.17

1 2 0 −2
0 3 −1 1
A=
0 0 0 5
0 0 0 0
46 Unidad 2  Sistemas de ecuaciones lineales, matrices y determinantes

A está escalonada porque


Or(A1) = 1
Or(A2) = 2
Or(A3) = 4
Or(A4) = 8

Ejemplo 2.2.18

1 2 0 −2
0 0 −1 1
A=
0 0 0 5
0 2 0 0

A no está escalonada porque Or(A3) > Or(A4):


Or(A1) = 1
Or(A2) = 3
Or(A3) = 4
Or(A4) = 2

Definición 2.2.15
Si el orden de Ai es j, el elemento aij se llama elemento principal o pivote (o delantero) de Ai (los
renglones cero no tienen pivote).
Si en una matriz escalonada todos los renglones distintos de cero tienen pivote igual a uno
y, además, en la columna de cada pivote todos los otros elementos son cero, se dice que la
matriz está escalonada en forma reducida o que tiene forma de escalón reducido.

Ejemplo 2.2.19

1 0 1 0
0 1 2 0
A=
0 0 0 1
0 0 0 0

A tiene forma de escalón reducido.

Operaciones elementales en los renglones


Definición 2.2.16
Son operaciones elementales en los renglones de una matriz las siguientes:
Intercambio de dos renglones Ai ↔ Aj
Multiplicación de un renglón por un escalar distinto de cero aAi → Ai, a ≠ 0
Sumar un múltiplo de un renglón a otro aAi + Aj → Aj

Definición 2.2.17
Se dice que dos matrices A y B son equivalentes por renglones (lo que se denota por A ∼ B) si y
sólo si una de ellas se obtiene a partir de la otra mediante un número finito de operaciones
elementales por renglones.
2.2 Matrices 47

Ejemplo 2.2.20
Si
2 0 3 1 1 0 3 5
1 2 0 −2 1 2 0 −2
A= 2 3 −1 1 y B= 3 5 −1 −1
1 0 3 5 2 0 3 1
−1 1 0 2 −3 3 0 6

entonces A ∼ B, ya que B5 = 3A5, B4 = A1, B1 = A4, B3 = A3 + A2.

Definición 2.2.18
El rango de una matriz A ∈ Mm × n, denotado por r, es el número de renglones no cero de una
matriz equivalente a A, que está en forma escalonada.2

Ejemplo 2.2.21

1 2 0 −2
0 3 −1 1
A=
0 0 0 5
0 0 0 0

Dado que A está en la forma escalonada y su número de renglones distintos de cero es 3,


entonces su rango es 3.

Sistemas de ecuaciones lineales


Definición 2.2.19
Una ecuación lineal sobre el campo K en las variables x1, x2, ..., xn es una expresión de la forma
a1 x1 + a2 x2 + ⋅ ⋅ ⋅ + an xn = b,
donde a1, a2, ..., an, b ∈ K, y las variables están restringidas a tomar valores en K.

Si b = 0, se llama ecuación lineal homogénea; y si b ≠ 0, se conoce como ecuación lineal no


homogénea.

Ejemplo 2.2.22
La ecuación x1 + x2 = 2 no es homogénea.

Definición 2.2.20
Un sistema de m × n ecuaciones lineales sobre el campo K es una colección de m ecuaciones
lineales con n variables sobre K, es decir,
a11 x1 + a12 x2 + ⋅ ⋅ ⋅ + a1n xn = b1
a21 x1+ a22 x2+ ⋅ ⋅ ⋅ + a2n xn = b2

am1 x1+ am2 x2+ ⋅ ⋅ ⋅ + amn xn = bm

2En álgebra lineal se define el rango de una matriz como la dimensión del espacio generado por los renglones, que es igual que la
dimensión del espacio generado por las columnas. Las tres definiciones son equivalentes.
48 Unidad 2  Sistemas de ecuaciones lineales, matrices y determinantes

Ejemplo 2.2.23
x1 − x2 = 1 x1 + x2 = 1
2x1 + x2 = 0 −x1 + 2x2 = 0
x1 − x2 = 1

x1 − 3x2 − x3 = 1
2x1 + x2 + x3 = 2

Si todos los términos bi para i = 1, 2, 3, … m son cero, se tiene un sistema de ecuaciones
lineales homogéneo; de lo contrario, se trata de un sistema de ecuaciones lineales no homogéneo.
Del mismo modo que las ecuaciones lineales, los sistemas de ecuaciones lineales pueden tener:
i) solución única,
ii) un número infinito de soluciones (en estos dos casos se dice que el sistema es consistente),
iii) ninguna (en este último caso se dice que el sistema es inconsistente).
Los sistemas lineales homogéneos siempre tienen la solución cero (o trivial, cuando todas las
variables son iguales a cero), o bien un número infinito de soluciones.

x x x

y y y
         

y − x = 0  x − y = 3  y + x = 3 
y+x=4 3x + 3y = 9 y+x=1

a)  Solución única (2, 2)       b)  Un número infinito de soluciones      c)  Ninguna solución

Los sistemas de ecuaciones lineales pueden expresarse en forma matricial como

a11 a12 … a1n x1 = b1


a21 a22 … a2n x2 = b2
∙ ∙ ∙ ∙
am1 am2 … amn xn = bm

A X b
o en forma simbólica como AX = b.

Ejemplo 2.2.24
El sistema
x1 − x2 = 1
2x1 + x2 = 0

se puede expresar como


1 −1  x 1  1
2 1  x = 
   2  0
2.2 Matrices 49

A se conoce como la matriz del sistema o matriz de coeficientes. Al adjuntar el vector b a la


matriz A se construye lo que se conoce como matriz aumentada.
Así, la matriz del sistema es

a a  a1n 
 11 12 
a a  a2 n 
A =  21 22

     
a a m2  amm 
 m1
y la matriz aumentada
 a11 a12  a1n b1 
 
 a a  a b 
2
[ A | b ] =  21 22 2n

      
a a a
 mn bm 
 m1 m2 

Ejemplo 2.2.25
Las matrices
 1 1  1 1 1
   
 −1 2  y −1 2 0
 1 −1  1 −1 1

son la matriz de coeficientes y la matriz aumentada del sistema

x1 + x2 = 1
−x1 + 2x2 = 0
x1 − x2 = 1

Definición 2.2.21
 s1 
s 
S= 
2
Se dice que
 
 
sn 
donde s1, s2, ..., sn ∈ K es una solución del sistema de ecuaciones lineales si y sólo si la colección
de las si (el vector S) satisface cada una de las ecuaciones. Es decir que, para cada i (i = 1, 2, …, m),
ai1 s1+ ai2 s2 + ⋅ ⋅ ⋅ + ain sn = bi

En forma matricial, S es solución si y sólo si AS = b.

Ejemplo 2.2.26
2
S=
1
es una solución al sistema

x1 − x2 = 1
2x1 + x2 = 5
50 Unidad 2  Sistemas de ecuaciones lineales, matrices y determinantes

ya que

2 − 1 = 1
2(2) + 1 = 5

En forma matricial,

2
 
1 −1 2 1 1
2 1  1 = 5 
     1 −1 1 · 2 − 1 · 1 1
    = 
2 1 2 · 2 + 1 · 1 5

Definición 2.2.22
Dos sistemas de ecuaciones lineales, con las mismas variables, son equivalentes si y sólo si tie-
nen el mismo conjunto solución.3

Ejemplo 2.2.27

x1 − x2 = 1
2x1 + x2 = 5
y

x1 − x2 = 1
x2 = 1

son equivalentes, ya que tienen la misma solución (2, 1).

2
S=  
1
En efecto,
2 − 1 = 1
2(2) + 1 = 5
y
2 − 1 = 1
1 = 1

y ambos sistemas tienen solución única.


El rango de la matriz aumentada [A|b] se denota como r(A|b).
El sistema de ecuaciones AX = b tiene solución si y sólo si el rango de la matriz del sistema
es igual al rango de la matriz aumentada, es decir, r = r(A|b).
En efecto, el sistema Ax = b de m ecuaciones tiene solución si y sólo si el vector b de constan-
tes es una combinación lineal de las columnas de la matriz del sistema, lo que sucede si y sólo si b
es una combinación lineal de las columnas, lo que implica que el espacio que generan las colum-
nas es igual al generado por las columnas más el vector de constantes, lo que ocurre si y sólo si el
rango de la matriz del sistema es igual con el rango de la matriz aumentada.

3 Esta definición es equivalente a la que se dio en términos de operaciones elementales.


2.2 Matrices 51

Definición 2.2.23
Sea Ax = b un sistema de m ecuaciones que tiene solución. Entonces, los grados de libertad
(o número de parámetros de la solución) se definen como
GL = n − r,
donde GL = grados de libertad, n = número de incógnitas y r = rango de la matriz A.

La siguiente matriz está escalonada:


 1 1 0 1
 
0 1 1 2
0 0 1 3
 
r = 3 y r(A|b) = 3

Como los rangos son iguales, el sistema tiene solución y los grados de libertad son
GL = n − r = 3 − 3 = 0 (la solución del sistema es única).
La siguiente matriz está escalonada:
1 1 2 0 1
0 1 1 1 −1

0 0 0 1 3
 
0 0 0 0 0
Aquí, r = 3 y r(A|b) = 3.
Como los rangos de las matrices del sistema y la aumentada son iguales, el sistema tiene solu-
ción y los grados de libertad (o número de parámetros) son GL = n − r = 4 −3 = 1 (el sistema tiene
un número infinito de soluciones que dependen del valor que se asigne al parámetro).
La siguiente matriz está escalonada:
 1 1 0 1
 
0 1 1 2
0 0 0 3
 
En este caso, r = 2 y r(A|b) = 3.
Puesto que los rangos no son iguales, el sistema no tiene solución.
Como ya se dijo, otra forma de representar el sistema de ecuaciones es expresar el vector b en
la forma siguiente:
 a11   a12   a1n   b1 
       
 a21   a22   a2 n   b2 
x1 + x2 + ... + xn =
          
       
am1  am 2  amn  bm 

Ejemplo 2.2.28
El sistema de ecuaciones lineales

x1 + x2 = 1
−x1 + 2x2 = 0
x1 − x2 = 1

se puede expresar en forma vectorial

 1  1 1
     
x1 −1 + x2  2 = 0
 1 −1 1

52 Unidad 2  Sistemas de ecuaciones lineales, matrices y determinantes

Se desea resolver el sistema de ecuaciones


y + z = 1
2x − 4 y + 4 z + 6w = 2
−x + 2 y − 2 z − 2w = −2
x − 2y + 2 z + 3w = 1

Método de Gauss (eliminación gaussiana)


1. Obtenga la matriz aumentada del sistema

0 1 1 0 1
 2 −4 4 6 2 

−1 2 −2 −2 −2
 
 1 −2 2 3 1 

2. Aplique operaciones elementales con renglones para obtener su forma de escalón reducido

 0 1 1 0 1  0 1 1 0 1
 2 −4 4 6 2   1  1 −2 2 3 1 ,
   
R → R2 …
−1 2 −2 −2 −2 2 2 −1 2 −2 −2 −2
   
 1 −2 2 3 1  1 −2 2 3 1

 0 1 1 0 1  1 −2 2 3 1
 1 −2 2 3 1  0 1 1 0 1 ,
  R1 ↔ R2 … 
−1 2 −2 −2 −2 −1 2 −2 −2 −2
   
 1 −2 2 3 1  1 −2 2 3 1

 1 −2 2 3 1 1 −2 2 3 1
 0 1   1 ,
 1 0 1 R + R → R … 0 1 1 0
1 3 3
−1 2 −2 −2 −2 0 0 0 1 −1
   
 1 −2 2 3 1 1 −2 2 3 1

1 −2 2 3 1 1 −2 2 3 1
0 1 1 0 1 −R + R → R … 0
 1 1 0 1
 1 4 4
0 0 0 1 −1 0 0 0 1 −1
   
1 −2 2 3 1 0 0 0 0 0

3. En la última matriz calcule el rango de la matriz del sistema y de la matriz aumentada (en
ambas hay tres renglones distintos de cero); por lo tanto,

r = 3 y r(A|b) = 3

y entonces el sistema tiene solución.


4. Calcule los grados de libertad

GL = 4 − 3 = 1

5. Observe que el resultado anterior indica que existe una variable a la que se le puede asignar
un valor arbitrario.
6. Identifique la variable (parámetro) a la que se asignarán valores arbitrarios.
2.2 Matrices 53

Cómo seleccionar los parámetros


De cada renglón de la matriz aumentada, que ya esté en forma escalonada, se marcan los prime-
ros elementos de cada renglón distintos de cero, de izquierda a derecha. En este caso son los ele-
mentos a11, a22 y a34.

1 −2 2 3 1
 
0 1 1 0 1
 
0 0 0 1 −1
0 0 0 0 0

El parámetro (α) corresponde con la variable libre asociada a la columna que no tiene ele-
mentos marcados (que no es pivote o variable delantera). En este caso los valores arbitrarios se
asignarán a la variable z. Se despejan las variables restantes en términos de z, iniciando de abajo
hacia arriba como se indica (sustitución hacia atrás).
z=α
w = −1
y + z = 1, de donde y = 1− α
x −2y + 2z + 3w = 1, por lo que x = 1 − 2(1 − α) − 2(α) −3(−1) = 6 − 4α

Entonces la solución se expresa como


x   6   − 4
 y   1  − 1
S =   =   +α  
 z   0  1
     
w −1  0

En seguida se muestra un ejemplo de un sistema de ecuaciones lineales no homogéneo con


solución única.
3x − 6y + 8z = 15
5x + 3y − 2z = 5
x − 2y + 2z = 3
Este ejemplo se resuelve usando el método de Gauss-Jordan, que consiste
en aplicar las operaciones elementales en los renglones para obtener una matriz Se dice que una matriz se encuentra
escalonada bien bonito (escalonada reducida). escalonada bien bonito cuando 
Se escribe la matriz aumentada del sistema está escalonada y para cada renglón
que comienza con un uno la
1 correspondiente columna es un
2 2 5 R3 / 2 = R3 1 2 2 5
vector unitario (el resto de las
0 −7 −12 −14 ≈ 7R3 + ( −6 )R2 = R3 0 −7 −12 −14
 
    componentes de la columna son
 0 −6 1 −1 −R3 + R1 = R1  0 −12 2 −2 cero). Por definición, la matriz cero
está escalonada bien bonito.
R2 + 6R3 = R2  1 −2 0 −3  1 0 0 1
R2 / 13 = R2 
≈ R1 − R3 = R1  0 13 
0 26 ≈ 0 1 0 2
  R + 2R = R  
R3 / 2 = R3  0 0 1 3 1 2 1
 0 0 1 3

Como se observa, no hay variables libres, el rango es 3 y el número de variables es 3, por lo


que se tiene un sistema con solución única.
A continuación se muestra el ejemplo de un sistema de ecuaciones lineales no homogéneo
con un número infinito de soluciones.

x + y − 3z = 2 
−3x + y + z = 6
2.2 Matrices
54 Unidad 2  Sistemas de ecuaciones lineales, matrices y determinantes

Se escribe la matriz aumentada del sistema

3R1 + R2 = R2
 1 1 −3 2  1 0 −1 −1
 −3 ≈ R2 / 4 = R2 
 1 1 6   0 1 −2 3 
R1 − R2 = R1

de manera que la solución general expresada en forma paramétrica es

x=r−1
y = 2r + 3    r ∈ 
z=r

o escrita en forma vectorial paramétrica

 x  1  −1
     
x− =  y = r  2 +  3 r ∈
  
 z   1  0
    

Como se observa, hay dos variables delanteras y una variable libre. El rango es 2 y el número
de variables es 3, por lo que se tiene un sistema con un parámetro y, por lo tanto, con un número
infinito de soluciones.
El conjunto solución se escribe así:

  x  1  −1 
       
 x; x =  y = r  2 +  3 r ∈ 
    
 z   1  0 
     

Se obtienen soluciones particulares al asignar valores a r. Si r = 1, entonces


 x  1  −1  0
 
x =  y =  2 +  3 =  5
   

 z   1  0  1

Se comprueba en el sistema original y se ve que la solución anterior satisface las dos ecuaciones

1(0) + 1(5) − 3(1) = 2


−3(0) + 1(5) + 1(1) = 6

Ejemplo de un sistema de ecuaciones lineales no homogéneo sin solución:

x + y = 3z =2
2x + 2y − 6z = 7

Se escribe la matriz aumentada del sistema y se escalona

 1 1 −3 2  R2 + ( −2 )R1 = R2  1 1 −3 2
 2 2 −6 7  ≈  0 0 0 3 
 

La segunda ecuación dice 0x + 0y + 0z = 3.    ¡El sistema es inconsistente!


2.2 Matrices 55

Ejercicios 2.2

1. Reescriba en forma ordenada el sistema lineal siguiente:


3x − 5y + 9 = 0
−z + 4w – 11 = −3x
−x – z + 3y − w = 18
−y − z + 8t = −w − 5
Determine:
a) La matriz de coeficientes. d ) El sistema homogéneo asociado.
b) El vector de constantes. e) Escriba en la forma matricial AX = b.
c) La matriz aumentada. f ) Escriba el vector de constantes como com-
binación lineal de las columnas.

2. Escriba las siguientes matrices en forma de sistemas de ecuaciones y resuélvalas.

 2 0 0 π  7 4 0 0 −1 3 3
 0 −2 d)  0 0 −2 1
a)  0 3
 
0 1 8

 0 0 4 e  0 0 0 3 4 −7 2


 1 0 −2 1 2  1 4 0 −3 0 1 2
b)  
 0 1 3 −2 4 e)  0 0 1 2 0 −1 7
 
 0 0 0 0 1 −2 8
 3 0 −1 5 4
c) 
 0 2 −2 −3 9

3. Determine los sistemas consistentes y calcule sus soluciones generales.

a) d)
3x + 2 y + 3z = 19 3 y + z = −9
−x + y − z = −3 3x + y = −8
2x − y + z = 8 3x + 7 y + 2 z = −26

b) 2 x + 3 y + 6 z = 5
e) 17 − 2 z = x − 3 y
−x − y − z = −3
14 + 2 x
− = 3y
2x + y + z = 7
7y − 1 = 3x + 2 z
c) x + y = 1
w + z = 1
x + w = 1
y + z = 1

Aplicaciones de los sistemas de ecuaciones


Balanceo de reacciones químicas
Una reacción química es un proceso termodinámico en el que uno o más reactivos se transforman
en productos por efecto de un factor energético. Las sustancias (reactivos y productos) que inter-
vienen en la reacción pueden ser elementos o compuestos químicos, también conocidos con el
nombre genérico de especies. Las reacciones químicas se representan simbólicamente mediante
ecuaciones químicas.
Por ejemplo, en algunas estufas domésticas de gas, cuando se enciende una hornilla, ocurre
una reacción de combustión en la que el gas butano (compuesto cuya molécula está formada por 4
56 Unidad 2  Sistemas de ecuaciones lineales, matrices y determinantes

átomos de carbono y 10 átomos de hidrógeno, y que se representa con el símbolo C4H10) reaccio-
na con el oxígeno del aire (molécula con 2 átomos, O2) cuando se ponen en contacto con una
chispa o con la flama de un piloto (factor energético). Si la hornilla está bien calibrada (cuando
permite que la combustión se lleve a cabo completamente), esta reacción produce dióxido de car-
bono (1 átomo de carbono y 2 de oxígeno, CO2) y agua (2 átomos de hidrógeno y uno de oxígeno,
H2O), y se representa mediante la siguiente ecuación (balanceada):
2C4H10 + 13O2 → 8CO2 + 10H2O
en donde los números que anteceden a los símbolos de las diversas sustancias se denominan coefi-
cientes estequiométricos e indican las cantidades en moles,4 en que los reactivos se combinan y las
cantidades de producto que se obtienen (es decir, 2 moles de butano reaccionan con 13 moles de
oxígeno para producir 8 moles de dióxido de carbono y 10 moles de agua).
El hecho de que una ecuación química esté balanceada significa que el número de átomos de
cada elemento que interviene en los reactivos corresponda exactamente con el número de átomos
del mismo elemento que estén presentes en los productos; es decir, que ningún elemento se genere
ni se destruya en la reacción.
Número de átomos de un  Número de átomos del mismo
 elemento en los reactivos  =  elemento en los productos 
   
Este principio se conoce como la ley de Lavoisier de conservación de la materia. Para determi-
nar el número de átomos de cada elemento con que cada especie química contribuye en la reac-
ción, se multiplica el coeficiente estequiométrico de la especie por el número que se encuentra
como subíndice del elemento en el símbolo que representa a la especie (si no existe un subíndice,
éste se asume como la unidad).
De esta manera, como se puede verificar en la reacción de combustión del butano, la cantidad
de átomos de carbono en los reactivos es 2 × 4 = 8, la de hidrógeno 2 × 10 = 20 y la de oxígeno
13 × 2 = 26, mientras que la cantidad de átomos de carbono en los productos es 8 × 1 = 8, la de
hidrógeno 10 × 2 = 20 y la de oxígeno 8 × 2 + 10 × 1 = 16 + 10 = 26. Como la cantidad de átomos
de cada elemento en los reactivos es igual que la de los productos, se dice que la ecuación química
está balanceada.
Desde esta perspectiva (conservación de los átomos), la ecuación química se puede escribir en
forma análoga a una ecuación algebraica:
2C4 H10 + 13O 2 = 8CO 2 + 10H 2O
o bien
2C 4H10 + 13O2 + (−8)CO2 + (−10)H2 O = 0
Observe que esta última representación de la ecuación química implica asumir que los coefi-
cientes estequiométricos de los productos tienen signo negativo.
Para ilustrar el procedimiento involucrado en el balanceo de reacciones químicas, se plantea
determinar los coeficientes de la reacción de combustión del butano, presentada anteriormente.
La ecuación química es la siguiente:
x1C 4H10 + x2 O2 → x3CO2 + x4H2 O

en donde x1, x2, x3 y x4 son los coeficientes estequiométricos.


El balance atómico para cada elemento (C, H y O) presente en la reacción se puede simplificar
mediante la siguiente tabla:
Número de átomos Número de átomos
Elemento
en los reactivos en los productos
Carbono, C 4 x1 x3
Hidrógeno, H 10 x1 2 x4
Oxígeno, O 2 x2 2 x3 + x4

4 En química, el número de moles equivale al resultado que se obtiene al dividir la cantidad en masa de una especie entre su peso molecular.
2.2 Matrices 57

Al igualar las expresiones de la segunda y la tercera columnas de la tabla se obtiene el siguien-


te sistema de ecuaciones:
4x1 = x3
10 x1 = 2 x4
2 x2 = 2 x3 + x4
que en forma análoga se escribe:
4x1 − x3 = 0
10x1 − 2x4 = 0
2x2 − 2x3 − x4 = 0

Este sistema homogéneo es de tres ecuaciones con cuatro incógnitas, por lo que la solución no
es única. Se puede resolver usando alguno de los métodos desarrollados en esta unidad (por ejem-
plo, el método de Gauss-Jordan). La matriz aumentada
 4 0 −1 0 0
 
10 0 0 −2 0
 0 2 −2 −1 0

da como resultado la siguiente matriz escalonada:


 1 
1 0 0 − 0
 5 
0 1 0 −
13 
0
 10 
 4 
0 0 1 − 0
 5 

que se puede escribir como el sistema de ecuaciones siguiente:

1
x1 − x4 = 0
5
13
x2 − x4 = 0
10
4
x3 − x4 = 0
5
De este sistema simplificado se obtiene la siguiente solución:

1
x1
5
13
x2
x= = α 10 α ∈ 
4
x3
5
x4 1

Cuando se está modelando una reacción química conviene considerar coeficientes enteros,
por lo que en la solución anterior se puede cambiar el parámetro α por el símbolo (o parámetro)
α = 10t y hacerlo variar sobre los enteros, para obtener soluciones particulares.

 2  x1   2 
 13   x   13 
 2  
x = t   ,   t ∈     Por ejemplo, para t = 1   x =   =  
 8 x3 8
     
10  x
 4  10
58 Unidad 2  Sistemas de ecuaciones lineales, matrices y determinantes

Finalmente, sustituya los valores de los coeficientes obtenidos en la reacción:


2 C 4H10 + 13O2 → 8 CO2 + 10 H2 O
¡La reacción está balanceada!

Representación generalizada
Con objeto de generalizar los procedimientos anteriores, se puede plantear la siguiente notación
para escribir una especie química (Aj) que contiene un número E de elementos (ei):

que no es un producto sino una notación, en donde ei es el símbolo del elemento i y el subíndice si,j
representa el número de átomos con que el elemento i está presente en la especie Aj.
Por ejemplo, en el caso del butano,
A1 = C 4H10 ; e1 = C, e2 = H; s1,1 = 4, s2,1 = 10
De esta manera, en una reacción química en la que intervienen N especies, R reactivos y P = N − R
productos, el principio de conservación de la materia se puede enunciar mediante la siguiente
ecuación:
(x1A1 +  + xR AR ) − (xR +1AR +1 +  + xN AN ) = j∑=1x j Aj − j =∑R +1x j Aj = 0
R N

en donde xj es el número estequiométrico asociado a la especie Aj en la reacción química.

Balanceo de ecuaciones químicas. Método algebraico


Balancear una reacción química general
(x1A1 +  + xR AR ) − (xR +1AR +1 + L + xN AN ) = 0
significa determinar los valores que deben tener los coeficientes estequiométricos de cada especie
involucrada para que se satisfaga la ley de conservación de la materia (en donde cada especie Aj
es una fórmula que contiene una cantidad de átomos de los elementos ei determinada por el subín-
dice si,j).
La teoría general de la química proporciona distintos métodos para este propósito (óxido-
reducción, tanteos, ion-electrón, entre otros), pero la ley de conservación de la materia, que se
puede interpretar como el balance atómico de las especies presentes en cada reacción, cuando
se escribe en forma ordenada, genera un sistema homogéneo de ecuaciones lineales algebraicas,
cuya solución se puede obtener usando los métodos que se tratan en esta unidad.
El ordenamiento adecuado para realizar el balance anterior consiste en construir una tabla en
la que los renglones correspondan a cada uno de los E elementos y las columnas a cada una de las
N especies que se encuentran presentes en la reacción química. Posteriormente, las celdas de la
tabla se llenan colocando en cada una de ellas el número de átomos que corresponda; por ejemplo,
para la celda que involucra al renglón del elemento i y la columna de la especie j se debe colocar
la expresión que resulta de multiplicar el coeficiente estequiométrico de la especie j (xj) por el
número que corresponde al subíndice del elemento i en la especie j (si,j). En el caso en que algún
elemento k no esté contenido en la fórmula de una especie m, entonces sk,m = 0. La suma algebrai-
ca en cada renglón corresponderá con el balance atómico de cada elemento, que tiene que ser cero.
A continuación se muestra el proceso completo para una reacción química general:
A1 ⋅⋅⋅ AR AR +1 ⋅⋅⋅ AN

e1 s11, x1 + ⋅⋅⋅ + s x − s − ⋅⋅⋅ − s1,N x N = 0


1,R R 1,R + 1xR + 1
     
ei si,1x1 + ⋅⋅⋅ + s x
i ,R R
− s
i ,R + 1xR + 1
− ⋅⋅⋅ − si ,N xN = 0

     
eE sE,1x1 + ⋅⋅⋅ + s x
E ,R R
− s
E ,R + 1xR + 1
− ⋅⋅⋅ − s E ,N x N = 0
2.2 Matrices 59

En la solución de tal sistema homogéneo se pueden presentar los siguientes casos:5


i) Cuando la única manera de satisfacer la ecuación química es la trivial, es decir, x1 = x2 =
… = x = 0, se dice que no representa una reacción química.
N
ii) La ecuación química representa una sola reacción si la solución del sistema de ecuaciones
conduce a obtener N − 1 coeficientes estequiométricos (x1, x2, …, xN−1) como función del
N-ésimo (xN). En estos casos se acostumbra seleccionar un valor entero para xN, tal que
genere números enteros reducidos a su mínima expresión para los demás x1, x2, …, xN−1.
iii) La ecuación tiene F grados de libertad (o parámetros independientes) y F > 1. Esto sucede
si y sólo si la solución del sistema implica F coeficientes que pueden seleccionarse arbitra-
riamente, y para cada selección existe un único conjunto de números que se asignan a los
demás coeficientes y que balancean la ecuación. Es importante notar aquí que la elección
de soluciones (por lo tanto, de las F reacciones independientes) no es única.

Ejemplos de balanceo de reacciones químicas


1. Una ecuación que no representa una reacción química:

( )
x1 NH 4 2 SO4 → x2 NH 4OH + x3SO2

Balance atómico:

(NH4)2 SO4 NH4OH SO2


N 2x1 − x2 = 0
H 8x1 − 5x2 = 0
S x1 − x2 = 0
O 4x1 − x2 − 2x3 = 0

La matriz aumentada: 2 −1 0 0
 
8 −5 0 0
1 0 −1 0
 
4 −1 −2 0

que resulta en 1 0 −1 0
 
0 1 −2 0
0 0 2 0
 
0 0 0 0
El renglón cuatro de la matriz se hace cero, por lo que el sistema tiene solución única que es
la trivial.

Matriz escalonada: 1 0 0 0
 
0 1 0 0 
 
0 0 1 0 

En efecto, x1 = 0
x2 = 0
x3 = 0

5Rincón, C. y Garritz, A. “Capricho Valenciano (II). Fundamento matemático del método de balanceo por números de oxidación”,
Educación Química, Vol. 8, Núm. 2, pp. 76-86, 1997.
60 Unidad 2  Sistemas de ecuaciones lineales, matrices y determinantes

Por lo tanto, la ecuación x1(NH4)2SO4 → x2NH4OH + x3SO2 no representa reacción quími-


ca alguna.
2. Una ecuación que representa una reacción química única (con un solo parámetro):

x1HCl + x2 KMnO4 → x3Cl2 + x4KCl + x5 MnCl2 + x6H2 O

Balance atómico:

HCl KMnO4 Cl2 KCl MnCl2 H2O


H x1 − 2x6 = 0
Cl x1 − 2x3 − x4 − 2x5 = 0
K x2 − x4 = 0
Mn x2 − x5 = 0
O 4x2 − x6 = 0

Matriz aumentada: 1 0 0 0 0 −2 0
 
1 0 −2 −1 −2 0 0
0 1 0 −1 0 0 0
 
0 1 0 0 −1 0 0
 
0 4 0 0 0 0 0

1 16
Matriz escalonada:  0 0 0 0 − 0 
8
 
0 2
1 0 0 0 − 0
 8 
 5 
0 0 1 0 0 − 0
 8 
 2 
0 0 0 1 0 − 0
 8 
 2 
0 0 0 0 1 − 0
 8 

Sistema reducido: 16
x1 − x = 0
8 6
2
x2 − x = 0
8 6
5
x3 − x = 0
8 6
2
x4 − x = 0
8 6

x5 − 2 = 0
x
8 6
2.2 Matrices 61

La solución del sistema homogéneo es:


16 
x1   16 16
8
x2 2 2 2
8
5
x3   x 5 5
x= = x6  8  = 6 =t t∈
2 8
x4   2 2
8
2
x5 8 2 2
 
x6 1 8 8

Reacción balanceada (t = 1):

16HCl + 2KMnO4 → 5Cl2 + 2KCl + 2MnCl2 + 8H2 O

Para que se puedan apreciar las ventajas que representa hacer algunas consideraciones que
permiten reducir el sistema, a continuación se trata lo que aquí se denomina método corto.
Balancee la siguiente reacción:
HCl + KMnO4 → Cl2 + KCl + MnCl2 + H2O
Encuentre cuáles elementos aparecen sólo en un reactivo y van a dar sólo a un compuesto de
los productos con objeto de asociar la misma variable a las moléculas que los contienen; en este
caso son las del hidrógeno, del potasio y del manganeso. Debido a que la molécula de agua tiene
2 hidrógenos, se le pone a, con lo cual a la molécula del ácido clorhídrico le corresponde 2a; al
permanganato de potasio se le pone b y, en consecuencia, al cloruro de potasio y al cloruro de
manganeso también les corresponde b. Al resto de los compuestos (sólo hay cloro) se les asignan
otras letras.
El resultado es
HCl + KMnO4 → Cl2 + KCl + MnCl2 + H2O
2a b c b b a
Se plantea ahora el sistema de ecuaciones lineales, obedeciendo la ley de la conservación de
la materia. El número de átomos de cada especie reactiva tiene que coincidir con el número
de átomos de cada especie producto.

H: 2a = 2a Como se observa, las ecuaciones que deben considerarse


Cl: 2a = 2c + b + 2b son las que corresponden al cloro y al oxígeno. El resto
K: b = b no aporta información útil.
Mn: b = b
O: 4b = a

El sistema ordenado

2a − 3b − 2c = 0 se resuelve por el método matricial.


a − 4b =0

 8
2 −3 −2  1 0 − 5
≈ 
2
1 −4 0 0 1 − 
 5

Escriba el sistema en forma de ecuaciones lineales. Observe que a y b quedaron como varia-
bles delanteras y c como parámetro, es decir c = r.
62 Unidad 2  Sistemas de ecuaciones lineales, matrices y determinantes

8
a= r
5  a  8  
2    r  
b= r Conjunto solución  x ; x =  b  =  2  r ∈ 
5   c  5 5  
5      
c= r
5

Una solución particular haciendo r = 5 es:

 a  8  8
  5   
= b = 2 = 2
  5   
 c   5  5

HCl + KMnO4 → Cl2 + KCl + MnCl2 + H2O


2a b c b b a
16 2 5 2 2 8
16 HCl + 2 KMnO4 → 5 Cl2 + 2 KCl + 2 MnCl2 + 8 H2O

que es la misma solución que se obtuvo antes.


3. Una ecuación que representa una reacción química con coeficientes inusuales:6

( ) ( )
x1 Cr N 2 H 4CO 6  Cr CN 6  + x2 KMnO4 + x3H2SO4
 4  3
→ x4K 2 Cr2 O7 + x5 MnSO4 + x6CO2 + x7 KNO3 + x8K 2SO4 + x9H2 O

que, para efectos de representar en el balance de átomos, se escribe en la forma

x1A1 + x2 A 2 + x3 A 3 → x4 A 4 + x5 A 5 + x6 A 6 + x7 A 7 + x8 A 8 + x9 A 9

Balance atómico:

A1 A2 A3 A4 A5 A6 A7 A8 A9

Cr 7x1 − 2x4 = 0
N 66x1 − x7 = 0
H 96x1 + 2x3 − 2x9 = 0
C 42x1 − x6 = 0
O 24x1 + 4x2 + 4x3 − 7x4 − 4x5 − 2x6 − 3x7 − 4x8 − x9 = 0
K x2 − 2x4 − x7 − 2x8 = 0
Mn x2 − x5 = 0
S x3 − x5 − x8 = 0

6 En 1995, Roland Stout, Ph.D, actual profesor de la Universidad de Carolina del Norte en Pembroke, publicó esta reacción en un
artículo científico (J. Chem. Educ. 1995, 72, 1125). Indicó que a veces se la proponía a sus estudiantes con objeto de que la balancea-
ran, ofreciendo la calificación más alta para su materia en el caso de que lo lograran. Dice que ninguno pudo. Tiempo después, Jim
Diamond (J. Chem. Educ. 1997, 74, 1256) publicó que un estudiante de matemáticas pudo resolver la misma reacción por el método
algebraico, una semana después de que se la propuso.
2.2 Matrices 63

Matriz aumentada:

7 0 0 −2 0 0 0 0 0 0
 
66 0 0 0 0 0 −1 0 0 0
96 0 2 0 0 0 0 0 −2 0
 
42 0 0 0 0 −1 0 0 0 0
24 4 4 −7 −4 −2 −3 −4 −1 0
 
 0 1 0 −2 0 0 −1 −2 0 0
 0 1 0 0 −1 0 0 0 0 0
 
 0 0 1 0 −1 0 0 −1 0 0

Matriz escalonada:

Sistema reducido:

10
x1 − x9 = 0
1 879
1 176
x2 − x9 = 0
1 879
1 399
x3 − x9 = 0
1 879
35
x4 − x9 = 0
1 879
1176
x5 − x9 = 0
1 879
420
x6 − x9 = 0
1 879
660
x7 − x9 = 0
1 879
223
x8 − x9 = 0
1 879
64 Unidad 2  Sistemas de ecuaciones lineales, matrices y determinantes

Solución del sistema homogéneo:

 x1   10   10 
x   1176   1176 
 2    
 x3  1 399  1 399 
     
 x4   35   35 
x
x  x5  = 9  1176  = t  11776  t ∈ 
  1 879    
 x6   420   420 
x   660   660 
 7    
 x8   223   223 
     
 x9  1 879  1 879 

Reacción balanceada (t = 1):

10Cr (N 2 H 4CO)6 4 Cr (CN)6 3 + 1176KMnO4 + 1399H2SO4 → 35K 2 Cr2 O7 + 1176MnSO4
+ 420CO2 + 660KNO3 + 223K 2SO4 + 1879H2 O

Comprobación:

Elemento Número de átomos en los reactivos Número de átomos en los productos


Cromo, Cr 10 × (4 + 3) = 70 35 × 2 = 70

Nitrógeno, N 10 × (48 + 18) = 660 660 × 1 = 660


Hidrógeno, H 10 × 96 + 1 399 × 2 = 3 758 1 879 × 2 = 3 758

Carbono, C 10 × (24 + 18) = 420 420 × 1 = 420

10 × 24 + 1176 × 4 35 × 7 + 1176 × 4 + 420 × 2 + 660 × 3


Oxígeno, O
+1399 × 4 = 10 540 +223 × 4 + 1 879 × 1 = 10 540

Potasio, K 1176 × 1 = 1176 35 × 2 + 660 × 1 + 223 × 2 = 1176

Manganeso, Mn 1176 × 1 = 1176 1176 × 1 = 1176

Azufre, S 1 399 × 1 = 1 399 1176 × 1 + 223 × 1 = 1 399

Aunque los coeficientes son inusuales, la ecuación está balanceada.


Al igual que en el ejemplo anterior, a continuación se resuelve el mismo problema utilizando
el método corto.
[Cr(N2H4CO)6]4[Cr(CN)6]3 + KMnO4 + H2SO4 → K2Cr2O7 + MnSO4 + CO2 + KNO3 + K2SO4 + H2O
7
b a a + c b a 42b 66b c d
2

Conjunto solución:
2.2 Matrices 65

Solución particular:

[Cr(N2H4CO)6]4[Cr(CN)6]3 + KMnO4 + H2SO4 → K2Cr2O7 + MnSO4 + CO2 + KNO3 + K2SO4 + H2O


7
b a a + c b a 42b 66b c d
2
10 1 176 1 399 35 1 176 420 660 223 1 879

Comprobación
Los elementos que se usaron para asignar las letras son Cr, N, C, Mn, S, por lo que no se incluyen
en la comprobación.

H: 960 + 2(1 176) + 2(223) = 3 758 = 2(1 879)


O: 240 + 4(1 176) + 4(1 176) + 4(223) = 10 540 = ( 49 )(10) + 4(1 176) + 840 + 1 980 + 4(223) + 1 879
2
K:  1 176 = 70 + 660 + 2(223)
4. Una reacción cuyo balanceo indica que algo anda mal (¡la matemática da información rele-
vante!).
x1FeI2 + x2HIO3 + x3ICl → x4FeCl3 + x5HCl + x6H2O
Balance atómico:

FeI2 HIO3 ICl FeCl3 HCl H2O


Fe   x1 − x4 = 0
I 2x1 + x2 + x3 = 0
H x2 − x5 − 2x6 = 0
O 3x2 − x6 = 0
Cl x3 − 3x4 − x5 = 0

Matriz aumentada: 1 0 0 −1 0 0 0
 
2 1 1 0 0 0 0
0 1 0 0 −1 −2 0
 
0 3 0 0 0 −1 0
 
0 0 1 −3 −1 0 0

 4 
Matriz escalonada: 1 0 0 0 0 − 0
 15 
0 5
1 0 0 0 − 0
 15 
 13 
0 0 1 0 0 0
 15 
 4 
0 0 0 1 0 − 0
 15 
 25 
0 0 0 0 1 0
 15 
66 Unidad 2  Sistemas de ecuaciones lineales, matrices y determinantes

Solución del sistema:  4  4


 5  5
   
α  −13   −13 
x=  =t  t∈
15  4   4
 −25   −25 
   
 15   15 

y de acuerdo con los coeficientes calculados, la reacción es

4FeI2 + 5HIO3 −13IC1 → 4FeC13− 25HCI + 15H2O

 a matemática indica de manera clara que, en este ejercicio, el cloruro de yodo y el ácido
L
clorhídrico están en posición equivocada; es decir, el ICl debe ser producto y el HCl debe ser
reactivo. Así, la reacción balanceada (escrita correctamente) es

4FeI2 + 5HIO3 −25HCl → 4FeCl3 − 13ICl + 15H2O

5. Cinco reacciones independientes:

x1 Zn + x2 HNO3 → x3 Zn (NO3)2 + x4 H2O + x5 H2 + x6 NH4NO3 + x7 Zn (NH2)2 + x8 NO + x9 NO2

que, otra vez, para simplificar se representa mediante:

x1A1 + x2A2 → x3A3 + x4A4 + x5A5 + x6A6 + x7A7 + x8A8 + x9A9

Balance atómico:

A1 A2 A3 A4 A5 A6 A7 A8 A9
Zn x1 − x3 − x7 = 0
H x2 − 2x4 − 2x5 − 4x6 − 4x7 = 0
N x2 − 2x3 − 2x6 − 2x7 − x8 − x9 = 0
O 3x2 − 6x3 − x4 − 3x6 − x8 − 2x9 = 0

Matriz aumentada:

1 0 −1 0 0 0 −1 0 0 0
 
0 1 0 −2 −2 −4 −4 0 0 0
0 1 −2 0 0 −2 −2 −1 −1 0
 
0 3 −6 −1 0 −3 0 −1 −2 0

Matriz escalonada:

 3 1 
1 0 0 0 −1 −4 −−8 − 0
 2 2 
0 1 0 0 −2 −10 −16 −4 −2 0
 3 1 
0 0 1 0 −1 −4 −77 − − 0
 2 2 
0 0 0 1 0 −3 −6 −2 −1 0
2.2 Matrices 67

Solución del sistema:


 x1  1 4 8 3 1
x  2  10  16  8  4
 2          
 x3  1 4 7 3 1
           
 x4  0 3 6 4 2 
x = x5 = α1 1 + α2 0 + α3 0 +α4 0 +α5  0 
          αi ∈  i = 1, 2, 3, 4, 5
           
 x6  0 1 0 0 0
x  0 0 1 0 0
 7          
 x8  0 0 0 2  0
           
 x9  0 0 0 0 2 
Una reacción balanceada, αi = 1, i = 1, 2, 3, 4, 5

17Zn + 40HNO3 → 16 Zn NO3 ( )2 + 15H 2O + H 2 + NH 4 NO3 + Zn(NH 2 )2 + 2NO + 2NO2


La solución vectorial significa que la ecuación química planteada es el resultado de integrar
las cinco reacciones siguientes, que se obtienen haciendo cada parámetro uno y los demás ceros:
1. (
Zn + 2HNO3 → Zn NO3 2 + H 2 )
2. (
4Zn + 10HNO3 → 4Zn NO3 2 + 3H 2O + NH 4 NO3 )
3. (
8Zn + 16HNO3 → 7Zn NO3 2 + 6H 2O + Zn NH 2 2 ) ( )
4. (
3Zn + 8HNO3 → 3Zn NO3 2 + 4H 2O + 2NO )
5. Zn + 4HNO3 → Zn(NO3 )2 + 2H2 O + 2NO2
 i el tratamiento matemático corresponde o no con la realidad química es ya otro asunto
S
(Rincón y Garritz, obra citada).
6. Balancee la siguiente reacción (hipotética):7

PbS + Cu2S + HNO3 → Cu(NO3)2 + Pb(NO3)2 + NO + NO2 + H2O + S


 e observa que el plomo, el cobre y el hidrógeno van de un reactivo a un producto. Se pone a
S
las dos moléculas donde aparece el plomo a. Como la molécula Cu2S tiene dos átomos de
cobre y el producto Cu(NO3)2 sólo uno, el primer coeficiente es b y el segundo 2b. Análoga-
mente, para el HNO3 y H2O los coeficientes son 2c y c, respectivamente,
PbS + Cu2S + HNO3 → Cu(NO3)2 + Pb(NO3)2 + NO + NO2 + H2O + S
a b 2c 2b a c

Note que todo el azufre que sale de los reactivos va a dar a una sola molécula, por lo que le
toca a + b. Para el resto de los compuestos utilizamos las letras del alfabeto d y e.

PbS + Cu2S + HNO3 → Cu(NO3)2 + Pb(NO3)2 + NO + NO2 + H2O + S


a b 2c 2b a d e c a + b

Como ya quedaron balanceados el Pb, Cu, S e H, para el sistema de ecuaciones, sólo resta
revisar el nitrógeno y el oxígeno.

Pb: a = a Como se observa, las ecuaciones que deben


Cu: 2b = 2b tomarse en cuenta son las que corresponden al
S: a+b= a+b nitrógeno y al oxígeno.
H: 2c = 2c
N: 2c = 4b + 2a + d + e
O: 6c = 12b + 6a + d + 2e + c

7 Algunos químicos dicen que cada molécula de S tiene 8 átomos, por lo que la reacción debería tener S8. En ese caso, basta multiplicar
cada coeficiente de la reacción balanceada, excepto el del azufre, por 8.
68 Unidad 2  Sistemas de ecuaciones lineales, matrices y determinantes

Se ordena el sistema

2a + 4b − 2c + d + e = 0 que escrito en forma de matriz queda


6a + 12b − 5c + d + 2e = 0

 3 1
2 4 −2 1 1 1 2 0 − − 
≈ 2 2
 
6 12 −5 1 2  0 0 1 −2 −1 

Observe que a y c quedaron como variables delanteras y b, d y e como variables libres, que se
convierten en parámetros. Sean b = r, d = s, e = t.
El conjunto solución es

3 1   a   −2  3   1 
a = −2 r + s + t
2 2          
 b   1   0  0 
b= r  1 1 
s = x x =  c  = r  0  + s  4  + t  2  , r, s, t ∈ 
c= 2s + t      2   2   
 d   0 2  0 
d= s e   0  0 2 
         
e= t

La solución general es

Para que la solución general represente la reacción química planteada es necesario que todos
los coeficientes de los parámetros sean no negativos; por lo tanto, deben satisfacer la desigualdad
3 3t t
ss+ s++− 2 r−− > 0 > 0, de donde 3s + t > 4r. Se puede escoger r = 1 y s = t = 2, y la solución particular
>2 r02r
2 22 2
que resulta es

de donde
PbS + Cu2S + HNO3 → Cu(NO3)2 + Pb(NO3)2 + NO + NO2 + H2O + S
a b 2c 2b a d e c a + b
2 1 12 2 2 2 2 6 3

que escrita en forma de reacción química es la siguiente:


2PbS + Cu2S + 12HNO3 → 2Cu(NO3)2 + 2Pb(NO3)2 + 2NO + 2NO2 + 6H2O + 3S
Verifique que la reacción está balanceada.
La misma reacción resuelta con el método largo:
PbS + Cu2S + HNO3 → Cu(NO3)2 + Pb(NO3)2 + NO + NO2 + H2O + S
2.2 Matrices 69

Se pasa directamente a la matriz:

Ph: 1 0 0 0 −1 0 0 0 0
Cu: 0 2 0 −1 0 0 0 0 0 

S: 1 1 0 0 0 0 0 0 −11 
 
H: 0 0 1 0 0 0 0 −2 0 
N: 0 0 1 −2 −2 −1 −1 0 0
 
O: 0 0 3 −6 −6 −1 −2 −1 0 

Se lleva a la forma de escalón reducido:

1 1 3
 0 0 0 0 0 − −2 
4 4
 
0 1 3
1 0 0 0 0 − 1
 4 4 
0 0 1 0 0 0 0 −2 0
 
≈  1 3 
0 0 0 1 0 0 − 2
 2 2 
0 1 3
0 0 0 1 0 − −2 
 4 4 
 1 1 
0 0 0 0 0 1 − 0
 2 2 

El conjunto solución es  .

Con objeto de tener coeficientes de los parámetros con números positivos se deben satisfacer
las siguientes desigualdades:

r 3s Es evidente de la cuarta desigualdad que s > r, y como el denomi-


− + 2t > 0
4 4 nador de las primeras dos es 4, se escogen para s y r múltiplos de
4. Sea s = 8 y r = 4.
r 3s
− + −t > 0 Para la primera desigualdad queda 1 − 6 + 2t > 0, y por lo tanto,
4 4
r 3s 5
− + −t > 0 t> , la segunda −1 + 6 – t > 0; por lo tanto, t < 5, y entonces
2 2 2
r s 5
− + >0 < t < 5, con lo cual t puede ser 3 o 4. Para la tercera desigualdad se ve que
2 2 2 −2 + 12 – t > 0; por lo tanto, t < 10.
70 Unidad 2  Sistemas de ecuaciones lineales, matrices y determinantes

Se puede escoger r = 4, s = 8 y t = 3, con lo que


 1 −3  2   1 − 6 + 6  1 
         
 −1  3  −1  −1 + 6 − 3  2
 0  8  0  16 16 
         
−2  6  −2 −2 + 12 − 6  4
x =  1 + 2 −3 + 3  2  =  1 − 6 + 6 =  1 
         
−2  2  0   −2 + 4  2
 4  0  0   4  4
         
 0  4  0   8  8 
         
 0  0  1   3  3

1PbS + 2Cu2S + 16HNO3 → 4Cu(NO3)2 + 1Pb(NO3)2 + 2NO + 4NO2 + 8H2O + 3S


Otro balance posible se obtiene haciendo r = 4, s = 8 y t = 4:
3PbS + 1Cu2S + 16HNO3 → 2Cu(NO3)2 + 3Pb(NO3)2 + 2NO + 4NO2 + 8H2O + 4S
Compruebe que ambas reacciones están balanceadas.
En el proceso anterior se consideraron desigualdades estrictas. Si se considerara la posibilidad de
la igualdad en cada una, se obtienen tres ecuaciones distintas y la solución general resulta ser el
conjunto de combinaciones lineales de ellas.

r − 3s + 8t ≥ 0
− r + 3s − 4t ≥ 0
− r + 3s + 4t ≥ 0
s≥r

Por ejemplo, si s = r, s = 4t, haciendo t = 1 y r = s = 4 el sistema queda:

a   1 −3  8   0
b   −1  3 −4  4
         
c   0  8  0 32
         
d  −2  6 −8  8
 
x = e = 4  1 + 4 −3 + 1 8  =  0 , que simplificando representa la reacción
         
f −2  2  0  0
g  4  0  0 16 
         
h   0  4  0 16 
i   0  0  4  4
         

0
1
 
8
 
2
x = 0 Cu2S + 8HNO3 → 2Cu(NO3)2 + 4NO2 + 4H2O + S
 
0
4
 
4
1
 
Análogamente se obtienen las dos restantes.
2.3  Análisis dimensional 71

2.3  Análisis dimensional


Dimensión
En el mundo físico es común realizar mediciones de:
a) Lo largo de un oleoducto.
b) La cantidad de varilla para una construcción.
c) El tiempo de vida de una lámpara.
d) La temperatura en una ciudad en un momento dado.
e) La corriente eléctrica que circula en una red eléctrica.
f) La intensidad luminosa emitida por los faros de un automóvil.
g) Las moles de un compuesto químico.
h) Los metros cúbicos de agua suministrados a una casa habitación durante un mes.
i) La densidad de una sustancia.
j) La viscosidad de un líquido.
k) Los metros cuadrados de construcción.
l) El calor específico de una sustancia.
m) La conductividad calorífica de un metal.

Cada una de ellas requiere de instrumentos específicos de medición. A continuación se listan:


longitud (L), masa (M), tiempo (T), temperatura (θ), corriente eléctrica (I), intensidad luminosa
(J) y cantidad de una sustancia (N), conocidas como dimensiones básicas o fundamentales.
En la tabla siguiente se resume lo expuesto: en la primera columna está la magnitud; en la
segunda, su dimensión; en la tercera, la unidad de medida en el Sistema Internacional de Unida-
des (SI) y en la cuarta, el símbolo de la unidad.8

Magnitud Dimensión Unidad (SI) Símbolo de la unidad


Longitud L metro m
Masa M kilogramo kg
Tiempo T segundo s
Temperatura termodinámica θ kelvin K
Corriente eléctrica I ampere A
Intensidad luminosa J candela cd
Cantidad de una sustancia N mol mol

Estas dimensiones pueden combinarse para generar las unidades derivadas, de las cuales son
ejemplos las siguientes:

Magnitud Dimensión Unidad (SI)


Área L2 m2
Volumen L3 m3
Densidad M/ L3 /
kg m3
Viscosidad M/LT kg/ms
Calor específico L2/T2θ m2/s2K
Conductividad calorífica ML/T3θ kgm/s3K

El análisis dimensional es un ejemplo de la utilización de métodos matemáticos para obtener


soluciones al problema de determinar si una variable interviene o no en un experimento, sin hacer

8 Lanomenclatura utilizada en este apartado se apega al uso generalizado de la literatura científica, que no siempre coincide con la
norma oficial mexicana.
72 Unidad 2  Sistemas de ecuaciones lineales, matrices y determinantes

experimentos; esto se logra a través de una función, que se denota por [ ] y que, aplicada a una
variable física, muestra sus dimensiones. Por ejemplo, si µ denota la viscosidad de un líquido, sus
dimensiones son [µ] = M/LT = ML−1T−1.
El siguiente ejemplo muestra algunas de las propiedades de la función [ ]:
De la física se sabe que la velocidad de un móvil tiene la forma v = v0 + at expresión que debe
ser dimensionalmente consistente para que la suma sea posible: [v] = [v0] = L/T, [a] = L/T 2 y [t] =
T. Como se dijo, las dimensiones del término at tienen que ser las mismas de v0, es decir:
[at] = L/T = [a][t] = (L/T 2)T, análogamente, [v0 + at] = [v0] = [at]
Si se divide v entre v0, la cantidad resultante no tiene dimensiones. Cuando esto sucede se dice
que la variable v/v0 es adimensional. Al aplicar la función [ ] se tiene [v/v0] = (L/T)/(L/T) = L0T0 =
(LT)0 = 1.

Definición 2.3.1
Sea VF = {v; v es una variable física}
∀ v, w ∈ VF

1. vw = v   w v / w = v  /  w . En particular, si [v] = [ w] entonces [v / w] = 1.

2. v  =  w ⇒ v ± w = v  .

En particular, ([v] = 1 ∧ [ w] = 1) ⇒ ([vw] = 1 ∧ [v ⁄w ]= 1 ∧ [v ± w] = 1 ) .


La ecuación v = v0 + at relaciona v con v0 y at, pero existen fenómenos donde no se conoce
una relación entre las variables relevantes asociadas con ellos. El análisis dimensional proporcio-
na una manera de encontrar alguna relación entre ellas.
Si se desea plantear alguna relación entre un grupo de variables con otras en un fenómeno, apli-
cando la propiedad 2, se verifica que en muchos casos es posible escribir una relación entre las varia-
bles de un fenómeno en la forma
f (x1, x2,…, xn) = g (y1, y2,…, ym),
f (x1, x2 ,, xn )
en donde =1
g ( y1, y2 , , ym )
Note que como
f (x1, x2 , , xn )
=1
g ( y1, y2 , , ym )
el cociente es adimensional.
Para encontrar estas relaciones se dispone de varios métodos, pero aquí se tratarán dos:
el de Rayleigh y el de Buckingham, íntimamente ligados con la teoría de los sistemas de
ecuaciones lineales.
A continuación se ilustran ambos métodos considerando el siguiente problema.
Suponga que hay una esfera lisa de diámetro (D) dentro de un líquido en movimiento.
Se desea hallar una relación entre la fuerza de arrastre (F) que el fluido ejerce sobre la esfera,
sabiendo que éste tiene densidad (ρ), viscosidad (µ) y velocidad (v).

Método de Rayleigh
1. Identifique las dimensiones de las variables:

Magnitud Dimensión
Fuerza MLT−2
Diámetro L
Velocidad LT−1
Densidad ML−3
Viscosidad ML−1T−1
2.3  Análisis dimensional 73

2. Se propone el siguiente modelo: expresar una de las variables como el producto de potencias
de las otras, cuyos exponentes deben determinarse.

F = cv x1 ρ x2 D x3 µ x4, donde c es una constante.

3. Ecuación dimensional: [ F ] = cv x 1 ρ x 2 D x 3 µ x 4 


 

( ) (L−3M) (L)x3 (L−1MT−1 )


x1 x2 x4
LMT−2 = LT−1
LMT −2 = Lx1 T − x1 L−3x2 M x2 Lx3 L− x4 M x4 T − x4
LMT −2 = Lx1 −3x2 + x3 − x4 M x2 + x4 T − x1 − x4

4. Sistema de ecuaciones que resulta de igualar los exponentes de cada dimensión:

L : x1 − 3x2 + x3 − x4 = 1
M: x2 + x4 = 1
T : − x1 − x4 = −2

5. Matriz aumentada del sistema:

 1 −3 1 −1 1
 
 0 1 0 1 1
 − 1 0 0 −1 −2 
 

6. Aplicando el método de Gauss-Jordan:

 1 −3 1 −1 1  1 0 0 1 2
   
 0 1 0 1 1 ≈  0 1 0 1 1
 −1
 0 0 −1 − 2  0 0 1 1 2

La solución es x1 = 2 − α x2 = 1 − α x3 = 2 − α x4 = α α ∈

7. Se sustituyen los valores hallados en F = cv


x1
ρ x2 D x3 µ x4 y se agrupan las variables con el mismo
exponente:

F = cv 2 − α ρ1− α D2 − α µα
F = cv 2 ρ1D2 v −α ρ −α D −α µα
α
 µ 
∴ F = cv 2 ρD2 
 vρD 

El término es el recíproco de un número adimensional conocido como número de Rey-


nolds, lo que sugiere el cambio de variable α = 2 − β, de lo cual resulta la expresión equivalente

F = c  .

Los pasos 3, 4 y 5 se pueden simplificar usando una tabla que en su primera columna tiene las
dimensiones y en su primer renglón las variables. Los exponentes de las dimensiones de cada
variable son los coeficientes de la matriz aumentada del sistema. La última columna son los tér-
74 Unidad 2  Sistemas de ecuaciones lineales, matrices y determinantes

minos independientes que corresponden a los exponentes de las dimensiones de la variable que se
despejó.
v ρ D µ F
L 1 −3 1 −1 1
M 0 1 0 1 1
T −1 0 0 −1 −2

Método de Buckingham
1. Se propone el siguiente modelo: igualar el producto de potencias de todas las variables con
una constante adimensional.

v x1 ρ x2 D x3 F x4 µ x5 = c
2. Construir con el modelo una tabla como la del ejemplo anterior.

v ρ D F µ
L 1 −3 1 1 −1 0
M 0 1 0 1 1 0
T −1 0 0 −2 −1 0

 1 −3 1 1 −1 0
 
∴  0 1 0 1 1 0
−1 0 0 −2 −1 0
 

3. Aplicar el método de Gauss-Jordan.

1 −3 1 1 −1 0 1 0 0 2 1 0
   
0 1 0 1 1 0 ≈ 0 1 0 1 1 0
0 −3 1 −1 −2 0 0 0 1 2 1 0

 x1  −2 −1
x   −1 −1
 2     x x x x x
Solución: x3  = α −2 + β −1 v 1 ρ 2 D 3 F 4 µ 5 = c
     
x4   1  0
x5   0  1

La ecuación resultante queda en función de dos grupos adimensionales:


−α β
 v 2 ρD 2   µ 
c = F   
   vρD 

Si α = −1 y β = 2 − λ, entonces
λ
µ 2  vρD  µ2
F=C   , o bien F = C φ (Re)
ρ µ  ρ
A pesar de que, aparentemente, las soluciones obtenidas en cada método no coinciden, se
puede comprobar que son equivalentes al observar que los dos parámetros del segundo método
suelen relacionarse de manera conveniente.
En resumen, sean B = {v1, v2,…, vn} un conjunto de variables que describen un fenómeno
físico y D = {D1, D2,…, Dk} un conjunto de dimensiones básicas para ellas.
2.3  Análisis dimensional 75

( )
x n
1. Ecuación que relaciona las variables: c = ∏ vi i ,
i =1
k a
v j  = ∏ Di i j
  i =1
k
0
2. Análisis de dimensiones: c  = ∏ Di
i =1

xj
n
( )xi  = i∏= j  i∏=1Di i j 
n k a
 ∏ vi
i =1 
n
k
∑ ai j x j k n
∏ Di j =1 = ∏ Di0 son iguales si ∑ ai j x j = 0, i = 1, 2,, k
i =1 i =1 j =1

3. Se construye una tabla con k + 1 renglones y n + 2 columnas. En la columna uno se colocan


los elementos de A y en el primer renglón los elementos de B. Debajo de cada variable se
escriben los exponentes de sus dimensiones.

v1 v2  vj  vn

D1 a11 a12  a1 j  a1n 0

D2 a21 a22  a2 j  a2 n 0

       

Di ai1 ai 2  ai j  ai n 0

       

Dk ak1 ak 2  ak j  ak n 0

4. La solución al sistema es:

x1  e11  e12  e1m 


       
x2  = α e21  + α e22  + α e2 m 
m donde m = n − r, y r es el rango de la matriz.
   
1
  2
 
       
xn  en1  en 2  enm 

La solución de esta ecuación homogénea es la solución al problema de análisis dimensio-


nal. El número de grados de libertad del sistema, m = n − r, donde r es el rango de la matriz,
es el número de grupos adimensionales básicos que se obtienen.
El producto de grupos adimensionales es:

Recuerde que el producto y el cociente de grupos adimensionales es un grupo adimensional.

Ejemplo 2.3.1

Se ha encontrado que la caída de presión (ΔP) en una tubería es una función del diámetro (D),
rugosidad de la pared (ε) y longitud (l) del tubo, y de la densidad (ρ), velocidad (v) y viscosidad
(µ) del líquido. Se desea determinar una expresión que relacione la caída de presión con el resto
de las variables.
2.3  Análisis dimensional
76 Unidad 2  Sistemas de ecuaciones lineales, matrices y determinantes

Solución
Dimensiones de cada variable:

Magnitud Símbolo Dimensión(es)


Velocidad v LT−1
Caída de presión ΔP ML−1T−2
Densidad ρ ML−3
Viscosidad µ ML−1T−1
Diámetro D L
Longitud l L
Rugosidad ε L

1. Ecuación que relaciona las variables:

v x1 ∆P x2 ρ x3 µ x4 D x5 l x6 ε x7 = π
2. Tabla de dimensiones:

v ΔP ρ µ D l ε
L 1 −1 −3 −1 1 1 1 0
M 0 1 1 1 0 0 0 0
T −1 −2 0 −1 0 0 0 0

1 0 −2 0 1 1 1 0
 
0 1 1 0 −1 −1 −1 0
0 0 0 1 1 1 1 0

3. Solución del sistema de ecuaciones:

 x1   2 −1 −1 −1


x  −1  1  1  1
 2        
x3   1  0  0  0
         
x4  = r  0 + s −1 + t −1 + u −1
x5   0  1  0  0
         
x6   0  0  1  0
x   0  0  0  1
 7        

α1 α2 α3 α4
 v2 ρ   ∆PD   ∆Pl   ∆Pε 
   µv   µv   µv  =π
 ∆P 

Cada uno de los términos entre paréntesis corresponde a un grupo adimensional (las opera-
ciones de suma, resta, producto y cociente de grupos adimensionales es un grupo adimensional),
los cuales se denotan con la letra π.

v2 ρ ∆PD ∆Pl ∆Pε


π1 = , π2 = , π3 = , π4 =
∆P µv µv µv
1 ∆P 1 1 µ π l π ε
= , = = , 3 = , 4 =
π 1 v 2 ρ π 1π 2 v 2 ρ ∆PD vρD π 2 D π 2 D
∆P µv
2.3  Análisis dimensional 77

Por último,
α β γ
 µ   l  ε
∆P = kv 2 ρ  ,
 vρD   D   D 
donde k, α, β y γ son constantes que se determinan experimentalmente.

Ejemplo 2.3.2
Considere la transferencia de masa que resulta cuando un fluido fluye sobre una superficie sólida.
Las variables que contribuyen a la transferencia global se muestran en la tabla siguiente:

Dimensiones de cada variable


Magnitud Símbolo Dimensiones
Velocidad v LT−1
Viscosidad µ ML−1T−1
Densidad ρ ML−3
Difusividad de masa D L2T−1
Coeficiente de transferencia de masa k LT−1
Longitud característica l L

1. Ecuación v
x1
µ x2 ρ x3 D x4 k x5 l x6 = π

v µ ρ D kc l
L 1 −1 −3 2 1 1 0
M 0 1 1 0 0 0 0
T −1 −1 0 −1 0 0 0

1 0 0 0 −1 −1 0
 
0 1 0 1 1 1 0
0 0 1 −1 −1 −1 0

2. Solución del sistema de ecuaciones:

 x1   0 −1  1
x  −1  0 −1
 2      
x3   1  0  1
  = r  + s  + t 
x4   1  0  0
x5   0  1  0
       
x6   0  0  1

3. Sustitución en la ecuación v
x1
µ x2 ρ x3 D x4 k x5 l x6 = π :
α α3
 ρD  1  k α2  vρl 
π = α     
 µ  v  µ 
Los grupos adimensionales obtenidos son:

ρD k vρl π 2π 3 kl
π1 = , π2 = , π3 = y =
µ v µ π1 D
78 Unidad 2  Sistemas de ecuaciones lineales, matrices y determinantes

Los grupos adimensionales se conocen como:

Grupo adimensional Símbolo Nombre

ρD
Sc Schmidt
µ

vρl
Re Reynolds
µ

kl Sh Sherwood
D

Ejercicios 2.3

1. Balancee las siguientes ecuaciones químicas hipotéticas usando el método algebraico.

a) P2I4 + P4 + H2O −→ PH4I + H3PO4 l ) Cl2 + KOH −→ KCl + KClO3 + H2O
b) KOH + H2SO4 + H2O −→ KHSO4 m) Ba(OH)2 + HCl + H2O −→ BaCl2
c) FeI2 + HIO3 + HCl −→ FeCl3 + I2 + H2O n) K2Cr2O7 + CH3CH2OH + H2SO4 −→
d) Na2Cr2O7 + NaI + HCl −→ CrCl3 + I2 + Cr2(SO4)3 + CH3COOH + K2SO4 + H2O
H2O + NaCl o) KClO3 + HCl −→ KCl + H2O + Cl2 + ClO2
e) HCl + KMnO4 −→ Cl2 + KCl + MnCl2 + p) C + O2 −→ CO + CO2
H2O q) C2H4 + HCl −→ C2H6 + C5H5Cl + C2H4Cl
f ) CaF2 + H2SO4 −→ CaSO4 + HF r) C3H8 + O2 −→ H2O + C + CO + CO2
g) FeS + O2 −→ Fe2O3 + SO2 s) As2S5 + HNO3 −→ H3AsO4 + H2SO4 +
h) K2Cr2O7 + H2O + S −→ SO2 + KOH + Cr2O3 H2O + NO + NO2
i) CaC2O4 + KMnO4 + H2SO4 −→ CaSO4 + t) NaBrO + H2O2 −→ NaBr + O2 + H2O
MnSO4 + K2SO4 + CO2 + H2O u) Cu + HNO3 −→ Cu(NO3)2 + NO2 + NO +
j) CuSCN + KIO3 + HCl + O2 −→ CuSO4 + H2O
ICN + KCl + H2O v) CH3CH2CH3 + O2 −→ C + CO2 + CO +
k) PbCrO4 + KI + HCl −→ PbCl2 + Crl3 + KCl H2O
+ I2 + H2O
2. Con la información que se da en cada ejercicio, encuentre los exponentes y los grupos adimen-
sionales correspondientes:

a) v x1 ρ x2 Lx3 F x4 µ x5 = π

Magnitud Símbolo Dimensiones


Fuerza F /
M LT2
Velocidad v /
LT
Densidad ρ /
M L3
Viscosidad µ M/LT
Longitud L L

b) v x1 D x2 ρ x3 ∆P x4 Lx5 ε x6 µ x7 = π

Magnitud Símbolo Dimensiones


Caída de presión ΔP ML T2 /
Velocidad V /
LT
2.3  Análisis dimensional 79

Magnitud Símbolo Dimensiones


Diámetro de la tubería D L
Longitud de la tubería L L
Rugosidad de la tubería ε L
Viscosidad del fluido µ /
M LT
Densidad del fluido ρ /
M L3

c) D x1 k x2 µ x3 v x4 ρ x5 C p x6 h x7 = π

Magnitud Símbolo Dimensiones


Coeficiente de transferencia de calor H /
Q TL2θ
Velocidad V LT /
Diámetro del tubo D L
Conductividad térmica del fluido k /
Q LTθ
Capacidad calorífica del fluido Cp Q/Mθ
Viscosidad del fluido µ M/LT
Densidad del fluido ρ M/L3

d) LxAB
1
µ x 2 k x 3 g x 4 β x 5 C px 6 ρ x 7 ∆T x 8 h x 9 = π

Magnitud Símbolo Dimensiones


Coeficiente de transferencia de calor H /
Q TL2θ
Longitud significativa L L
Densidad ρ /
M L3
Viscosidad del fluido µ M/LT
Conductividad térmica del fluido K Q/LTθ
Capacidad calorífica del fluido Cp Q/Mθ
Coeficiente de expansión térmica β 1/θ
Diferencia de temperaturas ∆T θ
Aceleración gravitacional G L T2/

x1 x 2
e) DAB ρ D x 3 kcx 4 v x 5 µ x 6 = π

Magnitud Símbolo Dimensiones


Coeficiente de transferencia de masa kc /
LT
Velocidad del fluido V L/T
Diámetro del tubo D L
Difusividad del fluido DAB L2 T/
Viscosidad del fluido µ /
M LT
Densidad del fluido ρ M/ L3
80 Unidad 2  Sistemas de ecuaciones lineales, matrices y determinantes

L µ kc ρ ( g∆ρ a ) 6 = π
x1 x 2 x 3 x 4 x5 x
f ) DAB

Magnitud Símbolo Dimensiones


Coeficiente de transferencia de masa kc LT /
Longitud característica L L
Difusividad del fluido DAB L2 T /
Viscosidad del fluido µ M LT /
Densidad del fluido ρ M L3 /
Fuerza de flotación g ∆ρa /
M L2T2

2.4 Determinantes
Existe una función9 det: Mn × n (R) → R que asocia a cada matriz cuadrada un número que se
llama su determinante; se denota como det(A); |A|; D(A); Δ; ...… y es la única que tiene las siguientes
propiedades:

 A1 
  
 
 Ai 
 
Sea A =    la matriz escrita según sus renglones. Entonces,
 Aj 
 
  
A 
 n

 A1   A1 
     
   
 kAi   Ai 
   
1. det    = k det    (La función determinante saca escalares de cada renglón.)
 Aj   Aj 
   
     
A  A 
 n  n

 A1   A1   A1 
        
     
 Ai + Bi   Ai   Bi 
     
2. det    = det    + det    (La función determinante abre sumas en cada renglón.)
 Aj   Aj   Aj 
     
        
 A  A  A 
 n   n  n

9 La teoría de la función determinante, su existencia y unicidad, se desarrolla en el apéndice 2 correspondiente.


2.4 Determinantes 81

 A1   A1 
     
   
 Aj   Ai 
   
3. det    = −det    (La función determinante es alternante.)
 Ai   Aj 
   
     
A  A 
 n  n

 e1  1  0  0  0
 
 
 ei  0  1  0  0
 
4. det    =  = 1 (El determinante de la matriz idéntica es uno.)
e j  0  0  1  0
 
 
e  0  0  0  1
 n

La información anterior se resume diciendo que la función determinante es la única n-lineal,


alternante y que valuada en la identidad es uno.

Consecuencias
 A1 
  
 
 Ai 
 
1. det    = 0 (Si una matriz tiene dos renglones iguales, su determinante vale cero.)
 Ai 
 
  
A 
 n

 A1   A1 
     
   
 Ai + kAj   Ai 
   
2. det    = det    (El determinante de una matriz no se altera si a un renglón se le
 Aj   Aj  suma cualquier múltiplo de otro.)
   
     
 An  A 
  n

Por lo tanto,
3. El determinante de una matriz vale cero si un renglón es combinación lineal10 de los demás.
4. det(A) = det(At ). En consecuencia, todo lo que se afirma para los renglones, resulta válido
para las columnas, y recíprocamente (ver más adelante).
Un corolario importante de las propiedades anteriores es lo que se conoce como regla de
Cramer.

10Sea β = {A1, A2, …, An} una colección de columnas. Una columna B es combinación lineal de β si y sólo si existen coeficientes
k1, k2, …, kn, tales que B = k1A1 + k2A2 + ⋅⋅⋅ + knAn.
82 Unidad 2  Sistemas de ecuaciones lineales, matrices y determinantes

Sea
a11x1 +  + a1n xn = k1
  
an1x1 +  + ann xn = kn

Un sistema de ecuaciones lineales n × n y Δ el determinante de la matriz del sistema:


a11 a12  a1n
∆=   
an1 an 2  ann

Al multiplicar la primera columna por x1:

a11x1 a12  a1n


∆x1 =   
an1x1 an 2  ann

Al sumar a la primera columna múltiplos de las otras (el determinante no se altera):

a11x1 + a12 x2 +  + a1n xn a12  a1n k1 a12  a1n


∆x1 =    =    = ∆1
an1x1 + an 2 x2 +  + ann xn an 2  ann kn an 2  ann

Observe que ∆1 se obtuvo sustituyendo la primera columna de la matriz del siste-


Gabriel Cramer (1704-1752).
Matemático suizo y profesor de la
ma por los términos independientes. En forma análoga, se pueden desarrollar los
Universidad de Ginebra. En 1750 determinantes ∆ 2 ,..., ∆ n ; por lo tanto, para cada i = 1,, n se obtiene la igualdad
publicó su regla en el libro Introduc- ∆xi = ∆i y si ∆ ≠ 0 resulta
tion à l'analyse des lignes courbes
algébriques. ∆i
xi =

que es lo que se conoce como la regla de Cramer, la cual asegura que si el determinante de la
matriz del sistema es diferente de cero, el sistema tiene solución única y se obtiene aplicando las
fórmulas anteriores.

Cálculo de determinantes
Para aplicar la regla de Cramer, así como para otros cálculos, es indispensable conocer el valor del
determinante de una matriz cuadrada. A continuación se describe uno de los métodos que se uti-
lizan para estos efectos, denominado desarrollo por cofactores.
Dada la matriz

 a11 a12  a1n 


 
A=    
 
an1 an 2  ann 

se define el cofactor del elemento aij como Cij = (−1)i + j Mij , en donde Mij es el determinante de la
submatriz que se obtiene de la matriz A eliminando el renglón i y la columna j, y se llama el menor ij.
El cálculo del determinante de la matriz A puede realizarse de la manera siguiente:

Al desarrollar por el i-ésimo renglón: det (A) = ai1Ci1 + ai 2Ci 2 +  + ainCin .


2.4 Determinantes 83

Al desarrollar por la j-ésima columna: det (A) = a1 jC1 j + a2 jC2 j +  + anjC nj .

Se puede demostrar que ambos desarrollos coinciden y que son independientes de la i y de la


j; es decir, el desarrollo puede hacerse por cualquier renglón o columna. Se recomienda elegir el
renglón o columna que tenga más ceros.
Observe que el método anterior está basado en un argumento inductivo. Presupone que se
conoce la manera de calcular determinantes de matrices m × m con m = n − 1, y la inducción
comienza con el cálculo de los determinantes de las matrices 2 × 2 (que se suponen conocidos).

a11 a12
= a11a22 − a21a12
a21 a22

Ejemplo 2.4.1

 −1 2 0 −3 
 2 −2 −1 − 4 
Calcular el determinante de la matriz A =  .
 4 −1 1 3
 
 3 1 2 5

De acuerdo con la sugerencia anterior, se selecciona el renglón 1 para hacer el desarrollo por
cofactores.
Los menores son:

−2 −1 −4 2 −1 − 4
M11 = −1 1 3 = 6 M12 = 4 1 3 = −11
1 2 5 3 2 5

2 −2 − 4 2 −2 −1
M13 = 4 −1 3 = −22 M14 = 4 −1 1 = −3
3 1 5 3 1 2

por lo que los cofactores resultan:

C11 = 6   C12 = 11   C13 = −22   C14 = 3

det (A) = (−1)(6) + 2 (11) + 0 (−22) − 3(3) = 7

Al desarrollar ahora el determinante por la tercera columna:

 −1 2 0 −3 
 2 −2 −1 −4 
A= 
 4 −1 1 3 
 
 3 1 2 5
det (A) = 0 (−22) − 1(35) + 1(−62) + 2 (52) = 7

Un método alternativo consiste en obtener una matriz triangular superior por medio de
operaciones elementales y, utilizando las propiedades de los determinantes, calcular la forma en
que se van modificando los de las matrices equivalentes. El valor del determinante final se obtie-
ne multiplicando los elementos de la diagonal principal, lo que corresponde al desarrollo por
cofactores de la matriz triangular.
84 Unidad 2  Sistemas de ecuaciones lineales, matrices y determinantes

Por ejemplo,

−1 2 0 − 3 −1 2 0 −3 −1 0 2 −3
2 −2 −1 − 4 0 2 −1 −10 0 −1 2 −10
= =−
4 −1 1 3 0 7 1 −9 0 1 7 −9
3 1 2 5 0 7 2 −4 0 2 7 −4
−1 0 2 −3
−1 0 2 −3 −1 0 2 −3
0 −1 2 −10
0 −1 2 −10 0 −1 2 −10
− =− =− 0 0 9 −19 = 7
0 1 7 −9 0 0 9 −19
7
0 2 7 −4 0 0 11 −24 0 0 0 −
9

Note que en el segundo paso, en el que se intercambiaron columnas, se puso un signo menos,
ya que el determinante cambia de signo cuando esto pasa. En los otros pasos se sumó el múltiplo
de un renglón al que se desea modificar. Esta operación no altera el resultado del determinante.
En algunos libros de nivel intermedio (álgebra de licenciatura) se menciona la regla de Sarrus
para calcular determinantes de matrices 3 × 3, lo que no es un método diferente, sino un artificio
visual para simplificar el desarrollo por cofactores. Consiste en repetir los dos primeros renglones
abajo del tercero (o las dos primeras columnas a la derecha de la matriz) y sumar los productos de las
diagonales (en forma análoga a los determinantes 2 × 2); como se muestra en el siguiente ejemplo:

Pierre Frédéric Sarrus (1798-1861). 2 −2 1 −


Matemático francés cuya celebridad 2 −2 1 3 4 2
entre los estudiantes de matemáticas
se debe a la regla de cálculo de 3 4 2 → −1 1 2 = 35
determinantes de matrices de 3 × 3 −1 1 2 2 −2 1
que lleva su nombre: regla de Sarrus.
3 4 2 +

Ejercicios 2.4

1. Calcule los siguientes determinantes

1 2 3 4
2 1 2
5 6 7 8
i)  −1 1 1   ii) 
9 10 11 12
2 −1 3
−1 0 π 2

2. Sean A y B las matrices

 2 1 2  1 2 3
A = −1 1 1    B =  4 5 6
 
   
 2 −1 3  7 8 0

Compruebe que el determinante del producto AB de las matrices es igual al producto de


sus determinantes.
3. Demuestre que el determinante de una matriz triangular es igual al producto de los elementos
de su diagonal.
4. Resuelva el siguiente sistema de ecuaciones utilizando la regla de Cramer.

x + 2y − z = 3
3y − 2z = 2
z=2
 85

Sistema
3.1  El sistema de los números reales
Unidad
•  Axiomas de campo
•  Algunas propiedades de campo de los números reales
•  Axiomas de orden
•  Subsistemas de los números reales
•  Axioma de completez
•  Algunas representaciones de los números reales
3.2  Números complejos
•  El modelo de Gauss y la inmersión de  en 

s numér
•  La conjugación
•  La norma
•  La ecuación general de segundo grado
•  Sistemas de ecuaciones
•  Representación geométrica de los números complejos
•  Raíces n-ésimas de un número complejo
•  El argumento de un número complejo
•  La función exponencial compleja
•  Representación geométrica de algunas rectas bajo la  
transformación E
•  La función logaritmo
•  Las funciones trigonométricas

icos
86 Unidad 3  Sistemas numéricos

3.1  El sistema de los números reales


Se presenta una breve discusión acerca de uno de los conjuntos más importantes de las matemá-
ticas: el sistema de los números reales. Una gran parte de las matemáticas se construye sobre las
propiedades de los números reales y su discusión se realiza aquí, a través de un método axiomáti-
co, a diferencia de los cursos elementales, en donde usualmente se adopta un enfoque intuitivo de
este sistema. A pesar de que al principio de la discusión se requiere una cierta capacidad de abs-
tracción, su desarrollo permitirá adquirir nociones más concretas en torno al uso, representación
e interpretación geométrica de los números reales.
El sistema de los números reales se denota por  y consiste en un conjunto de objetos primi-
tivos a, b, c, ..., que contiene al menos dos elementos. En él están definidas dos operaciones (rela-
ciones primitivas), llamadas adición y multiplicación, representadas por los signos “+” y “·”, res-
pectivamente, que cumplen con un conjunto de axiomas que pueden separarse, de manera natural,
en tres partes:
i) Axiomas y propiedades de campo (adición y multiplicación).
ii) Axiomas y propiedades de orden.
iii) Axioma de Dedekind o propiedad de ser completos o completez.
Para una presentación fluida, estos axiomas se consideran por separado.

Axiomas de campo
Las leyes que gobiernan las operaciones adición y multiplicación en el conjunto de los números reales
se llaman propiedades de campo, y en general todo conjunto que las satisfaga se denomina campo.

Axioma 3.1.1
Leyes conmutativas
∀ a, b ∈ 
a+b=b+a
a·b=b· a

Axioma 3.1.2
Leyes asociativas
∀ a, b, c ∈ 
a + (b + c ) = (a + b) + c

Axioma 3.1.3
Leyes distributivas
∀ a, b, c ∈ 

(a + b) · c = a · c + b · c

Axioma 3.1.4
Elementos idénticos
∃ 0, 1 ∈ , 0 ≠ 1, tales que ∀a ∈ 
a+0=a =0+a
3.1  El sistema de los números reales 87

Axioma 3.1.5
Elementos inversos
∀a, b ∈ , con b ≠ 0 ∃ x, y ∈  tales que
a+x =0=x+a
b · y =1= y · b
x y y se denotan por −a y b −1 , respectivamente.

Ya que en virtud de tales axiomas a + (b + c) = (a + b) + c, la expresión a + b + c se puede uti-


lizar sin ambigüedad alguna.
Análogamente, la notación a . b . c se puede usar para representar ya sea a . (b . c) o (a . b) . c.
En este sentido, cuando se suman cuatro números reales a, b, c y d existe una situación similar;
por ejemplo, si se considera
(a + b) + (c + d )
a + [(b + c ) + d ]
[(a + b) + c] + d

es posible demostrar que, sin importar cómo se asocien los números, se obtendrá siempre el mis-
mo resultado, por lo que usualmente se escribe:
a+b+c+d
en lugar de alguna de las expresiones anteriores. Esta observación puede hacerse aun para sumas
de cualquier número de sumandos. Una demostración general de este hecho requiere del método de
inducción matemática, que será discutido posteriormente. Existe una situación análoga en el caso
de la multiplicación, en donde la expresión
a.b.….n
se emplea para denotar el producto de cualquier cantidad de factores.
Con el propósito de simplificar aún más la notación, se puede omitir el signo “ . ”, en los casos
en que no se complique la interpretación, lo que permite escribir “ab” en lugar de “a . b”.
Adicionalmente, la notación a(b), (a)b o (a)(b) también se empleará para denotar el producto
a . b. Análogamente, para la multiplicación de más de dos elementos, cualquiera de las expresio-
nes a(bc), (ab)c o abc podrá usarse en lugar de a . b . c.
En los casos en donde intervienen simultáneamente la adición y la multiplicación de números
reales, estas operaciones se deben jerarquizar de modo tal que todas las multiplicaciones se reali-
cen antes que las sumas. Debe hacerse notar que los paréntesis se usan para representar números
únicos, de manera que las operaciones que estén dentro de ellos deberán realizarse primero.
El elemento 0 del axioma 3.1.4 se denomina el idéntico aditivo o cero. El elemento 1 es el idén-
tico multiplicativo o uno. Estos elementos idénticos son los únicos que satisfacen las propiedades
que les confiere el axioma 3.1.4.
El número real —a del axioma 3.1.5— se llama el inverso aditivo de a o negativo de a, mientras
que el inverso multiplicativo b−1 de un número real b, distinto de cero, se llama el recíproco de b.
El principio de sustitución de la lógica matemática, aplicado a las operaciones de adición y
multiplicación, establece que, al ser a, b, c y d números reales:
a = c ∧ b = d ↔ a + b = c + d ∧ ab = cd

En particular, si a = c, es correcto escribir a + b = c + b y ab = cb.


Por conveniencia, algunas veces se refiere uno a estas manipulaciones diciendo: “agregando b
a ambos lados de la igualdad a = c” o “multiplicando ambos lados por b”.
Las consideraciones anteriores hacen ver que la formulación de algunas de las propiedades de
las operaciones (que se expusieron con objeto de agilizar el desarrollo de la teoría) resultan redun-
dantes. Por ejemplo, la ley de la distribución por la derecha se puede obtener a partir de las pro-
piedades de campo.
88 Unidad 3  Sistemas numéricos

En efecto, como la multiplicación es conmutativa, se puede escribir


(b + c) a = a (b + c)
Por la ley de la distribución por la izquierda
a (b + c ) = ab + ac
o bien (b + c) a = ab + ac
y aplicando otra vez la conmutatividad ab = ba
y ac = ca
se obtiene finalmente (b + c) a = ba + ca
que es lo que queríamos demostrar.
Los siguientes ejemplos ilustran los desarrollos que pueden llevarse a cabo usando las propie-
dades de campo. En ellos, todas las letras minúsculas representan números reales.

Ejemplo 3.1.1
Pruebe que
(a + b) + (c + d ) = (a + d ) + (c + b)
Solución
(a + b) + (c + d ) = a + [b + (c + d )] (ley asociativa)
= a + [(b + c ) + d ] (ley asociativa)
= a + [d + (b + c )] (ley conmutativa)
= (a + d ) + (b + c ) (ley asociativa)
= (a + d ) + (c + b) (ley conmutativa)

Ejemplo 3.1.2
Pruebe que
(a + b) + (− a ) = b
Solución
(a + b) + (−a) = (−a) + (a + b) (ley conmutativa)
= (−a + a ) + b (ley asociativa)
= 0 + b (elemento inverso)
= b (elemento idéntico)

Ejemplo 3.1.3
Demuestre que si a y b son no nulos:
(ab)(a −1b −1 ) = 1
Solución
En virtud de que a y b son no nulos, por el axioma 3.1.5 existen los recíprocos a−1 y b−1. Entonces
es posible escribir
(ab)(a −1b −1 ) = (ba)(a −1b −1 ) (ley conmutativa)
= (ba ) a −1 b −1 (ley asociativa)
(
= b aa b
−1
) −1
(ley asociativa)
= [b · 1]b
−1
(elemento inverso)
−1
= bb (elemento idéntico)
= 1 (elemento inverso)
3.1  El sistema de los números reales 89

Ejemplo 3.1.4
Pruebe que (a + b)(c + d ) = ac + ad + bc + bd
Solución
(a + b)(c + d ) = a (c + d ) + b (c + d ) (ley distributiva por la derecha)
= ( ac + ad ) + ( bc + bd ) (ley distributiva por la izquierda)
= ac + ad + bc + bd 

Algunas propiedades de campo de los números reales


En esta sección se presentan teoremas básicos de los números reales. En un principio se expresará
la razón que justifique cada paso de una demostración, refiriéndola a un axioma específico, un
teorema o una definición que se haya empleado. Posteriormente se espera que las referencias invo-
lucradas en cada razonamiento puedan ser identificadas.

  Teorema 3.1.1
Ley de la cancelación para la adición.
Sean a, b, c ∈ 
a+c =b+c ⇒ a =b

Demostración
Suponga que a+c =b+c
Por el axioma 3.1.5, el número real c tiene un inverso aditivo, el número real –c. Al sumar –c
en ambos lados de la igualdad dada se tiene
(a + c) + ( −c ) = (b + c) + ( −c )
Ahora
(a + c) + ( −c ) = a + [c + ( −c )] (ley asociativa)
= a+ 0 (elemento inverso)
=a (elemento idéntico)
y, siguiendo exactamente los mismos pasos:
(b + c) + ( −c ) = b
Entonces a=b
De la ley conmutativa se sigue
c+a =c+b ⇒ a =b
y también que a+c =c+b ⇒ a =b

  Teorema 3.1.2
∀ a, ∈ , .

Demostración
(elemento idéntico)
= a· 0 +a · 0 (ley distributiva)
También

(elemento idéntico)
90 Unidad 3  Sistemas numéricos

Entonces

(ley de cancelación de la adición)
(ley conmutativa)

  Teorema 3.1.3
1 ≠ 0 .

Demostración
Se hará una demostración por reducción al absurdo.
De esta manera, suponga que
1= 0
Si a es cualquier elemento de los números reales, entonces
(elemento idéntico)
(1 = 0 por hipótesis)
= 0 (teorema 3.1.2)
Por lo tanto,  consta solamente del cero, lo que contradice el hecho de que el conjunto
de los reales contiene más de un elemento. Entonces la suposición original es falsa y conse-
cuentemente
1≠ 0

  Teorema 3.1.4
0 no tiene un inverso multiplicativo.

Demostración
Para todo a ∈ :
y 0 ≠ 1
Por lo tanto, 0 no tiene inverso multiplicativo (por el axioma 3.1.5, es el único número
real que no lo tiene).

En general, por el axioma 3.1.5, todo número real a tiene un inverso aditivo, llamado –a. El
siguiente teorema muestra que sólo hay un inverso aditivo para un elemento de .

  Teorema 3.1.5
Cada número real tiene un único inverso aditivo.

Demostración
Sea −x un inverso aditivo de x. Entonces, si x + y = 0 sumando −x a ambos lados se obtiene:

− x + (x + y) = − x + 0
3.1  El sistema de los números reales 91

Además
− x + (x + y) = (− x + x ) + y (ley asociativa)
=0+ y (elemento inverso)
=y (elemento idéntico)

y también

−x + 0 = −x (elemento idéntico)

Entonces
y = −x

Corolario 1 0 = −0

Demostración
Como
0+0 =0
del teorema 3.1.5 se verifica que
0 = −0

Corolario 2 ∀ a ∈ , −(−a ) = a

Demostración
(− a ) + a = 0
el inverso de –a, que es –(–a), es a.

  Teorema 3.1.6
Cada número real, distinto de cero, tiene un único inverso multiplicativo.

Demostración
Sea x ≠ 0, x−1 un inverso multiplicativo y suponga que xy = 1.
Por demostrar y = x−1
de xy = 1 se obtiene, multiplicando ambos lados por x−1,
x −1 (x y) = x −1 (1) ,  (x −1x) y = x −1 ,  1( y) = x −1

∴ y = x −1
92 Unidad 3  Sistemas numéricos

En el ejemplo 3.1.3 se demostró que


(ab)(a −1b −1 ) = 1
para cualesquiera números reales no nulos a y b. Al aplicar el teorema 3.1.6 con
x = ab ∧ y = a −1b −1
se obtiene el siguiente resultado:
a −1b −1 = (ab)−1

  Teorema 3.1.7
Regla de los signos

∀ a, b ∈ , (−a)b = −(ab); a(−b) = −(ab).

Demostración

Se mostrará que (−a)b + ab = 0


(−a)b + ab = (−a + a)b = 0b = 0
lo que demuestra que (−a)b es el inverso aditivo de ab, como se quería demostrar.
a (−b) = −(ab)
y se sigue de la ley conmutativa.

Corolario 1 ∀ a, b ∈ ; (−a )(−b) = ab

Demostración
(−a)(−b) = −[a (−b)] (teorema 3.1.7)
= − −(ab)
= ab (corolario 1)

Como un caso especial del corolario 3.1.3 se observa que

Asimismo, a partir del teorema 3.1.7 y del hecho de que

se obtiene la siguiente regla:


(−1) a = −a
La operación de sustracción en los números reales se define de la siguiente manera:
3.1  El sistema de los números reales 93

Definición 3.1.1
Definición de sustracción
Sean a, b ∈ .
La expresión a−b
se lee “a menos b” y se define como
a + (−b).

  Teorema 3.1.8
∀ a, b, c ∈ ; a (b − c ) = ab − ac .

Demostración

a (b − c ) = a[b + (−c )]
= ab + a (−c )
= ab + −(ac )
= ab − ac

Es posible establecer otras reglas para la sustracción. En el siguiente ejemplo se describe una de
ellas.

Ejemplo 3.1.5

Demuestre que ∀ a, b ∈ ; −(a + b) = −a − b


Solución

−(a + b) = (−1)(a + b)
= (−1) a + (−1)b
= − a + ( −b )
= −a − b 

Definición 3.1.2
Definición de división
Sean a, b ∈  y b ≠ 0.
La expresión a / b
se puede leer “a entre b”, “cociente de a entre b”, “a sobre b” o “fracción de a sobre b”, y se
define como

ab−1

Esta operación de división se puede expresar en distintas formas, entre ellas


a
a ÷ b, , b a , a : b
b
en donde a y b se conocen como numerador y denominador o dividendo y divisor.
94 Unidad 3  Sistemas numéricos

La definición de división permite escribir los inversos multiplicativos de otra forma; específi-
camente, si b ≠ 0, entonces

Por lo tanto, se puede escribir

Es importante notar que como el número real cero no tiene inverso multiplicativo, la expresión
a / 0
no está definida; esto es, en los números reales no es posible dividir entre cero.
El siguiente teorema contiene algunas propiedades de la división.

 Teorema 3.1.9
Sean a, b, c, d ∈  con b ≠ 0 y d ≠ 0. Entonces
1.
2.
3.
4. 

Las propiedades 1 y 4 se demuestran a continuación. Como ejercicio, se deja a usted que


demuestre las otras dos.

1.
(
= (ac ) b −1d −1 )
= (ac )(bd )
−1

2.
= a (1)b −1 + c (1) d −1
( ) (
= a d d −1 b −1 + c bb −1 d −1 )
(
= (ad ) b d −1 −1
) + (bc)(b −1d −1)
= (ad + bc )(bd )
−1

El método de demostración dado para la propiedad 4 del teorema 3.1.9 recurre al uso de un
común denominador bd para las dos fracciones.

  Teorema 3.1.10
a, b ∈  ∧ ab = 0 ⇒ a = 0 ∨ b = 0 

Demostración
Suponga que ab = 0
Si a = 0, no hay más por demostrar.
Si a≠0
existe a−1

y es posible escribir a−1(ab) = a−1 . 0 = 0


3.1  El sistema de los números reales 95

Sin embargo, a−1(ab) = (a−1a)b = 1 . b = b

Entonces b=0

Por lo tanto, si ab = 0

es necesario que a=0 ∨ b=0

Axiomas de orden
Este postulado permite hacer referencia a algunos números reales como positivos y a otros como
negativos. Se usa también para definir las relaciones mayor que, menor que, máximos, mínimos,
cotas superiores e inferiores, ínfimo y supremo en el conjunto .

Axioma
Axioma de orden
El conjunto de los números reales contiene un subconjunto llamado conjunto de los reales
positivos. Se representa como + y posee las siguientes propiedades:
i) a, b ∈ + ⇒ a + b ∈ + ∧ ab ∈ + (cerradura bajo sumas y productos)
ii) si a ∈ , entonces una y sólo una de las siguientes proposiciones es cierta:
a = 0 ∨ a ∈ + ∨ −a ∈ + (ley de tricotomía)

Los números reales no nulos que no están en + se llaman números reales negativos.
La colección de números reales negativos se denotará por −. El conjunto + es no vacío,
como puede verse en el siguiente teorema.

  Teorema 3.1.11
a ∈  ∧ a ≠ 0 ⇒ a 2 ∈ +.

Demostración
Si a ≠ 0, entonces, por el axioma de orden, a ∈ + ∨ −a ∈ +.
Si a ∈ +, como + es cerrado con respecto a la multiplicación, se tiene que a . a = a2 ∈ +.
Por otra parte, si −a ∈ +, por el corolario 1, (−a)(−a) = a . a = a2, o bien (−a)(−a) ∈ +.
En ambos casos se tiene a2 ∈ +.
En resumen, ∀a ∈ , a ≠ 0 → a2 ∈ +.

Sean a, b ∈ . Considere a − b.
Por el axioma de orden, sólo una de las siguientes proposiciones es cierta: Nota
2 +
1 ≠ 0 ∴ 1 = 1 ∈  . Además,
a − b = 0, a − b ∈ + o −(a − b) ∈ +. + +
k ∈  → 1 + k ∈  . Por lo tanto,
Cuando a − b ∈ +, se dice que b es menor que a y se escribe b < a. todo número natural distinto de cero
es un real positivo.

Definición 3.1.3
Si a, b ∈ , entonces b ≤ a si b = a o b < a.

Esta definición determina una relación de orden lineal en ; b está relacionado con a si y sólo
si b ≤ a.
96 Unidad 3  Sistemas numéricos

Definición 3.1.4
Si a, b ∈ , entonces a ≥ b ↔ b ≤ a.

Mediante el uso de la relación de orden, la ley de tricotomía quedaría así: Para todos a, b ∈
, una y sólo una de las siguientes proposiciones es cierta:
a = b, a > b, a < b
La conexión entre el axioma de orden y las definiciones de mayor que y menor que se confirma
aún más mediante el siguiente teorema.

  Teorema 3.1.12
Sea a ∈ . Entonces a ∈ + si y sólo si a > 0; −a ∈ + si y sólo si a < 0.

Demostración
Si a∈
se puede escribir a = a + 0 = a + (−0) = a − 0
Por lo tanto, a ∈ + ⇔ a − 0 ∈ +
Entonces, por la definición de mayor que,
a ∈ R+ ⇔ a > 0
Análogamente, para demostrar la segunda parte del teorema se escribe
−a = 0 −a
Entonces, − a ∈ + ⇔ a < 0
resultado que puede obtenerse de la definición de menor que.

En otras palabras, el resultado anterior indica que un número real es positivo si y sólo si es
mayor que cero, y es negativo si y sólo si es menor que cero. También nótese que, por el teorema
3.1.11, para cada número real a no nulo se tiene que a2 > 0.
Podemos utilizar el teorema 3.1.12 para enunciar alternativamente el axioma de orden en la
siguiente forma.

  Teorema 3.1.13
1. Si a, b ∈ , son tales que a > 0 ∧ b > 0, entonces a + b > 0 ∧ ab > 0.
2. Si a ∈ , entonces una y sólo una de las siguientes proposiciones es cierta: a = 0, a > 0 o a < 0.

Las relaciones “>” y “<” permiten obtener diversos resultados. Las reglas que se dan en el
siguiente teorema son importantes para nuestro trabajo posterior.

 Teorema  3.1.14
Sean a, b, c ∈ .
1. a > b ∧ b > c ⇒ a > c 3.  a > b ∧ c > 0 ⇒ ac > bc
2. a > b ⇒ a + c > b + c 4.  a > b ∧ c < 0 ⇒ ac < bc 
3.1  El sistema de los números reales 97

Demostración
1. Si a > b ∧ b > c, entonces, por la definición de mayor que:
a − b ∈ + ∧ b − c ∈ +
Como + es cerrado con respecto a la adición,
(a − b) + (b − c) ∈ +
Entonces, a − c ∈ +
lo cual, por definición, quiere decir que
a>c
Esto significa que la relación “>” es transitiva.
2. Sea a>b
Entonces las siguientes proposiciones son ciertas:
a − b ∈ + (definición de mayor que)
(a − b) + 0 ∈ + (elemento idéntico)
(a − b) + (c − c) ∈ 
+
(elemento inverso)
(a + c) − (b + c) ∈ + (ley asociativa)
a + c > b + c (definición de mayor que)
El resto de la demostración se deja como ejercicio.

Los resultados que se obtienen para la relación “<” son análogos. Específicamente:

 Teorema 3.1.15
Sean a, b, c ∈ .
1. a < b ∧ b < c ⇒ a < c 3.  a < b ∧ c > 0 ⇒ ac < bc
2. a > b ⇒ a + c > b + c 4.  a < b ∧ c < 0 ⇒ ac > bc
La notación a>b>c
significa que a>b ∧ b>c
al mismo tiempo, y puede leerse b está entre a y c.
De manera similar, uno puede escribir
a<b<c<d
en donde el significado es ahora obvio. La notación
a≤b<c
significa a≤b ∧ b<c
mientras que a<b≤c
significa a<b ∧ b≤c

Se dice que dos números reales no nulos concuerdan en signo si y sólo si ambos son positivos
o ambos negativos. Por otra parte, difieren en signo si uno es positivo y el otro es negativo. El
siguiente resultado fundamental es una consecuencia del teorema 3.1.14.

  Teorema 3.1.16
Leyes de los signos
El producto y cociente de dos números reales no nulos son positivos si los dos números concuerdan
en el signo y son negativos si los dos números difieren en el signo.
Este teorema es consecuencia directa del teorema 3.1.7 y de la definición de menor que.
98 Unidad 3  Sistemas numéricos

Subsistemas de los números reales


Se han asignado ya símbolos especiales a algunos números reales, como son 0 y 1, a partir de los
cuales se definen algunos otros:
0 +1 = 1
1+1 = 2
2 +1 = 3
3 +1 = 4

Al seguir este procedimiento se obtiene el conjunto  de los naturales:
 = {0, 1, 2, 3, 4, …} ⊂ 
Como 1 es positivo (es el cuadrado de 1), k positivo implica que k + 1 es positivo y, por lo
tanto, el conjunto de los números naturales diferentes de cero * ⊂ + .

Los inversos aditivos 0, −1, −2, −3, … de los elementos en  se denotan como . El conjunto
 de los enteros se define como
 = ∪
+
Dado que 1 ∈  , como consecuencia del teorema 3.1.12 se tiene que 1 > 0. Así,
1 + 1 > 1 + 0, es decir, 2 > 1
Análogamente,
2+1>2
y al continuar de esta manera se observa que
0 < 1< 2 < 3 < 4 < 5 <
Del mismo modo, dado que a < b implica −a > −b, se tiene
0 > −1 > −2 > −3 > −4 > 
Al combinar ambas sucesiones resulta
 < −4 < −3 < −2 < −1 < 0 < 1 < 2 < 3 < 4 < 
Observe que 1 ≤ a para todo a ∈ * . Algunas veces se hace referencia a este hecho diciendo
que 1 es el menor entero positivo.
Dado que no todo entero tiene inverso multiplicativo en ,  no es un campo, aunque satis-
face todas las demás propiedades de campo.
Siempre es posible expresar un entero dado como un producto de otros enteros. Por ejemplo,
el entero 6 puede escribirse como 2 . 3, (−2)( −3), 1 . 6, (−1)( −6), (−1)(2)( −3), y así sucesivamente.
Los enteros 2, −2, 3, −3, 1, −1, 6 y −6, que aparecen en estos productos, se llaman factores o divi-
sores de 6, como se indica en la siguiente definición.

Definición 3.1.5
Definición de factor o divisor
Si a, b ∈ , y si a = bc para algún c ∈ , entonces b es llamado un factor o divisor de a, y este
último se conoce como múltiplo de b (y también de c).

Todo entero a tiene factores a, −a, 1 y −1. A éstos se les denomina frecuentemente como fac-
tores triviales de a. Si existen otros factores se les llama factores no triviales. Para el entero 6, los
factores no triviales son 2, 3, −2 y −3.

Definición 3.1.6
Definición de número primo
Un entero no nulo p, diferente de 1 y −1, se llama primo o irreducible si y sólo si sus únicos
factores son triviales.
3.1  El sistema de los números reales 99

Observe que, de acuerdo con esta definición, 1 y −1 no se consideran como primos. Los pri-
meros primos positivos son 2, 3, 5, 7, 11, 13, 17 y 19.
Una de las razones de la importancia de los números primos radica en que todo entero posi-
tivo a > 1 se puede escribir de una y sólo una forma (excepto por el orden de los factores) como
un producto de primos positivos. Por ejemplo, se tiene 12 = 2 . 2 . 3, 126 = 2 . 3 . 3 . 7, 540 = 2 . 2 .
3 . 3 . 3 . 5. La demostración de este resultado, que se conoce como el teorema fundamental de la
aritmética, no se dará aquí. En la práctica, algunas veces es muy difícil encontrar la factorización
prima de un número dado. Sin embargo, tal factorización es siempre posible.
Como se ha observado, una característica de los enteros es la no existencia de los inversos
multiplicativos para la mayoría de sus elementos. Los únicos enteros invertibles, que se conocen
como unidades, son 1 y −1.
Con objeto de extender al conjunto de los enteros, de manera que en el nuevo conjunto todos
sus elementos no cero sean invertibles, se construye el conjunto  de los números racionales, que
por esta razón constituye un subcampo de los números reales.
Un número real se llama número racional si puede escribirse en la forma a / b, en donde a y b
son enteros y b ≠ 0. Para denotar el conjunto de todos los números racionales se emplea la letra .
El conjunto  es cerrado con respecto a la adición y a la multiplicación. Si el cociente a / b ≠ 0,
entonces a ≠ 0 y, por lo tanto, b / a ∈ .
Observe que (a / b)(b / a) = ab / ba = 1, lo que prueba que todo elemento distinto de cero tiene
inverso.
 es un campo y la demostración de esta afirmación se sugiere como ejercicio.
Como cada entero a puede escribirse como a = a / 1, resulta que  está inmerso en  (la defi-
nición de inmersión se da más adelante).
Puede demostrarse que no existe un número racional x tal que x2 = 2. Sin embargo, un núme-
ro real cuyo cuadrado es 2 existe y se denota por 2 . Existen muchos números reales que no son
racionales y se llaman números irracionales, entre ellos π, e, la raíz n-ésima de todo entero que no
sea entera, como 2 , 3 .
El sistema  contiene muchos más números irracionales que números racionales.
22
En ocasiones, para cálculos prácticos, π se aproxima con los números racionales 7 o 3.1416;
e con 2.718; 2 con 1.4142, ..., donde el número de cifras decimales queda determinado por el
grado de aproximación que el cálculo requiera.

Definición 3.1.7
Definición de valor absoluto
El valor absoluto |a| de un número real a se define como
i) a = a si a ≥ 0     ii) a = −a si a < 0

De esta definición se observa que el valor absoluto de todo número real no nulo
Aunque en español las palabras
es positivo, pues si a > 0, entonces |a| = a, que está en +. Si a < 0, entonces |a| = −a,
máximo y mínimo llevan acento, en
que también está en +. las abreviaturas max y min no se han
De manera equivalente se puede definir a = max{a, − a} lo que significa que el puesto intencionalmente para usar
valor absoluto de a es igual al mayor de a y −a. una notación uniforme con otros
textos.
Ejemplo 3.1.6
Encuentre |3|, |−3|, |0|, 2 −2| y |2− 2
Solución
Como 3, 0 y 2 − 2 son no negativos,

3 = 3, 0 = 0 y 2− 2 =2− 2

Por otro lado, −3 y 2 − 2 son negativos, y entonces

− 3 = −( −3) = 3 y 2 − 2 = −( 2 − 2 ) = 2 − 2 
100 Unidad 3  Sistemas numéricos

  Teorema 3.1.17
Para todo a, b ∈ :
1. a = − a     2. ab = a b     3. − a ≤ a ≤ a 

Demostración
La primera afirmación resulta obvia ya que:
a = max{a, − a} y −a = max{−a, a} .
La segunda, ab = a b , puede demostrarse revisando las diferentes posibilidades para a
y b. Note que si alguno de los dos es cero, el resultado es obvio, y los otros casos se ilustran
en la siguiente tabla.

Tabla 3.1  Diferentes posibilidades para a y b

a b ab |a| |b| |ab| |a||b|


+ + +  a  b  ab  ab
+ − −  a −b −ab −ab
− + − −a  b −ab −ab
− − + −a −b  ab  ab

La demostración de la tercera afirmación se deja como ejercicio.

  Teorema 3.1.18
Si a, b ∈  y b > 0, entonces
1. |a| < b si y sólo si −b < a < b     3.  |a| = b si y sólo si a = b o a = −b
2. |a| > b si y sólo si a > b o a < −b

Demostración
Demostración de 1
⇒ Sea |a| < b. Del inciso 3 del teorema 3.1.17 se tiene que a ≤ |a| y, por lo tanto, a < b. Al
multiplicar ambos lados de |a| < b por −1 resulta que −b < −|a|. Nuevamente, del teorema
3.1.17, −|a| ≤ a, y entonces −b < a. Esto permite concluir que −b < a < b.
⇐ −b < a < b, donde b > 0. Si a es no negativo, entonces |a| = a, de donde |a| < b. Si a es
negativo, entonces ocurre que |a| = −a, como −b < a, −a < b, de donde se concluye otra vez
que |a| < b, por lo que en ambos casos |a| < b.

Las demostraciones de 2 y 3 se dejan como ejercicios.


El teorema 3.1.18 nos dice que |a| < b si y sólo si a está entre −b y b. Por ejemplo, |a| < 2 si y
sólo si −2 < a < 2.

Axioma de completez
Para caracterizar al sistema de los números reales se necesita un axioma, el de completez o teorema
de Dedekind,1 cuyo enunciado requiere de algunas definiciones preliminares.

1Cuando los números reales se construyen usando el método de cortaduras, el enunciado es un teorema, pero cuando se definen
axiomáticamente, tiene que ser un axioma.
3.1  El sistema de los números reales 101

Definición 3.1.8
Sea S un conjunto no vacío de números reales.
i) Un número real u es una cota superior de S si s ≤ u para todo s ∈ S.
ii) Un número real l es una cota inferior de S si l ≤ s para todo l ∈ S.
iii) Un número real u′ es la menor cota superior o supremo de S (sup S) si u′ es una cota supe-
rior de S y es menor o igual que cualquier otra cota superior de S. Es decir, una cota supe-
rior u′ es el supremo del conjunto S si y sólo si para cualquier número a menor que u′
existe un elemento del conjunto mayor que a, ya que a no es una cota superior.
iv) Un número real l ′ es la mayor cota inferior o ínfimo de S (inf S) si l ′ es una cota inferior de
S y es mayor o igual que cualquier otra cota inferior de S.

No siempre existen cotas superiores o inferiores para subconjuntos de . Sin embargo, está claro
que si u es una cota superior de S, entonces cualquier número mayor que u también es cota superior.
De la misma manera, cualquier número menor que una cota inferior también es cota inferior.
Por ejemplo, sea S = {−4 / 3, 3, 0, 2 / 9, −1 / 2, 7 / 5}. Cualquier número real u tal que u ≥ 3 es una
cota superior de S. En particular, 4, 17, π, 468, 3.001 y 3 son cotas superiores. También cualquier
número l tal que l ≤ −4 / 3 es una cota inferior de S. Observe que las cotas superiores e inferiores
de un conjunto S no tienen por qué pertenecer a S.
El conjunto * = {1, 2, 3, …} tiene muchas cotas inferiores. Entonces, 0, 2  / 2, 7 / 8, −5 y 1
son números menores o iguales a todos los números en *, conjunto que no tiene cotas superiores
como se probará más adelante.
En el conjunto S del ejemplo anterior se observan varias cotas superiores. Una de ellas, el núme-
ro 3, puede considerarse la “mejor” cota superior en el sentido de que es el menor número real entre
todas las cotas superiores. Análogamente, entre todas las cotas inferiores de S, −4 / 3 es la mayor. De
acuerdo con los incisos iii) y iv) de la definición 3.1.8 resulta, que 3 = sup S, −4 / 3 = inf S.

  Teorema 3.1.19
Para un conjunto, si un supremo o un ínfimo existen, son únicos.
Para demostrar este teorema, suponga que u′ y v′ son supremos del conjunto S. Una y sólo una de
las siguientes relaciones es cierta: u′ < v′, v′ < u′ o u′ = v′. Sin embargo, si u′ < v′, se tiene una contradic-
ción con el hecho de que v′ es la menor cota superior de S. De la misma manera, v′ < u′ contradice el
hecho de que u′ es la menor cota superior. Entonces, u′ = v′, lo cual demuestra que el conjunto sólo
puede tener un supremo. Análogamente, un conjunto puede tener a lo más un ínfimo. El inf ∗ es 1.

Ejemplo 3.1.7
Suponga a, b ∈ , con a < b, y sea
S = {x ∈  a < x < b} .
Demuestre que b es el sup S.
Solución
Como x < b para todo x ∈ S, el número b es una cota superior de S. Obviamente, cualquier núme-
ro real menor o igual que a no es cota superior. Para probar que b es el sup S considere cualquier
c+b c+b
número real c tal que a < c < b. Se puede probar entonces que c < < b. De esta manera,
2 2
está en S y es mayor que c; por lo tanto, c no es cota superior de S. Entonces, b es el sup S, dado
que es cota superior y que ningún elemento menor que él lo es.
Para demostrar que a es el inf S se puede emplear un argumento análogo.

Axioma 3.1.6
Axioma de completez (o teorema de Dedekind)
Sea S un conjunto no vacío de números reales. Si S tiene una cota superior, entonces tiene
supremo. Análogamente, si S tiene una cota inferior, tiene ínfimo.
102 Unidad 3  Sistemas numéricos

A un campo que satisface el axioma de orden y el de completez se le conoce como campo orde-
nado completo. Puede demostrarse que el sistema de los números reales  es el único campo 
ordenado completo.
Ejemplo 3.1.8
Demuestre que el conjunto  de los números naturales no tiene cotas superiores.
Solución
Se demuestra por reducción al absurdo. Suponga que  tiene una cota superior.
1
Entonces, por la propiedad de completez, existe el sup  (digamos u); entonces u − 2 no es una
1
cota superior, y por lo tanto existe un n0 ∈  tal que u − 1 < n0.2 Entonces ¡ u + 2 < (n0 + 1) ≤ u !,
2
( )
absurdo que demuestra el teorema.

Del ejemplo anterior se sigue que para todo número real x existe un entero positivo n tal que
n > x.

Propiedad arquimediana de los números reales


Dado un número arbitrariamente pequeño μ ∈ + y un número M ∈  tan grande como se quie-
ra, existe un número natural n0 tal que n0μ > M.

Demostración

El número Mµ es un número real y, por lo tanto, existe un natural n0 mayor que él, es decir,
M < n . Dado que la multiplicación por positivos no altera el sentido de las desigualdades,
µ 0
n0 µ > M .

Un corolario importante de la propiedad arquimediana es el hecho de que en  no existen los


infinitésimos.3
La propiedad de completez desempeña un papel muy importante en el estudio de los números
reales.
Por ejemplo, con ella se pueden demostrar los siguientes teoremas:
• Sea f : [a, b] →  una función continua tal que f (a) f (b) < 0. Entonces existe c ∈ (a, b) tal que
f (c) = 0. Este teorema afirma que no se puede pasar en forma continua de un semiplano al
otro sin cortar el borde (la recta no tiene hoyos).
• Para cada número real positivo a existe un número real x tal que x2 = a. De manera más
general, si a > 0 y n ∈ , entonces existe un único número real b > 0 tal que bn = a. Este
número b se llama raíz n-ésima de a.
• El conjunto de los números racionales es denso en el conjunto de los números reales; es decir,
entre cualesquiera dos números reales x y y existe un número racional.

Algunas representaciones de los números reales


Hasta este momento se ha trabajado para desarrollar un sistema de axiomas que caracterice a los
números reales, de tal manera que cualquier otra propiedad que tengan pueda deducirse de éstos.
Para continuar esta vertiente se procede a desarrollar:
i) las representaciones de los números reales y
ii) la interpretación geométrica de los números reales como puntos en una línea recta,
lo que no se hará de manera totalmente rigurosa; por el contrario, se hará hincapié en el trabajo
matemático que todo estudiante ha realizado previamente.

2 Ver la definición de supremo.


3 Un infinitésimo positivo puede definirse como un real positivo menor que –1n para toda n ∈ *. Este concepto fue empleado en los ini-
cios del cálculo diferencial. Por razones históricas, algunos libros de cálculo conservan el nombre (incorrecto) de cálculo infinitesimal.
3.1  El sistema de los números reales 103

Representación decimal de los números reales


Se asume familiaridad con el proceso de la división y con expresiones como:
1 1 1 9
= 0.1, = 0.01, = 0.001, = 9( 0.01) ,
10 100 1 000 100
y así sucesivamente. A una expresión de la forma 7.4934 se le llama decimal que termina y es igual al
número racional 7 493 / 1 000, que también puede interpretarse como la suma de 7, 0.4, 0.09 y 0.003.
Es posible preguntar ahora qué sentido puede darse a un número decimal que no termina, por ejem-
plo, una expresión de la forma 13.4637 = 13.4637637637 donde la línea superior en los números
y los puntos suspensivos indican que los dígitos 6, 3, 7 se repiten en ese orden un número infinito de
veces. Tal expresión se llama expresión periódica infinita. No es necesario decir que también existen
decimales infinitos no periódicos, donde tal repetición de dígitos no ocurre. Al trabajar con expresio-
nes de este tipo se pueden suprimir las terminaciones decimales infinitas usando la propiedad de
completez; específicamente, se puede estar de acuerdo en que un símbolo como 4.176429… (ya sea
periódico o no) es una notación para el supremo del siguiente conjunto de números reales:

{4, 4.1, 4.17, 4.176, 4.1764, …}

De manera incidental, un decimal que termina como 7.493, puede ser considerado también
como un decimal infinito, o sea 7.493000…, y también como 7.4929 . A expresiones como éstas
se les llama representaciones decimales de números reales. El término “decimal” se refiere a que
usa como base el número 10 y sus potencias. Esta representación, introducida por los árabes, es la
que más se emplea actualmente; sin embargo, desde la antigüedad se han utilizado diversas bases,
como la sexagesimal5 (base 60), vigesimal6 (base 20), y en la actualidad, con el desarrollo de la
informática, adquirieron relevancia la binaria (base 2), la octal (base 8) y la hexadecimal (base 16).
De los párrafos anteriores se sigue que toda expresión decimal, periódica o no, representa un
número real. En sentido inverso, es posible demostrar que todo número real tiene una representación
decimal. Para números racionales, esta representación se encuentra por medio de la división; por
ejemplo, cuando se divide 7 434 entre 2 310 se obtiene 3.218 . Se puede demostrar que la represen-
tación decimal de todo número racional es periódica y recíprocamente toda representación decimal
periódica es un número racional. Las representaciones decimales que no son periódicas correspon-
den a números irracionales y se pueden aproximar mediante procedimientos como los aprendidos en
aritmética para extraer raíces cuadradas o algunas otras maneras de aproximación sucesiva.
Se dispone de recursos numéricos para denotar números reales cuyo mayor empleo se tiene
en el trabajo con problemas de aplicación de la matemática en las ciencias. Los números reales se
pueden definir como el conjunto de todas las posibles expresiones decimales infinitas; sin embargo,
en este caso existe el problema (no resuelto hasta ahora) de definir la igualdad, la adición y la multi-
plicación de tales expresiones, por lo que la demostración de las propiedades de los números reales
requiere de otro tipo de representación (como la axiomática o la de cortaduras de Dedekind).

Interpretación geométrica de los números


reales como puntos en una línea recta
Es posible asociar el conjunto de los números reales  con los puntos sobre una línea recta l de
tal manera que a cada número real a corresponda uno y sólo un punto, e inversamente, a cada
punto P en l le corresponda precisamente un número real. Tal asociación entre dos conjuntos se
conoce como una correspondencia uno a uno, que se inicia seleccionando un punto arbitrario O
en l, llamado el origen a quien se asocia el número real 0; posteriormente se escoge cualquier otro
punto P1 y se asocia con el número real 1. El segmento lineal OP1 de O a P1 se dice que tiene lon-
gitud unitaria. A cada número real a le corresponde el punto de la recta que está situado a la dis-

4 7,493 según la Norma Oficial Mexicana, aunque el uso del punto decimal (que también está autorizado) es más frecuente que
el de la coma.
5 Que sobrevive en la geometría (medidas angulares) y en la medición del tiempo (minutos y segundos).
6 Representación usada por los mayas.
104 Unidad 3  Sistemas numéricos

l P-3 P-2 P-1 O P1 P2 P3 tancia a del origen y, recíprocamente, a cada punto le corresponde
el número real que marca su distancia. La construcción geométrica7
-3 -2 -1 0 1 2 3
de algunos de esos puntos se puede continuar marcando segmentos
sucesivos de longitud unitaria a lo largo de l a partir de P1, con lo
Figura 3.1  Correspondencia entre el conjunto de
que se obtienen los puntos P2, P3, …, los que se asocian con los nú-
los enteros y puntos en l.
meros enteros 2, 3, …, respectivamente. Este proceso corresponde
a la operación algebraica de sumar 1 consigo mismo muchas veces.
De la misma forma, trabajando sobre l en el lado opuesto se localizan los puntos P−1, P−2, …, que
corresponden a los enteros negativos −1, −2, …. La figura 3.1 ilustra la correspondencia que existe
entre el conjunto de los enteros y ciertos puntos en l.
Cada segmento lineal en l se puede subdividir en n partes iguales, para cualquier entero positivo
n, trazando una diagonal a partir del cero y marcando en ella n segmentos de igual dimensión, de
manera que el origen del primero coincida con el cero. Se traza una recta desde el final del último
punto con el que corresponde al uno. La intersección de las paralelas desde cada punto de los ex-
tremos de los n segmentos con el segmento OP1 define la división deseada. Si el segmento OP1 se
subdivide de esta forma, el punto final de la primera subdivisión corresponde al número racional
1 / n, y contando un número m de dichos segmentos podemos asociar un punto en l con cualquier
número racional positivo m / n, que equivale con la multiplicación m(1 / n). Entonces, el punto corres-
pondiente a 13 / 5 está a 13 / 5 de unidades del origen (o a 3 / 5 del punto
(1, 1) P 2 en el segmento P2P3). Los números racionales negativos se manejan
en forma análoga. De todo punto que se localice geométricamente en
√2
l 1 la recta l, de la manera anterior, se dirá que se ha construido.
Es posible determinar ciertos puntos en l asociados con números
-1 0 1 √2 2 3
irracionales; por ejemplo, el punto que corresponde con 2 se puede
Figura 3.2  Trazo geométrico de la raíz de 2.
construir trazando un arco de circunferencia con centro en 0 y que
pase por el punto (1, 1), como se indica en la figura 3.2.
En general, se puede construir geométricamente la raíz cuadrada
de cualquier número real positivo que se haya construido previamente, como se
ilustra a continuación:
Sea a un número real positivo ya construido.
Marque en la recta un segmento AM de longitud a y otro MB de longitud 1,
A B
a M 1 determine el punto medio del segmento AB y, haciendo centro en él, trace una cir-
cunferencia de diámetro (a + 1) (figura 3.3).
Por el punto M trace una perpendicular al diámetro AB y llame C al punto de
intersección de esta perpendicular con la circunferencia.
Los triángulos AMC y CMB son rectángulos (CM ⊥ AB). El triángulo ACB
Figura 3.3  Primer paso en la cons- también es rectángulo, ya que el ángulo C interseca un diámetro de la circunferen-
trucción de la raíz de a. cia en la que está inscrito (figura 3.4).

C CC CC

A B AA BB AA BB
a M 1 aa MM 1 1 aa MM 1 1

Figura 3.4  Segundo paso en la Figura 3.5  Tercer paso en la construcción de la raíz de a.
construcción de la raíz de a.

7 Se dice que un punto se puede construir geométricamente (es constructible) si y sólo si puede dibujarse utilizando sólo regla y

compás.
3.1  El sistema de los números reales
3.1  El sistema de los números reales 105

Por lo tanto, los triángulos AMC y CMB son semejantes, de donde las longitudes C
de sus lados correspondientes son proporcionales.
AM CM
Razón por la cual = . x
CM CM
a x
Dado que MB = 1, AM = a y CM = x resulta que = , de donde CM = x es la A B
x 1 a M 1
raíz cuadrada de a (figuras 3.6 y 3.7).
No todos los puntos que correspondan a números irracionales se pueden cons-
truir. El número π = 3.1415927… es irracional, pero su construcción es imposible;
sin embargo, la posición de este o de cualquier otro número irracional en l puede
aproximarse teóricamente con tanta precisión como se quiera. Por ejemplo, los pun-
tos correspondientes a los números 3, 3.1, 3.14, 3.141, 3.1415, … que aproximan π, se Figura 3.6  Semejanza de los
pueden situar de manera sucesiva. triángulos involucrados.
Es posible demostrar que a cada número irracional le corresponde un punto úni-
C
co en l, e inversamente, a cada punto que no esté asociado con un número racional le
corresponde un número irracional.
El estudio de los números constructibles (C 0 ) se remonta a la época en que Pla- √a
tón y sus discípulos (aproximadamente 300 años antes de nuestra era) plantearon
lo que se conoce como los tres problemas clásicos de la geometría: la trisección del A B
ángulo, la duplicación del cubo y la cuadratura del círculo, que consisten en: a M 1

i) dado un ángulo cualquiera, construir dos rayos que lo dividan en tres ángulos
congruentes (de igual medida),
ii) dado un cubo regular (su arista), construir otro cuyo volumen sea el doble del
primero, Figura 3.7  Raíz cuadrada de a.
iii) construir el lado de un cuadrado cuya área sea igual a la de un círculo dado,
en donde, por supuesto, las construcciones deben hacerse utilizando únicamente un compás y una
regla no graduada (sin marcas).
La solución de cada uno de los problemas anteriores requiere de la determinación, con regla y
compás, de números inconstructibles y, por lo tanto, no es posible resolverlos. La demostración de
la insolubilidad de estos problemas se basa en argumentos del álgebra abstracta, esencialmente en
los trabajos de Galois, cuyos teoremas permiten diferenciar completamente los números construc-
tibles de los no constructibles. La demostración de estos resultados no se presenta aquí porque
no corresponde al nivel en el que están escritas estas notas y, simplemente, como un “breviario
cultural”, se apuntan los siguientes hechos:
1. Cero es constructible: 0 ∈C 0.
2. La suma de constructibles es constructible: a, b ∈C 0 ⇒ (a + b) ∈C 0.
3. El inverso aditivo de todo número constructible es constructible: a ∈C 0 ⇒ − a ∈C 0 .
La suma de números reales (los constructibles lo son) es conmutativa; por lo tanto, C 0 es
un grupo abeliano.
4. 1 es constructible: 1 ∈C 0 .
5. El producto de números constructibles es constructible: a, b ∈C 0 ⇒ ab ∈C 0.
6. El inverso multiplicativo de todo número constructible diferente de cero es constructible:
a ∈C 0 , a ≠ 0 ⇒ a −1 ∈C 0 .
La multiplicación de números reales es conmutativa y se distribuye sobre la suma; por lo
tanto, C 0 es un subcampo de los números reales.
7. Se puede demostrar que un número real es constructible si y sólo si está en una extensión de
ℚ de grado alguna potencia de 2.
El coseno de 20° es raíz de la ecuación 8x3 + 6x − 1 = 0 y la raíz cúbica de 2 satisface x3 − 2 = 0,
que son ecuaciones con coeficientes enteros, por lo que, aplicando el método de la división sintética,
se puede comprobar que ninguna tiene raíces racionales, lo que implica que son irreducibles en ℚ(x).
Si se pudieran factorizar, tendrían necesariamente un factor de primer grado y, por lo tanto, una raíz
racional; es decir, tanto cos 20° como 3 2 están en extensiones de ℚ de grado 3. π es trascendente. Lo
anterior demuestra que cos 20°, 3 2 y π son inconstructibles y que, por lo tanto, no se puede trisecar
el ángulo de 60°, duplicar el cubo unitario, ni cuadrar el círculo de radio uno.
106 Unidad 3  Sistemas numéricos

Todo número x que esté asociado con un punto X en l es la coordenada de X, y a X se le llama


la gráfica de x. Esta asociación se denomina sistema de coordenadas para l, y l se conoce como una
línea coordenada y se representa generalmente como una línea horizontal, tomando los números
reales positivos como coordenadas de puntos a la derecha de O y los números reales negativos
como coordenadas de puntos a la izquierda de O. De tal manera, es posible asignar una dirección
a l, tomando como dirección positiva a lo largo de l aquella en la que las coordenadas crecen y
como dirección negativa aquella en la que decrecen. La dirección positiva se denota colocando una
punta de flecha en l, como se muestra en la figura 3.2. En caso de que las coordenadas estén asig-
nadas de esta manera, es evidente que si los números reales a y b son coordenadas de los puntos
A y B, respectivamente, entonces a < b si y sólo si B está a la derecha de A.
Si se desea describir geométricamente al conjunto
S = {x ∈  | a < x < b}

A B la porción de l que corresponda a los puntos entre A y B se remarca, como se observa


( ) en la figura 3.8. El paréntesis en la figura indica que los puntos correspondientes a a
y b no se incluyen; en caso de que se quiera incluir a A o B, se emplearán corchetes
a b
en lugar de paréntesis.
Figura 3.8  Intervalo (a, b). El conjunto S se llama un intervalo abierto de a a b y se denota por el símbolo
(a, b),8 de manera que el conjunto de puntos en l entre A y B se denominará gráfica
de (a, b); asimismo, los intervalos cerrados se denotarán por [a, b] y los intervalos semiabiertos por
los símbolos [a, b) y (a, b], los cuales se definen de la manera siguiente:
[ a, b ] = {x ∈  | a ≤ x ≤ b}
[ a, b ) = {x ∈  | a ≤ x < b}
( a, b ] = {x ∈  | a < x ≤ b}

Sus gráficas se presentan en la figura 3.9.

A A A B B BA A A B B BA A A B B B
[ [ [ ] ] ][
    [ [ ) ) (
)   
( ( ] ] ]
a a a b b ba a a b b ba a a b b b

Figura 3.9  Representación de intervalos cerrados y semiabiertos.

Ocasionalmente se considerarán los siguientes conjuntos de puntos en l no acotados:

( a, ∞ ) = {x ∈  | x > a}
[ a, ∞ ) = {x ∈  | x ≥ a}
( −∞, a ) = {x ∈  | x < a}
( −∞, a ] = {x ∈  | x ≤ a}
( −∞, ∞ ) = 
( El símbolo ∞, que se lee infinito, es solamente un artificio de notación y nunca debe inter-
a
pretarse como la representación de un número real.9 La figura 3.10 presenta una parte de la
gráfica de (a, ∞), donde la flecha indica que la gráfica continúa indefinidamente hacia la dere-
Figura 3.10  Intervalo
cha, en virtud de que no es posible dibujar la gráfica completa.
(a, ∞).
Finalmente, es posible asignar valores numéricos a los segmentos en l, de acuerdo con la
siguiente definición:

8 En algunos libros, el intervalo abierto (a, b) también se dibuja con círculos blancos en los puntos A y B, usando corchetes inver-
tidos ]a, b[, o de alguna otra forma.
9 En el estudio del cálculo, algunas veces conviene considerar ∞ y −∞ como números; en ese caso el conjunto que resulta se llama

el conjunto de los números reales aumentados, cuya aritmética debe modificarse en la forma adecuada.
3.1  El sistema de los números reales 107

Definición 3.1.9
Definición de longitud
Sean a y b las coordenadas de dos puntos A y B, respectivamente, sobre la recta coordenada l,
y sea AB el segmento lineal de A a B. La longitud d(A, B) de AB se define por d(A, B) = |b − a| y
señala la distancia de A a B.

Observe que la distancia entre dos puntos se definió como un valor absoluto y, por lo tanto,
para todos los puntos A, B y C de l:
i) d (A, B) ≥ 0; d (A, B ) = 0 ⇔ A = B
ii) d (A, B) = d (B, A)
iii) d (A, B) ≤ d (A, C ) + d (C , B )

Ejemplo 3.1.9
Suponga que los puntos A, B, C y D tienen las coordenadas −5, −3, 1 y 6, respectivamente (figura
3.11). Encuentre d(A, B), d(C, B), d(O, A) y d(C, D).

A B O C D

-5 -3 0 1 6

Figura 3.11  Coordenadas de los puntos A, B, C y D.

Solución
Por la definición se tiene
d ( A, B ) = −3 − ( −5 ) = −3 + 5 = 2 = 2
d (C , B ) = −3 − 1 = −4 = 4
d (O, A) = −5 − 0 = −5 = 5
d (C , D ) = 6 − 1 = 5 = 5 

En algunos casos se desea trabajar con distancias a lo largo de l que consideren la dirección de l,
por lo que se presenta la siguiente definición.

Definición 3.1.10
Distancia dirigida
Sean a y b las coordenadas de dos puntos A y B, respectivamente, sobre la línea coordenada l.
→ →
La distancia dirigida AB de A a B se define como AB = b − a.

→ → →
Como BA→ = a − b se tiene que AB = − BA. Evidentemente, →
el punto B está a la derecha de
A si y sólo si AB > 0, y está a la izquierda de A si y sólo si AB < 0. De esta manera, la distancia
dirigida indica, además de la magnitud, la dirección de A a B, que es positiva cuando coincide con
la dirección asignada a l.

Ejemplo 3.1.10
→ → → →
Si A, B, C y D son los puntos del ejemplo 3.1.9, encuentre AB , BA , CB y OA .
108 Unidad 3  Sistemas numéricos

Solución
De la definición se obtiene

AB = −3 − (−5) = 2

BA = −5 − (−3) = −2

CB = −3 − 1 = −4

OA = −5 − 0 = −5
→ →
Considere que M es el punto medio del segmento AB. Entonces, AM = MB , ya sea que
→ →
AB > 0 o AB < 0 (figura 3.12).

A A M M B B B B M M A A

a a m m b b   b b m m a a

Figura 3.12  Punto medio del segmento de extremos A y B.

Entonces, si m es la coordenada de M, se tiene m − a = b − m. Al sumar m + a a ambos lados y


a+b
simplificando se obtiene 2m = a + b, y entonces m = , lo que demuestra el siguiente teorema.
2

 Teorema 3.1.20
Sean a y b las coordenadas de dos puntos A y B, respectivamente, sobre la línea coordenada l.
Entonces la coordenada del punto medio M del segmento AB es

a+b
m=
2

Ejemplo 3.1.11
Sean A, B, C y D como en el ejemplo 3.1.9. Encuentre las coordenadas de los puntos medios de
los segmentos AB, BC y CD.
Solución
Por el teorema 3.1.20 se tienen las siguientes coordenadas de los puntos medios:

−5 + ( −3) −8
Segmento AB: m1 = = = −4
2 2
−3 + 1 −2
Segmento BC: m2 = = = −1
2 2
1+ 6 7
Segmento CD: m3 = = 
2 2

Uno de los errores más comunes en la determinación del punto medio de un segmento
AB consiste en sustraer las coordenadas de A y B y dividir entre 2, por lo que es muy recomendable
notar que el teorema 3.1.20 establece que las coordenadas deben sumarse y la suma dividirse
entre 2.
3.1  El sistema de los números reales 109

Ejercicios 3.1

1. Pruebe, por medio de las propiedades de un campo, cada una de las reglas siguientes, indicando
la razón de cada paso.
a) (a + c ) + (d + b) = (a + b) + (c + d )
b) d + [(c + b) + a] = (a + b) + (c + d )
c) (−b + a ) + (−a + b) = 0
d) c[(db) a] = (ab)(cd )
e) a[(b + c ) + d ] = ab + a (d + c )
(
f ) Si a ≠ 0, entonces a −1b a = b )
g) Si a ≠ 0, b ≠ 0, entonces (ab) (a–1 + b–1) = a + b
h) Si a ≠ 0, b ≠ 0, entonces a–1b (a + b–1) = a–1 + b
2. Justifique las igualdades indicadas:
a) a − (b + c ) = (a − b) − c c) (a − b)(c − d ) = (ac + bd ) − (ad + bc)
b) −[−(−a )] = −a d) Si b ≠ 0, entonces –(a/b) = −a/b = a/(−b)

3. Demuestre que
a) si d ≠ 0, entonces a / d + c / d = (a + c) / d
b) si a ≠ 0 y b ≠ 0, entonces (a / b)−1 = b / a
c) en la expresión (a + c) / (b + c) no vale cancelar c
d) lo siguiente no es cierto para todo a, b y c ∈ : c / (a + b) = c / a + c / b
4. Demuestre que, para todos a, b, c, d ∈ .
a) Si a > b y c > d, entonces a + c > b + d .
b) Si a ≤ b, entonces a + c ≤ b + c.
c) Si a ≤ b y b < c, entonces a < c.
d) a < b si y sólo si −a > −b.
e) Si a ≤ b y b ≤ a, entonces a = b.
f) Si b, d ∈ +, demuestre que a / b < c / d si y sólo si ad < bc. Y si alguno de ellos, b o d, es nega-
tivo, ¿cuál sería la expresión?
5. Encuentre tres cotas superiores e inferiores, así como el supremo y el ínfimo, cuando éstos exis-
tan, en los siguientes conjuntos:
a) c) {x ∈  | x < 4}
b) {x ∈  | −2 < x ≤ 2} { 1
d) n | n ∈ 
2 }
6. Demuestre que
a) si S = {x ∈  | x ≥ π} inf S = 5, ¿o no?
b) un conjunto tiene, a lo más, un ínfimo.
c) el conjunto Z− no tiene cotas inferiores.
d) para todo x ∈ R existe n, m ∈ Z tales que n < x < m .
7. Explique cómo usar un triángulo rectángulo para encontrar un punto en una línea coordenada
que represente 5.
8. Demuestre que
→ → →
a) si J, K y L son tres puntos cualesquiera en una línea coordenada l, entonces JK + KL = JL .
b) si J, K, L y M son cuatro puntos cualesquiera en una línea coordenada l, entonces
→ → → →
JK − LK = JM + ML .
c) si J, K y L son puntos cualesquiera en una línea coordenada l, entonces no siempre es cierto
que d(J, K) + d(K, L) = d(J, L).
110 Unidad 3  Sistemas numéricos

3.2  Números complejos


Una característica importante del conjunto  de los números reales es que tiene una clase positiva
+, que define al orden canónico en , que por ser compatible con las operaciones tiene, entre
otras, la propiedad de que para toda a diferente de cero, a2 es un positivo y, por lo tanto, la ecua-
ción x2 + 1 = 0 no puede tener solución en . Como en otros casos (construcciones de ℤ y ℚ), se
pensó en extender  a un campo más grande, en el que la mencionada ecuación pudiera resolverse.
Era necesario construir un campo en el que existiera un número imaginario,“i”, que satisficie-
ra la ecuación x2 + 1 = 0 que fuera una extensión de  y, por supuesto, que resultara el más “eco-
nómico”, en el sentido de la contención, con esas propiedades.
En la época en que surgió este problema no se conocía el teorema que asegura que para todo
campo K y todo polinomio f (x) no constante, con coeficientes en K, existe una extensión de K en
la que el polinomio tiene al menos una raíz, teorema que valida la construcción, que resulta más
natural y que la hubiera librado de las objeciones —injustificadas— que en su momento se hicie-
ron, y que se referían al invento de los números imaginarios.
Es pertinente observar que en el campo cuya construcción se deseaba no puede haber una
relación de orden compatible con las operaciones, que es la única que interesa al álgebra, ya que
en ese caso, como en el de los reales, los cuadrados tendrían que ser no negativos. Por esta razón,
algunos autores que enfatizan la propiedad dicen que  es el “desordenado” campo de los núme-
ros complejos, a pesar de que, como una consecuencia del axioma de selección, resulta que en
todo conjunto se puede definir un buen orden. Lo que no puede asegurarse es que ese orden resul-
te compatible con las operaciones.
Puestos a estudiar ese hipotético campo en el que figura esa misteriosa i, se vio que tenían que
estar también todas sus potencias (i2, i3, ...) productos de éstas por números reales y sumas de tales
productos, es decir, debían estar consideradas todas las expresiones de la forma:

(3.2.1)
además de sus inversos multiplicativos. Se notó que como
i2 = −1
i3 = i2 · i = (−1)i = −i
i4 = i2 · i2 = (−1)(−1) = 1
si n es un número natural tal que n = 4q + r, 0 ≤ r < 4

i n = (i 4)q · i r = 1 · i r = i r


o sea, i n es 1, i, –1 o –i, observación que permite simplificar las expresiones 3.2.1, que pueden
reducirse a binomios de la forma a + bi , a, b ∈  .

Ejemplo 3.2.1
3 + 2i − 7i 2 + 2i 3 − i 4 + 7i 5 = 3 + 2i − 7 (−1) + 2 (−i ) − 1 + 7i = 9 + 7i 

Ejemplo 3.2.2
1 + i 3 + i 37 − i 204 = 1 − i + i − 1 = 0 

Ejercicio 3.2

Exprese en la forma a + bi :
(2 − 7i )2
( )
3 7 20 5
1. 2 − 8i + 7i − 3i + 16i 2.  2i 3 3.  
1 + 3i − 2i 2 + i 3 + 2i 7
3.2  Números complejos 111

Tomando en cuenta lo anterior, se procedió a estudiar al subconjunto β formado por los ele-
mentos del nuevo campo que pueden expresarse como binomios. Es decir,
β = { a + bi ∈ ; a, b ∈ , i 2 = −1 }
Como siempre que se define un conjunto nombrando a sus elementos, es conveniente aportar un
criterio que permita decidir cuando dos nombres corresponden al mismo individuo. Se hace notar
que, puesto que se trata de un campo, a + bi = c + di ⇒ (a − c ) = (b − d )i , y que, por lo tanto,
(a − c)2 = −(d − b)2 i;, que es una igualdad en  que implica que cada cuadrado debe ser necesaria-
mente 0, y por lo tanto, a = c y b = d . Es decir que en β cada elemento tiene una representación
única. Por ejemplo, si se supiera que i = u + vi , se sabría que u = 0 y v = 1.
Como β es subconjunto de un campo, (a + bi) (c + di) = (a + c) + (b + d)i, de donde resulta que
la adición, en , de elementos de β, produce un elemento de β (β es cerrado bajo la adición de ),
y, por lo tanto, la restricción de ésta a β × β es una operación binaria en β que, por herencia, resul-
ta asociativa y conmutativa. 0 = 0 + 0i está en β, y para cada a + bi ∈ β (−a ) + (−b) i el inverso
aditivo de a + bi también es un elemento de β; luego, {β, +} es un grupo abeliano.

Ejemplo 3.2.3
(3 + 4i ) + (6 + 5i ) = (3 + 6) + (4 + 5) i = 9 + 9i 

Ejemplo 3.2.4
(6 − 14i ) − (−10 + 17i ) = 16 − 31i 

Ejercicio 3.2

2. Exprese el resultado de las operaciones siguientes en la forma a + bi.

a) (4 + 7i ) + (8 − 3i ) f) ( ) (
2 + i 3 − 5 2 − 3i )
b) (2 + 7i ) − (6 + 2i ) g) (9 − i ) + (2 − 2i )
c) (11 + i ) + (3 − 4i ) h) [(2 + 4i ) + (6 − 2i )] − (6 − 11i )
d) (9 − i ) − (2 − 3i ) i) (−6 + 4i ) − [(1 − 6i ) − (−5 − i )]
e) (5 + 2i ) − (6 + 5i ) j) (2 + i 3) − (5 + 2 3i ) + (7 − 3 3i )
El producto, en , de dos elementos de β está en β.
En efecto, (a + bi) (c + di) = (ac − bd) + (ad + bc)i, y, por lo tanto, β tiene también una multi-
plicación que, por ser la restricción de la de un campo, es asociativa, conmutativa, tiene idéntico
(1 = 1 + 0i) y se distribuye sobre la suma por ambos lados.

Ejemplo 3.2.5

(6 + 3i )(2 + 4i ) = (12 − 12) + (6 + 24)i = 30i 


Ejemplo 3.2.6

(2 + i 3) (5 − 6 ) ( )
3 i = (10 + 18) + 5 3 − 12 3 i = 28 − 7 3 i 

Finalmente, si a + bi ∈ β y es a + bi ≠ 0 + 0i ( a ≠ 0 o b ≠ 0 y, por lo tanto, a 2 + b2 > 0 ),


a −bi
(a + bi )−1 = 2 2
+ 2
a +b a + b2
1.1  Lógica matemática
112 Unidad 3  Sistemas numéricos

 a −bi 
como puede comprobarse efectuando el producto (a + bi) 2 + 2  , por lo que resulta
que β es un campo. a + b 2
a + b2 
Cada número real a = a + 0i está en β, así como i = 0 + 1i. Obviamente, β es el menor campo
en el sentido de la contención con esas dos propiedades. Luego, β =  es el campo que se deseaba
construir.
Para ver cómo se obtiene el inverso multiplicativo de a + bi considere un número x + yi tal que
multiplicado por a + bi resulte igual a 1 + 0i, es decir,
(x + yi )(a + bi ) = 1 + 0i

al efectuar la multiplicación

(ax − by) + (ay + bx)i = 1 + 0i

de donde
ax − by = 1
bx + ay = 0

Como a + bi ≠ 0, a ≠ 0 o b ≠ 0 y, por lo tanto, a 2 + b2 > 0, por lo que, aplicando la regla de


Cramer, se obtiene

1 −b a 1
0 a a b 0 −b
x= = y= =
a −b a 2 + b2 a −b a 2 + b2
b a b a
a −bi
es decir, (a + bi )−1 = +
a 2 + b2 a 2 + b2

Ejemplo 3.2.7
Considere el ejemplo siguiente. Se desea encontrar (3 + 4i )−1 , que de acuerdo con lo anterior
resulta , y se comprueba

Se define el conjugado de un número complejo z = a + bi como z = a − bi.


Así, si z = 3 + 4i , su conjugado z = 3 − 4i , y entonces, al recordar que la expresión a / b repre-
senta al producto de a por el inverso de b, (a / b = ab−1), se encuentra que para efectuar la división
de z entre w basta multiplicar el cociente por , con lo que se obtiene el resultado deseado.

Ejemplo 3.2.8
Divida (2 − i ) entre (1 + i ) :
2 − i 2 − i 1 − i 1 − 3i 1 3
= · = = − i
1+ i 1+ i 1 − i 2 2 2

En efecto, .

Ejemplo 3.2.9
6 + 7i 4 + 3i
se multiplica por
4 − 3i 4 + 3i
3.2  Números complejos 113

Ejemplo 3.2.10
z w (6 + 7i)(4 + 3i) (24 − 21) + (28 + 188)i 3 + 46i 1
· = = = = (3 + 46i)
w w (4 − 3i)(4 + 3i) 16 + 9 25 25

z 7 +i 5
=
w 5 +i 7

z w ( 7 +i 5 )( 5 −i 7 )=( )
35 + 35 + (5 − 7)i 2 35 − 2i 1
· = = = ( )
35 − i 
w w ( 5 +i 7 )( 5 −i 7) 5+7 12 6

Ejercicio 3.2
3. Exprese en la forma a + bi el resultado de las siguientes operaciones:

a) (9 + 4i ) (7 − 6i ) m) 5i ÷ (1 − 7i )
b) (6 − 2i ) (2 + 5i ) n) ( ) (
3 − i 2 ÷ 2 3 − 2 2i )
c) (6 − 4i )(2 + 5i ) ñ) (4 5 + 2 3i ) ÷ ( 5 − 2 3i )
d) (6 − i )(1 − 5i ) o) ( 6 + 10i ) ÷ (3 6 − 2 10 i )
e) (−2 + 3i )(4 − 5i ) p) (2 + 2i )(3 − 3i ) ÷ (2 + 3i )
f) (5 − 2i )(3 − 2i ) q) (2 + 3i )2 ÷ (5 − 3i )
g) (7 )(
2 − 6 3i − 2 − 7 3i ) r) (−5 + 4i ) ÷ (2 + 2i )2
h) (3 + 2i )[(7 − 3i )(−2 + i )] s) Relájese.

i) (5 − 2i )2 t)
(10i − 3)(4i + 3)
9i − 8
j) (3 − 5i )3 (1 + 2i )(2 + i )
u)
k) (8 − 3i ) ÷ (9 + 4i ) (3 + 2i )(4 + 5i )
l) (2 − 4i ) ÷ (3 − 2i ) (3 − 5i )(7 + 4i )
v)
(5 + 3i )(6 − i )
Carl Friedrich Gauss (1777-1855).
Matemático alemán de quien existen
varias anécdotas sobre su gran
talento matemático, el cual se
El modelo de Gauss y la inmersión de  en  manifestó desde su infancia.
Gauss, tomando como base los resultados anteriores y con objeto de contestar las Contribuyó ampliamente al
desarrollo de la teoría de los números
objeciones que se hicieron a la construcción anterior; es decir, la existencia de
y creó el primer modelo de geometría
números imaginarios, propuso el siguiente modelo: no euclidiana. Hizo también
Sea  = { (a, b); a, b ∈ } aportaciones importantes en
astronomía y en física.

Definición 3.2.1
1. (a, b) = (c, d ) ⇔ a = c, b = d (representación única)

2. (a, b) ⊕ (c, d ) = (a + c, b + d ) (la suma dentro del último paréntesis es la de )

3. (a, b) ⊗ (c, d ) = (ac − bd , ad + bc)


114 Unidad 3  Sistemas numéricos

Con esto se pudo demostrar que {, ⊕, ⊗, 0, e} es un campo, en el cual


0 = (0, 0) ,    −(a, b) = (−a, − b),    e = (1, 0)
y si z = (a, b) es z ≠ 0
a −b 
entonces z −1 =  2 2
, 2 2
( z ≠ 0 ⇒ a 2 + b2 ≠ 0 )
a +b a +b 
En este modelo se acostumbra llamar a la primera componente de cada pareja la parte real y
a la segunda, la imaginaria. Observe que ambas partes son números reales; así, si z = (a, b) es un
complejo, Re z = a, Imz = b, y esta costumbre queda justificada con la inmersión f :  →  , defi-
nida como f ( a ) = ( a, 0 ).
(Recuerde que una inmersión de una estructura en otra es una función inyectiva que “respeta”
las relaciones de ambas. Explícitamente, f debe ser inyectiva y ∀a, b ∈ 

f ( a + b ) = f ( a ) ⊕ f (b )
f ( ab ) = f ( a ) ⊗ f ( b )
en donde, por supuesto, las operaciones de la izquierda de las igualdades son operaciones en  y
las de la derecha, en .)
En vista de que las operaciones de las parejas, adición y multiplicación, se definieron toman-
do como modelo las de los binomios, estas nuevas operaciones tienen, necesariamente, las propie-
dades de las anteriores y, por lo tanto,  = {{(a, b) | a, b ∈ }, ⊕, ⊗} , como se dijo y puede
comprobarse, resulta un campo. La inmersión f :  →  definida f ( a ) = ( a, 0 ) muestra que 
puede considerarse  como una extensión de campo de  y bautizando i como i = (0, 1) . Además,
identificando a con f(a) = (a, 0), puede verse que
1. i = (0, 1) ⊗ (0, 1) = (−1, 0) = −1
2

2. (a, b) = (a, 0) ⊕ (0, b) = (a, 0) ⊕ (b, 0) ⊗ (0, 1) = a + bi


con lo que se recuperan los binomios de los que se partió como base en la construcción de Gauss.
La construcción del inverso multiplicativo de un complejo (a,  b) distinto de cero,
−1  a −b 
(a, b) =  2 2 , 2 2  , mostró la conveniencia de definir dos funciones (f :  →  y
a +b a +b
g :  → ) por medio de las fórmulas
f ((a, b)) = (a, − b) la conjugación
g ((a, b)) = a + b
2 2
el módulo o tamaño

La conjugación
Si z = (a, b), z = f ( z) = (a, − b).
Cuando se identifican los complejos como puntos del plano coordenado 2, es decir, cuando
z = (a, b) es el punto de abscisa a y de ordenada b, la conjugación puede interpretarse geométri-
camente como la reflexión sobre el eje x.
Entre otras propiedades, la conjugación tiene las que expresa el siguiente teorema.

 Teorema 3.2.1
∀ z, w ∈ .
1. z + w = z + w “El conjugado de la suma es la suma de los conjugados”.
2. z · w = z · w “El conjugado de un producto es el producto de los conjugados”.
3. z = z ⇔ z∈
4. z =z
5. z =w⇔z=w
6. z + z = 2Re z z − z = 2i Im z
3.2  Números complejos 115

Demostración
Sean z = (a, b), w = (c, d ) .

1. z + w = (a + c, b + d ) = ((a + c ), − (b + d )) = (a, − b) + (c, − d ) = z + w

( )
2. z · w = (ac − bd , ad + bc ) = ac − bd , − (ad + bc ) = (a, − b)(c, − d ) = z · w

3. z ∈  ⇔ b = 0 ∴ z = (a, − 0) = (a, 0) = z

4. z = (a, b) = (a, − b) = (a, b) = z

5. z + z = 2 a = 2 Re z z − z = 2bi = 2i Im z

Corolario 1 
(De 4) Puesto que la conjugación es autoinversa, resulta biyectiva.

Corolario 2

(De 2) Si w es w ≠ 0 (z / w) = z / w .

En efecto, y, por lo tanto, . (Observe


que w ≠ 0 ⇒ w ≠ 0.)

Cuando se interpreta la conjugación como una función f :  → , el teorema prueba que f


es una función biyectiva que “va bien” con las operaciones de  y que “deja fijo” a  en el sentido
del inciso 3 del teorema 3.2.1.10

 Teorema 3.2.2
Si η :  →  es un automorfismo que deja fijo a , (η( a ) = a ∀a ∈ ), entonces η es la conjuga-
ción o la identidad en .

Demostración
Sea z = (a, b) = a + bi .
Entonces η(z ) = η(a + bi ) = η(a ) + η(b)η(i ) = a + bη(i )
( a, b ∈  ⇒ η ( a ) = a, η ( b ) = b )
Además, −1 = η(−1) = η(i · i ) = η2 (i ) y, por lo tanto, η(i ) tiene que ser una raíz cuadrada
de −1, o sea, η(i ) = i o η(i ) = −i .
Si η(i ) = i muestra que η es la identidad en  y si η(i ) = −i , η es la conjugación.

Ejemplo 3.2.11
Se desea calcular z si iz + (2 − i ) z = 10 + 6i .

10Las funciones biyectivas que respetan las operaciones se llaman isomorfismos, y cuando “van” de un campo en éste se conocen
como automorfismos.
116 Unidad 3  Sistemas numéricos

Entonces, z = x + yi , z = x − yi
∴ iz + ( 2 − i ) z = i ( x + yi ) + ( 2 − i )( x − yi ) = ( 2 x − 2 y ) − 2 yi
( 2 x − 2 y ) − 2 yi = 10 + 6i ⇒ −2 y = 6, 2 x − 2 y = 10
∴ x = 2, y = −3
Comprobación
i (2 − 3i ) + ( 2 − i )(2 − 3i ) = 3 + 2i + 7 + 4i = 10 + 6i 

Ejercicio 3.2

4. Resuelva:

a) (1 + i ) z + (1 − i ) z = 4 d ) (1 + i ) z − ( 6 + i )w = 4
b) zz + 3( z + z ) = 7 e) zz − 3(z + z ) = i
c) i z + (1 + i ) z = 3 + i f ) 2 z + z − z = 4 − 2i

¿Alguna de las operaciones anteriores no tiene solución?

La norma
Si z = (a, b) es un número complejo, se define su norma z como z = g ( z ) = a 2 + b2 . Aquí tam-
bién, si se identifican los complejos como puntos del plano, la norma o tamaño de z puede inter-
pretarse como la distancia euclidiana de (a, b) al origen.
Entre otras propiedades, la función norma tiene las que están enumeradas en el siguiente
teorema.

  Teorema 3.2.3
∀ z, w ∈ .
1. z = zz 3. zw = z w
2. z ≥ 0; z = 0 ⇔ z = 0 4. z+w ≤ z + w 

Demostración
2 2
1. zz = ( a, b )( a, − b ) = a + b = z .
2. La demostración es inmediata, ya que el tamaño de z es la raíz cuadrada de un número
no negativo, y ésta sólo es cero si el radicando (a2 + b2) lo es.
2 2 2
3. zw = zw · zw = zz · ww = z w , y como los tamaños son números reales, “se vale”
extraer raíces cuadradas. Luego, zw = z w .
4. Observe que ∀z, z = z y que Re z ≤ z ; Im z ≤ z .

z + w = (z + w)(z + w) = zz + zw + zw + ww =
2

2 2 2 2
= z + 2 Re( zw ) + w ≤ z + 2 zw + w =
= z + 2 z w + w = ( z + w ) , que es una desigualdad de números reales no
2 2 2

negativos.
Por lo tanto, z + w ≤ z + w .
3.2  Números complejos 117

Corolario 1  (De 3) Si t ∈ , t = t t = t 2 = t ∴ t z = t z .
En particular, si t = −1, − z = z .
Una función de 2 en  con las propiedades 2, 3 y 4 del teorema 3.2.3 (una norma)
permite definir la distancia entre dos puntos de 2, en este caso dos complejos z, w, como
sigue:
Def: ∀ z, w ∈ , d (z, w) = z − w

De la definición y de las propiedades de la norma se deducen las propiedades siguientes que con-
fieren a d la categoría de métrica.

  Teorema 3.2.4
∀ z, y, w ∈ .
1. d ( z, w ) ≥ 0; d ( z, w ) = 0 ⇔ z = w
2. d ( z, w ) = d ( w, z )
3. d ( z, w ) ≤ d ( z, y ) + d ( y, w ) 

En efecto:
1. z − w ≥ 0; z −w = 0 ⇔ z −w = 0 ∴ z = w
2. z − w = w − z
3. z − w = z − y + y − w ≤ z − y + y − w (de las propiedades consignadas en los corolarios).

La ecuación general de segundo grado


Un teorema cuya importancia le ha valido el nombre de teorema fundamental del álgebra11 asegu-
ra que  es algebraicamente cerrado; es decir, que todo polinomio f (x) ∈ [x] grado n tiene n
raíces, bien contadas, en . Vale la pena demostrar la existencia de algunas de éstas, en particular
las raíces cuadradas que deben calcularse cuando se usa la fórmula para resolver la ecuación gene-
ral de segundo grado.
Se desea resolver la ecuación ax2 + bx + c = 0, en donde a, b, c ∈ , a ≠ 0.
/
1. Se divide la ecuación entre a (a ≠ 0) y se resta c   a de cada lado:
bx c
=− x2 +
a a
b2
2. Se completa el trinomio cuadrado perfecto por la izquierda, sumando a cada lado:
4a 2
b b2 b2 c
x2 + x + 2 = 2 −
a 4a 4a a
22
o sea  x + b  = b − 4ac
 
 2a  4a 2

3. Suponiendo que se puede sacar raíz cuadrada a b2 − 4ac, que se representa como b2 − 4ac ,
la ecuación anterior queda

b b2 − 4ac
x+ =±
2a 2a

11La demostración de este teorema dentro del análisis complejo es tan elegante (breve) que justifica plenamente que se posponga,
dado que a este nivel resulta complicada y larga, y que por descansar, necesariamente, en alguna construcción de , no puede ser
algebraica pura.
118 Unidad 3  Sistemas numéricos

en donde el doble signo expresa el hecho de que para el caso sirve tanto la raíz cuadrada de b2 −
4ac, cuya existencia se supuso, como su inverso. Finalmente,

−b ± b2 − 4ac
x=
2a
Queda por justificar la antes mencionada existencia de las raíces cuadradas de b2 − 4ac, que
es lo que afirma el teorema siguiente.

 Teorema 3.2.5
Para cada complejo z = a + bi diferente de cero existen (exactamente) dos raíces cuadradas com-
plejas: una raíz y su inversa aditiva.

Demostración
Sea w = x + yi, tal que w2 = z.
Entonces,
( x + yi )( x + yi ) = x 2 − y2 + 2 xyi = a + bi ∴ x 2 − y2 = a
2xy = b
Al elevar al cuadrado cada ecuación y al sumar:

x 4 − 2 x 2 y2 + y 4 = a 2
4x 2 y 2 = b 2

( )
2
x 4 + 2 x 2 y2 + y 4 = a 2 + b2 ∴ x 2 + y2 = a 2 + b2
Entonces,

x 2 + y2 = a 2 + b2 (= z )
2 2
x −y =a ( = Re z )
a 2 + b2 + a a 2 + b2 − a
∴ x2 = y2 =
2 2
y como a 2 + b2 ≥ a cada una de las expresiones de la derecha en estas igualdades tiene
raíces cuadradas (reales), de donde resulta que

a 2 + b2 + a a 2 + b2 − a
x=± , y=±
2 2
Para seleccionar la pareja de raíces que satisface nuestro problema —producir una raíz cua-
drada de z— debe tenerse en cuenta que como 2xy es igual a b, si b > 0, deben escogerse
signos iguales para x y y (ambos positivos o ambos negativos), y si b < 0 x y y deben
tener signos diferentes.

Ejemplo 3.2.12
Encuentre las raíces cuadradas de 5 − 12i entonces si w = x + yi es una de ellas:

x 2 + y2 = 52 + 122 = 13 (el tamaño de 5 − 12i)


x2 − y2 = 5 (la parte real)
x2 = 9, x = ±3
Entonces, y2 = 4, y = ±2
y como b es menor que cero, x y y deben escogerse con signos diferentes.
Entonces, w1 = 3 − 2i y w2 = −3 + 2i son las raíces cuadradas de z.
3.2  Números complejos 119

Ejemplo 3.2.13
Obtenga las raíces de la ecuación z 2 − 3z + 3 − i = 0 .
Entonces, a = 1, b = −3, c = 3 − i,
y, por lo tanto,
b2 = 9
−4ac = −4(1)(( 3 − i ) = −12 + 4i ; b2 − 4ac = −3 + 4i

Para calcular b2 − 4ac se necesita encontrar x y y tales que

(x + yi )2 = b2 − 4ac = −3 + 4i
∴ x 2 + y2 = 5 (el tamaño)
x 2 − y2 = −3 (la parte real)
5−3 5+3
∴ x= = ±1 y= = ±2
2 2
Como 2xy = 4, los signos deben escogerse iguales.
Entonces, las raíces deben ser
1 + 2i y − 1 − 2i
3 ± (1 + 2i )
Finalmente, z=
2
z1 = 2 + i   y  z2 = 1 − i
Comprobación
(Sólo se hará para z1.)
(2 + i )2 − 3(2 + i ) + 3 − i = 3 + 4i − 6 − 3i + 3 − i = (6 − 6) + (4 − 4)i = 0 

Ejemplo 3.2.14
Obtenga las raíces de la ecuación z 2 − 2iz − 9 − 6i = 0 .
a =1 b = −2i c = −9 − 6i
b2 − 4ac = −4 + 36 + 24i = 32 + 24i
Debe obtenerse 32 + 24i = x + yi
de manera que
x 2 + y2 = 40, 2 xy = 24 (signos iguales)
2 2
x − y = 32
x = ±6, y = ±2 ∴ las raíces son 6 + 2i y − 6 − 2i
de donde, regresando a la ecuación,
2i ± (6 + 2i )
z=
2
2i + 6 + 2i 2i − 6 − 2i
z1 = = 3 + 2i z2 = = −3
2 2
Comprobación
Para (−3):
(−3)2 − 2i (−3) − 9 − 6i = 9 + 6i − 9 − 6i = 0
Para (3 + 2i):
(3 + 2i )2 − 2i (3 + 2i ) − 9 − 6i = 9 − 4 + 12i − 6i + 4 − 9 − 6i = 5 + 4 − 9 + 12i − 12i = 0 
La comprobación también puede hacerse, notando que la suma de las raíces debe ser r1 + r2 = −b
y su producto r1r2 = c. En efecto, si r1 y r2 son raíces de x2 + bx + c = 0, se tiene que

x2 + bx + c = (x − r1)(x − r2) = x2 − (r1 + r2)x + r1 r2


120 Unidad 3  Sistemas numéricos

o sea r1 + r2 = −b
r1r2 = c
Haga esta comprobación en los ejemplos anteriores.

Ejercicios 3.2

5. Encuentre las raíces cuadradas.

a) z = 1 − 3i g) z = 24 − 10i m) z = −3 + 4i
b) z = −1 − 3i h) z = 2 + 2 3i n) z = −3 − 4i
c) z = 2i i) z = −8i ñ) z = 12 + 5i
d) z = −16 j) z = 5 − 12i o) z = 15 + 8i
e) z = −2i k) z = 3 − 4i p) z = −40 + 42i
f) z = −4 l) z = 3 + 4i
6. Resuelva las ecuaciones siguientes:
a) z 2 − 3z + 3 − i = 0 f) −5x 2 + 2 x − 1 = 0
b) z 2 − 2iz − 9 − 6i = 0 g) z 2 − (4 + i ) z + 5 − i = 0
c) z 2 − 3(1 + i ) z + 5i = 0 h) z 2 − (5 − 3i ) z + 2 − 6i = 0
d) (1 + i ) z 2 + (1 + 2i ) z − 2 = 0 i) z 2 + (2 − 3i ) z − (5 + 5i ) = 0
e) z 2 − 2iz + 1 = 0 j) z 6 + z 3 + 1 = 0

Sistemas de ecuaciones
I.  Se desea resolver el sistema
iz + (1 + i )w = 3i
(1 + i ) z − (6 + i )w = −12 + 3i
Se observa que las incógnitas de la segunda ecuación son las conjugadas de la primera, por lo
que se puede conjugar, con lo que se obtiene una ecuación equivalente (con las mismas raíces). El
sistema, equivalente al primero, queda así:
iz + (1 + i )w = 3i
(1 − i ) z − (6 − i )w = −12 − 3i
y procediendo por suma y resta:
(1 − i )iz + (1 − i )(1 + i )w = (1 − i )3i i (1 − i ) z + 2w = 3 + 3i

−i (1 − i ) z − (−i )(6 − i )w = −i (−12 − 3i ) −i (1 − i ) z + (1 + 6i )w = −3 + 12i
Por lo tanto,
5i (1 − 2i )
(3 + 6i )w = 15i ∴ (1 + 2i )w = 5i ∴ w = = 2 +i
5
y sustituyendo en la primera ecuación,
iz + (1 + i )(2 + i ) = 3i
iz + 1 + 3i = 3i
−1
iz = −1; z = =i
i
Comprobación
i (i ) + (1 + i )(2 + i ) = −1 + 1 + 3i = 3i
(1 + i ) i − (6 + i )(2 + i ) = 1 − i − 13 + 4i = −12 + 3i
3.2  Números complejos 121

II.  Se desea resolver el sistema


iz + 2w = 3 + 4i
2 z − iw = 5 − 3i
Calcule
i 2
∆ = = −3 Por lo tanto, el sistema tiene solución única.
2 −i

Comprobación
i (2 − i ) + 2 (1 + i ) = 3 + 4i
2 (2 − i ) − i (1 + i ) = 5 − 3i
III.  Se desea resolver el sistema
x + y + z = 4 + 2i
x + 2 y − 2 z = −4 − 2i
2 x − 2 y − z = −5 + 5i
Indicando las operaciones con Rn′ (nuevo renglón n),

Rn − Rm (renglón n menos el renglón m).

La matriz aumentada es:

1 1 1 4 + 2i  1 1 1 4 + 2i 
  R2′ = R2 − R1  
 1 2 −2 −4 − 2i   0 1 −3 −8 − 4i 
 2 −2 −1 −5 + 5i  R3′ = R3 − 2R1  0 −4 −3 −13 + i 
   
R1′ = R1 − R2  1 0 4 12 + 6i  1 0 0 2i 
  R1′ = R1 − 4R3  
R3 + 4R2  0 1 −3 −8 − 4i  −
0 1 0 1 i 
R3′ = 0 0 1 3 + i  R2′ = R2 + 3R3 0 0 1 3 + i 
−15    
Por lo tanto,
x = 2i
y = 1− i
z = 3+i
Comprobación
Sustituyendo estos valores en el sistema original,
2i + (1 − i ) + (3 + i ) = 4 + 2i
2i + 2 (1 − i ) − 2 (3 + i ) = 2i + 2 − 2i − 6 − 2i = −4 − 2i
2 (2i ) − 2 (1 − i ) − (3 + i ) = 4i − 2 + 2i − 3 − i = −5 + 5i
Como puede verse, satisfacen cada una de las ecuaciones del sistema original.

Ejercicio 3.2

7. Resuelva:

a) i z + (1 + i )w = 3 + i b)

(1 + i ) z − ( 6 + i )w = 4
122 Unidad 3  Sistemas numéricos

c)  3z + w = 4 + 2i e) 
 
2 z − iw = 3 + 2i iz1 + (1 + i ) z2 + (1 − i ) z3 = 7 + 4i


d) (1 + i ) z + (1 − i )w = 0

(1 − i ) z + (1 + i )w = 4 f)  z1 + 2 z2 + 3z3 = 1 − 2i

4 z1 + 5 z2 + 6 z3 = 2 + i
7 z + 8 z + 9 z = 3 + 4i
 1 2 3

Representación geométrica de los números complejos


Como se ha mencionado en párrafos anteriores, todo número complejo a + bi puede hacerse
corresponder con el punto del plano cuyas coordenadas son a y b. Cuando se usa esta representa-
ción, el eje x se conoce como el eje real y el eje y es el imaginario. Cada número complejo z puede
considerarse como la suma a + bi, la pareja (a, b), el punto del plano P = (a, b) o el vector apoya-
do en el origen de extremo P. Si la longitud del segmento OP es r y el ángulo que forma OP con
el eje real es θ, el complejo z puede expresarse también en coordenadas polares (r, θ), en donde,
por supuesto, a = r cos θ y b = r sen θ. El cambio inverso, rectangulares a polares (que debe hacer-
se tomando en cuenta los signos de a y de b, que definen el cuadrante en el que se encuentra z),
está dado por las relaciones

r = a 2 + b2

II I

III IV

Figura 3.13  Los cuadrantes del plano.

Tabla 3.2  Argumento de un número complejo

No definido a=0 b=0 Cuadrante Ángulo θ


b
π/2 a=0 b>0 I Arctan  
a
Ángulo θ −π/2 a=0 b<0
π − Arctan  
II b
0 a>0 b=0 a
 
π a<0 b=0 III π + Arctan  b 
a 

2π − Arctan  
IV b
a 

a
Equivalentemente, se define el “argumento” θ de z como el ángulo cuyo coseno es
b a + b2
2
y cuyo seno es . La utilización de estas últimas fórmulas permite trabajar en todo el plano.
a 2 + b2
θ no está definido si a2 + b2 = 0; es decir, si z = 0.
Puede verse que esta manera de definir el argumento de z permite la posibili-
Nota
dad de que dos ángulos θ1 y θ2 sean argumentos de z si θ1 y θ2 difieren en un múlti-
cis θ = cos θ + i sen θ.
plo entero de 2π, y sólo entonces (vea “argumento de un número complejo” más
adelante, observación que resultará conveniente cuando se estudie la extracción de
raíces n-ésimas) cos θ1 = cos θ2 y sen θ1 = sen θ2 si y sólo si θ1 = θ2 + 2πk, k ∈ .
3.2  Números complejos 123

Ejemplo 3.2.15
Im
Considere el vector (en el plano) de módulo 2 y
argumento π / 3, y calcule su forma rectangular y su
forma polar (se sugiere comenzar dibujando el vec-
tor de que se trate) (figura 3.14). 2
Entonces sus coordenadas rectangulares son 1 y
3. Por lo tanto, su forma rectangular es 1 + 3i y √3
su forma polar es 2 cis (π / 3) o 2 cis (60°).

Ejemplo 3.2.16 0 1 Re
Calcule las formas rectangular y polar de z– si z tiene
módulo 4 y argumento π / 4 (o 45°). Figura 3.14  Complejo de módulo 2 y
Entonces, como puede verse, la forma rectan- argumento π / 3.
gular de z– es 2 2 − 2 2 i y la forma polar es 4 cis
(−π / 4) = 4 cis (7π / 4).

Im
z
4
Im

π 4
8
4
0 Re
−π 4
0 4√3 Re

Figura 3.16  Representación gráfica del


número 4 3 + 4i .
4 −z

Figura 3.15  Representación de z– y z.

Ejemplo 3.2.17
Im
Transforme el 4 3 + 4i a la forma polar (también se sugiere empe-
zar con un dibujo).
Como se puede ver, el tamaño ( 4 3 )2 + 42 = 64 = 8 y el
argumento π /  6 (o 30°), y entonces la forma polar resulta
z = 8 cis 30° = 8(cos 30° + i sen30°).

Ejemplo 3.2.18 2 120º

Exprese el número 2 cis 120° en forma rectangular.


Entonces, como puede verse, las coordenadas de z son ( −1, 3 ) , 0 Re
y por lo tanto, z = −1 + 3 i .

Figura 3.17  Representación del 2 cis 120°.


3.2  Números complejos
124 Unidad 3  Sistemas numéricos

Ejercicios 3.2

 8. Calcule las coordenadas de los vectores del plano cuyo módulo es r y cuyo argumento es s.
a) r = 3 2, s = 225° e) r = 2, s = 45°
b) r = 2, s = 30° f) r = 4, s = 120°
c) r = 3, s = 90° g) r = 2, s = 300°
d) r = 2, s = 270°

 9. Transforme a coordenadas polares:


a) 7 + 7i e) 4 + 2i
b) 3−i f) −6 − 6 3i
c) −5 + 5i g) −4
d) 1 − i 3 h) −8i

10.  Escriba en la forma a + bi los siguientes números complejos:

a)  (1 + i )8     b)  ( 3 + 4i )3     c)  (5 − 12i )2

Entre las ventajas que tiene la representación geométrica de los números complejos, que permite
estudiar la geometría del plano a través del álgebra de , se hace notar que tal representación
permite interpretar la suma de dos complejos z1 y z2 como la diagonal del paralelogramo cons-
truido sobre los sumandos, como se muestra en la figura 3.18.
Además, permite interpretar la multiplicación en la forma que expresa el siguiente teorema.
Im
 Teorema  3.2.6
z1 + z2
z1 Sean z j = rj (cos θ j + i sen θ j ), j = 1, 2, números complejos (que por como-
didad se denotan en forma abreviada como z j = rj cis θ j ). Entonces,
z1z2 = r1r2 cis (θ1 + θ2 )

Este teorema dice que para multiplicar dos complejos se multiplican


z2
sus tamaños y se suman sus argumentos.
0 Rc Recíprocamente, para dividir dos complejos, el segundo distinto de 0,
se dividen sus tamaños y se restan sus argumentos.

Figura 3.18  Representación de la suma de


complejos.

Demostración
Demostración (de la multiplicación)
( r1 cos θ1 + ir1 sen θ1 )( r2 cos θ2 + ir2 sen θ2 )

= r1r2 [cos θ1 cos θ2 − sen θ1 sen θ2 + i (sen θ1 cos θ2 + cos θ1 sen θ2 )]


= r1r2 [cos (θ1 + θ2 ) + i sen (θ1 + θ2 )] = r1r2 cis (θ1 + θ2 )


3.2  Números complejos 125

Corolario 1 
Teorema de De Moivre
Si z = r cis θ es un número complejo, entonces ∀n ∈ , z n = r n cis ( nθ ).

Demostración

Demostración (inducción sobre n)


La base, n = 1, es obvia.
Paso inductivo. Se debe demostrar que Τ ( k ) ⇒ Τ( k + 1).
Suponga que el teorema vale para n = k, es decir, zk = rk cis (kθ). Al aplicar el teorema ante-
rior se obtiene
z k +1 = z k · z = r k cis ( kθ ) · r cis θ = r k +1 cis [( k + 1)θ ].

Paso inductivo aumentado Τ( n ) ⇒ Τ( − n ).

Y como el coseno es una función par y el seno es una función impar, cos (−α) = cos α,
sen (−α) = − sen α resulta

z − n = r − n (cos (−nθ ) + i sen (−nθ )) = r − n cis (−nθ )

Ejemplo 3.2.19
Se desea realizar las siguientes operaciones:
5
1.    3. (1 + i )

( )
5
= 10(cos 100° + i sen 100°) = 10 cis 100°    = 2 cis 45° = 25 / 2 cis 5( 45°) = 4 2 cis 225°

2.

= 60 cis 420° = 60 cis 60°


Observe que, en general, es menos
Alternativamente, el problema 3 se puede resolver desarrollando el binomio laborioso calcular potencias de un
(en forma rectangular): número complejo en forma polar
usando el teorema de De Moivre que
(1 + i )5 = 1 + 5i + 10i 2 + 10i 3 + 5i 4 + i 5 desarrollando el binomio en forma
= 1 + 5i − 10 − 10i + 5 + i = −4 − 4i rectangular (trate de calcular
200
(1 + i ) en forma rectangular).
que transformado a la forma polar, al notar que z = 16 + 16 = 4 2 y θ = 225°
queda:
z 5 = 4 2 cis 225°

Ejercicios 3.2

Realice las operaciones indicadas. En el caso de los complejos que están en forma rectangular,
11. 
primero expréselos en forma polar.
a) 2(cos 25° + i sen 25°)5(cos 75° + i sen 75°)
b) 8(cos 18° + i sen 18°)6(cos 24° + i sen 24°)
126 Unidad 3  Sistemas numéricos

c) 15(cos 140° + i sen 140°)4(cos 280° + i sen 280°)


d) (1 + i 3 )( 4 + 4i )
e) ( 6 − 6i )( −7 + 7 3i )
f) 2(cos 15° + i sen 15°)3(cos 70° + i sen 70°)4(cos 65° + i sen 65°)

12.  Use el teorema de De Moivre para elevar a la potencia indicada.

12
a) [ 4(cos 12° + i sen 12°)]3 h) ( 3 − i )
4 −4
b) [ 3(cos 18° + i sen 18°)] i) [5(cos 16° + i sen 16°)]
8
c) [ 3 (cos 25° + i sen 25°)]6 j) [ 7 (cos 20° + i sen 20°)]
8 6
d) [ 2(cos 20° + i sen 20°)] k) [cos ( −10° ) + i sen ( −10° )]
−6
e) (1 − i )10 l) (cos 10° + i sen 10°)
9 −10
f) (1 + i 3 ) m) ( 3 + i )
8
g) ( −2 3 + 2i ) n) ( −1 − i )12

Raíces n-ésimas de un número complejo


Suponga que se desea encontrar a todos los complejos w tales que wn = z, y que
z = ρ cis θ. Suponga también que w0 = r cis ϕ es uno de ellos.
Entonces, por el teorema de De Moivre, w0n = r n cis nφ = ρ cis θ ∴ r = n ρ
(la raíz real) y ϕ = θ / n.
Es decir, .
1 Si θ es un argumento de z, los números θ + 2π k, k ∈  también lo son. Por lo
tanto, las otras n − 1 raíces de z se encuentran sumando a ϕ, .
Por ejemplo, si z = 1 (z = 1 cis 0), sus raíces cúbicas (que son tres), que en
general se conocen como 1, ω y ω2, son

Figura 3.19  Representación de las raí-


ces cúbicas de la unidad. cuya representación geométrica se muestra en la figura 3.19.
Observe lo siguiente:
a) Si se continúa el proceso de asignar a k valores mayores que 2, las raíces ya
obtenidas se repiten. Este fenómeno es independiente del orden de las raí-
ces que se desea calcular. Esto confirma el hecho de que todo número com-
plejo tiene exactamente n raíces n-ésimas.
b) Cuando se desea extraer raíces cúbicas de cualquier número complejo, el
30° argumento se va aumentando de 120° en 120°, lo que también se obtiene
multiplicando por ω. Esta observación permite encontrar las raíces cúbi-
cas de z multiplicando una de ellas por ω y ω2.
 Si z = 32 cis 150°, sus raíces quintas son

w1 = 2 cis 30 + (2π 5) = 2 cis ( 30° + 72°) = 2 cis 102°

Figura 3.20 Representación geomé- w2 = 2 cis [30° + 2( 72°)] = 2 cis 174°


trica de las raíces quintas de z = 32
cis 150°.
3.2  Números complejos 127

w3 = 2 cis [30° + 3( 72°)] = 2 cis 246°


w4 = 2 cis [30° + 4( 72°)] = 2 cis 318°
y su representación geométrica se ilustra en la figura 3.20.
Los ejemplos anteriores son casos particulares del siguiente teorema.

 Teorema  3.2.7
Sea z = ρ cis θ un número complejo diferente de cero. Entonces, para cada n entero positivo, z
tiene exactamente n raíces n-ésimas, que están dadas por la fórmula
θ + 2π k
wk = n ρ cis φk , en donde φ k = , k = 0, 1, ..., n − 1
n
Para fines prácticos, los ángulos pueden expresarse en grados, y en este caso
θ + 360°k
φk = , k = 0, 1..., n − 1
n

Demostración
Sea β = {w0 ,...,wn −1} el conjunto formado por los n valores de la fórmula que corresponden a
k = 0, 1..., n − 1 .

Entonces,
θ + 2π k
1.  ( wk ) n = ( n ρ ) n cis ( n ) = ρ cis (θ + 2 π k ) = z
n
2. Suponga wi , 0 ≤ j ≤ i < n . Entonces, n ρ cis φ j = n ρ cis φ j y, por lo tanto, ϕi y ϕj difieren,
necesariamente, en un múltiplo entero de 2π, es decir,

θ + 2πi θ + 2π j i− j
φi − φ j = 2π k = − = 2π
n n n
i− j
Por lo tanto, k =  n ,   que debe ser entero, lo cual significa que n divide a i − j, pero
0 ≤ i − j ≤ n ∴ i − j = 0, i = j .

En resumen, wi = wj ⇒ i = j, y por contrapuesta, i ≠ j ⇒ wi ≠ wj. Luego la cardinalidad de β es


n, y dado que la ecuación xn − z = 0 no puede tener más de n raíces en , β consta de todas las
raíces n-ésimas de z.

Ejercicio 3.2.

13.  Obtenga las raíces que se indican.


a) Raíces cúbicas de 8(cos 72° + i sen 72°) h) Raíces cúbicas de −1
b) Raíces cúbicas de 216(cos 27° + i sen 27°) i) Raíces cúbicas de i
c) Raíces cuadradas de (1 − i 3 ) j) Raíces cúbicas de ( 3 + 4i )
d) Raíces cúbicas de (1 − i 3 ) k) Raíces cuartas de 16 2 ( −1 + i )
e) Raíces cuadradas de ( −1 − i 3 ) l) Raíces quintas de 1
f) Raíces cúbicas de 1 m) Raíces sextas de −27i
g) Raíces cúbicas de 8 n) Raíces quintas de 16 2 ( −1 + i )
128 Unidad 3  Sistemas numéricos

El argumento de un número complejo


Cuando se cambian las coordenadas polares a rectangulares en un complejo z, z = (r, θ), estas
últimas quedan bien determinadas por las expresiones x = r cos θ y y = r sen θ, pero el cambio
inverso (rectangulares a polares), en el que si z = (x, y), r resulta ser r = x 2 + y2 sólo define a θ
módulo 2π. Es decir, si θ satisface sen θ = y r, cos θ = x r, r ≠ 0, entonces ϕ satisfará las mismas
relaciones si y sólo si ϕ = θ + 2πk, es decir, si y solamente si θ y ϕ difieren en un múltiplo entero de
2π. Para evitar la ambigüedad que esta situación ocasiona se conviene en definir θ = Arg z, que se
conoce como el argumento principal, al único real con las propiedades
x = r cos θ , y = r sen θ , − π < θ ≤ π ( z ≠ 0 )12
Se sabe (teorema de De Moivre) que para multiplicar dos complejos, se multiplican (en ) sus
tamaños y se “suman sus argumentos”, pero para ser congruentes con la convención anterior, a
esta suma se le debe aplicar una corrección para el caso de que tal suma no caiga dentro del rango
acordado (−π, π]. De modo que si zj = rj cis θj (Arg zj = θ j = 1, 2), se tiene que

Arg (z1z2) = θ1 + θ2 + 2πc(z1z2),


en donde

 1 si θ1 + θ2 ≤ −π

c ( z1, z2 ) =  0 si − π < θ1 + θ2 ≤ π
 − 1 si θ + θ > π
 1 2

Así, por ejemplo, si


z1 = z2 = −1;
−1 = cis π ∴ c ( z1, z2 ) = − 1

entonces ( −1)( −1) = 1 cis ( 2π − 2π ) = 1 cis 0

La función exponencial compleja


Sea η: [a, b] →  la descripción de una trayectoria en 2. Entonces, η(t) = x(t) + iy(t) muestra que
tanto la parte real como la imaginaria de η(t) son funciones que dependen de t, y entonces la
derivada de η con respecto a t se define como
η′(t) = x′(t) + iy′(t)
Por ejemplo, si η(t) = cos t + i sen t describe la rotación de una partícula alrededor del origen
con radio uno, donde la variable t se interpreta como “el tiempo”, la velocidad de la partícula (la
derivada de η con respecto a t) es η′(t) = −sen t + i cos t, y del mismo modo su aceleración resulta
η″(t) = −cos t + i sen t.
Se desea extender exp :  →  a E :  →  de manera que se conserven las propiedades bási-
cas de la exponencial. Explícitamente, se desea que E tenga las propiedades siguientes:

a) E ( x ) = exp ( x ) ∀x ∈ 
b) ∀z, w ∈ , E ( z + w ) = E ( z ) E ( w )
c) E ′( z ) = E ( z ) · z ′

En vista de esto, si z = x + iy, con x, y ∈ , debe suceder que

E ( z ) = E ( x + iy ) = E ( x ) E (iy ) = e x E (iy )

12 Algunos autores definen el rango de θ en el intervalo [0, 2π).


3.2  Números complejos 129

y, por lo tanto, nuestro problema, encontrar la forma correcta de definir E(z), se reduce a decidir
la manera en que debe interpretarse E(iy), que obviamente es un complejo cuyas partes real e
imaginaria dependen de y. Es decir,

E (iy ) = U ( y ) + iV ( y )

y se deben encontrar funciones U y V que resulten adecuadas para nuestro propósito (conseguir
que E tenga las propiedades deseadas a), b) y c)).
Entonces,
1. E (iy ) = U ( y ) + iV ( y ) por definición. Derivando en el supuesto de que E satisface a c),
2. E ′(iy ) = i E (iy ) = U ′( y ) + iV ′( y ), en donde U ′ y V ′ son derivadas con respecto a su variable y.

Al derivar una vez más


3. E ′′(iy ) = − E (iy ) = U ′′( y ) + iV ′′( y ) = − U ( y ) − iV ( y ). Este resultado muestra que tanto U
como V son funciones que satisfacen la ecuación f ′′ + f = 0.
Al hacer y = 0 en 1 y en 2 se obtiene:
4. 1 = U ( 0 ) + iV ( 0 ) ∴U ( 0 ) = 1; V ( 0 ) = 0.
5. i = U ′( 0 ) + iV ′( 0 ) ∴ U ′( 0 ) = 0; V ′( 0 ) = 1.

Los resultados anteriores muestran que tanto U como V deben ser las soluciones a los proble-
mas de valores iniciales siguientes:
U : y ′′ + y = 0, y( 0 ) = 1, y ′( 0 ) = 0
y V : y ′′ + y = 0, y( 0 ) = 0, y ′( 0 ) = 1
y como las soluciones a tales problemas son únicas, como se demuestra en los cursos de ecuacio-
nes diferenciales, U debe ser la función coseno y V la función seno. Luego,
E ( x + iy ) = e x (cos y + i sen y ) = e x cis y

 Teorema 3.2.8
La función E  :  →  así definida tiene las propiedades a), b) y c).

Demostración

a)  E ( x ) = exp ( x ) ∀x ∈ 
z ∈  → z = x + 0i ∴ E ( z ) = exp ( x ) cis ( 0 )
cis ( 0 ) = 1 ∴ E ( z ) = E ( x ) = exp ( x )
b)  E ( z1 + z2 ) = E ( z1 ) E ( z2 )
z j = x j + iy j j = 1, 2
z1 + z2 = ( x1 + x2 ) + i ( y1 + y2 )


c)  E ′( z ) = E ( z ) z ′
z (t ) = x(t ) + iy(t ) ∴ E ( z ) = e x (cos y + i sen y )
E ′( z ) = x′e x (cos y + i sen y ) + y′e x ( −sen y + i cos y )


130 Unidad 3  Sistemas numéricos

 Teorema  3.2.9
La función exponencial es periódica y cada periodo es de la forma 2πki, k ∈ .

Demostración
Sea w un periodo de E, luego ∀ z ∈ , E(z) = E(z + w). Al hacer z = 0, E(w) = 1, y si
w = x + yi, E(w) = ex cis y = 1 ⇒ x = 0, cos y = 1 y sen y = 0, entonces y = 2πk, k ∈ .

Una consecuencia de la demostración es que

Representación geométrica de algunas


rectas bajo la transformación E
Sea T :  →  la transformación T(z) = E(z).
Observe que el origen de  va a dar al punto (1, 0), y a medida que la variable recorre el eje x
alejándose del origen en el sentido positivo, ex aumenta exponencialmente, pero y se mantiene
igual a cero. Luego la imagen de [0, ∞) es [1, ∞), mientras que E(−∞, 0) es (0, 1).
De la misma manera puede analizarse la imagen bajo la transformación E de cualquier recta
horizontal (y es constante). Se encuentra que la imagen de la semirrecta cuyos puntos tienen abs-
cisa positiva es la parte que queda fuera del círculo unitario, del rayo que parte del origen y cuyo
argumento es la y de la recta. La semirrecta de puntos con x negativa tiene por imagen la porción
del rayo que queda dentro del círculo.
Observe que como E(z) · E(−z) = 1, ∀ z ∈  y, por lo tanto, ∀ z ∈ , E(z) ≠ 0, el origen del
plano  no es imagen de ningún complejo z bajo la transformación exponencial.
Las rectas verticales x = cte (tamaño fijo y argumento de −∞ a ∞) van a dar a circunferencias
de radio ex las rectas que parten del origen se “retratan” como espirales que “arrancan” de (1, 0).
Las imágenes van aumentando tanto de tamaño como de argumento a medida que la variable se
va alejando del origen.

e2

1 1

e
1 1

Figura 3.21  Transformación exponencial de algunas rectas, de 2 en 2 (imagen proporcionada por el


Dr. Carlos Bruno Velarde Velázquez).
3.2  Números complejos 131

La función logaritmo
Con el deseo de definir la función inversa de la exponencial (el logaritmo complejo), se observa que
si (por supuesto, E ( z ) = e x , Arg E ( z ) = y ). Por lo tanto, debe definirse

Observe que si , es decir, L es una extensión de la función


logaritmo natural.
Si z = − x, L ( z ) = ln x + πi .
Ya que la exponencial es una función periódica, debe escogerse una banda del plano de 2π para
seleccionar en ella los argumentos de los logaritmos complejos. En efecto, si se escoge la región
{( x, y ) ∈ | − π < y ≤ π}, entonces la función exponencial definida en ella la “mapea” biyectiva-
mente en todo el plano, menos el origen.
Otra vez, si se define D = {x + yi ∈  | − π < y ≤ π} , E : D →  − {0} es biyectiva y su inversa
es L:  − {0} → D.
En efecto, ∀z ∈ D, z = x + yi , E ( z ) = e x cis y; L ( e x cis y ) = ln e x + iy = x + yi.
Si z = x + yi es un complejo no cero de tamaño r y de argumento θ (x = r cos θ, y = r sen θ),
entonces L ( z ) = ln r + iθ y, por lo tanto, E(L(z)) = eln r cis θ = r cos θ + ir sen θ = x + yi = z.
Note que la función L :  − {0} → D está bien definida (en el sentido de que ∀z ≠ 0, L ( z ) ∈ D ),
ya que, según se convino, el argumento de L(z) debe satisfacer −π < Arg z ≤ π .

Ejemplo 3.2.20

1.
2. L ( −1) = ln −1 + i Arg ( −1) = ln 1 + πi = πi 

 Teorema 3.2.10
Si z1 = r1 cis θ1, z2 = r2 cis θ2 , entonces L ( z1z2 ) = L ( z1 ) + L ( z2 ) + 2 πic ( z1, z2 ).

Demostración
L ( z1z2 ) = L ( r1r2 cis (θ1 + θ2 + 2π c ( z1, z2 )))
= ln ( r1r2 ) + i (θ1 + θ2 + 2π c ( z1, z2 ))
= ln r1 + iθ1 + ln r2 + iθ2 + 2 π ic ( z1, z2 )
= L ( z1 ) + L ( z2 ) + 2π ic ( z1, z2 )

Definición 3.2.2
Si z es z ≠ 0, w ∈, z w = E ( wL ( z ))

En el caso de que z = x ∈  + y w = y ∈ , E ( x y ) = E ( yL ( x )) = E ( y ln x ) = exp( y ln x ), por lo


que, como puede verse, la definición anterior extiende a la que se tenía para .
De z w = E ( w( z )), al aplicar la función L, se ve L ( z w ) = wL ( z ) .

  3.2.11 Teorema
w1 + w2
1. ∀z ≠ 0, w1 , w2 ∈, z = z w1 · z w2
w w ww
2. ( z 1 ) 2 = z 1 2
3. Si z1 y z2 son distintos de cero,
w ∈ , ( z1z2 )w = z1w z2w E ( 2π wic ( z1z2 ))
132 Unidad 3  Sistemas numéricos

Demostración

w1 w 2
1. z = E (( w1 + w2 )L ( z )) = E ( w1L ( z ) + w2 L ( z ))
w1 w2
= E ( w1L ( z )) · E ( w2 L ( z )) = z ·z
w1 w2 w
2. ( z ) = E ( w2 L ( z 1 ))
w w
= E ( w2 · w1L ( z )) = z 1 2
w
3. ( z1z2 ) = E ( wL ( z1z2 ))
= E [ w( L ( z1 ) + L ( z2 ) + 2πic ( z1z2 ))]
= E [ wL ( z1 ) + wL ( z2 ) + 2πwic ( z1z2 )]
= E ( wL ( z1 )) · E ( wL ( z2 )) · E ( 2 π wic ( z1z2 ))
= z1w · z2w · E ( 2 π wic ( z1z2 ))

Ejemplo 3.2.21

1. 

En la enseñanza del álgebra elemental se asegura que para obtener la raíz cuadrada de un número
negativo, se toma la correspondiente a su valor absoluto multiplicada por i.
Así, por ejemplo, se dice que −4 = 2i, y se justifica escribiendo

−4 = 4( −1) = 4 −1 = 2i.
Observe que en el paso intermedio 4( −1) = 4 −1 no se tomó en cuenta la corrección,
multiplicar por que en este caso es cero, ya que la suma de los argumentos de
los factores no excede π, y así el resultado es correcto, aunque el procedimiento no. Si lo fuera,
entonces valdría la conocida “paradoja” siguiente:

1 = 1 = ( −1)( −1) = −1 −1 = i 2 = −1. ¿1 = −1?

La falacia aparece cuando se sustituye ( −1)( −1) por ( −1) ( −1) , ya que aquí la corrección
no es cero. En efecto, Arg ( −1) = π y, por lo tanto, Arg ( −1) + Arg ( −1) = 2π , suma que excede el
rango que se escogió y que obliga en este caso a aplicar la corrección, c( −1, − 1) = −2π ; es decir,
debe multiplicarse el lado derecho de la igualdad por
Ahora sí: ( −1)( −1) = −1 −1( −1) = i 2 ( −1) = ( −1)( −1) = 1.

Las funciones trigonométricas


Al recordar que para todo número real θ , eθ i = cos θ + i sen θ , e −θ i = cos θ − i sen θ , se puede ver
eθ i + e −θ i θi −θ i
que e + e = 2 cos θ y eθ i − e −θ i = 2 i sen θ . Por lo tanto, cos θ = y sen θ = e − e ,
θi −θ i
2 2i
e zi
+ e −zi e zi
− e − zi
en vista de lo cual se conviene en definir para cada z ∈ , cos z = y sen z = .
2 2i
Con este acuerdo, las nuevas funciones (que extienden a las correspondientes coseno y seno
de variable real) adquieren, entre otras, las siguientes propiedades:

 Teorema  3.2.12
∀ z, w ∈ .
3.2  Números complejos 133

2 2
1. sen z + cos z = 1 4. cos ( z + w ) = cos z cos w − sen z sen w
2. (sen z )′ = cos z 5. sen ( z + w ) = sen z cos w + cos z sen w
3. (cos z )′= − sen z

Demostración
2
2  e zi − e − zi  e 2 zi + e −2 zi − 2
1. sen z =   =
 2i  −4
2
2  e zi + e − zi  e 2 zi + e −2 zi + 2
cos z =   =
 2  4

e 2 zi + e −2 zi + 2 − e 2 zi − e −2 zi + 2
Por lo tanto, sen2 z + cos2 z = =1
4

 e zi − e − zi ′ i ( e zi + e − zi ) e zi + e − zi
2. (sen z )′=   = = = cos z
 2i  2i 2

 e zi + e − zi ′ i ( e zi − e − zi ) i 2 ( e zi − e − zi )
3. (cos z )′=   = = = −sen z
 2  2 2i

( e zi + e − zi )( e wi + e −wi ) e ( z +w )i + e ( z −w )i + e ( − z +w )i + e −( z +w )i
4. cos z cos w = =
4 4
( e zi − e − zi )( e wi − e −wi ) e ( z +w )i − e ( z −w )i − e ( − z +w )i + e −( z +w )i
sen z sen w = =
( 2i )( 2i ) −4
2 e ( z + w )i + 2 e ( z + w )i
∴ cos z cos w − sen z sen w = = cos ( z + w)
2

( e zi − e − zi )( e wi + e −wi ) e ( z +w )i + e ( z −w )i − e ( − z +w ) − e −( z +w )i
5. sen z cos w = =
2( 2i ) 4i

( e zi + e − zi )( e wi − e −wi ) e ( z +w )i − e ( z −w )i + e ( − z +w )i − e −( z +w )i
cos z sen w = =
2( 2i ) 4i
2 e ( z + w )i − 2 e − ( z + w )i
∴ sen z cos w + cos z sen w = = sen ( z + w )
4i

Ejercicios 3.2

14.  Defina tan z, cot z, csc z (expresiones explícitas).


  Demuestre que:
1. tan2 z + 1 = sec2 z
2. cot2 z + 1 = csc2 z
3. sen2 i + cos2 i = 1
2
1 + cos z
4. cos2 z =
2
2
1 − cos z
5. sen 2 z =
2
 135

Polinom
de ecua
4.1 Polinomios
Unidad
•  Suma y multiplicación
•  Grado
•  Inmersión de K en K [x]
•  Algoritmo de la división
4.2  Funciones polinomiales
•  Teorema del residuo
•  Raíces de ecuaciones polinomiales
•  Teorema del factor

ciones
ios y teo
•  Algoritmo de la división sintética
•  Raíces complejas
•  Raíces “surd”
•  Las ecuaciones generales de 2º, 3º y 4º grados
4.3 Algunos resultados de la teoría de números y su aplicación
a los polinomios y a las funciones polinomiales
•  Máximo común divisor de dos enteros (algoritmo de Euclides)
•  Fracciones parciales
4.4  Métodos numéricos
•  Introducción
•  Error
•  Cálculo de raíces de ecuaciones

ría
•  Método de iteración de punto fijo
•  Método de bisección
•  Método de Newton-Raphson
•  Aplicaciones
•  Estimación de las constantes de la ecuación de estado de Van der Waals
136 Unidad 4  Polinomios y teoría de ecuaciones

4.1 Polinomios
Los polinomios son objetos matemáticos que el estudiante encuentra desde sus estudios de secun-
daria. Son expresiones de la forma siguiente: a0 + a1x + a2x2 + … + anxn, que por tener estructura
de sumas se conocen como sumas formales. El conjunto {a0, …, an} consta de elementos de algún
campo, usualmente el de los números reales o el de los complejos, y se llaman coeficientes; x es la
indeterminada. Cuando se trata de funciones polinomiales (vea más adelante), la x también se lla-
ma la variable o incógnita. Los estudiantes aprenden a operar con ellos (sumarlos, restarlos, mul-
tiplicarlos, dividirlos y también usarlos para resolver gran variedad de problemas); sin embargo,
el sustento teórico de lo que están haciendo es muy poco claro. En efecto, ¿qué son esas indeter-
minadas? ¿La x2 qué significa? ¿Cómo se multiplican entre sí o con los coeficientes? ¿Qué clase de
sumas son esas, en las que no está clara la naturaleza de los sumandos? Esas sumas y esas multi-
plicaciones, ¿conmutan? ¿Son asociativas? ¿Qué leyes obedecen y cuáles no?
Con objeto de establecer una base teórica adecuada para contestar las preguntas anteriores y
poder extender la teoría convenientemente, se proponen las definiciones pertinentes que, por
supuesto, están basadas en el conocimiento intuitivo previo, el que se tiene y que se usará junto
con el concepto de grado (que se formalizará más adelante) para orientar las definiciones corres-
pondientes.

Suma y multiplicación
La observación de que tanto la suma como la multiplicación de polinomios pueden definirse pres-
cindiendo de las indeterminadas permite identificar cada polinomio con la colección de sus coefi-
cientes. Así, el polinomio a0 + a1x + a2x2 + … + anxn se hace corresponder con la colección 
(a0, a1, …, an). Por ejemplo, al polinomio x5 + 3x4 − x2 + 2x − 3 le corresponde la colec- 
ción (−3, 2, −1, 0, 3, 1). Note que en estas colecciones los coeficientes aparecen en el orden inverso
del que se usa en la forma acostumbrada. Puede verse que con esta identificación para sumar poli-
nomios de distinto grado es necesario agregar tantos ceros como sea preciso para igualar el núme-
ro de términos de cada sumando, así como para “rellenar” los huecos que dejan las “potencias
faltantes”. Con objeto de obviar estos “estiramientos” parciales se propone un “estirón” general
que sirva para todos los casos, y con esta consideración se define: el polinomio a0 + a1x + a2x2 +
… + a xn es la sucesión casi nula1 (a , a , …, a , 0, 0, …). De acuerdo con esto, dos polinomios
n 0 1 n
resultan iguales si y sólo si son idénticos. [Recuerde que dos funciones f y g son iguales si y sólo si
tienen igual dominio, igual contradominio y producen la misma imagen en cada elemento al que
se le aplican (f : A → B) = (g : C → D) si y sólo si A = C, B = D y f(x) = g(x) para toda x ∈ A.]
La suma de polinomios se define de manera natural como la suma de imágenes, esto es, si a y
b son los polinomios a = (a0, a1, …, an, 0, …) y b = (b0, b1, …, bn, 0, …), el polinomio a + b es 
a + b = (a0 + b0, a1 + b1, …, ai + bi, 0, …), que por supuesto resulta también una sucesión casi nula.
Se hace cero, al menos, a partir del lugar que corresponde al máximo de m y n.
Por ejemplo, sean a = (1, −2, 0, 7, 0,…) y b = (5, 0, 4, 0,…). Entonces la suma a + b resulta 
a + b = (1 + 5, −2 + 0, 0 + 4, 7 + 0, 0 + 0,…), o sea, a + b = (6, −2, 4, 7, 0,…).
Como los coeficientes (imágenes de los números naturales correspondientes) pertenecen a un
campo, es claro que la suma que se ha definido resulta asociativa, conmutativa, con elemento cero
y con un inverso aditivo para cada polinomio. Explícitamente, 0 = (0, 0, …), y si
a = (a0, a1, …, an, 0, …), −a = (−a0, −a1, …, −an, 0, …),
que tiene las propiedades que se requieren. Así, 0 + a = a y −a + a = 0.
Con objeto de que la multiplicación de polinomios coincida con la que conocemos, se define,
para a = (a0, a1, …, an, 0, …) y b = (b0, b1, …, bm, 0, …), ab = (c0, c1, …, cj, 0, …), en donde cada
n+m
ck es ckk = ∑ ai b j . Así, c = (a0b0, a0b1 + a1b0, a0b2 + a1b1 + a2b0, …).
k =i + j

1 Una sucesión es una función S : ℕ → D cuyo dominio es el conjunto de los números naturales. Se dice que es casi nula si y sólo
si S(n) = 0 para todos los números naturales, excepto por un número finito de ellos.
4.1 Polinomios 137

La multiplicación resulta asociativa, conmutativa, con 1 = (1, 0, …) y se distribuye sobre la


suma, con lo que el conjunto de los polinomios con coeficientes en un campo K resulta un anillo
conmutativo con uno,2 que se denota como K [x].

Grado
Definición 4.1.1
Se define el grado de un polinomio a = (a0, a1, …, an, 0, …) como n si an ≠ 0 y am = 0 para todo
m > n. Por ejemplo, si a = (0, 2, 1, 5, 0, …), es de grado 3; recuerde que los “lugares” se cuentan
desde el lugar cero. b = (7, 0, 0, …) es de grado cero; note que los polinomios que corresponden
a los elementos diferentes de cero del campo de los coeficientes son precisamente los de grado
cero (vea inmersión).

Observe que para definir el grado de un polinomio es preciso que algún coeficiente de éste sea
diferente de cero. Por esta razón resulta que el polinomio cero no puede tener grado (el polinomio
cero está “degradado”).
Al sumar (o restar) dos polinomios de distinto grado, la suma (o la diferencia) resulta del
mismo grado que el del mayor. Sin embargo, cuando ambos sumandos son de igual grado, pue- 
de suceder que se cancelen algunos términos (uno, varios o todos), y así se dice que el resultado de
una suma (o resta) es el polinomio cero o un polinomio de grado menor o igual que el grado
común de los sumandos.
Ejemplo 4.1.1

(1 ,2, 0, 1, 0, ...) − (0, 3, −1, 0, ...) = (1, −1, 1, 1, 0, ...)


(1, 2, 0, 1, 0, ...) + (− 1, 2, 0, −1, 0, ...) = (0, 0, 0, 0, 0,...)
(x3 + 3x2 − 2x + 4) + (−x3 −3x2 + x + 7) = −x + 11
Esta falta de precisión en el grado de una suma no ocurre para el producto. En efecto, en K [x]
“vale” el siguiente teorema.

 Teorema  4.1.1
Sean a = (a0, …, an, 0, …) y b = (b0, …, bm, 0, …) dos polinomios de grado n y m, respectivamente.
Entonces el grado del producto ab es n + m.

Demostración
El término cn+m del producto consta de la suma de los productos ai bj con i + j = n + m. Cuan-
do i es i > n, ai = 0 (el grado de a es n). Por otro lado, si i < n, j resulta mayor que m y, por lo
tanto, bj . = 0, de modo que el único término de la suma que sobrevive es anbm , que es distin-
to de cero, ya que ambos factores lo son.
Los coeficientes del producto mayores a n + m son todos cero, ya que la condición 
i + j > n + m fuerza a que necesariamente i sea mayor que n, y en ese caso ai = 0 o que j sea
mayor que m, y ahora es bj la que se anula.

2 Un anillo es una terna {A, +, .}, en donde A es un conjunto y +, . son operaciones binarias en A tales que {A, +} es un grupo
abeliano y la multiplicación . se distribuye sobre la suma por ambos lados. Si la multiplicación conmuta el anillo se conoce como
anillo conmutativo, y si tiene idéntico (uno) se dice que es un anillo con uno.
Un anillo conmutativo se llama dominio entero si y sólo si en la multiplicación se pueden cancelar factores iguales, distintos de
cero o equivalentemente, cuando cero no tiene divisores propios, es decir, que un producto es cero si y sólo si alguno de sus factores es
cero. El ejemplo más importante de los dominios enteros es el conjunto de los enteros ℤ (que además tiene idéntico multiplicativo: uno).
138 Unidad 4  Polinomios y teoría de ecuaciones

Una consecuencia inmediata del teorema anterior es la proposición siguiente:


Sean a, b ∈ K [x]. Entonces a ≠ 0 y b ≠ 0 ⇒ ab ≠ 0 o, por contraposición, ab = 0 ⇒ a = 0 o
b = 0, y cuando tal proposición se cumple se dice que “cero no tiene divisores propios” y que el
anillo es un dominio entero.

 Teorema 4.1.2
En un anillo conmutativo, cero no tiene divisores propios si y sólo si se “vale cancelar” factores
diferentes de cero, es decir, ab = ac y a ≠ 0 ⇒ b = c.

Demostración

Hipótesis: ab = 0 ⇒ a = 0 o b = 0.
PD ab = ac y a ≠ 0 ⇒ b = c.
El teorema de la deducción permite incorporar ab = ac y a ≠ 0 como hipótesis adicional,
y entonces demostrar que b = c.
De ab = ac se sigue que 0 = ab − ac = a(b − c), por lo que a = 0 o (b − c) = 0. Pero a ≠ 0
por hipótesis, de modo que (b − c) tiene que ser cero. Por lo tanto, b = c.

Suponga que se vale cancelar factores diferentes de cero y que ab = 0. Debe demostrarse
que a = 0 o b = 0. Equivalentemente, a ≠ 0 ⇒ b = 0.
Sea pues a ≠ 0 y ab = 0; entonces, ab = a · 0, y como a ≠ 0, al cancelarla queda b = 0.

Inmersión de K en K [x]
Cada elemento a0 ∈ K, mediante la identificación natural, puede considerarse como el polinomio
(a0, 0, 0,...) ∈ K [x].
Si se define η : K → K [x] como η ( a0 ) = ( a0 , 0, 0, ) , η resulta una función inyectiva tal que
para todos a, b ∈ K, η ( a + b ) = η ( a ) + η ( b ) y η ( ab ) = η ( a ) η ( b ) . (Es decir, η es lo que se conoce
como un monomorfismo de anillos o inmersión.)

Demostración

1. η ( a ) = η ( b ) ⇒ ( a, 0, 0, ) = ( b, 0, 0, ) y, por lo tanto, a = b (es decir, η es inyectiva).


2. η ( a + b ) = ( a + b, 0, 0, ) = ( a, 0, 0, ) + ( b, 0, 0, ) = η ( a ) + η ( b ) . η “respeta” sumas.
3. η ( ab ) = ( ab, 0, 0, ) = ( a, 0, 0, )( b, 0, 0, ) = η ( a ) η ( b ) ∙ (η “respeta” productos.)

{ }
Se define K+ [ x ] = ( a0 , , an , 0, ) ; an > 0 y entonces puede verse que K+[x] resulta una
clase positiva3 y que a ∈ K+ ⇔ η (a) ∈ K+ [x], con lo que se puede concluir que η también “respe-
ta” el orden.

3 Sea D un dominio entero (o un campo). D+⊂ D es una clase positiva si y sólo si para todos los elementos de D:

1.  a, b ∈D+ ⇒ a + b, ab ∈D+ (es cerrado bajo sumas y productos).


2.  Vale una y sólo una de a ∈D+, a = 0 o −a ∈D+(vale la ley de tricotomía).
4.1 Polinomios 139

Definición 4.1.2
x = ( 0, 1, 0,  , 0, )

Entonces, x 2 = (0, 0, 1, 0, , 0, )

x = (0, 0, 0, , 1, 0, )
n

En este último paréntesis, el “1” se encuentra en el n-ésimo lugar (recuerde que los “lugares”
se cuentan desde el lugar cero).
También an x n = (an , 0, , 0, )(0, 0, , 0, 1, 0, ) = (0, 0, , 0, an , 0, ) , en donde an está en
el n-ésimo lugar.
Y finalmente, a0 = (a0 , 0, 0, , 0, )
a1x = ( 0, a1, 0, , 0, )
a2 x 2 = ( 0, 0, a2 , , 0, )

an x = (0, 0, 0, , an , )
n

∴ a0 + a1x +  + an x n = (a0 , a1, a2 , …, an , …)


con lo que se recuperan las sumas formales, que ahora sí son sumas de polinomios con todo 
derecho.

Algoritmo de la división
El algoritmo de la división asegura que, como en el caso de los enteros, en el anillo K [x] la división
es una operación bien definida en el sentido que afirma el siguiente teorema:

  Teorema 4.1.3
Sean a, b ∈ K [x], b ≠ 0. Entonces existen únicos q y r polinomios tales que a = bq + r, en donde r
es cero o su grado es menor que el de b.
El teorema asegura dos cosas que se demostrarán separadamente: la existencia del cociente y
del residuo, y la unicidad de éstos.

Demostración
Demostración de la primera parte (existencia)
Se hará por inducción sobre el grado de a, utilizando el segundo principio. La hipótesis es “el
teorema se cumple para el cero y para todo polinomio de grado menor que el grado de a”.
Observe que si a es el polinomio cero o su grado es menor que el grado de b, entonces q = 0
y r = a satisfacen lo que el teorema asegura. En efecto, a = 0 · b + a, gr (a ) < gr (b) o a = 0. Por
lo tanto, se supone que gr (b) ≤ gr (a ) y sean
a = (a0 , … , an , 0,…) = an x n +  + a0 ,   an ≠ 0
b = (b0 , …, bm , 0, …) = bm x m +  + b0 ,   bm ≠ 0 m ≤ n
140 Unidad 4  Polinomios y teoría de ecuaciones

Recuerde que cuando se divide a entre b, el primer término del cociente se construye
dividiendo an entre bm, y tomando n − m como exponente para la x, es decir, se construye
an n − m
α= x
bm
Se multiplica después α por b y el producto se resta de a. Al hacer esto, el primer térmi-
no de a se cancela y se obtiene el primer residuo r1, que puede ser cero, y que si no lo es,
tiene grado menor que n. Entonces,
a = αb + r1 (4.1.1)
Si r1 = 0, el proceso termina. Si no, aplicando la hipótesis de inducción a r1 resulta que
r1 = q1b + r2 con r2 = 0 o gr (r2 ) < gr (b). Al sustituir esta expresión para r1 en la ecuación
(4.1.1) se obtiene:
a = α b + q1b + r2 = (α + q1 )b + r2

Las definiciones q = α + q1 y r2 = r producen a = qb + r , r = 0 o gr (r ) < gr (b).

Demostración de la segunda parte (unicidad)


Para demostrar la unicidad de un objeto, se supone que existen dos y se demuestra que éstos
son diferentes representaciones del mismo.
Sean q1(x), r1(x), q2(x), r2(x) polinomios que satisfacen la condición que el algoritmo de
la división requiere, es decir,
a = q1b + r1   r1 = 0 o gr (r1 ) < gr (b)
a = q2 b + r2   r2 = 0 o gr (r2 ) < gr (b)

Entonces, q1b + r1 = q2 b + r2. Luego,

(q1 − q2 )b = (r2 − r1 ) (4.1.2)

es decir, b divide a (r2 − r1), que también se escribe b (r2 − r1 ).


Si r2 ≠ r1, gr (r2 − r1 ) < gr (b), lo cual es absurdo,4 por lo que r2 − r1 tiene que ser cero; es
decir, r2 = r1, y por lo tanto, de la ecuación (4.1.2) se obtiene (q1 − q2 )b = 0, lo que dice que 
q1 = q2 (recuerde que b ≠ 0).

4.2  Funciones polinomiales


Sean K un campo y E una extensión (K es un subcampo de E, por ejemplo,  y ).
Con cada polinomio f ∈ K [x] se puede definir una función f (x) : E → E de la manera siguiente:
sea f (x) = (a0, a1, ..., an, 0, ...) ∈ K [x] y z ∈ E. Entonces, f (z ) = a0 + a1z +  + an z n , que es una
suma de productos de elementos de E. Así, f (x) viene a ser la función f (x) : E → E definida por el
polinomio f. A tales funciones (que están definidas por medio de un polinomio) se les denomina
funciones polinomiales.
Se puede comprobar que si f y g son polinmios con coeficientes en K, y f(x) y g(x) son las fun-
ciones polinomiales correspondientes, resulta que las funciones que se asocian a los polinomios
f + g, fg son precisamente las definidas como ( f + g )(x) = f (x) + g (x), ( fg )(x) = f (x) · g (x).

4 Observe que: p|q ⇒ ∃ r ∋ pr = q, y entonces si q no es cero, su grado es la suma de los grados de sus factores, es decir, 

gr(q) = gr(p) + gr(r). Por lo tanto,


p|q y  q ≠ 0 ⇒ gr (q) ≥ gr (p)
y por contrapuesta, si el grado de p fuera mayor que el posible grado de q, la afirmación p|q obliga a que entonces q = 0.
4.2  Funciones polinomiales 141

Entonces, si η la función que asocia a cada polinomio f en K [x], la correspondiente función


polinomial f(x)η es un homomorfismo de anillos, que cuando el campo K es infinito permite iden-
tificar a cada polinomio con su función polinomial, de manera que ambas estructuras (polino-
mios y funciones polinomiales) resultan indistinguibles desde el punto de vista de sus propiedades
algebraicas. Es por esto que en los estudios elementales del álgebra (secundaria y preparatoria) no
se hace distinción alguna entre ellas.
Vale la pena notar que, de acuerdo con la definición, los elementos del campo, cuando se
convierten en polinomios, producen funciones constantes. Así, si
a0 → (a0, 0,…), a0(x) = a0 + 0 x + … = a0.
Cuando se plantea una ecuación polinomial (por ejemplo, x2 − 7x + 12 = 0), ésta no puede
referirse a una igualdad de polinomios. En efecto (12, − 7, 1, 0, 0, …) = x2 − 7x + 12 no puede ser
igual al polinomio 0 = (0, 0, 0,…). Por lo tanto, se trata de una igualdad entre funciones polino-
miales, que sólo se cumple cuando x toma el valor de 3 o 4.
Cuando se utiliza el método de las fracciones parciales para integrar un cociente f(x)/g(x) de
polinomios, se factoriza g(x) como producto de factores irreducibles (los polinomios reales irre-
ducibles son de primero o de segundo grado con discriminante menor que cero),
g(x) = (x − α1) (x − α2)(x2 + αx + β)...,
se buscan constantes A, B, C, … que satisfagan la igualdad
f (x ) A B Cx + D
= + + +
g (x) (x − α1 ) (x − α2 ) x 2 + αx + β
Se trata ahora de una igualdad entre polinomios, de manera que si, por ejemplo, resultara
Ax 3 + Bx 2 + C x + D = 2 x 2 − 7 , es decir (D, C , B, A, 0, ) = (−7, 0, 2, 0, ), , se tendría D = −7, 
C = 0, B = 2 y A = 0.
La estrecha relación de las propiedades algebraicas entre polinomios y funciones polinomia-
les (homomorfismo de anillos) permite utilizarla para la demostración de algunos teoremas bási-
cos de la teoría de ecuaciones, como los que se presentan a continuación, en los que se usará
indistintamente f o f(x).

Teorema del residuo


Sean f (x) ∈ K [x], E una extensión de K y a ∈ E. Entonces el residuo de dividir f(x) entre (x − a) 
es f(a).

Demostración
f(x) ∈ K [x] y K ⊂ E aseguran que f(x) puede considerarse también como un polinomio con
coeficientes en E y, por lo tanto, el algoritmo de la división garantiza la existencia de q(x) y
r(x) (en E [x]) tales que f(x) = q(x − a) + r, en donde r = 0 o gr(r) = 0 (es decir, r es un polino-
mio constante).
Esta igualdad vale para las funciones polinomiales y, por lo tanto, ∀ x ∈ E,
f (x) = q (x)(x − a ) + r (x), y si x = a, f (a ) = q (a )(a − a ) + r (a ) = r.
(Recuerde que r ∈ K implica que r(x) es una función constante y que, por lo tanto, 
∀ x ∈ R, r(x) = r.)

Raíces de ecuaciones polinomiales

Definición 4.2.1
Sea f(x) ∈ K [x], K es un subcampo de E; a ∈ E es un cero de f (o una raíz de la ecuación 
f(x) = 0) si f(a) = 0.
142 Unidad 4  Polinomios y teoría de ecuaciones

Definición 4.2.2
a ∈ E es un cero de multiplicidad m de f (o una raíz de multiplicidad m de f(x) = 0) si (x − a)m
divide a f(x) y (x − a ) m +1 ya no la divide.

Definición 4.2.3
Las raíces de multiplicidad uno se llaman raíces simples. Las de multiplicidad dos, dobles; las
de tres, triples; y, en general, para m > 3 se denominan como “raíces de multiplicidad m”.
Aquellas de multiplicidad cero son las que no son raíces (vea más adelante).

Teorema del factor


Sea f(x) ∈ K [x], K ⊂ E; a ∈ E es una raíz de f(x) = 0 si y sólo si (x − a ) f (x).


Demostración

Hipótesis: a es una raíz f(x) = 0.
PD (x − a ) f (x).
Al dividir f (x) entre (x − a), el residuo que se obtiene, de acuerdo con el teorema del residuo,
es f (a), y como a es cero del polinomio f, la expresión que resulta es f (x) = q (x)(x − a ) + 0, de lo
que se sigue inmediatamente que (x − a) divide a f (x).

Hipótesis: (x − a ) f (x).
PD f (a ) = 0.
Dado que x − a divide a f (x), ∃ q (x) ∈ E [x] ∋ f (x) = q (x)(x − a ), lo que dice que al
dividir f (x) entre x − a, el residuo que resulta es cero, que, de acuerdo con el teorema del
residuo, es igual al valor f (a).

Una aplicación importante del teorema del factor consiste en transformar el problema de
encontrar raíces de las ecuaciones polinomiales por medio de fórmulas (lo que en el caso del poli-
nomio general de grado mayor o igual que cinco, está demostrado que es imposible) en un proble-
ma de divisibilidad. En efecto, cada vez que al dividir f (x) entre x − a se obtenga el residuo cero,
se habrá encontrado la raíz a de la ecuación f (x) = 0.
Por supuesto, en el caso de los números reales es imposible probar con cada uno de ellos si es
o no cero del polinomio de que se trate; sin embargo, el conjunto de los números racionales que
pueden ser cero de los polinomios con coeficientes enteros está bien definido y no es muy nume-
roso, por lo que en estos casos resulta adecuado utilizar el método de la división. Puede demos-
trarse que si f (x) ∈ Z [x] es f (x) = a0 + a1x +  + an x n , con los coeficientes ai ∈ Z, entonces las
únicas raíces racionales p/q (simplificadas, es decir, tales que (p, q) = 1) de la ecuación f (x) = 0
pertenecen al conjunto de las fracciones para las que p a0 y q| an. En particular, si an = 1 (y en este
caso se dice que f (x) es un polinomio mónico), las únicas raíces racionales tienen que ser enteras,
con lo que la búsqueda se simplifica bastante.

Ejemplo 4.2.1
Sea f (x) = x 6 + 10 x5 + 40 x 4 + 82 x 3 + 91x 2 + 52 x + 12 = 0. Las posibles raíces racionales pertene-
cen al conjunto de los divisores de 12, a saber: { ± 1, ± 2, ± 3, ± 4, ± 6, ± 12} . Puede probarse que
x 6 + 10 x5 + 40 x 4 + 82 x 3 + 91x 2 + 52 x + 12 = (x + 1)3 (x + 2)2 (x + 3) , que por lo tanto tiene raíces
4.2  Funciones polinomiales 143

−1, −2 y −3. (−1 es raíz triple; −2, doble; y −3, simple. Cualquier otro racional es raíz de multipli-
cidad cero, es decir, no es raíz.)

Ejemplo 4.2.2
8x + 28x5 + 10 x 4 − 35x 3 − 5x 2 + 16x − 4 = 0. En este ejemplo, las raíces racionales se deben buscar
6

entre las fracciones cuyo numerador es un divisor de 4 y con denominador divisor de 8. Así, el
p
conjunto de números sospechosos de ser raíces racionales de la ecuación son { q }, en donde
{ }
p ∈ { ± 1, ± 2, ± 4}   y  q ∈ { ± 1, ± 2, ± 4, ± 8}. Entonces, p / q ∈ ± 2, ± 1, ± 1 , ± 1 , ± 1 . f(x) resulta ser
2 4 8
( )
3
igual a 8(x + 2)2 (x + 1) x − 1 , y, por lo tanto, sus raíces son −2 de multiplicidad 2, −1 de multi-
1 2
plicidad 1 y 2 de multiplicidad 3. 

Ejemplo 4.2.3
x + x 3 + 3x 2 − 2 x + 2 = 0 . En este caso, las raíces racionales tienen que estar en el conjunto de los
4

divisores de 2, a saber: ± 1, ± 2. Se puede ver que el conjunto {(x + 1), (x − 1), (x + 2), (x − 2)} no
4 3 2
tiene ningún divisor de x + x + 3x − 2 x + 2, de lo que se concluye que la ecuación propuesta 
no tiene raíces racionales. 

Como puede verse, una vez que se han localizado los posibles sospechosos de ser raíces racio-
nales, su búsqueda requiere de divisiones f (x) entre binomios de la forma x − a, proceso que se
puede simplificar utilizando el algoritmo conocido como “división sintética”, que se detalla a
continuación.

Algoritmo de la división sintética


Cuando se divide un polinomio an x n +  + a0 entre un binomio x − a, el procedimiento (apren-
dido en secundaria) produce una colección de expresiones:
bn x n −1 + (bn −1 + abn ) x n − 2 + 
x−a bn x n + bn −1x n −1 + bn − 2 x n − 2  + b0
−bn x n + abn x n −1

r
El procedimiento general es el siguiente:
1. El primer término del cociente es el resultado de dividir el primer término del dividendo entre
el primero del divisor, que es x; por lo tanto, si el primer término del dividendo fuera anxn, el
que corresponde al primero del cociente es anxn−1.5
2. Se multiplica anxn−1 por (x − a) y el producto se resta del dividendo, con lo que se obtiene el
primer residuo parcial (o segundo dividendo), en el que el término anxn queda cancelado.

(an x n −1)(x − a) = an x n − aan x n −1


y
an x n + an −1x n −1 +  + a0
– an x n + aan x n −1

(an −1 + aan ) x n −1 +  + a0 (primer residuo parcial o segundo dividendo)

5 El signo de an entre 1 es el signo de an, el valor de an entre 1 es an y xn entre x es xn−1.


144 Unidad 4  Polinomios y teoría de ecuaciones

Los siguientes términos del cociente se construyen repitiendo el procedimiento de dividir


entre x cada uno de los residuos parciales, en los que el primer término del anterior resulta cance-
lado, y se continúa hasta que el último de los residuos parciales sea constante.

Ejemplo 4.2.4

−3x 2 − 6 x − 10
x−2 −3x 3 + 2 x − 7
(
− −3x 3 + 6x 2 )
−6x 2 + 2 x − 7
− −6x 2 + 12 x ( )
−10 x − 7
−(−10 x + 20)
−27
Observe que:
1. En el cociente aparecen las potencias decrecientes de la x, empezando por xn−1 (algunos coefi-
cientes pueden ser cero).
2. El signo y el coeficiente de cada término del cociente coinciden con los de los primeros térmi-
nos de cada dividendo (el original y cada residuo parcial). Cada uno es el resultado de dividir
los correspondientes coeficientes entre 1.
Estas operaciones sólo involucran a los coeficientes, de manera que se puede prescindir
de las x en todas las expresiones.
3. Al efectuar cada resta se cambian los signos al sustraendo y se suman, por lo que el primer
término de cada dividendo se anula.

En vista de las observaciones anteriores, la división se puede simplificar escribiendo solamen-


te los coeficientes del dividendo y el término independiente del divisor, al que se le cambia de
signo para evitar el proceso de cambiarlo cada vez que se tenga que restar.
Finalmente se pueden compactar las restas en una sola línea. Así, para el ejemplo anterior
puede escribirse:
2 −3 0 2 −7
y seguir de acuerdo con las etapas antes descritas.

−3
2 −3 0 2 −7
−6
−6 2 −7

−6
2 −6 2 −7
−12
−10 −7

−10
2 −10 −7
−20
−27
4.2  Funciones polinomiales 145

es decir:
−3 −6 −10

2 −3 0 2 −7
−6 −12 −20
−6 −10 −27

El proceso de dividir −3x 3 + 2 x − 7 entre x − 2 da como cociente −3 x 2 − 6 x − 10 y deja resi-


( )
duo –27. En efecto, compruebe que −3x 3 + 2 x − 7 = (x − 2) −3x 2 − 6x − 10 − 27.
Observe que al escribir los coeficientes del dividendo se tuvo la precaución de poner cero en
el lugar correspondiente al término en x2, que no aparece explícito en el polinomio −3x 3 + 2 x − 7.
En resumen, para dividir un polinomio f (x) entre x − a:

1. Escriba, dentro del calderón de la división, los coeficientes f (x) en el orden que ocupan cuan-
do se escribe el polinomio como dividendo, teniendo cuidado de poner cero en los lugares
correspondientes a las potencias faltantes. Por ejemplo, si f (x) = −3x 2 + 2 x − 7 y a = 2:

−3 0 2 −7
2. Afuera del calderón escriba “a” (note que se está dividiendo entre x − 2).

2 −3 0 2 −7
3. Copie el primer coeficiente del divisor y póngalo en la parte superior del calderón:

−3
2 −3 0 2 −7
4. Multiplique ese número (−3) por (2), súmelo al segundo término dentro del calderón (0) y
escriba la suma en la parte de arriba:
−3 −6
2 −3 0 2 −7
−6
5. Prosiga en forma ordenada (ahora es 2 × − 6 que se suma al 2. El –10 sube).
−3 −6 −10
2 −3 0 2 −7
−6 −12
6. El proceso termina con la última suma, que es el residuo:

−3 −6 −10
2 −3 0 2 −7
−6 −12 −20 (−27)
7. Escriba en el cociente las potencias de x que corresponden, empezando de derecha a izquier-
da, con x0 (que es igual a 1 y no se pone). Entonces la división de −3x 3 + 2 x − 7 entre x − 2
tiene cociente −3x 2 − 6x − 10 y residuo –27.

Ejemplo 4.2.5
Encuentre las raíces racionales de la ecuación 12 x5 + 4x 4 − 33x 3 + 16x 2 + 3x − 2 = 0 y factorícela.
Solución
Note que como los coeficientes de la ecuación son enteros, las posibles raíces racionales son núme-
ros p donde p es un divisor de 2 y q es un divisor de 12; es decir, las raíces racionales pertenecen

{ }
q
al conjunto ±1, ± 2, ± 1 , ± 1 , ± 1 , ± 1 , ± 1 , ± 2 .
2 3 4 6 12 3
146 Unidad 4  Polinomios y teoría de ecuaciones

Observe que como la suma de los coeficientes es cero, 1 es una raíz; entonces, x − 1 divide al
polinomio. En efecto,
12 16 −17 −1 2 0
1 12 4 −33 16 3 −2
12 16 −17 −1 2
4 3 2
(
Entonces, 12 x + 4x − 33x + 16x + 3x − 2 = (x − 1) 12 x + 16x − 17 x 2 − x + 2 .
5 4 3
)
Ahora el problema es encontrar las raíces racionales del factor de la derecha, que es un poli-
nomio un grado menor que el original. Como el coeficiente principal y el término independiente
no han cambiado, las posibles raíces racionales siguen perteneciendo al mismo conjunto.
Se puede ver (división sintética) que 1, −1 y 2 no son raíces.
Entonces ensayamos con el −2, con lo que resulta:
12 −8 −1 1 0
−2 12 16 −17 −1 2
−24 16 2 −2

Como resultado queda 12 x5 + 4x 4 − 33x 3 + 16x 2 + 3x − 2 = (x − 1)(x + 2) 12 x 3 − 8x 2 − x + 1 . ( )


 1 1 1 1 1
Ahora las posibles raíces racionales pertenecen al conjunto ± , ± , ± , ± , ± .
 2 3 4 6 12 
Si se ensaya con 1 resulta:
2
Nota
12 −2 −2 0
1
Ya que el polinomio original es de 12 −8 −1 1
coeficientes enteros, la aparición  2
p 6 −1 −1
de una raíz q fuerza a que el 
polinomio reducido (el último Como resultado queda
cociente) tenga a q como común
divisor (en este caso 2).
1
12 x5 + 4x 4 − 33x 3 + 16x 2 + 3x − 2 = (x − 1)(x + 2) x −  12 x 2 − 2 x − 2
 2
( )
1
= 2 (x − 1)(x + 2) x −  6x 2 − x − 1 .
 2
( )

En efecto,
1 1 1
Ahora las posibles raíces racionales pertenecen al conjunto ± , ± , ±
2 3 6
.
{ }
6 2 0
1
6 −1 −1
Nota 2
Como 1 sigue siendo candidato,
3 1
2 Como resultado queda
debe seguirse probando como posible
1 1
12 x5 + 4x 4 − 33x 3 + 16x 2 + 3x − 2 = 2 (x − 1) (x + 2)  x −   x −  (6x + 2)
raíz.
 2  2
2
1
= 4(x − 1)(x + 2) x −  (3x + 1)
 2
2
1 1
= 12 (x − 1)(x + 2) x −   x +  .
Nota
Los últimos pasos se pueden cambiar  2  3
por la solución de la ecuación
6x 2 − x − 1 = 0 mediante el uso de la 1 1 1
fórmula general para resolver las
Finalmente, las raíces racionales son 1, − 2, , , − .
2 2 3
ecuaciones de segundo grado.
4.2  Funciones polinomiales 147

Ejemplo 4.2.6
Encuentre las raíces racionales de x5 − 16x 4 + 93x 3 − 254x 2 + 332 x − 168 = 0 x.
Solución
Como el polinomio es mónico, las posibles raíces son enteras y pertenecen al conjunto
{±1, ± 2, ± 3, ± 4, ± 6, ± 7, ± 8, ± 12, ± 14, ± 21, ± 24, ± 28, ± 42, ± 56 ± 84, ± 168}.
Es claro que evaluar el polinomio con x = 1 es equivalente a sumar sus coeficientes, mientras
que cuando x = −1, los coeficientes correspondientes a las potencias impares de la variable cam-
bian de signo. Como al evaluar el polinomio en los valores 1 y ­­−1 se obtienen valores distintos de
cero, los factores (x − 1) y (x + 1) no lo dividen:

(1)5 − 16(1)4 + 93(1)3 − 254(1)2 + 332 (1) − 168 = 1 − 16 + 93 − 254 + 332 − 168 = −12
(−1)5 − 16(−1)4 + 93(−1)3 − 254(−1)2 + 332 (−1) − 168 = −1 − 16 − 93 − 254 − 332 − 168 = −874
Por lo tanto, pruebe con 2:
1 −14 65 −124 84 0
2 1 −16 93 −254 332 −168
2 −28 130 −248 168

(
Entonces, x5 − 16x 4 + 93x 3 − 254x 2 + 332 x − 168 = (x − 2) x 4 − 14x 3 + 65x 2 − 124x + 84 . )
Como el término independiente cambió y hemos probado que 1 y ­­−1 no son raíces, el conjun-
to de posibles raíces racionales es ahora {±2, ± 3, ± 4, ± 6, ± 7, ± 12, ± 28, ± 42, ± 84} .
Así, es conveniente continuar probando con 2:
1 −12 41 −42 0
2 1 −14 65 −124 84
2 −24 82 −84

(
El resultado es x5 − 16x 4 + 93x 3 − 254x 2 + 332 x − 168 = (x − 2)2 x 3 − 12 x 2 + 41x − 42 y las )
posibles raíces racionales pertenecen al conjunto {±2, ± 3, ± 6, ± 7, ± 14, ± 21, ± 42} . Nuevamente
se recomienda continuar con 2:

1 −10 21 0
2 1 −12 41 −42
2 −20 42

El resultado es x5 − 16x 4 + 93x 3 − 254x 2 + 332 x − 168 = (x − 2)3 x 2 − 10 x + 21 . ( )


Ahora las posibles raíces racionales pertenecen al conjunto {±3, ± 7, ± 21} . Pruebe con 3. No
es necesario investigar las raíces siguiendo el orden natural (lexicográfico); la regla de Descartes y
la aparición de cotas pueden dar información que reduzca el trabajo.

1 −7 0
3 1 −10 21
3 −21
El resultado es x5 − 16x 4 + 93x 3 − 254x 2 + 332 x − 168 = (x − 2)3 (x − 3)(x − 7).
Entonces las raíces racionales son 2, 2, 2, 3, 7.
Note que el polinomio x 2 − 10 x + 21 = 0 se puede descomponer directamente en factores en
la forma x 2 − 10 x + 21 = (x + a )(x + b), de manera tal que a + b = −10 y ab = 21. Entonces a = −3 y
b = −7; por lo tanto, x 2 − 10 x + 21 = (x − 3)(x − 7). 
148 Unidad 4  Polinomios y teoría de ecuaciones

Ejemplo 4.2.7
Encuentre las raíces racionales de la ecuación x 6 − 3x5 − 5x 4 + 15x 3 + 4x 2 − 12 x = 0.
Solución
Como este polinomio carece de término independiente, es conveniente factorizarlo antes de plan-
tear el conjunto de las posibles raíces. Así,
(
x 6 − 3x5 − 5x 4 + 15x 3 + 4x 2 − 12 x = x x5 − 3x 4 − 5x 3 + 15x 2 + 4x − 12 )
y dado que x = (x − 0) , el polinomio queda factorizado en la forma
(
x 6 − 3x5 − 5x 4 + 15x 3 + 4x 2 − 12 x = (x − 0) x5 − 3x 4 − 5x 3 + 15x 2 + 4x − 12 )
es decir, cero es una de sus raíces (cero anula el primer factor). Las posibles raíces del factor de la
derecha pertenecen al conjunto {±1, ±2, ±3, ±4, ±6, ±12}.
Como la suma de los coeficientes es cero y 1 es una raíz, entonces x − 1 divide al polinomio.
En efecto,
1 −2 −7 8 12 0
1 1 −3 −5 15 4 −12
1 −2 −7 8 12

(
Así, x 6 − 3x5 − 5x 4 + 15x 3 + 4x 2 − 12 x = x (x − 1) x 4 − 2 x 3 − 7 x 2 + 8x + 12 . )
En este caso, las posibles raíces racionales que faltan siguen perteneciendo al mismo conjunto:
{±1, ±2, ±3, ±4, ±6, ±12}
y como la suma de los coeficientes es distinta de cero, 1 ya no es raíz; proceda con −1:

1 −3 −4 12 0
−1 1 −2 −7 8 12
−1 3 4 −12

(
Entonces, x 6 − 3x5 − 5x 4 + 15x 3 + 4x 2 − 12 x = x (x − 1)(x + 1) x 3 − 3x 2 − 4x + 12 . )
Al sumar los coeficientes cambiando los signos de aquellos cuyas potencias son impares no se
obtiene cero, es decir, −1 ya no se repite. Las posibles raíces racionales pertenecen al conjunto
reducido {±2, ±3, ±4, ±6, ±12}. Pruebe ahora con 2:
1 −1 −6 0
2 1 −3 −4 12
2 −2 −12

De esta manera, x 6 − 3x5 − 5x 4 + 15x 3 + 4x 2 − 12 x = x (x − 1)(x + 1)(x − 2) x 2 − x − 6 . ( )


Ahora las posibles raíces racionales pertenecen al conjunto{±2, ±3}, pero x = 2 ya no es raíz
(división sintética). Pruebe con −2:

1 −3 0
−2 1 −1 −6
−2 6
El resultado es x 6 − 3x5 − 5x 4 + 15x 3 + 4x 2 − 12 x = x (x − 1)(x + 1)(x − 2)(x + 2)(x − 3) .
Entonces, las raíces racionales son −2, −1, −0, 1, 2, 3.

Raíces complejas
En el campo  de los números complejos existe una función, la conjugación, η :  → , que aso-
cia a cada número complejo z = a + bi , su conjugado z = a − bi , y que puede verse, geométrica-
mente, como la reflexión de los puntos del plano (­números complejos) sobre el eje de las abscisas.
Recuerde que la función η tiene las propiedades siguientes:
4.2  Funciones polinomiales 149

 Teorema  4.2.1
Si η(z) se denota como z , entonces ∀ z, w ∈  se cumple:
1. z = z   El conjugado del conjugado de z es z (es decir, η es autoinversa).
2. z + w = z + w ∴ z − w = z − w   El conjugado de la suma es la suma de los conjugados (la
conjugación conmuta con la suma).
3. zw = z w ∴ si w ≠ 0 (z / w) = z / w   El conjugado de un producto es el producto de los con-
jugados (la conjugación conmuta con el producto).
4. z = z si y sólo si z ∈   La conjugación deja fijo a ℝ.

Corolario 1
Si un complejo z es cero de un f(x) con coeficientes reales, entonces z también, y ambos
complejos son raíces de igual multiplicidad de la ecuación f(x) = 0.

Demostración
n
Si f (x) = a0 + a1x +  + an x n , ai ∈ , i = 1, 2, ..., n y z ∈  es tal que 0 = f (z ) = ∑ ai z i :.
n 0
Al conjugar ambos lados de la igualdad 0 = ∑ai z i se obtiene
0
.
Tanto 0 como cada ai son números reales (y, por lo tanto, coinciden con sus conjuga-
dos), y como además se puede probar (por inducción) que ∀ n ∈ , z n = ( z ) n , de
0 = a0 + a1 z +  + an z se obtiene 0 = a0 + ∑ ai (z ) = f (z ).
n i

Finalmente, si z ∈  es un cero de multiplicidad m de f(x), (x − z ) m f (x), es decir,


∃ g (x) ∈  [x] ∋ f (x) = (x − z ) m g (x), y conjugando (note que f (x) ∈  [x ] ⇔ f (x) = f (x),
f (x) = (x − z ) m g (x), es decir, (x − z ) m f (x), y por lo tanto, z es un cero f(x), de multipli-
cidad al menos m. Un argumento análogo muestra que la multiplicidad de z es mayor o igual
a la de z y que, por lo tanto, son de igual multiplicidad como ceros de f(x).

La discusión anterior muestra que si un complejo z es raíz de una f(x) = 0 con coeficientes
reales, entonces z también y que, por lo tanto, (x − z ) y (x − z ) son divisores de f(x).
Dado que (x − z) y (x − z ) son primos relativos, (x − z)(x − z ) f (x).
Note que si z = a + bi, (x − z )(x − z ) es (x − a − bi )(x − a + bi ) = x 2 + 2 ax + a 2 + b2 ∈  [x] y,
f (x)
por lo tanto, = g (x) ∈  [x], que es de grado 2 unidades menor que el de f(x), lo que
(x − z)(x − z )
en general facilita la búsqueda de las demás raíces.

Raíces “surd”
El razonamiento anterior también se aplica en el caso de los elementos del campo
( p ) = {a + b p; a, b ∈ , p primo}

en donde la función η : ( p ) → ( p ), que está definida: η(a + b p ) = a − b p , tiene las mis-


mas propiedades que la conjugación compleja; es decir, es un automorfismo de campos que deja
fijos a los números racionales. Entonces si un “surd” a + b p es raíz de una ecuación f(x) = 0 con
coeficientes racionales, su conjugado a − b p también lo es y de la misma multiplicidad.
La demostración es análoga a la anterior.
150 Unidad 4  Polinomios y teoría de ecuaciones

Ejemplo 4.2.8
Si se sabe que 1 − 2 3 es raíz de x 4 − 2 x 3 − 10 x 2 − 2 x − 11 = 0 , de acuerdo con el corolario 1,
( ) (
1 + 2 3 también es raíz y, por lo tanto, x − 1 − 2 3 y x − 1 + 2 3 dividen al polinomio. Como )
éstos son factores primos relativos, su producto también divide. Es decir, x − 1 + 2 3 x − 1 − 2 3 ( )( )
es un divisor del polinomio original. Para encontrar el producto, los factores se pueden agrupar
( )( )
en la forma (x − 1) + 2 3 (x − 1) − 2 3 , que, como se ve, resulta una diferencia de cuadrados, es
( )( ) ( )
2
decir, (x − 1) + 2 3 (x − 1) − 2 3 = (x − 1)2 − 2 3 = x 2 − 2 x − 11 , que es un polinomio con coefi-
cientes enteros.
x2 +0x +1
x2 −2x −11 x4 −2x3 −10x2 −2x −11
−x4 +2x3 +11x2
0x3 +x2 −2x
0x3 +0x2 +0x
x2 −2x −11
−x2 +2x +11
0
Note que las raíces que faltan son los ceros del polinomio que está en el numerador, o sea, 
x2 + 1.
( )(
Entonces, x 4 − 2 x 3 − 10 x 2 − 2 x − 11 = x − 1 + 2 3 x − 1 − 2 3 (x + i )(x − i ). )
Finalmente, los ceros de f (x) = x 4 − 2 x 3 − 10 x 2 − 2 x − 11 son 1 − 2 3, 1 + 2 3 , i , −i 

Ejemplo 4.2.9
Se sabe que i es raíz de x 4 − 7 x 3 + 13x 2 − 7 x + 12 = 0. Encuentre las otras raíces.
Solución
Como i es raíz, de acuerdo con el teorema anterior, −i también, y, por lo tanto, el producto
(x − i )(x + i ) = x 2 + 1 divide al polinomio. Al efectuar la división se obtiene:
x2 −7x +12
x2 +0x +1 x4 −7x3 +13x2 −7x +12
−x4 +0x3 −x2
−7x3 +12x2 −7x
7x3 +0x2 +7x
12x2 +0x +12
−12x2 +0x −12
0
Note que el procedimiento anterior puede simplificarse empleando solamente los coeficientes.
Es decir,
1 −7 12
1 0 1 1 −7 13 −7 12
−1 0 −1
−7 12 −7
7 0 7
12 0 12
−12 0 −12
0
4.2  Funciones polinomiales 151

( )( )
Entonces, x 4 − 7 x 3 + 13x 2 − 7 x + 12 = x 2 + 1 x 2 − 7 x + 12 = (x − i ) (x + i ) x 2 − 7 x + 12 . ( )
Proceda ahora a buscar los ceros de la función f (x) = x 2 − 7 x + 12.
Las posibles raíces están en el conjunto {±1, ± 2, ± 3, ± 4, ± 6, ± 12} , y puede probarse por
división sintética que ni ±1 ni ±2 lo son; por lo tanto, pruebe con 3.

1 −4 0
3 1 −7 12
3 −12

Entonces, x 4 − 7 x 3 + 13x 2 − 7 x + 12 = (x − i )(x + i )(x − 3)(x − 4).


Finalmente, los ceros de f (x) = x 4 − 7 x 3 + 13x 2 − 7 x + 12 son i, − i, 3, 4.

Ejemplo 4.2.10
Encuentre las raíces de la ecuación 12 x 7 − 32 x 6 + 39x5 + 5x 4 − 28x 3 + 16x 2 + 20 x + 4 = 0, sabiendo
que 1 − i es una raíz de multiplicidad 2.
Solución
De acuerdo con el teorema 4.2.1, si 1 − i es una raíz doble de la ecuación, entonces su conjugado
también lo es, por lo que el producto

[(x − 1 − i )(x − 1 + i )] 2 = (x2 − 2x + 2)


2
= x 4 − 4x 3 + 8x 2 − 8x + 4
divide al polinomio original. Al efectuar la división se obtiene:

12 16 7 1
1 −4 8 −8 4 12 −32 39 5 −28 16 20 4
−12 48 −96 96 −48
16 −57 101 −76 16
−16 64 −128 128 −64
7 −27 52 −48 20
−7 28 −56 56 −28
1 −4 8 −8 4
−1 4 −8 8 −4
0

Entonces,

( ) (12x3 + 16x2 + 7x + 1)
2
12 x 7 − 32 x 6 + 39x5 + 5x 4 − 28x 3 + 16x 2 + 20 x + 4 = x 2 − 2 x + 2
(
= [(x − 1 − i )(x − 1 + i )] 12 x 3 + 16x 2 + 7 x + 1 .
2
)
Ahora el problema consiste en encontrar los ceros del polinomio f (x) = 12 x 3 + 16x 2 + 7 x + 1.
Nuevamente, como los coeficientes de la ecuación son enteros, las posibles raíces racionales
son números qp donde p es un divisor de 12 y q es 1; es decir, las raíces racionales pertenecen al
 
conjunto ±1, ± 1 , ± 1 , ± 1 , ± 1 , ± 1 .
 2 3 4 6 12 
Como todos los coeficientes f(x) son positivos, la ecuación f(x) = 0 no puede tener raíces
positivas, por lo que deben probarse solamente los “sospechosos” negativos.
Al evaluar el polinomio en −1 se obtiene

12 (−1)3 + 16(−1)2 + 7 (−1) + 1 = −12 + 16 − 7 + 1 = −2


152 Unidad 4  Polinomios y teoría de ecuaciones

lo que demuestra que −1 no es raíz.


1
Se sugiere probar con − .
2
12 10 2 0
1
− 12 16 7 1
2
−6 −5 −1


1
( )
Entonces, 12 x 3 + 16x 2 + 7 x + 1 =  x +  12 x 2 + 10 x + 2 = (2 x + 1) 6x 2 + 5x + 1 .
2
( )
1
Al probar nuevamente con − se encuentra:
2
6 2 0
1
− 6 5 1
2
−3 −1

Entonces, 12 x + 16x + 7 x + 1 = (2 x + 1) (3x + 1).


3 2 2

1 1
Como 3x + 1 = 0 tiene raíz x = − , y 2x + 1 = 0, x = − , las raíces del polinomio original son
3 2
1 1 1
1 + i, 1 + i, 1 − i, 1 − i, − , − , −
2 2 3

Ejemplo 4.2.11
Sea f (x) = 2 x10 − 3x 9 + x8 − 16x 7 + 12 x 6 − 22 x5 + 26x 4 − 8x 3 + 10 x 2 + x − 3 un polinomio del que
se sabe (de alguna manera) que i es un cero de multiplicidad 2, y se desea resolver la ecuación
f (x) = 0. Puesto que f (x) ∈ [x], y de acuerdo con el teorema anterior, se sabe que entonces 
(x − i) 2 y también (x + i)2 dividen a f(x).
Solución
( )
2
El producto (x − i )2 (x + i )2 = x 2 + 1 = x 4 + 2 x 2 + 1 divide a f(x), y al efectuar la división se ob- 
tiene
2 −3 −3 −10 16 1 −3
1 0 2 0 1 2 −3 1 −16 12 −22 26 −8 10 1 −3
−2 0 −4 0 −2
−3 −3 −16 10 −22
3 0 6 0 3
−3 −10 10 −19 26
3 0 6 0 3
−10 16 −19 29 −8
10 0 20 0 10
16 1 29 2 10
−16 0 −32 0 −16
1 −3 2 −6 1
−1 0 −2 0 −1
−3 0 −6 0 −3
−3 0 −6 0 −3
0
Entonces,

2 x10 − 3x 9 + x8 − 16x 7 + 12 x 6 − 22 x5 + 26x 4 − 8x 3 + 10 x 2 + x − 3


( )(
= x 4 + 2 x 2 + 1 2 x 6 − 3x5 − 3x 4 − 10 x 3 + 16x 2 + x − 3   )
= (x 2 + 1) (2 x 6 − 3x5 − 3x 4 − 10 x 3 + 16x 2 + x − 3)
2

= (x − i )2 (x + i )2 (2 x 6 − 3x5 − 3x 4 − 10 x 3 + 16x 2 + x − 3).


2 x10 − 3x 9 + x8 − 16x 7 + 12 x 6 − 22 x5 + 26x 4 − 8x 3 + 104.2 
x 2 Funciones
+ x − 3 polinomiales 153
( )(
= x 4 + 2 x 2 + 1 2 x 6 − 3x5 − 3x 4 − 10 x 3 + 16x 2 + x − 3   )
= (x 2 + 1) (2 x 6 − 3x5 − 3x 4 − 10 x 3 + 16x 2 + x − 3)
2

= (x − i )2 (x + i )2 (2 x 6 − 3x5 − 3x 4 − 10 x 3 + 16x 2 + x − 3).

Ahora se deben encontrar las raíces de 2 x 6 − 3x5 − 3x 4 − 10 x 3 + 16x 2 + x − 3 = 0. En este caso,


las posibles raíces racionales pertenecen al conjunto

{ 1 3
±1, ± , ± , ± 3 .
2 2 }
Otra vez, como la suma de los coeficientes es cero, 1 debe ser raíz:
2 −1 −4 −14 2 3 0
1 2 −3 −3 −10 16 1 −3
2 −1 −4 −14 2 3

(
Entonces, 2 x 6 − 3x5 − 3x 4 − 10 x 3 + 16x 2 + x − 3 = (x − 1) 2 x5 − x 4 − 4x 3 − 14x 2 + 2 x + 3 . )
De esta manera, el problema ahora es encontrar las raíces de 2 x5 − x 4 − 4x 3 − 14x 2 + 2 x + 3 = 0.
En este caso las posibles raíces racionales pertenecen al mismo conjunto, excepto que, como la
suma de los coeficientes es distinta de cero, 1 no lo es y se puede probar por división sintética que
–1 tampoco. Entonces el conjunto de las posibles raíces de la nueva ecuación es

{1 3
± , ± , ±3 .
2 2 }
1
Pruebe con :
2
2 0 −4 −16 −6 0
1 2 −1 −4 −14 2 3
2
1 0 −2 −8 −3

1
Entonces, 2 x 6 − 3x5 − 3x 4 − 10 x 3 + 16x 2 + x − 3 = (x − 1)  x −  2 x 4 − 4x 2 − 16x − 6
 2
( )
(
= (x − 1)(2 x − 1) x 4 − 2 x 2 − 8x − 3 . )
4 2
El problema se ¿reduce? ahora a la solución de la ecuación de 4° grado: x − 2 x − 8x − 3 = 0.
El conjunto de sus posibles raíces racionales es
{±1, ± 3}
pero, como probamos anteriormente, los valores ±1 no son raíces. Pruebe con ±3:

2 6 14 26 72 2 −6 14 −58 168
3 2 0 −4 −16 −6 −3 2 0 −4 −16 −6
6 18 42 78 −6 18 −42 174
Evidentemente, ±3 tampoco son raíces. Entonces,
2 x10 − 3x 9 + x8 − 16x 7 + 12 x 6 − 22 x5 + 26x 4 − 8x 3 + 10 x 2 + x − 3

(
= (x − i )2 (x + i )2 (x − 1)(2 x − 1) x 4 − 2 x 2 − 8x − 3 )
1
Las raíces racionales de la ecuación original son i , i , − i , − i , 1, . ¿Está claro que la ecuación
2
no tiene más raíces racionales?¿Qué hacer ahora? … ¡No se pierda la próxima sección!
Resumen
1. Asegúrese de que f (x) ∈  [x], es decir, el polinomio tiene coeficientes enteros.
2. Escriba los coeficientes en forma ordenada, poniendo cero en el lugar de cada coeficiente de
los términos faltantes.
154 Unidad 4  Polinomios y teoría de ecuaciones

3. Identifique el coeficiente principal y el independiente, an y a0.


4. Haga una lista de “sospechosos” (las posibles raíces racionales), es decir, el conjunto

p 
 ; p a0 , q an , p y q primos relativos
 q 
5. Observe:
•  Si los coeficientes de f(x) son todos positivos, no hay raíces positivas.
•  Si los coeficientes de f(−x) son todos negativos o todos positivos, no hay raíces negativas.
6. Si la suma de los coeficientes de f(x) es cero, 1 es raíz. Si la suma de los coeficientes de f(−x)
es cero, −1 es raíz. Si los últimos r términos del polinomio son cero, 0 es una raíz de multipli-
cidad r. En particular, si el término independiente es cero, 0 es raíz.
7. Si encuentra una raíz, busque las demás en el polinomio degradado, incluida la que encontró
cuando sea el caso (es decir, cuando permanezca en la lista de las posibles).
8. Haga buen uso de la información (raíces irracionales y complejas conjugadas).
Recuerde que, como consecuencia del teorema fundamental del álgebra, todo polinomio de
grado n tiene exactamente n raíces (bien contadas, es decir, cada raíz de multiplicidad r cuenta
como r raíces); por lo tanto, si sólo encontró m raíces racionales (y las buscó bien) con m < n,
faltan n − m raíces que pueden ser irracionales o complejas conjugadas (vea el ejemplo 4.2.10).
A continuación se enuncian cuatro teoremas importantes sin demostración.

 Teorema  4.2.2
Teorema fundamental del álgebra
Todo polinomio f(x) no constante, con coeficientes complejos, tiene (al menos) un cero complejo.
[Para cada ecuación f (x) = 0, si f (x) no es un polinomio constante existe un número complejo z
tal que f (z) = 0.]

 Teorema  4.2.3
Sea K un campo, f (x) ∈ K [x] y f (x) no constante. Entonces existe una extensión F del campo K
(un campo F del cual K es un subcampo) en el que f (x) tiene un cero (al menos uno).

Corolario 16
Existe una extensión del campo K en la que f (x) tiene tantos ceros (bien contados) como
su grado.

 Teorema  4.2.4
Sea f (x) un polinomio de grado n con coeficientes en un campo K. Entonces f (x) tiene a lo más n
raíces en cualquier extensión del campo K.

 Teorema  4.2.5
El campo  de los números complejos es algebraicamente cerrado, es decir, contiene a todas las
raíces de las ecuaciones polinomiales complejas (cada ecuación f (x) = 0 con f (x) ∈ C [x], tiene
todas sus raíces en ).

6La condición de que se trate de campos es esencial para que los teoremas se cumplan. En el conjunto de los cuaternios reales
QR = {a + bi + cj + dk; a, b, c, d ∈ R}, cuyas operaciones cumplen todas las propiedades requeridas por las operaciones de los
campos, excepto la conmutatividad de la multiplicación, el polinomio x2 + 1 tiene un número infinito de ceros, a saber, todos los
cuaternios de la forma bi + cj + dk con b2 + c2 + d2 = 1 (es decir, la ecuación x2 + 1 = 0 tiene tantas raíces como puntos tiene la
esfera con centro en el origen y radio uno).
4.2  Funciones polinomiales 155

Las ecuaciones generales de 2°, 3° y 4° grados


El teorema fundamental del álgebra garantiza la existencia de n raíces (bien contadas) para cada
ecuación polinomial compleja f (x) = 0 de grado positivo n (f (x) ∈  [x], gr f = n), pero no dice
cómo encontrarlas.
Se sabe (como consecuencia de la teoría de Galois) que para la ecuación general de grado n,
con n ≥ 5 no pueden existir métodos que permitan calcular sus raíces a partir de efectuar opera-
ciones racionales (suma, resta, multiplicación o división), más la extracción de raíces n-ésimas
efectuadas con los coeficientes; sin embargo, se conocen fórmulas que permiten resolver las ecua-
ciones polinomiales de grado 1, 2, 3 o 4, y que se discutirán en los párrafos siguientes:
1. La ecuación general de 1° grado ax + b = 0, a ≠ 0 tiene la solución x = − b / a.
2
2. La conocida “fórmula del chicharronero” para la ecuación de 2° grado ax + bx + c = 0,  

a ≠ 0 es x = −b ± b − 4ac , que, como se ve, involucra la extracción de la raíz cuadrada del


2

2a
“discriminante” ∆ = b2 − 4ac (se llama así porque, cuando los coeficientes son reales, permi-
te conocer la naturaleza de sus raíces. En efecto, si Δ es mayor que cero, las raíces de la ecua-
ción son dos números reales distintos. Si Δ = 0, la ecuación tiene una sola raíz real doble 
−b / (2a), y si Δ < 0, las raíces son complejos conjugados).
3. Las fórmulas de Cardano y el método de “completar cuadrados” de Ferrari permiten resolver
las ecuaciones de 3° y 4° grados.

Deducción de la fórmula general para las ecuaciones de 2° grado


Sea ax2 + bx + c = 0, a ≠ 0, a, b, c ∈ una ecuación.
1. Se divide cada miembro entre a, y el término c  a pasa al segundo miembro: x + b x = − c .
/ 2
a a
2. Se agrega el término a cada lado de la igualdad para completar el trinomio cuadrado
2 2 2
perfecto del lado izquierdo x 2 + b x + b =  x + b  = b − c = b − 4ac . Al extraer las
2
a 4a 2
 2a  4a 2 a 4a 2
2
raíces cuadradas de ambos lados de la ecuación se obtiene x + b = ± b − 4ac y, final-
2 2a 2a
mente x = −b ± b − 4ac .
2a

La ecuación de 3° grado
Sea ax3 + b ′x2 + c ′x + d ′ = 0, a, b ′, c′, d ′ ∈ , a ≠ 0.
3 2
1. Se divide entre a y se obtiene x + bx + cx + d = 0. Al definir y d ′ = d / a. Una
observación importante: en casi todos los casos, cuando se trata de resolver una ecuación 
f (x) = 0 conviene transformar el problema en otro en donde f (x) sea un polinomio mónico
(con coeficiente principal 1), lo que en general simplifica los cálculos. Esto se consigue divi-
diendo el polinomio entre el coeficiente principal. El resultado es un polinomio que tiene
exactamente los mismos ceros que el original. En efecto, si g(x) es igual a k f (x), k ≠ 0, g(x) = 0
si y sólo si f (x) = 0.
2. Al hacer el cambio de variable x = y − b / 3 se elimina el término de segundo grado. Entonces,
156 Unidad 4  Polinomios y teoría de ecuaciones

 b2   2b3 bc 
Finalmente, 0 = y3 +  c −  y +  − + d  = y3 + py + q
 3  27 3 

 b2   2b3 bc 
en donde p = c −  ; q =  − +d
 3  27 3 
La ecuación ahora es y3 + py + q = 0.
Se propone entonces el cambio y = u + v y se obtiene u3 + 3u2 v + 3uv 2 + v 3 + p(u + v) + q = 0, es
decir, u3 + (3uv + p)(u + v) + q + v 3 = 0. 3
p p3 3 2 3  p
Al hacer v = − , queda u3 + q − = 0 y equivalentemente ( u ) + qu −   = 0 , que
3u 27 u3 3
3
es una ecuación de 2° grado en u , por lo que

3
p
−q ± q 2 + 4   2 3
3 q q  +  p
u3 = =− ±    
2 2 2 3

u3 tiene tres raíces cúbicas (u1, u2 y u3), y si se denota a una cualquiera de ellas como
2 3
q q p
u = 3 − +   +  
2 2  3 

las otras dos resultan ser uω y uω2, en donde ω = − 1 + 3 i y ω 2 = − 1 − 3 i son dos de las raíces
2 2 2 2
cúbicas de la unidad.
2 3
q q   p
Si ahora se considera como v3 = − 2 −  2  +  3  existen tres valores para v, y si a uno de
   
q  q 2  p 3
ellos lo denotamos como v = 3 − −   +   , se tiene que los otros dos valores para v son vω
y vω2. 2 2  3

Al multiplicar u por v, dadas las identificaciones anteriores se obtiene


 3    q p   q p 
2 2 3 2 3 2 3
q q p  3 −q −  q  +  p  q q
uv =  3 − +   +       
= 3  − +   +     − −   +   
 2 2  3    2 2  3    2 2  3    2 2  3  
       

3
p p
y así: uv = 3  −  = −
 3 3
p
es decir, v satisface la igualdad v = − 3u , que es lo que se pidió en un paso anterior.
2 3 2 3
q q   p q q   p
La moraleja de todo este cuento es que las fórmulas u3 = − 2 +  2  +  3  y v3 = − 2 −  2  +  3 
       
2 3
q  q  p  permiten encontrar un valor para u y otro para v que satisfacen la condición
−   +  
2 2 3
p
anterior, es decir, v = − y, por lo tanto, permiten calcular y1 = u + v , que es una raíz de la
3u
(
ecuación reducida que se deseaba resolver y3 + py + q = 0 .
p
)
Ahora, si u y v son tales que uv = − , las parejas uω con vω2 y uω2 con vω también satisfacen
3
la condición requerida y, por lo tanto,  y2 = uω + v ω2 ,  y3 = uω2 + v ω son las otras dos raíces 
de la ecuación reducida. Finalmente,
b b b
x1 = y1 − ,   x2 = y2 − ,   x3 = y3 −
3 3 3
son las tres raíces de la ecuación original.
4.2  Funciones polinomiales 157

Ejemplo 4.2.12
x 3 − 6x 2 − 12 x − 8 = 0
x = y+2

x3 = y3 + 6y2 + 12y + 8
−6x2 = − 6y2 − 24y − 24
−12x = − 12y − 24
−8 = − 8
x 3 − 6x 2 − 12 x − 8 = y3 − 24 y − 48

p = − 24   q = − 48

 q 2  p 3
∆ =   +   = 576 − 512 = 64 ∴ ∆ =8
2   3 
u3 = 24 + 8 = 8 · 4; u = 2 3 4 , 2 3 4 ω , 2 3 4 ω2

v 3 = 24 − 8 = 8 · 2; v = 2 3 2 , 2 3 2 ω2 , 2 3 2 ω
p
23 4 · 23 2 = 43 8 = 8 = −
3
    ∴ y1 = 2 3 4 + 2 3 2 = 2 ( 3 4 + 3 2 ) ;    x1 = 2( 3 4 + 3 2 + 1)
y2 = 2 3 4 ω + 2 3 2 ω2 = 2 ( 3 4 + 3 2 ω2 ) ;      x2 = 2 ( 3 4 ω + 3 2 ω2 + 1)

y3 = 2 3 4 ω2 + 2 3 2 ω = 2 ( 3 4 ω2 + 3 2 ω) ;    x3 = 2 ( 3 4 ω2 + 3 2 ω + 1) 

Como puede verse,  y1 + y2 + y3 = 0, y1 y2 y3 = 48, como debe ser (relaciones entre raíces y
coeficientes), que es una comprobación (parcial) de que y1, y2 y y3 son las raíces de la ecuación
reducida y3 − 24 y − 48 = 0 . Note que también x1 + x2 + x3 = 6.

La ecuación de 4° grado
Un método general para resolver las ecuaciones de cuarto grado ax 4 + bx 3 + cx 2 + dx + e = 0 con
a, b, c, d , e ∈ , a ≠ 0, consiste en lograr una factorización del polinomio en dos factores de
segundo grado que se resuelven después con la “fórmula del chicharronero”.
La factorización se consigue completando trinomios cuadrados perfectos de la manera que se
ilustra en los siguientes ejemplos.

Ejemplo 4.2.13
x 4 + x 3 − 3x 2 + 7 x − 6 = 0.7

a) Considere los dos primeros términos y complete el trinomio cuadrado perfecto agregando y
2
1 13
restando 4 x ; x 4 + x 3 + 1 x 2 − 13 x 2 + 7 x − 6 = 0 y reordenando  x 2 + x  = x 2 − 7 x + 6.
1 2
4 4  2  4
1 u2
b) Agregue u  x 2 + x  + a cada lado.
 2  4

7 Recuerde que, según la observación que se hizo anteriormente, se considerarán sólo polinomios mónicos (o monificados).
158 Unidad 4  Polinomios y teoría de ecuaciones

2 2 2
 x 2 + 1 x  + u  x 2 + 1 x  + u =  u + 13  x 2 +  u − 7  x + u + 6
       
 2   2  4  4 2  4
2
 1 u  13  u  u2
es decir,  x 2 + x +  =  u +  x 2 +  − 7  x + +6 (4.2.3)
 2 2  4 2  4

c) Encuentre una u que convierta la expresión de la derecha en un trinomio cuadrado perfecto,


2  2   13 
es decir, busque una u que resuelva la ecuación  u − 7  = 4 u + 6   u +  (que es de ter-
2   4   4
cer grado y se conoce como la ecuación auxiliar).
En este caso, resulta u3 + 3u2 + 31u + 29 = 0, una de cuyas raíces es −1. Sea pues u = − 1.
En ejercicios “sencillos” puede ensayarse el método de “tanteo” para encontrar la u
requerida (vea los ejemplos 4.2.14 y 4.2.15).
2 2
La ecuación (4.2.3) queda  x 2 + 1 x − 1  = 9 x2 − 15 x + 25 =  3 x − 5  .
 2 2 4 2 4 2 2
d) Al extraer las raíces, y tomando en cuenta los signos, se obtienen las dos ecuaciones siguien-
tes:
1 1 3 5
i) x 2 + x − = x − , o sea, x 2 − x + 2 = 0.
2 2 2 2
1 1 3 5
ii) x 2 + x − = − x + , es decir, x 2 + 2 x − 3 = 0.
2 2 2 2
e) Compruebe que el procedimiento se ha seguido correctamente, multiplicando i) por ii):

x2 − x + 2
x2 + 2x − 3
− 3x2 + 3x − 6
2x3 − 2x2 + 4x
x4 − x3 + 2x2
x4 + x3 − 3x2 + 7x − 6

( )(
que es el polinomio original. Luego, x 4 + x 3 − 3x 2 + 7 x − 6 = x 2 − x + 2 x 2 + 2 x − 3 = 0. )
f) Resuelva las ecuaciones i) y ii) y compruebe los resultados. La multiplicación efectuada en
el paso e) permite que la comprobación pueda hacerse solamente en los factores i) y ii).

1± 1− 8 1 7 1 7
de x 2 − x + 2 = 0 x = ;       x1 = + i x2 = − i
2 2 2 2 2
−2 ± 4 + 12
de x 2 + 2 x − 3 = 0 x = ; x3 = 1 x4 = −3
2
 1 7   1 7 
g) Finalmente, x 4 + x 3 − 3x 2 + 7 x − 6 = (x − 1)(x + 3)  x − − i  x − + i
 2 2   2 2 
 1 7 1 7 8
ker f = 1, − 3, + i, − i .
 2 2 2 2 

8 El núcleo o kernel de una función f, ker f, representa al conjunto de números complejos tales que, bajo la función polinomial
f (x), van a dar al cero. Es decir, ker f es el conjunto de las raíces de la ecuación f (x) = 0.
4.3  Algunos resultados de la teoría de números y su aplicación 159

Ejemplo 4.2.14

x 4 − 6x 3 + 16x 2 − 54x + 63 = 0
i) x 4 − 6x 3 + 9x 2 + 7 x 2 − 54x + 63 = 0
u2 u2
(x2 − 3x) ( )
2
+ u x 2 − 3x += (u − 7) x 2 + (54 − 3u) x + − 63
4 4
2 2
 x 2 − 3x + u  = u − 7 x 2 + 54 − 3u x + u − 63
  ( ) ( ) (4.2.4)
 2 4
2  u2 
La ecuación auxiliar es (54 − 3u) = 4 − 63  (u − 7); es decir, u3 − 16u2 + 72 u + 1 152 , que
 4 
se puede factorizar (con división sintética) en la forma u3 − 16u2 + 72 u + 1152 = (u − 16) u2 + 72 , ( )
de modo que u = 16 transforma al segundo miembro de la ecuación (4.2.4) en 9x 2 + 6x + 1 , que
es igual a (3x + 1)2 . Entonces,
x 2 − 3x + 8 = ±(3x + 1)

lo que resulta en los polinomios x 2 − 6x + 7 y x 2 + 9, cuyo producto es el polinomio original.


2
El cálculo de u puede efectuarse por tanteos. Para esto, note que si u −63 debe ser un cua-
2 4
drado real, u −63 debe ser mayor o igual que cero, por lo que u2 debe ser u2 ≥ 252, y ∴ u ≥ 16
4
(152 = 225, 225 < 252; 162 = 256, 256 − 252 = 4 . )
El lado derecho de la ecuación (4.2.4), haciendo u = 16, queda 9x2+ 6x + 7, que es igual a 
(3x + 1)2. Ahora puede continuar con el procedimiento indicado.

Ejemplo 4.2.15
Resuelva x 4 − 11x 2 + 28x − 6 = 0.
Observe que, por no existir término en x3, la compleción del primer trinomio cuadrado per-
fecto no tiene que hacerse.

i) x 4 = 11x 2 − 28x + 6.
u2  u2 
ii) x 4 + ux 2 + = (u + 11) x 2 − 28x +  + 6  . (4.2.5)
4  4 
Puede verse (por tanteos) que u = 5 transforma la ecuación (4.2.5) en
2 2
 x 2 + 5  =  4x − 7 
   
 2  2
lo que conduce a la factorización final

( ) (
x 4 − 11x 2 + 28x − 6 = x 2 + 4x − 1 + x 2 − 4x + 6 .  )

4.3 Algunos resultados de la teoría de números


y su aplicación a los polinomios y
a las funciones polinomiales
Recuerde que la suma y el producto de los números enteros tienen entre sus propiedades básicas
las siguientes: ∀ a, b, c ∈ Z.

1. La suma
a) es asociativa: (a + b) + c = a + (b + c).
b) es conmutativa: a + b = b + a.
160 Unidad 4  Polinomios y teoría de ecuaciones

c) tiene neutro aditivo: ∃ 0 ∈ Z ∋ a + 0 = 0 + a = a.


d ) tiene un inverso aditivo en cada entero a: −a; − a + a = 0.
Y, por lo tanto, {Z, +} es un grupo abeliano (o conmutativo).
2. La multiplicación
a) es asociativa: (ab)c = a(bc).
b) es conmutativa: ab = ba.
c) tiene idéntico multiplicativo: ∃ 1∈ , 1 ≠ 0 ∋ a · 1 = a.
d ) se distribuye sobre la suma: (a + b)c = ac + bc.
Con estas propiedades, Z resulta un “anillo conmutativo con uno”.
El producto de dos enteros ab es igual a 0 si y sólo si alguno de los factores es cero;
ab = 0 ⇒ a = 0 o b = 0, lo que equivale a decir que en Z vale la ley de cancelación de factores
iguales que sean diferentes de cero. Es decir que si ab = ac y a ≠ 0, entonces b = c.
Las propiedades 1 y 2 confieren a Z la categoría de dominio entero.
Existe en Z la función valor absoluto que se define:
n si n ≥ 0
∀ n ∈ , n =     o   n = máx { n, − n}
− n si n < 0
es decir, que el valor absoluto de un número entero n es el número no negativo mayor de la pareja n, − n.

 Teorema  4.3.1
De la definición resulta que ∀ n, m ∈ ,
    i) n ≥ 0, n = 0 si y sólo si n = 0.
  ii) nm = n m .
*) n < m si y sólo si −m < n < m ∴(|n| ≤ m si y sólo si −m ≤ n ≤ m).
iii) n + m ≤ n + m .
Propiedades cuya demostración es directa de la definición.

Demostración
En efecto,
  i) Si n es cero, −n también y, por lo tanto, n = 0.
Si no es cero, n o −n es positivo y entonces coincide con n , que, por lo tanto, es positivo.
  ii) En el caso en que n = 0 o m = 0, nm es cero y entonces tanto nm como n m
resultan ser ambas cero y, por lo mismo, iguales entre sí.
Para analizar los otros cuatro casos se puede construir una tabla como la que sigue,
en la que puede verse, comparando las dos últimas columnas, que el teorema es cierto.
Tabla 4.1  Análisis de los casos de la propiedad ii)
n m |n| |m| nm |nm| |n||m|
+ + n m + nm = nm
+ − n −m − −nm = n (−m)
− + −n m − −nm = (−n)m
− − −n −m + nm = (−n)(−m)
*) ⇒
Hipótesis: n < m
PD − m < n < m
 n < m ⇒ m mayor que n y que −n, por lo que n < m, − n < m. Al multiplicar la
segunda desigualdad por −1 se obtiene − m < n, de donde − m < n < m.

Hipótesis: − m < n < m, es decir, n < m y − m < n; por lo tanto, al multiplicar la segun-
da desigualdad por −1 se obtiene − n < m, de donde resulta que m es más grande que
el máximo de { n, − n}, que es n ; es decir, n < m.
4.3  Algunos resultados de la teoría de números y su aplicación 161

Note que el teorema es válido si se consideran las desigualdades débiles.9


iii) PD n + m ≤ n + m .
En efecto, n ≤ n ∴− n <n< n .
Análogamente, m ≤ m ∴ − m < m < m .
Al sumar −( n + m ) ≤ n + m ≤ ( n + m ) , y de la propiedad *) resulta que, por lo tanto:
n+m ≤ n + m .


En el conjunto Z de los números enteros vale, además, lo siguiente:

 Teorema  4.3.2
Algoritmo de la división. Sean a, b ∈ , b ≠ 0. Entonces existen (y son únicos) un cociente q y un
residuo r tales que a = bq + r, 0 ≤ r < b .

Demostración

Demostración de la existencia del cociente q y del residuo r


Sea a no negativo tal que a ≥ b
1.  (si a < b , q = 0 y r = a satisfacen el teorema, ya que
a = 0 b + a, 0 ≤ a < b ).
b ≠ 0 ⇒ b ≥ 1 ∴ a b ≥ a, (a + 1) b > a. Luego, β = {m ∈ + ; m b > a} es no vacío ((a + 1) ∈ β )
((a + 1) ∈ β ) y, por lo tanto, por el principio del buen orden tiene un elemento menor m0, y en vis-
ta de que a ≥ b , m0 es mayor que uno y, por lo tanto, q0 = m0 − 1∈ + , y al ser menor que
m0 no puede estar en β. Luego, q0 b ≤ a. Sea r = a − q0 b , entonces a = q0 b + r 0 ≤ r, y
sólo falta probar que r < b . Suponga que no, es decir, r ≥ b . Luego, r = a − q0 b ≥ b , de
donde a ≥ (q0 + 1) b = m0 b , lo que es absurdo. Por lo tanto, r < b .
q0 si b = b
Finalmente, se define q =  y se obtiene la igualdad deseada:
−q0 si b = −b
a = bq + r,    0 ≤ r < b .
2. Después de haber probado el teorema cuando a es no negativo, considere el caso a < 0.
Entonces, para −a ∈ + y |b| existen q0 , r0 ∈  ∋ −a = q0 b + r0 , 0 ≤ r0 < b . Al multipli-
car por −1,
a = −q0 b − r0  (4.3.1)
Si r0 es r0 = 0, a = −q0 b .
Si r0 no es cero, en la igualdad de la ecuación (4.2.6) sume y reste b , con lo que se obtiene
a = −(q0 + 1) b + b − r0 , y al definir b − r0 = r se tiene a = −(q0 + 1) b + r, 0 ≤ r < b .

−(q0 + 1) si b = b
Finalmente, al hacer q =  se tiene a = bq + r, 0 ≤ r < b .
(q0 + 1) si b = −b

9|a| ≤ x si y sólo si −x ≤ a ≤ x. En efecto, si a ≥ 0, a = x, −a ≤ 0 ∴ −a ≤ a = x ≤ a. Si a < 0, |a| = −a = x, y por lo tanto −a ≤ x. −a > 0


∴ a < −a... (propiedad 1) x = −a ...(2). De (2), −x = a y de (propiedad 1) a < x, y entonces −x ≤ a ≤ x.
162 Unidad 4  Polinomios y teoría de ecuaciones

Demostración
Demostración de la unicidad de q y de r
Suponga que:
a = bq 1 + r1 0 ≤ r1 < b
a = bq 2 + r2 0 ≤ r2 < b y que r1 ≤ r2 .
Entonces, bq1 + r1 = bq 2 + r2 ∴ b( q1 − q 2 ) = r2 − r1 ≥ 0, es decir, b ( r2 − r1 ) , pero r2 − r1 < b ,
de donde r2 − r1 = 0,10 ∴ r2 = r1, b( q1 − q 2 ) = 0 y b ≠ 0, y consecuentemente q1 = q2.


Las propiedades 1 y 2 de las operaciones y el algoritmo de la división caracterizan a las estruc-
turas matemáticas conocidas como anillos euclidianos. En el caso de los enteros, la función eucli-
diana11 es el valor absoluto.
Entre los anillos euclidianos más importantes, además de  están los polinomios  [x] con
coeficientes reales y función euclidiana “grado” (el polinomio cero no tiene grado y por eso en la
definición de “función euclidiana” se excluye el cero del dominio de ésta), y los enteros gaussianos
 [i] = {a + bi ∈ ; a, b ∈}, en donde la función euclidiana es d (a + bi ) = a 2 + b2 .
En el anillo euclidiano de los enteros  existen teoremas que se demuestran usando solamen-
te los axiomas y que, por lo tanto, valen (son teoremas) también en toda estructura en la que se
cumplan los axiomas equivalentes. Tal es el caso del anillo  [x] de los polinomios y el anillo  [i]
de los enteros gaussianos. Recíprocamente, todo teorema en  [i] o en  [x] (de hecho en cualquier
anillo euclidiano), vale también en  (algunos teoremas importantes de la teoría de números 
—aritmética— se demostraron en [i ]).
Entre los teoremas que valen en  y que se utilizarán (sin requerir demostración) en los poli-
nomios se señalan los siguientes:
1. ∀ m, n ∈ , n > 1, m se puede escribir como una suma de múltiplos de potencias de n,
m = a0 + a1n + a2 n2 +  + ak n k con 0 ≤ ai < n, i = 1, 2, , k.
El procedimiento para calcular los coeficientes ai consiste en dividir primero m entre n. Si
m = q0 n + r0 0 ≤ r0 < n, se define a0 = r0 . Se divide ahora q0 entre n, q0 = q1n + r1, 0 ≤ r1 < n y se
hace a1 = r1. Se prosigue dividiendo los cocientes entre n y definiendo como ai a los residuos
correspondientes. El principio del buen orden12 garantiza que finalmente se llegue al residuo cero,
con lo que el proceso termina.

Ejemplo 4.3.1
Exprese 27 como múltiplos de las potencias de 2 (note que en este caso los coeficientes —resi-
duos— sólo pueden ser 0 o 1).
27
13 1 a0 = 1
6 1 a1 = 1 27 = 1 + 1 · 2 + 0 · 22 + 1 · 23 + 1 · 2 4
3 0 a2 = 0
1 1 a3 = 1 27 = 1 + 2 + 8 + 16
0 1 a4 = 1


10 Lema: En . Sean b y c tales que b|c. Entonces c ≠ 0 ⇒ |b| ≤ |c| y por contrapuesta si |b| > |c|, c tiene que ser cero. En efecto, b|c
⇒ ∃ d ∈ ∋ bd = c y, por lo tanto, |b||d| = |c|. Si c ≠ 0 , d y b no pueden ser cero ∴ 1 ≤ |d| y 1 ≤ |b|, y de ahí, |b| ≤ |b||d| = |c|.
11 Una función euclidiana d, en un dominio entero D, es una función d : D* → N, tal que para todos los elementos a, b diferentes

de cero en el dominio d(a) ≤ d(ab) y ∀ a, b ∈ D, b ≠ 0, ∃ q, r ∈ D∋ a = bq + r, r = 0 o d(r) < d (b) (vale el algoritmo de la división).
12 El principio del buen orden para  garantiza que todo conjunto no vacío de enteros positivos (en este caso los residuos) tiene

primer elemento. Al dividir este entre n, el residuo es necesariamente 0.


4.3  Algunos resultados de la teoría de números y su
aplicación
4.3  Algunos resultados de la teoría de números y su aplicación 163

Ejemplo 4.3.2
En  [x] exprese 2 x 4 + 3x − 7 como una suma de múltiplos de potencias de x − 1. Los coeficientes
deben ser ceros o polinomios de grado menor que gr (x − 1) (que es 1), o sea, deben ser constantes.
Mediante la división sintética se obtiene:

(2 = a4 )
2 (8 = a3 )
1 2 6 (12 = a2 )
1 2 4 6 (11 = a1 )
1 2 2 2 5 (−2 = a0 )
1 2 0 0 3 −7

Entonces 2 x 4 − 3x − 7 = −2 + 11(x − 1) + 12 (x − 1)2 + 8(x − 1)3 + 2 (x − 1)4 .  La  comprobación pue-


de hacerse utilizando el triángulo de Pascal de la siguiente manera:

(x − 1)0 = 1
(x − 1) = 1 −1
(x − 1)2 = 1 −2 1

(x − 1)3 = 1 −3 3 −1

(x − 1)4 = 1 −4 6 −4 1

−2 −2
11 (x – 1) 11 −11
12 (x − 1)2 12 −24 12
8(x − 1)3 8 −24 24 −8
2(x − 1)4 2 −8 12 −8 2
2x4 + 3x − 7 2 0 0 3 −7


Ejemplo 4.3.3
Exprese 3x 4 + 2 x 3 − 1 como múltiplos de potencias de x 2 + x + 1 . Usando la división de polino-
mios simplificada (escribiendo sólo los coeficientes):
3 −1 −2
1 1 1 3 2 0 0 −1
−3 −3 −3
−1 −3 0
1 1 1
−2 1 −1
2 2 2
3 1 ; a0 = 3x + 1
3
1 1 1 3 −1 −2
−3 −3 −3
−4 −5 ; a1 = −4x − 5
0
1 1 1 3
3 ; a2 = 3
164 Unidad 4  Polinomios y teoría de ecuaciones

( ) ( )
2
Entonces 3x 4 + 2 x 3 − 1 = (3x + 1) − (4x + 5) x 2 + x + 1 + 3 x 2 + x + 1 .
Comprobación

3x + 1
− 4x 3 − 9x 2 − 9x − 5

3x 4 + 6x 3 + 9x 2 + 6x + 3

3x 4 + 2 x 3 + 0 x 2 + 0x − 1

El máximo común divisor de dos enteros, de dos polinomios, de dos enteros gaussianos o...,
no ambos cero, existe y es combinación lineal de ellos. Este máximo común divisor es múltiplo de
cualquier otro divisor común (en el caso de los enteros, es la menor combinación lineal de ellos).

Definición 4.3.1
Se dice que dos enteros (o polinomios, o...) son primos relativos si su máximo común divisor es
la unidad, lo que se cumple si y sólo si 1 es combinación lineal de ambos.

Ejemplo 4.3.4

1. En , (8, 15) = 1; (1 = 2(8) + (−1) 15)


2. (11, 19) = 1; (1 = 7 (11) − 4(19))
3. En  [x], (x + 1, x + 2) = 1;
1 = (x + 2) − (x + 1)
2
( 2
)
4. x + 1, x + 4 = 1;
1 1
1 = x2 + 4 − x2 + 1
3 3
( ) ( )
( )
5. x + 1, x = 1; 1 = x + 1 − x (x) 
2 2
( )
Note que en  [x] las combinaciones lineales de los polinomios f (x) y g(x) son expresiones de
la forma a (x) f (x) + b (x) g (x), en las que los “coeficientes” a(x) y b(x) son también polinomios.

Máximo común divisor de dos enteros


(algoritmo de Euclides)
Sean a, b ∈ , b ≠ 0.
Entonces, si a b, (a, b) = a . En efecto, (a, b) es el mayor divisor de a y b. El mayor de los
divisores de a es a , y como a b, (a, b) = a .
Por otra parte, (a, b) es la combinación lineal positiva mínima de a y de b, y genera a todas las
combinaciones lineales de a y de b. Por lo tanto, si las combinaciones lineales de a y b (ℒab) coin-
ciden (son iguales) con las de c y d, entonces (a, b) = (c, d ) (vea el ejemplo 4.3.5).
Sean a, b ∈ , b ≠ 0, cuyo máximo común divisor se desea encontrar.
• Divida a/b y sea a = bq + r 0 ≤ r < b . (4.3.1)
Si r es cero, b a, y por lo tanto (a, b) = b , y el proceso termina.
Si r ≠ 0, (a, b) = (b, r) , ya que ℒab = ℒbr. En efecto, sea x  ℒab, es decir, ∃ α, β ∈  ∋ x = αa + βb,
por lo que, sustituyendo a por su valor en la ecuación (4.3.1),
x = α (bq + r) + β b = (α q + β )b + α r ∈ ℒb r ; por lo tanto, ℒab⊂ ℒ.

Sea ahora y ∈ ℒbr ∴ ∃ u, v ∈  ∋ y = ub + vr, y como r = a − bq, y = ub + v(a − bq) = va + (u − vq)


b ∈ ℒab. Luego, ℒb r ⊂ ℒa b y ∴ ℒa b = ℒb r , de donde resulta, que (a, b) = (b, r).
4.3  Algunos resultados de la teoría de números y su aplicación 165

• Divida ahora b entre r : b = q1r + r1 0 ≤ r1 < r y note que ahora (a, b) = (b, r) = (r, r1 ).
Prosiga dividiendo hasta obtener un residuo cero (principio del buen orden). En ese paso, el
divisor es el máximo común divisor buscado.

Ejemplo 4.3.5
(Si (a, b) = (c, d ), entonces ℒa ,b = ℒc , d ).
Demuestre que ℒ15,21 = ℒ9,12 . 

Demostración
Se calcula (15, 21)
1  2 2
15 21 6 15 3 6
6 3 0
3 = 15 − (2 · 6) = 15 − 2 (21 − 15) = 3(15) − 2 (21)
Por lo tanto, (15, 21) = 3
De manera análoga se calcula (9, 12) = 3 :
3 = 12 − 9.
Luego, ℒ15,21 debe ser igual a ℒ9,12 . En efecto, para toda a y toda b en :
15a + 21b = 9xa + 12 yb
5(12 − 9) a + 7 (12 − 9)b
Al desarrollar y reagrupar se obtiene
(−5a − 7b)9 + (5a + 7b)12 ∈  9,12
Análogamente, para toda y en ℒ9,12 :
y = 9a + 12b = 3(3(15) − 2 (21)) a + 4(3(15) − 2 (21))b
y = (9a + 12b)15 − (6a + 8b)21∈ ℒ15,21.

Ejemplo 4.3.6
Encuentre el máximo común divisor de dos números.

(11, 19) = 1
1 1 2  1  1
2 2 3 8 11 19
0 1 2 3 8
Note que el proceso también permite encontrar los coeficientes que se requieren para expresar
(a, b) como combinación lineal de ellos. En el ejemplo, el último residuo diferente de cero, que es
el máximo común divisor de 11 y 19, es 1. Entonces (vea las divisiones),
1= 3−2
2 = 8 − 2 (3) ∴ 1 = 3 − (8 − 2 (3)) = −8 + 3(3)
3 = 11 − 8 ∴ 1 = −8 + 3(11 − 8) = 3(11) − 4(3). Finalmente,
8 = 19 − 11 ∴ 1 = 3(11) − 4(19 − 11) = 7 (11) − 4(19). 

Ejemplo 4.3.7
(15, 51) = 3
2  2  3
3 6 15 51
0 3 6
166 Unidad 4  Polinomios y teoría de ecuaciones

3 = 15 − 2 (6)
6 = 51 − 3(15) ∴ 3 = 15 − 2 (51 − 3(15)) = 7 (15) − 2 (51). 

Fracciones parciales
El teorema fundamental de la aritmética (TFA) asegura que todo entero n mayor que uno se pue-
de escribir como producto (generalizado) de números primos y que esta factorización es única,
excepto por el orden y por asociados.13 Por ejemplo,
12 = 2 · 2 · 3 = 2 · 3 · 2 = 3 · 2 · 2 = 2 (−2)(−3) =  = (−3)(−2)2.
El TFA aplicado a los polinomios dice que en  [x] existen polinomios primos o irreducibles
(que son los de grado 1 o los de grado 2 con discriminante negativo), y que todo polinomio de
grado mayor que cero se puede escribir en forma única, excepto por el orden y por asociados,
como producto de primos. Aquí hay que mencionar que en  [x] cada polinomio f (x) es asociado
con k f (x), k ≠ 0, ya que en este anillo las unidades son todos los polinomios de grado cero, es
decir, las constantes diferentes de cero.
Entre las aplicaciones de este teorema se menciona la que permite encontrar expresiones equi-
valentes a funciones polinomiales racionales (cocientes de polinomios) que se pueden convertir en
sumas de fracciones parciales, con lo que algunas veces se simplifican los procesos que involucran
f (x )
a tales cocientes. La integración de funciones racionales, de la forma , en donde f (x) y g(x)
son polinomios, es un ejemplo de esto. g (x )
Se tienen los teoremas siguientes:

 Teorema  4.3.3
Sea f (x) / g (x) un cociente de polinomios en donde g(x) es el producto de h(x) por k(x) con h(x)
y k(x) primos relativos, es decir, (h (x), k (x)) = 1. Entonces existen polinomios a (x), b (x) ∈  [x]
tales que
f (x ) a (x ) b (x )
= +
g (x ) h (x ) k (x )

Demostración
(h(x), k (x)) = 1 ⇒ ∃ α (x), β (x) ∈  [x], tales que 1 = α (x) h (x) + β (x) k (x); por lo tanto,
f (x) = f (x) ∙ 1 = f (x)(α(x)h(x) + β(x)k(x)). Al dividir entre g (x),

f (x ) f (x ) α ( x ) f ( x ) h (x ) β ( x ) f ( x ) k ( x ) α ( x ) f ( x ) β ( x ) f ( x )
= = + = +
g (x ) h (x ) k (x ) h (x ) k (x ) h (x ) k (x ) k (x ) h (x )
Entonces, a (x ) = β (x ) f (x )
b (x ) = α (x ) f (x ) 

 Teorema  4.3.4
f (x)
Sea f (x) ∈  [x]. Entonces el cociente se puede escribir como una suma de fracciones
a n (x)
α 0 (x) α1 (x) α (x)
+ n −1 + ... + n −k k ,
a (x) a (x)
n
a (x)
en donde cada αi (x) es cero o un polinomio de grado menor que el grado de a(x).
Note que si k ≥ n, el desarrollo termina con un polinomio.

13Las unidades de un anillo son los elementos de éste que tienen inverso multiplicativo. Se define en un anillo A “a es asociado con
b” si y sólo si existe una unidad u ∈ A tal que a = bu. En  las únicas unidades son 1 y −1 y, por lo tanto, cada entero n es asocia-
do sólo con él mismo y con su inverso aditivo.
4.3  Algunos resultados de la teoría de números y su aplicación 167

Demostración
Al desarrollar f (x) como suma de potencias de a(x) se obtiene
f (x) = α0 (x) + α1 (x) a (x) + α2 (x) a 2 (x) +  + α k (x) a k (x)
y al dividir entre an(x),
f (x ) k
= ∑ αi (x) a i − n (x). 
a (x ) i = 0
n

Ejemplo 4.3.8
1. Obtenga el máximo común divisor y expréselo como una combinación lineal.
a) ((x + 1), (x + 2)) = 1
1
1 1 1 2
−1 −1
1
1 = (x + 2) − (x + 1)

(
b) x, x 2 + 1 = 1 )
1 0
1 0 1 0 1
−1 0
1
( )
1 = x 2 + 1 − x (x )

c) ((x 2 + 1), (x 2 + 4)) = 1


1
1 0 1 1 0 4
−1 0 −1
3
( ) (
3 = x2 + 4 − x2 + 1 ∴ 1 = ) (
1 2
3
1
) (
x + 4 − x2 + 1
3
)
(
d) x 2 − 7 x + 12, x 2 − 6x + 5 = 1 )
−1 −1 1
−1 7 1 −6 5 1 −7 12
−1 7 −1 6 −5
1 5 −1 7
−1 7
12
( )
12 = x 2 − 6x + 5 + (x + 1)(−x + 7)
( ) (
12 = x 2 − 6x + 5 + (x + 1)  x 2 − 7 x + 12 − x 2 − 6x + 5  ) ( )
( ) (
12 = (x + 1) x 2 − 7 x + 12 − x x 2 − 6x + 5 . Finalmente, )
1
( 1
) (
1 = (x + 1) x 2 − 7 x + 12 − x x 2 − 6x + 5 . 
12 12
)
Ejemplo 4.3.9
Descomponga en fracciones parciales.
(3x + 1) − (4x + 5)(x 2 + x + 1) + 3(x 2 + x + 1)
2
3x 4 + 2 x 3 − 1
a) =
(x2 + x + 1) (x2 + x + 1)
4 4

3x 4 + 2 x 3 − 1 (3x + 1) (4x + 5) 3
= − +
(x ) (x ) (x ) (x )
2 4 2 4 2 3 2 2
+ x +1 + x +1 + x +1 + x +1
168 Unidad 4  Polinomios y teoría de ecuaciones

b) 2 x − 3x − 7 = −2 + 11(x − 1) + 12 (x − 1) + 8(x − 1) + 2 (x − 1)
4 2 3 4

(x − 1)2 (x − 1)2
2 x 4 − 3x − 7 2 11
=− + + 12 + 8(x − 1) + 2 (x − 1)2
(x − 1)2 (x − 1)2 (x − 1)
x 8 + x 7 + 4x 6 + 5x 5 + 6x 4 + 8x 3 + 4x 2 + 4x + 2
c)
(x2 + 1)
2

Se expresa el numerador como suma de potencias de x 2 + 1 :

( ) ( ) ( ) ( )
2 3 4
x 8 + x 7 + 4x 6 + 5x 5 + 6x 4 + 8x 3 + 4x 2 + 4x + 2 = 1 + x x 2 + 1 + 2 x x 2 + 1 + x x 2 + 1 + x 2 + 1

Entonces,

( ) ( ) ( ) ( )
2 3 4
x 8 + x 7 + 4x 6 + 5x 5 + 6x 4 + 8x 3 + 4x 2 + 4x + 2 1 + x x2 + 1 + 2x x2 + 1 + x x2 + 1 + x2 + 1
=
(x2 + 1) (x2 + 1)
2 2

1 x
( ) ( )
2
= + + 2x + x x2 + 1 + x2 + 1
(x ) (x )
2 2
2
+1 +1

4.4  Métodos numéricos


Introducción
La ciencia y la tecnología tratan de describir fenómenos reales mediante modelos matemáticos
con el fin de que, a través de su planteamiento, resolución, análisis y discusión, sea posible dispo-
ner de un conocimiento más profundo acerca de ellos, así como de su posible evolución posterior.
La matemática aplicada se funda en la búsqueda y aplicación de las herramientas más adecuadas
para la solución de los problemas basados en estos modelos; sin embargo, por diversas razones,
no siempre es posible aplicar los métodos analíticos clásicos en virtud de que
a) no se adecuan al modelo concreto,
b) su aplicación resulta extremadamente compleja,
c) su solución formal es tan complicada que hace imposible cualquier interpretación posterior,
d) no existen métodos analíticos capaces de proporcionar soluciones al problema.
Es en estos casos que los métodos numéricos son de amplia utilidad. Un método numérico es
aquel en el que, mediante una labor de cálculo (que suele ser intensa), es posible obtener solucio-
nes aproximadas de un problema. El esfuerzo de cálculo que implica la mayoría de estas técnicas
hace que su uso esté íntimamente ligado al de las computadoras. De hecho, sin el desarrollo actual
en el campo de la informática resultaría difícil imaginar el nivel de utilización que poseen
los métodos numéricos en ámbitos cada día más diversos. Por ejemplo, en la determinación de los
perfiles de composición en una columna de destilación multicomponente, mediante un algoritmo
numérico, se requiere de una cantidad significativa de cálculos para los que una “calculadora
humana” debería dedicar muchas horas.

Error
El concepto de error es inherente al cálculo numérico. En la solución de problemas es importante
realizar un seguimiento de los errores cometidos a fin de poder estimar el grado de aproximación
de la solución que se obtiene.
Los errores asociados a todo cálculo numérico tienen su origen en:
a) Factores debidos a la formulación del problema.
Entre ellos se incluyen aquellos en los que la definición matemática del problema es sólo una
aproximación a la situación física real. Estos errores son normalmente despreciables; por ejem-
plo, el que se comete al obviar los efectos relativistas en la solución de un problema de mecánica
4.4  Métodos numéricos 169

clásica. En los casos en que estos errores no sean realmente despreciables, la solución será poco
precisa independientemente de la precisión empleada para encontrar las soluciones numéricas.
b) Factores debidos a la obtención de los datos.
Imprecisión de las constantes físicas y de los datos empíricos (en caso de errores en la
medición de éstos y teniendo en cuenta su carácter generalmente aleatorio, el tratamiento
analítico es especialmente complejo pero imprescindible para contrastar el resultado obteni-
do vía un método numérico).
c) Factores que son consecuencia del método empleado para encontrar la solución del problema
(error computacional).
Sus fuentes principales son:
i) Equivocaciones en la realización de las operaciones. Esta fuente de error es bien conocida
por cualquiera que haya realizado cálculos manualmente o empleando una calculadora.
El empleo de computadoras ha reducido de manera significativa la probabilidad de ocu-
rrencia de este tipo de errores. Sin embargo, la probabilidad de que el programador come-
ta uno de éstos (calcular correctamente un resultado erróneo) no es despreciable. Cuando
no es posible verificar que la solución calculada es razonablemente correcta, la posibili-
dad de que se haya cometido un error no debe ser ignorada; sin embargo, ésta no es la
fuente de error más preocupante.
ii) Error causado por algún tipo de aproximación. Generalmente se encuentra asociado a la
sustitución de un proceso infinito por una aproximación finita (en problemas de integra-
ción y/o diferenciación). Por ejemplo, en el cálculo de una función elemental usando
solamente n términos de una expansión en serie de Taylor; en la aproximación de la inte-
gral de una función por una suma finita de los valores de la función, como en el método
de los trapecios; en la resolución de una ecuación diferencial reemplazando las derivadas
por una aproximación (diferencias finitas); en la solución de una ecuación por el método
de Newton-Raphson, proceso iterativo que, en general, converge sólo cuando el número
de iteraciones tiende a infinito. En cualquiera de sus formas, este error se conoce como
error por truncamiento; en estos casos es relevante estimar, o al menos acotar, este error.
Cálculos aritméticos que no pueden realizarse con precisión ilimitada. Muchos números
iii) 
requieren infinitos decimales para ser representados correctamente; sin embargo, para ope-
rar con ellos es necesario redondearlos. Aun en el caso en que un número pueda represen-
tarse exactamente, algunas operaciones aritméticas pueden dar lugar a errores (las
divisiones pueden producir números que deben ser redondeados y las multiplicaciones
dar lugar a más dígitos de los que conviene utilizar); en estos casos el error se denomina
error de redondeo.

Definiciones de error
Ahora que se dispone de una idea concreta del origen y significado de los errores, se puede forma-
lizar el concepto. En general, cuando no se conoce el valor de una cierta magnitud x, es posible
aceptar un valor aproximado x de ella. Para estimar la magnitud del error involucrado se requiere
de dos definiciones básicas:
Error absoluto de x: ea ( x ) = x − x  (4.4.1)
ea ( x ) x − x
Error relativo de x: er ( x ) = = , x ≠ 0 (4.4.2)
x x

Para efectos prácticos se emplea la expresión


ea ( x )
er ( x ) = , x≠0 (4.4.3)
x
En general, el valor de este error no se conoce, ya que no es habitual disponer del valor exac-
to de la magnitud, sino el de una acotación de su valor, esto es, un número ε (x) tal que

ea ( x ) ≤ ε ( x ) (4.4.4)
170 Unidad 4  Polinomios y teoría de ecuaciones

o bien er ( x ) ≤ ε r ( x )  (4..4.5)
De acuerdo con este formalismo, es posible representar un número en la forma siguiente:
x = x ± ε (x ) (4.4.6)
x = x[ 1 ± ε r ( x ) ]

Análisis más completos sobre las


Cálculo de raíces de ecuaciones
causas y predicciones del error se dan El objeto del cálculo de las raíces de una ecuación es determinar los valores de x
en los libros de análisis numérico.
para los que se cumple:
f (x ) = 0 (4.4.7)

La determinación de las raíces de una ecuación es uno de los problemas más antiguos de la
matemática. Su importancia radica en que, en caso de ser posible determinar las raíces de una
ecuación, también lo es la determinación de máximos y mínimos, valores propios de matrices,
resolución de sistemas de ecuaciones lineales y diferenciales, etcétera.
El cálculo de las soluciones de la ecuación (4.4.7) puede llegar a ser un problema muy difícil.
Si f (x) es una función polinomial de grado 1 o 2, existen expresiones simples que permitirán deter-
minar sus raíces, mientras que en la mayoría de los casos de funciones polinomiales de grado 3 o 4
es necesario emplear métodos complejos y laboriosos. Sin embargo, si la función f (x) es de grado
mayor de cuatro, o bien no es una función polinomial, no existe algún procedimiento analítico
conocido que permita determinar las raíces de la ecuación (excepto en casos muy particulares).
La matemática ha desarrollado una serie de reglas que pueden ayudar a determinar las raíces
de una ecuación; por ejemplo, el teorema de Bolzano, que establece que si una función f (x) conti-
nua asume valores de signo opuesto en los extremos de un intervalo dado [a, b], entonces la fun-
ción tiene, al menos, una raíz en dicho intervalo.
En el caso en que f (x) sea una función algebraica (polinomial) de grado n y coeficientes rea-
les, es posible afirmar que tendrá n raíces (reales o complejas).
La propiedad más importante que poseen las raíces racionales de una ecuación algebraica
establece que si el número
p
q
es una raíz racional de la ecuación de coeficientes enteros

a0 + a1x + a2 x 2 +  +an x n = 0, (ai ∈ )

entonces el denominador q divide al coeficiente an y el numerador p divide al término indepen-


diente a0.

Ejemplo 4.4.1

Para calcular las raíces racionales de la ecuación

3x 3 + 3x 2 − x − 1 = 0

primero es necesario efectuar el siguiente cambio de variable:


y
x=
3

y3 y2 y
para obtener 3 + 3 − −1 = 0
33 32 3

Al multiplicar ahora por 32 y3 + 3 y2 − 3 y − 9 = 0


4.4  Métodos numéricos 171

por lo que las posibles raíces de la ecuación son


y = ±9, ± 3, ± 1.
Al sustituir estos valores en la ecuación se obtiene que la única raíz real es
y = −3

−3
es decir, x= = −1
3
y es, además, la única raíz racional de la ecuación. 
La mayoría de los métodos numéricos utilizados para el cálculo de las raíces de una ecuación
son iterativos y se basan en modelos de aproximaciones sucesivas. En estos métodos se trabaja en
la forma siguiente:
A partir de una primera aproximación al valor de la raíz, se calcula una mejor aproximación
aplicando una determinada regla de cálculo, y así sucesivamente, hasta que se obtiene el valor de la
raíz con el grado de aproximación deseado.

Método de iteración de punto fijo


El método de iteración de punto fijo es un método numérico que se aplica para resolver ecuacio-
nes que se puedan expresar en la forma
x = g (x ) (4.4.8)
Así, en el caso de que la ecuación cuyas raíces reales se pretende conocer tenga la forma
f (x ) = 0 (4.4.9)
es posible obtener una expresión equivalente en forma de la ecuación (4.4.8), o bien sumar x en
ambos lados de la ecuación (4.4.9).

Ejemplo 4.4.2

La ecuación polinomial 2 x 4 − 3x 3 + 2 x 2 − 5 x − 5 = 0

se puede transformar, factorizando x en los primeros cuatro términos y despejándola, en


5
x= 3
2 x − 3x 2 + 2 x − 5

Ejemplo 4.4.3
Al sumar x en ambos miembros de la ecuación
tan x − e 3x = 0

se obtiene x = x + tan x − e 3x 

Descripción del método


El proceso de búsqueda de los valores reales de la variable x que satisfacen la ecuación, llamados
raíces de la ecuación, es un proceso iterativo que inicia mediante la suposición de un valor inicial
de la variable x, que se denota xi, cuyo conocimiento permite evaluar la siguiente aproximación
mediante la relación
xi +1 = g (xi )
Este cálculo debe repetirse, asignando el valor calculado xi +1 al valor supuesto xi hasta obte-
ner la exactitud deseada (ε ); es decir, hasta que la diferencia en valor absoluto entre los valores
supuesto y calculado
xi +1 − xi
sea tan pequeña como se requiera.
172 Unidad 4  Polinomios y teoría de ecuaciones

g (x)
x x

g (x)

x0 x2 x3 x1 x4 x0 x1 x3
x2

Figura 4.1  Convergencia del método de iteración de Figura 4.2  Divergencia del método de iteración
punto fijo. de punto fijo.

Visualización gráfica del método


La convergencia del método de iteración de punto fijo se puede visualizar con toda claridad en la
figura 4.1.
La suposición inicial de la variable se identifica en la gráfica con el valor x0. Con ese valor
se calcula g(x0), y se supone que x1 = g(x0); si el valor absoluto de la diferencia |x1− x0| es mayor
que el prefijado para el cálculo (ε );, se calcula la siguiente aproximación por medio de la relación
x2 = g(x1). Este proceso se repite hasta cumplir con la condición xn +1 − xn < ε ,, lo que representa
un punto aproximado de intersección de las dos funciones x y g(x).
Existen funciones para las que el método diverge, como se puede observar en la figura 4.2.
En este caso, la evolución del método permite apreciar que los valores calculados de la va-
riable, a partir de la suposición inicial x0, se alejan del punto de intersección.

Criterio de convergencia del método


de iteración de punto fijo
Suponga, por ejemplo, que una raíz real de una ecuación dada es xr , es decir, que el valor xr satis-
face la relación
xi +1 = g (xi )

en la forma xr = g (xr )

Al restar las dos últimas ecuaciones se obtiene


xr − xi +1 = g (xr ) − g (xi )

Del teorema del valor medio para derivadas se sabe que si la función g(x) es continua en [a, b]
y diferenciable en (a, b), entonces existe un punto c ∈ (a, b) tal que

g (b) − g (a )
g ′(c ) =
b−a
Por lo anterior, existe un punto c en el intervalo determinado por xi y xr tal que

g (xr ) − g (xi )
g ′(c ) =
xr − xi
de donde se obtiene g (xr ) − g (xi ) = g ′(c )(xr − xi )

o bien xr − xi +1 = g ′(c )(xr − xi )


4.4  Métodos numéricos 173

y considerando valor absoluto en ambos miembros


xr − xi +1 = g ′(c ) (xr − xi ) .
Es preciso observar que el término
xr − xi +1
es precisamente el error absoluto en la (i + 1)-ésima iteración, mientras que el término
xr − xi
corresponde al error absoluto en la i-ésima iteración, por lo que la magnitud del error en la
(i + 1)-ésima iteración disminuirá solamente si
g ′(c ) < 1.
En caso contrario, el valor del error irá en aumento.

Secuencia de cálculo
Con el fin de calcular una raíz real de la ecuación
f (x ) = 0
por medio del método de iteración de punto fijo, considere la siguiente secuencia, conocida como
algoritmo:
1. Exprese la ecuación en la forma x = g (x).
2. Suponga un valor inicial de la variable xi y determine una ε (magnitud del error mayor que
cero).
3. Calcule la siguiente aproximación xi +1 con la relación xi +1 = g (xi ).
4. Con el valor de xi +1 , calcule el valor absoluto de la derivada de g (x).
4.1. Si g ′(xi +1 ) < 1, siga al paso 5.
4.2. Si g ′(xi +1 ) ≥ 1, el método no converge y debe utilizarse otro método.

5. Compare el error calculado xi +1 − xi con el error definido en el paso 2.

5.1. Si xi +1 − xi ≥ ε , entonces asigne el valor calculado xi +1 al valor supuesto xi y vuelva al


paso 3.
5.2. Si xi +1 − xi < ε, se concluye que el valor xi +1 es una buena aproximación de la raíz de
f (x) = 0.

Ejemplo 4.4.4
Use el método de iteración de punto fijo para aproximar una raíz real de la función polinomial

2 x 4 − 3x 3 + 2 x 2 − 5 x − 5 = 0

iniciando con x0 = 0 y hasta que xi +1 − xi < ε = 0.01.

Solución
La ecuación polinomial 2 x 4 − 3x 3 + 2 x 2 − 5 x − 5 = 0 se puede transformar en

5
x = g (x ) =
2 x 3 − 3x 2 + 2 x − 5
y la derivada de esta función g(x) es

g ′(x) =
(
−10 3x 2 − 3x + 1 )
(2 x + 2 x − 5)
3 2 2
− 3x

Como fue discutido previamente, el método converge a la raíz real cuando el valor absoluto
de la derivada de la función g(x) evaluada en una vecindad de la raíz es menor que uno.
174 Unidad 4  Polinomios y teoría de ecuaciones

Al aplicar la fórmula iterativa para x0 = 0 se tiene


5 5
x1 = g (x0 ) = = = −1
2 x03 − 3x02 + 2 x0 − 5 2 · 0 − 3 · 02 + 2 · 0 − 5
3

Entonces,
x1 − x0 = − 1 − 0 = 1 > ε

y como el error es mayor que 0.01 se continúa con

g ′(x0 ) =
(
−10 3 · 02 − 3 · 0 + 1 ) =
2
<1
(2 · 0 )
2
3 2
−3 · 0 +2 · 0 −5 5

Al aplicar nuevamente la fórmula iterativa

5 5
x2 = g (x1 ) = =−
2 · (−1) − 3 · (−1) + 2 · (−1) − 5
3 2
12

5 7
x2 − x1 = − − (−1) = = 0.583 > ε
12 12
y

g ′ (x1 ) =
(
−10 3 · (−1)2 − 3 · (−1) + 1 ) =
70
= .486 1 < 1
(2 · (−1) )
2
3
− 3 · (−1) + 2 · (−1) − 5
2 144

Para simplificar este procedimiento es recomendable construir una tabla que permitirá obser-
var la evolución del método y calcular la raíz de la ecuación con la aproximación que se desea.

Tabla 4.2  Resumen del cálculo

I xi xi+1 = g(xi) g′(xi) | xi+1 − xi |


0 0 −1 0.4 1
1 −1 −0.4167 0.4861 0.5833
2 −0.4167 −0.7694 0.6561 0.3527
3 −0.7694 −0.5419 0.5974 0.2274
4 −0.5419 −0.6865 0.6611 0.1445
5 −0.6865 −0.5929 0.6289 0.0936
6 −0.5929 −0.6530 0.6538 0.0601
7 −0.6530 −0.6141 0.6393 0.0389
8 −0.6141 −0.6392 0.6493 0.0251
9 −0.6392 −0.6229 0.6431 0.0162
10 −0.6229 −0.6334 0.6473 0.0105
11 −0.6343 −0.6267 0.6447 0.0068

En la tabla 4.2 se observa que el error aproximado se va reduciendo lentamente. De esta


manera, se requieren 12 iteraciones para reducir el error aproximado a un valor menor de 1%. El
resultado final que se obtiene es
x12 = −0.6267
con un error aproximado de 0.0068.
4.4  Métodos numéricos 175

Ejemplo 4.4.5
Use el método de iteración de punto fijo para aproximar la raíz de la función trascendente
f (x ) = x 2 − 5 x − e x = 0
-0.1
iniciando con x0 = 0 hasta que xi +1 − xi < ε = 0.01.
g′(x)
Solución
-0.2
Si se obtiene la x del término lineal, la ecuación equivale a
x2 − e x
x=
5 -0.3
x2 − e x
de donde g (x ) =
5
2x − e x -0.4
En este caso, la derivada g ′(x) =
5
cuya gráfica es la de la figura 4.3, permite observar que
-0.5
g ′(x) < 1 -1.0 -0.5 0.0 0.5 1.0

x ∈ [−1, 1]
x
Para 2x − e
Figura 4.3  Gráfica de g ′(x) = .
5
lo que es suficiente para inferir que el método converge a la raíz
buscada.
La tabla 4.3 muestra el procedimiento de búsqueda de una raíz real Tabla 4.3  Resumen del cálculo
de la ecuación.
i xi xi+1 = g(xi) | xi+1 − xi |
En este ejemplo, el método solamente requiere cuatro iteraciones
para reducir el error a menos de 1%, lo que corresponde con la aproxima- 0 0 −0.2 0.2
ción de la solución buscada 1 −0.2 −0.1557 0.0443
2 −0.1557 −0.1663 0.0106
x4 = −0.1638.  3 −0.1663 −0.1638 0.0025

Método de bisección
Éste es un método numérico de búsqueda de raíces que permite aproximar las raíces reales de una
ecuación. Consiste en determinar un intervalo en el dominio de la variable independiente que garan-
tice la existencia de un punto interno en donde el valor de la ecuación sea cero.
El método se basa en el teorema del valor intermedio (TVI), que establece que toda función
continua f (x) en un intervalo cerrado [a, b] asume todos los valores que se hallan entre f (a) y f (b);
esto es, que todo número que se encuentre entre f (a) y f (b) es imagen de, al menos, un valor en el
intervalo (a, b).
En caso de que la función evaluada en a y b tenga signos opuestos, f (a ) · f (b) < 0, el cero es
un valor intermedio entre f (a ) y f (b), por lo que existe un punto interior p ∈ (a, b) tal que
f ( p) = 0, lo que asegura la existencia de una solución de la ecuación f (x) = 0. En caso de que se
asigne el punto medio del intervalo como valor de la raíz, el posible error es menor o igual que la
mitad de la longitud del intervalo.

Descripción del método


Sea f (x) una función continua en el intervalo [a, b] tal que f (a ) · f (b) < 0. El método consiste en
lo siguiente:
a+b
Se calcula el punto medio del intervalo [a, b]: m = .
2
Se evalúa la función en ese punto.
176 Unidad 4  Polinomios y teoría de ecuaciones

En caso de que la función evaluada en el punto medio sea igual


f (b) con cero, ya se ha encontrado la raíz requerida.
En caso de que no sea así, se compara el signo de este valor con los
f (a ) y f (b) y se define el nuevo intervalo [a, m] o [m, b] según se
haya determinado en cuál de estos intervalos ocurre el cambio de sig-
a no. Se continúa sucesivamente encerrando la solución en un intervalo
0 cada vez más pequeño, hasta alcanzar la precisión deseada.
b

Visualización gráfica del método


f (a)
El procedimiento descrito se ilustra en la figura 4.4, que representa
a la función f.
En la figura se observa que la función tiene una raíz en el inter-
Figura 4.4  Gráfica de un intervalo en donde f (x) valo [a, b] y que f (a) < 0 y f (b) > 0.
tiene un cero. El punto m1 corresponde con el punto medio del intervalo [a, b]
y el valor de la función en ese punto medio es negativo, por lo que el
nuevo intervalo, en donde se encuentra la raíz, es [m1, b].
La bisección de este intervalo genera un nuevo punto m2 y el
valor de la función es nuevamente negativo, por lo que el intervalo se
reduce a [m2, b].
La siguiente bisección permite obtener el punto m3 y, al evaluar
la función en ese punto, resulta f (m3) > 0. El intervalo de búsqueda
se reduce ahora a [m2, m3].
Este procedimiento continúa hasta que el tamaño del error sea
del orden de magnitud preestablecido (figura 4.5).

Secuencia de cálculo
Para calcular una raíz real de la ecuación
a m1 b
f (x ) = 0
m1 m2 b por medio del método de bisección, considere la siguiente secuencia:
m2 m3 b
Obtenga dos números a y b en el dominio de la función tales que
1. 
Figura 4.5  Ilustración gráfica del método de f (a ) f (b) < 0.
bisección. 2.  Defina la magnitud deseada para el error ε > 0.
a+b
3.  Calcule el punto medio xm del intervalo [a, b] xm = .
2
4. Con el valor de xm, evalúe f (xm).
4.1.  Si f (xm) = 0, ha finalizado el cálculo y la raíz es xm.
4.2.  Si f (xm) ≠ 0, siga al paso 5.
5. El nuevo intervalo, que se seguirá denotando como [a, b], de longitud h = b − a, es
[ ]
5.1.  a, xm , si f (a ) · f (xm ) < 0; la nueva b es xm.
5.2.  [xm , b], si f (a ) · f (xm ) > 0; la nueva a es xm.
6. Compare h con el error definido en el paso 2.
6.1.  Si h/2< ε , el proceso ha terminado.
6.2.  Si h /2 ≥ ε , entonces vuelva al paso 3.

Ejemplo 4.4.6
Use el método de bisección para aproximar una raíz real de la ecuación polinomial

2 x 4 − 3x 3 + 2 x 2 − 5 x − 5 = 0

hasta que xi +1 − xi < ε = 0.01


4.4  Métodos numéricos 177

Solución
Encuentre los valores a y b entre los que exista una raíz de la función polinomial y, en este caso,
se aprovechará que este mismo problema se ha resuelto por el método de iteración de punto fijo,
lo que permite comenzar con los valores a = −1 y b = 0.
Observe que

f (a ) = f (−1) = 2 (−1)4 − 3(−1)3 + 2 (−1)2 − 5(−1) − 5 = 7 > 0

y f (b) = f (0) = 2 · 0 4 − 3 · 03 + 2 · 02 − 5 · 0 − 5 = −5 < 0

de manera que el intervalo de búsqueda de la raíz de la ecuación polinomial es

[a, b] = [−1, 0]
a + b −1 + 0
y su punto medio es xm = = = −0.5
2 2
El valor de la función en el punto medio es

f (xm ) = f (−0.5) = 2 (−0.5)4 − 3(−0.5)3 + 2 (−0.5)2 − 5(−0.5) − 5 = −1.5 < 0

Para definir el nuevo intervalo (1 es mayor que ε = 0.01) se efectúa la operación

f (a ) · f (xm ) = f (−1) · f (−0.5) = 7 (−1.5) = −10.5 < 0

Entonces, [a, b] = [−1, − 0.5]


y así −0.5 − (−1) = 0.5 > ε 

Análogamente al caso anterior, con objeto de simplificar el procedimiento se recomienda


apoyarse en una tabla en la que se podrá observar la evolución del método.

Tabla 4.4  Resumen del cálculo

i a b xm f (a) f (xm) |b− a|

1 −1 0 −0.5 7 −1.5 b = −0.5 0.5


2 −1 −0.5 −0.75 7 1.7734 a = −0.75 0.25
3 −0.75 −0.5 −0.625 1.7734 −0.0562 b = −0.625 0.125
4 −0.75 −0.625 −0.6875 1.7734 0.8045 a = −0.6875 0.0625
5 −0.6875 −0.625 −0.65625 0.8045 0.3614 a = −0.65625 0.0313
6 −0.65625 −0.625 −0.640625 0.3614 0.1495 a = −0.640625 0.0156
7 −0.640625 −0.625 −0.6328125 0.1495 0.0459 0.0078

En la tabla 4.4 se observa que el error aproximado se va reduciendo por mitades, de manera
que se requieren siete iteraciones para reducirlo a un valor menor de 1%. El resultado final que se
obtiene es
x12 = −0.6328125

con un error absoluto aproximado de 0.0078.

Ejemplo 4.4.7
Use el método de bisección para aproximar la raíz de la función trascendente

f (x ) = x 2 − 5 x − e x
178 Unidad 4  Polinomios y teoría de ecuaciones

f (x) hasta que xi +1 − xi < ε = 0.01

Solución
En la figura 4.6 se ilustra la gráfica de la función trascendente en
[−2, 2] , en la que se puede observar que existe una raíz entre –1 y
0, por lo que se define
x
-2 2 a = −1 y b = 0
Comprobación
f (a ) = f (−1) = (−1)2 − 5(−1) − e (−1) ≈ 5.6321 > 0
y f (b) = f (0) = 02 − 5 · 0 − e 0 = −1 < 0
de manera que el intervalo de búsqueda de la raíz de la ecuación
Figura 4.6  Gráfica de f (x) [−2, 2] . polinomial es
[a, b] = [−1, 0]
y su punto medio es
a + b −1 + 0
xm =
= = −0.5
2 2
y el valor de la función en el punto medio calculado es

f (xm ) = f (−0.5) =(−0.5)2 − 5(−0.5) − e (−0.5) ≈ 2.1435 > 0

y para definir el nuevo intervalo se efectúa la operación

f (a ) · f (xm ) = f (−1) · f (−0.5) ≈ (5.6321)( 2.1435 ) ≈ 12.0724 > 0

Entonces, [a, b] = [−0.5, 0]


y así, b − a = − 0.5 − 0 = 0.5 > ε

Con objeto de simplificar el procedimiento se construye la tabla 4.5.

Tabla 4.5  Resumen del cálculo

i a b xm f (a) f (xm) |b− a|


1 −1 0 −0.5 5.6321 2.1435 a = −0.5 0.5
2 −0.5 0 −0.25 2.1435 0.5337 a = −0.25 0.25
3 −0.25 −0.5 −0.125 0.5337 −0.2419 b = −0.125 0.125
4 −0.25 −0.125 −0.1875 0.5337 0.1436 a = −0.1875 0.0625
5 −0.1875 −0.125 −0.15625 0.1436 −0.0497 b = −0.15625 0.0313
6 −0.1875 −0.15625 −0.171875 0.1436 0.0468 a = −0.171875 0.0156
7 −0.171875 −0.15625 −0.1640625 0.0468 0.0015 0.0078

En este ejemplo, el método requiere también de siete iteraciones para reducir el error a menos
de 1%, que corresponde con la aproximación de la solución buscada:
x7 = −0.1640625 

Método de Newton-Raphson
Este método, iterativo, para la búsqueda de raíces de ecuaciones es uno de los más usados y efi-
cientes. A diferencia del método de bisección, el de Newton-Raphson no se inicia con un interva-
lo dado, sino que basa su formulación en un proceso como el que se ilustra a continuación.
4.4  Métodos numéricos 179

f (x) f (x)

(xk , f (xk))

xr xk xr xk +1 xk

Figura 4.7  Gráfica de la k-ésima aproximación Figura 4.8  Gráfica de la (k + 1)-ésima aproxima-
xk. ción xk+1.

Descripción y visualización gráfica del método


Suponga que se tiene la k-ésima aproximación xk a la raíz xr de la función f, lo que se ilustra en
la figura 4.7.
Al trazar la recta tangente a la curva en el punto ( xk , f (xk ) ), que cruza al eje x en el punto
xk+1, se obtiene una aproximación a la raíz xr (figura 4.8).
Para obtener el punto xk+1 se calcula la ecuación de la recta tangente, cuya pendiente se sabe
que es la derivada de la f:
y − f (xk ) = f ′(xk )(x − xk ).

Haciendo y = 0 y despejando x se obtiene


f ( xk )
x = xk − .
f ′(xk )
Considerando ahora que x es el valor de la siguiente aproximación a la raíz, es posible expresar
xk +1 = x
y se obtiene la fórmula iterativa de Newton-Raphson para aproximar la solución de la ecuación
f ( xk )
xk +1 = x k − , f ′(xk ) ≠ 0.
f ′(xk )
Note que el método de Newton-Raphson no trabaja con intervalos que aseguren la presencia
de una raíz de la ecuación y, de hecho, no existe garantía alguna de que el método aproximará a
tal raíz. Desde luego, existen ejemplos en los que este método no converge; sin embargo, en
los casos donde converge a la raíz lo hace con una rapidez impresionante, por lo cual es uno de los
métodos preferidos.
Observe que, en el caso de que f ′(xk) = 0, el método no se puede aplicar; de hecho, esto signi-
fica geométricamente que la recta tangente es horizontal y, por lo tanto, no interseca al eje x en
algún punto o está sobre él, y en este caso, la misma xk es una raíz de f (x) = 0.

Secuencia de cálculo
Con el fin de calcular una raíz real de la ecuación f (x) = 0 por medio del método de Newton-
Raphson, considere la siguiente secuencia:
1. Obtenga una expresión para la derivada de la función f (x).
2. Suponga un valor inicial de la variable, xk, y defina una magnitud del error ε > 0.
180 Unidad 4  Polinomios y teoría de ecuaciones

3. Evalúe la función f (x) y su derivada f ′(x) en el punto x = xk .


4. Compare el valor de la función con el error definido en el paso 2.
4.1. Si f (xk ) < ε , la raíz aproximada es xk.
4.2. Si f (xk ) ≥ ε , continúe en el paso 5.
5. Observe el valor de la derivada.
5.1. Si f ′(xk ) = 0, el método no converge en ese punto. Intente otro valor inicial xk.
5.2. Si f ′(xk ) ≠ 0, continúe con el paso 6.
f ( xk )
6. Calcule la siguiente aproximación xk +1 con la relación xk +1 = xk − .
7. Criterio de convergencia: compare el valor de xk +1 con el de xk . f (xk )

7.1. Si xk +1 − xk ≥ ε, siga al paso 8.
7.2. Si xk +1 − xk < ε, la raíz es xk+1.
8. Asigne al valor supuesto xk el valor calculado xk+1.
9. Vuelva al paso 3.

Ejemplo 4.4.8
Use el método de Newton-Raphson para aproximar una raíz real de la ecuación polinomial
2 x 4 − 3x 3 + 2 x 2 − 5 x − 5 = 0
iniciando con x0 = 0
y hasta que xk +1 − xk < ε = 0.01.

Solución
Dada la función polinomial f (x ) = 2 x 4 − 3 x 3 + 2 x 2 − 5 x − 5
su derivada f ′(x) = 8x 3 − 9x 2 + 4x − 5
el valor inicial de x (k = 0) x0 = 0
y el tamaño del error ε = 0.01. 

Como se indica en la secuencia de cálculo, se deben evaluar la función y su derivada en x0:


f (x0 = 0) = 2 (0)4 − 3(0)3 + 2 (0)2 − 5(0) − 5 = −5
f ′(x0 = 0) = 8(0)3 − 9(0)2 + 4(0) − 5 = −5.

Como f (0) ≥ ε y f ′(0) ≠ 0, se procede con la operación siguiente. Se obtiene el valor de x1


aplicando la fórmula iterativa de Newton-Raphson
f (x0 ) −5
x1 = x0 − =0− = −1
f ′(x0 ) −5

de donde x1 − x0 = − 1 − 0 = 1 > ε
Entonces el valor calculado de x se toma como el valor supuesto y se regresa al paso 3.
f (−1) = 2 (−1)4 − 3(−1)3 + 2 (−1)2 − 5(−1) − 5 = 7
f ′(−1) = 8(−1)3 − 9(−1)2 + 4(−1) − 5 = −26.

Nuevamente, como f (0) ≥ ε y f ′(0) ≠ 0, se procede a obtener el valor de x2


7
x2 = −1 − = −0.7308
(−26)
en donde x2 − x1 = − 0.7308 − (−1) = 0.2692 > ε .
De la misma manera que se hizo en los métodos anteriores con el fin de simplificar el proce-
dimiento, se recomienda construir una tabla en donde se podrá observar la evolución del método
para obtener la raíz aproximada de la ecuación.
4.4  Métodos numéricos 181

Tabla 4.6  Resumen del cálculo

          f (x )
k
k xk f (xk) f ′(xk) xk+1 = xk − •xk+1 − xk•
f ′(xk)
0 0 −5 −5 −1 1
1 −1 7 −26 −0.7308 0.2692
2 −0.7308 1.4630 −15.8513 −0.6385 0.0923
3 −0.6385 0.1208 −13.3049 −0.6294 0.0091

En la tabla 4.6 se puede observar que el método de Newton-Raphson converge a la solución


de una manera significativamente más rápida que los métodos anteriores (iteración de punto fijo
y bisección). El tamaño del error aproximado se reduce al esperado en solamente cuatro iteracio-
nes. El resultado final que se obtiene es
x4 = −0.6294, con un error aproximado de 0.0091.

Ejemplo 4.4.9
Use el método de Newton-Raphson para aproximar la raíz de la función trascendente
f (x) = x 2 − 5 x − e x con xk +1 − xk < ε = 0.01
Solución
Dada la función f (x) = x 2 − 5 x − e x , con derivada f ′(x) = 2 x − 5 − e x.
Se inicia el procedimiento con x0 = 0.
Se evalúa la función y su derivada en x0:

f (0) = (0)2 − 5(0) − e 0 = −1


f ′(0) = 2 (0) − 5 − e 0 = −6

Como f (0) ≥ ε y f ′(0) ≠ 0, se procede a obtener el valor de x1:


−1
x1 = 0 − = −0.1667
−6
en donde x1 − x0 = − 0.1667 − 0 = 0.1667 > ε

entonces f (−0.1667) = (−0.1667)2 − 5(−0.1667) − e −0.1667 = −0.0146


f ′(−0.1667) = 2 (−0.1667) − 5 − e −0.1667 = −6.1798

Como f (0) ≥ ε y f ′(0) ≠ 0, se procede a obtener el valor de x2:

(−0.0146)
x2 = −0.1667 − = −0.1643
(−6.1798)
en donde x2 − x1 = −0.1667 − (−0.1643) = 0.0024 < ε
En este caso no fue preciso construir una tabla, en virtud de que desde esta segunda iteración
el tamaño del error calculado es menor que el propuesto. La aproximación de raíz es

x2 = −0.1643,
con un error aproximado de 0.0024.

Aplicaciones
Raíces cuadradas
Use el método de Newton-Raphson para aproximar raíces cuadradas de números reales positivos.
182 Unidad 4  Polinomios y teoría de ecuaciones

Solución
Sea a > 0. Se requiere calcular un valor x tal que x = a .
Entonces, elevando al cuadrado la expresión anterior,
x 2 = a, o bien x 2 − a = 0.
Se define la función f (x) = x 2 − a con f ′(x) = 2 x.
Al sustituir esta información en la fórmula de Newton-Raphson se obtiene

xk2 − a
xk +1 = xk −
2 xk
y simplificando
1 a 
xk +1 =  xk + .
2 xk 

Por ejemplo, para estimar aproximadamente la raíz de 5 (a = 5), proponga, como valor inicial
de x, x0 = 2 y aplique la fórmula obtenida
1 5
x1 =  2 +  = 2.25,
2 2
lo que arroja un error de tamaño 0.25 > ε.
Tabla 4.7  Resumen del cálculo Los resultados que se consiguen aplicando sucesivamente la fórmula
Aproximación a la raíz Error aproximado
obtenida se resumen en la tabla 4.7.
De aquí es posible concluir que
2
2.25 0.25 5 ≈ 2.236067977.
2.236111111 0.013888888 Este resultado es correcto en todos sus dígitos, comparado con el que
2.236067978 0.000043133
se obtiene en una calculadora comercial.
Esta misma idea puede aplicarse para crear algoritmos que aproximen
2.236067977 5.003 × 10−10
raíces n-ésimas de números reales positivos.

La ecuación de estado de Van der Waals


La ecuación de estado de Van der Waals para un gas es
RT a
p= − 2
v−b v
en donde p es la presión, v el volumen molar, T la temperatura, R la constante universal de los
gases, y a y b las denominadas constantes de Van der Waals, cuyo valor se obtiene a partir de la
temperatura (Tc ) y la presión ( pc ) críticas (para más detalle, revise la última sección de esta uni-
dad) en la siguiente forma:
9R 2Tc2 RTc
a= y b= .
8 pc 3 pc
Ésta es una ecuación que permite predecir, con un menor grado de incertidumbre con respec-
to a la ecuación del gas ideal, el comportamiento presión-volumen-temperatura (pvT) de los gases
y líquidos. Ésta es una ecuación polinomial de grado 3 para el volumen molar, como se puede
observar mediante el siguiente desarrollo.
Dada la ecuación de Van der Waals
RT a
p= − 2
v−b v

multiplicando por (v − b)v 2 p(v − b)v 2 = RT v 2 − a (v − b)


o bien pv 3 − pbv 2 = RT v 2 − av + ab
y al reordenar pv 3 − ( pb + RT )v 2 + av − ab = 0
4.4  Métodos numéricos 183

y finalmente dividiendo entre p, se tiene una ecuación polinomial mónica de grado 3 en el volu-
men molar.

Ejemplo 4.4.10
Considerando el siguiente valor de la constante universal de los gases,
l · atm
R = 0.08205
mol g · °K
calcule, usando el método de iteración de punto fijo, el volumen molar del metanol a temperatura
de 97 °C (370 K) y presión de 1 atmósfera, hasta que el error sea menor que 1 × 10−6.
Compare la eficiencia de este método realizando el mismo cálculo por el método de Newton-
Raphson.

Solución
El metanol tiene las siguientes propiedades críticas:*
Tc = 512.6 K pc = 79.9 atm

por lo que los valores de sus constantes de Van der Waals serán

1 (0.08205)(512.6) l
y b= = 0.175465 .
3 79.9 mol g
De esta manera, la ecuación polinomial en el volumen molar para el metanol será
v 3 − 30.533965v 2 + 24.906925v − 4.370294 = 0.
Para usar el método de iteración de punto fijo se obtiene la siguiente ecuación:
4.370294
vi +1 = 2 = g (vi )
vi − 30.533965vi + 24.906925
−4.370294(2 vi − 30.533965)
y su derivada g ′(vi ) = .
( )
2
vi2 − 30.533965vi + 24.906925

Por otra parte, para asignar un valor inicial del volumen molar en fase vapor es posible recu-
rrir al resultado obtenido vía la ecuación del gas ideal:
RT (0.08205)(370) l
v0 = = = 30.3585 .
p 1 mol g
Con toda la información recabada, ahora se puede construir la tabla sugerida durante el
desarrollo del método de iteración de punto fijo para encontrar la raíz de la ecuación polinomial
(tabla 4.8).
Después de 14 iteraciones, el método de iteración de punto fijo converge a la raíz

v14 = 0.253736.
Es importante observar que esta estimación no depende del valor supuesto inicialmente; se
puede probar también con cero y el resultado que se obtiene con este método es el mismo:
l
v = 0.253736 .
mol g
El valor obtenido, comparado con el volumen molar del metanol calculado a través de la
ecuación del gas ideal, es muy pequeño. Esto sugiere que el metanol, bajo las condiciones de tem-
peratura y presión establecidas en el problema, solamente se puede encontrar en fase líquida.

* Reid, R.C., Prausnitz, J.M. y Sherwood, T.K., The properties of gases and liquids, 3a. ed., McGraw-Hill Book.
184 Unidad 4  Polinomios y teoría de ecuaciones

Tabla 4.8  Resumen del cálculo

i vi vi+1 = g(vi) g′(vi) •vi+1 − vi•


0 30.358500 0.223201 –0.34406 30.135299
1 0.223201 0.240899 0.399531 0.017699
2 0.240899 0.248181 0.423546 0.007281
3 0.248181 0.251302 0.434058 0.003122
4 0.251302 0.252665 0.438685 0.001362
5 0.252665 0.253264 0.440728 0.000599
6 0.253264 0.253528 0.441630 0.000264
7 0.253528 0.253645 0.442029 0.000117
8 0.253645 0.253696 0.442206 0.000052
9 0.253696 0.253719 0.442284 0.000023
10 0.253719 0.253729 0.442318 0.000010
11 0.253729 0.253734 0.442334 0.000005
12 0.253734 0.253736 0.442341 0.000002
13 0.253736 0.253736 0.442343 < 1 × 10–6

Para resolver el problema a través del método de Newton-Raphson se requiere de la función


polinomial

f (v ) = v 3 − 30.533965v 2 + 24.906925v − 4.370294

su derivada f ′(v ) = 3v 2 − 61.067930 v + 24.906925

f (vk )
y la fórmula de Newton-Raphson vk +1 = vk − .
f ′(vk )
Posteriormente se procede a calcular la raíz de la ecuación, con el auxilio de la tabla sugerida
en el desarrollo del método y suponiendo un valor inicial del volumen molar del metanol de cero
(tabla 4.9).

Tabla 4.9  Resumen del cálculo

k vk f (vk) f ′(vk) vk+1 •vk+1 − vk•

0 0 −4.370294 24.906925 0.175465 0.175465


1 0.175465 0.934677 14.284004 0.240900 0.065435
2 0.240900 −0.128205 10.369746 0.253264 0.012363
3 0.253264 0.0044555 9.633068 0.253736 0.000473
4 0.253736 −6.7 × 10−6 9.604912 0.253737 <1 × 10−6

Como se puede observar, el método de Newton-Raphson converge a una aproximación de la


solución, con la misma exactitud, solamente en cinco iteraciones, arrojando un resultado de
l
v5 = 0.253737 .
mol g
Este resultado permite suponer que el método de Newton-Raphson es significativamente más
eficiente comparado con iteración de punto fijo (al menos en este caso eso sucede). Para efectos
de una mejor comparación de eficiencia de los métodos, se puede iniciar el cálculo con el volumen
estimado a través de la ecuación de gas ideal, para lo que se genera la tabla 4.10.
4.4  Métodos numéricos 185

Tabla 4.10  Resumen del cálculo

k vk f (vk) f ′(vk) vk+1 •vk+1 − vk•


0 30.358500 590.051285 935.891739 29.728030 0.630469
1 29.728030 23.814164 860.745021 29.700364 0.0027667
2 29.700364 0.044873 857.501980 29.700311 0.000052
3 29.700311 1.6×10−7 857.495851 29.700311 < 1 × 10–6

Sorprendentemente, el método de Newton-Raphson converge con mayor rapidez (en sólo


cuatro iteraciones), pero a una raíz diferente de la anterior,
l
v4 = 29.700311
mol g
misma que no es posible obtener mediante el uso del método de iteración de punto fijo. De aquí
se puede concluir, por una parte, que el método de Newton-Raphson es más sensible al valor ini-
cial supuesto de la variable, y por la otra, que el metanol, a condiciones de temperatura y presión
de 97 °C y 1 atmósfera, respectivamente, se encuentra tanto en fase líquida como vapor, y que sus
volúmenes molares correspondientes son
l l
v L = 0.253737 ∧ vV = 29.700311 .
mol g mol g

Factor de compresibilidad
El factor de compresibilidad (z) mide las desviaciones de comportamiento que presentan los gases
reales con respecto al gas ideal y se define en la forma siguiente:
pv .
z=
RT
Este factor está acotado en el intervalo [0, 1] en virtud de que, para el caso de líquidos (o
fluidos incompresibles), el factor de compresibilidad z supone valores próximos a cero, mientras
que para gases este factor está limitado al caso ideal (z = 1).
El factor de compresibilidad para diversos compuestos y condiciones de presión y temperatu-
ra se puede obtener a partir de la ecuación de Van der Waals mediante la sustitución del volumen
molar v por una expresión equivalente:
RT
v= z
p
 RT  2 a ab
en la ecuación polinomial,gv 3 −  b + v + v− =0
 p  p p
3 2
 RT  3  RT   RT  2 a RT ab
para obtener   z −b+   z + z− =0
 p   p  p  p p p

 RT   p  2 p p2
z3 − b +   z +a z − ab =0
 p   RT  (RT )2 (RT )3
 pb  pa p2 ab
o bien, z3 −  + 1 z 2 + 2 2 z − 3 3 = 0 .
 RT  R T R T

Ejemplo 4.4.11
Calcule el factor de compresibilidad del ciclohexilbenceno (C12H16) a 2 atmósferas de presión y
temperatura de 125 °C (398 K), e investigue si el compuesto referido se encuentra en una sola fase
o no, sabiendo que sus propiedades críticas son las siguientes:
Tc = 760.98 K pc = 29.73 atm
186 Unidad 4  Polinomios y teoría de ecuaciones

Solución
El ciclohexilbenceno tiene las siguientes constantes de Van der Waals:

9 (0.08205) (760.98)
2 2
l2 · atm
a= = 147.523521
8 29.73 mol g2
1 (0.08205)(760.98) l
y b= = 0.700061
3 29.73 mol g
de manera que la función que representa su factor de compresibilidad es la siguiente:
f (z ) = z 3 − 1.042875 z 2 + 0.276674 z − 0.011862.
Tomando en cuenta que el valor que puede adoptar el factor de compresibilidad satisface
0 ≤ z ≤ 1, es posible emplear el método de bisección, para lo cual es suficiente ubicar al interva-
lo (a, b) dentro de [0, 1], en donde f (a) · f (b) < 0.
Para lograr este objetivo es posible elaborar una gráfica de la función f (z) en el intervalo de
referencia. Al mismo tiempo, esta visualización permitirá conocer si el compuesto ciclohexilben-
ceno a las condiciones de presión y temperatura establecidas presenta más de una raíz de su fun-
ción polinomial.
La figura 4.9 muestra que existen tres raíces del factor de compresibilidad, acotadas en los
siguientes subintervalos:
z (1) ∈ [0, 0.1 ], z (2) ∈ [0.3, 0.4] y z (3) ∈ [0.6, 0.7] .
La termodinámica presenta sólidos argumentos para justifi-
f (z) car que solamente dos de estas raíces tienen significado físico y
corresponden con los factores de compresibilidad en fase líquida
( ) (
z L = z (1) y vapor zV = z (2) . Así,)
z L ∈ [ 0, 0.1] zV ∈ [ 0.6, 0.7 ].

Para calcular el factor de compresibilidad en fase líquida, zL,


por el método de bisección se propone
a = 0, b = 0.1,
z de tal manera que
0.2 0.4 0.6 0.8 f (a ) = 03 − 1.042875 · 02 + 0.276674 · z − 0.011862 < 0
f (b) = (0.1)3 − 1.042875(0.1)2 + 0.276674(0.1) − 0.0011862 > 0.
Figura 4.9  Raíces del factor de compresibilidad.
Entonces,
Tabla 4.11  Resumen del cálculo

i A b zm f (a) f (zm) |b− a|


1 0 0.1 0.05 −0.011862 −0.000511 a = 0.05 0.05
2 0.05 0.1 0.075 −0.000511 0.003444 b = 0.075 0.025
3 0.05 0.075 0.0625 −0.000511 0.001601 b = 0.0625 0.0125
4 0.05 0.0625 0.05625 −0.000511 0.000579 b = 0.05625 0.00625
5 0.05 0.05625 0.053125 −0.000511 0.000043 b = 0.053125 0.003125
6 0.05 0.053125 0.0515625 −0.000511 −0.000232 a = 0.0515625 0.0015625
7 0.0515625 0.053125 0.05234375 −0.000232 −0.000094 a = 0.05234375 0.00078125
8 0.05234375 0.053125 0.05273438 −0.000094 −0.000025 a = 0.05273438 0.00039062
9 0.05273438 0.053125 0.05292969 −0.000025 0.000009 b = 0.05292969 0.00019531
10 0.05273438 0.05292969 0.05283204 −0.000025 −0.000008 a = 0.05283204 0.0000977
11 0.05283204 0.05292969 0.05288087 −0.000008 < 1 × 10−6 0.0000488
4.4  Métodos numéricos
4.4  Métodos numéricos 187

En la iteración 11 de la tabla 4.11 se puede observar que para


zm = 0.05288087,
la función polinomial cumple con el criterio de error establecido
f (zm ) < 1 × 10 −6 ,
por lo que se puede suponer que el factor de compresibilidad en fase líquida del ciclohexilbenceno es
z L = 0.05288087.
En la tabla 4.12 se ilustra el proceso de cálculo del factor de compresibilidad en fase vapor,
que se encuentra en el intervalo [0.6, 0.7].

Tabla 4.12  Resumen del cálculo

i A b zm f (a) f (zm) |b− a|

1 0.6 0.7 0.65 −0.005293 0.001986 b = 0.65 0.05


2 0.6 0.65 0.625 −0.005293 −0.002173 a = 0.625 0.025
3 0.625 0.65 0. 6375 −0.002173 −0.000229 a = 0.6375 0.0125
4 0.6375 0.65 0.64375 −0.000229 0.000844 b = 0.64375 0.00625
5 0.6375 0.64375 0.640625 −0.000229 0.000299 b = 0.640625 0.003125
6 0.6375 0.640625 0.6390625 −0.000229 0.000033 b = 0.6390625 0.0015625
7 0.6375 0.6390625 0.63828125 −0.000229 −0.000099 a = 0.63828125 0.00078125
8 0.63828125 0.6390625 0.63867188 −0.000099 −0.000033 a = 0.63867188 0.00039062
9 0.63867188 0.6390625 0.63886719 −0.000033 <1× 10−6 0.0000488

De manera análoga, para el segundo caso en la iteración 9 se obtiene


zm = 0.63886719,
con el que resulta f (zm ) < 1 × 10 −6.
De aquí se puede considerar que el factor de compresibilidad del ciclohexilbenceno en fase
vapor es, aproximadamente,
zV = 0.63886719. 

El factor o coeficiente de fricción


El factor o coeficiente de fricción es una medida de la resistencia que opone un fluido a desplazar-
se al interior de una tubería y su valor está determinado por una serie de efectos, entre los que se
pueden citar la rugosidad relativa (∈, que es la relación de la altura de las imperfecciones superfi-
ciales con respecto al diámetro interior de la tubería), la velocidad, densidad y viscosidad del
fluido y el diámetro de la tubería (reflejados estos últimos en un número adimensional empleado
en el flujo de fluidos, denominado número de Reynolds [Re]).
En el caso de flujo a régimen laminar (Re < 2 000), el valor del factor de fricción en todas las
tuberías y para cualquier fluido está dado por la expresión
64
f =
Re
Por otra parte, en el caso de flujo turbulento (Re > 5 000) no se dispone de relaciones matemá-
ticas sencillas que permitan obtener la variación de f con el número de Reynolds; sin embargo, el
Instituto de Hidráulica de Estados Unidos y la mayoría de los ingenieros consideran la ecuación
de Colebrook
1  ∈ 2.51 
= −2 log10  + 
f  3.7 D Re f 
como la expresión más aceptable para calcular el factor f en ese régimen.
188 Unidad 4  Polinomios y teoría de ecuaciones

En el tratamiento de esta ecuación es posible considerar que cuando las tuberías son hidráuli-
camente lisas, el valor de la proporción cociente de la rugosidad relativa al diámetro de la tubería

D
es muy pequeño, por lo que se puede despreciar el primer término de los que están entre corche-
tes. Esta misma consideración se aplica en el cálculo del factor de fricción para fluidos no newto-
nianos. De manera análoga, cuando el número de Reynolds es muy elevado, el segundo término
entre corchetes es despreciable; en tales casos la viscosidad prácticamente no influye y el factor de
fricción depende sólo de la rugosidad relativa de la tubería. Este hecho se refleja en los diagramas
de fricción en los que las curvas toman forma horizontal para valores elevados del número de
Reynolds.

Ejemplo 4.4.12
Usando la ecuación de Colebrook, calcule el factor de fricción en una tubería de fierro galvaniza-
do a partir de la siguiente información:
Rugosidad relativa: ∈ = 0.00015 m
F(f )
Diámetro de tubería: D = 0.0508 m (tubería de fierro
galvanizado)
Número de Reynolds: Re = 2 200 507.
hasta que el error ε sea menor que 1 × 10−6.
Solución
La ecuación de Colebrook se puede escribir en la forma siguiente:
f 1  ∈ 2.51 
+ 2 log10  + =0
0.01 0.02 0.03 0.04 0.05 f  3 .7 D Re f 
o bien,

Figura 4.10  Gráfica de la función F (f ). 1  ∈ 2.51 


F( f ) = + 2 log10  +  .
f  3.7 D Re f 

Esta expresión es difícil de tratar algebraicamente (derivar, despejar f ), por lo que, con el fin
de resolverla sin mayores complicaciones, se propone usar el método de bisección. Para esto es
necesario definir un intervalo del factor de fricción [a, b] tal que F(a) · F(b) < 0 a través de una
gráfica de la función F(f ) (figura 4.10).
Como se puede observar en la gráfica, la raíz de la función está en el intervalo [0.02, 0.03],
en donde

1  0.00015 2.51 
F (0.02) = + 2 log10  +  = 0.883854 > 0
0.02 3.7 (0.0508) 2 200 507 0.02 
1  0.00015 2.51 
y F (0.02) = + 2 log10  +  = −0.415307 < 0.
0.03 3.7 (0.0508) 2 200507 0.03 

Entonces, para efectos de simplificar la presentación de resultados y siguiendo la secuencia de


cálculo del método de bisección, se elabora la tabla 4.13.
En la iteración 11 de la tabla 4.13 se puede observar que para
fm = 0.02611267
la diferencia en los límites del intervalo cumple con el criterio de error establecido
b − a < 1 × 10 −6 ,
por lo que se puede considerar que el factor de fricción correspondiente a los datos del ejemplo es
f = 0.02611267.
4.4  Métodos numéricos 189

Tabla 4.13  Resumen del cálculo

i a bm fm F(a) F(fm) |b− a|


1 0.02 0.03 0.025 0.883853 0.136424 a = 0.025 0.005000

2 0.025 0.03 0.0275 0.136424 −0.158267 b = 0.0275 0.002500

3 0.025 0.0275 0.02625 0.136424 −0.016185 b = 0.02625 0.001250

4 0.025 0.02625 0.025625 0.136424 0.058723 a = 0.025625 0.000625

5 0.025625 0.02625 0.0259375 0.058723 0.020930 a = 0.0259375 0.000313

6 0.0259375 0.02625 0.02609375 0.020930 0.002289 a = 0.02609375 0.000156

7 0.02609375 0.02625 0.02617188 0.002289 −0.006969 b = 0.02617188 0.000078

8 0.02609375 0.02617188 0.02613282 0.002289 −0.002345 b = 0.02613282 0.000039

9 0.02609375 0.02613282 0.02611328 0.002289 −0.000029 b = 0.02611328 0.000019

10 0.02609375 0.02611328 0.02610352 0.002289 0.001129 a = 0.02610352 0.000010

11 0.02610352 0.02611328 0.0261084 0.001130 0.000550 a = 0.0261084 0.000005

12 0.0261084 0.02611328 0.02611084 0.000550 0.000260 a = 0.02611084 0.000002

13 0.02611084 0.02611328 0.02611206 0.000260 0.000116 a = 0.02611206 0.000001

11 0.02611206 0.02611328 0.02611267 0.000116 0.000043 < 1×10–6

Vaporizador flash
Cuando se alimentan F mol / h una corriente con n componentes de gas natural al vaporizador flash
(separación en una sola etapa) que se muestra en la figura 4.11, las corrientes de vapor y líquido
resultantes se retiran del vaporizador con flujos molares V y L, respectivamente, mientras que las
fracciones molares de los componentes en las corrientes de alimentación, vapor y líquido se deno-
minan zj ; yj y xj, para valores de j = 1, 2, …, n.
Si la mezcla en el destilador flash se considera en equilibrio líquido-vapor durante una opera-
ción en estado estacionario, entonces el sistema se puede caracterizar bajo los siguientes balances
de materia:
Balance total: F = L + V
Balance individual (para el j-ésimo componente): F z j = Lx j + V y j
yj
Relación de equilibrio líquido-vapor: Kj =
xj
Aquí, Kj es la constante de equilibrio del j-ésimo componente a las condiciones de V
temperatura y presión que prevalecen en el tanque. Con estas ecuaciones y a partir del
hecho que la suma de las fracciones molares de cualquier mezcla con n componentes
debe ser siempre la unidad, es decir,
n n n
Vapor
∑ zj = ∑ yj = ∑ xj = 1
j =1 j =1 j =1 Alimentación

se puede construir una función F


f = f (V ) Líquido

que permita resolver el problema de cálculo de la separación flash.


Del balance de materia total se obtiene la siguiente expresión para L:
L = F −V L
Al sustituir en el balance individual
Figura 4.11  Esquema del vapori-
F z j = (F − V ) x j + V y j
zador flash.
190 Unidad 4  Polinomios y teoría de ecuaciones

y emplear la relación de equilibrio en la forma


yj = K j xj
se obtiene F z j = F x j −V x j +V K j x j
F zj
en donde xj =
V (K j − 1) + F
n n
Ahora, partiendo del hecho que ∑ zj = ∑ xj
j =1 j =1
n n F zj
se puede escribir ∑ zj − ∑ =0
j =1 j =1V (K j − 1) + F
n V (K j − 1) z j + F z j − F z j
al ordenar ∑ =0
j =1 V ( K j − 1) + F
n V (K j − 1) z j
o bien, ∑ =0
j =1V (K j − 1) + F
Finalmente, se obtiene la función que habrá de resolverse:
n V (K j − 1) z j
f (V ) = ∑ .
j =1V (K j − 1) + F
Ejemplo 4.4.13
La tabla 4.14 muestra un conjunto de datos de prueba relativos al “flasheo” de una corriente de
gas natural a 160 libras/pulgada2 absolutas (psia) y 120°F.*

Tabla 4.14  Datos de prueba

f Componente zj Kj
1 CO2 0.0046 1.650
2 CH4 0.8345 3.090
3 C2H6 0.0381 0.720
4 C3H8 0.0163 0.390
5 i-C4H10 0.0050 0.210
6 n-C4H10 0.0074 0.175
7 C5H12 0.0287 0.093
8 Hexanos 0.0220 0.065
9 Heptanos 0.0434 0.036

Ejemplo 4.4.14
Suponga que se alimentan 1 000 mol/h de mezcla a un destilador flash. A partir de los valores de
F, zj, Kj, y usando el método de Newton-Raphson, encuentre la raíz de la función f (V). Además,
calcule los valores correspondientes de L, así como los de las xj y las yj usando las ecuaciones de
balance de materia y la relación de equilibrio.
Solución
Para calcular la raíz de la función (con n = 9)
9 V (K j − 1) z j
f (V ) = ∑
j =1V (K j − 1) + F
* Carnahan B., Luther H.A. y Wilkes J.O. Applied Numerical Methods, Krieger Publishing Company; Malabar, Florida, 1990.
4.4  Métodos numéricos 191

a través del método de Newton-Raphson se requiere, además de su derivada,


9 F (K j − 1) z j
f ′(V ) = ∑
(V (K j − 1) + F )
2
j =1

f (V j )
la fórmula de Newton-Raphson V j +1 = V j − .
f ′(V j )

La solución de este problema puede ser más complicada que la de los ejemplos anteriores, en
virtud de que tanto la función como su derivada son sumas de nueve términos, es decir,
V (K1 − 1) z1 V (K2 − 1) z2 V (K9 − 1) z9
f (V ) = + ++
V (K1 − 1) + F V (K2 − 1) + F V (K9 − 1) + F
F (K1 − 1) z1 F (K2 − 1) z2 F (K9 − 1) z9
y f ′(V ) = + ++
(V (K1 − 1) + F ) 2
(V (K2 − 1) + F ) 2
(V (K9 − 1) + F )2
lo que involucra una cantidad mucho mayor de iteraciones. Sin embargo, es posible proceder a
calcular la raíz de la función con el auxilio de la tabla 14.15 y suponiendo un valor inicial del flujo
de vapor (V) equivalente a 84% del flujo alimentado, lo que corresponde de manera aproximada
con la cantidad de metano (CH4) que está presente inicialmente en la mezcla
V0 = 0.84 F = 0.84(1000) = 840 mol/h
Esta aproximación inicial se propone considerando que la corriente de vapor acarrea (en el
mejor de los casos) solamente al compuesto más ligero de todos los presentes en la mezcla alimen-
tada y, de acuerdo con los datos proporcionados, la constante de equilibrio (que es, de alguna
manera, una medida de la volatilidad relativa) del metano ( KCH4 = 3.09 ), es la mayor en todos los
compuestos presentes, puesto que duplica aproximadamente a la volatilidad relativa más cercana,
la del dióxido de carbono:
KCO2 = 1.65

Tabla 4.15  Resumen del cálculo

j Vf f (Vi) f ′(Vi) Vj+1 |Vj+1 − Vj|

0 840 0.120571 −0.001991 900.544689 60.544689


1 900.544689 −0.050965 −0.004003 887.813935 12.730754
2 887.813935 −0.004032 −0.003394 886.626142 1.187793
3 886.626142 −0.000029 −0.003345 886.611726 0.008877
4 886.611726 −1.6 × 10−9 −0.003344 886.617265 5 × 10−7

Como se puede observar, el método de Newton-Raphson converge a una aproximación de la


solución con un error significativamente pequeño en solamente cinco iteraciones, arrojando un
resultado de

V5 = 886.617265 mol h
De acuerdo con el balance total, el flujo de líquido que abandona el destilador será

L = F −V = 1 000 − 886.617265 = 113.382735 mol h .


Las fracciones molares de la corriente líquida se obtienen mediante la expresión de balance
individual

y las correspondientes a la fase vapor yj = Kj xj .


Los resultados de las fracciones molares para cada compuesto se muestran en la tabla 4.16.
192 Unidad 4  Polinomios y teoría de ecuaciones

Tabla 4.16  Fracciones molares obtenidas para cada


compuesto en cada fase

Compuesto K z x Y
CO2 1.650 0.0046 0.0029 0.0048
CH4 3.090 0.8345 0.2925 0.9038
C2H6 0.720 0.0381 0.0507 0.0365
C3H8 0.390 0.0163 0.0355 0.0138
i-C4H10 0.210 0.0050 0.0167 0.0035
n-C4H10 0.175 0.0074 0.0276 0.0048
C5H12 0.093 0.0287 0.1466 0.0136
Hexanos 0.065 0.0220 0.1286 0.0084
Heptanos 0.036 0.0434 0.2987 0.0108


Adimensionalización de las ecuaciones de balance


El problema de destilación flash multicomponente anterior se puede resolver, de manera análoga,
mediante una adimensionalización de las ecuaciones de balance, lo que permitirá acotar la solu-
ción al intervalo [0, 1], es decir, dado el problema ilustrado en la figura 4.11, en donde se considera
que el destilador flash opera en estado estacionario y que la mezcla está en equilibrio líquido-
vapor, el sistema se puede caracterizar por las mismas ecuaciones de balance y equilibrio del
problema anterior:
yj
V
F = L + V    F z j = Lx j + V y j    K j =
xj
Ahora se propone la siguiente modificación en las ecuaciones balance de materia:
F L +V L V L V
Vapor = ⇒ 1= + ⇒ = 1−
F F F F F F
en donde L y V representan las fracciones de líquido y vapor, respectivamente,
Alimentación
F F
F generadas en el destilador con respecto a la cantidad total alimentada.
Líquido
Por otra parte,

F L V V V
z j = x j + y j ⇒ z j = 1 −  x j + K j x j
F F F  F F
L
y haciendo Θ = V (la fracción del flujo alimentado que sale en la corriente del des-
Figura 4.11  Esquema del vapori- F
zador flash (repetido). tilado), la ecuación que habrá que resolver será
n Θ(K j − 1) z j
∑ = 0.
j =1 Θ (K j − 1) + 1
Solución
Nuevamente, para calcular la raíz de la función
9 Θ(K j − 1) z j
f (Θ) = ∑
j =1 Θ (K j − 1) + 1
mediante el método de Newton-Raphson se requiere la derivada:

f ′(Θ) = ∑
9 (K j − 1) z j
( ( j ) )
2
j =1 Θ K − 1 + 1
4.4  Métodos numéricos 193

y la fórmula de Newton-Raphson
f (Θ j )
Θ j +1 = Θ j − .
f ′(Θ j )

Como se discutió en el problema anterior, se requieren bastantes operaciones por iteración,


pero es posible proceder a calcular la raíz de la función con el apoyo de la tabla 4.17 y suponiendo
un valor inicial de la fracción de flujo de vapor (Θ) equivalente a 0.84, que corresponde aproxi-
madamente con la fracción de CH4 presente en la alimentación:
Θ0 = 0.84
Tabla 4.17  Resumen del cálculo

j Θj f (Θj) f ′(Θj) Θj+1 •Θj+1 − Θj•


0 0.840000 0.120571 −1.991436 0.900545 0.060545
1 0.900545 −0.050965 −4.003294 0.887814 0.012731
2 0.887814 −0.004032 −3.394312 0.886626 0.001188
3 0.886626 −0.000030 −3.344498 0.886617 0.000009
4 0.886617 −1.6  ×  10–9 −3.344498 0.886617 5 × 10–10

En este caso, el método converge a una raíz en cinco iteraciones con un error del orden 10−10:
Θ5 = 0.886617
lo que significa que el flujo de vapor será

V = Θ · F = (0.886617)(1000) = 886.617 mol h


y, de acuerdo con el balance total, el flujo de líquido que abandona el destilador será

L = F − V = 1 000 − 886.617 = 113.383 mol h


Las fracciones molares correspondientes a las corrientes líquida y vapor se muestran en la
tabla 4.18.
Tabla 4.18  Fracciones molares obtenidas para cada
compuesto en cada fase
Compuesto K z X y
CO2 1.650 0.0046 0.0029 0.0048
CH4 3.090 0.8345 0.2925 0.9038
C2H6 0.720 0.0381 0.0507 0.0365
C3H8 0.390 0.0163 0.0355 0.0138
i-C4H10 0.210 0.0050 0.0167 0.0035
n-C4H10 0.175 0.0074 0.0276 0.0048
C5H12 0.093 0.0287 0.1466 0.0136
Hexanos 0.065 0.0220 0.1286 0.0084
Heptanos 0.036 0.0434 0.2987 0.0108

Estimación de las constantes de la ecuación


de estado de Van der Waals
La ecuación de estado de Van der Waals fue diseñada, en principio, para poder representar las
desviaciones del comportamiento de los gases reales con respecto al ideal; sin embargo, debido a
su forma característica se puede observar que es capaz de predecir también el comportamiento de
la fase líquida de manera cualitativa. Así, por ejemplo, el comportamiento pvT del bifenilo
(C12H10), cuyas propiedades críticas son

Tc = 789.00 K, pc = 38.00 atm


194 Unidad 4  Polinomios y teoría de ecuaciones

calculado a través de la ecuación de estado de Van der Waals


RT a
p= − 2
v−b v
con valores de las constantes

l · atm l2 · atm l
R = 0.08205 , a = 124.074 2
, b = 0.56787 ,
mol g · K mol g mol g

se puede representar a través del diagrama p-v ilustrado en la figura 4.13, cuyas trayectorias son
isotermas (líneas a temperatura constante).
Como se puede observar en la figura 4.13, la forma carac-
terística de la ecuación de estado de Van der Waals refleja un
p (atm) comportamiento muy particular de las trayectorias isotermas.
30 Las líneas calculadas para temperaturas menores a la tempera-
T = 900 K tura crítica (650, 700 y 750 K) presentan un máximo y un míni-
25 mo (que no se observa en T = 650 K debido a la escala de la
T = 850 K gráfica). En la línea calculada a la temperatura crítica (Tc = 789
20 T = 789 K
K) se puede observar un punto de inflexión, en donde la gráfi-
ca tiene pendiente cero y las trayectorias calculadas a tempera-
15 T = 750 K turas mayores que la crítica (850 y 900 K) no presentan estos
puntos extremos.
10 Entonces, los valores de las constantes de la ecuación de
T = 700 K
estado de Van der Waals se pueden determinar a partir del
5 cumplimiento de las condiciones, donde
T = 650 K
0 ∂ p  ∂2 p 
0 1 2 3 4 5 6   =  2  =0
v (l / mol)  ∂v  Pc  ∂v  pc

que se conoce como punto crítico.


Figura 4.13  Gráfica de las isotermas para el bifenilo.
Sean Tc , vc y pc la temperatura, volumen y presión en el
punto crítico. Entonces,
∂ p ∂  RT a RTc 2a
  =  − 2 =− + 3 =0 (4.4.10)
 ∂v T ∂ v  v − b v  ( p ,v ,T ) (vc − b) vc
2
( pc ,vc ,Tc ) c c c

∂ p
2
∂  RT 2a  2 RTc 6a
 2  =  − + 3  = − 4 =0 (4.4.11)
( pc ,vc ,Tc ) ( c
∂ vc  (v − b) v − b)
2 3
 ∂v  T v  vc
( pc ,vc ,Tc )
La solución del sistema de ecuaciones simultáneas (4.4.10 y 4.4.11) permite encontrar expre-
siones para las constantes de la ecuación de estado de Van der Waals en función de las propieda-
des críticas Tc y pc .
De la ecuación (4.4.10) se obtiene
vc3 RTc
· a= (4.4.12)
2 (vc − b)2
Al sustituir la ecuación (4.4.12) en la ecuación (4.4.11) resulta
2 RTc 6 vc3 RTc
= · ·
(vc − b)3 vc 2 (vc − b)2
4

2 3
o bien, =
vc − b vc

1
Al reordenar b = vc  (4.4.13)
3
4.4  Métodos numéricos 195

RTc
bajo la consideración de gas ideal vc =
pc
1 RTc
se tiene b= ·  (4.4.14)
3 pc
Para encontrar una expresión de la constante a, se sustituye la ecuación (4.4.13) en la ecua-
ción (4.4.12):
v3 RTc vc3 9RTc 9
a= c · 2
= · = RTc vc
2  1  2 4vc2 8
 vc − vc 
 3 
Al usar nuevamente la ecuación del gas ideal para vc se obtiene:

9 R 2 Tc2
a= · (4.4.15)
8 pc
Las ecuaciones (4.4.14) y (4.4.15) son las expresiones correspondientes a la estimación de los
valores de las constantes de la ecuación de estado de Van der Waals, en función de las propiedades
temperatura y presión críticas.

Ejercicios 4.2

Funciones polinomiales
1. Use la división sintética y el teorema del residuo en los siguientes ejercicios:
a) Si f(x) = 2x4 − 6x3 + x2 − 3x + 4, encuentre f(1),  f(2),  f(−3)
b) Si f(x) = x3 − 13x2 + 8x + 27, encuentre f(−1), f(1), f(2)
c) Si f(x) = 2x3− x + 4, encuentre f(−5),  f(4),  f(3)
d) Si f(x) = x4 − 2x3 + x2 − 2x + 1, encuentre f(−3),  f(3),  f(−2),  f(1),  f(1),  f(−1)
e) Si f(x) = x4 − 3x2 − x + 2, encuentre  f( 1),  f(−1),  f(2)  f(−2),  f(3),  f(−3) y  f(4)
2. Demuestre que (x − a) es un factor de f(x)
a) Si a = 3 y f(x) = x4 − 8x3 + 23x2 − 28x + 12
b) Si a = − 2 y f(x) = 6x3 − 30x2 − 7x +10
3
c) Si a = −2 y f(x) = 2x5 + x4 − 12x3 + x2 + 20x −12
d) Si a = − i y f(x) = x4 + 4x3 + 5x2 + 4x + 4
e) Si a = 5 y f(x) = x5 − 2x4 − 10x3 + 16 x2 + 25x − 30
f) Si a = − 21 y f(x) = 4x7 + 8x6 − 15x5 −23x4 + 21x3 + 15x2 − 8x − 4
g) Si a = − 3 y f(x) = x5 + 15x3 − 10x2 − 60x − 72
3. Encuentre todos los ceros del polinomio (las raíces de f(x) = 0), haga una lista de ellas y escriba
el polinomio como un producto de factores lineales.
a) f(x) = x4 − 8x3 + 23x2 − 28x + 12
b) f(x) = 6x3 − 30x2 − 7x + 10
c) f(x) = 2x5 + x4 − 12x3 + x2 + 20x − 12
d) f(x) = x4 + 4x3 + 5x2 + 4x + 4
e) f(x) = x5 − 2x4 − 10x3 + 16x2 + 25x − 30
f) f(x) = 4x7+ 8x6 − 15x5 − 23x4 + 23x3 + 15x2 − 8x − 4
g) f(x) = 6x8 − 29x7 + 5x6 + 105x5 − 11x4 − 136x3 − 60x2
h) f(x) = x10 − x9 − 17x8 + 27x7 + 81x6 − 183x5 − 43x4 + 289x3 − 94x2 − 132x + 72
i) f(x) = 72x6 + 138x5 + 41x4 − 44x3 − 18x2 + 2x + 1
. Si sabe que r es cero (o raíz de f(x) = 0), encuentre el resto de los ceros (o raíces), haga una lista
4
y escriba el polinomio como un producto de factores lineales.
a) Si r = 3 − 2i y f(x) = 2x5 − 17x4 + 42x3 + 27x2 − 230x + 104
b) Si r = 2 + 3 y f(x) = x7 − 9x6 + 35x5 − 83x4 + 119x3 − 95x2 + 37x −5
196 Unidad 4  Polinomios y teoría de ecuaciones

c) Si r = −2 − i y f(x) = 2x5 + 13x4 + 21x3 − 29x2 − 117x − 90


d) Si r = − 1 + i es raíz doble de
f(x) = x10 + 5x9 + 8x8 − 2x7 − 23x6 − 23x5 + 10x4 + 32x3 + 12x2 − 12x − 8 = 0
e) Si r = 1 + 7 y f(x) = 6x6 − 23x5 − 38x4 + 153x3 + 56x2 − 214x + 60
f) Si r = 3 + 5 y f(x) = 2x6 − 19x5 + 51x4 − 27x3 − 41x2 + 46x −12
g) Si r = − 5 + 2 y f(x) = x4 + 8x3 + 13x2 + 54x + 230

5. a) x4 + 7x3 + 12x2 + 13x − 3 = 0


b) x4 + 2x3 − x2 + 2x − 2 = 0
c) x4 + 4x3 + 3x2 + 2x − 1 = 0
d) x4 + 2x3 − 8x2 − 6x − 1 = 0
e) x4 − 7x2 + 2x + 2 = 0
f ) x4 + 6x3 + 8x2 + 8x − 16 = 0

6. a) x3 + 6x2 + 6x − 10 = 0
b) x3 + 3x2 + 9x + 9 = 0
c) x3 + 3x2 + 15x + 1 = 0
d ) x3 + 9x + 6 = 0
e) x3 + 6x2 − 3x − 8 = 0
f ) x3 + 3x2 + 9x + 9 = 0
 197

Álgebra
5.1  Grupos abelianos (o conmutativos)
Unidad
5.2  Anillos, dominios enteros y campos
5.3 Homomorfismos
5.4  Espacios vectoriales
•  Dependencia e independencia lineal. Bases y dimensión
•  Dimensión
5.5  Producto escalar, norma y métrica en n
•  Norma
•  Distancia

lineal
•  Ángulos y ortogonalidad
•  Conjuntos y bases ortogonales
•  Proyecciones
•  Aplicaciones
5.6  Producto vectorial
•  Definición
•  Analogía con la solución como determinante
•  Interpretación geométrica de la norma del producto vectorial
•  Algunas propiedades del producto vectorial
5.7  Triple producto escalar
•  Definiciones
•  Interpretación geométrica
5.8  Rectas y planos
•  Las rectas en n
•  Una ecuación de la recta que pasa por dos puntos
•  Ángulo entre rectas
•  Planos en 3
•  Una ecuación del plano que pasa por tres puntos no colineales
•  Ecuación normal del plano
•  Ángulo entre planos
•  Ángulo entre recta y plano
5.9  Transformaciones lineales
198 Unidad 5  Álgebra lineal

5.1  Grupos abelianos (o conmutativos)

Definición 5.1.1
Definición de operación binaria
Sea X un conjunto. Una operación (binaria) en X, f: X × X → X es una función que a cada
pareja de elementos de X le asocia un elemento de X. Así, por ejemplo, la suma de números
reales es una operación en , lo mismo la multiplicación o la resta.

Se acostumbra denotar a las operaciones con diferentes símbolos entre los que destacan, por
la frecuencia con que se usan +, ·, *, entre otros, y también se acostumbra representar a la imagen
de una pareja (a, b) bajo una operación, como a * b, en vez de la notación usual para funciones.
Así, por ejemplo, * ((a, b)) se denota por a * b (o simplemente ab) y +((a, b)) es a + b.

Definición 5.1.2
Definición de grupo abeliano
Se dice que un conjunto G con una operación * es un grupo abeliano si la operación en G
satisface las cuatro siguientes propiedades:
i) ∀ a, b, c ∈ G, (a * b) * c = a * (b * c) (propiedad asociativa)
ii) ∀a, b ∈ G, a * b = b * a (propiedad conmutativa)
iii) ∃ e ∈ G∋, a * e = e * a = a (existencia del neutro)
iv) ∀ a ∈ G, ∃ b ∈ G ∋, a * b = b * a = e (existencia de inversos)
Cuando no se supone la propiedad conmutativa, se dice simplemente que {G, *} es un grupo.

Si {G, *} es un grupo abeliano, la operación suele llamarse “suma” y se denota “+”; a su neu-
tro se le llama cero, que, por supuesto, se representa con su símbolo usual. Cuando la operación
se supone conocida, la pareja {G, *) se nombra simplemente como “el grupo G (abeliano, cuando
es el caso)”.
Se puede probar (ejercicios) que en todo grupo abeliano G son válidas, entre muchas otras, las
propiedades siguientes:
Para todos los elementos de G:
1. El idéntico es único; es decir, si 0 y 0′ son idénticos de G, entonces 0 = 0′.
2. Para cada a ∈G existe un único inverso (que se denota como “−a”, cuando la operación de G
es la suma). La suma de a con el inverso de b, a + (−b) se simplifica como a − b.
Se puede usar la inducción para definir sumas generalizadas de la siguiente manera:
1 n +1 n 
∑ ai = a1,    ∑ ai =  ∑ ai  + an +1,   además, ∑ ai = 0
i =1 i =1  i =1  i∈∅

y entonces se puede demostrar también que el resultado de una de estas sumas generalizadas
es independiente de la forma en que se asocien los sumandos y del orden en que se consideren.
Esta última observación es la que se expresa cuando se dice que “el cambio en el orden de los
sumandos no altera la suma de ellos”. Es decir,
n
∑ ai = a1 + ... + an
i =1

3. a + b = a + c ⇒ b = c (“Es válido cancelar”).


4. La ecuación a + x = b tiene solución única x = b − a.

Los siguientes son ejemplos de grupos:


1. { , +}; {n , +}; {n+}; {p, +}; {(p)*, ·}
5.2  Anillos, dominios enteros y campos 199

2. {, +}; {*, ·}; {, +}; {*, ·}; {, +}; {*, ·}; {K [X], +}; {K (X), +}; {(K (X))*, ·}
(En general, si K es un campo, {K,+} y {K *, ·} son grupos abelianos.) Se está usando el
símbolo * para denotar los conjuntos sin su idéntico. (N* = N − {0} = {1, 2, 3, …}).
3. Sean S un conjunto no vacío y A(S) = { f: S →S; f biyectiva}. Entonces, A(S), es grupo con la
composición.
Si •S• = n, A(S) se acostumbra denotar como Sn y se llama el grupo simétrico de orden n,
cuya cardinalidad es n!
4. Sean S un conjunto no vacío y {G, +} un grupo.
Si F = { f · S → G) y se define: (  f + g)(x) = f (x) + g(x), entonces {F, +} es grupo.
5. {Mn × n (K), +}.
6. {A ∈Mn × n (K); det A ≠ 0, ·} = GL(n), ·.

5.2  Anillos, dominios enteros y campos


Definición 5.2.1
Definición de anillo
Un anillo es una terna {A, +, ·},en donde A es un conjunto, + y · son operaciones binarias en
A, que se conocen como suma y producto, tales que
{A, +} es un grupo abeliano.
El producto “ · ” es una operación que se distribuye por ambos lados sobre la suma “+”;
es decir, que para todos:
a, b, c ∈ A a · (b + c ) = a · b + a · c ; (a + b) · c = a · c + b · c
Cuando · es una operación asociativa, el anillo se llama anillo asociativo.
Cuando · es una operación conmutativa, el anillo se denomina anillo conmutativo.
Cuando · es una operación con idéntico, el anillo se conoce como anillo con uno.

Definición 5.2.2
Definición de dominio entero
Un anillo conmutativo es un dominio entero si y sólo si se cumple cualquiera de las propieda-
des siguientes (que son equivalentes):
a) En el producto (o multiplicación) se pueden cancelar factores diferentes de cero; es decir,
a · b = a · c y a ≠ 0 ⇒ b = c.
b) Cero no tiene divisores propios; es decir, a · b = 0 ⇒ a = 0 ∨ b = 0.

Si la multiplicación tiene idéntico, el anillo se llama dominio entero con uno.


La teoría de grupos surgió del estudio de las permutaciones y la teoría de anillos, de la arit-
mética del conjunto Z de los números enteros. Estas teorías y la de campos están en la base de lo
que se conoce como álgebra abstracta (o moderna).

Definición 5.2.3
Definición de campo
Un conjunto K con dos operaciones binarias “suma” y “producto” (“+” y “·”) es un campo
si {K, +} y {K*, ·} son grupos abelianos para los que además es válida la “ley distributiva”;
es decir, ∀a, b, c ∈ K, (a + b) c = ac + bc. Se exige además que el idéntico de {K, +} (idéntico
aditivo o “cero”) sea diferente al de {K*, ·} (“cero” distinto de “uno”).
200 Unidad 5  Álgebra lineal

n
El producto generalizado ∏ ai se define inductivamente como en el caso de la suma:
i =1
1 n  n +1
∏ ai = a1,   
∏ ai =  ∏ ai  an +1 ,   además, ∏ ai = 1
i =1 i =1  i =1  i ∈∅

y se recuerda que en este caso la propiedad conmutativa (generalizada) se expresa diciendo que para
la multiplicación: “El cambio en el orden de los factores no altera el producto de ellos”. Entonces,
n
∏ ai = a1 · a2 ·  · an
i =1
Se apunta aquí que al ser {K*, ·}un grupo abeliano, son válidas en él las propiedades corres-
pondientes.
Agregamos las tres propiedades siguientes (que relacionan las dos operaciones de K):
1. ∀a ∈ K,   a · 0 = 0.
2. a(−b) = −ab;   (−a)(−b) = ab (es válida la “regla de los signos”)
n  n
3.  ∑ ai  b = ∑ ai b (es válida la ley distributiva generalizada)
 i =1  i =1

y resumimos los resultados anteriores diciendo que “las reglas algebraicas que se estudian en
secundaria están bien”.
Son ejemplos de campos (con las operaciones usuales):
1. , , 
2. ( p ) , p en P
( p1 , p2 ,..., )
pn , pi números primos, i = 1, …, n, en donde
( p ) = {a + b p; a, b ∈ Z} y
( p1 , p2 , ..., ) {
pn +1 = a + b pn +1 ; a, b ∈  ( p1 , p2 , ..., pn )}
3. {z ∈; z es cero de algún polinomio no cero, con coeficientes enteros}, que se conoce como el
campo de los números algebraicos.1
4. Z2, Z3, Z5, ..., Zp, p primo positivo.

5.3 Homomorfismos
Definición 5.3.1
Definición de homomorfismos
Sean { A, +, ·} y { B, ⊕, } dos estructuras en donde +, · son operaciones binarias en A y ⊕, 
operaciones binarias en B.
Una función f : A → B es un homomorfismo si y sólo si para todos a, b ∈ A :
f (a + b) = f (a ) ⊕ f (b)
f ( a · b ) = f (a )  f (b)
Si ℜ ⊂ A ×  × A y ℑ ⊂ B ×  × B son relaciones n-arias en A y en B, se dice que un
homomorfismo f preserva la relación si y sólo si para todos
a1, , an ∈ A, (a1, , an ) ∈ ℜ ⇔ ( f (a1 ), , f (an )) ∈ ℑ.
La relación binaria más común es la de orden, y en ese caso se dice que el homomorfismo
f preserva el orden si y sólo si para todos a, b ∈ A, a ≤ b ⇔ f (a ) ≤ f (b) .
Si un homomorfismo f es inyectivo, se llama monomorfismo o inmersión.
Si un homomorfismo f es suprayectivo, se llama epimorfismo.
Si un homomorfismo f es biyectivo, se llama isomorfismo.

1Si E es una extensión de campo de F, un número a ∈ E es algebraico sobre F si es raíz de un polinomio no cero con coeficientes en
F. Se dice que un número es algebraico si es un número complejo algebraico sobre los racionales.
5.4  Espacios vectoriales 201

5.4  Espacios vectoriales


Definición 5.4.1
Definición de espacios vectoriales
Sea {V, ⊕ } un grupo abeliano y {K, +, ·} un campo. V es un espacio vectorial sobre K si existe una
operación binaria:  : K × V → V tal que si  ((k, x )) se denota como k x, entonces cumple con:
∀α, β ∈ K, ∀ x, y ∈V,
i) α( x ⊕ y ) = α x ⊕ α y
ii) (α + β) x = α x ⊕ β x
iii) (α β) x = α (β x )
iv) 1 x = x
Los elementos de V se llaman vectores y los de K escalares. Se usó el signo ⊕ para distinguir-
lo de la suma en K, pero en lo sucesivo se usará + para ambas sumas.

Cuando K es el campo R de los números reales, se dice que V es un espacio vectorial real, y si
K es el de los complejos, V es un espacio vectorial complejo. Cuando se deba mencionar explícita-
mente el campo K usaremos la notación V / K, y cuando no sea ese el caso, simplemente V.

Ejemplo 5.4.1
Si G = {0} con 0 + 0 = 0 y ∀a ∈ K, a · 0 = 0, G es un espacio vectorial sobre cualquier campo K y
se llama “el espacio vectorial cero” o “trivial”.

Ejemplo 5.4.2
Todo campo K es un espacio vectorial sobre cualquiera de sus subcampos, y en este caso la suma
y el producto son las operaciones de K (C es un espacio vectorial complejo, real, racional, ...,
según sea el subcampo que se considere como el campo de los escalares).

Ejemplo 5.4.3
Sea K un campo, Kn = K × K × ... × K (n factores). Entonces ∀ n ∈ Z+, Kn resulta un espacio vec-
torial sobre K si se define para
–a = (..., a , ...) y –b = (..., b , ...)
i i
–a = –b ⇔ a = b , i = 1, 2, ..., n
i i
–a + –b = (..., a + b , ...)
i i
y si α ∈ K, α –a = (…, α a , …).
i
Se puede demostrar que todo espacio vectorial de dimensión finita n (vea la definición más
adelante) sobre un campo K es isomorfo a Kn (indistinguible desde el punto de vista de sus pro-
piedades algebraicas), y esa observación justifica que se diga que, “de alguna manera”, los Kn son
los espacios vectoriales más importantes entre los de dimensión finita.

Ejemplo 5.4.4
Si G = Mm × n (K), G es un espacio vectorial sobre K cuando se define la suma de matrices y la
multiplicación por escalares de manera conveniente.
Explícitamente, si
A = (aij), B = (bij) en G, entonces
A = B ⇔ aij = bij para todas i y j
A + B = (aij + bij)
α ∈K, αA = (αaij).
202 Unidad 5  Álgebra lineal

Ejemplo 5.4.5
Si G = K [x], el “anillo de los polinomios en una indeterminada x con coeficientes en un campo K
(los polinomios “comunes”), G es un espacio vectorial sobre el campo K, con la suma y la multi-
plicación por un escalar definidas en la forma usual.

Ejemplo 5.4.6
Sea W un espacio vectorial sobre un campo K y S un conjunto no vacío. Se define G = { f  : S → W} el
conjunto de las funciones de S en W. Se le da estructura de grupo al definir para f, g ∈ G, ( f + g): S → W
como la función que asocia a cada x ∈S, el resultado de sumar (en W) f (x) con g(x), es decir, 
(  f + g)(x) = f (x) + g(x), y se define para α ∈K, αf (x) = α(f (x)).
Entonces G resulta un espacio vectorial sobre K, que en cierto sentido es el ejemplo más
importante de espacios vectoriales (todos los ejemplos anteriores son casos particulares de éste).

Definición 5.4.2
Definición de subespacio
Sea V un espacio vectorial sobre un campo K. W ⊂ V es un subespacio de V (notación:  
W ≤ V) si y sólo si
∀ α ∈ K, ∀ x, y ∈ W
i) 0 ∈ W
ii) x + y ∈ W
iii) α x ∈ W
“W es cerrado bajo sumas y productos escalares y no vacío”.

La definición de subespacio suele darse diciendo que un subconjunto W de V es un subespa-


cio de V si W es un espacio vectorial (sobre el mismo campo K) con las “operaciones inducidas en
W por las de V”. Se demuestra después que W ⊂ V es un subespacio de V si y sólo si W satisface
las anteriores condiciones i), ii) y iii), de manera que ambas definiciones son equivalentes. Se opta
por la primera, que tiene la ventaja de evitar la discusión sobre “operaciones inducidas” y que
además es la que se usa con más frecuencia para comprobar que un subconjunto de V es un sub-
espacio de V.
La condición i), puede cambiarse por:
j) W ≠ ∅, que no es la misma que i). Obviamente, i) → ij, pero no al revés; sin embargo, al tomar-
se junto con ii) y iii) forman conjuntos de proposiciones equivalentes (es decir, de 
{i), ii), iii)} se puede demostrar { j), ii), iii)}. Y de { j), ii), iii)} se puede demostrar {i), ii), iii)}).

Definición 5.4.3
Definición de combinación lineal
Sea V un espacio vectorial sobre K y β = { xi }i ∈I un subconjunto de vectores de V. x ∈ V es
una combinación lineal de β si existen coeficientes α1, α2 , ∈ K tales que,
x = ∑ αi xi
i ∈I
x es una suma formal en donde todos los coeficientes son iguales a cero, excepto un número
finito de ellos (lo que se expresa diciendo que “casi todos los coeficientes son cero”).

 Teorema  5.4.1
Si β = { xi }i ∈I es un subconjunto no vacío de V, (I ≠ ∅), la colección de todas las combinaciones
lineales de β es un subespacio de V, que se llama el subespacio de V generado por β, y se denota
como [ β ], o bien como Gen β.
[ β ] = { x ∈ V; x es combinación lineal de β}.
5.4  Espacios vectoriales 203

Demostración
i) ∀ i ∈ I, x–i es una combinación lineal de β y, por lo tanto, [β] no es vacío. (Por definición,
la combinación lineal vacía es el cero.)
ii) La suma de combinaciones lineales de β, así como el producto de cualquiera de ellas por
un escalar, son combinaciones lineales.
Es decir, x, y ∈ [β] ⇒ x + y ∈ [β], y además α ∈ K, x ∈ [β] ⇒ α x ∈[β].

Es fácil convencerse de que [β] es la intersección de todos los subespacios de V que contienen
a β, y en este sentido se asegura que, con respecto a la contención, [β] es el menor subespacio de
V que contiene a β. Esto motivó las definiciones de combinación lineal vacía (sin sumandos) como
– –
0 y del espacio generado por el conjunto vacío como{0}.

Dependencia e independencia lineal. Bases y dimensión


Definición 5.4.4
Definición de base
Una base β es un subconjunto de vectores de V que tiene la propiedad de que cada x ∈ V se
puede expresar en forma única como combinación lineal de β.

n n
Por “forma única” debe entenderse que si x = ∑ αi xi = ∑ δi xi , entonces αi = δi , ∀i ∈I, aunque,
i =1 i =1
por supuesto, los sumandos pueden aparecer en cualquier orden, y en ese caso quizá sería mejor
decir que los coeficientes de cada elemento básico “son los que deben ser únicos”.
El que cada x ∈ V sea combinación lineal de β equivale a decir que “β genera a V” o que “β
es un conjunto generador de V”. El hecho de que cada combinación lineal de β tenga una expre-
sión única es lo que se conoce como independencia lineal.
En realidad, la definición más conocida de “independencia lineal” es la que afirma que β ⊂ V
es linealmente independiente si y sólo si cada vez que una combinación lineal de β sea cero, todos
los coeficientes tienen que ser necesariamente cero.
Las siguientes definiciones son equivalentes a las dos anteriores:
• β es linealmente independiente si y sólo si ninguno de sus vectores es combinación lineal de
los otros.
• β es linealmente independiente si y sólo si no es linealmente dependiente (en este caso debe
precisarse lo que se entiende por “linealmente dependiente”).
En resumen, un conjunto β ⊂ V es una base de V si y sólo si
1. es linealmente independiente, y
2. genera a V.
Entre los ejemplos de bases más conocidos se citan los siguientes:

Ejemplo 5.4.7
Si êi = (0, ..., 0, 1, 0, ..., 0); i = 1, ..., n; { ê1, eˆ2 , ..., ên } es la base canónica de Rn.

Ejemplo 5.4.8
{l, x, x2, ...} es la base canónica de  [x].
204 Unidad 5  Álgebra lineal

Ejemplo 5.4.9
 1 0   0 1   0 0   0 0 
 0 0  ,  0 0  ,  1 0  ,  0 1  es la base canónica del espacio M2 × 2 (R), cuyos elementos son las
       
matrices cuadradas de 2 × 2 con coeficientes reales. 

“Canónico” es un término impreciso que se utiliza para designar a la forma más “natural” o
que “proporciona más información a simple vista”, y que en general es “la más usada”.
Así, por ejemplo, se habla de las ecuaciones canónicas de las cónicas:

( x − h )2 + ( y − k )2 = r 2 Para la circunferencia
y − k = 4p(x – h)2 Para las parábolas verticales
( x − h )2 ( y − k )2
+ = r1 Para las elipses “bien orientadas”
a2 b2
( x − h )2 ( y − k )2
±  = r1 Para las hipérbolas “bien orientadas”
a2 b2
Y también se llama “canónico” el orden usual de los números naturales.
El hecho de que cada vector x– de un espacio vectorial de dimensión finita n se pueda expresar
en forma única como combinación lineal de una base β permite asociar a cada vector de V un
vector de n formado con los coeficientes de los elementos de la base. Así, por ejemplo, si
x = (5, 2, 3) y β es la base {i , j , k} , entonces x = 5i + 2 j + 3k , y, por lo tanto, su vector de coorde-
nadas es (5, 2, 3). Pero si la base β fuera {(1, 0, 0)(1, 1, 0)(1, 1, 1)} , su vector de coordenadas sería 
(3, −1, 3), ya que 3(1, 0, 0) − 1(1, 1, 0) + 3(1, 1, 1) = (5, 2, 3).
La función f :V → n que asocia a cada vector su vector de coordenadas, resulta un isomor-
fismo entre V y n que depende de la base β, de modo que, como ya se dijo, se comprueba que
todo espacio vectorial real es esencialmente un n.
Se aceptan los siguientes resultados, cuyas demostraciones se pueden encontrar en los libros
de álgebra lineal, a los que en estas notas se denominan como dogmas (D), para aclarar que no se
incluye su demostración.
D 1  Todo espacio vectorial tiene al menos una base. Aquí es necesario aceptar que:
• ∅ es linealmente independiente.
• La combinación lineal vacía (una suma formal con cero sumandos) es el vector cero y
que, por lo tanto, la base de { 0 }es el conjunto vacío.
D 2  Si un conjunto finito β ⊂ V es una base de V, entonces cualquier otra base de V tiene
el mismo número de elementos que β.

Dimensión
De los dogmas anteriores se sigue que para todo espacio vectorial V, o bien todas sus bases son
infinitas, o todas son finitas de la misma cardinalidad. En el primer caso, se dice que “V es 
de dimensión infinita”. En el segundo caso hay un número bien definido, el número de elementos de
cada una de sus bases, que se conoce como la dimensión de V (dim V).
En el ejemplo 5.4.7, dim Rn = n.
En el ejemplo 5.4.8, dim R [x] = ∞.
En el ejemplo 5.4.9, dim M2 × 2 (R) = 4. En general, dim Mm × n (R) = mn.
En otras palabras, si un espacio vectorial V tiene una base finita (con un conjunto finito de
vectores), se dice que es de dimensión finita, y si ese no es el caso, es decir, si todas las bases de V
tienen una infinidad de vectores (son infinitas), entonces V es de dimensión infinita.
En los ejemplos anteriores, Rn y M2 × 2 (R) son de dimensión finita, mientras que R [x] no lo es.
D 3  Si γ ⊂ V es un conjunto linealmente independiente, existe β, una base de V, tal que 
γ ⊂ β. (Es decir, todo conjunto de vectores linealmente independiente puede completarse a una base.)
D 4  Si β genera V, existe un subconjunto γ ⊂ β, que es linealmente independiente y que
genera a V (todo conjunto generador de V contiene una base de V).
5.5  Producto escalar, norma y métrica en Rn 205

Si β = { x 1}, i = 1, ..., n es una base de V, β se puede ordenar con el orden inducido por el orden
nn
de sus subíndices, β = { x 1..., x n}, y en ese caso a cada vector x = ∑∑ααii xxxii i∈∈ V se le puede asociar
i =i =11
el vector (al, ..., an) ∈ Kn, que se llama el vector de coordenadas de x, que obviamente depende de
la base β. Así, por ejemplo, si β = { x1, x2 , x3 } es una base de R3 y u = 3 x1 + 2 x2 − 5x3 , el vector
de coordenadas de u con respecto a β es (3, 2, −5).
La función η: V → Kn, que asocia a cada vector x ∈V su vector de coordenadas con respec-
to a una base fija β, resulta un isomorfismo de espacios vectoriales (función biyectiva de uno en
otro, tal que ∀ α ∈ K, ∀ x , y ∈ V, η( x, y ) = η( x ) + η( y ) y η(α x ) = α η( x ). Este isomorfismo
justifica la siguiente afirmación: si la dim V/K es n, entonces V es isomorfo a Kn.

5.5  Producto escalar, norma y métrica en Rn


Definición 5.5.1
Definición de producto punto
Sea V = Rn el espacio vectorial real de las n-adas. Se define el producto punto de los vectores
x = (x1, ... , xn) y y = (y1, ..., yn) como sigue:
n
x . y = x y + ... + x y = ∑ xi yi ∈ .
1 1 n n
i =1

Y de esta definición se deriva el siguiente teorema:

 Teorema 5.5.1
∀ α ∈ K, ∀ x, y , z ∈ Rn,
a) x · y = y · x (el producto punto conmuta)
b) x ·(y + z )= x · y + x · z (abre sumas)
c) x · (α y ) = α( x · y ) (saca escalares)
d) x · x ≥ 0; x · x = 0 ⇔ x = 0 (está definido en forma positiva)

Las demostraciones (ejercicios) son directas de la definición.


Las propiedades b) y c) confieren al producto punto su calidad de “lineal en el segundo fac-
tor” (vea transformaciones lineales más adelante), y combinadas con la propiedad conmutativa a)
permiten ver que el citado producto también es lineal en el primer factor, lo que se expresa dicien-
do que el producto punto es “bilineal”.
Una función V × V → K con las propiedades a), b) y c) es un producto interior que, cuando
tiene adicionalmente la propiedad d), se dice que está “definido en forma positiva”.

Norma
n n
El hecho de que ∀ x ∈  , x · x = ∑ x12 sea mayor o igual que cero permite definir la norma (eucli-
i =1
diana) de cada vector como sigue:

Definición 5.2.2
Sea x ∈ n. La norma x de x es x = (x · x ) . Está bien definida, ya que todo número
real no negativo tiene una raíz cuadrada no negativa.

Se dice que la norma es euclidiana porque cuando se usa para construir la geometría en 2 lo
que resulta es un modelo de la geometría de Euclides.2 Note que, en particular, si x = (x1, x2 ),

2La geometría de Euclides es la que se construye a partir de los axiomas de Euclides (aumentados con los que propuso Hilbert),
en contraste con las (mal llamadas) geometrías no euclidianas, que niegan el quinto postulado.
206 Unidad 5  Álgebra lineal

entonces x = x12 + x22 , es decir, la norma o “tamaño” va de acuerdo con el teorema de Pitágo-
ras. Existen otras normas que no necesariamente se derivan de un producto interior, así como
también hay otras geometrías que tienen distintas aplicaciones,3 pero que aquí no se consideran.
Algunas propiedades de la norma euclidiana se establecen en el siguiente teorema:

 Teorema 5.5.2
∀ α ∈ , ∀ x, y ∈ n,
a) x ≥ 0; x = 0 ⇔ x = 0
b) αx = α x y, por lo tanto, −x = x
*) x · y ≤ x y
c) x + y ≤ x + y

Se llama norma a toda función real con las propiedades a), b) y c). A un espacio en el que está
definida una función de ese tipo se le llama espacio normado.
La propiedad *, conocida como la desigualdad Cauchy-Schwarz-Bounyakowski (C-S-B), que
es importante, no es necesaria para esta definición.

Demostración
La propiedad a) es obvia debido a la definición. En efecto, la raíz cuadrada de todo número
no negativo es no negativa y sólo es cero cuando el radicando es cero (la suma de cuadrados
es no negativa). Luego,
n n
∑ xi2 ≥ 0 y ∑ xi2 = 0 ⇔ x1 = ... = xn = 0.
i =1 i =1
La propiedad b) se demuestra de la siguiente manera:

αx = ( αx ) · ( αx ) = α 2 ( x · x ) = α x · x = α x .

Recuerde que la raíz cuadrada real de un producto es el producto de sus raíces cuadradas y
que la raíz cuadrada del cuadrado de un número real es su valor absoluto.
Una demostración de la desigualdad C-S-B es la siguiente:
Sean x , y ∈  n . Se define z = x y − y x ∈ n.
= ( x y − y x) · ( x y − y x)
2
0≤ z
= x (y · y) − x
2
y ( y · x ) − y x (x · y ) + y
2

= 2 x y −2 x y (x · y ) 
2 2
(5.5.1)
Si x = 0 o y = 0, evidentemente x · y ≤ x y , (0 ≤ 0). Suponiendo que ese no es el caso,
resulta x y > 0 y, por lo tanto, en la ecuación 5.5.1 se puede cancelar el factor x y , con lo
que se obtiene:
0 ≤ x y − x · y , o sea, x · y ≤ x y .  (5.5.2)
Al repetir el argumento con z = x y + y x se llega a la desigualdad
0 ≤ x y + x · y y ∴ − (x · y ) ≤ x y  (5.5.3)
De las ecuaciones (5.5.2) y (5.5.3) − x y ≤ (x · y ) ≤ x y .

3Einstein dijo que la teoría general de la relatividad no se hubiera podido construir sin la geometría de Minkowski (una geometría no
euclidiana).
5.5  Producto escalar, norma y métrica en Rn 207

de donde, x·y ≤ x y
Recuerde ∀ a , b ∈ , b ≤ a ⇔ − a ≤ b ≤ a.
Con el resultado anterior se demuestra la propiedad c) (conocida como la desigualdad del
triángulo, debido a su relación con la interpretación geométrica):
= (x + y ) · (x + y ) = x · x + 2 (x · y ) + y · y
2
x+y

+ 2 (x · y ) + y =(x + y )2
2 2 2 2
= x ≤ x +2 x y + y

de donde x+y ≤ x + y

Distancia
Definición 5.5.3
La existencia de una norma, , en un espacio V permite definir una función distancia d : 
(V × V → ), de la siguiente manera: sean x, y ∈V; entonces, d ( x , y ) = x – y .

De la definición anterior se deriva el siguiente teorema, cuya demostración es directa y se deja


como ejercicio, y sólo se desarrolla la del inciso c) a manera de ejemplo.

 Teorema  5.5.3
∀ x , y , z ∈V
a) d ( x , y ) ≥ 0; d ( x , y ) = 0 ⇔ x = y
b) d ( x , y ) = d ( y , x )
c) d ( x , y ) ≤ d ( x , z ) + d ( z , y )

Demostración de c)

d ( x , y ) = x − y = x − z + z − y = (x − z ) + ( z − y ) ≤ x − z + z − y = d ( x , z ) + d ( z , y )

Toda función m: V × V →  con las propiedades anteriores es una métrica, y en ese caso el
espacio V se llama espacio métrico. También se apunta que existen métricas, que tampoco se
consideran en el texto, que no necesariamente se derivan de una norma y simplemente se agre-
ga como nota cultural, que con cualquier métrica se puede construir una topología y que, por
supuesto, también existen topologías (familias de abiertos con ciertas propiedades) que no
proceden de métrica alguna.


Ángulos y ortogonalidad
La desigualdad C-S-B, x · y ≤ x y , asegura que si x ≠ 0 y yy ≠ 0, entonces

x·y
−1 ≤ ≤1
x y
– y –y como aquel
por lo que se puede definir el ángulo formado por los vectores, diferentes de cero, x
cuyo coseno es
x ·y
x y
restringido a estar en el intervalo [0, π] (definición que se justifica observando la ley de los cosenos
para el plano que se demuestra en el siguiente párrafo). Entonces se dirá que x – y –y son ortogonales
– – –
si y sólo si x · y = 0, lo que se denota como x ⊥ y (en esta definición ya se incluye al vector 0, que,
n
por lo tanto, resulta ortogonal a todo vector x ∈  , incluido él mismo).
208 Unidad 5  Álgebra lineal

Demostración

Ley de los cosenos: c2 = b2 + a2 – 2ab cos θ


Sean ABC un triángulo de lados con medidas a, b y c.
h perpendicular de A al lado BC
M el pie de la perpendicular h
θ la medida del ángulo en C
x la longitud del segmento CM (por lo tanto, la medida del segmento MB resulta ser a − x).
A En el triángulo rectángulo ACM, h2 = b2 − x 2 .
En el triángulo rectángulo AMB,
b c 2
h2 = c 2 − (a − x) = c 2 − x 2 − a 2 + 2 ax.
h
Al igualar las ecuaciones anteriores y cance-
θ
M
B
lar x2 se obtiene: b2 = c 2 − a 2 + 2 ax, es decir,
C
x a-x c 2 = b2 + a 2 − 2 ax, y como x = b cos θ resulta:
a
c 2 = b2 + a 2 − 2 ab cos θ  (5.5.4)
Figura 5.1  Construcción para la ley de
los cosenos. que es la ley de los cosenos.


Considere ahora el segmento dirigido CA como el vector b , de tamaño b, el segmento CB
como el vector a , de tamaño a, de donde resulta que el segmento AB es el vector a − b de tama-
ño c. Entonces,

c 2 = (a − b ) · (a − b ) = a
2 2
+ b − 2 a · b = a 2 + b2 − 2 a · b (5.5.5)
De (5.5.4) y (5.5.5)

ab cos θ = a · b , o también a b a b
de donde resulta
a ·b
cos θ = .
a y
El argumento anterior justifica la definición de ángulo entre vectores en n.
– y –y —diferentes de –0— es el ángulo cuyo coseno es
El ángulo formado por los vectores x
x·y
.
x y
Ejemplo 5.5.1

– = (1, 1, 0) y –y = (1, 1, 1) entonces


En 3, si x
 (1, 1, 0 ) · (1, 1, 1)  −1  2  −1  6 
θ ( x , y ) = cos −1   = cos   = arc cos  
 (1, 1, 0 ) (1, 1, 1)
   2 3  3 
por lo que θ es, aproximadamente, 35.26° (en radianes, 0.6154).
De la definición de ángulo entre vectores, también resulta que x es paralelo a y si y sólo si
x·y
= ± 1,
x y

lo que sucede cuando uno de ellos es múltiplo del otro y sólo en ese caso. Es decir,
Definición 5.5.4

x y ⇔ ∃α ∈  ∋ αx = y o α y = x .
5.5  Producto escalar, norma y métrica en Rn 209

Así, por ejemplo, (3, 2, 0, −5) y (6, 4, 0, −10) son paralelos debido a que el segundo es el doble
– –
del primero. Note que como el vector 0 está incluido en la definición, y, por lo tanto, 0 es paralelo
a cualquier vector, no basta una sola de las igualdades anteriores para definir paralelismo.

Conjuntos y bases ortogonales


Definición 5.5.5
En un espacio normado, un vector x– es unitario si su tamaño es uno (algunos autores les lla-
man “versores” y usan la notación x̂ para designarlos).

Ejemplo 5.5.2
 1 1 1 
En n, cada êi = (…,1,…) es unitario y xˆ =  , ,  también.
 3 3 3

Definición 5.5.6
Sea β = { x1,..., xn }. β es un conjunto ortogonal si ∀ i , ∀ j , i ≠ j ⇒ xi ⊥ x j , y si además
∀ i , i = 1, ..., n xi = 1, se dice que β es un conjunto ortonormal.

Ejemplo 5.5.3
En n, {eˆ1 , ... , eˆn } es un conjunto ortonormal.

  Teorema 5.5.4
Todo conjunto ortonormal finito es linealmente independiente.

Demostración
n
– , ..., x– } un conjunto ortonormal y 0 = ∑
Sea β = {x a j x j ; entonces, para cada i = 1, ..., n,
1 n
j =1
 n 
0 = 0 · xi =  ∑ a j x j  · xi = ai (xi · xi ) = ai .
 j =1 


Se acepta también el teorema que asegura:
D 5  Todo espacio vectorial real de dimensión finita (esencialmente un n) tiene bases orto-
gonales y todo conjunto ortogonal que sea linealmente independiente puede completarse a (for-
ma parte de) una base ortogonal.

Si β = {x–1, ..., x–n} es un conjunto ortogonal, linealmente independiente (y ∴ x–i ≠ 0, i = 1,..., n),
entonces
x x 
β* =  1 , ..., n 
x
 1 xn 
es ortonormal, por lo que en el dogma anterior puede sustituirse “ortonormal” por “ortogonal”
sin que pierda validez.

Definición 5.5.7
Sea W ≤ V un subespacio de un espacio vectorial real de dimensión finita V. El complemento
ortogonal W⊥ de V es:
W⊥ = {x ∈ V ; x ⊥ y ∀ y ∈ W}

Ejemplo 5.5.4
Si W ={(a, b, 0) ∈ 3}, entonces W⊥ = {(0, 0, c) ∈ 3}.
210 Unidad 5  Álgebra lineal

Ejemplo 5.5.5
Si W = {(x, y, z) ∈ 3; 2x + 3y − z = 0}, entonces
W ⊥ = {x ∈  3 ; x = t ( 2, 3, − 1) ; t ∈ }.
Observación
Si W es un subespacio de V generado por β = {x1, ..., xn }, entonces su complemento ortogonal
W⊥ es W ⊥ = {x ∈ ; x ⊥ xi , i = 1, ..., r}.

 Teorema  5.5.5
Sea Vk un espacio de dimensión finita n, W un subespacio de V y W⊥ su complemento ortogonal.
Entonces W⊥ es un subespacio de V y dim W + dim W⊥ = dim V.

Demostración

I. a) 0 es ortogonal a x ∀ x ∈ V, en particular ∀ x ∈ W∴ 0 ∈ W ⊥ .
b) Sean x , y ∈ W ⊥ ∴ ∀ u ∈ W, x · u = 0, y · u = 0 ∴ ( x + y ) · u = e.d. x + y ∈ W ⊥ .
c) Sea x ∈ W ⊥ , k ∈ K, ∀u ∈ W, x · u = 0, k ( x · u ) = kx · u = 0 ∴ kx ∈ W ⊥ ; entonces
W⊥ es un subespacio de V.
{ }
II. Sea r = dim 𝕎, {x1, ..., xr } base ortonormal de W y x1 , ..., x r , v r +1 , ..., vn base ortonormal
de V. Entonces x ∈ {vr +1,..., vn } resulta ser ortogonal a xxii,,ii == 11,, ..., r, y por lo tanto ∈W
tanto xx ∈ W⊥⊥..
Entonces [v ] ⊂ W ⊥ ... (1).
r r
Sea x ∈ W ⊥ , x = ∑ ai xi + ∑ b j v j ∴ x ⊥ xi , i = 1, ..., r ∴ xi · x = a i = 0 i = 1, ..., r e.d.
i =1 i = r +1
r
x = ∑ b j v j ∈ [vi ] ∴ W ⊥ ⊂ [vi ] ...(2)
i= 1

de (1) y (2) se obtiene que W⊥ = [vr +1, ..., vn ] y ∴ dim W⊥ = n − r, luego dim W + dim W⊥ = n.

Proyecciones
Motivación
→ →
La suma de dos vectores u y v es una operación que permite obtener un vec-
→ →
tor resultante u + v , que, en caso de que sean ortogonales, su representación
gráfica tiene la forma que aparece en la figura 5.2.
En la física e ingeniería existen varias aplicaciones en las que se plantea el

problema inverso: descomponer un vector dado (resultante) en la suma de los
u → → dos vectores ortogonales que lo forman, como se ilustra en el ejemplo 5.5.6.
u+ v
Ejemplo 5.5.6
Considere una locomotora que sube sobre una vía inclinada, como se muestra
en la figura 5.3.

La fuerza w , debida a la gravedad, empuja la máquina contra la vía, y
→ también contra su desplazamiento sobre la vía, lo que produce las dos fuerzas
v
→ →
u y v , que son ortogonales, a las que se denomina las proyecciones de la fuer-
Figura 5.2  Suma de dos vectores. → →
za w . Así, w es la resultante de la suma de sus proyecciones:
→ → →
w=u +v
→ →
La representación de las fuerzas u y v ayuda a desarrollar el análisis del efecto de la gravedad

sobre la locomotora; por ejemplo, –u representa la fuerza que se requiere para impedir que la

máquina se deslice vía abajo, mientras que v representa la fuerza que soportan sus ruedas.
5.5  Producto escalar, norma y métrica en Rn 211

Proyección de un vector sobre otro vector


→ → →
Dados los vectores w y x diferentes de cero, es posible proyectar el vector w
→ → →
sobre el vector x y sobre otro vector y perpendicular a x , como se muestra
en la figura 5.4.
→ → → → →
Como se puede observar, w = u + v , en donde u es la proyección de w →
u
→ → → →
sobre x y v es la proyección de w sobre y .

Propiedades de la proyección de un vector


La proyección de un vector sobre los otros dos vectores perpendiculares
entre sí tiene las siguientes propiedades:
→ → → →
1. u = λ x para algún escalar λ (u es paralelo a x )
→ → →
2. w = u+ v
→ → →
3. v ·x =0 v

Mediante el uso de estas propiedades se puede calcular la proyección



w
de un vector sobre otro en la forma siguiente:
De 2 se puede plantear que →
Figura 5.3  w y sus componentes.
w x u v x
Al aplicar la propiedad distributiva del producto punto con la suma

de vectores se obtiene y

w x u x v x
→ →
Como v · x = 0 (propiedad 3), entonces
→ → → → → →
w · x = u · x+ 0 = u · x

→ → w
Por otra parte, la propiedad 1 establece que u = λ x ; por lo tanto,

w · x = (λ x ) · x = λ (x · x)
→ → → → → →

v
Del anterior desarrollo se tiene que
w x w x

x x u
x
→ → →
De esta manera, la proyección de un vector w sobre otro x se puede x
escribir en la forma →
Figura 5.4  Proyecciones ortogonales de w.
w x x w x x
u x
x x x
donde
w x
x
→ →
es la componente de w sobre x . La componente de una proyección sobre un vector v es el escalar
por el que se requiere multiplicar un vector unitario en la dirección de v para obtener la proyec-
ción correspondiente.

La proyección ortogonal ( v ) de w con respecto a x→ resulta
Nota
Los términos componente y proyec-
→ → → → → ción no se utilizan de manera
Como w · x = w x cos θ , la componente de la proyección de w sobre x→ se uniforme en la literatura. En algunos
puede escribir en la forma libros se definen en forma intercam-
→ →
· biada. Le llaman proyección a lo que

= → cos θ aquí se definió como componente y
viceversa.
→ →
en donde θ es el ángulo entre w yx
212 Unidad 5  Álgebra lineal

La noción de proyección se puede generalizar a n.

Definición 5.5.8
→ → → →
Dados dos vectores u y v en n, la proyección de u sobre v es el vector
u v
v
v v

El vector u v u
v
v v
→ → →
que es perpendicular a v , se llama la proyección ortogonal de u con respecto a v .

Ejemplo 5.5.7
→ → ˆ calcule la proyección de → →
Dados u = 2iˆ − 3 jˆ + 4 kˆ y w = −2iˆ − 3 jˆ + 5 k, u sobre v y la proyección
→ →
ortogonal de u con respecto a v .

Solución
→ →
La proyección de u sobre v es
u v
u v
v
 2 (−2) + (−3)(−3) + 4(5) 
=  (−2, − 3, 5)
 4 + 9 + 25 
25 25 75 125 
=   (−2, − 3, 5) =  − , − , 
 38   19 38 38 
z

→ →
La proyección ortogonal de u con respecto a v (figura 5.5) es

v
→ →
u · v→ 25 75 125 

u − Proyv → →
u = u −  v = (2, − 3, 4) −  − , − , 
→  v 
→ 2
 19 38 38 

Proy→ u  
u v
25 75 125   63 39 2 7 
=  2 + , − 3 + , 4 −  = − , − ,  
 19 38 38   19 38 38 
y

Aplicaciones
→ →
La aplicación de una fuerza F = 3iˆ + 3 jˆ (con F en newtons) mueve
x → →
un bloque a través de un desplazamiento D = (5, 0) ( D en metros). La
→ figura 5.6 muestra un esquema del proceso.
Figura 5.5  Proyección ortogonal de u   →
→ Determine el trabajo realizado por la fuerza F .
sobre v .

→ →
F F

P D Q θ
P → Q
D →
→ F cos θ
Proy→ F
D


Figura 5.6  Diagrama del desplazamiento de un bloque. Figura 5.7  Componente horizontal de F .
5.6  Producto vectorial 213

Solución

El trabajo realizado por una fuerza constante de magnitud F que mueve un objeto a lo largo de

una distancia recta δ se calcula mediante la fórmula W = F δ , siempre y cuando la fuerza tenga

la dirección de la recta de movimiento. Si la fuerza F que mueve un objeto a través de un despla-
→ → →
zamiento D tiene otra dirección, entonces la que realiza el trabajo es la proyección de F sobre D .
Así,

D
F D
→ →
F · D → → →
W = →  D = F · D
 D 
 
( )
W = 3, 3 · (5, 0) = 3(5) + 3 (0) = 15 joules.

→ →
En→ la física se acostumbra nombrar a la proyección de F sobre D como la componente vecto-

rial de F en la dirección de D y a su componente como la componente escalar. De esta manera, la
solución del mismo problema en el lenguaje de la física sería la que aparece en

la figura 5.7.
Como se observa en la figura 5.7, la componente vectorial de la fuerza F en la dirección del
→ →
desplazamiento D es la que realiza el trabajo, y considerando a θ como el ángulo que forman F
→ → → →
y D; entonces, la componente escalar de F en la dirección de D es F cos θ. Así,


Trabajo =  componente
→ (
escalar de  longitud de D
→ 
D
)
F en la dire
ección de

F D
→ →
W= F D cos θ z
→ →
Por lo tanto, W =F · D

5.6  Producto vectorial


(1, -1, 2)
Definición (2, 3, 2)

El producto vectorial o producto cruz está definido, para un par de vectores y


u, v ∈ 3, en la forma
u × v = (u2v3 − u3v2, u3v1 − u1v3, u1v2 – u2v1)
en donde
x
3 3
u = u1ê1 + u2ê2 + u3ê3 = ∑ ui eˆi ; v = v1ê1 + v2ê2 + v3ê3 = ∑ vi eˆi (8, -2, -5)
i =1 i =1

Figura 5.8 Representación geométrica de


u × v.
Ejemplo 5.6.1

Si u = 2 ê3 + 3 ê3 + 2 ê3 y v = ê31 − ê32 + 2 ê3, su producto vectorial será el siguiente vector:
u × v = (3 . 2 – 2(−1), 2 . 1 − 2 . 2, 2(−1) − 3 . 1) = (8, −2, −5) = 8 êi − 2 ê2i − 5 ê3
y el dibujo de su gráfica en 3 se muestra en la figura 5.8.
Por la convención de suma, el producto vectorial se puede escribir en forma más compacta como
3 3
∑ ui eˆi = ui êi ;     ∑ vi eˆi = vi êi 
i =1 i =1
214 Unidad 5  Álgebra lineal

Analogía con la solución como determinante


Observe que, de acuerdo con la definición, el producto vectorial describe un sis-
z tema coordenado de mano derecha, como se ilustra en la figura 5.9.
Los productos vectoriales entre los vectores unitarios ê1i , ê2i y ê3i resultan:
ê1i × ê2i = ê3i = −( ê2i × ê1i )
ê2i × ê3i = ê1i = −( ê3i × ê2i )
ê3
ê3i × ê1i = ê2i = −( ê1i × ê3i )
ê1 ê2 y ê1i × ê1i = ê2i × ê2i = ê3i × ê3i = 0
El producto vectorial de u y v se puede escribir entonces como
u × v = (ui êi ) × (vj êji )
x y, utilizando las relaciones entre los vectores ê1i , ê2i y ê3i definidas anteriormen-
te, esta expresión se puede desarrollar para reproducir la definición del pro-
Figura 5.9  Base canónica de R3. ducto vectorial
u × v = (u2v3 − u3v2) ê1i + (u3v1 − u1v3) ê2i + (u1v2 − u1v3) ê3i
Como se puede observar de esta última forma, el producto vectorial se puede
escribir también como si fuera un determinante
Nota eˆ1 eˆ2 eˆ3
La repetición de índices se interpreta u × v = u1 u2 u3
como suma cuando dos de los
subíndices son iguales. Así, por v1 v2 v3
ejemplo,
3 2
Entonces, con base en las propiedades de los determinantes, se puede ver que
uik vi wk = ∑ ∑ uik vi wk el producto vectorial no conmuta
i =1 k =1
3 u × v ≠ v × u
= ∑ (ui1vi w1 + ui 2 vi w2 )
i =1 debido a que el determinante del producto v × u
3
∑ (ui1vi w1 + ui 2 vi w2 ) eˆ1 eˆ2 eˆ3
i =1
= (u11v1w1 + u12 v1w2 ) + (u21v2 w1 + u22 v2 w2 ) + (u31v3w1 + u32 v3w2 ) v × u = v1 v2 v3
( 11 1 1 12 1 2 ) + (u21v2 w1 + u22 v2 w2 ) + (u31v3w1 + u32 v3w2 )
u v w + u v w
u1 u2 u3
) + (u21v2 w1 + u22 v2 w2 ) ++ (u31v3w1 + u32 v3w2 ) presenta un intercambio de renglones con respecto al determinante u × v , por lo
que
v × u = − (u × v )
Con el objetivo de abreviar la escritura del producto vectorial, es posible introducir
el símbolo de permutación ∈ijk, cuya definición establece que
0, si i = j ∨ j = k ∨ k = i
∈ijk=  1, si es una permutación par de 1, 2, 3
– 1, si es una permutación impar de 1, 2, 3
El valor que adopta este símbolo es menos complicado de establecer y usar, mediante
el apoyo del esquema de la figura 5.10, en donde, como se puede observar, ∈ijk es +1 cuan-
1 do la secuencia de los subíndices 1, 2 y 3 describe la dirección de las manecillas del reloj,
-1 +1 mientras que ∈ijk es −1 cuando los subíndices 1, 2 y 3 siguen una secuencia contraria a las
manecillas del reloj. Por lo tanto,
∈123 = ∈231 = ∈312 = +1
∈132 = ∈321 = ∈213 = −1
3 2
El empleo del símbolo de permutación y sus propiedades permite demostrar que el
producto vectorial entre los vectores u y v se puede escribir usando notación indicial,
en la siguiente forma:
u × v = ∈ijk uivj êk
Figura 5.10  Esquema del 3 3 3
signo de las permutaciones. ∈ijk uivj êk = ∑ ∑ ∑ ∈ijk ui v j êk
k =1 i =1 j =1
5.6  Producto vectorial 215

Asimismo, cuando se asume esta nueva representación del producto vectorial, es posible
escribir un determinante en forma compacta. De esta manera, el determinante de la matriz de 3 ×
3 con elementos aij será:

det (aij) = ∈ijk a1i a2j a3k = ∈ijk ai1 aj2 ak3

det (aij) = ∈111 a11 a21 a31 + ∈112 a11 a21 a32 + ∈113 a11 a21 a33 + ∈121 a11 a22 a31 + ∈122 a11 a22 a32
+ ∈123 a11 a22 a33 + ∈131 a11 a23 a31 + ∈132 a11 a23 a32 + ∈133 a11 a23 a33 + ∈211 a12 a21 a31
+ ∈212 a12 a21 a32 + ∈213 a12 a21 a33 + ∈221 a12 a22 a31 + ∈222 a12 a22 a32 + ∈223 a12 a22 a33
+ ∈231 a12 a23 a31 + ∈232 a12 a23 a32 + ∈233 a12 a23 a33 + ∈311 a13 a21 a31 + ∈312 a13 a21 a32
+ ∈313 a13 a21 a33 + ∈321 a13 a22 a31 + ∈322 a13 a22 a32 + ∈323 a13 a22 a33 + ∈331 a13 a23 a31
+ ∈332 a13 a23 a32 + ∈333 a13 a23 a33

det (aij) = 0 · a11 a21 a31 + 0 · a11 a21 a32 + 0 · a11 a21 a33 + 0 · a11 a22 a31 + 0 · a11 a22 a32
+ 1 · a11 a22 a33 + 0 · a11 a23 a31 + (−1) · a11 a23 a32 + 0 · a11 a23 a33 + 0 · a12 a21 a31
+ 0 · a12 a21 a32 + (−1) · a12 a21 a33 + 0 · a12 a22 a31 + 0 · a12 a22 a32 + 0 · a12 a22 a33
+ 1 · a12 a23 a31 + 0 · a12 a23 a32 + 0 · a12 a23 a33 + 0 · a13 a21 a31 + 1 · a13 a21 a32
+ 0 · a13 a21 a33 + (−1) · a13 a22 a31 + 0 · a13 a22 a32 + 0 · a13 a22 a33 + 0 · a13 a23 a31
+ 0 · a13 a23 a32 + 0 · a13 a23 a33

det (aij) = a11 a22 a33 (–)a11 a23 a32 (−)a12 a21 a33 (+)a12 a23 a31 (+)a13 a21 a32 (−)a13 a22 a31
= a11 (a22 a33 – a23 a32) + a12 (a23 a31 – a21 a33) + a13 (a21 a32 – a22 a31)

a11 a12 a13


a22 a23 a21 a23 a21 a22
= a11 − a12 + a13 = a21 a22 a23
a32 a33 a31 a33 a31 a32
a31 a32 a33

En la función determinante del anexo 2, se da otra descripción del desarrollo anterior.


Es posible demostrar, y se deja como ejercicio, que la norma del producto vectorial tiene la
forma siguiente:
|| u × v || = || u || || v || sen θ

en donde θ es el ángulo que forman u y v .


Esta última afirmación permite establecer una forma análoga del producto vectorial que
incluye al vector unitario perpendicular al plano formado por u y v , denominado ê ⊥;

u × v = || u || || v || sen θ ê⊥

Como se ha establecido previamente, los vectores u , v y ê ⊥ definen un sistema coordenado


de mano derecha.

Interpretación geométrica de la norma


del producto vectorial
|| u × v || = || u || || v || sen θ

Sea el par de vectores no colineales y distintos de cero v , u ∈ 3, como se ilustra en la figura 5.11.
Si se considera el paralelogramo cuyos lados corresponden con los vectores u y v , entonces
su área es
AP = base × altura = || v || × h
216 Unidad 5  Álgebra lineal

pero la altura (h) del paralelogramo corresponde con el cateto opuesto del triángulo
rectángulo de la figura, por lo que
h = || u || sen θ
Al reemplazar se tiene
u
θ
h AP = || u || || v || sen θ = || u × v ||
v
Ejemplo 5.6.2
Encuentre el área del triángulo en 3, cuyos vértices corresponden con los vectores
siguientes:
Figura 5.11  Paralelogramo u = (1, 2, −1), v = (2, −2, 1) y w = (1, −1, 2)
formado por u y v . La figura 5.12 muestra la gráfica de los tres puntos, así como dos aristas del trián-
gulo que forman y que corresponden con las diferencias:
u − v = (1, 2, −1) – (2, −2, 1) = (−1, 4, −2) y w − v = (1, −1, 2) – (2, −2, 1) = (−1, 1, 1)
Entonces
eˆ1 eˆ2 eˆ3
( u − v ) × ( w − v ) = −1 4 −2 = (6, 3, 3)
−1 1 1
w y el área del paralelogramo sería
v AP = ||(6, 3, 3)|| = 54 = 3 6
u Entonces el área del triángulo es
Figura 5.12  Vectores que señalan
3
AT = 6
los vértices del triángulo. 2

Algunas propiedades del producto vectorial


En el siguiente teorema se establecen algunas propiedades adicionales del producto vectorial.

 Teorema  5.6.1
Sean u, v y w vectores en 3 y α ∈  un escalar:

i) u · ( u · v ) = v · ( u × v ) = 0 ( u × v es ortogonal tanto a u como a v )


ii) u || v ⇔ u × v = v × u = 0
iii) u × 0 = 0 × u = 0
iv) || u × v ||2 = || u ||2 || v ||2 – ( u · v )2 (identidad de Lagrange)
v) u × ( v + w ) = ( u × v ) + ( u × w )
vi) u × (α v ) = (α u ) × v = α( u × v )

Se harán solamente las demostraciones correspondientes a las propiedades i), ii) y v). Las
demás se sugieren como ejercicios.
i) u · ( u × v ) = (u1, u2, u3) · (u2v3 − u3v2, u3v1 − u1v3, u1v2 − u2v1)
= u1(u2v3 – u3v2) + u2(u3v1 − u1v3) + u3(u1v2 – u2v1)
= u1u2v3 – u1u3v2 + u2u3v1 – u2u1v3 + u3u1v2 – u3u2v1
= u1u2v3 + u2u3v1 + u3u1v2 – (u3u1v2 + u1u2v3 + u2u3v1) = 0
v · ( u × v ) = (v1, v2, v3) · (u2v3 − u3v2, u3v1 − u1v3, u1v2 − u2v1)
= v1(u2v3 – u3v2) + v2(u3v1 − u1v3) + v3(u1v2 – u2v1)
= v1u2v3 – v1u3v2 + v2u3v1 – v2u1v3 + v3u1v2 – v3u2v1
= v1u2v3 + v2u3v1 + v3u1v2 – (v3u1v2 + v1u2v3 + v2u3v1) = 0
5.7  Triple producto escalar 217

ii) u || v ⇒ u = α v

eˆ1 eˆ2 eˆ3 eˆ1 eˆ2 eˆ3 eˆ1 eˆ2 eˆ3


u × v = u1 u2 u3 = αv1 αv2 αv3 = α v1 v2 v3 = α ( 0 ) = 0
v1 v2 v3 v1 v2 v3 v1 v2 v3
eˆ1 eˆ2 eˆ3 eˆ1 eˆ2 eˆ3 eˆ1 eˆ2 eˆ3
v × u = v1 v2 v3 = v1 v2 v3 = α v1 v2 v3 = α ( 0 ) = 0
u1 u2 u3 αv1 αv2 αv3 v1 v2 v3

v) u × ( v + w ) = ( u × v ) + ( u × w )

eˆ1 eˆ2 eˆ3 eˆ1 eˆ2 eˆ3 eˆ1 eˆ2 eˆ3


u × (v + w ) = u1 u2 u3 = u1 u2 u3 + u1 u2 u3
v1 + w1 v2 + w2 v3 + w3 v1 v2 v3 w1 w2 w3

= (u × v ) + (u × w )

5.7  Triple producto escalar


Definiciones
Sean u, v y w vectores en 3.

Se define el triple producto escalar en la forma


u1 u2 u3
u · ( v × w ) = v1 v2 v3 = u1v2w3 + u2v3w1 + u3v1w2 – (u1v3w2 + u2v1w3 + u3v2w1)
w1 w2 w3
o bien

u · ( v × w ) = || u || || v × w || cos θ,

en donde θ es el ángulo entre los vectores u y ( v × w ).

Ejemplo 5.7.1
Calcule el producto triple escalar para los siguientes vectores:
u = (2, −2, 1), v = (3, 4, 2) y w = (−1, 1, 2)

2 −2 1
u  ·  ( v × w ) =  3 4 2 = 2 · 4 · 2 + (−2) · 2 · (−1) + 1 · 3 · 1 – (2 · 2 · 1 + (−2) · 3 · 2 + 1 · 4 · (−1))
−1 1 2
= 35

Interpretación geométrica
Sean u, v y w tres vectores en 3 que forman paralelogramos correspondientes con los lados de
un paralelepípedo, que se ilustra en la figura 5.13.
El volumen de todo paralelepípedo equivale al producto del área de su base por su respectiva
altura. En el caso del paralelepípedo formado por los vectores u, v y w, el área de la base se
puede obtener a partir de || v × w ||, que es el área de la superficie del paralelogramo formado por
los vectores v y w.
218 Unidad 5  Álgebra lineal

La altura del paralelepípedo (vea la figura 5.13) es equivalente a la norma de la


proyección de u sobre v × w. Así,
u · (v × w)
h = Proy u ×v u =
u v ×w
v
h θ De esta manera, el volumen del paralelepípedo es
w
u · (v × w)
VP = v × w = u · (v × w)
v ×w
que es el triple producto escalar.

Figura 5.13  Paralelepípedo Ejemplo 5.7.2


formado por u, v y w. El volumen del paralelepípedo formado por los vectores

u = (2, −2, 1), v = (3, 4, 2) y w = (−1, 1, 2)


es VP = u · ( v × w )| = 35.

5.8  Rectas y planos


Las rectas en n
Para definir con toda precisión una recta debe estar claro que basta un punto por el que pase _ (o
en el que se apoye) y un vector diferente de cero que la genere. Sea P0 un punto en  n y a un
vector distinto de cero. Entonces la recta ℒ, apoyada en P0 y generada por a , es el conjunto de los
puntos P ∈  n que satisfacen la ecuación P = P0 + ta para cada t ∈  . Así, a cada valor de t le
corresponde un punto en la recta y recíprocamente. Un punto Q está en la recta si y sólo si existe
un t0 ∈  tal que Q = P0 + t0 a . Esta recta también se denota como ℒ (P0 ; a ).

Ejemplo 5.8.1
Sea ℒ la recta apoyada en (1, 2, 3) y generada por (3, 2, 1). El punto (10, 8, 6) está en ℒ, ya que
(10, 8, 6) = (1, 2, 3) + 3(3, 2, 1) mientras que (1, 0, 1) no está en ella, ya que no existe t ∈  tal que
(1, 0, 1) = (1, 2, 3) + t (3, 2, 1). 
La figura_5.14 representa la recta en 3 que pasa por el punto P0 y está generada
por el vector a .
z
Se deja al lector la demostración de los teoremas siguientes.
P0

a  Teorema  5.8.1
ℒ _ _
Si Q es un punto de la recta ℒ(P0; a, ), entonces ℒ(P0; a ) = ℒ(Q; (a ); es decir, toda
recta se puede apoyar en cualquiera de sus puntos.

x y  Teorema  5.8.2
_ _ _
Figura 5.14  Recta en 3. Si b es un vector diferente de cero y paralelo a a, entonces ℒ(p0; a ) = ℒ(P0; b ).
Toda recta se puede generar por cualquier vector no cero, paralelo a su generador
original.

Corolario 1 La ecuación de la recta no es única.

Una ecuación de la recta que pasa por dos puntos


Sean P1 y P2 dos puntos distintos. Para encontrar una ecuación de la recta que pasa por ellos, se
debe seleccionar un punto de apoyo y un vector que la genere. En vista de los teoremas anteriores,
se puede elegir cualquiera de los puntos como apoyo y tomar el vector P2 − P1 como vector gene-
5.8  Rectas y planos 219

rador, que es distinto de cero, dado que los puntos son diferentes. Entonces, ℒ(P1; P2 – P1) es la
ecuación de una recta. Para comprobar que es la que se quiere basta hacer ver que –P1 y P2 están
en ella, lo que se consigue tomando para t los valores 0 y 1.
Por ejemplo, sean P1 = (1, 2, −1) y P2 = (−2, 3, 1). Entonces una ecuación de la recta que pasa
por ellos es ℒ((1, 2, −1); (−3, 1, 2)). Otras serían _ ℒ((–2, 3, 1); (3, –1, –2)),…
_
Una _ ecuación vectorial de la recta ℒ(P 0 ; a ) es ℒ = {P | P = P0 + ta , + t ∈ }.
Si a = (a1, a2, a3) y P0 = (x0, y0, z0), la ecuación de la recta también puede escribirse en forma
paramétrica, como sigue:
x = x0 + ta1
y = y0 + ta2, t ∈ 
z = z0 + ta3

y cuando a1, a2, a3 son diferentes de 0, se puede usar la forma simétrica, que se obtiene despejando
el parámetro t en las ecuaciones anteriores e igualando los resultados:
x − x0 y − y0 z − z0
a1 = a2 = a3

Ejemplo 5.8.2
_ _
Sea P0 = (1, 2, 3) y a = (3, 2, 1). Entonces, la recta ℒ que pasa por P0 y que está generada por a es:
Ecuación vectorial: P = {(x, y, z) = (1, 2, 3) + t(3, 2, 1), t ∈ } (5.8.1)
Ecuaciones paramétricas:
x = 1 + 3t
y = 2 + 2t t ∈  (5.8.2)
z = 3 + t
Forma simétrica:
x−1 y−2
= =z−3
3 2

Ángulo entre rectas


Se define el ángulo entre dos rectas, independientemente de que se corten o no, como el que for-
man los vectores que las generan.
Cuando los vectores generadores son ortogonales (o paralelos) se dice que las rectas son orto-
gonales (o paralelas).

Planos en 3
El mismo razonamiento que se usó para definir la ecuación vectorial de una recta permite asegu-
rar que un plano queda bien determinado si se conoce un punto de apoyo y dos
vectores que lo generen (figura 5.15). _ –
Así, una ecuación del plano apoyado en P0 y generado por los _ –vectores a y b es
P ={P|P = _ P0–+ ta + sb, s, t ∈ }, que se abrevia como π (P0; a, b ). Para que los z
vectores a y b generen al_plano se requiere que no sean paralelos.

Un punto P ∈ π (P0 ; a, b ) si y sólo si existen escalares s0 y t0 tales que b
_ –
P = P0+ t0 a + s0b .
Siguiendo con las analogías, se expresan los dos teoremas siguientes, cuya demos-
a
tración también se deja como ejercicio.

 Teorema  5.8.3
_ – _ – _ – x y
Si Q0∈ π(P0; a, b ), entonces π(P0; a, b ) = π (Q0; a, b ). Un plano puede apoyarse en
cualquiera de sus puntos.
Figura 5.15  Vectores que generan
el plano.
220 Unidad 5  Álgebra lineal

 Teorema  5.8.4
_ –
Si u– y v– son vectores no paralelos que están en el plano generado por a y b, entonces
_ –
π (P0; a, b) = π (P0; –u, –v ).
Un plano puede generarse por cualesquiera dos vectores no paralelos que estén en el plano de los
generadores originales.

Una ecuación del plano que pasa


por tres puntos no colineales
Sean P1, P2 y P3 tres puntos no colineales. Para encontrar una ecuación del plano que pasa por
ellos se debe seleccionar un punto de apoyo y dos vectores no paralelos que lo generen. En vista
de los teoremas anteriores, se puede elegir cualquiera de ellos (por ejemplo, P1), como apoyo y
tomar los vectores P2 – P1 y P3 – P1 como generadores. La no colinealidad garantiza que los
vectores generadores no son paralelos (vea el ejercicio 5.9.11 del final de la unidad). La ecuación
del plano queda π (P1; P2 − P1, P3 − P1 ), o en forma vectorial P = P1 + s (P2 − P1 ) + t (P3 − P1 ), s, t ∈= ,
y en este caso si t = s = 0 resulta que P1 ∈ π ; si s = 1 y t = 0, P2 ∈ π , y si s = 0 y t = 1, P3 ∈ π.
Por ejemplo, sean P1 = (1, 0, − 1), P2 = (3, 1, 2) y P3 = (−4, 4, 1). Tomando P1 como punto de
apoyo, los vectores generadores P2 − P1 y P3 − P1 resultan ser (2, 1, 3) y (−5, 4, 2). Entonces una
ecuación del plano es π ((1, 0, − 1); (2, 1, 3), (−5, 4, 2)) .

Ecuación normal del plano


Otra forma de expresar la ecuación de un plano π requiere de un vector n que sea ortogonal a
cualquier recta contenida en π y un punto de apoyo P0 . El vector n se conoce como una normal
al plano. Note que en este caso, si P es un punto del plano P − P0 , resulta ortogonal a n y, por lo
tanto, n · (P − P0 ) = 0. En particular, si n = (a, b, c ) , P0 = (x0 , y0 , z0 ) (vectores conocidos) y
P = (x, y, z ) un vector cualquiera del plano, la ecuación anterior queda

ax + by + cz = d
en donde d = ax0 + by0 + cz0 = n · P0 .
En general, toda ecuación lineal en tres variables representa un plano en 3, cuya normal es
el vector formado por sus coeficientes. Por ejemplo, la ecuación x + 2 y + 3z = 0 representa un pla-
no que pasa por el origen —el punto (0, 0, 0) satisface la ecuación— y tiene normal (1, 2, 3). La
ecuación 2 x − 3z = 5 representa al plano que pasa por (1, −7, −1) y que tiene por normal al vector
(2, 0, −3).
Cuando se conocen los vectores que generan al plano, una normal puede obtenerse a partir
del producto cruz de ellos. Del ejemplo anterior se obtiene n– = (2, 1, 3) × (−5, 4, 2) = (−10, −19, 13)
y d resulta (−10, −19, 13) . (1, 0, −1) = −23. Finalmente, una ecuación del plano es
−10 x − 19 y + 13z = −23
n
z

P - P0
Ángulo entre planos
Se define el ángulo entre dos planos como el que forman sus vectores norma-
P0 les. Entonces, si los vectores normales son ortogonales (o paralelos), se dice
P que los planos son ortogonales (o paralelos).
y

x Ángulo entre recta y plano


Se define el ángulo entre una recta y un plano como el complemento del
Figura 5.16  Representación del plano. que forman una normal al plano y un vector generador de la recta.
5.9  Transformaciones lineales 221

5.9  Transformaciones lineales


En esta sección se estudian funciones cuyo dominio y codominio son espacios vectoriales sobre el
mismo campo y que cumplen dos condiciones: abren sumas y sacan escalares (vea la definición).

a S( a )

a + b S( a ) + S( b )

α· a αα · Sv (a
S() a )

b S( b)

{𝕌, 𝕂, + , ·} {𝕍, 𝕂, , ·}

Figura 5.17  Esquema de la transformación lineal S.

Definición 5.9.1
Sean U y V espacios vectoriales sobre el campo K. Una función S de U en V se llama una
transformación lineal si satisface las dos condiciones siguientes:
– + b ) = S(a–) + S(b–)
1. S (a “abre sumas”.
– –)
2. S (αa ) = αS(a “saca escalares”.
∀ a, b ∈ U, ∀ α ∈ K
Se enfatiza que la suma a + b y la multiplicación de un vector por un escalar α · a se reali-
za en el espacio U, mientras que S( a ) ⊕ S( b ) y α ≠ S( a ) se realizan en el espacio V.

Ejemplo 5.9.1
Sea a un número real y T:  →  con regla de asociación T(x) = ax. Se comprobará que T es
una transformación lineal (TL).
En efecto, sean x, y ∈  (vectores) y α ∈  (escalar). Al aplicar la definición de T:
T(x + y) = a(x + y) = ax + ay = T(x) + T(y) “abre sumas”.
T(αx) = a(αx) = (aα)x = (αa)x = α(ax) = αT(x) “saca escalares”.
Ejemplo 5.9.2
Si ahora la regla de asociación fuera T(x) = ax2, ¿T sería una TL?
Sean x, y ∈  y α ∈ . Al aplicar la definición
T(x + y) = a(x + y)2 = a(x2 + 2xy + y2) = ax2 + a2xy + ay2 = T(x) + 2xy + T(y) ≠ T(x) + T(y)
T(αx) = a(αx)2 = a(α2x2) = α2 (ax)2 = α2 T(x) ≠ αT(x).
Como no se cumple ninguna de las condiciones, T no es una TL (bastaría con que no se
cumpliera cualquiera de ellas).

Ejemplo 5.9.3
Sean a y b números reales y T: 2 →  con regla de asociación T(x, y) = ax + by. ¿T es una TL?
Sea x = ( x1, x2 ) y y = ( y1 , y2 ) elementos de 2 y α ∈ . Aplicando la definición,
T (αx ) = a (αx1 ) + b (αx2 ) = (aα) x1 + (bα) x2 = α (ax1 + bx2 ) = αT (x )
T (x + y ) = T (x1 + y1, x2 + y2 ) = a ( x1 + y1 ) + b( x2 + y2 ) = ax1 + bx2 + ay1 + by2 = T ( x ) + T ( y )

Luego, T es una TL.


222 Unidad 5  Álgebra lineal

Ejemplo 5.9.4
Sean a y b números reales y T: 2 →  con regla de asociación T(x, y) = ax + by + 1. ¿T es una TL?
Sean x = ( x1 , x2 ) y y = ( y1, y2 ) elementos de 2 y α ∈ . Al aplicar la definición,

T ( x + y ) = T ( x1 + y1, x2 + y2 ) = a ( x1 + y1 ) + b( x2 + y2 ) + 1 = ( ax1 + bx2 ) + ( ay1 + by2 ) + 1


T ( x ) + T ( y ) = ( ax1 + bx2 + 1) + ( ay1 + by2 + 1) = ( ax1 + bx2 ) + ( ay1 + by2 ) + 2
∴ T (x + y ) ≠ T (x ) + T ( y )
T no es una TL.

Ejercicios 5.9

1. Calcule las componentes del vector (4, 6) con respecto a las bases B 1 = {(1, 0),(0, 1)},  
B {(1, 1), (1, − 1)} y y B 3 = {(1, 0),(1, 2)} .

2. Calcule las componentes del vector (2, 0, 3) respecto a las bases B a = {(1, 0, 0),(0, 1, 0),(0, 0, 1)} ,
B b = {(2, − 2, 1), (0, 1, − 1),(0, 0, 1)} y B c = {(1, 1, 1), (0, 1, 2), (1, 0, 4)}.

3. Resuelva lo que se le pide:


1 2  1 
a)  Dé tres combinaciones lineales de los vectores   ,   ,   .
3 1 −1
1 1 2
b)  ¿   es una combinación lineal de los vectores  ,   ?
3
  1 1
2 −1  1  1
c)  ¿   es una combinación lineal de los vectores  ,  ,   ?
1
   2  −1 1
 1 1 −2
d )  ¿   es una combinación lineal de los vectores  ,   ?
−1 1 −2

4. Trace los subespacios de 2 generados por los vectores que se indican.

1 0 1 −1  1  −1  0 −1  1


a)  , b)  , c)  , d)  , e)  , f )  , g)  , h)  , i)  ,
−1
0 1 1  1 −1  0   −1 −1
1 0 1 1  1 −1
j )  ,  , k)  ,  , l ) −1,  1.
0 1 0 1    

5. ¿Cuáles de los subespacios generados son iguales?


1 0 1  1 1 1
1 2  −1   0  0    −1 , Gen   0 .
Gen   , Gen  ,   , Gen 0, 1 , Gen  ,  −1 , Gen 1,   0,  
0 0  0 0 0 1   0  0 0 0
       

6. ¿Cuáles de las siguientes proposiciones son ciertas?


 1 1 0
1  0 1 2 1 −2      
a)   ∈ Gen  , −
0 , b) 1 ∈ Gen 1, −2 , c)   ∈ Gen 0,
1 1.
3
   −1         0 1
 2  
5.9  Transformaciones lineales 223

7. ¿Cuáles de los siguientes conjuntos de vectores son linealmente independientes?

1 0 0 1 0 2


 1 1  1 −1   1, 0 , D =   1, 1 .
A =  ,   , B =  ,   , C = 1,     1,    
−1 1 −1  1 1
  1 1 1
  1 1

8. Indique los conjuntos que son bases de 2 y aquellos que son bases de 3.

1 0
 1  1 1  1 1 1   1 ,
B =   , B =  , 1 , B = −1, 1, 2 , B = 1,  
−1
  −1        1
  1

1 0 0 0 0 1 0 0 1 −1
                  
B = 1, 1 , 0 , B = 0, 1, 1 , B = 0, 1, 1,  1 .
1 1 1 1 1 1 1 1 1 −1
     

9. Dé una ecuación de la recta que pasa por el punto P = (1, −1, 2) y que está generada por el
vector (2, 1, 3).

10. Construya una ecuación de la línea que pasa por los puntos P = (1, 0, 1) y Q = (2, 2, 3).

11. Demuestre que si los puntos P1, P2, P3 no son colineales, entonces P2 − P1 y P3 − P1 no son
paralelos.

12. Dé una ecuación del plano que pasa por el punto P = (−1, 1, 1) y que es perpendicular a los
vectores a,= (5, 1, 3) y b , = (−2, 1, 1).

13. Dé una ecuación del plano que pasa por los puntos P = (2, 1, 0), Q = (3, −1, 1) y R = (1, 0, 2).

14. Dé una ecuación del plano que pasa por el punto P = (1, 1, 1), cuya normal es paralela al vector
(1, 2, 3).

( )
L (1, 1, 2); (2, 1, 1) , exprésela en forma vectorial y en forma paramétrica.
15. Dada la recta ℒ

16. Dada una ecuación vectorial para un plano, transfórmela en una normal.

17. Calcule el ángulo entre las líneas ℒ1 = {(1, −1, 2) + α (1, 0, 1), α ∈ } y ℒ2 = {(2, 3, −1) + β(0,
−1, 1), β ∈ }. ¿Cuál es la intersección de las líneas ℒ1 y ℒ2?

18. Calcule el ángulo entre los planos π1 = {(x, y, z) | 2x + y − z = 1} y π2 = {(x, y, z) | x − y − z = 2 }.

19. Calcule la distancia entre los puntos P = (2, 1, 4) y Q = (1, 0, 2).


224 Unidad 5  Álgebra lineal

20. Calcule la distancia del punto P = (2, 1, 1) a la línea ℒ que tiene ecuaciones paramétricas 
x = 1 + t, y = 2 − t, z = −1 + 2t.

21. Calcule la distancia entre las líneas ℒ1 = {(1, −1, 2) + α(1, 0, 1), α ∈ } y
ℒ2 = {(2, 3, −1) + β(0, −1, 1), β ∈ }.

22. Calcule la distancia del punto P = (1, 0, 1) al plano x + 3y − z = 4.

23. Calcule la distancia entre los planos x − y + z = 1 y −x + y − z = 4.

24. Para a = (−1, 1, 0), b = (0, 1, 1), calcule la norma de los siguientes vectores: 2 a, a − b, 
a × b .

25. Dé dos vectores ortogonales a los vectores − a y 2 b , que tengan tamaño π, donde a = (−1,
1, 0) y b = (0, 1, 1).

26. Dé todos los vectores ortogonales al vector (1, −1, −2).

27. Calcule el perímetro y el área del triángulo que tiene como vértices los puntos (1, 0, 0), 
(0, 2, 0) y (0, 0, 3).

28. Calcule el volumen del paralelepípedo que tiene como tres de sus aristas los vectores (1, 0, 0), 
(0, 2, 0) y (0, 0, 3).

29. Calcule el volumen de la pirámide que tienen sus vértices en los puntos (0, 0, 0), (3, 0, 0), 
(0, 4, 0) y (1, 1, 1).

30. ¿Qué parejas de los siguientes vectores son ortogonales?

a = (2, 1, 3), b = (1, 1, −2), c = (−1, 1, 0).

31. Calcule el ángulo que forman los vectores a = (1, −1, 1) y b = (−1, 1, 1).

32. Calcule la proyección ortogonal del vector a = (2, 0, 1) sobre el vector b = (0, 2, 1).

33. Calcule la componente ortogonal del vector a = (0, 2, 1) sobre el vector b = (2, 0, 1).

34. Exprese el vector a = (2, 1, 3) como la suma de dos vectores ortogonales, uno de los cuales
sea paralelo al vector b = (1, −1, 1).

35. Investigue cómo se definen los cosenos directores y calcule los que correspondan al vector 
a = (1, −2, 1).

36. Descanse.
Anexo 1
Combinatoria
Para analizar los resultados de las encuestas, muestreos, censos, probabilidades o estudios estadís-
ticos teóricos o las prácticas indispensables para la toma adecuada de decisiones es importante
contar los elementos de algunos conjuntos, de sus subconjuntos y de las familias de éstos. De esta
actividad (determinar la cardinalidad de un conjunto o contar sus elementos) han surgido algunas
conjeturas, afirmaciones que no han sido demostradas, y varias proposiciones importantes en la
teoría de los números, como el último teorema de Fermat que se demostró más de 300 años des-
pués de que fue formulado.
Cuando los conjuntos son infinitos, es decir, tienen un número infinito de elementos, la cuen-
ta del número de éstos depende de la manera de contarlos, pero en el caso finito, si no se equivoca
el contador, el resultado es independiente del método, observación que ha dado origen a un buen
número de aplicaciones importantes en diversas ramas de la matemática, como la teoría de gru-
pos, de anillos, extensiones de campos, y en general en la parte conocida como “álgebra abstrac-
ta”, así como en la probabilidad y en la teoría de la medida.
En esta sección se analizan algunas técnicas elementales de conteo para los conjuntos finitos;
asimismo, se presentan ejemplos y se proponen ejercicios relacionados con el tema.
Cuando se describe un conjunto exhibiendo explícitamente a sus elementos, tal exhibición es
equivalente a una serie de proposiciones de pertenencia unidas por el conectivo “y” que conmuta
y es asociativo. Así, la expresión A = {a, b} dice que a ∈ A y b ∈ A, o equivalentemente que b ∈ A y
a ∈ A, es decir, {a, b} = {b, a}.
Observe que la proposición a ∈ A ∧ a ∈ A ∧ a ∈ A ∧ b ∈ A ∧ b ∈ A define al mismo conjunto.
Es decir, { a, b} = { a, a, a, b, b} = {b, b, , a, a,} .
En efecto, un conjunto está determinado por sus elementos y es independiente del orden en el
que se diga que tales elementos pertenecen al conjunto y del número de veces que pueda repetirse
esta información de pertenencia; es decir, que los elementos de un conjunto no están ordenados.
Algunas veces resulta conveniente, o cómodo, denotar a los elementos de un conjunto con la
misma letra marcada con diferentes subíndices. Así, por ejemplo, se han mencionado las n-adas
( x1, x2 ,, xn ) y los productos cartesianos generalizados
En el primer caso se ha usado la misma letra x para representar las diferentes coordenadas de
cada n-ada, distinguiendo unas de otras por el subíndice que se les adjunta, y en este ejemplo el orden
natural de los subíndices puede usarse para inducir el correspondiente orden en las coordenadas. Se
dice que “xi es anterior a xj” si i es menor que j (por ejemplo, x2 “va antes” que x4 o que x7).
En el caso del producto cartesiano generalizado, pudiera suceder que el conjunto I de índices
tuviera alguna relación de orden y, en ese caso, éste permite ordenar a los factores de manera
análoga a la anterior (xi es anterior a xj si, en el orden de I, i va antes que j).
Se llama conjunto parcialmente ordenado (o COPO) a la colección de objetos (conjunto) en
la que, además de los objetos mismos, está definida en ellos alguna relación de orden, que cuando
es lineal (o total o completa) produce un COPO linealmente ordenado.
Estas consideraciones deberán tomarse en cuenta cuando se trate de decidir si dos conjuntos
son iguales o no. Del axioma de extensión1 se sigue que A ≠ B si y sólo si existe un elemento en A
que no esté en B o viceversa, pero cuando se trata de conjuntos ordenados puede suceder que aun
teniendo los mismos elementos, éstos aparezcan en diferente orden, y en ese caso los conjuntos
deben considerarse como distintos. Las coordenadas de los puntos del plano son un ejemplo de
esto; ( a, b ) ≠ ( b, a ), a menos que a sea igual a b.
¿Cuántos subconjuntos de dos elementos pueden formarse a partir de A = { a, b, c } ? La res-
puesta es tres: {a, b}, {a, c}, {b, c}.

1 A = B ⇔ ∀ x, x ∈ A ⇔ x ∈ B. 225
226 Anexo 1

¿Cuántos subconjuntos ordenados? En este caso, la respuesta es seis, a saber: (a, b), (b, a),
(a, c), (c, a), (b, c), (c, b).
Observe el cambio de notación: {a, b} = {b, a} aunque a sea diferente de b, y en este caso,
(a, b) ≠ (b, a).

Principio fundamental del conteo (PFC)


Suponga que se debe realizar un evento que consta de dos etapas independientes, y que cada una
se puede efectuar de m1 y m2 maneras, respectivamente. Entonces la sucesión ordenada de las dos
etapas (el evento) tiene m1 m2 distintas maneras de efectuarse. En general, si un evento consta de
n etapas independientes, cada una de las cualesn
puede realizarse de mi, i = 1, …, n, maneras dife-
rentes, el proceso total puede efectuarse de ∏ mi modos distintos, resultado que puede probarse
por inducción sobre el número de etapas. i =1
La situación anterior para el caso de un proceso que consta de dos etapas independientes, una
de las cuales se puede realizar de dos formas y la otra de tres, puede ilustrarse, entre otras, de las
siguientes maneras:
1. Sean A = {a1, a2} las formas en que puede llevarse a cabo la primera y B = {b1 , b2 , b3 } las de
la segunda. Entonces los seis diferentes eventos pueden representarse por las parejas ordena-
das ( a1, b1 ), ( a1, b2 ), ( a1, b3 ), ( a2 , b1 ), ( a2 , b2 ) y ( a2 , b3 ), en donde las coordenadas indi-
can la selección de cada una de las posibilidades. Observe que cada paréntesis puede
considerarse también como una función η del conjunto de las etapas E = {E1, E2} en el pro-
ducto cartesiano A × B de las posibles selecciones. Así, (ai, bj) representa (es) la función
ηi j : E → A × B , tal que η(E1 ) = ai , η(E2 ) = b j , que suprimiendo literales dice que, en este
caso, para la etapa 1 se escogió la forma i y para la etapa 2 la forma j. Esta observación per-
mite contar el número de distintos eventos por medio de la cuenta de las funciones anteriores.
2. A cada selección de la primera etapa (dos posibilidades) corresponde cualquiera de las tres
posibilidades de la segunda (o viceversa), lo que se ilustra con los siguientes diagramas.

b1
a1
a1 b2 b1 a
b2 b b1 a1
a1 b2 b1 a1 a22
b3
a2
b1 3 b2 aa21
a2 b2 b1 a2a
b2 b b3 1

b33 b3 aa21
a2

¿Cuántas palabras de tres letras se pueden formar con los elementos del conjunto A = {a, b, c, d, e}?
Se llamará palabra a cualquier conjunto ordenado de tres letras, repetidas o no, independien-
temente del significado que pudieran o no tener en el sentido usual. Así, aac, aba y ccc son ejem-
plos de palabras para este problema. Note que aab y aba son palabras distintas.
Debe ser claro que para encontrar la solución a este problema deben tomarse tres decisiones,
y que no importa el orden en el que se tomen: cuál debe ser la primera letra, cuál la segunda y cuál
la tercera. En cada caso debe seleccionarse una letra del conjunto A que tiene cinco elementos,
luego cada selección puede hacerse de cinco maneras independientes. El PFC asegura que enton-
ces el proceso completo, seleccionar las tres letras, puede hacerse de 5 × 5 × 5 maneras diferentes,
y que, por lo tanto, hay 125 posibles palabras de tres letras.
Aquí se ha llamado palabra a lo que técnicamente se conoce como una ordenación con repetición
de tres elementos, y en este caso el problema puede plantearse preguntando: ¿cuántas ordenaciones
con repetición de tres elementos se pueden formar a partir de un conjunto de cinco elementos? En
este anexo se denotará la respuesta, que resulta ser 53, con el símbolo OR35, que se lee como ordena-
ciones con repetición de cinco elementos tomados de tres en tres. En algunos libros se invierte el orden
de los índices y se escribe OR53, o se usa también la notación 3OR5 (y aun 5OR3).
La discusión del ejemplo anterior debe ser suficiente para convencerse de que, en general, las
ordenaciones con repetición de k símbolos tomados de un universo de n deben satisfacer la fórmu-
la ORkn = nk.
Anexo 1 227

En el caso en que para formar una palabra no se admitan repeticiones, se dirá que se trata de
una ordenación, y el número de todas ellas se denotará como Okn.
¿Cuántas ordenaciones se pueden formar con k símbolos a partir de un universo de n?
Deben hacerse k selecciones. Para la primera hay n posibilidades. Para la segunda, puesto que
no se permiten repeticiones, quedan n − 1 posibilidades. Para la tercera n − 2, y para la k-ésima
n!
n − k + 1. Luego, O kn = n (n − 1)(n − 2)(n − k + 1), que es igual al número . ¡Convénzase!
(n − k )!
Para calcular el número de palabras sin repetición (ordenaciones) con k símbolos que pueden formarse con
un alfabeto de n letras, considérese el producto de n por el conjunto de sus predecesores inmediatos, hasta
completar k factores.

Ejemplo A1.1
3
O10 = 10 · 9 · 8 = 720
   3 factores
28!
O528 = 28 · 27 · 26 · 25 · 24 =
 5 factores (28 − 5)!

Permutaciones
Las ordenaciones de n elementos formadas a partir de un universo de n, Onn, se conocen co-
mo permutaciones de un conjunto con n elementos, y cada una es un caso particular del concepto
de permutación de los elementos de un conjunto A que se define a continuación.

Definición A1.1
Sea A un conjunto (finito o infinito). Se llama una permutación de los elementos de A a toda
función biyectiva f: A → A.

El conjunto de las permutaciones de A se denota como S(A), y si A es finito y consta de n


elementos, se usa la notación Sn y se llama el grupo simétrico de orden n, que, como ya se dijo,
tiene n! elementos y se puede interpretar como las diferentes formas en que pueden acomodarse
ordenadamente los n elementos de A. Esto es, Sn = O nn = n!
Cuando cada elemento xi ∈ A se representa simplemente por su índice, Sn resulta ser
Sn = { f : {1, 2, , n} → {1, 2, , n}; f esbiyectiva }

Ejemplo A1.2
En el caso n = 3, si A = {a1, a2, a3}, los seis elementos de S3 son las funciones que describen las
matrices
 a1 a2 a3   a1 a2 a3   a1 a2 a3   a1 a2 a3   a1 a2 a3   a1 a2 a3 
a a , , , , ,
 1 2 a3   a2 a3 a1   a3 a1 a2   a1 a3 a2   a3 a2 a1   a2 a1 a3 

en donde el segundo renglón de cada una indica la imagen de cada elemento del primer renglón,
bajo la función particular de que se trate.
Así, la matriz
 a1 a2 a3 
a a a 
 i j k

dice que la función f que representa es f (a1 ) = ai , f (a2 ) = a j , f (a3 ) = ak , en donde, por supuesto,
ai, aj y ak son diferentes entre sí.

Ejemplo A1.3
El grupo S3 o grupo de las simetrías del triángulo.
228 Anexo 1

Definición A1.2
Se llama simetría de un polígono a toda función isométrica del polígono en el mismo, que
manda vértices en vértices y lados en lados.

Una isometría es una función que preserva distancias. Es decir, si X es un espacio mé-
trico (tiene una función distancia), una función f : X → X  es una isometría si y sólo si
∀ x, y ∈ X , d (x, y) = d ( f (x), f ( y)).

Definición A1.3
Un espacio X se llama métrico si existe una función distancia η: X × X → R tal que ∀x, y, z ∈ X.
1. η ( x, y ) ≥ 0 η ( x, y ) = 0 ⇔ x = y
2. η(x, y) = η( y, x)
3. η(x, y) ≤ η(x, z ) + η( z, y)

En este caso, η se llama una métrica y se puede traducir así: η(x, y) es la distancia (en X)
de x a y.

De acuerdo con las definiciones anteriores, el grupo de las isometrías del triángulo consta de las
seis permutaciones de sus vértices v1, v2, v3, que son las que corresponden a las matrices siguientes:

1 2 3   1 2 3 1 2 3
I =  R=  R2 =  
1 2 3  2 3 1 3 1 2 

y 1 2 3  1 2 3  1 2 3
x=  y=  z= 
1 3 2  3 2 1 2 1 3
en las que se ha utilizado la convención de representar al conjunto
v2 de los vértices como el conjunto {1, 2, 3} de sus índices.
Si se considera el triángulo equilátero v1 v2 v3 con centro en el
origen, vértice v1 sobre el eje de las abscisas y v2 simétrico con v3
respecto al mismo eje (vea la figura A1.1), las permutaciones ante-
v1
x riores pueden verse como operaciones de simetría.
O
Así, I es la transformación idéntica, R es una rotación alrede-
dor del origen con ángulo de 120°, R2 una rotación de 240° (o el
resultado de aplicar R dos veces: R 2 = R  R ) y x es la reflexión del
v3 triángulo sobre el eje de las abscisas (v1 se queda fijo y v2 cambia
con v3). Si el triángulo se refleja sobre la recta Ov2 , v2 se queda fijo
y v1 cambia con v3; luego, y es la permutación que produce ese efec-
to. Finalmente, z es la operación que consiste en reflejar el triángu-
Figura A1.1  Simetrías del triángulo. lo sobre la recta Ov3 (figura A1.2).

y y y

I R R2
v2 v1 v3

v1 v3 v2
x x x
O O O

Figura A1.2  Operación de v3 v2 v1


simetría del triángulo.

y y y

X Y Z
v3 v2 v1
v1 v3 v2
x x x
O O O

v3 v2 v1
Anexo 1 229

y y y

X Y Z
v3 v2 v1

v1 v3 v2
x x x
O O O

v2 v1 v3

Figura A1.2  (continuación).

Los resultados de efectuar dos operaciones de manera consecutiva corres- O I R R2 x y z


ponden a los elementos de la tabla A1.3, en la que el lugar (i, j) (renglón i, I I R R2 x y z
columna j) es el resultado de aplicar primero la permutación j y después la i.
R R R2 I z x Y
Así, por ejemplo, el lugar Rx es el resultado de componer R con x, es decir,
R ° x, que es z. En efecto, R2 R2 I R y z X
x x y z I R R2
1 2 3 y y z x R2 I R
  z z x y R R2 I
Rx =  1 3 2 
2 1 3 Figura A1.3  Tabla de multiplicar de S3.
 

La figura A1.3 ilustra la tabla de multiplicar del grupo S3, que, como puede verse, no es abe-
liano (la tabla no es simétrica con respecto a su diagonal). Así, por ejemplo, xy = R es diferente de
yx = R2.
Entre todos los grupos no abelianos, S3 es el que tiene el menor número de elementos (su
orden, 6, es menor que el de cualquier otro grupo no conmutativo). Además de ésta, S3 tiene otras
propiedades algebraicas que hacen importante su estudio para la teoría de grupos del álgebra
abstracta (o moderna).

Número de subconjuntos
¿Cuántos subconjuntos de dos letras se pueden formar con el conjunto de las vocales? Se puede
tomar cualquiera de las cinco y hacerlas acompañar con cualquiera de las otras cuatro.
La primera selección se puede realizar de cinco maneras y la segunda de cuatro. Así se produ-
cen las 20 ordenaciones posibles, que son las siguientes: (a, e), (a, i), …, (u, o), cada una de las
cuales define al subconjunto de sus componentes. Los subconjuntos así definidos son los siguien-
tes: {a, e}, {a, i}, …, {u, o}. Pero note que en este caso cada subconjunto está representado dos
veces: {a, e}, = {e, a}, …, {o, u} = {u, o}, una por cada permutación de sus componentes. Luego,
el número de las distintas parejas así formadas consta solamente de 10 elementos, a saber, el
número de ordenaciones entre el de permutaciones.
Recíprocamente, cada subconjunto de dos elementos produce dos ordenaciones, de manera
que para obtener las 20 posibles son suficientes y bastan los 10 subconjuntos de dos letras. Apli-
cando estos razonamientos al caso general, puede concluirse que el número de subconjuntos con
k elementos que se pueden formar a partir de un universo de n símbolos es igual al número de
ordenaciones Okn entre el número de permutaciones de estos elementos, que es k! En resumen,

Onk n!
C nk = =
k! (n − k )! k!

En algunos textos (casi todos),   es el símbolo que se usa para representar las combinaciones
n

de n elementos tomados de k en k.  
k
Anexo 2
La función determinante

Definición A2.1
Sea {Vi}i=1, …, n una familia de espacios vectoriales sobre un campo K de característica dife-
rente de 2 (no todo elemento de K es autoinverso). Una función f: V1 × V2 × … × Vn → K es
lineal en el factor i del dominio si ∀ xi , yi ∈ V
Vii, ∀ α ∈ K .

f (x1, , xi + α yi , , xn ) = f (x1, , xi ,, xn ) + α f (x1, , yi , , xn ) .

Es decir, f abre sumas y saca escalares en el i-ésimo factor.


f es n-lineal si es lineal en cada uno de los factores de su dominio (  f es lineal en cada i , i = 1,, n ).

Definición A2.2
Sea V1 = V2 = … = Vn = V, f:V × V × …× V → K, n-lineal. f es alternante si
f (x–1, …, x–i, …, x–j, …, x–n) = 0 cuando x–i = x–j
para algunas i y j (la función f vale cero cuando tiene dos coordenadas iguales en su dominio).

Corolario 1 f es alternante si ∀ i ,∀ j , i, j, ∈{1, ..., n}

f (x1, , xi , , x j , , xn ) = − f (x1, , x j , , xi , , xn )

(Al intercambiar un vector por otro, f cambia de signo.)

En efecto, considere f (x1, , xi + x j , , xi + x j , , xn ) = 0, ya que tiene dos coordenadas iguales.


Entonces,
0 = f (x1, , xi , , xi , , xn ) + f (x1, , x j , , xi , , xn )
+ f (x1, , xi , , x j , , xn ) + f (x1, , x j , , x j , , xn )

El primero y el cuarto sumandos son ceros.


0 = f (x1, , xi , , x j , , xn ) + f (x1, , x j , , xi , , xn )
Por lo tanto,
f (x1, , xi , , x j , , xn ) = − f (x1, , x j , , xi , , xn )

Corolario 2 Si x–i es paralelo a x–j, entonces f (x–1, …, x–i, …, x–j, …, x–n) = 0.


En efecto,
f (x1, , xi , , x j , , xn ) = f (x1, , xi , , kxi , , xn ) = k f (x1, , xi , , xi , , xn ) = 0

230
Anexo 2 231

Corolario 3 f (x–1, …, x–i, …, x–j, …, x–n) = f (x–1, …, x–i, + kx–j, …, x–j, …, x–n)
En efecto,
f (x–1, …, x–i, + kx–j, …, x–j, …, x–n) = f (x–1, …, x–i, …, x–j, …, x–n) + kf (x–1, …, x–j, …, x–j, …, x–n)
f (x– , …, x– , + kx– , …, x– , …, x– ) = f (x– , …, x– , …, x– , …, x– ) + k(0)
1 i j j n 1 i j n

f (x–1, …, x–i, …, x–j, …, x–n) no se altera si a un vector se le suma un múltiplo de algún otro.

Corolario 4 Si x–i es combinación lineal de otros, entonces f (x–1, …, x–i, …, x–n) = 0.


Su demostración se deja como ejercicio.

Definición A2.3
Sea Sn = {σ : {1, …, n} → {1, …, n}; σ es biyectiva}. Sn es el conjunto de todas las permuta-
ciones de un conjunto de n elementos representados por sus índices (es decir, {a1, …, an} se
denotará por {1, 2, …, n}).

Una transposición es una permutación que sólo intercambia un índice por otro; por ejemplo,
σ (1, 2, , i , , j , , n) = (1, 2, , j , , i , , n) es una transposición que algunas veces se denota
como (i, j).
σ ∈ Sn es una permutación par si el número de transposiciones que se requieren para pasar
de (σ (1), σ (2), , σ (n)) a (1, 2, , n) es par. Una permutación que no es par se llama impar.
 1 2  n  1 2  n 
Una permutación σ (1) σ (2)  σ (n)  puede transformarse en   a partir de
  1 2  n 
diferentes series de transposiciones, pero la paridad en el número de transposiciones requeridas se
conserva en todos estos procesos.* Es decir, la paridad de una permutación está bien definida.

 Teorema A2.1 Nota
Observe que si tal función existe
Sea f :V × V ×  × V → K n-lineal, alternante. resulta única, ya que está completa-
 
n ¯ factores mente definida por este teorema.
n
dim V = n, β = { u1, u2 , , un } base de V. xi = ∑ ai j u j para cada i , i = 1, , n.
j =1

 n n 
Entonces, f (x1, , xn ) = f  ∑ a1 j u j , , ∑ an j u j  = ∑ (−1)σ a1σ(1) a2 σ(2) an σ(n) f (u1, , un )
 j =1 j =1  σ ∈Sn

1 si σ es par
en donde (−1)σ =  
−1 si σ esimpar

Demostración
n
Al desarrollar cada xi = ∑ ai j u j se obtiene:
j =1

( )
f (x1, …, xn ) = f a11 u1 +  + a1n un , …, an1 u1 +  + an n un .

* Herstein, Topics in algebra.


232 Anexo 2

Se puede ver que al expandir las sumas anteriores, de acuerdo con la alternancia de f,
sólo sobreviven n! factores, uno por cada σ ∈Sn , de lo que resulta que

 n 
( )
n
f  ∑ a1 j u j , , ∑ anj u j  = ∑ a1σ(1) a2σ(2)  anσ(n) f uσ(1) , , uσ(n)
 j =1 j =1  σ ∈Sn
 n n 
f  ∑ a1 j u j , , ∑ an j u j  = ∑ (−1)σ a1σ(1) a2 σ(2) an σ(n) f (u1, , un )
 j =1 j =1  σ ∈Sn

El argumento anterior se ilustra para el caso n = 2 de la manera siguiente:


Sean
2
x1 = ∑ a1 j u j = a11u1 + a12 u2
j =1

2
x2 = ∑ a2 j u j = a21u1 + a22 u2
j =1

Entonces,
 2 2 
f (x1, x2 ) = f  ∑ a1 j u j , ∑ a2 j u j  = f (a 11u1 + a12 u2 , a21u1 + a22 u2 )
 j =1 j =1 

f (x1, x2 ) = f (a11u1 , a21u1 + a22 u2 ) + f (a12 u2 , a21u1 + a22 u2 )

f (x1, x2 ) = f (a11u1 , a21u1 ) + f (a11u1 , a22 u2 ) + f (a12 u2 , a21u1 ) + f (a12 u2 , a22 u2 )

en donde el primero y el cuarto sumandos son ceros por tener coordenadas paralelas: a11u1 es paralelo a a21u1 y a12 u
a11u1 es paralelo a a21u1 y a12 u2 es paralelo a a22 u2 , por lo que

f (x1, x2 ) = f (a11 u1, a22 u2 ) + f (a12 u2 , a21 u1 )

f (x1, x2 ) = a11 a22 f (u1, u2 ) + a12 a21 f ( u2 , u1 ) = a11 a22 f (u1, u2 ) − a12 a21 f ( u1, u2 )

f (x1, x2 ) = (a11 a22 − a12 a21 ) f (u1, u2 )

( )
f (x1, x2 ) = a1σ(1) a2 σ(2) − a1τ(2) a2 τ(1) f (u1, u2 )

en donde σ (1) = 1, σ (2) = 2, τ (1) = 2, τ (2) = 1, es decir, σ es la permutación idéntica y τ es la trans-


posición (1, 2); obviamente, {σ , τ } = S2 .

Corolario 5 ×V
Si f :V ×
 V → K es alternante y β = { u1, u2 , , un }
×
n ¯ factores
n
es base de V, y además f (u1, , un ) = 1; entonces, si cada xi = ∑ ai j u j ,
j =1
 n n 
f (x1, , xn ) = f  ∑ a1 j u j , , ∑ anj u j  = ∑ (−1)σ a1σ(1) a2σ(2)  anσ(n)
 j =1 j =1  σ ∈Sn

Definición A2.4
Sea M n × n (K) el conjunto de las matrices n × n con coeficientes en un campo K de caracte-
rística distinta de 2 y para cada M ∈ M n × n (K), A1, , An sus columnas.
Anexo 2 233

(
Sea D : M n × n (K) → K una función que, vista como D (M ) = f A1,, An , es ) Observación
n-lineal, alternante y tal que, evaluada en la matriz idéntica, es uno. Entonces, En vista de que para toda σ ∈Sn ,
como se verá, tal función existe y, en vista del teorema A2.1, es única y se llama la −1
(−1)σ = (−1)σ (el signo de cada
función determinante. permutación es igual al signo de
su permutación inversa),
a1σ (1)  anσ (n) = a −1  a −1 ,
σ (1) 1 σ ( n) n
Sobre la existencia de la función determinante resulta que si A ∈ M n × n (K), entonces
D (A) = D (At ).
La existencia de la función determinante se demostrará construyéndola (induc-
ción sobre n).

Base
n = 1 Si A = (a ), se define D (A) = a. Entonces,
1. D es 1-lineal
D (a + kb) = a + kb = D (a ) + kD (b)
y
2. D(1) = 1
3. La propiedad de ser alternante se cumple por vacuidad.

Por lo tanto, la función determinante existe para las matrices M1 × 1 (K).

Caso particular, n = 2
La conocida manera de definir el determinante de una matriz 2 × 2 es correcta. En efecto, sea
a b 
A=  . Entonces,
c d 

a b  a + 0 0 + b a 0  0 b   a 0   0 b 
D  = D  = D  + D  = D  + D 
c d   c d  c d  c d  0 + c d + 0 0 + c d + 0
a 0  a 0 0 b  0 b
= D  + D  + D  + D  = ad + 0 + 0 − bc = ad − bc
0 d  c 0 0 d  c 0
a 0 0 b 
En efecto, ya que D   = D =0
c 0 0 d 
a 0  1 0
D  = (ad ) D   = ad
0 d  0 1
0 b 0 1 1 0
D  = bcD   = −bcD   = −bc
c 0 1 0 0 1

Paso inductivo
Definición A2.5
Para cada A ∈ M n × n (K) se define Ai j ∈ M( n −1) × ( n −1) (K) como la matriz que resulta de supri-
mir el i-ésimo renglón y la j-ésima columna en A, y su determinante se llama “el menor de aij”,
que algunas veces se denota Mij.

Suponga definida la función determinante D* : M( n −1) × ( n −1)(K) → K (hipótesis de inducción).


Sea A ∈ M n × n (K). Se define,
n
D (A) = ∑ (−1)i + j aij Mij (i fija )
j =1
234 Anexo 2

Como cada Mij = D*(Aij) es (n − 1)-lineal, alternante y D*(I) = 1, la función D así definida
también resulta con las propiedades que se requieren, es decir, es n-lineal, alternante y D(I) = 1 y,
por lo tanto, existe y es la única con esas propiedades.
El desarrollo anterior se conoce como desarrollo del determinante por menores con respecto al
renglón i-ésimo. Es independiente del renglón y, en vista de que D(A) = D(At), también puede
calcularse desarrollándolo por menores de cualquier columna.
El producto (−1)i+j Mij se conoce como el cofactor de aij y se denota como Cij .

Regla de Cramer
Sean Ai, i = 1, …, n, vectores columna de dimensión n. B ∈ Kn, x1, …, xn ∈ K tales que
x1A1 + … + xnAn = B.

Entonces, ∀ i ,i = 1, , n, xi D (A1, , An ) = D( A1, , B , , An )


i -ésimo
lugar

En efecto, D(A1, …, B, …, An) = D(A1, …, ∑xiAi, …, An) = D(A1, …, xiAi, …, An). Los otros
términos de la suma son 0, ya que para cada uno de ellos hay dos columnas repetidas. Finalmente,
( ) ( ) ( ) D
xi D A1,, An = D A1, , B, , An = Di , y si ∆ = D A1, , An ≠ 0, xi = i .

Corolario 6    Si  a11x1 + a12 x2 +  + a1n xn = k1


a21x1 + a22 x2 +  + a2 n xn = k2

an1x1 + an 2 x2 +  + ann xn = kn

aij, ki ∈ K es un sistema de ecuaciones lineales n × n (n ecuaciones, n incógnitas).


A = (aij) es la matriz n × n formada por los coeficientes, B es el vector de los términos
independientes, y el sistema puede escribirse x1A1 + x2 A2 +  + xn An = B , en donde cada Ai
es una columna de A. Entonces, si ∆ = D (A) ≠ 0, la regla de Cramer puede utilizarse para
encontrar la solución del sistema. Así,
Di
∀i, xi = = ∆
que, como puede verse, tal solución es única.

Aunque la regla de Cramer no es práctica (el cálculo de los determinantes no es fácil si n ≥ 4),
tiene una consecuencia teórica importante.
Si el sistema es homogéneo y, por lo tanto, B es el vector cero, cada Di resulta cero y entonces,
si D (A) ≠ 0 , su única solución es x1 = x2 =  = xn = 0.
Existen problemas en los que se requiere encontrar soluciones no triviales (distintas de x = 0 )
para ecuaciones de la forma Ax = kx , en donde A ∈ M n × n ( K), x = (x1, , xn ) ∈ K n , k ∈ K . Este
problema es equivalente al de encontrar soluciones no triviales para la ecuación (A − kI ) x = 0 , que
se puede ver como un sistema homogéneo de ecuaciones lineales n × n de matriz (A − kI ) . Luego, si
se necesitan soluciones distintas a x = 0, D (A − kI ) debe ser necesariamente cero. Es decir,

a11 − k a12  a1n


a21 a22 − k  a2 n
=0
  
an1 an 2  ann − k

que, como puede verse, es una ecuación de orden n en la variable k. Esta ecuación se llama la
ecuación característica de A. Los valores de k que la resuelven se conocen como valores propios de
A (eigen-valores), y los vectores x ≠ 0 que corresponden a cada valor propio son los vectores
Anexo 2 235

propios (eigen-vectores), de A, correspondientes a k. Si x es un vector propio correspondiente al


valor propio k, cualquiera de sus múltiplos también lo es. En efecto, si Ax = kx , entonces, para
cualquier escalar λ ≠ 0, λ Ax = A(λx ) = λ kx = k (λx ).

Ejemplo A2.1
Cálculo de valores y vectores propios para una matriz cuadrada.
3 1 3 3 − k 1 3 
   
Sea A =  1 1 1  ∴ A − I k =  1 1− k 1 
3 1 5  3 1 5 − k 
  
Entonces la ecuación característica A − kI = 0 es
3− k 1 3
1 1− k 1 = 0, − k 3 + 9 k 2 − 12 k + 4 = 0. Una de sus raíces es k = 1.
3 1 5−k
Entonces, si k = 1, el sistema (A − kI ) x = 0 resulta
2x + y + 3z = 0 x = −z
x + z = 0 ∴ y = −z
3x + y + 4z = 0 z = z
una de cuyas soluciones, el vector propio correspondiente al valor propio k = 1, es (1, 1, −1). En efecto,

1
1
−1
3 1 3 1
1 1 1 1
3 1 5 −1

 3 1 3   1  1
     
En este ejemplo,  1 1 1   1 = (1) 1 .
 3 1 5   −1  −1
     
Ejemplo A2.2
0 1 1  −k 1 1 
   
Sea A =  1 0 1  ∴ A − I k =  1 − k 1 
1 1 0  1 1 − k 
  
A − kI = 0 es

−k 1 1
1 − k 1 = −(k − 2)(k + 1)2 = 0. Por lo tanto, los valores propios son 2 y −1.
1 1 −k

Un vector propio correspondiente al valor propio k = 2 es (1, 1, 1). En efecto,

1
1
1
 0 1 1  1 1
0 1 1 2      
1 0 1 2  1 0 1 1
   = (2 ) 1
 1 1 0  1 1
1 1 0 2      
Anexo 3
Teoremas sobre funciones
Sean f : A → B y g : B → C.
Sean I el conjunto de las funciones inyectivas, S el de las suprayectivas y B el de las biyectivas;
1A es la función identidad en A y 1B la identidad en B.
T.1 f , g ∈ I ⇒ g  f ∈ I; g  f ∈ I ⇒ f ∈ I
T.2 f , g ∈ S ⇒ g  f ∈ S; g  f ∈ S ⇒ g ∈ S
T.3 f ∈ I ⇒ ∃ h : B → A; h  f = 1A
T.4 f ∈ S ⇒ ∃ h : B → A; f  h = 1B
T.5 f  g = f h ∧ f ∈I ⇒ g = h
T.6 g f = h f ∧ f ∈S ⇒ g = h
T.7 f ∈ B ⇔ ∃ h : B → A; h  f = 1A ; f  h = 1B (h = f −1, h −1 = f )
Demostraciones de los teoremas
  Teorema A3.1
f g
Sean A → B → C funciones. Si f, g ∈II, entonces g  f también, y si g  f ∈ I , entonces f ∈ I g
no necesariamente.

Demostración

1. Sean a, b ∈ A ∋ g  f ( a ) = g  f ( b )
Por demostrar a = b.
g  f ( a ) = g  f ( b ), es decir, g ( f (a )) = g ( f (b)); por lo tanto, f (a ) = f (b) (ya que g es
inyectiva). Finalmente, a = b (  f también es inyectiva).
2. Sea g  f ∈ I
Por demostrar f ∈ I
Sean a, b ∈ A; f ( a ) = f ( b ) ∴ g ( f ( a )) = g ( f ( b ))
e.d. g  f (a ) = g  f (b) ∴ a = b ( g  f es inyectiva).

  Teorema A3.2
f g
Sean A → B → C funciones. Si f, g ∈ S, entonces g  f también, y si g  f ∈ S , entonces g ∈ S,
f no necesariamente.

Demostración

1. Sean f, g como antes y c ∈ C .


Por demostrar ∃a ∈ A ∋ g  f (a ) = c
c ∈ C ⇒ ∃b ∈ B ∋ g (b) = c (ya que g es suprayectiva).
b ∈ B ⇒ ∃a ∈ A ∋ f (a ) = b (ya que f también es suprayectiva) ∴ g  f (a ) = g (b) = c
236
Anexo 3 237

Es decir, g  f (a ) = c.
2. Sea g  f ∈ S y c ∈ C.
Por demostrar ∃b ∈ B ∋ g (b) = c
g  f ∈ S ⇒ ∃a ∈ A ∋ g  f (a) = c g  f (a) = g ( f (a))
bautizo: f (a ) = b, b es el elemento cuya existencia se tenía que demostrar.

f g
Corolario 1   Sean A → B → C funciones. Si f, g son biyectivas, entonces g  f tam-
bién, y si g  f es biyectiva, entonces f es inyectiva y g suprayectiva.

La figura A3.1 representa tres conjuntos (A, B, C ) y dos funciones:


  (f : A → B y g: B → C), en donde A = {a}, B = {b1, b2} y C = {c}. b2
Note que
1.  g  f es inyectiva. f es inyectiva pero g no. f g
2.  g  f suprayectiva. g es suprayectiva pero f no.
3.  g  f biyectiva. f es inyectiva y g es suprayectiva. a b1 c
g º f (a) = c

Figura A3.1  Composición de funciones.


  Teorema A3.3
Sea f : A → B, f ∈ I. Entonces ∃g : B → A ∋ g  f = 1A. (Las funciones inyectivas tienen inverso
izquierdo.)

Demostración
Sea a0 ∈ A. Se define para b ∈ A:

a, si b ∈ f (A), y a ∈ A es el único elemento


o tal que f (a ) = b. g (b) = a

g (b) = 
a , si b ∉ f ( A)
 0
Entonces, ∀a ∈ A, g  f (a ) = a, es decir, g  f = 1A. 

  Teorema A3.4
Sea f : A → B, f ∈ S. Entonces ∃g : B → A ∋ f  g = 1B. (Las funciones suprayectivas tienen inver-
so derecho).

Demostración
Puesto que g es suprayectiva, para cada b ∈ A, f −1 (b) ≠ ∅ . Se selecciona a tal que a ∈f−1(b)
(axioma de selección) y se define g(b) = a. Entonces ∀b ∈ A, f  g (b) = f (a ) = b .
Atención: a ∈ f −1 (b) si y sólo si f (a) = b.

En el diagrama de la figura A3.2 se muestra una función f que tiene inverso izquierdo que
no es derecho y otra función g que tiene inverso derecho que no es izquierdo, en donde A = {a},
B = {b1, b2}.
238 Anexo 3

b2 b2

g
f f
a b1 a b1
Figura A3.2  Composición de funciones.

Note que g  f = 1A, pero que f  g ≠ 1B. Por ejemplo, sean


A = N el conjunto de los números naturales.
B = Q #  el conjunto de los números racionales no negativos.
i #
N →Q la inmersión i(n) = n.
# []
Q → N la función mayor entero [q] = k, ∀ q ∈ Q # si k ≤ q < k + 1.
Entonces la cadena
[]
i
N
→ Q#  i
→N
→ Q#
muestra que [ ]  i es la identidad en N, pero i  [ ] no es la identidad en Q # . Es decir, i es inverso
derecho pero no izquierdo, y [ ] es inverso izquierdo pero no derecho.

  Teorema A3.5
Sean h, g : A → B, f : B → C , f  h = f  g y f  inyectiva. Entonces, h = g. (Las funciones inyec-
tivas se pueden cancelar por la izquierda.)

Demostración
En efecto, sea a ∈ A. Por demostrar: h(a) = g(a).
Como f  h = f  g, f  h (a) = f  g (a) ∴ f (h (a)) = f (g (a)) ∴ h (b) = g (a), ya que f es in-
yectiva.

  Teorema A3.6
Sean h, g : B → C , f : A → B ∋ h  f = g  f y f suprayectiva. Entonces, h = g. (Las funciones
suprayectivas se pueden cancelar por la derecha.)
Sea b ∈ B. Se debe demostrar h(b) = g(b).

Demostración
Como g es suprayectiva, ∃ a ∈ A ∋ g (a ) = b, y puesto que h  f = g  f , h  f (a ) = g  f (a ) ,
es decir, h (b) = g (b).

Corolario 2  Las funciones biyectivas se pueden cancelar por la derecha y por la iz-
quierda.

  Teorema A3.7
Sea f : A → B biyectiva si y sólo si f tiene inversa (es decir, si y sólo si existe una función g : B → A
tal que g  f = 1A y f  g = 1B ).

Demostración

Como f es biyectiva, es inyectiva y suprayectiva; por lo tanto,
∃h, g : B → A ∋ g  f = 1A ∧ f  h = 1B .
Anexo 3 239

Se demostrará que h = g, usando la asociatividad para la composición de funciones. En


este caso, g  ( f  h) = ( g  f )  h .
Entonces, ya que g  ( f  h) = g  1B = g y ( g  f )  h = 1A  h = h , resulta g = h, y, por lo
tanto, g = h = f −1 .
Note que g  1B (b) = g (1B (b)) = g (b) ∴ g  1B = g; análogamente,
1A  h (b) = 1A (h (b)) = h (b)

Se supone ∃ f −1: B → A ∴ f −1  f = 1A ∴ f ∈ I (T.1)
f  f −1 = 1A ∴ f ∈ S (T.2)
∴ f es biyectiva.

Funciones inducidas por una función


Sea f : A → B una función. Entonces  f  induce dos funciones (que por abuso de notación se cono-
cen como f y f −1). f :℘(A) →℘(B ), f −1 : ℘(B ) →℘(A) definidas:
∀ E ⊂ A, f (E ) = { f (x) ∈ B; x ∈ E}

∀ F ⊂ B, f −1 (F ) = {x ∈ A; f (x) ∈ F }
Note que las funciones que se estudian en esta sección son las mismas que se usaron en la
demostración del teorema A3.4.

  Teorema A3.8
Sea f : A → B una función y f −1 : ℘(B ) →℘(A). Entonces ∀ E1, E2 ∈℘(B ), es decir, E1 y E2 ⊂ B:

i) f −1 (E1 ∪ E2 ) = f −1 (E1 ) ∪ f −1 (E2 )


ii) f −1 (E1 ∩ E2 ) = f −1 (E1 ) ∩ f −1 (E2 )
( )
C
iii) f −1 E C =  f −1 (E )

Demostración

i) x ∈ f −1 (E1 ∪ E2 ) ⇔ f (x) ∈ E1 ∪ E2 ⇔ f (x) ∈ E1 o f (x) ∈ E2


⇔ x ∈ f −1 (E1 ) o x ∈ f −1 (E2 ) ⇔ x ∈ f −1 ( E1 ) ∪ f −1 (E2 )
ii) x ∈ f −1 (E1 ∩ E2 ) ⇔ f (x) ∈ E1 ∩ E2 ⇔ f (x) ∈ E1 y f (x) ∈ E2
⇔ x ∈ f −1 (E1 ) y x ∈ f −1 ( E2 ) ⇔ x ∈ f −1 ( E1 ) ∩ f −1 ( E2 )
( )
C
iii) x ∈ f −1 E C ⇔ f (x) ∈ E C ⇔ x ∉ f −1 ( E ) ⇔ x ∈  f −1 ( E )

El teorema anterior demuestra que la función inversa se comporta “bien” en relación con la
unión, la intersección y el complemento, mientras que la función directa no, lo que se ilustra con
el siguiente contraejemplo.
Sea f : C → R definida como f (z ) = z . Es decir, si z = a + bi = (a, b), z = a 2 + b2 .
A = {(0, b); b ∈ R} y B = {(a, 0); a ∈ R}. Entonces, f (A) = f (B ) ∈ R + ∪ {0}
A ∩ B = {(0, 0)}, por lo tanto, f (A ∩ B ) = {0} ≠ f (A) ∩ f (B).
Anexo 4
Relaciones
Entre las ideas intuitivas que se tienen con referencia a los conjuntos está la de relación. Por ejem-
plo, entre el de los hombres está la de ser hermano de, que cumplen Caín y Abel, que relaciona a
Rómulo y Remo, y en general a cualquier persona con su hermano.
En su Teoría intuitiva de los conjuntos, Halmos ejemplifica una situación semejante (formali-
zar una relación entre los elementos de dos conjuntos) hablando de algo como el matrimonio entre
hombres y mujeres, en donde dice que si el señor h estuviera casado con la señora m, la pareja
ordenada (h, m) podría describir esta situación, y que si se considera el conjunto de todas las
parejas (hombre, mujer) que están casados, tal conjunto definiría completa, precisamente, la rela-
ción matrimonio, en este contexto, aun cuando se ignore lo que significa estar casado. Esto suena
bien, porque la teoría de conjuntos desarrollada en este libro se conoce razonablemente, y en
cambio la relación matrimonio no está formalizada, porque después de todo, ¿qué significa estar
casado? Para algunos consiste en firmar un acta; para otros, recibir la bendición de algún ministro
religioso; para los gitanos, romper una olla; para otros, vivir juntos; para los antiguos romanos,
comer un pastel de trigo frente a testigos; y aunque frecuentemente se dice que el matrimonio es
como el demonio, el concepto demonio tampoco está formalizado.
Asimismo, algunos autores, ante la dificultad de precisar lo que es el color rojo, que se supone
bien conocido, sugieren que se llame rojo al conjunto de todas las cosas de ese color con la inten-
ción de transformar un concepto no formalizado en un conjunto. Así, se diría que un objeto es
rojo si pertenece a ese conjunto y sólo en ese caso.
Entre los elementos de dos conjuntos A y B es común encontrar cierta liga que se quisiera
formalizar. Por ejemplo, suponga que A y B son conjuntos de números y que se cuenta con una
caja negra η, tal que cada vez que entra en ella un elemento a de A, lo transforma en otro b de B,
y que se ha realizado el experimento de meter en η un conjunto de elementos de A (una o varias
veces cada número) y se anota en una tabla la salida que corresponde a cada entrada. Resulta
claro que la colección de todas las parejas entrada-salida de la tabla describe completamente el
experimento, aunque quizá se desconocieran las reglas, que pudieran ser totalmente aleatorias,
con las que la caja transformó un elemento en otro.
Siguiendo esta línea de ideas se puede definir una relación ℜ entre los elementos de un con-
junto A con los de otro B, como la colección de todas las parejas ordenadas (a, b) tales que a es
un elemento de A que tiene la relación ℜ con el elemento b de B.
Así, la relación caracteriza al conjunto de parejas y esto permite asociar una idea intuitiva
(vaga) con un objeto bien definido de la teoría de conjuntos. Cuando se procede de esta manera,
cada relación no es otra cosa que un subconjunto del producto A × B.

Definición A4.1
Una relación binaria ℜ de A en B es un subconjunto del producto cartesiano A × B, es decir,
ℜ ⊂ A × B . Si (a, b) está en ℜ, se dice que a está en la relación ℜ con b (o que ℜ está rela-
cionada con b), y se denota a ℜ/ b. Si no es así, (a, b) ∉ ℜ es porque a no está ℜ relacionada
con b, y la notación usual para este caso es aℜb.

A partir de la precedente surgen, de manera natural, las tres definiciones siguientes:

1. Si ℜ ⊂ A × B en una relación de A en B, el conjunto de todos los primeros miembros de los


elementos de ℜ se llama el dominio de la relación.
2. La colección de todas las segundas coordenadas (los segundos miembros de las parejas de ℜ)
es el rango o codominio de ℜ.
240
Anexo 4 241

3. La colección de todas las parejas, en orden inverso, es la relación inversa de ℜ.


Explícitamente, sea ℜ ⊂ A × B una relación de A en B. Entonces,

i) el dominio de ℜ, Dℜ = {a ∈ A; (a, b) ∈ ℜ} .
ii) el codominio de ℜ, Rangoℜ = {b ∈ B; (a, b) ∈ ℜ} .
iii) la relación inversa de ℜ, ℜ−1 = {(b, a ) ∈ B × A; (a, b) ∈ ℜ} .

Es importante considerar el caso particular en que A es igual a B. Se dice que ℜ ⊂ A × A es


una relación en A; por ejemplo, ser menor que, ser igual a o ser mayor que son relaciones en cual-
quier conjunto ordenado.
Entre las propiedades importantes que puede tener una relación ℜ en A se definen las siguientes.

Definición A4.2
Sea ℜ ⊂ A × A una relación en A.

i) ℜ es reflexiva si y sólo si ∀ a ∈ A, a ℜa; (a, a ) ∈ ℜ.


ii) ℜ es simétrica si y sólo si ∀ a, b ∈ A, a ℜb ⇒ b ℜa .
iii) ℜ es antisimétrica si y sólo si ∀ a, b ∈ A, a ℜb ∧ b ℜa ⇒ a = b.
iv) ℜ es transitiva si y sólo si ∀ a, b, c ∈ A, a ℜb ∧ b ℜc ⇒ a ℜc.
v) ℜ obedece la ley de tricotomía si y sólo si ∀ a, b ∈ A, a ℜb, a = b o b ℜa , pero sólo una de
ellas.

Relaciones de orden
Se dice que ℜ es de orden parcial si y sólo si es reflexiva, antisimétrica y transitiva, y si además
obedece a la ley de tricotomía (cualesquiera dos elementos de A se pueden comparar), el orden se
llama total, lineal o completo. Los conjuntos en los que está definida una relación de orden
se llaman conjuntos parcialmente ordenados o COPOS. Cuando la relación de orden es lineal se
dice que A está totalmente (o linealmente o completamente) ordenado por la relación, o bien que
la relación ℜ es un orden lineal para A.
La más importante de las relaciones de orden parcial es la de contención entre conjuntos. A
está relacionada con B si y sólo si A ⊂ B , y entre los ejemplos más conocidos de relaciones de
orden lineal está la relación menor o igual para los naturales, los enteros, los racionales o los reales.
De las relaciones de orden se derivan las relaciones siguientes:
Sea {A, ≤} un conjunto parcialmente ordenado y B ⊂ A.
i) x ∈ B es el elemento mayor de B si y sólo si ∀ b ∈ B, b ≤ x (obviamente, si B tiene elemento
mayor, este es único).
ii) y ∈ B es el elemento menor de B si y sólo si ∀ b ∈ B, y ≤ b (que también es único).
iii) z ∈ B es un elemento máximo de B si no hay en B ningún elemento mayor que z, es decir,
∀ b ∈ B, z ≤ b ⇒ z = b. Cuando B tiene elemento mayor, este es el único máximo; pero en
general, puede haber varios elementos máximos en un conjunto (vea el ejemplo A.4.2).
iv) w ∈ B es un elemento mínimo de B si no hay en B ningún elemento menor que w, es decir,
∀ b ∈ B, b ≤ w ⇒ b = w . Como en el caso anterior, si B tiene elemento menor, este es el úni-
co mínimo, pero si B no tiene elemento menor, puede haber en él más de un mínimo.
v) c ∈ A es una cota superior de B si ∀ b ∈ B, b ≤ c. Si c es una cota superior de B, cualquier
d ≥ c también es cota superior. Cuando una cota superior es la menor de todas, se llama el
supremo de B.
vi) g ∈ A es una cota inferior de B si y sólo si ∀ b ∈ B, g ≤ b. Cuando existe una cota inferior
mayor a todas las demás, se llama el ínfimo de B. Note que cuando el supremo y el ínfimo
de B existen, son únicos.
vii) Un subconjunto C de A es una cadena, si con el orden de A restringido a C, C resulta total-
mente ordenado.
242 Anexo 4

La relación divide a
Sea A = N el conjunto de los números naturales.
Se define ∀ n, m ∈ N, n ℜm, si n divide a m; es decir, n ℜm si y sólo si existe k ∈ N tal que
k n = m. La notación usual para esta relación es n m, que dice que n está relacionado con m si y
sólo si n es un divisor de m o, equivalentemente, que m es un múltiplo de n.
Así, 2 8, ya que existe 4 ∈ N y 4 · 2 = 8.
2 3 , ya que ∀ n ∈ N, 2 n ≠ 3
Observe que ∀ n ∈ N, n 0, ya que 0 ∈ N y 0 n = 0, en particular 0 0. Note que no se trata de
una división, sino de la definición de una relación en N.

  Teorema A4.1
La relación ℜ es de orden parcial.

En efecto, ∀ n, m, k ∈ N, se cumple que:

i) n n (existe 1∈ N y 1 · n = n )
ii) n m ∧ m n ⇒ n = m . En efecto,
n m ⇒ ∃ k ∈ N∋ k n = m y m n ⇒ ∃l ∈ N∋ l m = n.
Al combinar estas ecuaciones resulta que kln = n.
Entonces, si n = 0, m = k n = k 0 = 0, y por lo tanto, n = m.
Si n ≠ 0, se puede cancelar de la igualdad kl n = n, entonces kl = 1, lo que en N implica
que k = l = 1 y, por lo tanto, n = m.
iii) n m ∧ m l ⇒ n l. En efecto,
n m ⇒ ∃ k ∈ N∋ k n = m
m l ⇒ ∃ j ∈ N∋ j m = l , por lo tanto, ( j k ) n = l , es decir, n l.
A continuación se ilustra la relación divide a con dos ejemplos interesantes.

Ejemplo A4.1
Considere el conjunto B = {0, 1, 2, , 20} ⊂ N. Entonces, con la relación anterior divide a:
i) 0 es el elemento mayor de B (0 es múltiplo de cualquier elemento de B. Recuerde que todo
número natural divide a cero, es decir, ∀n ∈ N, n 0).
ii) 1 es el elemento menor de B (1 divide a cualquier elemento de B).

Ejemplo A4.2
Sea C = {2, 3, 4,, 20} ⊂ N con la misma relación.
Entonces C no tiene elemento mayor (ningún elemento de C es múltiplo de todos) ni elemen-
to menor (ninguno de ellos divide a todos).
Los números 2, 3, 5, 7, 11, 13, 17, 19 son mínimos (no tienen divisores en C).
Los números 11, 12, 13, 14, 15, 16, 17, 18, 19, 20 son máximos (no tienen múltiplos en C).
D = {1, 2, 4, 16, 0} es una cadena en B.
E = {3, 9}, {5}... son cadenas tanto en B como en C.
0 es el supremo de B y es su única cota superior.
Anexo 4 243

1 es el ínfimo de B y de C (y es su única cota inferior).


20! es una cota superior de C, pero no es el supremo. El supremo de C es mínimo común
múltiplo de sus elementos, a saber: 2 4 × 32 × 5 × 7 × 11 × 13 × 17 × 19 = 232 792 560.

Ejercicio A4.1

Sea F = { f : D f ⊂ R → R}. Se define


f ≤ g si y sólo si D f ⊂ Dg y g (x) = f (x) ∀ x ∈ D f
Demuestre que ≤ es una relación de orden. ¿Es lineal?

Relaciones de equivalencia
Sea ℜ ⊂ A × A una relación.
Se dice que ℜ es una relación de equivalencia en A si y sólo si ∀ a, b, c ∈ A :

i) (a, a ) ∈ ℜ (a ℜa ). Propiedad reflexiva.


ii) (a, b) ∈ ℜ ⇒ (b, a ) ∈ ℜ (a ℜ b ⇒ b ℜa ). Propiedad simétrica.
iii) (a, b) ∧ (b, c ) ∈ ℜ ⇒ (a, c ) ∈ ℜ (a ℜb ∧ b ℜc ⇒ a ℜc ). Propiedad transitiva.

Ejemplo A4.3
Para todo conjunto A, la relación de igualdad es de equivalencia. En efecto, las propiedades bási-
cas de esta relación garantizan que
∀ a, b, c ∈ A :
a=a
a=b ⇒ b=a
a=b ∧ b=c ⇒ a=c

Ejemplo A4.4
A es un conjunto de triángulos en el plano. Para T1 y T2 , elementos de A se define T1 ≈ T2 si y
sólo si son semejantes; es decir, tienen sus ángulos relacionados, congruentes entre sí (de igual
medida).

Ejemplo A4.5
Sea A = N × N . Se define
(a, b) ≈ (c, d ) si y sólo si a + d = b + c.

Ejemplo A4.6
Sea B = Z × Z* ; Z* = Z − {0} . Se define
(a, b) ≈ (c, d ) si y sólo si ad = bc.

Ejemplo A4.7
Sea A = Z (los enteros) y m un número entero positivo. Se define
a ≡ b (mod m ) si y sólo si m (a − b) (ambos dejan igual residuo al dividirse entre m).
244 Anexo 4

Ejemplo A4.8
Sea A = N. Se define n ≈ m si y sólo si en la escritura usual ambos terminan con el mismo dígito.

Relaciones de equivalencia y particiones


Las particiones de un conjunto surgen del deseo de formalizar lo que sería una clasificación (per-
fecta) de sus elementos. Es una asignación de éstos en diferentes cajones (subconjuntos de A), de
manera que ningún cajón quede vacío y que para cada elemento del conjunto exista un único
cajón al que pertenece. Con este objeto se da la siguiente definición.

Definición A4.3
Sea A un conjunto. Una familia {Ai }i ∈I de subconjuntos de A es una partición de A si y sólo si
1. Ai ≠ ∅ ∀ i ∈ I (cada Ai es no vacío).
2.  Ai = A (la unión de la familia es todo A).
i ∈I
3. Ai ≠ Aj ⇒ Ai ∩ Aj = ∅ o por contrapuesta.
4. Ai ∩ Aj ≠ ∅ ⇒ Ai = Aj (los elementos de la familia son ajenos 2 a 2).

Una aplicación importante de las relaciones de equivalencia tiene que ver con su conexión
con las particiones, lo que está contemplado en el siguiente teorema.

  Teorema A4.2
Toda relación de equivalencia en un conjunto permite definir una partición de éste y, recíproca-
mente, toda partición permite definir una relación de equivalencia.

Demostración

Sea {Ai }i ∈I una partición de A. Se define para a, b ∈ A.
a ℜb si y sólo si existe algún Ai en la familia, tal que tanto a como b estén en él.
Entonces
1. ∀ a ∈ A, A =  Ai implica que existe algún Ai tal que a está en él. Evidentemente, a está
i ∈I
en el mismo conjunto Ai que él mismo, es decir, ∀ a ∈ A, a ℜa .
2. a ℜb quiere decir que a y b están en el mismo Ai de la familia, luego b y a están en él
(a ℜb ⇒ bℜa).
3. Finalmente, a ℜb ∴ ∃i ∈ I∋ a, b ∈ Ai , b ℜc dice que b y c están en algún Aj ∴ b ∈ Ai ∩ Aj .
Luego Ai = Aj, por lo que a y c están en el mismo conjunto, es decir, a ℜc (a ℜb ∧ b ℜc ⇒ a ℜc ).
Dado que ℜ satisface las propiedades reflexiva, simétrica y transitiva, resulta de
equivalencia y es la relación inducida por la partición {Ai }i∈I .

Sea A un conjunto y ℜ ⊂ A × A una relación de equivalencia. Se define para cada
a ∈ A, Aa = {b ∈ A; a ℜb} .
Entonces {Aa }a ∈A es una partición de A (la inducida por ℜ ). En efecto,
1. ∀ a, a ℜa ( ℜ es reflexiva) ∴ a ∈ Aa . Luego, Aa ≠ ∅.
Anexo 4 245

2. Por la misma razón, si a ∈ A, a ∈  Aa ∴ A ⊂  Aa . Obviamente,  Aa ⊂ A, ya que


a ∈A a ∈A a ∈A
cada Aa es subconjunto de A ∴ A =  Aa .
a ∈A
3. Suponga que Aa ∩ Ab ≠ ∅. P.D. Aa = Ab .

Sea c ∈ Aa ∩ Ab ∴ a ℜc (y c ℜa ). También b ℜc y c ℜb. Luego de a ℜc y c ℜb, a ℜb (y b ℜa ).


Ahora, sea x ∈ Aa ∴ a ℜx, y como b ℜa, resulta b ℜx, es decir, x ∈ Ab ∴ Aa ⊂ Ab . Análo-
gamente se prueba que Ab ⊂ Aa y, por lo tanto, Aa = Ab .

Cuando se construye una partición a partir de una relación de equivalencia en A, los elemen-
tos de la partición (los subconjuntos Ai , i ∈ I ) forman a su vez un conjunto que se conoce como
el conjunto cociente, módulo la relación, y si esta última es ℜ, el mencionado conjunto se denota
A / ℜ. A los elementos de este conjunto se les llama también clases de equivalencia y cada uno de
sus elementos es un representante de su clase.

Tres ejemplos importantes


1. Sea  = N × N = {(a, b); a, b ∈ N} . Se establece en Z (a, b) ≈ (c, d ) si y sólo si a + d = b + c.
Se puede ver que la relación así definida es de equivalencia y el conjunto cociente se define
como Z, el conjunto de los enteros.
Por ejemplo, el 2 ∈ Z es {(2, 0), (3, 1), , (n + 2, n), } . Cada pareja es un representante
del 2.
*
2. Sea Q = Z × Z (Z* es el conjunto de los enteros Z, menos el cero).
Se define en Q, (a, b) ≈ (c, d ) si y sólo si ad = bc que resulta de equivalencia. El conjunto
Q de los números racionales es el conjunto cociente Q/ ≈. Por ejemplo,
1 = 1, 2 , 2, 4 , 3, 6 , , n, 2 n , 
2
{( ) ( ) ( ) ( ) }
− 1 = {(−1, 2), (−2, 4), (−3, 6), , (− n, 2 n), }
2
y cada pareja es un representante de su clase.
3. Sean Z el conjunto de los enteros y m un entero positivo. Se define a ≡ b ( m ) si y sólo si m (a − b)
(condición que es equivalente a pedir que a y b dejen igual residuo al dividirse entre m).
La congruencia módulo m resulta también una relación de equivalencia en Z. Las clases
de equivalencia (elementos del conjunto cociente) se llaman clases residuales módulo m.
Por ejemplo, si m = 3, Z/ ≡ = {0, 1, 2} , que son los residuos positivos que resultan al divi-
dir un entero entre tres, entonces
0 = {, − 6, − 3, 0, 3, 6, , 3n, } (Residuo cero)
1 = {, − 5, − 2, 1, 4, 7, , 3n + 1, } (Residuo uno)
2 = {, − 4, − 1, 2, 5, 8, , 3n + 2, } (Residuo dos)

Una representación de relaciones


Considere el rectángulo ABCD en el que los puntos del segmento AB representan a los elementos
de un conjunto X y los del segmento AD al conjunto Y. Entonces el rectángulo es una manera de
representar al producto cartesiano X × Y.
Si, por ejemplo, el punto P tiene coordenadas a y b en el rectángulo, P es la representación de la
pareja (a, b) del producto cartesiano. En este contexto, una relación ℜ de X en Y, ℜ ⊂ X × Y ,
corresponde al subconjunto del rectángulo que incluye las coordenadas de toda pareja ℜ relacionada.
Cuando ℜ es una relación en A, (ℜ ⊂ A × A), el rectángulo al que se refiere el párrafo ante-
rior es un cuadrado, y en él la propiedad reflexiva de una relación ℜ corresponde a la condición de
que el subconjunto que la representa contenga a la diagonal AC. La propiedad simétrica de
246 Anexo 4

ℜ, ((a, b) ∈ ℜ ⇒ (b, a ) ∈ ℜ), dice que la gráfica debe ser simétrica con respecto a la antes referida
diagonal.
Con la convención anterior, la relación de equivalencia más pequeña en el sentido de la con-
tención es la igualdad, ya que la diagonal tiene que estar contenida en el dibujo de cada gráfica de
una relación de equivalencia. (∀ a ∈ A, (a, a ) ∈ ℜ), mientras que la mayor de todas las antes men-
cionadas relaciones es la relación total A × A .

Ejercicio A4.2

Demuestre que todas las relaciones definidas en los ejemplos son de equivalencia y encuentre la
partición que cada una de ellas induce.
Anexo 5
Transformaciones lineales
Sean U y V espacios vectoriales sobre el mismo campo. La colección de todas las transformacio-
nes lineales de U en V se denota L (U, V). Cuando U = V, L (U, V) se abrevia L (U).

  Teorema A5.1
L (U, V) es un espacio vectorial sobre el campo K, con las operaciones de suma y multiplicación
por un escalar definidas como

1. (S + T )(u ) = S (u ) + T (u )

y
2. (αS )(u ) = αS (u )
T ∈ L (U, V ), ∀α ∈ K, ∀u ∈ U

Demostración

1. {L (U, V), +} (es decir, L (U, V) con la suma) es un grupo abeliano.


La suma es asociativa:
∀u ∈ U ,
[(S + T ) + U ] (u ) = (S + T )(u ) + U (u )
= (S (u ) + T (u )) + U (u )
= S (u ) + (T (u ) + U (u ))
= S (u ) + (T + U )(u )
= [S + (T + U )](u )
∴ (S + T ) + U = S + (T + U ) .
Existe el neutro: O (u ) = 0
∀ u ∈ U,
[S + O](u ) = S (u ) + O (u )
= S (u ) + O (u ) = S (u ) + 0
= S(u )
∴ S + O = S.
Cada elemento S tiene su inverso aditivo −S definido S (−u ) = −S (u )
∀ u ∈ U,
[S + (−S )](u ) = S ( u ) − S ( u )
=0
= O (u )
∴ S + (−S ) = O .
247
248 Anexo 5

La suma conmuta:
∀ u ∈ U,
[S + T ](u ) = S ( u ) + T ( u )
= T (u ) + S(u )

= [T + S ](u )

∴ S + T = T + S.
2. La multiplicación por escalares cumple con las propiedades:

[(αβ )S](u ) = (αβ )S (u )


= S ((αβ ) u )

= S (α (β u ))

= αS (β u )

= α (βS (u ))

= [α (βS )](u )

∴ (αβ )S = α (βS ) .
[(α + β )S](u ) = (α + β )S (u )
= S ((α + β ) u )

= S (αu + β u )

= S (αu ) + S (β u )

= αS (u ) + βS (u )

= (αS )(u ) + (βS )(u )

= [αS + βS ](u )

∴ (α + β )S = αS + βS.

[α (S + T )](u ) = α (S + T )(u )
= α (S (u ) + T (u ))

= α (S (u )) + α (T (u ))

= (αS )(u ) + (αT )(u )

= (αS + αT )(u )

∴ α (S + T ) = αS + αT .

[1S](u ) = 1S (u )
= S (u )

∴ 1S = S.
Anexo 5 249

A continuación se presenta una demostración de que la multiplicación por un escalar de


transformaciones lineales es lineal y la suma también.

[αS](β u ) = α (S (β u ))
= α (βS (u ))

= (αβ )(S (u ))

= ( β , α ) (S (u))

= β (α (S (u )))

= β ([αS ](u ))   (saca escalares)

[αS](u + v ) = α (S (u + v ))
= α (S (u ) + S (v ))

= α (S (u )) + α (S (v ))

= [αS ](u ) + [αS ](v )   (abre sumas)

[S + T ](u + v ) = S (u + v ) + T (u + v )
= S (u ) + S (v ) + T (u ) + T (v )

= S (u ) + T (u ) + S (v ) + T (v )

= [S + T ](u ) + [S + T ](v ) (abre sumas)

[S + T ](αu ) = S (αu ) + T (αu )


= αS (u ) + αT (u )

= α (S (u ) + T (u ))

= α ([S + T ](u )) (saca escalares)

Núcleo o kernel e imagen de una transformación lineal


Definición A5.1
Sea T ∈ L (U, V).

Ker (T ) = {u ∈ U : T (u ) = 0} se llama el núcleo o kernel de T;


T (U) = {T (u ) ∈ V : u ∈ U} se llama la imagen de T.

  Teorema A5.2
Sea T ∈ L (U, V). Entonces,
1. T ( 0w ) = 0v
2. T (−u ) = −T (u )
3. Ker w (T ) es un subespacio de U.
4. T (U) es un subespacio de V.
250 Anexo 5

Demostración

() ( ) ()
1. T 0 = T 0 + 0 = T 0 + T 0 ()
0 + T (0) = T (0) + T ( 0 )

Al cancelar, 0 = T ( 0).

()
2. 0 = T 0 = T (u − u ) = T (u + ( − u )) = T (u ) + T (− u )
∴ T (−u ) = −T (u ).

3. T (u ) = 0 ∴ 0 ∈ Ker (T)
Sean u , v ∈ Ker (T ); por lo tanto, T (u ) = 0 y T (v ) = 0

T (u + v ) = T (u ) + T (v ) = 0 + 0 = 0 ∴ (u + v ) ∈ Ker (T ).

Sea α ∈ K

T (αu ) = αT (u ) = α 0 = 0 ∴ αu ∈ Ker (T ).

()
4. T 0 = 0 ∴ 0 ∈ T (U) .
 ean v1, v2 ∈ T (U); por lo tanto, existen u1, u2 ∈ U tales que T (u1 ) = v1 y T (u2 ) = v2 .
S
Entonces T (u1 + u2 ) = v1 + v2 en T (U).

Sea α ∈ K . Entonces αu ∈ K , y, por lo tanto, T (αu ) = αv ∈ T (U).

Lema A5.1
Sean T ∈ L (U, V) y U de dimensión finita n,
{v1, , vn} ⊂ T (U), {x1, , xn} ∋ T (xi ) = vi , i = 1,..., n .
Entonces, {v1, , vn } linealmente independiente implica {x1, , xn } linealmente independiente.

Demostración
n  n  n
Sea 0 = ∑ ai xi . Entonces T ( 0) = 0 = T  ∑ ai xi  = ∑ ai vi ; por lo tanto, cada ai = 0.
i =1  i =1  i =1

Corolario 1 dim T (U) ≤ dim U = n .

  Teorema A5.3
n = dim Ker (T ) + dim T (U).

Sean {x1,  , xr } base de Ker (T ), {y1, , ys } base de T (U), {u1,  , us } ⊂ U, T (ui ) = yi . Enton-
ces β = {x1,  , xr , u1,  , us } es una base de U (∴ n = r + s) . Note que todos los elementos de β son
distintos. ¿Por qué?

1. β genera U. En efecto, sea x ∈U.

 s 
T (x ) ∈ T (U ) ∴ T (x ) = ∑ b j y j = ∑ b j T (u j ) = T  ∑ b j u j 
s s

j =1 j =1  j =1 
 s   s 
∴ 0 = T (x ) − T  ∑ b j u j  = T  x − ∑ b j u j 
 j =1   j =1 
Anexo 5 251

 s  s r
∴ x − ∑ b j u j  ∈ Ker T y ∴ es una combinación lineal de β, es decir, x − ∑ b j u j = ∑ αi xi ,
 j =1  j =1 i =1
r s
de donde x = ∑ αi xi + ∑ b j u j .
i =1 j =1
r s
2. β es linealmente independiente. Sea 0 = ∑ α i xi + ∑ b j u j .
i =1 j =1
Por demostrar αi = 0 ∀ i , b j = 0 ∀ j
 r   s   s  s
T ( 0) = 0 = T  ∑ αi xi  + T  ∑ b j u j  = T  ∑ b j u j  = ∑ b j y j ∴ cada b j = 0 y
 i =1   j =1   j =1  j =1
r s r
∴ ∑ αi xi + ∑ b j u j = ∑ αi xi y ∴ cada αi es α i = 0.
i =1 j =1 i =1

Definición A5.2
Se dice que los espacios vectoriales U y V son isomorfos, lo cual se denota por U ≅ V, si existe
un isomorfismo entre ellos.

  Teorema A5.4
Si U es un espacio vectorial de dimensión n sobre el campo K, entonces U ≅ Kn.

La demostración se hace de la siguiente manera:


1. Se define una función T de U en Kn.
2. Se demuestra que T es lineal y biyectiva.

Demostración

Sea β = {u1, … , un } una base de U. Por lo tanto, para cada x ∈ U existe una única colección
de coeficientes ai tales que u = a1u1 +  + an un ∈ U. Se define, T: U → Kn T(u– ) = (a1, ..., an).
T es lineal. En efecto, sean u = a1u1 +  + an un y v = b1u1 +  + bn un , α ∈ K

T (u + αv ) = (a1 + αb1, , an + αbn ) = (a1, , an ) + (αb1, , αbn ) = T (u ) + αT (v ).

La demostración de que es biyectiva es inmediata debido a que tiene inversa. En efecto, si


S (a1, , an ) , se define como a1u1 +  + an un = u ∴ S es T −1.
Note que el isomorfismo T depende de la base y que para cada base de U existe un iso-
morfismo diferente.

  Teorema A5.5
Sea T ∈ L (U, V) un isomorfismo (por lo tanto, tiene inversa); entonces, T −1 es una transforma-
ción lineal. 

Demostración
Sean m, n ∈ V y u, v ∈ U tales que T (u ) = m, T (v ) = n, entonces,
T −1 (m + n) = T −1 (T (u) + T (v )) = T −1 (T (u + v )) = u + v = T −1 (m) + T −1 (n).

Sea α ∈K. T −1 (αm) = T −1 (αT (u )) = T −1 (T (αu )) = αu = αT −1 (m). 


252 Anexo 5

  Teorema A5.6
Sea T ∈ L (U, V) y dim U = dim V. Entonces las proposiciones siguientes son equivalentes:
1. T es un isomorfismo.
2. Si {u1,  , un } es una base de U, entonces {T (u1 ),  , T ( un )} es una base de V.
3. Si T (u ) = 0, entonces u = 0.
4. T −1 es lineal, T −1  T = I U y T  T −1 = I V, donde I U e I V son las identidades en U y en V,
respectivamente.

La demostración se deja como ejercicio.

  Teorema A5.7

Sean U y V espacios vectoriales sobre el mismo campo, {u1,  , un } una base de U y {v1,  , vn } un
conjunto de vectores de V, no necesariamente distintos. Entonces ∃! T ∈ L (U, V) ∋ ∀i ∈ {1, 2, , n}, T (ui ) = vi .
∃! T ∈ L (U, V) ∋ ∀i ∈ {1, 2,  , n}, T (ui ) = vi .

Demostración
Sea u = α1u1 +  + α n un ∈ U. Se define T (u ) = α1v1 +  + α n vn , entonces
( )
T (ui ) = T 0 u1 +  + 0 ui − 1 + 1ui + 0 ui +1 +  + 0 un = 0v1 +  + 0vi −1 + 1vi + 0vi +1 +  + 0vn = vi ,
es decir, T (ui ) = vi , ∀i ∈ {1, 2,  , n}
T es lineal. En efecto, sean u = a1u1 +  + an un, v = b1u1 +  + bn un ∈U, T (u– + –v ) = (a1 + b1) v–1
+ ... + (an + bn) v–n .
Al desarrollar y arreglar términos:
(a1v1 +  + an vn ) +(b1v1 +  + bn vn ) = T (u ) + T (v )
T (αu ) = (αa1 )v1 +  + (αan )vn = α (a1v1 ) +  + α (an vn ) = α (T (u )). 

Unicidad  Para probar la unicidad de la función T, se supone que existe S ∈ L (U, V), tal que

∀ i ∈ I , S (ui ) = vi , entonces ∀ u ∈ U, T (u ) = T (a1u1 +  + an un ) = a1v1 +  + an vn =

= a1S (u1 ) +  + anS (un ) = S (a1u1 +  + an un ) = S (u ) ∴ T = S.

Matriz asociada a una transformación lineal


  Teorema A5.8
Sean T ∈ L (U, V), U y V espacios vectoriales sobre el campo K, BU = (u1,  , un ) y BV = (v1,  , vm )
bases ordenadas de U y V, respectivamente.

Sean f : U → R n y g : U → R m los isomorfismos asociados a las bases BU y BV. Entonces


∃! A ∈ M m × n (K) tal que g ° T = A ° f. Es decir que A hace conmutativo el siguiente diagrama:

m
Anexo 5 253

Demostración
Sean u ∈ U, v ∈ V y T (u ) = v

 x1 
 
u = x1u1 +  + xn un = [u1 … un ]   
xn 

 y1 
 
v = y1v1 +  + yn vn = [v1 … vn ]   
 yn 

 A1 j 
 
u j = A1 j v1 +  + Am j vn = [v1 … vm ]   
A 
 mj

T (u ) = T (x1u1 +  + xn un ) = x1T (u1 ) +  + xnT (un )

 x1    A11   A1n   x1 
        
T (u ) = T (u1 ) T (un )    = [v1 … vm ]    [v1 … vm ]      
xn   A  A  x 
  m1   m n   n 

 A11 A1n   x1   y1 
    
T (u ) = [v1 … vm ]         = v = [v1 … vm ]   
A    yn 
 m1 Am n  xn 

 y1   A11 A1n   x1 
    
   =         , es decir, y = Ax
 yn  Am1 Am n  xn 
 

 A11 A1n 
 
     es la matriz asociada a T, con respecto a las bases BU y BV , denotada por
A 
 m1 Am n 

 A11 A1n 
 
(T ) BV
BU =    
A 
 m1 Amn 

Unicidad  Partiendo de las bases BU y BV, la matriz asociada a la transformación resulta única,
dado que es lineal y tiene definidas las imágenes de los elementos básicos.

Definición A5.3
Sean U, V y W espacios vectoriales sobre el campo K. Si S ∈ L (U, V) y T ∈ L (V, W),
entonces se puede formar la composición T  S : U → W de la manera usual, es decir,
[T  S](u ) = T (S (u )) .
254 Anexo 5

  Teorema A5.9
T  S ∈ L (U, W). 

Demostración
[T  S](u + v ) = T (S (u + v )) = T (S (u ) + S (v ))
= T (S (u )) + T (S (v )) = [T  S ](u ) + [T  S ](v )
[T  S](αu ) = T (S (αu )) = T (αS (u )) = αT (S (u )) = α[T  S](u ).

  Teorema A5.10

Sean S ∈ L (U, V) , T ∈ L (V , W) ; U, V y W espacios vectoriales sobre el campo K; BU = (u1, , un ),


BV = (v1, , v p ), BW = (w1, , wm ) bases ordenadas de U, V y W, respectivamente, f : U → R n ,
g : V → R p y h : W → R m los isomorfismos asociados a las bases BU , BV y BW . 

Entonces ∃! A ∈ M p × n (K) y −∃! B ∈ M m × p (K), tales que hacen conmutativo el siguiente diagrama:

En particular, h  (T  S ) = B  (A  f ).
Sean u ∈ U, S (u ) = v ∈ V y T (v ) = w ∈ W
 x1 
 
u = x1u1 +  + xn un = [u1 … un ]   
xn 
 y1 
 
v = y1v1 +  + y pv p = v1 … v p    
y p 
 
 z1 
 
w = y1w1 +  + ym wm = [w1 … wm ]   
zm 
 A1 j 
 
S (u j ) = A1 j v1 +  + Ap j v p = v1 … v p    
A 
 pj
 B1k 
 
T (vk ) = B1k w1 +  + Bm k wm = [w1 … wm ]   
B 
 mk 
 z1   B11  B1 p   A11  A1n   x1 
     
  =          
zm  Bm1  Bm p  Ap1  Apn  xn 
 
 11
C  C1n   B11  B1 p   A11  A1n 
    
               es la matriz asociada a T  S.
C m1  C mn  Bm1  Bm p  Ap1  Apn 
  
¡Observe que la matriz asociada a una composición de transformaciones lineales es el pro-
ducto de las matrices asociadas a cada una de ellas!
Respuestas a los ejercicios

Unidad 1  Lógica y conjuntos Recuerde que por la ley de De Morgan ¬ (P ∧ ¬Q) ≡ (¬P ∨ Q)
Que de acuerdo con el primer ejercicio (¬P ∨ Q) ≡ (P → Q)
1.1  Lógica matemática Por reducción al absurdo se tiene ¬(P → Q), (P → Q) ⊢–
1. P → Q Hipótesis
Ejercicios 1.1.1 2. ¬ (P → Q) Hipótesis
Demuestre (P → Q) ≡ (¬Q → ¬P) 3. (P ∧ ¬Q) ∧ ¬(P → Q) (1, 2)
⇒ (P → Q), ¬Q ⊢– (¬Q → ¬P) ⇐ Se debe demostrar que (P ∧ ¬Q) ⊢– ¬ (P → Q)
(P → Q), ¬Q ⊢– ¬P Por teorema de la deducción Por reducción al absurdo (P ∧ ¬Q), (P → Q) ⊢–
[(P → Q),¬Q, P] ⊢– Por teorema de reducción al absurdo 1. P Hipótesis
1. P Hipótesis 2. P → Q Hipótesis
2. P → Q Hipótesis 3. Q MP(1, 2)
3. Q MP(1, 2) 4. ¬Q Hipótesis
4. ¬Q Hipótesis 5. Q ∧ ¬Q (3, 4)
5. Q ∧ ¬Q (3, 4)
Ejercicios 1.1.2
⇐ (¬Q → ¬P ) ⊢– (P → Q)
a) Sí
La demostración es análoga.
b) No
Demuestre (P → Q) ≡ (¬P ∨ Q)
c) Sí
⇒ Se debe demostrar que (P → Q) ⊢– (¬P ∨ Q) (1)
d ) Sí
Recuerde que por ley de De Morgan ¬ (¬P ∨ Q) ≡ (P ∧ ¬Q)
e) No
Por reducción al absurdo (1) se cambia por (P→Q), P, ¬Q ⊢–
f ) No
1. P Hipótesis
g) Sí
2. P → Q Hipótesis
h) Sí
3. Q MP(1, 2)
4. ¬Q Hipótesis Ejercicios 1.1.3
5. Q ∧ ¬Q (3, 4)
a) P ∧ Q
⇐ Se debe demostrar que (¬P ∨ Q) ⊢– (P → Q)
b) P ∨ Q
Por teorema de la deducción (¬P ∨ Q), P ⊢– Q
c) P ↔ Q
Por reducción al absurdo (¬P ∨ Q), P, ¬Q ⊢– d ) P ∨ Q
1. (¬P ∨ Q) Hipótesis
2. P Hipótesis Ejercicios 1.1.4
3. Q Disy (1, 2) a) ¬O
4. ¬Q Hipótesis b) P → Q
5. Q ∧ ¬Q (3, 4) c) P
Demuestre ¬ (P → Q) ≡ (P ∧ ¬Q) d ) P → Q
⇒ Se debe demostrar que ¬ (P → Q) ⊢– (P ∧ ¬Q) e) P → Q
f ) P ∧ Q ∨ Z

255
256 Respuestas a los ejercicios

Ejercicios 1.1.5
a) Si a es menor que b, o b es mayor o igual que c, entonces a c) Si el que a sea menor o igual que b implica que b es menor
es menor que c. que c, entonces a es mayor o igual que c.
b) Si no es cierto que a es menor que b o es falso que a es d ) a es menor que c y c es igual a d, si y sólo si, b es menor que
menor o igual que b, y b es menor que c, entonces a es menor c y a es mayor o igual que b, entonces a es menor que c.
que c.

Ejercicios 1.1.6
a)
A → (B → A)
0 1 0 1 0
0 1 1 0 0
1 1 0 1 1
1 1 1 1 1

b)
(A → B) → [(A → (B → C)) → (A → C)]
0 1 0 1 0 1 0 1 0 1 0 1 0
0 1 0 1 0 1 0 1 1 1 0 1 1
0 1 1 1 0 1 1 0 0 1 0 1 0
0 1 1 1 0 1 1 1 1 1 0 1 1
1 0 0 1 1 1 0 1 0 0 1 0 0
1 0 0 1 1 1 0 1 1 1 1 1 1
1 1 1 1 1 0 1 0 0 1 1 0 0
1 1 1 1 1 1 1 1 1 1 1 1 1

c)
A → (B → (A ∧ B))
0 1 0 1 0 0 0
0 1 1 0 0 0 1
1 1 0 1 1 0 0
1 1 1 1 1 1 1

d )
(A ∧ B) → A (A ∧ B) → B
0 0 0 1 0 0 0 0 1 0
0 0 1 1 0 0 0 1 1 1
1 0 0 1 1 1 0 0 1 0
1 1 1 1 1 1 1 1 1 1

e)
(A → C) → [(B → C) → ((A ∨ B) → C)]
0 1 0 1 0 1 0 1 0 0 0 1 0
0 1 1 1 0 1 1 1 0 0 0 1 1
0 1 0 1 1 0 0 1 0 1 1 1 0
0 1 1 1 1 1 1 1 0 1 1 1 1
1 0 0 1 0 1 0 0 1 1 0 0 0
1 1 1 1 0 1 1 1 1 1 0 1 1
1 0 0 1 1 0 0 1 1 1 1 0 0
1 1 1 1 1 1 1 1 1 1 1 1 1
Respuestas a los ejercicios 257

f )
A → (A ∨ B) B → (A ∨ B)
0 1 0 0 0 0 1 0 0 0
0 1 0 1 1 1 1 0 1 1
1 1 1 1 0 0 1 1 1 0
1 1 1 1 1 1 1 1 1 1

g)
(A → B) → [(A → ¬B) → ¬A]
0 1 0 1 0 1 1 1 1
0 1 1 1 0 1 0 1 1
1 0 0 1 1 1 1 0 0
1 1 1 1 1 0 0 1 0

h)
(¬ ¬A) → A
0 1 1 0
1 0 1 1

Ejercicios 1.1.7 c) 1. F ∨ (G ∨¬D) Equiv H1


a) Verdadera 2. ¬F H3
b) Verdadera 3. G ∨¬D Disy(1, 2)
c) Verdadera 4. D → G Equiv 3
d ) Verdadera 5. E → D Equiv H2
e) Verdadera 6. E → G SIL(5, 4)
d ) 1. ¬(D ∧ O) ∨ Z H3
2. ¬Z H4
Ejercicios 1.1.8 3. ¬(D ∧ O) ≡ ¬D ∨ ¬O Disy(1, 2)
a) No válido 4. D → ¬O Equiv 3
b) No válido 5. M → ¬O SIL(H2, 4)
c) Válido 6. O → ¬M Contrap 5
d ) Válido 7. L → ¬M SIL(H1, 6)
e) Válido
Ejercicios 1.1.10
a) Falso, contraejemplo x = −2 ya que 4 ≠ −2; negación:
Ejercicios 1.1.9
∃x ∈  ∋ x 2 ≠ x
a) 1. S ∧ Q H1 b) Cierto, x = 0, 2(0) = 0; negación: ∀x ∈ , 2 x ≠ x
2. S ∧ Q → S TB4 c) Falso, contraejemplo x = −3, •−3• ≠ −3; negación:
3. S MP(1, 2) ∃ x ∈ ∋ x ≠ x
d) Falso, no implica que es 2, pues puede ser −2; negación:
b) 1. F ∨ S H3 ∃ x ∈  ∋ x 2 = 4 ∧ x ≠2
2. ¬ S H4 e) Cierto, cada número tiene su inverso aditivo; negación:
3. F Disy(1, 2) ∃ x ∈,∀y ∈ ∋ x + y = 0
4. ¬H ∨ ¬F Equiv H2 f) Falso, no existe un número que pueda fungir como el inver-
5. ¬H Disy(4, 3) so aditivo de todos los números reales, cada número tiene su
6. Q ∨ H Equiv H1 inverso aditivo; negación: ∃ x ∈,∀y ∈ ∋ x + y = 0
7. Q Disy(6, 5) g) Cierto, y = −2, funciona con todos los valores para x en la
proposición x + y ≤ −1
258 Respuestas a los ejercicios

1.7 Algunas demostraciones es decir, (A × B ) ∪ (A × C ) ⊂ A × (B ∪ C ) (2)


en la teoría de conjuntos de (1) y (2)

A × (B ∪ C ) = ( A × B ) ∪ ( A × C )
Ejercicio 1.7.1
1. No, (a, a) es un punto en el plano y {{a}} es el conjunto que Ejercicio 1.7.4
consta del conjunto que consta sólo de la a. a ∈ A ∧ a ∈ C
(a, b) ∈ (A × B) ∩ (C × D) ⇔ b ∈ B ∧ b ∈ D ⇔ (a, b) ∈ (A × D) ∩ (C × B)
a ∈ A ∧ a ∈ C 
Ejercicio 1.7.2 (a, b) ∈ (A × B) ∩ (C × D) ⇔ b ∈ B ∧ b ∈ D ⇔ (a, b) ∈ (A × D) ∩ (C × B)

3 1 2 4
x= ; y= ; x= ; y=
4 4 5 5 Ejercicio 1.7.5
Si A ∩ B ≠ ∅, entonces ∀A ∈ (A ∩ B ), (a, a ) ∈ A × B
Ejercicio 1.7.3

i) A ⊂ X ∧ B ⊂ Y ⇔ ( A × B) ⊂ (X × Y ) Ejercicio 1.7.6
a)
⇒ sea
A B A∪B (A ∪ B)C = AC BC AC ∩ BC
(a, b) ∈ A × B ∴ a ∈ A, b ∈ B ∴ a ∈ X , b ∈Y
a b a∨b ¬(a ∨ b) ⇔ ¬a ¬b ¬a ∧ ¬b
∴ (a, b) ∈ X ×Y ∴ (A × B) ⊂ (X ×Y )
0 0 0 1 1 1 1 1
⇐ sea 0 1 1 0 1 1 0 0
a ∈ A, b ∈ B ∴ (a, b) ∈ A × B ∴ (a, b) ∈ X ×Y
1 0 1 0 1 0 1 0
∴ a ∈ X , b ∈Y ∴ A ⊂ X , B ⊂ Y 1 1 1 0 1 0 0 0

iii) Sea A ≠ B ∧ A × B = ∅ ∴ ∃a ∈ A − B ∧ b ∈ B b)

∴ (a, b) ∈ A × B pero ∴ (a, b) ∉ B × A ∴ A × B ≠ B × A A B A∩B (A ∩ B)C = AC BC AC ∪ BC


a b a∧b ¬(a ∧ b) ⇔ ¬a ¬b ¬a ∨ ¬b
v) Sea (a, b) ∈ A × (B ∪ C ) ∴ a ∈ A, b ∈ B ∨ b ∈ C 0 0 0 1 1 1 1 1
0 1 0 1 1 1 0 1
∴ (a, b) ∈ A × B ∨ (a, b) ∈ A × C , es decir, (a, b) ∈ A × (B ∪ C )
1 0 0 1 1 0 1 1
∴ A × (B ∪ C ) ⊂ (A × B) ∪ (A × C ) (1) 1 1 1 0 1 0 0 0

Sea (a, b) ∈ (A × B) ∪ (A × C ) c) ( A − B ) − C = A − (B ∪ C )
∴ (a , b) ∈ A × B ∨ (a , b) ∈ A × C ∴ b ∈ B ∨ b ∈ C
( )
que es equivalente a A ∩ BC ∩ C C = A ∩ (B ∪ C )C
∴ (a , b) ∈ A × (B ∪ C ) (vea cuadro R.1).

Cuadro R.1
A B C BC CC A ∩ BC (A ∩ B)C ∩ CC = B∪C (B ∪ C)C A ∩ (B ∪ C)C
a b c ¬b ¬c (a ∧ ¬ b) (a ∧ ¬ b) ∧ ¬ c ⇔ b∨c ¬(b ∨ c) a ∧ (¬b ∨ c)
0 0 0 1 1 0 0 1 0 1 0
0 0 1 1 0 0 0 1 1 0 0
0 1 0 0 1 0 0 1 1 0 0
0 1 1 0 0 0 0 1 1 0 0
1 0 0 1 1 1 0 1 0 1 1
1 0 1 1 0 1 1 1 1 0 0
1 1 0 0 1 0 0 1 1 0 0
1 1 1 0 0 0 0 1 1 0 0
Respuestas a los ejercicios 259

d) (A ⊂ B) ⇒ ([A ∩ (B ∩ C )] = [(A ∩ B) ∩ C ])

que es equivalente a (A → B) ⇒ ([A ∩ (B ∩ C )] ⇔ [( A ∩ B) ∩ C ])

A B C A→B ⇒ B∩C A ∩ (B ∩ C) = A∩B (A ∩ B) ∩ C


a b c a→b ⇒ b∧c a ∧ ( b ∧ c) ⇔ a∧b (a ∧ b) ∧ c
0 0 0 1 1 0 0 1 0 0
0 0 1 1 1 0 0 1 0 0
0 1 0 1 1 0 0 1 0 0
0 1 1 1 1 1 0 1 0 0
1 0 0 0 1 0 0 1 0 0
1 0 1 0 1 0 0 1 0 0
1 1 0 1 1 0 0 1 1 0
1 1 1 1 1 1 1 1 1 1

1.8  El concepto de función Son cadenas {{a}}, {{b}}, {{c}}, {{a, b}}, {{c, d}}, {{d,
e, f }} {{a}, {a, b}}, {{b}, {a, b}}, {{b}, {b, c}}, {{c}, {b, c}}
Ejercicio 1.8.1
Ejercicio 1.8.6
5 utilizaron camión y tren; 40 utilizaron camión o tren.
f   1   2 
f + g = {(1, 1), (2, 5), (3, 11)} = (1, 0), 2,  , 3, 
Ejercicio 1.8.2 g   4   9 
169 llevan cálculo y física; 149 llevan cálculo y física, pero no f − g = {(1, − 1), (2, − 3), (3, − 7)} f  g = {(1, 0), (2, 3)}
álgebra. f ⋅ g = {(1, 0), (2, 4), (3, 18)} g  f = {(1, 0), (2, 1), (3, 4), (4, 9)}

Ejercicio 1.8.3
Ejercicio 1.8.7
Una partición puede ser {P, Q}, en donde P = {a, b} y
Q = {c, d}, en ese caso la relación ℜ de equivalencia que induce f  g = x + 1, x ≥ 0 ; g  f = x2 + 1
es: ℜ = {(a, a), (a, b), (b, a), (b, b), (c, c), (c, d), (d, c), (d, d)}.
Otra podría ser {P, Q, R, S} en donde. P = {a}, Q = {b}, Ejercicio 1.8.8
R = {c}, S = {d}. La relación ℜ inducida es: ℜ = {(a, a), (b, b),
(c, c), (d, d)}. h(x) = x 4 + x 2 − 2

Ejercicio 1.8.4
n ≡ m, si y sólo si m − n es múltiplo de 5. Unidad 2 Sistema de ecuaciones
1. n ≡ n 0 es múltiplo de 5 lineales, matrices y
2. Si n ≡ m(5) es decir, ∃ x ∈ Z ∋ m − n = (x)(5); (−x)(5) = n − m ,
determinantes
y ∴ m ≡ n(5)
2.1  Sistemas de ecuaciones lineales
3. Sean, n ≡ m(5), m ≡ k(5) ∃ x, y ∈ Z ∋ m − n = (x) (5); k − m = ( y) (5),
 k − m = (y)(5), por lo que sumando miembro a miembro Ejercicios 2.1.1
resulta k − n = (x + y)(5), es decir, n ≡ k(5). 1. i) Coeficientes 0, −2, 0; término constante b = 6;
 {
La partición que resulta es 0, 1, 2, 3, 4 en donde;} ii) variable delantera y, variables libres x, z
{ } { } {
0 = 5n, n ∈  1 = 5n + 1, n ∈  , …, 4 = 5n + 4, n ∈  , }
iii) Solución general
o también:
{{5n}, {5n + 1}, {5n + 2}, {5n + 3}, {5n + 4}} n ∈ Z  x  1 0  0
X =  y  = r  0  + s  0  +  −3  , r ∈ℝ
Ejercicio 1.8.5        
 z  0 1  0
i) No existe ningún elemento de A que contenga a todos. Lue-
go no hay “mayor”.    
x  0
ii) No existe ningún elemento de A que esté contenido en Solución particular, r = s = 0;  y  =  −3  y
todos. Luego no hay “menor”.    
iii) Los elementos que no están contenidos en ningún otro son  z   0
{a, b}, {b, c}, {d, e, f } que por lo tanto son “máximos”.  x   1 
iv) Los elementos que no contienen a ningún otro son {a}, {b}, r = s = 1  y  =  −3 
   
{c}, {d, e, f } que por lo tanto son “mínimos”.  z   1 
260 Respuestas a los ejercicios

2. i) Coeficientes 3, 0, 0; término constante b = −6; 2.2 Matrices


ii) variable delantera x; variables libres y, z
Ejercicios 2.2.1
iii) Solución general
3x − 5 y = −9
 x   0   0   −2 
        4w + 3x − z = 11
y = r 1 + s 0 + 0 , r , s ∈ 
X =
− w − x + 3 y − z = 18
       
 z  0 1  0 8t + w − y − z = −5
 x   −2     
  0 0 3 −5 0 −9
Solución particular r = 2, s = 0  y  =  2  y    
    0 4 3 0 −1 11
a)   b) b= 
 z   0  0 −1 −1 3 −1   18 
 8 1 0 −1 −1   −5 
 x   −2 
r = s = −1  y  =  −1
  0 0 3 −5 0 −9 
     
 z   −1  0 4 3 0 −1 11
c)  
 0 −1 −1 3 −1 18 
3. i) Coeficientes −2, 7, 0; término constante b = 0;  8 1 0 −1 −1 −5 
ii) variable delantera x, variables libres y, z 3x −5 y = 0
iii) Solución general 4w +3x −z = 0
d)
−w − x +3 y − z = 0
8t +w − y −z = 0
 
t
 0 0 3 −5 0     −9 
  w
0 4 3 0 −1    11 
e)    x  =  18 
 x   −7   0 −1 −1 3 −1     
y
Solución particular r = s = 2  y  =  2 y  8 1 0 −1 −1     −5 
     z 
 z   2 
 0   0   3   −5   0   −9 
 0   4   3   0   −1   11 
 x   0  f) t   + w  + x  +y  +z   =  ; t, w,x, y, z ∈=
 0   −1   −1   3   −1   18 
r=s=0  y
 = 0 
 
     8  1   0   −1   −1   −5 
 z   0 
t, w, x, y, z ∈ ℝ
4. i) Coeficientes 1, 0, 1; término constante b = 6; Ejercicios 2.2.2
ii) variable delantera x, variables libres y, z  π 
   2 
a) 2 x = π  x  − 2 
iii) Solución general  y =  
3y = −2 ; x =
   3 
4z = e z  e 
 
 4 
 x   3  b) a − 2c + d = 2
Solución particular r = 2  y  =  2 y
s = 3     b + 3c − 2 d = 4
 z   3 

 x 5  ℝ
r = s = 1,  y  =  1

   
 z   1 
c) 3a − c + 5d = 4

5. No es una ecuación lineal 2b − 2c − 3d = 9
   
 1   −5   4 
Ejercicios 2.1.2. a    3   3
  3    
i) a) s ≠
9
b) s =
9 x =  b  = r  1  + s  3  +  9  , r, s ∈

2 2 c     2  2
d   1   0   0 
  0    
ii) a) s ∈ b) No existe    1  0
   
Respuestas a los ejercicios 261

d) 7 a + 4b −e +3 f = 3 y+w =1
c − 2e +8 f = 1 y+ z =1
c)
3d + 4e − 7 f = 2 x+ y =1
w+ z =1  1
 1   −3   3  1 0 0 0 
 −4   2
 a     7   7  7  0 1 1 0 1 
  7        1
 b   1   0   0  0 0 1 0 1 1  0 1 0 0 
2
 c     2   −8   1   ≈
1 1 0 0 1  1
x =   = r  0  + s   + t   +   , r, s, t ∈  0 0 1 0 
 d   0   −4   7   2  0 0 1 1 1  2

 e     3   3  3  1
   0   1   0   0  0 0 0 1 
 f   0         2
 
 0   1  0 1
 w   21 
   
Solución: x =  x  =  2 
1
e) a + 4b − 3d +f = 2  y   2 
c + 2d −f = 1 z 1
 
e −2 f = 8 2
3y + z = −9
 a   −4   3   −1   2  d) 3x + y = −8
 b   1   0   0   0 
          3x + 7 y + 2 z = −26
c  = r  0  + s  −2  + t  1  +  7  ,r,s,t,u ∈=
x =  
d   0   1   0   0  −1 −5 

e
  0   0   2   8  0 3 1 − 9  1 0 9 3
           
 f   0   0   1   0   3 1 0 − 8 ≈  1 
  0 1 − 3
 3 7 2 −26   3 

r, s, t, u ∈ ℝ 0 0 0 0

Ejercicios 2.2.3 x  −1   −5 


Solución: x =  y  = r    3
3 + , r ∈ =ℝ
  9    3
3x + 2 y + 3z = 19 z  9  0
a) −x + y − z = −3
x − 3 y + 2 z = 17  1 −3 2 17   1 0 0 55 
2x − y + z = 8
e) 2 x − 3 y = 14  2 −3 0 14  ≈  0 1 0 32 
   
 3 2 3 19   1 0 0 5  3x − 7 y + 2 z = −1  3 −7 2 −1   0 0 1 29 
 −1 1 −1 −3  ≈  0 1 0 2 
   
 2 −1 1 8   0 1 0 0   x   55 
Solución: x =  y  =  32 
   29 
 x   5  z
Solución: x =  y  =  2 
Aplicaciones de los sistemas de ecuaciones
   
 z   0 

2x + 3 y + 6z = 5 2.3  Balanceo de reacciones químicas


b) −x − y − z = −3
2x + y + z = 7 Ejercicios 2.3.1
a) a P2 I 4 + b P4 + c H 2 O → d PH 4 I + e H 3 PO4
 2 3 6 5   1 0 0 4 
 −1 −1 −1 −3  ≈  0 1 0 −1 
     a   10 
 2 1 1 7   0 0 1 0 
 b   13 
Solución: x =  c  = r  128  , r ∈ ℝ
 x   4     40 
d
Solución: x =  y  =  −1     
   0  e 32 
z
b) a KOH + b H 2SO 4 + c H 2 O → d KHSO 4
262 Respuestas a los ejercicios

a  1 i) a CaC2 O 4 + b KMnO 4 + c H 2SO 4 → d CaSO 4 + e MnSO 4 + f K 2SO 4 + g CO 2 + h H 2 O


   
a CaC
b 2 O 4 + b KMnO 4 + c H 2SO 4 → d CaSO 4 + e MnSO 4 + f K 2SO 4 + g CO 2 + h H 2 O
Solución: x =   = r    ,, r ∈ ℝ
1
 c  −1 
d   1  a   5 
     b   2 
Nota: El signo negativo del tercer coeficiente indica que el  c   8 
agua es un producto, no un reactivo.  d   
Solución: x =   = r  5   ,, rr ∈
∈=ℝ
c) a FeI 2 + b HIO3 + c HCl → d FeCl3 + e I 2 + f H 2 O  e   2

 f   1
 a   10   g 
   10 
 b   6   8 
h 
   
Solución: x =  c  = r 30  ,, rr ∈ ∈=ℝ
d  10 
 e   13  j ) a CuSCN + b KIO3 + c HCl + d O2 → e CuSO 4 + f ICN + g KCl + h H 2O
 +b KIO
a CuSCN
 f   18 3 + c HCl + d O2 → e CuSO4 + f ICN
+ g KCl + h H 2O

d ) a Na 2 Cr2 O7 + b NaI + c HCl → d CrCl3 + e I 2 + f H 2 O + g NaCl  a   4 


 b   4 
 a   1    4 
c
 b   6     
d
 c   14  Solución: x =   = r  3   ,, r ∈=ℝ
e
Solución: x =  d  = r 2  , r ∈ ℝ    4 
   3  f 
e  4 
     g   4 
 f   7   
h   2 
 g   8 
e) a HCl + b KMnO 4 → c Cl2 + d KCl + e MnCl2 + f H 2 O k) a PbCrO 4 + b KI + c HCl → d PbCl2 + e CrI 3 + f KCl + g I 2 + h H 2 O
a PbCrO 4 + b KI + c HCl → d PbCl2 + e CrI 3 + f KCl + g I 2 + h H 2 O
 a   16 
 b   2 
   5   
a  2 
Solución: x =  c  = r ,, rr ∈=ℝ
d  2   
b  12 
 e   2   
c  16 
     
d  
 f  8 Solución: x =   = r  2  ,, rr ∈=ℝ
e
f ) a CaF2 + b H 2SO 4 → c CaSO 4 + d HF    2 
 f
  12 
 g   3
 a   1    8 
h 
Solución: x =
 b  = r  1  ,, r ∈=ℝ
 c   1
    l) a Cl2 + b KOH → c KCl + d KClO3 + e H 2O
d 2

g) a FeS + bO 2 → c Fe 2 O3 + d SO 2  a   3
 b   6 
 a   4  Solución: x =  c  = r  5  ,, rr ∈=ℝ
 b  = r  7   ,, rr ∈=ℝ  d   1
Solución: x =    
 c   2  e
    3
d 4
m) a Ba (OH )2 + b HCl + c H 2 O → d BaCl2
h) a K 2 Cr2 O7 + b H 2 O + cS → d SO 2 + e KOH + f Cr2 O3
 a   1
 a   2 
Solución: x =  b  = r  2   ,, rr ∈∈=ℝ
 b   2     −2 
   3 c
c    
Solución: x =   = r  3  ,, rr ∈=ℝ d 1 
d
 e
  4 
    Nota: El signo negativo del tercer coeficiente indica que el
 f  2
agua es un reactivo, no un producto.
Respuestas a los ejercicios 263

n) a K 2 Cr2 O7 + bCH 3CH 2 OH + c H 2SO 4 → d Cr2 (SO 4 )3 + eCH 3COOH


Se+obtiene
f K 2SOla desigualdad −4r + 12 s > 0 , es decir 3s > r, que se
4 + g H 2O
resuelve, en un caso particular, si
+ c H 2SO 4 → d Cr2 (SO 4 )3 + eCH 3COOH + f K 2SO 4 + g H 2 O
r = s = 40
 a   1 t) a NaBrO + b H 2 O 2 → c NaBr + d O 2 + e H 2 O
 b   3  a   2   −1 
 c   4   b   0   1 
Solución: x =  d  = r  1  ,,rr∈∈=ℝ      
Solución: x = c = r 2 + s −1 , r, s ∈ ℝ
 e   3      
     d   1  0 
 f   1  e   0   1
 g   7       

o) a KClO3 + b HCl → c KCl + d H 2 O + eCl2 + f ClO 2 Se obtiene la desigualdad 2 r − s > 0 , es decir 2r > s, que se
resuelve, en un caso particular, si
 a  1  5  r=s=1
 b 6 6
  u) a Cu + b HNO3 → c Cu (NO3 )2 + d NO 2 + e NO + f H 2 O
r  1 s  5 
Solución: x =  c  =   + 6   , r, s ∈ ℝ
3  a  1  1
d  3  3  b  0 4
 e  3  0    r  s 
      Solución: x =  c  = 1 +
2  2 
1 , r, s ∈ ℝ
f 0 6
d  −4   2 
p) a C + bO 2 → c CO + d CO 2  e  2 0
     
f  0 2
 a 2  1
  r  1   Se obtiene la desigualdad −2 r + s > 0 , es decir s > 2r, que se
Solución: x = b = + s 1 , r, s ∈ ℝ resuelve, en un caso particular, si s = 6 y r = 2
  2   
 c   2   0  v) a CH 3CH 2 CH 3 + bO 2 → c C + d CO 2 + eCO + f H 2 O
d  0  1
Vea el ejercicio r.
q) a C2 H 4 + b HCl → c C2 H 6 + d C 5 H 5Cl + eC2 H 4 Cl
Ejercicios 2.3.2
 a  11   3
 b   2   2 Análisis dimensional
r  + s   , r, s ∈ ℝ
Solución: x =   =
 c 2  6  2  1 

x1 

−2 −1
d  2   0    
 x2  −1
  −1
 e  0   2 α1 α2
      a) Solución:  x3 = α1 −2 + α 2 −1 ,  F   µ  = π

       L2 ρv 2   ρvL 
 x4   1  0
r) a C3H 8 + bO 2 → c H 2 O + d C + eCO + f CO 2  
x5  0 1
     
Solución:
 a  1 2  1 Si α1 = 0 y α2 = 1 se obtiene el número adimensional de Euler
        F
 b 2 7  5 π1 = Eu = 2 2 .
  r  4 s  8 t  4 L ρv
x =  c = + + , r, s, t ∈ ℝ
3  3 6  0  3  0 
d       Si α1 = 0 y α2 = 0 se obtiene el inverso del número adimensional
 e 0 6 0 1 µ
        de Reynolds π 2 = = ∴  Eu = φ (Re)
 Re ρvl
f 0 0  3
s) a As2S5 + b HNO3 → c H 3AsO 4 + d H 2SO 4 + e H 2 O + f NO + g NO 2b) Solución:
 x1  −2  0  0  1
d H 2SO 4 + e H 2 O + f NO
+ g NO 2 x2         
   0 −1 −1  1
x
 3 − 1   0  0  1
 a  3  1 x  = α  1 + α  0 + α  0 + α  0  ,
 b  40   40   4 1  2  3  4 
      x5   0  1  0  0
 c r  6 s  2          
Solución: x = d = 40 15 + 40 5 , r, s ∈ ℝ x6   0  0  1  0
      
      −1
 e  −4   12  
x7    0  0  0  
      α1 α
 f   40   0   ∆P   l α2  ε α3  vdρ  4
 2        =π
 g  0  40  v ρ  d  d   µ 
264 Respuestas a los ejercicios

c) Solución: x1  −1  1 −1


x1  −1  0  1 x   1  0  3
    −  −   2      
x2   0  1  1 x3   0 −1 −1
x3   1  1  0 f) Solución:   = α1   + α 2   + α 3  
x
 4  1  0  0
       ,
x
 4 = α −1
1  + α 0
2  + α 3  0 x5   0  1  0
x  −1  0  0        
 5       x6   0  0  1
x6   0  1  0
x   0  0  1  Lkc 
α1 α2
 L3 g∆ρ A 
α3
 7        DAB ρ 
 D   µ   D µ  =π
AB  AB 
Dvρ
π1 = Re = , número de Reynolds
µ Lkc 1 DAB ρ L3 g∆ρ A
π1 = NuAB = π2 = = π3 =
µC p DAB Sc µ DAB µ
π 2 = Pr = , número de Prandtl
k
DAB ρ L3 g∆ρ A
Dh π 2 · π 3 = GrAB =
π 3 = Nu = , número de Stanton µ DAB µ
k
 x1   0  3 0   1 Unidad 3  Sistemas numéricos
x   1  −2  0   0
 2        
 x3   − 1  0 0   − 1 3.1  El sistema de números reales
x4   0  1 0   0
x          Ejercicios 3.1.5
d) Solución:  5  = α1  0 + α 2  0  + α 3 1  + α 4  0
x6 
x7 
 1
 0
 0
 2
0 
0 
 0
 0
Cotas superiores: x ∈; x ≥
a)  {
35
8 }
; cotas inferiores:

x          {x ∈; x ≤ −4} ; supremo: 35 ; ínfimo: −4.


8  0  0 1   0 8
x9   0  0 0   1 Cotas superiores: {x ∈; x ≥ 2} ; cotas inferiores:
b) 
         
{x ∈; x ≤ −2} ; supremo: 2; ínfimo: −2.
α1 α2
 µC p   L3 gρ 2  Lh  α 4
 k   µ 2  (β ∆T )α3  k
 =π c) Cotas superiores: {x ∈; x ≥ 4} ; cotas inferiores: no tiene;
supremo: 4; ínfimo no tiene.
µC p d) Cotas superiores: {x ∈; x ≥ 1} ; cotas inferiores:
3 2
π1 = Pr = , π 2 = L gρ , π 3 = β∆T, π 4 = Nu = Lh
k µ 2
k {x ∈; x ≤ 0} ; supremo: 1; ínfimo: 0.
β gρ 2 L3 ∆T 3.2  Números complejos
π 2π 3 = Gr = número de Grashof
µ2
Ejercicios 3.2.1
x1  −1 −1 −1  1. 18 − 12i
x   0  0 −1
 2        2. −32i
x3   1  1  0
e) Solución:   = α1   + α 2   + α 3   28
1 0  3. −15 − i
x
 4      0 3
x5   0  1  0
        Ejercicios 3.2.2
x6   0  0  1
 1. 12 + 4i
α1 α2 α3
 Dkc   Dv   µ   2. − 4 + 5i
 D   D   D ρ  =π
 3. 14 − 3i
AB AB AB
 4. 7 + 2i
Dv
Dkc Dv µ π D Dvρ  5. − 1 − 3i
π1 = Nu = , π2 = , π 3 = Sc = , 2 = Re = AB =
DAB DAB DAB ρ π 3 µ µ  6. −4 2 + 2 3i
DAB ρ  7. 11 − 3i
Dv
 8. 2 − 9i
µ π D Dvρ
, π 3 = Sc = , 2 = Re = AB =  9. − 12 + 9i
DAB ρ π 3 µ µ
DAB ρ 10. 4 − 4 3i
Respuestas a los ejercicios 265

Ejercicios 3.2.3 Ejercicios 3.2.5


Exprese en la forma a + bi el resultado de las siguientes opera- 3 1 3 1
a) w1 = − i ; w2 = − + i
ciones: 2 2 2 2
a) 87 − 26i
1 3 1 3
b) 22 + 26i b) w1 = − i; w2 = − + i
2 2 2 2
c) 32 + 22i
c) w1 = 1 + i; w2 = −1 − i
d) 1 − 31i
d) w1 = 4i; w2 = −4i
e) 7 + 22i
e) w1 = 1 − i; w2 = −1 + i
f) 11 − 16i
f) w1 = 2i; w2 = −2i
g) −140 − 43 6i
h) − 59 + 17i g) w1 = 5 − i; w2 = −5 + i
i) 21 − 20i h) w1 = 3 + i ; w2 = − 3 − i
j) −198 − 10i i) w1 = 2 − 2i ; w2 = −2 + 2i
60 59
k) − i j) w1 = 3 − 2i ; w2 = −3 + 2i
97 97
14 8 k) w1 = 2 − i ; w2 = −2 + i
l) − i l) w1 = 2 + i; w2 = −2 − i
13 13
7 1 m) w1 = 1 + 2i; w2 = −1 − 2i
m) − + i
10 10 n) w1 = 1 − 2i; w2 = −1 + 2i
1 5 1 5 1
n) ñ) w1 = 2+ 2 i ;  w2 = − 2 − 2i
2 2 2 2 2
8 10 15 o) w1 = 4 + i; w2 = −4 − i
ñ) + i
17 17
p) w1 = 3 + 7i; w2 = −3 − 7i
o) − 1 + 5 15 i
47 47 Ejercicios 3.2.6
24 36
p) − i a) z1 = 2 + i; z2 = 1 − i
13 13
b) z1 = 3 + 2i; z2 = −3
61 45
q) − + i c) z1 = 2 + i; z2 = 1 + 2i
34 34
1 1
1 5 d) z1 = − i ; z2 = −2
r) + i 2 2
2 8
s) ¡Ahhh! ( ) (
e) z1 = 1 + 2 i ; z2 = 1 − 2 i )
554 297
t) + i 2 3 2 3
145 145 f) x1 = − 2 i ; x2 = + 2i
115 10 10 10 10 10
u) + i
533 533 g) z1 = 3 + 2i ; z1 = 1 − i
31 38 h) z1 = 4 − 2i; z2 = 1 − i
v) − i
37 37 i) z1 = 1 + 2i; z2 = −3 + i
Ejercicios 3.2.4
j) Haga ξ = entonces la ecuación z6 + z3 + 1 = 0, se transfor-
z3,
ma en ξ + ξ + 1 = 0
2
a) (a, b) = (a, a − 2); a∈
1 3 1 3
ξ1 = z 3 = − + i ; ξ2 = z 3 = − −
(a , ± )
i
b) (a , b) = 7 − 6a − a ; a ∈ [−7, 1]
2 2 2 2 2

c) z = 3 + 5i Ejercicios 3.2.7
1 1
5 7 
d) z = ( 2 − 2 i ) +  − i  w a) z =
15
(37 − 39i ), w = − 15 (8 + 14i )
2 2 
3 47 1
e) Este problema no tiene solución; es decir, no existe z ∈ ℂ, b) z = − 3i , w = + i
10 15 3
(
tal que: z z − 3 z + z = i ) 1 1
1 c) z= (20 + 9i ), w=− (8 + i )
f) z=2− i 13 13
2
266 Respuestas a los ejercicios

d) z = 1 + i, w=1−i d) 256 cis 160º


e) z1 = 1 + 2i ,  z2 = 3 − i ,  z3 = 2 + 3i e) 32 cis 270º

 z1  f) 512 cis 180º


 −1   4   1 
  1     z g) 43 264 cis 134.8º
f)  z2  = 3  2  +  −3  i +  −2  3
 z3   0   0   1  h) 4 096 cis 0º
 
1
i) cis 296°
Ejercicios 3.2.8 625
j) 2 041 cis 160º
a) (−3, −3)
k) cis 60º
b) ( )
3,1 l) cis 60º
1
c) (0, 3) m) cis 60°
1 024
d) (0, −2)
n) 64 cis 180º
e) (1, 1)
Ejercicios 3.2.13
f) (−2, 2 3) Obtenga las raíces que se indican.
g) (1, − 3) a) 2 cis 24°; 2 cis 144°; 2 cis 264°
b) 6 cis 9°; 6 cis 129°; 6 cis 249°
Ejercicios 3.2.9
c) 2 cis 150°; 2 cis 330°
a) 7 2 (cos 45° + i sen 45°)
3 3 3
d) 2 cis 100°; 2 cis 220°; 2 cis 340°
b) 2 (cos 330° + i sen 330°)
e) 2 cis 120°; 2 cis 300°
c) 5 2 (cos 135° + i sen 135°)
f) cis 0° = 1; cis 120°; cis 240°
d) 2 (cos 300° + i sen 300°)
g) 2 cis 0° = 2; 2 cis 120°; 2 cis 240°
e) 2 5 (cos 26.6° + i sen 26.6°) h) cis 60°; cis 180°= − 1; cis 300°
f) 12 (cos 240° + i sen 240°) i) cis 30°; cis 150°; cis 270°= − i
g) 4(cos 180° + i sen 180°) j) 3
5 cis 17.7°; 3
5 cis 137.7°; 3
5 cis 257.7°

h) 8(cos 270° + i sen 270°) k) 2 4 2 cis 33.75°; 2 4 2 cis 123.75°; 2 4 2 cis 213.75°; 2 4 2 cis 303.75°

2 4 2 cis 33.75°; 2 4 2 cis 123.75°; 2 4 2 cis 213.75


°; 2 4 2 cis 303.75°
Ejercicios 3.2.10
a) 16 l) cis 0° = 1; cis 72°; cis 144°; cis 216°; cis 288°
b) −117 + 44i m) 3 cis 45°; 3 cis 105°; 3 cis 165°; 3 cis 225°; 3 cis 285°; 3 cis 345°
c) −119 + 120i
3 cis 45°; 3 cis 105°; 3 cis 165°; °;
3 cis 225 3 cis 285°; 3 cis 345°
Ejercicios 3.2.11 n) 10
512 cis 27°; 10
512 cis 99°; 10
512 cis 171°; 10
512 cis 243°; 10
512 cis 315°
a) 10 cis 100º
10
512 cis 27°; 10
512 cis 99°; 10
512 cis 171°; 10
°;
512 cis 243 10
512 cis 315°
b) 48 cis 42º
c) 60 cis 60º
Ejercicios 3.2.14
d) 8 2 cis 105°
sen z e zi − e − zi
Definiciones: tan z = = zi ;
e) 84 2 cis 75° cos z (
e + e − zi i )
f) 24 cis 150º

cot z =
cos z
= zi
(
e zi + e − zi i )
; sec z =
1
=
2
; csc z =
1
=
2i
Ejercicios 3.2.12
sen z e + e − zi cos z e zi + e − zi sen z e zi − e −
a) 64 cis 36º
b) 81 cis 72º
cot z =
cos z
= zi
(
e zi + e − zi i )
; sec z =
1
=
2
; csc z =
1
=
2i
c) 27 cis 150º sen z e + e − zi cos z e zi + e − zi sen z e zi − e − zi

Respuestas a los ejercicios 267

1.
( ) ( ) { }
2 2
2
− e zi − e − zi + e zi + e − zi 4 c) Raíces: 1, 1, − 2, − 2,
3
; f ( x ) = (x − 1)2 (x + 2)2 (2 x − 3)
tan z + 1 = = = sec 2 z 2
( ) (e )
2 − zi 2
e zi + e − zi zi
+e
d) Raíces: {i , − i , − 2, − 2}; f ( x ) = (x − 1) (x + 2) (2 x − 3)
2 2

2. cot 2 z + 1 =
(
− e +e zi − zi 2
) + (e zi
−e
=
− zi 2
−4) = csc 2 z {
e) Raíces: 1, − 2, 3, 5 , − 5 ; f (x) = (x − 1) (x + 2)(x − 3) x − 5 x + 5 } ( )( )
({ zi − zi 2
) zi − zi 2
}( )
, −e 2, 3, 5 , − 5 ;e f (+xe) = (x − 1) (x + 2)(x − 3) x − 5 x + 5
e 1− ( )( )
2 2
 1  1  1  1
{ }
2
1 1 1
    e2 + e2 + 2 f) Raíces: 1, 1, 1, − 2, − 2, − , − ; f (x) = (x − 1)3 (x + 2)2  x + 
2 2
3. sen2i =  e − e  = e + e − 2 ; cos2i =  e + e  = 2 2  2
 2 i  − 4  2  4
 1 
2
1
− 2 ; cos2i =  e + e  = e2 + e2 + 2 , por lo tanto: sen2 i + cos
2 5
3 2 { 
g) Raíces: 0, 0, − 1, − 1, 2, 3, − , ; f (x) = x (x + 1) (x − 2)(x − 3) x +   x − 
2 2

2 
3  }
5
2

{ }
2
2 5i = 1
2
   2  5
4  2  4 0, 0, − 1, − 1, 2, 3, − , ; f (x) = x (x + 1) (x − 2)(x − 3) x +   x − 
2 2
3 2 zi2 −2 zi  3  2
1+ cos 2z 2 + e 2 zi + e −2 zi 2 e +e +2 2 1+ cos 2z
4. = ; cos z = , por
por lo tanto : cos z = {1, 1, 1, − 1, − 1, 2, 2, 2, − 3, − 3}; f (x) = (x − 1)3 (x + 1)2 (x − 2)3 (x + 3)2
h) Raíces:
2 4 4 2
{1, 1, 1, − 1, − 1, 2, 2, 2, − 3, − 3}; f (x) = (x − 1)3 (x + 1)2 (x − 2)3 (x + 3)2
2 e 2 zi + e −2 zi + 2 1+ cos 2z
z= lo tanto : cos2 z =
, por tanto: i) Raíces:
4 2

{ }
2
1 1 1 1 2 1  1  1
5. sen2 z = −
e 2 zi
+e −2 zi
−2
=
(
2 − e 2 zi + e −2 zi ) = 1 − cos 2z −1, − 1 − , − , , ; f (x) = (x + 1) x +  x −  x − 
3 3 2 4  3  2  4
4 4 2
Ejercicio 4.2.4
Unidad 4 Polinomios y teoría de
ecuaciones
a) Si r = 3 − 2i es raíz; { 2}
raíces: 3 − 2i , 3 + 2i , − 2, 4, 1 ;

 1
4.2  Funciones polinomiales f (x) = (x − 3 + 2i )(x − 3 − 2i )(x + 2 )(x − 4) x − 
 2
Ejercicios 4.2.1 b) Si r = 2 + 3 es raíz;   raíces: {2 + 3 , 2 − 3, 1, 1, 1, 1 + 2i , 1 − 2i};

a) f(1) = −2;  f(2) = −14;  f(−3) = −346


( )( )
f (x) = x − 2 − 3 x − 2 + 3 (x − 1)3 (x − 1 − 2i )(x − 1 + 2i )
b) f(−1) = 5;  f(1) = 23;  f(2) = −1

c) f(−5) = −241;  f(4) = 128;  f(3) = 82


c) Si r = − 2 − i es raíz; {
raíces: −2 − i , − 2 + i , − 3, 2, −
3
2
; }
d) f(−3) = 151;  f(3) = 31;  f(−2) = 41;  f(1) = −1; f(−1) = 7  3
f (x) = (x + 2 + i )(x + 2 − i )(x + 3)(x − 2) x + 
 2
e) f (1) = −1;  f(−1) = 1;  f(2) = 4;  f(−2) = 8;  f(−3) = 53; 
f(−3) = 59; f(4) = 206 d) Si r = −1 + i es raíz doble;

Ejercicios 4.2.2 raíces: {−1 + i , − 1 + i , − 1 − i , − 1 − i , 1, 1, 1, − 1, − 1, − 2} ;

a) f(3) = 0 f (x) = (x + 1 − i )2 (x + 1 + i )2 (x − 1)3 (x + 1)2 (x + 2)


 2
b) f  −  = 0
 3
c) f(−2) = 0
e) Si r = 1 + 7 es raíz; { 5 1
raíces: 1 + 7 , 1 − 7 , 1, − 2, , ;
2 3 }
d) f(−i) = 0
( )( 
)
5  1
f (x) = x − 1 − 7 x − 1 + 7 (x − 1)(x + 2) x −   x − 
 2  3
e) f ( 5) = 0
 1
f) f  −  = 0
 2
f) Si r = 3 + 5 es raíz; {
raíces: 3 + 5 , 3 − 5 , 1,−1, 3,
1
2
; }
g) f(−3) = 0 ( )( )  1
f (x) = x − 3 − 5 x − 3 + 5 (x − 1)(x + 1)(x − 3) x − 
 2

Ejercicios 4.2.3

a) Raíces: {1, 2, 2, 3}; f ( x ) = (x − 1)(x − 2) (x − 3)


2 {
g) Si r = −5 + 2 es raíz; raíces: −5 + 2 , − 5 − 2 , 1 + 3i , 1 − 3i ; }
( )( )
b) Raíces: { 1 2
2 }
, − , 5 ; f ( x ) = (2 x − 1)(3x + 2)(x − 5)
3

f (x) = x + 5 − 2 x + 5 + 2 (x − 1 − 3i )(x − 1 + 3i )
268 Respuestas a los ejercicios

Ejercicios 4.2.5 Ejercicio 5.9.3

 5 29 5 29  a)
a) −1 − 2 i , − 1 + 2 i , − − ,− + 
 2 2 2 2   1   2   1   8 
2  + 1  + 3 = 
b) {−i, i, − 1 − 3 ,− 1 + 3 }  3   1   −1   3 

 3 13 3 13 1 3 1 3   1   2   1   3 
c) − − ,− + ,− − i, − + i 1
3  + 0  + 2 = 
 2 2 2 2 2 2 2 2     1   −1   1 

d) {−2 − 3 , − 2 + 3 , 1 − 2 , 1 + 2}  1   2   1   4 
−1  + 1  + 3 = 
e {−1 − 3 , − 1 + 3, 1 − 2 , 1 + 2}  3   1   −1   −5 

f ) {−2 − 2 2 , − 2 + 2 2 , − 1 − 3 i, − 1 + }
3i b)
 1   2   α + 2β   1 
Ejercicios 4.2.6  Ecuaciones de 3° grado α + β = = 
 1   1   α + β   3 

a) {3 4 + 3 2 − 2, 3 4 ω + 3 2 ω2 − 2, 3 4 ω2 + 3 2 ω − 2} α + 2β = 1
b) {3 2 − 3 4 − 1, 3 2 ω − 3 4 ω2 − 1, 3 2 ω2 − 3 4 ω − 1} α +β =3

c) {2 3 2 − 2 3 4 − 1, 2 3 2 ω − 2 3 4 ω2 − 1, 2 3 2 ω2 − 2 3 4 ω − 1}  1 12 12 12 1p1 1 1 21 2 12 1 11p10 10 0 5 5 5 


 1 11 11 31 33 0 0− 10− 1 −21 2 20 01 01 −12−2 −2 
d) {3 3 − 3 9, 3 3 ω − 3 9 ω2 , 3 3 ω2 − 3 9 ω}  1  sí es una combinación de los
El sistema tiene solución ∴
 3 
e) {3 25 + 3 5 + 2, 3 25 ω + 3 5 ω2 + 2, 3 25 ω2 + 3 5 ω + 2} vectores  1 1 ,  2 
 1 1   1 
f ) {3 2 − 3 4 − 1, 3 2 ω − 3 4 ω2 − 1, 3 2 ω2 − 3 4 ω − 1}
c) Sí, ya que el sistema tiene solución.

Unidad 5  Álgebra lineal  −1 −1 1 1 1 1 2 2 p 1 1−1 −1−1 −1 −2 −2  1p 10 02 2 3 3 


 2 2−1 −1 1 1 1 1 0 0 1 1 3 3 5 5  0 01 13 3 5 5 
5.9  Transformaciones
 −1 1 lineales
1 2  1 −1 −1 − 2  1 0 2 3 
  2 −1 1 1 0 1 3 5  0 1 3 5 
Ejercicio 5.9.1
d) No
4
4(1, 0) + 6(0, 1) = (4, 6) por lo tanto (4, 6) B =   1 1−2 −2 1  1p1  1−2 −2 1 1 
1 6 1 1−2 −2 −1 −1 0  0 0 0 −2 −2 

5(1, 1) − 1(1, − 1) = (4, 6) por lo tanto (4, 6) B =  5 Ejercicio 5.9.4


2 −1

1(1, 0) + 3(1, 2) = (4, 6) ( 4, 6 ) B =  1  y y
3  3

Ejercicio 5.9.2
x x
2
 
2 (1, 0, 0) + 0 (0, 1, 0) + 3(0, 0, 1) = (2, 0, 3)(2, 0, 3) B = 0
a   a) c) 
3
 1 y y
 
1(2, − 2, 1) + 2 (0, 1, − 1) + 4(0, 0, 1) = (2, 0, 3)(2, 0, 3) B = 2
b  
4
x x
 1
1(1, 1, 1) − 1(0, 1, 2) + 1(1, 0, 4) = (2, 0, 3)(2, 0, 3) B = −1
c  
 1 b) d) 
Respuestas a los ejercicios 269

y y Ejercicio 5.9.9
 x   1   2 
 y  =  −1  + t  1  , t ∈=ℝ
     
x x  z   2   3 

Ejercicio 5.9.10
e) i) 
 x   2   1   x   1   −1 
y y
 y  = 2  + t  2  , t ∈=ℝ o  y  = 0  + t  −2  , t ∈=ℝ
   
 z   3  
  2 
  z   1  
  −2 

(la ecuación de la recta no es única)


x x
Ejercicio 5.9.11
Usando la contrapuesta:
f) j) 
si los vectores P2 − P1 y P3 − P1 son paralelos, entonces P1, P2 y
y y P3 son colineales. P3 − P1 = α (P2 − P1 ), P3 = P1 + α (P2 − P1 ) ∴ P3
está en la línea que pasa por P1 y P2

Ejercicio 5.9.12
x x
P = (x, y, z ) = (−1, 1, 1) + α (5, 1, 3) + β (−2, 1, 1), α, β ∈ ℝ

g) k)  Ejercicio 5.9.13


P = (2, 1, 0) + α (1, − 2, 1) + β (−1, − 1, 2), α, β ∈ ℝ
y y

Ejercicio 5.9.14

x x x + 2y + 3z = 6

Ejercicio 5.9.15
h) l)  P = (1, 1, 2) + t (2, 1, 1)
x = 1 + 2t
Ejercicio 5.9.5
y = 1+ t
z = 2+t
1   2   −1
Gen   = Gen   ,   (Eje x)
 0   0   0 Ejercicio 5.9.16

 1   0    1   1   ( P − P0 ) · (a × b ) = 0
   
Gen  0  ,  1   = Gen  1  ,  −1   (Plano xy)
       
 0 0 
  0 0 

Ejercicio 5.9.17
 1
θ = arccos   = 60°
Ejercicio 5.9.6  2
a) Cierta L1 ∩ L2 = { } = ∅
b) Falsa
Ejercicio 5.9.18
c) Falsa
 2 
Ejercicio 5.9.7 θ = arccos   ≈ 61.87 º
 6 3
A, C
Ejercicio 5.9.19
Ejercicio 5.9.8
d (P , Q) = (−1,− 1,− 2) = 6
   0  0    0  0  1 
 1   1  ;  1 , 
  ,     1   1,  0   ;  0 ,  1 ,  1  Ejercicio 5.9.20
 −1  1               
 1   1  1   1 1 1  d(P, ℒ) = 0
270 Respuestas a los ejercicios

Ejercicio 5.9.21 Ejercicio 5.9.29


d(ℒ1, ℒ2) = 0 2

Ejercicio 5.9.30
Ejercicio 5.9.22
4 b, c
d (P, π ) =
11
Ejercicio 5.9.31
Ejercicio 5.9.23 ≈ 109.47°

5
d (π1, π 2 ) = Ejercicio 5.9.32
3
 0, 2 , 1 
 
Ejercicio 5.9.24  5 5

2 2; 2; 3 Ejercicio 5.9.33

Ejercicio 5.9.25 5
5
 π π π   π π π 
 , ,− ; −  , ,− 
 3 3 3  3 3 3 Ejercicio 5.9.34
 4 , − 4 , 4  +  2 , 7 , 5  = 2, 1, 3
Ejercicio 5.9.26     ( )
3 3 3 3 3 3
{(x, y, z); x − y − 2 z = 0}
Ejercicio 5.9.35
Ejercicio 5.9.27 6 6 6
cos α = ; cos β = − ; cos γ =
7 6 3 6
5 + 10 + 13 ;
2
Ejercicio 5.9.36
Ejercicio 5.9.28
¡Aaah!
6
Índice analítico
La n después de un número de página indica que la referencia se encuentra en las notas.

A B Cocientes de polinomios, 166


Absurdos, 6 Balanceo de Coeficiente de fricción, 187
Adimensionalización de las ecuaciones de reacciones químicas, 56 Coeficientes, 136
balance, 192 una reacción química general, 58 estequiométricos, 56
Álgebra Base β, 203 Cofactor(es)
abstracta, 199 Base, definición de, 203 de la matriz triangular, desarrollo por, 83
de funciones, 33 definición del, 82
moderna, 199 C desarrollo por, 82
Algoritmo, 173 Calculadora humana, 168 Colección de
de Euclides, 164 Cálculo conjuntos, 24
de la división, 139, 161 de la raíz real de una ecuación, 173 elementos, 20
sintética, 143 de las raíces de una ecuación, 170 índices, 24
Análisis dimensional, 71 de predicados, 2, 19 Combinación lineal
Ángulo entre de una raíz real por el método de bisección, de β, 202
dos planos, 220 176 de polinomios, 164
dos rectas, 219 de una raíz real por el método de Newton- definición de, 202
una recta y un plano, 220 Raphson, 179 vacía, 203, 204
vectores, 208 Cálculo numérico Complejos, suma de dos, 124
Ángulo formado por vectores, errores asociados a todo, 168 Complemento, 25
207, 208 origen de los errores asociados al, 168 de un conjunto, 21
Ángulos agudos, 12 Cálculo proposicional, 2, 15 con respecto a otro, 25
Anillo, 137n, 199 ampliado, 19 Componente, 211
asociativo, 199 conceptos del, 2 de una proyección sobre un vector, 211
con uno, 199 elementos del, 2 escalar, 213
conmutativo, 137n relaciones primitivas del, 2 de la fuerza, 213
con uno, 137, 160 Cálculos vectorial, 213
de los enteros gaussianos, 162 aritméticos que no pueden realizarse con de la fuerza, 213
de los polinomios, 162 precisión ilimitada, 169 Componentes básicos de la lógica matemática,
definición de, 199 numéricos, 7 2
euclidiano de los enteros, 162 resultados de, 7 Común denominador, 94
Anillos euclidianos, 162 Cambio de Concepto de
Aproximación de la solución, grado de, coordenadas polares a rectangulares en un argumentos, 8
168 complejo, 128 campo, 86
Argumento(s), 8 coordenadas rectangulares a polares en un conjugación, 114
concepto de, 8 complejo, 128 conjunto, 20
definición de, 8 Campo demostración, 7
no válido,8 algebraicamente cerrado, 154 error, 168
principal, 128 concepto de, 86 grado, 136
válido, 8 de los escalares, 201 método numérico, 168
Aritmética del conjunto Z de los números de los números complejos, 154 norma, 116, 206
enteros, 199 definición de, 199 Conceptos
Arreglo rectangular de elementos, K de los números complejos, 201 definidos, 2n
37 ordenado completo, 102 del cálculo proposicional, 2
Automorfismo de campos, 149 R de los números reales, 201 primitivos, 2n, 22
Automorfismos, 115 Cancelación de la teoría, 2
Axioma de de factores iguales, ley de, 160 Conclusión, la, 8
completez, 100, 101 para la adición, ley de, 89 Condición que define al conjunto solución, 40
especificación, 22, 23, 24 Canónico, 204 Condiciones del subespacio, 202
existencia de conjuntos, 22 Características Conectivos
extensión de conjuntos, 22 de la suma booleana, 29 del lenguaje, 2
las parejas de conjuntos, 24 del conjunto de los números reales, 110 lógicos, 2, 3
las partes, 25 del producto booleano, 29 binarios, 3
las uniones de conjuntos, 24 Cardinalidad de un conjunto, 25 Conjugación, 114
Axiomas, 2, 162 Categoría de dominio entero, 160 concepto de, 114
de campo, 86 Cero es constructible, 105 es autoinversa, 115
de Euclides, 205n Circunferencia, 204 es biyectiva, 115
de orden, 95 Clase positiva, 138 Conjugado de
equivalentes, 162 Clasificación de las funciones, 32 la suma, 114, 149
271
272 Índice analítico

un número complejo, 112 Decimales infinitos no periódicos, 103 Diagrama Venn-Euler, 28


un producto, 114, 149 Deducción de una fórmula, 11 Dibujo de la gráfica de la función, 32
Conjugado del conjugado Z, 149 Definición de Diferencia, 25
Conjunto, 22 ángulo entre dos rectas, 219 de conjuntos, 21
cardinalidad de un, 25 ángulo entre vectores, 208 Diferencias finitas, 169
complemento de un, 21 anillo, 199 Dimensión
concepto de, 20 argumento, 8 de V, 204
de conjuntos, 22 base, 203 del espacio generado por las columnas, 47
de enteros positivos, 98 campo, 199 del espacio generado por los renglones, 47
de fórmulas, 8 combinación lineal, 202 finita, 204
de los cuaternios reales, 154n conjunto ortogonal, 209 infinita de V, 204
de los enteros, 137n conjuntos, 209 Dimensiones básicas, 71
de números racionales, 142 contención, 21 Dirección
de puntos del plano, 26 distancia, 207 negativa, 106
de todos los números racionales, 99 divisor, 98 positiva, 106
ínfimo del, 101 dominio entero, 199 Distancia, definición de, 207
no vacío, 95 ecuación lineal, 47 Disyunción, 11
ortogonal, 209 espacios vectoriales, 201 Dividendo, 93
definición de, 209 factor, 98 División
ortonormal, 209 grupo abeliano, 198 de dos complejos, 124
finito, 209 homomorfismos, 200 sintética, 143, 146
potencia, 22, 25 igualdad de matrices, 42 algoritmo de la, 143
solución, 40, 54 independencia lineal, 203 Divisor, 93
condición que define al, 40 matriz, 41 definición de, 98
universal, 23 mayor que, 95 Doble
vacío, 23 menor que, 95 condición que da la igualdad, 22
espacio generado por el, 203 norma, 205 negación, 4, 11
Conjunto de los números reales, 95 número primo, 98 Dogmas en el espacio vectorial, 204
aumentados, 106 operación binaria, 198 Dominio
negativos, 95 permutación, 214 de la función, 32
positivos, 95 producto cartesiano, 27 de la variable independiente, 175
Conjuntos producto de matrices, 38 Dominio entero, 137n, 138, 160
contención de, 23 producto punto, 205 con uno, 199
definición de, 209 recta, 218 definición de, 199
diferencia de, 21 subespacio, 209 Dos sistemas de ecuaciones lineales, 50
familia de, 24 teoría axiomática, 16 Duplicación del cubo, 105
formas de expresar los, 21 transpuesta de una matriz, 43
iguales, 21 triple producto escalar, 217 E
intersección de, 21 valor absoluto, 99 Ecuación
unión de, 21 Definición del algebraica, 56
universales, 24 cofactor, 82 cálculo de la raíz real de una, 173
Consecuencias de la determinante, 81 rango de una matriz, 47 consistente, 40
Constantes de Van der Waals, 182 Delantero, 46 de 2º grado, 155
Construcción geométrica de un punto, 104 Demostración de Colebrook, 187, 188
Contención, 23 concepto de, 7 de estado de Van der Waals, 182, 193
de conjuntos, 22 de proposiciones en la teoría de conjuntos, de la recta que pasa por dos puntos,
definición de, 21 31 218
Contradominio, 136 Denominador, 93 del gas ideal, 182
de la función, 32 Denotación del plano, 220
Convergencia del método de iteración de de la determinante, 80 que pasa por tres puntos, 220
punto fijo, 172 de la recta, 218 equivalente, 120
Coordenada(s), 106 de la suma, 198 general de primer grado, 155
polares, 122 del conjunto vacío, 21 general de segundo grado, 117
Correspondencia del sistema de los números reales, 86 fórmula para resolver la, 117
biunívoca, 26 Desarrollo por cofactores, 82 inconsistente, 40
uno a uno, 103 de la matriz triangular, 83 normal de un plano, 220
Cota Descripción del método de Newton-Raphson, química, 56
inferior, 101 178 balanceada, 56
superior, 101 Desigualdad polinomial, 155
Cuadratura del círculo, 105 Cauchy-Schwarz-Bounyakowski, 206 raíz de, 141
Cuantificador del triángulo, 207 vectorial, 219
existencial, 19 Determinación de las raíces de una ecuación, de la recta, 219
universal, 19 170 Ecuación de una recta
Cuantificadores, 19 Determinante forma paramétrica de la, 219
Cuaternios reales, conjunto de los, 154n alternante, 80 forma simétrica de la, 219
cero de una matriz, 81 Ecuación lineal
D consecuencias de la, 81 con coeficientes reales, 36
Decimal que de la matriz, 39, 80 definición de, 47
no termina, 103 de la submatriz, 82 homogénea, 47
termina, 103 denotación de la, 80 no homogénea, 47
Índice analítico 273

Ecuaciones Expresión periódica infinita, 103 Geometrías no euclidianas, 205


canónicas de las cónicas, 204 Extensión de conjuntos, axioma de, 22 Grado, 162
con coeficientes enteros, 36 concepto de, 136
de balance, adimensionalización de las, 192 F de aproximación de la solución, 168
de cuarto grado, 155, 157 Factor de un polinomio, 137
de tercer grado, 155 de compresibilidad, 185 Grados de libertad, 51
diofantinas, 36 de fricción, 187 Gráfica, 106
lineales, 36 energético, 56 de la función, 32
paramétricas, 219 Factores del método de Newton-Raphson,
polinomiales de grado, 155 en la formulación del problema, 168 178
Eje en la obtención de los datos, 169 Grupo, 198
imaginario, 122 no triviales, 98 adimensional, 76
real, 122 triviales, 98 conmutativo, 160
Ejemplos de grupos, 198 Factorización G, 198
Elemento, 22 del polinomio, 157 simétrico de orden n, 199
principal, 46 prima, 99 Grupo abeliano, 105, 137n, 160, 198, 199
Elementos Familia de conjuntos, 24 definición de, 198
arreglo rectangular de, 37 intersección de la, 25 G, 198
de la matriz del sistema, 39 unión de la, 24 Grupos adimensionales básicos, 75
del cálculo proposicional, 2 Familias de abiertos, 207
idénticos, 86 Forma H
inversos, 87 característica de la ecuación de estado Hipérbolas, 204
Eliminación gaussiana, 52 de Van der Waals, 194 Hipótesis, 8
Elipses, 204 matricial de un sistema de ecuaciones, 38 Homomorfismo, 200
Enteros única, 203 biyectivo, 200
anillo euclidiano de los, 162 paramétrica de la ecuación de una recta, de anillos, 141
conjunto de los, 137n 219 definición de, 200
gaussianos, 162 simétrica, 219 inyectivo, 200
invertibles, 99 de la ecuación de una recta, 219 suprayectivo, 200
positivos, conjunto de, 98 Formas de expresar los conjuntos, 21
Epimorfismo, 200 Fórmula I
Equivalencia de dos sistemas de ecuaciones de Newton-Raphson, 184 Idéntico
lineales, 50 deducción de una, 11 aditivo, 87
Equivocaciones en la realización de las del chicharronero, 155, 157 multiplicativo, 87
operaciones, 169 para resolver la ecuación general de i-ésimo renglón de una matriz, 45
Error segundo grado, 117 Igualdad
absoluto, 169, 173 Formulación del problema, factores en la, 168 de matrices, definición de, 42
aproximado, 174 Fórmulas de Cardan, 155 de polinomios, 141
causado por algún tipo de aproximación, Fuentes principales del error, 169 doble condición que da la, 22
169 Función, 26, 32 entre funciones polinomiales, 141
computacional, 169 biyectiva, 32 entre polinomios, 141
concepto de, 168 compuesta, 32 Implicación transitiva, 11
de redondeo, 169 continua, 175 Incógnita, 136
por truncamiento, 169 contradominio de la, 32 Inconsistencia simple, 14n
relativo, 169 determinante, 215 Independencia lineal, 203
Errores asociados al cálculo numérico, 168 distancia, 207 definición de, 203
origen de los, 168 euclidiana, 162 Indeterminada, 136
Escalar, 37 inversa, 32 Ínfimo del conjunto, 101
Escalares, 201 de la exponencial, 131 Infinitésimo positivo, 102
campo de los, 201 inyectiva, 114 Inmersión, 99, 137, 200
Espacio kernel de una, 158 de una estructura en otra, 114
generado por el conjunto vacío, 203 logaritmo natural, 131 Intersección de
métrico, 207 norma, 116 conjuntos, 21
normado, 206 real, 32 la familia de conjuntos, 25
Espacio vectorial, 201 de variable real, 32 Intervalo
cero, 201 suprayectiva, 32 abierto, 106
complejo, 201 valor absoluto, 160 cerrado, 106, 175
de dimensión finita, 201, 204 Funciones semiabierto, 106
de dimensión infinita, 204 clasificación de las, 32 Inverso
definición de, 201 inyectivas, 32 aditivo, 87, 90
dogmas en el, 204 polinomiales, 136, 140 de todo número constructible,
real, 201 racionales, 166 105
trivial, 201 reales, 33 multiplicativo, 87, 90
Esquema del signo de las permutaciones, 214 de variable real, 33 de un número complejo, 114
Esquemas de las tautologías básicas, 6 trigonométricas, propiedades de, 132 Isomorfismo, 200, 204
Existencia de espacios vectoriales, 205
de conjuntos, axioma de, 22 G Isotermas, 194
de inversos, 198 Geometría de
del cociente y del residuo, 139 Euclides, 205, 205n J
del neutro, 198 Minkowski, 206n Jerarquía de operaciones, 87
274 Índice analítico

K de completar cuadrados, 155 primo, 98


Kernel de una función, 158 de Ferrari, 155 definición de, 98
de Gauss, 52 racional, 99
L de Gauss-Jordan, 53, 57 Número(s) complejo(s), 110, 136, 148
Ley de de inducción matemática, 87 campo de los, 154
cancelación de factores iguales, 160 de iteración de punto fijo, 171, 173 campo K de los, 201
conservación de la materia, 58 convergencia del, 172 conjugado de un, 112
la cancelación para la adición, 89 de la división, 142 inverso multiplicativo de un, 114
Lavoisier de conservación de la materia, 56 sintética, 105 parte imaginaria de un, 114
los cosenos, 208 de las fracciones parciales, 141 parte real de un, 114
tricotomía, 95 de Newton-Raphson, 169, 178, 190 representación geométrica de los, 124
Ley del reemplazo, 10n para aproximar raíces cuadradas, 181 Números
Leyes de Rayleigh, 72 constructibles, 105
asociativas, 86 directo para determinar la validez de un enteros, aritmética del conjunto Z de los,
conmutativas, 86 argumento, 8 199
distributivas, 86 general para resolver ecuaciones de cuarto inconstructibles, 105
Leyes de grado, 157 irracionales, 99, 104
De Morgan, 18 indirecto para determinar la validez de un racionales, conjunto de, 142
los signos, 97 argumento, 8 Números reales, 136
Línea coordenada, 106 numérico, concepto de, 168 aumentados, conjunto de los, 106
Logaritmo complejo, 131 Métodos campo R de los, 201
Lógica analíticos clásicos, 168 características del conjunto de los, 110
binaria, 2 numéricos, 168 denotación del sistema de los, 86
de la vida, 2 para el cálculo de las raíces de una negativos, conjunto de los, 95
proposicional, 10 ecuación, 171 positivos, conjunto de los, 95
reglas válidas de inferencia de la, 10 para determinar la validez de un
Lógica matemática, 2 argumento, 8 O
componentes básicos de la, 2 Métrica, 207 Objetivos centrales de la lógica matemática, 2
objetivos centrales de la, 2 Modelo de la geometría de Euclides, 205 Objeto del cálculo
razonamientos válidos de la, 2 Modelos de aproximaciones sucesivas, 171 de las raíces de una ecuación, 170
Modus ponendo ponens, 10 proposicional, 15
M Modus ponens, 10, 11 Objetos primitivos, 86
Matemática aplicada, 168 Modus tollendo ponens. Véase Regla de Operación
Matrices, 37 disyunción binaria, 198
equivalentes por renglones, 46 Monomorfismo, 200 definición de, 198
iguales, 42 de anillos, 138 de división en los números reales, 93
Matriz Multiplicación de sustracción en los números reales, 92
antisimétrica, 44 asociativa, 137 Operaciones
aumentada, 38, 49 conmutativa, 137 conjuntistas, 24
cero, 53 de dos complejos, 124 de las matrices, 37
cuadrada, 42 de matrices, 37, 45 elementales en los renglones de una matriz,
valor del determinante de una, 82 de polinomios, 136 46
de coeficientes, 38, 49 de un renglón por un escalar distinto de jerarquía de, 87
definición de, 41 cero, 46 racionales, 155
definición del rango de una, 47 de una matriz por un escalar, 44 Operaciones binarias, 137
del sistema, 38 Múltiplo, 98 en A, 200
elementos de la, 39 en B, 200
determinante cero de una, 81 N Orden
determinante de la, 39, 80 Negación de una tautología, 6 canónico en el conjunto de los números
diagonal, 42 Negativo de un número, 87 reales, 110
simétrica, 43 Neutro de la suma, 198 de los índices, 27
Matriz escalonada Norma inducido, 27
bien bonito, 53 concepto de, 116, 206 usual de los números naturales, 204
por renglones, 45 de un número complejo, 116 Origen, 103
reducida, 46, 53 definición de, 205 de los errores asociados al cálculo
Matriz triangular Norma euclidiana, 205 numérico, 168
desarrollo por cofactores de la, 83 propiedades de la, 206
inferior, 43 teorema de la, 206 P
superior, 42, 83 Notación Padre del álgebra, 36
Máximo común divisor, 164 del determinante, 39 Parábolas verticales, 204
Mayor cota inferior, 101 indicial, 214 Paralelepípedo, 217
Menor Numerador, 93 Paralelismo, 209
cota superior, 101 Número Paralelogramo, 215
entero positivo, 98 constructible, inverso aditivo de todo, 105 Pareja ordenada, 25
ij, 82 de parámetros de la solución, 51. Véase Parejas de
Método también Grados de libertad conjuntos, axioma de las, 24
axiomático-deductivo, 2 de Reynolds Re, 187 proposiciones equivalentes, 6
corto, 61 imaginario, 110 Parte
de bisección, 175 irreducible, 98 imaginaria de un número complejo, 114
de Buckingham, 72 negativo de un, 87 real de un número complejo, 114
Índice analítico 275

Permutación, 214 Propiedades racionales, 153


definición de, 214 adicionales del producto vectorial, 216 de una ecuación algebraica, 170
Permutaciones, 199 teorema de las, 216 simples, 142
esquema del signo de las, 214 algebraicas de los polinomios, 141 Raíces de una ecuación
Pertenencia, 23 básicas de la exponencial, 128 cálculo de las, 170
Pivote, 46 de campo, 86 determinación de las, 170
Plano(s) de funciones trigonométricas, 132 Raíz
cartesiano, 26 de la adición, 86 de ecuación polinomial, 141
ortogonales, 220 de la conjugación, 114 n-ésima de un número, 102
Polinomio de la determinante, 80 racional de la ecuación de coeficientes
cero, 137 de la división, 94 enteros, 170
constante, 141 de la multiplicación, 86 “surd”, 149
degradado, 137 de la norma euclidiana, 206 Raíz cuadrada
factorización del, 157 de la proyección de un vector sobre otro del discriminante, 155
grado de un, 137 vector, 211 no negativa, 205
mónico, 142, 155 de la suma de números enteros, 159 Raíz real de una ecuación, cálculo de la, 173
Polinomios, 136 de las funciones polinomiales, 141 Rango de
anillo de los, 162 de las raíces complejas, 148 la función, 32
cocientes de, 166 de los determinantes, 214 la matriz aumentada, 50
combinación lineal de, 164 de orden, 95 la matriz del sistema, 50
con coeficientes enteros, 142 del campo, 200 una matriz, 47
de grado cero, 137, 166 del grupo abeliano G, 198 definición del, 47
mónicos, 157n del símbolo de permutación, 214 Razonamiento por medio de argumentos, 8
monificados, 157n del símbolo ⊢–, 15 Razonamientos válidos de la lógica
reales irreducibles, 141 esenciales de la implicación, 11 matemática, 2
Postulados de una teoría, 2n Propiedades del producto Reacción
Premisas, 8 cartesiano, 27 de combustión, 55
Primera coordenada, 26 de los números enteros, 159 química, 55
Primos relativos, 164 del producto punto, 205 Recíproco de un número, 87
Principio Proposición, 3 Recta, 218
de sustitución, 87 abierta, 23 denotación de la, 218
del buen orden, 161, 162 completa, 4 teoremas de la, 218
Problemas clásicos de la geometría, 105 simple, 3 Rectas
Procedimiento Proposiciones, 2 ortogonales, 219
de búsqueda de una raíz real de la ecuación, ciertas por vacuidad, 4 paralelas, 219
175 compuestas, 3 Reducción al absurdo (RAA), 23, 90
para dividir un polinomio, 145 equivalentes, 6 regla de, 10
Procesos deductivos simples, 12 parejas de, 6 teorema de, 12, 13, 14
Producto, 199 falsas, 2 Reflexión de los puntos del plano, 148
booleano, 28 iguales, 2 Regla de
características del, 29 que siempre son falsas, 6 Cramer, 112
conjugado de un, 114, 149 simbolismo matemático de las, 3 disyunción, 10
cruz, 213 verdaderas, 2 formación del conjunto, 21
de factores irreducibles, 141 Proposiciones simples, 2 los signos, 92, 200
de matrices, 38, 45 diferentes, 2 reducción al absurdo, 10
definición de, 38 no especificadas, 2 Sarrus, 84
generalizado, 200 Proyección, 211 Regla del silogismo hipotético, 10
interior, 205 de un vector sobre otro vector, 211 Reglas
definido en forma positiva, 205 ortogonal de un vector sobre otro, derivadas, 11
Producto cartesiano, 22 212 válidas de inferencia, 10, 11
de conjuntos, 26 Proyecciones, 210 de la lógica proposicional, 10
definición de, 27 de la fuerza, 210 Relación
Producto punto, 205 Punto(s) de orden lineal, 95
bilineal, 205 construcción geométrica de un, 104 de un conjunto en otro, 26
de vectores, 38 crítico, 194 primitiva, 22
definición de, 205 del plano, conjunto de, 26 Relaciones
propiedad distributiva del, 211 fijo, convergencia del método de iteración definidas, 2n
teorema del, 205 de, 172 en la matemática, 26
Producto vectorial, 213 medio del intervalo como valor de la raíz, primitivas, 2n
propiedades adicionales del, 216 175 del cálculo proposicional, 2
teorema de las propiedades adicionales del, Renglones no cero de una matriz, 47
216 R Repetición de índices, 214
Productos notables, 10 Raíces Representación
Propiedad complejas, propiedades de las, 148 axiomática de las propiedades de los
arquimediana de los números reales, 102 de igual multiplicidad, 149 números reales, 103
asociativa de la multiplicación, 198 de la ecuación, 171 de cortaduras de Dedekind de las
conmutativa de la multiplicación, 198 de las ecuaciones polinomiales por medio propiedades de los números reales, 103
de cerradura bajo sumas y productos, de fórmulas, 142 de una matriz, 37
95 de multiplicidad, 142 geométrica de los números complejos,
distributiva del producto punto, 211 positivas, 151 124
276 Índice analítico

gráfica del conjunto de todas las parejas de de polinomios, 136 de números, 162
números reales, 26 denotación de la, 198 general de la química, 58
Representaciones formal, 202 Teoría axiomática
de los números reales, 102 Sumas con negación, 14n
decimales de números reales, 103 de polinomios, 139 definición de, 16
Residuo parcial, 143 de distinto grado, 136 intuitiva, 15
Resultados de cálculos numéricos, 7 formales, 136, 139 Teorías
Resultante, 210 Supremo del conjunto, 101 axiomáticas, 10
Rugosidad relativa, 187 Sustitución científicas, 2
de un proceso infinito por una humanísticas, 2
S aproximación finita, 169 Tipos de
Segmento lineal de longitud unitaria, 103 hacia atrás, 53 anillo, 199
Segunda coordenada, 26 matrices, 42
Segundo dividendo, 143 T mediciones, 71
Signo de agrupación, 5 Tabla de Topología, 207
Silogismo hipotético (SH), 11 pertenencia de los elementos de los Transformaciones lineales, 205, 221
regla del, 10 conjuntos, 28 Transpuesta de una matriz, definición de, 43
Simbolismo matemático de las proposiciones, verdad del conectivo no, 3 Trayectorias isotermas, 194
3 Tablas de verdad, 2, 3, 31 Triángulo rectángulo, 12
Símbolo de básicas, 4 Trinomio cuadrado perfecto, 155, 159
infinito, 106 de los conectivos lógicos, 18 Triple producto escalar, 217
permutación, 214 iguales, 6 definición de, 217
Símbolos de las unidades de medida, 71 Tautología(s), 6, 8 Trisección del ángulo, 105
Simplificación de la hipótesis, 12 básicas, 11
Sistema esquemas de las, 6 U
coordenado de mano derecha, 214 compuesta con tres fórmulas, 18 Unicidad del cociente y del residuo, 139
de coordenadas, 106 Teorema Único inverso, 198
de dos ecuaciones, 38 de Bolzano, 170 Unidad de medida, 71
con coeficientes reales, 38 de De Moivre, 125, 126 en el Sistema Internacional
de ecuaciones, forma matricial de un, 38 de Dedekind, 100 de Unidades, 71
de los números reales, 86 de distancia, 207 Unidades derivadas, 71
denotación del, 86 de la combinación lineal,202 Unión de
Sistema de ecuaciones lineales, 47 de la deducción, 12, 13 conjuntos, 21
homogéneo, 48 de la norma euclidiana, 206 la familia de conjuntos, 24
no homogéneo, 48 de la suma de polinomios,137 Utilización de métodos matemáticos para
Sistema Internacional de Unidades, 71 de Pitágoras, 7, 12, 206 obtener soluciones, 71
Sistemas de ecuaciones, 36 de reducción al absurdo, 12, 13, 14
Solución de subespacio, 210 V
cero de un sistema de ecuaciones, 48 del algoritmo de la división, 139 Validez de los teoremas, 13
del sistema de ecuaciones lineales, 49 del anillo conmutativo, 138 Valor
escrita en forma vectorial paramétrica, 54 del factor, 142 absoluto, 162
expresada en forma paramétrica, 54 del producto punto, 205 definición de, 99
general de la ecuación, 36 del residuo, 141, 142 de verdad de una proposición
particular, 36 del valor intermedio (TVI), 175 compuesta, 4
trivial de un sistema de ecuaciones, 48 del valor medio para derivadas, 172 del determinante de una matriz cuadrada,
vectorial, 67 fundamental de la aritmética (TFA), 82
Soluciones particulares, 54 166, 99 del error, 173
Subespacio aplicado a los polinomios, 166 Valores de verdad, 2
condiciones del, 202 fundamental del álgebra, 117, 154 de las proposiciones compuestas, 3
de un espacio vectorial real de dimensión Teorema de las propiedades Vaporizador flash, 189
finita, 209 adicionales del producto vectorial, 216 Variable, 136
de V, 212 de las raíces complejas, 149 delantera, 40
generado por β, 202 Teoremas, 2 independiente, dominio de la, 175
definición de, 209 básicos de la teoría de ecuaciones, 141 libre asociada, 53
teorema de, 210 básicos de los números reales, 89 real, 32
Submatriz, determinante de la, 82 de la geometría, 7 Variables, 2
Sucesión, 136 de la recta, 218 libres, 40
casi nula, 136 de las tablas de verdad de los conectivos proposicionales, 2
Suma, 198 lógicos, 18 Vector
asociativa, 12, 136 de los vectores que generan un plano, 219 componente de una proyección sobre un,
booleana, 28 del álgebra, 7 211
características de la, 29 Teoría de coordenadas, 205
conjugado de la, 114, 149 de anillos, 199 sobre otro vector, proyección de un, 211
conmutativa, 136 de campos, 199 Vectores, 201
de constructibles, 105 de conjuntos, 7, 31 ángulo formado por, 207, 208
de dos complejos, 124 de ecuaciones, 141 no paralelos, 220
de dos vectores, 210 de Galois, 155 producto punto de, 38
de imágenes, 136 de grupos, 199 que generan un plano, teorema de los, 219
de los dos vectores ortogonales, 210 de la función determinante, 80n Versores, 209
de matrices, 44 de los sistemas de ecuaciones lineales, 72 Volumen del paralelepípedo, 218

Das könnte Ihnen auch gefallen