Capítulo 2

2.
Ecuaciones Algebraicas Lineales
2.1 Introducción
Se ha estimado que un 75% de los problemas de ingeniería se presenta, en alguna
etapa del trabajo, la solución de un sistema de ecuaciones lineales:
a11 x1 a12 x 2 a13 x 3 a1n x n b1
a 21 x1 a 22 x 2 a 23 x 3 a 2 n x n b2
a 31 x1 a 32 x 2 a 33 x3 a 3n x n b3 (2.1a)

a n1 x1 a n 2 x 2 a n3 x 3 a nn x n bn
o bien: Ax b
a a a a x b
11 12 13 1n 1 1
x
 
a a 22 a 23 a 2n 2 b
 21  2
a 31 a 32 a 33 a 3n x3 b3  (2.1b)
   
a n1 an2 a n3 a nn  x n  bn
En las secciones siguientes se supone que el sistema de ecuaciones tiene solución

única, es decir, que det( A) 0 .
La solución de sistemas de ecuaciones es un buen ejemplo de las diferencias entre las

matemáticas “clásicas” y los métodos numéricos modernos. Así, la Regla de Cramer:
a a12 b1 a1n 
 11 
a 21 a 22 b2 a 2n

det a 31 a 32 b3 a 3n


a n1 an2 bn a nn
xj
a a12 a1 j a1n  (2.2)
 11 
a 21 a 22 a2 j a 2n 

det a 31 a 32 a3 j a 3n


 
a n1 an2 a nj a nn
si bien proporciona fórmulas explícitas es tremendamente ineficiente cuando se trata de

resolver sistemas con más de 3 incógnitas (excepto para casos muy especiales de la
matriz de coeficientes).
H. Scaletti - Métodos Numéricos: Ecuaciones Algebraicas Lineales 2-1
Muchos métodos frecuentemente utilizados en ingeniería, como por ejemplo los métodos
de elementos finitos para la solución de ecuaciones en derivadas parciales, resultan en
el planteamiento de grandes sistemas de ecuaciones lineales. El costo de análisis y en
muchos casos la factibilidad de un modelo suficientemente preciso dependen en gran
medida de la forma de almacenamiento de las ecuaciones y de la eficiencia del algoritmo
utilizado en su solución.

2.2 Métodos Directos para la Solución
de Sistemas de Ecuaciones Lineales
Este acápite considera métodos que, de no haber errores de redondeo, producen la
solución exacta en un número finito de pasos. Para sistemas Ax = b, en los que A es de
alta densidad, los métodos directos son en general los más eficientes (para las
computadoras actualmente utilizadas). Sin embargo, cuando un gran número de
T
elementos de A son cero, y en especial cuando A es definida positiva ( x Ax 0 para
cualquier x 0 ), puede ser más conveniente utilizar un método iterativo en que se
obtiene una secuencia de soluciones aproximadas que convergen a la solución exacta.
2.2.1. Sistemas Triangulares
La solución de sistemas de ecuaciones lineales es particularmente simple cuando la

matriz de coeficientes es triangular. Por ejemplo, considérese un sistema Ux = b en el
que U es triangular superior:
u11 x1 u12 x 2 u13 x 3 u1n x n u 22 x 2 b1
u 23 x 3 u 2 n x n u 33 x 3 b2
u 3n x n b3
(2.3)
u n 1,n 1 x n 1 u nn x n bn
u nn x n bn
Si U es no singular ( u ii 0 para todo i), las incógnitas pueden evaluarse en el orden: n,

n-1, n-2, n-3, ... 2, 1:
nb
xn (2.4a)
u
nn
n
xi 1 bi u ik x k  (2.4b)
u
 
ii  k i1
Este proceso se denomina “sustitución inversa”. Análogamente, para un sistema Lx = b,

en el que L es una matriz triangular inferior no singular ( l ii 0 para todo i), puede
utilizarse una sustitución directa o “reducción”:
b1
x1 (2.5a)
l11
i1
xi  bi l ik x k 
1
(2.5b)
l
 
ii  k1
En ambos casos, la solución del sistema requiere n divisiones y

1
n n 1 operaciones
2
de multiplicación y suma (casi lo mismo que para multiplicar una matriz triangular por un
vector).
2.2.2 Método de Gauss

Éste es el más importante de los métodos directos para la solución de sistemas de
ecuaciones lineales. La idea básica está en combinar las distintas ecuaciones para ir

eliminando incógnitas en forma sistemática y obtener finalmente un sistema triangular,
fácil de resolver. Considérese el sistema de orden n:
a (1) x a (1) x a (1) x a (1) x b (1)

11 1 12 2 13 3 1n n 1
a (1) x a (1) x a (1) x a (1) x b (1)

21 1 22 2 23 3 2n n 2
a (1) x a (1) x a (1) x a (1) x b (1) (2.6)

31 1 32 2 33 3 3n n 3
a (1) x a (1) x a (1) x a (1) x b (1)

n1 1 n2 2 n3 3 nn n n
o en forma compacta: Ax = b. En lo que sigue se supone que A es no singular.

Supóngase también que a11 0 . Puede entonces eliminarse x1 de la ecuación i si de
ésta se resta la ecuación 1 multiplicada por:

(1)
a
i1
li1 (1) (2.7a)
a11
Con ello se obtiene:
a (1) x a (1) x a (1) x a (1) x b (1)

11 1 12 2 13 3 1n n 1
( 2) ( 2) ( 2) ( 2)
a 22 x 2 a 23x 3 a x2n n b2
( 2)
a 32 x 2 a ( 2)33x 3 a ( 2)
x3n n b (32) (2.7b)
a n( 2)2 x 2 a ( 2)n3x 3
a ( 2) xnn n b ( 2)n
donde
a ( 2) a (1) l a (1)
ij ij i1 1j
(2.7c)
( 2) (1) (1)
b b l b
i i i1 1
En forma similar, puede eliminarse x2 de las ecuaciones i = 3,4,..n restando de la

ecuación i la ecuación 2 multiplicada por:
( 2)
ia2
li 2 ( 2)
a 22
y así sucesivamente hasta obtener el sistema triangular:
a (1) x a (1) x a (1) x a (1) x b (1)

11 1 12 2 13 3 1n n 1
( 2) ( 2) ( 2) ( 2)
a 22 x 2 a 23x 3 a x2n n b2
(3)
a 33 x3 a (3) x3n n b (3)3 (2.8)
o n notación matricial: Ux = b.
e
( n)
nn n ab ( n) x n
(1) ( 2) (3) ( n 1)
Los elementos
a11 , a 22 , a 33 a n 1,n 1 que se usan como divisores en esta reducción
se llaman “pivotes”. El proceso – tal como ha sido planteado hasta el momento – falla si
alguno de estos es cero. Esto en general no ocurre si la matriz A tiene diagonal
dominante (es decir, si a ii a ij ) o si A es simétrica (AT = A) y definida positiva
(vTAv > 0 para v arbitrario). ji

El siguiente ejemplo ilustra el proceso:
1 2 3 4 x1  2
(1) 1 4 9 16 x 2  10

(1) 1 8 27 64 x 3  44
 4
(1)  1 16 81 256 x 190
Los números indicados a la izquierda (entre paréntesis) son los factores li1 por los que es
necesario multiplicar la ecuación 1 antes de restarla de la ecuación i, para lograr el
objetivo de eliminar x1 de la segunda y las siguientes ecuaciones.
1 2 3 4 x1  2
0 2 6 12 x 2  8

(3) 0 6 24 60 x 3  42
 4
(7)  0 14 78 252 x 188
Análogamente:
1 2 3 4 x1  2
0 2 6 12 x 2  8

0 0 6 24 x 3  18
0
0  4
(6)  36 168 x 132
1 2 3 4 x1  2

0 2 6 12 x 2  8

0 0 6 24 x 3  18
0  4
 0 0
24 x 24
finalmente:
24 x 4 24 x4 1
6 x3 24 x 4 18 x3 1
2 x 2 6 x3 12 x 4 8 x2 1
x1 2 x 2 3 x3 4 x 4 2 x1 1
Para estimar el esfuerzo de cómputo es habitual referirse al número de "operaciones"

requeridas. La costumbre es contar como una operación a la combinación de una suma
(o resta, o simplemente una copia) con una multiplicación (o división). Esta práctica
proviene de las épocas en que el tiempo requerido para efectuar una multiplicación o una
división era un orden de magnitud mayor que el necesario para una suma o una resta,
pudiendo despreciarse estas últimas. La reducción de la matriz de coeficientes requiere
3
de un número de operaciones de orden 1 3 n . La reducción del segundo miembro y la
2
sustitución inversa requieren aproximadamente n operaciones. Si se tuvieran varios
sistemas de ecuaciones con la misma matriz de coeficientes: Ax = b1, Ay = b2, ... sólo
se requeriría efectuar la reducción de A una vez, por lo que el número de operaciones
3 3 2
sería siempre aproximadamente 1 3 n . Más precisamente, se hacen 1 n n 1 n
3 1 2 5
3n
1
operaciones de multiplicación y división (y 2n 6n sumas o restas) para
resolver un sistema de n ecuaciones lineales, pero si n es grande (que es el caso en el

que la estimación tiene interés) sólo el primer término es importante.
3 3

(i )
El proceso antes descrito falla cuando se presenta un pivote, a ii , igual a cero. Un
ejemplo simple de tal situación es el siguiente:
1 1 1 x1  1

1 1 2 x2 2

1 2 2 x3  1
La matriz de coeficientes no es singular y el sistema tiene una solución única

T
x 1 1 1 . Sin embargo, después del primer paso (efectuado en el orden indicado
anteriormente), se obtiene:
1 1 1 x1  1

0 0 1 x2 1

0 1 1 x3  0
( 2)
y siendo a 22 0 , no es posible proseguir como habitualmente. La solución es en este
(i )
caso obvia: intercambiar las ecuaciones (filas) 2 y 3. En general, si a ii 0 , algún otro
elemento de la misma columna, a (iji) , debe ser distinto de cero (lo contrario implicaría
una dependencia lineal de por lo menos dos de las ecuaciones, es decir la singularidad
de A). Intercambiando las filas j e i puede entonces continuarse la reducción. Dados los
(i )
elementos a ji de la columna i, es conveniente escoger como pivote aquel de máximo
valor absoluto, puesto que el uso de pivotes pequeños introduce fuertes errores en la
solución. El ejemplo siguiente es ilustrativo:
 11
3 10 1  x1  7
 

1 1 x2  9
Trabajando con 10 cifras significativas se obtiene:

3.000 000 000 10 11 1 x 7
 1
 3.333333333 1010 x 2  7 3.333333333 1010

 0 
de donde: x2 7
x1 0
La solución correcta es, sin embargo, x1 2 . Es fácil comprobar que no se presenta
este problema si se evita el pivote pequeño intercambiando previamente las ecuaciones:

1 1 x1  9
11
3 10  1 x2  7
El intercambio de filas al que se ha hecho referencia se denomina “intercambio parcial”.

Alternativamente, puede pensarse en un “intercambio completo”, en que se selecciona el
siguiente pivote como el elemento de máximo valor absoluto entre todos los elementos
de la sub matriz por reducirse. Se intercambian entonces filas (ecuaciones) y columnas
(incógnitas) para continuar el proceso como se ha descrito.
El intercambio parcial es generalmente satisfactorio, desde el punto de vista de la

estabilidad numérica, y requiere bastante menos trabajo que el proceso con intercambio
total.

2.2.3 Descomposición A = LU
Supóngase que A es tal que el proceso de reducción del método de Gauss puede
efectuarse sin necesidad de intercambiar filas o columnas. En tal caso, la
descomposición A = LU donde L es una matriz triangular inferior con l ii 1 y U es una
matriz triangular superior, es única. Esto puede probarse fácilmente por inducción. Para
el caso del primer ejemplo:
1 2 3 4 1 0 0 01 2 3 4
 
1 4 9 16  1 1 0 00 2 6 12
1 8 27 64 1 3 1 00 0 6 24
   
 1 16  6 1  0 0
 1 7
81 256
0
24 
Los elementos de L son justamente los coeficientes l ij usados durante la reducción; U

es en cambio ¡la matriz A reducida!
Se ha mencionado anteriormente que varios sistemas de ecuaciones con la misma

matriz de coeficientes pueden ser resueltos simultáneamente. Sin embargo, no siempre
se conocen desde un principio todos los vectores de coeficientes del segundo miembro.
Por ejemplo, puede querer resolverse Ax1 = b y Ax2 = x1. Aún en este caso, al resolver
el segundo sistema no es necesario volver a reducir la matriz A como al inicio. El
sistema Ax = b es equivalente a LUx = b, o bien a los dos sistemas triangulares: Ly = b
2
, Ux = y. Siendo L y U conocidos, estos dos sistemas pueden resolverse en O( n )
operaciones. L y U pueden almacenarse en las mismas posiciones de memoria que en
(i )
la matriz A: Como l a a (i ) se determina con el objeto de hacer a (i 1) 0 , l
ki ki ii ki ki
puede almacenarse en las posición de a ki . Por otro lado, no es necesario almacenar los
elementos de la diagonal de L (que son todos iguales a 1). Dado que los elementos de
U son aquellos de la matriz reducida, el efecto de la reducción o descomposición en la
distribución de memoria es de la forma:
a11 a12 a13 a1n  u u12 u13 u1n 
   11 
a 21 a 22 a 23 a 2n  l 21 u 22 u 23 u 2n
 
a a 32 a 33 a 3n  l l 32 u 33 u 3n
31 31
 
   
a n1 a n2 a n3 a nn  l n1 l n2 l n3 u nn
Para el ejemplo precedente:

1 2 3 4  1 2 3 4
1 4 9 16  1 2 6 12 
1 8 27 64   1 3 6 24 
 1 16 81 256 1 7
 6 24 

En los casos en los que se efectúan intercambios de filas y/o columnas es siempre posible
(si A no es singular) obtener factores triangulares L y U tales que LU = A’, donde A’
es la matriz que resulta de efectuar los intercambios mencionados en la matriz original A.

2.2.4 Otros Métodos Directos
Todos los métodos tratados en esta sección pueden considerarse como variantes del
método de Gauss.
Una posible alternativa es la de calcular los elementos de L y U mediante las fórmulas:

k1
u k j ak j l k p u p j j k , k 1, n (2.9a)
p1
1 k1 
l ik  ai k l i p u p k i k 1, n (2.9b)
 
u kk  p1
en lugar de efectuar “reducciones” como anteriormente. Esta modificación (Doolitle) es

conveniente cuando se usan calculadoras manuales, ya que evita la escritura de muchos
resultados intermedios. Su uso en computadoras es ventajoso si las operaciones se
hacen con una precisión mayor que aquella con la que se almacenan los resultados.
El método de Crout efectúa la factorización A = LDR, donde L es la misma matriz

triangular inferior obtenida durante el proceso de Gauss, D es una matriz diagonal y R es
una matriz triangular superior con coeficientes 1 en su diagonal principal. D y R están
relacionados con la U de Gauss.
d ii u ii
u (2.10)
rij  ij j i
d ii
En particular, para A simétrica: R = LT. Este método no posee ventajas ni desventajas

con relación al de Gauss, bien sea en cuanto a estabilidad numérica y precisión, como
en el número de operaciones necesarias.
Si durante el proceso de reducción se usa la ecuación i para eliminar xi, no sólo de las
ecuaciones que siguen a la i sino también de la ecuaciones precedentes, se tiene el
método de Gauss – Jordan. Para el ejemplo antes considerado:
1 2 3 4 x1  2
1 4 9 16 x 2  10

1 8 27 64 x  3 44
 1 16 81 256 x 4 190
1 2 3 4 x1  2
0 2 6 12 x 2  8

0 6 24 60 x 3  42
 0 14 78 252  x 4 188
1 0 3 8 x1  6
0 2 6 12 x 2  8

0 0 6 24 x 3  18
 0 0 36 168  x 4 132
Nótese que se utilizó la segunda ecuación para reducir no solamente las ecuaciones 3 y
4, sino también la ecuación 1. Análogamente:

1 0 0 4 x1  3
0 2 0 12 x 2 10
0 0 6 24 x3  18
0 0 24
0 4x 24
1 0 0 0 x1  1
2 0 0
0 x2  2
0 6
 de donde se obtiene fácilmente la solución.
0 0 x3  6
 0 0 0 24  x 4 24
El método de Gauss- Jordan es más simple de programar, pero requiere casi 1.5 veces
el número de operaciones del método de Gauss tradicional.
Finalmente, para concluir esta sección, debe mencionarse que el método de Gauss es
aplicable también a sistemas de ecuaciones con coeficientes complejos. Por ejemplo:
2 1i 0 x1  4 2i
1i 2 1 i x 2 8 4i
0 1i 3 x3  11 2i
2 1i 0 x1  4 2i
0 1 1 i x 2 5 3i
0 1i 3 x3  11 2i 
2 1i 0 x1  4 2i
0 1 1 i x 2 5 3i
0 0 1 x3  3
de donde:
x3 3
x 2 (5 3i) 3(1 i) 2
1
x1 (4
2 2i) 2(1 i) 1
2.2.5 Inversión de Matrices

-1
Si la inversa, A , de una matriz A se conoce, la solución de un sistema Ax = b puede
-1 -1
escribirse x = A b. Podría entonces parecer conveniente determinar A , en especial si
se tienen varios sistemas de ecuaciones con la misma matriz de coeficientes. Sin
embargo, la solución puede ser obtenida con mucho menos operaciones – y en general
con mucha más precisión – utilizando la descomposición A = LU. La solución de los dos
2
sistemas triangulares Ly = b y Ux = y requiere sólo O(n ) operaciones (por cada
columna de b ó x). Por otro lado, la multiplicación A-1b 2
también demanda O(n )
-1
operaciones. Sin embargo, la determinación de A requiere aproximadamente el triple
de trabajo que para obtener L y U. El número de operaciones (multiplicaciones o
divisiones) necesarias para obtener la inversa de una matriz cuadrada (no simétrica) de
3
orden n es n 2 n2 n 1 .
No obstante esto, en algunos casos se necesita la inversa en forma explícita. La inversa
puede obtenerse de un modo eficiente resolviendo n sistemas de ecuaciones lineales:

AX = In, donde X = A-1. El siguiente ejemplo utiliza una variante del método de Gauss
con este objeto:
1 1 1

A 2 1 3
3 1 4

En la columna de la izquierda se tienen la matriz A y sus sucesivas modificaciones. A la

derecha se presentan la matriz I y las modificaciones obtenidas efectuando sobre las
filas las mismas operaciones que en A:
1 1 1 1 0 0
 
2 1 3 0 1 0
3 1 4 0 0 1
 
1 1 1 1 0 0
0 1 1 2 1 0
 0 2 1  3 0 1 
1 0 2 
1 1 0
  
0 1 1 2 1 0
0 0 1 2 1 
1
1 0 1 3 2
 0  
0 1  1 1 1 A1
0 0 1
0 1
 2 1 

Alternativamente, si la descomposición A = LU de una matriz A se conoce, la inversa

-1 -1 -1 2
puede obtenerse de A = U L , también en O(n ) operaciones. Si en los cómputos
-1 -1
para L y U se hacen intercambios de filas, el producto U L resulta la inversa de una
-1 -1
cierta matriz A’. La matriz A puede obtenerse a partir de (A’) intercambiando
columnas en secuencia inversa a los cambios de fila durante el proceso.
Para la matriz antes considerada:
1 1 1  1 0 01 1 1
2 1 3 21 00 1 1
 1 0 
3 1 4  3 2 0 1
A LU
La inversa de una matriz triangular es otra matriz del mismo tipo, fácil de determinar.
Para una matriz triangular inferior, L, cada columna de la matriz inversa L-1 puede ser
obtenida por sustitución directa o “reducción”: LY = In.
y ij 0 i j (2.11a)
 i1 
1
y ij  ij l ik y kj  i j (2.11b)
l
H. Scaletti - Métodos Numéricos: Ecuaciones Algebraicas Lineales 2-
10
 
ii  kj
En forma análoga, la inversa, U-1, de una matriz triangular superior, U, es también una
matriz triangular superior. Cada fila i, puede determinarse mediante UZ = In:
H. Scaletti - Métodos Numéricos: Ecuaciones Algebraicas Lineales 2-

11
j1
z ij 1 ij z ik u kj  i j (2.12a)
u
ki
 
z ij 0 jj   (2.12b)
i j
Para las matrices L y U del ejemplo considerado:

1 0 0  1 1 2
L1 2 1 0 U1 0 1 1
 
1 2 1 0 0 1
1 3 2 
A 1 U 1 L1 1 1 1
 1 2 1 
2.2.6 Casos Especiales
Matrices Simétricas Definidas Positivas.
Para una matriz simétrica: a (1) a (1) . Si se efectúa la reducción de Gauss sin
jk kj
intercambio de filas y/o columnas se tiene también que: a (i ) a (i ) para i j , k n.
jk kj
En otras palabras, la sub – matriz que debe aún reducirse en un paso dado es también
simétrica. Esto puede probarse por inducción, teniendo en cuenta las condiciones
iniciales de simetría y además que:
(i 1) (i ) (i ) (i ) a ki(i ) (i )
a
a kj a kj l ki aij a kj (i ) ij (2.13a)
aii
a (i )
(i 1) (i ) (i ) (i ) ji (i )
a jk a jk l ji aik a jk a ik (2.13b)
a ii(i )
Puede observarse que, si los coeficientes en la etapa i son simétricos, aquellos en la

etapa i 1 también lo son, puesto que se obtienen operando del mismo modo con
números iguales.
Considérese, por ejemplo, el sistema de ecuaciones con coeficientes simétricos:

4 2 1 0 x1  0
2 6 2 1 x2  1

1 2 6 2 x3  0

 0 1 2 4 x4 0
H. Scaletti - Métodos Numéricos: Ecuaciones Algebraicas Lineales 2 - 10
En las sucesivas etapas del proceso de eliminación, las sub matrices que quedan por
reducir siguen siendo simétricas:
4 2 1 0 x1  0
0 5 1.5 1 x2  1

0 1.5 5.75 2 x3  0

0 1 2 4 x4 0

4 2 1 0 x1  0
0 5 1.5 1 x2  1

0 0 5.3 1.7 x3  0.3
0 0 1.7 3.8  x 4
0.2
4 2 1 0 x1 0  x1  0.0986

0 5 1.5 1 x2 1  x2  0.2203
  de donde 
0 0 5.3 1.7 x3  0.3  x3  0.0464

0 0 0 3.2547 x 0.1038 x 0.0319
4 4
La simetría de la matriz por reducirse permite hacer: l a (i ) a (i ) (utilizando a (i ) en

ki ik ii ik
(i ) (i 1)
lugar de a ) y restringir los cálculos de: a a (i ) l a (i ) a las columnas k j n ,
ki kj kj ki ij
en lugar de i j n . El número de operaciones para la reducción (contando solo

2
multiplicaciones y divisiones) es entonces O( 1 6 n ) , aproximadamente la mitad que
para el caso general.
También los requerimientos de memoria pueden reducirse, almacenando los coeficientes

de la matriz en un arreglo monodimensional. Para el caso de una matriz simétrica de
alta densidad el siguiente esquema de numeración de los coeficientes es apropiado:
1 2 4 7 11 
 
3 5 8 12 
 6 9 13 
 
 10 14 

 15 
1

2 n (n 1) 
Es evidente que intercambios de filas y columnas destruyen la simetría, a menos que se

tome siempre como pivote un elemento de la diagonal principal. Tales intercambios no
son necesarios si la matriz es definida positiva ( xTAx > 0 para x arbitraria, no nula), ya
que en tal caso:
a ii( k ) 0 i 1, k n
2 (k )
a ij( k ) a ii a (jjk ) k i, j n (2.14)
aii ( k 1) 2 aii( k ) k i n

Estas condiciones garantizan que no se presentan pivotes pequeños.
Para el caso de matrices simétricas definidas positivas puede también utilizarse el

método de Cholesky. Éste método efectúa la descomposición A = RTR, donde R es una
matriz triangular superior cuyos elementos pueden obtenerse (por filas) de:
1
 i1 2
rii a ii  r 2
pi

 (2.15a)
 p1 


1
i1

aij rpi rpj  j i 1, i 2,
rij  (2.15b)
r ii  p1
Para el ejemplo anterior se obtiene:

1
r11 a11 2 2.0000
r12 a12 r11 -1.0000

r13 a13 r11 0.5000
r14 a14 r11 0
a 1
r22 22
r12 2 2
2.2361
r23 a 23 r12 r13 r22 -0.6708
r24 a 24 r12 r14 r22 0.4472

a 1
 r13  r23 2 2.3022

2 2
r33 33
r34 a 34 r13 r14 r23 r24 r33 -0.7384

1
r a r2 r2 r2 2
44 44 14 24 34 1.8041
es decir:
1.0000 
2.0000 0.5000 0
0 2.2361 0.6708 0.4472 

R
0 0 2.3022 0.7384  
 0 0 0 1.8041 
El sistema Ax = b puede entonces rescribirse como RTRx = b o bien RTy = b; Rx = y
Resolviendo el primer sistema triangular:
0 

0.4472 
y
0.1303 
0.0575
y finalmente:
x1  0.0986
x 2  0.2203

x3  0.0464 
x 4  0.0319
Puede anotarse que R está relacionada con las L y U de Gauss mediante RT= LD;
R = D –1U; donde D = diag u11  u 22 u nn .

Matrices Banda.
Los sistemas de ecuaciones en que los coeficientes forman matrices banda son
frecuentes. Tales sistemas se resuelven eficientemente por el método de Gauss y otros
similares, ya que éstos conservan la estructura de banda de las matrices: A = LU:
1 1 0 0 0 1 0 0 0 01 1 0 0 0
   
1 2 1 0 0 1 1 0 0 00 1 1 0 0
0 1 2 1 0 0 1 1 0 00 0 1 1 0
   
0 0 1 2 1 0 0 1 1 00 0 0 1 1
  
 0 0 0 1 2 0 0 0 1 1 0 0 0 10
– – –1
Nótese que A 1 = U 1L no es una matriz banda:
5 4 3 2 1
 
4 4 3 2 1
A1 3 3 3 2 1
2 2 2 2 1
 
1 1 1 1 1
y por lo tanto no conviene hallar A 1 en forma explícita.
Particularmente simples de tratar son los sistemas con matrices banda simétricas y
definidas positivas (no se requieren intercambios de filas y/o columnas). Dos posibles
esquemas para almacenar los coeficientes en un arreglo monodimensional son en este
caso:
1 8 15 
 
 2 9 16 
 3 10 17 
 
A  4 11 18 
 
 5 12 19 
  6 13 (20)

  7 (14) (21)
Las posiciones tales como 14, 20 y 21 no se usan, pero se requieren para tener un número
fijo de coeficientes en cada codiagonal, lo que facilita la programación. Siendo el ancho
de la semibanda, m, mucho menor que el número de ecuaciones, n, las posiciones
de memoria “perdidas” son despreciables. Este esquema de almacenamiento (y su
variante por filas) es apropiado cuando el ancho de banda es aproximadamente
constante.
Otra posibilidad es:
1 2 4 
 
3 5 7 13 
 
 6 8 10 14 
A  9 11 15 

 12 16 18 
 17 19 

  20 

Esta forma de almacenamiento es más eficiente cuando el ancho de banda es variable
(como ocurre en la mayor parte de los problemas reales). Se guardan los coeficientes
por columnas, desde el “perfil” superior a la diagonal principal. Se requiere un arreglo de
apuntadores o índices que indican las posiciones ocupadas por los coeficientes de la
diagonal principal (que son los más referidos durante el proceso de solución). Nótese que
al aplicar el método de Gauss (o cualquier variante de ese procedimiento) no se producen
valores significativos por encima del perfil original y por lo tanto no se requiere más
memoria que aquella en la situación inicial.
Se necesitan nm posiciones de memoria (donde n es el orden de la matriz y m << n el

2
ancho de semibanda), mucho menos que las n posiciones para la matriz completa o las
1 n n 1 para una matriz simétrica de alta densidad. Por otro lado, la reducción de la
2
2
matriz de coeficientes demanda sólo O 1 nm operaciones, ya que:
2
l ij 0 excepto para j i j m
u ij 0 excepto para i j i m
Esto debe compararse con O 1 6n

3
 operaciones para reducir una matriz simétrica de
alta densidad. La reducción del segundo miembro y la sustitución inversa requieren

O 2 nm , en lugar de O n 2 operaciones. En la práctica, rara vez se tiene un ancho de
banda constante, pero aún así estos estimadores son útiles, si se considera m como la
media cuadrática de los anchos de semibanda en las ecuaciones.
Un caso especial es aquel en que la matriz de coeficientes es “tridiagonal”:

x1  c1 
a1 b1 
b1 a 2 b2 x2  c2 
b2 a3 b3 x3  c3
  (2.16)
 

b a b x c
n2 b n1 n1  n1  n1
 an xn cn
n1
Los únicos coeficientes significativos son aquellos de la diagonal principal y de dos

codiagonales, es decir, dos líneas paralelas a la referida diagonal.
Se observa que al descomponer la matriz de coeficientes, A, en sus factores triangulares

LU los factores mantienen la estructura banda:
a b 1 r b 
 1 1
 1 1

b a b q 1 r b
2 3 3 2 3 3
 
b a n1 
 
bn2 n1 
r4  
 
q n2 1
  n1 
b
bn1 an  q n1 1 rn
La determinación de los q i y ri es muy simple:

r1 a1
q i bi / a i i 1,2, n 1 (2.17a)
ri 1 ai 1 qi bi
y, considerando L y = c:
y1 c1
(2.17b)
y i1 ci1 qi y i i 1,2, n 1
de donde se obtiene x resolviendo U x = y:

x n y n / rn
xi ( y i bi xi1 ) / ri i n 1, 2,1
Para resolver un sistema de n ecuaciones lineales con matriz de coeficientes tridiagonal

se requieren sólo 5n 4 operaciones. Como se indicó anteriormente, se cuenta como
una operación la combinación de una multiplicación o división con una suma, resta o
almacenamiento del resultado.
Grandes sistemas de ecuaciones lineales
(con matrices de coeficientes banda, simétricas y definidas positivas).
Cuando la memoria de la computadora es insuficiente para almacenar todos los

coeficientes del sistema de ecuaciones, se recurre al disco. El acceso a este medio es
(en términos relativos) muy lento y en lo posible debe tratar de minimizarse su uso.
Es frecuente subdividir la información de sistemas de ecuaciones excesivamente

grandes en “bloques” de una o más ecuaciones (o columnas).
Los datos de cada bloque se almacenan en disco. Éstos son leídos a la memoria
principal conforme van siendo utilizados y regrabados en la memoria auxiliar una vez
operados. La solución del sistema de ecuaciones por el método de Gauss (u otro similar)
requiere mantener en memoria principal la información de por lo menos dos bloques en
forma simultánea. Así por ejemplo, durante el proceso de reducción, las ecuaciones del
bloque k deben ser utilizadas para reducir ecuaciones del mismo bloque y de los bloques
sucesivos k+1, k+2, ...., k+n (n en general es pequeña), lo que implica que, estando el
bloque k en memoria, los bloques sucesivos deben ser leídos, parcialmente reducidos, y
regrabados en secuencia. Algo similar ocurre con el proceso de sustitución inversa.
2.3. Errores en la Solución de

Sistemas de Ecuaciones Lineales
En la solución práctica de grandes sistemas de ecuaciones lineales se realizan millones
de operaciones y en cada una ocurren errores de redondeo, ¿Cómo afectan estos
errores a los resultados? ¿Cómo puede estimarse la magnitud del error en la solución?
Podría pensarse que, habiendo resuelto el sistema A x = b, la magnitud del residuo
r = b – A x sea una buena medida del error introducido en x. !Esto es falso!
Considérese por ejemplo:
0.780 0.563 0.217
A=  b=
0.913 0.659  0.254

T
Y supóngase que se ha resuelto A x = b obteniendo x1 = (0.341 -0.087) ¿Qué tan
buena es esta solución?
r1 = b – A x1 = (10-6 0)T
Por otro lado si se afirma que la solución es x2 = (0.999 -1.001) T se obtiene el residuo.
T
r2 = b – A x2 = (1.343x10-3 1.572x10-3)
¿Es x1 mejor solución que x2? No. La solución exacta es x = (1 -1) T.
Aunque la magnitud del vector residuo r = b – A x no da una indicación directa del error
en x, es posible utilizar residuos para estimar el error e incluso para corregir la solución.
Esto se discute más adelante.
2.3.1 Normas de Vectores y Matrices
Con el propósito de discutir los errores al resolver sistemas de ecuaciones lineales, se

define como norma (o medida) de un vector:
x (x p x p )1 / p 1 p  (2.18a)
p 1 2
Dos casos particulares son de interés:
x 2
(x 2 1 x 2 2 ) 1/ 2
(norma Euclidiana) (2.18b)
x 
máx x i (máximo valor absoluto) (2.18c)
Es relativamente fácil probar que:

x 0 sólo hay igualdad si x = 0
ax a x (2.19)
x y x y
Estas propiedades son familiares en relación a la norma Euclidiana o “longitud” de un

vector.
La norma de una matriz cuadrada, A , puede ser definida en forma consistente con la
definición de norma de un vector:
Axp
A máx x 0 (2.20a)
p
x p
1/ 2 máx T
La norma A 2
es ,
máx donde es el máximo valor característico de A A (ver
capítulo 3). Por otro lado:

n
A máx
i
 aij (2.20b)
j1
Estas normas satisfacen condiciones similares a las normas de vectores. Además:

AB A B (2.21)

2.3.2 Condicionamiento de una matriz:
En esta ecuación se analizan los efectos de una pequeña perturbación A en la matriz
A, o de una perturbación b en b.
Si x es la solución exacta de A x = b, cuando se considera la matriz de coeficientes

A A la solución resulta x x :
(A A) (x x) b (2.22)
de donde:
x A 1 A (x x)
tomando normas:
 1
x A A x x
y dividiendo entre x x :
A
x A
(2.23)
x x A
1
donde K A A A (2.24)
1/ 2
es el número de condicionamiento de la matriz A. Dado que A1 mín , donde
2
T
min es el menor valor característico de la matriz A A, puede escribirse:
1/ 2
K2A  máx / mín (2.25)
Por otro lado: para una perturbación b en b:

A (x x) b b (2.26)
de donde:
x A 1b
 1
x A b
b
y dado que b = A x, lo que implica x 
A
se obtiene:
x b
K A (2.27)
x b
Las ecuaciones (2.23) y (2.27) indican que, si K A es grande, pequeños cambios en A
o en b pueden originar cambios importantes en la solución.

Si se tienen errores relativos de orden tanto en A como en b, (2.23) y (2.27) pueden
combinarse, para escribir:
x 2 K (A) x (2.28)

Los errores de redondeo introducidos en el proceso de solución pueden ser
considerados como equivalentes a perturbaciones en las matrices A y b iniciales. K A
es también un buen indicador de los efectos de los errores de redondeo en la solución.
La expresión (3) implica que si A y b están dadas con t cifras significativas, el número de
cifras que puede esperarse sean correctas en la solución, s, puede estimarse mediante:
s t log10 K (A) (2.29)
Para el ejemplo precedente:

A 
= 0.913 + 0.659 = 1.572
 0.659 0.563 
1
además: A 106 
0.913 0.780
de donde A1 = 0.913 x 106 + 0.780 x 106 = 1.693 x 106

KA A A1 = 1.572 x 1.693 x 106 = 2.7 x 106

Alternativamente, trabajando con normas Euclidianas:

1.441969 1.0040807 
AT A  
1.040807 0.751250
cuyos valores característicos son máx = 2.1932, mín = 4.56 x 10-13

1/ 2
de donde K 2 A  máx / mín = 2.2 x 106
Ambos resultados indican un mal condicionamiento de la matriz A.
Note que en el ejemplo anterior la matriz A no era simétrica, por lo que fue necesario
T
evaluar los valores característicos de A A . Si A fuera simétrica, los valores
T
característicos de A A serían exactamente los cuadrados de los valores característicos
de A.
2.3.3 Errores de redondeo en la solución de sistemas de ecuaciones lineales

por el método de Gauss (y otros métodos de eliminación similares)
Las relaciones teóricas utilizadas en la reducción son:
(i )
l ki a ki/ a ii(i )
(i 1) (i ) (i )
a kj a kj l kia ij (2.30)
k
bk (i 1) b (i ) l bki (i )
i
Sin embargo, como resultado de los errores de redondeo, los valores calculados (aquí
indicados en barras) satisfacen:
(i ) (i )

l ki (a ki / a ii )(1 1 )
(i 1) (i ) (i )
a kj (a kj l ki a ij (1 2 ))(1 3 ) (2.31)
(i 1) (i ) (i )
bk (b k l ki b i (1 4 ))(1 5 )
donde i , siendo el máximo error relativo de redondeo. Alternativamente puede
escribirse:

(i ) (i )
l ki (a
 ki e (i )ki) / a ii
(i 1) (i ) (i )
(i )
a kj a kj l ki a ij e kj (2.32)
(i 1) (i ) (i )
bk b k l ki b i e (i )k
y puede probarse que:

(i )
e ki(i ) a ki
(i ) (i 1) 
e kj(i ) áx akj
3.m , a kj 
  (2.33)
(i ) (i 1) 
c k(i ) áx bk
3.m , bk 
 
(1)
Por otro lado, considerando que . a kj a kj , l kk 1 , pueden utilizarse las expresiones
(1)
precedentes para escribir a kj en función de los l ki , a ij . (es decir los elementos de las
matrices L y U). Se obtiene así:

r s
(i )
a kj e i l kj ki a ij (2.34a)
i1 i1
(1)
donde r = min (k-1,j), s = min (k, j). Por otro lado, teniendo en cuenta que bk bk , se
obtiene:
k1 k (i )
i
bk c l ki bk i (2.34b)
i1 i1
Esto demuestra que las matrices calculadas:

(i )
L (l ki ) U (a ij ) y (b (i i) )
No son factores exactos de A y b sino de A + A y b + b:
A A LU
b b Ly
Los elementos de A son sumatorias de los e kji ; los elementos de b son sumatorias
i
de los c k . Las expresiones (4) dan una medida de estas perturbaciones. Obsérvese
que las expresiones (2.23) y (2.27) son aplicables también en este caso, y un valor de
K (A) alto indica que los errores de redondeo tendrán efectos importantes en la
solución.

Por otro lado, las expresiones (2.33) y (2.34) indican que es conveniente limitar el
crecimiento de los a kj(i ) , bk(i ) . Este es el propósito al realizar intercambios de filas y/o
columnas.
Finalmente, debe mencionarse que en el proceso de sustitución inversa, para obtener x

resolviendo U x y , los errores acumulados son despreciables en términos relativos a
los que resultan de la reducción.

Las ecuaciones precedentes permiten una estimación a-posteriori de la magnitud del
(1)
error. A-priori puede establecerse :
máx a ij( k )
i , j ,k
gn (2.35)
máx a ij(1)
i, j
teniendo que:
g n 2 n1 para intercambio parcial (filas)
0.25 Ln n
1.8
gn n para intercambio total.
Estos límites son teóricos. Nótese por ejemplo que para un sistema de orden 100 se
29
tendría g n 6.3x10 para intercambio parcial y g n 18 para intercambio completo, lo
que justificaría el trabajo adicional necesario para la segunda alternativa. Sin embargo,
en la práctica rara vez se observa un g n mayor que 10, aún con intercambio parcial.
Para matrices simétricas definidas positivas se tiene que g n 1 .
2.3.4 Algunas consideraciones relativas a unidades.

Equilibrio de las ecuaciones.
En un sistema de ecuaciones A x = b... los aij, bi, xj pueden expresarse en diversos
sistemas de unidades. Un cambio de unidades equivale a considerar b = D1 b’; x = D2 x’
y por lo tanto (D1 A D2) x’ == D1 b’. En estas expresiones las matrices D1 y D2 son
diagonales. Puede demostrarse que, si se utilizan los mismos pivotes y las D1 y D2 solo
contienen potencias enteras de la base del sistema de numeración utilizado, los
resultados son los mismos (habida cuenta de los cambios de unidades).
Sin embargo las unidades utilizadas pueden afectar la selección de pivotes, especialmente
si sólo se hace intercambio parcial.
En tal caso, es recomendable equilibrar las ecuaciones. Para las incógnitas deben
seleccionarse escalas que reflejen su importancia relativa. Las ecuaciones deben
multiplicarse por factores D1 tales que:
máx a ij 1 i=1,2,3,...n
1 jn
2.3.5 Método iterativo para mejorar la solución

Considérese el sistema de ecuaciones Ax b para el que se tiene la solución
aproximada x (0) . Si x es la solución exacta, se tiene que:
x x (0) x (0)
y entonces:
A x (0) r (0)
(0)
donde: r b Ax (0)

(0)
Al determinar . x . se obtienen los factores triangulares aproximados L y U tales que
L U A A , siendo A pequeño. Esta descomposición requiere aproximadamente
O 1 3n 3 operaciones.
(0) (0) 2
A partir de x puede determinarse r en O n operaciones y resolverse:

Lz r
Ux z
2
también en O n operaciones. Dado que L y U no son los factores exactos de A , y
además se introducen nuevos errores de redondeo, es necesario iterar:
r (i ) b A x (i )
L z (i ) r (i ) (2.36)
U x (i ) z (i )
x ( k 1) x ( k ) x ( k )
Pero nada se ganaría si las operaciones se hicieran siempre con el mismo número de
cifras significativas empleadas en los cómputos originales. Si los aij bi xi están dados
con t dígitos, el cómputo de los residuos:
n
ir
(k )
bi ax
j1
ij
(k )
j
debe hacerse con 2 t dígitos (para minimizar errores de cancelación). Sin embargo, el
almacenamiento de los resultados puede hacerse en precisión simple, es decir, con t

dígitos.
(1) ( 2)
Los vectores x y x permiten también estimar el número de condicionamiento:
(1)
1 x
A (2.37)
n ( 2)
x
donde n es el orden del sistema y es el máximo error relativo de redondeo (al operar
en precisión simple). Si x (1) no es mucho menor que x (1) , o lo que es lo mismo,
si A n  no es mucho menor que 1, el proceso iterativo no es adecuado. En tal caso,
la única alternativa sería operar con mayor precisión en toda la solución.
Considérese, por ejemplo, el sistema de ecuaciones:
5 7 3 x1  0.
7 11 2 x2 1
3 2 6 x3  0.
y supóngase que la computadora opera en base 10 con 3 cifras significativas. La

factorización de la matriz de coeficientes, A L U , resulta en:
5 7 3 1.00
 5.00
7.00 3.00 
7 11 2 1.40
 1.00 1.20 2.20
   
3 2 6 0.60 1.83 1.00  0.17
De la reducción del segundo miembro, es decir la solución de L y b se obtiene:
T
y 0.00 1.00 1.83
Finalmente por sustitución inversa, es decir resolviendo U x y , se determina

x (1) 35.3 20.6 10.8
T

Para esta solución aproximada se tiene el residuo:
T
r (1) b A x (1) 0.100 0.100 0.100
El cómputo de los bi a ij x j deben hacerse en doble precisión, almacenándose los
resultados ri en precisión simple.
(1) (1)
Resolviendo los dos sistemas triangulares: L z r y Ux z se obtiene:
T
x (1) 0.685 0.391 0.195
Y entonces:
T
x ( 2) x (1) x (1) 36.0 21.0 11.0
(1)
(redondeado a 3 cifras significativas). Este resultado es mejor que x (en este caso el
resultado es exacto, aunque debería decirse que por accidente).
Puede verificarse fácilmente que la matriz A del ejemplo anterior es bien condicionada.
Por otro lado, considérese nuevamente el sistema:

0.780 0.563 x1  0.217

0.913 0.659 x2  0.254
6
para el cual se obtuvo anteriormente A de orden 2 x 10 . Supóngase que se opera
en base 10 con 6 cifras significativas:
0.780 0.563 1.00 000 0.780 000 0.563000


 0.913 0.659 1.17 051 1.00 000  3 106
se pierden cifras significativas en el elemento a22 de esta última matriz al restar dos
números que solo difieren en la última cifra almacenada). De aquí resultan:

x (1) 0.518 803 0.333 333
T
T
r (1) 0.139 10 6 0.692 10 6
No obstante ser este residuo “pequeño”, se obtiene la corrección:

T
x (1) 0.127 348 0.176 433
T
x ( 2) x (1) x (1) 0.391455 0.156 900
T
y es obvio que este resultado difiere más de la solución exacta x 1 1 que la
(1)
aproximación x antes obtenida. ¡Para resolver este sistema de ecuaciones se
requiere trabajar con un mínimo de 8 cifras significativas!
2.4.Métodos Iterativos para la Solución

de Sistemas de Ecuaciones Lineales
En los acápites siguientes se tratan dos tipos distintos de métodos iterativos. Estos
procesos pueden ser muy eficientes cuando la matriz de coeficientes, A , es de baja
densidad, más aún si la evaluación de productos de la forma Av no requiere la previa
determinación y el almacenamiento de A en forma explícita.

2.4.1 Métodos de Relajación
Estos procedimientos son adecuados sólo cuando la diagonal principal de la matriz de

coeficientes es dominante. En general, se considera una aproximación inicial, tal como
x ( 0) 0 , y ésta es sucesivamente mejorada hasta obtener una solución suficientemente
precisa.
Considérese el sistema de orden n : A x b , con aii 0 para todo i . En el método de

(1) ( 2)
Jacobi se calculan las aproximaciones x , x , x(3) mediante:
1( k 1)  (k )

xi bi aij x j  (2.38)
a
ii  ji
La aproximación es arbitraria; con frecuencia x

( 0)
0 . Si los xi( k 1) se determinan en el
( k 1)
orden habitual, al determinar xr ya se han previamente obtenido las nuevas
( k 1)
aproximaciones x , x ( k 1) x ( k 1) . Sin embargo, en el método de Jacobi no se hace
1 2 r1
uso de estas nuevas aproximaciones hasta la iteración siguiente, difiriendo en esto del
método de Gauss - Seidel:
1( k 1)
 
i 1 ( k 1)
 n
(k )

xi bi aij x j aij x j  (2.39)

a
ii  j1 j i1
Nótese que sólo se requiere almacenar las últimas aproximaciones a los xi .
En el ejemplo siguiente se usan las dos alternativas:
5 1 1 0 x1 1
1 5 0 1 x2  2.75
1 0 5 1x
 3 1
 0 1 1 5  x4 2.75
La solución exacta es
T
x 0.25 0.50 0.25 0.50
Con el método de Jacobi se obtienen las sucesivas aproximaciones:

k x1( k ) x2( k ) x3( k ) x4( k )
0 0 0 0 0
1 0.2 0.55 -0.2 -0.55
2 0.27 0.48 -0.27 -0.48

3 0.242 0.508 -0.242 -0.508
4 0.2532 0.4968 -0.2532 -0.4968
5 0.24872 0.50128 -0.24872 -0.50128
6 0.250512 0.499488 -0.250512 -0.499488
7 0.249795 0.500205 -0.249795 -0.500205
8 0.250082 0.499918 -0.250082 -0.499918
9 0.249967 0.500033 -0.249967 -0.500033
10 0.250013 0.499987 -0.250013 -0.499987
11 0.249995 0.500005 -0.249995 -0.500005
12 0.250002 0.499998 -0.250002 -0.499998

(k )
k x1( k ) x2 x3( k ) x4( k )
13 0.249999 0.500001 -0.249999 -0.500001

14 0.250000 0.500000 -0.250000 -0.500000
15 0.250000 0.500000 -0.250000 -0.500000
La convergencia es mejor con el método de Gauss – Seidel:

k x1( k ) x2( k ) x3( k ) x4( k )
0 0 0 0 0
1 0.2 0.59 -0.16 -0.464
2 0.286 0.5144 -0.2356 -0.49424
3 0.255760 0.502304 -0.247696 -0.499078
4 0.250922 0.500369 -0.249631 -0.499853
5 0.250147 0.500059 -0.249941 -0.499976
6 0.250024 0.500009 -0.249991 -0.499996
7 0.250004 0.500002 -0.249998 -0.499999
8 0.250001 0.500000 -0.250000 -0.500000
9 0.250000 0.500000 -0.250000 -0.500000
En algunos casos la convergencia puede acelerarse con sobrerelajación:
xi ( k 1) x ( ki) ri (k )
(2.40a)
1( k ) 
i 1 ( k 1)
 n
(k )

ri bi aij x j aij x j  (2.40b)

a
ii  j1 ji
(k )
El valor óptimo de depende de A e incluso de la aproximación x . Cuanto mayores
sean los valores absolutos de los términos de la diagonal principal, respecto a la suma
de los valores absolutos de los restantes coeficientes de la misma fila, más se aproxima
a 1. Para el ejemplo precedente, utilizando 1.05 se obtienen:
k x1( k ) x2( k ) x3( k ) x4( k )
0 0 0 0 0
1 0.210000 0.621600 -0.165900 -0.481803
2 0.295197 0.507233 -0.240892 -0.497478
3 0.251172 0.500414 -0.249680 -0.499972
4 0.250096 0.500005 -0.249990 -0.499998
5 0.249998 0.500000 -0.250000 -0.500000
6 0.250000 0.500000 -0.250000 -0.500000
Estos métodos no son necesariamente más precisos que los procesos de eliminación. El
ejemplo al inicio de la sección 2.6 muestra que si el sistema es mal condicionado puede

aceptarse como correcta una solución totalmente equivocada, pero con la que se tiene
un residuo “pequeño”.

2.4.2 Convergencia
En esta sección se analiza la convergencia de los métodos de relajación. Un paso típico
en la solución de A x b puede escribirse como:
x ( k 1) G x ( k ) f (2.41)
Esto puede verse más fácilmente si se considera la descomposición:

A D Ti I Ts  (2.42)
donde D es una matriz diagonal, con elementos aii ; Ti y Ts son matrices triangulares,
inferior y superior respectivamente, con ceros en la diagonal principal, cuyos coeficientes

son los aij aii . Por ejemplo:
2 1 2 0 0 0 1 0 0 1
  2
1  

1
 2 0 2 2
0  0  1 0 0
Con esta notación, para el método de Jacobi se tiene:
x ( k 1) T T x ( k ) D 1b (2.43a)
i s
es decir: G Ti Ts  (2.43b)
mientras que para el método de Gauss-Seidel puede escribirse:
x ( k 1) T x ( k 1) T x ( k ) D 1b (2.44a)
i s
y por lo tanto: G I Ti Ts 1
(2.44b)
De modo similar, para el método de sobre relajación se tiene:

G I Ti  1 1 I Ts 
(2.45)
Por otro lado, dado, que la solución exacta, x , debe cumplir la ecuación (2.41), se tiene
que:
x Gx f (2.46)
y restando (2.46) de (2.41):
x ( k 1) x G x ( k ) x  (2.47a)
de donde:
x ( k 1) x G x ( k ) x G 2 x ( k 1) x G k 1 x (0) x  (2.47b)
Además, si , ,
1 2 3 n son los vectores característicos de la matriz G , a los que
corresponden los valores característicos 1 , 2 , 3 n , puede escribirse:
x (0) x  1 1
22 33
n n

ya que los vectores característicos constituyen una base completa. Es relativamente
fácil probar que:
     
x ( k ) x G k x (0) x k k k k
(2.47c)
1 1 1 2 2 2 3 3 3 n n n
Para tener convergencia:
Lim x ( k ) x 0 (2.48a)
k

y por tanto se requiere i 1 para todo i , o lo que es lo mismo:
G máx i 1 (2.48b)
i
G se denomina el radio espectral de la matriz G .

Para k suficientemente grande el error se multiplica por G en cada paso, es decir se
tiene aproximadamente log10 G  cifras decimales exactas adicionales en cada
paso.
No es práctico determinar con gran precisión los valores característicos de G (esto

significaría más trabajo que resolver el sistema de ecuaciones), pero ciertos límites
pueden ser fácilmente establecidos.
Para el método de Jacobi: g ij a ij a ii si i j (2.49a)
g ii 0
y utilizando el teorema de Gerschgorin (véase el capítulo relativo a la evaluación de

valores y vectores característicos):
G máx ii máx
i  j
gij o bien máx
j  i
g ji (2.49b)
con lo que la condición de convergencia G 1 puede rescribirse:

n n
a jj
i1
 aij aii 
j1
aij (2.49c)
i j ji
Estas son condiciones suficientes pero no necesarias. La convergencia es más rápida

cuanto más fuertes son las desigualdades.
Para el método de Gauss – Seidel G máx ri

1 si  (2.50a)
i
donde:

i1

n a a
si 
ij ij
ri (2.50b)
a a
j i1 ii j1 ii
y finalmente se concluye que las condiciones para la convergencia son las mismas que
para el método de Jacobi (aunque en general el método de Gauss -Seidel converge más
rápidamente).
Un análisis similar del método de sobre relajación permite establecer la condición

adicional: 0 2
2.4.3 Métodos de Máxima Gradiente y de Gradiente Conjugada

En la primera parte de esta sección se consideran métodos para la solución de sistemas
T
de ecuaciones A x b con matriz A simétrica y definida positiva, es decir, v A v 0

para todo vector v no nulo.
Considérese la función:
f (x) 1
x2 T A x xT b (2.51)
Si x es la solución exacta de A x b se tiene que:

f (x) f (x) 1
xT 2A x xT b 1 xT A x 2xT b 
1
x xT A x x
2
1 T
Pero, siendo A definida positiva: x x Ax x 0
2
Y por lo tanto f (x) f (x) 0 , es decir, f (x) f (x) (2.52)
La igualdad solo se da si x x . La solución de Ax b es entonces equivalente a una
minimización de f (x) .
Dada la aproximación inicial x (0) , a la que corresponden el residuo r (0) b A x(0) y el

(1) (1) (0)
valor f (x) , debe determinarse una nueva aproximación, x , tal que f (x ) f (x ) .
Para reducir el valor de f (x) lo más rápidamente posible, la corrección debe hacerse en
la dirección de máxima gradiente. Debe entonces determinarse esta dirección, z , tal

que:
d
f (x(0) z)
d 0
sea máxima (en valor absoluto). Siendo f (x) 1

x2 T A x xT b , puede escribirse:
f (x(0) z)
2
1
(x(0) z)T A (x(0) z) (x(0) z)T b
(2.53a)
12 T
2
z A z zT r (0) f (x(0) )
de donde:
d
f (x(0) z) zT r (0)
d 0
Esto significa que debe tomarse la dirección z r (0) (2.53b)
(0)
Ahora puede determinarse 0 de modo que f (x (0) 0 r ) sea un mínimo.
(0)
Rescribiendo (2.53a) con z r y derivando con respecto a :
d T T
f (x (0) r (0) ) r (0) A r (0) r (0) r (0) 0
d
de donde:
T
r (0) r (0)
0
 T
r (0) A r (0)
T
(dado que A es definida positiva, nunca se presenta el caso r (0) A r (0) 0 )
Finalmente:
x (1) x (0)  0r
(0)
El proceso puede repetirse en sucesivos ciclos: r

(
k
)
b A x(k )
T
r (k ) r (k ) (2.54a)
k  T (2.54b)
r (k ) A r (k )
x ( k 1) x ( k )  k r (k ) (2.54c)

Este método es siempre convergente, pero no puede conocerse a priori en cuantos
ciclos se tendrá la precisión requerida.
En los párrafos siguientes se estudia una modificación de este proceso, el método de

Gradiente Conjugada, para el que – al usar una aritmética perfecta - puede garantizarse
la convergencia en un número de pasos igual o inferior al orden del sistema de
ecuaciones.
Considérese el sistema de ecuaciones de orden n , A x b . Dada una solución
(0)
aproximada, x , la solución exacta, x , puede escribirse como:
x x (0) x
x puede expresarse como combinación lineal vectores linealmente de n
independientes. En particular, si se consideran vectores s 0 , s 1 , s 2 s n 2 , s n 1 , que
satisfacen las relaciones de ortogonalidad:
s Ti A s j c  i ij
puede escribirse:
x (1) x (0) s x0( 2) 0

x (1) s 1 1
x ( k 1) x ( k ) s k k
x x ( n) x ( n1)  n1 s n1
alternativamente:
n1
(0)
x x  k sk (2.55)
k0
Suponiendo que los vectores s k son conocidos, los coeficientes k pueden obtenerse
utilizando las relaciones de ortogonalidad ya mencionadas. Dado que:

n1
r (i ) b A x (i ) A x x (i )  k A sk (2.56)
ki
T
premultiplicando por s j se obtiene:
n1
(i )
s Tj r  k s Tj A s k 0 si j i (2.57)
ki
T
j s j As j si j i
de donde puede escribirse:
T
js r ( j)
j (2.58a)
sT A s
j j

Alternativamente, puede utilizarse

T
j r ( j ) r ( j )
(2.58b)
sT A s
j j
T
La expresión alternativa j(s r (0)
j ) (s Tj A s j ) no es conveniente, por la acumulación
de errores de redondeo.
Dado que los s 0 , s 1 , s 2 s n 2 , s n1 son n vectores linealmente independientes en un
espacio n -dimensional, el error siempre puede ser expresado como una combinación
lineal de estos vectores , es decir el proceso debería llegar a la solución exacta (salvo
errores de redondeo) en n pasos.
( k 1)
El vector s k 1 se obtiene eliminando de r la componente según A s k :
s k 1 r ( k 1) k sk (2.59)
donde:
k s T A r ( k 1)
k (2.60)
sT A s
k k
Es relativamente fácil probar que si s 0 , s 1 , s 2 s k son A -ortogonales, entonces s k 1
calculado con (2.59) resulta también A -ortogonal a todos los vectores previamente
hallados. Para empezar, con s k :
s Tk A r (´1)
sT A s s T A r ( k 1) s s T A r ( k 1) 
T
0
k1 k k k k k sk A sk
s Tk Ask
Por otro lado, de (2.57) se concluye que:

(k )T
s Tk 1 A sj r Asj
y
1 ( j 1) r ( j)
As j r
 j
y por lo tanto, para j k :

1 1
s Tk 1 A s j  r (k ) T
r ( j 1)  r (k ) T
r ( j) 0
j   j 
El método de gradiente conjugada puede resumirse en los pasos siguientes:

(0)
Dado x
(0)
, determinar r s 0 b A x (0)
Y luego para k 0,1, 2 n 1:
qk A sk (no se requiere A en forma explícita)

T
r (k ) r (k )
k  T
sk qk
x ( k 1) x ( k ) s r (kk 1) k (2.61)
r (k ) q
k k
( k 1) T ( k 1) T ( k 1)
r qk r r
k T T
sk qk r (k ) r (k )

( k 1)
sk1 r k sk
Puede demostrarse que, operando con una aritmética perfecta:

k
1
(x ( k ) x) T A (x ( k ) x) 2 (x (0) x) T A (x (0) x)
 1 

(k )
siendo x la solución exacta, x la aproximación en el paso k y n (A) / 1 (A) el
número de condicionamiento de la matriz de coeficientes. La solución exacta debería

obtenerse en no más de n pasos, pero con la aritmética imperfecta de las computadoras
digitales pueden requerirse muchos más, especialmente si la matriz A está mal
condicionada.
Como ejemplo, considérese la solución del sistema de ecuaciones A x b definido por:
10 5 0 1 24
 
5 8 4 0 9
A  b

 1 18
 0 4 10 
1 0  
 81  30
La matriz de coeficientes A es simétrica y definida positiva.
Con la aproximación inicial x ( 0) 0 se obtienen r (0) s 0 b Ax (0) b (con lo que
r 43.370 ) y en sucesivos pasos:
k q As  x x s r r q r  s r s
1 315.00 0.104 2.498 -8.786 12.097 0.078 -6.919

120.00 0.937 -3.490 -2.790
114.00 1.874 6.134 7.535
246.00 3.123 4.395 6.729
2 -76.413 0.089 1.880 -1.959 4.897 0.164 -3.093
-87.055 0.687 4.288 3.831
79.778 2.547 -0.994 0.241
39.380 3.724 0.877 1.980
3 -9.792 0.226 1.180 0.258 3.268 0.445 -1.119
14.221 1.555 1.069 2.775
-14.893 2.601 2.378 2.486
12.503 4.172 -1.954 -1.072
4 1.611 0.160 1.000 0.000 0.000
6.663 2.000 0.000
14.827 3.000 0.000
-12.184 4.000 0.000
El método de gradiente conjugada puede ser generalizado para resolver cualquier

sistema de ecuaciones A x b (con A no singular):
Con x
(0)
arbitrario, se obtiene r (0) s 0 b A x (0)
Y luego para k 0,1, 2 n 1:
q k A Ts k (no se requiere A en forma explícita)

T
k r ( k ) r ( k )
q Tk q k
x ( k 1) x ( k ) q k k (2.62)
r ( k 1) r ( k )  k A qk
T
k r( k 1) r ( k 1)
T
r (k ) r (k )
s k 1 r ( k 1) k sk
Precondicionamiento
El término precondicionamiento se refiere a la conversión del sistema de ecuaciones

A x b en otro que puede ser resuelto más eficientemente, por ejemplo haciendo:
M 1 A x M 1b
La matriz no singular M es el precondicionador. Se requieren pocas modificaciones al

procedimiento de gradiente conjugada antes descrito. Con la aproximación inicial
1
x0 0 y por lo tanto r0 b A x 0 b se determina s 0 p 0 M r0 y luego se itera
para k 0,1, 2 n 1 con:
qk Ask
pk T rk
k
skT q k
xk 1 xk k sk
rk 1 rk k qk
pk1 M 1
rk 1 (no se requiere M 1 , más bien se resuelve M p k1 r k 1)
pT r
k1 k1
k
p Tk rk
sk1 pk1 k sk
El precondicionador debe ser tal que se satisfagan las condiciones:
M1 A I R siendo R pequeño
Las ecuaciones lineales de la forma M u v deben resolverse fácilmente
Las demandas de memoria adicional deben ser poco significativas
Nótese que estas condiciones son en alguna medida contradictorias. Por ejemplo, si
M A se cumple la primera condición (y en tal caso (M 1 A) 1 ) pero no la segunda.
En cambio el precondicionador diagonal M diag (A) puede implementarse muy
fácilmente, pero en general solo produce mejoras muy modestas. El pre

condici
onador de Gauss-Seidel se basa en la descomposición
A L D U
donde D es una matriz diagonal con los coeficientes de la diagonal principal de A y las

matrices L y U son triangulares, inferior y superior respectivamente, con ceros en la
diagonal principal. Por ejemplo:
10 5 0 1 0 0 0 0  10 0 0 0 0 5 0 1
    
5 8 4 0 5 0 0 0 0 8 0 0 0 0 4 0
1 4 
 4  0
0 10  0  0 0  0 10 0  0 0 0 1

  0 0 
1 0 8 1 1  0 1 0 0 8 0 0 0 0
Entonces obtiene: M (LD 1 I) (D U) Nótese que p k 1 M 1r k1 puede
efectuarse fácilmente, en dos pasos que involucran matrices de coeficientes triangulares:
(LD 1 I) z r k1
(D U) p k 1 z
Para el mismo sistema de ecuaciones lineales antes considerado:

q As x x s r r q r p M 1
r  s p s
k

0 0 24 43.370 1.718 1.718

0 9 0.633 0.633
0 18 2.016 2.016
0 30 3.656 3.656
1 24.000 1.079 1.854 -1.895 4.745 -0.548 0.024 -0.506

5.590 0.683 2.969 0.730 0.746
13.969 2.175 2.928 0.482 0.531
28.952 3.945 -1.238 -0.070 0.019
2 -1.310 1.651 1.019 0.267 1.236 -0.004 0.020 -0.014

1.314 1.914 0.800 0.057 0.072
2.306 3.051 -0.877 -0.053 -0.042
-0.883 3.977 0.220 0.017 0.018
3 0.240 1.201 1.002 -0.022 0.030 -0.002 0.001 -0.002

0.675 2.000 -0.011 0.000 0.000
-0.726 3.000 -0.006 0.000 0.000
0.170 3.998 0.015 0.002 0.002
4 -0.022 1.010 1.000 0.000 0.000

-0.011 2.000 0.000
-0.006 3.000 0.000
0.015 4.000 0.000
También en este caso se obtiene la solución exacta en n 4 pasos, pero puede
observarse que el error en el tercer paso, r 0.030 , es mucho menor que el que se
tenía cuando el proceso se aplicó sin precondicionador, r 3.268 .
Un precondicionador que por lo general es más efectivo cuando la matriz A es dispersa

(es decir, con baja densidad de coeficientes significativos) se obtiene de la factorización
incompleta de la matriz:
A LU R y R pequeño

Los factores L y U se determinan en forma similar al algoritmo de eliminación de
Gauss, pero sus coeficientes se suponen iguales a cero en todas las posiciones en las
que A (o en algunos casos una potencia de A ) no tiene un coeficiente significativo.
2.5 Sistemas Sobre-Determinados de Ecuaciones Lineales

El problema de determinación de los parámetros de un modelo lineal para aproximar un
conjunto de datos es frecuente. A fin de reducir la influencia de errores de medición, es
habitual hacer más mediciones que las estrictamente necesarias, de donde resultan más
ecuaciones que incógnitas.
Dada una matriz A de orden m n ( m n ) y un vector b de orden m , se requiere
determinar x de modo tal que A x sea la mejor aproximación posible a b .

Un proceso simple (y muy adecuado si los errores en los bi son estadísticamente
2
independientes) es el método de mínimos cuadrados, que consiste en minimizar la
T
magnitud del residuo r b A x (o minimizar r r r ) con respecto a las x . Dado
que:
f r T r bT b 2xT AT b xT AT A x (2.63)
y por lo tanto:
f
2 AT b 2 AT A x 0
x
el método de mínimos cuadrados puede formularse como la solución del sistema de
ecuaciones normales:
A T Ax AT b (2.64)
Si A a1 a2 a3 a n , la matriz simétrica C AT A T
tiene elementos cij a i a j .
La matriz C es no singular sólo si todas las columnas a k de la matriz A son

linealmente independientes.
Para formar las ecuaciones normales se requieren 1

2 mn n 3 operaciones. Para
3
resolver el sistema O 1 6n operaciones. La mayor parte del trabajo está en formar las
ecuaciones normales.
Considérese por ejemplo

1 0 0  1
0 1 0 2
x1
0 0 1  3
x
1 1 0 2 1
x 
0 1 1 3 2

1 0 1 1
las ecuaciones normales son en este caso:
3 1 1 x1  1
1 3 1 x2 1
1 1 3 x3  6

de donde:
T
x 1.25 1.75 3
Un método alternativo (y numéricamente mejor condicionado) se basa en al

descomposición de la matriz de coeficientes, A , en el producto de una matriz ortogonal,
Q , y una matriz triangular superior, R (en el capítulo relativo a valores y vectores
característicos se describen procedimientos que pueden ser empleados para esto).
Al tenerse A Q R (2.65)
T T
las ecuaciones normales A Ax A b pueden rescribirse:
T
A b Ax 0
R T QT b Q R x 0
T
y dado que Q Q I se obtiene:
R T QT b R x 0
La matriz R no es singular y por tanto:
R x QT b (2.66)
La matriz R es la misma que se obtendría al descomponer A T A en dos factores
triangulares por el método de Cholesky. Para el ejemplo precedente:

1 0 0 0.5774 0.2041 0.3536 
  
 0 1 0  0 0.6124 0.3536 
 0   1.7321 0.5774 0.5774
 0 1
Q R 
0 0 0.7071   
A 0 1.6330 0.8165
1 1 0 0.5774 0.4082 0  
   0 0 1.4142
0 1 1 0 0.6124 0.3536 
 
1 0 1 0.5774 0.2041 0.3536
de donde:
1.7321 0.5774 0.5774 x1  0.5774

T
Rx 0 1.6330 0.8165 x 2 Q b 0.4082
0 0 1.4142 x3  4.2426
y finalmente: x 1.25 T
1.75 3

Capítulo 2

Hochgeladen von

Dokumentinformationen

Originalbeschreibung:

Originaltitel

Copyright

Verfügbare Formate

Dieses Dokument teilen

Dokument teilen oder einbetten

Freigabeoptionen

Stufen Sie dieses Dokument als nützlich ein?

Sind diese Inhalte unangemessen?

Copyright:

Verfügbare Formate

Capítulo 2

Hochgeladen von

Copyright:

Verfügbare Formate

2.

Ecuaciones Algebraicas Lineales

En las secciones siguientes se supone que el sistema de ecuaciones tiene solución

La solución de sistemas de ecuaciones es un buen ejemplo de las diferencias entre las

si bien proporciona fórmulas explícitas es tremendamente ineficiente cuando se trata de

H. Scaletti - Métodos Numéricos: Ecuaciones Algebraicas Lineales 2-1

cualquier x 0 ), puede ser más conveniente utilizar un método iterativo en que se

obtiene una secuencia de soluciones aproximadas que convergen a la solución exacta.

2.2.1. Sistemas Triangulares

La solución de sistemas de ecuaciones lineales es particularmente simple cuando la

Si U es no singular ( u ii 0 para todo i), las incógnitas pueden evaluarse en el orden: n,

Este proceso se denomina “sustitución inversa”. Análogamente, para un sistema Lx = b,

En ambos casos, la solución del sistema requiere n divisiones y

2.2.2 Método de Gauss

H. Scaletti - Métodos Numéricos: Ecuaciones Algebraicas Lineales 2-3

a (1) x a (1) x a (1) x a (1) x b (1)

a (1) x a (1) x a (1) x a (1) x b (1)

a (1) x a (1) x a (1) x a (1) x b (1) (2.6)

a (1) x a (1) x a (1) x a (1) x b (1)

o en forma compacta: Ax = b. En lo que sigue se supone que A es no singular.

ésta se resta la ecuación 1 multiplicada por:

a (1) x a (1) x a (1) x a (1) x b (1)

En forma similar, puede eliminarse x2 de las ecuaciones i = 3,4,..n restando de la

y así sucesivamente hasta obtener el sistema triangular:

a (1) x a (1) x a (1) x a (1) x b (1)

(vTAv > 0 para v arbitrario). ji

H. Scaletti - Métodos Numéricos: Ecuaciones Algebraicas Lineales 2-5

Para estimar el esfuerzo de cómputo es habitual referirse al número de "operaciones"

resolver un sistema de n ecuaciones lineales, pero si n es grande (que es el caso en el

H. Scaletti - Métodos Numéricos: Ecuaciones Algebraicas Lineales 2-5

La matriz de coeficientes no es singular y el sistema tiene una solución única

Trabajando con 10 cifras significativas se obtiene:

 3.333333333 1010 x 2  7 3.333333333 1010

La solución correcta es, sin embargo, x1 2 . Es fácil comprobar que no se presenta

este problema si se evita el pivote pequeño intercambiando previamente las ecuaciones:

El intercambio de filas al que se ha hecho referencia se denomina “intercambio parcial”.

El intercambio parcial es generalmente satisfactorio, desde el punto de vista de la

H. Scaletti - Métodos Numéricos: Ecuaciones Algebraicas Lineales 2-7

Los elementos de L son justamente los coeficientes l ij usados durante la reducción; U

Se ha mencionado anteriormente que varios sistemas de ecuaciones con la misma

Para el ejemplo precedente:

H. Scaletti - Métodos Numéricos: Ecuaciones Algebraicas Lineales 2-6

H. Scaletti - Métodos Numéricos: Ecuaciones Algebraicas Lineales 2-7

Una posible alternativa es la de calcular los elementos de L y U mediante las fórmulas:

en lugar de efectuar “reducciones” como anteriormente. Esta modificación (Doolitle) es

El método de Crout efectúa la factorización A = LDR, donde L es la misma matriz

En particular, para A simétrica: R = LT. Este método no posee ventajas ni desventajas

H. Scaletti - Métodos Numéricos: Ecuaciones Algebraicas Lineales 2-9

2.2.5 Inversión de Matrices

H. Scaletti - Métodos Numéricos: Ecuaciones Algebraicas Lineales 2-9

En la columna de la izquierda se tienen la matriz A y sus sucesivas modificaciones. A la

Alternativamente, si la descomposición A = LU de una matriz A se conoce, la inversa

H. Scaletti - Métodos Numéricos: Ecuaciones Algebraicas Lineales 2-

Para las matrices L y U del ejemplo considerado:

2.2.6 Casos Especiales

Matrices Simétricas Definidas Positivas.

Puede observarse que, si los coeficientes en la etapa i son simétricos, aquellos en la

Considérese, por ejemplo, el sistema de ecuaciones con coeficientes simétricos:

H. Scaletti - Métodos Numéricos: Ecuaciones Algebraicas Lineales 2 - 11

La simetría de la matriz por reducirse permite hacer: l a (i ) a (i ) (utilizando a (i ) en

en lugar de i j n . El número de operaciones para la reducción (contando solo

También los requerimientos de memoria pueden reducirse, almacenando los coeficientes