Sie sind auf Seite 1von 5

3 S.E.L.

Métodos Directos

En este capı́tulo se trata de dar solución a un sistema de n ecuaciones lineales


con n incógnitas. Es una de las ramas más importantes del cálculo numérico, puesto
que es casi imposible desarrollar métodos discretos sin plantear sistemas de ecuaciones
lineales. Más aún, los sistemas que se forman a partir de problemas fı́sicos y/o quı́micos
son generalmente grandes en dimensión, necesitando una gran cantidad de recursos
como para ser resueltos en forma exacta. Para este tipo de problemas, generalmente
involucrando matrices sparse 1 , existen métodos especiales que se agrupan en una de
las rutinas computacionales más conocidas: LAPACK (Linear Algebra PACKage), que
fue programada en Fortran77.
Antes de comenzar a describir los métodos directos de resolución, que involucran
una cantidad finita de pasos a desarrollar, se darán ciertas definiciones necesarias para
comprender los conceptos en los que se basan.

3.1. Conceptos básicos


3.1.1. Unicidad de las soluciones
Un sistema de n ecuaciones lineales con n incógnitas:

A11x1 + A12x2 + .. . + A1nxn = b1


A21x1 + A22x2 + .. . + A2nxn = b2
A31x1 + A32x2 + .. . + A3nxn = b3
.
An1x1 + An2x2 + .. . + Annxn = bn,

se puede escribir en forma matricial de la siguiente manera:

𝐴11 ⋯ 𝐴1𝑛 𝑋1 𝐵1
[ ⋮ ⋱ ⋮ ][ ⋮ ] = [ ⋮ ]
𝐴𝑛1 ⋯ 𝐴𝑛𝑛 𝑋𝑛 𝐵𝑛

o Ax = b, donde A es la matriz de coeficientes, x es el vector de incógnitas y b es el


vector de constantes. Dicho sistema tiene solución ´única, si y solo si el determinante
de la matriz de coeficientes es no singular, es decir que |A| ̸= 0. Entonces las filas y columnas de dicha
matriz son linealmente independientes, es decir que ninguna fila (o
columna) es combinación lineal de otras filas (o columnas).
Si la matriz de coeficientes es singular, entonces el sistema tiene infinitas soluciones,
o ninguna solución, dependiendo del vector de constantes.

Ejemplo 18. El sistema de ecuaciones:

2x + y = 3
4x + 2y = 6
tiene infinitas soluciones. La matriz de coeficientes es singular y una de las ecuaciones
es combinación lineal de la otra. Es decir que cualquier solución de la primera de ellas
es también solución de la otra y viceversa.

Ejemplo 19. El sistema de ecuaciones:

2x + y = 3
4x + 2y = 0

no posee soluciones. La matriz de coeficientes es singular pero ninguna ecuación es


combinación lineal de la otra. Es decir que ninguna de las soluciones que posee la
primera ecuación satisface la segunda.

Ejercicio 6. Graficar los sistemas de ecuaciones de los ejemplos anteriores para con-
firmar la existencia ó no de las soluciones.

3.1.1. Normas vectoriales y matriciales


Una cuestión obvia que surge de analizar la unicidad de las soluciones en un sistema
es: ¿qué pasa si la matriz de coeficientes es casi singular, es decir que |A| es muy
pequeño? Un planteo lógico es ¿cuándo se dice que un determinante es pequeño? Es
necesario tener un patrón de medida, un valor para poder comparar y decidir si el
determinante es pequeño o no. Para ello, se lo puede comparar con alguna de las
normas matriciales existentes y decir que el determinante es pequeño si:

|A| ≪ ∥A∥.

Las siguientes son las normas matriciales más utilizadas.

Definición 6. Sea V un espacio vectorial sobre el campo R de los números reales. La


función de valores no negativos ∥ · ∥ se denomina norma del espacio V si se cumplen
los siguientes axiomas:

∥v∥ = 0, si y sólo si v = 0 y v ∈ V.

∥λv∥ = |λ|∥v∥, para todo λ ∈ R y todo v ∈ V.

∥u + v∥≤ ∥u∥ + ∥v∥, para todos u, v ∈ V.

Un espacio vectorial V, con una norma asociada, se denomina espacio vectorial


normado.

Cualquier norma de un espacio vectorial V = Rn se llama norma vectorial. Tres normas


vectoriales son comunes en el álgebra numérica: la norma 1, la norma 2 (o norma
euclideana) y la norma infinito.

n 7. La norma 1 del vector v = (v1 , v2 , . . . , vn )T ∈ Rn se define como:


Definició
𝑛
‖𝑉‖ 1 = ∑|𝑉1 |
𝑖=1

n 8. La norma 2 del vector v = (v1 , v2 , . . . , vn )T ∈ Rn se define como:


Definició
𝑛

‖𝑉‖ 2 = √∑|𝑉1 | 2
𝑖=1

En general, es posible definir la norma p, utilizando la misma noción aplicada en


las dos normas anteriores:

Definición 9. La norma p del vector v = (v1, v2, ... , vn)T ∈ Rn se define como:

𝑛
‖𝑉‖ 𝑝 = (∑|𝑉1 | 𝑝 ) 1/𝑝

𝑖=1

En particular, si se toma el limite sobre p, cuando p → ∞, de define la norma


infinito, que es una de las más utilizadas debido a lo simple que es calcularla:
Definición 10. La norma infinito del vector
n
v = (v1, v2,. .., vn)T ∈ Rn se define como:
∥v∥∞ = máx |vi |.
i=1

Cuando n = 1, cada una de estas normas se transforman en el valor absoluto, | · |,


el ejemplo más simple de una norma en R.
Cualquier norma del espacio vectorial Rn×n de matrices cuadradas de orden n será
llamada norma matricial. En particular, se considerarán normas matriciales
inducidas por normas vectoriales.
Definición 11. Dada cualquier norma ∥· ∥ en el espacio Rn de vectores
n-dimensionales, la norma matricial subordinada ó inducida del espacio Rn×n se
define como:
𝑚𝑎𝑥 ‖𝐴𝑣‖
‖𝐴‖ =
𝑣𝜖ℝ𝑛 ‖𝑣‖
Teorema 7. La norma matricial subordinada a la norma vectorial ∥ · ∥1 puede ser
expresada, para cualquier matriz n × n, A = (Aij)1≤i,j≤n ∈ Rn×n, como:
𝑛 𝑛

‖𝐴‖ 1 = 𝑚𝑎𝑥 ∑|𝐴𝑖𝑗 |


𝑗 = 1 𝑖=1

Este resultado es expresado en forma ligera diciendo que la norma 1 de una matriz es
igual al mayor valor de las sumas de los valores absolutos de los elementos de las
columnas.

Teorema 8. La norma matricial subordinada a la norma vectorial ∥ · ∥∞ puede ser


expresada, para cualquier matriz n × n, A = (Aij)1≤i,j≤n ∈ Rn×n, como:
𝑛 𝑛
‖𝐴‖ ∞ = 𝑚𝑎𝑥 ∑|𝐴𝑖𝑗 |
𝑖 = 1 𝑖=1
Este resultado es expresado en forma ligera diciendo que la norma infinito de una
matriz es igual al mayor valor de las sumas de los valores absolutos de los elementos
de las filas.

As´ı como se definieron axiomas para las normas vectoriales, existe uno para las
normas matriciales.

Teorema 9. Dada ∥· ∥, una norma matricial subordinada en Rn×n, se cumple que:


∥AB∥≤ ∥A∥∥B∥,

para cualquier par de matrices A, B ∈ Rn×n.

Comandos de EMT. Los comandos para calcular normas son:

norm(A:vector numérico, p:real no negativo), donde A es vector; p es la


norma que se desea calcular. Tener en cuenta que p=0 no calcula la norma
infinito, sino que identifica el mayor elemento del vector.

Norm(A:matriz numérica, p:entero), donde A es una matriz cuadrada; p es


la norma que se desea calcular, los valores permitidos son 0 (norma infinito), 1
ó 2. El paquete Calculo debe cargarse previamente en memoria.

Ejemplo en EMT 6. Calcular, para el vector [1; −2; 3; −4], las normas 1, 2 e infinito.

>norm([1;-2;3;-4],1)
10
>norm([1;-2;3;-4])
5.47722557505
>norm(abs([1;-2;3;-4]),0)
4
Ejemplo en EMT 7. Calcular, para la matriz:
1 2 3
[−4 5 −6]
7 8 9
las normas 1, 2 e infinito.

>Norm([1,2,3;-4,5,-6;7,8,9],1)
18
>Norm([1,2,3;-4,5,-6;7,8,9],2)
14.841377283
>Norm([1,2,3;-4,5,-6;7,8,9],0)
24

3.1.1. Condicionamiento de matrices


En la subsección anterior se definieron las normas matriciales. Su principal utilidad es
poder calcular el número de condición de una matriz, es decir, qué tan sensible es a las
perturbaciones cuando se trabaja con ella.
Sea A ∈ Rn×n tal que A−1 exista. El error entre la solución calculada x̃ de Ax = b
y x es:
e = x − x̃. (3.3)
Es decir que Ax = b, pero generalmente Ax̃ ̸= b. Entonces se define el residuo:

r = b − Ax̃. (3.4)
Se ve que:
Ae = Ax − Ax̃ = b − Ax̃ = r. (3.5)
Así e = A−1r. Es de notar que si e = 0, entonces r = 0, pero si los valores de r son pequeños,
entonces e no necesariamente tiene valores pequeños puesto que A−1 deberı́a tener valores
grandes, haciendo que A−1r tenga valores grandes. En otras palabras, un residuo r pequeño
no garantiza que x̃ sea cercano a x. A veces, r es calculado como un testeo superficial para
comprobar si x̃ es razonable. La principal ventaja de r es que siempre puede ser calculado
mientras que x puede ser desconocido y por lo tanto e no puede ser calculado en forma
exacta. Más allá de esto, puede mostrarse que considerar r en combinación con un número
de condición es el método más efectivo de verificar cuán cercano es x̃ a x.

Como e = A−1r, se puede asegurar que ∥e∥p ≤ A−1 r = Ae, por lo que ∥r∥p =
∥Ae∥p ≤ ∥A∥p ∥e∥p. As´ı:

‖𝑟‖ 𝑝
≤ ‖𝑥‖𝑝 ≤ ‖𝐴−1
p ‖𝑝 ‖𝑟‖𝑝
‖𝐴‖𝑝

De la misma forma, x = A−1b, entonces:

‖𝑏‖ 𝑝
≤ ‖𝑥‖𝑝 ≤ ‖𝐴p−1 ‖𝑝 ‖𝑏‖𝑝
‖𝐴‖𝑝

Si ∥x∥p ≠ 0, y ∥b∥p ≠ 0, entonces tomando recı́procos en (3.7) se obtiene:


1 1 ‖𝐴‖𝑝
≤ ≤
‖𝐴−1 ‖𝑝 ‖𝑏‖𝑝 ‖𝑥‖𝑝 ‖𝑏‖𝑝
Ahora, multiplicando términos correspondientes en (3.8) y (3.6):
1 ‖𝑟‖𝑝 ‖𝑒‖𝑝 ‖𝑟‖𝑝
≤ ≤ ‖𝐴−1 ‖𝑝 ‖𝐴‖𝑝
‖𝐴−1 ‖ 𝑝 ‖𝐴‖𝑝 ‖𝑏‖𝑝 ‖𝑥‖𝑝 ‖𝑏‖𝑝
Recordando que:
‖𝑥 − 𝑥̌‖𝑝 ‖𝑒‖𝑝
𝜖𝑟 = =
‖𝑥‖ ‖𝑥‖

Entonces:

1 ‖𝑟‖𝑝 −1 ‖ ‖𝐴‖
‖𝑟‖𝑝
≤ 𝜖 𝑟 ≤ ‖𝐴 𝑝 𝑝
‖𝐴−1 ‖𝑝 ‖𝐴‖𝑝 ‖𝑏‖𝑝 ‖𝑏‖𝑝

Se denomina residuo relativo a


‖𝑟‖𝑝 ‖𝑏 − 𝐴𝑥 ‖𝑝
=
‖𝑏‖𝑝 ‖𝑏‖𝑝