Sie sind auf Seite 1von 41

MATEMATICAS I (Curso 2011-2012)

Primer Curso del Grado en Ingeniera Electronica, Robotica y Mecatronica,


Ingeniera de la Energa e Ingeniera de Organizacion Industrial
Departamento de Matematica Aplicada II. Universidad de Sevilla
Leccion 5: Autovalores y Autovectores (Tema 4 del temario)

5.1.- Autovalores y autovectores.


Definicion y propiedades.
La ecuacion caracterstica. El teorema de Cayley-Hamilton.

5.2.- Diagonalizacion.
Matrices diagonalizables.
Matrices no diagonalizables.
Forma canonica de Jordan y matriz exponencial.

5.3.- Aplicaciones del calculo de autovalores y autovectores.

5.4.- Ejercicios.

A lo largo de todo el tema trataremos esencialmente con matrices cuadradas reales (aun-
que muchos de los resultados que veamos tambien seran validos para el caso de matrices cua-
dradas complejas). De todos modos, aun trabajando con matrices reales, sera imprescindible
hacer referencia a los numeros (y a los vectores) complejos. La razon es que necesitaremos
considerar las races de un polinomio con coeficientes reales (si la matriz es real) y estas
pueden ser complejas con parte imaginaria no nula.
Una matriz A cuadrada m m define una transformacion lineal sobre Km ,

x Km y = Ax Km .

Aunque la matriz sea real, cuando algunas de las races del llamado polinomio caracterstico
de A (que sera un polinomio real) sean numeros complejos, con parte imaginaria no nula,
sera conveniente referirnos a la transformacion definida por A sobre el espacio complejo Cm .
En estos casos, tendremos que considerar para vectores complejos todos los aspectos lineales
que hemos considerado en el tema 4: combinaciones lineales, dependencia/independencia
lineal, subespacios vectoriales de Cm , dimension, espacios nulo y columna, etc.

La transformacion de vectores que efectua la matriz A puede ser mas o menos sencilla
de describir dependiendo del vector (o de la direccion) sobre la que se efectue. El problema
fundamental que se aborda es el de la determinacion de las llamadas direcciones principales:
direcciones sobre las que la matriz A actua como la multiplicacion por un numero. Calculemos
para algunos ejemplos geometricos en el plano y en el espacio, los vectores sobre los cuales
la transformacion asociada a una matriz actua simplemente multiplicando por un numero.

1
2 Leccion 5.- Autovalores y autovectores.

Ejemplos.

(1) Consideremos la transformacion lineal en el plano consistente en la simetra respecto de


una recta r que pase por el origen de coordenadas. Aplicando esta transformacion sobre
un vector de dicha recta se obtiene el mismo vector y aplicandola sobre un vector de
la recta s perpendicular a r que pasa por el origen de coordenadas se obtiene el vector
opuesto. Los vectores (no nulos) de las rectas r y s se denominan vectores propios o
autovectores de la transformacion dada. Las rectas a veces se denominan direcciones
principales de la transformacion y los coeficientes 1 = 1 y 2 = 1, asociados a dichas
direcciones, se suelen denominar valores propios o autovalores.

(2) Consideramos un plano que pase por el origen en el espacio R3 y la transformacion


lineal T : R3 R3 que asocia a cada vector v R3 el vector T (v) R3 que se obtiene
al proyectar v (ortogonalmente) sobre el plano considerado. Si {v1 , v2 } son dos vectores
que generan el plano y v3 es un vector (no nulo) perpendicular al plano tenemos que

T (v1 ) = v1 , T (v2 ) = v2 , T (v3 ) = 0

con lo cual v1 , v2 y v3 son autovectores y los coeficientes respectivos 1, 1 y 0 son auto-


valores. Puesto que los vectores v1 , v2 y v3 forman una base de R3 , cualquier vec-
tor v R3 puede expresarse como combinacion de ellos y teniendo dicha expresion
v = v1 + v2 + v3 es inmediato obtener T (v) como combinacion lineal de los vectores
v1 , v2 y v3 ,
T (v) = T (v1 ) + T (v2 ) + T (v3 ) = v1 + v2 .

Por ejemplo, para el plano 2x 3y + z = 0 podemos tomar los vectores


2 3 2 3 2 3
3 1 2
6 7 6 7 6 7
v1 = 4 2 5 , v2 = 4 0 5 y v3 = 4 3 5

0 2 1

(la transformacion lineal no depende de como elijamos los vectores v1 , v2 y v3 ). Notemos


que a partir de lo anterior es facil obtener la matriz A de T respecto a la base canonica
(puesto que tenemos los vectores v1 , v2 y v3 y sus transformados expresados respecto
a la base canonica). La matriz A verifica
2 3 2 3

6 7 6 7
A 4 v1 v2 v3 5 = 4 Av1 Av2 Av3 5

y puesto que la matriz


2 3

6 7
P = 4 v1 v2 v3 5

tiene inversa (por ser sus columnas linealmente independientes), podemos despejar la

2
5.1.- Autovalores y autovectores. 3

matriz A,
2 32 31

6 76 7
A = 4 Av1 Av2 Av3 54 v1 v2 v3 5 =

2 3 2 3 2 3
3 1 0 6 5 3 20 12 4
6 7 1 6 7 1 6 7
= 4 2 0 0 5 4
28
2 3 13 5 = 28 4
12 10 6 5 .
0 2 0 4 6 2 4 6 26

(3) Si A es una matriz diagonal con elementos diagonales d1 , d2, . . . , dm , es claro que para
los vectores canonicos e1 , e2 , . . . , em se verifica Aek = dk ek .

(4) Si tomamos dos vectores {v1 , v2 } linealmente independientes del plano, cualquier trans-
formacion lineal T : R2 R2 queda determinada si conocemos como actua sobre
estos vectores. Si A es la matriz asociada a T respecto a la base canonica, podemos
determinar dicha matriz a partir de Av1 y Av2 (si conocemos las coordenadas de los
vectores v1 , v2 , Av1 y Av2 respecto a la base canonica). Si tomamos por ejemplo los
vectores

1 2
v1 = , v2 = , T (v1 ) = Av1 = 3v1 , T (v2 ) = Av2 = 2v2
2 1

(con lo cual tenemos una situacion en la que conocemos las direcciones sobre las cuales
la transformacion actua multiplicando por un numero), es facil determinar la matriz A
teniendo en cuenta que, puesto que v1 y v2 son linealmente independientes, la matriz
cuyas columnas son v1 y v2 tiene inversa y
2 3 2 3 2 3 2 3

6 7 6 7 6 7 6 7 3 0
A 4 v1 v 2 5 = 4 3v1 2v 2 5 = A 4 v1 v 2 5 = 4 v1 v 2 5 =
0 2

2 3 2 31

6 7 3 0 6 7
= A = 4 v1 v2 5 4 v1 v2 5
0 2

Notemos que de esta ultima expresion es facil obtener las matrices An , n = 1, 2, . . .


2 3 2 31

n
6 7 (3) 0 6 7
An = 4 v1 v2 5 4 v1 v2 5
0 2n

y, por tanto, los vectores que se obtienen al aplicar sucesivamente la matriz A sobre
un vector dado
u, Au, A (Au) = A2 u, . . . , An u, . . .

3
4 Leccion 5.- Autovalores y autovectores.

5.1.- Autovalores y autovectores.


5.1.1.- Definicion y propiedades.
Definicion. Sea A una matriz cuadrada de orden m. Diremos que un escalar C es un
autovalor de A si existe un vector v Cm , v 6= 0 tal que Av = v, en cuyo caso se dice
que v es un autovector de A asociado al autovalor .

Obviamente, si tenemos un autovector v de A asociado a un autovalor , cualquier multi-


plo no nulo de v tambien es un autovector de A asociado al mismo autovalor . Por otra
parte, si tenemos dos autovectores v1 y v2 asociados a un mismo autovalor , cualquier com-
binacion lineal no nula de dichos autovectores tambien es un autovector de A asociado al
mismo autovalor .

Observaciones.
(a) Al hacer transformaciones fila (o columna) sobre una matriz A, los autovalores y los
autovectores de la matriz que se obtiene NO guardan relacion (en general) con los auto-
valores y autovectores de la matriz original. En general, tampoco es cierto que los auto-
valores de una matriz suma/resta/producto de otras dos sean suma/resta/producto de
los autovalores de cada uno de los sumandos. Ejercicio. Busca ejemplos de todo lo
anterior.
(b) El concepto de autovalor y autovector no es exclusivo de los espacios de coordenadas,
ni de los espacios vectoriales de dimension finita. Por ejemplo, siendo V el espacio
vectorial de las funciones y : R R indefinidamente derivables y siendo T : V V
la aplicacion lineal y T (y) = y , se tiene que = 0 es un autovalor de T y todo
polinomio de primer grado es un autovector asociado. Por otra parte = 1 tambien es
autovalor y la funcion y(x) = ex es un autovector asociado.

5.1.2.- La ecuacion caracterstica. El teorema de Cayley-Hamilton.


Proposicion. Dada una matriz cuadrada A y un numero 0 C, son equivalentes:
(1) 0 es un autovalor de A.
(2) El sistema homogeneo (A 0 I) x = 0 es un sistema compatible indeterminado.
(3) dim [Nul (A 0 I)] 1. (3) El rango [A 0 I] no es maximo.
(4) La matriz (A 0 I) no tiene inversa.
(5) det [A 0 I] = 0.
Por tanto, los autovalores de A son las soluciones de la ecuacion p() = det [A I] = 0.
Esta ecuacion se denomina ecuacion caracterstica de la matriz A y p() = det [A I]
se denomina polinomio caracterstico.
Siendo A = [aij ] una matriz m m,


a11 a12 ... a1m


a21
a22 ... a2m
p() = det [A I] =
..
.. .. ..
= (1)m m + cm1 m1 + + c0
. . . .


am1 am2 . . . amm

4
5.1.- Autovalores y autovectores. 5

es un polinomio de grado m y, por tanto, tiene m races (contando cada una segun su
multiplicidad) que pueden ser reales o complejas no-reales (aun en el caso en que la matriz
A sea real).
El subespacio vectorial Nul [A 0 I] se denomina espacio propio asociado al autovalor
0 (notemos que en general estara compuesto por vectores complejos, los autovectores de A
asociados a 0 y el vector nulo),

Nul [A 0 I] = {0} {autovectores asociados a 0 } .

De manera habitual cuando hablemos de autovectores asociados a un autovalor nos referire-


mos a una base del espacio propio asociado, es decir autovectores linealmente independientes
de forma que cualquier autovector asociado al autovalor en cuestion sea combinacion lineal
de ellos.

Ejemplos. Ademas de los ejemplos considerados anteriormente, veamos algunos ejemplos


en los que la matriz A viene dada.

1 2
(1) Consideremos la matriz A = .
2 1
Autovalores: Para cualquier escalar tenemos que

1 2
AI = = det (AI) = (1)2 4 = 2 23 = (3)(+1).
2 1

Por tanto det (A I) = 0 = 3 o = 1.


Autovectores

asociados a 1 = 3 : son los vectores no-nulos que estan en el espacio nulo de


A 3I,

2 2 0 1 1 0 1 1
(A3I)x = 0 x = x2 v1 = ,
2 2 0 0 0 0 1 1

asociados a 2 = 1 : son los vectores no-nulos que estan en el espacio nulo de


A + I,

2 2 0 1 1 0 1 1
(A + I)x = 0 x = x2 v2 = .
2 2 0 0 0 0 1 1

(2) Consideremos la matriz asociada a un giro (en el plano) de centro el origen de coorde-
nadas y angulo [0, 2). En el caso = 0 se obtiene la identidad y en el caso =
la simetra respecto al origen de coordenadas. Si 6= 0, , al aplicar el giro sobre un
vector (real) distinto de cero se obtiene otro vector que en ningun caso sera un multi-
plo (real) del vector al que se aplica el giro. Esto quiere decir que la matriz del giro
no tiene ningun autovalor real (salvo en los casos = 0, ). Resolvamos la ecuacion

5
6 Leccion 5.- Autovalores y autovectores.

caracterstica

cos() sen()
G=
sen() cos()

cos() sen()

p() = det (G I) = =
sen() cos()

= (cos() ) (cos() ) + sen()2 =

= 2 2 cos() + 1 = 0 = cos() i sen() = ei .

Calculemos los autovectores asociados a cada uno de los autovalores.

1 = ei Tenemos que resolver el problema homogeneo (G 1 I) x = 0,



i sen() sen() 0 F2 iF1 i sen() sen() 0 sen() 6= 0
sen() i sen() 0 0 0 0 =

x1 1 1
= = x1 Nul [G 1 I] Gen v1 = .
x2 i i

2 = ei Es facil comprobar que



1
Nul [G 2 I] = Gen v2 = .
i

Las propiedades referidas a autovalores las podemos agrupar dependiendo de si pueden


obtenerse directamente de la definicion (con lo cual estaran involucrados los autovectores) o
si se obtienen a partir del polinomio caracterstico (algunas de ellas pueden obtenerse de las
dos formas).

Proposicion. Sea un autovalor de A y v un autovector asociado, entonces:

(1) es un autovalor de A y v es un autovector asociado.

(2) ( ) es un autovalor de A I y v es un autovector asociado.

(3) k es un autovalor de Ak y v es un autovector asociado.

(4) Si q() es un polinomio, entonces q() es un autovalor de q(A) y v es un autovector


asociado. (Ejemplo: 33 +52 7+2 es un autovalor de la matriz 3A3 +5A2 7A+2I).

(5) Si A tiene inversa, entonces 6= 0, 1 es un autovalor de A1 y v es un autovector


asociado.

(6) Sea A es una matriz real, = a+bi C, (a, b R) un autovalor de A y v = u+iw Cm


un autovector de A asociado a . Entonces = a bi C tambien es autovalor de A
y v = u iw Cm es un autovector de A asociado a .

6
5.1.- Autovalores y autovectores. 7

Proposicion. Sea A una matriz m m. Se verifica:


(a) A tiene a lo sumo m autovalores distintos.
(b) A y AT tienen los mismos autovalores (aunque los autovectores asociados pueden ser
distintos).

Proposicion. Sea A una matriz m m y sea


p() = det [A I] = (1)m m + cm1 m1 + + c1 + c0 =

= (1)m ( 1 ) ( m )

su polinomio caracterstico (es decir 1 , , m son los autovalores de A, iguales o distintos).


Se verifica:
(a) El determinante de A es igual al producto de sus autovalores (apareciendo cada uno, en
dicho producto, tantas veces como indique su multiplicidad como raz del polinomio
caracterstico)
1 m = det (A) = p(0) = c0 .

(b) La traza de A (la suma de los elementos diagonales de A) es igual a la suma de sus
autovalores (apareciendo cada uno, en dicha suma, tantas veces como indique su multi-
plicidad como raz del polinomio caracterstico)

1 + 2 + + m = (1)m1 cm1 = traza(A) := a11 + a22 + + amm .

Uno de los resultados mas importantes referidos a autovalores y autovectores es el


siguiente.

Teorema. A autovalores distintos corresponden autovectores linealmente independientes.


Es decir, si 1 , . . . , p son autovalores de A distintos dos a dos y v1 , . . . , vp son autovectores
de A asociados respectivamente a 1 , . . . , p , entonces

{v1 , . . . , vp } es linealmente independiente.

Demostracion.- En el caso de tener un solo autovector (p = 1) no hay nada que discutir. Supon-
gamos que p 2 y que los vectores v1 , . . . , vp son linealmente dependientes, entonces para un cierto
ndice k tendremos que {v1 , . . . , vk } son linealmente independientes y vk+1 es combinacion lineal
de ellos. Entonces, tendremos unos coeficientes 1 , . . . , k C tales que

vk+1 = 1 v1 + 2 v2 + + k vk . ()

Multiplicando por la matriz A en los dos miembros de esta igualdad tenemos


Avk+1 = 1 Av1 + 2 Av2 + + k1 Avk
k+1 vk+1 = 1 1 v1 + 2 2 v2 + + k1 k vk . ()

Multiplicando los dos miembros de la igualdad (*) por k+1 tenemos

k+1 vk+1 = 1 k+1 v1 + 2 k+1 v2 + + k k+1 vk .

7
8 Leccion 5.- Autovalores y autovectores.

y restando (**) obtenemos


0 = 1 (k+1 1 ) v1 + 2 (k+1 2 ) v2 + + k (k+1 k ) vk .
Puesto que los vectores v1 , . . . , vk son linealmente independientes, de la ultima igualdad tenemos
que los coeficientes tienen que ser todos nulos
1 (k+1 1 ) = 2 (k+1 2 ) = = k (k+1 k ) = 0
y puesto que los autovalores son distintos entre s k+1 6= 1 , . . . , k obtenemos
1 = 2 = = k = 0
y, por tanto vk+1 = 0 en contradiccion con el hecho de ser un autovector de A (asociado a k+1 ).

El siguente resultado tiene un caracer esencialmente teorico aunque puede utilizarse para
obtener algunas matrices relacionadas con una matriz A. No estamos en condiciones de dar la
demostracion en el caso general. Mas adelante veremos la demostracion en un caso especial.

Teorema (de Cayley-Hamilton). Sea p() = det (A I) el polinomio caracterstico de


una matriz cuadrada A, entonces p(A) = 0

Es decir, si una matriz A de orden 3 tiene como polinomio caracterstico, por ejemplo
p() = 3 + 22 5 + 7,
entonces la matriz verifica que
p(A) = 0 A3 + 2A2 5A + 7I = 0.
En este caso, puesto que el termino independiente es no-nulo, de la anterior ecuacion podemos
despejar A1 en funcion de potencias de A con exponente no-negativo. Ejercicio.- Hazlo.

5.2.- Diagonalizacion.
Consideremos una transformacion lineal T : Km Km y la matriz A asociada (cuadra-
da, mm) respecto de la base canonica C de Km . Es decir, siendo x las coordenadas cannicas
de un vector v y siendo y las coordenadas canonicas del transformado T (v), tenemos que
y = Ax. Consideremos otra base B y denotemos por x e y a las coordenadas de v y T (v),
respectivamente, respecto de dicha base B. Si P es la matriz del cambio de base C B
tenemos que x = P x e y = P y . Por tanto, la transformacion lineal T se puede expresar, en
coordenadas respecto a B mediante
y = Ax P y = AP x y = P 1 AP x .
Es decir, de la misma forma que A representa a T respecto a la base canonica, la matriz
B = P 1 AP tambien representa a T , pero respecto a la base B. Cuando dos matrices A y
B (cuadradas del mismo orden) estan relacionadas mediante la igualdad B = P 1 AP para
alguna matriz P no-singular, se dice que A y B son semejantes. En este caso se trata de
matrices que representan a la misma transformaion lineal respecto de bases distintas.
En este apartado vamos a considerar el problema de intentar determinar una matriz P
para la cual B = P 1 AP sea una matriz lo mas sencilla posible (que permita describir la
transformacion T asociada de la forma mas simple). La forma mas simple que se puede
plantear es el de una matriz diagonal. Para algunas matrices A sera posible obtener una
matriz diagonal y para otras no.

8
5.2.- Diagonalizacion. 9

5.2.1.- Matrices diagonalizables.


Definicion. Se dice que una matriz A m m es diagonalizable si existe alguna matriz P
no singular tal que P 1 AP es una matriz diagonal D. En este caso, se dice que P es una
matriz de paso que diagonaliza A y que la expresion A = P DP 1 es una diagonalizacion de
A.
Notemos que si 2 3
d1 0 0 . . . 0
6 7
6 0 d2 0 . . . 0 7
6 7
6 7
P 1 AP = D = 6 0 0 d3 . . . 0 7
6 . .. .. . . . 7
6 .
4 . . . . .. 7
5
0 0 0 . . . dm
entonces de la igualdad matricial AP = P D,
2 3
2 3 2 3 d1 0 . . . 0
6 7
6 7 6 76
0 d2 . . . 0 7
A v1 v2 . . . v = v1 v2 . . . v 6 7
4 m 5 4 m 56 .. .. . . . 7
4 . . . .. 5

0 0 . . . dm

se obtiene que cada columna, Avk , de la matriz AP es igual a la correspondiente columna


de P D. Es decir, cada columna de P es un autovector de A asociado al correspondiente
elemento diagonal de D, que sera un autovalor de A.
Por otra parte, el que la matriz P sea no-singular ( tiene inversa det (A) 6= 0) es
equivalente a que sus m columnas sean linealmente independientes.

Cuando sea posible, para construir una diagonalizacion de A bastara con obtener m
autovectores linealmente independientes. La matriz P de orden m que tenga a dichos auto-
vectores linealmente independientes como columnas (en un cierto orden) sera no-singular y
verificara AP = P D siendo D la matriz diagonal cuyos elementos diagonales son los auto-
valores (en el mismo orden en el que hayamos puesto los autovectores en la matriz P ). Por
tanto tenemos una diagonalizacion de A.

Notemos que si en una diagonalizacion A = P DP 1,

cambiamos el orden en las columnas de P y de forma simultanea cambiamos el orden


en los elementos diagonales de D, de manera que se correspondan columnas de P -
elementos diagonales de D, se obtiene otra diagonalizacion de A;

sustituimos cada columna de P por un multiplo no-nulo de dicha columna, se obtiene


otra matriz de paso distinta que tambien diagonaliza a A (la matriz D no cambia).

Proposicion. Sea A una matriz m m. Se verifica:

(1) A es diagonalizable si y solo si tiene m autovectores linealmente independientes.

(2) Si A es diagonalizable tambien lo es cualquier potencia Ak , k = 1, 2,

(3) Si A es diagonalizable tambien lo es cualquier matriz de la forma A I.

9
10 Leccion 5.- Autovalores y autovectores.

(4) Si A es diagonalizable tambien lo es cualquier polinomio en A

q(A) = ck Ak + + c1 A + c0 I.

(5) Si A tiene inversa, A es diagonalizable si y solo si lo es su inversa A1 .

(6) A es diagonalizable si y solo si lo es AT .

Si tenemos una diagonalizacion de A, P 1 AP = D A = P DP 1 se obtienen las siguientes


diagonalizaciones de Ak , A I, AT y A1 (si existe)

Ak = P D k P 1 , A I = P (D I)P 1 , AT = (P T )1 D(P T ), A1 = P D 1 P 1 .

Recordemos que a autovalores distintos corresponden autovectores linealmente indepen-


dientes. Por tanto,
Teorema. Si todos los autovalores de A son simples (A tiene m autovalores distintos),
entonces A es diagonalizable.

Para que una matriz sea diagonalizable no es imprescindible que todos sus autovalores
sean simples. Por ejemplo = 1 es un autovalor doble de la matriz
2 3
2 1 0
6 7
A=4 1 2 0 5

0 0 1

y A es diagonalizable (compruebalo!). Aunque hay matrices que no son diagonalizables, como


por ejemplo
2 1
B= .
0 2
Para analizar de forma mas detallada cuando una matriz es diagonalizable consideramos
los siguientes conceptos.

Definicion. Sea A una matriz m m y sea 0 un autovalor de A. Se llama:

(a) Multiplicidad algebraica de 0 , y se denota por ma (0 ), a la multiplicidad de 0


como raz del polinomio caracterstico p() = det (A I) de A. Es decir, p() puede
factorizarse como
p() = ( 0 )ma (0 ) q(),
siendo q() un polinomio (de grado m ma (0 )) que no se anula para 0 , q(0 ) 6= 0.

(b) Multiplicidad geometrica de 0 , y se denota por mg (0 ), a la dimension del espacio


nulo de A 0 I,

dim [Nul (A 0 I)] = m rango [(A 0 I)] .

Es decir, la multiplicidad geometrica es el numero (maximo) de autovectores lineal-


mente independientes asociados al autovalor.

10
5.2.- Diagonalizacion. 11

Lo unico que se puede afirmar en general sobre la relacion entre las multiplicidades
algebraica y geometrica de un autovalor de una matriz viene dado por el siguiente resultado.

Lema. Sea 0 un autovalor de una matriz A, entonces 1 mg (0 ) ma (0 ).

Teorema. A es diagonalizable si y solo si para cada autovalor se verifica que

ma () = mg ().

En ese caso, si 1 , . . . , p son (todos) los autovalores distintos de A y tenemos una base Bk de
cada uno de los subespacios Nul [A k I] (es decir, tenemos tantos autovectores linealmente
independientes asociados a k como indica su multiplicidad algebraica), entonces

B = B1 Bp

es una base de Rm o de Cm .

Por tanto:

Para determinar si una matriz es diagonalizable habra que determinar si cada autovalor
multiple tiene asociados tantos autovectores linealmente independientes como indique
su multiplicidad algebraica.

Para construir una diagonalizacion, cuando sea posible, habra que obtener tanto auto-
vectores linealmente independientes, asociados a cada autovalor, como indique su multi-
plicidad algebraica;

Vamos a demostrar el teorema de Cayley-Hamilton para las matrices diagonalizables.

Teorema (de Cayley-Hamilton). Sea p() = det (A I) el polinomio caracterstico de


una matriz cuadrada A, entonces
p(A) = 0.

D. Aunque el resultado es cierto para una matriz cuadrada arbitraria, aqu solo vamos a considerar
el caso en que A es diagonalizable.
Si A es diagonalizable mediante una matriz de paso P ,

P 1 AP = D = A = P DP 1 = 2 3
p(1 ) 0 ... 0
6 7
6 0 p(2 ) . . . 0 7
p(A) = P p(D)P 1 =P 6
6 .. .. .. .. 7
7 P 1 =
4 . . . . 5
0 0 ... p(m )
2 3
0 0 ... 0
6 7
6 0 0 ... 0 7
=P 6
6 .. .. . . .. 7
7 P 1 = 0.
4 . . . . 5

0 0 ... 0

11
12 Leccion 5.- Autovalores y autovectores.

Observacion.- Para una matriz diagonalizable A, el tener una diagonalizacion

P 1AP = D (diagonal),

permite obtener funciones de dicha matriz que esten definidas por polinomios o por series
de potencias. Por ejemplo,

Ak = P D k P 1 ,
polinomio(A) = P polinomio(D)P 1,
2 3
e1 0 0
" # 6 7

X Ak
Dk
X 6 0 e2 0 7
eA
= =P P 1 = P 6
6 .. .. . . .. 7
7 P 1
k=0 k! k=0 k! 4 . . . . 5
m
0 0 e

puesto que calcular la correspondiente funcion matricial para una matriz diagonal se reduce
a obtener el valor de dicha funcion en cada uno de los elementos de la diagonal principal.

5.2.2.- Matrices no diagonalizables.


Una matriz cuadrada A es diagonalizable si, y solo si, hay una base (de Rn o Cn ) formada
por autovectores de A. Cuando A no es diagonalizable hay situaciones en las que es necesario
encontrar tambien una base cuyos elementos verifiquen ciertas propiedades similares a las
de los autovectores de A. Estos seran los denominados autovectores generalizados de A.

Definicion. Sea A una matriz m m y sea un autovalor de A. Se dice que un vector


v 6= 0 es un autovector generalizado de A asociado a si se verifica que (A I)k v = 0
para algun entero positivo k.
Es decir, los autovectores generalizados de A asociados a son (excluyendo al vector
nulo), los vectores de los espacios nulos de las matrices (A I)k , k = 1, 2, 3, ...

Observaciones.

1) Es facil comprobar que



Nul (A I) Nul (A I)2 Nul (A I)k Nul (A I)k+1 . . .

2) Puesto que la dimension del espacio es finita, los subespacios anteriores no pueden crecer
de manera indefinida, sino que para un cierto valor r se verificara

Nul [A I] ( Nul (A I)2 ( ( Nul [(A I)r ] = Nul (A I)r+1 = .

3) Si v Nul (A I)k entonces Av Nul (A I)k . Es decir, si v es un autovector
generalizado, Av tambien lo es (o es el vector nulo).

El siguiente resultado indica que para calcular los autovectores generalizados hay que
llegar, a lo sumo, hasta la potencia ma (). Nos indica ademas que, si bien en general no es
cierto que para un autovector generalizado v asociado a se tenga que Av es v, se tiene en
cambio que Av es tambien autovector generalizado asociado a .

12
5.2.- Diagonalizacion. 13

Teorema. Sea A matriz m m y sea autovalor de A de multiplicidad algebraica ma ().


Existe un valor 1 r ma () tal que

dim (Nul [A I]) < < dim (Nul [(A I)r ]) = dim Nul (A I)ma () = ma (),

y Nul (A I)k = Nul (A I)ma () para k r.
Observaciones.

1) La proposicion anterior no contradice lo visto hasta ahora para autovectores: si A es dia-


gonalizable y es autovalor de multiplicidad algebraica ma () = l (su multiplicidad
geometrica sera por tanto mg () = l) el valor r de la proposicion anterior es r = 1.

2) Observe que segun el teorema anterior



los autovectores generalizados siempre son los
elementos de Nul (A I)ma () , aunque dependiendo de cada caso, dicho espacio
nulo puede coindicir con el espacio nulo de una potencia inferior de A I.

Ejemplo. Consideremos la matriz


2 3
1 0 2 2
6 7
4 4 1 2
A=6
6
7
7 .
4 4 8 4 9 5

4 5 1 5

Vamos a calcular una base de R4 formada por autovectores y autovectores generalizados de


A. Su polinomio caracterstico es pA (x) = (x 1)3 (x + 1), luego sus autovalores son 1 = 1
con multiplicidad algebraica ma (1 ) = 1 y 2 = 1 con multiplicidad algebraica ma (2 ) = 3.
Como 1 = 1 es autovalor simple, sus multiplicidades algebraica y geometrica coinciden.
Un autovector asociado a 1 = 1 es, por ejemplo, v1 = (1, 1, 3, 3)T y los demas autovectores
asociados al mismo autovalor son multiplos de v1 . Para el autovalor triple 2 = 1, las matrices
A 2 I y la escalonada superior obtenida de ella por eliminacion gaussiana son
2 3 2 3
2 0 2 2 2 0 2 2
6 7 Elim. Gauss. 6 7
6 4 3 1 2 7 6 0 3 3 6 7
A 2 I = 6 7 6 7 .
4 4 8 3 9 5 4 0 0 1 3 5

4 5 1 6 0 0 0 0

Puesto que A 2 I tiene rango 3, solo hay un autovector independiente asociado al auto-
valor 2 = 1 y por tanto, A no es diagonalizable. Los autovectores asociados son los multiplos
(no nulos) de v2 = (2, 1, 3, 1)T .
Calculemos una base de autovectores generalizados asociados al autovalor 2 = 1. Para
ello, debemos calcular las potencias A2 I hasta que una de ellas tenga rango mma (2 ) =
4 3 = 1 con lo cual el espacio nulo de dicha potencia de A 2 I tendra dimension 3. La
matrices (A 2 I)2 y la escalonada superior obtenida por eliminacion gaussiana son
2 3 2 3
4 6 0 2 4 6 0 2
6 7 Elim. Gauss. 6 7
2 6 8 9 0 7 7 6 0 3 0 3 7
(A 2 I) = 6 7 6 7 ,
4 0 3 0 3 5 4 0 0 0 0 5

8 7 0 9 0 0 0 0

13
14 Leccion 5.- Autovalores y autovectores.

cuyo rango es 2 (todava distinto de 1 = 4 ma (2 )). Por tanto la dimension del espacio
nulo de (A 2 I)2 es 2 y podemos obtener en dicho espacio nulo un autovector genera-
lizado v3 linealmente independiente con v2 , por ejemplo v3 = (0, 0, 1, 0)T . Notemos que
Nul ((A 2 I)2 ) = Gen {v2 , v3 }. La matriz (A 2 I)3 es
2 3
8 8 0 8
6 7
6 8 8 0 8 7
(A 2 I)3 = 6 7 ,
4 24 24 0 24 5

24 24 0 24

cuyo rango es 1 = 4 ma (2 ). Por tanto, el espacio nulo de (A 2 I)3 tiene dimension


3. En este espacio nulo podemos obtener un autovector generalizado v4 que sea linealmente
independiente con {v2 , v3 }, por ejemplo v4 = (1, 1, 0, 0)T . Notemos que

Nul ((A I)3 ) = Gen {v2 , v3 , v4 }

y que los vectores de este espacio son, ademas del vector nulo, todos los autovectores y auto-
vectores generalizados asociados al autovalor 1 = 1. As, hemos obtenido tres autovectores
(generalizados) asociados al autovalor triple 1 = 1 de una determinada forma, ampliando de
una base de Nul (A I) a una de Nul ((A I)2) y de esta a una de Nul ((A I)3). Podramos
haber obtenido una base de Nul ((A I)3 ) sin necesidad de pasar por bases de los espacios
intermedios. Por ejemplo, los vectores

w2 = (1, 1, 0, 0)T , w3 = (0, 1, 0, 1)T , w4 = (0, 0, 1, 0)T

forman una base de Nul ((A I)3 ).


Por tanto, tenemos como bases de R4

{v1 , v2 , v3 , v4 } y {v1 , w2 , w3 , w4 }.

Para observar la diferencia entre ellas (y entender por que, en general, es mas conveniente
encontrar una base por el procedimiento seguido para construir {v1 , v2 , v3 , v4 }) se propone
como ejercicio determinar la matriz P 1 AP tomando respectivamente como matriz P la
matriz cuyas columnas son las coordenadas de los vectores de cada una de las bases anteriores.
As, si formamos P1 = [v1 , v2 , v3 , v4 ] y P2 = [v1 , w2 , w3 , w4 ] obtenemos
2 3 2 3
1 0 0 0 1 0 0 0
6 7 6 7
6 0 1 1 1 7 6 0 1 2 2 7
P11AP1 = 6 7 , P21 AP2 = 6 7 .
4 0 0 1 1 5 4 0 1 0 1 5

0 0 0 1 0 4 1 4

Observamos que con P1 , en el bloque correspondiente al autovalor 1, este aparece en la


diagonal y ademas es un bloque triangular superior, es decir, en la matriz obtenida (que no
puede ser diagonal pues A no es diagonalizable), los autovalores aparecen en la diagonal y
el bloque del autovalor 1 al menos tiene ceros por debajo de la diagonal.
Sin embargo, con P2 ni el autovalor 1 aparece en la diagonal ni su bloque correspondiente
es triangular.
Si una matriz es diagonalizable al juntar autovectores independientes de autovalores
diferentes se obtiene una base de Rm (o de Cm ). De la misma forma cuando se unen bases

14
5.2.- Diagonalizacion. 15

de los espacios de autovectores generalizados se obtiene una base de Rm (o de Cm ). Siendo


mas preciso, tenemos el siguiente resultado.
Proposicion. Sea A una matriz cuadrada de orden m, con polinomio caracterstico

pA () = ( 1 )m1 . . . ( p )mp ,

con 1 , . . . , p distintos entre s. Si Bj es base de Nul (A j I)mj , para j = 1, . . . , p, la union


de dichas bases B = {B1 , . . . , Bp } es base de Rm (o de Cm ).

Observacion-Ejercicio. Segun vimos en el estudio de las propiedades del calculo de auto-


valores y autovectores, todo autovector de una matriz A es autovector de cualquiera de sus
potencias A2 , A3 , . . . El recproco no es cierto, en general. Por ejemplo, tomando la matriz

0 1
A=
0 0

se verifica que A2 es la matriz nula y, por tanto, cualquier vector no-nulo de R2 es autovector
de A2 asociado a su unico autovalor = 0. Sin embargo, hay vectores de R2 que no son
autovectores de A, por ejemplo v = [ 1, 1 ].
Determina los autovectores de cada una de las potencias de
2 3
0 0 1 0
6 7
6 0 0 0 1 7
A=6 7 .
4 0 0 0 0 5

0 0 0 0

5.2.3.- Forma canonica de Jordan y matriz exponencial.


En esta seccion veremos que los autovectores generalizados pueden elegirse de forma que
la matriz A puede escribirse de la forma

A = P JP 1

siendo J la forma canonica de Jordan que definimos a continuacion y P una matriz cuyas
columnas son autovectores generalizados independientes.
Definicion. Un bloque de Jordan es una matriz cuadrada triangular superior J() tal que:

a) Todos los elementos de la diagonal principal son iguales a .

b) Todos los elementos en la primera sobre diagonal son iguales a 1.

c) Todos los demas elementos son iguales a 0.

Por ejemplo un bloque de Jordan de orden cuatro es la matriz


2 3
1 0 0
6 7
6 0 1 0 7
J() = 6 7 .
4 0 0 1 5

0 0 0

15
16 Leccion 5.- Autovalores y autovectores.

Puede probarse el siguiente resultado


Teorema. Dada una matriz A de orden m m existe una base de autovectores generali-
zados tal que A = P JP 1, siendo P la matriz cuyas columnas es la base de autovectores
generalizados y J, a la que se denomina forma canonica de Jordan de A, es la matriz
2 3
J1 0 0
6 7
6 0 J2 0 7
J= 6 7
6 .. .. .. 7
4 . . . 5

0 0 Js

donde cada Jr es un bloque de Jordan de orden nr . El numero de bloques s es igual a la suma


de las multiplicidades geometricas de los autovalores diferentes de la matriz A. El mismo
autovalor puede estar en distintos bloques de Jordan Jr , pero el numero total de bloques
con ese autovalor es igual a su multiplicidad geometrica, mientras que el numero total de
elementos en la diagonal prinicpal con cada autovalor es su multiplicidad algebraica. Los
numeros nr y el numero total de bloques quedan determinados por la matriz A.
Observar que la matriz J es una matriz diagonal por bloques y tiene una estructura
muy particular. Es triangular superior, con los autovalores de A en la diagonal, la sobre
diagonal esta formada por unos o ceros y todos los demas elementos son ceros. Por tanto el
teorema anterior nos dice que aunque una matriz no sea diagonalizable siempre es semejante
a una matriz diagonal por bloques. (Aunque la matriz A sea real, las matrices J y P no
tienen por que ser reales).
Veamos algunos ejemplos que expliquen el contenido del teorema anterior.
Ejemplo 1.
Forma canonica de Jordan de la matriz
2 3
5 4 3
6 7
A=4 1 0 3 5 .
1 2 1

Obtenemos su polinomio caracterstico det (A I) = (2 + )(4 )2 . Por lo tanto


los autovalores de A son 1 = 2 con multiplicidad algebraica ma (1 ) = 1 y 2 = 4 con
ma (2 ) = 2.
Como 1 = 2 es un autovalor simple, su multiplicidad algebraica y geometrica coinciden,
y su valor es uno. Ya que el rango de la matriz A 4I es 2, la multiplicidad geometrica del
autovalor 2 es mg (2 ) = 32 = 1. Por lo tanto la matriz A no es diagonalizable. De acuerdo
con el teorema anterior la forma canonica de Jordan debera tener dos bloques de Jordan,
uno con el autovalor 1 de orden uno (porque este autovalor solo debe aparecer una vez en
la diagonal de J) y otro bloque de Jordan de orden dos asociado al autovalor 2 ya que este
autovalor debe aparecer dos veces en la diagonal de J. Por lo tanto la forma canonica de
Jordan de A es: 2 3
2 0 0
6 7
J = 4 0 4 1 5.
0 0 4

La matriz de paso P = v1 v2 v3 la obtenemos con la condicion de que A = P JP 1, o
lo que es lo mismo AP = P J. Entonces los vectores v1 , v2 y v3 deben verificar las siguientes

16
5.2.- Diagonalizacion. 17

condiciones: 8
>
< Av1 = 2v1
Av2 = 4v2
>
:
Av3 = v2 + 4v3

La condicion Av1 = 2v1 nos dice que v1 es un autovector asociado al autovalor 1 = 2,


T
por ejemplo, v1 = 1 1 1 .
La condicion Av2 = 4v2 nos dice que v2 es un autovector asociado al autovalor 2 = 4,
T
por ejemplo, v2 = 1 1 1 .
Para obtener v3 debemos resolver el sistema Av3 = v2 + 4v3 , es decir (A 4I) v3 = v2 .
Utilizando el metodo de Gauss, obtenemos
2 3 2 3 2 3
1 4 3 1 1 4 3 1 1 4 3 1
6 7 6 7 6 7
4 1 4 3 1 5 4 0 0 0 0 5 4 0 1 1 0 5

1 2 3 1 0 6 6 0 0 0 0 0

y la solucion es
2 3
1+
6 7
v3 = 4 5


T
siendo un parametro arbitrario. Tomando = 0, obtenemos que v3 = 1 0 0 .
Observar que, ya que (A 4I) v3 = v2 se obtiene que

(A 4I)2 v3 = (A 4I) v2 = 0,

por lo tanto v3 es un autovector generalizado asociado al autovalor 2 . Finalmente, hemos


conseguido descomponer A de la forma
2 32 32 31
1 1 1 2 0 0 1 1 1
6 76 76 7
A=4 1 1 0 54 0 4 1 54 1 1 0 5

1 1 0 0 0 4 1 1 0

y por lo tanto A = P JP 1.
Ejemplo 2.
Forma canonica de Jordan de la matriz
2 3
2 2 1
6 7
A=4 1 1 1 5 .
1 2 2

Obtenemos su polinomio caracterstico det (A I) = (1 )3 . Por lo tanto A tiene un


unico autovalor 1 = 1 de ma (1 ) = 3, con lo que en la diagonal de J el autovalor 1 = 1
aparecera tres veces. 2 3
1 2 1
6
Ya que el rango de la matriz A I = 4 1 2 1 7
5 es 1, la multiplicidad geometrica

1 2 1
del autovalor es mg (1 ) = 3 1 = 2, con lo que habra dos bloques de Jordan. Ya que la

17
18 Leccion 5.- Autovalores y autovectores.

matriz es de orden tres uno de los bloques es de orden uno y otro de los bloques es de orden
dos. Es decir que la forma canonica de Jordan de esta matriz es:
2 3
1 0 0
6 7
J=4 0 1 1 5 .
0 0 1

La matriz de paso P = v1 v2 v3 la obtenemos con la condicion de que A = P JP 1, o
lo que es lo mismo AP = P J. Entonces los vectores v1 , v2 y v3 deben verificar las siguientes
condiciones: 8
> Av1 = v1
<
Av2 = v2
>
:
Av3 = v2 + v3
La condicion Av1 = v1 nos dice que v1 es un autovector asociado al autovalor 1 = 1.
La condicion Av2 = v2 nos dice que v2 es un autovector asociado al autovalor 1 = 1.
Para obtener v3 debemos resolver el sistema Av3 = v2 + v3 , es decir (A I) v3 = v2 .
Obtenemos los autovectores asociados al autovalor 1 = 1. Para ello resolvemos el sistema
homogeneo (A I)x = 0, cuyas soluciones son los vectores de la forma
2 3
2 +
6 7
v=4 5 , , R.

Por tanto para obtener v1 y v2 , no tendramos mas que dar valores a y para que v1 y
v2 fuesen
2
independientes. Por ejemplo podramos tomar
3 2
3 = 1 y = 0, para obtener que
1 2
6 7 6 7
v1 = 4 0 5 y = 0 y = 1, para obtener que v2 = 4 1 5 . Ahora tendramos que resolver
1 0
el sistema (A I) v3 = v2 . Aplicamos el metodo de Gauss al sistema
2 3 2 3
1 2 1 2 1 2 1 2
6 7 6 7
4 1 2 1 1 5 4 0 0 0 1 5

1 2 1 0 0 0 0 2
que claramente no tiene solucion. El motivo de esta aparente contradiccion es que no podemos
fijar desde el principio el vector
2
v2 y debemos
3
trabajar con autovector v2 generico. Es decir
2 +
tomamos como vector v2 = 6 4 7
5 y al resolver (A I) v3 = v2 obtendremos los


valores de y adecuados para que dicho sistema tenga solucion. Resolvemos por el metodo
de Gauss el sistema
2 3 2 3
1 2 1 2 + 1 2 1 2 +
6 7 6 7
4 1 2 1 5 4 0 0 0 + 5

1 2 1 0 0 0 +
y obtenemos que el sistema tiene solucion si y solo si + = 0. Resuelvo el sistema anterior
tomando = = 1 y obtenemos que
2 3
1 + t 2s
6 7
v3 = 4 s 5 , t, s R.
t

18
5.2.- Diagonalizacion. 19

2 3
1
6
Si elegimos t = s = 0, obtenemos que v3 = 4 0 7
5. Finalmente la base de autovectores

0
generalizados esta formada por los vectores
2 3 2 3 2 3
1 1 1
6 7 6 7 6 7
v1 = 4 0 5 , v2 = 4 1 5 , v3 = 4 0 5

1 1 0
y
2 32 32 31
1 1 1 1 0 0 1 1 1
6 76 76 7
A = P JP 1 = 4 0 1 0 54 0 1 1 54 0 1 0 5

1 1 0 0 0 1 1 1 0
Ejemplo 3.
Forma canonica de Jordan de la matriz
2 3
1 0 2 2
6 7
6 4 4 1 2 7
A=6 7 .
4 4 8 4 9 5

4 5 1 5

Para esta matriz ya obtuvimos en la seccion anterior dos bases de autovectores genera-
lizados. Con la primera de las bases obtuvimos que A era semejane a una matriz tiangular
superior con los autovalores de la matriz en la diagonal, pero esa matriz no es la forma
canonica de Jordan, con la segunda obtuvimos que A era semejante a una matriz que ni
siquiera era triangular. Ahora vamos a obtener una base adecuada para comprobar que A es
semejante a su forma canonica de Jordan.
De la seccion anterior tenemos que los autovalores de la matriz son 1 = 1 con multi-
plicidad algebraica y geometrica uno y 2 = 1 con ma (2 ) = 3 y mg (2 ) = 1. Por lo tanto
la forma canonica de Jordan tiene dos bloques, uno asociado al autovalor 1 de orden uno y
otro asociado al autovalor 2 de orden tres. Por lo tanto su forma canonica de Jordan es
2 3
1 0 0 0
6 7
6 0 1 1 0 7
J =6 7 .
4 0 0 1 1 5

0 0 0 1

La matriz de paso P = v1 v2 v3 v4 la obtenemos con la condicion de que A = P JP 1,
o lo que es lo mismo AP = P J. Entonces los vectores v1 , v2 , v3 y v4 deben verificar las
siguientes condiciones: 8
> Av1 = v1
>
<
Av2 = v2
> Av3 = v2 + v3
>
:
Av4 = v3 + v4
La condicion Av1 = v1 nos dice que v1 es un autovector asociado al autovalor 1 = 1,
T
por ejemplo v1 = 1 1 3 3
La condicion Av2 = v2 nos dice que v2 es un autovector asociado al autovalor 2 = 1.
T
Tomamos como vector v2 = 2 3 , siendo un parametro arbitrario 6= 0.

19
20 Leccion 5.- Autovalores y autovectores.

La condicion Av3 = v2 + v3 da lugar al sistema (A I)v3 = v2 . Determinamos con la


condicion de que este sistema tenga solucion. Por el metodo de Gauss obtenemos
2 3 2 3
2 0 2 2 2 2 0 2 2 2
6 7 6 7
6 4 3 1 2 7 6 0 3 3 6 3 7
6 7 6 7
4 4 8 3 9 3 5 4 0 8 7 13 7 5

4 5 1 6 0 5 5 10 5
2 3
2 0 2 2 2
6 7
6 0 3 3 6 3 7
6 7
4 0 0 1 3 5

0 0 0 0 0
que este sistema tiene solucion para todo y su solucion es
2 3
2
6 7
6 7
v3 = 6 7
4 + 3 5


siendo y parametros arbitrarios con la condicion de que 6= 0.
La condicion Av4 = v3 + v4 da lugar al sistema (A I)v4 = v3 . Determinamos y con
la condicion de que este sistema tenga solucion. Por el metodo de Gauss obtenemos
2 3 2 3
2 0 2 2 2 2 0 2 2 2
6 7 6 7
6 4 3 1 2 7 6 0 3 3 6 3 7
6 7 6 7
4 4 8 3 9 + 3 5 4 0 8 7 13 7 + 5

4 5 1 6 0 5 5 10 5
2 3
2 0 2 2 2
6 7
6 0 3 3 6 3 7
6 7
4 0 0 1 3 + 5

0 0 0 0 0
que este sistema tiene solucion para todo y y su solucion es
2 3
+
6 7
6 7
v4 = 6 7
4 + + 3 5


siendo , y parametros arbitrarios con la condicion de que 6= 0. Eligiendo los valores
= 1, = 0 y = 0, obtenemos que la base de autovectores generalizados que nos da la
matriz P es la formada por los vectores:
2 3 2 3 2 3 2 3
1 2 0 1
6 7 6 7 6 7 6 7
1 1 0 1
v1 = 6
6
7
7 , v2 = 6
6
7
7 , v3 = 6
6
7
7 , v4 = 6
6
7
7
4 3 5 4 3 5 4 1 5 4 1 5

3 1 0 0
por lo tanto
2 32 32 31
1 2 0 1 1 0 0 0 1 2 0 1
6 7 6 7 6 7
6 1 1 0 1 7 6 0 1 1 0 7 6 1 1 0 1 7
A=6 7 6 7 6 7 .
4 3 3 1 1 5 4 0 0 1 1 5 4 3 3 1 1 5

3 1 0 0 0 0 0 1 3 1 0 0

20
5.2.- Diagonalizacion. 21

Acabamos esta seccion introduciendo brevemente el concepto de exponencial de una


matriz. Es conocido que la funcion exponencial ex puede desarrollarse en serie de potencias
de x y que dicha serie de potencias es convergente para todo x,

X 1 k
ex = x .
k=0 k!

Si A es una matriz cuadrada de orden m m entonces puede probarse que la serie



1 k
X 1 1
A = I + A + A2 + A3 +
k=0 k! 2! 3!

es convergente. A la matriz resultante (que es no singular) se le llama expnencial de la matriz


y se escribe eA , es decir

X 1 k
eA = A
k=0 k!

Evidentemente, si queremos obtener eA , debemos ser capaces de calcular previamente Ak .


Veamos las distintas situaciones que pueden presentarse:
Si A es una matriz diagonal
2 3
1 0 0
6 7
6 0 2 0 7
A= 6 7
6 .. .. .. 7
4 . . . 5

0 0 m

entonces 2 3
k1 0 0
6 7
k
6 0 k2 0 7
A = 6 7
6 .. .. .. 7
4 . . . 5

0 0 km
y
2 3
P
1 k
6

k! 1
0 0 7
6 k=0 7
6 P 7
1 k
A

X 1 k 6
6
0
k! 2
0 7
7
e = A = 6 k=0 7
k=0 k!
6
6
.. .. .. 7
7
6 . . . 7
4
P 5
1 k
0 0
k! m
k=0
2 3
e1 0 0
6 7
6 0 e2 0 7
= 6 7
6 .. .. .. 7
4 . . . 5

0 0 em

Si A es diagonalizable, entonces existe una matriz diagonal D con los autovalores de A


en la diagonal de D y una matriz de paso P no singular tal que A = P DP 1. En este caso

21
22 Leccion 5.- Autovalores y autovectores.

Ak = P D k P 1 y la mariz exponencial es
!

A 1 k
X X 1 k
e = A =P D P 1
k=0 k! k=0 k!
2 3
e1 0 0
6 7
6 0 e2 0 7
= P 6
6 .. .. .. 7
7 P 1 .
4 . . . 5

0 0 em
Cuando la matriz A no es diagonalizable haremos uso de la forma canonica de Jordan. En
primer lugar veremos que calcular potencias de bloques de Jordan es sencillo (aunque no
tan sencillo como calcular la potencia de una matriz diagonal). Por comodidad escribimos
la kpotencia para un bloque de orden cuatro, pero es sencillo intuir como sera para un
bloque de orden
2
n. 3
1 0 0
6
6 0 1 0 7 7
Si J() = 6 7 entonces
4 0 0 1 5
0 0 0
2 3
k(k1) k2 k(k1)(k2) k3
k kk1 2!
3!

6 7
k(k1) k2
k
J () =
6
6 0 k k1
k 2!
7
7
6 7
4 0 0 k k1
k 5

0 0 0 k
y la matriz exponencial de un bloque de Jordan sera
2 3
P P P k(k1) P k(k1)(k2)
1 k 1
6 k!
k!
kk1 2!k!
k2
3!k!
k3
7
6 k=0 k=1 k=2 k=3 7
6
P
P
P 7
1 k 1 k(k1 k2
6
6
0 k!
k!
kk1 2!k!
7
7
J() 6 k=0 k=1 k=2 7
e = 6
P P 7
1 k 1
6
6
0 0 k!
k!
kk1 7
7
6 k=0 k=1 7
4
P 5
1 k
0 0 0 k!

k=0
2 1 1 3
e e 2!
e 3!
e
6 1 7
6 0 e
e 2!
e 7
= 6 .7
4 0 0 e e 5

0 0 0 e

Si
2
A no es diagonalizable
3
podemos descomponerla en la forma A = P JP 1 , siendo J =
J1 0 0
6
6 0 J2 0 77
6
6 .. .. .. 7
7 su forma canonica de Jordan. Entones
4 . . . 5
0 0 Js
2 3
J1k 0 0
6 7
k
6 0 J2k 0 7
A =P 6
6 .. .. .. 7
7 P 1
4 . . . 5

0 0 Jsk

22
5.2.- Diagonalizacion. 23

y
2 3
eJ1 0 0
6 7
A 6 0 eJ2 0 7
e =P 6
6 .. .. .. 7
7 P 1
4 . . . 5

0 0 eJs

Acabamos con unos cuantos ejemplos.


Ejemplo 4. 2 3
1 1 0
6 7
Calcular la matriz exponencial eA de la matriz A = 4 1 2 1 5

0 1 1
Calculamos el polinomio caracterstico de la matriz A,

det (A I) = ( 1) ( 3)

Como la matriz tiene tres autovalores simples, es diagonaizable. Calculamos los autovectores
T
asociados a cada uno de los autovalores, que son: a 1 = 0 el autovector v1 = 1 1 1 ,
T
al autovalor 2 = 1 el autovector v1 = 1 0 1 y al autovalor 3 = 3 el autovector v1 =
T
1 2 1 . Por lo tanto

2 32 32 31
1 1 1 1 0 0 1 1 1
6 76 76 7
eA = 4 1 0 2 54 0 e 0 54 1 0 2 5

1 1 1 0 0 e3 1 1 1

Ejemplo 5. 2 3
5 4 3
Calcular la matriz exponencial eA de la matriz A del ejemplo 1, A = 6
4 1 0 3 7
5

1 2 1
Como ya tenemos calculada su forma canonica de Jordan, su matiz exponencial sera
2 32 32 31
1 1 1 e2 0 0 1 1 1
6 76 76 7
eA = 4 1 1 0 54 0 e4 e4 54 1 1 0 5

1 1 0 0 0 e4 1 1 0

Ejemplo 6.
2 3
1 0 2 2
6 7
6 4 4 1 2 7
Calcular la matriz exponencial eA de la matriz A del ejemplo 3, A = 6 7
4 4 8 4 9 5

4 5 1 5
Como ya tenemos calculada su forma canonica de Jordan, su matiz exponencial sera
2 32 32 31
1 2 0 1 e1 0 0 0 1 2 0 1
6 7 6 1 2 7 6 7
6 1 1 0 1 7 6 0 e e e 7 6 1 1 0 1 7
eA = 6 7 6 2! 7 6 7 .
4 3 3 1 1 5 4 0 0 e e 5 4 3 3 1 1 5

3 1 0 0 0 0 0 e 3 1 0 0

23
24 Leccion 5.- Autovalores y autovectores.

5.3.- Aplicaciones del calculo de autovalores y autovectores.


Vamos a considerar la relacion del calculo de autovalores y autovectores con los llamados
problemas de evolucion. Dichos problemas vendran expresados por una ecuacion en
diferencias en el caso discreto y por una ecuacion diferencial en el caso continuo.
En forma generica se tratara de obtener una funcion vectorial de variable discreta (en cuyo
caso tendremos una sucesion de vectores) o de variable continua (en cuyo caso tendremos
una funcion vectorial de variable real) determinadas por una condicion sobre su evolucion.
Como es natural solo consideraremos problemas lineales. De esta forma los correspondientes
conjuntos de soluciones tendran una estructura similar a la del conjunto de soluciones de un
sistema de ecuaciones lineales. Es decir, tendran una estructura de subespacio vectorial (o
de variedad lineal) y podran manipularse de forma analoga a la manipulacion de vectores de
coordenadas.

5.3.1.- Sistemas de ecuaciones en diferencias.


Aqu trataremos de obtener las sucesiones de vectores en Rm (o Cm )
u0 , u1 , u2 , u3 , . . . , un , . . .
en la que la relacion entre dos terminos consecutivos es lineal, constante y homogenea.
De forma mas precisa, la relacion entre dos vectores consecutivos sera de la forma
un+1 = Aun
siendo A una matriz cuadrada m m constante (independiente de n).

Definicion. Sea A una matriz cuadrada de orden m y sea u1 , u2 , . . . , un , . . . una sucesion


de vectores en Rm definidos de manera recurrente por
un = Aun1, n = 1, 2, . . .
a partir de un vector inicial u0 Rm . Una relacion de recurrencia de esta forma se llama
sistema de ecuaciones en diferencias lineal homogeneo de primer orden (con coeficientes
constantes). No nos ocuparemos aqu ni del caso no homogeneo, ni del caso de coeficientes
no constantes y muchisimos menos de casos no lineales.

A partir de la relacion un = Aun1 se tiene que un = An u0 y tenemos la expresion


del termino general un en funcion del vector original u0 . El problema es determinar las
potencias An de A. Tendremos esencialmente dos situaciones. Por un lado, el caso en que A
sea diagonalizable sera facil de tratar y por otro, el caso en el que A no sea diagonalizable que
necesitara de mas elaboracion puesto que tendremos que recurrir al calculo de autovectores
generalizados. Uno de los aspectos que permite estudiar la expresion del termino general un
(a partir de u0 ) es el comportamiento asintotico, es decir el comportamiento a largo plazo de
la sucesion un , que sucede con los vectores un cuando n se hace grande?
Proposicion. Sea A una matriz cuadrada de orden m y u0 Rm . Entonces
(a) Si A es diagonalizable, A = P DP 1 (P matriz de paso de orden m cuyas columnas
son autovectores de A linealmente independientes, D matriz diagonal cuyos elementos
diagonales son los autovalores correspondientes de A), se verifica que
An = P D n P 1 y un = An u0 = P D n P 1 u0 , n = 1, 2, . . .

24
5.3.- Aplicaciones del calculo de autovalores y autovectores. 25

(b) Si u0 es combinacion lineal de autovectores de A (independientemente de que A sea


diagonalizable o no),

u0 = c1 v1 + + ck vk y Avj = j vj , j = 1, . . . , k,

entonces
An u0 = c1 n1 v1 + ck nk vk .

Observaciones. Que sucede si A no es diagonalizable y u0 no es combinacion lineal de


autovectores? Sea A una matriz m m no diagonalizable.

(a) Si v es un autovector generalizado de A asociado a un autovalor , para un cierto valor


k se verifica que

(A I)v 6= 0, . . . , (A I)k1 v 6= 0, (A I)k v = 0.

Utilizando esto podemos determinar la solucion (sucesion de vectores) del sistema de


ecuaciones en diferencias un = Aun1 que tiene como valor inicial u0 = v. Para ello,
basta considerar la formula del binomio de Newton:

n n 0 n n1 1 n n2 2 n 1 n1 n
n
(a+b) = a b+ a b+ a b + ab + a0 bn
0 1 2 n1 n

p p(p 1) (p q + 1) p!
:= = , (0! := 1)
q q! q!(p q)!
que es aplicable a la potencia de una suma de matrices si estas conmutan. Es decir, si
A y B son dos matrices cuadradas que conmutan (AB = BA), se verifica la igualdad

n 0 n 1 n 2 n
(A + B) = n n
A B + A n1
B + A n2
B + + A0 B n
0 1 2 n

siendo A0 = B 0 = I. Puesto que las matrices A I y I conmutan, podemos aplicar


la formula del binomio de Newton y para n k obtenemos

An v = [I + (A I)]n v =

n n n
= (I)n + (I)n1 (A I)1 + + (A I)n v
0 1 n

puesto que (A I)k v = (A I)k+1 v = (A I)k+2 v = = 0

n(n 1) n2
= n v + nn1 (A I)v + (A I)2 v + +
2

n
+ + nk+1 (A I)k1 v
k1

y aparecen (a lo sumo) k sumandos en el sumatorio, independientemente de lo grande


que sea n. En los ejemplos que veremos k sera pequeno y apareceran pocos terminos
en el sumatorio.

25
26 Leccion 5.- Autovalores y autovectores.

(b) Si obtenemos una base {v1 , . . . , vm } (de Rm o Cm ) formada por autovectores generali-
zados de A, entonces puede encontrarse la solucion general del sistema de ecuaciones
en diferencias un = Aun1 para cualquier u0 Rn . Para ello, expresamos u0 como
combinacion lineal de los autovectores generalizados {v1 , . . . , vm },

u0 = 1 v1 + + m vm

con lo que
un = An u0 = 1 An v1 + + m An vm
y, por tanto, bastara determinar (An vj ) para cada autovector generalizado vj .

(c) Calculo de An . A partir de una base formada por autovectores generalizados {v1 , . . . , vm }
podemos calcular An sin mas que obtener los vectores {An v1 , . . . , An vm } y despejar An
de la igualdad matricial
2 3 2 3

6 7 6 7
An 4 v1 v2 . . . vm 5 = 4 An v1 An v2 . . . An vm 5 .

(d) Comportamiento asintotico de An u0 . Con este termino se designa al estudio del


comportamiento de la sucesion de vectores u0, u1 , u2 , . . . a largo plazo. Es decir se
trata de estudiar que sucede cuando n . Los vectores un

convergen a un cierto vector?


oscilan entre ciertos vectores?
tienden a ? Es decir, lmn ||un || = ?

Si tenemos un vector u0 expresado como combinacion lineal de autovectores y autovectores


generalizados
u0 = c1 v1 + + cm vm ,
la sucesion generada viene dada mediante

un = An u0 = c1 An v1 + + cm An vm

con lo cual podemos reducir el estudio al comportamiento de las sucesiones An v siendo v


un autovector o un autovector generalizado de A. En la situacion mas simple, que v sea un
autovector asociado a un cierto autovalor tenemos que

An v = n v

y, por tanto,

Si || < 1, tenemos que (n ) 0 y (An v) = (n v) 0.

Si || > 1, tenemos que (n ) y (||An v||) = (||n ||v||) +.

Si || = 1 hay que distinguir dos casos (al menos):

Si = 1, la sucesion de vectores An v = v es constante.

26
5.3.- Aplicaciones del calculo de autovalores y autovectores. 27

Si || = 1, 6= 1, puesto que |n | = 1 para todo n = 1, 2, . . . , los coeficientes


, 2 , 3 , . . . recorren la circunferencia unidad (no completa, infinitas veces) y los
vectores An v = n v presentan un comportamiento oscilante.

Veamos a continuacion dos ejemplos de como obtener An v.


Ejemplo 1. Calcular un = An u0 siendo
2 3 2 3
1 1 0 2
6 7 6 7
A=4 0 1 0 5 y u0 = 4 1 5 .
0 0 2 1
Por ser A triangular es inmediato que los autovalores son 1 = 1 (doble) y 2 = 2 (sim-
ple). Como es facil comprobar, mg (1 = 1) = 1 < ma (1 = 1) = 2 y la matriz A no es
diagonalizable. No existe una base de autovectores (1 y 2 aportan uno cada uno) y nece-
sitamos recurrir a un autovector generalizado de 1 para obtener una base de R3 formada
por autovectores y autovectores generalizados.
Autovectores asociados a 1 = 1,
8 2 39
>
< 1 >
=
6 7
(A I)x = 0 = Nul (A I) = Gen v1 = 4 0 5 .
> >
: ;
0

Autovectores generalizados asociados a 1 = 1,


8 2 39


>
< 0 >
=
6 7
(A I)2 x = 0 = Nul (A I)2 = Gen >
v1 , v2 = 4 1 5
>
.
: ;
0

Autovectores asociados a 2 = 2,
8 2 39
>
< 0 >
=
6 7
(A 2I)x = 0 = Nul (A 2I) = Gen v3 = 4 0 5 .
> >
: ;
1

Es decir, trabajaremos con la base de R3 formada por {v1 , v2 , v3 } (que en este caso sencillo
coincide con la canonica). As,
un = An u0 = An (2v1 + v2 v3 ) = 2An v1 + An v2 An v3 .
Por ser v1 y v3 autovectores:
An v1 = n1 v1 = 1n v1 = v1 y An v3 = n2 v3 = 2n v3 .
Mientras que por ser v2 autovector generalizado de 1 = 1, que verifica (AI)2 v2 = 0 (k = 2
en la formula dada anteriormente):
An v2 = [1 I + (A 1 I)]n v2

n(n1) n2
= n1 v2 + nn1
1 (A 1 I)v2 + 2
1 (A 1 I)2 v2 +

= 1n v2 + n1n1 v1 + 0 + ... = v2 + nv1 ya que (A I)v2 = v1 .

27
28 Leccion 5.- Autovalores y autovectores.

Finalmente

2+n
un = An u0 = 2v1 + (v2 + nv1 ) 2n v3 = (n + 2)v1 + v2 2n v3 = 1 .
2n

Ejemplo 2. Calcular un = An u0 siendo


2 3 2 3
3/2 1/2 1/2 0
6 7 6 7
A=4 0 2 1 5 y u0 = 4 2 5 .
1/2 1/2 5/2 1
Autovalores. Calculamos sus autovalores mediante la ecuacion caracterstica,
|A I| = 0 3 62 + 12 8 = 0 ( 2)3 = 0,
de donde obtenemos que 1 = 2 es un autovalor triple (ma (1 ) = 3). (Recuerdese
que la traza de la matriz debe coincidir con la suma de los autovalores; en este caso
ambas valen 6, puesto que tr(A) = 3/2 + 2 + 5/2 = 2 + 2 + 2 = 6). Si calculamos su
multiplicidad geometrica
mg (1 = 2) = 3 rango(A 2I) = 3 2 = 1
vemos que solo tiene un autovector asociado linealmente independiente, con lo que
necesitaremos encontrar dos autovectores generalizados (linealmente independientes)
para formar una base de R3 con autovectores y autovectores generalizados.
Autovectores:
2 32 3 2 3
12 1
2
1
2
x1 1
6 76 7 x1 x2 + x3 = 0 6 7
(A 2I)x = 4 0 0 1 54 x2 5 = 0 x = x2 4 1 5 .
1 x3 = 0
2
12 21 x3 0

Tomamos como autovector, por ejemplo, v1 = (1, 1, 0)T .


Autovectores generalizados:
(A 2I)2 x = 0
2 32 3 2 3 2 3
1
2
12 12 x1 1 0
6 1 76 7 6 7 6 7
4
2
12 12 54 x2 5 = 0 x1 x2 + x3 = 0 x = x1 4 1 5 + x3 4 1 5 .
0 0 0 x3 0 1
Tomamos como primer autovector generalizado (que debe ser linealmente inde-
pendiente con v1 ), por ejemplo, v2 = (0, 1, 1)T .
Finalmente, (A 2I)3 x = 0
2 32 3 2 3
0 0 0 x1 x1
6 76 7 6 7
4 0 0 0 54 x2 5 = 0 x = 4 x2 5 R3 arbitrario.
0 0 0 x3 x3

Podemos tomar como segundo autovector generalizado cualquier vector de R3 que


sea linealmente independiente con {v1 , v2 }, por ejemplo, v3 = (1, 0, 0)T .

28
5.3.- Aplicaciones del calculo de autovalores y autovectores. 29

Una vez que tenemos la base B = {v1 , v2 , v3 } formada por autovectores y autovectores
generalizados, calculamos las coordenadas de u0 en dicha base,
2 3 2 32 3 2 3
0 1 0 1 1
u0 = PB [u0 ]B 6
4 2 7
5 =6
4 1 1 0 76
54 7
5 [u0 ]B = 6
4 1 7
5 ,
1 0 1 0 1

es decir, u0 = v1 + v2 v3 .
Por tanto,
un = An u0 = An (v1 + v2 v3 ) = An v1 + An v2 An v3 .
Puesto que v1 es autovector de A asociado a 1 = 2, An v1 = n1 v1 = 2n v1 . Por otra parte,

An v2 = [1 I + (A 1 I)]n v2 = n1 v2 + nn1
1 (A 1 I)v2 + n(n1) n2
2
1 (A 1 I)2 v2 +
2 3 2 3
0 1
6 7 6 7
= 2n v2 + n2n1 v1 + 0 + ... = 2n 4 1 5 + n2n1 4 1 5

1 0

(por ser v2 autovector generalizado asociado a 1 = 2, que verifica (A 2I)2 v2 = 0 (k = 2


en la formula anterior) y ya que (A 2I)v2 = v1 ),

An v3 = [1 I + (A 1 I)]n v3 = n1 v3 + nn1
1 (A 1 I)v3 + n(n1) n2
2
1 (A 1 I)2 v3 +
2 3 2 3 2 3
1 1/2 1/2
6 7 6 7 n(n1) n2 6 7
= 2n 4 0 5 + n2n1 4 0 5 + 2
2 4 1/2 5

0 1/2 0

(por ser v3 autovector generalizado de 1 = 2, que verifica (A 2I)3 v3 = 0 (k = 3 en la


formula anterior) y ya que
2 3 2 3
1/2 1/2
6 7 6 7
(A 2I)v3 = 4 0 5 y (A 2I)2 v3 = 4 1/2 5 .
1/2 0

Notese que si hubieramos elegido una base formada por tres autovectores generalizados,

{w1 , w2 , w3 },

a partir de (A 2I)3 v = 0, tendramos

un = An u0 = An (1 w1 + 2 w2 + 3 w3 ) = 1 An w1 + 2 An w2 + 3 An w3 .

Para obtener cada uno los tres terminos An wi necesitaramos recurrir a una expresion analoga
a la obtenida para An v3 . De ah que, en general, sea recomendable construir la base de
Rn formada por autovectores y autovectores generalizados de forma progresiva: resolviendo
primero (A I)v = 0, despues (A I)2 v = 0, despues (A I)3 v = 0, etc.
No obstante, puesto que en el caso anterior todo vector es un autovector generalizado
(puesto que solo hay 1 autovalor), calcular An u0 conlleva los mismos calculos que obtener
An v3 .

29
30 Leccion 5.- Autovalores y autovectores.

5.3.2.- Sistemas lineales de ecuaciones diferenciales.


Una primera advertencia que debemos hacer es que solo vamos a considerar algunos
aspectos manipulativos de un tipo particularmente simple de ecuaciones y sistemas
de ecuaciones diferenciales. No vamos a considerar ni los problemas de la ciencia y la
ingeniera que dan lugar a dichas ecuaciones (desintegracion radiactiva, circuitos LCR, leyes
de Newton del enfriamiento y del calentamiento, dinamica de poblaciones, mezclas, reaccio-
nes qumicas,...) ni los conceptos fsicos (velocidad,...) o geometricos (recta tangente a una
curva,...) que pueden asociarse a una ecuacion diferencial, ni las variantes mas simples que
suelen asociarse a las ecuaciones y sistemas que consideraremos.
El estudio de las ecuaciones diferenciales sera uno de los topicos esenciales en la asignatura
Ampliacion de Matematicas de segundo curso.

Una ecuacion diferencial es una igualdad en la que aparece una incognita (que debemos
obtener) con la particularidad de que esta incognita no es un numero sino una funcion
(real de una variable real) definida en un intervalo (finito o infinito) y en la igualdad estan
involucradas, ademas de la propia funcion incognita, una o varias de las derivadas de dicha
funcion incognita. Siendo t la variable independiente, y(t) una funcion a determinar y f (t)
una funcion dada, la igualdad y (t) = f (t) es una ecuacion diferencial cuyas soluciones
son las primitivas de la funcion f (t). Suponiendo que las primitivas estan definidas en toda
la recta real, cuando fijamos un punto (t0 , y0 ) del plano, solo hay una de dichas primitivas
cuya grafica pase por dicho punto. La igualdad y (t) = y(t) es otra ecuacion diferencial
y sus soluciones son las funciones y(t) = ket siendo k una constante arbitraria. De entre
estas soluciones, solo hay una cuya grafica pase por el punto (t0 , y0) (la que se obtiene con
k = y0 et0 ). Las ecuaciones diferenciales se suelen clasificar atendiendo en primer lugar a su
orden, es decir, al mayor orden de derivacion (de la funcion incognita) que aparece en la
ecuacion. Por ejemplo:

(a) y 2y = cos(t), yy = 0, (y )2 + y = 0 son ecuaciones de primer orden,

(b) y = t2 3t, yy 2y = 3 son ecuaciones de segundo orden,

(c) y = 0 es una ecuacion de tercer orden, ...

Un tipo especial (e importante) de ecuaciones diferenciales lo constituyen las llamadas


ecuaciones diferenciales lineales. Se llama as a las ecuaciones diferenciales que resultan
de igualar una combinacion lineal de la funcion incognita y sus derivadas a una funcion dada,
siendo los coeficientes en dicha combinacion lineal funciones de la variable independiente.
Por ejemplo, la ecuacion
2y ty + et y = t2 1
es una ecuacion diferencial lineal de segundo orden (con coeficientes no constantes). Notemos
que la parte que afecta a la funcion incognita

L(y) := 2y ty + et y

actua de forma lineal sobre ella, es decir, siendo c1 y c2 constantes arbitrarias y siendo y1 (t)
e y2 (t) funciones para las que L(y) esta definida, se verifica

L(c1 y1 + c2 y2 ) = c1 L(y1 ) + c2 L(y2 ).

30
5.3.- Aplicaciones del calculo de autovalores y autovectores. 31

Este hecho hace que la estructura del conjunto de soluciones de una ecuacion diferencial lineal
L(y) = f (t) sea similar a la estructura del conjunto solucion de un sistema de ecuaciones
lineales Ax = b. Entre estas similitudes podemos destacar:

(a) Una combinacion lineal de soluciones de la ecuacion homogenea asociada L(y) = 0, es


solucion de dicha ecuacion homogenea.

(b) Al sumar una solucion de la ecuacion completa con una solucion de la ecuacion ho-
mogenea se obtiene una solucion de la ecuacion completa.

(c) Al restar dos soluciones de la ecuacion completa se obtiene una solucion de la ecuacion
homogenea.

(d) Si y1 es una solucion de la ecuacion L(y) = f1 (t) e y2 es una solucion de la ecuacion


L(y) = f2 (t), entonces y1 + y2 es una solucion de la ecuacion L(y) = f1 (t) + f2 (t).

El enunciado (d) se suele denominar, en forma rimbombante (pero descriptiva), prin-


cipio de superposicion. En forma reducida los enunciados (a), (b) y (c) nos dicen que
manipular el conjunto solucion de la ecuacion homogenea L(y) = 0 es analogo a manipular
un subespacio vectorial (que sera de dimension igual al orden de la ecuacion) y manipular el
conjunto solucion de la ecuacion completa L(y) = q(t) es analogo a manipular una variedad
afn (el conjunto solucion de un sistema completo Ax = b), siendo el subespacio director
el conjunto solucion de la ecuacion homogenea. Si tenemos una solucion particular yp (t) de
la ecuacion completa, se verifica que (al igual que para un sistema de ecuaciones lineales
Ax = b que sea compatible)
8 9 8 9 8 9
>
< solucion general >
=
>
< una solucion particular >
=
>
< solucion general >
=
de la => de la +> de la
> > > >
: ; : ; : ;
ecuacion completa ecuacion completa ecuacion homogenea

De entre las ecuaciones diferenciales lineales, cabe destacar las que tienen coeficientes
constantes, es decir, ecuaciones del tipo

y 3y + 4y = f (t).

Para este tipo de ecuaciones podremos dar una descripcion completa del conjunto solucion
de la ecuacion homogenea asociada y 3y + 4y = 0 as como metodos para abordar la
ecuacion completa.

La ecuacion lineal de primer orden.

Se suele escribir en la forma y + p(t)y = q(t), donde p(t) y q(t) son funciones continuas
en un intervalo I R. Para resolver la ecuacion de primer orden vamos a proceder en dos
etapas:

(1) Resolver (obtener la solucion general de) la ecuacion homogenea asociada.


R
y
y + p(t)y = 0 = = p(t) yh (t) = ce p(t) dt
y
siendo c una constante real arbitraria.

31
32 Leccion 5.- Autovalores y autovectores.

(2) Buscar una solucion particular de la ecuacion completa. Para buscar una solucion parti-
cular de la ecuacion completa vamos a usar un procedimiento debido a J.L. Lagrange y
que se conoce como metodo de variacion de los parametros. Esta tecnica tambien
es aplicable para ecuaciones lineales de orden superior y para sistemas de ecuaciones.
La idea consiste en buscar una solucion de la ecuacion completa que tenga la misma
forma R
yh (t) = ce p(t) dt
que la solucion general de la ecuacion homogenea asociada, pero sustituyendo la cons-
tante arbitraria c por una funcion c(t) que debemos determinar. Es decir, buscamos
una solucion de la forma R
yp (t) = c(t)e p(t) dt .
Sustituyendo yp (t) en la ecuacion y + p(t)y = q(t) nos queda
R  R  R
p(t) dt p(t) dt p(t) dt
q(t) = yp + p(t)yp = c (t)e + c(t) p(t)e + p(t)c(t)e =
R R R
R
p(t) dt p(t) dt p(t) dt
= c (t)e c (t) = q(t)e c(t) = q(t)e dt
R
p(t) dt
Por tanto, siendo (t) = e , la solucion general de la ecuacion completa viene
dada por

c 1 Z 1 Z

y(t) = yh (t) + yp (t) = + q(t)(t) dt = c + q(t)(t) dt ,


(t) (t) (t)

(otro problema es obtener las primitivas que aparecen involucradas en la expresion


anterior).

Una vez que tenemos la solucion general de la ecuacion basta sustituir para obtener la
solucion de un Problema de valor inicial: calcular la solucion de la ecuacion cuya grafica
pasa por un determinado punto. Es decir, dado un punto t0 I, una solucion del problema
de valor inicial (tambien conocido como problema de Cauchy) en t0 ,

y + p(t)y = q(t)
y(t0) = y0

es una funcion y = y(t) derivable en I que verifica las dos condiciones.

Teora general de los sistemas lineales.

La teora y las tecnicas de resolucion de los sistemas de ecuaciones diferenciales lineales


con coeficientes constantes corre paralela a la de las ecuaciones diferenciales lineales. En el
epgrafe siguiente estudiaremos las ecuaciones diferenciales lineales de segundo orden como
caso particular. Por comodidad y economa de tiempo, nos restringiremos al caso de los
sistemas de dos ecuaciones, las ideas esenciales son trasladables al caso general.

Definiciones Un sistema lineal plano con coeficientes constantes es un sistema de ecuaciones


diferenciales de la forma
y1 = a11 y1 + a12 y2 + f1 (t)
y2 = a21 y1 + a22 y2 + f2 (t)

32
5.3.- Aplicaciones del calculo de autovalores y autovectores. 33

en el que A = [aij ] es una matriz de numeros reales cuadrada de orden 2 que se llama matriz
de los coeficientes y f1 , f2 : [a, b] R son funciones continuas dadas. Se dice que el sistema
es homogeneo cuando las dos funciones f1 y f2 son iguales a la funcion cero.
Una solucion de dicho sistema es un par y1 e y2 de funciones derivables tales que para
cada t [a, b] se verifica
y1 (t) = a11 y1 (t) + a12 y2 (t) + f1 (t)
y2 (t) = a21 y1 (t) + a22 y2 (t) + f2 (t).
Si introducimos las funciones vectoriales y, f : [a, b] R2 dadas por

y1 (t) f1 (t)
y(t) = y f (t) = ,
y2 (t) f2 (t)
el sistema se escribe de forma abreviada como y (t) = Ay(t)+f (t). La estructura es la misma
que la de una ecuacion lineal de primer orden. De hecho, la teora de los sistemas lineales es,
como cabe esperar, una extension de las teoras de las ecuaciones lineales de primer orden.
Esto se pone de manifiesto en los siguientes resultados.

Teorema. Teorema de existencia y unicidad: Sean A = [aij ] una matriz cuadrada de orden
2 y f : [a, b] R2 una funcion vectorial continua. Dados un punto t0 [a, b] y un vector
y0 R2 , entonces el problema de valor inicial

y (t) = Ay(t) + f (t)
y(t0 ) = y0
tiene solucion unica en [a, b].

Este teorema nos dice, por ejemplo, que la solucion general de un sistema lineal plano
dependera de dos constantes que pueden determinarse fijando el valor de cada una de las
componentes de la funcion vectorial y(t) en un punto dado t0 .

Teorema. Estructura

de las soluciones de un sistema lineal:
Sea A = aij una matriz cuadrada de orden 2, sea f : [a, b] R2 una funcion vectorial
continua y consideremos el sistema lineal y (t) = Ay(t) + f (t). Entonces se verifican:
(1) Las soluciones del sistema homogeneo

asociado y (t)

= Ay(t) forman un espacio vectorial
(1) (2)
de dimension 2. En particular, si y (t), y (t) es una base de soluciones del sistema
homogeneo, entonces se dice que la funcion matricial formada columna a columna por
estas soluciones
Y (t) = y (1) (t) y (2) (t)
es una matriz fundamental de soluciones del sistema y = Ay. Observemos que esta
matriz verifica Y (t) = AY (t). Una vez que tenemos una matriz fundamental de solu-
ciones, la solucion general del sistema homogeneo es y(t) = Y (t)c, donde c R2 es un
vector de constantes arbitrarias.
(2) Si y (p) (t) es una solucion particular del sistema completo y (t) = Ay(t) + f (t), entonces
la solucion general del sistema completo es
y(t) = Y (t)c + y (p) (t) = c1 y (1) (t) + c2 y (2) (t) + y (p) (t),

siendo Y (t) = y (1) (t) y (2) (t) una matriz fundamental de soluciones del sistema
homogeneo asociado y c R2 un vector de constantes arbitrarias.

33
34 Leccion 5.- Autovalores y autovectores.

Sistemas homogeneos con coeficientes constantes.

De acuerdo con lo que acabamos de ver, para resolver un sistema lineal

y (t) = Ay(t) + f (t),

debemos hallar una matriz fundamental de soluciones del sistema homogeneo asociado y
una solucion particular del sistema completo. Empezaremos estudiando como se calculan
las soluciones de un sistema homogeneo y = Ay; luego veremos metodos para resolver el
sistema completo.
Podemos utilizar la solucion general de la ecuacion diferencial y = ay como gua para
resolver un sistema y = Ay. Teniendo en cuenta que las soluciones de la ecuacion y = ay
son de la forma y(t) = ceat no es descabellado buscar soluciones del sistema y (t) = Ay(t) de
la forma y(t) = et v siendo v un vector constante (independiente de t). Puesto que en dicho
caso y (t) = et v, sustituyendo tenemos

et v = Aet v Av = v.

Por tanto, 8 9 8 9
>
< y(t) = et v >
=
>
< es un autovalor de A >
=
es solucion de y v es un autovector .
> > > >
: ; : ;
y = Ay de A asociado a
Notemos que si v1 y v2 son dos autovectores de A lineamente independientes asociados
respectivamente a dos autovalores 1 y 2 , entonces las soluciones

y (1) (t) = e1 t v1 , y (2) (t) = e2 t v2

son linealmente independientes, al margen de que 1 y 2 sean iguales o distintos.

Que sucede si la multiplicidad geometrica de un autovalor es menor que la algebraica?


Hay que recurrir a los autovectores generalizados.

Que sucede con los autovalores y autovectores complejos no-reales? Para tener so-
luciones reales hay que separar la parte real y la parte imaginaria de las soluciones
complejas que obtengamos.

Para un sistema de dimension 2 podemos distinguir cuatro casos.

Teorema. Sea A una matriz real 2 2 y consideremos el sistema y = Ay.

(1) Autovalores reales y distintos. Supongamos que A tiene dos autovalores reales y
distintos y . Sea u un autovector asociado a y sea v un autovector asociado
a . Entonces las funciones vectoriales y (1) (t) = et u e y (2) (t) = et v son soluciones
linealmente independientes del sistema y = Ay. En consecuencia, la solucion general
de dicho sistema viene dada por

y(t) = c1 y (1) (t) + c2 y (2) (t) = c1 et u + c2 et v.

34
5.3.- Aplicaciones del calculo de autovalores y autovectores. 35

(2) Autovalor real doble y no defectivo. Supongamos que A tiene un autovalor real
doble que no es defectivo; es decir, que admite dos autovectores linealmente inde-
pendientes u y v. Entonces y (1) (t) = et u e y (2) (t) = et v son soluciones linealmente
independientes del sistema y = Ay. En consecuencia, la solucion general de dicho
sistema viene dada por

y(t) = c1 y (1) (t) + c2 y (2) (t) = c1 et u + c2 et v.

Observacion. Si una matriz cuadrada de orden 2 tiene un autovalor real doble y no defectivo,
entonces la matriz es diagonalizable y, automaticamente, diagonal. En ese caso, el sistema
lineal correspondiente no es propiamente un sistema sino, mas bien, dos ecuaciones separadas.
Si hemos descrito el procedimiento de resolucion de forma tan general es porque sigue siendo
valido para matrices de orden mayor, que pueden tener autovalores dobles, triples, etc., no
defectivos sin ser diagonales.

(3) Autovalor real doble y defectivo. Supongamos que A tiene un autovalor real doble
que s es defectivo; es decir, que admite solamente un autovector linealmente inde-
pendiente u. Entonces y (1) (t) = et u es una solucion del sistema y = Ay. Para buscar
una segunda solucion y (2) (t) que sea linealmente independiente de la anterior, hacemos
lo siguiente. Sea v un vector linealmente independiente del autovector u. Entonces

y (2) (t) = et [I + (A I)t] v

es una solucion del sistema homogeneo y = Ay independiente de y (1) (t). En conse-


cuencia, la solucion general de dicho sistema viene dada por

y(t) = c1 y (1) (t) + c2 y (2) (t) = c1 et u + c2 et [I + (A I)t] v.

Observacion. Este procedimiento de resolucion no es valido, tal y como se ha descrito, para

matrices de orden mayor que tengan autovalores dobles defectivos. La manera de trasladarlo al
caso general es la siguiente: el vector v que se toma para construir y (2) no puede ser cualquier
vector linealmente independiente del autovector u, debe ser un autovector generalizado; es
decir, un vector v tal que (AI)2 v = 0. Lo que ocurre con una matriz de orden dos que tiene
un autovalor doble defectivo es que, automaticamente, (A I)2 = 0 y todos los vectores
son autovectores generalizados.

(4) Autovalores complejos distintos. Supongamos que u = v + iw, donde i = 1 es
la unidad imaginaria, es un autovector complejo de A asociado al autovalor complejo
= + i ( 6= 0). Entonces

y (1) (t) = Re et u = et [v cos(t) w sen(t)]
y (2) (t) = Im et u = et [v sen(t) + w cos(t)]

son soluciones linealmente independientes del sistema y = Ay. En consecuencia, la


solucion general de dicho sistema viene dada por

y(t) = c1 y (1) (t) + c2 y (2) (t) = c1 Re et u + c2 Im et u .

35
36 Leccion 5.- Autovalores y autovectores.

Para un sistema lineal de ecuaciones diferenciales con coeficientes constantes

y (t) = Ay(t) + f (t)

siendo A una matriz real m m y f : [a, b] Rm una funcion vectorial continua, podemos
decir lo mismo que hemos visto para un sistema de dimension 2 en lo que se refiere a la
estructura de la solucion general del sistema homogeneo asociado y (t) = Ay(t), la relacion
entre la solucion general del sistema completo y la del sistema homogeneo, el teorema de
existencia y unicidad del problema de valor inicial asociado... En lo que se refiere a soluciones
asociadas a autovalores y autovectores tenemos los resultados siguientes.

Teorema. Sea A una matriz real m m,


(a1) Si v es un autovector de A asociado a un autovalor , entonces y(t) = et v es una
solucion (real o compleja) del sistema y = Ay.

(a2) Si A es diagonalizable y {v1 , , vm } es un conjunto de m autovectores linealmente


independientes, asociados respectivamente a los autovalores 1 , . . . , m (iguales o dis-
tintos, reales o complejos), entonces

y1 (t) = e1 t v1 , . . . , ym (t) = em t vm

son m soluciones linealmente independientes del sistema y = Ay. En el caso de auto-


valores/autovectores complejos no-reales bastara sustituir la pareja de soluciones com-
plejas et v, et v por la pareja formada por su parte real e imaginaria.

(b) Si u es un autovector generalizado de A asociado a un autovalor , entonces


 
1
y(t) = e t
I + (A I)t + + (A I)k tk + u
k!
es una solucion (real o compleja) del sistema y = Ay. Notemos que, puesto que u es
un autovector generalizado de A asociado a , se verifica que (A I)k u = para un
cierto valor de k en adelante y, por tanto, en la suma anterior bastara con considerar
una cantidad finita de sumandos (que a lo sumo sera la multiplicidad algebraica de ).

(c) Si y(t) es una solucion compleja del sistema y = Ay, entonces su parte real y su parte
imaginaria son soluciones de dicho sistema.

Observacion. Una forma habitual de dar la solucion general de un sistema homogeneo


y = Ay utiliza la denominada exponencial de una matriz. Si definimos la exponencial
de una matriz cuadrada A mediante

X 1 n 1 1
eA = A = I + A + A2 + A3 +
n=0 n! 2! 3!

entonces, se verifica que eA es una matriz no-singular (independientemente de A) y su inversa


es la que tiene que ser (analoga con la funcion exponencial real, y con la compleja),

X (1)n n 1 1
eA = A = I A + A2 A3 +
n=0 n! 2! 3!

36
5.3.- Aplicaciones del calculo de autovalores y autovectores. 37

De esta forma, para cualquier vector v Rm , podemos considerar la funcion

y(t) = eAt v

que verifica que y = Ay puesto que


  
d At d 1
e v = I + At + A2 t2 + v =
dt dt 2!
   
1 1 1
= A + A2 2t + A3 3t2 + v = A I + At + A2 t2 + v = AeAt v.
2! 3! 2!

Por tanto y(t) = eAt v, v Rm es la solucion general de y = Ay (las columnas de eAt son
soluciones linealmente independientes, eAt es una matriz fundamental de soluciones).
En general, para calcular de manera efectiva la exponencial eA de una matriz A, hay que
recurrir al calculo de autovalores y autovectores. En la situacion mas simple, cuando A es
diagonalizable, si P es una matriz de paso que diagonaliza A,

P 1AP = D = A = P DP 1 = An = P D n P 1 =

2 3
e1 0 . . . 0
6 7
6 0 e2 . . . 0 7
eA = P eD P 1 = P 6
6 .. .. . . .. 7
7 P 1 .
4 . . . . 5

0 0 . . . em

37
38 Leccion 5.- Autovalores y autovectores.

5.4.- Ejercicios.
Ejercicio 1.

(1) Determina la matriz de la simetra respecto al plano x + y z = 0.

(2) Determina la matriz de la proyeccion ortogonal sobre la recta



x + y z = 0,
r
x y + 2z = 0.

(3) Determina la matriz de la simetra respecto de la recta



x + y z = 0,
r
x y + 2z = 0.

Ejercicio 2. Dada la matriz 2 3


3 0 a
A6
4 3 1 b 7
5 .
2 0 c

(a) Calcula A de forma que (2, 0, 1)T sea un autovector cuyo autovalor correspondiente es
= 1.

(b) Halla los demas autovalores y autovectores.

Ejercicio 3. Determina los valores del parametro para los que es diagonalizable cada una
de las siguientes matrices,
2 3 2 3 2 3
1 0 0 0 2 0 0 1
6 7 6 7 6 7
A=4 a 1 0 5 , B=4 1 3 0 5 , C=4 2 3 5 .
1 1 2 +2 1 0 0 1

Ejercicio 4. Dada la matriz


2 3
1 0 1
A=6
4 2 2 7
5 , R.
3 0 1

(a) Calcula los valores de para los que A es diagonalizable.

(b) Para dichos valores de , calcula los autovalores y los autovectores de A1 .

(c) Para dichos valores de , calcula An , n = 1, 2, .

38
5.4.- Ejercicios. 39

Ejercicio 5. Estudia la diagonalizabilidad de las siguientes matrices en funcion de los pa-


rametros que aparecen.
2 3
2 3 2 3 1 0 0 0
a+3 b 1 5 0 0 6 7
6 7 6 7 6 a 1 0 0 7
A=4 0 a 0 5 , B = 4 0 1 b 5 , C=6 7 .
2 4 b d 1 0 5
a 1 c a+1 3 0 a
c e f 1

Ejercicio 6. Calcula bases de R3 formadas por autovectores y autovectores generalizados


de las siguientes matrices:
2 3 2 3
4 1 1 0 1 0
6 7 6 7
A=4 1 3 1 5 , B=4 0 0 1 5 .
0 1 1 2 5 4

Ejercicio 7. Determina la matriz de la transformacion lineal T : x R2 T (x) = Ax


R2 respecto de la base B = {v1 , v2 } siendo

1 1 1 5
A= , v1 = , v2 = .
1 3 1 4

Ejercicio 8. Sea f : R4 R4 la aplicacion lineal dada por f (x) = Ax, donde


2 3
a 1 1 1
6 7
0 b 0 3
A=6
6
7
7 .
4 1 2 c 1 5

0 1 0 d

(a) Halla A sabiendo que f (S1 ) = S2 , donde



x1 x2 = 0
S1 y S2 = Gen {(1, 2, 1, 1)T , (0, 3, 1, 2)T }.
x3 + x4 = 0

(b) Prueba que A no es diagonalizable.

(c) Halla una base de R4 formada por autovectores y autovectores generalizados.

Ejercicio 9. Demuestra:

(a) Si es un autovalor de una matriz cuadrada A, la multiplicidad geometrica de como


autovalor de A y como autovalor de AT es la misma.

(b) Si A es una matriz cuadrada diagonalizable con un unico autovalor (multiple) entonces
A es una matriz diagonal.

39
40 Leccion 5.- Autovalores y autovectores.

(c) Sea A una matriz diagonalizable y sea P tal que P 1 AP es diagonal. Demuestra que A2
y AT son diagonalizables y calcula matrices de paso que las diagonalicen.

Ejercicio 10. Sea A la matriz


2 3
1 1 0 1
6 7
6 0 2 0 0 7
A=6 7 , a R.
4 a1 1 2 a 5

0 a 0 a

(a) Determina los valores de a para los que A es diagonalizable.


(b) Para a = 1, diagonaliza la matriz A y calcula An , n = 1, 2, . . . Es valido el resultado
para n = 1, 2, . . . ? Justifica la respuesta.
(c) Para a = 1, diagonaliza cada una de las matrices siguientes:

A5 , A 7I, AT .

Ejercicio 11. Sea B = {b1 , b2 , b3 } una base de R3 y consideremos la matriz A definida por
las siguientes condiciones,

Ab1 = b1 , Ab2 = b3 y Ab3 = b2 .

(a) Comprueba que la matriz A esta bien definida.


(b) Calcula los autovalores de A.
(c) Calcula los autovectores de A expresados en funcion de la base B considerada y demues-
tra que A es diagonalizable.

Ejercicio 12. Calcula la matriz



X An 1 1
eA = = I + A + A2 + An +
n=0 n! 2! n!
para las matrices 2 3 2 3
1 1 2 0 2 1
A1 = 6
4 0 2 1 7
5 y A2 = 6
4 0 0 3 7
5 .
0 0 3 0 0 0


un = Aun1
Ejercicio 13. Calcula la solucion del problema de valor inicial siendo
u0
2 3 2 3
3 0 1 0
6 7 6 7
A=4 10 1 5 5 y u0 = 4 0 5 .
1 0 1 1

40
5.4.- Ejercicios. 41

Ejercicio 14. Resuelve el sistema de ecuaciones diferenciales y = Ay para las siguientes


matrices A:

1 1 1 1 1 2 1 1
(1) , . , ,
4 1 2 3 2 1 0 1
2 3 2 3 2 3
1 1 4 5 4 2 1 1 0
6 7 6 7 6 7
(2) 4 3 2 1 5 ,4 4 5 2 5 ,4 1 2 1 5 .
2 1 1 2 2 8 2 1 1
2 3 2 3 2 3
1 1 0 1 3 2 1 0 2
6 7 6 7 6 7
(3) 4 1 2 1 5 ,4 0 1 0 5 ,4 0 1 0 5 .
0 1 1 0 1 2 1 1 1

y = Ay
Ejercicio 15. Resuelve el problema de valor inicial para las siguientes ma-
y(0) = y0
trices A y valores iniciales y0 :

0 1 0
(1) A = , y0 = .
5 2 2
2 3 2 3
3 1 1 1
(2) A = 6
4 1 3 1 7
5 , y0 = 6
4 2 7
5 .
3 3 1 1
2 3 2 3
3 2 4 1
6 7 6
(3) A = 4 2 0 2 5 , y0 = 4 4 7
5.

4 2 3 1

41

Das könnte Ihnen auch gefallen