Sie sind auf Seite 1von 94

✬ ✩

Revisão de álgebra linear

Obs. Apenas uma pequena parte deste material será utilizado em sala
de aula.
O objetivo deste capı́tulo é fornecer a base matemática para a análise e
sı́ntese de sistemas de controle.
No estudo de álgebra linear a noção de conjunto é um conceito
fundamental.
Def. Um conjunto é definido como sendo uma coleção de objetos e é
explicitado listando-se seus elementos.

F = {0, 1, 2, · · · }

Uma outra forma de explicitar um conjunto é evidenciando alguma


propriedade comum de seus elementos:

F = {x ∈ R / x ≥ 0}

Conjuntos de interesse particular:

R : conjunto dos números reais


C : conjunto dos números complexos

✫ ✪
EEL 6001: Teoria de Sistemas Lineares I algebra.tex 1
✬ ✩

Corpos numéricos

Def. Um corpo numérico é um conjunto, denotado por F, de elementos


escalares e duas operações: adição e multiplicação - ambas definidas sobre
F, satisfazendo as seguintes propriedades:

1. ∀α, β ∈ F, α + β ∈ F, αβ ∈ F

2. Os números 0 e 1 são elementos de F tais que:

• α + 0 = α ∀α ∈ F
• 1α = α ∀α ∈ F

3. ∀α ∈ F então ∃ − α ∈ F

4. ∀α = 0 ∈ F então ∃ α1 ∈ F

5. Associatividade: ∀α, β, γ ∈ F

• (α + β) + γ = α + (β + γ)
• (αβ)γ = α(βγ)

6. Comutatividade : ∀α, β ∈ F

• α+β =β+α
• αβ = αβ

7. Distributividade: ∀α, β, γ ∈ F

• (α + β)γ = αγ + βγ

✫ ✪
EEL 6001: Teoria de Sistemas Lineares I algebra.tex 2
✬ ✩

Corpos numéricos

Exemplos:

1. S = {0, 1} com as definições usuais de soma e de multiplicação não


formam um corpo pois:
1+1=2

Entretanto, se redefinirmos as operações: sendo:

0+0=0 ; 1+1=1 ; 1+0=1


0.1 = 0 ; 0.0 = 0 ; 1.1 = 1

Com essas operações S = {0, 1} forma um corpo.

2. Considere o conjunto M2×2 de todas as matrizes 2 × 2 da forma:


 
x −y
M = 
y x

onde x, y são números reais arbitrários. A soma e de multiplicação de


matrizes são as usuais. Sejam os elementos neutros da soma e da
multiplicação:    
0 0 1 0
0=  ; I= 
0 0 0 1

Verificar que forma um corpo.

✫ ✪
EEL 6001: Teoria de Sistemas Lineares I algebra.tex 3
✬ ✩

Espaços lineares

Consistem de um conjunto X de elementos chamados vetores.


• Operações soma vetorial e multiplicação por escalar.
• Elemento nulo 0 ∈ X

Propriedades:

1. x + y = y + x , ∀ x, y ∈ X (comutativa)

2. (x + y) + z = x + (y + z) , ∀ x, y, z ∈ X (associativa)

3. 0 + x = x , ∀ x ∈ X

4. ∀ x ∈ X , ∃ (−x) ∈ X tal que x + (−x) = 0

5. (αβ)x = α(βx) , ∀ α, β ∈ R , ∀ x ∈ X

6. α(x + y) = αx + αy , ∀ α ∈ R , ∀ x, y ∈ X

7. (α + β)x = αx + βx , ∀ α, β ∈ R , ∀ x ∈ X

8. 1x = x , ∀ x ∈ X

✫ ✪
EEL 6001: Teoria de Sistemas Lineares I algebra.tex 4
✬ ✩

Exemplos
• Espaço X = Rn , com as operações de adição vetorial e multiplicação
por escalar definidas de maneira convencional
• Y = {0} , 0 ∈ Rn
• Z = span(v1 , v2 , . . . , vk ) , vi ∈ Rn , i = 1, . . . , k

 
span(v1 , v2 , . . . , vk ) = α1 v1 + · · · + αk vk : αi ∈ R
 
n
• W = f : R+ → R , f diferenciável

(f1 + f2 )(t) = f1 (t) + f2 (t) (soma)

(αf )(t) = αf (t) (multiplicação por escalar)

Note que um elemento em W é uma trajetória no Rn


 
• V = x ∈ W : ẋ = Ax
Os elementos de V são trajetórias do Rn soluções do sistema linear
ẋ = Ax
• Espaço dos polinômios em s de grau menor ou igual a n

✫ ✪
EEL 6001: Teoria de Sistemas Lineares I algebra.tex 5
✬ ✩

Subespaços lineares

Um subespaço vetorial é um subconjunto que é também um espaço


vetorial
Definição W é um subespaço vetorial de (V, F) se as seguintes condições
são verificadas:

• 0∈W

• ∀w1 , w2 ∈ W então w1 + w2 ∈ W

• ∀α ∈ F e ∀w ∈ W então αw ∈ W

Exemplos:
• X , Y, Z são subespaços do Rn

• V é um subespaço de W

 
x1
• x ∈ R2 : x =   é um subespaço do R2
αx1

✫ ✪
EEL 6001: Teoria de Sistemas Lineares I algebra.tex 6
✬ ✩

Independência linear. Base e Representações

• Os parâmetros considerados neste curso são números reais (a menos que


seja especificado diferentemente).

Matrizes: A (n × m), B (m × r), C (l × n), D (r × p)

Seja ai a i-ésima coluna de A e bj a j-ésima linha de B:

 
b1
 
  b2 
 
AB = a1 a2 · · · am  .. 
 . 
 
bm
= a1 b1 + a2 b2 + · · · + am bm

   
CA = C a1 a2 · · · am = Ca1 Ca2 · · · Cam

✫ ✪
EEL 6001: Teoria de Sistemas Lineares I algebra.tex 7
✬ ✩

   
b1 b1 D
   
 b2   bD 
   2 
BD =  .. D =  . 
 .   .. 
   
bm bm D

ai bi : matriz n por r (vetor n × 1 multiplicado por vetor 1 × r)


bi ai : só está definido para n = r (escalar)
• Espaço real de dimensão n: Rn
Cada vetor x ∈ Rn é uma ênupla de números reais

 
x1
 
 x2 
 
x= .. 
 . 
 
xn

✫ ✪
EEL 6001: Teoria de Sistemas Lineares I algebra.tex 8
✬ ✩

Um conjunto de vetores {x1 , x2 , . . . , xn }, xi ∈ Rn , é linearmente


dependente (LD) se e somente se existem escalares α1 , α2 , . . . , αn ,não
todos nulos, tais que

α1 x1 + α2 x2 + · · · + αn xn = 0

Se a igualdade for verdadeira apenas para

α1 = α2 = · · · = αn = 0

diz-se então que o conjunto {x1 , x2 , . . . , xn } é linearmente independente


(LI).

Se um conjunto de vetores {x1 , x2 , . . . , xn } é linearmente dependente,


existe pelo menos um αi diferente de zero e (por exemplo, se α1 = 0)

1
x1 = − [α2 x2 + α3 x3 · · · + αn xn ]
α1

isto é, um dos vetores (mas não necessariamente qualquer um) pode ser
escrito como uma combinação linear dos demais.

✫ ✪
EEL 6001: Teoria de Sistemas Lineares I algebra.tex 9
✬ ✩

Equivalentemente, os vetores são LI se

α1 x1 + α2 x2 + · · · + αn xn = β1 x1 + β2 x2 + · · · + βn xn

=⇒ α1 = β1 ; α2 = β2 ; · · · ; αn = βn

Ou ainda, se nenhum vetor xi puder ser expresso como combinação linear


dos demais.
O conceito de dependência linear depende do tipo (corpo) do escalar
considerado.
Considere o conjunto das funções racionais em s


s 1
,
s+1 s+2

Não existem escalares reais α1 , α2 não todos nulos tais que

s 1
α1 + α2 =0
s+1 s+2
No entanto, para escalares pertencentes ao corpo das funções racionais
em s, a igualdade vale se

1 s
α1 = − ; α2 =
s+2 s+1

✫ ✪
EEL 6001: Teoria de Sistemas Lineares I algebra.tex 10
✬ ✩

Dimensão

A dimensão de um espaço vetorial é o número máximo de vetores LI


desse espaço.
• Assim, no Rn há no máximo n verores LI.
• A dimensão de um espaço vetorial pode ser infinita: considere o espaço
das funções contı́nuas no intervalo [a, b]. Em particular, as funções
t, t2 , t3 , . . ..



αi ti = 0 ⇐⇒ α1 = α2 = · · · = 0
i=1

Um conjunto de vetores LI do Rn é uma base se qualquer vetor x ∈ Rn


puder ser expresso de forma única como uma combinação linear destes
vetores.
• Em um espaço de dimensão n, qualquer conjunto de n vetores LI forma
uma base
• Quaisquer duas bases de um espaço n-dimensional possuem o mesmo
número de elementos.

Seja {q1 , q2 , . . . , qn } uma base para o Rn , então qualquer vetor x ∈ Rn


pode ser escrito de maneira única como

x = α1 q1 + α2 q2 + · · · + αn qn

✫ ✪
EEL 6001: Teoria de Sistemas Lineares I algebra.tex 11
✬ ✩

Definindo a matriz quadrada Q (n × n)

 
Q q 1 q2 · · · q n

 
α1
 
 α2 
 
x = Q ..  = Qα
 . 
 
αn
 
α α1 α2 · · · αn é a representação de x na base {q1 , q2 , . . . , qn }.
A qualquer vetor x ∈ Rn , pode-se associar a base ortonormal

     
1 0 0
     
   1   0 
 0     
     
 0   0   0 
     
e1 =  ..  , e2 =  .  , . . . , en =  . 
 .   ..   .. 
     
     
 0   0   0 
     
0 0 1

✫ ✪
EEL 6001: Teoria de Sistemas Lineares I algebra.tex 12
✬ ✩

Um vetor x na base ortonormal {e1 , e2 , . . . , en } se escreve

   
x1 x1
   
 x2   x2 
   
x= ..  = x1 e1 + x2 e2 + · · · + xn en = In  .. 
 .   . 
   
xn xn

=⇒ se confunde com sua representação.

Exemplo: Considere o conjunto dos polinômios de grau menor do que 4.

Base: e1 = s3 ; e2 = s2 ; e3 = s; e4 = 1
Se x = s3 + 4s2 − 4s + 10, então

 
1
 
  4 
 
x= e1 e2 e3 e4   ,
 −4 
 
10
 
1 4 −4 10 é a representação de x na base escolhida.

✫ ✪
EEL 6001: Teoria de Sistemas Lineares I algebra.tex 13
✬ ✩

Mudança de Base

Se β e β̄ são as representações de um vetor x ∈ Rn em relação às bases


{e1 , e2 , . . . , en } e {ē1 , ē2 , . . . , ēn }, então

   
x= e1 e2 · · · en β= ē1 ē2 · · · ēn β̄

→ representar ei em termos de {ē1 , ē2 , . . . , ēn } ou vice-versa.

 
p1i
 
 p2i 
 
Seja pi =  ..  a representação de ei na base {ē1 , ē2 , . . . , ēn }:
 . 
 
pni

 
p1i
 
  p2i 
 
ei = ē1 ē2 · · · ēn  .. 
 . 
 
pni
 Epi , i = 1, 2, . . . , n

✫ ✪
EEL 6001: Teoria de Sistemas Lineares I algebra.tex 14
✬ ✩

Usando notação matricial

   
e1 e2 · · · en = Ep1 Ep2 · · · Epn

 
= E p 1 p2 · · · p n
 
p11 p12 · · · p1n
 
  p21 p22 · · · p2n 
 
= ē1 ē2 · · · ēn  .. .. .. .. 
 . . . . 
 
pn1 pn2 · · · pnn
 
 ē1 ē2 · · · ēn P

   
x= ē1 ē2 · · · ēn Pβ = ē1 ē2 · · · ēn β̄

Como a representação é única: β̄ = P β


Analogamente, representando ēi na base {e1 , e2 , . . . , en }, obtém-se

β = Qβ̄

✫ ✪
EEL 6001: Teoria de Sistemas Lineares I algebra.tex 15
✬ ✩

→ conhecida a representação de um vetor numa base, a representação


em outra base pode ser automaticamente determinada:

β̄ = P β = P Qβ̄ , ∀β̄
P Q = I → P = Q−1

Exemplo: polinômios de grau menor do que 4.

Base: ē1 = s3 − s; ē2 = s2 − s; ē3 = s − 1; ē4 = 1


Se x = s3 + 4s2 − 4s + 10, então

 
1
 
  4 
 
x= ē1 ē2 ē3 ē4  
 1 
 
11

✫ ✪
EEL 6001: Teoria de Sistemas Lineares I algebra.tex 16
✬ ✩

Operadores lineares

Transformação Linear

Uma função f : X → Y é um operador linear se

f (α1 x1 + α2 x2 ) = α1 f (x1 ) + α2 f (x2 )

para quaisquer escalares α1 , α2 e x1 , x2 ∈ X .

y = f (x) ; x ∈ X (domı́nio) , y ∈ Y (range)

Exemplo: Seja g uma função contı́nua sobre [0, T ]. A transformação

 T
y(t) = g(t − τ )x(τ )dτ
0

é linear, levando do espaço das funções contı́nuas no intervalo [0, T ] para


o mesmo espaço.

✫ ✪
EEL 6001: Teoria de Sistemas Lineares I algebra.tex 17
✬ ✩

Teorema: Sejam X e Y espaços lineares de dimensão n e m,


respectivamente. Sejam {x1 , x2 , . . . , xn } vetores LI de X . Então, o
operador linear L : X → Y é unicamente determinado pelos n pares
yi = L(xi ), i = 1, 2, . . . , n. Além disso, com relação à base {x1 , x2 , . . . , xn }
de X e à base {u1 , u2 , . . . , um } de Y, L pode ser representado por uma
matriz A m × n. A i-ésima coluna de A é a representação de yi na base
{u1 , u2 , . . . , um }.

Prova: Como L é linear,

L(x) = L(α1 x1 + α2 x2 + · · · + αn xn )
= α1 L(x1 ) + α2 L(x2 ) + · · · + αn L(xn )
= α1 y1 + α2 y2 + · · · + αn yn

 
a1i
 
 a2i 
 
Seja  ..  a representação de yi na base {u1 , . . . , um }
 . 
 
ami
 
a1i
 
  a2i 
 
yi = u 1 u2 · · · u m  ..  , i = 1, 2, . . . , n
 . 
 
ami

✫ ✪
EEL 6001: Teoria de Sistemas Lineares I algebra.tex 18
✬ ✩

Neste caso,

   
L( x1 x2 · · · xn ) = y1 y2 · · · yn

 
a11 a12 · · · a1n
 
   a21 a22 · · · a2n 
 
= u1 u2 · · · u m  . .. ... .. 
 .. . . 
 
am1 am2 · · · amn
 
 u 1 u2 · · · u m A

Em relação às bases {x1 , x2 , . . . , xn } e {u1 , u2 , . . . , um },

y = L(x)
   
u1 u2 · · · um β = L( x1 x2 · · · xn α)
 
= u1 u2 · · · um Aα =⇒ β = Aα

Para se descrever a transformação, não há diferença entre especificar x, y


ou α, β. É claro que A (representação da transformação linear) depende
das bases escolhidas.

✫ ✪
EEL 6001: Teoria de Sistemas Lineares I algebra.tex 19
✬ ✩

Transformação de Similaridade

Considere a transformação linear L : X → Y, com a mesma base para o


domı́nio X e o range Y.

{e1 , e2 , . . . , en } → A , {ē1 , ē2 , . . . , ēn } → Ā

L
x y (= L(x))
 
A
e1 · · · en α β (= Aα)

P Q P Q = P −1

  Ā
ē1 · · · ēn ᾱ β̄ (= Āᾱ)

β̄ = Āᾱ ; β̄ = P β = P Aα = P AP −1 ᾱ

=⇒ Āᾱ = P AP −1 ᾱ , ∀α

✫ ✪
EEL 6001: Teoria de Sistemas Lineares I algebra.tex 20
✬ ✩

Ā = P AP −1 = Q−1 AQ
A = P −1 ĀP = QĀQ−1

=⇒ Q = P −1

A, Ā : matrizes similares
P AP −1 , P −1 ĀP : Transformações de Similaridade
Todas as representações de um operador linear são similares. Uma matriz
A ∈ Rn×n pode ser vista como a representação de um operador linear ou
como o operador linear propriamente dito.
Exemplo de transformação linear: A transformação que rotaciona
um ponto no plano de 90o no sentido anti-horário

y3

x2 = y1
x3

y2 x1

✫ ✪
EEL 6001: Teoria de Sistemas Lineares I algebra.tex 21
✬ ✩

Em relação à base {x1 , x2 }

 
  0
y1 = L(x1 ) = x1 x2  
1
 
  −1
y2 = L(x2 ) = x1 x2  
0

Portanto,

 
0 −1
A= 
1 0

A representação de y3 com relação à base {x1 , x2 } é

    
0 −1 1.5 −0.5
β = Aα =   = 
1 0 0.5 1.5

 
1.5
  é a representação de x3 na base {x1 , x2 }
0.5

✫ ✪
EEL 6001: Teoria de Sistemas Lineares I algebra.tex 22
✬ ✩

Matriz como Operador Linear

Seja a função linear L : Rn → Rn descrita pela matriz A ∈ Rn×n

y = L(x) = A(α1 x1 + α2 x2 + · · · + αn xn )
= α1 Ax1 + α2 Ax2 + · · · + αn Axn
=⇒ yi = Axi , i = 1 · · · n

Na base ortonormal, xi = ei e, portanto, yi = Aei = ai (i-ésima coluna de


A) que coincide com sua representação na base ortonormal unitária
(representação de A = A)

Exemplo

   
3 2 −1 0
   
A=
 −2 1 0 
 ; b =  0 
 
4 3 1 1

Considere os vetores {b, Ab, A2 b} (são LI):

     
−1 −4 −5
     
Ab = 
 0  ; A2 b =  2  ; A3 b =  10 
    
1 −3 −13

✫ ✪
EEL 6001: Teoria de Sistemas Lineares I algebra.tex 23
✬ ✩

Ā é a representação de A na base {b, Ab, A2 b}:

 
0
  
A(b) = b Ab A b  2 
 1 
0
 
0
  
A(Ab) = b Ab A2 b  
 0 
1
 
17
  
A(A2 b) = b Ab A2 b 
 −15


5

 
0 0 17
 
Ā = 
 1 0 −15 

=⇒
0 1 5
(Forma Companheira)

✫ ✪
EEL 6001: Teoria de Sistemas Lineares I algebra.tex 24
✬ ✩

Representação de A ∈ Rn×n na base {q1 , q2 , . . . , qn }

 
−1
Ā = Q AQ ; Q q 1 q2 · · · q n

i-ésima coluna de Q:
=⇒ representação de qi na base ortonormal {e1 , . . . , en } = qi

Ā = Q−1 AQ → QĀ = AQ
 
ou, como Q = q1 q2 · · · q n ,

   
q1 q2 · · · q n Ā = Aq1 Aq2 · · · Aqn

āi é a i-ésima coluna de Ā, representação de Aq i na base {q1 , . . . , qn }.


Uma escolha adequada da base {q1 , q2 , . . . , qn } pode levar a
representações importantes.

✫ ✪
EEL 6001: Teoria de Sistemas Lineares I algebra.tex 25
✬ ✩

Seja A ∈ Rn×n . Se existir um vetor b ∈ Rn×1 tal que o conjunto de n


vetores {b, Ab, A2 b, . . . , An−1 b} seja linearmente independente e se

An = β1 b + β2 Ab + · · · + βn An−1 b

então a representação de A na base {b, Ab, A2 b, . . . , An−1 b} é dada por


(forma companheira)

 
0 0 ··· 0 β1
 
 1 0 ··· 0 β2 
 
 
 0 1 ··· 0 β3 
 
Ā =  .. .. . . .. .. 
 . . . . . 
 
 
 0 0 ··· 0 βn−1 
 
0 0 ··· 1 βn

✫ ✪
EEL 6001: Teoria de Sistemas Lineares I algebra.tex 26
✬ ✩

Ortonormalização

Um vetor x está normalizado se sua norma Euclidiana é igual a 1, ou


seja, x x = 1.
Dois vetores x1 e x2 são ortogonais se x1 x2 = x2 x1 = 0.
Um conjunto de vetores {x1 , x2 , . . . , xn } é ortonormal se


 0 se i = j

xi xj =
 1 se i = j

Dado um conjunto de vetores LI {x1 , x2 , . . . , xn }, pode-se obter um


conjunto de vetores ortonormais através do procedimento de
ortonormalização de Schmidt:

u1 = x 1 q1 = u1 /u1 
u2 = x2 − (q1 x2 )q1 q2 = u2 /u2 
.. ..
. .

n−1
un = x n − (qk xn )qk qn = un /un 
k=1

✫ ✪
EEL 6001: Teoria de Sistemas Lineares I algebra.tex 27
✬ ✩

A primeira equação apenas normaliza o vetor x1


Na segunda equação, (q1 x2 )q1 é a projeção do vetor x2 ao longo de q1 , e
x2 − (q1 x2 )q1 é necesssariamente ortogonal ao vetor q1 .

u2
x2

q2

q1 x1 = u1

Se um conjunto de vetores u1 , u2 , . . . , un é ortonormal então

 
U u 1 u2 · · · u n ; U  U = In

✫ ✪
EEL 6001: Teoria de Sistemas Lineares I algebra.tex 28
✬ ✩

Propriedades:


n
n
Se y = U x, então yi2 = x2i , ou
i=1 i=1

y2 = U x2 = (U x) (U x) = x U  U x = x x = x2

Em outras palavras, y = U x é um mapeamento isométrico (a


multiplicação por U não altera a norma)
   
Se y = U x e ỹ = U x̃ então y, ỹ = x, x̃ (a multiplicação por U não
altera o produto interno) pois

     
  
y, ỹ = U x, U x̃ = (U x) (U x̃) = x U U x = x, x̃
   
e também não altera o ângulo ∠ y, ỹ = ∠ x, x̃
Se U é ortonormal, a transformação linear y = U x preserva a norma dos
vetores
 Ux = x
 epreserva o ângulo entre vetores
∠ U x, U x̃ = ∠ x, x̃

✫ ✪
EEL 6001: Teoria de Sistemas Lineares I algebra.tex 29
✬ ✩

Exemplos: Transformações de rotação ou reflexão de vetores (de fato,


toda matriz ortogonal descreve ou uma rotação ou uma reflexão).
• No R2 , a transformação que roda um vetor (sentido anti-horário) de θ é
dada por

 
cos θ − sin θ
y = Uθ x ; Uθ =  
sin θ cos θ

e2
u2 u1
θ
e1

✫ ✪
EEL 6001: Teoria de Sistemas Lineares I algebra.tex 30
✬ ✩

• A reflexão de um vetor na reta x2 = x1 tan( 2θ ) é dada por

 
cos θ sin θ
y = Rθ x ; Rθ =  
sin θ − cos θ

e2
u1

e1

u2

✫ ✪
EEL 6001: Teoria de Sistemas Lineares I algebra.tex 31
✬ ✩

O procedimento de ortonormalização pode ser descrito como uma


transformação linear. Considere a matriz X formada pelos vetores
linearmente independentes {x1 , x2 , . . . , xn }

 
X= x1 x2 · · · x n

Deseja-se determinar uma matriz F tal que

 
q1 q 2 · · · q n  Q = XF

A condição de que os vetores {q1 , q2 , . . . , qn } sejam ortonormais pode ser


escrita na forma

Q Q = I =⇒ F  RF = I ; R  X X

Sistema com n(n + 1)/2 restrições e n2 incógnitas (n(n − 1)/2 elementos


de F são arbitrários)

✫ ✪
EEL 6001: Teoria de Sistemas Lineares I algebra.tex 32
✬ ✩

• Uma solução particular pode ser obtida pela fatorização de Cholesky da


matriz R, que produz uma matriz triangular superior L tal que R = L L.
Assim,

F  RF = F  L LF = (LF ) (LF ) = I

e F = L−1 aparece como solução óbvia.

• A fatorização de Schur aplicada à matriz R produz uma matriz unitária


V e uma matriz diagonal Ω composta pelos autovalores de R tal que
R = V ΩV  , sugerindo como solução

F = V Ω−0.5 V   R−0.5

A escolha da transformação F que ortonormaliza X pode ser ditada por


algum critério especı́fico. Por exemplo, o objetivo pode ser encontrar Q
solução do problema

min Tr (X − Q) (X − Q)
sujeito a Q Q = I

que equivale a minimizar a norma (ao quadrado) de xi − qi , i = 1, . . . , n.


Com isso, busca-se uma transformação que tente preservar o máximo
possı́vel os vetores originais.

✫ ✪
EEL 6001: Teoria de Sistemas Lineares I algebra.tex 33
✬ ✩

Re-escrevendo em termos de F :

min Tr (X − XF ) (X − XF )
sujeito a F  X  XF = I

Desenvolvendo os termos que compõem a função objetivo

min Tr(X  X + F  X  XF − F  X  X − X  XF )
sujeito a F  X  XF = I

Substituindo a restrição e lembrando que os termos constantes na função


objetivo não influenciam na solução F :

min Tr (−F  X  X − X  XF ) = max Tr (2X  XF )


sujeito a F  X  XF = I

✫ ✪
EEL 6001: Teoria de Sistemas Lineares I algebra.tex 34
✬ ✩

Procedimentos clássicos para resolver problemas de otimização com


restrições podem ser usados.
• Escrevendo a função Lagrangeano L (F, Λ) (onde Λ é a variável dual
simétrica associada à restrição original do problema)
 
  
L (F, Λ) = Tr 2X XF + Λ(F X XF − I)

As condições de estacionariedade são dadas por

∂L
= 2(R + RΛF ) = 2R(I + ΛF ) = 0
∂F
∂L
= (F  X  XF − I) = 0
∂Λ
Resolvendo em termos de F e de Λ:

F = −Λ−1 =⇒ (−Λ−1 )X  X(−Λ−1 ) = I =⇒ X  X = Λ2


 
 +(X  X)0.5  −(X  X)−0.5
Λ= =⇒ F =
 −(X  X)0.5  +(X  X)−0.5

A função objetivo original é dada por

min Tr (−2X  XF ) = max Tr (2X  XF )


e o ótimo é obtido para F = (X  X)−0.5 .
• Note que a solução F = −(X  X)−0.5 fornece a mesma base
ortonormalizada Q (apenas trocando o sinal dos vetores) e pode ser
interpretada como a transformação F que maximiza a diferença entre as
normas (ao quadrado) dos vetores de cada base. A solução ótima deste
problema de otimização é a mesma obtida pela decomposição de Schur.

✫ ✪
EEL 6001: Teoria de Sistemas Lineares I algebra.tex 35
✬ ✩

Exemplo: considere os vetores LI

     
1 1 0
     
x1 =  1
 
 , x2 =  2  ,
  x3 = 
 1 

1 3 −1
 
X  x1 x2 x3

Procedimento interativo:
   
1 0.5774
u1 1    
u1 = x 1 ; q1 = =√  1  =  0.5774 
u1  3   
1 0.5774
 
−0.7071
u  
=  0.0000 
2
u2 = x2 − (u1 x2 )u1 ; q2 =
u2   
0.7071
 
−0.4082
u3  
u3 = x3 − (u2 x3 )u2 − (u1 x3 )u1 ; q3 = =  0.8165 
u3   
−0.4082

✫ ✪
EEL 6001: Teoria de Sistemas Lineares I algebra.tex 36
✬ ✩

Usando Cholesky na matriz R = X  X:

 
1.7321 3.4641 0
 
L = chol(R) = 
 0 1.4142 −0.7071 

 , LL=R
0 0 1.2247

 
−1
Q = XL = u1 u2 u3


 [Q, L] = qr(X)

Q Q = I (decomposição triangular



ortonormal)

Usando Schur: [V, Ω] = schur(R) , R−0.5 = V Ω−0.5 V 

 
0.9908 −0.0890 −0.1021
 
Q2 = XR−0.5 = 
 0.1348 0.5758 0.8064 

0.0130 0.8127 −0.5825
Q2 Q2 = I

✫ ✪
EEL 6001: Teoria de Sistemas Lineares I algebra.tex 37
✬ ✩

Exemplo: considere os vetores LI no plano x1 , x2

 
  1 2
X= x1 x2 = 
3 0.5
 
  0.32 0.95
Schmidt: Q = q 1 q2 = 
0.95 −0.32

 
  0.1 1
Schur: U = u 1 u2 = 
1 −0.1
x1

u1
q1
x2
−u2
u2
q2
−u1

✫ ✪
EEL 6001: Teoria de Sistemas Lineares I algebra.tex 38
✬ ✩

Sistema de equações algébricas lineares

    
a11 a12 · · · a1n x1 y1
    
 a    
 21 a22 · · · a2n  x2   y2 
 . .. ... ..  .. = ..  (Ax = y)
 .. . .  .   . 
    
am1 am2 · · · amn xn ym

A (m × n) , x (n × 1) , y (m × 1)
aij , yi ∈ R : dados do sistema; xi ∈ R : incógnitas

Três situações: m > n, m = n ou m < n

• Problema: dados A e y

1. ∃x : Ax = y?

2. Se existe solução, qual o número de soluções LI?

Range da matriz A ∈ Rm×n é definido como o conjunto de todas as


possı́veis combinações lineares das colunas de A

 
R(A)  y = Ax : x ∈ R ⊆ Rm
n

✫ ✪
EEL 6001: Teoria de Sistemas Lineares I algebra.tex 39
✬ ✩

Rank da matriz A ∈ Rm×n é definido como a dimensão do range de A


(ou, equivalentemente, como o número de colunas LI em A) e denotado
ρ(A).

Espaço nulo da matriz A consiste no conjunto de vetores x ∈ Rn tais


que Ax = 0. A dimensão do espaço nulo é chamada de nulidade da
matriz A e denotada ν(A).

 
n
N (A)  x ∈ R : Ax = 0

Note que y = Ax pode ser escrito

y = x1 a1 + x2 a2 + · · · + xn an

e portanto
 xi ∈ R, i = 1,
 . . . , n são as ponderações das colunas de
A = a1 a2 · · · an

✫ ✪
EEL 6001: Teoria de Sistemas Lineares I algebra.tex 40
✬ ✩

Propriedades

• Para A ∈ Rm×n

ν(A) = n − ρ(A)

rank A = número de colunas LI de A


= número de linhas LI de A
≤ min (n, m)

• N (A) e R(A) são espaços lineares; (N (A) é um subespaço do Rn e


R(A) é um subespaço do Rm )

• Se ν(A) = 0, N (A) = {0} e as seguintes afirmações são equivalentes:

· x pode ser determinado de maneira única de y = Ax

· colunas de A são LI

· det(A A) = 0

• Se ν(A) = k, Ax = 0 possui k soluções LI

✫ ✪
EEL 6001: Teoria de Sistemas Lineares I algebra.tex 41
✬ ✩

Exemplo: Considere a matriz A ∈ R3×5 dada por

 
0 1 1 2 −1
   
 
A =  1 2 3 4 −1  = a1 a2 a3 a4 a5
2 0 2 0 2

         
0 1 1 2 −1
         
Ax = x1  
 1  + x  
2 2  + x  
3 3  + x  
4 4  + x  
5  −1 

2 0 2 0 2

a3 = a1 + a2 ; a4 = 2a2
a5 = a3 − a4 = a1 + a2 − 2a2 = a1 − a2

   
0 1
   
Ax = (x1 + x3 + x5 )    
 1  + (x2 + x3 + 2x4 − x5 )  2 
2 0

✫ ✪
EEL 6001: Teoria de Sistemas Lineares I algebra.tex 42
✬ ✩

Como a1 , a2 são LI =⇒ ρ(A) = 2


 x +x +x =0
1 3 5
Ax = 0 ⇐⇒
 x2 + x3 + 2x4 − x5 = 0

Número de Equações = ρ(A) = 2


Número de Incógnitas = 5
Número de Graus de Liberdade = 3
Possı́veis soluções LI:

     
−1 0 −1
     
 −1   −2   1 
     
     
v1 = 
 1  ; v2 =  0  , v3 =  0 
    
     
 0   1   0 
     
0 0 1

{v1 , v2 , v3 } formam uma base de N (A) ; ν(A) = 3

✫ ✪
EEL 6001: Teoria de Sistemas Lineares I algebra.tex 43
✬ ✩

Teorema
• Dada uma matriz A ∈ Rm×n e um vetor y ∈ Rm×1 , existe uma solução
x ∈ Rn×1 da equação
y = Ax

se e somente se y ∈ R(A) ou, equivalentemente,


 
ρ(A) = ρ( A y )

• Dada uma matriz A, uma solução x de y = Ax existe para todo y se e


somente se ρ(A) = m (rank completo de linhas).

Teorema (parametrização de todas as soluções)


• Dada uma matriz A ∈ Rm×n e um vetor y ∈ Rm×1 , seja xp uma solução
x ∈ Rn×1 da equação y = Ax e seja k = n − ρ(A) = ν(A) a nulidade de A.
Se ρ(A) = n (rank completo de colunas) a solução xp é única. Se k > 0,
então para todo αi ∈ R, i = 1, . . . , k o vetor

x = xp + α1 n1 + α2 n2 + · · · + αk nk

sendo {n1 , . . . , nk } uma base de N (A) é uma solução de Ax = y. De fato,


k
Axp + αi Ani = Axp + 0 = y
i=1

✫ ✪
EEL 6001: Teoria de Sistemas Lineares I algebra.tex 44
✬ ✩

Desigualdade de Sylvester: para A ∈ Rq×n e B ∈ Rn×p

ρ(A) + ρ(B) − n ≤ ρ(AB) ≤ min (ρ(A), ρ(B))

ρ(A)
 q
R(A)
R(AB)
ρ(B) R(B) d
p
N (B) ν(B) n N (A)
ν(A)

B A
Rp Rn Rq

• domı́nio de AB = R(B);
• R(AB) = subespaço de R(A);
• ρ(AB) ≤ min (ρ(A), ρ(B));
• ρ(AB) = ρ(B) − d ; ν(A) = n − ρ(A) ⇒ d ≤ n − ρ(A);
• ρ(AB) ≥ ρ(A) + ρ(B) − n
Se B é uma matriz n × n não singular

ρ(A) + ρ(B) − n = ρ(A) ≤ ρ(AB) ≤ min (ρ(A), n) ≤ ρ(A)

✫ ✪
EEL 6001: Teoria de Sistemas Lineares I algebra.tex 45
✬ ✩

Seja A ∈ Rm×n . Então

ρ(AC) = ρ(A) ; ρ(DA) = ρ(A)

para quaisquer matrizes C ∈ Rn×n e D ∈ Rm×m não singulares.

• O rank de uma matriz não se altera ao ser pré ou pós-multiplicada por


uma matriz não singular.

Seja A ∈ Cm×n e A∗ sua conjugada transposta. Então,

• ρ(A) = n ⇐⇒ ρ(A∗ A) = n ; det(A∗ A) = 0

• ρ(A) = m ⇐⇒ ρ(AA∗ ) = m ; det(AA∗ ) = 0

A∗ A n × n ; AA∗ m × m

Observe que ρ(A) = n implica

•n≤m
• Aα = 0 ⇒ α=0

✫ ✪
EEL 6001: Teoria de Sistemas Lineares I algebra.tex 46
✬ ✩

Inversa

Se A ∈ Rn×n (matriz quadrada), A é inversı́vel ou não-singular se


det(A) = 0.

Condições equivalentes:
• as colunas de A formam uma base para o Rn
• as linhas de A formam uma base para o Rn
• a equação y = Ax tem uma solução única x = A−1 y para todo y ∈ Rn .
Em particular, a única solução de Ax = nesse caso é x = 0
• AA−1 = A−1 A = I
• N (A) = {0}
• R(A) = Rn
• det(A A) = det(AA ) = 0

1
A−1 = Adj (A)
det(A)

Adj (A): matriz adjunta da matriz A

Adj (A) = [Co (A)]

Co (A): matriz cofatora de A, composta pelos cofatores Cij da matriz A.

✫ ✪
EEL 6001: Teoria de Sistemas Lineares I algebra.tex 47
✬ ✩

Considere o sistema y = Ax com A ∈ Rm×n e m > n (matriz retangular


em pé), isto é, o sistema tem mais equações do que incógnitas (pode não
ter solução).

Solução aproximada: define-se um erro

e = Ax − y

e busca-se a solução xa que minimiza e, chamada solução aproximada


de mı́nimos quadrados de Ax = y. xa é o ponto no R(A) que está mais
próximo de y, ou seja, Axa é a projeção de y no R(A).

min e2 = min (Ax − y) (Ax − y)

Derivando-se a função objetivo (em relação a x) e igualando a 0

2x A A − 2y  A = 0

Assumindo que A tem rank completo (e portanto A A é inversı́vel)

xa = (A A)−1 A y

✫ ✪
EEL 6001: Teoria de Sistemas Lineares I algebra.tex 48
✬ ✩

Note que xa é uma função linear de y, e xa = A−1 y se A é quadrada.

xa é a solução exata de y = Ax se y ∈ R(A).

A†  (A A)−1 A é chamada de pseudo-inversa de A

A projeção de y no R(A) é linear, dada por Axa = A(A A)−1 A y e


A(A A)−1 A é chamada matriz de projeção.

 
 −1 
O erro e = Axa − y = A(A A) A − I y é ortogonal ao R(A):

   
  −1 
e, Ax = y A(A A) A − I Ax = 0

✫ ✪
EEL 6001: Teoria de Sistemas Lineares I algebra.tex 49
✬ ✩

Estimador Mı́nimos Quadrados


Muitos problemas de reconstrução, inversão ou estimação podem ser
colocados na forma y = Ax + ∆ onde x é o vetor a ser estimado ou
reconstruı́do; y é o vetor de medidas e ∆ é o vetor de ruı́dos ou erros de
medida.
Problema: encontre a estimativa x̂ que minimiza a diferença entre os
valores medidos y e o que deveria ser obtido se ∆ = 0.
Solução: x̂ = (A A)−1 A y
Considere o sistema y = Ax com A ∈ Rm×n e m < n (matriz retangular
deitada), isto é, o sistema tem mais variáveis do que equações (várias
escolhas de x podem levar ao mesmo y).
Assumindo que A tem rank completo de linhas m, o conjunto de todas as
soluções tem a forma

   
x : Ax = y = xp + z : z ∈ N (A)

sendo xp uma solução particular qualquer. Os vetores z do espaço nulo de


A caracterizam as várias soluções para o problema (N (A) = n − m graus
de liberdade).
Uma solução (de mı́nima norma) é dada por xm = A (AA )−1 y (como A
tem rank completo de linhas, AA é inversı́vel). De fato, para qualquer
outra solução x tem-se A(x − mm ) = 0 e

(x − xm ) xm = (x − xm ) A (AA )−1 y =
 
= A(x − xm ) (AA )−1 y = 0 =⇒ (x − xm ) ⊥ xm

x2 = xm + x − xm 2 = xm 2 + x − xm 2 ≥ xm 2

✫ ✪
EEL 6001: Teoria de Sistemas Lineares I algebra.tex 50
✬ ✩

A matriz A (AA )−1 é chamada de pseudo-inversa de A (rank completo de


linhas). Note que xm é ortogonal a N (A) (xm é a projeção de 0 no
conjunto de soluções {x : Ax = y}).
O mesmo resultado poderia ser obtido com multiplicadores de Lagrange.

min x x
sujeito a Ax = y

Introduzindo o multiplicador de Lagrande λ e escrevendo o Lagrangeano

L (x, λ) = x x + λ (Ax − y)

As condições de otimalidade são

∂L
= 2x + λ A = 0
∂x

∂L
= (Ax − y) = 0
∂λ

=⇒ x = −A λ/2 ; λ = −2(AA )−1 y

=⇒ x = A (AA )−1 y

✫ ✪
EEL 6001: Teoria de Sistemas Lineares I algebra.tex 51
✬ ✩

Autovalores, autovetores. Formas de Jordan

Um escalar λ ∈ C é um autovalor (valor próprio) de A ∈ Rn×n se existe


um vetor x ∈ Cn não nulo tal que

Ax = λx

Qualquer vetor x ∈ C que satisfaça Ax = λx é chamado de autovetor


(vetor próprio) de A associado a λ (mais precisamente, esta é a definição
para autovetores à direita de A).

• Ax = λx pode ser visto como (A − λI)x = 0

• ∃x ∈ Cn , x = 0 : (A − λI)x = 0 ⇔ det(A − λI) = 0

• ∆(λ)  det(λI − A) : polinômio (mônico) caracterı́stico de A

• ∆(λ) = 0 : equação caracterı́stica de A

• Grau de ∆(λ) = n e portanto A ∈ Rn×n possui n autovalores.

✫ ✪
EEL 6001: Teoria de Sistemas Lineares I algebra.tex 52
✬ ✩

Exemplo: Considere a matriz A

   
a11 a12 a11 − λ a12
A=  ; A − λI =  
a21 a22 a21 a22 − λ

det (A − λI) = (λ − a11 )(λ − a22 ) − a12 a21

= λ2 − (a11 + a22 )λ − (a12 a21 − a11 a22 )

= λ2 − Tr(A)λ + det(A)


n
det(A) = aij Coij ; Coij : cofator de aij
j=1

Coij = (−1)i+j Mij ; Mij : det de A sem a linha i e a coluna j


✫ ✪
EEL 6001: Teoria de Sistemas Lineares I algebra.tex 53
✬ ✩

Note que λ ∈ C é um autovalor de A ∈ Rn×n se

∆(λ) = det(λI − A) = 0

Essa condição é equivalente à existência de y ∈ C tal que

y  A = λy  =⇒ y  (λI − A) = 0

e qualquer y que satisfaça a relação acima é chamado de autovetor à


esquerda de A (associado ao autovalor λ).

• Se v ∈ Cn é um autovetor associado a λ ∈ C, então v̄ (complexo


conjugado de v) é um autovetor associado a λ̄.
• Se v é um autovetor de A, a transformação linear A aplicada sobre v
produz um escalonamento de λ (na direção v).
• Matrizes na forma companheira
   
0 0 0 −α4 −α1 −α2 −α3 −α4
   
 1 0 0 −α3   
   1 0 0 0 
  ;  
 0 1 0 −α2   0 1 0 0 
   
0 0 1 −α1 0 0 1 0

e suas transpostas têm o seguinte polinômio caracterı́stico:

∆(λ) = λ4 + α1 λ3 + α2 λ2 + α3 λ + α4

✫ ✪
EEL 6001: Teoria de Sistemas Lineares I algebra.tex 54
✬ ✩

Autovalores distintos
Teorema: Sejam λ1 , λ2 , . . . , λn autovalores distintos de A e vi um
autovetor de A associado ao autovalor λi , i = 1, 2, . . . , n. Então, o
conjunto de autovetores {v1 , v2 , . . . , vn } é LI.
Prova: Primeiramente, note que


 (λ − λ )v , j =
i
i j i
(A − λj I)vi =
 =0 , j=i

Supondo (por absurdo) que {v1 , v2 , . . . , vn } é LD, existem escalares


α1 , α2 , . . . , αn não todos nulos tais que


n
αi vi = 0
i=1

Sem perda de generalidade, assuma α1 = 0. Então,


n
n−1
(A − λn I) αi vi = αi (λi − λn )vi
i=1 i=1


n
n−2
(A − λn−1 I)(A − λn I) αi vi = αi (λi − λn )(λi − λn−1 )v i
i=1 i=1

..
.
α1 (λ1 − λ2 )(λ1 − λ3 ) · · · (λ1 − λn )v1 = 0

Como λi = λj , j = 2, 3, . . . , n, α1 = 0, o que contradiz a hipótese inicial.


Como conclusão,

{v1 , v2 , . . . , vn } LI → Base do Cn

✫ ✪
EEL 6001: Teoria de Sistemas Lineares I algebra.tex 55
✬ ✩

Forma Diagonal
Seja Ā a representação de A na base formada pelos autovetores
{v1 , v2 , . . . , vn }. A i-ésima coluna de Ā = representação de Avi = λi vi
na base {v1 , v2 , . . . , vn }. Então,

 
0
 
 
 0 
 .. 
  
 . 
Avi = v1 v2 · · · v i · · · vn  
 λi 
 
 .. 
 . 
 
0

 
λ1 0 ··· 0
 
 0 λ2 · · · 0 
 
Ā =  .. .. . . ..  = Q−1 AQ
 . . . . 
 
0 0 · · · λn
 
Q = v1 v2 · · · vn

=⇒ Existe uma representação diagonal se todos os autovalores de A são


distintos.
• Q define uma transformação de similaridade que diagonaliza a matriz A
 
• Portanto, se Q = v1 v2 · · · vn é tal que Ā = Q−1 AQ é uma
matriz diagonal, então

AQ = QĀ =⇒ Avi = λi vi , i = 1 · · · n

e {v1 , v2 , . . . vn } são autovetores LI de A.


✫ ✪
EEL 6001: Teoria de Sistemas Lineares I algebra.tex 56
✬ ✩

Exemplo

 
1 0 −1
 
A=
 0 2 0 
 , λ1 = 1, λ2 = 2, λ3 = 3
0 0 3

(A − λ1 I)v1 = 0

     
0 0 −1 
 
v11
  −v31 = 0

 
1
 0 1  
0   v21  → v1 =  
  = 0  v21 = 0  0 


0 0 2 v31 2v31 = 0 0

(A − λ2 I)v2 = 0

     
−1 0 −1 
 
v12
  −v12 − v32 = 0
 0
 
 0 0 0   v22  = 0 → v2 =  
     1 


0 0 1 v32 v32 = 0 0

✫ ✪
EEL 6001: Teoria de Sistemas Lineares I algebra.tex 57
✬ ✩

(A − λ3 I)v3 = 0

   
−2 −1 

0

v13
  −2v13 − v33 = 0

 0 −1 0   v23 
 
  = 0  −v23 = 0


0 0 0 v33

 
−0.5
 
→ v13 = −0.5v33 ; v3 = 
 0 

1

 
1 0 0
   
{v1 , v2 , v3 } são LI Ā = 
 0 2 0 
 , Q= v1 v2 v3
0 0 3

Considere entretanto

 
1 0 −1
 
A=
 0 1 0 
 , λ1 = λ2 = 1, λ3 = 2
0 0 2

✫ ✪
EEL 6001: Teoria de Sistemas Lineares I algebra.tex 58
✬ ✩

  
0 0 −1 v11
  
(A − λ1 I)v1 = 0 =⇒   0 0 0 

 v21  = 0

0 0 1 v31
   
1 0
   
Soluções LI: v1 = 
 0  
 , v2 =  1


0 0

  
−1 0 −1 v13
  
(A − λ3 I)v3 = 0 =⇒    
 0 −1 0   v23  = 0
0 0 0 v33
 
−1
   
; v3 = 
 0 
 , Q = v1 v2 v3
1

• Multiplicidade Geométrica (MG) de λ1 : 2 (número de soluções LI


associadas ao autovalor)
• No caso geral, tem-se: Multiplicidade Geométrica (MG) ≤
Multiplicidade Algébrica (MA)
• Se a Multiplicidade Geométrica for menor que a Multiplicidade
Algébrica, então não é possı́vel determinar autovetores {v1 , v2 , v3 } LI.

✫ ✪
EEL 6001: Teoria de Sistemas Lineares I algebra.tex 59
✬ ✩

Autovalores complexos

Considere a matriz

 
−1 1 1
 
A=
 0 4 −13 

0 1 0

Polinômio caracterı́stico: (λ + 1)(λ2 − 4λ + 13)

Autovalores: −1, 2 + j3 e 2 − j3

Note que autovalores complexos sempre aparecem em pares complexo


conjugados para matrizes com coeficientes reais.

     
1 j −j
     
Autovetores:  0
 
 ;  −3 + j2  ;  −3 − j2 
   
0 j −j

✫ ✪
EEL 6001: Teoria de Sistemas Lineares I algebra.tex 60
✬ ✩

   
1 j −j −1 0 0
   
Q=
 0 −3 + j2 −3 − j2 
 ; Ā = 
 0 2 + j3 0 

0 j −j 0 0 2 − j3

• Para autovalores não distintos, nem sempre é possı́vel obter Ā na forma


diagonal:

 
5 1
A=  , λ1 = λ2 = 5 , MA = 2
0 5

(A − λ1 I)v1 = 0

  
0 1 v11
⇒    = 0
0 0 v21
 
1
v1 =  
0
MG = 1

✫ ✪
EEL 6001: Teoria de Sistemas Lineares I algebra.tex 61
✬ ✩

Forma Canônica de Jordan


Define-se como Jk (λ) o bloco de Jordan de dimensão k × k associado ao
autovalor λ, dado por

 
λ 1 0 ··· 0
 
 0 λ 1 ··· 
 0 
 .. .. .. . . .. 
Jk (λ) = 
 . . . . .  ∈ Ck×k

 
 0 0 0 ··· 1 
 
0 0 0 ··· λ

Para qualquer matriz A ∈ Rn×n existe uma matriz não singular Q tal que
 
Jk1 (λ1 )
 
 J (λ ) 
−1  k2 2 
Ā = Q AQ =  . 
 .. 
 
Jkr (λr )
k1 + · · · + k r = n
sendo que A tem r autovalores distintos λ1 , . . . , λr entre n possı́veis.
Associados aos r autovalores distintos, pode-se determinar r autovetores
LI {v1 , v2 , . . . , vr } a partir de
(A − λi I)vi = 0 , i = 1, 2, . . . , r

• Ā é em geral bidiagonal superior, sendo diagonal no caso de n blocos de


Jordan de tamanho k = 1
• A forma de Jordan é única para uma dada matriz A (salvo eventuais
permutações entre os blocos)
• Pode haver múltiplos blocos associados ao mesmo autovalor
✫ ✪
EEL 6001: Teoria de Sistemas Lineares I algebra.tex 62
✬ ✩

Os autovetores associados ao bloco de Jordan Jki (λi ) verificam:


 
λi 1 0 ··· 0
 
 0 λ 1 ··· 0 
 
 . . .
i   
... . 
.
vi1 vi2 · · · viki  . . .
 . . .

.  = A vi1 vi2 · · · viki
 
 0 0 0 ··· 1 
 
0 0 0 · · · λi

Definindo vi1  vi (autovetor associado ao autovalor λi ) tem-se

λi vi1 = Avi1 =⇒ (A − λi I)vi1 = 0


vi1 + λi vi2 = Avi2 =⇒ (A − λi I)vi2 = vi1
..
.
vi(ki −1) + λi viki = Aviki =⇒ (A − λi I)viki = vi(ki −1)

• Note que sempre existe vi1 = 0 tal que (A − λi I)vi1 = 0 (definição de


autovetor)
• Da equação que define vi2 tem-se

(A − λi I)(A − λi I)vi2 = (A − λi I)vi1 = 0


 (A − λ I)2 v = 0
i i2
=⇒ Autovetor Generalizado de λi
 (A − λi I)vi2 = 0

v é um autovetor generalizado de grau 9 de A associado ao autovalor


λ se
(A − λI) v = 0
(A − λI)−1 v = 0

✫ ✪
EEL 6001: Teoria de Sistemas Lineares I algebra.tex 63
✬ ✩

Note que um autovetor generalizado v de grau 1 satisfaz

(A − λI)v = 0 ; v = 0

e portanto é um autovetor.
• O número de blocos de Jordan associados ao autovalor λ é dado por

ν(A − λI)

• A forma canônica de Jordan é útil do ponto de vista conceitual, não


sendo usada para cálculos computacionais.

Exemplo
 
0 6 −5
 
A=
 1 0 2 

3 2 4
∆(λ) = λ3 − 4λ2 + 5λ − 2 = ; λ1 = 2 , λ2 = λ3 = 1

Autovetor associado ao autovalor λ1 = 2:


    
−2 6 −5 v1a −2
    
(A − 2I)v1 = 
 1 −2 2   v1b
 =0 ;
 v1 = 
 1 

3 2 2 v1c 2

Para o autovalor λ2 = 1:

 
−1 6 −5
 
(A − 1I)v2 = 
 1 −1 2 
 v2 = 0
3 2 3

Note que a 3a linha é igual à 1a mais (4×)2a =⇒ ν(A − 1I) = 1


✫ ✪
EEL 6001: Teoria de Sistemas Lineares I algebra.tex 64
✬ ✩

Portanto, existe 1 bloco de Jordan associado ao autovalor λ = 1; com


isso, sabe-se que a forma de Jordan é dada por

 
2 0 0
 
Ā = Q−1 AQ = 
 0 1 1 

0 0 1

Um autovetor v2 pode ser obtido da expressão acima:

 
−1
 
v2 =  
 3/7 
5/7

A partir de v21  v2 pode-se determinar o autovetor generalizado v22

 
−1
 
(A − 1I)v22 = v21 ; v22 =
 22/49 

46/49

 
Q= v1 v21 v22

• “Ajuda” do Matlab é importante.


✫ ✪
EEL 6001: Teoria de Sistemas Lineares I algebra.tex 65
✬ ✩

Considere A ∈ R4×4 com um autovalor λ de multiplicidade algébrica igual


a 4. Assuma que ν(A − λI) = 1. Assim,

(A − λI)v = 0

possui apenas uma solução linearmente independente. Para formar uma


base do R4 , três outros vetores LI são necessários. Os três vetores
(autovetores generalizados) v2 , v3 e v4 devem satisfazer as propriedades:

(A − λI)2 v2 = 0
(A − λI)3 v3 = 0
(A − λI)4 v4 = 0

A partir do autovetor v, a cadeia de autovetores generalizados de


tamanho 4 pode ser gerada da seguinte forma:

v4  v
v3  (A − λI)v4 = (A − λI)v
v2  (A − λI)v3 = (A − λI)2 v
v1  (A − λI)v2 = (A − λI)3 v

✫ ✪
EEL 6001: Teoria de Sistemas Lineares I algebra.tex 66
✬ ✩

Como pode ser verificado, valem as propriedades: (A − λI)v1 = 0,


(A − λI)2 v2 = 0, (A − λI)3 v3 = 0 e (A − λI)4 v4 = 0.

Os vetores gerados dessa maneira são LI. Das equações, obtém-se

Av1 = λv1
Av2 = v1 + λv2
Av3 = v2 + λv3
Av4 = v3 + λv4

Forma de Jordan (representação na base {v1 , v2 , v3 , v4 }):

 
λ 1 0 0
 
 0 λ 1 0 
 
Ā =  
 0 0 λ 1 
 
0 0 0 λ

• Se a ordem dos vetores da base for invertida, a representação passa a


ser bidiagonal inferior.

✫ ✪
EEL 6001: Teoria de Sistemas Lineares I algebra.tex 67
✬ ✩

Considere agora A ∈ R4×4 com um autovalor λ de multiplicidade


algébrica igual a 4 mas ν(A − λI) = 2. Assim,

(A − λI)v = 0

possui 2 soluções LI. Dois autovetores podem ser obtidos e


n − 2 = 4 − 2 = 2 autovetores generalizados são necessários.

A partir de cada um dos autovetores, gera-se uma cadeia de autovetores


generalizados. As possı́veis formas de Jordan neste caso são:
   
λ 1 0 0 λ 1 0 0
   
 0 λ 1 0   0 λ 0 0 
   
Ā1 =   ; Ā2 =  
 0 0 λ 0   0 0 λ 1 
   
0 0 0 λ 0 0 0 λ

✫ ✪
EEL 6001: Teoria de Sistemas Lineares I algebra.tex 68
✬ ✩

Exemplo

 
3 −1 1 1 0 0
 
 −1 −1 
 1 1 0 0 
 
 
 0 0 2 0 1 1 
A= 
 0 0 0 2 −1 −1 
 
 
 0 0 0 0 1 1 
 
0 0 0 0 1 1

Propriedade (A e C matrizes quadradas)

 
A B
det   = det A det C
0 C

 
∆(λ) = det(A − λI) = [(3 − λ)(1 − λ) + 1] (2 − λ)2 (1 − λ)2 − 1

= (2 − λ)2 (2 − λ)2 (2 − λ)λ = (2 − λ)5 λ

Autovalores: λ1 = 2, MA= 5 ; λ2 = 0, MA= 1


✫ ✪
EEL 6001: Teoria de Sistemas Lineares I algebra.tex 69
✬ ✩

 
1 −1 1 1 0 0
 
 1 −1 −1 −1 
 0 0 
 
 
 0 0 0 0 1 1 
(A − 2I) =  
 0 0 0 0 −1 −1 
 
 
 0 0 0 0 −1 1 
 
0 0 0 0 1 −1

ρ(A − 2I) = 4 ⇒ ν1 = ν(A − 2I) = 6 − 4 = 2 → MG = 2

• A forma de Jordan apresenta dois blocos (MG=2) associados ao


autovalor λ1 = 2

 
3 −1 1 1 0 0
 
 −1 −1 
 1 1 0 0 
 
 
 0 0 2 0 1 1 
A= 
 0 0 0 2 −1 −1 
 
 
 0 0 0 0 1 1 
 
0 0 0 0 1 1

✫ ✪
EEL 6001: Teoria de Sistemas Lineares I algebra.tex 70
✬ ✩

 
0 2 2 1 0 0
 
 0 
 2 0 0 0 0 
 
 0 
 0 1 1 2 1 
Q =  
 0 0 −1 0 −2 −1 
 
 
 0.5 0 0 0.5 0 1 
 
−0.5 0 0 0.5 0 1
 
= x v1 v 2 v 3 u1 u2

• x, v1 e u1 são autovetores
 
0 0 0 0 0 0
 
 
 0 2 1 0 0 0 
 
 
−1  0 0 2 1 0 0 
Ā = Q AQ =  
 0 0 0 2 0 0 
 
 
 0 0 0 0 2 1 
 
0 0 0 0 0 2

• Nem sempre é fácil determinar a cadeia de autovetores generalizados.


Por exemplo, se v é autovetor, −v também é, mas os autovetores
generalizados podem ser diferentes

Ax = v + λx ; Ay = −v + λy

✫ ✪
EEL 6001: Teoria de Sistemas Lineares I algebra.tex 71
✬ ✩

Autovalores e Autovetores de Matriz Simétrica


Sejam λ1 , λ2 , . . . , λn autovalores de uma matriz simétrica A ∈ Rn×n .
• λi ∈ R, i = 1, . . . , n
• Autovetores vi , vj associados a autovalores distintos λi = λj são
ortogonais, isto é

 
vi , vj = vi vj = 0

Para mostrar que os autovalores são reais, note que se λ ∈ C é um


autovalor e v ∈ Cn é um autovetor genérico de A

Av = λv ; v = 0 =⇒ v ∗ Av = λv ∗ v
Tomando o conjugado transposto da expressão (escalar) acima e
lembrando que A∗ = A (matriz simétrica)

(v ∗ Av)∗ = (v ∗ Av) = λ̄v ∗ v

Subtraindo

0 = (λ − λ̄)v ∗ v =⇒ λ = λ̄ =⇒ λ∈R

Para mostrar a ortogonalidade de autovetores associados a autovalores


distintos:
Avi = λi vi =⇒ vj Avi = λi vj vi
Avj = λj vj =⇒ vi Avj = λj vi vj

Como o lado esquerdo das expressões acima é igual (A = A ), subtraindo


 
0 = (λi − λj ) vi , vj =⇒ vi ⊥ vj se λi = λj

A forma de Jordan de uma matriz simétrica A ∈ Rn×n é diagonal.


✫ ✪
EEL 6001: Teoria de Sistemas Lineares I algebra.tex 72
✬ ✩

Para provar, mostra-se que não existem autovetores generalizados de grau


k ≥ 2. Suponha, por absurdo, que para algum λi

(A − λi I)k v = 0 e (A − λi I)k−1 v = 0 (k ≥ 2)

Entretanto,

 
k−2 k
(A − λi I) v, (A − λi I) v = 0

Usando a simetria de A

 
k−1 k−1
(A − λi I) v, (A − λi I) v = (A − λi I)k−1 v = 0

⇐⇒ (A − λi I)k−1 v = 0

o que contradiz a hipótese inicial. Portanto, não existe nenhum bloco de


Jordan cuja ordem seja maior do que 1

∃ Q : Ā = Q−1 AQ → diagonal

• Se A = A , Ā = Ā é uma matriz diagonal (com os autovalores reais na


diagonal) e a base formada pelos autovetores é tal que

Q Q = I (base ortonormal)

(Q−1 AQ) = Q AQ−1 = Q−1 AQ =⇒ Q−1 = Q

✫ ✪
EEL 6001: Teoria de Sistemas Lineares I algebra.tex 73
✬ ✩

Funções matriciais

Funções de Matriz Quadrada


Matrizes quadradas A ∈ Rn×n estão associadas a transformações lineares
f : R n → Rn
Defina
A0 = I ; Ak = AA · · · A (k vezes) ; k∈Z

Funções Polinomiais: Seja f (λ) um polinômio em λ de grau finito.


Por exemplo,
f (λ) = λ2 + 5λ + 6 = (λ + 2)(λ + 3)
Uma função f (A) é definida como

f (A)  A2 + 5A + 6I = (A + 2I)(A + 3I)

Em particular, se A assume a forma bloco diagonal


 
A1 0
A= 
0 A2

com A1 e A2 matrizes quadradas de qualquer ordem, tem-se


   
k
A1 0 f (A1 ) 0
Ak =   ; f (A) =  
k
0 A2 0 f (A2 )

✫ ✪
EEL 6001: Teoria de Sistemas Lineares I algebra.tex 74
✬ ✩

Como é sempre possı́vel escrever A = QÂQ−1 (Â é a representação de A


na Forma Canônica de Jordan)

f (A) = f (QÂQ−1 ) = (QÂQ−1 )(QÂQ−1 ) + 5(QÂQ−1 ) + 6(QQ−1 )

 
= Q Â + 5Â + 6I Q−1 = Qf (Â)Q−1
2

ou f (Â) = Q−1 f (A)Q.


O polinômio mı́nimo de A é definido como o polinômio mônico (maior
coeficiente igual a 1) φ(λ) de menor grau tal que φ(A) = 0.
Portanto, f (A) = 0 se e somente se f (Â) = 0 (matrizes similares têm o
mesmo polinômio mı́nimo).

O polinômio mı́nimo de uma matriz na forma de Jordan pode ser obtido


por inspeção.

Se λi é um autovalor de A com multiplicidade ni , o polinômio


caracterı́stico de A é dado por


∆(λ) = det(λI − A) = (λ − λi )ni
i

✫ ✪
EEL 6001: Teoria de Sistemas Lineares I algebra.tex 75
✬ ✩

Supondo que a forma de Jordan de A é conhecida, define-se como o


ı́ndice de λi a maior ordem de todos os blocos de Jordan associados a λi
(denotado n̄i ).

Por exemplo, λ1 tem multiplicidade 4 nas quatro matrizes abaixo:

   
λ1 0 0 0 λ1 1 0 0
   
 0 λ 0 0   0 λ 0 0 
 1   1 
Â1 =   ; Â2 =  
 0 0 λ1 0   0 0 λ1 0 
   
0 0 0 λ1 0 0 0 λ1

   
λ1 1 0 0 λ1 1 0 0
   
 0 λ 1 0   0 λ 1 0 
 1   1 
Â3 =   ; Â4 =  
 0 0 λ1 0   0 0 λ1 1 
   
0 0 0 λ1 0 0 0 λ1

=⇒ os ı́ndices do autovalor λ1 são, respectivamente, 1, 2, 3 e 4.

✫ ✪
EEL 6001: Teoria de Sistemas Lineares I algebra.tex 76
✬ ✩

Usando os ı́ndices n̄i de todos os autovalores λi , o polinômio mı́nimo pode


ser expresso da seguinte forma:

φ(λ) = (λ − λi )n̄i
i

 
com grau n̄ = n̄i ≤ ni = n = dimensão de A.

Nas matrizes acima, os polinômios mı́nimos são:

φ1 = (λ − λ1 ) ; φ2 = (λ − λ1 )2
φ3 = (λ − λ1 )3 ; φ4 = (λ − λ1 )4

O polinômio caracterı́stico é sempre ∆(λ) = (λ − λ1 )4 .


Portanto, o polinômio mı́nimo é um fator do polinômio caracterı́stico.

Considere por exemplo a forma de Jordan dada por


 
λ 1 0 0
 
 0 λ 1 0 
 
 =  
 0 0 λ 1 
 
0 0 0 λ

✫ ✪
EEL 6001: Teoria de Sistemas Lineares I algebra.tex 77
✬ ✩

Note que

   
0 1 0 0 0 0 1 0
   
 0 0 1 0   0 0 0 1 
  2  
(Â − λI) =   ; (Â − λI) =  
 0 0 0 1   0 0 0 0 
   
0 0 0 0 0 0 0 0

 
0 0 0 1
 
 0 0 0 0 
 
(Â − λI)3 =   ; (Â − λI)k = 0 para k ≥ 4
 0 0 0 0 
 
0 0 0 0

Portanto, φ(A) = 0 e que nenhum outro polinômio de grau menor verifica


a condição.

✫ ✪
EEL 6001: Teoria de Sistemas Lineares I algebra.tex 78
✬ ✩

Teorema de Cayley-Hamilton

Seja ∆(λ) = det(λI − A) = λn + α1 λn−1 + · · · + αn−1 λ + αn o polinômio


caracterı́stico de A. Então,

∆(A) = An + α1 An−1 + · · · + αn−1 A + αn I = 0


isto é, toda matriz A ∈ Rn×n satisfaz seu polinômio caracterı́stico.

Como ni ≥ n̄i , o polinômio caracterı́stico contém o polinômio mı́nimo


como um fator, ou seja, para algum polinômio h(λ)

∆(λ) = φ(λ)h(λ)

Como φ(A) = 0,

∆(A) = φ(A)h(A) = 0h(A) = 0

Pelo Teorema, An pode ser escrita como uma combinação linear de


{I, A, . . . , An−1 }.

✫ ✪
EEL 6001: Teoria de Sistemas Lineares I algebra.tex 79
✬ ✩

De fato, multiplicando-se ∆(A) = 0 por A tem-se que An+1 pode ser


escrito como combinação linear de {A, A2 . . . , An }, que por sua vez pode
se escrever como combinação linear de {I, A, . . . , An−1 }, e assim
sucessivamente.

Para qualquer polinômio f (λ), independentemente do grau, e valores


apropriados de βi , f (A) pode ser expresso na forma

f (A) = β0 I + β1 A + · · · + βn−1 An−1

Na verdade, se o polinômio mı́nimo (grau n̄) de A é conhecido, A pode


ser expressa como combinação linear de {I, A, . . . , An̄−1 }.

✫ ✪
EEL 6001: Teoria de Sistemas Lineares I algebra.tex 80
✬ ✩

Expressando um polinômio qualquer f (λ) na forma

f (λ) = q(λ)∆(λ) + h(λ)

q(λ): quociente da divisão por ∆(λ)

h(λ): resto da divisão (grau menor que n)

f (A) = q(A)∆(A) + h(A) = q(A)0 + h(A) = h(A)

Uma alternativa à divisão de polinômios acima é dada a seguir. Defina


h(λ) como

h(λ) = β0 + β1 λ + · · · + βn−1 λn−1

βi , i = 0, . . . , n − 1: incógnitas a serem obtidas


Se os n autovalores de A são distintos, βi podem ser obtidos diretamente
das n equações

f (λi ) = q(λi )∆(λi ) + h(λi ) = h(λi ) , i = 1, 2, . . . , n

Se A tem autovalores com multiplicidade maior do que 1, a expressão


acima tem que ser diferenciada (em relação a λ) para fornecer novas
equações.

✫ ✪
EEL 6001: Teoria de Sistemas Lineares I algebra.tex 81
✬ ✩

Seja f (λ) uma função dada e seja A ∈ Rn×n com o polinômio


caracterı́stico


m
m
∆(λ) = (λ − λi )ni ; n= ni
i=1 i=1

Defina o polinômio de grau n − 1 (com n coeficientes a determinar):

h(λ) = β0 + β1 λ + · · · + βn−1 λn−1

Os n coeficientes βi podem ser obtidos do conjunto de n equações dadas


por


 9 = 0, 1, . . . , n − 1
i
f () (λi ) = h() (λi )
 i = 1, 2, . . . , m

 
d
f (λ)  d
h(λ) 
onde f () (λi )   ; h() (λi )  
dλ λ=λi dλ λ=λi

Neste caso, f (A) = g(A) e diz-se que h(λ) é igual a f (λ) no espectro
(conjunto dos autovalores) de A.

✫ ✪
EEL 6001: Teoria de Sistemas Lineares I algebra.tex 82
✬ ✩

• Dois polinômios que tenhas os mesmos valores no espectro de A


definem a mesma função matricial.

• O resultado acima pode ser usado para qualquer função f (λ) (não
necessariamente polinomial), definindo-se f (A) = h(A) e computando-se
os coeficientes βi , i = 0, . . . , n − 1.

• Qualquer polinômio h(λ) de grau n − 1, com n parâmetros


independentes, poderia ser usado.

 
1 2
• A100 , A=  ; ∆(λ) = det(λI − A) = (λ − 1)2
0 1

g(λ) = α0 + α1 λ

Espectro de A: λ = 1 , f (λ) = λ100


f (1) = g(1) → 1 100
= α0 + α1 



=⇒ α0 = −99 ; α1 = 100


d d 
f (1) = g(1) → 100(1 ) = α1 
99
dλ dλ
 
1 200
A100 = f (A) = g(A) = α0 I + α1 A =  
0 1

✫ ✪
EEL 6001: Teoria de Sistemas Lineares I algebra.tex 83
✬ ✩

• Calcule exp(At), isto é, se f (λ) = exp(λt), encontre f (A)


 
0 0 −2
 
A=
 0 1 0 
 ; ∆(λ) = (λ − 1)2 (λ − 2) , n1 = 2, n2 = 1
1 0 3

g(λ) = α0 + α1 λ + α2 λ2 ; f (A) = α0 I + α1 A + α2 A2

f (1) = g(1) → exp(t) = α0 + α1 + α2


f  (1) = g  (1) → t exp(t) = α1 + 2α2
f (2) = g(2) → exp(2t) = α0 + 2α1 + 4α2

α0 = −2t exp(t) + exp(2t) ; α1 = 3t exp(t) + 2 exp(t) − 2 exp(2t)


α2 = exp(2t) − exp(t) − t exp(t)
 
2 exp(t) − exp(2t) 0 2 exp(t) − 2 exp(2t)
 
f (A) = 
 0 exp(t) 0 

− exp(t) + exp(2t) 0 2 exp(2t) − exp(t)

✫ ✪
EEL 6001: Teoria de Sistemas Lineares I algebra.tex 84
✬ ✩

Exemplo: Obtenha a expressão de f (Â) para

 
λ1 1 0 0
 
 0 0 
 λ1 1 
 =  
 0 0 λ1 1 
 
0 0 0 λ1

O polinômio caracterı́stico é dado por ∆(λ) = (λ − λ1 )4 . Escolhendo (de


maneira conveniente)

h(λ) = β0 + β1 (λ − λ1 ) + β2 (λ − λ1 )2 + β3 (λ − λ1 )3

A condição f (λ) = h(λ) no espectro de  fornece

 f  (λ1 ) f (3) (λ1 )


β0 = f (λ1 ) ; β1 = f (λ1 ) ; β2 = ; β3 =
2! 3!
Assim,

f  (λ1 )
f (Â) = f (λ1 )I + (Â − λ1 I)
1!
f  (λ1 ) 2 f (3) (λ1 )
+ (Â − λ1 I) + (Â − λ1 I)3
2! 3!

✫ ✪
EEL 6001: Teoria de Sistemas Lineares I algebra.tex 85
✬ ✩

Usando as propriedades de (Â − λI)k


 
f (λ1 ) f  (λ1 )/1! f  (λ1 )/2! f (3) (λ1 )/3!
 
 0   
 f (λ 1 ) f (λ1 )/1! f (λ1 )/2! 
f (Â) =  
 0 0 f (λ1 ) f (λ1 )/1! 

 
0 0 0 f (λ1 )

Por exemplo, para f (λ) = exp(λt)


 
exp(λ1 t) t exp(λ1 t) t2 exp(λ1 t)/2! t3 exp(λ1 t)/3!
 
 t2 exp(λ1 t)/2! 
 0 exp(λ1 t) t exp(λ1 t) 
exp(Ât) =  
 0 0 exp(λ1 t) t exp(λ1 t) 
 
0 0 0 exp(λ1 t)

Exemplo: Considere a matriz (com dois blocos de Jordan)

 
λ1 1 0 0 0
 
 0 λ 1 0 0 
 1 
 
A=
 0 0 λ1 0 0


 
 0 0 0 λ2 1 
 
0 0 0 0 λ2

• Se f (λ) = exp(λt)= eλt , então


 
eλ1 t teλ1 t t2 eλ1 t /2! 0 0
 
 0 eλ1 t teλ1 t 
 0 0 
 
exp(At) = eAt  0 0 eλ1 t 0 0 

 
 0 0 0 eλ2 t teλ2 t 
 
0 0 0 0 eλ2 t

✫ ✪
EEL 6001: Teoria de Sistemas Lineares I algebra.tex 86
✬ ✩

• Se f (λ) = (s − λ)−1 , então

(sI − A)−1 =
 
1 1 1
 (s − λ1 ) 0 0 
 (s − λ1 )2 (s − λ1 )3 
 1 1 
 0 0 0 
 (s − λ1 ) (s − λ1 )2 
 
 1 
 0 0 0 0 
 (s − λ1 ) 
 1 1 
 0 0 0 
 (s − λ2 ) (s − λ2 )2 
 
 1 
0 0 0 0
(s − λ2 )

✫ ✪
EEL 6001: Teoria de Sistemas Lineares I algebra.tex 87
✬ ✩

Teorema de Cayley-Hamilton
Seja ∆(λ) = det(λI − A) = λn + α1 λn−1 + · · · + αn−1 λ + αn o polinômio
caracterı́stico de A. Então,

∆(A) = An + α1 An−1 + · · · + αn−1 A + αn I = 0

• Se A é uma matriz diagonalizável, então existe uma transformação de


similaridade dada pela matriz Q tal que

A = QΛQ−1 ; Λ diagonal ; A2 = (QΛQ−1 )(QΛQ−1 ) = QΛ2 Q−1

A3 = QΛ3 Q−1 , . . . , Ak = QΛk Q−1


 
n n−1
∆(A) = Q Λ + α1 Λ + · · · + αn−1 Λ + αn I Q−1

e cada termo dentro dos colchetes é uma matriz diagonal cujo elemento
(i, i) é dado por

λni + α1 λn−1
i + · · · + αn−1 λi + αn = ∆(λi ) = 0

pois λi é um autovalor de A.
• O teorema de Cayley-Hamilton fornece uma fórmula explı́cita para o
cálculo da matriz inversa

−1 1  n−1 n−2

A =− A + α1 A + · · · + αn−1 I
αn

No caso geral, a matriz A sempre pode ser reduzida à forma de Jordan


 
−1 n n−1
 = Q AQ ; ∆(A) = Q  + α1  + · · · + αn−1  + αn I Q−1

✫ ✪
EEL 6001: Teoria de Sistemas Lineares I algebra.tex 88
✬ ✩

Para mostrar que a matriz dentro dos colchetes vale sempre zero, note
que a forma de Jordan é composta de blocos diagonais Âi

 = diag {Â1 , Â2 , . . . , Âr } ; Âk = diag {Âk1 , Âk2 , . . . , Âkr }

Considerando um tı́pico bloco Âi , é preciso provar que

 
n n−1
Âi + α1 Âi + · · · + αn−1 Âi + αn I = 0

Note que os termos abaixo da diagonal principal são sempre iguais a zero,
e que na diagonal principal um elemento tı́pico (i, i) é dado por
∆(λi ) = 0. Na diagonal acima da diagonal principal (verificar), um termo
tı́pico é dado por


d∆(λ) 
nλn−1 + α1 (n − 1)λn−2 + · · · + αn−1 = =0
i i
dλ λ=λi

e a raı́z em questão tem multiplicidade maior do que 1. Se Âi é um bloco


de Jordan de tamanho p × p, λi necessariamente é uma raı́z de no mı́nimo
ordem p, e assim as derivadas de ordem até p − 1 são todas iguais a zero
em λ = λi . As sucessivas diagonais acima possuem termos que são
múltiplos
 dessas derivadasda equação caracterı́stica, e portanto
Âni + α1 Ân−1
i + · · · + αn I = 0

✫ ✪
EEL 6001: Teoria de Sistemas Lineares I algebra.tex 89
✬ ✩

Normas e produtos internos

Norma de vetores
Qualquer função real representada por x pode ser definida como uma
norma se para qualquer x ∈ Rn e para qualquer escalar α ∈ R

1. x ≥ 0 ; x = 0 ⇐⇒ x = 0

2. αx = | α | x

3. x1 + x2  ≤ x1  + x2  (Desigualdade Triangular)

Exemplo

 n  p1

xp = | xi |p ; p ≥ 1 p inteiro
i=1

x2 = x x (norma Euclidiana)
x∞ = max | xi | (norma infinito)
i

x
b

x1 = | a | + | b |

x2 = a2 + b2
x∞ = max{| a |, | b |}

✫ ✪
EEL 6001: Teoria de Sistemas Lineares I algebra.tex 90
✬ ✩

Produto Interno

Para dois vetores x, y ∈ Rn , define-se o produto interno (ou produto


escalar) como

 
x, y  x1 y1 + x2 y2 + · · · + xn yn = x y

Propriedades:

   
• αx, y = α x, y

     
• x + y, z = x, z + y, z

   
• x, y = y, x

 
• x, x = x2 ≥ 0

 
• x, x = 0 ⇐⇒ x = 0

• o vetor x pode ser visto como uma função linear x : Rn → R

✫ ✪
EEL 6001: Teoria de Sistemas Lineares I algebra.tex 91
✬ ✩

• Identidade do paralelogramo

x + y2 + x − y2 = 2(x2 + y2 )

x x−y
x+y

Teorema: (Desigualdade de Cauchy-Schwarz)

  1
2
Defina x = x, x . Então,

 
| x, y | ≤ xy

Prova: Para y = 0, a prova é imediata. Assumindo y = 0,


         
0 ≤ x + αy, x + αy = x, x + ᾱ y, x + α x, y + αᾱ y, y

vale ∀ α.

✫ ✪
EEL 6001: Teoria de Sistemas Lineares I algebra.tex 92
✬ ✩

 
y, x
Escolhendo α = −   , tem-se
y, y
    
  x, y y, x | x, y |2
x, x ≥   =  
y, y y, y

O ângulo θ entre quaisquer dois vetores x, y ∈ Rn é dado por

y
θ ! "
x y
y
y

! "
x y
θ = cos−1 =⇒ x y = xy cos θ
xy

✫ ✪
EEL 6001: Teoria de Sistemas Lineares I algebra.tex 93
✬ ✩

Produto Interno

x y = xy cos θ

• Se x e y são colineares: θ = 0, x y = xy e se x = 0 y = αx para


algum α ≥ 0
• Se x e y são vetores opostos: θ = π, x y = −xy e se x = 0 y = −αx
para algum α ≥ 0
π
• Se x e y são vetores ortogonais (x ⊥ y): θ = ± =⇒ x y = 0
2
• x y > 0 =⇒ ângulo agudo; x y < 0 =⇒ ângulo obtuso
• Dado um vetor y ∈ Rn , o conjunto

 

x : xy ≤0

define um semi-espaço em Rn (y é chamado vetor normal) passando no


ponto 0

 

x : xy ≤0

0
y

✫ ✪
EEL 6001: Teoria de Sistemas Lineares I algebra.tex 94

Das könnte Ihnen auch gefallen