Sie sind auf Seite 1von 14

5

Captulo 2 - Reviso Matemtica e Estatstica


2.1 - Organizao dos dados
Os dados multivariados surgem quando um investigador, procurando entender um fenmeno social
ou fsico, seleciona p 1 de variveis ou caractersticas para serem mensuradas.Os valores dessas
variveis so registrados para cada item, pessoa ou ensaio.
Seja X
1
, X
2
, ..., X
p
um conjunto com p variveis aleatrias, que pode ser apresentado sob a forma de
um vetor X | X
1
X
2
... X
p
].
Pretende-se estudar essas p caractersticas para um conjunto de N indivduos, caso se trate de uma
populao ou n no caso de uma amostra.
As variveis so apresentadas
nas colunas e nas linhas cada
um dos indivduos ou itens.
Assim, X
x
11
x
1j
x
1p
. . .
x
i1
x
ij
x
ip
. . .
x
n1
x
nj
x
np
contm os dados
de todas as
observaes sobre
todas as variveis
x
ij
: valor da j-sima varivel observada no i-simo item.
Ex 2.1: Recibos de vendas de livros de uma livraria. Cada recibo informa, entre outras coisas,
nmero total de livros vendidos e a quantia total de cada venda.
Varivel 1 (Venda em R$) 84 104 96 116 100
Varivel 2 (nmero de livros) 4 5 4 3 4
X
84
104
96
116
100
4
5
4
3
4
2.2 - ESTATSTICA DESCRITIVA
Muitas informaes contidas num conjunto de dados pode ser aferida pelo clculo de determinados
indicadores numricos, conhecidos por medidas de estatstica descritiva.
Medidas de locao valores centrais mdia, mediana, moda, etc.
Medidas de espalhamento disperso varincia, desvio absoluto, desvio padro, etc.
x
j

1
n

i1
n
x
ij
, j 1, ..., p mdia amostral
s
j
2

1
n1

i1
n
(x
ij
x
j )
2
, j 1, 2, ..., p varincia amostral
s
i
2
s
ii
e s
ii
desvio padro amostral (medida de variao na mesma unidade de medida das
observaes).
Considere n pares de medidas das variveis 1 e 2: x
11
x
21
... x
n1
T
e x
12
x
22
... x
2n
T
.
Uma medida de associao linear entre as variveis 1 e 2 dada pela covarincia amostral:
s
12

1
n 1

i1
n
(x
i1
x
1 )(x
i2
x
2 )
6
s
12
0, valores grandes da var1 so observados em conjunto com valores grandes da var2 e os
pequenos valores ocorrem juntos.
s
12
0, se o valor grande da var1 e valor pequeno da var2 so observados conjuntamente ou
vice-versa.
s
12
0, se no tiver nenhuma associao entre as duas variveis.
Para as variveis j e k, a covarincia pode ser medida por:
s
jk

1
n 1

i1
n
(x
ij
x
j )(x
ik
x
k ), j 1, 2, ..., p e k 1, 2, .., p.
Covarincia Amostral mede a associao entre a i-sima e k-sima variveis. Alm disso,
s
ik
s
ki,
i e k.
Exemplo: Trs conjuntos de dados, todos com 10 elementos foram observados.
Conjunto 1: Amostra de agentes de uma companhia de seguros: X
1
: anos de servios e X
2
: nmero
de clientes.
Agente A B C D E F G H I J
X
1
3 3 5 5 4 6 8 7 9 10
X
2
48 50 57 53 44 60 63 58 65 72
Conjunto 2: Amostra de famlias: X
1
: renda bruta mensal (sal. min.) e X
2
: porcentagem da renda
gasta com assistncia mdica.
Famlia 1 2 3 4 5 6 7 8 9 10
X
1
12 16 18 20 28 30 40 48 50 54
X
2
7,2 7,4 7,0 6,5 6,6 6,7 6,0 5,6 6,0 5,5
Conunto 3: Amostra de operrios: X
1
: nota de teste de ingls e X
2
: tempo necessrio (em segundos)
para operar uma mquina.
Operrio A B C D E F G H I J
X
1
32 45 52 63 70 72 76 80 90 90
X
2
350 343 370 355 334 337 383 345 375 358
7
Ag. X
1
X
2
X
1
x
1
X
2
x
2 (X
1
x
1 )(X
2
x
2 ) Op. X
1
X
2
X
1
x
1
X
2
x
2 (X
1
x
1 )(X
2
x
2 )
A 3 48 A 35 350
B 3 50 B 45 343
C 5 57 C 52 370
D 5 53 D 61 355
E 4 44 E 70 334
F 6 60 F 72 337
G 8 63 G 75 383
H 7 58 H 80 345
I 9 65 I 90 375
J 10 72 J 90 358
S
1

6, 00 19, 44
19, 44 72, 22
S
2

343, 78 74, 33
74, 33 272, 44
30
35
40
45
50
55
60
65
70
75
2 4 6 8 10 12
N
u
m
.
d
e
c
l
i
e
n
t
e
s
Anos de Emprego
Fig. 1.1 - No. de clientes por tempo de servio
320
330
340
350
360
370
380
390
20 30 40 50 60 70 80 90 100
T
e
m
p
o
O
p
e
r
a

o
Nota de Ingls
Nota de ingls e tempo para operar uma mquina
Coeficiente de Correlao Amostral (Coeficiente de correlao de Pearson) uma medida de
associao linear entre as duas variveis e no depende das unidades de medida.
r
jk

s
jk
s
jj
s
kk


i1
n
(x
ij
x
j )(x
ik
x
k )

i1
n
(x
ij
x
j )
2

i1
n
(x
ik
x
k )
2
, j e k 1, ..., p e r
jk
r
kj
, para j e k.
O coeficiente de correlao amostral r pode ser considerado como uma covarincia amostral, pois
justamente a covarincia amostral das observaes padronizadaas (centradas em zero e expressas em
unidades de desvio padro). Ele tem as seguintes propriedades:
1. O valor de r deve estar entre 1 e 1.
2. r mede a fora da associao linear. Se r 0 no existe associao linear entre as variveis.
Caso contrrio, o sinal de r indica a direo da associao.
3. O valor de r
ik
permanece igual, mesmo que se mude os valores da i-sima varivel para y
ij
ax
ij
b,
i 1, .., n e os valores da k-sima varivel para y
ik
cx
ik
d, i 1, 2, ..., n, desde que as constantes
8
a e c tenham o mesmo sinal.
As estatsticas s
ij
e r
ij
, em geral, no necessariamente refletem todo o conhecimento de associao
entre duas variveis. Associaes no lineares podem existir e no so reveladas por estas estatsticas
descritivas. s vezes, uma observao discrepante (outlier ou wild observation) ou influente acaba
gerando altas correlaes, apesar de no existir uma associao muito forte entre as variveis.
As estatsticas descritivas multivariadas calculadas de n observaes em p variveis podem ser
organizadas em formas matriciais.
mdias amostrais: x
x
1
x
2
.
x
p
px1
varincias e
covarincias
amostrais
S
s
11
s
12
s
1p
s
21
s
22
s
2p
. . `
s
p1
s
p2
s
pp
pxp
correlaes
amostrais
R
1 r
12
r
1p
r
12
1 r
2p
. . `
r
1p
r
2p
1
pxp
Ex 2.2: Para os dados do ex. 2.1, encontre x, S e R.
2.2.1 - DISTNCIA
A maioria das tcnicas multivariadas baseada no conceito de distncias e o conceito de distncia
euclidiana, ou a linha reta deve ser familiar para muitos estudantes.
Considere o ponto P (x
1
, x
2
) no plano cartesiano, a distncia d(0, P), de P origem 0 (0, 0) de
acordo com o teorema de Pitgoras,
d(0, P) x
1
2
x
2
2
(2.1)
Em geral, se P tem p coordenadas a distncia (em linha reta) de P origem :
d(0, P) x
1
2
x
2
2
... x
p
2
(2.2)
Todos os pontos (x
1
, x
2
, ..., x
p ) que situam a uma distncia ao quadrado de uma constante,
denominada c, da origem satisfazem a equao:
d
2
(0, P) x
1
2
x
2
2
... x
p
2
c
2
(2.3)
A expresso (2.3) a equao de uma hiperesfera (um crculo se p 2) e os pontos equidistantes da
origem pertencem a esta hipersesfera.
A distncia entre dois pontos arbitrrios P e Q com coordenadas P (x
1
, x
2
, ..., x
p
) e
Q (y
1
, y
2
, ..., y
p
) dada por:
d(P, Q) (x
1
y
1
)
2
(x
2
y
2
)
2
... (x
p
y
p
)
2
(2.4)
A reta ou distncia euclidiana no adequada para a maioria dos propsitos estatsticos. Isso
9
acontece porque cada coordenada contribui igualmente para o clculo da distncia Euclidiana. Quando
essas coordenadas representam medidas que esto sujeitas a flutuaes aleatrias ou magnitudes
diferentes prefervel trabalhar com coordenadas ponderadas do que ter algumas com grandes
variabilidades e outras no.
Isso sugere o uso de uma nova medida de distncia.
Ser desenvolvida uma distncia que considera as diferenas nas varincias e a presena de
correlao, denominada distncia estatstica.
Suponha n pares de medidas de 2 variveis x
1
e x
2
, x
1
independente de x
2
. Alm disso, a
variabilidade de x
1
maior que de x
2
.
um grfico com maior
variabilidade na direo
x
1
do que na direo de x
2
(Independncia significa que as medidas de x
2
no podem ser preditas com nenhuma acurcia a
partir das medidas de x
1
e vice-versa).
Observando-se a figura anterior, verifica-se que no surpreendente encontrar desvios na direo de
x
1
que se afastem da origem consideravelmente, o que no ocorre na direo x
2
. A variabilidade de x
1

maior do que de x
2
. Ento, razovel ponderar x
2
com mais peso do que x
1
para um mesmo valor,
quando as distncias da origem forem calculadas.
Nesses casos, divide-se cada coordenada pelos seus desvios padro e tem-se coordenadas
padronizadas, x
1

x
1
/ s
11
e x
2

x
2
/ s
22
. Aps eliminar as diferenas de variabilidade das
variveis pode-se usar a frmula da distncia euclidiana.
Ento, uma distncia estatstica do ponto P (x
1
, x
2
) a origem 0 (0, 0) pode ser calculada das
coordenadas padronizadas, como:
d(0, P) x
1
2
x
2
2

x
1
s
11
2

x
2
s
22
2

x
1
2
s
11

x
2
2
s
22
(2.5)
Se as varincias forem iguais conveniente usar a frmula da distncia Euclidiana (sem dividir pela
varincia).
Usando (2.5), todos os pontos (x
1
, x
2 ) que esto a uma distncia c
2
da origem devem satisfazer:
x
1
2
s
11

x
2
2
s
22
c
2
(2.6)
que uma equao de uma elipse centrada na origem, cujos eixos maior e menor coincidem com os
eixos das coordenadas.
Ex 2.5: Um conjunto de pares (x
1
, x
2 ) de medidas de duas variveis resultou em x
1
x
2
0,
s
11
4 e s
22
1. Suponha que as medidas x
1
no estejam relacionadas com as de x
2
(varia
independentemente uma da outra). Como as varincias no so iguais, mede-se a distncia ao quadrado
de um ponto arbitrrio P (x
1
, x
2 ) a origem 0 (0, 0) por:
10
d
2
(0, P)
x
1
2
4

x
2
2
1
Todos os pontos (x
1
, x
2 ) que esto a uma distncia igual a 1 da origem satisfazem a equao
x
1
2
4

x
2
2
1
1.
Nesse caso, por exemplo, os pontos (0, 1), (0, 1), (2, 0), (1, 3 /2) ficam a distncia 1 da origem.
Um grfico dessa equao uma elipse, com a maior coordenada em x
1
. O comprimento de x
1

c s
11
1 4 2 e de x
2
c s
22
1.
Todos os pontos sobre
a elipse tm a mesma
distncia estatstica da
origem, que no caso 1.
Essas equaes anteriores podem ser generalizadas.
1. para p 2, a distncia estatstica de um ponto arbitrrio P (x
1
, x
2 ) a um ponto fixo Q (y
1
, y
2
)
dada por:
d(P, Q)
(x
1
y
1
)
2
s
11

(x
2
y
2
)
2
s
22
(2.7)
2. para p 2 P (x
1
, ..., x
p
) e Q (y
1
, y
2
, ..., y
p
).
d(P, Q)
(x
1
y
1
)
2
s
11

(x
2
y
2
)
2
s
22
...
(xpyp)
2
spp
Todos os pontos que esto a uma distncia constante ao quadrado caem sobre uma hiperelipsoide
centrada em Q cujos eixos maiores e menores so paralelos aos eixos das coordenadas.
Obs: i) Para a distncia de P at origem, y
1
y
2
... y
p
0.
ii) Se s
11
s
22
... s
pp
, ento melhor usar a distncia euclidiana, dada em (2.4).
A distncia (2.7) no inclui a maioria dos casos importantes encontrados na prtica, por causa da
suposio de independncia.
O que acontece quando as variveis no so independentes?
A medida de x
2
no varia independen-
temente de x
1
. Quando x
1
cresce,
x
2
tambm e vice-versa. Alm disso,
variabilidade de x
2
maior que de x
1
.
Qual a melhor medida de distncia para esses casos, em que:
- a variabilidade de x
1
diferente de x
2
e
- as variveis x
1
e x
2
so correlacionadas?
Faz-se uma pequena transformao, isto , faz-se uma rotao de ngulo nos eixos e tem-se novos
11
eixos x
1
e x
2.
O grfico fica muito semelhante a aquele visto inicialmente.
Isso significa que pode-se usar x
1
e x
2
e calcular suas varincias s
11
e s
22
, para obter a distncia do
ponto P ( x
1
, x
2
) at a origem 0 (0, 0):
d(0, P)
x
1
2
s
11

x
2
2
s
22
(2.8)
A relao entre as coordenadas originais (x
1
, x
2 ) e as novas ( x
1
, x
2
) dada por:
x
1
x
1
cos() x
2
sen()
x
2
x
1
sen() x
2
cos()
(2.9)
Com essas relaes, pode-se substituir x
1
e x
2
em (2.8) e expressar a distncia em termos das
coordenadas originais.
d(0, P) a
11
x
1
2
2a
12
x
1
x
2
a
22
x
2
2
(2.10)
Sejam:
A cos
2
()s
11
2sen() cos()s
12
sen
2
()s
22
B cos
2
()s
22
2sen() cos()s
12
sen
2
()s
11
(2.11)
Portanto:
a
11

cos
2
()
A

sen
2
()
B
a
22

sen
2
()
A

cos
2
()
B
a
12

cos()sen()
A

sen() cos()
B
Em geral, a distncia estatstica do ponto P (x
1
, x
2 ) a um ponto fixo Q (y
1
, y
2
), para variveis
correlacionadas, tem a forma:
d(Q, P) a
11
(x
1
y
1
)
2
2a
12
(x
1
y
1
)(x
2
y
2
) a
22
(x
2
y
2
)
2
(2.12)
Alm disso, as coordenadas de todos os pontos P (x
1
, x
2 ) que esto a uma distncia c de Q
satisfazem:
a
11
(x
1
y
1
)
2
2a
12
(x
1
y
1
)(x
2
y
2
) a
22
(x
2
y
2
)
2
c
2
(2.13)
Esta uma equao de uma elipse centrada em Q.
12
E para p 2
d(0, P) a
11
x
1
2
a
22
x
2
2
... a
pp
x
p
2
2a
12
x
1
x
2
2a
13
x
1
x
3
... 2a
p1,p
x
p1
x
p
(2.14)
d(Q, P)
a
11
(x
1
y
1
)
2
a
22
(x
2
y
2
)
2
... a
pp
(x
p
y
p
)
2
2a
12
(x
1
y
1
)(x
2
y
2
)
2a
13
(x
1
y
1
)(x
3
y
3
) ... 2a
p1,p
(x
p1
y
p1
)(x
p
y
p
)
(2.15)
em que a

s so nmeros tais que as distncias so sempre no negativas.


Os contornos das distncias constantes calculadas em (2.14) e (2.15) so hiperelipsides (p 3,
lembra uma bola de futebol americano).
Por que considerar distncia estatstica do que distncia euclidiana?
Veja o exemplo:
Considere a distncia euclidiana dos
ponto Q aos pontos P e 0.
d(P, Q) d(Q, 0)
Entretanto P parece ser um ponto mais provvel no conglomerado do que a origem. Considerando a
variabilidade dos pontos na distncia estatstica, Q estar mais prximo de P do que de 0.
Outras medidas de distncia podem ser consideradas.
Qualquer medida de distncia d(P, Q) entre dois pontos P e Q vlida se:
d(P, Q) d(Q, P)
d(P, Q) 0 se P Q
d(P, Q) 0 se P Q
d(P, Q) d(P, R) d(R, Q) (desigualdade triangular), em que R qualquer ponto intermedirio.
2.3 - LGEBRA MATRICIAL
Considera-se vetor coluna: x
x
1
x
2
.
x
n
e x

|x
1
, x
2
, ..., x
n ]
Um vetor x pode ser representado geometricamente como uma reta orientada de n dimenses, com o
componente x
1
ao longo do 1 eixo, x
2
ao longo do 2 eixo, etc.
O comprimento de um vetor x, dado por L
x
, : L
x
x
1
2
x
2
2
... x
n
2
.
Multiplicando por uma constante c, o comprimento fica: L
cx
|c| L
x
.
13
ngulo
cos
1

x
1
Lx
cos
2

y
1
Ly
sen
1

x
2
Lx
sen
2

y
2
Ly
cos cos(
2

1
) cos
2
cos
1
sen
2
sen
1

y
1
Ly
x
1
Lx

y
2
Ly
x
2
Lx

x
1
y
1
x
2
y
2
LxLy
O produto interno de x e y : x

y x
1
y
1
x
2
y
2
... x
n
y
n

L
x
comprimento de x x

x e cos
x

y
Lx Ly

y
x

x y

y
Ex: x

|1, 3, 2] e y

|2, 1, 1]. Encontre 3x e x y. Determine o comprimento de x, y e o


ngulo entre x, y
Definio: Um conjunto de vetores x
1
, x
2
, ..., x
k
linearmente dependente se houver constantes
c
1
, c
2
, ..., c
k
, no todos nulos, tal que: c
1
x
1
c
2
x
2
.... c
k
x
k
0. Caso contrrio, linearmente
independente.
EX: Considere o conjunto de vetores:
x
1

1
2
1
, x
2

1
0
2
, x
3

2
1
1
Verifique se so linearmente dependentes ou independentes.
PROJEO de um vetor x sobre o vetor y dada por:
x

y
Ly
1
Ly
y
x

y
y

y
y O comprimento da projeo
|x

y|
Ly
L
x
x

y
LyLx
L
x
|cos|.
Ortogonalidade dois vetores no nulos so ortogonais se o cosseno do ngulo entre eles for zero
(xy 0)
Base ortonormal de vetores cada vetor da base possui um comprimento unitrio (x
i

x
i
1) e cada
par de vetor da base so ortogonais (x
i

x
j
0, i j)
2.3.1 Matrizes
* i) (A.B)
1
B
1
A
1
ii) (A B)

iii) (AB)

iv) (A
1
)

(A

)
1
* Uma matriz Q ortogonal se QQ

Q I ou Q

Q
1
.
14
Ex: Verifique se L
1
2
1
2
1
2
1
2
ortogonal.
* i) |A

| |A| ii) |A
1
|
1
|A|
|A|
1
iii) |A.B| |A| |B|
* Se |A| 0 A denominado de posto completo, A no singular e A
1
existe.
* Trao de A , tr(A) a
ii
(soma dos elementos da diagonal principal da matriz)
* i) tr (A B) tr(A) tr(B) ii) tr(cA) ctr(A) iii) tr(A

) tr(A)
* iv) tr (AB) tr(BA) v) tr(ABC) tr|(AB)C] tr(CAB)
* Uma matriz quadrada A tem autovalor , com correspondente autovetor x 0, se Ax x.
Obs: comum normalizar x tal que seu comprimento seja 1 x

x (E conveniente denotar os
autovetores normalizados por e).
Se A for uma matriz quadrada e simtrica, A tem k pares de autovalores e autovetores:
(
1
, e
1 ), (
2
, e
2 ), ..., (
k
, e
k ).
Os autovetores podem ser escolhidos satisfazendo 1 e
1

e
1
e
2

e
2
... e
k

e
k
e so mutuamente
perpendiculares.
Os escalares
1
,
2
, ...,
k
satisfazem a equao polinomial |A I| 0.
Ex: A
3 2
2 5

O estudo de variao e de inter-relaes em dados multivariados so freqentemente baseados em
distncia e na suposio de que os dados tm uma distribuio normal multivariada.
O quadrado das distncias e a densidade da normal multivariada podem ser expressos em termos de
produtos de matrizes denominados formas quadrticas.
Portanto, as formas quadrticas tm um papel bastante importante na anlise multivariada.
Resultados envolvendo formas quadrticas e matrizes simtricas so, em muitos casos, uma
conseqncia direta de uma expanso para matrizes simtricas conhecidas como
decomposio espectral.
A decomposio espectral de uma matriz A(kxk) simtrica dada por:
A
(kxk)

1
e
1
e
1


2
e
2
e
2

...
k
e
k
e
k

i
- autovalores e e
i
- autovetores normalizados associados.
15
Ex: A
10, 00 0, 70 15, 00
0, 70 0, 08 1, 10
15, 00 1, 10 35, 00
Os autovalores so:
1
42, 065,
2
2, 984 e
3
0, 031.
Voc pode verificar que os autovetores podem ser, respectivamente:
e
1

| 0, 425 0, 031 0, 905 ], e


2

| 0, 903 0, 057 0, 425 ] e


e
3

| 0, 064 0, 998 0, 004 ].


A decomposio espectral de A :A
1
e
1
e
1


2
e
2
e
2


31
e
3
e
3

ou
10, 00 0, 70 15, 00
0, 70 0, 08 1, 10
15, 00 1, 10 35, 00

42, 065
0, 425
0, 031
0, 905
| 0, 425 0, 031 0, 905 ] 2, 984
0, 903
0, 057
0, 425
| 0, 903 0, 057 0, 425 ]
0, 031
0, 064
0, 998
0, 004
| 0, 064 0, 998 0, 004 ]
7, 56 0, 55 16, 15
0, 55 0, 04 1, 17
16, 15 1, 17 34, 46

2, 43 0, 15 1, 14
0, 15 0, 01 0, 07
1, 14 0, 07 0, 54

0, 0001 0, 0020 0, 0008


0, 0020 0, 0305 0, 0130
0, 0008 0, 0130 0, 0055
, como pode ser verificado.
A decomposio espectral uma ferramenta analtica muito importante, pois por meio dela pode-se
demonstrar muitos resultados estatsticos, como por exemplo a distncia.
Se A
(kxk)
uma matriz simtrica tal que x

Ax 0 para x

|x
1
, x
2
, ..., x
k ], ento A denominada
definida no negativa (no negativa definida)
Se a igualdade valer somente para o vetor x

|0, 0, ..., 0] ento, A definida positiva. (positiva


definida) (x

Ax 0 para x 0).
Por Q x

Ax

i1
n
a
ii
x
i
2
2

i1
n1

ji1
n
a
ij
x
i
x
j
ter apenas termos ao quadrado (x
i
2
) e produtos (x
i
x
j
)
chamado de forma quadrtica.
Usando decomposio espectral possvel mostrar que uma matriz simtrica A
(kxk)
definida
positiva o autovalor de A positivo. Se A for definida no negativa todos os autovalores so 0.
Ex: Mostre que a seguinte forma quadrtica definida positiva: 3x
1
2
2x
2
2
2 2 x
1
x
2
.
16
Vejam a frmula (2.14) sobre distncia!
(dist)
2
a
11
x
1
2
... a
pp
x
p
2
2(a
12
x
1
x
2
.... a
p1,p
x
p1
x
p
)
Dado que (dist)
2
0, para x 0 e fazendo a
ij
a
ji
(simetria), tem-se que:
0 (dist)
2
x
1
x
2
... x
p
a
11
a
12
a
1p
a
21
a
22
a
2p
. . .
a
p1
a
p2
a
pp
x
1
x
2
.
x
p
x

Ax
a distncia determinada de uma forma quadrtica x

Ax uma forma quadrtica positiva


definida pode ser interpretada como o quadrado da distncia.
Comentrio: Seja o quadrado da distncia de um ponto x

(x
1
, x
2
, ..., x
p
) a origem dada por x

Ax,
em que A
(pxp)
uma matriz simtrica e positiva definida. Ento, o quadrado da distncia de x a um
ponto fixo arbitrrio

(
1
,
2
, ...,
p
) dado pela expresso (x )

A(x ).
Isso permite uma interpretao geomtrica baseada em autovalores e autovetores da matriz A.
Por ex: p 2. Qualquer ponto x

(x
1
, x
2
) distante c
2
da origem satisfaz:
x

Ax a
11
x
1
2
a
22
x
2
2
2a
12
x
1
x
2
c
2
.
Pela decomposio espectral A
1
e
1
e
1


2
e
2
e
2

Ax
1
(x

e
1
)
2

2
(x

e
2
)
2

c
2

1
y
1
2

2
y
2
2
uma elipse.
Tem-se que x c
1
1/2
e
1
satisfaz x

Ax
1
(c
1
1/2
e
1

e
1
)
2
c
2
e x c
1
1/2
e
2
d a distncia apropriada
na direo e
2
.
Ento, os pontos com distncia c caem sobre uma elipse cujos eixos so dados por autovetores de A
com comprimentos proporcionais as razes quadradas dos recprocos vetores.
1
1

2
Se p 2, os pontos x

|x
1
, x
2
, ..., x
p ] distantes c x

Ax da origem caem sobre um


hiperelipside c
2

1
(x
1

e
1
)
2
...
p
(x
p

e
p
)
2
, cujos eixos so dados por autovetores de A. A metade
do comprimento na direo e
i
igual a c/
i
, i 1, 2, ...,
i
autovalor de A.
Raiz Quadrada de uma Matriz
Pela decomposio espectral:
A
(kxk)


i1
k

i
e
i
e
i

P'P

, sendo:
17
P |e
1
, e
2
, ..., e
k
] e '

1
0 0
0
2
0
. . ` .
0 0
k
, com
i
0
PP

P I P ortogonal
A
1
(P'P

)
1
P'
1
P


i1
k
(1/
i
)e
i
e
i

AA
1
(P'P

)(P'P

)
1
P'P

P'
1
P

I
Seja '
1/2
: a matriz diagonal com o i-simo elemento da diagonal
i
.
A matriz
i1
k

i
e
i
e
i

P'
1/2
P

uma raiz quadrada de A, denotada por A


1/2
, tem as seguintes
propriedades:
1. A
1/2

A
1/2
(isto , A
1/2
simtrica).
2. A
1/2
A
1/2
A.
3. A
1/2
1

i1
k
(1/
i
)e
i
e
i

P'
1/2
P

, com '
1/2
uma matriz diagonal com o 1/
i
como o
i-simo elemento da diagonal.
4. A
1/2
A
1/2
A
1/2
A
1/2
I e A
1/2
A
1/2
A
1
em que A
1/2
A
1/2
1
.
2.4. Vetores e Matrizes Aleatrios
Um vetor aleatrio um vetor cujos elementos so variveis aleatrias. Similarmente, uma matriz
aleatria uma matriz cujos elementos so variveis aleatrias.
E(X)
E(X
11
) E(X
12
) E(X
1n
)
E(X
21
) E(X
22
) E(X
2n
)
. . .
E(X
p1
) E(X
p2
) E(X
pn
)
, em que:
E(X
ij
)

x
ij
f
ij
(x
ij
)dx
ij,
X
ij
v. a. contnua com funo densidade de probab. f
ij
(x
ij
)

x
ij
x
ij
p
ij
(x
ij
) X
ij
v. a. discreta com funo densidade de probab p
ij
(x
ij
)
Ex: a) p 2 e n 1 X

|X
1
, X
2
]. X
1
e X
2
tem a seguinte funo de probabilidade.
x
1
1 0 1
p
1
(x
1
) 0, 3 0, 3 0, 4
x
2
0 1
p
2
(x
2
) 0, 8 0, 2
b) f(x
1,
x
2
)
x
1
2

x
1
x
2
3
, 0 x
1
1, 0 x
2
2
0 para qquer outros valores
Sejam X e Y matrizes aleatrias de mesma dimenso e sejam A e B, matrizes de constantes:
E(X Y) E(X) E(Y) e E(AXB) AE(X)B
18
Vetor Mdia e Matriz de Covarincia
X X
i
)
(px1)
matriz aleatria (vetor)
As mdias marginais
i
e varincias
i
2
so definidas respectivamente, como:
i
E(X
i
) e

i
2
E(X
i

i
)
2
, i 1, 2, ..., p.

x
i
f
i
(x
i
)dx
i
contnua

x
i
x
i
p
i
(x
i
) discreta

i
2

ii

(x
i

i
)
2
f
i
(x
i
)dx
i
contnua

x
i
(x
i

i
)
2
p
i
(x
i
) discreta
medida de associao linear entre quaisquer pares de v. as:

ik
E(X
i

i
)(X
k

k
)

(x
i

i
)(x
k

k
) f
ik
(x
i
, x
k
)dx
i
dx
k
contnua

x
i

x
k
(x
i

i
)(x
k

k
) p
ik
(x
i
, x
k
) discreta
Generalizando, o vetor aleatrio X

|X
1
, X
2,
..., X
p
] tem uma funo densidade de probabilidade
conjunta f(x
1
, x
2
, ..., x
p
) f(x). Freqentemente, f(x) ser uma funo densidade normal multivariada.
Se P|X
i
x
i
e X
k
x
k
] P|X
i
x
i ]P|X
k
x
k
], todos os pares (x
i
, x
k
) X
i
e X
k
so
estatisticamente independentes, ou f
ik
(x
i
, x
k
) f
i
(x
i
)f
k
(x
k
).
X
1
, X
2,
..., X
p
so estatisticamente mutuamente independentes se f
1,..,p
(x
1
, .., x
p
) f
1
(x
1
) f
2
(x
2
) ...
f
p
(x
p
).
Se X
i
e X
k
so independentes, ento Cov(X
i
, X
k
) 0.
E(X)
E(X
1
)
E(X
2
)
.
E(X
p
)

2
.

p

E(X )(X )

E(X
1

1
)
2
E(X
1

1
)(X
2

2
) E(X
1

1
)(X
p

p
)
E(X
2

2
)(X
1

1
) E(X
2

2
)
2
E(X
2

2
)(X
p

p
)
. . ` .
E(X
p

p
)(X
1

1
) E(X
p

p
)(X
2

2
) E(X
p

p
)
2
Cov(X)

11

12

1p

21

22

2p
. . ` .

p1

p2

pp
Ex: Encontre a matriz de covarincia para duas v.as. X
1
e X
2
.

Das könnte Ihnen auch gefallen