Beruflich Dokumente
Kultur Dokumente
1
n1
i1
n
(x
ij
x
j )
2
, j 1, 2, ..., p varincia amostral
s
i
2
s
ii
e s
ii
desvio padro amostral (medida de variao na mesma unidade de medida das
observaes).
Considere n pares de medidas das variveis 1 e 2: x
11
x
21
... x
n1
T
e x
12
x
22
... x
2n
T
.
Uma medida de associao linear entre as variveis 1 e 2 dada pela covarincia amostral:
s
12
1
n 1
i1
n
(x
i1
x
1 )(x
i2
x
2 )
6
s
12
0, valores grandes da var1 so observados em conjunto com valores grandes da var2 e os
pequenos valores ocorrem juntos.
s
12
0, se o valor grande da var1 e valor pequeno da var2 so observados conjuntamente ou
vice-versa.
s
12
0, se no tiver nenhuma associao entre as duas variveis.
Para as variveis j e k, a covarincia pode ser medida por:
s
jk
1
n 1
i1
n
(x
ij
x
j )(x
ik
x
k ), j 1, 2, ..., p e k 1, 2, .., p.
Covarincia Amostral mede a associao entre a i-sima e k-sima variveis. Alm disso,
s
ik
s
ki,
i e k.
Exemplo: Trs conjuntos de dados, todos com 10 elementos foram observados.
Conjunto 1: Amostra de agentes de uma companhia de seguros: X
1
: anos de servios e X
2
: nmero
de clientes.
Agente A B C D E F G H I J
X
1
3 3 5 5 4 6 8 7 9 10
X
2
48 50 57 53 44 60 63 58 65 72
Conjunto 2: Amostra de famlias: X
1
: renda bruta mensal (sal. min.) e X
2
: porcentagem da renda
gasta com assistncia mdica.
Famlia 1 2 3 4 5 6 7 8 9 10
X
1
12 16 18 20 28 30 40 48 50 54
X
2
7,2 7,4 7,0 6,5 6,6 6,7 6,0 5,6 6,0 5,5
Conunto 3: Amostra de operrios: X
1
: nota de teste de ingls e X
2
: tempo necessrio (em segundos)
para operar uma mquina.
Operrio A B C D E F G H I J
X
1
32 45 52 63 70 72 76 80 90 90
X
2
350 343 370 355 334 337 383 345 375 358
7
Ag. X
1
X
2
X
1
x
1
X
2
x
2 (X
1
x
1 )(X
2
x
2 ) Op. X
1
X
2
X
1
x
1
X
2
x
2 (X
1
x
1 )(X
2
x
2 )
A 3 48 A 35 350
B 3 50 B 45 343
C 5 57 C 52 370
D 5 53 D 61 355
E 4 44 E 70 334
F 6 60 F 72 337
G 8 63 G 75 383
H 7 58 H 80 345
I 9 65 I 90 375
J 10 72 J 90 358
S
1
6, 00 19, 44
19, 44 72, 22
S
2
343, 78 74, 33
74, 33 272, 44
30
35
40
45
50
55
60
65
70
75
2 4 6 8 10 12
N
u
m
.
d
e
c
l
i
e
n
t
e
s
Anos de Emprego
Fig. 1.1 - No. de clientes por tempo de servio
320
330
340
350
360
370
380
390
20 30 40 50 60 70 80 90 100
T
e
m
p
o
O
p
e
r
a
o
Nota de Ingls
Nota de ingls e tempo para operar uma mquina
Coeficiente de Correlao Amostral (Coeficiente de correlao de Pearson) uma medida de
associao linear entre as duas variveis e no depende das unidades de medida.
r
jk
s
jk
s
jj
s
kk
i1
n
(x
ij
x
j )(x
ik
x
k )
i1
n
(x
ij
x
j )
2
i1
n
(x
ik
x
k )
2
, j e k 1, ..., p e r
jk
r
kj
, para j e k.
O coeficiente de correlao amostral r pode ser considerado como uma covarincia amostral, pois
justamente a covarincia amostral das observaes padronizadaas (centradas em zero e expressas em
unidades de desvio padro). Ele tem as seguintes propriedades:
1. O valor de r deve estar entre 1 e 1.
2. r mede a fora da associao linear. Se r 0 no existe associao linear entre as variveis.
Caso contrrio, o sinal de r indica a direo da associao.
3. O valor de r
ik
permanece igual, mesmo que se mude os valores da i-sima varivel para y
ij
ax
ij
b,
i 1, .., n e os valores da k-sima varivel para y
ik
cx
ik
d, i 1, 2, ..., n, desde que as constantes
8
a e c tenham o mesmo sinal.
As estatsticas s
ij
e r
ij
, em geral, no necessariamente refletem todo o conhecimento de associao
entre duas variveis. Associaes no lineares podem existir e no so reveladas por estas estatsticas
descritivas. s vezes, uma observao discrepante (outlier ou wild observation) ou influente acaba
gerando altas correlaes, apesar de no existir uma associao muito forte entre as variveis.
As estatsticas descritivas multivariadas calculadas de n observaes em p variveis podem ser
organizadas em formas matriciais.
mdias amostrais: x
x
1
x
2
.
x
p
px1
varincias e
covarincias
amostrais
S
s
11
s
12
s
1p
s
21
s
22
s
2p
. . `
s
p1
s
p2
s
pp
pxp
correlaes
amostrais
R
1 r
12
r
1p
r
12
1 r
2p
. . `
r
1p
r
2p
1
pxp
Ex 2.2: Para os dados do ex. 2.1, encontre x, S e R.
2.2.1 - DISTNCIA
A maioria das tcnicas multivariadas baseada no conceito de distncias e o conceito de distncia
euclidiana, ou a linha reta deve ser familiar para muitos estudantes.
Considere o ponto P (x
1
, x
2
) no plano cartesiano, a distncia d(0, P), de P origem 0 (0, 0) de
acordo com o teorema de Pitgoras,
d(0, P) x
1
2
x
2
2
(2.1)
Em geral, se P tem p coordenadas a distncia (em linha reta) de P origem :
d(0, P) x
1
2
x
2
2
... x
p
2
(2.2)
Todos os pontos (x
1
, x
2
, ..., x
p ) que situam a uma distncia ao quadrado de uma constante,
denominada c, da origem satisfazem a equao:
d
2
(0, P) x
1
2
x
2
2
... x
p
2
c
2
(2.3)
A expresso (2.3) a equao de uma hiperesfera (um crculo se p 2) e os pontos equidistantes da
origem pertencem a esta hipersesfera.
A distncia entre dois pontos arbitrrios P e Q com coordenadas P (x
1
, x
2
, ..., x
p
) e
Q (y
1
, y
2
, ..., y
p
) dada por:
d(P, Q) (x
1
y
1
)
2
(x
2
y
2
)
2
... (x
p
y
p
)
2
(2.4)
A reta ou distncia euclidiana no adequada para a maioria dos propsitos estatsticos. Isso
9
acontece porque cada coordenada contribui igualmente para o clculo da distncia Euclidiana. Quando
essas coordenadas representam medidas que esto sujeitas a flutuaes aleatrias ou magnitudes
diferentes prefervel trabalhar com coordenadas ponderadas do que ter algumas com grandes
variabilidades e outras no.
Isso sugere o uso de uma nova medida de distncia.
Ser desenvolvida uma distncia que considera as diferenas nas varincias e a presena de
correlao, denominada distncia estatstica.
Suponha n pares de medidas de 2 variveis x
1
e x
2
, x
1
independente de x
2
. Alm disso, a
variabilidade de x
1
maior que de x
2
.
um grfico com maior
variabilidade na direo
x
1
do que na direo de x
2
(Independncia significa que as medidas de x
2
no podem ser preditas com nenhuma acurcia a
partir das medidas de x
1
e vice-versa).
Observando-se a figura anterior, verifica-se que no surpreendente encontrar desvios na direo de
x
1
que se afastem da origem consideravelmente, o que no ocorre na direo x
2
. A variabilidade de x
1
maior do que de x
2
. Ento, razovel ponderar x
2
com mais peso do que x
1
para um mesmo valor,
quando as distncias da origem forem calculadas.
Nesses casos, divide-se cada coordenada pelos seus desvios padro e tem-se coordenadas
padronizadas, x
1
x
1
/ s
11
e x
2
x
2
/ s
22
. Aps eliminar as diferenas de variabilidade das
variveis pode-se usar a frmula da distncia euclidiana.
Ento, uma distncia estatstica do ponto P (x
1
, x
2
) a origem 0 (0, 0) pode ser calculada das
coordenadas padronizadas, como:
d(0, P) x
1
2
x
2
2
x
1
s
11
2
x
2
s
22
2
x
1
2
s
11
x
2
2
s
22
(2.5)
Se as varincias forem iguais conveniente usar a frmula da distncia Euclidiana (sem dividir pela
varincia).
Usando (2.5), todos os pontos (x
1
, x
2 ) que esto a uma distncia c
2
da origem devem satisfazer:
x
1
2
s
11
x
2
2
s
22
c
2
(2.6)
que uma equao de uma elipse centrada na origem, cujos eixos maior e menor coincidem com os
eixos das coordenadas.
Ex 2.5: Um conjunto de pares (x
1
, x
2 ) de medidas de duas variveis resultou em x
1
x
2
0,
s
11
4 e s
22
1. Suponha que as medidas x
1
no estejam relacionadas com as de x
2
(varia
independentemente uma da outra). Como as varincias no so iguais, mede-se a distncia ao quadrado
de um ponto arbitrrio P (x
1
, x
2 ) a origem 0 (0, 0) por:
10
d
2
(0, P)
x
1
2
4
x
2
2
1
Todos os pontos (x
1
, x
2 ) que esto a uma distncia igual a 1 da origem satisfazem a equao
x
1
2
4
x
2
2
1
1.
Nesse caso, por exemplo, os pontos (0, 1), (0, 1), (2, 0), (1, 3 /2) ficam a distncia 1 da origem.
Um grfico dessa equao uma elipse, com a maior coordenada em x
1
. O comprimento de x
1
c s
11
1 4 2 e de x
2
c s
22
1.
Todos os pontos sobre
a elipse tm a mesma
distncia estatstica da
origem, que no caso 1.
Essas equaes anteriores podem ser generalizadas.
1. para p 2, a distncia estatstica de um ponto arbitrrio P (x
1
, x
2 ) a um ponto fixo Q (y
1
, y
2
)
dada por:
d(P, Q)
(x
1
y
1
)
2
s
11
(x
2
y
2
)
2
s
22
(2.7)
2. para p 2 P (x
1
, ..., x
p
) e Q (y
1
, y
2
, ..., y
p
).
d(P, Q)
(x
1
y
1
)
2
s
11
(x
2
y
2
)
2
s
22
...
(xpyp)
2
spp
Todos os pontos que esto a uma distncia constante ao quadrado caem sobre uma hiperelipsoide
centrada em Q cujos eixos maiores e menores so paralelos aos eixos das coordenadas.
Obs: i) Para a distncia de P at origem, y
1
y
2
... y
p
0.
ii) Se s
11
s
22
... s
pp
, ento melhor usar a distncia euclidiana, dada em (2.4).
A distncia (2.7) no inclui a maioria dos casos importantes encontrados na prtica, por causa da
suposio de independncia.
O que acontece quando as variveis no so independentes?
A medida de x
2
no varia independen-
temente de x
1
. Quando x
1
cresce,
x
2
tambm e vice-versa. Alm disso,
variabilidade de x
2
maior que de x
1
.
Qual a melhor medida de distncia para esses casos, em que:
- a variabilidade de x
1
diferente de x
2
e
- as variveis x
1
e x
2
so correlacionadas?
Faz-se uma pequena transformao, isto , faz-se uma rotao de ngulo nos eixos e tem-se novos
11
eixos x
1
e x
2.
O grfico fica muito semelhante a aquele visto inicialmente.
Isso significa que pode-se usar x
1
e x
2
e calcular suas varincias s
11
e s
22
, para obter a distncia do
ponto P ( x
1
, x
2
) at a origem 0 (0, 0):
d(0, P)
x
1
2
s
11
x
2
2
s
22
(2.8)
A relao entre as coordenadas originais (x
1
, x
2 ) e as novas ( x
1
, x
2
) dada por:
x
1
x
1
cos() x
2
sen()
x
2
x
1
sen() x
2
cos()
(2.9)
Com essas relaes, pode-se substituir x
1
e x
2
em (2.8) e expressar a distncia em termos das
coordenadas originais.
d(0, P) a
11
x
1
2
2a
12
x
1
x
2
a
22
x
2
2
(2.10)
Sejam:
A cos
2
()s
11
2sen() cos()s
12
sen
2
()s
22
B cos
2
()s
22
2sen() cos()s
12
sen
2
()s
11
(2.11)
Portanto:
a
11
cos
2
()
A
sen
2
()
B
a
22
sen
2
()
A
cos
2
()
B
a
12
cos()sen()
A
sen() cos()
B
Em geral, a distncia estatstica do ponto P (x
1
, x
2 ) a um ponto fixo Q (y
1
, y
2
), para variveis
correlacionadas, tem a forma:
d(Q, P) a
11
(x
1
y
1
)
2
2a
12
(x
1
y
1
)(x
2
y
2
) a
22
(x
2
y
2
)
2
(2.12)
Alm disso, as coordenadas de todos os pontos P (x
1
, x
2 ) que esto a uma distncia c de Q
satisfazem:
a
11
(x
1
y
1
)
2
2a
12
(x
1
y
1
)(x
2
y
2
) a
22
(x
2
y
2
)
2
c
2
(2.13)
Esta uma equao de uma elipse centrada em Q.
12
E para p 2
d(0, P) a
11
x
1
2
a
22
x
2
2
... a
pp
x
p
2
2a
12
x
1
x
2
2a
13
x
1
x
3
... 2a
p1,p
x
p1
x
p
(2.14)
d(Q, P)
a
11
(x
1
y
1
)
2
a
22
(x
2
y
2
)
2
... a
pp
(x
p
y
p
)
2
2a
12
(x
1
y
1
)(x
2
y
2
)
2a
13
(x
1
y
1
)(x
3
y
3
) ... 2a
p1,p
(x
p1
y
p1
)(x
p
y
p
)
(2.15)
em que a
|x
1
, x
2
, ..., x
n ]
Um vetor x pode ser representado geometricamente como uma reta orientada de n dimenses, com o
componente x
1
ao longo do 1 eixo, x
2
ao longo do 2 eixo, etc.
O comprimento de um vetor x, dado por L
x
, : L
x
x
1
2
x
2
2
... x
n
2
.
Multiplicando por uma constante c, o comprimento fica: L
cx
|c| L
x
.
13
ngulo
cos
1
x
1
Lx
cos
2
y
1
Ly
sen
1
x
2
Lx
sen
2
y
2
Ly
cos cos(
2
1
) cos
2
cos
1
sen
2
sen
1
y
1
Ly
x
1
Lx
y
2
Ly
x
2
Lx
x
1
y
1
x
2
y
2
LxLy
O produto interno de x e y : x
y x
1
y
1
x
2
y
2
... x
n
y
n
L
x
comprimento de x x
x e cos
x
y
Lx Ly
y
x
x y
y
Ex: x
|1, 3, 2] e y
y
Ly
1
Ly
y
x
y
y
y
y O comprimento da projeo
|x
y|
Ly
L
x
x
y
LyLx
L
x
|cos|.
Ortogonalidade dois vetores no nulos so ortogonais se o cosseno do ngulo entre eles for zero
(xy 0)
Base ortonormal de vetores cada vetor da base possui um comprimento unitrio (x
i
x
i
1) e cada
par de vetor da base so ortogonais (x
i
x
j
0, i j)
2.3.1 Matrizes
* i) (A.B)
1
B
1
A
1
ii) (A B)
iii) (AB)
iv) (A
1
)
(A
)
1
* Uma matriz Q ortogonal se QQ
Q I ou Q
Q
1
.
14
Ex: Verifique se L
1
2
1
2
1
2
1
2
ortogonal.
* i) |A
| |A| ii) |A
1
|
1
|A|
|A|
1
iii) |A.B| |A| |B|
* Se |A| 0 A denominado de posto completo, A no singular e A
1
existe.
* Trao de A , tr(A) a
ii
(soma dos elementos da diagonal principal da matriz)
* i) tr (A B) tr(A) tr(B) ii) tr(cA) ctr(A) iii) tr(A
) tr(A)
* iv) tr (AB) tr(BA) v) tr(ABC) tr|(AB)C] tr(CAB)
* Uma matriz quadrada A tem autovalor , com correspondente autovetor x 0, se Ax x.
Obs: comum normalizar x tal que seu comprimento seja 1 x
x (E conveniente denotar os
autovetores normalizados por e).
Se A for uma matriz quadrada e simtrica, A tem k pares de autovalores e autovetores:
(
1
, e
1 ), (
2
, e
2 ), ..., (
k
, e
k ).
Os autovetores podem ser escolhidos satisfazendo 1 e
1
e
1
e
2
e
2
... e
k
e
k
e so mutuamente
perpendiculares.
Os escalares
1
,
2
, ...,
k
satisfazem a equao polinomial |A I| 0.
Ex: A
3 2
2 5
O estudo de variao e de inter-relaes em dados multivariados so freqentemente baseados em
distncia e na suposio de que os dados tm uma distribuio normal multivariada.
O quadrado das distncias e a densidade da normal multivariada podem ser expressos em termos de
produtos de matrizes denominados formas quadrticas.
Portanto, as formas quadrticas tm um papel bastante importante na anlise multivariada.
Resultados envolvendo formas quadrticas e matrizes simtricas so, em muitos casos, uma
conseqncia direta de uma expanso para matrizes simtricas conhecidas como
decomposio espectral.
A decomposio espectral de uma matriz A(kxk) simtrica dada por:
A
(kxk)
1
e
1
e
1
2
e
2
e
2
...
k
e
k
e
k
i
- autovalores e e
i
- autovetores normalizados associados.
15
Ex: A
10, 00 0, 70 15, 00
0, 70 0, 08 1, 10
15, 00 1, 10 35, 00
Os autovalores so:
1
42, 065,
2
2, 984 e
3
0, 031.
Voc pode verificar que os autovetores podem ser, respectivamente:
e
1
2
e
2
e
2
31
e
3
e
3
ou
10, 00 0, 70 15, 00
0, 70 0, 08 1, 10
15, 00 1, 10 35, 00
42, 065
0, 425
0, 031
0, 905
| 0, 425 0, 031 0, 905 ] 2, 984
0, 903
0, 057
0, 425
| 0, 903 0, 057 0, 425 ]
0, 031
0, 064
0, 998
0, 004
| 0, 064 0, 998 0, 004 ]
7, 56 0, 55 16, 15
0, 55 0, 04 1, 17
16, 15 1, 17 34, 46
2, 43 0, 15 1, 14
0, 15 0, 01 0, 07
1, 14 0, 07 0, 54
Ax 0 para x
|x
1
, x
2
, ..., x
k ], ento A denominada
definida no negativa (no negativa definida)
Se a igualdade valer somente para o vetor x
Ax 0 para x 0).
Por Q x
Ax
i1
n
a
ii
x
i
2
2
i1
n1
ji1
n
a
ij
x
i
x
j
ter apenas termos ao quadrado (x
i
2
) e produtos (x
i
x
j
)
chamado de forma quadrtica.
Usando decomposio espectral possvel mostrar que uma matriz simtrica A
(kxk)
definida
positiva o autovalor de A positivo. Se A for definida no negativa todos os autovalores so 0.
Ex: Mostre que a seguinte forma quadrtica definida positiva: 3x
1
2
2x
2
2
2 2 x
1
x
2
.
16
Vejam a frmula (2.14) sobre distncia!
(dist)
2
a
11
x
1
2
... a
pp
x
p
2
2(a
12
x
1
x
2
.... a
p1,p
x
p1
x
p
)
Dado que (dist)
2
0, para x 0 e fazendo a
ij
a
ji
(simetria), tem-se que:
0 (dist)
2
x
1
x
2
... x
p
a
11
a
12
a
1p
a
21
a
22
a
2p
. . .
a
p1
a
p2
a
pp
x
1
x
2
.
x
p
x
Ax
a distncia determinada de uma forma quadrtica x
(x
1
, x
2
, ..., x
p
) a origem dada por x
Ax,
em que A
(pxp)
uma matriz simtrica e positiva definida. Ento, o quadrado da distncia de x a um
ponto fixo arbitrrio
(
1
,
2
, ...,
p
) dado pela expresso (x )
A(x ).
Isso permite uma interpretao geomtrica baseada em autovalores e autovetores da matriz A.
Por ex: p 2. Qualquer ponto x
(x
1
, x
2
) distante c
2
da origem satisfaz:
x
Ax a
11
x
1
2
a
22
x
2
2
2a
12
x
1
x
2
c
2
.
Pela decomposio espectral A
1
e
1
e
1
2
e
2
e
2
Ax
1
(x
e
1
)
2
2
(x
e
2
)
2
c
2
1
y
1
2
2
y
2
2
uma elipse.
Tem-se que x c
1
1/2
e
1
satisfaz x
Ax
1
(c
1
1/2
e
1
e
1
)
2
c
2
e x c
1
1/2
e
2
d a distncia apropriada
na direo e
2
.
Ento, os pontos com distncia c caem sobre uma elipse cujos eixos so dados por autovetores de A
com comprimentos proporcionais as razes quadradas dos recprocos vetores.
1
1
2
Se p 2, os pontos x
|x
1
, x
2
, ..., x
p ] distantes c x
e
1
)
2
...
p
(x
p
e
p
)
2
, cujos eixos so dados por autovetores de A. A metade
do comprimento na direo e
i
igual a c/
i
, i 1, 2, ...,
i
autovalor de A.
Raiz Quadrada de uma Matriz
Pela decomposio espectral:
A
(kxk)
i1
k
i
e
i
e
i
P'P
, sendo:
17
P |e
1
, e
2
, ..., e
k
] e '
1
0 0
0
2
0
. . ` .
0 0
k
, com
i
0
PP
P I P ortogonal
A
1
(P'P
)
1
P'
1
P
i1
k
(1/
i
)e
i
e
i
AA
1
(P'P
)(P'P
)
1
P'P
P'
1
P
I
Seja '
1/2
: a matriz diagonal com o i-simo elemento da diagonal
i
.
A matriz
i1
k
i
e
i
e
i
P'
1/2
P
P'
1/2
P
, com '
1/2
uma matriz diagonal com o 1/
i
como o
i-simo elemento da diagonal.
4. A
1/2
A
1/2
A
1/2
A
1/2
I e A
1/2
A
1/2
A
1
em que A
1/2
A
1/2
1
.
2.4. Vetores e Matrizes Aleatrios
Um vetor aleatrio um vetor cujos elementos so variveis aleatrias. Similarmente, uma matriz
aleatria uma matriz cujos elementos so variveis aleatrias.
E(X)
E(X
11
) E(X
12
) E(X
1n
)
E(X
21
) E(X
22
) E(X
2n
)
. . .
E(X
p1
) E(X
p2
) E(X
pn
)
, em que:
E(X
ij
)
x
ij
f
ij
(x
ij
)dx
ij,
X
ij
v. a. contnua com funo densidade de probab. f
ij
(x
ij
)
x
ij
x
ij
p
ij
(x
ij
) X
ij
v. a. discreta com funo densidade de probab p
ij
(x
ij
)
Ex: a) p 2 e n 1 X
|X
1
, X
2
]. X
1
e X
2
tem a seguinte funo de probabilidade.
x
1
1 0 1
p
1
(x
1
) 0, 3 0, 3 0, 4
x
2
0 1
p
2
(x
2
) 0, 8 0, 2
b) f(x
1,
x
2
)
x
1
2
x
1
x
2
3
, 0 x
1
1, 0 x
2
2
0 para qquer outros valores
Sejam X e Y matrizes aleatrias de mesma dimenso e sejam A e B, matrizes de constantes:
E(X Y) E(X) E(Y) e E(AXB) AE(X)B
18
Vetor Mdia e Matriz de Covarincia
X X
i
)
(px1)
matriz aleatria (vetor)
As mdias marginais
i
e varincias
i
2
so definidas respectivamente, como:
i
E(X
i
) e
i
2
E(X
i
i
)
2
, i 1, 2, ..., p.
x
i
f
i
(x
i
)dx
i
contnua
x
i
x
i
p
i
(x
i
) discreta
i
2
ii
(x
i
i
)
2
f
i
(x
i
)dx
i
contnua
x
i
(x
i
i
)
2
p
i
(x
i
) discreta
medida de associao linear entre quaisquer pares de v. as:
ik
E(X
i
i
)(X
k
k
)
(x
i
i
)(x
k
k
) f
ik
(x
i
, x
k
)dx
i
dx
k
contnua
x
i
x
k
(x
i
i
)(x
k
k
) p
ik
(x
i
, x
k
) discreta
Generalizando, o vetor aleatrio X
|X
1
, X
2,
..., X
p
] tem uma funo densidade de probabilidade
conjunta f(x
1
, x
2
, ..., x
p
) f(x). Freqentemente, f(x) ser uma funo densidade normal multivariada.
Se P|X
i
x
i
e X
k
x
k
] P|X
i
x
i ]P|X
k
x
k
], todos os pares (x
i
, x
k
) X
i
e X
k
so
estatisticamente independentes, ou f
ik
(x
i
, x
k
) f
i
(x
i
)f
k
(x
k
).
X
1
, X
2,
..., X
p
so estatisticamente mutuamente independentes se f
1,..,p
(x
1
, .., x
p
) f
1
(x
1
) f
2
(x
2
) ...
f
p
(x
p
).
Se X
i
e X
k
so independentes, ento Cov(X
i
, X
k
) 0.
E(X)
E(X
1
)
E(X
2
)
.
E(X
p
)
2
.
p
E(X )(X )
E(X
1
1
)
2
E(X
1
1
)(X
2
2
) E(X
1
1
)(X
p
p
)
E(X
2
2
)(X
1
1
) E(X
2
2
)
2
E(X
2
2
)(X
p
p
)
. . ` .
E(X
p
p
)(X
1
1
) E(X
p
p
)(X
2
2
) E(X
p
p
)
2
Cov(X)
11
12
1p
21
22
2p
. . ` .
p1
p2
pp
Ex: Encontre a matriz de covarincia para duas v.as. X
1
e X
2
.