Sie sind auf Seite 1von 28

GEOMETRA MUESTRAL

UNI-EPIES-FIECS ANLISIS MULTIVARIADO I

Observacin Multivariada

Una observacin multivariada es una coleccin de mediciones sobre p


variables medida sobre el mismo objeto o ensayo:

x x L x
11 12 1p
x x L x 1ra observacin
21 22 2p
Xnxp =
M M O M

x x L x
n1 n2 np
n-sima
observacin
y1 y2 yp

Agosto, 2011 Lic. Luis Huamanchumo de la Cuba


UNI-EPIES-FIECS ANLISIS MULTIVARIADO I

NOTACIN

Xnxp : Matriz de datos para una muestra de tamao n para p variables


xij : Un dato para la variable j del individuo o unidad muestral i.

xi : i-sima fila.
x(j) : j-sima columna, correspondiente a la j-sima variable.

Agosto, 2011 Lic. Luis Huamanchumo de la Cuba


UNI-EPIES-FIECS ANLISIS MULTIVARIADO I

NOTACIN (continuacin)

X1

X2

Xnxp = .
. = X(1) , X(2) , , X(p)

Xn

Xi1 X1j

Xi2 X2j

. .
donde, xi = . (i=1, ,n) x(j) = . (j=1, ,p)
. .

Xip Xpj

Agosto, 2011 Lic. Luis Huamanchumo de la Cuba


UNI-EPIES-FIECS ANLISIS MULTIVARIADO I

Caso n=3 y p=2

Ploteo de puntos (observaciones) para una matriz X

x2
o2

o3
x
o1
x1
0

Agosto, 2011 Lic. Luis Huamanchumo de la Cuba


UNI-EPIES-FIECS ANLISIS MULTIVARIADO I

Caso n=3 y p=2


Grfico de variables para la matriz X
3

y2

2
y1

Agosto, 2011 Lic. Luis Huamanchumo de la Cuba


UNI-EPIES-FIECS ANLISIS MULTIVARIADO I

VECTORES ALEATORIOS

Agosto, 2011 Lic. Luis Huamanchumo de la Cuba


UNI-EPIES-FIECS ANLISIS MULTIVARIADO I

Longitud o Norma de un Vector

X2
Lx= X12+X22
x2 X=(x1,x2)
Lx= XlX
Lx

X1 Caso General:
0 x1 X=(x1, x2, ..., xp)

Agosto, 2011 Lic. Luis Huamanchumo de la Cuba


UNI-EPIES-FIECS ANLISIS MULTIVARIADO I

ngulo entre Dos Vectores

y
x1y1 + x2y2+ ... + xpyp
Cos =
LxLy

XlY
x Cos =
XlX YlY

Agosto, 2011 Lic. Luis Huamanchumo de la Cuba


UNI-EPIES-FIECS ANLISIS MULTIVARIADO I

Componente y Proyeccin de X sobre Y

La Proyeccin Ortogonal de X sobre Y (Pryx) es el


vector cuya direccin est dada por la direccin y
sentido del vector Y, y la longitud por la Componente
de X sobre Y (Cpyx)

Pryx = xly . y = xly . y = Cpyx . y


L2y Ly Ly Ly

Agosto, 2011 Lic. Luis Huamanchumo de la Cuba


UNI-EPIES-FIECS ANLISIS MULTIVARIADO I

CASOS
x x

Agudo

y y
Cpyx Pryx
x x
Pry x
Obtuso
Cpy x

y y
Cpyx Pryx

Componente Proyeccin
Agosto, 2011 Lic. Luis Huamanchumo de la Cuba
UNI-EPIES-FIECS ANLISIS MULTIVARIADO I

Media Muestral

desviacin
Sea
yi
yi= (xi1, xi2, ..., x1n) y 1 = (1, 1, ...,1)nx1

yi xi1 = ei Pruyi = yil u . u donde u=1 .1


u 2 n

Pruyi = yil u . u = xi . 1
u Pruyi = xi . 1

componente
de medias

Agosto, 2011 Lic. Luis Huamanchumo de la Cuba


UNI-EPIES-FIECS ANLISIS MULTIVARIADO I

Caso para p=3 y n=3

y1
3 y1 - x11

1 x11

x31 1
x21 e2
y1 e1
e3
x11 y2
2
y3

Agosto, 2011 Lic. Luis Huamanchumo de la Cuba


UNI-EPIES-FIECS ANLISIS MULTIVARIADO I

Caso para p=3 y n=3


Graficando las Desviaciones
3

L2ei = eilei = (xij xi)2


j
(longitud del vector (suma de cuadrados de
de desviaciones) 2 = las desviaciones)
e1
2 Longitud ms grande del
vector de desviaciones
e2 representa mayor
variabilidad que vectores
e3
1 ms pequeos
Agosto, 2011 Lic. Luis Huamanchumo de la Cuba
UNI-EPIES-FIECS ANLISIS MULTIVARIADO I

Coeficiente de Correlacin
El coseno del ngulo formado por dos vectores de
desviaciones es el coeficiente de correlacin

eilek = Lei Lek cos(ik)

cos(ik) = eilek cos(ik) = Sik


Lei Lek Sii Skk
ek
ek ek

ei ei ei

cos(ik) = 0 0 < cos(ik) < 1 cos(ik) < 0

Agosto, 2011 Lic. Luis Huamanchumo de la Cuba


UNI-EPIES-FIECS ANLISIS MULTIVARIADO I

Varianza Generalizada
e1

Le1
h h = Pre2 e1

Le2 e2

h = Le1sen()

Area = Le1Le2 1 cos2()

Agosto, 2011 Lic. Luis Huamanchumo de la Cuba


UNI-EPIES-FIECS ANLISIS MULTIVARIADO I

Le1 = (x1j - x1)2


j=1
= (n-1)s11

Le2 = (x2j - x2)2


j=1
= (n-1)s22

cos() = r12
Luego,

Area = (n-1) s11 s22 1 r212

|S| = (Area)2 (n-1)2

Agosto, 2011 Lic. Luis Huamanchumo de la Cuba


UNI-EPIES-FIECS ANLISIS MULTIVARIADO I

Generalizando para un espacio n-dimensional y p vectores de


desviaciones,

|S| = (n-1)-p (Volumen)2

Agosto, 2011 Lic. Luis Huamanchumo de la Cuba


UNI-EPIES-FIECS ANLISIS MULTIVARIADO I

Caso: p=3

e3
e3
e1
e2 e2
e1

0 2
0

Varianza Generalizada Varianza Generalizada


Muestral Grande 1 Muestral Pequea
Agosto, 2011 Lic. Luis Huamanchumo de la Cuba
UNI-EPIES-FIECS ANLISIS MULTIVARIADO I

Caso en que el volumen tri-dimensional es cero |S|=0

e1

e2 e3

Agosto, 2011 Lic. Luis Huamanchumo de la Cuba


UNI-Escuela Profesional de Ingeniera Estadstica ANLISIS MULTIVARIADO I

Interpretacin de la varianza generalizada

5 4 3 0 5 -4
S= S= S=
4 5 0 3 -4 5

r = 0.8 r=0 r = - 0.8

x = 2, 1 x = 2, 1 x = 2, 1

S = 9 S = 9 S = 9

Agosto, 2011 Lic. Luis Huamanchumo de la Cuba


UNI-Escuela Profesional de Ingeniera Estadstica ANLISIS MULTIVARIADO I

Diferentes estructuras de correlacin no son detectadas por S

1 = 9 e1 = 1 / 2 ,1/ 2 1 = 3 e1 = 1 , 0 1 = 9 e1 = 1 / 2 ,-1/ 2

2 = 1 e2 = 1 / 2 ,-1/ 2 2 = 3 e2 = 0 , 1 2 = 1 e2 = 1 / 2 ,1/ 2

x= 2,1 x= 2,1 x= 2,1

Agosto, 2011 Lic. Luis Huamanchumo de la Cuba


UNI-Escuela Profesional de Ingeniera Estadstica ANLISIS MULTIVARIADO I

Ejemplo 3.3 (*) Descomposicin de un vector en su media y desviaciones centrales

4 1
X= -1 3
3 5

En este caso,

Consecuentemente,

(*) Johnson y Wichern (2002) Applied Multivariate Statistical Analysis

Agosto, 2011 Lic. Luis Huamanchumo de la Cuba


UNI-Escuela Profesional de Ingeniera Estadstica ANLISIS MULTIVARIADO I

y,

Se comprueba que x11 y d1 son perpendiculares

El mismo resultado se obtiene para x21 y d2 .

La descomposicin de y1 e y2 es:

Agosto, 2011 Lic. Luis Huamanchumo de la Cuba


UNI-Escuela Profesional de Ingeniera Estadstica ANLISIS MULTIVARIADO I

Para cualquiera dos vectores de desviaciones d1 y d2 :

Si ik es el ngulo formado por los vectores di y dk :

O, equivalentemente con las observaciones muestrales:

El coseno del ngulo es el coeficiente de correlacin muestral entre di y dk:

Agosto, 2011 Lic. Luis Huamanchumo de la Cuba


UNI-Escuela Profesional de Ingeniera Estadstica ANLISIS MULTIVARIADO I

Calculando la matriz varianza covarianza Sn y de correlaciones R

Se sabe que:

Veamos los componentes de la matriz varianza-covarianza:

s11 = 14 / 3

s22 = 8 / 3

s12 = -2 / 3

Agosto, 2011 Lic. Luis Huamanchumo de la Cuba


UNI-Escuela Profesional de Ingeniera Estadstica ANLISIS MULTIVARIADO I

Consecuentemente,

12 = 100.65

La matriz varianza-covarianza y de correlacin muestral seran:

Agosto, 2011 Lic. Luis Huamanchumo de la Cuba


UNI-EPIES-FIECS ANLISIS MULTIVARIADO I

INTERPRETACIN GEOMTRICA DE LA MUESTRA

1. La proyeccin de la columna x(j) de la matriz X sobre el vector equiangular 1 es el


vector xj 1. ste tiene norma n xi . As, la j-sima media muestral, xj, se
relaciona con la longitud de la proyeccin de x(j) sobre 1 o la componente de x(j)
sobre 1.

2. La informacin contenida en Sn se obtuvo de los vectores de desviaciones dj = yj -


x(j) 1 = x1j - x(j) , x2j - x(j) , , xnj - x(j) . El cuadrado de la longitud dj es nsjj y el
producto interno entre di y dj es nsij.

3. La correlacin muestral rik es el coseno del ngulo formado por di y dk.

Agosto, 2011 Lic. Luis Huamanchumo de la Cuba

Das könnte Ihnen auch gefallen