Sie sind auf Seite 1von 29

Tema 4: Componentes Principales

En el estudio de las limas teniamos 7 variables pero estas cuatro parecen Tener suficiente informacin. Podemos Reducirlo aun ms?

Objetivo: Describir p variables con r variables(posiblemente


Diferentes) con r<p con la menor perdida de informacin posible.

Guin
1. Definicin y Clculo de las componentes 2.Nmero de componentes? 3. Componentes normadas 4. Propiedades de las componentes (Variabilidad explicada) 5. Interpretacin de las componentes

Tcnica: Considerar combinaciones lineales de las p variables


Originales y elegir

Las mas informativas (MAYOR VARIANZA) Que no compartan Informacin (INCORRELADAS)

Componentes principales: Estas nuevas variables (Combinaciones lineales de las originales) se denominan Las componentes principales (C.P) se ordenan de mayor a menor varianza

VENTAJAS
DIMENSIN REDUCIDA: Cuantas menos variables, el analisis exploratorio, la clasificacin, encontrar los conglomerados es mas sencillo INCORRELACIN: Simplifica el anlisis

INTERPRETACIN: A menudo las C.P nos informan de ndices De interes que nos ayudan a entender mejor el fenmeno considerado
INCONVENIENTE: A Veces no es posible darle ningn sentido a las C.P!

CALCULO DE LAS COMPONENTES PRINCIPALES


1. IDEA La primera componente (Z1) es la combinacion lineal con mayor varianza La segunda componente (Z2) es la combinacion lineal con mayor varianza incorrelada con Z1 La Tercera componente Z3 es la combinacion lineal con mayor varianza incorrelada con Z1 y Z2 NOTA IMPORTANTE: Hay p C.P pero en la prctica con pocas explicamos un alto porcentaje de variabilidad

2. Interpretacin geomtrica
Geometricamente ls C.P puden interpretarse como los ejes del Elipsoide definidos por los datos

Mxima dispersin

NOTA: Incorreladas= Perpendiculares

Caso extremo

2. Interpretacin Analtica
Analticamente las C.P se representan por los vectores propios de La matriz de varianzas covarianzas

Sai i ai
Vector Propio (Autovector) (Eigenvector)

Valor Propio (Autovalor) (Eigenvalue)

1 2 i p
Z i ai , x

a i 1 pero SPSS nos da a i i

Ejemplo de los Rectangulos

Diagrama de dispersin y componentes (geomtrico)

Componentes analticamente

Componentes SPSS

PROPIEDADADES DE LAS COMPONENTES PRINCIPALES

1. s i
2 zi

2.

s
i 1

2 zi

i
i 1

3 La proporcin de varianza explicada por la C.P z h es


s
p i 1 2 zh 2 zi

i 1

4 La covarianza entre z h y la variable original x i

szh , xi h (ah )i h (bh )i


4 La correlaci n entre z h y la variable original x i

rzh , xi

h (ah )i
si

COMPONENTES PRINCIPALES NORMADAS (CPN)


Las componentes principales normadas CPN se obtienen trabajando con las variables estandarizadas. Es decir trabajamos con la matriz de correlaciones R y hallamos Sus valores propios etc

ACPN: Unidades distintas o variables que tienen menor magnitud de manera intrinseca Ejemplo Longitud de huesos del cuerpo. El fmur y el martillo varan de manera distinta pero Son igualmente importantes ACP: Si estudiamos ndices econmicos y uno fluctua mucho y otro es casi constante, Al estandarizar obviamos este hecho. La componente principal lo reflejara Duda: Realicemos ambos analisis y seleccionemos el que nos conduzca a conclusiones mas informativas

PROPIEDADADES DE LAS COMPONENTES PRINCIPALES NORMADAS

1. s

2 ziR

R i

2.

s
i 1
R h R i

2 ziR

i 1

R i

3 La proporcin de varianza explicada por la C.P z h es


s
p 2 R zh 2 ziR

s
i 1

p i 1

R h

4 La covarianza entre z h y la variable original x i

sz R , y ( a )
h i

R h

R h i

4 La correlaci n entre z h y la variable original x i

rz R , y ( a ) (b )
h i

R h

R h i

R h i

CUANTAS COMPONENTES PRINCIPALES?

Cocodrilos

Grfico de Codo

INTERPRETACIN DE LAS C.P

Ejemplo Escleorosis

Das könnte Ihnen auch gefallen