Beruflich Dokumente
Kultur Dokumente
Cuadrados
R =
2
Qu tan Buena es la
Regresin (Parte 2) ?
Qu tan bien predecir esta ecuacin de regresin los
NUEVOS puntos de datos?
Sample
y = a'x+
+ b'
Muestra 1:
y =1:ax
b+ + e
Sample 2: y
+
Muestra
2:= a''x
y +=b''ax
+ b + e
Lmites de Confianza
Datos sin
procesar
Slo
Media-centrada
Slo
Varianza-centrada
Normalizada
Anlisis Multivariable
Ahora estamos listos para empezar a hablar acerca del anlisis
multivariable (AMV). Existen dos tipos principales de AMV:
1.
2.
Slo Xs
Xx
Proyecciones a las Estructuras Latentes (PEL)
Xs y Ys
X Y
Puede ser
ser la
la
Puede
misma base
base de
de
misma
datos, i.e.,
i.e.,
datos,
puedes hacer
hacer el
el
puedes
ACPen
en sobre
sobre la
la
ACP
totalidad de
de la
la
totalidad
muestra (Xs
(Xs yy
muestra
Ys juntos)
juntos)
Ys
Recordatorio
Navaja de Ockham
+1
-1
Recordatorio
Atributos Latentes
NAMP Mdulo 17: Introduccin al Anlisis Multivariable
donde
Como en la regresin
linear slo se usan
matrices
componentes
P
son las cargas de las variables originales en los nuevos
componentes
E
matriz residual, conteniendo el ruido
X3
proyeccin
. ..
.
.
.
.
er
.
.
. X2
do
X1
3 variables
originales
NAMP Mdulo 17: Introduccin al Anlisis Multivariable
Nmero de Componentes
Los componentes son simplemente los nuevos ejes que son creados
para ajustar la mayora de la varianza con el menor nmero de
dimensiones. La metodologa del ACP asegura que los componentes
sean extrados en orden decreciente de la varianza. En otras palabras, el
primer componente siempre ajusta la mayora de la varianza, el segundo
ajusta la mayora restante de la varianza, y as sucesivamente:
2 3
6 ...
Eigenvalores de la matriz A :
7
6
Eigenvalores
5
4
3
2
1
Componente #
Interpretacin de los
Componentes del ACP
Como cualquier tipo de AMV, la parte ms complicada del ACP es la
interpretacin de los componentes. El software es 100% matemtico y
da las mismas soluciones an si los datos estn relacionados al
consumo de diesel o a los resultados de las carreras de caballos. El
ingeniero es el que debe de dar sentido a las soluciones del software. En
general, se debe de:
Basar en la fuerza y direccin de las cargas
Identificar los conjuntos de variables que pudieran estar fsicamente
relacionadas o que provienen de un origen comn
e.g., En la produccin de papel, las propiedades de fortaleza
tales como rasgado, ruptura, longitud de rompimiento en el papel
estn todas relacionadas a la longitud y enlaces de las fibras
iniciales.
Xx
XY
X = TP + E
Y = UQ + F
uh = bhth
Los factores de peso w son usados para asegurarse que las dimensiones
son ortogonales
Interpretacin de los
Componentes del PEL
La interpretacin de los resultados del PEL presenta todas las dificultades
del ACP, adems de uno ms: dar sentido a los componentes individuales
del espacio X e Y.
En otras palabras, para que los resultados tengan sentido, el primer
componente de X debe estar relacionado de alguna manera con el primer
componente de Y.
Observe que a lo largo de este curso, la palabras causa y efecto estn
ausentes. El AMV determina SLO las correlaciones. La nica excepcin
es cuando se ha empleado un adecuado diseo del experimento.
Este es un ejemplo de una falsa correlacin: las semillas en un alimentador
de aves permanece lleno todo el invierno, pero desaparece de repente en
primavera. Usted concluye que el clima clido hicieron desintegrase a las
semillas
NAMP Mdulo 17: Introduccin al Anlisis Multivariable
Resultados
Grficas de Resultados
Grficas de Entradas
Ya
estudiadas
Diagnsticos
Grficas de Residuos
Observado vs. Predicho
(muchas ms)
111
11
22
22
22
22
22
22
22
22
22
22
22
22
22
22
22
22
22
22
22
22
22
22
22
22
22
22
22
22
22
22
22
22
22
22
22
22
22
22
22
22
22
22
22
22
22
22
22
22
22
22
22
22
22
22
22
22
22
22
22
22
22
22
22
2
99
99
90
00
00
00
00
00
000
000
00
00
00
00
00
00
00
00
00
00
00
00
00
00
000
00
00
00
000
00
00
00
00
00
00
00
00
00
000
00
00
000
00
000
00
00
00
00
000
00
00
00
00
00
00
00
00
00
00
000
00
0
99
99
90
00
00
00
00
00
000
000
00
00
00
00
00
00
00
00
00
00
00
00
00
00
000
00
00
00
000
00
00
00
00
00
00
00
00
00
000
00
00
000
00
000
00
00
00
00
000
00
00
00
00
00
00
00
00
00
00
00
00
0
99
99
99
00
00
000
00
00
00
00
00
00
00
00
00
000
000
00
00
00
00
00
000
00
00
00
11
11
111
11
11
11
11
11
11
11
11
11
111
11
111
11
11
11
11
11
11
11
11
212
22
222
22
22
22
22
22
222
22
22
22
22
-- 11
-- 11
-- 1
-- 00
-- 00
--- 000
-- 0
-- 00
-- 00
-- 0
-- 00
-- 0
-- 00
-- 0
-- 00
--- 00
--- 000
-- 00
--- 00
-- 01
-- 11
--- 111
-- 1
-- 11
-- 11
-0
--- 000
--- 000
-- 0
-- 00
-- 0
-- 00
-- 0
-- 00
-- 00
-- 0
-- 00
--- 000
-- 00
--- 000
-- 00
-- 01
--- 111
-- 1
-- 11
-- 11
-- 1
-- 010
-- 00
--- 000
-- 0
-- 00
-- 0
-- 00
-- 00
--- 000
-- 0
-- 00
-- 00
-- 00
-- 203
-- 011
-- 232
-- 010
-- 2132
0
--- 10122
-- 010
--- 322010
-- 12
-- 2003
-- 11
-- 2032
-- 011
-- 2203
-- 011
2
--- 0321
-- 2132
-- 0110
--- 2203
-- 12
2
--- 100321
-- 203
-- 01
-- 232
-- 010
-- 212
03
--- 1021
-- 010
-- 22103
--- 1021
-- 203
-- 101
-- 2032
-- 0211
-- 0320
-- 1212
-- 0310
-- 2213
--- 0101
-- 2203
0
--- 211032
-- 01
-- 122
-- 031
-- 03212
-- 1102
-- 0320
-- 12
-- 00
-- 12
-- 203
-- 011
-- 22003
--- 21032
-- 0121
-- 0203
-- 112
- 032
12
22
22
11
11
22
22
33
33
34
44
4455
55
565
66
676
77
787
88
899
99
90
00
010
11
11
2212
22
11
11
22
22
33
33
34
44
45
55
55
66
66
77
77
878
88
999
90
0100
11
11
22
221
11
122
22
33
33
34
44
454
55
565
66
677
77
87
98743987654321065
765432107654321098
0984321096587
43212187654309
98765102876543
87654321094321096587
197654321098
54323210987654
7610985432
1098767654329810
329876541032
76547632109854
5432109832109876
32109876545410987632
541098765432
98767654321098
10765432098
543213210985476
763210765498
1098876543209
218765432109
765435432987610
10985432109876
32210987654
430987654321
098765654321798
107654321098
54323210987654
76210984365
2109878765430921
4398765210
65434321098765
874321098765
6543212109874365
87432109765
219887654309021
098765438765432109
6543218709654321
4321098710987265
21098743098765432165
8765430921876543
8765432109432109657
98432108765
21092109654387
876543765432109
987654321098
65432108743210965
430987098765214321
65109875432
98767654321098
10654098732
6521210987436543
874321098765
321099876541032
541098765432
876543210976
985432109876
5432103218765476
985432109876
321018765409
987654329876543210
765432101098765432
985410987632
321009876154
54321098765432
98767654321098
107654321098
765432321098546
87109
D M o d X [1 ]( N o r m )
Residuales
D-Crit(0.05)
Original observations
Obs ID (TIME)
M 2 - D - C r i t[ 4 ]
=
1 . 15 7
Modelo a Distancia
plano
proyeccin
eik
er
do
i=observacink
=variable
YVar(53AI034.AI)
240
220
200
MODELOIDEAL
IDEAL
MODELO
180
160
150
160
170
180
190
200
210
220
230
240
YPred[14](53AI034.AI)
RMSEE = 24.6664
Realidad fsica
Variables no
medibles
Felicidades!
Tier 1 Quiz
Pregunta 1:
Observar una o dos variables a la vez no es recomendable porque
generalmente las variables estn correlacionadas. Qu
significa esto exactamente?
a) Estas variables tienden a incrementar y decrecer al unisono.
b) Estas variables probablemente estn midiendo lo mismo,
indirectamente sin embargo.
c) Estas variable revelan una variable comn y profunda que
probablemente no est medida.
d) Estas variables no son estadsticamente independientes.
e) Todas las anteriores.
Tier 1 Quiz
Pregunta 2:
Cul es la diferencia entre informacin y conocimiento?
a) La informacin est en la computadora o en un pedazo de
papel, mientras que el conocimiento est dentro de la cabeza de
las personas.
b) Slo los cientficos poseen el verdadero conocimiento.
c) La informacin es matemtica, mientras que el conocimiento no
lo es.
d) La informacin incluye relaciones entre variables, pero no
tiene respaldo de la base de las causas cientficas.
e) El conocimiento puede adquirirse slo a travs de la
experiencia.
Tier 1 Quiz
Pregunta 3:
Por qu el AMV nunca revela la causa-y-efecto, al menos que se
emplee un experimento diseado?
a) Causa-y-efecto puede ser determinado slo en el laboratorio.
b) Los experimentos diseados eliminan el error.
c) El AMV sin experimentos diseados slo es inductivo,
mientras que la relacin causa-y-efecto requiere de una
deduccin.
d) Slo los efectos son medibles.
e) Los cientficos disean los experimentos para trabajar
perfectamente la primer vez.
Tier 1 Quiz
Pregunta 4:
Cul es la desventaja ms grande de usar el modelo de la caja
negra en lugar de usar uno basado en los primeros principios?
a) No hay unidades de operacin.
b) El modelo es slo tan bueno como los datos empleados
para crearlo.
c) Datos de reacciones qumicas y datos termodinmicos no son
usados.
d) Un modelo de caja negra puede no tomar en cuenta el diagrama
de flujo completo.
e) Los modelos de AMV son slo lineares.
Tier 1 Quiz
Pregunta 5:
Qu nos dice un intervalo de confianza?
Tier 1 Quiz
Pregunta 6:
Cuando los datos fueron recopilados, algunos de los sensores de la
planta no funcionaba correctamente y daba lecturas imprecisas.
Cules son las implicaciones a tomar en el anlisis estadstico?
a) Se ajustan en el modelo ms trminos cuadrticos y productos
cruzados a los datos.
b) Valores de la media ms elevados de los esperados
normalmente.
c) Valores de varianza ms elevados para las variables
asociadas con el mal funcionamiento del sensor.
d) Diferente seleccin de variables para incluir en el anlisis.
e) Trmino residual mayor en el modelo.
Tier 1 Quiz
Pregunta 7:
Por qu el reducir el nmero de dimensiones (ms variables para
menos componentes) tiene sentido desde un punto de vista
cientfico?
a) Los nuevos componentes pueden corresponder a la base
fsica del fenmeno que no puede ser medido directamente.
b) Menos dimensiones son ms sencillas de observar en una
grfica o computadora.
c) La navaja de Ockham limita a los cientficos a menos de cinco
dimensiones.
d) El mundo real est limitado a slo tres dimensiones.
e) Todas las anteriores.
Tier 1 Quiz
Pregunta 8:
Si dos puntos en una grfica de resultados estn demasiado cerca,
significa esto que estas dos observaciones son casi idnticas?
a)
b)
c)
d)
e)
Tier 1 Quiz
Pregunta 9:
Observando el ejemplo de la comida, qu pases aparentan estar
correlacionados con un gran consumo de aceite de oliva?
a)
b)
c)
d)
e)
Tier 1 Quiz
Pregunta 10:
Por qu el error queda relegado cuando se tiene un mayor orden
de componentes en el ACP?
a)
b)
c)
d)
e)