Sie sind auf Seite 1von 41

El Principio de los Mnimos

Cuadrados

La regresin trata de generar la


ecuacin de mejor ajuste --pero qu es lo mejor?

Criterio: minimizar la suma de


las desviaciones cuadradas
de los puntos de datos de la
regresin lineal.

NAMP Mdulo 17: Introduccin al Anlisis Multivariable

Tier 1, Part 1, Rev.: 0

Qu tan Buena es la Regresin


(Parte 1) ?
Qu tan bien representa nuestros datos originales la
ecuacin de regresin?
La proporcin (porcentaje) de la varianza en y que es explicada
por la ecuacin de regresin es representada por el smbolo R2.

R =
2

(Suma de los cuadrados de la media de Y)


(Suma de los cuadrados de la regresin lineal)

NAMP Mdulo 17: Introduccin al Anlisis Multivariable

Tier 1, Part 1, Rev.: 0

Variabilidad Ajustada - ilustracin

R2 Alto- buen ajuste

R2 Bajo- poco ajuste

NAMP Mdulo 17: Introduccin al Anlisis Multivariable

Tier 1, Part 1, Rev.: 0

Qu tan Buena es la
Regresin (Parte 2) ?
Qu tan bien predecir esta ecuacin de regresin los
NUEVOS puntos de datos?

Recuerde que emple una muestra de la poblacin de los puntos


de datos potenciales para determinar la ecuacin de regresin.
e.g. un valor cada 15 minutos, 1-2 semanas de operacin de
datos

Una muestra diferente dar una ecuacin diferente con diferentes


coeficientes de bi

Como se muestra en la siguiente diapositiva, la muestra puede


afectar enormemente la ecuacin de regresin

NAMP Mdulo 17: Introduccin al Anlisis Multivariable

Tier 1, Part 1, Rev.: 0

Muestreando variablidad de los


Coeficientes de Regresin- ilustracin

Sample
y = a'x+
+ b'
Muestra 1:
y =1:ax
b+ + e

Sample 2: y
+
Muestra
2:= a''x
y +=b''ax
+ b + e

NAMP Mdulo 17: Introduccin al Anlisis Multivariable

Tier 1, Part 1, Rev.: 0

Lmites de Confianza

Los lmites de confianza (x%) son las fronteras superior e inferior


que tienen una probabilidad x% de encerrar el valor de poblacin
verdadero de una variable dada
Generalmente mostradas como barras arriba y debajo de un punto
de dato predicho:

NAMP Mdulo 17: Introduccin al Anlisis Multivariable

Tier 1, Part 1, Rev.: 0

Normalizacin de los Datos


Los datos empleados para la regresin son usualmente
normalizados para tener una media de cero y varianza de uno.
De otra forma los clculos estaran dominados (parcializados) por
variables, presentndose:
valores numricos muy grandes
varianza grande
Esto significa que el software del AMV nunca ve los datos originales,
slo la versin normalizada

NAMP Mdulo 17: Introduccin al Anlisis Multivariable

Tier 1, Part 1, Rev.: 0

Normalizacin de los Datos ilustracin


Cada variable es representada por una barra de varianza y su media
(centro).

Datos sin
procesar

Slo
Media-centrada

Slo
Varianza-centrada

NAMP Mdulo 17: Introduccin al Anlisis Multivariable

Normalizada

Tier 1, Part 1, Rev.: 0

Requisitos para la Regresin


Requerimientos de los Datos
Datos normalizados
Errores normalmente distribuidos con media cero
Variables independientes no correlacionadas

Implicaciones si los Requerimientos No se Logran


Mayores lmites de confianza alrededor de los coeficientes de
regresin (bi)
Prediccin ms pobre de nuevos datos

NAMP Mdulo 17: Introduccin al Anlisis Multivariable

Tier 1, Part 1, Rev.: 0

Anlisis Multivariable
Ahora estamos listos para empezar a hablar acerca del anlisis
multivariable (AMV). Existen dos tipos principales de AMV:
1.

2.

Anlisis del Componente Principal (ACP)

Slo Xs
Xx
Proyecciones a las Estructuras Latentes (PEL)

a.k.a. Mnimos Cuadrados Parciales

Xs y Ys
X Y

Puede ser
ser la
la
Puede
misma base
base de
de
misma
datos, i.e.,
i.e.,
datos,
puedes hacer
hacer el
el
puedes
ACPen
en sobre
sobre la
la
ACP
totalidad de
de la
la
totalidad
muestra (Xs
(Xs yy
muestra
Ys juntos)
juntos)
Ys

Empecemos con el ACP. Note que el ejemplo de la comida


europea al principio fue ACP, debido a todos los tipos de comida
fueron tratados como equivalentes.

NAMP Mdulo 17: Introduccin al Anlisis Multivariable

Tier 1, Part 1, Rev.: 0

Propsito del ACP


El propsito del ACP es el de proyectar un espacio de datos con un
gran nmero de dimensiones correlacionadas (variables) en un
segundo espacio de datos con un nmero mucho menor de
dimensiones independientes (ortogonal).
Esto es justificable cientficamente gracias a la Navaja de Ockham.
Muy en el fondo, la Naturaleza ES simple. Seguido, la dimensin
espacial ms baja corresponde ms de cerca a lo que est
sucediendo en un nivel fsico.
El reto es interpretar los resultados del de una forma cientficamente
vlida.

Recordatorio
Navaja de Ockham

NAMP Mdulo 17: Introduccin al Anlisis Multivariable

Tier 1, Part 1, Rev.: 0

Ventajas del ACP


Entre las ventajas del ACP estn:

Las variables no correlacionadas se prestan para el anlisis


estadstico tradicional
Espacios de bajas dimensiones que son ms fciles para trabajar
Las nuevas dimensiones muy a menudo, representan ms
claramente la base de la estructura de los grupos de variables
(nuestro amigo Ockham)

+1

-1

Recordatorio
Atributos Latentes
NAMP Mdulo 17: Introduccin al Anlisis Multivariable

Tier 1, Part 1, Rev.: 0

Cmo funciona el ACP (Concepto)


El ACP es un proceso paso a paso. As es como funciona
conceptualmente:

Encontrar un componente (vector de dimensin) que


ajuste la mayor cantidad de variaciones de x como sea
posible
Encontrar un segundo componente que:
sea ortgonal al (no correlacionado con) primero
ajuste la mayor cantidad posible de los restos de la
variacin de x
El proceso continua hasta que el investigador est
satisfecho o el ajuste sea mnimo.

NAMP Mdulo 17: Introduccin al Anlisis Multivariable

Tier 1, Part 1, Rev.: 0

Cmo Trabaja el ACP (Matemticas)


As es como trabaja el ACP matemticamente:
Considerar una (n x k) matrz de datos X
(n observaciones, k variables)

Modelos PCS como (asumiendo datos normalizados):


X = T * P + E

donde

Como en la regresin
linear slo se usan
matrices

son los valores de cada observacin de los nuevos

componentes
P
son las cargas de las variables originales en los nuevos
componentes
E
matriz residual, conteniendo el ruido

NAMP Mdulo 17: Introduccin al Anlisis Multivariable

Tier 1, Part 1, Rev.: 0

Cmo Trabaja el ACP (Visualmente)


El ACP trabaja visualmente proyectando la nube de datos
multidimensionales en un hiperplano definido por los primeros dos
componentes. La imagen muestra esto en 3-D, para que sea sencillo de
entender, pero en realidad puede haber una docena de o hasta cientos
de dimensiones:
plano

X3

proyeccin

. ..
.
.
.

.
er

.
.
. X2

do

X1
3 variables
originales
NAMP Mdulo 17: Introduccin al Anlisis Multivariable

La nube de datos (en


rojo) es proyectada en un
plano definido por los
primeros 2 componentes

Tier 1, Part 1, Rev.: 0

Nmero de Componentes
Los componentes son simplemente los nuevos ejes que son creados
para ajustar la mayora de la varianza con el menor nmero de
dimensiones. La metodologa del ACP asegura que los componentes
sean extrados en orden decreciente de la varianza. En otras palabras, el
primer componente siempre ajusta la mayora de la varianza, el segundo
ajusta la mayora restante de la varianza, y as sucesivamente:

2 3

6 ...

Eventualmente, los componentes de mayor nivel representan


principalmente ruido. Esto es algo bueno, y de hecho una de las razones
por las cuales se usa el ACP. Debido a que el ruido es relegado a los
componentes de alto nivel, ste est ausente en los primeros
componentes. Esto se debe a que todos los componentes son
ortogonales el uno del otro, lo que significa que son estadsticamente
independientes o no correlacionados.
NAMP Mdulo 17: Introduccin al Anlisis Multivariable

Tier 1, Part 1, Rev.: 0

El Criterio de los Eigenvalores


Existen dos maneras de determinar cundo dejar de crear
nuevos componentes:
Criterio Eigenvalor
Scree test
La primera de stas usa la siguiente definicin matemtica:

Eigenvalores de la matriz A :

Definida matemticamente por (A - I) = 0


til como medida de importancia para las
variables

Usualmente, componentes con eigenvalores menores de uno


son descartados, ya que presentan menos poder de
definicin que el que presentaban originalmente las variables
originales.
NAMP Mdulo 17: Introduccin al Anlisis Multivariable

Tier 1, Part 1, Rev.: 0

El Criterio del Punto de


Inflexin (Scree Test)
8

Grfica de los eigenvalores


vs. nmero de componentes
Extraer componentes hasta
el punto donde se estabiliza
la grfica
La cola derecha de la curva
es rocosa (como la parte
inferior de una pendiente
rocosa)

7
6

Eigenvalores

El segundo mtodo es una


simple tcnica grfica:

5
4
3
2
1

NAMP Mdulo 17: Introduccin al Anlisis Multivariable

Componente #

Tier 1, Part 1, Rev.: 0

Interpretacin de los
Componentes del ACP
Como cualquier tipo de AMV, la parte ms complicada del ACP es la
interpretacin de los componentes. El software es 100% matemtico y
da las mismas soluciones an si los datos estn relacionados al
consumo de diesel o a los resultados de las carreras de caballos. El
ingeniero es el que debe de dar sentido a las soluciones del software. En
general, se debe de:
Basar en la fuerza y direccin de las cargas
Identificar los conjuntos de variables que pudieran estar fsicamente
relacionadas o que provienen de un origen comn
e.g., En la produccin de papel, las propiedades de fortaleza
tales como rasgado, ruptura, longitud de rompimiento en el papel
estn todas relacionadas a la longitud y enlaces de las fibras
iniciales.

NAMP Mdulo 17: Introduccin al Anlisis Multivariable

Tier 1, Part 1, Rev.: 0

ACP vs. PEL


Cul es la diferencia entre ACP y PEL?
Las PEL son una versin de regresin multivariables. Usa dos
modelos diferentes de ACP, uno para las Xs y otro par alas Ys, y
encuentra el enlace entre las dos.
Matemticamente, la diferencia es:
En el ACP, la varianza ajustada por
el modelo es maximizada.

En las PEL, se maximiza la covarianza.

Xx
XY

NAMP Mdulo 17: Introduccin al Anlisis Multivariable

Tier 1, Part 1, Rev.: 0

Cmo Trabaja el PEL (Concepto)


El PEL tambin es un proceso paso-a-paso. As es como funciona
conceptualmente:

PEL encuentra una serie de componentes ortogonales que :


maximizan el nivel de ajuste de la X e Y
provn de una ecuacin predictora para Y en trminos de las Xs

Esto se logra mediante:


Ajuste de un grupo de componentes a X (como en ACP)
Similarmente ajustar un grupo de componentes a Y
Combinar los dos grupos de componentes de tal manera que se
maximice el ajuste de X e Y

NAMP Mdulo 17: Introduccin al Anlisis Multivariable

Tier 1, Part 1, Rev.: 0

Cmo Traba el PEL (Matemticas)


As es como trabaja el PEL matemticamente:

X = TP + E
Y = UQ + F
uh = bhth

relacin externa para X (como ACP)


relacin externa para Y (como ACP)
relacin interna para los componentes
h = 1,,(# de componentes)

Los factores de peso w son usados para asegurarse que las dimensiones
son ortogonales

NAMP Mdulo 17: Introduccin al Anlisis Multivariable

Tier 1, Part 1, Rev.: 0

PEL la Relacin Interna


La forma como trabaja el PEL visualmente es enrollando los dos
modelos del ACP (X e Y) hasta que su covarianza es optimizada. Es este
enrollado lo que produce el nombre de mnimos cuadrados parciales.

Los 3 son resueltos


simultneamente va mtodos
numricos
NAMP Mdulo 17: Introduccin al Anlisis Multivariable

Tier 1, Part 1, Rev.: 0

Interpretacin de los
Componentes del PEL
La interpretacin de los resultados del PEL presenta todas las dificultades
del ACP, adems de uno ms: dar sentido a los componentes individuales
del espacio X e Y.
En otras palabras, para que los resultados tengan sentido, el primer
componente de X debe estar relacionado de alguna manera con el primer
componente de Y.
Observe que a lo largo de este curso, la palabras causa y efecto estn
ausentes. El AMV determina SLO las correlaciones. La nica excepcin
es cuando se ha empleado un adecuado diseo del experimento.
Este es un ejemplo de una falsa correlacin: las semillas en un alimentador
de aves permanece lleno todo el invierno, pero desaparece de repente en
primavera. Usted concluye que el clima clido hicieron desintegrase a las
semillas
NAMP Mdulo 17: Introduccin al Anlisis Multivariable

Tier 1, Part 1, Rev.: 0

Tipo de Salidas del AMV


El software del AMV genera dos tipos de salidas: resultados y
diagnsticos. Hemos visto la grfica de Resultados y Entradas en el
ejemplo de la comida. Algunos otros son mostrados en las siguientes
diapositivas.

Resultados
Grficas de Resultados
Grficas de Entradas

Ya
estudiadas

Diagnsticos
Grficas de Residuos
Observado vs. Predicho
(muchas ms)

NAMP Mdulo 17: Introduccin al Anlisis Multivariable

Tier 1, Part 1, Rev.: 0

111
11
22
22
22
22
22
22
22
22
22
22
22
22
22
22
22
22
22
22
22
22
22
22
22
22
22
22
22
22
22
22
22
22
22
22
22
22
22
22
22
22
22
22
22
22
22
22
22
22
22
22
22
22
22
22
22
22
22
22
22
22
22
22
22
2

99
99
90
00
00
00
00
00
000
000
00
00
00
00
00
00
00
00
00
00
00
00
00
00
000
00
00
00
000
00
00
00
00
00
00
00
00
00
000
00
00
000
00
000
00
00
00
00
000
00
00
00
00
00
00
00
00
00
00
000
00
0

99
99
90
00
00
00
00
00
000
000
00
00
00
00
00
00
00
00
00
00
00
00
00
00
000
00
00
00
000
00
00
00
00
00
00
00
00
00
000
00
00
000
00
000
00
00
00
00
000
00
00
00
00
00
00
00
00
00
00
00
00
0

99
99
99
00
00
000
00
00
00
00
00
00
00
00
00
000
000
00
00
00
00
00
000
00
00
00
11
11
111
11
11
11
11
11
11
11
11
11
111
11
111
11
11
11
11
11
11
11
11
212
22
222
22
22
22
22
22
222
22
22
22
22

-- 11
-- 11
-- 1
-- 00
-- 00
--- 000
-- 0
-- 00
-- 00
-- 0
-- 00
-- 0
-- 00
-- 0
-- 00
--- 00
--- 000
-- 00
--- 00
-- 01
-- 11
--- 111
-- 1
-- 11
-- 11
-0
--- 000
--- 000
-- 0
-- 00
-- 0
-- 00
-- 0
-- 00
-- 00
-- 0
-- 00
--- 000
-- 00
--- 000
-- 00
-- 01
--- 111
-- 1
-- 11
-- 11
-- 1
-- 010
-- 00
--- 000
-- 0
-- 00
-- 0
-- 00
-- 00
--- 000
-- 0
-- 00
-- 00
-- 00

-- 203
-- 011
-- 232
-- 010
-- 2132
0
--- 10122
-- 010
--- 322010
-- 12
-- 2003
-- 11
-- 2032
-- 011
-- 2203
-- 011
2
--- 0321
-- 2132
-- 0110
--- 2203
-- 12
2
--- 100321
-- 203
-- 01
-- 232
-- 010
-- 212
03
--- 1021
-- 010
-- 22103
--- 1021
-- 203
-- 101
-- 2032
-- 0211
-- 0320
-- 1212
-- 0310
-- 2213
--- 0101
-- 2203
0
--- 211032
-- 01
-- 122
-- 031
-- 03212
-- 1102
-- 0320
-- 12
-- 00
-- 12
-- 203
-- 011
-- 22003
--- 21032
-- 0121
-- 0203
-- 112
- 032

12
22
22
11
11
22
22
33
33
34
44
4455
55
565
66
676
77
787
88
899
99
90
00
010
11
11
2212
22
11
11
22
22
33
33
34
44
45
55
55
66
66
77
77
878
88
999
90
0100
11
11
22
221
11
122
22
33
33
34
44
454
55
565
66
677
77
87

98743987654321065
765432107654321098
0984321096587
43212187654309
98765102876543
87654321094321096587
197654321098
54323210987654
7610985432
1098767654329810
329876541032
76547632109854
5432109832109876
32109876545410987632
541098765432
98767654321098
10765432098
543213210985476
763210765498
1098876543209
218765432109
765435432987610
10985432109876
32210987654
430987654321
098765654321798
107654321098
54323210987654
76210984365
2109878765430921
4398765210
65434321098765
874321098765
6543212109874365
87432109765
219887654309021
098765438765432109
6543218709654321
4321098710987265
21098743098765432165
8765430921876543
8765432109432109657
98432108765
21092109654387
876543765432109
987654321098
65432108743210965
430987098765214321
65109875432
98767654321098
10654098732
6521210987436543
874321098765
321099876541032
541098765432
876543210976
985432109876
5432103218765476
985432109876
321018765409
987654329876543210
765432101098765432
985410987632
321009876154
54321098765432
98767654321098
107654321098
765432321098546
87109

D M o d X [1 ]( N o r m )

Residuales

Tambin llamado Modelo a Distancia (DModX)


Contiene todo el ruido
Definicin:
(siguiente diapositiva)

DModX = ( eik2 / D.F.)1/2


32-months of 1 day .M2 (PLS), Untitled
DModX[1](Norm)

D-Crit(0.05)

Original observations
Obs ID (TIME)

M 2 - D - C r i t[ 4 ]
=

1 . 15 7

Empleado para identificar salidas moderadas


Salidas extremas visibles en la Grfica de Resultados

NAMP Mdulo 17: Introduccin al Anlisis Multivariable


Tier 1, Part 1, Rev.: 0

Modelo a Distancia

plano

proyeccin

eik

er

do

i=observacink
=variable

NAMP Mdulo 17: Introduccin al Anlisis Multivariable

Tier 1, Part 1, Rev.: 0

Observado vs. Predicho


Esta grfica presenta los valores de Y predichos por el modelo, contra
los valores originales de Y. Un modelo perfecto tendra slo puntos a lo
largo de la lnea.
day.M3
(PLS), Sin
Untitled
32-32-months
meses deof11da.
M3 (PEL),
Ttulo
YPred[14](53AI034.AI)/YVar(53AI034.AI)
Ypred[14](531034.AI)/YVar(53A1034.AI)

YVar(53AI034.AI)

240

220

200

MODELOIDEAL
IDEAL
MODELO

180

160
150

160

170

180

190

200

210

220

230

240

YPred[14](53AI034.AI)

RMSEE = 24.6664

NAMP Mdulo 17: Introduccin al Anlisis Multivariable

Tier 1, Part 1, Rev.: 0

Retos del AMV


Se presenta una lista de algunos de los principales retos a los que se
enfrentar cuando trabaje con el AMV. Usted ha sido advertido!

Dificultad de interpretacin de las graficas (como leer hojas de t)


Datos pre-procesados
Las curvas de control pueden disfrazar correlaciones reales
Datos discretos vs. promediado vs. interpolados
Determinar los retrasos para los tiempos de residencia en el
diagrama de flujo
Problemas con el incremento de tiempo
e.g., valores segundo-a-segundo o promedios diarios?

Algunas variables sensitivas tpicas para la aplicacin del AMV a un


proceso con datos reales se muestran en la siguiente pgina

NAMP Mdulo 17: Introduccin al Anlisis Multivariable

Tier 1, Part 1, Rev.: 0

Variables Sensitivas Tpicas


Clculos con
AMV

-Lapso de tiempo / promedios


-Qu variable es empleada
-Cuntos componentes?
-Datos pre-procesados
-Tratamiento del ruido/fuera de rango
-ACP vs. PEL

Realidad fsica

-Cules son las Xs e Ys?


-Sub-secciones del diagrama de flujo
-Retrasos de time, mezclado & recirculacin
-Cambios proceso/equipo
-Efectos temporales

Variables no
medibles

-Conocidas pero no medidas


-Desconocidas y no medidas

NAMP Mdulo 17: Introduccin al Anlisis Multivariable

Tier 1, Part 1, Rev.: 0

Fin del Tier 1

Felicidades!

Asumiendo que ha realizado toda la lectura, este es el fin del Tier 1.


Sin duda mucha informacin parece confusa, pero las cosas se
aclararn cuando se resuelvan ejemplos reales en el Tier 2.
Slo falta completar un pequeo quiz

NAMP Mdulo 17: Introduccin al Anlisis Multivariable

Tier 1, Part 1, Rev.: 0

Tier 1 Quiz
Pregunta 1:
Observar una o dos variables a la vez no es recomendable porque
generalmente las variables estn correlacionadas. Qu
significa esto exactamente?
a) Estas variables tienden a incrementar y decrecer al unisono.
b) Estas variables probablemente estn midiendo lo mismo,
indirectamente sin embargo.
c) Estas variable revelan una variable comn y profunda que
probablemente no est medida.
d) Estas variables no son estadsticamente independientes.
e) Todas las anteriores.

NAMP Mdulo 17: Introduccin al Anlisis Multivariable

Tier 1, Part 1, Rev.: 0

Tier 1 Quiz
Pregunta 2:
Cul es la diferencia entre informacin y conocimiento?
a) La informacin est en la computadora o en un pedazo de
papel, mientras que el conocimiento est dentro de la cabeza de
las personas.
b) Slo los cientficos poseen el verdadero conocimiento.
c) La informacin es matemtica, mientras que el conocimiento no
lo es.
d) La informacin incluye relaciones entre variables, pero no
tiene respaldo de la base de las causas cientficas.
e) El conocimiento puede adquirirse slo a travs de la
experiencia.

NAMP Mdulo 17: Introduccin al Anlisis Multivariable

Tier 1, Part 1, Rev.: 0

Tier 1 Quiz
Pregunta 3:
Por qu el AMV nunca revela la causa-y-efecto, al menos que se
emplee un experimento diseado?
a) Causa-y-efecto puede ser determinado slo en el laboratorio.
b) Los experimentos diseados eliminan el error.
c) El AMV sin experimentos diseados slo es inductivo,
mientras que la relacin causa-y-efecto requiere de una
deduccin.
d) Slo los efectos son medibles.
e) Los cientficos disean los experimentos para trabajar
perfectamente la primer vez.

NAMP Mdulo 17: Introduccin al Anlisis Multivariable

Tier 1, Part 1, Rev.: 0

Tier 1 Quiz
Pregunta 4:
Cul es la desventaja ms grande de usar el modelo de la caja
negra en lugar de usar uno basado en los primeros principios?
a) No hay unidades de operacin.
b) El modelo es slo tan bueno como los datos empleados
para crearlo.
c) Datos de reacciones qumicas y datos termodinmicos no son
usados.
d) Un modelo de caja negra puede no tomar en cuenta el diagrama
de flujo completo.
e) Los modelos de AMV son slo lineares.

NAMP Mdulo 17: Introduccin al Anlisis Multivariable

Tier 1, Part 1, Rev.: 0

Tier 1 Quiz
Pregunta 5:
Qu nos dice un intervalo de confianza?

a) Qu tan dispersa est la informacin alrededor de la lnea de


regresin.
b) El rango dentro del cual cierto porcentaje de valores es
esperado que se encuentre.
c) El rea dentro de la cual la regresin lineal debe caer.
d) El grado de credibilidad de los resultados de un anlisis
especfico.
e) El nmero de veces que debe repetirse un anlisis para estar
seguro de los resultados.

NAMP Mdulo 17: Introduccin al Anlisis Multivariable

Tier 1, Part 1, Rev.: 0

Tier 1 Quiz
Pregunta 6:
Cuando los datos fueron recopilados, algunos de los sensores de la
planta no funcionaba correctamente y daba lecturas imprecisas.
Cules son las implicaciones a tomar en el anlisis estadstico?
a) Se ajustan en el modelo ms trminos cuadrticos y productos
cruzados a los datos.
b) Valores de la media ms elevados de los esperados
normalmente.
c) Valores de varianza ms elevados para las variables
asociadas con el mal funcionamiento del sensor.
d) Diferente seleccin de variables para incluir en el anlisis.
e) Trmino residual mayor en el modelo.

NAMP Mdulo 17: Introduccin al Anlisis Multivariable

Tier 1, Part 1, Rev.: 0

Tier 1 Quiz
Pregunta 7:
Por qu el reducir el nmero de dimensiones (ms variables para
menos componentes) tiene sentido desde un punto de vista
cientfico?
a) Los nuevos componentes pueden corresponder a la base
fsica del fenmeno que no puede ser medido directamente.
b) Menos dimensiones son ms sencillas de observar en una
grfica o computadora.
c) La navaja de Ockham limita a los cientficos a menos de cinco
dimensiones.
d) El mundo real est limitado a slo tres dimensiones.
e) Todas las anteriores.

NAMP Mdulo 17: Introduccin al Anlisis Multivariable

Tier 1, Part 1, Rev.: 0

Tier 1 Quiz
Pregunta 8:
Si dos puntos en una grfica de resultados estn demasiado cerca,
significa esto que estas dos observaciones son casi idnticas?

a)
b)
c)
d)
e)

S, porque estn en la misma posicin del cuadrante.


No, porque se debe a un error experimental.
S, porque presentan virtualmente el mismo efecto en el AMV.
No, porque la grfica de resultados es slo una proyeccin.
Respuestas (a) y (c).

NAMP Mdulo 17: Introduccin al Anlisis Multivariable

Tier 1, Part 1, Rev.: 0

Tier 1 Quiz
Pregunta 9:
Observando el ejemplo de la comida, qu pases aparentan estar
correlacionados con un gran consumo de aceite de oliva?
a)
b)
c)
d)
e)

Italia y Espaa y en menor grado Portugal y Austria.


Slo Italia y Espaa.
Slo Italia.
Irlanda e Italia.
Todos los pases menos Suecia, Dinamarca e Inglaterra.

NAMP Mdulo 17: Introduccin al Anlisis Multivariable

Tier 1, Part 1, Rev.: 0

Tier 1 Quiz
Pregunta 10:
Por qu el error queda relegado cuando se tiene un mayor orden
de componentes en el ACP?
a)
b)
c)
d)
e)

Porque la Navaja de Ockham as lo establece.


Porque el mundo real slo tiene tres dimensiones.
Porque el ruido es falsa informacin.
Porque el AMV es capaz de corregir datos pobres.
Porque el ruido no est correlacionado con otras variables.

NAMP Mdulo 17: Introduccin al Anlisis Multivariable

Tier 1, Part 1, Rev.: 0

Das könnte Ihnen auch gefallen