Beruflich Dokumente
Kultur Dokumente
Facultad de Ingeniera
Maestra de Investigacin de Operaciones
Inferencia Estadstica
Superficies de Respuesta
Integrantes:
Jos Alirio Cardoza
Los diferentes niveles o valores que pueden tomar las condiciones de operacin comprenden
los factores de ajuste de cada experimento. Los factores de ajuste pueden estar compuestos
por variables cuantitativas con una relacin de primer orden (lineal) o de segundo orden
(cuadrtica) y en base a las caractersticas de la superficie de respuesta de estas se decide que
accin se tomar en el experimento.
= (1 , 2 , 3 , , )
= 0 + 1 1 + 2 2 + 3 3 +
Los modelos de primer orden, slo son tiles cuando se explore una regin relativamente
pequea de (1 , 2 , 3 , , ), dependiendo por supuesto, del problema y de la regin de
exploracin de las variables bajo estudio; generalmente, estas regiones exhiben ninguna o
muy poca curvatura. En caso contrario, es necesario aproximar, mediante un polinomio de
segundo orden, denotado de la siguiente manera:
= 0 + + 2 + +
=1 =1 =1 =1
Partiendo del hecho que los valores (1 , 2 , 3 , , )son variables controladas y medidas
con mnimo error (tan pequeo, que se puede decir que se mide sin error) los coeficientes del
modelo (parmetros) puede estimarse a travs de los procedimientos de regresin lineal
conocidos (mnimos cuadrados, mxima verosimilitud).
2. SUPERFICIE DE RESPUESTA
La relacin = (1 , 2 , 3 , , ) entre y los niveles (1 , 2 , 3 , , ) de los
factores representa una superficie. Con p factores la superficie est en + 1 dimensiones. Si
= 1 la superficie se encontrar en un espacio de dos dimensiones, mientras que si tenemos
= 2 la superficie se encontrar en un espacio de tres dimensiones. Esta superficie es la que
se busca optimizar y conseguir el punto ptimo de operacin del sistema.
REGIN EXPERIMENTAL
La regin experimental especifica la regin de valores para los niveles de los factores. Esto
se puede hacer empleando los niveles actuales de operacin para cada factor, si se desea
explorar el vecindario se incrementa y decremento el valor del nivel en una cantidad
determinada. Esta regin representa las restricciones a las cuales las variables regresoras
estn sometidas.
3. POLINOMIO DE PRIMER ORDEN
Generalmente se desconoce la relacin entre la respuesta y las variables independientes, por
eso se requiere de un modelo que aproxime la relacin funcional entre y las variables
independientes.
Los modelos de primer orden se utilizan cuando el sistema est siendo investigado por
primera vez, a partir de un polinomio de primer orden se puede obtener la direccin de
ascenso mximo de la superficie de respuesta, es probable que le siga un ajuste de segundo
orden, es decir la resolucin de un polinomio de primer orden es la base de una
experimentacin secuencial.
= 0 + 1 1 + 2 2 + 3 3 + +
Los parmetros del modelo se estiman mediante el mtodo de mnimos cuadrados. Una vez
que se tienen los estimadores se sustituyen en la ecuacin y obtenemos el modelo ajustado:
0 +
= 1 1 +
2 2 +
3 3 +
Adems, los valores del error aleatorio () deben asumir una distribucin normal e
independiente con una varianza comn 2 .
)2
= (
=1 =1
Donde:
= 1,2, ,
= 1,2, ,
: Numero de replicaciones para el l-simo punto.
=
= ( )2
=1
Donde:
: Es el valor predicho en el l-simo punto del diseo.
/( )
=
/( )
Donde:
: Nmero de niveles de las variables independientes.
N: Nmero total de observaciones.
p: Nmero de variables que tiene el modelo
Se busca contrastar la hiptesis de Ho: la relacin es lineal contra H1: la relacin no es lineal.
La hiptesis de suficiencia de ajuste con un nivel de significancia se rechaza cuando el
valor calculado del estadstico es mayor a (, ,) . Cuando la calculada no es mayor
el cuadrado medio residual es utilizado para estimar la Varianza y tambin se usa para probar
la significancia del modelo.
Cuando la hiptesis de suficiencia de ajuste se rechaza, se debe elevar el grado del modelo
aumentando trminos de producto cruzado y/o trminos de mayor grado en
(1 , 2 , 3 , , ). Si se requieren puntos adicionales para estimar todos los coeficientes
estos se aaden. Se colectan los datos y se vuelve hacer.
Si no se rechaza la hiptesis podemos inferir que la superficie es plana. Una vez que se tiene
la ecuacin y se ha probado el ajuste se busca niveles que mejoren la respuesta,
Para comprender como se sigue la ruta de la mxima pendiente en ascenso, son necesarios el
uso de algunas herramientas del clculo diferencial, para obtener la direccin y la longitud
de los pasos que se usarn para desplazarse a travs de la curva, se utiliza el mtodo del
gradiente.
Para entender la metodologa del gradiente partiremos del siguiente anlisis, supngase que
se tiene una funcin de dos dimensiones (, ), esta pudiese representar la altura de una
montaa como una funcin de su posicin. Supngase que se encuentra en un lugar especfico
de la montaa (a,b) quiere conocer la pendiente en una direccin arbitraria. Una forma de
definir la direccin es a lo largo de un nuevo eje que forma un ngulo con el eje . La
elevacin a lo largo del nuevo eje puede entenderse como como una nueva funcin (). Si
usted define su posicin como el origen de este eje (es decir, = 0), la pendiente en esta
direccin podra designarse como (0). Est pendiente se llama derivada direccional, se
puede calcular a partir de las derivadas parciales a lo largo de los ejes y mediante:
(0) = cos + sin
= +
Este vector tambin se conoce como nabla , el cual relaciona con la derivada direccional
de (, ) en el punto = y = .
1
2
() = .
.
.
{
Para el problema de subir la montaa, si lo que interesa es ganar elevacin tan rpidamente
como sea posible, el gradiente nos indica, de manera local, que direccin tomar y cunto
ganaremos al hacerlo.
Para un modelo de superficie de respuesta de primer orden, partiendo de que este se trata de
un plano, la direccin ptima es perpendicular a los contornos o curvas de nivel. Se
recomienda como ya se dijo, un paso de movimiento unitario en el factor de mayor influencia,
con lo cual se asegura que los pasos en los otros factores sern de menor amplitud y
proporcionales a sus coeficientes. Esta longitud de paso representa la mitad del rango
experimental utilizado (es decir, nivel alto menos nivel bajo entre dos).
As si el modelo es de la forma:
0 +
= 1 1 +
2 2
= 0 + + 2 + +
=1 =1 =1 =1
En ste los son los coeficientes de regresin para los trminos de primer orden, los son
los coeficientes para los trminos cuadrticos puros, los son los coeficientes para los
trminos de productos cruz y es el trmino del error aleatorio. Los trminos cuadrticos
puros y los de productos cruz son de segundo orden. El nmero de trminos en la ecuacin
esta dado por = ( + 1)( + 2)/2.
Los parmetros del modelo se estiman mediante el mtodo de mnimos cuadrados. Una vez
que se tienen los estimadores se sustituyen en la ecuacin y obtenemos el modelo ajustado
para la regin donde se encuentra el valor ptimo de la respuesta.
0 + +
= 2
+
=1 =1 =1 =1
Una vez que se ha verificado que el modelo tiene suficiencia de ajuste y que los coeficientes
son significativos, se procede a localizar las coordenadas del punto estacionario mediante
mtodos de optimizacin y se lleva a cabo un anlisis ms detallado de la respuesta.
Estas tcnicas de optimizacin dependen del modelo ajustado, existen diferentes tcnicas
para evaluar donde se encuentra el punto ajustado, en este trabajo hablaremos del anlisis
cannico y el uso de curvas de nivel.
ANLISIS CANNICO
Es una tcnica utilizada para analizar los modelos de segundo orden y caracterizar su
superficie, estudiando las coordenadas del punto estacionario el tipo de punto y la orientacin
de la superficie. Este anlisis consiste en rescribir el modelo ajustado de segundo orden en
forma cannica, que consiste en expresarlo en trmino de nuevas variables, llamadas
variables cannicas, las cuales son transformaciones de las variables codificadas. La ventaja
es que la ecuacin cannica proporciona a simple vista informacin a simple vista sobre el
tipo de superficie que se est observando y sobre su forma.
El primer consiste en hallar el punto estacionario, que consiste en el punto donde el plano
tangente a la superficie tiene tangente cero, el cual se localiza derivando con respecto a cada
variable , igualando a cero y despejando. Todo esto se puede facilitar si el modelo se
rescribe en su notacin matricial como:
0 + +
=
Donde
= [1 , 2 , , ]
1
2
= .
.
{
: es el vector de los coeficientes de la parte lineal del proceso.
11 1 /2
=( )
1 /2
= + 2 = 0
De donde se obtiene el punto:
1
0 =
2
0 + 1 1 2 + 2 2 2 + + 2
=
Donde:
0 : es el valor predicho para el modelo sobre el punto estacionario
: Representa las variables independientes transformadas conocidas como variables
transformadas.
: Son los valores propios de la matriz
Para encontrar el valor de los o valores propios de la matriz hay que recordar que son
constantes que cumplen la relacin
=
Donde:
: es un vector propio, tambin llamado vector caracterstico.
Donde:
: Matriz identidad de dimensin k.
ANLISIS GRAFICO DE UNA SUPERFICIE DE RESPUESTA
Una tcnica utilizada para ayudar a visualizar la forma que puede tener una superficie de
respuesta tridimensional consiste en representar la grfica de contornos de la superficie, en
la que se trazan las denominadas lneas de contorno, que son curvas correspondientes a
valores constantes de la respuesta sobre el plano
1 2 (plano cuyos ejes coordenados vienen dados por los niveles 1 y 2 de los factores).
Geomtricamente, cada lnea de contorno es una proyeccin sobre el plano 1 2 de una
seccin de la superficie de respuesta al intersectar con un plano paralelo al 1 2 . La grfica
de contornos resulta til para estudiar los niveles de los factores en los que se da un cambio
en la forma o altura de la superficie de respuesta. La existencia de grficas de contorno no
est limitada a 3 dimensiones a pesar de que en el caso en que haya ms de 3 factores de
influencia no es posible la representacin geomtrica. No obstante, el hecho de poder
representar grficas de contorno para problemas en que haya 2 o 3 factores permite visualizar
ms fcilmente la situacin general.
Un mximo o un mnimo puede estar representado como la figura que se muestra a
continuacin, donde dependiendo de los valores mostrados, se tendr un mximo si los
crculos en el interior tienen valores ms grandes, y estos disminuyen conforme se alejan del
centro o un mnimo cuando se comporte de manera contraria a la anterior.
Una clase nica de diseos que minimizan la varianza de los coeficientes de regresin ( )
son los diseos ortogonales de primer orden. Se considera que un diseo es ortogonal cuando
los coeficientes estimados en el modelo ajustado, no estn correlacionados entre s.
La distancia de los puntos axiales al origen, que se denotan por , vara segn las
propiedades que se desean en el diseo. Las propiedades ms buscadas, generalmente, son
rotabilidad, ortogonalidad y precisin uniforme.
Una propiedad de los diseos centrales compuestos es que mediante la eleccin apropiada de
los puntos centrales el diseo puede hacerse ortogonal, esto es, que las estimaciones de los
parmetros para el modelo de segundo orden, estn mnimamente correlacionados con las
estimaciones de otros parmetros.
En los diseos en los que se busque rotabilidad y ortagonalidad, al mismo tiempo, se debe
cumplir con valores especficos para y 0 . Los valores que stos deben tomar son
1
= (2 )1/4 y 0 = 4 ((2 )2 + 2) + 2 2
= (2 )1/4 = 1.4142
Para el caso de un diseo de tres factores se tendr los siguientes factores:
Los diseos centrales compuestos son muy eficientes, pues proporcionan mucha informacin
sobre los efectos de las variables experimentales y sobre todo del error experimental, todo
ello en un nmero mnimo de corridas posibles.
6. MODELO DE SUPERFICIES DE RESPUESTA PARA DISEO
DE HELICPTERO DE PAPEL
El siguiente ejemplo extrado del artculo Designing a better paper helicopter, using
response Surface methodology del autor Erik Barry Erhardt es una muestra de cmo se
puede utilizar la metodologa de superficies de respuesta para optimizar el tiempo de vuelo
de helicpteros hechos de papel.
El diseo inicial es como se muestra en la figura a continuacin, se tiene una hoja de papel
de 20 x 8 cm, las lneas solidas representan la parte de papel que se deber cortar y las lneas
segmentadas las partes del papel que debern ser dobladas. Al helicptero de papel se le
puede identificar cuatro partes rotor, cuerpo, pliegue y pie (en el resto del documento se usar
los nombres en ingles motivado a que es el idioma original de donde se sustrajo la
informacin).
Una vez realizados los cortes y los dobles del papel el helicptero quedar como la imagen
que se muestra a continuacin. El tiempo de vuelo del helicptero se mide como el tiempo
en que esta demora en llegar al suelo cuando se deja caer en cada libre.
Para comenzar el diseo de los experimentos la primera decisin que se deber tomar es
cuales son los factores (variables de control) que influencia el tiempo de vuelo y que se
tomarn en cuenta para el diseo del helicptero. La seleccin de los factores para el diseo
del helicptero depende de los conocimientos de aerodinmica que se tenga y de que tanto
control se tenga sobre estas variables.
Una primera seleccin de las posibles variables de control que influencian el tiempo de vuelo
del helicptero sera como se muestra en la siguiente tabla (Se incluye los valores de
codificacin de las variables para la realizacin de los experimentos, las unidades estn dadas
en centimetros).
El factor G indica el tipo de papel que se va utilizar donde solo se tiene dos niveles un papel
ms grueso que otro, el factor H indica la direccin hacia donde se realizarn los pliegues, si
sern en contra o en el sentido de la rotacin.
El principio de Pareto establece que en un experimento hay factores de vital importancia y
otros factores menos importantes que se pueden considerar triviales. Para determinar cules
factores tienen una contribucin mayor en el tiempo de vuelo del helicptero, se realiz un
experimento fraccional 284 partiendo del diseo inicial que se mostr en la primera figura.
Se produjeron 16 helicpteros y se midi su tiempo de vuelo para una altura de 20 pies. Las
codificaciones de las variables y los resultados obtenidos se muestran en la siguiente tabla:
Una vez seleccionado las variables de control se realiza un nuevo experimento para
determinar un modelo de primer orden que nos permita ubicar la direccin de donde se
encuentra el punto ptimo. Como se tiene nicamente dos factores se realizar un
experimento 22 con 4 replicaciones, se utiliz la codificacin inicial, los resultados obtenidos
se muestran a continuacin:
Aplicando regresin lineal a los resultados obtenidos se tiene el siguiente modelo:
Para establecer la direccin de mayor crecimiento se utiliza el mtodo del gradiente, en este
caso en particular los diseadores del experimento en base a su experiencia decidieron
establecer el siguiente paso para la bsqueda de la regin donde se encuentra el punto ptimo,
en este caso los diseadores del experimento decidieron establecer el siguiente paso en buque
da del optimo, 1cm para el factor (rotor length) y -0.39cm para el factor (rotor width), a
continuacin se muestra la tabla con los resultados obtenidos.
El factor no es una variable de control pero se muestra en la tabla porque este decrece a
medida que decrece. En la tabla se puede observar que al cuarto paso se produce un
decrecimiento del valor de respuesta, encontrndose posiblemente el punto ptimo alrededor
del punto (11.5, 2.83).
Una vez determinada la regin donde posiblemente se encuentre el punto ptimo se realizar
un diseo del tipo central compuesto de dos factores para determinar el modelo de segundo
que mejor se adapte a la variable de respuesta y as determinar el punto ptimo de operacin.
Para el diseo central compuesto se realiz una nueva codificacin de las variables de control
colocando como centro de la regin de estudio la obtenida del modelo de primer oreden, en
la siguiente tabla se muestra la nueva codificacin:
Una vez realizado el diseo central compuesto se obtuvieron los siguientes resultados:
Aplicando regresin lineal a los resultados obtenidos se tiene el siguiente modelo de segundo
orden:
Obtenido el modelo se realiz la validacin de los parmetros del modelo. Usando la prueba
para los coeficientes se obtuvo que todos los factores excepto el trmino de la interaccin
(1 2) son significantes con un nivel de 0.05. De la prueba de falta de ajuste se obtiene que
el modelo ajustado describe correctamente la data debido a que el valor de la prueba dio
= 0.3737 por lo tanto no se rechaza la hiptesis nula y no ser necesario aumentar el
grado del modelo. A continuacin se muestran los resultados obtenidos:
Del modelo se obtiene el siguiente punto estacionario (1 = 0.32, = 0.29) (estos valores
son de las variables codificadas) con una respuesta igual a = 16.9. Los cofactores de este
modelo son (-1.15,-1.71), ambos negativos por lo tanto indica que se est ante un mximo
del modelo y posible punto ptimo.
Por ultimo para el diseo seleccionado se procede a realizar otro experimento para la
verificacin del modelo. Se realiz seis helicpteros con las medidas establecidas en el y se
observ su tiempo de respuesta. Los resultados estadsticos encontrados fueron, una media
de 17.81 segundos, con una desviacin estndar de 1.67 segundos, un intervalo de confianza
del 95% para valores entre (16.1, 19.6). A continuacin se muestran los resultados obtenidos
para las 6 mediciones realizadas.
La respuesta predicha con el modelo es de = 16.9, esta se encuentra dentro del intervalo
de confianza obtenido con la ltima muestra. Se puede concluir que la metodologa de
superficies de respuesta permiti conseguir un modelo de helicptero que probablemente nos
d el mayor tiempo de vuelo.
7. BIBLIOGRAFA
Barry Erhardt, Erik: Designing a better paper helicopter: Using response surface
Methodology,https://www.amstat.org/publications/stats/index.cfm?fuseaction=paperhelico
pter.