Beruflich Dokumente
Kultur Dokumente
17
7. Conclusiones y recomendaciones. Una vez que se han analizado los datos, el experimentador debe sacar
conclusiones prcticas acerca de los resultados y recomendar un curso de accin. Los mtodos grficos suelen ser tiles en esta etapa, en particular para presentar los resultados. Tambin debern realizarse corridas
de seguimiento o pruebas de confirmacin para validar las conclusiones del experimento.
A lo largo del proceso completo es importante tener presente que la experimentacin es una parte
esencial del proceso de aprendizaje, en la que se formulan hiptesis tentativas acerca de un sistema, se
realizan experimentos para investigar estas hiptesis y se formulan nuevas hiptesis con base en los resultados, y as sucesivamente. Esto sugiere que la experimentacin es iterativa. Por lo general es un gran'
error disear un solo experimento comprensivo y extenso al principio de un estudio. Un experimento exitoso requiere conocer los factores importantes, los rangos en los que debern hacerse variar estos factores, el nmero apropiado de niveles que debern usarse y las unidades de medicin apropiadas para estas
variables. En general, no se conocen las respuestas precisas de estas cuestiones, pero se aprende acerca de
ellas sobre la marcha. A medida que avanza un programa experimental, es comn abandonar algunas variables de entrada e incorporar otras, modificar la regin de exploracin de algunos factores o incorporar
nuevas variables de respuesta. Por consiguiente, generalmente la experimentacin se hace en forma secuencial y, como regla general, no deber invertirse ms de 25% de los recursos disponibles en el primer
experimento. Con esto se asegurar que se contar con los recursos suficientes para realizar las corridas
de confirmacin y que se alcanzar en ltima instancia el objetivo final del experimento.
1~5
Ha habido cuatro eras del desarrollo moderno del diseo experimental estadstico. La era agrcola fue
encabezada por el trabajo pionero de Sir Ronald A. Fisher en los aos 1920 y principios de la dcada de
1930. En este periodo, Fisher fue el responsable de las estadsticas y el anlisis de datos en la Estacin
18
CAPTULO 1 INTRODUCCIN
Agrcola Experimental de Rothamsted en las cercanas de Londres, Inglaterra. Fisher se percat de que
las fallas en la forma en que se llevaba a cabo el experimento que generaba los datos obstaculizaban con
frecuencia el anlisis de los datos de los sistemas (en este caso sistemas agrcolas). Mediante la interaccin con mltiples cientficos e investigadores de diversos campos, Fisher desarroll las ideas que llevaron a los tres principios bsicos del diseo experimental que se revisan en la seccin 1-3: la aleatorizacin,
la realizacin de rplicas y la formacin de bloques. Fisher incorpor de manera sistemtica ~l pensamiento y los principios estadsticos en el diseo de las investigaciones experimentales, incluyendo el concepto de diseo factorial y el anlisis de varianza. Sus libros [44a, b] tuvieron profunda influencia en el uso
de la estadstica, particularmente en la agricultura y las ciencias biolgicas relacionadas. Para una excelente biografa de Fisher, ver Box [21].
Si bien es cierto que la aplicacin del diseo estadstico en ambientes industriales se inici en la dcada de 1930, el catalizador de la segunda era, o era industrial, fue el desarrollo de la metodologa de superficies de respuesta (MSR) por parte de Box y Wilson [20]. Estos autores se percataron y explotaron el
hecho de que muchos experimentos industriales son fundamentalmente diferentes de sus contrapartes
agrcolas en dos sentidos: 1) la variable de respuesta puede observarse por lo general (casi) de inmediato,
y 2) el experimentador puede obtener pronto informacin crucial de un pequeo grupo de corridas que
puede usarse para planear el siguiente experimento. Box [12f] denomina inmediatez y secuencialidad a estas dos caractersticas de los experimentos industriales. En los 30 aos siguientes, la MSR y otras tcnicas
de diseo se generalizaron en las industrias qumica y de proceso, sobre todo en el trabajo de investigacin y desarrollo. George Box fue el lder intelectual de este movimiento. Sin embargo, la aplicacin del
diseo estadstico a nivel de plantas o procesos de manufactura todava no estaba muy generalizada.
Algunas de las razones de ello incluyen la capacitacin inadecuada de ingenieros y otros especialistas en
procesos en los conceptos y los mtodos estadsticos bsicos, as como la falta de recursos de computacin
y software de estadstica que fueran fciles de usar para apoyar la aplicacin de experimentos diseados
estadsticamente.
El inters creciente de la industria occidental en el mejoramiento de calidad que empez a fines de la
dcada de 1970 anunci la tercera era del diseo estadstico. El trabajo de Genichi Taguchi (Taguchi y Wu
[109], Kackar [62] y Taguchi [108a, b]) tuvo un impacto significativo en el aumento del inters y el uso de
los experimentos diseados. Taguchi propugnaba por el uso de experimentos diseados para lo que denomin el diseo paramtrico robusto, es decir,
1. Hacer procesos insensibles a los factores ambientales o de otra ndole que son difciles de controlar.
2. Fabricar productos insensibles a la variacin transmitida por los componentes.
3. Encontrar los niveles de las variables del proceso que obliguen a la media a un valor deseado
mientras que al mismo tiempo se reduzca la variabilidad en torno a este valor.
Taguchi propuso diseos factoriales altamente fraccionados y otros arreglos ortogonales junto con algunos mtodos estadsticos nuevos para resolver estos problemas. La metodologa resultante gener muchas discusiones y controversias. Parte de la controversia surgi porque en Occidente la metodologa de
Taguchi fue defendida al principio (y sobre todo) por empresarios, y no se haba hecho la revisin escrutadora adecuada de la ciencia estadstica fundamental. Para fines de la dcada de 1980, los resultados de
esta revisin indicaron que aun cuando los conceptos y los objetivos enfocados en la ingeniera de Taguchi
tenan bases slidas, existan problemas sustanciales con su estrategia experimental y sus mtodos para el
anlisis de los datos. Para detalles especficos de estas cuestiones, ver Box [12d], Box, Bisgaard y Fung
[14], Hunter [59a, b], Myers y Montgomery [85a] y Pignatiello y Ramberg [94]. Gran parte de estas preo-
19
cupaciones se resumen tambin en el amplio panel de discusin del nmero de mayo de 1992 de TeehnomeDies (ver Nair, et al. [86]).
Hubo al menos tres resultados positivos de la controversia desatada por Taguchi. Primero, el uso de
los experimentos diseados se hizo ms generalizado en las industrias con piezas discretas, incluyendo la
industria de manufacturas automotrices y aeroespaciales, de electrnica y semiconductores, y muchas
otras, que anteriormente hacan poco uso de esta tcnica. Segundo, se inici la cuarta era del diseo estadstico. Esta era ha incluido un renovado inters general tanto por parte de investigadores como de profesionales en ejercicio en el diseo estadstico y el desarrollo de varios enfoques nuevos y tiles para los
problemas experimentales en el mundo industrial, incluyendo alternativas a los mtodos tcnicos de Thguchi que permiten que sus conceptos de ingeniera se lleven a la prctica de manera eficaz y eficiente.
Algunas de estas alternativas se revisarn e ilustrarn en captulos subsecuentes, en particular en el captulo 11. Tercero, la educacin formal en diseo experimental estadstico se est haciendo parte de los programas de ingeniera en las universidades, tanto a nivel de licenciatura como de posgrado. La integracin
exitosa de una buena prctica del diseo experimental en la ingeniera y las ciencias es un factor clave en
la competitividad industrial futura.
1~6
Gran parte de la investigacin en la ingeniera, las ciencias y la industria es emprica y hace un uso extensiva de la experimentacin. Los mtodos estadsticos pueden incrementar en gran medida la eficiencia de
estos experimentos y con frecuencia pueden fortalecer las conclusiones as obtenidas. El uso correcto de
las tcnicas estadsticas en la experimentacin requiere que el experimentador tenga presentes los puntos
siguientes:
Los experimentadores suelen poseer amplios conocimientos de sus respectivos campos. Por ejemplo, un ingeniero civil que trabaja en un problema de hidrologa cuenta de manera tpica con considerable experiencia prctica y capacitacin acadmica formal
en esta rea. En algunos campos existe un cuerpo enorme de teora fsica en el cual indagar para explicar
las relaciones entre los factores y las respuestas. Este tipo de conocimientos no estadsticos es invaluable
para elegir los factores, determinar los niveles de los factores, decidir cuntas rplicas correr, interpretar
los resultados del anlisis, etc. El uso de la estadstica no es sustituto de la reflexin sobre el problema.
Debido justamente a que dos condiciones experimentales producen respuestas medias que son estadsticamente diferentes, no existe ninguna seguridad de que esta diferencia sea de la magnitud suficiente como para tener
algn valor prctico. Por ejemplo, un ingeniero puede determinar que una modificacin en el sistema de
inyeccin de combustible de un automvil puede producir un mejoramiento promedio real en el rendimiento del combustible de 0.1 mi/gal. ste es un resultado estadsticamente significativo. Sin embargo, si
20
CAPTULO 1 INTRODUCCIN
el costo de la modificacin es de $1000, la diferencia de 0.1 mi/gal probablemente ser muy pequea para
poseer algn valor prctico.
4. Los experimentos son generalmente iterativos. Recuerde que en la mayora de las situaciones no es
conveniente disear un experimento demasiado comprensivo al principio de un estudio. Un diseo exitoso requiere conocer los factores importantes, los rangos en los que estos factores se harn variar, el nmero aprOpiado de niveles para cada factor y los mtodos y las unidades de medicin adecuados para cada
factor y respuesta. En general, ningn experimentador est en posicin de responder estas cuestiones al
principio del experimento, sino que las respuestas aparecen sobre la marcha. Esto habla en favor del enfoque iterativo o secuencial analizado anteriormente. Desde luego, hay situaciones en las que un experimento comprensivo es totalmente apropiado pero, como regla general, la mayora de los experimentos
debern ser iterativos. Por consiguiente, no deber invertirse ms de 25% de los recursos para la experimentacin (corridas, presupuesto, tiempo, etc.) en el experimento inicial. Con frecuencia estos esfuerzos
iniciales constituyen slo experiencias de aprendizaje, y es necesario contar con recursos suficientes para
alcanzar los objetivos finales del experimento.
Experimentos
comparativos simples
En este captulo se examinan los experimentos para comparar dos condiciones (llamadas en ocasiones
tratamientos), a las cuales es comn denominar experimentos comparativos simples. Se empieza conel
ejemplo de un experimento que se realiza para determinar si dos formulaciones diferentes de un producto producen resultados equivalentes. El estudio lleva a revisar varios conceptos bsicos de la estadstica,
como variables aleatorias, distribuciones de probabilidad, muestras aleatorias, distribuciones de muestreo y pruebas de hiptesis.
2..1 INTRODUCCIN
La fuerza de la tensin de adhesin del mortero de cemento portland es una caracterstica importante del
producto. Un ingeniero est interesado en comparar la fuerza de una formulacin modificada en la que se han
agregado emulsiones de ltex de polmeros durante el mezclado, con la fuerza del mortero sin modificar. El
experimentador ha reunido 10 observaciones de la fuerza de la formulacin modificada y otras 10 observaciones de la formulacin sin modificar. Los datos se muestran en la tabla 2-1. Podra hacerse referencia a las dos
formulaciones diferentes como dos tratamientos o como dos niveles del factor formulaciones.
En la figura 2-1 se grafican los datos de este experimento. A esta representacin se le llama diagrama
de puntos. Del examen visual de estos datos se obtiene la impresin inmediata de que la fuerza del mortero sin modificar es mayor que la fuerza del mortero modificado. Esta impresin se confirma al comparar
las fuerzas de la tensin de adhesinpromedio'Yl = 16.76 kgf/cm2 para el mortero modificado YY2 = 17.92
kgf/cm2 para el mortero sin modificar. Las fuerzas de la tensin de adhesin promedio de estas dos muestras difieren en lo que parece ser una cantidad no trivial. Sin embargo, no es evidente que esta diferencia
sea de la magnitud suficiente para implicar que las dos formulaciones son en realidad diferentes. Quizs
esta diferencia observada en las fuerzas promedio sea el resultado de fluctuaciones del muestreo y las dos
formulaciones sean idnticas en realidad. Posiblemente otras dos muestras produzcan el resultado contrario, con la fuerza del mortero modificado excediendo la de la formulacin sin modificar.
Puede usarse una tcnica de la inferencia estadstica llamada prueba de hiptesis (algunos autores
prefieren el trmino prueba de significacin) para auxiliar al experimentador en la comparacin de estas
21
22
Tabla 2.1
Mortero
modificado
Mortero sin
modificar
Y1j
16.85
16.40
17.21
16.35
16.52
17.04
16.96
17.15
16.59
16.57
17.50
17.63
18.25
18.00
17.86
17.75
18.22
17.90
17.96
18.15
1
2
3
4
5
6
7
8
9
10
dos formulaciones. La prueba de hiptesis permite que la comparacin de las dos formulaciones se haga
en trminos objetivos, con el conocimiento de los riesgos asociados si se llega a una conclusin equivocada. Antes de presentar los procedimientos de la prueba de hiptesis en experimentos comparativos simples, se har una breve revisin de algunos conceptos elementales de la estadstica.
2.2
A cada una de las observaciones del experimento del cemento portland citado anteriormente se le llamara una corrida. Observe que las corridas individuales difieren, por lo que existen fluctuaciones, o ruido,
en los resultados. Es comn llamar a este ruido el error experimeutal o simplemente el error. Se trata de
un error estadstico, lo cual significa que se origina por la variacin que no est bajo control y que generalmente es inevitable. La presencia del error o ruido implica que la variable de respuesta, la fuerza de la
tensin de adhesin, es una variable aleatoria. Una variable aleatoria puede ser discreta o coutinua. Si el
conjunto de todos los valores posibles de la variable aleatoria es finito o contablemente infinito, entonces
la variable aleatoria es discreta, mientras que si el conjunto de todos los valores posibles de la variable
aleatoria es un intervalo, entonces la variable aleatoria es continua.
Descripcin grfica de la variabilidad
Es frecuente usar mtodos grficos simples como ayuda para analizar los datos de un experimento. El
diagrama de puntos, ilustrado en la figura 2-1, es un recurso muy til para representar un cuerpo reducido. de datos (digamos hasta unas 20 observaciones). El diagrama de puntos le permite al experimentador
ver de inmediato la localizacin o tendencia central de las observaciones y su dispersin. Por ejemplo, en
el experimento de la fuerza de tensin d adhesin del cemento portland, el diagrama de puntos revela
ee_
15
y,
Figura 2-1
ee Ieee
00
16
17 Fuerza
16.76
(kgf/cm 2)
oro!> 000
18
Y2 ~ 17.92
19
20
e
Mortero modificado
ro
'Ero
30
0.10
20
ro
.
c:
ro
.
c:
ID
::J
"~
ID
::J
"
.t
23
"-
ID
0.05
0.00
10
60
65
70
75
que probablemente las dos formulaciones difieran en la fuerza promedio, pero que ambas producen
aproximadamente la misma variacin en la fuerza.
Cuando los datos son muy numersos, es difcil distinguir las observaciones graficadas en un diagrama de puntos, y en tal caso sera preferible un histograma. En la figura 2-2 se presenta el histograma de
200 observaciones de la recuperacin de metal (o rendimiento) en un proceso de fundicin. El histograma muestra la tendencia central, la dispersin y la forma general de la distribucin de los datos. Recuerde
que un histograma se construye dividiendo el eje horizontal en intervalos (generalmente de longitud
igual) y trazando un rectngulo sobre el intervalo j-simo con el rea del rectngulo proporcional a l1j , el
nmero de observaciones incluidas en ese intervalo.
El diagrama de caja (o diagrama de caja y bigotes) es una manera muy til de representar grficamente los datos. En un diagrama de caja se muestra el mnimo, el mximo, los cuartiles inferior y superior
(el percentil25 y el percentil 75, respectivamente) y la mediana (el percentil50) en una caja rectangular
alineada horizontal o verticalmente. La caja se extiende del cuartil inferior al cuartil superior y se traza
una lnea por la mediana que atraviesa la caja. Se trazan dos lneas (o bigotes) que se extienden de los extremos de la caja hasta (de manera tpica) los valores mnimo y mximo. (Existen diversas variantes de los
diagramas de caja que tienen reglas diferentes para denotar los puntos muestrales extremos. Ver Montgomery y Runger [83d] para ms detalles.)
En la figura 2-3 se muestran los diagramas de caja de las dos muestras de la fuerza de la tensin de
adhesin en el experimento del mortero de cemento portland. En esta representacin se revela con toda
claridad la diferencia en la fuerza promedio entre las dos formulaciones. Indica asimismo que ambas formulaciones producen distribuciones de la fuerza razonablemente simtricas con una variabilidad o dispersin similar.
Los diagramas de puntos, los histogramas y los diagramas de caja son tiles para resumir la informacin de una muestra de datos. Para describir con mayor detalle las observaciones que podran presentarse
en una muestra, se usa el concepto de distribucin de probabilidad.
Distribuciones de probabilidad
La estructura de la probabilidad de una variable aleatoria, por ejemplo y, se describe mediante su distribucin de probabilidad. Cuando y es discreta, es comn hacer referencia a su distribucin de probabili-
24
;-
E 18.4 1u
Cl
"
18 1-
-o
.;
w 17.6 -
.I::
"O
ro
"O
"
"
2l
17.2
16.8
'0
.;
.!!!
w 16.4 -
"O
ro
:J
16 -
1
I
Modificado
Sin modificar
Formulacin del mortero
LL
Figura 2-3 Diagramas de caja del experimeuto de la fuerza de la tensin de adhesin del cemento portland.
dad, por ejemplo p(y), como la funcin de probabilidad de y. Cuando y es continua, es comn hacer
referencia a su distribucin de probabilidad, por ejemplo f(y), como la funcin de densidad de probabilidad de y.
En la figura 2-4 se ilustran dos distribuciones de probabilidad hipotticas, una discreta y la otra continua. Observe que en la distribucin de probabilidad discreta es la altura de la funcin p(Yj) la que representa la probabilidad, mientras que en el caso continuo, es el rea bajo la curva f(y) asociada con un
L..----..LI~..L__.I__I_..I.-L-.L......L--'---LI__'_I_
Y1
Y3
Y2
Ya
Y4
Yg
Y7
Ya
Ya
Y11
Y10
Yj
Y13
Y12
Y14
b-----=--Y
b) Una distribucin continua
25
intervalo dado la que representa la probabilidad. Un resumen cuantitativo de las propiedades de las distribuciones de probabilidad sera el siguiente:
y discreta:
p(yJ=1
todos los
valores de y j
y continua:
0:5 f(Y)
P(a:5 y:5 b) = f: f(y)dy
f:",f(y)dy= 1
La media, ,t, de una distribucin de probabilidad es una medida de su tendencia central o localizacin.
Matemticamente, la media se define como
f:oo yf(y) dy
,t- { LYP(Y)
y continua
y discreta
(2-1)
toda y
La media tambin puede expresarse en trminos del valor esperado o valor promedio a la larga de la variable aleatoria y como
J:oo yf(y)dy
,t= E(y) =
{ LJYP(Y)
y continua
y discreta
(2-2)
toda y
(2-3)
Observe que la varianza puede expresarse exclusivamente en trminos del valor esperado debido a que
(2-4)
Por ltimo, el uso de la varianza es tan frecuente que resulta conveniente definir un operador de la varianza V tal que
V(y) = E[(y_,t)2] = 0 2
(2-5)
26
Los conceptos de valor esperado y varianza se usan constantemente a lo largo de este libro, y puede
ser til revisar varios resultados elementales relacionados con estos operadores. Si y es una variable aleatoria con media fl y varianza if y c es una constante, entonces
1.
2.
3.
4.
5.
6.
E(c) = c
E(y) = fl
E( cy) = cE(y) = cfl
V(c)= O _
V(y) = a 2
V(cy) = c 2V(y) = c 2a 2
a;, se tiene
7.
donde
(2-6)
es la covarianza de las variables aleatorias Y1 y Y2. La covarianza es una medida de la asociacin lineal entre Y1 y Y2" Ms especficamente, puede demostrarse que si Y1 y Y2 son independientes, 1 entonces
COV(y1' Y2) = O. Tambin puede demostrarse que
9.
2,3
El objetivo de la inferencia estadstica es sacar conclusiones acerca de una poblacin utilizando una
muestra de la misma. La mayora de los mtodos que se estudiarn aqu incluyen el supuesto de que se
Observe que el recproco no es necesariamente verdadero; es decir, puede tenerse Cov ',Y2) = OYno obstante esto no implica que
las variables sean independientes. Para un ejemplo, ver Hines y Montgomery ([55] pp. 128-129).