You are on page 1of 14

UNIVERSIDAD NACIONAL DE CAJAMARCA

Norte de la Universidad Peruana


FACULTAD DE INGENIERIA
ESTADSTICA APLICADA
ESTRATEGIA DE EXPERIMENTACIN
Los experimentos son parte natural en el proceso de la toma de decisiones en ingeniera y las
ciencias. Supngase, por ejemplo, que un ingeniero civil investiga los efectos de diferentes
mtodos de curado sobre la resistencia a la compresin media del concreto. El experimento
consistira en formar varios ejemplos de prueba de concreto utilizando cada uno de los mtodos de
curado propuestos para despus probar la resistencia a la compresin de cada ejemplar de
prueba. Los datos de este experimento podran usarse a fin de determinar qu mtodo de curado
deber usarse para conseguir la resistencia a la compresin media mxima.
Si slo hay dos mtodos de curado que sean de inters, este experimento podra disearse y
analizarse aplicando los mtodos para hiptesis estadsticas con dos muestras. Es decir, el
experimentador tiene un solo factor de inters (el mtodo de curado) y slo hay dos niveles del
factor.
Las tcnicas de diseo experimental basadas en la estadstica son particularmente tiles en el
campo de la ingeniera para mejorar el desempeo de un proceso de manufactura. Tiene tambin
diversas aplicaciones en el desarrollo de nuevos procesos. La mayora de los procesos pinfluencia
ueden describirse en trminos de varias variables controlables, como la temperatura, la presin y la
rapidez de alimentacin. Mediante el uso de experimentos diseados, los ingenierospueden
determinar el subconjunto de las variables del proceso que ejerce mayor influencia sobre el
desempeo del proceso . Los resultados de un experimento como ste pueden llevar a 1) El
mejoramiento del rendimiento del proceso, 2) La reduccin de la variabilidad del proceso y a una
concordancia ms prxima con los requerimientos nominales o proyectados.3) La reduccin del
tiempo de diseo y desarrollo. 4) La reduccin en el costo de operacin.

ANALISIS DE VARIANZA
El anlisis de la varianza (ANOVA, ANalysis Of VAriance, segn terminologa inglesa) es una
coleccin de modelos estadsticos y sus procedimientos asociados, en el cual la varianza est
particionada en ciertos componentes debidos a diferentes variables explicativas.
Las tcnicas iniciales del anlisis de varianza fueron desarrolladas por el estadstico y genetista R.
A. Fisher en los aos 1920 y 1930 y es algunas veces conocido como "Anova de Fisher" o "anlisis
de varianza de Fisher", debido al uso de la distribucin F de Fisher como parte del contraste de
hiptesis.
El anlisis de varianza se sigue para facilitar una prueba de hiptesis, mediante la cual la variacin
total presente en un conjunto de datos se particiona en varias componentes, algunas se atribuyen
a variables explicativas o factores y otra al azar (error inmerso en el modelo) de modo que en el
anlisis es posible averiguar la magnitud de las contribuciones de cada una de las fuentes a la
variacin total.
El anlisis de varianza tiene su aplicacin ms amplia en anlisis de los datos obtenidos a
partir de experimentos.
El anlisis de varianza se utiliza en dos fines:
Estimar y probar la hiptesis acerca de las varianzas de las poblaciones.
Estimar y probar la hiptesis acerca de las medias de las poblaciones.
El anlisis de varianza para los diversos diseos, sigue el siguiente procedimiento:
1. Modelo.- El modelo insistir de una representacin simblica de un
valor tpico tomado de los datos que se estn analizando.
2. Suposiciones.- Especificaciones que fundamentan el modelo.
3. Hiptesis.- Se indicarn las hiptesis que puedan probarse de acuerdo
al modelo se formular H0 y H1 .

UNIVERSIDAD NACIONAL DE CAJAMARCA


Norte de la Universidad Peruana
FACULTAD DE INGENIERIA
ESTADSTICA APLICADA
4. Clculos.- Se aplicarn los clculos aritmticos apropiados.
5. TABLA ANVA.- Los resultados de los clculos, se resumirn en una
tabla que permitir una estimacin rpida y conveniente de los resultados.
6. Decisin.- Se tomar una decisin estadstica para rechazar o no H0 .

I.

DISEO COMPLETAMENTE ALEATORIZADO (DCA)

Un diseo completamente aleatorizado (DCA), es el diseo en el cual las unidades son asignadas
completamente al azar a los tratamientos, o viceversa. Esto es un diseo que no supone
restricciones tales como bloqueo en la distribucin de los tratamientos a las unidades
experimentales.
Este diseo debe limitarse su uso a casos en los cuales se dispone de unidades
experimentales homogneas. Si no pueden obtenerse tales unidades, debe utilizarse algn
bloqueo para incrementar la eficiencia del diseo.
MODELO.
Suponga que se tiene K niveles de un solo factor que se desean comparar.
La respuesta observada a partir de cada uno de los K niveles o tratamientos es una
variable aleatoria. Los datos aparecen en la tabla. Yij representa la i_sima
observacin tomada bajo el tratamiento j.
Es posible describir las observaciones de la tabla mediante el modelo estadstico lineal.

Yij = u + j +

i j

i = 1, 2, ... , n
j = 1, 2, ... , k

; modelo efectos fijos

Donde : yi j : ij-sima observacin.


: efecto medio verdadero; parmetro comn a todos TT 0S.
j : efecto del j-simo tratamiento.
i j : incluye los efectos de todos los otros factores extraos
Representacin simblica de los datos en un D.C.A

OBSERVACIONES

TOTAL
Medias
VARIANZAS

1
y11
y21
.
.
.
yn1

TRATAMIENTOS
2
. . .
K
y12
. . .
y1k
y22
. . .
y2k
.
.
.
.
.
.
yn2
. . .
ynk

T.1

T.2

.1

.2

2
.1

. . .

. . .

T.k
.k
2

S .2
. . .
S .k
. j = T. j / n j media del j-simo TT0 .

UNIVERSIDAD NACIONAL DE CAJAMARCA


Norte de la Universidad Peruana
FACULTAD DE INGENIERIA
ESTADSTICA APLICADA
4.

Suposiciones.
El modelo a efectos fijos implica que se est interesado solo en k poblaciones representados
por los datos de la muestra. Cualquier inferencia que pueda hacerse se aplica solo a estas
poblaciones.

Suposiciones para el modelo de efectos fijos :


a) Los k conjuntos de datos observados constituyen k muestras aleatorias independientes de las
poblaciones respectivas.
b) Cada una de las poblaciones de las cuales proviene las muestras est distribuida
2
normalmente con media j y varianza j .
2
2
2
c) Las k poblaciones tienen la misma varianza : 1 =
2 = . . . =
k
2
d). Los i j
DNI (0, ).
HIPOTESIS.
Puede probarse la hiptesis:
H0 : 1= 2= . . . = k
H1 : No todas las u j son iguales
Si las medias de las poblaciones son iguales, cada efecto del tratamiento es igual a cero, de
modo que alternativamente la hiptesis puede enunciarse como:
H0 :j = 0; J=1, 2, . . . k
HA : no todas las j =0
Se elige el nivel de significacin :
2

...

2
k

Si H0 es verdadero y si 1 = 2 =
=
situacin se observa como fig. 1
2
2
...
2
1= 2= = k

Fig: 1

y las poblaciones tienen una distribucin normal; la

1=2= . . . =k

Si H0 es falso pueda serlo debido a que una de las medias de las poblaciones difiere del resto que
son iguales entre si, o bien puede ocurrir que todas las medias poblacionales sean diferentes. Es
decir al menos una de las j para cualquier valor de j=1,,k ; sea diferente del resto
4. CALCULOS.
Se Desarrollar el anlisis de varianza para el modelo de efectos fijos, clasificacin en un sentido,
aqui:
k

Particin de la suma de cuadrados:


k

SCT =

(y
j 1

i 1

ij

y )

nj

T2
y

N
j
1
k

nj

2
ij

UNIVERSIDAD NACIONAL DE CAJAMARCA


Norte de la Universidad Peruana
FACULTAD DE INGENIERIA
ESTADSTICA APLICADA
Pero
nj

( y

SCT =

j 1 1

y j y j y ) 2

ij

Si se agrupa trminos y se desarrolla, se tendr :


nj

SCT=

( y
j 1 1

y j )

ij

nj

( y

j 1 1

SCE

y ) 2

SCTR

(Suma de cuadrados dentro)

(Suma de cuadrados entre)

(Suma de cuadrados del Error)

(Suma de cuadrados de tratamientos)

nj

SCE =

( y
j 1 1

Donde:

nj

j 1 1

(T j ) 2

j 1

nj

SCTR =

( y

SCTR =

y j )

ij

nj

M YY =

y )
T2

(T j ) 2

j 1

nj

(T j ) 2

j 1

nj

(T j ) 2

j 1

nj

2
ij

E yy

T2

TYY
N

M YY

T2
N
nj

SCE = SCT SCTR =

y
j

2
ij

- MYY - TYY

5. TABLA: ANALISIS DE VARIANZA PARA UN DISEO C.A.


Fuente de
variacin
Entre
Tratamientos
Dentro de
tratamiento
(Error)
Total

Suma de cuadrados

SCTR =
k

SCE=

2
.J /n

nj

-T.. /N
k

(T j ) 2

j 1

nj

y
2
ij

1
2

SCT=yij T.. /N

Grados
de
libertad
k-1

N-K

N-1

Media de cuadrados

CMTR = SCTR/(k-1)

CME = SCE/(N-K)

F0

F0 = CMTR/CME

UNIVERSIDAD NACIONAL DE CAJAMARCA


Norte de la Universidad Peruana
FACULTAD DE INGENIERIA
ESTADSTICA APLICADA
6. DECISION.
La decisin de realizar o no H0 se toma definiendo la regin crtica (RC)
f(F)

RRH0

RAH0

, k-1, N-k

Se rechaza Ho si F> F

, k-1, N-k

Ejemplo 1: Un ingeniero desea mejorar la resistencia a la compresin del concreto. Sospecha que
la resistencia es una funcin de la concentracin de la concentracin de un aditivo. Decide
investigar con distintas concentraciones:
5, 10, 15, 20 y 25 %.
Han de tomarse cinco
observaciones para cada concentracin de aditivo, empleando una planta piloto.
Las 25
observaciones necesarias se realizan en forma aleatoria, y los datos obtenidos se muestran en la
tabla.
2

Tabla 1.1: Resistencia a la compresin del concreto (PSI = lib/pulg )

5%
7
7
15
11
9
49
5
9.8

TOTALES(Ti)
Numero de observaciones
Medias(i)

TRATAMIENTOS
Concentracin del aditivo
10%
15%
20%
12
14
19
17
18
25
12
18
22
18
19
19
18
19
23
77
88
108
5
5
5
15.4
17.6
21.6

TOTAL
25%
7
10
11
15
11
54
5
10.8

376
25
15.04

Donde: Totales = T = Ti
Numero de observaciones = n
= T/ n

qu conclusiones se puede extraer con = 0,05?


SOLUCION EJEMPLO 1

1.

Modelo:

yij = +

+ ij

(modelo a efectos fijos o de clasificacin en un solo sentido)

2. Suposiciones:
Se tiene 5 muestras independientes
2
Cada provisin N(j , j).
2
2
2
2
Poblaciones con variaciones homogneas: 1 = 2 = ... = 5 =
2
j = 0 y ij
DNI(O, )

UNIVERSIDAD NACIONAL DE CAJAMARCA


Norte de la Universidad Peruana
FACULTAD DE INGENIERIA
ESTADSTICA APLICADA
3. Hiptesis:
H0 : 1 = 2 = = 5
H1 : No todas las 5 son iguales
4. Nivel de significacin: = 0.05
5. Prueba estadstica: usamos la siguiente estadstica de prueba.

F0 =

Tyy
(suma de cuadrados entre tratamientos)
-------- ----------------------------------------------------------- = F0.05,4,20
Eyy
(suma de cuadrados del error experimental)

6. Regla de decisin:
Si Fc > F,(k - 1),(n - k)
H0 se rechaza a un nivel de
Si Fc F,(k - 1),(n - k)
H0 no se rechaza.
7. Clculos: se realizan los clculos para obtener las estimaciones en la tabla ANOVA; es decir:
El ANOVA resultante se muestra en la siguiente tabla:
Tabla : anlisis de resistencia para los datos de resistencia a la tensin.
Fuente de
variacin

Suma de
cuadrados

Grados de
libertad

Cuadrados
medios

Tratamientos
Error experi.
total

475.76
161.20
636.96

4
20
24

118.94
8.06
---------

Cuadrado
medio
esperado
14.76

F0
0.00001

De la tabla se deduce que


F0.05,4,20 = 2.86 y F0 = 14.76
Entonces H0 se rechaza al nivel de 0.05
Se concluye que la concentracin del aditivo influye de manera significativa en la
resistencia a la compresin del concreto.
INGRESAMOS LOS DATOS A MINITAB V 17

UNIVERSIDAD NACIONAL DE CAJAMARCA


Norte de la Universidad Peruana
FACULTAD DE INGENIERIA
ESTADSTICA APLICADA

En Option: indicar el Nivel


de Confianza

RESULTADOS

En
Comparisons
indicar los
mtodos de
comparacin
mltiples de
Tukey y Fisher

CONCLUSIONES
Como p value = 0.000< 0.05, Se
Rechaza H0 y Se concluye que la
concentracin del aditivo influye de
manera
significativa
en
la
resistencia a la compresin del
concreto.

INTERVALOS DE CONFIANZA AL 95% DE LAS RESISTENCIAS A LA COMPRENSIN SEGN


CONCENTRACIONES DE ADITIVOS

COMPARACIONES MULTIPLES

Mediante el anlisis de comparacin mltiple de los mtodos de Tukey y Fisher, se llega a la


conclusin que la concentracin del aditivo, que genera la mayor Resistencia promedio a la
compresin es la del 20%.

UNIVERSIDAD NACIONAL DE CAJAMARCA


Norte de la Universidad Peruana
FACULTAD DE INGENIERIA
ESTADSTICA APLICADA
ANLISIS EXPLORATORIO - GRAFICOS DE BOX PLOTS (GRAFICO DE CAJAS Y BIGOTES)

Boxplot of Resistencia
25

4
20

Resistencia

15

10

5
5.00%

10.00%

15.00%

20.00%

25.00%

Concentracin

Aqu podemos apreciar que en el tratamiento 1(Concentracin de aditivo al 5%) y tratamiento 2


(Concentracin de aditivo al 10%) existe mayor variabilidad o dispersin en sus datos y en el
tratamiento 3 (Concentracin de aditivo al 15%) de forma contraria existe una menor
variabilidad o dispersin. Tambin se logra con la observacin determinar que el tratamiento
con mayor resistencia a la compresin es el tratamiento 4 (Concentracin de aditivo al 20%) y el
tratamiento con menor resistencia es el tratamiento 1 (Concentracin de aditivo al 5%). Esto
qued confirmado con el anlisis del Diseo completo al Azar.
Ejemplo 2: Los datos del experimento corresponden a la Resistencia a la tensin de fajas
utilizadas en poleas para trabajos de construccin, cuando se han utilizado los porcentajes de
algodn indicados en la tabla.
Porcentaje de
algodn

Resistencia a la Tensin
1

15
5
8
15
20
12
17
12
25
17
18
18
30
19
25
22
35
7
10
11
FUENTE: Diseo y Anlisis de Experimentos de Montgomery

11
18
19
19
15

9
18
19
23
11

UNIVERSIDAD NACIONAL DE CAJAMARCA


Norte de la Universidad Peruana
FACULTAD DE INGENIERIA
ESTADSTICA APLICADA
a) Cul es el objetivo del anlisis de los datos de este experimento?
b) Cul es el diseo experimental que se emplear en este caso?Cul es el modelo
estadstico que le corresponde a dicho diseo? Bajo que supuestos?. Enumrelos
c) Cul es el anlisis estadstico que le corresponde a estos datos ?
d) Realice el anlisis correspondiente
e) Previo al anlisis ejecutado Qu hubiera sido preciso realizar? Hgalo
f) Cul es el aporte en el anlisis de datos, lo ejecutado en e)?.

SOLUCION EJEMPLO 2
a) Cul es el objetivo del anlisis de los datos de este experimento?
El objetivo es saber Cmo influye el porcentaje de algodn en la Resistencia a la
tensin de las fajas?.
b) Cul es el diseo experimental que se emplear en este caso?Cul es el
modelo estadstico que le corresponde a dicho diseo? Bajo que supuestos?.
Enumrelos
El diseo experimental a emplear es el Diseo Completamente Aleatorizado, al cual le
corresponde el siguiente modelo:

Yij = u + j + ei j ;

i = 1, 2, ... , n
j = 1, 2, ... , k

; modelo a efectos fijos

Donde :

: Es una constante e indica el efecto medio verdadero; parmetro comn a todos TT 0S.

: Es el efecto diferencial del nivel. Recoge la importancia de cada tratamiento.y es el


objetivo del anlisis.

ei j : incluye los efectos de todos los otros factores extraos. Es un trmino de error ,
considerado como variable aleatoria
Puede probarse la hiptesis:
H0 : 1=2= . . . =k
H1 : No todas las j son iguales
Si las medias de las poblaciones son iguales, cada efecto del tratamiento es igual a
cero, de modo que alternativamente la hiptesis puede enunciarse como:

H0 : j = 0;
H1 : j
0

j=1, 2, . . . k

Se elige el nivel de significacin


:
Todo esto bajo los supuestos de que:
1) El Modelo es Lineal
2) El Modelo es Aditivo
2
3) Los ei j N (0, I ).

UNIVERSIDAD NACIONAL DE CAJAMARCA


Norte de la Universidad Peruana
FACULTAD DE INGENIERIA
ESTADSTICA APLICADA
c) Cul es el anlisis estadstico que le corresponde a estos datos ?
Se desarrollar el Anlisis de Varianza para el modelo de efectos fijos
d) Realice el anlisis correspondiente
Con ayuda del paquete estadstico MINITAB 17. realizamos el Anlisis correspondiente
H0 : j = 0;
H1 : j

( el efecto de los tratamientos son nulos)


0

( efecto de los tratamientos son diferentes)

Nivel de significacin = 0,05

Indicar la variable
respuesta que es la
Resistencia a la
tensin y el Factor o
variable respuesta
es el % de
Algodn.
En
Comparisons
indicar los
mtodos de
comparacin
mltiples de
Tukey y Fisher

En Option: indicar el Nivel


de Confianza

RESULTADOS

CONCLUSIONES
Como p value = 0.000< 0.05, Se
Rechaza H0 y Se concluye que el
porcentaje de algodn influye de
manera
significativa
en
la
resistencia a la tensin de las fajas.

10

UNIVERSIDAD NACIONAL DE CAJAMARCA


Norte de la Universidad Peruana
FACULTAD DE INGENIERIA
ESTADSTICA APLICADA
COMPARACIONES MULTIPLES

Mediante el anlisis de comparacin mltiple de los mtodos de Tukey y Fisher, se llega a la


conclusin que el porcentaje de Algodn, que genera la mayor Resistencia promedio a la tensin
es del 30%.
e) Previo al anlisis ejecutado Qu hubiera sido preciso realizar? Hgalo
Hubiera sido preciso realizar un Anlisis exploratorio de Datos que nos permitiera como actividad principal
revisarlos para saber como es su comportamiento y as poder asignarle un modelo adecuado.
Boxplot of Resistencia Tensin

Resistencia Tensin

25

20

15

10

5
15.00%

20.00%

25.00%

30.00%

35.00%

% de algodn

f)

Cul es el aporte en el anlisis de datos, lo ejecutado en e)?.


1) Mediante las representaciones visuales es fcil descubrir el modo de
comportarse de los datos.
2) Este mtodo requiere que la atencin del analista se centre en los residuales o
lo que queda despus de haber aplicado algn tipo de anlisis.
3) Mediantes transformaciones matmaticas simples, como por ejemplo, el
logaritmo y la raz cuadrada , los anlisis no solo se simplifican sino que
adquieren una mejor claridad.

4) El carcter resistente, propio de estos mtodos, garantizan el hecho de que los


valores de datos extraos o poco corrientes no influyan indebidamente los
resultados de un anlisis.

11

UNIVERSIDAD NACIONAL DE CAJAMARCA


Norte de la Universidad Peruana
FACULTAD DE INGENIERIA
ESTADSTICA APLICADA

II. DISEO DE BLOQUES COMPLETOS ALEATORIOS

Ademas de probar el efecto de los Bloques

Tabla 1: Anlisis de varianza de un diseo de Bloques completos Aleatorios

Fuente de
Variacin

Suma de
Cuadrados

Grados de
Libertad

12

Cuadrado Medio

F0

UNIVERSIDAD NACIONAL DE CAJAMARCA


Norte de la Universidad Peruana
FACULTAD DE INGENIERIA
ESTADSTICA APLICADA

Ejemplo 3:
Se realiz un experimento para determinar el efecto de cuatro sustancias qumicas diferentes
sobre la resistencia de un material. Estas sustancias qumicas se usan como parte del proceso de
acabado del planchado permanente. Se seleccionaron cinco tipos de material, y se corri un
diseo de bloques completos aleatorizados para probar cada tipo de sustancia qumica sobre cada
tipo de material de forma aleatoria. Se muestran a continuacin los datos, lo que se desea probar
es las diferencias de las medias utilizando el anlisis de varianza con =0.01.
Tabla 1: Datos de la Resistencia del material: Diseo de Bloques completos Aleatorios
Tipo de
Sustancia
qumica

1.3

1.6

0.5

1.2

1.1

2.2

2.4

0.4

2.0

1.8

1.8

1.7

0.6

1.5

1.3

3.9

4.4

2.0

4.1

3.4

Tipo de Material

Las hiptesis a probar son:


I) Con respecto a tratamientos (Tipo de Sustancia Qumica)
(El tipo de sustancia qumica NO influye de manera altamente significativa en la resistencia del
material)
(Al menos un tipo de sustancia qumica influye de manera altamente significativa en la resistencia
del material)

II) Con respecto a Bloques (Tipo de Material)

(El tipo de material NO influye de manera altamente significativa en la resistencia del


material)
(Al menos un tipo de material influye de manera altamente significativa en la resistencia del
material)

Ingresando los datos en MINITAB V. 17.

13

UNIVERSIDAD NACIONAL DE CAJAMARCA


Norte de la Universidad Peruana
FACULTAD DE INGENIERIA
ESTADSTICA APLICADA

RESULTADOS
I)

Como p value para el Tipo de Sustancia


Qumica = 0.000< 0.01, Se Rechaza H0 y
Se concluye que al menos un Tipo de
sustancia qumica influye de manera
altamente significativa en la resistencia
del material.

II) Como p value para el Tipo de Material=


0.000 < 0.01, Se Rechaza H0 y Se
concluye que al menos un Tipo de
material, influye de manera altamente
significativa en la resistencia del material.

III.

DISEO CUADRADO LATINO

El agrupamiento de las unidades experimentales en dos direcciones (filas y columnas) y la


asignacin de los tratamientos al azar en las unidades, de tal forma que en cada fila y en cada
columna se encuentren todos los tratamientos constituye un diseo cuadrado latino.
Caractersticas:
1. Las unidades experimentales se distribuyen en grupos, bajo dos criterios de homogeneidad
dentro de la fila y dentro de la columna y heterogeneidad en otra forma.
2. En cada fila y en cada columna, el nmero de unidades es igual al nmero de tratamientos.
3. Los tratamientos son asignados al azar en las unidades experimentales dentro de cada fila
y dentro de cada columna.
4. El nmero de filas = nmero de columnas = nmero de tratamientos.
5. Los anlisis estadsticos T-student, Duncan, Tuckey y en pruebas de contraste se procede
como el diseo completo al azar y el diseo de bloques. La desviacin estandar de la
diferencia de promedios y la desviacin estandar del promedio, estn en funcin del
cuadrado medio del error experimental.
El nombre de cuadrado Latino se debe a R.A. Fisher [The Arrangement of Field Experiments, J.
Ministry Agric., 33: 503-513 (1926)]. Las primeras Aplicaciones fueron en el campo agronmico,
especialmente en los casos de suelos con tendencias en fertilidad en dos direcciones.

14