Sie sind auf Seite 1von 37

y Analisis

Metodos
de Diseno
de
Experimentos
Patricia Isabel Romero Mares
Departamento de Probabilidad y Estadstica
IIMAS UNAM

abril 2013

1 / 37

Experimentos con factores aleatorios

2 / 37


Introduccion

Hasta ahora hemos supuesto que los factores de un


experimento son factores fijos, esto es, los niveles de los
factores usados en el experimento son los niveles especficos
Esto implica que las inferencias estadsticas que se
de interes.
limitadas a estos niveles
hagan sobre estos factores estan
especficos estudiados.
En algunas situaciones experimentales, los niveles de un factor
grande de posibles
se seleccionan al azar de una poblacion
niveles, y el investigador quiere tener conclusiones acerca de
de niveles, no solamente de los usados en el
toda la poblacion
experimento.
se dice que el factor es aleatorio.
En esta situacion

3 / 37


Introduccion

Para el caso de un solo factor, el modelo estadstico lineal es:


yij = + i + ij
i = 1, . . . , a j = 1, . . . , n
donde es la media general, i son los efectos aleatorios del
factor, ij es el error aleatorio. Se supone que i y ij son
independientes y que se distribuyen:
ij N(0, 2 )
i N(0, 2 )
es:
La varianza de cualquier observacion
V(yij ) = 2 + 2
2 y 2 se llaman componentes de varianza y el modelo se
llama modelo de efectos aleatorios o de componentes de
varianza.
4 / 37


Introduccion

Ahora lo que nos interesa es probar hipotesis


acerca de la
2
componente de varianza .
H0 : 2 = 0 tratamientos iguales
H1 : 2 > 0 variabilidad entre tratamientos
2

Na
donde N = na, y bajo la hipotesis
nula
Se tiene que SSE
2
SStrat
2
a1 , entonces, bajo H0 :
2

Fc =

SStrat /a 1 CMtrat
=
Fa1,Na
SSE/N a
CME

5 / 37

Tabla de ANOVA

F.V.
Factor A
Error
Total

g.l.
a1
N t
N 1

SS
SSA
SSE
SStot

CM
CMA
CME

Fc
CMA /CME

E(CM)
2 + n2
2

Bajo H0 , CMA = CME = 2 .


Si H0 no es cierta, CMA > CME, por lo tanto rechazamos H0
para valores grandes de Fc , es decir, rechazamos H0 si

Fc > Fa1,Na
.

6 / 37

Componentes de varianza

Interesa estimar los componentes de varianza (2 , 2 ) en el


modelo.
Existen varios procedimientos, el que veremos se llama

metodo
de analisis
de varianza o de momentos, ya que usa
de la tabla de ANOVA.
la informacion

El metodo
consiste en igualar la esperanza de cuadrados
medios a sus valores observados.
CMtrat = 2 + n2
CME = 2
por lo tanto
2 = CME
CMtrat CME
2 =
n
7 / 37

Componentes de varianza

El metodo
de analisis
de varianza para estimar los
componentes de varianza es relativamente sencillo y bueno
cuando se tienen experimentos balanceados.

A veces este metodo


de estimar las componentes de varianza
da estimaciones negativas.
Algunos autores dicen que es evidencia de que la componente
es cero, aunque otros dicen que puede ser evidencia de que el
modelo es incorrecto.

reciente y que tiene buenos resultados es el


Un metodo
mas

de maxima
verosimilitud restringida, REML (este
es el metodo
recomendado en JMP).

8 / 37

Ejemplo

Una fabrica
textil produce un tipo de tela en un numero
grande

de telares. Se desea obtener una tela de resistencia uniforme.


de la variacion

El ingeniero a cargo sospecha que ademas


usual en resistencia de muestras de tela del mismo telar, puede
haber variaciones en resistencia entre diferentes telares.
Para investigar esto, selecciona al azar 4 telares y hace 4
determinaciones de resistencia en la tela producida por cada
telar. El experimento se corre en orden aleatorio.
Telar
1
2
3
4

Resistencia
98, 97, 99, 96
91, 90, 93, 92
96, 95, 97, 95
95, 96, 99, 98

ej12-1.jmp
9 / 37

Ejemplo

F.V.
Telar
Error
Total
Componente
Telar
Error
Total

g.l.
3
12
15

SS
89.19
22.75
111.94

CM
29.73
1.89

F
15.68**

Componente de varianza
estimado
6.96
1.89
8.85

E(CM)
2 + 4T2
2

% del total
78.59
21.41
100.00

La mayor parte de la variabilidad se debe a diferencias entre


telares. Si el ingeniero logra disminuir la variabilidad entre
de telas sera mas
homogenea.

telares la produccion
10 / 37

factorial con dos factores aleatorios


Diseno

Suponga que se tienen los factores A y B y que ambos tienen

un numero
grande de niveles que son de interes.

Seleccionamos aleatoriamente a niveles de A y b niveles de B


factorial. Si el
y arreglamos estos niveles en un diseno
experimento se replica n veces, entonces el modelo lineal es:
yijk = + i + j + ( )ij + ijk
i = 1, . . . , a j = 1, . . . , b k = 1, . . . , n
donde i , j , ( )ij , ijk son variables aleatorias independientes.
Tambien suponemos que:
i N(0, 2 )
j N(0, 2 )
2
( )ij N(0,
)

ijk N(0, 2 )
11 / 37

factorial con dos factores aleatorios


Diseno

es:
Por lo tanto, la varianza de cualquier observacion
2
V(yijk ) = 2 + 2 +
+2

Nos interesa probar las hipotesis:


H01 : 2 = 0
H02 : 2 = 0
2
H03 :

= 0

Las sumas de cuadrados se calculan igual que con efectos


fijos.

12 / 37

factorial con dos factores aleatorios


Diseno

Para formar las estadsticas de prueba, debemos examinar la


esperanza de cuadrados medios.
Se puede demostrar que:
2
E(CMA ) = 2 + n
+ bn2
2
E(CMB ) = 2 + n
+ an2
2
E(CMAB ) = 2 + n

E(CME) = 2

13 / 37

factorial con dos factores aleatorios


Diseno

Las estadsticas F para probar las hipotesis


anteriores se
calculan de la siguiente manera:

2
H01 :
= 0 Fc =

CMAB
CME

H02 : 2 = 0 Fc =

CMA
CMAB

H03 : 2 = 0 Fc =

CMB
CMAB

14 / 37

factorial con dos factores aleatorios


Diseno

Los componentes de varianza se pueden estimar por el

metodo
de analisis
de varianza, igualando los cuadrados
medios observados a sus respectivos valores esperados y
resolviendo las ecuaciones, quedando:

2 = CME
=

CMAB CME
n

2 =

CMB CMAB
an

2 =

CMA CMAB
bn

15 / 37

Ejemplo con dos factores aleatorios

del funcionamiento de
(Ejemplo 7.1 Kuehl) Evaluacion

maquinas
con componentes de varianza.

Se esta desarrollando un nuevo espectrofotometro


para uso en
laboratorios clnicos. Se quiere evaluar el funcionamiento de

las maquinas
de la lnea de produccion.

Pregunta de investigacion:
Un componente crtico del funcionamiento de un instrumento
es la consistencia de las mediciones de un da a otro entre las

maquinas.
Se quiere saber si la variabilidad de las mediciones

dentro
entre las maquinas
operadas durante varios das estan

de los estandares
aceptables para aplicaciones clnicas.
Estructura de tratamientos:
factorial con maquinas

Se construye un diseno
y das como
probadas 4 maquinas

factores. Seran
en 4 diferentes das en
un arreglo 4 4.
16 / 37

Ejemplo con dos factores aleatorios

experimental:
Diseno

Se seleccionan aleatoriamente 4 maquinas.


Se preparan cada
da 8 replicaciones de muestras de suero en sangre con el
mismo lote de reactivos. Dos muestras de suero se asignan

aleatoriamente a cada una de las cuatro maquinas


en cada
completamente al azar con
uno de los 4 das para un diseno

dos repeticiones de cada tratamiento. El mismo tecnico

prepara las muestras de suero y opera las maquinas


durante

todo el experimento. Se miden los niveles de trigliceridos


(mg/dl) en las muestras de suero.

17 / 37

Ejemplo con dos factores aleatorios

Maquina
Da
1
2
3
4

1
142.3,144.0
134.9, 146.3
148.6, 156.5
152.0, 151.4

2
148.6, 146.9
145.2, 146.3
148.6, 153.1
149.7, 152.0

3
142.9, 147.4
125.9, 127.6
135.5, 138.9
142.9, 142.3

4
133.8, 133.2
108.9, 107.5
132.1, 149.7
141.7, 141.2

Las maquinas
son un factor aleatorio porque representan una
potencial de maquinas

muestra aleatoria de una poblacion


a
construir, y los das son una muestra aleatoria de una
de das en los cuales se usaran
las maquinas.

poblacion
El
de la interaccion
entre
arreglo factorial permite la evaluacion

maquinas
y das. La consistencia del funcionamiento de las

maquinas
se evidenca por la ausencia de interaccion.
ej7 1 kuehl.jmp
18 / 37

Ejemplo con dos factores aleatorios

F.V.
Da

Maquina

Interaccion
Error

g.l.
3
3
9
16

SS
1334.46
1647.28
786.04
286.33

CM
444.82
549.09
87.34
17.90

Fc
5.09*
6.29*
4.88**

E(CM)
2 + 8 2
2 + 2dm
d
2 + 8 2
2 + 2dm
m
2
2 + 2dm
2

2 = CME = 17.90
CMdm CME
2
dm
=
= 34.72
n
CMm CMdm
m2 =
= 57.72
na
CMd CMdm
d2 =
= 44.69
nb

19 / 37

Ejemplo con dos factores aleatorios

Componente
Da

Maquina

Da x Maquina
Error
Total

Estimador
44.69
57.72
34.72
17.90
155.02

% del total
28.825
37.23
22.398
11.544
100

es:
La varianza estimada de una observacion
2
y2 = 2 + d2 + m2 + dm
= 155.02

20 / 37

Ejemplo con dos factores aleatorios

Interpretacion:
Cada uno de los componentes de varianza contribuye
de las mediciones.
significativamente a la variacion
en la
El componente del error 2 = 17.9 representa la variacion
de las muestra de suero en sangre.
preparacion
en el

El componente de maquinas
m2 = 57.7, es la variacion

funcionamiento de las maquinas.


El componente de das d2 = 44.7, es la variabilidad asociada

con un nuevo inicio utilizando nuevos reactivos para el analisis


de las muestras y otras fuentes de variabilidad que pueden
asociarse a las diferencias operacionales entre los das.

21 / 37

Ejemplo con dos factores aleatorios

2 = 34.7 implica que el


dm
El componente de la interaccion

funcionamiento de las maquinas


no vara consistentemente
de los das. Una posible
con los cambios de operacion
es que exista una inconsistencia en la calibracion

explicacion

de las maquinas
a lo largo de los das.

El investigador, basado en su experiencia, debe ser capaz de


decidir si alguna de las fuentes de variabilidad anteriores
excede un nivel aceptable y corregir, si es necesario, cualquier

deficiencia en las maquinas


o en las condiciones de operacion

22 / 37

Tres factores aleatorios

F.V.
A
B
C
AB
AC
BC
ABC
Error

g.l.
a1
b1
c1
(a 1)(b 1)
(a 1)(c 1)
(b 1)(c 1)
(a 1)(b 1)(c 1)
abc(r 1)

E(CM)
2 + rc 2 + rb 2 + rbc 2
2 + rabc
ac
a
ab
2 + rc 2 + ra 2 + rac 2
2 + rabc
b
bc
ab
2 + rb 2 + ra 2 + rab 2
2 + rabc
c
ac
bc
2
2
2
+ rabc + rcab
2 + rb 2
2 + rabc
ac
2
2
2
+ rabc + rabc
2
2 + rabc
2

23 / 37

Tres factores aleatorios

Las estadsticas F se construyen de la siguiente manera:

ABC :

CMABC
CME

AB :

CMAB
CMABC

AC :

CMAC
CMABC

BC :

CMBC
CMABC

24 / 37

Tres factores aleatorios

Para probar los tres efectos principales (A,B y C) es necesario


construir un cuadrado medio para el denominador de las
pruebas F.
Existen pruebas F aproximadas utilizando el procedimiento de
lineal de los
Satterthwaite, donde se calcula una combinacion
cuadrados medios y sus correspondientes grados de libertad.
lineal M, donde
Dada una funcion
M = a1 (CM1 ) + a2 (CM2 ) + . . . + ak (CMk )
y CM1 , CM2 , . . . , CMk son cuadrados medios con gl 1 , 2 , . . . , k
respectivamente, los grados de libertad para M son
aproximadamente
M2
=
(a (CM ))2
ki=1 i i i
25 / 37

Tres factores aleatorios

Para probar la hipotesis


H0 : A2 = 0 se puede construir la
lineal
combinacion
M = CMAB + CMAC CMABC
entonces la prueba queda como:
CMA
M
Calculando los grados de libertad para el denominador con el
procedimiento de Satterthwaite.

26 / 37

Tres factores aleatorios

Es posible construir un Cuadrado Medio negativo cuando en la


lineal algunos de los cuadrados medios tienen
combinacion
coeficientes negativos.
para probar la
Para salvar esta dificultad, otra aproximacion
2

hipotesis
H0 : A = 0 es hacer
M1 = CMA + CMABC
M2 = CMAB + CMAC
con gl calculados con el procedimiento de
Satterthwaite,entonces la prueba queda como:
M1
.
M2
Lo mismo se hara para los otros efectos principales (B y C).
27 / 37

Efectos anidados

28 / 37

Efectos anidados

En algunos experimentos factoriales los niveles de un factor

(digamos, B) son similares pero no identicos


para diferentes
niveles de otro factor (A).
anidado o jerarquico

Este arreglo se llama diseno


y se dice
que B esta anidado en A.
anidados son aleatorios.
Generalmente los factores que estan
a compra su materia prima a tres
Por ejemplo, una compan
a desea determinar si la
diferentes proveedores. La compan
pureza de la materia prima es la misma en cada proveedor.
Se seleccionan cuatro lotes de materia prima de cada
tres determinaciones de pureza en
proveedor y se tomaran
cada lote.

29 / 37

Ejemplo

30 / 37

Ejemplo

anidado de 2 etapas, con lote anidado en


Este es un diseno
anidada en lote.
proveedor, y observacion
Por que no son dos factores cruzados? Porque el lote 1
debera referirse a una caracterstica particular del mismo lote,
equivalentemente para los otros lotes.
En el ejemplo, los lotes de cada proveedor son unicos

para el
proveedor particular.
Esto es, el lote 1 del proveedor 1 no tiene nada que ver con el
lote 1 de los otros proveedores, es solamente una etiqueta.

31 / 37

Efectos anidados

anidados de dos etapas


El modelo estadstico para los disenos
es:
yijk = + i + j(i) + k(ij)
i = 1, . . . , a j = 1, . . . , b k = 1, . . . , n
a niveles del factor A
b niveles del factor B anidados en cada nivel del factor A
n repeticiones

Es conveniente pensar en las repeticiones como que estan


de niveles de A y B.
anidadas en la combinacion
anidado balanceado, ya que hay igual
Este es un diseno
numero
de niveles de B dentro de cada nivel de A e igual

numero
de repeticiones.

Ya que todos los niveles de B no aparecen con todos los


entre A y B.
niveles de A entonces no puede haber interaccion
32 / 37

Efectos anidados

F.V.
A
B(A)
Error
Total

g.l.
a1
a(b 1)
ab(n 1)
abn 1

SSA =
SSB(A) =

1 a b 2
1 a 2
yij.

yi..
n i=1 j=1
bn i=1
b

y2ijk n y2ij.

i=1 j=1 k=1


a

SSTot =

CM
CMA
CMB(A)
CME

1 a 2
y2...
y

i.. abn
bn i=1

SSE =

SS
SSA
SSB(A)
SSE
SSTot

i=1 j=1

y2...

y2ijk abn

i=1 j=1 k=1

33 / 37

Efectos anidados

E(CM)

A fijo
B fijo

A fijo
B aleatorio

A aleatorio
B aleatorio

E(CMA )

2 + bnA2

2 + nB2 + bnA2

2 + nB2 + bnA2

E(CMB(A) )

2 + nB2

2 + nB2

2 + nB2

E(CME)

34 / 37

Ejemplo

1
Lote

1
1
-1
0

2
-2
-3
-4

3
-2
0
1

4
1
4
0

Proveedor
2
1 2 3
1 0 -1
-2 4 0
-3 2 -2

3
4
0
3
2

1
2
4
0

2
-2
0
2

3
1
-1
2

4
3
2
1

Los lotes se toman al azar de cada proveedor.


Proveedor es fijo y lote aleatorio.
anidado.jmp

35 / 37

Ejemplo

F.V.
Proveedor
Lote(Proveedor)
Error
Total

g.l.
2
9
24
35

SS
15.06
69.92
63.33
148.31

CM
7.53
7.77
2.64

E(CM)
2 + 3B2 + 12A2
2 + 3B2
2

F
0.97
2.94*

No hay efecto significativo del proveedor en la pureza del


material.
La pureza de los lotes de materia prima del mismo proveedor
difieren significativamente, por lo tanto, hay que trabajar con los
proveedores para que reduzcan su variabilidad de lote a lote.
Las estimaciones de los componentes de varianza son:
Componente
Lote(proveedor)
Error
Total

Estimacion
1.7099
2.6389
4.3488

% del total
39.32
60.68
100.00
36 / 37

Ejemplo

Que pasa si ignoramos que hay diferentes lotes y


consideramos las 12 observaciones de cada proveedor como
repeticiones?
F.V.
Proveedor
Error
Total

g.l.
2
33
35

SS
15.06
133.25
148.31

CM
7.53
4.038

F
1.864

p-value
0.171

No hay diferencia en proveedores.

Sin embargo, en este analisis


estamos ignorando que cada 3
observaciones tienen en comun
que provienen de un mismo

lote donde hay diferencias (segun


anterior).
el analisis

37 / 37

Das könnte Ihnen auch gefallen