Sie sind auf Seite 1von 30

Notas de Clase elaboradas por L. M.

González
DBCA y cuadro latino

1. Diseño en Bloques Completos Aleatorizados


Cuando se sospecha o se sabe que fuentes de variación no deseables pueden in-
terferir en la respuesta de un experimento, es posible reducir y/o eliminar este efecto
usando bloqueo.
Un diseño en bloques completos aleatorizados tiene un factor experimental con t
tratamientos y tiene b bloques de tamaño t, ver tabla 1. Se llama completo porque
los t tratamientos están asignados dentro de cada bloque y el proceso de aleatori-
zación es tal que los t tratamientos son aleatoriamente asignados a las t unidades
experimentales dentro de cada bloque.
Para que el bloqueo sea efectivo, las unidades experimentales dentro de un bloque
deben ser más homogéneas que las unidades experimentales entre los bloques.

Tabla 1: Esquema general - datos de un diseño en bloques.


bloque
Tratamiento 1 2 ... j ... b
1 y11 y12 . . . y1j ... y1b
2 y21 y22 . . . y2j ... y2b
.. .. .. .. .. .. ..
. . . . . . .
i yi1 yi2 ... yij ... yib
.. .. .. .. .. .. ..
. . . . . . .
t yt1 yt2 ... ytj ... ytb

Nota 1 Dos unidades experimentales en el mismo bloque son similares y pueden ser
medidas bajo similares condiciones de experimentación.

Nota 2 Dos unidades experimentales en diferentes bloques pueden dar diferentes


respuestas aún cuando sean asignados al mismo tratamiento.

Nota 3 Hinkelmann & Kempthorne (1994) señalan que en general, los bloques com-
pletos son construidos tal que el número de unidades experimentales por bloque es
k = vt, i.e., el número de unidades experimentales por bloque es un múltiplo de t (nú-
mero de tratamientos). El caso particular es v = 1 y por tanto cada bloque contiene
t unidades experimentales, k = t.

Ejemplo 1 Ejercicio 4-2 de Montgomery (2002) sobre la comparación de tres solu-


ciones de lavado diferentes y la efectividad para retardar el crecimiento de bacterias
en contenedores de leche de 5 galones. El análisis se hace en un laboratorio y sólo
puede realizarse tres ensayos en un día. Como los días pueden representar una fuen-
te potencial de variabilidad, se asumen como bloques. En la tabla 2 se presentan los
datos.

1.1. El modelo
Montgomery (2002). Sea

yij = µ + τi + δj + ǫij i = 1, 2, . . . , t; j = 1, 2, . . . , b

1
Notas de Clase elaboradas por L. M. González
1.1 El modelo DBCA y cuadro latino

Tabla 2: Ejemplo de las soluciones de lavado y el crecimiento de bacterias.


Días
Solución 1 2 3 4
1 13 22 18 39
2 16 24 17 44
3 5 4 1 22
Fuente: Montgomery (2002)[p. 164]

en que

yij es la respuesta de la unidad experimental que fue asignada al tratamiento


i en el bloque j y

ǫij es el componente asociado con el error aleatorio que se asume ǫij ∼ N (0, σ 2 ).

P
t P
b
Asumiendo las restricciones τi = 0 y δj = 0,
i=1 j=1

µ es la media general o global,

τi es el efecto del tratamiento i con respecto a la media general, µ, y

δj es el efecto del bloque j con respecto a la media general, µ.

1.1.1. Matricialmente
Considerando la restricción sobre los τ ’s y los δ’s, se tiene que

τ1 + τ2 + τ3 + · · · + τt−1 + τt = 0

entonces
τt = −τ1 − τ2 − τ3 − · · · − τt−1 .
Igualmente,
δ1 + δ2 + δ3 + · · · + δb−1 + δb = 0
entonces
δb = −δ1 − δ2 − δ3 − · · · − δb−1 .
Así, en el vector de parámetros β no es necesario incluir a τt ni a δb puesto que τt y
δb se pueden escribir y obtener en términos de los otros τ ’s y δ’s, respectivamente.

Y = Xβ + E

2
Notas de Clase elaboradas por L. M. González
1.1 El modelo DBCA y cuadro latino

con
   
y11 1 1 0 ... 0 1 0 ... 0
y12  1 1 0 ... 0 0 1 ... 0 
   
 ..   .. .. .. .. .. .. .. .. .. 
 .  . . . . . . . . . 
   
y1b  1 1 0 ... 0 −1 −1 . . . −1
   
y21  1 0 1 ... 0 1 0 ... 0
   
y22  1 0 1 ... 0 0 1 ... 0
   
 ..   .. .
. .. .. .. .. .. .. .. 
Y n×1 =
 . ;
 X n×(t+1) =
. . . . . . . . . ;
y2b  1 0 1 ... 0 −1 −1 . . . −1
   
 ..   .. .
.. .. .. .. .. .. .. .. 
 .  . . . . . . . . 
   
 yt1  1 −1 −1 . . . −1 1 0 ... 0
   
 yt2  1 −1 −1 . . . −1 0 1 ... 0
   
 .  . .. .. .. .. .. .. .. .. 
 ..   .. . . . . . . . . 
ytb 1 −1 −1 . . . −1 −1 −1 . . . −1

 
ǫ11
ǫ12 
 
   .. 
µ  . 
 
 τ1 ǫ1b 
   
 τ2 ǫ21 
   
 
.. ǫ22 
 
.  
   .. 
β t+b−1×1 = 
τt−1  ; E n×1 =
 . ;

 δ1  ǫ2b 
   
 δ2   .. 
   . 
 .   
 ..   ǫt1 
 
δb−1  ǫt2 
 
 . 
 .. 
ǫtb
El estimador mínimos cuadrados de β es:
b = (X t X)−1 X t Y
β

con
b = σ 2 (X t X)−1 .
V ar(β)

3
Notas de Clase elaboradas por L. M. González
1.1 El modelo DBCA y cuadro latino

Ejemplo 2 Continuando con el ejemplo 1, el modelo, matricialmente escrito, es:

Y = X β + E
     
13 1 1 0 1 0 0 ǫ11
22 1 1 0 0 1 0 ǫ 
     12 
18 1 1 0 0 0 1 ǫ 
       13 
39 1 1 0 −1 −1 −1 µ ǫ 
     14 
16 1 0 1 1 0 0  τ1  ǫ 
       21 
     τ2   
24 1 0 1 0 1 0   ǫ22 
  =   δ1  +  
17 1 0 1 0 0 1   ǫ23 
    δ2   
44 1 0 1 −1 −1 −1 ǫ24 
     
5 1 −1 −1 1 0 0 δ3 ǫ31 
     
4 1 −1 −1 0 1 0 ǫ32 
     
1 1 −1 −1 0 0 1 ǫ33 
22 1 −1 −1 −1 −1 −1 ǫ34

Para calcular el vector de parámetros estimado, tenemos que:


 
12 0 0 0 0 0
 0 8 4 0 0 0
 
 0 4 8 0 0 0
X X=
t
 0 0 0 6 3 3

 
 0 0 0 3 6 3
0 0 0 3 3 6

 
0.083 0 0 0 0 0
 0 0.167 −0, 083 0 0 0 
 
 0 −0.083 0.167 0 0 0 
(X t X)−1 
= 
 0 0 0 0.25 −0.083 −0.083

 0 0 0 −0.083 0.25 −0.083
0 0 0 −0.083 −0.083 0.25
   
225 18.75
 60   4.25 
   
 69   6.5 
t 
X Y = ; 
β̂ =  
−71  −7.417 
   
−55 −2.083
−69 −6.75

De β̂ podemos concluir que:

µ = 18.75, i.e., que la efectividad media es 18.75;

τ1 = 4.25, i.e., que el efecto medio de la solución 1 sobre la efectividad es 4.25


con respecto a la media general. Así, la solución 1 aumenta la efectividad en
4.25 dado un día en particular;

4
Notas de Clase elaboradas por L. M. González
1.2 Análisis de varianza DBCA y cuadro latino

τ2 = 6.5, i.e., que el efecto medio de la solución 2 sobre la efectividad es 6.5


con respecto a la media general. Así, la solución 2 aumenta la efectividad en
6.5 dado un día en particular;
τ3 = −4.25 − 6.5 = −10.75, i.e., que el efecto medio de la solución 3 sobre
la efectividad es -10.75 con respecto a la media general. Así, la solución 3
disminuye la efectividad en 10.75 dado un día en particular;
δ1 = −7.417, i.e., que el efecto medio del día 1 sobre la efectividad es -7.417
con respecto a la media general. Así, en el día 1 se disminuyó la efectividad en
7.42 dada una solución en particular;
δ2 = −2.083, i.e., que el efecto medio del día 2 sobre la efectividad es -2.083
con respecto a la media general. Así, en el día 2 se disminuyó la efectividad en
2.1 dada una solución en particular;
δ3 = −6.75, i.e., que el efecto medio del día 3 sobre la efectividad es -6.75 con
respecto a la media general. Así, en el día 3 se disminuyó la efectividad en 6.75
dada una solución en particular y
δ4 = 7.417 + 2.083 + 6.75 = 16.25, i.e., que el efecto medio del día 4 sobre la
efectividad es 16.25 con respecto a la media general. Así, en el día 4 se aumentó
la efectividad en 16.25 dada una solución en particular;

1.2. Análisis de varianza


Para el análisis de varianza se debe tener en cuenta que hay una fuente de va-
riación adicional en el modelo que consiste en el ajuste por el bloque. Lo anterior
implica separar la varianza debida al efecto del factor de bloqueo de la varianza debi-
da a los tratamientos. Para esto se va a subdividir la matriz diseño X en dos partes
en que una parte corresponde a las columnas asociadas con los tratamientos (X τ ),
y la otra parte corresponde a las columnas asociadas con el factor de bloqueo (X δ ),
i.e.,

 
1 0 ... 0  
 1 0 ... 0  1 0 0 ... 0
  0 1 0 ... 0
 .. .. .. .. 
..  
 . . . . .  0 0 1 ... 0
   
1 0 ... 0  −1 −1 −1 . . . −1
   
0 1 ... 0  1
   0 0 ... 0 
0 1 ... 0  0
   1 0 ... 0 
 .. . . . .  0
Xτ =  . . . . .
.  0 1 ... 0
 . . .  y Xδ = 
−1 −1 −1 . . .

0 1 . . . 0   −1 
   . .. .. .. 
 .. .. .. .. ..   .. ..
 . . . . .   . . . . 

  1
−1 −1 . . . −1   0 0 . . . 0 
  0
−1 −1 . . . −1   1 0 ... 0 
  0
 . .. .. .. ..  0 1 ... 0
 .. . . . .  −1 −1 −1 . . . −1
1 −1 −1 . . . −1

5
Notas de Clase elaboradas por L. M. González
1.2 Análisis de varianza DBCA y cuadro latino

La hipótesis de interés es:

H0 :τ1 = τ2 = · · · = τt−1 = τt = 0 vs
Ha :Al menos un τi 6= 0, i = 1, 2, . . . , t.
H0 se rechazará si el P-valor asociado a los tratamientos es menor a α en la tabla
del análisis de varianza, tabla 3, y se concluirá que hay diferencia estadísticamente
significativa en el efecto medio de los tratamientos en consideración.

Tabla 3: Análisis de varianza para un diseño en bloques completamente aleatorizado.

Causa de Grad. de Suma de Cuadrado F-calculado P-valor


Variación Libertad Cuadrados Medio

b SCT rat CM T rat


Tratam. t−1 Y tX β − P (Ft−1,gle > Fc )
t b − nȳ 2 t−1 CM E
Y Xδβ δ

b SCBloq
Bloques b−1 Y tX β −
b − nȳ 2 b−1
Y tX τ β τ

b SCE
Error (t − 1)(b − 1) Y tY − Y tXβ
gle
Total n−1 Y t Y − nȳ 2
n = b ∗ t y gle=grados de libertad del error.
1 Pt P b
ȳ = yij
n i=1 j=1
b = (X t X)−1 X t Y
β b = (X tτ X τ )−1 X tτ Y
β b = (X tδ X δ )−1 X tδ Y
β
τ δ

Ejemplo 3 Continuando con el ejemplo 1:


   
1 0 1 0 0
1 0 0 1 0
   
1 0  1
 0 0 
1 0 −1 −1 −1
   
0 1 1 0 0
   
   
0 1 0 1 0
Xτ =   y Xδ =  
0 1 0 0 1
   
0 1 −1 −1 −1
   
−1 −1 1 0 0
   
−1 −1 0 1 0
   
−1 −1 0 0 1
−1 −1 −1 −1 −1
entonces
b = 6029.167,
Y tX β b = 703.5,
Y tX τ β b = 1106.917,
Y tX δ β
τ δ
Y t Y = 6081, nȳ 2 = 4218.75

Se concluye de la tabla 4 que hay efecto de la solución sobre la efectividad.

6
Notas de Clase elaboradas por L. M. González
1.2 Análisis de varianza DBCA y cuadro latino

Tabla 4: Análisis de varianza para los datos del ejemplo 1.


Causa de Grad. de Suma de Cuadrado F-calculado P-valor
Variación Libertad Cuadrados Medio
Solución 2 703.5 351.75 40.717 <0.001
Días 3 1106.917 368.972
Error 6 51.833 8.6389
Total 11 1758.583

Nota 4 Debido a la aleatorización dentro de los bloques, hay autores que consideran
que el estadístico
CM Bloq
Fc =
CM E
no es adecuado para ver el efecto de bloques (no es un test), puesto que influye el
efecto de la restricción sobre la aleatorización. Sin embargo, se puede examinar el
cociente
CM Bloq
CM E
⋆ Si CM Bloq
CM E >> 1 entonces los bloques fueron útiles para reducir el tamaño de
CM E.
⋆ Si CM Bloq
CM E << 1 entonces los bloques dismimuyen la potencia del test de hipóte-
sis e incrementaran la longitud de los intervalos de confianza para los contrastes
de tratamientos.
CM Bloq
Ejemplo 4 Continuando con el ejemplo 1, se observa que CM E >> 1 entonces
fue útil haber utilizado en el diseño el bloqueo por días.

Nota 5 Una vez se ha realizado un diseño en bloques NO se puede remover como


causa de variación del análisis de varianza el bloqueo, puesto que la aleatorización
no es la de un diseño completamente aleatorizado.

Nota 6 Para tamaño de muestra y comparaciones múltiples se procede de forma si-


milar a los calculos en un diseño completamente aleatorizado haciendo los respectivos
cambios de r por b y de los grados de libertad.

Ejercicio 1 Realizar el test de Bonferroni para el ejemplo 1 con un nivel de signi-


ficancia del 0.10 a mano y en R (para verificar).

Ejercicio 2 Usando los datos del ejemplo 1 como prueba piloto, calcular un tamaño
de muestra mínimo considerando una potencia de 0.90 y un nivel de significancia de
0.05.

Ejercicio 3 Deducir la tabla de análisis de varianza con las columnas: causa de


variación, grados de libertad, sumas de cuadrados, cuadrados medios, esperanza de
los cuadrados medios y F, para un diseño en bloques completos aleatorizados con
submuestreo en que t es el número de tratamientos, b es el número de bloques y n∗ es
el número de unidades observacionales por unidad experimental. Escribir la hipótesis
de interés y mostrar el procedimiento de prueba según la distribución de la variable
aleatoria F en el análisis de varianza.

7
Notas de Clase elaboradas por L. M. González
1.3 Intrucciones en R para bloques DBCA y cuadro latino

1.3. Intrucciones en R para bloques

remove(list=ls()) # Limpia R de bases anteriores

dias <- c(1,1,1,2,2,2,3,3,3,4,4,4) # Variable independiente - bloques

solucion <- c(1,2,3,1,2,3,1,2,3,1,2,3) # Variable independiente - tratamientos

efectividad <- c(13,16,5,22,24,4,18,17,1,39,44,22) # Variable dependiente

dias=as.factor(dias) # especifica que dias es una variable categorica

solucion=as.factor(solucion) # especifica que solucion es una variable categorica

solucion.f = data.frame(dias,solucion,efectividad) # une en un solo data.frame


las variables independiente y dependientes

ajuste = aov(efectividad ∼ dias + solucion, data=solucion.f ) # ajusta el modelo


de análisis de varianza

summary(ajuste) # imprime en pantalla el análisis de varianza

library(agricolae) # Llama la libreria agricolae

gle = df.residual(ajuste) # extrae los gradosde libertad del error del modelo ajus-
tado

SCE = deviance(ajuste) # extrae la suma de cuadrados del error del modelo


ajustado

CME = SCE/gle # calcula el cuadrado medio del error

TukeyHSD(ajuste,which="solucion",ordered=TRUE) # Realiza comparaciones


múltiples para el factor solución

plot(TukeyHSD(ajuste, "solucion",ordered=TRUE)) # Realiza un gráfico de com-


paraciones múltiples

1.4. Datos faltantes


Una solución exacta para hacer estimación cuando un dato es faltante es hacer
los cálculos desde la matriz diseño, sin el dato faltante, teniendo en cuenta que el
diseño NO será ortogonal y los grados de libertad del error corresponden al número
de datos menos el rango de la matriz diseño X que en este caso corresponde a n
menos el número de columnas de la matriz diseño X.

Ejemplo 5 Continuando con el ejemplo 1, suponga que se pierde la observación

8
Notas de Clase elaboradas por L. M. González
1.4 Datos faltantes DBCA y cuadro latino

asociada a la solución 2 del día 3, entonces:

Y = X β + E
     
13 1 1 0 1 0 0 ǫ11
22 1 1 0 0 1 0  ǫ 
     12 
18 1 1 0 0 0 1    ǫ 
    µ  13 
39 1 1 0 −1 −1 −2/3 ǫ 
     τ1   14 
       
16 1 0 1 1 0 0   τ2  ǫ21 
       
24 = 1 0 1 0 1 0  δ1  + ǫ22 
       
44 1 0 1 −1 −1 −2/3 δ2  ǫ24 
     
5 1 −1 −3/4 1 0 0  ǫ31 
    δ3  
4 1 −1 −3/4 0 1 0  ǫ32 
     
1 1 −1 −3/4 0 0 1  ǫ33 
22 1 −1 −3/4 −1 −1 −2/3 ǫ34

Para calcular el vector de parámetros estimado, tenemos que:


 
11 0 0 0 0 0
0 8 3 0 0 0 
 
0 3 5.25 0 0 −0.917
t
X X=  
0 0 0 6 3 2 
 
0 0 0 3 6 2 
0 0 −0.917 2 2 3.333
 
0, 091 0 0 0 0 0
 0 0.162 −0.099 0.008 0.008 −0.037 
 
 0 −0.099 0.264 −0.022 −0.022 0.099 
(X t X)−1 =
 0

 0.008 −0.022 0.244 −0.089 −0, 099 
 0 0.008 −0.022 −0.089 0.244 −0.099 
0 −0.037 0.099 −0.099 −0.099 0.446
   
208 18.909
 60   4.636 
   
 
60   7.636 
t
X Y =  
 ; β̂ = −8.212
−71  
−55 −2.879
−51 −6.545

9
Notas de Clase elaboradas por L. M. González
1.5 Eficiencia de un DBCA frente a DCA DBCA y cuadro latino

 
  1 0 0
1 0 0
1 1 0 
 0  

0

1 0 1 
 0  

−1 −1 −2/3

1 0   
  1 0 0 
   
0 1   
  0 1 0 
Xτ =  0 1  y Xδ =  
  0 0 1 
0 1   
  −1 −1 −2/3
−1 −3/4  
  1 0 0 
−1 −3/4  
  0 1 0 
−1 −3/4  
0 0 1 
−1 −3/4
−1 −1 −2/3
entonces
b = 5744.667,
Y tX β b τ = 790.909,
Y tX τ β b δ = 1141.076,
Y tX δ β
Y t Y = 5792, nȳ 2 = 3933.091

Tabla 5: Análisis de varianza para los datos el ejemplo 1 considerando la pérdida


del dato asociado con la solución 2 y el dia 3.
Causa de Grad. de Suma de Cuadrado F-calculado P-valor
Variación Libertad Cuadrados Medio
Solución 2 670.5 335.25 35.414 <0.001
Días 3 1020.667 340.222
Error 5 47.333 9.467
Total 10 1858.909

Se concluye de la tabla 5 que hay efecto de la solución sobre la efectividad. Note


que SCT rat + SCbloq + SCE 6= SCT .

Ejercicio 4 Suponga que se pierde la observación asociada a la solución 2 del día 3


y la observación asociada a la solución 3 dia 4 en el ejemplo 1. Construir la matriz
diseño X τ y X δ , encontrar β τ , β δ y el análisis de varianza. Comparar con la salida
de R.

1.5. Eficiencia de un DBCA frente a DCA


Melo, López & Melo (2007) señalan que la eficiencia relativa del Diseño completa-
mente aleatorizado (DCA) con respecto al diseño en bloques completos aleatorizados
(DBCA) es:
CM EDCA
ER =
CM EDBCA
 
1 CM bloq
=1+ −1
t CM EDBCA
Si ER > 1, entonces es mejor usar DBCA.

10
Notas de Clase elaboradas por L. M. González
1.6 Intrucciones en R para bloques con datos faltantes DBCA y cuadro latino

Si ER ≤ 1, entonces es mejor usar DCA.

Ejemplo 6 Continuando con el ejemplo 1, de la tabla 4 sabemos que CM bloq =


368.972 y CM EDBCA = 8.6389, entonces
 
1 368.972
ER = 1 + − 1 = 14.90
3 8.6389
Por tanto, en este caso es mejor usar un diseño en bloques completamente aleatori-
zados.

1.6. Intrucciones en R para bloques con datos faltantes

remove(list=ls()) # Limpia R de bases anteriores

dias <- c(1,1,1,2,2,2,3,3,4,4,4) # Variable independiente - bloques

solucion <- c(1,2,3,1,2,3,1,3,1,2,3) # Variable independiente - tratamientos

efectividad <- c(13,16,5,22,24,4,18,1,39,44,22) # Variable dependiente

dias=as.factor(dias) # especifica que dias es una variable categorica

solucion=as.factor(solucion) # especifica que solucion es una variable categorica

solucion.f = data.frame(dias,solucion,efectividad) # une en un solo data.frame


las variables independiente y dependientes

ajuste1 = aov(efectividad ∼ dias + solucion, data=solucion.f ) # ajusta el modelo


de análisis de varianza para analizar solución

ajuste2 = aov(efectividad ∼ solucion + dias, data=solucion.f ) # ajusta el modelo


de análisis de varianza para analizar dias

summary(ajuste1) # imprime en pantalla el análisis de varianza

summary(ajuste2) # imprime en pantalla el análisis de varianza

2. Prueba de Friedman para K Muestras


Es una prueba alternativa cuando en un diseño en bloques completos aleatoriza-
dos el supuesto de normalidad no se cumple o cuando las mediciones no son realizadas
en escala al menos de intervalo, i.e., para la prueba de Friedman se asume que las
mediciones son realizadas en al menos escala ordinal.
Los supuestos del test son [ver Conover (1980)[p. 299]]:

1. Los resultados dentro de un bloque no influencian los resultados dentro de otros


bloques.

2. Dentro de cada bloque, las observaciones pueden ser ordenadas según algún
criterio de interés.

11
Notas de Clase elaboradas por L. M. González
DBCA y cuadro latino

La hipótesis nula es que los efectos de los tratamientos son los mismos, i.e., las
poblaciones de interés tienen distribuciones idénticas. La hipótesis alterna es que
existe una diferencia entre los efectos de tratamientos.

H0 : f1 (y) = f2 (y) = · · · = fk (y)

Se pueden considerar dos procedimientos para el cálculo del estadístico de prueba.

1. Canavos (1988)[p. 584]. Se puede utilizar cuando b ≥ 10 y t ≥ 4 y consiste en


asignar rangos de 1 a t dentro de cada bloque, y luego calcular el estadístico
de prueba: " t #
12 X
2
G= Ri∗ − 3b(t + 1)
bt(t + 1)
i=1

con Rij el rango de la observación ij, b el número de bloques, t el número de


tratamientos y
Xb
Ri∗ = Rij .
j=1

La distribución de G se puede aproximar a través de la distribución chi-


cuadrado:
G ∼ χ2t−1
y se rechaza H0 si G > χ2t−1,1−α .

2. Conover (1980)[p. 299] Consiste en asignar rangos de 1 a t dentro de cada


bloque, luego calcular el estadístico de prueba:
h 2
i
(b − 1) B2 − bt(t+1)
4
T = , A2 6= B2
A2 − B2
con
t X
X b
2
A2 = Rij
i=1 j=1
t
1X 2
B2 = Ri∗
b
i=1

Se rechaza H0 si:
T > F1−α,t−1,(b−1)(t−1)

Nota 7 Si A2 = B2 , el p-valor es:


 b−1
1
α̂ =
t!

12
Notas de Clase elaboradas por L. M. González
DBCA y cuadro latino

Nota 8 Para comparaciones múltiples entre efectos de tratamientos, se considerará


que dos efectos de tratamiento son diferentes si
s 
2b(A2 − B2 )
| Ri∗ − Ri′ ∗ |> t1− α2 ,(b−1)(t−1)
(b − 1)(t − 1)

Nota 9 En caso de empates se asigna el rango promedio a cada una de las observa-
ciones empatadas.

bt(t + 1)(2t + 1)
Nota 10 Si no hay empates, A2 se simplifica a A2 =
6
Ejemplo 7 Continuando con el ejemplo sobre las tres soluciones de lavado y su
efectividad para retardar el crecimiento de bacterias en contenedores de leche de 5
galones [Ejercicio 4.2 de Montgomery (2002)], la tabla 6 muestra los rangos.

Tabla 6: Ejemplo de las soluciones de lavado y el crecimiento de bacterias. Rangos.


Días
Solución 1 2 3 4 Rango
1 2 2 3 2 9
2 3 3 2 3 11
3 1 1 1 1 4

4 ∗ 3(3 + 1)(2 ∗ 3 + 1) 1
A2 = = 56; B2 = (92 + 112 + 42 ) = 54.5
6 4
Por tanto h i
4∗3∗42
(3) 54.5 − 4
T = = 13
56 − 54.5
Como F0.95,2,6 = 5.14, se rechaza la hipótesis de que los efectos de las soluciones son
iguales sobre la efectividad para retardar el crecimiento de bacterias.
Para comparar las tres soluciones, tenemos que el valor crítico es
s  s 
2b(A2 − B2 ) 2 ∗ 4 ∗ (56 − 54.5) √
t1− a2 ,(b−1)(t−1) = t0.975,6 = 2.447∗ 2 = 3.4606
(b − 1)(t − 1) 6

solución 1 versus 2: |9 − 11| = 2 < 3.46 entonces el efecto de la solución 1


sobre la efectividad es igual al efecto de la solución 2.

solución 1 versus 3: |9 − 4| = 5 > 3.46 entonces el efecto de la solución 1 sobre


la efectividad es diferente al efecto de la solución 3.

solución 2 versus 3: |11 − 4| = 7 > 3.46 entonces el efecto de la solución 2


sobre la efectividad es diferente al efecto de la solución 3.

Ejercicio 5

13
Notas de Clase elaboradas por L. M. González
DBCA y cuadro latino

Tabla 7: Datos ejercicio 5.


Velocidad de Horno
agitación 1 2 3 4
5 8 4 5 6
10 14 5 6 9
15 14 6 9 2
20 17 9 3 6

Montgomery (2002)[p.165] Sobre un fabricante de una aleación maestra de aluminio


que produce refinadores de textura en forma de lingotes. La compañía produce el
producto en cuatro hornos que se tratan como factor de bloqueo. Los ingenieros del
proceso quieren comparar cuatro velocidades de agitación. Los datos se presentan en
la tabla 7.

¿existe alguna evidencia de que la velocidad de agitación afecta la medida de


la textura? Realice un análisis de varianza.

¿existe alguna evidencia de que la velocidad de agitación afecta la medida de


la textura? Realice el test de friedman.

Nota 11 La intrucción en R para el test de Friedman es:

friedman.test(efectividad ∼ solucion | dias) # modelo y ∼ A|B con y la respuesta,


A los tratamientos y B los bloques

Nota 12 Para comparaciones múltiples no paramétricas en R se puede usar la li-


breria: nparcomp.

3. Ideas sobre Bloques Incompletos Balanceados


3.1. Características:
1. Cada bloque contiene k unidades experimentales con k < t, por tanto hay más
tratamientos que unidades experimentales en un bloque.

2. Cada tratamiento aparece exactamente en r bloques.

3. Cada tratamiento aparece o una vez o no aparece en un bloque.

4. Cada par de tratamientos ocurre junto en el mismo número de bloques λ veces.


Esta propiedad hace posible que cualquier par de tratamientos sean comparados
con el mismo error estándar.

Entre sus propiedades están que todos los contrastes de tratamientos son estimables
y todas las comparaciones dos a dos entre efectos de tratamientos son estimadas con
la misma varianza y por tanto sus intervalos de confianza tienen la misma longitud,
ver Dean & Voss (1999)[p. 344].

14
Notas de Clase elaboradas por L. M. González
3.2 Tipos de bloques incompletos balanceados: DBCA y cuadro latino

Si

t : Número de tratamientos
b : Número de bloques
k : Número de unidades experimentales por bloque
r : Número de réplicas por tratamiento
λ : Número de veces que aparecen un par de tratamientos

entonces un diseño en bloques incompletos balanceados cumple con las siguientes


tres condiciones:

bk
r= , b≥t
t
r(k − 1)
λ= (1)
(t − 1)
b≥t

Nota 13 Como λ debe ser entero, no existen bloques incompletos para cualquier r,
k, t y b. Cochran & Gertrude (1974) presenta una variedad de arreglos en bloques
incompletos balanceados.

3.2. Tipos de bloques incompletos balanceados:


Tipo I: Experimentos en que los bloques pueden ser agrupados en repeticiones.
Ver figura 1.

Figura 1: Diseño tipo I.


Bloque Rep. I Bloque Rep. II Bloque Rep. III
1 T1 T2 4 T1 T3 7 T1 T4
2 T3 T4 5 T2 T5 8 T2 T6
3 T5 T6 5 T4 T6 8 T3 T5

Bloque Rep. IV Bloque Rep. V


10 T1 T5 13 T1 T6
11 T2 T4 14 T2 T3
12 T3 T6 15 T4 T5
Fuente: Cochran & Gertrude (1974)[p. 487].

Tipo II: Son experimentos en que los bloques pueden ser agrupados en grupos
de repeticiones. Ver figura 2.
Tipo III: Diseños en que los bloques no pueden ser agrupados en repeticiones
o grupos de repeticiones. Ver figura 3 y figura 4.
Tipo IV: Diseños en que los bloques no pueden ser agrupados en repeticiones
o grupos de repeticiones y t = b, figura 4. Entonces los diseños tipo IV son un
caso particular de los diseños tipo III.

15
Notas de Clase elaboradas por L. M. González
3.2 Tipos de bloques incompletos balanceados: DBCA y cuadro latino

Figura 2: Diseño tipo II.


Bloque Rep. I Bloque Rep. II Bloque Rep. III
1 T1 T2 8 T1 T3 15 T1 T4
2 T2 T6 9 T2 T4 16 T2 T3
3 T3 T4 10 T3 T5 17 T3 T6
4 T4 T7 11 T4 T6 18 T4 T5
5 T1 T5 12 T5 T7 19 T2 T5
6 T5 T6 13 T1 T6 20 T6 T7
7 T3 T7 14 T2 T7 21 T1 T7
Fuente: Cochran & Gertrude (1974)[p. 517].

Figura 3: Diseño tipo III.


Bloque
1 T1 T2 T5
2 T1 T2 T6
3 T1 T3 T4
4 T1 T3 T6
5 T1 T4 T5
6 T2 T3 T4
7 T2 T3 T5
8 T2 T4 T6
9 T3 T5 T6
10 T4 T5 T6
Fuente: Cochran & Gertrude (1974)[p. 516].

Tipo V: Si el número de parcelas es pequeño, ver figura 5.

Nota 14 Dean & Voss (1999)[p.354] presentan la estimación de los efectos de tra-
tamiento:
k
τ̂i = Qi
λt
con
b
1X
Qi = Ti − n h i Bh
k
h=1

donde:

Ti : Suma de todas las observaciones sobre el tratamiento i


(
1, Si el tratamiento i es observado en el bloque h.
nhi =
0, En otro caso.
Bh : Suma de todas las observaciones en el bloque h.
b : Número de bloques.

Pt
Así el estimador mínimos cuadrados del contraste i=1 ci τ̂i es

16
Notas de Clase elaboradas por L. M. González
3.2 Tipos de bloques incompletos balanceados: DBCA y cuadro latino

Figura 4: Diseño tipo IV.


Bloque
1 T4 T6 T7 T9 T10 T11
2 T1 T5 T7 T8 T10 T11
3 T1 T2 T6 T8 T9 T11
4 T1 T2 T3 T7 T9 T10
5 T2 T3 T4 T8 T10 T11
6 T1 T3 T4 T5 T9 T11
7 T1 T2 T4 T5 T6 T10
8 T2 T3 T5 T6 T7 T11
9 T1 T3 T4 T6 T7 T8
10 T2 T4 T5 T7 T8 T9
11 T3 T5 T6 T8 T9 T10
Fuente: Cochran & Gertrude (1974)[p. 521].

Figura 5: Diseño tipo V.


Bloque Rep. I Bloque Rep. II Bloque Rep. III
1 T1 T2 3 T1 T3 5 T1 T4
2 T3 T4 4 T2 T4 6 T2 T3
Fuente: Cochran & Gertrude (1974)[p. 516].

t
X X t
k
ci τ̂i = Qi ci
λt
i=1 i=1
t
" b
#
k X 1X
= Ti − nhi Bh ci
λt k
i=1 h=1
Xt Xt X
b
k 1
= Ti ci − nhi Bh ci
λt λt
i=1 i=1 h=1

Nota 15 !
t
X t
k 2X 2
V ar ci τ̂i = σ ci
λt e
i=1 i=1

Los test de comparaciones múltiples entre efectos de tratamientos se pueden usar


teniendo en cuenta que los grados de libertad del erro son: bk − b − t + 1.

Nota 16 Para detalles sobre análisis de diseños en bloques incompletos en general,


sean balanceados o no , pueden adicionalmente consultar
http://media.wiley.com/product_data/excerpt/75/04715517/0471551775.pdf

Nota 17 Tamaño de Muestra.


Partiendo de
k
V ar (τmáx − τmı́n ) = σe2 (2)
λt

17
Notas de Clase elaboradas por L. M. González
DBCA y cuadro latino

y reemplazando λ dada en (1) se tiene que


k(t − 1) 2
V ar (τmáx − τmı́n ) = 2 σ
rt(k − 1) e
2σe2
= rt(k−1)
k(t−1)
2σe2
= (2)
r∗

con r∗ = rt(k−1)
k(t−1) .
De las notas de clase sobre tamaño de muestra para un diseño completamente
aleatorizado, se tenía que

2tσe2 φ2
r= , (3)
∆2
con
2σe2
V ar (τmáx − τmı́n ) =
r
cambiando r en (3) por r∗ dada (2), se tiene que

2φ2 σe2 k(t − 1)


r=
∆2 (k − 1)
El resto del procedimiento es similar al visto en las notas de tamaño de muestra.

4. Diseño en Cuadro Latino


Cuando hay dos fuentes de bloqueo es posible organizar el diseño de forma que
el número de unidades experimentales necesarias sea mínimo. Una alternativa es el
diseño en cuadro latino. Un diseño en cuadro latino tiene un factor experimental con
t tratamientos y tiene dos fuentes de bloqueo en que cada una tiene t niveles. Esta
es una restricción ya que el número de niveles de las dos fuentes de bloqueo debe
ser igual al número de tratamientos. Un esquema de cuadro latino se presenta en
la figura 6 en que las filas están asociadas a los niveles del factor de bloqueo G, las
columnas están asociadas a los niveles del factor de bloqueo F y las letras latinas
dentro del cuadro están asociadas a los niveles del factor tratamiento. Es importante
resaltar que cada letra latina debe aparecer solo una vez en cada columna y en cada
fila del cuadrado.

Figura 6: Ejemplo de un diseño en cuadro latino para t = 4.


Fuente de Bloqueo F
Fuente de bloqueo G F1 F2 F3 F4
G1 C D A B
G2 B C D A
G3 A B C D
G4 D A B C

18
Notas de Clase elaboradas por L. M. González
4.1 El modelo DBCA y cuadro latino

Ejemplo 8 Ejercicio 4-15 de Montgomery (2002) sobre la comparación de cuatro


métodos de ensamblaje (A, B, C y D) sobre el tiempo de ensamblaje de un com-
ponente de televisores a color. Las dos fuentes de bloqueo son operadores, i.e., se
seleccionaron cuatro operadores, y el orden de ensamblaje. En la tabla 8 se presentan
los datos.

Tabla 8: Ejemplo de los métodos de ensamblaje en cuadro latino.


Operador
Orden de ensamblaje 1 2 3 4
1 C=10 D=14 A=7 B=8
2 B=7 C=18 D=11 A=8
3 A=5 B=10 C=11 D=9
4 D=10 A=10 B=12 C=14
Fuente Montgomery (2002)[p.167]

4.1. El modelo
Montgomery (2002)[p.145]. Sea

yijk = µ + τi + δj + γk + ǫijk i = 1, 2, . . . , t; j = 1, 2, . . . , t; k = 1, 2, . . . , t,

en que

yijk es la respuesta de la unidad experimental que fue asignada al tratamiento


i en el bloque fila j en el bloque columna k y

ǫijk es el componente asociado con el error aleatorio que se asume ǫijk ∼


N (0, σǫ2 ).
P
t P
t P
t
Asumiendo las restricciones τi = 0, δj = 0 y γk = 0,
i=1 j=1 k=1

µ es la media general o global,

τi es el efecto del tratamiento i con respecto a la media general, µ,

δj es el efecto del bloque fila j con respecto a la media general, µ, y

γk es el efecto del bloque columna k con respecto a la media general, µ.

19
Notas de Clase elaboradas por L. M. González
4.2 Análisis de varianza DBCA y cuadro latino

Ejemplo 9 Continuando con el ejemplo 8, el modelo, matricialmente escrito, es:


Y = Xβ + E
     
10 1 1 0 0 1 0 0 0 0 1 ǫ311
7 1 1 0 0 0 1 0 0 1 0 ǫ221 
     
5 1 1 0 0 0 0 1 1 0 0  
      ǫ131 
10 1 1 0 0 −1 −1 −1 −1 −1 
−1 µ  
   ǫ441 
14 1 0 1 0 1 0 0 −1 −1  
−1 γ1  ǫ412 
      
18 1 0 1  ǫ322 
   1 0 0 1 0 0 0  γ 2
   
10 1 0 0  ǫ232 
   1 0 0 0 1 0 1  γ 3 
      
10 1 0 1 0 −1 −1 −1 1 0 0  δ 1
 ǫ
 142 
  =   +  
7 1 0 0 1 1 0 0 1 0 0  δ2  ǫ113 
     
11 1 0 0 1 0 1 0 −1 −1 −1  δ3   ǫ423 
     
11 1 0 0 1 0 0 1 0 0 1  τ1   ǫ333 
     ǫ  
12 1 0 0 1 −1 −1 −1 0 1 0 
    τ2  243 
8 1 −1 −1 −1 1 0 0 0 1 0 τ 3 ǫ 
     214 
8 1 −1 −1 −1 0 1 0 1 0 0  
   ǫ124 
9 1 −1 −1 −1 0 0 1 −1 −1 −1 ǫ434 
14 1 −1 −1 −1 −1 −1 −1 0 0 1 ǫ344
Para calcular el vector de parámetros estimado, tenemos que:
 
16 0 0 0 0 0 0 0 0 0
0 8 4 4 0 0 0 0 0 0
 
0 4 8 4 0 0 0 0 0 0
 
0 4 4 8 0 0 0 0 0 0
 
0 0 0 0 8 4 4 0 0 0
X X=
t
0 0

 0 0 4 8 4 0 0 0

0 0 0 0 4 4 8 0 0 0
 
0 0 0 0 0 0 0 8 4 4
 
0 0 0 0 0 0 0 4 8 4
0 0 0 0 0 0 0 4 4 8
   
164 10.25
 −7  −2.25
   
 13   2.75 
   
 2   0.00 
   
 −7  −0.50
X Y =
t 
 −2  ; β̂ = 
 0.75 

   
−11 −1.50
   
−14 −2.75
   
 −7  −1.00
9 3.00

4.2. Análisis de varianza


Para el análisis de varianza se debe tener en cuenta que hay dos fuentes de
variación adicionales en el modelo que consiste en el ajuste por el bloque fila y

20
Notas de Clase elaboradas por L. M. González
4.2 Análisis de varianza DBCA y cuadro latino

el ajuste por el bloque columna. Lo anterior implica separar la varianza debida al


efecto del factor de bloqueo fila y al efecto del factor de bloqueo columna de la
varianza debida a los tratamientos. Para esto se va a subdividir la matriz diseño X
en tres partes en que la primera parte corresponde a las columnas asociadas con los
tratamientos (X τ ), la segunda parte corresponde a las columnas asociadas al factor
de bloque fila (X δ ), y la tercera parte corresponde a las columnas asociadas con el
factor de bloqueo columna (X γ ).
La hipótesis de interés es:

H0 :τ1 = τ2 = · · · = τt−1 = τt = 0 vs
Ha :Al menos un τi 6= 0, i = 1, 2, . . . , t.

H0 se rechazará si el P-valor asociado a los tratamientos es menor a α en la tabla


del análisis de varianza, tabla 9, y se concluirá que hay diferencia estadísticamente
significativa en el efecto medio de los tratamientos en consideración.

Tabla 9: Análisis de varianza para un diseño en cuadro latino.


Causa de Grad. de Suma de Cuadrado F-calculado P-valor
Variación Libertad Cuadrados Medio
SCT rat CM T rat
Tratam. t−1 Y tP τ Y P (Ft−1,gle > Fc )
t−1 CM E
SCF ila
Bloqueo t−1 Y tP δ Y
t−1
fila
SCColumna
Bloqueo t−1 Y tP γ Y
t−1
columna
SCE
Error (t − 2)(t − 1) Y tY −
gle
Y tP X Y
Total t2 − 1 Y t Y −nȳ 2
n = t2 y gle=grados de libertad del error.
1 P t P t P t
ȳ = yijk P X = X(X t X)−1 X t
n i=1 j=1 k=1
P τ = X τ (X tτ X τ )−1 X tτ P δ = X δ (X tδ X δ )−1 X tδ P γ = X γ (X tγ X γ )−1 X tγ

21
Notas de Clase elaboradas por L. M. González
4.2 Análisis de varianza DBCA y cuadro latino

Ejemplo 10 Continuando con el ejemplo 8:


     
0 0 1 1 0 0 1 0 0
0 1 0  0 1 0 1 0 0
     
1 0 0 0 0 1 1 0 0
     
−1 −1 −1 −1 −1 −1 1 0 0
     
−1 −1 −1 1 0 0 0 1 0
     
0 0 1 0 1 0 0 1 0
    
0 1 0 0 0 1 0 1 0
     
     
 1 0 0  −1 −1 −1 0 1 0
Xτ =  , Xδ =   y Xγ =  
1 0 0 1 0 0 0 0 1
     
−1 −1 −1 0 1 0 0 0 1
     
0 0 1  0 0 1 0 0 1
     
0 1 0 −1 −1 −1 0 0 1
     
0 1 0  1 0 0 −1 −1 −1
     
1 0 0 0 1 0 −1 −1 −1
    
−1 −1 −1 0 0 1 −1 −1 −1
0 0 1 −1 −1 −1 −1 −1 −1

Tabla 10: Análisis de varianza para los datos del ejemplo 8.


Causa de Grad. de Suma de Cuadrado F-calculado P-valor
Variación Libertad Cuadrados Medio
Método 3 72.5 24.1667 13.8095 0.004213
Operario 3 51.5 17.1667
Orden 3 18.5 6.1667
Error 6 10.5 1.75
Total 15 153

Se concluye de la tabla 10 que hay efecto del método de ensamblaje sobre el tiempo
de ensamblaje de un componenete de televisores a color.

Nota 18 Hinkelmann & Kempthorne (1994)[p.317]. Sea Tt el número total de cua-


dros latinos de orden t en forma reducida, es decir, en la cual la primera fila y la
primera columna son arregladas en orden alfabético.
El número de cuadros latinos que puede ser generado de una forma reducida por
permutación de las filas y columnas es t!(t − 1)!.

Ejemplo 11 Ejemplo de algunos cuadros latinos en forma reducida y permutaciones


del mismo
t = 2 −→ 2!1! = 2
A B B A
y
B A A B
t = 3 −→ 3!2! = 12
A B C A B C A C B
B C A C A B C B A ···
C A B B C A B A C

22
Notas de Clase elaboradas por L. M. González
4.3 Programa en R para diseño en cuadro latino DBCA y cuadro latino

t = 4 −→ 4!3! = 144

A B C D A B C D A B C D A B C D
B A D C B A D C B C D A B D A C
···
C D A B C D B A C D A B C A D B
D C B A D C A B D A B C D C B A

Nota 19 Para seleccionar una cuadro latino a aplicar:

1. Contruir el cuadro latino estándar.

2. Aleatorizar el orden de las filas.

3. Aleatorizar el orden de las columnas.

4. Asignar los tratamientos en forma aleatoria a las letras latinas

5. Correr el experimento por fila o por columna.

4.3. Programa en R para diseño en cuadro latino


remove(list=ls()) # limpiando las bases de datos
library(stats) # Cargando la libreria stats
#reading data base
operador <- c(1,1,1,1,2,2,2,2,3,3,3,3,4,4,4,4)
orden <- c(1,2,3,4,1,2,3,4,1,2,3,4,1,2,3,4)
metodo <- c(3,2,1,4,4,3,2,1,1,4,3,2,2,1,4,3)
tiempo <- c(10,7,5,10,14,18,10,10,7,11,11,12,8,8,9,14)
metodos.f = data.frame(operador,orden,metodo,tiempo)
coperador.factor=factor(operador)
corden.factor=factor(orden)
cmetodo.factor=factor(metodo)
ajuste = aov(tiempo ~ coperador.factor + corden.factor + cmetodo.factor)
# La instrucción aov genera el análisis de varianza
summary(ajuste)
ajuste$model
ajuste$residuals
ajuste$fitted.values
library(agricolae)
gle = df.residual(ajuste)
SCE = deviance(ajuste)
CME = SCE/gle
HSD.test(tiempo,cmetodo.factor,gle,CME,0.05)
TukeyHSD(ajuste,which="cmetodo.factor",ordered=TRUE)
plot(TukeyHSD(ajuste, "cmetodo.factor",ordered=TRUE))

Nota 20 (Cuadro Latino Replicado) Para aumentar los grados de libertad, una alter-
nativa es replicar el cuadro latino. Las situaciones más simples son:

1. Replicar el cuadro latino r veces.


El modelo:

23
Notas de Clase elaboradas por L. M. González
DBCA y cuadro latino

yijkl = µ + τi + δj + γk + θl + ǫijkl
con i = 1, 2, . . . , t; j = 1, 2, . . . , t; k = 1, 2, . . . , t, l = 1, 2, . . . , r y θl el efecto de la
réplica l.
Un ejemplo de un cuadro latino replicado está en la figura 7.

Figura 7: Ejemplo de un diseño en cuadro latino replicado.


1 2 3 ... r
AB AB AB ... AB
BA BA BA ... BA

La tabla de análisis de varianza con causa de variación y grados de libertad se presenta


en la tabla 11.

Tabla 11: Análisis de varianza para un diseño en cuadro latino replicado.


Causa de Variación Grados de libertad
Réplicas r−1
Tratamientos t−1
Filas t−1
Columnas t−1
Error (t − 1)[r(t + 1) − 3]
Total rt2 − 1

2. Diseño en Rectángulo Latino.


El modelo:

yijk = µ + τi + δj + γk + eijk
con i = 1, 2, . . . , t; j = 1, 2, . . . , rt; k = 1, 2, . . . , t.
Un ejemplo de un diseño en rectángulo latino está en la figura 8.

Figura 8: Ejemplo de un diseño en rectágulo latino.


A B C
C A B
B C A
A B C
C A B
B C A

En este caso, la tabla de análisis de varianza con causa de variación y grados de


libertad se presenta en la tabla 12.

5. Diseño en cuadro grecolatino


Cuando hay tres fuentes de bloqueo es posible organizar el diseño de forma que el número
de unidades experimentales necesarias sea el mismo que en un diseño en cuadro latino, i.e.,
n = t2 . La alternativa es el diseño en cuadro grecolatino. Un diseño en cuadro grecolatino
tiene un factor experimental con t tratamientos y tiene tres fuentes de bloqueo en que cada

24
Notas de Clase elaboradas por L. M. González
5.1 El modelo DBCA y cuadro latino

Tabla 12: Análisis de varianza para un diseño en rectágulo latino.


Causa de Variacion gl
Filas rt − 1
Columnas t−1
Tratamientos t−1
Error (rt − 2)(t − 1)
Total rt2 − 1

una tiene t niveles. Esta es una restricción ya que el número de niveles de las tres fuentes
de bloqueo debe ser igual al número de tratamientos. Un esquema de cuadro grecolatino se
presenta en la figura 9 en que las filas están asociadas a los niveles del factor de bloqueo G,
las columnas están asociadas a los niveles del factor de bloqueo F , las letras griegas están
asociadas al factor de bloque H y las letras latinas dentro del cuadro están asociadas a
los niveles del factor tratamiento. Es importante resaltar que cada pareja de letras latina y
griega debe aparecer solo una vez en el cuadro. Adicionalmente, que un cuadro grecolatino
es el resultado de superponer dos cuadros latinos.

Figura 9: Ejemplo de un diseño en cuadro grecolatino para t = 4.


Fuente de Bloqueo F
Fuente de bloqueo G F1 F2 F3 F4
G1 C β Bγ Dδ Aα
G2 Bα Cδ Aγ Dβ
G3 Aδ Dα Bβ Cγ
G4 Dγ Aβ Cα Bδ

Ejemplo 12 Ejercicio 4-23 de Montgomery (2002) sobre la comparación de cuatro métodos


de ensamblaje (A, B, C y D) sobre el tiempo de ensamblaje de un componente de televisores
a color. Las tres fuentes de bloqueo son operadores, i.e., se seleccionaron cuatro operadores,
el orden de ensamblaje y sitios de trabajo. En la tabla 13 se presentan los datos.

Tabla 13: Ejemplo de los métodos de ensamblaje en cuadro grecolatino.


Operador
Orden de ensamblaje 1 2 3 4
1 C β =11 Bγ =10 D δ =14 Aα=8
2 B α =8 C δ =12 A γ =10 D β =12
3 A δ =9 D α =11 B β = 7 C γ =15
4 D γ =9 A β = 8 C α =18 B δ =6
Fuente Montgomery (2002)[p.168]

5.1. El modelo
Montgomery (2002)[p.152]. Sea

yijk = µ + τi + δj + γk + ωl + ǫijk

con i=1,2,. . . ,t; j=1,2,. . . ,t; k=1,2,. . . ,t; l=1,2,. . . ,t, en que
yijkl es la respuesta de la unidad experimental que fue asignada al tratamiento i en
el bloque fila j en el bloque columna k en la letra griega l y

25
Notas de Clase elaboradas por L. M. González
5.1 El modelo DBCA y cuadro latino

ǫijkl es el componente asociado con el error aleatorio que se asume ǫijkl ∼ N (0, σǫ2 ).
P
t P
t P
t P
t
Asumiendo las restricciones τi = 0, δj = 0, γk = 0 y ωl = 0
i=1 j=1 k=1 l=1

µ es la media general o global,


τi es el efecto del tratamiento i con respecto a la media general, µ,
δj es el efecto del bloque fila j con respecto a la media general, µ,
γk es el efecto del bloque columna k con respecto a la media general, µ, y
ωl es el efecto del bloque letra griega l con respecto a la media general, µ.

Ejemplo 13 Continuando con el ejemplo 12, el modelo, matricialmente escrito, es:

Y = Xβ + E

en que   
11 ǫ3112
8 
 ǫ2214 
  µ  
9 ǫ1313 
   γ1   
9   ǫ4411 
   γ2   
10   ǫ2121 
   γ3   
12   ǫ3223 
   δ1   
11   ǫ4324 
   δ2   
8   ǫ1422 
Y = 
14 ; β= 
 δ3  ; E=
ǫ4133 

   τ1   
10   ǫ1231 
   τ2   
7   ǫ2332 
   τ3   
18   ǫ3434 
  ω1   
8   ǫ1144 
  ω2   
12 ǫ4242 
  ω3  
15 ǫ3341 
6 ǫ2443
y  
1 1 0 0 1 0 0 0 0 1 0 1 0
1 1 0 0 0 1 0 0 1 0 1 0 0
 
1 1 0 0 0 0 1 1 0 0 0 0 1
 
1 1 0 0 −1 −1 −1 −1 −1 −1 −1 −1 −1
 
1 0 1 0 1 0 0 0 1 0 −1 −1 −1
 
1 0 1 0 0 1 0 0 0 1 0 0 1
 
1 0 1 0 0 0 1 −1 −1 −1 1 0 0
 
1 0 1 0 −1 −1 −1 1 0 0 0 1 0
X=
1

 0 0 1 1 0 0 −1 −1 −1 0 0 1
1 0 0 1 0 1 0 1 0 0 −1 −1 −1
 
1 0 0 1 0 0 1 0 1 0 0 1 0
 
1 0 0 1 −1 −1 −1 0 0 1 1 0 0
 
1 −1 −1 −1 1 0 0 1 0 0 1 0 0
 
1 −1 −1 −1 0 1 0 −1 −1 −1 0 1 0
 
1 −1 −1 −1 0 0 1 0 0 1 −1 −1 −1
1 −1 − 1 −1 − 1 −1 −1 0 1 0 0 0 1

26
Notas de Clase elaboradas por L. M. González
5.2 Análisis de varianza DBCA y cuadro latino

Para calcular el vector de parámetros estimado, tenemos que:


 
16 0 0 0 0 0 0 0 0 0 0 0 0
0 8 4 4 0 0 0 0 0 0 0 0 0
 
0 4 8 4 0 0 0 0 0 0 0 0 0
 
0 4 4 8 0 0 0 0 0 0 0 0 0
 
0 0 0 0 8 4 4 0 0 0 0 0 0
 
0 0 0 0 4 8 4 0 0 0 0 0 0
 
X tX =  0 0 0 0 4 4 8 0 0 0 0 0 0

0 0 0 0 0 0 0 8 4 4 0 0 0
 
0 0 0 0 0 0 0 4 8 4 0 0 0
 
0 0 0 0 0 0 0 4 4 8 0 0 0
 
0 0 0 0 0 0 0 0 0 0 8 4 4
 
0 0 0 0 0 0 0 0 0 0 4 8 4
0 0 0 0 0 0 0 0 0 0 4 4 8
   
168 10.5
 −4  −1.25
   
 0  −0.25
   
 8   1.75 
   
 2   0.25 
   
 1   0 
   
X tY = 
 1 ;
 β̂ = 
 0 

−11 −1.75
   
−15 −2.75
   
 10   3.5 
   
 1   0.75 
   
 −6   −1 
−3 −0.25

5.2. Análisis de varianza


Para el análisis de varianza se debe tener en cuenta que hay tres fuentes de variación
adicionales en el modelo que consiste en el ajuste por el bloque fila, el ajuste por el bloqueo
columna y el ajuste por el bloqueo letra griega. Lo anterior implica separar la varianza de-
bida al efecto del factor de bloqueo fila, al efecto del factor de bloqueo columna y al efecto
del factor de bloqueo letra griega de la varianza debida a los tratamientos. Para esto se va
a subdividir la matriz diseño X en cuatro partes en que la primera parte corresponde a las
columnas asociadas con los tratamientos (X τ ), la segunda parte corresponde a las columnas
asociadas al factor de bloque fila (X δ ), la tercera parte corresponde a las columnas asocia-
das con el factor de bloqueo columna (X γ ) y la cuarta parte corresponde a las columnas
asociadas con el factor de bloqueo letra griega (X ω ).
La hipótesis de interés es:

H0 :τ1 = τ2 = · · · = τt−1 = τt = 0 vs
Ha :Al menos un τi 6= 0, i = 1, 2, . . . , t.

H0 se rechazará si el P-valor asociado a los tratamientos es menor a α en la tabla del


análisis de varianza, tabla 14, y se concluirá que hay diferencia estadísticamente significativa
en el efecto medio de los tratamientos en consideración.

27
Notas de Clase elaboradas por L. M. González
5.2 Análisis de varianza DBCA y cuadro latino

Tabla 14: Análisis de varianza para un diseño en cuadro grecolatino.


Causa de Grad. de Suma de Cuadrado F-calculado P-valor
Variación Libertad Cuadrados Medio
SCT rat CM T rat
Tratam. t−1 Y tP τ Y P (Ft−1,gle > Fc )
t−1 CM E
SCF ila
Bl. fila t−1 Y tP δ Y
t−1
SCCol
Bl. columna t−1 Y tP γ Y
t−1
SCgriega
Bl l. griega t−1 Y tP ω Y
t−1
SCE
Error (t − 3)(t − 1) Y tY − Y tP X Y
gle
Total t2 − 1 Y t Y − nȳ 2
2
n = t y gle=grados de libertad del error.
1 P t P t P t
ȳ = yijk P X = X(X t X)−1 X t P ω = X ω (X tω X ω )−1 X tω
n i=1 j=1 k=1
P τ = X τ (X τ X τ ) X tτ
t −1
P δ = X δ (X tδ X δ )−1 X tδ P γ = X γ (X tγ X γ )−1 X tγ

Ejemplo 14 Continuando con el ejemplo 12:


     
0 0 1 1 0 0 1 0 0
0 1 0  0 1 0 1 0 0
     
1 0 0 0 0 1 1 0 0
     
−1 −1 −1 −1 −1 −1 1 0 0
     
0 1 0  1 0 0 0 1 0
     
0 0 1  0 1 0 0 1 0
     
−1 −1 −1 0 0 1 0 1 0
     
1 0 0  −1 −1 −1 0 1 0

Xτ =   Xδ =   Xγ =  
−1 −1 −1, 1 0 0 0 0 1
     
1 0 0  0 1 0 0 0 1
     
0 1 0  0 0 1 0 0 1
     
0 0 1  −1 −1 −1 0 0 1
     
1 0 0  1 0 0 −1 −1 −1
     
−1 −1 −1 0 1 0 −1 −1 −1
     
0 0 1 0 0 1 −1 −1 −1
0 1 0 −1 −1 −1 −1 −1 −1

28
Notas de Clase elaboradas por L. M. González
5.3 Programa en R para diseño en cuadro grecolatino DBCA y cuadro latino

 
0 1 0
1 0 0
 
0 0 1
 
−1 −1 −1
 
−1 −1 −1
 
0 0 1
 
1 0 0
 
0 1 0
Xω = 
0

 0 1
−1 −1 −1
 
0 1 0
 
1 0 0
 
1 0 0
 
0 1 0
 
−1 −1 −1
0 0 1

Tabla 15: Análisis de varianza para los datos del ejemplo 12.
Causa de Grad. de Suma de Cuadrado F-calculado P-valor
Variación Libertad Cuadrados Medio
Método 3 95.5 31.833 3.4727 >0.10
Operario 3 19 6.333
Orden 3 0.5 0.1667
sitio 3 7.5 2.5
Error 3 27.5 9.167
Total 15 150

Se concluye de la tabla 15 que no hay efecto del método de ensamblaje sobre el tiempo
de ensamblaje de un componenete de televisores a color.

Ejercicio 6 Suponga que el diseño en cuadro grecolatino dado en la tabla 13 es replicado


r veces.

1. De el modelo lineal y su correspondiente matriz diseño considerando las restricciones


usuales para los parámetros del modelo.
2. Deducir la suma de cuadrados, esperanza de los cuadrados medios y distribución (ma-
tricialmente).
3. Construir el análisis de varianza.

5.3. Programa en R para diseño en cuadro grecolatino


remove(list=ls()) # limpiando las bases de datos
library(stats) # Cargando la libreria stats
#reading data base
operador <- c(1,1,1,1,2,2,2,2,3,3,3,3,4,4,4,4)
orden <- c(1,2,3,4,1,2,3,4,1,2,3,4,1,2,3,4)
sitio <- c(2,1,3,4,4,3,1,2,3,4,2,1,1,2,4,3)
metodo <- c(3,2,1,4,2,3,4,1,4,1,2,3,1,4,3,2)
tiempo <- c(11,8,9,9,10,12,11,8,14,10,7,18,8,12,15,6)
metodos.f = data.frame(operador,orden,sitio,metodo,tiempo)

29
Notas de Clase elaboradas por L. M. González
REFERENCIAS DBCA y cuadro latino

coperador.factor=factor(operador)
corden.factor=factor(orden)
csitio.factor=factor(sitio)
cmetodo.factor=factor(metodo)
ajuste = aov(tiempo ~ coperador.factor + corden.factor + csitio.factor +
cmetodo.factor) # La instrucción aov genera el análisis de varianza
summary(ajuste)
ajuste$model
ajuste$residuals
ajuste$fitted.values

Referencias
Canavos, G. (1988). Probabilidad y estadística. Aplicaciones y Métodos. México: Mc Graw-
Hill.

Cochran, W. & Gertrude, M. (1974). Diseño experimentales. 3ra edición. México: Editorial
Trillas S.A.

Conover, W. J. (1980). Practical nonparametric statistics. 2da edición. New York: John
Wiley & Sons.

Dean, A. & Voss, D. (1999). Design and analysis of experiments. New York: Springer.

Hinkelmann, K. & Kempthorne, O. (1994). Design and analysis of experiments. VolumenI:


Introduction to Experimental Design. John Wiley & Sons.

Melo, O., López, L. & Melo, S. (2007). Diseño de Experimento métodos y aplicaciones. 1a
Edición. Universidad Nacional de Colombia, Sede Bogotá. Facultad de Ciencias.

Montgomery, D. (2002). Diseño y análisis de experimentos. Segunda edición. México: Edi-


torial Limusa SA.

30