Beruflich Dokumente
Kultur Dokumente
Introduccin o
Estudiaremos si un conjunto de factores (con dos o ms niveles a cada uno) inuye sobre los valores medios de una variable respuesta Y . Intentaremos determinar qu factores inuyen e realmente sobre Y . Es importante el diseo del experimento para asegurar la n homogeneidad dentro de cada poblacin y reducir el error o experimental. Ejemplo 2.1: En 1973 la compa petrol na fera Texaco inform al o Subcomit de Contaminacin Ambiental sobre la eciencia del e o ltro Octel para reducir la emisin de gases contaminantes en los o coches. Una de las posibles desventajas del ltro era que aumentaba el ruido producido por los automviles. La compa o na ofrec datos del ruido (en decibelios) producido por coches a provistos del ltro Octel frente al producido por coches desprovistos de l y deduc que no exist diferencia. e a a
Estad stica (CC. Ambientales). Profesora: Amparo Ba llo Tema 2: Diseo de experimentos (varios factores) n 2
Ejemplo 2.1 (cont.): Nivel de ruido (en decibelios) Sin ltro Octel
810 820 820 840 840 845 785 790 785 835 835 835 845 855 850 760 760 770 820 820 820 820 820 825 775 775 775 825 825 825 815 825 825 770 760 765
860 840 820 800 780 760 Sin filtro Filtro Octel
Tema 2: Diseo de experimentos (varios factores) n 3
Ejemplo 2.1 (cont.): Es un problema de ANOVA con I = 2 grupos. El contraste de igualdad de medias no muestra evidencia de que el ltro Octel sea ms ruidoso. a
F.V. Explicada Residual Total S.C. 1056.3 28818.1 29874.3 g.l. 1 34 35 C.M. 1056.3 847.6 F F = 1.24 < F1,34,0.05 = 4.13
El error experimental de estos datos es muy grande comparado con la posible diferencia entre el ruido medio emitido por ambos grupos, razn por la cual quiz no detectemos dicha diferencia. o a El error experimental puede deberse a la inuencia de otros factores (gama de coche: alta, media o baja) sobre la respuesta. En algunos casos quiz podamos medir y controlar estos factores a (y reducir el error) y en otros no seremos capaces de detectarlos (pero esperamos que inuyan poco en la respuesta).
Estad stica (CC. Ambientales). Profesora: Amparo Ba llo Tema 2: Diseo de experimentos (varios factores) n 4
Cuando aceptamos H0 : 1 = 2 = . . . = I , o bien es porque las medias son todas iguales, o bien porque no podemos detectar la diferencia entre las medias debido a que es demasiado grande. El diseo de experimentos intenta reducir el error experimental para n que ste no oculte una diferencia signicativa entre las respuestas e medias. Uno de nuestros objetivos ser realizar comparaciones a entre grupos lo ms homogneos posible y tratar de detectar los a e factores que realmente inuyen sobre la variable de inters. e Estudiaremos tres casos: Dos factores (diseo por bloques) n Dos factores con interaccin o Tres factores (cudrados latinos)
Aleatorizacin o Consiste en asignar todos los factores no controlados aleatoriamente a las observaciones. Esto previene sesgos en las observaciones y reduce la dependencia de stas entre s e . Ejemplo 2.1 (cont.): Supongamos que en las pruebas se utilizaron dos marcas de coche exclusivamente, Ford y Seat, pero que el factor marca no nos interesa. Si los ltros Octel se instalan en los Ford y los silenciadores en los Seat y la marca Seat es ms silenciosa que la a Ford quiz lleguemos a la conclusin de que el ltro hace a o demasiado ruido cuando en realidad el efecto ha sido causado por la marca Ford. Una manera de resolver este problema es, al ir a tomar una nueva observacin, escoger al azar la marca de ese o coche de entre las dos disponibles.
El principio de aleatorizacin tambin se utiliza para prevenir el o e efecto de aprendizaje o de fatiga. Supongamos que queremos comparar tres programas estad sticos, A, B y C, para su posible uso en la docencia de una asignatura. Se evaluar, entre otras cosas, si los programas son de fcil manejo y a a comprensin. Se pide a seis estudiantes que analicen algunos o conjuntos de datos, cada uno de ellos con esos tres programas. Si todos resuelven cada problema utilizando los programas en el orden A, B, C, es probable que los programas B o C les parezcan mejor, porque la utilizacin del programa A previamente les ha servido o para aprender. Para evitar este efecto se asignar aleatoriamente a a cada estudiante un orden de utilizacin de los programas: o estudiante programas 1 A B C 2 B C A 3 C B A 4 B A C 5 C A B 6 A C B
8
La repeticin del experimento o Puesto que lo que deseamos es detectar las posibles diferencias entre medias de poblaciones y la varianza de una media muestral es 2 /n, disminuiremos el error experimental aumentando el tamao muestral n, es decir, repitiendo ms veces el experimento. n a Diseo factorial n Supongamos que medimos el nivel de ruido emitido por un coche en funcin de si lleva o no un ltro, pero hay otro factor (la gama) o que inuye en la respuesta. Podemos eliminar la presencia de ese factor utilizando la misma gama de coche en todo el experimento. En esto consiste el diseo clsico de experimentos: eliminar el n a efecto de todos los factores que puedan afectar a la respuesta, excepto la presencia o no del ltro, manteniendo jos sus valores a lo largo de todo el experimento.
Estad stica (CC. Ambientales). Profesora: Amparo Ba llo Tema 2: Diseo de experimentos (varios factores) n 9
Otra opcin es utilizar distintas gamas de coche tanto para la o presencia de ltro como para su ausencia. Esto es razonable si queremos extender las conclusiones del experimento a cualquier tipo de coche (y no slo a los de una determinada gama). o En general, trataremos de introducir en el experimento todos los factores que puedan afectar a la respuesta y observaremos sta e para distintos niveles de los factores. En el diseo factorial con dos factores se cruzan todos los posibles n niveles del factor que ms nos interesa (la presencia o no de ltro) a con todos los posibles niveles del otro factor (la gama del automvil). Las observaciones obtenidas se presentan en una tabla o de doble entrada.
10
Ejemplo 2.1 (cont.) Texaco en realidad proporcion ms o a informacin en su informe del ltro Octel: o Gama veh culo Baja Media Alta 810 840 785 820 840 790 820 845 785 835 845 760 835 855 760 835 850 770 820 820 775 820 820 775 820 825 775 825 815 770 825 825 760 825 825 765
Tema 2: Diseo de experimentos (varios factores) n 11
Silenciador
Filtro Octel
A esa variable experimental, como la gama del coche, que a priori no nos interesa directamente, pero que incluimos en las observaciones para reducir el error experimental se la llama variable bloque (o factor secundario). El factor principal tambin se e denomina tratamiento. El diseo experimental ms sencillo, llamado modelo en bloques n a aleatorizados, cruza todos los posibles niveles del factor de inters e con todos los niveles de la variable bloque y observa la variable respuesta al menos una vez para cada una de esas combinaciones. El resto de factores que puedan afectar al experimento (como el punto de instalacin del ltro en el coche) se asignarn al azar o a (aleatorizacin) a cada combinacin del bloque con el factor. o o
12
13
Factor 2 1 Factor 1 1 2 . . . I Medias por columnas y11 y21 . . . yI 1 y1 2 y12 y22 yI 2 y2 ... ... ... J y1J y2J . . . yIJ yJ Medias por las y1 y2 . . . yI y
14
Ejemplo 2.2: Se realiza un estudio del efecto de la luz sobre el crecimiento de los helechos. Como la tasa de crecimiento depende de la edad de la planta se utilizan cuatro plantas jvenes (plantas o crecidas en la oscuridad durante cuatro d y cuatro plantas ms as) a viejas (crecidas en las oscuridad durante doce d as). Se investigan cuatro tratamientos de luz diferentes: se expone la planta a una unica dosis de luz, se la pone de nuevo en la oscuridad y se mide el rea (en m2 ) de seccin transversal del extremo del helecho a o veinticuatro horas despus de administrrsele la luz. Se asigna un e a helecho elegido aleatoriamente a cada cruce de los dos factores. Longitud de onda de la luz 420 nm 460 nm 600 nm 720 nm 1017.6 929.0 939.8 1081.5 854.7 689.9 841.5 797.4
15
El modelo en bloques aleatorizados Se supone que el valor medio de la respuesta Y es un cierto , que si el primer factor est en el nivel i entonces el valor medio de Y se a incrementa en una cantidad i y que si el segundo factor est en a un nivel j entonces la media de la respuesta se incrementa en j . Imponemos la hiptesis de que no existe interaccin entre ambos o o factores, es decir, que el efecto del factor principal no depende del nivel j de la variable bloque (y viceversa). El modelo es Yij = + i + j + Uij , i = 1, . . . , I , j = 1, . . . , J,
siendo Uij variables aleatorias independientes N(0, 2 ) que representan el error experimental.
16
En consecuencia, Yij N( + i + j , 2 ) para i = 1, . . . , I , j = 1, . . . , J, y adems son independientes entre s a . Como los i y j representan efectos incrementales supondremos adems que a
I J
i = 0
i=1
y
j=1
j = 0.
17
yij = y
i=1 j=1
= yi = yi y = yj = yj y
i = 0.
i=1
j = 0.
j=1
Estad stica (CC. Ambientales). Profesora: Amparo Ba llo Tema 2: Diseo de experimentos (varios factores) n 18
Residuo eij
= Valor observado Valor previsto con el modelo = yij yij = yij ( + i + j ) = yij + y yi yj
Ejemplo 2.2 (cont.): Edad Joven Adulto yj j Longitud de onda de la luz 420 nm 460 nm 600 nm 720 nm 1017.6 929.0 939.8 1081.5 854.7 689.9 841.5 797.4 yi i
19
eij = 0,
i=1
j = 1, . . . , J,
j=1
eij = 0,
i = 1, . . . , I .
I J
eij = 0.
Luego el nmero de restricciones sobre los residuos es I + J 1 y u el nmero de residuos independientes es (I 1)(J 1). u Un estimador centrado de 2 es la varianza residual
2 sR
1 = (I 1)(J 1)
J 2 eij .
i=1 j=1
20
N , i j
2 (I 1)(J 1)sR 2
2 n
N i , (I 1)
2 n 2 N j , (J 1) n
2 1)(J1) (I
21
Anlisis de la varianza a Para averiguar si el primer factor inuye en el nivel medio de la respuesta contrastaremos H0
(1)
: :
1100
(1) H1
Joven
Viejo
Tema 2: Diseo de experimentos (varios factores) n 22
: :
(2)
Si alguno de los dos factores no fuera inuyente quiz podr a amos obviarlo y utilizar el modelo del Tema 1. Para realizar estos contrastes descomponemos la variabilidad total
I J
VT =
i=1 j=1
(yij )2
en trminos asociados a los distintos factores. Observemos que e yij = yij y = i + j + eij . Por tanto,
I J I J 2 eij . i=1 j=1
23
VT = J
i=1
i2 + I
j=1
j2 +
i2
VE() = I
j=1
j2
VNE =
25
Tabla ADEVA para el anlisis de la varianza con dos factores: a Fuentes de variacin o Factor 1 Factor 2 Residual Total Suma de cuadrados VE() VE() VNE VT Grados de libertad I 1 J 1 (I 1)(J 1) n1 Varianzas
2 s = 2 s =
VE() I 1 VE() J 1
2 sR
2 sy =
VT n1
26
27
Si el primer factor no inuye sobre el nivel medio de la respuesta, es (1) decir, si la hiptesis H0 : i = 0 para todo i es cierta, entonces o VE() 21 I 2 y es independiente de la VNE. Entonces F (1) = y rechazamos H0
(1) 2 s F(I 1),(I 1)(J1) 2 sR
28
Anlogamente, si el segundo factor no inuye y la hiptesis a o (2) H0 : j = 0 para todo j es cierta, entonces F (2) = y rechazamos H0
(2) 2 s 2 sR
F(J1),(I 1)(J1)
29
Observacin: Si alguno de los factores no inuye, entonces este o diseo en bloques aleatorizados es menos ecaz que el que vimos n en el Tema 1 (diseo completamente aleatorizado). Entonces n deber amos obviar la clasicacin dada por el factor no relevante y o construir una tabla ADEVA con un solo factor. Ejemplo 2.2 (cont.):
En cambio, si el segundo factor inuye signicativamente sobre el valor medio de la respuesta, entonces el estad stico F (1) del contraste en bloques aleatorizados es ms sensible a las diferencias a entre tratamientos que el estad stico F del contraste completamente aleatorizado.
Estad stica (CC. Ambientales). Profesora: Amparo Ba llo Tema 2: Diseo de experimentos (varios factores) n 30
El coeciente de determinacin o El coeciente de determinacin es la proporcin de variabilidad o o total explicada por el modelo en bloques aleatorizados R2 = VE() + VE() VE = . VT VT
2 2 2 Observemos que R 2 = R + R , siendo R = VE()/VT el coeciente de determinacin parcial del primer factor y o 2 = VE()/VT el coeciente de determinacin parcial del R o segundo factor.
31
Anlisis de las diferencias entre medias a Si el anlisis de la varianza revela la inuencia de uno de los a factores sobre la respuesta, debemos averiguar qu niveles de este e factor son realmente distintos entre s . Estimamos las diferencias entre los niveles i y k del primer factor mediante i k = yi yk . Adems utilizaremos que a i k (i k ) t(I 1)(J1) 2 sR / J Anlogamente estimamos las diferencias entre los niveles j y del a segundo factor mediante j = yj y . Se cumple que j (j ) t(I 1)(J1) . 2 sR / I
Estad stica (CC. Ambientales). Profesora: Amparo Ba llo Tema 2: Diseo de experimentos (varios factores) n 32
33
Diagnosis del modelo Se har mediante anlisis grco de los residuos. Las hiptesis de a a a o normalidad, homocedasticidad e independencia se comprobarn a igual que en el Tema 1. Ejemplo 2.2: Histograma de los residuos
Histograma de los residuos no estandarizados
2,0
1,5
1,0
0,5
34
Estadsticos descriptivos N Residuo N vlido (segn lista) Estadstico 8 8 Asimetra Estadstico ,000 Error tpico ,752 Curtosis Estadstico -1,706 Error tpico 1,481
35
36
Modelo sin interaccin y K replicaciones o Ejemplo 2.1 (cont.): En la pgina 11, por cada cruce del nivel i a del factor principal (con/sin ltro) con el nivel j de la variable bloque (gama de veh culo), tenemos K = replicaciones. Queremos ver si alguno de los dos factores inuye en el nivel medio de ruido provocado por el automvil. o El modelo de Anlisis de la Varianza con dos factores, sin a interaccin y K replicaciones es o Yijk = + i + j + Uijk , donde i = 1, . . . , I , j = 1, . . . , J, k = 1, . . . , K ,, Uijk N(0, 2 ) son independientes entre s , I i = 0 y J j = 0. i=1 j=1
37
yijk
i=1 j=1 k=1
= yi y = yj y
yijk ,
j=1 k=1 J K
i = 1, . . . , I ,
yj =
yijk ,
j=1 k=1
j = 1, . . . , J.
38
i2
j2
Variabilidad total = VT =
i=1 j=1 k=1
(yijk y )2 .
Residuos del modelo con replicaciones: eijk = yijk yijk = yijk ( + i + j ) = yijk + y yi yj
I J K 2 eijk . i=1 j=1 k=1
Estad stica (CC. Ambientales). Profesora: Amparo Ba llo Tema 2: Diseo de experimentos (varios factores) n 39
Ejemplo 2.1 (cont.): Residuos VE() = Silenciador Gama veh culo Baja Media Alta
VE() =
VT = Filtro Octel
VNE =
40
Rechazo H0
(2)
42
Ejemplo 2.1 (cont.): Histograma y grco probabil a stico normal de los residuos
Normal Probability Plot
0.99 0.98 0.95 0.90 0.75 0.50 0.25 0.10 0.05 0.02 0.01 20
10
Data
10
43
10
10
20 760
780
800
820
840
44
establece que E (Yij ) = + i + j . No existe interaccin entre los dos factores. o Por ejemplo, se cumple que para cualquier j = 1, . . . , J, E (Y4j ) E (Y1j ) = 4 1 . En el Ejercicio 2.2 esto signica que la diferencia entre el consumo medio de gasolina de un coche espaol y japons es la misma n e independientemente de si estamos conduciendo en hora punta o en carretera llana.
Estad stica (CC. Ambientales). Profesora: Amparo Ba llo Tema 2: Diseo de experimentos (varios factores) n 45
En el modelo sin interaccin, al representar las respuestas medias o para valores jos de uno de los factores, las l neas son paralelas.
E(Yij) en modelo sin interaccin +1+1 +1+2
+1+3
+4+3 +3+3
j=1
j=2
j=3
46
donde Uij N(0, 2 ) son independientes y ()ij son parmetros a que describen la interaccin entre los factores. o En este modelo hay IJ + 1 parmetros desconocidos. Si slo a o tenemos una observacin yij para cada (i, j), no podemos o estimarlos todos. En este caso, aunque podr amos modelizar la interaccin con una expresin ms simple, utilizaremos siempre el o o a modelo sin interaccin. o Cuando hay K 2 replicaciones por cada cruce de los dos factores s podemos ajustar el modelo con interaccin a nuestros datos. o Ejemplo 2.1 (cont.): En la pgina 11, por cada cruce del nivel i a del factor principal (con/sin ltro) con el nivel j de la variable bloque (gama de veh culo), tenemos K = replicaciones.
Estad stica (CC. Ambientales). Profesora: Amparo Ba llo Tema 2: Diseo de experimentos (varios factores) n 47
i = 0
i=1
;
j=1
j = 0
;
i=1 J
()ij = 0, j = 1, . . . , J ()ij = 0, i = 1, . . . , I .
j=1
()ij = E (Yij ) i j = desviacin de la respuesta esperada o respecto de la prediccin dada por el modelo sin interaccin o o
Estad stica (CC. Ambientales). Profesora: Amparo Ba llo Tema 2: Diseo de experimentos (varios factores) n 48
1 IJK
yijk
i=1 j=1 k=1
= yi y = yj y = yij yi yj + y yijk
1 JK 1 IK
k=1 J
yijk ,
j=1 k=1 J K
i = 1, . . . , I , j = 1, . . . , J.
Tema 2: Diseo de experimentos (varios factores) n 49
yijk ,
j=1 k=1
Alta
785 790 785 760 760 770
yi
Sin ltro
y11 = ()11 =
820 820 820 825 825 825
y12 = ()12 =
820 820 825 815 825 825
y13 = ()13 =
775 775 775 770 760 765
F. Octel
y21 = ()21 =
y22 = ()22 =
y23 = ()23 =
yj j
y =
50
Residuos: eijk = yijk yijk = yijk ( + i + j + ()ij ) = yijk yij Tienen IJ(K 1) g.l., pues
Ejemplo 2.1 (cont.): Residuos Baja -15,83 -5,83 -5,83 9,17 9,17 9,17 -2,50 -2,50 -2,50 2,50 2,50 2,50 K k=1 eijk
Gama veh culo Media -5,83 -5,83 -0,83 -0,83 9,17 4,17 -1,67 -1,67 3,33 -6,67 3,33 3,33 Alta 10,00 15,00 10,00 -15,00 -15,00 -5,00 5,00 5,00 5,00 0,00 -10,00 -5,00
Sin ltro
Filtro Octel
51
(yijk y )2
VE() = JK
i=1
i2
I J
VE() = IK
j=1 K 2 eijk i=1 j=1 k=1 I J 2
j2
VNE =
VE() = K
i=1 j=1
()ij
52
Tabla ANOVA para dos factores con K replicaciones y con interaccin: o FV Factor Factor Interaccin o Residual Total SC VE() VE() VE() VNE VT gl I 1 J 1 (I 1)(J 1) IJ(K 1) n1 CM
2 s =
VE() I 1 VE() J 1
2 s =
2 s =
2 sR =
2 sy =
: i = 0, i = 1, . . . , I R (1) = F (1) =
2 s > FI 1,IJ(K 1), 2 sR
H0
(2)
: j = 0, j = 1, . . . , J R
(2)
(2)
2 s 2 sR
H0
(3)
: ()ij = 0, i = 1, . . . , I , j = 1, . . . , J R
(3)
(3)
2 s 2 sR
Aunque no rechacemos H0 , no conviene unir VE() con VNE a menos que F (3) sea muy prximo a 1. o La diagnosis del modelo se realiza mediante anlisis de los residuos. a
Estad stica (CC. Ambientales). Profesora: Amparo Ba llo Tema 2: Diseo de experimentos (varios factores) n 54
(3)
55
Ejemplo 2.3: Se investiga el efecto de diferentes tipos de msica u sobre enfermos de Alzheimer. Se eligen enfermos con un desarrollo bajo y medio de la enfermedad y se prueban tres tipos de msica: u interludios de piano, Mozart y msica ligera. La variable respuesta u es el nivel de agitacin del enfermo. o Msica u Desarrollo enfermedad Bajo Interludios 21 24 22 18 20 22 20 25 18 20 Mozart 9 12 10 5 9 14 18 11 9 13 Ligera 29 26 30 24 26 15 18 20 13 19
56
Medio
Ejemplo 2.3 (cont.): Msica u Desarrollo enfermedad Bajo Interludios 21 24 22 18 20 y11 = ()11 = 22 20 25 18 20 y21 = ()21 = Mozart 9 12 10 5 9 Ligera 29 26 30 24 26 yi i
Medio
14 18 11 9 13
15 18 20 13 19
yj j
Estad stica (CC. Ambientales). Profesora: Amparo Ba llo
y =
Tema 2: Diseo de experimentos (varios factores) n 57
58
Ejemplo 2.3 (cont.): Residuos eijk Msica u Des. enf. Bajo Int. 0 3 1 -3 -1 1 -1 4 -3 -1 Moz. 0 3 1 -4 0 1 5 -2 -4 0 Lig. 2 -1 3 -3 -1 -2 1 3 -4 2 Des. enf. Bajo Int. 21 21 21 21 21 21 21 21 21 21 Valores previstos yijk Msica u Moz. 9 9 9 9 9 13 13 13 13 13 Lig. 27 27 27 27 27 17 17 17 17 17
Medio
Medio
59
Residuos
60
0.15
0.1
0.05
0 5
Una manera grca de estudiar si existe interaccin es representar a o las medias muestrales yij para valores jos de uno de los factores. Si las l neas no son paralelas, concluimos que existe interaccin. o Ejemplo 2.3 (cont.):
30 25 20 15 10 5 D. bajo D. medio
Interludios
Ligera
62
820
800
780
63
i = 0 ,
i=1 I J j=1 I
j = 0 ,
k=1
k = 0
K
()ij =
i=1 I j=1
()ij =
i=1 J
()ik =
k=1 K
()ik = . . . = 0
()ijk =
i=1 j=1
()ijk =
k=1
()ijk = 0.
64
i , j , k = Efectos principales ()ij , ()jk , ()ik = Interacciones de segundo orden ()ijk = Interacciones de tercer orden a No de observaciones = IJK < No de parmetros a estimar = IJK + 1 En un diseo con tres factores a cuatro niveles cada uno y sin n replicacin se necesitan 43 = 64 observaciones. Existe un diseo o n ms restrictivo pero ms sencillo que slo precisa 42 = 16 a a o observaciones: el cuadrado latino.
65
Cuadrado latino Este diseo se utiliza cuando n hay tres factores; el nmero de niveles de los tres factores es el mismo, I ; u no hay interaccin entre los factores. o El cuadrado latino tiene n = I 2 observaciones. Cada nivel de un factor se cruza slo una vez con cada nivel de los otros dos o factores. En la prctica se forma una cuadr a cula con I las e I columnas y se asignan I letras de tal manera que no haya letras repetidas en ninguna la ni en ninguna columna. Por ejemplo, si I = 3, existen 12 diseos posibles. Uno es n A C B C B A B A C y11(1) y21(3) y31(2) y12(3) y22(2) y32(1) y13(2) y23(1) y33(3)
66
Ejemplo 2.4: Se desea evaluar si el tipo de riego (por goteo, aspersin o sin riego) puede contribuir a la proteccin de cultivos o o de fresas frente al fr extremo. En todos los casos se utiliza un o mantillo plstico sobre la tierra de cultivo. Por otro lado, se a supone que hay otros factores, como la humedad y el contenido en nitrgeno del suelo, que tambin pueden inuir. Cul de los o e a siguientes diseos del experimento ser ms adecuado? n a a Nivel de nitrgeno o Alto Medio Bajo Nivel Alto No riego Goteo Aspersin o de Medio No riego Aspersin No riego o humedad Bajo Goteo Goteo Aspersin o Nivel de nitrgeno o Alto Medio Bajo Nivel Alto No riego Goteo Aspersin o de Medio Goteo Aspersin No riego o humedad Bajo Aspersin No riego o Goteo
Estad stica (CC. Ambientales). Profesora: Amparo Ba llo Tema 2: Diseo de experimentos (varios factores) n 67
Un ejemplo con I = 5: Deseamos contrastar la ecacia de 5 fertilizantes diferentes (A,B,C,D,E) sobre un cultivo espec co. Queremos utilizar los 5 fertilizantes, esperar a que el cultivo madure y medir el resultado de la cosecha por unidad de supercie con cada fertilizante. Pero terrenos contiguos pueden variar en fertilidad debido a mltiples u causas (diferencias de humedad, uso previo del terreno, etc.). Para reducir la variabilidad experimental dividimos el terreno en una ret cula de 5 x 5 rectngulos y en cada uno utilizamos un a fertilizante segn el siguiente diseo de cuadrado latino: u n
Estad stica (CC. Ambientales). Profesora: Amparo Ba llo Tema 2: Diseo de experimentos (varios factores) n 68
A B C D E
B D E C A
C A D E B
D E E C B A A field planted with a crop using five different treatments according to a 5 5 latin square arrangement. A B Suppose we want to test the relative effectiveness of 5 different fertilizer mixtures on a crop of, say, oats. We apply the C D fertilizer, wait for the crop to mature, harvest it and measure the yield per unit area. But the five experiments cannot be car
x
out on the same plot of land. Even contiguous plots may vary in fertility because of a moisture gradient, different previous of the land, or some other reason. Dividing a single plot into a 5 x 5 grid of subplots, and administering the fertilizers (labe randomly A, B, C, D, E) according to a latin square arrangement like the one used in the figure above:
A B B D C E Dno DiseC E A C D E A E C D B A E A experimentos de B B C D
Tema 2:
(varios factores)
69
i =
i=1 j=1
j =
k=1
k = 0.
i j k
= = =
70
yij()
i=1 j=1
j = yj y
k = yk y
donde yij() es la observacin de la casilla (i, j) sea cual sea la letra o asociada y yi = 1 I
I
yij()
j=1
yj =
1 I
yij()
i=1
yk =
1 I
yij(k)
i=1 j=1
gl 2 i
i=1 I
CM
2 s =
VE() = I
I 1
Efecto columna
VE() = I
j=1 I
j2 k 2
k=1 I 2 eij()
I 1
2 s =
Efecto letra
VE() = I
I
I 1
2 s =
Residual
VNE =
i=1 j=1 I I
(I 1)(I 2)
2 sR =
VNE (I 1)(I 2) VT n1
Total
VT =
i=1 j=1
(yij() y )2
n1
2 sy =
72
H0
(2)
H0
(3)
73
Ejemplo 2.4 (cont.): El estudio sobre la proteccin del cultivo de o fresas frente al fr produjo nalmente los datos que se indican o debajo. La efectividad de los mtodos de irrigacin se midi en e o o funcin del peso de los frutos congelados. Cul de los mtodos o a e protegi mejor el cultivo? o Nivel de nitrgeno o Alto Medio Bajo 51 (G) 119 (A) 60 (NR) 98 (NR) 43 (G) 31 (A) 99 (A) 87 (NR) 49 (G)
Nivel de humedad
74