Sie sind auf Seite 1von 74

Tema 2.

Modelos de diseo de n experimentos (varios factores)

Estad stica (CC. Ambientales). Profesora: Amparo Ba llo

Tema 2: Diseo de experimentos (varios factores) n

Introduccin o
Estudiaremos si un conjunto de factores (con dos o ms niveles a cada uno) inuye sobre los valores medios de una variable respuesta Y . Intentaremos determinar qu factores inuyen e realmente sobre Y . Es importante el diseo del experimento para asegurar la n homogeneidad dentro de cada poblacin y reducir el error o experimental. Ejemplo 2.1: En 1973 la compa petrol na fera Texaco inform al o Subcomit de Contaminacin Ambiental sobre la eciencia del e o ltro Octel para reducir la emisin de gases contaminantes en los o coches. Una de las posibles desventajas del ltro era que aumentaba el ruido producido por los automviles. La compa o na ofrec datos del ruido (en decibelios) producido por coches a provistos del ltro Octel frente al producido por coches desprovistos de l y deduc que no exist diferencia. e a a
Estad stica (CC. Ambientales). Profesora: Amparo Ba llo Tema 2: Diseo de experimentos (varios factores) n 2

Ejemplo 2.1 (cont.): Nivel de ruido (en decibelios) Sin ltro Octel
810 820 820 840 840 845 785 790 785 835 835 835 845 855 850 760 760 770 820 820 820 820 820 825 775 775 775 825 825 825 815 825 825 770 760 765

Nivel de ruido (en decibelios)

860 840 820 800 780 760 Sin filtro Filtro Octel
Tema 2: Diseo de experimentos (varios factores) n 3

Estad stica (CC. Ambientales). Profesora: Amparo Ba llo

Ejemplo 2.1 (cont.): Es un problema de ANOVA con I = 2 grupos. El contraste de igualdad de medias no muestra evidencia de que el ltro Octel sea ms ruidoso. a
F.V. Explicada Residual Total S.C. 1056.3 28818.1 29874.3 g.l. 1 34 35 C.M. 1056.3 847.6 F F = 1.24 < F1,34,0.05 = 4.13

El error experimental de estos datos es muy grande comparado con la posible diferencia entre el ruido medio emitido por ambos grupos, razn por la cual quiz no detectemos dicha diferencia. o a El error experimental puede deberse a la inuencia de otros factores (gama de coche: alta, media o baja) sobre la respuesta. En algunos casos quiz podamos medir y controlar estos factores a (y reducir el error) y en otros no seremos capaces de detectarlos (pero esperamos que inuyan poco en la respuesta).
Estad stica (CC. Ambientales). Profesora: Amparo Ba llo Tema 2: Diseo de experimentos (varios factores) n 4

Cuando aceptamos H0 : 1 = 2 = . . . = I , o bien es porque las medias son todas iguales, o bien porque no podemos detectar la diferencia entre las medias debido a que es demasiado grande. El diseo de experimentos intenta reducir el error experimental para n que ste no oculte una diferencia signicativa entre las respuestas e medias. Uno de nuestros objetivos ser realizar comparaciones a entre grupos lo ms homogneos posible y tratar de detectar los a e factores que realmente inuyen sobre la variable de inters. e Estudiaremos tres casos: Dos factores (diseo por bloques) n Dos factores con interaccin o Tres factores (cudrados latinos)

Estad stica (CC. Ambientales). Profesora: Amparo Ba llo

Tema 2: Diseo de experimentos (varios factores) n

El diseo del experimento n


Llamaremos variable respuesta a la variable de inters Y (el nivel e de ruido producido por el coche). Los factores o variables experimentales son aquellas variables que pueden afectar a los valores de la respuesta (el que un coche lleve o no el ltro, la gama de automvil). o Suponemos que la respuesta es continua y que los factores se prejan para el experimento en unos niveles determinados (ltro/silenciador, gama alta/media/baja). Podemos controlar o prejar el valor que toman algunos factores y luego observar el valor que toma Y . Pero en cualquier experimento habr numerosos factores que no midamos ni controlemos y que a contribuyen al error experimental. Hay tres posibles maneras de reducir este error: la aleatorizacin, la repeticin y los diseos o o n factoriales.
Estad stica (CC. Ambientales). Profesora: Amparo Ba llo Tema 2: Diseo de experimentos (varios factores) n 6

Aleatorizacin o Consiste en asignar todos los factores no controlados aleatoriamente a las observaciones. Esto previene sesgos en las observaciones y reduce la dependencia de stas entre s e . Ejemplo 2.1 (cont.): Supongamos que en las pruebas se utilizaron dos marcas de coche exclusivamente, Ford y Seat, pero que el factor marca no nos interesa. Si los ltros Octel se instalan en los Ford y los silenciadores en los Seat y la marca Seat es ms silenciosa que la a Ford quiz lleguemos a la conclusin de que el ltro hace a o demasiado ruido cuando en realidad el efecto ha sido causado por la marca Ford. Una manera de resolver este problema es, al ir a tomar una nueva observacin, escoger al azar la marca de ese o coche de entre las dos disponibles.

Estad stica (CC. Ambientales). Profesora: Amparo Ba llo

Tema 2: Diseo de experimentos (varios factores) n

El principio de aleatorizacin tambin se utiliza para prevenir el o e efecto de aprendizaje o de fatiga. Supongamos que queremos comparar tres programas estad sticos, A, B y C, para su posible uso en la docencia de una asignatura. Se evaluar, entre otras cosas, si los programas son de fcil manejo y a a comprensin. Se pide a seis estudiantes que analicen algunos o conjuntos de datos, cada uno de ellos con esos tres programas. Si todos resuelven cada problema utilizando los programas en el orden A, B, C, es probable que los programas B o C les parezcan mejor, porque la utilizacin del programa A previamente les ha servido o para aprender. Para evitar este efecto se asignar aleatoriamente a a cada estudiante un orden de utilizacin de los programas: o estudiante programas 1 A B C 2 B C A 3 C B A 4 B A C 5 C A B 6 A C B
8

Estad stica (CC. Ambientales). Profesora: Amparo Ba llo

Tema 2: Diseo de experimentos (varios factores) n

La repeticin del experimento o Puesto que lo que deseamos es detectar las posibles diferencias entre medias de poblaciones y la varianza de una media muestral es 2 /n, disminuiremos el error experimental aumentando el tamao muestral n, es decir, repitiendo ms veces el experimento. n a Diseo factorial n Supongamos que medimos el nivel de ruido emitido por un coche en funcin de si lleva o no un ltro, pero hay otro factor (la gama) o que inuye en la respuesta. Podemos eliminar la presencia de ese factor utilizando la misma gama de coche en todo el experimento. En esto consiste el diseo clsico de experimentos: eliminar el n a efecto de todos los factores que puedan afectar a la respuesta, excepto la presencia o no del ltro, manteniendo jos sus valores a lo largo de todo el experimento.
Estad stica (CC. Ambientales). Profesora: Amparo Ba llo Tema 2: Diseo de experimentos (varios factores) n 9

Otra opcin es utilizar distintas gamas de coche tanto para la o presencia de ltro como para su ausencia. Esto es razonable si queremos extender las conclusiones del experimento a cualquier tipo de coche (y no slo a los de una determinada gama). o En general, trataremos de introducir en el experimento todos los factores que puedan afectar a la respuesta y observaremos sta e para distintos niveles de los factores. En el diseo factorial con dos factores se cruzan todos los posibles n niveles del factor que ms nos interesa (la presencia o no de ltro) a con todos los posibles niveles del otro factor (la gama del automvil). Las observaciones obtenidas se presentan en una tabla o de doble entrada.

Estad stica (CC. Ambientales). Profesora: Amparo Ba llo

Tema 2: Diseo de experimentos (varios factores) n

10

Ejemplo 2.1 (cont.) Texaco en realidad proporcion ms o a informacin en su informe del ltro Octel: o Gama veh culo Baja Media Alta 810 840 785 820 840 790 820 845 785 835 845 760 835 855 760 835 850 770 820 820 775 820 820 775 820 825 775 825 815 770 825 825 760 825 825 765
Tema 2: Diseo de experimentos (varios factores) n 11

Silenciador

Filtro Octel

Estad stica (CC. Ambientales). Profesora: Amparo Ba llo

A esa variable experimental, como la gama del coche, que a priori no nos interesa directamente, pero que incluimos en las observaciones para reducir el error experimental se la llama variable bloque (o factor secundario). El factor principal tambin se e denomina tratamiento. El diseo experimental ms sencillo, llamado modelo en bloques n a aleatorizados, cruza todos los posibles niveles del factor de inters e con todos los niveles de la variable bloque y observa la variable respuesta al menos una vez para cada una de esas combinaciones. El resto de factores que puedan afectar al experimento (como el punto de instalacin del ltro en el coche) se asignarn al azar o a (aleatorizacin) a cada combinacin del bloque con el factor. o o

Estad stica (CC. Ambientales). Profesora: Amparo Ba llo

Tema 2: Diseo de experimentos (varios factores) n

12

Anlisis de la varianza con dos factores a (diseo en bloques aleatorizados) n


Tambin se denomina modelo simple con dos factores. Se utiliza e cuando queremos investigar el efecto de dos atributos independientes sobre una variable respuesta Y . Por ejemplo, deseamos averiguar si en el crecimiento de un helecho inuyen la longitud de onda de la luz que recibe y la edad de la planta. Denotamos por I y J el nmero de niveles del primer y segundo u factor respectivamente. Tenemos una unica observacin yij por o cada combinacin (i, j) del primer factor con el segundo y o disponemos los n = I J datos en una tabla de doble entrada.

Estad stica (CC. Ambientales). Profesora: Amparo Ba llo

Tema 2: Diseo de experimentos (varios factores) n

13

Factor 2 1 Factor 1 1 2 . . . I Medias por columnas y11 y21 . . . yI 1 y1 2 y12 y22 yI 2 y2 ... ... ... J y1J y2J . . . yIJ yJ Medias por las y1 y2 . . . yI y

Estad stica (CC. Ambientales). Profesora: Amparo Ba llo

Tema 2: Diseo de experimentos (varios factores) n

14

Ejemplo 2.2: Se realiza un estudio del efecto de la luz sobre el crecimiento de los helechos. Como la tasa de crecimiento depende de la edad de la planta se utilizan cuatro plantas jvenes (plantas o crecidas en la oscuridad durante cuatro d y cuatro plantas ms as) a viejas (crecidas en las oscuridad durante doce d as). Se investigan cuatro tratamientos de luz diferentes: se expone la planta a una unica dosis de luz, se la pone de nuevo en la oscuridad y se mide el rea (en m2 ) de seccin transversal del extremo del helecho a o veinticuatro horas despus de administrrsele la luz. Se asigna un e a helecho elegido aleatoriamente a cada cruce de los dos factores. Longitud de onda de la luz 420 nm 460 nm 600 nm 720 nm 1017.6 929.0 939.8 1081.5 854.7 689.9 841.5 797.4

Edad Joven Adulto

Estad stica (CC. Ambientales). Profesora: Amparo Ba llo

Tema 2: Diseo de experimentos (varios factores) n

15

El modelo en bloques aleatorizados Se supone que el valor medio de la respuesta Y es un cierto , que si el primer factor est en el nivel i entonces el valor medio de Y se a incrementa en una cantidad i y que si el segundo factor est en a un nivel j entonces la media de la respuesta se incrementa en j . Imponemos la hiptesis de que no existe interaccin entre ambos o o factores, es decir, que el efecto del factor principal no depende del nivel j de la variable bloque (y viceversa). El modelo es Yij = + i + j + Uij , i = 1, . . . , I , j = 1, . . . , J,

siendo Uij variables aleatorias independientes N(0, 2 ) que representan el error experimental.

Estad stica (CC. Ambientales). Profesora: Amparo Ba llo

Tema 2: Diseo de experimentos (varios factores) n

16

En consecuencia, Yij N( + i + j , 2 ) para i = 1, . . . , I , j = 1, . . . , J, y adems son independientes entre s a . Como los i y j representan efectos incrementales supondremos adems que a
I J

i = 0
i=1

y
j=1

j = 0.

Por tanto, los parmetros desconocidos en el modelo son , a 1 , . . . , I 1 , 1 , . . . , J1 y , un total de I + J.

Estad stica (CC. Ambientales). Profesora: Amparo Ba llo

Tema 2: Diseo de experimentos (varios factores) n

17

Estimacin de los parmetros del modelo o a Estimamos , i y j mediante mxima verosimilitud: a = i j 1 n


I J

yij = y
i=1 j=1

= yi = yi y = yj = yj y

Slo I 1 de los efectos incrementales i son independientes o


I

i = 0.
i=1

Asimismo slo J 1 de los j son independientes ya que o


J

j = 0.
j=1
Estad stica (CC. Ambientales). Profesora: Amparo Ba llo Tema 2: Diseo de experimentos (varios factores) n 18

Residuo eij

= Valor observado Valor previsto con el modelo = yij yij = yij ( + i + j ) = yij + y yi yj

Ejemplo 2.2 (cont.): Edad Joven Adulto yj j Longitud de onda de la luz 420 nm 460 nm 600 nm 720 nm 1017.6 929.0 939.8 1081.5 854.7 689.9 841.5 797.4 yi i

Estad stica (CC. Ambientales). Profesora: Amparo Ba llo

Tema 2: Diseo de experimentos (varios factores) n

19

I + J ecuaciones de restriccin para los residuos: o


I J

eij = 0,
i=1

j = 1, . . . , J,
j=1

eij = 0,

i = 1, . . . , I .
I J

De ellas una se puede deducir de las dems ya que a


i=1 j=1

eij = 0.

Luego el nmero de restricciones sobre los residuos es I + J 1 y u el nmero de residuos independientes es (I 1)(J 1). u Un estimador centrado de 2 es la varianza residual
2 sR

1 = (I 1)(J 1)

J 2 eij .

i=1 j=1

Ejemplo 2.2 (cont.):

Estad stica (CC. Ambientales). Profesora: Amparo Ba llo

Tema 2: Diseo de experimentos (varios factores) n

20

Propiedades de los estimadores de los parmetros a

N , i j
2 (I 1)(J 1)sR 2

2 n

N i , (I 1)

2 n 2 N j , (J 1) n

2 1)(J1) (I

Estad stica (CC. Ambientales). Profesora: Amparo Ba llo

Tema 2: Diseo de experimentos (varios factores) n

21

Anlisis de la varianza a Para averiguar si el primer factor inuye en el nivel medio de la respuesta contrastaremos H0
(1)

: :
1100

i = 0, para todo i = 1, . . . , I i = 0, para algn i = 1, . . . , I . u

(1) H1

Ejemplo 2.2 (cont.):


Crecimiento del helecho

1000 900 800 700 600

Joven

Viejo
Tema 2: Diseo de experimentos (varios factores) n 22

Estad stica (CC. Ambientales). Profesora: Amparo Ba llo

Tambin contrastaremos si el segundo factor inuye e H0 H1


(2)

: :

j = 0, para todo j = 1, . . . , J j = 0, para algn j = 1, . . . , J. u

(2)

Si alguno de los dos factores no fuera inuyente quiz podr a amos obviarlo y utilizar el modelo del Tema 1. Para realizar estos contrastes descomponemos la variabilidad total
I J

VT =
i=1 j=1

(yij )2

en trminos asociados a los distintos factores. Observemos que e yij = yij y = i + j + eij . Por tanto,
I J I J 2 eij . i=1 j=1
23

VT = J
i=1

i2 + I
j=1

j2 +

Estad stica (CC. Ambientales). Profesora: Amparo Ba llo

Tema 2: Diseo de experimentos (varios factores) n

VT = VE() + VE() + VNE , donde VE() = J


i=1 I

i2

es la variabilidad debida al primer factor,


J

VE() = I
j=1

j2

es la variabilidad debida al segundo factor y


I J 2 eij . i=1 j=1

VNE =

es la variabilidad residual o no explicada.


Estad stica (CC. Ambientales). Profesora: Amparo Ba llo Tema 2: Diseo de experimentos (varios factores) n 24

Ejemplo 2.2 (cont.):

Estad stica (CC. Ambientales). Profesora: Amparo Ba llo

Tema 2: Diseo de experimentos (varios factores) n

25

Tabla ADEVA para el anlisis de la varianza con dos factores: a Fuentes de variacin o Factor 1 Factor 2 Residual Total Suma de cuadrados VE() VE() VNE VT Grados de libertad I 1 J 1 (I 1)(J 1) n1 Varianzas
2 s = 2 s =

VE() I 1 VE() J 1
2 sR

2 sy =

VT n1

Estad stica (CC. Ambientales). Profesora: Amparo Ba llo

Tema 2: Diseo de experimentos (varios factores) n

26

Ejemplo 2.2 (cont.):

Estad stica (CC. Ambientales). Profesora: Amparo Ba llo

Tema 2: Diseo de experimentos (varios factores) n

27

Si el primer factor no inuye sobre el nivel medio de la respuesta, es (1) decir, si la hiptesis H0 : i = 0 para todo i es cierta, entonces o VE() 21 I 2 y es independiente de la VNE. Entonces F (1) = y rechazamos H0
(1) 2 s F(I 1),(I 1)(J1) 2 sR

al nivel de signicacin si o F (1) > F(I 1),(I 1)(J1), .

Estad stica (CC. Ambientales). Profesora: Amparo Ba llo

Tema 2: Diseo de experimentos (varios factores) n

28

Anlogamente, si el segundo factor no inuye y la hiptesis a o (2) H0 : j = 0 para todo j es cierta, entonces F (2) = y rechazamos H0
(2) 2 s 2 sR

F(J1),(I 1)(J1)

al nivel de signicacin si o F (2) > F(J1),(I 1)(J1), .

Ejemplo 2.2 (cont.):

Estad stica (CC. Ambientales). Profesora: Amparo Ba llo

Tema 2: Diseo de experimentos (varios factores) n

29

Observacin: Si alguno de los factores no inuye, entonces este o diseo en bloques aleatorizados es menos ecaz que el que vimos n en el Tema 1 (diseo completamente aleatorizado). Entonces n deber amos obviar la clasicacin dada por el factor no relevante y o construir una tabla ADEVA con un solo factor. Ejemplo 2.2 (cont.):

En cambio, si el segundo factor inuye signicativamente sobre el valor medio de la respuesta, entonces el estad stico F (1) del contraste en bloques aleatorizados es ms sensible a las diferencias a entre tratamientos que el estad stico F del contraste completamente aleatorizado.
Estad stica (CC. Ambientales). Profesora: Amparo Ba llo Tema 2: Diseo de experimentos (varios factores) n 30

El coeciente de determinacin o El coeciente de determinacin es la proporcin de variabilidad o o total explicada por el modelo en bloques aleatorizados R2 = VE() + VE() VE = . VT VT

2 2 2 Observemos que R 2 = R + R , siendo R = VE()/VT el coeciente de determinacin parcial del primer factor y o 2 = VE()/VT el coeciente de determinacin parcial del R o segundo factor.

Ejemplo 2.2 (cont.):

Estad stica (CC. Ambientales). Profesora: Amparo Ba llo

Tema 2: Diseo de experimentos (varios factores) n

31

Anlisis de las diferencias entre medias a Si el anlisis de la varianza revela la inuencia de uno de los a factores sobre la respuesta, debemos averiguar qu niveles de este e factor son realmente distintos entre s . Estimamos las diferencias entre los niveles i y k del primer factor mediante i k = yi yk . Adems utilizaremos que a i k (i k ) t(I 1)(J1) 2 sR / J Anlogamente estimamos las diferencias entre los niveles j y del a segundo factor mediante j = yj y . Se cumple que j (j ) t(I 1)(J1) . 2 sR / I
Estad stica (CC. Ambientales). Profesora: Amparo Ba llo Tema 2: Diseo de experimentos (varios factores) n 32

Ejemplo 2.2 (cont.):

Estad stica (CC. Ambientales). Profesora: Amparo Ba llo

Tema 2: Diseo de experimentos (varios factores) n

33

Diagnosis del modelo Se har mediante anlisis grco de los residuos. Las hiptesis de a a a o normalidad, homocedasticidad e independencia se comprobarn a igual que en el Tema 1. Ejemplo 2.2: Histograma de los residuos
Histograma de los residuos no estandarizados
2,0

1,5

1,0

0,5

0,0 -50 -25 0 25 50

Estad stica (CC. Ambientales). Profesora: Amparo Ba llo

Tema 2: Diseo de experimentos (varios factores) n

34

Ejemplo 2.2: Curtosis y asimetr de los residuos a

Estadsticos descriptivos N Residuo N vlido (segn lista) Estadstico 8 8 Asimetra Estadstico ,000 Error tpico ,752 Curtosis Estadstico -1,706 Error tpico 1,481

Estad stica (CC. Ambientales). Profesora: Amparo Ba llo

Tema 2: Diseo de experimentos (varios factores) n

35

Ejemplo 2.2: Diagrama de residuos frente a valores previstos


Ejemplo 2.2: Crecimiento de helechos 48,90 44,00 21,50
Residuo

16,60 -16,60 -21,50 -44,00 -48,90


711,40 792,60 838,10 841,40 907,50 988,70 1034,20 1037,50

Valor pronosticado o previsto

Estad stica (CC. Ambientales). Profesora: Amparo Ba llo

Tema 2: Diseo de experimentos (varios factores) n

36

Modelo sin interaccin y K replicaciones o Ejemplo 2.1 (cont.): En la pgina 11, por cada cruce del nivel i a del factor principal (con/sin ltro) con el nivel j de la variable bloque (gama de veh culo), tenemos K = replicaciones. Queremos ver si alguno de los dos factores inuye en el nivel medio de ruido provocado por el automvil. o El modelo de Anlisis de la Varianza con dos factores, sin a interaccin y K replicaciones es o Yijk = + i + j + Uijk , donde i = 1, . . . , I , j = 1, . . . , J, k = 1, . . . , K ,, Uijk N(0, 2 ) son independientes entre s , I i = 0 y J j = 0. i=1 j=1

Estad stica (CC. Ambientales). Profesora: Amparo Ba llo

Tema 2: Diseo de experimentos (varios factores) n

37

Estimacin de los parmetros del modelo: o a 1 = y = IJK i j donde yi = 1 JK 1 IK


J K I J K

yijk
i=1 j=1 k=1

= yi y = yj y

yijk ,
j=1 k=1 J K

i = 1, . . . , I ,

yj =

yijk ,
j=1 k=1

j = 1, . . . , J.

Estad stica (CC. Ambientales). Profesora: Amparo Ba llo

Tema 2: Diseo de experimentos (varios factores) n

38

Variabilidad debida al primer factor = VE() = JK


i=1 J

i2

Variabilidad debida al segundo factor = VE() = IK


j=1 I J K

j2

Variabilidad total = VT =
i=1 j=1 k=1

(yijk y )2 .

Residuos del modelo con replicaciones: eijk = yijk yijk = yijk ( + i + j ) = yijk + y yi yj
I J K 2 eijk . i=1 j=1 k=1
Estad stica (CC. Ambientales). Profesora: Amparo Ba llo Tema 2: Diseo de experimentos (varios factores) n 39

Variabilidad residual = VNE =

Ejemplo 2.1 (cont.): Residuos VE() = Silenciador Gama veh culo Baja Media Alta

VE() =

VT = Filtro Octel

VNE =

Estad stica (CC. Ambientales). Profesora: Amparo Ba llo

Tema 2: Diseo de experimentos (varios factores) n

40

Tabla ANOVA F.V. S.C. Factor 1 Factor 2 Residual Total Rechazo H0


(1)

g.l. I 1 J 1 IJK (I + J) + 1 IJK 1

VE() VE() VNE VT

C.M. VE() 2 s = I 1 2 = VE() s J 1 VNE 2 = sR IJK (I + J) + 1 VT 2 sy = IJK 1

: i = 0 para todo i = 1, . . . , I al nivel si F (1) =


2 s > F(I 1),IJK (I +J)+1, . 2 sR

Rechazo H0

(2)

: j = 0 para todo j = 1, . . . , J al nivel si F (2) =


2 s 2 sR

> F(J1),IJK (I +J)+1, .


Tema 2: Diseo de experimentos (varios factores) n 41

Estad stica (CC. Ambientales). Profesora: Amparo Ba llo

Ejemplo 2.1 (cont.):

Estad stica (CC. Ambientales). Profesora: Amparo Ba llo

Tema 2: Diseo de experimentos (varios factores) n

42

Ejemplo 2.1 (cont.): Histograma y grco probabil a stico normal de los residuos
Normal Probability Plot

0.35 0.3 0.25 0.2 0.15 0.1 0.05 0 15 10 5 0 5 10 15


Probability

0.99 0.98 0.95 0.90 0.75 0.50 0.25 0.10 0.05 0.02 0.01 20

10
Data

10

Estad stica (CC. Ambientales). Profesora: Amparo Ba llo

Tema 2: Diseo de experimentos (varios factores) n

43

Ejemplo 2.1 (cont.): Diagrama de residuos frente a valores previstos


20

10

10

20 760

780

800

820

840

Estad stica (CC. Ambientales). Profesora: Amparo Ba llo

Tema 2: Diseo de experimentos (varios factores) n

44

Modelo con dos factores e interaccin o


El modelo de efectos aditivos Yij = + i + j + Uij , i = 1, . . . , I , j = 1, . . . , J,

establece que E (Yij ) = + i + j . No existe interaccin entre los dos factores. o Por ejemplo, se cumple que para cualquier j = 1, . . . , J, E (Y4j ) E (Y1j ) = 4 1 . En el Ejercicio 2.2 esto signica que la diferencia entre el consumo medio de gasolina de un coche espaol y japons es la misma n e independientemente de si estamos conduciendo en hora punta o en carretera llana.
Estad stica (CC. Ambientales). Profesora: Amparo Ba llo Tema 2: Diseo de experimentos (varios factores) n 45

En el modelo sin interaccin, al representar las respuestas medias o para valores jos de uno de los factores, las l neas son paralelas.
E(Yij) en modelo sin interaccin +1+1 +1+2

+4+2 +4+1 +3+2 +3+1

+1+3

+4+3 +3+3

j=1

j=2

j=3

Estad stica (CC. Ambientales). Profesora: Amparo Ba llo

Tema 2: Diseo de experimentos (varios factores) n

46

Un modelo con interaccin ser o a Yij = + i + j + ()ij + Uij , i = 1, . . . , I , j = 1, . . . , J

donde Uij N(0, 2 ) son independientes y ()ij son parmetros a que describen la interaccin entre los factores. o En este modelo hay IJ + 1 parmetros desconocidos. Si slo a o tenemos una observacin yij para cada (i, j), no podemos o estimarlos todos. En este caso, aunque podr amos modelizar la interaccin con una expresin ms simple, utilizaremos siempre el o o a modelo sin interaccin. o Cuando hay K 2 replicaciones por cada cruce de los dos factores s podemos ajustar el modelo con interaccin a nuestros datos. o Ejemplo 2.1 (cont.): En la pgina 11, por cada cruce del nivel i a del factor principal (con/sin ltro) con el nivel j de la variable bloque (gama de veh culo), tenemos K = replicaciones.
Estad stica (CC. Ambientales). Profesora: Amparo Ba llo Tema 2: Diseo de experimentos (varios factores) n 47

El modelo ANOVA de dos factores con interaccin es o Yijk = + i + j + ()ij + Uijk , i = 1, . . . , I j = 1, . . . , J k = 1, . . . , K ( 2)

donde Uijk N(0, 2 ) son independientes y


I J I

i = 0
i=1

;
j=1

j = 0

;
i=1 J

()ij = 0, j = 1, . . . , J ()ij = 0, i = 1, . . . , I .
j=1

()ij = E (Yij ) i j = desviacin de la respuesta esperada o respecto de la prediccin dada por el modelo sin interaccin o o
Estad stica (CC. Ambientales). Profesora: Amparo Ba llo Tema 2: Diseo de experimentos (varios factores) n 48

Nmero de parmetros desconocidos = IJ + 1. u a Estimaciones de los parmetros: a = y = i j ()ij donde yij = yi = yj = 1 K


K I J K

1 IJK

yijk
i=1 j=1 k=1

= yi y = yj y = yij yi yj + y yijk

1 JK 1 IK

k=1 J

yijk ,
j=1 k=1 J K

i = 1, . . . , I , j = 1, . . . , J.
Tema 2: Diseo de experimentos (varios factores) n 49

yijk ,
j=1 k=1

Estad stica (CC. Ambientales). Profesora: Amparo Ba llo

Ejemplo 2.1 (cont.): Gama veh culo Baja Media


810 820 820 835 835 835 840 840 845 845 855 850

Alta
785 790 785 760 760 770

yi

Sin ltro

y11 = ()11 =
820 820 820 825 825 825

y12 = ()12 =
820 820 825 815 825 825

y13 = ()13 =
775 775 775 770 760 765

F. Octel

y21 = ()21 =

y22 = ()22 =

y23 = ()23 =

yj j

y =

Estad stica (CC. Ambientales). Profesora: Amparo Ba llo

Tema 2: Diseo de experimentos (varios factores) n

50

Residuos: eijk = yijk yijk = yijk ( + i + j + ()ij ) = yijk yij Tienen IJ(K 1) g.l., pues
Ejemplo 2.1 (cont.): Residuos Baja -15,83 -5,83 -5,83 9,17 9,17 9,17 -2,50 -2,50 -2,50 2,50 2,50 2,50 K k=1 eijk

= 0 para todo (i, j).

Gama veh culo Media -5,83 -5,83 -0,83 -0,83 9,17 4,17 -1,67 -1,67 3,33 -6,67 3,33 3,33 Alta 10,00 15,00 10,00 -15,00 -15,00 -5,00 5,00 5,00 5,00 0,00 -10,00 -5,00

Sin ltro

Filtro Octel

Estad stica (CC. Ambientales). Profesora: Amparo Ba llo

Tema 2: Diseo de experimentos (varios factores) n

51

Descomposicin de la variabilidad total VT = o


i=1 j=1 k=1

(yijk y )2

VT = VE() + VE() + VE() + VNE, donde


I J

VE() = JK
i=1

i2
I J

VE() = IK
j=1 K 2 eijk i=1 j=1 k=1 I J 2

j2

VNE =

VE() = K
i=1 j=1

()ij

Estad stica (CC. Ambientales). Profesora: Amparo Ba llo

Tema 2: Diseo de experimentos (varios factores) n

52

Tabla ANOVA para dos factores con K replicaciones y con interaccin: o FV Factor Factor Interaccin o Residual Total SC VE() VE() VE() VNE VT gl I 1 J 1 (I 1)(J 1) IJ(K 1) n1 CM
2 s =

VE() I 1 VE() J 1

2 s =

2 s =

VE() (I 1)(J 1) VNE IJ(K 1) VT n1


53

2 sR =

2 sy =

Estad stica (CC. Ambientales). Profesora: Amparo Ba llo

Tema 2: Diseo de experimentos (varios factores) n

Posibles contrastes y sus regiones de rechazo: H0


(1)

: i = 0, i = 1, . . . , I R (1) = F (1) =
2 s > FI 1,IJ(K 1), 2 sR

H0

(2)

: j = 0, j = 1, . . . , J R
(2)

(2)

2 s 2 sR

> FJ1,IJ(K 1),

H0

(3)

: ()ij = 0, i = 1, . . . , I , j = 1, . . . , J R
(3)

(3)

2 s 2 sR

> F(I 1)(J1),IJ(K 1),

Aunque no rechacemos H0 , no conviene unir VE() con VNE a menos que F (3) sea muy prximo a 1. o La diagnosis del modelo se realiza mediante anlisis de los residuos. a
Estad stica (CC. Ambientales). Profesora: Amparo Ba llo Tema 2: Diseo de experimentos (varios factores) n 54

(3)

Ejemplo 2.1 (cont.):

Estad stica (CC. Ambientales). Profesora: Amparo Ba llo

Tema 2: Diseo de experimentos (varios factores) n

55

Ejemplo 2.3: Se investiga el efecto de diferentes tipos de msica u sobre enfermos de Alzheimer. Se eligen enfermos con un desarrollo bajo y medio de la enfermedad y se prueban tres tipos de msica: u interludios de piano, Mozart y msica ligera. La variable respuesta u es el nivel de agitacin del enfermo. o Msica u Desarrollo enfermedad Bajo Interludios 21 24 22 18 20 22 20 25 18 20 Mozart 9 12 10 5 9 14 18 11 9 13 Ligera 29 26 30 24 26 15 18 20 13 19
56

Medio

Estad stica (CC. Ambientales). Profesora: Amparo Ba llo

Tema 2: Diseo de experimentos (varios factores) n

Ejemplo 2.3 (cont.): Msica u Desarrollo enfermedad Bajo Interludios 21 24 22 18 20 y11 = ()11 = 22 20 25 18 20 y21 = ()21 = Mozart 9 12 10 5 9 Ligera 29 26 30 24 26 yi i

Medio

14 18 11 9 13

15 18 20 13 19

yj j
Estad stica (CC. Ambientales). Profesora: Amparo Ba llo

y =
Tema 2: Diseo de experimentos (varios factores) n 57

Ejemplo 2.3 (cont.):

Estad stica (CC. Ambientales). Profesora: Amparo Ba llo

Tema 2: Diseo de experimentos (varios factores) n

58

Ejemplo 2.3 (cont.): Residuos eijk Msica u Des. enf. Bajo Int. 0 3 1 -3 -1 1 -1 4 -3 -1 Moz. 0 3 1 -4 0 1 5 -2 -4 0 Lig. 2 -1 3 -3 -1 -2 1 3 -4 2 Des. enf. Bajo Int. 21 21 21 21 21 21 21 21 21 21 Valores previstos yijk Msica u Moz. 9 9 9 9 9 13 13 13 13 13 Lig. 27 27 27 27 27 17 17 17 17 17

Medio

Medio

Estad stica (CC. Ambientales). Profesora: Amparo Ba llo

Tema 2: Diseo de experimentos (varios factores) n

59

Ejemplo 2.3 (cont.):


6 4 2 0 2 4 6 5 10 15 20 Valores previstos 25 30

Estad stica (CC. Ambientales). Profesora: Amparo Ba llo

Residuos

Tema 2: Diseo de experimentos (varios factores) n

60

Ejemplo 2.3 (cont.): Histograma de los residuos

0.15

0.1

0.05

0 5

Curtosis de los residuos = 2.1683 Coeciente de asimetr de los residuos = 0.0554 a


Estad stica (CC. Ambientales). Profesora: Amparo Ba llo Tema 2: Diseo de experimentos (varios factores) n 61

Una manera grca de estudiar si existe interaccin es representar a o las medias muestrales yij para valores jos de uno de los factores. Si las l neas no son paralelas, concluimos que existe interaccin. o Ejemplo 2.3 (cont.):
30 25 20 15 10 5 D. bajo D. medio

Interludios

Mozart Tipo de msica

Ligera

Estad stica (CC. Ambientales). Profesora: Amparo Ba llo

Tema 2: Diseo de experimentos (varios factores) n

62

Ejemplo 2.1 (cont.):


840

820

800

780

Silenciador F. Octel Baja Media Gama Alta

Estad stica (CC. Ambientales). Profesora: Amparo Ba llo

Tema 2: Diseo de experimentos (varios factores) n

63

Anlisis de la varianza con tres factores a


Modelo general para tres factores sin replicacin o Para i = 1, . . . , I , j = 1, . . . , J, k = 1, . . . , K , Yijk = + i + j + k + ()ij + ()ik + ()jk + ()ijk + Uijk , donde Uijk N(0, 2 ) son independientes y
I J K

i = 0 ,
i=1 I J j=1 I

j = 0 ,
k=1

k = 0
K

()ij =
i=1 I j=1

()ij =
i=1 J

()ik =
k=1 K

()ik = . . . = 0

()ijk =
i=1 j=1

()ijk =
k=1

()ijk = 0.
64

Estad stica (CC. Ambientales). Profesora: Amparo Ba llo

Tema 2: Diseo de experimentos (varios factores) n

i , j , k = Efectos principales ()ij , ()jk , ()ik = Interacciones de segundo orden ()ijk = Interacciones de tercer orden a No de observaciones = IJK < No de parmetros a estimar = IJK + 1 En un diseo con tres factores a cuatro niveles cada uno y sin n replicacin se necesitan 43 = 64 observaciones. Existe un diseo o n ms restrictivo pero ms sencillo que slo precisa 42 = 16 a a o observaciones: el cuadrado latino.

Estad stica (CC. Ambientales). Profesora: Amparo Ba llo

Tema 2: Diseo de experimentos (varios factores) n

65

Cuadrado latino Este diseo se utiliza cuando n hay tres factores; el nmero de niveles de los tres factores es el mismo, I ; u no hay interaccin entre los factores. o El cuadrado latino tiene n = I 2 observaciones. Cada nivel de un factor se cruza slo una vez con cada nivel de los otros dos o factores. En la prctica se forma una cuadr a cula con I las e I columnas y se asignan I letras de tal manera que no haya letras repetidas en ninguna la ni en ninguna columna. Por ejemplo, si I = 3, existen 12 diseos posibles. Uno es n A C B C B A B A C y11(1) y21(3) y31(2) y12(3) y22(2) y32(1) y13(2) y23(1) y33(3)
66

Estad stica (CC. Ambientales). Profesora: Amparo Ba llo

Tema 2: Diseo de experimentos (varios factores) n

Ejemplo 2.4: Se desea evaluar si el tipo de riego (por goteo, aspersin o sin riego) puede contribuir a la proteccin de cultivos o o de fresas frente al fr extremo. En todos los casos se utiliza un o mantillo plstico sobre la tierra de cultivo. Por otro lado, se a supone que hay otros factores, como la humedad y el contenido en nitrgeno del suelo, que tambin pueden inuir. Cul de los o e a siguientes diseos del experimento ser ms adecuado? n a a Nivel de nitrgeno o Alto Medio Bajo Nivel Alto No riego Goteo Aspersin o de Medio No riego Aspersin No riego o humedad Bajo Goteo Goteo Aspersin o Nivel de nitrgeno o Alto Medio Bajo Nivel Alto No riego Goteo Aspersin o de Medio Goteo Aspersin No riego o humedad Bajo Aspersin No riego o Goteo
Estad stica (CC. Ambientales). Profesora: Amparo Ba llo Tema 2: Diseo de experimentos (varios factores) n 67

Con I = 4 tendr amos 576 posibles diseos. Uno de ellos es: n A C B D B D A C D A C B C B D A

Un ejemplo con I = 5: Deseamos contrastar la ecacia de 5 fertilizantes diferentes (A,B,C,D,E) sobre un cultivo espec co. Queremos utilizar los 5 fertilizantes, esperar a que el cultivo madure y medir el resultado de la cosecha por unidad de supercie con cada fertilizante. Pero terrenos contiguos pueden variar en fertilidad debido a mltiples u causas (diferencias de humedad, uso previo del terreno, etc.). Para reducir la variabilidad experimental dividimos el terreno en una ret cula de 5 x 5 rectngulos y en cada uno utilizamos un a fertilizante segn el siguiente diseo de cuadrado latino: u n
Estad stica (CC. Ambientales). Profesora: Amparo Ba llo Tema 2: Diseo de experimentos (varios factores) n 68

Feature Column Arc

2. Agronomy experiments: Latin squares in real life.

A B C D E

B D E C A

C A D E B

D E E C B A A field planted with a crop using five different treatments according to a 5 5 latin square arrangement. A B Suppose we want to test the relative effectiveness of 5 different fertilizer mixtures on a crop of, say, oats. We apply the C D fertilizer, wait for the crop to mature, harvest it and measure the yield per unit area. But the five experiments cannot be car
x

out on the same plot of land. Even contiguous plots may vary in fertility because of a moisture gradient, different previous of the land, or some other reason. Dividing a single plot into a 5 x 5 grid of subplots, and administering the fertilizers (labe randomly A, B, C, D, E) according to a latin square arrangement like the one used in the figure above:
A B B D C E Dno DiseC E A C D E A E C D B A E A experimentos de B B C D

Estad stica (CC. Ambientales). Profesora: Amparo Ba llo

Tema 2:

(varios factores)

69

Modelo: Yij(k) = + i + j + k + Uij(k) , i, j, k = 1, . . . , I ,

donde Uij(k) N(0, 2 ) son independientes y


I I I

i =
i=1 j=1

j =
k=1

k = 0.

i j k

= = =

efecto incremental de la la efecto incremental de la columna efecto incremental de la letra

Parmetros desconocidos: , 1 , . . . , I 1 , 1 , . . . , I 1 , 1 , . . . , a a I 1 , 2 No de parmetros a estimar = 3I 1

Estad stica (CC. Ambientales). Profesora: Amparo Ba llo

Tema 2: Diseo de experimentos (varios factores) n

70

Estimacin de los parmetros: o a 1 = y = n i = yi y


I I

yij()
i=1 j=1

j = yj y

k = yk y

donde yij() es la observacin de la casilla (i, j) sea cual sea la letra o asociada y yi = 1 I
I

yij()
j=1

yj =

1 I

yij()
i=1

yk =

1 I

yij(k)
i=1 j=1

Residuos: eij(k) = yij(k) yij(k) = yij(k) ( + i + j + k ) = yij(k) yi yj yk + 2 y


Estad stica (CC. Ambientales). Profesora: Amparo Ba llo Tema 2: Diseo de experimentos (varios factores) n 71

Tabla ANOVA para el cuadrado latino:


FV Efecto la SC
I

gl 2 i
i=1 I

CM
2 s =

VE() = I

I 1

VE() I 1 VE() I 1 VE() I 1

Efecto columna

VE() = I
j=1 I

j2 k 2
k=1 I 2 eij()

I 1

2 s =

Efecto letra

VE() = I
I

I 1

2 s =

Residual

VNE =
i=1 j=1 I I

(I 1)(I 2)

2 sR =

VNE (I 1)(I 2) VT n1

Total

VT =
i=1 j=1

(yij() y )2

n1

2 sy =

Estad stica (CC. Ambientales). Profesora: Amparo Ba llo

Tema 2: Diseo de experimentos (varios factores) n

72

Contrastes y sus regiones de rechazo al nivel de signicacin : o H0


(1)

: i = 0, para todo i = 1, . . . , I R (1) = F (1) =


2 s > FI 1,(I 1)(I 2), 2 sR

H0

(2)

: j = 0, para todo j = 1, . . . , I R (2) = F (2) =


2 s 2 sR

> FI 1,(I 1)(I 2),

H0

(3)

: k = 0, para todo k = 1, . . . , I R (3) = F (3) =


2 s > FI 1,(I 1)(I 2), 2 sR

Estad stica (CC. Ambientales). Profesora: Amparo Ba llo

Tema 2: Diseo de experimentos (varios factores) n

73

Ejemplo 2.4 (cont.): El estudio sobre la proteccin del cultivo de o fresas frente al fr produjo nalmente los datos que se indican o debajo. La efectividad de los mtodos de irrigacin se midi en e o o funcin del peso de los frutos congelados. Cul de los mtodos o a e protegi mejor el cultivo? o Nivel de nitrgeno o Alto Medio Bajo 51 (G) 119 (A) 60 (NR) 98 (NR) 43 (G) 31 (A) 99 (A) 87 (NR) 49 (G)

Nivel de humedad

Alto Medio Bajo

Estad stica (CC. Ambientales). Profesora: Amparo Ba llo

Tema 2: Diseo de experimentos (varios factores) n

74

Das könnte Ihnen auch gefallen