Sie sind auf Seite 1von 8

Curso: Diseño Experimental ESPOL

MATERIA: Diseño de experimentos


UNIDAD 1. Principios del diseño de experimentos y Análisis de Varianza
SUBUNIDAD 1.1 Conceptos y Principios Básicos del diseño de experimentos
1.2 ANOVA: Verificación de la adecuación del modelo-supuestos
1.3Comparaciones de medias de un Diseño Completamente Aleatorizado
OBJETIVOS: Introducir a los estudiantes acerca del modelo básico analizado en diseños
experimentales, así como a las metodologías estadísticas empleadas en el
análisis del modelo y comparación de medias en diseños de un factor
completos aleatorizados.
Proporcionar a los estudiantes estrategias sobre cómo evaluar supuestos
del ANOVA y cómo abordar la violación de los mismos.
Promover la correcta aplicación y práctica de los diseños experimentales
en los estudiantes.
TEMAS CUBIERTOS: - Estrategias de reducción variabilidad en diseños experimentales
- Definición e ilustración del concepto de diseños completos
aleatorizados
- Refuerzo de las buenas prácticas en el diseño de un experimento
- Análisis de la varianza y sus supuestos
- Estrategias para evaluar y abordar la violación de supuestos de
ANOVA
- Comparaciones de media con pruebas a posteriori en diseños
completos aleatorizados
- Análisis de datos experimentales en software
Tiempo estimado 4.5 horas (3 clases)

REVISIÓN DE CONCEPTOS E INVESTIGACIÓN

Diferencia entre replicación y mediciones repetidas:

La replicación se trata de repeticiones independientes del mismo tratamiento (o experimento). El


diseño de medidas repetidas repite todas las condiciones de la investigación sobre los mismos
sujetos.

Placebo:

Es un tratamiento que aparenta causar efecto sobre las unidades experimentales, pero que
realmente no causa efecto alguno —control encubierto.1

Experimentos a ciegas simple y doble:

En los experimentos a ciegas los participantes desconocen a qué grupo pertenecen (experimental o
control). Mientras que, en los experimentos a ciegas doblemente, ni el experimentador ni los
participantes conocen quiénes pertenecen a qué grupo (experimental o control)

¿Cuál es el objeto de utilizar estas técnicas?

DISEÑOS COMPLETOS ALEATORIZADOS

Realizar este ejemplo con la clase: Se prueba sobre 5 ratas el cambio en peso que genera el
alimentarlas con 3 distintos tipos de dietas.

Establecer el diseño e identificar cada uno de los componentes del experimento

Omar Ruiz-Barzola
Curso: Diseño Experimental ESPOL

Suponga que se formaron 3 grupos de ratas, la asignación de ratas a cada grupo fue hecha
aleatoriamente. (El profesor agrupa los pesos de las ratas de cada grupo en tres pilas en el escritorio,
sin que los valores sean vistos)

Pida a los estudiantes que aleatoricen qué tipo de dieta recibirá cada grupo: A, B, C

Tomen nota de los pesos de cada rata según su grupo.

TIPO DE DIETA PESO2


(sólo para conocimiento del profesor) (revelar cuando se simule la toma de datos)
A 118

A 111

A 87

A 100

A 102

B 120

B 108

B 105

B 98

B 96

C 111

C 98

C 56

C 86

C 74

ANOVA Y COMPARACIONES DE MEDIAS EN DISEÑOS COMPLETOS ALEATORIZADOS

En estudios comparativos generalmente se aplican varios tratamientos sobre las unidades


experimentales con la intención de conocer el efecto medio que cada uno causa sobre la variable de
respuesta y conocer cuál de ellos proporciona un mejor resultado en ella (dependiendo de nuestras
necesidades).

ANOVA —que es una generalización de comparación de medias en muestras independientes, t-


student— es un procedimiento que estima las respuestas promedio de tratamientos y las

Omar Ruiz-Barzola
Curso: Diseño Experimental ESPOL

comparaciones entre ellas. ANOVA descompone la variabilidad total en la muestra (suma de


cuadrados total de las observaciones) en componentes (sumas de cuadrados) asociados a cada una
de las fuentes de variación reconocidas.

Recuerde: todo factor es una fuente de variación, pero no todos son de nuestro interés.

“Las variables involucradas en ANOVA son la variable dependiente o respuesta. Las variables
independientes, o de clasificación, o predictoras (cualitativas o cuantitativas con un número discreto
de niveles). La variable dependiente es aquella sobre la que se desea hacer comparaciones —recibe
el efecto de los tratamientos. Las variables predictoras representan las fuentes de variación de
interés que permiten separar o clasificar a los individuos en grupos.”3

Modelo4
Observación en la
j-ésima repetición del i-ésimo

Yij     i  eij
tratamiento

Media general
Efecto del i-ésimo tratamiento

Efecto aleatorio
de la ij-ésima
unidad
Defina el modelo del experimento ejemplo
experimental
𝑝𝑒𝑠𝑜 = 𝜇 +𝜏 +𝑒 , 𝑖 = 1,2,3; 𝑗 = 1,2,3,4,5

Supuestos4
HOMOGENEIDAD

eij ~ N  0,  2 
INDEPENDENCIA

cov(eij , ei ' j ' )  0 ij  i ' j '

Contraste

Hipótesis nula: el efecto es el mismo para todos los tratamientos

Hipótesis alterna: al menos uno de los tratamientos causa un efecto distinto que los demás

Omar Ruiz-Barzola
Curso: Diseño Experimental ESPOL

Validando los supuestos5

La precisión de la inferencia depende mucho en el cumplimiento de los supuestos.

Los tres supuestos básicos que necesitamos chequear se realizan sobre los errores. En orden de
importancia estos son: independencia, homogeneidad y normalidad. Recuerde que en el mundo real
es muy difícil que estos supuestos sean exactamente cumplidos. Sin embargo, existe un concepto
llamado la robustez de la validación que indica que el cumplimiento de nuestros supuestos es
razonablemente válido en un rango de inferencia. Por ello, las pruebas formales no deben ser un
tropiezo en nuestros análisis, es mejor utilizar evaluaciones gráficas y numéricas. Una estrategia que
puede ayudarnos con la violación de supuestos es la transformación logarítmica de la variable de
respuesta.

- Independencia: Los problemas más comunes de dependencia se ven cuando resultados que
están cercanos en tiempo o en espacio tienden a ser demasiado similares (dependencia
positiva) o demasiado distintos (dependencia negativa). Se recomienda verificar este
supuesto en los gráficos índex (que muestran índices de tiempo, o coordenadas espaciales,
en el eje x y, los residuos en el eje y). Las columnas por cada índice deberían lucir del mismo
alto, en términos generales, cuando se cumple con el supuesto de la independencia.
Generalmente los problemas de dependencia tienen que ver con el diseño de experimentos:
una falla en el instrumento de medición, un cambio en las habilidades del experimentador,
cambio en condiciones ambientales, etc.
La falta de independencia se debe contemplar en el modelo (correlación espacial o
temporal).
Los ejemplos siguientes6 muestran dependencia temporal, ya que la dispersión de sus
residuos no es independiente del tiempo (residuos en 2008 vs 2010), se observa entonces,
que los errores entre diferentes individuos en el mismo tiempo están correlacionados. Por
tanto, el tiempo debe ser considerado un factor que habría que incluir en el modelo para
corregir el problema. El ejemplo mensual parece no presentar mayores problemas de este
tipo, sin embargo, se sospecha falta de independencia.

- Homogeneidad de varianza: La homogeneidad de varianza se prueba con algunos tests


formales como la prueba de Levene, de Bartlett, o de Hartley. Sin embargo, no se
recomienda su uso, debido a su inestabilidad frente a distribuciones no normales. Se sugiere
chequear este supuesto en los gráficos de residuos (residuos sin ningún patrón indican

Omar Ruiz-Barzola
Curso: Diseño Experimental ESPOL

homogeneidad —evidentemente en estos gráficos se verán columnas verticales de puntos,


pero esto no indica la presencia de un patrón, sino la diferencia entre tratamientos).
Pudieran aparecer patrones con la forma de un megáfono, lo que indicaría que la varianza
incrementa o decrece cuando la media incrementa o crece, respectivamente. La falta de
homogeneidad muchas veces ocurre por un mal diseño.
El gráfico de la derecha7 muestra cómo generalmente luce un gráfico de residuos en un
diseño con factores; sin embargo, este no parece presentar problemas de
heterocedasticidad. No así los gráficos de la derecha6.

- Normalidad: Para evaluar la normalidad se debe analizar los residuos (quitar el efecto de
cada tratamiento –restar la media de la variable de respuesta por cada grupo) mediante QQ-
plot (residuos alineados a la recta indican el cumplimiento de la normalidad) y alguna de las
pruebas formales como Shapiro-Wilks (hipótesis nula: los datos siguen una distribución
normal). Generalmente, la falta de normalidad se asocia con problemas de falta de
independencia u homogeneidad. El gráfico siguiente muestra algunos casos de no
normalidad y la posible razón de ese desvío.

Omar Ruiz-Barzola
Curso: Diseño Experimental ESPOL

Construcción de una tabla de análisis de la varianza

En base al material que se solicitó a los estudiantes leer, construyan el esquema de la tabla ANOVA
para el ejercicio anterior y ejecútelo en el programa respectivo

Fuentes de Medias
Sumas de cuadrados G.L. Prueba F
Variación cuadráticas
Dieta (variación 𝑎−1 𝑀𝑆
𝑆𝑆
entre los 𝑆𝑆 =𝑛 (𝑦 ∙ − 𝑦∙∙ ) =3−1 𝑀𝑆 = 𝐹 =
2 𝑀𝑆
tratamientos) =2
𝑛−𝑎
Error (dentro de 𝑆𝑆
𝑆𝑆 = 𝑦 −𝑦∙ = 15 − 3 𝑀𝑆 =
los tratamientos) = 12 12
𝑛−1
Total 𝑆𝑆 = 𝑦 − 𝑦∙∙ = 15 − 1
= 14

𝐸[𝑀𝑆 ] = 𝜎

Analice el cumplimiento de supuestos del modelo propuesto

- Ejecute el modelo que usted propone


- ¿Cómo luce el gráfico de residuos? ¿hay algún patrón que siguen los residuos?
- ¿Cómo luce el QQ-plot? ¿en términos generales, los residuos se alinean a la recta?

Omar Ruiz-Barzola
Curso: Diseño Experimental ESPOL

- ¿Cómo luce el diagrama de cajas de los residuos por tratamiento?


- ¿Qué concluye acerca del efecto de la dieta sobre el peso de los ratones?

Comparación de medias entre tratamientos

ANOVA permite hacer inferencias acerca del impacto que causan los factores sobre la variable de
respuesta. Sin embargo, muchas veces es deseable conocer el efecto de cada uno de sus niveles o
tratamientos y determinar si esos efectos son estadísticamente significativamente. Este análisis
tiene origen en la comparación de medias. Las pruebas a posteriori permiten realizar estas
comparaciones y determinar qué tratamientos causan mayor, menor o igual efecto estadísticamente
significativo sobre la variable de respuesta.

Algunas de estas pruebas son: LSD de Fisher, Duncan, Tukey, Scheffé, Dunnett (comparación con el
control), corrección de Bonferroni.

Ejecute las pruebas a posteriori y decida qué dieta beneficia más a los ratones (peso mayor)

TALLER

Reúnanse en grupo y diseñen un experimento sencillo de un factor, que les permita recolectar al
menos 5 repeticiones por tratamiento, hasta la siguiente clase. Escriban un reporte en donde se
contemple el diseño y la ejecución del experimento. Esto se discutirá en la siguiente clase, en donde
cada grupo evaluará la aplicación de las buenas prácticas del diseño de experimentos.

Recuerde, solo el diseño y la recolección de datos. La obtención del modelo se realizará durante la
siguiente sesión.

1
Gary W. Oehlert, A first course in design and analysis of experiments, University of Minessota, 2000.
2
This is Dataplot data file RATFEED.DAT
Weight Gain of Rats
Source--Hoaglin, D., Mosteller, F., and Tukey, J. (1991).
Fundamentals of Exploratory Analysis of Variance.
Wiley, New York, page 100.
Response Variable = Weight gain of rats
Number of observations = 60 (= 10 reps x 2 amounts x 3 diets)
Number of variables per line image = 3
Order of variables per line image--
Response variable = rat weight gain (in grams)
Factor 1 = diet amount (1 = high, 2 = low)
Factor 2 = diet type (1 = beef, 2 = pork, 3 = cereal)
Statistical areas--Multifactor
Design type --Randomized Block
To read this file into Dataplot--
SKIP 25
READ RATFEED.DAT Y X1 X2
3
Balzarini M.G., Gonzalez L., Tablada M., Casanoves F., Di Rienzo J.A., Robledo C.W. (2008). Manual del
Usuario, Editorial Brujas, Córdoba, Argentina.
4
F. Casanoves, J. Dirienzo, R. Macchiaveli, Diplomado de Bioestadística 2017.
5
Gary W. Oehlert, A first course in design and analysis of experiments, “Chapter 6: Checking assumptions”
6
Daniel Hocking, Model Validation: Interpreting Residual Plots [en línea] https://www.r-bloggers.com/model-
validation-interpreting-residual-plots/
7
https://ase.tufts.edu/gsc/gradresources/guidetomixedmodelsinr/mixed%20model%20guide.html

Omar Ruiz-Barzola
Curso: Diseño Experimental ESPOL

Omar Ruiz-Barzola

Das könnte Ihnen auch gefallen