Beruflich Dokumente
Kultur Dokumente
Placebo:
Es un tratamiento que aparenta causar efecto sobre las unidades experimentales, pero que
realmente no causa efecto alguno —control encubierto.1
En los experimentos a ciegas los participantes desconocen a qué grupo pertenecen (experimental o
control). Mientras que, en los experimentos a ciegas doblemente, ni el experimentador ni los
participantes conocen quiénes pertenecen a qué grupo (experimental o control)
Realizar este ejemplo con la clase: Se prueba sobre 5 ratas el cambio en peso que genera el
alimentarlas con 3 distintos tipos de dietas.
Omar Ruiz-Barzola
Curso: Diseño Experimental ESPOL
Suponga que se formaron 3 grupos de ratas, la asignación de ratas a cada grupo fue hecha
aleatoriamente. (El profesor agrupa los pesos de las ratas de cada grupo en tres pilas en el escritorio,
sin que los valores sean vistos)
Pida a los estudiantes que aleatoricen qué tipo de dieta recibirá cada grupo: A, B, C
A 111
A 87
A 100
A 102
B 120
B 108
B 105
B 98
B 96
C 111
C 98
C 56
C 86
C 74
Omar Ruiz-Barzola
Curso: Diseño Experimental ESPOL
Recuerde: todo factor es una fuente de variación, pero no todos son de nuestro interés.
“Las variables involucradas en ANOVA son la variable dependiente o respuesta. Las variables
independientes, o de clasificación, o predictoras (cualitativas o cuantitativas con un número discreto
de niveles). La variable dependiente es aquella sobre la que se desea hacer comparaciones —recibe
el efecto de los tratamientos. Las variables predictoras representan las fuentes de variación de
interés que permiten separar o clasificar a los individuos en grupos.”3
Modelo4
Observación en la
j-ésima repetición del i-ésimo
Yij i eij
tratamiento
Media general
Efecto del i-ésimo tratamiento
Efecto aleatorio
de la ij-ésima
unidad
Defina el modelo del experimento ejemplo
experimental
𝑝𝑒𝑠𝑜 = 𝜇 +𝜏 +𝑒 , 𝑖 = 1,2,3; 𝑗 = 1,2,3,4,5
Supuestos4
HOMOGENEIDAD
eij ~ N 0, 2
INDEPENDENCIA
Contraste
Hipótesis alterna: al menos uno de los tratamientos causa un efecto distinto que los demás
Omar Ruiz-Barzola
Curso: Diseño Experimental ESPOL
Los tres supuestos básicos que necesitamos chequear se realizan sobre los errores. En orden de
importancia estos son: independencia, homogeneidad y normalidad. Recuerde que en el mundo real
es muy difícil que estos supuestos sean exactamente cumplidos. Sin embargo, existe un concepto
llamado la robustez de la validación que indica que el cumplimiento de nuestros supuestos es
razonablemente válido en un rango de inferencia. Por ello, las pruebas formales no deben ser un
tropiezo en nuestros análisis, es mejor utilizar evaluaciones gráficas y numéricas. Una estrategia que
puede ayudarnos con la violación de supuestos es la transformación logarítmica de la variable de
respuesta.
- Independencia: Los problemas más comunes de dependencia se ven cuando resultados que
están cercanos en tiempo o en espacio tienden a ser demasiado similares (dependencia
positiva) o demasiado distintos (dependencia negativa). Se recomienda verificar este
supuesto en los gráficos índex (que muestran índices de tiempo, o coordenadas espaciales,
en el eje x y, los residuos en el eje y). Las columnas por cada índice deberían lucir del mismo
alto, en términos generales, cuando se cumple con el supuesto de la independencia.
Generalmente los problemas de dependencia tienen que ver con el diseño de experimentos:
una falla en el instrumento de medición, un cambio en las habilidades del experimentador,
cambio en condiciones ambientales, etc.
La falta de independencia se debe contemplar en el modelo (correlación espacial o
temporal).
Los ejemplos siguientes6 muestran dependencia temporal, ya que la dispersión de sus
residuos no es independiente del tiempo (residuos en 2008 vs 2010), se observa entonces,
que los errores entre diferentes individuos en el mismo tiempo están correlacionados. Por
tanto, el tiempo debe ser considerado un factor que habría que incluir en el modelo para
corregir el problema. El ejemplo mensual parece no presentar mayores problemas de este
tipo, sin embargo, se sospecha falta de independencia.
Omar Ruiz-Barzola
Curso: Diseño Experimental ESPOL
- Normalidad: Para evaluar la normalidad se debe analizar los residuos (quitar el efecto de
cada tratamiento –restar la media de la variable de respuesta por cada grupo) mediante QQ-
plot (residuos alineados a la recta indican el cumplimiento de la normalidad) y alguna de las
pruebas formales como Shapiro-Wilks (hipótesis nula: los datos siguen una distribución
normal). Generalmente, la falta de normalidad se asocia con problemas de falta de
independencia u homogeneidad. El gráfico siguiente muestra algunos casos de no
normalidad y la posible razón de ese desvío.
Omar Ruiz-Barzola
Curso: Diseño Experimental ESPOL
En base al material que se solicitó a los estudiantes leer, construyan el esquema de la tabla ANOVA
para el ejercicio anterior y ejecútelo en el programa respectivo
Fuentes de Medias
Sumas de cuadrados G.L. Prueba F
Variación cuadráticas
Dieta (variación 𝑎−1 𝑀𝑆
𝑆𝑆
entre los 𝑆𝑆 =𝑛 (𝑦 ∙ − 𝑦∙∙ ) =3−1 𝑀𝑆 = 𝐹 =
2 𝑀𝑆
tratamientos) =2
𝑛−𝑎
Error (dentro de 𝑆𝑆
𝑆𝑆 = 𝑦 −𝑦∙ = 15 − 3 𝑀𝑆 =
los tratamientos) = 12 12
𝑛−1
Total 𝑆𝑆 = 𝑦 − 𝑦∙∙ = 15 − 1
= 14
𝐸[𝑀𝑆 ] = 𝜎
Omar Ruiz-Barzola
Curso: Diseño Experimental ESPOL
ANOVA permite hacer inferencias acerca del impacto que causan los factores sobre la variable de
respuesta. Sin embargo, muchas veces es deseable conocer el efecto de cada uno de sus niveles o
tratamientos y determinar si esos efectos son estadísticamente significativamente. Este análisis
tiene origen en la comparación de medias. Las pruebas a posteriori permiten realizar estas
comparaciones y determinar qué tratamientos causan mayor, menor o igual efecto estadísticamente
significativo sobre la variable de respuesta.
Algunas de estas pruebas son: LSD de Fisher, Duncan, Tukey, Scheffé, Dunnett (comparación con el
control), corrección de Bonferroni.
Ejecute las pruebas a posteriori y decida qué dieta beneficia más a los ratones (peso mayor)
TALLER
Reúnanse en grupo y diseñen un experimento sencillo de un factor, que les permita recolectar al
menos 5 repeticiones por tratamiento, hasta la siguiente clase. Escriban un reporte en donde se
contemple el diseño y la ejecución del experimento. Esto se discutirá en la siguiente clase, en donde
cada grupo evaluará la aplicación de las buenas prácticas del diseño de experimentos.
Recuerde, solo el diseño y la recolección de datos. La obtención del modelo se realizará durante la
siguiente sesión.
1
Gary W. Oehlert, A first course in design and analysis of experiments, University of Minessota, 2000.
2
This is Dataplot data file RATFEED.DAT
Weight Gain of Rats
Source--Hoaglin, D., Mosteller, F., and Tukey, J. (1991).
Fundamentals of Exploratory Analysis of Variance.
Wiley, New York, page 100.
Response Variable = Weight gain of rats
Number of observations = 60 (= 10 reps x 2 amounts x 3 diets)
Number of variables per line image = 3
Order of variables per line image--
Response variable = rat weight gain (in grams)
Factor 1 = diet amount (1 = high, 2 = low)
Factor 2 = diet type (1 = beef, 2 = pork, 3 = cereal)
Statistical areas--Multifactor
Design type --Randomized Block
To read this file into Dataplot--
SKIP 25
READ RATFEED.DAT Y X1 X2
3
Balzarini M.G., Gonzalez L., Tablada M., Casanoves F., Di Rienzo J.A., Robledo C.W. (2008). Manual del
Usuario, Editorial Brujas, Córdoba, Argentina.
4
F. Casanoves, J. Dirienzo, R. Macchiaveli, Diplomado de Bioestadística 2017.
5
Gary W. Oehlert, A first course in design and analysis of experiments, “Chapter 6: Checking assumptions”
6
Daniel Hocking, Model Validation: Interpreting Residual Plots [en línea] https://www.r-bloggers.com/model-
validation-interpreting-residual-plots/
7
https://ase.tufts.edu/gsc/gradresources/guidetomixedmodelsinr/mixed%20model%20guide.html
Omar Ruiz-Barzola
Curso: Diseño Experimental ESPOL
Omar Ruiz-Barzola