Anova

19/7/2019 ANOVA
INTRODUCCIÓN AL ANÁLISIS DE LA
VARIANZA
José Luis Vicente Villardón
Departamento de Estadística
ANALISIS DE LA VARIANZA
DISEÑO DE UNA VIA
Disponemos de r poblaciones, generalmente correspondientes a r tratamientos

experimentales. Cada uno de los tratamientos Ti, (i=1, …, r) se supone que tiene distribución
normal con media mi y varianza s2, común a todos ellos, es decir se trata de poblaciones
normales y homoscedásticas. De cada una de las poblaciones (o tratamientos), tomamos una
muestra de tamaño ni.
Las observaciones obtenidas se pueden recoger en una tabla de la forma
es decir xij es la observación j del grupo experimental i.
Llamaos a las medias muestrales de los grupos y a la media de todas las

observaciones.
Cuando se trata de un experimento diseñado, es decir, cuando se trata de la aplicación de r

tratamientos a un conjunto de unidades experimentales, estas deben seleccionarse para que
sean homogéneas, de forma que no se introduzcan factores de variación distintos del que se
desea controlar. La asignación de los tratamientos a cada una de las unidades debe hacerse al
azar. Es lo que se conoce como diseño “completamente al azar”.
El modelo matemático subyacente a este tipo de diseño es
biplot.usal.es/problemas/anova/ANOVA.html 1/10
19/7/2019 ANOVA
donde es la cantidad que depende del tratamiento usado (descompuesta en una

media global y un efecto del tratamiento) y es la cantidad que depende solamente de la
unidad experimental y que se identifica con el error experimental.
La hipótesis de que los distintos tratamientos no producen ningún efecto (o la de que las
medias de todas las poblaciones son iguales) se contrasta mediante el análisis de la varianza
de una vía, comparando la variabilidad entre grupos con la variabilidad dentro de los grupos.
El análisis de la varianza se basa en la descomposición de la variabilidad total en dos partes,

una parte debida a la variabilidad entre las distintas poblaciones o tratamientos (variabilidad
entre grupos o variabilidad explicada por el diseño) y otra parte que puede considerarse como
la variabilidad intrínseca de las observaciones (variabilidad dentro de los grupos o residual).
La variabilidad entre grupos
mide la discrepancia entre los grupos y la media global, de forma que si no hay diferencias
entre ellos (la hipótesis nula es cierta) obtendremos variabilidades pequeñas. Si, por el
contrario, la hipótesis nula es falsa, cabe esperar que la variabilidad entre grupos sea grande.
La variabilidad dentro de los grupos
mide la variabilidad intrínseca de las observaciones, es decir, si el experimento está bien

diseñado y no se incluyen factores de variación distintos al estudiado, debe ser error
puramente aleatorio producido como resultado de la variabilidad biológica del material
experimental.
El contraste del Análisis de la varianza se basa en la comparación de la variabilidad entre y la

variabilidad dentro, rechazaremos la hipótesis nula siempre que la variabilidad “entre” sea
grande, pero utilizando como patrón de comparación la variabilidad “dentro”. Es decir,
aceptaremos un efecto de los tratamientos siempre que estos produzcan mayores diferencias
en las unidades experimentales que las que habría sin la aplicación de los mismos.
19/7/2019 ANOVA
Antes de proceder a la comparación hemos de dividir las sumas de cuadrados por sus
correspondientes grados de libertad, relacionados con el número de observaciones con las
que se realiza el cálculo.
De esta forma obtenemos los cuadrados medios o estimadores de las variabilidades.
La información completa se resume en la tabla siguiente. Es la que se conoce como tabla de

ANOVA y resume toda la información necesaria para realizar el correspondiente contraste.
Fuente Suma de cuadrados g.l. Estimador Fexp

Entre r-1
Residual n-r
Total n-1
El cociente entre la variabilidad “entre” y la variabilidad “dentro”, una vez que se han hecho
comparables, sigue una distribución F de Snedecor con r-1 y n-r grados de libertad. La
distribución nos sirve para buscar el valor a partir del cual el cociente es lo suficientemente
grande como para declarar las diferencias entre grupos estadísticamente significativas.
Los estimadores de los efectos de los tratamientos se estiman a partir de
y la parte propia de cada observación (o residual)
Los residuales pueden servirnos para la validación de las hipótesis básicas.
Recuérdese que, en realidad, un análisis de la varianza de una vía es equivalente a un modelo

de regresión en el que solo aparece una regresora cualitativa con r categorías (mediante las
correspondientes variables ficticias). La validación de las hipótesis básicas puede hacerse
entonces de la misma manera que en un modelo re regresión, utilizando gráficos de
residuales.
ANALISIS DE DOS VIAS
En muchas situaciones prácticas la unidades experimentales no son homogéneas por lo que

conviene agruparlas en distintos conjuntos de observaciones homogéneas. A tales conjuntos
se les denomina bloques.
19/7/2019 ANOVA
Los tratamientos se aplican dentro de cada bloque siguiendo las mismas técnicas de
aleatorización expuestas previamente.
Se procurará que los tratamientos estén representados de la misma manera en todos los
bloques.
Diseño en bloques al azar
Supongamos que se dispone de r tratamientos a comparar y que se dividen las observaciones

en s bloques con r unidades experimentales cada uno.
Dentro de cada bloque se aplica una vez cada tratamiento utilizando un procedimiento de
aleatorización.
Los datos resultantes serían los siguientes
El modelo matemático es ahora
Donde ai es el efecto debido al bloque, bj es el efecto debido al tratamiento y eij es el error

experimental.
Obsérvese que solamente hemos sustraído del residual la parte correspondiente a los bloques.
-Análisis estadístico: Análisis de la varianza de dos vías.
Las hipótesis de que los distintos tratamientos y los bloques no producen ningún efecto se
contrasta mediante el análisis de la varianza de dos vías, comparando la variabilidad entre
bloques y la variabilidad entre tratamientos con la variabilidad dentro de los grupos.
Los resultados fundamentales se resumen en la tabla siguiente.

Entre Bloques s-1
Entre Tratam. r-1
19/7/2019 ANOVA
Residual (r-1)(s-1)
Total n-1
Los estimadores de los efectos de los bloques y tratamientos se estiman a partir de
Los residuales pueden servirnos para la validación de las hipótesis básicas de la misma
manera que en el diseño de una vía.
IDEAS BASICAS SOBRE EXPERIMENTOS

FACTORIALES
-Definiciones generales y discusión
A cada uno de los tratamientos básicos le denominaremos factor y a cada una de sus posibles
formas (o valores) la denominaremos nivel del factor.
Una combinación de un nivel de cada uno de los factores estudiados determina un

tratamiento.
El experimento en el que todas las combinaciones de niveles de los factores son interesantes
se denomina experimento factorial.
-Tipos de factores
-Factores cualitativos específicos.
Factores susceptibles de aplicación
Factores de clasificación
-Factores cuantitativos
-Factores cualitativos ordenados.
-Factores cualitativos muestreados.

19/7/2019 ANOVA
Efectos principales e interacción en un experimento de dos factores.
Supongamos que tenemos un experimento de dos factores A y B con cuatro niveles cada uno,
y supongamos, para simplificar que no existe variación no controlada.
Factor B
Factor A nivel 1 nivel 2 nivel 3 nivel 4 media
nivel 1 9 11 14 15 12.25
nivel 2 12 14 17 18 15.25
nivel 3 10 12 15 16 13.25
nivel 4 13 15 18 19 16.25
media 11 13 16 17
Tenemos varias formas de cacterizar esta tabla:
a)La diferencia entre las observaciones de dos niveles cualesquiera de A es la misma para
todos los niveles de B.
b)La diferencia entre las observaciones de dos niveles cualesquiera de B es la misma para
todos los niveles de A.
c) Los efectos de los dos factores son aditivos.
d) Los residuales al restar los efectos fila y columna son cero.
En este caso se dice que los factores no interactuan o que sus efectos son aditivos.
Si estas condiciones no se verifican decimos que hay una interacción entre A y B.
Se dice que hay interacción cuando las diferencias entre dos niveles cualesquiera de uno de
los factores dependen de los niveles del otro factor.
Factor B
Factor A nivel 1 nivel 2 nivel 3 nivel 4 media
nivel 1 9 11 14 15 12.25
nivel 2 12 14 17 18 15.25
nivel 3 11 11 14 17 13.25
nivel 4 12 16 19 18 16.25
media 11 13 16 17
Efectos principales: Efectos de cada uno de los niveles de los factores por separado
(promediando sobre el otro factor).
Interacción: Efectos producidos por la aplicación conjunta de los niveles de los dos factores.
19/7/2019 ANOVA
Gráficos de interacción
Efectos aditivos
Efectos no aditivos
Experimento factorial con dos factores de variación y el mismo número de

observaciones por casilla.
Se dispone de un conjunto de observaciones homogéneas y se asigna los tratamientos

(combinación de niveles de los dos factores) aleatoriamente a las unidades.
Los datos resultantes serían los siguientes
El modelo matemático es ahora
19/7/2019 ANOVA
Donde ai es el efecto debido al bloque, bj es el efecto debido al tratamiento, (ab)ij es el

efecto conjunto (interacción) y eij es el error.
-Análisis estadístico: Análisis de la varianza de dos vías.
Las hipótesis de que los distintos factores no producen ningún efecto y de que no existe
interacción se contrastan mediante el análisis de la varianza de dos vías con interacción,
comparando la variabilidad entre los niveles del factor A, la variabilidad entre los niveles del
factor B, y la variabilidad debida a la interacción con la variabilidad dentro de los grupos o
residual.

Filas s-1
Columnas r-1
Interacc. (r-1)(s-
1)
Resid. rs(t-1)
Total rst-1
Los estimadores de los efectos de los bloques y tratamientos se estiman a partir de
Los residuales pueden servirnos para la validación de las hipótesis básicas de la misma
manera que en el diseño de una vía.
EJEMPLO
19/7/2019 ANOVA
Se está investigando cual es el efecto de tres tipos de abono sobre dos tipos de suelo. Se espera que el efecto
de los distintos abonos se manifieste de forma diferente dependiendo del tipo de suelo. Para el presente
estudio tomaremos dos tipos de suelo, ácido y alcalino y tres tipos de abono que denotaremos con A, B y C.
Tenemos así dos factores (suelo y abono) con 2 y 3 niveles respectivamente, que resultan en 6
combinaciones. Tomaremos un diseño factorial con dos factores y tres réplicas en cada una de las
combinaciones de los niveles de los dos factores. La respuesta es un índice de abundancia de una
determinada especie tras la aplicación de los distintos abonos. Los resultados se muestran en la tabla
siguiente.
A B C
8 10 8
Ácido 4 8 6
0 6 4
14 4 15
Alcalino 10 2 12
6 0 9
19/7/2019 ANOVA

Anova

Hochgeladen von

Dokumentinformationen

Originaltitel

Copyright

Verfügbare Formate

Dieses Dokument teilen

Dokument teilen oder einbetten

Freigabeoptionen

Stufen Sie dieses Dokument als nützlich ein?

Sind diese Inhalte unangemessen?

Copyright:

Verfügbare Formate

Anova

Hochgeladen von

Copyright:

Verfügbare Formate

19/7/2019 ANOVA

Disponemos de r poblaciones, generalmente correspondientes a r tratamientos

Las observaciones obtenidas se pueden recoger en una tabla de la forma

es decir xij es la observación j del grupo experimental i.

Llamaos a las medias muestrales de los grupos y a la media de todas las

Cuando se trata de un experimento diseñado, es decir, cuando se trata de la aplicación de r

El modelo matemático subyacente a este tipo de diseño es

donde es la cantidad que depende del tratamiento usado (descompuesta en una

El análisis de la varianza se basa en la descomposición de la variabilidad total en dos partes,

La variabilidad entre grupos

La variabilidad dentro de los grupos

mide la variabilidad intrínseca de las observaciones, es decir, si el experimento está bien

El contraste del Análisis de la varianza se basa en la comparación de la variabilidad entre y la

De esta forma obtenemos los cuadrados medios o estimadores de las variabilidades.

La información completa se resume en la tabla siguiente. Es la que se conoce como tabla de

Fuente Suma de cuadrados g.l. Estimador Fexp

Los estimadores de los efectos de los tratamientos se estiman a partir de

y la parte propia de cada observación (o residual)

Los residuales pueden servirnos para la validación de las hipótesis básicas.

Recuérdese que, en realidad, un análisis de la varianza de una vía es equivalente a un modelo

ANALISIS DE DOS VIAS

En muchas situaciones prácticas la unidades experimentales no son homogéneas por lo que

Diseño en bloques al azar

Supongamos que se dispone de r tratamientos a comparar y que se dividen las observaciones

Los datos resultantes serían los siguientes

El modelo matemático es ahora

Donde ai es el efecto debido al bloque, bj es el efecto debido al tratamiento y eij es el error

-Análisis estadístico: Análisis de la varianza de dos vías.

Los resultados fundamentales se resumen en la tabla siguiente.

Fuente Suma de cuadrados g.l. Estimador Fexp

Entre Tratam. r-1

Los estimadores de los efectos de los bloques y tratamientos se estiman a partir de

y la parte propia de cada observación (o residual)

IDEAS BASICAS SOBRE EXPERIMENTOS

Una combinación de un nivel de cada uno de los factores estudiados determina un

Factores susceptibles de aplicación

-Factores cualitativos ordenados.

-Factores cualitativos muestreados.

Efectos principales e interacción en un experimento de dos factores.

Tenemos varias formas de cacterizar esta tabla:

c) Los efectos de los dos factores son aditivos.

d) Los residuales al restar los efectos fila y columna son cero.

Si estas condiciones no se verifican decimos que hay una interacción entre A y B.

Experimento factorial con dos factores de variación y el mismo número de

Se dispone de un conjunto de observaciones homogéneas y se asigna los tratamientos

Los datos resultantes serían los siguientes

El modelo matemático es ahora

Donde ai es el efecto debido al bloque, bj es el efecto debido al tratamiento, (ab)ij es el

-Análisis estadístico: Análisis de la varianza de dos vías.

Fuente Suma de cuadrados g.l. Estimador Fexp

Los estimadores de los efectos de los bloques y tratamientos se estiman a partir de

y la parte propia de cada observación (o residual)

Das könnte Ihnen auch gefallen