Sie sind auf Seite 1von 38

Unidad III.

Introduccin al Diseo Experimental


Objetivos

Diferenciar

grupos

de

una

poblacin

de

datos

usando

diseos

experimentales y pruebas de varianzas ANDEVA.

Hacer inferencias y valorar los modelos de ANDEVA en la solucin de


problemas experimentales de la vida real y profesional.

Desarrollar capacidades del trabajo en equipo al momento de realizar


investigaciones experimentales.

Contenido
Unidad 3.Introduccin al diseo Experimental..........................................................1
3.1 Experimentacin, conceptos bsicos...............................................................1
3.2 Modelos ANDEVA............................................................................................3
3.3 Andeva uni factorial, anova one way, diseo DCA.........................................8
3.4 ANDEVA para un Diseo BCA.......................................................................17
3.5 Diseo de Cuadro Latino...............................................................................26
3.6 Diseo en Cuadro Greco Latino....................................................................32
3.7 Anlisis de la varianza de dos factores con interaccin................................32

3.1 Experimentacin, conceptos bsicos


Investigar en condiciones controladas y con un diseo predefinido es un
experimento.

Un experimento, es una investigacin en condiciones controladas. Es la forma


ms comn de investigar en las ingenieras.

Al controlar las condiciones de

investigacin el nmero de repeticiones es menor que en una investigacin de tipo


descriptivo. Para entrar al mundo de la experimentacin es necesario manejar
algunos conceptos bsicos como:
Luis Mara Dicovskiy Riobo, 2011

Pgina 1

Unidad Experimental es la mnima unidad donde se aplican los tratamientos,


puede ser una persona o una comunidad, una planta o una parcela. Es la unidad
donde se toma el dato. El tamao y nmero de elementos vara segn los
objetivos de la investigacin.
Factor de un experimento es una variable independiente nominal o categrica; es
una variable cuyos niveles son configurados por el experimentador, es el tema del
experimento. Un experimento puede tener ms de un factor en estudio. Cada
valor o tipo del factor se llama Tratamiento o Grupo, estos suelen ser las nuevas
tecnologas a evaluar, lo que propone como novedoso el investigador.
Tratamientos Testigos son tratamientos de referencia, sirven para comparar los
tratamientos propios del experimento. Pueden ser de dos tipos: Absoluto y
Relativo. A veces un experimento lleva ambos testigos. El tratamiento absoluto,
puede ser no aplicar tratamiento, permite medir la variable dependiente, ante la
ausencia de las tecnologas que se estn probando. El tratamiento relativo puede
ser la tecnologa tradicional, lo que se hace de manera corriente, me permite
valorar la mejora que producen las nuevas tecnologas, tomando como referencia
lo que se hace de forma tradicional.
Repeticin Es el nmero de veces que ocurre cada tratamiento. Para poder hacer
estadstica debe haber repeticiones Para tener confiabilidad en los resultados de
un experimento, el nmero mnimo de repeticiones no debera ser menor a cuatro.
Tamao de un experimento: es el nmero de unidades experimentales del
experimento, n. Cuando el nmero de repeticiones por tratamiento es el mismo
valor, n es igual al nmero de tratamientos por el nmero de repeticiones, n=r t.
Diseo del experimento. Es el arreglo espacial y en el tiempo de los tratamientos.
Cuando ms complicado es el diseo, ms grados de libertad pierde modelo, pero
se controla mejor el error experimental si se conocen las direcciones de los
Luis Mara Dicovskiy Riobo, 2011

Pgina 2

gradiente de las causas de perturbacin. En este sentido hay un equilibrio


dinmico, un diseo ms complejo y que no tiene un mejor el control del error
puede ser ms ineficiente que un diseo simple. No hay un diseo mejor que otro,
el investigador debe descubrir cul es el mejor diseo para su experimento y este
depender de la irregularidad del rea experimental, del nmero de tratamientos y
de la orientacin espacial de las causas que perturban el experimento. El diseo
ms simple de todos es el Diseo Completamente al Azar, DCA, sin embargo el
diseo ms utilizado en la agricultura en el de Bloques completos al azar, BCA.
Un diseo experimental ms complicado no garantiza un mejor control del error
experimental.

Ejercicio 3.1 Se hizo un experimento de evaluacin de la durabilidad en horas, de


4 tipos de mquinas: A, B C y D. La mquina D es la que usa
comercialmente la gente y las mquinas A, B y C son nuevos prototipos que
se acaban de disear. El experimento tiene 5 repeticiones, hay 5 mquinas iguales
de cada tipo. Cada unidad experimental era una mquina. Diga:
Cul es el factor en estudio?
Cuntas unidades experimentales tiene el experimento?
Cul es la variable dependiente, de investigacin?
Cules son los tratamientos experimentales, nuevas tecnologas?
Cul es el tratamiento testigo?

3.2 Modelos ANDEVA


La tcnica del Anlisis de la Varianza (ANDEVA) es una de las tcnicas ms
utilizadas en los anlisis de los datos de los diseos experimentales. Se utiliza
cuando queremos contrastar ms de dos medias, por lo que puede verse como
una extensin de la prueba t para diferencias de dos medias.

Luis Mara Dicovskiy Riobo, 2011

Pgina 3

El ANDEVA usado para analizar experimentos, es un mtodo muy flexible que


permite

construir

modelos

estadsticos

para

el

anlisis

de

los

datos

experimentales. Bsicamente es un procedimiento que permite dividir la varianza


de la variable dependiente, generalmente variable continua, en dos o ms
componentes, cada uno de los cuales puede ser atribuido a una fuente (variable o
factor) identificable y la otra al error experimental. Las variables independientes
son generalmente nominales, son los Factores en estudio y hacen grupos o
tratamientos.
Los modelos que permite construir el ANDEVA pueden ser reducidos al cociente
entre dos varianzas, el numerador es la varianza del modelo como los
tratamientos, bloques, etc. y el denominador es la varianza de los errores. Por
ejemplo en un caso de Andeva unifactorial anova one way el valor F calculado

es

S 2trat
S 2error

El ANDEVA est basado en ciertos supuestos, unos ms posibles que otros Es


evidente que cuantos ms factores introduzcamos se espera que quede menos
cantidad de variacin residual (error) por explicar. Pero siempre quedar alguna
variacin residual.
Suposiciones del Anlisis de Varianza
En cada ocasin que se realice un anlisis de varianza (ANDEVA), rutinariamente
deben examinarse los datos para determinar si estos indican alguna desviacin de
los supuestos que rigen dicho anlisis. Por lo tanto, es recomendable realizar un
anlisis de las suposiciones en las que se basa el ANDEVA junto con el anlisis
mismo. Slo despus de hacer este anlisis de suposiciones y que stas se
cumplan razonablemente, se puede expresar con cierta confianza la validez de los
resultados estadsticos.
Luis Mara Dicovskiy Riobo, 2011

Pgina 4

Las suposiciones en las que se basa el ANDEVA son las siguientes:

Los errores de los datos son normales.

Varianzas son homogneas.

Independencia de medias y varianzas

Aditividad del modelo

Normalidad de los errores: Es relativamente fcil hacer pruebas de normalidad


de los errores con programas estadsticos computacionales, ya sea con un grfico
QQ plot o la prueba de normalidad de Shapiro Wilks. En la primera prueba el valor
r de correlacin debe ser mayor a 0.95 y en la segunda prueba el valor p de la
prueba de hiptesis debe ser mayor a 0.05, estar en H 0. El programa INFOSTAT
puede calcular los errores de cada dato y hace ambas pruebas. Sin embargo este
requisito no es tan importante como la Independencia de las Observaciones, pues
en general el ANDEVA es una prueba robusta. Esto quiere decir que, aunque los
errores de las observaciones no sean normales, las medias de los tratamientos
son aproximadamente normales debido al Teorema Central del Lmite. Sin
embargo, si los errores de los datos son extremadamente no-normales, es posible
transformar los datos para cubrir este requisito, o bien emplear mtodos no
paramtricos.
Homogeneidad de varianzas de los diferentes tratamientos: Es muy
importante para el modelo verificar su hay homogeneidad de las varianzas de los
diferentes tratamientos, pues si esto no se cumple se pueden invalidar los
resultados de una HA. Una poblacin heterognea en varianzas no permite
detectar si las diferencias observadas se deben diferencias de promedios o de las
varianzas.
Para corroborar o refutar las afirmaciones hechas respecto de la hiptesis de la
homogeneidad de las varianzas de los grupos o tratamientos respecto a la variable
Luis Mara Dicovskiy Riobo, 2011

Pgina 5

dependiente, se dispone de la prueba de Levene de homogeneidad de varianzas.


Esta prueba funciona como un estadstico F de la distribucin F de Fisher,
donde la H0 consiste en suponer que las varianzas de los errores absolutos de los
distintos grupos son iguales. Se rechazar esta H0 en el caso de que la
significacin del estadstico sea menor que 0,05. El estadstico de Levene se hace
realizando una ANDEVA una va con los errores en valor absoluto, INFOSTAT
calcula este tipo de error.
Independencia de promedios y varianzas: Que un promedio mayor no tenga
independencia entre medias y varianzas es un caso especial de falta de
homogeneidad de varianzas. En algunos datos existe una relacin definida entre
las medias y sus varianzas, por ejemplo el nmero de hojas de plantas de tomate
de un mes y de tres meses, en ambos casos no solo hay diferencias de promedios
sino tambin de varianzas, a ms edad mayor promedio y varianza. Este problema
se puede manejar con un buen diseo del experimento. Sin embargo esta relacin
suele ser la causa ms comn de heterogeneidad de varianza. Una correlacin
positiva entre medias y varianzas es una forma de detectar el problema, cuando
se observa un amplio rango entre las medias. El estadstico de Levene tambin
detecta este problema.
Aditividad del modelo
Una prueba ANDEVA supone que los datos siguen un modelo lineal aditivo. Para
cada diseo experimental se construye un modelo matemtico lineal aditivo, para
el caso de un diseo completamente aleatorio, DCA, es

x ij= x i i j

. La

ecuacin expresa que el valor de cualquier unidad experimental est compuesta


por la media general, ms o menos el efecto de tratamiento
un termino de error caracterstico de cada dato

ij

y ms o menos

. En este modelo los trminos

se suman, si esto no ocurre as, el ANDEVA nos puede llevar a conclusiones


Luis Mara Dicovskiy Riobo, 2011

Pgina 6

incorrectas. La falta de aditividad puede ocurrir por un mal diseo del experimento,
por ejemplo si se prueban diferentes dosis de fertilizante, pero cada dosis se
prueba en una especie de planta diferente, puede resultar una interaccin entre
dosis de fertilizante y especie de planta que rompa el modelo aditivo.
Qu hacer cuando el modelo no funciona?
La violacin o falta de apego a cualquiera de estas suposiciones indica que los
resultados podran no tener validez. Dependiendo del tipo de problema, puede
haber solucin o no al objetivo buscado en el experimento. El dilema ms fuerte
con el que ha de luchar el experimentador es el de la falta de homogeneidad de
varianzas, ya que si esto ocurre, no podemos saber si las diferencias entre los
tratamientos se deben a promedios diferentes o varianzas diferentes.
La falta de normalidad no es tan importante, pues la prueba ANDEVA es robusta a
este problema y, en casos extremos, se puede optar por el uso de
transformaciones. En general para los casos en que los supuestos de normalidad,
homogeneidad, independencia de medias-varianzas o aditividad no se cumplen,
puedo usar transformaciones de datos, las ms usadas son:

Logaritmo Log (x), til cuando los datos crecen en sentido exponencial o
cuando las desviaciones estndares de las muestra sean aproximadamente
proporcionales a los promedios o hay evidencia de efectos principales
multiplicativos de los tratamientos en vez de aditividad.

La transformacin

x+0.5

til cuando los nmeros observados son

pequeos 0-10, por ejemplo son acontecimientos pocos comunes, tienen


una posibilidad muy baja de ocurrir en cualquier individuo. Estos datos
tienden a seguir una distribucin de Poisson.

La transformacin

Arcoseno x /100

cuando los datos son expresados

en por ciento o son proporciones de la muestra total. Por lo general estos


Luis Mara Dicovskiy Riobo, 2011

Pgina 7

datos tienen una distribucin binomial y no de una distribucin normal como


se espera.
Como ltimo recurso, ante datos dudosos de anlisis se puede usar el uso de
mtodos de estadstica no paramtrica. Es importante mencionar que el empleo
de estadstica no paramtrica o el uso de transformaciones no eliminan el
problema de la falta de aleatoriedad de las unidades experimentales, errores por
un mal diseo del experimento o por una mala toma de datos, es decir, la
ejecucin incorrecta de un experimento no tiene ms remedio que repetir el
experimento corrigiendo los errores por falta de diseo o mal manejo.

3.3 Andeva uni factorial, anova one way, diseo DCA.


Anova one way es como se le llama en lengua inglesa al Andeva Unifactorial y
como comnmente aparece citado en la bibliografa. Este es el modelo ms simple
y ms usado de ANDEVA,

tiene

un Factor, variable que genera grupos o

tratamientos y una variable dependiente continua. Este es un modelo que funciona


bien Equilibrado no Equilibrado. El modelo supone que las repeticiones de los
distintos tratamientos estn distribuidas al azar dentro del experimento y que no
necesariamente cada grupo o tratamiento tiene igual nmero de repeticiones. El
diseo de este modelo estadstico se llama Diseo Completamente aleatorio y
generalmente funciona bien controlando el error experimental cuando no hay
perturbaciones externas con algn sentido definido, como viento, tipos de suelo
diferentes, variaciones trmicas, etc.
El Diseo Completamente Aleatorio, DCA, supone que las diferentes unidades
experimentales del experimento se encuentran al azar dentro del rea
experimental y al mismo tiempo. El DCA se utiliza mucho en investigaciones
sociales, cuando se posee informacin de variables dependientes continuas como
peso, altura, edad o ingresos y variables nominales que hacen grupos como
nivel social procedencia sexo etc. Tambin se usa mucho en experimentacin
Luis Mara Dicovskiy Riobo, 2011

Pgina 8

en laboratorios, donde se tiene un buen control de aquellos factores que puedan


perturbar la investigacin. El modelo supone que se debe disponer de los
resultados de k muestras aleatorias independientes, cada una de tamao n k, de k
diferentes poblaciones; y lo que interesa probar es la hiptesis que las medias de
esas k poblaciones son todas iguales
ANOVA ONE WAY : Modelo Estadstico supuesto, es Lineal:
x ij= x i ij
x ij

= Valor de la n-esima observacin ubicada en el tratamiento i.

= Promedio General

= Efecto del tratamiento i que es igual a

x Ti x

, la media del tratamiento

i menos la media general. Estos efectos puede tener valor positivo o negativo
y el modelo supone que hay variacin entre los tratamientos, por los tanto se
puede calcular su variancia,
ij

S 2 tratamientos

= Error o Variacin de las observaciones ubicada en la repeticin j y

tratamiento i. El valor del error puede ser negativo o positivo. Se cumple que la
suma y promedios de los errores son iguales a 0. Sin embargo es posible
calcular la variancia,

S 2

Tipo de Hiptesis en un ANOVA ONE WAY


H0: 1= 2= 3= k, se supone que la variancia de los tratamientos es semejante a
la variancia del error, por lo tanto la relacin
pequeo, cercano a uno.

Luis Mara Dicovskiy Riobo, 2011

Pgina 9

S 2 / S 2 debe ser un valor

HA: no todos los son iguales, al menos el menor y mayor promedios son
diferentes. Esto supone que la relacin

S 2 / S 2

es un valor relativamente

grande, ya que la variancia de los tratamientos es varias veces mayor a la


variancia del error.
Nivel de significacin:
0.05 0.01
Estadstico de Prueba:
Fcalculado =S 2 /S 2
Regla de Decisin:
Si valor Fcalculado es mayor que el valor frontera tomado de una tabla de distribucin
Ftabla se rechaza Ho, ya que el Fcalculado est en zona de rechazo de la hiptesis nula,
Ho de la distribucin F. El valor de F de frontera se busca en una tabla de
valores F, donde el valor de las columnas son los grados de libertad de los
tratamientos y los de las filas son los grados de libertad del error.
Si se usa un programa estadstico el anlisis de hiptesis se hace con el P valor.

Si P 0.05 se est en H0.


Si P< 0.05 se est en HA.

Modelo de ANDEVA
Causa de

Grados de Suma de Cuadrados

Cuadrado

Variacin

Libertad

Medio, CM

SC

GL
Tratamientos

t 1

(n -1)

SC

( ) ( )

xi
1

r
Error

total

xij

- SCtratamientos

(t 1)

Luis Mara Dicovskiy Riobo, 2011

S2
SC Tratamientos
GL Tratamientos

Pgina 10

SC Error
GL error

FCalculado

S 2tratamientos
s 2error

Total

n 1

( x ij )
2

( )
1

x ij

Estadsticos que verifican calidad de los datos, R 2 y CV.


Al interpretar un ANDEVA es importante medir que tan bueno fue el modelo
estadstico aplicado y si el error experimental fue controlados por el diseo
experimental. Para este tipo de anlisis disponemos de dos coeficientes fciles de
calcular el coeficiente de determinacin, R2, y el coeficiente de variacin
aplicado al error CV .
El coeficiente de Determinacin, R2:
Este coeficiente muestra que proporcin de la variacin total de los datos est
siendo explicada por el modelo adoptado, R 2 es un valor entre 0 y 1; a ms cerca
de 1 mejor funciona el modelo. El R 2 se construye con la suma de cuadrados de

la tabla ANDEVA de la siguiente manera:

R 2=

SC Modelo
SCTotal . En el caso de un DCA

la suma de cuadrados del modelo, SC Modelo, es la suma de cuadrados de los


tratamientos. En el caso de un BCA (bloques completos al azar), la SC Modelo es
igual a la SCTratamientos + SCBloques. En una caso de un cuadro latino, CL, la SC Modelo
es igual a la SCTratamientos + SCFilas + SCcolumnas.
El Coeficiente de Variacin, CV, aplicado a un experimento.
El Coeficiente de Variacin, CV, se puede aplicar para medir la variacin interna
de los tratamientos, variacin que se refleja en la variancia del error o cuadrado
medio del error. Un experimento mal manejado puede presentar mucha variacin
entre las repeticiones de un mismo tratamiento, esto es error experimental. El CV
tambin est en dependencia de la variable que se mide o pesa. Si la variable est
bien controlada el CV deber ser menor a 20 %, incluso en laboratorio se pueden
Luis Mara Dicovskiy Riobo, 2011

Pgina 11

exigir CV menores al 10 %. Sin embargo en investigacin social descriptiva o en


variables biolgicas no controladas como es una plaga, es comn que los CV sean
grandes. El investigador debe explicar la causa de esta variacin. La forma de

clculo es:

CV =

CM Error (100 )
X

Un Ejemplo de ANDEVA uni factorial


Una tesis de estudiantes evalu 4 tipos de abono, uno con base de pulpa de caf,
otro con base de abono de lombriz, lombrihumus, y se utilizaron 2 testigos, uno
con la dosis de fertilizacin qumica tradicional, testigo relativo y otra con tierra sin
abono extra, testigo absoluto. La variable de produccin fue grs. promedio del
peso seco de las plntulas de caf a los 6 meses de siembra por unidad
experimental, el ensayo tuvo cuatro repeticiones. A continuacin se muestran los
datos obtenidos.
Tabla de Datos. Peso en onzas. Parte area plntula de caf.
Tratamiento/
Bloques
Pulpa caf
Abono de lombriz
Qumico
Tierra
repeticion es

II

III

IV

tratam

1.00
1.65
1.69
0.58
4.92

0.90
1.59
1.52
0.60
4.61

1.16
2.00
1.40
0.60
5.16

0.98
1.65
1.46
0.46
4.55

4.04
6.89
6.07
2.24
19.24

1.01
1.72
1.52
0.56

Tabla de ANDEVA
Causa de

Grados de

Suma de

Cuadrado

Variacin

Libertad

Cuadrados

Medio, CM

FCalculada

S2

Tratamientos

4 1 = 3

3.28

3.28/ 3 =1.09

1.09/0.02=6
5.18

Luis Mara Dicovskiy Riobo, 2011

Pgina 12

Error

15- 3 =

0.20

Total

12
16 1 =

3.48

0.2/12 =0.017

P valor
0.00

15

Suma de Cuadrados Total =

( x ij )2
1

( )
x ij
1

= (1.002 + 0.902 + 1.162 +0.982...+ 0.462 ) ((1.00 + 0.90 + 1.16 +0.98...+ 0.46)2 /
16) = 26.61 19.242 / 16 = 26.61 23.13 = 3.48

Suma de cuadrados de los Tratamientos =

( ) ( )

xj
1

x ij

= ((4.04)2 + (6.89)2 + (6.07)2 + (2.34)2 )/ 4 (19.242 / 16) = (106.11 / 4) 23.13=


3.28
Interpretacin
La prueba resulta en HA: no todos los son iguales
Ya que la F calculada 65.18 > F Tabla 3.49 (con 3 y 12 grados de libertad)

El Diseo Completamente Al azar, DCA se resuelve estadsticamente con


un ANDEVA unifactorial, ANOVA ONE WAY

Verificacin del modelo.

Luis Mara Dicovskiy Riobo, 2011

Pgina 13

Para realizar un estudio de normalidad y homogeneidad de las variancias es


necesario calcular los errores y hacer pruebas de normalidad y homocedasticidad.
Con los programas Excel o INFOSTAT se pueden calcular los errores de cada
valor observado de la manera:

Tratamiento
Pulpa caf
Pulpa caf
Pulpa caf
Pulpa caf
Lombrihumu
s
Lombrihumu
s
Lombrihumu
s
Lombrihumu
s
Qumico
Qumico
Qumico
Qumico
Tierra
Tierra
Tierra
Tierra

ij =x ij x ( xti x )

Peso
1.00
0.90
1.16
0.98

Media
Total
1.2
1.2
1.2
1.2

Media
Tratamiento
1.01
1.01
1.01
1.01

Efecto
Tratamiento
-0.19
-0.19
-0.19
-0.19

Error
-0.01
-0.11
0.15
-0.03

Error
Absolut
o
0.01
0.11
0.15
0.03

1.65

1.2

1.72

0.52

-0.07

0.07

1.59

1.2

1.72

0.52

-0.13

0.13

2.00

1.2

1.72

0.52

0.28

0.28

1.65
1.69
1.52
1.40
1.46
0.58
0.6
0.6
0.46

1.2
1.2
1.2
1.2
1.2
1.2
1.2
1.2
1.2

1.72
1.52
1.52
1.52
1.52
0.56
0.56
0.56
0.56

0.52
0.32
0.32
0.32
0.32
-0.64
-0.64
-0.64
-0.64

-0.07
0.17
0.00
-0.12
-0.06
0.02
0.04
0.04
-0.1

0.07
0.17
0.00
0.12
0.06
0.02
0.04
0.04
0.1

Luis Mara Dicovskiy Riobo, 2011

Pgina 14

Cuantiles observados(RDUO_gr planta)

Grfico QQ plot de errores

0.28

0.16

0.04

-0.08

-0.20
-0.20

-0.08

0.04
Cuantiles de una Normal

0.16

0.28

En el Grfico QQ plot de los residuos se observa que stos se distribuyen cercanos a


la recta de regresin de la normal, lo que hace suponer que los residuos se
distribuyen de manera normal. Tambin el programa hace regresin de los residuos y
la recta normal y esta fue d: r =0.95, valor suficiente para aceptar la normalidad.
Valores de la prueba Shapiro-Wilks para verificar normalidad por prueba de
hiptesis.
Variable
Rduo gr planta

n
16

Media D.E. W*
0.00 0.12 0.89

p (una cola)
0.10

La prueba de normalidad de Shapiro Wilks para los errores del modelo, realizado
con el programa INFOSTAT, confirma que stos se distribuyen de manera normal.
Se acepta la H0 de normalidad de los errores ya que el valor calculado p de 0.10
es mayor al valor de 0.05.

Para verificar la homogeneidad de las variancias, se hizo la prueba de Levene,


que consiste en hacer un ANDEVA de los valores promedios de los errores de los
tratamientos en valor absoluto.
Cuadro de Anlisis de la Varianza de los errores en valor absoluto
Luis Mara Dicovskiy Riobo, 2011

Pgina 15

F.V.

SC

gl

CM

p-valor

Abono 0.02

0.01

1.10

0.39

0.01

Error

0.06

12

Total

0.08

15

Como el p valor de 0.39 es mayor al valor de 0.05 concluyo que se ocurre H 0,


las variancias de los errores absolutos de los diferentes tratamientos son iguales,
por lo tanto en este experimento se cumple la homogeneidad de variancias.
Para observar grficamente la homogeneidad de varianzas se puede construir un
grfico de densidad de puntos con los valores por tratamiento de los residuos
absolutos, estos puntos deben tener una dispersin semejante en los diferentes
tratamientos. A continuacin se observa el ejemplo.

0.29

Grfico de Residuos Absolutos por tratamiento

RABS_peso

0.22
0.14
0.06
-0.01

Pulpa

Lombrihumus

Qumico

Tierra

Calidad de los datos


El coeficiente de determinacin fue bastante alto, lo que explica que el modelo

funcion bastante bien explicar la variacin total de los datos, el


es un valor muy alto.
Luis Mara Dicovskiy Riobo, 2011

Pgina 16

R2=

3.28
=0.94
3.48

El coeficiente de variacin tuvo un valor bastante aceptable para un experimento

de fertilizacin a campo, este fue:

CV =

0.017
( 100 )=11
1.2

Ejercicio 3.2 En un estudio socioeconmico se tuvo 75 datos, correspondientes a


muestras de diferentes ciudades de cada pas. Donde la variable dependiente
estudiada fue caloras ingeridas por da y la variable dependiente es Pas, en
total 8 pases. En este caso la Hiptesis nula a responder es: La cantidad
promedio de caloras diarias ingeridas por persona es igual en todas las regiones
econmicas del mundo? A continuacin se muestra la tabla incompleta de
ANDEVA.
Tabla de Anlisis de Variancia, ANDEVA.
Causa De variacin
Suma de Grados de Cuadrado
Cuadrados Libertad
Medio
Entre Grupos
1,445
7
Error, dentro del grupo
5,382
67
Total
74
Completar la tabla de ANDEVA?

Construya las 2 hiptesis correspondientes?


Interprete y comente los resultados?
Ejercicio 3.3 Se quera saber si los estudiantes utilizan la teora explicada en el
aula al resolver problemas prcticos. Se hizo un experimento con 12 estudiantes,
se formaron 3 grupos, A-B-C, de cuatro estudiantes cada uno. A cada grupo se les
dio un ejercicio matemtico semejante para resolver de manera individual. A los
cinco minutos al grupo B se le dio un papel con una informacin terica adicional y
al grupo C se les dio un papel con dos informaciones. Cada estudiante resolva el
problema de manera individual. La variable dependiente fue el tiempo medido en
segundos.
Los datos obtenidos fueron los siguientes:
Luis Mara Dicovskiy Riobo, 2011

Pgina 17

Grupo/ Segundos para resolver


E.1
A. Testigo
242
B. Un informacin adicional
176
C. Dos informaciones adicionales
155
Construya las 2 hiptesis correspondientes?

E.2
206
129
106

E.3
300
128
122

E.4
282
190
115

Resolver la tabla de ANDEVA?


Interprete y comente los resultados?
Verifique el modelo. Son los errores normales, y las variancias de los grupos
homogneas?

3.4 ANDEVA para un Diseo BCA


El diseo de bloques completamente al azar, BCA, es un diseo ampliamente
utilizado a campo en centros experimentales agronmicos. Es ideal para evaluar
variedades, distancias de siembra, control de plagas, etc. Este diseo permite
controlar al menos el principal gradiente de error que posee el rea experimental.
El diseo. Un bloque es (en Estadstica) un grupo de observaciones que pueden y
deben ser analizadas e interpretadas slo de modo conjunto. Se dice que un
bloque es un bloque completo cuando todos sus elementos componentes tienen
valores vlidos y estn representados todos los tratamientos.

Un bloque puede estar fijado o establecido por el investigador de modo arbitrario.


En este caso, se dice que ese bloque es un bloque no aleatorio. Pero puede que
este bloque est fijado, configurado o seleccionado segn la ley estadstica del
azar, en cuyo caso se dice que el bloque es un bloque aleatorio.

El BCA exige que en cada bloque se encuentren todos los tratamientos, de ah el


nombre de bloques completos y que los bloques se ubiquen de manera
transversal al gradiente que perturba de mayor grado el rea experimental, por
Luis Mara Dicovskiy Riobo, 2011

Pgina 18

ejemplo: pendiente de suelos, vientos, riego, luz, etc. De esta manera se trata de
reducir la suma de cuadrados del error, es decir reducir la varianza del error y as
poder explicar con el modelo la variacin ocurrida en el rea experimental. El
punto dbil del modelo es que se pierden grados de libertad del error por lo tanto
sino se reduce la suma de cuadrados del error el BCA pierde precisin frente a un
DCA.

En nuestras condiciones se recomienda usar cuando hay menos de 15


tratamientos, ya que con un nmero mayor de tratamientos es muy difcil de
manejar a campo, an experimentos de 10 tratamientos son difciles de
implementar sin aumentar el error experimental a niveles que hacen dudar de los
resultados.
El BCA es el diseo ms utilizado en la experimentacin agrcola

El Modelo Estadstico, lineal.


x ij= x i j ij
x ij

= Valor de la j observacin ubicada en el i tratamiento.

x = Promedio General

= Efecto del tratamiento i

= Efecto del Bloque j

ij

= Variacin o error de las observaciones ubicada en el bloque j, utilizando el


tratamiento i.

Desde el punto estadstico el modelo es semejante al utilizado para resolver un


diseo completamente aleatorio, DCA, solo que se le agrega una nueva causa de
Luis Mara Dicovskiy Riobo, 2011

Pgina 19

variacin, que en este caso son los bloques. El modelo supone que no existe
interaccin entre los bloques y que los efectos son fijos sin importar los
tratamientos, esto quiere decir que un tratamiento dado no puede ser de los
mejores promedio en un bloque y ser de los peores en otro.
Al realizar el experimento lo que se espera es que haya diferencias significativas
entre los bloques, que estos absorban error experimental. Sin embargo

esta

prueba solo es referencial ya que desde un punto de vista estricto de diseo, los
bloques no tienen repeticiones.
ANDEVA bifactorial sin interaccin es el modelo estadstico para anlisis de
un diseo B.C.A

Anlisis de Varianza
Hiptesis:
Sobre los tratamientos
Ho: 1= 2=..... = k, HA: no todas los k son iguales
Sobre los bloques
Ho: 1= 2=..... = j, HA: no todas j son iguales
Nivel de significacin:
0.05 0.01
Estadstico de Prueba:
Ftratamientos = S2tratam/S2error ; Fbloques= S2bloque/S2error
Regla de Decisin:
Si Fcalculado es mayor que la Ftabla se rechaza Ho

Tabla de ANDEVA de un BCA

Luis Mara Dicovskiy Riobo, 2011

Pgina 20

Causa de

Grados

Variacin

de

Suma de Cuadrados

Tratamientos

( ) ( )

( ) ( )
x ij

(t 1)

total

t
(n -1) SC

xj
1

- SC

S2
SC Tratamientos
GL Tratamientos

S 2tratamientos
s 2error

x ij

b 1

xj

t 1

Error

FCalculado

Medio, CM

Libertad

Bloques

Cuadrado

SC bloques
GL bloques

tratam

- SC

bloq

S bloques
2
serror

SC Error
GL error

(b -1)
Total

n 1

( x ij )

( )

x ij

Donde:
i es cualquier tratamiento
j es cualquier bloque
t es el nmero de tratamientos
b es el nmero de bloques
n es el nmero de unidades experimentales, es igual a b x t.
Un Ejemplo
Para comparar diseos se analiza el mismo ejemplo anterior pero considerando
que las repeticiones tuvieron un diseo de bloques
Tabla de ANDEVA

Luis Mara Dicovskiy Riobo, 2011

Pgina 21

Causa de

Grados de

Suma de

Cuadrado

Variacin

Libertad

Cuadrados

Medio, CM

3.28

S2
1.09

Tratamientos

4 1 = 3

FCalculada

Tratamiento
Bloques

4 1 = 3

0.06

0.02

Error

15- 3 - 3= 9

0.14

0.16

Total

16 1 = 15

3.48

Bloques
1.29

Suma de cuadrado Total =

( x ij )
1

70.07

( )
1

x ij

= (1.002 + 0.902 + 1.162 +0.982...+ 0.462 ) ((1.00 + 0.90 + 1.16 +0.98...+ 0.46)2 /
16)
= 26.61 19.242 / 16 = 26.61 23.13 = 3.48
t

Suma de cuadrados de los Tratamientos =

b
1

= ((4.04)2 + (6.89)2 + (6.07)2 + (2.34)2 )/ 4 (19.242 / 16)

Luis Mara Dicovskiy Riobo, 2011

Pgina 22

( ) ( )
b

= (106.11 / 4) 23.13= 3.28

xj

x ij

Suma de cuadrados de Bloques =

( ) ( )

xj
1

x ij

= (4.922 + 4.612 + 5.162 + 4.552 / 4) (19.242 / 16)


= (96.12 / 4) 23.13 = 0.06
Suma de cuadrados del Error = S.C total S.C tratamientos S.C bloques

3.48 -3.28- 0.06= 0.14


Cuadrado Medio de los tratamientos = S.C

tratamientos

/ G.L tratamientos

3.28 / 3 = 1.09
Cuadrado Medio de los bloques= S.C bloques / G.L bloques
0.06 / 3 = 0.02
Cuadrado Medio del error = S.C error / G.L error
0.14 / 9 = 0.016
Ftratamientos = C.M tratamientos / C.M error
1.09 / 0.016 = 68.12 (la variancia de los tratamientos es 68.12 veces mayor que la
variancia del error)
Fbloques = C.M bloques / C.M error
0.02/ 0.016 = 1.25
Interpretacin de la prueba de hiptesis.
Luis Mara Dicovskiy Riobo, 2011

Pgina 23

Siendo Fcalculada = 68.12 > Ftabla, 3-9 GL = 0.05 3.86 y 0.01 6.99
El resultado se encuentra en Hiptesis alternativa, es decir al menos uno de los
tratamientos es diferente al resto, ahora se debe hacer una prueba de separacin
de promedios para conocer el detalle de las diferencias entre los tratamientos. Sin
embargo los bloques no son significativos, lo que significa que estos no
disminuyeron el error.
Separacin de Promedios
Estas pruebas se realizan solamente cuando el resultado del ANDEVA refleja que
estamos en HA, es decir al menos los promedios extremos son diferentes. Las
pruebas que veremos son: Diferencias significativas mnimas, Prueba de rangos
mltiples de Duncan y la Prueba de rangos mltiples de Tukey.
Diferencia Significativa Mnima
Solo se debe usar para comparar promedios adyacentes, o contra un testigo
estndar, donde no se involucren en la comparacin ms de 2 promedios. Esta
prueba suele ser poco usada, pero sirve como insumo para realizar la prueba de
Duncan que es ms popular.

DSM0.05 = t0.05

DSM0.05 =

2.262

2(CM error )
r

2(0.016)
=0.20 gr
4

El valor t de tabla se busca con los grados de libertad del error, en este caso es
de 9 y para un alfa del 5 %. El valor DSM de 0.20 gr se contrasta con las
Luis Mara Dicovskiy Riobo, 2011

Pgina 24

diferentes diferencias de promedios respecto al testigo. Si la diferencia de


promedios es mayor que el valor DSM, se concluye que estos promedios son
diferentes.

Tratamientos

en gr

Lombrihumus
1.72
Qumico
1.52
Pulpa caf
1.01
Conclusiones: el lombrihumus, el

Diferencia con

Diferencias

el testigo Tierra

mayores de

de 0.56 gr
0.20 gr
1.16
Si
0.96
Si
0.45
Si
fertilizante qumico y la pulpa de caf son

mejores estadsticamente que el testigo tierra sin fertilizante.


Prueba de Rangos mltiples de Duncan.
Es una prueba muy usada cuando tienen 6 o menos tratamientos, con un nmero
mayor generan muchos subgrupos de comparacin, lo que hace difcil la
interpretacin de resultados
DSM0.05 Duncan = DSM0.05 R

Donde R es un valor extrado de de una tabla de factores studentizados


significativos que se elije de acuerdo con el nivel de significacin deseado, con los
grados de libertad para el error y con la disposicin relativa de las medias en el
arreglo, ver la tabla en Little, T y Hills F. 1989.
Prueba de Rangos mltiples de Tukey
Es una prueba muy estricta, robusta, se sugiere usar cuando hay mas de 6
tratamientos o se quieren resultados de separaciones muy confiables.

Luis Mara Dicovskiy Riobo, 2011

Pgina 25

CM error
r
DSM Tukey = q , gl error, t *
Donde q es un valor tabulado, ver tabla en Daniel (2006), donde se considera: el
valor alfa de 0.05,

los grados de libertad del error, 9, y el nmero de

tratamientos,4. En este ejemplo el valor q es 4.415


DSM Tukey = 4.415=

0.016
=0.28 gr
4

Tabla de Diferencias
Tratamientos
Lombrihumus
Qumico
Pulpa caf
Tierra

Lombri
humus
-

Qumico

Pulpa caf

Tierra

0.20 NS
-

0.71**
0.52**
-

1.16**
0.96**
0.45**
-

Segn este cuadro, los fertilizantes lombrihumus y qumico son iguales y


diferentes y mejores a los otros dos tratamientos, pero pulpa de caf es mejor
que tierra. En este ejemplo, coinciden en resultados la prueba de Tukey y la
prueba DSM, debemos considerar que no siempre sucede as.

3.5 Diseo de Cuadro Latino


El diseo de cuadro latino, CL, es un diseo trifactorial sin interacciones, que es
adecuado implementar cuando se pueden encontrar fuentes extraas de
perturbacin al experimento en dos sentidos con relativamente pocas repeticiones,
lo que significa un menor gasto al momento de hacer experimentos. Un ejemplo de
CL en un experimento de agronoma

puede considerar como factores de

perturbacin el viento de norte a sur y un gradiente de fertilidad de este a oeste.


Este modelo es igual considerar la existencia de bloques dobles, bloques por filas
Luis Mara Dicovskiy Riobo, 2011

Pgina 26

y bloques por columnas. Una Caracterstica importante de este tipo de diseo es


su balance, que se logra asignando el mismo nmero de observaciones a cada
tratamiento de cada bloque, por esto son diseos en cuadro.
El cuadro latino, es un diseo trifactorial sin interacciones que resuelve
preguntas de tres factores con pocas repeticiones
Un ejemplo de cuadro latino, en nutricin animal, es comparar tres diferentes
alimentos A-B-C, donde un bloque son diferentes grupos de animales que comen
los alimentos y el otro bloque es el tiempo en que a cada grupo de animales se le
aplica los diferentes alimentos. En resumen hay: tres tipos de alimentos y tres
tiempos de alimentacin para tres grupos de animales, el experimento podra
disponerse segn el patrn siguiente:

Grupo

Animales T1

T2

/Tiempo
Grupo 1
A
B
Grupo 2
C
A
Grupo 3
B
C
Donde A-B-C son los diferentes tipos de alimentos.

T3
C
B
A

En este caso, cada alimento se aplica una sola vez por cada grupo de animales
junto con cada tiempo, y si existiesen efectos sistemticos debido a diferencias
entre los animales o entre los tiempos, dichos efectos estaran presentes de igual
manera en cada tratamiento, esto es, en cada tipo de alimento.
En este modelo se pueden observar que las diagonales repiten el mismo grupo,
ver el caso de la diagonal A-A-A, B-B y C-C. Estas diagonales no son problema en
esta caso ya que las columnas son el Factor tiempo, y el tiempo no se perturba
diagonalmente, sin embargo si el diseo fuera con filas y columnas en el espacio,
por ejemplo filas E-O y columnas NS, las diagonales no son deseables ya que

Luis Mara Dicovskiy Riobo, 2011

Pgina 27

pueden ser una fuente de error. En este caso se recomienda sortear filas y
columnas de forma independiente.
Un arreglo experimental como el que se describi se denomina cuadrado latino
3X3. Un cuadrado latino n x n es un arreglo cuadrado, los tratamientos aparecen
solo una vez en cada fila y en cada columna.

Ej. de Modelo 4x4, es el ms usado


Ej. Modelo 5x5

A
B
C
D

Modelo
Lineal

A
B
C
D
E

B
C
D
A
B
A
D
E
C

C
D
A
B
C
E
A
B
D

D
E
B
C
D
C
E
A
B

E
D
B
C
A

Estadstico

x ij= x i c j f k ij
x ij

= valor de la observacin i ubicada en la columna k con la fila j usando

el tratamiento i.
x = Promedio General
i

= Efecto del tratamiento i

cj

= Efecto de la columna j

fj

= efecto de la fila k

ij

= Variacin de las observaciones ubicada en la columna K, con la fila j,

usando el tratamiento i.
Luis Mara Dicovskiy Riobo, 2011

Pgina 28

Anlisis de Varianza
Hiptesis:
Sobre los tratamientos
Ho: 1= 2=..... = i

HA: no todas las i , tratamientos, son iguales

Sobre el Factor en columna


Ho: 1= 2=..... = j HA: no todas las j , columnas, son iguales
Sobre el Factor en Fila
Ho: 1= 2=..... = k , filas, son iguales. HA: no todas las k son iguales
Nivel de significacin:
0.05 0.01
Estadstico de Prueba:
F1= St/S2error; F2= Sf/S2error; F3= Sc/S2error
Regla de Decisin:
Si Fcalculado es mayor que la Ftabla se rechaza Ho

Tabla de ANDEVA de un Cuadro Latino


Causa de

Suma de

Grados de

Cuadrado

Variacin

Cuadrados

Libertad

Medio, CM

FCalculado

S2
S2t

Tratamiento
SCT
t-1
St/Serror
2
Filas
SCF
c-1
Sf
Sf/S2error
2
Columnas
SCC
f-1
Sc
Sc/S2error
Error
SCTot (SCT+SCF+SCC)
Difer.
S2error
Total
SCTot
n-1
Las sumas de cuadrados de las filas, columnas y tratamientos se resuelven con
procedimientos similares, como si fueran tres anova one way.
El ejemplo: Se quiere estudiar el rendimiento acadmicos de alumnos de la
misma carrera Ingeniera en Sistemas en 4 grupos: A, B, C, D,

en cuatro

asignaturas: Estadstica, Base de Datos, Economa y Fsica. Para neutralizar el


efecto en cadena que una asignatura tiene sobre la otra, el estudio se hace en
cuatro momentos, respetando el hecho que en un mismo momento se evalen las
Luis Mara Dicovskiy Riobo, 2011

Pgina 29

cuatro asignaturas. En este modelo pueden considerarse los Momentos como


columnas y las asignaturas como filas.
Datos
Asignatura

Grupo

Momento

Nota

Asignatura

Grupo

Momento

Nota

C
D
A
B
D
A
B
C

1
2
3
4
1
2
3
4

82
81
83
77
70
65
67
61

Estadstica
Estadstica
Estadstica
Estadstica
B de D
B de D
B de D
B de D

A
B
C
D
B
C
D
A

1
2
3
4
1
2
3
4

75
70
73
67
78
76
78
71

Economa
Economa
Economa
Economa
Fsica
Fsica
Fsica
Fsica

Suma de Cuadrados
2

1174
SC total=82 +81 ++71
=623.75
16
2

SC Asignaturas =

323 2+285 2+263 2+303 2 1174 2

=490.75
4
16
2

SC Grupo =

294 + 292 +292 +296 1174

=2.75
4
16

SC Momento=

3052 +2922+ 3012+276 2 1174 2

=124.25
4
16

SC Error =SC Total SC Asignaturas SC Grupo SC Momento=6.00

El anlisis de de variancia realizado con INFOSTAT como un ANDEVA trifactorial


sin interacciones dio los siguientes p valores.
Cuadro de Anlisis de la Varianza de un Cuadro Latino
C.V.
SC
gl CM
F
p-valor
Asignatura 490.75 3 163.58 163.58
<0.0001
Grupo
2.75 3 0.92
0.92
0.4872
Momento
124.25 3 41.42 41.42
0.0002
Luis Mara Dicovskiy Riobo, 2011

Pgina 30

Error
Total

6.00 6
623.75 15

1.00

Se concluye que hay diferencias significativas para las diferentes asignaturas y


diferentes momentos de aplicacin de exmenes ya que el p valor de 0.0001 y
0.0002 son menores al valor de 0.05. Sin embargo los cuatros Grupos de
alumnos tienen un comportamiento semejante.

Ejercicio 3.4 Se evalu 3 niveles de inclusin (10 %, 20 % y 30 %) de un nuevo


alimento para rumiantes desarrollado a base de pulpa de caf. El testigo fue 0 %
de inclusin. La variable medida fue consumo de materia seca, CMS en un
periodo determinado. Cmo no se tenan suficientes ovejas para realizar el
experimento, se usaron 4 animales en un diseo de cuadro latino en el tiempo,
cada una de estos pas por los cuatro tratamientos de alimentacin.

Realizar el ANDEVA como BCA y como Cuadro Latino e Interpretar ambas


pruebas de hiptesis. Comentar la diferencias

Realizar prueba de separacin de medias por Tukey, DUNCAN y DSM e


interpretar. Observar diferencias.

Hacer estudios de residuos con pruebas de normalidad por qq plot


Hacer estudio de igualdad de varianzas con los residuos absolutos, prueba

de Levene.
Hacer grficos de barras

Concluir los resultados de manera narrativa


Datos
Tratamiento
0
10
20
30
0
10
20
30

Ovejas
A
B
C
D
B
A
D
C

Luis Mara Dicovskiy Riobo, 2011

Tiempo
1
1
1
1
2
2
2
2

Pgina 31

CMS
424.6
427.2
567
774.7
523.3
519.43
444.27
772.56

0
10
20
30
0
10
20
30

D
C
B
A
C
D
A
B

3
3
3
3
4
4
4
4

559
699.1
702.61
734.6
586.2
432
656.78
574

Usando el programa estadstico INFOSTAT se debe realizar:

El ANDEVA como Cuadro Latino e Interpretar las pruebas de hiptesis.

Pruebas de separacin de medias por Tukey, DUNCAN y DSM e interpretar.


Observar diferencias.

Estudios de residuos con pruebas de normalidad por qq plot


Estudio de igualdad de varianzas con los residuos absolutos, prueba de

Levene.
Grficos de barras con intervalos de confianza.

Concluir los resultados de manera narrativa

3.6 Diseo en Cuadro Greco Latino


El diseo en cuadros Greco Latino, en una extensin del diseo de cuadro latino.
Al modelo de tres factores del cuadro latino, tratamiento, filas y columnas, se
agrega un nuevo factor que se simboliza con letras griegas. Adems de tener
control del error por filas y columnas, tenemos un nuevo factor que son las letras
griegas. Este tercer

permite controlar la heterogeneidad que no pueden

neutralizar las diagonales del cuadro latino. Este diseo es poco usado y se
justifica cuando el

rea experimental o los elementos de perturbacin son

extremadamente heterogneos.
Ejemplo de un diseo Greco Latino con letras latinas diferenciando los factores
columnas y filas y letras griegas como tercer factor que neutraliza las diagonales.

A
B

Luis Mara Dicovskiy Riobo, 2011

C
D

C
D

C
Pgina 32
D
A

A
B

D
E
B
C

3.7 Anlisis de la varianza de dos factores con interaccin


El diseo bifactorial, es un diseo del tipo factorial, pero con dos factores o temas
de estudio, Factor 1 y Factor 2, los cuales pueden tener interaccin entre ellos.
Este modelo supone tres pruebas de hiptesis una para el Factor 1, otra para el
Factor 2 y la tercera para la interaccin F1xF2, en esta prueba la hiptesis nula es
la falta de interaccin. La interaccin responde a la pregunta de si el Factor 1 tiene
diferentes comportamientos ante los diferentes valores del Factor 2, por ejemplo
ante una prueba de evaluacin de variedades de un cultivo en diferentes
ambientes, la interaccin sera que la mejor variedad en un ambiente de alta
fertilidad, ya no se comporta como la mejor variedad al cambiar a un ambiente de
baja fertilidad.
El

ANDEVA permite estudiar simultneamente los efectos de dos fuentes de

variacin. En un ANDEVA de dos factores se clasifica a los tratamientos o grupos


de acuerdo a dos factores para estudiar simultneamente sus efectos. Este
modelo difiere del BCA, en que interesa la interaccin de los dos factores.

El Modelo Estadstico, lineal.


x ij= x i j ij ij
x ij

= Valor del j Factor B ubicada en el i Factor A.

x = Promedio General

= Efecto del Factor A i

Luis Mara Dicovskiy Riobo, 2011

Pgina 33

j
ij
ij

= Efecto del Factor B j


= Efecto de la interaccin del Factor A por el Factor B
= Variacin de las observaciones ubicada en el Facto B j y el Factor A i.

Anlisis de Varianza
Hiptesis de los Factores A y B:
Ho: 1A= 2A=..... = iA ; HA: no todas los iA son iguales para el Factor A
Ho: 1B= 2B=..... = jB ; HA: no todas jB son iguales para el Factor B
Hiptesis de Interaccin
Ho: El Factor A no interacta con el Factor B
HA: El Factor A interacta con el Factor B
Nivel de significacin:
0.05 0.01
Estadstico de Prueba:
F1= S2A /S2error; F2= S2B/S2error; F3= S2AB/S2error
Regla de Decisin:
Si Fcalculado es mayor que la Ftabla se rechaza Ho
ANDEVA de un Diseo Bifactorial con interaccin
Causa de

Suma de Cuadrados Grados de

Variacin

Libertad

Cuadrado

FCalculado

Medio, CM
S2

Total
Tratamientos
Totales
Factor A
Factor B
Factor AxB
Error
Donde:

SCtotal
SCtratamientos

n-1
t-1

SCA
SCB
SCAxB
SCError

a-1
b-1
(a-1)(b-1)
n-t

t = nmero tratamientos totales,

Luis Mara Dicovskiy Riobo, 2011

Pgina 34

S2A
S2B
S2AxB

S2A /Serror
S2B S2error
S2AxB S2error

a = nmero tratamientos del Factor A,

b=nmero de tratamientos del Factor B

SCAxB = SCtratamientos - SCA- SCB

SCError = SCtotal - SCtratamientos

En este modelo la suma cuadrados de los tratamientos totales, SC tratamientos, se


descompone en tres sumas de cuadrados, SC A, SCB y SCAxB. Esta forma de
resolucin de la suma de cuadrados de la interaccin es vlido para calcular los
grados de libertad de la interaccin.
Ejemplo de un Anlisis Bifactorial
Hay un grupo de 26 Estudiantes, 12 varones y 12 mujeres. A ellos se les pregunt
su nota promedio y las horas de estudio semanales, esta ltima variable se
codific: 0 a 3 horas, 4 a 6 horas y ms de 6 horas.
Responder a las preguntas:
Hay diferencias de notas segn sean varn o mujer?
Hay diferencias de notas segn sean horas de estudio realizadas?
Hay interaccin entre sexo y horas de estudio realizadas?
Con una calculadora manual con funcin estadstica realice:
1. Anlisis de variancia bifactorial con interaccin.
2. Un grfico de interacciones
3. Comentar los resultados
Tabla de datos
Para analizar los datos manualmente se debe hacer las sumatorias por
tratamiento.
Sexo

Hora

Repeticiones

Varn
Varn
Varn
Mujer

s
0-3
4-6
+6
0-3

70
78
86
64

74
75
82
70

Luis Mara Dicovskiy Riobo, 2011

X
73
80
88
69

69
76
85
76
Pgina 35

286
309
341
279

X
71.50
77.25
85.25
69.75

Mujer
Mujer

4-6
+6

80
80

81
90

73
84

79
82

313
336
1,864

78.25
84.00
77.67

Suma de Cuadrados
1864
SC total=70 +74 + +82
24
2

SC tratamientos =

2862 +3092+ 3412+ +3362 18642

4
24

SC Sexo =

936 +928 1864

12
24

SC Horas estudio=

5652+ 6222+677 2 1864 2

8
24

SC SexoHoras estudio=SCTratamientos SC SexoSC Horas estudio

SC SexoHoras estudio=SCTratamientos SC SexoSC Horas estudio

Resultados. Con el programa estadstico INFOSTAT se obtuvieron los siguientes


valores del ANDEVA.
ANDEVA de Interacciones. Variable Dependiente: Nota Promedio
Cuadro de Anlisis de la Varianza
C.V.
SC
gl
Modelo
795.33
5
Sexo
2.67
1
Horas Estudio
784.08
2
Sexo*Horas Estudio 8.58
2
Error
218.00
18
Total
1013.33
23

Luis Mara Dicovskiy Riobo, 2011

CM
159.07
2.67
392.04
4.29
12.11

Pgina 36

F
13.13
0.22
32.37
0.35

p-valor
<0.0001
0.6445
<0.0001
0.7064

Estos resultados dicen que no hay diferencias de notas segn sean los
estudiantes varones o mujeres (significacin de 0.64 mayor al 0.05), pero por otro
lado si se observa diferencias estadsticas entre las horas de estudio (significacin
de 0.0001 menor al 0.05), con esta ltima variable y este resultado se debe hacer
una separacin de promedios entre las tres categoras de horas de estudio.

Grfico de Interacciones
Este grfico nos permite observar si hay interaccin con los dos factores, sexo y
horas de estudio. Esta interaccin ocurre si las rayas generadas por las variables
se cruzan, lo que sera una confirmacin de la existencia de interaccin entre sexo
y horas de estudio. Como esto no se observa en el grfico que se muestra a
continuacin, se puede concluir que coinciden los resultados del ANDEVA y del
grfico.

Luis Mara Dicovskiy Riobo, 2011

Pgina 37

Grfico de Interacciones entre las Variables Sexo y Horas de estudio

N
o
ta
s

8
5
8
0
7
5
7
00
-3
h
o
ra
sE
4
6
h
o
re
a
sm
s
tu
d
i-o
S
a
n
l+6horas

Luis Mara Dicovskiy Riobo, 2011

Pgina 38

Das könnte Ihnen auch gefallen