Sie sind auf Seite 1von 29

Departamento de Estadstica e Informtica Curso: Mtodos Estadsticos para la Investigacin I Captulo VII

Anlisis de Covariancia

Anlisis de Covariancia

Si usted tortura los datos lo suficiente, ellos confesarn. Ronald Coase

1. Introduccin En el anlisis de covariancia se combinan los conceptos del anlisis de variancia para un diseo experimental y para regresin. El anlisis de covariancia es utilizado en casos en los que la variable respuesta de un diseo experimental est relacionada con una o ms variables concomitantes. En este captulo se tratar el caso de la covariancia lineal con una sola variable concomitante y se presentar el anlisis para el Diseo de Bloques Completos al Azar. El estudiante sin embargo, no tendr ningn problema en llevar esta tcnica a un Diseo Completamente al Azar.

2. Modelo Aditivo Lineal El modelo aditivo lineal para un anlisis de covariancia en un Diseo de Bloques Completos al Azar es el siguiente: Y^ + r^+Z?( Xij-X..) + % donde: Yij es el valor o rendimiento observado en el i-simo tratamiento, j-simo bloque. ju es el efecto de la media general. Ti es el efecto del i-simo tratamiento. Yj es el efecto del j-simo bloque. y? es el coeficiente de regresin lineal de Y sobre X. Xij es el valor de la variable independiente en el i-simo tratamiento, j-simo bloque. X es la media de la variable independiente. sij es el efecto del error experimental en el i-simo tratamiento, j-simo bloque. t es el nmero de tratamientos. b es el nmero de bloques. i = 1,..., t j = 1,..,b

Ing. Ral Eyzaguirre Prez

reyzagui

rre@lamolina.edu.pe

100

Departamento de Estadstica e Informtica Curso: Mtodos Estadsticos para la Investigacin I Covariancia

Anlisis de

Ejemplo 1: Se desarroll un experimento cuyo objetivo era determinar si la exposicin en agua calentada artificialmente afectaba el crecimiento de las ostras. Cinco bolsas con diez ostras cada una fueron aleatoriamente asignadas a cinco temperaturas (T1, T2, T3, T4, T5); cada bolsa constitua una unidad experimental. Se utilizaron cinco estanques, cada uno calentado a una de las cinco temperaturas. Las ostras fueron limpiadas y pesadas al comienzo y al final del experimento un mes despus. El experimento se repiti cuatro veces para lo cual fueron necesarios 4 meses. Cada repeticin constituye un bloque. Los pesos iniciales y finales se presentan en la siguiente tabla: Blo T1 T2 T3 q. XY XY XY I 20.4 24.6 27.2 32.6 26.8 31.7 II 19.6 23.4 32.0 36.6 26.5 III 25.1 30.3 33.0 37.7 IV 18.1 21.8 26.8 31.0 30.7 26.8 30.4 Tot 83.2 100.1 119.0 108.7 al 137.9 126.6 El modelo aditivo lineal es el siguiente: Yij=// + ri+rj+/?(Xij-X..) + % donde: Yij es el peso final de una bolsa de ostras tratada con la i-sima temperatura de agua (tratamiento) en el j-simo mes (bloque). ju es el efecto de la media general de los pesos. Ti es el efecto de la i-sima temperatura del agua. y es el efecto del j-simo mes. p es el coeficiente de regresin lineal de Y, el peso final de las ostras, sobre X, el peso inicial. Xij es el peso inicial de una bolsa de ostras tratada con la i-sima temperatura de agua (tratamiento) en el j-simo mes (bloque). X es el peso medio inicial de las bolsas de ostras. s es el efecto del error experimental con la i-sima temperatura de agua, en el j-simo mes. t = 5 (Nmero de tratamientos). b = 4 (Nmero de bloques). T4 XY 22.4 29.1 23.2 28.9 28.6 35.2 24.4 30.2 98.6 123.4 T5 XY 21.8 27.0 24.3 30.5 30.3 36.4 29.3 35.0 105.7 128.9 Total X Y 118. 145. 6 0 125. 150. 6 1 143. 515. 170. 616. 2 9

i = 1,..., t

j = 1,..,b

3. Suposiciones del Modelo Estadstico Adems de los supuestos de un Diseo de Bloques Completos al Azar, se deben cumplir los siguientes: 1. Los valores de X son fijos, medidos sin error, y no son afectados por los tratamientos. Ing. Ral Eyzaguirre Prez reyzaguirre@lamolina.e du.pe

101

Departamento de Estadstica e Informtica Curso: Mtodos Estadsticos para la Investigacin I

Anlisis de Covariancia 2. Las variables X y Y deben tener variancias homogneas entre los tratamientos. 3. La regresin de Y sobre X debe ser lineal.

4. Anlisis de Covariancia La met odol oga para efec tuar el An lisis de Cov aria ncia se resu me a cont inua cin :

Cuadro ANCOVA Fuentes de Bloques Trat. Error Trat. + Error - 1T E -SCE t SC -1 S u m a s


+ +

a d SCX 5;^ 7>x Exx Sxx SPx r 5x7 Txy EXY SXY SCY BYY TYY EYY SYY SC aj. y c u a d r a d o s x* m e d i o s p a r a e v a l u a r d i f e r e n c i a s e n t r e m e

Gl 6- 1 t-1 (1)(6 1) 6(- 1)

SC = EYY -^xx o2 SCr+ = Srr ^XX

d e c u a d r a d o s , g r a d o s d e l i b e r t

d i a s a j u s t a d a s d e t r a t a m i e n t o s Los pasos para la construccin del cuadro ANCOVA son los siguientes: 5. Calcule los grados de libertad (Columna gl). 6. Calcule las sumas de cuadrados total en X y Y y la suma de productos total: xy SC(X) = SS^2-^= 1 ;= 1 t b donde: t b = 1 j = 1 b X Y

X =

T Y

TCX = t

T C

t b 3. Calcule las sumas de cuadrados en X y Y y la suma de productos para cada una de las fuentes de variacin (Columnas SCX, SPXY, SCY): Para Bloques: B TC, XX j=1 X 2 t H^ I n b X Y nxr Z_i
1

b ^V x r YY # 1

Departamento de Estadstica e Informtica Curso: Mtodos Estadsticos para la Investigacin I

Anlisis de Covariancia Para Tratamientos: ' X2 ' XY 'Y2 1xx ~ Z-i x XY ~ Z-i XY
1

YY ~ Z-i

y i=\ i=\ " i=\ Para el Error (Por diferencia): Exx = SC(X) B^ -T^ EXY= SP(XF) -Bxy-Txy EYY = SC(7) BYY - TYY 4. Calcule las sumas de cuadrados y productos para Tratamientos + Error: ^XX ~ *-XX ~"~ ^XX ^XY ~ *-XY " "

~"~ -^XY *YY ~"~ ^YY 5. Calcule las sumas de cuadrados ajustadas (Columna SC aj.): F2

^YY ~

i j y 616 92

(5)(4) = (24.6 2 +23.4 2 +... + 35.0 2 )-------------------------------------= 358.67 r, YY I n

V2 ^YY T+E -^XX ^XX

6. Calcule la suma de cuadrados ajustada para evaluar diferencias entre las medias ajustadas de los tratamientos: SCr+ - sc 7. Calcule los grados de libertad ajustados (Columna gl aj.). 8. Calcule los cuadrados medios ajustados (Columna CM aj.). Ejemplo 1 (Cont): A continuacin se presentan los clculos para la construccin del cuadro ANCOVA para el ejemplo tratado en esta seccin: tb sc(x) = XSX-rc, tb (5) (4) SP(XF) = ^ Z Va ~ TC*y =i j=\ = (20.4 2 +19.6 2 +... + 29.3 2 )- 515'2 =309.79 ((20.4)(24.6) + (19.6)(23.4) + ... + (29.3)(35.0))(515'2^616^ = 325.67 tb

Departamento de Estadstica e Informtica Curso: Mtodos Estadsticos para la Investigacin I

Anlisis de Covariancia b Y2 BXX =YJ~~TCX

2 (118.6 +125. 6 2+...2+ 127.22) 515.2 _ ---------------------------------- 68.37 5

( 5 X 4 ) fe II XT ^=Z^^-rC^ ((118.6) (145.0) + (125.6) (150.!) + ... + (127.2) (151.8)) (515.2) (616.9) 5 (5X4) b y2 BYY =^-^-7U7 22 2 2

( 1 4 5 . 0 2 + 1 5 0 . r + . . . + 1 5 1 . 8 2

) 6 1 6 . 9 2 = 7 1 . 3 7

= 358.6771.37-198.41 = 88.89 Con estos resultados, el cuadro ANCOVA 5 (5)(4) es el siguiente:

y2 =i * _(83.2 2 +119.0 +... + 105.7) " 4 7 X (5X4) =1 " 22 2 515.2 I n

2 = 176.79
1

1XY ~ _ 7 ^X T =1 * ((83.2)(100.1) + (119.0) (137.9) + ...(105.7) (128.9)) (515.2)(616.9) _ 1Q1 _ -------------------------------------------------------------------------------181.61 4 T/2 r =Y-TC

22 (100.12 +137.92 +... + 128.92)

6 i=\

(5X4) 2 616.92 1 = 198.41

YY

_ Y 4 (5X4)

^xx = ^^(^)~"xx ~*xx = 309.79-68.37-176.79 = 64.63 Exr=SnXY)-Bxr-Txr = 325.67-69.56-181.61 = 74.50

Departamento de Estadstica e Informtica Curso: Mtodos Estadsticos para la Investigacin I

Anlisis de Covariancia

Fuentes de Bloques Tratamientos Error Trat. + Error

gl 3 4 12 16

SCX 68.37 176.79 64.63 241.42

Cantidades para evaluar diferencias medias ajustadas de tratamientos 4.1. Prueba de Hiptesis para el Coeficiente de Regresin El primer paso en un anlisis de covariancia es evaluar la significancia del coeficiente de regresin. Si el coeficiente de regresin resulta significativo, entonces se justifica el uso de la variable concomitante X en el modelo y por lo tanto, los efectos de los tratamientos debern evaluarse con los datos corregidos por la regresin. De no resultar significativo este coeficiente, los efectos de los tratamientos seran evaluados a

partir de un Anlisis de Variancia sin considerar el efecto de la variable concomitante X. El procedimiento de prueba de hiptesis para el coeficiente de regresin es el siguiente: Hiptesis: H
0

= 0 H
1

: 0 Estas hiptesis con equivalentes a: H0: El peso final de las ostras no depende linealmente del peso inicial. I n

: = 0 H
1

: 0 Estadstico de Prueba: F Fc XY E 2 XX E CMEaj. (1,gl(Error aj.))

Regla de Decisin: La hiptesis nula se rechaza con un nivel de significacin si el Fc resulta mayor que el valor de tabla F(1-, 1, gl(Error aj.)) . Ejemplo 1 (Cont.): H
0

Departamento de Estadstica e Informtica Curso: Mtodos Estadsticos para la Investigacin I

Anlisis de Covariancia H1: El peso final de las ostras s depende linealmente del peso inicial. E2 X Y 74.502 Fc =-----E^ = 6463 = 31305 F CMEaj. 0.2743 (1, 11) El valor de tabla para un nivel de significacin del 5% es F(0951 11)= 4.84. Como el valor calculado es mayor que el valor de tabla se rechaza H0 y se concluye que existe suficiente evidencia estadstica para aceptar que el peso final de las ostras depende linealmente del peso inicial. 4.2. Prueba de Hiptesis para los efectos de los tratamientos En el caso que la regresin resulte significativa, las hiptesis para los tratamientos se

plantearn en trminos de los efectos (medias) de los tratamientos ajustados por la regresin. Hiptesis: H0: JUi aj. = Uaj. V i H1: //i aj. * //aj. para al menos algn i Estadstico de Prueba: Fc = CM(Trat aj.)^ CME aj. Regla de Decisin: La hiptesis nula se rechaza con un nivel de significacin a si el Fc resulta mayor que el valor de tabla F 1 .. [-a, gl(trat. aj.), gl(Error aj.)J Ejemplo 1 (Cont.): H
0

3 , 4 , 5

gl(trat. aj.),gl(Error aj.))

H 1 : / /
i

j . ^ j U a j . p a r a a l m e n o s a

: A a j . = / / a j . i = 1 , 2 ,

l g n i o literalmente: H0: Las cinco temperaturas son igualmente efectivas en el crecimiento de las ostras. H1: Con al menos una de las temperaturas se obtienen resultados diferentes en el crecimiento de ostras. Fc = CM(Trat aj.) = 3.1493 = 1 1 4 8 ^ CME aj. 0.2743 (4,11) El valor de tabla para un nivel de significacin del 5% es F(095,4,11)= 3.36. Como el valor calculado es mayor que el valor de tabla se rechaza H0 y se concluye que existe suficiente I n 1

Departamento de Estadstica e Informtica Curso: Mtodos Estadsticos para la Investigacin I

Anlisis de Covariancia evidencia estadstica para aceptar que con al menos una temperatura se obtiene un peso final diferente para las ostras.

5. Pruebas de Comparacin de Medias de Tratamientos Para aplicar las pruebas de comparacin de medias de tratamientos se debe trabajar con las medias de los tratamientos ajustadas por la regresin. Para efectuar el ajuste, se debe calcular primero el coeficiente de regresin estimado, el cual es dado por: E XY

Las medias de los

tratamientos

ajustadas por la

I n regresin estn dadas por: Las desviaciones

estndar para las pruebas son: 1. Prueb aty DLS C M E aj 1 (Xi^E* X^)2 l-----hri rj 1

2 d

1 EX 1 CM X (X^2 X^) E l----haj. ij

3 . D u n

CME aj E1+1+ ( XT.Xi.)2 'XX

Estas frmulas se aplican si el diseo es un DCA con ri y rj repeticiones para el par de tratamientos que se estn comparando (rT es el nmero de repeticiones para el tratamiento testigo). En el caso de un DBCA, que es el diseo que se est tratando en esta seccin, el nmero de repeticiones para cada tratamiento es igual a b, por lo que en las frmulas anteriores ri = rj = rT = b y 1ri + 1rj =2/ b. 74.5 Ejemplo 1 (Cont.): Efecte la pruebe de Tukey. 0 Las hiptesis son las siguientes: H0: Aaj. = Mj aj. V i j = 1, 2, ... 5, con i *j H1: //i aj. ^^yaj. El coeficiente de regresin estimado es: E E XY P 1.15 27

Departamento de Estadstica e Informtica Curso: Mtodos Estadsticos para la Investigacin I Covariancia Las medias de las variables X y Y sin ajustar para cada tratamiento son: X1% = 20.8 Y1 =25.025 X2. = 29.75 Y2. =34.475 X3. = 27.175 Y 3. =31.65 X4. = 24.65 Y4. =30.85

Anlisis de

X5. = 26.425 Y 5. =32.225

X = 25.76

Las medias de Y ajustadas para cada tratamiento segn la frmula Yi. aj = Yi. - (Xi. - X) son: Y1 aj =30.74 Y2.aj =29.88 Y3.aj =30.02 Y4.aj =32.13 Y5.aj =31.46

El valor de tabla con a = 5%, p = 5 tratamientos y 11 grados de libertad para el error ajustado es AES(T) = 4.57. La amplitud lmite significativa de Tukey est dada por la siguiente frmula: CME aj. ALS(T) = AES(T) 2 donde b = 4, CME aj. = 0.2743 y EXX = 64.63. A continuacin se presentan los resultados para las 10 comparaciones: Tratamientos comparados 1y2 1y3 1y4 1y5 2y3 2y4 2y5 3y4 3y5 4y5 T2 29.88 \Y -Y 1 i* aj 0.867 0.724 1.387 0.716 0.143 2.254 1.583 2.111 1.440 0.671 sd j 0.488 0.393 0.316 0.368 0.287 0.352 0.303 0.287 0.264 0.274 T1 30.74 2.232 1.798 1.445 1.684 1.314 1.608 1.386 1.310 1.207 1.254 T5 31.46 n.s. n.s. n.s. n.s. n.s. * * * * n.s. T4 32.13 ALS(T) Significancia 2i(X,-Xj.)2~ H--------------bEXX

T3 30.02

Ing. Ral Eyzaguirre

Prez

reyzaguirre@lamolina.e du.pe

108

Departamento de Estadstica e Informtica Curso: Mtodos Estadsticos para la Investigacin I

Anlisis de Covariancia Anexo: Salida de Minitab General Linear Model F a c t o r T y p e L e v e l s V a l u e s B l o q f i x e d 4 1 2 3 4 T r a t f i x e d 5 1

2 3 4 5 Analysis of Variance for Y, using Adjusted SS for Tests Sourc X Bloq Trat Error Total Term Const X O 1 D 1 3 4 1 1 9 Seq SS 342.35 0.697 12.597 3.017 358.67 0 Coef StDev 1.151 6 1.15273 Fit 29.68 A 8 1 1 3 8 2 5 0 Adj 85.87 0.402 3.149 0.274 F 3 . 1 . 1 .

Lev Differen Tra of Means 3 0.1433 4 2.2539 5 1.5828 Tra 3 t subtracte d from:

SE of Differe 0.4066 0.4976 0.4291

T P 0 6 0.508 1 6 0.000 Residu 0.811 St 2.06R

Unusual Observations for Y Y 30.500 StDev 0.3451

R denotes an observation with a large standardized residual. Tukey Simultaneous Tests Response Variable Y All Pairwise Comparisons among Levels of Trat Trat = 1 subtracted from: Lev Differen SE of Tra of Means Differe T2 -0.8669 0.6908 3 -0.7237 0.5565 4 1.3870 0.4473 3.101 5 0.7159 0.5210 1.374 Trat 2 subtracted from: Adjus P0.721 0.696 0.062 0.654

Lev Differen SE of Tra of Means Differe T4 2.111 0.4052 5.208 5 1.440 0.3736 3.854 Trat 4 subtracted from:

Adjus P0.002 0.018

Lev Tra 5 I n

Differen of Means -0.6711

SE of Differe 0.3880

Departamento de Estadstica e Informtica Curso: Mtodos Estadsticos para la Investigacin I

Anlisis de Covariancia Ejercicios 1. En una estacin experiment al se realiz un experiment o en el que se evalu el efecto del tiempo de cosecha sobre el rendimiento de grano de maz. Se dise un experiment o con cuatro tratamiento s usando una distribucin de bloques completos al azar. Los tratamiento s fueron 30, 35, 40 y 45 das despus de ocurrida la polinizaci n (para el tiempo de cosecha). El nmero de plantas por parcela til fue de 52. La variedad usada fue V1 y el cultivo se efectu con riego. Los valores se presentan

en al siguiente tabla: Rendimiento de grano seco (Kg / parcela til) y N de plantas de maz cosechada sa diferentes fechas de la polinizaci n. X: N de plantas Y: Producci n de grano seco (Kg / parcela) Das de tratamiento 30 35 40 45 X 41 40 37 32 Bloques I Y 4.08 4.26 4.72 4.00 X 24 36 32 38 II Y 2.78 4.23 4.92 4.53 X 31 44 38 40 Y X

5X Y

12. Presente el Modelo Aditivo Lineal y defina cada uno de sus componentes en trminos del problema. 13. Presente el cuadro de ANCOVA y realice las pruebas correspondientes. 14. Encuentre las medias de los tratamientos ajustados. I n

20 4.7 3

15 4.0 0

9. Presente el Modelo Aditivo Lineal y defina cada uno de sus componentes en trminos del problema. 10. Presente el cuadro ANCOVA y realice las pruebas correspondientes. 11. Realice la prueba de Tukey. 2. La siguiente informacin corresponde a pesos iniciales (X) y ganancias de peso (Y) en Kg de lechones en un ensayo comparativo de 6 raciones en 5 corrales (bloques). Corral 1X Y 2X Y 3X Y 4X Y 1 17 4.32 16 3.72 19 4.23 22 4.79 2 22 4.5 1 15 4.3 16 4.23 21 4.9 Raciones 3 4 18 22 3.8 4.54 6 17 15 4.5 4.19 21 19 3.8 4.24 21 18 4.02 4.39

Departamento de Estadstica e Informtica Curso: Mtodos Estadsticos para la Investigacin I

Anlisis de Covariancia d) Efecte la prueba de Dunnett. Considere que la racin 1 es el testigo. 3. Se tiene un experiment o con 3 variedades de trigo y se desea averiguar en que variedad se tiene mayor peso de races (Y) en gramos de materia seca. Se cree que el nmero de plantas (X) influye sobre el tamao de las races por lo cual se utilizar el Anlisis de Covariancia en este experiment o, el mismo que se lleva a cabo utilizando cinco macetas en invernadero . El diseo estadstico utilizado es el DCA. N de Maceta X I

1 2 3 4 5

6 4 6 4 4

0.54 0.56 0.55 0.60 0.59

8 5 4 5 7

0.11 0.20 0.23 0.21 0.09

15. Plantee el modelo estadstico adecuado y explique cada uno de sus componentes en trminos del enunciado. 16. Presente el cuadro de ANCOVA y realice las pruebas correspondientes. 17. Utilice la prueba t para evaluar si con la variedad I se obtienen pesos superiores en ms de 0.5 gr que con la variedad II.

Ing. Ral Eyzaguirre Prez reyzaguirre@lamolina.e du.pe

111

Das könnte Ihnen auch gefallen