Sie sind auf Seite 1von 52

1.2.3.- D ATOS DE UN A, DOS Y TRES V AS.

1.2.3.1- DISEO COMPLETAMENTE AL AZ AR,


1.2.1.- C AR ACTERSTIC AS
VARI ANZ A.

PROPSITOS

DEL

AN LISIS

DE

La estadstica ha desarrollado la tcnica de Fisher conocida como anlisis de


varianza (ANAVA), para la prueba de hiptesis de varias poblaciones con datos de
muestras. Esta tcnica es una herramienta muy til en el proceso de investigacin
en el cual se aplican la observacin y la experimentacin.
La tcnica del ANAVA consiste en separar de la variacin total observada las causas
o factores parciales siguiendo los siguientes pasos:
a) Clasificar o separar las causas parciales de variacin
b) Calcular los grados de libertad para cada factor o causa de variacin
c) Calcular la suma de cuadrados de las desviaciones de las observaciones con
respecto a la media, para cada una de las causas de variacin
d) Probar la hiptesis por medio de la prueba de Fisher, conocida como prueba de
F o relacin de varianza.
e) Comparar los promedios (discriminar variables) por varios mtodos, cuando los
tratamientos son numerosos.
f) Calcular la varianza o cuadrado medio para cada factor de variacin.
El tipo ms sencillo de un arreglo es aquel en que los tratamientos estn asignados
completamente al azar a las unidades experimentales.
Esta distribucin se usa cuando se usan dos o ms tratamientos bajo las siguientes
condiciones:
Lugar y unidad experimental muy uniforme (homognea).
Cuando sea probable que una parte del experimento se pierda.
Cuando se tiene un experimento pequeo y donde la mayor precisin de
otras distribuciones no compensa la perdida de grados de libertad del error.
Este diseo tiene varias ventajas:
1.- Permite flexibilidad completa. Puede usarse cualquier nmero de repeticiones y
de tratamientos.
2.- El anlisis estadstico es fcil, aun si el nmero de repeticiones no es el mismo
por tratamientos.
Aun cuando los datos de algunas unidades o algunos tratamientos completos se
hayan perdido.

El Anava requiere el cumplimiento los siguientes supuestos:

Las poblaciones (distribuciones de probabilidad de la variable dependiente


correspondiente a cada factor) son normales.
Las K muestras sobre las que se aplican los tratamientos son independientes.
Las poblaciones tienen todas igual varianza (homoscedasticidad).

TIPOS DE MODELOS ESTADISTICOS


De acuerdo a la seleccin de los tratamientos y otros factores se tiene la siguiente
clasificacin:
Modelo I (Efectos Fijos):
Se presenta cuando los tratamientos y dems factores que intervienen en un
experimento son fijados por el investigador; es decir, no se efecta una eleccin
aleatoria. En estos casos las conclusiones del anlisis de variancia solamente son
vlidas para los tratamientos y otros factores usados en el experimento.
Modelo II (Efectos aleatorios):
Se presenta cuando los tratamientos y dems factores que intervienen en un
experimento son elegidos al azar de una poblacin. En estos casos las conclusiones
del anlisis de variancia son vlidos, tanto para los tratamientos y dems factores
usados, as como para todas las poblaciones de tratamientos y factores.
Modelo III (Modelo Mixto):
Este modelo es la combinacin de los dos anteriores y se presenta cuando algunos
factores son fijados y otros son elegidos al azar. En estos casos las conclusiones del
anlisis de variancia sern vlidas para toda la poblacin de factores cuando estos
son elegidos al azar, y solamente para los factores usados cuando estos son fijados.
Las Hiptesis a Probar sern:
Ho: 1=2=3....a
Ha: 1

3....a

Otra forma equivalente de plantear las hiptesis en trminos de los efectos de los
tratamientos, si las medias de los tratamientos son iguales, esto implica que no
existe ningn efecto o desviacin causada por el tratamiento en si, las hiptesis son:
Ho: t1= t2=t3......ta
Ha: t1

t2

t3......ta

Regla de Decisin:
Si Fc es que la F Hay diferencia significativa entre los tratamientos
Si Fc es que la F No hay diferencia significativa entre los tratamientos
Modelo I (Efectos Fijos):
Cuando los tratamientos son seleccionados por el experimentador y las
conclusiones del anlisis slo se aplican a dichos tratamientos.
Cuadro 1.- Mostrando la estructura de datos para el anlisis de varianza
Tratamientos

Observaciones
3
4

TRATS Media

Xi.
X i.

X14

X1n

X1.

X23

X24

X2n

X2.

X32

XIJ X33

X34

X3n

X3.

Xa2

.
Xa3

.
Xa4

.
Xan

.
Xa.

X11

X12

X13

X21

X22

X31

.
Xa1

X 1.

X 2.

X 3.

X a..

X..
X..=X1.+X2.+X3.+....+Xa.
Donde las observaciones Xij se pueden representar con el modelo:
Xij = + i + ij
Cuando i = 1,2,....., a

j = 1,2,.......,n

Donde:
Xij: Variable de respuesta
: Es la media general alrededor de la cual oscilan los valores de todas las
observaciones.
i: Efecto del i-esimo tratamiento o nivel de un factor
ij: error experimental, variacin debido al azar o variacin de muestreo NI (0, 2)

Distribucin completamente al azar con el mismo nmero de repeticiones por


tratamiento.
Donde :

F .C.

1.

Tratamientos = a
Repeticiones = n
X 2 ..
an

S .C.Total X ij F .C. ( X 112 X 122 ... X an2 )


2

2.

S .C.Tratamientos

3.

X
n

2
i

F .C.

-FC

X 12. X 2 2. .... Xn 2 .
n

S .C Error S .C total S .C .Tratamientos

4.
Cuadro 2.- Modelo de
completamente al azar

anlisis

de

varianza

Fuentes de G.L.
variacin
Tratamient a 1
o

S.C.

Error

a(n-1)

S .C Error S .Ctotal S .C.Trat ' s

Total

an 1

S .C.Total X ij F .C.

xi.

S .C.Trat ' s

F .C.

para

una

CM = 2

Fc

SCtrat' s
gl

CMtrat' s
CMError

distribucin
F

Distribucin Completamente al Azar con Diferente Nmero de Repeticiones


por Tratamiento
Donde :

Tratamientos = a
Repeticiones = n

Cuadro 3.- Mostrando la estructura de datos para el anlisis de varianza


Tratamientos

Observaciones
3
4

X11

X12

X13

X14

X21

X22

X23

X24

TRATS Media

Xi.
X i.
X1.

X25

X2.

X 1.

X 2.
4

X31

X32

X33

XIJ

X3.

X41

X42

X43

X44

X51

X52

X53

X45

X 3.

.
X5.

X a..

X..
X..=X1.+X2.+X3.+....+Xa.
F .C.

1.-

X 2 ..
ni

S .C.Total X ij F .C.
2

2.-

S .C.Trat 's

2
X 21. X 2. 2
X a.

n n ... n
1
2
n

F .C.

3.-

S .C Error S .Ctotal S .C .Tratamientos


4.Cuadro 4.- Modelo de anlisis de varianza para una distribucin
completamente al azar con diferente nmero de repeticiones por tratamiento.
Fuentes de G.L.
variacin
Tratamient a 1
o
Error
Total

S.C.

CM
2

xi.

S .C.Trat ' s

1) ( a 1)

F .C.

= Fc

SCtrat' s
gl

CMtrat' s
CMError

S .C Error S .Ctotal S .C.Trat ' s

S .C.Total X ij F .C.
2

Estimacin de parmetros:
El efecto de cada tratamiento se traduce en una desviacin de la media
poblacional. Existe un valor i que representa la media para un tratamiento que
5

debe ser el valor de la media poblacional ms la desviacin causada por el


tratamiento, esto es: i=+i. Se puede tener una estimacin del valor i por el
intervalo siguiente:

CME
CME
( x i. t / 2 , glError
i y i t / 2, glError
)
n
n
_

O
_

( x i. t / 2 , glError

CME
)
n

De igual forma se puede tener una estimacin para la diferencia de medias de dos
tratamientos: i-j

( x i. x j . t / 2 , glError

2CME
CME
i j y i t / 2, glError 2
)
n
n

o
_

( x i. x j . t / 2 , GlError

2CME
)
n

Donde:

x i.

= La media de las n observaciones del tratamiento i

x j.

= La media de las n observaciones del tratamiento j


t/2, gLError = Valor del estadstico t para una significancia /2 y glError
Estadsticos que verifican calidad de los datos, R2 y CV.
Al interpretar un ANDEVA es importante medir que tan bueno fue el modelo
estadstico aplicado y si el error experimental fue controlados por el diseo
experimental. Para este tipo de anlisis disponemos de dos coeficientes fciles de
calcular el coeficiente de determinacin, R2 , y el coeficiente de variacin
aplicado al error CV.
El coeficiente de Determinacin, R2 :
Este coeficiente muestra que proporcin de la variacin total de los datos est
siendo explicada por el modelo adoptado, R2 es un valor entre 0 y 1; a ms cerca
6

de 1 mejor funciona el modelo. El R2 se construye con la suma de cuadrados de la


tabla ANDEVA de la siguiente manera: 2 = / .
En el caso de un DCA la suma de cuadrados del modelo, SCModelo, es la suma de
cuadrados de los tratamientos. En el caso de un BCA (bloques completos al azar), la
SCModelo es igual a la SCTratamientos + SCBloques. En una caso de un cuadro
latino, CL, la SCModelo es igual a la SCTratamientos + SCFilas + SCcolumnas.
Coeficiente de variacin
El Coeficiente de Variacin, CV, se puede aplicar para medir la variacin interna de
los tratamientos, variacin que se refleja en la variancia del error o cuadrado medio
del error. Un experimento mal manejado puede presentar mucha variacin entre las
repeticiones de un mismo tratamiento, esto es error experimental.
El CV tambin est en dependencia de la variable que se mide o pesa. Si la variable
est bien controlada el CV deber ser menor a 20 %, incluso en laboratorio se
pueden exigir CV menores al 10 %. Sin embargo en investigacin social descriptiva
o en variables biolgicas no controladas como es una plaga, es comn que los CV
sean grandes.
En experimentacin no controlada (condiciones de campo) se considera que un
coeficiente de variabilidad mayor de 35% es elevado por lo que se debe tener
especial cuidado en la interpretacin y o conclusiones.
a).- CV = 20% muy variable
b).- CV = 10% variable
c).- CV = 5% Relativamente variable
Coeficiente
de Interpretacin del coeficiente
Variacin %
Variabilidad
Estabilidad
Igual a 0
Nula
Muy alta
Mayor de 0 - 20
Baja
Alta
Mayor de 20 60
Moderada
Moderada
Mayor de 60 90
Alta
Baja
Mayor de 90
Muy alta
Nula
El investigador debe explicar la causa de esta variacin. La forma de clculo es:

CV

CME

x100

X
ANALISIS DEL MODELO DE EFECTOS FIJOS

En esta seccin se desarrolla el anlisis de un solo factor para el modelo de efectos


fijos. Recuerde que xi representa el total de las observaciones bajo el tratamiento i

xi

esimo. Sea que la media


represente el promedio de las observaciones bajo el
tratamiento i-esimo. De manera similar, sea que X.. representa el gran total de todas

las observaciones y que la media


observaciones.

X ..

representa el gran promedio de todas las

Ejemplo
1.- Un ingeniero est interesado en maximizar la resistencia a la tensin de una
nueva fibra sinttica empleada en la manufactura de telas. Se sabe que la
resistencia a la tensin es influida por el porcentaje de algodn presente en la fibra.
As que decide elaborar fibras con el 15% de algodn, despus con un 20%, luego
25%, 30% y 35% y decide tambin tomar 5 muestras de cada porcentaje, donde
cada muestra se obtiene con una corrida experimental. Supngase que se corren
las 25 pruebas obtenindose los siguientes resultados:

Tabla 7.- Mostrando las corridas experimentales enumeradas del 1 al 25


%
de
Algodn
15
20
25
30
35

Numero de corrida experimental


1
6
11
16
21

2
7
12
17
22

3
8
13
18
23

4
9
14
19
24

5
10
15
20
25

Tabla 8.- Eligiendo nmeros aleatorios entre 1 a 25 para realizar cada prueba,
supngase que se obtienen las siguientes secuencias aleatorias.
Sec
uen
cia

Co
rri
da
s

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25

8
18
10
25
17
5
14
6
15
20
9
4
12
7
1
24
21
11
2
13
22
16
25
19
3

%
al
go
do
n
20
30
20
35
30
15
25
20
25
30
20
15
25
20
15
35
35
25
15
25
35
30
35
30
15

Esta secuencia de prueba aleatorizada es necesaria para evitar que los efectos de
variables perturbadoras desconocidas, las cuales quizas varien fuera de control
durante el experimento, contaminen los resultados.

10

Para ilustrar esto, suponga que las 25 corridas de prueba tuvieran que realizarse en
el orden original no aleatorizado (es decir, primero se prueban los cinco ejemplares
con 15% de algodn, despues se prueban los cinco ejemplares con 20% de
algodn, etc). Si la maquina empleada para probar la resistencia a la tension
presenta un efecto de calentamiento tal que entre mas tiempo este funcionando
sean menores las lecturas de la resistencia la tension observada, el efecto del
calentamiento contaminara potencialmente los datos de la resistencia a la tension y
destruira la validez del experimento
Tabla 9.- Supngase que se corren las 25 pruebas en el orden anterior y que se
obtienen los siguientes datos de resistencia a la tensin, para cada nivel de % de
algodn.
Observaciones
% de
Algodn
15
20
25
30
35

7
12
14
19
7

7
17
18
25
10

15
12
18
22
11

11
18
19
19
15

9
18
19
23
11

Se usara el anlisis de varianza para probar Ho: u 1=2= 3= 4= 5 contra la


hiptesis alternativa Ha: (Ho: u12 3 4 5) o al menos una media de ellas es
diferente.
La suma de cuadrados requeridos se calcula como sigue:
Donde:

F .C.

1.

Tratamientos = a
Repeticiones = n
X 2 ..
an

S .C.Total X ij2 F .C. ( X 112 X 122 ... X an2 )


2.

i 1

-FC
a

S .C.Tratamientos
3.

X
i 1

2
i.

F .C.

( X 12. X 22. ... X n2. )


FC
n

11

S .C Error S .Ctotal S .C.tratamientos


4.
Cuadro 5.- Anlisis de varianza de los datos de la resistencia a la tensin
Ejemplo: para el caso de la fibra sinttica, si se quisiera determinar un intervalo para
la media del tratamiento de un 20% de algodn, 2 con un nivel de confianza del
95%.
_

( x i. t / 2 , glError

CME
)
n

De igual forma se puede tener una estimacin para la diferencia de medias de dos
tratamientos: i-j
_

( x i. x j . t / 2 , GlError

2CME
)
n

2.- Se coleccionaron las concentraciones atmosfricas de SO2 (en ppm)


provenientes de 5 muestreadores localizados a diferentes distancias (aleatoriamente
asignadas), de una fuente industrial emisora. Los datos que se dan en la tabla de
abajo son de 4 observaciones por muestreador.
Tabla 10.- Mostrando los datos de concentraciones de SO2 (ppm)
observacion

Muestreadores

es
I
II
III
IV

1
500
510
490
530

2
550
540
500
520

3
648
630
620
600

4
720
700
710
736

5
890
900
920
880

Probar la hiptesis nula de que las poblaciones de SO2 son iguales, es decir, Ho:
1 = 2 = 3 = 4 = 5.
La suma de cuadrados requeridos se calcula como sigue:
Donde:

Tratamientos = a
Repeticiones = n

12

F .C.

5.

X 2 ..
an

S .C.Total X ij2 F .C. ( X 112 X 122 ... X an2 )


i 1

6.

-FC
a

S .C.Tratamientos
7.

X
i 1

2
i.

F .C.

( X 12. X 22. ... X n2. )


FC
n

S .C Error S .Ctotal S .C.tratamientos


8.
Distribucin Completamente al Azar con Diferente Nmero de Repeticiones
por Tratamiento
Donde :

Tratamientos = a
Repeticiones = n

1.- Se examina el contenido de azufre en 5 yacimientos de carbn. Se toman 10


muestras aleatorias de cada uno de los yacimientos y se analizan, obteniendo los
siguientes datos del porcentaje de azufre de los yacimientos. Sin embargo en
alguno de ellos se carece de informacin.
Muestras
1
2
3
4
5
6
7
8
9
10

Yacimientos
1
1.51
1.92
1.08
2.04
2.14
1.76
1.17

2
1.69
0.64
0.90
1.41
1.01
0.84
1.28
1.59

3
1.56
1.22
1.32
1.39
1.33
1.54
1.04
2.25
1.49

4
1.30
0.75
1.26
0.69
0.62
0.90
1.20
0.32

5
0.73
0.80
0.90
1.24
0.82
0.72
0.57
1.18
0.54
1.30

a- Plantear la hiptesis
b- Realice el anlisis de varianza para verificar si hay diferencia del contenido
de azufre en los yacimientos de carbn.
c- De acuerdo a los resultados que conclusiones deduce de este experimento?

13

14

2.- En una empresa de montaje trabajan 135 operarios que realizan un determinado trabajo
(T). La direccin de la empresa est interesada en conocer si influye el factor operario en la
variable tiempo de realizacin del trabajo T. Para ello se eligen cinco operarios al azar y se
les controla el tiempo en minutos que tardan en realizar el trabajo T en diez ocasiones. Sin
embargo en algunos de ellos no se tiene informacin.
Los resultados del experimento son los de la tabla adjunta.
Oper.1.
72
75
71
69
67
71
75
73
69
65

Oper.2.
75
70
77
73
79
77
76
74

Oper.3.
78
79
84
72
83
77
80
83
71
85

Oper. 4.
69
65
61
75
70
68
67

Oper.5.
65
60
63
68
70
64
62
64
69

a- Plantear la hiptesis
b- Realice el anlisis de varianza para verificar si hay diferencia en el factor operarios.
c- De acuerdo a los resultados que conclusiones deduce de este experimento?

F .C.

9.

X 2 ..
ni

S .C.Total X ij F .C.
2

10.

S .C.Trat 's

2
X 21. X 2. 2
X a.

n n ... n
1
2
n

F .C.

11.

S .C Error S .C total S .C.Tratamientos


12.

15

EL MODELO DE EFECTOS ALEATORIOS


En algunas ocasiones los niveles de los tratamientos son demasiados y se tienen
que elegir solo algunos de ellos, cuando esta seleccin es aleatoria, los resultados
pueden aplicarse a todos los posibles niveles.
Como son demasiados los niveles involucrados, no es prctico hacer el anlisis de
variancia para probar hiptesis sobre los valores de cada nivel. En ese sentido, el
planteamiento de las hiptesis se hace con la idea de que si un tratamiento es
indiferente o no sirve, no desva los valores observados de su media poblacional, ni
produce variacin, por lo que basta con probar su varianza. Es obvio que dicho
tratamiento debe seleccionarse aleatoriamente.
Para probar si los tratamientos producen o no variacin, las hiptesis se plantean:
Ho: t2 = 0
Ha: t2>0
De esta manera, si los tratamientos efectivamente no influyen, no producirn
varianza, por lo que es de esperarse que una Ho: t 2 = 0 sea aceptada. Si Ho se
rechaza es que si hay variacin y los tratamientos si influyen en los valores
observados, aunque de momento no sea posible determinarlos.

El anlisis de varianza es igual al anlisis de varianza para el modelo de efectos


fijos.
Fuentes de G.L.
variacin
Tratamient a 1
o

S.C.

Error

a(n-1)

S .C Error S .Ctotal S .C.Trat ' s

Total

an 1

S .C.Total X ij F .C.

xi.

S .C.Trat ' s

F .C.

CM = 2

Fc

SCtrat' s
gl

CMtrat' s
CMError

Y los estimadores de la variancia del error y de la variancia de los tratamientos son:


2= CME
t 2

CMTrat CMError
n

ESTIMACIN DE PARMETROS
En el anlisis de varianza se tienen dos fuentes de variabilidad: la variacin
proveniente del error aleatorio que se genera dentro de cada tratamiento,

16

representada por

y la variacin proveniente por el efecto de los tratamientos,

t
representada por
. En los modelos de efectos aleatorios es frecuente la
necesidad de tener estimaciones de estos valores considerados como fuentes de
variabilidad.
2

Es posible construir intervalos de confianza para estos valores de la siguiente


2
manera: Para la varianza del error (
) con 1- de confiabilidad, el intervalo
queda:

GLerror CME
GLE CME
2

x 2 / 2, GLE
x 2 1 / 2, GLE

t 2

Para la varianza de los tratamientos (

) no es posible construir un intervalo de

t
t 2
2

confianza pero se puede tener para


que representa la proporcin de la
variabilidad debida a la varianza de los tratamientos, es decir, debida a la diferencia
entre los tratamientos.

t 2
2 t 2

El intervalo para

para una confiabilidad 1- queda:

L
t 2
U
2

2
1 L t
1U

CMt

CMe

1

1

F / 2; GLt, GLe

CMt
1

1

CMe F1 / 2; GLt, GLe

F1 / 2; GLt, GLe F / 2; GLe, GLt

Ejemplos
17

1.- Un ingeniero de procesos de una industria textil, piensa que la resistencia de las
telas, aparte de la variacin usual se ven afectadas por el telar que las produce.
Como se desea que esto no ocurra, decide tomar cuatro muestras de cada telar en
forma aleatoria, obtenindose los siguientes datos del experimento.
Tela
1
2
3
4

13.

1
98
91
96
95

X 2 ..
F .C.
an

2
97
90
95
96

3
99
93
97
99

4
96
92
95
98

xi.
390
366
383
388
X..=1527

=145,733.06

S .C.Total X ij F .C.
2

14.

S .C.Tratamientos
15.

= 145,845 145,733.06 = 111.93

X 2 i.
F .C.
n

= 145,822.25 145,733.06 = 89.19

S .C Error S .C total S .C.Tratamientos


16.
FV
Trats
Error
Total

= 111.93 89.19 = 22.74


GL
3
12
15

SC
89.19
22.74
111.93

CM
29.73
1.89

Fc
15.73

F 0.05
3.49

0.01
5.95

Las Hiptesis a Probar sern:


Ho: t = 0
Ha: t 0
Intervalo de para la varianza del error (

) con 1- de confiabilidad.

GLerror CME
GLE CME
2 2
2
x / 2, GLE
x 1 / 2, GLE

18

121.89
2

x 0.025,12

121.89
x 1 0.025,12
2

121.89 2 121.89
23.3

4.04

t 2
2 t 2

El intervalo para

para una confiabilidad 1- queda:

L
t 2
U
2

2
1 L t
1U

CMt

CMe

29.73
1.89

1

1

F / 2; GLt, GLe

29.73

1.89

1

1

F 0.025;3,12

1
1 0.629
4.47

CMt

CMe

1
1

1
4

F1 / 2; GLt, GLe

F1 / 2; GLt, GLe F / 2; GLe, GLt

1 29.73 1

1

4 1.89 14.34

29.73

1.89

1
1

F 1 0.025 ;12,3

1 29.73 1

1 55.92

4 1.89 0.07

0.629
t 2
55.92
2

2
1 0.629 t
1 55.92

2.- Una fbrica de textiles cuenta con un gran nmero de telares. Se supone que
cada uno tiene la misma produccin de tela por minuto. Para investigar esta
suposicin, 5 telares son escogidos al azar y se mide la cantidad de tela producida
en 5 tiempos diferentes. Se obtienen los siguientes datos.
Produccin de telares
19

Tiempo
1
2
3
4
5

1
14.0
13.9
14.1
13.6
13.8

2
14.1
13.8
14.2
13.8
13.6

3
14.2
13.9
14.1
14.0
13.9

4
14.0
14.0
14.0
13.9
13.8

5
14.1
14.0
13.9
13.7
14.0

Tienen los mismos telares el mismo rendimiento?


Calcular la variabilidad de los telares
Estime la varianza del error experimental

2 yt 2
Determine un intervalo de confianza del 95% para

20

1.2.3.2.- DISEOS EN BLOQUES AL AZAR.


En este diseo se pretende eliminar el efecto de la variacin predominante.
1.- El material experimental se divide en bloques
2.- Los tratamientos se asignan aleatoriamente dentro de cada bloque (suposicin
de independencia).
3.- El manejo dentro del mismo bloque debe ser el mismo en tiempo y espacio
(muestreo, compostaje, alimentacin, aclareo, control de insectos, control de
enfermedades, cosecha, ect).
4.- Cada bloque deber ser lo ms uniforme posible.
5.- Cada tratamiento es asignado una vez a una unidad experimental dentro de
cada bloque (pero uno o ms pueden repetirse).
6.- El nmero de tratamientos no debe ser excesivo > 15
7.- Se mantiene el error experimental dentro de cada bloque.
8.- Todas las unidades dentro del mismo bloque son comparables.
9.- Los bloques deben formarse perpendiculares a los gradientes de variacin.
10.- El bloque ayuda a reducir el error experimental proveniente de las variaciones
(de tratamientos, de la unidad experimental, peso, altura, edad, diamentro, etc).
La distribucin de los bloques puede ser de acuerdo a la variacin existente, no
importando que tan dispersos queden, siempre y cuando tengan el mismo ambiente
atmosfrico.

Estratificacin del sitio


MODELO DE RESPUESTA.

X ij ti j ij
Donde:
Xij = Variable de respuesta de la j-esima unidad experimental, con eli-esimo
tratamiento.

= media general comun a todas las unidades experimentales antes de aplicar los
tratamientos.
21

ti= Efecto del i-esimo tratamiento


bj= Efecto del j-esimo bloque
Eij= Error en el j-esimo del i-esimo tratamiento
ESTRUCTURA DE CONCENTRACIN DE DATOS
Tratamient
os
(Niveles)
I

Observacion
es
(Repeticione
s)
II

III

Xi.

X11

X12

X13

X1n

X1.

X21

X22

X23

X2n

X2.

X31

X32

X33

X3n

X3.

.
a

.
Xa1

.
Xa2

.
Xa3

.
Xan

.
Xa.

Total
bloques
(X.j)

Total
Trat's

Xij

Promedi
o.

X i.

X 1.

X 2.

X 3.
.

X a.

X.1

X.2

X.3

X.n

X ..

X..

X..= Xi.+X2.+X3.+..+Xa.
Modelo de anlisis de varianza para una distribucin en bloques al azar
Fuentes
de
variacin
Tratamien
to

G.L.

S.C.

CM
2

(a-1)

xi.2
S .C.Trat ' s
F .C.
n

SCtrat' s
gl

Bloque

(n-1)

Error

S .C.Bloques
(a-1)(n-1)

x. j

= Fc

CMtrat' s
CMError

F .C.

S .CError S .Ctotal S .C.Trat ' s S .CBloques

22

Total

(an-1)

S .C.Total X ij F .C.
2

23

Se prueban dos Hiptesis:


Tratamientos:
Ho: t1= t2=t3......ta

Ha: t1 t2
Bloques :

t3......ta

Ho : 1=2=3..n
Ha : 123..n
Regla de desicin:
Para tratamientos:
Si Fc es F; se rechaza Ho: t1= t2=t3......ta
por lo tanto se acepta Ha : t1

t2

t3......ta

Para bloques :
Si Fc es F; se rechaza Ho: 1=2=3..n
por lo tanto se acepta Ha : 123..n
CALCULO DE LA SUMA DE CUADRADOS
F .C.

17.

18.

X 2 ..
an

S .C.Total

2
ij

F .C.

X 1. 2 X 2. 2 ... Xa. 2
xi. F .C.

F .C.
n
n
2

S .C.Tratamientos
19.

8.-

x. j 2
X .12 X .2 2 ... X .n 2

S .C. Bloques
F .C.
F .C.
a
a

S .CError S .Ctotal S .C.Tratamientos S .CBloques

20.

24

C.V
21.

cme

x100

25

ESTIMACIN DE PARMETROS:
El efecto de cada tratamiento se traduce en una desviacin de la media
poblacional. Existe un valor i que representa la media para un tratamiento que
debe ser el valor de la media poblacional ms la desviacin causada por el
tratamiento, esto es: i=+i. Se puede tener una estimacin del valor i por el
intervalo siguiente:

CME
CME
( x i. t / 2 , glError
i y i t / 2, glError
)
n
n
_

O
_

( x i. t / 2 , glError

CME
)
n

De igual forma se puede tener una estimacin para la diferencia de medias de dos
tratamientos: i-j

( x i. x j . t / 2 , glError

2CME
CME
i j y i t / 2, glError 2
)
n
n

o
_

( x i. x j . t / 2 , GlError

2CME
)
n

Donde:

x i.

= La media de las n observaciones del tratamiento i

x j.

= La media de las n observaciones del tratamiento j


t/2, gLError = Valor del estadstico t para una significancia /2 y glError

26

Ejemplo
1.- Un ingeniero industrial realiza un experimento para estudiar el tiempo que tarda
el ojo en enfocar. Est interesado en la relacin que existe entre la distancia del
objeto al ojo y el tiempo que el ojo tarda en enfocar. Cuatro diferentes distancias
resultan de inters. Hay 5 sujetos disponibles para el experimento. Los datos se
muestran a continuacin.
Distancia
(pies)
4
6
8
10
Bloques
(X.j)

Sujeto
3
4

10
7
5
6
28

8
6
3
4
21

6
6
3
4
19

4
1
2
2
9

5
6
6
5
3
20

Regla de decisin:
Para tratamientos:
Si Fc es F; se rechaza Ho: t1= t2=t3......ta
por lo tanto se acepta Ha : t1

t2

t3......ta

Como Fc es > que Ft en los dos niveles hay alta diferencia significativa entre los
tratamientos, por lo tanto no ce acepta a Ho y no se rechaza a Ha de que los
tratamientos son diferentes entre s o al menos uno de ellos.
Para bloques:
Si Fc es F; se rechaza Ho: 1=2=3..n
por lo tanto se acepta Ha : 123..n
Intervalo de confianza para la media del mtodo 3.
_

( x i. t / 2 , glError

CME
)
n

De igual forma se puede tener una estimacin para la diferencia de medias de dos
tratamientos: i-j

27

( x i. x j . t / 2 , GlError

2CME
)
n

2.- Se desea estudiar el efecto de la Fluorita en la reduccin del costo energtico en


la fabricacin de cemento. Se emplean 6 mezclas distintas de materias primas.
Mezclas
I
II
III
IV
V
VI

0%
15.02
8.42
18.31
10.49
9.78
9.28

1%
11.86
10.15
16.84
10.52
9.59
8.84

Fluorita
2%
9.94
8.54
15.86
8.04
6.96
7.04

3%
12.45
6.98
14.64
10.50
8.15
6.66

4%
13.23
8.93
15.96
10.34
9.24
9.46

DATOS FALTANTES EN BLOQUES AL AZAR


Cuando por alguna razn ajena al experimento una observacin se pierde se
presenta el problema de no poder realizar el anlisis correspondiente. La solucin al
problema anterior se logra por medio de los pasos siguientes.
a) Estimacin del dato faltante
b) Bloques incompletos
ESTIMACION DE UN DATO FALTANTE:
I

II .........

T1
T2
.
.
Ts
.
Ta

X11
X21
.
.
Xs1
.
Xa1

X12...
X22...
.
.
Xs2...
.
Xa2...

Total X.j

X.1

X.2...

Repeticiones
m ............

Total Xi.

X1m....
X2m..
.
.
X1..
.
Xam...

X1n
X2n
.
.
Xsn
.
Xan

X1.
X2.
.
.
X's.+X1
.
Xa.

X'm.+X1

X.n

X"..
X"..
X..= X+X1

28

(aX ' s. nx ' m.) X "..


n 1 a 1

Donde:
n= repeticiones
a= tratamientos
X's. = Suma total de los tratamientos.
X'm. = Suma total del bloque.
X".. = Suma total de los tratamientos.

Una vez que se tiene la estimacin del dato faltante, su valor se incluye en la
celda correspondiente del cuadro de concentracin de datos y se procede a calcular
la suma de cuadrados de las fuentes de variacin correspondientes al diseo de
bloques al azar. El anlisis de varianza deber mostrar una disminucin de 1 gL. en
el error y en el total 2 gL.
Cuadro de ANAVA
F.V.

G.L.

S.C.

Trat's
Bloques
Error
Total

a-1
n-1
(a-1)(n_1)-1
(an-1)-1

C.M.

Fc

El ANAVA anterior nos da una prueba aproximada de la hiptesis Ho:


t1=t2=.......ta. Si en la prueba aproximada de Ho: t 1=t2=t3=...=ta, se obtiene
significancia, deber hacerse la prueba exacta para dicha hiptesis. La razn para
realizar la prueba es la posibilidad de que la diferencia significativa detectada se
deba al incremento que sufre la suma de cuadrados de los tratamientos por el
clculo del dato perdido.
PROCEDIMIENTO PARA REALIZAR LA PRUEBA EXACTA.
1.- Obtener la sctrat's corregida (Sctratc)
a)

Sctratc Sctrat z

X ' m. a 1 x
Z
a a 1

CMtrat ' s

b)

Donde:

Esta cantidad hay que restarla a la suma de cuadrados de


tratas.

Sctratc
a 1

29

Fc

CM trat
CM Error

c)

30

ESTIMACION DE DOS DATOS FALTANTES:


A) LOS DATOS FALTANTES PERTENECEN AL MISMO TRATAMIENTO
I

II .........

m ............

Total Xi.

T1
T2
.
.
Ts
.
.
Ta

X11
X21
.
.
Xs1
.
.
Xa1

X12..
X22..
.
.
X1..
.
Xa2..

X1m..
X2m..
.
.
X2..
.
.
Xam..

X1n
X2n
.
.
Xsn
.
.
Xan

X1.
X2.
.
.
X's.+X1+X2
.
.
Xa.

Total X.j

X.1

Xm.+X1

X'w.+X2

X.n

X"..
X..=X"..+X1+X2

X1

aX ' s. n 1 X ' m. X ' w. X "..


a 1 n 2

X2

ax ' s. x' m. n 1 x' w. X "..


a 1 n 2

LOS DATOS FALTANTES PERTENECEN AL MISMO BLOQUE


I

Repeticiones
II .........
m ............

l
n

Tota Xi.

X1n
X2n
.
.
XSn
.
.
Xqn
.
.
Xan

X1.
X2.
.
.
X's.+X1
.
.
X'q.+X2
.
.
Xa.

T1
t2
.
.
Ts
.
.
tq
.
.
Ta

X11
X21
.
.
XS1
.
.
Xq1
.
.
Xa1

X12...
X22...
.
.
XS2...

X1m....
X2m....
.
.
X1.

Xq2...
.
.
Xa2...

X2.
.
.
Xam...

Total X.j

X.1

X.2...

Xm.+X1+X2 X.n

x1

nX ' m. a 1 X ' s. X ' q. X "..


n 1 a 2

x2

X"..
X..=X"..+X1+X2

nX ' m. X ' s. a 1 X ' q. X "..


n 1 a 2

31

LOS DATOS FALTANTES PERTENECEN A DIFERENTES TRATAMIENTOS Y


DIFERENTES BLOQUES
Repeticiones
I
II .....
m......
w......
n
Total
Xi.
t1
X11
X12....
X1m....
X1w...
X1n X1.
t2
X21
X22...
X2m...
X2w...
X2n X2.
.
.
.
.
.
.
.
.
.
.
.
.
ts
Xs1
Xs2...
X1.
Xsw
Xsn X's.+X1=T1+X1
.
.
.
.
.
.
.
.
.
.
.
.
tq
Xq1
Xq2.
Xqm
X2.
Xqn X'q.+X2=T2+X2
.
.
.
.
.
.
.
.
.
.
.
.
Ta
Xa1
Xa2
Xam
Xaw
Xan Xa.
Total X.j

x1

X.1

X.2

X'm.+X1=R1+X1

fw1 w2
f 2 1

X'w.+X2= R2+X2

x2

f a 1 n 1

X.n

X"..
X..=X"..+X1+X2

fw2 w1
f 2 1

w1 aT1 nR1 X "..

w2 aT2 nR2 X "..

Prueba Exacta Cuando son Dos los Datos Faltantes


Una vez que se tienen las estimaciones de los datos faltantes, sus valores se
incluyen en las celdas correspondientes del cuadro de concentracin de datos y se
procede a calcular la suma de cuadrados de las fuentes de variacin
correspondientes al diseo de bloques al azar. El anlisis de varianza deber
mostrar una disminucin de 2 gL. en el error y en el total 3 gL.
Cuadro de ANAVA
F.V.

G.L.

Trat's
Bloques
Error
Total

a-1
n-1
(a-1)(n_1)-2
(an-1)-2

S.C.

C.M.

Fc

El ANAVA anterior nos da una prueba aproximada de la hiptesis Ha:


t1=t2=.......ta. Si en esta prueba se detecta significancia para los tratamientos
deberemos hacer una correccin para abatir el efecto del incremento en la ScTrat's
debido a los valores estimados de los datos faltantes.
32

PROCEDIMIENTO
1) Sin considerar las estimaciones de los datos faltantes, realizar un anlisis de
varianza para un diseo completamente al azar con diferente nmero de
repeticiones por tratamiento. En este diseo considrese a los bloques como los
tratamientos y a los tratamientos como repeticiones.
2) La suma de cuadrados de los tratamientos corregida (ScTrat'sc) es la diferencia
de la suma de cuadrados del error del diseo completamente al azar del
procedimiento 1, menos la suma de cuadrados del error del diseo bloques al
azar (obtenido en el ANAVA) de la prueba aproximada) identificados como
SCEBA, es decir.
SCTC= SCECA-SCEBA
CMTC=SCTC / t-1
3) La prueba exacta de la hiptesis Ho: t1=t2=.....=ta, se obtiene con el CMTc y el
CMEBA (CME obtenido en el ANAVA de la prueba aproximada).
Nota 1. Cuando faltan dos datos, un procedimiento frecuentemente usado es: Para
uno de los datos faltantes se le asigna la media de todas las observaciones (na-2
datos disponibles en todo el experimento). De esta forma tendremos el caso de un
solo dato faltante y usarse la ecuacin para este caso. A continuacin se estima el
dato al cual se le asign la media. Se vuelve a estimar la primera observacin y as
sucesivamente hasta que se estabilicen las estimaciones, es decir, hasta que los
cambios en los valores de las estimaciones no sean grandes.
Nota 2. Si falta un bloque o un tratamiento completo, el anlisis de los resultados
puede realizarse de la manera usual, si se tienen todava dos o ms tratamientos o
bloques completos.
Nota 3.- Cuando son tres los datos faltantes, a uno puede asignarsele la media de
los an-3 datos disponibles y usar para estimar los restantes dos, las ecuaciones
para los dos datos faltantes.

33

Estimacin de un dato faltante


1.- Tres diferentes soluciones para lavar estn siendo comparadas con objeto de
estudiar su efectividad en el retraso del crecimiento de bacterias en envases de
leche de 5 galones. El anlisis se realiza en un laboratorio y slo pueden efectuarse
3 pruebas en un mismo da. Como los das son una fuente de variabilidad potencial,
el experimentador decide usar un diseo aleatorizado en bloques. Las
observaciones se recopilaron durante 4 das y los datos son los siguientes.

Solucin

Dias
2

1
2
3

13
16
5

22
X
4

18
17
1

39
44
22

2- El tiempo de respuesta en milisegundos, fue determinado para tres tipos de


circuito de un mecanismo de interrupcin automtica de vlvulas. Los resultados
fueron:
Tipo de
Circuito
1
2
3

tiempos de respuesta en milesegundos


9
20
6

12
21
5

10
23
8

X
17
16

15
30
7

-Realice el anlisis de varianza para verificar si hay diferencia en los tiempos de


respuesta de cada mecanismo

34

Estimacin de Datos Faltantes.


1.- Los datos siguientes se refieren a un experimento conducido bajo un diseo
bloques al azar en el cual se han perdido dos datos en diferente tratamiento y
diferente bloque.
Bloques

Tratamientos
1

I
16
II
28
III
16
IV
28
Suma de
Trats
88
Xi.

x1

Suma
Bloques X.j

de

22
27
25
X2

16
17
16
19

X1
20
16
18

18
23
19
24

8
23
16
25

80+X1= R1+X1
138
108
114+X2=R2+X2

74+X2= T2+X2 68 54+X1=T4+X1 84

72

440

fw1 w2
f 2 1

x2

f a 1 n 1

fw2 w1
f 2 1

w1 aT4 nR1 X "..

w2 aT2 nR2 X "..


f a 1 n 1

w1 aT4 nR1 X "..

= (6-1)(4-1) =15

= [(6)(54) + 4(80)] 440 = 204

w2 aT2 nR2 X "..

= [(6)(74) + 4(114) ] 440 = 460

x1

fw1 w2 15 204 460

11.61
f 2 1
15 2 1

x2

fw2 w1 15 460 204

f 2 1
15 2 1

35

Una vez calculados los datos faltantes realizar el anlisis de varianza y si hay
diferencia significativa, obliga a realizar la prueba exacta de la hiptesis nula para
dos datos faltantes.

1.2.3.3- DISEO EN CUADRADO LATINO


Contenido
1.- Caractersticas y supuestos bsicos del Diseo en Cuadro Latino.
2.- Modelo Lineal.
3.- Asignacin aleatoria de los tratamientos: aleatorizacin de hileras y columnas
4.- Cuadro de concentracin de datos
5.- Hiptesis a probar.
6.- Modelo del Anlisis de Varianza.
7.- Interpretacin del Anlisis de Varianza: Diferentes ejemplos numricos.
8.- Intervalo de Confianza Para una Media de Tratamientos
Se aplica donde se sospecha que la variabilidad afecta en dos sentidos y es tal su
magnitud que modifican la respuesta de los tratamientos.
Bloquea la variabilidad en cada sentido.
Se aleatorizan los tratamientos en cada sentido de la variabilidad dando lugar a
hileras y columnas.
Cada tratamiento se asigna una vez en cada hilera y columna.
Se requieren tantas repeticiones como tratamientos se evalan, los ms comunes
son de 5 a 8.
Hileras y columnas son grupos de unidades homogneas para una u otra variable.
El error experimental por unidad tiende a ser directo al tamao del cuadro.
Se aplica tanto en la industria como en la agricultura.
La varianza del error experimental en el cuadrado latino se espera que sea menor
en relacin con los anteriores diseos.
DISTRIBUCIN DE LOS TRATAMIENTOS:
aleatorizacin de tratamientos en cuadrado latino
Se selecciona un plan de distribucin de tratamientos de acuerdo al nmero de
tratamientos, mismos que no deben repetirse en cada hilera y columna.
1 ABCDE
2 EABCD
3 DEABC
4 CDEAB
5 BCDEA
6
7
8
N=5

ABCDEF
FABCDE
EFABCD
DEFABC
CDEFAB
BCDEFA

ABCDEFG
GABCDEF
FGABCDE
EFGABCD
DEFGABC
CDEFGAB
BCDEFGA

n=6

n=7

ABCDEFGH
HABCDEFG
GHABCDEF
FGHABCDE
EFGHABCD
DEFGHABC
CDEFGHAB
BCDEFGHA
n=8
36

Los anteriores planes de distribucin se obtuvieron al ubicar las letras de la primera


hilera en orden alfabtico e iniciar la siguiente con la ltima letra de la hilera anterior
para continuar con el orden alfabtico de las letras que participan, as
sucesivamente hasta la ltima hilera. Sin embargo los planes muestran una
direccin diagonal de los tratamientos lo que es indeseable pues existe la
posibilidad de que no se logre el efecto de hileras y columnas, lo que obliga a
aleatorizar hileras y columnas.
ALEATORIZACIN DE COLUMNAS
1 BACED
2 AEBDC
3 EDACB
4 DCEBA
5 CBDAE
6
7
8

CBADFE
BAFCED
AFEBDC
FEDACB
EDCFBA
DCBEAF

DBGACEF
CAFGBDE
BGEFACD
AFDEGBC
GECDFAB
FDBCEGA
ECABDFG

FGABECHD
EFHADBGC
DEGHCAFB
CDFGBHEA
BCEFAGDH
HACDGEBF
HACDGEBF
GHBCFDAE

2 CAFGBDE
1DBGACEF
3 BGEFACD
4 AFDEGBC
6 FDBCEGA
5 GECDFAB
7 ECABDFG

6 ABDEHFCG
1 FGABECHD
3 DEGHCAFB
5 BCEFAGDH
2 EFHADBGC
7 HACDGEBF
8 GHBCFDAE
4 CDFABHEA

ALEATORIZACIN DE HILERAS
3 EDACB
2 AEBDC
5 CBDAE
1 BACED
4 DCEBA

4 FEDACB
1 CBADFE
2 BAFCED
6 DCBEAF
5 EDCFBA
3 AFEDBC

Modelo de respuesta:

X ij k hi c j tk ij k
Donde:
Xij(k) = variable de respuesta para el tratamiento k que se encuentra en la hilera i y
columna j.
Hi = efecto de la hilera i
Cj = efecto de la columna j
Tk = efecto del tratamiento k
= efecto general o contribucin comn a todas las unidades experimentales.

ij k

= error experimental, variacin debido al azar o variacin de muestreo con


distribucin NI (0, 2)
37

38

Cuadro de Concentracin de Datos


Suma
total Xhi..
1

2
3

B
D

D
A

E
B

C
E

4
5
Suma
total
X.cj.

C
E

B
C

A
C
Xiltk
E
D

D
A

A
B
X..

Suma total
X..tk
A=
B=
C=
D=
E=
Modelo de anlisis de varianza para una distribucin en Cuadrado Latino
Fuentes
de
Variacin
Hileras

Columnas

G.L.
a-1

n-1

S.C.

C.m.

S .C.Hileras

S .C.Columnas

x.cj.

Fc

2
hi..

F .C.

n
2

F .C.

X ..tk

Tratamient n-1
o

S .C.Trat ' s

Error

(n-1)(n-2)

S .C.Error S .CTotal S .C H 's S .CC 's S .CTrat 's

Total

a2-1

S .C.Totales

F .C.

2
iltk

F .C.

Las hiptesis que se prueban en el anlisis de varianza son:


Para hileras:

Ho h1 h2 .... ht
Ha : h1 h2 .... ht

39

Para columnas:

Co c1 c2 ..... ct

Ca c1 c 2 ..... ct

Para tratamientos:

To t1 t 2 ..... t a a

Ta t1 t 2 ..... t a

Regla de desicin:
Para tratamientos:
Si Fc es F; se rechaza Ho: t1= t2=t3......ta
por lo tanto se acepta Ha : t1

t2

t3......ta

Para hileras:
Si Fc es F; se rechaza Ho: h1=h2=h3..hn
por lo tanto se acepta Ha : h1h2h3..hn
Para columnas:
Si Fc es F; se rechaza Ho: c1=c2=c3..cn
por lo tanto se acepta Ha : c1c2c3..cn
Suma de Cuadrados:
2

F .C.
1.-

2.-

3.-

x...
a2

S .C.Totales

iltk

F .C.

X 1.2 X 2.2 ... Xhi..2


S .C.Hileras
F .C.
n

hi...

F .C.

40

X 1.2 X 2.2 .... X .cj.2


F .C.
n

S .C.Tratamientos

X 1.2 X 2.2 ... X ..tk 2

F .C.
n

4.-

5.-

x.cj.

S .C.Columnas

F .C.

X ..tk

F .C.

S .C. Error S .C Total S .C Hileras S .C Columnas S .C Tratamientos

6.-

41

ESTIMACIN DE PARMETROS:
El efecto de cada tratamiento se traduce en una desviacin de la media
poblacional. Existe un valor i que representa la media para un tratamiento que
debe ser el valor de la media poblacional ms la desviacin causada por el
tratamiento, esto es: i=+i. Se puede tener una estimacin del valor i por el
intervalo siguiente:

( x i. t / 2 , glError

CME
CME
i y i t / 2, glError
)
n
n

O
_

( x i. t / 2 , glError

CME
)
n

De igual forma se puede tener una estimacin para la diferencia de medias de dos
tratamientos: i-j

2CME
CME
( x i. x j . t / 2 , glError
i j y i t / 2, glError 2
)
n
n

o
_

( x i. x j . t / 2 , GlError

2CME
)
n

42

Ejemplo
1.- Suponga que un experimentador est investigando el efecto de 5 tipos de
formulaciones de combustible (usado en la operacin de una caldera), para
observar el efecto en la tasa de combustin. Cada formula de combustible se tom
de un lote que solo da para 5 pruebas. Adems de esto, las formulas son
preparadas por 5 operadores diferentes. De esta manera, se puede observar dos
factores de ruido o variabilidad que son identificables por el experimentador y que se
pueden bloquear: los lotes de material y los operadores. La siguiente tabla ilustra lo
anteriormente descrito:
Lotes de
materia
prima

Operadores

1
A=2
4
B=1
7
C=1
8
D=2
6
E=2
2

Lote1
Lote2
Lote3
Lote4
Lote5

Total

2
B=20

3
C=19

4
D=24

5
E=24

C=24

D=30

E=27

A=36

D=38

E=26

A=27

B=21

E=31

A=26

B=23

C=22

A=30

B=20

C=29

D=31

Total
Tratamientos= formulaciones de combustible
A= A1+A2+A3+A4+A5= 24+30+26+27+36= 143
B= B1+B2+B3+B4+B5= 17+20+20+23+21= 101
C= C1+C2+C3+C4+C5= 18+24+19+29+22= 112
D= D1+D2+D3+D4+D5= 26+38+30+24+31= 149
E= E1+E2+E3+E4+E5= 22+31+26+27+24= 130
A=
B=
C=
D=
E=

24
17
18
26
22

30
20
24
38
31

26
20
19
30
26

27
23
29
24
27

36
21
22
31
24

Total
143
101
112
149
130

Media
28.6
20.2
22.4
29.8
26.0

43

Cuadro de anlisis de varianza


Fuentes de
Variacin
Tratamiento
Hileras
Columnas
Error

G.L.

S.C.

4
4
4
12

330
68
150
128

Total

24

676

C.m.

Fc
0.05
7.7344 3.26
1.5938 3.26
3.5156 3.26

82.5
17
37
10.666

Ft
0.01
5.41
5.41
5.41

Cv= 12.85%
Regla de desicin:
Para tratamientos:
Si Fc es F; se rechaza Ho: t1= t2=t3......ta
por lo tanto se acepta Ha : t1

t2

t3......ta

Como Fc es > que Ft en los dos niveles hay alta diferencia significativa entre los
tratamientos, por lo tanto no ce acepta a Ho y no se rechaza a Ha de que los
tratamientos son diferentes entre s o al menos uno de ellos.
Para hileras:
Si Fc es F; se rechaza Ho: h1=h2=h3..hn
por lo tanto se acepta Ha : h1h2h3..hn
Como Fc es < que la Ft no hay diferencia significativa entre las Hileras por lo tanto
no rechaza Ho y no se acepta a Ha.
Para columnas:
Si Fc es F; se rechaza Ho: c1=c2=c3..cn;
por lo tanto se acepta Ha : c1c2c3..cn
Como Fc es > que la Ft al 0.01 y menor al 0.05 solamente hay diferencia
significativa entre las columnas; por lo tanto se rechaza Ho y se acepta a Ha de que
las columnas sean diferentes entre s o al menos una de ellas.
Como Fc es < que la Ft no hay diferencia significativa entre las columnas por lo
tanto no rechaza Ho y no se acepta a Ha.

44

Calcular el intervalo de Confianza al 95% para la media de tratamiento 2:


P x1 t / 2 , gl S x1 1 t / 2 , gl S x1 1

P 20.2 0.05 / 2,12 10.666 1 0.05 / 2,12 ( 10.666 ) 1

P 20.2 2.179 3.265 1 (2.179)(3.265) 1

P 20.2 7.11 1 7.11 1

2.- Un ingeniero industrial est investigando el efecto que tienen cuatro mtodos de
ensamble sobre el tiempo de ensamble de un componente para televisores a color.
Se seleccionan 4 operadores para realizar este estudio. Por otra parte, el ingeniero
sabe que cada mtodo de ensamble fatiga, por lo que el tiempo que se tarda en el
ltimo ensamble puede ser mayor que en el primero, independientemente del
mtodo. En otras palabras se produce un patrn en el tiempo de ensamble. Para
controlar esta posible fuente de variabilidad, el ingeniero decide utilizar un diseo en
cuadrado latino. Los datos se muestran a continuacin.
Orden
montaje
1
2
3
4

de
1
C 10
B7
A5
D 10

2
D 14
C 18
B 10
A 10

3
A7
D 11
C 11
B 12

4
B8
A8
D9
C 14

45

DATOS FALTANTES EN DISEO CUADRADO LATINO


UN DATO FALTANTE
Suponiendo que falta la observacin de la hilera w, columna m y que el
tratamiento correspondiente a dicha celda es s.
HILERAS I
I
II
.
.
W
.
.
N
C1

II

COLUMNAS
......
m

......

X ts

C2

....

Cm+X

......

Cn

H1
H2
.
.
Hw+X
.
.
Hn
X...+X

a t ' s H ' w C ' m 2 X "...


a 1 a 2

Donde:
a= Tratamientos
ts= Suma total del tratamiento donde se encuentra la parcela perdida.
Hw= Suma total de la hilera donde se encuentra el dato perdido
Cm= Suma total de la columna donde se encuentra el dato perdido
X= Suma total de las observaciones con el dato perdido
Si se detecta diferencia significativa para tratamientos es necesario realizar la
prueba exacta o insesgada que consiste en corregir la suma de cuadrados de
tratamientos.
2

X "... H ' w C ' m n 1T ' s


SCtcorregida SCt
n 1 n 2 2
2

46

DOS DATOS FALTANTES


LOS DATOS FALTANTES PERTENECEN AL MISMO TRATAMIENTO
COLUMNAS
HILERAS
I
II
.
.
W
.
.
Q
.
.
N

II

.....

..... Z

....

n
H1
H2
.
.
H+X1=Hw
.
.
H+X2=Hq
.
.
Hn

X1
X2

C1

C2

.....

C1+X1= Cm

..... C2+X2=Cz
.

.....

Cn

X...+X1+X2= X..

Donde:
H1 : Suma de las n-1 observaciones presentes en la hilera donde se ubica X1
H2 : Suma de las n-1 observaciones presentes en la hilera donde se ubica X2
C1 : Suma de las n-1 observaciones presentes en la columna donde se ubica X1
C2 : Suma de las n-1 observaciones presentes en la columna donde se ubica X2
X... : Suma de las a2-2 observaciones presentes en todo el experimento
T12 : Suma de las a-2 observaciones presentes que se tienen para el tratamiento
Q1 a T '12 H '1 C '1 2 X "...

Q2 a T12 H '2 C '2 2 X "...

LOS DATOS FALTANTES PERTENECEN A LA MISMA HILERA


HILERAS I
I
II
.
.
W

II

..... m

.....

X1 ts

....

N
H1
H2
.
.
Hw=H12+X1+X

X2 ta

.
.
q
.
.
n

.
.
.
.
Hn
C1

C2

.....

Cm+X1= C1

.....

Cz+X2=C2

.....

Cn

X...+X1+X2=X..

47

Donde:
T1 : Total o suma de a-1 datos para el tratamiento al que pertenece X1
T2 : Total o suma de a-1 datos para el tratamiento al que pertenece X2
Q1 a T '1 H '12 C '1 2 X "...

X1

Q2 a T '2 H '12 C '2 2 X "...

a 1 Q1 Q2
2
a a 2

X2

a 1 Q2 Q1
2
a a 2

LOS DATOS FALTANTES CORRESPONDEN A LA MISMA COLUMNA


HILERAS I
I
II
.
.
W
.
.
Q
.
.
N
C1

II

a 1 Q1 Q2
2
a a 2

.....

n
H1
H2
.
.
Hw=H1+X1
.
.
Hq=H2+X2
.
.
Hn

X1
X2

C2

Q1 a T '1 H '1 C '12 2 X "...

X1

.....

.....

Cm+X1+X2=
C12+X1+X2

.....

Cn

X...+X1+X2= X..

Q2 a T '2 H '2 C '12 2 X "...

X2

a 1 Q2 Q1
2
a a 2

48

LOS DATOS FALTANTES


TRATAMIENTO DIFERENTE
HILERAS I
I
II
.
.
W
.
.
Q
.
.
N
C1

f a 1 a 2

X1

II

PERTENECEN

..... m

..... Z

COLUMNA,

....

H1
H2
.
.
Hw=H+X1
.
.
Hq=H2+X2
.
.
Hn

X2 ta

.....

C1+X1=Cm

C2+X2=Cz

Q1 a T '1 H '1 C '1 2 X "...

fQ1 2Q2
f 2 4

X2

X1 ts

C2

HILERA

X...+X1+X2=X..

Q2 a T '2 H '2 C '2 2 X "...

fQ2 2Q1
f2 4

Una vez que se tienen las estimaciones de los datos faltantes, stos se incluyen en
el cuadro de concentracin de datos y se procede al clculo de la suma de
cuadrados en el ANAVA deber disminuirse 2 glE y 2 gl al total.
ESTIMACION DE UN DATO PERDIDO:
1.- En un experimento para observar el efecto de 5 niveles de vitaminas en el
crecimiento de cerdos se tenan 5 camadas de 5 cerdos cada una bajo 5 sistemas
de crianza. La variable a medir es el incremento en peso en el primer mes despus
de la aplicacin de la vitamina. Los resultados fueron los siguientes.
A 30
B 29
C 17
D 13
E 33

B 28
A 31
D 15
E 31
C 16

C 15
D 16
EX
A 32
B 31

D 14
E 31
B 30
C 19
A 33

E 30
C 16
A 32
B 29
D 14
49

HILERAS I
I
II
.
.
W
.
.
N
C1

COLUMNAS
......
m

II

......

X ts

C2

....

Cm+X

......

Cn

H1
H2
.
.
Hw+X
.
.
Hn
X...+X=X..

a t ' s H ' w C ' m 2 X "...


a 1 a 2

A 30
B 29
C 17
D 13
E 33
122

B 28
A 31
D 15
E 31
C 16
121

SUMA C
E1= 30 +

E2=31 +

COLUMNAS
C 15
D 14
D 16
E 31
EX =32.92 B 30
A 32
C 19
B 31
A 33
94+X
127
126.92

E 30
C 16
A 32
B 29
D 14
121

SUMA H
117
123
94+X
124
127
585+X

=126.92
X..=617.92

E4=31 + E5= 33 = ts= 125

ts = 125
Hw=94
Cm=94
X..=585
a=5
X

7.-

a t ' s H ' w C ' m 2 X "...


a 1 a 2

1.-

2.-

x..
F .C. 2.
a

5125 94 94 2 585
5 1 5 2

= 32.9I6

617.92 2 381825.1264

15273.005
52
25

S .C .Totales

ilk

F .C 16748.7264 15273.005 1475.72

50

X 1.2 X 2.2 ... Xhi..2


F .C.
n

S .C.Hileras
3.-

hi...

F .C.

=15286.337-15273.005= 13.332

S .C.Columnas
4.-

X 1.2 X 2.2 .... X .cj.2


F .C.
n

x.cj.

F .C.

= 15280.7372-15273.005= 7.7323

S .C.Tratamientos
5.-

X 1.2 X 2.2 ... X ..tk 2

F .C.
n

X ..tk

F .C.

=16716.9453-15273.005 = 1443.9403
S .C. Error S .C Total S .C Hileras S .C Columnas S .C Tratamientos

6.=1475.7214 (13.332+7.7323+ 1443.9403) = 10.72


FV
Trats
Hileras
Columnas
Error
Total

GL
a-1 = 4 -1 = 3
n-1 = 4 -1 = 3
n-1 = 4 -1 = 3
(n-1)(n-2)-1
(3)(2)=61=5
(a2-1)-1=15-1=14

SC
1443.9403
13.332
7.7322
10.72
1475.72

CM
481.313
4
4.444
2.5774
2.144

Fc
224.49
1.72
1.20

Prueba exacta para corregir la SCt


2
2

X "... H ' w C ' m n 1T ' s

585 94 94 5 1125
Z

5 1 5 2 2
n 1 n 2 2
2

73.674

2.- Se realiza un estudio para comparar los ndices de monxido de carbono en 5


puntos estratgicos de una ciudad.( N-norte, S-sur, E-este, O-oeste, C-centro). Los
conjuntos de bloques involucrados son determinados das de la semana y distintos
horarios del da. El cuadrado obtenido y los datos (ppm) registrados se presenta a
continuacin. Realizar la comparacin.
Lunes

Mircoles

Viernes

Sbado

Domingo
51

08:00
11:00
14:00
17:00
20:00

N (124)
E (112)
S (123)
O (118)
C (102)

S (124)
C (100)
N (133)
E (112)
O (122)

C (124)
N (X)
O (112)
S (133)
E (118)

O (122)
S (131)
E (121)
C (124)
N (131)

E (124)
O (114)
C (133)
N (134)
S (133)

52

Das könnte Ihnen auch gefallen