Beruflich Dokumente
Kultur Dokumente
Diseo anidado
Un diseo anidado es un diseo que posee 2 o ms factores talque:
Hay un solo factor, el cual no se encuentra anidado con ningn otro factor. Sea F1 la
notacin de este factor. Se dir que F1 representa la primera jerarqua entre todos los
factores que existen.
Existe un segundo factor (sea denotado por F2) el cual se encuentra anidado dentro del
factor F1.
El prximo factor en caso que exista (sea F3) debe encontrarse anidado dentro del factor
F2.
El diseo estadstico lineal en dos etapas es:
Y
ijk
= + t
i
+ |
j (i )
+ c
(ij ) k
En otras palabras, existen a nivel de factor B, jerarquizados bajo cada nivel A, y n
replicas. El subndice ndice que el j-esimo del factor B esta anidado bajo el i-esimo
nivel del factor A. Es conveniente considerar que las replicas estn anidadas dentro de
las combinaciones de los niveles A y B. As, el subndice (ij)k se usa para el termino
del error. Este es un diseo anidado balanceado ya que hay un nmero de niveles de B
dentro de cada nivel A y un mismo nmero de replicas. Como cada nivel de B no
aparece con cada nivel de B no aparece con cada nivel de A, no hay interaccin entre A
y B.
La suma total de cuadrados puede descomponerse en una suma de cuadrados debido al
factor A, en una suma de cuadrados debida al factor B bajo los niveles de A, y en una
suma de cuadrados debida al error. Esto simblicamente se puede expresar:
SC
T
= SC
A
+ SC
B ( A)
+ SC
E
2
2
2
2 2
2
2 2 2
|
|
2 2 2
Y
Y
n
t
E(CM)
A fij A fij A Aleatr
B fij B Aleatr B Aleatr
o
bn
ti
o o
bn
ti
o o o
E ( A
E
)
+
a1
2
+ +
|
a1
+n +bn
n
2 j(i) 2 2 2 2
E(MA
E(A)
)
o
+
a(b1)
o
+n
o
|
o
+n
o
|
E(MA
E
)
o o o
Anlisis de varianza:
Fuen d Med d
Variac Sum d cuadra Grad d libert cuadra
a 2 2
A SCA=
Y
i..
Y
...
a1 MC
i=1
bn ab
a b
2
ij.
a 2
i..
B dent d A
SCB(A) =
bn
b(a1)
MC(BA)
i=1 j=1 i=1
a b n
Y
2
a b
Y
2
Err
SCE=
ijk
ij.
ab(n1) MC
i=1 j=1 k
n i=1 j=1
n
a b n
Y
2
a b
Y
2
Tot
SCE=
ijk
ij.
abn1
i=1 j=1 k
n i=1 j=1
n
3
Ejemplo 1
Pagina 560, ejemplo 13.1:
Minitab
General Linear Model: Pureza versus Proveedor, Lote
Factor Type Levels Values
Proveedor fixed 3 1, 2, 3
Lote(Proveedor) random 12 1, 2, 3, 4, 1, 2, 3, 4, 1, 2,
3, 4
Analysis of Variance for Pureza, using Adjusted SS for Tests
Source DF Seq SS Adj SS Adj MS F P
Proveedor 2 15.056 15.056 7.528 0.97 0.416
Lote(Proveedor) 9 69.917 69.917 7.769 2.94 0.017
Error 24 63.333 63.333 2.639
Total 35 148.306
S = 1.62447 R-Sq = 57.30% R-Sq(adj) = 37.72%
Expected Mean Squares, using Adjusted SS
Expected Mean Square
Source for Each Term
1 Proveedor (3) + 3.0000 (2) + Q[1]
2 Lote(Proveedor) (3) + 3.0000 (2)
3 Error (3)
4
Error Terms for Tests, using Adjusted SS
Synthesis
1
Source
Proveedor
Error DF
9.00
Error MS
7.769
of Error MS
(2)
2 Lote(Proveedor) 24.00 2.639 (3)
Variance Components, using Adjusted SS
Estimated
Source Value
Lote(Proveedor) 1.710
Error 2.639
* El resultado del ANVA para ste estudio con factor fijo (Proveedor) y
aleatorio (lotes), se concluye que no hay efecto de los proveedores en la
pureza, el efecto que si existe es el de los lotes anidados dentro de los
proveedores que son significativamente distintos.
* De los componentes de varianza se puede decir que el modelo es bueno
ya que la mayor parte de la varianza es atribuida al error.
Ejemplo 2:
Se encuentra bajo estudio el acabado superficial de parte metlicas producidas por
cuatro mquinas. Se realiza un experimento en el que cada mquina es maniobrada por
tres diferentes operadores, y se seleccionan y prueban dos piezas de cada operador.
Debido a que las mquinas estn en diferente localidad no es posible usar los mismos
operarios en cada mquina; adems los operadores se eligen al azar. Los datos se
muestran en la siguiente tabla. Analice los datos y realice las conclusiones apropiadas.
Maquina 1
Maquina 2
Maquina 3
Maquina 4
Operario
1
2
3
1
2
3
1
2
3
1
2
3
Superficie
79
94
46
92
85
76
88
53
46
36
40
62
62
74
57
99
79
68
75
56
57
53
56
47
Solucin:
5
Informacin del nivel de clase
Clase
Niveles
Valores
maquina
4
1 2 3 4
operario
3
1 2 3
SAS
SAS
data da;
input maquina $ operario $ superficie;
cards;
1 1 79
1 1 62
1 2 94
1 2 74
1 3 46
1 3 57
2 1 92
2 1 99
2 2 85
2 2 79
2 3 76
2 3 68
3 1 88
3 1 75
3 2 53
3 2 56
3 3 46
3 3 57
4 1 36
4 1 53
4 2 40
4 2 56
4 3 62
4 3 47
;
proc glm;
class maquina operario;
model superficie=maquina operario(maquina);
random operario(maquina)/test;
run;
Sistema SAS
Procedimiento GLM
6
Nmero de observaciones 24
Sistema SAS
Procedimiento GLM
Variable dependiente: superficie
Fuente
DF
Suma de
cuadrados
Cuadrado de la
media
F-
Valor
Pr > F
Modelo
11
6435.333333
585.030303
6.92
0.0012
Error
12
1014.000000
84.500000
Total
correcto
23
7449.333333
R-cuadrado
Coef Var
Raiz MSE
superficie Media
0.863880
13.96312
9.192388
65.83333
Fuente
DF
Tipo I SS
Cuadrado de la
media
F-
Valor
Pr > F
maquina
3
3617.666667
1205.888889
14.27
0.0003
operario(maquina)
8
2817.666667
352.208333
4.17
0.0134
Fuente
DF
Tipo III SS
Cuadrado de la
media
F-
Valor
Pr > F
maquina
3
3617.666667
1205.888889
14.27
0.0003
operario(maquina)
8
2817.666667
352.208333
4.17
0.0134
1
Sistema SAS
Procedimiento GLM
Fuente
Tipo III Cuadrado de media esperado
maquina
Var(Error) + 2 Var(operario(maquina)) + Q(maquina)
operario(maquina)
Var(Error) + 2 Var(operario(maquina))
Sistema SAS
Procedimiento GLM
Tests de hiptesis para el anlisis del modelo mixto de la varianza
Variable dependiente: superficie
Fuente
DF
Tipo III SS
Cuadrado de la media
F-Valor
Pr > F
maquina
3
3617.666667
1205.888889
3.42
0.0728
Error
8
2817.666667
352.208333
Error: MS(operario(maquina))
Fuente
DF
Tipo III SS
Cuadrado de la
media
F-
Valor
Pr > F
operario(maquina)
8
2817.666667
352.208333
4.17
0.0134
Error: MS(Error)
12
1014.000000
84.500000
Como estos dos nuevos cuadros son reemplazados por los que se muestran o son
generados normalmente por el SAS ya que estos no se encuentran bajos los
requerimientos del diseo de modelos anidados.
2
Diseo de Parcelas Divididas
En los experimentos factoriales, a veces, un factor requiere ms material experimental
para su evaluacin que otro factor. En las pruebas de campo en agronoma y
horticultura, un factor como los mtodos de cultivo puede requerir el uso de algn tipo
de equipo que es ms adecuado en parcelas grandes; mientras que otro factor, como
nivel de fertilidad, se puede aplicar con facilidad a una parcela mucho ms pequea. La
parcela de tratamiento de mtodos de cultivo ms grande, la parcela completa, se divide
en subparcelas ms pequeas a las que se les aplican distintos tratamientos de cultivo o
fertilidad. Esto se conoce como diseo de parcelas divididas y este ejemplo particular
tiene dos unidades experimentales de diferente tamao.
Anlisis para diseos de parcelas divididas
Modelo de parcelas divididas
Para disear parcelas divididas se usa una formulacin de modelo mixto que refleje las
distintas varianzas del error experimental para las subparcelas y la parcela completa, lo
que incluye los efectos del error aleatorio por separado para ambas. Si el factor de
tratamiento de la parcela completa se coloca en un diseo de bloques totalmente
aleatorizado el modelo lineal es:
Donde p es la media general, a
i
es el efecto del i-simo nivel del factor A, p
k
es el efecto
del k-simo bloque, d
lk
es el error aleatorio de la parcela completa, Bj es el efecto del j-
simo nivel del factor B, () es el efecto de interaccin entre ambos factores y eVk es
el error aleatorio de la subparcela. Se supone que los errores de la parcela completa y la
subparcela son errores aleatorios independientes con distribucin normal con media O y
varianzas respectivas. La asignacin aleatoria de los tratamientos a las unidades
experimentales justifica la suposicin de independencia para los dos errores aleatorios y
la correlacin igual entre los errores de las unidades en la subparcelas dentro de una
misma parcela completa.
Anlisis de varianza para parcelas divididas
En la tabla 14.1 se muestran los cuadrados medios esperados para el anlisis de varianza
mediante el mtodo mixto de la ecuacin (14.1), con los efectos fijos para los factores A
y B.
3
Tabla 14.1 Cuadrados medios esperados para el anlisis de varianza de parcelas
divididas
4
Solucin:
SAS:
data dpd;
input nitrogeno $ bloque $ hierba rpta;
cards;
nitrogeno bloque hierba rpta
1 1 1 3.8
1 2 1 3.9
1 1 2 5.3
1 2 2 5.4
1 1 3 5.9
1 2 3 4.3
2 1 1 5.2
2 2 1 6
2 1 2 5.6
2 2 2 6.1
2 1 3 5.4
2 2 3 6.2
3 1 1 6
3 2 1 7
3 1 2 5.6
3 2 2 6.4
3 1 3 7.8
3 2 3 7.8
4 1 1 6.8
4 2 1 7.9
4 1 2 8.6
4 2 2 8.6
4 1 3 8.5
4 2 3 8.4
;
proc glm;
class nitrogeno bloque hierba;
model rpta=bloque hierba bloque*hierba nitrogeno hierba*nitrogeno/ss1;
Test H = bloque hierba
E = bloque*hierba ;
run;
5
The SAS System
The GLM Procedure
Class Level Information
Class Levels Values
4
1 2 3 4 nitrogeno
2
1 2 bloque
3
1 2 3 hierba
25 Number of observations
NOTE: Due to missing values, only 24 observations can be used in this analysis.
The SAS System
The GLM Procedure
Dependent Variable: rpta
Source DF Sum of Squares Mean Square F Value Pr > F
14
46.76583333
3.34041667
14.93
0.0002 Model
9
2.01375000
0.22375000
Error
23
48.77958333
Corrected Total
R-Square Coeff Var Root MSE rpta Mean
0.958717
7.444284
0.473022
6.354167
Source DF Type I SS Mean Square F Value Pr > F
1
0.51041667
0.51041667
2.28
0.1652 bloque
2
3.81583333
1.90791667
8.53
0.0084 hierba
2
0.96083333
0.48041667
2.15
0.1728 bloque*hierba
3
37.32458333
12.44152778
55.60
<.0001 nitrogeno
6
4.15416667
0.69236111
3.09
0.0626 nitrogeno*hierba
6
Tests of Hypotheses Using the Type I MS for bloque*hierba as an Error
Term
Source DF Type I SS Mean Square F Value Pr > F
1
0.51041667
0.51041667
1.06
0.4110 bloque
2
3.81583333
1.90791667
3.97
0.2012 hierba
Lo que se tiene que hacer es reemplazar este cuadro por en anterior es decir para
el caso de bloque y hierba cambiar los valores que esta aqu por los que salen
arriba, las 2 ultimas lneas de la sintaxis son las que generan este cuadro , ya que
se requiere de un diseo de bloques aleatorizado.
Minitab:
7
General Linear Model: rpta versus bloque, hierba, nitrogeno
Factor Type Levels Values
bloque fixed 2 1, 2
hierba random 3 1, 2, 3
nitrogeno fixed 4 1, 2, 3, 4
Analysis of Variance for rpta, using Adjusted SS for Tests
Source DF Seq SS Adj SS Adj MS F P
bloque 1 0.5104 0.5104 0.5104 1.06 0.411
hierba 2 3.8158 3.8158 1.9079 2.01 0.238 x
bloque*hierba 2 0.9608 0.9608 0.4804 2.15 0.173
nitrogeno 3 37.3246 37.3246 12.4415 17.97 0.002
hierba*nitrogeno 6 4.1542 4.1542 0.6924 3.09 0.063
Error 9 2.0138 2.0138 0.2238
Total 23 48.7796
x Not an exact F-test.
S = 0.473022 R-Sq = 95.87% R-Sq(adj) = 89.45%
Unusual Observations for rpta
Obs rpta Fit SE Fit Residual St Resid
5 5.90000 5.21250 0.37396 0.68750 2.37 R
6 4.30000 4.98750 0.37396 -0.68750 -2.37 R
R denotes an observation with a large standardized residual.
Esta es un variante como pueden apreciar los resultados son similares, es decision suya
usar cualiqer de estas 2 variantes ya sea por SAS o por minitab.