Beruflich Dokumente
Kultur Dokumente
La diferencia entre los factores de tratamiento y los de bloque radica en que estos últimos no
se incluyen en el experimento de manera explícita por que interese analizar su efecto, sino como
un medio para estudiar de manera adecuada y eficaz al factor de interés para no sesgar la
comparación. Estos entran al estudio con un nivel de importancia secundaria con respecto al
factor de interés y la inclusión de estos es un medio no un fin para lograr la comparación.
Source DF SS MS F P
Marca Atomizador 2 296.33 148.167 2.88 0.103
Día 5 281.33 56.267 1.09 0.421
Error 10 514.33 51.433
Total 17 1092.00
90 5
Residual
Percent
50 0
10 -5
1 -10
-10 -5 0 5 10 50 55 60 65 70
Residual Fitted Value
Residual
0
2.4
1.2 -5
0.0 -10
-10 -5 0 5 10 2 4 6 8 10 12 14 16 18
Residual Observation Order
11. En una empresa lechera se tienen varios silos para almacenar leche
(cisternas de 60 000 L). Un aspecto crítico para que se conserve la leche es
la temperatura de almacenamiento. Se sospecha que en algunos silos hay
problemas, por ello, durante cinco días se decide registrar la temperatura
a cierta hora crítica. Obviamente la temperatura de un día a otro es una
fuente de variabilidad que podría impactar la variabilidad total.
Aquí podemos observar que el valor-p de los silos es mayor que el valor de
significancia, es decir, que el valor-p de los silos es 0.246 y el nivel de
significancia es 0.05 y por lo tanto es mayor, lo que significa que
estadísticamente son iguales.
d) ¿La temperatura de un día a otro es diferente?
Por medio del problema anterior podemos observar que la temperatura es igual
porque el valor-p de los bloques es 0.609 y el nivel de significancia es 0.05 así
que se muestra que el valor-p del bloque es mayor que la significancia y por lo
tanto las temperaturas son iguales.
e) Revise residuos, ¿hay algún problema evidente?
En el recuadro de la grafica de probabilidad normal nos muestra que el supuesto
de normalidad se cumple porque los residuos o puntos estas más o menos cerca
de la línea recta. Por mientras que en el recuadro vs ajuste también se cumple
el supuesto de varianza porque los residuos se ubican aleatoriamente dentro de
una banda horizontal.
b) ¿Hay diferencias en las conclusiones anteriores y las del prob lema anterior?
Explique su respuesta.
Si hay diferencias, debido a que en las conclusiones anteriores las medias de los
diferentes tratamientos son diferentes de la media poblacional, y en este caso
del diseño completamente al azar, se acepta la H0 que las medias de los
tratamientos son iguales a la media poblacional.
c) ¿Con cuáles conclusiones se queda? Explique su respuesta.
Con las primeras que se obtuvieron en el diseño de bloques completo al azar
porque el factor de bloqueo que consideramos tiene influencia en la respuesta.
14. Una de las variables críticas en el proceso de ensamble del brazo lector
de un disco duro es el ángulo que éste forma con el cuerpo prin cipal de la
cabeza lectora. Se corre un experimento con el objetivo de comparar dos
equipos que miden dicho ángulo en unidades de radianes. Se decide
utilizar como factor de bloque a los operadores de los equipos. Los
resultados se muestran en la siguiente tabla:
Hipótesis:
Tratamiento:
𝐻0 : 𝜇𝐴 = 𝜇𝐵 = 𝜇𝐶 = 𝜇𝐷 = 𝜇𝐸 = 𝜇
𝐻𝐴 : 𝜇𝑖 ≠ 𝜇𝑗 para algún 𝑖 ≠ 𝑗
Bloques:
𝐻0 : 𝛾1 = 𝛾2 = 𝛾3 = 𝛾4 = 𝛾5 = 0
𝐻𝐴 : 𝛾𝑗 ≠ 0 para algún 𝑏𝑙𝑜𝑞𝑢𝑒 𝑗
RESUME Promedi
N Cuenta Suma o Varianza
Fila 1 5 12.8 2.56 3.148
Fila 2 5 23.3 4.66 3.068
Fila 3 5 -3 -0.6 18.915
Fila 4 5 23.7 4.74 3.203
Fila 5 5 -9.3 -1.86 9.728
Columna
1 5 15.4 3.08 5.197
Columna
2 5 16 3.2 6.18
Columna
3 5 16.3 3.26 6.078
Columna
4 5 1 0.2 11.085
Columna
5 5 -1.2 -0.24 39.653
ANÁLISIS DE
VARIANZA
Origen de Promedi
las Suma de Grados o de los Valor
variacion cuadrad de cuadrad Probabilid crítico
es os libertad os F ad para F
8.090957 0.0009115 3.006917
Filas 182.532 4 45.633 45 9 28
2.748581 0.0648652 3.006917
Columnas 62.008 4 15.502 56 9 28
Error 90.24 16 5.64
Total 334.78 24
En tratamiento:
Dado que 𝐹0 > 𝐹𝑐𝑟𝑖𝑡𝑖𝑐𝑎 , la hipótesis se rechaza, esto significa que la temperatura
en los silos es diferente.
En bloque:
Como 𝐹0 < 𝐹𝑐𝑟𝑖𝑡𝑖𝑐𝑎 , la hipótesis nula se acepta, esto se interpreta en que el día
no tiene un efecto en la medición de la temperatura.
Hipótesis:
Tratamiento:
𝐻0 : 𝜇𝐴 = 𝜇𝐵 = 𝜇𝐶 = 𝜇𝐷 = 𝜇𝐸 = 𝜇
𝐻𝐴 : 𝜇𝑖 ≠ 𝜇𝑗 para algún 𝑖 ≠ 𝑗
Bloques:
𝐻0 : 𝛾1 = 𝛾2 = 𝛾3 = 𝛾4 = 𝛾5 = 0
𝐻𝐴 : 𝛾𝑗 ≠ 0 para algún 𝑏𝑙𝑜𝑞𝑢𝑒 𝑗
Columna 1 5 20 4 0.875
Columna 2 5 22 4.4 0.8
Columna 3 5 20.5 4.1 2.925
Columna 4 5 13 2.6 2.675
Columna 5 5 18 3.6 0.3
ANÁLISIS DE
VARIANZA
Origen de Grados Promedio
las Suma de de de los Valor crítico
variaciones cuadrados libertad cuadrados F Probabilidad para F
Filas 4.46 4 1.115 0.69040248 0.60921239 3.00691728
Columnas 9.76 4 2.44 1.51083591 0.24602212 3.00691728
Error 25.84 16 1.615
Total 40.06 24
En tratamiento:
Dado que 𝐹0 < 𝐹𝑐𝑟𝑖𝑡𝑖𝑐𝑎 , la hipótesis se acepta, esto significa que la
temperatura en los silos no es diferente.
En bloque:
Como 𝐹0 < 𝐹𝑐𝑟𝑖𝑡𝑖𝑐𝑎 , la hipótesis nula se acepta, esto se interpreta en que el
día no tiene un efecto en la medición de la temperatura.
Para |MER-RTD|
Día 1 Día 2 Día 3 Día 4 Día 5
Silo
Dif. Dif. Dif. Dif. Dif.
A 1.4 1.2 0 0.5 0.6
B 1.4 0.4 0.3 0.2 0
C 1.2 2.6 1.7 3.9 10.6
D 0.6 1 0.1 1.8 2.3
E 4 3.6 2.9 6 10.3
Hipótesis:
Tratamiento:
𝐻0 : 𝜇𝐴 = 𝜇𝐵 = 𝜇𝐶 = 𝜇𝐷 = 𝜇𝐸 = 𝜇
𝐻𝐴 : 𝜇𝑖 ≠ 𝜇𝑗 para algún 𝑖 ≠ 𝑗
Bloques:
𝐻0 : 𝛾1 = 𝛾2 = 𝛾3 = 𝛾4 = 𝛾5 = 0
𝐻𝐴 : 𝛾𝑗 ≠ 0 para algún 𝑏𝑙𝑜𝑞𝑢𝑒 𝑗
Columna
1 5 8.6 1.72 1.732
Columna
2 5 8.8 1.76 1.708
Columna
3 5 5 1 1.6
Columna
4 5 12.4 2.48 5.997
Columna
5 5 23.8 4.76 27.703
ANÁLISIS DE
VARIANZA
Origen de Promedi
las Suma de Grados o de los Valor
variacion cuadrad de cuadrad Probabilid crítico
es os libertad os F ad para F
6.659989 0.0023574 3.006917
Filas 96.8136 4 24.2034 27 4 28
2.886617 0.0563964 3.006917
Columnas 41.9616 4 10.4904 23 3 28
Error 58.1464 16 3.63415
196.921
Total 6 24
En tratamiento:
Dado que 𝐹0 > 𝐹𝑐𝑟𝑖𝑡𝑖𝑐𝑎 , la hipótesis nula se rechaza esto se interpreta en que, la
diferencia entre las temperaturas de los termómetros, en los silos es diferente,
es decir, hay diferencias entre cada tratamiento.
En bloque:
Como 𝐹0 < 𝐹𝑐𝑟𝑖𝑡𝑖𝑐𝑎 , la hipótesis nula se acepta, esto se interpreta en que el día
no tiene un efecto en la medición de la temperatura.
En conclusión, se puede inferir por los resultados en los incisos anteriores, que
el termómetro Rtd es diferente al termómetro Mer, y considerando que sobre éste
último no hay duda de su funcionamiento, entonces, el termómetro Rtd, está
dañado y no registra las temperaturas correctas.
Ho: μ1 + μ2 + μ3 + μ4 + μ5= μ
Ha: μi ≠ μj para algún i ≠ j
Que también se puede expresar como:
Ho: τ1 = τ2 = τ3 = τ4 = τ5 = 0
Ha: τi ≠ 0 para algún i
c) Existen diferencias entre los tratamientos? Cuáles tratamientos son diferentes entre si?
Total 24 206.640
De esta tabla se observa que para Catalizador se obtuvo un valor-p = 0.000 < 0.05, por lo tanto
se rechaza Ho. Es decir que al menos dos de los catalizadores son diferentes.
d) Los factores de ruido, lote y día afectan el tiempo de reacción del proceso?
Del ANOVA se observa que para lote se obtuvo un valor-p = 0.348 > 0.05, por lo tanto se acepta
Ho. Es decir que no existe diferencia entre el tiempo de reacción de un proceso químico de los
lotes.
Por otro lado, del ANOVA se observa que para días se obtuvo un valor-p = 0.455 > 0.05, por lo
tanto se acepta Ho. Es decir que no existe diferencia entre el tiempo de reacción de un proceso
químico de los días.
e) Dibuje los gráficos de medias para los tratamientos, los lotes y los días. Cuál tratamiento es
el mejor?
Sería el tratamiento 5, puesto que tiene la media más baja respecto al tiempo de reacción del
proceso.
f) Verifique los supuestos del modelo, considerando que los datos se obtuvieron columna por
columna, día a día.
Residual Plots for Y
Normal Probability Plot of the Residuals Residuals Versus the Fitted Values
99
2
90
1
Residual
Percent
50 0
-1
10
-2
1
-3.0 -1.5 0.0 1.5 3.0 2 4 6 8 10
Residual Fitted Value
Residual
3.0 0
-1
1.5
-2
0.0
-2 -1 0 1 2 2 4 6 8 10 12 14 16 18 20 22 24
Residual Observation Order
En la gráfica 1 (Normal Probability Plot of the Residuals) se han graficado los residuos y se
observa que estos siguen una distribución normal ya que tienden a quedar alineados en una
línea recta.
En la gráfica 2 (Residuals Versus the Fitted Values) se han graficado los predichos contra los
residuos y se observa que los puntos se distribuyen de manera aleatoria en una banda
horizontal (sin ningún patrón claro y contundente), por lo que se cumple el supuesto de que
los tratamientos tienen igual varianza.
El nombre del diseño es uno de tipo multigrupo completamente al azar, el modelo es de tipo
unifactorial de efectos fijos, no-equilibrado y las hipótesis adecuadas son:
F)
RESPUESTA
20. Cuando se comparan varios fertilizantes o diferentes variedades de
cierto cultivo, es típico que se deba considerar el gradiente de fertilidad del
suelo (factor columna) o los efectos residuales de cultivos previos (factor
renglón). Considerando estos factores de bloque, Gomez y Gomez (1984)
plantean un experimento en cuadro latino para comparar, en cuanto a
rendimiento en toneladas por hectárea, tres variedades de maíz híbrido (A,
B, C) y una variedad control (C). Para ello, se utiliza un campo agrícola
cuadrado de 16 hectáreas, dividido en parcelas de una hectárea. Los datos
de rendimiento obtenidos en cada parcela se muestran a continuación:
a) ¿Existen diferencias en los rendimientos de las diferentes variedades de
maíz?
Debido a que le Valor-p es menos que la significancia observada para el modelo
0.025< 0.05 se afirma que si existen diferencias entre los tratamientos.
b) ¿Cuál de los factores de bloque tuvo efectos?
El gradiente de fertilidad del suelo
c) ¿Se habrían detectado las mismas diferencias en los tratamientos con un
diseño completamente al azar?
No, porque en este tipo de diseño en cuadro latino se controlan dos factores de
bloqueo y se tienen cuatro fuentes de variabilidad para el modelo que pueden
afectar la respuesta observada.
d) ¿Y con un diseño en bloques completos al azar?
No, ya que no contempla la posibilidad de comparar más de 1 factor
21. Se quieren comparar tres dietas (A, B, C) a base de proteínas de origen
vegetal utilizando 18 ratas de laboratorio de una misma camada. Primero
se observa por un tiempo el apetito para formar tres grupos de seis ratas,
según su voracidad; y cada uno de estos grupos se clasifica a su vez en
tres grupos de dos ratas, de acuerdo a su peso inicial. Se plantea un
experimento donde la variable de respuesta es el peso en gramos ganado
por las ratas después de cierto periodo, con los siguientes resultados:
a) Analice los datos. ¿Cuáles de los factores influyen en el peso ganado por las
ratas?
El tipo de análisis es Diseño en cuadro latino (DCL), cuyo modelo es:
𝑌𝑖𝑗𝑙 = 𝜇 + 𝜏𝑖 + 𝛾𝑗 + 𝛿𝑙 + 𝜀𝑖𝑗𝑙
Hipótesis:
Tratamiento:
𝐻0 : 𝜇𝐴 = 𝜇𝐵 = 𝜇𝐶 = 𝜇
𝐻𝐴 : 𝜇𝑖 ≠ 𝜇𝑗 para algún 𝑖 ≠ 𝑗
Bloque 1:
𝐻0 : 𝛾1 = 𝛾2 = 𝛾3 = 0
𝐻𝐴 : 𝛾𝑗 ≠ 0 para algún 𝑏𝑙𝑜𝑞𝑢𝑒 𝑗
Bloque 2:
𝐻0 : 𝛾1 = 𝛾2 = 𝛾3 = 0
𝐻𝐴 : 𝛾𝑗 ≠ 0 para algún 𝑏𝑙𝑜𝑞𝑢𝑒 𝑗
ANÁLISIS DE VARIANZA
Grados Promedio
Origen de las Suma de de de los Valor crítico
variaciones cuadrados libertad cuadrados F para F
Tratamiento 6432 2 3216 99.4639175 6.94427191
Peso inicial 232.66666
(B1) 7 2 116.333333 3.59793814 6.94427191
Voracidad 4932.6666
(B2) 7 2 2466.33333 76.2783505 6.94427191
64.666666
Error 7 2 32.3333333
Total 11662 8
En tratamiento:
Dado que 𝐹0 > 𝐹𝑐𝑟𝑖𝑡𝑖𝑐𝑎 , la hipótesis nula se rechaza, es decir, los tratamientos
(dietas) son diferentes entre sí.
En bloque 1:
Como 𝐹0 < 𝐹𝑐𝑟𝑖𝑡𝑖𝑐𝑎 , la hipótesis nula se acepta, es decir, que el peso inicial no
tiene un efecto en el resultado.
En bloque 2:
Como 𝐹0 > 𝐹𝑐𝑟𝑖𝑡𝑖𝑐𝑎 , la hipótesis nula se rechaza, es decir, que la voracidad de
las ratas si es un factor que influye en los resultados.
Bloques
𝐻0 : 𝛾1 = 𝛾2 = 𝛾3 = 0
𝐻𝐴 : 𝛾𝑗 ≠ 0 para algún 𝑏𝑙𝑜𝑞𝑢𝑒 𝑗
Análisis de varianza de dos factores con una sola muestra por grupo
Total 11662 8
En tratamiento:
Dado que 𝐹0 > 𝐹𝑐𝑟𝑖𝑡𝑖𝑐𝑎 , la hipótesis nula se rechaza, es decir, los tratamientos
(dietas) son diferentes entre sí.
En bloque:
Como 𝐹0 > 𝐹𝑐𝑟𝑖𝑡𝑖𝑐𝑎 , la hipótesis nula se rechaza, es decir, que él apetito si influye
en el resultado.
Es decir los resultados siguen siendo los mismos.
Coeficientes
Datos en
i Shapiro- xn-i+j-xi ai(xn-i+j-xi)
orden
Wilks
1 50 0.5888 14 8.2432
2 51 0.3244 11 3.5684
3 53 0.1976 8 1.5808
4 55 0.0947 4 0.3788
5 58 Σ 13.7712
6 59
7 61
8 62
9 64
𝑠 2 = 3680.125
Entonces 𝑊 = 0.00644
Y de tablas 𝑊𝑐𝑟𝑖𝑡𝑖𝑐𝑎 = 0.978
Por lo tanto si 𝑊𝑐𝑟𝑖𝑡𝑖𝑐𝑎 > 𝑊 la hipótesis nula se acepta. Estos dato provienen
de una distribución normal.
Varianza constante
Como los datos tienen una distribución normal se utiliza el estadístico de
Bartlett.
𝐻0 : 𝜎𝐴 2 = 𝜎𝐵 2 = 𝜎3 2
𝐻𝐴 : 𝜎𝑖 2 ≠ 𝜎𝑗 2 para algún 𝑖 ≠ 𝑗
𝑞
𝜒0 2 = 2.3026
𝑐
Dónde:
𝑘
1
𝑐 =1+ [∑(𝑛𝑖 − 1)−1 − (𝑁 − 𝑘)−1 ]
3(𝑘 − 1)
𝑖=1
𝑘
Para tratamiento:
-
χ2= 11370.2924
De tablas 𝜒 2 = 5.991
Por lo tanto, como 𝜒 2 𝑡𝑎𝑏𝑙𝑎𝑠 < 𝜒 2 0 entonces, la hipótesis nula se rechaza, esto
quiere decir que no existe Homocedasticidad en los datos.
Para bloque:
Σ
si2 1252 1546.33333 566.333333 3364.66667
log si2 3.09760433 3.18930312 2.75307212 9.03997957
log
sp2= 1121.55556 sp2= 3.04982079
q= 0.2189656
c= 1.11111111
χ2= 0.45377118
De tablas 𝜒 2 = 5.991
Por lo tanto, como 𝜒 2 𝑡𝑎𝑏𝑙𝑎𝑠 > 𝜒 2 0 entonces, la hipótesis nula se acepta, esto
quiere decir que hay homogeneidad de varianza en los datos con respecto a los
bloques.
Independencia
El método analítico de comprobar el supuesto de independencia se realiza con
la prueba Durbin-Watson.
𝐻0 : 𝜌 = 0 (𝑛𝑜 ℎ𝑎𝑦 𝑐𝑜𝑟𝑟𝑒𝑙𝑎𝑐𝑖ó𝑛)
𝐻𝐴 : 𝜌 ≠ 0
∑𝑛𝑖=2(𝑒𝑖 − 𝑒𝑖−1 )2
𝑑=
∑𝑛𝑖=1(𝑒𝑖 )2
independencia
Datos yi ei e i2 (ei-ei-1)2
1 183 209.333333 -26.33 693.44
2 217 209.333333 7.67 58.78 1156
3 228 209.333333 18.67 348.44 121
4 113 145.333333 -32.33 1045.44 2601
5 142 145.333333 -3.33 11.11 841
6 181 145.333333 35.67 1272.11 1521
7 139 165.333333 -26.33 693.44 3844
8 159 165.333333 -6.33 40.11 400
9 198 165.333333 32.67 1067.11 1521
Σ 5230.000 12005.000
𝑑 = 2.2954
De las tablas no viene el valor correspondiente, para 𝑝 = 2 y 𝑛 = 9, por lo tanto,
no se pudo concluir el método analítico.
Gráficamente: en base al valor de 𝑅 2 se puede concluir que no hay correlación
entre los datos.
525
500
475
Respuesta
450
425
400
375
350
1 2 3 4 5 6 7
Vaca
De tal forma, los intervalos de confianza de las vacas se traslapan por lo que sus
respuestas medias son iguales estadísticamente.
500
Respuesta
450
400
350
1 2 3 4 5 6 7
período
De tal forma, los intervalos de confianza de los períodos se traslapan por lo que
sus respuestas medias son iguales estadísticamente.
Interval Plot of Respuesta vs % lisina
95% CI for the Mean
550
500
450
Respuesta
400
350
300
1 2 3 4 5 6 7
% lisina
550
500
Respuesta
450
400
350
300
1 2 3 4 5 6 7
% proteina
50 0
-25
10
-50
1
-50 -25 0 25 50 300 400 500 600
Residual Fitted Value
12 50
25
Frequency
9
Residual
0
6
-25
3
-50
0
-60 -30 0 30 60 1 5 10 15 20 25 30 35 40 45
Residual Observation Order