Sie sind auf Seite 1von 26

“Año de la lucha contra la corrupción e

impunidad”

UNIVERSIDAD NACIONAL DE SAN


AGUSTÍN
FACULTAD DE INGENIERÍA DE PROCESOS
ESCUELA PROFESIONAL DE
INGENIERÍA AMBIENTAL

“EVALUACIÓN CONTINUA DE
ESTADISTICA.”
CURSO: Estadística Y Diseños Experimentales
DOCENTE:
Ing. Luis Álvarez Soto

ALUMNO:

Luna Roldán, María Alejandra.


Arequipa- Perú
2019

1
EVALUACION CONTINUA
1.- Se toman 8 medidas del diámetro interno de los anillos para pistones del motor de
un automóvil. Los datos (en mm) son:
74,001 74.003 74.015 74.000 74.005 74.002 74.005 74.004
Construya un diagrama de puntos y realice un comentario con respecto a los datos.

Diagrama de Puntos
3
Número de datos

2
1
0
73.998 74 74.002 74.004 74.006 74.008 74.01 74.012 74.014 74.016
Diametros internos de los anillos en mm.

Diagrama de Puntos - Diámetro interno

Número de observaciones: 8
Media: 74004,4
Desviación estándar: 4,65794

Comentario: El valor de la moda para el diámetro interno de los anillos de los pistones es
74.005mm y el valor que se encuentra más alejado al promedio es 74.0015mm.

2.- En una prueba de Laboratorio se mide la fuerza de tirantez de un conector. Los


siguientes son los datos obtenidos (y registrados en orden) para 40 muestras bajo
prueba (de arriba hacia abajo y de izquierda a derecha).
241 220 249 209
258 194 251 212
237 245 238 185
210 209 210 187
194 201 198 218
225 195 199 190
248 255 183 175
203 245 213 178
195 235 236 175
249 220 245 190

2
a.- Construya una gráfica de series de tiempo, para estos datos. Comente el resultado.

Gráfico Secuencias Cronológicas

270

250
Fuerza de tirantez

230

210

190

170
0 10 20 30 40
Fila

Comentario: Se observa que los datos tomados tienen la forma de una función senozoidal, por lo
tanto, todas las experimentaciones al ser graficadas secuencialmente, tienden a formar ciclos cada vez
más irregulares, lo que nos permite suponer la diversidad de prototipos con diferentes fuerzas de
tirantez.

3.- Un artículo publicado en una revista de ingeniería, presenta datos de viscosidad de un lote
de cierto proceso químico. La siguiente es una muestra de estos datos.
13. 14. 15. 15. 14. 14. 15. 14. 14. 14. 14. 16. 13. 15. 12. 14. 14. 15. 15. 16.
3 5 3 3 3 8 2 5 6 1 3 1 1 5 6 6 3 4 2 8
14. 13. 15. 14. 15. 15. 15. 13. 14. 15. 15. 15. 15. 16. 14. 15. 17. 14. 14. 14.
9 7 2 5 3 6 8 3 1 4 2 2 9 5 8 1 0 9 8 0
15. 13. 15. 13. 14. 14. 14. 14. 16. 16. 14. 16. 14. 15. 14. 15. 14. 16. 14. 15.
8 7 1 4 1 8 3 3 4 9 2 9 9 2 4 2 6 4 2 7
16. 14. 13. 15. 14. 15. 16. 13. 15. 14. 14. 14. 13. 13. 15. 14. 12. 16. 16. 15.
0 9 6 3 3 6 1 9 2 4 0 4 7 8 6 5 8 1 6 6

a) Construya una tabla de frecuencias con los datos de viscosidad del proceso químico.
Límite Límite Frecuencia Frecuencia Frecuencia
Clase Inferior Superior Punto Medio Frecuencia Relativa Acumulada Rel. Acum.
menor o igual 12.0 0 0.0000 0 0.0000
1 12.0 12.6 12.3 1 0.0125 1 0.0125
2 12.6 13.2 12.9 2 0.0250 3 0.0375
3 13.2 13.8 13.5 8 0.1000 11 0.1375
4 13.8 14.4 14.1 17 0.2125 28 0.3500
5 14.4 15.0 14.7 15 0.1875 43 0.5375
6 15.0 15.6 15.3 21 0.2625 64 0.8000
7 15.6 16.2 15.9 8 0.1000 72 0.9000
8 16.2 16.8 16.5 5 0.0625 77 0.9625
9 16.8 17.4 17.1 3 0.0375 80 1.0000
10 17.4 18.0 17.7 0 0.0000 80 1.0000
mayor de 18.0 0 0.0000 80 1.0000

3
b) Grafique un histograma con la tabla de frecuencia anterior.

c) Grafique una ojiva de frecuencia acumulada, y determine el valor aproximado que


corresponde al valor del 80 % de los datos para la viscosidad.

Ojiva de Frecuencia
Acumulada
Frecuencia acumulada porcentual (%)

120
100
95
100 86

80 71

60
44
40
15
20
4
0
13.3 14.0 14.7 15.4 16.1 16.8 17.5
Viscocidad

4
d) Determine el percentil 30 y percentil 70.

Percentiles
5.0% 13.3
10.0% 13.7
25.0% 14.3
30.0% 14.3
50.0% 14.9
70.0% 15.3
75.0% 15.55
90.0% 16.25
95.0% 16.7

e) ¿Cuál es el valor del rango intercuartilico? Comente el resultado.


Rango 4.4
Rango Intercuartílico 1.25

Q1= 14.3
Q3=15.55
Entonces el Rango intercuartilico será:

𝑅𝑄 = 𝑄3 − 𝑄1 = 1,225

La dispersión de la distribución de viscosidades es de 1,225; es decir que los datos varían entre esa
distancia, este valor se usa para construir los diagramas de caja y bigote, que sirven para visualizar
la variabilidad de una variable y comparar distribuciones de la misma variable; además de ubicar
valores extremos.
f) Construya un diagrama de caja, con los datos de la tabla anterior.

Gráfico de Caja y Bigotes

12 13 14 15 16 17
viscosidad del proceso químico

5
g) ¿Cuál es el valor del promedio de los datos?

Recuento 80
Promedio 14.8988

h) Determine el valor de la desviación Estándar muestra


Desviación Estándar = 0.980376

i) Determine el valor de la mediana. Compare con el promedio. Explique si hubiera


diferencia.

Mediana 14.9
Promedio 14.8988
La diferencia se da porque el promedio es la sumatoria de todos los datos entre el número de
datos , mientras que la

j) ¿Cuál es el valor del coeficiente de asimetría? ¿Qué implica este valor? Comente
Coeficiente de asimetría = 0.07913789
Es el sesgo de la distribución, es decir el grado de asimetría alrededor de la mediana.

k) Determine el valor de la curtosis. ¿Este valor se puede vincular con alguna propiedad
de los datos?

Curtosis -0.262819
Curtosis Estandarizada -0.47984

Cuan más cerca estén los datos del promedio, implicarán más repetición o frecuencia tal como
lo define la curtosis de valor -0.262819.
4.- Se analizan los discos de policarbonato de un proveedor para determinar su resistencia a las
ralladuras y a los golpes. A continuación, se resumen los resultados obtenidos al analizar 100
muestras

Sean A: el evento donde el disco tiene una alta resistencia a los golpes y B evento donde el disco
tiene una alta resistencia a las ralladuras. Determine
a) El número de discos en A ∩ B,

6
b) El número de discos en A’

c) El número de discos en A U B. Dibuje un diagrama de Venn que represente los datos,


en cada uno de los casos.

d) Determine la probabilidad de :

 P(A)
 P(A’)
 P(A∩B)’
 P(AU B)
 P(A’U B)

5.- Se inspecciona un lote de 140 chips mediante la selección de una muestra de cinco de ellos.
Suponga que 10 chips no cumplen con los requerimientos del cliente.
a) ¿Cuál es el número de muestras distintas posibles?
Se seleccionan 5 chips al azar de los 140 chips. Entonces hallamos todas las formas posibles
de hacerlo:
𝐶5140 = 140.139.138.137.136 = 50 035 863 360
Se tiene cerca de 50 mil millones de posibilidades de muestra de 5 chips.

b) ¿Cuántas muestras de cinco contienen exactamente un chip que no cumple con los
requerimientos?

7
Debemos seleccionar 1 chip de los 10 chips que no cumplen con los requerimientos del
cliente y simultáneamente seleccionaremos 4 chips de los 130 que si cumplen con los
requerimientos. Ambos sucesos son independientes entre ellos.
𝐶110 . 𝐶4130 = 10. (130.129.128.127) = 2 726 131 200
Podemos obtener más de dos millones y medio de muestras que contengan exactamente un
chip que no cumple con los requerimientos.

c) ¿Cuántas muestras de cinco contienen exactamente un chip que cumple con los
requerimientos?
Para hallar las muestras precisadas, debemos seleccionar 1 chip de los 130 chips que cumplen
con los requerimientos y simultáneamente, 4 chips de los que no cumplen los requerimientos.
Ambos sucesos son mutuamente independientes.
𝐶1130 . 𝐶410 = 130. (10.9.8.7) = 655 200
Tenemos más de 6 mil muestras que contengan exactamente un chip que cumpla con los
requerimientos.

6.- En el problema 2, se realiza una prueba de Laboratorio y se mide la fuerza de tirantez de un


conector. Los siguientes son los datos obtenidos (y registrados en orden) para 40 muestras bajo
prueba (de arriba hacia abajo y de izquierda a derecha), determine si los datos provienen de
una distribución normal.
DATOS DISTRIBUCIÓN
NORMAL
241 0,00948765
FUERZA DE TIRANTEZ
258 0,003816563 DE UN CONECTOR
237 0,011002123 0.018
210 0,015462178
0.016
194 0,011002123
225 0,014748359 0.014

248 0,006890639 0.012


203 0,01400116 0.01
195 0,011372223
0.008
249 0,006541538
220 0,015584462 0.006
194 0,011002123 0.004
245 0,007977983
0.002
209 0,015316702
201 0,013418061 0
1 3 5 7 9 11 13 15 17 19 21 23 25 27 29 31 33 35 37 39
195 0,011372223
255 0,004632687
245 0,007977983
235 0,011736268
220 0,015584462

8
249 0,006541538
251 0,005867699 Normal
238 0,010627311
210 0,015462178
0,4 Media,Desv. Est.
198 0,012440751 0,1
199 0,012778461
183 0,006890639 0,3
213 0,015757287

densidad
236 0,011372223
0,2
245 0,007977983
209 0,015316702
212 0,015682986 0,1
185 0,007609676
187 0,00835095
218 0,015757287 0
-5 -3 -1 1 3 5
190 0,00948765
x
175 0,004349744
178 0,005230207
175 0,004349744
190 0,00948765

7.- Se utilizan dos máquinas para llenar botellas de plástico con detergente para maquinas
lavaplatos. Se sabe que las desviaciones estándar del volumen de llenado son σ1 = 0.10 onzas de
líquido, y σ2 = 0.15 onzas de líquido para las dos máquinas respectivamente., Se toman dos
muestras aleatorias n1 = 12 botellas de la maquina 1 y n2 = 10 botellas e la maquina 2. Los
volúmenes promedio de llenado son ẍ1 = 30.87 onzas de líquido y ẍ2 = 30.68 onzas de líquido.
¿Las dos máquinas tienen igual volumen de llenado de detergente?

MÁQUINA 1 MÁQUINA 2
σ1 0.1 σ2 0.15
n1 12 n2 10
̅𝟏
𝒙 30.87 ̅𝟐
𝒙 30.68

a) Construya un intervalo de confianza bilateral del 90 % para la diferencia entre las


medias del volumen de llenado.

𝟐 𝝈𝟐 𝝈𝟐 𝟐 𝝈𝟐 𝝈𝟐
𝒙𝟏− 𝒙𝟐 − 𝒛𝟏⁄ √ 𝟏 − 𝟐 ≤ 𝝁𝟏 − 𝝁𝟐 ≤ 𝒙𝟏− 𝒙𝟐 + 𝒛𝟏⁄ √ 𝟏 − 𝟐
𝟐 𝒏𝟏 𝒏𝟐 𝟐 𝒏𝟏 𝒏𝟐

Datos:
Promedio muestral 1 30.87

9
Promedio muestral 2 30.68
Desv est: 1 0.1
Desv est: 2 0.15
Tamaño de muestra 1 12
Tamaño de muestra 2 10
Confianza 90%
α/2 5%
Z 1.644853627

Límite inferior Límite


superior
0.09866494 0.26939297

b) Construya un intervalo de confianza bilateral del 95 % para la diferencia entre las


medias de volumen de llenado. Compare el ancho de este intervalo con el ancho del
calculado en el inciso a.
𝟐 𝝈𝟐𝟏 𝝈𝟐𝟐 𝟐 𝝈𝟐
𝟏 𝝈𝟐𝟐
𝒙𝟏− 𝒙𝟐 − 𝒛𝟏⁄ √ − ≤ 𝝁𝟏 − 𝝁𝟐 ≤ 𝒙𝟏− 𝒙𝟐 + 𝒛𝟏⁄ √ −
𝟐 𝒏𝟏 𝒏𝟐 𝟐 𝒏𝟏 𝒏𝟐

Datos:
Promedio muestral 1 30.87
Promedio muestral 2 30.68
Desv est: 1 0.1
Desv est: 2 0.15
Tamaño de muestra 1 12
Tamaño de muestra 2 10
Confianza 95%
α/2 3%
Z 1.959963985

Límite inferior Límite


superior
0.09539744 0.28460256

c) Construya un intervalo de confianza superior del 95 %, para la diferencia de medias


del volumen de llenado.

𝟐 𝝈𝟐 𝝈𝟐 𝟐 𝝈𝟐 𝝈𝟐
𝒙𝟏− 𝒙𝟐 − 𝒛𝟏⁄ √ 𝟏 − 𝟐 ≤ 𝝁𝟏 − 𝝁𝟐 ≤ 𝒙𝟏− 𝒙𝟐 + 𝒛𝟏⁄ √ 𝟏 − 𝟐
𝟐 𝒏𝟏 𝒏𝟐 𝟐 𝒏𝟏 𝒏𝟐

10
Datos:
Promedio muestral 1 30.87
Promedio muestral 2 30.68
Desv est: 1 0.1
Desv est: 2 0.15
Tamaño de muestra 1 12
Tamaño de muestra 2 10
Confianza 95%
α 5%
Z 1.644853627

Intervalo de confianza superior al 95 %


0.26939297

8.- Se piensa que la concentración del ingrediente activo de flotación, es afectada por el tipo de
catalizador utilizada en el proceso de fabricación. Se sabe que la desviación estándar de la
concentración activa es de 3 gr/lt, sin importar el tipo de catalizador utilizado. Se realizan 10
observaciones con cada catalizador, y se obtiene los datos siguientes:

Catalizador 1 57.9 66.2 65.4 65.4 65.2 62.6 67.6 63.7 67.2 71.0
Catalizador 2 66.4 71.7 70.3 69.3 64.8 69.6 68.6 69.4 65.3 68.8

Suponga que la concentración activa está distribuida normalmente y que la varianza de la


concentración activa de ambos tipos de catalizadores es desconocido

Catalizador 1 Catalizador 2
̅𝟏
𝒙 65.22 𝑥̅2 68.42
𝝈𝟏 3.44 𝜎2 2.22
𝒏𝟏 10 𝑛2 10

a) Encuentre un intervalo de confianza del 95 % para la diferencia entre las medias de las
concentraciones activas suponiendo que ambas varianzas son iguales.
Comparación de Medias
Intervalos de confianza del 95.0% para la media de CATALIZADOR 1: 65.22 +/- 2.46399
[62.756, 67.684]
Intervalos de confianza del 95.0% para la media de CATALIZADOR 2: 68.42 +/- 1.59096
[66.829, 70.011]
Intervalos de confianza del 95.0% intervalo de confianza para la diferencia de medias
Suponiendo varianzas iguales: -3.2 +/- 2.72394

INTERVALO DE CONFIANZA PARA LA DIFERENCIA DE MEDIAS:


[-5.92394, -0.47606]

11
b) Encuentre un intervalo de confianza del 95% para la diferencia entre las
concentraciones activas promedio, suponiendo que las varianzas no son iguales.
Comparación de Medias
Intervalos de confianza del 95.0% para la media de CATALIZADOR 1: 65.22 +/- 2.46399
[62.756, 67.684]
Intervalos de confianza del 95.0% para la media de CATALIZADOR 2: 68.42 +/- 1.59096
[66.829, 70.011]
Intervalos de confianza del 95.0% intervalo de confianza para la diferencia de medias
Sin suponer varianzas iguales: -3.2 +/- 2.75739

c) Compare la longitud del intervalo de confianza calculado en el inciso (a) con la longitud
del intervalo de confianza obtenido, con los datos y consideraciones anteriores (b); que
intervalo es mayor y por qué?

𝜎1 2 𝜎2 2 𝜎1 2 𝜎2 2
(𝑥̅1 − 𝑥̅2 ) − 𝑡0 ∗ √ + ≤ 𝜇1 − 𝜇2 ≤ (𝑥̅1 − 𝑥̅2 ) + 𝑡0 ∗ √ +
𝑛1 𝑛2 𝑛1 𝑛2

-5.9629 ≤ 𝜇1 − 𝜇2 ≤ -0.4371

ENTONCES 𝜇1 − 𝜇2 ∈ [−5.9629, − 0.4371]

Al 95% de confianza
DIFERENCIA DE LOS INTERVALOS

a) b)
5.4481 5.5259

Diferencia 0.0778

9.- Se investiga la temperatura de deflexión bajo carga para dos tipos diferentes de tubería de
plástico. Para ello se toman dos muestras aleatorias, cada una de 15 especímenes, anotando las
temperaturas de deflexión observadas (oF) . Los resultados son los siguientes:

Tipo 1 Tipo 2
206 193 192 177 176 198
188 207 210 197 185 188
205 185 194 206 200 189
187 189 178 201 197 203
194 213 205 180 192 192

12
Muestra 1 Muestra 2
Tam. Muestra 𝑛1 15 𝑛2 15
Promedio 𝑥1 196.4 𝑥2 192.07
Desv. Estan. 𝑠1 10.48 𝑠2 9.44
Varianza 𝑠12 109.83 𝑠22 89.07
Significancia 0.05

a) ¿Los datos apoyan la afirmación de que la temperatura de deflexión bajo carga para la
tubería de tipo 2 es mayor que para la tubería de tipo 1? Para llegar a una conclusión
utilice α = 0.05 y suponga que las varianzas de ambas poblaciones son iguales.
¿ 𝜇2 > 𝜇1 ? 𝑒𝑠 𝑙𝑜 𝑚𝑖𝑠𝑚𝑜 ¿ 𝜇1 < 𝜇2 ?

α= 0.05
𝐶𝑜𝑛 𝜎1 = 𝜎2 2
2

𝐻0 : 𝜇1 = 𝜇2
𝐻1 : 𝜇1 < 𝜇2

α= 0.05
𝑡𝑐𝑟𝑖𝑡𝑖𝑐𝑜 = 𝑡1−𝛼 , 𝑛1+𝑛2−2
= 𝑡0.975 , 28 = 2.4671
2

𝑅𝐶 = {𝑡 /𝑡 < −2.4671}
𝑥̅1 − 𝑥̅2
𝑡=
2 2
√𝑠𝑝 + 𝑠𝑝
𝑛1 𝑛2
(𝑛1 − 1)𝑠12 + (𝑛2 − 1)𝑠22 𝑠𝑝2 = 99.447619
𝑠𝑝2 =
𝑛1 + 𝑛2 − 2

𝑡= 1.19002349 ∉ 𝑅𝐶

Entonces se acepta Ho por lo tanto se rechaza Hi, es decir que la deflexión en la tubería 2 no es mayor
que de la tubería 1

b) Calcule un valor P para la prueba del inciso a.

𝑉𝑎𝑙𝑜𝑟 𝑃 = 𝑃(𝑡 > 1.19002349)


= 1 − 𝑃(𝑡 ≤ 1.19002349)
= 1 − 0.8761

P= 0.1239
Valor P = 0.1239 > 0.05 entonces se acepta Ho y esto es que la deflexion en la tuberia 2 no es
mayor que de la tuberia 1

13
c) Construya diagramas de caja para las dos muestras. ¿Estas graficas apoyan la hipótesis
de que las varianzas son iguales? Escriba una interpretación práctica para estas
gráficas.
Gráfico Caja y Bigotes

TIPO 1

TIPO 2

170 180 190 200 210 220

Interpretación: La nos muestra con los promedios, que la temperatura de deflexión de la


tubería del tipo 2 no es mayor que la de la tubería 1.

10.- El motor de un cohete se fabrica al unir dos tipos de propulsores; uno de encendido y
uno de impulso. Se piensa que la resistencia al esfuerzo cortante de la unión es una función
lineal de la edad en semanas del propulsor cuando se arma el motor. En la tabla siguiente
aparece la información recolectada.
Número de Resistencia y Edad x
observación (psi) (semanas)

1 2158.70 15.50
2 1678.15 23.75
3 2316.00 8.00
4 2061.30 17.00
5 2207.50 5.00
6 1708.30 19.00
7 1784.70 24.00
8 2575.00 2.50
9 2357.90 7.50
10 2277.70 11.00
11 2165.20 13.00
12 2399.55 3.75
13 1779.80 25.00
14 2336.75 9.75
15 1765.30 22.00
16 2053.50 18.00

14
17 2414.40 6.00
18 2200.50 12.50
19 2654.20 2.00
20 1753.70 21.50

a) Dibuje un diagrama de dispersión de los datos ¿Parece plausible utilizar como modelo
de regresión una línea recta?
Gráfico de RESISTENCIA (PSI) vs EDAD (SEMANAS)

2800

2600
RESISTENCIA (PSI)

2400

2200

2000

1800

1600
0 5 10 15 20 25
EDAD (SEMANAS)

Los puntos en el diagrama realizado parecen tener una asociación negativa, indicaría esto que
a medida que aumente la resistencia el tiempo disminuye.

b) Encuentre las estimaciones de mínimos cuadrados para la pendiente y la ordenada al


origen del modelo de regresión lineal simple.
Regresión Simple - RESISTENCIA (PSI) vs. EDAD (SEMANAS)
Variable dependiente: RESISTENCIA (PSI)
Variable independiente: EDAD (SEMANAS)
Lineal: Y = a + b*X
Coeficientes
Mínimos Estándar Estadístico
Cuadrados
Parámetro Estimado Error T Valor-P

Intercepto 2625.39 45.3468 57.8957 0.0000


Pendiente -36.9618 2.96681 -12.4584 0.0000
RESISTENCIA (PSI) = 2625.39 - 36.9618*EDAD (SEMANAS)  Modelo de regresión
lineal.Puesto que el valor-P en la tabla ANOVA es menor que 0.05, existe una relación
estadísticamente significativa entre RESISTENCIA (PSI) y EDAD (SEMANAS) con un
nivel de confianza del 95.0%.

15
Gráfico del Modelo Ajustado
RESISTENCIA (PSI) = 2625.39 - 36.9618*EDAD (SEMANAS)

2800

2600
RESISTENCIA (PSI)
2400

2200

2000

1800

1600
0 5 10 15 20 25
EDAD (SEMANAS)

c) Estime σ2 y los errores estándar de β0 y β1 de los regresores del modelo lineal.

Número de Resistencia Edad x Pronóstico


observación y (semanas)
(psi) Y^ e e^2 x^2
1 2158.7 15.5 2052.4821 106.2179 11282.2423 240.25
2 1678.15 23.75 1747.54725 -69.39725 4815.97831 564.0625
3 2316 8 2329.6956 -13.6956 187.569459 64
4 2061.3 17 1997.0394 64.2606 4129.42471 289
5 2207.5 5 2440.581 -233.081 54326.7526 25
6 1708.3 19 1923.1158 -214.8158 46145.8279 361
7 1784.7 24 1738.3068 46.3932 2152.32901 576
8 2575 2.5 2532.9855 42.0145 1765.21821 6.25
9 2357.9 7.5 2348.1765 9.7235 94.5464523 56.25
10 2277.7 11 2218.8102 58.8898 3468.00854 121
11 2165.2 13 2144.8866 20.3134 412.63422 169
12 2399.55 3.75 2486.78325 -87.23325 7609.63991 14.0625
13 1779.8 25 1701.345 78.455 6155.18703 625
14 2336.75 9.75 2265.01245 71.73755 5146.27608 95.0625
15 1765.3 22 1812.2304 -46.9304 2202.46244 484
16 2053.5 18 1960.0776 93.4224 8727.74482 324
17 2414.4 6 2403.6192 10.7808 116.225649 36
18 2200.5 12.5 2163.3675 37.1325 1378.82256 156.25
19 2654.2 2 2551.4664 102.7336 10554.1926 4
20 1753.7 21.5 1830.7113 -77.0113 5930.74033 462.25
42648.15

16
SSe 176601.8231
muestra 20
Sxx 1114.659375
σ2 9811.212392

d) Pruebe la hipótesis de Ho : β1 = 0 contra H1 : β1 ≠ 0 , utilizando el procedimiento del


análisis de la varianza con α = 0.05.

Bo=Y-B1*X 2621,49 <- Ordenada al origen


B1=Sxy/Sxx -36,86 <- Pendiente
SSE=Syy-B1*Sxy 173075,1380 <- Suma de cuadrados de los errores
MSE=SSE/(n-2) 9615,2854 <- Cuadrados medios de los errores

e) Determine el coeficiente de determinación del modelo. (R2).


Coeficiente de Correlación = -0.946616
R-cuadrada = 89.6081 porciento
R-cuadrado (ajustado para g.l.) = 89.0308 porciento

f) Obtenga los valores ajustados ŷi que corresponden a cada valor observado yi. Haga una
grafico de ŷ contra yi y haga un comentario sobre la forma que tendría esta grafica si
la relación lineal entre la resistencia al esfuerzo y la edad fuese perfectamente
determinista (sin error). ¿La grafica indica que la edad es un regresor razonable para
el modelo?
Ei Y.est
108.50 2050.20
-67.98 1746.13
-10.63 2326.63
66.38 1994.92
-229.70 2437.20
-212.91 1921.21
47.78 1736.92
45.66 2529.34
12.84 2345.06
11.64 2216.06
22.85 2142.35
-83.72 2483.27
79.74 1700.06
74.62 2262.13
-45.33 1810.63
95.44 1958.06
14.05 2400.35

17
39.72 2160.78
106.43 2547.77
-75.36 1829.06

Sí, debido a que se infiere que mientras al aumentar el y^ la resistencia aumenta, y con respecto a la
edad pasa lo contrario.
g) Realice una grafico de donde considere a ŷi como ordenada y al error como abscisas.

Grafico del Error frente al Y estimado


3000.00

2500.00

2000.00

1500.00

1000.00

500.00

0.00
-250.00 -200.00 -150.00 -100.00 -50.00 0.00 50.00 100.00 150.00

h) Si el modelo es adecuado, Estime la resistencia al esfuerzo promedio de un motor


construido con un propulsor armado hace 20 semanas.

𝑥 = 20
𝑌 = 𝐵0 + 𝐵1 𝑋 = 2641.49 − 36.86𝑋 = 2641.49 − 36.86(20) = 1884.3481

18
11.- Se efectúa un estudio sobre el desgaste de un cojinete (y) y su relación con x1 =
viscosidad del aceite y x2 = carga. Se obtienen los datos siguientes:
Y X1 X2
193 1.6 850
230 15.5 816
172 22.0 1058
91 43.0 1201
113 33.0 1357
125 40.0 1115

a. Realice una gráfica y verifique si los datos corresponderían a un modelo de regresión


lineal múltiple.

Diagrama de dispersión Para X1


50
40
30
20
10
0
0 50 100 150 200 250

Diagrama de dispersión para X2


1500

1000

500

0
0 50 100 150 200 250

Estadísticas de la regresión
Coeficiente de correlación múltiple 0,93
Coeficiente de determinación R^2 0,86
R^2 ajustado 0,77
Error típico 25,55
Observaciones 6

19
b. Ajuste un modelo de regresión lineal múltiple a los datos de la tabla anterior.

Coeficientes Error Estadístico Probabilidad Inferior Superior Inferior Superior


típico t 95% 95% 95,0% 95,0%
Intercepción 350.70 74.87 4.68 0.02 112.42 588.97 112.42 588.97
Variable X 1 -1.27 1.17 -1.08 0.36 -5.00 2.46 -5.00 2.46
Variable X 2 -0.15 0.09 -1.71 0.19 -0.44 0.13 -0.44 0.13

y = 350.697 - 1.2715 x1 - 0.15366 x2

c. Utilice el modelo para predecir el desgaste cuando x1 = 25 y x2 = 1000.


𝑌̂ = 350.70 − 1,27𝑋1 − 0,15𝑋2 =350.70-1.27(25)-0,15(1000) =165.25

d. Ajuste un modelo de regresión lineal múltiple con un término de interacción entre los
datos.

Error Estadístico
Parámetro Estimación Estándar T Valor-P
B0 125.202 197.03 0.635444 0.5901
B1 7.77765 7.48005 1.03979 0.4076
B2 0.0951177 0.219791 0.432765 0.7074
B3 -0.00920874 0.00753116 -1.22275 0.3460

ANAVA
Fuente Suma de Cuadrados Gl Cuadrado Medio Razón-F Valor-P
Modelo 12991.5 3 4330.5 7.73 0.1167
Residuo 1120.49 2 560.243
Total (Corr.) 14112.0 5

La ecuación del modelo ajustado es:

y = 125.202 + 7.77765 x1 + 0.0951177 x2 - 0.00920874 x1x2

e. Utilice el modelo del inciso d para hacer una predicción cuando x1 = 25 y x2 = 1000.
Compare esta predicción con el valor calculado en el inciso c.
y = 125.202 + 7.77765 x1 + 0.0951177 x2 - 0.00920874 x1x2
f.
Desgaste (y) = 125.202 + 7.77765 (25) + 0.0951177 (1000)- 0.00920874 (25000)
Desgaste (y) = 184.542
Se deduce que el desgaste del cojinete a una viscosidad de 25, una carga de 1000 y una
interacción entre viscosidad y carga se produce un desgaste de 184.542

g. Determine el coeficiente de determinación de ambos modelos.

𝑅 2 = 𝑟 2 ∗ 100 = 77

20
El 77% de la variación de desgaste está explicada por la asociación con la viscosidad del aceite y la
carga por el modelo de regresión.

12.- En el diseño y análisis de experimentos tercera edición, se describe un experimento en el


que el fabricante está interesado en la resistencia a la tensión de una fibra sintética, se sospecha
que la resistencia está relacionada con el porcentaje de algodón de la fibra. Para ello se emplea
5 niveles de porcentaje de algodón y se corren 5 réplicas en orden aleatorio, con ello se obtienen
los datos siguientes:
Porcentaje de Observaciones
Algodón
15 7 7 15 11 9
20 12 17 12 18 18
25 14 18 18 19 19
30 19 25 22 19 23
35 7 10 11 15 11
a. Dibuje diagramas de cajas comparativos, de los porcentajes de algodón.

Gráfico Caja y Bigotes

25

22

19
respuesta

16

13

10

7
15 20 25 30 35

b. Realice una prueba de hipótesis de:


H0: µ15 = µ20 = µ25 = µ30 = µ35
H1: µ15 ≠ µ20….(por lo menos uno diferente). Utilice un nivel de confianza del 95%.

21
Criterio de aceptación y rechazo:

Cuando Ho Es decir
NO SE Los tratamientos son
RECHAZA iguales
o bien

nivel de significancia
SE Existe al menos un
RECHAZA nivel que produce un
o bien efecto significativo al
𝛼.
nivel de significancia

f ( a 1),a ( n 1),  f ( 4),( 20), 0.05  2.87


Entonces:
14.76 > 2.87 o bien P-value < 0.05 Þ Se rechaza Ho

c. Realice una gráfica de probabilidad normal de los residuos.

Dispersión según Muestra

25

22

19
respuesta

16

13

10

7
15 20 25 30 35

d. De validar H1, realice la comparación de promedios por cualquier método de


comparación (Tuckey, LSD, Múltiples Duncan, a elección).

Pruebas de Múltiple Rangos

Método: 95.0 porcentaje LSD

22
Casos Media Grupos
Homogéneos
15 5 11.8 X
20 5 15.4 X
25 5 15.6 X
35 5 16.0 X
30 5 16.4 X

Contraste Sig. Diferencia +/- Límites

15 - 20 -3.6 7.03315
15 - 25 -3.8 7.03315
15 - 30 -4.6 7.03315
15 - 35 -4.2 7.03315
20 - 25 -0.2 7.03315
20 - 30 -1.0 7.03315
20 - 35 -0.6 7.03315
25 - 30 -0.8 7.03315
25 - 35 -0.4 7.03315
30 - 35 0.4 7.03315

13.- Un Ingeniero está interesado en el efecto que tiene la rapidez de corte (A), la configuración
(B) y el ángulo de corte (C), sobre la duración de la herramienta. Se eligieron dos niveles de
cada factor y se realiza un diseño factorial 23 con tres replicas. Los resultados se muestran a
continuación:
A B C Combinación Replicas
de
Tratamientos
- - - (1) 22 31 25
+ - - a 32 43 29
- + - b 35 34 50
+ + - ab 55 47 46
- - + c 44 45 38
+ - + ac 40 37 36
- + + bc 60 50 54
+ + + abc 39 41 47

a. Estime los efectos de los factores. ¿Cuáles de estos efectos resultan ser mayores? Se
recomienda, para esta etapa, utilizar gráficos.

23
Gráfico de Interacciones

50 angulo de corte
-1
1
47

44
duracion

41

38

35

32
-1 1
velocidad de corte

Gráfico de Interacciones

50 angulo de corte
-1
1
46
duracion

42

38

34

30
-1 1
configuracion

Gráfico de Interacciones

50 velocidad de corte
-1
1
47

44
duracion

41

38

35

32
-1 1
angulo de corte

24
b. Utilice el análisis de varianza, a fin de confirmar sus conclusiones para el inciso a. Nivel
de confiabilidad del 95%.
Análisis de Varianza para duracion - Suma de Cuadrados Tipo III

Fuente Suma de Cuadrados Gl Cuadrado Medio Razón-F Valor-P

EFECTOS PRINCIPALES

A:velocidad de corte 0.666667 1 0.666667 0.02 0.8837


B:configuracion 770.667 1 770.667 25.55 0.0001
C:angulo de corte 280.167 1 280.167 9.29 0.0077
INTERACCIONES
AB 16.6667 1 16.6667 0.55 0.4681
AC 468.167 1 468.167 15.52 0.0012
BC 48.1667 1 48.1667 1.60 0.2245
ABC 28.1667 1 28.1667 0.93 0.3483
RESIDUOS 482.667 16 30.1667
TOTAL (CORREGIDO) 2095.33 23
Todas las razones-F se basan en el cuadrado medio del error residual

El StatAdvisor
La tabla ANOVA descompone la variabilidad de duración en contribuciones debidas a varios
factores. Puesto que se ha escogido la suma de cuadrados Tipo III (por omisión), la contribución de
cada factor se mide eliminando los efectos de los demás factores. Los valores-P prueban la
significancia estadística de cada uno de los factores. Puesto que 3 valores-P son menores que 0.05,
estos factores tienen un efecto estadísticamente significativo sobre duración con un 95.0% de nivel
de confianza.

El StatAdvisor
La tabla ANOVA particiona la variabilidad de duración en piezas separadas para cada uno de los
efectos. entonces prueba la significancia estadística de cada efecto comparando su cuadrado medio
contra un estimado del error experimental. En este caso, 3 efectos tienen una valor-P menor que 0.05,
indicando que son significativamente diferentes de cero con un nivel de confianza del 95.0%.

c. Analice los residuos. ¿Existen problemas evidentes?


Si se trabaja en el nivel bajo de la rapidez de corte y se cambia de nivel bajo a nivel alto en
la configuración se observa que no hay un cambio en la resistencia.
Si se trabaja en el nivel alto de la rapidez de corte y se cambia del nivel bajo a nivel alto en
la configuración se nota un incremento en la resistencia. Se recomienda usar nivel alto de la
rapidez de corte y nivel alto de configuración.

d. Cuales niveles de a,b y c, recomendaría usted.


Es recomendable utilizar los niveles de:

A = (x1) AB = (x1x2) BC = (x2x3) Y ABC = (x1x2x3)

25
Por los resultados obtenidos anteriormente se puede concluir que: los efectos significativos son:
rapidez de corte, configuración, Angulo de corte y la interacción de rapidez de corte y la
configuración. Los niveles recomendados para obtener mayor resistencia son nivel alto de rapidez
de corte, nivel alto de configuración y nivel bajo del ángulo de corte.

26

Das könnte Ihnen auch gefallen