Beruflich Dokumente
Kultur Dokumente
GEOESTADISTICA
(Profesor (a) Aguilar Rivera Rosa María)
PROBLEMARIO 1° PARCIAL
2PM1
Fecha de entrega: 24-08-2018
2
1. El artículo citado en el problema anterior también presenta las siguientes observaciones de resistencia en
cilindros:
6.1 5.8 7.8 7.1 7.2 9.2 6.6 8.3 7.0 8.3
7.8 8.1 7.4 8.5 8.9 9.8 9.7 14.1 12.6 11.2
a. Trace un diagrama comparativo de tallo y hojas, de los datos para vigas y cilindros y a continuación
conteste las preguntas de los incisos (b), (c), y (d) del problema anterior para las observaciones con
cilindros.
Concreto cilindros
9 5 8
88533 6 16
98877643200 7 012488
Tallo : unidades
721 8 13359 Hojas : decimas
770 9 278
7 10
863 11 2
12 6
13
14 1
Unidad de hoja = 0.1
b. ¿En qué aspectos se parecen los dos lados del diagrama? ¿Hay diferencias obvias entre las
observaciones para vigas y para cilindros?
6 7 8 9 10 11 12 13 14
C2
6. Las propiedades mecánicas permisibles para diseño estructural de vehículos aeroespaciales metálicos,
requiere un método aprobado para analizar estadísticamente los datos de prueba empíricos. En el artículo
“Establishing Mechanical Property Allowables for Metals” (J. of Testing and Evaluation, 1998: 293 –
299), se emplearon los datos adjuntos de resistencia última a la tensión (ksi) como base para superar
dificultades en el desarrollo del método.
122.2 124.2 124.3 125.6 126.3 126.5 126.5 127.2 127.3 127.5 127.9
128.6 128.8 129.0 129.2 129.4 129.6 130.2 130.4 130.8 131.3 131.4
131.4 131.5 131.6 131.6 131.8 131.8 132.3 132.4 132.4 132.5 132.5
132.5 132.5 132.6 132.7 132.9 133.0 133.1 133.1 133.1 133.1 133.2
133.2 133.2 133.3 133.3 133.5 133.5 133.5 133.8 133.9 134.0 134.0
134.0 134.0 134.1 134.2 134.3 134.4 134.4 134.6 134.7 134.7 134.7
134.8 134.8 134.8 134.9 134.9 135.2 135.2 135.2 135.3 135.3 135.4
135.5 135.5 135.6 135.6 135.7 135.8 135.8 135.8 135.8 135.8 135.9
135.9 135.9 135.9 136.0 136.0 136.1 136.2 136.2 136.3 136.4 136.4
136.6 136.8 136.9 136.9 137.0 137.1 137.2 137.6 137.6 137.8 137.8
137.8 137.9 137.9 138.2 138.2 138.3 138.3 138.4 138.4 138.4 138.5
138.5 138.6 138.7 138.7 139.0 139.1 139.5 139.6 139.8 139.8 140.0
140.0 140.7 140.7 140.9 140.9 141.2 141.4 141.5 141.6 142.9 143.4
143.5 143.6 143.8 143.8 143.9 144.1 144.5 144.5 147.7 147.7
a. Construya un diagrama de tallo y hojas de los datos eliminando (truncando) primero el dígito de las
decenas y luego repitiendo cada valor del tallo cinco veces (una vez para las hojas 1 y 2, una segunda
vez para las hojas 3 y 4, etc.) ¿Por qué es relativamente fácil identificar un valor de resistencia
representativo?
12 2
12 445
12 6667777
12 889999
13 00011111111
13 2222222222333333333333333
13 44444444444444444455555555555555555555
13 6666666666667777777777
13 888888888888999999
14 0000001111
14 2333333
14 444
14 77
4
➢ POR LA SIMETRIA SE OBSERVA EL VALOR REPRESENTATIVO, ESTE SE ENCUENTRA
ENTRE 134 Y 135
b. Construya un histograma usando las clases de igual amplitud con la primera clase con un límite
inferior de 122 y un límite superior de 124. Luego comente acerca de cualquier característica
interesante del histograma.
RESISTENCIA A LA TENSION
35
30
25
Frecuencia
20
15
10
0
124 128 132 136 140 144 148
C2
➢ NO TIENE HUECOS
➢ EL VALOR REPRESENTATIVO ES 130
➢ LIGERA SIMETRIA
➢ POCA DISPERCION
7. En el artículo “Study on the life Distribution of Microdrills” (J. of Engr. Manufacture, 2002: 301- 305)
aparecen las observaciones siguientes, listadas en orden creciente, del tiempo de vida de un taladro (número
de agujeros que maquina un taladro antes de romperse) cuando se hacen agujeros en cierta aleación de
latón.
11 14 20 23 31 36 39 44 47 50
59 61 65 67 68 71 74 76 78 79
81 84 85 89 91 93 96 99 101 104
105 105 112 118 123 136 139 141 148 158
161 168 184 206 248 263 289 322 388 513
5
a. ¿Por qué no se puede basar una distribución de frecuencias en los intervalos de clase 0 -50, 50 – 100,
100 – 150, etc.?
Estadísticas
Variable Mínimo Máximo Rango
C2 11.0 513.0 502.0
√50 = 7.07
502
= 71.71
7
Histograma de C2
20
15
Frecuencia
10
0
11.0000000 1.5299E+02 2.9497E+02 4.3696E+02 5.7895E+02
C2
6
c. Construya una distribución de frecuencias e histograma de logaritmos naturales de las observaciones
de tiempo de vida media y comente acerca de las características interesantes.
d. ¿Qué proporción de las observaciones de tiempo de vida de la muestra son menores que 100? ¿Qué
proporción de las observaciones son por lo menos 200?
a. ¿Es verdad que más del 50% de los ángulos muestreados son más pequeños que 15°, como se afirma
en el artículo?
SI ES VERDAD
EL 15.2 %
EL 40.8%
9. Un artículo publicado en Electrical Manufacturing & Coil Winding Conference Proceedings (1995, pág.
829) presenta los resultados del número de embarques devueltos, según los registros de cierta empresa. La
compañía está interesada en saber por qué fueron regresados los embarques. A continuación se muestran
resultados. Construya un diagrama de Pareto e interprete los datos.
20.9 19.6 20.4 20.3 20.8 20.6 20.5 20.4 19.9 19.8
19.5 20.2 16.5 18.3 18.7 19.6 20.0 20.0 19.5 19.6
19.1 18.8 18.3 17.6 17.2 17.8 18.7 19.0 19.0 18.6
18.8 19.0 18.5 18.3 17.5 16.9 17.0 17.8 18.1 18.8
18.9 18.9 19.1 18.8 18.4 17.8 17.0 16.8 17.9 18.4
19.0 19.4 19.7 19.5 19.5 19.5 19.0 18.7 18.1 17.9
Gráfica de puntos de C2
12. En el artículo “The Pedaling Technique of Elite Endurance Cyclists” (Int. J. of Sport Biomechanics, 1991:
29 – 53) aparecen los siguientes datos de energía en una sola pierna con una alta carga de trabajo:
244 191 160 187 180 176 174
205 211 183 211 180 194 200
Estadísticas
Variable Media Mediana
C2 192.57 189.00
b. Suponga que la primera observación fue 204 y no 244 ¿Cómo cambiarían la media y la mediana?
MediaRec
190.70
8
d. En el artículo también se proporcionan los valores de la energía de una sola pierna para poca carga de
trabajo. La media muestral para n = 13 observaciones fue x = 119.8 (en realidad, 119.7962) y la
observación décimo cuarta, algo apartada fue 159. ¿Cuál es el valor de x para la muestra total?
13. El mercurio es un contaminante del ambiente persistente y dispersivo en muchos ecosistemas alrededor del
mundo. Cuando se libera como un subproducto industrial a menudo encuentra su camino en los sistemas
acuáticos donde puede tener efectos deletéreos sobre diferentes especies acuáticas y en aves. Los datos
adjuntos en la concentración de mercurio en la sangre (µg/g) para las hembras adultas cerca de ríos
contaminados en Virginia se obtuvieron de un gráfico en el artículo “Mercury Exposure Effects the
Reproductive Success of a Free-Living Terrestrial Songbird, the Carolina Wren” (The Auk , 2011: 759
– 769; esta es una publicación de la American Ornithologist’ Union).
0.20 0.22 .025 0.30 0.34 0.41 0.55 0.56 1.42 1.70 1.83 2.20 2.25 3.07 3.25
a. Determine los valores de la media y la mediana muestrales y explique porqué son diferentes.
Media
1.222
Mediana
0.560
MediaRec
1.156
9.3 10.7 8.5 9.6 12.2 15.6 9.2 10.5 9.0 13.2 11.0 8.8 13.7 12.1 9.8
b. Comente sus observaciones sobre los dados (simetría, dispersión, valores representativos y atípicos,
etc.)
Estadísticas
Variable N N* Mínimo Máximo Rango
C2 15 0 8.500 15.600 7.100
√15 = 3.87
➢ SU VALOR REPRESENTATIVO : 9
➢ SIMETRIA: SESGO POSITIVO
➢ DISPERSION: MUCHA DISPERSION
➢ VALOR ATIPICO: 15.6
e. Halle el intervalo de la muestra
4
f. La varianza muestral s2 de la definición (es decir calcular primeramente las desviaciones con respecto a
la media y luego elevarlas al cuadrado, etc.)
Varianza
4.335
g. La desviación estándar muestral
𝑆 = √𝑠 2 = 2.082
h. s2 usando el método breve
𝑆 = √𝑠 2 = 2.082
15. La exposición a productos microbianos, especialmente endotoxina, puede tener un impacto en la
vulnerabilidad respecto a enfermedades alérgicas. El artículo “Dust Sampling Methods for Endotoxin-
An Essential, But Underestimated Issue” (Indoor Air, 2006; 20 – 27) consideró temas asociados con la
determinación de la concentración de endotoxina. Los siguientes datos sobre concentración (EU/mg) en
polvo asentada en una muestra de hogares urbanos y otra de casas campestres fueron proporcionados por
los autores del artículo citado:
U: 6.0 5.0 11.0 33.0 4.0 5.0 80.0 18.0 35.0 17.0 23.0
F: 4.0 14.0 11.0 9.0 9.0 8.0 4.0 20.0 5.0 8.9 21.0 9.2 3.0 2.0 0.3
Media de U
Variable Media
Media de F
C2 21.55 Variable Media
C2 8.56
Mediana de U
Variable Mediana Variable Mediana
Mediana de F
C2 17.00 C2 8.90
11
c. Calcule la media recortada de cada muestra eliminando la observación más pequeña y la más grande.
¿Cuáles son los porcentajes de recorte correspondientes? ¿cómo se comparan los valores de estas
medias recortadas con las medias y medianas correspondientes?
MEDIA RECORTADA DE U
Variable MediaRec
C2 *
MEDIA RECORTADA DE F
Variable MediaRec
C2 7.74
16. Los datos siguientes corresponden a las temperaturas (°F) de los anillos sellos (O-rings) para cada
encendido de prueba o lanzamiento real del motor del transbordador espacial (Presidential Commission on
the Space Shuttle Challenger Accident, vol.1, pp. 129 – 131):
84 49 61 40 83 67 45 66 70 69 80 58 68 60 67 72 73 70
57 63 70 78 52 67 53 67 75 61 70 81 76 79 75 76 58 31
TEMPERATURA (C°)
42 48 54 60 66 72 78 84
C2
12
b. Calcule e interprete los valores de la media y la desviación estándar muestrales.
c. Omita la observación más pequeña y la mayor y calcule de nuevo las cantidades del inciso
(b). Comente los resultados y compárelos con los del inciso (b). Calcule ¿qué porcentaje se
recortó?
SE RECORTO EL 6%
17. Se determinó el valor del módulo de elasticidad, en GPa de placas coladas, formadas por varios sustratos
intermetálicos y se obtuvieron las siguientes observaciones muestrales (“Strength and Modulus of a
Molybdenum-Coated Ti-25 Al-10 Nb-3 U-1Mo Intermetallic”, Journal of Material Engineering and
Performance, 1997, pp. 46-50):
Variable Media
C2 115.58
𝑥𝑖 (𝑥𝑖 − x) (𝑥𝑖 − x )2 𝑥𝑖 2
116.4 0.82 0.6724 13548.96
115.9 0.32 0.1024 13432.81
114.6 - 0.98 0.9604 13133.16
115.2 - 0.38 0.1444 13271.04
115.8 0.22 0.0484 13409.64
Total=577.9 Total= 0 Total= 1.929 Total= 66795.61
13
b. Use las desviaciones que calculó en el inciso a para obtener la varianza y la desviación estándar
muestrales.
d. Reste 100 de cada observación para obtener una muestra de valores transformados. Ahora calcule la
varianza muestral de esos valores trasformados y compárela con s2 para datos originales.
Variable Varianza
C2 0.482 𝑆 2 = .232324
20. Se determinó la cantidad de contaminación de aluminio, en ppm, en determinado plástico, con una muestra
de 26 especímenes y se obtuvieron los siguientes datos (“The Lognormal Distribution for Modeling
Quality Data when the Means Is Near Zero”, J. of Quality Technology, 1990, pp. 105 – 110):
30 30 60 63 70 79 87 90 101
102 115 118 119 119 120 125 140 145
172 182 183 191 222 244 291 511
Trace un diagrama de caja que muestre los valores atípicos y comente sus particularidades.
14
Gráfica de caja de C2
21. A continuación vemos el diagrama de tallo y hojas de los datos del tiempo de evacuación mostrados en el
ejercicio 3 del texto.
32 55
33 49
34
35 6699
36 34469
37 03345
38 9
39 2347
40 23
41
42 4
Para ser inusual debe ser menor que Q1 – 1.5 fs o mayor que Q3 + 1.5 fs, por
tanto sería:
359 – (1.5)(33) = 309.5 o 392 + (1.5)(33) = 441.5
15
En este caso no hay valores menores que 309.5 ni mayores que 441.5
Para que se considere un valor extremo debe ser menor que Q1 – 3.0 fs o mayor
que Q3 + 3.0 fs, por tanto sería:
359 – (3.0)(33) = 260 o 392 + (3.0)(33) = 491
Como en este caso la observación mínima es 325 y la máxima 424 se
concluye que no hay valores atípicos ni extremos.
d. ¿Cuánto habría de disminuir la observación más grande, que por el momento es 424, sin que afecte el
valor de la cuarta dispersión?
22. Se seleccionaron muestras de tres tipos distintos de cable de acero y se determinó el límite de fatiga, en
MPa, para cada muestra con los resultados siguientes:
Tipo 1 350 350 350 358 370 370 370 371 371 372 372 384
391 391 392
Tipo 2 350 354 359 363 365 368 369 371 373 374 376 380
383 388 392
Tipo 3 350 361 362 364 364 365 366 371 377 377 377 379
380 380 392
16
a. Trace un diagrama de caja comparativo y comente acerca de semejanzas y diferencias.
C2
➢ L
a
C3
m
e
d
i
a
n C4
a
C2
C3
C4
mpa
17
c. ¿El diagrama de caja comparativo del inciso (a) proporciona una información evaluativa de las
semejanzas y diferencias? Explique por qué.
23. La corrosión por fricción es un proceso de desgaste que resulta de los movimientos oscilatorios
tangenciales de pequeña amplitud en las piezas de una máquina. El artículo “Grease Effect on Fretting
Wear of Mild Steel” (Industrial Lubrication and Tribology, 2008: 67 – 78) incluye los siguientes datos
sobre el desgaste de volumen (10-4mm3) para los aceites base que tienen cuatro diferentes viscosidades.
Viscosidad Desgaste
20.4 55.8 30.8 27.3 29.9 17.7 76.5
30.2 44.5 47.2 48.7 41.6 32.8 18.3
89.4 73.3 57.1 66.0 93.8 133.2 81.1
252.6 30.6 24.2 16.6 38.9 28.7 23.6
a. El coeficiente de variación muestral (100𝑠/𝑥̅ ) evalúa el grado de variabilidad con respecto a la media
(específicamente, la desviación estándar como porcentaje de la media). Calcule el coeficiente de
variación para la muestra en cada viscosidad. Después, compare los resultados y coméntelos.
b. Construya una gráfica de caja comparativa de los datos y comente las características interesantes.
25. Los autores del artículo “Predictive Model for Pitting Corrosion in Buried Oil and Gas Pipelines”
(Corrosion 2009: 332 – 342) proporcionan los datos en los cuales basaron sus investigaciones.
a. Considere la muestra siguiente de 61 mediciones de la profundidad máxima a la cual se corroen los
pozos (nm) del tipo de tubería enterrada en suelo de arcilla limo.
0.41 0.41 0.41 0.41 0.43 0.43 0.43 0.48 0.48 0.58 0.79 0.79 0.81 0.81 0.81 0.91 0.94
0.94 1.02 1.04 1.04 1.17 1.17 1.17 1.17 1.17 1.17 1.17
1.19 1.19 1.27 1.40 1.40 1.59 1.59 1.60 1.68 1.91 1.96 1.96 1.96 2.10
2.21 2.31 2.46 2.49 2.57 2.74 3.10 3.18 3.30 3.58 3.58 4.15 4.75 5.33
7.65 7.70 8.13 10.41 13.44
Construya una gráfica de tallo y hojas en la que los dos valores más grandes se muestran en la última
fila HI.
Tallo y hoja
0 444444444577888999
1 00011111111124455669999
2 1234457
3 11355
4 17
5 3
6
7 67
8 1
9
10 4
11
12
13 4
Unidad de hoja = 0.1
b. Remítase de nuevo al inciso a) y construya un histograma basado en las ocho clases con 0 en el límite
inferior de la primera clase y con anchos de clase de 0.5, 0.5, 0.5, 1, 2, y 5 respectivamente.
20
35
30
25
Frecuencia
20
15
10
0
0 3 6 9 12
Intervalos
c. Construya un diagrama de caja y describa las características importantes y explique si los 3 gráficos
muestran la misma información, si no es así ¿por qué?
Gráfica de caja de C2
0 2 4 6 8 10 12 14
C2
21