Sie sind auf Seite 1von 21

1

INSTITUTO POLITECNICO NACIONAL


ESIA TICOMAN

GEOESTADISTICA
(Profesor (a) Aguilar Rivera Rosa María)

PROBLEMARIO 1° PARCIAL

➢ Ocegueda Matamoros Enrique


➢ Vázquez Gutiérrez Ricardo

2PM1
Fecha de entrega: 24-08-2018
2

1. El artículo citado en el problema anterior también presenta las siguientes observaciones de resistencia en
cilindros:

6.1 5.8 7.8 7.1 7.2 9.2 6.6 8.3 7.0 8.3
7.8 8.1 7.4 8.5 8.9 9.8 9.7 14.1 12.6 11.2
a. Trace un diagrama comparativo de tallo y hojas, de los datos para vigas y cilindros y a continuación
conteste las preguntas de los incisos (b), (c), y (d) del problema anterior para las observaciones con
cilindros.

Concreto cilindros
9 5 8
88533 6 16
98877643200 7 012488
Tallo : unidades
721 8 13359 Hojas : decimas
770 9 278
7 10
863 11 2
12 6
13
14 1
Unidad de hoja = 0.1

➢ NO PRESENTA SIMETRIA, LOS VALORES SE CONCENTRAN EN EL 7


➢ TIENE MUCHA DISPERCION
➢ EL VALOR REPRESENTATIVO ES EL 7
➢ EL VALOR ATIPICO SERIA EL 14.1

b. ¿En qué aspectos se parecen los dos lados del diagrama? ¿Hay diferencias obvias entre las
observaciones para vigas y para cilindros?

➢ ENTRE 5 Y 9 SE ENCUENTRAN LA MAYORIA DE LOS DATOS


➢ AMBOS COINCIDEN CON QUE 7 ES SU VALOR REPRESETATIVO
c. Construya una gráfica de puntos de los datos del cilindro.
Gráfica de puntos de C2
3

6 7 8 9 10 11 12 13 14
C2

6. Las propiedades mecánicas permisibles para diseño estructural de vehículos aeroespaciales metálicos,
requiere un método aprobado para analizar estadísticamente los datos de prueba empíricos. En el artículo
“Establishing Mechanical Property Allowables for Metals” (J. of Testing and Evaluation, 1998: 293 –
299), se emplearon los datos adjuntos de resistencia última a la tensión (ksi) como base para superar
dificultades en el desarrollo del método.

122.2 124.2 124.3 125.6 126.3 126.5 126.5 127.2 127.3 127.5 127.9
128.6 128.8 129.0 129.2 129.4 129.6 130.2 130.4 130.8 131.3 131.4
131.4 131.5 131.6 131.6 131.8 131.8 132.3 132.4 132.4 132.5 132.5
132.5 132.5 132.6 132.7 132.9 133.0 133.1 133.1 133.1 133.1 133.2
133.2 133.2 133.3 133.3 133.5 133.5 133.5 133.8 133.9 134.0 134.0
134.0 134.0 134.1 134.2 134.3 134.4 134.4 134.6 134.7 134.7 134.7
134.8 134.8 134.8 134.9 134.9 135.2 135.2 135.2 135.3 135.3 135.4
135.5 135.5 135.6 135.6 135.7 135.8 135.8 135.8 135.8 135.8 135.9
135.9 135.9 135.9 136.0 136.0 136.1 136.2 136.2 136.3 136.4 136.4
136.6 136.8 136.9 136.9 137.0 137.1 137.2 137.6 137.6 137.8 137.8
137.8 137.9 137.9 138.2 138.2 138.3 138.3 138.4 138.4 138.4 138.5
138.5 138.6 138.7 138.7 139.0 139.1 139.5 139.6 139.8 139.8 140.0
140.0 140.7 140.7 140.9 140.9 141.2 141.4 141.5 141.6 142.9 143.4
143.5 143.6 143.8 143.8 143.9 144.1 144.5 144.5 147.7 147.7

a. Construya un diagrama de tallo y hojas de los datos eliminando (truncando) primero el dígito de las
decenas y luego repitiendo cada valor del tallo cinco veces (una vez para las hojas 1 y 2, una segunda
vez para las hojas 3 y 4, etc.) ¿Por qué es relativamente fácil identificar un valor de resistencia
representativo?

TALLO Y HOJA DE RESISTENCIA A LA TENSION

12 2
12 445
12 6667777
12 889999
13 00011111111
13 2222222222333333333333333
13 44444444444444444455555555555555555555
13 6666666666667777777777
13 888888888888999999
14 0000001111
14 2333333
14 444
14 77
4
➢ POR LA SIMETRIA SE OBSERVA EL VALOR REPRESENTATIVO, ESTE SE ENCUENTRA
ENTRE 134 Y 135

b. Construya un histograma usando las clases de igual amplitud con la primera clase con un límite
inferior de 122 y un límite superior de 124. Luego comente acerca de cualquier característica
interesante del histograma.

Intervalo Frecuencia Frec. relativa Intervalo Frecuencia Frec. relativa


122 ≤ x <124 1 0.00654 136 ≤ x < 138 22 0.14379
124 ≤ x < 126 3 0.01961 138 ≤ x < 140 18 0.11765
126 ≤ x < 128 7 0.04575 140 ≤ x < 142 10 0.06536
128 ≤ x <130 6 0.03921 142 ≤ x < 144 7 0.04575
130 ≤ x < 132 11 0.07189 144 ≤ x < 146 3 0.01961
132 ≤ x < 134 25 0.16340 146 ≤ x < 148 2 0.01307
134 ≤ x < 136 38 0.24836 Totales 153 0.99999

RESISTENCIA A LA TENSION
35

30

25
Frecuencia

20

15

10

0
124 128 132 136 140 144 148
C2

➢ NO TIENE HUECOS
➢ EL VALOR REPRESENTATIVO ES 130
➢ LIGERA SIMETRIA
➢ POCA DISPERCION

7. En el artículo “Study on the life Distribution of Microdrills” (J. of Engr. Manufacture, 2002: 301- 305)
aparecen las observaciones siguientes, listadas en orden creciente, del tiempo de vida de un taladro (número
de agujeros que maquina un taladro antes de romperse) cuando se hacen agujeros en cierta aleación de
latón.

11 14 20 23 31 36 39 44 47 50
59 61 65 67 68 71 74 76 78 79
81 84 85 89 91 93 96 99 101 104
105 105 112 118 123 136 139 141 148 158
161 168 184 206 248 263 289 322 388 513
5
a. ¿Por qué no se puede basar una distribución de frecuencias en los intervalos de clase 0 -50, 50 – 100,
100 – 150, etc.?

➢ NO SE PUEDE PONER EL MISMO PORCENTAJE EN DOS INTERVALOS


b. Construya una distribución de frecuencias y un histograma con los datos usando los límites de clase 0,
50, 100, …, y comente acerca de las características interesantes.

Estadísticas
Variable Mínimo Máximo Rango
C2 11.0 513.0 502.0

√50 = 7.07

502
= 71.71
7

Intervalos Frecuencia Frecuencia


relativa
0 ≤ x < 80 20 0.40
80 ≤ x < 160 20 0.40
160 ≤ x < 240 4 0.08
240 ≤ x < 320 3 0.06
320 ≤ x < 400 2 0.04
400 ≤ x < 480 0 0.00
480 ≤ x < 540 1 0.02
Totales 50 1.00

Histograma de C2

20

15
Frecuencia

10

0
11.0000000 1.5299E+02 2.9497E+02 4.3696E+02 5.7895E+02
C2
6
c. Construya una distribución de frecuencias e histograma de logaritmos naturales de las observaciones
de tiempo de vida media y comente acerca de las características interesantes.
d. ¿Qué proporción de las observaciones de tiempo de vida de la muestra son menores que 100? ¿Qué
proporción de las observaciones son por lo menos 200?

8. En la actualidad se está utilizando la difracción retrodispersada de electrones en el estudio de fenómenos de


fractura. La siguiente información sobre ángulo de desorientación (grados) se extrajo del artículo
“Observations on the Faceted Initiation Site in the Dwell - Fatigue Tested Ti-6242 Alloy:
Crystallographic Orientation and Size Effects” (Metallurgical and Materials Trans., 2006: 1507 – 1518).

Clase: 0 - <5 5 - < 10 10 - < 15 15 - < 20 20 - < 30


Frecuencia relativa: 0.177 0.166 0.175 0.136 0.194

Clase: 30 - < 40 40- < 60 60 - < 90


Frecuencia relativa: 0.078 0.044 0.030

a. ¿Es verdad que más del 50% de los ángulos muestreados son más pequeños que 15°, como se afirma
en el artículo?

SI ES VERDAD

c. ¿Qué proporción de los ángulos muestreados son por lo menos de 30°?

EL 15.2 %

d. Aproximadamente que proporción de los ángulos son de entre 10° y 25°?

EL 40.8%

e. Construya un histograma y comente sobre cualquier característica interesante?

9. Un artículo publicado en Electrical Manufacturing & Coil Winding Conference Proceedings (1995, pág.
829) presenta los resultados del número de embarques devueltos, según los registros de cierta empresa. La
compañía está interesada en saber por qué fueron regresados los embarques. A continuación se muestran
resultados. Construya un diagrama de Pareto e interprete los datos.

Causa Número de clientes


Rechazados 195 000
Selección equivocada 50 000
Respuesta equivocada 68 000
Cancelación 5 000
Otra 15 000
7
10. Los datos siguientes son mensuales y se obtuvieron durante el período de 1985 a 1989. Cada valor es la
radiación solar promedio en la banda de 385 a 530 nm como porcentaje de la radiación total (“Global
Energy in the Different Spectral Bands at Dhahran, Saudi Arabia”, J. Solar Energy Engr. 1991: 290 294).
Comente acerca de las características de los datos.

20.9 19.6 20.4 20.3 20.8 20.6 20.5 20.4 19.9 19.8
19.5 20.2 16.5 18.3 18.7 19.6 20.0 20.0 19.5 19.6
19.1 18.8 18.3 17.6 17.2 17.8 18.7 19.0 19.0 18.6
18.8 19.0 18.5 18.3 17.5 16.9 17.0 17.8 18.1 18.8
18.9 18.9 19.1 18.8 18.4 17.8 17.0 16.8 17.9 18.4
19.0 19.4 19.7 19.5 19.5 19.5 19.0 18.7 18.1 17.9

a. Construya un diagrama de puntos y dígitos para la serie de tiempo adjunta.

Gráfica de puntos de C2

16.8 17.4 18.0 18.6 19.2 19.8 20.4 21.0


C2

12. En el artículo “The Pedaling Technique of Elite Endurance Cyclists” (Int. J. of Sport Biomechanics, 1991:
29 – 53) aparecen los siguientes datos de energía en una sola pierna con una alta carga de trabajo:
244 191 160 187 180 176 174
205 211 183 211 180 194 200

a. Calcule e interprete la media y la mediana de la muestra.

Estadísticas
Variable Media Mediana
C2 192.57 189.00

b. Suponga que la primera observación fue 204 y no 244 ¿Cómo cambiarían la media y la mediana?

➢ LA MEDIANA EN NADA CAMBIARIA, LA MODA DISMINUYE A 189.71


c. Calcule la media recortada eliminando las observaciones mínima y máxima de la muestra. ¿Cuál es el
porcentaje correspondiente de corte?

MediaRec
190.70
8

d. En el artículo también se proporcionan los valores de la energía de una sola pierna para poca carga de
trabajo. La media muestral para n = 13 observaciones fue x = 119.8 (en realidad, 119.7962) y la
observación décimo cuarta, algo apartada fue 159. ¿Cuál es el valor de x para la muestra total?

Variable Media Mediana


C2 192.57 189.00

13. El mercurio es un contaminante del ambiente persistente y dispersivo en muchos ecosistemas alrededor del
mundo. Cuando se libera como un subproducto industrial a menudo encuentra su camino en los sistemas
acuáticos donde puede tener efectos deletéreos sobre diferentes especies acuáticas y en aves. Los datos
adjuntos en la concentración de mercurio en la sangre (µg/g) para las hembras adultas cerca de ríos
contaminados en Virginia se obtuvieron de un gráfico en el artículo “Mercury Exposure Effects the
Reproductive Success of a Free-Living Terrestrial Songbird, the Carolina Wren” (The Auk , 2011: 759
– 769; esta es una publicación de la American Ornithologist’ Union).

0.20 0.22 .025 0.30 0.34 0.41 0.55 0.56 1.42 1.70 1.83 2.20 2.25 3.07 3.25

a. Determine los valores de la media y la mediana muestrales y explique porqué son diferentes.

Media
1.222
Mediana
0.560

➢ EN LA MEDIANA COMO ES UN NUMERO IMPAR, TOMAMOS EL DEL


CENTRO.
➢ EM LA MEDIA SE SUMAN TODOS LOS VALORES Y SE DIVIDEN ENTRE
EL NUMERO TOTAL DE VALORES.

b. Determine el valor de la media recortada 10% y compare con la media y la mediana.

MediaRec
1.156

c. ¿Cuánto podría aumentar la observación 0.20 sin afectar el valor de la mediana?

➢ SI AUMENTA NO AFECTA, EN ESTE CASO LA MEDIANA COMO ES


IMPAR, NO HAY NADA POR QUE SUMAR.
14. Se obtuvieron quince muestras de aire de determinada región y se determinó la concentración de
monóxido de carbono en cada una. Los resultados, en ppm fueron los siguientes:

9.3 10.7 8.5 9.6 12.2 15.6 9.2 10.5 9.0 13.2 11.0 8.8 13.7 12.1 9.8

a. Construya un diagrama de tallo y hojas con los datos


9

Tallo y hoja de muestras de aire


8 58
9 02368
10 57
11 0
12 12
13 27
14
15 6
Unidad de hoja = 0.1

b. Comente sus observaciones sobre los dados (simetría, dispersión, valores representativos y atípicos,
etc.)

➢ SIMETRIA: no tiene simetría, presenta un sesgo positivo


➢ DISPERCIÓN: tiene mucha dispersión
➢ VALOR REPRESENTATIVO: 9
➢ VALOR ATIPICO: 15

c. Trace un histograma con la frecuencia relativa en el eje vertical

Estadísticas
Variable N N* Mínimo Máximo Rango
C2 15 0 8.500 15.600 7.100
√15 = 3.87

INTERVALOS FRECUENCIA F.RELATIVA F.R.ACOMULADA


8 ≤ X ≤ 10 7 7/15=.46 .46
10 ≤ X ≤ 12 3 3/15=.2 .66
12 ≤ X ≤ 14 4 4/15=.26666 .92
14 ≤ X ≤ 16 1 1/15=.0666 .9999
10
d. ¿Cómo describiría la forma del histograma?

➢ SU VALOR REPRESENTATIVO : 9
➢ SIMETRIA: SESGO POSITIVO
➢ DISPERSION: MUCHA DISPERSION
➢ VALOR ATIPICO: 15.6
e. Halle el intervalo de la muestra
4
f. La varianza muestral s2 de la definición (es decir calcular primeramente las desviaciones con respecto a
la media y luego elevarlas al cuadrado, etc.)

Varianza
4.335
g. La desviación estándar muestral

𝑆 = √𝑠 2 = 2.082
h. s2 usando el método breve

𝑆 = √𝑠 2 = 2.082
15. La exposición a productos microbianos, especialmente endotoxina, puede tener un impacto en la
vulnerabilidad respecto a enfermedades alérgicas. El artículo “Dust Sampling Methods for Endotoxin-
An Essential, But Underestimated Issue” (Indoor Air, 2006; 20 – 27) consideró temas asociados con la
determinación de la concentración de endotoxina. Los siguientes datos sobre concentración (EU/mg) en
polvo asentada en una muestra de hogares urbanos y otra de casas campestres fueron proporcionados por
los autores del artículo citado:

U: 6.0 5.0 11.0 33.0 4.0 5.0 80.0 18.0 35.0 17.0 23.0
F: 4.0 14.0 11.0 9.0 9.0 8.0 4.0 20.0 5.0 8.9 21.0 9.2 3.0 2.0 0.3

a. Determine la media muestral de cada muestra. ¿Cómo se comparan?

Media de U
Variable Media
Media de F
C2 21.55 Variable Media
C2 8.56

➢ TIENE MAYORES CONCENTRACIONES LA ZONA URBANA QUE LA


ZONA DE CASAS CAMPESTRES
b. Determine la mediana muestral de cada muestra. ¿Cómo se comparan? ¿Por qué la mediana de la
muestra urbana es tan diferente de la media de dicha muestra?

Mediana de U
Variable Mediana Variable Mediana
Mediana de F
C2 17.00 C2 8.90
11

➢ LA MEDIA ES LA FORMA MAS SENCILLA DE RESUMIR UNA SOLA


VARIABLE
➢ EN LA MEDIANA SE LOCALIZA EL VALOR INTERMEDIO

c. Calcule la media recortada de cada muestra eliminando la observación más pequeña y la más grande.
¿Cuáles son los porcentajes de recorte correspondientes? ¿cómo se comparan los valores de estas
medias recortadas con las medias y medianas correspondientes?

MEDIA RECORTADA DE U
Variable MediaRec
C2 *

MEDIA RECORTADA DE F
Variable MediaRec
C2 7.74

➢ EL RECORTE FUE DEL 20%

➢ LOS VALORES RECORTADOS EVIDENTEMENTE SON MAS BAJOS , O


NULOS (COMO EN EL CASO DE LA ZONA URBANA)

16. Los datos siguientes corresponden a las temperaturas (°F) de los anillos sellos (O-rings) para cada
encendido de prueba o lanzamiento real del motor del transbordador espacial (Presidential Commission on
the Space Shuttle Challenger Accident, vol.1, pp. 129 – 131):

84 49 61 40 83 67 45 66 70 69 80 58 68 60 67 72 73 70
57 63 70 78 52 67 53 67 75 61 70 81 76 79 75 76 58 31

a. Construya un diagrama de puntos de los datos de la temperatura.

TEMPERATURA (C°)

42 48 54 60 66 72 78 84
C2
12
b. Calcule e interprete los valores de la media y la desviación estándar muestrales.

Estadísticas de temperatura (c°)


Variable Media Desv.Est.
C2 66.60 10.84

c. Omita la observación más pequeña y la mayor y calcule de nuevo las cantidades del inciso
(b). Comente los resultados y compárelos con los del inciso (b). Calcule ¿qué porcentaje se
recortó?

Estadísticas de temperatura (C°)


Variable Media Desv.Est.
C2 66.96 9.48

➢ LA MEDIA AUMENTA LIGERAMENTE


➢ LA DESVIACION ESTANDAR AL HACER EL CORTE REDUCE

SE RECORTO EL 6%

17. Se determinó el valor del módulo de elasticidad, en GPa de placas coladas, formadas por varios sustratos
intermetálicos y se obtuvieron las siguientes observaciones muestrales (“Strength and Modulus of a
Molybdenum-Coated Ti-25 Al-10 Nb-3 U-1Mo Intermetallic”, Journal of Material Engineering and
Performance, 1997, pp. 46-50):

116.4 115.9 114.6 115.2 115.8

a. Calcule x y las desviaciones respecto a la media

Variable Media
C2 115.58

𝑥𝑖 (𝑥𝑖 − x) (𝑥𝑖 − x )2 𝑥𝑖 2
116.4 0.82 0.6724 13548.96
115.9 0.32 0.1024 13432.81
114.6 - 0.98 0.9604 13133.16
115.2 - 0.38 0.1444 13271.04
115.8 0.22 0.0484 13409.64
Total=577.9 Total= 0 Total= 1.929 Total= 66795.61
13
b. Use las desviaciones que calculó en el inciso a para obtener la varianza y la desviación estándar
muestrales.

Desviación estándar muestral


Variable Desv.Est.
C2 0.694
𝑆 2 = 48225

c. Calcule s 2 con el método breve

d. Reste 100 de cada observación para obtener una muestra de valores transformados. Ahora calcule la
varianza muestral de esos valores trasformados y compárela con s2 para datos originales.

Variable Varianza
C2 0.482 𝑆 2 = .232324

20. Se determinó la cantidad de contaminación de aluminio, en ppm, en determinado plástico, con una muestra
de 26 especímenes y se obtuvieron los siguientes datos (“The Lognormal Distribution for Modeling
Quality Data when the Means Is Near Zero”, J. of Quality Technology, 1990, pp. 105 – 110):

30 30 60 63 70 79 87 90 101
102 115 118 119 119 120 125 140 145
172 182 183 191 222 244 291 511

Trace un diagrama de caja que muestre los valores atípicos y comente sus particularidades.
14

Gráfica de caja de C2

0 100 200 300 400 500


C2

Hay una ligera inclinación positiva a esta información. Hay


un extremo atípico (x = 511). Incluso al eliminar el valor
atípico, la tasa de variación aún es moderadamente grande.

21. A continuación vemos el diagrama de tallo y hojas de los datos del tiempo de evacuación mostrados en el
ejercicio 3 del texto.
32 55
33 49
34
35 6699
36 34469
37 03345
38 9
39 2347
40 23
41
42 4

a. Determine el valor de la cuarta dispersión.

Q1 = 359 Q3 = 392 fs = Q3 – Q1 = 392 – 359 fs = 33

b. ¿Hay algunos valores atípicos en la muestra? ¿y algunos puntos atípicos extremos?

Para ser inusual debe ser menor que Q1 – 1.5 fs o mayor que Q3 + 1.5 fs, por
tanto sería:
359 – (1.5)(33) = 309.5 o 392 + (1.5)(33) = 441.5
15
En este caso no hay valores menores que 309.5 ni mayores que 441.5
Para que se considere un valor extremo debe ser menor que Q1 – 3.0 fs o mayor
que Q3 + 3.0 fs, por tanto sería:
359 – (3.0)(33) = 260 o 392 + (3.0)(33) = 491
Como en este caso la observación mínima es 325 y la máxima 424 se
concluye que no hay valores atípicos ni extremos.

c. Trace un diagrama de caja y comente sus particularidades.

Hay un ligero sesgo positivo, no tiene mucha simetría y la dispersión


parece grande.

d. ¿Cuánto habría de disminuir la observación más grande, que por el momento es 424, sin que afecte el
valor de la cuarta dispersión?

Hasta un valor que no fuera menor que 392 , es decir no mas


de 32 unidades

22. Se seleccionaron muestras de tres tipos distintos de cable de acero y se determinó el límite de fatiga, en
MPa, para cada muestra con los resultados siguientes:

Tipo 1 350 350 350 358 370 370 370 371 371 372 372 384
391 391 392

Tipo 2 350 354 359 363 365 368 369 371 373 374 376 380
383 388 392

Tipo 3 350 361 362 364 364 365 366 371 377 377 377 379
380 380 392
16
a. Trace un diagrama de caja comparativo y comente acerca de semejanzas y diferencias.

C2

➢ L
a
C3
m
e
d
i
a
n C4
a

e 350 360 370 380 390


s mpa
l
a misma (371) en cada gráfica y los tres conjuntos de datos son muy simétricos.
Además, los tres tienen el mismo valor mínimo (350) y el mismo valor máximo
(392). Además, los tres conjuntos de datos tienen los mismos cuartiles inferior
(364) y superior (378). Entonces, los tres diagramas de caja serán idénticos.
b. Trace un diagrama de caja comparativo (un diagrama de caja para cada muestra con una escala común).
Comente acerca de semejanzas y diferencias.

C2

C3

C4

350 360 370 380 390

mpa
17

c. ¿El diagrama de caja comparativo del inciso (a) proporciona una información evaluativa de las
semejanzas y diferencias? Explique por qué.

➢ El diagrama de caja en (a) no es capaz de detectar las diferencias entre los


conjuntos de datos. La razón principal es que las diagramas de caja ofrecen
algunos detalles al describir los datos porque solo usan 5 números de resumen
para comparar conjuntos de datos. Técnicamente hablando, la mediana de la
mitad inferior de los datos no es realmente el primer cuartil, aunque en general
es muy cercano. En cambio, las medianas de la mitad inferior y superior de los
datos a menudo se denominan las bisagras inferior y superior. Nuestros
diagramas de caja usan las bisagras inferior y superior para definir la dispersión
del 50% del medio de los datos, pero otros autores algunas veces usan los
cuartiles reales para este propósito.

23. La corrosión por fricción es un proceso de desgaste que resulta de los movimientos oscilatorios
tangenciales de pequeña amplitud en las piezas de una máquina. El artículo “Grease Effect on Fretting
Wear of Mild Steel” (Industrial Lubrication and Tribology, 2008: 67 – 78) incluye los siguientes datos
sobre el desgaste de volumen (10-4mm3) para los aceites base que tienen cuatro diferentes viscosidades.

Viscosidad Desgaste
20.4 55.8 30.8 27.3 29.9 17.7 76.5
30.2 44.5 47.2 48.7 41.6 32.8 18.3
89.4 73.3 57.1 66.0 93.8 133.2 81.1
252.6 30.6 24.2 16.6 38.9 28.7 23.6

a. El coeficiente de variación muestral (100𝑠/𝑥̅ ) evalúa el grado de variabilidad con respecto a la media
(específicamente, la desviación estándar como porcentaje de la media). Calcule el coeficiente de
variación para la muestra en cada viscosidad. Después, compare los resultados y coméntelos.

➢ Viscosidad 1.- 55.53%


➢ Viscosidad 2.- 29.68%
➢ Viscosidad 3.- 32.29%
➢ Viscosidad 4.- 27.85%
➢ La viscosidad uno tiene una mayor variación con respecto a su media ya que es la
menor viscosidad de las estudiadas
18

b. Construya una gráfica de caja comparativa de los datos y comente las características interesantes.

➢ La viscosidad 1,2 y 3 presentan dispersión


➢ La viscosidad 4 presenta simetría
➢ No hay valores atípicos
➢ La viscosidad 1 y 3 tienen sesgo positivo
➢ La viscosidad 2 tiene sesgo negativo
19

25. Los autores del artículo “Predictive Model for Pitting Corrosion in Buried Oil and Gas Pipelines”
(Corrosion 2009: 332 – 342) proporcionan los datos en los cuales basaron sus investigaciones.
a. Considere la muestra siguiente de 61 mediciones de la profundidad máxima a la cual se corroen los
pozos (nm) del tipo de tubería enterrada en suelo de arcilla limo.

0.41 0.41 0.41 0.41 0.43 0.43 0.43 0.48 0.48 0.58 0.79 0.79 0.81 0.81 0.81 0.91 0.94
0.94 1.02 1.04 1.04 1.17 1.17 1.17 1.17 1.17 1.17 1.17
1.19 1.19 1.27 1.40 1.40 1.59 1.59 1.60 1.68 1.91 1.96 1.96 1.96 2.10
2.21 2.31 2.46 2.49 2.57 2.74 3.10 3.18 3.30 3.58 3.58 4.15 4.75 5.33
7.65 7.70 8.13 10.41 13.44
Construya una gráfica de tallo y hojas en la que los dos valores más grandes se muestran en la última
fila HI.

Tallo y hoja
0 444444444577888999
1 00011111111124455669999
2 1234457
3 11355
4 17
5 3
6
7 67
8 1
9
10 4
11
12
13 4
Unidad de hoja = 0.1

b. Remítase de nuevo al inciso a) y construya un histograma basado en las ocho clases con 0 en el límite
inferior de la primera clase y con anchos de clase de 0.5, 0.5, 0.5, 1, 2, y 5 respectivamente.
20

35

30

25
Frecuencia

20

15

10

0
0 3 6 9 12
Intervalos

c. Construya un diagrama de caja y describa las características importantes y explique si los 3 gráficos
muestran la misma información, si no es así ¿por qué?

Gráfica de caja de C2

0 2 4 6 8 10 12 14
C2
21

Das könnte Ihnen auch gefallen