Beruflich Dokumente
Kultur Dokumente
MTODOS ESTADSTICOS
TAREA 1
El conjunto de datos de puntajes del test de ansiedad visto en clase est contenido en el archivo puntajes_ansiedad.txt en BB. Haga el cmputo de las siguientes
cantidades muestrales. Muestre el desarrollo de los clculos; si alguno de stos es muy largo, muestre un resumen.
id
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
Puntajes
Ansiedad
29
30
33
33
33
35
36
36
36
37
37
38
39
39
39
40
41
42
43
43
45
45
47
47
47
48
48
49
841
900
1089
1089
1089
1225
1296
1296
1296
1369
1369
1444
1521
1521
1521
1600
1681
1764
1849
1849
2025
2025
2209
2209
2209
2304
2304
2401
-6953.61
-5916.93
-3434.04
-3434.04
-3434.04
-2241.38
-1765.84
-1765.84
-1765.84
-1362.82
-1362.82
-1026.31
-750.34
-750.34
-750.34
-528.88
-355.94
-225.53
-131.64
-131.64
-29.42
-29.42
-1.28
-1.28
-1.28
0.00
0.00
0.76
132723.17
107019.27
51809.16
51809.16
51809.16
29332.88
21343.61
21343.61
21343.61
15109.48
15109.48
10352.39
6818.26
6818.26
6818.26
4277.01
2522.55
1372.78
669.63
669.63
90.81
90.81
1.40
1.40
1.40
0.00
0.00
0.69
50
52
53
54
54
55
56
59
59
60
64
65
66
68
70
70
71
71
Total
2500
2704
2809
2916
2916
3025
3136
3481
3481
3600
4096
4225
4356
4624
4900
4900
5041
5041
113046
7.00
59.92
118.59
206.74
206.74
330.38
495.49
1299.68
1299.68
1690.71
4029.58
4837.99
5747.89
7896.11
10522.24
10522.24
12029.52
12029.52
35179.97
13.39
234.45
582.64
1222.49
1222.49
2283.90
3920.80
14183.50
14183.50
20141.46
64122.88
81825.20
102962.13
157235.49
230574.25
230574.25
275632.94
275632.94
2035806.53
a) Los percentiles del 5, 10, 20, 25, 50, 75, 80, 90 y 95 porciento
Percentil 5
p=
0.05
hp = j + d
hp = 0.05*46
hp =
2.3
hp = j + d
2.3 = 2 + 0.3
Pporcentaje = (1 - d) Xj + d X(j+1)
P5 = (1 - 0.3) X2 + 0.3 X3
P5 = (0.7) * 30 + 0.3* 33
P5 =
30.9
33
P5
Percentil 10
p=
0.1
hp = j + d
hp = 0.10*46
hp =
4.6
hp = j + d
4.6 = 4 + 0.6
Pporcentaje = (1 - d) Xj + d X(j+1)
P10 = (1 - 0.6) X4 + 0.6 X5
P10 = (0.4) * 33 + 0.6* 33
P10 =
33
33
P10
Percentil 15
p=
0.15
hp = j + d
hp = 0.15*46
hp =
6.9
hp = j + d
6.9 = 6 + 0.9
Pporcentaje = (1 - d) Xj + d X(j+1)
P15 = (1 - 0.9) X6 + 0.9 X7
P15 = (0.1) * 35 + 0.9* 36
P15 =
35.9
36
P15
Percentil 20
p=
0.2
hp = j + d
hp = 0.20*46
hp =
9.2
hp = j + d
9.2 = 9 + 0.2
Pporcentaje = (1 - d) Xj + d X(j+1)
P20 = (1 - 0.2) X9 + 0.2 X10
P20 = (0.8) * 36 + 0.2* 37
P20 =
36.2
37
P20
Percentil 75
p=
0.75
hp = j + d
hp = 0.75*46
hp =
34.5
hp = j + d
34.5 = 34 + 0.5
Pporcentaje = (1 - d) Xj + d X(j+1)
P75 = (1 - 0.5) X34 + 0.5 X35
P75 = (0.5) * 55 + 0.5* 56
P75 =
55.5
56
P75
Percentil 25
p=
0.25
hp = j + d
hp = 0.25*46
hp =
11.5
hp = j + d
11.5 = 11 + 0.5
Pporcentaje = (1 - d) Xj + d X(j+1)
P25 = (1 - 0.5) X11 + 0.5 X12
P25 = (0.5) * 37 + 0.5* 38
P25 =
37.5
38
P25
Percentil 80
p=
0.8
hp = j + d
hp = 0.8*46
hp =
36.8
hp = j + d
36.8 = 36 + 0.8
Pporcentaje = (1 - d) Xj + d X(j+1)
P80 = (1 - 0.8) X36 + 0.8 X37
P80 = (0.2) * 59 + 0.8* 59
P80 =
59
59
P80
Percentil 50
p=
0.5
hp = j + d
hp = 0.50*46
hp =
23
hp = j + d
23 = 23 + 0.0
Pporcentaje = (1 - d) Xj + d X(j+1)
P50 = (1 - 0.0) X23 + 0.0 X24
P50 = (1.0) * 47 + 0.0* 47
P50 =
47
47
P50
Percentil 90
p=
0.9
hp = j + d
hp = 0.9*46
hp =
41.4
hp = j + d
41.4 = 41 + 0.4
Pporcentaje = (1 - d) Xj + d X(j+1)
P90 = (1 - 0.4) X41 + 0.4 X42
P90 = (0.6) * 66 + 0.4* 68
P90 =
66.8
68
P90
Percentil
5
10
15
20
25
50
75
80
90
95
Clculo
30.9
33
35.9
36.2
37.5
47
55.5
59
66.8
70
Media
Media
Varianza
Desviacin Estandar
Moda
48.09
Varianza
Varianza
148.39
Desviacin Estndar
Desviacin Estndar
12.18
48.09
148.39
12.18
33.00
Valor
33
33
36
37
38
47
56
59
68
70
Clculo Excel
33
34
36
37
38.25
47
55.75
59
67
70
c) El error estndar
Error Estndar
1.80
d) El rango intercuartlico
RQ = Q3 - Q1
Q3 = P75 = 55.5
Q1 = P25 = 37.5
RQ = 55.5 - 37.5
RQ
18.00
e) Los bigotes inferior y superior del diagrama de caja de acuerdo con la regla vista en clase
Bigote Inferior
Bigote Inferior = observacin ms pequea pero mayor a Q1 1.5RQ
Q1 1.5RQ =
10.5
Bigote Inferior
29.00
Bigote Superior
Bigote Superior = observacin ms grande pero menor a Q3 + 1.5RQ
Q3 + 1.5RQ =
82.5
Bigote Superior
71.00
S=
Sesgo
12.18
0.45
Bigote Inf.
Bigote Sup.
Q1 1.5RQ
Q3 + 1.5RQ
29
71
Exceso de Curtosis
Exceso de Curtosis
Clculo Excel
-0.86
-0.81
g) De acuerdo a las grficas vistas en clase y estas cantidades calculadas, qu puede decir acerca de la forma de la distribucin de la muestra?
Tabla de Distribucin de Frecuencias
Intervalos
Lmites
Reales
28 - 32
32 - 36
36 - 40
40 - 44
44 - 48
48 - 52
52 - 56
56 - 60
60 - 64
64 - 68
68 -72
28.5 - 32.5
32.5 - 36.5
36.5 - 40.5
40.5 - 44.5
44.5 - 48.5
48.5 - 52.5
52.5 - 56.5
56.5 - 60.5
60.5 - 64.5
64.5 - 68.5
68.5 - 72.5
Frecuencia
Frecuencia
Relativa
2
7
7
4
7
3
5
3
1
3
4
0.04
0.15
0.15
0.09
0.15
0.07
0.11
0.07
0.02
0.07
0.09
Frecuencia
Relativa
Acumulada
0.04
0.19
0.34
0.43
0.58
0.65
0.73
0.86
0.85
0.92
1
Histograma
8
7
6
5
4
3
2
1
0
28 - 32
32 - 36
36 - 40
40 - 44
44 - 48
48 - 52
52 - 56
56 - 60
60 - 64
64 - 68
68 -72
Estadstica Descriptiva
Media
48.0869565
Error tpico
1.79608433
Mediana
47
Moda
33
Desviacin estndar 12.1816366
Varianza de la muestra
148.392271
Curtosis
-0.8632237
Coeficiente de asimetra
0.45213823
Rango
42
Mnimo
29
Mximo
71
Suma
2212
Cuenta
46
Nivel de confianza(95.0%)
3.61749948
0.8
0.6
Frecuencia
Relativa
Acumulada
0.4
0.2
68 -72
64 - 68
60 - 64
56 - 60
52 - 56
48 - 52
44 - 48
40 - 44
36 - 40
32 - 36
28 - 32
Valores Reales
Bigote Inferior
29.00
Q1
37.5
Mediana
47
Q3
55.5
Bigote Superior
71.00
80
70
60
50
Valores Grfica
Q1
Mediana
Q3
Bigote Superior
Bigote Inferior
Diagrama de Caja
37.5
9.5
8.5
15.5
8.5
Q3
40
Mediana
30
Q1
20
10
0
1
2. En cada uno de los siguientes ejercicios, utilice los mtodos grficos que considere apropiados para hacer un anlisis exploratorio de los datos. Puede
auxiliarse con el cmputo de algunos estadsticos, si as lo desea. Extraiga conclusiones de lo que observe en sus grficas. Ambas cosas, tanto grficas
a) El conjunto de datos emisiones_CO.csv contiene datos de emisiones de CO de 794 autos (gramos por milla). Se presentan en forma de una tabla de
frecuencia 2 columnas separadas por comas; la primera con los lmites inferior y superior del intervalo de clase y la segunda con la frecuencia.
EMISIONES CO
Intervalo
0-24
24-48
48-72
72-96
96-120
120-144
144-168
168-192
192-216
216-240
240-264
264-288
288-312
312-336
336-360
Total
Marca
de Clase
Frecuencia
Frecuencia
Relativa
13
98
161
189
148
85
45
30
10
5
5
1
2
1
1
794
0.02
0.12
0.20
0.24
0.19
0.11
0.06
0.04
0.01
0.01
0.01
0.00
0.00
0.00
0.00
1.00
12
36
60
84
108
132
156
180
204
228
252
276
300
324
348
Media
94.25
Frecuencia
Relativa
Acumulada
0.02
0.14
0.34
0.58
0.77
0.87
0.93
0.97
0.98
0.99
0.99
0.99
1.00
1.00
1.00
156
3528
9660
15876
15984
11220
7020
5400
2040
1140
1260
276
600
324
348
74832
EMISIONES CO
200
180
160
140
120
100
80
60
40
20
336-360
312-336
288-312
264-288
240-264
216-240
192-216
168-192
144-168
120-144
96-120
72-96
48-72
24-48
0-24
1.00
0.75
0.50
0.25
336-360
312-336
288-312
264-288
240-264
216-240
192-216
168-192
144-168
120-144
96-120
72-96
48-72
24-48
0-24
0.00
b) El archivo mortalidad.dat contiene frecuencias de mortalidad humana. Se presentan en forma de una tabla de frecuencia con 2 columnas separadas por espacios; la
primera con los lmites inferior y superior del grupo de edad y la segunda con la cantidad de muertes.
Intervalo
0-5
5-10
10-15
15-20
20-25
25-30
30-35
35-40
40-45
45-50
50-55
55-60
60-65
65-70
70-75
75-80
80-85
85-90
90-95
95-100
Total
Marca
de 2.5
Clase
7.5
12.5
17.5
22.5
27.5
32.5
37.5
42.5
47.5
52.5
57.5
62.5
67.5
72.5
77.5
82.5
87.5
92.5
97.5
MORTALIDAD
Frecuencia Frecuencia *
1000
39.3
39300
12
12000
9.5
9500
10.8
10800
12.3
12300
14.6
14600
18.1
18100
23.2
23200
30.8
30800
41.7
41700
56.7
56700
76.4
76400
99.9
99900
123.3
123300
138.6
138600
134.2
134200
103.6
103600
56.6
56600
18.6
18600
3
3000
1023.2
1023200
Media
62.37
Frecuencia
Relativa
0.04
0.01
0.01
0.01
0.01
0.01
0.02
0.02
0.03
0.04
0.06
0.07
0.10
0.12
0.14
0.13
0.10
0.06
0.02
0.00
1.00
Frecuencia
Relativa
0.04
0.05
0.06
0.07
0.08
0.10
0.11
0.14
0.17
0.21
0.26
0.34
0.44
0.56
0.69
0.82
0.92
0.98
1.00
1.00
98250
90000
118750
189000
276750
401500
588250
870000
1309000
1980750
2976750
4393000
6243750
8322750
10048500
10400500
8547000
4952500
1720500
292500
63820000
MORTALIDAD
160000
140000
120000
100000
80000
60000
40000
20000
95-100
90-95
85-90
80-85
75-80
70-75
65-70
60-65
55-60
50-55
45-50
40-45
35-40
30-35
25-30
20-25
15-20
10-15
5-10
0-5
1.00
0.75
0.50
0.25
95-100
90-95
85-90
80-85
75-80
70-75
65-70
60-65
55-60
50-55
45-50
40-45
35-40
30-35
25-30
20-25
15-20
10-15
5-10
0-5
0.00
3.90
15.21
-38.98
132.17
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
4.90
5.00
5.00
5.20
5.30
5.40
5.90
5.90
6.00
6.00
6.00
6.00
6.00
6.10
6.10
6.20
6.20
6.30
6.40
6.40
6.40
6.40
6.50
6.50
6.70
6.80
6.80
6.80
24.01
25
25
27.04
28.09
29.16
34.81
34.81
36
36
36
36
36
37.21
37.21
38.44
38.44
39.69
40.96
40.96
40.96
40.96
42.25
42.25
44.89
46.24
46.24
46.24
-13.66
-12.02
-12.02
-9.14
-7.89
-6.76
-2.69
-2.69
-2.15
-2.15
-2.15
-2.15
-2.15
-1.69
-1.69
-1.30
-1.30
-0.97
-0.71
-0.71
-0.71
-0.71
-0.49
-0.49
-0.21
-0.12
-0.12
-0.12
32.66
27.53
27.53
19.10
15.70
12.78
3.74
3.74
2.77
2.77
2.77
2.77
2.77
2.01
2.01
1.41
1.41
0.96
0.63
0.63
0.63
0.63
0.39
0.39
0.12
0.06
0.06
0.06
6.90
7.00
7.10
7.20
7.20
7.30
7.60
7.60
7.80
7.90
8.00
8.00
8.10
8.10
8.30
8.30
8.40
8.50
8.50
8.60
8.60
8.70
9.00
9.20
9.30
9.50
9.70
9.90
10.10
10.60
10.90
11.20
15.10
Total
47.61
49
50.41
51.84
51.84
53.29
57.76
57.76
60.84
62.41
64
64
65.61
65.61
68.89
68.89
70.56
72.25
72.25
73.96
73.96
75.69
81
84.64
86.49
90.25
94.09
98.01
102.01
112.36
118.81
125.44
228.01
3660.26
-0.06
-0.02
-0.01
0.00
0.00
0.00
0.03
0.03
0.13
0.23
0.36
0.36
0.53
0.53
1.03
1.03
1.37
1.77
1.77
2.24
2.24
2.80
4.99
6.96
8.11
10.78
13.99
17.77
22.17
36.24
47.02
59.75
476.27
384.201082
0.02
0.01
0.00
0.00
0.00
0.00
0.01
0.01
0.07
0.14
0.25
0.25
0.43
0.43
1.04
1.04
1.51
2.14
2.14
2.94
2.94
3.95
8.54
13.29
16.30
23.83
33.70
46.36
62.29
119.95
169.72
233.58
3719.33
5772.33065
Percentil 50
p=
0.5
hp = j + d
hp = 0.50*64
hp =
32
hp = j + d
32 = 32 + 0.0
Pporcentaje = (1 - d) Xj + d X(j+1)
P50 = (1 - 0.0) X32 + 0.0 X33
P50 = (1.0) * 6.9 + 0.0* 7
P50 =
6.9
Percentil 75
p=
0.75
hp = j + d
hp = 0.75*64
hp =
48
hp = j + d
48 = 48 + 0.0
Pporcentaje = (1 - d) Xj + d X(j+1)
P75 = (1 - 0.0) X48 + 0.0 X49
P75 = (1.0) * 8.4 + 0.5* 8.5
P75 =
8.4
Percentil
25
50
75
Clculo
6
6.9
8.4
Media
7.29
Media
Varianza
Desviacin Estandar
Moda
7.29
4.10
2.03
6.00
Clculo Excel
6.075
6.95
8.425
Varianza
4.10
Desviacin Estndar
Desviacin Estndar
2.03
Error Estndar
0.25
e) Los bigotes inferior y superior del diagrama de caja de acuerdo con la regla vista en clase
Bigote Inferior
Bigote Inferior = observacin ms pequea pero mayor a Q1 1.5RQ
Q1 1.5RQ =
2.4
Bigote Inferior
3.20
Bigote Superior
Bigote Superior = observacin ms grande pero menor a Q3 + 1.5RQ
Q3 + 1.5RQ =
12
Bigote Superior
11.20
Karen Carla Kissling Carbajal - 814404
Bigote Inf.
Bigote Sup.
Q1 1.5RQ
Q3 + 1.5RQ
3.2
11.2
S=
Sesgo
2.03
0.76
Exceso de Curtosis
Exceso de Curtosis
2.71
Clculo Excel
2.84
f ) Realizar grficas
15.1
2.1
13
10
1.3
1.615384615
2.05
Plomo
0.300
0.250
0.200
0.150
0.100
0.050
15.05-16.05
14.05-15.05
13.05-14.05
12.05-13.05
11.05-12.05
10.05-11.05
9.05-10.05
8.05-9.05
7.05-8.05
6.05-7.05
5.05-6.05
4.05-5.05
0.000
3.05-4.05
2.05-3.05
Mximo
Mnimo
Rango
No. Intervalos
Amplitud
Lmite Inferior
Lmite Real
Estadstica Descriptiva
Media
7.290625
Error tpico
0.253181333
Mediana
6.95
Moda
6
Desviacin estndar2.025450665
Varianza de la muestra
4.102450397
Curtosis
2.839858649
Coeficiente de asimetra
0.757602346
Rango
13
Mnimo
2.1
Mximo
15.1
Suma
466.6
Cuenta
64
Nivel de confianza(95.0%)
0.505942518
1.000
0.800
0.600
0.400
0.200
15.05-16.05
14.05-15.05
13.05-14.05
12.05-13.05
11.05-12.05
10.05-11.05
9.05-10.05
8.05-9.05
7.05-8.05
6.05-7.05
5.05-6.05
4.05-5.05
3.05-4.05
2.05-3.05
0.000
12
Valores Grfica
Q1
Mediana
Q3
Bigote Superior
Bigote Inferior
6
0.9
1.5
2.8
2.8
Diagrama de Caja
10
Q3
6
Mediana
Q1
4
2
0
1
Medicion 1
Medicion 2
Medicion 3
Medicion 4
Medicion 5
1
2
3
4
5
6
7
8
9
10
11
29
29
34
35
30
34
30
28
32
35
35
38
34
40
34
35
40
35
35
35
32
36
29
36
36
35
36
29
34
37
29
31
35
28
36
30
30
34
35
35
35
30
31
36
34
35
36
37
34
36
30
30
39
28
39
33
31
37
33
31
38
37
35
35
33
34
38
35
38
30
35
31
36
32
33
35
35
29
34
32
38
38
38
39
40
34
38
35
38
35
30
33
35
29
35
33
30
38
32
34
37
37
37
33
34
31
37
41
29
36
36
30
35
31
35
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
31
34
35
30
37
31
32
36
36
36
34
35
37
31
35
34.4
29.8
36.4
36.8
31.4
35.4
34.8
30.2
35.8
33.6
34.6
34.6
33.2
35.4
34.4
33.2
35
33.2
34
35
34.4
34.6
33.6
36.2
33.8
32.4
27
28
29
30
36
30
36
34
30
36
35
40
38
34
29
34
36
35
31
30
35
34
33.8
35.6
Estadstica Descriptiva
Media
34.1533333
Error tpico
0.29628867
Mediana
34.4
Moda
34.4
Desviacin estndar
1.62283986
Varianza de la muestra
2.6336092
Curtosis
1.45475163
Coeficiente de asimetra
-1.04909684
Rango
7
Mnimo
29.8
Mximo
36.8
Suma
1024.6
Cuenta
30
Nivel de confianza(95.0%)
0.60597835
40
35
30
25
20
15
10
5
0
1
Media
Moda
Varianza
Desv. Estndar
Error Estandar
34.15
35.00
9.33
3.05
0.25
10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30
e) El archivo hydrophobics.dat contiene datos de mediciones de aldrin y hexaclorobenzeno. Las mediciones fueron hechas en el Ro Tennessee en un sitio abandandonado
donde se reciban desechos industriales. Se espera que las mediciones no tengan una distribucin vertical homogenea en el ro. Es importante verificar esta condicin, ya
que eso determina esquemas de muestreo posteriores. Grafique la informacin tratando de responder a esta preocupacin. Concluya.
Nivel
Superficie
Medio
Aldrin
3.08
3.58
3.91
4.31
4.35
4.4
3.67
5.17
5.17
4.35
5.17
6.17
6.26
4.26
3.17
3.76
4.76
4.9
6.57
5.17
HCB
3.74
4.61
4
4.67
4.87
5.12
4.52
5.29
5.74
5.48
6.03
6.55
3.55
4.59
3.77
4.81
5.85
5.74
6.77
5.64
5
4
Aldrin
3
HCB
2
1
0
1
10
Fondo
4.81
5.71
4.9
5.35
5.26
6.26
3.76
8.07
8.79
7.3
5.44
6.88
5.37
5.44
5.03
6.48
3.89
5.85
6.85
7.16
Aldrin
HCB
1
0
1
10
Aldrin
HCB
3
2
1
0
10
Aldrin
HCB
3
2
1
0
1
9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30