Beruflich Dokumente
Kultur Dokumente
A.)Salarios=
No
1
4
2
45
3
4
Salarios
2000.00
0
750.000
1500.000
1200.000
600.000
450.000
1111.864
B.)
Trabajadores
Rector
Secretarias
Coordinadores
Docentes
Celadores
Aseadoras
Salarios=
No
1
4
2
45
3
4
Salarios
2002.10
0
752.100
1502.100
1202.100
602.100
452.100
1113.964
2. Cuatro grupos de estudiantes consistentes en 15, 20, 10 y 18, individuos, dieron pesos medios de
162, 148, 153, y 140 lb, respectivamente. Hallar el peso medio de todos los estudiantes.
Estudiantes
1
2
3
4
Cantidad
15
20
10
18
Peso
162
148
153
140
ANGIE CAMACHO
Peso=
16215+14820+15310+14018 9440
=
=
149,8
63
63
2.3
1.8
1.7
3.8
3.3
1.0
2.9
1.0
4.1
2.2
5.0
3.1
3.8
4.4
4.6
3.2
4.2
4.2
4.5
4.1
2.8
3.3
3.1
4.0
4.4
3.5
1.8
1.7
3.5
3.3
4.2
2.9
1.5
3.3
4.8
5.0
4.4
2.6
2.1
4.4
c= 6
=0,666
= 0,7
rango=0,7*6=4.2
diferencia = 4.2-4=0.2
xmin= 1-0.1=0.9
xmax=5+0.1=5.1
f
xi
f* xi
0.9-1.6
1.25
3.75
1.6-2.3
1.95
13.65
Intervalos
Notas
media=
147.95
=3.28
45
2.3-3
3-3.7
12
2.65
3.35
4.05
13.25
40.20
4.75
3.7-4.4
12
48.60
4.4-5.1
28.50
45
147.95
ANGIE CAMACHO
4.5
2.3
1.0
3.2
1.8
2.9
Hombres:
3.3
1.7
1.0
3.3
3.8
4.1
2.7
3.3
2.2
Mujeres=
5.0
3.1
3.2
4.2
2.8
3.3
3.5
1.8
4.2
2.9
5.0
4.4
3.8
4.4
4.6
4.2
4.5
4.1
3.1
4.0
4.4
1.7
3.5
3.3
1.5
3.3
4.8
2.6
2.1
4.4
Hombres=
3.2818+3.3227
=3.304
45
4. Al consejo directivo de un colegio le han llegado las quejas de que los precios de las comidas y
artculos que se venden en la cafetera estn elevados. Para averiguar si el rumor es cierto se
tomaron como muestra algunos artculos encontrndose los siguientes precios.
73
70
86
75
72
66
90
85
70
72
81
70
75
84
62
66
74
82
75
68
83
81
65
75
70
65
82
85
80
66
73
95
84
75 68
80
75
68
72
78
73 72 68
84
75
72
80
Para ayudar al consejo directivo y determinar si el rumor es cierto o falso realice las siguientes
actividades.
a. Agrupar en intervalos de clase apropiados
b. Determinar el precio promedio de los artculos
c. Determinar la mediana de los artculos
d. Calcule, Q1, Q3, D3, D5, D7, P80, V2, V3, P70.
e. Realice un grfico de bigotes y su respectivo anlisis con las medidas visualizadas
f. Realice un grfico de barras
g. Realice un grfico de ojivas de la distribucin.
h. Respecto a las grficas y las medidas de tendencia central, elabore una conclusin.
A.) Rango= 95-62=33
m=1+3.3*log(47)=7
33
=4.714=5
c= 7
ANGIE CAMACHO
rango=7*5=35
diferencia =35-33=2
xmin= 62-1=61
xmax=95+1=96
Intervalos
3509.5
=74.67
47
C.)
66-71
h
F
0.1276596 6
0.1702128
14
71-76
intervalos f
(61,66]
6
8
(71,76]
16
(76,81]
(81,86]
(86,91]
(91,96]
0.340425 30
76-81
5
0.1276596 36
81-86
0.1914894 45
86-91
0.0212766 46
91-96
0.0212766
47
Mediana= Me= Li +
Fa
2
*C
f
47
14
ME= 71+ 2
5=73.96875
16
( )
47
6
D.) Q1=66 + 4
5=69,59375
8
( )
347
30
4
Q3= 76+
5=80.375
6
xi
f* xi
promedio=
Precios
61-66
(66,71]
63.5
68.5
73.5
H8
marca
0.1276596 78.5
63.5
0.297872
68.5
16
83.5
3
0.638297 88.5
73.5
6
9
93.5
0.765957 78.5
49
0.957446 83.5
8
1
0.978723 88.5
4
1
10.000.00
93.5
0
47
381
548
X
381.0
548.0
1176
1176.0
471
471.0
751.5
751.5
88.5
88.5
93.5
3509.5
ANGIE CAMACHO
347
14
10
D3= 71+
5=71.03125
16
(
(
(
(
(
(
(
)
)
)
547
14
10
D5= 71+
5=73.96875
16
747
30
10
D7= 76+
5=78.41667
6
8047
36
100
P80= 81+
5=81.8889
9
)
)
8047
30
100
P70= 76+
5=78.41667
6
247
14
5
V2= 71+
5=72.5
16
)
)
347
14
5
V3= 71+
5=75.4375
16
ANGIE CAMACHO
Frecuencias
ANGIE CAMACHO
118 _ 126
127 _ 135
136 _ 144
145 _ 153
154 _ 162
163 _ 171
172 _ 180
3
6
8
10
7
4
2
Calcule el valor de la media y la mediana, y realice interpretaciones de las dos medidas obtenidas.
Pesos
118-126
127-135
xi
122
131
17
140
27
149
34
158
38
167
40
176
f* xi
366
786
136-144
1120
145-153
10
154-162
1106
163-171
668
1490
Media, pesos
5888
=147.2
40
promedio=
172-180
Mediana =Me=
352
40
5888
40
17
2
145+
8=147.4
10
( )
palabras ledas en 15 segundos por un grupo de 120 sujetos dislxicos y 120 individuos normales.
Teniendo en cuenta los resultados de la tabla
No de palabras ledas
26
27
28
29
30
Dislxicos
24
16
12
10
2
Normales
9
21
29
28
32
ANGIE CAMACHO
Calcule:
Realizar los anteriores clculos en R-Estadstico, dibujar las respectivas cajas de bigotes.
No de palabras
Dislxico
ledas
26
27
28
29
30
s
24
16
12
10
2
a.) dislexicos
> datos=read.table("dis.txt")
> attach(datos)
> datos
> f=table(datos)
>f
> x=c(26,27,28,29,30)
No de palabras
ledas
26
27
28
29
30
datos
26 27 28 29 30
24 16 12 10 2
[1] 26 27 28 29 30
Normales
9
21
29
28
32
ANGIE CAMACHO
X
> cbind(x,f)
> xf=x*f
> xf
> cbind(x,f,xf)
> n=sum(f)
>n
> media=sum(xf)/n
> media
x f
26 26 24
27 27 16
28 28 12
29 29 10
30 30 2
datos
26 27 28 29 30
624 432 336 290 60
x f xf
26 26 24 624
27 27 16 432
28 28 12 336
29 29 10 290
30 30 2 60
[1] 64
[1] 27.21875
Normales
> datos=read.table("normales.txt")
> attach(datos)
> datos
> f=table(datos)
>f
> x=c(26,27,28,29,30)
X
> cbind(x,f)
> xf=x*f
> xf
> cbind(x,f,xf)
> n=sum(f)
datos
26 27 28 29 30
9 21 29 28 32
[1] 26 27 28 29 30
x f
26 26 9
27 27 21
28 28 29
29 29 28
30 30 32
datos
26 27 28 29 30
234 567 812 812 960
x f xf
26 26 9 234
27 27 21 567
28 28 29 812
29 29 28 812
30 30 32 960
[1] 119
ANGIE CAMACHO
>n
> media=sum(xf)/n
> media
[1] 28.44538
Normales:
Q1
quantile(datos,
Q3
quantile(datos,
D5
quantile(datos,
D7
quantile(datos,
P35
quantile(datos,
P70
quantile(datos,
e.)
No de palabras ledas
26
27
28
29
prob = c(0.25))
prob = c(0.75))
prob = c(0.50))
prob = c(0.70))
prob = c(0.35))
prob = c(0.70))
Dislxicos
24
16
12
10
25%
27.5
75%
30
50%
29
70%
29
35%
28
70%
29
No de palabras
ANGIE CAMACHO
30
ledas
26
27
28
29
30
Normales
9
21
29
28
32
7.) Con el fin de observar la relacin entre la inteligencia y el nivel socioeconmico (medido por el
salario mensual familiar) se tomaron dos grupos, uno formado con sujetos de cociente intelectual
ANGIE CAMACHO
inferior a 95 y otro formado por los dems; De cada sujeto se anot el salario mensual familiar.
Teniendo en cuenta los resultados que se indican en la tabla:
Nivel socioeconmico
Intervalos
6 10
10 16
16 22
22 28
28 34
34 40
Frecuencia
75
35
20
30
25
15
Sujetos con
Frecuencia
19
26
25
30
54
46
A)
B) medidas de tendencia central para aquellos sujetos con CI < 95
Nivel socioeconmico
Intervalos
6 10
10 16
16 22
22 28
28 34
34 40
> f=c(75,35,20,30,25,15)
ANGIE CAMACHO
>
>
>
>
>
>
>
>
>
>
>
>
>
>
>
>
>
>
>
>
>
>
>
>
>
>
>
>
>
>
>
liminf=c(6,10,16,22,28,34)
limsup=c(10,16,22,28,34,40)
marca=(limsup+liminf)/2
marca
X=f*marca
X
F=cumsum(f)
F
cbind(f,F,marca,X)
n=200
n
media=sum(X)/n
media
n/2
li=10
Fa=75
fo=35
c=4
me=li+((n/2-Fa)/fo)*c
me
fo=75
fa=0
fs=35
li=6
delta1=fo-fa
delta1
delta2=fo-fs
delta2
mo=li+(delta1/(delta1+delta2))*c
mo
cbind(media,me,mo)
[1,]
[2,]
[3,]
[4,]
[5,]
[6,]
[1]
f
75
35
20
30
25
15
8 13 19 25 31 37
F
75
110
130
160
185
200
marca X
8
600
13 455
19 380
25 750
31 775
37 555
[1] 17.575
[1] 100
[1] 12.85714
[1] 75
[1] 40
[1] 8.608696
media
me
mo
[1,] 17.575 12.85714 8.608696
ANGIE CAMACHO
Nivel socioeconmico
Sujetos con
Frecuencia
19
26
25
30
54
46
Intervalos
6 10
10 16
16 22
22 28
28 34
34 40
> f=c(75,35,20,30,25,15)
>cbind(f)
> liminf=c(6,10,16,22,28,34)
> limsup=c(10,16,22,28,34,40)
> marca=(limsup+liminf)/2
> marca
> X=f*marca
>X
> F=cumsum(f)
>F
> cbind(f,F,marca,X)
> n=200
>n
> media=sum(X)/n
> media
> n/2
> li=22
> Fa=70
> fo=30
> c=4
> me=li+((n/2-Fa)/fo)*c
> me
> fo=54
> fa=30
> fs=46
> li=28
> delta1=fo-fa
f
[1,] 19
[2,] 26
[3,] 25
[4,] 30
[5,] 54
[6,] 46
[1] 8 13 19 25 31 37
f F marca X
[1,] 19 19 8 152
[2,] 26 45 13 338
[3,] 25 70 19 475
[4,] 30 100 25 750
[5,] 54 154 31 1674
[6,] 46 200 37 1702
[1] 200
[1] 25.455
[1] 100
[1] 26
[1] 24
ANGIE CAMACHO
> delta1
> delta2=fo-fs
> delta2
> mo=li+(delta1/(delta1+delta2))*c
> mo
> cbind(media,me,mo)
[1] 8
[1] 31
media me mo
[1,] 25.455 26 31
8). Considere las siguientes medidas: media, mediana, moda, (max + min)/2, primer cuartil, tercer
cuartil. Dos de las propiedades de abajo pertenecen a las medidas anteriores.
1. Su valor siempre tiene que ser igual a uno de los datos observados.
2. Divide al conjunto de datos en dos conjuntos de igual tamao.
3. Es el centro de los datos en un intervalo de clase.
4. Siempre existe.
9).Se ha definido una nueva medida Cuantil, los Quintiles, en cuantas partes divide a una distribucin
los quintiles, y cul es el quintil cuyo valor corresponde a la mediana?
1. 5 partes
2. El 3 quintil
3. 50 partes
4. El segundo Quintil
10).Si se dan los siguientes Cuantles: Q1; Q2 ; Q3; D2; D5; D8; P25; P50; P90; en cual de los
siguientes alternativas los Cuantles mostrados son equivalentes
A. Q3; D8; P50
B. Q2; D5; P50
C. Q3; D8; P90
D. Q2; D5; P25
E. Q1; D2; P50
ANGIE CAMACHO
11). Se sabe que ninguna de las sucursales de una empresa comercial tiene ms de 9 empleados o
menos de 7. La mayora tiene 8 empleados, pero el 25% tiene 9 empleados y una de cada 10
sucursales tiene 7 empleados. Cul es el promedio de empleados por sucursal?.
A. 10.15
B. 8.15
C. 9.15
D. 15.15
E. 11.15
13.)
Los
salarios
pagados
Cargos
Num
Salar
Director
ero
2
io
930.0
es
Supervis
00
510.0
ores
Economis
00
370.0
00
350.0
26
00
246.0
110
00
190.0
los
tas
Contador
es
Auxiliare
s
Obreros
00
empleados
de
una
compaa
se
ANGIE CAMACHO
El valor de la media y el Q2
1. 250.000
2. 360.000
3. 229052
4 370.000
14). En una muestra de las compras de 15 estudiantes en la tienda de una escuela primaria, se
observan las siguientes cantidades de ventas, dispuestas en orden de magnitud ascendente: $100,
$100, $250, $250, $250, $350, $400, $530, $900, $1250, $1350, $2450, $2710, $3090,
$4100.
15).
Los
siguientes
datos
representan
las
edades
de
los
pacientes
admitidos
al
hospital
37
62
47 54
54
63
81
16
64
24
10
11
39 16
34
22
24
80
58
84
10
35
71
Durante el mes de agosto de 2002, la edad media de los pacientes admitidos al hospital de la
comunidad era de 8 aos. Hay suficiente evidencia para concluir que la edad media de los pacientes
admitidos durante el mes de agosto de este ao es mayor que la edad mediana de los admitidos en el
2002?
ANGIE CAMACHO
I. se debe calcular la media y realizar una diferencia para establecer la evidencia de la afirmacin
II. Se debe calcular la varianza para establecer la veracidad de la afirmacin
>datos=c(37,62,47,54,54,8,63,7,81,1,16,3,64,2,24,
[1] 37 62 47 54 54 8 63 7 81
10,11,39,16,4,34,22,24,6,80,4,35,58,71,84,8,10)
1 16 3 64 2 24 10 11 39 16 4
> datos
34 22 24 6 80 4 35 58 71 84
> mean(datos)
> Varianza<-function(x=NA)
8 10
[1] 32.46875
[1] 707.374
+{
+ n=length(x)
+ media=sum(x)/n
+ v<-sum((x-media) ^2)/n
+ return(v)
+}
> Varianza(datos)
16). Una compaa recoge informacin sobre los precios de libros de texto de matemticas. En el
2000, el precio promedio para todos los textos de matemticas era de $45.400, con una desviacin
tpica de $100. Los precios de 32 libros de matemticas seleccionados al azar durante este ao son:
50 40 41 48 48 42 49 50
48 45 56 41 57 42 45 46
45 66 45 45 55 66 42 50
46 46 55 48 45 58 47 35
El precio promedio de los libros para este ao es mayor que el precio de los libros en el ao 2000
POR QUE, el coeficiente de variacin es tambin mayor.
Rta: por que tuvo un incremento en su promedio el cual aumento en $2.787 dando un promedio de $48.187
con un coeficiente de variacin de 14.25%
17). Multiplicando por 4 cada uno de los valores de la variable, X: 3, 2, 0, 5, se obtiene la serie Y:
12, 8, 0, 20, Para comprobar que las series tienen el mismo coeficiente de variacin se debe
ANGIE CAMACHO
I. Calcular las medias de ambas series
X=3,2,0,5
Media=2.5
Varianza=3.25
Y=12,8,0,20
Media =10
Varianza=52
Coeficiente variacin X
> Cv<-function(x=NA)
[1] 0.7211103
+{
+ n=length(x)
+ media=sum(x)/n
+v<-(sqrt(sum((x-media) ^2)/n))/media
+ return(v)
+}
> datos=c(12,8,0,20)
> Cv(datos)
> Cv<-function(x=NA)
[1] 0.7211103
+{
+ n=length(x)
+ media=sum(x)/n
+v<-(sqrt(sum((x-media) ^2)/n))/media
+ return(v)
+}
> datos=c(3,2,0,5)
> Cv(datos)
18.) En una universidad de la capital, se ha Encontrado que los promedios en los 4 primeros
semestres de las notas de Matemticas corresponden a: 3.2,
3.4,
3.0,
3.8, si la cantidad de
alumnos matriculados fue de 30, 35, 40, 22 respectivamente, y sabiendo que existe un
4 de
ANGIE CAMACHO
Varianza, entonces el coeficiente de variacin del promedio total de las notas de los cuatro
semestres corresponde a:
A. 60.6 %
B. 70.6%
C. 75.6%
D. 65.6%
E. 55.6%
1. La varianza en el ejemplo representa una buena medida para establecer la veracidad del dato promedio.
2. $600.000 de acuerdo a la desviacin Standard no es una medida suficiente representativa.
3. La media de $600.000 es suficientemente representativa ya que la desviacin estndar es pequea.
4. La media no esta acorde con la realidad lo dice el enorme tamao de la Varianza.
20). 7. Mediante
Si en total existen 180 estudiantes con un promedio total de 3,4 y un coeficiente de variacin del
2.5%, entonces cuantos estudiantes sobresalientes tiene la facultad?
A. 100
B. 96
C. 45
D. 99
E. 9
ANGIE CAMACHO
A. 0.085
B. 0.025
C. 7.2
D. 0.085
E. 0.0072
22). Una cantidad que se toma en cuenta para evaluar proyectos azarosos es la desviacin estndar.
sta mide la dispersin de los resultados del proyecto azaroso. Es decir, si hay dos proyectos: A y
B. Y si la desviacin estndar del rendimiento del proyecto A es mayor que la del B. El proyecto A
es ms arriesgado, el B es ms Estable. Si ambos tienen valor esperado parecido el A tiene
posibilidades de rendir mucho ms que el B pero, tambin el A tiene posibilidad de generar mayores
prdidas que el B.
La Afirmacin anterior es verdadera porque:
23). La resistencia de 100 baldosas de la fabrica De las casas se referencia en la siguiente tabla.
Kg./Cm2
100_ 200
magnitudes
unidades
de
medida.
200_ 300
10
300_ 400
21
400_ 500
33
500_ 600
18
600_ 700
700_ 800
Concluimos que:
baldosas.
B. Es mucho ms dispersa la informacin correspondiente al salario de los empleados.
ANGIE CAMACHO
C. Ambas informaciones presentan la misma dispersin y por tanto no se puede tomar una decisin.
D. La Varianza en los salarios es diferente en la resistencia de las baldosas eso hace que el anlisis entre
las dos informaciones sea indiferente
100
101
120
115
130
150
112
145
138
121
126
115
140
137
143
118
147
149
150
115
100
127
135
149
146
137
122
118
135
129
Elabore una distribucin de frecuencias, para datos agrupados, indicando los valores de los lmites
reales. Y calcule: Cuartil 2, Coeficiente de variacin, Interpretacin con respecto al Cv.
>datos=c(100,101,120,115,130,150,1
[1] 100 101 120 115 130 150 112 145 138 121
12,145,138,121,126,115,140,137,14
126 115 140 137 143 118 147 149 150 115 100
3,118,147,149,150,115,100,127,135,
149,146,137,122,118,135,129)
[30] 129
> datos
> rang=max(datos)-min(datos)
[1] 50
> rang
> m=round(1+3.3*log10(30))
[1] 6
>m
> c=rang/m
[1] 8.333333
>c
> nuevo=c*m
Aproximamos=9
[1] 54
> nuevo
> inicio=min(datos)-2
inicio final
> final=max(datos)+2
[1,]
> cbind(inicio,final)
>intervalos=cut(datos,breaks=c(98
[1] (98,107]
, 107,116,125,134,143,152))
> intervalos
98 152
(98,107]
(116,125] (107,116]
ANGIE CAMACHO
[25] (143,152] (134,143] (116,125] (116,125]
(134,143] (125,134]
Levels: (98,107] (107,116] (116,125] (125,134]
> f=table(intervalos)
>f
(134,143] (143,152]
intervalos
(98,107]
(107,116]
(116,125]
(125,134]
(134,143] (143,152]
4
> n=sum(f)
3
[1] 30
>n
> F=cumsum(f)
(98,107]
(107,116]
>F
(134,143] (143,152]
3
>
(116,125]
12
(125,134]
16
23
30
[1] 102.5 111.5 120.5 129.5 138.5 147.5
liminf=c(98,107,116,125,134,143)
>
limsup=c(107,116,125,134,143,152
)
> marca=(limsup+liminf)/2
> marca
> x=f*marca
>x
intervalos
(98,107]
(107,116]
(116,125]
(125,134]
(134,143] (143,152]
307.5
969.5
cbind(f,F,marca,x)
446.0
1032.5
f F marca
602.5
x
518.0
ANGIE CAMACHO
> n/2
> Fa=12
[1] 15
[1] 131.75
> fo=4
> li=125
> Q2=li+((2*n/4-Fa)/fo)*c
> Q2
> d2=(marca-media)^2*f
> d2
intervalos
(98,107]
(107,116]
(116,125]
(125,134]
378.45
0.36
(134,143] (143,152]
2138.67
1253.16
605.43 2344.23
f F marca
cbind(f,F,marca,d2)
d2
0.36
> varianza
> ds=sqrt(varianza)
[1] 14.96696
> ds
> cv=ds/media
[1] 0.1158434
> cv
25). En los siguientes enunciados uno es verdadero.
ANGIE CAMACHO
26.) Cuando la media aritmtica de un determinado nmero de datos es $270.50 y la desviacin
tpica es de $33.99, el coeficiente de variacin (CV) es igual a:
A. 6.2%
B. 795.82%
C. 2.6%
D. 5.4%
E. 1.8%