Sie sind auf Seite 1von 13

UNIVERSIDAD ANDRES BELLO

DEPARTAMENTO DE MATEMATICAS
GUIA 1 EJERCICIOS RESUELTOS: ESTADISTICA DESCRIPTIVA
PROF: PAOLA BARILE
1.

Clasifique las siguientes variables segn escala de medicin y recorrido e identifique en


cada caso la unidad de observacin.
1.1
Origen tnico de los habitantes de Amrica del Sur.
1.2
Tasas de inters de prstamos de consumo..
1.3
Tiempo de demora, en minutos, en ser atendido un cliente en la fila de un banco.
2
1.4
Intensidad solar directa (watts/m ) en distintos das en la zona Sur de Chile.
1.5
Ventas anuales .
1.6
Modo de pago (al contado, cheque, tarjeta de crdito)

SOLUCION:
Variable

Escala de medicin

Recorrido

Unidad de observacin.

1.1

Origen tnico

Nominal

Discreta

1.2

Tasas
de
inters
Tiempo
de
demora
Intensidad
solar directa
Ventas
Modo de pago

De razn

Continua

Habitantes de Amrica del


Sur.
Prstamos de Consumo.

Intervalo

Continua

Los clientes

De razn

Continua

De razn
Nominal

Continua
Discreta

Los das en la zona Sur de


Chile.
Los aos.
Los pagos

1.3
1.4
1.5
1.6

2.

En una compaa aseguradora se registr la siguiente informacin respecto del nmero de


accidentes de los vehculos asegurados, en esa compaa, durante los ltimos seis meses:
Nmero de Accidentes
Nmeros de vehculos
2.1
2.2
2.3

SOLUCIN.
2.1

1
450

2
120

3
50

4
20

5
10

Identifique la variable en estudio, clasifique la variable segn recorrido e indicar cul


es la unidad de observacin.
Grafique las frecuencias relativas acumuladas.
Obtenga H4 - H 2 ( la diferencia entre la cuarta y la segunda frecuencia relativa
acumulada) e interpretar el resultado.

Variable: Cantidad de accidentes de los vehculos asegurados en la compaa


aseguradora durante los ltimos seis meses.
Segn recorrido la variable es discreta.
Las unidades de observacin son los vehculos asegurados en esa compaa.

2.2
Xi
Fi

1
0.6923

2
0.8769

3
0.9538

4
0.9846

5
1.000

Distribucin de los vehculos asegurados segn la cantidad de


accidentes durante los ltimos seis meses

Frecuencias Porcentuales
Acumuladas

1,2
1
0,8
0,6
0,4
0,2
0
1

Nmero de accidentes

2.3

3.

H4 H2 = 0,9846 0,8769 = 0,1077


El 10,77% de los vehculos ha tenido entre 2 y 3 accidentes en los ltimos seis
meses.

Los siguientes datos corresponden a la cantidad de hijos declarada por 30 familias en una
encuesta social:
20-135523-4012304-533-4213223
17532
3.1
3.2
3.3

Obtenga la cantidad media y cantidad mediana de hijos.


Cul es la desviacin estndar del nmero de hijos?
Ordene los datos en una tabla de frecuencias y presente grficamente la frecuencia
relativa.

SOLUCIN:
3.1

X=

2 + 0 + 1 + ... + 3 + 2
= 2,7 3 hijos (corresponde a la media o promedio)
30

Para obtener la mediana, se debe ordenar los datos de menor a mayor. Estos son:
000111122222223
333333-3 44455557
Como el nmero de observaciones es par (30), la mediana corresponde al
promedio de las dos observaciones centrales, es decir,

Me( X ) =

X (15 ) + X (16 )
2

3+ 3
= 3 Hijos.
2

El 50% de las familias tiene a lo

ms tres hijos.
3.2

2x =

2 2 + 0 2 + ... + 2 2
30

2 ,7 2 =

301
30

2 ,7 2 = 2 ,743 x = 1 ,6563 hijos

3.3

Distribucin de las familias segn la cantidad de hijos:


Cantidad de hijos
0
1
2
3
4
5
6
7
TOTAL

Cantidad de familias
3
4
7
8
3
4
0
1
30

Proporcin de familias
0,1000
0,1333
0,2333
0,2667
0,1000
0,1333
0,0000
0,0333
1,0000

La frecuencia relativa se presenta en el siguiente grfico de barras:


Distribucin de las familias segn cantidad de hijos

Porcentaje de Familias

30

26,67
23,33

25
20
13,33

15

13,33

10

10

10
3,33

5
0
0
0

Cantidad de Hijos

4.

Los siguientes datos corresponden a los pesos, en miligramos, de 25 tabletas de aspirinas.


672,2 679,2 669,8 672,6 672,2 662,2 662,7 661,3 654,2 667,4
667,0 670,7 665,5 672,9 664,8 655,1 669,1 663,6 655,2 657,5
655,7 662,5 665,6 684,7 659,5
4.1
4.2
4.3

Obtenga el peso mediano de estas aspirinas.


Dibuje la grfica de caja y bigotes. Comente.
Construya una tabla de frecuencias con 5 clases.

4.4

Usando la tabla construida en 4.3 obtenga el intervalo comprendido por

x 2 .

SOLUCIN.
4.1

Para obtener el valor mediano, se ordenan los datos obteniendo:


654,2 655,1 655,2 655,7 657,5 659,5 661,3 662,2 662,5
663,6 664,8 665,5 665,6 667,0 667,4 669,1 669,8 670,7
672,2 672,2 672,6 672,9 679,2 684,7

662,7

Como el nmero de observaciones es impar, la mediana corresponde a la


observacin que est justo al medio, es decir, en la posicin 13. El peso
mediano de estas aspirinas es 665,5 mg, El 50% de estas aspirinas tiene un
peso de a lo ms 665,5 mg y el otro 50% pesa a lo menos 665,5 mg.
4.2

Para trazar esta grfica se necesitan 5 puntos: Mnimo, mximo, mediana, primer
cuartil (percentil 25) y tercer cuartil (percentil 75).
Por lo tanto, nos falta el
primer cuartil (percentil 25) y el tercer cuartil (percentil 75).
Obtencin del percentil 25:

25 25
= 6,25
100

Como no es entero, entonces,

el valor del percentil 25 es la observacin que est en el (6+1) = 7 lugar de los


datos ordenados y corresponde a 661,3 P25 = 661,3 mg.
Obtencin del percentil 75:

75 25
= 18,75 P75 = 670,7 mg
100

DIAGRAMA DE CAJA:

654,2

661,3

665,5

670,7

684,7

Comentario: Por el diagrama resultante se observa que la distribucin de los datos


es ms bien asimtrica con sesgo a la derecha.

4.3 Las tablas de frecuencia posible son diversas, un ejemplo de ellas:


Xi - Xi+1
650-657
657-664
664-671
671-678
678-685

Xi

ni

Ni

fi

Fi

653.5
660.5
667.5
674.5
681.5

4
7
8
4
2

4
11
19
23
25

0.16
0.28
0.32
0.16
0.08

0.16
0.44
0.76
0.92
1

Los valores de promedio ( x ) y de desviacin estndar


de cada tabla. Para esta tabla en particular se tiene:

x=

(
)

variarn segn los intervalos

653.5 * 4 + 660.5 * 7 + 667.5 * 8 + 674.5 * 4 + 681.5 * 2


= 665.54
25

653.5 2 * 4 + 660.5 2 * 7 + 667.5 2 * 8 + 674.5 2 * 4 + 681.5 2 * 2


=
665.54 2 = 8.047
25

Por lo tanto el intervalo de

5.

x 2

es

[649.446 681.634]

Uno de los indicadores ms importantes de la contaminacin es la concentracin de polvo


en el aire. La distribucin de frecuencias de 160 mediciones en una ciudad viene dada por
la siguiente tabla:

Intervalo N

Lmites

1
2
3
4
5
6

yi

ni

Ni

hi
0,05

31
53
148

0,1375

11,0

Los intervalos son de dos unidades de amplitud.


5.1
5.2

Complete la tabla de frecuencias (no olvide incluir los ttulos de las columnas).
Efecte un anlisis estadstico con la informacin de la tabla y obtenga los
estadsticos de posicin y dispersin ms adecuados.
Grafique las frecuencias relativas.

5.3
SOLUCION:
5.1

Intervalo Concentraci
N
n
[LI LS[

1
2
3
4
5
6

5.2

02
24
46
68
8 10
10 12

Concentracin
N de
promedio
medicione
(yi)
s
(ni)
1
3
5
7
9
11

8
31
53
34
22
12

N
acumulado
de
mediciones
(Ni)
8
39
92
126
148
160

Proporcin Proporcin
acumulada
de
mediciones
de
(hi)
mediciones
(Hi)
0,05
0,19375
0,33125
0,2125
0,1375
0,075

0,05000
0,24375
0,57500
0,78750
0,92500
1,0000

La mayora de las mediciones tiene una concentracin entre 4 y 6, la minora una


concentracin entre 0 y 2 y ms del 50% (57,5%) tiene una concentracin inferior a 6.
Como la distribucin de las mediciones es asimtrica, las medidas de posicin y
dispersin ms adecuadas son la mediana y el recorrido intercuartlico,
respectivamente.

Q = Q 3 Q1
120 92
Q = 6 + 2
= 7,647
3
34

80 39
= 5,547
53

Me ( x ) = 4 + 2

40 39
= 4,038
53

Q1 = 4 + 2

Q = 7,647 4,038 = 3,609


5.3
Distribucin porcentual de las mediciones segn concentracin
33,125

35

Porcentaje de Mediciones

30
25

21,25

19,375

20

13,75

15
10

7,55
5

5
0
1

11

Conce ntracin

6. La siguiente distribucin de porcentajes corresponde a los tiempos de demora en la


atencin (X) y los tiempos de atencin (Y) de un grupo de clientes en una Isapre.
X(%) Y(%)
0-10
10-20
20-30
30-40
40-50
Total

6.1
6.2
6.3
SOLUCION.

0-10
3
0
0
0
0
3

10-20
3
6
0
0
0
9

20-30
0
3
9
8
2
22

30-40
0
0
3
24
27
54

40-50
0
0
0
10
2
12

Total
6
9
12
42
31
100

Cul de las distribuciones es ms homognea?. Justifique.


De entre los clientes con a lo ms 30 minutos de duracin de la atencin, en qu
porcentaje la atencin demor al menos 28 minutos?.
Calcule e interprete Cov(X,Y).

6.1

C .V . x =

11,41
= 0,343 ;
33,3

C .V . y =

9,13
= 0,2916
31,3

Es ms homognea los tiempos destinados a atencin, ya que su coeficiente de


variacin es menor.

6.2
Tiempo de demora
0-10
10-20
20-30
30-40
40-50
Total

N de observaciones con Y 30
6
9
9
8
2
34

i 34

100 15
28 = 20 + 10

N Acumulado de observac.
6
15
24
32
34

i = 65,29% de las muestras es a lo ms igual al

28% 100 i = 34,71% de los tiempos de demora son al menos del 28 minutos
cuando el tiempo de atencin es a lo ms de 30 minutos.
6.3 Cov(x,y) =?

x = 33,3%
y = 31,3%

xy =

5(5 3 + 15 3 ) + 15(15 6 + 25 3 ) + ... + 45(25 2 + 35 27 + 45 2 )


= 1120
100

Cov (x, y) = 1120 33,3 31,3 = 77,71


Como la covarianza es positiva, podemos decir que existe una relacin lineal
positiva (directa) entre las variables.

7.
Para analizar la duracin de cierto tipo de componentes elctricos, se tom una muestra de
200 componentes y se obtuvieron los resultados que se indican en la tabla siguiente:
2

Duracin (en 10 horas) Nmero


componentes
2,25 2,75
6
2,75 3,25
17
3,25 3,75
25
3,75 4,25
40
4,25 4,75
33
4,75 5,25
28
5,25 5,75
19
5,75 6,25
15
6,25 6,75
10
6,75 7,25
7

de

7.1

Construya el histograma y el polgono de frecuencias correspondientes.

7.2

Calcule la media ( x ), la mediana (Me) y la varianza ( s x ).

SOLUCION:
7.1
45
Nmero de Componentes

40
35
30
25
20
15
10
5
0
2,5

3,5

4,5

5,5

6,5

Duracin

7.2

x=

880 , 50
200

= 4 ,403

( 10 horas)

100 88

33

Me = 4 , 25 + 0, 5

( 10 horas)

4295 , 25
2
2
sx =
4 ,403
= 2 ,090 ( 102 horas)2
200
8.

Usted ha sido contratado como Jefe Administrativo en una industria envasadora de


alimentos. Debido a la crisis econmica existente se debe decidir desechar una de dos
mquinas que se utilizan para el envasado de productos de contenido neto 200 gramos.
Para la mquina I se tiene la siguiente informacin de una muestra de un lote de
produccin:
Peso (gr.)
176 186
186 196
196 206
206 216
216 226

Cantidad de productos
5
20
50
20
5

Para la mquina II se poseen los siguientes antecedentes de una muestra de 80 productos:


80

X
i =1

= 16.120 gr .; X i2 = 3.248.300 [gr .]


80

i =1

donde Xi : peso del i-simo producto.


8.1
8.2

8.3

Usted ha decidido rechazar aquella mquina cuyo envasado sea ms heterogneo,


Cul debe rechazar?
Si se consideran anormales aquellos productos con un peso mayor a 215 gramos o
menor a 190 gramos. Calcule el porcentaje de productos con peso normal para la
mquina I.
Suponga que se decide seguir trabajando con ambas mquinas, y que por cada
100 productos envasados por la mquina I, la mquina II envasa 80 productos.
Calcule el peso promedio y desviacin estndar del total de los productos
envasados (por ambas mquinas).

SOLUCION:

= 201 gr .; 2 = 80[gr .]2 ; = 8,94 gr .


I
I
I
x = 201,5 gr .; 2 = 1,5[gr .]2 ; = 1,22 gr .
II
II
II

x
8.1

La mquina que presenta mayor heterogeneidad es la I; por lo tanto, sa es la


mquina rechazada.
8.2

100 x

75

P = 215 = 206 + 100


10 x = 93 %
x
20

100 y

P = 190 = 186 + 100


10 y = 13 %
y
20

Productos con peso normal = y x = 93 13 = 80%.


8.3

xT =

201 100 + 201,5 80


180

= 201, 2gr .

80 100 + 1,5 80
201 201, 2
2
T =
+
180
T =

45,1728 = 6 ,721gr .

)2 100 + (201,5 201, 2)2 80 = 45,1728[gr .]2


180

9.

Se realiz un estudio en la primera plaza de peaje saliendo de Santiago hacia la costa, en


la fecha 16 y 17 de septiembre con respecto a las siguientes variables:
X : nmero de personas que viajan dentro de cada vehculo que fue encuestado
Y : Monto en miles de pesos destinado a gastos para el viaje
Z : Si el vehculo en que viajan es propio o arrendado
Obteniendo los siguientes datos :
X

Y
Z

0 - 100
Si
no
2
3
3
1
3
2
2
3

1
2
3
4
9.1

9.2
9.3

100 - 150
si
no
3
4
2
5
3
5
2
4

150 - 300
si
no
2
4
7
6
8
7
6
5

300 - 500
si
no
3
0
5
0
4
0
7
2

Si para el prximo ao se ha estimado que el monto destinado a gastos de fiestas


patrias aumentar en un 10% ms 2 UF. Compare la homogeneidad del monto
destinado a gastos actual con el monto para el prximo ao, solamente para los
que en vehculo arrendado viajan hasta con tres personas.
Determine entre que valores flucta el 50% de la variacin central de las
observaciones del monto dedicado a gasto para los que viajan en vehculo propio.
Un profesional participante en el estudio afirma que el hecho de que el auto sea
propio o arrendado condiciona en forma importante la cantidad de dinero destinada
a gastos. Utilizando medidas descriptivas. Qu puede concluir usted?

SOLUCION:
9.1

Se debe comparar los coeficientes de variacin de los gastos actuales y del


prximo ao, ambos condicionados los valores de Z=no y X 3.
Sea
Y :
Monto actual destinado a viajes de los vehculos arrendados que
viajan hasta con tres personas, en m$.
Y:
Monto destinado a viajes para el prximo ao viajes de los vehculos
arrendados que viajan hasta con tres persona, en m$.

Suponiendo 1 U.F. = $16.000, entonces Y = 1,1 Y +32


Por propiedades de la desviacin estndar y de

C. V .( Y) =

y
prximo ao).

> C.V .( Y" ) =

1,1 y
1,1y +32

la

media,

se

tiene

que

, (Obtendremos que es ms homognea la del

Datos a usar:
Marca de clase
50
125
225
Total

C .V .( Y) =

66, 071

= 0 ,416

Y / Z = no X 3
0 - 100
100 - 150
150 - 300

C. V .( Y" ) =

72,678

nj
6
14
17
37

= 0, 352
158,784
206,662
Por lo tanto, el coeficiente de variacin de la distribucin de los gastos para el
prximo ao disminuye en 15,4%, respecto del ao actual (es ms homognea).

9.2

Q = Q3 Q1 =?, o bien Q = P75 P25


Datos a considerar:
Gastos
N vehculos
0 100
10
100 150
10
150 300
23
300 500
19
Total
62

Para Q3:

in
4

3 62
4

= 46,5 y para Q1:

N Acumulado
10
20
43
62

in
4

1 62
4

= 15 ,5

46,5 43
Q = 300 + 200
= 336,84 (m$)
3
19
15,5 10
Q = 100 + 50
= 127,5(m$)
1
10
Q = 336,84 127,5 = 209,34(m$)
El 50% de la variacin central flucta entre 336,84 (m$) y 127,5 (m$), por lo que se
diferencian en $209,34 (m$).
9.3

Sean

Yp : Monto destinado a gastos de viajes cuando el vehculo es propio.


Ya : Monto destinado a gastos de viajes cuando el vehculo es
arrendado.

Datos a usar:
Monto(m$)
0 100
100 150
150 - 300
300 500
Total

y p = 234,27

Monto
Promedio
50
125
225
400

Cantidad autos
propios
10
10
23
19
62

Cantidad autos
arrendados
9
18
22
2
51

(miles de $)

Se puede concluir que las personas que viajan en auto


y a = 165,68 (miles de $)
propio tienen destinado un monto de gastos significativamente mayor a las que
viajan en auto arrendado.
10.

Muchos veteranos de Vietnam tiene niveles peligrosamente altos de la dioxina TCDD en la


sangre y en los tejidos grasos a consecuencia de su exposicin al defoliador Agente Naranja.
Un estudio realizado inform los niveles de TCDD en 20 veteranos de Vietnam que
posiblemente estuvieron expuestos al Agente Naranja. Las concentraciones de TCDD ( en
partes por billn) en plasma sanguneo y tejido graso extrado de cada veterano se muestran
en la tabla siguiente.
Lamentablemente la realizacin de este anlisis tiene un elevado costo. Sin embargo, un
alumno de medicina recin egresado asegura que los costos podran disminuirse en un
buen porcentaje, ya que slo es necesario obtener la concentracin de DDT en la sangre y
con este estimar a travs de un modelo lineal la concentracin presente en el tejido graso.
Tiene razn este seor?

Nivel de TCDD en plasma


2.5
3.1
2.1
4.6
1.6
7.2

3.5
1.8

3.1
20.0

1.8
2.0

6.8
2.5

3.0
4.1

36.0

4.7

6.9

3.3

Nivel de TCDD en tejido graso


4.9
5.9
4.4
6.9
4.6
1.4
7.7
1.1

7.0
11.0

4.2
2.5

10.0
2.3

5.5
2.5

41.0

4.4

7.0

2.9

SOLUCION:

[Cov( x, y )]
=

2x 2y

=?

Cov(x,y) = 102,73 6,03 6,86 =61,3642; x = 99,153 36,3609 = 62,7921


2
y = 115,143 47,0596 = 68,0834
2

(61,3642) 2
R =
= 0,88 S, ya que el 88% de la variabilidad de los niveles de
62,7921 68,0834
2

TCDD en tejido graso est explicado por el nivel de TCDD en la sangre y slo el 12 % por
otras variables.

11.

xi
yi

Una empresa ha gastado en publicidad, en los ltimos 10 aos, las cantidades xi (millones
de pesos) que se indican en la tabla y ha obtenido las ventas yi (millones de pesos) que
figuran en dicha tabla.
6
155

5.5
150

x i = 96,5
y i = 2110
11.1
11.2

6.5
180

8
190

8.5
200

10
220

11
230

12
250

13
260

16
275

2
x i = 1034,75
2
y i = 462050

x i y i = 21655

Calcule el coeficiente de correlacin entre la variable gasto y la variable venta. Interprete


este resultado.
D una estimacin del volumen de ventas, si se dedicaran 15 millones de pesos a
publicidad.

SOLUCION:
r = 0,97965; existe una asociacin lineal alta, igual a 0,97965, entre el gasto en
publicidad y las ventas.
Y = 90,4274 +12,49457 15 = 277,8459 millones de pesos.

12.

Sea (X, Y) la variable estadstica bidimensional que toma los siguientes valores:
xi
yi

-2
-2

-1
-

0
2

1
-+4

2
+6

s 2y de X e Y, respectivamente.

12.1

Determine las medias x, y y las varianzas s x y de

12.2

Calcule la covarianza y el coeficiente de correlacin entre X e Y. Indique para qu


valores de las variables estn fuertemente correlacionadas.

SOLUCIN:

12.1

x=0

s 2x = 2

y=2

s 2y =

4 2
+8
5

12.2
Cov(x,y)=4 0 2 =4

4
4

2 2 + 8
5

Para pequeo existe alta correlacin positiva.

En particular, para =0 se tiene que =1.

Das könnte Ihnen auch gefallen