Sie sind auf Seite 1von 11

GUA DE PRCTICA

ESTADSTICA

INTRODUCCIN

Slo cuando nos adentramos en un mundo ms especfico como es el campo de la


investigacin de las Ciencias, ya sean estas exactas o sociales, empezamos a
percibir que la Estadstica no slo es algo ms, sino que se convierte en el nico
mtodo que permite obtener resultados ptimos, y por tanto beneficiosos, en
cualquier tipo de estudio.

VARIABLES
TABLA N1: MATRIZ DE CLASIFICACIN DE VARIABLES
Clasificar adecuadamente las diversas variables con (X)
N

Variable

cualitativa

discreta

ordinal

continua

nominal cuantitativa Justificacin

Edad

Talla

Temperatura

4
5

Nmero de alumnos de
tu Instituto.
Coeficiente intelectual
de tus compaeros de
clase.

Grado de temperatura

Profesin que te gusta.

Nmero de goles
marcados por tu equipo
favorito en la ltima
temporada.

Nmero de ttulos

10

Nmero de actos
registrales

POBLACIN Y MUESTRA
CUESTIONARIO
1.- De la poblacin de investigadores espaoles que han publicado su tesis en
2009, 50 investigadores extrados por sorteo.
Definir
a. Poblacin:..
b. Muestra:.
c. Variable:.
d. Tipo de variable:
2.- De la poblacin de los 100.000 primeros nmeros naturales, los nmeros
que han salido en la lotera durante un ao. Se realiz una encuesta a 3740
personas para evaluar su opinin acerca de la atencin recibida en el
Hospital de la Provincial de Ica, clasificndolos en relacin a sus estudios.
Definir
a.- Poblacin:..
b.- Muestra:.
c.- Variable:.
d.- Tipo de variable:

DISTRIBUCION DE FRECUENCIAS
1) Dada la siguiente serie de puntajes de un examen de rendimiento escolar:
63

88

79

92

86

87

83

78

41

67

68

76

46

81

92

77

84

76

70

66

77

75

98

81

82

81

87

78

70

60

94

79

52

82

77

81

77

70

74

61

a) Construir la tabla de frecuencias y graficar


b) Calcular la media aritmtica, como serie simple
c) Transforme la serie en una distribucin de clases y frecuencias; luego
calcule nuevamente la media; compare resultados. (Utilice un intervalo de
amplitud igual a 10)
d) Calcule la mediana y la moda.
2) Colectivo: 60 cilindros fabricados por una mquina. N = 60 Variable X:
longitud en centmetros Valores observados:
239, 254, 255, 248, 246, 249, 242, 250, 249, 244, 253, 248
250, 258, 252, 251, 250, 253, 247, 243, 245, 251, 247, 250
248, 250, 259, 249, 249, 250, 251, 253, 241, 251, 249, 252
250, 247, 251, 259, 250, 246, 252, 238, 251, 238, 236, 259
249, 257, 249, 247, 251, 246, 245, 243, 250, 249, 242, 238
a) Construir la tabla de frecuencias y graficar
b) Calcular la media aritmtica, como serie simple
c) Transforme la serie en una distribucin de clases y frecuencias; luego
calcule nuevamente la media; compare resultados. (Utilice un intervalo de
10)
d) Calcule la mediana y la moda.
3) Un fabricante de neumticos ha recabado, de los diferentes concesionarios,
informacin sobre la cantidad de miles de kilmetros recorridos por un modelo
concreto de esos neumticos hasta que se ha producido un pinchazo o un
reventn del neumtico. Los concesionarios la han proporcionado los
siguientes datos:
61.979
4.3068
51.179
74.582
74.239
60.727
48.240
57.884
79.426
67.662
47.012
71.360
55.643
55.912
84.588
40.709
63.692
70.003
44.411
41.886

41.539
58.708
56.155
55.257
53.324
78.635
46.681
50.238
65.996
34.754

62.215
48.035
86.070
84.656
49.011
41.715
66.519
61.390
55.989
59.888

51.269
67.124
90.565
48.662
29.480
72.635
59.168
85.720
49.677
59.449

82.919
41.830
53.751
10.504
41.128
41.463
66.313
45.313
46.502
67.632

34.182
61.030
76.580
60.951
30.252
48.996
35.884
46.724
67.467
89.116

37.654
58.267
68.629
38.420
33.412
48.172
28.625
61.752
64.398
69.483

80.502
35.342
44.719
37.402
52.452
50.432
37.748
51.831
73.808
35.807

48.698
65.854
75.850
36.949
75.548
69.010
61.477
65.585
61.065
57.277

Se pide:
a- Construir una taba de frecuencias para esos datos tomando como nmero
de intervalos el que proporciona la frmula de Sturgess. Interpretas la tabla.
b- Construir las tablas de frecuencias.
3

c- Dibujar el histograma de frecuencias relativas sin acumular y acumulado.


d- Calcular las principales medidas de tendencia central e interpretarlas.
e- Obtener las medidas de dispersin ms importantes e interpretarlas.
4) En una encuesta a 35 personas se les preguntaba sobre sus preferencias a la
hora de leer novelas. Los resultados se recogieron en la siguiente grfica:

a) Construye la tabla de frecuencias.


b) Dibuja sobre el grfico un diagrama de barras.
c) A qu porcentaje de las personas encuestadas les gustan las novelas
de amor? Y las de ciencia-ficcin?
d) Cul es la moda?

MEDIDAS DE TENDENCIA CENTRAL


Las medidas de tendencia central ms usuales son:
a) Media o promedio.- Es un valor central que representa el centro a un
conjunto de datos en una muestra o poblacin. Se define mediante la suma
de todos los datos y se divide entre el tamao de la muestra.
n
x
X i
i 1 n
Ejm. Se tiene las notas de 5 alumnos del curso de matemtica
12
x1
n

X
i 1

17
x2

13
x3

15
x4

10
x5

xi x1 x 2 x3 x 4 x5 12 17 13 15 10 67

13.4
n
5
5
5

Interpretacin.- La nota de los 5 alumnos se encuentra alrededor de 13.4.

b) Mediana (Me).- Es un valor que indica el centro de un conjunto de datos


ordenados, donde el 50% de los datos son menores a dicho valor y el otro
50% sern mayores.
Del ejemplo anterior (cuando n es impar, n = 5)
Pasos:
1 Ordenar los datos de menor a mayor
10
x1
Me

12
x2

13
x3

15
x4

17
x5

50%

50%

2 Ubicar el valor mediano: en el ejm. Es x3 = Me = 13


Interpretacin.- El 50% (mitad) de las notas de los 5 alumnos son menores
a 13 y el otro 50% tiene notas mayores a 13.
Ejm.: Edades de 6 alumnos en aos cumplidos (cuando n es par, n=6).
18
x1

20
x2

50%

20
x3

Me

21
x4

23
x5

25
X6

50%

Me = (20+21)/2 = 20.5
Interpretacin.- El 50% (mitad) de los 6 alumnos, tienen menos de 20.5
aos y el otro, 50% tiene ms de 20.5 aos.
b) Moda (Mo).- Es el dato que ms se repite.
Ejm.: Tenemos las edades de 5 finalistas a Miss Per en aos cumplidos:
18

19

21

22

21

20

El dato que ms se repite es 21, entonces:


Mo = 21
Interpretacin.- La mayora de las 5 finalistas a Miss Per tiene 21 aos.
CUESTIONARIO
En los siguientes problemas calcular e interpretar:
1. Para que un producto sea aceptado por su cliente, el proveedor debe
cumplir con ciertas especificaciones de calidad. Una de ellas, radica en
que el promedio de longitud de los 20 primeros productos este entre
20,0 y 20,9 centmetros. Si las medidas son:
22,3 20,4 19,8 19,9 20,1 20,8 21,6 19,8 20,5 23,4
19,6 21,5 18,5 18,7 20,9 21,1 20,1 21,5 22,3 17,9
5

a.
b.
c.
d.
e.

Promedio
Mediana
Moda
Graficar los Histogramas
Cumple en el proveedor con
las especificaciones del cliente?

2.

Calcular la desviacin media a partir del registro de las siguientes


edades de una muestra de 36 personas.
48
15
20
43
17
48

a.
b.
c.
d.

19
21
30
45
44
23

12
41
28
38
11
35

31
52
17
28
18
41

19
18
46
23
21
49

15
49
40
50
13
23

Promedio
Mediana
Moda
Graficar los Histogramas

3. El cuadro que figura ms abajo da los caudales mensuales del rio


Magdalena observados durante los meses de abril y mayo, desde 1988
a 2005 (la unidad de medida no se precisa).
ao
1995
1996
1997
1998
1999
2000
2001
2002
2003
2004
2005
2006
2007
2008
2009
2010
2011
2012

Abril
600
227
487
560
521
423
307
390
364
284
415
255
209
230
424
528
258
242

Mayo
512
211
469
370
363
272
241
253
408
233
245
199
215
297
309
303
196
166

Se desea ordenar estos datos y efectuar el anlisis siguiente:


Dar una representacin global de los caudales de abril y mayo.
Graficar
mediante
dos
histogramas
los
datos
resumidos
(recomendacin: agrupe los datos empleando tablas de frecuencia con
iguales intervalos de clase).
Calcular la media de los caudales de abril, y la media de los caudales
de mayo.
Calcular la desviacin tpica de los caudales de abril, y la desviacin
tpica de los caudales de mayo.
Comparar los caudales de abril con los caudales de mayo, a partir del
coeficiente de variacin.
Realizar conclusiones sobre: media, mediana, moda, frecuencias,
desviaciones e histogramas de frecuencia

4. Un equipo de investigadores desea conocer el tiempo promedio en


minutos de la atencin de publicidad registral de los residuos obtenidos
a travs de la entrevista aplicada a 40 usuarios de la Zona registral XI
Ica. Los datos que se dan a continuacin.
3.30
3.59
2.05
2.30
2.62

2.30
3.30
2.30
2.44
2.20

2.05
2.56
2.05
3.10
3.01

3.59
2.07
3.59
3.31
3.43

3.31
3.31
2.45
3.75
2.28

a.
b.
c.
d.

2.30
2.07
3.81
2.81
2.18

3.59
3.59
3.59
2.21
3.46

2.31
3.90
2.11
2.07
3.58

Promedio
Mediana
Moda
Graficar los Histogramas

5. El equipo anterior adems, sostiene que el ingreso de ttulos por da y


por tipo de registro es:
Oficina
Andahuaylas
Ayacucho
Chincha
Huancavelica
Huanta
Nasca
Pisco
a.
b.
c.
d.

PI

PJ
102
115
98
133
99
119
125

PN
91
82
61
73
84
62
76

89
76
87
75
88
80
96

BM
119
80
139
93
144
113
125

Promedio
Mediana
Moda
Graficar los Histogramas

MEDIDAS DE DISPERSIN
1. MEDIDAS DE DISPERSIN.- Son valores que nos permiten conocer sobre
la variabilidad de las observaciones, entre las ms importantes tenemos: El
rango, la varianza, desviacin estndar y el coeficiente de variacin.
a)

Rango.- Indica entre que valores se encuentra el conjunto de datos. Es la


diferencia entre el valor de las observaciones mayor y el menor.
R = XDato mximo XDato mnimo

b)Varianza (S2).- Indica la variabilidad u homogeneidad de los datos. Es la


media de los cuadrados de las diferencias entre cada valor de la variable
y la media aritmtica de la distribucin.
n

S2
c)

(X
i 1

X )2

Desviacin Estndar.- Indica la dispersin o distanciamiento de los datos


respecto al centro. Es la raz cuadrada de la varianza.
S

S2

d) Coeficiente de variacin.- Cuando se quiere comparar el grado de


dispersin de dos distribuciones que no vienen dadas en las mismas
unidades o que las medias no son iguales, se utiliza el coeficiente de
variacin de Pearson que se define como el cociente entre la desviacin
tpica y el valor absoluto de la media aritmtica.
CV

S
* 100
X

CUESTIONARIO
En los siguientes problemas hallar e interpretar: Desviacin estndar, varianza,
coeficiente de variacin.
1.- Calificacin de ttulos por oficina
Oficina
Andahuaylas
Ayacucho
Chincha
Huancavelica
Huanta
Nasca
Pisco

PI

PJ
102
115
98
133
99
119
125

PN
91
82
61
73
84
62
76

89
76
87
75
88
80
96

BM
119
80
139
93
144
113
125

Cul es la Oficina ms homognea?

2.- Los sueldos de los Directores ejecutivos de dos empresas se presentan en


la siguiente tabla:
Director ejecutivo
A
B
C
D
E
F
G
H
I

Sueldos Empresa
A
8925
2437
1410
6960
1847
1490
3414
3344
1490

Sueldos Empresa
B
95650
18546
55678
12389
27973
29268
38237
14045
12140

Qu empresa tiene los sueldos ms homogneos?


REGRESIN Y CORRELACION LINEAL
CUESTIONARIO
1. La resistencia del papel utilizado en la fabricacin de cajas de cartulina (Y) est
relacionado con la concentracin de madera dura en la pulpa original (X). Bajo
condiciones controladas, una planta piloto fabrica 16 muestras con un lote diferente
de pulpa y mide la resistencia a la tensin. Los datos obtenidos son los siguientes:

X 1
1.5
1.5
1.5
2
2
2.2
2.4
2.5 2.5 2.8
2.8
3
3
3.2
Y 101.4 117.4 117.1 106.2 131.9 146.9 146.8 133.9 111 123 125.1 145.1 134.3 144.5 14
a) Representar grficamente los datos y comentar los resultados.
b) Hallar el coeficiente de correlacin.
c) Ajustar un modelo de regresin lineal. Predecir la resistencia de una caja
fabricada con pulpa cuya concentracin es 2.3.
d) Hallar el Coeficiente de Determinacin e interpretar.
e) Calcule la ecuacin de regresin de X sobre Y
2. La direccin de una empresa quiere estudiar la rentabilidad de su inversin en
publicidad. Para ello ha recogido datos del volumen de ventas y del gasto en
publicidad referidos a los aos 2000 - 2009 expresados en millones de soles.
Ao
2000 2001 2002 2003 2004 2005 2006 2007 2008 2009
Ventas
50
100 150 200 200 300 400 500 650 700
Gasto
10
15
18
20
25
35
50
55
60
65
publicidad
a) Construya el diagrama de dispersin y calcule el coeficiente de correlacin.

b) Especifica y estima el modelo lineal que explique las ventas de la empresa en


funcin de la inversin publicitaria. Interpreta los parmetros estimados.
c) En el ao 2010, la empresa va a invertir 85 millones de soles en publicidad.
Calcula el volumen de ventas esperado.
3. En un pas europeo se han obtenido estadsticas que relacionan el nmero de
vehculos Matriculados y el nmero de accidentes habidos en un perodo
determinado. Los datos recogidos son los siguientes:
periodo

n de
accidentes

1
2
3
4
5
6
7
8
9
10
11

166
153
177
201
216
208
227
238
268
268
274

n de
vehculos
matriculados
352
373
411
441
462
490
529
577
641
692
743

Se pide:
a) Un modelo de regresin que
nos explique el n de
accidentes en funcin de los
vehculos matriculados.
b) Coeficiente de correlacin
lineal.
c) Porcentaje de las causas
ajenas a la regresin que
influyen en la variable

dependiente.
d) Deducir cul sera el n de accidentes si se matriculan 800 vehculos.
e) Estimar el parque de vehculos matriculados para reducir el nmero de
accidentes hasta 175.

10

1. Datos los siguiente ingreso per cpita:


a.- Determinar en qu ao el ingreso per cpita fuer ms homogneo
b.- Graficar el ingreso.
PNB per cpita (en
dlares)
Mes
Ene
Feb
Mar
Abr
May
Jun
Jul
Ago
Sep
Oct
Nov
Dic

2.

2010
15,920
12,640
12,080
9,230
10,740
10,050
9,920
10,570
11,080
10,840
11,230
10,680

2013
44,360
31,090
23,700
23,340
22,690
24,040
24,230
19,470
23,060
14,860
10,670
11,780

Dados los siguientes datos del total de pasajeros que arribaron (PT, miles
de pasajeros) en vuelos regulares en aeropuertos nacionales, analice la
serie determinando:
1.- En que ao el arribo de pasajeros fue ms homognea
2.- Clculo de la tendencia por el mtodo de la regresin
3.- Prediccin de pasajeros totales para el 2013.

Meses
Enero
Febrero
Marzo
Abril
Mayo
Junio
Julio
Agosto
Septiembre
Octubre
Noviembre
Diciembre

2005
81,215
75,265
84,999
86,928
89,276
89,256
94,784
91,639
89,329
89,830
84,698
84,841

2006
85,498
80,385
92,597
92,871
98,464
99,212
106,956
106,739
105,521
105,182
99,000
98,258

2007
95,698
96,836
105,947
107,839
114,562
112,829
119,571
117,791
115,592
115,997
107,158
103,578

2008
107,681
100,810
113,837
116,828
122,241
119,892
127,379
126,064
123,530
121,112
101,149
96,537

2009
99,899
94,076
105,991
110,688
116,610
111,503
121,570
120,936
116,919
117,373
108,547
106,725

2010
104,443
102,313
114,496
115,782
122,892
122,264
130,569
129,381
127,392
127,448
118,745
116,189

2011
120,712
117,174
130,360
133,272
140,440
138,012
146,454
144,629
141,819
140,577
123,317
118,445

2012
125,042
121,890
135,974
138,312
146,237
144,532
153,827
152,152
149,484
148,820
134,367
130,233

IPAE, 23 SETIEMBRE DEL 2014.

11

Das könnte Ihnen auch gefallen