Beruflich Dokumente
Kultur Dokumente
2 PRESENTACION DE DATOS
1 INTRODUCCIN
01/01/2015
01/01/2015
es
la recoleccin y elaboracin de datos, es decir:
clasificacin, presentacin de la informacin y el clculo
de medidas de tendencia central y dispersin.
decisiones
y/o predecir fenmenos con respecto a las caractersticas
de la poblacin en base a la informacin de la muestra
extrada de la poblacin en estudio.
01/01/2015
01/01/2015
01/01/2015
Parmetro.-
nos
describe alguna caracterstica de inters y cuyo valor es
calculado usando los valores de los elementos o unidades de
una poblacin.
Algunos parmetros conocidos y que usaremos en este
curso son:
- media poblacional
denotado por
varianza poblacional
denotado por
proporcin poblacional
denotado por
01/01/2015
- media de la muestra
denotado por
- varianza muestral
denotado por
- proporcin muestral
denotado por
p
01/01/2015
01/01/2015
01/01/2015 10
B. Variables cuantitativas
Ingreso personal.
Talla, etc.
Las variables cuantitativas pueden ser :
Discretas.
Continuas.
01/01/2015 11
01/01/2015 12
Primaria.
Secundaria.
01/01/2015 13
01/01/2015 14
- Entrevista:
01/01/2015 15
01/01/2015 16
01/01/2015 17
REVISIN DE DATOS
01/01/2015 18
B. CLASIFICACIN DE DATOS
01/01/2015 19
01/01/2015 20
CENCUESTA
1.1
Edad : ..
1.2
Sexo :
1.3
Estado Civil
M.
Masculino
1.
Casado.
F.
Femenino
2.
Soltero
3.
Otro
(Especifique )
1.4
Grado de Instruccin
0.
Ningn nivel
1.5
Nmero de hijos :
1.
Primaria
2.
Secundaria
3.
Superior
1.6
Trabaja ?
1.7
1.
Si
..
0.
No Pasar al 1.8
1.8
presidente de la repblica?
1.
Aprueba
2.
Desaprueba
3.
NS/NO
Entrevistador :
Fecha :
6 / 04 / 2015
01/01/2015 21
01/01/2015 22
n
edad
genero
es_civ
gr_ins
n_hijos
trabaja
ingreso
opinion
1
45
1
1
0
3
1
1554,0
2
Datos de la encuesta
2
56
1
2
1
4
1
1283,8
2
3
53
0
3
2
1
1
1223,6
2
4
42
1
3
2
1
1
1566,6
2
5
43
1
1
1
1
1
1327,2
aplicada
6
43
0
2
3
1
1
1464,4
2
7
22
0
1
1
3
1
1491,0
1
47
1306,2
9
26
0
3
3
2
0
,0
1
10
44
1
2
1
3
1
1320,2
2
11
45
1
1
0
4
1
1505,0
2
12
40
1
1
2
5
1
1699,6
2
13
54
1
2
2
3
1
1467,2
1
14
28
0
1
1
0
0
,0
3
Las
variables
cualitativas
en
15
25
1
1
1
3
1
1451,8
3
16
34
1
1
1
3
1
1596,0
2
codificacin
(valores
en
la
17
43
1
1
0
2
1
1185,8
1
18
45
1
2
1
2
1
1435,0
2
19
43
0
1
2
1
1
1288,0
1
20
37
0
1
2
2
1
1412,6
2
21
31
0
3
1
3
1
1353,8
1
Masculino
22
39
0
1
1
2
1
1412,5
2
23
39
1
1
1
2
1
1618,4
2
2
Femenino
24
28
1
3
1
4
0
,0
2
25
44
1
2
1
1
1
1411,2
2
26
31
1
1
1
4
1
1356,6
2
27
21
1
2
2
2
1
1474,2
2
28
46
1
1
1
2
1
1384,6
1
Las
variables
cuantitativas
29
36
0
1
2
2
0
,0
2
30
18
1
1
2
2
1
1314,6
1
con
sus
valores
en
su
31
37
1
2
1
4
1
1436,4
2
32
25
1
1
0
2
1
1289,4
2
33
38
1
1
1
2
1
1398,2
1
recorrido.
Ejemplo
34
28
1
3
2
3
1
1465,8
2
35
23
0
2
1
2
1389,4
1
Edad 24
36
44
0
1
2
3
1
1405,9
2
37
27
0
1
1
3
1
1565,2
3
Ingreso 1467.2
38
42
1
3
1
2
1
1429,4
1
39
54
1
1
1
2
1
1368,7
1
40
30
0
1
1
4
1
1356,4
2
41
33
0
1
3
1
0
,0
2
42
43
1
1
1
3
1
1415,4
2
43
35
0
1
1
2
1
1405,6
1
44
50
0
3
1
2
1
1292,2
2
45
35
0
1
3
1
1
1055,6
2
01/01/2015 23
X
f
h
1
=CONTAR.SI($J$3:$J$47,L87)
=M87/$M$10
2
=CONTAR.SI($J$3:$J$47,L88)
=M88/$M$10
3
=CONTAR.SI($J$3:$J$47,L89)
=M89/$M$10
=SUMA(M87:M89)
=SUMA(N87:N89)
FORMULAS:
m
fi = n
hi = 1
i=1
i=1
01/01/2015 24
D EL PR ESID EN T E D EL PER U EN A B R IL
CUADRON1
f
h
FORMULAS:
Aprueba
13
28.89%
Desaprueba
29
64.44%
NS/NO
3
6.67%
45
100.00%
=
FUENTE: Encuesta
GRAFICO N 1
GRAFICO N 1
70%
60%
50%
Aprueba
40%
Desaprueba
30%
20%
NS/NO
10%
0%
FUENTE: Cuadro n 1
Aprueba
Desaprueba
NS/NO
FUENTE: Cuadro n 1
01/01/2015 25
Rx : 0, 1, 2, 3, 4, 5, .
01/01/2015 26
FORMULAS:
m
fi = n
hi = 1
fi = Fk
hi = Hk
i=1
i=1
i=1
i=1
01/01/2015 27
CUADRO N 2
X
f
h
F'
F''
H'
H''
0
1
0.02222
1
45
0.02222
100.00%
1
8
0.17778
9
44
0.20000
97.78%
2
17
0.37778
26
36
0.57778
80.00%
3
12
0.26667
38
19
0.84444
42.22%
4
6
0.13333
44
7
0.97778
15.56%
1
0.02222
45
1
1.00000
2.22%
45
1.00000
FUENTE: ENCUESTA
FORMULAS:
=
= .
01/01/2015 28
a) GRAFICA DE LA
FERCUENCIA
RELATIVA ( h ).
25%
20%
h
15%
40
%
10%
5%
35
%
0%
30
%
GRAFICO N 2
01/01/2015 29
60%
50%
40%
100
%
90
%
80
%
30%
20%
10%
0%
GR
AFI
CO
:
DIS
TRI
BU
CIO
N
DE
FR
EC
UE
NCI
A
RE
LA
TIV
A
AC
UM
UL
AD
AS
DE
L
N
DE RELATIVA ACUMULADAS DEL N DE HIJOS DE
HIJ
OS
DE
LIM
E
OS
LIM
E
OS
100%
90%
80%
70
%
60
%
50
%
40%
30%
20%
10%
0%
0
1
2
3
4
0
1
2
3
4
01/01/2015 30
01/01/2015 31
01/01/2015 32
la siguiente expresin: c = A / m
= ==
Si E < 0 se acepta m y c
Si E = 0 o E > 0 se modifica m o c en una u.de.medida.
01/01/2015 33
1
LI1
CLASE
X
X1
m
LI
LS
LS1
2
i
LI2
i
LS2
X2
LIm
LI3
LSm
LS3
X3
4
LI4
LS4
==+
=+=+
+=
01/01/2015 34
Ejemplo:
Sea
n = 100
R = 0.26
Negativo
Hacemos lo siguiente:
D = 9(0.03) 0.26 = 0.01
D = 8(0.04) 0.26 = 0.06
Se escoge el menor
01/01/2015 35
m
CLASE
CLASE
LI
LS
LI
LS
1
1.56
1.58
1.56
<
1.59
2
1.59
1.61
1.59
<
1.62
1.62
1.64
1.62
<
1.65
4
1.65
1.67
1.65
<
1.68
5
1.68
1.7
1.68
<
1.71
6
1.71
1.73
1.71
<
1.74
7
1.74
1.76
1.74
<
1.77
1.77
1.79
1.77
<
1.80
9
1.80
1.82
1.80
<
1.83
01/01/2015 36
Nota si Vmx = 71.4 y Vmn = 30.2, se tiene que la amplitud ser: A = (71.4 30.2)
+ 0.1 = 41.3
Esto significa que si los valores mximo y mnimo estn expresados hasta dcimas se incrementar un
dcimo (0.1); si los valores estn expresados en centsimos, se agregar un centsimo (0.01) y as
sucesivamente.
Este valor nos indica que el nmero de intervalos que podemos tomar ser
comprendido entre 5 y 7. En este caso hemos adoptado el valor de 6.
C.- c = 42 / 6 = 7
01/01/2015 37
CLASE
X
m
LI
LS
1
30.0
36.0
33.0
2
37.0
43.0
40.0
3
44.0
50.0
47.0
4
51.0
57.0
54.0
5
58.0
64.0
61.0
6
65.0
71.0
68.0
Hay que cuidar que en la primera y ltima clase deben estar el Vmn. y
Vmx. Respectivamente.
Nota: si los lmites estn expresados hasta dcimas, entonces se tendr que el
lmite superior de la primera clase es Vmn + ( C - 0.1 ); si est expresado hasta
centsimas ser Vmn. + ( C - 0.01 ) y as sucesivamente.
01/01/2015 38
PRESENTACION MATRICIAL .
EDAD
Xi
fi
hi%
Hi%
Fi
30 36
33
1
3.30%
3.30%
1
37 43
40
7
23.30%
26.70%
8
44 50
47
3
10.00%
36.70%
11
51 57
54
3
10.00%
46.70%
14
58 64
61
8
26.70%
73.30%
22
65 71
68
8
26.70%
100.00%
30
30
100.00%
NOTA : Si los lmites nominales de los intervalos de clase estn expresados en enteros, los lmites reales
de cada intervalo se determina restando y sumando media unidad al lmite inferior y superior respectivamente
de cada intervalo. Pero si los lmites estn expresados de cada intervalo hasta dcimos, los lmites reales se
encontrarn restando y sumando media dcima al lmite inferior y superior respectivamente de cada
intervalo, y as sucesivamente.
01/01/2015 39
Donde :
fi: Frecuencia absoluta del i-simo intervalo (o valor Xi) nos indica nmero
de veces que aparece repetido dicho intervalo (o valor) en el conjunto de
observaciones estudiadas.
0 fi n y f1 + f2 + ... + fm = n
Donde m y n son el nmero de clase y el nmero total de datos
respectivamente.
01/01/2015 40
Donde :
0 Hi 1 0 H1 % 100
01/01/2015 41
Calcular el rango R
=
1055.6
Calcular el N de clases m
< <
R=
644.1
=
.
+ .
()
m=
6.000
6.322
c = 107.400
107.350
Rx : 1055.6, 1699.6
en soles
CLASE
X
LI
LS
1055.6
1162.9
1109.3
1163.0
1270.3
1216.7
1270.4
1377.7
1324.1
1377.8
1485.1
1431.5
1485.2
1592.5
1538.9
1592.6
1699.9
1646.3
01/01/2015 43
PRESENTACIN DE DATOS
01/01/2015 44
a. Mtodo tabular
01/01/2015 45
Qu ?
Opinin de ciudadanos.
D EL PR ESID EN T E D EL PER U EN A B R IL
CUADRON1
X
f
h
Aprueba
13
28.89%
Desaprueba
29
64.44%
NS/NO
3
6.67%
45
100.00%
FUENTE: Encuesta
01/01/2015 46
CUADRO N 2
X
f
h
F'
F''
H'
H''
0
1
0.02222
1
45
0.02222
100.00%
1
8
0.17778
9
44
0.20000
97.78%
2
17
0.37778
26
36
0.57778
80.00%
3
12
0.26667
38
19
0.84444
42.22%
4
6
0.13333
44
7
0.97778
15.56%
5
1
0.02222
45
1
1.00000
2.22%
45
1.00000
FUENTE: ENCUESTA
FORMULAS:
=
= .
01/01/2015 47
m
CLASE
X
f
F
h
H'
H''
LI
LS
1
1055.6
1162.9
1109.3
1
1
0.02500
0.02500
1.00000
2
1163.0
1270.3
1216.7
2
3
0.05000
0.07500
0.97500
3
1270.4
1377.7
1324.1
12
15
0.30000
0.37500
0.92500
4
1377.8
1485.1
1431.5
17
32
0.42500
0.80000
0.62500
5
1485.2
1592.5
1538.9
5
37
0.12500
0.92500
0.20000
6
1592.6
1699.9
1646.3
3
40
0.07500
1.00000
0.07500
40
1.00000
= 0.4250
=
= .
01/01/2015 48
b. Mtodo grafico.
01/01/2015 49
01/01/2015 50
01/01/2015 51
01/01/2015 52
GRAFICO N 1
70%
60%
50%
40%
30%
20%
10%
0%
Aprueba
Desaprueba
NS/NO
FUENTE: Cuadro n 1
01/01/2015 53
01/01/2015 54
Aprueba
Desaprueba
NS/NO
FUENTE: Cuadro n 1
01/01/2015 55
25%
h
20%
40%
15%
35%
10%
5%
0%
NUME
RO DE
HIJOS
POR
CIUDA
DANO
DE
LIMA
GRAFI
CO N
2
01/01/2015 56
70%
60%
50%
10
0%
40%
30%
90
%
20%
10
%
0%
GR
AF
IC
O:
DI
ST
RI
BU
CI
ON
DE
FR
EC
UE
NC
IA
GR
AF
IC
O:
DI
ST
RI
BU
CI
ON
DE
FR
EC
UE
NC
IA
LI
ME
O
S
LI
ME
O
S
100%
90%
80%
70%
60
%
50
%
40
%
30%
20%
10%
0%
0
1
2
3
4
0
1
2
3
4
01/01/2015 57
Histograma, polgono
Si los datos son una variable cuantitativa, la representacin
grfica puede ser: histograma, polgonos y ojivas.
01/01/2015 58
Polgono:
01/01/2015 59
HISTOGRAMA DE
INGRESOS DE ENCUESTADOS
45%
40%
35%
30%
25%
20%
15%
10%
5%
0%
1001.9 1109.3 1216.7 1324.1 1431.5 1538.9 1646.3 1753.7
01/01/2015 60
40%
POLIGONO DE
35%
FRECUENCIA
30%
25%
20%
15%
10%
5%
0%
1001.9
1109.3
1216.7
1324.1
1431.5
1538.9
1646.3
1753.7
01/01/2015
61
POLIGONO DE FRECUENCIA DE
INGRESOS DE ENCUESTADOS
45%
40%
35%
30%
25%
20%
15%
10%
5%
0%
1001.9
1109.3
1216.7
1324.1
1431.5
1538.9
1646.3
1753.7
01/01/2015 62
Ojiva.
01/01/2015 63
HISTOGRAMA ACUMULADO DE
OJIVA DE INGRESOS DE
INGRESOS DE ENCUESTADOS
ENCUESTADOS
120%
120%
100%
100%
80%
80%
60%
60%
40%
40%
20%
20%
0%
0%
1001.9
1109.3
1216.7
1324.1
1431.5
1538.9
1646.3
1055.5
1162.9
1270.3
1377.7
1485.1
1592.5
1699.9
01/01/2015
64
100%
80%
60%
40%
20%
0%
1055.6
1163.0
1270.4
1377.8
1485.2
1592.6
1700.0
01/01/2015
65
12
12
17
13
13
12
14
12
13
13
13
15
16
11
16
12
12
12
18
15
15
17
11
12
12
14
14
13
16
14
14
13
01/01/2015 66
80
79
69
80
77
69
80
76
90
72
75
76
79
74
71
78
77
80
76
79
70
73
78
72
68
70
91
66
79
75
89
88
91
86
83
81
68
79
80
85
83
82
81
80
78
73
79
84
68
66
01/01/2015 67
Ejercicios:
01/01/2015 68
Ejercicio:
En el ejemplo siguiente la variable Y representa el nmero
de hijos por familia proveniente de una encuesta hecha
entre 50 familias:
A base de esta informacin, se pide la representacin
grfica de los datos, mediante:
a) Grfico de barras
b)
Grfico de sectores circulares
yi
ni
0
2
12
2
21
3
9
4
4
5
2
50
01/01/2015 69
Ejercicio:
2000
2001
2002
2003
2004
EMISIN
126
183
270
304
517
557
917
1290
2051
2502
01/01/2015 70