Sie sind auf Seite 1von 14

PARTE 1

Inicialmente teníamos 60357 datos de la variable P6040 correspondiente a las edades de cierta población.

NOTA: Al momento de hacer el conteo de la cantidad de datos por edades a través de la función CONTAR.SI de Excel, la sumatoria de datos finales es igual a
60356, indicando que en el conteo existe un dato de la encuesta que probablemente no es contable, ya sea por error humano. Para este estudio tomaremos
como tamaño de la población 60356.

Para realizar el histograma debemos agrupar los datos en intervalos de edades.

 Tamaño de la población: N=60356


 Número de intervalos de clase: Nc = 1+3,22xLOG10(60356)
Nc= 16.4
Redondeamos al entero más próximo: Nc’=16
 Valor mínimo de edad: Vmin=0
 Valor máximo de edad: Vmáx=101
 Rango: Rango=101-0
Rango=101
 Amplitud: Amplitud=Rango/Número de clase
Amplitud=101/16=6.3
 Redondeamos al entero mayor más próximo: Amplitud’=7
 Calculamos un nuevo rango debido al redondeo de la amplitud: Rango= Amplitud x Numero de clase’
Rango’= 7 x 16 = 112
 Calculamos la diferencia entre el rango anterior y el nuevo rango: Diferencia=112-101
Diferencia= 11
 Calculamos los nuevos valor mínimo y máximo para determinar los límites de los intervalos:

Vmin’ = 0 - 11/2  Vmin’ = -5.5

Vmax’ = 101 + 11/2  Vmax’ = 106.5

A continuación, se muestra los 16 intervalos de amplitud 7 donde el valor mínimo es -5.5 y el valor máximo es 106.5 y el conteo de los datos según la edad:
RANGO DE EDAD
Ni Lm Ls CONTEO DE DATOS POR EDAD (AÑOS) SUMATORIA
0 1
1 -5,5 1,5
964 861 1825
2 3 4 5 6 7 8
2 1,5 8,5
966 995 989 1044 1044 977 1103 7118
9 10 11 12 13 14 15
3 8,5 15,5
1069 1102 1225 1123 1161 1140 1167 7987
16 17 18 19 20 21 22
4 15,5 22,5
1164 1151 1162 1078 1139 1170 1132 7996
23 24 25 26 27 28 29
5 22,5 29,5
1031 1018 1077 1016 1052 910 968 7072
30 31 32 33 34 35 36
6 29,5 36,5
917 878 916 815 807 802 758 5893
37 38 39 40 41 42 43
7 36,5 43,5
724 754 787 804 780 841 814 5504
44 45 46 47 48 49 50
8 43,5 50,5
768 817 753 720 791 765 703 5317
51 52 53 54 55 56 57
9 50,5 57,5
698 671 612 593 563 534 525 4196
58 59 60 61 62 63 64
10 57,5 64,5
477 499 405 394 411 411 354 2951
65 66 67 68 69 70 71
11 64,5 71,5
338 329 325 255 254 255 257 2013
72 73 74 75 76 77 78
12 71,5 78,5
232 244 225 204 208 166 147 1426
79 80 81 82 83 84 85
13 78,5 85,5
132 120 132 89 97 75 82 727
86 87 88 89 90 91 92
14 85,5 92,5
68 58 42 32 41 21 14 276
93 94 95 96 97 98 99
15 92,5 99,5
14 9 10 4 4 6 5 52
100 101
16 99,5 106,5
2 1 3
TOTAL 60356

Calculamos la media y la desviación estándar por medio de las funciones PROMEDIO y DESVEST.P de Excel.

Media: 𝑋̅= 30.972

Desviación estándar: 𝜎=20.755


A continuación, se muestra la tabla de frecuencias para los intervalos establecidos:

Ni Nc fi Fi hi Hi Porcentaje
1 -5.5 - 1.5 1825 1825 0,0302 0,0302 3,0237%
2 1.5 - 8.5 7118 8943 0,1179 0,1482 11,7934%
3 8.5 - 15.5 7987 16930 0,1323 0,2805 13,2331%
4 15.5 - 22.5 7996 24926 0,1325 0,4130 13,2481%
5 22.5 - 29.5 7072 31998 0,1172 0,5302 11,7171%
6 29.5 - 36.5 5893 37891 0,0976 0,6278 9,7637%
7 36.5 - 43.5 5504 43395 0,0912 0,7190 9,1192%
8 43.5 - 50.5 5317 48712 0,0881 0,8071 8,8094%
9 50.5 - 57.5 4196 52908 0,0695 0,8766 6,9521%
10 57.5 - 64.5 2951 55859 0,0489 0,9255 4,8893%
11 64.5 -71.5 2013 57872 0,0334 0,9588 3,3352%
12 71.5 -78.5 1426 59298 0,0236 0,9825 2,3626%
13 78.5 - 85.5 727 60025 0,0120 0,9945 1,2045%
14 85.5 - 92.5 276 60301 0,0046 0,9991 0,4573%
15 92.5 - 99.5 52 60353 0,0009 1,0000 0,0862%
16 99.5 - 106.5 3 60356 0,0000 1,0000 0,0050%
TOTAL 60356 TOTAL 1,00000 TOTAL 100,00000%

Las personas que cuentan con más de 85 años corresponden a una cantidad menor del 1% de la población encuestada, por lo tanto, esto indica que la
desviación estándar tendrá un valor considerable.

A continuación, se muestra el histograma según los intervalos establecidos:


ANÁLISIS:

El histograma presente curtosis de tipo positiva (más en punta) o de tipo Leptocúrtiva, con asimetría positiva o hacia la izquierda.

Según la curtosis hacia la izquierda, podemos apreciar que la mayor cantidad de encuestados tienen edades entre 1 y 50 años, siendo los intervalos de 8.5 – 15.5
y 15.5 – 22.5 años el pico máximo del histograma.

Debido a que la curtosis tiende hacia la izquierda se puede afirmar que la cantidad de mayor de encuestados se debe a personas adolescentes y adultas, por
tanto, las personas que pertenecen a la tercera edad representan un porcentaje pequeño de la población encuestada.
Teniendo en cuenta la nueva variable 𝑃6040 𝑛𝑒𝑤 = 𝑃60402/3 calculamos la desviación estándar.

Desviación estándar variable nueva: 𝑠=4.57  Calculado según la función DESVEST.P de Excel para la nueva variable

Calculamos el tamaño de la muestra según las fórmulas:

𝒁𝟐 𝒔𝟐
𝒏𝟎 =
𝜹𝟐
𝒏𝟎
𝒏= 𝒏
𝟏 + 𝑵𝟎

Siendo Z: Es el cuantil de la distribución normal estándar al nivel de significancia que se establezca.

S: Es la desviación estándar de la variable.

δ: Es el margen de error absoluto.

Nivel de confianza del 95%: corresponde a Z(0.95) = 1.96 pre-establecido

Error absoluto: 0.5

Desviación estándar= 4.57

Calculamos no:

𝑍 2 𝑠 2 (1.96)2 (4.57)2
𝑛0 = = = 320.889
𝛿2 (0.5)2

𝑛0 320.889
𝑛= 𝑛 = ≈ 319
1 + 0 1 + 320.889
𝑁 60356
El tamaño de muestra es igual a 319

Usando el algoritmo de coordinado negativo para la variable P6040 2/3 generamos un numero (entre 0 y 1) para cada dato de manera aleatoria, seguidamente
ordenamos el listado de números aleatorios (de menor a mayor) de tal manera que el listado de datos quede en lista de manera aleatoria y poder tomar los
primeros 319 datos desde el inicio del listado.
A continuación, se muestra los 319 datos seleccionados por el método de coordinado negativo:

11,1037025 3,65930571 13,5720881 15,8328963 3,30192725 11,696071 10,4950846 18,5663553 13,207709 3,65930571
12,838232 9 5,24148279 9,22087258 8,32033529 16,3316209 13,7524514 18,7207544 9,65489385 5,24148279
15,664906 11,696071 8,54987973 10,4950846 12,273798 5,52877481 3,30192725 8,32033529 12,0827612 8,54987973
11,8902021 12,4633594 11,1037025 6,61148902 8,32033529 7,12036736 3,65930571 11,5003151 2,5198421 10,9027236
0 1,58740105 7,85142441 10,2882765 16 6,61148902 12,273798 4 9,43913068 6,082202
19,4834398 7,61166261 11,1037025 13,9316395 19,634183 11,5003151 14,6372228 9 5,52877481 3,30192725
12,838232 8,54987973 7,61166261 16,1662356 12,273798 15,3261886 7,368063 4,94608744 4 11,696071
5,24148279 11,5003151 20,8200805 11,5003151 16,1662356 2,92401774 9,8682724 9 7,12036736 2,5198421
9,22087258 16 14,4624474 6,34960421 17,7844665 9,65489385 13,3905183 14,6372228 13,9316395 7,61166261
10,9027236 8,54987973 2,92401774 10,9027236 6,34960421 14,983686 11,5003151 7,61166261 9 1
2,5198421 9,22087258 11,3028786 14,2866095 10,9027236 1,58740105 12,273798 1 9,8682724 7,368063
1,58740105 10,4950846 11,3028786 7,85142441 0 11,3028786 13,207709 6,34960421 8,54987973 9
13,7524514 13,7524514 2,92401774 9 5,52877481 1,58740105 20,3794231 6,86828546 9,8682724 9,43913068
15,4960101 16,6599084 7,85142441 6,86828546 7,85142441 7,85142441 16,8228431 16,6599084 16,1662356 12,65149
11,8902021 13,7524514 14,810961 3,65930571 9,43913068 4,64158883 4,94608744 10,6998748 1,58740105 15,4960101
14,810961 0 2,5198421 4,32674871 12,4633594 5,80878573 4,32674871 13,207709 2,92401774 5,80878573
5,52877481 8,77638296 1,58740105 5,52877481 2,08008382 7,12036736 9,43913068 18,2556122 6,34960421 6,86828546
4,64158883 13,3905183 12,0827612 11,696071 8,54987973 10,2882765 15,664906 8,0875794 8,0875794 4,64158883
1,58740105 15,4960101 13,3905183 12,273798 14,4624474 0 6,34960421 8,0875794 9 7,61166261
9,22087258 0 13,9316395 5,24148279 8,77638296 5,52877481 13,9316395 4,64158883 4,64158883 8,0875794
13,7524514 11,1037025 15,4960101 12,0827612 10,6998748 9 13,9316395 4,64158883 7,85142441 10,2882765
5,52877481 11,5003151 8,77638296 5,52877481 7,368063 13,9316395 14,6372228 7,368063 11,5003151 12,273798
2,92401774 6,34960421 2,92401774 7,368063 0 4,94608744 8,77638296 10,0793684 13,7524514 9,43913068
15,4960101 9,22087258 9,43913068 9,65489385 3,65930571 10,6998748 9,22087258 11,8902021 4,94608744 11,696071
5,80878573 11,3028786 9,43913068 7,368063 12,65149 10,9027236 12,273798 1 17,4668761 1,58740105
7,61166261 2,5198421 8,77638296 9 5,24148279 14,6372228 13,207709 5,52877481 15,3261886 6,34960421
4,32674871 5,24148279 14,4624474 4,32674871 9,8682724 11,5003151 8,77638296 4 4,32674871 14,810961
0 6,082202 6,34960421 8,77638296 12,4633594 13,207709 8,0875794 3,65930571 8,0875794 7,85142441
14,810961 6,86828546 10,9027236 10,9027236 12,273798 16,496173 9,22087258 1,58740105 9,22087258 4,94608744
2,92401774 15,4960101 2,5198421 13,7524514 2,08008382 4,32674871 13,5720881 3,30192725 8,0875794 2,5198421
2,92401774 12,65149 5,24148279 12,0827612 8,54987973 10,9027236 9,43913068 16,3316209 14,1096827 6,082202
7,12036736 10,4950846 8,54987973 2,5198421 4 14,2866095 13,207709 8,54987973 9,22087258
DIFERENCIA ENTRE LA MEDIA POBLLACIONAL Y MUESTRAL

Las medias poblacional y muestral fueron calculadas por la función PROMEDIO de Excel.

Media Poblacional=9.287863 Media Muestral=9.097398

Diferencia entre medias= Media Poblacional – Media Muestral

Diferencia entre medias= 9.287863 – 9.097398

Diferencia entre medias= 0.190465

ANALISIS: Las pequeñas diferencias existentes entre la media poblacional y la media muestral se deben a los datos tomados en la muestra para representar la
población, ya que la muestra nunca podrá representar totalmente la población de estudio.

DIFERENCIA ENTRE LA DESVIACION ESTANDAR POBLACIONAL Y MUESTRAL

Las desviaciones estándar poblacional y muestral fueron calculadas por las funciones DESVEST.P y DESVEST.M de Excel.

Desviación estándar poblacional= 4,5694648 Desviación estándar muestral= 4,4896507

Diferencia entre desviación estándar= 4,5694648 - 4,4896507

Diferencia entre desviación estándar= 0,0798141

ANALISIS: Esta pequeña diferencia entre las desviaciones estándar indica que la muestra tomada es muy representativa de la población en estudio, ya que tiene
en cuenta una cantidad de valores proporcionales que están alejados de la media.
NOTA: Para estudio de la escolaridad, 17 individuos no tienen información acerca de su escolaridad.

HISTOGRAMA PARA LA ESCOLARIDAD DE HOMBRES DE LA MUESTRA PROPUESTA

NC FRECUENCIA
[0,1] 20
[1,4] 23
[4,7] 32
[7,10] 20
[10,13] 45
[13,16] 12
[16,19] 4
[19,22] 1
Muestra de 166 Hombres.

ESCOLARIDAD HOMBRE

50
45
40
35
30
25
20
15
10
5
0
[0,1] [1,4] [4,7] [7,10] [10,13] [13,16] [16,19] [19,22]

La mayoría de hombres de la muestra tienen escolaridad menor que 13.

Son muy pocos los hombres que logran tener una escolaridad superior a 16.

Un porcentaje importe de hombres han conseguido tener una escolaridad entre 10 y 13.
HISTOGRAMA PARA LA ESCOLARIDAD DE MUJERES DE LA MUESTRA PROPUESTA

NC FRECUENCIA
[0,1] 26
[2,4] 30
[4,7] 41
[7,10] 15
[10,13] 66
[13,16] 22
[16,19] 5
[19,22] 0
[22,25] 1
Muestra de 214 mujeres

ESCOLARIDAD MUJER

70

60

50

40

30

20

10

0
[0,1] [2,4] [4,7] [7,10] [10,13] [13,16] [16,19] [19,22] [22,25]

Un porcentaje importante de mujeres ha logrado tener una escolaridad entre 10 y 13.

Son muy pocas las mujeres que han logrado tener una escolaridad superior a 16.

La mayoría de mujeres tienen una escolaridad inferior a 13.

CONCLUSIÓN: El nivel de escolaridad entre hombres y mujeres es muy similar, lo que se puede concluir que no hay gran diferencia que pueda confirmar que el
nivel de escolaridad puede tener beneficios por uno de los géneros.
CALCULO DE LA DISTRIBUCIÓN NORMAL PARA LOS HOMBRES DE LA MUESTRA

La media escolar para los hombres es: 7.720


Con desviación estándar: 4.881

Teniendo en cuenta un nivel de confianza del 95% (correspondiente a Z=1.96) calculamos los valores de escolaridad.
𝑥−𝜇
𝑧=
𝜎
𝑥 =𝑧∗𝜎+𝜇
𝑋 < 1.96 ∗ 4.881 + 7.720

𝑋 < 17.2

Se puede considerar que el 95% de los hombres logra tener una escolaridad igual o inferior a 17
CALCULO DE LA DISTRIBUCIÓN NORMAL PARA LAS MUJERES DE LA MUESTRA

La media escolar para los hombres es: 7.741


Con desviación estándar: 4.899

Teniendo en cuenta un nivel de confianza del 95% (correspondiente a Z=1.96) calculamos los valores de escolaridad.

𝑥−𝜇
𝑧=
𝜎
𝑥 =𝑧∗𝜎+𝜇
𝑋 < 1.96 ∗ 4.899 + 7.741

𝑋 < 17.3

Se puede considerar que el 95% de las mujeres logra tener una escolaridad igual o inferior a 17
CALCULO DE LA DISTRIBUCIÓN NORMAL PARA LAS MUJERES DE LA MUESTRA

La media escolar para los hombres es: 7.917


Con desviación estándar: 5.035

Teniendo en cuenta un nivel de confianza del 95% (correspondiente a Z=1.96) calculamos los valores de escolaridad.

𝑥 =𝑧∗𝜎+𝜇
𝑋 < 1.96 ∗ 5.035 + 7.917

𝑋 < 17.8

Se puede considerar que el 95% de las mujeres logra tener una escolaridad igual o inferior a 18

CONCLUSIÓN: los gráficos de distribución normal muestran que para un intervalo del 95% la escolaridad para hombres y mujeres es igual, por lo
que se puede confirmar que el género no determina un grado de escolaridad mayor o menor en la muestra.

En el estudio de escolaridad para ambos géneros se puede concluir que las personas que tienen una escolaridad igual o menor que 18, representan
el 95% de la muestra.
PARTE 2

NOTA: De 380 datos de la muestra solo 99 presentan información sobre asistencia a establecimientos educativos oficiales.

A partir de estos datos realizo el gráfico de barras para ambos sexos.

ASISTENCIA A COLEGIOS OFICIALES

ASISTENCIA A UN COLEGIO OFICIAL


Hombres Mujeres
Si No Si No
35 9 45 10
9,21% 2,37% 11,84% 2,63% Del total de la muestra

ASISTENCIA COLEGIOS OFICIALES


50
45
40
35
30
25
20
15
10
5
0
Si No

HOMBRES MUJERES

CONCLUSIÓN: Se puede afirmar que el investigador supone erróneamente que los hombres asisten más a un colegio oficial que las mujeres.

Las mujeres tienen más asistencia a colegios oficiales debido a que el 11.84% del total de la muestra son mujeres que asisten a establecimientos oficiales, mientras
que solo el 9.21% del total de la muestra representan los hombres que logran tener asistencia a este tipo de colegios.
ASISTENCIA A UN COLEGIO OFICIAL
Hombres Mujeres
Si No Si No
35 9 45 10
21,08% 5,42% Del total de hombres 21,03% 4,67% Del total de mujeres

Debido a que el tipo de variable es No cuantitativa, no es hay manera de calcular la desviación estándar y media muestral. Por tanto, se puede afirmar que en la
muestra el 21.08% del total de hombres asiste a establecimientos oficiales, el 5,42% no asisten y el 73.49% no presenta información sobre el tema.

En la muestra el 21.03% del total de mujeres asiste a establecimientos oficiales, el 4.67% no asisten y el 73.49% no presenta información al respecto.

PRUEBA DE HIPOTESIS JI-CUADRADO X2 – PARA VARIABLES CUALITATIVAS

Suposición la hipótesis nula Ho:

Sabemos que de los 380 individuos de la muestra solo 99 presentaron información, supongo que se esperara que:

 38 hombres si asistieron a colegios oficiales y 7 no


 47 mujeres si asistieron a colegios oficiales y 8 no
(35−38)2 (9−7)2 (45−47)2 (10−8)2
𝑥2 = + + +
38 7 47 8

𝒙𝟐 = 𝟏. 𝟏𝟒
Como el valor obtenido en nuestro estudio; 1.14 es menor al valor crítico de 3.84, podemos aceptar la hipótesis nula (H0)

Das könnte Ihnen auch gefallen