Sie sind auf Seite 1von 16

INTITUCION UNIVERSITARIA POLITECNICO GRANCOLOMBIANO

CONTADURIA PÚBLICA

FACULTAD INGENIERIA Y CIENCIAS BASICAS

INTEGRANTES

OVALLE CARRANZA DANIELA

RODRIGUEZ CORTES OSCAR EDUARDO

TUTOR

GABRIELA SANCHEZ

ESTADISTICA 2

2018
OBJETIVOS

Objetivo general:
Conseguir y desarrollar los conocimientos requeridos del módulo Estadística II y la
aplicación de estos, los cuales son necesarios para nuestra formación a futuro, no
solo en el ámbito académico, sino también el profesional, logrando con ello,
mejorar nuestra capacidad de análisis e interpretación de los temas vistos, a
través del desarrollo de los diferentes puntos del trabajo, utilizando las
herramientas y directrices para el aprendizaje en la modalidad virtual.

Objetivos específicos:
Mejorar nuestra capacidad de análisis e interpretación de ejercicios prácticos de
estadística inferencial, aplicando los principios y fórmulas vistos a lo largo del
curso.

Desarrollar habilidades y capacidades requeridas en este tipo de trabajo en grupo


a través de la modalidad virtual, con el fin de sustentar y argumentar las
respuestas a las diferentes entregas (por semanas), buscando consolidar la
respuesta más adecuada.

Identificar las principales características del muestreo y las distribuciones


muéstrales, así como la estimación de parámetros e intervalos de confianza,
según se iban desarrollando cada uno de los puntos por los diferentes integrantes
del grupo.
CONTEXTO

A continuación, se tiene la información de la Gran Encuesta Integrada de Hogares


(GEIH), realizada por el DANE. Esta encuesta se hace en las 13 ciudades
principales del Colombia (Bogotá, Medellín, Cali, barranquilla, Bucaramanga,
Manizales, Pasto, Pereira, Ibagué, Cúcuta, Villavicencio, Montería, Cartagena) y
11 ciudades intermedias (Tunja, Florencia, Popayán, Valledupar, Quibdó, Neiva,
Riohacha, Santa Marta, Armenia, Sincelejo, San Andrés).  Esta encuesta, se
solicita información sobre las condiciones de empleo de las personas (si trabajan,
en qué trabajan, cuánto ganan, si tienen seguridad social en salud o si están
buscando empleo), además de las características generales de la población como
sexo, edad, estado civil y nivel educativo, se pregunta sobre sus fuentes de
ingresos. La GEIH proporciona al país información a nivel nacional, cabecera -
resto, regional, departamental, y para cada una de las capitales de los
departamentos.

Parte 1 (semana 3 - 5)

Selección de muestra

1. En ocasiones en que no es posible o conveniente realizar un censo (analizar a


todos los elementos de una población), se selecciona una muestra, entendiendo
por tal una parte representativa de la población. En ese sentido, escoja un tipo
de muestreo y argumente la viabilidad de esta técnica para la base de datos
dada. Para seleccionar una muestra debe tenerse en cuenta el cómo
seleccionar los elementos que formarán parte de la
muestra (tipo de muestreo) y cuántos elementos debemos seleccionar (Tamaño
de muestra).

Desarrollo: (Hoja de Excel: Parte1_Semana3. Punto1)

Según lo descrito en el enunciado del trabajo, ya que no es posible efectuar un


censo para obtener la información real, se realizó la Gran Encuesta Integrada
de Hogares (GEIH) a una muestra representativa de la población para las
ciudades principales (13) e intermedias (11) de Colombia, buscando la
información requerida sobre las condiciones de empleo de las personas,
además de sus características generales de cada una de ellas.

De acuerdo a lo anterior y basándome en lo visto a lo largo de estas semanas


para esta estadística inferencial, yo creo que es un Muestreo Probalístico, ya
que es una selección aleatoria con un margen de error (error de muestreo), de
tipo Muestreo Estratificado, ya que la población se puede dividir según el
archivo de Excel en grupos con características homogéneas dentro los grupos y
heterogéneas entre sí.

De esta forma, si la población tiene N individuos, y se ordenan aleatoriamente,


entonces los primeros (o los últimos) k elementos conforman una muestra
aleatoria simple de tamaño k. Este tamaño de muestra k se calcula con la
siguiente formula dado que se conoce el tamaño de la población:

2. Utilizando la variable género P(6020) determine el tamaño de la muestra


seleccionando adecuadamente y justificando:

Desarrollo: (Hoja de Excel: Parte1_Semana3. Punto2)

a) Fórmula a desarrollar:
De acuerdo al algoritmo seleccionado para
determinar la muestra a usar en el desarrollo de este taller, se debe calcular
el tamaño de muestra con la siguiente formula:

En donde,
N = tamaño de la población
Z = nivel de confianza,
P = probabilidad de éxito, o proporción esperada
Q = probabilidad de fracaso
D = precisión (Error máximo admisible en términos de proporción).

b) Estimación de la proporción de mujeres:


De acuerdo a la información contenida en la base de datos sobre el Censo
en Colombia, se obtiene la siguiente información:

Cantidad de Estimación de
Género mujeres y proporción de
hombres mujeres

Mujer 31.969 52,97%


Hombre 28.387 47,03%

Total general 60356 100,00%

c) Nivel de confiabilidad
Para tener en cuenta, algunos de los valores de Z de la distribución normal
estándar más comunes en la resolución de ejercicios de estadística, están
dados en la siguiente tabla:

Nivel de
confianza 1-α α/2 z α/2
deseado

90% 0,90 0,050 1,645


95% 0,95 0,025 1,960

99% 0,99 0,005 2,575

Para el desarrollo de este taller, se selecciona este nivel de confianza del


95% dado que es el punto medio los niveles de confianza más usuales

d) Error de estimación

Es el error máximo admisible en términos de proporción. Para el desarrollo


de este taller, dado que no se establece un valor, se establece trabajar en
la resolución de este taller con un error de 0.05.

e) El tamaño de la muestra y la muestra


Una vez se han determinado los valores anteriores, se procede a calcular el
tamaño de la muestra y a seleccionar la muestra, como se muestra en la
hoja de Excel Parte1_semana3. Punto 2.

Z= 1,96

S(pxq)= 0,25

d= 0,05

N= 60356

n= 380,40

Por lo tanto, el tamaño de la muestra es 380.

Parte 1 (semana 4)

Intervalo de confianza para dos variables numéricas


Un investigador, cree determinar que existen diferencias entre los niveles de
estudio de los hombres y las mujeres en Colombia. Para determinar lo anterior,
use la “muestra” encontrada en la semana 3:
1. Utilizando la variable escolaridad (ESC) y sexo (P6020), realice un histograma
para los hombres y mujeres. Según los resultados, ¿Existen diferencias?

Desarrollo: (Hoja de Excel: Parte1_Semana4. Punto1)

Para la realización de este punto se requiere primero identificar los valores


máximo y mínimo de la variable ESC de la hoja de cálculo de Excel llamada
“Población”, que hace referencia al grado de escolaridad de los encuestados.
Esta identificación nos ayuda a determinar la Clase a utilizar en la creación del
histograma. De acuerdo a los resultados obtenidos en Excel, se muestran a
continuación la tabla resumen y el grafico donde se establece el histograma
para hombres y mujeres de acuerdo al grado de escolaridad:

Clases Mujeres Hombres Mujeres Hombres Mujeres Hombres Mujeres Hombres Mujeres Hombres
5 73 77 39% 43% 5 5 73 77 39% 43%
10 46 43 63% 67% 15 15 61 51 71% 71%
15 61 51 95% 95% 10 10 46 43 95% 95%
20 9 6 100% 98% 20 20 9 6 100% 98%
y mayor... 0 3 100% 100% y mayor... y mayor... 0 3 100% 100%
Chart Title
90 120%
80 77 100%
73 95% 98%
100%
70 100% 100%
61 95%
60 80%
71%51
50 71% 46
43 60%
40
43%
30 40%
39%
20
9 20%
10 6
3
0
0 0%
15 10 20 y mayor... y mayor...

Frecuencia Mujeres Frecuencia Hombres


% acumulado Mujeres % acumulado Hombres

Gráficamente, los resultados del histograma tanto para hombres y para mujeres,
no se muestra diferencia alguna en los resultados, es decir que el nivel de

escolaridad es similar tanto en hombres como mujeres, salvo para el nivel de


escolaridad de 0 a 5, dado que en este caso, el porcentaje de escolaridad es
menor para las mujeres.

 El 43% de los hombres encuestados presentan un grado de escolaridad


de 0-5, mientras que las mujeres presentan en esta misma categoría el
39%
 Es de sorprender que el porcentaje del grado de escolaridad se mayor en
la categoría de 10-15 que en la categoría de 5-10, donde en ambas
categorías se muestra una mayor (pero no tan significativa) participación
de las mujeres a nivel de grados escolares.
2. Asumiendo que los datos son normales, calcule un
intervalo de confianza del 95% para estimar, la escolaridad promedio de los
hombres y de las mujeres de forma individual, en los niveles de estudio de
Bachiller, Tecnólogo y Universitario.

Desarrollo: (Hoja de Excel: Parte1_Semana4. Punto 2 y 3)

Para el cálculo del intervalo de confianza se va a utilizar la siguiente formula:

Por lo tanto utilizando las fórmulas de Excel se determinan los siguientes


promedios y desviaciones estándar para la variable escolaridad en hombres y
mujeres, desagregado por Bachillerato, Tecnólogo y Universidad:
Etique tas de colum na
Hom bre M uje r
Etique tas de fila Sum a de ESC Pr om e dio de ESC De s ve s t de ESC Sum a de ESC Prom e dio de ESC De s ve s t de ESC
Bachiller 430 11,62 1,0 645 11,52 1,0
Ninguno 80 10,00 0,0 80 10,00 0,0
Postgrado 62 20,67 3,2 53 17,67 1,5
Técnico o tecnológico 215 14,33 2,3 96 13,71 1,1
Universitario 79 15,80 0,4 64 16,00 0,0
(en blanco) 487 4,35 2,8 476 4,29 2,9
Total ge ne ral 1353 7,52 4,9 1414 7,48 4,6

Luego, haciendo uso de la formula expuesta, los resultados de los intervalos de


confianza para hombres son:

Intervalo de
Universitari
confianza para Bachiller Tecnólogo
o
hombres

Con un nivel de
significancia del
1,645
95%, se tiene que
Z

Limite Inferior 11,54 14,08 15,72

Limite superior 11,70 14,59 15,88


 El intervalo de confianza para la escolaridad en
hombres para Bachillerato es de: (11.54; 11.70)
 El intervalo de confianza para la escolaridad en hombres para Tecnólogo es
de: (14.08 ; 14.59)

 El intervalo de confianza para la escolaridad en hombres para Universidad es


de: (15.72 ; 15.88)

Luego, haciendo uso de la formula expuesta, los resultados de los intervalos de


confianza para mujeres son:

Universitari
Intervalo de confianza Bachiller Tecnologo
o

Con un nivel de
significacia del 95%, se 1,645
tiene que Z

Limite Inferior 11,45 13,53 16,00

Limite superior 11,59 13,90 16,00

 El intervalo de confianza para la escolaridad en mujeres para Bachillerato es


de: (11.45; 11.59)
 El intervalo de confianza para la escolaridad en mujeres para Tecnólogo es
de: (13.53 ; 13.90)

 El intervalo de confianza para la escolaridad en mujeres para Universidad es


de: (16.00 ; 16.00)

3. Asumiendo que los datos son normales, calcule un Intervalo de confianza al


95% para estimar la diferencia promedio de escolaridad para los hombres y
mujeres, en los niveles de estudio de Bachiller, Tecnólogo y Universitario

Desarrollo: (Hoja de Excel: Parte1_Semana4. Punto 2 y 3)


Para el cálculo del intervalo de confianza se va a utilizar
la siguiente formula:

Por lo tanto, utilizando las fórmulas de Excel se determinan los siguientes


intervalos de confianza:

Intervalo de Universitari
Bachiller Tecnólogo
confianza o

Con un nivel de
significancia del
1,96
95%, se tiene que
Z

Límite Inferior 0,0024 0,2920 -0,2986

Límite superior 0,2051 0,9461 -0,1014

 El intervalo de confianza para la diferencia de escolaridad entre mujeres y


hombres en bachillerato es (0.0024; 0.2051)
 El intervalo de confianza para la diferencia de escolaridad entre mujeres y
hombres en Tecnólogo es (0.2920; 0.9461)
 El intervalo de confianza para la diferencia de escolaridad entre mujeres y
hombres en Universidad es (-0,2986;
-0.1014)

Parte 1 (semana 5)

Prueba de hipótesis para dos variables nominales

Un investigador, cree determinar que los hombres asisten más a un colegio oficial
que las mujeres en Colombia. Para determinar lo anterior, use la “muestra”
encontrada en la semana 3:

1. Utilizando la variable si actualmente asiste a un establecimiento oficial (P6175)


y sexo (P6020), realice un diagrama de barras comparativo para los hombres y
mujeres en un solo gráfico. Según los resultados,
¿Existen diferencias?

Desarrollo: (Hoja de Excel: Parte1_Semana5. Punto 1, 2 y 3)

140 133
120 114
100
80
60 54
46
40
16 17
20
0
No Sí (en blanco)

Hombre Mujer

 Gráficamente se muestran diferencias no tan significativas entre hombres y


mujeres frente al tema de asistir a establecimientos oficiales, dada una
participación respectivamente del 29.3% y 23.5%

2. Con un nivel de confianza del 95%, estime e interprete la proporción de


hombres y de mujeres que asisten a un establecimiento oficial.
Desarrollo: (Hoja de Excel: Parte1_Semana5. Punto 1, 2 y 3)

Intervalo de
Hombres Mujeres
confianza
Con un
nivel de
significancia del 1,96
95%, se tiene que
Z

Límite Inferior 22,8% 17,5%

Límite superior 35,9% 29,4%

 Por tanto, con un nivel de significancia del 95%, se tiene que el intervalo de
confianza de hombres que asisten a un establecimiento oficial es (22.8%;
35.9%), dado que el porcentaje de hombres que asiste a una entidad oficial
el de 29.3%

 De igual manera, con un nivel de significancia del 95%, se tiene que el


intervalo de confianza de mujeres que asisten a un establecimiento oficial es
(17,5%; 23.5%), dado que el porcentaje de mujeres que asiste a una entidad
oficial el de 23.5%

3. Realice una prueba de hipótesis para determinar la afirmación del investigador.


Utilice un nivel de significancia del 5%. ¿Qué se puede decir de lo anterior?

Prueba de hipótesis
Hipótesis: el nivel de asistencia a establecimientos oficiales es mayor en
hombres que en mujeres
Hipótesis nula: la asistencia entre hombres y mujeres a establecimientos
oficiales es similar

La información proporcionada es:

 n_hombres= 184 n_mujeres=196


 p_hombres =0.293 p_mujeres= 0.235
 P-hombres -P_mujeres= 0.058
Especifica el nivel de significación de α=.05 . El valor crítico para la es de
1.64.
Se estima el error estándar de la diferencia de las dos proporciones:

h−m

s p = P (1−P)
( n1 + n1 )
H M

Donde:
n H P H +nM P M
P=
nH +n M

( 184 x 0.293 )+(196 x 0.235)


P= =0.26
380

Por lo tanto:


S= 0.26 x ( 1−0.26 ) x ( 1841 + 1961 )=0.045

Se calcula el estadístico de prueba:

0.058−0
Z= =1.29
0.045

De acuerdo a los resultados, no se rechaza la hipótesis dado que el valor


de Z calculado es menor que el valor crítico 1.96 y mayor que el valor critico
-1.96, según el nivel de significancia establecido por el ejercicio.
CONCLUSIONES

Con el perfeccionamiento de este trabajo en grupo, a través de un ambiente de


educación virtual, se aplicaron los temas vistos a lo largo del curso de Estadística
II, en donde se utilizaron en la práctica los diferentes conceptos y fórmulas, así
como las herramientas propias de la plataforma, en pro de la interacción y
argumentación de los resultados por parte de los integrantes del grupo.

Revisando las soluciones a los puntos en el foro y luego de aplicar los


conocimientos vistos en estas 5 semanas, se llevó al consenso las respuestas a
nivel grupal, las cuales para nosotros son las más adecuadas, esperando que se
haya cumplido con el objetivo principal del ejercicio de Estadística II.

Es gratificante para cada uno de nosotros, lograr el desarrollo de nuevos


conceptos, conocimientos y habilidades prácticas, las cuales nos enriquecerán y
complementarán sustancialmente en nuestra formación como profesionales,
buscando ser egresados con un excelente nivel y competitivos laboralmente .
REFERENCIAS

http://mggp.utalca.cl/cursos/Documentos/met_de_investigacion/Cap
%208_9%20Metodologia%20de%20investigacion.pdf

https://es.khanacademy.org/math/statistics-probability/confidence-intervals-
one-sample

Das könnte Ihnen auch gefallen