Sie sind auf Seite 1von 3

Facultad de Ingeniería y Ciencia Básicas

Estadística II
Modalidad Virtual

La siguiente serie de ejercicios se dividirán en dos partes, la primera tendrá una fecha de realización hasta el
jueves de la semana 4, y finalizando la semana 6 la segunda parte, el documento final y consolidación del
trabajo debe ser subido en pdf en el (Foro: Desarrollo del trabajo Semana 2 - 7) en cada uno de los respectivo
grupos a más tardar el jueves de la semana 7.

El documento final debe tener: Portada de los que participaron activamente en el foro, Solución de los
problemas planteados, conclusiones y referencia. Todos los puntos deben ser justificados, en caso de hacer
uso de una hoja de cálculo debe ser también adjuntada en el foro.
Para mayor detalle:​ https://www.youtube.com/watch?v=MTLbHXeJoeo

Contexto
A continuación, se tiene la información de la Gran Encuesta Integrada de Hogares (GEIH), realizada por el
DANE​[1]​. Esta encuesta se hace en las 13 ciudades principales del Colombia (Bogotá, Medellín, Cali,
barranquilla, Bucaramanga, Manizales, Pasto, Pereira, Ibagué, Cúcuta, Villavicencio, Montería, Cartagena) y 11
ciudades intermedias (Tunja, Florencia, Popayán, Valledupar, Quibdó, Neiva, Riohacha, Santa Marta, Armenia,
Sincelejo, San Andrés). Esta encuesta, se solicita información sobre las condiciones de empleo de las personas
(si trabajan, en qué trabajan, cuánto ganan, si tienen seguridad social en salud o si están buscando empleo),
además de las características generales de la población como sexo, edad, estado civil y nivel educativo, se
pregunta sobre sus fuentes de ingresos. La GEIH proporciona al país información a nivel nacional, cabecera -
resto, regional, departamental, y para cada una de las capitales de los departamentos.

Este trabajo colaborativo, tiene 5 actividades diferentes. Cada actividad corresponde a un tema de los cuales se
desarrolla durante el módulo. El grupo debe resolver cada actividad e ir plasmando los resultados en el
documento en línea. Los niveles de cada actividad varían según el tema que se esté desarrollando. Sin embargo,
cabe aclarar que las actividades son independientes. Los temas que se desarrollan en este documento van hasta
la semana 7.

En el archivo de Excel ( ​https://goo.gl/zB3Ntf ) se tiene información sobre las características generales de las
personas que respondieron en un mes en particular. Para este trabajo colaborativo, realice lo siguiente:

Parte 1

Tamaño de muestra

Utilizando la variable edad (P6040), realice lo siguiente:


● Realice un histograma y describa la información según la forma y la curtosis de los datos.
● Realice una descripción numérica y descripción como es la población.

● Calcule una nueva variable que sea el


● Teniendo en cuenta la variable anterior realice el cálculo del tamaño de muestra, utilizando la siguiente
fórmula:

Donde, se tiene lo siguiente:

Z: Es el cuantil de la distribución normal estándar al nivel de significancia que se establezca.


S: Es la desviación estándar de la variable.

Es el margen de error absoluto.

Para calcular el tamaño de la muestra, utilice un nivel de confianza del 95% y un margen de error de absoluto
que no supere 0.5.
● Teniendo en cuenta los resultados anteriores, realice una selección de elementos para una muestra,
utilizando el algoritmo del coordinado negativo.
● Compara la media poblacional, con la media muestral y determine la variación relativa.

Intervalo de confianza para dos variables numéricas


Un investigador, cree determinar que existen diferencias entre los niveles de estudio de los hombres y las
mujeres en Colombia. Para determinar lo anterior, se sugiere utilizar la base de la hoja “muestra” y realizar lo
siguiente:
● Utilizando la variable escolaridad (ESC) y sexo (P6020), realice un histograma para los hombres y
mujeres. Según los resultados, ¿Existen diferencias?
● Teniendo en cuenta lo anterior, realice un estudio descriptivo de ambas variables. Realice lectura de
resultados.
● Asumiendo que los datos son normales, calcule un intervalo de confianza del 95% y determine, la
escolaridad de los hombres y de las mujeres de forma individual.
● Asumiendo que los datos son normales, calcule un Intervalo de confianza al 95% para la diferencia de los
niveles de escolaridad para los hombres y mujeres.

Parte 2

Prueba de hipótesis para dos variables nominales


Un investigador, cree determinar que los hombres asisten más a un colegio oficial que las mujeres en Colombia.
Para determinar lo anterior, se sugiere utilizar la base de la hoja de “muestra” y realizar lo siguiente:
● Utilizando la variable si actualmente asiste a un establecimiento oficial (P6175) y sexo (P6020), realice un
diagrama de barras comparativo para los hombres y mujeres en un solo gráfico. Según los resultados,
¿Existen diferencias?
● Con un nivel de confianza del 95%, realice una estimación de los hombres que asisten a un
establecimiento oficial.
● Con un nivel de confianza del 95%, realice una estimación de las mujeres que asisten a un
establecimiento oficial.
● Realice una prueba de hipótesis para determinar la afirmación del investigador. Utilice un nivel de
significancia del 5%. ¿Qué se puede decir de lo anterior?

[1]​ http://www.dane.gov.co/files/investigaciones/fichas/empleo/ficha_metodologica_GEIH-01_V10.pdf