Beruflich Dokumente
Kultur Dokumente
Presentado Por:
Maylebis Castellar Niz
Tutor:
MILTON EDUARDO SALGADO
Grupo: 204040_9
.
JUSTIFICACIÓN
.
OBJETIVOS
Descripción de la actividad
Para dar inicio a su trabajo, el grupo deberá ajustar la base de datos “Indicadores
socioeconómicos 120 municipios (2019) 16-2” trabajada en el periodo, la cual
se encuentra en el entorno de aprendizaje colaborativo, en la carpeta: guía de
actividades y rúbrica de evaluación - Paso 2– organización y presentación, el
grupo dejará sólo los primeros 50 datos en cada una de las variables y procederá
a procesarlos como una muestra de la base original.
Descripción de la actividad.
Una vez ajustada la base de datos, el grupo deberá tomar mínimo cinco variables
(al menos dos cualitativas, una cuantitativa discreta y una cuantitativa continua) y
Descripción de la actividad
Sequías, 5
Sismos, 11
Vulcanísmos, 9
Heladas, 4
La moda: Son Las variables Movimientos en masa y Sismos.
Tabla de Contingencia:
GRADO DE MAGINACIÓN
Muy alto Alto Medio Bajo Muy bajo
Movimiento en masa 1 7 2 1
QUE SE EXPONE LA
TIPO DE RIESGO AL
Sequía 2 2 1
POBLACIÓN
Vulcanismo 1 5 3
Heladas 1 3
Sismo 1 4 5 1
Avenidas torrenciales 3 3 1
Desbordamientos 1 2
Descripción de la actividad
Población Población
de 15 años de 15 años
o más sin o más sin
N° Educación N° Educación
básica básica
primaria primaria
completa completa
1 678 -7.286,74 53.096.579,83 26 5585 -2.379,74 5.663.162,47
2 816 -7.148,74 51.104.483,59 27 6058 -1.906,74 3.635.657,43
3 1278 -6.686,74 44.712.491,83 28 6211 -1.753,74 3.075.603,99
4 1503 -6.461,74 41.754.083,83 29 6549 -1.415,74 2.004.319,75
5 1569 -6.395,74 40.905.490,15 30 6581 -1.383,74 1.914.736,39
6 1653 -6.311,74 39.838.061,83 31 6784 -1.180,74 1.394.146,95
7 1809 -6.155,74 37.893.134,95 32 7033 -931,74 868.139,43
8 1942 -6.022,74 36.273.397,11 33 7094 -870,74 758.188,15
9 2042 -5.922,74 35.078.849,11 34 7178 -786,74 618.959,83
10 2232 -5.732,74 32.864.307,91 35 7578 -386,74 149.567,83
11 2279 -5.685,74 32.327.639,35 36 7852 -112,74 12.710,31
12 2311 -5.653,74 31.964.775,99 37 8352 387,26 149.970,31
13 2960 -5.004,74 25.047.422,47 38 9159 1.194,26 1.426.256,95
14 3030 -4.934,74 24.351.658,87 39 9479 1.514,26 2.292.983,35
15 3192 -4.772,74 22.779.047,11 40 10054 2.089,26 4.365.007,35
16 3235 -4.729,74 22.370.440,47 41 12072 4.107,26 16.869.584,71
17 3240 -4.724,74 22.323.168,07 42 12178 4.213,26 17.751.559,83
18 3248 -4.716,74 22.247.636,23 43 13875 5.910,26 34.931.173,27
19 3697 -4.267,74 18.213.604,71 44 14404 6.439,26 41.464.069,35
20 3906 -4.058,74 16.473.370,39 45 16352 8.387,26 70.346.130,31
21 3940 -4.024,74 16.198.532,07 46 17058 9.093,26 82.687.377,43
22 4135 -3.829,74 14.666.908,47 47 17366 9.401,26 88.383.689,59
23 4202 -3.762,74 14.158.212,31 48 17995 10.030,26 100.606.115,67
24 4663 -3.301,74 10.901.487,03 49 23680 15.715,26 246.969.396,87
25 4854 -3.110,74 9.676.703,35 50 73296 65.331,26 4.268.173.533,19
Medidas Univariantes de Tendencia Central
Media: 7.964,74
Media
∑𝑁
𝑗=1 𝑗 398.237
= = =
𝑁 50
̅ = 7.964,74
Mediana:
Mediana
𝑀𝑒𝑑𝑖𝑎𝑛𝑎 = 5 = 4.854
𝑀𝑒𝑑𝑖𝑎𝑛𝑎 = 4.854
Moda: Moda
No existe la moda porque ningún dato se repite
Cuartiles
Cuartiles
Primer Cuartil (Q1)
1 1
𝑄1 = 1 + 13 = 2.311 + 2.960 =
2 2
𝑄1 = 2.635,5
Segundo Cuartil (Q2)
𝑄 = 𝑀𝑒𝑑𝑖𝑎𝑛𝑎 = 4.854
Tercer Cuartil (Q3)
1 1
𝑄3 = 37 + 38 = 8.352 + 9.159 =
2 2
𝑄3 = 8.759
Medidas univariantes de dispersión:
Rango (R)
𝑅 = 50 1 = 73.296 678 =
𝑅 = 72.618
2
Varianza (s ):
∑𝑁=1 5.713.733.527,62
𝑠 = = =
𝑁 50
𝑠 = 114.274.670,55
Desviación típica(s=)
𝑠 = √𝑠
𝑠 = √114.274.670,55 =
𝑠 = 10.689,93
Coeficiente de variación (V)
𝑠 10.689,93
𝑉= = =
7.964,74
𝑉 = 1,34
Para la variable continúa elegida, se deberán calcular las medidas univariantes de
tendencia central: Media, Mediana, Moda. Todos los cuartiles Así mismo deberán
calcular las medidas univariantes de dispersión: Rango, Varianza, Desviación
típica y Coeficiente de variación.
Los cálculos de los parámetros los podrán realizar con el programa Excel o
Infostat,
% de % de
Población Población
de 15 años de 15 años
o más o más
analfabeta analfabeta
10,82 5,45
3,79 10,13
4,89 17,09
6,38 8,27
5,52 11,02
5,24 4,18
5,14 14,57
9,55 10,18
5,66 9,80
11,27 7,91
9,43 8,31
8,31 4,01
8,52 5,16
10,13 10,56
4,80 2,11
11,36 8,20
7,45 7,16
8,14 10,95
19,47 9,20
5,83 3,46
7,98 9,57
7,13 6,81
4,23 7,57
7,17 13,77
Fórmula de Sturges
𝑐 = 1 + 3,322 ∗ log 𝑁
𝑐 = 1 + 3,322 ∗ 𝐿𝑜𝑔 50
=
𝑐 = 6,64 ≈ 7𝑐𝑙𝑎𝑠𝑒𝑠
Amplitud (a)
𝑀𝑎𝑦𝑜𝑟 𝑚𝑒𝑛𝑜𝑟
𝑎= =
𝑐
19,47 2,11
𝑎= =
7
𝑎 = 2,48
Distribución de frecuencias
% de Población de 15
frecuencias
años o más analfabeta
2,10 4,58 6
4,59 7,07 12
7,08 9,56 16
9,57 12,05 11
12,06 14,54 1
14,55 17,03 2
17,04 19,52 2
50
𝑀𝑒𝑑𝑖𝑎𝑛𝑎 = 8,17
La Moda
∆1
𝑀𝑜𝑑𝑎 = 𝐿1 + ( )∗𝑐
∆1 + ∆
𝐿1: frontera inferior de la clase modal
∆1: exceso de la frecuencia modal sobre la clase inferior inmediata
∆ : exceso de la frecuencia modal sobre la clase superior inmediata
c: anchura del intervalo de la clase modal
La clase modal es la tercera clase
4
𝑀𝑜𝑑𝑎 = 7,075 + ( ) ∗ 2,49 =
5+4
𝑀𝑜𝑑𝑎 = 8,18
Cuartiles
Primer Cuartil (Q1)
𝑁
∑𝑓
𝑄1 = 𝐿1 + ( 4
1
)∗𝑐
𝑓𝑐𝑢𝑎𝑟𝑡 𝑙
donde:
L1: Límite inferior de la clase cuartil
N: número de datos (frecuencia total)
∑ 𝑓 1: suma de las frecuencia de la clases inferiores a la clase
cuartil
fcuartil: frecuencia de la clase cuartil
c: anchura del intervalo de la clase cuartil
𝑁
∑𝑓 1
𝑄1 = 𝐿1 + ( 4 )∗𝑐
𝑓𝑐𝑢𝑎𝑟𝑡 𝑙
La clase cuartil es la segunda
50
6
𝑄1 = 4,59 + ( 4 ) ∗ 2,49 =
12
𝑄1 = 5,94
Segundo Cuartil (Q2) es igual a la mediana:
𝑄2 = 8,17
Tercer Cuartil (Q3):
3𝑁
∑𝑓 1
𝑄3 = 𝐿1 + ( 4 )∗𝑐
𝑓𝑐𝑢𝑎𝑟𝑡 𝑙
La clase cuartil es la cuarta clase
37,5 34
𝑄3 = 9,57 + ( ) ∗ 2,49 =
11
𝑄3 = 10,36
Medidas de Dispersión:
Rango (R)
𝑅 = 𝑀𝑎𝑦𝑜𝑟 𝑚𝑒𝑛𝑜𝑟 =
𝑅 = 19,47 2,11 =
𝑅 = 17,36
2
Varianza (s )
∑𝑁
𝑗=1 𝑗 211,95
𝑠 = = =
𝑁 50
𝑠 = 4,24
7
6
disponibles
5
4
3
2
1
0
0 100 000 200 000 300 000 400 000 500 000 600 000 700 000 800 000
poblacion total (habitantes)
Podemos concluir según el diagrama que si existe correlación entre las dos
variables, que su dirección es positiva
y = 7E-06x + 3,1979
R² = 0,1405
r: 0,3748964
Resumen
Estadísticas de la regresión
Coeficiente de0,41406899
correlación múltiple
Coeficiente de0,17145313
determinación R^2
R^2 ajustado 0,13619582
Error típico 3,32155862
Observaciones 50
ANÁLISIS DE VARIANZA
Grados de libertad
Suma de cuadrados
Promedio de los cuadradosF Valor crítico de F
Regresión 2 107,302549 53,6512743 4,86290963 0,01203515
Residuos 47 518,539329 11,0327517
Total 49 625,841877
Superior 95,0% Coeficientes Error típico Estadístico t Probabilidad Inferior 95% Superior 95%Inferior 95,0%Superior 95,0%
Intercepción 10,7555246 1,11694065 9,62945048 1,0678E-12 8,50852989 13,0025194 8,50852989 13,0025194
Variable X 1 -8,0571E-06 5,4372E-06 -1,48184474 0,14505565 -1,8995E-05 2,8812E-06 -1,8995E-05 2,8812E-06
Variable X 2 -0,61933089 0,31147141 -1,98840366 0,05260798 -1,24593054 0,00726876 -1,24593054 0,00726876
y=10,75-8,057X1-0,619X2
En los datos obtenidos se observa que partir del coeficiente de correlación r2 que
nos da un valor de 0,136 un valor que se encuentra entre menor a 0,30 y nos
muestra que la relación que existe entre las variables múltiples según el grado de
correlación lineal en nula lo que quiere decir que no hay correlación entre las
variables múltiples.
Regresión y correlación entre variables cuantitativas
cantidad de
nivel
servicios
mayoritario de
públicos
Sisbén
disponibles
1 4
1 5
2 7
2 5
1 4
1 4
2 4
1 3
1 2
1 2
2 4
1 5
1 4
1 1
1 7
1 3
1 0
2 4
1 3
2 3
1 3
1 1
1 6
1 3
2 5
1 3
1 2
1 1
1 4
1 3
1 3
1 2
1 2
2 5
1 5
1 4
2 3
1 2
1 7
2 3
1 0
1 3
2 1
2 5
1 4
1 4
2 5
1 3
1 4
1 2
Realizar el diagrama de dispersión de dichas variables y determinar el tipo
de asociación entre las variables.
7
6
5
4
3
2
1
0
0 0.5 1 1.5 2 2.5
CANTIDAD DE SERVICIOS PUBLICOS DISPONIBLES
y= 0,09647x+2,2245
𝑅 = 0,0677
Presenta un grado de correlación regular
Cantidad de servicios
publicos disponibles
8
6
4
2
0
0 10 20 30 40 50 60
Relacionar la información obtenida con el problema.
Resumen
Estadísticas de la regresión
Coeficiente de correlación múltiple 0,260104397
Coeficiente de determinación R^2 0,067654297
R^2 ajustado 0,048230429
Error típico 1,603173827
Observaciones 50
ANÁLISIS DE VARIANZA
Coeficientes Error típico Estadístico t Probabilidad Inferior 95% Superior 95% Inferior 95,0% Superior 95,0%
Intercepción 2,224532225 0,689609252 3,225786515 0,00226 0,837979894 3,611084555 0,837979894 3,611084555
Variable X 1 0,964656965 0,516883987 1,866292995 0,06812 -0,074607946 2,003921875 -0,074607946 2,003921875
Descripción de la actividad.
Finalmente, el grupo deberá responder a la pregunta: ¿Qué alternativa de solución
plantea para la problemática estudiada?, dicha respuesta deberá estar justificada
descriptivamente, es decir para ello (utilizará tablas, gráficos, medidas, diagramas,
entre otros) a partir de los resultados estadísticos descriptivos realizados en la
actividad anterior (50 primeros datos) y la información obtenida de la problemática
planteada.
Del diagrama estadístico Tipo de Riesgo al que se Expone la Población se
desprende que la población con mayor exposición los Riesgos están asociados
con Movimiento de Masas y Sismos. De la tabla de contingencia entre el Grado de
Marginación y Tipo de Riesgo al que se expone la población se desprende que la
población expuestas los Riesgos de Movimiento en Masas y Sismos tienen un
grado de marginación medio y bajo, es decir que están próximos a salir de la
condición de marginalidad lo que los motivará a mudarse a zonas más seguras.
En cuanto a la población de 15 años o más sin educación básica completa se
puede notar que el promedio de los municipios es de 7.965 el cual es un número
manejable, que se pueden identificar y reinsertarlos al sistema educativo con el
objeto de especializar la mano de obra. De la tabla de distribución del %Población
con 15 años o más analfabeta se nota que está concentrada en ciertos municipios
ya que la media, la mediana y la moda tienen valores muy parecido lo que es
indicativo de la concentración de los datos así como el coeficiente de variación es
bajo. Esto sugiere que las políticas públicas deben dirigirse a esos lugares con el
objeto de combatir esa debilidad en nuestra población. En cuanto a la relación
entre la Población y la Población mayor de 15 años completa se nota que están
altamente relacionadas como lo explica el coeficiente de determinación y la
correlación, lo que puede decirse que la población de 15 años o más sin
educación básica completa es una parte de la población que guarda proporción en
todos los lugares habitados.
Actividad 4. Consolidación de informe descriptivo
Descripción de la actividad.
Hay 34 municipios cuyo % de la población ocupada con ingresos de hasta 2
salarios mínimos se encuentra entre 42,92 % y 51,07 % con una media de 46,99
% lo que indica que una cantidad importante de la población tiene esos ingresos.
Hay 6 municipios cuyo % de la población ocupada con ingresos de hasta 2
salarios mínimos se encuentra entre 18,45 % y 26,61 % con una media de 22,53
% lo que es indica menores ingresos.
Los resultados obtenidos indican que el promedio de la población de los 120
municipios de Colombia la población ocupada con ingreso hasta 2 salarios
mínimos es 43,49% lo que se puede considerar bastante aceptable teniendo en
cuenta que la mayoría de la población debe ganar solamente el salario mínimo.
Los valores de moda y media están muy cercanos al promedio lo que indican que
la mayoría de los datos se encuentran muy cerca del valor promedio.
Esto también aparece reflejado en los resultados obtenidos en las medidas de
dispersión que para el rango o amplitud de los datos los valores muestran poca
dispersión.
Se puede concluir que el porcentaje de la población ocupada con ingresos hasta
2 salarios mínimos es cercano a la mitad en los 120 municipios.
CONCLUSIONES
estadísticos es muy completa y nos da una idea exacta de la situación que nos
permite tomar las decisiones adecuadas que conducen a las soluciones de los
Cada estadístico nos da una información específica que nos permite interpretar la
Montero, J.M. (2007). Regresión y Correlación Simple. Madrid: Paraninfo. (pp
151 – 158). Recuperado
de http://go.galegroup.com/ps/i.do?id=GALE%7CCX4052100011&v=2.1&u=un
ad&it=r&p=GVRL&sw=w&asid=b82c81e98fcc1361e1929abe203c8219