Beruflich Dokumente
Kultur Dokumente
Análisis de la información
Yurbely Ascencio
Grupo: 204040_77
15 de Abril de 2018
Estadistica Descriptiva
17 de Abril de 2018
1
Introducción
El presente trabajo se realiza con el fin de evidenciar la importancia de la estadística puesto que
de problemas que se nos presentan a diario o para explicar las condiciones de algún proceso de
estudio.
originados a partir de los estudios que se surgen en la humanidad. Los daros arrojados a estas
operaciones se representan numérica y gráficamente por lo que hace que sean más fáciles de
interpretar.
En esta parte del trabajo se estudian algunas Variables cuantitativas, las cuales se clasifican en
discretas y continuas, de las discretas solo se toman valores enteros, por el contrario dentro de las
continuas se puede tomar cualquier valor real, cuando se estudia el comportamiento de estas
2
Justificación
El presente trabajo se enfocará en estudiar las medidas de tendencia central y de dispersión, esto
con el fin explicar en qué consisten las medidas de tendencia central, ya que son aquellas
medidas estadísticas que pretenden resumir en un solo valor a un conjunto de valores, tales como
Media, Mediana y Moda, de igual forma tener presente que las medidas de dispersión en
cambio miden el grado de dispersión de los valores de la variable es decir aquella información
Es de anotar que gracias a estos medidas estadísticas, podemos reconocer de una manera rápida
3
Objetivos
Objetivo General.
Interpretar los diferentes ejercicios utilizando Medidas Univariantes para las variables
Discretas y continuas.
Objetivos Específicos
4
Medidas univariantes de tendencia central
Variable discreta
Las medidas de tendencia central son medidas estadísticas que pretenden resumir en un solo valor
de los datos.
Media: Medida de tendencia central usualmente llamada promedio, se define como la división de
X Σ f.
=
X
n
Mediana: Del conjunto de datos obtenidos es el valor que al organizar los datos en orden
ascendente o descenderte a la mitad o centro de los mismos. La posición que ocupa la mediana
n
F k-1
2 A
Me = X k L
k
f k
5
Moda: Es el dato que ocurre con mayor frecuencia en un conjunto de elementos estudiados.
F
k-1
Mo = X A L
k k
F k-1
F
k-1
Cuartiles: Los cuartiles son valores que dividen una muestra de datos en cuatro partes iguales.
K.N
Qx =
4
Deciles: Los Deciles (D) son puntuaciones que dividen la distribución en diez partes.
K.N
D5 =
10
Percentiles: El percentil es una medida de posición usada en estadística que indica, una vez
ordenados los datos de menor a mayor, el valor de la variable por debajo del cual se encuentra un
K.N
P =
100
6
Estudiante 1: Fabián Darío Ortega Moncada
MEDIA 4945286,18
MEDIANA 4956367,50
MODA 5078578,50
CUARTIL 1 4260930,50
CUARTIL 2 4956367,50
CUARTIL 3 5713106,00
DECIL 5 4956367,50
DECIL 7 5543372,00
PERCENTIL 30 4260930,50
PERCENTIL 50 4956367,50
Gráfica:
Frecuencia
45
40
35
30
25
20 Frecuencia
15
10
5
0
1 2 3 4 5 6 7 8
7
Estudiante 2: Laura Vanessa Leal Sumalave
MEDIA 25.286.286
MEDIANA 25.173.301
CUARTIL 1 23.076.293
CUARTIL 2 25.173.301
CUARTIL 3 27.433.631
DECIL 5 25.173.301
DECIL 7 23.150.854,1
PERCENTIL 30 22.376.377,8
PERCENTIL 50 25.173.301
Gráfica:
MEDIA 48303554,25
MEDIANA 48453732,45
8
MODA 25609167-26643156
CUARTIL 1 36439475,88
CUARTIL 2 48453732,45
CUARTIL 3 60467989,02
DECIL 5 48453732,45
DECIL 7 57764781,3
PERCENTIL 30 38842327,2
PERCENTIL 50 48453732,45
Gráfica:
Chart Title
80,000,000
Axis Title
60,000,000
40,000,000
20,000,000
-
1 2 3 4 5 6 7 8 9
Clase 30 36 42 48 54 60 66 72
Frecuencia 20 20 20 20 19 20 20 20 159
MEDIA 253144
MEDIANA 253452
MODA AMODAL
9
CUARTIL 1 231307
CUARTIL 2 253452
CUARTIL 3 271411
DECIL 5 253452
DECIL 7 269308
PERCENTIL 30 234202
PERCENTIL 50 253452
Gráfica:
250,000
200,000
150,000
100,000
50,000
-
106
113
120
127
134
141
148
155
8
1
78
15
22
29
36
43
50
57
64
71
85
92
99
MEDIA 45.598.150,189
MEDIANA 45.598.150
10
MODA Es amodal porque
no hay ningún dato
que se repita
CUARTIL 1 43.843.132
CUARTIL 2 45.598.150
CUARTIL 3 47.353.169
DECIL 5 45.598.150
DECIL 7 46.958.290
PERCENTIL 30 44.194.135
PERCENTIL 50 45.598.150
Grafica
48000000
Cantidad de Personas
46000000
44000000
42000000
40000000
38000000
8
15
22
29
36
43
50
57
64
71
1
78
85
92
99
106
113
120
127
134
141
148
155
Meses
- Valor que divide a los datos, en 2 partes iguales, es decir la mitad de la población gana menos
11
- Un 50% de los datos tienen una ocupación inferior a 25.173.301.
- En el año que hubo menos cantidad de empresas, hubo 206457, en el año que hubo más cantidad
estuvieron entre 206457 y 253452 empresas, se puede observar que de los meses estudiados el otro
- En los años comprendidos 2004 a 2017 hubo un crecimiento considerable, por lo anterior la
confianza de los habitantes del país fue buena, con esto podemos deducir que debido a esto no
- En el 25% de los meses estudiados hubo entre 206456 y 231307 cantidad de empresa.
- El 50% de los meses estudiados, hubo entre 206457 y 253452 cantidad de empresas en Colombia.
12
- En el 75% de los meses estudiados hubo entre 206457 y 271411 empresas, mientras que el 25%
- En el 50% de los mese estudiados hubo entre 206457 y 253452 empresas en Colombia.
- En el 70% de los meses hubo entre 206457 y 269308 empresas, en el 30% restante hubo entre
- En el 30% de los meses estudiados hubo entre 206457 y 234202 empresas en Colombia.
- En el 50% de los meses estudiados hubo entre 206457 y 253452 empresas, el otro 50% restante
- El promedio de personas en Colombia entre el año 2004 y 2017 es de 45.598.150, cifra que ve
que incrementó mes a mes lo cual hizo que esta base de datos fuera amodal ya que no hubo un mes
- Podemos observar que el 25% de la población fue 43.843.132 mientras que el 50% incrementó
con 45.589.150 demostrándonos que cada mes, el número de personas en Colombia iba
- Podemos concluir que en el 70% de la población entre 2004 y 2017 motró un incremento
- Podemos observar que entre el 30% y el 50% de la cantidad de personas en el país, hubo un
incremento considerable, lo cual demanda que el país incremente sus vacantes de empleo para
variable discreta
datos, indicando la mayor o menor concentración de datos respecto a las medias de centralización.
Rango: El rango (R) o recorrido estadístico es la diferencia entre el valor máximo y el mínimo de
un conjunto de elementos.
Varianza: La varianza (S2) mide la dispersión de los datos de una muestra respecto a
la media, calculando la media de los cuadrados de las distancias de todos los datos.
Al elevar las diferencias al cuadrado se garantiza que las diferencias absolutas respecto a la media
14
Siempre se cumple que la varianza es mayor o igual que cero (S2 ≥ 0). La varianza es cero cuando
Desviación típica: La desviación típica es la medida de dispersión (S) asociada a la media. Mide
el promedio de las desviaciones de los datos respecto a la media en las mismas unidades de los
datos.
Coeficiente de variación: mide la variación de los datos respecto a la media, sin tener en cuenta
15
El coeficiente de variación toma valores entre 0 y 1. Si el coeficiente es próximo al 0, significa
que existe poca variabilidad en los datos y es una muestra muy compacta. En cambio, si tienden a
Para interpretar fácilmente el coeficiente, podemos multiplicarlo por cien para tenerlo en tanto por
cien.
RANGO 5591256
DESVIACIÓN 1063464,497
VARIANZA 1,13096E+12
RANGO 2.420.097
DESVIACIÓN 239123.4
VARIANZA 5.7175*〖10〗^10
16
Variable discreta: Personas Sin Empleo
RANGO 5591251
DESVIACIÓN 1063464,497
VARIANZA 1,13096E+12
RANGO 5591251
DESVIACIÓN 1063464,50
VARIANZA 1,13096E+12
- Existe una diferencia de 2.420.097 entre el máximo y el mínimo valor de personas con empleo.
17
- La desviación respecto al promedio es de 239123.4 personas.
- El rango en el que se mueve las personas sin empleo en los meses estudiados no es tan pequeña,
- Teniendo en cuenta que las medidas de dispersión presentan un valor grande comparado con los
datos estudiados, podemos concluir que existe una diferencia significativa entre las personas sin
empleo, igualmente que su distribución es Hetereogenea, ya que hay diferencia entre los valores
VARIABLE CONTINUA
Cuando se trabaja con datos que han sido agrupados en una distribución de frecuencias, no se sabe
con certeza los valores individuales de cada dato. Por lo que se utilizan métodos alternos para
Media para datos agrupados: Al calcular la media para datos agrupados, se supone que las
18
Mediana: Primero se encuentra la clase mediana, la cual es la clase cuya frecuencia acumulada es
La moda: Es la observación que ocurre con mayor frecuencia, por lo que es necesario identificar
la clase modal, esta se localiza encontrando la clase que tenga más frecuencia.
19
Estudiante 1: Fabián Darío Ortega
n 159
Min 48,97
Max 61,41
Rango 12,44
8,09
K
A 1,56
20
Frecuencia
Número de Límite Límite Marca de Frecuencia
absoluta
clases inferior superior clase absoluta f
acumulada
TOTAL 159
Histograma:
Frecuencia
45
40
35
30
25
20 Frecuencia
15
10
5
0
1 2 3 4 5 6 7 8
21
Polígono de frecuencias:
Frecuencia
50
40
30
20 Frecuencia
10
0
1 2 3 4 5 6 7 8
MODA 59,09
n/2 79,50
N 159
P80 55,55
P81 55,75
MEDIANA 55,65
N 159,00 n 159,00
K 50,00 k 25,00
L 79,50 L 39,75
22
N 159,00 n 159,00 n 159,00
n 159,00 n 159,00
k 5,00 k 7,00
L 79,50 L 111,30
D5 55,65 D7 57,44
Frecuencia
Número de Límite Límite Marca de Frecuencia
absoluta
clases inferior superior clase absoluta f
acumulada
23
2 84,20625 91,7125 16 40 10,06%
TOTAL 159
Histograma:
25
20
15
10
5
0
80.45 87.96 95.47 102.97 110.48 117.98 125.49 133.00
INDICE DE PRECIOS
35 − 28
𝑀𝑜𝑑𝑎 = 106,725 + ∗ 7,50625 = 108.74591
(35 − 28) + (35 − 16)
24
159
− 57
𝑀𝑒𝑑𝑖𝑎𝑛𝑎 = 99,21875 + 2 ∗ 7,50625 = 105.25055
28
𝑃50 = 𝑄2 = 105.25055
𝑃25 = 𝑄1 = 91.59521
1 ∗ 159
− 24
𝑄1 = 84,20625 + 4 ∗ 7,50625 = 91.59521
16
2 ∗ 159
− 57
𝑄2 = 99,21875 + 4 ∗ 7,50625 = 105.25055
28
3 ∗ 159
− 85
𝑄3 = 106,725 + 4 ∗ 7,50625 = 114.07040
35
𝐷5 = 𝑄2 = 105.25055
7 ∗ 159
− 85
𝐷7 = 106,725 + 10 ∗ 7,50625 = 112.36541
35
25
Estudiante 3: Leidy Niño Tellez
n 159
Min 1712,5
Max 3664,5
Rango 1952
K 8,08849874
A 244
Frecuencia
Número de Límite Límite Marca de Frecuencia
absoluta
clases inferior superior clase absoluta f
acumulada
TOTAL 159
26
Histograma:
Frecuencia
80
70
60
50
40
30
20
10
0
1956,6 2200,6 2444,6 2688,6 2932,6 3176,6 3420,6 3664,5 y
mayor...
Frecuencia
Polígono de frecuencias:
Frecuencia
Frecuencia
69
30
18 17
9 7
6
3
0
27
MODA 1.713-1.957
n/2 79,5
P80 2.066
P81 2.089
MEDIANA
n 159 n 159
k 50 k 25
L 79,5 L 39,75
Datos 80 Dato 40
80 1.763 40 1.885
81 2.089 41 1.885
k 2 k 1 k 3
28
n 159 n 159
k 5 k 7
L 79,5 L 111,3
D5 2077,823667 D7 2339,484171
n 159
Min 7,27
Max 17
Rango 9,73
K 8,31304125
A 1,17
Frecuencia
Número de Límite Límite Marca de Frecuencia
absoluta
clases inferior superior clase absoluta f
acumulada
29
3 9,61 10,78 10,20 30 70
Total 159
Histograma:
45
40
35
30
Meses
25
20
15
10
0
7.86 9.03 10.20 11.37 12.54 13.71 14.88 16.05
Tasa de Desempleo
30
Polígono de frecuencias:
35
30
25
20
15
10
5
0
-8.50 148.50 305.50 462.50 619.50 776.50 933.50 1090.50 1247.50 1405
Tasa de Desempleo
fk-1 30
fk+1 22
Ak 1,17
Lk 10,78
MODA 11,46
n/2 79,5
n 159
Fk-1 70
fk 46
Ak 1,17
Lk 10,78
31
MEDIANA 11,02
n 159 n 159
Fk-1 70 Fk-1 9
fk 46 fk 31
Ak 1,17 A 1,17
Lk 10,78 Lk 8,44
fk 46 fk 31 fk 30
n 159 n 159
Fk-1 70 Fk-1 70
fk 46 fk 46
32
Ak 1,17 A 1,17
Lk 10,78 Lk 10,78
D5 11,02 D7 11,83
moderadamente simétrica.
33
Henry Yecid Rojas Arismendy – Tasa de Desempleo
en los meses estudiados se mantuvo en mantuvo en 10,95, con lo anterior se puede decir que más
de la mitad de los meses que estudiamos la tasa de desempleo fue baja referente a la cantidad de
- En el presente ejercicio podemos deducir que frente a la tasa de desempleo el 50% se mantuvo
entre 7,27 y 11,02, el otro 50% del periodo estudiado se mantuvo entre el 11,02 y 17,00 siendo
- En el presente ejercicio podemos deducir que en los meses estudiados el porcentaje de la tasa de
- En el presente ejercicio podemos deducir que en el 25% de los meses estudiados, la tasa de
- En el presente ejercicio podemos deducir que en el 50% de los meses estudiados, la tasa de
desempleo en Colombia se mantuvo entre 7,26 y 11,02, mientras que el 50% restante se mantuvo
34
- En el presente ejercicio podemos deducir que en el 75% de los meses estudiados la tasa de
desempleo en Colombia se mantuvo entre 7,27 y 12,08, mientras el otro 25% la tasa de desempleo
- En el presente ejercicio podemos deducir que en el 50% de los meses estudiados, la tasa de
desempleo se mantuvo entre 7,27 y 11,02, es decir que aunque se incrementó, este no fue
desmedido esto podría significar que se debe a que hubo incremento en la economía dando más
oportunidad a la población.
- En el presente ejercicio podemos deducir que en el 70% de los meses estudiados, la tasa de
desempleo se mantuvo entre 7,27 y 11,83, el otro 30% restante se mantuvo entre 11,83 y 17,00.
- En el presente ejercicio podemos decir que en el 25% de los meses estudiados la tasa de
- En el presente ejercicio podemos decir que en el 50% de los meses estudiados la tasa de
desempleo se mantuvo entre 7,27 y 11,02, en el otro 50% la tasa de desempleo se mantuvo entre
11,02 y 17,00.
Medidas de dispersión
Variable continúa
Las medidas de dispersión nos permiten conocer si los valores en general están cerca o alejados
de los valores centrales, muestran la variabilidad de una distribución de datos, indicando por medio
35
de un número si las diferentes puntuaciones de una variable están muy alejadas de la medida de
tendencia central.
Rango:
Varianza: Es la diferencia entre el valor máximo y el mínimo en nuestros datos, esta medida de
Datos agrupados hay dos formas para determinar el rango para datos agrupados:
Rango = Punto medio de la clase más alta – punto medio de la más baja.
Rango= Límite superior de la clase más alta – límite inferior de la más baja.
36
Desviación Estándar
Coeficiente De Variación
RANGO 16,00
DESVIACIÓN 3,024308932
VARIANZA 9,146444516
RANGO 60,05
DESVIACIÓN 15.7511
VARIANZA 248.09732
RANGO 12,44
DESVIACIÓN 3,024308932
VARIANZA 9,146444516
38
Estudiante 4: Henry Yecid Rojas A.
RANGO 9,73
DESVIACIÓN 1,688
VARIANZA 2,85
- Existe una diferencia de 60,05 entre el máximo y el mínimo valor del índice de precios
- Respecto a la media la variación es del 15.095%, es decir, los datos se desvían de la media
39
- Teniendo en cuenta que la medida de dispersión comparada con la tasa de desempleo en
precios en los meses estudiados por lo anterior se puede decir que es homogénea.
40
Conclusiones
La estadística por excelencia es una herramienta que nos permite interpretar información
Con el desarrollo del trabajo y el análisis de los datos podemos evidenciar desde las
resultados.
A partir de estos resultados podemos concluir, como mediante los diferentes ejercicios de
estadística calculamos resultados que nos permiten visualizar la verdadera situación del
41
REFERENCIAS BIBLIOGRÁFICAS
Normas APA consultado el día 7 de septiembre del 2017. Disponible en línea en:
http://www.bidi.uam.mx/index.php?option=com_content&view=article&id=62:citar-
recursos-electronicos-normas-apa&catid=38:como-citar-recursos&Itemid=65#2
dispersion/
https://tratamientodedatos.wordpress.com/2011/03/07/medidas-de-tendencia-central-
para-datos-no-agrupados-y-agrupados/
42