Sie sind auf Seite 1von 19

INTRODUCCIÓN

La estadística descriptiva es de gran importancia ya que nos permite encontrar

soluciones que nos sirvan como apoyo para la toma correcta de decisiones en una

determinada situación.

En el presente documento se estudia la base de datos Pruebas SABER 11 - 220

estudiantes 2020 (16-1), para obtener las medidas de tendencia central, posición y

dispersión de la variable cuantitativa discreta: Numero de cuartos en el hogar y la

variable cuantitativa continua: Horas de dedicación a Internet, con el fin de afianzar

conceptos importantes para el curso de estadística descriptiva y adquirir las habilidades

necesarias para tener un mejor desempeño.


JUSTIFICACIÓN
El presente trabajo se desarrolla con el fin de adquirir las habilidades necesarias de

la estadística descriptiva e implementar teorías matemáticas y estadísticas, para poder

inferir mejores soluciones o inferir el comportamiento de una población de acuerdo con

sus características, con el objetivo de tomar las medidas de acción necesarias y

realizar una debida clasificación de la población.


OBJETIVOS
Objetivo general:

Aplicar las medidas estadísticas univariantes, en la solución de diferentes problemas.

Objetivos específicos:

 Realizar las tablas de distribución de frecuencia para datos agrupados.

 Hacer uso de las gráficas para representar los datos.

 Argumentar de forma adecuada los resultados obtenidos a partir de las

mediciones realizadas.
ACTIVIDADES A DESARROLLAR
Actividad 1: Mapa mental.

Resumir mediante un mapa mental las medidas estadísticas univariantes (medidas

de tendencia central, medidas de posición, medidas de dispersión), describiendo

ampliamente una de ellas.

Actividad 2. Medidas Univariantes -variable Discreta

A partir de la base de datos: Pruebas SABER 11 - 220 estudiantes 2020 (16-1),

encontrada en el entorno de aprendizaje Colaborativo, cada estudiante deberá elegir

una variable cuantitativa discreta distinta, manifestarlo en el foro paso 3 Análisis de la

Información y calcular las medidas de tendencia central y de dispersión.

Posterior a la consulta de las referencias, resolver los siguientes incisos:

Variable cuantitativa discreta: Numero de cuartos en el hogar.


a) Tabla de frecuencia datos no agrupados. Cada estudiante deberá elegir una

variable cuantitativa discreta y diseñar una tabla de frecuencia para datos no

agrupados, a partir de ella elaborar un diagrama de barras y un diagrama de líneas.

La tabla de datos está dada por:

Tabla de distribución de frecuencias


Frecuencia Frecuencia
Marca de Frecuencia absoluta Frecuencia relativa
clase absoluta acumulada relativa acumulada
yi ni Ni hi Hi
1 11 11 5,023% 5,023%
2 49 60 22,374% 27,397%
3 88 148 40,183% 67,580%
4 43 191 19,635% 87,215%
5 13 204 5,936% 93,151%
6 8 212 3,653% 96,804%
7 5 217 2,283% 99,087%
8 1 218 0,457% 99,543%
9 1 219 0,457% 100,000%
219 100,000%

Diagrama de barras:

Cuartos en el hogar
90
80
70
60
50
40
30
20
10
0
1 2 3 4 5 6 7 8 9

Diagrama de líneas:
Cuartos en el hogar
100
90
80
70
60
50
40
30
20
10
0
1 2 3 4 5 6 7 8 9

b) Medidas de tendencias central y de Posición. Para la variable cuantitativa

discreta elegida, cada estudiante deberá calcular las medidas de tendencia central

(media, mediana, moda), medidas de posición: cuartiles, Decil 5 y percentil 50,

determinar el tipo de asimetría y curtosis e interpretar los resultados y asociarlos

con la problemática: Identificación de los principales factores que influyen en

los resultados de las pruebas SABER 11 en estudiantes de Instituciones

públicas y privadas de Colombia.

Nótese que en la tabla de frecuencias la población es de 219 vs. 220 de la base de

datos original, esto debido a que el número 108 de la lista no especificó el número

de cuartos en su casa, así las cosas, tenemos:

Medidas de tendencia central:

 Media:

∑ xi f i
Media= i=1
N
11∗1+ 49∗2+ 88∗3+ 43∗4+ 13∗5+ 8∗6+ 5∗7+ 1∗8+1∗9 710
¿ ¿ ¿ 3,242
219 219

 Mediana:

Como tenemos 219/2=109,5 entonces se toma el dato número 109 de los datos

ordenados de menor a mayor obteniendo:

Mediana=3

 Moda:

Para la moda, se miran cual valor es más veces repetido, para ello podemos ver la

gráfica y notar la barra más grande:

Moda=3

Medidas de posición:

Cuartil:

k 219
Qk=
4

 Primer cuartil:

1∗219
Q 1= =54,75
4

 Segundo cuartil:
2∗219
Q 2= =109,5
4

 Tercer cuartil:

3∗119
Q 3= =164,25
4

Decil:

kN
Dk =
10

 Decil 5

5∗219
D 5= =43,8
10

Percentil:

kN
Pk =
100

 Percentil 50

50∗219
P50= =109,5
100

c) Medidas de Dispersión. Para la variable cuantitativa discreta elegida calcular:

Rango, varianza, desviación típica, coeficiente de variación, posteriormente

interpretar los resultados y asociarlos con la problemática: Identificación de los


principales factores que influyen en los resultados de las pruebas SABER 11

en estudiantes de Instituciones públicas y privadas de Colombia.

Medidas de Dispersión:

 Rango:

R=X max −X min =9−1=8

 Varianza:

∑ ( xi −x ) n i
2 i
σ =
N

σ 2=1,82

 Desviación típica:

σ =√ σ 2= √1,82=1,34

 Coeficiente de Variación:

σ
C v= 100 %
|x|

1,33
C v= 100 %
3,242

C v =41,024 %
Interpretación de los resultados:

Gracias a la sistematización de una sola variable como la del número de cuartos de

los estudiantes que presentaron el ICFES, nos permite ver gráficamente y de una

manera más ágil el comportamiento de los datos, como, por ejemplo, a simple vista se

evidencia como en Colombia tienden a predominar la construcción de 3 cuartos.

Actividad 3. Medidas Univariantes - variable Continua

A partir de la base de datos: Pruebas SABER 11 - 220 estudiantes 2020 (16-1),

encontrada en el entorno de aprendizaje Colaborativo, cada estudiante deberá elegir

una variable cuantitativa continua distinta, manifestarlo en el foro paso 3 Análisis de la

Información y calcular las medidas de tendencia central y de dispersión.

Posterior a la consulta de las referencias, resolver los siguientes incisos:

Variable cuantitativa continua: Horas de dedicación a Internet.

a. Tabla de frecuencia datos agrupados. Cada estudiante deberá elegir una variable

cuantitativa continua y diseñar una tabla de frecuencia para datos agrupados

identificando rango, número de intervalos, amplitud y a partir de ella elaborar un

histograma de frecuencias y un polígono de frecuencias. Finalmente, interpretar los

resultados y asociarlos con la problemática: Identificación de los principales

factores que influyen en los resultados de las pruebas SABER 11 en

estudiantes de Instituciones públicas y privadas de Colombia.

La tabla de datos está dada por:


Tabla de distribución de frecuencias
%
Frecuenci
Límite Límite Marca % Frecuenci
Interval Frecuenci a absoluta
inferio superio de Frecuenci a relativa
o a absoluta acumulad
r r clase a relativa acumulad
a
a
1 0,5 0,94 0,72 30 30 14% 14%
2 0,94 1,38 1,16 41 71 19% 32%
3 1,38 1,82 1,6 0 71 0% 32%
4 1,82 2,26 2,04 3 74 1% 34%
5 2,26 2,7 2,48 24 98 11% 45%
6 2,7 3,14 2,92 34 132 15% 60%
7 3,14 3,58 3,36 0 132 0% 60%
8 3,58 4,02 3,8 47 179 21% 81%
9 4,02 4,46 4,24 41 220 19% 100%
Suma
: 220 100%

Histograma de frecuencias:

Horas de dedicación a internet


50
45
40
35
30
25
20
15
10
5
0
0.72 1.16 1.6 2.04 2.48 2.92 3.36 3.8 4.24
Polígono de frecuencias:

Horas de dedicación a internet


50
45
40
35
30
25
20
15
10
5
0
0.72 1.16 1.6 2.04 2.48 2.92 3.36 3.8 4.24

b. Medidas de tendencias central y de Posición. Para la variable cuantitativa

continúa elegida, cada estudiante deberá calcular las medidas de tendencia central

(media, mediana, moda), medidas de posición: cuartiles, Decil 5 y percentil 50,

determinar el tipo de asimetría y curtosis e interpretar los resultados y asociarlos

con la problemática: Identificación de los principales factores que influyen en

los resultados de las pruebas SABER 11 en estudiantes de Instituciones

públicas y privadas de Colombia.

Medidas de tendencia central:

 Media:

∑ xi f i
Media= i=1
N
0,72∗30+1,16∗41+1,6∗0+ 2,04∗3+2,48∗24+2,92∗34+3,36∗0+3,8∗47 +4,24∗41
¿
220

¿ 2,666

 Mediana:

Como tenemos 220/2=110 entonces se toma el dato número 110 de los datos

ordenados de menor a mayor obteniendo:

Mediana=3

 Moda:

Para la moda, se miran cual valor es más veces repetido, para ello podemos ver la

gráfica y notar la barra más grande:

Moda=47

Medidas de posición:

Cuartil:

k 220
Qk =
4

 Primer cuartil:

1∗220
Q 1= =55
4

 Segundo cuartil:
2∗220
Q 2= =110
4

 Tercer cuartil:

3∗220
Q 3= =165
4

Decil:

kN
Dk =
10

 Decil 5

5∗220
D 5= =110
10

Percentil:

kN
Pk =
100

 Percentil 50

50∗220
P50= =110
100

c. Medidas de Dispersión. Para la variable cuantitativa continúa elegida calcular:

Rango, varianza, desviación típica, coeficiente de variación, posteriormente

interpretar los resultados y asociarlos con la problemática: Identificación de los


principales factores que influyen en los resultados de las pruebas SABER 11

en estudiantes de Instituciones públicas y privadas de Colombia.

Medidas de Dispersión:

 Rango:

R=X max −X min =4,5−0,5=4

 Varianza:

∑ ( xi −x ) n i
2 i
σ =
N

σ 2=1,96

 Desviación típica:

σ =√ σ 2= √1,78=1,4

 Coeficiente de Variación:

σ
C v= 100 %
|x|

1,4
C v= 100 %
2,666

C v =52,513 %
Interpretación de los resultados:

Gracias a la sistematización de una sola variable como la del número de dedicación

a internet los estudiantes que presentaron el ICFES, nos permiten ver gráficamente y

de una manera más ágil el comportamiento de los datos, como, por ejemplo, a simple

vista se evidencia como en Colombia tienden a predominar 47 horas de dedicación al

internet.
CONCLUSIONES
 Con el desarrollo de la guía de actividades fue posible afianzar la temática de

medidas estadísticas univariantes, por medio de la solución de diferentes

ejercicios aplicativos.

 Los diagramas de barras y de líneas nos permiten visualizar mejor los datos

obtenidos con las tablas de frecuencia por lo que nos permiten realizar mejor el

análisis de datos como por ejemplo la moda.

 De los resultados obtenidos se observó que en Colombia tienden a predominar la

construcción de 3 cuartos por hogar y 47 horas de dedicación al internet.


REFERENCIAS BIBLIOGRÁFICAS

García, J. E (2005). Análisis de Datos Unidimensionales.et al. Madrid: Paraninfo.

Página 26 -42

Montero, J. M. (2007). Características de Una Distribución de Frecuencias. Statistical

Descriptive. Cengage Learning Paraninfo, S.A. Paginas 41-50

Das könnte Ihnen auch gefallen