Beruflich Dokumente
Kultur Dokumente
Estadı́stica
La estadı́stica descriptiva es una rama de la matemática que emplea métodos y técnicas que se utilizan
en la recolección, ordenamiento, resumen, análisis, interpretación y comunicación de un conjunto de da-
tos de una determinada población de interés.
La población es un conjunto de individuos o elementos que poseen alguna variable cualitativa (carac-
terı́sticas) o cuantitativa (valores, datos) común que se quiere estudiar. Las poblaciones pueden ser finitas
o infinitas. Por lo general la población de interés suelen ser de gran tamaño y por lo tanto su estudio re-
querirı́a de mucho tiempo dinero. Es por ello que se suele tomar una muestra de la población, que es un
subconjunto de la población, que debe ser representativa.
Una encuesta es una forma de recabar información, lo cual se realiza sobre la muestra de la población,
son el fin de obtener opiniones, caracterı́sticas, mediciones, etc.
Variables
Es una caracterı́stica que se asocia a los elementos de una muestra o población.
Variable Cualitativa: Son aquellas en que las observaciones realizadas se refieren a un atributo (no son
numéricos), por ejemplo: sexo, nacionalidad, profesión, etc. Las variables cualitativas pueden ser de 2
tipos:
Nominal: son clasificadas en categorı́as y no admiten criterio de orden: estado civil (casado, viudo,
divorciado), color de pelo (negro, rubio, castaño), etc.
Ordinal: en ellas existe una relación de orden intuitivo: nivel educacional (básica, media, superior),
medallas deportivas (oro, plata, bronce), etc.
Variable Cuantitativa: Son aquellas en que cada observación tiene un valor expresado por un número
real, por ejemplo: peso, temperatura, salario, etc. Las variables cuantitativas pueden ser de 2 tipos:
Discreta: toman sólo variables enteros, por ejemplo: número de hijos, número de departamentos de un
edificio, etc.
Continua: toman cualquier valor decimal, por ejemplo: peso de un estudiante, estatura de un recién
nacido, etc.
Ejercicios
Conteste Verdadero (V) o Falso (F) a las siguientes afirmaciones:
2. La carrera preferida por los estudiantes del Preuniversitario es una variable nominal.
8. Para que un estudio estadı́stico de una población sea válido a partir de una muestra, basta que la
muestra sea aleatoria.
10. La distancia entre el preuniversitario y las casas de los estudiantes es una variable continua.
Tabulación de datos
Cuando recabamos la información esta debe ser ingresada en tablas para que su interpretación sea más
simple. A este proceso se le llama, tabulación de datos. Sus elementos son:
Frecuencia (f ): Número de veces que se repite un dato en un intervalo o clase (también se le denomina
frecuencia absoluta).
Frecuencia acumulada (fac ): esta se obtiene sumando ordenadamente las frecuencia absoluta hasta la
que ocupa la última posición.
Frecuencia relativa (fr ): esta se obtiene dividiendo la frecuencia absoluta y el total de observaciones de
cada uno de los datos. Se puede expresar en fracción, decimal o porcentaje.
Frecuencia relativa acumulada (fra ): Esta se obtiene sumando ordenadamente las frecuencia absoluta
acumuladas hasta la que ocupa la última posición.
2
E JEMPLO 1 Tabla de frecuencia de datos no agrupados.
x f fac fr fra
1 2 2 20 % 20 %
2 3 5 30 % 50 %
3 5 10 50 % 100 %
Ejercicios
Los siguientes datos corresponden a las notas obtenidas por un curso en un examen de ma-
temática: 1 − 5 − 3 − 4 − 3 − 7 − 2 − 6 − 5 − 4 − 3 − 2 − 3 − 5 − 4 − 3 − 6 − 5 − 4 − 4 − 6 − 7 − 5 − 4 − 6.
Complete la tabla con esta información.
Para construir la tabla de frecuencia con datos agrupados en intervalos, se puede seguir el siguiente
procedimiento:
Paso 1: Calcular el rango de la muestra. El rango es la diferencia entre el mayor y menor valor de la
muestra.
Paso 3: Calcular la amplitud de los intervalos, que es el cuociente entre el rango u la cantidad de inter-
valos. La amplitud no necesariamente tiene que ser la misma en todos los intervalos, depende del
criterio del investigador.
3
Paso 4: Agregar la Marca de clase (M C), que es el promedio de los valores extremos de un intervalo.
Ejercicios
La tabla adjunta muestra la distribución de frecuencia de los ingresos familiares en miles de
pesos (agrupados por intervalos), que tienen 200 familias.
Moda (M o)
Es el dato que aparece con mayor frecuencia, es decir, el que más se repite.
Si no hay un dato que tenga mayor frecuencia que otro se dice que la distribución de frecuencias es
amodal. Si existe un solo dato que tenga mayor frecuencia la distribución de frecuencia es unimodal. De
existir dos (o más) datos que tienen la misma frecuencia, siendo esta la mayor, se dice que la muestra es
binomial o polimodal.
4
O BSERVACI ÓN 1 En el caso de la PSU de matemática, para el calculo de la moda en tablas de datos agrupados en
intervalos, se considerará o se preguntará por el intervalo modal.
Moda en Intervalos
Li Extremo inferior del intervalo modal.
O BSERVACI ÓN 2 El intervalo modal es el intervalo que presenta mayor frecuencia absoluta.
Mediana (M e)
Es el dato que ocupa la posición central de la muestra cuando estos se encuentran ordenados en forma
creciente (%) o decreciente (&). Si la muestra tiene un número par de datos, la mediana es la media
aritmética de los dos términos centrales.
Me =
x n + x n2 +1
2
si n es par
2
O BSERVACI ÓN 4 En el caso de la PSU de matemática, para el calculo de la moda en tablas de datos agrupados en
intervalos, se considerará o se preguntará por el intervalo en el que se encuentra la mediana.
5
E JEMPLO 4 Determine la media en los siguientes datos:
1−1−2−3−4−5−5−6
Solución
En este caso los datos ya se encuentran ordenados de menor a mayor, contando los datos son
n = 8, entonces la mediana serı́a:
1 − 1 − 2 − 3| {z
− 4} −5 − 5 − 6
Me
Mediana en Intervalos
n Es el número total de datos.
Solución
E JEMPLO 5 Dada la siguiente tabla de-
terminar la estimación de la mediana. n 100
Si = = 50, entonces el intervalo de la mediana es:
2 2
Datos f F [20, 25[. Ası́:
[10, 15[ 20 20
50 − 45
[15, 20[ 25 45 M e = 20 + ·5
45
[20, 25[ 45 90 5
= 20 + ·5
[25, 30[ 10 100 45
Total 100 25
= 20 + = 20 + 0, 5 = 20, 5
45
6
Media Aritmética para datos organizados en una tabla de frecuencia
La media aritmética o promedio para datos ordenados en tabla es el resultado de la multiplicación de
los datos por sus frecuencias, dividido por la cantidad de datos. Si se tienen n datos: x1 , x2 , x3 , ..., xn , y
sus respectivas frecuencias f1 , f2 , f3 , ..., fn , entonces la media aritmética es:
x1 · f1 + x2 · f2 + x3 · f3 + ... + xn · fn
X=
f1 + f2 + f3 + ... + fn
Media Aritmética para datos agrupados en intervalos organizados en una tabla de fre-
cuencia
La media aritmética o promedio para datos agrupados en intervalos ordenados en tabla es el resultado
de la multiplicación de los datos por sus frecuencias, dividido por la cantidad de datos. Si se tienen
n marcas de clase: m1 , m2 , m3 , ..., mn , y sus respectivas frecuencias f1 , f2 , f3 , ..., fn , entonces la media
aritmética es:
m1 · f1 + m2 · f2 + m3 · f3 + ... + mn · fn
X=
f1 + f2 + f3 + ... + fn
+ Si cada datos de una muestra se multiplica o divide por una constante k, la media aritmética se
multiplica o divide por k.
Ejercicios
1. ¿Cuál(es) de las siguientes afirmaciones es (son) verdadera(s) con respecto a los datos
presentados en la tabla adjunta? (DEMRE, 2015)
A) Solo I
E) I, II y III
7
Ejercicios
2. Si la tabulación del peso de 50 niños recién nacidos se muestra en la tabla adjunta,
¿cuál(es) de las siguientes afirmaciones es (son) verdadera(s)? (DEMRE, 2015)
Medidas de Dispersión
Desviación estándar
Es una medida de dispersión y nos indica cuánto tienden a alejarse los datos del promedio aritmético.
Para calcular la desviación estándar (σ) se utilizan las siguientes fórmula:
Varianza
Es otra medida de dispersión que corresponde al cuadrado de la desviación estándar. V ar(x) = σ 2
8
Propiedades de la varianza
Sea x una variable aleatoria y k un número real, se cumple:
Medidas de Posición
Cuartiles
Son los tres valores que dividen a un conjunto ordenado de datos en cuatro partes iguales.
Percentiles
Son los valores que dividen a un conjunto ordenando de datos en 100 partes iguales.
El percentil de orden k se denota por Pk y en el caso discreto es la observación cuya frecuencia absoluta
acumulada alcanza el valor igual al k % de las observaciones.
9
O BSERVACI ÓN 7 (Q UINTIL ) Son pocos los ejercicios que se presenta el concepto de quintil, no obstante, es bueno
conocer la fórmula para determinar la posición del quintil qk .
k·n
Se calcula la posición que ocupa el quintil, con la fórmula qk = , en donde k = {1, 2, 3, 4} y n el número de
5
datos. Si es decimal se aproxima al entero superior más cercano.
Ejercicios
1. Si a, b y c son tres números enteros cuya desviación estándar es σ, entonces la desviación
estándar de na, nb y nc, con n un número entero positivo, es (DEMRE, 2014)
A) n2 σ
B) σ
√
C) nσ
D) nσ
E) 3nσ
2. De acuerdo a los 100 datos de la tabla adjunta, ¿cuál(es) de las siguientes afirmaciones
es (son) verdadera(s)? (DEMRE, 2015)
10
Representación gráfica e Interpretación de Gráficos
La representación gráfica de una distribución de frecuencia nos permite ver de manera clara y ordenada
un determinado estudio estadı́stico. Hay varios tipos de gráficos, siendo los más comunes:
Gráficos de caja
El diagrama de caja (o bigote) es una representación gráfica basada en cuartiles. Para elaborar este gráfi-
co, se necesitan cinco datos: el valor mı́nimo, el primer cuartil, la mediana, el tercer cuartil y el valor
máximo de la muestra. Los gráficos resultantes pueden ser:
11
Ejercicios
1. Después de medir los largos de una colección de objetos, se obtiene el gráfico de fre-
cuencia de la figura adjunta. ¿Cuál es el percentil 50 de los datos representados en este
gráfico?
A) 3, 5 cm
B) 5 cm
C) 4 cm
D) 6 cm
E) 3 cm
A) Solo I
B) Solo II
C) Solo III
D) Solo I y III
E) I, II y III
12