Sie sind auf Seite 1von 6

UNIVERSIDAD DE LAS FUERZAS ARMADAS – ESPE

ESTADÍSTICA I

Pablo Aguirre NRC: 1407

HISTOGRAMAS
Un histograma es una representación gráfica de una variable en forma de barras, donde la
superficie de cada barra es proporcional a la frecuencia de los valores representados. En el eje
vertical se representan las frecuencias, y en el eje horizontal los valores de las variables,
normalmente señalando las marcas de clase, es decir, la mitad del intervalo en el que están
agrupados los datos.

 Diagramas de barras simples

Representa la frecuencia simple (absoluta o relativa)


mediante la altura de la barra la cual es proporcional a la
frecuencia simple de la categoría que representa.

 Diagramas de barras compuesta

Se usa para representar la información de


una tabla de doble entrada o sea a partir de dos
variables, las cuales se representan así; la altura
de la barra representa la frecuencia simple de
las modalidades o categorías de la variable y
esta altura es proporcional a la frecuencia
simple de cada modalidad.

 Diagramas de barras agrupadas

Se usa para representar la información de una tabla de


doble entrada o sea a partir de dos variables, el cual es
representado mediante un conjunto de barras como se
clasifican respecto a las diferentes modalidades.
 Polígono de frecuencias

Es un gráfico de líneas que de las frecuencias absolutas de


los valores de una distribución en el cual la altura del
punto asociado a un valor de las variables es proporcional
a la frecuencia de dicho valor.

 Ojiva porcentual

Es un gráfico acumulativo, el cual es muy útil


cuando se quiere representar el rango porcentual
de cada valor en una distribución de frecuencias.

MEDIDAS DESCRIPTIVAS
Las medidas descriptivas son valores numéricos calculados a partir de la muestra y que nos
resumen la información contenida en ella.

MEDIDAS DE CENTRALIZACIÓN

Nos dan un centro de la distribución de frecuencias, es un valor que se puede tomar como
representativo de todos los datos. Hay diferentes modos para definir el "centro" de las
observaciones en un conjunto de datos. Por orden de importancia, son:

 MEDIA (media aritmética o simplemente media).- es el promedio aritmético de las


observaciones, es decir, el cociente entre la suma de todos los datos y el número de ellos.
Si xi es el valor de la variable y ni su frecuencia, tenemos que:
∑𝑛𝑖=0 𝑥𝑖
𝑥̅ =
𝑛

 MEDIANA (Me).- es el valor que separa por la mitad las observaciones ordenadas de
menor a mayor, de tal forma que el 50% de estas son menores que la mediana y el otro
50% son mayores. Si el número de datos es impar la mediana será el valor central, si es par
tomaremos como mediana la media aritmética de los dos valores centrales.
 MODA (Mo).- es el valor de la variable que más veces se repite, es decir, aquella cuya
frecuencia absoluta es mayor. No tiene por qué ser única.

MEDIDAS DE DISPERSIÓN

 VARIANZA (𝑺𝟐 ).- es el promedio del cuadrado de las distancias entre cada observación y la
media aritmética del conjunto de observaciones.

Haciendo operaciones en la fórmula anterior obtenemos otra fórmula para calcular la


varianza:

Si los datos están agrupados utilizamos las marcas de clase en lugar de Xi.

 DESVIACIÓN TÍPICA (S) .- La varianza viene dada por las mismas unidades que la variable
pero al cuadrado, para evitar este problema podemos usar como medida de dispersión la
desviación típica que se define como la raíz cuadrada positiva de la varianza
Para estimar la desviación típica de una población a partir de los datos de una muestra se
utiliza la fórmula (cuasi desviación típica):

 COEFICIENTE DE VARIACIÓN.- Cuando se quiere comparar el grado de dispersión de dos


distribuciones que no vienen dadas en las mismas unidades o que las medias no son
iguales se utiliza el coeficiente de variación de Pearson que se define como el cociente
entre la desviación típica y el valor absoluto de la media aritmética

CV representa el número de veces que la desviación típica contiene a la media aritmética y


por lo tanto cuanto mayor es CV mayor es la dispersión y menor la representatividad de la
media.

 RANGO (𝑹𝒆).- Es la diferencia entre el valor de las observaciones mayor y el menor.

𝑅𝑒 = 𝑥𝑚𝑎𝑥 – 𝑥𝑚𝑖𝑛

MEDIDAS DE POSICIÓN: CUANTILES

Los cuantiles son valores de la distribución que la dividen en partes iguales, es decir, en intervalos,
que comprenden el mismo número de valores. Los más usados son los cuartiles, los deciles y los
percentiles.

 CUARTILES.- son los tres valores que dividen al conjunto de datos ordenados en cuatro
partes iguales, son un caso particular de los percentiles:
 El primer cuartil Q 1 es el menor valor que es mayor que una cuarta parte de
los datos
 El segundo cuartil Q 2 (la mediana), es el menor valor que es mayor que la
mitad de los datos
 El tercer cuartil Q 3 es el menor valor que es mayor que tres cuartas partes de
los datos

 DECILES.- son los nueve valores que dividen al conjunto de datos ordenados en diez partes
iguales, son también un caso particular de los percentiles.
 PERCENTILES.- son 99 valores que dividen en cien partes iguales el conjunto de datos
ordenados. Ejemplo, el percentil de orden 15 deja por debajo al 15% de las observaciones,
y por encima queda el 85%

MEDIDAS DE POSICIÓN

Comparan la forma que tiene la representación gráfica, bien sea el histograma o el diagrama de
barras de la distribución, con la distribución normal.

 ASIMETRÍA

Diremos que una distribución es simétrica cuando su mediana, su moda y su media aritmética
coinciden.

Diremos que una distribución es asimétrica a la derecha si las frecuencias (absolutas o relativas)
descienden más lentamente por la derecha que por la izquierda.

Si las frecuencias descienden más lentamente por la izquierda que por la derecha diremos que la
distribución es asimétrica a la izquierda.

Existen varias medidas de la asimetría de una distribución de frecuencias. Una de ellas es


el Coeficiente de Asimetría de Pearson:

Su valor es cero cuando la distribución es simétrica, positivo cuando existe asimetría a la derecha y
negativo cuando existe asimetría a la izquierda.
 CURTOSIS

Miden la mayor o menor cantidad de datos que se agrupan en torno a la moda. Se definen 3 tipos
de distribuciones según su grado de curtosis:

 Distribución mesocúrtica: presenta un grado de concentración medio alrededor de los


valores centrales de la variable (el mismo que presenta una distribución normal).
 Distribución leptocúrtica: presenta un elevado grado de concentración alrededor de los
valores centrales de la variable.
 Distribución platicúrtica: presenta un reducido grado de concentración alrededor de los
valores centrales de la variable.

Das könnte Ihnen auch gefallen