Beruflich Dokumente
Kultur Dokumente
Tipos de estadsticos
Posicin
Dividen un conjunto ordenado de datos en grupos con la misma
cantidad de individuos.
Entre ellos cabe destacar: Cuantiles, percentiles, cuartiles, deciles,...
Centralizacin
Indican valores con respecto a los que los datos parecen agruparse.
Entre ellos cabe destacar: Media, mediana y moda
Dispersin
Indican la mayor o menor concentracin de los datos con respecto a
las medidas de centralizacin.
Entre ellos : Desviacin tpica, coeficiente de variacin, rango, varianza
Forma
Dan una idea de cmo se distribuyen los datos
Entre ellos: Asimetra, Apuntamiento o curtosis
1
Estadsticos de posicin
Se define el cuantil de orden a como un valor de la variable por
debajo del cual se encuentra una frecuencia acumulada a.
Casos particulares son los percentiles, cuartiles, deciles, quintiles,...
2
Percentiles y cuantiles
Percentil de orden k = cuantil de orden k/100
. La mediana se corresponde con el percentil 50
Ejemplos
El 5% de los recin nacidos tiene un peso demasiado bajo. Qu
peso se considera demasiado bajo?
Percentil 5 o cuantil 0,05
3
Qu peso no llega a alcanzar el 25%
de los individuos?
Primer cuartil = Percentil 25= 60 Kg
Qu peso es superado por el 25% de
los individuos?
Tercer cuartil = Percentil 75 = 80 Kg
Entre qu valores se encuentra el
50% de los individuos con un peso
ms normal?
Entre el primer y tercer cuartil = entre 100
60 y 80 kg.
Este intervalo coincide con los individuos 90
Estadsticos 60
PESO
Percentiles 25 60,00 50
50 70,00
75 80,00 40
Ejemplos Estadsticos
4
Medidas de centralizacin
Media (Mean) Es la media aritmtica (promedio) de los valores
de una variable. Suma de los valores dividido por el tamao
muestral.
La media es un promedio aritmtico: de 2,2,3,7 es (2+2+3+7)/4=3,5
Conveniente cuando los datos se concentran simtricamente con
respecto a ese valor. Muy sensible a valores extremos.
Se puede considerar como el centro de gravedad de los datos
Mediana (median) Es un valor que divide a las observaciones
en dos grupos con el mismo nmero de individuos (percentil 50). Si
el nmero de datos es par, se elige la media de los dos datos
centrales.
Mediana de 1,2,4,5,6,6,8 es 5
Es conveniente cuando los datos son asimtricos. No es sensible a
valores extremos.
Ejemplo: Mediana de 1,2,4,5,6,6,800 es 5. La media es 117,7!
Moda (mode) Es el/los valor/es donde la distribucin de
frecuencia alcanza su mximo.
Las formulas
Media (Para datos sin agrupar: x1, x2, ..., xn )
x=
x
i i
n
Media (Para agrupados u organizados en tablas)
Variable fr. fr. ac.
xn = N
L0 L1 x1 n1 N1
i i i
L1 L2 x2 n2 N2
x= i
... n n
Lk-1 Lk xk nk Nk
n
5
Altura mediana
6
n N i 1 0,5 58 Ni 1
C = Li 1 + ( Li Li 1 ) Mediana = C0,5 = Li 1 + ( Li Li 1 )
ni ni
0,5 58 15 )
= 60 + (70 60) = 66,6
21
Peso Marca N %
40 50 45 5 5
50 60 55 10 15
60 70 65 21 36
70 - 80 75 11 47
80 - 90 85 5 52
90 - 100 95 3 55
0,5 58 15 )
100 130 115 3 58 C0,5 = 60 + (70 60) = 66,6
58 21
Variabilidad o Dispersin
La variabilidad de en los valores de un cualquier atributo que
evaluemos est presente siempre en la naturaleza y en cualquier
fenmeno social, su origen en ciencias sociales, es siempre mltiple.
EJEMPLO: Los estudiantes de Sociologa reciben diferentes
calificaciones en la asignatura (variabilidad). A qu puede deberse?
Diferencias individuales en el conocimiento de la materia.
Podra haber otras razones (fuentes de variabilidad)? . Supongamos
que todos los alumnos poseen el mismo nivel de conocimiento. Las
notas seran las mismas en todos? Seguramente No.
7
Medidas de Dispersin
Miden el grado de dispersin (variabilidad) de los datos,
independientemente de su causa.
Amplitud o Rango (range):
Es la diferencia entre las observacines
extremas.
Es muy sensible a valores extremos.
EJEMPLO: 2,1,4,3,8,4.
El rango es 8-1=7.
25% 25% 25%
Rango intercuartlico
(interquartile range):
Es la distancia entre el primer y tercer
cuartil.
Parecida al rango, pero elimina las
observaciones ms extremas inferiores y
superiores, hacindose menos sensible a
valores extremos.
Rango intercuartlico = P75 - P25
Variabilidad o Dispersin
Varianza S2 (Variance): Mide el promedio de las desviaciones
(al cuadrado) de las observaciones con respecto a la media.
1
S2 =
n i
( xi x ) 2
8
Desviacin tpica
Desviacin tpica (standard deviation). Es la raz cuadrada de la
varianza
x 2 x + 2
S = S2 50
x x +
90
1.
1.
2.
2.
2.
3.
de la media tendremos 95%
30
70
10
50
90
30
0
0
observaciones. Peso recin nacidos en partos gemelares
9
Coeficiente de variacin
Es la razn entre la desviacin tpica y la media.
Mide la desviacin tpica en forma de qu tamao tiene con
respecto a la media o desviacin por unidad de media
S
CV =
x
Tambin se la denomina Variabilidad relativa
Es frecuente mostrarla en porcentajes.
EJEMPLO: Si la media es 80 y la desviacin tpica 20 entonces
CV=20/80=0,25=25% (variabilidad relativa)
Es una cantidad adimensional. Interesante para comparar la
variabilidad de diferentes variables.
EJEMPLO: Si el peso tiene CV=30% y la altura tiene CV=10%, los
individuos presentan ms dispersin en peso que en altura.
No debe usarse cuando la variable presenta valores negativos o
donde el valor 0 sea una cantidad fijada arbitrariamente
Asimetra o sesgo
Una distribucin es simtrica
si la mitad izquierda de su
distribucin es la imagen
especular de su mitad
derecha.
En las distribuciones
simtricas media y mediana
coinciden. Si slo hay una
moda tambin coincide
La asimetra es positiva o
negativa en funcin de a qu
lado se encuentra la cola de la
distribucin
La media tiende a desplazarse
hacia las valores extremos
(colas). Discrepancias entre
las medidas de centralizacin
indican la asimetra.
10
Estadsticos de Asimetra
Basados en diferencia entre estadsticos de tendencia central, se utilizan:
Por diferencias intercuartlicas 1 y 2 cuartiles y 2 y 3.
Apuntamiento o curtosis
La curtosis nos indica el grado de apuntamiento (aplastamiento) de una
distribucin con respecto a la distribucin normal o gaussiana, que es
adimensional.
Las series que representan los siguientes grficos poseen la misma
media y desviacin tpica, pero con diferente grado de apuntamiento.
160 400 300
140
300
200
120
200
100
100
80
100
Frecuencia
Frecuencia
Frecuencia
60
0 0
40 3 27 37 47 57 67 77 87 97 108 27 37 45 53 61 69 77 85 93
45 48 51 54 57 60 63 66 69 72 75 78 81 84 16 32 42 52 62 72 82 92 102 138 32 41 49 57 65 73 81 89 99
Se denomina:
Platicrtica: curtosis < 0
Mesocrtica: curtosis = 0
Leptocrtica: curtosis > 0
11
Salida de Estadsticos del SPSS
El SPSS nos permite sacar todos estos estadsticos en una sola orden:
En el men Analizar Estadsticos descriptivos Descriptivos
y con todas las opciones activas nos muestra la tabla siguiente:
Descriptivos para Nmero de hijos
Mediana 2,00
Varianza 3,114
Desv. tp. 1,765
Mnimo 0
Mximo 8
Rango 8
Amplitud intercuartil
3,00
12