Beruflich Dokumente
Kultur Dokumente
Plantear Disear
hiptesis experimento
Recoleccin
Organizacin
Presentacin
Anlisis
Interpretacin
CONCEPTOS CLAVES
Muestra: es parte de una poblacin de objetos, personas,
empresas o cosas, que es representativa del total de
elementos que conforman el universo.
x
y se calcula mediante las expresiones, segn el caso:
Para TDNA TF TI
n n n
xi xi ni ci ni
x
i 1 n i 1 n i 1 n
xi representa el valor de la variable; ci representa la marca de clase.
La media como punto de equilibrio
La mediana
[=mediana(rango)]
La mediana de un conjunto de nmeros ordenados en magnitud es o el
valor central o la media de los dos valores centrales.
n 1
Tendremos en cuenta el tamao de la muestra. X
Si N es Impar, hay un trmino central, el trmino 2
que ser el valor de la mediana.
n n
Si N es Par, hay dos trminos centrales, X y X 1
2 2
la mediana ser la media de esos dos valores
n n
X X 1
2 2
2
Ejemplo: El conjunto de nmeros 5,5,7,9,11,12,15 y18 tiene mediana 10
Ejemplo con variables continuas
Peso M. frec Fr.
Clase acum.
40 50 45 5 5
50 60 55 10 15
60 70 65 21 36
70 - 80 75 11 47
80 - 90 85 5 52
90 - 100 95 3 55
100 130 115 3 58
0,75 58 N i 1 43,5 36
P75 C0, 75 Li 1 (ai ) 70 (10) 76,8
ni 11
X
r
C r n
k k
X
3
Q3 42 31,5
4 4
Cuartiles (Q): Dividen a la muestra en 4 grupos con frecuencias similares.
Primer cuartil = Percentil 25 = Cuantil 0,25
Segundo cuartil = Percentil 50 = Cuantil 0,50 = mediana
Tercer cuartil = Percentil 75 = Cuantil 0,75
80
70
Estadsticos
60
PESO
Percentiles 25 60,00 50
50 70,00
75 80,00 40
Ejemplo
50%
Medidas de variabilidad
Rango
Rango Intercuartlico
Desviacin Media
Varianza
Desviacin Estndar
Coeficiente de Variacin
Estadgrafos de Variabilidad o dispersin
Los estudiantes de Metodologa de la Investigacin obtienen diferentes
calificaciones en la asignatura (variabilidad). A qu puede deberse?
Diferencias individuales en el conocimiento de la materia.
Por ejemplo supongamos que todos los alumnos poseen el mismo nivel de
conocimiento. Las notas seran las mismas en todos? Seguramente No.
Amplitud o Rango
[=max(rango)-min(rango)]
La diferencia entre las observaciones extremas.
2,1,4,3,8,4. El rango es 8-1=7
Es muy sensible a los valores extremos.
Rango intercuartlico
[=CUARTIL(rango;3)-CUARTIL(rango;1)]
Es la distancia entre el primer y tercer cuartil.
Rango intercuartlico = Q3 Q1 = P75 - P25 = C0.75 C0,25
Parecida al rango, pero eliminando las observaciones ms extremas
inferiores y superiores.
3
Media
muestral
-3.6
Frecuencia
4.4
1 -3.6
-.6 3.4
0
1 2 3 4 5 6 7 8 9 More
Edades observadas
Desviacin Absoluta Media
[=desvprom(rango)]
-3.6 + -3.6 + -.6 + 3.4 + 4.4 = 0
|-3.6| + |-3.6| + |-.6| + |3.4| + |4.4| = 15.6
Distancia promedio = 15.6 / 5 = 3.12
En general:
n
1
DAM
n
|x
i 1
i x|
n
| xi x |
DAM i 1 n
Otra medida: Varianza
3
3.6x3.6 Media
Muestral
2
F re c ue n c ia
4.4x4.4
.6x.6
1
0 3.6x3.6 3.4x3.4
1 2 3 4 5 6 7 8 9 More
Are a o bs e rv a da
Varianza
[=var(rango)]
( xi x)
n 2
s
2
i 1 n 1
Grados de libertad
s s 2
As s = 3.78
Desviacin estndar
2=
S 14.3 aos 2
S
S=3.78 aos
Medidas de forma.
Asimetra y Curtosis
En los temas anteriores hemos visto las medidas de tendencia
central, de posicin y las medidas de variabilidad.
Si bien la obtencin de tales medidas es clave para describir
una muestra y efectuar inferencias sobre la poblacin de origen,
es tambin fundamental saber obtener una caracterizacin
adecuada de los datos.
Asimetra
Si bien es fcil tener una idea de si la distribucin es simtrica o
no tras ver la representacin grfica, es importante cuantificar la
posible asimetra de una distribucin.
Recordemos que cuando la distribucin de los datos es simtrica,
la media, la mediana y la moda coinciden. (Y la distribucin tiene
la misma forma a la izquierda y la derecha del centro)
ndices de asimetra
1. ndice de asimetra de Pearson
Muy sencillo de calcular. Est basado en la relacin entre la
media y la moda en distribuciones simtricas y asimtricas:
__
X Mo
A S
Sx
Si la distribucin es simtrica As ser 0
Si la distribucin es asimtrica positiva, As ser mayor que 0
Si la distribucin es asimtrica negativa, As ser menor que 0
ndices de asimetra
2. ndice de asimetra de Fisher
Est basado en la diferencia de los datos sobre la media, como la
varianza, si bien esta vez se elevan los coeficientes al cubo
n __
i
( x X ) 3
n
AS i 1
3
s x
Si la distribucin es simtrica As ser 0
Si la distribucin es asimtrica positiva, As ser mayor que 0
Si la distribucin es asimtrica negativa, As ser menor que 0
Desventaja: Muy influida por puntuaciones atpicas (ya lo
volveremos a comentar en el ltimo punto de este tema).
ndices de asimetra
3. Expresin en Excel
En el software Excel, la funcin
=COEFICIENTE.ASIMETRIA(A3:A14) se basa en la siguiente
expresin:
__
n
( x i X )3
A s
( n 1) ( n 2 ) 3
s x
(xi X )4 n
i 1
4
3
s x
(x X ) i
4
n
Cr i 1
4
3
s x
__
4
n(n 1) ( xi X ) 3(n 1) 2
Cr (n 1)(n 2)(n 3) 4
(n 2)(n 3)
sx
Si la distribucin es normal (mesocrtica), el ndice vale 0
Si la distribucin es leptocrtica, el ndice es superior a 0
Si la distribucin es platicrtica, el ndice es inferior a 0
Leptocrtica Curtosis Platicrtica