Beruflich Dokumente
Kultur Dokumente
X
- 4 -3 - 2 - 1 + 1 +2 + 3 + 4
Md
Mo
Es simtrica y media, mediana y moda coinciden en el punto central
Si aadimos el valor de la desviacin tpica y lo restamos a la media entre ambos
extremos queda comprendido el 68.26% de los sujetos.
Si sumamos o restamos 2 a la media el universo comprendido entre estos
extremos es de 97.7% . Con 3 ser el 99.9% del universo.
Con 1,96 queda comprendido entre ambos valores el 95%
Estandarizar puntuaciones la z
Para poder comparar puntuaciones de dos sujetos en distintas
distribuciones o de un sujeto en distintas variables se utiliza la
puntuacin estandarizada basada en puntuarlo en unidades de
desviacin estndar. Unidades que se desva de su media
Z=
Desviacin tpica
As la puntuacin n de un sujeto en una distribucin de media
y desviacin ser: n
Z=
Ejemplo: Un sujeto que ha puntuado 95 en una
distribucin de media = 100 y desviacin tpica =15 tendra
una puntuacin estndar z de (100-95)/15 = - 0,67
La puntuacin z adems de permitir comparar a sujetos en diferentes
distribuciones tiene propiedades muy interesantes al tener de =0 y
=1 y distribuirse de forma normal
Los sujetos que puntan ms de cero estn por encima de la media y
viceversa
Un sujeto que puntu 1 dejara por debajo de l a ms del 76,02%
1
Ejemplo: Tenemos dos series de notas correspondientes a dos asignaturas
diferentes de un grupo de alumnos:
4 5 5 6 7 8 7 7 6 6 7 5 9 10 8 6 7 8 3 8 7 =6,61 =1,65
1 5 6 3 2 0 6 7 9 8 10 1 3 5 3 4 7 8 3 2 4 = 4,61 =2,81
2
Un ejemplo de Residuos ajustados
Partimos de un grupo de 220 sujetos, divididos en tres grupos de edad
en torno al voto emitido a diferentes mbitos polticos. La
distribucin de frecuencias observadas es:
Jvenes Adultos Mayores Total
Izquierda 20 40 20 80
Centro 20 10 10 40
Derecha 20 40 40 100
Total 60 90 70 220
3
Se ajustan finalmente para normalizar su distribucin mediante:
0,5722 2,0731
SRij SRij AR11 = = -0,6 ... AR12 = 2,1
ARij = de dnde = 60 80 90 80
Vij 1 1 1 1
Oi. O . j 220 220 220 220
1 1
n n AR 21 =
0,5722
= 3,6 ... AR 22
2,0731
= 2,3
60 40 90 40
1 1 1 1
220 220 220 220
4
Activamos las casillas de residuos Tipificados corregidos
5
Si activamos los tres tipos de residuos como muestra el grfico el programa
nos mostrara los Residuos Rij, los Residuos tipificados ARij y los
Residuos ajustados SRij
6
Medidas de asociacin (variables no mtricas)
Podemos definir la asociacin entre dos variables como la intensidad
con la que unas categoras de una variable diferencian las frecuencias
obtenidas en el cruce con la otra
Una primera mediada podra ser la diferencia de porcentajes Para Snchez
Carrin, J. (1995) es la mejor de todos ellas.
En la tabla hay un diferencial de 20% entre
M V Total Mujeres y Varones entre las opciones A y B
Opcin A 15 35 50
El diferencial porcentual vara entre:
Opcin B 35 15 50 0 <d> 100
Total 50 50 100 El problema es que hay que calcularlo para cada
casilla, de ah que se busque un indicador nico
7
Asociacin. Indicadores basados en la reduccin de error de prediccin
A diferencia de los anteriores basados en Ji-cuadrado. Estos tratan de
ver la relacin entre variables intentando predecir como se clasifica un
sujeto en la variable Y a partir de conocer su clasificacin en la X
Coeficiente Lambda de Goodman y Kruskal
Llamado tambin Coeficiente de predictibilidad de Guttman se basa
en la reduccin de error en la prediccin conociendo la distribucin de
una variable bajo la frmula:
Siendo:
( N M y ) ( N my ) M y m y My = la frecuencia modal global
yx = = My = la suma de frecuencias modales
N My N My
N = Total de casos
Sabiendo que es hombre la posibilidad de que fallara mi pronstico sera m1= 138
Por el contrario si se que es mujer la posibilidad de errar es m2=163. El error al
conocer la distribucin de la segunda variable es menor que si no la conozco.
Aplicando la formula de Lamda:
( N M y ) ( N my ) M y my
yx = =
N My N My