Beruflich Dokumente
Kultur Dokumente
ESTADISTICAS
BIVARIADAS
INTRODUCCION
Hasta ahora nos hemos centrado en medidas de
tendencia central, variabilidad, asimetra y curtosis de
una nica variable.
No obstante, en la prctica es comn examinar dos o
ms variables conjuntamente (relacin entre inteligencia
y rendimiento, etc.)
En este tema nos centraremos en la relacin entre 2
variables (a partir de n observaciones apareadas) y
calcularemos (en particular) un ndice que nos dar el
grado de relacin/asociacin entre ambas variables: el
coeficiente de correlacin lineal (de Pearson)
rendimiento
rendimiento
rendimiento
inteligencia
inteligencia
Relacin lineal
positiva
Sin
relacin
inteligencia
Relacin lineal
negativa
rendimiento
rendimiento
inteligencia
Relacin lineal
inteligencia
Relacin no lineal
inteligencia
Relacin lineal
perfecta (casi
perfecta)
rendimiento
rendimiento
rendimiento
inteligencia
Relacin lineal
fuerte/moderad
a
inteligencia
Relacin lineal
dbil
Ahora necesitamos un ndice que nos informe tanto del grado en que
X e Y estn relacionadas, y si la relacin es positiva o negativa
rendimiento
Caso 1
rendimiento
inteligencia
Caso 2
inteligencia
TIPOS DE GRAFICOS:
BIVARIADOS
-Dos variables cuantitativas: Grficos de
dispersin
- Dos variables cualitativa: Grficos de Barras
dobles
- Una variable cualitativa y otra cuantitativa:
a) Diagramas de Puntos.
b) Panel de histogramas.
c) Diagrama de cajas agrupadas.
Tabla de Correlacin o
Contingencia (atributos)
Distribuciones marginales
DISTRIBUCIONES
Al analizar una distribucin
bidimensional, uno puede centrar su
MARGINALES
estudio en el comportamiento de una de las variables, con
independencia de como se comporta la otra. Estaramos as en el
anlisis de una distribucin marginal.
Distribucin marginal de A
Distribucin marginal de B
Ai
ni.
Bj
n.j
A1
n1.
B1
n.1
A2
n2.
B2
n.2
An-1
nn-1.
Bm-1
n.m-1
An
nn.
Bm
n.m
Distribuciones marginales
k
Definimos:
J
ni nij
j 1
n j nij
i 1
n
i 1
nij
fi
j 1 n
J
n j nij N
j 1
f j
i 1
nij
n
i 1 j 1
c) Perfiles fila
Del total de
individuos con la
caracterstica A1
que porcentaje
comparte a su vez la
B1
d) Perfiles columna
Cmo es lgico, el
porcentaje de
individuos con A1
que, o bien
comparten B1 o B2 y
hasta Bj ser el
100% = 1
Distribuciones condicionadas
xi
ni.
(Frecuencia cuando y=valor especfico)
x1
n1.
x2
n2.
xn-1
nn-1.
xn
nn.
50
100
150
200
Suma de frecuencias
cuando y=0, y=1, y= 2.
Que tienen un gasto de 50.
Independencia Estadstica
nij
N
Graves Y
Averias
Leves X
0
1
2
3
4
5
Marginal de Graves
0
0,2308
0,1692
0,0769
0,0923
0,0615
0,0308
1
0,0385
0,0615
0,0385
0,0615
0,0308
0,0077
2
0,0077
0,0231
0,0154
0,0077
0,0000
0,0000
3
Marginal de leves
0,0000
0,2769
0,0077
0,2615
0,0154
0,1462
0,0154
0,1769
0,0077
0,1000
0,0000
0,0385
0,6615
0,2385
0,0538
0,0462
ni.
N
n. j
N
Si
nij
ni . n. j
N N
N
ij Independencia
Varianzas - Covarianzas
Var ( X )
2
(
x
x
)
ni
i
i 1
Varianza de X
S X2
k
Varianza de Y
Cov( X , Y )
Var (Y )
( x x )( y
i 1 j 1
y )nij
S XY
2
(
y
y
)
n j
j
j 1
SY2
Covarianza entre X e Y
Mide si existe asociacin lineal
entre X e Y. Positiva o negativa
pero no la intensidad
rxy
S xy
SxS y
rxy
Propiedades:
Es un coeficiente adimensional
-1 r 1
Si hay relacin lineal positiva r > 0 y prximo a 1
Si hay relacin lineal negativa r < 0 y prximo a -1
Si no hay relacin lineal r se aproxima a 0
Si X e Y son independientes Sxy = 0 y por tanto r = 0
Importante:
Si las dos variables son independientes, su covarianza vale cero. No podemos asegurar lo mismo en sentido contrario. Si
dos variables tienen covarianza cero, no significa que sean independientes. Linealmente NO tienen relacin. Pero pueden
pueden ser dependientes.
rendimiento
inteligencia
VARIABLES CUALITATIVAS
1) Coeficiente de Asociacin Chi-Cuadrado (2):
i 1 j 1
Si
nij eij
eij
nij
eij
Frecuencia observada
ni n j
n
Frecuencia
esperada
1
lm ite _ m xim o 1
min(I , J )
Nunca superior a uno
Si C 0
Si C 1
inexistencia de asociacin
perfecta asociacin entre las variables
Interpretacin:
Si = 1: Correlacin por rangos perfecta y positiva. La concordancia entre los
rangos es perfecta
Si = -1: Correlacin por rangos perfecta y negativa. La concordancia entre los
rangos es perfecta
Si = 0: Correlacin por rangos nula. No hay concordancia entre los rangos
Si 0 < < 1: Correlacin por rangos positiva y si -1 < <0: Correlacin por
rangos negativa
ASOCIACIN ESTADSTICA
La idea de asociacin / relacin entre
variables se define por lo general en
oposicin al de independencia estadstica
y se evala examinando el sentido y la
fuerza de las regularidades empricas
MEDIDAS DE ASOCIACIN
Medida de
asociacin
Tabla
Escala de
Medida
Phi
2x2
Nominales
V de Cramer
fxc
Nominales
Lambda
fxc
Nominales
Gamma
fxc
Ordinales
Tau b / c de
Kendall
fxc
Ordinales
Observaciones
Medidas basadas en chi cuadrado.
Toman valores comprendidos entre 0 y 1.
Evala hiptesis lineales (diagonal principal).
Son tiles para estimar grados de asociacin
entre pares de variables, sobre un mismo
conjunto de individuos para n filas y columnas.
Toma valores entre 0 y 1.
Disponen versin asimtrica.
Es fcil de interpretar en trminos de la
proporcin que se reduce le error de
prediccin del valor de una variable a partir
de los valores de la otra (pero puede tomar
valores muy bajos en tablas con asociacin).
Toma valores entre -1 y 1, pasando por 0.
Gamma es ms fcil de interpretar. Asume
relaciones curvilineales.
Tau b slo alcanza valores extremos cuando
hay asociacin total y f y c son iguales.
Tau c tiende a subestimar la
23relacin.