Sie sind auf Seite 1von 16

Estadstica Econmica

2007-2008. Sara Mateo.


Captulo 6
Distribuciones de frecuencias
bidimensionales
Contenidos:

Distribucin bidimensional de frecuencias
Representaciones grficas
Momentos en distribuciones bidimensionales
Mtodo reducido para el clculo de varianzas y covarianzas
Valor de la covarianza en caso de independencia estadstica
Coeficiente de correlacin lineal
Coeficientes de Asociacin para variables nominales: Chi-Cuadrado
y C de contingencia
Tabla de Correlacin o
Contingencia (atributos) (al final del captulo)
Tabla de Correlacin o Contingencia

Permite ayudarnos a determinar si existe relacin de interdependencia
entre 2 variables, es decir, si se influyen mutuamente.

As, una tabla de contingencia es una una tabla de doble
entrada, donde en cada casilla figurar el nmero de casos
o individuos que poseen un nivel de una de las
caractersticas analizadas y otro nivel de la otra
caracterstica.

donde nij es el nmero de
observaciones que presentan
simultneamente las
caractersticas i, j de las variables A
y B, respectivamente.
Al analizar una distribucin bidimensional, uno puede centrar su
estudio en el comportamiento de una de las variables, con
independencia de como se comporta la otra. Estaramos as en el
anlisis de una distribucin marginal.
Distribucin marginal de A
A
i
n
i.

A
1
n
1.

A
2
n
2.


A
n-1
n
n-1.

A
n
n
n.

Distribucin marginal de B
B
j
n
.j

B
1
n
.1

B
2
n
.2


B
m-1
n
.m-1

B
m
n
.m

son las frecuencias absolutas marginales
de las variables A y B, respectivamente.
Definimos:
son las frecuencias relativas marginales
de las variables A y B, respectivamente.
Distribuciones marginales

=
-
=
J
j
ij
i
n
n
f
1

=
-
=
I
i
ij
j
n
n
f
1

=
-
=
J
j
ij i
n n
1

=
-
=
I
i
ij j
n n
1
1 1 1 1
h k h k
i j ij
i j i j
n n n N
- -
= = = =
= = =

1 2 3
1
... ...
k
i i i i ij ik ij
j
n n n n n n n
-
=
= + + + + + + =

1 2 3
1
... ...
h
j j j j ij hj ij
i
n n n n n n n
-
=
= + + + + + + =

Estadstica Econmica
2007-2008. Sara Mateo.
En las tablas de contingencia:
a) Distribuciones marginales
b) Distribuciones de frecuencias relativas
c) Perfiles fila
d) Perfiles columna
Del total de
individuos con la
caracterstica A
1

que porcentaje
comparte a su vez la
B
1


Cmo es lgico, el
porcentaje de
individuos con A
1

que, o bien
comparten B
1
o B
2
y
hasta B
j
ser el
100% = 1
Distribucin de una de las variables
siempre que la otra cumpla una
condicin especfica.

x
i
n
i.
(Frecuencia cuando y=valor especfico)

x
1
n
1.

x
2
n
2.


x
n-1
n
n-1.

x
n
n
n.

X: Gasto en material escolar
Y: Nmero de hijos
Distrib. Condicionada: Por ejemplo, gasto en material escolar
cuando el nmero de hijos es <3. Tambin podra ser simplemente
cuando y=nmero, slo sera coger esa columna sin sumar nada.
0 5
50 8
100 5
150 8
200 4
Suma de frecuencias
cuando y=0, y=1, y= 2.
Que tienen un gasto de 50.
Estadstica Econmica
2007-2008. Sara Mateo.
Averias 0 1 2 3 Marginal de leves
0 0,2308 0,0385 0,0077 0,0000 0,2769
1 0,1692 0,0615 0,0231 0,0077 0,2615
2 0,0769 0,0385 0,0154 0,0154 0,1462
3 0,0923 0,0615 0,0077 0,0154 0,1769
4 0,0615 0,0308 0,0000 0,0077 0,1000
5 0,0308 0,0077 0,0000 0,0000 0,0385
0,6615 0,2385 0,0538 0,0462 1
Graves Y
Leves X
Marginal de Graves
ij
n
N
. i
n
N
. j
n
N
.
.
j
i
ij
n
Si i Indep j
N
en
n
dencia
n
N N
=
Representacin grfica: Nube de
puntos o diagrama de dispersin
Estadstica Econmica
2007-2008. Sara Mateo.
2
2
1
( )
( )
h
i i
i
X
x x n
Var X S
N
-
=

= =

2
1
2
( )
( )
k
j j
j
Y
y y n
Var Y S
N
-
=

= =

1 1
( )( )
( , )
h k
i j ij
i j
XY
x x y y n
Cov X Y S
N
= =

= =

Varianza de X
Varianza de Y
Covarianza entre X e Y
Mide si existe asociacin lineal
entre X e Y. Positiva o negativa
pero no la intensidad
Estadstica Econmica
2007-2008. Sara Mateo.
1 1
h k
r s
i j ij
i j
rs
x y n
a
N
= =
=

1 1
( ) ( )
h k
r s
i j ij
i j
rs
x x y y n
m
N
= =

=

Momento rs con respecto origen:


Momento rs con respecto a las medias:
Estadstica Econmica
2007-2008. Sara Mateo.
1 1
2 2
'
'
i i
j j
x c p x
y c p y
= +
= +
1 1
2 2
'
'
x c p x
y c p y
= +
= +
2 2 2
1
2 2 2
2
( ')
( ')
X X
Y Y
S p S
S p S
=
=
1 2
'
XY XY
S p p S =
Se efecta la transformacin:
Resultado de las Medias de las nuevas variables
De las nuevas varianzas:
De la nueva covarianza:
Coeficiente de correlacin lineal
xy
r
El valor de la covarianza depender de los valores de las
variables, por tanto de sus unidades. Para poder eliminar las
unidades y tener una medida adimensional utilizamos el
COEFICIENTE DE CORRELACIN LINEAL ) (
xy
r
y x
xy
xy
S S
S
r =
siendo invariante frente a transformaciones lineales (cambio de origen
y escala) de las variable.
Es un coeficiente adimensional
-1 s r s 1
Si hay relacin lineal positiva r > 0 y prximo a 1
Si hay relacin lineal negativa r < 0 y prximo a -1
Si no hay relacin lineal r se aproxima a 0
Si X e Y son independientes Sxy = 0 y por tanto r = 0

Si las dos variables son independientes, su covarianza vale cero. No podemos asegurar lo mismo en sentido contrario. Si
dos variables tienen covarianza cero, no significa que sean independientes. Linealmente NO tienen relacin. Pero pueden
pueden ser dependientes.
Importante:
Propiedades:
1) Coeficiente de Asociacin Chi-Cuadrado (
2
):
( )

= =

=
I
i
J
j
ij
ij ij
e
e n
1 1
2
2
_
Frecuencia observada ij
n
n
n n
e
j i
ij
- -
=
Frecuencia
esperada
Si 0 no habr asociacin inexistencia de asociacin

Problema: no tiene lmite superior por lo que no permite
conocer el grado de asociacin.
2
_
VARIABLES CUALITATIVAS
Estadstica Econmica
2007-2008. Sara Mateo.
2) Coeficiente C de contingencia de Karl Pearson:
n
C
+
=
2
2
_
_
) , min(
1
1 _
J I
mximo lmite =
Si C 0 inexistencia de asociacin
Si C 1 perfecta asociacin entre las variables
Nunca superior a uno
Estadstica Econmica
2007-2008. Sara Mateo.
Coeficiente de Correlacin por Rangos de Spearman:
El Coeficiente de Correlacin por Rangos de Spearman permite determinar
la correlacin de datos de carcter ordinal midiendo la concordancia o
discordancia entre las clasificaciones.

Formulacin:
Si no hay empates
Interpretacin:

Si = 1: Correlacin por rangos perfecta y positiva. La concordancia entre los
rangos es perfecta
Si = -1: Correlacin por rangos perfecta y negativa. La concordancia entre los
rangos es perfecta
Si = 0: Correlacin por rangos nula. No hay concordancia entre los rangos
Si 0 < < 1: Correlacin por rangos positiva y si -1 < <0: Correlacin por
rangos negativa
D: diferencia de valores para las
dos variables.
EJEMPLOS EN CLASE

Das könnte Ihnen auch gefallen