Sie sind auf Seite 1von 9

N=

i =1 j =1
DISTRIBUCIONES BIDIMENSIONALES
Conceptos Generales.
Hasta ahora hemos estudiado sobre cada observacin de las que forman la muestra el
valor que presenta un determinado carcter. En este tema estudiaremos sobre cada
observacin dos caracteres (por ejemplo: peso y altura, edad y salario,...). Estos dos
caracteres tendrn unas variables asociadas que denotaremos por e !. cada variable
tomara unos valores "
#
, "
$
, ...,"
%
(la variable ) y y
#
, y
$
,..., y
p
(la variable !).
& la variable (X,Y) la llamaremos variable estad'stica bidimensional y sus valores sern
los pares de valores ("
i
, y
j
).
(os ra)onamientos que presentaremos para dos variables (estad'stica
bidimensional) son e"trapolables en mayor o menor medida para *n+ variables
(Estad'stica n,dimensional).
Representacin numrica.
(a tabla estad'stica ms sencilla para representar una variable bidimensional consiste
en colocar en dos columnas los pares de valores se-.n se han ido observando. /n
mismo sub'ndice afecta a ambos elementos del par y nos indica que observacin
nos ha proporcionado dicho par de valores ("
i
, y
i
), el .ltimo sub'ndice, *n+ es i-ual
al n.mero de observaciones:
E0E12(3 #: (& 4/2E56787E E9 HE8:&5E&4() ! 253;/88739 E9 <m.(!) ;E = 6798&4:
6798& 4/2.Ha.(X) 253;/8. <m(Y)
# #> #>>
$ = ?=
@ #> =>
A #= ?=
= = ?=
Distribuciones bidimensionales de frecuencias.
Tablas de correlacin y contingencia.
En esta representacin los distintos valores de la variable X los notamos "
i
iB #, $,
..., % y los distintos valores de la variable Y los notamos y
i
iB #, $, ..., p.
& cada observacin le corresponde un par de valores ("
i
, y
j
). Al nmero de
observaciones que han presentado el valor x
i
de X e y
j
de Y se le denomina
frecuencia absoluta del par (x
i
, y
j
) y se nota como n
i j
9otaremos con f
i j
a la frecuencia relativa de dicho par:
n
i j
f
i j
=
N
;onde 9 es el n.mero de observaciones:
k
p
NOTA: interpretacin del doble sumatorio!
k
p
k
p p p p

n
ij
=

(

n
ij
) =

n
1 j
+

n
2
j
+ ... +

n
kj
= n
11
+ n
12
+ ... + n
1 p
i =1 j =1 i =1 j =1 j =1 j =1 j =1
+ n
21
+ n
22
+ ... + n
2
p
+ ... + n
k 1
+ n
k 2
+ ... + n
kp
k
p p
k
Es fcil comprobar que:
N =

n
ij
=

n
ij
i =1 j =1 j =1 i =1
4e denomina distribuci!n bidimensional de frecuencias al conjunto de valores (( x
i
, y
j
) , n
i j
) donde iB #,$,..., % y j B #,$,...,p.
Esta distribucin bidimensional se representa adecuadamente mediante una tabla
de doble entrada llamada tabla de correlaci!n:
"#$ y
1
y
2
y
3
............ y
p
x
1
n
11
n
12
n
13
............. n
1p
x
2
n
21
n
22
n
23
............. n
2p
.......
x
k
..........
n
k1
n
k2
n
k3
............. n
kp
%&%'()O * : ;74:57C/8739 4EDE9 4&(&5734 (!, E9 E/534) ! E;&;E4()
;E /9 D5/23 ;E #>> 03FE9E4.
G! =>,#>>
H ?=
#>>,#=>
#$=
#=>,$>>
#?=
4/1& 67(&
$> #> @ $ #=
$# = #= = $=
$$ $ $> #= @?
$@ > #@ #> $@
4/1& 83(. #? =# @$ #>>
H 8/&9;3 &(D/9& ;E (&4 F&57&C(E4 E4:&9 &D5/2&;&4 E9 79:E5F&(34
4E :31& 8313 F&(35 x
i
" y
j
(& 1&58& ;E 8(&4E.
n
#$
= %& 47D97678& </E #@ ;E (34 87E9
03FE9E4 :7E9E9 $@ &I34 ! /9 4&(&573 E9:5E #>> !
#=> E/534.
Si las variables objeto de estudio fueran cualitativas, la tabla se
denominara tabla de contingencia.
4i llamamos: n
. j
B n
i j
con *j+ fijo, dicho valor se corresponde con la suma de las
frecuencias absolutas de la columna *j+ de nuestra tabla.
4i llamamos: n
i
. B n
i j
con *i+ fijo, dicho valor se corresponde con la suma de
las frecuencias absolutas de la fila *i+ de nuestra tabla.
El n.mero total de observaciones *9+ tambiJn puede obtenerse como:
k
p
k
p
N =

n
ij
=

n
i
.
=

n
. j
i =1 j =1 i =1 j =1
En nuestro ejemplo $ los n
i
. y los n
. j
son los datos que aparecen en la .ltima
columna y fila respectivamente.
+.*.*. Distribuciones marginales y condiciona das .
Distr ibuciones ma r g inales.
;e estas tablas de doble entrada (de correlacin o contin-encia), es posible
e"traer la informacin correspondiente a cada una de las variables
(independientemente de la otra), posibilidad relevante ya que su anlisis como
variable unidimensional puede ser de utilidad.
A las distribuciones unidimensionales extra'das de una variable bidimensional se les
denomina distri b uci o n es mar( in a le s . Kste nombre deriva del hecho de que las
frecuencias de la distribucin mar-inal se obtienen sumando en el mar-en de la
derecha o inferior de la tabla de correlacin las correspondientes frecuencias
bidimensionales.
;ada una tabla de correlacin de una variable bidimensional (, !) las
distribuciones mar-inales para e ! sern:
;istrib. 1ar-inal primera ;istrib. 1ar-inal se-unda
n
i
. f
i
. ! n.
.j
f
. j
"
#
n
#
. f
#
. y
#
n.
#
f.
#
"
$
n
$
. f
$
. y
$
n.
$
f.
$
........
........ .....
"
%
n
%
. f
%
. y
p
n.
p
f.
p
4/1&4 9 # 9 #
;onde:
n
i
. n.
.j
f
i
. B ,,,,,,,,, B f
i j
839 *i+ 6703 f
. j
B ,,,,,,,,, B f
i j
839 *j+
6703 9 9
En nuestro ejemplo $ las distribuciones mar-inales serian:
(a distribucin mar-inal primera:
" n
i
.
*, -.
*- *.
** +/
*+ *+
01'A CO). -,,
(a distribucin mar-inal se-unda:
! n.
j
?= #?
#$= =#
#?= @$
4/1& 83(. #>>
not a : a las medidas (media, varian)a,...) calculadas sobre la distribucin mar-inal
se les aLade el calificativo de mar-inal (media mar-inal, varian)a mar-inal,...).
Distribuciones Condiciona das.
(as distribuciones condicionadas e"presan como se distribuyen, se-.n una de las
dos variables, el conjunto de observaciones que cumplen una condicin. Esta
condicin viene e"presada por un valor o conjunto de valores que presenta la otra
variable.
Es decir, la distribucin condicionada de cuando y toma el valor y
c
o el conjunto
de valores y
r
3 la distribucin condicionada de ! cuando " toma el valor "
c
o el conjunto de
valores "
r
/tili)ando nuestro ejemplo $, una distribucin condicionada, seria la distribucin
se-.n salarios (variable !) condicionada a que la edad (variable ) sea $# aLos, ("
$
B $#).
Es decir la distribucin de la variable y condicionada a que la variable tome el
valor $# (!
"B $#
).
y
x= 21
n
j / 2
50 - 100 5
100 150 15
150 200 5
4e puede observar que cada una de las filas de frecuencias de la tabla de
correlacin define una distribucin condicionada para la variable y, salvo la .ltima
que define su distribucin mar-inal. &nlo-amente cada una de las columnas de
frecuencias de la tabla de correlacin define una distribucin condicionada para la
variable ", salvo la .ltima que define su distribucin mar-inal.
)as distribuciones condicionadas son distribuciones unidimensionales a las cuales se
les puede aplicar todo lo conocido para ese tipo de distribuciones* A las
caracter'sticas calculadas sobre las distribuciones condicionadas se les a+ade el
calificativo de condicionada (media condicionada, varian,a condicionada,***)*
2ara las distrib. condicionadas !"
i
notaremos las frecuencias relativas como f
j G i
:
n
i j
f
j / i
= -------
n
i .
! anlo-amente para las distribuciones condicionadas y
i
'omentos en d istribuc io n es bid ime n sio n a le s :
+.+.-. 'omentos respecto al origen no centrados!.
4e define el momento respecto al ori-en de la variable bidimensional ( , !) de
orden ( r , s) y lo denotamos como a
r s
1
k p
a
rs
=


x
i
y
j
n
ij
Casos particulares:
a
# >
B es la media mar-inal de
a
> #
B es la media mar-inal de !
N i =1
r s
j =1
+.+.*. 'omentos respecto a la media centrados!: )a co2arian3a.
4e define el momento respecto a la media de la variable bidimensional ( , !) de
orden ( r , s) y lo denotamos como m
r s
1
k p
m
rs
=

(
x
i
x )
r
( y
j
y)
s
n
ij
N i =1 j =1
S S
Casos particulares:
m
# >
B > B m
> #
m
$ >
B es la varian)a mar-inal de
m
> $
B es la varian)a mar-inal de !
El momento respecto a la media ms importante es la co2arian3a que se nota y
define como:
1
k p
m
11
=

(
x
i
x )(
y
j

y)n
ij
S
XY
N i =1 j =1
(a covarian)a ayuda a cuantificar la covariacin entre dos variables del si-uiente
modo:
8uando 4
"y
M >, hay una tendencia a que a mayores observaciones de
correspondan mayores observaciones de !. 2or ejemplo, a mayor cantidad de
a-ua de lluvia en un aLo, suele corresponder una mejor cosecha.
8uando 4
"y
N >, la tendencia resulta contrariaO es decir, a mayor valor de
solemos encontrar menores valores de !. 2or ejemplo, a mayor renta per cpita
en los pa'ses suele corresponder una menor mortalidad infantil.
Este valor depender de los valores de las variables, por tanto de sus
unidades. 2ara poder eliminar las unidades y tener una medida adimensional
utili)amos el 83E6787E9:E ;E 8355E(&87P9 (r
"y
)
S
r =
xy
xy
x y
4iendo tambiJn invariante frente a transformaciones lineales (cambio de ori-en y
escala) de las variable. 8itamos las si-uientes propiedades:
Es un coeficiente adimensional.
,# r
"y
#
4i hay relacin lineal positiva r
"y
M > y pr"imo a #.
4i hay relacin lineal ne-ativa r
"y
N> y pr"imo a ,#.
4i no hay relacin lineal r
"y
se apro"ima a >.
4i e ! son independientes 4
"y
B > y por tanto r
"y
B >.
R%CA(4T1)AC4ON
A) TABLA DE CORRELACION/CONTINGENCIA:
X/Y y
1
y
2
y
3
......... y
n
... y
p
n
i
.
x
1
n
11
n
12
n
13
..... n
1n
...... n
1p
n
1
.
x
2
n
21
n
22
n
23
..... n
2n
...... n
2p
n
2
.
....... ..........
x
m
n
m1
n
m2
n
m3
..... n
mn
..... n
mp
n
m
.
.......
x
k
n
k1
n
k2
n
k3
..... n
kn
...... n
kp
n
k
.
n.
j
n.
1
n.
2
n.
3
n.
n
n.
p
n
B) DISTRIB.MARGINALES Y CONDICIONADAS:
MARGINAL 1(X) MARGINAL 2(Y)
COND.Yx

COND.Xy
n
X n
!
. "
!
. Y n.
j
".
j
Yx

n
j/
Xy
n
n
!/n
x
1
n
1
. "
1
. y
1
n.
1
".
1
y
1
n
1
x
1
n
1n
x
2
n
2
. "
2
. y
2
n.
2
".
1
y
2
n
2
x
2
n
2n
... ... ... ... ... ... ... ... ... ...
x

. "

. ... ... ... ... ... x

n
n
... ... ... y
n
n.
n
".
n
y
n
n
n
... ...
x
#
n
#
. "
#
. ... ... ... ... ... x
#
n
#n
y
p
n.
p
".
p
y
p
n
p

N 1 n 1 n

. n.
n
5recuecians Relati2as:
f
i
. B n
i
.G9 f.
j
B n.
j
G9 f
jGm
B n
m j
Gn
m
. O f
iGn
B n
i n
Gn.
n
'edias 'arginales:
x B (#G9) "
i
n
i
. B "
i
f
i
. O y B (#G9) y
j
n.
j
B y
j
f.
j
'edias Condicionadas:
x
p
B (#Gn.
n
) "
i
n
in
B "
i
f
iGn
O
y
m
B (#Gn
m
.) y
j
n
mj
B y
j
f
jGm
Relaciones entre distrib. 'arginales y condicionadas:
n
ij
n
ij
n
i
.
, f
ij
B ,,,,,,, B ,,,,,, ,,,,,,, B f
jGi
f
i
.
9 n
i
. 9
n
ij
n
ij
n.
j
, f
ij
B ,,,,,,, B ,,,,,, ,,,,,,, B f
iGj
f.
j
9 n.
j
9
, x B (#G9) "
i
n
i
. B "
i
f
i
. B "
i
f
ij
B "
i
f
iGj
f.
j
B ("
i
f
iGj
)f.
j
B "
j
f.
j
, y B (#G9) y
j
n.
j
B y
j
f.
j
B y
j
f
ij
B y
j
f
jGi
f
i
.B (y
j
f
jGi
) f
i
.B y
i
f
i
.
+.6. 4ndependencia estad7stica:
;os variables e ! son estad'sticamente independientes cuando el
condicionamiento no tiene nin-.n efecto diferenciador.
(2iJnsese que si las caracter'sticas en estudio son, por ejemplo, el peso(") y el
n.mero de miembros de la unidad familiar (y), en principio y al menos
intuitivamente, la variable peso se comportara independientemente del
condicionamiento que podamos hacer en cuanto al n.mero de miembros de la
unidad familiar).
En tJrminos de frecuencias relativas, la independencia estad'stica se traducir
(condicin de independencia) en que:
f
jGi
B f.
j
! f
iGj
B f
i
. i, j
! dado que f
ij
B f
jGi
f
i
. B f
iGj
f.
j
En caso de independencia estad'stica, tendremos que:
f
ij
B f
i
. f.
j
i, j
3 en tJrminos de frecuencias absolutas:
n
ij
n
i
. n.
j
n
i
. n.
j
, ,,,,,,, B ,,,,,, ,,,,,,, n
ij
B ,,,,,,,,,,,, i, j
9 9 9 9
-stas dos ltimas expresiones son las que se suelen tomar como caracteri,aci!n de
la independencia.
Feamos que: si dos variables " e y son estad'sticamente independientes entonces
su covarian)a es cero m
##
B >(el reciproco no tiene por que ser cierto):
5ecordemos que m
##
B a
##
, a
#>
a
>#
Famos a demostrar que si hay independencia a
##
B a
#>
a
>#
a
##
B (#Gn) "
i
y
j
n
ij
B "
i
y
j
n
ij
B "
i
y
j
n
i
. n .
j
9 9 9
B "
i
n
i
. y
j
n .
j
B a
#>
a
>#
9 9
2or tanto:
7ndependencia 8ovarian)a cero
8ovarian)a cero 7ndependencia
8ibliograf7a b9sica
H 1Q &n-eles palacios, 6ernando &. (pe) Hernnde) , 0osJ Darc'a 8rdoba y
1anuel 5ui) 1ar'n. *79:53;/887P9 & (& E4:&;R4:78& 2&5& (& E125E4&+.
(ibrer'a Escarabajal
H 1art'n,2lie-o (pe), 6co. *7ntroduccin a la estad'stica econmica y empresarial+.
Ed. :homson
H 8asas, 0. 1., 8allealta, 0., 9.Le), 0., :oledo, 1. y /reLa, 8. (#STU). .urso /0sico
de -stad'stica 1escriptiva* 7.9.&.2.
H Hermoso DutiJrre), 0. &. y Hernnde) Castida, &. (#SS?). .urso /0sico de
-stad'stica 1escriptiva y 2robabilidad. Ed. 9Jmesis.
(ara saber m9s o aclarar dudas:
: t tp:# #; ;; + .u<i. e s #=mat e u # t*>ig- * .doc
:ttp : ##desc a rtes.c n ic e. m e cd.es# % stadi s tica# d istrib ? bi d imen s ion a les# d ist r ibu ci ones ?b id im e ns
iona les .:tm
:ttp: ##;;;. eumed .net#c ursec on#l ibr eria# drm#ca p+ .pdf
:ttp:##personal.redestb.es#3tt#tem#t-.?distribu ciones?bidim en siona les.:tm
:ttp: ##;;;. aulafaci l.c om #Curso%stadi stica#)e cc>- , >est.:tm
:ttp : ##;;; . ugr.es # = < sa li nas#act i 2 i# C6 .pdf

Das könnte Ihnen auch gefallen