Beruflich Dokumente
Kultur Dokumente
Sea una poblacin de n individuos donde estudiamos, simultneamente, dos variables X e Y . Sean x1 , x2 , . . . , xk las modalidades de X e y1 , y2, . . . , yp las modalidades de Y . La distribucin de frecuencias bidimensional de estas dos variables se presenta mediante una tabla de doble entrada
X\Y x1 x2 . . . xi . . . xk n.j
2.1.1
Frecuencias Absolutas
Se dene la frecuencia absoluta correspondiente a la pareja de valores (xi , yj ) como nij = nmero de individuos que presenta la modalidad xi de X e yj de Y para i = 1, . . . , k, j = 1, . . . , p. Claramente, se verica que n=
p k XX
nij
i=1 j=1
2.1.2
Frecuencias Relativas
Se dene la frecuencia relativa correspondiente a la pareja de valores (xi , yj ) como fij = proporcin de individuos que presenta nij = n la modalidad xi de X e yj de Y
fij
i=1 j=1
2.2
Distribuciones Marginales
Las distribuciones marginales corresponden al estudio, por separado, de cada una de las dos variables que componen una variable estadstica bidimensional. Cada distribucin marginal ser, por tanto, una distribucin unidimensional y, consecuentemente, se le podr aplicar cualquiera de los resultados estudiados en el Captulo 2.
2.2.1
Distribucin Marginal de X
Es la distribucin de todas las observaciones de X independientemente de las de Y . Se obtiene sumando, para cada xi , las frecuencias correspondientes a todos los valores de
Distribuciones Marginales
Y , es decir X x1 x2 . . . xi . . . xk ni. n1. n2. . . . ni. . . . nk. n donde, para cada i = 1, . . . , k, ni. =
p X
j=1
se denomina Frecuencia Marginal Absoluta de xi , y ni. X = fi. = fij n j=1 se denomina Frecuencia Marginal Relativa de xi . Se verica que
k X i=1 k X i=1 p
ni. = n,
fi. = 1.
Media Marginal de X x=
k X i=1
fi. xi =
k 1 X ni. xi n i=1
k X i=1
fi. x2 x2 i
2.2.2
Distribucin Marginal de Y
Es la distribucin de todas las observaciones de Y independientemente de las de X, se obtiene sumando, para cada yj , las frecuencias correspondientes a todos los valores de X, es decir Y y1 y2 . . . yj . . . yp donde, para cada j = 1, . . . , p, n.j =
k X i=1
n.j = n,
j=1
j=1
p X
f.j = 1.
j=1
p X
f.j yj =
p 1 X n.j yj n j=1
j=1
p X
f.j (yj y )2 =
j=1
p X
2 f.j yj y 2
Distribuciones Condicionadas
2.3
Distribuciones Condicionadas
Las distribuciones condicionadas corresponden al estudio de una variable cuando la otra toma presenta, exactamente, un valor concreto. Cada distribucin condicionada ser, por tanto, una distribucin unidimensional y, consecuentemente, se le podr aplicar cualquiera de los resultados estudiados en el Captulo 2.
2.3.1
Distribucin Condicionada de X a Y = yj
Para cada j = 1, . . . , p jo, la distribucin de X condicionada a Y = yj es la distribucin de la variable X restringida a los individuos que presentan modalidad yj de Y , es decir X/Y = yj x1 x2 . . . xi . . . xk nj (j jo) i nj = n1j 1 nj = n2j 2 . . . nj = nij i . . . nj = nkj k n.j fij = nj /n.j i
j f1 = nj /n.j 1 j f2 = nj /n.j 2 . . .
fij = nj /n.j i . . .
j fk = nj /n.j k
Observemos que existen p distribuciones condicionadas de X a Y (una para cada valor de Y ). Media de X condicionada a Y = yj xj =
k X i=1
fij xi =
fij (xi xj )2 =
k X i=1
j fij x2 x2 i
2.3.2
Distribucin condicionada de Y a X = xi
Para cada i = 1, . . . , k jo, la distribucin de Y condicionada a X = xi es la distribucin de la variable Y restringida a los individuos que presentan modalidad xi de X, es decir Y /X = xi y1 y2 . . . yj . . . yp ni (i jo) j ni = ni1 1 ni = ni2 2 . . . ni = nij j . . . ni = nip p ni.
i fj = ni /ni. j i f1 = ni /ni. 1 i f2 = ni /ni. 2 . . . i fj = ni /ni. j . . . i fp = ni /ni. p
Observemos que existen k distribuciones condicionadas de Y a X (una para cada valor de X). Media de Y condicionada a X = xi yi =
p X i fj yj p 1 X = nij yj ni. j=1
j=1
yi 2
Pp
i j=1 fj (yj
yi )2 =
(la demostracin queda propuesta). Observemos que slo hemos considerado las distribuciones condicionadas de una variable cuando la otra presenta un valor jado. Este estudio se puede generalizar al caso en que se condiciona, no a un nico valor de la variable, sino a todo un conjunto de valores.
2.4
Diremos que Y es estadsticamente independiente de X (o, simplemente, indeentre s, para cualquier xi al que se condicione, es decir,
i Y es independiente de X fj no depende de i
1 2 k fj = fj = . . . = fj
En tal caso, las distribuciones condicionadas Y /X = xi coinciden con la marginal de Y , es decir Y es independiente de X
i fj
= f.j
para
i = 1, . . . , k j = 1, . . . , p
Se puede demostrar que la independencia es recproca, esto es, X es independiente de Y Y es independiente de X Esto permite hablar de variables independientes entre s (diremos, simplemente, que X e Y son independientes). De las deniciones anteriores se deduce que X es independiente de Y nij = ni. n.j fij = fi. f.j n
2.5
Cuando dos variables no son estadsticamente independientes, se dice que son estadsticamente dependientes. La dependencia estadstica ms fuerte es la llamada Dependencia Funcional. Se dice que X depende funcionalmente de Y si a cada modalidad yj de Y corresponde una nica modalidad de X (en cada columna de la tabla bidimensional hay un trmino, y slo uno, diferente de cero). Se dice que Y depende funcionalmente de X si a cada modalidad xi de X corretrmino, y slo uno, diferente de cero). En general, la dependencia funcional no es recproca, como muestra el siguiente ejemplo: X\Y x1 x2 x3 y1 4 0 0 y2 0 6 0 y3 7 0 0 y4 0 0 9
2.6
Covarianza
Se trata de una caracterstica numrica conjunta bidimensional que indica el sentido en que crecen o decrecen las variables por trmino medio. Concretamente, si la covarianza es positiva, las dos variables varan en el mismo sentido (las dos crecen o las dos decrecen) y, si es negativa, las variables varan en sentido opuesto (una crece cuando la otra decrece y viceversa). La covarianza de dos variables, X e Y , se dene como Cov (X, Y ) = XY
k 1 XX = fij (xi x) (yj y ) = nij xi yj xy n i=1 j=1 i=1 j=1 p k XX p
Se dice que X e Y son incorreladas si su covarianza es nula, esto es X e Y son incorreladas Cov (X, Y ) = 0
Representaciones Grcas
Se tiene la siguiente relacin INDEPENDENCIA = INCORRELACIN 6= es decir, si dos variables son independientes, entonces son incorreladas (demustrese), pero si las variables son incorreladas, no se puede armar nada sobre su dependencia o independencia estadstica.
2.7
Representaciones Grcas
Como las distribuciones condicionadas y marginales son unidimensionales, todos
los grcos estudiados en el Captulo 1 son aplicables a dichas distribuciones. En las distribuciones bidimensionales se suelen emplear los siguientes grcos:
2.7.1
Consiste en representar los pares de puntos (xi , yj ) en el plano junto con su correspondiente frecuencia absoluta conjunta nij .
2.7.2
Se trata de un grco en tres dimensiones donde un eje corresponde a la variable X, otro a la variable Y y el tercero a las frecuencia absoluta conjunta. Si las variables son discretas, el estereograma estar compuesto por barras (diagrama de barras tridimensional); si las variables son continuas, el estereograma estar formado por paraleleppedos (histograma tridimensional) cuyos respectivos volmenes son proporcionales a las correspondientes frecuencias absolutas conjuntas.