Sie sind auf Seite 1von 26

Estadstica Bivariada

REPRESENTACIN DE DATOS DE DOS VARIABLES. Cada una de las variables puede ser por su naturaleza cualitativa o cuantitativa. Como resultado, los datos bivariados pueden formarse mediante tres combinaciones de variables: 1. Ambas variables son cualitativas (de atributos). 2. Una variable es cualitativa (de atributo) y otra es cuantitativa (numrica). 3. Ambas variables son cuantitativas (numricas). Dos variables cuantitativas. Cuando los datos bivariados son resultado de dos variables cuantitativas, los datos matemticos suelen expresarse como pares ordenados, (X,Y), donde X es la variable de entrada (variable independiente) y Y es la variable de salida (variable dependiente).

REPRESENTACIN DE DATOS DE DOS VARIABLES.


Relacin funcional Dos variables x e y estn relacionadas funcionalmente cuando conocida la primera se puede saber con exactitud el valor de la segunda. Ejemplo Si se deja caer una piedra, existe una frmula que nos permite calcular exactamente, la altura a la que se encuentra en funcin del tiempo transcurrido. h = g t. Relacin estadstica Dos variables x e y estn relacionadas estadsticamente cuando conocida la primera se puede estimar aproximadamente el valor de la segunda. Ejemplos Ingresos y gastos de una familia, Produccin y ventas de una fbrica, Gastos en publicidad y beneficios de una empresa. Variable estadstica bidimensional Una variable bidimensional es una variable en la que cada individuo est definido por un par de caracteres, (X, Y). Estos dos caracteres son a su vez variables estadsticas en las que s existe relacin entre ellas, una de las dos variables es la variable independiente y la otra variable dependiente.

Distribuciones Bidimensionales
Las distribuciones bidimensionales son aquellas en las que se estudian al mismo tiempo dos variables de cada elemento de la poblacin: por ejemplo peso y altura de un grupo de estudiantes; superficie y precio de las viviendas de una ciudad; potencia y velocidad de una gama de automviles deportivos. Para representar los datos obtenidos se utiliza una tabla de correlacin
X/Y x1 x2 ..... xn-1 xn y1 n1,1 n2,1 x nn-1,1 nn,1 y2 n1,2 n2,2 x nn-1,2
nn,2

..... x x x x x

ym-1 n1,m-1 n2,m-1 x nn-1,m-1 nn,m-1

ym n1,m n2,m x nn-1,m nn,m

En cada interseccin (par (x,y)) se recoge el nmero de veces que dicho par de valores se ha presentado conjuntamente.

Distribuciones Bidimensionales Ejemplo: Medimos la estatura y el peso de los alumnos de una clase y obtenemos los siguientes resultados:
Alumno Alumno 1 Alumno 2 Alumno 3 Alumno 4 Alumno 5 Alumno 6 Alumno 7 Alumno 8 Alumno 9 Alumno 10 Alumno 11 Alumno 12 Alumno 13 Alumno 14 Alumno 15 Estatura 1,25 1,28 1,27 1,21 1,22 1,29 1,3 1,24 1,27 1,29 1,25 1,28 1,27 1,21 1,22 Peso 32 33 34 30 32 35 34 32 32 35 33 35 34 30 33 Alumno Alumno 16 Alumno 17 Alumno 18 Alumno 19 Alumno 20 Alumno 21 Alumno 22 Alumno 23 Alumno 24 Alumno 25 Alumno 26 Alumno 27 Alumno 28 Alumno 29 Alumno 30 Estatura 1,29 1,3 1,24 1,27 1,29 1,25 1,28 1,27 1,21 1,22 1,29 1,3 1,24 1,27 1,29 Peso 34 35 32 33 33 33 34 34 31 32 34 34 31 35 34

Distribuciones Bidimensionales Esta informacin se puede representar de un modo ms organizado en la siguiente tabla de correlacin:
Estatura / Peso 1,21 cm 1,22 cm 1,23 cm 1,24 cm 1,25 cm 1,26 cm 1,27 cm 1,28 cm 1,29 cm 1,30 cm 31 kg 0 0 0 0 1 0 2 0 3 0 32 kg 0 1 0 2 1 0 1 1 0 0 33 kg 1 1 0 1 1 0 0 1 1 0 34 kg 2 0 0 0 0 0 2 0 1 2 35 kg 0 1 0 0 0 0 1 1 1 1

Tal como se puede ver, en cada casilla se recoge el nmero de veces que se presenta conjuntamente cada par de valores (x,y).

Distribuciones Bidimensionales Distribuciones marginales Al analizar una distribucin bidimensional, uno puede centrar su estudio en el comportamiento de una de las variables, con independencia de como se comporta la otra. Estaramos as en el anlisis de una distribucin marginal.

ni = nij ; i =1...m
j =1
n

Suma de los valores de la fila i-sima de la tabla.

n j = nij ; j = 1..n
i =1

Suma de los valores de la columna jsima de la tabla.

Distribuciones Bidimensionales Distribuciones marginales A partir del ejemplo anterior (pesos y medidas de los alumnos) vamos a estudiar sus distribuciones marginales.
Estatura / Peso 1,21 cm 1,22 cm 1,23 cm 1,24 cm 1,25 cm 1,26 cm 1,27 cm 1,28 cm 1,29 cm 1,30 cm 31 kg 0 0 0 0 1 0 2 0 3 0 6 32 kg 0 1 0 2 1 0 1 1 0 0 6 33 kg 1 1 0 1 1 0 0 1 1 0 6 34 kg 2 0 0 0 0 0 2 0 1 2 7 35 kg 0 1 0 0 0 0 1 1 1 1 5 3 3 0 3 3 0 6 3 6 3

30

Distribuciones Bidimensionales Distribuciones marginales Marginal de X


Estatura 1,21 1,22 1,23 1,24 1,25 1,26 1,27 1,28 1,29 1,3 Total ni 3 3 0 3 3 0 6 3 6 3 30

Marginal de Y
Peso 31 32 33 34 35 Total ni 6 6 6 7 5 30

Correlacin Lineal.
Diagrama de dispersin o nube de puntos. Es la grfica de todos los pares ordenados de datos de dos variables que estn en un sistema de ejes coordenados. La variable de entrada, X, se grafica en el eje horizontal y la variable de salida, Y, se grfica en el eje vertical.
Diag. Dispersin 36 35 34 33 32 31 30 29 1,2 1,22 1,24 1,26 Estatura Peso 1,28 1,3 1,32

Correlacin Lineal. TIPOS DE DEPENDENCIA A PARTIR DE LA REPRESENTACIN GRFICA Uno de los objetivos de este tema es estudiar el tipo de dependencia que hay entre las dos caractersticas o variables estudiadas para un fenmeno en cuestin. " A mayor talla de una persona le corresponde mayor peso ? " A esta pregunta parece que se responde rpidamente que s. Cmo se observa en la nube de puntos este hecho?. Si los pares ordenados (x, y) tienden a seguir un patrn de lnea recta, se tiene una correlacin lineal. Esta correlacin puede ser positiva o negativa (relacin directa inversa). Si los datos forman una lnea horizontal o vertical, no hay correlacin, ya que una variable no afecta la otra.

Correlacin Lineal. Si los pares ordenados (x, y) tienden a seguir un patrn de lnea recta, se tiene una correlacin lineal. Esta correlacin puede ser positiva o negativa (relacin directa inversa). Si los datos forman una lnea horizontal o vertical, no hay correlacin, ya que una variable no afecta la otra.

Correlacin Lineal.

Diag. Dispersin 36 35 34 33 32 31 30 29 1,2 1,22 1,24 1,26 Estatura Peso 1,28 1,3 1,32

Correlacin Lineal. Covarianza La covarianza entre dos variables X e Y (COVxy), nos indica si la posible relacin es directa o inversa (favorable o no). Si COVxy >0 Si COVxy <0 Si COVxy = 0 Directa indirecta No hay relacin Incorrelacionadas

1)COVxy = 2)COVxy =

1 ( xi X )( yi Y ) n 1 ( xi yi ) ( X Y ) n

OBS: La covarianza, sin embargo, no permite tener una nocin del grado de asociacin ya que vara entre infinitos y + infinito y no hay modo de saber si es grande pequea.

Correlacin Lineal. Covarianza

1 COVxy = ( xi yi ) ( X Y ) n
Ejemplo Estudiamos la talla, medida en cm. y el peso, medido en kg. de un grupo de 10 personas, podemos obtener los siguientes valores:

TALLA (cm) PESO (kg)

160 55

165 58

168 58

170 61

171 67

175 62

175 66

180 74

180 79

182 83

Podemos llamar X a la talla e Y al peso con lo que se obtendra la variable bidimensional (X, Y) que toma 10 valores, que son las 10 parejas de valores de la tabla anterior: (160,55), (165,58), etc.

Correlacin Lineal. Covarianza Ejemplo


TALLA (cm) PESO (kg) 160 55 165 58 168 58 170 61 171 67 175 62 175 66 180 74 180 79 182 83

TALLA V/S PESO


90 85 80 75 70 65 60 55 50 45 40 155

160

165

170

175

180

185

Correlacin Lineal. Covarianza

COVxy =
Ejemplo
TALLA (cm) PESO (kg)

1 ( xi yi ) ( X Y ) n

160 55

165 58

168 58

170 61

171 67

175 62

175 66

180 74

180 79

182 83

x = 172,6 y = 66,3
COVxy = 160 55 + 165 58 + 168 58 + 170 61 + 175 62 + 175 66 + 180 74 + 180 79 + 182 83 172,6 66,3 10

COVxy = 11498,7 11443,38 = 55,32 > 0

Implica dependencia directa

Correlacin Lineal. Coeficiente de Correlacin (r). El coeficiente de correlacin lineal (de Pearson) de dos variables, r, nos indica si los puntos tienen una tendencia a disponerse alineadamente (excluyendo rectas horizontales y verticales). El coeficiente de correlacin lineal, r, es la medida numrica de la intensidad de la relacin lineal entre dos variables. El coeficiente refleja la consistencia de efecto que el cambio en una variable tiene sobre otras. Tiene el mismo signo que COVxy por tanto de su signo obtenemos el que la posible relacin sea directa o inversa. r es til para determinar si hay relacin lineal entre dos variables, pero no servir para otro tipo de relaciones (cuadrtica, logartmica,...)

Coeficiente de Correlacin (r).

1)r =

COVxy S x SY

2) r =

COVxy VarxVarY

Propiedades de r: Es adimensional Slo toma valores en [-1,1] Las variables son incorreladas si r=0 Relacin lineal perfecta entre dos variables r=+1 o r=-1 Excluimos los casos de puntos alineados horiz. o verticalmente. Cuanto ms cerca est r de +1 o -1 mejor ser el grado de relacin lineal. Ej: si r=1

Correlaciones Positivas

Correlaciones Negativas

Correlacin Lineal. Recta de regresin Supongamos que en una variable bidimensional queremos precisar la relacin que existe entre las dos variables que la forman. Normalmente se elige como y la variable dependiente y como x la independiente. Si esa relacin se expresa mediante una funcin lineal del tipo y = ax + b, su grfica correspondera a una recta. En el caso que nos ocupa nos interesa la recta que mejor "se ajuste" a los puntos de la nube de la variable. Dicha recta se denomina: recta de regresin. Por un mtodo que se denomina de "mnimos cuadrados" y cuya concrecin no corresponde a este nivel de estudio, se deduce que la recta de regresin debe pasar por el punto correspondiente a las medias de ambas variables.

Correlacin Lineal. Recta de regresin


En la imagen siguiente se muestra la recta de regresin de y (peso) sobre x (talla) del ejemplo anterior. En este caso se supone que represente cmo depende el peso de una persona respecto de su talla.
TALLA V/S PESO
90 80 70 60 50 40 155

Dependencia directa Pendiente de la recta positiva Funcin creciente

160

165 PESO (kg)

170

175

180

185

Lineal (PESO (kg))

Si recordamos que entre la talla y el peso decamos que exista una dependencia directa, la recta de regresin lo confirma ya que su pendiente es positiva: a medida que aumenta la talla aumenta el peso. Por tanto:

Correlacin Lineal. Recta de regresin


Ecuacin de la recta de regresin

PESO V/S TALLA


100 80 60 40 20 0 155 160 165 170 175 180 185 y = 1,2121x - 142,91

qu utilidad tiene la recta de regresin?

Correlacin Lineal. Qu utilidad tiene la recta de regresin?


En la tabla de valores de las variables talla - peso, solamente nos dan los valores de un determinado nmero de personas (10): casos conocidos. Mediante la recta de regresin podramos obtener de manera aproximada el peso de una persona de la que slo conociramos la talla, en una poblacin semejante a aquella de la que se ha obtenido la muestra. Si observamos la grfica anterior, podramos suponer por ejemplo que una persona de 185 cm pesara algo ms de 80 kg
PESO V/S TALLA
100 80 60 40 20 0 155 160 165 170 175 180 185 y = 1,2121x - 142,91

De manera ms precisa, si conocemos la expresin de la recta de regresin, se pueden calcular valores para la variable y, conocidos los de x, como si se tratara de una funcin.

Correlacin Lineal. Ejemplo anterior: para una persona de 185 cm cul sera su peso en kg Funcin y = ax + b y = 1,2121x 142,91 y = 1,2121*185 142,91 y = 81,3285 Estimado Reemplazamos el valor de x =185 (conocido) en la funcin

Das könnte Ihnen auch gefallen