Beruflich Dokumente
Kultur Dokumente
REPRESENTACIN DE DATOS DE DOS VARIABLES. Cada una de las variables puede ser por su naturaleza cualitativa o cuantitativa. Como resultado, los datos bivariados pueden formarse mediante tres combinaciones de variables: 1. Ambas variables son cualitativas (de atributos). 2. Una variable es cualitativa (de atributo) y otra es cuantitativa (numrica). 3. Ambas variables son cuantitativas (numricas). Dos variables cuantitativas. Cuando los datos bivariados son resultado de dos variables cuantitativas, los datos matemticos suelen expresarse como pares ordenados, (X,Y), donde X es la variable de entrada (variable independiente) y Y es la variable de salida (variable dependiente).
Distribuciones Bidimensionales
Las distribuciones bidimensionales son aquellas en las que se estudian al mismo tiempo dos variables de cada elemento de la poblacin: por ejemplo peso y altura de un grupo de estudiantes; superficie y precio de las viviendas de una ciudad; potencia y velocidad de una gama de automviles deportivos. Para representar los datos obtenidos se utiliza una tabla de correlacin
X/Y x1 x2 ..... xn-1 xn y1 n1,1 n2,1 x nn-1,1 nn,1 y2 n1,2 n2,2 x nn-1,2
nn,2
..... x x x x x
En cada interseccin (par (x,y)) se recoge el nmero de veces que dicho par de valores se ha presentado conjuntamente.
Distribuciones Bidimensionales Ejemplo: Medimos la estatura y el peso de los alumnos de una clase y obtenemos los siguientes resultados:
Alumno Alumno 1 Alumno 2 Alumno 3 Alumno 4 Alumno 5 Alumno 6 Alumno 7 Alumno 8 Alumno 9 Alumno 10 Alumno 11 Alumno 12 Alumno 13 Alumno 14 Alumno 15 Estatura 1,25 1,28 1,27 1,21 1,22 1,29 1,3 1,24 1,27 1,29 1,25 1,28 1,27 1,21 1,22 Peso 32 33 34 30 32 35 34 32 32 35 33 35 34 30 33 Alumno Alumno 16 Alumno 17 Alumno 18 Alumno 19 Alumno 20 Alumno 21 Alumno 22 Alumno 23 Alumno 24 Alumno 25 Alumno 26 Alumno 27 Alumno 28 Alumno 29 Alumno 30 Estatura 1,29 1,3 1,24 1,27 1,29 1,25 1,28 1,27 1,21 1,22 1,29 1,3 1,24 1,27 1,29 Peso 34 35 32 33 33 33 34 34 31 32 34 34 31 35 34
Distribuciones Bidimensionales Esta informacin se puede representar de un modo ms organizado en la siguiente tabla de correlacin:
Estatura / Peso 1,21 cm 1,22 cm 1,23 cm 1,24 cm 1,25 cm 1,26 cm 1,27 cm 1,28 cm 1,29 cm 1,30 cm 31 kg 0 0 0 0 1 0 2 0 3 0 32 kg 0 1 0 2 1 0 1 1 0 0 33 kg 1 1 0 1 1 0 0 1 1 0 34 kg 2 0 0 0 0 0 2 0 1 2 35 kg 0 1 0 0 0 0 1 1 1 1
Tal como se puede ver, en cada casilla se recoge el nmero de veces que se presenta conjuntamente cada par de valores (x,y).
Distribuciones Bidimensionales Distribuciones marginales Al analizar una distribucin bidimensional, uno puede centrar su estudio en el comportamiento de una de las variables, con independencia de como se comporta la otra. Estaramos as en el anlisis de una distribucin marginal.
ni = nij ; i =1...m
j =1
n
n j = nij ; j = 1..n
i =1
Distribuciones Bidimensionales Distribuciones marginales A partir del ejemplo anterior (pesos y medidas de los alumnos) vamos a estudiar sus distribuciones marginales.
Estatura / Peso 1,21 cm 1,22 cm 1,23 cm 1,24 cm 1,25 cm 1,26 cm 1,27 cm 1,28 cm 1,29 cm 1,30 cm 31 kg 0 0 0 0 1 0 2 0 3 0 6 32 kg 0 1 0 2 1 0 1 1 0 0 6 33 kg 1 1 0 1 1 0 0 1 1 0 6 34 kg 2 0 0 0 0 0 2 0 1 2 7 35 kg 0 1 0 0 0 0 1 1 1 1 5 3 3 0 3 3 0 6 3 6 3
30
Marginal de Y
Peso 31 32 33 34 35 Total ni 6 6 6 7 5 30
Correlacin Lineal.
Diagrama de dispersin o nube de puntos. Es la grfica de todos los pares ordenados de datos de dos variables que estn en un sistema de ejes coordenados. La variable de entrada, X, se grafica en el eje horizontal y la variable de salida, Y, se grfica en el eje vertical.
Diag. Dispersin 36 35 34 33 32 31 30 29 1,2 1,22 1,24 1,26 Estatura Peso 1,28 1,3 1,32
Correlacin Lineal. TIPOS DE DEPENDENCIA A PARTIR DE LA REPRESENTACIN GRFICA Uno de los objetivos de este tema es estudiar el tipo de dependencia que hay entre las dos caractersticas o variables estudiadas para un fenmeno en cuestin. " A mayor talla de una persona le corresponde mayor peso ? " A esta pregunta parece que se responde rpidamente que s. Cmo se observa en la nube de puntos este hecho?. Si los pares ordenados (x, y) tienden a seguir un patrn de lnea recta, se tiene una correlacin lineal. Esta correlacin puede ser positiva o negativa (relacin directa inversa). Si los datos forman una lnea horizontal o vertical, no hay correlacin, ya que una variable no afecta la otra.
Correlacin Lineal. Si los pares ordenados (x, y) tienden a seguir un patrn de lnea recta, se tiene una correlacin lineal. Esta correlacin puede ser positiva o negativa (relacin directa inversa). Si los datos forman una lnea horizontal o vertical, no hay correlacin, ya que una variable no afecta la otra.
Correlacin Lineal.
Diag. Dispersin 36 35 34 33 32 31 30 29 1,2 1,22 1,24 1,26 Estatura Peso 1,28 1,3 1,32
Correlacin Lineal. Covarianza La covarianza entre dos variables X e Y (COVxy), nos indica si la posible relacin es directa o inversa (favorable o no). Si COVxy >0 Si COVxy <0 Si COVxy = 0 Directa indirecta No hay relacin Incorrelacionadas
1)COVxy = 2)COVxy =
1 ( xi X )( yi Y ) n 1 ( xi yi ) ( X Y ) n
OBS: La covarianza, sin embargo, no permite tener una nocin del grado de asociacin ya que vara entre infinitos y + infinito y no hay modo de saber si es grande pequea.
1 COVxy = ( xi yi ) ( X Y ) n
Ejemplo Estudiamos la talla, medida en cm. y el peso, medido en kg. de un grupo de 10 personas, podemos obtener los siguientes valores:
160 55
165 58
168 58
170 61
171 67
175 62
175 66
180 74
180 79
182 83
Podemos llamar X a la talla e Y al peso con lo que se obtendra la variable bidimensional (X, Y) que toma 10 valores, que son las 10 parejas de valores de la tabla anterior: (160,55), (165,58), etc.
160
165
170
175
180
185
COVxy =
Ejemplo
TALLA (cm) PESO (kg)
1 ( xi yi ) ( X Y ) n
160 55
165 58
168 58
170 61
171 67
175 62
175 66
180 74
180 79
182 83
x = 172,6 y = 66,3
COVxy = 160 55 + 165 58 + 168 58 + 170 61 + 175 62 + 175 66 + 180 74 + 180 79 + 182 83 172,6 66,3 10
Correlacin Lineal. Coeficiente de Correlacin (r). El coeficiente de correlacin lineal (de Pearson) de dos variables, r, nos indica si los puntos tienen una tendencia a disponerse alineadamente (excluyendo rectas horizontales y verticales). El coeficiente de correlacin lineal, r, es la medida numrica de la intensidad de la relacin lineal entre dos variables. El coeficiente refleja la consistencia de efecto que el cambio en una variable tiene sobre otras. Tiene el mismo signo que COVxy por tanto de su signo obtenemos el que la posible relacin sea directa o inversa. r es til para determinar si hay relacin lineal entre dos variables, pero no servir para otro tipo de relaciones (cuadrtica, logartmica,...)
1)r =
COVxy S x SY
2) r =
COVxy VarxVarY
Propiedades de r: Es adimensional Slo toma valores en [-1,1] Las variables son incorreladas si r=0 Relacin lineal perfecta entre dos variables r=+1 o r=-1 Excluimos los casos de puntos alineados horiz. o verticalmente. Cuanto ms cerca est r de +1 o -1 mejor ser el grado de relacin lineal. Ej: si r=1
Correlaciones Positivas
Correlaciones Negativas
Correlacin Lineal. Recta de regresin Supongamos que en una variable bidimensional queremos precisar la relacin que existe entre las dos variables que la forman. Normalmente se elige como y la variable dependiente y como x la independiente. Si esa relacin se expresa mediante una funcin lineal del tipo y = ax + b, su grfica correspondera a una recta. En el caso que nos ocupa nos interesa la recta que mejor "se ajuste" a los puntos de la nube de la variable. Dicha recta se denomina: recta de regresin. Por un mtodo que se denomina de "mnimos cuadrados" y cuya concrecin no corresponde a este nivel de estudio, se deduce que la recta de regresin debe pasar por el punto correspondiente a las medias de ambas variables.
160
170
175
180
185
Si recordamos que entre la talla y el peso decamos que exista una dependencia directa, la recta de regresin lo confirma ya que su pendiente es positiva: a medida que aumenta la talla aumenta el peso. Por tanto:
De manera ms precisa, si conocemos la expresin de la recta de regresin, se pueden calcular valores para la variable y, conocidos los de x, como si se tratara de una funcin.
Correlacin Lineal. Ejemplo anterior: para una persona de 185 cm cul sera su peso en kg Funcin y = ax + b y = 1,2121x 142,91 y = 1,2121*185 142,91 y = 81,3285 Estimado Reemplazamos el valor de x =185 (conocido) en la funcin