Sie sind auf Seite 1von 3

CORRELACION GRADUAL Al utilizar valores mustrales precisos, o cuando la precisin no puede obtenerse, los datos pueden clasificarse en orden

de tamao, importancia, etc., empleando los nmeros 1,2, . . . n. Si dos conjuntos correspondientes de valores x, y se clasifican de tal forma, el coeficiente de correlacin gradual, denotada por rgrad o sencillamente r, est dado por:

Donde d : diferencias entre las clasificaciones de los correspondientes x, y. n : nmero de pares de valores (x, y) en los datos. Ejercicio: l0 trabajadores fueron clasificados segn su rendimiento en la planta externa y los cursos realizados de cierta compaa de telefona pblica. Hallar el coeficiente de correlacin gradual.

Planta 7 Externa Cursos 8

5 4

4 5

8 7

3 5

10 5

1 2

5 4

4 6

1 2

La diferencia de puntuaciones d en planta externa y la oficina para cada trabajador se da en la tabla siguiente. Tambin se incluyen d2 y d2. Diferencias 1 de puntuaciones, d D2 1 -1 1 -1 2 5 1 -1 2 1 d2.=

43 1 1 1 4 25 1 1 4 4

Indicando que hay una relacin entre el rendimiento en planta externa y los cursos.

INTERPRETACION PROBABILISTICA DE LA REGRESION Un diagrama de dispersin, es una representacin grfica de los puntos de datos para una muestra particular. Al escoger una muestra diferente, o aumentar la original, un diagrama de dispersin algo diferente se obtendra generalmente. Cada diagrama de dispersin resultara en una recta o curva de regresin diferente, aunque esperamos que las diferencias no sean significantes si las muestras se extraen de la misma poblacin. Del concepto de curva de ajuste en muestras pasamos al de curva de ajuste para la poblacin de donde se tomaron las muestras. La dispersin de puntos alrededor de una recta o curva de regresin indican que para un valor particular de x hay realmente varios valores de y distribuidos alrededor de la recta o curva Esta idea de distribucin nos conduce naturalmente a la realizacin de que hay una conexin entre curva de ajuste y probabilidad. La conexin se implementa introduciendo las variables aleatorias X, Y que toman los diferentes valores mustrales X, y respectivamente. Por ejemplo X, Y pueden representar las estaturas y pesos de adultos en una poblacin de la cual se extraen las muestras. Entonces se supone que X, Y tienen una funcin de probabilidad conjunta o funcin de densidad, f(x, y), segn si se consideran discretas o continuas. Dada la funcin de densidad conjunta o funcin de probabilidad, f(x, y), de dos variables aleatorias X, Y, es lgico de las anotaciones anteriores preguntar si hay una funcin g(X) taI que: { }

Una curva con ecuacin y = g(X) se llama curva de regresin de mnimos cuadrados de Y sobre X. Tenemos el teorema siguiente: TEOREMA 1: Si X, Y son variables aleatorias con funcin de densidad conjunta o funcin de probabilidad f(x, y), entonces existe una curva de regresin de mnimos cuadrados de Y sobre X , dada por: Siempre y cuando X, Y tengan una varianza finita.

Otro caso se presenta cuando la distribucin conjunta es la distribucin normal bidimensional. Entonces tenemos el teorema siguiente:

TEOREMA 2: Si X, y son variables aleatorias con la distribucin normal bidimensional, entonces la curva de regresin de mnimos cuadrados de Y sobre X es una recta de regresin dada por: ( Dnde: )

Representa el coeficiente de correlacin poblacional. INTERPRETACION PROBABILISTICA DE LA CORRELACION Un coeficiente de relacin poblacional debe dar una medida de que tan bien una curva de regresin poblacional dada se ajusta a los datos poblacionales. Todas las anotaciones previamente enunciadas para la correlacin en una muestra se aplican a la poblacin, por ejemplo:

Donde Yest =g(x) y = E(y), Las tres cantidades) se llaman las variaciones total, no explicada y explicada respectivamente. Esto conduce a la definicin del coeficiente de correlacin poblacional p, donde: CORRELACION Y DEPENDENCIA Si dos variables aleatorias X, Y tienen un coeficiente de correlacin diferente a cero, sabemos que son dependientes en el sentido de probabilidad (esto es, su distribucin conjunta no se factoriza en sus distribuciones marginales). Adems, cuando p 0, podemos utilizar una ecuacin pata predecir el valor de Y a partir del valor de X. EJEMPLO 1. Sean X, Y variables aleatorias que representan estaturas y pesos de individuos. Aqu hay una independencia directa entre X y Y. EJEMPLO 2. Si X representa los salarios anuales de los carpinteros en tanto que Y representa la cantidad de crmenes, el coeficiente de correlacin puede ser diferente de cero y podramos hallar una ecuacin de regresin prediciendo una variable de la otra, Pero difcilmente diramos que hay interdependencia directa entre X y Y.

Das könnte Ihnen auch gefallen