Sie sind auf Seite 1von 14

REGRESIN Y CORRELACIN

I. INTRODUCCIN

A continuacin, desarrollare el grado de relacin entre dos o


mas variables en lo que llamaremos anlisis de correlacin, para representar
esta relacin utilizaremos una representacin grfica llamada diagrama de
dispersin, estudiaremos un modelo matemtico para estimar el valor de una
variable basndonos en el valor de otra, en lo que llamaremos anlisis de
regresin. Y, finalmente desarrollaremos tres ejercicios aplicados a lo
aprendido, donde utilizaremos datos verdaderos de una empresa de servicios
tursticos.

II. OBJETIVOS

Aprender a calcular la correlacin entre dos variables.


Saber dibujar un diagrama de dispersin.
Representar la recta que define la relacin lineal entre dos variables.
Saber estimar la recta de regresin por el mtodo de mnimos.
cuadrados e interpretar su ajuste.
Realizar inferencia sobre los parmetros de la recta de regresin.

III. MARCO TERICO

A. DEFINICIN DE CORRELACIN LINEAL

En ocasiones nos puede interesar estudiar si existe o no algn tipo


de relacin entre dos variables aleatorias. As, por ejemplo, podemos
preguntarnos si hay alguna relacin entre las notas de la asignatura
Estadstica I y las de Matemticas I. Una primera aproximacin al
problema consistira en dibujar en el plano R2 un punto por cada alumno: la
primera coordenada de cada punto sera su nota en estadstica, mientras
que la segunda sera su nota en matemticas. As, obtendramos una nube
de puntos la cual podra indicarnos visualmente la existencia o no de algn tipo
de relacin (lineal, parablica, exponencial, etc.) entre ambas notas.

Otro ejemplo, consistira en analizar la facturacin de una empresa en un


periodo de tiempo dado y de cmo influyen los gastos de promocin y
publicidad en dicha facturacin. Si consideramos un periodo de tiempo de 10
aos, una posible representacin sera situar un punto por cada ao de forma
que la primera coordenada de cada punto sera la cantidad en euros invertidos
en publicidad, mientras que la segunda sera la cantidad en euros obtenidos de
su facturacin. De esta manera, obtendramos una nube de puntos que nos
indicara el tipo de relacin existente entre ambas variables.
En particular, nos interesa cuantificar la intensidad de la relacin lineal
entre dos variables. El parmetro que nos da tal cuantificacin es el coeficiente
de correlacin lineal de Pearson r, cuyo valor oscila entre 1 y +1:
Como se observa en los diagramas anteriores, el valor de r se aproxima
a +1 cuando la correlacin tiende a ser lineal directa (mayores valores de X
significan mayores valores de Y), y se aproxima a 1 cuando la correlacin
tiende a ser lineal inversa.

Es importante notar que la existencia de correlacin entre variables no


implica causalidad. Atencin!: si no hay correlacin de ningn tipo entre dos
v.a., entonces tampoco habr correlacin lineal, por lo que r = 0. Sin embargo,
el que ocurra r = 0 slo nos dice que no hay correlacin lineal, pero puede que
la haya de otro tipo.

El siguiente diagrama resume los anlisis del coeficiente de correlacin


entre dos variables:
a) TIPOS DE CORRELACIN

1. Correlacin Directa

La correlacin directa se da cuando al aumentar una de las variables la


otra aumenta. La recta correspondiente a la nube de puntos de la distribucin
es una recta creciente.

2. Correlacin Inversa

La correlacin inversa se da cuando al aumentar una de las variables la otra


disminuye. La recta correspondiente a la nube de puntos de la distribucin es
una recta decreciente.
3. Correlacin nula

La correlacin nula se da cuando no hay dependencia de ningn tipo


entre las variables. En este caso se dice que las variables son incorreladas y la
nube de puntos tiene una forma redondeada.

b) GRADO DE CORRELACIN

El grado de correlacin indica la proximidad que hay entre los puntos de


la nube de puntos. Se pueden dar tres tipos:

1. Correlacin fuerte

La correlacin ser fuerte cuanto ms cerca est los puntos de la recta.

2. Correlacin dbil

La correlacin ser dbil cuanto ms separados estn los puntos de la recta.


c) COEFICIENTE DE CORRELACIN LINEAL

El coeficiente de correlacin lineal es el cociente entre la covarianza y el


producto de las desviaciones tpicas de ambas variables. El coeficiente de
correlacin lineal se expresa mediante la letra r.

d) PROPIEDADES

El coeficiente de correlacin no vara al hacerlo la escala de medicin.


Es decir, si expresamos la altura en metros o en centmetros el
coeficiente de correlacin no vara.
El signo del coeficiente de correlacin es el mismo que el de
la covarianza.
Si la covarianza es positiva, la correlacin es directa.
Si la covarianza es negativa, la correlacin es inversa.
Si la covarianza es nula, no existe correlacin.
El coeficiente de correlacin lineal es un nmero real comprendido entre
1 y 1.

1 r 1

Si el coeficiente de correlacin lineal toma valores cercanos a 1 la


correlacin es fuerte e inversa, y ser tanto ms fuerte cuanto ms se
aproxime r a 1.
Si el coeficiente de correlacin lineal toma valores cercanos a 1 la
correlacin es fuerte y directa, y ser tanto ms fuerte cuanto ms se
aproxime r a 1.
Si el coeficiente de correlacin lineal toma valores cercanos a 0, la
correlacin es dbil.
Si r = 1 1, los puntos de la nube estn sobre la recta creciente o
decreciente. Entre ambas variables hay dependencia funcional.

e) ANLISIS DE CORRELACIN. Es el conjunto de tcnicas estadsticas


empleado para medir la intensidad de la asociacin entre dos variables.

El principal objetivo del anlisis de correlacin consiste en


determinar que tan intensa es la relacin entre dos variables.
Normalmente, el primer paso es mostrar los datos en un diagrama de
dispersin.
1. Diagrama de Dispersin. es aquel grafico que representa la relacin
entre dos variables.
2. Variable Dependiente. es la variable que se predice o calcula. Cuya
representacin es Y
3. Variable Independiente. es la variable que proporciona las bases para
el calculo. Cuya representacin es: X1, X2, X3......
4. Coeficiente de Correlacin. Describe la intensidad de la relacin entre
dos conjuntos de variables de nivel de intervalo. Es la medida de la
intensidad de la relacin lineal entre dos variables.
El valor del coeficiente de correlacin puede tomar valores desde
menos uno hasta uno, indicando que mientras ms cercano a uno sea el
valor del coeficiente de correlacin, en cualquier direccin, ms fuerte
ser la asociacin lineal entre las dos variables. Mientras ms cercano a
cero sea el coeficiente de correlacin indicar que ms dbil es la
asociacin entre ambas variables. Si es igual a cero se concluir que no
existe relacin lineal alguna entre ambas variables.

Ejemplos:

Las notas de 12 alumnos de una clase en Matemticas y Fsica son las


siguientes:

Matemticas 2 3 4 4 5 6 6 7 7 8 10 10

Fsica 1 3 2 4 4 4 6 4 6 7 9 10

Hallar el coeficiente de correlacin de la distribucin e interpretarlo.

xi yi xi yi xi2 yi2
2 1 2 4 1
3 3 9 9 9
4 2 8 16 4
4 4 16 16 16
5 4 20 25 16
6 4 24 36 16
6 6 36 36 36
7 4 28 49 16
7 6 42 49 36
8 7 56 64 49
10 9 90 100 81
10 10 100 100 100
72 60 431 504 380
1 Hallamos las medias aritmticas.

2 Calculamos la covarianza.

3 Calculamos las desviaciones tpicas.

4 Aplicamos la frmula del coeficiente de correlacin lineal.

Al ser el coeficiente de correlacin positivo, la correlacin es directa.

Como coeficiente de correlacin est muy prximo a 1 la correlacin es muy


fuerte.

Los valores de dos variables X e Y se distribuyen segn la tabla siguiente:

Y/X 0 2 4
1 2 1 3
2 1 4 2
3 2 5 0

Determinar el coeficiente de correlacin.

Convertimos la tabla de doble entrada en tabla simple.

xi yi fi xi fi xi2 fi yi fi yi2 fi xi yi fi
0 1 2 0 0 2 2 0
0 2 1 0 0 2 4 0
0 3 2 0 0 6 18 0
2 1 1 2 4 1 1 2
2 2 4 8 16 8 16 16
2 3 5 10 20 15 45 30
4 1 3 12 48 3 3 12
4 2 2 8 32 4 8 16
20 40 120 41 97 76
Al ser el coeficiente de correlacin negativo, la correlacin es inversa.

Como coeficiente de correlacin est muy prximo a 0 la correlacin es muy


dbil.

B. DEFINICIN Y CARACTERSTICAS DEL CONCEPTO DE


REGRESIN LINEAL.

En aquellos casos en que el coeficiente de regresin lineal sea cercano


a +1 o a 1, tiene sentido considerar la ecuacin de la recta que mejor se
ajuste a la nube de puntos (recta de mnimos cuadrados). Uno de los
principales usos de dicha recta ser el de predecir o estimar los valores de Y
que obtendramos para distintos valores de X. Estos conceptos quedarn
representados en lo que llamamos diagrama de dispersin:
La ecuacin de la recta de mnimos cuadrados (en forma punto
pendiente) es la siguiente:

a) REGRESIN LINEAL

Expresndolo en forma simple, la regresin lineal es una tcnica que


permite cuantificar la relacin que puede ser observada cuando se grafica un
diagrama de puntos dispersos correspondientes a dos variables, cuya
tendencia general es rectilnea (Figura la); relacin que cabe compendiar
mediante una ecuacin del mejor ajuste de la forma:

y = a + bx

En esta ecuacin, y representa los valores de la coordenada a lo largo


del eje vertical en el grfico (ordenada); en tanto que x indica la magnitud de
la coordenada sobre el eje horizontal (absisa). El valor de a (que puede ser
negativo, positivo o igual a cero) es llamado el intercepto; en tanto que el valor
de b (el cual puede ser negativo o positivo) se denomina la pendiente
o coeficiente de regresin.

Serie de datos para el clculo de una regresin (a y b) y del


coeficiente de correlacin (r)
Nmero Valores de Valores de Nmero Valores de Valores de
x y x y
1 9,0 0,50 7 6,7 1,00
2 9,4 0,50 8 8,4 0,50
3 7,4 1,23 9 8,0 0,50
4 9,7 1,00 10 10,0 0,50
5 10,4 0,30 11 9,2 0,50
6 5,0 1,50 12 6,2 1,00
13 7,7 0,50

El procedimiento para obtener valores de a y b para una serie de


pares de datos de x y de y (tal como la presentada en la Figura 1 y/o en la
Tabla 1) es como sigue:

Paso 1 Calcule, para cada par de valores de x e y, las cantidades x, y,


y x.y.

Paso 2 Obtenga las sumas () de estos valores para todos los pares de datos
de x e y, as como las sumas del total de los valores de x e y. Los
resultados de los Pasos 1 y 2 aparecern en forma similar a la
siguiente:

Nmero de pares de x x y y x.y


datos
1
2
3



n
Monto de las sumas x x y y xy

Paso 3 Estime la pendiente (b) por medio de la relacin:

Paso 4 Estime el intercepto (a) por medio de la relacin:

A partir de esos valores de a y de b obtenidos mediante las


Ecuaciones 2 y 3, es posible trazar a lo largo de los puntos dispersos de un
grfico la lnea recta mejor ajustada a los mismos, y verificar visualmente si
tales puntos estn bien expresados por la lnea

Anlisis de regresin. Es la tcnica empleada para desarrollar la ecuacin y


dar las estimaciones.

Ecuacin de Regresin. es una ecuacin que define la relacin lineal entre


dos variables.

Ecuacin de regresin Lineal: Y = a + Bx

Ecuacin de regresin Lineal Mltiple: Y = a + b1x1 + b2x2 + b2x2


Principio de Mnimos Cuadrados. Es la tcnica empleada para obtener la
ecuacin de regresin, minimizando la suma de los cuadrados de las distancias
verticales entre los valores verdaderos de Y y los valores pronosticados Y.

Anlisis de regresin y Correlacin Mltiple. Consiste en estimar una


variable dependiente, utilizando dos o ms variables independientes.

Ecuacin de regresin Mltiple. La forma general de la ecuacin de regresin


mltiple con dos variables independientes es:

Ejemplo:

Las notas de 12 alumnos de una clase en Matemticas y Fsica son las


siguientes:

Matemticas 2 3 4 4 5 6 6 7 7 8 10 10

Fsica 1 3 2 4 4 4 6 4 6 7 9 10

Hallar las rectas de regresin y representarlas.

xi yi xi yi xi2 yi2
2 1 2 4 1
3 3 9 9 9
4 2 8 16 4
4 4 16 16 16
5 4 20 25 16
6 4 24 36 16
6 6 36 36 36
7 4 28 49 16
7 6 42 49 36
8 7 56 64 49
10 9 90 100 81
10 10 100 100 100
72 60 431 504 380

1 Hallamos las medias arimticas.

2 Calculamos la covarianza.

3 Calculamos las varianzas.


4Recta de regresin de Y sobre X.

4Recta de regresin de X sobre Y.


BIBLIOGRAFIA

http://www.monografias.com/trabajos82/regresion-y-correlacion-lineal/regresion-y-
correlacion-lineal.shtml

http://www.vitutor.com/estadistica/bi/correlaci%C3%B3n_regresion.html

http://recursostic.educacion.es/descartes/web/materiales_didacticos/Correlacion_regresion_r
ecta_regresion/correlacion_y_regresion.htm

http://html.rincondelvago.com/regresion-y-correlacion.html

Das könnte Ihnen auch gefallen