You are on page 1of 32

ANALISIS DE REGRESION Y

CORRELACION
Introduccin

El vicepresidente de una gran compaa


opina que las ganancias anuales de la
empresa dependen de la cantidad
gastada en investigacin y desarrollo. El
presidente de la compaa no est de
acuerdo y ha solicitado pruebas.
Qu herramienta puede presentar el
vicepresidente que sustenten su teora?
Qu variables tendr que medir?
Qu ecuacin ayudar a predecir las
ganancias anuales en funcin de la cantidad
presupuestada en I y D?
Ser esta ecuacin lineal o no lineal?
Qu precisin se puede esperar al usar esta
herramienta de toma de decisiones?
A continuacin se presentan datos de 11 aos

Gasto en I y D Ganancia
Ao (ciento de anual
miles ) (millones)
50
1999 2 20 40
2000 4 25 30
20
2001 5 34
10
2002 4 30 0
0 2 4 6 8 10
2003 6 33
2004 5 34
2005 5 36 Una lnea recta podra ser lo
2006 7 35 ms adecuado para relacionar
2007 8 40 estas variables?
2008 7 37
2009 8 41
ANALISIS DE REGRESION

El trmino regresin fue utilizada por primera


vez por FRANCIS GALTON (18221911) en sus
estudios biolgicos sobre la herencia.

GALTON manifest que: la estatura de los


hijos de padres inusualmente altos o
inusualmente bajos, tienden a moverse o
regresar a la estatura promedio de la
poblacin.
I. DEFINICIN:
Es una tcnica estadstica que sirve para
analizar la dependencia de una variable
respecto a otra variable, es decir,
conociendo los valores de una variable
independiente se trata de estimar los
valores de una variable dependiente.
II. FUNCIONES DEL ANLISIS DE REGRESIN:
Las funciones que persigue el Anlisis de Regresin son:

1. Determinar si las variables independientes y la variable


dependiente presentan fuerzas de relacin.
2. Determinar la estructura o la ecuacin matemtica que
relaciona las variables independientes con las
dependientes.
3. Pronosticar o predecir los valores de la variable
dependiente en funcin de la variable independiente.
4. Controlar otras variables independientes al evaluar las
contribuciones de una variable especifica o un conjunto
de variables
III. TIPOS DE REGRESIN:
TIPO Ecuacin
Simple Y 0 1 X
REGRESIN LINEAL
Mltiple Y 0 1 X 1 ... N X N

Potencia Y 0 X 1

Exponencial Y 0 1
X
REGRESIN NO
LINEAL Hiperblico 1
Y 0
X
IV. DIAGRAMA DE DISPERSIN

Es el primer paso a realizar para determinar si


existe una relacin entre dos variables.
Este grafico consiste en un conjunto de puntos
(x, y) presentados en un plano cartesiano.
Este diagrama permite visualizar el patrn de
comportamiento de estas variables y por ende
conocer la ecuacin de regresin que
describen dichos datos.
Nubes de Puntos- Dispersin-
Esparcimiento
Sea un conjunto de pares de valores de las variables X e Y. Si los
representamos en un diagrama de dispersin obtendremos una nube de
puntos que nos dar una idea grfica de la posible correlacin entre ambas
variables.
Y Y Y

X X X

No hay relacin Relacin positiva Relacin negativa


ALGUNOS CASOS :
Anlisis de Regresin Lineal Simple

Qu es el anlisis de
regresin lineal ?

Es modelar la dependencia de la variable Y en


funcin de la variable X a travs de la ecuacin de
una recta.

Yi 0 1 X i ei i=1, 2, , n

Error ~ NID(0,2)
Parmetros Variable
Variable
predictora
dependiente
(independiente)
V. ECUACION DE REGRESIN

Si la variable respuesta o variable dependiente (Y) est en relacin


con la variable independiente (X), entonces la relacin funcional o
ecuacin de regresin entre Y y X tienen la siguiente forma:

Y 0 1 X Ecuacin de regresin poblacional

Y 0 1 X Ecuacin de regresin muestral

Donde:

Y = Variable dependiente X= Variable independiente


0 1
= Parmetros de la ecuacin
CMO SE INTERPRETAN LOS
PARMETROS
Se interpretan como:
0
es el valor estimado de la variable Y cuando la
variable X = 0

1es el coeficiente de regresin que est expresado en


las mismas unidades de Y por cada unidad de X.

Indica el nmero de unidades en que vara Y cuando se


produce un cambio en una unidad en X.
VI. ESTIMACIN DE LOS COEFICIENTES DE REGRESIN

Para estimar los coeficientes de la ecuacin de regresin,


se utiliza el Mtodo de los Mnimos Cuadrados
Ordinarios (MMCO).

Este Mtodo trata de encontrar las coeficientes de la


ecuacin que ms se aproxime al conjunto de datos, es
decir, encuentra la ecuacin de la recta de tal manera
que los errores que se forman sean los ms pequeos
posibles.
Para estimar estos coeficientes de regresin ,
primeramente se deben construir las
ecuaciones normales que son las siguientes:
n n

Y
i 1
n 0 1 X
i 1

n n n

YX 0 X 1 X
2

i 1 i 1 i 1
Al resolver este sistema de ecuaciones normales obtenemos las siguientes
formulas:

n n n O TAMBIEN PUEDE UTILIZAR


n XY X Y _ _

1 i 1
n
i 1
n
i 1
1 XY n X Y
n X ( X )
2 2 _

i 1 i 1
X nX
2 2

0 y 1 x

Luego se sustituyen los valores en la ecuacin de la recta para obtener la


ecuacin estimada o predicha por el MMCO.
ANALISIS DE CORRELACIN

El anlisis de correlacin es una tcnica


estadstica que mide el grado de asociacin o
afinidad entre las variables cuantitativas
consideradas en un estudio.
El COEFICIENTE DE CORRELACION DE
PEARSON
Es el estadgrafo que mide el grado de
asociacin o afinidad entre las variables
cuantitativas y se denota por r la cual se
define como: n n n
n XY X Y
r n
i 1
n
i 1
n
i 1
n
n X ( X )
2 2
n Y ( Y ) 2 2

i 1 i 1 i 1 i 1
El COEFICIENTE DE CORRELACION: r Mide el grado de asociacin o afinidad entre
las variables
Interpretacin:

-1 -0.7 -0.4 0 0.4 0.7 +1


Perfecta Perfecta

Alta Regular Baja Baja Regular Alta

NEGATIVA POSITIVA
COEFICIENTE DE DETERMINACIN
El coeficiente de determinacin mide el
porcentaje de variabilidad en Y que puede ser
explicada por la variable independiente X.
Se denota por R2 o r2

0 Y 1 XY nY
2

r
2

Y nY
2 2
INTERPRETACION:

Si r2 0.70, la ecuacin estimada se ajusta o


tiende a representar los datos.

Si r2 = 1, la ecuacin estimada es perfecta.


EJERCICIOS DE APLICACIN:

EJEMPLO 1:
Se tienen informacin de los costos de mantenimiento de 06
maquinas llenadotas de gaseosas de distintas edades de la
Empresa Enrique Cassinelli e Hijos S.A. La Gerencia desea hacer
estimaciones o pronsticos acerca del costo de mantenimiento
(Y) en funcin del tiempo operativo de la mquina (X). La
informacin que se tienen es la siguiente:
Maquina 1 2 3 4 5 6

Tiempo operativo en
1 1 2 2 3 3
Aos (X)
Costo de
30 40 70 80 100 100
mantenimiento $ (Y)

1. Determinar la ecuacin de regresin. Interpretar sus


coeficientes
2. Pronosticar el costo de mantenimiento para una mquina
que tienen 4 aos operativos.
3. Hallar el error estndar de estimacin.
SOLUCIN
GRAFICAR PARA CONOCER LA TENDENCIA DE
DATOS
120

Diagrama de Dispersion
100
Costo de mantenimiento $

80

y = 32.5x + 5
60
R = 0.9602

40

20

0
0 0.5 1 1.5 2 2.5 3 3.5
Tempo operativo en aos
1.- Determinacin de la Ecuacin de Regresin:

MAQUINA X Y XY X*X Y*Y


1 1 30 30 1 900
2 1 40 40 1 1600
3 2 70 140 4 4900
4 2 80 160 4 6400
5 3 100 300 9 10000
6 3 100 300 9 10000
TOTAL 12 420 970 28 33800
Calculando los coeficientes de regresin:

n n n
n XY X Y
6(970) (12)( 420)
1 i 1
n
i 1
n
i 1
6(28) (12) 2 32.5
n X 2 ( X ) 2
i 1 i 1

0 y 1 x = 70 (32.5 (2)) = 5
Por lo tanto la ecuacin de regresin es:

Y = 5 + 32.5 X

Interpretacin:
0 = 5: Cuando la mquina no tienen ningn ao de
funcionamiento su costo de mantenimiento es de 5
dlares.
1 = 32.5: Por cada ao de funcionamiento de la
maquina su costo de mantenimiento aumenta en
32.5 dlares.
2 . Pronostico cuando la mquina tienen 4 aos
de funcionamiento:

Y=5+32.5*4=135, que significa, que el costo de


mantenimiento para la maquina si tiene 4
aos de funcionamiento es de 135$.
EJEMPLO 2:
El dueo de una licorera est interesado en medir el efecto del
precio de las botellas de whisky escocs sobre la cantidad vendida.
Los resultados de la tabla adjunta se obtuvieron de una muestra
aleatoria de las ventas de ocho semanas. El precio est medido en
dlares y las ventas en cajas:

PRECIO 192 205 197 213 208 199 178 172


VENTAS 25 14 18 12 11 15 29 35

A. Estimar la recta de regresin


para las ventas.
B. Estimar cunto ser la cantidad
vendida si el precio de la caja es
de 200 dlares.
Resolviendo:

Precio Ventas XY X2 Y2
192 25
205 14
197 18
213 12
208 11
199 15
178 29
172 35
Totales
Reemplazando los valores tenemos:
n8
_
X 1564 / 8 195.5
_
Y 159 / 8 19.875
_ _

b XY n X Y 30227 8 195.5 19.875


0.5963
_
307200 8 195.5 2

X nX 2 2

_ _
a Y b X 19.875 (0.5963) 195.5 136.4545

Y 136.4545 0.5963x

Por cada dlar que incrementa el precio de la botella de


whisky las ventas disminuye en 0.5963 cajas.