Sie sind auf Seite 1von 19

ANALISIS DE REGRESIN Y CORRELACIN

CORRELACIN, estudia la relacin entre variables

Ej, La empresa TECNIsoft vende a travs de llamadas telefnicas en Quito,


Guayaquil y Cuenca,. Se desea saber si hay relacin entre el nmero de
llamadas para vender y el nmero de celulares vendidos en el mes. Su
gerente selecciono una muestra de 10 vendedores con las llamadas y
ventas que realizaron.

Parece haber una relacin entre el nmero de llamadas y las ventas, quien llamo
ms vendi ms, pero la relacin no es perfecta.
Ahora se realizara un anlisis de correlacin:

ANALISIS DE CORRELACIN, Grupo de tcnicas que mide la relacin


entre 2 variables.

Se reportar la asociacin entre las 2 variables y lo primero que se hace es trazar


los datos de un diagrama de dispersin. Se detecta cual vendedor hizo mas
llamada y las ventas o que tipo de variables son:
VARIABLE DEPENDIENTE, Es la variable que se predice o se estima (Y)
VARIABLE INDEPENDIENTE, proporciona la base para la estimacin (X)
COEFICIENTE DE CORRELACIN r, describe la fuerza de la relacin entre 2
conjuntos de variables en escala de intervalo o de razn:

r = 0,759

COEFICIENTE DE DETERMINACION r2, Proporcin de la variacin total en la


variable dependiente Y que se explica, o contabiliza, por la variacin en la variable
dependiente X.
Se calcula elevando al cuadrado el coeficiente de correlacin r2 = 0,576 que
representa una proporcin o porcentaje, 57,6% la variacin del nmero de
copiadoras, se explica por la variacin en el nmero de llamadas.
DEBER. Pag 466 y 467 ejercicio 1 al 6
COEFICIENTE DE DETERMINACIN, Proporcin de la variacin total en la variable
dependiente Y que se explica, o contabiliza, por la variacin en la variable dependiente X.

CORRELACIN CAUSA, si hay una relacin fuerte (sea 0,91) entre 2 variables,
es evidente que si se cambia una variable causa un cambio en otra variable. Ej.
Se puede observar que el consumo de pan en Quito y el consumo de pernil tiene
una correlacin muy fuerte. As como los ingresos de docentes y el ingreso de
pacientes al HCAM han aumentado en forma proporcional. Estas relaciones se
llaman correlaciones espurias. Cuando se tiene 2 variables con fuerte correlacin
es que hay una relacin o asociacin entre ambas variables y no hay un cambio
en una y este ocasiona un cambio en la otra.

PANADERIA LA UNION, realiza sus ventas en Quito, y anuncia en radio y Tv, quiere
analizar sus gastos en publicidad, relacionndolo al nivel de ventas, y tiene la siguiente
informacin:
a) Se quiere proyectar las ventas en base a los gastos
b) Trace un diagrama de dispersin
c) Interprete el coeficiente de correlacin
d) Determine el coeficiente de determinacin

ANALISIS DE REGRESIN, se elabora una ecuacin para expresar la relacin


lineal (recta) entre 2 variables y tambin estimar el valor de la variable
dependiente Y basado en la variable independiente X, esta accin se llama
anlisis de regresin.

Buscar una ecuacin lineal que exprese la relacin entre el nmero de llamadas y
el nmero de maquinas vendidas, significa encontrara una ecuacin de la recta
que estime en Y con base en X. y esta es la ecuacin de regresin.

ECUACIN DE REGRESION, es la ecuacin que expresa la relacin lineal entre las 2


variables de estudio.

PRINCIPIO DE LOS MINIMOS CUADRADOS, La grfica de la ecuacin de


regresin es resultado de un trazado de puntos y una lnea recta que
probablemente se ajustara a esos datos. Pero si se tiene un conjunto de rectas,
cada una representara un estimado distinto.
Si se emplea la recta de regresin con el mtodo matemtico llamado Principio de
los Mnimos Cuadrados, se elimina esta incertidumbre, y los proporciona una recta
que mejor se ajusta.

PRINCIPIO DE LOS MINIMOS CUADRADOS, se determina una ecuacin de regresin


cuando minimiza la suma de los cuadrados de las distancias verticales entre los valores
reales de Y y los valores pronosticados de Y.

Utilizamos la siguientes frmulas:


Ecuacin lineal general:

Pendiente de la Recta de Regresin:


Interseccin con el eje Y:

Donde:

Y = Variable dependiente
m = La pendiente de la recta
X = Variable independiente
b = Interseccin con Y
Sy =La Desviacin estndar de VD
Sx = La Desviacin estndar de VI
Y = Promedio de la VD
X = Promedio de la VI

PRUEBA AL COEFICIENTE DE CORRELACIN


En ele ejemplo de TECNIsoft, el coeficiente de correlacin es 0,759 indica una
asociacin muy fuerte, ero la muestra es de solo 10 vendedores, pero puede ser
que r = 0? Lo que significara que el 0,759 se deba a la casualidad, y la poblacin
es todo el personal de la empresa.
Para resolver esto hay que preguntarse si Puede haber una correlacin 0 entre la
poblacin de la cual se selecciono la muestra? O es lo mismo ?Proviene el valor r
calculado de una poblacin de observaciones pareadas con correlacin cero?.
Utilizar p (rho) es la correlacin entre la poblacin.

Ho: p = 0
H1: p 0
La prueba es de 2 colas

t=

Prueba t del coeficiente de

t n2
1r 2

correlacin

Con un nivel de significancia del 0,05 se tiene una regla de decisin cuando se
calcula t y es la siguiente:

Regin de
rechazo hay

Ho, no se
rechaza (No
hay

gl = n 2 = 10 2 = 8.

La Toma de decisin es

t=

t n2

1r

t=

0,759 102

10,7592

=3,297

El valor t calculado esta en la regin de rechazo, significa que la correlacin entre la


poblacin no es cero. Indica que hay una correlacin entre las llamadas y el nmero de
celulares vendidos en la poblacin de vendedores.
En trminos de valor p, que es la probabilidad de determinar un valor del estadstico de
prueba ms extremo que el calculado., cuando Ho es verdadero.

Valor p, consulte t en su tabla en la fila de 8 gl su valor estadstico es 3,297 con una


prueba de 2 colas. En una prueba de 2 colas con un nivel de significancia de 0,02 el valor
crtico es de 2,896 y el valor crtico de 0,01 es 3,355. Como 3,297 esta entre 2,896 y
3,355 se concluye que el valor p esta entre 0,01 y 0,02.
Deber ejercicios del 7 al 12.

PROBAR LA SIGNIFICANCIA DE LA PENDIENTE


Se debe analizar la ecuacin de regresin para saber si la pendiente es distinta de
cero, y esto es posible ya que se tiene la capacidad de predecir a la variable
dependiente por medio de su variable independiente, si no hay como demostrar,
no es til utilizar la variable independiente para predecir. Si no se demuestra que
la pendiente de la ecuacin es distinta de cero se podra utilizar la media de la
variable dependiente como factor de prediccin y no la ecuacin de regresin.
Entonces las hiptesis son:
Ho: = 0
H1: 0

La pendiente de la ecuacin de regresin de la poblacin es 0, si es


as, la recta de regresin es horizontal y no hay relacin entre la
variable independiente y dependiente. (El valor de la variable
dependiente, es el mismo para cualquier valor de la variable
independiente), esto no nos ayuda a calcular el valor de la variable

DONDE:
es la pendiente de la poblacin de la ecuacin de regresin
Se identifica el valor de la pendiente como m que calculada se basa en una
muestra y es una estimacin de la pendiente de la poblacin.

Si se rechaza la Hiptesis Nula entonces la pendiente de la recta de regresin de


la poblacin no es igual a 0.

En la presentacin anterior.
Primero se indica r = 0,7590 es el coeficiente de correlacin.
Segundo, Indica la Tabla ANOVA donde resume la informacin de regresin.
Tercero, Est la informacin necesaria para la prueba de Hiptesis respecto a la
pendiente de la recta, el valor de la pendiente es 1,18421 y la interseccin que es
18,9474. El error estndar o tpico es 0,35914 que es similar al error estndar de
la media e indica la variacin entre las medias muestrales y por ende la posible
variacin de los valores de la pendiente y de la interseccin

PRUEBA DE LA PENDIENTE:

t=

m0
sm

DONDE:
m es la estimacin de la pendiente de la recta de regresin, con informacin de la
muestra.
sb

error estndar de la estimacin de la pendiente, con informacin de la

muestra.
Paso 1, Establecer la Hiptesis Nula y alternativa:
Ho: 0
H1: > 0
La prueba es de una cola, si aceptamos Ho se dice que la pendiente de la recta
de regresin entre la poblacin podra ser 0. O que conocer el nmero de
llamadas que se hizo, no ayuda a predecir las ventas.

Si rechazamos H1, entonces la pendiente de la recta es mayor a 0, Entonces la


variable independiente es una ayuda para predecir la dependiente. O conocer el
nmero de llamadas ayudara a predecir las ventas. Se demostr tambin que la
pendiente de la recta es mayor a 0 (es +) que ms llamadas se traducen en mas
ventas de celulares.
gl = n 2 = 10 2 = 8
Con un = 0,05

t=

m0
sm =

1,184210
=3,297
0,35814

Entonces Ho se rechaza y se concluye que la recta de la pendiente es mayor a 0,


la variable independiente es til para pronosticar las ventas, es decir hacer
llamadas sirve para vender celulares.
La tabla nos ayuda a calcular el valor p, y apoya la decisin de rechazar Ho.

EVALUACION DE CAPACIDAD DE PREDICCION

EJERCICIO, Realizar un estudio de regresin y correlacin de las siguientes


variables en SPSS:

Primero necesitamos hacer un grfico de dispersin con los siguientes pasos:

Luego debemos realizar una anlisis ms detallado:


Probaremos que se trata de una distribucin normal, esto es con la prueba de
hiptesis siguiente:
Ho: Los datos de las variables siguen una distribucin normal.
H1: Los datos de las variables NO siguen una distribucin normal.
= 0,01
CONDICION
Si p < 0,01 Rechaza Ho
Si p > 0,01 Acepta Ho
Hacemos los siguientes pasos para analizar esto:

Como:
Si p > 0,01 Acepta Ho
Entonces se acepta Ho y procedemos a trabajar con una estadstica paramtrica.

Analizamos R cuadrado, que expresa la proporcin de varianza de la variable


dependiente que esta explicada por la variable independiente, El Coeficiente de
determinacin toma un valor alto e indica que el 27,2% de la variacin de la
ganancia de peso esta explicada por la cantidad de nutriente X.
Analizamos R.

R cuadrado ajustado, ser sustancialmente ms bajo que R2.


El Error estndar de la estimacin, representa una medida de la parte de
variabilidad de la variable dependiente que no es explicada por la recta de
regresin. En general, cuanto mejor es el ajuste, ms pequeo es este error
estndar.

Aqu se analiza el valor F y el grado de significancia. El estadstico F permite


contrastar Ho de que el valor poblacional de R es 0, lo cual en el modelo de
regresin simple, equivale a contrastar la hiptesis de que la pendiente de la recta
de regresin vale 0. El nivel de significancia indica que si suponemos que el valor
poblacional de R es 0 es improbable (probabilidad = 0,0269) que R. en esta
muestra tome el valor 0,522. Esto implica que R es mayor a 0 entonces ambas
variables estn relacionadas.

Ho: R = 0
H1: R > 0
Como p = 0,026 y es < que 0,05 entonces Ho se rechaza y se acepta H1, lo que
se concluye que las variables estn linealmente relacionadas.

Ahora vamos a analizar la constante y la pendiente:


Esto nos indica la siguiente ecuacin:
Pronstico de ganancia de peso = - 14,044 + 0,222 nutriente X

Se realizo un estudio de correlacin y regresin comparado las tallas de 10 padres


y sus hijos:

Que talla esperara un hijo de que padre que tiene 180 cm?
Y = mX + b
Y = 0,869X + 22,174
Como X = 180 cm.
Y = 0,869(180) + 22,174= 176,94

Das könnte Ihnen auch gefallen