Sie sind auf Seite 1von 24

ESTADSTICA APLICADA

REGRESIN LINEAL SIMPLE


MACHICAO BEJAR NILTON
PLAN DE CLASE
COMPETENCIAS

Al termino de la sesin, el
estudiante estar en capacidad de:
Calcular el coeficiente de
correlacin lineal entre una variable
dependiente y una independiente.
Calcular la ecuacin que mejor se
ajusta a un conjunto de datos, y que
permite hacer pronsticos.
SUPUESTO BSICO

La relacin entre la
variable dependiente (y) y
la variable independiente
(x) es aproximadamente
una lnea recta.
4
DIAGRAMA DE DISPERSIN
RECTA DE AJUSTE

observamos:
- tendencia negativa
- puntos dispersados alrededor de la lnea
ANLISIS DE CORRELACIN

Es una tcnica estadstica empleada para


medir la intensidad de la relacin
(correlacin) entre dos variables. Se toma el
supuesto que las variables en estudio son
aleatorias. La correlacin se mide con el
coeficiente de correlacin.
COEFICIENTE DE CORRELACIN (r)

Mide el grado de relacin lineal entre dos variables


y esta definida por:

SP ( XY )
r ; donde : 1 r 1
SC ( X ).SC (Y )
Adems, si:
r = -1, la relacin es perfecta e indirecta.
r = 0, no hay relacin lineal.
r = 1, la relacin es perfecta y directa.
ANLISIS DE REGRESIN

Es una tcnica estadstica que nos permite


hallar una ecuacin que exprese la relacin
funcional o dependencia de una variable
(conocida como variable dependiente) con otra
variable (conocida como variable
independiente): El objetivo es realizar
predicciones de la variable dependiente
respecto a la variable independiente utilizando
una ecuacin, conocida como ecuacin de
regresin.
REGRESIN LINEAL SIMPLE
Permite describir la relacin (a travs de una funcin
lineal - recta) entre dos variables: una independiente X y
otra dependiente Y.
La recta se estima de la siguiente manera:

Y b0 b1 X ........Recta de Regresin
SP( XY )
Donde : b1 bo y b1 x
SC ( X )
Donde:
El coeficiente de regresin: b1 es el cambio (aumento o
disminucin) en promedio en Y cuando X vara en una
unidad.
FORMULAS:

SC ( X ) x nx
2 2

SC (Y ) y n y
2 2

SP ( XY ) xy nx y
EJERCICIO RESUELTO 1
Se quiere saber si el ingreso y el gasto de las
familias de cierto distrito estn relacionadas o
no. Para esto, se toma una muestra aleatoria de
10 familias y se registran sus ingresos y gastos
(en miles de soles). Los datos son:

Ingresos 3,4 1,9 6,4 5,56 2,5 3,59 1,5 4,57 4,3 2,9
Gastos 3 1,6 5,87 4,6 2 3,67 1,25 4,5 4 2,7
Calcule la ecuacin de regresin.

SP(XY) 142.0293 - 10x3.662x3.319


b1 = = = 0.9264
2
SC(X) 156.2166 - 10x3.662

bo = y - b1x = 3.319 - 0.9264x3.662 = -0.0735

y = b0 + b1x = -0.0735 + 0.9264x

Interpretacin del coeficiente de regresin


Si el ingreso de una familia aumenta en mil soles, en
promedio el gasto aumentar en 926.4 soles
COEFICIENTE DE DETERMINACIN (R2)
Mide el porcentaje de variacin de la variable Y
(dependiente) explicado por X (variable
independiente).

SC Re g b1SP( XY ) 2
R 2
r
SC (Y ) SC (Y )
PRUEBA DE SIGNIFICANCIA DEL MODELO

Es el modelo significativo?
X influye en Y?
Pasos para la prueba de hiptesis:
1. Plantear las hiptesis
Ho : 1 = 0 ...El modelo no es significativo
H1 : 1 0... El modelo es significativo

2. Nivel de significancia
3. Estadstico de prueba:
b1 se
tc : tn 2 ; donde : Sb 1
Sb 1 SC ( X )

y se
b0 Y b1 XY
Y 2

n2
4. Criterio de Decisin:
Si ttab tc ttab, entonces no se rechaza H0
5. Conclusin
Primero se escribe una conclusin general con su respectivo
nivel de significacin y luego la conclusin de acuerdo al caso.
EJERCICIO RESUELTO 2
Se supone que se puede establecer cierta relacin lineal entre las
exportaciones de un pas y la produccin interna de dicho pas. Si para
un pas cualquiera, tenemos los siguientes datos anuales (expresados
en miles de millones):

Aos Produccin (X) Exportaciones


(Y)
2007 50 9.5
2008 54 12.1
2009 57 14.2
2010 63 17.3
2011 65 19.1
b) Es posible afirmar que si la produccin se incrementa en una unidad, las
exportaciones se incrementan, en promedio, en ms de 0.68 unidades.
Sustente su respuesta.
Falso. Si la produccin se incrementa en una unidad, entonces, las
exportaciones se incrementan, en promedio, en 0.62 unidades.
c) Realice la prueba de hiptesis correspondiente para determinar
si el modelo es significativo. Utilice un nivel de significancia del 5%.

H 0 : 1 0
H1 : 1 0
0.05
b 0.62
tcal 1 8.86
Sb1 0.07
donde :
Se 0.82
Sb1 0.07
SC ( X ) 154.8
ttabla 3.182
Como tcal =8.86 se encuentra en la regin de rechazo, entonces se rechaza H 0 .
Con un nivel de significancia del 5%, existe evidencia estadstica para pensar
que el modelo es significativo.
EJERCICIO PROPUESTO 1
Para determinar la relacin entre la velocidad (X) y el rendimiento
de la gasolina (Y) en automviles de una determinada marca, se
tom una muestra de 5 automviles y se obtuvieron los siguientes
resultados:

X: Velocidad (Km/h) 60 70 80 90 100


Y: Rendimiento
55 52 50 45 40
(Km/Galn)

1. Calcule la ecuacin de regresin e interprete sus coeficientes.


2. Calcule e interprete el coeficiente de determinacin.
3. Plantee las hiptesis respectivas y diga si el modelo obtenido
es significativo a un nivel de significancia del 5%.
INTERVALO DE PREDICCIN PARA UN VALOR
INDIVIDUAL

El propsito es el de encontrar un intervalo de


prediccin para un valor individual de Y cuando se
tiene una valor en X, considerando un nivel de
prediccin o seguridad de 1 . El intervalo de
prediccin se define como:

1 (X X ) 2
LP (Ypred ) Y mt s 1

(1 , n 2)
e
n SC ( X )
2
EJERCICIO PROPUESTO 2

Teniendo en cuenta los resultados del ejemplo


anterior. Encuentre un intervalo de prediccin a
un nivel del 90% para el rendimiento de la
gasolina (Y), si se sabe que la velocidad (X) es
de 75 Km/h. Interprete el resultado.
PARA REFORZAR LO APRENDIDO