Sie sind auf Seite 1von 70

ESCUELA SUPERIOR POLITECNICA DEL LITORAL

Regresin Lineal Simple


Andres G. Abad, PhD

FIMCP-ESPOL
Estadstica Gerencial
Guayaquil, Ecuador
Agosto, 2016

Objetivos de Aprendizaje
En este captulo aprender:
Usar el anlisis de regresin para predecir el valor de
una variable dependiente basado en una variable
independiente
Conocer el significado de los coeficientes b0 y b1
Evluar los supuestos del anlisis de regression y sabra
qu hacer si los supuestos no son respetados
Har inferencias sobre el coeficiente de correlacin
Estimar el valor promedio y predecir valores
individuales

ESCUELA SUPERIOR POLITECNICA DEL LITORAL, Guayaquil, Ecuador

Correlacin vs Regresin
Un diagram de dispersion puede ser utilizado para

mostrar la relacin entre dos variables numricas


Anlisis de correlacin es usado para medir la
fuerza de asociacin (relacin lineal) entre dos
variables
La correlacin solo considera la fuerza de la relacin
Efectos causales no son implicados con la correlacin

ESCUELA SUPERIOR POLITECNICA DEL LITORAL, Guayaquil, Ecuador

Anlisis de Regresin
Anlisis de Regresin es utilizado para:
Predecir el valor de una variable dependiente

basado en el valor de al menos una variable


independiente
Explicar el impacto de cambios en variables

indeendientes sobre una variable dependiente


Variable dependiente: la variable que desea explicar
Variable independeinte: la variable utilizada para
explicar a la variable dependiente

ESCUELA SUPERIOR POLITECNICA DEL LITORAL, Guayaquil, Ecuador

Modelo de Regresin Lineal Simple


Solo una variable independiente, X
Relacin entre X y Y descrita por una funcin

lineal
Cambios en Y estn relacionados con cambios
en X

ESCUELA SUPERIOR POLITECNICA DEL LITORAL, Guayaquil, Ecuador

Tipos de Relaciones
Relaciones lineales

Relaciones curvilneas

X
Y

X
Y

X
ESCUELA SUPERIOR POLITECNICA DEL LITORAL, Guayaquil, Ecuador

X
6

Tipos de Relaciones
Relaciones fuertes

Relaciones dbiles

X
Y

X
Y

X
ESCUELA SUPERIOR POLITECNICA DEL LITORAL, Guayaquil, Ecuador

X
7

Tipos de Relaciones
Y

Ninguna relacin
Y

X
ESCUELA SUPERIOR POLITECNICA DEL LITORAL, Guayaquil, Ecuador

Modelo de Regresin Lineal


Intercepto
poblacional
Y
Variable
dependiente

Coeficiente
de
pendiente
poblacional

Variable
Independiente

Error
aleatorio

Yi 0 1X i i
Componente lineal

Componente aleatorio

Modelo de regresin poblacional


ESCUELA SUPERIOR POLITECNICA DEL LITORAL, Guayaquil, Ecuador

Modelo de Regresin Lineal


Y

Yi 0 1X i i

Valor observado
de Y para Xi

i
Valor predicho
de Y para Xi

Pendiente = 1
Error aleatorio
para el valor de Xi

Intercepto = 0

Xi
ESCUELA SUPERIOR POLITECNICA DEL LITORAL, Guayaquil, Ecuador

X
10

Ecuaciones de Regresin Lineal


La ecuacin de la regresin lineal simple prove una
estimacin de la lnea de regresin poblacional
Estimacin (o
prediccin) del
valor Y para
observacin i

Estimacin del
intercepto de la
regresin

Estimacin de la
pendiente de la
regresin

Yi b 0 b1X i
ESCUELA SUPERIOR POLITECNICA DEL LITORAL, Guayaquil, Ecuador

Valor de X
para
observacin i

11

Mtodo de los Mnimos Cuadrados


b0 y b1 son obtenidos encontrando los valores

que minimizan la suma cuadrtica de las


diferencias entre Y y Y
2
2

min (Yi Yi ) min (Yi (b 0 b1Xi ))

Los coeficientes b0 y b1 , y otros resultados de

regresin de este captulo pueden ser obtenidos


usando Excel
ESCUELA SUPERIOR POLITECNICA DEL LITORAL, Guayaquil, Ecuador

12

Interpretacin del Intercepto y la


Pendiente
b0 es la estimacin del valor medio de Y

cuando el valor de X es zero


b1 es la estimacin del cambio estimado

del valor medio de Y por cada unidad


adicional de X

ESCUELA SUPERIOR POLITECNICA DEL LITORAL, Guayaquil, Ecuador

13

Ejemplo de Regresin Lineal


Un agente inmobiliario desea examiner la

relacin entre el precio de venta de una casa y


su tamap (medida en pies cuadrados)
Una muestra aleatoria de 10 casas es obtenida
Variable dependiente (Y) = precio de la casa en

$1000s
Variable independiente (X) = pies cuadrados

ESCUELA SUPERIOR POLITECNICA DEL LITORAL, Guayaquil, Ecuador

14

Ejemplo de Regresin Lineal - Data


Precio de la casa en $1000s
(Y)

Pies cuadrados
(X)

245

1400

312

1600

279

1700

308

1875

199

1100

219

1550

405

2350

324

2450

319

1425

255

1700

ESCUELA SUPERIOR POLITECNICA DEL LITORAL, Guayaquil, Ecuador

15

Ejemplo de Regresin Lineal


Diagrama de Dispersin
Modelo del precio de casa: diagram de

House Price ($1000s)

dispersin
450
400
350
300
250
200
150
100
50
0

1000

2000

3000

Square Feet

ESCUELA SUPERIOR POLITECNICA DEL LITORAL, Guayaquil, Ecuador

16

Ejemplo de Regresin Lineal


Usando Excel
Tools
-------Data
Analysis
-------Regression

ESCUELA SUPERIOR POLITECNICA DEL LITORAL, Guayaquil, Ecuador

17

Ejemplo de Regresin Lineal


Usando Excel
La ecuacin de la regresin es:

Regression Statistics
Multiple R

0.76211

R Square

0.58082

Adjusted R Square

0.52842

Standard Error

precio de casa 98.24833 0.10977 (pies cuadrados)

41.33032

Observations

10

ANOVA
df

SS

MS

Regression

18934.9348

18934.9348

Residual

13665.5652

1708.1957

Total

32600.5000

Coefficients
Intercept
Square Feet

Standard Error

t Stat

F
11.0848

P-value

Significance F
0.01039

Lower 95%

Upper 95%

98.24833

58.03348

1.69296

0.12892

-35.57720

232.07386

0.10977

0.03297

3.32938

0.01039

0.03374

0.18580

ESCUELA SUPERIOR POLITECNICA DEL LITORAL, Guayaquil, Ecuador

18

Ejemplo de Regresin Lineal


Representacin Grfica
Modelo del precio de casa: diagrama de dispersion

House Price ($1000s)

y linea de regresin

Intercepto
= 98.248

450
400
350
300
250
200
150
100
50
0

Pendiente
= 0.10977

1000

2000

3000

Square Feet

precio de casa 98.24833 0.10977 (pies cuadrados)


ESCUELA SUPERIOR POLITECNICA DEL LITORAL, Guayaquil, Ecuador

19

Ejemplo de Regresin Lineal Interpretacin de b0


precio de casa 98.24833 0.10977 (pies cuadrados)
b0 es la estimacin del valor promedio de Y

cuando el valor de X es zero


Si X = 0 est en el rango de los valores observados

de X
Debido a que los pies cuadrado no pueden ser

0, el intercepto de Y no tiene aplicacin prctica.

ESCUELA SUPERIOR POLITECNICA DEL LITORAL, Guayaquil, Ecuador

20

Ejemplo de Regresin Lineal


Interpretacin de b1
precio de casa 98.24833 0.10977 (pies cuadrados)
b1 mide el cambio medio del valor promedio de

Y como resultado de un cambio de X de una


unidad
Aqu, b1 = 0.10977 nos dice que el valor
promedio aumenta en 0.10977($1000) =
$109.77, en promedio, por cada pies cuadrado
adicional
ESCUELA SUPERIOR POLITECNICA DEL LITORAL, Guayaquil, Ecuador

21

Ejemplo de Regresin Lineal


Haciendo Predicciones
Predecir el precio de una casa de 2000 pies cuadrados

precio de casa 98.25 0.1098 (sq.ft.)


98.25 0.1098(200 0)
317.85
La prediccin del precio de una casa de 2000 pies
cuadrado es 317.85($1,000s) = $317,850
ESCUELA SUPERIOR POLITECNICA DEL LITORAL, Guayaquil, Ecuador

22

Ejemplo de Regresin Lineal


Haciendo Predicciones
Cuando se utiliza un modelo de regression lineal para

predecir, solo usarlo dentro del rango relevante de los


datos

House Price ($1000s)

Rango releante para


interpolacin

450
400
350
300
250
200
150
100
50
0

No extrapole fuera
de el rango de
valores observados
de Xs
0

1000

2000

3000

Square Feet
ESCUELA SUPERIOR POLITECNICA DEL LITORAL, Guayaquil, Ecuador

23

Medidas de Variacin
La variacin total est compuesta de dos partes:

SST
Total Sum of
Squares

SST ( Yi Y )2

SSR
Regression Sum of
Squares

SSE
Error Sum of
Squares

2
Y)2 SSE ( Y Y

SSR ( Y
)
i
i i

donde:

Y = valor medio de la variable dependiente


Yi = valor observado de la variable dependiente

Y i = valor predicho de Y dado el valor Xi


ESCUELA SUPERIOR POLITECNICA DEL LITORAL, Guayaquil, Ecuador

24

Medidas de Variacin
SST = total sum of squares
Mide la variacin de los valores Yi alrededor de su

media Y
SSR = regression sum of squares
Variacin explicada atribuida a la relacin entre X y Y

SSE = error sum of squares


Variacin atribuida a factores ajenos a la relacin

entre X y Y

ESCUELA SUPERIOR POLITECNICA DEL LITORAL, Guayaquil, Ecuador

25

Medidas de Variacin
Y
Yi

2
SSE = (Yi - Yi )

SST = (Yi - Y)2

_
SSR = (Yi - Y)2

_
Y

Xi
ESCUELA SUPERIOR POLITECNICA DEL LITORAL, Guayaquil, Ecuador

_
Y

X
26

Coeficiente de Determinacin, r2
El coeficiente de determinacin es la porcin de

la variacin total en la variable dependiente que


es explicada por la variable independiente
El coeficiente de determinacin ese tambin
llamado r-cuadrado o r2
SSR regressionsum of squares
r

SST
total sum of squares
2

0 r 1
2

ESCUELA SUPERIOR POLITECNICA DEL LITORAL, Guayaquil, Ecuador

27

Coeficiente de Determinacin, r2
Y
r2 = 1

r2 = -1

100% de la variacin de Y es
explicada por la variable X

r2

=1

Perfecta relacin lineal entre X y


Y:

ESCUELA SUPERIOR POLITECNICA DEL LITORAL, Guayaquil, Ecuador

28

Coeficiente de Determinacin, r2
Y
0 < r2 < 1

Dbil relacin lineal entre X y


Y:
Algo, pero no todo, de la
variacin de Y es explicada por
la variacin en X

X
ESCUELA SUPERIOR POLITECNICA DEL LITORAL, Guayaquil, Ecuador

29

Coeficiente de Determinacin, r2
r2 = 0

Ninguna relacin lineal entre X y


Y:

r2 = 0

El valor de Y no est relacionado


con X. (Nada de la variacin de Y
es explicada por la variacin de X)

ESCUELA SUPERIOR POLITECNICA DEL LITORAL, Guayaquil, Ecuador

30

Ejemplo de Regresin Lineal


Coeficiente de Determinacin, r2
SSR 18934.9348
r

0.58082
SST 32600.5000

Regression Statistics
Multiple R

0.76211

R Square

0.58082

Adjusted R Square

0.52842

Standard Error

58.08% de la variacin del precio


de las casas es explicado por la
variacin de pies cuadrados

41.33032

Observations

10

ANOVA
df

SS

MS

Regression

18934.9348

18934.9348

Residual

13665.5652

1708.1957

Total

32600.5000

Coefficients
Intercept

Square Feet

Standard Error

t Stat

F
11.0848

P-value

Significance F
0.01039

Lower 95%

Upper 95%

98.24833

58.03348

1.69296

0.12892

-35.57720

232.07386

0.10977

0.03297

3.32938

0.01039

0.03374

0.18580

ESCUELA SUPERIOR POLITECNICA DEL LITORAL, Guayaquil, Ecuador

31

Estimacin del Error Standard


La desviacin standard de la variacin de las

observaciones alrededor de la lnea de regresin


es estimado por
n

SYX

SSE

n2

(
Y

Y
)
i i
i 1

n2

Donde
SSE = error sum of squares
n = tamao de la muestra

ESCUELA SUPERIOR POLITECNICA DEL LITORAL, Guayaquil, Ecuador

32

Ejemplo de Regresin Lineal Error


Standard de la Estimacin
Regression Statistics
Multiple R

0.76211

R Square

0.58082

Adjusted R Square

0.52842

Standard Error

SYX 41.33032

41.33032

Observations

10

ANOVA
df

SS

MS

Regression

18934.9348

18934.9348

Residual

13665.5652

1708.1957

Total

32600.5000

Coefficients
Intercept
Square Feet

Standard Error

t Stat

F
11.0848

P-value

Significance F
0.01039

Lower 95%

Upper 95%

98.24833

58.03348

1.69296

0.12892

-35.57720

232.07386

0.10977

0.03297

3.32938

0.01039

0.03374

0.18580

ESCUELA SUPERIOR POLITECNICA DEL LITORAL, Guayaquil, Ecuador

33

Comparando Errores Standard


SYX es una medida de la variacin de valores obserados
de Y de la lnea de regresin
Y

pequeo sYX

grande sYX

La magnitude de SYX debera siempre ser juzgada en relacin al


tamao de los valores de Y en la muestra
ESCUELA SUPERIOR POLITECNICA DEL LITORAL, Guayaquil, Ecuador

34

Supuestos de la Regresin Lineal


(L.I.N.E)
Linealidad
La relacin entre X y Y es lineal
Errores independientes
Los valores de los errores son estadsticamente

independiente
Normalidad de los errores
Los valores de los errores siguen una distribucin
normal para cualquier valor dado de X
Varianzas iguales (tambin llamado homocedasticidad)
La distribucin de probabilidad de los errores tiene
varianza constante
ESCUELA SUPERIOR POLITECNICA DEL LITORAL, Guayaquil, Ecuador

35

Anlisis Residual
ei Yi Yi
El residuo de una observacin i, ei, es la diferencia entre

su valore observado y su prediccin


Comprobamos los supuesto del modelo de regresin lineal
examinando los residuos
Examine el supuesto de Linealidad
Evalue el supuesto de Independencia
Evalue el supuesto de Normalidad
Examine varianzas Iguales para todos los valores dados
de X
Anlisis grfico de los residuos
Grafique residuos vs. X
ESCUELA SUPERIOR POLITECNICA DEL LITORAL, Guayaquil, Ecuador

36

Anlisis Residual para Linearidad


Y

x
No Lineal

ESCUELA SUPERIOR POLITECNICA DEL LITORAL, Guayaquil, Ecuador

residuals

residuals

x
Lineal
37

Anlisis Residual para Independencia

residuals

residuals

Independiente

residuals

No Independiente

ESCUELA SUPERIOR POLITECNICA DEL LITORAL, Guayaquil, Ecuador

38

Comprobando Normalidad
Examine el diagram de Tallo-hoja de los

residuos
Examine el diagram Box-and-Whisker de los
Residuos
Examine el Histograms de los Residuos
Constriya un Plot de probabilidad normal de
los Residuos

ESCUELA SUPERIOR POLITECNICA DEL LITORAL, Guayaquil, Ecuador

39

Anlisis Residual para Varianzas


Iguales
Y

Varianzas desiguales
ESCUELA SUPERIOR POLITECNICA DEL LITORAL, Guayaquil, Ecuador

residuals

residuals

Varianzas iguales
40

Ejemplo de Regresin Lineal Output


Residual en Excel
House Price Model Residual Plot

RESIDUAL OUTPUT
Predicted
House Price

80

Residuals

251.92316

-6.923162

60

273.87671

38.12329

40

284.85348

-5.853484

304.06284

3.937162

218.99284

-19.99284

-20

268.38832

-49.38832

-40

356.20251

48.79749

-60

367.17929

-43.17929

254.6674

64.33264

10

284.85348

-29.85348

Residuals

20
0

1000

2000

3000

Square Feet

No parece irrespetar ninguno de los supuestos de


la regresin

ESCUELA SUPERIOR POLITECNICA DEL LITORAL, Guayaquil, Ecuador

41

Midiendo la Autocorrelacin:
El Estadstico Durbin-Watson
Utilizado cuando los datos han sido

recolectados a lo largo del timepo


Para detector autocorrelacin

Autocorrelacin existe si los residuos en un

periodo del tiempo estn relacionados con


los residuos en otro periodo

ESCUELA SUPERIOR POLITECNICA DEL LITORAL, Guayaquil, Ecuador

42

Autocorrelacin
Autocorrelacin es la correlacin de los errores

(residuos) a lo largo del tiempo


Time (t) Residual Plot

15

Aqu, los residuos


sugieren un patrn
cclico, no aleatorio

Residuals

10
5
0
-5 0

-10

-15
Time (t)

Irrespeta los supuestos de regresin de que los

residuos son estadisticamente independientes


ESCUELA SUPERIOR POLITECNICA DEL LITORAL, Guayaquil, Ecuador

43

El Estadstico Durbin-Watson
El estadstico Durbin-Watson es utilizado para probar la

existencia de autocorrelacin
H0: residuos no estn autocorrelacionados
H1: hay autocorrelacin presente
n

2
(
e

e
)
i i1
i2

2
e
i
i 1

ESCUELA SUPERIOR POLITECNICA DEL LITORAL, Guayaquil, Ecuador

El rango posible es 0 D 4
D debe estar cercano a 2 si H0 es
verdadera

D menor a 2 es seal de autocorrelacin


positive, D mayor a 2 es seal de
autocorrelacin negativa
44

El Estadstico Durbin-Watson
H0: no existe autocorrelacin positiva
H1: est presente autocorrelacin positiva
Calcule el estadstico de la prueba Durbin-Watson = D
(El estadstico Durbin-Watson puede ser encontrado en Excel)

Encuentre el valor de dL y dU de la tabla de Durbin-Watson


(para un tamao de n y un nmero de variables independientes k)

Regla de decisin: rechace H0 si D < dL


Rechace H0

No se concluye

dL

ESCUELA SUPERIOR POLITECNICA DEL LITORAL, Guayaquil, Ecuador

No rechace H0

dU

2
45

El Estadstico Durbin-Watson
Ejemplo con n = 25:

160

140

Excel:

120

Durbin-Watson Calculations
Sales

100

y = 30.65 + 4.7038x
R2 = 0.8976

80

Sum of Squared
Difference of Residuals

3296.18

60

Sum of Squared Residuals

3279.98

40

Durbin-Watson Statistic

1.00494

20
0
0

10

15

20

25

30

Time

(e
i 2

ei1 )2

ei

3296.18
1.00494
3279.98

i1

ESCUELA SUPERIOR POLITECNICA DEL LITORAL, Guayaquil, Ecuador

46

El Estadstico Durbin-Watson
Aqu, n = 25 y hay k = 1 variables independientes
Utilice la tabla Durbin-Watson, dL = 1.29 y dU = 1.45

D = 1.00494 < dL = 1.29, as que rechace H0 y concluya

que existe autocorrelacin positiva


Por lo tanto, el anlisis de regresin lineal no es apropiado

para predecir ventas


Decisin: rechace H0 dado que
D = 1.00494 < dL
Rechace H0

No se concluye

dL=1.29

ESCUELA SUPERIOR POLITECNICA DEL LITORAL, Guayaquil, Ecuador

No rechace H0

dU=1.45

2
47

Inferencias sobre la pendiente:


La prueba t
Prueba t para la pendiente poblacional
Existe relacin lneal entre X y Y?

Hiptesis Nula y Alterna

H0: 1 = 0
H1: 1 0

(no existe relacin lineal)


(existe relacin lineal)

Estadstico de la prueba

b1 1
t
Sb1
d.f. n 2

ESCUELA SUPERIOR POLITECNICA DEL LITORAL, Guayaquil, Ecuador

donde:
b1 = coeficiente de pendiente de
la regression
1 = pendiente hipotetizada
Sb1 = error standard de la
pendiente
48

Inferencias sobre la pendiente:


La prueba t - Ejemplo
Precio casas en
$1000s
(y)

Pies cuadrados
(x)

245

1400

312

1600

279

1700

308

1875

199

1100

219

1550

405

2350

324

2450

319

1425

255

1700

Ecuacin de regresin estimada:


precio casa 98.25 0.1098 (sq.ft.)

La pendiente del modelo es 0.1098


Hay alguna relacin entre los pies
cuadrados de una casa y su precio?

ESCUELA SUPERIOR POLITECNICA DEL LITORAL, Guayaquil, Ecuador

49

Inferencias sobre la pendiente:


La prueba t - Ejemplo
H0: 1 = 0

b1

De Excel:

H1: 1 0

Coefficients
Intercept
Square Feet

Standard Error

Sb1
t Stat

P-value

98.24833

58.03348

1.69296

0.12892

0.10977

0.03297

3.32938

0.01039

b1 1 0.10977 0
t

3.32938
t
Sb1
0.03297

ESCUELA SUPERIOR POLITECNICA DEL LITORAL, Guayaquil, Ecuador

50

Inferencias sobre la pendiente:


La prueba t - Ejemplo
Estadstico de
la prueba: t = 3.329

H0: 1 = 0
H1: 1 0

d.f. = 10- 2 = 8
a/2=.025

Reject H0

a/2=.025

Do not reject H0

-t/2
-2.3060

Reject H

0
t/2
2.3060 3.329

ESCUELA SUPERIOR POLITECNICA DEL LITORAL, Guayaquil, Ecuador

Decisin: Rechace H0
Hay suficiente evidencia de
que los pies cuadrados
afectan el precio

51

Inferencias sobre la pendiente:


La prueba t - Ejemplo
Valor p

De Excel:
Coefficients
Intercept

H0: 1 = 0
H1: 1 0

Square Feet

Standard Error

t Stat

P-value

98.24833

58.03348

1.69296

0.12892

0.10977

0.03297

3.32938

0.01039

Decisin: Rechace H0, dado que


el valor p<
Hay suficiente evidencia de que los
pies cuadrados afectan el precio de las
casas

ESCUELA SUPERIOR POLITECNICA DEL LITORAL, Guayaquil, Ecuador

52

Prueba F para Significancia


Estadstico

de prueba F:
donde

MSR
F
MSE
SSR
MSR
k
SSE
MSE
n k 1

F sigue una distribucin F con k grados de libertad en el numerador y (n k - 1) grados de libertad en el denominador
(k = el nmero de variables independientes en el modelo de regresin)
ESCUELA SUPERIOR POLITECNICA DEL LITORAL, Guayaquil, Ecuador

53

Prueba F para Significancia Output


de Excel
Regression Statistics
Multiple R

0.76211

R Square

0.58082

Adjusted R Square

0.52842

Standard Error

MSR 18934.9348
F

11.0848
MSE 1708.1957

41.33032

Observations

10

Valor-p para
la prueba F

Con 1 y 8 grados de
libertad

ANOVA
df

SS

MS

Regression

18934.9348

18934.9348

Residual

13665.5652

1708.1957

Total

32600.5000

ESCUELA SUPERIOR POLITECNICA DEL LITORAL, Guayaquil, Ecuador

F
11.0848

Significance F
0.01039

54

Prueba F para Significancia


Estadstico de la prueba:

H0: 1 = 0
H1: 1 0

MSR
F
11.08
MSE

a = .05
df1= 1

df2 = 8

Decisin:
Reject H0 at a = 0.05
Conclusin:

Valor crtico:
Fa = 5.32
a = .05

Do not
reject H0

Reject H0

F.05 = 5.32

ESCUELA SUPERIOR POLITECNICA DEL LITORAL, Guayaquil, Ecuador

Hay suficiente evidencia


estadstica de que los pies
cuadrados afectan el precio de
una casa
55

Estimacin de Intervalos de
Confianza para la Pendiente
Estimacin del interval de confianza de la
pendiente:

b1 t n2Sb1

d.f. = n - 2

Excel:
Coefficients
Intercept
Square Feet

Standard Error

t Stat

P-value

Lower 95%

Upper 95%

98.24833

58.03348

1.69296

0.12892

-35.57720

232.07386

0.10977

0.03297

3.32938

0.01039

0.03374

0.18580

Al nivel de confianza de 95%, el interval de confianza


de la prendiente es (0.0337, 0.1858)
ESCUELA SUPERIOR POLITECNICA DEL LITORAL, Guayaquil, Ecuador

56

Estimacin de Intervalos de
Confianza para la Pendiente
Coefficients
Intercept
Square Feet

Standard Error

t Stat

P-value

Lower 95%

Upper 95%

98.24833

58.03348

1.69296

0.12892

-35.57720

232.07386

0.10977

0.03297

3.32938

0.01039

0.03374

0.18580

Dado que las unidades del precio de casas es $1000s, Ud.


Esta un 95% confiado de que el cambio promedio del precio
est entre $33.74 y $185.80 por pie cuadrado
Este interval de confianza de 95% no incluye al 0.
Conclusin: existe una relacin significativa entre el precio de una casa
y los pies cuadrados a un nivel de significancia del .05
ESCUELA SUPERIOR POLITECNICA DEL LITORAL, Guayaquil, Ecuador

57

Prueba t para un Coeficiente de


Correlacin
Hiptesis

H0: = 0
H1: 0

(no hay correlacin entre X y Y)


(existe correlacin)

Estadstico de la prueba

r -

(con n 2 grados de libertad)

1 r
n2
2

ESCUELA SUPERIOR POLITECNICA DEL LITORAL, Guayaquil, Ecuador

donde
r r 2 si b1 0
r r 2 si b1 0
58

Prueba t para un Coeficiente de


Correlacin
Existe evidencia de una relacin lineal entre pies cuadrados
y precio de casa a un nivel de significancia de .05?
H0: = 0 (No correlacin)
H1: 0 (existe correlacin)

a =.05 , df = 10 - 2 = 8

r
1 r2
n2

ESCUELA SUPERIOR POLITECNICA DEL LITORAL, Guayaquil, Ecuador

.762 0
1 .762 2
10 2

3.329

59

Prueba t para un Coeficiente de


Correlacin
Decisin:
Rechazar H0

d.f. = 10- 2 = 8
a/2=.025

Reject H0

a/2=.025

-t/2

-2.3060

Do not reject H0

Reject H0

t/2
2.3060

ESCUELA SUPERIOR POLITECNICA DEL LITORAL, Guayaquil, Ecuador

3.329

Conclusin:
Hay evidencia de
asociacin lineal al
nivel de
significancia del
5%

60

Estimando Valores Promedios y


Prediciendo Valores Individuales
Intervalos de
confianza
para la media
de Y, dado Xi

Meta: Construir intervalos alrededor de Y para


expresar la incertidumbre sobre el valor de Y para
un Xi dado

Y = b0+b1Xi

Intervalos de prediccin
para un valor individual
de Y, dado Xi
ESCUELA SUPERIOR POLITECNICA DEL LITORAL, Guayaquil, Ecuador

Xi

X
61

Intervalos de Confianza para el


promedio de Y, dado X
Intervalos de confianza estimados para el valor
promedio de Y dado un valor particular Xi

Intervalo de confianza para Y|X Xi :


Y tn 2SYX hi
Tamao del interval vara de acuerdo
a su distancia con la media, X

1 (X i X) 2 1
(X i X) 2
hi

n
SSX
n (X i X) 2
ESCUELA SUPERIOR POLITECNICA DEL LITORAL, Guayaquil, Ecuador

62

Intervalo de Prediccin para un valor


individual Y, dado X
Intervalo de prediccin estimado para un valor
individual de Y dado un valor particular Xi

Intervalo de prediccin YXXi :


Y tn 2SYX 1 hi

Este trmino extra aade al ancho del intervalo para


reflejar la inceridumbre aadida para un caso individual

ESCUELA SUPERIOR POLITECNICA DEL LITORAL, Guayaquil, Ecuador

63

Estimacin del Valor Medio - Ejemplo


Estimacin del interval de confianza para Y|X=X

Encuentre el interval de confianza de 95% para el valor


promedio de casas de 2,000 pies cuadrados

Precio predicho Yi = 317.85 ($1,000s)

t S
Y
n-2 YX

1
(Xi X)2

317.85 37.12
2
n (Xi X)

Los extremos del intervalo de confianza son 280.66 y


354.90, o desde $280,660 hasta $354,900
ESCUELA SUPERIOR POLITECNICA DEL LITORAL, Guayaquil, Ecuador

64

Estimacin de Valores Individuales Ejemplo


Estimcin de intervalos de preidccin YX=X i
Encuentre el interval de 95% para una casa individual de 2,000
pies cuadrados

Precio predicho Yi = 317.85 ($1,000s)

t S
Y
n-1 YX

1
(Xi X)2
1
317.85 102.28
2
n (Xi X)

Los extremos del intervalo de prediccin son 215.50 y 420.07,


o desde $215,500 hasta $420,070
ESCUELA SUPERIOR POLITECNICA DEL LITORAL, Guayaquil, Ecuador

65

Errores del Anlisis de Regresin


Desconocer los supuestos de la regression de

mnimos cuadrados
Desconocer como evaluar los supuestos
Desconocer las alternativas para la regression de
mnimos cuadrados cuando los supuestos son
irrespetados
Usar un modelo de regresin sin conocer
caractersticas importantes de su aplicacin
Extrapolar fuera del rango de relevancia

ESCUELA SUPERIOR POLITECNICA DEL LITORAL, Guayaquil, Ecuador

66

Estrategias para prevenir errores de


Regresin
Comenzar con un diagram de dispercin de X en

Y para observar posibles relaciones


Conduzca anlisis de residuos para comprobar
supuestos
Grafique los residuos vs. X para comprobar si algun

supuesto es irrespetado
Como el de varianzas iguales

Utilice histogramas, tallo-hoja, o plot de normalidad

de los residuos para investigar posible nonormalidad


ESCUELA SUPERIOR POLITECNICA DEL LITORAL, Guayaquil, Ecuador

67

Estrategias para prevenir errores de


Regresin
Si alguno de los supuestos es irrespetado, utilice

mtodos o modelos alternos


Si no hay evidencia de irrespeto de supuestos,
pruebe la significancia de los coeficientes de
regresin y construya intervalos de confianza e
intervalos de prediccin
Evite hacer predicciones y pronsticos fuera del
rango de relevancia

ESCUELA SUPERIOR POLITECNICA DEL LITORAL, Guayaquil, Ecuador

68

Resumen del Captulo


En este captulo, hemos
Introducido tipos de modelos de regresin
Revisado supuestos de regresin y correlacin
Determinado la ecuacin del modelo de

regresin lineal simple


Descrito medidas de variacin
Discutido el anlisis de residuos
Medido autocorrelacin

ESCUELA SUPERIOR POLITECNICA DEL LITORAL, Guayaquil, Ecuador

69

Resumen del Captulo


En este captulo, hemos
Descrito inferencias sobre la pendiente
Discutido correlacin - midiendo la fuerza de

asociacin
Estimado el valor promedio y predicciones de
valores individuales
Discutido posibles errores de regresin y
recomendado estrategas para evitarlos

ESCUELA SUPERIOR POLITECNICA DEL LITORAL, Guayaquil, Ecuador

70

Das könnte Ihnen auch gefallen