Sie sind auf Seite 1von 15

Universidad Catlica Los ngeles de Chimbote

FACULTAD DE INGENIERA
ESTADSTICA INFERENCIAL ESTADSTICA APLICADA
------------------------------------------------------------------------------------------------------------------------------------------------------------

LECTURA 10: REGRESIN Y CORRELACIN LINEAL SIMPLE (PARTE I)


TEMA 20: REGRESIN LINEAL SIMPLE
1. INTRODUCCIN
Cuando se estudian dos caractersticas simultneamente sobre una muestra, se
puede considerar que una de ellas influye sobre la otra de alguna manera. El
objetivo principal de la regresin es descubrir el modo en que se relacionan
Por ejemplo, en una tabla de ingresos semanales y consumos semanales en soles
de 10 familias se puede suponer que la variable ingresos semanales influye sobre
la variable consumos semanales en el sentido de que cosnumos semanales altos
vienen explicados por valores altos de ingresos semanales. De las dos variables a
estudiar, que vamos a denotar con X e Y, vamos a llamar a la X VARIABLE
INDEPENDIENTE o EXPLICATIVA, y a la otra, Y, le llamaremos VARIABLE
DEPENDIENTE o EXPLICADA.
En la mayora de los casos la relacin entre las variables es mutua, y es difcil saber
qu variable influye sobre la otra. El ejemplo dado es un ejemplo claro donde
distinguir entre variable explicativa y explicada . En este caso un ingreso semanal
bajo tender a tener un consumo semanal bajo, y un ingreso alto indicar tal vez
que las familias tienen un consumo semanal alto. Sin embargo, a la hora de
determinar qu variable explica a la otra, est claro que el ingreso semanal explica
la consumo semanal y no al contrario, pues las familias primero obtienen sus
ingresos semanales, y luego consumen semanalmente. Por tanto, X = ingresos
semanales (variable explicativa o independiente) Y = consumos semanales (variable
explicada o dependiente) El problema de encontrar una relacin funcional entre dos
variables es muy complejo, ya que existen infinidad de funciones de formas distintas.
El caso ms sencillo de relacin entre dos variables es la relacin LINEAL, es decir
que y = 0 + 1x (es la ecuacin de una recta) donde 0 y 1 son nmeros, que es
el caso al que nos vamos a limitar.
Cabe recalcar la regresin estudia la mejor relacin funcional entre las variable
dependiente y una o un conjunto de variables independientes o explicativas.

___________________________________________________________________________
Elaborado por
: Mg. Carmen Barreto R.
Fecha
: Febrero 2010
Versin
:2

Universidad Catlica Los ngeles de Chimbote

FACULTAD DE INGENIERA
ESTADSTICA INFERENCIAL ESTADSTICA APLICADA
------------------------------------------------------------------------------------------------------------------------------------------------------------

2. DEFINICIN
Una funcin de regresin es lineal simple cuando las variaciones en la variable
independiente provocan variaciones proporcionales en la variable dependiente.
Y = f (X)
Donde:
Y : Variable dependiente
X : Variable independiente
Por ejemplo: Podemos estar interesados en predecir el consumo promedio de un
conjunto de familias en base al ingreso de las mismas.
Entonces: Y: Consumo ; X : Ingreso
Hacer anlisis de regresin lineal simple consiste en estimar la funcin de regresin
poblacional (F.R.P.) que responde a la siguiente expresin:
F.R.P. :

Yi = 0 + 1 Xi + Ei ..................... (1)

Donde:
Y : Variable dependiente
X : Variable independiente
0: Intercepto
1: Coeficiente pendiente
Ei : Error aleatorio.
Con base en la funcin de regresin muestral (F.R.M.)
F.R.M.

yi = 0 + 1x i + e i

.............................. (2)

3. ELECCIN DE UNA RELACIN FUNCIONAL


Ac veremos el tipo de funcin matemtica que mejor ha de representar la
dependencia entre las variables, dos son los mtodos empleados:
a) Una consideracin analtica del fenmeno que nos ocupa (estudios anteriores).
b) Un examen del diagrama de dispersin en forma grfica de los datos observados,
en esta forma es fcil tener una idea si existe o no existe regresin, si es lineal o

___________________________________________________________________________
Elaborado por
: Mg. Carmen Barreto R.
Fecha
: Febrero 2010
Versin
:2

Universidad Catlica Los ngeles de Chimbote

FACULTAD DE INGENIERA
ESTADSTICA INFERENCIAL ESTADSTICA APLICADA
------------------------------------------------------------------------------------------------------------------------------------------------------------

curvilnea, esto puede permitir ahorrar tiempo y dinero, evitando trabajos estriles.
Ver fig. 20.
Diagrama de dispersin

fig. 20
4.

EL MTODO DE LOS MNIMOS CUADRADOS ORDINARIOS (M.C.O)


El mtodo de los mnimos cuadrados ordinarios brinda los siguientes

coeficientes de regresin estimados:

0 = y 1 x
n( x i yi ) ( x i )( yi )
1 =
2
n x i2 ( x i )

...........................(8)

............................(9)

4.1. Caracteristicas de los coeficientes de regresion estimados


Son expresados nicamente en trminos de cantidades observables.
Son estimadores puntuales, es decir dada la muestra cada estimador
proporcionar un solo valor del parmetro poblacional relevante.
4.2. Interpretacion de los coeficientes de regresion estimados
0 : Es el efecto medio o promedio sobre la variable dependiente de todas
las
variables omitidas en el modelo de regresin.

___________________________________________________________________________
Elaborado por
: Mg. Carmen Barreto R.
Fecha
: Febrero 2010
Versin
:2

Universidad Catlica Los ngeles de Chimbote

FACULTAD DE INGENIERA
ESTADSTICA INFERENCIAL ESTADSTICA APLICADA
------------------------------------------------------------------------------------------------------------------------------------------------------------

1 :

Es el promedio de los incrementos de y debido a los aumentos


unitarios de x o es el promedio de las disminuciones de y debido a los
aumentos unitarios de x.

fig. 21
4.3. Coeficiente de determinacin: r2
Consideremos ahora la bondad de ajuste de la lnea de regresin ajustada al
conjunto de datos.

fig. 22
De la fig. 22 se desprende claramente que si todas las observaciones coinciden con
la lnea de regresin, obtendramos el ajuste perfecto lo que raras veces ocurre.
Generalmente tiende a haber algunas ei positivos (encima de la lnea de regresin)
y ei negativos (debajo de la lnea de regresin) con la esperanza de que los erros

___________________________________________________________________________
Elaborado por
: Mg. Carmen Barreto R.
Fecha
: Febrero 2010
Versin
:2

Universidad Catlica Los ngeles de Chimbote

FACULTAD DE INGENIERA
ESTADSTICA INFERENCIAL ESTADSTICA APLICADA
------------------------------------------------------------------------------------------------------------------------------------------------------------

aleatorios localizados alrededor de la lnea de regresin sean los ms pequeos


posibles.
El Coeficiente de Determinacin (r2) es una medida resumen que nos dice que tan
exactamente la lnea de regresin estimada se ajusta a los datos observados.
El coeficiente de determinacin se expresa de la siguiente manera:
n xy ( x ) ( y )

2
2
2
2
x ( x ) ][n y ( y ) ]
2

r =
2

[n

El coeficiente de determinacin muestral es ampliamente utilizado como una medida


de la bondad de ajuste de una lnea de regresin. Es decir el r2 mide la proporcin
o porcentaje de la variacin de la variacin total en y explicada por el modelo
de regresin.
Sus propiedades son:
1. Es una cantidad positiva
2. Sus lmites son: 0 r2 1
* Si r2 = 1, quiere decir que el ajuste es perfecto.
* Si r2 = 0, quiere decir que no hay relacin entre la variable dependiente y la
variable independiente.
3. Cunto ms se acerca r2 a 1, tanto ms alto ser el grado de linealidad entre las
variables.
4. Si r2 0.75 hay seguridad en las predicciones con la ecuacin de regresin lineal
estimada.
Ejemplo 1:
El dueo de una empresa desea determinar si hay relacin lineal entre lo aos de
experiencia de los vendedores y el nmero de computadoreas que venden. Los
siguientes datos representan los aos de experiencia (X) y el nmero de
computadoras vendidas (Y), de 10 vendedores de la empresa, los datos se dan en la
siguiente tabla:

___________________________________________________________________________
Elaborado por
: Mg. Carmen Barreto R.
Fecha
: Febrero 2010
Versin
:2

Universidad Catlica Los ngeles de Chimbote

FACULTAD DE INGENIERA
ESTADSTICA INFERENCIAL ESTADSTICA APLICADA
------------------------------------------------------------------------------------------------------------------------------------------------------------

N de computadoras
vendidas
(Y)
9
12
16
19
23
27
34
37
40
45

N de aos de
experiencia
(X)
3
4
6
7
8
12
15
20
22
26

Se pide:
a) Graficar el diagrama de dispersin de las variables dadas y comentar.
b) Estimar la lnea de regresin de los gastos en material informtico sobre los
ingresos globales.
c) Graficar la lnea de regresin estimada sobre el diagrama de dispersin.
d)

Interpretar el coeficiente de regresin estimado 1 .

e)
f)

Calcular el coeficiente de determinacin r2 e interpretar.


Cunto sera el nmero de computadoras vendidas si el nmero de aos de
experiencia es de X=30 aos?

Solucin:
a)

___________________________________________________________________________
Elaborado por
: Mg. Carmen Barreto R.
Fecha
: Febrero 2010
Versin
:2

Universidad Catlica Los ngeles de Chimbote

FACULTAD DE INGENIERA
ESTADSTICA INFERENCIAL ESTADSTICA APLICADA
------------------------------------------------------------------------------------------------------------------------------------------------------------

Diagrama de dispersin
N de computadoras vendidas

45
40
35
30
25
20
15
10
5
0
0

10

15

20

25

30

N de aos de experiencia

Se observa que los datos tienen aproximadamente una tendencia lineal.


b) Estimando la linea de regresin
A continuacin le mostraremos una tabla de trabajo en donde se har el clculo de
las sumatorias solicitadas:

e = y y

x2

y2

xy

81

27

12.18

-43426

12

16

144

48

13.69

12

16

36

256

96

16.17

16

19

49

361

133

18.21

19

23

64

529

184

19.72

23

12

27

144

729

324

25.75

27

15

34

225

1156

510

30.27

34

20

37

400

1369

740

37.81

37

22

40

484

1600

880

40.82

40

26

45

676

2025

1170

46.85

45

x=

123

y=

262

x2 =

2103

y =

8250

xy =

2942

___________________________________________________________________________
Elaborado por
: Mg. Carmen Barreto R.
Fecha
: Febrero 2010
Versin
:2

Universidad Catlica Los ngeles de Chimbote

FACULTAD DE INGENIERA
ESTADSTICA INFERENCIAL ESTADSTICA APLICADA
------------------------------------------------------------------------------------------------------------------------------------------------------------

Calculando 1 :
1 =

n xy ( x)( y)
n x 2 ( x) 2

Calculando:

10(4112) (123)(262)
1 =
10(8250) (123) 2
= 1.507
1

Calculando 0
Se sabe que :

1 = 1.507 ; x = 12.3; y = 26.2


Reemplazando en la formula:

0 = y 1 x
0 = 26.2 1.507(12.3)
0 = 7.661

Entonces la lnea de regresin estimada est dada por:

y = 0 + 1x
y = 7.661 + 1.507x
c)

Hallando los interceptos para graficar la linea de regresin estimada:

___________________________________________________________________________
Elaborado por
: Mg. Carmen Barreto R.
Fecha
: Febrero 2010
Versin
:2

Universidad Catlica Los ngeles de Chimbote

FACULTAD DE INGENIERA
ESTADSTICA INFERENCIAL ESTADSTICA APLICADA
------------------------------------------------------------------------------------------------------------------------------------------------------------

Los interceptos son los puntos que pasan por los ejes x e y.

Cuando x = 0 entonces y estar dado por:

y = 7.661 + 1.507x
y = 7.661+ 1.507(0)
y = 7.661

P1 = ( 0, 7.661)

Cuando y = 0 entonces x estar dado por:


y = 7.661 + 1.507x
0 = 7.661 + 1.507x
1.507x = -7.661

x=

7.661
1.507

x = -5.0836

P2 = (-5.0836, 0)

Grfica de la linea de regresin estimada

N de computadoras vendidas

45
40
35
30
25
20
15
10
5
0
0

10

15

20

25

30

N de aos de experiencia
___________________________________________________________________________
Elaborado por
: Mg. Carmen Barreto R.
Fecha
: Febrero 2010
Versin
:2

Universidad Catlica Los ngeles de Chimbote

FACULTAD DE INGENIERA
ESTADSTICA INFERENCIAL ESTADSTICA APLICADA
------------------------------------------------------------------------------------------------------------------------------------------------------------

d)

1 = 1.1715
Por cada aumento que hay en el nmero de aos de experiencia el nmero de
computadoras vendidas aumenta en 1 unidad.

e)

Calculando el coeficiente de determinacin r 2:


n xy ( x ) ( y )

2
2
x 2 ( x ) ][n y 2 ( y ) ]
2

r2 =

r2 =

[n

[10(4112) (123)(262) ]

[10(8250) (262) 2 ][10(2103) (123) 2 ]

r2 =

(115800000) 2
98850000 140000000

r2 =

1.340964 1016
1.3839 1016

r 2 = 0.967

Interpretacin: quiere decir que el 96.70% de las variaciones del nmero promedio
del nmero de computadoras vendidas est explicada por el nmero de aos de
experiencia.
d) Cuando el nmero de aos de experiencia es de X = 30, entonces el nmero de
computadoras vendidas es de:

y = 7.661 + 1.507(30)
y = 52.871 53computadoras
4.4. Prueba de Hiptesis para el Coeficiente de Regresion Poblacional.
___________________________________________________________________________
Elaborado por
: Mg. Carmen Barreto R.
Fecha
: Febrero 2010
Versin
:2

10

Universidad Catlica Los ngeles de Chimbote

FACULTAD DE INGENIERA
ESTADSTICA INFERENCIAL ESTADSTICA APLICADA
------------------------------------------------------------------------------------------------------------------------------------------------------------

Se debe probar los parmetros poblacionales para asegurar que el estadstico


hallado difiere significativamente de cero.
Prueba para 1
1. Formulacin de hiptesis:
H0 : 1 = 0
H1 : 1 0
2.

Nivel de significancia:

3.

Estadstica de prueba:

t=

1 1
t n 2
s
1

NOTA: La estadstica de prueba nos sirve para hallar el vaor


experimental t 0 = t1 ; n 2
tk y el valor tabular

4.

Establecimiento de los criterios de decisin:

1-

/2

/2
-to

R.A
.
R.A.: Si tk [-to , to], se acepta Ho.

R.R.

to
R.R.

R.R.: Si tk < -to o tk > to, se rechaza Ho.

___________________________________________________________________________
Elaborado por
: Mg. Carmen Barreto R.
Fecha
: Febrero 2010
Versin
:2

11

Universidad Catlica Los ngeles de Chimbote

FACULTAD DE INGENIERA
ESTADSTICA INFERENCIAL ESTADSTICA APLICADA
------------------------------------------------------------------------------------------------------------------------------------------------------------

5.

Clculos :

tk =

1 1
s
1

Donde:

s 1 =

se
sc x

se =

CME

CME =

SCE
n 2

SCE = SC y

SC X =

SC y =

SC Xy =

(SC XY ) 2
SC x

x2

( x) 2

y2

( y) 2

xy

( x)( y)
n

6. Decisin:
Se acepta o rechaza la hiptesis
Ejemplo 2:

___________________________________________________________________________
Elaborado por
: Mg. Carmen Barreto R.
Fecha
: Febrero 2010
Versin
:2

12

Universidad Catlica Los ngeles de Chimbote

FACULTAD DE INGENIERA
ESTADSTICA INFERENCIAL ESTADSTICA APLICADA
------------------------------------------------------------------------------------------------------------------------------------------------------------

Tomando el ejemplo 1 probar si el coeficiente de regresin poblacional es diferente


de 0 ( 1 0) . Con = 0.05.
1.

Formulacin de hiptesis:
H0 : 1 = 0
H1 : 1 0

2.

Nivel de significancia: =0.05

3.

Estadstica de prueba:

t=

1 1
t n 2
s
1

Como n = 10
t t 8
4.

Establecimiento de los criterios de decisin:

1- =0.95

/2=0.025

/2=0.025

-2.306

2.306

R.A
.

R.R.

R.R.

R.A.: Si tk [-2.306, 2.306], se acepta Ho.


R.R.: Si tk < -2.306 o tk > 2.306, se rechaza Ho.

5. Clculos :
Donde:
SC y =

y2

( y) 2

SC xy =

xy

( x)( y)
n

n
___________________________________________________________________________
(262)2
(123)(262)
=
8250

Elaborado por
: Mg. CarmenSC
Barreto
R.
y
SC xy = 4112
10
10
Fecha
: Febrero 2010
Versin

:2

SC y = 1385.6

SC xy = 889.4

13

Universidad Catlica Los ngeles de Chimbote

FACULTAD DE INGENIERA
ESTADSTICA INFERENCIAL ESTADSTICA APLICADA
------------------------------------------------------------------------------------------------------------------------------------------------------------

SC X =

( x) 2

x2

SC X = 2103

(123) 2
10

SC X = 590

SCE = SC y

(SC xy ) 2

SCE = 1385.6

SC x
(889.4) 2
590

SCE = 44.8672

CME =

SCE
n 2

CME =

44.8672
8

CME = 5.6084

Entonces :
se =

CME

se =

5.6084

s e = 2.3682

s 1 =

se
sc x

___________________________________________________________________________
Elaborado por
: Mg. Carmen Barreto R.
2.3682
s 1 =
Fecha
: Febrero 2010
590 : 2
Versin

s 1 = 0.0975

14

Universidad Catlica Los ngeles de Chimbote

FACULTAD DE INGENIERA
ESTADSTICA INFERENCIAL ESTADSTICA APLICADA
------------------------------------------------------------------------------------------------------------------------------------------------------------

tk =

1 1
s
1

tk =

1.507
0.0975

t k = 15.4564

6.

Decisin:

t k = 15.4564 a R.R. ; entonces se rechaza Ho . Lo que quiere decir que 1 0.

___________________________________________________________________________
Elaborado por
: Mg. Carmen Barreto R.
Fecha
: Febrero 2010
Versin
:2

15

Das könnte Ihnen auch gefallen