Beruflich Dokumente
Kultur Dokumente
PROGRAMA: LICENCIATURA EN
MATEMTICAS
ASIGNATURA: ESTADISTICA
CURSO preparado por:
MELBA LILIANA VERTEL MORINSN
E-mail: melba.vertel@unisucre.edu.co
ESTADISTICA. U. Sucre
ESTADISTICA. U. Sucre
ESTADISTICA. U. Sucre
y i 0 1 xi1 p xip
Donde: los coeficientes son los factores que definen la variacin promedio
de y, para cada valor de x.
Estimada esta funcin terica a partir de los datos, cabe preguntarse qu
tan bien se ajusta a la distribucin real.
Tema: Regresin Lineal
ESTADISTICA. U. Sucre
Y o 1 X
Donde, Y: es llamada la variable de respuesta o dependiente,
X: es llamada la variable predictora o independiente,
o : es el intercepto de la lnea con el eje Y,
1 : es la pendiente de la lnea de regresin y
: es un error aleatorio, el cual se supone que tiene media 0 y
varianza constante 2.
Tema: Regresin Lineal
ESTADISTICA. U. Sucre
1 x11
y1
1 x21
y2
Y
; X
y
1 x
np
n
x1 p
x2 p
xnp
nx(p 1)
1
;
(p 1)x1
E ~ N 0 n , 2 I n ; Y ~ N X , 2 I n
Tema: Regresin Lineal
e1
e2
; E
e
n
nx1
ESTADISTICA. U. Sucre
Mnimos Cuadrados
Residuo:
ei yi y i yi 0 1 xi1 k xik
Minimizar:
2
e
i
i 1
X X
Tema: Regresin Lineal
XY
ESTADISTICA. U. Sucre
(
y
x
)
i
i
o
1 i
Q(o,1) =
i 1
i 1
Luego :
o y 1 x
s xy
s xx
x y
xy
n
2
2
x
ESTADISTICA. U. Sucre
Interpretacin de la pendiente 1 :
Indica el cambio promedio en la variable de respuesta Y cuando X se
incrementa en una unidad.
ESTADISTICA. U. Sucre
ESTADISTICA. U. Sucre
10
Donde:
n
( yi y )
Suma de Cuadrados Total = SCT =
i 1
( y i y )
Suma de Cuadrados de Regresin = SCR =
i 1
n
y i ) 2
ESTADISTICA. U. Sucre
11
ESTADISTICA. U. Sucre
12
Grados de
Libertad
Suma de
Cuadrados
Cuadrados
Medios
Debido a la
regresin
SCR
CMR=SCR/1
CMR/CME
Debido al
Error
n-2
SCE
CME=SCE/n-2
Total
n-1
SCT
ESTADISTICA. U. Sucre
13
El Coeficiente de Determinacin
Es una medida de la bondad de ajuste del modelo de regresin hallado.
R2
SSR
SST
Donde,
SCR representa la suma de cuadrados debido a la regresin y
SCT representa la suma de cuadrados del total.
El coeficiente de determinacin es simplemente el cuadrado del coeficiente de
correlacin.
El coeficiente de Determinacin vara entre 0 y 1.
R2 indica qu porcentaje de la variabilidad de la variable de respuesta Y es
explicada por su relacin lineal con X.
Tema: Regresin Lineal
ESTADISTICA. U. Sucre
14
Yo X o
2
(
x
x
)
1
Y0 t(1 / 2, n 2) s
0
n
S xx
2
(
x
x
)
1
0
Y0 t(1 / 2, n 2) s 1
n
S xx
ESTADISTICA. U. Sucre
15
ESTADISTICA. U. Sucre
16
Anlisis de Residuales
En un anlisis de residuales se puede detectar:
ESTADISTICA. U. Sucre
17
ESTADISTICA. U. Sucre
18
Y a bX cX 2
donde a, b y c son constantes a estimar. Usando la tcnica de mnimos
cuadrados se pueden obtener frmulas explcitas para calcular a, b y c.
ESTADISTICA. U. Sucre
19
Transformacin
Modelo Linealizado
Exponencial
Y=eX
Z=Ln Y X=X
Z=Ln +X
Logartmico
Y= +Log X
Y=Y
Y= +W
Doblemente Logartmico
Y=X
Z=Log Y W=Log X
Z= Log +W
Hiperblico
Y= +/X
Y=Y
W=1/X
Y= +W
Inverso
Y=1/( +X)
Z=1/Y
X=X
Z= +X
W=Log X
ESTADISTICA. U. Sucre
20
FUNCIONES NO LINEALES
Exponenciales
Logartmicas
Tema: Regresin Lineal
ESTADISTICA. U. Sucre
21
ESTADISTICA. U. Sucre
22
380
320
340
360
400
420
r= 0.415
r^2 = 0.172
150
160
170
180
190
360
370
La distribucin de Y,
independientemente del valor de X, se
denomina distribucin marginal.
350
380
390
r= 0.984
r^2 = 0.969
150
160
170
180
190
ESTADISTICA. U. Sucre
23
ESTADISTICA. U. Sucre
24
xy
ESTADISTICA. U. Sucre
25
Propiedades de r
Es adimensional
Slo toma valores en [-1,1]
Las variables son incorreladas r=0
Relacin lineal perfecta entre dos variables r=+1 o r=-1
Excluimos los casos de puntos alineados horiz. o verticalmente.
Cuanto ms cerca est r de +1 o -1 mejor ser el grado de
relacin lineal.
Siempre que no existan observaciones anmalas.
Relacin
inversa
perfecta
Variables
incorreladas
-1
Relacin
directa
casi
perfecta
+1
0
Tema: Regresin Lineal
ESTADISTICA. U. Sucre
26
correlaciones positivas
correlaciones negativas
ESTADISTICA. U. Sucre
27
Animacin:
Evolucin de r y diagrama de dispersin
ESTADISTICA. U. Sucre
28
por qu?
ESTADISTICA. U. Sucre
29
Modelos de regresin
1 variable explicativa
2+ variables explicativas
Simple
Lineal
Mltiple
No lineal
Lineal
No lineal
ESTADISTICA. U. Sucre
30
180
170
b0=89,985
b1=0,466
Aprecias regresin a la media?
160
150
150
160
170
180
190
Correlacin de Pearson
Padre
,759
1,000
(Constante)
Altura del Padre
89,985
,466
9,180
,053
R
R cuadrado
a
,759
,577
R cuadrado
corregida
,569
Error tp. de la
estimacin
3,480
a. Variables
predictoras:
(Constante), Altura del Padre
Tema: Regresin
Lineal
31
ESTADISTICA. U. Sucre
200
datos<-data.frame(X,Y)
10.0
9.5
X
0.01794
#Grfica de dispersin
7.5
7.0
8.0
datos
Coefficients:
(Intercept)
7.00661
9.0
Y<-c(7.4,7.0,8.2,7.6,9.2,8.6,9.0,10.0,10.3)
X<-c(0,18,42,81,100,118,125,141,169)
Call:
lm(formula = Y ~ X)
8.5
#modelo de regresin
50
100
150
modelo<-lm(Y~X)
modelo
#Grfico de dispersin con linea de regresin
plot(X,Y,col=1:3,main="tiempo vs. slidos solubles")
abline(modelo)
Coefficients:
Coefficients:
Estimate
Estimate Std.
Std. Error
Error t
t value
value Pr(>|t|)
Pr(>|t|)
(Intercept)
7.006614
0.337556
20.757
1.51e-07
(Intercept) 7.006614
0.337556 20.757 1.51e-07 ***
***
X
0.017935
0.003258
5.506
0.000901
X
0.017935
0.003258
5.506 0.000901 ***
***
-----
Residual
standard error:
Residual standard
error: 0.5312
0.5312 on
on 7
7 degrees
degrees of
of freedom
freedom
Multiple
Adjusted
Multiple R-squared:
R-squared: 0.8124,
0.8124,
Adjusted R-squared:
R-squared: 0.7856
0.7856
F-statistic:
30.31
on
1
and
7
DF,
p-value:
0.000901
F-statistic: 30.31 on 1 and 7 DF, p-value: 0.000901
anova(modelo)
# Grfico de diagnstico de los residuales
plot(modelo)
#residuales
resi<-residuals(modelo)
Analysis
Analysis of
of Variance
Variance Table
Table
Response:
Response: Y
Y
Df
Df
X
1
X
1
Residuals
Residuals 7
7
-----
Sum
Pr(>F)
Sum Sq
Sq Mean
Mean Sq
Sq F
F value
value
Pr(>F)
8.5536
0.000901 ***
8.5536 8.5536
8.5536 30.313
30.313 0.000901
***
1.9752
1.9752 0.2822
0.2822
Analysis
Analysis of
of Variance
Variance Table
Table
Response:
Response: long
long
Df
Df Sum
Sum Sq
Sq Mean
Mean Sq
Sq F
F value
value
Pr(>F)
Pr(>F)
trat
2
421.20
trat
2 421.20
0.0001508
0.0001508 ***
***
Residuals
Residuals 18
18 253.99
253.99
210.60
210.60
14.925
14.925
14.11
14.11
Df
Pr(>F)
Df Sum
Sum Sq
Sq Mean
Mean Sq
Sq F
F value
value
Pr(>F)
trat
2
421.20
210.60
trat
2 421.20 210.60 14.925
14.925
trat:
trat: RespL
RespL 1
1 416.93
416.93 416.93
416.93 29.547
29.547
trat:
4.28
4.28
0.303
trat: RespC
RespC 1
1
4.28
4.28
0.303
Residuals
18
253.99
14.11
Residuals
18 253.99
14.11
0.0001508
0.0001508 ***
***
3.652e-05
3.652e-05 ***
***
0.5887848
0.5887848
-----
Call:
Call:
lm(formula
lm(formula =
= long
long ~
~ t,
t, data
data =
= base)
base)
50
50
longitud
longitud vs.
vs. concentracin
concentracin
tt
30
30
40
40
Coefficients:
Coefficients:
Estimate
Estimate Std.
Std. Error
Error t
t value
value Pr(>|t|)
Pr(>|t|)
(Intercept)
21.29524
1.27208
16.740
7.86e-13
(Intercept) 21.29524
1.27208 16.740 7.86e-13 ***
***
t
-0.21829
0.03941 -5.538
-5.538 2.42e-05
2.42e-05 ***
***
t
-0.21829
0.03941
00
10
10
20
20
----Multiple
Multiple R-squared:
R-squared: 0.6175,
0.6175,
10
10
15
15
20
20
long
long
25
25
30
30
Adjusted
Adjusted R-squared:
R-squared: 0.5974
0.5974
Analysis
Analysis of
of Variance
Variance Table
Table
Response:
long
Response: long
Df
Sum Sq
Mean Sq
Pr(>F)
Df Sum
Sq Mean
Sq F
F value
value
Pr(>F)
t
1
2.424e-05 ***
t
1 416.93
416.93 416.93
416.93 30.672
30.672 2.424e-05
***
Residuals
13.59
Residuals 19
19 258.26
258.26
13.59
----Tema: Regresin Lineal
ESTADISTICA. U. Sucre
33