Beruflich Dokumente
Kultur Dokumente
Regresin y Correlacin
Regresin y Correlac
Francis Galton
Primo de Darwin
Estadstico y aventurero
Fundador (con otros) de
la estadstica moderna
para explicar las teoras
de Darwin.
Conclusin
Padres
Hoy
Regresin y Correlac
Yi x i i
Parmetros
Error
Residual
Parte sistemtica
Regresin y Correlac
Regresin y Correlac
Regresin y Correlac
( x1 , y1 ) , ( x2 , y2 ) , ... , ( xn , yn )
Modelo de Regresin
Yi x i i
y i ~ N ( E (Y / x i ), 2 )
Recta de Estimacin
Regresin y Correlac
y a b. x
Regresin Lineal
Algebra de la Muestra.
X = Variable independiente
Predictora
Explicativa
Regresin y Correlac
Regresin y Correlac
Altura
en cm.
Peso
en Kg.
162
61
154
60
180
78
158
62
171
66
169
60
166
54
176
84
163
68
...
...
Pesa 50 kg.
Mide 161 cm.
Regresin y Correlac
Pesa 76 kg.
au
o
es
p
El
a
r
u
alt
a
l
n
co
a
nt
e
m
Regresin y Correlac
10 kg.
10 cm.
Regresin y Correlac
Estimacin
a
b
y a b. x i
2 n 2
( yi yi ) ei mnimo
i 1
i 1
Regresin y Correlac
2 n
2
(
y
y
)
[
y
(
a
b
.
x
)]
i i i
i
i 1
i 1
(a, b) [ yi a b. x i ]2 mn
i 1
(a, b)
0
a
a Y b. X
(a , b)
0
b
n
xi . yi n. X .Y
i 1
x
i 1
Regresin y Correlac
2
i
n. X
( xi . X ).( yi Y )
i 1
( xi X ) 2
i 1
Cov ( x , y )
V ( x)
Covarianza de X e Y
1
cov( x , y ) ( x i x )( yi y )
n i
Regresin y Correlac
150
160
170
180
190
200
Regresin y Correlac
e i yo yc
2
i ~ N (0, )
cov( i , j ) 0 i j
Regresin y Correlac
yo
ei
e1
Regresin y Correlac
en
y a bx
b= pendiente de la recta
Regresin y Correlac
Regresin y Correlac
Interpretacin de la variabilidad en Y
En primer lugar olvidemos que existe la
variable X. Veamos cul es la variabilidad
en el eje Y.
Regresin y Correlac
Regresin y Correlac
Coeficiente de Determinacin = r2
Error no Explicado
Error Explicado
yo
Error total
Regresin y Correlac
Error total
= Error no Explicado
Error Explicado
Y y i y i y i Y
Y
y
n
i 1
yi Y
n
i 1
i y
i Y
yi y
y
n
i 1
i 1
i y
i Y
y
y i y i y i Y
2
i 1
V .T .V . N .E V .E .
Regresin y Correlac
V .T . V . N .E .V .E .
V . N .E . V .E .
V .T .
V .T .
V .T .
V .T .
V . N .E . V .E .
2
1
r
V .T .
V .T .
0 r2 1
r 2 0 VE 0 VNE VT
r 2 1 VE VT VNE 0
No detecta el tipo de relacion
Regresin y Correlac
Coeficiente de Determinacin
Resumiendo:
VNE
R 1
VT
2
S
Regresin y Correlac
2
e
2
Y
Regresin y Correlac
Regresin y Correlac
cov( x , y )
Sx Sy
Coeficiente de Correlacin :r
Existe una relacin lineal entre las variables, la cual est medida por el
coeficiente de correlacin poblacional definido como :
E( y) y V( y) 2y
xy
E[(X x ) 2 ]E[(Y y ) 2 ]
r Coeficiente de Corr. Muestral
Regresin y Correlac
1 1
cov( x , y )
r
S ( x ).S ( y ) 1
n
1 n
( x i X )( yi Y )
n i 1
( xi X ) 2 ( yi Y ) 2
x i y i n XY
i 1
( x nX )( y nY )
2
i
2
i
1 r 1
i 1
Regresin y Correlac
(r ) 0 r
1; 1 r 1
Correlaciones Negativas
Regresin y Correlac
correlaciones positivas
Regresin y Correlac
Regresin y Correlac
Regresin y Correlac
Para = 0
r es simtrica alrededor de
r
( n ) es pequeo
1 r
n2
n .
~ t n2
H0 : = 0
H0 : X e Y son independientes
H1 : 0
H1 : X e Y no son independientes
Regresin y Correlac
Normal
a
~ N (0,1)
a
entonces
b ~ N ( , b )
Regresin y Correlac
a e.
n. ( x i X )
e es desconocido
a
~ t n2
Sa
b
~ N (0,1)
b
entonces
con
xi2
como b
b
~ t n2 ,
Sb
( xi X )
e es desconocido
Y X
i
Yi X i
con
i ~ N (0, 2 )
a bx i
E (Yi ) E (a ) E (b) x i
xi
E ( y i ) x i E ( yi )
y i es un estimador no viciado de x i
Regresin y Correlac
V {Y b( x i X )}
V (Yi ) V (a bx i )
V (Yi ) V (Y ) ( x i X ) 2V (b)
2
V (Y )
n
V ( i )
2
2
e
2
2
V (Yi )
( xi X ) 2 .
n
( xi X ) 2
(
x
X
)
1
2
i
V (Yi )
2
n ( xi X )
Regresin y Correlac
ESTIMACIN DE LA MEDIA DE Yi
Correspondiente a un valor conocido de xi
Yi ~ N ( . x i , e )
y i ( . x i ) y i yi
y i
y i
y i
S ( y i )
~ N (0,1)
y i ( . x i ) y i yi
S ( y i )
S ( y i )
~ t n2
y i t n 2; / 2 .S ( y i ) yi y i t n 2; / 2 .S ( y i )
Regresin y Correlac
la variacin propia
la
PARA Xi FIJO
de los errores
X
)
i
V ( y / x i ) S
2
( yi )
1
( xi X ) 2
S . 1
2
n
(
x
X
)
i
2
e
y i t n 2; / 2 .S ( yi ) y y i t n 2; / 2 .S ( yi )
Regresin y Correlac