Beruflich Dokumente
Kultur Dokumente
Regresión logı́stica
Introducción a la regresión logı́stica
Estimación de parámetros
Referencias Bibliográficas
yi = β0 + β1 xi + εi ,
donde yi y xi son la i-esima observación de la variable de respuesta y
predictora, respectivamente; β0 es el intercepto; β1 es la pendiente; y
εi es el i-esimo error.
σ2
SE2 (β∗1 ) = PN
i=1 (xi − x̄)2
donde σ2 = VAR(ε).
I Esto puede ser utilizado para establecer intervalos de confianza
(e.g. 95%) para los estimadores
β∗1 ± 2 · SE(β∗1 )
β∗1 − 0
t=
SE(β∗1 )
Coeficiente de
determinación
El coeficiente de
determinación del
modelo es
ESS
R2 =
TSS
yi = β0 + β1 xi1 + · · · + βp xip + εi .
Equivalentemente
Y = Xβ + ε,
donde Y ∈ Rn ; X ∈ Rn×(p+1) ; β ∈ R(p+1) ; y ε ∈ Rn .
Andrés G. Abad, Ph.D., agabad@espol.edu.ec 16 / 39
Regresión lineal múltiple II
∂RSS
= − 2X| (y − Xβ) X| (y − Xβ) =0
∂β
∂2 RSS β̂ = (X| X)−1 X| y
=2X| X
∂β∂β|
Tenemos ası́ la estimación ŷ dada por
ŷ = Xβ̂
ŷ = X(X| X)−1 X| y
Coeficiente de determinación
El coeficiente de determinación del modelo es
ESS
R2 = .
TSS
n−1
R2adj = 1 − (1 − R2 ),
n−k−1
donde n es el tamaño de la muestra y k número de variables
independientes
El estadı́stico de la prueba es
(TSS − RSS)/p
F= ∼ Fp,n−p−1
RSS/(n − p − 1)
N
1 X h i
min wi l(yi , β0 + β| xi ) + λ (1 − α)kβk22 /2 + αkβk1 ,
β0 ,β N
i=1
Lambda
3000 400 55 20
Automtc1
150
Coefficients
50
MetColr1
Weight
0
KM
−100
Age
8 7 6 5 4 3
Log Lambda
UniversalBank Data
I Age of customer in years
I Experience: professional experience in years
I Income of customer
I Family size of customer
I CCAvg: average monthly credit card spending
I Mortgage: size of mortgage
I SecuritiesAccount: No/Yes
I CDAccount: No/Yes
I Online: No/Yes
I CreditCard: No/Yes
I Educational level: three categories (undergraduate,
Andrés G. Abad, Ph.D., agabad@espol.edu.ec
graduate, professional) 29 / 39
Regresión logı́stica II
La idea es transformar la respuesta y = β0 + β1 x1 + · · · + βp xp de la
siguiente manera
1
p(y) =
1 + exp−y
1
= .
1 + exp−β0 −β1 x1 −···−βp xp
p
log( ) = β0 + β1 x1 + · · · + βp xp .
1−p
1
P{PersonalLoan = 1|Income = x} =
1 + exp−β0 −β1 x
1
P{PersonalLoan = 1|Income = x} =
1+ exp6.3525−0.0392x
lo que es equivalente a
N
X
yi log(p(xi )) + (1 − yi ) log(1 − p(xi ))
arg max
β0 ,β1
i=1
logit=-13.201-
0.045Age+0.057Experience+0.066Income+0.572Family
+0.187CCAvg+0.002Mortgage-0.855Securities+3.469CD
-0.844Online-0.964CreditCard+4.589EduGrad+4.523EducProf
I Matriz de confusión
I Curva ROC (receiver operating characteristic)
I Curva Lift