Beruflich Dokumente
Kultur Dokumente
1.
2.
3.
Introduccin
Metodologa Estadstica
2.1 Pruebas estadsticas preliminares
2.2 Mtodos de discriminacin
Funcin discriminante lineal de Fisher
Funcin discriminante de Mxima verosimilitud
Anlisis de regresin discriminante
Distancia de Mahalanobis
2.3 Evaluacin de la funcin discriminante
2.4 Evaluacin de la clasificacin
2.5 Clasificacin de nuevas observaciones
2.6 Anlisis discriminante con ms de dos grupos
Ejemplo de aplicacin
1. Introduccin
Es un mtodo multivariado cuyo propsito es el de
clasificar nuevos individuos u objetos en grupos o
poblaciones previamente definidas, para lo cual se
desarrollan reglas o funciones discriminantes que
son construidas en base del conjunto de variables
que son medidas sobre los individuos u objetos.
El AD, es considerado un mtodo de dependencia;
las variables que permiten clasificar son llamadas
clasificadoras, predictoras o explicativas (variables
independientes), mientras que se usa una variable
categrica (variable dependiente) para identificar al
grupo que pertenece el individuo.
Caractersticas
El AD, se usa para fines explicativos (identificar
variables que mejor discriminen entre los grupos),
predictivos (seleccionar variables) y reclasificacin
(nuevas observaciones).
El AD, esta afectado por las unidades de medida
de las variables explicativas.
En el AD, se puede distinguir el anlisis
discriminante simple, cuando la variable
dependiente considera dos categoras (dos grupos:
G=2) y el anlisis discriminante mltiple, cuando
existen ms de dos categoras (ms de dos grupos:
G>2).
Caractersticas
La diferencia principal entre ambos, es el nmero
de funciones discriminantes que se pueden
obtener. En el ADS se obtiene slo una funcin
discriminante; mientras que el ADM se pueden
obtener el Mnimo(G-1, p) funciones discriminantes,
donde p= N de variables indep.
En el AD es posible retener o seleccionar un grupo
del conjunto de variables independientes para
obtener la funcin discriminante. Se emplean
tcnicas de seleccin de variables que son
aplicables en el anlisis de regresin lineal mltiple:
seleccin haca adelante (forward), haca atrs
(backward) y por pasos (stepwise).
2
g
Wg
g
Sg
ng 1
G
g 1
n K
2
W
g 1
nG
(n
g 1
1)
nG
2.1
Di a1 X1i a2 X 2i a3 X 3i . . . a p X pi
i 1,2,..,n
i en el grupo I
Si Di C , se clasifica al individuo i en el grupo II
Si Di C
DI DII
C
2
L j ( x) max f i ( x)
i
( X i )' 1 ( X i )
La lambda de Wills
La V de Rao
d ( xi x I )' S ( xi x I )
d
2
iI
2
iII
( xi x II )' S ( xi x II )
i
i
1 i
Cuando i se aproxima a 1, indicar que la funcin i-sima muestra
gran capacidad explicativa para la funcin discriminante. Eta
(correlacin cannica) i al cuadrado representa la proporcin de la
variancia total de la variable a explicar que es explicada por la funcin
discriminante i.
p g g 1
V j n 1
j 0,1,2,..., g 2
Ln(1 i )
2 i j 1
g x Pr ob( D / g )
G
x Pr ob( D / i)
i 1
3. Ejemplo de aplicacin
Anlisis discriminante simple. Una entidad financiera
cuenta con algunas caractersticas de prstamos
concedidos a sus clientes. Se trata de construir una funcin
discriminante que clasifique con los menores errores
posibles a los clientes en dos grupos: fallidos y no fallidos Si
se obtienen un buen resultados de clasificacin, en etapas
posteriores se utilizar la funcin discriminante construida
para determinar si se concede el prstamo a nuevos
solicitantes. De esta forma, si a un nuevo solicitante se le
clasifica a priori como fallido, no se le conceder el
prstamo solicitado.
Variable Dependiente
Tipo de cliente: 1=Fallido 2=No Fallido
Variables Independientes
mon_pre = Monto de prstamo (miles soles)
pat_net = Patrimonio neto (miles soles)
deu_pen = Deuda pendiente (miles soles)
Ejemplo 1 de aplicacin
Anlisis discriminante mltiple. El objetivo del estudio es
tratar de determinar cules son las variables que realmente
sirven para discriminar entre las empresas que tienen
resultados clasificados como Bajos, Medios y Altos.
Variable Dependiente
Resultados monetarios de las empresas: 1=Bajos,
2=Medios y 3=Altos
Variables Independientes
Incremento (%) en el presupuesto publicitario con
respecto al periodo anterior (inc_publ)
Incremento (%) en el presupuesto promocional con
respecto al ejercicio anterior (inc_prom)
Inversin de patrocinio (patrocin).
Duracin en das de las actividades promocionales de la
empresa (promocio)
Duracin en das de las actividades publicitarias de la
empresa (publicit)
Ejemplo 2 de aplicacin
1. Con el archivo Distritos Peruanos se va realiz el Anlisis Cluster
Utilizando como mtrica la Distancia Euclidia al cuadrado y como
mtodo de agrupamiento el Mtodo del Vecino Ms Lejano y teniendo
en cuenta la condicin mnima necesaria Cuntos clusters se
forman y cuntos distritos tiene cada uno? D la relacin de los 4 pri
meros distritos que pertenecen al cluster 2.
2. Se desea hacer el Anlisis Discriminante con las clases que fueron
obtenidas con el Anlisis Cluster anterior. Suponga que se quiere
trabajar con las variables ms relevantes utilizando el Mtodo de La
Varianza no Explicada y como criterios usar el valor de F de entrada de
3.84 y de salida de 2.71. Haga las pruebas preliminares que se han
visto en el curso, presente las hiptesis y concluya con un nivel de
significacin de 0.05. Suponiendo que se cumplen los supuestos:
evale las funciones discriminantes.