Sie sind auf Seite 1von 17

ANLISE DISCRIMINANTE

Carlos A. A. Varella
ANLISE MULTIVARIADA APLICADA AS CINCIAS AGRRIAS
PS-GRADUAO EM AGRONOMIA CINCIA DO SOLO: CPGA-CS
ANLISE DISCRIMINANTE
Segundo KHATTREE & NAIK (2000) uma tcnica da estatstica
multivariada que estuda a separao de objetos de uma
populao em duas ou mais classes.

DISCRIMINAO
A discriminao ou separao a primeira etapa, sendo
a parte exploratria da anlise e consiste em se
procurar caractersticas capazes de serem utilizadas
para alocar objetos em diferentes grupos previamente
definidos.
CLASSIFICAO
A classificao ou alocao pode ser definida como um
conjunto de regras que sero usadas para alocar novos
objetos (JOHNSON & WICHERN, 1999).
CONFUSO
A funo que separa objetos pode tambm servir
para alocar, e, o inverso, regras que alocam
objetos podem ser usadas para separar.
Normalmente, discriminao e classificao se
sobrepem na anlise, e a distino entre
separao e alocao confusa.
FISHER, 1936
Segundo REGAZZI (2000) o problema da
discriminao entre dois ou mais grupos,
visando posterior classificao, foi
inicialmente abordado por Fisher (1936).
Funes matemticas capazes de classificar
um indivduo X em uma de vrias
populaes ti;
Com base em medidas de um nmero p de
caractersticas, buscando minimizar a
probabilidade de m classificao, isto ,
minimizar a probabilidade de classificar
erroneamente um indivduo em uma
populao ti, quando realmente pertence a
populao tj.

REGIES DE ALOCAO
Regies de alocao so conjunto de valores
separados por uma fronteira definida por uma
funo discriminante qualquer.

Funo Linear
Funo Quadrtica
FUNES DISCRIMINANTES
Funes discriminantes podem ser modelos
estatsticos, de redes neurais ou lgica fuzzy.
Os parmetros so ajustados a partir de amostras
de treinamento.
O modelo de Fisher estatstico.
REGRAS DE CLASSIFICAO
Uma boa regra de classificao deve resultar em
pequenos erros;

Deve haver pouca probabilidade de m classificao;

Segundo JOHNSON & WICHERN (1999) para que isso
ocorra a regra de classificao deve considerar as
probabilidades a priori e os custos de m classificao.
REGRAS DE CLASSIFICAO
As regras de classificao devem considerar se as
varincias das populaes so iguais ou no;

varincias de populaes iguais gera funes
discriminantes lineares;

varincias de populaes diferentes gera funes
discriminantes quadrticas;



FUNO DISCRIMINANTE LINEAR DE
FISHER
uma combinao linear de caractersticas originais
que se caracteriza por produzir separao mxima
entre duas populaes
FUNO DISCRIMINANTE LINEAR DE
FISHER
Demonstra-se que a funo linear do vetor aleatrio X
que produz separao mxima entre duas populaes
dada por:

( ) | | X X L X D E = =
1
2 1
' '

L
= vetor discriminante;
X
= vetor aleatrio de caractersticas das populaes;
= vetor de mdias p-variado;
E
=
matriz comum de covarincias das populaes t
1
e t
2
;

FUNO DISCRIMINANTE LINEAR DE
FISHER
O valor da funo discriminante de Fisher para uma
dada observao :

( ) | |
o o
x x D E =
1
2 1
'

O ponto mdio entre as duas mdias
populacionais univariadas
1
e
1
:

| | | |
2 1
1
2 1
'
2
1
+ E =

m
( ) ( ) | |
2 1
2
1
D D m + =
FUNO DISCRIMINANTE LINEAR DE
FISHER
A regra de classificao baseada na funo
discriminante de Fisher :
Alocar
o
x em
t
1 se
( )
| |
m x x D
o o
> E =
1
2 1
'



Alocar
o
x em
t
2 se
( ) | |
m x x D
o o
< E =
1
2 1
'



MATRIZ COMUM DE COVARINCIAS S
C

Assumimos que as populaes t
1
e t
2
tm a mesma
matriz de covarincias E.
( ) ( ) ( ) ( )
2
2 1
2
1
2 1
1
1 1
1
1 1
1
S
n n
n
S
n n
n
S
c

(

+

+
(

+

=
c
S
1
n
2
n
1
S
2
S
c
S
=
estimativa da matriz comum de covarincias E;
1
n
=
nmero de observaes da populao t
1
;
2
n
=
nmero de observaes da populao t
2
;
1
S
=
estimativa matriz de covarincias da populao t
1
;
2
S
=
estimativa matriz de covarincias da populao t
2
;

A FUNO DISCRIMINANTE LINEAR AMOSTRAL
DE FISHER
obtida substituindo-se os parmetros
1
,
2
e E pelas
respectivas quantidades amostrais:

1
x
2
x
c
S
( ) | | x S x x x L x D
c
= =
1
2 1
'

'
( ) x D = funo discriminante linear amostral de Fisher;
'

L
= estimativa do vetor disriminante;
1
x
= mdia amostral da populao t
1
;
2
x
= mdia amostral da populao t
2
.

EXEMPLO DE APLICAO
Vamos considerar os dados de temperatura de
duas localidades de Pernambuco:

Triunfo
Recife

Das könnte Ihnen auch gefallen