You are on page 1of 34

Universidade Federal de Ouro Preto (UFOP)

Programa de Ps-Graduao em Cincia da Computao (PPGCC)

Reconhecimento de Padres

Reviso de Probabilidade e
Estatstica

David Menotti, Ph.D.


www.decom.ufop.br/menotti
Conceitos Bsicos
Estamos realizando um evento aleatrio (pegar um
peixe no mar)
Espao amostral S
Conjunto de todas a possibilidades
Um evento A
Um subconjunto de S
Lei da probabilidade
Regra que atribui uma probabilidade aos eventos de um
experimento
S

A
Axiomas Bsicos da Probabilidade
P(A) >= 0
P(S) = 1
P(AUB) = P(A)+P(B) se A e B forem
mutuamente exclusivos
Eventos que no ocorrem simultaneamente,
ou seja AB =
Caso contrrio
P(AUB) = P(A)+P(B) P(AB)
P(A) + P(~A)= 1
Probabilidade Condicional
A probabilidade de ocorrer um evento, na
condio de que outro evento j tenha ocorrido.
P( A B)
P( A | B)
P( B)
Considere o seguinte exemplo:
250 alunos esto matriculados no primeiro ano
100 homens e 150 mulheres
110 cursam fsica e 140 qumica

Sexo\Discip. Fsica Qumica Total


H 40 60 100
M 70 80 150
Total 110 140 250
Probabilidade Condicional
Um aluno sorteado ao acaso. Qual a
probabilidade de que esteja cursando
qumica dado que seja mulher.
80
P (Q M ) 250 80
P (Q | M ) 0.53
P( M ) 150 150
250
Probabilidade Total
Uma sequncia finita de experimentos na qual
cada experimento tem um nmero finito de
resultados com uma determinada probabilidade
chamada de processo estocstico finito.
rvore Bayesiana uma boa ferramenta para
visualizao do problema.
A probabilidade final calculada pela lei da
probabilidade final.
Probabilidade Total: Exemplo
Considere 3 caixas
Caixa 1 tem 10 lampadas, das quais 4 com defeito
Caixa 2 tem 6 lmpadas, das quais 1 com defeito
Caixa 3 tem 8 lmpadas, das quais 3 com defeito.
O problema consiste em saber a probabilidade de uma lmpada ser
defeituosa P(A), ao selecionar uma caixa aleatoriamente e depois
selecionar uma lmpada aleatoriamente.
4/10
Defeito
1 6/10 Ok
1/3
1/6 Defeito
1/3 2 Baseado no conceito de probabilidade total,
5/6
Ok temos como probabilidade P(A)

1/3 3/8 Defeito


3 1 4 1 1 1 3
5/8
Ok P( A) 0.31
3 10 3 6 3 8
Eventos Independentes
Dois eventos so ditos independentes se
P(AB) = P(A) * P(B)
Logo, pela regra da probabilidade
condicional, se A e B so independentes,
P ( A) P ( B )
P( A | B) P ( A)
P( B)
Exemplo
Suponha que uma urna contenha 4 bolas brancas e 6
vermelhas. Vamos sortear duas bolas (sem reposio)
em momentos distintos. Qual a probabilidade de sair
uma bola branca seguida de uma vermelha

P(B) = 3/9

P(B) = 4/10 P(V) = 6/9

P(B) = 4/9
P(V) = 6/10

P(V) = 5/9
Exemplo (cont)
Agora considere o exemplo anterior com
reposio, ou seja, eventos
independentes.
P(B,V) = P(B) X P(V) = 4/10 X 6/10 = 0.24
Teorema de Bayes
Basicamente o teorema de Bayes mostra como
rever as crenas sempre que novas evidncias
so coletadas.
Ou seja, atualizar a probabilidade a posteriori
utilizando para isso a probabilidade a priori e as
verossimilhanas e as evidncias.
Verosimilhanas
priori
(likelihood)

P ( A) P ( B | A)
Prob. a P( A | B)
posteriori P( B) Evidncias

P ( B ) P ( Ai ) P ( B | Ai )
Teorema de Bayes: Exemplo
Um mdico sabe que a meningite causa
torcicolo em 50% dos casos. Porm, o mdico
sabe que a meningite atinge 1/50000 e tambm
que a probabilidade de se ter torcicolo de
1/20.
Usando Bayes pra saber a probabilidade de
uma pessoa ter meningite dado que ela est
com torcicolo
P(T|M) = 0.5
P(M) = 1/50000
P(T) = 1/20
P ( M ) P (T | M ) 1 / 50000 0.5
P( M | T ) 0.0002
P (T ) 1 / 20
Teorema de Bayes: Exerccio
Considere o sistema de classificao de peixes visto anteriormente.
Para essa poca do ano, sabe-se que a probabilidade de pescar
salmo maior que pescar robalo, P(salmo) = 0.82 e P(robabo) =
0.18.
Suponha que a nica caracterstica que voc pode contar a
intensidade do peixe ou seja, se ele claro ou escuro. Sabe-se que
49.5% dos salmes tem intensidade clara e que 85% dos robalos
tem intensidade clara.
Calcule a probabilidade de ser salmo dado que o peixe amostrado
tem intensidade clara.

P( S ) P (C | S ) 0.82 0.495
P( S | C ) 0.726
P (C ) 0.82 0.495 0.18 0.85

Probabilidade total
Variveis Aleatrias
Na prtica, muitas vezes mais interessante
associarmos um nmero a um evento aleatrio
e calcularmos a probabilidade da ocorrncia
desse nmero do que a probabilidade do
evento.
Exemplo: Lanam-se trs moedas. Seja X o
numero de ocorrncias da face cara. Determinar
a distribuio de probabilidade de X
S = {ccc,cck,ckc,ckk,kcc,kck,kkc,kkk}
Se X o nmero de caras, X assume os valores
0,1,2, e 3.
Variveis Aleatrias
Podemos associar a esses nmeros
eventos que correspondem a ocorrncia
de nenhuma, uma, duas ou trs caras.
Desta forma temos
P(X=0) = 1/8
P(X=1) = 3/8
P(X=2) = 3/8
P(X=3) = 1/8 Distribuio de Probabilidades

P( X ) 1
i
Variveis Aleatrias
Portanto, podemos definir que varivel
aleatria a funo que associa a todo
evento pertencente a uma partio do
espao amostral um nico nmero real.
Variveis podem ser discretas ou
contnuas
Parmetros de uma Distribuio
Existem caractersticas numricas que
so muito importantes em uma
distribuio de probabilidades. So os
parmetros da distribuio
Esperana matemtica e varincia.
Esperana matemtica
E ( X ) X i P( X i )
Esperana Matemtica: Exemplo
Uma seguradora paga 30000 em caso de
acidente de carro e cobra franquia de 1000.
Sabe-se que a probabilidade de que um carro
sofra acidente de 3%. Quanto espera a
seguradora ganhar por carro segurado.
Varivel Aleatria: X
X P(X) E(X) = 1K * .97 + -29K *.03 = 100
1000 0.97
-29000 0.03
Esperana (lucro mdio) de 100 por
Distribuio de Probabilidade carro. Deve ser interpretada como
valor mdio
Varincia
Conhecendo a mdia (esperana) de uma
distribuio de probabilidades, podemos
calcular o grau de disperso em torno da
mdia
VAR ( X ) X i
2

P ( X i ) E ( X )
2
Variveis Aleatrias Contnuas
Podemos definir uma varivel aleatria
contnua como sendo a varivel aleatria
X em R se existir uma funo f(x) tal que:
Calculando as probabilidades

Caso discreto: Caso contnuo:


- Probabilidades -Densidade e no probabilidades
- P(peixe ter 2 ou 3 nadadeiras) = -Probabilidade do peixe pesar entre
- P(2) + P(3) = 0.3+0.4 29 e 31 kgs.
- Integrar
Use a soma
Distribuies Tericas
As distribuies tericas associam uma
probabilidade a cada resultado numrico
de um experimento, ou seja, d a
probabilidade de cada valor de uma
varivel aleatria.
Podem ter uma variedade de formas.
Simtricas e no simtricas.
Binomial, Poisson, Exponencial, Normal
Distribuio Normal (Gaussiana)
A distribuio normal a mais importante
das distribuies pois muitas variveis
aleatrias de ocorrncia natural ou de
processos prticos obedecem a esta
distribuio.
Formato de sino
Simtrica
Unimodal
Distribuio Normal
A funo densidade para esta distribuio dada
por

Como podemos perceber, a distribuio normal


inclui dois parmetros
mdia populacional
desvio padro populacional.
Denotamos N(, ) a curva normal com mdia e
desvio padro
Distribuio Normal
A mdia refere-se ao centro da
distribuio e o desvio padro ao
espalhamento (ou achatamento) da curva.
Distribuio Normal

68.27%
95.45%
99.73%
Exemplo
O peso de recm-nascidos uma varivel aleatria
contnua. A Figura abaixo mostra a distribuio de
freqncias relativas 5000 pesos de recm-nascidos.
Exemplo

Considerando = 2800g, = 500g,


podemos concluir que
P(2300 <= X <= 3300) = 68.3%
P(1800 <= X <= 3800) = 95.5%
P(1300 <= X <= 4300) = 99.7%
Porm, na prtica desejamos calcular
probabilidades para diferentes valores de
e .
Distribuio Normal
Para isso, a varivel X cuja distribuio
N(, ) transformada numa forma
padronizada Z, com distribuio N(0,1)
(distribuio normal padro), pois tal
distribuio tabelada.
A normalizao se d por
X
Z

Utilizando a Tbua de
Probabilidades
Primeiro necessrio decompor Z em duas
parcelas
Por exemplo, Z = 1.39
Primeira parcela = 1.3
Segunda parcela = 0.09
No cruzamento das duas parcelas encontra-
se a probabilidade correspondente a rea
da curva entre 0 e Z.
Exemplo
Considere a seguinte distribuio
X -> N(30;4)
Calcule a probabilidade de X >= 40.
40 30
Z 2.5
4

Da tabela,
temos 0.4938
Logo,
P(X>=40) = 0.5 0.4938

0 2.5
Exerccio
Uma fbrica de carros sabe que os
motores de sua fabricao tm durao
normal com mdia 150 mil km e desvio de
5 mil. Qual a probabilidade de que um
carro escolhido ao acaso dure
a) menos de 170 mil
b) entre 140 e 165 mil
Exerccio
a) P(X < 170)
Z = 4. Da tabela temos 0.4999968
Logo P(X<170) = 0.5 + 0.4999= 0.999
Teorema Central do Limite
A medida em que o tamanho da amostra
X cresce, a distribuio de X se aproxima
da distribuio normal