Sie sind auf Seite 1von 17

Pontifícia Universidade Católica do Paraná (PUCPR)

Programa de Pós-Graduação em Informática (PPGIA)

Reconhecimento de Padrões

Revisão de Probabilidade e
Estatística

Luiz Eduardo S. Oliveira, Ph.D.


www.ppgia.pucpr.br/~soares

Conceitos Básicos
• Estamos realizando um evento aleatório (pegar um
peixe no mar)
• Espaço amostral S
– Conjunto de todas a possibilidades
• Um evento A
– Um subconjunto de S
• Lei da probabilidade
– Regra que atribui uma probabilidade aos eventos de um
experimento
S

1
Axiomas Básicos da Probabilidade
• P(A) >= 0
• P(S) = 1
• P(AUB) = P(A)+P(B) se A e B forem
mutuamente exclusivos
– Eventos que não ocorrem simultaneamente,
ou seja A∩B = ø
• Caso contrário
– P(AUB) = P(A)+P(B) – P(A∩B)
• P(A) + P(~A)= 1

Probabilidade Condicional
• A probabilidade de ocorrer um evento, na
condição de que outro evento já tenha ocorrido.
P( A Ι B )
P( A | B ) =
P( B)
• Considere o seguinte exemplo:
– 250 alunos estão matriculados no primeiro ano
• 100 homens e 150 mulheres
• 110 cursam física e 140 química

Sexo\Discip. Física Quimica Total


H 40 60 100
M 70 80 150
Total 110 140 250

2
Probabilidade Condicional
• Um aluno é sorteado ao acaso. Qual a
probabilidade de que esteja cursando
química dado que seja mulher.
80
P (Q Ι M ) 250 80
P (Q | M ) = = = = 0.53
P( M ) 150 150
250

Probabilidade Total
• Uma sequência finita de experimentos na qual
cada experimento tem um número finito de
resultados com uma determinada probabilidade
é chamada de processo estocástico finito.
• Árvore Bayesiana é uma boa ferramenta para
visualização do problema.
• A probabilidade final é calculada pela lei da
probabilidade final.

3
Probabilidade Total: Exemplo
• Considere 3 caixas
– Caixa 1 tem 10 lampadas, das quais 4 com defeito
– Caixa 2 tem 6 lâmpadas, das quais 1 com defeito
– Caixa 3 tem 8 lâmpadas, das quais 3 com defeito.
• O problema consiste em saber a probabilidade de uma lâmpada ser
defeituosa P(A), ao selecionar uma caixa aleatoriamente e depois
selecionar uma lâmpada aleatoriamente.
4/10
Defeito
1 6/10 Ok
1/3
1/6 Defeito
1/3 2 Baseado no conceito de probabilidade total,
5/6
Ok temos como probabilidade P(A)

1/3 3/8 Defeito


3 5/8 1 4  1 1 1 3
Ok P( A) =  ×  +  ×  +  ×  = 0.31
 3 10   3 6   3 8 

Eventos Independentes
• Dois eventos são ditos independentes se
P(A∩B) = P(A) * P(B)
• Logo, pela regra da probabilidade
condicional, se A e B são independentes,
P( A) × P ( B )
P( A | B ) = = P( A)
P( B)

4
Exemplo
• Suponha que uma urna contenha 4 bolas brancas e 6
vermelhas. Vamos sortear duas bolas (sem reposição)
em momentos distintos. Qual a probabilidade de sair
uma bola branca seguida de uma vermelha

P(B) = 3/9

P(B) = 4/10 P(V) = 6/9

P(B) = 4/9
P(V) = 6/10

P(V) = 5/9

Exemplo (cont)
• Agora considere o exemplo anterior com
reposição, ou seja, eventos
independentes.
• P(B,V) = P(B) X P(V) = 4/10 X 6/10 = 0.24

5
Teorema de Bayes
• Basicamente o teorema de Bayes mostra como
rever as crenças sempre que novas evidências
são coletadas.
• Ou seja, atualizar a probabilidade a posteriori
utilizando para isso a probabilidade a priori e as
verossimilhanças e as evidências.
Verosimilhanças
priori
(likelihood)

P( A) × ( B | A)
Prob. a P( A | B ) =
posteriori P( B) Evidências

P( B) = ∑ P( Ai ) × P( B | Ai )

Teorema de Bayes:Exemplo
• Um médico sabe que a meningite causa
torcicolo em 50% dos casos. Porém, o médico
sabe que a meningite atinge 1/50000 e também
que a probabilidade de se ter torcicolo é de
1/20.
• Usando Bayes pra saber a probabilidade de
uma pessoa ter meningite dado que ela está
com torcicolo
P(T|M) = 0.5
P(M) = 1/50000
P(T) = 1/20
P( M ) × (T | M ) 1 / 50000 × 0.5
P( M | T ) = = = 0.0002
P (T ) 1 / 20

6
Teorema de Bayes:Exercício
• Considere o sistema de classificação de peixes visto anteriormente.
Para essa época do ano, sabe-se que a probabilidade de pescar
salmão é maior que pescar robalo, P(salmão) = 0.82 e P(robabo) =
0.18.
• Suponha que a única característica que você pode contar é a
intensidade do peixe ou seja, se ele é claro ou escuro. Sabe-se que
49.5% dos salmões tem intensidade clara e que 85% dos robalos
tem intensidade clara.
• Calcule a probabilidade de ser salmão dado que o peixe amostrado
tem intensidade clara.

P( S ) × (C | S ) 0.82 × 0.495
P( S | C ) = = = 0.726
P(C ) 0.82 × 0.495 + 0.18 × 0.85

Probabilidade total

Variáveis Aleatórias
• Na prática, muitas vezes é mais interessante
associarmos um número a um evento aleatório
e calcularmos a probabilidade da ocorrência
desse número do que a probabilidade do
evento.
• Exemplo: Lançam-se três moedas. Seja X o
numero de ocorrências da face cara. Determinar
a distribuição de probabilidade de X
– S = {ccc,cck,ckc,ckk,kcc,kck,kkc,kkk}
– Se X é o número de caras, X assume os valores
0,1,2, e 3.

7
Variáveis Aleatórias
• Podemos associar a esses números
eventos que correspondem a ocorrência
de nenhuma, uma, duas ou três caras.
• Desta forma temos
– P(X=0) = 1/8
– P(X=1) = 3/8
– P(X=2) = 3/8
– P(X=3) = 1/8
Distribuição de Probabilidades

∑ P( X ) = 1
i

Variáveis Aleatórias
• Portanto, podemos definir que variável
aleatória é a função que associa a todo
evento pertencente a uma partição do
espaço amostral um único número real.
• Variáveis podem ser discretas ou
contínuas

8
Parâmetros de uma Distribuição
• Existem características numéricas que
são muito importantes em uma
distribuição de probabilidades. São os
parâmetros da distribuição
– Esperança matemática e variância.
• Esperança matemática
E ( X ) = ∑ X i × P( X i )

Esperança Matemática: Exemplo


• Uma seguradora paga 30000 em caso de
acidente de carro e cobra franquia de 1000.
Sabe-se que a probabilidade de que um carro
sofra acidente é de 3%. Quanto espera a
seguradora ganhar por carro segurado.
• Variável Aleatória: X
X P(X) E(X) = 1K * .97 + -29K *.03 = 100
1000 0.97
-29000 0.03
Esperança (lucro médio) é de 100 por
Distribuição de Probabilidade carro. Deve ser interpretada como
valor médio

9
Variância
• Conhecendo a média (esperança) de uma
distribuição de probabilidades, podemos
calcular o grau de dispersão em torno da
média
VAR( X ) = (∑ X i
2
)
×P ( X i ) − [E ( X )]
2

Variáveis Aleatórias Contínuas


• Podemos definir uma variável aleatória
contínua como sendo a variável aleatória
X em R se existir uma função f(x) tal que:

10
Calculando as probabilidades

Caso discreto: Caso contínuo:


- Probabilidades -Densidade e não probabilidades
- P(peixe ter 2 ou 3 nadadeiras) = -Probabilidade do peixe pesar entre
- P(2) + P(3) = 0.3+0.4 29 e 31 kgs.
- Integrar
Use a soma

Distribuições Teóricas
• As distribuições teóricas associam uma
probabilidade a cada resultado numérico
de um experimento, ou seja, dá a
probabilidade de cada valor de uma
variável aleatória.
• Podem ter uma variedade de formas.
– Simétricas e não simétricas.
• Binomial, Poisson, Exponencial, Normal

11
Distribuição Normal (Gaussiana)
• A distribuição normal é a mais importante
das distribuições pois muitas variáveis
aleatórias de ocorrência natural ou de
processos práticos obedecem a esta
distribuição.
• Formato de sino
• Simétrica
• Unimodal

Distribuição Normal
• A função densidade para esta distribuição é
dada por

• Como podemos perceber, a distribuição normal


inclui dois parâmetros
– µ – média populacional
– σ – desvio padrão populacional.
• Denotamos N(µ, σ) a curva normal com média µ
e desvio padrão σ

12
Distribuição Normal
• A média refere-se ao centro da
distribuição e o desvio padrão ao
espalhamento (ou achatamento) da curva.

Distribuição Normal

68.27%
95.45%
99.73%

13
Exemplo
• O peso de recém-nascidos é uma variável
aleatória contínua. A Figura abaixo mostra a
distribuição de freqüências relativas 5000 pesos
de recém-nascidos.

Exemplo

• Considerando µ = 2800g, σ = 500g,


podemos concluir que
– P(2300 <= X <= 3300) = 68.3%
– P(1800 <= X <= 3800) = 95.5%
– P(1300 <= X <= 4300) = 99.7%
• Porém, na prática desejamos calcular
probabilidades para diferentes valores
de µ e σ.

14
Distribuição Normal
• Para isso, a variável X cuja distribuição
N(µ, σ) é transformada numa forma
padronizada Z, com distribuição N(0,1)
(distribuição normal padrão), pois tal
distribuição é tabelada.
• A normalização se dá por
X −µ
Z=
σ

Utilizando a Tábua de
Probabilidades
• Primeiro é necessário decompor Z em
duas parcelas
• Por exemplo, Z = 1.39
– Primeira parcela = 1.3
– Segunda parcela = 0.09
• No cruzamento das duas parcelas
encontra-se a probabilidade
correspondente a área da curva entre 0 e
Z.

15
Exemplo
• Considere a seguinte distribuição
– X -> N(30;4)
– Calcule a probabilidade de X >= 40.
40 − 30
Z= = 2 .5
4

Da tabela,
temos 0.4938
Logo,
P(X>=40) = 0.5 – 0.4938

0 2.5

Exercício
• Uma fábrica de carros sabe que os
motores de sua fabricação têm duração
normal com média 150 mil km e desvio de
5 mil. Qual a probabilidade de que um
carro escolhido ao acaso dure
– a) menos de 170 mil
– b) entre 140 e 165 mil

16
Exercício
• a) P(X < 170)
– Z = 4. Da tabela temos 0.4999968
– Logo P(X<170) = 0.5 + 0.4999= 0.999

Teorema Central do Limite


• A medida em que o tamanho da amostra
X cresce, a distribuição de X se aproxima
da distribuição normal

17

Das könnte Ihnen auch gefallen