Beruflich Dokumente
Kultur Dokumente
NOÇÕES DE
PROBABILIDADE E ESTATÍSTICA
2011
PROBABILIDADE E ESTATÍSTICA
Para Levasseur a estatística é: “O estudo numérico dos fatos sociais”. Yule define
estatística como: “Dados quantitativos afetados marcadamente por uma multiplicidade de
causas”.
Uma definição mais usual nos dias de hoje seria: “Um método científico que permite a
análise, em base probabilística, de dados coligados e condensados”. Ou ainda podemos
dizer que Estatística é um conjunto de métodos quantitativos, que servem para a coleta,
organização, redução e apresentação de dados, análise dos mesmos e a obtenção de
conclusões válidas e tomadas de decisões a partir de tais análises.
Estatística pode ser entendida como sendo a ciência de aprendizagem a partir de dados.
No nosso cotidiano, precisamos tomar decisões, muitas vezes decisões rápidas. Assim
podemos dizer que a Estatística fornece métodos que auxiliam o processo de tomada de
decisão.
Quantitativos Contínuos
Discretos
Qualitativos Nominais
Por postos
As variáveis contínuas podem assumir qualquer valor num intervalo contínuo. Os dados
referentes a tais variáveis dizem-se dados contínuos. Ex.: peso, comprimento, espessura
onde se usa a mensuração.
Os dados por postos consistem de valores relativos atribuídos para denotar ordem:
primeiro, segundo, terceiro, quarto, etc. Ex.: concurso de beleza se classificam em 1ª, 2ª,
3ª colocadas.
TIPOS DE DADOS
CONTÍNUOS: Quando os eventos vão sendo registrados à medida que ocorrem. Exemplos
os registros civis dos fatos vitais (nascimento, óbitos e casamentos).
3- Organizar os dados
5- Relatar as conclusões
EXERCÍCIOS
1- Identifique os seguintes exemplos em termos de tipos de dados:
a- 17 gramas
b- 3 certos, 2 errados
c- 25 segundos
d- 25 alunos na classe
e- tamanho de camisa
f- Km/litro
g- O mais aprazível
h- O mais lento
Responder as perguntas:
conhecimento de Estatística?
2.1 DEFINIÇÕES:
POPULAÇÃO: é o conjunto de indivíduos (ou objetos), que tem pelo menos uma variável
comum observável. População é a totalidade dos elementos de um conjunto com uma
dada característica, no qual se deseja fazer um determinado estudo.
AMOSTRA: é qualquer subconjunto da população extraída para se realizar estudos
estatísticos.
.
POPULAÇÃO
AMOSTRA
Há vários métodos para extrair uma amostra, talvez o mais importante seja a amostragem
aleatória. De modo geral, a amostragem aleatória exige que cada elemento tenha a
mesma oportunidade de ser incluído na amostra.
Nas Populações discretas uma amostra aleatória é aquela em que cada item da
população tem a mesma chance de ser incluído na amostra.
Nas Populações contínuas, uma amostra aleatória é aquela em que a probabilidade de
incluir na amostra qualquer intervalo de valores é igual à percentagem da população que
está naquele intervalo.
Populações infinitas: são aquelas que contém, pelo menos hipoteticamente, um número
infinito de elementos.
Ex.: Produção de carros V.W. produzidos no Brasil e a serem produzidos (universo
volkswagem), processo probabilístico.
SISTEMÁTICA
ESTRATIFICADA
CONGLOMERADO
AMOSTRAGEM SISTEMÁTICA
É muito parecida com a amostragem aleatória simples. Podemos ter uma amostragem
realmente aleatória, escolhendo-se cada K-ésima amostra, onde K obtem-se dividindo o
tamanho da população pelo tamanho da amostra.
Significa que será escolhido um item a cada seqüência de 20 de uma lista. Para iniciar
pode-se usar uma tabela de números aleatórios de 0 a 9 para iniciar os grupos. Por
exemplo se der o 9, escolhemos o 9º, 29º, 39º ,49º , etc.
comum termos 10% dos itens representarem cerca de 60% do valor total em quanto que os
90% restantes representam só 40% do valor total (Curva A,B,C; Pareto; regra 80/20).
populações) representativos da população global. Neste caso cada conglomerado pode ser
Ex.: Estudo pré-eleitoral para medir a preferência dos eleitores. (Sub-grupos: sexo,
Para populações discretas o termo “Aleatório” significa que cada item da população tem a
mesma chance de participar na amostra.
a- Finita;
b- Infinita.
analisar e entender uma massa de dados, relevantes ao seu particular objeto de estudos.
De modo geral, podemos dizer que a essência da ciência é a observação e que seu
objetivo básico é a inferência. Esta é a parte da metodologia da ciência que tem por
finalmente, faz-se a inferência para uma população, da qual os dados (amostras) foram
obtidos.
Para cada tipo de variável existem técnicas mais apropriadas para resumir as informações.
Porém podemos usar algumas técnicas empregadas num caso e adaptá-las para outros.
1º grau
IIIIIIIIIIII 12 33,33
2º grau
IIIIIIIIIIIIIIIIII 18 50,00
TOTAL 36 100
4 |----- 8 10 27,78
8 |----- 12 12 33,33
12 |----- 16 8 22,22
16 |----- 20 5 13,89
20 |----- 24 1 2,78
TOTAL 36 100
0 4 20
1 5 25
2 7 35
3 3 15
5 1 5
TOTAL 20 100
A apresentação gráfica dos dados e respectivos resultados de sua análise pode também
ser feita sob forma de figuras, em geral gráficos ou diagramas.
freqüências
12
10
0
4 I-------8 8 I-------12 12 I-------16 16 I-------20 20 I-------24
Salários
freqüências
12
10
0
4 |---- 8 8 |---- 12 12 |----16 16 |----20 20 |----24
salários
α α
α .f = π.r 2 , ou seja, r = π f . Se chamar r = α' f .
π de α’, tem-se:
Portanto, os raios dos círculos devem ser proporcionais à raiz quadrada das freqüências
das modalidades da variável.
Assim se quisermos representar graficamente a distribuição da tabela 4, os raios do círculo
deverão ser:
33,33
2,7 13,89 22,22 27,78
% %
% % %
Outra opção seria através de setores circulares, na qual se divide a área total de um círculo
em subáreas (setores) proporcionais as freqüências.
Lembrando que o círculo compreende setores cujas áreas (S) são produto do raio (r) pelo
tamanho do arco (a), isto é, S = r.a, e como S deve ser proporcional à freqüência f, tem-se
S= α.f , onde α é o fator de proporcionalidade; então:
α .f = r. a
a = α.f
r
α
Se chamarmos de α’, tem-se S = α’.f , isto é, os arcos e os respectivos ângulos centrais
r
de um círculo é igual a 360°, e sendo F a freqüênci a total, tem-se
360° = α’. F
360º
ou seja: α' =
360º
. Portanto a= .f .
F F
120°
50°
10°
.
100° 80°
33%
22%
28% 14%
3%
No diagrama linear deve-se plotar os pontos nos eixos como foi feito no diagrama de
barras e em seguida unir esses pontos por semi-retas constituindo-se desta forma o
diagrama linear.
freq.
12
10
0
4 8 8 12 12 16 16 20 20 24
salários
A análise estatística de dados relativos a uma amostra de uma população, requer uma
aglutinação organizada de informações, conforme regras cuja prática demonstrou serem
eficientes.
Consideremos uma relação de pesos de pacotes de manteiga, em gramas, de uma
amostra de 100 pacotes extraídos parcialmente de um processo automático de
empacotamento.
±15
A especificação de fabricação é 215 gramas (200 a 230 gramas)
TABELA 6
O agrupamento destes dados em sub-grupos é feito com base nos seguintes conceitos:
Amplitude total (RT ou Ω): é a diferença entre a medida máxima e a medida mínima. No
caso da amostra de pacotes de manteiga acima, temos:
25
No exercício temos: amplitude do intervalo de cada classe RI = = 2,78 (aprox. 3)
9
As classes devem ser mutuamente exclusivas, para que não haja dúvida na localização
dos valores das variáveis, podemos daí utilizar as seguintes simbologias para os intervalos:
0 ----I 10 intervalo aberto & fechado, para significar que o intervalo compreende os
valores da variável maiores do que 0 (exclusive) e até 10 (inclusive);
0 I---- 10 intervalo fechado & aberto, para significar que compreende os valores da
variável a partir de 0 (inclusive) e até 10 (exclusive);
0 ----- 10 Intervalo aberto & aberto, para significar que compreende valores maiores do
que 0 e menores do que 10.
0 I----I 10 intervalo fechado & fechado, para significar que compreende os valores da
variável a partir de 0 (inclusive) e até 10 (inclusive).
∑ 100 100%
Onde:
Freqüência (f) = número de vezes que as medidas ocorrem no intervalo de classes
Freqüência Relativa (fR) = porcentagem da freqüência de cada classe em relação ao total
f
de elementos. f R = .100
n
Freqüência acumulada (F) = soma das freqüências até o intervalo de classe considerado.
Ex. F5 = f1+ f2 + f3 + f4 + f5 → 1 + 4 + 10 + 15 + 25 = 55
Freqüência acumulada relativa (FR) = soma das freqüências relativas até o intervalo
considerado. Por ex.: FR3 = fR1 + fR2 + fR3 → 1 + 4 + 10 = 15
POLÍGONO DE
FREQÜÊNCIAS
HISTOGRAMA
15
10
1 2 3 4 5 6 7 8 9 CLASSES
FREQÜÊNCIAS
25 RELATIVAS (%)
POLÍGONO DE
FREQÜÊNCIA
RELATIVA
HISTOGRAMA
15
10
1 2 3 4 5 6 7 8 9 CLASSES
FREQÜÊNCIAS
ACUMULADAS
POLÍGONO DE
100 FREQÜÊNCIA
ACUMULADA
HISTOGRAMA
55
15
1 2 3 4 5 6 7 8 9 CLASSES
FREQÜÊNCIAS
ACUMULADAS
RELATIVAS (%)
POLÍGONO DE
100 FREQÜÊNCIA
ACUMULADA
RELATIVA
HISTOGRAMA
55
15
1 2 3 4 5 6 7 8 9 CLASSES
B) Alongada
A) Assimétrica Positiva
mo
mo mo
mo mo mo
Uma alternativa para o uso da tabela de distribuição de freqüências é usar o gráfico do tipo
ramo-e-folhas.
Podemos estudar a partir de um exemplo prático:
Observamos os seguintes números de passageiros em 50 viagens de um avião que faz a
ponte aérea Rio - São Paulo:
61 52 64 84 35 57 58 95 82 64
50 53 103 40 62 77 78 66 60 41
58 92 51 64 71 75 89 37 54 67
59 79 80 73 49 71 97 62 68 53
43 80 75 70 45 91 50 64 56 86
SOLUÇÃO:
F FA
3 5 7 2 2
4 0 1 3 5 9 5 7
5 0 0 1 2 3 3 4 6 7 8 8 9 12 19
6 0 1 2 2 4 4 4 4 6 7 8 11 30
7 0 1 1 3 5 5 7 8 9 9 39
8 0 0 2 4 6 9 6 45
9 1 2 5 7 4 49
10 3 1 50
1920
1930
1940
1950
1960
1970
1980
1990
EXERCÍCIO
Como o próprio nome indica, a medida de tendência central visa a determinar o centro da
distribuição. Esta determinação, porém, não é bem definida daí parece razoável
chamarmos de “tendência central”.
__
• MÉDIA ARITMÉTICA SIMPLES/PONDERADA ( X ou M);
• MEDIANA (md);
• MODA (mo).
_ ∑x i _
∑x
X= i =1
ou simplificadamente, X =
n n
n
Sendo: ∑x
i =1
i = x 1 + x 2 + ... + x n
_
8 + 3 + 5 + 12 + 10 38
X= = = 7 ,6
5 5
__ ∑x i .fi
X= i =1
n
∑f i =1
i
Números x = 5, 8, 6, 2
Freqüências f = 3, 2, 4, 1
__ ∑x i .fi
(5.3) + (8.2) + (6.4) + ( 2.1) 57
X= i =1
= = = 5 ,7
n
3+ 2+4+1 10
∑f i =1
i
Exemplo: Determine a posição da mediana para: (a) n=15, (b) n=45 e (c)n=88.
n + 1 15 + 1
(a) = = 8 , e a mediana é o valor do 8° elemento;
2 2
n + 1 45 + 1
(b) = = 23 , e a mediana é o valor do 23° elemento;
2 2
n + 1 88 + 1
(c) = = 44,5 , e a mediana é a média do valor do 44° e o 45°elem ento.
2 2
n n
Ou seja, quando n é par procuramos duas posições: e + 1
2 2
No caso do exercício da distribuição dos 100 valores de peso de pacotes de manteiga
temos:
50°
valor
F 0 1 5 15 30 55 76 89 96 100
X 200 203 206 209 212 215 218 221 224 227
50°
30 55
212 215
∆= 5 x 3 = 0,6 ∆= 20 x 3 = 2,4
25 25
portanto a mediana será 215 - ∆ portanto a mediana será 212 + ∆
logo, md = 215 - 0,6 = 214,4. logo, md = 212 + 2,4 = 214,4.
n
− Fant
m d = l inf +h 2 , onde:
f med
n
≡ metade da quantidade de dados
2
h ≡ amplitude da classe mediana
linf ≡ limite inferior da classe da mediana
fmed ≡ freqüência absoluta da classe da mediana
Fant ≡ freqüência acumulada da classe anterior a da
mediana
n
− Fant
m d = l inf +h 2 = 212 + 3 50 − 30 = 212 + 3.0,8 = 212 + 2,4 = 214,4
f med 25
md = 214,4
Como extensão do conceito de mediana, podemos dividir os valores em quatro, dez e cem
partes iguais. Essas divisões são chamadas de quartis, decis e centis, respectivamente.
O cálculo dessas divisões é semelhante ao da mediana, isto é:
i .n
− FQi − 1
Quartis: Q i = l inf +h 4 , onde i = 1, 2, 3
f Qi
i .n
− FDi − 1
Decis: D i = l inf + h 10 , onde i = 1, 2, 3, 4, 5, .., 9
f Di
i .n
− FCi − 1
Centis: C i = l inf + h 100 , onde i = 1, 2, 3, 4, 5, ..., 99
f Ci
Onde:
h ≡ amplitude da classe
linf ≡ limite inferior da classe da quartílica, decílica ou
percentílica
fQi , fDi , fCi ≡ freqüências das classes quartílica, decílica e
percentílica, respectivamente
FQi-1 , FDi-1 , FCi-1 ≡ freqüências acumuladas da classe
anterior à classe quartílica, decílica ou percentílica
9.4 MODA ( mo )
Em um conjunto de números a moda é o valor que ocorre com maior freqüência, isto é, o
valor mais comum.
Exemplos:
1) 2, 2, 3, 7, 8, 8, 8, 9, 10
moda=8
2) 1, 2, 3, 4, 5, 6, 7, 8, 9, 10
moda = Ф (não existe moda)
3) 2, 2, 4, 4, 4, 5, 6, 7, 8, 8, 8, 9
moda = 4 e 8
O cálculo da moda pelo Método de Pearson é mais utilizado quando temos uma
indicação de que os três parâmetros de tendência central (média, mediana e moda)
estejam muito próximos.
Um outro método, de origem gráfica, é o Método de Czuber, que utilizamos na maioria
dos casos:
∆a
mo = l inf + ⋅ h
∆a + ∆p
onde:
linf = limite inferior da classe modal.
∆a = diferença entre a fi da classe modal e a fi da classe anterior. Entenderemos como
classe anterior aquela que precede à classe modal.
∆p = diferença entre a fi da classe modal e a fi da classe posterior (aquela que vem
logo após a classe modal).
h = amplitude da classe modal.
A equação da moda pode ser deduzida facilmente do processo gráfico para determinar
a moda em um histograma.
∆a x h∆a
= ⇒x=
∆p h − x ∆a + ∆p
∆a
Portanto: mo = l inf + ⋅ h
∆a + ∆p
xx x x x x xxx xxx xx x x
a) pequena dispersão
xx x x xxx x x x x x x x x xx x x xxx x x x xx x x x x xx
b) grande dispersão
É a medida mais simples de dispersão. É a diferença entre o maior e o menor valor das
observações.
RT = Xmax – Xmin
1- Utiliza apenas uma parcela das informações contidas nas observações. O seu valor
não se modifica mesmo que os valores das observações variem, desde que
conservem os seus valores máximo e mínimo. Ou seja, depende apenas dos
valores externos (max e min), não sendo afetada pelos valores internos.
X min X max.
RT = pequeno
X min X max.
RT = Grande
__
O desvio médio d é a média aritmética dos módulos dos desvios, isto é:
__
__
∑d ∑x i − x
d= =
i
n n
Para uma distribuição de freqüências (simples ou por classes), teremos:
__
__
∑d .fi ∑x i − x .fi
d= =
i
n n
Exercício: calcular o desvio médio para os exemplos (1), (2) e (3) da página anterior.
σ2 ou s2)
10.4 VARIÂNCIA (σ
__
tamanho da amostra.
As equações anteriores para σ2 e s2 representam uma maneira de cálculo dessas medidas.
Podemos também utilizar as seguintes equações:
σ2 =
∑ f (x )
i i
2
− N.µ 2
ou s2 =
∑ f (x )
i i
2
− n. x
N n −1
σ ou s)
10.5 DESVIO PADRÃO (σ
σ s
cv = .100 (para população) ou cv = __ .100 (para amostra)
µ
x
(4) Vinte e cinco residências de um certo bairro foram sorteadas e visitadas por um
entrevistador que, entre outras questões, perguntou sobre o número de televisores. Os
dados foram os seguintes:
2, 2, 2, 3, 1, 2, 1, 1, 1, 1, 0, 1, 2, 2, 2, 2, 3, 1, 1, 3, 1, 2, 1, 0 e 2.
Organize os dados numa tabela de feqüência e determine as diversas medidas de posição.
Determinar:
a) a mediana;
b) o 1º Quartil;
c) o 3º Quartil;
d) o 8º Decil;
e) o 15º Centil.
(9) Você está indeciso em comprar um aparelho de televisão e decide avaliar algumas
informações estatísticas, fornecidas pelo fabricante, sobre a duração (em horas) do
tubo de imagem.
Marca do aparelho GA FB HW
Média 8000 8200 8000
Mediana 8000 9000 7000
Desvio Padrão 600 1500 2500
(11) Num estudo sobre consumo de combustível, 200 automóveis do mesmo ano e modelo
tiveram seu consumo observado durante 1000 quilômetros. A informação obtida é
__
apresentada na tabela abaixo em km/litro. Calcular X , S2 e S.
Faixas Freqüência (f)
7 8 27
8 9 29
9 10 46
10 11 43
11 12 55
Calcular a média, mediana, moda, variância e desvio-padrão dos dados da tabela acima.
(12) 15 alunos participaram de um teste e obtiveram os seguintes resultados 60, 45, 70, 30,
85, 60, 30, 70, 60, 60, 85, 70, 70, 85 e 70.
Pede-se:
a) Construir uma tabela de dados ponderados;
b) Calcular a média aritmética (ponderada);
c) Calcular o desvio padrão;
d) Determinar a variância.
xi f
30 2
45 1
60 4
70 15
85 3
.
(14) Calcular a variância da série de dados dada pela tabela abaixo:
Classes fi
[2 ; 4) 2
[4 ; 6) 5
[6 ; 8) 7
[8 ; 10) 4
[10 ; 12) 3
[12 ; 14] 3
Porém existem apenas dois eventos possíveis: sair “cara” (K) ou “coroa” (C). Nesse
exemplo existe um caso favorável a esse evento em dois casos possíveis. A P (K) = ½ ou
50%.
P= ½ e Q=½
Sendo P+Q = 1 então P= (1 - Q) e Q = (1 - P)
ESPAÇO AMOSTRAL
OBJETIVO SUBJETIVO
1
P(cada resultado) =
N° de resultados possíveis
Por exemplo, a probabilidade de extração de uma dama, de acordo com esta definição, é
Pode ser necessário determinar P(A e B), isto é; a probabilidade de ocorrência de ambos
os eventos.
= 13 + 4 - 1 = 16
52 52 52 52
NAIPE
♣ K ♦ K ♥ K ♠ K
♣ Q ♦ Q ♥ Q ♠ Q
♣ J ♦ J ♥ J ♠ J
♣ 10 ♦ 10 ♥ 10 ♠ 10 a carta é
um dez
♣ 9 ♦ 9 ♥ 9 ♠ 9
♣ 8 ♦ 8 ♥ 8 ♠ 8
♣ 7 ♦ 7 ♥ 7 ♠ 7
♣ 6 ♦ 6 ♥ 6 ♠ 6
♣ 5 ♦ 5 ♥ 5 ♠ 5
♣ 4 ♦ 4 ♥ 4 ♠ 4
♣ 3 ♦ 3 ♥ 3 ♠ 3
♣ 2 ♦ 2 ♥ 2 ♠ 2
♣ A ♦ A ♥ A ♠ A
Carta de paus
Os eventos “paus” e “dez” se interceptam.
Como foi visto no final do item anterior, existem algumas regras de probabilidade. Neste
item detalharemos tais regras, conhecidas como propriedades da probabilidade.
Revendo, a probabilidade de um evento A ocorrer é um número entre 0 e 1, ou seja:
0 ≤ P(A) ≤ 1
Se considerarmos o espaço amostral, S, e o conjunto vazio, ∅, como eventos, temos:
Exemplo: Suponha que o seguinte quadro represente uma possível divisão dos alunos
matriculados num Instituto de Matemática:
Sendo M o evento que ocorre quando, escolhendo-se ao acaso um aluno do Instituto, ele é
um estudante de Matemática Pura. A, E, C, H e F são os demais eventos com significados
análogos. Desta maneira, temos como exemplos:
30 115
P ( E) = e P( H ) =
200 200
Dados os eventos A e H, podemos considerar dois novos eventos:
- A ∪ H, chamado a união de A e H, que ocorre quando pelo menos um dos eventos
ocorre;
- A ∩ H, chamado a intersecção de A e H, que ocorre quando A e H ocorrem
simultaneamente.
15
É fácil verificar na tabela anterior que P( A ∩ H ) = , pois o aluno escolhido terá
200
que ser ao mesmo tempo, matriculado no curso de Matemática Aplicada e homem.
30 115
Vemos que P( A ) = e P( H ) = ; suponha que o nosso cálculo para P(A ∪ H)
200 200
fosse:
30 115 145
P ( A ∪ H ) = P ( A ) + P( H ) = + =
200 200 200
Se assim o fizéssemos, estaríamos contando duas vezes os alunos que são homens e que
estão matriculados no curso de Matemática Aplicada, como está em destaque na tabela
anterior. Portanto a resposta correta é:
30 115 15 130
P( A ∪ H ) = P( A ) + P( H ) − P( A ∩ H ) = + − =
200 200 200 200
30 30
No entanto, considerando-se os eventos A e C, vemos que P( A ) = , P( C) = e
200 200
60
P( A ∪ C) = = P( A ) + P(C) . Neste caso, os eventos A e C são disjuntos ou
200
P( A C ) = 1 − P( A )
As operações de união, intersecção e complementação entre eventos possuem
propriedades análogas àquelas válidas para operações entre conjuntos.
Por exemplo:
(i) (A ∩ B)C = AC ∪ BC
(A ∪ B)C = AC ∩ BC
(ii) A ∩ AC = ∅
A ∪ AC = S
(iii) A∩∅=∅
A∩S=A
A∪∅=A
A∪S=S
(iv) ∅C = S
SC = ∅
[ ]
(c) P( A C ∩ B C ) =P ( A ∪ B ) C = 1 − P( A ∪ B ) = 1 −
7 5
=
12 12
) =P [( A ∩ B ) ]= 1 − P( A ∪ B ) = 1 − =
1 3
(d) P( A C ∪ B C C
4 4
Podemos escrever:
B = ( A ∩ B) ∪ ( A C ∩ B) ,
ou seja, B pode ocorrer com A ou (exclusivo) com AC. Logo,
P( B ) = P( A ∩ B ) ∪ P ( A C ∩ B ) ,
do que decorre
1 1 1
P ( A C ∩ B ) = P( B ) − P ( A ∩ B ) = − =
3 4 12
Voltemos à tabela da página 59. Dado que um estudante, escolhido ao acaso, esteja
20 2
matriculado no curso de Estatística, a probabilidade de ele ser mulher é de = . Isto
30 3
porque do total de 30 alunos que estudam Estatística, 20 são mulheres. Escrevemos:
2
P(mulher | Estatística ) =
3
Para dois eventos quaisquer A e B, sendo P(B) > 0, definimos a probabilidade condicional
de A, dado B, P(A|B), como sendo:
P( A ∩ B )
P( A | B ) =
P( B )
Para o exemplo mencionado, se A e B indicam, respectivamente, os eventos “aluno
matriculado em Estatística” e “aluno é mulher”, então P(A∩B) = 20/200, P(B) = 30/200 e,
portanto:
P( A ∩ B ) 20 / 200 2
P( A | B ) = = = ,
P( B ) 30 / 200 3
como havíamos obtido.
P( A ∩ B ) = P(B ) . P( A | B )
Exemplo: Uma urna contem duas bolas brancas (B) e três vermelhas (V). Suponha que
sorteemos duas bolas ao acaso, sem reposição. Isto significa que escolhemos a primeira
bola, verificamos a sua cor e não a devolvemos à urna; misturamos as bolas restantes e
retiramos a segunda bola. O diagrama em árvore ilustra as possibilidades. Em cada “galho”
da árvore estão indicadas as probabilidades de ocorrência, sendo que para algumas bolas
temos probabilidades condicionais. A probabilidade dos resultados conjuntos é, então,
dada pela regra do produto acima.
1
B V
1 /4
B 1 /3 B
2 /5 3 /4
V V
2 /3
1 /3 B
B V
2 /4 2 /3
3 /5 V
2 /4 2 /3 B
V
V
1 /3
Resultados Probabilidades
BBV 2 1 2 6
. .1 = =
5 4 20 60
BVB 2 3 1 6
. . =
5 4 3 60
BVV 2 3 2 12
. . =
5 4 3 60
VBB 3 2 1 6
. . =
5 4 3 60
VBV 3 2 2 12
. . =
5 4 3 60
VVB 3 2 2 12
. . =
5 4 3 60
VVV 3 2 1 6
. . =
5 4 3 60
Total 60/60 = 1
1 2
P( A ∩ B ) = P( A ) . P( B )
P ( A ∩ C ) = P( A ) . P( C)
P( B ∩ C ) = P( B ) . P( C)
P( A ∩ B ∩ C) = P( A ) . P( B ) . P( C)
Esta definição pode ser estendida para um número finito qualquer de eventos
independentes.
Uma das relações mais importantes envolvendo probabilidades condicionais é dada pelo teorema
de Bayes, que expressa uma probabilidade condicional em termos de outras probabilidades
condicionais e marginais. Vamos introduzi-lo através de um exemplo.
Exemplo: Temos 5 urnas exatamente iguais, cada uma com 6 bolas. Duas dessas urnas (tipo C1)
têm 3 bolas brancas, duas outras (tipo C2) têm 2 bolas brancas, e a última urna (tipo C3) tem 6
bolas brancas. Escolhemos uma urna ao acaso e dela retiramos uma bola. Qual a probabilidade da
urna escolhida ser do tipo C3, sabendo-se que a bola sorteada é branca?
Na figura abaixo estão esquematizados o espaço amostral e os eventos de interesse.
C1 C2 C3
1 2 3 4 5
C
O B
R
BC
S
E consideremos A um evento qualquer. Também são conhecidos P(Ci) e P(A|Ci) para i = 1, 2,...., n.
Então, temos o seguinte resultado, ilustrado pela figura a seguir.
Teorema de Bayes – A probabilidade de ocorrência de um dos eventos Ci, dado que ocorreu o
evento A, é dado por:
P (C i ) . P ( A | C i )
P( C i | A ) =
n
∑ P(C j ) . P( A | C j )
j =1
onde , i = 1, 2, ..., n.
Exemplo: Para selecionar seus funcionários, uma empresa oferece aos candidatos um curso de
treinamento durante uma semana. Ao final, eles são submetidos a uma prova e 25% são
classificados como bons (B), 50% como médios (M) e os restantes 25% como fracos (F).
P( F ) . P( A | F )
P( F | A ) = =
P( B ) . P( A | B ) + P ( M ) . P ( A | M ) + P ( F ) . P( A | F )
(0,25) . (0,20)
= = 0,10
(0,25) . (0,80) + (0,50) . (0,50) + (0,25) . (0,20)
Então, apenas 10% dos aprovados é que seriam classificados como fracos durante o
curso. De modo análogo, podemos encontrar:
P(B|A) = 0,40 e P(M|A) = 0,50
que seriam subsídios valiosos para ajudar a decisão de substituir o treinamento pelo teste.
OBSERVAÇÕES:
- O teorema de Bayes é usado extensivamente nas análises de decisões. As
probabilidades prévias são freqüentemente estimativas subjetivas fornecidas por um
tomador de decisão. A informação amostral é obtida e as probabilidades posteriores
são calculadas para uso no desenvolvimento de uma estratégia de decisão.
- Um evento e seu complemento são mutuamente exclusivos e suas uniões formam
uma partição. Assim, o teorema de Bayes é sempre aplicável para o cálculo das
probabilidades posteriores de um evento e seu complemento.
Uma das possibilidades é o uso das árvores de decisão, mas quando o número de
resultados é grande, essa lista se torna muito trabalhosa; é necessário então recorrer a
fórmulas matemáticas para determinar o número total de resultados possíveis.
Em segundo lugar devemos explorar suas diversas versões. Imaginemos que o teste
consista de apenas:
Conclui-se:
Número de questões : 1 2 3 4
Número de resultados : 2 4 8 16
V VVV
V F VVF
V V V FV
F F V FF
V FV V
V F FV F
F
V FFV
F
F FFF
O diagrama mostra que cada questão dobra o número total de resultados possíveis (com
duas alternativas V ou F) temos:
De um modo geral, se há “n” decisões seqüenciais, cada uma com “m” escolhas, o número
total de resultados é mn.
Para o uso na análise combinatória usaremos o número fatorial representado pelo símbolo
! como por exemplo 4! lê-se “quatro fatorial” e significa 4 x 3 x 2 x 1 = 24.
Outros exemplos:
5! = 5 x 4 x 3 x 2 x 1 = 120
12! = 12 x 11 x 10 x 9 x 8 x 7 x ..............x 1 = 479.001.600
4! = 12
2!
5! = 10
2! 3!
( 5 - 3 )! = 2! e não ( 5! - 3! )
( 9 - 2 )! = 7!
( 3 + 1)! = 4!
8! = 8! = 8 x 7 x 6 x 5! = 8x7x6 = 56
3! ( 8 – 3 )! 3! . 5! 3 x 2 x 5! 3x2
ARRANJOS
São agrupamentos que podem variar pela ordem ou natureza dos elementos. Quando se
consideram n elementos distintos tomados x a x chamamos arranjo ou agrupamentos
“eneários” que se podem formar com esses n elementos, dispomos de todas as formas
possíveis de modo que dois arranjos quaisquer difiram ao menos pela ordem dos
elementos.
Assim, os arranjos possíveis com as letras A, B e C são A 3,2 (3 elementos dois a dois)
A 3,2 = AB; BA; AC; CA, BC; CB.
Outro exemplo: Se há sete cavalos num páreo, quantos arranjos há considerando 1°,2° e
3° lugares?
PERMUTAÇÃO
Denomina-se permutação aos arranjos de objetos tomados n a n. Neste caso cada objeto
entra só uma vez em todos os grupos.
Em geral o número de permutações distintas com n itens, dos quais n1 são indistinguíveis
de um tipo, n2 de outro tipo, etc, é:
n!
Pnn 1 , n 2 , ..., n K = (permutação com repetições)
(n 1 ! ) (n 2 ! ) (n 3 ! ) ... (n k ! )
Solução
Há 8 letras : 4Rs 3Us 1N dai:
8!
P84 3 1 = = 280
(4! ) ( 3! ) (1! )
Cn, x =
n!
x! (n − x)!
= nx()
Quantos comitês distintos, de 3 pessoas cada um, podemos formar com um grupo de 10
pessoas?
4! 6!
Mulheres e Homens => C 4 ,1 . C 6 , 2 = . = 4 . 15 = 60
1! 3! 2! 4!
n!
A n, x =
(n − x )!
n!
Pnn 1 , n 2 , ..., n K =
(n 1 ! ) (n 2 ! ) (n 3 ! ) ... (n k ! )
Cn, x =
n!
x! (n − x)!
= nx ()
2- Calcule:
3 4 5 9
a- b- c- d-
2 4 1 6
1,00
P
1,00 R 1,00
O 1,OO
B
A
P B
R 0,75 I 0,75
O L 0,75
B I
A D
B A
I 0,5 D 0,5
L 0,5 E
I
D A
A C
D 0,25 U 0,25
E 0,25 0,25 M 0,25
U
L
A
0 D 0
0 1 2 A 0 1 2
NÚMERO DE CARAS
NÚMERO DE CARAS
Uma v.a. que pode assumir tanto um número finito de valores como infinita seqüência de
valores tais como 0, 1, 2, 3, ... é denominada variável aleatória discreta. Por exemplo,
considere o experimento de um contador que faz um exame público. O exame tem quatro
partes. Podemos definir a v.a. discreta como x ≡ o número de partes em que foi aprovado
no exame. Essa v.a. discreta pode assumir o número finito de valores 0, 1, 2, 3 ou 4.
Como outro exemplo, considere o experimento de carros que chegam a um posto de
pedágio. A v.a. de interesse é x ≡ o número de carros que chega durante o período de um
dia. Os possíveis valores de x vêm da seqüência de inteiros 0, 1, 2 e assim por diante.
Portanto x é uma v.a. discreta que assume um dos valores nessa seqüência infinita.
Embora muitos experimentos tenham resultados que são naturalmente descritos por
valores numéricos, outros não o são. Por exemplo, uma questão de um levantamento pode
solicitar a um indivíduo que relembre a mensagem de um recente comercial de televisão.
Esse experimento poderia ter dois resultados possíveis: o indivíduo não pode lembrar a
mensagem e o indivíduo pode lembrar a mensagem. Podemos ainda descrever esses
resultados experimentais numericamente, definindo-se a v.a. discreta x como segue: seja x
= 0 se o indivíduo não pode lembrar a mensagem e x = 1 se o indivíduo pode lembrar a
mensagem. Os valores numéricos para essa v.a. são arbitrários (poderíamos usar 5 e 10),
mas eles são aceitáveis em termos da definição de uma v.a..
Outros exemplos de v.a. discretas são dados a seguir:
f(x) = 1/n
onde:
n ≡ o número de valores que a v.a. pode assumir
x f(x)
1 1/6
2 1/6
3 1/6
4 1/6
5 1/6
6 1/6
VALOR ESPERADO
O valor esperado, ou média, de uma v.a. discreta é a medida de posição central para a
v.a.. A expressão matemática para o valor esperado da v.a. x é dada por:
E(x) = µ = ∑ x.f(x)
VARIÂNCIA
σ= σ2
x f(x)
3 0,25
6 0,50
9 0,25
Total 1,00
y f(y)
2 0,20
4 0,30
7 0,40
8 0,10
Total 1,00
a) Calcule E(y).
b) Calcule Var(y) e σ.
4 - O Statistical Abstract of the United States, 1997, mostra que o número médio de
aparelhos de televisão por família é de 2,3. Considere que a distribuição de
probabilidade para o número de aparelhos de televisão por família é mostrado a seguir:
x f(x)
0 0,01
1 0,23
2 0,41
3 0,20
4 0,10
5 0,05
Um experimento binomial
2a CCCK 1K e 3C 1
2b CCKC
2c CKCC
2d KCCC
3a CCKK 2K e 2C 2
3b CKKC
3c KKCC
3d CKCK
3e KCKC
3f KCCK
4a KKKC 3K e 1C 3
4b KKCK
4c KCKK
4d CKKK
5 KKKK 4K e 0C 4
Utilizando as regras do produto para eventos independentes (e) e da adição para eventos
mutuamente exclusivos (ou) é possível calcular as probabilidades associadas aos valores
de X.
Para o cálculo da probabilidade X=1 deve-se trabalhar com o evento “1K e 3C” como
temos as opções a,b,c,d, que são mutuamente exclusivas, a regra da soma manda
efetuar a adição 0,0625 +0,0625 +0,0625 +0,0625 ou, o que é o mesmo de se efetuar o
produto 4x 0,0625 = 0,25.
x EVENTO f( x )
0 4 0 4
0 0K e 4C O,0625 = 1 X 0,5 X 0,5 = 1p q
1 3 1 3
1 1K e 3C O,2500 = 4 X 0,5 X 0,5 = 4p q
2 2 2 2
2 2K e 2C O,3750 = 6 X 0,5 X 0,5 = 6p q
3 1 3 1
3 3K e 1C O,2500 = 4 X 0,5 X 0,5 = 4p q
4 0 4 0
4 4K e 0C O,0625 = 1 X 0,5 X 0,5 = 1p q
TOTAL 1,00
n = número de moedas
n! n
=
x!. (n − x)! x combinações de n indivíduos tomados x a x.
n!
f ( x) = . p x .q n − x
x!. (n − x )!
10! 1
10 =1 . = 0,000976
10!(10 − 10)! 1024
10! 1
9 = 10 . = 0,009760
9!(10 − 9)! 1024
10! 1
8 = 45 . = 0,043940
8!(10 − 8)! 1024
10! 1
7 = 120 . = 0,117180
7!(10 − 7)! 1024
10! 1
6 = 210 . = 0,205070
6!(10 − 6)! 1024
10! 1
5 = 252 . = 0,246090
5! (10 − 5)! 1024
10! 1
4 = 210 . = 0,205070
4! (10 − 4)! 1024
10! 1
3 = 120 . = 0,117180
3! (10 − 3)! 1024
10! 1
2 = 45 . = 0,043940
2! (10 − 2)! 1024
10! 1
1 = 10 . = 0,009760
1! (10 − 1)! 1024
10! 1
0 =1 . = 0,000976
0! (10 − 0)! 1024
3- Doze por cento dos que reservam lugar num vôo sistematicamente faltam ao
embarque. O avião comporta 15 passageiros. Determine a probabilidade de que
todos os 15 que reservaram lugar compareçam ao embarque
4- Um revendedor de automóveis novos constatou que 80% dos carros vendidos são
devolvidos ao departamento mecânico para corrigir defeitos de fabricação, nos
primeiros 25 dias apos a venda. De 11 carros vendidos num período de 5 dias, qual
é a probabilidade de que:
a. Todos voltem dentro de 25 dias para reparo.
b. Só um não volte
n ≥ 100 e n.p ≤ 10
n = elementos da população
p = probabilidade
Exemplo: n = 150 p = 0,05
Temos a distribuição de Poisson com:
n.p = 150 . (0,05) = 7,5
A equação a ser usada é:
(n. p) x . e − n. p
f ( x) =
x!
sendo e= 2,718 e µ = n.p
Exemplo: Sabe-se que 2% dos livros encadernados em uma certa livraria apresentam
defeitos de encadernação. Utilize a aproximação de Poisson da distribuição Binomial para
achar a probabilidade de que 5 entre 400 livros encadernados nessa livraria apresentam
algum defeito de encadernação.
Temos: n = 400 p = 2% = 0,02 x=5 n.p = 400 . 0,02 = 8
-8
e = 0,000335; temos então:
EXERCICIOS:
É uma distribuição contínua e simétrica, cujo gráfico tem a forma de um sino. A distribuição
normal é o resultado da atuação conjunta de causas aleatórias.
F (x)
µ - 3σ µ - 2σ µ - 1σ µ µ + 1σ µ + 2σ µ + 3σ
µ → Média da População
Determinam o formato da curva
σ → Desvio padrão da população
F (x)
-∞ + ∞
X0
Portanto:
c- A área total sob a curva normal é igual a 1, pela própria equação da probabilidade.
x−µ
z=
σ
o que significa adotar como origem do eixo z o ponto em que x = µ e como unidade de
escalados z e o desvio padrão σ, teremos transformado a expressão da função das
probabilidades na distribuição normal reduzida:
− z2
1
f ( z) = e 2
σ 2π
Considerando, a partir da equação auxiliar:
dz 1
= ⇒ dx = σ dz
dx σ
As áreas sob a curva permanecem as mesmas, mas agora podem ser tabuladas em
função dos valores de Z (Ver figura abaixo, eixo dos Z). Basta construir a tábua das áreas
para os valores I(z), mostrados na tabela da página 56.
Por exemplo, a área desde Z=0 até Z= 1,0 é I(1,0) = 0,3413 ou 34,13% da área total da
curva; conseqüentemente, dentro do intervalo ± 1 σ temos 68,26% da área total da curva.
x−µ
A partir da equação auxiliar z= podemos transformar valores de x em valores de z e
σ
em seguida construir uma tabela com resultados das integrais, que corresponde à área sob
a curva x0 intervalo de 0 a Z0 identificada por IZ0.
F (x)
µ - 3( ( - 2( ( - 1( ( ( + 1( ( + 2( ( + 3(
-3 -2 -1 0 1 2 3 Z
x0 x−µ z0
z=
σ
µ µ −µ
σ 0
µ + 1σ µ +1σ − µ
σ 1
µ + 2σ µ + 2σ − µ
σ 2
µ + 3σ µ + 3σ − µ
σ 3
µ - 1σ µ −1σ − µ
σ -1
µ - 2σ µ − 2σ − µ
σ -2
µ - 3σ µ − 3σ − µ
σ -3
0 Z0
1- Trace uma curva normal e sombreie a área desejada a partir das informações:
a- P(x ≤ 60)
b- P(35 ≤ x ≤ 62)
c- P(55 ≤ x ≤ 65)
d- P(x ≥ 55)
e- P(35 ≤ x ≤ 45)
6- O adulto americano médio tem 1,75 m de altura. Assuma que o desvio seja 8 cm.
Responda:
a- qual é a probabilidade de que um homem adulto tenha mais de 1,83 m ?
b- qual é a probabilidade de que um homem adulto tenha menos de 1,522 m ?
c- qual é a probabilidade de que um homem adulto tenha entre 1,682 e
1,778 m ?
d- qual é a probabilidade de que um homem adulto não tenha mais de 1,83 m ?