Nocoes de Probabilidade e Estatistica I PDF

unesp
UNIVERSIDADE ESTADUAL PAULISTA

“JÚLIO DE MESQUITA FILHO”
Faculdade de Engenharia – Campus de Ilha Solteira
NOÇÕES DE
PROBABILIDADE E ESTATÍSTICA
PROFª BERENICE CAMARGO DAMASCENO
2011
PROBABILIDADE E ESTATÍSTICA
1.0 ALGUMAS DEFINIÇÕES DE ESTATÍSTICA

Etimologicamente a palavra estatística vem de “status” expressão latina que significa,
”sensu lato”, o estudo do estado. Os primeiros a empregarem esse termo foram os
Alemães seguidos pela Itália, França, Inglaterra e ainda por outros paises.
Para Levasseur a estatística é: “O estudo numérico dos fatos sociais”. Yule define
estatística como: “Dados quantitativos afetados marcadamente por uma multiplicidade de
causas”.
Uma definição mais usual nos dias de hoje seria: “Um método científico que permite a
análise, em base probabilística, de dados coligados e condensados”. Ou ainda podemos
dizer que Estatística é um conjunto de métodos quantitativos, que servem para a coleta,
organização, redução e apresentação de dados, análise dos mesmos e a obtenção de
conclusões válidas e tomadas de decisões a partir de tais análises.
Estatística pode ser entendida como sendo a ciência de aprendizagem a partir de dados.
No nosso cotidiano, precisamos tomar decisões, muitas vezes decisões rápidas. Assim
podemos dizer que a Estatística fornece métodos que auxiliam o processo de tomada de
decisão.
1.1 POR QUE ESTUDAR ESTATÍSTICA?
O raciocínio estatístico é largamente utilizado no governo e na administração; assim, é

possível que, no futuro, um empregador venha a contratar ou promover um profissional por
causa do seu conhecimento de estatística. Essa é uma razão, esperamos que ao final
deste trabalho o leitor encontre suas próprias razões.
1.2 A NATUREZA DOS DADOS

Os dados estatísticos constituem a matéria prima das pesquisas estatísticas, eles surgem
quando se fazem mensurações ou se restringem observações.
Estatística descritiva: Trata-se da descrição e resumo dos dados.
Probabilidade: É um estudo que envolve o acaso.
Inferência: É a análise e interpretação de dados amostrais (Amostragem).
Modelos: São versões simplificadas (abstrações) de algum problema ou situação real.
Noções de Probabilidade e Estatística 1 Profª Berenice C. Damasceno

1.3 TIPOS DE DADOS
Quantitativos Contínuos
Discretos
Qualitativos Nominais
Por postos
As variáveis contínuas podem assumir qualquer valor num intervalo contínuo. Os dados
referentes a tais variáveis dizem-se dados contínuos. Ex.: peso, comprimento, espessura
onde se usa a mensuração.
As variáveis discretas assumem valores inteiros de dados discretos são os resultados da

contagem de números de itens. Ex.: alunos da sala de aula, número de defeitos num carro
novo, acidentes de uma fábrica.
Os dados nominais surgem quando se definem categorias e se conta o número de

observações pertencentes a cada categoria. Atuam dentro das variáveis “Qualitativas”, às
quais devemos associar a valores numéricos para que possamos processar
estatisticamente. Ex.: cor dos olhos (azuis, verdes, castanhos), sexo (masculino e
feminino), desempenho (excelente, bom, sofrível, mau), etc.
Os dados por postos consistem de valores relativos atribuídos para denotar ordem:
primeiro, segundo, terceiro, quarto, etc. Ex.: concurso de beleza se classificam em 1ª, 2ª,
3ª colocadas.
TABELA 1: A mesma população pode originar diferentes tipos de dados.
TIPOS DE DADOS
POPULAÇÕES CONTÍNUOS DISCRETOS NOMINAIS POR POSTO
Alunos de administração idade/peso N. de classes Homens/Mulheres 3º grau

1.4 TIPOS DE LEVANTAMENTOS
Os levantamentos podem ser classificados em contínuos, periódicos e ocasionais:
CONTÍNUOS: Quando os eventos vão sendo registrados à medida que ocorrem. Exemplos
os registros civis dos fatos vitais (nascimento, óbitos e casamentos).
PERIÓDICOS: Acontecem ciclicamente. Exemplo é o recenceamento, feito no Brasil a

cada dez anos. A realização de um Censo Demográfico representa o desafio mais
importante para um instituto de estatística, sobretudo em um país de dimensões
continentais como o Brasil, com 8 514 215,3 km2, composto por 27 Estados e 5 507
municípios existentes na data de referência da pesquisa, abrangendo um total de
54 265 618 de domicílios pesquisados (dados do IBGE sobre o Censo de 2000).
OCASIONAIS: São aqueles realizados sem a preocupação de continuidade ou

periodicidade preestabelecidas, exemplos a maioria dos trabalhos de investigação
cientifica.
Os dados ainda podem ser classificados em: primários e secundários.
DADOS PRIMÁRIOS: Quando o investigador não encontra dados publicados adequados

ao seu estudo, parte para a realização de um inquérito, isto é, os dados são levantados
diretamente na população no momento da investigação.
DADOS SECUNDÁRIOS: Quando o investigador para verificar as suas hipóteses de

trabalho utiliza-se de dados já existentes, arquivados, registrados ou publicados. Podem
ser, até mesmo, dados gerados pelo Departamento de Estatística de Populações da
Fundação Instituto Brasileiro de Geografia e Estatística (IBGE).

1.5 PLANEJAMENTO DE EXPERIMENTOS
1- Definição do problema: Um Estudo ou Uma Análise
2- Formular plano adequado para coleta de dados
3- Organizar os dados
4- Analisar e interpretar os dados
5- Relatar as conclusões
EXERCÍCIOS
1- Identifique os seguintes exemplos em termos de tipos de dados:
a- 17 gramas
b- 3 certos, 2 errados
c- 25 segundos
d- 25 alunos na classe
e- tamanho de camisa
f- Km/litro
g- O mais aprazível
h- O mais lento
i- 5 acidentes no mês de maio
Responder as perguntas:
1- Defina o termo Estatística.
2- Responder a pergunta: Por que estudar estatística?
3- Dar exemplos de como você, na sua profissão, poderá se beneficiar do
conhecimento de Estatística?

2.0 AMOSTRAGEM
AMOSTRAGEM VERSUS CENSO: Uma amostra usualmente envolve o estudo de uma
parcela dos ítens de uma população, enquanto que o censo requer o estudo de todos os
ítens.
Restrições ao Censo:
- Custo
- Populações infinitas
- Dificuldade nos critérios (Precisão)
- Produtos de testes Destrutivos (fósforos, munições)
- Tempo despendido (atualização)
- Tipos de informações mais restritivas
Casos de excessão:
- Populações pequenas
- Amostras grandes em relação à população
- Se exige precisão completa
- Se já são disponíveis informações completas
2.1 DEFINIÇÕES:
POPULAÇÃO: é o conjunto de indivíduos (ou objetos), que tem pelo menos uma variável
comum observável. População é a totalidade dos elementos de um conjunto com uma
dada característica, no qual se deseja fazer um determinado estudo.
AMOSTRA: é qualquer subconjunto da população extraída para se realizar estudos
estatísticos.
.
POPULAÇÃO
AMOSTRA

A estatística indutiva é a ciência que busca tirar conclusões probabilísticas sobre a
população, com base em resultados verificados em amostras retiradas dessa população.
Entretanto não basta que saibamos descrever convenientemente os dados da amostra
para que possamos executar, com êxito, um trabalho estatístico completo. Antes de tudo
é preciso garantir que a amostra ou amostras que serão utilizadas sejam obtidas por
processos adequados.
- O que é necessário garantir, em suma, é que a amostra seja “Representativa” da
população.
Dois aspectos nas amostras são fundamentais, e que dão a sua representatividade em
termos:
- Qualitativos: Amostras que representem todas as sub-populações, quando for o caso.
- Quantitativos: Que possua quantidade de dados suficientes para representar a
população.
Na indústria onde amostras são freqüentemente retiradas para efeito de Controle da

Qualidade dos produtos e materiais, em geral os problemas de amostragem são mais
simples de resolver.
Por outro lado, em pesquisas sociais, econômicas ou de opinião, a complexibilidade dos

problemas de amostragem são normalmente bastante grandes.
Inferência estatística envolve a formulação de certos julgamentos sobre um todo após

examinar apenas uma parte, ou a amostra, dele.
A probabilidade e a amostragem estão estreitamente correlacionadas e juntas formam o

fundamento da teoria de inferência.
- Amostragem é o ato de retirar amostra, isto é, a ação.
- Amostra é a quantidade de dados especificados para representar a população.

Amostragem aleatória permite estimar o valor do erro possível, isto é, dizer “ quão
próxima” está a amostra da população, em termos de representatividade.
Amostragem não aleatória não apresenta esta característica.
Há vários métodos para extrair uma amostra, talvez o mais importante seja a amostragem
aleatória. De modo geral, a amostragem aleatória exige que cada elemento tenha a
mesma oportunidade de ser incluído na amostra.
Nas Populações discretas uma amostra aleatória é aquela em que cada item da
população tem a mesma chance de ser incluído na amostra.
Nas Populações contínuas, uma amostra aleatória é aquela em que a probabilidade de
incluir na amostra qualquer intervalo de valores é igual à percentagem da população que
está naquele intervalo.
Populações finitas: é quando, temos constituído por números finitos, ou fixos de

elementos, medidas ou observações.
Ex.: Peso bruto de 3000 latas de tinta de um certo lote de produção.
Populações infinitas: são aquelas que contém, pelo menos hipoteticamente, um número
infinito de elementos.
Ex.: Produção de carros V.W. produzidos no Brasil e a serem produzidos (universo
volkswagem), processo probabilístico.
2.2 AMOSTRAGEM ALEATÓRIA BASEADA EM NÚMEROS

ALEATÓRIOS (RANDÔMICOS)
As tabelas de números aleatórios contém os dez algarismos 0,1,2,3,4,......,9. Esses

números podem ser lidos isoladamente ou em grupos; podem ser lidos em qualquer ordem.
A probabilidade de qualquer algarismo aparecer em qualquer ponto é 1/10. Portanto todas
as combinações são igualmente prováveis.

Conceitualmente, poderíamos construir uma tabela de números aleatórios numerando
dez bolinhas com os algarismos de 0 a 9 , colocando-as numa urna, misturando bem e
extraindo uma de cada vez, com reposição, anotando os valores obtidos.
A titulo de ilustração poderíamos querer selecionar aleatoriamente 15 clientes de uma lista

de 830 de um grande magazine, a finalidade poderia ser :
Estimar a freqüência de compras;
Determinar o valor médio de cada compra;
Registrar as queixas contra o sistema.
2.3 OUTROS PLANOS DE AMOSTRAGEM
Amostragem probabilística versus Amostragem não probabilística.
Os planos de amostragem probabilística são delineados de tal modo que se conhece a

probabilidade de todas as combinações amostrais possíveis. Em razão disso, pode-se
determinar a quantidade de variável amostral numa amostra aleatória e uma estimativa do
erro amostral. A amostragem aleatória é um exemplo da amostragem probabilística.
A amostragem não probabilística é a amostragem subjetiva, ou por julgamento, onde a
variabilidade amostral não pode ser estabelecida com precisão, conseqüentemente, não é
possível nenhuma estimativa do erro amostral.
A verdade é que, sempre que possível, deve-se usar a amostragem probabilística.
2.4 AMOSTRAGEM POR JULGAMENTO (NÃO PROBABILÍSTICA)

Se o tamanho da amostra é bem pequeno; digamos, de uns 5 itens, a amostragem
aleatória pode dar resultados totalmente não representativos, ao passo que uma pessoa
familiarizada com a população pode especificar quais os itens mais representativos da
população.

Exemplo: Uma equipe médica deve trabalhar com pacientes que se apresentem como
voluntários para testar um novo medicamento. Nenhum desses grupos podem ser
considerados como uma amostra aleatória do público em geral, e seria perigoso tentar
tirar conclusões gerais com base em tal estudo. Todavia, os resultados poderiam
proporcionar uma base para a elaboração de um plano de amostragem aleatório para
validar os resultados básicos. Os perigos inerentes à pesquisa médica, bem como outro
tipo de pesquisa, freqüentemente obrigam a limitar a pesquisa inicial a um pequeno grupo
de voluntários.
Exemplo: A aplicação de hormônios em mulheres na menopausa, após um período de

tempo notou-se o aumento das chances de adquirirem câncer de mama, doenças
cardíacas etc.
2.5 AMOSTRAGEM PROBABILÍSTICA
SISTEMÁTICA
ESTRATIFICADA
CONGLOMERADO
AMOSTRAGEM SISTEMÁTICA
É muito parecida com a amostragem aleatória simples. Podemos ter uma amostragem
realmente aleatória, escolhendo-se cada K-ésima amostra, onde K obtem-se dividindo o
tamanho da população pelo tamanho da amostra.
K= N onde: N= Tamanho da População

n n= Tamanho da Amostra
EX. N= 200 e n=10 então K=200/10 = 20
Significa que será escolhido um item a cada seqüência de 20 de uma lista. Para iniciar
pode-se usar uma tabela de números aleatórios de 0 a 9 para iniciar os grupos. Por
exemplo se der o 9, escolhemos o 9º, 29º, 39º ,49º , etc.

AMOSTRAGEM ESTRATIFICADA
Pressupõe a divisão da população em sub-grupos Homogêneos (Estratos), procedendo
então a amostragem de cada sub-grupo. Ex.: Para se fazer o inventário do estoque, é
comum termos 10% dos itens representarem cerca de 60% do valor total em quanto que os
90% restantes representam só 40% do valor total (Curva A,B,C; Pareto; regra 80/20).
AMOSTRAGEM POR CONGLOMERADO
Pressupõe a disposição dos itens de uma população em sub-grupos heterogêneos (sub-
populações) representativos da população global. Neste caso cada conglomerado pode ser
encarado como uma minipopulação.
Ex.: Estudo pré-eleitoral para medir a preferência dos eleitores. (Sub-grupos: sexo,
educação, faixa etária, poder aquisitivo, região da habitação, etc.)

RESUMO
A finalidade da amostra é permitir fazer inferência sobre a população após inspeção de

apenas parte dela. Fatores como custo, ensaios destrutivos e populações infinitas, tornam
a amostragem preferível a um estudo completo (Censo) da população.
Naturalmente espera-se que a amostra seja representativa da população da qual foi

extraída.
Potencialmente, este objetivo é atingido quando a amostragem é aleatória.
Para populações discretas o termo “Aleatório” significa que cada item da população tem a
mesma chance de participar na amostra.
No caso de populações contínuas, significa que a probabilidade de incluir qualquer valor

de um dado intervalo de valores é igual à proporção de valores naquele intervalo.
As amostras aleatórias podem ser obtidas:

- Através de um processo de mistura, como o embaralhamento de cartas;
- Pela utilização de um processo mecânico (Misturadores);
- Utilizando-se uma tabela de números aleatórios para proceder à seleção de uma
lista.
Em certas condições, podem ser mais eficientes variantes da amostragem aleatória

simples, tais como amostragem sistemática (periódica), estratificada (sub-grupos
Homogêneos), ou amostragem por aglomerados (sub-grupos convenientes e
heterogêneos).
A principal vantagem da amostragem aleatória é que se pode determinar o grau de

variabilidade amostral, o que é essencial na inferência estatística. Para a amostragem
não probabilística falta esta característica.

QUESTÕES PARA RECAPITULAÇÃO
1- Em que circunstância é a amostragem preferível a um censo completo?
2- Quando se deve preferir um censo a uma amostragem?
3- Defina “Amostra Aleatória”.
4- Explique rapidamente as características:
a- da amostragem por conglomerado;

b- da amostragem estratificada;
c- da amostragem sistemática.
5- O que é amostragem por julgamento e em que circunstância deve ser usada?
6- O que é amostragem probabilística e quando deve ser usada?
7- Explique o que é uma população:
a- Finita;
b- Infinita.

3.0 ANÁLISE EXPLORATÓRIA DE DADOS
Em alguma fase de seu trabalho, o pesquisador se vê às voltas com o problema de
analisar e entender uma massa de dados, relevantes ao seu particular objeto de estudos.
De modo geral, podemos dizer que a essência da ciência é a observação e que seu
objetivo básico é a inferência. Esta é a parte da metodologia da ciência que tem por
objetivo a coleta, a redução, a análise e a modelagem dos dados, a partir do que,
finalmente, faz-se a inferência para uma população, da qual os dados (amostras) foram
obtidos.
4.0 DISTRIBUIÇÃO DE FREQÜÊNCIA
Para cada tipo de variável existem técnicas mais apropriadas para resumir as informações.
Porém podemos usar algumas técnicas empregadas num caso e adaptá-las para outros.
Quando se estuda uma variável, o maior interesse do pesquisador é conhecer a
distribuição dessa variável através das possíveis realizações (valores) da mesma.
Exemplo: Dados relativos a uma amostra de 36 funcionários de uma população de 2000
funcionários da empresa Milsa. Ver resultados anotados na tabela abaixo.

TABELA 1: Dados relativos a uma amostra de 36 funcionários de uma população de 2000
funcionários da empresa Milsa.
Nº ESTADO GRAU DE Nº DE SALÁRIO IDADE REGIÃO DE

CIVIL INSTRUÇÃO FILHOS (X SAL. MIN) ANOS MESES PROCEDÊNCIA
1 solteiro 1º grau --- 4 26 03 interior
2 casado 1º grau 1 4,56 32 10 capital
4 solteiro 2º grau --- 5,73 20 10 outro
6 casado 1º grau 0 6,66 28 00 interior
7 solteiro 1º grau --- 6,86 41 00 interior
8 solteiro 1º grau --- 7,39 43 04 capital
14 casado 1º grau 3 8,95 44 02 outro
19 solteiro superior --- 10,53 25 08 interior
20 solteiro 2º grau --- 10,76 37 04 interior
24 casado superior 0 12,79 26 01 outro
31 solteiro superior --- 16,22 31 05 outro
33 casado superior 3 17,26 43 07 capital
34 solteiro superior --- 18,75 33 07 capital
36 casado superior 3 23,30 42 02 interior

TABELA 2: Freqüência e porcentagem da amostra de 36 empregados da empresa Milsa
segundo o grau de instrução.
GRAU DE FRQÚÊNCIA FREQ. RELATIVA

INSTRUÇÃO TABULAÇÃO F FR (%)
1º grau
IIIIIIIIIIII 12 33,33
2º grau
IIIIIIIIIIIIIIIIII 18 50,00
superior IIIIII 6 16,67
TOTAL 36 100
TABELA 3: Freqüência e porcentagem dos 2000 empregados (População) da empresa

Milsa (Censo x Probabilidade)
GRAU DE FRQÜÊNCIA FREQ. RELATIVA FREQ. RELATIVA

INSTRUÇÃO F FR % CENSO FR % PROVÁVEL
1º grau 650 32,50 33,33
2º grau 1020 51,00 50,00
superior 330 16,50 16,67
TOTAL 2000 100 100

TABELA 4: Freqüência e porcentagens dos 36 empregados (Amostra) da empresa Milsa
CLASSES DE FREQÜÊNCIA FREQ. RELATIVA

SALÁRIOS F FR (%)
4 |----- 8 10 27,78
8 |----- 12 12 33,33
12 |----- 16 8 22,22
16 |----- 20 5 13,89
20 |----- 24 1 2,78
TOTAL 36 100
TABELA 5: Freqüências e porcentagem dos empregados da empresa Milsa, segundo Nº

de filhos
FREQÜÊNCIA FREQ. RELATIVA

Nº DE FILHOS F FR (%)
0 4 20
1 5 25
2 7 35
3 3 15
5 1 5
TOTAL 20 100

5.0 APRESENTAÇÃO GRÁFICA
A apresentação gráfica dos dados e respectivos resultados de sua análise pode também
ser feita sob forma de figuras, em geral gráficos ou diagramas.
Gráficos devem ser auto-explicativos e de fácil compreensão, de preferência sem

comentários inseridos. Os gráficos devem ser simples, atrair a atenção do leitor e inspirar
confiança.
5.1 DIAGRAMA DE ORDENADAS

Para sua construção é traçada uma reta horizontal (ou vertical) de sustentação; a partir de pontos
eqüidistantes na reta, traçam-se perpendiculares cujos comprimentos sejam proporcionais às
freqüências.
freqüências
12
10
0
4 I-------8 8 I-------12 12 I-------16 16 I-------20 20 I-------24
Salários

5.2 DIAGRAMA DE BARRAS
A mesma distribuição acima poderia ser representada por meio de diagrama que levasse
em conta a magnitude da área da figura geométrica, já que a vista repousa melhor sobre
uma superfície do que sobre uma linha.
freqüências
12
10
0
4 |---- 8 8 |---- 12 12 |----16 16 |----20 20 |----24
salários

5.3 DIAGRAMA DE CÍRCULOS
Além do retângulo, outra figura geométrica utilizada é o círculo ou conjunto de círculos.
Lembrando que a área do círculo é o produto do número irracional π = (3,1416) pelo
quadrado do raio (r), isto é, C = π.r 2 , e desde que as áreas dos diversos círculos devem ser
proporcionais às magnitudes das freqüências, isto é, C = α .f onde α é o fator de

proporcionalidade, segue-se que:
α α
α .f = π.r 2 , ou seja, r = π f . Se chamar r = α' f .
π de α’, tem-se:
Portanto, os raios dos círculos devem ser proporcionais à raiz quadrada das freqüências
das modalidades da variável.
Assim se quisermos representar graficamente a distribuição da tabela 4, os raios do círculo
deverão ser:
r1 = 27,78 . α’= 5,27 . α’→ 5,27. 3 = 15.8 mm
r2 = 33,33 . α’= 5.77 . α’→ 5,77. 3 = 17,3 mm
r3 = 22,22 . α’= 4,71. α’→ 4,71. 3 = 14,1 mm
r4 = 13,89 . α’= 3.72. α’→ 3,72. 3 = 11,1 mm
r5 = 2,78 . α’ = 1,66 α’→ 1,66. 3 = 5,00 mm
A figura abaixo representa esta distribuição, com um α’ adotado de 3 mm.
33,33
2,7 13,89 22,22 27,78
% %
% % %

5.4 DIAGRAMA DE SETORES CIRCULARES
Outra opção seria através de setores circulares, na qual se divide a área total de um círculo
em subáreas (setores) proporcionais as freqüências.
Lembrando que o círculo compreende setores cujas áreas (S) são produto do raio (r) pelo
tamanho do arco (a), isto é, S = r.a, e como S deve ser proporcional à freqüência f, tem-se
S= α.f , onde α é o fator de proporcionalidade; então:
α .f = r. a
a = α.f
r
α
Se chamarmos de α’, tem-se S = α’.f , isto é, os arcos e os respectivos ângulos centrais
r
de um círculo é igual a 360°, e sendo F a freqüênci a total, tem-se
360° = α’. F
360º
ou seja: α' =
360º
. Portanto a= .f .
F F
Assim, a distribuição de freqüência da tabela 4 representando faixas de salários será:
a1 = 360° x 27,78 = 100°

100
a2 = 360° x 33,33 = 120°

100
a3 = 360° x 22,22 = 80°

100
a4 = 360° x 13,89 = 50°

100
S5 = 360° x 2,78 = 10°

100

Diagrama de Setor Circular:
120°
50°
10°
.
100° 80°
Diagrama de Setor Circular feito automaticamente pelo Excel:
33%
22%
28% 14%
3%

5.5 DIAGRAMA LINEAR
No diagrama linear deve-se plotar os pontos nos eixos como foi feito no diagrama de
barras e em seguida unir esses pontos por semi-retas constituindo-se desta forma o
diagrama linear.
freq.
12
10
0
4 8 8 12 12 16 16 20 20 24
salários

6.0 MONTAGEM DE UMA DISTRIBUIÇÃO DE FREQÜÊNCIAS
A análise estatística de dados relativos a uma amostra de uma população, requer uma
aglutinação organizada de informações, conforme regras cuja prática demonstrou serem
eficientes.
Consideremos uma relação de pesos de pacotes de manteiga, em gramas, de uma
amostra de 100 pacotes extraídos parcialmente de um processo automático de
empacotamento.
±15
A especificação de fabricação é 215 gramas (200 a 230 gramas)
TABELA 6
AMOSTR AMOSTR AMOSTR AMOSTR AMOSTR

A PESO A PESO A PESO A PESO A PESO
1 207 21 220 41 210 61 210 81 217
2 213 22 204 42 214 62 220 82 211
3 210 23 213 43 219 63 213 83 213
4 215 24 211 44 215 64 217 84 218
5 201 25 214 45 217 65 214 85 213
6 210 26 217 46 213 66 219 86 216
7 212 27 224 47 218 67 214 87 218
8 204 28 211 48 214 68 215 88 216
9 209 29 220 49 215 69 223 89 206
10 212 30 209 50 212 70 217 90 212
11 215 31 214 51 221 71 213 91 207
12 216 32 208 52 211 72 218 92 213
13 221 33 217 53 218 73 207 93 215
14 219 34 214 54 205 74 210 94 212
15 222 35 209 55 220 75 208 95 223
16 225 36 212 56 203 76 214 96 210
17 215 37 208 57 216 77 211 97 226
18 218 38 215 58 222 78 205 98 224
19 213 39 211 59 206 79 215 99 214
20 216 40 216 60 221 80 207 100 215
O agrupamento destes dados em sub-grupos é feito com base nos seguintes conceitos:
Amplitude total (RT ou Ω): é a diferença entre a medida máxima e a medida mínima. No
caso da amostra de pacotes de manteiga acima, temos:

RT = 226 – 201 = 25 gramas
Número de classes (d) : é o número de divisões que estipulamos para a Amplitude Total.
Normalmente pode-se usar d ≈ n onde n é o número de itens na amostra. Para o

exercício temos d ≈ 100 = 10 classes, porém deve-se utilizar sempre que possível número
ímpar de classes, no caso podemos usar 9 classes.

(Classe: é o intervalo de variação das medidas.)
Amplitude do intervalo de classe (RI): é a diferença entre os valores máximos e mínimos

de cada classe.
RT
Amplitude do intervalo de cada classe RI =
d
25
No exercício temos: amplitude do intervalo de cada classe RI = = 2,78 (aprox. 3)
9
RI adotado = 3 e RT adotado = 27 (começa um antes do menor e termina um depois do

maior valor)
OBS.: Normalmente usa-se um número mínimo de 5 e no máximo 20 classes, de

preferência de mesma amplitude.
As classes devem ser mutuamente exclusivas, para que não haja dúvida na localização
dos valores das variáveis, podemos daí utilizar as seguintes simbologias para os intervalos:
0 ----I 10 intervalo aberto & fechado, para significar que o intervalo compreende os
valores da variável maiores do que 0 (exclusive) e até 10 (inclusive);
0 I---- 10 intervalo fechado & aberto, para significar que compreende os valores da
variável a partir de 0 (inclusive) e até 10 (exclusive);
0 ----- 10 Intervalo aberto & aberto, para significar que compreende valores maiores do
que 0 e menores do que 10.
0 I----I 10 intervalo fechado & fechado, para significar que compreende os valores da
variável a partir de 0 (inclusive) e até 10 (inclusive).

TABELA DE DISTRIBUIÇÃO DAS FREQÜÊNCIAS
Para a facilidade e metodização do processo de análise estatística, monta-se uma tabela
que agrupe as informações obtidas, da forma de Tabela de Freqüências. Para os pacotes
em pauta, teremos a seguinte tabela de freqüências:
TABELA 7
FREQ. FREQU. FREQ. ACUM.
VALOR COMPRIMENTO FREQ. RELATIVA (%) ACUM. REL (%)
CLASSE CLASSE TABULAÇÃO f fR F FR
1 200 I--- 203 I 1 1 1 1
2 203 I--- 206 I I I I 4 4 5 5
3 206 I--- 209 I I I I I I I I I I 10 10 15 15
4 209 I--- 212 I I I I I I I I I I I I I I I 15 15 30 30
5 212 I--- 215 I I I I I I I I I I I I I I I I I I I I I I I I I 25 25 55 55
6 215 I--- 218 I I I I I I I I I I I I I I I I I I I I I 21 21 76 76
7 218 I--- 221 I I I I I I I I I I I I I 13 13 89 89
8 221 I--- 224 I I I I I I I 7 7 96 96
9 224 I--- 227 I I I I 4 4 100 100
∑ 100 100%
Onde:
Freqüência (f) = número de vezes que as medidas ocorrem no intervalo de classes
Freqüência Relativa (fR) = porcentagem da freqüência de cada classe em relação ao total
f
de elementos. f R = .100
n
Freqüência acumulada (F) = soma das freqüências até o intervalo de classe considerado.
Ex. F5 = f1+ f2 + f3 + f4 + f5 → 1 + 4 + 10 + 15 + 25 = 55
Freqüência acumulada relativa (FR) = soma das freqüências relativas até o intervalo
considerado. Por ex.: FR3 = fR1 + fR2 + fR3 → 1 + 4 + 10 = 15

7.0 REPRESENTAÇÃO GRÁFICA DAS VARIÁVEIS QUANTITATIVAS
A representação gráfica da distribuição de freqüências de uma variável tem a vantagem de,

rápida e concisamente, informar sobre a variabilidade da mesma.
Podemos optar por vários tipos de gráficos, porém qualquer que seja ele, devemos
especificar os elementos essenciais para a sua interpretação, que são:
i. o título;
ii. o corpo;
iii. o cabeçalho;
iv. as colunas indicadoras.
TÍTULO é a indicação que, precedendo à tabela, é colocado na parte superior da mesma.
Deve ser preciso, claro e conciso, indicando a natureza dos fatos estudados (o quê), e a
época (quando) em que o mesmo foi observado.
CORPO da tabela é o conjunto de linhas e colunas que contem respectivamente, as
séries horizontais e verticais de informações. Casa, cela ou célula é o cruzamento de uma
linha com uma coluna, onde se tem a freqüência com que a categoria (ou categorias)
aparece.
CABEÇALHO é a parte da tabela em que é designada a natureza (as categorias, as
modalidades da variável) do conteúdo de cada coluna.
COLUNA INDICADORA é a parte da tabela em que é designada a natureza (as
categorias, as modalidades da variável) do conteúdo de cada linha.
Os elementos complementares de uma tabela são:
i. Fontes;
ii. Notas.
FONTE é o indicativo, no rodapé da tabela, da entidade responsável pela sua
organização ou fornecedora dos dados primários. A razão da presença da fonte não é
somente honestidade científica, mas também permitir ao leitor a possibilidade de
consultar o trabalho original de onde procedem as informações.
NOTAS são colocadas no rodapé da tabela para esclarecimentos de ordem geral. E são
numeradas, podendo-se também usar símbolos gráficos, sendo comum o asterisco.

7.1 HISTOGRAMA E POLIGONO DAS FREQÜÊNCIAS
FREQÜÊNCIAS
25
POLÍGONO DE
FREQÜÊNCIAS
HISTOGRAMA
15
10
1 2 3 4 5 6 7 8 9 CLASSES
Polígono de freqüências é a representação gráfica de uma distribuição de freqüências

através de um polígono, onde tomamos sobre a abscissa os pontos médios das classes e
sobre as ordenadas as freqüências correspondentes. Depois para fechar o polígono
unimos os extremos da figura com o eixo das abscissas nos pontos médios de uma classe
imediatamente anterior à primeira e imediatamente posterior à última, ambas as
freqüências nulas, para manter a área sob o polígono igual a área do histograma.

7.2 HISTOGRAMA E POLIGONO DE FREQÜÊNCIA RELATIVA
FREQÜÊNCIAS
25 RELATIVAS (%)
POLÍGONO DE
FREQÜÊNCIA
RELATIVA
HISTOGRAMA
15
10
1 2 3 4 5 6 7 8 9 CLASSES

7.3 POLIGONO DE FREQÜÊNCIA ACUMULADA OU OGIVA
FREQÜÊNCIAS
ACUMULADAS
POLÍGONO DE
100 FREQÜÊNCIA
ACUMULADA
HISTOGRAMA
55
15
1 2 3 4 5 6 7 8 9 CLASSES

7.4 POLIGONO DE FREQÜÊNCIA ACUMULADA RELATIVA
FREQÜÊNCIAS
ACUMULADAS
RELATIVAS (%)
POLÍGONO DE
100 FREQÜÊNCIA
ACUMULADA
RELATIVA
HISTOGRAMA
55
15
1 2 3 4 5 6 7 8 9 CLASSES

8.0 TIPOS DE DISTRIBUIÇÃO
As distribuições de freqüência podem se apresentar de diversas formas conforme as

figuras a seguir:
8.1 DISTRIBUIÇÃO SIMÉTRICA OU EM FORMA DE SINO

A distribuição é simétrica quando os valores se distribuem igualmente em torno da média
__
( X ou M)
A) Normal
B) Alongada

C) Achatada
8.2 DISTRIBUIÇÃO ASSIMÉTRICA
É aquela em que as freqüências dos valores medidos se distribuem de forma desigual em

torno da média.
A) Assimétrica Positiva

B) Assimétrica Negativa
8.3 DISTRIBUIÇÃO MODAL, AMODAL, BIMODAL E MULTIMODAL
Chamamos de moda (mo) numa distribuição, ao valor da medida ou classe que

corresponde à freqüência máxima. Sob o critério da moda as distribuições classificam-se
em:
A) DISTRIBUIÇÃO MODAL – Quando a distribuição tem freqüência máxima ela é

denominada modal.
mo

B) DISTRIBUIÇÃO AMODAL – Quando a distribuição não tem moda
C) DISTRIBUIÇÃO BIMODAL – Quando a distribuição tem duas modas.
mo mo
D) DISTRIBUIÇÃO MULTIMODAL – Quando a distribuição tem mais de duas modas
mo mo mo

8.4 APRESENTAÇÃO TIPO RAMO-E-FOLHAS
Uma alternativa para o uso da tabela de distribuição de freqüências é usar o gráfico do tipo
ramo-e-folhas.
Podemos estudar a partir de um exemplo prático:
Observamos os seguintes números de passageiros em 50 viagens de um avião que faz a
ponte aérea Rio - São Paulo:
61 52 64 84 35 57 58 95 82 64
50 53 103 40 62 77 78 66 60 41
58 92 51 64 71 75 89 37 54 67
59 79 80 73 49 71 97 62 68 53
43 80 75 70 45 91 50 64 56 86
SOLUÇÃO:
F FA
3 5 7 2 2
4 0 1 3 5 9 5 7
5 0 0 1 2 3 3 4 6 7 8 8 9 12 19
6 0 1 2 2 4 4 4 4 6 7 8 11 30
7 0 1 1 3 5 5 7 8 9 9 39
8 0 0 2 4 6 9 6 45
9 1 2 5 7 4 49
10 3 1 50
A MEDIANA NESTE CASO SERÁ md = 64

8.5 O PICTOGRAMA
A figura abaixo mostra um exemplo de apresentação pictográfica de dados temporais

(comumente encontrada em jornais, revistas e relatórios de vários tipos); no caso abaixo
representa a população dos Estados Unidos da América do Norte.
1920
1930
1940
1950
1960
1970
1980
1990
Cada símbolo = 10 milhões de pessoas

(Pictograma da população dos Estados Unidos da América do Norte)
EXERCÍCIO
Construa uma distribuição de freqüências e faça as possíveis representações gráficas para

os dados da tabela abaixo.
Tabela - Pressão arterial em milímetros de mercúrio, para cães adultos anestesiados

depois de determinado procedimento cirúrgico. Fonte: ARAÚJO e HOSSNE (1977)
130,0 105,0 120,0 111,5 99,0 116,0 92,5
107,5 1250 100,0 107,5 120,0 143,0 115,0
135,0 130,0 135,0 127,5 905 104,5 136,5
100,0 145,0 125,0 104,5 101,5 102,5 101,5
134,5 138,5 110,0 102,5 90,5 107,5 1244,0
121,5 135,0 102,0 119,5 115,5 125,5 117,5
107,5 140,0 121,5 107,5 113,0 93,0 103,5

9.0 MEDIDAS DE POSIÇÃO OU DE TENDÊNCIA CENTRAL
Como o próprio nome indica, a medida de tendência central visa a determinar o centro da
distribuição. Esta determinação, porém, não é bem definida daí parece razoável
chamarmos de “tendência central”.
São medidas de tendência central:
__
• MÉDIA ARITMÉTICA SIMPLES/PONDERADA ( X ou M);
• MEDIANA (md);
• MODA (mo).
9.1 MÉDIA ARITMÉTICA SIMPLES
Dada uma distribuição de freqüências, chama-se média aritmética desta distribuição, e

_
representa-se por X a soma de todos os valores da variável, dividida pelo número de
variáveis “n”.
_ ∑x i _
∑x
X= i =1
ou simplificadamente, X =
n n
n
Sendo: ∑x
i =1
i = x 1 + x 2 + ... + x n
Exemplo: Calcular a média aritmética simples de 8, 3, 5, 12, 10.
_
8 + 3 + 5 + 12 + 10 38
X= = = 7 ,6
5 5

9.2 MÉDIA ARITMÉTICA PONDERADA
__ ∑x i .fi
X= i =1
n
∑f i =1
i
onde: fi = freqüência dos dados xi
Exemplo: Calcular a média ponderada dos números 5, 8, 6, 2 ; os quais ocorrem com as

freqüências 3, 2, 4 e 1, respectivamente.
Números x = 5, 8, 6, 2
Freqüências f = 3, 2, 4, 1
__ ∑x i .fi
(5.3) + (8.2) + (6.4) + ( 2.1) 57
X= i =1
= = = 5 ,7
n
3+ 2+4+1 10
∑f i =1
i
9.3 MEDIANA (md)
Se ordenarmos uma seqüência de números do menor para o maior e se a quantidade

desses números for impar, então a mediana será o valor do meio, ou a média dos dois
valores do meio, caso a quantidade de números seja par.
O símbolo que usamos para representar a mediana será md

No caso de cálculo da mediana quando estamos trabalhando com distribuição de
freqüência determinamos o valor mais provável dessa distribuição a partir de:
Posição da md = Freqüência acumulada total = FA

2 2

n + 1
Ou seja, a posição da MEDIANA é definida por   -ésimo elemento quando ”n” é
 2 
ímpar e temos um número inteiro que dá a posição da mediana. Quando temos o meio do
caminho entre dois números inteiros, isto é, ”n” é par, a mediana será a média deles.
Exemplo: Determine a posição da mediana para: (a) n=15, (b) n=45 e (c)n=88.
n + 1 15 + 1
(a) = = 8 , e a mediana é o valor do 8° elemento;
2 2
n + 1 45 + 1
(b) = = 23 , e a mediana é o valor do 23° elemento;
2 2
n + 1 88 + 1
(c) = = 44,5 , e a mediana é a média do valor do 44° e o 45°elem ento.
2 2
n  n 
Ou seja, quando n é par procuramos duas posições:   e  + 1
2 2 
No caso do exercício da distribuição dos 100 valores de peso de pacotes de manteiga
temos:
md = FA = 100 = 50, e a mediana é o valor do 50° elemento

2 2
50°
valor
F 0 1 5 15 30 55 76 89 96 100
X 200 203 206 209 212 215 218 221 224 227
50°
30 55
212 215
(55 – 30) (215 – 212) ou (55 – 30) (215 – 212)

(55 – 50) ∆ (50 – 30) ∆
∆= 5 x 3 = 0,6 ∆= 20 x 3 = 2,4
25 25
portanto a mediana será 215 - ∆ portanto a mediana será 212 + ∆
logo, md = 215 - 0,6 = 214,4. logo, md = 212 + 2,4 = 214,4.

Assim, para encontrarmos a mediana para dados tabulados agrupados em classes
podemos formalizar os passos anteriores na seguinte equação:
n 
 − Fant 
m d = l inf +h 2  , onde:
 f med 
 
 
n
≡ metade da quantidade de dados
2
h ≡ amplitude da classe mediana
linf ≡ limite inferior da classe da mediana
fmed ≡ freqüência absoluta da classe da mediana
Fant ≡ freqüência acumulada da classe anterior a da
mediana
Voltando ao exemplo, temos:

1º Passo: da tabela 7 - página 25, temos as freqüências acumuladas já calculadas;
n 100
2º Passo: n = 100 => = = 50 => localização da classe mediana: 5ª classe, isto é,
2 2
classe 212 --- 215;
3º Passo: encontrar na tabela: linf , fmed e Fant :
linf = 212
fmed = 25
Fant = 30
4º Passo: substituir os dados na equação:
n 
 − Fant 
m d = l inf +h 2  = 212 + 3 50 − 30  = 212 + 3.0,8 = 212 + 2,4 = 214,4
 f med   25 
 
 
md = 214,4

9.3.1 SEPARATRIZES (QUARTIS, DECIS E CENTIS)
Como extensão do conceito de mediana, podemos dividir os valores em quatro, dez e cem
partes iguais. Essas divisões são chamadas de quartis, decis e centis, respectivamente.
O cálculo dessas divisões é semelhante ao da mediana, isto é:
 i .n 
 − FQi − 1 
Quartis: Q i = l inf +h 4  , onde i = 1, 2, 3
 f Qi 
 
 
 i .n 
 − FDi − 1 
Decis: D i = l inf + h  10  , onde i = 1, 2, 3, 4, 5, .., 9
 f Di 
 
 
 i .n 
 − FCi − 1 
Centis: C i = l inf + h  100  , onde i = 1, 2, 3, 4, 5, ..., 99
 f Ci 
 
 
Onde:
h ≡ amplitude da classe
linf ≡ limite inferior da classe da quartílica, decílica ou
percentílica
fQi , fDi , fCi ≡ freqüências das classes quartílica, decílica e
percentílica, respectivamente
FQi-1 , FDi-1 , FCi-1 ≡ freqüências acumuladas da classe
anterior à classe quartílica, decílica ou percentílica
Voltando ao exemplo anterior, temos:

i) Se quisermos calcular o 1º Quartil, ou seja, 25% dos dados:
 1.n   100 
 − FQ i − 1   − 15 
Q 1 = l inf +h 4  = 209 + 3 4  = 209 + 3.0,67 = 211,01
 f Qi   15 
   
   

ii) Para o 3º Quartil:
 3.n   3.100 
 − FQ i − 1   − 55 
Q 3 = l inf +h 4  = 215 + 3 4  = 215 + 3.0,95 = 217,85
 f Qi   21 
   
   
iii) Para o 8º Decil:
 8.n   8.100 
 − FDi − 1   − 76 
D 8 = l inf + h  10  = 218 + 3 10  = 218 + 3.0,31 = 218,93
 f Di   13 
   
   
iv) Para o 15º Centil:
 15.n   15.100 
 − FCi − 1   −5
C15 = l inf + h  100  = 206 + 3 100  = 209
 f Ci   10 
   
   
OBS.: Caso tenhamos dados não agrupados em classes, como por exemplo a
seqüência 2,3,3,4,5,7,7,8,10,11,12,12, 13; o cálculo do 3º Quartil será:
3.n 3.13
Posição: = = 9,75 . A posição 9,75ª será aproximada pela inteira imediatamente
4 4
posterior a ela, ou seja, a 10ª posição, logo Q3 = 11. E assim, analogamente, para
encontrar os decis e centis de uma série de dados não agrupados em classes.
9.4 MODA ( mo )
Em um conjunto de números a moda é o valor que ocorre com maior freqüência, isto é, o
valor mais comum.
Exemplos:
1) 2, 2, 3, 7, 8, 8, 8, 9, 10
moda=8
2) 1, 2, 3, 4, 5, 6, 7, 8, 9, 10
moda = Ф (não existe moda)
3) 2, 2, 4, 4, 4, 5, 6, 7, 8, 8, 8, 9
moda = 4 e 8

Para o exemplo do exercício das distribuições de freqüências dos pacotes de manteiga
(onde os dados são tabulados agrupados em classes) uma forma de estimar o valor da
moda é pela Estimativa de Pearson (para dados tabulados agrupados em classes):
_
mo = 3.md – 2. X
Voltando ao exemplo, temos:

mo = 3.214,4 – 2. 214,49 => mo = 214,22
onde a média foi calculada da forma:

_
201,5.1 + 204,5.4 + 207,5.10 + 210,5.15 + 213,5.25 + 216,5.21 + 219,5.13 + 222,5.7 + 225,5.4
X=
1 + 4 + 10 + 15 + 25 + 21 + 13 + 7 + 4
_
=> X = 214,49
O cálculo da moda pelo Método de Pearson é mais utilizado quando temos uma
indicação de que os três parâmetros de tendência central (média, mediana e moda)
estejam muito próximos.
Um outro método, de origem gráfica, é o Método de Czuber, que utilizamos na maioria
dos casos:
 ∆a 
mo = l inf +   ⋅ h
 ∆a + ∆p 
onde:
linf = limite inferior da classe modal.
∆a = diferença entre a fi da classe modal e a fi da classe anterior. Entenderemos como
classe anterior aquela que precede à classe modal.
∆p = diferença entre a fi da classe modal e a fi da classe posterior (aquela que vem
logo após a classe modal).
h = amplitude da classe modal.
A equação da moda pode ser deduzida facilmente do processo gráfico para determinar
a moda em um histograma.

Da figura acima temos mo = linf + x e chamando ∆1 de ∆a e ∆2 de ∆p , e, pela semelhança
dos triângulos ABE e CDE temos:
∆a x h∆a
= ⇒x=
∆p h − x ∆a + ∆p
 ∆a 
Portanto: mo = l inf +   ⋅ h
 ∆a + ∆p 

10.0 MEDIDAS DE VARIABILIDADE (OU DE DISPERSÃO)
As medidas de dispersão indicam se os valores estão relativamente próximos uns

dos outros, ou separados. Podemos dizer que dispersão é o grau com o qual os
valores numéricos de uma distribuição tendem a se distanciar em torno de um valor
médio.
Em todos os casos, o valor zero indica ausência de dispersão; a dispersão aumenta à

proporção que aumenta o valor da medida (amplitude, desvio-padrão, variância).
xx x x x x xxx xxx xx x x
a) pequena dispersão
xx x x xxx x x x x x x x x xx x x xxx x x x xx x x x x xx
b) grande dispersão
10.1 AMPLITUDE TOTAL (RT ou Ω)
É a medida mais simples de dispersão. É a diferença entre o maior e o menor valor das
observações.
RT = Xmax – Xmin
Embora exista simplicidade de cálculo, existem duas restrições ao seu uso

generalizado:
1- Utiliza apenas uma parcela das informações contidas nas observações. O seu valor
não se modifica mesmo que os valores das observações variem, desde que
conservem os seus valores máximo e mínimo. Ou seja, depende apenas dos
valores externos (max e min), não sendo afetada pelos valores internos.
2- Depende do número de observações na amostra. Em geral o valor da amplitude

cresce quando cresce o tamanho da amostra.
X min X max.
RT = pequeno
X min X max.
RT = Grande

10.2 DESVIO EM RELAÇÃO À MÉDIA ARITMÉTICA (di)
O desvio di em relação à média de um conjunto de dados é a diferença do valor xi e a

_
média aritmética X do conjunto, isto é:
_
di = (xi - X )
Exemplos :
(1) Calcular os desvios di para o seguinte conjunto : 3, 4, 5, 6, 7
xi di
Onde 3 -2
_
3+4+5+6+7 4 -1
X= =5
5 5 0
6 1
7 2
Σdi = 0
(2) Calcular os desvios di para a seguinte distribuição :

xi fi di
82 5 -4,60
Onde 85 10 -1,60
_ 87 15 0,40
X = 86,60.
89 8 2,40
90 4 3,40
Σfi = 42 Σdi ≈ 0
(3) Calcular os desvios di para a seguinte distribuição :

Classes xi fi di di.fi
[35, 45) 40 2 -22,91 -45,82
Onde : [45, 55) 50 13 -12,91 -167,83
_
[55, 65) 60 20 -2,91 -58,20
X = 62,91
[65, 75) 70 10 7,09 70,90
[75, 85) 80 7 17,09 119,63
[85, 95) 90 3 27,09 81,27
Σfi = 55 Σdi ≈ 12,55 Σdi.fi≈ 0

__
10.3 DESVIO MÉDIO ( d )
__
O desvio médio d é a média aritmética dos módulos dos desvios, isto é:
__
__
∑d ∑x i − x
d= =
i
n n
Para uma distribuição de freqüências (simples ou por classes), teremos:
__
__
∑d .fi ∑x i − x .fi
d= =
i
n n
Exercício: calcular o desvio médio para os exemplos (1), (2) e (3) da página anterior.
σ2 ou s2)
10.4 VARIÂNCIA (σ
Variância da população é a soma dos quadrados dos desvios de cada observação em

relação à média de “x” e divide-se por N. Indica-se a Variância da População por σ² .
Podemos fazer a mesma analogia com a Variância da Amostra dada por S².
Variância para uma população: σ 2

=
∑ (x − µ )i
2
. fi
, onde µ é a média populacional e N é o
N
tamanho da população.
__
Variância para uma amostra: s 2 =

∑ ( x i − X) 2 . f i _
, onde X é a média amostral e n é o
n −1
tamanho da amostra.
As equações anteriores para σ2 e s2 representam uma maneira de cálculo dessas medidas.
Podemos também utilizar as seguintes equações:

__ 2
σ2 =
∑ f (x )
i i
2
− N.µ 2
ou s2 =
∑ f (x )
i i
2
− n. x
N n −1
Como medida de dispersão, a Variância tem a desvantagem de apresentar como unidade

de medida o quadrado da unidade de medida dos dados. Se os dados estão em metros,
a Variância fica em metros quadrados. O desvio padrão por sua vez, fica com valor na
mesma da unidade da variável.
Obs: A variância sendo uma média de uma soma de quadrados é sempre maior ou igual a
0. Ela será nula se os valores dos dados são constantes.
σ ou s)
10.5 DESVIO PADRÃO (σ
É a medida que determina a variação dos valores observados em torno da média da

distribuição, e representa a distância do ponto de inflexão da curva até a linha da média.
A partir da variância podemos calcular o desvio padrão como segue:
Desvio padrão da população: σ = σ 2
Desvio padrão da amostra: s = s2
10.6 COEFICIENTE DE VARIAÇÃO (cv)
O coeficiente de variação cv é a razão entre o desvio padrão e a média aritmética. Esta

medida é admensional e geralmente é expressa em porcentagens. A equação para o seu
cálculo é:
σ s
cv = .100 (para população) ou cv = __ .100 (para amostra)
µ
x

EXERCÍCIOS
(1) Calcular a média aritmética para os dados da tabela:

Pesos (kg) Freqüência (f)
35 45 3
45 55 7
55 65 11
65 75 20
75 85 13
85 95 6
(2) Calcular a mediana para a tabela:

Pesos (kg) Freqüência (f)
40 50 2
50 60 5
60 70 9
70 80 20
80 90 15
90 100 9
(3) Encontre a mediana para os seguintes dados:

Estaturas (cm) Freqüência (f)
140 149 3
149 158 9
158 167 12
167 176 15
176 185 32
185 194 19
194 203 14
(4) Vinte e cinco residências de um certo bairro foram sorteadas e visitadas por um
entrevistador que, entre outras questões, perguntou sobre o número de televisores. Os
dados foram os seguintes:
2, 2, 2, 3, 1, 2, 1, 1, 1, 1, 0, 1, 2, 2, 2, 2, 3, 1, 1, 3, 1, 2, 1, 0 e 2.
Organize os dados numa tabela de feqüência e determine as diversas medidas de posição.

(5) Num experimento, 15 coelhos foram alimentados com uma nova ração e seu peso
avaliado no fim do mês. Os dados referentes ao ganho de peso (em quilogramas)
foram os seguintes:
1,5 ; 1,6 ; 2,3 ; 1,7 ; 1,5 ; 2,0 ; 1,5 ; 1,8 ; 2,1 ; 2,1 ; 1,9 ; 1,8 ; 1,7 ; 2,5 ; e 2,2.
a) Utilizando os dados brutos acima, determine a média, moda e mediana desse
conjunto.
b) Organize uma tabela de freqüência com faixas de amplitude 0,2 a partir de 1,5.
c) Calcule a partir dessa tabela de freqüência e com o ponto médio como representante
de cada classe, a média e a mediana.
(6) Dada a seguinte tabela:

Classes Freqüência (f)
20 30 5
30 40 9
40 50 17
50 60 28
60 70 37
70 80 15
80 90 10
Determinar:
a) a mediana;
b) o 1º Quartil;
c) o 3º Quartil;
d) o 8º Decil;
e) o 15º Centil.
(7) Calcular a moda pela estimativa de Pearson, para a tabela:

Classes Freqüência (f)
35 46 8
46 57 21
57 68 46
68 79 57
79 90 39
90 101 28
101 112 12

(8) Determinar o desvio padrão para as medidas: 16, 11, 20, 26 e 10.
(9) Você está indeciso em comprar um aparelho de televisão e decide avaliar algumas
informações estatísticas, fornecidas pelo fabricante, sobre a duração (em horas) do
tubo de imagem.
Marca do aparelho GA FB HW
Média 8000 8200 8000
Mediana 8000 9000 7000
Desvio Padrão 600 1500 2500
Com que marca você ficaria? Justifique.
(10) A pulsação de dez estudantes, no início de uma avaliação de Estatística, foram as

seguintes (em batimentos por minuto): 80, 91, 84, 86, 93, 88, 80, 89, 85 e 86. Calcule a
média e a variância desse conjunto de dados.
(11) Num estudo sobre consumo de combustível, 200 automóveis do mesmo ano e modelo
tiveram seu consumo observado durante 1000 quilômetros. A informação obtida é
__
apresentada na tabela abaixo em km/litro. Calcular X , S2 e S.
Faixas Freqüência (f)
7 8 27
8 9 29
9 10 46
10 11 43
11 12 55
Calcular a média, mediana, moda, variância e desvio-padrão dos dados da tabela acima.
(12) 15 alunos participaram de um teste e obtiveram os seguintes resultados 60, 45, 70, 30,
85, 60, 30, 70, 60, 60, 85, 70, 70, 85 e 70.
Pede-se:
a) Construir uma tabela de dados ponderados;
b) Calcular a média aritmética (ponderada);
c) Calcular o desvio padrão;
d) Determinar a variância.

(13) Calcular a variância e o desvio padrão para os seguintes dados:
xi f
30 2
45 1
60 4
70 15
85 3
.
(14) Calcular a variância da série de dados dada pela tabela abaixo:
Classes fi
[2 ; 4) 2
[4 ; 6) 5
[6 ; 8) 7
[8 ; 10) 4
[10 ; 12) 3
[12 ; 14] 3

11.0 PROBABILIDADE
O problema fundamental da estatística consiste em trabalhar com o acaso e a incerteza.

Chama-se probabilidade de um acontecimento a razão entre o número de casos
favoráveis ao mesmo e o número total de acontecimentos possíveis.
As leis da hereditariedade foram a primeira grande aplicação das probabilidades na área
de biociências. Hoje conhecemos muitas aplicações: ocorrência de mutações, risco de
doenças, chance de sobrevivência, distribuição e interação de espécies, etc.
A aplicação mais importante, entretanto, é feita na estatística. Nenhuma observação e
nenhuma experiência podem ser precisamente planejadas e analisadas sem algum método
estatístico. Mesmo se mantivermos as condições experimentais mais constantes possíveis,
a repetição de uma observação ou uma experiência dificilmente resulta sempre exatamente
igual. Sempre existem flutuações.
Portanto, todas as conclusões baseadas em dados empíricos são necessariamente
encaradas com incerteza. Tentamos expressar o grau de incerteza em termos de
probabilidades. Então, um pesquisador afirma “significância ao nível de cinco por cento”,
ele admite a possibilidade de uma afirmativa errônea. Antes da compreensão de alguns
métodos estatísticos é necessário um conhecimento básico sobre probabilidades.
Quando se considera uma população limitada de P indivíduos, a probabilidade de cada um

ser escolhido, ao acaso, é de 1/P.
Laplace definiu probabilidade como: “O quociente do número de casos favoráveis sobre o

número de casos igualmente possíveis”. Por exemplo, se jogarmos uma moeda “não
viciada” para o ar, de modo geral não podemos afirmar se vai dar cara ou coroa.
Porém existem apenas dois eventos possíveis: sair “cara” (K) ou “coroa” (C). Nesse
exemplo existe um caso favorável a esse evento em dois casos possíveis. A P (K) = ½ ou
50%.
Considerando-se “cara” como sucesso e “coroa” como fracasso e representando-se o

acontecimento favorável como “P” e o não favorável como “Q”, temos as razões:
P= ½ e Q=½
Sendo P+Q = 1 então P= (1 - Q) e Q = (1 - P)

A probabilidade de um evento A, denotada por P (A), é um número de 0 a 1, que indica a
chance de ocorrência do evento A. Quanto mais próxima de 1 é P(A), maior é a chance de
ocorrência do evento A, e quanto mais próxima de Zero, menor é a chance de ocorrência
do evento A.
A um evento impossível atribui-se a probabilidade Zero. Um evento certo tem probabilidade

1.
As probabilidades podem ser expressas, inclusive por valores decimais, frações e

porcentagem como: 20%; 2 em 10; 0,2; ou ainda, 1/5.
Além do uso na interpretação de jogos de azar, usa-se ainda a probabilidade mediante
determinada combinação de julgamento, experiência ou dados históricos, para predizer
Quão Provável é a ocorrência de determinado evento futuro.
Há numerosos exemplos de tais situações no campo dos Negócios e do Governo. A

previsão da aceitação de um novo produto, o cálculo dos custos de produção, a
contratação de um novo empregado, o preparo do orçamento, a avaliação do impacto de
uma redução de impostos sobre a inflação – tudo isso contém algum elemento de acaso.

11.1 ESPAÇO AMOSTRAL E EVENTOS
Consideremos o experimento que consiste em “extrair uma carta de um baralho de 52
cartas”. Há 52 eventos elementares no espaço amostral. Quanto aos eventos podemos
classificá-los em:
ESPAÇO AMOSTRAL
COMPLEMENTO Cartas vermelhas e cartas pretas

A
Não se interceptam cartas de

MUTUAMENTE EXCLUSIVOS copas e cartas de paus
A B
NAO SÃO MUTUAMENTE Cartas de copas e figuras, tem

EXCLUSIVOS elementos em comum.
A B
Cartas de paus, ouro, copas e

COLETIVAMENTE EXAUSTIVOS A B C D espadas
11.2 TRÊS ORIGENS DA PROBABILIDADE
Há três maneiras diferentes de calcular ou estimar probabilidades, O método Clássico,

quando o espaço amostral tem resultados igualmente prováveis. O método Empírico, que
se baseia na freqüência relativa de ocorrência de um evento num grande número de
provas repetidas; e o método Subjetivo, que utiliza estimativas pessoais baseadas num
certo grau de crença.
OBJETIVO SUBJETIVO
CLÁSSICO EMPÍRICO Opinião Pessoal

(resultados igualmente prováveis) (dados históricos)

O Método Clássico
Os jogos de azar (lançamento de moedas, jogo de dados, extração de cartas) usualmente

apresentam resultados igualmente prováveis.
Nestes casos temos:
1
P(cada resultado) =
N° de resultados possíveis
Se cada carta de um baralho de 52 tem a mesma chance de ser escolhida, então a

probabilidade de extrair cada uma delas é de 1/52 : P (A) = 1/52 ou 1,92%.
Da mesma forma a probabilidade de termos uma cara no lançamento de uma moeda é ½

ou 50%. O mesmo ocorre com uma coroa, ou seja, ½ ou 50%.
No caso de um dado temos a probabilidade de dar qualquer número: 1, 2, 3, 4, 5 ou 6 de

1/6 ou de 16,66%.
De forma geral vale também a expressão:
P(A) = Número de resultados associados ao evento A

Número total de resultados possíveis
Por exemplo, a probabilidade de extração de uma dama, de acordo com esta definição, é
P (dama) = 4 damas = 4 = 1 = 7,69%

52 cartas 52 13
Analogamente, a probabilidade de obter número ímpar no lance de um dado é
P(ímpar) = 3 faces = 3 ou 50%

6 faces possíveis 6

A MATEMÁTICA DA PROBABILIDADE
Muitas aplicações de estatística exigem a determinação da probabilidade de combinações

de eventos. Há duas categorias de eventos de interesse, A e B, no espaço amostral.
Pode ser necessário determinar P(A e B), isto é; a probabilidade de ocorrência de ambos
os eventos.
Em outras situações, podemos querer a probabilidade de ocorrência de A ou B, P(A ou B).
Cálculo da Probabilidade da ocorrência de dois eventos “independentes”

P(A e B)
Se dois eventos são independentes, então a probabilidade da ocorrência de ambos é igual

ao produto de suas probabilidades individuais: P(A e B) = P(A) . P(B)
Exemplo: Jogam-se duas moedas equilibradas. Qual a probabilidade de ambas as faces
serem cara?
É razoável admitir que os resultados das duas moedas sejam independentes um do outro.
Além disso, para moedas equilibradas, P(cara)= ½ . Logo P(cara e cara) será:
1ª moeda 2ªmoeda
½ x ½ =¼ ou 25%
Cálculo da Probabilidade da ocorrência de dois eventos “mutuamente exclusivos”

P(A ou B ocorrerá)
Se dois eventos são mutuamente exclusivos, a probabilidade de ocorrência de qualquer um

deles é a soma de suas probabilidades individuais. Para dois eventos A e B temos:
P(A ou B) = P(A) + P(B)

Exemplo: qual é a probabilidade de aparecer cinco ou seis numa jogada de um dado
equilibrado?
P(cinco) ou P(seis) = P (5) + P(6) = 1 + 1 = 2 = 33,33%
6 6 6
Cálculo da Probabilidade da ocorrência de dois eventos “não mutuamente

exclusivos” P(A ou B ou ambos ocorrerão)
Suponhamos a probabilidade de extração de uma carta de paus ou um dez de um baralho

de 52 cartas. Como é possível que uma carta seja simultaneamente de “paus” e um “dez”,
os eventos não são mutuamente exclusivos. Assim devemos excluir a probabilidade de
intersecção. Então temos:
P(paus) = 13 , P(dez)= 4 , P( dez de paus) = 1 ,

52 52 52
P(paus ou dez,ou ambos) = P(paus) + P(dez) - P(dez de paus)
= 13 + 4 - 1 = 16
52 52 52 52
NAIPE
PAUS OUROS COPAS ESPADA

PRETA VERMELHA VERMELHA PRETA
♣ K ♦ K ♥ K ♠ K
♣ Q ♦ Q ♥ Q ♠ Q
♣ J ♦ J ♥ J ♠ J
♣ 10 ♦ 10 ♥ 10 ♠ 10 a carta é
um dez
♣ 9 ♦ 9 ♥ 9 ♠ 9
♣ 8 ♦ 8 ♥ 8 ♠ 8
♣ 7 ♦ 7 ♥ 7 ♠ 7
♣ 6 ♦ 6 ♥ 6 ♠ 6
♣ 5 ♦ 5 ♥ 5 ♠ 5
♣ 4 ♦ 4 ♥ 4 ♠ 4
♣ 3 ♦ 3 ♥ 3 ♠ 3
♣ 2 ♦ 2 ♥ 2 ♠ 2
♣ A ♦ A ♥ A ♠ A
Carta de paus
Os eventos “paus” e “dez” se interceptam.

Resumindo:
P (A e B), para eventos independentes (Multiplicação) P(A) x P(B)
P (A ou B), para eventos mutuamente exclusivos (Soma) P(A) + P(B)
P (A ou B ou ambos ocorrerão), para eventos não mutuamente exclusivos

P(A) + P(B) - P(A interceção B)
11.4 ALGUMAS PROPRIEDADES
Como foi visto no final do item anterior, existem algumas regras de probabilidade. Neste
item detalharemos tais regras, conhecidas como propriedades da probabilidade.
Revendo, a probabilidade de um evento A ocorrer é um número entre 0 e 1, ou seja:
0 ≤ P(A) ≤ 1
Se considerarmos o espaço amostral, S, e o conjunto vazio, ∅, como eventos, temos:
P(S) = 1 (evento certo)

P(∅) = 0 (evento impossível)
Exemplo: Suponha que o seguinte quadro represente uma possível divisão dos alunos
matriculados num Instituto de Matemática:

SEXO
CURSO Homens (H) Mulheres(F) TOTAIS
Matemática Pura (M) 70 40 110

Matemática Aplicada (A) 15 15 30
Estatística (E) 10 20 30
Computação (C) 20 10 30
TOTAIS 115 85 200
Sendo M o evento que ocorre quando, escolhendo-se ao acaso um aluno do Instituto, ele é
um estudante de Matemática Pura. A, E, C, H e F são os demais eventos com significados
análogos. Desta maneira, temos como exemplos:
30 115
P ( E) = e P( H ) =
200 200
Dados os eventos A e H, podemos considerar dois novos eventos:
- A ∪ H, chamado a união de A e H, que ocorre quando pelo menos um dos eventos
ocorre;
- A ∩ H, chamado a intersecção de A e H, que ocorre quando A e H ocorrem
simultaneamente.
15
É fácil verificar na tabela anterior que P( A ∩ H ) = , pois o aluno escolhido terá
200
que ser ao mesmo tempo, matriculado no curso de Matemática Aplicada e homem.
30 115
Vemos que P( A ) = e P( H ) = ; suponha que o nosso cálculo para P(A ∪ H)
200 200
fosse:
30 115 145
P ( A ∪ H ) = P ( A ) + P( H ) = + =
200 200 200
Se assim o fizéssemos, estaríamos contando duas vezes os alunos que são homens e que
estão matriculados no curso de Matemática Aplicada, como está em destaque na tabela
anterior. Portanto a resposta correta é:
30 115 15 130
P( A ∪ H ) = P( A ) + P( H ) − P( A ∩ H ) = + − =
200 200 200 200
30 30
No entanto, considerando-se os eventos A e C, vemos que P( A ) = , P( C) = e
200 200
60
P( A ∪ C) = = P( A ) + P(C) . Neste caso, os eventos A e C são disjuntos ou
200

mutuamente exclusivos, pois se A ocorre, então C não ocorre e vice-versa. Aqui, A ∩ C = φ
e P( A ∩ C) = 0 .
Portanto, se M e N são dois eventos quaisquer, teremos a chamada regra da adição
de probabilidades:
P(M ∪ N ) =P(M ) + P( N ) − P(M ∩ N ) ,
que se reduz a
P(M ∪ N ) =P(M ) + P( N ) ,
se M e N são eventos mutuamente exclusivos.
Suponha agora que estejamos somente interessados em saber se um estudante escolhido
ao acaso está matriculado como de Matemática Pura, Aplicada, Estatística ou
Computação, não interessando saber se é homem ou mulher. Um espaço amostral é
S = M ∪ A ∪ E ∪ C . Os eventos A e B = M ∪ E ∪ C são chamados complementares e são
30
tais que A ∪ B=S e A ∩B=φ. Vemos que P( A ) = , enquanto
200
110 30 30 170
P( B ) = + + = , isto é:
200 200 200 200
P ( A ) + P( B ) = 1
C
Em geral, vamos indicar por A o complementar de um evento A, e teremos, então:
P( A C ) = 1 − P( A )
As operações de união, intersecção e complementação entre eventos possuem
propriedades análogas àquelas válidas para operações entre conjuntos.
Por exemplo:
(i) (A ∩ B)C = AC ∪ BC
(A ∪ B)C = AC ∩ BC
(ii) A ∩ AC = ∅
A ∪ AC = S
(iii) A∩∅=∅
A∩S=A
A∪∅=A
A∪S=S
(iv) ∅C = S
SC = ∅

Vejamos, agora, um exemplo de aplicação das propriedades das probabilidades.
Exemplo: Consideremos um experimento e os eventos A e B associados, tais que
1 1 1
P( A ) = , P(B ) = e P( A ∩ B ) = . Então temos:
2 3 4
1 1
(a) P( A C ) = 1 − P( A ) = 1 − = ;
2 2
1 2
P( B C ) = 1 − P ( B ) = 1 − =
3 3
1 1 1 7
(b) P( A ∪ B ) = P( A ) + P(B ) − P( A ∩ B ) = + − =
2 3 4 12
[ ]
(c) P( A C ∩ B C ) =P ( A ∪ B ) C = 1 − P( A ∪ B ) = 1 −
7 5
=
12 12
) =P [( A ∩ B ) ]= 1 − P( A ∪ B ) = 1 − =
1 3
(d) P( A C ∪ B C C
4 4
(e) Calculemos P( A C ∩ B ) , ou seja, a probabilidade que ocorra B e não ocorra A
Podemos escrever:
B = ( A ∩ B) ∪ ( A C ∩ B) ,
ou seja, B pode ocorrer com A ou (exclusivo) com AC. Logo,
P( B ) = P( A ∩ B ) ∪ P ( A C ∩ B ) ,
do que decorre
1 1 1
P ( A C ∩ B ) = P( B ) − P ( A ∩ B ) = − =
3 4 12

EXERCÍCIOS
1- Extrai-se uma só carta de um baralho de 52. Determine a probabilidade de obter:

a- Um valete
b- Uma figura
c- Uma carta vermelha
d- Uma carta de ouros
e- Um dez de paus
f- Um nove vermelho ou um oito preto
2- Joga-se uma vez um dado equilibrado; determine a probabilidade de obter:
a- Um seis;
b- Cinco, seis ou sete;
c- Um número par;
d- Um número menor que quatro.
3- Doze fichas são numeradas de 1 a 12 e colocadas numa urna. Escolhida uma
aleatoriamente, determine a probabilidade de sair:
a- O número 3
b- Um número impar
c- Um número menor que quatro
d- O número dez
4- Joga-se um par de dados equilibrados:
a- Qual a probabilidade de ambas as faces serem seis?
b- Qual a probabilidade de ambas as faces serem dois?
c- Qual a probabilidade de ambas as faces serem pares?
5- Sejam P(A) = 0,30, P(B) = 0,80 e P(A e B) = 0,15.
a- A e B são mutuamente exclusivos? Explique.
b- Determine P(A ou B).
6- Sejam A e B mutuamente exclusivos, P(A) = 0,31 e P(B) = 0,29.
a- A e B são coletivamente exaustivos? Explique.
b- Determine P(A ou B).
c- Determine P (A e B)
7- Joga-se uma moeda três vezes. Qual a probabilidade de aparecer coroa três vezes?
Qual a probabilidade de não aparecer coroa nas três vezes?

11.5 PROBABILIDADE CONDICIONAL E INDEPENDÊNCIA
Voltemos à tabela da página 59. Dado que um estudante, escolhido ao acaso, esteja
20 2
matriculado no curso de Estatística, a probabilidade de ele ser mulher é de = . Isto
30 3
porque do total de 30 alunos que estudam Estatística, 20 são mulheres. Escrevemos:
2
P(mulher | Estatística ) =
3
Para dois eventos quaisquer A e B, sendo P(B) > 0, definimos a probabilidade condicional
de A, dado B, P(A|B), como sendo:
P( A ∩ B )
P( A | B ) =
P( B )
Para o exemplo mencionado, se A e B indicam, respectivamente, os eventos “aluno
matriculado em Estatística” e “aluno é mulher”, então P(A∩B) = 20/200, P(B) = 30/200 e,
portanto:
P( A ∩ B ) 20 / 200 2
P( A | B ) = = = ,
P( B ) 30 / 200 3
como havíamos obtido.
Da relação anterior, isto é:

PA ∩ B )
P( A | B ) =
P( B )
obtemos a chamada regra do produto de probabilidades, ou seja:
P( A ∩ B ) = P(B ) . P( A | B )
Exemplo: Uma urna contem duas bolas brancas (B) e três vermelhas (V). Suponha que
sorteemos duas bolas ao acaso, sem reposição. Isto significa que escolhemos a primeira
bola, verificamos a sua cor e não a devolvemos à urna; misturamos as bolas restantes e
retiramos a segunda bola. O diagrama em árvore ilustra as possibilidades. Em cada “galho”
da árvore estão indicadas as probabilidades de ocorrência, sendo que para algumas bolas
temos probabilidades condicionais. A probabilidade dos resultados conjuntos é, então,
dada pela regra do produto acima.

Resultados Probabilidades
B BB 2 1 2 1
1/4 . = =
5 4 20 10
B BV 2 3 6 3
2/5 3/4 V
. = =
5 4 20 10
VB 3 2 6 3
2/4 B . = =
5 4 20 10
3/5 V
VV 3 2 6 3
. = =
2/4 5 4 20 10
V
Total 1
Exemplo: Imagine agora que as duas extrações são feitas da urna, mas a primeira bola é
reposta na urna antes da extração da segunda bola. Nestas condições, as extrações são
independentes, no sentido de que o resultado de cada extração não tem influência no
resultado da outra. Obtemos a seguinte situação:
B
BB 2 2 4
2/5 . =
5 5 25
B BV 2 3 6
2/5 3/5 V . =
5 5 25
VB 3 2 6
2/5 B . =
5 5 25
3/5 V
VV 3 3 9
3/5 . =
V 5 5 25
Total 1
Observe que aqui
2
P(branca na 2ª | branca na 1ª ) = = P(branca na 2ª ) , ou seja, se o evento A é independente de
5
B, então P(A|B) = P(A). Usando a regra do produto, temos:
P( A ∩ B ) = P( B ) . P( A | B ) = P ( B ) . P ( A ) ,
ou seja, P( A ∩ B ) = P( A ) . P(B ) , se A é independente de B.

É fácil ver que, se A é independente de B, então B é independente de A. A equação
anterior pode ser tomada como definição de independência, ou seja, A e B são
independentes se, e somente se, tal equação for válida.

Exemplo: Considere ainda a mesma urna dos exemplos anteriores, mas vamos fazer três
extrações sem repetição. Obtemos o esquema:
1
B V
1 /4
B 1 /3 B
2 /5 3 /4
V V
2 /3
1 /3 B
B V
2 /4 2 /3
3 /5 V
2 /4 2 /3 B
V
V
1 /3
BBV 2 1 2 6
. .1 = =
5 4 20 60
BVB 2 3 1 6
. . =
5 4 3 60
BVV 2 3 2 12
. . =
5 4 3 60
VBB 3 2 1 6
. . =
5 4 3 60
VBV 3 2 2 12
. . =
5 4 3 60
VVB 3 2 2 12
. . =
5 4 3 60
VVV 3 2 1 6
. . =
5 4 3 60
Total 60/60 = 1
Observe que P(B|B) = ¼, ao passo que P(V|B∩B) = 1; daí,

2 1
P ( B ∩ B ∩ V ) = P( B ) . P ( B | B ) . P ( V | B ∩ B ) = . .1 = 1
5 4 10
De modo geral, dados 3 eventos M, N e R, temos que:

P( M ∩ N ∩ R ) = P( M ) . P( N | M ) . P( R | M ∩ N )

Exemplo: A Teoria da Confiabilidade estuda sistemas e seus componentes, como, por
exemplo, sistemas mecânicos ou eletrônicos (um automóvel ou um computador) e
sistemas biológicos (como o corpo humano). O objetivo da teoria é estudar relações entre o
funcionamento dos componentes e do sistema. A figura abaixo ilustra um sistema
composto de dois componentes, ligados em série.
1 2
O sistema funciona se os componentes 1 e 2 funcionam simultaneamente. Se um dos

componentes não funciona, o sistema também não funciona. Supondo que os
componentes funcionem independentemente, e se pi é a probabilidade do componente i
(i=1,2) funcionar, então a probabilidade do sistema funcionar é p1.p2.
Chamando:
E: o sistema funciona
Ai: o componente i funciona, i = 1,2
então,
P ( E ) = P ( A 1 ∩ A 2 ) = P( A 1 ) . P( A 2 ) = p 1 . p 2
Cada pi é chamada a confiabilidade do componente i e P(E) = h(p1, p2) = p1. p2 é chamada

a confiabilidade do sistema.
Se os elementos 1 e 2 estiverem ligados em paralelo, como na figura abaixo, então o

sistema funciona se pelo menos um dos dois componentes funciona. Ou seja,
P ( E ) = P ( A 1 ∪ A 2 ) = P( A 1 ) + P( A 2 ) − P( A 1 ∩ A 2 ) = p 1 + p 2 − p 1 . p 2
e a confiabilidade do sistema é h(p1, p2) = p1 + p2 – p1. p2.

Vejamos agora o conceito de independência para três eventos. Dizemos que os eventos A,
B e C são independentes se, e somente se,
P( A ∩ B ) = P( A ) . P( B )
P ( A ∩ C ) = P( A ) . P( C)
P( B ∩ C ) = P( B ) . P( C)
P( A ∩ B ∩ C) = P( A ) . P( B ) . P( C)
Esta definição pode ser estendida para um número finito qualquer de eventos
independentes.

11.6 TEOREMA DE BAYES
Uma das relações mais importantes envolvendo probabilidades condicionais é dada pelo teorema
de Bayes, que expressa uma probabilidade condicional em termos de outras probabilidades
condicionais e marginais. Vamos introduzi-lo através de um exemplo.
Exemplo: Temos 5 urnas exatamente iguais, cada uma com 6 bolas. Duas dessas urnas (tipo C1)
têm 3 bolas brancas, duas outras (tipo C2) têm 2 bolas brancas, e a última urna (tipo C3) tem 6
bolas brancas. Escolhemos uma urna ao acaso e dela retiramos uma bola. Qual a probabilidade da
urna escolhida ser do tipo C3, sabendo-se que a bola sorteada é branca?
Na figura abaixo estão esquematizados o espaço amostral e os eventos de interesse.
C1 C2 C3
1 2 3 4 5
C
O B
R
BC
S
Queremos encontrar P(C3|B), sabendo que

2 3 1
P (C1 ) = P ( B | C1 ) = =
5 6 2
2 2 1
P( C 2 ) = P( B | C 2 ) = =
5 6 3
1 6
P (C 3 ) = P( B | C 3 ) = = 1
5 6
Da definição de probabilidade condicional, temos:
P(C 3 ∩ B) P(C 3 ) . P(B | C3 )
P(C 3 | B) = =
P(B) P(B)
Precisamos agora encontrar o valor de P(B), já que o numerador é conhecido. Como C1, C2 e C3
são eventos mutuamente exclusivos, e reunidos formam o espaço amostral completo, podemos
decompor o evento B, na união de três outros, mutuamente exclusivos, ou seja:
B = ( C1 ∩ B ) ∪ ( C 2 ∩ B ) ∪ (C 3 ∩ B )
e então

P ( B ) = P ( C1 ∩ B ) + P (C 2 ∩ B ) + P (C 3 ∩ B ) =
= P ( C1 ) . P ( B | C1 ) + P ( C 2 ) . P ( B | C 2 ) + P (C 3 ) . P ( B | C 3 ) =
2 1 2 1 1 8
= . + . + .1 =
5 2 5 3 5 15
Substituindo este resultado na equação de P(C3|B), obtemos:

1
.1
P(C 3 ) . P(B| C 3 ) 5 3
P(C 3 |B) = = =
P(B) 8 8
15
Podemos agora generalizar os resultados acima do seguinte modo: seja C1, C2, ..., Cn uma
partição do espaço amostral S, isto é,
Ci ∩ Cj = ∅, i ≠j, e C1 ∪ C2 ∪ ... ∪ Cn = S;
E consideremos A um evento qualquer. Também são conhecidos P(Ci) e P(A|Ci) para i = 1, 2,...., n.
Então, temos o seguinte resultado, ilustrado pela figura a seguir.
Teorema de Bayes – A probabilidade de ocorrência de um dos eventos Ci, dado que ocorreu o
evento A, é dado por:
P (C i ) . P ( A | C i )
P( C i | A ) =
n
∑ P(C j ) . P( A | C j )
j =1
onde , i = 1, 2, ..., n.
Exemplo: Para selecionar seus funcionários, uma empresa oferece aos candidatos um curso de
treinamento durante uma semana. Ao final, eles são submetidos a uma prova e 25% são
classificados como bons (B), 50% como médios (M) e os restantes 25% como fracos (F).

Como medida de economia, o departamento de seleção pretende substituir o treinamento
por um teste contendo perguntas envolvendo conhecimentos gerais e específicos. Mas,
para isso, gostaria de conhecer qual a probabilidade de que um indivíduo aprovado no
teste fosse considerado fraco, caso fizesse o curso. Assim, nesse ano antes do início do
curso, os candidatos foram submetidos ao teste e, de acordo com os resultados,
receberam o conceito aprovado (A) ou reprovado (R). Ao final do curso, obtiveram as
seguintes probabilidades condicionais:
P(A|B) = 0,80 P(A|M) = 0,50 P(A|F) = 0,20
Queremos encontrar P(F|A), e pelo teorema de Bayes esta é dada por
P( F ) . P( A | F )
P( F | A ) = =
P( B ) . P( A | B ) + P ( M ) . P ( A | M ) + P ( F ) . P( A | F )
(0,25) . (0,20)
= = 0,10
(0,25) . (0,80) + (0,50) . (0,50) + (0,25) . (0,20)
Então, apenas 10% dos aprovados é que seriam classificados como fracos durante o
curso. De modo análogo, podemos encontrar:
P(B|A) = 0,40 e P(M|A) = 0,50
que seriam subsídios valiosos para ajudar a decisão de substituir o treinamento pelo teste.
11.7 ABORDAGEM TABULAR DO TEOREMA DE BAYES
O cálculo de uma probabilidade condicional pelo Teorema de Bayes, muitas vezes é

facilitado utilizando-se uma abordagem tabular. Nessa abordagem uma tabela com cinco
colunas será montada. Os passos para a sua montagem são os seguintes:
(1º) Na 1ª coluna são colocados os eventos mutuamente exclusivos para os quais as

probabilidades posteriores são desejadas (Ai).
(2º) Na 2ª coluna são colocadas as probabilidades prévias para esses eventos (P(Ai)).
(3º) Na 3ª coluna são colocadas as probabilidades condicionais da nova informação
dada para cada evento (P(B|Ai)).

(4º) Na 4ª coluna são calculadas as probabilidades associadas para cada um dos
eventos e a nova informação B, usando-se a lei da multiplicação. Essas
probabilidades associadas são encontradas multiplicando-se as probabilidades
prévias na coluna 2 pelas probabilidades condicionais na coluna 3, isto é,
P(Ai ∩ B) = P(Ai) . P(B|Ai)
(5º) É feita, então, a soma das probabilidades associadas na coluna 4. A soma é a
probabilidade da nova informação P(B).
(6º) Na 5ª coluna, calcular as probabilidades posteriores usando a relação básica de
probabilidade condicional:
P ( Ai ∩ B )
P ( Ai | B ) =
P( B)
No exemplo anterior, aplicando-se essa abordagem, teremos a seguinte a tabela:
Eventos Probabilidades Probabilidades Probabilidades Probabilidades

Prévias Condicionais Associadas Posteriores
B P(B) = 0,25 P(A|B) = 0,80 P(B). P(A|B) = 0,20

P( B | A) = = 0,40
0,25.0,80 = 0,20 0,50
M P(M) = 0,50 P(A|M) = 0,50 P(M). P(A|M) = 0,25
P( M | A) = = 0,50
0,50.0,50 = 0,25 0,50
F P(F) = 0,25 P(A|F) = 0,20 P(F). P(A|F) = 0,25.0,20 0,05
P( F | A) = = 0,10
= 0,05 0,50
_______ _______ _______
1,00 P(A) = 0,50 1,00
OBSERVAÇÕES:
- O teorema de Bayes é usado extensivamente nas análises de decisões. As
probabilidades prévias são freqüentemente estimativas subjetivas fornecidas por um
tomador de decisão. A informação amostral é obtida e as probabilidades posteriores
são calculadas para uso no desenvolvimento de uma estratégia de decisão.
- Um evento e seu complemento são mutuamente exclusivos e suas uniões formam
uma partição. Assim, o teorema de Bayes é sempre aplicável para o cálculo das
probabilidades posteriores de um evento e seu complemento.

EXERCÍCIOS
1- No exemplo da página 68, que trata das urnas, elabore a tabela segundo a
abordagem tabular para chegar aos valores das probabilidades posteriores.
2- A probabilidade do time de futebol São Paulo ganhar uma partida quando chove é
de 0,7 e quando não chove é de 0,8. No mês de setembro passado, a probabilidade de
chuva foi de 0,6. Sabendo-se que o São Paulo jogou uma partida em setembro e ganhou,
qual a probabilidade de ter chovido no dia desse jogo?
3- M. D. Computing (maio de 1991) descreve o uso do teorema de Bayes e o uso da
probabilidade condicional no diagnóstico médico. As probabilidades prévias de doenças
são baseadas na avaliação dos médicos de variáveis tais como localização geográfica,
influência sazonal, ocorrência de epidemias e assim por diante. Suponha que se acredite
que um paciente tenha uma de duas doenças, denotadas como D1 e D2 com P(D1) = 0,60 e
P(D2) = 0,40 , e que a pesquisa médica tenha determinado a probabilidade associada com
cada sintoma que pode acompanhar as doenças. Suponha que, dadas as doenças D1 e D2,
as probabilidades de que o paciente terá os sintomas S1, S2 ou S3 são como segue:
S1 S2 S3
D1 P(S1|D1) = 0,15 P(S2|D1) = 0,10 P(S3|D1) = 0,15
D2 P(S1|D2) = 0,80 P(S2|D2) = 0,15 P(S3|D2) = 0,03
Depois que constatar que um certo sintoma esteja presente, o diagnóstico médico pode ser
auxiliado encontrando-se as probabilidades revisadas de cada doença em particular.
Calcule as probabilidades posteriores de cada doença dadas as seguintes constatações
médicas:
a) O paciente tem o sintoma S1.
b) O paciente tem o sintoma S2.
c) O paciente tem o sintoma S3.
4- Uma companhia produz circuitos integrados em três fábricas, I, II e III. A fábrica I
produz 40% dos circuitos, enquanto a II e a III produzem 30% cada uma. As probabilidades
de que um circuito integrado produzido por estas fábricas não funcione são 0,01, 0,04 e
0,03, respectivamente. Escolhido um circuito da produção conjunta das três fábricas, qual a
probabilidade do mesmo não funcionar?

12.0 TÉCNICAS DE CONTAGEM
Para utilizar o método clássico da probabilidade, é preciso conhecer o número total de

resultados possíveis de um experimento.
Uma das possibilidades é o uso das árvores de decisão, mas quando o número de
resultados é grande, essa lista se torna muito trabalhosa; é necessário então recorrer a
fórmulas matemáticas para determinar o número total de resultados possíveis.
Suponhamos que um estudante esteja fazendo um teste de 20 questões do tipo

“verdadeiro-ou-falso”. Suponhamos ainda que ele, não tenha estudado nada, esteja
dando todas as respostas na base do palpite. Qual a probabilidade de ele responder
corretamente todo o teste?
A primeira coisa a fazer é determinar o número total de resultados possíveis.
Em segundo lugar devemos explorar suas diversas versões. Imaginemos que o teste
consista de apenas:
Uma questão temos V ou F

Duas questões temos VV, VF, FV, FF
Três questões temos VVV, VVF, VFF, VFV, FVF, FVV, FFV, FFF
Conclui-se:
Número de questões : 1 2 3 4
Número de resultados : 2 4 8 16
Nota-se que, se o número de itens for grande, a listagem se tornará praticamente

impossível.
Em seguida, podemos ver um diagrama de árvore para determinar todos os arranjos

possíveis.

QUESTÃO N°1 QUESTÃO N°2 QUESTÃO N°3 RESULTADOS
V VVV
V F VVF
V V V FV
F F V FF
V FV V
V F FV F
F
V FFV
F
F FFF
Além disso, o que realmente é necessário é determinar o número total de resultados;

nada se tem a ganhar identificando cada resultado.
12.1 O PRINCÍPIO DA MULTIPLICAÇÃO
O diagrama mostra que cada questão dobra o número total de resultados possíveis (com
duas alternativas V ou F) temos:
NÚMERO DE QUESTÕES TOTAL DE RESULTADOS

1 2=2
2 2 x 2 =4
3 2x2x2=8
4 2 x 2 x 2 x 2 = 16

Se fossem quatro escolhas para cada questão:
NÚMERO DE QUESTÕES TOTAL DE RESULTADOS

1 4=4
2 4 x 4 =16
3 4 x 4 x 4 = 64
4 4 x 4 x 4 x 4 = 256
Para solucionar o exercício do teste, teremos:
2 x 2 x 2 x 2 x 2 x . . . . . . . x 2 = 220 = 1.048.576
1 2 3 4 5 ..... . 20
De um modo geral, se há “n” decisões seqüenciais, cada uma com “m” escolhas, o número
total de resultados é mn.
12.2 PERMUTAÇÃO, ARRANJO E COMBINAÇÃO
Quando a ordem em que os elementos se dispõem é importante, o número total de

resultados possíveis é conhecido como Arranjo ou Permutação. Quando a ordem não
interessa, o número total de resultados possíveis é designado como Combinação.
Para o uso na análise combinatória usaremos o número fatorial representado pelo símbolo
! como por exemplo 4! lê-se “quatro fatorial” e significa 4 x 3 x 2 x 1 = 24.
Outros exemplos:
5! = 5 x 4 x 3 x 2 x 1 = 120
12! = 12 x 11 x 10 x 9 x 8 x 7 x ..............x 1 = 479.001.600
Os fatoriais crescem de modo extremamente rápido, à medida que aumenta o número-

base.
Felizmente, quase nunca é necessário utilizar-se completamente os fatoriais, pois eles
aparecem em grupos, permitindo cancelamentos:

5! = 1
7! 42
4! = 12
2!
5! = 10
2! 3!
Às vezes os fatoriais podem envolver soma e subtração. Exemplos:
( 5 - 3 )! = 2! e não ( 5! - 3! )
( 9 - 2 )! = 7!
( 3 + 1)! = 4!
8! = 8! = 8 x 7 x 6 x 5! = 8x7x6 = 56
3! ( 8 – 3 )! 3! . 5! 3 x 2 x 5! 3x2
O fatorial de zero é igual a um 0! = 1.

O fatorial de 1 é igual a um 1! = 1.
ARRANJOS
São agrupamentos que podem variar pela ordem ou natureza dos elementos. Quando se
consideram n elementos distintos tomados x a x chamamos arranjo ou agrupamentos
“eneários” que se podem formar com esses n elementos, dispomos de todas as formas
possíveis de modo que dois arranjos quaisquer difiram ao menos pela ordem dos
elementos.
Assim, os arranjos possíveis com as letras A, B e C são A 3,2 (3 elementos dois a dois)
A 3,2 = AB; BA; AC; CA, BC; CB.
E com os números: 2, 6 e 8 podem ser feitos os seguintes arranjos A 3,2

A 3,2 = 26; 28; 62; 68; 82; 86.

Portanto:
n!
A n, x =
(n − x )!
Outro exemplo: Se há sete cavalos num páreo, quantos arranjos há considerando 1°,2° e
3° lugares?
Ou seja, 7 elementos tomados 3 a 3

A 7,3 = 7! = 7! = 7 x 6 x 5 x 4! = 7 x 6 x 5 = 210
( 7 – 3 )! 4! 4!
PERMUTAÇÃO
Denomina-se permutação aos arranjos de objetos tomados n a n. Neste caso cada objeto
entra só uma vez em todos os grupos.
Em geral o número de permutações distintas com n itens, dos quais n1 são indistinguíveis
de um tipo, n2 de outro tipo, etc, é:
n!
Pnn 1 , n 2 , ..., n K = (permutação com repetições)
(n 1 ! ) (n 2 ! ) (n 3 ! ) ... (n k ! )
Exemplo: Quantas permutações distintas de 3 letras podemos formar com as letras:

RRRR UUU N
4 3 1
Solução
Há 8 letras : 4Rs 3Us 1N dai:
8!
P84 3 1 = = 280
(4! ) ( 3! ) (1! )

COMBINAÇÃO
Chama-se combinação quando não interessa a ordem para denotar o número de

agrupamentos distintos possíveis.
Exemplo: é a escolha de 2 tipos de vegetal de um cardápio com 5 tipos. A escolha de

batata e cenoura é a mesma que cenoura e batata.
De um modo geral, para agrupamentos de tamanho x extraídos de uma lista de n itens, o

Número de combinações possíveis é:
Cn, x =
n!
x! (n − x)!
= nx()
Quantos comitês distintos, de 3 pessoas cada um, podemos formar com um grupo de 10
pessoas?
10! 10! 10.9.8.7!

C10 , 3 = = = = 120
3!(10 − 3)! 3! 7! 3.2.7!
De quantas maneiras podemos formar um comitê de 1 mulher e 2 homens, de um total de

4 mulheres e 6 homens.
4! 6!
Mulheres e Homens => C 4 ,1 . C 6 , 2 = . = 4 . 15 = 60
1! 3! 2! 4!

REGRAS DE CONTAGEM
REGRA DA MULTIPLICAÇÃO: o produto do número de escolhas para uma seqüência de

n
decisões m , onde m = número de escolhas e n = decisões seqüenciais.
ARRANJOS: Número de agrupamentos em que interfere a ordem
n!
A n, x =
(n − x )!
PERMUTAÇÃO COM REPETIÇÕES (OU DISTINGÜÍVEIS): alguns itens são idênticos, e a

ordem é importante.
n!
Pnn 1 , n 2 , ..., n K =
(n 1 ! ) (n 2 ! ) (n 3 ! ) ... (n k ! )
OBS: Permutação simples: Pn = n!
COMBINAÇÕES: a ordem não importa.
Cn, x =
n!
x! (n − x)!
= nx ()

EXERCÍCIOS
1- Calcule:
a- 2! b- 3! c- 10! d- 1! e- 0!
2- Calcule:
 3  4  5  9
a-   b-   c-   d-  
 2  4 1   6
3- Determine o número de arranjos:
a- A 3,2 b- A 4,4 c- A 5,1 d- A 9,6 e- A 1,0
4- Um vendedor de automóveis deseja impressionar os possíveis compradores com o

maior Número de combinações diferentes possíveis. Um modelo pode ser dotado de
três tipos de motor, dois tipos de transmissão, cinco cores externas e duas internas.
Quantas são a escolhas possíveis?
5- Em um determinado Estado, as placas de licença constam de três letras e quatro

algarismos. Quantas placas diferentes podemos formar admitindo-se o uso de todas as
(26 letras) e os (10 algarismos)?
6- Quantas permutações distintas podem ser feitas com as letras da palavra

ESTATÍSTICA?
7- Se um torneio de basquetebol consiste de 36 times, de quantas maneiras podem ser

conquistados os três primeiros lugares?
8- De quantas maneiras diferentes podemos escolher um comitê de cinco pessoas dentre

oito?
9- A Pizzaria ISA oferece as seguintes escolhas de pizza: presunto, cogumelos, pimentão,

enchovas e muzzarella. De quantas maneiras podemos escolher dois tipos diferente de
pizza?

13.0 VARIÁVEL ALEATÓRIA E DISTRIBUIÇÃO DE
PROBABILIDADE
13.1 DEFINIÇÃO DE VARIÁVEL ALEATÓRIA

Introduzidas às noções fundamentais sobre a teoria das probabilidades, podemos
passar às chamadas Distribuições de Probabilidades.
Uma distribuição de probabilidades é uma distribuição de freqüência relativa para
os resultados de um espaço amostral (isto é, para os resultados de uma variável
aleatória); que mostra a proporção das vezes em que a variável aleatória tende a assumir
cada um dos diversos valores.
Consideremos a variável aleatória “número de caras em duas jogadas de uma
moeda”, eis a lista dos pontos do espaço amostral e os valores correspondentes à v.a.:
(Sendo K = cara e C = coroa)
Resultados Valor de v.a.
CC 0
CK 1
KC 1
KK 2
Se a moeda é equilibrada, P(K) = P(C) = ½. As probabilidades dos diversos resultados são:
Resultados Pobabilidade do Resultado Número de Caras

P(x)
CC 1 1 1 0
. = = 0,25
2 2 4
CK 1 1 1 1
. = = 0,25 =>0,50
2 2 4
KC 1 1 1 1
. = = 0,25
2 2 4
KK 1 1 1 2
. = = 0,25
2 2 4

Assim, pois, a distribuição de probabilidades para o número de caras em duas jogadas de
uma moeda é:
Número de Caras P(x)

0 0,25
1 0,50
2 0,25
1,00
Nota-se que a soma de todas as probabilidades é 1,00, como é de se esperar, pois os

resultados apresentados são mutuamente exclusivos e coletivamente exaustivos. A
mesma distribuição pode ser apresentada em forma acumulada.
Número de Caras P(x ou menos)
0 0,25
1 0,75
2 1,00
Graficamente, as distribuições de probabilidade e acumulada se apresentam:
P
1,00 R 1,00
O 1,OO
B
A
P B
R 0,75 I 0,75
O L 0,75
B I
A D
B A
I 0,5 D 0,5
L 0,5 E
I
D A
A C
D 0,25 U 0,25
E 0,25 0,25 M 0,25
U
L
A
0 D 0
0 1 2 A 0 1 2
NÚMERO DE CARAS
NÚMERO DE CARAS

Portanto concluímos que uma variável aleatória (v.a.) fornece um meio para se descrever
por valores numéricos os resultados experimentais. Uma v.a. é uma descrição numérica do
resultado de um experimento.
Uma v.a. pode ser classificada como discreta ou contínua, dependendo dos valores
numéricos que ela assume.
VARIÁVEIS ALEATÓRIAS DISCRETAS
Uma v.a. que pode assumir tanto um número finito de valores como infinita seqüência de
valores tais como 0, 1, 2, 3, ... é denominada variável aleatória discreta. Por exemplo,
considere o experimento de um contador que faz um exame público. O exame tem quatro
partes. Podemos definir a v.a. discreta como x ≡ o número de partes em que foi aprovado
no exame. Essa v.a. discreta pode assumir o número finito de valores 0, 1, 2, 3 ou 4.
Como outro exemplo, considere o experimento de carros que chegam a um posto de
pedágio. A v.a. de interesse é x ≡ o número de carros que chega durante o período de um
dia. Os possíveis valores de x vêm da seqüência de inteiros 0, 1, 2 e assim por diante.
Portanto x é uma v.a. discreta que assume um dos valores nessa seqüência infinita.
Embora muitos experimentos tenham resultados que são naturalmente descritos por
valores numéricos, outros não o são. Por exemplo, uma questão de um levantamento pode
solicitar a um indivíduo que relembre a mensagem de um recente comercial de televisão.
Esse experimento poderia ter dois resultados possíveis: o indivíduo não pode lembrar a
mensagem e o indivíduo pode lembrar a mensagem. Podemos ainda descrever esses
resultados experimentais numericamente, definindo-se a v.a. discreta x como segue: seja x
= 0 se o indivíduo não pode lembrar a mensagem e x = 1 se o indivíduo pode lembrar a
mensagem. Os valores numéricos para essa v.a. são arbitrários (poderíamos usar 5 e 10),
mas eles são aceitáveis em termos da definição de uma v.a..
Outros exemplos de v.a. discretas são dados a seguir:

Exemplos de v.a. discretas
Experimento v.a. (x) Possíveis valores para v.a.
Contatar cinco clientes Número de clientes que 0, 1, 2, 3, 4, 5
colocam um pedido de
compra
Inspecionar um embarque Número de rádios 0, 1, 2, ..., 49, 50
de 50 rádios defeituosos
Operar um restaurante por Número de clientes 0, 1, 2, 3, 4, ...
um dia
Vender um automóvel Gênero do cliente 0 se masculino,
1 se feminino
VARIÁVEIS ALEATÓRIAS CONTÍNUAS

Uma v.a. que pode assumir qualquer valor numérico em um intervalo ou numa coleção de
intervalos é chamada v.a. contínua. Resultados experimentais que são baseados em
escalas de medidas tais como peso, tempo, distância e temperatura podem ser descritos
por v.a. contínuas. Por exemplo considere, o experimento de monitorar as chamadas
telefônicas que chegam a um escritório de reclamações de uma grande empresa de
seguros. Suponha que a v.a. de interesse seja x ≡ o tempo em minutos entre chamadas
consecutivas recebidas. Essa v.a. pode assumir qualquer valor no intervalo x ≥ 0.
Realmente, um número infinito de valores são possíveis para x, incluindo valores tais como
1,27 minutos, 2,471 minutos, 4,5555 minutos e assim por diante. Como um outro exemplo,
considere um trecho de 144 Km de uma auto-estrada interestadual ao norte de Atlanta,
Geórgia, nos USA. Para um serviço de emergência localizado em Atlanta, podemos definir
a v.a. como x ≡ a localização do próximo acidente de trânsito ao longo desse trecho da
auto-estrada. Neste caso, x seria uma v.a. contínua que assume qualquer valor no intervalo
0 ≤ x ≤ 144. Outros exemplos são apresentados na tabela abaixo.

Exemplos de v.a. contínuas
Experimento v.a. (x) Possíveis valores para v.a.

Operar um banco Tempo entre as chegadas x ≥ 0 (min)
dos clientes em minutos
Encher um recipiente de Número de ml 0 ≤ x ≤ 343 (ml)
refrigerante (máx = 343 ml)
Trabalhar num projeto para Porcentagem de término do 0 ≤ x ≤ 100 (%)
a construção de uma nova projeto após 6 meses
biblioteca
Testar um novo processo Temperatura quando a 65 ≤ x ≤ 100 (ºC)
químico reação desejada ocorre
(mín 65º C e máx 100º C)
Observação: Um modo de determinar se uma v.a. é discreta ou contínua é pensar nos

valores da v.a. como pontos sobre um segmento de reta. Escolha 2 pontos que
representam valores da v.a.. Se todo o segmento de reta entre os 2 pontos também
representa possíveis valores para a v.a., então a v.a. é contínua.

EXERCÍCIO:
Uma série de experimentos e v.a. ‘s associadas são listados a seguir. Em cada caso,
identifique os valores que a v.a. pode assumir e estabeleça se a v.a. é discreta ou
contínua.
Experimento v.a. (x)

a. Fazer um exame com 20 questões Número de questões respondidas
corretamente
b. Observar carros que chegam a um posto Número de carros que chegam ao posto de
de pedágio, no espaço de uma hora pedágio
c. Auditar 50 declarações de imposto Número de declarações que contêm erros
d. Observar o trabalho de um operário Número de horas não produtivas em um dia
de trabalho de 8 horas
e. Pesar um carregamento de produtos Número de quilos
DISTRIBUIÇÕES DISCRETAS DE PROBABILIDADE

A distribuição de probabilidade para uma v.a. descreve como as probabilidades estão
distribuídas sobre os valores da v.a.. Para uma v.a. discreta x, a distribuição de
probabilidade é definida por uma função de probabilidade, denotada por f(x). A função de
probabilidade fornece a probabilidade para cada um dos valores da v.a..
Como exemplo de v.a. discreta e sua distribuição de probabilidade, considere as vendas de
automóveis de uma revendedora chamada X-Motors. Nos últimos 300 dias de operação, os
dados de vendas mostram 54 dias sem vendas de automóveis, 117 dias com um
automóvel vendido, 72 dias com dois automóveis vendidos, 42 dias com três automóveis
vendidos, 12 dias com quatro automóveis vendidos e 3 dias com cinco automóveis
vendidos. Suponha que consideremos o experimento de selecionar um dia de operação na
X-Motors. Definimos a v.a. de interesse como x ≡ o número de automóveis vendidos
durante um dia. A partir dos dados históricos conhecidos, sabemos que x é uma v.a.
discreta que pode assumir os valores 0, 1, 2, 3, 4 ou 5. Na notação da função de
probabilidade, f(0) fornece a probabilidade de 0 automóveis vendidos, f(1) fornece a
probabilidade de 1 automóvel vendido e assim por diante. Uma vez que os dados mostram
54 dos 300 dias com 0, atribuímos o valor 54/300 = 0,18 para f(0), indicando que a
probabilidade de 0 automóvel ter sido vendido durante um dia é de 0,18. Analogamente,

podemos calcular as demais funções, mostradas na tabela a seguir.
Distribuição de probabilidade para o número de automóveis vendidos durante um

dia na X-Motors
x f(x)
0 0,18
1 0,39
2 0,24
3 0,14
4 0,04
5 0,01
Total 1,00
No desenvolvimento de uma função de probabilidade para qualquer v.a. discreta, as duas

condições seguintes precisam ser satisfeitas:
1. f(x) ≥ 0
2. ∑ f(x) = 1
O exemplo mais simples de uma distribuição discreta de probabilidade é a distribuição

uniforme de probabilidade. Sua função de probabilidade é dada a seguir:
f(x) = 1/n
onde:
n ≡ o número de valores que a v.a. pode assumir
por exemplo considere o experimento de lançamento de um dado e defina a v.a. x como

sendo o número da face voltada para cima. Existem n = 6 valores possíveis para a v.a.; x =
1, 2, 3, 4 , 5, 6. Assim a função de probabilidade para esta v.a. é
f(x) = 1/6 x = 1,2,3,4,5,6

Os valores possíveis da v.a. e as probabilidades associadas são mostrados a seguir:
x f(x)
1 1/6
2 1/6
3 1/6
4 1/6
5 1/6
6 1/6
VALOR ESPERADO E VARIÂNCIA DE UMA V.A. DISCRETA
VALOR ESPERADO
O valor esperado, ou média, de uma v.a. discreta é a medida de posição central para a
v.a.. A expressão matemática para o valor esperado da v.a. x é dada por:
E(x) = µ = ∑ x.f(x)
Voltando ao exemplo anterior da X-Motors, temos:
Cálculo do valor esperado para o nº de automóveis vendidos durante um

dia na X-Motors
x f(x) x.f(x)
0 0,18 0,00
1 0,39 0,39
2 0,24 0,48
3 0,14 0,42
4 0,04 0,16
5 0,01 0,05
Total 1,00 1,50

Portanto E(x) = µ = ∑ x.f(x) = 1,50.
VARIÂNCIA
Enquanto o valor esperado fornece o valor médio para a v.a., freqüentemente

necessitamos de uma medida de variabilidade ou de dispersão. A expressão matemática
para a variância é:
Var(x) = σ2 = ∑ (x - µ)2 . f(x)
E o desvio padrão será:
σ= σ2
No exemplo anterior temos:
Cálculo da variância para o nº de automóveis vendidos durante um dia

na X-Motors
(x - µ) . f(x)
2
x f(x)
0 0,18 0,4050
1 0,39 0,0975
2 0,24 0,0600
3 0,14 0,3150
4 0,04 0,2500
5 0,01 0,1225
Total 1,00 1,2500
Portanto Var(x) = σ2 = ∑ (x - µ)2 . f(x) = 1,25.

EXERCÍCIOS:
1 - A seguinte tabela é uma distribuição de probabilidade para v.a. x:
x f(x)
3 0,25
6 0,50
9 0,25
Total 1,00
a) Calcule E(x), o valor esperado de x.

b) Calcule σ2, a variância de x.
c) Calcule σ, o desvio padrão de x.
2 - A seguinte tabela é uma distribuição de probabilidade para v.a. y:
y f(y)
2 0,20
4 0,30
7 0,40
8 0,10
Total 1,00
a) Calcule E(y).
b) Calcule Var(y) e σ.
3 - Um serviço voluntário de ambulâncias atende de 0 a 5 chamadas de serviço em

qualquer dia. A distribuição de probabilidade para o número de chamadas de serviço é:

Número de chamadas Probabilidade
de serviço
0 0,10
1 0,15
2 0,30
3 0,20
4 0,15
5 0,10
a) Qual o número esperado de chamadas de serviço?

b) Qual é a variância no número de chamadas de serviço? Qual é o desvio
padrão?
4 - O Statistical Abstract of the United States, 1997, mostra que o número médio de
aparelhos de televisão por família é de 2,3. Considere que a distribuição de
probabilidade para o número de aparelhos de televisão por família é mostrado a seguir:
x f(x)
0 0,01
1 0,23
2 0,41
3 0,20
4 0,10
5 0,05
a) Calcule o valor esperado do número de aparelhos de televisão por família e

compare-o com a média relatada no Statistical Abstract.
b) Qual a variância e o desvio padrão do número de aparelhos por família?

13.2 DISTRIBUIÇÃO BINOMIAL
A distribuição binomial de probabilidade é uma distribuição discreta de probabilidade que

tem muitas aplicações. Ela está associada a um experimento de múltipla etapa que
chamamos de experimento binomial.
Um experimento binomial
Um experimento binomial tem as quatro seguintes propriedades:
(1ª) O experimento consiste de uma seqüência de n ensaios idênticos.

(2ª) Dois resultados são possíveis em cada ensaio. Referimo-nos a um como um
sucesso e ao outro como um fracasso.
(3ª) A probabilidade de um sucesso, denotado por p, não se modifica de ensaio para
ensaio. Conseqüentemente, a probabilidade de um fracasso, denotado por q (onde
q = 1 – p), não se modifica de ensaio para ensaio.
(4ª) Os ensaios são independentes.
Se as propriedades 2, 3 e 4 estão presentes, dizemos que os ensaios são gerados por um

processo de Bernoulli. Se além disso, a propriedade 1 está presente, dizemos que temos
um experimento binomial.
Suponhamos agora o experimento E4= “Lançamento de 4 moedas”. A tabela abaixo

mostra todas as possibilidades de combinações cara/coroa, os eventos que estas
combinações originam e os valores correspondentes da variável aleatória X : Número de
vezes que sai “Cara”.

POSSIBILIDADE MOEDA N° EVENTO VALOR DE X
N° 1, 2, 3, 4 ( N° DE VEZES QUE SAI CARA)
1 CCCC 0K e 4C 0
2a CCCK 1K e 3C 1
2b CCKC
2c CKCC
2d KCCC
3a CCKK 2K e 2C 2
3b CKKC
3c KKCC
3d CKCK
3e KCKC
3f KCCK
4a KKKC 3K e 1C 3
4b KKCK
4c KCKK
4d CKKK
5 KKKK 4K e 0C 4
Utilizando as regras do produto para eventos independentes (e) e da adição para eventos
mutuamente exclusivos (ou) é possível calcular as probabilidades associadas aos valores
de X.
A probabilidade de X=0 é obtida pelo conhecimento de termos 4 coroas, sabe-se que a

probabilidade de sair coroa é ½ , a probabilidade final será: 0,5x0,5x0,5x0,5 = 0,0625.
Para o cálculo da probabilidade X=1 deve-se trabalhar com o evento “1K e 3C” como
temos as opções a,b,c,d, que são mutuamente exclusivas, a regra da soma manda
efetuar a adição 0,0625 +0,0625 +0,0625 +0,0625 ou, o que é o mesmo de se efetuar o
produto 4x 0,0625 = 0,25.

Desta forma analogamente temos:
x EVENTO f( x )
0 4 0 4
0 0K e 4C O,0625 = 1 X 0,5 X 0,5 = 1p q
1 3 1 3
1 1K e 3C O,2500 = 4 X 0,5 X 0,5 = 4p q
2 2 2 2
2 2K e 2C O,3750 = 6 X 0,5 X 0,5 = 6p q
3 1 3 1
3 3K e 1C O,2500 = 4 X 0,5 X 0,5 = 4p q
4 0 4 0
4 4K e 0C O,0625 = 1 X 0,5 X 0,5 = 1p q
TOTAL 1,00
n = número de moedas
p = probabilidade de K : P(K) = 0,5
q = 1 – p = probabilidade de C : P(C) = 0,5
Podemos usar a equação:
n! n
= 
x!. (n − x)!  x  combinações de n indivíduos tomados x a x.
Generalizando temos a função binomial f(x):
n!
f ( x) = . p x .q n − x
x!. (n − x )!

Exemplo: Distribuição binomial de x (número de coroas) para n = 10
X Número de n! Distribuição f(x)
“Coroas” em 10 x!(n − x)!
jogadas Amostral
10! 1
10 =1 . = 0,000976
10!(10 − 10)! 1024
10! 1
9 = 10 . = 0,009760
9!(10 − 9)! 1024
10! 1
8 = 45 . = 0,043940
8!(10 − 8)! 1024
10! 1
7 = 120 . = 0,117180
7!(10 − 7)! 1024
10! 1
6 = 210 . = 0,205070
6!(10 − 6)! 1024
10! 1
5 = 252 . = 0,246090
5! (10 − 5)! 1024
10! 1
4 = 210 . = 0,205070
4! (10 − 4)! 1024
10! 1
3 = 120 . = 0,117180
3! (10 − 3)! 1024
10! 1
2 = 45 . = 0,043940
2! (10 − 2)! 1024
10! 1
1 = 10 . = 0,009760
1! (10 − 1)! 1024
10! 1
0 =1 . = 0,000976
0! (10 − 0)! 1024
Total de resultados = 210 = 1024

EXERCÍCIOS:
Use a equação binomial para responder às questões abaixo:
1- Um fabricante de mesas de bilhar suspeita que 2% de seu produto apresenta algum

defeito. Se tal suspeita é correta, determine a probabilidade de que, numa amostra
de nove mesas:
a- Haja ao menos uma defeituosa
b- Não haja nenhuma defeituosa
2- Dos estudantes de um colégio, 41% FUMAM CIGARROS. Escolhem-se seis ao

acaso para darem sua opinião sobre o fumo.
a- Determine a probabilidade de nenhum dos seis estudantes ser fumante.
b- Determine a probabilidade de todos os seis serem fumantes.
c- Qual a probabilidade de ao menos a metade dos seis serem fumantes.
3- Doze por cento dos que reservam lugar num vôo sistematicamente faltam ao
embarque. O avião comporta 15 passageiros. Determine a probabilidade de que
todos os 15 que reservaram lugar compareçam ao embarque
4- Um revendedor de automóveis novos constatou que 80% dos carros vendidos são
devolvidos ao departamento mecânico para corrigir defeitos de fabricação, nos
primeiros 25 dias apos a venda. De 11 carros vendidos num período de 5 dias, qual
é a probabilidade de que:
a. Todos voltem dentro de 25 dias para reparo.
b. Só um não volte
5- Suponha que 8% dos cachorros-quentes vendidos num estádio de futebol sejam

pedidos sem mostarda. Se sete pessoas pedem cachorrão, determine a
probabilidade de que:
a. Todos queiram mostarda
b. Apenas um não a queira.

13.3 DISTRIBUIÇÃO DE POISSON
A chamada Distribuição de Poisson ou de Eventos Raros pode ser considerada um caso

limite da distribuição binomial. Quando “n” é grande e “p” é pequeno podemos usar a
aproximação de Poisson para a distribuição Binomial.
É difícil dar condições precisas para que se possa usar a aproximação de Poisson, ou seja,
o que significa quando “n” é grande e “p” pequeno. Como regra geral (de referência
empírica) podemos usar:
n ≥ 100 e n.p ≤ 10
n = elementos da população
p = probabilidade
Exemplo: n = 150 p = 0,05
Temos a distribuição de Poisson com:
n.p = 150 . (0,05) = 7,5
A equação a ser usada é:
(n. p) x . e − n. p
f ( x) =
x!
sendo e= 2,718 e µ = n.p
Exemplo: Sabe-se que 2% dos livros encadernados em uma certa livraria apresentam
defeitos de encadernação. Utilize a aproximação de Poisson da distribuição Binomial para
achar a probabilidade de que 5 entre 400 livros encadernados nessa livraria apresentam
algum defeito de encadernação.
Temos: n = 400 p = 2% = 0,02 x=5 n.p = 400 . 0,02 = 8
-8
e = 0,000335; temos então:
(8) 5 . e − 8 (32768) (0,000335)

f (5) = = = 0,0915
5! 120
Obs.: A distribuição de Poisson é semelhante à Binomial, diferenciando-se apenas no fato
de que na Binomial os eventos ocorrem por tentativas ou observações fixas, enquanto que
na de Poisson os eventos ocorrem simultaneamente. Ex.; nº de acidentes por dia, clientes
2
por hora, chamadas telefônicas por minuto, defeitos por cm , etc.

Contra-exemplo: Suponhamos que os defeitos em fios para tear possam ser aproximados
por um processo de Poisson com média de 0,2 defeitos por metro (p = 0,2).
Inspecionando-se pedaços de fio de 6 metros de comprimento, determine a probabilidade
de menos de 2 (isto é 0 ,1) defeitos.
Dados: n = 6 p = 0,2 n . p = 6 . 0,2 = 1,2
Para utilizarmos a aproximação de Poisson para a distribuição Binomial devemos ter:
1ª) n ≥ 100. (neste caso n = 6);
2ª) n.p ≤ 10 (neste caso n.p = 6 . 0,2 = 1,2).
Logo a 1ª condição não é verificada, isto implica que não poderemos utilizar Poisson.
Uma solução possível é a utilização da distribuição Binomial, ou seja:
P(x<2) = P(0) + P(1) , onde:
6! 6!
P ( 0) = 0,20 . 0,86 = 1 .1 . 0,86 = 0,2621 e P(1) = 0,21 . 0,85 = 6 . 0,2 . 0,85 = 0,3932
0! 6! 1! 5!
Logo, P(x<2) = 0,6553 ou 65,53% de haver 0 ou 1 defeito.
EXERCICIOS:
1- O departamento de manutenção de computadores de uma Universidade recebe uma

média 5 computadores por dia. Qual a probabilidade que, em determinado dia,
selecionado aleatoriamente, sejam recebidos:
a- Exatamente 3 computaores;
b- Menos de 3 computadores.
2- Se 0,6% dos detonadores fornecidos a um arsenal são defeituosos, utilize a
aproximação de Poisson para a distribuição binomial para determinar a probabilidade de
que, em uma amostra aleatória de 500 detonadores, quatro sejam defeituosos.
3- Em uma certa cidade 3,2% dos habitantes se envolve em, ao menos, um acidente de
carro em um ano. Com o auxilio da aproximação de Poisson para a distribuição
Binomial, determine a probabilidade de que, dentre 200 motoristas escolhidos
aleatoriamente nessa cidade:
a- Exatamente seis se envolvam em ao menos um acidente em um ano;
b- No máximo oito se envolvam em ao menos um acidente em um ano;
c- Cinco ou mais se envolvam em ao menos um acidente em um ano;
4- Suponha que, em média 2% das pessoas sejam canhotas. Encontre a probabilidade de
3 ou mais canhotos em 100 pessoas.

13.4 DISTRIBUIÇÃO NORMAL (ou de GAUSS ou de LAPLACE)
É uma distribuição contínua e simétrica, cujo gráfico tem a forma de um sino. A distribuição
normal é o resultado da atuação conjunta de causas aleatórias.
F (x)
µ - 3σ µ - 2σ µ - 1σ µ µ + 1σ µ + 2σ µ + 3σ
Parâmetros da Distribuição Normal
µ → Média da População
Determinam o formato da curva
σ → Desvio padrão da população
Equação da Função de Probabilidade – A equação da função de probabilidade é dada pela

expressão:
− ( x−µ )2
1 2σ 2
f ( x) = e
σ 2π
Do estudo da estatística conclui-se que:
- a variável x pode assumir qualquer valor real no intervalo - ∞ ≤ x ≤ + ∞
- a variável x obedecerá à uma Distribuição Normal, se a probabilidade de que um
valor x seja menor ou igual a outro x0 for:

x0 − ( x−µ )2
1 2σ 2
P ( x < x0 ) = f ( x0 ) =
σ 2π ∫e
−∞
dx
- a integral desta expressão representa a área compreendida entre - ∞ e x0.
F (x)
-∞ + ∞
X0
Portanto:
“ A probabilidade de ocorrência de um valor menor ou igual à área abaixo da curva, entre

os valores - ∞ e x0 é dada pela equação anterior”.
Os valores π = 3,1416 e e ( número neperiano) = 2,718 são constantes numéricas.

CARACTERÍSTICAS DA CURVA DE DISTRIBUIÇÃO NORMAL
A curva normal obedece necessariamente às seguintes características:
a- A média µ é o valor da variável x para o qual a f(x) é máxima.
b- O desvio padrão σ, é a distância entre a média e o ponto de inflexão da curva.
c- A área total sob a curva normal é igual a 1, pela própria equação da probabilidade.
d- Em virtude da simetria as áreas à direita e à esquerda do valor µ são iguais
DISTRIBUIÇÃO NORMAL PADRONIZADA
Se tomarmos a equação auxiliar:
x−µ
z=
σ
o que significa adotar como origem do eixo z o ponto em que x = µ e como unidade de
escalados z e o desvio padrão σ, teremos transformado a expressão da função das
probabilidades na distribuição normal reduzida:
− z2
1
f ( z) = e 2
σ 2π
Considerando, a partir da equação auxiliar:
dz 1
= ⇒ dx = σ dz
dx σ
Portanto a função da probabilidade, em função de Z, será dada pela expressão:

z0 − z2
1
f ( z) = ∫e
2
dz
2π −∞
As áreas sob a curva permanecem as mesmas, mas agora podem ser tabuladas em
função dos valores de Z (Ver figura abaixo, eixo dos Z). Basta construir a tábua das áreas
para os valores I(z), mostrados na tabela da página 56.
Por exemplo, a área desde Z=0 até Z= 1,0 é I(1,0) = 0,3413 ou 34,13% da área total da
curva; conseqüentemente, dentro do intervalo ± 1 σ temos 68,26% da área total da curva.
Se procurarmos a probabilidade de encontrarmos um valor de “x” dentro do intervalo

µ ± 0,95 onde µ é a média, σ é o desvio padrão da população, teremos:
P(− z0 < z < + z0 ) = P( µ − 0,95σ < z < µ + 0,95σ )

IZ1= 0,3289 It= 0,6578 ou 65,78%.
Apresentamos na tabela abaixo alguns dos mais importantes intervalos de distribuição

normal para aplicações em exercícios de probabilidade na curva normal.

TÁBUAS DE ÁREAS DA CURVA NORMAL
x−µ
A partir da equação auxiliar z= podemos transformar valores de x em valores de z e
σ
em seguida construir uma tabela com resultados das integrais, que corresponde à área sob
a curva x0 intervalo de 0 a Z0 identificada por IZ0.
F (x)
µ - 3( ( - 2( ( - 1( ( ( + 1( ( + 2( ( + 3(
-3 -2 -1 0 1 2 3 Z

Transformação de X em Z
x0 x−µ z0
z=
σ
µ µ −µ
σ 0
µ + 1σ µ +1σ − µ
σ 1
µ + 2σ µ + 2σ − µ
σ 2
µ + 3σ µ + 3σ − µ
σ 3
µ - 1σ µ −1σ − µ
σ -1
µ - 2σ µ − 2σ − µ
σ -2
µ - 3σ µ − 3σ − µ
σ -3

IZ0
0 Z0
AREAS IZ0 = P (0 ≤ z ≤ Z0) para Z0= (x - µ)/ σ

Z0 Z0 Z0 Z0 Z0 Z0
IZ0 IZ0 IZ0 IZ0 IZ0 IZ0
0,00 0,0000 0,60 0,2257 1,20 0,3849 1,80 0,4641 2,40 0,4918 3,00 0,4987
0,05 0,0199 0,65 0,2422 1,25 0,3944 1,85 0,4678 2,45 0,4929 3,05 0,4989
0,10 0,0398 0,70 0,2580 1,30 0,4032 1,90 0,4713 2,50 0,4938 3,10 0,4990
0,15 0,0596 0,75 0,2734 1,35 0,4115 1,95 0,4744 2,55 0,4946 3,15 0,4992
0,20 0,0793 0,80 0,2881 1,40 0,4192 2,00 0,4772 2,60 0,4953 3,20 0,4993
0,25 0,0987 0,85 0,3051 1,45 0,4279 2,05 0,4798 2,65 0,4960 3,25 0,4994
0,30 0,1179 0,90 0,3159 1,50 0,4332 2,10 0,4821 2,70 0,4965 3,30 0,4995
0,35 0,1369 0,95 0,3289 1,55 0,4394 2,15 0,4842 2,75 0,4970 3,35 0,4996
0,40 0,1554 1,00 0,3413 1,60 0,4452 2,20 0,4861 2,80 0,4974 3,40 0,4997
0,45 0,1736 1,05 0,3531 1,65 0,4505 2,25 0,4878 2,85 0,4978 3,50 0,4998
0,50 0,1915 1,10 0,3643 1,70 0,4554 2,30 0,4893 2,90 0,4981 3,70 0,4999
0,55 0,2088 1,15 0,3749 1,75 0,4599 2,35 0,4906 2,95 0,4984 3,90 0,5000

EXERCÍCIOS
1- Trace uma curva normal e sombreie a área desejada a partir das informações:
a- área à direita de z=1,0

b- área da esquerda de z= 1,0
c- área entre z=0 e z=1,5
d- área entre z=0 e z= - 2,9
e- área entre z=1,0 e z= 2,0
f- área entre z= -2,0 e z= 2,0
g- área entre z= 2,5 e z=3,0
2- Ache os valores de z correspondentes às seguintes áreas:
a- área à esquerda de µ para Iz = 0,0596

b- área à esquerda de µ para Iz = 0,2257
c- área à esquerda de µ para Iz= 0,4505 e área à direita de µ para Iz = 0,4861
3- Uma distribuição normal tem média 50 e desvio padrão 5. Que porcentagem da

população estaria provavelmente dentro dos intervalos:
a- P(x ≤ 60)
b- P(35 ≤ x ≤ 62)
c- P(55 ≤ x ≤ 65)
d- P(x ≥ 55)
e- P(35 ≤ x ≤ 45)

4- Suponha uma renda média de uma grande comunidade possa ser razoavelmente
aproximada por uma distribuição normal com media anual de R$ 10.000,00 e desvio
padrão de R$ 2.000,00.
a- Que porcentagem da população terá renda superior a R$ 15.000,00?
b- Numa amostra de 50 assalariados, quantos podemos esperar que tenham
menos de R$ 8.000,00 de renda?
5- Considere um problema semelhante ao anterior, sendo a renda média de um grupo

de trabalhadores igual a R$ 7000,00 e o desvio R$ 800,00 e a distribuição sendo
normal, pede-se:
a- A probabilidade dos trabalhadores ganharem acima de R$ 8000, 00;

b- O limite inferior da renda dos 10 % mais ricos.
6- O adulto americano médio tem 1,75 m de altura. Assuma que o desvio seja 8 cm.
Responda:
a- qual é a probabilidade de que um homem adulto tenha mais de 1,83 m ?
b- qual é a probabilidade de que um homem adulto tenha menos de 1,522 m ?
c- qual é a probabilidade de que um homem adulto tenha entre 1,682 e
1,778 m ?
d- qual é a probabilidade de que um homem adulto não tenha mais de 1,83 m ?
7- O volume de comercialização na Bolsa de Valores de Nova York tem crescido nos

últimos anos. Para as duas primeiras semanas de janeiro de 1998, o volume médio
diário foi de 646 milhões de ações. A distribuição de probabilidade é
aproximadamente normal com desvio de 100 milhões de ações.
a- Qual a probabilidade de que o volume de comercialização será menor de 400
milhões?
b- Qual a probabilidade de que o volume de comercialização excedeu 801
milhões?

Nocoes de Probabilidade e Estatistica I PDF

Hochgeladen von

Dokumentinformationen

Originaltitel

Copyright

Verfügbare Formate

Dieses Dokument teilen

Dokument teilen oder einbetten

Freigabeoptionen

Stufen Sie dieses Dokument als nützlich ein?

Sind diese Inhalte unangemessen?

Copyright:

Verfügbare Formate

Nocoes de Probabilidade e Estatistica I PDF

Hochgeladen von

Copyright:

Verfügbare Formate

unesp

UNIVERSIDADE ESTADUAL PAULISTA

PROFª BERENICE CAMARGO DAMASCENO

1.0 ALGUMAS DEFINIÇÕES DE ESTATÍSTICA

1.1 POR QUE ESTUDAR ESTATÍSTICA?

O raciocínio estatístico é largamente utilizado no governo e na administração; assim, é

1.2 A NATUREZA DOS DADOS

Noções de Probabilidade e Estatística 1 Profª Berenice C. Damasceno

As variáveis discretas assumem valores inteiros de dados discretos são os resultados da

Os dados nominais surgem quando se definem categorias e se conta o número de

TABELA 1: A mesma população pode originar diferentes tipos de dados.

POPULAÇÕES CONTÍNUOS DISCRETOS NOMINAIS POR POSTO

Alunos de administração idade/peso N. de classes Homens/Mulheres 3º grau

Noções de Probabilidade e Estatística 2 Profª Berenice C. Damasceno

Os levantamentos podem ser classificados em contínuos, periódicos e ocasionais:

PERIÓDICOS: Acontecem ciclicamente. Exemplo é o recenceamento, feito no Brasil a

OCASIONAIS: São aqueles realizados sem a preocupação de continuidade ou

Os dados ainda podem ser classificados em: primários e secundários.

DADOS PRIMÁRIOS: Quando o investigador não encontra dados publicados adequados

DADOS SECUNDÁRIOS: Quando o investigador para verificar as suas hipóteses de

Noções de Probabilidade e Estatística 3 Profª Berenice C. Damasceno

1- Definição do problema: Um Estudo ou Uma Análise

2- Formular plano adequado para coleta de dados

4- Analisar e interpretar os dados

i- 5 acidentes no mês de maio

1- Defina o termo Estatística.

2- Responder a pergunta: Por que estudar estatística?

3- Dar exemplos de como você, na sua profissão, poderá se beneficiar do

Noções de Probabilidade e Estatística 4 Profª Berenice C. Damasceno

Noções de Probabilidade e Estatística 5 Profª Berenice C. Damasceno

Na indústria onde amostras são freqüentemente retiradas para efeito de Controle da

Por outro lado, em pesquisas sociais, econômicas ou de opinião, a complexibilidade dos

Inferência estatística envolve a formulação de certos julgamentos sobre um todo após

A probabilidade e a amostragem estão estreitamente correlacionadas e juntas formam o

- Amostragem é o ato de retirar amostra, isto é, a ação.

- Amostra é a quantidade de dados especificados para representar a população.

Noções de Probabilidade e Estatística 6 Profª Berenice C. Damasceno

próxima” está a amostra da população, em termos de representatividade.

Amostragem não aleatória não apresenta esta característica.

Populações finitas: é quando, temos constituído por números finitos, ou fixos de

2.2 AMOSTRAGEM ALEATÓRIA BASEADA EM NÚMEROS

As tabelas de números aleatórios contém os dez algarismos 0,1,2,3,4,......,9. Esses

Noções de Probabilidade e Estatística 7 Profª Berenice C. Damasceno

A titulo de ilustração poderíamos querer selecionar aleatoriamente 15 clientes de uma lista

2.3 OUTROS PLANOS DE AMOSTRAGEM

Amostragem probabilística versus Amostragem não probabilística.

Os planos de amostragem probabilística são delineados de tal modo que se conhece a

2.4 AMOSTRAGEM POR JULGAMENTO (NÃO PROBABILÍSTICA)

Noções de Probabilidade e Estatística 8 Profª Berenice C. Damasceno

Exemplo: A aplicação de hormônios em mulheres na menopausa, após um período de

2.5 AMOSTRAGEM PROBABILÍSTICA

K= N onde: N= Tamanho da População

EX. N= 200 e n=10 então K=200/10 = 20

Noções de Probabilidade e Estatística 9 Profª Berenice C. Damasceno

Pressupõe a divisão da população em sub-grupos Homogêneos (Estratos), procedendo

então a amostragem de cada sub-grupo. Ex.: Para se fazer o inventário do estoque, é

AMOSTRAGEM POR CONGLOMERADO

Pressupõe a disposição dos itens de uma população em sub-grupos heterogêneos (sub-

encarado como uma minipopulação.

educação, faixa etária, poder aquisitivo, região da habitação, etc.)

Noções de Probabilidade e Estatística 10 Profª Berenice C. Damasceno

A finalidade da amostra é permitir fazer inferência sobre a população após inspeção de

Naturalmente espera-se que a amostra seja representativa da população da qual foi