Sie sind auf Seite 1von 110

unesp

UNIVERSIDADE ESTADUAL PAULISTA


“JÚLIO DE MESQUITA FILHO”
Faculdade de Engenharia – Campus de Ilha Solteira

NOÇÕES DE

PROBABILIDADE E ESTATÍSTICA

PROFª BERENICE CAMARGO DAMASCENO

2011
PROBABILIDADE E ESTATÍSTICA

1.0 ALGUMAS DEFINIÇÕES DE ESTATÍSTICA


Etimologicamente a palavra estatística vem de “status” expressão latina que significa,
”sensu lato”, o estudo do estado. Os primeiros a empregarem esse termo foram os
Alemães seguidos pela Itália, França, Inglaterra e ainda por outros paises.

Para Levasseur a estatística é: “O estudo numérico dos fatos sociais”. Yule define
estatística como: “Dados quantitativos afetados marcadamente por uma multiplicidade de
causas”.

Uma definição mais usual nos dias de hoje seria: “Um método científico que permite a
análise, em base probabilística, de dados coligados e condensados”. Ou ainda podemos
dizer que Estatística é um conjunto de métodos quantitativos, que servem para a coleta,
organização, redução e apresentação de dados, análise dos mesmos e a obtenção de
conclusões válidas e tomadas de decisões a partir de tais análises.

Estatística pode ser entendida como sendo a ciência de aprendizagem a partir de dados.
No nosso cotidiano, precisamos tomar decisões, muitas vezes decisões rápidas. Assim
podemos dizer que a Estatística fornece métodos que auxiliam o processo de tomada de
decisão.

1.1 POR QUE ESTUDAR ESTATÍSTICA?

O raciocínio estatístico é largamente utilizado no governo e na administração; assim, é


possível que, no futuro, um empregador venha a contratar ou promover um profissional por
causa do seu conhecimento de estatística. Essa é uma razão, esperamos que ao final
deste trabalho o leitor encontre suas próprias razões.

1.2 A NATUREZA DOS DADOS


Os dados estatísticos constituem a matéria prima das pesquisas estatísticas, eles surgem
quando se fazem mensurações ou se restringem observações.
Estatística descritiva: Trata-se da descrição e resumo dos dados.
Probabilidade: É um estudo que envolve o acaso.
Inferência: É a análise e interpretação de dados amostrais (Amostragem).
Modelos: São versões simplificadas (abstrações) de algum problema ou situação real.

Noções de Probabilidade e Estatística 1 Profª Berenice C. Damasceno


1.3 TIPOS DE DADOS

Quantitativos Contínuos
Discretos

Qualitativos Nominais
Por postos

As variáveis contínuas podem assumir qualquer valor num intervalo contínuo. Os dados
referentes a tais variáveis dizem-se dados contínuos. Ex.: peso, comprimento, espessura
onde se usa a mensuração.

As variáveis discretas assumem valores inteiros de dados discretos são os resultados da


contagem de números de itens. Ex.: alunos da sala de aula, número de defeitos num carro
novo, acidentes de uma fábrica.

Os dados nominais surgem quando se definem categorias e se conta o número de


observações pertencentes a cada categoria. Atuam dentro das variáveis “Qualitativas”, às
quais devemos associar a valores numéricos para que possamos processar
estatisticamente. Ex.: cor dos olhos (azuis, verdes, castanhos), sexo (masculino e
feminino), desempenho (excelente, bom, sofrível, mau), etc.

Os dados por postos consistem de valores relativos atribuídos para denotar ordem:
primeiro, segundo, terceiro, quarto, etc. Ex.: concurso de beleza se classificam em 1ª, 2ª,
3ª colocadas.

TABELA 1: A mesma população pode originar diferentes tipos de dados.

TIPOS DE DADOS

POPULAÇÕES CONTÍNUOS DISCRETOS NOMINAIS POR POSTO

Alunos de administração idade/peso N. de classes Homens/Mulheres 3º grau

Noções de Probabilidade e Estatística 2 Profª Berenice C. Damasceno


1.4 TIPOS DE LEVANTAMENTOS

Os levantamentos podem ser classificados em contínuos, periódicos e ocasionais:

CONTÍNUOS: Quando os eventos vão sendo registrados à medida que ocorrem. Exemplos
os registros civis dos fatos vitais (nascimento, óbitos e casamentos).

PERIÓDICOS: Acontecem ciclicamente. Exemplo é o recenceamento, feito no Brasil a


cada dez anos. A realização de um Censo Demográfico representa o desafio mais
importante para um instituto de estatística, sobretudo em um país de dimensões
continentais como o Brasil, com 8 514 215,3 km2, composto por 27 Estados e 5 507
municípios existentes na data de referência da pesquisa, abrangendo um total de
54 265 618 de domicílios pesquisados (dados do IBGE sobre o Censo de 2000).

OCASIONAIS: São aqueles realizados sem a preocupação de continuidade ou


periodicidade preestabelecidas, exemplos a maioria dos trabalhos de investigação
cientifica.

Os dados ainda podem ser classificados em: primários e secundários.

DADOS PRIMÁRIOS: Quando o investigador não encontra dados publicados adequados


ao seu estudo, parte para a realização de um inquérito, isto é, os dados são levantados
diretamente na população no momento da investigação.

DADOS SECUNDÁRIOS: Quando o investigador para verificar as suas hipóteses de


trabalho utiliza-se de dados já existentes, arquivados, registrados ou publicados. Podem
ser, até mesmo, dados gerados pelo Departamento de Estatística de Populações da
Fundação Instituto Brasileiro de Geografia e Estatística (IBGE).

Noções de Probabilidade e Estatística 3 Profª Berenice C. Damasceno


1.5 PLANEJAMENTO DE EXPERIMENTOS

1- Definição do problema: Um Estudo ou Uma Análise

2- Formular plano adequado para coleta de dados

3- Organizar os dados

4- Analisar e interpretar os dados

5- Relatar as conclusões

EXERCÍCIOS
1- Identifique os seguintes exemplos em termos de tipos de dados:

a- 17 gramas

b- 3 certos, 2 errados

c- 25 segundos

d- 25 alunos na classe

e- tamanho de camisa

f- Km/litro

g- O mais aprazível

h- O mais lento

i- 5 acidentes no mês de maio

Responder as perguntas:

1- Defina o termo Estatística.

2- Responder a pergunta: Por que estudar estatística?

3- Dar exemplos de como você, na sua profissão, poderá se beneficiar do

conhecimento de Estatística?

Noções de Probabilidade e Estatística 4 Profª Berenice C. Damasceno


2.0 AMOSTRAGEM
AMOSTRAGEM VERSUS CENSO: Uma amostra usualmente envolve o estudo de uma
parcela dos ítens de uma população, enquanto que o censo requer o estudo de todos os
ítens.
Restrições ao Censo:
- Custo
- Populações infinitas
- Dificuldade nos critérios (Precisão)
- Produtos de testes Destrutivos (fósforos, munições)
- Tempo despendido (atualização)
- Tipos de informações mais restritivas
Casos de excessão:
- Populações pequenas
- Amostras grandes em relação à população
- Se exige precisão completa
- Se já são disponíveis informações completas

2.1 DEFINIÇÕES:
POPULAÇÃO: é o conjunto de indivíduos (ou objetos), que tem pelo menos uma variável
comum observável. População é a totalidade dos elementos de um conjunto com uma
dada característica, no qual se deseja fazer um determinado estudo.
AMOSTRA: é qualquer subconjunto da população extraída para se realizar estudos
estatísticos.

.
POPULAÇÃO

AMOSTRA

Noções de Probabilidade e Estatística 5 Profª Berenice C. Damasceno


A estatística indutiva é a ciência que busca tirar conclusões probabilísticas sobre a
população, com base em resultados verificados em amostras retiradas dessa população.
Entretanto não basta que saibamos descrever convenientemente os dados da amostra
para que possamos executar, com êxito, um trabalho estatístico completo. Antes de tudo
é preciso garantir que a amostra ou amostras que serão utilizadas sejam obtidas por
processos adequados.
- O que é necessário garantir, em suma, é que a amostra seja “Representativa” da
população.
Dois aspectos nas amostras são fundamentais, e que dão a sua representatividade em
termos:
- Qualitativos: Amostras que representem todas as sub-populações, quando for o caso.
- Quantitativos: Que possua quantidade de dados suficientes para representar a
população.

Na indústria onde amostras são freqüentemente retiradas para efeito de Controle da


Qualidade dos produtos e materiais, em geral os problemas de amostragem são mais
simples de resolver.

Por outro lado, em pesquisas sociais, econômicas ou de opinião, a complexibilidade dos


problemas de amostragem são normalmente bastante grandes.

Inferência estatística envolve a formulação de certos julgamentos sobre um todo após


examinar apenas uma parte, ou a amostra, dele.

A probabilidade e a amostragem estão estreitamente correlacionadas e juntas formam o


fundamento da teoria de inferência.

- Amostragem é o ato de retirar amostra, isto é, a ação.

- Amostra é a quantidade de dados especificados para representar a população.

Noções de Probabilidade e Estatística 6 Profª Berenice C. Damasceno


Amostragem aleatória permite estimar o valor do erro possível, isto é, dizer “ quão

próxima” está a amostra da população, em termos de representatividade.

Amostragem não aleatória não apresenta esta característica.

Há vários métodos para extrair uma amostra, talvez o mais importante seja a amostragem
aleatória. De modo geral, a amostragem aleatória exige que cada elemento tenha a
mesma oportunidade de ser incluído na amostra.

Nas Populações discretas uma amostra aleatória é aquela em que cada item da
população tem a mesma chance de ser incluído na amostra.
Nas Populações contínuas, uma amostra aleatória é aquela em que a probabilidade de
incluir na amostra qualquer intervalo de valores é igual à percentagem da população que
está naquele intervalo.

Populações finitas: é quando, temos constituído por números finitos, ou fixos de


elementos, medidas ou observações.
Ex.: Peso bruto de 3000 latas de tinta de um certo lote de produção.

Populações infinitas: são aquelas que contém, pelo menos hipoteticamente, um número
infinito de elementos.
Ex.: Produção de carros V.W. produzidos no Brasil e a serem produzidos (universo
volkswagem), processo probabilístico.

2.2 AMOSTRAGEM ALEATÓRIA BASEADA EM NÚMEROS


ALEATÓRIOS (RANDÔMICOS)

As tabelas de números aleatórios contém os dez algarismos 0,1,2,3,4,......,9. Esses


números podem ser lidos isoladamente ou em grupos; podem ser lidos em qualquer ordem.
A probabilidade de qualquer algarismo aparecer em qualquer ponto é 1/10. Portanto todas
as combinações são igualmente prováveis.

Noções de Probabilidade e Estatística 7 Profª Berenice C. Damasceno


Conceitualmente, poderíamos construir uma tabela de números aleatórios numerando
dez bolinhas com os algarismos de 0 a 9 , colocando-as numa urna, misturando bem e
extraindo uma de cada vez, com reposição, anotando os valores obtidos.

A titulo de ilustração poderíamos querer selecionar aleatoriamente 15 clientes de uma lista


de 830 de um grande magazine, a finalidade poderia ser :
Estimar a freqüência de compras;
Determinar o valor médio de cada compra;
Registrar as queixas contra o sistema.

2.3 OUTROS PLANOS DE AMOSTRAGEM

Amostragem probabilística versus Amostragem não probabilística.

Os planos de amostragem probabilística são delineados de tal modo que se conhece a


probabilidade de todas as combinações amostrais possíveis. Em razão disso, pode-se
determinar a quantidade de variável amostral numa amostra aleatória e uma estimativa do
erro amostral. A amostragem aleatória é um exemplo da amostragem probabilística.
A amostragem não probabilística é a amostragem subjetiva, ou por julgamento, onde a
variabilidade amostral não pode ser estabelecida com precisão, conseqüentemente, não é
possível nenhuma estimativa do erro amostral.
A verdade é que, sempre que possível, deve-se usar a amostragem probabilística.

2.4 AMOSTRAGEM POR JULGAMENTO (NÃO PROBABILÍSTICA)


Se o tamanho da amostra é bem pequeno; digamos, de uns 5 itens, a amostragem
aleatória pode dar resultados totalmente não representativos, ao passo que uma pessoa
familiarizada com a população pode especificar quais os itens mais representativos da
população.

Noções de Probabilidade e Estatística 8 Profª Berenice C. Damasceno


Exemplo: Uma equipe médica deve trabalhar com pacientes que se apresentem como
voluntários para testar um novo medicamento. Nenhum desses grupos podem ser
considerados como uma amostra aleatória do público em geral, e seria perigoso tentar
tirar conclusões gerais com base em tal estudo. Todavia, os resultados poderiam
proporcionar uma base para a elaboração de um plano de amostragem aleatório para
validar os resultados básicos. Os perigos inerentes à pesquisa médica, bem como outro
tipo de pesquisa, freqüentemente obrigam a limitar a pesquisa inicial a um pequeno grupo
de voluntários.

Exemplo: A aplicação de hormônios em mulheres na menopausa, após um período de


tempo notou-se o aumento das chances de adquirirem câncer de mama, doenças
cardíacas etc.

2.5 AMOSTRAGEM PROBABILÍSTICA

SISTEMÁTICA
ESTRATIFICADA
CONGLOMERADO

AMOSTRAGEM SISTEMÁTICA

É muito parecida com a amostragem aleatória simples. Podemos ter uma amostragem
realmente aleatória, escolhendo-se cada K-ésima amostra, onde K obtem-se dividindo o
tamanho da população pelo tamanho da amostra.

K= N onde: N= Tamanho da População


n n= Tamanho da Amostra

EX. N= 200 e n=10 então K=200/10 = 20

Significa que será escolhido um item a cada seqüência de 20 de uma lista. Para iniciar
pode-se usar uma tabela de números aleatórios de 0 a 9 para iniciar os grupos. Por
exemplo se der o 9, escolhemos o 9º, 29º, 39º ,49º , etc.

Noções de Probabilidade e Estatística 9 Profª Berenice C. Damasceno


AMOSTRAGEM ESTRATIFICADA

Pressupõe a divisão da população em sub-grupos Homogêneos (Estratos), procedendo

então a amostragem de cada sub-grupo. Ex.: Para se fazer o inventário do estoque, é

comum termos 10% dos itens representarem cerca de 60% do valor total em quanto que os

90% restantes representam só 40% do valor total (Curva A,B,C; Pareto; regra 80/20).

AMOSTRAGEM POR CONGLOMERADO

Pressupõe a disposição dos itens de uma população em sub-grupos heterogêneos (sub-

populações) representativos da população global. Neste caso cada conglomerado pode ser

encarado como uma minipopulação.

Ex.: Estudo pré-eleitoral para medir a preferência dos eleitores. (Sub-grupos: sexo,

educação, faixa etária, poder aquisitivo, região da habitação, etc.)

Noções de Probabilidade e Estatística 10 Profª Berenice C. Damasceno


RESUMO

A finalidade da amostra é permitir fazer inferência sobre a população após inspeção de


apenas parte dela. Fatores como custo, ensaios destrutivos e populações infinitas, tornam
a amostragem preferível a um estudo completo (Censo) da população.

Naturalmente espera-se que a amostra seja representativa da população da qual foi


extraída.

Potencialmente, este objetivo é atingido quando a amostragem é aleatória.

Para populações discretas o termo “Aleatório” significa que cada item da população tem a
mesma chance de participar na amostra.

No caso de populações contínuas, significa que a probabilidade de incluir qualquer valor


de um dado intervalo de valores é igual à proporção de valores naquele intervalo.

As amostras aleatórias podem ser obtidas:


- Através de um processo de mistura, como o embaralhamento de cartas;
- Pela utilização de um processo mecânico (Misturadores);
- Utilizando-se uma tabela de números aleatórios para proceder à seleção de uma
lista.

Em certas condições, podem ser mais eficientes variantes da amostragem aleatória


simples, tais como amostragem sistemática (periódica), estratificada (sub-grupos
Homogêneos), ou amostragem por aglomerados (sub-grupos convenientes e
heterogêneos).

A principal vantagem da amostragem aleatória é que se pode determinar o grau de


variabilidade amostral, o que é essencial na inferência estatística. Para a amostragem
não probabilística falta esta característica.

Noções de Probabilidade e Estatística 11 Profª Berenice C. Damasceno


QUESTÕES PARA RECAPITULAÇÃO

1- Em que circunstância é a amostragem preferível a um censo completo?

2- Quando se deve preferir um censo a uma amostragem?

3- Defina “Amostra Aleatória”.

4- Explique rapidamente as características:

a- da amostragem por conglomerado;


b- da amostragem estratificada;
c- da amostragem sistemática.

5- O que é amostragem por julgamento e em que circunstância deve ser usada?

6- O que é amostragem probabilística e quando deve ser usada?

7- Explique o que é uma população:

a- Finita;
b- Infinita.

Noções de Probabilidade e Estatística 12 Profª Berenice C. Damasceno


3.0 ANÁLISE EXPLORATÓRIA DE DADOS

Em alguma fase de seu trabalho, o pesquisador se vê às voltas com o problema de

analisar e entender uma massa de dados, relevantes ao seu particular objeto de estudos.

De modo geral, podemos dizer que a essência da ciência é a observação e que seu

objetivo básico é a inferência. Esta é a parte da metodologia da ciência que tem por

objetivo a coleta, a redução, a análise e a modelagem dos dados, a partir do que,

finalmente, faz-se a inferência para uma população, da qual os dados (amostras) foram

obtidos.

4.0 DISTRIBUIÇÃO DE FREQÜÊNCIA

Para cada tipo de variável existem técnicas mais apropriadas para resumir as informações.

Porém podemos usar algumas técnicas empregadas num caso e adaptá-las para outros.

Quando se estuda uma variável, o maior interesse do pesquisador é conhecer a

distribuição dessa variável através das possíveis realizações (valores) da mesma.

Exemplo: Dados relativos a uma amostra de 36 funcionários de uma população de 2000

funcionários da empresa Milsa. Ver resultados anotados na tabela abaixo.

Noções de Probabilidade e Estatística 13 Profª Berenice C. Damasceno


TABELA 1: Dados relativos a uma amostra de 36 funcionários de uma população de 2000
funcionários da empresa Milsa.

Nº ESTADO GRAU DE Nº DE SALÁRIO IDADE REGIÃO DE


CIVIL INSTRUÇÃO FILHOS (X SAL. MIN) ANOS MESES PROCEDÊNCIA
1 solteiro 1º grau --- 4 26 03 interior
2 casado 1º grau 1 4,56 32 10 capital
3 casado 1º grau 2 5,25 36 05 capital
4 solteiro 2º grau --- 5,73 20 10 outro
5 solteiro 1º grau --- 6,26 40 07 outro
6 casado 1º grau 0 6,66 28 00 interior
7 solteiro 1º grau --- 6,86 41 00 interior
8 solteiro 1º grau --- 7,39 43 04 capital
9 casado 2º grau 1 7,59 34 10 capital
10 solteiro 2º grau --- 7,44 23 06 outro
11 casado 2º grau 2 8,12 33 06 interior
12 solteiro 1º grau --- 8,46 27 11 capital
13 solteiro 2º grau --- 8,74 37 05 outro
14 casado 1º grau 3 8,95 44 02 outro
15 casado 2º grau 0 9,13 30 05 interior
16 solteiro 2º grau --- 9,35 38 08 outro
17 casado 2º grau 1 9,77 31 07 capital
18 casado 1º grau 2 9,8 39 07 outro
19 solteiro superior --- 10,53 25 08 interior
20 solteiro 2º grau --- 10,76 37 04 interior
21 casado 2º grau 1 11,06 30 09 outro
22 solteiro 2º grau --- 11,59 34 02 capital
23 solteiro 1º grau --- 12,00 41 00 outro
24 casado superior 0 12,79 26 01 outro
25 casado 2º grau 2 13,23 32 05 interior
26 casado 2º grau 2 13,6 35 00 outro
27 solteiro 1º grau --- 13,85 46 07 outro
28 casado 2º grau 0 14,69 29 08 interior
29 casado 2º grau 5 14,71 40 06 interior
30 casado 2º grau 2 15,99 35 10 capital
31 solteiro superior --- 16,22 31 05 outro
32 casado 2º grau 1 16,61 36 04 interior
33 casado superior 3 17,26 43 07 capital
34 solteiro superior --- 18,75 33 07 capital
35 casado 2º grau 2 19,40 48 11 capital
36 casado superior 3 23,30 42 02 interior

Noções de Probabilidade e Estatística 14 Profª Berenice C. Damasceno


TABELA 2: Freqüência e porcentagem da amostra de 36 empregados da empresa Milsa
segundo o grau de instrução.

GRAU DE FRQÚÊNCIA FREQ. RELATIVA


INSTRUÇÃO TABULAÇÃO F FR (%)

1º grau
IIIIIIIIIIII 12 33,33

2º grau
IIIIIIIIIIIIIIIIII 18 50,00

superior IIIIII 6 16,67

TOTAL 36 100

TABELA 3: Freqüência e porcentagem dos 2000 empregados (População) da empresa


Milsa (Censo x Probabilidade)

GRAU DE FRQÜÊNCIA FREQ. RELATIVA FREQ. RELATIVA


INSTRUÇÃO F FR % CENSO FR % PROVÁVEL

1º grau 650 32,50 33,33

2º grau 1020 51,00 50,00

superior 330 16,50 16,67

TOTAL 2000 100 100

Noções de Probabilidade e Estatística 15 Profª Berenice C. Damasceno


TABELA 4: Freqüência e porcentagens dos 36 empregados (Amostra) da empresa Milsa

CLASSES DE FREQÜÊNCIA FREQ. RELATIVA


SALÁRIOS F FR (%)

4 |----- 8 10 27,78

8 |----- 12 12 33,33

12 |----- 16 8 22,22

16 |----- 20 5 13,89

20 |----- 24 1 2,78

TOTAL 36 100

TABELA 5: Freqüências e porcentagem dos empregados da empresa Milsa, segundo Nº


de filhos

FREQÜÊNCIA FREQ. RELATIVA


Nº DE FILHOS F FR (%)

0 4 20

1 5 25

2 7 35

3 3 15

5 1 5

TOTAL 20 100

Noções de Probabilidade e Estatística 16 Profª Berenice C. Damasceno


5.0 APRESENTAÇÃO GRÁFICA

A apresentação gráfica dos dados e respectivos resultados de sua análise pode também
ser feita sob forma de figuras, em geral gráficos ou diagramas.

Gráficos devem ser auto-explicativos e de fácil compreensão, de preferência sem


comentários inseridos. Os gráficos devem ser simples, atrair a atenção do leitor e inspirar
confiança.

5.1 DIAGRAMA DE ORDENADAS


Para sua construção é traçada uma reta horizontal (ou vertical) de sustentação; a partir de pontos
eqüidistantes na reta, traçam-se perpendiculares cujos comprimentos sejam proporcionais às
freqüências.

freqüências

12

10

0
4 I-------8 8 I-------12 12 I-------16 16 I-------20 20 I-------24
Salários

Noções de Probabilidade e Estatística 17 Profª Berenice C. Damasceno


5.2 DIAGRAMA DE BARRAS
A mesma distribuição acima poderia ser representada por meio de diagrama que levasse
em conta a magnitude da área da figura geométrica, já que a vista repousa melhor sobre
uma superfície do que sobre uma linha.

freqüências

12

10

0
4 |---- 8 8 |---- 12 12 |----16 16 |----20 20 |----24

salários

Noções de Probabilidade e Estatística 18 Profª Berenice C. Damasceno


5.3 DIAGRAMA DE CÍRCULOS
Além do retângulo, outra figura geométrica utilizada é o círculo ou conjunto de círculos.
Lembrando que a área do círculo é o produto do número irracional π = (3,1416) pelo
quadrado do raio (r), isto é, C = π.r 2 , e desde que as áreas dos diversos círculos devem ser

proporcionais às magnitudes das freqüências, isto é, C = α .f onde α é o fator de


proporcionalidade, segue-se que:

α α
α .f = π.r 2 , ou seja, r = π f . Se chamar r = α' f .
π de α’, tem-se:

Portanto, os raios dos círculos devem ser proporcionais à raiz quadrada das freqüências
das modalidades da variável.
Assim se quisermos representar graficamente a distribuição da tabela 4, os raios do círculo
deverão ser:

r1 = 27,78 . α’= 5,27 . α’→ 5,27. 3 = 15.8 mm

r2 = 33,33 . α’= 5.77 . α’→ 5,77. 3 = 17,3 mm

r3 = 22,22 . α’= 4,71. α’→ 4,71. 3 = 14,1 mm

r4 = 13,89 . α’= 3.72. α’→ 3,72. 3 = 11,1 mm

r5 = 2,78 . α’ = 1,66 α’→ 1,66. 3 = 5,00 mm

A figura abaixo representa esta distribuição, com um α’ adotado de 3 mm.

33,33
2,7 13,89 22,22 27,78
% %
% % %

Noções de Probabilidade e Estatística 19 Profª Berenice C. Damasceno


5.4 DIAGRAMA DE SETORES CIRCULARES

Outra opção seria através de setores circulares, na qual se divide a área total de um círculo
em subáreas (setores) proporcionais as freqüências.
Lembrando que o círculo compreende setores cujas áreas (S) são produto do raio (r) pelo
tamanho do arco (a), isto é, S = r.a, e como S deve ser proporcional à freqüência f, tem-se
S= α.f , onde α é o fator de proporcionalidade; então:

α .f = r. a

a = α.f
r
α
Se chamarmos de α’, tem-se S = α’.f , isto é, os arcos e os respectivos ângulos centrais
r
de um círculo é igual a 360°, e sendo F a freqüênci a total, tem-se

360° = α’. F

360º
ou seja: α' =
360º
. Portanto a= .f .
F F

Assim, a distribuição de freqüência da tabela 4 representando faixas de salários será:

a1 = 360° x 27,78 = 100°


100

a2 = 360° x 33,33 = 120°


100

a3 = 360° x 22,22 = 80°


100

a4 = 360° x 13,89 = 50°


100

S5 = 360° x 2,78 = 10°


100

Noções de Probabilidade e Estatística 20 Profª Berenice C. Damasceno


Diagrama de Setor Circular:

120°

50°
10°
.

100° 80°

Diagrama de Setor Circular feito automaticamente pelo Excel:

33%

22%

28% 14%
3%

Noções de Probabilidade e Estatística 21 Profª Berenice C. Damasceno


5.5 DIAGRAMA LINEAR

No diagrama linear deve-se plotar os pontos nos eixos como foi feito no diagrama de
barras e em seguida unir esses pontos por semi-retas constituindo-se desta forma o
diagrama linear.

freq.

12

10

0
4 8 8 12 12 16 16 20 20 24
salários

Noções de Probabilidade e Estatística 22 Profª Berenice C. Damasceno


6.0 MONTAGEM DE UMA DISTRIBUIÇÃO DE FREQÜÊNCIAS

A análise estatística de dados relativos a uma amostra de uma população, requer uma
aglutinação organizada de informações, conforme regras cuja prática demonstrou serem
eficientes.
Consideremos uma relação de pesos de pacotes de manteiga, em gramas, de uma
amostra de 100 pacotes extraídos parcialmente de um processo automático de
empacotamento.
±15
A especificação de fabricação é 215 gramas (200 a 230 gramas)

TABELA 6

AMOSTR AMOSTR AMOSTR AMOSTR AMOSTR


A PESO A PESO A PESO A PESO A PESO
1 207 21 220 41 210 61 210 81 217
2 213 22 204 42 214 62 220 82 211
3 210 23 213 43 219 63 213 83 213
4 215 24 211 44 215 64 217 84 218
5 201 25 214 45 217 65 214 85 213
6 210 26 217 46 213 66 219 86 216
7 212 27 224 47 218 67 214 87 218
8 204 28 211 48 214 68 215 88 216
9 209 29 220 49 215 69 223 89 206
10 212 30 209 50 212 70 217 90 212
11 215 31 214 51 221 71 213 91 207
12 216 32 208 52 211 72 218 92 213
13 221 33 217 53 218 73 207 93 215
14 219 34 214 54 205 74 210 94 212
15 222 35 209 55 220 75 208 95 223
16 225 36 212 56 203 76 214 96 210
17 215 37 208 57 216 77 211 97 226
18 218 38 215 58 222 78 205 98 224
19 213 39 211 59 206 79 215 99 214
20 216 40 216 60 221 80 207 100 215

O agrupamento destes dados em sub-grupos é feito com base nos seguintes conceitos:
Amplitude total (RT ou Ω): é a diferença entre a medida máxima e a medida mínima. No
caso da amostra de pacotes de manteiga acima, temos:

Noções de Probabilidade e Estatística 23 Profª Berenice C. Damasceno


RT = 226 – 201 = 25 gramas
Número de classes (d) : é o número de divisões que estipulamos para a Amplitude Total.

Normalmente pode-se usar d ≈ n onde n é o número de itens na amostra. Para o


exercício temos d ≈ 100 = 10 classes, porém deve-se utilizar sempre que possível número

ímpar de classes, no caso podemos usar 9 classes.


(Classe: é o intervalo de variação das medidas.)

Amplitude do intervalo de classe (RI): é a diferença entre os valores máximos e mínimos


de cada classe.
RT
Amplitude do intervalo de cada classe RI =
d

25
No exercício temos: amplitude do intervalo de cada classe RI = = 2,78 (aprox. 3)
9

RI adotado = 3 e RT adotado = 27 (começa um antes do menor e termina um depois do


maior valor)

OBS.: Normalmente usa-se um número mínimo de 5 e no máximo 20 classes, de


preferência de mesma amplitude.

As classes devem ser mutuamente exclusivas, para que não haja dúvida na localização
dos valores das variáveis, podemos daí utilizar as seguintes simbologias para os intervalos:

0 ----I 10 intervalo aberto & fechado, para significar que o intervalo compreende os
valores da variável maiores do que 0 (exclusive) e até 10 (inclusive);

0 I---- 10 intervalo fechado & aberto, para significar que compreende os valores da
variável a partir de 0 (inclusive) e até 10 (exclusive);

0 ----- 10 Intervalo aberto & aberto, para significar que compreende valores maiores do
que 0 e menores do que 10.

0 I----I 10 intervalo fechado & fechado, para significar que compreende os valores da
variável a partir de 0 (inclusive) e até 10 (inclusive).

Noções de Probabilidade e Estatística 24 Profª Berenice C. Damasceno


TABELA DE DISTRIBUIÇÃO DAS FREQÜÊNCIAS
Para a facilidade e metodização do processo de análise estatística, monta-se uma tabela
que agrupe as informações obtidas, da forma de Tabela de Freqüências. Para os pacotes
em pauta, teremos a seguinte tabela de freqüências:
TABELA 7
FREQ. FREQU. FREQ. ACUM.
VALOR COMPRIMENTO FREQ. RELATIVA (%) ACUM. REL (%)

CLASSE CLASSE TABULAÇÃO f fR F FR

1 200 I--- 203 I 1 1 1 1

2 203 I--- 206 I I I I 4 4 5 5

3 206 I--- 209 I I I I I I I I I I 10 10 15 15

4 209 I--- 212 I I I I I I I I I I I I I I I 15 15 30 30

5 212 I--- 215 I I I I I I I I I I I I I I I I I I I I I I I I I 25 25 55 55

6 215 I--- 218 I I I I I I I I I I I I I I I I I I I I I 21 21 76 76

7 218 I--- 221 I I I I I I I I I I I I I 13 13 89 89

8 221 I--- 224 I I I I I I I 7 7 96 96

9 224 I--- 227 I I I I 4 4 100 100

∑ 100 100%

Onde:
Freqüência (f) = número de vezes que as medidas ocorrem no intervalo de classes
Freqüência Relativa (fR) = porcentagem da freqüência de cada classe em relação ao total
f
de elementos. f R = .100
n
Freqüência acumulada (F) = soma das freqüências até o intervalo de classe considerado.
Ex. F5 = f1+ f2 + f3 + f4 + f5 → 1 + 4 + 10 + 15 + 25 = 55
Freqüência acumulada relativa (FR) = soma das freqüências relativas até o intervalo
considerado. Por ex.: FR3 = fR1 + fR2 + fR3 → 1 + 4 + 10 = 15

Noções de Probabilidade e Estatística 25 Profª Berenice C. Damasceno


7.0 REPRESENTAÇÃO GRÁFICA DAS VARIÁVEIS QUANTITATIVAS

A representação gráfica da distribuição de freqüências de uma variável tem a vantagem de,


rápida e concisamente, informar sobre a variabilidade da mesma.
Podemos optar por vários tipos de gráficos, porém qualquer que seja ele, devemos
especificar os elementos essenciais para a sua interpretação, que são:
i. o título;
ii. o corpo;
iii. o cabeçalho;
iv. as colunas indicadoras.
TÍTULO é a indicação que, precedendo à tabela, é colocado na parte superior da mesma.
Deve ser preciso, claro e conciso, indicando a natureza dos fatos estudados (o quê), e a
época (quando) em que o mesmo foi observado.
CORPO da tabela é o conjunto de linhas e colunas que contem respectivamente, as
séries horizontais e verticais de informações. Casa, cela ou célula é o cruzamento de uma
linha com uma coluna, onde se tem a freqüência com que a categoria (ou categorias)
aparece.
CABEÇALHO é a parte da tabela em que é designada a natureza (as categorias, as
modalidades da variável) do conteúdo de cada coluna.
COLUNA INDICADORA é a parte da tabela em que é designada a natureza (as
categorias, as modalidades da variável) do conteúdo de cada linha.
Os elementos complementares de uma tabela são:
i. Fontes;
ii. Notas.
FONTE é o indicativo, no rodapé da tabela, da entidade responsável pela sua
organização ou fornecedora dos dados primários. A razão da presença da fonte não é
somente honestidade científica, mas também permitir ao leitor a possibilidade de
consultar o trabalho original de onde procedem as informações.
NOTAS são colocadas no rodapé da tabela para esclarecimentos de ordem geral. E são
numeradas, podendo-se também usar símbolos gráficos, sendo comum o asterisco.

Noções de Probabilidade e Estatística 26 Profª Berenice C. Damasceno


7.1 HISTOGRAMA E POLIGONO DAS FREQÜÊNCIAS
FREQÜÊNCIAS
25

POLÍGONO DE
FREQÜÊNCIAS

HISTOGRAMA
15

10

1 2 3 4 5 6 7 8 9 CLASSES

Polígono de freqüências é a representação gráfica de uma distribuição de freqüências


através de um polígono, onde tomamos sobre a abscissa os pontos médios das classes e
sobre as ordenadas as freqüências correspondentes. Depois para fechar o polígono
unimos os extremos da figura com o eixo das abscissas nos pontos médios de uma classe
imediatamente anterior à primeira e imediatamente posterior à última, ambas as
freqüências nulas, para manter a área sob o polígono igual a área do histograma.

Noções de Probabilidade e Estatística 27 Profª Berenice C. Damasceno


7.2 HISTOGRAMA E POLIGONO DE FREQÜÊNCIA RELATIVA

FREQÜÊNCIAS
25 RELATIVAS (%)

POLÍGONO DE
FREQÜÊNCIA
RELATIVA

HISTOGRAMA
15

10

1 2 3 4 5 6 7 8 9 CLASSES

Noções de Probabilidade e Estatística 28 Profª Berenice C. Damasceno


7.3 POLIGONO DE FREQÜÊNCIA ACUMULADA OU OGIVA

FREQÜÊNCIAS
ACUMULADAS

POLÍGONO DE
100 FREQÜÊNCIA
ACUMULADA

HISTOGRAMA

55

15

1 2 3 4 5 6 7 8 9 CLASSES

Noções de Probabilidade e Estatística 29 Profª Berenice C. Damasceno


7.4 POLIGONO DE FREQÜÊNCIA ACUMULADA RELATIVA

FREQÜÊNCIAS
ACUMULADAS
RELATIVAS (%)

POLÍGONO DE
100 FREQÜÊNCIA
ACUMULADA
RELATIVA

HISTOGRAMA

55

15

1 2 3 4 5 6 7 8 9 CLASSES

Noções de Probabilidade e Estatística 30 Profª Berenice C. Damasceno


8.0 TIPOS DE DISTRIBUIÇÃO

As distribuições de freqüência podem se apresentar de diversas formas conforme as


figuras a seguir:

8.1 DISTRIBUIÇÃO SIMÉTRICA OU EM FORMA DE SINO


A distribuição é simétrica quando os valores se distribuem igualmente em torno da média
__
( X ou M)
A) Normal

B) Alongada

Noções de Probabilidade e Estatística 31 Profª Berenice C. Damasceno


C) Achatada

8.2 DISTRIBUIÇÃO ASSIMÉTRICA

É aquela em que as freqüências dos valores medidos se distribuem de forma desigual em


torno da média.

A) Assimétrica Positiva

Noções de Probabilidade e Estatística 32 Profª Berenice C. Damasceno


B) Assimétrica Negativa

8.3 DISTRIBUIÇÃO MODAL, AMODAL, BIMODAL E MULTIMODAL

Chamamos de moda (mo) numa distribuição, ao valor da medida ou classe que


corresponde à freqüência máxima. Sob o critério da moda as distribuições classificam-se
em:

A) DISTRIBUIÇÃO MODAL – Quando a distribuição tem freqüência máxima ela é


denominada modal.

mo

Noções de Probabilidade e Estatística 33 Profª Berenice C. Damasceno


B) DISTRIBUIÇÃO AMODAL – Quando a distribuição não tem moda

C) DISTRIBUIÇÃO BIMODAL – Quando a distribuição tem duas modas.

mo mo

D) DISTRIBUIÇÃO MULTIMODAL – Quando a distribuição tem mais de duas modas

mo mo mo

Noções de Probabilidade e Estatística 34 Profª Berenice C. Damasceno


8.4 APRESENTAÇÃO TIPO RAMO-E-FOLHAS

Uma alternativa para o uso da tabela de distribuição de freqüências é usar o gráfico do tipo
ramo-e-folhas.
Podemos estudar a partir de um exemplo prático:
Observamos os seguintes números de passageiros em 50 viagens de um avião que faz a
ponte aérea Rio - São Paulo:

61 52 64 84 35 57 58 95 82 64

50 53 103 40 62 77 78 66 60 41

58 92 51 64 71 75 89 37 54 67

59 79 80 73 49 71 97 62 68 53

43 80 75 70 45 91 50 64 56 86

SOLUÇÃO:
F FA
3 5 7 2 2

4 0 1 3 5 9 5 7

5 0 0 1 2 3 3 4 6 7 8 8 9 12 19

6 0 1 2 2 4 4 4 4 6 7 8 11 30

7 0 1 1 3 5 5 7 8 9 9 39

8 0 0 2 4 6 9 6 45

9 1 2 5 7 4 49

10 3 1 50

A MEDIANA NESTE CASO SERÁ md = 64

Noções de Probabilidade e Estatística 35 Profª Berenice C. Damasceno


8.5 O PICTOGRAMA

A figura abaixo mostra um exemplo de apresentação pictográfica de dados temporais


(comumente encontrada em jornais, revistas e relatórios de vários tipos); no caso abaixo
representa a população dos Estados Unidos da América do Norte.

1920

1930

1940

1950

1960

1970

1980

1990

Cada símbolo = 10 milhões de pessoas


(Pictograma da população dos Estados Unidos da América do Norte)

EXERCÍCIO

Construa uma distribuição de freqüências e faça as possíveis representações gráficas para


os dados da tabela abaixo.

Tabela - Pressão arterial em milímetros de mercúrio, para cães adultos anestesiados


depois de determinado procedimento cirúrgico. Fonte: ARAÚJO e HOSSNE (1977)
130,0 105,0 120,0 111,5 99,0 116,0 92,5
107,5 1250 100,0 107,5 120,0 143,0 115,0
135,0 130,0 135,0 127,5 905 104,5 136,5
100,0 145,0 125,0 104,5 101,5 102,5 101,5
134,5 138,5 110,0 102,5 90,5 107,5 1244,0
121,5 135,0 102,0 119,5 115,5 125,5 117,5
107,5 140,0 121,5 107,5 113,0 93,0 103,5

Noções de Probabilidade e Estatística 36 Profª Berenice C. Damasceno


9.0 MEDIDAS DE POSIÇÃO OU DE TENDÊNCIA CENTRAL

Como o próprio nome indica, a medida de tendência central visa a determinar o centro da
distribuição. Esta determinação, porém, não é bem definida daí parece razoável
chamarmos de “tendência central”.

São medidas de tendência central:

__
• MÉDIA ARITMÉTICA SIMPLES/PONDERADA ( X ou M);

• MEDIANA (md);

• MODA (mo).

9.1 MÉDIA ARITMÉTICA SIMPLES

Dada uma distribuição de freqüências, chama-se média aritmética desta distribuição, e


_
representa-se por X a soma de todos os valores da variável, dividida pelo número de
variáveis “n”.

_ ∑x i _
∑x
X= i =1
ou simplificadamente, X =
n n

n
Sendo: ∑x
i =1
i = x 1 + x 2 + ... + x n

Exemplo: Calcular a média aritmética simples de 8, 3, 5, 12, 10.

_
8 + 3 + 5 + 12 + 10 38
X= = = 7 ,6
5 5

Noções de Probabilidade e Estatística 37 Profª Berenice C. Damasceno


9.2 MÉDIA ARITMÉTICA PONDERADA

__ ∑x i .fi
X= i =1
n

∑f i =1
i

onde: fi = freqüência dos dados xi

Exemplo: Calcular a média ponderada dos números 5, 8, 6, 2 ; os quais ocorrem com as


freqüências 3, 2, 4 e 1, respectivamente.

Números x = 5, 8, 6, 2
Freqüências f = 3, 2, 4, 1

__ ∑x i .fi
(5.3) + (8.2) + (6.4) + ( 2.1) 57
X= i =1
= = = 5 ,7
n
3+ 2+4+1 10
∑f i =1
i

9.3 MEDIANA (md)

Se ordenarmos uma seqüência de números do menor para o maior e se a quantidade


desses números for impar, então a mediana será o valor do meio, ou a média dos dois
valores do meio, caso a quantidade de números seja par.

O símbolo que usamos para representar a mediana será md


No caso de cálculo da mediana quando estamos trabalhando com distribuição de
freqüência determinamos o valor mais provável dessa distribuição a partir de:

Posição da md = Freqüência acumulada total = FA


2 2

Noções de Probabilidade e Estatística 38 Profª Berenice C. Damasceno


n + 1
Ou seja, a posição da MEDIANA é definida por   -ésimo elemento quando ”n” é
 2 
ímpar e temos um número inteiro que dá a posição da mediana. Quando temos o meio do
caminho entre dois números inteiros, isto é, ”n” é par, a mediana será a média deles.

Exemplo: Determine a posição da mediana para: (a) n=15, (b) n=45 e (c)n=88.

n + 1 15 + 1
(a) = = 8 , e a mediana é o valor do 8° elemento;
2 2
n + 1 45 + 1
(b) = = 23 , e a mediana é o valor do 23° elemento;
2 2
n + 1 88 + 1
(c) = = 44,5 , e a mediana é a média do valor do 44° e o 45°elem ento.
2 2
n  n 
Ou seja, quando n é par procuramos duas posições:   e  + 1
2 2 
No caso do exercício da distribuição dos 100 valores de peso de pacotes de manteiga
temos:

md = FA = 100 = 50, e a mediana é o valor do 50° elemento


2 2

50°
valor

F 0 1 5 15 30 55 76 89 96 100
X 200 203 206 209 212 215 218 221 224 227

50°

30 55
212 215

(55 – 30) (215 – 212) ou (55 – 30) (215 – 212)


(55 – 50) ∆ (50 – 30) ∆

∆= 5 x 3 = 0,6 ∆= 20 x 3 = 2,4
25 25
portanto a mediana será 215 - ∆ portanto a mediana será 212 + ∆
logo, md = 215 - 0,6 = 214,4. logo, md = 212 + 2,4 = 214,4.

Noções de Probabilidade e Estatística 39 Profª Berenice C. Damasceno


Assim, para encontrarmos a mediana para dados tabulados agrupados em classes
podemos formalizar os passos anteriores na seguinte equação:

n 
 − Fant 
m d = l inf +h 2  , onde:
 f med 
 
 
n
≡ metade da quantidade de dados
2
h ≡ amplitude da classe mediana
linf ≡ limite inferior da classe da mediana
fmed ≡ freqüência absoluta da classe da mediana
Fant ≡ freqüência acumulada da classe anterior a da
mediana

Voltando ao exemplo, temos:


1º Passo: da tabela 7 - página 25, temos as freqüências acumuladas já calculadas;
n 100
2º Passo: n = 100 => = = 50 => localização da classe mediana: 5ª classe, isto é,
2 2
classe 212 --- 215;
3º Passo: encontrar na tabela: linf , fmed e Fant :
linf = 212
fmed = 25
Fant = 30
4º Passo: substituir os dados na equação:

n 
 − Fant 
m d = l inf +h 2  = 212 + 3 50 − 30  = 212 + 3.0,8 = 212 + 2,4 = 214,4
 f med   25 
 
 
md = 214,4

Noções de Probabilidade e Estatística 40 Profª Berenice C. Damasceno


9.3.1 SEPARATRIZES (QUARTIS, DECIS E CENTIS)

Como extensão do conceito de mediana, podemos dividir os valores em quatro, dez e cem
partes iguais. Essas divisões são chamadas de quartis, decis e centis, respectivamente.
O cálculo dessas divisões é semelhante ao da mediana, isto é:

 i .n 
 − FQi − 1 
Quartis: Q i = l inf +h 4  , onde i = 1, 2, 3
 f Qi 
 
 

 i .n 
 − FDi − 1 
Decis: D i = l inf + h  10  , onde i = 1, 2, 3, 4, 5, .., 9
 f Di 
 
 

 i .n 
 − FCi − 1 
Centis: C i = l inf + h  100  , onde i = 1, 2, 3, 4, 5, ..., 99
 f Ci 
 
 
Onde:
h ≡ amplitude da classe
linf ≡ limite inferior da classe da quartílica, decílica ou
percentílica
fQi , fDi , fCi ≡ freqüências das classes quartílica, decílica e
percentílica, respectivamente
FQi-1 , FDi-1 , FCi-1 ≡ freqüências acumuladas da classe
anterior à classe quartílica, decílica ou percentílica

Voltando ao exemplo anterior, temos:


i) Se quisermos calcular o 1º Quartil, ou seja, 25% dos dados:
 1.n   100 
 − FQ i − 1   − 15 
Q 1 = l inf +h 4  = 209 + 3 4  = 209 + 3.0,67 = 211,01
 f Qi   15 
   
   

Noções de Probabilidade e Estatística 41 Profª Berenice C. Damasceno


ii) Para o 3º Quartil:
 3.n   3.100 
 − FQ i − 1   − 55 
Q 3 = l inf +h 4  = 215 + 3 4  = 215 + 3.0,95 = 217,85
 f Qi   21 
   
   
iii) Para o 8º Decil:
 8.n   8.100 
 − FDi − 1   − 76 
D 8 = l inf + h  10  = 218 + 3 10  = 218 + 3.0,31 = 218,93
 f Di   13 
   
   
iv) Para o 15º Centil:
 15.n   15.100 
 − FCi − 1   −5
C15 = l inf + h  100  = 206 + 3 100  = 209
 f Ci   10 
   
   
OBS.: Caso tenhamos dados não agrupados em classes, como por exemplo a
seqüência 2,3,3,4,5,7,7,8,10,11,12,12, 13; o cálculo do 3º Quartil será:
3.n 3.13
Posição: = = 9,75 . A posição 9,75ª será aproximada pela inteira imediatamente
4 4
posterior a ela, ou seja, a 10ª posição, logo Q3 = 11. E assim, analogamente, para
encontrar os decis e centis de uma série de dados não agrupados em classes.

9.4 MODA ( mo )

Em um conjunto de números a moda é o valor que ocorre com maior freqüência, isto é, o
valor mais comum.
Exemplos:
1) 2, 2, 3, 7, 8, 8, 8, 9, 10
moda=8
2) 1, 2, 3, 4, 5, 6, 7, 8, 9, 10
moda = Ф (não existe moda)
3) 2, 2, 4, 4, 4, 5, 6, 7, 8, 8, 8, 9
moda = 4 e 8

Noções de Probabilidade e Estatística 42 Profª Berenice C. Damasceno


Para o exemplo do exercício das distribuições de freqüências dos pacotes de manteiga
(onde os dados são tabulados agrupados em classes) uma forma de estimar o valor da
moda é pela Estimativa de Pearson (para dados tabulados agrupados em classes):
_
mo = 3.md – 2. X

Voltando ao exemplo, temos:


mo = 3.214,4 – 2. 214,49 => mo = 214,22

onde a média foi calculada da forma:


_
201,5.1 + 204,5.4 + 207,5.10 + 210,5.15 + 213,5.25 + 216,5.21 + 219,5.13 + 222,5.7 + 225,5.4
X=
1 + 4 + 10 + 15 + 25 + 21 + 13 + 7 + 4
_
=> X = 214,49

O cálculo da moda pelo Método de Pearson é mais utilizado quando temos uma
indicação de que os três parâmetros de tendência central (média, mediana e moda)
estejam muito próximos.
Um outro método, de origem gráfica, é o Método de Czuber, que utilizamos na maioria
dos casos:

 ∆a 
mo = l inf +   ⋅ h
 ∆a + ∆p 
onde:
linf = limite inferior da classe modal.
∆a = diferença entre a fi da classe modal e a fi da classe anterior. Entenderemos como
classe anterior aquela que precede à classe modal.
∆p = diferença entre a fi da classe modal e a fi da classe posterior (aquela que vem
logo após a classe modal).
h = amplitude da classe modal.

A equação da moda pode ser deduzida facilmente do processo gráfico para determinar
a moda em um histograma.

Noções de Probabilidade e Estatística 43 Profª Berenice C. Damasceno


Da figura acima temos mo = linf + x e chamando ∆1 de ∆a e ∆2 de ∆p , e, pela semelhança
dos triângulos ABE e CDE temos:

∆a x h∆a
= ⇒x=
∆p h − x ∆a + ∆p

 ∆a 
Portanto: mo = l inf +   ⋅ h
 ∆a + ∆p 

Noções de Probabilidade e Estatística 44 Profª Berenice C. Damasceno


10.0 MEDIDAS DE VARIABILIDADE (OU DE DISPERSÃO)

As medidas de dispersão indicam se os valores estão relativamente próximos uns


dos outros, ou separados. Podemos dizer que dispersão é o grau com o qual os
valores numéricos de uma distribuição tendem a se distanciar em torno de um valor
médio.

Em todos os casos, o valor zero indica ausência de dispersão; a dispersão aumenta à


proporção que aumenta o valor da medida (amplitude, desvio-padrão, variância).

xx x x x x xxx xxx xx x x

a) pequena dispersão

xx x x xxx x x x x x x x x xx x x xxx x x x xx x x x x xx

b) grande dispersão

10.1 AMPLITUDE TOTAL (RT ou Ω)

É a medida mais simples de dispersão. É a diferença entre o maior e o menor valor das
observações.

RT = Xmax – Xmin

Embora exista simplicidade de cálculo, existem duas restrições ao seu uso


generalizado:

1- Utiliza apenas uma parcela das informações contidas nas observações. O seu valor
não se modifica mesmo que os valores das observações variem, desde que
conservem os seus valores máximo e mínimo. Ou seja, depende apenas dos
valores externos (max e min), não sendo afetada pelos valores internos.

2- Depende do número de observações na amostra. Em geral o valor da amplitude

Noções de Probabilidade e Estatística 45 Profª Berenice C. Damasceno


cresce quando cresce o tamanho da amostra.

X min X max.

RT = pequeno

X min X max.
RT = Grande

Noções de Probabilidade e Estatística 46 Profª Berenice C. Damasceno


10.2 DESVIO EM RELAÇÃO À MÉDIA ARITMÉTICA (di)

O desvio di em relação à média de um conjunto de dados é a diferença do valor xi e a


_
média aritmética X do conjunto, isto é:
_
di = (xi - X )
Exemplos :
(1) Calcular os desvios di para o seguinte conjunto : 3, 4, 5, 6, 7
xi di
Onde 3 -2
_
3+4+5+6+7 4 -1
X= =5
5 5 0
6 1
7 2
Σdi = 0

(2) Calcular os desvios di para a seguinte distribuição :


xi fi di
82 5 -4,60
Onde 85 10 -1,60
_ 87 15 0,40
X = 86,60.
89 8 2,40
90 4 3,40
Σfi = 42 Σdi ≈ 0

(3) Calcular os desvios di para a seguinte distribuição :


Classes xi fi di di.fi
[35, 45) 40 2 -22,91 -45,82
Onde : [45, 55) 50 13 -12,91 -167,83
_
[55, 65) 60 20 -2,91 -58,20
X = 62,91
[65, 75) 70 10 7,09 70,90
[75, 85) 80 7 17,09 119,63
[85, 95) 90 3 27,09 81,27
Σfi = 55 Σdi ≈ 12,55 Σdi.fi≈ 0

Noções de Probabilidade e Estatística 47 Profª Berenice C. Damasceno


__
10.3 DESVIO MÉDIO ( d )

__
O desvio médio d é a média aritmética dos módulos dos desvios, isto é:

__

__
∑d ∑x i − x
d= =
i

n n
Para uma distribuição de freqüências (simples ou por classes), teremos:

__

__
∑d .fi ∑x i − x .fi
d= =
i

n n

Exercício: calcular o desvio médio para os exemplos (1), (2) e (3) da página anterior.

σ2 ou s2)
10.4 VARIÂNCIA (σ

Variância da população é a soma dos quadrados dos desvios de cada observação em


relação à média de “x” e divide-se por N. Indica-se a Variância da População por σ² .
Podemos fazer a mesma analogia com a Variância da Amostra dada por S².

Variância para uma população: σ 2


=
∑ (x − µ )i
2
. fi
, onde µ é a média populacional e N é o
N
tamanho da população.

__

Variância para uma amostra: s 2 =


∑ ( x i − X) 2 . f i _
, onde X é a média amostral e n é o
n −1

tamanho da amostra.
As equações anteriores para σ2 e s2 representam uma maneira de cálculo dessas medidas.
Podemos também utilizar as seguintes equações:

Noções de Probabilidade e Estatística 48 Profª Berenice C. Damasceno


__ 2

σ2 =
∑ f (x )
i i
2
− N.µ 2

ou s2 =
∑ f (x )
i i
2
− n. x
N n −1

Como medida de dispersão, a Variância tem a desvantagem de apresentar como unidade


de medida o quadrado da unidade de medida dos dados. Se os dados estão em metros,
a Variância fica em metros quadrados. O desvio padrão por sua vez, fica com valor na
mesma da unidade da variável.
Obs: A variância sendo uma média de uma soma de quadrados é sempre maior ou igual a
0. Ela será nula se os valores dos dados são constantes.

σ ou s)
10.5 DESVIO PADRÃO (σ

É a medida que determina a variação dos valores observados em torno da média da


distribuição, e representa a distância do ponto de inflexão da curva até a linha da média.

A partir da variância podemos calcular o desvio padrão como segue:

Desvio padrão da população: σ = σ 2

Desvio padrão da amostra: s = s2

10.6 COEFICIENTE DE VARIAÇÃO (cv)

O coeficiente de variação cv é a razão entre o desvio padrão e a média aritmética. Esta


medida é admensional e geralmente é expressa em porcentagens. A equação para o seu
cálculo é:

σ s
cv = .100 (para população) ou cv = __ .100 (para amostra)
µ
x

Noções de Probabilidade e Estatística 49 Profª Berenice C. Damasceno


EXERCÍCIOS

(1) Calcular a média aritmética para os dados da tabela:


Pesos (kg) Freqüência (f)
35 45 3
45 55 7
55 65 11
65 75 20
75 85 13
85 95 6

(2) Calcular a mediana para a tabela:


Pesos (kg) Freqüência (f)
40 50 2
50 60 5
60 70 9
70 80 20
80 90 15
90 100 9

(3) Encontre a mediana para os seguintes dados:


Estaturas (cm) Freqüência (f)
140 149 3
149 158 9
158 167 12
167 176 15
176 185 32
185 194 19
194 203 14

(4) Vinte e cinco residências de um certo bairro foram sorteadas e visitadas por um
entrevistador que, entre outras questões, perguntou sobre o número de televisores. Os
dados foram os seguintes:
2, 2, 2, 3, 1, 2, 1, 1, 1, 1, 0, 1, 2, 2, 2, 2, 3, 1, 1, 3, 1, 2, 1, 0 e 2.
Organize os dados numa tabela de feqüência e determine as diversas medidas de posição.

Noções de Probabilidade e Estatística 50 Profª Berenice C. Damasceno


(5) Num experimento, 15 coelhos foram alimentados com uma nova ração e seu peso
avaliado no fim do mês. Os dados referentes ao ganho de peso (em quilogramas)
foram os seguintes:
1,5 ; 1,6 ; 2,3 ; 1,7 ; 1,5 ; 2,0 ; 1,5 ; 1,8 ; 2,1 ; 2,1 ; 1,9 ; 1,8 ; 1,7 ; 2,5 ; e 2,2.
a) Utilizando os dados brutos acima, determine a média, moda e mediana desse
conjunto.
b) Organize uma tabela de freqüência com faixas de amplitude 0,2 a partir de 1,5.
c) Calcule a partir dessa tabela de freqüência e com o ponto médio como representante
de cada classe, a média e a mediana.

(6) Dada a seguinte tabela:


Classes Freqüência (f)
20 30 5
30 40 9
40 50 17
50 60 28
60 70 37
70 80 15
80 90 10

Determinar:
a) a mediana;
b) o 1º Quartil;
c) o 3º Quartil;
d) o 8º Decil;
e) o 15º Centil.

(7) Calcular a moda pela estimativa de Pearson, para a tabela:


Classes Freqüência (f)
35 46 8
46 57 21
57 68 46
68 79 57
79 90 39
90 101 28
101 112 12

Noções de Probabilidade e Estatística 51 Profª Berenice C. Damasceno


(8) Determinar o desvio padrão para as medidas: 16, 11, 20, 26 e 10.

(9) Você está indeciso em comprar um aparelho de televisão e decide avaliar algumas
informações estatísticas, fornecidas pelo fabricante, sobre a duração (em horas) do
tubo de imagem.
Marca do aparelho GA FB HW
Média 8000 8200 8000
Mediana 8000 9000 7000
Desvio Padrão 600 1500 2500

Com que marca você ficaria? Justifique.

(10) A pulsação de dez estudantes, no início de uma avaliação de Estatística, foram as


seguintes (em batimentos por minuto): 80, 91, 84, 86, 93, 88, 80, 89, 85 e 86. Calcule a
média e a variância desse conjunto de dados.

(11) Num estudo sobre consumo de combustível, 200 automóveis do mesmo ano e modelo
tiveram seu consumo observado durante 1000 quilômetros. A informação obtida é
__
apresentada na tabela abaixo em km/litro. Calcular X , S2 e S.
Faixas Freqüência (f)
7 8 27
8 9 29
9 10 46
10 11 43
11 12 55

Calcular a média, mediana, moda, variância e desvio-padrão dos dados da tabela acima.
(12) 15 alunos participaram de um teste e obtiveram os seguintes resultados 60, 45, 70, 30,
85, 60, 30, 70, 60, 60, 85, 70, 70, 85 e 70.

Pede-se:
a) Construir uma tabela de dados ponderados;
b) Calcular a média aritmética (ponderada);
c) Calcular o desvio padrão;
d) Determinar a variância.

Noções de Probabilidade e Estatística 52 Profª Berenice C. Damasceno


(13) Calcular a variância e o desvio padrão para os seguintes dados:

xi f
30 2
45 1
60 4
70 15
85 3

.
(14) Calcular a variância da série de dados dada pela tabela abaixo:

Classes fi
[2 ; 4) 2
[4 ; 6) 5
[6 ; 8) 7
[8 ; 10) 4
[10 ; 12) 3
[12 ; 14] 3

Noções de Probabilidade e Estatística 53 Profª Berenice C. Damasceno


11.0 PROBABILIDADE

O problema fundamental da estatística consiste em trabalhar com o acaso e a incerteza.


Chama-se probabilidade de um acontecimento a razão entre o número de casos
favoráveis ao mesmo e o número total de acontecimentos possíveis.
As leis da hereditariedade foram a primeira grande aplicação das probabilidades na área
de biociências. Hoje conhecemos muitas aplicações: ocorrência de mutações, risco de
doenças, chance de sobrevivência, distribuição e interação de espécies, etc.
A aplicação mais importante, entretanto, é feita na estatística. Nenhuma observação e
nenhuma experiência podem ser precisamente planejadas e analisadas sem algum método
estatístico. Mesmo se mantivermos as condições experimentais mais constantes possíveis,
a repetição de uma observação ou uma experiência dificilmente resulta sempre exatamente
igual. Sempre existem flutuações.
Portanto, todas as conclusões baseadas em dados empíricos são necessariamente
encaradas com incerteza. Tentamos expressar o grau de incerteza em termos de
probabilidades. Então, um pesquisador afirma “significância ao nível de cinco por cento”,
ele admite a possibilidade de uma afirmativa errônea. Antes da compreensão de alguns
métodos estatísticos é necessário um conhecimento básico sobre probabilidades.

Quando se considera uma população limitada de P indivíduos, a probabilidade de cada um


ser escolhido, ao acaso, é de 1/P.

Laplace definiu probabilidade como: “O quociente do número de casos favoráveis sobre o


número de casos igualmente possíveis”. Por exemplo, se jogarmos uma moeda “não
viciada” para o ar, de modo geral não podemos afirmar se vai dar cara ou coroa.

Porém existem apenas dois eventos possíveis: sair “cara” (K) ou “coroa” (C). Nesse
exemplo existe um caso favorável a esse evento em dois casos possíveis. A P (K) = ½ ou
50%.

Considerando-se “cara” como sucesso e “coroa” como fracasso e representando-se o


acontecimento favorável como “P” e o não favorável como “Q”, temos as razões:

P= ½ e Q=½
Sendo P+Q = 1 então P= (1 - Q) e Q = (1 - P)

Noções de Probabilidade e Estatística 54 Profª Berenice C. Damasceno


A probabilidade de um evento A, denotada por P (A), é um número de 0 a 1, que indica a
chance de ocorrência do evento A. Quanto mais próxima de 1 é P(A), maior é a chance de
ocorrência do evento A, e quanto mais próxima de Zero, menor é a chance de ocorrência
do evento A.

A um evento impossível atribui-se a probabilidade Zero. Um evento certo tem probabilidade


1.

As probabilidades podem ser expressas, inclusive por valores decimais, frações e


porcentagem como: 20%; 2 em 10; 0,2; ou ainda, 1/5.
Além do uso na interpretação de jogos de azar, usa-se ainda a probabilidade mediante
determinada combinação de julgamento, experiência ou dados históricos, para predizer
Quão Provável é a ocorrência de determinado evento futuro.

Há numerosos exemplos de tais situações no campo dos Negócios e do Governo. A


previsão da aceitação de um novo produto, o cálculo dos custos de produção, a
contratação de um novo empregado, o preparo do orçamento, a avaliação do impacto de
uma redução de impostos sobre a inflação – tudo isso contém algum elemento de acaso.

Noções de Probabilidade e Estatística 55 Profª Berenice C. Damasceno


11.1 ESPAÇO AMOSTRAL E EVENTOS
Consideremos o experimento que consiste em “extrair uma carta de um baralho de 52
cartas”. Há 52 eventos elementares no espaço amostral. Quanto aos eventos podemos
classificá-los em:

ESPAÇO AMOSTRAL

COMPLEMENTO Cartas vermelhas e cartas pretas


A

Não se interceptam cartas de


MUTUAMENTE EXCLUSIVOS copas e cartas de paus
A B

NAO SÃO MUTUAMENTE Cartas de copas e figuras, tem


EXCLUSIVOS elementos em comum.
A B

Cartas de paus, ouro, copas e


COLETIVAMENTE EXAUSTIVOS A B C D espadas

11.2 TRÊS ORIGENS DA PROBABILIDADE

Há três maneiras diferentes de calcular ou estimar probabilidades, O método Clássico,


quando o espaço amostral tem resultados igualmente prováveis. O método Empírico, que
se baseia na freqüência relativa de ocorrência de um evento num grande número de
provas repetidas; e o método Subjetivo, que utiliza estimativas pessoais baseadas num
certo grau de crença.

OBJETIVO SUBJETIVO

CLÁSSICO EMPÍRICO Opinião Pessoal


(resultados igualmente prováveis) (dados históricos)

Noções de Probabilidade e Estatística 56 Profª Berenice C. Damasceno


O Método Clássico

Os jogos de azar (lançamento de moedas, jogo de dados, extração de cartas) usualmente


apresentam resultados igualmente prováveis.
Nestes casos temos:

1
P(cada resultado) =
N° de resultados possíveis

Se cada carta de um baralho de 52 tem a mesma chance de ser escolhida, então a


probabilidade de extrair cada uma delas é de 1/52 : P (A) = 1/52 ou 1,92%.

Da mesma forma a probabilidade de termos uma cara no lançamento de uma moeda é ½


ou 50%. O mesmo ocorre com uma coroa, ou seja, ½ ou 50%.

No caso de um dado temos a probabilidade de dar qualquer número: 1, 2, 3, 4, 5 ou 6 de


1/6 ou de 16,66%.

De forma geral vale também a expressão:

P(A) = Número de resultados associados ao evento A


Número total de resultados possíveis

Por exemplo, a probabilidade de extração de uma dama, de acordo com esta definição, é

P (dama) = 4 damas = 4 = 1 = 7,69%


52 cartas 52 13

Analogamente, a probabilidade de obter número ímpar no lance de um dado é

P(ímpar) = 3 faces = 3 ou 50%


6 faces possíveis 6

Noções de Probabilidade e Estatística 57 Profª Berenice C. Damasceno


A MATEMÁTICA DA PROBABILIDADE

Muitas aplicações de estatística exigem a determinação da probabilidade de combinações


de eventos. Há duas categorias de eventos de interesse, A e B, no espaço amostral.

Pode ser necessário determinar P(A e B), isto é; a probabilidade de ocorrência de ambos
os eventos.

Em outras situações, podemos querer a probabilidade de ocorrência de A ou B, P(A ou B).

Cálculo da Probabilidade da ocorrência de dois eventos “independentes”


P(A e B)

Se dois eventos são independentes, então a probabilidade da ocorrência de ambos é igual


ao produto de suas probabilidades individuais: P(A e B) = P(A) . P(B)
Exemplo: Jogam-se duas moedas equilibradas. Qual a probabilidade de ambas as faces
serem cara?
É razoável admitir que os resultados das duas moedas sejam independentes um do outro.
Além disso, para moedas equilibradas, P(cara)= ½ . Logo P(cara e cara) será:
1ª moeda 2ªmoeda
½ x ½ =¼ ou 25%

Cálculo da Probabilidade da ocorrência de dois eventos “mutuamente exclusivos”


P(A ou B ocorrerá)

Se dois eventos são mutuamente exclusivos, a probabilidade de ocorrência de qualquer um


deles é a soma de suas probabilidades individuais. Para dois eventos A e B temos:

P(A ou B) = P(A) + P(B)


Exemplo: qual é a probabilidade de aparecer cinco ou seis numa jogada de um dado
equilibrado?
P(cinco) ou P(seis) = P (5) + P(6) = 1 + 1 = 2 = 33,33%
6 6 6

Cálculo da Probabilidade da ocorrência de dois eventos “não mutuamente


exclusivos” P(A ou B ou ambos ocorrerão)

Suponhamos a probabilidade de extração de uma carta de paus ou um dez de um baralho

Noções de Probabilidade e Estatística 58 Profª Berenice C. Damasceno


de 52 cartas. Como é possível que uma carta seja simultaneamente de “paus” e um “dez”,
os eventos não são mutuamente exclusivos. Assim devemos excluir a probabilidade de
intersecção. Então temos:

P(paus) = 13 , P(dez)= 4 , P( dez de paus) = 1 ,


52 52 52
P(paus ou dez,ou ambos) = P(paus) + P(dez) - P(dez de paus)

= 13 + 4 - 1 = 16
52 52 52 52

NAIPE

PAUS OUROS COPAS ESPADA


PRETA VERMELHA VERMELHA PRETA

♣ K ♦ K ♥ K ♠ K

♣ Q ♦ Q ♥ Q ♠ Q
♣ J ♦ J ♥ J ♠ J
♣ 10 ♦ 10 ♥ 10 ♠ 10 a carta é
um dez
♣ 9 ♦ 9 ♥ 9 ♠ 9
♣ 8 ♦ 8 ♥ 8 ♠ 8
♣ 7 ♦ 7 ♥ 7 ♠ 7
♣ 6 ♦ 6 ♥ 6 ♠ 6
♣ 5 ♦ 5 ♥ 5 ♠ 5
♣ 4 ♦ 4 ♥ 4 ♠ 4
♣ 3 ♦ 3 ♥ 3 ♠ 3
♣ 2 ♦ 2 ♥ 2 ♠ 2
♣ A ♦ A ♥ A ♠ A
Carta de paus
Os eventos “paus” e “dez” se interceptam.

Noções de Probabilidade e Estatística 59 Profª Berenice C. Damasceno


Resumindo:

P (A e B), para eventos independentes (Multiplicação) P(A) x P(B)

P (A ou B), para eventos mutuamente exclusivos (Soma) P(A) + P(B)

P (A ou B ou ambos ocorrerão), para eventos não mutuamente exclusivos


P(A) + P(B) - P(A interceção B)

11.4 ALGUMAS PROPRIEDADES

Como foi visto no final do item anterior, existem algumas regras de probabilidade. Neste
item detalharemos tais regras, conhecidas como propriedades da probabilidade.
Revendo, a probabilidade de um evento A ocorrer é um número entre 0 e 1, ou seja:
0 ≤ P(A) ≤ 1
Se considerarmos o espaço amostral, S, e o conjunto vazio, ∅, como eventos, temos:

P(S) = 1 (evento certo)


P(∅) = 0 (evento impossível)

Exemplo: Suponha que o seguinte quadro represente uma possível divisão dos alunos
matriculados num Instituto de Matemática:

Noções de Probabilidade e Estatística 60 Profª Berenice C. Damasceno


SEXO
CURSO Homens (H) Mulheres(F) TOTAIS

Matemática Pura (M) 70 40 110


Matemática Aplicada (A) 15 15 30
Estatística (E) 10 20 30
Computação (C) 20 10 30
TOTAIS 115 85 200

Sendo M o evento que ocorre quando, escolhendo-se ao acaso um aluno do Instituto, ele é
um estudante de Matemática Pura. A, E, C, H e F são os demais eventos com significados
análogos. Desta maneira, temos como exemplos:
30 115
P ( E) = e P( H ) =
200 200
Dados os eventos A e H, podemos considerar dois novos eventos:
- A ∪ H, chamado a união de A e H, que ocorre quando pelo menos um dos eventos
ocorre;
- A ∩ H, chamado a intersecção de A e H, que ocorre quando A e H ocorrem
simultaneamente.
15
É fácil verificar na tabela anterior que P( A ∩ H ) = , pois o aluno escolhido terá
200
que ser ao mesmo tempo, matriculado no curso de Matemática Aplicada e homem.
30 115
Vemos que P( A ) = e P( H ) = ; suponha que o nosso cálculo para P(A ∪ H)
200 200
fosse:
30 115 145
P ( A ∪ H ) = P ( A ) + P( H ) = + =
200 200 200
Se assim o fizéssemos, estaríamos contando duas vezes os alunos que são homens e que
estão matriculados no curso de Matemática Aplicada, como está em destaque na tabela
anterior. Portanto a resposta correta é:
30 115 15 130
P( A ∪ H ) = P( A ) + P( H ) − P( A ∩ H ) = + − =
200 200 200 200
30 30
No entanto, considerando-se os eventos A e C, vemos que P( A ) = , P( C) = e
200 200
60
P( A ∪ C) = = P( A ) + P(C) . Neste caso, os eventos A e C são disjuntos ou
200

Noções de Probabilidade e Estatística 61 Profª Berenice C. Damasceno


mutuamente exclusivos, pois se A ocorre, então C não ocorre e vice-versa. Aqui, A ∩ C = φ
e P( A ∩ C) = 0 .
Portanto, se M e N são dois eventos quaisquer, teremos a chamada regra da adição
de probabilidades:
P(M ∪ N ) =P(M ) + P( N ) − P(M ∩ N ) ,
que se reduz a
P(M ∪ N ) =P(M ) + P( N ) ,
se M e N são eventos mutuamente exclusivos.
Suponha agora que estejamos somente interessados em saber se um estudante escolhido
ao acaso está matriculado como de Matemática Pura, Aplicada, Estatística ou
Computação, não interessando saber se é homem ou mulher. Um espaço amostral é
S = M ∪ A ∪ E ∪ C . Os eventos A e B = M ∪ E ∪ C são chamados complementares e são
30
tais que A ∪ B=S e A ∩B=φ. Vemos que P( A ) = , enquanto
200
110 30 30 170
P( B ) = + + = , isto é:
200 200 200 200
P ( A ) + P( B ) = 1
C
Em geral, vamos indicar por A o complementar de um evento A, e teremos, então:

P( A C ) = 1 − P( A )
As operações de união, intersecção e complementação entre eventos possuem
propriedades análogas àquelas válidas para operações entre conjuntos.
Por exemplo:
(i) (A ∩ B)C = AC ∪ BC
(A ∪ B)C = AC ∩ BC
(ii) A ∩ AC = ∅
A ∪ AC = S
(iii) A∩∅=∅
A∩S=A
A∪∅=A
A∪S=S
(iv) ∅C = S
SC = ∅

Noções de Probabilidade e Estatística 62 Profª Berenice C. Damasceno


Vejamos, agora, um exemplo de aplicação das propriedades das probabilidades.
Exemplo: Consideremos um experimento e os eventos A e B associados, tais que
1 1 1
P( A ) = , P(B ) = e P( A ∩ B ) = . Então temos:
2 3 4
1 1
(a) P( A C ) = 1 − P( A ) = 1 − = ;
2 2
1 2
P( B C ) = 1 − P ( B ) = 1 − =
3 3
1 1 1 7
(b) P( A ∪ B ) = P( A ) + P(B ) − P( A ∩ B ) = + − =
2 3 4 12

[ ]
(c) P( A C ∩ B C ) =P ( A ∪ B ) C = 1 − P( A ∪ B ) = 1 −
7 5
=
12 12

) =P [( A ∩ B ) ]= 1 − P( A ∪ B ) = 1 − =
1 3
(d) P( A C ∪ B C C
4 4

(e) Calculemos P( A C ∩ B ) , ou seja, a probabilidade que ocorra B e não ocorra A

Podemos escrever:

B = ( A ∩ B) ∪ ( A C ∩ B) ,
ou seja, B pode ocorrer com A ou (exclusivo) com AC. Logo,

P( B ) = P( A ∩ B ) ∪ P ( A C ∩ B ) ,
do que decorre
1 1 1
P ( A C ∩ B ) = P( B ) − P ( A ∩ B ) = − =
3 4 12

Noções de Probabilidade e Estatística 63 Profª Berenice C. Damasceno


EXERCÍCIOS

1- Extrai-se uma só carta de um baralho de 52. Determine a probabilidade de obter:


a- Um valete
b- Uma figura
c- Uma carta vermelha
d- Uma carta de ouros
e- Um dez de paus
f- Um nove vermelho ou um oito preto
2- Joga-se uma vez um dado equilibrado; determine a probabilidade de obter:
a- Um seis;
b- Cinco, seis ou sete;
c- Um número par;
d- Um número menor que quatro.
3- Doze fichas são numeradas de 1 a 12 e colocadas numa urna. Escolhida uma
aleatoriamente, determine a probabilidade de sair:
a- O número 3
b- Um número impar
c- Um número menor que quatro
d- O número dez
4- Joga-se um par de dados equilibrados:
a- Qual a probabilidade de ambas as faces serem seis?
b- Qual a probabilidade de ambas as faces serem dois?
c- Qual a probabilidade de ambas as faces serem pares?
5- Sejam P(A) = 0,30, P(B) = 0,80 e P(A e B) = 0,15.
a- A e B são mutuamente exclusivos? Explique.
b- Determine P(A ou B).
6- Sejam A e B mutuamente exclusivos, P(A) = 0,31 e P(B) = 0,29.
a- A e B são coletivamente exaustivos? Explique.
b- Determine P(A ou B).
c- Determine P (A e B)
7- Joga-se uma moeda três vezes. Qual a probabilidade de aparecer coroa três vezes?
Qual a probabilidade de não aparecer coroa nas três vezes?

Noções de Probabilidade e Estatística 64 Profª Berenice C. Damasceno


11.5 PROBABILIDADE CONDICIONAL E INDEPENDÊNCIA

Voltemos à tabela da página 59. Dado que um estudante, escolhido ao acaso, esteja
20 2
matriculado no curso de Estatística, a probabilidade de ele ser mulher é de = . Isto
30 3
porque do total de 30 alunos que estudam Estatística, 20 são mulheres. Escrevemos:
2
P(mulher | Estatística ) =
3
Para dois eventos quaisquer A e B, sendo P(B) > 0, definimos a probabilidade condicional
de A, dado B, P(A|B), como sendo:

P( A ∩ B )
P( A | B ) =
P( B )
Para o exemplo mencionado, se A e B indicam, respectivamente, os eventos “aluno
matriculado em Estatística” e “aluno é mulher”, então P(A∩B) = 20/200, P(B) = 30/200 e,
portanto:
P( A ∩ B ) 20 / 200 2
P( A | B ) = = = ,
P( B ) 30 / 200 3
como havíamos obtido.

Da relação anterior, isto é:


PA ∩ B )
P( A | B ) =
P( B )

obtemos a chamada regra do produto de probabilidades, ou seja:

P( A ∩ B ) = P(B ) . P( A | B )

Exemplo: Uma urna contem duas bolas brancas (B) e três vermelhas (V). Suponha que
sorteemos duas bolas ao acaso, sem reposição. Isto significa que escolhemos a primeira
bola, verificamos a sua cor e não a devolvemos à urna; misturamos as bolas restantes e
retiramos a segunda bola. O diagrama em árvore ilustra as possibilidades. Em cada “galho”
da árvore estão indicadas as probabilidades de ocorrência, sendo que para algumas bolas
temos probabilidades condicionais. A probabilidade dos resultados conjuntos é, então,
dada pela regra do produto acima.

Noções de Probabilidade e Estatística 65 Profª Berenice C. Damasceno


Resultados Probabilidades
B BB 2 1 2 1
1/4 . = =
5 4 20 10
B BV 2 3 6 3
2/5 3/4 V
. = =
5 4 20 10
VB 3 2 6 3
2/4 B . = =
5 4 20 10
3/5 V
VV 3 2 6 3
. = =
2/4 5 4 20 10
V
Total 1
Exemplo: Imagine agora que as duas extrações são feitas da urna, mas a primeira bola é
reposta na urna antes da extração da segunda bola. Nestas condições, as extrações são
independentes, no sentido de que o resultado de cada extração não tem influência no
resultado da outra. Obtemos a seguinte situação:
Resultados Probabilidades
B
BB 2 2 4
2/5 . =
5 5 25
B BV 2 3 6
2/5 3/5 V . =
5 5 25
VB 3 2 6
2/5 B . =
5 5 25
3/5 V
VV 3 3 9
3/5 . =
V 5 5 25
Total 1
Observe que aqui
2
P(branca na 2ª | branca na 1ª ) = = P(branca na 2ª ) , ou seja, se o evento A é independente de
5
B, então P(A|B) = P(A). Usando a regra do produto, temos:
P( A ∩ B ) = P( B ) . P( A | B ) = P ( B ) . P ( A ) ,

ou seja, P( A ∩ B ) = P( A ) . P(B ) , se A é independente de B.


É fácil ver que, se A é independente de B, então B é independente de A. A equação
anterior pode ser tomada como definição de independência, ou seja, A e B são
independentes se, e somente se, tal equação for válida.

Noções de Probabilidade e Estatística 66 Profª Berenice C. Damasceno


Exemplo: Considere ainda a mesma urna dos exemplos anteriores, mas vamos fazer três
extrações sem repetição. Obtemos o esquema:

1
B V
1 /4

B 1 /3 B
2 /5 3 /4
V V
2 /3

1 /3 B

B V
2 /4 2 /3
3 /5 V

2 /4 2 /3 B
V
V
1 /3
Resultados Probabilidades
BBV 2 1 2 6
. .1 = =
5 4 20 60
BVB 2 3 1 6
. . =
5 4 3 60
BVV 2 3 2 12
. . =
5 4 3 60
VBB 3 2 1 6
. . =
5 4 3 60
VBV 3 2 2 12
. . =
5 4 3 60
VVB 3 2 2 12
. . =
5 4 3 60
VVV 3 2 1 6
. . =
5 4 3 60
Total 60/60 = 1

Observe que P(B|B) = ¼, ao passo que P(V|B∩B) = 1; daí,


2 1
P ( B ∩ B ∩ V ) = P( B ) . P ( B | B ) . P ( V | B ∩ B ) = . .1 = 1
5 4 10

De modo geral, dados 3 eventos M, N e R, temos que:


P( M ∩ N ∩ R ) = P( M ) . P( N | M ) . P( R | M ∩ N )

Noções de Probabilidade e Estatística 67 Profª Berenice C. Damasceno


Exemplo: A Teoria da Confiabilidade estuda sistemas e seus componentes, como, por
exemplo, sistemas mecânicos ou eletrônicos (um automóvel ou um computador) e
sistemas biológicos (como o corpo humano). O objetivo da teoria é estudar relações entre o
funcionamento dos componentes e do sistema. A figura abaixo ilustra um sistema
composto de dois componentes, ligados em série.

1 2

O sistema funciona se os componentes 1 e 2 funcionam simultaneamente. Se um dos


componentes não funciona, o sistema também não funciona. Supondo que os
componentes funcionem independentemente, e se pi é a probabilidade do componente i
(i=1,2) funcionar, então a probabilidade do sistema funcionar é p1.p2.
Chamando:
E: o sistema funciona
Ai: o componente i funciona, i = 1,2
então,
P ( E ) = P ( A 1 ∩ A 2 ) = P( A 1 ) . P( A 2 ) = p 1 . p 2

Cada pi é chamada a confiabilidade do componente i e P(E) = h(p1, p2) = p1. p2 é chamada


a confiabilidade do sistema.

Se os elementos 1 e 2 estiverem ligados em paralelo, como na figura abaixo, então o


sistema funciona se pelo menos um dos dois componentes funciona. Ou seja,
P ( E ) = P ( A 1 ∪ A 2 ) = P( A 1 ) + P( A 2 ) − P( A 1 ∩ A 2 ) = p 1 + p 2 − p 1 . p 2

e a confiabilidade do sistema é h(p1, p2) = p1 + p2 – p1. p2.

Noções de Probabilidade e Estatística 68 Profª Berenice C. Damasceno


Vejamos agora o conceito de independência para três eventos. Dizemos que os eventos A,
B e C são independentes se, e somente se,

P( A ∩ B ) = P( A ) . P( B )

P ( A ∩ C ) = P( A ) . P( C)

P( B ∩ C ) = P( B ) . P( C)

P( A ∩ B ∩ C) = P( A ) . P( B ) . P( C)

Esta definição pode ser estendida para um número finito qualquer de eventos
independentes.

Noções de Probabilidade e Estatística 69 Profª Berenice C. Damasceno


11.6 TEOREMA DE BAYES

Uma das relações mais importantes envolvendo probabilidades condicionais é dada pelo teorema
de Bayes, que expressa uma probabilidade condicional em termos de outras probabilidades
condicionais e marginais. Vamos introduzi-lo através de um exemplo.
Exemplo: Temos 5 urnas exatamente iguais, cada uma com 6 bolas. Duas dessas urnas (tipo C1)
têm 3 bolas brancas, duas outras (tipo C2) têm 2 bolas brancas, e a última urna (tipo C3) tem 6
bolas brancas. Escolhemos uma urna ao acaso e dela retiramos uma bola. Qual a probabilidade da
urna escolhida ser do tipo C3, sabendo-se que a bola sorteada é branca?
Na figura abaixo estão esquematizados o espaço amostral e os eventos de interesse.

C1 C2 C3
1 2 3 4 5

C
O B
R

BC
S

Queremos encontrar P(C3|B), sabendo que


2 3 1
P (C1 ) = P ( B | C1 ) = =
5 6 2
2 2 1
P( C 2 ) = P( B | C 2 ) = =
5 6 3
1 6
P (C 3 ) = P( B | C 3 ) = = 1
5 6
Da definição de probabilidade condicional, temos:
P(C 3 ∩ B) P(C 3 ) . P(B | C3 )
P(C 3 | B) = =
P(B) P(B)
Precisamos agora encontrar o valor de P(B), já que o numerador é conhecido. Como C1, C2 e C3
são eventos mutuamente exclusivos, e reunidos formam o espaço amostral completo, podemos
decompor o evento B, na união de três outros, mutuamente exclusivos, ou seja:
B = ( C1 ∩ B ) ∪ ( C 2 ∩ B ) ∪ (C 3 ∩ B )
e então

Noções de Probabilidade e Estatística 70 Profª Berenice C. Damasceno


P ( B ) = P ( C1 ∩ B ) + P (C 2 ∩ B ) + P (C 3 ∩ B ) =
= P ( C1 ) . P ( B | C1 ) + P ( C 2 ) . P ( B | C 2 ) + P (C 3 ) . P ( B | C 3 ) =
2 1 2 1 1 8
= . + . + .1 =
5 2 5 3 5 15

Substituindo este resultado na equação de P(C3|B), obtemos:


1
.1
P(C 3 ) . P(B| C 3 ) 5 3
P(C 3 |B) = = =
P(B) 8 8
15
Podemos agora generalizar os resultados acima do seguinte modo: seja C1, C2, ..., Cn uma
partição do espaço amostral S, isto é,
Ci ∩ Cj = ∅, i ≠j, e C1 ∪ C2 ∪ ... ∪ Cn = S;

E consideremos A um evento qualquer. Também são conhecidos P(Ci) e P(A|Ci) para i = 1, 2,...., n.
Então, temos o seguinte resultado, ilustrado pela figura a seguir.

Teorema de Bayes – A probabilidade de ocorrência de um dos eventos Ci, dado que ocorreu o
evento A, é dado por:

P (C i ) . P ( A | C i )
P( C i | A ) =
n
∑ P(C j ) . P( A | C j )
j =1

onde , i = 1, 2, ..., n.

Exemplo: Para selecionar seus funcionários, uma empresa oferece aos candidatos um curso de
treinamento durante uma semana. Ao final, eles são submetidos a uma prova e 25% são
classificados como bons (B), 50% como médios (M) e os restantes 25% como fracos (F).

Noções de Probabilidade e Estatística 71 Profª Berenice C. Damasceno


Como medida de economia, o departamento de seleção pretende substituir o treinamento
por um teste contendo perguntas envolvendo conhecimentos gerais e específicos. Mas,
para isso, gostaria de conhecer qual a probabilidade de que um indivíduo aprovado no
teste fosse considerado fraco, caso fizesse o curso. Assim, nesse ano antes do início do
curso, os candidatos foram submetidos ao teste e, de acordo com os resultados,
receberam o conceito aprovado (A) ou reprovado (R). Ao final do curso, obtiveram as
seguintes probabilidades condicionais:
P(A|B) = 0,80 P(A|M) = 0,50 P(A|F) = 0,20

Queremos encontrar P(F|A), e pelo teorema de Bayes esta é dada por

P( F ) . P( A | F )
P( F | A ) = =
P( B ) . P( A | B ) + P ( M ) . P ( A | M ) + P ( F ) . P( A | F )
(0,25) . (0,20)
= = 0,10
(0,25) . (0,80) + (0,50) . (0,50) + (0,25) . (0,20)
Então, apenas 10% dos aprovados é que seriam classificados como fracos durante o
curso. De modo análogo, podemos encontrar:
P(B|A) = 0,40 e P(M|A) = 0,50
que seriam subsídios valiosos para ajudar a decisão de substituir o treinamento pelo teste.

11.7 ABORDAGEM TABULAR DO TEOREMA DE BAYES

O cálculo de uma probabilidade condicional pelo Teorema de Bayes, muitas vezes é


facilitado utilizando-se uma abordagem tabular. Nessa abordagem uma tabela com cinco
colunas será montada. Os passos para a sua montagem são os seguintes:

(1º) Na 1ª coluna são colocados os eventos mutuamente exclusivos para os quais as


probabilidades posteriores são desejadas (Ai).
(2º) Na 2ª coluna são colocadas as probabilidades prévias para esses eventos (P(Ai)).
(3º) Na 3ª coluna são colocadas as probabilidades condicionais da nova informação
dada para cada evento (P(B|Ai)).

Noções de Probabilidade e Estatística 72 Profª Berenice C. Damasceno


(4º) Na 4ª coluna são calculadas as probabilidades associadas para cada um dos
eventos e a nova informação B, usando-se a lei da multiplicação. Essas
probabilidades associadas são encontradas multiplicando-se as probabilidades
prévias na coluna 2 pelas probabilidades condicionais na coluna 3, isto é,
P(Ai ∩ B) = P(Ai) . P(B|Ai)
(5º) É feita, então, a soma das probabilidades associadas na coluna 4. A soma é a
probabilidade da nova informação P(B).
(6º) Na 5ª coluna, calcular as probabilidades posteriores usando a relação básica de
probabilidade condicional:
P ( Ai ∩ B )
P ( Ai | B ) =
P( B)

No exemplo anterior, aplicando-se essa abordagem, teremos a seguinte a tabela:

Eventos Probabilidades Probabilidades Probabilidades Probabilidades


Prévias Condicionais Associadas Posteriores

B P(B) = 0,25 P(A|B) = 0,80 P(B). P(A|B) = 0,20


P( B | A) = = 0,40
0,25.0,80 = 0,20 0,50
M P(M) = 0,50 P(A|M) = 0,50 P(M). P(A|M) = 0,25
P( M | A) = = 0,50
0,50.0,50 = 0,25 0,50
F P(F) = 0,25 P(A|F) = 0,20 P(F). P(A|F) = 0,25.0,20 0,05
P( F | A) = = 0,10
= 0,05 0,50
_______ _______ _______
1,00 P(A) = 0,50 1,00

OBSERVAÇÕES:
- O teorema de Bayes é usado extensivamente nas análises de decisões. As
probabilidades prévias são freqüentemente estimativas subjetivas fornecidas por um
tomador de decisão. A informação amostral é obtida e as probabilidades posteriores
são calculadas para uso no desenvolvimento de uma estratégia de decisão.
- Um evento e seu complemento são mutuamente exclusivos e suas uniões formam
uma partição. Assim, o teorema de Bayes é sempre aplicável para o cálculo das
probabilidades posteriores de um evento e seu complemento.

Noções de Probabilidade e Estatística 73 Profª Berenice C. Damasceno


EXERCÍCIOS
1- No exemplo da página 68, que trata das urnas, elabore a tabela segundo a
abordagem tabular para chegar aos valores das probabilidades posteriores.
2- A probabilidade do time de futebol São Paulo ganhar uma partida quando chove é
de 0,7 e quando não chove é de 0,8. No mês de setembro passado, a probabilidade de
chuva foi de 0,6. Sabendo-se que o São Paulo jogou uma partida em setembro e ganhou,
qual a probabilidade de ter chovido no dia desse jogo?
3- M. D. Computing (maio de 1991) descreve o uso do teorema de Bayes e o uso da
probabilidade condicional no diagnóstico médico. As probabilidades prévias de doenças
são baseadas na avaliação dos médicos de variáveis tais como localização geográfica,
influência sazonal, ocorrência de epidemias e assim por diante. Suponha que se acredite
que um paciente tenha uma de duas doenças, denotadas como D1 e D2 com P(D1) = 0,60 e
P(D2) = 0,40 , e que a pesquisa médica tenha determinado a probabilidade associada com
cada sintoma que pode acompanhar as doenças. Suponha que, dadas as doenças D1 e D2,
as probabilidades de que o paciente terá os sintomas S1, S2 ou S3 são como segue:
S1 S2 S3
D1 P(S1|D1) = 0,15 P(S2|D1) = 0,10 P(S3|D1) = 0,15
D2 P(S1|D2) = 0,80 P(S2|D2) = 0,15 P(S3|D2) = 0,03
Depois que constatar que um certo sintoma esteja presente, o diagnóstico médico pode ser
auxiliado encontrando-se as probabilidades revisadas de cada doença em particular.
Calcule as probabilidades posteriores de cada doença dadas as seguintes constatações
médicas:
a) O paciente tem o sintoma S1.
b) O paciente tem o sintoma S2.
c) O paciente tem o sintoma S3.
4- Uma companhia produz circuitos integrados em três fábricas, I, II e III. A fábrica I
produz 40% dos circuitos, enquanto a II e a III produzem 30% cada uma. As probabilidades
de que um circuito integrado produzido por estas fábricas não funcione são 0,01, 0,04 e
0,03, respectivamente. Escolhido um circuito da produção conjunta das três fábricas, qual a
probabilidade do mesmo não funcionar?

Noções de Probabilidade e Estatística 74 Profª Berenice C. Damasceno


12.0 TÉCNICAS DE CONTAGEM

Para utilizar o método clássico da probabilidade, é preciso conhecer o número total de


resultados possíveis de um experimento.

Uma das possibilidades é o uso das árvores de decisão, mas quando o número de
resultados é grande, essa lista se torna muito trabalhosa; é necessário então recorrer a
fórmulas matemáticas para determinar o número total de resultados possíveis.

Suponhamos que um estudante esteja fazendo um teste de 20 questões do tipo


“verdadeiro-ou-falso”. Suponhamos ainda que ele, não tenha estudado nada, esteja
dando todas as respostas na base do palpite. Qual a probabilidade de ele responder
corretamente todo o teste?

A primeira coisa a fazer é determinar o número total de resultados possíveis.

Em segundo lugar devemos explorar suas diversas versões. Imaginemos que o teste
consista de apenas:

Uma questão temos V ou F


Duas questões temos VV, VF, FV, FF
Três questões temos VVV, VVF, VFF, VFV, FVF, FVV, FFV, FFF

Conclui-se:
Número de questões : 1 2 3 4
Número de resultados : 2 4 8 16

Nota-se que, se o número de itens for grande, a listagem se tornará praticamente


impossível.

Em seguida, podemos ver um diagrama de árvore para determinar todos os arranjos


possíveis.

Noções de Probabilidade e Estatística 75 Profª Berenice C. Damasceno


QUESTÃO N°1 QUESTÃO N°2 QUESTÃO N°3 RESULTADOS

V VVV

V F VVF

V V V FV

F F V FF

V FV V
V F FV F
F

V FFV
F
F FFF

Além disso, o que realmente é necessário é determinar o número total de resultados;


nada se tem a ganhar identificando cada resultado.

12.1 O PRINCÍPIO DA MULTIPLICAÇÃO

O diagrama mostra que cada questão dobra o número total de resultados possíveis (com
duas alternativas V ou F) temos:

NÚMERO DE QUESTÕES TOTAL DE RESULTADOS


1 2=2
2 2 x 2 =4
3 2x2x2=8
4 2 x 2 x 2 x 2 = 16

Noções de Probabilidade e Estatística 76 Profª Berenice C. Damasceno


Se fossem quatro escolhas para cada questão:

NÚMERO DE QUESTÕES TOTAL DE RESULTADOS


1 4=4
2 4 x 4 =16
3 4 x 4 x 4 = 64
4 4 x 4 x 4 x 4 = 256
Para solucionar o exercício do teste, teremos:
2 x 2 x 2 x 2 x 2 x . . . . . . . x 2 = 220 = 1.048.576
1 2 3 4 5 ..... . 20

De um modo geral, se há “n” decisões seqüenciais, cada uma com “m” escolhas, o número
total de resultados é mn.

12.2 PERMUTAÇÃO, ARRANJO E COMBINAÇÃO

Quando a ordem em que os elementos se dispõem é importante, o número total de


resultados possíveis é conhecido como Arranjo ou Permutação. Quando a ordem não
interessa, o número total de resultados possíveis é designado como Combinação.

Para o uso na análise combinatória usaremos o número fatorial representado pelo símbolo
! como por exemplo 4! lê-se “quatro fatorial” e significa 4 x 3 x 2 x 1 = 24.

Outros exemplos:

5! = 5 x 4 x 3 x 2 x 1 = 120
12! = 12 x 11 x 10 x 9 x 8 x 7 x ..............x 1 = 479.001.600

Os fatoriais crescem de modo extremamente rápido, à medida que aumenta o número-


base.
Felizmente, quase nunca é necessário utilizar-se completamente os fatoriais, pois eles
aparecem em grupos, permitindo cancelamentos:

Noções de Probabilidade e Estatística 77 Profª Berenice C. Damasceno


5! = 1
7! 42

4! = 12
2!

5! = 10
2! 3!

Às vezes os fatoriais podem envolver soma e subtração. Exemplos:

( 5 - 3 )! = 2! e não ( 5! - 3! )
( 9 - 2 )! = 7!
( 3 + 1)! = 4!
8! = 8! = 8 x 7 x 6 x 5! = 8x7x6 = 56
3! ( 8 – 3 )! 3! . 5! 3 x 2 x 5! 3x2

O fatorial de zero é igual a um 0! = 1.


O fatorial de 1 é igual a um 1! = 1.

ARRANJOS

São agrupamentos que podem variar pela ordem ou natureza dos elementos. Quando se
consideram n elementos distintos tomados x a x chamamos arranjo ou agrupamentos
“eneários” que se podem formar com esses n elementos, dispomos de todas as formas
possíveis de modo que dois arranjos quaisquer difiram ao menos pela ordem dos
elementos.

Assim, os arranjos possíveis com as letras A, B e C são A 3,2 (3 elementos dois a dois)
A 3,2 = AB; BA; AC; CA, BC; CB.

E com os números: 2, 6 e 8 podem ser feitos os seguintes arranjos A 3,2


A 3,2 = 26; 28; 62; 68; 82; 86.

Noções de Probabilidade e Estatística 78 Profª Berenice C. Damasceno


Portanto:
n!
A n, x =
(n − x )!

Outro exemplo: Se há sete cavalos num páreo, quantos arranjos há considerando 1°,2° e
3° lugares?

Ou seja, 7 elementos tomados 3 a 3


A 7,3 = 7! = 7! = 7 x 6 x 5 x 4! = 7 x 6 x 5 = 210
( 7 – 3 )! 4! 4!

PERMUTAÇÃO

Denomina-se permutação aos arranjos de objetos tomados n a n. Neste caso cada objeto
entra só uma vez em todos os grupos.

Em geral o número de permutações distintas com n itens, dos quais n1 são indistinguíveis
de um tipo, n2 de outro tipo, etc, é:

n!
Pnn 1 , n 2 , ..., n K = (permutação com repetições)
(n 1 ! ) (n 2 ! ) (n 3 ! ) ... (n k ! )

Exemplo: Quantas permutações distintas de 3 letras podemos formar com as letras:


RRRR UUU N
4 3 1

Solução
Há 8 letras : 4Rs 3Us 1N dai:

8!
P84 3 1 = = 280
(4! ) ( 3! ) (1! )

Noções de Probabilidade e Estatística 79 Profª Berenice C. Damasceno


COMBINAÇÃO

Chama-se combinação quando não interessa a ordem para denotar o número de


agrupamentos distintos possíveis.

Exemplo: é a escolha de 2 tipos de vegetal de um cardápio com 5 tipos. A escolha de


batata e cenoura é a mesma que cenoura e batata.

De um modo geral, para agrupamentos de tamanho x extraídos de uma lista de n itens, o


Número de combinações possíveis é:

Cn, x =
n!
x! (n − x)!
= nx()
Quantos comitês distintos, de 3 pessoas cada um, podemos formar com um grupo de 10
pessoas?

10! 10! 10.9.8.7!


C10 , 3 = = = = 120
3!(10 − 3)! 3! 7! 3.2.7!

De quantas maneiras podemos formar um comitê de 1 mulher e 2 homens, de um total de


4 mulheres e 6 homens.

4! 6!
Mulheres e Homens => C 4 ,1 . C 6 , 2 = . = 4 . 15 = 60
1! 3! 2! 4!

Noções de Probabilidade e Estatística 80 Profª Berenice C. Damasceno


REGRAS DE CONTAGEM

REGRA DA MULTIPLICAÇÃO: o produto do número de escolhas para uma seqüência de


n
decisões m , onde m = número de escolhas e n = decisões seqüenciais.

ARRANJOS: Número de agrupamentos em que interfere a ordem

n!
A n, x =
(n − x )!

PERMUTAÇÃO COM REPETIÇÕES (OU DISTINGÜÍVEIS): alguns itens são idênticos, e a


ordem é importante.

n!
Pnn 1 , n 2 , ..., n K =
(n 1 ! ) (n 2 ! ) (n 3 ! ) ... (n k ! )

OBS: Permutação simples: Pn = n!

COMBINAÇÕES: a ordem não importa.

Cn, x =
n!
x! (n − x)!
= nx ()

Noções de Probabilidade e Estatística 81 Profª Berenice C. Damasceno


EXERCÍCIOS
1- Calcule:
a- 2! b- 3! c- 10! d- 1! e- 0!

2- Calcule:

 3  4  5  9
a-   b-   c-   d-  
 2  4 1   6

3- Determine o número de arranjos:

a- A 3,2 b- A 4,4 c- A 5,1 d- A 9,6 e- A 1,0

4- Um vendedor de automóveis deseja impressionar os possíveis compradores com o


maior Número de combinações diferentes possíveis. Um modelo pode ser dotado de
três tipos de motor, dois tipos de transmissão, cinco cores externas e duas internas.
Quantas são a escolhas possíveis?

5- Em um determinado Estado, as placas de licença constam de três letras e quatro


algarismos. Quantas placas diferentes podemos formar admitindo-se o uso de todas as
(26 letras) e os (10 algarismos)?

6- Quantas permutações distintas podem ser feitas com as letras da palavra


ESTATÍSTICA?

7- Se um torneio de basquetebol consiste de 36 times, de quantas maneiras podem ser


conquistados os três primeiros lugares?

8- De quantas maneiras diferentes podemos escolher um comitê de cinco pessoas dentre


oito?

9- A Pizzaria ISA oferece as seguintes escolhas de pizza: presunto, cogumelos, pimentão,


enchovas e muzzarella. De quantas maneiras podemos escolher dois tipos diferente de
pizza?

Noções de Probabilidade e Estatística 82 Profª Berenice C. Damasceno


13.0 VARIÁVEL ALEATÓRIA E DISTRIBUIÇÃO DE
PROBABILIDADE

13.1 DEFINIÇÃO DE VARIÁVEL ALEATÓRIA


Introduzidas às noções fundamentais sobre a teoria das probabilidades, podemos
passar às chamadas Distribuições de Probabilidades.
Uma distribuição de probabilidades é uma distribuição de freqüência relativa para
os resultados de um espaço amostral (isto é, para os resultados de uma variável
aleatória); que mostra a proporção das vezes em que a variável aleatória tende a assumir
cada um dos diversos valores.
Consideremos a variável aleatória “número de caras em duas jogadas de uma
moeda”, eis a lista dos pontos do espaço amostral e os valores correspondentes à v.a.:
(Sendo K = cara e C = coroa)
Resultados Valor de v.a.
CC 0
CK 1
KC 1
KK 2

Se a moeda é equilibrada, P(K) = P(C) = ½. As probabilidades dos diversos resultados são:

Resultados Pobabilidade do Resultado Número de Caras


P(x)
CC 1 1 1 0
. = = 0,25
2 2 4
CK 1 1 1 1
. = = 0,25 =>0,50
2 2 4
KC 1 1 1 1
. = = 0,25
2 2 4
KK 1 1 1 2
. = = 0,25
2 2 4

Noções de Probabilidade e Estatística 83 Profª Berenice C. Damasceno


Assim, pois, a distribuição de probabilidades para o número de caras em duas jogadas de
uma moeda é:

Número de Caras P(x)


0 0,25
1 0,50
2 0,25

1,00

Nota-se que a soma de todas as probabilidades é 1,00, como é de se esperar, pois os


resultados apresentados são mutuamente exclusivos e coletivamente exaustivos. A
mesma distribuição pode ser apresentada em forma acumulada.
Número de Caras P(x ou menos)
0 0,25
1 0,75
2 1,00

Graficamente, as distribuições de probabilidade e acumulada se apresentam:

P
1,00 R 1,00
O 1,OO
B
A
P B
R 0,75 I 0,75
O L 0,75
B I
A D
B A
I 0,5 D 0,5
L 0,5 E
I
D A
A C
D 0,25 U 0,25
E 0,25 0,25 M 0,25
U
L
A
0 D 0
0 1 2 A 0 1 2
NÚMERO DE CARAS
NÚMERO DE CARAS

Noções de Probabilidade e Estatística 84 Profª Berenice C. Damasceno


Portanto concluímos que uma variável aleatória (v.a.) fornece um meio para se descrever
por valores numéricos os resultados experimentais. Uma v.a. é uma descrição numérica do
resultado de um experimento.
Uma v.a. pode ser classificada como discreta ou contínua, dependendo dos valores
numéricos que ela assume.

VARIÁVEIS ALEATÓRIAS DISCRETAS

Uma v.a. que pode assumir tanto um número finito de valores como infinita seqüência de
valores tais como 0, 1, 2, 3, ... é denominada variável aleatória discreta. Por exemplo,
considere o experimento de um contador que faz um exame público. O exame tem quatro
partes. Podemos definir a v.a. discreta como x ≡ o número de partes em que foi aprovado
no exame. Essa v.a. discreta pode assumir o número finito de valores 0, 1, 2, 3 ou 4.
Como outro exemplo, considere o experimento de carros que chegam a um posto de
pedágio. A v.a. de interesse é x ≡ o número de carros que chega durante o período de um
dia. Os possíveis valores de x vêm da seqüência de inteiros 0, 1, 2 e assim por diante.
Portanto x é uma v.a. discreta que assume um dos valores nessa seqüência infinita.
Embora muitos experimentos tenham resultados que são naturalmente descritos por
valores numéricos, outros não o são. Por exemplo, uma questão de um levantamento pode
solicitar a um indivíduo que relembre a mensagem de um recente comercial de televisão.
Esse experimento poderia ter dois resultados possíveis: o indivíduo não pode lembrar a
mensagem e o indivíduo pode lembrar a mensagem. Podemos ainda descrever esses
resultados experimentais numericamente, definindo-se a v.a. discreta x como segue: seja x
= 0 se o indivíduo não pode lembrar a mensagem e x = 1 se o indivíduo pode lembrar a
mensagem. Os valores numéricos para essa v.a. são arbitrários (poderíamos usar 5 e 10),
mas eles são aceitáveis em termos da definição de uma v.a..
Outros exemplos de v.a. discretas são dados a seguir:

Noções de Probabilidade e Estatística 85 Profª Berenice C. Damasceno


Exemplos de v.a. discretas
Experimento v.a. (x) Possíveis valores para v.a.
Contatar cinco clientes Número de clientes que 0, 1, 2, 3, 4, 5
colocam um pedido de
compra
Inspecionar um embarque Número de rádios 0, 1, 2, ..., 49, 50
de 50 rádios defeituosos
Operar um restaurante por Número de clientes 0, 1, 2, 3, 4, ...
um dia
Vender um automóvel Gênero do cliente 0 se masculino,
1 se feminino

VARIÁVEIS ALEATÓRIAS CONTÍNUAS


Uma v.a. que pode assumir qualquer valor numérico em um intervalo ou numa coleção de
intervalos é chamada v.a. contínua. Resultados experimentais que são baseados em
escalas de medidas tais como peso, tempo, distância e temperatura podem ser descritos
por v.a. contínuas. Por exemplo considere, o experimento de monitorar as chamadas
telefônicas que chegam a um escritório de reclamações de uma grande empresa de
seguros. Suponha que a v.a. de interesse seja x ≡ o tempo em minutos entre chamadas
consecutivas recebidas. Essa v.a. pode assumir qualquer valor no intervalo x ≥ 0.
Realmente, um número infinito de valores são possíveis para x, incluindo valores tais como
1,27 minutos, 2,471 minutos, 4,5555 minutos e assim por diante. Como um outro exemplo,
considere um trecho de 144 Km de uma auto-estrada interestadual ao norte de Atlanta,
Geórgia, nos USA. Para um serviço de emergência localizado em Atlanta, podemos definir
a v.a. como x ≡ a localização do próximo acidente de trânsito ao longo desse trecho da
auto-estrada. Neste caso, x seria uma v.a. contínua que assume qualquer valor no intervalo
0 ≤ x ≤ 144. Outros exemplos são apresentados na tabela abaixo.

Noções de Probabilidade e Estatística 86 Profª Berenice C. Damasceno


Exemplos de v.a. contínuas

Experimento v.a. (x) Possíveis valores para v.a.


Operar um banco Tempo entre as chegadas x ≥ 0 (min)
dos clientes em minutos
Encher um recipiente de Número de ml 0 ≤ x ≤ 343 (ml)
refrigerante (máx = 343 ml)
Trabalhar num projeto para Porcentagem de término do 0 ≤ x ≤ 100 (%)
a construção de uma nova projeto após 6 meses
biblioteca
Testar um novo processo Temperatura quando a 65 ≤ x ≤ 100 (ºC)
químico reação desejada ocorre
(mín 65º C e máx 100º C)

Observação: Um modo de determinar se uma v.a. é discreta ou contínua é pensar nos


valores da v.a. como pontos sobre um segmento de reta. Escolha 2 pontos que
representam valores da v.a.. Se todo o segmento de reta entre os 2 pontos também
representa possíveis valores para a v.a., então a v.a. é contínua.

Noções de Probabilidade e Estatística 87 Profª Berenice C. Damasceno


EXERCÍCIO:
Uma série de experimentos e v.a. ‘s associadas são listados a seguir. Em cada caso,
identifique os valores que a v.a. pode assumir e estabeleça se a v.a. é discreta ou
contínua.

Experimento v.a. (x)


a. Fazer um exame com 20 questões Número de questões respondidas
corretamente
b. Observar carros que chegam a um posto Número de carros que chegam ao posto de
de pedágio, no espaço de uma hora pedágio
c. Auditar 50 declarações de imposto Número de declarações que contêm erros
d. Observar o trabalho de um operário Número de horas não produtivas em um dia
de trabalho de 8 horas
e. Pesar um carregamento de produtos Número de quilos

DISTRIBUIÇÕES DISCRETAS DE PROBABILIDADE


A distribuição de probabilidade para uma v.a. descreve como as probabilidades estão
distribuídas sobre os valores da v.a.. Para uma v.a. discreta x, a distribuição de
probabilidade é definida por uma função de probabilidade, denotada por f(x). A função de
probabilidade fornece a probabilidade para cada um dos valores da v.a..
Como exemplo de v.a. discreta e sua distribuição de probabilidade, considere as vendas de
automóveis de uma revendedora chamada X-Motors. Nos últimos 300 dias de operação, os
dados de vendas mostram 54 dias sem vendas de automóveis, 117 dias com um
automóvel vendido, 72 dias com dois automóveis vendidos, 42 dias com três automóveis
vendidos, 12 dias com quatro automóveis vendidos e 3 dias com cinco automóveis
vendidos. Suponha que consideremos o experimento de selecionar um dia de operação na
X-Motors. Definimos a v.a. de interesse como x ≡ o número de automóveis vendidos
durante um dia. A partir dos dados históricos conhecidos, sabemos que x é uma v.a.
discreta que pode assumir os valores 0, 1, 2, 3, 4 ou 5. Na notação da função de
probabilidade, f(0) fornece a probabilidade de 0 automóveis vendidos, f(1) fornece a
probabilidade de 1 automóvel vendido e assim por diante. Uma vez que os dados mostram
54 dos 300 dias com 0, atribuímos o valor 54/300 = 0,18 para f(0), indicando que a
probabilidade de 0 automóvel ter sido vendido durante um dia é de 0,18. Analogamente,

Noções de Probabilidade e Estatística 88 Profª Berenice C. Damasceno


podemos calcular as demais funções, mostradas na tabela a seguir.

Distribuição de probabilidade para o número de automóveis vendidos durante um


dia na X-Motors
x f(x)
0 0,18
1 0,39
2 0,24
3 0,14
4 0,04
5 0,01
Total 1,00

No desenvolvimento de uma função de probabilidade para qualquer v.a. discreta, as duas


condições seguintes precisam ser satisfeitas:
1. f(x) ≥ 0
2. ∑ f(x) = 1

O exemplo mais simples de uma distribuição discreta de probabilidade é a distribuição


uniforme de probabilidade. Sua função de probabilidade é dada a seguir:

f(x) = 1/n
onde:
n ≡ o número de valores que a v.a. pode assumir

por exemplo considere o experimento de lançamento de um dado e defina a v.a. x como


sendo o número da face voltada para cima. Existem n = 6 valores possíveis para a v.a.; x =
1, 2, 3, 4 , 5, 6. Assim a função de probabilidade para esta v.a. é
f(x) = 1/6 x = 1,2,3,4,5,6

Noções de Probabilidade e Estatística 89 Profª Berenice C. Damasceno


Os valores possíveis da v.a. e as probabilidades associadas são mostrados a seguir:

x f(x)
1 1/6
2 1/6
3 1/6
4 1/6
5 1/6
6 1/6

VALOR ESPERADO E VARIÂNCIA DE UMA V.A. DISCRETA

VALOR ESPERADO

O valor esperado, ou média, de uma v.a. discreta é a medida de posição central para a
v.a.. A expressão matemática para o valor esperado da v.a. x é dada por:

E(x) = µ = ∑ x.f(x)

Voltando ao exemplo anterior da X-Motors, temos:

Cálculo do valor esperado para o nº de automóveis vendidos durante um


dia na X-Motors
x f(x) x.f(x)
0 0,18 0,00
1 0,39 0,39
2 0,24 0,48
3 0,14 0,42
4 0,04 0,16
5 0,01 0,05
Total 1,00 1,50

Noções de Probabilidade e Estatística 90 Profª Berenice C. Damasceno


Portanto E(x) = µ = ∑ x.f(x) = 1,50.

VARIÂNCIA

Enquanto o valor esperado fornece o valor médio para a v.a., freqüentemente


necessitamos de uma medida de variabilidade ou de dispersão. A expressão matemática
para a variância é:

Var(x) = σ2 = ∑ (x - µ)2 . f(x)

E o desvio padrão será:

σ= σ2

No exemplo anterior temos:

Cálculo da variância para o nº de automóveis vendidos durante um dia


na X-Motors
(x - µ) . f(x)
2
x f(x)
0 0,18 0,4050
1 0,39 0,0975
2 0,24 0,0600
3 0,14 0,3150
4 0,04 0,2500
5 0,01 0,1225
Total 1,00 1,2500

Portanto Var(x) = σ2 = ∑ (x - µ)2 . f(x) = 1,25.

Noções de Probabilidade e Estatística 91 Profª Berenice C. Damasceno


EXERCÍCIOS:

1 - A seguinte tabela é uma distribuição de probabilidade para v.a. x:

x f(x)
3 0,25
6 0,50
9 0,25
Total 1,00

a) Calcule E(x), o valor esperado de x.


b) Calcule σ2, a variância de x.
c) Calcule σ, o desvio padrão de x.

2 - A seguinte tabela é uma distribuição de probabilidade para v.a. y:

y f(y)
2 0,20
4 0,30
7 0,40
8 0,10
Total 1,00

a) Calcule E(y).
b) Calcule Var(y) e σ.

3 - Um serviço voluntário de ambulâncias atende de 0 a 5 chamadas de serviço em


qualquer dia. A distribuição de probabilidade para o número de chamadas de serviço é:

Noções de Probabilidade e Estatística 92 Profª Berenice C. Damasceno


Número de chamadas Probabilidade
de serviço
0 0,10
1 0,15
2 0,30
3 0,20
4 0,15
5 0,10

a) Qual o número esperado de chamadas de serviço?


b) Qual é a variância no número de chamadas de serviço? Qual é o desvio
padrão?

4 - O Statistical Abstract of the United States, 1997, mostra que o número médio de
aparelhos de televisão por família é de 2,3. Considere que a distribuição de
probabilidade para o número de aparelhos de televisão por família é mostrado a seguir:

x f(x)
0 0,01
1 0,23
2 0,41
3 0,20
4 0,10
5 0,05

a) Calcule o valor esperado do número de aparelhos de televisão por família e


compare-o com a média relatada no Statistical Abstract.
b) Qual a variância e o desvio padrão do número de aparelhos por família?

Noções de Probabilidade e Estatística 93 Profª Berenice C. Damasceno


13.2 DISTRIBUIÇÃO BINOMIAL

A distribuição binomial de probabilidade é uma distribuição discreta de probabilidade que


tem muitas aplicações. Ela está associada a um experimento de múltipla etapa que
chamamos de experimento binomial.

Um experimento binomial

Um experimento binomial tem as quatro seguintes propriedades:

(1ª) O experimento consiste de uma seqüência de n ensaios idênticos.


(2ª) Dois resultados são possíveis em cada ensaio. Referimo-nos a um como um
sucesso e ao outro como um fracasso.
(3ª) A probabilidade de um sucesso, denotado por p, não se modifica de ensaio para
ensaio. Conseqüentemente, a probabilidade de um fracasso, denotado por q (onde
q = 1 – p), não se modifica de ensaio para ensaio.
(4ª) Os ensaios são independentes.

Se as propriedades 2, 3 e 4 estão presentes, dizemos que os ensaios são gerados por um


processo de Bernoulli. Se além disso, a propriedade 1 está presente, dizemos que temos
um experimento binomial.

Suponhamos agora o experimento E4= “Lançamento de 4 moedas”. A tabela abaixo


mostra todas as possibilidades de combinações cara/coroa, os eventos que estas
combinações originam e os valores correspondentes da variável aleatória X : Número de
vezes que sai “Cara”.

Noções de Probabilidade e Estatística 94 Profª Berenice C. Damasceno


POSSIBILIDADE MOEDA N° EVENTO VALOR DE X
N° 1, 2, 3, 4 ( N° DE VEZES QUE SAI CARA)
1 CCCC 0K e 4C 0

2a CCCK 1K e 3C 1
2b CCKC
2c CKCC
2d KCCC

3a CCKK 2K e 2C 2
3b CKKC
3c KKCC
3d CKCK
3e KCKC
3f KCCK

4a KKKC 3K e 1C 3
4b KKCK
4c KCKK
4d CKKK

5 KKKK 4K e 0C 4

Utilizando as regras do produto para eventos independentes (e) e da adição para eventos
mutuamente exclusivos (ou) é possível calcular as probabilidades associadas aos valores
de X.

A probabilidade de X=0 é obtida pelo conhecimento de termos 4 coroas, sabe-se que a


probabilidade de sair coroa é ½ , a probabilidade final será: 0,5x0,5x0,5x0,5 = 0,0625.

Para o cálculo da probabilidade X=1 deve-se trabalhar com o evento “1K e 3C” como
temos as opções a,b,c,d, que são mutuamente exclusivas, a regra da soma manda
efetuar a adição 0,0625 +0,0625 +0,0625 +0,0625 ou, o que é o mesmo de se efetuar o
produto 4x 0,0625 = 0,25.

Noções de Probabilidade e Estatística 95 Profª Berenice C. Damasceno


Desta forma analogamente temos:

x EVENTO f( x )

0 4 0 4
0 0K e 4C O,0625 = 1 X 0,5 X 0,5 = 1p q

1 3 1 3
1 1K e 3C O,2500 = 4 X 0,5 X 0,5 = 4p q

2 2 2 2
2 2K e 2C O,3750 = 6 X 0,5 X 0,5 = 6p q

3 1 3 1
3 3K e 1C O,2500 = 4 X 0,5 X 0,5 = 4p q

4 0 4 0
4 4K e 0C O,0625 = 1 X 0,5 X 0,5 = 1p q

TOTAL 1,00

n = número de moedas

p = probabilidade de K : P(K) = 0,5

q = 1 – p = probabilidade de C : P(C) = 0,5

Podemos usar a equação:

n! n
= 
x!. (n − x)!  x  combinações de n indivíduos tomados x a x.

Generalizando temos a função binomial f(x):

n!
f ( x) = . p x .q n − x
x!. (n − x )!

Noções de Probabilidade e Estatística 96 Profª Berenice C. Damasceno


Exemplo: Distribuição binomial de x (número de coroas) para n = 10
X Número de n! Distribuição f(x)
“Coroas” em 10 x!(n − x)!
jogadas Amostral

10! 1
10 =1 . = 0,000976
10!(10 − 10)! 1024

10! 1
9 = 10 . = 0,009760
9!(10 − 9)! 1024

10! 1
8 = 45 . = 0,043940
8!(10 − 8)! 1024

10! 1
7 = 120 . = 0,117180
7!(10 − 7)! 1024

10! 1
6 = 210 . = 0,205070
6!(10 − 6)! 1024

10! 1
5 = 252 . = 0,246090
5! (10 − 5)! 1024

10! 1
4 = 210 . = 0,205070
4! (10 − 4)! 1024

10! 1
3 = 120 . = 0,117180
3! (10 − 3)! 1024

10! 1
2 = 45 . = 0,043940
2! (10 − 2)! 1024

10! 1
1 = 10 . = 0,009760
1! (10 − 1)! 1024

10! 1
0 =1 . = 0,000976
0! (10 − 0)! 1024

Total de resultados = 210 = 1024

Noções de Probabilidade e Estatística 97 Profª Berenice C. Damasceno


EXERCÍCIOS:

Use a equação binomial para responder às questões abaixo:

1- Um fabricante de mesas de bilhar suspeita que 2% de seu produto apresenta algum


defeito. Se tal suspeita é correta, determine a probabilidade de que, numa amostra
de nove mesas:
a- Haja ao menos uma defeituosa
b- Não haja nenhuma defeituosa

2- Dos estudantes de um colégio, 41% FUMAM CIGARROS. Escolhem-se seis ao


acaso para darem sua opinião sobre o fumo.
a- Determine a probabilidade de nenhum dos seis estudantes ser fumante.
b- Determine a probabilidade de todos os seis serem fumantes.
c- Qual a probabilidade de ao menos a metade dos seis serem fumantes.

3- Doze por cento dos que reservam lugar num vôo sistematicamente faltam ao
embarque. O avião comporta 15 passageiros. Determine a probabilidade de que
todos os 15 que reservaram lugar compareçam ao embarque

4- Um revendedor de automóveis novos constatou que 80% dos carros vendidos são
devolvidos ao departamento mecânico para corrigir defeitos de fabricação, nos
primeiros 25 dias apos a venda. De 11 carros vendidos num período de 5 dias, qual
é a probabilidade de que:
a. Todos voltem dentro de 25 dias para reparo.
b. Só um não volte

5- Suponha que 8% dos cachorros-quentes vendidos num estádio de futebol sejam


pedidos sem mostarda. Se sete pessoas pedem cachorrão, determine a
probabilidade de que:
a. Todos queiram mostarda
b. Apenas um não a queira.

Noções de Probabilidade e Estatística 98 Profª Berenice C. Damasceno


13.3 DISTRIBUIÇÃO DE POISSON

A chamada Distribuição de Poisson ou de Eventos Raros pode ser considerada um caso


limite da distribuição binomial. Quando “n” é grande e “p” é pequeno podemos usar a
aproximação de Poisson para a distribuição Binomial.
É difícil dar condições precisas para que se possa usar a aproximação de Poisson, ou seja,
o que significa quando “n” é grande e “p” pequeno. Como regra geral (de referência
empírica) podemos usar:

n ≥ 100 e n.p ≤ 10
n = elementos da população
p = probabilidade
Exemplo: n = 150 p = 0,05
Temos a distribuição de Poisson com:
n.p = 150 . (0,05) = 7,5
A equação a ser usada é:

(n. p) x . e − n. p
f ( x) =
x!
sendo e= 2,718 e µ = n.p

Exemplo: Sabe-se que 2% dos livros encadernados em uma certa livraria apresentam
defeitos de encadernação. Utilize a aproximação de Poisson da distribuição Binomial para
achar a probabilidade de que 5 entre 400 livros encadernados nessa livraria apresentam
algum defeito de encadernação.
Temos: n = 400 p = 2% = 0,02 x=5 n.p = 400 . 0,02 = 8
-8
e = 0,000335; temos então:

(8) 5 . e − 8 (32768) (0,000335)


f (5) = = = 0,0915
5! 120
Obs.: A distribuição de Poisson é semelhante à Binomial, diferenciando-se apenas no fato
de que na Binomial os eventos ocorrem por tentativas ou observações fixas, enquanto que
na de Poisson os eventos ocorrem simultaneamente. Ex.; nº de acidentes por dia, clientes
2
por hora, chamadas telefônicas por minuto, defeitos por cm , etc.

Noções de Probabilidade e Estatística 99 Profª Berenice C. Damasceno


Contra-exemplo: Suponhamos que os defeitos em fios para tear possam ser aproximados
por um processo de Poisson com média de 0,2 defeitos por metro (p = 0,2).
Inspecionando-se pedaços de fio de 6 metros de comprimento, determine a probabilidade
de menos de 2 (isto é 0 ,1) defeitos.
Dados: n = 6 p = 0,2 n . p = 6 . 0,2 = 1,2
Para utilizarmos a aproximação de Poisson para a distribuição Binomial devemos ter:
1ª) n ≥ 100. (neste caso n = 6);
2ª) n.p ≤ 10 (neste caso n.p = 6 . 0,2 = 1,2).
Logo a 1ª condição não é verificada, isto implica que não poderemos utilizar Poisson.
Uma solução possível é a utilização da distribuição Binomial, ou seja:
P(x<2) = P(0) + P(1) , onde:
6! 6!
P ( 0) = 0,20 . 0,86 = 1 .1 . 0,86 = 0,2621 e P(1) = 0,21 . 0,85 = 6 . 0,2 . 0,85 = 0,3932
0! 6! 1! 5!

Logo, P(x<2) = 0,6553 ou 65,53% de haver 0 ou 1 defeito.

EXERCICIOS:

1- O departamento de manutenção de computadores de uma Universidade recebe uma


média 5 computadores por dia. Qual a probabilidade que, em determinado dia,
selecionado aleatoriamente, sejam recebidos:
a- Exatamente 3 computaores;
b- Menos de 3 computadores.
2- Se 0,6% dos detonadores fornecidos a um arsenal são defeituosos, utilize a
aproximação de Poisson para a distribuição binomial para determinar a probabilidade de
que, em uma amostra aleatória de 500 detonadores, quatro sejam defeituosos.
3- Em uma certa cidade 3,2% dos habitantes se envolve em, ao menos, um acidente de
carro em um ano. Com o auxilio da aproximação de Poisson para a distribuição
Binomial, determine a probabilidade de que, dentre 200 motoristas escolhidos
aleatoriamente nessa cidade:
a- Exatamente seis se envolvam em ao menos um acidente em um ano;
b- No máximo oito se envolvam em ao menos um acidente em um ano;
c- Cinco ou mais se envolvam em ao menos um acidente em um ano;
4- Suponha que, em média 2% das pessoas sejam canhotas. Encontre a probabilidade de
3 ou mais canhotos em 100 pessoas.

Noções de Probabilidade e Estatística 100 Profª Berenice C. Damasceno


13.4 DISTRIBUIÇÃO NORMAL (ou de GAUSS ou de LAPLACE)

É uma distribuição contínua e simétrica, cujo gráfico tem a forma de um sino. A distribuição
normal é o resultado da atuação conjunta de causas aleatórias.

F (x)

µ - 3σ µ - 2σ µ - 1σ µ µ + 1σ µ + 2σ µ + 3σ

Parâmetros da Distribuição Normal

µ → Média da População
Determinam o formato da curva
σ → Desvio padrão da população

Equação da Função de Probabilidade – A equação da função de probabilidade é dada pela


expressão:
− ( x−µ )2
1 2σ 2
f ( x) = e
σ 2π
Do estudo da estatística conclui-se que:
- a variável x pode assumir qualquer valor real no intervalo - ∞ ≤ x ≤ + ∞
- a variável x obedecerá à uma Distribuição Normal, se a probabilidade de que um
valor x seja menor ou igual a outro x0 for:

Noções de Probabilidade e Estatística 101 Profª Berenice C. Damasceno


x0 − ( x−µ )2
1 2σ 2
P ( x < x0 ) = f ( x0 ) =
σ 2π ∫e
−∞
dx

- a integral desta expressão representa a área compreendida entre - ∞ e x0.

F (x)

-∞ + ∞

X0

Portanto:

“ A probabilidade de ocorrência de um valor menor ou igual à área abaixo da curva, entre


os valores - ∞ e x0 é dada pela equação anterior”.
Os valores π = 3,1416 e e ( número neperiano) = 2,718 são constantes numéricas.

Noções de Probabilidade e Estatística 102 Profª Berenice C. Damasceno


CARACTERÍSTICAS DA CURVA DE DISTRIBUIÇÃO NORMAL

A curva normal obedece necessariamente às seguintes características:

a- A média µ é o valor da variável x para o qual a f(x) é máxima.

b- O desvio padrão σ, é a distância entre a média e o ponto de inflexão da curva.

c- A área total sob a curva normal é igual a 1, pela própria equação da probabilidade.

d- Em virtude da simetria as áreas à direita e à esquerda do valor µ são iguais

DISTRIBUIÇÃO NORMAL PADRONIZADA

Se tomarmos a equação auxiliar:

x−µ
z=
σ
o que significa adotar como origem do eixo z o ponto em que x = µ e como unidade de
escalados z e o desvio padrão σ, teremos transformado a expressão da função das
probabilidades na distribuição normal reduzida:

− z2
1
f ( z) = e 2

σ 2π
Considerando, a partir da equação auxiliar:

dz 1
= ⇒ dx = σ dz
dx σ

Portanto a função da probabilidade, em função de Z, será dada pela expressão:

Noções de Probabilidade e Estatística 103 Profª Berenice C. Damasceno


z0 − z2
1
f ( z) = ∫e
2
dz
2π −∞

As áreas sob a curva permanecem as mesmas, mas agora podem ser tabuladas em
função dos valores de Z (Ver figura abaixo, eixo dos Z). Basta construir a tábua das áreas
para os valores I(z), mostrados na tabela da página 56.

Por exemplo, a área desde Z=0 até Z= 1,0 é I(1,0) = 0,3413 ou 34,13% da área total da
curva; conseqüentemente, dentro do intervalo ± 1 σ temos 68,26% da área total da curva.

Se procurarmos a probabilidade de encontrarmos um valor de “x” dentro do intervalo


µ ± 0,95 onde µ é a média, σ é o desvio padrão da população, teremos:

P(− z0 < z < + z0 ) = P( µ − 0,95σ < z < µ + 0,95σ )


IZ1= 0,3289 It= 0,6578 ou 65,78%.

Apresentamos na tabela abaixo alguns dos mais importantes intervalos de distribuição


normal para aplicações em exercícios de probabilidade na curva normal.

Noções de Probabilidade e Estatística 104 Profª Berenice C. Damasceno


TÁBUAS DE ÁREAS DA CURVA NORMAL

x−µ
A partir da equação auxiliar z= podemos transformar valores de x em valores de z e
σ
em seguida construir uma tabela com resultados das integrais, que corresponde à área sob
a curva x0 intervalo de 0 a Z0 identificada por IZ0.

F (x)

µ - 3( ( - 2( ( - 1( ( ( + 1( ( + 2( ( + 3(

-3 -2 -1 0 1 2 3 Z

Noções de Probabilidade e Estatística 105 Profª Berenice C. Damasceno


Transformação de X em Z

x0 x−µ z0
z=
σ
µ µ −µ
σ 0

µ + 1σ µ +1σ − µ
σ 1

µ + 2σ µ + 2σ − µ
σ 2

µ + 3σ µ + 3σ − µ
σ 3

µ - 1σ µ −1σ − µ
σ -1

µ - 2σ µ − 2σ − µ
σ -2

µ - 3σ µ − 3σ − µ
σ -3

Noções de Probabilidade e Estatística 106 Profª Berenice C. Damasceno


IZ0

0 Z0

AREAS IZ0 = P (0 ≤ z ≤ Z0) para Z0= (x - µ)/ σ


Z0 Z0 Z0 Z0 Z0 Z0
IZ0 IZ0 IZ0 IZ0 IZ0 IZ0
0,00 0,0000 0,60 0,2257 1,20 0,3849 1,80 0,4641 2,40 0,4918 3,00 0,4987
0,05 0,0199 0,65 0,2422 1,25 0,3944 1,85 0,4678 2,45 0,4929 3,05 0,4989
0,10 0,0398 0,70 0,2580 1,30 0,4032 1,90 0,4713 2,50 0,4938 3,10 0,4990
0,15 0,0596 0,75 0,2734 1,35 0,4115 1,95 0,4744 2,55 0,4946 3,15 0,4992
0,20 0,0793 0,80 0,2881 1,40 0,4192 2,00 0,4772 2,60 0,4953 3,20 0,4993
0,25 0,0987 0,85 0,3051 1,45 0,4279 2,05 0,4798 2,65 0,4960 3,25 0,4994
0,30 0,1179 0,90 0,3159 1,50 0,4332 2,10 0,4821 2,70 0,4965 3,30 0,4995
0,35 0,1369 0,95 0,3289 1,55 0,4394 2,15 0,4842 2,75 0,4970 3,35 0,4996
0,40 0,1554 1,00 0,3413 1,60 0,4452 2,20 0,4861 2,80 0,4974 3,40 0,4997
0,45 0,1736 1,05 0,3531 1,65 0,4505 2,25 0,4878 2,85 0,4978 3,50 0,4998
0,50 0,1915 1,10 0,3643 1,70 0,4554 2,30 0,4893 2,90 0,4981 3,70 0,4999
0,55 0,2088 1,15 0,3749 1,75 0,4599 2,35 0,4906 2,95 0,4984 3,90 0,5000

Noções de Probabilidade e Estatística 107 Profª Berenice C. Damasceno


EXERCÍCIOS

1- Trace uma curva normal e sombreie a área desejada a partir das informações:

a- área à direita de z=1,0


b- área da esquerda de z= 1,0
c- área entre z=0 e z=1,5
d- área entre z=0 e z= - 2,9
e- área entre z=1,0 e z= 2,0
f- área entre z= -2,0 e z= 2,0
g- área entre z= 2,5 e z=3,0

2- Ache os valores de z correspondentes às seguintes áreas:

a- área à esquerda de µ para Iz = 0,0596


b- área à esquerda de µ para Iz = 0,2257
c- área à esquerda de µ para Iz= 0,4505 e área à direita de µ para Iz = 0,4861

3- Uma distribuição normal tem média 50 e desvio padrão 5. Que porcentagem da


população estaria provavelmente dentro dos intervalos:

a- P(x ≤ 60)
b- P(35 ≤ x ≤ 62)
c- P(55 ≤ x ≤ 65)
d- P(x ≥ 55)
e- P(35 ≤ x ≤ 45)

Noções de Probabilidade e Estatística 108 Profª Berenice C. Damasceno


4- Suponha uma renda média de uma grande comunidade possa ser razoavelmente
aproximada por uma distribuição normal com media anual de R$ 10.000,00 e desvio
padrão de R$ 2.000,00.
a- Que porcentagem da população terá renda superior a R$ 15.000,00?
b- Numa amostra de 50 assalariados, quantos podemos esperar que tenham
menos de R$ 8.000,00 de renda?

5- Considere um problema semelhante ao anterior, sendo a renda média de um grupo


de trabalhadores igual a R$ 7000,00 e o desvio R$ 800,00 e a distribuição sendo
normal, pede-se:

a- A probabilidade dos trabalhadores ganharem acima de R$ 8000, 00;


b- O limite inferior da renda dos 10 % mais ricos.

6- O adulto americano médio tem 1,75 m de altura. Assuma que o desvio seja 8 cm.
Responda:
a- qual é a probabilidade de que um homem adulto tenha mais de 1,83 m ?
b- qual é a probabilidade de que um homem adulto tenha menos de 1,522 m ?
c- qual é a probabilidade de que um homem adulto tenha entre 1,682 e
1,778 m ?
d- qual é a probabilidade de que um homem adulto não tenha mais de 1,83 m ?

7- O volume de comercialização na Bolsa de Valores de Nova York tem crescido nos


últimos anos. Para as duas primeiras semanas de janeiro de 1998, o volume médio
diário foi de 646 milhões de ações. A distribuição de probabilidade é
aproximadamente normal com desvio de 100 milhões de ações.
a- Qual a probabilidade de que o volume de comercialização será menor de 400
milhões?
b- Qual a probabilidade de que o volume de comercialização excedeu 801
milhões?

Noções de Probabilidade e Estatística 109 Profª Berenice C. Damasceno

Das könnte Ihnen auch gefallen