Probabilidade e Estatística - UNISUL PDF

Universidade Sul de Santa Catarina
Probabilidade e
Estatística
UnisulVirtual
Palhoça, 2016
Créditos
Universidade do Sul de Santa Catarina – Unisul

Reitor
Sebastião Salésio Herdt
Vice-Reitor
Mauri Luiz Heerdt
Pró-Reitor de Ensino, de Pesquisa e de Extensão
Mauri Luiz Heerdt
Pró-Reitor de Desenvolvimento Institucional
Luciano Rodrigues Marcelino
Pró-Reitor de Operações e Serviços Acadêmicos
Valter Alves Schmitz Neto
Diretor do Campus Universitário de Tubarão

Heitor Wensing Júnior
Diretor do Campus Universitário da Grande Florianópolis
Hércules Nunes de Araújo
Diretor do Campus Universitário UnisulVirtual
Fabiano Ceretta
Campus Universitário UnisulVirtual

Diretor
Fabiano Ceretta
Unidade de Articulação Acadêmica (UnA) – Ciências Sociais, Direito, Negócios e Serviços

Amanda Pizzolo (coordenadora)
Unidade de Articulação Acadêmica (UnA) – Educação, Humanidades e Artes
Felipe Felisbino (coordenador)
Unidade de Articulação Acadêmica (UnA) – Produção, Construção e Agroindústria
Anelise Leal Vieira Cubas (coordenadora)
Unidade de Articulação Acadêmica (UnA) – Saúde e Bem-estar Social
Aureo dos Santos (coordenador)
Gerente de Operações e Serviços Acadêmicos

Moacir Heerdt
Gerente de Ensino, Pesquisa e Extensão
Roberto Iunskovski
Gerente de Desenho, Desenvolvimento e Produção de Recursos Didáticos
Márcia Loch
Gerente de Prospecção Mercadológica
Eliza Bianchini Dallanhol
Luiz Arthur Dornelles Júnior
Probabilidade e
Estatística
Livro didático
Revisão e atualização de conteúdo

Joseane Borges de Miranda
3a Edição
Designer instrucional
Karla Leonora Dahse Nunes
Sabrina Bleicher
Eliete de Oliveira Costa
UnisulVirtual
Palhoça, 2016
Copyright © Nenhuma parte desta publicação pode ser reproduzida por
UnisulVirtual 2016 qualquer meio sem a prévia autorização desta instituição.
Livro Digital
Professor conteudista Revisor

Luiz Arthur Dornelles Júnior Contextuar
Revisão e atualização de conteúdo ISNB

Gabriel Oscar Cremona Parma (2ª edição) 978-85-506-0036-9
Joseane Borges de Miranda (3ª edição)
e-ISBN
Designer instrucional 978-85-506-0037-6
Karla Leonora Dahse Nunes
Sabrina Bleicher (2ª edição)
Eliete de Oliveira Costa (3ª edição)
Projeto gráfico e capa

Equipe UnisulVirtual
Diagramador(a)
Caroline Casassola
D75
Dornelles Júnior, Luiz Arthur
Probabilidade e estatística : livro didático / Luiz Arthur Dornelles Júnior ;
revisão e atualização de conteúdo Joseane Borges de Miranda, [ Gabriel Oscar
Cremona Parma] ; design instrucional [Karla Leonora Dahse Nunes], [Sabrina
Bleicher], Eliete de Oliveira Costa. – 3. ed. – Palhoça : UnisulVirtual, 2016.
217 p. : il. ; 28 cm.
Inclui bibliografia.
ISBN 978-85-506-0036-9
e-ISBN 978-85-506-0037-6
1. Estatística. 2. Probabilidades. I. Mirada, Joseane Borges de. II.

Parma, Gabriel Oscar Cremona. III. Nunes, Karla Leonora Dahse. IV.
Bleicher, Sabrina. V. Costa, Eliete de Oliveira. VI. Título.
CDD (21. ed.) 519.5
Ficha catalográfica elaborada pela Biblioteca Universitária da Unisul

Sumário
Introdução | 7
Capítulo 1
Estatística descritiva | 9
Capítulo 2
Medidas de posição e dispersão | 51
Capítulo 3
Probabilidade | 91
Capítulo 4
Amostragem e cálculo de estimativa | 131
Capítulo 5
Regressão Linear simples | 163
Considerações Finais | 177
Referências | 179
Sobre os Professores Conteudistas | 181
Respostas e comentários das atividades de autoavaliação | 183
Anexos | 216
Introdução
Olá! Bem-vindo(a) à disciplina Probabilidade e Estatística.
Dentro desta unidade de aprendizagem você irá estudar o que os profissionais e

cientistas chamam de probabilidade e estatística.
Tendo como base a matemática, esta unidade de aprendizagem trata da

aplicação no cotidiano, em pesquisas e avaliações. Trata também de técnicas
eficientes para organizar e analisar dados e tomar decisões.
Não é objetivo desta unidade de aprendizagem formar estatísticos e, sim, profissionais

com conhecimento técnico para realizar análises e interpretação de dados, além de ter
condições de argumentar, dar suporte e trocar ideias com outros profissionais.
Desta forma, o esperado é que ao final da unidade de aprendizagem você tenha em

suas mãos uma verdadeira “caixa com várias ferramentas” para apoiar suas decisões.
Sinta-se, agora, convidado a estudar para obter todas as “ferramentas” que lhe
serão apresentadas nesta unidade de aprendizagem, e cuide para ordenar as
ferramentas na “caixa”, de modo a poder fazer uso delas quando for necessário.
Bons estudos!
Professor Luiz Arthur Dornelles Jr.

Capítulo 1
Estatística descritiva
Seção 1
Introdução à Estatística
A cada dia, nossa sociedade torna-se mais complexa. Convivemos com os
indicadores econômicos, com a inflação, com a reforma da previdência, com o
controle de qualidade, enfim, deparamo-nos constantemente com situações e
informações sempre mais complexas.
No que se refere à gestão das organizações, a situação não é diferente. Para se

administrar uma empresa, seja pública ou privada, necessitamos de ferramentas
para poder acompanhar a evolução da sociedade e, assim, analisar situações
e informações, bem como dar suporte às nossas decisões. Assim como no
setor público, a Estatística é uma ótima forma para prever e estudar as variáveis
econômicas, tais como juros, inflação, dentre outros.
Por isso, dizemos que a Estatística é um conjunto de ferramentas, as quais,

quando bem empregadas, podem ser de grande utilidade para a gestão de
empresas e no setor público em geral. Hoje em dia, sem a Estatística, não
seríamos capazes de avaliar a variação de preços, da inflação, de consumo, nem
fazer controle de qualidade, pesquisa eleitoral etc.
Para conhecer Estatística, é importante que você compreenda, antes, o

significado da palavra e o seu conceito. A palavra Estatística origina-se do
latim, e o seu radical status, significa estado. Sendo assim, a palavra Estatística
significa “o estudo do estado”. Para entender o conceito de “estudo do estado”,
acompanhe as seguintes definições sobre Estatística:
A Estatística é uma coleção de métodos para planejar

experimentos, obter dados e organizá-los e, deles, extrair
conclusões. (TRIOLA, 1999, p. 2).
9
Capítulo 1
A Estatística está interessada nos métodos científicos para a

coleta, a organização, o resumo, a apresentação e a análise
de dados, bem como na obtenção de conclusões válidas e
na tomada de decisões razoáveis, baseadas em tais análises.
(SPIEGEL, 1994, p. 1).
Estatística é um conjunto de métodos e processos
quantitativos que serve para estudar e medir os fenômenos
coletivos. (SILVA, 1999, p. 11).
Você percebeu que as definições assemelham-se e completam-se? Então, observe,

a seguir, a definição de Estatística adotada neste estudo que começa agora.
A Estatística corresponde a um conjunto de métodos científicos para a coleta,

organização, apresentação e análise de dados, bem como, para a conclusão e tomada
de decisões baseadas em tais análises.
Em termos gerais, convém destacar que a Estatística está dividida em duas partes:
•• Estatística descritiva: aplicada quando você depara-se com uma

quantidade muito grande de dados, e é difícil tirar conclusões sobre o
fenômeno. A Estatística descritiva é usada para reduzir as informações
até o ponto em que se possa interpretar tal fenômeno. O objetivo da
Estatística descritiva é observar fenômenos de mesma natureza, coletar,
organizar, classificar, apresentar, interpretar e analisar dados referentes
ao fenômeno por meio de gráficos e tabelas, além de calcular medidas
de tendência que permitam descrever o fenômeno.
•• Estatística indutiva: aplicada quando é impossível realizar levantamentos
com a totalidade dos objetos de uma pesquisa, seja por tempo, ou por
economia etc., somente uma parcela desses elementos é utilizada para
realizar as observações. Partindo, nesse caso, de uma parcela desses
elementos, a Estatística indutiva chega a conclusões e realiza previsões
sobre elementos em questão (método que se fundamenta na teoria da
probabilidade associada a uma margem de incerteza).
Para a obtenção de resultados confiáveis, que reflitam a realidade dos fatos, é necessário
realizar uma pesquisa, cuidadosamente planejada, com métodos adequados.
O método é um conjunto de meios dispostos convenientemente para se chegar a um fim

que se demarcou. O método estatístico, diante da impossibilidade de manter as causas
constantes, admite as causas presentes, variando-as, registrando essas variações e
procurando determinar, no resultado final, que influências cabem a cada uma delas.
10
Probabilidade e Estatística
Alguns passos precisam ser seguidos para que seja aplicado o método estatístico
e, assim, realizada uma boa pesquisa. Para você entender quais são esses
passos, acompanhe, a seguir, as principais fases.
a. Definição do problema: a primeira fase do trabalho estatístico

consiste em uma definição ou formulação correta do problema a ser
estudado. Nesta fase, você precisa definir:
· O que será pesquisado? Definir o tema e os objetivos de
pesquisa.
· Em que setor geográfico? O público-alvo a ser planejado.
· Como será a amostra? Incluir o cálculo da amostra e as
técnicas de coletas de dados.
b. Planejamento: consiste em determinar o procedimento necessário

para levantar informações sobre o assunto objeto do estudo. Você
deverá definir como serão coletados os dados de pesquisa, já que
isso pode ser feito de várias formas.
· Observação direta: caracteriza-se quando o pesquisador
somente faz observações para coletar os dados necessários
para a pesquisa.
· Entrevista oral: caracteriza-se por estabelecer perguntas
orais a um indivíduo ou grupo de indivíduos. As entrevistas
podem ser classificadas em estruturadas e não estruturadas;
entrevistas estruturadas são aquelas em que o pesquisador
estabelece um roteiro prévio de perguntas. Nas entrevistas
não estruturadas, o pesquisador, por meio de uma conversa
amigável, busca levantar dados que possam ser utilizados em
análise qualitativa, selecionando-se os aspectos mais relevantes
do problema de pesquisa. (RAUEN, 2006).
· Entrevista escrita ou questionário: questionário é uma lista
de indagações escritas, as quais devem ser respondidas por
escrito pelo informante. Sua vantagem é a possibilidade de se
indagarem muitas pessoas ao mesmo tempo. Para entrevistar
uma sala de universitários, basta distribuir as folhas, para
que todos respondam simultaneamente (entrevista de grupo)
(RAUEN, 2006). O questionário é uma forma muito utilizada
na coleta de dados, mas exige ser: completo (responder
tudo), concreto (perguntas claras e objetivas), secreto (sem
identificação) e discreto (perguntas bem formuladas).
11
Capítulo 1
É preciso planejar o trabalho a ser realizado, tendo em vista o objetivo que se

pretende atingir.
c. Coleta de dados: compreende a coleta das informações

propriamente ditas. Formalmente, a coleta de dados refere-se à
obtenção, à reunião e ao registro sistemático de dados com um
objetivo determinado.
d. Apuração dos dados: consiste em reunir os dados por meio de sua
contagem e seu agrupamento.
e. Apresentação dos dados: os dados estatísticos podem ser mais
facilmente compreendidos quando apresentados por meio de uma
representação gráfica, o que permite uma visualização instantânea
de todos os dados.
f. Análise e interpretação de dados: nesta etapa, o interesse maior
reside em tirar conclusões que auxiliam o pesquisador a atingir seu
objetivo, ou seja, encontrar a resposta para a sua pergunta.
Todas essas fases são realizadas quando se cumpre um processo de pesquisa.

Veja a representação no esquema a seguir.
Figura 1.1 – O processo da pesquisa
População Amostra
Produção de
dados
Características Estudo da amostra:

populacionais - tabelas
- gráficos
- medidas
Estatística
Indutiva Características
amostrais
Fonte: Adaptado de Ação Local de Estatística Aplicada − ALEA (1999-2010).
12
População e amostra
Quando você prepara um alimento, pode provar (observar) uma pequena porção.
Nesse procedimento, você está fazendo o processo de amostragem, ou seja,
extraindo do todo (população) uma parte (amostra), com o propósito de inferir
(avaliar) a qualidade de todo o alimento. A partir do exemplo, podemos distinguir
dois importantes conceitos da Estatística descritiva: população e amostra.
População é o conjunto total de elementos com, pelo menos, uma característica em

comum, cujo comportamento interessa estudar.
A definição dos elementos que serão estudados está ligada diretamente às

características levantadas no objetivo da pesquisa, ou seja, é este objetivo que
auxiliará na definição desta população. Estes elementos podem ser:
•• animados: pessoas, animais etc.;

•• inanimados: notas fiscais, produtos industrializados etc.
Em relação ao número de elementos, a população pode ser:
•• finita: quando tem um número limitado de elementos (número de

funcionários de um determinado banco etc.);
•• infinita: quando tem um número ilimitado de elementos (exemplo:
número possível de análises químicas que podem ser feitas em um
rio poluído etc.).
A representação do tamanho da população é dada por N = número de

elementos da população.
São exemplos de definição de população:
•• ao estudar a idade e o sexo de funcionários da empresa A: para definir

a população, devemos considerar todos os funcionários da empresa;
•• ao estudar a qualidade de peças de uma linha de produção da
empresa A: para definir a população, devemos considerar todas as
peças produzidas pela empresa.
Amostra é o conjunto de elementos ou observações, recolhidos a partir de um

subconjunto da população, que se estuda com o objetivo de tirar conclusões para a
população de onde foi recolhida.
13
Capítulo 1
A amostra precisa ser representativa, ou seja, possuir as mesmas características

da população.
A representação do tamanho da amostra é dada por n = número de elementos

da amostra.
Processos estatísticos de abordagem

Ao estudar um fenômeno coletivo, ou seja, um fenômeno que se refere a uma
determinada população, compreendendo um grande número de elementos,
coisas e indivíduos, podemos optar entre os seguintes processos estatísticos:
•• Censo 1: é uma coleção de dados relativos a todos os elementos

de uma população; uma avaliação direta de um parâmetro que
utiliza todos os componentes da população. No Brasil, por
exemplo, o censo é feito de dez em dez anos, momento em que são
pesquisados todos os domicílios brasileiros.
Principais propriedades do censo:
· admite erro processual zero e tem confiabilidade de 100%;

· é caro e lento;
· quase sempre desatualizado;
· nem sempre é viável.
•• Parâmetro: usado para designar alguma característica descritiva

dos elementos da população (percentagem, média etc.).
•• Estimação: é uma avaliação indireta de um parâmetro com base em
um estimador, por intermédio do cálculo de probabilidades. Nesse
caso, utiliza-se uma amostra.
· Principais propriedades da estimação:
· admite erro processual positivo e tem confiabilidade menor do
que 100%;
· é barata e rápida;
· é atualizada;
· é sempre viável.
1 - O censo era considerado uma pesquisa desatualizada pela demora da publicação dos dados, mas a
tecnologia veio para diminuir em muito esse tempo de publicação. No ano de 2010, constatamos que os dados
foram publicados com mais rapidez do que nas décadas anteriores. Acesse o site do Instituto Brasileiro de
Geografia e Estatística (IBGE) e consulte informações da sua cidade e do seu estado: <www.ibge.gov.br>.
14
•• Estimativa: é o valor assumido por certa Estatística (exemplo: 60%

é o valor de estimativa do referido parâmetro).
Amostragem
Como exposto neste capítulo, as pesquisas são realizadas por meio de estudo
dos elementos que compõem uma amostra extraída da população que se
pretende analisar.
A população é o conjunto de indivíduos ou objetos que apresentam, em comum,

determinadas características definidas para o estudo. Amostra é um subconjunto
da população. O estudo de todos os elementos da população possibilita
conhecimento preciso das variáveis que estão sendo pesquisadas; todavia, nem
sempre é possível obter as informações de todos os elementos da população.
Limitações de tempo, custo e as vantagens do uso das técnicas Estatísticas

justificam o uso de planos amostrais. A representatividade da amostra dependerá
do seu tamanho (quanto maior, melhor). O investigador procurará acercar-se de
cuidados, visando à obtenção de uma amostra significativa, ou seja, que de fato
represente toda a população da melhor maneira possível. (FONSECA, 1996).
Observe, a seguir, mais alguns conceitos do processo estatístico, relacionados à

amostragem:
•• Estatística: característica descritiva dos elementos da amostra

(percentagem, média etc.).
•• Erro amostral: é a máxima diferença que o investigador/pesquisador
admite entre a média da população e a média da amostra. Em
pesquisa, admite-se o uso do erro amostral entre 1% a 10%. Observe,
por exemplo, as pesquisas eleitorais, a maioria destas é efetuada com
erro amostral de 2%. Isso significa que pode variar de −2% a +2%.
Quando se diz que dois candidatos estão com empate técnico, isso
quer dizer que, somando ou diminuindo 2%, eles estão empatados.
Exemplo
O candidato A está com 48% da preferência dos votos, e o candidato B está com
52% da preferência dos votos. O candidato A tem 48%; diminuindo os 2% = 46;
com 48% mais 2% = 50%. Ou seja, varia de 46% a 50%. Já, o candidato B tem
52% menos 2% = 50%; com 52% mais 2% = 54%. Logo, considerando-se o erro
amostral, os candidatos estão empatados tecnicamente, com 50% cada.
15
Capítulo 1
•• Nível de confiança: é expresso em percentual e representa quantas

vezes o percentual real da população encontra-se dentro do
intervalo de confiança. O nível de confiança de 95% significa que
você tem 95% de certeza. A maioria dos pesquisadores usa o nível
de confiança de 95%.
Como podemos ver, o uso da amostragem é vantajoso por trazer:
•• economia: é mais econômico, o levantamento de somente

uma parte da população, muitas vezes pelo custo do próprio
levantamento e também por não ser mais possível recuperar
elementos da população;
•• tempo: em pouco tempo, pode-se pesquisar uma amostra, ao
contrário de uma população;
•• confiabilidade: quando se pesquisa um número menor de
elementos, pode-se dar mais atenção, evitando erros nas respostas.
Variáveis
Variáveis são conjuntos de características que podem ser observados e/ou medidos
em cada elemento da população ou amostra, sob as mesmas condições.
Ao analisar uma determinada experiência, um fato ou um elemento, você pode

verificar que todos eles assumem diferentes características ou valores.
Exemplo: ao analisar um determinado setor de uma empresa, você pode verificar,

entre seus funcionários, algumas características (variáveis) como sexo, idade,
salário, assiduidade etc.
Essas características variam de elemento para elemento, por isso são chamadas
de variáveis.
As variáveis são classificadas em dois tipos:
•• Qualitativas: representam a informação que identifica alguma

qualidade, categoria ou característica, não suscetível de medida (não
numérica), mas de classificação, assumindo várias modalidades.
Exemplo:
Estado civil: casado, solteiro, viúvo, divorciado.
Sexo: masculino e feminino.
Escolaridade: 1º grau, 2º grau, 3º grau.
16
As variáveis qualitativas estão divididas em:
· Nominais: são dados caracterizados por rótulos ou categorias.

Por exemplo, sexo, estado civil, cor dos olhos etc.
· Ordinais: são dados caracterizados por uma ordem, mas não
podem ser diferenciados por valor numérico. Por exemplo: nível
de escolaridade (1º, 2º e 3º graus), intensidade da luz (muito
forte, forte, média, suave, muito suave).
•• Quantitativas: representam a informação resultante de

características suscetíveis de serem medidas, apresentam-se com
diferentes intensidades.
Exemplo:
Idade: 19 anos, 20 anos, 35 anos.
Número de nascidos vivos: 10, 15, 22, 12, 14.
Peso: 55 kg, 66 kg, 71 kg.
As variáveis quantitativas estão divididas em:
•• Variáveis discretas: se ela pode assumir um conjunto constante

discreto, ou seja, enumerável, finito de valores. Geralmente são
expressas por valores inteiros não negativos. Por exemplo: número
de pessoas do setor, quantidade de notas fiscais (observação: não
se pode considerar meia nota fiscal ou meia pessoa).
•• Variáveis contínuas: são as variáveis em que não conseguimos
enumerar seus possíveis resultados, por estes formarem um conjunto
infinito de valores, em um intervalo de números reais. Por exemplo:
peso, altura, temperatura.
Diferença entre as variáveis discreta e contínua

Você, à noite, ao ir deitar-se, tem 1,65m e desperta pela manhã com 1,70m. Você cresce
5cm de forma instantânea? Não, você cresce aos poucos e, entre 1,65 e 1,70, você
tem infinitas alturas. Para a variável discreta, observamos que não é possível aumentar
o número de pessoas de 22 para 22,57. Não podemos aumentar em 0,57 pessoa. Só
podemos aumentar em uma unidade.
17
Capítulo 1
Dados
Dados estatísticos são medidas da presença de um determinado conjunto de
valores de uma variável em uma população ou amostra. Os tipos de dados
estatísticos são:
•• dados primários: quando são observados e/ou levantados pelo

próprio pesquisador ou pela organização que os tenha recolhido;
•• dados secundários: quando são observados e/ou levantados por
outra organização ou pesquisador.
Além dessa classificação, os dados também pode ser absolutos e relativos. Nesta
seção, vamos aprender a transformar dados absolutos em dados relativos, mas,
antes disso, vamos conhecer suas definições.
•• Dados absolutos são dados estatísticos resultantes da coleta direta

da fonte, sem outra manipulação a não ser a contagem ou medida.
A leitura dos dados absolutos é sempre enfadonha e inexpressiva.
Embora, esses dados traduzam um resultado exato e fiel, não têm a
virtude de ressaltar de imediato as suas conclusões numéricas.
Daí o uso imprescindível que faz a Estatística dos dados relativos. O
número de vezes que um valor da variável de uma pesquisa é citado
representa a frequência absoluta daquele valor.
•• Dados relativos são o resultado de comparações por quociente
(razões) que se estabelecem entre dados absolutos e têm por
finalidade realçar ou facilitar as comparações entre quantidades.
Traduzem-se os dados relativos, em geral, por meio de:
· percentagens;
· coeficientes;
· taxas;
· índices.
A frequência relativa é o quociente entre a frequência absoluta de uma variável e

o total de citações de todas as variáveis da pesquisa.
18
Seção 2
Distribuição de frequência
Com a posse dos dados de forma desorganizada, um primeiro passo seria
organizá-los em tabelas para que possibilitem uma primeira análise, além de
servirem para uma série de interpretações. Você poderá aprender como se
organizam dados brutos e como pode ser analisada a distribuição de frequências.
Antes de qualquer coisa, você precisa saber o que são dados brutos e dados agrupados.
Dados brutos
Dados brutos são sequências de valores numéricos ou não, os quais não sofreram
qualquer tratamento estatístico, nem foram organizados, obtidos diretamente da
observação de um fenômeno.
Mais precisamente, dados brutos são os dados apresentados da forma como foram
coletados na pesquisa ou no levantamento, desorganizados, sem ordenação.
Acompanhe os exemplos de levantamento de dados de acordo com o tipo de

variável: qualitativa, quantitativa discreta ou quantitativa contínua.
•• Para uma variável qualitativa

Em um levantamento realizado com 56 clientes de um banco, foram obtidos os
seguintes dados sobre o tipo de investimento em que estes mais confiavam,
conforme legenda.
Quadro 1.1 − Levantamento sobre o tipo de investimento que os clientes do banco mais confiavam
I M R P I I P R
P R I P P I R I
P P P M I P P P
M P I I I M P R
Legenda do quadro:
M R R P M M P R I – Investimentos imobiliários;
M – Investimento em mercado de ações;
I R M P P I R P P – Investimento em poupança;
R – Investimento em fundos de renda fixa.
M P I P P M P I
Fonte: Elaboração do autor (2010).
19
Capítulo 1
Repare que, neste caso, foram pesquisados 56 clientes e foram anotadas as

respostas na ordem das entrevistas.
•• Para uma variável quantitativa discreta

O controle de qualidade de uma fábrica de rolamentos vem analisando os lotes para
detectar defeitos nas peças fabricadas. Cada lote contém 56 peças. A seguir, está
relacionado o número de defeitos por peça, conforme estas são produzidas neste lote.
Quadro 1.2 − Levantamento sobre o número de defeitos por peça de uma fábrica de rolamentos
1 1 4 1 0 0 1 6
5 0 0 0 0 0 0 0
0 1 0 0 1 0 3 2
4 2 0 0 2 0 1 0
0 0 3 3 0 0 4 0
0 1 0 2 0 0 1 0
3 0 0 0 3 0 0 0
Repare que foram analisadas 56 peças e foram anotados os números de defeitos

por peça, na ordem em que estas foram produzidas.
•• Para uma variável quantitativa contínua

Os valores anotados, a seguir, representam o volume de vendas mensal de 56
representantes de uma empresa que fabrica remédios. Os valores estão em
milhares de reais.
20
Quadro 1.3 − Levantamento sobre o volume de vendas mensal de 56 representantes de uma empresa
que fabrica remédios
23,25 27,43 17,76 33,33 33,05 16,08 34,49 23,74
32,63 20,58 18,50 16,69 16,43 20,08 19,00 16,13
21,36 26,60 22,49 22,77 23,05 33,55 22,73 24,89
24,11 34,83 21,73 31,53 35,13 34,36 20,80 16,84
29,55 34,76 31,72 24,89 21,65 22,65 30,43 30,93
17,25 17,05 19,67 22,79 25,30 23,08 25,77 35,03
16,59 15,90 20,30 33,86 17,76 30,93 20,81 29,05
Dados agrupados
Dados agrupados são sequências de valores numéricos, ou não, os quais se
encontram já organizados, ou por semelhança (qualitativas), ou por ordenação
numérica (quantitativas), em tabelas.
•• Tabelas para variável qualitativa

Para montar uma tabela com variável qualitativa, acompanhe o exemplo, a seguir,
de um levantamento de dados acerca do tipo de investimento em que os clientes
de um banco mais confiavam.
Para começar, você deve organizar os dados por semelhança. Conforme o quadro abaixo.
Quadro 1.4 − Levantamento sobre o tipo de investimento que os clientes do banco mais confiavam
I I I I I I I I
I I I I I I M M
M M M M M M M M
P P P P P P P P
P P P P P P P P
P P P P P P R R
R R R R R R R R
21
Capítulo 1
Repare que os dados estão organizados por tipo de investimento.
Agora, você vai escrever, em uma coluna, cada uma das opções verificadas. Contar
o número de vezes em que cada tipo aparece e marcar com traços, ao lado, para
representar as aparições. Em seguida, conte o número de traços para obter o número
de vezes que cada opção aparece. Observe o quadro da contagem dos dados.
I = 14
M = 10
P = 22
R = 10
Após a contagem e organização dos dados, agora, é só montar a tabela, sem

esquecer-se de nenhum de seus componentes. Acompanhe.
Tabela 1.2 − Tipos de investimento
Tipo de investimento Número de clientes
Imobiliário 14
Mercado de ações 10
Poupança 22
Fundos de renda fixa 10
Total 56
•• Tabelas para variável quantitativa discreta

Nesta seção, vamos verificar como montar uma tabela com variável quantitativa
discreta. Para saber como são montados estes tipos de tabela, acompanhe os
passos apresentados a seguir.
Observe que a opção de montar uma tabela sem intervalos deve-se ao fato de
esta série ter um número de elementos distintos pequeno.
Para começar, organize os dados em ordem crescente.
22
Quadro 1.5 − Levantamento sobre o número de defeitos por peça de uma fábrica de rolamentos
0 0 0 0 0 0 0 0
0 0 0 0 0 0 0 0
0 0 0 0 0 0 0 0
0 0 0 0 0 0 0 0
0 1 1 1 1 1 1 1
1 1 2 2 2 2 3 3
3 3 3 4 4 4 5 6
Repare que foram organizados conforme uma ordem numérica crescente (de
0 a 6). A organização dos dados na forma de lista em ordem – crescente ou
decrescente – é chamada de Rol.
Depois de criar o Rol de dados, escreva, em uma coluna, cada um dos valores
observados. Conte o número de vezes em que cada tipo aparece e marque com
traços, ao lado, para representar as aparições. Após terminar, conte o número
de traços para obter o número de vezes em que cada valor aparece. Observe o
quadro da contagem dos dados.
Quadro 1.6 − Contagem do número de elementos X
0 33
1 9
2 4
3 5
4 3
5 1
6 1
Agora, é só montar a tabela, sem esquecer-se de nenhum de seus componentes.
23
Capítulo 1
Tabela 1.3 − Número de defeitos por peças analisadas do lote
Número de defeitos (xi) Número de peças (fi)
0 33
1 9 Frequência
simples
Valores que a
variável pode 2 4
assumir
3 5
4 3
5 1
6 1
Frequência
Total (∑fi) 56 total
Nessa tabela, utilizamos algumas expressões Estatísticas para representação

dos elementos:
•• os valores que a variável pode assumir são representados por xi;

•• o número de observações de cada linha chama-se de frequência
simples, denotada por fi; e
•• o número total de observações chama-se de frequência total e
pode ser denotada por N (tamanho da população), n (tamanho da
amostra) ou .
•• Tabelas para variável quantitativa contínua

A opção de montar uma tabela com intervalos é preferível porque esta série
possui um grande número de elementos distintos ou, ainda, quando os valores
apresentam uma natureza de continuidade. Vamos acompanhar um exemplo para
montagem das tabelas para variável quantitativa contínua 2.
Exemplo: os valores anotados, a seguir, representam o volume de vendas mensal

de 56 representantes de uma empresa que fabrica remédios. Os valores estão em
milhares de reais.
2 - Para a variável quantitativa contínua, utilizam-se intervalos na tabela para representar a série de dados.
Esses intervalos denominam-se intervalos de classes.
24
Para começar, novamente, você deve organizar os dados em ordem crescente (Rol).
Quadro 1.7 − Levantamento sobre o volume de vendas mensal de 56 representantes de uma empresa
que fabrica remédios
15,90 16,08 16,13 16,43 16,59 16,69 16,84 17,05
17,25 17,76 17,76 18,50 19,00 19,67 20,08 20,30
20,58 20,80 20,81 21,36 21,65 21,73 22,49 22,65
22,73 22,77 22,79 23,05 23,08 23,25 23,74 24,11
24,89 24,89 25,30 25,77 26,60 27,43 29,05 29,55
30,43 30,93 30,93 31,53 31,72 32,63 33,05 33,33
33,55 33,86 34,36 34,49 34,76 34,83 35,03 35,13
Note que, como os dados são de uma variável contínua e são bastante variados,
temos que reduzir os dados calculando intervalos de classes das variáveis X, para
tanto, você deve calcular o número e o tamanho dos intervalos.
O número de intervalos (k) é obtido a partir dos seguintes critérios:
•• critério da raiz k= n;
•• fórmula de Sturges k = 1 + 3,3.log n;
•• n = tamanho da amostra (poderá ser usado N, quando for com a
população, log, logarítimo).
Observe que:
1. ainda que existam dois critérios, em geral, o critério utilizado é o da

raiz: k = n;
2. o número do intervalo (k), em alguns casos, pode ser predefinido;
3. as tabelas devem ter, no mínimo, 4 e, no máximo, 20 intervalos de
classes, para que não haja nem perda, nem excesso de informação;
Para este estudo, sendo n o número de elementos da amostra, n = 56, e

k = n , então , k = 56 logo k = 7,48, nesse caso, temos que arredondar,
pois os intervalos devem ser números inteiros, neste caso, o número de
intervalos utilizado será igual a 7.
25
Capítulo 1
Agora, vamos analisar as amplitudes e os limites de classe para determinar o

tamanho dos intervalos.
a. Amplitude total da distribuição (AT): é a diferença entre o maior

valor e o menor valor observado.
L (máx.) = Limite máximo (maior valor);
l (mín.) = Limite mínimo (menor valor).
No exemplo que você está estudando,
Nesta etapa, é conveniente que o resultado seja arredondado para cima, a fim de que
não haja perda de informação, sempre, em qualquer caso, arredondar para cima.
b. Amplitude de um intervalo de classe (h): também chamada de

tamanho do intervalo de classe, é obtida da seguinte forma.
AT
h=
k
No exemplo: .
Antes de partir para a construção da tabela, é conveniente testar se os cálculos

estão corretos. Para que isso aconteça, verifique se:
Aplique sobre o exemplo dado:
2,80 . 7 = 19,60 > 19,23
Ou seja, ao somar 19,60 ao menor valor observado, resulta 35,50, que é maior do
que o valor da maior observação, 35,13. Note que, dessa forma, o valor real do
Rol de dados estará dentro de um último intervalo de classe:
15,90 + 19,60 = 35,50 > 35,13
26
Caso não seja satisfeita essa condição, será necessário fazer um ajuste,
aumentando o tamanho do intervalo.
Então, resumindo, segundo o exemplo dado, a tabela terá:
•• sete intervalos;
•• cada um com o tamanho de 2,80.
c. Limites de classes: são os extremos de cada classe. O limite

inferior da classe (Li) é o menor número do intervalo. O limite
superior (Ls) é o maior número do intervalo.
Escreva os intervalos da tabela.
Tabela 1.4 − Passo a passo do cálculo dos intervalos de classe
Comece pela primeira classe, escreva o menor valor observado. 15,90
A este valor, some o h (2,8) e encontre o limite superior do intervalo:

15,90 |--- 18,70
15,9 + 2,8 = 18,7. Você deve escrever na tabela:
Na segunda classe, repita o último valor da classe anterior (18,7), some

o h (2,8) e encontre o limite superior do intervalo: 18,7 + 2,8 = 21,5. 18,70 |--- 21,50
Você pode escrever na tabela:
Na terceira classe, repita o último valor da classe anterior (21,5), some

o h (2,8) e encontre o limite superior do intervalo: 21,5 + 2,8 = 24,3. 21,50 |--- 24,30
Você pode escrever na tabela:
24,30 |--- 27,10
Usando este procedimento para as outras classes, você terá os 27,10 |--- 29,90
seguintes intervalos a seguir, até a sétima classe: 29,90 |--- 32,70
32,70 |--- 32,50
Observe que os intervalos são escritos dessa forma: 15,90 |--- 18,70. O que
isso significa?
27
Capítulo 1
A representação indica um intervalo fechado à esquerda e, aberto à direita Þ

[15,90; 18,70), ou seja, os valores deste intervalo chegam perto de 18,70, mas não
exatamente o valor 18,70 está no próximo intervalo: 18,70 |--- 21,50; o valor 21,50
não está neste intervalo, e sim no intervalo: 21,50 |---24,30. E assim por diante.
Agora, é a vez de partir para a construção da tabela, sem esquecer-se de seus

componentes. Primeiro, monte a tabela e escreva os intervalos.
Tabela 1.5 − Volume de vendas mensal, em milhares de reais, dos representantes de uma empresa que
fabrica remédios – outubro/2010
Classe Volume de vendas (em mil reais)
1 15,90 |--- 18,70
2 18,70 |--- 21,50
3 21,50 |--- 24,30
4 24,30 |--- 27,10
5 27,10 |--- 29,90
6 29,90 |--- 32,70
7 32,70 |--- 35,50
Após a construção da tabela, é só contar e marcar o número de valores em cada

intervalo. É aconselhável marcar os limites dos intervalos no Rol e usar os traços
para indicar a contagem ou marcar, conforme o quadro a seguir.
Quadro 1.7 − Volume de vendas mensais
15,90 16,08 16,13 16,43 16,59 16,69 16,84 17,05
17,25 17,76 17,76 18,50 19,00 19,67 20,08 20,30
20,58 20,80 20,81 21,36 21,65 21,73 22,49 22,65
22,73 22,77 22,79 23,05 23,08 23,25 23,74 24,11
24,89 24,89 25,30 25,77 26,60 27,43 29,05 29,55
30,43 30,93 30,93 31,53 31,72 32,63 33,05 33,33
33,55 33,86 34,36 34,49 34,76 34,83 35,03 35,13
28
Volume de vendas No de
Classe Contagem
(em mil reais) representantes (fi)
1 15,9 |--- 18,7 12
2 18,7 |--- 21,5 8
3 21,5 |--- 24,3 12
4 24,3 |--- 27,1 5
5 27,1 |--- 29,9 3
6 29,9 |--- 32,7 6
7 32,7 |--- 35,5 10
Total (∑fi) 56
A tabela fica como está apresentado a seguir.
Volume de vendas (em mil reais) No de representantes (fi)
15,9 |--- 18,7 12
18,7 |--- 21,5 8 Frequência

simples
Intervalo de 21,5 |--- 24,3 12
classes
24,3 |--- 27,1 5
27,1 |--- 29,9 3
29,9 |--- 32,7 6
32,7 |--- 35,5 10
Frequência
Total (∑fi) 56 total
29
Capítulo 1
Tipos de frequência
A Estatística tem como uma de suas finalidades facilitar a análise e a leitura dos
dados, e, justamente, para isso, um dos métodos utilizados é trabalhar com tipos
de frequência. O número de vezes que o X aparece no Rol de dados representa
a fi, frequência simples, e, a partir dessa frequência simples, podemos calcular a
fa (frequência acumulada), a fr (frequência relativa) e a fp (frequência percentual).
Esses tipos de frequência serão apresentados a seguir.
Frequência acumulada
Na tabela, na coluna da frequência acumulada, você deverá escrever o valor
acumulado das frequências, ou seja, para começar, repita a frequência simples
da primeira linha e, nas linhas seguintes, some a frequência simples à frequência
acumulada anterior.
Esse processo deverá chegar até a frequência total
fa = fa(ant) + fi
Sendo:
•• fa: frequência acumulada;

•• fa(ant.): frequência crescente da classe anterior;
•• fi: frequência simples da classe.
Acompanhe com atenção a tabela.
30
Tabela 1.8 − Volume de vendas.
Volume de vendas (em No de fa

mil reais) representantes (fi) Repetir a
primeira fi
15,9 |--- 18,7 12 12
18,7 |--- 21,5 8 20 Somar a fi desta classe com a

acumulada anterior --> 12 + 8 = 20
21,5 |--- 24,3 12 32
Somar a fi desta classe com a
24,3 |--- 27,1 5 37 acumulada anterior --> 20 + 12 = 32
27,1 |--- 29,9 3 40

Somar a fi desta classe com a
29,9 |--- 32,7 acumulada anterior --> 32 + 5 = 37
6 46
32,7 |--- 35,5 10 56
Total (∑fi) 56
Somar sucessivamente até chegar a

frequência total --> 46 + 10 = 56
A frequência acumulada dá a posição de um determinado X.
Imagine que você está apresentando um relatório de vendas da empresa para

a diretoria. Então, um dos diretores pergunta: “Quantos representantes tiveram
vendas menores que 29,9 mil reais?” Você não necessitará fazer contas, é só
observar a quinta classe, na coluna da frequência acumulada na tabela e dizer:
“40 representantes”.
E se perguntarem: “Quantos representantes venderam abaixo de 24,3 mil reais?”

Você vai encontrar a resposta na terceira classe, na coluna com a frequência
acumulada e responder: “32 representantes”.
Observe que o volume de vendas questionado é sempre do limite superior de

cada intervalo para baixo.
31
Capítulo 1
Frequência relativa (fr)

É o quociente entre a frequência (fi) da classe e o número total de observações.

fi
fr =
n
Sendo:
fr: frequência relativa da classe;
fi: frequência simples da classe;
n: número total de observações (pode-se usar n ou ).
Neste caso, deve-se calcular a frequência com quatro casas decimais visando ao
próximo passo.
Tabela 1.9 − Volume de vendas
Volume de vendas (em No de

fr Dividir a fi da classe pelo total
mil reais) representantes (fi)
fr = = 0,2143
15,9 |--- 18,7 12 0,2143
18,7 |--- 21,5 8 0,1429 Dividir a fi da classe pelo total

fr = = 0,1429
21,5 |--- 24,3 12 0,2143
24,3 |--- 27,1 5 0,0893 fr = = 0,2143
27,1 |--- 29,9 3 0,0536
29,9 |--- 32,7 fr = = 0,0893

6 0,1071
32,7 |--- 35,5 10 0,1786
Total (∑fi) 56 1,00
Após calcular a última, você deve calcular

o total, que deve ser 1,00 ou aproximado,
devido aos arredondamentos
Lembre-se: use sempre quatro casas decimais para arredondar a frequência relativa.
32
Frequência percentual (fp)

É a frequência relativa multiplicada por 100. É dada em porcentagem (%).

fp = fr . 100
Sendo:
fp: frequência percentual;
fr: frequência relativa.
Tabela 1.10 − Volume de vendas
Volume de vendas No de
fr fp (%)
0,2143.100 = 21,43
15,9 |--- 18,7 12 0,2143 21,43
0,1429.100 = 14,29
18,7 |--- 21,5 8 0,1429 14,29
21,5 |--- 24,3 12 0,2143 21,43 0,2143.100 = 21,43
24,3 |--- 27,1 5 0,0893 8,93 0,0893.100 = 8,93
27,1 |--- 29,9 3 0,0536 5,36 0,0536.100 = 5,36
29,9 |--- 32,7 6 0,1071 10,71

0,1071.100 = 10,71
32,7 |--- 35,5 10 0,1786 17,86

0,1786.100 = 17,86
Total (∑fi) 56 1,00 100,00
Após calcular a última, você deve calcular

o total, que deve ser 100 ou aproximado,
devido aos arredondamentos
Observe que, ao usar quatro casas decimais para a frequência relativa, o

percentual ficou com duas casas decimais. Usaremos duas casas decimais em
todos nossos casos.
Para que serve a frequência percentual?

Mais uma vez, você está apresentando um relatório de vendas da empresa
para a diretoria.
33
Capítulo 1
E vem aquela pergunta: “O que representa, do total, os representantes que

venderam de 32,70 a 35,50 mil reais?” Você poderia responder diretamente, sem
cálculos: “17,86%”.
E, se perguntarem: “Quantos representantes venderam de 24,3 a 27,1 mil reais ou

mais?” Você responderia: “8,93%”.
Observe que, nesse exemplo, o volume de vendas questionado é sempre um

intervalo. Antes de acompanhar os outros tipos de frequência, entenda o que é
ponto médio de uma classe.
Ponto médio de uma classe são os valores da variável que se encontram

exatamente na metade do intervalo de cada classe.
Para calcular o ponto médio, usa-se a média aritmética simples dos limites de
cada intervalo.

Ls + Li
PM =
2
Sendo:
PM: ponto médio;
Ls: limite superior do intervalo;
Li: limite inferior de cada intervalo.
A tabela, a seguir, indica o cálculo do ponto médio para o exemplo que estamos
estudando.
Tabela 1.11 − Volume de vendas.
Volume de vendas No de 15,9 + 18,7 = 17,3

PM PM =
2
15,9 |--- 18,7 12 17,3
18,7 + 21,5 = 20,1
18,7 |--- 21,5 8 20,1 PM =
2
21,5 |--- 24,3 12 22,9
21,5 + 24,3 = 22,9

24,3 |--- 27,1 5 25,7 PM =
2
27,1 |--- 29,9 3 28,5
24,3 + 27,1 = 25,7

29,9 |--- 32,7 6 31,3 PM =
2
32,7 |--- 35,5 10 34,1
Total (∑fi) 56
34
Lembre-se deste conceito, o ponto médio será usado para outros cálculos que
você irá realizar mais adiante, tais como média e desvio padrão.
Seção 3
Representação gráfica
O gráfico constitui outra maneira de se apresentarem os dados estatísticos. Eles
têm a finalidade de mostrar com clareza, veracidade e rapidez os dados que
estão sendo estudados. Além disso, os gráficos propiciam uma noção muito boa
de como algum fenômeno comporta-se.
Por meio de formas geométricas, os gráficos mostram, por área ou volume, as

diferenças entre as opções de cada variável.
Tome cuidado ao interpretar um gráfico. Assim como os gráficos podem dar

informações rápidas e precisas, sua manipulação pode distorcer a realidade,
provocando tendenciosidade nas informações.
Observe os gráficos a seguir.
Gráfico 1.1 − Censo demográfico Brasil 1890 – 2000
Censo Demográfico - Brasil - 1890 - 2000

180
160
140
População (em milhões)
120
100
80
60
40
20
0
1890
1900
1920
1940
1950
1960
1970
1980
1990
2000
Anos
Fonte: IBGE (2010).
35
Capítulo 1
Gráfico 1.2 − Censo demográfico Brasil 1890 – 2000
Censo Demográfico - Brasil - 1890 - 2000

180
160
140
120
100
80
60
40
20
0
1890 1900 1920 1940 1950 1960 1970 1980 1990 2000
Anos
Fonte: IBGE (2010).
Observe que, no Gráfico 1.1, a impressão é de que a população aumenta

abruptamente, enquanto que, no Gráfico 1.2, a impressão é de que a população
aumenta lentamente. E a única diferença entre os dois gráficos é a largura que se
usou para cada um deles. Em alguns casos, isso pode ser muito prejudicial.
Os gráficos comunicam as mesmas ideias das tabelas, porém produzem uma

impressão e compreensão mais rápida, mais viva, pois eliminam detalhes
desnecessários, apresentando somente as características mais importantes dos dados.
O gráfico estatístico é uma forma de apresentação dos dados estatísticos, cujo

objetivo é o de produzir, no investigador ou no público em geral, uma impressão
mais rápida e viva do fenômeno em estudo, já que os gráficos falam mais rápido à
compreensão do que as séries.
A representação gráfica de um fenômeno deve obedecer a certos requisitos

fundamentais para ser realmente útil. São eles:
a. simplicidade: o gráfico deve ser destituído de detalhes com

importância secundária, assim como de traços desnecessários que
possam levar o observador a uma análise morosa ou com erros;
b. clareza: o gráfico deve possibilitar uma correta interpretação dos
valores representativos do fenômeno em estudo;
c. veracidade: o gráfico deve expressar a verdade sobre o fenômeno
em estudo.
36
Para a construção de gráficos, você deverá observar alguns itens que se fazem
necessários neles:
•• todo gráfico deve ter título e fonte (no rodapé), para que o leitor não
tenha a necessidade de voltar ao texto para saber do que se trata;
•• a escala do eixo horizontal deve ser escrita abaixo deste e deverá
crescer da esquerda para a direita;
•• a escala do eixo vertical deve ser escrita à esquerda deste e crescer
de baixo para cima;
•• cada eixo deve ser identificado com o que está sendo medido ou
representado;
•• não é necessário colocar linhas de grade (que saem das marcas das
escalas horizontais e verticais), pois estas são opcionais.
Acompanhe, a seguir, um gráfico com todos os detalhes citados.
Gráfico 1.3 – Censo demográfico – Brasil – 1890 – 2000
180
Eixo vertical
160
140
120
100
80
60
Aqui, a escala Linha de grade
40
fica a esquerda
20
0
1890 1900 1920 1940 1950 1960 1970 1980 1990 2000
Anos
Eixo horizontal
Gráfico 3.3 - Censo demográfico - Brasil - 1890 - 2000 Aqui, a escala
Título e
Fonte Fonte: IBGE (2007) fica abaixo
Antigamente, os gráficos eram feitos à mão, com a ajuda de régua, compasso,

transferidor, esquadros e canetas ou giz coloridos. Hoje, podemos contar com
softwares específicos que auxiliam e facilitam na construção de gráficos e,
muitas vezes, propiciam mais precisão e clareza. Além dos softwares específicos
de Estatística, temos os programas aplicativos de escritório, que incluem as
chamadas planilhas eletrônicas.
37
Capítulo 1
Uma planilha eletrônica utiliza tabelas para a realização de cálculos e permite,

também, a criação de vários tipos de gráficos, o que facilita a representação e
análise de dados estatísticos.
Os principais tipos de gráficos são os diagramas, os cartogramas e os pictogramas.
Diagramas
Os diagramas são gráficos geométricos de, no máximo, duas dimensões; para
sua construção, em geral, fazemos uso do sistema cartesiano (eixo X e Y). Os
principais diagramas são os gráficos de linhas, colunas, barras, setores ou pizza e
o gráfico polar. Veja cada um desses tipos.
•• Gráfico de colunas
É usado para apresentar séries temporais, geográficas e específicas. Formado
por retângulos dispostos verticalmente, de mesma largura (arbitrária), com altura
proporcional às grandezas (variáveis) do fenômeno a ser representado.
Todos os retângulos têm base comum no eixo de x e, no eixo de y, os valores das

variáveis estudadas. Observe os exemplos na Tabela 2.10 e nos Gráficos 2.6 e 2.7.
Tabela 1.12 − Mortalidade Infantil, na região Sul e Sudeste, 2004
Estado Por mil nascimentos
SC 17,2
RS 14,3
PR 20,0
SP 16,5
RJ 20,9
ES 20,1
MG 21,8
Fonte: Portal Brasil (2004).
38
Gráfico 1.4 − Mortalidade Infantil, na região Sul e Sudeste, 2004
25
20
Por mil nascimentos
15
10
0
SC RS PR SP RJ ES MG
Gráfico 1.5 − Porcentagem de mulheres, com filhos antes dos 20 anos, 2000
50 47
45
40
35
35
29
30
Percentual (%)
25
20 19
15
10
0
África América do Norte América Latina Ásia
Fonte: Population Reference Bureau (2000).
39
Capítulo 1
•• Gráfico de barras
Segue as mesmas normas do gráfico de colunas, porém os retângulos ocupam
posição horizontal e, por isso, terão base comum no eixo y. É também mais
indicado para séries geográficas e específicas.
•• Gráfico de linhas
É comum, para quem trabalha na área de administração e negócios, observar o
comportamento de uma variável ao longo do tempo. Por exemplo, um executivo
que acompanha a cotação diária das ações da sua empresa, um gerente que
acompanha o volume semanal de vendas de sua loja ou um engenheiro de
produção que acompanha características de qualidade do produto que fabrica.
•• Gráfico de setores ou de pizza

É usado para mostrar a importância relativa das proporções e é construído a
partir das coordenadas polares:
· comparar a parte com o todo;

· é formado por um círculo, do qual cada parte representa um
percentual da variável.
Neste caso, utilizamos o mesmo exemplo do gráfico de barras, de modo que

você possa analisar as proporções no gráfico de setores.
•• Gráficos em colunas ou em barras múltiplas

Este tipo de gráfico é, geralmente, empregado quando queremos representar,
simultaneamente, dois ou mais fenômenos estudados com o propósito de comparação.
Tabela 1.13 − Balança Comercial brasileira (Valores em US$ Milhões), 2005 a 2009
Ano Exportação Importação

2005 118.309 73.545
2006 137.807 91.350
2007 160.649 120.610
2008 197.953 173.148
2009 152.252 127.637
Fonte: Base de dados do Portal Brasil (2010).
40
Gráfico 1.6 − Balança comercial brasileira (Valores em US$ milhões), 2005 a 2009
200.000
180.000
160.000
140.000
120.000
Valores
100.000
Exportação
80.000
60.000 Importação
40.000
20.000
0
.2005 .2006 .2007 .2008 .2009 Ano
Fonte: Base de dados do Portal Brasil, Banco Central do Brasil,
Ministério do Desenvolvimento, Siscomex e Fundação
Análise dos dados: observando o gráfico, podemos concluir que o saldo da

balança comercial brasileira é positivo, pois as colunas em cinza-claro, que
representam as exportações em todos os anos, são maiores do que as colunas
de cor cinza-escuro, que representam as importações.
O ano que representou um maior volume de exportação e também de importação

foi o de 2008. O menor volume de importação foi no ano de 2005.
•• Gráfico polar
É o gráfico mais indicado quando temos necessidade de representar variações
cíclicas, ou seja, que se repetem em períodos predeterminados. O gráfico polar é
mais utilizado em estudos climáticos (para séries temporais).
Cartograma
O cartograma é a representação sobre um mapa. Este gráfico é empregado

quando o objetivo é o de figurar os dados estatísticos diretamente relacionados
com áreas geográficas ou políticas.
Pictogramas
Pictogramas são construídos a partir de figuras ou conjunto de figuras

representativas da intensidade ou das modalidades do fenômeno.
São mais utilizados em jornais, revistas, cartazes e propagandas, ou seja, quando se

deseja dar um efeito mais atrativo ou chamar a atenção, sem nenhum rigor científico.
41
Capítulo 1
Representação gráfica de uma distribuição

Alguns gráficos em Estatística são usados para interpretações de informações,
análises de dados e, também, para a dedução geométrica de fórmulas de
algumas medidas importantes.
Para as distribuições de frequências simples, são utilizados o histograma e

o polígono de frequências. E, para as frequências acumuladas, é utilizado o
polígono de frequências acumuladas.
•• Histograma
Este gráfico é muito semelhante ao de colunas, ou seja, é formado por um
conjunto de retângulos justapostos, de maneira que a altura de cada retângulo
seja proporcional à frequência simples da classe por ele representada.
É construído no sistema de eixos cartesianos. No eixo horizontal, são marcados

os valores ou intervalos das classes assumidos pela variável. No eixo vertical,
são marcadas as frequências simples, que servirão para marcar a altura dos
retângulos, indicando, assim, o número de observações (ocorrências) de cada
valor ou classe da variável.
Como a altura de cada retângulo é proporcional à frequência simples, a área de

cada retângulo também é. Considerando isso, a soma das áreas dos retângulos
também é proporcional à frequência total.
Para construir um histograma:
•• desenhe os eixos vertical e horizontal;

•• faça as escalas em cada um dos eixos – no horizontal, os intervalos
de classe; e, no vertical, a frequência;
•• desenhe os retângulos que representam cada intervalo com a
mesma largura de cada intervalo e com a altura proporcional às
frequências dos intervalos;
•• não se esqueça de escrever o título e a fonte.
Observe o exemplo na Tabela 1.12 e no Gráfico 1.7.
42
Tabela 1.14 − Quantidade de óxido de enxofre
Quantidade de óxido de Nº de meses (fi)

enxofre
6,2 |--- 9,9 6
9,9 |--- 13,6 10
13,6 |--- 17,3 11
17,3 |--- 21,0 20
21,0 |--- 24,7 13
24,7 |--- 28,4 7
28,4 |--- 32,1 3
Total 70
Gráfico 1.7 − Emissão de óxido de enxofre nos últimos 70 meses (em toneladas)
25
20
20
15 13
No meses
11
10
10
7
5
5
3
0
6,2 |--- 9,9 9,9 |--- 13,6 13,6 |--- 17,3 17,3 |--- 21,0 21,0 |--- 24,7 24,7 |--- 28,4 28,4 |--- 32,1
Há uma analogia dos histogramas com os gráficos de barras. Contudo, nos

gráficos de barras, não há necessidade de se usar escala horizontal contínua,
além de não ser necessária a rigidez de construção que têm os histogramas.
43
Capítulo 1
•• Polígono de frequências
Unindo por linhas retas os pontos médios das bases superiores dos retângulos
do histograma, obtém-se outra representação dos dados, denominada
polígono de frequências.
Você pode observar que a área do histograma é igual à área abaixo do polígono
de frequências, ou seja, os retângulos que ficam fora são compensados pelos
triângulos que estão adicionados por dentro.
Gráfico 1.8 − Emissão de óxido de enxofre (em toneladas)
25
20
20
15 13
No meses
11
10
10
7
5
5
3
0
6,2 |--- 9,9 9,9 |--- 13,6 13,6 |--- 17,3 17,3 |--- 21,0 21,0 |--- 24,7 24,7 |--- 28,4 28,4 |---32,1
Você também terá a oportunidade de adquirir mais uma importante ferramenta

para utilizar na análise e interpretação de dados: a representação gráfica.
Você irá conhecer alguns tipos de representação gráfica mais utilizados e suas
características.
Poderá constatar que os dados representados por meio de gráficos, muitas

vezes, facilitam a leitura e a compreensão de algum fenômeno ou acontecimento.
44
Atividades de autoavaliação
Ao final de cada unidade, você realizará atividades de autoavaliação. O gabarito
está disponível no final do livro didático, mas se esforce para resolver as
atividades sem a ajuda do gabarito, pois, assim, você estará promovendo (e
estimulando) a sua aprendizagem.
1. Analise os conceitos de censo e estimação e descreva a principal diferença

entre os termos.
2. Ao escolher os elementos de uma amostra, o que você deve considerar para

que ela seja representativa? Por quê?
3. Como você pôde acompanhar, existem dois tipos de variáveis: a qualitativa,

que está dividida em nominal e ordinária, e a quantitativa, que está dividida em
contínua e discreta. Identifique, no seu dia a dia, pelo menos um exemplo de cada
uma dessas variáveis e escreva-as no quadro a seguir.
Variável Exemplo
Qualitativa nominal
Qualitativa ordinal
Quantitativa discreta
Quantitativa contínua
4. Ao planejar uma pesquisa sobre uma determinada síndrome, um pesquisador

tem a intenção de usar um questionário para a coleta de dados e, também,
planeja fazer um levantamento de dados no Ministério da Saúde, para que possa
realizar comparativos. Como consequência disso, ele terá que trabalhar com dois
tipos de dados: os resultantes dos questionários e os resultantes do levantamento
no Ministério. Classifique os dois tipos de dados.
a. Os dados coletados por meio de questionário são:________________

b. Os dados coletados no Ministério são:__________________________
45
Capítulo 1
5. Classifique cada uma das variáveis a seguir em qualitativa nominal ou ordinal

e em quantitativa discreta ou contínua.
Descrição da variável Classificação
• Saldo em conta corrente em R$:
• Idade do cliente:
• Sexo do cliente:
• Classe econômica:
• Estado civil:
• Número de defeitos do produto:
• Consumo de energia em kWh:
• Número de filhos:
• Comprimento da peça:
• Tempo de espera em caixa eletrônico

(em minutos):
• Nome de país exportador de petróleo:
• Grau de satisfação no atendimento

em uma loja comercial:
• Número de alunos de uma

universidade:
46
6. Um relatório recente distinguiu em seis tipos os principais motivos de tensão

(estresse). A pesquisa realizada para provar isso resultou nos dados a seguir
(dados fictícios).
MP MC DO DG MF
DM MF MP DG MC
MC MF MF MC MC
MF MC MP DO MP
MP MP DM MP DO
MP DM DG DM MC
MF MF MF MF MF
Legenda: tipos de fobias
DO MP DG MP DG MF: Morte de um filho;
MC: Morte do cônjuge;
MF MC MF MP DO MP: Morte dos pais ou irmãos;
DO DO DM MF MC DO: Divórcio;
DG: Doença grave;
MF DM MC MC DG
DM: Demissão.
DO MF DG MF MC
Monte a tabela de frequência simples, não esquecendo de todos seus

componentes.
7. Uma empresa procurou estudar a ocorrência de acidentes com seus

empregados, tendo, para isso, realizado um levantamento abrangendo um
período de 36 meses. No levantamento, foi observado o número de operários
acidentados para cada mês. Os dados correspondentes estão expostos a seguir.
4 8 6 6 4 5
6 5 8 5 6 5
8 5 7 6 8 7
3 3 4 4 3 3
5 5 4 6 5 5
7 7 6 8 8 7
Levando em consideração os dados apresentados, monte a tabela com as

variáveis quantitativas discretas.
47
Capítulo 1
8. Os dados a seguir representam a renda de uma amostra de famílias de um

bairro de classe baixa de Florianópolis, em reais (dados fictícios). Construa
a tabela de distribuição de frequências. Usar k = 6 (número de intervalos).
Sugestão: ao calcular o h (tamanho de cada intervalo), arredonde para um número
inteiro. Exemplo: 3,84 4
115 121 117 124 122 116
123 118 123 119 123 126
128 122 112 125 124 126
125 121 129 127 128 129
113 115 116 124 119 118
126 129 116 127 123 121
9. Uma empresa procurou estudar a ocorrência de acidentes com seus

empregados, tendo, para isso, a Comissão Interna de Prevenção de Acidentes
(CIPA) realizado um levantamento abrangendo um período de 36 meses, em que
foi observado o número de operários acidentados em cada mês. A tabela abaixo
resume estes dados:
Número de operários acidentados em cada mês
Número de Número de fa fr fp (%)

acidentados meses
3 4
4 5
5 9
6 7
7 5
8 6
Total (Σfi) 36
48
Complete a tabela com as frequências acumulada, relativa e percentual. Depois,

responda as perguntas.
a. Em quantos meses a empresa teve um número de funcionários

acidentados menor do que 6? ______
b. Em quantos meses a empresa teve um número de funcionários
acidentados maior ou igual a 5? ______
c. Qual foi o percentual de meses em que a empresa verificou 5
funcionários acidentados? ______
d. Qual foi o percentual de meses em que a empresa verificou 7
funcionários acidentados? ______
10. A seguir, você tem uma distribuição de frequências e um sistema de eixos.

Construa o histograma e o polígono de frequências para essa distribuição usando
o sistema de eixos (não se esqueça de todos os componentes de um gráfico,
inclusive as escalas dos eixos, título e fonte): tempo de sono, em minutos,
induzido em ratos por injeção de certo químico, na dosagem de 40 mg por quilo.
Tempo de sono (em min.) Número de ratos
7 |--- 12 2
12 |--- 17 6
17 |--- 22 17
22 |--- 27 9
27|--- 32 5
32 |--- 37 2
49
Capítulo 2
Medidas de posição e dispersão
Seção 1
Medidas de posição
Neste capítulo, você vai obter mais ferramentas de estatística descritiva para auxiliá-
lo a compreender e a utilizar a Estatística no seu dia a dia profissional. O objetivo
aqui é estudar medidas importantes e bastante utilizadas nos métodos estatísticos.
O cálculo de medidas como a média, a moda e a mediana, e os conceitos

apresentados neste capítulo, são de grande valia no seu cotidiano profissional,
pois fornecerão dados que serão pertinentes para o entendimento de algum fato
ou acontecimento. Chamamos essas medidas de medidas de posição.
Contudo, conhecer as interpretações dessas medidas não basta por si só.

Por meio delas, podemos chegar a algumas conclusões, mas estas não são
suficientes, por isso, você vai estudar, também, medidas que irão auxiliá-lo na
avaliação do comportamento das séries de dados com relação à sua média.
Chamamos essas medidas de medidas de dispersão.
Muitas vezes você irá deparar-se com uma massa de dados grande o bastante
para que a leitura e a análise tornem-se muito difíceis. Então, como fazer para
tirar informações relevantes e resumir os dados de forma eficaz nesses casos?
Usando medidas estatísticas. Neste capítulo, vamos ver algumas delas.
As medidas de posição, assim chamadas pela posição que elas ocupam na série
estatística, quando bem utilizadas e interpretadas, podem ser úteis, não só por
elas mesmas, mas também auxiliando o cálculo de outras medidas.
51
Capítulo 2
Além de tudo, elas facilitam o estudo de grandes volumes de dados, pois as

medidas de posição podem resumir as informações, dando a você uma noção do
comportamento do todo. As medidas de posição estão divididas da seguinte maneira:
a. Medidas de tendência central: são valores da variável que tendem

a estar no centro da série, por isso o nome. Referem-se ao valor da
variável que está, senão no centro, perto dele. Está dividia em três
tipos: média, mediana e moda.
b. Separatrizes: são valores da variável que dividem a série ordenada de
dados em partes que contêm a mesma quantidade de observações.
Medidas de Tendência Central
a. Média
A média é uma das medidas mais importantes dentro da Estatística. Ela é o
ponto de equilíbrio de uma série de dados. Veja a figura a seguir, extraída do livro
Introdução à Estatística, Triola (1999).
Figura 2.1 − A média como ponto de equilíbrio
Fonte: Triola (1999, p. 32).
Vários tipos de médias podem ser calculados para uma massa de dados. A mais
importante é a média aritmética, que você irá estudar nesta seção.
A média aritmética é a soma de todos os elementos de uma série de dados,

dividida pelo número de elementos que compõe essa série. Veja a seguir
como representá-la.
52
Notação:
= média dos dados de uma amostra.
μ = média dos dados de uma população (em que μ = 12° letra do alfabeto grego,
“μ” lê-se como “mi”).
a. A média aritmética para dados brutos

Agora, você vai calcular a média para dados que não foram organizados em
tabelas, ou seja, estão conforme foram coletados, brutos.
A soma de todos os valores dividida pelo número de valores.
Em que:
•• n = número de valores da série (ou tamanho da amostra);

•• xi = valores da série.
Veja, a seguir, um exemplo bem detalhado para compreender como realizar os

cálculos.
Um exemplo bem típico é calcular a média das notas das provas. Digamos que as
notas de uma disciplina cursada por você sejam: 7; 7,8; 6 e 8, então a média será:
b. A média aritmética para dados agrupados

Agora, você vai calcular a média para dados que foram organizados em tabelas, ou
seja, após a coleta, eles foram organizados em categorias e escritos em uma tabela.
b.1 Dados agrupados sem intervalos (variável discreta)
Para os dados agrupados (em tabela), sem intervalos, utiliza-se a fórmula descrita
a seguir, em que cada frequência simples pode ser considerada como peso. Por
isso que se chama, também, de média aritmética ponderada (pesos).
53
Capítulo 2
A soma de todos os valores multiplicados por sua frequência simples dividida

pela soma das frequências (frequência total).
Em que:

•• xi = valores da série;
•• fi = frequência simples de cada xi.
Veja, na sequência, um exemplo. Calcule a média dos dados representados na

tabela abaixo.
Tabela 2.1 – Número de filhos por famílias de um bairro de Florianópolis
No de filhos (xi) No de famílias (fi) xi . fi

0 x 14 = 0
0 14 0
1 16 16 1 x 16 = 16
2 11 22 2 x 11 = 22
3 9 27 3 x 9 = 27
4 4 16
5 1 5
6 1 6
Σxi.fi = 92
Total (Σfi) 56 92
Somar as frequências simples
Veja, agora, como calcular passo a passo.
Passo 1: some a coluna das frequências simples (fi) para obter Σfi (frequência total).
Σfi = 56
Passo 2: multiplique cada xi por sua correspondente fi e escreva o resultado na
coluna xi.fi.
54
Passo 3: some os valores calculados no passo 2 e escreva a soma no final da

coluna. Esse resultado é o Σxi.fi.
Σxi.fi = 92
Passo 4: divida o resultado do passo 3 (Σxi.fi) pelo resultado do passo 1 (Σfi).
Como interpretar esses dados? O valor médio da série é 1,64, ou seja, a média
de filhos por família é de 1,64 filhos. Analisando dessa maneira, pode parecer um
absurdo, mas você pode concluir que a média de filhos por família é de 1 a 2 filhos.
Ou de, aproximadamente, dois filhos, arredondando para cima.
b.2 Dados agrupados com intervalos (variável contínua)
Para os dados agrupados em tabela, com intervalos, você deve utilizar a fórmula
descrita a seguir, semelhante àquela utilizada para dados sem intervalos, entretanto,
por estarmos usando intervalos, usamos os pontos médios para representar xi.
A média, da mesma forma que para variável discreta, é a soma de todos os

pontos médios (x) multiplicados por sua frequência simples, dividida pela soma
das frequências (frequência total).
Em que:

•• PM = ponto médio do intervalo;
•• fi = frequência simples de cada intervalo.
Quando trabalhamos com dados agrupados em intervalos, passamos a trabalhar

com a perda dos valores individuais, ou seja, sabemos a frequência de cada
intervalo, mas não sabemos exatamente quais são os valores contidos nele
(intervalo). Por esse motivo, o cálculo da média, nesse caso, é feito com o uso do
ponto médio. A média, sendo assim, é um valor aproximado.
55
Capítulo 2
Veja o exemplo a seguir para compreender melhor.
Calcule a média dos dados representados como na tabela abaixo.
Tabela 2.2 – Quantidade emitida de óxido de enxofre (SO), em toneladas, pelas fábricas do distrito
industrial de Florianópolis
(15,9 + 18,7)/2 = 17,3

Qtde. de SO No de meses
PM PM.fi
(em ton.) (fi)
17,3 x 12 = 207,6
15,9 |-- 18,7 12 17,3 207,6
20,1 x 8 = 160,8
18,7 |-- 21,5 8 20,1 160,8
21,5 |-- 24,3 12 22,9 274,8 22,9 x 12 = 274,8
24,3 |-- 27,1 5 25,7 128,5 25,7 x 5 = 128,5
27,1 |-- 29,9 3 28,5 85,5
29,9 |-- 32,7 6 31,3 187,8
32,7 |-- 35,5 10 34,1 341
Σxi.fi = 1386
Total (Σfi) 56 1386
Somar as frequências simples
Veja, a seguir, como calcular passo a passo.
Passo 1: some a coluna das frequências simples (fi) para obter Σfi (frequência total).
Σfi = 56
Passo 2: calcule o ponto médio de cada intervalo.
Passo 3: multiplique cada PM por sua correspondente fi e escreva o resultado na

coluna PM.fi.
Passo 4: some os valores calculados no passo 3 e escreva a soma no final da

coluna; esse resultado é o ΣPM.fi.
ΣPMi.fi = 1386
Passo 5: divida o resultado do passo 4 (ΣPM.fi) pelo resultado do passo 1 (Σfi).
= 1386/56=24,75
Como interpretar o resultado? A quantidade média de óxido de enxofre emitida,

em 56 meses, foi de 24,75 toneladas.
56
b. Mediana
A mediana é um valor que divide a série de dados em duas partes iguais, ou seja,
é o valor observado que está no meio da série.
Notação:
Me = Mediana (também é usado md).
a. Mediana para dados brutos

Agora, você vai calcular a mediana para dados que não foram organizados em
tabelas, ou seja, estão conforme foram coletados, brutos. Após a ordenação
crescente dos dados, determinamos o número de elementos (n) do mesmo.
Separamos em dois casos:
a.1) quando o n (tamanho da amostra) é ímpar − o cálculo da posição da

mediana deve ser conforme segue:
a.2) quando o n (tamanho da amostra) é par − o cálculo da posição da mediana

deve ser realizado com a seguinte fórmula:
Veja, passo a passo, como calcular a mediana para dados brutos quando o
(n) é ímpar.
• Calcular a mediana da série X: 5, 30, 27, 9, 15, 19, 24, 20, 31.
Passo 1: ordene os valores de forma crescente 5, 9, 15, 19, 20, 24, 27, 30, 31.
Passo 2: o número de elementos é 9 ( n = 9, ímpar).
Passo 3: calcule a posição da mediana.
57
Capítulo 2
Passo 4: a mediana é o 5º elemento, volte para rol de dados e conte até o quinto x.
Me = 20 (a resposta é sempre me X).
1º 2º 3º 4º 5º 6º 7º 8º 9º
5 9 15 19 20 24 27 30 31
Como interpretar esses dados? 50% dos valores da série são menores ou iguais
a 20, e 50% dos valores da série são maiores ou iguais a 20.
Veja, passo a passo, como calcular a mediana para dados brutos quando o
(n) é par.
Para você encontrar a mediana, é preciso calcular o ponto médio dos dois valores
que ocupam as posições calculadas.
• Calcular a mediana da série X: 5, 30, 27, 9, 15, 19, 24, 20.
Passo 1: ordene os números de forma crescente 5, 9, 15, 19, 20, 24, 27, 30.
Passo 2: o número de elementos é 8 ( n = 8, par).
Passo 3: calcule as duas posições, Pos1 e Pos2.
Passo 4: a mediana está entre o 4º e o 5º elemento.
1º 2º 3º 4º 5º 6º 7º 8º
5 9 15 19 19,5 20 24 27 30
Como interpretar esses dados? 50% dos valores da série são menores do que
19,5, e 50% dos valores da série são valores maiores do que 19,5.
58
Você viu como se encontra a mediana para dados brutos? Assim como você
estudou na média, aqui, também para efeito de cálculo, você usará diferente
tratamento quando se tratar de dados agrupados com intervalos (variável
contínua) e dados agrupados sem intervalos (variável discreta).
b. Mediana para dados agrupados

Se os dados estão apresentados na forma de uma tabela, eles já estão
naturalmente ordenados. Então, vamos calcular a mediana para dados agrupados
sem intervalos e com intervalos de classe. Observe o exemplo.
Tabela 2.3 – Idade de 50 alunos de uma universidade
Número de fac
Idade (anos) alunos
1a a 3a posição
17 3 3
18 18 21 4a a 21a posição
19 17 38 22a a 38a posição

Total 50
Fonte: Elaboração do autor (2010)
Para facilitar a localização dos termos centrais, construímos a frequência

acumulada crescente (fac).
O primeiro passo é encontrar a posição em que se encontra a mediana.
Logo:
O resultado indica que a mediana está na 250 e 260 posição, então precisamos
verificar os valores na terceira coluna da frequência acumulada. Temos 3 alunos
com 17 anos e 21 alunos com 18 anos. Até aqui, já estamos na 240 posição, logo
a posição seguinte é a que procuramos. Por isso, na soma 38, estão inclusos os
valores da 250 posição até a 3800.
Para descobrir a mediana, basta verificarmos qual idade corresponde a essa

soma, ou seja, 19 anos.
59
Capítulo 2
Assim:
Mediana = 19 anos.
Interpretação
•• 50% dos alunos da série possuem idade inferior ou igual a 19 anos; e

•• 50% dos alunos da série possuem idade igual ou superior a 19 anos.
Dados agrupados com intervalo de classe (variável contínua). Quando a série é

agrupada em classes, a mediana corresponderá ao termo que dividir a série em
duas partes iguais.
A classe que contém a mediana, chamamos classe mediana.
Neste caso, vamos localizar uma classe onde se encontra a mediana, utilizando
a fórmula:
Em que:
•• Li = Limite inferior da classe que contém a mediana;

•• n = número de elementos da série;
•• Fa = frequência acumulada anterior;
•• fi = frequência da classe mediana;
•• h = amplitude do intervalo de classe.
Todas as medidas calculadas para uma variável contínua serão valores aproximados
para essas medidas, uma vez que, ao agruparmos os dados segundo uma variável
contínua, há perda de informações referentes à identidade dos dados. (SILVA, 1999).
Exemplo: a tabela a seguir revela o consumo de energia elétrica em 250 residências

de famílias da classe média, com dois filhos. Calcule e interprete o valor mediano.
60
Tabela 2.4 – Consumo de energia elétrica em residências
Consumo (kWh) No de famílias

0 |-- 50 2
50 |-- 100 15
100 |-- 150 32
150 |-- 200 47
200 |-- 250 50
250 |-- 300 80
300 |-- 350 24
Total 250
Fonte: Elaboração do autor (2010)
Para o cálculo da mediana, o primeiro passo é calcular a frequência acumulada

crescente, acrescentando os valores em uma nova coluna na própria tabela.
Tabela 2.5 – Consumo de energia elétrica em residências
Consumo (kWh) No de famílias fac

0 |-- 50 2 2
50 |-- 100 15 17
100 |-- 150 32 49
150 |-- 200 47 96
97a a 146a posição, logo
200 |-- 250 50 146 a mediana encontra-se
250 |-- 300 80 226 nesta classe
300 |-- 350 24 250

Total 250
O primeiro passo é encontrar a posição em que está a mediana.
Logo:
Observando a coluna com a fa, verificamos que a posição 960 vai até 200 kWh,
assim a 125a e 126a é a posição seguinte, que vai até a posição 146a. Essa é a
classe da mediana que vai de 200 até 250 kWh.
61
Capítulo 2
Agora, vamos identificar os dados para aplicar na fórmula:
•• Li = 200 (limite inferior da classe da mediana);

•• n = 250 (número da amostra);
•• Fa = 96 (frequência acumulada anterior);
•• fi = 50 (frequência da classe mediana);
•• h = 50 (amplitude do intervalo de classe).
Após a identificação de todos os valores, vamos aplicar na fórmula.
Interpretação
•• 50% das famílias consumiram valor igual ou inferior a 229 kWh; e

•• 50% das famílias consumiram valor igual ou superior a 229 kWh.
c) Moda
A moda é um valor que mais se repete em uma série de dados, ou seja, é o valor
com maior frequência.
Notação:
Mo = Moda.
62
a. Moda para dados brutos

Agora, você vai encontrar a moda para dados que não foram organizados em
tabelas, ou seja, que estão conforme foram coletados, brutos. A moda será o
valor que mais se repete no conjunto de dados.
Veja os exemplos.
•• Exemplo 1: X: 15, 16, 19, 20, 20, 22, 22, 22, 25, 26, 28.
O elemento que mais se repete é o 22, então, Mo = 22. Observe que o número
20 repete-se, mas não mais do que o 22. Para esse caso, no qual a Mo = 22,
afirma-se que a série é unimodal.
•• Exemplo 2: X: 15, 16, 20, 20, 20, 22, 22, 22, 25, 26, 28.
Os elementos que mais se repetem são o 20 e o 22, então Mo1 = 20 e Mo2 =
22. Para esse caso, no qual temos duas modas na série, afirma-se que a série é
bimodal. Acima de duas modas, é mais comum chamarmos a série de polimodal.
•• Exemplo 3: X: 20, 20, 22, 22, 25, 25, 28, 28.

Na série anterior, não temos um elemento que mais se repete, pois todos têm a
mesma frequência. Nesse caso, afirma-se que a série é amodal.
Você viu como se encontra a moda para dados brutos. Assim como você estudou
na média, aqui, também para efeito de cálculo, você usará diferente tratamento
quando se tratar de dados agrupados com intervalos (variável contínua) e dados
agrupados sem intervalos (variável discreta).
b. Moda para dados agrupados

Vimos que, para calcular a moda em uma série com dados não agrupados em
classe (variável contínua), é necessário observar somente o termo que mais
aparece, ou seja, a frequência mais alta.
Veja o exemplo na tabela a seguir.
Tabela 2.6 – Idade de 50 alunos de uma universidade
Idade (anos) Número de alunos
17 3
18 18
19 17
20 8
21 4
Total 50
63
Capítulo 2
Para identificarmos a média, precisamos observar a maior frequência, que,

neste caso, é 18. Logo, a idade que corresponde a maior frequência é 18,
então a moda = 18 anos.
Para uma distribuição de frequência com os dados agrupados em classe (variável

continua), pela própria complexidade como as variáveis apresentam-se, teremos
que fazer uso de uma fórmula, para podermos identificar a moda.
Um breve histórico da moda para dados agrupados. No início, o cálculo da moda

fazia-se pelo ponto médio da classe modal: tratava-se de uma forma bem simples
e rudimentar de calcular. Depois, percebeu-se que esse método apresentava
falhas. Até que surgiu o matemático de nome King, o qual propôs um segundo
modelo, que levou o seu nome, e, durante um período longo, passou-se a usá-
lo. Mesmo assim, apesar do avanço, percebia-se ainda não ser modelo o ideal.
A partir do processo de Czuber, quando se necessita calcular a moda de uma
distribuição de Frequência, emprega-se esse modelo. Muitos livros ainda trazem
ambos os modelos: King e Czuber.
Aqui, vamos estudar a Moda Czuber, a qual leva em consideração as variações

das frequências das classes anterior e posterior em relação à frequência modal.
Em que,
•• Li = Limite inferior da classe modal;

•• d1 = diferença entre a frequência de classe modal e a vizinha
imediatamente anterior;
•• d2 = diferença entre a frequência de classe modal e a vizinha
imediatamente posterior;
•• h = amplitude do intervalo de classe. Para exemplificar, calcule
a moda para a distribuição, a qual representa os salários de 25
funcionários selecionados em uma empresa.
64
Tabela 2.7 – Valor do salário base de 25 funcionários de uma empresa
Salários (R$) No de funcionários

Vizinha imediatamente
1.000 |-- 1.200 2 anterior
1.200 |-- 1.400 6
1.400 |-- 1.600 10 Classe modal
1.600 |-- 1.800 5

1.800 |-- 2.000 2 Vizinha imediatamente
posterior
Total 25
O primeiro passo é identificar a classe modal, ou seja, a classe com a maior

frequência. Logo, a classe modal é de 1400 a 1600, com a frequência 10.
Depois de identificarmos a classe modal, vamos identificar os valores que vamos

precisar para calcularmos a moda.
•• Li = 1.400 (limite inferior da classe modal);

•• d1= 10 – 6 = 4 (diferença entre a frequência de classe modal e a
vizinha imediatamente anterior);
•• d2= 10 -5 = 5 (diferença entre a frequência de classe modal e a
vizinha imediatamente posterior);
•• h = 200 (amplitude do intervalo de classe).
Substituindo os valores na fórmula, temos:
65
Capítulo 2
Interpretação
A moda é R$ 1.488,89, ou seja, esse é o salário que mais se repete.
Entre média, mediana ou moda, qual utilizar? Não há uma resposta simples e objetiva
para determinar a medida que seja mais representativa. A seguir, você encontrará um
resumo das vantagens e desvantagens de cada medida de tendência central.
Quadro 2.1 – Resumo das vantagens e desvantagens de cada medida de tendência central
Afetada
Leva em
pelos Vantagens e
Medida Definição Frequência Existência conta todos
valores desvantagens
os valores?
extremos?
Soma de Usada em toda
todos os Estatística;
valores Existe funciona bem
Média Mais usada. Sim. Sim.
divididos pelo sempre. com muitos
número de métodos
valores. estatísticos.
Costuma
Valor que ser uma boa
Usada Existe
Mediana divide a série Não. Não. escolha se há
comumente. sempre.
na metade. alguns valores
extremos.
Pode não
Valor que
existir ou, Apropriada para
mais se Usada às
Moda ainda, pode Não. Não. dados ao nível
repete (maior vezes.
haver mais nominal.
frequência).
de uma.
Separatrizes
Na maioria dos casos, o pesquisador tem interesse em conhecer outros aspectos
relativos ao conjunto de valores, além de um valor central ou valor típico. Algumas
informações relevantes podem ser obtidas por meio do conjunto de medidas:
média, extremos, quartís, decís, percentís etc. Veja, a seguir, mais detalhes e
exemplos de como calcular as separatrizes.
a. Quartís: divide uma série ordenada em quatro partes iguais, ou seja,

em partes de 25% cada.
Representação: Q1, Q2 e Q3.
Denominação: 1º quartil, 2º quartil e 3º quartil.
66
b. Decís: divide uma série ordenada em 10 partes iguais, ou seja, em

partes de 10% cada.
Representação: D1, D2, .... e D9.
Denominação: 1º decil, 2º decil, ... e 9º decil.
c. Percentil: divide uma série ordenada em 100 partes iguais, ou seja,

em partes de 1% cada.
Representação: P1, P2, .... e P99.
Denominação: 1º percentil, 2º percentil, ... e 99º percentil.
Note que a mediana também é uma separatriz. Você saberia dizer com quais
separatrizes podemos compará-la? Veja:
Q2 = D5 = P50 = Me
Todas essas medidas dividem a série de dados pela metade.
•• 50% dos valores são maiores do que Q2 = D5 = P50 = Me; e

•• 50% dos valores são menores do que Q2 = D5 = P50 = Me.
•• Separatrizes para dados brutos

O procedimento é bastante semelhante ao da mediana. Preste atenção nas
explicações a seguir: após a ordenação crescente dos dados (rol), determinamos
o seu número de elementos (n).
Veja o exemplo passo a passo.
Calcular Q1 para a série de dados X: 22, 15, 20, 22, 28, 20, 20, 22, 25, 26, 16.
Passo 1: ordene de forma crescente (rol) 15, 16, 20, 20, 20, 22, 22, 22, 25, 26, 28.
Passo 2: o número de elementos é 11 (n = 11, ímpar). Aqui, você deve adotar

procedimento semelhante ao da mediana e deve usar a mesma fórmula para
calcular a posição. Lembre-se: da posição! Assim, você irá encontrar a mediana, ou
seja, o segundo quartil (Q2).
67
Capítulo 2
Passo 3: Pos = 6, ou seja, Q2 ocupa a 6ª posição.
1º 2º 3º 4º 5º 6º 7º 8º 9º 10º 11º
15 16 20 20 20 22 22 22 25 26 28
Observe que o Q2 = 22.
Interpretação para Q2 = 22: 50% dos valores da série são menores ou iguais
a 22, e 50% dos valores da série são maiores ou iguais a 22. Antes do Q2, está
formado um novo conjunto de dados, mostrado a seguir.
1º 2º 3º 4º 5º
15 16 20 20 20
Nesse caso, a mediana (dessa nova série de dados) será o primeiro quartil. É só
repetir o mesmo processo feito nos passos 2 e 3.
Passo 4: o número de elementos é 5 (n = 5, ímpar).
1º 2º 3º 4º 5º
15 16 20 20 20
Observe que o elemento que ocupa a terceira posição é o 20, então Q1 = 20.
Como interpretar esses dados? 25% dos dados observados são menores ou
iguais a 20. Já 75% dos valores observados, são maiores ou iguais a 20.
68
Observe que podem ser usadas, também, para calcular a posição do primeiro quartil
e do terceiro, respectivamente, as seguintes fórmulas:
Para o primeiro quartil
Para o terceiro quartil
Veja, passo a passo, como você pode calcular o terceiro quartil.
Passo 1: o número de elementos é 11 (n = 11).
1º 2º 3º 4º 5º 6º 7º 8º 9º 10º 11º
15 16 20 20 20 22 22 22 25 26 28
Observe que o elemento que ocupa a nona posição é o 25, então Q3 = 25.
•• Percentis
Observação: para calcular a posição dos percentis use a seguinte fórmula.
Para o primeiro quartil
•• = posição da separatriz;
•• N ou n = tamanho da população (ou amostra);
•• i = número da separatriz (ex.: P60 = i = 60).
69
Capítulo 2
Continuando com o mesmo exemplo, calcule o sexagésimo percentil.
Passo 1: o número de elementos é 11 (n = 11) e o i = 60.
Passo 2: = 7,2, ou seja, entre a 7ª e a 8ª posições.
1º 2º 3º 4º 5º 6º 7º 8º 9º 10º 11º
15 16 20 20 20 22 22 22 25 26 28
Passo 3: para calcular o sexagésimo percentil, você deve encontrar o valor que fica
entre os valores que ocupam a 7ª e a 8ª posições.
• Valor que ocupa a 7ª posição = 22.
Então, = 22.
iguais a 22. Já 40% dos valores observados, são maiores ou iguais a 22.
•• Decís
Se você notar, poderá comparar os decís com alguns percentis.
Decís 1º 2º 3º 4º 5º 6º 7º 8º 9º
Percentis 10º 20º 30º 40º 50º 60º 70º 80º 90º
Isso mesmo, por exemplo, o D1 = P10, o D2 = P20, o D3 = P30 e, assim,

sucessivamente. Note, também, que as interpretações são as mesmas:
70
•• para o primeiro decil, 10% dos valores observados são menores e

90% dos valores observados são maiores;
•• para o segundo decil, 20% dos valores observados são menores e
80% dos valores observados são maiores;
•• para o terceiro decil, 30% dos valores observados são menores e
70% dos valores observados são maiores etc.
Continuando com o mesmo exemplo, calcule o terceiro decil. Note que ele é igual
ao trigésimo percentil (D3 = P30)! Será a mesma coisa que calcular P30.
Passo 1: o número de elementos é 11 (n = 11) e o i = 30.
Passo 2: PD3 = PP30 = 3,6, ou seja, D3 está entre a 3ª e a 4ª posições.
1º 2º 3º PD3 4º 5º 6º 7º 8º 9º 10º 11º
15 16 20 D3 20 20 22 22 22 25 26 28
Passo 3: para calcular o terceiro decil, você deve encontrar o valor que fica entre os
valores que ocupam a 3ª e a 4ª posições.
Então, D3 = 20.
iguais a 20. E 70% dos valores observados são maiores ou iguais a 20.
Assim como você estudou na média, aqui, também para efeito de cálculo, você
usará diferente tratamento quando se tratar de dados agrupados com intervalos
(variável contínua) e dados agrupados sem intervalos (variável discreta). No
entanto, para a finalidade deste estudo, não será incluído.
71
Capítulo 2
Seção 2
Medidas de dispersão
Para compreender melhor o que são as medidas de dispersão, acompanhe o
exemplo a seguir.
A realização de testes em três grupos de pessoas resultou nos escores

descritos na sequência.
Tabela 2.8 − Escores (em pontos) obtidos por pessoa (10 pessoas) e divididos em grupos
Grupos Escores (em pontos) obtidos por pessoa (10 pessoas) Total
Grupo 1: 6 6 6 6 6 6 6 6 6 6 60
Grupo 2: 1 8 9 2 6 10 5 8 7 4 60
Grupo 3: 5 6 7 7 6 5 6 7 5 6 60
Se você calcular a média dos escores para cada grupo, obterá os seguintes resultados.
Para o grupo 1:
ou seja, 6 pontos é o escore médio;
Para o grupo 2:
ou seja, 6 pontos é o escore médio;
Para o grupo 3:
ou seja, 6 pontos é o escore médio.
Observe que os escores médios dos três grupos são iguais. E agora, como
diferenciar um grupo do outro? Olhando somente para os dados, você pode tirar
algumas conclusões: no grupo 1, as pessoas têm o mesmo escore; no grupo 2,
os escores são diversificados; e, no grupo 3, existe uma pequena diversificação,
ou seja, os escores estão bem próximos da média.
72
Pode-se afirmar, quanto à dispersão das séries anteriores, que:
•• grupo 1: não é uma série em que os dados apresentam dispersão

com relação à média, ou seja, os dados estão totalmente
concentrados na média;
•• grupo 2: é uma série de dados em que os valores observados estão
bastante dispersos, ou seja, apresenta muitos valores distantes da
média. Podemos dizer que é uma série dispersa;
•• grupo 3: há uma pequena diferença de alguns dados com relação
à média, ou seja, apresenta uma pequena dispersão com relação à
média, os dados estão concentrados em torno da média.
Em resumo, nos grupos 1 e 3, a média pode servir como uma medida

representativa, mas, no grupo 2, a média não resulta representativa.
Para identificar esses tipos de situações é que usamos as medidas de dispersão.

Essas medidas são a maneira mais adequada para quantificar a dispersão dos
dados e avaliar a representatividade da média.
As principais medidas denominadas de dispersão absolutas são: amplitude total,

desvio médio simples, variância e desvio padrão.
O desvio médio simples, não menos importante, não será visto neste estudo,
pois, para o objetivo que se pretende alcançar, a variância e o desvio padrão são
mais adequados.
Cálculos da variância e do desvio padrão

Para começar a trabalhar com dispersão, é necessário que você conheça as
definições e as formas de representação da variância e do desvio padrão.
A variância é a média dos quadrados dos desvios de cada valor da série com relação à
média. Ficou complicado? Não se preocupe, a seguir você vai aprender como calcular!
O desvio padrão é a raiz quadrada da variância, pois assim fica mais fácil analisar e
comparar com a média; se usássemos a variância, as unidades seriam ao quadrado,
enquanto que o desvio padrão apresentaria a mesma unidade de medida que a média.
Veja a seguir como representá-las.
73
Capítulo 2
Quadro 2.2 − Representação do desvio padrão
População Amostra
(x) variância S2 (x) variância
(x) desvio padrão s (x) desvio padrão
σ = 18ª letra do alfabeto grego, chama-se sigma.
•• A variância e o desvio padrão para dados brutos

Neste item, você vai aprender como calcular a variância e o desvio padrão para dados
brutos. Preste atenção! A fórmula para população e para amostra são diferentes.
O quadro a seguir apresenta as fórmulas utilizadas para calcular a variância e o

desvio padrão.
Quadro 2.3 − Fórmulas para o cálculo de medidas de dispersão com dados brutos
Medidas População Amostra
Variância
Desvio padrão
Observação: a diferença entre as duas fórmulas da variância são os

denominadores. Para a população, usamos n e, para a amostra, usamos n – 1.
Como, ao trabalharmos com uma amostra para estimar valores de uma população,
a variabilidade dos dados é maior, então, dessa maneira, é mais indicado usarmos
n – 1 para que não subestimemos a dispersão. O n – 1 é usado, nesse caso,
como uma correção para a variância da amostra. Para amostras com mais de 30
elementos, essa correção torna-se irrelevante.
Para você entender melhor, imagine que a média de depósitos diários de

uma agência bancária seja de 120.000 reais e a variância, de 25.000 reais ao
quadrado. Seria difícil comparar reais com reais ao quadrado. Para tanto, ao fazer
uso do desvio padrão, o qual corresponde à raiz quadrada de 25.000 reais ao
quadrado, teríamos 5.000 reais. E essa é a mesma unidade de medida da média.
74
Daremos continuidade ao exemplo, para calcular a variância e o desvio padrão.

Acompanhe a resolução passo a passo.
Exemplo 1: uma vez dadas as notas: 6; 7; 7,8 e 8.
Passo 1: calcular a média: observe que, na média para a população, usa-se a

letra grega μ.
Passo 2: agora, calcular os desvios ao quadrado -
- = (6 – 7,20) = (-1,20)2= 1,4400
- = (7 – 7,20) = (−0,20)2 = 0,0400
- = (7,8 – 7,20) = (0,60)2 = 0,3600
- = (8 – 7,20) = (0,80)2 = 0,6400
Passo 3: calcular a média dos quadrados dos desvios, ou seja, a variância. Aqui,
você vai calcular para a população e para a amostra.
• Caso sejam dados de uma população:
Então:
• Caso sejam dados de uma amostra:
Então:
Passo 4: calcular o desvio padrão, calculando a raiz da variância.
75
Capítulo 2
Interpretação dos dados – Para dados de uma população, a variabilidade das

notas é de 0,79 pontos. Para dados de uma amostra, a variabilidade das notas é
de 0,91 pontos. Ou seja, a média é 7,20 e para a amostra de notas poderia chegar
a 7,20-0,91 = 6,29 e 7,20 +0,91 = 8,11.
•• A variância e o desvio padrão para dados agrupados sem

intervalos (variável discreta)
Agora, você vai calcular a variância e o desvio padrão para dados que foram
organizados em tabelas, ou seja, após a coleta, eles foram organizados em
categorias e tabelas, nas quais os dados estão agrupados sem intervalos.
Observe as fórmulas que são utilizadas para calcular esse tipo de dados, a
variância e o desvio padrão.
Quadro 2.4 − Fórmulas para o cálculo de medidas de dispersão com dados agrupados sem intervalos
Variância
Desvio padrão
Acompanhe o exemplo a seguir para compreender como realizar o cálculo dos

dados agrupados sem intervalos.
Exemplo: a tabela apresenta dados referentes à remuneração de funcionários de

uma empresa. Foram levantados o número de funcionários e sua faixa salarial, em
número de salários-mínimos.
76
Tabela 2.9 − Remuneração de funcionários
Nº de salários- Nº de xi.fi (x − )2.fi

mínimos (xi) funcionários (fi) (1-3,33)2.29 = 157,4381
1 29 29 157,4381
2 28 56 49,5292
3 20 60 2,1780
4 18 72 8,0820
5 16 80 44,4560
6 15 90 106,9335
7 9 63 121,1607
∑ 135 450 489,7757
∑ fi ∑ xi.fi S (x − i
)2.fi
Agora, acompanhe o cálculo passo a passo.
Passo 1: inicie por somar a coluna das frequências simples (fi) para obter ∑fi
(frequência total); ∑fi = 135.
Passo 2: calcule a média: multiplique cada xi por sua correspondente fi e escreva

na coluna xi. fi, some os valores calculados e escreva esse resultado no final da
coluna e divida pelo resultado do passo 1 (∑ fi).
Para facilitar os cálculos, arredondamos a média em duas casas decimais.
Passo 3: calcule a soma dos quadrados dos desvios e multiplique por fi, esta
coluna vai ser utilizada na parte de cima da fórmula da variância, - 2 . fi:
• 1 − 3,33 = (−2,33)2 = 5,4289 . 29 = 157,4381

• 2 − 3,33 = (−1,33)2 = 1,7689 . 28 = 49,5292
• 3 − 3,33 = (−0,33)2 = 0,1089 . 20 = 2,1780
• 4 − 3,33 = (0,67)2 = 0,4489 . 18 = 8,0802
77
Capítulo 2
• 5 − 3,33 = (1,67)2 = 2,7785 . 16 = 44,4560

• 6 − 3,33 = (2,67)2 = 7,1289 . 15 = 106,9335
• 7 − 3,33 = (3,67)2 = 13,4689 . 9 = 121,1607
Some os valores: (∑ - 2
. fi = 489,7757
Neste passo, usa-se quatro casas decimais, deixando para arredondar para duas
casas somente o resultado.
Passo 4: calcule a variância.
Na variância, serão usadas quatro casas decimais, pois ainda será necessário extrair
a raiz quadrada para chegar ao desvio padrão.
Passo 5: calcule o desvio padrão.
Interpretação dos dados − Para dados de uma população, a variabilidade

do número de salários é de 1,90 salários. Para dados de uma amostra, a
variabilidade do número de salários é de 1,91 salários.
•• Dados agrupados com intervalos (variável contínua)

Neste item, você poderá ver como se calcula a variância e o desvio padrão para
dados agrupados com intervalos (variável contínua).
78
Observe as fórmulas que são utilizadas para calcular esse tipo de dados.
Quadro 2.5 − Fórmulas para o cálculo de medidas de dispersão com dados agrupados com intervalos
Variância
Desvio padrão
Para o caso de dados agrupados com intervalos, usa-se o ponto médio – PM –

de cada intervalo, pois não se tem um valor específico para usar. O ponto médio
serve como uma boa aproximação.
Agora, vamos analisar um exemplo para realizar os cálculos de medidas de

dispersão com dados agrupados com intervalos.
Nº de vendas Nº de
PM PM.fi (PMi − )2.fi
(17,3 - 24,75)2.12 = 666,0300
15,9 |-- 18,7 12 17,3 207,6 666,0300
18,7 |-- 21,5 8 20,1 160,8 172,9800
21,5 |-- 24,3 12 22,9 274,8 41,0700
24,3 |-- 27,1 5 25,7 128,5 4,5125
27,1 |-- 29,9 3 28,5 85,5 42,1875
29,9 |-- 32,7 6 31,3 187,8 257,4150
32,7 |-- 35,5 10 34,1 341,0 874,2250
Total (∑fi) 56 1.386 2.058,4200
∑ fi ∑ PMi . fi S (PMi − )2.fi
Acompanhe os cálculos passo a passo.
79
Capítulo 2
Passo 1: primeiro, some a coluna das frequências simples (fi) para obter ∑fi
(frequência total); ∑fi = 56.
Passo 2: calcule a média; nesse caso, calcule o ponto médio de cada intervalo,
multiplique cada PM por sua correspondente fi e escreva na coluna PM.fi; e some
os valores e divida o resultado pelo resultado do passo 1 (∑fi). Assim, você obterá:
Passo 3: calcule a soma dos quadrados dos desvios e multiplique por fi, esta
coluna vai ser utilizada na parte de cima da fórmula da variância, - . fi .
• 17,3 − 24,75 = (−7,45)2 = 55,5025 . 12 = 666,0300

• 20,1 − 24,75 = (−4,65)2 = 21,6225 . 8 = 172,9800
• 22,9 − 24,75 = (−1,85)2 = 3,4225 . 12 = 41,0700
• 25,7 − 24,75 = (0,95)2 = 0,9025 . 5 = 4,5125
• 28,5 − 24,75 = (3,75)2 = 14,0625 . 3 = 42,1875
• 31,3 − 24,75 = (6,55)2 = 42,9025 . 6 = 257,4150
• 34,1 − 24,75 = (9,35)2 = 87,4225 . 10 = 874,2250
Some os valores :
∑ - . fi .= 2.058,4200.
Passo 4: calcule a variância.
Passo 5: calcule o desvio padrão.
80
Interpretação dos dados − Para dados de uma população, a variabilidade

do volume de vendas é de 6,06 mil reais. Para dados de uma amostra, a
variabilidade do volume de vendas é de 6,12 mil reais.
•• Interpretação do desvio padrão

O desvio padrão é uma importante medida de dispersão. É com ele que você
irá quantificar a dispersão dos dados de uma série com relação à sua média.
Preste atenção:
•• quanto maior o valor do desvio padrão, mais dispersos estão os

valores. Pode-se dizer, também, que mais distantes estão da média;
•• quanto menor o valor do desvio padrão, menos dispersos estão os
valores. Pode-se dizer, também, que mais próximos estão da média.
Veja a figura, a seguir, para compreender melhor o que foi colocado.
Figura 2.2 − Quanto mais distantes da média, mais dispersos os dados estão
S=0
7
6
S=0,8 S=1,2
5
f=3,0
4
3
2
1
1 2 3 4 5 6 7 1 2 3 4 5 6 7 1 2 3 4 5 6 7 1 2 3 4 5 6 7
O desvio padrão cresce quando a dispersão dos dados aumenta
Fonte: Triola (1999, p. 42).
81
Capítulo 2
Outra utilização do desvio padrão
Muitas séries, quando representadas por seu polígono de frequências, com certo
ajuste nas curvas, apresentam um formato semelhante a um sino, uma curva
simétrica (observando que a média, a moda e a mediana estão posicionadas ao
centro), como mostra o gráfico a seguir.
Gráfico 2.1 − Gráfico da curva normal
x
Para séries de dados que apresentam esse tipo de representação, pode-

se trabalhar com a área abaixo do polígono. A área abaixo é proporcional à
frequência total. Essa curva é chamada de Curva Normal ou Curvas de Gauss,
e suas principais características são:
•• a curva caracteriza-se por ter a forma de um sino;

•• a curva normal é simétrica com relação à média;
•• a área limitada pela curva e pelo eixo das abscissas é 1 ou 100%;
•• a curva é assintótica, isto é, aproxima-se indefinidamente do eixo
das abscissas sem tocá-lo;
•• a curva normal é unimodal, ou seja, possui um só pico ou ponto de
frequência máxima, ponto este que coincide com a moda, a média
e a mediana.
Como relacionar a curva com o desvio padrão? Veja a curva a seguir.
Gráfico 2.2 − Gráfico da curva normal
34,13% 34,13%
13,59% 13,59%
2,15% 2,15%
σ σ σ μ σ σ σ
82
Exemplo: em uma série em que μ = 80 e o σ (x)=3, pode-se interpretar esses

valores da seguinte forma:
•• os valores da série estão concentrados em torno da média, que é de

80 unidades;
•• o intervalo [μ − σ(x); μ + σ(x)] contém, aproximadamente, 68,26% dos
elementos da série, ou seja, o intervalo [77;83];
•• o intervalo [μ − 2σ(x); μ + 2σ(x)] contém, aproximadamente, 95,44%
dos elementos da série, isto é, o intervalo [74;86];
•• o intervalo [μ − 3σ(x); μ + 3σ(x)] contém, aproximadamente, 99,74%
dos elementos da série, ou seja, o intervalo [71;89].
A curva normal será utilizada nos cálculos de distribuição de probabilidade
Coeficiente de variação
•• Séries de dados com médias iguais
Acompanhe o exemplo: considere dois grupos de pessoas, nos quais foram
feitos levantamentos de suas rendas. Os resultados desse levantamento foram
os seguintes:
Tabela 2.11 – Resultado do levantamento de renda de uma população
Grupo 1 Grupo 2
Média: μ = 122 pontos Média: μ = 122 pontos
Desvio padrão: σ(x) = 4,5 pontos Desvio padrão: σ(x) = 7,5 pontos
Compare a dispersão das duas séries:
•• note que as médias são iguais;

•• o desvio padrão do grupo 1 é 4,5, e o do grupo 2 é 7,5; portanto, o grupo
que apresenta maior dispersão quanto ao nível de renda é o grupo 2;
•• conclusão: os níveis de renda do grupo 2 são mais dispersos
com relação ao grupo 1 (valores mais distantes da média); ou, os
integrantes do grupo 1 têm renda mais semelhantes entre eles do
que os integrantes do grupos 2.
83
Capítulo 2
Para comparar duas séries de dados usando medidas de dispersão absolutas

(variância e desvio padrão) é necessário que as médias sejam iguais, caso
contrário, usamos uma medida de dispersão relativa que veremos nesta seção.
•• Séries de dados com médias diferentes

Como você pôde observar no item anterior, para comparar duas séries de dados
quanto a suas dispersões, pode-se usar valores absolutos dos desvios padrão,
mas somente quando as médias são iguais.
Quando as médias são diferentes, utiliza-se o Coeficiente de Variação (CV), que

é uma medida de dispersão relativa.
O coeficiente de variação é a relação do desvio com a média. Veja a fórmula a seguir.
Tabela 2.12 – Fórmula do coeficiente de variação
Para a população Para a amostra
A série que apresentar maior coeficiente de variação será a série de maior

dispersão dos dados. O resultado é expresso em percentual (%), ou seja, quanto
o desvio padrão representa da média.
Acompanhe o exemplo a seguir para compreender como realizar o cálculo.
Exemplo: considere dois grupos de pessoas, nos quais foram feitos levantamentos
de suas rendas. Os resultados desse levantamento foram os seguintes.
Tabela 2.13 – Resultado do levantamento
Grupo 1 Grupo 2
Desvio padrão: σ(x) = 9,8 reais Desvio padrão: σ(x) = 7,5 reais
Média: μ = 145 reais Média: μ = 95 reais
84
•• note que as médias são diferentes;

•• o desvio padrão do grupo 1 é 9,8; e, o do grupo 2 é 7,5; portanto,
o grupo que apresenta maior dispersão absoluta quanto ao nível de
renda é o grupo 1;
•• como as médias são diferentes, devemos calcular o coeficiente de
variação, pois, simplesmente pela dispersão absoluta, não podemos
afirmar nada (se fossem iguais, bastaria a dispersão absoluta).
· Para o grupo 1:

· Para o grupo 2:

O grupo que apresenta maior coeficiente de variação é o grupo 2. Ou seja, os

níveis de renda observados no grupo 2 são mais dispersos com relação ao grupo
1 (valores mais distantes da média).
Comparando os dois, você poderia dizer que, no grupo 1, as pessoas têm a

renda mais próxima da média do grupo do que no Grupo 2, que, por sua vez,
as pessoas apresentam níveis de renda mais diferenciados da média do grupo,
comparando os dois grupos.
Para comparar a dispersão dos dados de duas séries de médias diferentes, usamos
o coeficiente de variação. Ele compara o desvio padrão com a média (proporção)
entre o desvio padrão e a média da série, sendo, assim, considerado uma forma
mais eficaz de comparação e, portanto, prevalecendo sobre a absoluta.
85
Capítulo 2
1. Uma empresa procurou estudar a ocorrência de uso de drogas lícitas –

bebidas alcoólicas – por seus empregados, tendo, para isso, realizado um
levantamento sobre o número de dias por semana que cada um dos empregados
costuma beber. Calcule e interprete a média. Os dados correspondentes são:
Consumo de bebidas alcoólicas por semana pelos funcionários
No de dias (xi) No de func. (fi) xi . fi
0 10
1 16
2 14
3 8
4 5
5 4
6 4
7 3
Total (∑fi) 64
Fonte: Pesquisa de campo (dados fictícios)
2. Os dados seguintes representam a renda de uma amostra de famílias de

um bairro de classe baixa de Florianópolis, em reais (dados fictícios). Calcule e
interprete a média.
Renda de famílias de um bairro de classe baixa de Florianópolis
Renda (R$) No de famílias (fi) PM PM.fi

112 | --- 115 2
115 | --- 118 6
118 | --- 121 4
121 | --- 124 9
124 | --- 127 8
127 | --- 130 7
Total (∑fi) 36
Fonte: Dados fictícios
86
3. Nos itens a seguir, estão dois conjuntos de dados. Calcule a mediana para
cada um deles e interprete seus resultados.
a. Conjunto 1
15 19 13 21 16 17 15 12 13
Sugestão: use a tabela a seguir para organizar e posicionar os dados.
b. Conjunto 2
17 18 14 14 15 15 16 16 13
Sugestão: use a tabela a seguir para organizar e posicionar os dados.
4. Nas opções a seguir, estão três conjuntos de dados. Encontre a moda para
cada um deles e interprete seus resultados.
a. Conjunto 01
7 6 5 8 2 1 3 2 1
1 7 6 8 5 1 2 2 7
b. Conjunto 02
5 6 8 2 3 5 3 3
2 6 5 8 3 2 5 6
c. Conjunto 03
5 6 3 7 5 3 2 1
1 6 7 2 8 4 8 4
87
Capítulo 2
5. Em um grupo de pacientes acometidos de fobias, foi levantado o tempo

para tratamento, em anos, conforme tabela abaixo. Calcule o Q3, o D9 e o P35 e
interprete seus resultados.
Tempo para tratamento de fobias, em anos:
4 6 8 2 5 9 4 3 8 9 5 4
Use a tabela abaixo para organizar e posicionar os dados.
6. Os dados a seguir representam o tempo em minutos usados por um grupo

de seis pessoas na realização de um teste. Calcule a variância e o desvio padrão,
considerando como uma população.
Tempo (em min.): 25, 22, 36, 20, 29, 38.
7. Os escores obtidos por cinco pessoas em um teste estão relacionados a

seguir. Calcule a variância e o desvio padrão, considerando como uma amostra.
Tempo: 15, 10, 9, 23, 31.
8. Uma empresa procurou estudar a ocorrência de uso de drogas lícitas – bebidas

alcoólicas – por seus empregados, tendo, para isso, tem-se realizado um levantamento
sobre o número de dias por semana que cada um dos empregados costuma beber.
Calcule a variância e o desvio padrão, considerando que os dados são de uma amostra
(sugere-se utilizar colunas para facilitar o cálculo). Os dados correspondentes são:
88
Nº de xi . fi
Nº de dias (xi) (x − )2.fi
funcionários (fi)
0 10
1 16
2 14
3 8
4 5
5 4
6 4
7 3
∑ 64
Fonte: Elaboração autor, 2016.
9. Na tabela a seguir, estão relacionados dados relativos à idade de um grupo

de 63 estudantes matriculados em uma disciplina da Unisul Virtual. Calcule a
variância e o desvio padrão, considerando que são dados da população (sugere-
se utilizar colunas para facilitar o cálculo).
Idade dos estudantes da disciplina Estatística
Idade (xi) Nº de estudantes (fi) xi . fi (xi − μ )2.fi

17 5
18 20
19 22
20 10
21 6
∑ 63
Fonte: Dados fictícios elaborados pelo autor.
89
Capítulo 2
10. Os dados abaixo representam a renda de uma amostra de famílias de um

bairro de classe baixa de Florianópolis, em reais. (dados fictícios). Calcule a
variância e o desvio padrão, considerando como sendo dados de uma amostra.
Renda (R$) No de famílias (fi) PM PM.fi (PMi − )2.fi
112 | --- 115 2

115 | --- 118 6
118 | --- 121 4
121 | --- 124 9
124 | --- 127 8
127 | --- 130 7
Total (∑fi) 36
Fonte: Elaboração do autor, 2016.
11. Analise cada caso, comparando quanto à dispersão dos dados, e responda
as perguntas:
a. Qual das séries apresenta maior dispersão absoluta (comparar os

desvios padrão)?
b. Qual das séries apresenta maior dispersão relativa (comparar os
coeficientes de variação)?
c. Conclua qual das séries realmente apresenta maior dispersão (não
se esqueça de que o coeficiente de variação é mais eficaz para
determinar a dispersão de uma série).
11.1
Série A Série B
μ = 57; σ(x) = 5,6 μ = 96; σ(x) = 8,2
11.2
Série A Série B
μ = 64; σ(x) = 12 μ = 96; σ(x) = 18
90
Capítulo 3
Probabilidade
Seção 1
Principais conceitos
A partir de agora, você iniciará o estudo da Estatística Indutiva, que tem como
base o estudo de probabilidades.
Talvez você deva estar perguntando-se: probabilidade? O que é? Tenho certeza

de que muitas vezes você já pensou em “possibilidades” de algo acontecer. Será
que vai chover? Será que serei escolhido para participar de um grupo? Será que
vou encontrar meu amigo hoje? etc.
Muitas vezes, não podemos prever acontecimentos como esses, ou seja, podem
acontecer ou não. Você até poderia associar isso tudo à sorte ou ao azar, enfim,
ao acaso. E é aqui que o estudo de probabilidade entra. Tentar formular e calcular
modelos matemáticos que definam essas situações e possibilitem a você tomar
suas decisões e, assim, conduzir sua vida, suas experiências e seus caminhos;
esse é um dos principais objetivos desta unidade.
Nesta unidade, você também conhecerá como é possível expressar em

números algumas situações com a finalidade de possibilitar um melhor
tratamento matemático a elas. Serão apresentados os tipos de distribuições de
probabilidades e como se calcula probabilidade usando a distribuição discreta e a
distribuição contínua de probabilidades.
Vamos começar com os conceitos de fenômenos, o que é um espaço amostral

e o que são eventos. Esses são alguns dos conceitos mais importantes que são
utilizados na probabilidade. O objetivo é que você compreenda como aplicar
esses conhecimentos no seu dia a dia.
91
Capítulo 3
Fenômenos (ou experimentos)

Você pode entender por fenômeno quaisquer acontecimentos, sejam eles naturais
ou não. Eles podem ser classificados em dois tipos: determinísticos ou aleatórios.
Fenômenos determinísticos: são fenômenos em que as condições iniciais

determinam um único resultado.
Fenômenos aleatórios: são fenômenos em que as condições iniciais não

determinam a possibilidade da existência de um resultado em particular.
Em resumo, quando você pode determinar o resultado de um fenômeno, você irá

chamá-lo de determinístico, mas quando os resultados do fenômeno não podem
ser determinados, você irá chamá-lo de aleatório, pois este pode apresentar
qualquer resultado dentro de um grupo de esperados (mais de um).
Veja, a seguir, exemplos de cada um deles.
Exemplo: para ilustrar, considere dois dados diferentes. O dado 1 tem as faces
com o mesmo número de pontos em cada face, e o dado 2 é um dado normal,
tem as faces com números de pontos diferentes.
•• Dado 1: tem as faces com o mesmo número de pontos;

•• Dado 2: é um dado normal, tem as faces com números de pontos
diferentes e não é viciado (observe que um dado viciado é aquele
que, ao ser jogado, sempre sai o mesmo número).
Fenômeno determinístico: se você jogar o dado 1 várias vezes, sob as

mesmas condições, este sempre irá apresentar o mesmo número de pontos
na face voltada para cima. Nesse caso, você pode dizer que é um fenômeno
determinístico, pois não existe outra possibilidade de resultado, e é possível
prever qual será.
Fenômeno aleatório: se você jogar o dado 2 várias vezes, sob as mesmas

condições, este poderá apresentar resultados diferentes a cada lançamento.
Nesse caso, você pode dizer que é um fenômeno aleatório, pois existem várias
possibilidades de resultado, e não é possível prever qual será.
A partir do exposto, conclui-se que o estudo de probabilidade é baseado nos

fenômenos aleatórios. Você pode dizer que o estudo de probabilidades está
intimamente ligado ao acaso.
92
Espaço amostral
Observe que quando se trabalha com experimentos que admitem mais de um
resultado, torna-se interessante definir o conjunto de todos esses resultados;
nesse caso, você pode chamar esse conjunto de espaço amostral. O símbolo
para representar o conjunto do espaço amostral é S (letra maiúscula).
Espaço amostral é o conjunto de todos os possíveis resultados de um

experimento (fenômeno) aleatório.
Veja, a seguir, exemplos sobre o espaço amostral.
Ao verificar os exemplos, lembre-se de que o número de elementos do conjunto

do espaço amostral é representado por n(S):
n(S) = número de elementos de S.
Exemplo 1: você pode usar o dado 2, citado no exemplo anterior, e estudar todas
as possibilidades. Pode-se construir o seguinte conjunto.
S = {1, 2, 3, 4, 5, 6}: observe que são todas as possibilidades de pontos de um

dado normal.
Exemplo 2: um médico trabalha com um grupo de pessoas com problemas

de alcoolismo. O grupo é composto por cinco pessoas, das quais duas delas
apresentam cirrose e três não apresentam cirrose (veja legenda).
Cn – Pessoa número “n” com cirrose;

Pn – Pessoa número “n” sem cirrose.
Exemplo:
C1 – pessoa número 1 com cirrose;
P1 – pessoa número 1 sem cirrose.
Pode-se construir o seguinte conjunto:
S = {C1, C2, P1, P2, P3}: observe que são todas as possibilidades entre as
pessoas do grupo.
93
Capítulo 3
Exemplo 3: um psicólogo trabalha com um grupo de pessoas e estuda os

distúrbios do sono. O grupo é composto por sete pessoas, das quais cinco
apresentam distúrbios e duas não apresentam distúrbios (veja legenda).
Dn – Pessoa número “n” com distúrbio;

Pn – Pessoa número “n” sem distúrbio.
Exemplo:
D1 – pessoa número 1 com distúrbio;
P1 – pessoa número 1 sem distúrbio.
S = {D1, D2, D3, D4, D5, P1, P2}: observe que são todas as possibilidades entre
as pessoas do grupo.
Exemplo 4: um grupo de pessoas que apresentam diferenças na cor do cabelo

(veja legenda).
Pn - Pessoa número “n” com cabelos pretos;

Ln - Pessoa número “n” com cabelos louros;
Cn - Pessoa número “n” com cabelos castanhos;
Rn - Pessoa número “n” com cabelos ruivos.
Sabendo que, nesse grupo, tem três pessoas com cabelos pretos, duas com
cabelos louros, três com cabelos castanhos e uma com cabelos ruivos, como fica
o conjunto do espaço amostral? Pense e anote, a seguir, como você acha que
fica o conjunto do espaço amostral do exemplo.
S = {______________________________________}
Agora, compare se o seu conjunto do espaço amostral está igual ao seguinte

conjunto do espaço amostral.
S = {P1, P2, P3, L1, L2, C1, C2, C3, R1}: observe que são todas as possibilidades
entre as pessoas do grupo.
Qual é o número de elementos dos espaços amostrais citados nos exemplos

dados? Veja:
No exemplo 1: n(S) = 6;
No exemplo 4: n(S) = 9.
94
Eventos
Quando você tiver que estudar algum experimento aleatório, deverá identificar
as diferentes variações de resultados possíveis dentro do espaço amostral.
Você pode chamar de evento cada uma dessas variações, ou seja, cada uma
dessas partes (subconjuntos) do espaço amostral é um evento. O símbolo para
representar o subconjunto de um evento é A (letra maiúscula).
Um evento é qualquer subconjunto do espaço amostral determinado pelo

experimento (fenômeno) aleatório em estudo.
Ao verificar os exemplos, lembre-se de que o número de elementos de evento é

representado por n(A):
n(A) = número de elementos de A.
Usando os exemplos citados anteriormente, você pode observar:
Exemplo 1: você pode usar o dado 2, citado no exemplo anterior, e estudar todas
as possibilidades.
Pode-se construir o seguinte evento:
A: sair um número par na face superior.
A = {2, 4, 6}: observe que são todas as possibilidades de pontos pares de dado normal.
Exemplo 2: um médico trabalha com um grupo de pessoas com problemas

de alcoolismo. O grupo é composto por cinco pessoas, das quais duas delas
apresentam cirrose e três não apresentam cirrose (veja legenda).
Cn – Pessoa número “n” com cirrose;

Pn – Pessoa número “n” sem cirrose.
B: ser uma pessoa sem cirrose.

B = {P1, P2, P3}: observe que são todas as possibilidades de pessoas sem cirrose.
Exemplo 3: um professor trabalha com um grupo de pessoas e estuda os

distúrbios do humor. O grupo é composto por sete pessoas. Cinco delas
apresentam distúrbios e duas não apresentam distúrbios (veja legenda).
95
Capítulo 3
Dn – Pessoa número “n” com distúrbio;

Pn – Pessoa número “n” sem distúrbio.
C: ser uma pessoa com distúrbio.

C = {D1, D2, D3, D4, D5}: observe que são todas as possibilidades de pessoas
com distúrbio.
Exemplo 4: um grupo de pessoas que apresentam diferenças na cor do cabelo

(veja legenda).
Pn − Pessoa número “n” com cabelos pretos;

Ln − Pessoa número “n” com cabelos louros;
Cn − Pessoa número “n” com cabelos castanhos;
Rn − Pessoa número “n” com cabelos ruivos.
Sabendo que nesse grupo você tem três pessoas com cabelos pretos, duas com
cabelos louros, três com cabelos castanhos e uma com cabelos ruivos, como fica
o subconjunto do evento pessoas com cabelos ruivos?
D: ser uma pessoa com cabelos ruivos.

D = {R1}: observe que é a única possibilidade com cabelos ruivos.
Qual é o número de elementos dos eventos citados nos exemplos anteriores?
No exemplo 1: n(A) = 3;
No exemplo 2: n(B) = 3;
No exemplo 3: n(C) = 5;
No exemplo 4: n(D) = 1.
Tipos de eventos
Existem três tipos de eventos, os quais são:
•• Evento simples: formado por apenas um elemento do espaço amostral.

Exemplo: D: ser uma pessoa com cabelos ruivos. (Veja o exemplo 4).
D = {R1} ⇒ n(D) = 1
96
•• Evento composto: formado por dois ou mais elementos do

espaço amostral.
Exemplo: B: ser uma pessoa sem cirrose. (Veja o exemplo 2).
B = {P1, P2, P3} ⇒ n(B) = 3
•• Evento impossível: não ocorre, seja qual for a realização do

experimento aleatório.
Exemplo: F: ser uma pessoa com cabelos verdes naturais. (Veja o
exemplo 4).
F = { } ⇒ n(F) = 0
•• Evento certo: é quando o evento é o próprio espaço amostral.

Exemplo: E: ser uma pessoa com alcoolismo. (Veja o exemplo 2).
E = {C1, C2, P1, P2, P3} ⇒ n (E) = 5 = n(S)
Operações com eventos

As operações com eventos são muito semelhantes às operações com conjuntos,
até porque os eventos nada mais são do que conjuntos. Veja, a seguir, mais
detalhes sobre esse assunto.
•• União de eventos
Se existem os eventos A e B de um espaço amostral S, a união desses eventos
existe se pode ocorrer A ou B.
Figura 3.1 − Representação em diagrama da união entre eventos
S
A B
Fonte: Elaborado pelo autor (2006).
A união de A e B pode ser representada por: A soma B ou A∪B. A união

corresponde a toda a área colorida.
97
Capítulo 3
•• Interseção de eventos
Se existem os eventos A e B de um espaço amostral S, a intersecção desses
eventos existe se pode ocorrer A e B, simultaneamente.
Figura 3.2 − Representação em diagrama da intersecção entre eventos
S
A B
A intersecção de A e B pode ser representada por: A vezes B ou A∩B. A intersecção

corresponde a toda a área colorida.
•• Complemento de um evento
É um evento formado por todos os elementos pertencentes a S, mas que não
pertencem a A.
Figura 3.3 − Representação em diagrama do complementar de um evento
S
A
A'
Complementar de A – pode ser representado por: Ᾱ, A’ ou CA. O complementar

de A corresponde a toda a área colorida.
98
•• Subtração de eventos
Você pode dizer que A menos B é se, e somente se, ocorre A e não ocorre B.
Figura 3.4 − Representação em diagrama da subtração de eventos
S
A B
A subtração de eventos pode ser representada por A − B, que corresponde a

toda a área colorida.
•• Eventos excludentes
Dois ou mais eventos são ditos excludentes (mutuamente exclusivos) se a
realização de um dos eventos excluir a realização do outro, ou de outros eventos.
Figura 3.5 − Representação em diagrama da subtração de eventos
S
A
B
C
Se, quando A ocorrer, exclui ocorrerem os outros, isso quer dizer que não há
intersecção entre eles! A e B são mutuamente exclusivos, e B e C não são
mutuamente exclusivos.
Agora que você já estudou os conceitos mais importantes utilizados na

probabilidade, é hora de saber os conceitos de probabilidade propriamente ditos
e como são feitos os seus cálculos!
99
Capítulo 3
Seção 2
Cálculo de probabilidade
Nesta seção, vamos estudar os conceitos de probabilidade e a forma de fazer
seus cálculos! Acompanhe as duas definições mais importantes dentro do
estudo de probabilidades. São elas: a definição clássica de probabilidade e a
frequência relativa.
Veja, então, separadamente, cada uma dessas definições.
•• Probabilidade clássica
Antes de conhecer como calcular a probabilidade clássica, saiba como ela é possível.
A probabilidade de ocorrer um determinado resultado na realização de um

experimento é igual ao quociente entre o número de casos favoráveis ao sucesso
(número de elementos do evento A) e o número de casos possíveis (número de
elementos do espaço amostral S).
Observe a fórmula a seguir.
•• Probabilidade de um evento A ocorrer:
= p = sucesso.
Observação: a probabilidade de não ocorrência pode ser representada por:
= q = fracasso.
Observe que, se você quiser o resultado em porcentagem, deve multiplicá-lo por

100 ao final.
Veja, a seguir, alguns exemplos do cálculo de probabilidade clássica.
Exemplo 1: em um levantamento feito com oito moradores de um condomínio,

verificou-se que dois são casados, dois são solteiros, três são divorciados e um é
viúvo. Qual a probabilidade de, ao escolher um morador ao acaso, ele ser casado?
E qual a probabilidade de, ao escolher um morador ao acaso, ele ser divorciado?
100
Compreenda passo a passo.
Legenda
Estado civil:
C – Casado (dois moradores) C1, C2;
S – Solteiro (dois moradores) S1, S2;
D – Divorciado (três moradores) D1, D2, D3;
V – Viúvo (um morador) V1.
Passo 1: identificar os elementos do espaço amostral e do evento solicitado.
S: moradores do condomínio S = {C1, C2, S1, S2, D1, D2, D3, V1};
A: moradores casados A = {C1, C2};
B: moradores divorciados B = {D1, D2, D3}.
Passo 2: identificar o número de elementos de cada conjunto.
n(S) = 8;
n(A) = 2;
n(B) = 3.
Passo 3: usar a fórmula da probabilidade.
Observação: após efetuar a divisão, é só multiplicar por 100 para obter a

probabilidade na forma percentual.
•• Para o evento A: P(A) = 0,25 ou 25,00%
•• Para o evento B: P(A) = 0,375 ou 37,50%
Passo 4: interpretar os dados.
Como interpretar esses dados? A probabilidade de um morador casado ser escolhido

é de 25%, e a probabilidade de um morador divorciado ser escolhido é de 37,5%.
101
Capítulo 3
Exemplo 2: em um levantamento realizado com um grupo de 118 chefes de

famílias com diferentes vínculos de trabalho, obteve-se os seguintes resultados
(dados fictícios).
Figura 3.6 – Resultado do levantamento
Pesquisa dos motivos de estresse

No de
Tipos de vínculo
pessoas
Evento A M Funcionário público municipal 29 n(A)
E Funcionário público estadual 24
F Funcionário público federal 20
Evento C C Comerciário 17 n(C)
T Temporário 17
Evento B I Comércio informal 11 n(B)
Total 118
Espaço Tamanho do espaço
amostral amostral - n(S)
Se você escolher ao acaso uma pessoa do grupo pesquisado, qual a

probabilidade de ela ter vínculo do tipo:
a. funcionário público municipal;

b. comerciário;
c. comércio informal.
S: todas as pessoas pesquisadas;

A: pessoa com vínculo do tipo funcionário público municipal;
B: pessoa com vínculo do tipo comerciário;
C: pessoa com vínculo do tipo comércio informal.
n(S) = 118;
n(A) = 29;
n(B) = 17;
n(C) = 11.
102
Obs: após efetuar a divisão, é só multiplicar o resultado por 100 para obter a
Para o evento A P(A) = 0,2458 ou 24,58%.
Para o evento B P(B) = 0,0932 ou 9,32%.
Para o evento C P(C) = 0,1441 ou 14,41%.
No exemplo anterior, você calculou a probabilidade para três eventos. A

seguir, você montará uma tabela com as probabilidades para todos os eventos
calculados. Siga os passos.
S: todas as pessoas pesquisadas (no caso, pessoas acometidas de estresse);

D: pessoa com vínculo do tipo funcionário público estadual;
E: pessoa com vínculo do tipo funcionário público federal;
F: pessoa com vínculo do tipo temporário.
n(S) = 118;
n(D) = 24;
n(E) = 20;
n(F) = 17.
103
Capítulo 3
Para o evento D P(D) = 0,2034 ou 20,34%.
Para o evento E P(E) = 0,1695 ou 16,95%.
Para o evento F P(F) = 0,1441 ou 14,41%.
Passo 4: montar a tabela com as probabilidades correspondentes a cada evento.
Tabela 3.1 – Levantamento com 90 chefes de famílias sobre os diferentes vínculos de trabalho
Tipos de vínculo No de pessoas Probabilidade
M Funcionário público municipal 29 0,2458

E Funcionário público estadual 24 0,2034
F Funcionário público federal 20 0,1695
C Comerciário 17 0,1441
T Temporário 17 0,1441
I Comércio informal 11 0,0932
Total 118 1*
* Repare que a soma é 1 ou 100%

Agora que você já compreendeu o conceito clássico de probabilidade e como

realizar os cálculos, é hora de compreender o que é frequência relativa e como
realizar os cálculos.
Frequência Relativa
A frequência relativa de um evento A é calculada dividindo o número de vezes
que ocorre o evento A pelo total de observação do experimento. É chamada,
também, de probabilidade avaliada ou probabilidade estimada.
Veja a fórmula abaixo.
Frequência relativa de um evento A.
frA = número de vezes que ocorreu A

número total de observações

104
Na verdade, a frequência relativa é calculada quando você deparar-se com

situações em que o cálculo da probabilidade de um evento não é possível. Nesse
caso, só é possível o cálculo de uma aproximação, a qual, por sua vez, consiste em
analisar o experimento e, com os resultados obtidos, calcular a frequência relativa.
É importante que você saiba que essa aproximação para o cálculo de probabilidade
só será considerável caso haja um número bastante grande de tentativas de
execução do experimento. Como fazer isso? Veja os exemplos a seguir.
•• Exemplos do cálculo da frequência relativa.

Em um teste feito com cobaias em laboratório, foi analisada uma delas e, após
inúmeras vezes, sob efeito de estímulos (comida, reação a dor etc.), ela executou
um comando, que era empurrar uma pequena alavanca. Foi observado que, após
3500 estímulos, a cobaia executou o comando 875 vezes. Qual é a frequência
relativa para o evento A: a cobaia executar o comando?
Como realizar o cálculo passo a passo.
Passo 1: identificar o numerador e o denominador da fórmula.
Número total de observações: 3500.

Número de vezes que ocorre A: 875.
Passo 2: usar a fórmula da frequência relativa.
frA = número de vezes que ocorreu A

número total de observações
Passo 3: interpretar os dados.
A frequência relativa para a cobaia executar a tarefa é de 25%; ou, ainda, a

probabilidade estimada da cobaia executar a tarefa é de 25%.
105
Capítulo 3
•• Algumas considerações.
Consideremos S um espaço amostral, e A, B, C são eventos contidos em S, então:
a. para cada evento A → 0 ≤ P(A) ≤ 1 (a probabilidade de A vai de 0 a

1 ou de 0% a 100%);
b. P(S) = 1 ↔ ;
c. sejam A, B e C todos os eventos possíveis do espaço amostral, então

P(A) + P(B) + P(C) = 1 ou 100%;
d. quando A e B são mutuamente exclusivos: P(A ∪ B) = P(A) + P(B);

e. quando A e B não são mutuamente exclusivos: P(A ∪ B) = P(A) +
P(B) – P(A ∩ B);
f. se A, B, C, ... são uma sequência de eventos mutuamente
exclusivos, então P(A ∪ B ∪ C ∪...) = P(A) + P(B) + P(C) + ....
Seção 3
Distribuição de probabilidades
A variável aleatória é uma ferramenta na análise estatística que possibilita a
atribuição de números para resultados de experimentos, adequando, assim, o
problema para um melhor tratamento matemático. Dentro da Estatística, ela é
considerada uma função que associa os números aos eventos de um espaço
amostral. Você poderá entender melhor se começar analisando um exemplo.
•• Exemplos de variável aleatória e distribuição de probabilidades.

Exemplo 1: se o experimento consistir em dois lançamentos de uma moeda, e a
variável aleatória (v.a.), definida como o nº de caras obtidas em dois lançamentos
de uma moeda, então você terá:
v.a. ⇒ X = nº de caras obtidas em dois lançamentos de uma moeda;
X definirá uma variável aleatória que poderá assumir os valores descritos na

tabela a seguir (K = cara e C = coroa).
106
Tabela 3.2 − Organização dos resultados e valores
Resultados Resultados Resultados possíveis nos Valor VA

1º lançamento 2º lançamento dois lançamentos
K K KK 2
K C KC 1
C K CK 1
C C CC 0
Você pode observar que existe apenas uma possibilidade para cada situação e o total
de possibilidades é 4; então, o cálculo da probabilidade dá-se da seguinte forma.
Escrevendo na tabela, atribuindo a probabilidade de cada linha, você terá

conforme na sequência.
Tabela 3.3 − Distribuição de probabilidade
Resultados possíveis
Valor VA Probabilidade
nos dois lançamentos
KK 2 1
/4
KC 1 1
/4
Duas possibilidades
CK 1 1
/4
de sair uma cara
CC 0 1
/4
Essa tabela caracteriza a distribuição de probabilidade, que é a probabilidade

de ocorrência de cada um dos valores da variável aleatória.
Note que o valor 1 repete-se, não é? Então, você pode agrupar e montar uma
nova tabela sem as repetições. É claro que se agrupam os valores repetidos. Você
deve somar as probabilidades, não se esqueça disso. Observe a seguir.
107
Capítulo 3
Tabela 3.4 − Agrupamento de resultados
Ao agrupar os
No de caras (Valor v.a) Probabilidade
resultados da variável
2 1
/4 aleatória (uma cara -1),
1 1
/2 você deve somar as
probabilidade:
0 1
/4
O estudo de probabilidades é uma ferramenta de apoio à decisão. É com base em

seu estudo que você terá oportunidade de suporte para analisar os experimentos,
organizar suas possibilidades e, então, partir para a ação, adotando o resultado
que julgar mais eficaz.
A variável aleatória e a distribuição de probabilidades são muito utilizadas

nesse sentido. Você pode ver que, a cada valor da variável, corresponde uma
probabilidade de ocorrência.
Como a variável aleatória possibilita a atribuição de valores aos eventos, você

pode encontrar dois tipos de situação.
Variáveis aleatórias discretas: elas podem assumir um conjunto constante

discreto, ou seja, enumerável, finito de valores.
Exemplo: número de caras resultante de lançamentos de uma moeda,

quantidade de caminhões de determinado modelo, número de defeitos por peça,
entre outros, são exemplos deste tipo de variáveis.
Variáveis aleatórias contínuas: são as variáveis em que não conseguimos

enumerar seus possíveis resultados, por estes formarem um conjunto infinito de
valores em um intervalo de números reais.
Exemplo: peso, altura, temperatura, tempo de transporte, custo de uma operação etc.
Baseado nesses dois conceitos, você pode atribuir a cada um dos tipos de
variáveis aleatórias uma distribuição de probabilidades de acordo com o tipo de
variável, veja a figura a seguir.
Figura 3.7 − Tipos de distribuição de probabilidade
Variável aleatória Distribuição discreta

discreta de probabilidade
Variável aleatória Distribuição contínua

contínua de probabilidade
108
Como você pôde observar, cada tipo de variável gera um tipo de distribuição de
probabilidade. Em resumo, os tipos de distribuição de probabilidades são:
•• distribuição discreta de probabilidades; e

•• distribuição contínua de probabilidades.
Como elas são diferentes, os métodos de cálculos das probabilidades também são.
Você vai estudar, na próxima seção, os modelos mais importantes e mais

aplicados dentro da área de seu curso, que são a distribuição binomial, para a
variável discreta, e a distribuição normal, para a contínua 1.
Uma distribuição discreta de probabilidade de uma variável aleatória atribui

probabilidades aos distintos valores dessa variável. Observe que essa distribuição
não atribui probabilidade para intervalos, e sim para cada valor ou para um
conjunto de valores da variável.
Uma das principais distribuições discretas é a binomial. Veja, a seguir, como se

calcula probabilidade usando esse método.
A distribuição binomial é o método utilizado para cálculo de probabilidades de

experimentos que se repetem algumas vezes e seguem algumas características.
A distribuição binomial é aplicável se:
1. o experimento que você está observando for repetido n vezes

independentes;
2. cada tentativa (repetição) admitir somente dois resultados:
· sucesso: denotado por S;
· fracasso: denotado por F.
A probabilidade de sucesso é denotada por p ⇒ P(S) = p, e a probabilidade de

fracasso é denotada por q ⇒ P(F) = q.
Importante: a soma das probabilidades de sucesso e fracasso é igual a 100%,

ou seja, é igual a 1 ⇒ p + q = 1.
A soma é utilizada se você estiver interessado em estudar o número de sucessos

e fracassos sem importar a ordem em que acontecem.
1. Para o bom andamento de seu estudo, é importante que você entenda bem a diferença entre as duas
variáveis, a discreta e a contínua!
109
Capítulo 3
Diante do exposto, é importante salientar que:
•• a distribuição binomial só é aplicável caso ocorram os dois casos

citados anteriormente;
•• os termos sucesso e fracasso são usados se o resultado esperado
ocorre ou não, ou seja, depende do objetivo de seu estudo.
Veja o exemplo, a seguir, para compreender como realizar os cálculos.
Em um exame, você deseja saber a probabilidade de erro de uma determinada

questão. Esta apresenta cinco alternativas (a, b, c, d, e) e somente uma está
correta. Qual é a probabilidade de sucesso?
Nesse caso, o objetivo é estudar a probabilidade de erro, então, o sucesso

refere-se ao erro. Para calcular a probabilidade de sucesso, você deve calcular a
probabilidade de erro da questão.
Veja como se calcula passo a passo.

Evento A e espaço amostral S.
A: errar a questão;
S: todas as opções (a, b, c, d, e).
Passo 2: identificar o número de elementos do evento e do espaço amostral.
n(A) = 4 (se somente uma está correta, sobram quatro incorretas);

n(S) = 5.
→ a probabilidade de sucesso é, então, p = 0,8.
Qual é a probabilidade de fracasso?
110
Veja, a seguir, passo a passo.
B: acertar a questão;
S: todas as opções (a, b, c, d, e).
n(B) = 1 (se somente uma está correta);

n(S) = 5.
- a probabilidade de fracasso é, então, q = 0,20
Observe:
p + q = 0,8 + 0,2 = 1 ou 100%
Desta forma, para achar o fracasso, poderia diminuir o sucesso 0,80 de 1,

então: 1-0,80 = 0,20.
Analise o seguinte exemplo: estudar a probabilidade de errar, como no

exemplo anterior. Ainda citando o exemplo anterior: nesse problema, você
estudou a probabilidade de errar somente uma questão do exame, mas e para
estudar as possibilidades de erro ou acerto de questões de um exame inteiro?
É aí que entra a distribuição binomial.
No exemplo anterior, você calculou a probabilidade de sucesso (errar) para

somente uma tentativa (questão). Agora, você vai calcular, para n tentativas, a
probabilidade de k sucessos. Acompanhe.
Seja X o número de sucessos em n tentativas do experimento.
Então, a fórmula para determinar a probabilidade de um dado número k de

sucessos é dada por:
Em que:
111
Capítulo 3
Sendo:
Cn,k = combinação de n elementos organizados em grupos de k elementos;

n = tentativas do experimento;
k = número de sucessos desejados;
p = probabilidade de sucesso (ocorrência do evento);
q = probabilidade de fracasso (não ocorrência do evento).
Notação: n! (fatorial)
n! = n.(n − 1).(n − 2). ... .
k! = k.(k − 1).(k − 2). ... .
Veja, a seguir, exemplos do cálculo de probabilidade usando a distribuição binomial.
Exemplo 1: uma prova com quatro questões, cada uma apresenta cinco
alternativas (a, b, c, d, e) e somente uma está correta. Qual a probabilidade de
errar duas questões?
Nesse caso, o objetivo é estudar a probabilidade de erro, então o sucesso refere-

se ao erro. Veja, a seguir, como se calcula passo a passo.
Passo 1: calcular a probabilidade de errar (no caso, sucesso) para cada questão.
A: errar a questão;
S: todas as opções (a, b, c, d, e);
n(A) = 4 (se somente uma está correta, sobram quatro incorretas);

n(S) = 5;
− a probabilidade de sucesso é, então, p = 0,80.
Passo 2: calcular a probabilidade de acertar (no caso, fracasso) para cada questão.
Você pode calcular de dois modos.
1. Primeiro modo de cálculo:

B: acertar a questão;
S: todas as opções (a, b, c, d, e);
112
n(B) = 1 (se somente uma está correta);

n(S) = 5;
− a probabilidade de fracasso, então q = 0,20.
2. Segundo modo de cálculo:

p + q = 1 ⇒ 0,8 + q = 1 ⇒ q = 1 – 0,8 ⇒ q = 0,20
Passo 3: identificar cada um dos componentes da fórmula.
n = 4 (total de repetições – são quatro questões com as mesmas características);

k = 2 (número de sucessos – errar duas questões);
p = 0,80 (probabilidade de sucesso, calculado anteriormente);
q = 0,20 (probabilidade de fracasso, calculado anteriormente).
Passo 4: calcular a probabilidade usando a fórmula apresentada.
Passo 5: como interpretar esses dados?
A probabilidade de uma pessoa errar duas questões de um teste de quatro questões

é de 15,36%. Note que não é 50%, pois você deve levar em consideração que cada
questão tem sua probabilidade e, também, você pôde agrupar as questões de várias
maneiras (errar a 1ª e a 3ª, ou a 2ª e a 4ª, ou a 1ª e a 4ª, e assim por diante).
Tudo o que você acabou de estudar, neste tópico, é o método de cálculo de

probabilidade usando a distribuição binomial. A intenção, com esse estudo, é que
você tenha uma noção desse processo, porém sem maiores aprofundamentos.
113
Capítulo 3
Cálculo de probabilidade usando distribuição contínua de

probabilidade.
Uma distribuição contínua de probabilidade de uma variável aleatória atribui
probabilidades a intervalos de valores dessa variável. Note que essa distribuição
atribui probabilidade para intervalos, e não para um valor dessa variável.
Uma das principais distribuições contínuas é a distribuição normal. No decorrer

deste tópico, você vai estudar um pouco dessa distribuição, além de aprender a
calcular probabilidade usando esse método.
A distribuição normal.
Como você estudou anteriormente, quando se utiliza uma variável aleatória
contínua, pode-se atribuir probabilidade a essa variável. Conforme a seção anterior,
os processos definidos a partir de contagens conduzem aos modelos que envolvem
variáveis aleatórias discretas, enquanto que os processos definidos a partir de
medidas conduzem aos modelos que envolvem variáveis aleatórias contínuas.
Figura 3.8 − Tipos de distribuições de probabilidade
Contagens Variável aleatória

discreta
Variável aleatória
Medidas
contínua
Podemos citar, como exemplos de variáveis contínuas, a altura das pessoas, a

temperatura corporal, o peso, os escores obtidos em testes psicológicos etc.
Antes de começar o estudo do cálculo de probabilidade usando a distribuição

normal, vamos relembrar alguns conceitos.
Considere a distribuição de frequências e seu histograma a seguir.
114
Tabela 3.6 − Tempo, em minutos, para as entregas urbanas da empresa X
Tempo (em minutos) Nº de entregas (fi)
15,9 |--- 18,7 2
18,7 |--- 21,5 6
21,5 |--- 24,3 10
24,3 |--- 27,1 14
27,1 |--- 29,9 10
29,9 |--- 32,7 6
32,7 |--- 35,5 2
Total (∑fi) 50
Histograma
Gráfico 3.2 – Tempo, em minutos, para as entregas urbanas da empresa X
16
14
12
No de entregas
10
15,9 |-- 18,7 18,7 |-- 21,5 21,5 |-- 24,3 24,3 |-- 27,1 27,1 |-- 29,9 29,9 |-- 32,7 32,7 |-- 35,5
Tempo em minutos
Observe que o gráfico é construído no sistema de eixos cartesianos, não é

mesmo? No eixo horizontal, são marcados os valores ou intervalos das classes
assumidos pela variável. No eixo vertical, marcamos as frequências simples,
que servirão para marcar a altura dos retângulos, indicando, assim, o número de
observações (ocorrências) de cada valor ou classe da variável.
115
Capítulo 3
Como a altura de cada retângulo é proporcional à frequência simples, a área de

cada retângulo também é. Considerando isso, a soma das áreas dos retângulos
também é proporcional à frequência total.
Continuando com a recordação, veja, agora, o polígono de frequências. Para

construir um polígono de frequência de dados, é só unir, por linhas, os pontos
médios das bases superiores dos retângulos do histograma.
Acompanhe o exemplo a seguir.
Gráfico 3.3 – Tempo, em minutos, para as entregas urbanas da empresa X
16
Polígono de Estes triângulos

14
Frequência compensam os
12
No de entregas
que ficam fora

10 do polígono
8
0
,3
,5
,7
,5
,1
,9
,7
24
35
18
21
27
29
32
|--
|--
|--
|--
|--
|--
|--
,5
,7
,9
,7
,3
,1
,9
21
32
15
18
24
27
29
Tempo em minutos
Você pôde observar que a área do histograma é igual à área abaixo do polígono
de frequências, ou seja, os triângulos que ficam fora são compensados por
aqueles que estão adicionados por dentro.
O gráfico expressa os tempos que a empresa levou para realizar 100% das
entregas de um determinado período.
Você observou que o polígono de frequências tem um formato especial? Sim, ele tem
o formato de um sino. Essa curva é chamada de curva normal ou curva de Gauss-
Laplace e tem algumas características bem especiais. Conheça-a no tópico a seguir.
116
Características da curva normal.

Analisando o polígono de frequências da maioria das séries, você pode observar,
com certo ajuste, que elas aproximam-se de uma distribuição normal, ou seja,
apresentam um gráfico semelhante conforme pode ser observado a seguir.
Gráfico 3.4 − Curva de Gauss-Laplace
X = Me = Mo X
Fonte: Adaptado de Silva (1997, p.70).
Principais características da curva normal.

Dentre as principais, podemos citar algumas, tais como:
a. a curva caracteriza-se por ter a forma de um sino;

b. a curva tem 2 pontos de inflexão (lugar onde a curva modifica-se);
c. a curva normal é simétrica com relação à média (é igual tanto à
esquerda, quanto à direita da média);
d. a área limitada pela curva e pelo eixo das abscissas é 1 ou 100%
(sendo assim, por ser simétrica, tem 50% da área à esquerda e
50% da área à direita da média);
e. a curva é assintótica, isto é, aproxima-se, indefinidamente, do eixo
das abscissas sem tocá-lo;
f. a curva normal é unimodal, isto é, possui um só pico ou ponto de
frequência máxima, ponto este em que coincidem a moda, a média
e a mediana;
g. a função que define a curva é .
117
Capítulo 3
A distribuição normal de probabilidade usa como base a curva normal.
Sabendo que a área abaixo do polígono (curva) representa proporcionalmente

a frequência total da série, e com o uso da média e do desvio padrão tem-se
condições de realizar o estudo de concentração dos dados em torno da média.
Com relação à área abaixo da curva, analise o gráfico a seguir.
Gráfico 3.5 − Distribuição normal, com percentuais em referência ao desvio padrão
3 4 ,1 3 %
1 3 ,5 9 % 0 ,5 o u 5 0 %
2 ,1 5 %
X
Fonte: Adaptado de Triola (1999, p.43).
Veja, a seguir, alguns exemplos para compreender como realizar os cálculos do

desvio padrão.
Em um teste, a média dos escores de um grupo de pessoas foi de μ = 80, e

o desvio padrão foi de σ(x) = 3. Pode-se interpretar esses valores da forma
mostrada na sequência.
Os valores da série estão concentrados em torno da média:
•• o intervalo (μ − σ(x); μ + σ(x)) contém, aproximadamente, 68,26%

dos elementos da série, ou seja, o intervalo (77; 83) → (80 − 3 = 77
e 80 + 3 = 83);
•• o intervalo (μ − 2σ(x); μ + 2σ(x)) contém, aproximadamente, 95,44%
dos elementos da série, ou seja, o intervalo(74; 86) → (80 − 6 = 74
e 80 + 6 = 86);
•• o intervalo (μ − 3σ(x); μ + 3σ(x)) contém, aproximadamente, 99,74%
dos elementos da série, ou seja, o intervalo (71; 89) → (80 − 9 = 71
e 80 + 9 = 89).
Veja, no gráfico a seguir, a ilustração desse exemplo.
118
Gráfico 3.6 − Distribuição normal, com percentuais em referência ao desvio padrão
9 9 ,7 4 %
9 5 ,4 4 %
6 8 ,2 6 %
3 4 ,1 3 % 3 4 ,1 3 %
1 3 ,5 9 % 1 3 ,5 9 %
2 ,1 5 % 2 ,1 5 %
71 74 77 =80 83 86 89
Fonte: Adaptado de Triola (1999, p.43).
Como ler os gráficos? Aí vão algumas sugestões:
• o percentual de entregas com tempo entre 77 e 83 minutos é de 68,26% (ou,

ainda, a probabilidade de escolher uma entrega que tenha sido feita entre 77
e 83 minutos é de 68,26%);

e 86 minutos é de 95,44%);

e 89 minutos é de 99,74%).
Como você pôde observar, os percentuais estão ligados à média e ao desvio

padrão e, por sua vez, determinam os intervalos a serem estudados. Esses
percentuais são obtidos calculando a área entre a curva e o eixo X, entre os
extremos do intervalo que você está estudando. Exemplo: (77; 83).
Baseado nesse estudo, você poderá calcular a probabilidade de algum evento

que resulte em um intervalo. Veja como fazer esses cálculos no próximo tópico.
119
Capítulo 3
Descrição do método de cálculo

A probabilidade em uma distribuição contínua de probabilidade (probabilidade
de ocorrência de um intervalo) é obtida calculando a área entre a curva e o eixo
X, como você já viu em estudos anteriores. Essa área é calculada com o uso de
uma ferramenta matemática chamada de integral definida da função, ou seja,
dada a função a seguir, a área entre a curva e o eixo X, no intervalo (a; b), é
calculada da seguinte forma.
Gráfico 3.7 − Distribuição normal, com intervalo definido
f
P (a < x < b )
a b x
A determinação dessa área usando o cálculo de integral é bastante complicada

e não será usado em seu estudo. Para superar essa dificuldade, utiliza-se outra
distribuição, chamada de Distribuição Normal Padronizada (ou Reduzida). O artifício
consiste em transformar a variável X, com média μ e desvio padrão σ, em uma
variável Z, com média 0 e desvio padrão 1, para que você possa fazer utilização da
tabela de Z (variável padronizada) com os valores das áreas já calculados.
Como padronizar a variável X e para quê?
Essa padronização é adotada para tornar o cálculo de probabilidade da

ocorrência de intervalo mais fácil e mais simples. Qualquer distribuição X com
as características citadas anteriormente pode ser transformada na distribuição
normal padronizada (ou reduzida) Z, para que seja possível o cálculo de áreas.
A transformação da variável aleatória X na variável padronizada dá-se mediante o

uso da fórmula a seguir.
120
Cálculo da variável padronizada.
Em que:
X1 = valor da variável aleatória (limite do intervalo);

μ = média;
σ = desvio padrão.
Acompanhe os exemplos a seguir para compreender como realizar o cálculo.
Exemplo 1: a área a ser calculada está no intervalo que vai da média até x1.
Nesse caso, só é necessário o cálculo de um limite do intervalo.
Gráfico 3.8 e 3.9 − Padronização de uma distribuição normal
P( < x< x1)
x1 x
P(0 < z< z1 )
0 z1 z
Nesse caso, a probabilidade de ocorrer o intervalo da média até o x1 é igual à

probabilidade de ocorrer o intervalo de 0 à Z1 ⇒ P(μ< x < x1 ) = P (0 < z < z1).
Exemplo 2: a área a ser calculada está no intervalo que vai de x1 até x2. Nesse
caso, é necessário o cálculo de dois limites do intervalo (Z1 e Z2).
Cálculo da variável padronizada.
121
Capítulo 3
Em que:
X1 e X2 = valores da variável aleatória (limites do intervalo);

μ = média;
σ = desvio padrão.
Gráficos 3.10 e 3.11 − Padronização de uma distribuição normal
P(x1< x< x2)
x1 x2 x
P(z1< Z < z2)
z1 0 z2 z
Nesse caso, a probabilidade de ocorrer o intervalo entre x1 e x2 é igual à

probabilidade de ocorrer o intervalo entre Z1 e Z2 ⇒ P(x1 < x < x2) = P (z1 < z < z2).
Até aqui, você conheceu como padronizar os valores da variável aleatória X. Agora,
você irá aprender como usar a tabela 2 de áreas da distribuição padronizada.
Veja, a seguir, um gráfico com representação da área dada pela tabela.
Gráfico 3.12 − Distribuição normal padronizada
Área
0 z
Fonte: Triola (1999, Anexos).
Observe que, conhecendo a área especificada na tabela, qualquer tipo de área

poderá ser calculada usando a simetria da curva.
2. Com o valor de Z calculado, basta encontrar o valor na tabela (ver tabela no final deste livro didático).
122
Observe os exemplos a seguir com atenção.
Exemplo 1: em um levantamento executado por uma empresa de entregas, resultou

que o tempo médio para a realização das entregas era de 21 minutos e o desvio
padrão foi de 7 minutos. Ao escolher, ao acaso, uma das entregas realizadas, qual a
probabilidade de o tempo para realizá-la estar entre 21 e 28 minutos?
Calculando passo a passo.
Passo 1: identificar todos os elementos que compõem o problema.
•• média: μ = 21;
•• desvio padrão: σ(x) = 7;
•• os limites do intervalo: como um dos limites é a própria média, você
só terá que calcular um Z, o outro limite é 28 ⇒ X = 28.
Passo 2: calcular a variável padronizada Z.
⇒Z=1
Passo 3: identificar, no gráfico, qual é a área que você deve encontrar.
Gráficos 3.13 e 3.14 − Padronização de uma distribuição normal
Área
μ=21 x=28
Área
0 z=1
Passo 4: procurar, na tabela, o Z = 1,00 e encontrar sua área correspondente.
123
Capítulo 3
Z 0,00 0,01 0,02

•• Primeiro, você deve procurar o valor 0,0 0,0000 0,0040 0,0080
1,0 na primeira coluna. 0,l 0,0398 0,0438 0,0478
0,2 0,0793 0,0832 0,0871
•• Depois, procurar, na primeira linha, 0,3 0,1179 0,1217 0,1255
o valor 0,00 (é como se separasse o 0,4 0,1554 0,1591 0,1628
número 1,00 em dois, uma parte seria 0,5 0,1915 0,1950 0,1985
1,0 e a outra seria o 0,00). 0,6 0,2257 0,2291 0,2324
0,7 0,2580 0,2611 0,2642
•• No cruzamento da coluna em que 0,8 0,2881 0,2910 0,2939
está o 0,00 e da linha em que está o 0,9 0,3159 0,3186 0,3212
1,0, você encontrará um número (no 1,0 0,3413 0,3438 0,3461
1,1 0,3643 0,3665 0,3686
caso é 0,3413).
1,2 0,3849 0,3869 0,3888
•• Esse número é a área entre Z e 0. 1,3 0,4032 0,4049 0,4066
Passo 5: responder e interpretar.
P(21 < x < 28) = 0,0000 + 0,3413 ou 34,13%
A probabilidade do tempo para realizar uma entrega estar entre 21 e 28

minutos é de 34,13%.
Exemplo 2: em média, a vida útil de um modelo de máquina de empacotar é de

24 anos, com um desvio padrão de 6 anos. Levando em consideração que a vida
útil desse tipo de máquina distribui-se normalmente, qual a probabilidade de uma
máquina, adquirida recentemente pela empresa, durar entre 17, 52 e 29,7 anos?
•• a média: μ = 24;
•• desvio padrão: σ(x) = 6;
•• os limites do intervalo: como os limites são diferentes da média,
você deve calcular Z para os dois valores (x1 = 17,52 e x2 = 29,7).
Passo 2: calcular as variáveis padronizadas Z1 e Z2.
124
Note que obrigatoriamente você deve utilizar o valor de Z com duas casas
decimais, por conta da formatação da tabela Z.
Passo 3: identificar, no gráfico, qual é a área que você deseja encontrar.
Gráfico 3.15 e 3.16 − Padronização de uma distribuição normal
Área
x2=17,52 μ=24 x1=29,7
Área
z=-1,08 0 z=0,95
Veja que a área está entre –1,08 e 0,95.
Não se preocupe com o sinal negativo de Z1. Esse sinal serve apenas para indicar
que a área está à esquerda da média (zero), por isso o negativo. Como a curva é
simétrica, a área tanto à esquerda como à direita é calculada da mesma maneira,
e o uso da tabela também é o mesmo.
Passo 4: procurar, na tabela, o Z1 = −1,08 e Z2 = 0,95 e encontrar suas áreas

correspondentes.
Procurando o Z1:
•• primeiro, procurar o valor 1,0 na primeira coluna;

•• depois, procurar, na primeira linha, o valor 0,08 (é como se separasse
o número 1,08 em dois, uma parte seria 1,0, e a outra, seria o 0,08);
125
Capítulo 3
•• no cruzamento da coluna na qual está o 0,08 e da linha na qual está

o 1,0, você encontrará um número (no caso, é 0,3599). Esse número
é a área entre Z1 e 0.
Tabela 3.7 − Tabela de valores normais Z
Cruzando a
linha com a
coluna.
Procurar 1,0
Procurar 0,08 Z 0,00 0,01 ... 0,07 0,08

0,0 0,0000 0,0040 ... 0,0279 0,0319
0,l 0,0398 0,0438 ... 0,0675 0,0714
0,2 0,0793 0,0832 ... 0,1064 0,1103
... ... ... ... ... ...
0,8 0,2881 0,2910 ... 0,3078 0,3106
0,9 0,3159 0,3186 ... 0,3340 0,3365
Cruzando a 1,0 0,3413 0,3438 ... 0,3577 0,3599
linha com a 1,1 0,3643 0,3665 ... 0,3790 0,3810
coluna. 1,2 0,3849 0,3869 ... 0,3980 0,3997
Agora, falta procurar o Z2! Veja como fazer:
•• primeiro, você deve procurar o valor 0,9 na primeira coluna;

o número 0,95 em dois, uma parte seria 0,9, e a outra, seria o 0,05);
Tabela 3.8 – Parte da tabela de valores normais Z

Z 0,00 ... 0,04 0,05
0,0 0,0000 ... 0,0160 0,0199
0,l 0,0398 ... 0,0557 0,0596
... ... ... ... ...
0,7 0,2580 ... 0,2704 0,2734
0,8 0,2881 ... 0,2995 0,3023
0,9 0,3159 ... 0,3264 0,3289
1,0 0,3413 ... 0,3508 0,3531
1,1 0,3643 ... 0,3729 0,3749
126
Passo 5: responder e interpretar.
Como você tem duas áreas, o próximo passo é somar. Veja o gráfico a seguir.
Gráfico 3.17 − Soma das áreas determinadas pela padronização
P(17,52 < x < 29,7) = 0,3599 + 0,3289 = 0,6888 ou 68,88%.
A probabilidade de uma máquina, adquirida recentemente pela empresa, durar

entre 17,52 e 29,7 anos é de 68,88%.
Exemplo 3: em média, a vida útil de um modelo de máquina de empacotar é de

24 anos, com um desvio padrão de 6 anos. Levando em consideração que a vida
útil desse tipo de máquina distribui-se normalmente, qual a probabilidade de uma
máquina, adquirida recentemente pela empresa, durar mais do que 29,7 anos?
•• a média: μ = 24;
•• o desvio padrão: σ(x) = 6;
•• os limites do intervalo: o intervalo é limitado abaixo por x = 29,7 e não
tem limite acima. Então, você deve calcular Z somente pelo valor de x.
127
Capítulo 3
Passo 3: identificar, no gráfico, qual é a área que você deseja encontrar.
Gráficos 3.18 e 3.19 − Padronização de uma distribuição normal.
Área
μ=24 x1=29,7
Área
0 z=0,95
Veja que a área está de 0,95 para cima.
Passo 4: procurar, na tabela, o Z = 0,95 e encontrar sua área correspondente.
Como usar a tabela?
•• primeiro, você deve procurar o valor 0,9 na primeira coluna;

o número 0,95 em dois, uma parte seria 0,9 e a outra, seria o 0,05);
Cruzando a
Tabela 3.9 − Parte da tabela normal Z
linha com a
coluna.
Procurar 0,9
Procurar 0,05 Z 0,00 ... 0,04 0,05

0,0 0,0000 ... 0,0160 0,0199
0,l 0,0398 ... 0,0557 0,0596
... ... ... ... ...
0,7 0,2580 ... 0,2704 0,2734
0,8 0,2881 ... 0,2995 0,3023
0,9 0,3159 ... 0,3264 0,3289
Cruzando a 1,0 0,3413 ... 0,3508 0,3531
linha com a 1,1 0,3643 ... 0,3729 0,3749
coluna.
128
Passo 5: interpretar e responder.
Como a área dada pela tabela é sempre entre zero e Z, como calcular a área de
Z para cima?
Você lembra que a curva normal é simétrica e que, de cada lado, tem 50% da
área total. Então, se a metade tem 50%, ou 0,5, e você diminuir dessa área a área
encontrada, restará a área que você quer encontrar. Veja o gráfico a seguir.
Gráfico 3.20 − Determinar a área limitada abaixo pelo valor padronizado e sem limite acima
0,3289
0,5-0,3289
0 z=0,95
A área cinza-escuro é calculada diminuindo 0,3289 (área entre zero e Z –

encontrada na tabela) de 0,5.
P(x > 29,7) = 0,5000 – 0,3289 = 0,1711 ou 17,11%.
Então, a probabilidade de uma máquina, adquirida recentemente pela empresa,

durar mais do que 29,7 anos é de 17,11%.
Além dos casos que você estudou nos exemplos, ainda há outros. Um deles
pode ser ilustrado a seguir.
Gráfico 3.21 − Determinar a área limitada abaixo pelo valor padronizado e sem limite acima
0,3413 0,5
ou
34,13% ou
50%
X
Caso o limite inferior do intervalo esteja à esquerda da média, o processo é o

mesmo, calcular o Z, encontrar a área na tabela e, no final, calcular a área final.
No caso anterior, note que você terá que juntar as duas áreas, a cinza-claro com
a cinza-escuro. Lembre-se de que a área, na metade da curva, é de 0,5 ou 50%.
Somando as duas: 0,5000 + 0,3413 = 0,8413 ou 84,13%.
129
Capítulo 3
1. Em um estudo realizado sobre os padrões de indecisão, depressão e ansiedade

em adolescentes, revelou-se que a relação com os pais era fator influenciador
dessas reações. Nessa estudo, foi pesquisado um total de 1500 adolescentes, e em
675 casos, os jovens sofriam com o autoritarismo dos pais. Qual a probabilidade de
ser escolhido, ao acaso, um jovem que sofra com o autoritarismo dos pais?
2. Segundo o IBGE, na Grande Florianópolis, as pessoas com dez anos ou mais

de idade, foram agrupadas na tabela abaixo, de acordo com seu estado civil.
Desquitado(a)
Casado(a) ou separado(a) Divorciado(a) Viúvo(a) Solteiro(a) Total
judicialmente
3. O teste chamado Tarefa de Memória Seletiva (TMS) testa alguns aspectos

da memória verbal. Este baseia-se em ouvir, lembrar e aprender doze palavras
apresentadas à pessoa que está sendo testada. Diversos aspectos da memória
verbal, tais como lembrança total, armazenamento na memória de longa duração
etc., são combinados para produzir um escore global. Sabendo que, para um
grupo determinado de pessoas, a média dos escores foi de 126 pontos e que o
desvio padrão foi de 10 pontos, determine o que é pedido a seguir.
a. Calcule Z (variável padronizada) para x = 116, para x = 136, para

x = 131 e para x = 141 pontos.
b. Qual a probabilidade de escolher uma pessoa com escore maior
do que 136 pontos?
c. Qual a probabilidade de escolher uma pessoa com escore entre
126 e 131 pontos?
d. Qual a probabilidade de escolher uma pessoa com escore entre
116 e 141 pontos?
130
Capítulo 4
Amostragem e cálculo de estimativa
Seção 1
Principais conceitos
Neste capítulo, você conhecerá com mais detalhes o que é amostra e poderá
aumentar seus conhecimentos sobre como escolher, calcular e para que usar
amostras em pesquisas e levantamentos de dados. Você terá a oportunidade de
verificar como é importante o estudo da amostragem, uma vez que é uma das
ferramentas essenciais que pode apoiar suas decisões.
Você também conhecerá como proceder para calcular o erro padrão de uma estimativa.
Você já deve ter visto, nos jornais ou na televisão, quando anunciam resultados
de uma pesquisa eleitoral, informarem que os resultados têm uma margem de
erro. Isto ocorre devido ao fato do uso da amostragem, ou seja, quando uma
pesquisa baseia-se apenas em uma parcela da população.
Como não é possível executar a pesquisa com a totalidade dessa população, os

resultados não são exatos, necessitando, assim, do cálculo da margem de erro.
Dessa forma, você vai entender como se procede para encontrar esse erro.
Serão usados alguns termos que são fundamentais no entendimento dos cálculos
e da interpretação. Sendo assim, antes de saber como se calcula o erro de uma
estimativa, é muito importante que você aprenda alguns conceitos importantes.
A amostragem está intimamente ligada aos estudos de Estatística descritiva

e probabilidades. Além de estarem ligados, são dependentes uns dos outros.
Veja a figura a seguir.
131
Capítulo 4
Figura 4.1 − Relações dos estudos estatísticos
Amostragem
Estatística descritiva Probabilidade
Como é feita essa relação entre os três? Com o estudo deste capítulo, você vai
poder compreender melhor. Conheça, a seguir, alguns conceitos importantes
para o estudo da amostragem.
População
População é o conjunto total de elementos com, pelo menos, uma característica
em comum, cujo comportamento interessa estudar.
Notação:
N = número de elementos da população (tamanho da população).
•• Censo: é uma coleção de dados relativos a todos os elementos de

uma população.
•• Parâmetro: é utilizado para designar alguma característica descritiva
dos elementos da população (percentagem, média etc.).
Amostra
Amostra é o conjunto de elementos ou observações, recolhidos a partir de um
subconjunto da população, que se estuda com o objetivo de tirar conclusões
para a população de onde foi recolhida.
Notação:
n = número de elementos da amostra (tamanho da amostra).

Contudo, qual tamanho de amostra usar? Essa sempre é a dúvida de muitos
pesquisadores. O tamanho da amostra muitas vezes depende da experiência
e do conhecimento do pesquisador. Experiência em saber qual o tamanho que
realmente representará, com fidelidade, a população e o conhecimento do
pesquisador sobre o tema e sobre a população-alvo do estudo. Dessa forma,
você verá duas formas de calcular o tamanho da amostra, que são as seguintes:
132
•• quando não se tem informações sobre a população: se o pesquisador

não tem acesso às medidas, como desvio padrão, percentuais etc.
•• quando se tem informações sobre a população: se o pesquisador
tem acesso às medidas, como desvio padrão, percentuais etc.
Quando não se tem informações sobre a população.
Nesse caso, é necessária a especificação do erro amostral pretendido

pelo pesquisador. Sugeridas por Barbetta (2002), as formas de cálculo
do tamanho da amostra, quando você não tem acesso a informações da
população, são as que seguem.
a. Quando não se conhece o tamanho da população.
1
Tamanho da amostra: n0 = .
E2
Em que:
n0 = primeira aproximação para o tamanho da amostra;

E = erro amostral tolerável.
(Usar o erro na forma unitária, exemplo: erro de 2%, usar 0,02).
b. Quando se conhece o tamanho da população.
N .n0
Tamanho da amostra: n= .
N + n0
Em que:
n0 = primeira aproximação para o tamanho da amostra;

N = tamanho da população;
n = tamanho da amostra.
Veja, a seguir, um exemplo de como realizar os cálculos.
Um pesquisador deseja realizar um estudo para com estudantes do Ensino

Fundamental da rede municipal de escolas da cidade de Florianópolis. Nessa
pesquisa, ele irá tolerar um erro amostral de 4%, e gostaria de saber qual seria o
tamanho da amostra necessária para realizar sua pesquisa, nos seguintes casos.
133
Capítulo 4
a. O pesquisador não conhece o número total de estudantes do

Ensino Fundamental da cidade.
Passo 1: identificar os elementos da fórmula.
n0 = tamanho aproximado da amostra;

E = erro amostral tolerável = 4% ou 0,04 (é só dividir por 100).
Passo 2: usar a fórmula.
1 1 1
n0 = 2
= 2
= = 625 n0 = 625 estudantes.
(E) (0,04) 0,0016
Um tamanho aproximado para a amostra seria de 625 estudantes do Ensino

Fundamental.
b. O número total de estudantes do Ensino Fundamental da cidade

é de 27.000 alunos.

E = erro amostral tolerável = 4% ou 0,04;
N = tamanho da população = 27000.
1 1 1
n0 = = = = 625 n0 = 625 estudantes.
( E ) 2 (0,04) 2 0,0016
Um tamanho aproximado para a amostra seria de 625 estudantes do Ensino

Fundamental. Observe que o pesquisador teve acesso à informação de que a
população seria de 27.000 estudantes, então você deve passar para o passo seguinte.
Passo 3: calcular o tamanho da amostra usando a população com a seguinte fórmula.
N .n0 27000.625 16875000

n= = = = 610,86
N + n0 27000 + 625 27625
Arredondando, seriam 611 estudantes.
134
c. Quando se tem informações sobre a população.

Neste caso, além da margem de erro tolerável, seriam necessárias informações
como desvio padrão, percentual dos indivíduos que apresentam as características
estudadas etc. Essas informações poderiam ser obtidas de pesquisas anteriores
ou, até mesmo, de uma pré-pesquisa. Nesta última, seria preciso uma
amostragem prévia para realizar os levantamentos necessários. Embora, não seja
de nosso interesse aprofundar o estudo sobre este assunto, a seguir estão as
fórmulas para se calcular o tamanho da amostra para os dois casos existentes,
para estimar a proporção (percentual) e a média populacional.
Quadro 4.1 − Tamanho da amostra, proporção (percentual) e média populacional
Para a estimativa da proporção

Para a estimativa da média populacional
populacional (percentual)
Para amostragem com reposição Para amostragem com reposição

(população infinita) (população infinita)
( (
2 2
Z .σ(x) Z . pq
ˆˆ
n= e n=
e2
Para amostragem sem reposição Para amostragem sem reposição

(população infinita) (população infinita)
Z2. σ2 (x)N ˆ ˆN
Z2 . pq
n= n=
e (N-1)+Z2.σ2 (x)
2 e (N-1)+Z2. pq
2
ˆˆ
Onde: Onde:
n = tamanho da amostra; n = tamanho da amostra;

N = tamanho da população; N = tamanho da população;
e = erro amostral; e = erro amostral;
σ = desvio padrão; p = percentual de elementos com a
Z = limite do intervalo (dist. Normal) característica estudada;
q = percentual de elementos sem a
característica estudada;
Z = limite do intervalo (dist. Normal)
Representatividade da amostra na população
Quando você está cozinhando, após temperar a comida, costuma mexer com
uma colher, não é? Por que você mexe? Para que o tempero fique bem misturado
com a comida. Correto? Qual é o passo seguinte? Provar! Claro, você pega
apenas um pouco da comida para saber como está o gosto. Para tanto, não é
necessário comer tudo!
135
Capítulo 4
Em resumo, o processo de amostragem é bem semelhante. Para que a prova de

comida seja representativa, você teve, antes, que mexer bem, tornando, assim,
uma mistura homogênea. Se for bem misturada, qualquer amostra que você colha,
em qualquer lugar da panela, dará uma boa noção de como o todo (a comida) está.
Em pesquisas, o processo é bem semelhante!
Você lembra-se da pesquisa de intenções de voto? Em época de campanha

eleitoral, quando um instituto de pesquisa faz uma pesquisa, ele tem que
selecionar eleitores que representem as mais diversas camadas sociais, regiões,
raças etc., tornando, assim, a amostra representativa da população.
Você saberia dizer se os dados levantados, com base em alguns poucos

elementos, podem trazer informações precisas acerca de uma população inteira?
De certa forma, sim! Você não terá informações exatas da população usando uma
amostra, mas, sim, uma aproximação bastante precisa. É importante salientar
que, por não haver pesquisado a totalidade dos elementos, você é levado a
concluir que os dados nunca representarão um reflexo exato da população.
Exemplos bem conhecidos são as pesquisas eleitorais divulgadas pelos meios

de comunicação. Veja.
Gráfico 4.1 − Exemplo dos dados de uma pesquisa eleitoral
39%
37%
35%
26% 24% 26%

A
B
15% C
11% D
9%
10% 11%
7%
Agosto Setembro Outubro
Como era a notícia que deu origem a esta tabela?
“A pesquisa de outubro apresentou os seguintes resultados: o candidato A tem

39% das intenções de voto, o candidato B tem 26% das intenções de voto,
o candidato C tem 9% das intenções de voto e o candidato D tem 7% das
intenções de votos. O erro é de 2%”.
136
De fato, existe uma margem de erro. Esse erro, relatado na notícia, gera um
intervalo, ou seja, as intenções de votos para o candidato A podem variar de 37%
a 41%. Por se tratar de uma pesquisa feita por amostragem, você não pode dizer
que o candidato terá realmente 39% das intenções de votos.
Quais são as informações que a amostragem pode fornecer?
Como você já viu em Estatística, esses intervalos são divididos em dois tipos, de
acordo com a variável estudada. Vale relembrar.
Figura 4.2 − Variável aleatória discreta e intervalo de produção; variável aleatória contínua e intervalo da média
Variável aleatória Intervalo de proporção

discreta (percentual)
Variável aleatória Intervalo da média

contínua
•• Intervalos de proporção: como visto no exemplo anterior, correspondem

aos percentuais das intenções de votos. Exemplos: proporção de famílias,
percentual de pacientes, proporção de cobaias etc.
•• Intervalos da média: são intervalos baseados em medidas. São
sempre calculados pela média destas. Exemplo: escore médio, peso
médio, altura média etc.
Outra informação importante para a definição do erro é o conhecimento do que,

em Estatística, é chamado de nível de confiança.
Nível de confiança
O nível de confiança é a probabilidade de o intervalo conter o parâmetro
estimado, ou seja, pode-se entender que o valor ou percentual da população
que você está tentando estimar tem a probabilidade de estar em um intervalo
que seria o definido pelo erro.
Intervalo de confiança
Intervalo de confiança é aquele que contém o parâmetro estudado com
determinada probabilidade (nível de confiança), ou seja, citando o exemplo da
pesquisa eleitoral, é o intervalo calculado com o erro. Veja os valores no exemplo
citado nesta seção: “... as intenções de voto para o candidato A podem variar de
37% a 41%”. Esse é o intervalo de confiança.
137
Capítulo 4
Curva normal
Você poderia perguntar-se, a partir do que foi apresentado, qual relação pode
estabelecer-se entre o nível de confiança e o intervalo de confiança. Como o nível
de confiança é a probabilidade de a estimativa estar correta e essa probabilidade
determina um intervalo (o intervalo de confiança), é possível usar a curva normal
para identificar a ambos. Veja a figura a seguir
Figura 4.3 − Curva normal
Nível de
confiança
%
Intervalo de confiança
Note que o nível de confiança é um percentual definido pelo intervalo de –z a z.

Como a curva é simétrica, metade da área vai de –z a zero, e a outra metade vai
de zero a z, ou seja, ambas são iguais. Isso é muito importante na definição do
valor de z. Para descobri-lo, você deve calcular a metade do nível de confiança e
usar a tabela da distribuição normal padronizada.
Exemplo 1
Nível de confiança: NC = 95%. Encontrar o valor de z na tabela.
Passo 1: dividir o NC por dois. Antes disso, não se esqueça de usar o valor do
nível de confiança na forma decimal, ou seja, dividido por 100.
95 0,95
NC = = 0,95 = 0,475
100 2
Passo 2: procurar esse valor na tabela e encontrar o z correspondente. O valor

é referente à área entre zero e z, localizado na região central da tabela. Veja a
tabela a seguir.
138
Tabela 4.1 − Tabela de valores normais
Localizada a área, é só seguir a coluna onde está o valor até a primeira linha,
encontrando o número 0,06. Na horizontal, basta traçar a linha até a primeira
coluna, encontrando o valor correspondente a 1,9. Juntando, ou somando os dois
valores, você encontra o valor 1,96 para z, ou seja, z = 1,96.
Exemplo 2
Nível de Confiança: NC = 90%. Encontrar o valor de z na tabela.
Passo 1: dividir o NC por dois. Para tanto, sempre usar o valor do nível de
confiança na forma decimal, ou seja, dividido por 100.
90 0,90
NC = = 0,90 = 0,45
100 2
139
Capítulo 4
Passo 2: procurar esse valor na tabela e encontrar o z correspondente. O valor

é referente à área entre zero e z, localizado na região central da tabela. Veja a
figura a seguir.
Tabela 4.2 − Tabela de valores normais
Encontrando a área, é só seguir a coluna na qual está o valor até a primeira

linha. Note que o valor situa-se entre 0,4495 e 0,4505 e, sendo assim, você deve
usar o valor compreendido entre 0,04 e 0,05 como se fosse um ponto médio, ou
seja, 0,045. Seguindo a linha até a primeira coluna, você encontra o valor 1,6.
Efetuando-se a soma, chega-se ao valor 1,645 para z, ou seja, z = 1,645.
Para calcular o erro, é necessário conhecer ou estabelecer previamente o nível

de confiança. Não existe uma regra específica para a determinação do nível de
confiança. Ele é determinado pelo pesquisador, com base em sua experiência e, em
geral, os mais usados são 90% e 95%, os zês são, respectivamente, 1,645 e 1,96.
Na seção seguinte, você aprenderá a usar o nível de confiança e a saber como se

calcula o erro da estimativa e o intervalo correspondente.
140
Seção 2
Estimativas para a proporção populacional
Antes de começar a calcular o erro da estimativa, conheça algumas notações:
•• p̂ = proporção da mostra (percentual) – probabilidade de sucesso;

•• p = proporção da população – probabilidade de sucesso;
•• q̂ = proporção da mostra (percentual) – probabilidade de fracasso;
•• q = proporção da população – probabilidade de fracasso.
Para diferenciar um percentual da amostra do percentual da população, tanto

de sucesso quanto de fracasso, deve-se usar o acento circunflexo (“chapéu”)
para a amostra.
Veja os exemplos a seguir.
Exemplo 1: em uma determinada população, foi retirada uma amostra antes da

eleição, e verificou-se que 30% dos eleitores votariam no candidato Théo. Após
a realização da eleição, verificou-se que o total de votantes (da população) para
esse candidato foi de 33%. Com base nisso, você deve indicar os percentuais de
sucesso e fracasso tanto para a população quanto para a amostra de votantes e
não votantes em relação ao candidato em questão.
Quadro 4.2 − População e amostra
População Amostra
Percentual de votantes em Théo = 33%; Percentual de votantes em Théo = 30%;

p = 33% (percentual de sucesso da população). p̂ = 30% (percentual de sucesso da amostra).
Percentual de eleitores que não votam em Théo: Percentual de eleitores que não votam em Théo:
calcule o percentual de fracasso sempre na forma calcule o percentual de fracasso sempre na forma
decimal, ou seja, dividindo o percentual por 100. decimal, ou seja, dividindo o percentual por 100.
33 30
p= = 0,33 pˆ = = 0,30
100 100
q = 1 – p = 1 – 0,33 = 0,67 qˆ = 1 − pˆ = 1 − 0,30 = 0,70
Depois, multiplique por 100 para encontrar Depois, multiplique por 100 para encontrar
novamente o percentual: novamente o percentual:
q = 0,67. 100 = 67% qˆ = 0,70.100 = 70%
(percentual de fracasso da população). (percentual de fracasso da amostra).
141
Capítulo 4
Observação: note que a diferença, além dos valores, está em identificar o

percentual da amostra com o acento circunflexo (“chapéu”).
A seguir, veja um exemplo mais elaborado.
Exemplo 2: em uma determinada população, foi retirada uma amostra de 200

votantes antes da eleição e verificou-se que 60 eleitores votariam no candidato Théo.
Após a realização da eleição, verificou-se que o total de votantes (da população) era
de 3000 eleitores e que 990 votaram no referido candidato. Então, você deve indicar
os percentuais de sucesso e fracasso tanto para a população quanto para a amostra
de votantes e não votantes em relação ao candidato mencionado.
Quadro 4.3 − População e amostra
População Amostra
Passo 1: identificar os valores. Passo 1: identificar os valores.
N = 3000 (tamanho da população); n = 200 (tamanho da amostra);

X = 990 (número de votantes no candidato). X = 60 (número de votantes no candidato).
Passo 2: cálculo do percentual de votantes no Passo 2: cálculo do percentual de votantes no

candidato. candidato.
990 60
p= = 0,33 pˆ = = 0,30
3000 200
Percentual de votantes em Théo = 33%; Percentual de votantes em Théo = 30%;

p = 33% (percentual de sucesso da população). pˆ = 30% (percentual de sucesso da amostra).
Percentual de eleitores que não votam em Théo: Percentual de eleitores que não votam em Théo:
calcule o percentual de fracasso sempre na forma calcule o percentual de fracasso sempre na forma
decimal, ou seja, dividindo o percentual por 100. decimal, ou seja, dividindo o percentual por 100.
p = 0,33 pˆ = 0,30
q = 1 – p = 1 – 0,33 = 0,67 qˆ = 1 − pˆ = 1 − 0,30 = 0,70
No final, multiplique por 100 para encontrar No final, multiplique por 100 para encontrar
novamente o percentual: novamente o percentual:
q = 0,67. 100 = 67% qˆ = 0,7.100 = 70%

(percentual de fracasso da população). (percentual de fracasso da amostra).
E para calcular o erro e o intervalo de uma estimativa?
Para fazer uma estimativa, após ter os resultados e calculado os percentuais,

você deve calcular o erro da estimativa e o seu intervalo (intervalo de confiança).
Veja, a seguir, a fórmula para o cálculo do erro.
142
pˆ qˆ
e = Ζ.
n
Em que:
e = erro da estimativa;
z = limite do intervalo definido pelo nível de confiança;
p̂ = proporção da mostra (percentual) – probabilidade de sucesso (ex.: percentual
de votantes em relação a um determinado candidato);
q̂ = proporção da mostra (percentual) – probabilidade de fracasso (ex.:
percentual dos eleitores que não votam em determinado candidato);
O intervalo é calculado subtraindo-se o erro do percentual e, em seguida,

somando-se o erro a esse percentual. Veja, na sequência, a notação usada.
P( pˆ − e < p < pˆ + e) = NC
Em que:
P = probabilidade de o valor estimado estar no intervalo calculado;

p̂ = proporção da mostra (percentual) – probabilidade de sucesso (exemplo:
percentual da amostra de votantes em relação a um determinado candidato);
P = proporção da população (percentual) que se quer estimar – probabilidade

de sucesso (ex.: percentual da população de votantes em relação a um
determinado candidato);
NC = nível de confiança.
Exemplo 1: uma pesquisa recente, efetuada com uma amostra de 300 eleitores
de uma pequena cidade, indicou que 35% deles votariam no candidato Arthur.
Faça uma estimativa para a totalidade dos eleitores (população) dessa cidade que
votarão no referido candidato. Use um nível de confiança de 95%.
143
Capítulo 4
Passo 1: calcular e procurar o z na tabela. Dividir o NC por dois. Para tanto,

não se esqueça de usar o valor do nível de confiança na forma decimal, ou seja,
dividido por 100.
95 0,95
NC = = 0,95 = 0,475
100 2
Como vimos anteriormente, o z para o nível de confiança de 95% sempre será 1,96.
Passo 2: discriminar cada elemento da fórmula de cálculo do erro e aplicá-la ao

caso em análise.
pˆ qˆ
e = Ζ.
n
Em que:
z = 1,96 (para o NC de 95%);
35
p̂ = 35% ou = 0,35 (percentual da amostra de eleitores que votam no candidato);
100
qˆ = 1 − 0,35 = 0,65 (percentual da amostra dos eleitores que não votam no candidato);
n = 300 (tamanho da amostra).
Cálculo do erro
pˆ qˆ 0,35.0,65 0,2275
e = Ζ. = 1,96. = 1,96. =
n 300 300
e = 1,96. 0,000758333 = 1,96.0,02754 = 0,05397 ou 5,40%
Ao final do cálculo, deve-se multiplicar o resultado por 100, para que ele fique em
porcentagem. Os meios de comunicação (TV, rádio, jornais, etc.), ao informarem os
resultados de uma pesquisa citam “... com um erro de 5,40% a mais ou a menos”.
144
Passo 4: calcular o intervalo da estimativa. Neste passo, o cálculo pode ser efetuado
na forma percentual ou decimal. Interpretando os resultados obtidos, tem-se que as
intenções de votos para o candidato referido devem ficar entre 29,60% e 40,40%.
Segundo as notações da Estatística, esse intervalo escreve-se da seguinte forma.
pˆ − e = 0,35 − 0,054 = 0,2960 ou 29,60%.
pˆ − e = 0,35 + 0,054 = 0,4040 ou 40,40%.
Interpretando os resultados obtidos, tem-se que as intenções de votos para o

candidato referido devem ficar entre 29,60% e 40,40%.
Segundo as notações da Estatística, esse intervalo escreve-se da seguinte forma.
P( pˆ − e < p < pˆ + e ) = 0,95

P(0,35 − 0,054 < p < 0,35 + 0,54 ) = 0,95
P(0,2960 < p < 0,4040) = 0,95 ou P(29,60% < p < 40,40%) = 95%.
Que leitura você pode fazer desses resultados?
O intervalo da estimativa para a totalidade dos eleitores que votariam no

candidato mencionado está compreendido entre 29,60% e 40,40%, com base
em um nível de confiança de 95%.
Exemplo 2: um levantamento de alunos aprovados e reprovados feito com

base no sistema municipal de educação de um município, referente ao Ensino
Fundamental, usando uma amostra de 2500 alunos, indicou que 1500 alunos
dentre eles haviam sido reprovados. Com um nível de confiança de 90%, faça
uma estimativa para a população de alunos que foram reprovados no Ensino
Fundamental do sistema municipal de educação.
145
Capítulo 4
Calculando passo a passo
Passo 1: como não foi indicado o percentual de alunos da amostra que foram
reprovados, você deve, em primeiro lugar, calcular esse percentual.
n = 2500 (tamanho da amostra);

X = 1500 (número de alunos reprovados).
Cálculo do percentual
1500
pˆ = = 0,60
2500
pˆ = 1 − 0,60 = 0,40
Você pode manter o resultado na forma decimal, pois o cálculo do erro também
é feito assim.
Z para 90% é sempre 1,645.

caso em exame.
pˆ qˆ
e = Ζ.
n
Em que:
e = o que se quer calcular (erro da estimativa);
z = 1,645;
60
p̂ = 60% ou = 0,60 (percentual da amostra de alunos reprovados);
100
qˆ = 1 − 0,60 = 0,40 (percentual da amostra de alunos que não foram reprovados);

146
Cálculo do erro
pˆ qˆ 0,60.0,40 0,24
e = Ζ. = 1,645. = 1,645. = 1,645. 0,000096
n 2500 2500
e = 1,645 × 0,009797959 = 0,01612 ou 1,16%.

Ao final, não se esqueça de multiplicar o resultado por 100 para transformá-lo
novamente em porcentagem.
Passo 4: calcular o intervalo da estimativa.
Neste passo, o cálculo pode ser feito na forma percentual ou decimal.
pˆ − e = 0,60 − 0,016 = 0,5840 ou 58,40 %;
pˆ − e = 0,60 + 0,016 = 0,6160 ou 61,60 %.
Interpretando os resultados obtidos, tem-se que de 58,40% a 61,60% da totalidade

dos alunos cursando o Ensino Fundamental na rede municipal foram reprovados.
Segundo as notações de Estatística, escreve-se esse intervalo da seguinte forma.
P( pˆ − e < p < pˆ + e ) = 0,90

P(0,60 − 0,016 < p < 0,60 + 0,016) = 0,90
P(0,5840 < p < 0,6160) = 0,90 ou P(58,40% < p < 61,60%) = 90%.
Que leitura você pode fazer?
O intervalo da estimativa para a totalidade dos alunos cursando o Ensino

Fundamental na rede municipal que foram reprovados está compreendido entre
58,40% e 61,60%, com base em um nível de confiança de 90%.
Você aprendeu como calcular o erro referente à estimativa do percentual de uma

população. Na sequência, você verá como calcular o erro de uma estimativa para
a média de uma população.
147
Capítulo 4
Seção 3
Estimativas para média populacional
Ao realizar uma pesquisa por amostragem, além de calcular percentuais, você
pode obter algumas médias como, por exemplo, a média das alturas, das idades,
dos pesos etc. O processo é semelhante, ou seja, calcula-se o erro e o intervalo.
O que muda é a forma de cálculo do erro. Isso vale para as séries de dados
amostrais que podem ser aproximados por uma distribuição normal.
Para calcular o erro de uma estimativa da média populacional, você vai precisar
da média de uma amostra e do desvio padrão. Este pode ser obtido com base na
própria população, se for possível, ou na amostra. O desvio padrão da amostra
pode ser usado como uma aproximação.
Veja, a seguir, a fórmula para o cálculo do erro.
S ( x)
e = Ζ.
n
Em que:
z = limite do intervalo definido pelo nível de confiança;
S(x) = desvio padrão da amostra (ou da população, se possível);
O intervalo é calculado subtraindo-se o erro da média da amostra e somando-se

o erro à referida média. Veja, na sequência, a notação usada.
P ( x − e < μ < x + e) = NC
Em que:
P = probabilidade de o valor estimado estar no intervalo calculado;

x = média da amostra;
μ = média da população (o que você vai estimar);
NC = nível de confiança.
148
Exemplo 1: em sondagem realizada com base nos alunos do curso de Matemática

das quintas séries de uma determinada escola, o resultado geral apresentou uma
média de 6,7, com um desvio padrão de 1,2. Com esse tipo de informação, pode-se
realizar uma série de análises. A partir desses dados, calcule uma estimativa (erro
e intervalo), considerando essa série com uma distribuição normal para a média
populacional a um nível de confiança de 95%, e que a amostra foi de 35 alunos.
Passo 1: identificar o z com NC de 95% ou seja, z =1,96.

caso em questão.
S ( x)
e = Ζ.
n
Em que:
z = 1,96;
S(x) = 1,2 (desvio padrão da amostra);
Cálculo do erro
S ( x) 1,2 1,2
e = Ζ. = 1,96. = 1,96. = 1,96.0,20284 = 0,3976 ou 0,40.
n 35 5,91607978
Não é necessário multiplicar por 100, pois esse resultado não indica um
percentual, mas, sim, pontos (a nota).
Neste passo, como na estimativa para o percentual, você deve subtrair e somar o
erro à média.
x − e = 6,70 − 0,40 = 6,30
x + e = 6,70 + 0,40 = 7,10
149
Capítulo 4
Interpretando os resultados obtidos, tem-se que a média das notas da totalidade

dos alunos está compreendida entre 6,30 e 7,10 pontos, aproximadamente.
P( x − e < μ < x + e) = 0,95
P(6,70 − 0,40 < μ < 6,70 + 0,40) = 0,95
P(6,30 < μ < 7,10) = 0,95
O intervalo da estimativa para a média das notas da totalidade dos alunos está
compreendido entre 6,30 e 7,10 pontos, aproximadamente, com um nível de
confiança de 95%.
Exemplo 2: em uma pesquisa realizada com diversas turmas de uma escola,

os alunos levaram 39 minutos, em média, para terminar uma avaliação de
Matemática. O tamanho da amostra era de 100 estudantes. O desvio padrão
dessa amostra foi de 18 minutos. Com base em um nível de confiança de 90%,
qual seria a estimativa para a média populacional da escola e a sua interpretação?
Calculando passo a passo
Passo 1: identificar o z com NC de 90%, ou seja, z = 1,645.

caso em questão.
S ( x)
e = Ζ.
n
Em que:
z =1,645;
S(x) = 18 (desvio padrão da amostra);
150
Cálculo do erro
S ( x) 18 18
e = Ζ. = 1,645. = 1,645. = 1,645.1,8 = 2,961 ou 2,96.
n 100 10
Não é necessário multiplicar por 100, pois esse resultado não indica um
percentual, mas, sim, minutos.
Passo 3: calcular o intervalo da estimativa. Neste passo, como na estimativa para

o percentual, você deve subtrair e somar o erro à média.
x − e = 39 − 2,96 = 36,04
x + e = 39 + 2,96 = 41,96
Interpretando os resultados obtidos, tem-se que o tempo médio para a realização

da avaliação está compreendido entre 36,04 e 41,96 minutos, aproximadamente.
P( x − e < μ < x + e) = 0,90

P(39 − 2,96 < μ < 39 + 2,96) = 0,90
P(36,04 < μ < 41,96) = 0,90
O intervalo da estimativa para a média do tempo de execução da avaliação está

compreendido entre 36,04 e 41,96 minutos, com um nível de confiança de 90%.
151
Capítulo 4
Seção 4
Análise de variância − ANOVA
Como comparar as características de várias amostras

Logo após calcular a estimativa de uma média populacional, podemos ter outro
desafio: definir se as médias de várias populações são mesmo semelhantes ou
existem diferenças que superam os próprios problemas do processo de amostragem.
Isso porque, muitas vezes, amostras de diferentes populações são selecionadas

com a finalidade de se avaliarem possíveis diferenças entre as distribuições
populacionais de alguma característica de interesse.
Podemos citar alguns exemplos dessas situações.
Exemplos
•• Seleção de lotes de parafusos fabricados em diferentes empresas

com diferentes equipamentos, para avaliar se a distribuição
(populacional) do valor médio do diâmetro da cabeça dos parafusos
produzidos varia com a marca do equipamento usado na fabricação.
•• Para curar certa doença, existem quatro tratamentos possíveis: A, B, C e
D. Pretende-se saber se existem diferenças significativas nos tratamentos,
no que diz respeito ao tempo necessário para eliminar a doença.
•• Análise de amostras de água de diversos pontos da cidade para verificar
se existe variação na distribuição de alguma característica (nível de
ácidos, por exemplo) associada à qualidade da água entre bairros.
Em muitos casos, uma análise descritiva dos dados indica que modelos
gaussianos ou normais são compatíveis com suas distribuições. Em outras
palavras, sob o ponto de vista estatístico, podemos considerar as k amostras
disponíveis como provenientes de populações normais com médias µ1, µ2, ..., µk.
Se não existirem razões contrárias, podemos também supor que as amostras são
independentes. Adicionalmente, a análise descritiva muitas vezes sugere que as k
populações têm a mesma variância σ2 (desconhecida).
O problema proposto pode, então, ser encarado como um teste da hipótese de

que as médias são iguais: H: µ1 = µ2 = ... = µk. E, nessas situações, a técnica
para resolver problemas desse tipo (e muitos outros semelhantes) é chamada de
análise de variância de um fator.
152
Considerando que existem k populações de interesse, nas quais se estuda uma

característica comum X1, X2, ..., Xk, são as variáveis aleatórias que representam
tais característica nas populações 1, 2, ..., k, respectivamente. Assim, a hipótese
a testar é: µ1 = µ2 = ... = µk.
Nesse problema, as k populações podem ser vistas como k níveis de um mesmo

fator. E, assim, a questão é saber se o fator exerce alguma influência na variação
da característica em estudo (a média, neste caso).
Caso o problema apresente somente um fator, estaremos trabalhando com

análise de variância de um fator, conhecido como ANOVA de um único fator.
Claro que também existe ANOVA de múltiplos fatores, mas esse tema não será
abordado neste estudo.
Analisando o problema com um exemplo.
Exemplo: o Sr. Fernando Fernandes é dono de uma Indústria Metal-Mecânica

e pretende comprar três fábricas de parafusos para suprimentos da sua própria
indústria. Para isso, precisa analisar o volume de fabricação das fábricas a
comprar, já que ele precisa que as três tenham produções semelhantes de
parafusos para prover regularmente à sua indústria.
Para isso, o Sr. Fernando Fernandes seleciona aleatoriamente cinco semanas do

semestre, nas quais observa o volume de fabricação semanal de cada fábrica (ou
seja, as três amostras são independentes).
Os dados amostrais estão registrados na seguinte tabela.
Tabela 4.3 − Dados amostrais
Semanas Fábrica 1 Fábrica 2 Fábrica 3

Semana 1 47 55 54
Semana 2 53 54 50
Semana 3 49 58 51
Semana 4 50 61 51
Semana 5 46 52 49
xi (médias amostrais) x1 = 49 x2 = 56 x3 = 51 x = 52
Representamos por Xi o volume de fabricação semanal na Fábrica i (i = 1, 2, 3) e,

por µi o valor médio de Xi.
153
Capítulo 4
A média da fábrica 1 é dada pela soma das semanas e dividida por 5, ou seja,
145/5= 49. Para a fábrica 2,280/5 = 56 e para a fábrica 255/5 = 51, note que a
média das médias das três fábricas é a soma das média (última linha da tabela)
dividida por 3.
Neste exemplo, existe apenas um fator de interesse, o fator “fábrica”, que

apresenta três níveis ou grupos: fábrica 1, fábrica 2 e fábrica 3. Assim, cada nível
do fator define uma população de média µi.
Assim, o que o Sr. Fernando Fernandes pretende saber é se as médias dos três níveis,
ou populações, são iguais, isto é, pretende-se saber se a hipótese é certa ou não.
H: µ1 = µ2 = µ3
(Hipótese de igualdade na fabricação média das três fábricas).
Então, a questão a responder é: serão as médias amostrais x1 = 49, x2 = 56,

x3 = 51, diferentes porque há diferenças entre as médias populacionais: µ1 =
µ2 = µ3? Ou serão essas diferenças atribuídas a flutuações amostrais?
Podemos, então, formular as seguintes hipóteses.
H: µ1 = µ2 = µ3
Ou, em outras palavras, a hipótese está afirmando que não há diferença entre o
volume médio de fabricação das três fábricas.
Lembre-se: como toda hipótese, as pesquisas (testes em nosso caso) poderão

confirmá-la ou negá-la!
Pressupostos para resolver a questão

A aplicação da análise de variância pressupõe a verificação das seguintes condições:
•• as amostras devem ser aleatórias e independentes;

•• as amostras devem ser extraídas de populações normais;
•• as populações devem ter variâncias iguais.
Assim, temos duas situações possíveis demonstradas a seguir.
•• A hipótese H é verdadeira
As diferenças observadas entre as médias amostrais são devidas a flutuações
amostrais. Ou seja, nesse caso, teremos que µ1 = µ2 = µ3: todas as amostras
provêm de populações com médias iguais.
154
Como se supôs que todas as populações são normais e têm variâncias iguais,
isto é, o mesmo que extrair todas as amostras de uma única população (de
uma única fábrica).
Gráfico 4.2 − Distribuição populacional quando µ1 = µ2 = µ3 = µ
•• A hipótese H é falsa
As diferenças observadas entre as médias amostrais são demasiado grandes para
serem devidas unicamente a flutuações amostrais.
Aqui, as médias das populações não são iguais, ou seja, pelo menos duas
fábricas têm volumes de produção média diferentes. As amostras recolhidas
provêm de populações diferentes.
Gráfico 4.3 − Distribuição populacional quando µ1 ≠ µ2 ≠ µ3
µ3 µ1 µ2
Teste ANOVA
Para testar a hipótese, devemos trabalhar com o valor da Estatística de teste F
(Anexo 2), que é outro valor que surge de outra distribuição de probabilidade, que
a semelhança da distribuição normal tem uma tabela para calcular seu valor, no
qual devemos entrar com os graus de liberdades (número de dados da amostra
diminuído um) para obter o valor correspondendo a certo nível de confiança, por
exemplo, NC = 95%, que equivale a um nível de significância de 5% ou α = 5%.
155
Capítulo 4
Então, a Estatística de teste mede a razão entre a variação entre grupos e a

variação dentro dos grupos.
A hipótese H é, pois, rejeitada para valores grandes da Estatística F.
A tabela ANOVA tem a seguinte estrutura.
Tabela 4.4 − Tabela ANOVA
Por exemplo, para n = 3 (três grupos) e m = 5 (cinco amostras por grupo), resultam em:
•• GLn = 3 – 1 = 2 (graus de liberdade do numerador, 2 = K);

•• GLm = 15 – 3 = 12 (graus de liberdade do denominador, 15 = 3 x 5 = N).
Ao final da seção, você pode achar a tabela completa para determinar o PC

(ponto crítico) ou estatística F, para um nível de confiança de 95%.
Assim, na tabela, procura-se na primeira coluna (GL do denominador) a linha do 12

e, na primeira fila, a linha do 2 (GL do numerador), resulta em um valor do estatístico
F: F = 3,89. Este valor definido pela tabela é conhecido como Ponto Crítico ou PC.
Devemos aclarar que existem diversas tabelas de F, cada uma delas calculada
para um grau de significância diferente, a tabela de nosso trabalho é a tabela para
um grau de significância de 5%.
156
Agora, temos que calcular o valor de F para nosso experimento, e, se o valor do F

calculado for maior do que o valor de F tabelado (PC), a hipótese deverá ser rejeitada.
Dessa forma, para calcular nosso valor de F amostral, devemos utilizar uma
tabela de layout para organizar nossos cálculos.
A tabela, chamada de Tabela ANOVA, tem a seguinte estrutura tradicional.
Nessa tabela, temos:
SST = é a soma de quadrados total e mede a variação total nos dados;
SSA = é a soma de quadrados entre os níveis (grupos) do fator e mede a variação

entre grupos (populações), é designada por variação explicada, pois ela é
explicada pelo fato de as amostras poderem provir de populações diferentes;
SSE = é a soma de quadrados dentro dos níveis (grupos) do fator e mede a

variação dentro dos grupos (populações), é, por vezes, designada por variação
residual, pois é atribuída a flutuações dentro da mesma população, portanto não
pode ser explicada pelas possíveis diferenças entre os grupos (populações).
Também temos que:
MSA = é a soma média de quadrados entre grupos;
MSE = é a soma média de quadrados dentro dos grupos ou residual.
Pode-se provar que
SST = SSA + SSE;
157
Capítulo 4
e, também, que
(K − 1) + (N – K) = N – 1.
Isso permite verificar os cálculos da tabela ANOVA.
Assim, sob o pressuposto da hipótese ser verdadeira, tem-se:
A hipótese deve ser rejeitada se o valor observado de F situar-se à direita do ponto

crítico; isto é, rejeita-se H se Fobs ≥ pc, em que o ponto crítico PC é dado por
Então, para nosso exemplo da compra das fábricas por parte do Sr. Fernando
Fernandes, vamos ver o que podemos concluir ao nível de significância de 0.05,
ou seja, a um nível de confiança NC = 95%.
Cálculo de SSE
Calculamos cada desvio de X menos a média de cada grupo, ou seja, de cada

fábrica, e somamos, agora vamos somar as somas finais.
SSE=30+50+14=94
Cálculo de SSA
O SSa é a diferença entre a média de cada fábrica menos a média das médias
elevada ao quadrado e multiplicada pelo n, no caso 5 de cinco semanas.
158
Assim, a tabela ANOVA resulta, numericamente, para o exemplo, nos seguintes valores.
E, se a hipótese H é verdadeira, resultará em
Então, o F calculado para o nosso exemplo é 65/7,83, que resulta em 8,30. Note
que é um F 2/12, ou seja, vamos procurar na Tabela F, coluna2 e linha 12.
Da tabela F, a gente já identificou o valor F para os graus de liberdade 2 e 12, e

95% de confiança.
E, segundo a tabela ANOVA, o valor observado da estatística F é
E, como resultando que 8,3 > 3,89, então a hipótese (H: µ1 = µ2 = µ3) é rejeitada
ao nível de significância de 0,05, ou nível de confiança de 95%; isto é, existem
diferenças significativas entre as médias amostrais das vendas, e há, portanto,
evidência de que existem pelo menos duas lojas com volumes médios de
produção diferentes entre elas.
Em outras palavras, o fator fábrica exerce uma influência significativa sobre o volume
médio da produção de parafusos: tem, ao menos, uma fábrica que está produzindo
bem menos ou bem mais do que as outras, desequilibrando o suprimento constante
de parafusos de que a indústria de Fernando Fernandes precisa.
159
Capítulo 4
Atividades de Autoavaliação
1. Estão listadas, a seguir, uma série de estudos e a margem de erro que o
pesquisador irá adotar como tolerável, bem como o tamanho da população-alvo
desse estudo. Calcule o tamanho da amostra necessária para realizar as pesquisas,
considerando que o pesquisador não tem acesso ao tamanho da população e que
o pesquisador tem acesso ao tamanho da população (calcular para os dois casos).
Tabela 1 − Tipos de estudos, margem de erro e tamanho da população e da amostra
Erro Tamanho da Tamanho da

Tema do estudo tolerável população amostra
a) Estudo socioeconômico com
0,03 5600
estudantes da Unisul
b) Estudo com famílias do bairro Rio
0,04 9400
Vermelho, em Florianópolis
c) Estudo da fecundidade na cidade de
0,06 125.000
Florianópolis
d) Estudo com adolescentes de uma
0,09 250
escola usuários de drogas
e) Estudo de Índice de massa corporal
0,05 4.000
dos estudantes da Unisul
f) Pesquisa de intenções de voto no
0,02 80.000.000
Brasil
2. Leia a notícia da IstoÉ on-line (2004).
Florianópolis / SC – Caça ao tucano
Sem contar com o apoio do governador, da prefeita Ângela Amin (PP) e de caciques
da política catarinense, Dário Berger, candidato da coligação PSDB-PMN, é a
grande surpresa até o momento nas eleições em Florianópolis. Concorrendo pela
primeira vez a um cargo público de expressão, Berger vem liderando com folga a
corrida eleitoral em Floripa. Pela pesquisa ISTOÉ/Databrain – feita entre os dias 26 e
27 de julho, com 700 entrevistados, margem de erro de 2,74 pontos porcentuais e
coeficiente de confiança de 90% – Berger apresenta tranquilos 26,4% das intenções
de voto. O levantamento foi registrado no TRE-SC com o número 559/2004. (Dados
adaptados de ISTOÉ ON-LINE, 2004).
160
Com os dados da matéria, mostre os cálculos que foram feitos para se chegar ao
erro de 2,74 pontos percentuais, e encontre o intervalo da estimativa.
3. Uma amostragem com 250 alunos foi feita em escolas, e, entre outras
perguntas, questionou-se sobre o peso dos alunos da quinta-série. O peso
médio dos alunos entrevistados foi de 29,3 Kg, e apresentou um desvio padrão
de 3,4 Kg. Usando um nível de confiança de 95%, calcule uma estimativa para a
totalidade (população) de alunos da quinta-série.
4. O diretor de marketing de uma indústria pretende comprar uma nova

máquina para fabricar parafusos. Você foi designado para estudar três marcas
semelhantes, cada uma delas combina, de modo diferente, fatores como o preço
do produto, volume de fabricação, condições de consumo de energia etc.
Qualquer um dos equipamentos pode ser utilizado na sua indústria, não

havendo qualquer tipo de influência no rendimento pela presença dos outros
equipamentos da indústria.
Para saber se há diferença entre o volume de produção das três máquinas

visando à sua eficácia, cada uma delas é testada, aleatoriamente, funcionando
em algumas das lojas dos fabricantes durante um período de duração limitada.
Note que as lojas de venda são selecionadas de modo que as três amostras
sejam aleatórias e independentes entre si.
A quantidade de peças produzidas durante esse período consta na tabela a seguir.
Máquina 1 Máquina 2 Máquina 3
8 10 7
6 8 5
5 12 8
6 7 6
7 9 7
10 5
11
Soma 32 67 38
Seja Xi a variável aleatória que representa o volume de produção de cada

máquina i (i = 1,2,3), também admitamos que X1, X2 e X3 têm distribuição normal
com iguais variâncias e fixemos o nível de confiança do teste em 95%, ou seja,
trabalharemos com um nível de significância de 5%.
161
Capítulo 4
A hipótese a testar é: H: µ1 = µ2 = µ3, ou seja: aceita-se que não há diferença entre

os níveis de produção relativamente ao volume médio de peças que podem fabricar.
Assim, para resolver o problema, calcule o ponto crítico pelo médio do estatístico
F da tabela da distribuição para um nível de significância de 5%. Verifique se
aceita ou rejeita a hipótese de trabalho e crie a tabela ANOVA.
162
Capítulo 5
Regressão Linear simples
Seção 1
Correlação linear simples
Os métodos que você estudou até o momento são eficazes para analisar e interpretar
somente uma variável de cada vez. Se eles servem para a análise de uma variável,
como analisar e comparar duas variáveis simultaneamente? Para compreender como
solucionar tal situação, você irá conhecer a correlação linear simples.
A correlação é uma ferramenta destinada ao estudo da relação entre duas

variáveis quantitativas, além de fornecer a intensidade dessa relação.
Para você estudar como usar a correlação linear simples, é importante que você
conheça o que é diagrama de dispersão e o coeficiente de correlação linear de
Pearson. Conheça melhor esses assuntos a seguir.
Diagrama de dispersão
O diagrama de dispersão ajuda a definir a correlação entre duas variáveis
quantitativas de modo gráfico. Em outras palavras, a relação entre duas variáveis,
X e Y, pode ser vista em um diagrama, no qual são marcados os pontos
correspondentes aos pares ordenados gerados pela relação X→Y, e (x,y) são
esses pares ordenados. Dessa forma, constrói-se um diagrama de dispersão.
Quanto mais esses pontos estão próximos à reta imaginária gerada pela nuvem
de pontos, mais forte será a correlação. Observe o gráfico a seguir e acompanhe
os exemplos apresentados.
No gráfico abaixo, os pares ordenados são gerados pela relação entre a altura
das pessoas em centímetros e o peso em quilos.
163
Capítulo 5
Gráfico 5.1 − Diagrama de dispersão
Coeficiente de correlação linear de Pearson

O coeficiente de correlação permite que você analise a força ou a existência da
correlação entre duas variáveis. Considerando que n é o número de observações
(tamanho da amostra), o coeficiente será dado pela seguinte fórmula.
n. ∑ x. y − [(∑ x )(
. ∑ y )]
rxy =
[n ∑ x 2 2
][ 2
− (∑ x ) . n ∑ y 2 − (∑ y ) ]
Em que:
r = resultado do coeficiente de correlação linear de Pearson;

n = número de observações;
x = valores assumidos pela variável X;
y = valores assumidos pela variável Y.
O coeficiente de Pearson pode variar de −1 a +1 → [−1,+1].
Quanto ao resultado de r, você deve considerar cinco situações, descritas no

quadro a seguir.
164
Quadro 5.1 − Resultados possíveis do valor de x
Valor de r Correlação entre as variáveis

r próximo de 0 Correlação linear pouco significativa.
r=0 Não há correlação linear entre as variáveis.
r próximo de –1 Há correlação linear negativa (significativa).
r = –1 Há correlação linear negativa perfeita.
r próximo de +1 Há correlação linear positiva (significativa).
r = +1 Há correlação linear positiva perfeita.
Tipos de correlações
Segundo os resultados de r, as correlações podem assumir diferentes tipos, os
quais você pode acompanhar detalhadamente a seguir.
a) Correlação linear positiva

Neste caso, o coeficiente de Pearson estará entre 0 e 1 → intervalo (0,1). É
próximo de 1, é forte, porém não é igual a 1, perto de 1, estamos falando em algo
acima de 0,8. Note que os pontos estão perto da reta de regressão, porém não
estão exatamente em cima da reta.
Gráfico 5.2 − Correlação linear positiva: altura e peso
Interpretação: se o x cresce o y cresce também, no exemplo, se a altura cresce,

o peso cresce; se o x decresce o y decresce também.
165
Capítulo 5
b) Correlação linear perfeita positiva

Neste caso, o coeficiente de Pearson r será igual a +1, neste caso, os pontos
estão perfeitamente alinhados em cima da reta.
Gráfico 5.3 − Correlação linear perfeita positiva: altura e peso
A interpretação é a mesma, ou seja, se o x cresce, o y cresce também. No

exemplo, se altura cresce, o peso cresce e, se o x decresce, o y decresce
também. Dizemos que eles apresentam a mesa tendência.
c) Correlação linear negativa

Neste caso, o coeficiente de Pearson estará entre 0 e −1, no caso próximo de −1:
intervalo [−1,0].
Gráfico 5.4 − Correlação linear perfeita negativa: idade e nota
Interpretação: o x cresce e o y decresce, no exemplo, se a idade cresce, a nota

decresce; e, se o x decresce, o y cresce, no exemplo, se a idade decresce, a nota
cresce. São inversamente proporcionais.
166
d) Correlação linear perfeita negativa

Neste caso, o coeficiente de Pearson r será −1: os pontos estão perfeitamente
alinhados sobre a reta de regressão.
Gráfico 5.5 − Correlação linear perfeita negativa: idade e nota
7 8 9 10 11 12 13 14 15 16
A interpretação é a mesma, ou seja, se o x cresce, o y decresce, no exemplo, se

a idade cresce, a nota decresce; e, se o x decresce, o y cresce.
e) Correlação linear nula ou ausência de correlação

A seguir, veja um exemplo de quando não há correlação entre as variáveis X e Y,
neste caso, o coeficiente de Pearson é igual a zero, r = 0. Note que não há uma
tendência nos pontos de dispersão, diferentemente dos exemplos anteriores.
Gráfico 5.6 − correlação linear nula ou ausência de correlação: altura e nota
167
Capítulo 5
Como calcular o coeficiente de correlação?

Para obter esta resposta, acompanhe com atenção o exemplo.
Exemplo: calcule o coeficiente de correlação de Pearson e construa o diagrama de

dispersão para uma turma de alunos, correlacionando altura e peso, descritos a seguir.
Tabela 6.1 – Altura e peso dos alunos de uma série
Passo 1: acrescente, na tabela, mais três colunas para auxiliar nos cálculos.
Some os elementos da coluna x (altura) e escreva o total na última linha,
obtendo, assim, a Some os elementos da coluna y (peso) e escreva o total
na última linha, obtendo, assim, a (veja tabela).
Passo 2: calcule os elementos da terceira coluna (x.y), multiplicando cada um dos

elementos da coluna x por cada um dos elementos da coluna y.
(160).(61) = 9760
(155).(56) = 8680
(152).(55) = 8360
......
(177).(77) = 13629
Em seguida, some todos eles e escreva o total na última linha, obtendo, assim, a
168
Passo 3: calcule os elementos da quarta coluna (x2), elevando ao quadrado, cada

um dos elementos da coluna x.
(160)2 = 25600
(155)2 = 24025
(152)2 = 23104
....
(177)2=31329
Em seguida, some todos eles e escreva o total na última linha, para obter, assim, a
Passo 4: calcule os elementos da quinta coluna (y2), elevando, ao quadrado, cada

um dos elementos da coluna y.
(61)2 = 3721
(56)2 = 3136
(55)2 = 3025
....
(77)2 = 5929
Em seguida, some todos eles e escreva o total na última linha, para obter, assim, o
Passo 5: calcule o coeficiente de correlação utilizando a fórmula vista anteriormente.
n = número de observações (10 alunos) → n = 10.
Os elementos, a seguir, foram calculados nos passos anteriores:
Observação: é importante lembrar que:
1. ≠
Note que no primeiro caso, você multiplica os elementos x e y, depois soma

a multiplicação no fim, e, no segundo caso, você soma x e y primeiro, depois
multiplica a soma final.
169
Capítulo 5
2. ≠
Neste caso, a diferença consiste no elevar ao quadrado, no primeiro caso, você
eleva ao quadrado cada variável x, depois soma. No segundo caso, você soma
primeiro o x e depois eleva a soma ao quadrado.
Se você escrever na fórmula, terá:
Passo 6: agora, construa o diagrama de dispersão. Para construí-lo; você deve

marcar os pontos de cada par ordenado, usando, para isso, os valores da coluna
das alturas, como x, e da coluna dos pesos, como y, formando (x, y). Veja o
gráfico a seguir.
Gráfico 5.7 − Altura e peso
170
Interpretação do resultado final do coeficiente de correlação: o coeficiente de

correlação resultou em um número positivo e próximo de 1 (r = 0,98), sendo
assim, a correlação entre a altura dos alunos e o peso é positiva (significativa), ou
seja, quanto maior a altura do aluno, maior será seu peso, e, quanto menor for a
sua altura, menor será o seu peso.
Seção 2
Análise de regressão linear
Para fazer a análise da regressão, nos casos em que é possível estabelecer uma
correlação entre duas variáveis, você terá que usar essa relação para prever
valores para uma delas (sempre a variável que for adotada como Y), mas isso só
será possível quando for conhecido o valor da outra variável, no caso, a variável
X. E essa previsão só tem significado caso a força da correlação seja significativa
ou perfeita (quando r está próximo ou igual a +1 ou −1). Essa força dá-se pela
proximidade dos pontos do diagrama de dispersão à reta de regressão.
A reta de regressão é obtida pela aproximação dos pontos do diagrama.
Para encontrar uma equação que auxilie a prever os valores de Y, usa-se o

Método dos Mínimos Quadrados, o qual você conhecerá a seguir.
A escolha da variável que será o Y está relacionada à variável que o pesquisador

deseja estimar. No exemplo anterior, se a intenção é a de estimar o peso dos
alunos, então o Y deve ser a variável peso. Caso a necessidade fosse a de
estimar a altura dos alunos, a variável Y passaria a ser a altura.
Método dos mínimos quadrados

Pode-se representar a reta imaginária pela equação exposta na sequência.
Reta de regressão:
Sendo:
171
Capítulo 5
Em que:
= valor predito de y (a ser estimado);

x = valor da variável x para determinado elemento da amostra;
y = valor da variável y para determinado elemento da amostra;
n = nº total de observações (tamanho da amostra);
b = a intersecção do eixo y (ou coeficiente linear da reta);
a = coeficiente de inclinação da reta (ou coeficiente angular da reta).
Ao predizer um valor de Y com base em determinado valor de X, quanto mais

significativa a correlação linear, mais precisa torna-se a previsão.
Interpolação: estimativas com valores entre os da série.
Extrapolação: estimativas com valores fora dos da série.
Resíduo: é a diferença entre um valor amostral, observado Y, e o valor predito,

com base na equação de regressão.
A tabela, a seguir, descreve as alturas e os pesos dos alunos de uma turma.

Você deverá:
a. construir a equação de uma reta de regressão para prever o peso

dos alunos;
b. prever o peso ( ) de um aluno com 175 cm (x) de altura.
Tabela 5.2 – Altura e peso dos alunos de uma série
172
•• Para o item a:
Considerando que a tabela é a mesma do exemplo da Seção 1 (cálculo do coeficiente
de correlação), não será necessário calcular as colunas nem os totais (veja a tabela).
Equação da reta de regressão →
Passo 1: sendo assim, você pode começar calculando a inclinação da reta (a).
Inclinação da reta (a):
Agora, identifique os elementos da fórmula:

n = 10.
Os elementos, a seguir, foram calculados nos passos anteriores;
;
;
;
.
173
Capítulo 5
Passo 2: calcule a intersecção com o eixo y, item (b).
Intersecção do eixo y (b):
Agora, identifique os elementos da fórmula:

n = 10.
Os elementos, a seguir, foram calculados nos passos anteriores.
;
;
.
Passo 3: construa a equação da reta de regressão.
Após calcular a e b, tem-se:
a = 0,72;
b = − 53,76;
•• Para o item b:
Fazer a previsão para um aluno que mede 175 cm. Você deve usar 175 como X = 175.
Substituir o valor de X na equação de regressão.
Como interpretar? A previsão para o peso deste aluno que mede 175 cm é de 72,24 Kg.
174
1. Uma turma da oitava série realizou avaliações em duas disciplinas,

Matemática e Biologia; as notas obtidas estão na tabela abaixo. Usando estes
dados, calcule o que se pede.
Aluno Nota Matemática Nota Biologia X.Y X2 Y2
1 9,5 3,4 32,3 90,3 11,6

2 9,0 5,4 48,6 81,0 29,2
3 8,5 6,0 51,0 72,3 36,0
4 8,0 6,0 48,0 64,0 36,0
5 8,0 5,0 40,0 64,0 25,0
6 7,5 7,0 52,5 56,3 49,0
7 7,5 9,0 67,5 56,3 81,0
8 6,0 7,5 45,0 36,0 56,3
9 5,0 8,0 40,0 25,0 64,0
10 4,0 8,0 32,0 16,0 64,0
Totais 73,0 65,3 456,9 561,0 452,0
a. Calcule o coeficiente de correlação entre as duas variáveis,

identifique o tipo de correlação e interprete o resultado.
b. Construa uma equação para a relação indicada (a equação da reta
de regressão) para possibilitar o cálculo de estimativas para a nota
de Biologia (Y), segundo a nota de Matemática (X).
c. Estime a nota de Biologia, considerando que um aluno tenha
tirado nota 6,5 (X) em Matemática. Substitua na equação da reta
construída no item b.
175
Considerações Finais
Muitas vezes deparamos-nos com situações em que temos que lidar com
muitos dados e não sabemos como vamos lidar com eles. O conteúdo e as
atividades apresentados nesta unidade de aprendizagem têm como objetivo
desenvolver habilidades e proporcionar ferramentas para os profissionais que
lidam com esse tipo de situação.
Desde a apresentação de relatórios e trabalhos científicos a pesquisas, controle,

testes, projeções e previsões, a Estatística está sempre presente. Afinal, no dia
a dia, lidamos com uma grande quantidade de informações, então pergunto: de
que vale ter tanta informação se não sabemos o que fazer com ela? Espera-se
que todo o conhecimento que você adquiriu nesta unidade de aprendizagem seja
suporte para as suas análises, opiniões e decisões.
Muito sucesso profissional!
Prof. Luiz Dornelles
177
Referências
ACÇÃO LOCAL DE ESTATÍSTICA APLICADA – ALEA. 1999-2010. Disponível em:

<http://alea-estp.ine.pt>. Acesso em: 15 ago. 2010.
ANDERSON, David R.; SWEENEY, Dennis J.; WILLIAMS, Thomas A. Estatística

aplicada à administração e economia. 2. ed. São Paulo: Cengage Learning,
2007. ISBN 9788522105212. Disponível em: <https://aplicacoes.unisul.br/
pergamum/biblioteca_s/php/login_usu.php?flag=minhabib lioteca_redirect.php>.
Acesso em: 11 fev. 2015. Acesso restrito via Minha Biblioteca.
ARANGO, Héctor Gustavo. Bioestatística teórica e computacional. Rio de

Janeiro: Guanabara, 2001.
ASSOCIAÇÃO NACIONAL DE ENTIDADES PROMOTORAS DE EMPREENDIMENTOS

INOVADORES - Anprotec. 2008. Disponível em: <http://www.anprotec.org.br>.
Acesso em: 15 ago. 2010.
BANCO CENTRAL DO BRASIL. 2010. Disponível em: <http://www.bcb.gov.br/>.

Acesso em: 15 ago. 2010.
BARBETTA, Pedro Alberto. Estatística aplicada às ciências sociais. 5. ed. rev.

Florianópolis: Ed. UFSC, 2002.
CRESPO, Antônio Arnot. Estatística fácil. São Paulo: Saraiva, 2001.
DEPARTAMENTO INTERSINDICAL DE ESTATÍSTICA E ESTUDOS

SOCIOECONÔMICOS – DIEESE. 2010. Disponível em: <http://www.dieese.org.
br/>. Acesso em: 3 ago. 2010.
DOANE, David P. Estatística aplicada à administração e à economia. Porto

Alegre: ArtMed, 2011. 2. v. ISBN 9788563308962. Disponível em: <https://
aplicacoes.unisul.br/pergamum/biblioteca_s/php/login_usu.php?flag=minhabib
lioteca_redirect.php>. Acesso em: 11 fev. 2015. Acesso restrito via Minha
Biblioteca.
INSTITUTO BRASILEIRO DE GEOGRAFIA E ESTATÍSTICA – IBGE. 2010.

Disponível em: <http://www.ibge.gov.br/>. Acesso em: 3 set. 2010.
LARSON, Ron; FARBER, Elizabeth. Estatística aplicada. 2. ed. São Paulo: Pearson
Prentice Hall, 2004. 476 p. ISBN 8587918591. Disponível em: <https://aplicacoes.
unisul.br/pergamum/biblioteca_s/php/login_usu.php?flag=minhabib lioteca_redirect.
php>. Acesso em: 11 fev. 2015. Acesso restrito via Minha Biblioteca.
179
LEVIN, Jack. Estatística aplicada às ciências humanas. São Paulo: Habra, 1987.
MORETTIN, Luiz Gonzaga. Estatística básica. São Paulo: Makron Books, 1999
MORETTIN, Pedro Alberto; BUSSAB, Wilton de O. Estatística básica. 8. ed. São

Paulo: Saraiva, 2008. 2 v. ISBN 9788502208001. Disponível em: <https://aplicacoes.
PINHEIRO, João Ismael D. Estatística básica: a arte de trabalhar com dados. Rio
de Janeiro: Elsevier, 2009. 288 p. ISBN 9788535230307. Disponível em: <https://
aplicacoes.unisul.br/pergamum/biblioteca_s/php/login_usu.php?flag=minhabib
lioteca_redirect.php>. Acesso em: 11 fev. 2015. Acesso restrito via Minha
Biblioteca. SARAIVA. Segurança e medicina do trabalho. 8. ed. atual. São Paulo,
2011. 1044 p. ISBN 9788502134294.
PORTAL BRASIL. 2010. Disponível em: <http://www.portalbrasil.net/>. Acesso

em: 3 set. 2010.
POPULATION REFERENCE BUREAU. La juventud del mundo 2000. Washington

DC: Population Reference Bureau, 2000. Disponível em: <http://www.prb.org/
SpanishContent.aspx>. Acesso em: 3 março 2011.
SINDICATO DA HABITAÇÃO – SECOVI/RS. 2010. Disponível em: <http://www.

secovi-rs.com.br/index.asp>. Acesso em: 10 ago. 2010.
SILVA, Ermes Medeiros da. Estatística. São Paulo: Atlas, 1996. v.1.
______. Estatística para os cursos de Economia, Administração e Ciências

Contábeis. São Paulo: Atlas, 1999.
SPIEGEL, M. R. Estatística. São Paulo: Makron Books, 1994.
PIEGEL, Murray R.; STEPHENS, Larry J. Estatística. 4. ed. Porto Alegre:

Bookman, 2009. 2 v. ISBN 9788577805204. Disponível em: <https://aplicacoes.
TRIBUNAL SUPERIOR ELEITORAL. 2010. Disponível em: <http://www.tse.gov.br>.

Acesso em: 20 set. 2010.
TRIOLA, Mario F. Introdução à Estatística. Rio de Janeiro: LTC, 1999.
VIEIRA, Sônia. Introdução à bioestatística. 6. ed. Rio de Janeiro: Campus, 2000.
______. Princípios de Estatística. São Paulo: Pioneira, 2003.
WILD, Christopher J. Encontros com o acaso. Rio de Janeiro: LTC, 2004.
180
Sobre os Professores Conteudistas
Luiz Arthur Dornelles Júnior

Graduado em Matemática pela Fundação Universidade do Rio Grande (FURG). É
professor da Universidade do Sul de Santa Catarina (UNISUL) desde 2000, onde leciona
as disciplinas de Estatística, Métodos Quantitativos e Programação Linear. Atualmente,
está cursando Especialização em Educação Matemática na UNISUL Virtual.
Gabriel Cremona Parma (2ª edição)

Doutor em Engenharia Civil, na área de Gestão Territorial, pela Universidade
Federal de Santa Catarina (UFSC). Mestre em Engenharia Civil, pela Universidade
Federal de Santa Catarina (UFSC). Cartógrafo: UNL, Argentina. Consultor
especializado em Geoprocessamento e Controle de Qualidade de Dados
Geoespaciais. Atua como professor e pesquisador na Universidade do Sul de
Santa Catarina (UNISUL) e na Universidade Federal de Santa Catarina (UFSC). Ex-
professor na Universidade Nacional do Litoral (UNL), Argentina.
Joseane Borges de Miranda

É bacharel em Ciências Econômicas na UFSC (1998), seu TCC objetivou
analisar o impacto da política cambial sobre os preços agrícolas em Santa
Catarina. É pós-graduada em Economia Industrial, pela Universidade Federal
de Santa Catarina (2000), sua dissertação de Mestrado foi focada nos aspectos
macroeconômicos da competitividade sistêmica no setor de revestimento de
Santa Catarina. Créditos de doutorado do programa de pós-graduação da UFSC,
chamado EGC (Engenharia e Gestão do Conhecimento), a área de conhecimento
é Engenharia do Conhecimento. É professora, há mais de 12 anos, da disciplina
Econometria, nos cursos de Economia. Na Unisul, é professora presencial nos
cursos de Engenharias de Produção, Civil e Ambiental. A maioria das unidades de
aprendizagem ministradas são de Probabilidade e Estatística, Macroeconomia.
Na UV (Unisul Virtual), é professora on-line das unidades de aprendizagem
Gestão do Conhecimento, Finanças Internacionais, Probabilidade e Estatística
e Econometria. É coautora do Livro de Matemática nas Ciências Sociais, é
autora dos Livros: Engenharia Econômica; Econometria I e Econometria II e
coordenadora do curso de bacharelado Ciências Econômicas, da Unisul Virtual.
181
182
Respostas e comentários das
atividades de autoavaliação
Capítulo 1
1. O censo é uma coleção de dados sobre uma população, enquanto que a
estimação usa dados de uma amostra para avaliar um parâmetro (característica
descritiva dos elementos da população).
2. Deve-se escolher elementos com as mesmas características da população,

ou seja, elementos que realmente representem a população. Aqui, você pode
citar exemplos (escolher clientes de níveis sociais diferentes para estudar grau
de satisfação, escolher amostras de diversos locais de um lago para análise
etc.). Isso é necessário para que você possa realmente refletir a realidade, sem
distorcer ou conduzir os resultados.
3. Nesta questão, você deve citar exemplos do seu dia a dia, por exemplo, as
listadas na tabela a seguir.
Variável Exemplos
Qualitativa nominal Nacionalidade
Qualitativa ordinal Atendimento (ótimo, muito bom, ... , muito ruim)
Quantitativa discreta Número de filhos
Quantitativa contínua Escore de teste psicológico
4. A classificação que você pode fazer é:
•• os dados coletados por meio de questionário − primários;

•• os dados coletados no Ministério − secundários.
183
5. Observe, no quadro a seguir, a resposta para esta questão.
DESCRIÇÃO DA VARIÁVEL CLASSIFICAÇÃO
Saldo em conta corrente em R$ Quantitativa contínua
Idade do cliente Quantitativa contínua
Sexo do cliente Qualitativa nominal
Classe econômica Qualitativa ordinal
Estado civil Qualitativa nominal
Número de defeitos do produto Quantitativa discreta
Consumo de energia em kWh Quantitativa contínua
Número de filhos Quantitativa discreta
Comprimento da peça Quantitativa contínua
Tempo de espera em caixa eletrônico (em minutos) Quantitativa contínua
Nome de país exportador de petróleo Quantitativa nominal
Grau de satisfação no atendimento em uma loja comercial Qualitativa nominal
Número de alunos de uma universidade Quantitativa discreta
6. Montagem da tabela.
Principais motivos de tensão Nº de clientes

(estresse)
Morte de um filho 16
Morte do cônjuge 12
Morte dos pais ou irmãos 11
Divórcio 8
Doença grave 7
Demissão 6
Total 60
184
Acidentes de trabalho nos últimos 36 meses
Nº de acidentes Nº de meses
3 4
4 5
5 9
6 7
7 5
8 6
Total 36
Renda das famílias de um bairro de classe baixa de Florianópolis
Renda família (R$) Nº de pacientes
112 |---- 115 2

115 |---- 118 6
118 |---- 121 4
121 |---- 124 9
124 |---- 127 8
127 |---- 130 7
Total 36
185
9. Completando a tabela.
Número de operários acidentados em cada mês
Nº de Nº de meses fa Fr fp (%)
acidentados
3 4 4 0,1111 11,11
4 5 9 0,1389 13,89
5 9 18 0,2500 25,00
6 7 25 0,1944 19,44
7 5 30 0,1389 13,89
8 6 36 0,1667 16,67
Total (Σfi) 36 1,0000 100,0
a. 18 meses (9+5+4);
b. 27 meses (9+7+5+6);
c. 25% dos meses;
d. 13,89% dos meses.
10. O histograma e o polígono de frequências deverão ser semelhantes ao

apresentado a seguir.
186
Capítulo 2
1. Em primeiro lugar, construa a tabela.
Consumo de bebidas alcoólicas por semana pelos funcionários.
Número de dias Número de xi.fi

(xi) funcionários (fi)
0 10 0
1 16 16
2 14 28
3 8 24
4 5 20
5 4 20
6 4 24
7 3 21
Total (Σfi) 64 153
Em segundo lugar, calcule a média, dividindo a soma da coluna xi.fi pela soma da
coluna fi. O resultado é a média.
Interpretação: o número médio de dias de consumo de álcool pelos funcionários

é de 2,39 dias.
2. Usando um processo semelhante ao anterior, em primeiro lugar, você deve

calcular o ponto médio. Em seguida, multiplicar o ponto médio pela fi de cada
linha e, porteriormente, escrever o resultado na coluna PM.fi. Some esses
números no final da coluna, conforme a tabela.
187
Renda (R$) Número de famílias PM PM.fi
112 |---- 115 2 113,5 227
115 |---- 118 6 116,5 699
118 |---- 121 4 119,5 478
121 |---- 124 9 122,5 1102,5
124 |---- 127 8 125,5 1004
127 |---- 130 7 128,5 899,5
Total (Σfi) 36 4410
Em segundo lugar, divida o resultado da soma (ΣPM.fi) pela soma dos números
da coluna fi.
Interpretação: o nível da renda familiar é de 122,5 reais.
3. a) Conjunto 1
Primeiro passo: escrever, na tabela, os dados organizados em ordem crescente

(Rol) e, na linha de baixo, as posições.
12 13 13 15 15 16 17 19 21
1ª 2ª 3ª 4ª 5ª 6ª 7ª 8ª 9ª
Segundo passo: calcular a posição, levando em consideração que a série tem 9

elementos, sendo, assim, é ímpar.
188
Terceiro passo: encontrar, na tabela p, o elemento que ocupa a 5ª posição.
12 13 13 15 15 16 17 19 21
1ª 2ª 3ª 4ª 5ª 6ª 7ª 8ª 9ª
Me = 15 – o tempo de internação mediano é de 15 dias.
Interpretação: 50% dos valores observados são menores ou iguais a 15, e 50%
dos valores observados são maiores ou iguais a 15.
b) Conjunto 2
Primeiro passo: escrever, na tabela, os dados organizados em ordem crescente

(Rol) e, na linha de baixo, as posições.
14 14 15 15 16 16 17 18
1ª 2ª 3ª 4ª 5ª 6ª 7ª 8ª
Segundo passo: calcular a posição, levando em consideração que a série tem 8

elementos, sendo, assim, é par.
A mediana ocupa uma posição entre a 4ª e a 5ª posições.
Terceiro passo: encontrar, na tabela, os elementos que ocupam as posições 4ª e 5ª.
14 14 15 15 Me 16 16 17 18
1ª 2ª 3ª 4ª 5ª 6ª 7ª 8ª
Elemento da 4ª posição = 15;

Elemento da 5ª posição = 16.
189
Quarto passo: calcular a média.
Me = (15+16)/2 = 15,5.
Interpretação: 50% dos valores observados são menores ou iguais a 15,5, e

50% dos valores observados são maiores ou iguais a 15,5.
4. a) Conjunto 1
•• Organizando os dados.
1 1 1 1 2 2 2 2 3
5 5 6 6 7 7 7 8 8
A série tem duas modas: Mo1 = 1 e Mo2 = 2.
Interpretação moda 1: o valor mais frequente é 1.
b) Conjunto 2
2 2 2 3 3 3 3 5
5 5 5 6 6 6 8 8
A série tem duas modas: Mo1 = 3 e Mo2 = 5.
c) Conjunto 3
1 1 2 2 3 3 4 4
5 5 6 6 7 7 8 8
A série não tem moda, pois não tem nenhum dado que se repita mais do que os outros.
Interpretação moda: é uma série amodal, ou seja, não tem valor(es) mais frequente(s).
190
Nome da disciplina
5. Primeiro passo: escrever, na tabela, os dados organizados em ordem

crescente (Rol) e, na linha de baixo, as posições.
2 3 4 4 4 5 5 6 8 8 9 9
1ª 2ª 3ª 4ª 5ª 6ª 7ª 8ª 9ª 10ª 11ª 12ª
•• Para o terceiro quartil.
Segundo passo: calcular a posição. Considerando n= 12.
Ou seja, Q3 está entre a 9ª e a 10ª posições.
Terceiro passo: calcular o terceiro quartil.
Valor que ocupa a 9ª posição = 8;
Valor que ocupa a 10ª posição = 8.
Então, calcule da seguinte forma.
Interpretação :75% dos dados observados são menores ou iguais a 8, e 25%

dos dados observados são maiores ou iguais a 8.
•• Para o nono decil (note que D9 = P90).
Quarto passo: calcular a posição. Considerando n= 12.
Ou seja, D9 está entre a 11ª e a 12ª posições.
191
Quinto passo: calcular o nono decil.
Interpretação: 90% dos dados observados são menores ou iguais a 9, e 10%

•• Para o trigésimo quinto percentil.
Sexto passo: calcular a posição. Considerando n = 12.
Ou seja, P35 está entre a 4ª e a 5ª posições.
Sétimo passo: calcular o trigésimo quinto percentil.
Interpretação: 35% dos dados observados são menores ou iguais a 4, e 65%

192
6. Nesta questão, você pode seguir os seguintes passos.
Passo 1: calcular a média.
Obs.: não se esqueça de que, na média, usamos a letra grega μ para a população.
Passo 2: calcular os quadrados dos desvios (xi – μ)2.
(x1 – μ)2 = (25 − 28,33)= (−3,33) 2 = 11,0889
(x2 – μ)2 = (22 − 28,33) = (−6,33) 2 = 40,0689
(x3 – μ)2 = (36 − 28,33) = (7,67) 2 = 58,8289
(x4 – μ)2 = (20 − 28,33) = (−8,33) 2 = 69,3889
(x5 – μ)2 = (29 − 28,33) = (0,67) 2 = 0,4489
(x6 – μ)2 = (38 − 28,33) = (9,67) 2 = 93,5089
Somando todos os resultados, temos 273,3334.
Passo 3: calcular a média dos quadrados dos desvios. Aqui, você vai calcular
para a população (variância).
Variância
Então σ2(x) = 45,5556.
193
Passo 4: calcular o desvio padrão calculando a raiz da variância.
Desvio padrão
Interpretação: a variabilidade de tempo de execução do teste é de 6,75 minutos.
7. O modo de calcular é o mesmo da questão anterior, só muda no final, ao

calcular a variância, usamos a fórmula para amostra.
Passo 1: calcular a média.
Passo 2: calcular os quadrados dos desvios (xi – ) 2
(x1 – ) 2 = (15 – 17,6) = (–2,6)2 = 6,76
(x2 – ) 2 = (10 – 17,6) = (–7,6)2 = 57,76
(x3 – ) 2 = (9 – 17,6) = (–8,6) 2 = 73,96
(x4 – ) 2 = (23 – 17,6) = (5,4) 2 = 29,16
(x5 – ) 2 = (31 – 17,6) = (13,4) 2 = 179,56
Somando todos os resultados, temos 347,20.
Passo 3: calcular a média dos quadrados dos desvios. Aqui, você vai calcular
para a amostra (variância).
Variância
Então, s2 (x) = 86,80.
194
Passo 4: calcular o desvio padrão calculando a raiz da variância.
Desvio padrão
= 9,3166
Interpretação: a variabilidade dos escores é de 9,32 pontos.
8. O primeiro passo é calcular a média.
Nº de xi.fi
Nº de dias (xi) funcionários (fi) (xi – ) 2.fi
0 10 0 57,10
1 16 16 30,88
2 14 28 2,10
3 8 24 2,96
4 5 20 12,95
5 4 20 27,24
6 4 24 52,12
7 3 21 63,75
∑ 64 153 249,10
Vamos calcular passo a passo.
Passo 1: devemos somar a coluna das frequências simples (fi) para obter Σfi
(frequência total).
Σfi = 64
Passo 2: calcular a média, multiplicar cada xi por sua correspondente fi e escrever

na coluna xi.fi; somar os valores calculados e escrever no final da coluna esse
resultado, e dividir o resultado pelo resultado do passo 1 (Σfi).
195
Passo 3: calcular os quadrados dos desvios, (xi – )2.fi
0 – 2,39 = (–2,39)2 = 5,71×10 = 57,10
1 – 2,39 = (–1,39) 2 = 1,93×16 = 30,88
2 – 2,39 = (–0,39) 2 = 0,15×14 = 2,10
3 – 2,39 = (0,61) 2 = 0,37×8 = 2,96
4 – 2,39 = (1,61) 2 = 2,59×5 = 12,95
5 – 2,39 = (2,61) 2 = 6,81×4 = 27,24
6 – 2,39 = (3,61) 2 = 13,03×4 = 52,12
7 – 2,39 = (4,61) 2 = 21,25×3 = 63,75
Somar os valores obtidos.
Σ(xi – )2.fi = 249,10
Passo 4: calcular a variância para a amostra.
Passo 9: calcular o desvio padrão.
Desvio padrão igual a 1,99.
9. Mais uma vez, vamos calcular passo a passo. Comparando com a anterior,
a diferença está em que aquela era para amostra, enquanto que esta é para a
população. Sugestão: use as colunas para facilitar os cálculos.
196
Idade dos estudantes da disciplina Estatística
Nº de estudantes xi.fi (xi – μ)2.fi

Idade (xi) (fi)
17 5 85 17,4845
18 20 360 15,1380
19 22 418 0,3718
20 10 200 12,769
21 6 126 27,2214
∑ 63 1189 72,9847
Passo 1: devemos somar a coluna das frequências simples (fi) para obter Σfi
(frequência total).
Σfi = 63
Passo 2: calcular a média, multiplicar cada xi por sua correspondente fi e escrever

na coluna xi.fi; somar os valores calculados e escrever no final da coluna esse
resultado, que é o Σxi.fi, dividir o resultado pelo resultado do passo 1 (Σfi).
Passo 3: calcular os quadrados dos desvios, Σ(xi – μ)2.fi.
17 – 18,87 = (–1,87)2 = 3,4969×5= 17,4845
18 – 18,87 = (–0,87)2 = 0,7569×20 = 15,1380
19 – 18,87 = (0,13) 2 = 0,0169×22 = 0,3718
20 – 18,87 = (1,13) 2 = 1,2769×10 = 12,769
21 – 18,87 = (2,13) 2 = 4,5369×6= 27,2214
Somar os valores obtidos na sexta coluna, Σ(xi – μ)2.fi.
Σ(xi – μ)2.fi = 72,9847
197
Passo 4: calcular a variância para a amostra.
Desvio padrão igual a 1,08.
10. Quando você tiver que calcular o desvio padrão para uma tabela com
intervalos, use o mesmo processo, apenas substituindo o xi pelo ponto médio.
Nº de famílias PM PM.fi
Renda (R$) (fi) (PMi − )2.fi
112 |-- 115 2 113,5 227 162

115 |-- 118 6 116,5 699 216
119,5
118 |-- 121 4 478 36
122,5
121 |-- 124 9 125,5 1102,2 0

124 |-- 127 8 128,5 1004 72
127 |-- 130 7 899,5 252
Total (∑fi) 36 4410 738
Vamos calcular passo a passo.
Passo 1: somar a coluna das frequências simples (fi) para obter Σfi (frequência total).
Σfi = 36
198
Passo 2: cálculo da média, calcular o ponto médio de cada intervalo (112+115)/2
= 113,5 primeiro PM, e multiplicar cada PM por sua correspondente fi e escrever
na coluna PM.fi, somar os valores calculados nessa coluna e escrever o total.
Dividir o resultado pelo resultado do Passo 1 (Σfi).
Passo 3: calcular os quadrados dos desvios (PMi – )2.fi
113,5 – 122,5 = (–9)2 = 81×2 = 162
116,5 – 122,5 = (–6)2 = 36×6 = 216
119,5 – 122,5 = (–3)2 = 9×4 = 36
122,5 – 122,5 = (0)2 = 0×9 = 0
125,5 – 122,5 = (3)2 = 9×8 = 72
128,5 – 122,5 = (6)2 = 36×7 = 252
Somar os valores obtidos.
Σ(PMi – )2.fi = 738
Passo 4: calcular a variância.
O desvio padrão é igual a 4,59.
199
11.
11.1
a) A mais dispersa em termos absolutos é a série B (maior desvio padrão).
b) Você tem que calcular o coeficiente de variação.
•• Para a série A.
•• Para a série B.
A série com maior dispersão relativa é a série A (maior coeficiente de variação).
c) Concluindo: a série mais dispersa é a série A.
11.2
a) A mais dispersa em termos absolutos é a série B (maior desvio padrão).
b) Você tem que calcular o coeficiente de variação.
•• Para a série A.
•• Para a série B.
As duas séries apresentam o mesmo valor para os coeficientes de variação.
c) Concluindo: as duas séries apresentam a mesma dispersão.
200
Capítulo 3
1.
Passo 1: para começar, você deve identificar o evento e o espaço amostral.
A: jovens sofriam com o autoritarismo dos pais.
S: adolescentes.
n(A) = 675;
n(S) = 1500.
Passo 3: calcular usando a fórmula.
0,45 ou 45%.
2.
Passo 1: para começar, você deve identificar os eventos e o espaço amostral.
A: casado(a);
B: solteiro(a);
C: divorciado(a);
S: total pesquisado.
Passo 2: identificar o número de elementos dos eventos e do espaço amostral.
n(A) = 267.867;
n(B) = 333.974;
n(C) = 16.779;
n(S) = 665.541.
201
Passo 3: calcular usando a fórmula apresentada a seguir.
0,4025 ou 40,25%
0,5018 ou 50,18%.
0,0252 ou 2,52%.
3.
a) Calcule Z (variável padronizada) para x = 116, x = 136, para x = 131 e para

x = 141 pontos.
Passo 1: identificar todos os elementos que compõe o problema.
a média: μ = 126;
o desvio padrão: σ(x) = 10;
os limites do intervalo: X = 116; X = 136; X = 131; X = 141.
•• Para X = 116.
Z = −1
•• Para X = 136.
Z=1
202
•• Para X = 131.
Z = 0,5
•• Para X = 141.
Z = 1,5
b) Qual a probabilidade de se escolher uma pessoa com escore maior do que

136 pontos?
Passo 1: identificar, no gráfico, o intervalo e a área que você deve calcular (usar o
z calculado no item anterior, para x = 136, o z = 1).
Passo 2: procurar, na tabela, a área correspondente a z = 1 (não se esqueça de

que a área dada na tabela é sempre entre 0 e z).
Z = 1 → Área = 0,3413.
Passo 3: calcular a probabilidade.
A área dada na tabela é de 0 a Z (0,3413), mas o intervalo solicitado é de 136 para

cima. Nesse caso, você deve subtrair de 0,5 (total de área de um lado da curva) o
valor encontrado (0,3413).
P(x > 136) = 0,5000 – 0,3413 = 0,1587 ou 15,87%.
203
c) Qual a probabilidade de se escolher uma pessoa com escore entre 126 e 131
pontos? Note que 126 é a média. Esse fica mais fácil.
Passo 1: identificar, no gráfico, o intervalo e a área que você deve calcular (usar o
z calculado no item anterior, para x = 131, o z = 0,5)
Passo 2: procurar na tabela a área correspondente à z = 0,5 (não se esqueça de

que a área dada na tabela é sempre entre 0 e z).
Z = 0,5 → Área = 0,1915.
A área dada na tabela é de 0 a Z (0,1915), e o intervalo solicitado é entre 0 e Z,

então, você já tem o resultado.
P(126 < x < 131) =0,5000 + 0,1915 ou 19,15%.
204
d) Qual a probabilidade de se escolher uma pessoa com escore entre 116 e
141 pontos?
Passo 1: identificar, no gráfico, o intervalo e a área que você deve calcular (usar
os valores de z calculados no item anterior, para x = 116, o z = −1 e para x = 141, o
z = 1,5).
Passo 2: procurar, na tabela, a área correspondente à z1 = –1 e z2 = 1,5 (não se

esqueça de que a área dada na tabela é sempre entre 0 e z).
Z1 = –1 → Área = 0,3413 (não se esqueça de que a curva é simétrica, e o sinal só

indica de que lado está a área).
Z2 = 1,5 → Área = 0, 4332.
A área solicitada é a soma das duas áreas, a correspondente à Z1 (0,3413), e a

correspondente à Z2 (0,4332).
P(116 < x < 141) = 0,3413 + 0,4332 = 0,7745 ou 77,45%.
205
Capítulo 4
1.
a) Estudo socioeconômico com estudantes da Unisul.
E = erro amostral tolerável = 0,03;
n0 = 1111,11 → arredondando, temos 1111 pessoas.
Um tamanho aproximado para a amostra seria de 1111 pessoas. Observe que

o pesquisador teve acesso à informação de que a população seria de 5600
pessoas, então você deve passar para o passo seguinte.
Arredondando, seriam 927 pessoas.
b) Estudo com famílias do bairro Rio Vermelho, em Florianópolis.
E = erro amostral tolerável = 0,04;
206
n0 = 625 crianças.
Um tamanho aproximado para a amostra seria de 625 crianças. Observe que

o pesquisador teve acesso à informação de que a população seria de 9400
crianças, então você deve passar para o passo seguinte.
Arredondando, seriam 586 crianças.
c) Estudo da fecundidade na cidade de Florianópolis.
n0 = 278;
n = 277.
d) Estudo com adolescentes de uma escola usuários de drogas.
n0 = 123;
n = 83.
f) Estudo do índice de massa corporal dos estudantes da Unisul.
n0 = 400;
n = 364.
g) Pesquisa de intenções de voto no Brasil.
n0 = 2500;
n = 2500.
207
2.
Passo 1: como já foi indicado o percentual de eleitores que votam no candidato,

só falta calcular o percentual dos eleitores que não votam no candidato ( )
Você pode deixar na forma decimal, pois, para calcular o erro, é usado dessa forma.
Passo 2: identificar o z com NC de 90%, o z = 1,645.
Passo 3: discriminar cada elemento da fórmula de cálculo do erro e calcular o
Em que:
z = 1,645.
p̂ = 26,4% ou (percentual da amostra de eleitores que votam no candidato);
(percentual da amostra dos eleitores que não votam no candidato);
Cálculo do erro
=1,645.
ou 2,74%.
208
Neste passo, o cálculo pode ser na forma percentual ou decimal.
ou
3.
Passo 1: identificar o z para o NC de 95%, z=1,96.
Passo 2: discriminar cada elemento da fórmula de cálculo do erro e calculá-lo.
Em que:
e = o que você quer calcular (erro da estimativa);
z = 1,96;
S(x) = 3,4 (desvio padrão da amostra);
Cálculo do erro
Observação importante: não é necessário multiplicar por 100, pois esse

resultado não indica percentual, neste caso, ele indica quilos!
209
4.
Passo 1:
Cálculo dos graus de liberdade para definição do ponto crítico:
GLn = 3 – 1 = 2 (graus de liberdade do numerador, isto porque são 3 máquinas, ou

seja, K=3);
GLm = 18 – 3 = 15 (graus de liberdade do denominador).
É o resultado de N menos K, N é composto por 5 peças na máquina 1, mais 7

peças da máquina 2, mais 6 peças da máquina 3.
Agora, procurando na tabela de F para 5% de nível de significância, entrando na coluna

da esquerda com GLm = 15 e na fila superior com GLn=2, resulta: F (5%,2,15) = 3,68.
Vamos calcular as médias das amostras:
Máquina 1 = 32/5= 6,40;
Máquina 2 = 67/7= 9,57;
Máquina 3 = 38/6= 6,33.
E a média das médias = (6,40+9,57+6,33)/3 = 22,30/3 = 7,43
Cálculo do SSE
Máquina 1
(8-6,40)^2+(6-6,40)^2+(5-6,40)^2+(6-6,40)^2+(7-6,40)^2 = 5,20
210
Máquina 2
(10-9,57)^2+(8-9,57)^2+(12-9,57)^2+(7-9,57)^2+(9-9,57)^2+(10-9,57)^2+(11-9,57)^2=17,68
Máquina 3
(7-6,33)^2+(5-6,33)^2+(8-6,33)^2+(6-6,33)^2+(7-6,33)^2+(5-6,33)^2=7,34
Somando as três, temos: 5,20+17,68+7,34 = 30,22.
SSE = 30,22
Cálculo do SSA
SSA = 5(6,40-7,43)^2 + 7(9,57-7,43)^2 + 6(6,33-7,43)^2 = 44,62
Cálculo do MSE
MSE = 30,22/15 = 2,01
Cálculo do MSA
MSA = 44,62/2 = 22,31
E o valor observado de F resulta em:
F(2/15) = 22,31/2,01= 11,01.
Então, ao nível de significância de 0.05 (95% de nível de confiança), rejeita-se

a hipótese H de igualdade de médias de produção, pois o valor observado da
estatística de teste F é maior do que o ponto crítico ou o F tabelado.
Há, portanto, evidência estatística de que as três máquinas não são iguais
relativamente ao volume médio de produção.
Em outras palavras: a marca da máquina influencia significativamente a

quantidade de peças fabricadas por ela.
211
A tabela ANOVA resulta nos seguintes valores.
Graus de
Fonte de variação Soma de quadrados Variância Razão F
liberdade
Entre grupos SSA =44,62 2 MSA = 22,31 11,01
Residual SSE = 30,22 15 MSE = 2,01
Total SSE = 74,84 17
Capítulo 5
1. a)
Passo 1: como as colunas já estão calculadas, você pode começar identificando

os elementos da fórmula.
n =10 (número de alunos)
∑x = 73;
∑y = 65,3;
∑x.y = 456,9;
∑x2 = 561;
∑y2 = 456,9.
Passo 2: calcule o coeficiente de correlação utilizando a fórmula vista no passo anterior.
212
Passo 3: analisando o resultado, você pode classificar e interpretar
contextualizando-o na situação descrita.
Classificação: a correlação entre as notas de Matemática e Biologia pode ser

classificada como negativa forte.
Como interpretar?
O coeficiente de correlação resultou em um número negativo e próximo de 1 (r =

–0,73842), sendo assim, a correlação entre as notas de Matemática e Biologia é
negativa (significativa), ou seja, quanto maior a nota em Matemática, menor será a nota
em Biologia, e quanto menor a nota em Matemática, maior será a nota em Biologia.
b)
Passo 1: para a equação da reta, conforme mostrada abaixo, você pode começar
calculando a inclinação da reta (a).
Equação da reta de regressão → b+a.X
Inclinação da reta (a).
Agora, identifique os elementos da fórmula.
n = 10 (número de alunos);
∑x = 73;
∑y = 65,3;
∑x.y = 456,9;
∑x2 = 561;
213
Passo 2: calcule a intersecção com o eixo y (b).
Intersecção do eixo y (b).
Identifique os elementos da fórmula.
n = 10 (número de alunos);
∑x = 73;
∑y = 65,3;
214
Passo 3: construa a equação da reta de regressão.
Após calcular a e b, tem-se:
b+a.X;
11,671171-0,70427.X.
c)
Para calcular a estimativa, você necessita de um valor para X, que é dado no item
c), ou seja, X = 6,5. Para estimar a nota de Biologia, você precisa de uma nota de
Matemática. Observe o seguinte procedimento:
X = 6,5;
11,671171 − 0,70427.X;
11,671171 − 0,70427.(6,5);
11,671171 − 4,577755;
7,09.
Interpretação: se um aluno tirar 6,5 em Matemática, possivelmente, ele tirará em

torno de 7,09 na nota de Biologia.Anexos
215
Anexos
Tabela 3.7 - Tabela de áreas da distribuição padronizada.
Fonte: Triola (1999)
216
217

Probabilidade e Estatística - UNISUL PDF

Hochgeladen von

Dokumentinformationen

Originaltitel

Copyright

Verfügbare Formate

Dieses Dokument teilen

Dokument teilen oder einbetten

Freigabeoptionen

Stufen Sie dieses Dokument als nützlich ein?

Sind diese Inhalte unangemessen?

Copyright:

Verfügbare Formate

Probabilidade e Estatística - UNISUL PDF

Hochgeladen von

Copyright:

Verfügbare Formate

Universidade Sul de Santa Catarina

Universidade do Sul de Santa Catarina – Unisul

Diretor do Campus Universitário de Tubarão

Campus Universitário UnisulVirtual

Unidade de Articulação Acadêmica (UnA) – Ciências Sociais, Direito, Negócios e Serviços

Gerente de Operações e Serviços Acadêmicos

Revisão e atualização de conteúdo

Professor conteudista Revisor

Revisão e atualização de conteúdo ISNB

Projeto gráfico e capa

1. Estatística. 2. Probabilidades. I. Mirada, Joseane Borges de. II.

CDD (21. ed.) 519.5

Ficha catalográfica elaborada pela Biblioteca Universitária da Unisul

Sobre os Professores Conteudistas | 181

Respostas e comentários das atividades de autoavaliação | 183

Olá! Bem-vindo(a) à disciplina Probabilidade e Estatística.

Dentro desta unidade de aprendizagem você irá estudar o que os profissionais e

Tendo como base a matemática, esta unidade de aprendizagem trata da

Não é objetivo desta unidade de aprendizagem formar estatísticos e, sim, profissionais

Desta forma, o esperado é que ao final da unidade de aprendizagem você tenha em

Professor Luiz Arthur Dornelles Jr.

No que se refere à gestão das organizações, a situação não é diferente. Para se

Por isso, dizemos que a Estatística é um conjunto de ferramentas, as quais,

Para conhecer Estatística, é importante que você compreenda, antes, o

A Estatística é uma coleção de métodos para planejar

A Estatística está interessada nos métodos científicos para a

Você percebeu que as definições assemelham-se e completam-se? Então, observe,

A Estatística corresponde a um conjunto de métodos científicos para a coleta,

•• Estatística descritiva: aplicada quando você depara-se com uma

O método é um conjunto de meios dispostos convenientemente para se chegar a um fim

a. Definição do problema: a primeira fase do trabalho estatístico

b. Planejamento: consiste em determinar o procedimento necessário

É preciso planejar o trabalho a ser realizado, tendo em vista o objetivo que se

c. Coleta de dados: compreende a coleta das informações

Todas essas fases são realizadas quando se cumpre um processo de pesquisa.

Figura 1.1 – O processo da pesquisa

Características Estudo da amostra:

Fonte: Adaptado de Ação Local de Estatística Aplicada − ALEA (1999-2010).

População é o conjunto total de elementos com, pelo menos, uma característica em

A definição dos elementos que serão estudados está ligada diretamente às

•• animados: pessoas, animais etc.;

Em relação ao número de elementos, a população pode ser:

•• finita: quando tem um número limitado de elementos (número de

A representação do tamanho da população é dada por N = número de

São exemplos de definição de população:

•• ao estudar a idade e o sexo de funcionários da empresa A: para definir

Amostra é o conjunto de elementos ou observações, recolhidos a partir de um

A amostra precisa ser representativa, ou seja, possuir as mesmas características

A representação do tamanho da amostra é dada por n = número de elementos

Processos estatísticos de abordagem

•• Censo 1: é uma coleção de dados relativos a todos os elementos

Principais propriedades do censo:

· admite erro processual zero e tem confiabilidade de 100%;

•• Parâmetro: usado para designar alguma característica descritiva

•• Estimativa: é o valor assumido por certa Estatística (exemplo: 60%

A população é o conjunto de indivíduos ou objetos que apresentam, em comum,

Limitações de tempo, custo e as vantagens do uso das técnicas Estatísticas

Observe, a seguir, mais alguns conceitos do processo estatístico, relacionados à

•• Estatística: característica descritiva dos elementos da amostra

•• Nível de confiança: é expresso em percentual e representa quantas

Como podemos ver, o uso da amostragem é vantajoso por trazer:

•• economia: é mais econômico, o levantamento de somente

Ao analisar uma determinada experiência, um fato ou um elemento, você pode