Estatística

Probabilidade e Estatística
Sonia Maria Barros Barbosa Correa
4ª Edição
PONTIFÍCIA UNIVERSIDADE CATÓLICA DE MINAS GERAIS
Grão Chanceler Dom Walmor Oliveira de Azevedo
Reitor Prof. Dom Joaquim Giovani Mol Guimarães

a
Vice-reitora Prof . Patrícia Bernardes
Pró-reitor de Extensão Prof. Wanderley Chieppe Felippe
Pró-reitor de Gestão Financeira Prof. Paulo Sérgio Gontijo do Carmo
Pró-reitora de Graduação Profª. Maria Inês Martins
Pró-reitor de Logística e Infra-estrutura Prof. Rômulo Albertini Rigueira
Pró-reitor de Pesquisa e Pós-Graduação Prof. João Francisco de Abreu
Pró-reitor de Recursos Humanos Prof. Alexandre Rezende Guimarães
PUC MINAS VIRTUAL

Diretora de Ensino a Distância Profª. Maria Beatriz Ribeiro de Oliveira Gonçalves
Autoria e Revisão Equipe Pedagógica e Tecnológica da PUC Minas Virtual

© PUCMINAS, 2009
Design Gráfico e diagramação Profª. Simone Nogueira

Sílvia Fonseca
Reprodução proibida. Art. 184
do Código Penal e Lei 9.610 de
19 de fevereiro de 1998.
Todos os direitos reservados

PONTIFÍCIA UNIVERSIDADE
CATÓLICA DE MINAS GERAIS
DIRETORIA DE ENSINO A DISTÂNCIA
2009
Impresso no Brasil
ATENDIMENTO E INFORMAÇÕES:
Telefone: (31) 3238-5656
www.virtual.pucminas.br/faleconosco
Sumário
Apresentação ........................................................................................... 5
MÓDULO 1 ....................................................................... 6
Capítulo 1. Natureza e Fundamentos do Método Estatístico .................................. 7

1.1. Introdução à Estatística.....................................................................................7
1.2. Importância da Estatística..................................................................................8
1.3. Grandes áreas da Estatística ...............................................................................9
1.4. Fases do Método Estatístico .............................................................................. 12
1.5. Séries Estatísticas .......................................................................................... 14
1.6. Apresentação de dados – Tabelas e Gráficos: Construção e Interpretação ...................... 21
Capítulo 2. Amostragem .............................................................................30

2.1. Importância da Amostragem ............................................................................. 30
2.2. Alguns conceitos e definições............................................................................ 31
2.3. Amostragem Aleatória Simples .......................................................................... 33
2.4. Amostragem Aleatória Estratificada .................................................................... 35
2.5. Amostragem por Conglomerado ......................................................................... 36
2.6. Amostragem Sistemática ................................................................................. 37
Capítulo 3. Distribuição de Freqüência...........................................................40

3.1. Introdução e Definições................................................................................... 40
3.2. Elementos de uma distribuição de freqüência: Amplitude total, Limites de classe, Amplitude
do intervalo de classe, Ponto médio da classe, Freqüência absoluta (simples e acumulada),
Freqüência relativa (simples e acumulada) .......................................................... 43
3.3. Regras Gerais para a elaboração de uma distribuição de freqüência ............................ 47
3.4. Gráficos representativos de uma distribuição de freqüência: histograma, polígono de
freqüência e ogiva......................................................................................... 48
Capítulo 4. Medidas de Posição ....................................................................51

4.1. Introdução................................................................................................... 51
4.2. Média aritmética simples (X ) ........................................................................... 52
4.3. Moda (Mo) .................................................................................................... 54
4.4. Mediana (Md) ................................................................................................ 56
4.5. Média Geométrica (MG) ................................................................................... 60
4.6. Média Harmônica (Mh) ..................................................................................... 60
4.7. Separatrizes: Quartis, Decis e Percentis ............................................................... 62
Capítulo 5. Medidas de Dispersão..................................................................65
5.1. Dispersão .................................................................................................... 65
5.2. Assimetria ................................................................................................... 67
5.3. Curtose....................................................................................................... 68
MÓDULO 2 ...................................................................... 72
Capítulo 6. Probabilidade ...........................................................................73

6.1. Experimento aleatório, espaço amostral e eventos ................................................. 73
6.2. Probabilidade: Definição Clássica; Probabilidade e freqüência relativa ......................... 77
6.3. Tipos de eventos ........................................................................................... 78
6.4. Axiomas de Probabilidade ................................................................................ 79
6.5. Probabilidade Condicional e Independência de Eventos ............................................ 81
Capítulo 7. Variáveis Aleatórias....................................................................85

7.1. Conceito de variável aleatória........................................................................... 85
7.2. Distribuição de probabilidade ........................................................................... 86
7.3. Função de distribuição acumulada...................................................................... 86
7.4. Esperança matemática, variância e desvio padrão: propriedades ................................ 86
7.5. Distribuições Discretas .................................................................................... 86
7.6. Distribuição contínua...................................................................................... 91
Capítulo 8. Inferência Estatística ..................................................................98

8.1. População e amostra; Estatísticas e parâmetros; Distribuições amostrais ...................... 98
8.2. Estimação ..................................................................................................101
8.3. Testes de Hipóteses ......................................................................................104
Capítulo 9. Correlação e Regressão Linear .................................................... 110

9.1. Diagrama de dispersão ...................................................................................110
9.2. Correlação Linear .........................................................................................111
9.3. Coeficiente de Correlação Linear (r) ..................................................................112
9.4. Regressão – Reta de regressão (ou reta de mínimos quadrados ou reta de ajuste)..........115
ANEXOS........................................................................ 118
Anexo A. TNA – Tabela de Números Aleatórios ...........................................................119
Anexo B. Tabela da Curva Normal – (Faixa Central) .....................................................120
Anexo C. Apêndice Matemático..............................................................................121
Anexo D. Estudo de Caso......................................................................................123
Glossário.............................................................................................. 138
Referências Bibliográficas......................................................................... 141
Apresentação
Este texto foi elaborado para ser um material de referência para o aluno no estudo
da disciplina Probabilidade e Estatística na modalidade a distância.
A disciplina será desenvolvida em um semestre letivo e o conteúdo está constituído
de 9 capítulos, dividido em 2 Módulos. O módulo I contemplará a Estatística Descriti-
va e o módulo II, a Probabilidade e Estatística Inferencial.
A apresentação, em uma mesma obra, de conteúdos comumente encontrados em vá-
rios livros, visa garantir ao estudante da graduação o acesso a informações, o enten-
dimento delas e sua utilização como instrumento de análises de dados. Instrumentos
estes que permitam a viabilidade de conclusões por meio de afirmações estatísticas.
Como material de apoio, a consulta à bibliografia recomendada é essencial para a
aprendizagem.
Como sistemática de apresentação, esclareço que, em todos os capítulos, são apre-
sentados exemplos com o objetivo de tornar mais claros os temas tratados.
Para que o aluno tenha um bom aproveitamento, é importante estudar detalhada-
mente cada unidade do programa, analisar os exemplos e os exercícios resolvidos.
Será também fundamental solucionar os exercícios propostos.
No capítulo 2, estaremos utilizando uma TNA (Tabela de Números Aleatórios), neces-
sária para resolução dos exercícios e avaliações. Nos capítulos 7 e 8, faremos uso de
uma outra tabela, a Tabela da Curva Normal, que devera ser consultada para a reso-
lução dos exercícios e avaliações. Estas duas tabelas são instrumentos de suma im-
portância no estudo da Estatística. Muito simples de serem utilizadas, elas podem ser
encontradas, como anexos.
Módulo 1
Capítulo 1.
Natureza e Fundamentos do Método Estatístico
Abordando temas relacionados ao método estatístico, esta unidade tem como objeti-
vos Gerais:
Demonstrar a importância da Estatística na vida diária;
Mostrar como podemos utilizá-la de forma correta;
Ensinar como compor tabelas a partir de dados numéricos;
Ensinar como representar dados numéricos em gráficos.
E como objetivos específicos:
Oferecer exemplos de tabelas e gráficos que podem representar, de forma sinté-

tica, as informações obtidas através de processos de pesquisa.
1.1. Introdução à Estatística

A palavra estatística lembra, à maioria das pessoas, recenseamento. Os censos existem há
milhares de anos e constituem um esforço imenso e caro feito pelos governos, com o objeti-
vo de conhecer seus habitantes, sua condição socioeconômica, sua cultura, religião etc.
Portanto, associar estatística a censo é perfeitamente correto do ponto de vista histórico,
sendo interessante salientar que as palavras estatística e estado têm a mesma origem
latina: status.
Desde a Antigüidade, há indícios de que 3000 anos A.C., reis e imperadores se preocupa-
vam em obter informações, não só em relação a população mas também às riquezas eco-
nômicas, informações essas que seriam utilizadas para a taxação de impostos e para fins de
alistamento militar. Por estar desde os primórdios ligada ao governo tem a origem associada
a palavra status.
A estatística é também comumente associada às pesquisas de opinião pública, aos vários
índices governamentais, aos gráficos e às médias publicadas diariamente na imprensa. Na
realidade, entretanto, a estatística engloba muitos outros aspectos, sendo fundamental na
análise de dados provenientes de quaisquer processos onde exista variabilidade.
É possível distinguir duas concepções para a palavra ESTATÍSTICA: no plural (estatísticas),
indica qualquer coleção de dados numéricos, reunidos com a finalidade de fornecer informa-
ções acerca de uma atividade qualquer. Assim, por exemplo, as estatísticas demográficas
referem-se aos dados numéricos sobre nascimentos, falecimentos, matrimônios, desquites
PUC Minas Virtual 7 Probabilidade e Estatística

etc. As estatísticas econômicas consistem em dados numéricos relacionados com empre-
go, produção, vendas e com outras atividades ligadas aos vários setores da vida econômica.
No singular (Estatística), indica a atividade humana especializada ou um corpo de técnicas
ou ainda uma metodologia desenvolvida para a coleta, a classificação, a apresentação, a
análise e a interpretação de dados quantitativos e a utilização desses dados para a tomada
de decisões.
1.2. Importância da Estatística

O mundo está repleto de problemas. Para resolvermos a maioria deles, necessitamos de
informações. Mas, que tipo de informação? Que quantidade de informações? Após obtê-las,
que fazer com elas? A Estatística trabalha com essas informações, associando os dados ao
problema, descobrindo como e o quê coletar, assim capacitando o profissional a obter con-
clusões a partir dessas informações, de tal forma que possam ser entendidas por outras
pessoas.
Recolher e analisar a informação é muito importante no mundo atual, fazer a análise dessas
informações nos permite tirar conclusões, prever situações e planejar atividades com mais
segurança.
Na era da energia nuclear, os estudos estatísticos têm avançado rapidamente e, com seus
processos e técnicas, têm contribuído para a organização de empresas e utilização dos re-
cursos do mundo moderno.
Portanto, os métodos estatísticos auxiliam o cientista social, o economista, o engenheiro, o
agrônomo e muitos outros profissionais a realizarem o seu trabalho com mais eficiência,
pois está baseada em fatos e dados, eliminando as tentativas e erros.
A Estatística é uma parte da Matemática que utiliza métodos específicos para

a coleta, organização, descrição, análise e interpretação de dados, viabilizan-
do a utilização dos mesmos na tomada de decisões.
Vejamos alguns exemplos:

Os estatísticos do governo conduzem censos de população, moradia, produtos industri-
ais, agricultura e outros.
Em instituições, também são feitas compilações sobre vendas, produção, inventário, folha
de pagamento e outros dados das indústrias e empresas. Essas estatísticas informam ao
administrador como a sua empresa está crescendo, seu crescimento em relação a outras
empresas fornecendo-lhes condições de planejar ações futuras. A análise dos dados é
muito importante para elaboração de programas e planos.

Em geral, as pessoas, quando se referem ao termo estatística, desconhecem que o aspecto
essencial é o de proporcionar métodos inferenciais, que permitam conclusões que transcen-
dam os dados obtidos inicialmente.
1.3. Grandes áreas da Estatística

Para fins de apresentação, é usual se dividir a estatística em três grandes áreas, embora
não se trate de ramos isolados:
Estatística Descritiva e Amostragem – Conjunto de técnicas que objetivam coletar, orga-
nizar, apresentar, analisar e sintetizar os dados numéricos de uma população, ou amos-
tra;
Estatística Inferencial – Processo de se obter informações sobre uma população a partir
de resultados observados na amostra;
Probabilidade – Modelos matemáticos que explicam os fenômenos estudados pela Esta-
tística em condições normais de experimentação.
Em estatística, utilizamos extensamente os termos: população, amostra, censo, parâmetros,

estatística, dados discretos, dados contínuos, dados quantitativos e dados qualitativos; que
estaremos definindo abaixo para maior compreensão:
População: é uma coleção completa de todos os elementos a serem estudados.
Amostra: é uma subcoleção de elementos extraídos de uma população.
Censo: é uma coleção de dados relativos a todos os elementos de uma população.
Parâmetro: é uma medida numérica referente a uma característica de uma população.
Estatística: é uma medida numérica que descreve uma característica de uma amostra.
Dados contínuos: resultam de um número infinito de valores possíveis que podem ser
associados a pontos em uma escala contínua de tal maneira que não haja lacunas.
Dados discretos: resultam de um conjunto finito de valores possíveis, ou de um conjunto
enumerável de valores.
Dados quantitativos: consistem em números que representam contagens ou medidas.
Dados qualitativos: podem ser separados em diferentes categorias que se distinguem por
alguma característica não-numérica.
Amostragem
É o processo de escolha da amostra. É a parte inicial de qualquer estudo estatístico, e con-
siste na escolha criteriosa dos elementos a serem submetidos ao estudo. Geralmente, as

pesquisas são realizadas através de estudo dos elementos que compõem uma amostra,
extraída da população que se pretende analisar.
Exemplo 1.1. Pesquisas sobre tendências de votação

Em época de eleição, é comum a realização de pesquisas com o objetivo de se conhecer as
tendências do eleitorado. Para que os resultados sejam de fato representativos, toma-se o
cuidado de se entrevistar um conjunto de pessoas com características socioeconômicas,
culturais, religiosas, etc. tão representativas quanto possível da população à qual os resulta-
dos da pesquisa serão estendidos. A escolha da amostra, a redação do questionário, a en-
trevista, a codificação dos dados e a apuração dos resultados são as etapas desse tipo de
pesquisa.
População e amostra
O estudo de qualquer fenômeno, seja ele natural, social, econômico ou biológico, exige a
coleta e a análise de dados estatísticos. A coleta de dados é, pois, a fase inicial de qualquer
pesquisa.
É com base nos dados da amostra que se desenvolvem os estudos, visando a fazer inferên-
cias sobre a população.
Exemplo 1.2. Avaliação de um programa de ensino

Toma-se certo número de pares de turmas: a um conjunto de turmas ensina-se um assunto
por um novo método e, ao outro, pelo método clássico. Aplica-se uma prova a cada um dos
grupos. As notas observadas nesses conjuntos de turmas constituem a amostra a ser anali-
sada. Se os resultados do novo método forem melhores, iremos aplicá-lo a todas as turmas,
isto é, à população. A partir da amostra, estabelecemos o que é conveniente para a popula-
ção, ou seja, fazemos uma inferência para a população.
Exemplo 1.3. Renda média per capita em diversas regiões do país

Toma-se um conjunto de indivíduos em cada região, escolhidos ao acaso, e sobre esse gru-
po são feitos os estudos. Os indivíduos assim escolhidos constituem a amostra e os resulta-
dos nela observados serão estendidos à população.
Estatística Descritiva
É a parte mais conhecida. Quem vê o noticiário, na televisão ou nos jornais, sabe quão fre-
qüente é o uso de médias, índices e gráficos nas notícias.

Exemplo 1.4. INPC (Índice Nacional de Preços ao Consumidor)
Sua construção envolve a sintetização, em um único número, dos aumentos dos produtos
de uma cesta básica.
Exemplo 1.5. Anuário Estatístico Brasileiro

O IBGE publica esse anuário apresentando, em várias tabelas, os mais diversos dados so-
bre o Brasil: educação, saúde, transporte, economia, cultura, etc. Embora simples, fáceis de
serem entendidas, as tabelas são o produto de um processo demorado e extremamente
dispendioso de coleta e apuração de dados.
Exemplo 1.6. Anuário Estatístico da Embratur

A Embratur publica esse anuário apresentando, em várias tabelas e gráficos, os mais diver-
sos dados sobre Turismo Interno e dados sobre entrada de turistas estrangeiros no Brasil.
Estatística Inferencial (ou Indutiva)
A tomada de decisões sobre a população, com base em estudos feitos sobre os dados da
amostra, constitui o problema central da inferência estatística.
Exemplo 1.7.
Suponha que a distribuição das alturas de todos os habitantes de um país possa ser repre-
sentada por uma distribuição normal. Mas não conhecemos de antemão a média da distribu-
ição. Devemos, pois, estimá-la.
Exemplo 1.8. Análise financeira.
Os analistas financeiros estudam dados sobre a situação da economia, visando explicar

tendências dos níveis de produção e de consumo, projetando-os para o futuro.
Exemplo 1.9. Ocorrência de terremotos.

Os geólogos estão continuamente coletando dados sobre a ocorrência de terremotos. Gos-
tariam de inferir quando e onde ocorrerão tremores, e qual a sua intensidade. Trata-se, sem
dúvida, de uma questão complexa, que exige longa experiência profissional, além de cuida-
dosa aplicação de métodos estatísticos.

Probabilidade
O processo de generalização, que é característico do método indutivo, está associado a

uma margem de incerteza. A existência da incerteza deve-se ao fato de que a conclusão,
que se pretende obter para o conjunto de todos os indivíduos analisados quanto a determi-
nadas características comuns, baseia-se em uma parcela do total das observações. A medi-
da da incerteza é tratada mediante técnicas e métodos que se fundamentam na Teoria da
Probabilidade. Essa teoria procura quantificar a incerteza existente em determinada situa-
ção.
1.4. Fases do Método Estatístico

Quando se pretende empreender um estudo estatístico completo, existem diversas fases do
trabalho que devem ser desenvolvidas para possibilitar que os resultados alcançados sejam
considerados válidos. As principais fases do método estatístico são as seguintes:
Definição do problema
Planejamento
Coleta de dados
Apuração dos dados
Apresentação dos dados
Análise e Interpretação dos dados
Definição do problema
Após a escolha do tema, a primeira fase do trabalho consiste em uma definição ou formula-
ção correta do problema a ser estudado. O analista além de considerar detidamente esse
problema objeto do estudo, deverá examinar outros levantamentos realizados no mesmo
campo e que sejam análogos. Esses dados podem conter parte da informação de que ne-
cessita.
Planejamento
O passo seguinte, compreende a fase do planejamento, que consiste em se determinar o
procedimento necessário para se resolver o problema e, em especial, como levantar infor-
mações sobre o assunto, objeto do estudo. É preciso planejar o trabalho a ser realizado ten-
do em vista o objetivo que se pretende atingir. É nessa fase que será escolhido o tipo de
levantamento a ser utilizado. Pode-se utilizar de dois tipos de levantamento:
Levantamento censitário, quando a contagem for completa, abrangendo todo o universo;
Levantamento por amostragem, quando a contagem for parcial.

Outros elementos importantes que devem ser tratados nessa mesma fase são:
Cronograma das atividades, através do qual são fixados os prazos para as várias fases;
Custos envolvidos;
Exame das informações disponíveis;
Delineamento da amostra, etc.
Coleta dos dados

O terceiro passo é essencialmente operacional, compreendendo a coleta das informações
propriamente ditas. Nessa fase do método estatístico, é conveniente estabelecer uma distin-
ção entre duas espécies de dados:
Dados primários – quando são publicados ou coletados pelo próprio pesquisador ou or-
ganização que os escolheu;
Dados secundários – quando são publicados ou coletados por outra organização.
Um conjunto de dados é, pois, primário ou secundário em relação a alguém. As tabelas do

Censo Demográfico são fontes primárias. Quando um determinado jornal publica dados es-
tatísticos extraídos de várias fontes e relacionadas com diversos setores industriais, os da-
dos são secundários. Esses dados podem ser utilizados em pesquisas em desenvolvimento.
A coleta de dados pode ser realizada de duas maneiras:
Coleta Direta – quando é obtida diretamente da fonte, como no caso da empresa que
realiza uma pesquisa para saber a preferência dos consumidores pela sua marca;
Coleta Indireta – quando o problema é inferido a partir dos elementos obtidos pela coleta
direta, ou pelo conhecimento de outros fenômenos relacionados com o fenômeno em
questão.
Apuração dos dados

É necessário realizar algum tratamento prévio nos dados obtidos, para torná-los mais signi-
ficativos, antes de iniciar a sua análise.
A quarta etapa do processo é, então, a da apuração ou sumarização, que consiste em re-
sumir os dados através de sua contagem e agrupamento. Essa apuração pode ser realizada
manualmente ou pelos processos da eletromecânica ou da eletrônica.

Apresentação dos dados
Os dados devem ser apresentados sempre de forma adequada, qualquer que seja a finali-
dade, tornando mais preciso o exame do fenômeno que está sendo objeto de tratamento
estatístico.
Há duas formas de apresentação ou exposição dos dados observados, que não se excluem
mutuamente:
Apresentação tabular – É a apresentação numérica dos dados. Consiste em dispor os
dados em linhas e colunas distribuídas de modo ordenado, segundo algumas regras prá-
ticas adotadas pelos diversos sistemas estatísticos. As tabelas têm a vantagem de con-
seguir expor, sinteticamente e em um só local, os resultados sobre determinado assunto,
de modo a se obter uma visão global daquilo que se pretende analisar.
Apresentação gráfica – É a apresentação geométrica dos dados numéricos. Embora a
apresentação tabular seja de extrema importância no sentido de facilitar a análise numé-
rica dos dados, não permite ao analista obter uma visão tão rápida, fácil e clara do fenô-
meno e sua variação como aquela conseguida através de um gráfico.
Análise e interpretação dos dados

Nessa última etapa, o interesse maior reside em tirar conclusões que auxiliem o pesquisador
a resolver seu problema. A análise realizada pelos estatísticos está ligada essencialmente
ao cálculo de medidas, cuja finalidade principal é descrever o fenômeno. Assim, o conjunto
de dados a ser analisado pode ser expresso por números-resumo, que evidenciam as carac-
terísticas particulares desse conjunto. O significado exato de cada um dos valores obtidos
através do cálculo das várias medidas estatísticas disponíveis deve ser bem interpretado. É
possível, mesmo nessa fase, arriscar algumas generalizações as quais envolverão, como
mencionado anteriormente, algum grau de incerteza, porque não se pode estar seguro de
que o que foi constatado para aquele conjunto de dados (a amostra) se verificará igualmente
para a população.
1.5. Séries Estatísticas

Define-se série estatística como toda e qualquer coleção de dados estatísticos que se refe-
rem a uma mesma ordem de classificação: quantitativa.
No sentido mais amplo, série é uma sucessão de números referentes a qualquer variável.
Se os números expressarem dados estatísticos, a série será chamada de série estatística.
Em sentido mais restrito, pode-se dizer que uma série estatística é uma sucessão de dados
estatísticos que se referem a caracteres qualitativos, ao passo que uma sucessão de dados
estatísticos que dizem respeito a caracteres quantitativos configurará uma Distribuição de
Freqüência.

Em outros termos, a palavra série é usada normalmente para designar um conjunto de da-
dos dispostos de acordo com um caráter variável, residindo a qualidade serial na disposição
desses valores, e não em uma disposição temporal ou espacial de indivíduos.
Vamos introduzir o conceito, de um instrumento amplamente utilizado pela Estatística a Ta-

bela ”
Tabela é um quadro que resume um conjunto de observações.
Uma tabela compõe-se de:

Corpo – conjunto de linhas e colunas que contém informações sobre a variável em estu-
do;
Cabeçalho – parte superior da tabela onde é especificado o seu conteúdo;

Coluna indicadora – parte da tabela que especifica o conteúdo das linhas;
Linhas – retas imaginárias que facilitam a leitura, no sentido horizontal, de dados que se
inscrevem nos seus cruzamentos com as colunas;
Casa ou célula – espaço destinado a um número;
Título – conjunto de informações, as mais completas possíveis, respondendo às pergun-
tas: O quê? – Quando? – Onde? – localizado no topo da tabela.
Fonte – referência que indica onde os dados foram obtidos.
Exemplo 1.10
Tabela 1.1. Quantas horas se trabalha em cada País – 2001

(Revista Veja – Nº 12 – Ano 37 – Edição 1846)
Países Horas
Coréia 46,2
Japão 42,2
Brasil 41,8
Estados Unidos 40,5
Inglaterra 39,6
França 38,2
Fonte: Organização Internacional do Trabalho (OIT).

As tabelas servem para apresentar séries estatísticas. Conforme varie um dos elementos da
série, podemos classificá-la em:
Cronológicas – Tempo (fator temporal ou cronológico) – a que época se refere o fenôme-
no analisado;
Geográficas – Local (fator espacial ou geográfico) – onde o fenômeno acontece;
Específicas – Fenômeno (descrição de um fato ou fator) – o que é descrito.
Os dados estatísticos resultantes da coleta direta da fonte, sem outra manipulação que não
a contagem ou medida, são chamados dados absolutos.
Dados Relativos são o resultado de comparações por quociente (razões) que se estabele-
cem entre dados absolutos e têm por finalidade realçar ou facilitar as comparações entre
quantidades.
Exemplo 1.11
Tabela 1.2. Operadora WKX – Vendas por Unidade da Federação – 1995
Dados Absolutos Dados Relativos

Unidades da
Federação Vendas
Vendas (%)
(em milhares de reais)
Minas Gerais 4000 12,69
Paraná 2230 7,08
Rio Grande do Sul 6470 20,53
Rio de Janeiro 8300 26,34
São Paulo 10090 32,02
Outros 420 1,33
TOTAL BRASIL 31510 1
Fonte: Departamento de Análise de Mercado
1.5.1. Tipos de Séries Estatísticas
Simples (ou de uma entrada)

As séries estatísticas diferenciam-se de acordo com a variação de um dos três elementos:
tempo, local e fenômeno.

Série Cronológica
Também chamada de série temporal, série histórica, série evolutiva ou marcha, identifica-se
pelo caráter variável do fator cronológico. Assim, deve-se ter:
Elemento variável: Época
Elementos Fixos: Local e Fenômeno
Exemplo 1.12
Tabela 1.3. – Operadora WKX – Venda de bilhetes aéreos

– Mercado Interno – 1995
Vendas
Meses (em milhares de reais)
Janeiro 2300
Fevereiro 1800
Março 2200
Abril 2210
Maio 2360
Junho 2600
Julho 2690
Agosto 3050
Setembro 3500
Outubro 3440
Novembro 3100
Dezembro 2760
TOTAL ANUAL 31510

Série Geográfica
Também chamada de série territorial, série espacial ou série de localização, identifica-se

pelo caráter variável do fator geográfico. Assim, deve-se ter:
Elemento variável: Local
Elementos Fixos: Época e Fenômeno

Exemplo 1.13
Tabela 1.4. Operadora WKX – Vendas por Unidade da Federação – 1995
Vendas
Unidades da Federação (em milhares de reais)
Minas Gerais 4000
Paraná 2230
Rio Grande do Sul 6470
Rio de Janeiro 8300
São Paulo 10090
Outros 420
TOTAL BRASIL 31510
Série Específica
Também chamada de série categórica ou série por categoria, identifica-se pelo caráter vari-
ável de fator especificativo. Assim, deve-se ter:
Elemento variável: Fenômeno
Elementos Fixos: Local e Época
Exemplos 1.14
Tabela 1.5. Operadora WKX – Venda de bilhetes aéreos por Linha – 1995
Vendas
Linha do Produto (em milhares de reais)
Linha A 6450
Linha B 9310
Linha C 15750
TODAS AS LINHAS 31510

Tabela 1.6. Número de empregados das várias classes de salários no estado de São Paulo – 1998
Classes de Salários (R$) Número de Empregados
Até 80 41 326
De 80 a 119 123 236
De 120 a 159 428 904
De 160 a 199 324 437
De 200 a 399 787 304
De 400 a 599 266 002
De 600 a 799 102 375
De 800 a 999 56 170
1000 e mais 103 788
TOTAL 2 233 542
Fonte: Serviço de Estatística da Previdência e Trabalho (Dados alterados para melhor compreensão)
1.5.2. Tabelas Compostas (ou de dupla entrada)
As tabelas apresentadas anteriormente são tabelas estatísticas simples, onde apenas uma
série está representada. É comum, todavia, haver necessidade de apresentar, em uma úni-
ca tabela, mais do que uma série. Quando as séries aparecem conjugadas, tem-se uma
tabela de dupla entrada. Em uma tabela desse tipo são criadas duas ordens de classifica-
ção: uma horizontal (linha) e uma vertical (coluna).
Exemplos 1.15
A) Série específico-temporal (Tabela 1.7)
B) Série geográfico-temporal (Tabela 1.8)
Tabela 1.7. População economicamente ativa por setor de atividades – Brasil
População (1 000 Hab.)

Setor
1940 1950 1960
Primário 8 968 10 255 12 163
Secundário 1 414 2 347 2 962
Terciário 3 620 4 516 7 525
Fonte: IPEA

Tabela 1.8. População Indígena Brasileira
Unidades da Produção
Federação 1937 1938 1939
Acre 5 007 4 765 4 727
Amazonas 6 858 5 998 5 631
Pará 4 945 4 223 4 500
Mato Grosso 1 327 1 285 1 235
Outros Estados 333 539 337
Fonte: Anuário Estatístico do Brasil – IBGE

– (Dados alterados para melhor compreensão)
Podem existir, se bem que mais raramente, pela dificuldade de representação, séries com-
postas de três ou mais entradas.
Obs.: Nem sempre uma tabela representa uma série estatística. Por vezes, os dados reunidos não
revelam uniformidade, sendo meramente um aglomerado de informações gerais sobre deter-
minado assunto, as quais, embora úteis, não apresentam a consistência necessária para se
configurar uma série estatística.
Exemplo 1.16
Tabela com resumos de dados, mas que não representa uma série estatística.
Tabela 1.9. Situação dos espetáculos cinematográficos no Brasil – 1967
Especificação Dados Numéricos
Número de cinemas 2 488
Lotação dos cinemas 1 722 348
Sessões por dia 3 933
Filmes de longa metragem 131 330 488
Meia-entrada 89 581 234
Fonte: Anuário Estatístico do Brasil – IBGE

1.6. Apresentação de dados – Tabelas e Gráficos: Construção e Interpretação
A representação gráfica das séries estatísticas tem por finalidade apresentar os resultados
obtidos, permitindo que se chegue a conclusões sobre a evolução do fenômeno ou sobre
como se relacionam os valores da série. A escolha do gráfico mais apropriado ficará a crité-
rio do analista. Contudo, os elementos simplicidade, clareza e veracidade devem ser consi-
derados, quando da elaboração de um gráfico.
Simplicidade – o gráfico deve ser destituído de detalhes de importância secundária, assim
como de traços desnecessários que possam levar o observador a uma análise morosa ou
sujeita a erros.
Clareza – o gráfico deve possibilitar uma correta interpretação dos valores representati-
vos do fenômeno em estudo.
Veracidade – o gráfico deve expressar a verdade sobre o fenômeno em estudo.
Diretrizes para a construção de um gráfico:

O título do gráfico deve ser o mais claro e completo possível. Quando necessário, deve-
se acrescentar subtítulos;
A orientação geral dos gráficos deve ser da esquerda para a direita;
As quantidades devem ser representadas por grandezas lineares;
Sempre que possível, a escala vertical há de ser escolhida de modo a aparecer a linha 0
(zero);
Só devem ser incluídas no desenho as coordenadas indispensáveis para guiar o olhar do
leitor ao longo da leitura. Um tracejado muito cerrado dificulta o exame do gráfico;
A escala horizontal deve ser lida da esquerda para a direita, e a vertical de baixo para
cima;
Os títulos e marcações do gráfico devem ser dispostos de maneira que sejam facilmente
lidos, partindo-se da margem horizontal inferior ou da margem esquerda.
Leitura e interpretação de um gráfico:

Declarar qual o fenômeno ou fenômenos representados, a região considerada, o período
de tempo, a fonte dos dados etc;
Examinar o tipo de gráfico escolhido, verificar se é o mais adequado, criticar a sua exe-
cução, no conjunto e nos detalhes;
Analisar cada fenômeno separadamente, fazendo notar os pontos mais em evidência, o
máximo e o mínimo, assim como as mudanças mais bruscas;
Investigar se há uma “tendência geral” crescente ou decrescente ou, então, se o fato ex-
posto é estacionário;

Procurar descobrir a existência de possíveis ciclos periódicos, qual o período aproxima-
do, etc.
Em seguida são apresentados os tipos mais comuns de gráficos:
Gráfico em Linhas
Constitui uma aplicação do processo de representação das funções num sistema de coor-
denadas cartesianas.
Exemplo 1.17: Operadora WKX – Venda de bilhetes aéreos – Mercado Interno – 1995 (Ta-
bela 1.3)
Figura 1.1. Operadora WKX – Venda de bilhetes aéreos – Mercado Interno – 1995
3700
3500
3300
3100
Quantidade
2900
2700
2500
2300
2100
1900
1700
Jan Fev Mar Abr Mai Jun Jul Ago Set Out Nov Dez
Meses
Fonte: Departamento de Análise de Mercado.
Obs.:
O gráfico acima, e os outros aqui mostrados foram construídos utilizando-se o soft-
ware Excel, é possível utilizar outros softwares.
Mas construir gráficos manualmente também é simples basta utilizar uma escala a-
dequada, régua e/ou compasso.
Podemos representar também uma tabela composta. Veja o exemplo.

Exemplo 1.18: População Indígena Brasileira (Tabela 1.8)
Figura 1.2. População Indígena
7000
6000
5000
Quantidade
Acre
4000 Amazonas
Pará
3000 Mato Grosso
Outros Estados
2000
1000
0
1937 1938 1940
Anos
Fonte: Anuário Estatístico do Brasil – IBGE (Dados alterados para melhor compreensão)
Gráfico em Colunas
É a representação de uma série por meio de retângulos, dispostos verticalmente.
Exemplo 1.19: Ver Tabela 1.1 – Quantas horas se trabalha em cada País – 2001
Figura 1.3. Horas trabalhadas em alguns países
50
40
30
Horas
20
10
0
Coréia Japão Brasil Estados Inglaterra França
Unidos
Paises
Fonte: Organização Internacional do Trabalho (OIT).
Obs.: Podemos representar também uma tabela composta.

Exemplo 1.20
Tabela 1.10. Salários iniciais setor privado e público – Brasil 2004
Dados obtidos – Revista Veja – Nº 12 – Ano 37 – Edição 1846
Cargos Privado Público
Consultor/Auditor 900 5300
Advogado 1100 5000
Economista 1200 5000
Bioquímico 1400 1500
Fonte: Nelson Marconi, professor de economia FGV
Figura 1.4. Salários iniciais – Setores privado e público – Brasil – 2004
Privado Público
6000
5000
4000
Salários
3000
2000
1000
0
Consultor/Auditor Advogado Economista Bioquímico
Cargos
Fonte: Nelson Marconi, professor de economia FGV
Gráfico em Barras
É semelhante ao gráfico em colunas, porém, os retângulos são dispostos horizontalmente.
Exemplo 1.21
Tabela 1.11. Taxa de juros real anual – 2004
Países Taxa em %
Brasil 9,2
Turquia 8,5
África do Sul 7,7
Israel 7,0
Filipinas 5,1
Rússia 3,2
Fonte: Revista Veja – Nº 12 – Ano 37 – Edição 1846

Figura 1.5. Taxa de juros real anual – 2004
Brasil
Turquia
Paises
África do Sul
Israel
Filipinas
Rússia
0% 2% 4% 6% 8% 10%
Porcentagem
Fonte: Revista Veja – Nº 12 – Ano 37 – Edição 1846 – 2004
Gráfico em Setores
É a representação gráfica de uma série estatística em círculo, por meio de setores. É utiliza-
do principalmente quando se pretende comparar cada valor da série com o total.
Exemplo 1.22
Tabela 1.12. Alunos matriculados no Município X de 2002–2004
Anos alunos
2002 900
2003 1200
2004 1500
Total 3600
Fonte: Secretária da Educação, Município X.
O total é representado pelo círculo, que fica dividido em tantos setores quantas são as par-
tes. As áreas dos setores são respectivamente proporcionais aos dados da série.

O setor é obtido por meio de uma regra de três simples e direta, ressaltamos que a soma
total da série corresponde a 360º, que é uma circunferência completa.
Total -------------- 360º
Parte ------------- xº
Para 1975: 3600 – 360º Para 1976: 3600 – 360º Para 1977: 3600 – 360º
900 – xº 1200 – xº 1500 – xº
x = 90º x = 120º x = 150º
Figura 1.6. Alunos matriculados no Município X – 2002-2004
2002 2003 2004
Fonte: Secretária da Educação, Município X
Gráfico Polar
É o gráfico ideal para representar séries temporais cíclicas, isto é, séries que apresentam
em seu desenvolvimento determinada periodicidade, como, por exemplo, a variação da pre-
cipitação pluviométrica ao longo do ano, ou da temperatura ao longo do dia, o consumo de
energia elétrica durante o mês ou o ano etc.

Exemplo 1.23
Tabela 1.13. Movimento Mensal de Compras de uma agencia em 2003
Meses Valores (R$1.000,00)
Janeiro 12
Fevereiro 13
Março 14
Abril 12
Maio 15
Junho 19
Julho 17
Agosto 18
Setembro 14
Outubro 16
Novembro 12
Dezembro 18
Fonte: Departamento financeiro da Agência (Dados Fictícios)
Figura 1.7. Movimento Mensal de Compras de

uma agencia em 2003 – Valores (R$ 1.000,00)
Janeiro
20
Dezembro Fevereiro
15
Novembro 10 Março
5
Outubro 0 Abril
Setembro Maio
Agosto Junho
Julho
Fonte: Departamento Financeiro da Agência (Dados Fictícios)

Exercício Resolvido:
Para a Série abaixo calcule os valores percentuais e represente os dados por meio de um
gráfico.
Dados obtidos no site:
http://www.anp.gov.br/doc/dados_estatisticos/Producao_de_Derivados_m3.xls
Tabela 1.14. Produção de gases combustíveis – 2003 (103 m3)
Meses Produção
Janeiro 226.351
Fevereiro 202.052
Março 227.291
Abril 228.004
Maio 241.135
Junho 228.004
Julho 202.179
Agosto 284.395
Setembro 202.328
Outubro 211.278
Novembro 200.953
Dezembro 200.867
Fonte: Ipiranga, Manguinhos e Petrobras.
Solução: Para calcularmos os valores percentuais de cada mês temos que considerar o va-
lor total (100%) como sendo o todo e, aplicando uma regra de 3, chegaremos ao valor per-
centual correspondente. É possível também dividir diretamente o valor da parte (mês consi-
derado) pelo total, e para obtermos a resposta em porcentagem basta multiplicarmos por
100.
Podemos escolher qualquer um dos gráficos que estudamos, para representar os dados e
ou porcentagens, mas como os valores são muito próximos o gráfico em setores e o gráfico
polar não apresentariam uma visão muito clara. Como estamos falando em volume de pro-
dução devemos optar por um gráfico em colunas que já demonstra uma idéia de volume.

Meses Produção %
Janeiro 226.351 8,53
Fevereiro 202.052 7,61
Março 227.291 8,56
Abril 228.004 8,59
Maio 241.135 9,08
Junho 228.004 8,59
Julho 202.179 7,62
Agosto 284.395 10,71
Setembro 202.328 7,62
Outubro 211.278 7,96
Novembro 200.953 7,57
Dezembro 200.867 7,57
Figura 1.8. Produção de gases combustíveis – 2003
12,00
10,00
porcentagem
8,00
6,00
4,00
2,00
0,00
Jan Fev Mar Abr Mai Jun Jul Ago Set Out Nov Dez
Meses
Fonte: Ipiranga, Manguinhos e Petrobras.

Capítulo 2.
Amostragem
Nesta unidade, veremos quais as técnicas que podemos utilizar para compor uma
amostra. São objetivos específicos desta unidade:
Familiarizar o leitor com a terminologia empregada na pesquisa de um fenômeno;
Identificar os fatores que afetam a quantidade de informações de um fenômeno;
Explicar como utilizar as Tabelas de Números Aleatórios (TNA) para selecionar
amostras aleatórias.
2.1. Importância da Amostragem

Na realização de qualquer estudo, na maioria das vezes não é possível examinar todos os
elementos da população de interesse. Por exemplo, para determinarmos a vida média dos
computadores da PUC Minas, como iríamos proceder? Consideremos os seguintes fatores:
o tempo necessário para fazer este levantamento; custo operacional; manipulação de gran-
de quantidade de dados; erros na coleta e manuseio de dados etc. Para resolver esta situa-
ção podemos retirar uma amostra.
Amostra – é um subconjunto da população
Exemplo 2.1
Vamos considerar uma situação mais próxima do cotidiano de todos nós. Na cozinha de
nossa casa a cozinheira para saber se uma panela de arroz esta temperada precisa de co-
mer todo o conteúdo da panela?
É claro que não!!! Ela simplesmente prova (pega uma amostra) uma pequena quantidade e
o que sente nesta pequena quantidade generaliza para todo o conteúdo da panela de arroz.
É um exemplo bem lúdico, mas é com este mesmo principio que vamos trabalhar com a-
mostras.
Usualmente, trabalhamos apenas com uma parte (amostra) da população. A inferência esta-
tística nos fornece elementos para generalizar, de maneira segura, as conclusões obtidas na
amostra para a população. Para as inferências serem corretas, é necessário garantir que a
amostra seja representativa da população, isto é, a amostra deve possuir as mesmas carac-
terísticas básicas da população, no que diz respeito ao fenômeno pesquisado.

É errôneo pensar que, caso tivéssemos acesso a todos os elementos da população, sería-
mos mais precisos. Os erros de coleta e manuseio de um grande número de dados são
maiores do que as imprecisões a que estamos sujeitos quando generalizamos, via inferên-
cia, as conclusões de uma amostra bem selecionada.
Em se tratando de amostra, a preocupação central é que ela seja representativa. É preciso
que a amostra ou as amostras que serão usadas sejam obtidas por processos adequados.
Para poder obter informações, através de um levantamento amostral, temos que levar em
consideração dois problemas:
Definir cuidadosamente a população de interesse;
Selecionar a característica que iremos pesquisar.
Dados coletados de forma descuidada podem ser tão inúteis que nenhum processamento
estatístico consegue aproveitá-los.
2.2. Alguns conceitos e definições

O conceito de população é intuitivo; trata-se do conjunto de indivíduos ou objetos que apre-
sentam em comum determinadas características definidas para o estudo.
Amostra – é um subconjunto da população.
Amostragem – são procedimentos para extração de amostras que representem bem a
população.
Riscos – é a margem de erro motivado pelo fato de investigarmos parcialmente (amos-
tras) o universo (população).
População-alvo – é a população sobre a qual vamos fazer inferências baseadas na a-
mostra.
Para que possamos fazer inferências válidas sobre a população a partir de uma amostra, é
preciso que essa seja representativa. Uma das formas de se conseguir representatividade é
fazer com que o processo de escolha da amostra seja, de alguma forma, aleatório. Além
disso, a aleatoriedade permite o cálculo de estimativas dos erros envolvidos no processo de
inferência.
Quanto à extração dos elementos, as amostras podem ser:

Com reposição – quando um elemento sorteado puder ser sorteado novamente;
Sem reposição – quando o elemento sorteado só puder figurar uma única vez na amostra.

Exemplo 2.2
Amostragem com reposição:
Seleção de pessoas para participar de um sorteio;
Seleção de itens para testes não destrutíveis;
Amostragem sem reposição: (maioria dos casos pesquisados e/ou estudados)
Seleção de itens para teste destrutíveis como: vida útil de lâmpadas, fusíveis, etc.
Pesquisa de opinião pública em uma mesma rodada;
Basicamente, existem dois métodos para composição da amostra: probabilístico e não pro-
babilístico (intencional).
O método de amostragem probabilística exige que cada elemento da população possua
determinada probabilidade de ser selecionado. Normalmente, possuem a mesma proba-
bilidade. Assim, se N for o tamanho da população, a probabilidade de cada elemento será
1/N. Somente com base em amostragens probabilísticas é possível realizar inferências
sobre a população, a partir dos parâmetros estudados na amostra. As principais técnicas
probabilísticas são:
- Amostragem Aleatória Simples;
- Amostragem Aleatória Estratificada;
- Amostragem Sistemática;
- Amostragem por Conglomerado.
Por serem as principais técnicas estudas, serão detalhadamente exploradas no item 2.3.
Os métodos não probabilísticos são amostragens em que há uma escolha deliberada dos
elementos que compõem a amostra. Não é possível generalizar os resultados das pes-
quisas para a população, uma vez que as amostras não probabilísticas não garantem a
representatividade da população. São elas:
- Amostragem Acidental;
- Amostragem Intencional;
- Amostragem por Quotas.
Amostragem Acidental – É formada por elementos que vão aparecendo, que são possí-
veis de se obter até completar o número de elementos da amostra.
Exemplo 2.3: Pesquisa de opinião, em que os entrevistados são acidentalmente escolhi-
dos.
Amostragem Intencional – É formada por elementos escolhidos por determinado critério,

ou seja, escolhe-se intencionalmente um grupo de elementos que irão compor a amos-
tra.
Exemplo 2.4: O pesquisador procura apenas oficinas, para um estudo sobre automóveis,
Amostragem por Cotas – Classificação da população em termos de propriedades que se

sabe serem relevantes para a característica a ser estudada. Determinação da proporção
da população para cada característica com base na constituição conhecida, ou estimada,
da população.
Exemplo 2.5: Suponhamos que tivéssemos de extrair uma amostra dos estudantes de
uma universidade, sendo que 47% são mulheres e 53% são homens. Utilizando esse
método, atribui-se aos pesquisadores uma cota de estudantes de forma que 47% da
amostra sejam de mulheres e 53% sejam homens.
2.3. Amostragem Aleatória Simples

A amostragem aleatória simples é um processo para selecionar amostras de tamanho “n”
dentre as “N” unidades em que foi dividida a população. Sendo a amostragem realizada sem
reposição, que é o caso mais comum, existem (N, n) possíveis amostras, todas igualmente
prováveis.
As amostras aleatórias podem ser escolhidas por diversos métodos. Os mais utilizados são:
tabelas de números aleatórios (TNA) e softwares para gerar números aleatórios. Na prática,
a amostra aleatória simples é escolhida unidade por unidade. As unidades da população são
numeradas de 1 a N. Em seguida, escolhe-se, na tabela de números aleatórios (TNA), (ou
por computador) n números compreendidos entre 1 e N. Esse processo é equivalente a um
sorteio no qual se colocam todos os números misturados dentro de uma urna. As unidades
correspondentes aos números escolhidos formarão a amostra.

Atenção: Neste momento, não estamos preocupados em saber como calcular n (nº de itens
que farão parte da amostra). O valor de n é dado nos exercícios e avaliações. Para o cálculo
do tamanho da amostra (n), precisamos de medidas estatísticas mais complexas que não
são abordadas agora.
Obs.:
1. Um exemplo de TNA encontra-se no final da unidade 2.
2. A TNA (Tabela de Números Aleatórios) – consiste em tabelas que apresentam seqüências
dos dígitos de 0 a 9 distribuídos aleatoriamente nas linhas (horizontais) e colunas (verticais).
Para obtermos os elementos da amostra usando a TNA, sorteamos uma linha e uma coluna
qualquer para começarmos a leitura. Por exemplo: escolho 3ª linha 15ª coluna o digito en-
contrado é 5. A leitura da tabela pode ser feita horizontalmente (da direita para a esquerda
ou vice-versa), verticalmente (de cima para baixo ou vice-versa), diagonalmente (no sentido
ascendente ou descendente). A opção, porém, deve ser feita antes de ser iniciado o proces-
so.
OBS: Como a leitura na TNA é Livre (podemos fazer a leitura em todos os sentidos), vamos adotar
em nossos exercícios, avaliações e trabalhos, a leitura da TNA na vertical, de cima para baixo, con-
siderando sempre as colunas da esquerda para a direita.
Exemplo 2.6: Utilização da TNA – Como encontrar as amostras.

Considere a situação abaixo: – Utilize a TNA que esta no final da unidade 2.
Procure os 10 primeiros números na TNA começando a leitura na 9ª linha e na 5ª coluna

(lembre-se que cada dígito representa uma coluna). (Resposta: 1, 0, 0, 1, 8, 4, 7, 0, 1, 3)
Agora considere a situação:
Para Populações com 10 ou mais itens:

Para populações com 10 ou mais itens têm que ler na TNA o número de colunas igual ao
número de dígitos da População. Exemplo: para retirarmos 5 amostras de uma população
com 300 itens, temos que ler três colunas para conseguirmos valores entre 001 e 300. Se o
número sorteado superar o número de elementos, abandona-se o número sorteado, prosse-
guindo-se o processo.
Por exemplo, se considerarmos a 9ª linha e 5ª coluna temos como resposta: 124, 056, 094,
143, 014.
Atenção: Foi escolhido ao acaso a 9ª linha e 5ª coluna. Para você realizar qualquer ativida-
de você também pode estar escolhendo ao acaso uma linha e uma coluna pra entrar na
TNA. Mas para resolver os exercícios, avaliações e atividades estes dados serão fornecidos
para facilitar a correção.

Exemplo 2.7
Vamos obter uma amostra representativa de 8 itens para a pesquisa da estatura de noventa
alunos de uma escola. Utilize a TNA (3ª linha e 8ª Coluna).
Resolução:
Enumeramos os alunos de 01 a 90;
Iniciamos o processo de sorteio dos itens da amostra na TNA considerando as colunas 8ª
e 9ª, pois 90 são dois dígitos;
A amostra será composta pelos alunos correspondentes aos números: 46, 28, 16, 51, 88,
09, 89, 14.
É preferível a utilização de outras técnicas de amostragem que a aleatória simples, pois es-
sas levam em consideração a composição da população, facilitando o trabalho de seleção
de amostras e aumentando a precisão.
2.4. Amostragem Aleatória Estratificada

Uma amostra estratificada é obtida separando-se as unidades da população em grupos não
superpostos, chamados estratos, e selecionando-se independentemente uma amostra alea-
tória simples de cada estrato. Existem dois tipos de amostragem estratificada:
De igual tamanho;
Proporcional.
No primeiro tipo, sorteia-se igual número de elementos em cada estrato. Esse processo é
utilizado quando o número de elementos por estrato for aproximadamente o mesmo.
No outro caso, utiliza-se a amostragem estratificada proporcional, cujo processo de calcular
o número de amostras por estrato é:
N → Nº de unidades total da população
n → Nº de unidades total de amostras Na na n
= → na = .Na
Na → Nº de unidades que compõem um determinado estrato (A) N n N
na → Nº itens que serão amostrados do estrato (A)
Atenção: Quando utilizamos a técnica de amostragem estratificada estamos considerando

uma população que esta subdividida em partes que para nós são os estratos. Podemos ter
populações subdivididas em quantos estratos forem precisos. Acima, eu considerei (A) com
sendo um estrato, mas podemos ter uma população dividida em 5 estratos (estratos A, B, C,
D e E). Temos que calcular a quantidade de amostras para cada estrato separadamente.

Exemplo 2.8
Supondo, no exemplo anterior, que, dos noventa alunos, 54 sejam meninos e 36 sejam me-
ninas, vamos obter uma amostra proporcional estratificada de 10%.
Resolução:
São, portanto, dois estratos (um estrato alunos do sexo masculino e outro estrato alunos
sexo feminino) e queremos uma amostra de 10% da população;
Calcula-se o número de amostras de cada estrato.
Sexo População 10% Número de amostras
M 54 5,4 5
F 36 3,6 4
Total 90 9,0 9
Para estarmos selecionando quem serão os 9 (nove) alunos vamos enumerar (os alunos)
de 01 a 90, sendo que de 01 a 54 correspondem ao estrato Masculino e de 55 a 90, ao
estrato feminino. O próximo passo é o mesmo do exemplo anterior.
2.5. Amostragem por Conglomerado

Uma amostra por conglomerado é uma amostra aleatória simples na qual cada unidade de
amostragem é um grupo ou um conglomerado de elementos.
O primeiro passo na amostragem por conglomerado é especificar conglomerados apropria-

dos. Os elementos em um conglomerado tendem a ter características similares, portanto, o
fato de novas avaliações serem tomadas num conglomerado não implica necessariamente
aumento de informação sobre o parâmetro populacional. Como regra geral, o número de
elementos num conglomerado deverá ser pequeno em relação ao tamanho da popula-
ção e o número de conglomerados deverá ser razoavelmente grande.
Na amostragem por conglomerado a população é dividida em grupos. E selecionam-se a-

mostras aleatórias simples de grupos e, então, todos os itens dos grupos (conglomerados)
selecionados farão parte da amostra.
Exemplo 2.9
Vamos considerar a seguinte situação: Em um levantamento da população de uma cidade,
podemos dispor do mapa indicando cada quarteirão e não dispor de uma relação atualizada
dos seus moradores.

Se quisermos saber a população da cidade acima podemos, utilizar a Técnica de Amostra-
gem por Conglomerado.
Vamos considerar cada quarteirão um conglomerado, e selecionar pela TNA (ou software)
os quarteirões. E realizamos a contagem completa de todos os que residem naqueles quar-
teirões sorteados.
Atenção: Para sabermos a população total teremos que fazer Inferência, este tema será
estudado na unidade 8. Neste momento estamos apenas estudando as técnicas para retirar
amostras.
2.6. Amostragem Sistemática

Quando os elementos da população já se encontram ordenados, não há necessidade de se
construir o sistema de referência. Nesses casos, a seleção dos elementos que constituirão a
amostra pode ser por um sistema imposto pelo pesquisador.
Em geral, para se obter uma amostra sistemática de n elementos de uma população de ta-
manho N, K deve ser menor ou igual a N/n. Não é possível determinar K, precisamente,
quando o tamanho da população é desconhecido, mas pode-se supor um valor de k de tal
modo que seja possível obter uma amostra de tamanho n. No lugar da amostragem aleató-
ria simples, pode-se empregar a amostragem sistemática pelas seguintes razões:
a amostragem sistemática é mais fácil de se executar e, por isso, está menos sujeita a
apresentar erros cometidos pelo entrevistador;.
a amostragem sistemática freqüentemente proporciona mais informações por custo unitá-
rio.
Diretrizes para calcular as amostras:

N
1º – Estabelecer o intervalo de amostragem K: K =
n
Obs.: Para valores de K=N/n, arredondar para o valor inteiro inferior.
2º – Iniciar aleatoriamente a composição da amostra.
b → inicio (nº de ordem inicial sorteado na TNA).

Obs.: 0<b≤ K

3º – Composição da Amostra:
1º item → b
2º item → b + K
3º item → b + 2k
4º item → b + 3k
5º item → b + 4k e assim sucessivamente até o final, ou seja, até conseguir o total de
elementos da amostra.
Exemplo 2.10
Suponhamos uma rua contendo quinhentos prédios, dos quais desejamos obter uma amos-
tra formada de vinte prédios. (Vamos considerar para a leitura da TNA, 9ªLinha e 5ª Coluna.)
Lembre-se que a escolha da linha e coluna é ao acaso, estou simplesmente dando uma
referência para podermos chegar ao mesmo resultado.
Solução: Do enunciado temos: N = 500 (população); n=20 (amostra)
a) Calcular K (intervalo de amostragem)
b) K=500/20, K=25
c) b= 12 (valor encontrado na TNA)
d) Composição da amostra
1º item → 12 3º item → 12 + 2*25 = 62
2º item → 12 + 25 = 37 20º item → 12 +19*25 = 487
Obs.: Não é preciso fazer nos exercícios todos os itens, o objetivo é o aluno saber utilizar a técnica.

Tabela de Números Aleatórios
COLUNA 1 5 9 13 17 21 25 29 33 37 41 45 49
LINHA
01 9486 9821 6074 1432 0995 0157 0071 9871 6678 0140 9522 0995 1735
02 3155 9878 3359 8244 8952 0084 1558 4775 1699 1652 2555 4765 2709
03 6136 2824 6030 4256 3870 5725 2204 5318 8337 3867 6184 2018 3522
04 7249 9182 8669 7423 1768 8147 7285 8390 9134 9863 9486 9821 6074
05 0071 9871 6678 0140 9522 0995 1735 1248 9807 1910 3155 9878 3359
06 1558 4775 1699 1652 2555 4765 2709 0561 4397 1135 6136 2824 6030
07 2204 5318 8337 3867 6184 2018 3522 0941 5569 5800 7249 9182 8669
08 7285 8390 9134 9863 9486 9821 6074 1432 0995 0157 0071 9871 6678
09 1735 1248 9807 1910 3155 9878 3359 8244 8952 0084 1558 4775 1699
10 2709 0561 4397 1135 6136 2824 6030 4256 3870 5725 2204 5318 8337
11 3522 0941 5569 5800 7249 9182 8669 7423 1768 8147 7285 8390 9134
12 6074 1432 0995 0157 0071 9871 6678 0140 9522 0995 1735 1248 9807
13 3359 8244 8952 0084 1558 4775 1699 1652 2555 4765 2709 0561 4397
14 6030 4256 3870 5725 2204 2318 8337 3867 6184 2018 3522 0941 5569
15 8669 7423 1768 8147 7285 8390 9134 9863 9486 9821 6074 1432 0995
16 6678 0140 9522 0995 1735 1248 9807 1910 3155 9878 3359 8244 8952
17 1699 1652 2555 4765 2709 0561 4397 1135 6136 2824 6030 4256 3870
18 8337 3867 6184 2018 3522 0941 5569 5800 7249 9182 8669 7423 1768
19 9134 9863 9486 9821 6074 1432 0995 0157 0071 9871 6678 0140 9522
20 9807 1910 3155 9878 3359 8244 8952 0084 1558 4775 1699 1652 2555
21 4397 1135 6136 2824 6030 4256 3870 5725 2204 5318 8337 3867 6184
22 5569 5800 7249 9182 8669 7423 1768 8147 7285 8390 9134 9863 8486
23 0995 0157 0071 9871 6678 0140 9522 0995 1735 1248 9807 1910 3155
24 8952 0084 1558 4775 1699 1652 2555 4765 2709 0568 4397 1135 6136
25 3870 5725 2204 5318 8337 3867 6184 2018 3522 0941 5569 5800 7249
26 7425 3566 6151 4731 6489 2491 2765 8525 7849 1488 8833 2597 1333
27 8961 8175 0879 6945 8029 9119 5990 1063 9444 8320 1740 6131 9907
28 3298 6173 1741 3874 9321 3748 7507 0170 0568 9112 1275 0924 3054
29 2276 4898 2394 1098 4063 5393 0226 8144 4778 7471 1764 4939 8063
30 9557 8114 1576 9767 1486 7161 5606 6295 3503 5050 9549 2500 9666
31 8650 1920 2533 7755 5324 3731 3414 2153 3815 0626 5718 8679 6801
32 2885 8101 1467 0080 7962 5999 9562 5819 1562 6793 2065 0239 8253
33 1841 8626 0344 4344 7446 0867 6157 8935 4413 2363 7187 8980 2488
34 4638 8030 0018 7760 9819 4276 0650 3516 5159 9236 3257 1694 7157
35 1320 7033 1218 5605 4206 2878 0230 1740 4553 8729 5827 7176 8703
36 1488 5803 6790 9368 0465 4819 0065 7633 3950 2109 7027 5824 5057
37 4353 4347 8565 2231 8789 4231 2585 0157 2037 7835 1320 8999 9181
38 7816 5817 9764 8789 7387 2172 0896 1038 6047 9539 3510 1343 8098
39 8600 9738 5415 8426 7152 8705 5829 0164 8330 9152 6045 8129 2293
40 1057 1550 8773 3003 4302 4034 2478 1078 0429 7189 0778 3260 5969

Capítulo 3.
Distribuição de Freqüência
Vamos considerar, nesta unidade, o estudo detalhado da distribuição de freqüência,

que é a forma pela qual podemos descrever os dados estatísticos resultantes de va-
riáveis quantitativas.
Freqüência é o número de repetições de elementos que estão sendo estudados. Mui-

tas vezes temos que agrupar estes elementos para facilitar o estudo. Este agrupa-
mento é dividido em partes que chamamos de classes, podemos ter classes com in-
tervalos ou sem intervalos (quando um único valor é a classe).
São objetivos desta unidade:
Compor uma distribuição de freqüência com ou sem intervalos de classe;
Determinar o quadro de freqüências, eles são úteis para condensar grandes con-
juntos de dados, facilitando a sua utilização;
Representar uma distribuição de freqüência através de gráficos como histograma,
polígono e ogiva.
3.1. Introdução e Definições

Ao analisarmos um conjunto de dados, devemos determinar se temos uma amostra ou uma
população. Essa determinação afetará não somente os métodos utilizados, mas também as
conclusões, pois se estamos trabalhando com uma amostra, os resultados encontrados são
estimativas para população.
Nem sempre é possível compreender o significado contido numa amostragem por simples
inspeção visual dos dados numéricos coletados. Entretanto, entendemos que o sucesso de
uma decisão dependerá da nossa habilidade em compreender as informações contidas nes-
ses dados. O objetivo desse estudo é mostrar a organização, apresentação e análise gráfica
de uma série de dados, matéria prima das distribuições de freqüências e dos histogramas
(gráficos representativos de uma distribuição de freqüência).
Podemos definir freqüência como o número de vezes que um determinado fenômeno acon-
tece, isto é, quantas vezes ele se repete.
 Dados Brutos
Quanto a organização 
  Rol
Os dados podem ser classificados: 
Quanto a natureza  Dados Discretos
 Dados Continuos

Dados brutos – são os dados originais. São os dados que ainda não foram tratados para
serem utilizados. Não podem ser analisados, por não estarem numericamente organizados.
(Também são conhecidos como Tabela Primitiva).
Exemplo 3.1
Tabela 3.1. Número mensal de aparelhos defeituosos na Empresa X.
J F M A M J J A S O N D
1995 6 2 5 1 0 3 2 1 3 5 5 3
1996 5 4 2 1 3 4 1 4 5 4 0 1
1997 3 1 2 4 3 1 4 1 0 3 0 2
1998 2 2 0 3 1 4 2 0 1 1 5 2
Rol – são os dados brutos, organizados em ordem crescente ou decrescente.
Exemplo 3.2: Considerando o exemplo anterior (Tabela 3.1) temos:
0 0 0 0 0 0 1 1 1 1 1 1
1 1 1 1 1 2 2 2 2 2 2 2
2 2 3 3 3 3 3 3 3 3 4 4
4 4 4 4 4 5 5 5 5 5 5 6
Dados discretos – a variável é discreta quando assume valores em pontos da reta real. (Os
dados são discretos quando temos um conjunto enumerável de itens).
Exemplo 3.3
• Número de erros em um livro: 0,1,2,3,4,....
• Número de filhos de vários casais: 1,2,3,4,.....
• Quantidade de acidentes em determinada rodovia: 4,10,12,15,....
Dados contínuos – a variável pode assumir, teoricamente, qualquer valor em certo interva-
lo da reta real. (Os dados são contínuos quando temos um conjunto mensurável de itens)

Exemplo 3.4
• peso de alunos: 55,5 kg; 61,0 kg; 63,4 kg; 68,1 kg.......
• distância entre cidades: 35,5 km; 48,6 km; 100,10 km;....
Vejamos alguns exemplos de agrupamentos:
Dados agrupados sem intervalo de classes: os valores da variável aparecem individual-

mente.
Exemplo 3.5
Considerando os dados da tabela anterior (Tabela 3.1):
Nº de aparelhos Nº de meses
com defeitos
0 06
1 11
2 09
3 08
4 08
5 05
6 01
Total 48
Dados agrupados com intervalo de classes: os valores da variável não aparecem indivi-
dualmente, mas agrupados em intervalo nas classes.
Exemplo 3.6
Tabela 3.2. Notas de 580 alunos de uma Universidade.
Notas Nº de alunos
0 |--- 20 020
20 |--- 40 065
40 |--- 60 230
60 |--- 80 160
80 |--- 100 025
Total 580

3.2. Elementos de uma distribuição de freqüência: Amplitude total, Limites de
classe, Amplitude do intervalo de classe, Ponto médio da classe,
Freqüência absoluta (simples e acumulada), Freqüência relativa
(simples e acumulada)
3.2.1. Amplitude total (A) – é a diferença entre o maior e o menor valor do rol.
A = Xmax – X mim
Exemplo 3.7:
Vamos considerar a estatura, em cm, de 40 alunos do Colégio A. (Dados ordenados em
ordem crescente, por colunas)
Tabela 3.3. Altura (em cm) de 40 alunos do Colégio A
150 154 155 157 160 161 162 164 166 169
151 155 156 158 160 161 162 164 167 170
152 155 156 158 160 161 163 164 168 172
153 155 156 160 160 161 163 165 168 173
A amplitude deste dados é: A = Xmax– Xmim

A = 173 – 150 = 23
3.2.2. Número de classes (K) e Classe (i)

Não existe regra fixa para se determinar o número de classes. Podemos utilizar:
A Regra de Sturges, que nos dá o número de classes em função do número de valores

da variável: K = 1+ 3,3. log n , onde n é o número de itens que compõe a amostra;
Ou K = 5 para n ≤ 25 e k ≅ n , para n > 25.
Exemplo 3.8
Considerando o exemplo anterior (tabela 3.3) temos: n=40
Pela formula de Sturges: K= 1+3,3log40 = 6,28 → K=6
Adotando K = n , temos k = 40 =6,3 → K=6
Classe i = 1, 2, 3, 4, 5 e 6
Obs.: A quantidade de classes é um processo de escolha, podemos utilizar qualquer uma das fórmu-
las acima a mais utilizada é: K≅ n

3.2.3. Amplitude de um intervalo de classe (h)
Amplitude de um intervalo de classe ou simplesmente intervalo de classe é a medida do
intervalo que define a classe.
h=A/K
Exemplo 3.9
Considerando o exemplo anterior (Tabela 3.3):
h = 23/ 6 = 3,83 → h = 4
Atenção: h é sempre um número inteiro. E mais prático fazer arredondamento para o núme-
ro inteiro maior. Em muitos casos quando fazemos o arredondamento para o menor inteiro
pode acontecer de faltar classe para os últimos itens.
3.2.4. Limites de Classe
Denominamos limites de classe os extremos de cada classe. Assim temos:

Limite inferior que é representado por: (linf)
Limite superior que é representado por: (Lsup)
Obs.: Vamos trabalhar com intervalos fechados à esquerda (limite inferior (linf)) e abertos à direita
(limite superior (Lsup)); isso significa que valores iguais ou superiores ao limite inferior são con-
siderados nessa classe e valores iguais e/ou superiores ao limite superior são considerados na
classe seguinte.
Exemplo 3.10
Como montar um quadro de distribuição de Freqüência
Do exemplo anterior (Tabela 3.3), temos:
A= 23, K= 6, h=4, e Xmin=150
Para determinarmos o limite inferior da 1ª classe consideramos o valor de Xmin.
Portanto o quadro fica assim composto:
Na 1ª classe: l1 = 150 e L1 = 150 + h = 150 + 4 = 154.
Na 2ª classe: l2 = 154 e L2 = 154+h = 154+4 = 158.
Na 3ª classe: l3 = 158 e L3 = 158 + h =158 + 4 = 162
e assim sucessivamente até a 6ª classe (porque K= 6)

Tabela 3.4. Quadro de distribuição de freqüências
Frequência absoluta simples
i Classes ni
1 150 | 154 4
2 154 | 158 9
3 158 | 162 11
4 162 | 166 8
5 166 | 170 5
6 170 | 174 3
Σ 40
Limites superiores
Número de classes Limites inferiores
Considerando a segunda classe, temos:

L2 =158 (Limite superior da segunda classe)
l2 = 154 (Limite inferior da segunda classe)
n2 = 09 (freqüência absoluta simples da segunda classe).
3.2.5. Ponto Médio da Classe – (xi)
O ponto médio da classe, que é representado por (xi) é como o próprio nome indica, o ponto
que divide o intervalo de classe em duas partes iguais. Para obtermos o ponto médio de
uma classe, calculamos:
linf + Lsup
xi =
2
Exemplo 3.11
Considerando a segunda classe do exemplo anterior, temos:
154 + 158
x2 = = 156 → x 2 = 156
2

3.2.6. Freqüências
Vamos trabalhar com Freqüências absolutas (simples e acumulada) e Freqüências relativas
(simples e acumulada)
  Simples (n i )
Absoluta 
 Acumulada (N i )
Frequência 
 Relativa  Simples ( f i )
 Acumulada (Fi )
Freqüências absoluta simples da classe i (ni) – são os valores que realmente represen-
tam o número de dados de cada classe. A soma das freqüências simples é igual ao número
total dos dados.
Exemplo 3.12: Considerando a terceira classe do exemplo anterior, temos: n3 = 11
Freqüências relativas simples (fi) – são os valores das razões entre as freqüências sim-
ples e o número total de dados.
ni
fi =
n
Exemplo 3.13:
Considerando a segunda classe do exemplo anterior, temos: f2 = 9/40=0,225.
Obs.: as freqüências relativas permitem a análise ou facilitam as comparações.
Freqüência absoluta acumulada (Ni) – é o total das freqüências de todos os valores inferi-
ores ao limite superior do intervalo de uma dada classe:
Exemplo 3.14:
Considerando a freqüência acumulada da quarta classe (N4), temos:

N4= n1+n2+n3+n4= 4+9+11+8 = 32
Freqüência relativa acumulada (Fi) – é a freqüência acumulada da classe, dividida pela

freqüência total da distribuição.
Ni
Fi =
n
Exemplo 3.15: Para o exemplo anterior, F4 = 0,8.

NOTA – Usualmente, denominamos:
Freqüência relativa acumulada crescente da classe i – Fi.
Obs.: Fi pode ser entendido como sendo a percentagem de observações abaixo do limite superi-
or da classe i.
Freqüência relativa acumulada decrescente da classe i – F’i.
Obs.: F’i e a porcentagem de observações acima do limite inferior da classe i.
3.3. Regras Gerais para a elaboração de uma distribuição de freqüência

Os principais estágios na construção de uma distribuição de freqüência para dados amos-
trais ou populacionais são:
a) Encontrar a amplitude total do conjunto de valores observados;
b) Escolher o número de classes;
K = 1 + 3,3 log n ou k = n
c) Determinar a amplitude do intervalo de classe;

d) Determinar os limites de classe;
A
h=
k
e) Construir a tabela de freqüências.
Exemplo 3.16
Vamos considerar a estatura de 50 estudantes do sexo masculino da Universidade XYZ.
Como podemos agrupar estes dados? Vamos considerar o que acabamos estudar. Vamos
calcular as freqüências e o ponto médio das classes.
Tabela 3.5. Alturas de 50 estudantes do sexo masculino da Universidade XYZ
33 35 35 39 41 41 42 45 47 48
50 52 53 54 55 55 57 59 60 60
61 64 65 65 65 66 66 66 67 68
69 71 73 73 74 74 76 77 77 78
80 81 84 85 85 88 89 91 94 97

Solução:
Os dados já estão ordenados, o que já facilita os cálculos!
Amplitude: A = 97-33 = 64
Número de Classes: K = 50 ≅ 7
Intervalo de classe: h =64/7 »10
Tabela 3.6. Quadro de distribuição de Freqüência e Ponto médio
i Classes ni Ni fi Fi xi
1 30 | 40 4 4 0,08 0,08 35
2 40 | 50 6 10 0,12 0,20 45
3 50 | 60 8 18 0,16 0,36 55
4 60 | 70 13 31 0,26 0,62 65
5 70 | 80 9 40 0,18 0,80 75
6 80 | 90 7 47 0,14 0,94 85
7 90 |100 3 50 0,06 1,0 95
Σ 50 1
Obs.: Não temos somatório de freqüência absoluta acumulada, pois a freqüência acumulada da
última classe já é o total de itens e também não temos freqüência relativa acumulada pelo
mesmo motivo. Também não temos o somatório dos pontos médios.
3.4. Gráficos representativos de uma distribuição de freqüência:

histograma, polígono de freqüência e ogiva
Uma distribuição de freqüência pode ser representativa graficamente pelo histograma, pelo
polígono de freqüência e pelo polígono de freqüência acumulada (Ogiva de Galton).
Histograma – é formado por um conjunto de retângulos justapostos, cujas bases se locali-

zam sobre o eixo horizontal, de tal modo que seus pontos médios coincidem com os pontos
médios dos intervalos de classe.
As larguras dos retângulos são iguais às amplitudes dos intervalos de classe.
As alturas dos retângulos devem ser proporcionais às freqüências das classes, sendo a
largura igual a amplitude dos intervalos.

Exemplo 3.17 – Histograma.
Considerando os dados da Tabela 3.6
Histograma
ni
12
30 40 50 60 70 80 90 100 Classes
Polígono de freqüência – é um gráfico em linha, sendo as freqüências marcadas sobre

perpendiculares ao eixo horizontal, e levantadas pelos pontos médios dos intervalos de
classe.
Para realmente obtermos um polígono (linha fechada), devemos completar a figura, ligando
os extremos da linha obtida aos pontos médios da classe anterior à primeira e da posterior à
última, da distribuição de freqüência.
Exemplo de um polígono de freqüência

Polígono de Freqüência
ni
12
35 45 55 65 75 85 95 Ponto médio

Polígono de freqüência acumulada – é traçado marcando-se as freqüências acumuladas
sobre perpendiculares ao eixo horizontal, levantadas nos pontos correspondentes aos limi-
tes superiores dos intervalos de classe.
Exemplo de um polígono de freqüência acumulada

Polígono de Freqüência Acumulada
50
47
40
31
18
10
30 40 50 60 70 80 90 100 classes
Obs.: Uma distribuição de freqüência sem intervalos de classe é representada graficamente por um
diagrama onde cada valor da variável é representado por um segmento de reta vertical e de
comprimento proporcional à respectiva freqüência.
ni
12
1 2 3 4 5 6 xi

Capítulo 4.
Medidas de Posição
Nesta unidade, veremos as tendências características de cada distribuição, desta-

cando as medidas de posição central, que recebem tal denominação pelo fato dos
dados observados tenderem, de maneira geral, a se agrupar em torno dos valores
centrais. São objetivos desta unidade:
Calcular as medidas de posição central;
Diferenciar as medidas – moda, média e mediana;
Utilizar as separatrizes para melhor interpretar os resultados.
4.1. Introdução
Nas seções anteriores, vimos a sintetização dos dados sob a forma de tabelas, gráficos e
distribuições de freqüências. Agora, vamos destacar o cálculo das medidas que possibilitam
localizar a maior concentração de valores de uma dada distribuição, isto é, se essa concen-
tração se localiza no início, no meio ou no final de uma distribuição ou, ainda, se há uma
distribuição uniforme. Tais medidas possibilitam comparações de séries de dados entre si
pelo confronto desses números.
Para ressaltar as tendências de cada distribuição, isoladamente, ou em confronto com ou-
tras, necessitamos introduzir os elementos típicos da distribuição, que são:
Medidas de posição;
Medidas de variabilidade ou dispersão;
Medidas de assimetria;
Medidas de curtose.
As medidas de posição mais importantes são as medidas de tendência central, que desta-
camos a seguir:
A média aritmética;
A mediana;
A moda.

As outras medidas de posição são as separatrizes, que englobam:
A mediana;
Os quartis;
Os decis;
Os percentis.
Primeiramente, vamos estudar as principais medidas de tendência central. No segundo
momento veremos as separatrizes e, na próxima unidade, as medidas de Dispersão, Assi-
metria e Curtose.
4.2. Média aritmética simples X ( )

A média é o quociente da divisão da soma dos valores da variável pelo número deles. A
média (aritmética) é, de modo geral, a mais importante de todas as medidas descritivas.
Como calcular a Média
Dados não agrupados
∑x i Xi: valor observado

x= i =1 n: número total de observações
n
Exemplo 4.1
Suponha que o tempo de vida útil de 10 aparelhos de telefone são:
10 29 26 28 15 23 17 25 0 20.
Qual a vida útil média destes aparelhos?
Solução:
Como os dados não estão agrupados utilizamos:
10
∑x
i =1
i = 10 + 29 + 26 + 28 + 15 + 23 + 17 + 25 + 0 + 20 = 193
10
∑x i
193
x= i =1
= = 19,3 (portanto a média de vida útil dos aparelhos é de 19,3 anos)
n 10

Dados Agrupados
Sem intervalo de Classe
∑x ×n i i
Xi: valor encontrado na classe
ni: n° de observações por classe – freqüência simples
x = i =1
n: nº total de observações
n
Exemplo 4.2
Nos valores abaixo, qual o valor médio?
Classes 0 1 2 3 4 5 6 Σ
ni 06 11 09 08 08 05 01 48
Solução:
Para o cálculo da média precisamos calcular o produto de x1 por ni.
Classes 0 1 2 3 4 5 6 Σ
ni 06 11 09 08 08 05 01 48
xi . ni 0 11 18 24 32 25 6 116
Utilizando a fórmula
n
∑x ×n i i 116
x = i =1 X= = 2,42 → X = 2,42
n 48
Com intervalo de Classe
∑x ×n i i x i : ponto médio da classe

X= i =1
ni: n° de observações por classe – freqüência simples
n
Exemplo 4.3
Nos valores abaixo, qual o valor médio?
Classes 0|--- 1 1|--- 2 2|--- 3 3|--- 4 4|--- 5 Σ
ni 3 10 17 8 5 43

Solução:
Para o cálculo da média precisamos calcular o produto do ponto médio as classe (xi) por ni.
Classes 0|--- 1 1|--- 2 2|--- 3 3|--- 4 4|--- 5 Σ
ni 3 10 17 8 5 43
xi 0,5 1,5 2,5 3,5 4,5 -
xi . ni 1,5 15 42,5 28 22,5 109,5
Utilizando a Fórmula:
n
∑x ×n i i
X= i =1
n
109,5
X = = 2,55 → X = 2,55
43
Às vezes, a média pode ser um número diferente de todos os da série de dados que ela
representa. Veja o Exemplo 4.1.
4.3. Moda (Mo)

É o valor que ocorre com maior freqüência em um conjunto de dados, e que é denominado
valor modal. Com base nesse contexto, um conjunto de dados pode apresentar mais de
uma moda, e nesse caso, dizemos que são multimodais; caso contrário, quando não existe
um valor predominante, dizemos que é amodal.
Para Calcular a Moda temos que verificar se estamos trabalhando com:

 Dados não agrupados

Dados agrupados  Sem intervalo
 
 Com intervalo de Classe
O valor modal é o valor predominante na distribuição.

Exemplo 4.4: Nos valores abaixo, qual o valor modal?
3 4 4 5 6 7 8 9 9 9 10 11 12 13
Solução: Mo= 9 (pois 9 é encontrado 3 vezes)

Dados agrupados
Sem intervalo de Classe:

O valor modal é o valor que possuir maior freqüência.
Exemplo 4.5
Nos valores abaixo, qual o valor modal?
Classes 0 1 2 3 4 5 6 Σ
ni 06 11 09 08 08 05 01 48
Solução: o valor predominante é o número 1, como podemos verificar na Tabela do exemplo

4.5, pois a freqüência de 1 é 11 o que significa que 1 ocorreu 11 vezes. Temos, portanto,
Mo=1.
Com intervalo de classe:

Tratando-se de dados agrupados com intervalo de classe, a moda não é percebida tão fa-
cilmente como nos casos anteriores. Para calcular o valor modal nesses casos, podemos
utilizar os seguintes processos:
nmo − nant
Mo = linf + hMo
1º Processo: Fórmula de Czuber:
( nmo − nant ) + ( nmo − n post )
onde constatamos:
Classe Modal: Classe de maior freqüência
n mo: freqüência simples da classe modal
nant: freqüência simples anterior à classe modal
npost: freqüência simples posterior à classe modal
linf: limite inferior da classe modal
hMo: intervalo de classe modal
2º Processo: Fórmula de Pearson: M o = 3Md − 2 X

onde constatamos:
Md = Mediana (vamos estudar a seguir)
X = Média

Exemplo 4.6
Determinar a moda para a distribuição:
Classes 0|--- 1 1|--- 2 2|--- 3 3|--- 4 4|--- 5 Σ
ni 3 10 17 8 5 43
Solução:
Como os dados estão agrupados em intervalos de classe vamos utilizar a fórmula de Czuber
a classe modal é a classe 2|----3 (classe com maior freqüência)
linf = 2
hMo = 1
nMo = 17
nant = 10
npost =8
Substituindo esses valores na fórmula, temos:
 17 − 10 
Mo = 2 + 1 
 (17 − 10) + (17 − 8) 
Mo= 2,44
4.4. Mediana (Md)

A mediana é uma medida de posição. É, também, uma separatriz, pois divide o conjunto em
duas partes iguais, com o mesmo número de elementos. O valor da mediana encontra-se no
centro da série estatística organizada, de tal forma que o número de elementos situados
antes desse valor central (mediana) é igual ao número de elementos que se encontram após
esse mesmo valor (mediana).
Para Calcular a Mediana temos que verificar se estamos trabalhando com:

 Dados não agrupados

Dados agrupados  Sem intervalo
 
 Com intervalo de Classe

Para uma série com número ímpar de itens: a mediana corresponde ao valor central.
EMd – elemento mediano: indica a posição da mediana.
n ímpar
EMd = (n+1)/2
Md = X (E Md )
A mediana será o termo de ordem (n+1)/2.

Para uma série com número par de itens: não há termo central único, mas, sim, dois termos
centrais. A mediana será dada por:
n par X (E Md ) + X (E Md +1)
EMd = n/2 Md =
2
A mediana será a média aritmética entre os termos centrais.

Exemplo 4.7
Nos valores abaixo, qual o valor mediano?
3 4 4 5 6 7 8 9 9 9 10 11 12 13
Solução:
Como os dados não estão agrupados temos verificar se os elementos estão em ordem
(crescente ou decrescente), no nosso exemplo os elementos já estão ordenados.
O total de itens é 14, portanto n é par.
Emd= n/2 = 14/2= 7 (vamos verificar qual o elemento que ocupa a 7ª posição)
1ª 2ª 3ª 4ª 5ª 6ª 7ª
3 4 4 5 6 7 8 9 9 9 10 11 12 13
Portanto a Md = (8 + 9)/2 → Md = 8,5

Dados agrupados
Neste caso, o problema consiste em determinar o ponto do intervalo em que está compre-
endida a mediana.
Sem intervalo de classe:

Devemos, primeiro, obter a localização da mediana na série através do termo de ordem:
n
E MD =
2
Uma vez localizada a posição da mediana, devemos verificar o valor numérico da variável
correspondente a essa posição.

Localizada a classe mediana, calculamos o valor da mediana pela fórmula:
n
∑2 − N ant
Md = linf + hMd
n Md
onde temos:
linf: limite inferior da classe mediana.
hMo: intervalo de classe mediana.
nMd: freqüência simples absoluta na classe mediana.
Nant: freqüência acumulada absoluta anterior à classe mediana.
Classe Mediana: classe onde está o elemento mediano.
Exemplo 4.8
Nos valores abaixo, qual o valor mediano?
Classes 0 1 2 3 4 5 6 Σ
ni 06 11 09 08 08 05 01 48
Solução:
n
Como os dados estão agrupados sem intervalo de classe vamos utilizar: E MD =
2
Emd= 48/2 = 24 (não precisamos verificar se n é par ou ímpar, temos que fazer esta verificação so-
mente para dados não agrupados!!!)

Pela freqüência acumulada verificamos a que classe corresponde.
1ª 2ª 3ª
Classes 0 1 2 3 4 5 6 Σ
ni 06 11 09 08 08 05 01 48
Ni 06 17 26 34 42 47 48 –
O elemento que ocupa a 24ª posição esta na 3ª classe ou seja o valor da Md = 2

(valor do elemento mediano foi igual a 24, então temos que encontrar até que classe temos
24 elementos, até a 2ª classe temos 17 (N2= 17) elementos, até a 3ª classe temos 26 (N3)
elementos, portanto o 24 º elemento esta na 3ª classe, que corresponde ao valor 2)
Exemplo 4.9
Determinar a mediana para a distribuição:
Classes 0|--- 1 1|--- 2 2|--- 3 3|--- 4 4|--- 5 Σ
ni 3 10 17 8 5 43
Solução: Como os dados estão agrupados com intervalo de classe vamos utilizar:
n
∑2 − N ant
Md = linf + hMd
n Md
Emd= 43/2 = 21,5 (não precisamos verificar se n é par ou ímpar!!!)

Pela freqüência acumulada verificamos qual a classe mediana
1ª 2ª 3ª
Classes 0|--- 1 1|--- 2 2|--- 3 3|--- 4 4|--- 5 Σ
ni 3 10 17 8 5 43
Ni 3 13 30 38 43 –
A classe mediana é a 3ª classe que compreende o intervalo de 2|--- 3. Agora retiramos as

variáveis utilizadas na fórmula.

linf: limite inferior da classe mediana. → linf =2
hMo: intervalo de classe mediana. → hMo = 1
nMd: freqüência simples absoluta na classe mediana. → n3=17
Nant: freqüência acumulada absoluta anterior à classe mediana. → N2=13
n
∑2 − N ant
 21,5 − 13 
Md = l inf + h Md M D = 2 + 1  = 2,5
n Md  17 
Portanto o valor mediano da distribuição é 2,5
4.5. Média Geométrica (MG)

A média geométrica de um conjunto de n números x1, x2,x3,......xn é a raiz de ordem n do
produto desses números:
M G = n x1.x2 . x3 .....xn
Dados agrupados
Sem intervalo de classe:

Xi: valor observado
M G = n x1 1 x2 2 x3 3 ....xn n
n n n n
ni: n° de observações da classe
n: nº total de itens
x i : ponto médio
M G = n x1 1 x 2 2 x 3 3 ....x n n
n n n n
ni: n° de observações
n: nº total de itens
4.6. Média Harmônica (Mh)

Sejam x1, x2, x3,......xn, valores de x, associados às freqüências absolutas n1, n2, n3,......nn,
respectivamente.

A média harmônica de X é definida por:
n n
Mh = = n
n1 n n n ni
x1
+ 2 + 3 + ........ + n
x2 x3 xn ∑
i =1 xi
Para dados não agrupados n = 1.

Para dados agrupados sem intervalo de classe xi é o valor da variável.
Para dados agrupados com intervalo de classe xi é o ponto médio da classe.
Exemplo 4.10
Utilizando o exemplo 4.9 qual o valor encontrado para a Média Harmônica e Média Geomé-
trica?
Solução:
Cálculo da Média Geométrica – utilizando a fórmula
MG = n
x1n1 x 2 n2 x 3n3 .... x n nn
Classes 0|--- 1 1|--- 2 2|--- 3 3|--- 4 4|--- 5 Σ
ni 3 10 17 8 5 43
Ni 3 13 30 38 43 –
xi 0,5 1,5 2,5 3,5 4,5
M G = 43 0,5 3.1,510.2,517.3,58.4,5 5 = 2,26
Cálculo da Média Harmônica – utilizando a fórmula

n n
Mh = = n
n1 n 2 n 3 n ni
+
x1 x 2
+
x3
+ ........ + n
xn ∑
i =1 xi
43
Mh = = 1,88
3 10 17 8 5
+ + + +
0,5 1,5 2,5 3,5 4,5

4.7. Separatrizes: Quartis, Decis e Percentis
São valores que ocupam determinados lugares de uma distribuição de freqüência. Podemos
classificá-las em:
Quartis: dividem a distribuição em 4 partes iguais

Qi = quartil i=1,2,3
Q1 = 1º quartil, valor situado de tal modo na série que uma quarta parte (25%) dos dados
é menor que ele e as três quartas partes restantes (75%) são maiores.
Q2 = 2º quartil, evidentemente, coincide com a Mediana (Q2 = Md).
Q3 = 3º quartil, valor situado de tal modo que as três quartas partes (75%) dos termos são
menores que ele e uma quarta parte 25% é maior.
1º Passo: Calcula-se em que classe esta o Qk que queremos.

2º Passo: Identifica-se a classe QK, pela Nac;
3º Passo: Aplica-se a fórmula:

n   3n 
 − N ant   − N ant 
Q1 = lQ1 +   .h
Q3 = lQ3 +   .h
4 4
nQ1 nQ3
Onde temos:
n: tamanho da amostra
linf: limite inferior da classe do quartil considerado
hQ: intervalo de classe do quartil considerado
nQ: freqüência simples absoluta do quartil considerado
Nant: freqüência acumulada anterior à classe do quartil considerado
Decis: dividem a distribuição em 10 partes iguais
Di = decil i=1,2,3, …, 9
1º Passo: Calcula-se em que classe esta o Dk que queremos.

2º Passo: Identifica-se a classe DK, pela Nac;
3º Passo: Aplica-se a fórmula:

lDK: limite inferior da Classe Dk
 KN 
 − N ( ant )  n: tamanho da amostra
DK = l DK +  10 h h: amplitude da classe
nDK nDK: freqüência da classe
N(ant): freqüência acumulada da classe anterior

Percentis: dividem a distribuição em 100 partes iguais.
Pk = centil i=1,2,3, …, 99
1º Passo: Calcula-se em que classe esta o Pk que queremos
2º Passo: Pela Nac identifica-se a classe Pk
3º Passo: Aplica-se a fórmula
lPK: limite inferior da classe

 Kn  em que, K = 1,2,3,...,98,99.
 − N ( ant ) 
n: tamanho da amostra
+ h
100
PK = l PK N(ant): freqüência acumulada anterior à classe
n PK
h: amplitude da classe
nPK: freqüência da classe
Exemplo 4. 11
Num acampamento infantil, foram obtidas as seguintes estaturas:
Estaturas 120|--- 128 128|---136 136|--- 144 144|--- 152 152|--- 160
freqüência 6 12 16 13 7
Calcule:
a) O 1º Quartil (Q1);
b) O 4º Decil (D4);
Solução:
Primeiro vamos estruturar a tabela de distribuição de Freqüências, como estamos traba-
lhando com intervalos de classe, temos que calcular os pontos médios de cada classe. De-
pois iremos utilizar as fórmulas para cada item que queremos calcular.
Estaturas (cm)
i ni Ni Xi (Ponto médio)
(Classes)
1 120|--- 128 6 6 124
2 128 |--- 136 12 18 132

3 136 |--- 144 16 34 138
4 144 |--- 152 13 47 148
5 152 |--- 160 7 54 156
Total 54 - -

a) Cálculo de Q1,
Para calcular Q1, temos que primeiro identificar a classe em que está o valor, para isso
consideramos que:
N 54
= = 13,5 , primeiramente vamos arredondar o resultado para 14, pela freqüência
4 4
acumulada procuramos a classe onde se encontra o 14º elemento. O 14º elemento esta
na 2ª classe com limites de 128 |--- 136.
Agora usaremos a fórmula para calcular Q1
Onde:
n 
 − N ant  linf: limite inferior da classe do quartil considerado = 128
Q1 = lQ1 +   .h
4
nQ1 hQ: intervalo de classe do quartil considerado = 8
nQ: freqüência simples absoluta do quartil considerado = 12
Nant: freqüência acumulada anterior à classe do quartil considerado =6
Substituindo estes valores na expressão acima temos:
Q1 = 128 +
(13,5 − 6) * 8 = 133
12
b) Cálculo de D4
Primeiramente identificamos a classe onde está localizado o valor que será utilizado,
Kn 4 . 54
= = 21,6 = 27 , através da freqüência acumulada identificamos a classe que
10 10
encontra o 27º, que é a 3ª classe com limites de 136 |--- 144
Agora usaremos a fórmula
onde:
 Kn  lDK: limite inferior da Classe Dk = 136
 − N ( ant ) 
+ h
1 n: tamanho da amostra = 54
DK = l D K
nDK h: amplitude da classe = 8
nDK: freqüência da classe = 16
N(ant): freqüência acumulada da classe anterior = 18
Substituindo estes valores na expressão acima temos:
D4 = 136 +
(21,6 − 18) * 8 = 137,8
16

Capítulo 5.
Medidas de Dispersão
A interpretação de dados estatísticos requer que se realize um grande estudo de da-

dos, além das medidas de posição. Nesta unidade, veremos que as medidas de dis-
persão servem para verificar a representatividade das medidas de posição, que é o
nosso principal objetivo.
5.1. Dispersão
Medidas de dispersão são medidas estatísticas utilizadas para avaliar o grau de variabilida-
de, ou dispersão, dos valores obtidos em torno do valor médio. Servem para medir a repre-
sentatividade da média.
  Amplitude (A)
 
 Absoluta  Variância (S 2 )
Medidas de Dispersão Desvio Padrão (S)

 
Relativa Coeficiente de variação (CV)
 
Amplitude Total (A)
A amplitude é a diferença entre o maior e o menor dos valores da série. A utilização da am-
plitude total como medida de dispersão é muito limitada, pois sendo uma medida que de-
pende apenas dos valores extremos, é instável, não sendo afetada pela dispersão dos valo-
res internos.
Variância (S2)
A variância inclui na sua medida os valores extremos e os valores intermediários, isto é,

expressa melhor os resultados obtidos. Na variância são estabelecidas relações dos desvios
em torno da média, isto é, a variância é a média aritmética dos quadrados dos desvios.

Para Dados Amostrais, temos as seguintes fórmulas para o cálculo da variância:
Dados Não Agrupados Dados Agrupados
n
∑ ( xi − x)
_
1 
 x 2 .n − (∑ x .n )2


S2 = ∑
2 i i
n −1 
i i
S =
2 i =1

n

n −1
Onde temos que:
Para dados agrupados sem intervalo de classe, xi é o valor da variável.
Para dados agrupados com intervalo de classe, xi é o ponto médio da classe.

Para Dados Populacionais temos as seguintes fórmulas para o cálculo da variância:
Dados Não Agrupados Dados Agrupados
1  (∑ xi .ni ) 
n _ 2
∑ ( xi − x ) 2 
S2 = i =1 S =2
n
∑ i i
x 2
.n −
n 
n  
Onde temos que:

Para dados agrupados sem intervalo de classe, xi é o valor da variável.
Para dados agrupados com intervalo de classe, xi é o ponto médio da classe.
Sendo a variância calculada a partir dos quadrados dos desvios, ela é um número em uni-
dade quadrada em relação à variável em questão, o que, sob o ponto de vista prático, é um
inconveniente; por isso, tem pouca utilidade na estatística descritiva, mas é extremamente
importante na inferência estatística e em combinações de amostras.
Desvio Padrão (S)
O desvio-padrão é a medida mais usada na comparação de diferenças entre conjuntos de

dados, por ter grande precisão. O desvio-padrão determina a dispersão dos valores em re-
lação à média e é calculado por meio da raiz quadrada da variância.
S = S2

Coeficiente de Variação (CV)
Coeficiente de variação é uma medida relativa de dispersão útil para a comparação em ter-
mos relativos do grau de concentração. O coeficiente de variação é a relação entre o desvio
padrão (S) e a média x ..
S
CV =
x
Diz-se que uma distribuição pode ter:
Baixa dispersão: CV ≤ 15%
Média dispersão: 15%< CV<30%
Alta dispersão: CV ≥ 30%
5.2. Assimetria
Denomina-se assimetria o grau de afastamento de uma distribuição da unidade de simetria.
As medidas de assimetria referem-se à forma da curva de uma distribuição de freqüência,
mais especificamente do polígono de freqüência ou do histograma.
Em uma distribuição simétrica, tem-se igualdade dos valores da média, mediana e moda.
Simetria
X = Mo = Md
Toda distribuição deformada é sempre assimétrica. Entretanto, a assimetria pode dar-se na

cauda esquerda ou na direita da curva de freqüências.
Em uma distribuição assimétrica positiva, ou assimétrica à direita, tem-se: Mo < Md < X
Assimetria à direita (ou positiva)
Mo Md X

Em uma distribuição assimétrica negativa, ou assimétrica à esquerda, tem-se:
X < Md < Mo
Assimetria à esquerda (ou negativa)
X Md Mo
Existem várias fórmulas para o cálculo do coeficiente de assimetria. As mais utilizadas são:
x − Mo Mo: valor modal (moda)

1º Coeficiente de Pearson: AS = S: Desvio padrão
S X : Média
Q1 + Q3 − 2Md Q1: valor do 1º Quartil

2º coeficiente de Pearson: AS = Q3: valor do 3º Quartil
Q3 − Q1 Md: valor da Mediana
Quando:
AS = 0, diz-se que a distribuição é simétrica.
AS > 0, diz-se que a distribuição é assimétrica positiva (à direita)
AS < 0, diz-se que a distribuição é assimétrica negativa (à esquerda).
5.3. Curtose
Curtose é o grau de achatamento (ou afilamento) de uma distribuição em comparação com
uma distribuição padrão (chamada curva normal). De acordo com o grau de curtose, classi-
ficamos três tipos de curvas de freqüência:
Mesocúrtica: é uma curva básica de referência chamada curva padrão ou curva normal;

Platicúrtica: é uma curva mais achatada (ou mais aberta) que a curva normal;
Leptocúrtica: é uma curva mais afilada que a curva normal;
Para medir o grau de curtose utiliza-se o coeficiente:
Q1: valor do 1º Quartil

Q3 − Q1
K= Q3: valor do 3º Quartil
2( P90 − P10 ) P10: valor do Percentil 10
P90: valor do Percentil 90
Se K= 0,263, diz-se que a curva correspondente à distribuição de freqüência é mesocúr-

tica.
Se K > 0,263, diz-se que a curva correspondente à distribuição de freqüência é platicúrti-

ca.
Se K < 0,263, diz-se que a curva correspondente à distribuição de freqüência é leptocúr-
tica.
Exercício Resolvido 5.1

Num acampamento infantil, foram retiradas uma amostra das estaturas de crianças. Os da-
dos amostrais estão abaixo:
Estaturas 120|--- 128 128|---136 136|--- 144 144|--- 152 152|--- 160
freqüência 6 12 16 13 7

Para estes dados, calcule:
a) Variância
b) Desvio Padrão
c) Coeficiente de Variação
d) Coeficiente de Assimetria
Resolução:
a) Cálculo da Variância
Como estamos trabalhando com dados agrupados com intervalo de classes temos que
calcular o ponto médio de cada classe.
Estaturas 120|--- 128 128|---136 136|--- 144 144|--- 152 152|--- 160 Σ
ni 6 12 16 13 7 54
xi 124 132 140 148 156 -
xi.ni 744 1584 2240 1924 1092 7584
xi2. ni 92256 209088 313600 284752 170352 1070048
Utilizando a fórmula para dados amostrais
1  (∑ xi .ni )
2
 = 1 1070048 − (7584 )
 2

S =
2
n −1
∑ xi .ni − n
2
 54 − 1  54
 = 92,78

   
b) Cálculo do Desvio padrão.
S = S 2 = 922,18 = 7,01
S = S 2 = 92,18 = 7,01
S = S 2 = 9,18 = 7,01
S = S 2 = 92,78 = 9,63

c) Cálculo do Coeficiente de Variação (temos que Calcular a Média da distribuição)
n
∑x ×n i i
7584
X= i =1
= = 140,44
n 54
S 9 , 63
CV = = = 0 , 068 = 6 ,8 %
X 140 , 44
d) Cálculo do Coeficiente de Assimetria – utilizando a formula do 1º coeficiente. (temos

que calcular a Moda)
nmo − nant 16 − 12
Mo = linf + hMo = 136 + 8 = 140,57
(nmo − nant ) + (nmo − n post ) (16 − 12) + (16 − 13)
x − Mo 140 , 44 − 140 ,57
AS = = = − 0 , 013
S 9 , 63
(Assimetria negativa ou a esquerda)

Módulo 2
Capítulo 6.
Probabilidade
Nesta unidade, veremos probabilidade expressa por meio de valores numéricos e as

possibilidades da ocorrência dos resultados de um fenômeno. São objetivos desta
unidade:
Definir e determinar os possíveis espaços amostrais de fenômenos;
Determinar a probabilidade de ocorrência de um determinado fenômeno.
Formar um conhecimento sólido sobre os valores probabilísticos que serão utiliza-
dos nas próximas unidades.
6.1. Experimento aleatório, espaço amostral e eventos
Introdução
Todas as vezes que se estudam fenômenos que podem ser observados, é imprescindível
distinguir o próprio fenômeno e o modelo matemático (determinístico ou probabilístico) que
melhor o explique.
Os fenômenos estudados pela estatística são fenômenos cujo resultado, mesmo em condi-
ções normais de experimentação, variam de uma observação para outra, dificultando a pre-
visão de um resultado.
A observação de um fenômeno casual é recurso poderoso para se entender a variabilidade
do mesmo. Entretanto, com suposições adequadas e sem observar diretamente o fenôme-
no, podemos criar um modelo teórico que reproduza de forma bastante satisfatória a distri-
buição das freqüências, como se o fenômeno estivesse sendo observado diretamente. Tais
modelos são os chamados modelos de probabilidades.
Os fenômenos determinísticos são previsíveis, e conduzem sempre a um mesmo resultado
quando as condições são as mesmas. Ex: tempo de queda livre de um corpo. Mantidas as
mesmas condições, as variações obtidas para o valor do tempo de queda livre de um corpo
são extremamente pequenas (em alguns casos, desprezíveis).
Os fenômenos aleatórios são imprevisíveis e podem conduzir a diferentes resultados mes-
mo quando as condições são as mesmas. Ex: lançamento de um dado.

Experimento Aleatório
Podemos considerar os seguintes experimentos aleatórios como fenômenos produzidos

pelo homem.
Lançamento de uma moeda honesta;
Lançamento de um dado;
Lançamento de duas moedas;
Retirada de uma carta de um baralho completo, de 52 cartas;
Determinação da vida útil de um componente eletrônico.
A análise desses experimentos revela que:

Cada experimento poderá ser repetido indefinidamente sob as mesmas condições;
Não se sabe a priori o resultado do experimento, porém pode-se descrever todos os pos-
síveis resultados a serem obtidos, isto é, as possibilidades;
Quando o experimento é repetido um grande número de vezes, surgirá uma regularidade.
Para a explicação desses fenômenos (fenômenos aleatórios), adota-se um modelo matemá-

tico probabilístico.
Espaço Amostral
Um dos conceitos matemáticos fundamentais utilizados no estudo das probabilidades é o de

conjunto. Um conjunto é uma coleção de objetos ou itens que possuem característica(s)
comum(ns). É importante definir cuidadosamente o que constitui o conjunto em que estamos
interessados, a fim de podermos decidir se determinado elemento é ou não membro do con-
junto.
Conjunto é uma coleção bem definida de objetos ou itens.
A probabilidade só tem sentido no contexto de um espaço amostral, que é o conjunto de

todos os resultados possíveis de um “experimento”. O termo “experimento” sugere a incerte-
za do resultado antes de fazermos as observações. Denominamos os resultados de um ex-
perimento (ex: a ocorrência de um raio, de uma viagem etc.) de eventos.
Espaço Amostral – É representado pela letra (S) – O espaço amostral de um experimento

aleatório é o conjunto de todos os possíveis resultados desse experimento.

Exemplo 6.1: Espaços Amostrais
Seja os experimentos:
A – Lançar uma moeda o Espaço amostral será:
S = {c, r}
B – Lançar um dado o Espaço amostral será:
S = {1, 2, 3, 4, 5, 6}
C – Lançar 2 moedas o Espaço amostral será:
S = {(c, r), (c, c), (r, c), (r, r)}
Pode-se inferir que se o nº de pontos (elementos do espaço amostral) amostrais de um es-
paço amostral finito é n, então o número de eventos é dado por: 2n.
Exemplo 6.2
No lançamento de 5 moedas, o número de pontos amostrais (resultados possíveis) é 25 =
32. Portanto, S= 32.
Evento
Evento Aleatório – É representado pela letra (E) – O evento aleatório é qualquer subconjun-
to de um espaço amostral. É também o resultado obtido de cada experimento aleatório, não
é previsível.
O complemento de um evento é constituído de todos os resultados obtidos no espaço amos-
tral que não façam parte do evento.
Os eventos são mutuamente excludentes, quando não têm elemento em comum, ou se não
podem ocorrer simultaneamente.
Exemplo 6.3
Na extração de uma só carta de baralho, os eventos “a carta é de copas” e a “carta é de
ouros” são mutuamente excludentes, porque uma carta não pode ser ao mesmo tempo de
copas e de ouros.
Já os eventos “a carta é de copas” e “a carta é uma figura” não são mutuamente excluden-
tes, porque algumas cartas de copas são também figuras.
Muitas vezes, é útil representar graficamente um espaço amostral, porque isso torna mais
fácil visualização dos elementos.

Vejamos alguns exemplos de representação gráfica de eventos e espaços amostrais.
A) Quando temos eventos complementares
’
A
Os eventos A e A’ são complementares A
B) Quando temos eventos mutuamente excludentes

A B
Os eventos A e B são mutuamente
S
excludentes porque não se interceptam.
C) Quando temos eventos não mutuamente excludentes

Os eventos A e B não são mutuamente excludentes,
A B
pois têm alguns elementos em comum.
S
Operações com Eventos Aleatórios

Consideremos um espaço amostral finito:
S = {∈ 1 , ∈ 2 , ∈ 3 .... ∈ n }
Sejam A e B dois eventos de S, as seguintes operações podem ser efetuadas e são defini-
das e representadas a seguir:
A) Reunião – A ∪ B – O evento reunião é formado pelos pontos amostrais que pertencem
a pelo menos um dos eventos.
A ∪ B = {∈1 (∈) S / ∈1∈ A ou ∈1∈ B}
A É o evento que ocorre se

B
A ocorre ou B ocorre,
ou ambos ocorrem.
B) Interseção – A ∩ B – O evento interseção é formado pelos pontos amostrais que perten-

cem simultaneamente aos eventos A e B.
A ∩ B = {∈i ∈ S ∈i ∈ A e ∈i ∈ B}

É o evento que ocorre
A A∩B B se A e B ocorrem
Obs.: Se A ∩ B = ∅, A e B são eventos mutuamente exclusivos.
C) Complementação → S – A = A” → É o evento que ocorre se o evento A não ocorre.

A' = {∈i ∈ S ∈i ∉ A}
6.2. Probabilidade: Definição Clássica; Probabilidade e freqüência relativa

Primeiramente o conceito de probabilidade estava, associado a freqüência de um aconteci-
mento ou seja quando o experimento é repetido um grande número de vezes, surgirá uma
regularidade.
Mas esta definição é muito vaga, pois o que é um grande número de repetições?
Abaixo temos uma definição mais clássica do que é probabilidade.
Chamamos de probabilidade de um evento A (A ⊂ S) o número real definido por P(A), tal
que:
Número de Casos Favoráveis ( A) NCF(A)
P(A) = =
Número Total de Casos NTC
Dado um experimento aleatório, E e S o espaço amostral, probabilidade de um evento A –

P(A) – é uma função definida em S que associa a cada evento um número real, satisfazendo
os seguintes axiomas:
0 ≤ P ( A) ≤ 1
P(S) = 1 (Probabilidade do espaço amostral)

Se A e B forem eventos mutuamente exclusivos, (A ∩ B=Ø), então:
P (A ∪ B)=P(A)+P(B)

6.3. Tipos de eventos
Chamamos de evento qualquer subconjunto do espaço amostral S de um experimento alea-
tório.
Assim, qualquer que seja E, se E ⊂ S (E está contido em S), então E é um evento de S.
Evento Certo – é aquele que ocorre em qualquer realização do experimento aleatório.

Se E = S, E é chamado evento certo.
Evento Elementar – é aquele formado por um único elemento do espaço amostral.
Se E ⊂ S e E é um conjunto unitário, E é chamado evento elementar.
Evento Impossível – é aquele que não ocorre em nenhuma realização de um experimento

aleatório.
Se E = ∅, E é chamado evento impossível.
Evento Complementar – seja um evento A qualquer, o evento A’ (chamado de complemen-

tar de A), tal que A’=S-A, ou seja, é um outro conjunto formado pelos elementos que perten-
cem a S e não pertencem a A.
Eventos Equiprováveis
No estudo de probabilidade (definição clássica) quando se associa a cada ponto amostral a
mesma probabilidade, o espaço amostral chama-se equiprovável ou uniforme. Os eventos
Ei,i=1,2,3......n são equiprováveis quando P(Ei)=P(E2)=P(En)= P, isto é, quando todos têm a
mesma probabilidade de ocorrer: P=1/n. Todo o nosso estudo estará baseado neste concei-
to
Se os n pontos amostrais (eventos) são equiprováveis, a probabilidade de cada um dos pon-
tos amostrais é 1/n.
1 r
P( A) = r   ∴ P( A) =
n n
Exemplo 6.4
Retira-se uma carta de um baralho completo de 52 cartas. Qual a probabilidade de sair um
rei ou uma carta de espadas?

Solução:
Probabilidade de Carta de espadas →P(A) = 13/52
Probabilidade de Rei → P(B) = 4/52
Probabilidade de P(A ∩ B)= 1/52 portanto
Eventos mutuamente exclusivos
P ( A ∪ B ) = P ( A) + P ( B ) − P ( A ∩ B )
13 4 1 16 4
P( A ∪ B) = + − = =
52 52 52 52 13
Dois eventos A e B são denominados mutuamente exclusivos se eles não puderem ocorrer
simultaneamente, isto é, A ∩ B = Ø.
Evento impossível
Exemplo 6.5
E = Jogar um dado e observar o resultado.
S = {1,2,3,4,5,6}
Sejam os eventos A= ocorrer nº par e B= ocorrer nº ímpar.
Então, A e B são mutuamente exclusivos, pois a ocorrência de um número par e ímpar não
pode ser verificada na mesma experiência.
6.4. Axiomas de Probabilidade

Probabilidade é um conceito matemático que permite a quantificação da incerteza, permitin-
do que ela seja aferida, analisada e usada para a realização de previsões. Alguns dos seus
princípios mais importantes são:
1. Se temos um conjunto vazio (representado por Ø) a Probabilidade é igual a 0.
Se Ø → P(Ø) = 0.
2. Teorema do evento complementar: Se A’ (lê-se: evento A complementar) é o comple-

mento do evento A, então a Probabilidade do evento complementar é:
P(A’) = 1 – P(A)
3. Teorema da soma: Se A e B são dois eventos quaisquer, então temos que a Probabili-
dade da união dos eventos A e B é:
P(A ∪ B) = P (A) + P (B) – P (A ∩ B)

Se tomássemos apenas P(A ∪ B) = P (A) + P (B), estaríamos, considerando duas vezes a
probabilidade de interseção, estamos trabalhando com eventos equiprováveis ou seja todos
os eventos tem a mesma probabilidade de acontecer. (ver definição em 6.3)
Teoria da Contagem
Dados dois eventos, o primeiro dos quais pode ocorrer de m maneiras distintas e o segundo
pode ocorrer de n maneiras distintas, então os dois eventos conjuntamente podem ocorrer
de m.n maneiras distintas. O cálculo da probabilidade de um evento reduz-se a um proble-
ma de contagem. Assim é que a Análise Combinatória tem fundamental importância para se
contar o nº de casos favoráveis e o total de casos. Para problemas simples ou com poucos
elementos, pode-se contar o número de resultados de forma direta, sem necessidade de
recorrer às fórmulas matemáticas da análise combinatória. Para problemas mais complexos,
recorre-se às combinações e arranjos para determinar o número de casos.
Combinação
São agrupamentos de r elementos, de forma que os r elementos sejam distintos entre si
apenas pela espécie. A posição dos elementos não importa.
O Número de combinações de r elementos combinados p a p sendo p<r é calculado por:
r r!
Cr , p =   =
 p  p!( r − p )!
Nota: O Símbolo fatorial! denota o produto dos inteiros positivos em ordem decrescente.
Por exemplo, 6! = 6.5.4.3.2.1= 720. Por definição, 0! = 1.
Exemplo 6.6
Quantas comissões de três pessoas podem ser formadas com um grupo de dez pessoas?
Solução: Como a ordem das três pessoas na comissão não importa (não gera outra comis-
são), temos que trabalhar com combinação.
r= 10, p=3 substituindo estes valores na fórmula temos:
10   10!  10.9.8.7!

C10,3 =   =   = = 120
 3   3!(10 − 3)!  3.2.1.7!

Podemos ter 120 comissões diferentes compostas por 3 pessoas.
Arranjos
São agrupamentos formados com r elementos, de forma que os r elementos sejam dis-
tintos entre si pela ordem ou pela espécie.
O número de arranjos de r elementos é calculado por:
r!
Ar , p =
( r − p )!
Exemplo 6.7
Considerando um grupo de dez pessoas, quantas chapas diferentes podemos ter para uma
eleição de presidente, tesoureiro e secretário?
Solução: Como a ordem das três pessoas na comissão gera outro resultado,, temos que
trabalhar com Arranjos.
r= 10, p=3 substituindo estes valores na fórmula temos:
10! 10 . 9 .8 . 7 . 6 . 5 . 4 . 3 .2 .1 10 .9 .8 .7!
A10,3 = = = = 10.9.8 = 720
(10 − 3)! 7! 7!
Podemos ter 720 chapas diferentes.

Obs.: Quando queremos selecionar r elementos de um conjunto de n elementos distintos sem levar
em conta a ordem, estamos considerando combinações, quando contamos separadamente or-
denações diferentes dos mesmos elementos temos arranjos.
6.5. Probabilidade Condicional e Independência de Eventos

Probabilidade Condicional
Podemos ter a probabilidade da ocorrência de um evento (B) dependendo da ocorrência de
outro (A), nestes casos, teremos a probabilidade de B condicionada a A, que é definida por
P(B\A) (lê-se Probabilidade de B dado A).
O evento em que ambos, A e B, ocorrem é chamado A interseção B; portanto, a probabili-
dade do evento B ocorrer, dado que A ocorreu, é de:
P( A ∩ B)
P( B A) =
P( A)

Isso significa que a probabilidade de B ocorrer, dado que A ocorreu, é igual à probabilidade
de ocorrência simultânea de A e B dividida pela probabilidade de ocorrência de A. (Note-se
que essa definição não se aplica quando P(A)=0, porque então estaríamos dividindo por
zero).
Exemplo 6.8
Dois dados são lançados. Consideremos os eventos
A={(x1,x2) / x1+x2=10} e B={(x1,x2) / x1 > x2}, onde x1 é o resultado do dado 1 e x2 é o resulta-
do do dado 2. Avaliar P(A); P(B); P(A/B) e P(B/A).
Solução:
P(A)= 3/36 =1/12 P(A/B)=1/15
P(B) =15/36 =5/12 P(B/A)=1/3
Teorema do Produto
“A probabilidade da ocorrência simultânea de dois eventos, A e B, do mesmo espaço amos-

tral, é igual ao produto da probabilidade de um deles pela probabilidade condicional do ou-
tro, dado o primeiro”.
P( A ∩ B) P( A ∩ B)
P( A B) = P ( B A) =
P(B) P ( A)
Independência Estatística
Um evento A é considerado independente de um outro evento B se a probabilidade de A é
igual à probabilidade condicional de A dado B.
Exemplo 6.9
Em um lote de 12 peças, 4 são defeituosas, 2 peças são retiradas uma após a outra, sem
reposição. Qual a probabilidade de que ambas sejam boas?
A = {a 1ª peça é boa}
B = {a 2ª peça é boa}
P(A ∩ B) = P(A). P(B/A) = 8/12.7/11 = 14/33
Isto é, se P(A) = P(A/B) «É evidente que, se A é independente de B, B é independente de A;
P(B) = P(B/A). Se A e B são independentes, então temos que
P(A ∩ B) = P(A).P(B)

Regra de Bayes
Sejam A1, A2, A3,......An, n eventos mutuamente exclusivos tais que A1 ∪ A2 ∪ An = S.
Sejam P(Ai) as probabilidades conhecidas dos vários eventos e B um evento qualquer de S,
tal que são conhecidas todas as probabilidades condicionais P(B/Ai).
P( Ai ).P( B / Ai )
P ( Ai / B) =
P ( A1 ).P( B / A1 ) + P ( A2 ).P( B / A2 ) + ...... + P( An ).P ( B / An )
Obs.: O Teorema de Bayes é também chamado de Teorema da Probabilidade a Posteriori. Ele rela-
ciona uma das parcelas da probabilidade total com a própria probabilidade total.
O teorema de Bayes é uma generalização da probabilidade condicional no caso de mais de
dois eventos.
Exemplo 6.10
1. Sendo P(A) = 1/3, P(B) = ¾ e P(A ∪ B) = 11/12, calcular P(A/B).
Solução:
P( A ∩ B) P
A
B
=
Como P ( A / B ) = )/(B
P
A
, devemos calcular P(A ∩ B).
P( B) P
B
Como P(A ∪ B) = P(A) + P(B) – P(A ∩ B),

temos: 11/12 = 1/3 + ¾ – P(A ∩ B)
1/ 6 2
∴ P(A ∩ B) = 2/12 = 1/6 logo, P(A/B) = =
3/ 4 9
2. Em certo colégio, 5% dos homens e 2% das mulheres têm mais de 1,80 m de altura. Por
outro lado, 60% dos estudantes são homens. Se um estudante é selecionado aleatoria-
mente e tem mais de 1,80m de altura, qual a probabilidade de que o estudante seja mu-
lher?
Solução:
Temos que:
P(Ma/H) = 0,05 (Probabilidade de Homem ter mais de 1,80 m)
P(Ma/M) = 0,02 (Probabilidade de Mulher ter mais de 1,80 m)
P(H) = 0,6 (Probabilidade de ser homem)
P(M) = 0,4 (Probabilidade de ser mulher)
P(M/Ma)= ? (Probabilidade de ser mulher e que tenha mais que 1,80 m)

Utilizando a Regra de Bayes temos:
P ( M ) * P ( Ma / M ) 0,4 * 0,02
P ( M / Ma ) = =
P ( M ) * P ( Ma / M ) + P ( H ) * P ( Ma / H ) (0,4 * 0,02) + (0,6 * 0,05)
0,008
P ( M / Ma ) = = 0,21 = 21%
0,038
3. Três máquinas, A, B e C produzem respectivamente 40%, 50% e 10% do total de peças

de uma fábrica. As porcentagens de peças defeituosas nas respectivas máquinas são
3%, 5% e 2%. Uma peça é sorteada ao acaso e verifica-se que é defeituosa. Qual a pro-
babilidade de que a peça tenha vindo da máquina B? E da máquina A?
Solução: Temos que:
P(A) = 0,4 P(D/A) = 0,03 P(B/D) = ?
P(B) = 0,5 P(D/B) = 0,05
P(C)= 0,10 P(D/C) = 0,02
Utilizando a Regra de Bayes temos:

P( B) * P( D / B)
P( B / D) =
P ( A) * P ( D / A) + P ( B ) * P ( D / B ) + P (C ) * P ( D / C )
0,5 * 0,05
P( B / D) =
0,4 * 0,03 + 0,5 * 0,05 + 0,1 * 0,02
0,025
P( B / D) = = 0,641 = 64,1%
0,039

Capítulo 7.
Variáveis Aleatórias
Muitos experimentos aleatórios produzem resultados não-numéricos. Antes de ana-

lisá-los, é conveniente transformar os seus resultados em números, esta transfor-
mação é realizada por meio de uma variável aleatória. Variável aleatória é uma re-
gra de associação de um valor numérico a cada ponto do espaço amostral. Portan-
to, variáveis aleatórias são variáveis numéricas às quais iremos associar modelos
probabilísticos. Veremos que uma variável aleatória tem um número para cada re-
sultado de um experimento e que uma distribuição de probabilidades associa uma
probabilidade a cada resultado numérico de um experimento.
7.1. Conceito de variável aleatória

Sejam E um experimento e S o espaço associado ao experimento. Uma função X, que as-
socie a cada elemento s ∈ S um número real X(s), é denominada variável aleatória.
S X
R
s
Variável
Aleatória X(s)
Exemplo:
E: lançamento de duas moedas;
X: nº de caras obtidas nas duas moedas;
S = {(c,c), (c,r), (r,c),(r,r)}
X = 0 → corresponde ao evento (r,r) com probabilidade ¼
X = 1 → corresponde ao evento (r,c), (c,r) com probabilidade 2/4
X = 2 → corresponde ao evento (c,c) com probabilidade ¼.
Empregamos a termo variável aleatória para descrever o valor que corresponde ao resulta-
do de determinado experimento.
As variáveis aleatórias também podem ser discretas ou continuas veja as definições:

Variáveis Aleatórias Discretas – Admite um número finito de valores, ou seja, têm uma quan-
tidade enumerável de valores.
Variáveis Aleatórias Contínuas – pode tomar um número infinito de valores, e esses valores
podem ser associados a mensurações em uma escala contínua.
7.2. Distribuição de probabilidade

Uma vez definida a variável aleatória, existe interesse no cálculo dos valores das probabili-
dades correspondentes.
O conjunto das variáveis e das probabilidades correspondentes é denominado distribuição
de probabilidades, isto é:
{(xi,p(xi), i=1,2,….n}
Obs.: A soma das probabilidades dos valores possíveis de X é igual a 1 (um)
7.3. Função de distribuição acumulada

É a função que descreve a probabilidade de ocorrer um valor até x assumido pela variável
aleatória, isto é:
F ( X ) = P( X ≤ x)
7.4. Esperança matemática, variância e desvio padrão: propriedades

Existem características numéricas que são muito importantes em uma distribuição de pro-
babilidades de uma variável aleatória discreta. São os parâmetros das distribuições, a saber:
Esperança matemática (ou simplesmente média) – E (x) – é um número real, é também

uma média aritmética;
Variância – VAR (x) – é a medida que dá o grau de dispersão (ou de concentração) de
probabilidade em torno da média. O fato de conhecermos a média de uma distribuição
de probabilidades já nos ajuda bastante, porém, precisamos de uma medida que nos dê
o grau de dispersão de probabilidade em torno dessa média.
Desvio Padrão – DP(X) – é a raiz quadrada da variância.
7.5. Distribuições Discretas

Uma função X, definida sobre o espaço amostral e assumindo valores num conjunto enume-
rável de pontos do conjunto real, é dita uma variável aleatória discreta.

Uma variável aleatória X do tipo discreto estará bem caracterizada se indicarmos os possí-
veis valores x1, x2, …, xk que ela pode assumir e as respectivas probabilidades p(x1), p(x2),
…, p(xk), ou seja, se conhecermos a sua função de probabilidade (x; p(x)), onde
p(x) = P(X = x)
Dada a variável aleatória discreta X, assumindo os valores x1, x2, …, xk, chamamos espe-
rança matemática de X ao valor:
E ( X ) = ∑ x ⋅ p( x)
Chamamos variância de X ao valor:

Var ( X ) = E ( X 2 ) − [ E ( X )] 2
onde
E ( X 2 ) = ∑ x 2 ⋅ p( x)
E de desvio padrão de X a
DP ( X ) = Var ( X )
Principais Distribuições Discretas de Probabilidade
Vamos estudar alguns modelos probabilísticos, que podem ser usados em várias situações.
Ressaltamos, em cada situação, devemos identificar qual modelo é o mais adequado.
1. Distribuição de Bernoulli
Dado um experimento aleatório E realizado repetidas vezes, sempre nas mesmas condi-
ções, de tal forma que o resultado pode ser um Sucesso (s) (se acontecer o evento espe-
rado) ou um Fracasso (f) (se o evento não se realizar).
Seja X a variável aleatória: Sucesso ou Fracasso

X → x1 = 1 (sucesso) ou x 2 = 0 (fracasso)
P(X) → p(x 1 ) = p p(x 2 ) = 1 − p = q
P( x = 0) = q e P(x = 1 ) = p
Essas condições caracterizam um conjunto de Provas de Bernoulli ou um experimento de

Bernoulli, e sua função probabilidade é dada por:
P ( X = x) = p x .q 1− x

Principais características da Distribuição de Bernoulli:
Média:
1
E ( X ) = ∑ xi P ( xi ) = 0.q + 1. p = p
i =0
Variância:
Var ( X ) = E ( X 2 ) − [ E ( X )]2
1
E ( X 2 ) = ∑ xi2 P( xi ) = 0 2 q + 12 p = p
i=0
Var ( X ) = p − p 2 = p (1 − p ) = pq
2. Distribuição Binomial
Uma variável aleatória tem distribuição binomial quando o experimento ao qual está rela-
cionada pode apresentar apenas dois resultados (sucesso ou fracasso). Este modelo fun-
damenta-se nas seguintes hipóteses:
n provas independentes e do mesmo tipo são realizadas;
cada prova admite dois resultados – Sucesso ou Fracasso;
a probabilidade de sucesso em cada prova é p e de fracasso 1 – p = q
(porque p+q= 1)
Define-se a Variável X que conta o número de sucesso nas n realizações do experimento.

(X pode assumir os valores 0, 1, 2, 3,......., n.)
Fazendo sucesso corresponder a 1 e fracasso, a 0, temos:

Para X = 0, uma seqüência de n zeros: 000000....000.
qX =
.)0(P( X = 0) = q.q.q.q.q.....q = q n
P
Para X = 1, uma seqüência do tipo: 1000....0; 01000....0; 001000...0; serão n seqüên-

cias, cada uma com um único sucesso e n–1 fracassos:
P( X = 1) = n. p.q n −1

Para X= x, tem-se x sucessos e (n–x) fracassos, correspondendo às seqüências com x
n
algarismos 1 e n–x zeros. Cada seqüência terá probabilidade p x q n− x e como há  
 x
seqüências distintas, tem-se:
 n
P( X = x) =   p x q n − x Expressão geral da
distribuição Binomial
 x
Principais características da Distribuição Binomial:

Média: E ( X ) = n. p
Variância: )(X
V ar ( X ) = n. p.q
pVar
Exemplo 7.1
Uma moeda não viciada é lançada 8 vezes. Encontre a probabilidade de:
a) dar 5 caras;
b) pelo menos uma cara;
c) no máximo 2 caras.
Solução: Utilizando o modela da distribuição binomial temos:
a) x = sair cara, p = 0,5 (probabilidade do sucesso de X), q = 0,5 (probabilidade do fracasso
de X0, n = 8 (número de repetições do evento).
8! 40320
P( X = 5) = .0,5 5.0,58−5 = .0,58 = 0,21875 = 21,88%
5!(8 − 5)! 120.6
b) P(x ≥ 1) = 1 – { P(X = 0)} = 1–{ qn} = 1 – 0,58 = 0,9960 = 99,6%

c) P(X ≤ 2) = P(X = 0) + P(x = 1) + P(X = 2), utilizando as fórmulas dos itens anteriores cal-
culam-se as probabilidades.
3. Distribuição de Poisson
Consideremos a probabilidade de ocorrência de sucessos em um determinado intervalo

(pode ser de tempo, de espaço físico, depende do experimento). A probabilidade da ocor-
rência de um sucesso no intervalo é proporcional ao intervalo. A probabilidade de mais de
um sucesso nesse intervalo é bastante pequena em relação à probabilidade de um su-
cesso.

Seja X o número de sucessos no intervalo; temos, então:
e − λ .λk
P( X = k ) = onde λ é a média.
k!
A variável X assim definida tem distribuição de Poisson.

A distribuição de Poisson é uma medida muito usada no cálculo da probabilidade de:
Carros que passam por um cruzamento por minuto, durante uma certa hora do dia;
Erros tipográficos por página, em um material impresso;
Defeitos por unidade (m³, m², m, etc.,,) por peça fabricada;
Colônias de bactérias numa dada cultura por 0,01mm², numa plaqueta de microscópio;
Mortes por ataque de coração por ano, numa cidade;
Problemas de filas de espera em geral, e outros.
Principais características da distribuição de Poisson:

Média: E ( X ) = λ
Variância: Var ( X ) = λ
Obs.: Muitas vezes, no uso da distribuição binomial, acontece que n é muito grande e p é muito
pequeno. Podemos, então, fazer uma aproximação de binomial pela distribuição de Pois-
son, da seguinte forma:
λ = np
Exemplo 7.2
Em média, são feitas 2 chamadas por hora para certo telefone. Calcular a probabilidade de
se receber no máximo 3 chamadas em 2 horas e a probabilidade de nenhuma chamada em
90 minutos.
Solução: No exemplo acima temos uma média de acontecimento por intervalo de tempo, por
isto vamos utilizar a Distribuição de Poisson para calcular a Probabilidade pedida.
λ = 2 por hora, para 2 horas λ= 4 (é proporcional ou seja se λ= 2 para uma hora, para 2 ho-
ras λ = 4)
x= número de chamadas
Pede-se para calcular a probabilidade de no máximo 3 chamadas, ou seja estamos queren-
do os valores de x menores que 3

P(X ≤ 3) = P(X = 0) + P(X = 1) + P(X = 2) + P(X = 3) ∴
e − λ .λ0 e − λ .λ1 e − λ .λ2 e − λ .λ3
P(X ≤ 3) = + + + ∴
0! 1! 2! 3!
e −4 .4 0 e −4 .41 e −4 .4 2 e −4 .4 3
P(X ≤ 3) = + + + ∴
1 1 2 6
−4
P(X ≤ 3) = e + 4e −4 + 8e −4 + 10,666e −4 = 23,66e −4 = 0,4334 = 43,34%
Agora para 90 minutos λ = 3 (1 hora (60 minutos) λ = 2)

e −3 .30
P(X = 0) = = e −3 = 0,0498 = 4,98 %
1
7.6. Distribuição contínua

Uma variável aleatória, cujos valores são expressos em uma escala contínua, é chamada de
variável aleatória contínua.
Podemos construir modelos teóricos para v.a.’s contínuas, escolhendo adequadamente a
função de densidade de probabilidade (f.d.p.), que é uma função indicadora da probabilida-
de nos possíveis valores de X.
Assim, a área sob a f.d.p. entre dois pontos a e b nos dá a probabilidade da variável assumir
valores entre a e b, conforme ilustrado na figura 7.1, apresentada a seguir.
Figura 7.1. Probabilidade como área sob a curva entre dois pontos
P(a<X<b)
a b
Portanto, podemos escrever:

Da relação entre a probabilidade e a área sob a função, a inclusão, ou não, dos extremos a
e b na expressão acima não afetará os resultados. Assim, iremos admitir:
b
P ( a < X < b) = ∫ f ( x ) dx
a
P (a < X < b) = P ( a ≤ X < b) = P (a < X ≤ b) = P (a ≤ X ≤ b)

Teoricamente, qualquer função f(x) que seja não negativa e cuja área total sob a curva seja
igual à unidade, isto é,
∫ f ( x ) dx = 1
caracterizará uma v.a. contínua.
Dada a v.a. contínua X, assumindo os valores no intervalo entre a e b, chamamos valor mé-
dio ou esperança matemática de X ao valor
b
E ( X ) = ∫ x ⋅ f ( x ) dx
a
Chamamos variância de X ao valor

Var ( X ) = E ( X 2 ) − [ E ( X )]2
onde
b
E ( X ) = ∫ x 2 ⋅ f ( x ) dx
2
e de desvio padrão de X a
DP ( X ) = Var ( X )
Se X é uma v.a. contínua com f.d.p. f(x), definimos a sua função de distribuição acumulada
F(x) como:
Principais Modelos Contínuos de Probabilidade
1. Distribuição Normal
A distribuição normal é a mais importante das distribuições de probabilidades. Conhecida

como a “curva em forma de sino”, a distribuição normal tem sua origem associada aos er-
ros de mensuração. É sabido que quando se efetuam repetidas mensurações de determi-
nada grandeza com um aparelho equilibrado, não se chega ao mesmo resultado todas as
vezes; obtém-se, ao contrário, um conjunto de valores que oscilam, de modo aproxima-
damente simétrico, em torno do verdadeiro valor. Construindo-se o histograma desses va-
lores, obtém-se uma figura com forma aproximadamente simétrica. Gauss deduziu mate-
maticamente a distribuição normal como distribuição de probabilidade dos erros de obser-
vação, denominando-a então “lei normal dos erros”.

Supunha-se inicialmente que todos os fenômenos da vida real devessem se ajustar a uma
curva em forma de sino; em caso contrário, suspeitava-se de alguma anormalidade no
processo de coleta de dados. Daí a designação de curva normal.
A observação cuidadosa subseqüente mostrou, entretanto, que essa pretensa universali-

dade da curva, ou distribuição normal, não correspondia à realidade. De fato, não são
poucos os exemplos de fenômenos da vida real representados por distribuições não nor-
mais, curvas assimétricas, por exemplo. Mesmo assim, a distribuição normal desempenha
papel preponderante na estatística, e os processos de inferência nela baseados têm larga
aplicação.
A distribuição normal tem sua função de densidade de probabilidade dada por
1  ( x − µ) 2 
exp −  −∞ < x < ∞
2σ
f(x) =
σ 2π 

2


Como se pode observar por meio da equação acima, a distribuição normal inclui os parâ-
metros µ e σ, os quais possuem os seguintes significados:
µ: posição central da distribuição (média, µx)
σ: dispersão da distribuição (desvio padrão, σx)
Se uma variável aleatória X tem distribuição normal com média µ e variância σ2, escre-
vemos: X ∼ N(µ,σ2)
A figura 7.2 ilustra uma curva normal típica, com seus parâmetros descritos graficamente.
Figura 7.2. Curva normal típica
f(x)
σ
µ: média
σ: desvio padrão
µ x
Propriedades da distribuição normal:

Para uma mesma média µ e diferentes desvios padrão σ, a distribuição que tem maior des-
vio padrão se apresenta mais achatada, acusando maior dispersão em torno da média. A
que tem menor desvio padrão apresenta “pico” mais acentuado e maior concentração em

torno da média. A figura 7.3 compara três curvas normais, com a mesma média, porém, com
desvios padrão diferentes. A curva A se apresenta mais dispersa que a curva B, que por sua
vez se apresenta mais dispersa que a curva C. Nesse caso, σA > σB > σC.
Distribuições normais com o mesmo desvio padrão e médias diferentes possuem a mesma
dispersão, mas diferem quanto à localização. Quanto maior a média, mais à direita está a
curva. A figura 7.4 ilustra o fato, onde a curva A possui média maior que a curva B(µA > µB).
Figura 7.3. Distribuições normais com mesma média e desvios padrão diferentes
B
A
Figura 7.4. Distribuições normais com mesmo desvio padrão e médias diferentes
B A
µB µA
Como descrito anteriormente, a probabilidade de uma variável assumir valores entre a e b é

igual à área sob a curva entre esses dois pontos. A determinação dessas probabilidades é
realizada matematicamente através da integração da função de densidade de probabilidade
entre os pontos a e b de interesse. No caso da normal, a integral não pode ser calculada
exatamente e a probabilidade entre dois pontos só pode ser obtida de forma aproximada,
por métodos numéricos. Essa tarefa é facilitada através do uso da distribuição normal pa-
drão definida a seguir no próximo item..

No caso da distribuição normal, algumas dessas áreas – com os pontos a e b, função da
média µ e do desvio padrão σ − são bastante difundidas e estão representadas na figura
7.5:
Figura 7.5. Probabilidades da distribuição normal
99.73 %
95.46 %
68.26 %
µ-3σ µ-σ µ µ+σ µ+3σ

µ-2σ µ+2σ
Portanto, 68,26% dos valores populacionais caem entre os limites definidos como média
mais ou menos um desvio padrão (µ ± 1σ); 95,46% dos valores caem entre média mais ou
menos dois desvios padrão (µ ± 2σ); e 99,73% dos valores caem entre média mais ou me-
nos três desvios padrão (µ ± 3σ).
A distribuição normal padrão:

A distribuição normal particular com média 0 e desvio padrão 1 é chamada de distribuição
normal padrão e costuma ser denotada por Z.
Se X ∼ N(µ,σ2), então, a variável aleatória definida por

X−µ
Z=
σ
terá uma distribuição N(0,1). Essa transformação é ilustrada pela figura 7.6:

2
Figura 7.6. Transformação de uma N(µ,σ ) para uma N(0,1)
X
µ-3σ µ-σ µ µ+σ µ+3σ
µ-2σ µ+2σ
X-µ
σ
Z
-3 -2 -1 0 1 2 3
A área à esquerda de um valor especificado da N(0,1) encontra-se tabelada. Utilizando-se a

transformação acima, podemos obter as probabilidades para qualquer N(µ,σ2). O procedi-
mento é ilustrado através do exemplo abaixo.
Exemplo 7.3
Extrudados tubulares possuem tensão de escoamento (tensão a partir da qual o material se
deforma plasticamente), que segue uma distribuição normal com média de 210 MPa com
desvio padrão de 5 MPa. Em notação estatística, X ∼ N(210,52). É desejado que tais extru-
dados tenham tensão de escoamento de pelo menos 200 MPa. Portanto, a probabilidade do
extrudado não atingir a especificação desejada é:
 200 − 210 
Solução: P(X < 200) = P Z < 5
 = P(Z < –2).

A figura 7.7 mostra a transformação realizada e a área desejada.

Figura 7.7. Probabilidade do extrudado não atingir a especificação desejada
P(X<200)
X
180 190 200 210 220 230 240
P(Z<-2)
Z
-6 -4 -2 0 2 4 6
Para cálculo dessa probabilidade, utilizamos a tabela de distribuição normal padronizada

(que se encontra no apêndice do livro indicado na bibliografia básica). Observe que a tabela
traz apenas a P(Z<z) para z não negativo (z ≥ 0). As propriedades que se seguem podem
ser deduzidas a partir da simetria da densidade em relação à média 0, e são úteis na obten-
ção de outras áreas não tabuladas.
P(Z>z) = 1 – P(Z<z)
P(Z<–z) = P(Z>z)
P(Z>–z) = P(Z<z)
Figura 7.8. Áreas correspondentes na distribuição normal
P(Z < -z) 1 - P(Z < z)
-z z
Utilizando as relações apresentadas acima, a probabilidade do extrudado não atender à

especificação é
P(X < 200) = P(Z < –2) = P(Z > 2) = 1 – P(Z < 2)
que, através da tabela da N(0,1) é igual a
P (X < 200) = 1 – 0,97725 = 0,02275 = 2,275%

Capítulo 8.
Inferência Estatística
A Inferência Estatística é o processo de obter informações sobre uma população a

partir de resultados observados na amostra.
De modo geral, tem-se uma população com grande número de elementos e deseja-
se, a partir de uma amostra dessa população, conhecer “o mais próximo possível”
algumas características da população.
Toda conclusão tirada por uma amostragem, quando generalizada para a população,
virá acompanhada de um grau de incerteza ou risco. Ex: pesquisas realizadas pelo
Data Folha, Vox Populi, Pesquisa eleitoral.
Ao conjunto de técnicas e procedimentos que permite dar ao pesquisador um grau
de confiabilidade, de confiança nas afirmações que faz para a população, baseadas
nos resultados das amostras, damos o nome de Inferência Estatística.
O problema fundamental da Inferência Estatística, portanto, é medir o grau de incer-
teza ou risco dessas generalizações. Os instrumentos da Inferência Estatística per-
mitem a viabilidade das conclusões por meio de afirmações estatísticas.
8.1. População e amostra; Estatísticas e parâmetros; Distribuições amostrais

Se um conjunto de dados consiste de todas as observações possíveis (concebíveis ou hipo-
téticas), é chamado uma população; se um conjunto de dados consiste apenas de uma par-
te dessas observações, é chamado uma amostra.
Um dos principais objetivos da maioria dos estudos, análises ou pesquisas estatísticas é
fazer generalizações seguras – com base em amostras – em relação às populações das
quais se extraíram as amostras.
Definições
Parâmetro: é a medida usada para descrever uma característica numérica populacional.

Genericamente é representado por θ. A média (µ), a variância (σ2) e o coeficiente de cor-
relação (ρ) são alguns exemplos de parâmetros populacionais.
Estimador: também denominado estatística de um parâmetro populacional. É uma caracte-
rística numérica determinada na amostra, uma função de seus elementos. Genericamente, é
representado por θ’. A média amostral (x) e a variância amostral (s2) são alguns dos exem-
plos de estimadores.

POPULAÇÃO PARÂMETROS: θ
AMOSTRAS ESTIMADORES: θ’
Distribuição Amostral
Considere todas as possíveis amostras de tamanho n que podem ser extraídas de determi-
nada população. Se para cada uma delas se calcular um valor do estimador, tem-se uma
distribuição amostral desse estimador. Como o estimador é uma variável aleatória, pode-se
determinar suas características, isto é, encontrar sua média, variância, desvio-padrão.
As distribuições amostrais são fundamentais para o processo de inferência estatística.
Distribuição Amostral da Média
Sabe-se que x' =

∑x i
(média aritmética) é um estimador da média populacional µ. O esti-
n
mador x’ é uma variável aleatória; portanto, busca-se conhecer sua distribuição de probabili-
dade.
Teorema 1 – A média da distribuição amostral das médias, denotada por µ(x’), é igual à
média populacional µ.
E (x’) = µ(x’) = µ
Assim, é provado que a média das médias amostrais é igual à média populacional.
Teorema 2 – Se a população é infinita, ou se a amostragem é com reposição, então a vari-

ância da distribuição amostral das médias, denotada por σ2(x’), é dada por:
σ 2
VAR ( x ' ) = σ 2
x' =
n

Teorema 3 – Se a população é finita, ou se a amostragem é sem preposição, então a vari-
ância da distribuição amostral das médias é dada por:
σ2  N −n
σ ( x' ) =
2
 
n  N −1 
σ N −n
σ x' =
E o desvio padrão
n N −1
Sendo que: µ (x’) = µ
Teorema 4 – Se a população tem ou não distribuição normal com média µ e variância σ2,
então a distribuição das médias amostrais será normalmente distribuída com média µ e va-
σ2
riância .
n
Esses quatro teoremas provam que a média amostral (x’) tem distribuição normal com mé-
σ2
dia igual à média da população (µ) e variância dada por para populações infinitas, as-
n
σ2  N −n
sim como   para populações finitas. Ou, ainda:
n  N −1 
 σ2   σ2  N − n  σ N 
x' ≈ N  µ ;  ou x' ≈ N  µ ;    µ ≈
;'x
N
 n   n  N − 1   N 
com distribuições padronizadas dadas por:
xi − µ xi − µ
Zi = Zi =
σ ou σ N −n
 
n n  N − 1 
Para população infinita Para população finita
Exemplo 8.1
Temos uma população de 5000 alunos de uma faculdade. Sabemos que a altura média dos
alunos é de 175 cm e o desvio padrão, de 5 cm. Retiramos uma amostra sem reposição, de
tamanho n = 100. Qual o valor do desvio padrão amostral?

Solução:
µ = 175cm
X: N (175, 25 cm) 
 σ = 5cm
σ N −n 5 5000 − 100
σx = = = 0,4950
n N − 1 10 5000 − 1
8.2. Estimação
Há dois tipos fundamentais de estimação: por ponto e por intervalo.
Estimação pontual
O problema da estimação pontual surge quando estamos interessados em alguma caracte-
rística numérica de uma distribuição desconhecida (ex: média, variância) e desejamos calcu-
lar, a partir de observações, um número que inferimos que seja uma aproximação da carac-
terística numérica em questão.
Para ilustrar alguns dos problemas com os quais nos deparamos quando estimamos a mé-
dia de uma população com base em dados amostrais, vamos recorrer a um estudo em que
planejadores industriais procuraram determinar o tempo médio que um adulto leva para
montar um robô “fácil de montar”. Com uma amostra aleatória obtém-se os seguintes dados
(em minutos) para 36 pessoas que montaram o robô:
17 13 18 19 17 21 29 22 16 28
21 15 26 23 24 20 8 17 17 21
32 18 25 22 16 10 20 22 19 14
30 22 12 24 28 11
A média desta amostra é x’ = 19,9 minutos. Na ausência de qualquer outra informação, po-
demos tomar esta cifra como uma estimativa de µ, o “verdadeiro” tempo médio que um adul-
to leva para montar o robô.
Esse tipo de estimativa é chamada estimativa pontual, pois consiste de um único número,
ou um único ponto na escala dos números reais. Embora se trate da forma mais comum de
expressar estimativas, ela deixa margem para não poucas questões. Por exemplo, não nos
diz em quantas informações a estimativa se baseia, nem tampouco nos informa sobre o ta-
manho possível do erro.

Estimação por intervalo
A estimação por pontos de um parâmetro não possui uma medida do possível erro cometido
na estimação, daí surge a idéia de construir os intervalos de confiança, que são baseados
na distribuição amostral do estimador pontual.
Uma maneira de expressar a precisão da estimação é estabelecer limites que, com certa
probabilidade, incluam o verdadeiro valor do parâmetro da população. Esses limites são
chamados “limites de confiança”: determinam um intervalo de confiança, no qual deverá
estar o verdadeiro valor do parâmetro. Logo, a estimação por intervalo consiste na fixação
de dois valores tais que (1 – α) seja a probabilidade de que o intervalo, por eles determina-
do, contenha o verdadeiro valor do parâmetro.
α: nível de incerteza ou grau de desconfiança

1 – α: coeficiente de confiança ou nível de confiabilidade.
Portanto, α nos dá a medida da incerteza dessa inferência (nível de significância). Logo, a

partir das informações de amostra, devemos calcular os limites de um intervalo, valores crí-
ticos que em (1 – α)% dos casos inclua o valor do parâmetro a estimar e em α% dos casos
não inclua o valor do parâmetro.
Intervalo de confiança (IC) para a média populacional (µ) quando a Variância (σ2) é
conhecida.
Como se sabe, o estimador de µ é x’. Também é conhecida a distribuição de probabilidade
de x’:
 σ2 
x' ≈ N  µ ;  para as populações infinitas,
 n 
 σ 2  N − n 
x' ≈ N  µ ;    para as populações finitas.
 n  N − 1  
Assim, para o caso de populações infinitas, a variável padronizada de x’ será:

x' − µ
Z =
σ
n

Fixando-se um nível de confiança 1 – α, tem-se:
 
Ou seja: P − Z α ≤ Z ≤ Z α  = 1−α
 
 2 2 
 
 
Substituindo-se o valor de Z, tem-se: P − Z ≤ x'− µ ≤ Z  = 1−α
 α
σ α 
 2 2

 n 
Resolvendo-se as duas inequações para µ, tem-se o intervalo de confiança para a média

populacional (µ) quando a variância (σ2) é conhecida:
 σ σ 
P x'− Z α ≤ µ ≤ x'+ Z α = 1−α
 2 n 2 n 
Como poderá ser verificado, a aplicação da fórmula é extremamente simples. Fixa-se o valor
de 1 – α, ou (1 – α)100= %, e observa-se na tabela de distribuição normal padrão o valor
das abscissas que deixam α/2 em cada uma das caudas. Com os valores de x’ (média a-
mostral), σ=desvio padrão da população, que neste caso é conhecido, e n (tamanho da a-
mostra), constrói-se o intervalo.
Para o caso de populações finitas, usa-se a seguinte fórmula:
 σ N −n σ N −n
P x'− Z α ≤ µ ≤ x'+ Z α  = 1−α
 2 n N −1 2 n N − 1 

Exemplo 8.2
A duração da vida de uma peça de equipamento é tal que σ =5 horas. Foram amostradas
100 dessas peças, obtendo-se a média de 500 horas. Deseja-se construir um intervalo de
confiança para a verdadeira duração média da peça com um nível de 95%.
Solução:
σ = 5; n = 100 x’ = 500 (1 – α)100=95%
o gráfico da distribuição normal padrão será:
2,5%
95% 2,5%
-1,96 1,96
lembre-se que para descobrir a abscissa 1,96, entrou-se na tabela de distribuição normal
padronizada com o valor 0,475 = 47,5, já que a tabela é de faixa central.
Substituindo na fórmula:
 σ σ 
P x'− Z α ≤ µ ≤ x'+ Z α  = 1−α
 2 n 2 n 
 5 5 
P 500 − 1,96 ≤ µ ≤ 500 + 1,96  = 95%
 100 100 
Efetuando os cálculos temos:

P(499,02 ≤ µ ≤ 500,98) = 95%
8.3. Testes de Hipóteses

Trata-se de uma técnica para se fazer inferência estatística. Ou seja, a partir de um teste de
hipóteses realizado com os dados amostrais, pode-se fazer inferências sobre a população.

Principais conceitos
Hipóteses Estatística – Trata-se de uma suposição quanto ao valor de um parâmetro popu-

lacional, ou quanto à natureza da distribuição de probabilidade de uma variável populacio-
nal. São exemplos de hipóteses estatísticas:
a) Os chips da marca A têm vida média H: µ = µ0;
b) O nível de inteligência de uma população de universitários é H: µ = µ;

c) O aço produzido pelo processo A é mais duro que o aço produzido pelo processo B: µA >
µB;
d) A altura média da população brasileira é de 1,65m, isto é: H: µ=1,65m;

e) A variância populacional dos salários vale R$ 5.0002, isto é: H: σ2=5.0002;
f) A proporção de paulistas com a doença X é de 40 %, ou seja: H: p=0,40;
g) A distribuição dos pesos dos alunos da nossa faculdade é normal;
h) A chegada de navios ao porto de Santos é descrita por uma distribuição de Poisson.
Formulamos duas hipóteses básicas:
Ho: hipótese nula ou da existência;

H1: hipótese alternativa.
Testamos hipóteses para tomarmos uma decisão entre duas alternativas. Por essa razão, o
Teste de Hipótese é um Processo de Decisão Estatística.
Tipos de Hipótese – Designa-se por H0, chamada hipótese nula, a hipótese estatística a ser
testada, e por H1 a hipótese alternativa. A hipótese nula expressa uma igualdade, enquanto
a hipótese alternativa é dada por uma desigualdade.
Exemplo 8.3
H 0 : µ = 1,65m
 para testes bilaterais (dá origem a um teste bicaudal)
H 1 : µ ≠ 1,65m 
H 0 : µ = 1,65m
 para testes unilaterais à direita (dá origem a um teste unilateral à direita)
H 1 : µ > 1,65m 
H 0 : µ = 1,65m
 para testes unilaterais à esquerda (dá origem a um teste unicaudal à esquerda)
H 1 : µ < 1,65m 

O procedimento padrão para a realização de um Teste de Hipóteses é o seguinte:
Definem-se as hipóteses do teste: nula e alternativa;
Fixa-se um nível de significância α;
Levanta-se uma amostra de tamanho n e calcula-se uma estimativa θ’0 do parâmetro θ;
Usa-se para cada tipo de teste uma variável cuja distribuição amostral do estimador dos
parâmetros seja a mais concentrada em torno do verdadeiro valor do parâmetro;
Calcula-se com o valor do parâmetro θ0, dado por H0, o valor crítico, valor observado na
amostra ou valor calculado (Vcalc);
Fixa-se duas regiões: uma de não rejeição de H0 (RNR) e uma de rejeição de H0 ou críti-
ca (RC) para o valor calculado, ao nível de risco dado;
Se o valor observado (Vcalc) ∈ Região de Não Rejeição, a decisão é a de não rejeitar H0;
Se Vcalc ∈ Região Crítica, a decisão é a de rejeitar H0.
Devemos observar que quando se fixa α, determinamos para os testes bilaterais, por exem-
plo, valores críticos (tabelados), Vα, tais que:
P(|Vcalc|< Vα)=1 – α → RNR
P(|Vcalc| ≥ Vα)= α → RC
Testes de Hipóteses para a Média de Populações normais com variâncias (σ2)

conhecidas
Exemplo 8.4 – Testes Bilaterais
De uma população normal com variância 36, toma–se uma amostra casual de tamanho 16,
obtendo-se x’=43. Ao nível de 10%, testar as hipóteses:
H 0 : µ = 45

H1 : µ ≠ 45
Solução: Como o teste é para média de populações normais com variância conhecida, usa-
remos a variável Z: N(0,1) como critério.
σ2=36 x’=43 n=16
x '− µ H 0 σ
Z= σ x' =
σx '
´ n

Como o teste é bilateral e α =10%, a Região de Não Rejeição, (RNR), é:
P(|Z|< Zα)=1 – α → P(|Z|<1,64)=0,90
Zα=Z5%=1,64
E a Região de Rejeição (RC) é dada por:
P ( Z ≥ Zα ) = α → P ( Z ≥ 1,64) = 0,10
Como Zcalc=–1,33
Temos que Zcalc ∈ RNR
Logo, a decisão é não rejeitarmos H0, isto é, a média é de 45, com 10% de risco de não re-
jeitarmos uma hipótese falsa.
Exemplo 8.5 – Testes Unilateral (Monocaudal) à Esquerda

Uma fábrica anuncia que o índice de nicotina dos cigarros da marca X apresenta-se abaixo
de 26 mg por cigarro. Um laboratório realiza 10 análises do índice obtendo: 26, 24, 23, 22,
28, 25, 27, 26, 28, 24. Sabe-se que o índice de nicotina dos cigarros da marca X se distribui
normalmente com variância 5,36 mg2. Pode-se aceitar a afirmação do fabricante, ao nível
de 5%?
H 0 : µ = 26

 H1 : µ < 26

∴RNR= (–1,64; +∞)
∴RC = (–∞; –1,64]
∴Zcalc ∈ RNR
Não se rejeita H0, isto é, ao nível de 5% podemos concluir que a afirmação do fabricante é
falsa.
Exemplos 8.6 – Testes Unilateral (Monocaudal) à Direita

Um fabricante de lajotas de cerâmica introduz um novo material em sua fabricação e acredi-
ta que aumentará a resistência média, que é de 206 kg. A resistência das lajotas tem distri-
buição normal, com desvio padrão de 12 kg. Retira-se uma amostra de 30 lajotas, obtendo-
se X’ =210 kg. Ao nível de 10%, pode o fabricante aceitar que a resistência média de suas
lajotas tenha aumentado?
H 0 : µ = 206

H1 : µ > 206
∴RNR=(–∞; 1,28)
∴RC = [1,28; +∞)
∴Zcalc ∈ RC
Como Zcalc > Zα, rejeita-se H0, isto é, ao nível de 10% o fabricante pode concluir que a resis-
tência média de suas lajotas aumentou.
Erros de Decisão
Tipos de Erro – Há dois tipos possíveis de erro ao testar uma hipótese estatística. Pode-se
rejeitar uma hipótese quando ela é, de fato, verdadeira, ou aceitar uma hipótese quando ela
é, de fato, falsa. A rejeição de uma hipótese verdadeira é chamada “erro tipo I”. A aceitação
de uma hipótese falsa constitui um “erro tipo II”.
As probabilidades desses dois tipos de erros são designadas, respectivamente, por α e β.
A probabilidade α do erro tipo I é denominada “nível de significância” do teste.

Resumindo:
Realidade
H0 verdadeira H0 falsa
Aceitar H0 Decisão Correta (1–α) Erro tipo II (β )

Decisão
Rejeitar H0 Erro tipo I (α) Decisão Correta (1 – β )
Observe que o erro tipo I só poderá ser cometido se, se rejeitar H0; e o erro do tipo II, quan-
do se aceitar H0.
O objetivo, obviamente, é reduzir ao mínimo as probabilidades dos dois tipos de erros. Infe-
lizmente, essa é uma tarefa difícil porque, para uma amostra de determinado tamanho, a
probabilidade de se incorrer em um erro tipo II aumenta à medida que diminui a probabilida-
de do erro I. E vice-versa. A redução simultânea dos erros poderá ser alcançada pelo au-
mento do tamanho da amostra.

Capítulo 9.
Correlação e Regressão Linear
Em muitas situações, torna-se interessante e útil estabelecer uma relação entre duas
ou mais variáveis. A matemática estabelece vários tipos de relações entre variáveis,
por exemplo, as relações funcionais e as correlações.
Relações Funcionais
São relações matemáticas expressas por sentenças matemáticas, cujos exemplos apresen-
tamos a seguir:
Área do retângulo (A=a.b) é a relação entre os lados do retângulo;
Densidade de massa (dm= m/v) é a relação entre a massa e o volume de um corpo;

Perímetro de uma circunferência (C=2πR) é a relação entre o comprimento da circunfe-
rência e o valor do raio.
Relações Estatísticas e Correlações
São relações estabelecidas após uma pesquisa. Com base nos resultados da pesquisa, são
feitas comparações que eventualmente podem conduzir (ou não) à ligação entre as variá-
veis.
Exemplo: relação entre a idade e a estatura de uma criança, ou a relação entre a classe
social de uma pessoa e o número de viagens por ela realizado.
No estudo estatístico, a relação entre duas ou mais variáveis denomina-se correlação. A
utilidade e importância das correlações entre duas variáveis podem conduzir à descoberta
de novos métodos, cujas estimativas são vitais em tomadas de decisões.
9.1. Diagrama de dispersão

O diagrama de dispersão é um gráfico cartesiano em que cada um dos eixos corresponde
às variáveis correlacionadas. A variável dependente (Y) situa-se no eixo vertical e o eixo das
abscissas é reservado para a variável independente (X). Os pares ordenados formam uma
nuvem de pontos.

A configuração geométrica do diagrama de dispersão pode estar associada a uma linha reta
(correlação linear), uma linha curva (correlação curvilínea) ou, ainda, ter os pontos dispersos
de maneira que não definam nenhuma configuração linear; nessa última situação, não há
correlação.
Figura 9.1. Diagramas de dispersão
100 18
90 16
80 14
70
12
60
10
50
8
40
30 6
20 4
10 2
0 0
0 1 2 3 4 5 6 0 1 2 3 4 5
Correlação Linear Correlação Curvilínea
9.2. Correlação Linear

Correlação linear é uma correlação entre duas variáveis, cujo gráfico aproxima-se de uma
linha. É uma linha de tendência, porque procura acompanhar a tendência da distribuição de
pontos, que pode corresponder a uma reta ou a uma curva. Por outro lado, é, também, uma
linha média, porque procura deixar a mesma quantidade de pontos abaixo e acima da linha.
Figura 9.2. Diagramas de dispersão de diversos tipos de correlação.
25 100
90
20 80
70
15 60
50
10 40
30
5 20
10
0 0
0 1 2 3 4 5 6 0 1 2 3 4 5 6
Correlação linear negativa Correlação linear positiva
8,5 18
8 16
14
7,5
12
7 10
6,5 8
6
6
4
5,5 2
5 0
0 2 4 6 8 10 12 14 0 1 2 3 4 5
Não há correlação Correlação curvilínea direta

Para definir se a correlação entre as variáveis corresponde a uma linha reta ou a uma curva,
pode-se utilizar modos qualitativos ou quantitativos.
No modo qualitativo, vai imperar o “bom senso” do pesquisador para verificar qual o grau de
intensidade na correlação entre as variáveis; isso significa o estabelecimento de uma rela-
ção numérica que medirá o nível da correlação.
9.3. Coeficiente de Correlação Linear (r)

O coeficiente de correlação linear pode ser apresentado como uma medida de correlação,
pois tem como objetivo indicar o nível de intensidade que ocorre na correlação entre as vari-
áveis. O coeficiente de correlação linear pode ser positivo ou negativo. O sinal positivo do
coeficiente de correlação linear indica que o sentido da correlação corresponde a uma reta
de inclinação descendente, e o sinal negativo corresponde a uma reta de inclinação ascen-
dente. Uma das formas de se medir o coeficiente de correlação linear foi desenvolvido por
Pearson e recebe o nome de coeficiente de correlação de Pearson. O coeficiente de corre-
lação de Pearson mede o grau de ajustamento dos valores em torno de uma reta.
Coeficiente de Correlação de Pearson (r):
n∑ xi yi − (∑ xi )(∑ yi )
r=
[n∑ x 2
i
2
][
− (∑ xi ) * n∑ yi2 − (∑ yi )
2
]
Temos
r = o coeficiente de Pearson
n = o número de observações
xi = variável independente
yi =variável dependente
O valor do coeficiente de correlação r tem a variação entre +1 e –1, ou seja, está limitado
entre os valores do Intervalo [–1,+1].
r = +1 (correlação positiva entre as variáveis);
r = – 1 (correlação perfeita negativa entre as variáveis);
r = 0 (não há correlação entre as variáveis ou, ainda, a correlação não é linear, caso exis-
ta).
Quanto mais próximo o valor de r estiver do valor “1”, mais forte a correlação linear.
Quanto mais próximo o valor de r estiver do valor “0”, mais fraca a correlação linear.

Em geral, multiplica-se o valor de r por 100; dessa forma, o resultado passa a ser expresso
em porcentagem. Na prática, estabelecem-se critérios para verificar os diversos níveis do
fraco ao forte, chegando até o perfeito:
0< |r| <0,3: a correlação é fraca e fica difícil estabelecer relação entre as variáveis. Em
porcentagem: 0< |r| < 30%;
0,3 ≤ |r| < 0,6: a correlação é fraca, porém, podemos considerar a existência de relativa
correlação entre as variáveis. Em porcentagem: 30% ≤ |r| < 60%;
0,6 ≤ |r| <1: a correlação é de média para forte; a relação entre as variáveis é significati-
va, o que permite coerência com poucos conflitos na obtenção das conclusões. Em por-
centagem: 60% ≤ |r| ≤ 100 %.
Exemplo 9.1
Uma pesquisa pretende verificar se há correlação significativa entre o peso total do lixo des-
cartado, por dia, numa empresa com o peso do papel contido nesse lixo.
Hotel H1 H2 H3 H4 H5 H6 H7 H8 H9 H10
Peso total 10,47 19,85 21,25 24,36 27,38 58,09 33,61 35,75 38,33 49,14
Peso do papel 2,43 5,12 6,88 6,22 8,84 8,76 7,54 8,47 9,55 11,43
De acordo com os dados, fazemos a representação gráfica. Os pares ordenados formam o

diagrama de dispersão.
Figura 9.3. Correlação entre o peso total do lixo descartado

e o peso do papel contido nesse lixo
14
12
10
Peso do papel
0
10 20 30 40 50 60 70
Peso total do lixo

Para se verificar o grau de correlação entre as variáveis, calcula-se o coeficiente de correla-
ção linear pela fórmula do coeficiente de correlação de Pearson:
n∑ xi yi − (∑ xi )( yi )
r=
[n∑ x 2
i
2
][
− (∑ xi ) * n∑ yi2 − (∑ yi )
2
]
Peso total (xi) Peso papel (yi) xi yi xi2 yi2
H1 10,47 2,43 25,44 109,62 5,90
H2 19,85 5,12 101,63 394,02 26,21
H3 21,25 6,88 146,20 451,56 47,33
H4 24,36 6,22 151,52 593,41 38,69
H5 27,38 8,84 242,04 749,66 78,15
H6 28,09 8,76 246,07 789,05 76,74
H7 33,61 7,54 253,42 1129,63 56,85
H8 35,73 8,47 302,63 1276,63 71,74
H9 38,33 9,55 366,05 1469,19 91,20
H10 49,14 11,43 561,67 2414,74 130,64
∑ 288,21 75,24 2396,68 9377,52 623,47
n ∑ xi yi − (∑ xi )(∑ yi )
r=
[n∑ x 2
i
2
][
− (∑ xi ) * n ∑ yi2 − (∑ yi )
2
]
10 * 2396,68 − 288,21 * 75,24
r=
[10 * 9377,52 − ( 288,21) 2 ] * [10 * 623,47 − (75,24) 2 ]
23966,8 − 21684,9 2281,83 2281,83
r= = = = 0,9206
[93775,2 − 83065] * [6234,7 - 5661,1] 10 710,21 * 573,59 2478,57
r = 0,921 ou r = 92,1%
Observamos, assim: 0,6 ≤ r ≤ 1 . Esse resultado indica que há uma forte correlação entre
as variáveis ou, ainda, que a correlação entre as duas variáveis é bastante significativa.
Nesse caso, podemos concluir haver coerência na afirmação de que existe correlação entre
o peso total do lixo descartado e o peso do papel contido nesse lixo.

9.4. Regressão – Reta de regressão
(ou reta de mínimos quadrados ou reta de ajuste)
A correlação linear é uma correlação entre duas variáveis, cujo gráfico aproxima-se de uma
linha. O gráfico cartesiano que representa essa linha é denominado diagrama de dispersão.
Para poder avaliar melhor a correlação entre as variáveis, é interessante obter a equação da
reta; essa reta é chamada de reta de regressão e a equação que a representa é a equação
de regressão. O diagrama de dispersão é construído de acordo com os dados amostrais de
n observações e a equação de regressão é dada pela expressão:
Y= aX + b → Y’ = aX + b
X é a variável independente
Y → Y” é a variável dependente; na verdade, é a variável correlacionada com a variável X e
sobre a qual se obtém um valor estimado.
Esse tipo de notação, de Y para Y’, caracteriza que não se trata de uma relação funcional
para a determinação da reta, e sim de uma relação estatística, em que a distribuição está
baseada em estimativas de dados colhidos por amostragem.
Sendo a e b os parâmetros de equação da reta, esses podem ser calculados por meio das
fórmulas:
n ∑ xi yi − ∑ xi * ∑ yi
a= b = y − ax
n ∑ xi2 − (∑ xi ) 2
Sendo:
n = número de observações dos dados amostrais
y = valor médio da variável y; o cálculo faz-se pela expressão y =

∑ yi
n
x = valor médio da variável x; o cálculo faz-se pela expressão x =

∑ xi
n
Exemplo 9.2
Determine a equação da reta de regressão do exemplo anterior, que trata de uma pesquisa
entre o peso total do lixo descartado por dia com o peso do papel contido nesse lixo.
Para a obtenção da equação da reta de regressão, elabora-se inicialmente uma tabela con-
tendo nas colunas as variáveis dependentes (yi), as independentes (xi) e os produtos xiyi e
xi2.

Cálculo do parâmetro a da equação da reta:
n ∑ xi yi − ∑ xi *∑ yi 10 * 2396 ,68 − 288 * 75,24 23996,8 - 21684,9
a= = =
n∑ xi2 − ( ∑ xi ) 2
10 * 9377 ,52 − ( 288,21) 2 93775,2 - 83065
2281,83
a= = 0,213
10710,2
Cálculo do parâmetro b da equação da reta:

75,24 288,21
y= = 7,52 e x= = 28,82
10 10
b = y − a x = 7,52 - 0,213 * 28,82 = 7,52 - 6,14 = 1,38
Uma vez calculados os parâmetros a e b, pode-se escrever a equação da reta:

Y’ = 0,213 X + 1,38
Para o traçado de uma reta, basta que se conheça dois de seus pontos. Assim, com base
na equação da reta acima, pode-se estabelecer dois pontos para X e Y’.
Para X = 0, temos Y’ = 1,38

Para X = 50, temos Y’ = 12,03
De acordo com os pontos P1(0;1,38) e P2(50;12,03), pode-se traçar a reta de regressão.
Figura 9.4. Correlação entre o peso total do lixo descartado

e o peso do papel contido nesse lixo
14
y = 0,2131x + 1,3836
12
10
0
0 10 20 30 40 50 60

Com base no conhecimento da equação da reta, pode-se interpolar e extrapolar valores.
Interpolação: a interpolação ocorre quando o valor considerado pertence ao intervalo da
tabela, porém, não figura entre os dados coletados.
Supondo-se o valor 15 kg para o peso total do lixo descartado, pode-se estimar o peso
de papel contido nesse lixo. Uma vez que 15 kg não é um dado coletado e, conseqüen-
temente, não pertence à tabela de dados, utiliza-se a equação da reta para determinar o
valor correspondente ao peso do papel.
Para 15 kg de lixo descartado, estima-se que haja 4,58 kg de papel contido nesse lixo.
Este resultado foi obtido utilizando a equação da reta Y’ = 0,213 X + 1,38, substituído o
valor de x = 15.
Extrapolação: a extrapolação ocorre quando o valor considerado não pertence ao interva-

lo da tabela, e também não figura entre os dados coletados.
Suponha que o peso do lixo descartado seja de 60 kg. Esse valor não é um dado coleta-
do e nem se encontra dentro do intervalo [10,47, 49,14]. Essa situação é semelhante à
anterior e utiliza-se a equação de reta para determinar o peso do papel.
Para 60 kg de lixo descartado, estima-se, por extrapolação, que haja 14,16 kg de papel
contido nesse lixo.

Anexos
Anexo A.
TNA – Tabela de Números Aleatórios
COLUNA 1 5 9 13 17 21 25 29 33 37 41 45 49
LINHA
01 9486 9821 6074 1432 0995 0157 0071 9871 6678 0140 9522 0995 1735
02 3155 9878 3359 8244 8952 0084 1558 4775 1699 1652 2555 4765 2709
03 6136 2824 6030 4256 3870 5725 2204 5318 8337 3867 6184 2018 3522
04 7249 9182 8669 7423 1768 8147 7285 8390 9134 9863 9486 9821 6074
05 0071 9871 6678 0140 9522 0995 1735 1248 9807 1910 3155 9878 3359
06 1558 4775 1699 1652 2555 4765 2709 0561 4397 1135 6136 2824 6030
07 2204 5318 8337 3867 6184 2018 3522 0941 5569 5800 7249 9182 8669
08 7285 8390 9134 9863 9486 9821 6074 1432 0995 0157 0071 9871 6678
09 1735 1248 9807 1910 3155 9878 3359 8244 8952 0084 1558 4775 1699
10 2709 0561 4397 1135 6136 2824 6030 4256 3870 5725 2204 5318 8337
11 3522 0941 5569 5800 7249 9182 8669 7423 1768 8147 7285 8390 9134
12 6074 1432 0995 0157 0071 9871 6678 0140 9522 0995 1735 1248 9807
13 3359 8244 8952 0084 1558 4775 1699 1652 2555 4765 2709 0561 4397
14 6030 4256 3870 5725 2204 2318 8337 3867 6184 2018 3522 0941 5569
15 8669 7423 1768 8147 7285 8390 9134 9863 9486 9821 6074 1432 0995
16 6678 0140 9522 0995 1735 1248 9807 1910 3155 9878 3359 8244 8952
17 1699 1652 2555 4765 2709 0561 4397 1135 6136 2824 6030 4256 3870
18 8337 3867 6184 2018 3522 0941 5569 5800 7249 9182 8669 7423 1768
19 9134 9863 9486 9821 6074 1432 0995 0157 0071 9871 6678 0140 9522
20 9807 1910 3155 9878 3359 8244 8952 0084 1558 4775 1699 1652 2555
21 4397 1135 6136 2824 6030 4256 3870 5725 2204 5318 8337 3867 6184
22 5569 5800 7249 9182 8669 7423 1768 8147 7285 8390 9134 9863 8486
23 0995 0157 0071 9871 6678 0140 9522 0995 1735 1248 9807 1910 3155
24 8952 0084 1558 4775 1699 1652 2555 4765 2709 0568 4397 1135 6136
25 3870 5725 2204 5318 8337 3867 6184 2018 3522 0941 5569 5800 7249
26 7425 3566 6151 4731 6489 2491 2765 8525 7849 1488 8833 2597 1333
27 8961 8175 0879 6945 8029 9119 5990 1063 9444 8320 1740 6131 9907
28 3298 6173 1741 3874 9321 3748 7507 0170 0568 9112 1275 0924 3054
29 2276 4898 2394 1098 4063 5393 0226 8144 4778 7471 1764 4939 8063
30 9557 8114 1576 9767 1486 7161 5606 6295 3503 5050 9549 2500 9666
31 8650 1920 2533 7755 5324 3731 3414 2153 3815 0626 5718 8679 6801
32 2885 8101 1467 0080 7962 5999 9562 5819 1562 6793 2065 0239 8253
33 1841 8626 0344 4344 7446 0867 6157 8935 4413 2363 7187 8980 2488
34 4638 8030 0018 7760 9819 4276 0650 3516 5159 9236 3257 1694 7157
35 1320 7033 1218 5605 4206 2878 0230 1740 4553 8729 5827 7176 8703
36 1488 5803 6790 9368 0465 4819 0065 7633 3950 2109 7027 5824 5057
37 4353 4347 8565 2231 8789 4231 2585 0157 2037 7835 1320 8999 9181
38 7816 5817 9764 8789 7387 2172 0896 1038 6047 9539 3510 1343 8098
39 8600 9738 5415 8426 7152 8705 5829 0164 8330 9152 6045 8129 2293
40 1057 1550 8773 3003 4302 4034 2478 1078 0429 7189 0778 3260 5969

Anexo B.
Tabela da Curva Normal – (Faixa Central)
Distribuição Normal
Z 0 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
0,00 0,0000 0,0040 0,0080 0,0120 0,0160 0,0199 0,0239 0,0279 0,0319 0,0359
0,10 0,0398 0,0438 0,0478 0,0517 0,0557 0,0596 0,0636 0,0675 0,0714 0,0753
0,20 0,0793 0,0832 0,0871 0,0910 0,0948 0,0987 0,1026 0,1064 0,1103 0,1141
0,30 0,1179 0,1217 0,1255 0,1293 0,1331 0,1368 0,1406 0,1443 0,1480 0,1517
0,40 0,1554 0,1591 0,1628 0,1664 0,1700 0,1736 0,1772 0,1808 0,1844 0,1879
0,50 0,1915 0,1950 0,1985 0,2019 0,2054 0,2088 0,2123 0,2157 0,2190 0,2224
0,60 0,2257 0,2291 0,2324 0,2357 0,2389 0,2422 0,2454 0,2486 0,2517 0,2549
0,70 0,2580 0,2611 0,2642 0,2673 0,2704 0,2734 0,2764 0,2794 0,2823 0,2852
0,80 0,2881 0,2910 0,2939 0,2967 0,2995 0,3023 0,3051 0,3078 0,3106 0,3133
0,90 0,3159 0,3186 0,3212 0,3238 0,3264 0,3289 0,3315 0,3340 0,3365 0,3389
1,00 0,3413 0,3438 0,3461 0,3485 0,3508 0,3531 0,3554 0,3577 0,3599 0,3621
1,10 0,3643 0,3665 0,3686 0,3708 0,3729 0,3749 0,3770 0,3790 0,3810 0,3830
1,20 0,3849 0,3869 0,3888 0,3907 0,3925 0,3944 0,3962 0,3980 0,3997 0,4015
1,30 0,4032 0,4049 0,4066 0,4082 0,4099 0,4115 0,4131 0,4147 0,4162 0,4177
1,40 0,4192 0,4207 0,4222 0,4236 0,4251 0,4265 0,4279 0,4292 0,4306 0,4319
1,50 0,4332 0,4345 0,4357 0,4370 0,4382 0,4394 0,4406 0,4418 0,4429 0,4441
1,60 0,4452 0,4463 0,4474 0,4484 0,4495 0,4505 0,4515 0,4525 0,4535 0,4545
1,70 0,4554 0,4564 0,4573 0,4582 0,4591 0,4599 0,4608 0,4616 0,4625 0,4633
1,80 0,4641 0,4649 0,4656 0,4664 0,4671 0,4678 0,4686 0,4693 0,4699 0,4706
1,90 0,4713 0,4719 0,4726 0,4732 0,4738 0,4744 0,4750 0,4756 0,4761 0,4767
2,00 0,4772 0,4778 0,4783 0,4788 0,4793 0,4798 0,4803 0,4808 0,4812 0,4817
2,10 0,4821 0,4826 0,4830 0,4834 0,4838 0,4842 0,4846 0,4850 0,4854 0,4857
2,20 0,4861 0,4864 0,4868 0,4871 0,4875 0,4878 0,4881 0,4884 0,4887 0,4890
2,30 0,4893 0,4896 0,4898 0,4901 0,4904 0,4906 0,4909 0,4911 0,4913 0,4916
2,40 0,4918 0,4920 0,4922 0,4925 0,4927 0,4929 0,4931 0,4932 0,4934 0,4936
2,50 0,4938 0,4940 0,4941 0,4943 0,4945 0,4946 0,4948 0,4949 0,4951 0,4952
2,60 0,4953 0,4955 0,4956 0,4957 0,4959 0,4960 0,4961 0,4962 0,4963 0,4964
2,70 0,4965 0,4966 0,4967 0,4968 0,4969 0,4970 0,4971 0,4972 0,4973 0,4974
2,80 0,4974 0,4975 0,4976 0,4977 0,4977 0,4978 0,4979 0,4979 0,4980 0,4981
2,90 0,4981 0,4982 0,4982 0,4983 0,4984 0,4984 0,4985 0,4985 0,4986 0,4986
3,00 0,4987 0,4987 0,4987 0,4988 0,4988 0,4989 0,4989 0,4989 0,4990 0,4990
3,10 0,4990 0,4991 0,4991 0,4991 0,4992 0,4992 0,4992 0,4992 0,4993 0,4993
3,20 0,4993 0,4993 0,4994 0,4994 0,4994 0,4994 0,4994 0,4995 0,4995 0,4995
3,30 0,4995 0,4995 0,4995 0,4996 0,4996 0,4996 0,4996 0,4996 0,4996 0,4997
3,40 0,4997 0,4997 0,4997 0,4997 0,4997 0,4997 0,4997 0,4997 0,4997 0,4998
3,50 0,4998 0,4998 0,4998 0,4998 0,4998 0,4998 0,4998 0,4998 0,4998 0,4998
3,60 0,4998 0,4998 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999
3,70 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999
3,80 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999
3,90 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000

Anexo C.
Apêndice Matemático
1. Números aproximados e Arredondamento de dados:
A Associação Brasileira de Normas técnicas (ABNT) estabelece regras fixas de arredonda-

mento na numeração decimal, em uso na atualidade. Essas regras estão de acordo com a
Resolução 886/66 do IBGE.
1.1. Quando o primeiro algarismo a ser abandonado é 0,1,2,3 ou 4, fica inalterado o último
algarismo a permanecer.
Ex: 83,34 passa a 83,3 ; 44,13 passa a 44,1
1.2. Quando o primeiro algarismo a ser abandonado é 6,7,8, ou 9, aumenta-se de uma uni-
dade ao algarismo a permanecer.
Ex: 43,67 passa a 53,7 ; 63,19 passa a 63,2 ; 87,99 passa a 88,0
1.3. Quando o primeiro algarismo a ser abandonado é 5, há duas soluções:

a) Se ao 5 seguir em qualquer casa um algarismo diferente de zero, aumenta-se uma
unidade ao algarismo a permanecer.
Ex: 2,352 passa a 2,4 ; 25,6501 passa a 25,7 ; 26,250002 passa a 26,3
b) Se o 5 for o último algarismo ou se ao 5 só se seguirem zeros, o último algarismo a

ser conservado só será aumentando de uma unidade se for ímpar.
Exemplos:
24,75 passa a 24,8
24,65 passa a 24,6
24,75000 passa 24,8
24,6500 passa a 24,6
Obs.: Não devemos nunca fazer arredondamento sucessivos. Exemplo: 17,3452 passa a
17,3 e não para 17,35 e depois para 17,4.

2. Cálculo de Porcentagem
Porcentagem são razões em que um valor total está associado a uma quantidade de 100%
e, pro meio de uma regra de três, podemos estabelecer a correspondência entre uma parce-
la do valor total e seu valor percentual.
Total → 100 %
Parcela → x%
Exemplo: a afirmação de que ente os principais mercados emissores de turistas para o Bra-
sil (em 1998) encontra-se a Argentina, com 31%, significa que a cada 100 turistas que en-
tram no Brasil 31 são argentinos. Se entrarem 1200 turistas no Brasil, qual a estimativa so-
bre a quantidade de argentinos?
Consideremos o valor 100 para base de comparação.

100% → 1200
31% → X ∴ X = 372 argentinos

Anexo D.
Estudo de Caso
Cenário
Joana trabalha em uma companhia aérea. Por responder pelo SAC (suporte de atendimento
ao consumidor), o diretor de sua área solicitou-lhe que elaborasse um estudo comparativo
dos serviços prestados pela empresa com os similares da concorrência. Joana decidiu in-
vestigar os passageiros de três companhias aéreas – usuários de vôos locais desembarca-
dos em Guarulhos. Para definir e levantar as informações mais relevantes para seu estudo,
ela compõe um questionário no qual indaga sobre a qualidade de alguns dos serviços ofere-
cidos pelas empresas de aviação em geral – como alimentação de bordo, atendimento no
check-in, trabalho das comissárias, pontualidade de vôo etc. Os entrevistados expressaram
seu grau de satisfação com as empresas pelas quais viajaram conferindo-lhes notas entre 0
e 10. Os 132 passageiros entrevistados (36 da Cia. A, 57 da B e 39 da C) atribuíram às res-
pectivas empresas os graus de satisfação expressos no Quadro 3.1.
Quadro 1. Notas atribuídas às companhias por seus passageiros
4,4 4,5 4,6 4,7 4,8 4,8 4,9 4,9 5,0 5,0 5,1 5,1
Cia. A
5,2 5,2 5,2 5,3 5,3 5,3 5,3 5,3 5,4 5,4 5,4 5,4
5,5 5,5 5,6 5,6 5,7 5,8 5,8 5,9 6,0 6,1 6,2 6,3
3,1 3,1 3,2 3,2 3,3 3,3 3,4 3,5 3,5 3,6 3,6 3,7
Cia. B 3,7 3,8 3,8 3,9 3,9 3,9 4,0 4,0 4,0 4,0 4,1 4,1
4,1 4,2 4,2 4,3 4,3 4,4 4,4 4,5 4,5 4,5 4,6 4,6
4,6 4,7 4,7 4,7 4,7 4,8 4,8 4,9 4,9 5,0 5,0 5,1
5,1 5,2 5,2 5,3 5,3 5,4 5,5 5,6 5,7
3,7 3,8 3,9 3,9 4,0 4,0 4,1 4,1 4,2 4,2 4,3 4,3
Cia. C
4,3 4,4 4,4 4,4 4,5 4,5 4,5 4,6 4,6 4,6 4,7 4,7
4,7 4,7 4,8 4,8 4,8 4,8 4,8 4,9 4,9 4,9 4,9 5,0
5,0 5,0 5,1
Joana precisa resumir esses dados antes de apresentá-los à sua diretoria. O resumo deve
lhe dar o máximo de informação e possibilitar-lhe a comparação das empresas. Primeiro
Joana pode resumir as notas em tabelas de distribuição de freqüências simples e acumula-

das. Dessas tabelas ela pode construir diversos gráficos, como os histogramas, os polígo-
nos de freqüências e as ogivas. Joana pode determinar uma série de medidas que lhe darão
informações complementares a essas.
Descrevendo Dados
Apesar de em geral uma imagem valer por mil palavras, também é útil encontrar números
que descrevam os conjuntos de dados, uma vez que os gráficos podem ser afetados pela
escala adotada e, ainda que permitam boa visualização do conjunto de dados, sua interpre-
tação tende a ser quase sempre subjetiva. Além disso, alguns descritores numéricos deter-
minados de dados amostrais permitem inferir propriedades e parâmetros populacionais.
Os dados são coletados da própria população ou de suas amostras. As medidas descritivas
calculadas a partir daí são chamadas respectivamente estatísticas ou parâmetros.
Estatística é uma medida derivada de dados amostrais.
Parâmetro é uma medida proveniente de dados populacionais.
Geralmente as estatísticas amostrais são representadas por letras latinas e os parâmetros

populacionais, por letras gregas.
Existem várias medidas descritivas. As mais comuns são as medidas de centro e as medi-
das de dispersão. Dito de modo geral, as medidas de centro apontam o meio da distribuição
dos dados, e as de dispersão, o espalhamento dos valores individuais em torno do centro.
Exemplos típicos de medidas centro são a média, a mediana e a moda. Como indicativas da
dispersão têm-se a amplitude, a variância e o desvio-padrão.
Para estimar o grau da satisfação de usuários, a empresa pode adotar o centro dos graus
expressos por clientes individuais. Se quiser avaliar a regularidade dos serviços que presta,
pode usar a dispersão em torno da média da satisfação dos mesmos clientes. Digamos que
o grau médio de satisfação dos usuários da companhia em que Joana trabalha é 5,0. Se o
cliente mais satisfeito deu à empresa a nota 4,5 e o mais satisfeito, nota 5,5, então as notas,
por estarem bem concentradas em torno do centro, são sinal de atendimento bem regular.
No entanto, se o cliente mais insatisfeito tiver dado uma nota 1,0 e o mais satisfeito, uma
nota 9,0, o alto espalhamento das notas em torno do centro será indício de atendimento
muito irregular, dirá que a empresa tanto tem funcionários eficientes e prestativos quanto
ineficientes e grosseiros.

Medidas de Centro
Para a maioria das situações verificadas no cotidiano de uma empresa bastam, como medi-
das de centro, a média aritmética, a mediana e a moda.
Média Aritmética
Para fins de cálculo, entende-se média aritmética como a soma dos valores de um conjunto
de dados dividida pelo número de itens avaliados.
A média aritmética é indicada por µ ou por x , conforme se refira a dados populacionais ou a

valores amostrais. Apesar dessa diferença de notação, o cálculo é feito sempre do mesmo
modo, conforme mostra abaixo.
Form. 1. Média aritmética populacional e amostral
Populacional Amostral
∑x ∑x
µ= x=
N n
em que x é um elemento qualquer do conjunto considerado, N é o total de elementos da

população e n, o total de itens da amostra avaliada.
O arranjo a seguir facilita a obtenção da média de X. Construída a tabela – que lista na pri-
meira coluna os valores dos quais se quer calcular a média aritmética, na segunda, as res-
pectivas freqüências (absolutas ou relativas) e na terceira, o produto dos valores individuais
pelas respectivas freqüências – a média será dada pela divisão do total da última coluna
pelo total da penúltima.
x f xf
. . .
. . .
. . .
Total ∑ f = N (ou n) ∑ xf

Exemplo 1
Determine os graus de satisfação médios das empresas A, B e C.
Agrupando os dados, tem-se:
Empresa A Empresa B Empresa C

x f xf x f xf x f xf
4,4 1 4,4 3,1 2 6,2 3,7 1 3,7
4,5 1 4,5 3,2 2 6,4 3,8 1 3,8
4,6 1 4,6 3,3 2 6,6 3,9 2 7,8
4,7 1 4,7 3,4 1 3,4 4,0 2 8,0
4,8 2 9,6 3,5 2 7,0 4,1 2 8,2
4,9 2 9,8 3,6 2 7,2 4,2 2 8,4
5,0 2 10,0 3,7 2 7,4 4,3 3 12,9
5,1 2 10,2 3,8 2 7,6 4,4 3 13,2
5,2 3 15,6 3,9 3 11,7 4,5 3 13,5
5,3 5 26,5 4,0 4 16,0 4,6 3 13,8
5,4 4 21,6 4,1 3 12,3 4,7 4 18,8
5,5 2 11,0 4,2 2 8,4 4,8 5 24,0
5,6 2 11,2 4,3 2 8,6 4,9 4 19,6
5,7 1 5,7 4,4 2 8,8 5,0 3 15,0
5,8 2 11,6 4,5 3 13,5 5,1 1 5,1
5,9 1 5,9 4,6 3 13,8 Total 39 175,8
6,0 1 6,0 4,7 4 18,8
6,1 1 6,1 4,8 2 9,6
6,2 1 6,2 4,9 2 9,8
6,3 1 6,3 5,0 2 10,0
Total 36 191,5 5,1 2 10,2
5,2 2 10,4
5,3 2 10,6
5,4 1 5,4
5,5 1 5,5
5,6 1 5,6
5,7 1 5,7
Total 57 246,5
Dos totais obtidos resultam as médias:
191,5 246,5 175,8

xA = =5,3194; x B = =4,3246; x C = =4,5077
36 57 39
Uma conclusão possível de se extrair das notas médias atribuídas às companhias é que o
atendimento que a Cia. A presta a seus clientes parece ser melhor que os das empresas B e
C.

Exemplo 2
Um hotel fez um estudo para gerenciar a quantidade de quartos necessários para atender
bem seus clientes. Para estimar o tempo médio de ocupação dos quartos, mediu-se a per-
manência efetiva de uma amostra de dez clientes. Esses tempos anotados foram:
Cliente A B C D E F G H I J
Tempo (min) 59,3 58,6 62,7 65,4 59,0 67,3 62,8 68,1 59,4 63,7
Dos valores registrados infere-se o tempo médio de ocupação dos quartos. A média é dada
por:
59,3 + 58,6 + 62,7 + 65,4 + 59,0 + 67,3 + 62,8 + 68,1 + 59,4 + 63,7
x= = 62,63
10
Tal resultado indica que em média os clientes ocupam os quartos por pouco mais de uma
hora. Disso pode-se inferir facilmente que, se o hotel tem 20 quartos, e se cada um for ocu-
pado em média por duas pessoas, ele atenderá pouco menos de 40 pessoas por hora. Se a
despesa média por pessoa for de R$15,00, seu faturamento por hora estará um pouco abai-
xo de R$600,00.
Exemplo 3
O que ocorria com o tempo médio do hotel mencionado no Exemplo 2 se o cliente denotado
B tivesse ocupado o quarto por apenas dez minutos?
Calculando o tempo médio para a nova condição, tem-se:
59,3 + 10,0 + 62,7 + 65,4 + 59,0 + 67,3 + 62,8 + 68,1 + 59,4 + 63,7
x= = 57,77
10
A suposta “pressa” do cliente B faria a média cair de 62,63 minutos para 57,77. Grosso mo-
do, pode-se dizer que, nessa condição, a expressão um pouco abaixo teria de ser substituí-
da por um pouco acima!
Os resultados dos Exemplos 2 e 3 revelam uma propriedade da média aritmética que é: a
média aritmética sempre é afetada por todos os valores computados.

Exemplo 4
Construa os polígonos de freqüências de satisfação das três companhias aéreas e localize
as respectivas médias.
Cia. Aérea A
6
0
4,4 4,5 4,6 4,7 4,8 4,9 5 5,1 5,2 5,3 5,4 5,5 5,6 5,7 5,8 5,9 6 6,1 6,2
média = 5,319
Figura 1. Polígono de freqüências do grau de satisfação da Cia. A.
Cia. Aérea B
4,5
4
3,5
3
2,5
2
1,5
1
0,5
0
1
7
3,
3,
3,
3,
3,
4,
4,
4,
4,
4,
5,
5,
5,
5,
média = 4,325
Figura 2. Polígono de freqüências do grau de satisfação da Cia. B.

Cia. Aérea C
6
0
3,7 3,8 3,9 4 4,1 4,2 4,3 4,4 4,5 4,6 4,7 4,8 4,9 5 5,1
média = 4,508
Figura 3. Polígono de freqüências do grau de satisfação da Cia. C.
Mediana
Como mostram os exemplos 2 e 3, a média é influenciada por todos os valores da distribui-

ção, e mais fortemente pelos díspares (muito altos ou muito baixos). Mas nem todas as me-
didas são tão sensíveis assim à mudança de valores do conjunto de dados. Uma das medi-
das de centro nessas condições é a mediana.
A mediana simbolizada por md, é o valor central de medidas ordenadas. Naturalmente, para
se obter o centro, ou a mediana, de um conjunto de valores, deve-se ordenar os elementos,
de modo crescente ou decrescente. E, por ser medida de centro do dados, metade dos valo-
res computados é menor que a mediana, e metade é maior. Outra propriedade relevante da
mediana é ela não ser afetada pelos extremos do conjunto de dados, seja lá quais forem os
seus valores. A determinação do centro de uma lista de dados ordenados depende de o
número de itens ser par ou ímpar.
A mediana de um número ímpar de medidas é o valor que cai no meio da distribuição. Pode-
se determinar qual é esse valor dividindo por dois o total de elementos mais um. Por exem-
plo, em um conjunto de 11 valores, a mediana é o sexto elemento ((11+1)/2=6).
A mediana de um número par de medidas é a média aritmética dos valores centrais (neste
caso também se diz que ela é o ponto central entre duas contagens medianas). Para se
saber quais são esses valores divide-se por dois o total de elementos. A mediana é a média
do elemento apontado por esse quociente e o seguinte a ele. Por exemplo, em um conjunto
de 12 valores, a mediana é a média entre o sexto (metade de 12) e o sétimo elemento.

Exemplo 5
Determine as medianas das seguintes distribuições (ordenadas):
a. 32 32 35 36 36 37 38
38
39 39 39 40 40 45 46
b. 32 35 36 36 37 38
38 39
39 39 40 40 42 45
A primeira distribuição compõe-se de 15 medidas. A mediana é o valor colocado na oitava

posição ((15+1)/2=8). Por sinal, os dados foram propositalmente dispostos de forma a facili-
tar a observação de que, das 15 medidas apresentadas, sete estão abaixo da mediana, e
sete estão acima. Logo, a mediana do conjunto A é md = 38.
A segunda distribuição compõe-se de 14 medidas. A mediana é a média dos valores situa-

dos na 7ª (14/2=7) e na 8ª posição. Nessas condições, para os valores fornecidos, tem-se:
38 + 39
md = = 38,5
2
No item b, a disposição gráfica dos dados também permite visualizar que metade dos dados
é inferior à mediana, e metade, superiores a ela, isto é, metade dos valores é menor que
38,5, e metade é maior que 38,5.
Conforme mencionado, a mediana não é afetada pelos extremos do conjunto de dados. As-
sim, no item b do Exemplo 5, a eventual troca de 45 por 95 e de 32 por 13 não modifica a
mediana, que continua sendo md=38,5.
De suas análises, Joana constata que as medianas de satisfação das companhias A e B
estão próximas às respectivas médias de satisfação (5,3 e 4,3, respectivamente). Quanto à
mediana de satisfação da Cia. C, a figura 4 mostra estar ligeiramente acima da média (mé-
dia de 4,5 contra uma mediana de 4,6).

Cia. Aérea C
0
3,7 3,8 3,9 4 4,1 4,2 4,3 4,4 4,5 4,6 4,7 4,8 4,9 5 5,1
média = 4,508 mediana = 4,6
Figura 4. Posições da média e mediana da Cia. C.
Moda
A moda, simbolizada por mo, é a mas simples das medidas de centro: é o valor mais fre-
qüente em uma distribuição, sendo simplesmente o que aparece em maior números de ve-
zes. Seu conceito está muito próximo da idéia de moda da linguagem vulgar, em que estar
na moda significa essencialmente vestir-se como a maioria.
Exemplo 6
Determine a moda da seguinte distribuição:
32 32 35 36 37 38 38 39 39 39 40 40 42 45
O valor que mais ocorre na distribuição é o 39 (aparece três vezes). Logo, a moda é igual a
39.
Por corresponder ao ponto mais alto, a moda é instantaneamente revelada pelos histogra-
mas e polígonos de freqüência das distribuições de dados.

Exemplo 7
Ache a moda das notas atribuídas à Cia. A
Cia. Aérea A
6
0
4,4 4,5 4,6 4,7 4,8 4,9 5 5,1 5,2 5,3 5,4 5,5 5,6 5,7 5,8 5,9 6 6,1 6,2
moda = 5,3
Figura 5. Moda do grau de satisfação da Cia. A.
Em geral, a moda é fácil de identificar. A dificuldade possível é que, para ela, vale tudo: po-
de não existir, pode ser única e pode ser múltipla. Inexiste quando ninguém se destaca,
quando todos os valores são igualmente comuns; é única quando há um elemento de des-
taque, o mais freqüente; é múltipla quando duas ou mais medidas se destacam igualmente,
mas de modo mais acentuado que as demais. Distribuições sem moda alguma são denomi-
nadas retangulares; as com uma moda apenas, unimodais, e as com várias modas, polimo-
dais.
Exemplo 8
Determine a moda da seguinte distribuição:
32 32 32 36 37 38 38 39 39 39 40 40 42 45
Há duas modas, 32 e 39 (esses valores ocorrem três vezes, e mais vezes que quaisquer
outros).

Exemplo 9: Determine a moda das notas atribuídas à Cia. B.
Cia. Aérea B
4,5
4
3,5
3
2,5
2
1,5
1
0,5
0
1
7
3,
3,
3,
3,
3,
4,
4,
4,
4,
4,
5,
5,
5,
5,
bimodal
Figura 6. Distribuição bimodal do grau de satisfação da Cia. B.
Na distribuição das notas da Cia. B há duas modas, 4,0 e 4,7 (essas notas ocorrem quatro
vezes). Ou seja, essa distribuição, assim como a do Exemplo 8, é bimodal.
Exemplo 10
Tome a distribuição do Exemplo 9, mude o último valor de 45 para 55 e determine a moda e
a mediana.
32 32 35 36 37 38 38 39 39 39 40 40 42 55
A moda e a mediana do conjunto de dados assim composto são: mo = 39 e md = 38,5 (média
entre o sétimo e o oitavo elemento). Como a mudança proposta não alterou tais medidas de
centro, pode-se dizer que a moda e a mediana nem sempre são sensíveis a mudanças nos
valores individuais ou nos extremos da distribuição (a mediana é afetada quando se mudam
os termos centrais da distribuição; a moda se altera quando mudam as freqüências dos va-
lores que a definem).
A moda tem algumas propriedades úteis. Exemplo, sua determinação é rápida e fácil. É que,
como basta achar o valor mais freqüente, ela independe da ordenação dos valores, dos ex-
tremos da distribuição e de quaisquer de seus valores intermediários.
A média, a mediana e a moda trazem diferentes informações a respeito do centro dos con-
juntos de dados. Em relação à simetria da distribuição, sabe-se que:
nas distribuições simétricas, a média, a mediana e a moda apontam o mesmo valor;

nas distribuições assimétricas, a média, a mediana e a moda apontam valores distintos
(quanto mais assimétrica a distribuição, mais distantes os valores estão):
- nas assimétricas à esquerda, a moda é maior que a mediana, e a mediana é maior
que a média, isto é, média < mediana < moda;
- nas assimétricas à direita, a moda é menor que a mediana, e a mediana é menor que
a média, isto é, moda < mediana < média.
As figuras 7 a 9 retratam essas condições.
Moda
Mediana
Média
Figura 7. Assimetria à esquerda: µ < md < mo.
Média = Mediana = Moda
Figura 8. Simetria: µ = md = mo
Moda
Mediana
Média
Figura 9. Assimetria à direita: mo < md < µ

Comparando as medidas de centro, Joana observa que a Cia. A tem distribuição quase si-
métrica (a média, a mediana e a moda praticamente coincidem) e a C apresenta distribuição
assimétrica à esquerda, fato que sugere ser relativamente alto o grau de satisfação de seus
clientes.
Medidas de Variabilidade
Embora dêem boa idéia das características dos dados sob análise, as medidas de tendência
central não informam completamente sobre o comportamento dos conjuntos de medidas.
Além de um número que tipifique o centro da distribuição, é importante ter alguma noção da
variabilidade ou flutuação das medidas.
Existem várias medidas que apontam o espalhamento dos dados em torno de determinado
valor. Para muitos propósitos bastam três medidas de dispersão: Amplitude, Variância e o
Desvio-Padrão.
Amplitude
Uma medida simples de dispersão é o intervalo ou amplitude dos dados. Por correspon-
der à diferença entre o maior e o menor valor observado, pode-se escrever:
Amplitude = Maior valor – Menor valor
A amplitude informa a distância entre os extremos dos dados ou de sua distribuição – ra-
zão pela qual costuma ser apresentada citando-se simplesmente o piso e o teto dos da-
dos. Medidas com essa característica têm a virtude de ser de fácil computação: não é
preciso tecer considerações sobre quaisquer outros elementos, está-se desobrigado de
determinar quem são eles, como se distribuem, qual o grau de concentração em torno de
algum ponto; o defeito natural dessa facilidade é abrir mão de informações relevantes,
como sobre o grau concentração ou espalhamento dos dados em torno de algum ponto.
Mas há casos particulares em que ela informa alguma coisa até sobre isso. Para distribu-
ições simétricas, por exemplo, a semiamplitude indica a distância máxima dos dados em
relação ao respectivo centro.
A amplitude cumpre bem seu papel quando aplicada a informações cujo fator relevante é
exatamente o extremo, como no caso das temperaturas diárias (mínima: 19 ºC; máxima:
27 ºC), de marés (baixa-mar: 0,1; preamar:1,6), durações dos dias (nascente: 06h46min;
poente: 19h54min) e estações do ano (verão: de 21-12 a 20-3; inverno: de 21-6 a 21-9).
Mas toda avaliação do espalhamento dos dados é útil, ao menos em uma primeira com-
paração de distintos conjuntos de dados. A comparação das amplitudes das companhias
aéreas avaliadas por Joana – Cia. A: 1,9; Cia. B:2,6; Cia. C:1,4 – sugere que o grau de
satisfação dos usuários da Cia. B é um pouco mais disperso que o apresentado pelos cli-
entes das demais empresas. Seu defeito é não levar em conta o número de observações.

Exemplo 11
Uma loja deseja saber se as reclamações sobre o tempo de espera no atendimento
telefônico de clientes são justificáveis ou não. Uma maostra de 15 chamadas registra os
seguintes tempos de espera:
Cliente 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
Tempo (min) 5,5 10,3 6,6 6,8 9,5 6,7 0,5 9,2 7,6 10,7 9,2 2,9 6,0 8,6 4,5
A amplitude dos tempos é: A = 10,7 – 0,5 = 10,2.
À primeira vista, pode-se supor que, sendo a dispersão do tempo de espera da ordem de
dez minutos, e sendo o maior valor igual a 10,7 minutos, os dados estão bem dispersos, que
o tempo de espera é bem variado. Todavia, um olhar mais atento mostra que há poucos
pequenos tempos de espera e que o piso dos dados está longe do segundo valor, ou seja,
0,5 fica muito afastado de 2,9. Na verdade, a maioria dos tempos de espera está entre cinco
e dez minutos., para um tempo médio de espera em torno de sete minutos.
Um modo razoável de medir a variabilidade dos dados é associá-la a alguma medida de
centro. Pode-se querer saber quanto em média os dados distam de um valor central típico.
Medidas com essa característica são a variância e o desvio-padrão.
Variância
A variância de um conjunto qualquer de dados é determinada pelo formulário a seguir:
Form. 2. Variância populacional e amostral
em que x é um elemento qualquer do conjunto considerado, µ (ou x ) é a média do con-

junto de dados e N (ou n), o total de elementos computados (da população ou amostra).
Uma parte essencial das expressões dadas no Form. 2 é a diferença entre cada valor e a
média aritmética do conjunto. O problema é a soma das diferenças em relação à média
do conjunto ser sempre zero. É para contornar esse resultado monótono e inexpressivo
que a variância considera os desvios elevados ao quadrado.

Desenvolvendo os quadrados expressos no Form. 2 obtêm-se as expressões alternativas
apresentadas no Form. 3 a seguir:
Form. 3. Variância populacional e amostral
Nas fórmulas constantes do Form. 3, a variância só depende do somatório dos valores

computados. Assim, ela é obtida de modo mais rápido e às vezes até mais preciso
(quando o cálculo da média exigir algum arredondamento).
Desvio-Padrão
A variância é uma medida com magnitude distinta da dos dados originais. Para que a
variabilidade seja comparável com os dados que a originam, deve-se expressá-la na
mesma unidade de medida. Isso resulta em uma nova medida de dispersão, dada pela
raiz quadrada positiva da variância. Essa nova medida, denominada desvio-padrão, é
assim definida:
Form. 4. Desvio-padrão populacional e amostral
em que x é um elemento qualquer do conjunto considerado, µ (ou x ) é a média do

conjunto de dados e N (ou n), o total de elementos considerados (tamanho da população
ou amostra).

Glossário
Amostra: é uma subcoleção de elementos extraídos de uma população.
Amostra Com reposição – quando um elemento sorteado puder ser sorteado nova-
mente.
Amostra Sem reposição – quando o elemento sorteado só puder figurar uma única vez
na amostra.
Amostragem – É o processo de escolha da amostra.
Amostragem Aleatória – método de amostragem em que qualquer elemento da popu-

lação tem a mesma chance de ser escolhido para compor a amostra.
Amostragem Aleatória Simples – é um processo para selecionar amostras de tama-

nho “n” dentre as “N” unidades em que foi dividida a população.
Amostra Estratificada – é obtida separando-se as unidades da população em grupos

não superpostos, chamados estratos, e selecionando-se independentemente uma amos-
tra aleatória simples de cada estrato.
Amostragem Intencional – é formada por elementos escolhidos por determinado
critério, ou seja, escolhe-se intencionalmente um grupo de elementos que irão compor a

amostra.
Amostragem não Aleatória – método de amostragem em que os diversos membros da

população não têm a mesma chance de figurar na amostra.
Amostra por Conglomerado – é uma amostra aleatória simples na qual cada unidade
de amostragem é um grupo, ou um conglomerado de elementos.
Amostragem por Cotas – classificação da população em termos de propriedades que

se sabe serem relevantes para a característica a ser estudada.
Amostra Sistemática – é mais fácil de executar e, por isso, está menos sujeita a apre-
sentar erros cometidos pelo entrevistador, freqüentemente proporciona mais informações
por custo unitário.
Amplitude total (A) – é a diferença entre o maior e o menor valor da tabela de distri-
buição.
Área sob a Curva Normal – Área que está entre a curva e a reta-base contendo 100%
ou todos os casos em qualquer distribuição normal dada.
Assimetria – Afastamento da simetria.
Coeficiente de Correlação – Variando em geral entre -1,00 e +1,00, é um número que

expressa tanto a intensidade como a direção da correlação.
Coeficiente de Correlação de Pearson – Coeficiente de correlação para dados interva-

lares.
Correlação – A intensidade e a direção do relacionamento entre duas variáveis.
Correlação Curvilínea – Relação entre X e Y que começa como positiva (ou negativa) e

inverte a direção.
Correlação Linear – Correlação positiva ou negativa, tal que os pontos em um diagra-

ma de dispersão tendem a formar uma linha reta passando pelo centro do gráfico.
Curtose – Forma do pico de uma distribuição.
Curva Normal – Distribuição suave, simétrica, em forma de sino e unimodal.

Decis – dividem a distribuição em 10 partes iguais.
Desvio Padrão – Raiz quadrada da média dos quadrados dos desvios em relação à mé-
dia de uma distribuição. Medida de variabilidade que reflete o desvio típico a contar da
média.
Estatística: é uma medida numérica que descreve uma característica de uma amostra.
Freqüência Absoluta Acumulada (Ni) – é o total das freqüências de todos os valores

inferiores ao limite superior do intervalo de uma dada classe.
Freqüência Absoluta Simples da Classe i (ni) – são os valores que realmente
representam o número de dados de cada classe.
Freqüência Relativa Acumulada (Fi) – é a freqüência acumulada da classe,
dividida pela freqüência total da distribuição.
Freqüências Relativas Simples (fi) – são os valores das razões entre as freqüências
simples e o número total de dados.
Freqüência Relativa Acumulada Crescente (Classe i – Fi) – Fi pode ser entendido

como sendo a percentagem de observações abaixo do limite superior da classe i.
Freqüência Relativa Acumulada Decrescente (classe i – F’i) – F’é a porcentagem de

observações acima do limite inferior da classe i.
Intervalo de 95% de Confiança – Intervalo de valores da média (proporções) dentro

do qual há 95 chances em 100 de a verdadeira média (proporção) populacional se situar.
Intervalo de 99% de confiança – Intervalo de valores da média (proporções) dentro

do qual há 99 chances em 100 de a verdadeira média (proporção) populacional se situar.
Intervalo de Classe – Categoria em uma distribuição agrupada contendo mais de um

valor.
Intervalo de Confiança – Intervalo de valores de médias (proporções) dentro do qual a

verdadeira média (proporção) populacional tem probabilidade de se situar.
Limite de Classe – Ponto a meio caminho entre intervalos de classe adjacentes que
serve para preencher a lacuna entre eles.
Média – Soma de um conjunto de escores dividida pelo número total no conjunto. É uma
medida de tendência central.

Mediana – Ponto mais central em uma distribuição de freqüências. Uma medida de ten-
dência central.
Moda – Valor mais freqüente, típico ou comum em uma distribuição.
Percentis – dividem a distribuição em 100 partes iguais.
Polígono de freqüência – é um gráfico em linha, sendo as freqüências marcadas

sobre perpendiculares ao eixo horizontal, e levantadas pelos pontos médios dos
intervalos de classe.
Polígono de freqüência acumulada – é traçado marcando-se as freqüências acumula-

das sobre perpendiculares ao eixo horizontal, levantadas nos pontos correspondentes aos
limites superiores dos intervalos de classe.
Ponto Médio – o próprio nome indica, o ponto que divide o intervalo de classe em duas
partes iguais.
População – Qualquer conjunto de indivíduos que compartilham de ao menos uma ca-

racterística.
Probabilidade – Modelos matemáticos que explicam os fenômenos estudados pela Esta-

tística em condições normais de experimentação.
Quartis – dividem a distribuição em 4 partes iguais.
TNA – tabelas de números aleatórios.
Variância – Média dos quadrados dos desvios em relação a média de uma distribuição.
Medida de variabilidade em uma distribuição.

Referências Bibliográficas
TRIOLA, Mario F. Introdução a Estatística, Rio de Janeiro: LTC, 1999.
BUSSAB, W.O. e Morettin, P.A. Estatística Básica. São Paulo: Atual, 1987.
FONSECA, J.S. e Martins, G.A. Curso de Estatística. São Paulo: Atlas, 1993.
LAPPONI, J.C. Estatística usando Excel 5 e 6. São Paulo: Lapponi Treinamento e Editora, 1997.
MORETTIN, L.G. Estatística Básica – Vol. 2 – Inferência. São Paulo: Makron Books, 1999.
MORETTIN, L.G. Estatística Básica – Vol.1 – Probabilidade. São Paulo: Makron Books, 1999.
STEVENSON,W.J. Estatística Aplicada à Administração. São Paulo: Harbra, 1996.
TIBONI,C.G. R. Estatística Básica para o curso de Turismo. São Paulo: Atlas, 2002.
TOLEDO, G. L. e Ovalle, I.I. Estatística Básica. São Paulo: Atlas, 1985.

Belo Horizonte,
agosto de 2009
PONTIFÍCIA UNIVERSIDADE CATÓLICA DE MINAS GERAIS

DIRETORIA DE ENSINO A DISTÂNCIA
Rua Espírito Santo, 1059 - 12º andar – Centro
30160-031 - Belo Horizonte – MG
Telefone: (0xx31) 3238-5600 - Fax: (0xx31) 3238-5605
http://www.virtual.pucminas.br
ATENDIMENTO E INFORMAÇÕES:
Telefone: (0xx31) 3238-5656
www.virtual.pucminas.br/faleconosco

Estatística

Hochgeladen von

Dokumentinformationen

Copyright

Verfügbare Formate

Dieses Dokument teilen

Dokument teilen oder einbetten

Freigabeoptionen

Stufen Sie dieses Dokument als nützlich ein?

Sind diese Inhalte unangemessen?

Copyright:

Verfügbare Formate

Estatística

Hochgeladen von

Copyright:

Verfügbare Formate

Probabilidade e Estatística

Sonia Maria Barros Barbosa Correa

Reitor Prof. Dom Joaquim Giovani Mol Guimarães

Pró-reitor de Extensão Prof. Wanderley Chieppe Felippe

Pró-reitor de Gestão Financeira Prof. Paulo Sérgio Gontijo do Carmo

Pró-reitora de Graduação Profª. Maria Inês Martins

Pró-reitor de Logística e Infra-estrutura Prof. Rômulo Albertini Rigueira

Pró-reitor de Pesquisa e Pós-Graduação Prof. João Francisco de Abreu

Pró-reitor de Recursos Humanos Prof. Alexandre Rezende Guimarães

PUC MINAS VIRTUAL

Autoria e Revisão Equipe Pedagógica e Tecnológica da PUC Minas Virtual

Design Gráfico e diagramação Profª. Simone Nogueira

Todos os direitos reservados

Capítulo 1. Natureza e Fundamentos do Método Estatístico .................................. 7

Capítulo 2. Amostragem .............................................................................30

Capítulo 3. Distribuição de Freqüência...........................................................40

Capítulo 4. Medidas de Posição ....................................................................51

Capítulo 6. Probabilidade ...........................................................................73

Capítulo 7. Variáveis Aleatórias....................................................................85

Capítulo 8. Inferência Estatística ..................................................................98

Capítulo 9. Correlação e Regressão Linear .................................................... 110

E como objetivos específicos:

Oferecer exemplos de tabelas e gráficos que podem representar, de forma sinté-

1.1. Introdução à Estatística

PUC Minas Virtual 7 Probabilidade e Estatística

1.2. Importância da Estatística

A Estatística é uma parte da Matemática que utiliza métodos específicos para

Vejamos alguns exemplos:

PUC Minas Virtual 8 Probabilidade e Estatística

1.3. Grandes áreas da Estatística

Em estatística, utilizamos extensamente os termos: população, amostra, censo, parâmetros,

PUC Minas Virtual 9 Probabilidade e Estatística

Exemplo 1.1. Pesquisas sobre tendências de votação

Exemplo 1.2. Avaliação de um programa de ensino

Exemplo 1.3. Renda média per capita em diversas regiões do país

PUC Minas Virtual 10 Probabilidade e Estatística

Exemplo 1.5. Anuário Estatístico Brasileiro

Exemplo 1.6. Anuário Estatístico da Embratur

Estatística Inferencial (ou Indutiva)

Exemplo 1.8. Análise financeira.

Os analistas financeiros estudam dados sobre a situação da economia, visando explicar

Exemplo 1.9. Ocorrência de terremotos.

PUC Minas Virtual 11 Probabilidade e Estatística

O processo de generalização, que é característico do método indutivo, está associado a

1.4. Fases do Método Estatístico

PUC Minas Virtual 12 Probabilidade e Estatística

Coleta dos dados

Um conjunto de dados é, pois, primário ou secundário em relação a alguém. As tabelas do

Apuração dos dados

PUC Minas Virtual 13 Probabilidade e Estatística

Análise e interpretação dos dados

1.5. Séries Estatísticas

PUC Minas Virtual 14 Probabilidade e Estatística

Vamos introduzir o conceito, de um instrumento amplamente utilizado pela Estatística a Ta-

Tabela é um quadro que resume um conjunto de observações.

Uma tabela compõe-se de:

Cabeçalho – parte superior da tabela onde é especificado o seu conteúdo;

Tabela 1.1. Quantas horas se trabalha em cada País – 2001

Estados Unidos 40,5

Fonte: Organização Internacional do Trabalho (OIT).

PUC Minas Virtual 15 Probabilidade e Estatística

Específicas – Fenômeno (descrição de um fato ou fator) – o que é descrito.

Tabela 1.2. Operadora WKX – Vendas por Unidade da Federação – 1995

Dados Absolutos Dados Relativos