Sie sind auf Seite 1von 219

Universidade Sul de Santa Catarina

Probabilidade e
Estatística

UnisulVirtual
Palhoça, 2016
Créditos

Universidade do Sul de Santa Catarina – Unisul


Reitor
Sebastião Salésio Herdt
Vice-Reitor
Mauri Luiz Heerdt
Pró-Reitor de Ensino, de Pesquisa e de Extensão
Mauri Luiz Heerdt
Pró-Reitor de Desenvolvimento Institucional
Luciano Rodrigues Marcelino
Pró-Reitor de Operações e Serviços Acadêmicos
Valter Alves Schmitz Neto

Diretor do Campus Universitário de Tubarão


Heitor Wensing Júnior
Diretor do Campus Universitário da Grande Florianópolis
Hércules Nunes de Araújo
Diretor do Campus Universitário UnisulVirtual
Fabiano Ceretta

Campus Universitário UnisulVirtual


Diretor
Fabiano Ceretta

Unidade de Articulação Acadêmica (UnA) – Ciências Sociais, Direito, Negócios e Serviços


Amanda Pizzolo (coordenadora)
Unidade de Articulação Acadêmica (UnA) – Educação, Humanidades e Artes
Felipe Felisbino (coordenador)
Unidade de Articulação Acadêmica (UnA) – Produção, Construção e Agroindústria
Anelise Leal Vieira Cubas (coordenadora)
Unidade de Articulação Acadêmica (UnA) – Saúde e Bem-estar Social
Aureo dos Santos (coordenador)

Gerente de Operações e Serviços Acadêmicos


Moacir Heerdt
Gerente de Ensino, Pesquisa e Extensão
Roberto Iunskovski
Gerente de Desenho, Desenvolvimento e Produção de Recursos Didáticos
Márcia Loch
Gerente de Prospecção Mercadológica
Eliza Bianchini Dallanhol
Luiz Arthur Dornelles Júnior

Probabilidade e
Estatística

Livro didático

Revisão e atualização de conteúdo


Joseane Borges de Miranda

3a Edição

Designer instrucional
Karla Leonora Dahse Nunes
Sabrina Bleicher
Eliete de Oliveira Costa

UnisulVirtual
Palhoça, 2016
Copyright © Nenhuma parte desta publicação pode ser reproduzida por
UnisulVirtual 2016 qualquer meio sem a prévia autorização desta instituição.

Livro Digital

Professor conteudista Revisor


Luiz Arthur Dornelles Júnior Contextuar

Revisão e atualização de conteúdo ISNB


Gabriel Oscar Cremona Parma (2ª edição) 978-85-506-0036-9
Joseane Borges de Miranda (3ª edição)
e-ISBN
Designer instrucional 978-85-506-0037-6
Karla Leonora Dahse Nunes
Sabrina Bleicher (2ª edição)
Eliete de Oliveira Costa (3ª edição)

Projeto gráfico e capa


Equipe UnisulVirtual

Diagramador(a)
Caroline Casassola

D75
Dornelles Júnior, Luiz Arthur
Probabilidade e estatística : livro didático / Luiz Arthur Dornelles Júnior ;
revisão e atualização de conteúdo Joseane Borges de Miranda, [ Gabriel Oscar
Cremona Parma] ; design instrucional [Karla Leonora Dahse Nunes], [Sabrina
Bleicher], Eliete de Oliveira Costa. – 3. ed. – Palhoça : UnisulVirtual, 2016.
217 p. : il. ; 28 cm.

Inclui bibliografia.
ISBN 978-85-506-0036-9
e-ISBN 978-85-506-0037-6

1. Estatística. 2. Probabilidades. I. Mirada, Joseane Borges de. II.


Parma, Gabriel Oscar Cremona. III. Nunes, Karla Leonora Dahse. IV.
Bleicher, Sabrina. V. Costa, Eliete de Oliveira. VI. Título.

CDD (21. ed.) 519.5

Ficha catalográfica elaborada pela Biblioteca Universitária da Unisul


Sumário

Introdução  | 7

Capítulo 1
Estatística descritiva | 9

Capítulo 2
Medidas de posição e dispersão | 51

Capítulo 3
Probabilidade | 91

Capítulo 4
Amostragem e cálculo de estimativa | 131

Capítulo 5
Regressão Linear simples | 163

Considerações Finais | 177

Referências | 179

Sobre os Professores Conteudistas  | 181

Respostas e comentários das atividades de autoavaliação | 183

Anexos | 216
Introdução

Olá! Bem-vindo(a) à disciplina Probabilidade e Estatística.

Dentro desta unidade de aprendizagem você irá estudar o que os profissionais e


cientistas chamam de probabilidade e estatística.

Tendo como base a matemática, esta unidade de aprendizagem trata da


aplicação no cotidiano, em pesquisas e avaliações. Trata também de técnicas
eficientes para organizar e analisar dados e tomar decisões.

Não é objetivo desta unidade de aprendizagem formar estatísticos e, sim, profissionais


com conhecimento técnico para realizar análises e interpretação de dados, além de ter
condições de argumentar, dar suporte e trocar ideias com outros profissionais.

Desta forma, o esperado é que ao final da unidade de aprendizagem você tenha em


suas mãos uma verdadeira “caixa com várias ferramentas” para apoiar suas decisões.

Sinta-se, agora, convidado a estudar para obter todas as “ferramentas” que lhe
serão apresentadas nesta unidade de aprendizagem, e cuide para ordenar as
ferramentas na “caixa”, de modo a poder fazer uso delas quando for necessário.

Bons estudos!

Professor Luiz Arthur Dornelles Jr.


Capítulo 1

Estatística descritiva

Seção 1
Introdução à Estatística
A cada dia, nossa sociedade torna-se mais complexa. Convivemos com os
indicadores econômicos, com a inflação, com a reforma da previdência, com o
controle de qualidade, enfim, deparamo-nos constantemente com situações e
informações sempre mais complexas.

No que se refere à gestão das organizações, a situação não é diferente. Para se


administrar uma empresa, seja pública ou privada, necessitamos de ferramentas
para poder acompanhar a evolução da sociedade e, assim, analisar situações
e informações, bem como dar suporte às nossas decisões. Assim como no
setor público, a Estatística é uma ótima forma para prever e estudar as variáveis
econômicas, tais como juros, inflação, dentre outros.

Por isso, dizemos que a Estatística é um conjunto de ferramentas, as quais,


quando bem empregadas, podem ser de grande utilidade para a gestão de
empresas e no setor público em geral. Hoje em dia, sem a Estatística, não
seríamos capazes de avaliar a variação de preços, da inflação, de consumo, nem
fazer controle de qualidade, pesquisa eleitoral etc.

Para conhecer Estatística, é importante que você compreenda, antes, o


significado da palavra e o seu conceito. A palavra Estatística origina-se do
latim, e o seu radical status, significa estado. Sendo assim, a palavra Estatística
significa “o estudo do estado”. Para entender o conceito de “estudo do estado”,
acompanhe as seguintes definições sobre Estatística:

A Estatística é uma coleção de métodos para planejar


experimentos, obter dados e organizá-los e, deles, extrair
conclusões. (TRIOLA, 1999, p. 2).

9
Capítulo 1

A Estatística está interessada nos métodos científicos para a


coleta, a organização, o resumo, a apresentação e a análise
de dados, bem como na obtenção de conclusões válidas e
na tomada de decisões razoáveis, baseadas em tais análises.
(SPIEGEL, 1994, p. 1).
Estatística é um conjunto de métodos e processos
quantitativos que serve para estudar e medir os fenômenos
coletivos. (SILVA, 1999, p. 11).

Você percebeu que as definições assemelham-se e completam-se? Então, observe,


a seguir, a definição de Estatística adotada neste estudo que começa agora.

A Estatística corresponde a um conjunto de métodos científicos para a coleta,


organização, apresentação e análise de dados, bem como, para a conclusão e tomada
de decisões baseadas em tais análises.

Em termos gerais, convém destacar que a Estatística está dividida em duas partes:

•• Estatística descritiva: aplicada quando você depara-se com uma


quantidade muito grande de dados, e é difícil tirar conclusões sobre o
fenômeno. A Estatística descritiva é usada para reduzir as informações
até o ponto em que se possa interpretar tal fenômeno. O objetivo da
Estatística descritiva é observar fenômenos de mesma natureza, coletar,
organizar, classificar, apresentar, interpretar e analisar dados referentes
ao fenômeno por meio de gráficos e tabelas, além de calcular medidas
de tendência que permitam descrever o fenômeno.
•• Estatística indutiva: aplicada quando é impossível realizar levantamentos
com a totalidade dos objetos de uma pesquisa, seja por tempo, ou por
economia etc., somente uma parcela desses elementos é utilizada para
realizar as observações. Partindo, nesse caso, de uma parcela desses
elementos, a Estatística indutiva chega a conclusões e realiza previsões
sobre elementos em questão (método que se fundamenta na teoria da
probabilidade associada a uma margem de incerteza).

Para a obtenção de resultados confiáveis, que reflitam a realidade dos fatos, é necessário
realizar uma pesquisa, cuidadosamente planejada, com métodos adequados.

O método é um conjunto de meios dispostos convenientemente para se chegar a um fim


que se demarcou. O método estatístico, diante da impossibilidade de manter as causas
constantes, admite as causas presentes, variando-as, registrando essas variações e
procurando determinar, no resultado final, que influências cabem a cada uma delas.

10
Probabilidade e Estatística

Alguns passos precisam ser seguidos para que seja aplicado o método estatístico
e, assim, realizada uma boa pesquisa. Para você entender quais são esses
passos, acompanhe, a seguir, as principais fases.

a. Definição do problema: a primeira fase do trabalho estatístico


consiste em uma definição ou formulação correta do problema a ser
estudado. Nesta fase, você precisa definir:
· O que será pesquisado? Definir o tema e os objetivos de
pesquisa.
· Em que setor geográfico? O público-alvo a ser planejado.
· Como será a amostra? Incluir o cálculo da amostra e as
técnicas de coletas de dados.

b. Planejamento: consiste em determinar o procedimento necessário


para levantar informações sobre o assunto objeto do estudo. Você
deverá definir como serão coletados os dados de pesquisa, já que
isso pode ser feito de várias formas.
· Observação direta: caracteriza-se quando o pesquisador
somente faz observações para coletar os dados necessários
para a pesquisa.
· Entrevista oral: caracteriza-se por estabelecer perguntas
orais a um indivíduo ou grupo de indivíduos. As entrevistas
podem ser classificadas em estruturadas e não estruturadas;
entrevistas estruturadas são aquelas em que o pesquisador
estabelece um roteiro prévio de perguntas. Nas entrevistas
não estruturadas, o pesquisador, por meio de uma conversa
amigável, busca levantar dados que possam ser utilizados em
análise qualitativa, selecionando-se os aspectos mais relevantes
do problema de pesquisa. (RAUEN, 2006).
· Entrevista escrita ou questionário: questionário é uma lista
de indagações escritas, as quais devem ser respondidas por
escrito pelo informante. Sua vantagem é a possibilidade de se
indagarem muitas pessoas ao mesmo tempo. Para entrevistar
uma sala de universitários, basta distribuir as folhas, para
que todos respondam simultaneamente (entrevista de grupo)
(RAUEN, 2006). O questionário é uma forma muito utilizada
na coleta de dados, mas exige ser: completo (responder
tudo), concreto (perguntas claras e objetivas), secreto (sem
identificação) e discreto (perguntas bem formuladas).

11
Capítulo 1

É preciso planejar o trabalho a ser realizado, tendo em vista o objetivo que se


pretende atingir.

c. Coleta de dados: compreende a coleta das informações


propriamente ditas. Formalmente, a coleta de dados refere-se à
obtenção, à reunião e ao registro sistemático de dados com um
objetivo determinado.
d. Apuração dos dados: consiste em reunir os dados por meio de sua
contagem e seu agrupamento.
e. Apresentação dos dados: os dados estatísticos podem ser mais
facilmente compreendidos quando apresentados por meio de uma
representação gráfica, o que permite uma visualização instantânea
de todos os dados.
f. Análise e interpretação de dados: nesta etapa, o interesse maior
reside em tirar conclusões que auxiliam o pesquisador a atingir seu
objetivo, ou seja, encontrar a resposta para a sua pergunta.

Todas essas fases são realizadas quando se cumpre um processo de pesquisa.


Veja a representação no esquema a seguir.

Figura 1.1 – O processo da pesquisa

População Amostra
Produção de
dados

Características Estudo da amostra:


populacionais - tabelas
- gráficos
- medidas
Estatística
Indutiva Características
amostrais

Fonte: Adaptado de Ação Local de Estatística Aplicada − ALEA (1999-2010).

12
Probabilidade e Estatística

População e amostra
Quando você prepara um alimento, pode provar (observar) uma pequena porção.
Nesse procedimento, você está fazendo o processo de amostragem, ou seja,
extraindo do todo (população) uma parte (amostra), com o propósito de inferir
(avaliar) a qualidade de todo o alimento. A partir do exemplo, podemos distinguir
dois importantes conceitos da Estatística descritiva: população e amostra.

População é o conjunto total de elementos com, pelo menos, uma característica em


comum, cujo comportamento interessa estudar.

A definição dos elementos que serão estudados está ligada diretamente às


características levantadas no objetivo da pesquisa, ou seja, é este objetivo que
auxiliará na definição desta população. Estes elementos podem ser:

•• animados: pessoas, animais etc.;


•• inanimados: notas fiscais, produtos industrializados etc.

Em relação ao número de elementos, a população pode ser:

•• finita: quando tem um número limitado de elementos (número de


funcionários de um determinado banco etc.);
•• infinita: quando tem um número ilimitado de elementos (exemplo:
número possível de análises químicas que podem ser feitas em um
rio poluído etc.).

A representação do tamanho da população é dada por N = número de


elementos da população.

São exemplos de definição de população:

•• ao estudar a idade e o sexo de funcionários da empresa A: para definir


a população, devemos considerar todos os funcionários da empresa;
•• ao estudar a qualidade de peças de uma linha de produção da
empresa A: para definir a população, devemos considerar todas as
peças produzidas pela empresa.

Amostra é o conjunto de elementos ou observações, recolhidos a partir de um


subconjunto da população, que se estuda com o objetivo de tirar conclusões para a
população de onde foi recolhida.

13
Capítulo 1

A amostra precisa ser representativa, ou seja, possuir as mesmas características


da população.

A representação do tamanho da amostra é dada por n = número de elementos


da amostra.

Processos estatísticos de abordagem


Ao estudar um fenômeno coletivo, ou seja, um fenômeno que se refere a uma
determinada população, compreendendo um grande número de elementos,
coisas e indivíduos, podemos optar entre os seguintes processos estatísticos:

•• Censo 1: é uma coleção de dados relativos a todos os elementos


de uma população; uma avaliação direta de um parâmetro que
utiliza todos os componentes da população. No Brasil, por
exemplo, o censo é feito de dez em dez anos, momento em que são
pesquisados todos os domicílios brasileiros.

Principais propriedades do censo:

· admite erro processual zero e tem confiabilidade de 100%;


· é caro e lento;
· quase sempre desatualizado;
· nem sempre é viável.

•• Parâmetro: usado para designar alguma característica descritiva


dos elementos da população (percentagem, média etc.).
•• Estimação: é uma avaliação indireta de um parâmetro com base em
um estimador, por intermédio do cálculo de probabilidades. Nesse
caso, utiliza-se uma amostra.
· Principais propriedades da estimação:
· admite erro processual positivo e tem confiabilidade menor do
que 100%;
· é barata e rápida;
· é atualizada;
· é sempre viável.

1 - O censo era considerado uma pesquisa desatualizada pela demora da publicação dos dados, mas a
tecnologia veio para diminuir em muito esse tempo de publicação. No ano de 2010, constatamos que os dados
foram publicados com mais rapidez do que nas décadas anteriores. Acesse o site do Instituto Brasileiro de
Geografia e Estatística (IBGE) e consulte informações da sua cidade e do seu estado: <www.ibge.gov.br>.

14
Probabilidade e Estatística

•• Estimativa: é o valor assumido por certa Estatística (exemplo: 60%


é o valor de estimativa do referido parâmetro).

Amostragem
Como exposto neste capítulo, as pesquisas são realizadas por meio de estudo
dos elementos que compõem uma amostra extraída da população que se
pretende analisar.

A população é o conjunto de indivíduos ou objetos que apresentam, em comum,


determinadas características definidas para o estudo. Amostra é um subconjunto
da população. O estudo de todos os elementos da população possibilita
conhecimento preciso das variáveis que estão sendo pesquisadas; todavia, nem
sempre é possível obter as informações de todos os elementos da população.

Limitações de tempo, custo e as vantagens do uso das técnicas Estatísticas


justificam o uso de planos amostrais. A representatividade da amostra dependerá
do seu tamanho (quanto maior, melhor). O investigador procurará acercar-se de
cuidados, visando à obtenção de uma amostra significativa, ou seja, que de fato
represente toda a população da melhor maneira possível. (FONSECA, 1996).

Observe, a seguir, mais alguns conceitos do processo estatístico, relacionados à


amostragem:

•• Estatística: característica descritiva dos elementos da amostra


(percentagem, média etc.).
•• Erro amostral: é a máxima diferença que o investigador/pesquisador
admite entre a média da população e a média da amostra. Em
pesquisa, admite-se o uso do erro amostral entre 1% a 10%. Observe,
por exemplo, as pesquisas eleitorais, a maioria destas é efetuada com
erro amostral de 2%. Isso significa que pode variar de −2% a +2%.
Quando se diz que dois candidatos estão com empate técnico, isso
quer dizer que, somando ou diminuindo 2%, eles estão empatados.

Exemplo

O candidato A está com 48% da preferência dos votos, e o candidato B está com
52% da preferência dos votos. O candidato A tem 48%; diminuindo os 2% = 46;
com 48% mais 2% = 50%. Ou seja, varia de 46% a 50%. Já, o candidato B tem
52% menos 2% = 50%; com 52% mais 2% = 54%. Logo, considerando-se o erro
amostral, os candidatos estão empatados tecnicamente, com 50% cada.

15
Capítulo 1

•• Nível de confiança: é expresso em percentual e representa quantas


vezes o percentual real da população encontra-se dentro do
intervalo de confiança. O nível de confiança de 95% significa que
você tem 95% de certeza. A maioria dos pesquisadores usa o nível
de confiança de 95%.

Como podemos ver, o uso da amostragem é vantajoso por trazer:

•• economia: é mais econômico, o levantamento de somente


uma parte da população, muitas vezes pelo custo do próprio
levantamento e também por não ser mais possível recuperar
elementos da população;
•• tempo: em pouco tempo, pode-se pesquisar uma amostra, ao
contrário de uma população;
•• confiabilidade: quando se pesquisa um número menor de
elementos, pode-se dar mais atenção, evitando erros nas respostas.

Variáveis
Variáveis são conjuntos de características que podem ser observados e/ou medidos
em cada elemento da população ou amostra, sob as mesmas condições.

Ao analisar uma determinada experiência, um fato ou um elemento, você pode


verificar que todos eles assumem diferentes características ou valores.

Exemplo: ao analisar um determinado setor de uma empresa, você pode verificar,


entre seus funcionários, algumas características (variáveis) como sexo, idade,
salário, assiduidade etc.

Essas características variam de elemento para elemento, por isso são chamadas
de variáveis.

As variáveis são classificadas em dois tipos:

•• Qualitativas: representam a informação que identifica alguma


qualidade, categoria ou característica, não suscetível de medida (não
numérica), mas de classificação, assumindo várias modalidades.

Exemplo:
Estado civil: casado, solteiro, viúvo, divorciado.
Sexo: masculino e feminino.
Escolaridade: 1º grau, 2º grau, 3º grau.

16
Probabilidade e Estatística

As variáveis qualitativas estão divididas em:

· Nominais: são dados caracterizados por rótulos ou categorias.


Por exemplo, sexo, estado civil, cor dos olhos etc.
· Ordinais: são dados caracterizados por uma ordem, mas não
podem ser diferenciados por valor numérico. Por exemplo: nível
de escolaridade (1º, 2º e 3º graus), intensidade da luz (muito
forte, forte, média, suave, muito suave).

•• Quantitativas: representam a informação resultante de


características suscetíveis de serem medidas, apresentam-se com
diferentes intensidades.

Exemplo:
Idade: 19 anos, 20 anos, 35 anos.
Número de nascidos vivos: 10, 15, 22, 12, 14.
Peso: 55 kg, 66 kg, 71 kg.

As variáveis quantitativas estão divididas em:

•• Variáveis discretas: se ela pode assumir um conjunto constante


discreto, ou seja, enumerável, finito de valores. Geralmente são
expressas por valores inteiros não negativos. Por exemplo: número
de pessoas do setor, quantidade de notas fiscais (observação: não
se pode considerar meia nota fiscal ou meia pessoa).
•• Variáveis contínuas: são as variáveis em que não conseguimos
enumerar seus possíveis resultados, por estes formarem um conjunto
infinito de valores, em um intervalo de números reais. Por exemplo:
peso, altura, temperatura.

Diferença entre as variáveis discreta e contínua


Você, à noite, ao ir deitar-se, tem 1,65m e desperta pela manhã com 1,70m. Você cresce
5cm de forma instantânea? Não, você cresce aos poucos e, entre 1,65 e 1,70, você
tem infinitas alturas. Para a variável discreta, observamos que não é possível aumentar
o número de pessoas de 22 para 22,57. Não podemos aumentar em 0,57 pessoa. Só
podemos aumentar em uma unidade.

17
Capítulo 1

Dados
Dados estatísticos são medidas da presença de um determinado conjunto de
valores de uma variável em uma população ou amostra. Os tipos de dados
estatísticos são:

•• dados primários: quando são observados e/ou levantados pelo


próprio pesquisador ou pela organização que os tenha recolhido;
•• dados secundários: quando são observados e/ou levantados por
outra organização ou pesquisador.

Além dessa classificação, os dados também pode ser absolutos e relativos. Nesta
seção, vamos aprender a transformar dados absolutos em dados relativos, mas,
antes disso, vamos conhecer suas definições.

•• Dados absolutos são dados estatísticos resultantes da coleta direta


da fonte, sem outra manipulação a não ser a contagem ou medida.
A leitura dos dados absolutos é sempre enfadonha e inexpressiva.
Embora, esses dados traduzam um resultado exato e fiel, não têm a
virtude de ressaltar de imediato as suas conclusões numéricas.
Daí o uso imprescindível que faz a Estatística dos dados relativos. O
número de vezes que um valor da variável de uma pesquisa é citado
representa a frequência absoluta daquele valor.
•• Dados relativos são o resultado de comparações por quociente
(razões) que se estabelecem entre dados absolutos e têm por
finalidade realçar ou facilitar as comparações entre quantidades.
Traduzem-se os dados relativos, em geral, por meio de:
· percentagens;
· coeficientes;
· taxas;
· índices.

A frequência relativa é o quociente entre a frequência absoluta de uma variável e


o total de citações de todas as variáveis da pesquisa.

18
Probabilidade e Estatística

Seção 2
Distribuição de frequência
Com a posse dos dados de forma desorganizada, um primeiro passo seria
organizá-los em tabelas para que possibilitem uma primeira análise, além de
servirem para uma série de interpretações. Você poderá aprender como se
organizam dados brutos e como pode ser analisada a distribuição de frequências.

Antes de qualquer coisa, você precisa saber o que são dados brutos e dados agrupados.

Dados brutos

Dados brutos são sequências de valores numéricos ou não, os quais não sofreram
qualquer tratamento estatístico, nem foram organizados, obtidos diretamente da
observação de um fenômeno.

Mais precisamente, dados brutos são os dados apresentados da forma como foram
coletados na pesquisa ou no levantamento, desorganizados, sem ordenação.

Acompanhe os exemplos de levantamento de dados de acordo com o tipo de


variável: qualitativa, quantitativa discreta ou quantitativa contínua.

•• Para uma variável qualitativa


Em um levantamento realizado com 56 clientes de um banco, foram obtidos os
seguintes dados sobre o tipo de investimento em que estes mais confiavam,
conforme legenda.

Quadro 1.1 − Levantamento sobre o tipo de investimento que os clientes do banco mais confiavam

I M R P I I P R

P R I P P I R I

P P P M I P P P

M P I I I M P R
Legenda do quadro:
M R R P M M P R I – Investimentos imobiliários;
M – Investimento em mercado de ações;
I R M P P I R P P – Investimento em poupança;
R – Investimento em fundos de renda fixa.
M P I P P M P I

Fonte: Elaboração do autor (2010).

19
Capítulo 1

Repare que, neste caso, foram pesquisados 56 clientes e foram anotadas as


respostas na ordem das entrevistas.

•• Para uma variável quantitativa discreta


O controle de qualidade de uma fábrica de rolamentos vem analisando os lotes para
detectar defeitos nas peças fabricadas. Cada lote contém 56 peças. A seguir, está
relacionado o número de defeitos por peça, conforme estas são produzidas neste lote.

Quadro 1.2 − Levantamento sobre o número de defeitos por peça de uma fábrica de rolamentos

1 1 4 1 0 0 1 6

5 0 0 0 0 0 0 0

0 1 0 0 1 0 3 2

4 2 0 0 2 0 1 0

0 0 3 3 0 0 4 0

0 1 0 2 0 0 1 0

3 0 0 0 3 0 0 0

Fonte: Elaboração do autor (2010).

Repare que foram analisadas 56 peças e foram anotados os números de defeitos


por peça, na ordem em que estas foram produzidas.

•• Para uma variável quantitativa contínua


Os valores anotados, a seguir, representam o volume de vendas mensal de 56
representantes de uma empresa que fabrica remédios. Os valores estão em
milhares de reais.

20
Probabilidade e Estatística

Quadro 1.3 − Levantamento sobre o volume de vendas mensal de 56 representantes de uma empresa
que fabrica remédios

23,25 27,43 17,76 33,33 33,05 16,08 34,49 23,74

32,63 20,58 18,50 16,69 16,43 20,08 19,00 16,13

21,36 26,60 22,49 22,77 23,05 33,55 22,73 24,89

24,11 34,83 21,73 31,53 35,13 34,36 20,80 16,84

29,55 34,76 31,72 24,89 21,65 22,65 30,43 30,93

17,25 17,05 19,67 22,79 25,30 23,08 25,77 35,03

16,59 15,90 20,30 33,86 17,76 30,93 20,81 29,05

Fonte: Elaboração do autor (2010).

Dados agrupados
Dados agrupados são sequências de valores numéricos, ou não, os quais se
encontram já organizados, ou por semelhança (qualitativas), ou por ordenação
numérica (quantitativas), em tabelas.

•• Tabelas para variável qualitativa


Para montar uma tabela com variável qualitativa, acompanhe o exemplo, a seguir,
de um levantamento de dados acerca do tipo de investimento em que os clientes
de um banco mais confiavam.

Para começar, você deve organizar os dados por semelhança. Conforme o quadro abaixo.

Quadro 1.4 − Levantamento sobre o tipo de investimento que os clientes do banco mais confiavam

I I I I I I I I

I I I I I I M M

M M M M M M M M

P P P P P P P P

P P P P P P P P

P P P P P P R R

R R R R R R R R

Fonte: Elaboração do autor (2010).

21
Capítulo 1

Repare que os dados estão organizados por tipo de investimento.

Agora, você vai escrever, em uma coluna, cada uma das opções verificadas. Contar
o número de vezes em que cada tipo aparece e marcar com traços, ao lado, para
representar as aparições. Em seguida, conte o número de traços para obter o número
de vezes que cada opção aparece. Observe o quadro da contagem dos dados.

I = 14

M = 10

P = 22

R = 10

Após a contagem e organização dos dados, agora, é só montar a tabela, sem


esquecer-se de nenhum de seus componentes. Acompanhe.

Tabela 1.2 − Tipos de investimento

Tipo de investimento Número de clientes

Imobiliário 14

Mercado de ações 10

Poupança 22

Fundos de renda fixa 10

Total 56

Fonte: Elaboração do autor (2010).

•• Tabelas para variável quantitativa discreta


Nesta seção, vamos verificar como montar uma tabela com variável quantitativa
discreta. Para saber como são montados estes tipos de tabela, acompanhe os
passos apresentados a seguir.

Observe que a opção de montar uma tabela sem intervalos deve-se ao fato de
esta série ter um número de elementos distintos pequeno.

Para começar, organize os dados em ordem crescente.

22
Probabilidade e Estatística

Quadro 1.5 − Levantamento sobre o número de defeitos por peça de uma fábrica de rolamentos

0 0 0 0 0 0 0 0

0 0 0 0 0 0 0 0

0 0 0 0 0 0 0 0

0 0 0 0 0 0 0 0

0 1 1 1 1 1 1 1

1 1 2 2 2 2 3 3

3 3 3 4 4 4 5 6
Fonte: Elaboração do autor (2010).

Repare que foram organizados conforme uma ordem numérica crescente (de
0 a 6). A organização dos dados na forma de lista em ordem – crescente ou
decrescente – é chamada de Rol.

Depois de criar o Rol de dados, escreva, em uma coluna, cada um dos valores
observados. Conte o número de vezes em que cada tipo aparece e marque com
traços, ao lado, para representar as aparições. Após terminar, conte o número
de traços para obter o número de vezes em que cada valor aparece. Observe o
quadro da contagem dos dados.

Quadro 1.6 − Contagem do número de elementos X

0 33

1 9

2 4

3 5

4 3

5 1

6 1

Fonte: Elaboração do autor (2010).

Agora, é só montar a tabela, sem esquecer-se de nenhum de seus componentes.

23
Capítulo 1

Tabela 1.3 − Número de defeitos por peças analisadas do lote

Número de defeitos (xi) Número de peças (fi)

0 33

1 9 Frequência
simples
Valores que a
variável pode 2 4
assumir
3 5

4 3

5 1

6 1

Frequência
Total (∑fi) 56 total

Fonte: Elaboração do autor (2010).

Nessa tabela, utilizamos algumas expressões Estatísticas para representação


dos elementos:

•• os valores que a variável pode assumir são representados por xi;


•• o número de observações de cada linha chama-se de frequência
simples, denotada por fi; e
•• o número total de observações chama-se de frequência total e
pode ser denotada por N (tamanho da população), n (tamanho da
amostra) ou .

•• Tabelas para variável quantitativa contínua


A opção de montar uma tabela com intervalos é preferível porque esta série
possui um grande número de elementos distintos ou, ainda, quando os valores
apresentam uma natureza de continuidade. Vamos acompanhar um exemplo para
montagem das tabelas para variável quantitativa contínua 2.

Exemplo: os valores anotados, a seguir, representam o volume de vendas mensal


de 56 representantes de uma empresa que fabrica remédios. Os valores estão em
milhares de reais.

2 - Para a variável quantitativa contínua, utilizam-se intervalos na tabela para representar a série de dados.
Esses intervalos denominam-se intervalos de classes.

24
Probabilidade e Estatística

Para começar, novamente, você deve organizar os dados em ordem crescente (Rol).

Quadro 1.7 − Levantamento sobre o volume de vendas mensal de 56 representantes de uma empresa
que fabrica remédios

15,90 16,08 16,13 16,43 16,59 16,69 16,84 17,05

17,25 17,76 17,76 18,50 19,00 19,67 20,08 20,30

20,58 20,80 20,81 21,36 21,65 21,73 22,49 22,65

22,73 22,77 22,79 23,05 23,08 23,25 23,74 24,11

24,89 24,89 25,30 25,77 26,60 27,43 29,05 29,55

30,43 30,93 30,93 31,53 31,72 32,63 33,05 33,33

33,55 33,86 34,36 34,49 34,76 34,83 35,03 35,13

Fonte: Elaboração do autor (2010).

Note que, como os dados são de uma variável contínua e são bastante variados,
temos que reduzir os dados calculando intervalos de classes das variáveis X, para
tanto, você deve calcular o número e o tamanho dos intervalos.

O número de intervalos (k) é obtido a partir dos seguintes critérios:

•• critério da raiz k= n;
•• fórmula de Sturges k = 1 + 3,3.log n;
•• n = tamanho da amostra (poderá ser usado N, quando for com a
população, log, logarítimo).

Observe que:

1. ainda que existam dois critérios, em geral, o critério utilizado é o da


raiz: k = n;
2. o número do intervalo (k), em alguns casos, pode ser predefinido;
3. as tabelas devem ter, no mínimo, 4 e, no máximo, 20 intervalos de
classes, para que não haja nem perda, nem excesso de informação;

Para este estudo, sendo n o número de elementos da amostra, n = 56, e


k = n , então , k = 56 logo k = 7,48, nesse caso, temos que arredondar,
pois os intervalos devem ser números inteiros, neste caso, o número de
intervalos utilizado será igual a 7.

25
Capítulo 1

Agora, vamos analisar as amplitudes e os limites de classe para determinar o


tamanho dos intervalos.

a. Amplitude total da distribuição (AT): é a diferença entre o maior


valor e o menor valor observado.

L (máx.) = Limite máximo (maior valor);

l (mín.) = Limite mínimo (menor valor).

No exemplo que você está estudando,

Nesta etapa, é conveniente que o resultado seja arredondado para cima, a fim de que
não haja perda de informação, sempre, em qualquer caso, arredondar para cima.

b. Amplitude de um intervalo de classe (h): também chamada de


tamanho do intervalo de classe, é obtida da seguinte forma.

AT
h=
k

No exemplo: .

Antes de partir para a construção da tabela, é conveniente testar se os cálculos


estão corretos. Para que isso aconteça, verifique se:

Aplique sobre o exemplo dado:

2,80 . 7 = 19,60 > 19,23

Ou seja, ao somar 19,60 ao menor valor observado, resulta 35,50, que é maior do
que o valor da maior observação, 35,13. Note que, dessa forma, o valor real do
Rol de dados estará dentro de um último intervalo de classe:

15,90 + 19,60 = 35,50 > 35,13

26
Probabilidade e Estatística

Caso não seja satisfeita essa condição, será necessário fazer um ajuste,
aumentando o tamanho do intervalo.

Então, resumindo, segundo o exemplo dado, a tabela terá:

•• sete intervalos;
•• cada um com o tamanho de 2,80.

c. Limites de classes: são os extremos de cada classe. O limite


inferior da classe (Li) é o menor número do intervalo. O limite
superior (Ls) é o maior número do intervalo.

Escreva os intervalos da tabela.

Tabela 1.4 − Passo a passo do cálculo dos intervalos de classe

Comece pela primeira classe, escreva o menor valor observado. 15,90

A este valor, some o h (2,8) e encontre o limite superior do intervalo:


15,90 |--- 18,70
15,9 + 2,8 = 18,7. Você deve escrever na tabela:

Na segunda classe, repita o último valor da classe anterior (18,7), some


o h (2,8) e encontre o limite superior do intervalo: 18,7 + 2,8 = 21,5. 18,70 |--- 21,50
Você pode escrever na tabela:

Na terceira classe, repita o último valor da classe anterior (21,5), some


o h (2,8) e encontre o limite superior do intervalo: 21,5 + 2,8 = 24,3. 21,50 |--- 24,30
Você pode escrever na tabela:

24,30 |--- 27,10

Usando este procedimento para as outras classes, você terá os 27,10 |--- 29,90
seguintes intervalos a seguir, até a sétima classe: 29,90 |--- 32,70

32,70 |--- 32,50

Fonte: Elaboração do autor (2010).

Observe que os intervalos são escritos dessa forma: 15,90 |--- 18,70. O que
isso significa?

27
Capítulo 1

A representação indica um intervalo fechado à esquerda e, aberto à direita Þ


[15,90; 18,70), ou seja, os valores deste intervalo chegam perto de 18,70, mas não
exatamente o valor 18,70 está no próximo intervalo: 18,70 |--- 21,50; o valor 21,50
não está neste intervalo, e sim no intervalo: 21,50 |---24,30. E assim por diante.

Agora, é a vez de partir para a construção da tabela, sem esquecer-se de seus


componentes. Primeiro, monte a tabela e escreva os intervalos.

Tabela 1.5 − Volume de vendas mensal, em milhares de reais, dos representantes de uma empresa que
fabrica remédios – outubro/2010

Classe Volume de vendas (em mil reais)

1 15,90 |--- 18,70

2 18,70 |--- 21,50

3 21,50 |--- 24,30

4 24,30 |--- 27,10

5 27,10 |--- 29,90

6 29,90 |--- 32,70

7 32,70 |--- 35,50

Fonte: Elaboração do autor (2010).

Após a construção da tabela, é só contar e marcar o número de valores em cada


intervalo. É aconselhável marcar os limites dos intervalos no Rol e usar os traços
para indicar a contagem ou marcar, conforme o quadro a seguir.

Quadro 1.7 − Volume de vendas mensais

15,90 16,08 16,13 16,43 16,59 16,69 16,84 17,05

17,25 17,76 17,76 18,50 19,00 19,67 20,08 20,30

20,58 20,80 20,81 21,36 21,65 21,73 22,49 22,65

22,73 22,77 22,79 23,05 23,08 23,25 23,74 24,11

24,89 24,89 25,30 25,77 26,60 27,43 29,05 29,55

30,43 30,93 30,93 31,53 31,72 32,63 33,05 33,33

33,55 33,86 34,36 34,49 34,76 34,83 35,03 35,13

Fonte: Elaboração do autor (2010).

28
Probabilidade e Estatística

Tabela 1.6 − Volume de vendas mensal, em milhares de reais, dos representantes de uma empresa que
fabrica remédios – outubro/2010

Volume de vendas No de
Classe Contagem
(em mil reais) representantes (fi)

1 15,9 |--- 18,7 12

2 18,7 |--- 21,5 8

3 21,5 |--- 24,3 12

4 24,3 |--- 27,1 5

5 27,1 |--- 29,9 3

6 29,9 |--- 32,7 6

7 32,7 |--- 35,5 10

Total (∑fi) 56

Fonte: Elaboração do autor (2010).

A tabela fica como está apresentado a seguir.

Tabela 1.7 − Volume de vendas mensal, em milhares de reais, dos representantes de uma empresa que
fabrica remédios – outubro/2010

Volume de vendas (em mil reais) No de representantes (fi)

15,9 |--- 18,7 12

18,7 |--- 21,5 8 Frequência


simples
Intervalo de 21,5 |--- 24,3 12
classes
24,3 |--- 27,1 5

27,1 |--- 29,9 3

29,9 |--- 32,7 6

32,7 |--- 35,5 10

Frequência
Total (∑fi) 56 total

Fonte: Elaboração do autor (2010).

29
Capítulo 1

Tipos de frequência
A Estatística tem como uma de suas finalidades facilitar a análise e a leitura dos
dados, e, justamente, para isso, um dos métodos utilizados é trabalhar com tipos
de frequência. O número de vezes que o X aparece no Rol de dados representa
a fi, frequência simples, e, a partir dessa frequência simples, podemos calcular a
fa (frequência acumulada), a fr (frequência relativa) e a fp (frequência percentual).
Esses tipos de frequência serão apresentados a seguir.

Frequência acumulada
Na tabela, na coluna da frequência acumulada, você deverá escrever o valor
acumulado das frequências, ou seja, para começar, repita a frequência simples
da primeira linha e, nas linhas seguintes, some a frequência simples à frequência
acumulada anterior.

Esse processo deverá chegar até a frequência total

fa = fa(ant) + fi

Sendo:

•• fa: frequência acumulada;


•• fa(ant.): frequência crescente da classe anterior;
•• fi: frequência simples da classe.

Acompanhe com atenção a tabela.

30
Probabilidade e Estatística

Tabela 1.8 − Volume de vendas.

Volume de vendas (em No de fa


mil reais) representantes (fi) Repetir a
primeira fi
15,9 |--- 18,7 12 12

18,7 |--- 21,5 8 20 Somar a fi desta classe com a


acumulada anterior --> 12 + 8 = 20
21,5 |--- 24,3 12 32
Somar a fi desta classe com a
24,3 |--- 27,1 5 37 acumulada anterior --> 20 + 12 = 32

27,1 |--- 29,9 3 40


Somar a fi desta classe com a
29,9 |--- 32,7 acumulada anterior --> 32 + 5 = 37
6 46

32,7 |--- 35,5 10 56

Total (∑fi) 56

Somar sucessivamente até chegar a


frequência total --> 46 + 10 = 56

Fonte: Elaboração do autor (2010).

A frequência acumulada dá a posição de um determinado X.

Imagine que você está apresentando um relatório de vendas da empresa para


a diretoria. Então, um dos diretores pergunta: “Quantos representantes tiveram
vendas menores que 29,9 mil reais?” Você não necessitará fazer contas, é só
observar a quinta classe, na coluna da frequência acumulada na tabela e dizer:
“40 representantes”.

E se perguntarem: “Quantos representantes venderam abaixo de 24,3 mil reais?”


Você vai encontrar a resposta na terceira classe, na coluna com a frequência
acumulada e responder: “32 representantes”.

Observe que o volume de vendas questionado é sempre do limite superior de


cada intervalo para baixo.

31
Capítulo 1

Frequência relativa (fr)


É o quociente entre a frequência (fi) da classe e o número total de observações.


fi
fr =
n

Sendo:

fr: frequência relativa da classe;

fi: frequência simples da classe;

n: número total de observações (pode-se usar n ou ).

Neste caso, deve-se calcular a frequência com quatro casas decimais visando ao
próximo passo.

Tabela 1.9 − Volume de vendas

Volume de vendas (em No de


fr Dividir a fi da classe pelo total
mil reais) representantes (fi)
fr = = 0,2143
15,9 |--- 18,7 12 0,2143

18,7 |--- 21,5 8 0,1429 Dividir a fi da classe pelo total


fr = = 0,1429
21,5 |--- 24,3 12 0,2143

24,3 |--- 27,1 5 0,0893 fr = = 0,2143

27,1 |--- 29,9 3 0,0536

29,9 |--- 32,7 fr = = 0,0893


6 0,1071

32,7 |--- 35,5 10 0,1786

Total (∑fi) 56 1,00

Após calcular a última, você deve calcular


o total, que deve ser 1,00 ou aproximado,
devido aos arredondamentos

Fonte: Elaboração do autor (2010).

Lembre-se: use sempre quatro casas decimais para arredondar a frequência relativa.

32
Probabilidade e Estatística

Frequência percentual (fp)


É a frequência relativa multiplicada por 100. É dada em porcentagem (%).


fp = fr . 100

Sendo:

fp: frequência percentual;

fr: frequência relativa.

Tabela 1.10 − Volume de vendas

Volume de vendas No de
fr fp (%)
(em mil reais) representantes (fi)
0,2143.100 = 21,43
15,9 |--- 18,7 12 0,2143 21,43
0,1429.100 = 14,29
18,7 |--- 21,5 8 0,1429 14,29

21,5 |--- 24,3 12 0,2143 21,43 0,2143.100 = 21,43

24,3 |--- 27,1 5 0,0893 8,93 0,0893.100 = 8,93

27,1 |--- 29,9 3 0,0536 5,36 0,0536.100 = 5,36

29,9 |--- 32,7 6 0,1071 10,71


0,1071.100 = 10,71

32,7 |--- 35,5 10 0,1786 17,86


0,1786.100 = 17,86
Total (∑fi) 56 1,00 100,00

Após calcular a última, você deve calcular


o total, que deve ser 100 ou aproximado,
devido aos arredondamentos

Fonte: Elaboração do autor (2010).

Observe que, ao usar quatro casas decimais para a frequência relativa, o


percentual ficou com duas casas decimais. Usaremos duas casas decimais em
todos nossos casos.

Para que serve a frequência percentual?


Mais uma vez, você está apresentando um relatório de vendas da empresa
para a diretoria.

33
Capítulo 1

E vem aquela pergunta: “O que representa, do total, os representantes que


venderam de 32,70 a 35,50 mil reais?” Você poderia responder diretamente, sem
cálculos: “17,86%”.

E, se perguntarem: “Quantos representantes venderam de 24,3 a 27,1 mil reais ou


mais?” Você responderia: “8,93%”.

Observe que, nesse exemplo, o volume de vendas questionado é sempre um


intervalo. Antes de acompanhar os outros tipos de frequência, entenda o que é
ponto médio de uma classe.

Ponto médio de uma classe são os valores da variável que se encontram


exatamente na metade do intervalo de cada classe.

Para calcular o ponto médio, usa-se a média aritmética simples dos limites de
cada intervalo.


Ls + Li
PM =
2

Sendo:

PM: ponto médio;

Ls: limite superior do intervalo;

Li: limite inferior de cada intervalo.

A tabela, a seguir, indica o cálculo do ponto médio para o exemplo que estamos
estudando.

Tabela 1.11 − Volume de vendas.

Volume de vendas No de 15,9 + 18,7 = 17,3


(em mil reais) representantes (fi)
PM PM =
2
15,9 |--- 18,7 12 17,3
18,7 + 21,5 = 20,1
18,7 |--- 21,5 8 20,1 PM =
2
21,5 |--- 24,3 12 22,9

21,5 + 24,3 = 22,9


24,3 |--- 27,1 5 25,7 PM =
2
27,1 |--- 29,9 3 28,5

24,3 + 27,1 = 25,7


29,9 |--- 32,7 6 31,3 PM =
2
32,7 |--- 35,5 10 34,1

Total (∑fi) 56

Fonte: Elaboração do autor (2010).

34
Probabilidade e Estatística

Lembre-se deste conceito, o ponto médio será usado para outros cálculos que
você irá realizar mais adiante, tais como média e desvio padrão.

Seção 3
Representação gráfica
O gráfico constitui outra maneira de se apresentarem os dados estatísticos. Eles
têm a finalidade de mostrar com clareza, veracidade e rapidez os dados que
estão sendo estudados. Além disso, os gráficos propiciam uma noção muito boa
de como algum fenômeno comporta-se.

Por meio de formas geométricas, os gráficos mostram, por área ou volume, as


diferenças entre as opções de cada variável.

Tome cuidado ao interpretar um gráfico. Assim como os gráficos podem dar


informações rápidas e precisas, sua manipulação pode distorcer a realidade,
provocando tendenciosidade nas informações.

Observe os gráficos a seguir.

Gráfico 1.1 − Censo demográfico Brasil 1890 – 2000

Censo Demográfico - Brasil - 1890 - 2000


180
160
140
População (em milhões)

120
100
80
60
40
20
0
1890

1900

1920

1940

1950

1960

1970

1980

1990

2000

Anos

Fonte: IBGE (2010).

35
Capítulo 1

Gráfico 1.2 − Censo demográfico Brasil 1890 – 2000

Censo Demográfico - Brasil - 1890 - 2000


180
160
140
População (em milhões)

120
100
80
60
40
20
0
1890 1900 1920 1940 1950 1960 1970 1980 1990 2000
Anos

Fonte: IBGE (2010).

Observe que, no Gráfico 1.1, a impressão é de que a população aumenta


abruptamente, enquanto que, no Gráfico 1.2, a impressão é de que a população
aumenta lentamente. E a única diferença entre os dois gráficos é a largura que se
usou para cada um deles. Em alguns casos, isso pode ser muito prejudicial.

Os gráficos comunicam as mesmas ideias das tabelas, porém produzem uma


impressão e compreensão mais rápida, mais viva, pois eliminam detalhes
desnecessários, apresentando somente as características mais importantes dos dados.

O gráfico estatístico é uma forma de apresentação dos dados estatísticos, cujo


objetivo é o de produzir, no investigador ou no público em geral, uma impressão
mais rápida e viva do fenômeno em estudo, já que os gráficos falam mais rápido à
compreensão do que as séries.

A representação gráfica de um fenômeno deve obedecer a certos requisitos


fundamentais para ser realmente útil. São eles:

a. simplicidade: o gráfico deve ser destituído de detalhes com


importância secundária, assim como de traços desnecessários que
possam levar o observador a uma análise morosa ou com erros;
b. clareza: o gráfico deve possibilitar uma correta interpretação dos
valores representativos do fenômeno em estudo;
c. veracidade: o gráfico deve expressar a verdade sobre o fenômeno
em estudo.

36
Probabilidade e Estatística

Para a construção de gráficos, você deverá observar alguns itens que se fazem
necessários neles:

•• todo gráfico deve ter título e fonte (no rodapé), para que o leitor não
tenha a necessidade de voltar ao texto para saber do que se trata;
•• a escala do eixo horizontal deve ser escrita abaixo deste e deverá
crescer da esquerda para a direita;
•• a escala do eixo vertical deve ser escrita à esquerda deste e crescer
de baixo para cima;
•• cada eixo deve ser identificado com o que está sendo medido ou
representado;
•• não é necessário colocar linhas de grade (que saem das marcas das
escalas horizontais e verticais), pois estas são opcionais.

Acompanhe, a seguir, um gráfico com todos os detalhes citados.

Gráfico 1.3 – Censo demográfico – Brasil – 1890 – 2000

180
Eixo vertical
160
140
População (em milhões)

120
100
80
60
Aqui, a escala Linha de grade
40
fica a esquerda
20
0
1890 1900 1920 1940 1950 1960 1970 1980 1990 2000
Anos
Eixo horizontal
Gráfico 3.3 - Censo demográfico - Brasil - 1890 - 2000 Aqui, a escala
Título e
Fonte Fonte: IBGE (2007) fica abaixo

Antigamente, os gráficos eram feitos à mão, com a ajuda de régua, compasso,


transferidor, esquadros e canetas ou giz coloridos. Hoje, podemos contar com
softwares específicos que auxiliam e facilitam na construção de gráficos e,
muitas vezes, propiciam mais precisão e clareza. Além dos softwares específicos
de Estatística, temos os programas aplicativos de escritório, que incluem as
chamadas planilhas eletrônicas.

37
Capítulo 1

Uma planilha eletrônica utiliza tabelas para a realização de cálculos e permite,


também, a criação de vários tipos de gráficos, o que facilita a representação e
análise de dados estatísticos.

Os principais tipos de gráficos são os diagramas, os cartogramas e os pictogramas.

Diagramas
Os diagramas são gráficos geométricos de, no máximo, duas dimensões; para
sua construção, em geral, fazemos uso do sistema cartesiano (eixo X e Y). Os
principais diagramas são os gráficos de linhas, colunas, barras, setores ou pizza e
o gráfico polar. Veja cada um desses tipos.

•• Gráfico de colunas
É usado para apresentar séries temporais, geográficas e específicas. Formado
por retângulos dispostos verticalmente, de mesma largura (arbitrária), com altura
proporcional às grandezas (variáveis) do fenômeno a ser representado.

Todos os retângulos têm base comum no eixo de x e, no eixo de y, os valores das


variáveis estudadas. Observe os exemplos na Tabela 2.10 e nos Gráficos 2.6 e 2.7.

Tabela 1.12 − Mortalidade Infantil, na região Sul e Sudeste, 2004

Estado Por mil nascimentos

SC 17,2

RS 14,3

PR 20,0

SP 16,5

RJ 20,9

ES 20,1

MG 21,8

Fonte: Portal Brasil (2004).

38
Probabilidade e Estatística

Gráfico 1.4 − Mortalidade Infantil, na região Sul e Sudeste, 2004

25

20
Por mil nascimentos

15

10

0
SC RS PR SP RJ ES MG

Fonte: Portal Brasil (2004).

Gráfico 1.5 − Porcentagem de mulheres, com filhos antes dos 20 anos, 2000

50 47

45

40
35
35
29
30
Percentual (%)

25

20 19

15

10

0
África América do Norte América Latina Ásia

Fonte: Population Reference Bureau (2000).

39
Capítulo 1

•• Gráfico de barras
Segue as mesmas normas do gráfico de colunas, porém os retângulos ocupam
posição horizontal e, por isso, terão base comum no eixo y. É também mais
indicado para séries geográficas e específicas.

•• Gráfico de linhas
É comum, para quem trabalha na área de administração e negócios, observar o
comportamento de uma variável ao longo do tempo. Por exemplo, um executivo
que acompanha a cotação diária das ações da sua empresa, um gerente que
acompanha o volume semanal de vendas de sua loja ou um engenheiro de
produção que acompanha características de qualidade do produto que fabrica.

•• Gráfico de setores ou de pizza


É usado para mostrar a importância relativa das proporções e é construído a
partir das coordenadas polares:

· comparar a parte com o todo;


· é formado por um círculo, do qual cada parte representa um
percentual da variável.

Neste caso, utilizamos o mesmo exemplo do gráfico de barras, de modo que


você possa analisar as proporções no gráfico de setores.

•• Gráficos em colunas ou em barras múltiplas


Este tipo de gráfico é, geralmente, empregado quando queremos representar,
simultaneamente, dois ou mais fenômenos estudados com o propósito de comparação.

Tabela 1.13 − Balança Comercial brasileira (Valores em US$ Milhões), 2005 a 2009

Ano Exportação Importação


2005 118.309 73.545
2006 137.807 91.350
2007 160.649 120.610
2008 197.953 173.148
2009 152.252 127.637
Fonte: Base de dados do Portal Brasil (2010).

40
Probabilidade e Estatística

Gráfico 1.6 − Balança comercial brasileira (Valores em US$ milhões), 2005 a 2009

200.000
180.000
160.000
140.000
120.000
Valores

100.000
Exportação
80.000
60.000 Importação
40.000
20.000
0
.2005 .2006 .2007 .2008 .2009 Ano
Fonte: Base de dados do Portal Brasil, Banco Central do Brasil,
Ministério do Desenvolvimento, Siscomex e Fundação

Fonte: Portal Brasil (2010).

Análise dos dados: observando o gráfico, podemos concluir que o saldo da


balança comercial brasileira é positivo, pois as colunas em cinza-claro, que
representam as exportações em todos os anos, são maiores do que as colunas
de cor cinza-escuro, que representam as importações.

O ano que representou um maior volume de exportação e também de importação


foi o de 2008. O menor volume de importação foi no ano de 2005.

•• Gráfico polar
É o gráfico mais indicado quando temos necessidade de representar variações
cíclicas, ou seja, que se repetem em períodos predeterminados. O gráfico polar é
mais utilizado em estudos climáticos (para séries temporais).

Cartograma

O cartograma é a representação sobre um mapa. Este gráfico é empregado


quando o objetivo é o de figurar os dados estatísticos diretamente relacionados
com áreas geográficas ou políticas.

Pictogramas

Pictogramas são construídos a partir de figuras ou conjunto de figuras


representativas da intensidade ou das modalidades do fenômeno.

São mais utilizados em jornais, revistas, cartazes e propagandas, ou seja, quando se


deseja dar um efeito mais atrativo ou chamar a atenção, sem nenhum rigor científico.

41
Capítulo 1

Representação gráfica de uma distribuição


Alguns gráficos em Estatística são usados para interpretações de informações,
análises de dados e, também, para a dedução geométrica de fórmulas de
algumas medidas importantes.

Para as distribuições de frequências simples, são utilizados o histograma e


o polígono de frequências. E, para as frequências acumuladas, é utilizado o
polígono de frequências acumuladas.

•• Histograma
Este gráfico é muito semelhante ao de colunas, ou seja, é formado por um
conjunto de retângulos justapostos, de maneira que a altura de cada retângulo
seja proporcional à frequência simples da classe por ele representada.

É construído no sistema de eixos cartesianos. No eixo horizontal, são marcados


os valores ou intervalos das classes assumidos pela variável. No eixo vertical,
são marcadas as frequências simples, que servirão para marcar a altura dos
retângulos, indicando, assim, o número de observações (ocorrências) de cada
valor ou classe da variável.

Como a altura de cada retângulo é proporcional à frequência simples, a área de


cada retângulo também é. Considerando isso, a soma das áreas dos retângulos
também é proporcional à frequência total.

Para construir um histograma:

•• desenhe os eixos vertical e horizontal;


•• faça as escalas em cada um dos eixos – no horizontal, os intervalos
de classe; e, no vertical, a frequência;
•• desenhe os retângulos que representam cada intervalo com a
mesma largura de cada intervalo e com a altura proporcional às
frequências dos intervalos;
•• não se esqueça de escrever o título e a fonte.

Observe o exemplo na Tabela 1.12 e no Gráfico 1.7.

42
Probabilidade e Estatística

Tabela 1.14 − Quantidade de óxido de enxofre

Quantidade de óxido de Nº de meses (fi)


enxofre

6,2 |--- 9,9 6

9,9 |--- 13,6 10

13,6 |--- 17,3 11

17,3 |--- 21,0 20

21,0 |--- 24,7 13

24,7 |--- 28,4 7

28,4 |--- 32,1 3

Total 70

Fonte: Elaboração do autor (2010).

Gráfico 1.7 − Emissão de óxido de enxofre nos últimos 70 meses (em toneladas)

25

20
20

15 13
No meses

11
10
10
7
5
5
3

0
6,2 |--- 9,9 9,9 |--- 13,6 13,6 |--- 17,3 17,3 |--- 21,0 21,0 |--- 24,7 24,7 |--- 28,4 28,4 |--- 32,1

Fonte: Elaboração do autor (2010).

Há uma analogia dos histogramas com os gráficos de barras. Contudo, nos


gráficos de barras, não há necessidade de se usar escala horizontal contínua,
além de não ser necessária a rigidez de construção que têm os histogramas.

43
Capítulo 1

•• Polígono de frequências
Unindo por linhas retas os pontos médios das bases superiores dos retângulos
do histograma, obtém-se outra representação dos dados, denominada
polígono de frequências.

Você pode observar que a área do histograma é igual à área abaixo do polígono
de frequências, ou seja, os retângulos que ficam fora são compensados pelos
triângulos que estão adicionados por dentro.

Gráfico 1.8 − Emissão de óxido de enxofre (em toneladas)

25

20
20

15 13
No meses

11
10
10
7
5
5
3

0
6,2 |--- 9,9 9,9 |--- 13,6 13,6 |--- 17,3 17,3 |--- 21,0 21,0 |--- 24,7 24,7 |--- 28,4 28,4 |---32,1

Fonte: Elaboração do autor (2010).

Você também terá a oportunidade de adquirir mais uma importante ferramenta


para utilizar na análise e interpretação de dados: a representação gráfica.
Você irá conhecer alguns tipos de representação gráfica mais utilizados e suas
características.

Poderá constatar que os dados representados por meio de gráficos, muitas


vezes, facilitam a leitura e a compreensão de algum fenômeno ou acontecimento.

44
Probabilidade e Estatística

Atividades de autoavaliação
Ao final de cada unidade, você realizará atividades de autoavaliação. O gabarito
está disponível no final do livro didático, mas se esforce para resolver as
atividades sem a ajuda do gabarito, pois, assim, você estará promovendo (e
estimulando) a sua aprendizagem.

1. Analise os conceitos de censo e estimação e descreva a principal diferença


entre os termos.

2. Ao escolher os elementos de uma amostra, o que você deve considerar para


que ela seja representativa? Por quê?

3. Como você pôde acompanhar, existem dois tipos de variáveis: a qualitativa,


que está dividida em nominal e ordinária, e a quantitativa, que está dividida em
contínua e discreta. Identifique, no seu dia a dia, pelo menos um exemplo de cada
uma dessas variáveis e escreva-as no quadro a seguir.

Variável Exemplo

Qualitativa nominal

Qualitativa ordinal

Quantitativa discreta

Quantitativa contínua

4. Ao planejar uma pesquisa sobre uma determinada síndrome, um pesquisador


tem a intenção de usar um questionário para a coleta de dados e, também,
planeja fazer um levantamento de dados no Ministério da Saúde, para que possa
realizar comparativos. Como consequência disso, ele terá que trabalhar com dois
tipos de dados: os resultantes dos questionários e os resultantes do levantamento
no Ministério. Classifique os dois tipos de dados.

a. Os dados coletados por meio de questionário são:________________


b. Os dados coletados no Ministério são:__________________________

45
Capítulo 1

5. Classifique cada uma das variáveis a seguir em qualitativa nominal ou ordinal


e em quantitativa discreta ou contínua.

Descrição da variável Classificação

• Saldo em conta corrente em R$:

• Idade do cliente:

• Sexo do cliente:

• Classe econômica:

• Estado civil:

• Número de defeitos do produto:

• Consumo de energia em kWh:

• Número de filhos:

• Comprimento da peça:

• Tempo de espera em caixa eletrônico


(em minutos):

• Nome de país exportador de petróleo:

• Grau de satisfação no atendimento


em uma loja comercial:

• Número de alunos de uma


universidade:

46
Probabilidade e Estatística

6. Um relatório recente distinguiu em seis tipos os principais motivos de tensão


(estresse). A pesquisa realizada para provar isso resultou nos dados a seguir
(dados fictícios).

MP MC DO DG MF

DM MF MP DG MC

MC MF MF MC MC

MF MC MP DO MP

MP MP DM MP DO

MP DM DG DM MC

MF MF MF MF MF
Legenda: tipos de fobias
DO MP DG MP DG MF: Morte de um filho;
MC: Morte do cônjuge;
MF MC MF MP DO MP: Morte dos pais ou irmãos;
DO DO DM MF MC DO: Divórcio;
DG: Doença grave;
MF DM MC MC DG
DM: Demissão.
DO MF DG MF MC

Monte a tabela de frequência simples, não esquecendo de todos seus


componentes.

7. Uma empresa procurou estudar a ocorrência de acidentes com seus


empregados, tendo, para isso, realizado um levantamento abrangendo um
período de 36 meses. No levantamento, foi observado o número de operários
acidentados para cada mês. Os dados correspondentes estão expostos a seguir.

4 8 6 6 4 5

6 5 8 5 6 5

8 5 7 6 8 7

3 3 4 4 3 3

5 5 4 6 5 5

7 7 6 8 8 7

Levando em consideração os dados apresentados, monte a tabela com as


variáveis quantitativas discretas.

47
Capítulo 1

8. Os dados a seguir representam a renda de uma amostra de famílias de um


bairro de classe baixa de Florianópolis, em reais (dados fictícios). Construa
a tabela de distribuição de frequências. Usar k = 6 (número de intervalos).
Sugestão: ao calcular o h (tamanho de cada intervalo), arredonde para um número
inteiro. Exemplo: 3,84 4

115 121 117 124 122 116

123 118 123 119 123 126

128 122 112 125 124 126

125 121 129 127 128 129

113 115 116 124 119 118

126 129 116 127 123 121

9. Uma empresa procurou estudar a ocorrência de acidentes com seus


empregados, tendo, para isso, a Comissão Interna de Prevenção de Acidentes
(CIPA) realizado um levantamento abrangendo um período de 36 meses, em que
foi observado o número de operários acidentados em cada mês. A tabela abaixo
resume estes dados:

Número de operários acidentados em cada mês

Número de Número de fa fr fp (%)


acidentados meses

3 4

4 5

5 9

6 7

7 5

8 6

Total (Σfi) 36

Fonte: Elaboração do autor (2006).

48
Probabilidade e Estatística

Complete a tabela com as frequências acumulada, relativa e percentual. Depois,


responda as perguntas.

a. Em quantos meses a empresa teve um número de funcionários


acidentados menor do que 6? ______
b. Em quantos meses a empresa teve um número de funcionários
acidentados maior ou igual a 5? ______
c. Qual foi o percentual de meses em que a empresa verificou 5
funcionários acidentados? ______
d. Qual foi o percentual de meses em que a empresa verificou 7
funcionários acidentados? ______

10. A seguir, você tem uma distribuição de frequências e um sistema de eixos.


Construa o histograma e o polígono de frequências para essa distribuição usando
o sistema de eixos (não se esqueça de todos os componentes de um gráfico,
inclusive as escalas dos eixos, título e fonte): tempo de sono, em minutos,
induzido em ratos por injeção de certo químico, na dosagem de 40 mg por quilo.

Tempo de sono (em min.) Número de ratos

7 |--- 12 2

12 |--- 17 6

17 |--- 22 17

22 |--- 27 9

27|--- 32 5

32 |--- 37 2

49
Capítulo 2

Medidas de posição e dispersão

Seção 1
Medidas de posição
Neste capítulo, você vai obter mais ferramentas de estatística descritiva para auxiliá-
lo a compreender e a utilizar a Estatística no seu dia a dia profissional. O objetivo
aqui é estudar medidas importantes e bastante utilizadas nos métodos estatísticos.

O cálculo de medidas como a média, a moda e a mediana, e os conceitos


apresentados neste capítulo, são de grande valia no seu cotidiano profissional,
pois fornecerão dados que serão pertinentes para o entendimento de algum fato
ou acontecimento. Chamamos essas medidas de medidas de posição.

Contudo, conhecer as interpretações dessas medidas não basta por si só.


Por meio delas, podemos chegar a algumas conclusões, mas estas não são
suficientes, por isso, você vai estudar, também, medidas que irão auxiliá-lo na
avaliação do comportamento das séries de dados com relação à sua média.
Chamamos essas medidas de medidas de dispersão.

Muitas vezes você irá deparar-se com uma massa de dados grande o bastante
para que a leitura e a análise tornem-se muito difíceis. Então, como fazer para
tirar informações relevantes e resumir os dados de forma eficaz nesses casos?
Usando medidas estatísticas. Neste capítulo, vamos ver algumas delas.

As medidas de posição, assim chamadas pela posição que elas ocupam na série
estatística, quando bem utilizadas e interpretadas, podem ser úteis, não só por
elas mesmas, mas também auxiliando o cálculo de outras medidas.

51
Capítulo 2

Além de tudo, elas facilitam o estudo de grandes volumes de dados, pois as


medidas de posição podem resumir as informações, dando a você uma noção do
comportamento do todo. As medidas de posição estão divididas da seguinte maneira:

a. Medidas de tendência central: são valores da variável que tendem


a estar no centro da série, por isso o nome. Referem-se ao valor da
variável que está, senão no centro, perto dele. Está dividia em três
tipos: média, mediana e moda.
b. Separatrizes: são valores da variável que dividem a série ordenada de
dados em partes que contêm a mesma quantidade de observações.

Medidas de Tendência Central

a. Média
A média é uma das medidas mais importantes dentro da Estatística. Ela é o
ponto de equilíbrio de uma série de dados. Veja a figura a seguir, extraída do livro
Introdução à Estatística, Triola (1999).

Figura 2.1 − A média como ponto de equilíbrio

Fonte: Triola (1999, p. 32).

Vários tipos de médias podem ser calculados para uma massa de dados. A mais
importante é a média aritmética, que você irá estudar nesta seção.

A média aritmética é a soma de todos os elementos de uma série de dados,


dividida pelo número de elementos que compõe essa série. Veja a seguir
como representá-la.

52
Probabilidade e Estatística

Notação:
= média dos dados de uma amostra.

μ = média dos dados de uma população (em que μ = 12° letra do alfabeto grego,
“μ” lê-se como “mi”).

a. A média aritmética para dados brutos


Agora, você vai calcular a média para dados que não foram organizados em
tabelas, ou seja, estão conforme foram coletados, brutos.

A soma de todos os valores dividida pelo número de valores.

Em que:

•• n = número de valores da série (ou tamanho da amostra);


•• xi = valores da série.

Veja, a seguir, um exemplo bem detalhado para compreender como realizar os


cálculos.

Um exemplo bem típico é calcular a média das notas das provas. Digamos que as
notas de uma disciplina cursada por você sejam: 7; 7,8; 6 e 8, então a média será:

b. A média aritmética para dados agrupados


Agora, você vai calcular a média para dados que foram organizados em tabelas, ou
seja, após a coleta, eles foram organizados em categorias e escritos em uma tabela.

b.1 Dados agrupados sem intervalos (variável discreta)

Para os dados agrupados (em tabela), sem intervalos, utiliza-se a fórmula descrita
a seguir, em que cada frequência simples pode ser considerada como peso. Por
isso que se chama, também, de média aritmética ponderada (pesos).

53
Capítulo 2

A soma de todos os valores multiplicados por sua frequência simples dividida


pela soma das frequências (frequência total).

Em que:

•• n = número de valores da série (ou tamanho da amostra);


•• xi = valores da série;
•• fi = frequência simples de cada xi.

Veja, na sequência, um exemplo. Calcule a média dos dados representados na


tabela abaixo.

Tabela 2.1 – Número de filhos por famílias de um bairro de Florianópolis

No de filhos (xi) No de famílias (fi) xi . fi


0 x 14 = 0
0 14 0
1 16 16 1 x 16 = 16
2 11 22 2 x 11 = 22
3 9 27 3 x 9 = 27
4 4 16
5 1 5
6 1 6
Σxi.fi = 92
Total (Σfi) 56 92
Somar as frequências simples
Fonte: Elaboração do autor (2006).

Veja, agora, como calcular passo a passo.

Passo 1: some a coluna das frequências simples (fi) para obter Σfi (frequência total).

Σfi = 56
Passo 2: multiplique cada xi por sua correspondente fi e escreva o resultado na
coluna xi.fi.

54
Probabilidade e Estatística

Passo 3: some os valores calculados no passo 2 e escreva a soma no final da


coluna. Esse resultado é o Σxi.fi.

Σxi.fi = 92
Passo 4: divida o resultado do passo 3 (Σxi.fi) pelo resultado do passo 1 (Σfi).

Como interpretar esses dados? O valor médio da série é 1,64, ou seja, a média
de filhos por família é de 1,64 filhos. Analisando dessa maneira, pode parecer um
absurdo, mas você pode concluir que a média de filhos por família é de 1 a 2 filhos.
Ou de, aproximadamente, dois filhos, arredondando para cima.

b.2 Dados agrupados com intervalos (variável contínua)

Para os dados agrupados em tabela, com intervalos, você deve utilizar a fórmula
descrita a seguir, semelhante àquela utilizada para dados sem intervalos, entretanto,
por estarmos usando intervalos, usamos os pontos médios para representar xi.

A média, da mesma forma que para variável discreta, é a soma de todos os


pontos médios (x) multiplicados por sua frequência simples, dividida pela soma
das frequências (frequência total).

Em que:

•• n = número de valores da série (ou tamanho da amostra);


•• PM = ponto médio do intervalo;
•• fi = frequência simples de cada intervalo.

Quando trabalhamos com dados agrupados em intervalos, passamos a trabalhar


com a perda dos valores individuais, ou seja, sabemos a frequência de cada
intervalo, mas não sabemos exatamente quais são os valores contidos nele
(intervalo). Por esse motivo, o cálculo da média, nesse caso, é feito com o uso do
ponto médio. A média, sendo assim, é um valor aproximado.

55
Capítulo 2

Veja o exemplo a seguir para compreender melhor.

Calcule a média dos dados representados como na tabela abaixo.

Tabela 2.2 – Quantidade emitida de óxido de enxofre (SO), em toneladas, pelas fábricas do distrito
industrial de Florianópolis

(15,9 + 18,7)/2 = 17,3


Qtde. de SO No de meses
PM PM.fi
(em ton.) (fi)
17,3 x 12 = 207,6
15,9 |-- 18,7 12 17,3 207,6
20,1 x 8 = 160,8
18,7 |-- 21,5 8 20,1 160,8
21,5 |-- 24,3 12 22,9 274,8 22,9 x 12 = 274,8
24,3 |-- 27,1 5 25,7 128,5 25,7 x 5 = 128,5
27,1 |-- 29,9 3 28,5 85,5
29,9 |-- 32,7 6 31,3 187,8
32,7 |-- 35,5 10 34,1 341
Σxi.fi = 1386
Total (Σfi) 56 1386
Somar as frequências simples
Fonte: Elaboração do autor (2006).

Veja, a seguir, como calcular passo a passo.

Passo 1: some a coluna das frequências simples (fi) para obter Σfi (frequência total).

Σfi = 56
Passo 2: calcule o ponto médio de cada intervalo.

Passo 3: multiplique cada PM por sua correspondente fi e escreva o resultado na


coluna PM.fi.

Passo 4: some os valores calculados no passo 3 e escreva a soma no final da


coluna; esse resultado é o ΣPM.fi.

ΣPMi.fi = 1386

Passo 5: divida o resultado do passo 4 (ΣPM.fi) pelo resultado do passo 1 (Σfi).

= 1386/56=24,75

Como interpretar o resultado? A quantidade média de óxido de enxofre emitida,


em 56 meses, foi de 24,75 toneladas.

56
Probabilidade e Estatística

b. Mediana
A mediana é um valor que divide a série de dados em duas partes iguais, ou seja,
é o valor observado que está no meio da série.

Notação:
Me = Mediana (também é usado md).

a. Mediana para dados brutos


Agora, você vai calcular a mediana para dados que não foram organizados em
tabelas, ou seja, estão conforme foram coletados, brutos. Após a ordenação
crescente dos dados, determinamos o número de elementos (n) do mesmo.

Separamos em dois casos:

a.1) quando o n (tamanho da amostra) é ímpar − o cálculo da posição da


mediana deve ser conforme segue:

a.2) quando o n (tamanho da amostra) é par − o cálculo da posição da mediana


deve ser realizado com a seguinte fórmula:

Veja, passo a passo, como calcular a mediana para dados brutos quando o
(n) é ímpar.

• Calcular a mediana da série X: 5, 30, 27, 9, 15, 19, 24, 20, 31.

Passo 1: ordene os valores de forma crescente 5, 9, 15, 19, 20, 24, 27, 30, 31.

Passo 2: o número de elementos é 9 ( n = 9, ímpar).

Passo 3: calcule a posição da mediana.

57
Capítulo 2

Passo 4: a mediana é o 5º elemento, volte para rol de dados e conte até o quinto x.

Me = 20 (a resposta é sempre me X).

1º 2º 3º 4º 5º 6º 7º 8º 9º

5 9 15 19 20 24 27 30 31

Como interpretar esses dados? 50% dos valores da série são menores ou iguais
a 20, e 50% dos valores da série são maiores ou iguais a 20.

Veja, passo a passo, como calcular a mediana para dados brutos quando o
(n) é par.

Para você encontrar a mediana, é preciso calcular o ponto médio dos dois valores
que ocupam as posições calculadas.

• Calcular a mediana da série X: 5, 30, 27, 9, 15, 19, 24, 20.

Passo 1: ordene os números de forma crescente 5, 9, 15, 19, 20, 24, 27, 30.

Passo 2: o número de elementos é 8 ( n = 8, par).

Passo 3: calcule as duas posições, Pos1 e Pos2.

Passo 4: a mediana está entre o 4º e o 5º elemento.

1º 2º 3º 4º 5º 6º 7º 8º

5 9 15 19 19,5 20 24 27 30

Como interpretar esses dados? 50% dos valores da série são menores do que
19,5, e 50% dos valores da série são valores maiores do que 19,5.

58
Probabilidade e Estatística

Você viu como se encontra a mediana para dados brutos? Assim como você
estudou na média, aqui, também para efeito de cálculo, você usará diferente
tratamento quando se tratar de dados agrupados com intervalos (variável
contínua) e dados agrupados sem intervalos (variável discreta).

b. Mediana para dados agrupados


Se os dados estão apresentados na forma de uma tabela, eles já estão
naturalmente ordenados. Então, vamos calcular a mediana para dados agrupados
sem intervalos e com intervalos de classe. Observe o exemplo.

Tabela 2.3 – Idade de 50 alunos de uma universidade

Número de fac
Idade (anos) alunos
1a a 3a posição
17 3 3
18 18 21 4a a 21a posição

19 17 38 22a a 38a posição


20 8 46 39a a 46a posição
21 4 50 47a a 50a posição
Total 50

Fonte: Elaboração do autor (2010)

Para facilitar a localização dos termos centrais, construímos a frequência


acumulada crescente (fac).

O primeiro passo é encontrar a posição em que se encontra a mediana.

Logo:

O resultado indica que a mediana está na 250 e 260 posição, então precisamos
verificar os valores na terceira coluna da frequência acumulada. Temos 3 alunos
com 17 anos e 21 alunos com 18 anos. Até aqui, já estamos na 240 posição, logo
a posição seguinte é a que procuramos. Por isso, na soma 38, estão inclusos os
valores da 250 posição até a 3800.

Para descobrir a mediana, basta verificarmos qual idade corresponde a essa


soma, ou seja, 19 anos.

59
Capítulo 2

Assim:

Mediana = 19 anos.

Interpretação

•• 50% dos alunos da série possuem idade inferior ou igual a 19 anos; e


•• 50% dos alunos da série possuem idade igual ou superior a 19 anos.

Dados agrupados com intervalo de classe (variável contínua). Quando a série é


agrupada em classes, a mediana corresponderá ao termo que dividir a série em
duas partes iguais.

A classe que contém a mediana, chamamos classe mediana.

Neste caso, vamos localizar uma classe onde se encontra a mediana, utilizando
a fórmula:

Em que:

•• Li = Limite inferior da classe que contém a mediana;


•• n = número de elementos da série;
•• Fa = frequência acumulada anterior;
•• fi = frequência da classe mediana;
•• h = amplitude do intervalo de classe.

Todas as medidas calculadas para uma variável contínua serão valores aproximados
para essas medidas, uma vez que, ao agruparmos os dados segundo uma variável
contínua, há perda de informações referentes à identidade dos dados. (SILVA, 1999).

Exemplo: a tabela a seguir revela o consumo de energia elétrica em 250 residências


de famílias da classe média, com dois filhos. Calcule e interprete o valor mediano.

60
Probabilidade e Estatística

Tabela 2.4 – Consumo de energia elétrica em residências

Consumo (kWh) No de famílias


0 |-- 50 2
50 |-- 100 15
100 |-- 150 32
150 |-- 200 47
200 |-- 250 50
250 |-- 300 80
300 |-- 350 24
Total 250
Fonte: Elaboração do autor (2010)

Para o cálculo da mediana, o primeiro passo é calcular a frequência acumulada


crescente, acrescentando os valores em uma nova coluna na própria tabela.

Tabela 2.5 – Consumo de energia elétrica em residências

Consumo (kWh) No de famílias fac


0 |-- 50 2 2
50 |-- 100 15 17
100 |-- 150 32 49
150 |-- 200 47 96
97a a 146a posição, logo
200 |-- 250 50 146 a mediana encontra-se
250 |-- 300 80 226 nesta classe

300 |-- 350 24 250


Total 250
Fonte: Elaboração do autor (2010).

O primeiro passo é encontrar a posição em que está a mediana.

Logo:

Observando a coluna com a fa, verificamos que a posição 960 vai até 200 kWh,
assim a 125a e 126a é a posição seguinte, que vai até a posição 146a. Essa é a
classe da mediana que vai de 200 até 250 kWh.

61
Capítulo 2

Agora, vamos identificar os dados para aplicar na fórmula:

•• Li = 200 (limite inferior da classe da mediana);


•• n = 250 (número da amostra);
•• Fa = 96 (frequência acumulada anterior);
•• fi = 50 (frequência da classe mediana);
•• h = 50 (amplitude do intervalo de classe).

Após a identificação de todos os valores, vamos aplicar na fórmula.

Interpretação

•• 50% das famílias consumiram valor igual ou inferior a 229 kWh; e


•• 50% das famílias consumiram valor igual ou superior a 229 kWh.

c) Moda
A moda é um valor que mais se repete em uma série de dados, ou seja, é o valor
com maior frequência.

Notação:
Mo = Moda.

62
Probabilidade e Estatística

a. Moda para dados brutos


Agora, você vai encontrar a moda para dados que não foram organizados em
tabelas, ou seja, que estão conforme foram coletados, brutos. A moda será o
valor que mais se repete no conjunto de dados.

Veja os exemplos.

•• Exemplo 1: X: 15, 16, 19, 20, 20, 22, 22, 22, 25, 26, 28.
O elemento que mais se repete é o 22, então, Mo = 22. Observe que o número
20 repete-se, mas não mais do que o 22. Para esse caso, no qual a Mo = 22,
afirma-se que a série é unimodal.

•• Exemplo 2: X: 15, 16, 20, 20, 20, 22, 22, 22, 25, 26, 28.
Os elementos que mais se repetem são o 20 e o 22, então Mo1 = 20 e Mo2 =
22. Para esse caso, no qual temos duas modas na série, afirma-se que a série é
bimodal. Acima de duas modas, é mais comum chamarmos a série de polimodal.

•• Exemplo 3: X: 20, 20, 22, 22, 25, 25, 28, 28.


Na série anterior, não temos um elemento que mais se repete, pois todos têm a
mesma frequência. Nesse caso, afirma-se que a série é amodal.

Você viu como se encontra a moda para dados brutos. Assim como você estudou
na média, aqui, também para efeito de cálculo, você usará diferente tratamento
quando se tratar de dados agrupados com intervalos (variável contínua) e dados
agrupados sem intervalos (variável discreta).

b. Moda para dados agrupados


Vimos que, para calcular a moda em uma série com dados não agrupados em
classe (variável contínua), é necessário observar somente o termo que mais
aparece, ou seja, a frequência mais alta.

Veja o exemplo na tabela a seguir.

Tabela 2.6 – Idade de 50 alunos de uma universidade

Idade (anos) Número de alunos

17 3

18 18

19 17

20 8

21 4

Total 50

Fonte: Elaboração do autor (2010).

63
Capítulo 2

Para identificarmos a média, precisamos observar a maior frequência, que,


neste caso, é 18. Logo, a idade que corresponde a maior frequência é 18,
então a moda = 18 anos.

Para uma distribuição de frequência com os dados agrupados em classe (variável


continua), pela própria complexidade como as variáveis apresentam-se, teremos
que fazer uso de uma fórmula, para podermos identificar a moda.

Um breve histórico da moda para dados agrupados. No início, o cálculo da moda


fazia-se pelo ponto médio da classe modal: tratava-se de uma forma bem simples
e rudimentar de calcular. Depois, percebeu-se que esse método apresentava
falhas. Até que surgiu o matemático de nome King, o qual propôs um segundo
modelo, que levou o seu nome, e, durante um período longo, passou-se a usá-
lo. Mesmo assim, apesar do avanço, percebia-se ainda não ser modelo o ideal.
A partir do processo de Czuber, quando se necessita calcular a moda de uma
distribuição de Frequência, emprega-se esse modelo. Muitos livros ainda trazem
ambos os modelos: King e Czuber.

Aqui, vamos estudar a Moda Czuber, a qual leva em consideração as variações


das frequências das classes anterior e posterior em relação à frequência modal.

Em que,

•• Li = Limite inferior da classe modal;


•• d1 = diferença entre a frequência de classe modal e a vizinha
imediatamente anterior;
•• d2 = diferença entre a frequência de classe modal e a vizinha
imediatamente posterior;
•• h = amplitude do intervalo de classe. Para exemplificar, calcule
a moda para a distribuição, a qual representa os salários de 25
funcionários selecionados em uma empresa.

64
Probabilidade e Estatística

Tabela 2.7 – Valor do salário base de 25 funcionários de uma empresa

Salários (R$) No de funcionários


Vizinha imediatamente
1.000 |-- 1.200 2 anterior
1.200 |-- 1.400 6
1.400 |-- 1.600 10 Classe modal

1.600 |-- 1.800 5


1.800 |-- 2.000 2 Vizinha imediatamente
posterior
Total 25

Fonte: Elaboração do autor (2010).

O primeiro passo é identificar a classe modal, ou seja, a classe com a maior


frequência. Logo, a classe modal é de 1400 a 1600, com a frequência 10.

Depois de identificarmos a classe modal, vamos identificar os valores que vamos


precisar para calcularmos a moda.

•• Li = 1.400 (limite inferior da classe modal);


•• d1= 10 – 6 = 4 (diferença entre a frequência de classe modal e a
vizinha imediatamente anterior);
•• d2= 10 -5 = 5 (diferença entre a frequência de classe modal e a
vizinha imediatamente posterior);
•• h = 200 (amplitude do intervalo de classe).

Substituindo os valores na fórmula, temos:

65
Capítulo 2

Interpretação

A moda é R$ 1.488,89, ou seja, esse é o salário que mais se repete.

Entre média, mediana ou moda, qual utilizar? Não há uma resposta simples e objetiva
para determinar a medida que seja mais representativa. A seguir, você encontrará um
resumo das vantagens e desvantagens de cada medida de tendência central.

Quadro 2.1 – Resumo das vantagens e desvantagens de cada medida de tendência central

Afetada
Leva em
pelos Vantagens e
Medida Definição Frequência Existência conta todos
valores desvantagens
os valores?
extremos?
Soma de Usada em toda
todos os Estatística;
valores Existe funciona bem
Média Mais usada. Sim. Sim.
divididos pelo sempre. com muitos
número de métodos
valores. estatísticos.
Costuma
Valor que ser uma boa
Usada Existe
Mediana divide a série Não. Não. escolha se há
comumente. sempre.
na metade. alguns valores
extremos.
Pode não
Valor que
existir ou, Apropriada para
mais se Usada às
Moda ainda, pode Não. Não. dados ao nível
repete (maior vezes.
haver mais nominal.
frequência).
de uma.

Fonte: Elaboração do autor (2006).

Separatrizes
Na maioria dos casos, o pesquisador tem interesse em conhecer outros aspectos
relativos ao conjunto de valores, além de um valor central ou valor típico. Algumas
informações relevantes podem ser obtidas por meio do conjunto de medidas:
média, extremos, quartís, decís, percentís etc. Veja, a seguir, mais detalhes e
exemplos de como calcular as separatrizes.

a. Quartís: divide uma série ordenada em quatro partes iguais, ou seja,


em partes de 25% cada.
Representação: Q1, Q2 e Q3.
Denominação: 1º quartil, 2º quartil e 3º quartil.

66
Probabilidade e Estatística

b. Decís: divide uma série ordenada em 10 partes iguais, ou seja, em


partes de 10% cada.
Representação: D1, D2, .... e D9.
Denominação: 1º decil, 2º decil, ... e 9º decil.

c. Percentil: divide uma série ordenada em 100 partes iguais, ou seja,


em partes de 1% cada.
Representação: P1, P2, .... e P99.
Denominação: 1º percentil, 2º percentil, ... e 99º percentil.

Note que a mediana também é uma separatriz. Você saberia dizer com quais
separatrizes podemos compará-la? Veja:

Q2 = D5 = P50 = Me

Todas essas medidas dividem a série de dados pela metade.

•• 50% dos valores são maiores do que Q2 = D5 = P50 = Me; e


•• 50% dos valores são menores do que Q2 = D5 = P50 = Me.

•• Separatrizes para dados brutos


O procedimento é bastante semelhante ao da mediana. Preste atenção nas
explicações a seguir: após a ordenação crescente dos dados (rol), determinamos
o seu número de elementos (n).

Veja o exemplo passo a passo.

Calcular Q1 para a série de dados X: 22, 15, 20, 22, 28, 20, 20, 22, 25, 26, 16.

Passo 1: ordene de forma crescente (rol) 15, 16, 20, 20, 20, 22, 22, 22, 25, 26, 28.

Passo 2: o número de elementos é 11 (n = 11, ímpar). Aqui, você deve adotar


procedimento semelhante ao da mediana e deve usar a mesma fórmula para
calcular a posição. Lembre-se: da posição! Assim, você irá encontrar a mediana, ou
seja, o segundo quartil (Q2).

67
Capítulo 2

Passo 3: Pos = 6, ou seja, Q2 ocupa a 6ª posição.

1º 2º 3º 4º 5º 6º 7º 8º 9º 10º 11º

15 16 20 20 20 22 22 22 25 26 28

Observe que o Q2 = 22.

Interpretação para Q2 = 22: 50% dos valores da série são menores ou iguais
a 22, e 50% dos valores da série são maiores ou iguais a 22. Antes do Q2, está
formado um novo conjunto de dados, mostrado a seguir.

1º 2º 3º 4º 5º

15 16 20 20 20

Nesse caso, a mediana (dessa nova série de dados) será o primeiro quartil. É só
repetir o mesmo processo feito nos passos 2 e 3.

Passo 4: o número de elementos é 5 (n = 5, ímpar).

Passo 5: Pos = 3, ou seja, Q1 ocupa a 3ª posição.

1º 2º 3º 4º 5º

15 16 20 20 20

Observe que o elemento que ocupa a terceira posição é o 20, então Q1 = 20.

Como interpretar esses dados? 25% dos dados observados são menores ou
iguais a 20. Já 75% dos valores observados, são maiores ou iguais a 20.

68
Probabilidade e Estatística

Observe que podem ser usadas, também, para calcular a posição do primeiro quartil
e do terceiro, respectivamente, as seguintes fórmulas:

Para o primeiro quartil

Para o terceiro quartil

Veja, passo a passo, como você pode calcular o terceiro quartil.

Passo 1: o número de elementos é 11 (n = 11).

Passo 2: Pos = 9, ou seja, Q3 ocupa a 9ª posição.

1º 2º 3º 4º 5º 6º 7º 8º 9º 10º 11º

15 16 20 20 20 22 22 22 25 26 28

Observe que o elemento que ocupa a nona posição é o 25, então Q3 = 25.

•• Percentis
Observação: para calcular a posição dos percentis use a seguinte fórmula.

Para o primeiro quartil

•• = posição da separatriz;
•• N ou n = tamanho da população (ou amostra);
•• i = número da separatriz (ex.: P60 = i = 60).

69
Capítulo 2

Continuando com o mesmo exemplo, calcule o sexagésimo percentil.

Passo 1: o número de elementos é 11 (n = 11) e o i = 60.

Passo 2: = 7,2, ou seja, entre a 7ª e a 8ª posições.

1º 2º 3º 4º 5º 6º 7º 8º 9º 10º 11º

15 16 20 20 20 22 22 22 25 26 28

Passo 3: para calcular o sexagésimo percentil, você deve encontrar o valor que fica
entre os valores que ocupam a 7ª e a 8ª posições.

• Valor que ocupa a 7ª posição = 22.

• Valor que ocupa a 8ª posição = 22.

Então, = 22.

Como interpretar esses dados? 60% dos dados observados são menores ou
iguais a 22. Já 40% dos valores observados, são maiores ou iguais a 22.

•• Decís
Se você notar, poderá comparar os decís com alguns percentis.

Decís 1º 2º 3º 4º 5º 6º 7º 8º 9º

Percentis 10º 20º 30º 40º 50º 60º 70º 80º 90º

Isso mesmo, por exemplo, o D1 = P10, o D2 = P20, o D3 = P30 e, assim,


sucessivamente. Note, também, que as interpretações são as mesmas:

70
Probabilidade e Estatística

•• para o primeiro decil, 10% dos valores observados são menores e


90% dos valores observados são maiores;
•• para o segundo decil, 20% dos valores observados são menores e
80% dos valores observados são maiores;
•• para o terceiro decil, 30% dos valores observados são menores e
70% dos valores observados são maiores etc.

Continuando com o mesmo exemplo, calcule o terceiro decil. Note que ele é igual
ao trigésimo percentil (D3 = P30)! Será a mesma coisa que calcular P30.

Passo 1: o número de elementos é 11 (n = 11) e o i = 30.

Passo 2: PD3 = PP30 = 3,6, ou seja, D3 está entre a 3ª e a 4ª posições.

1º 2º 3º PD3 4º 5º 6º 7º 8º 9º 10º 11º

15 16 20 D3 20 20 22 22 22 25 26 28

Passo 3: para calcular o terceiro decil, você deve encontrar o valor que fica entre os
valores que ocupam a 3ª e a 4ª posições.

• Valor que ocupa a 3ª posição = 20.

• Valor que ocupa a 4ª posição = 20.

Então, D3 = 20.

Como interpretar esses dados? 30% dos dados observados são menores ou
iguais a 20. E 70% dos valores observados são maiores ou iguais a 20.

Assim como você estudou na média, aqui, também para efeito de cálculo, você
usará diferente tratamento quando se tratar de dados agrupados com intervalos
(variável contínua) e dados agrupados sem intervalos (variável discreta). No
entanto, para a finalidade deste estudo, não será incluído.

71
Capítulo 2

Seção 2
Medidas de dispersão
Para compreender melhor o que são as medidas de dispersão, acompanhe o
exemplo a seguir.

A realização de testes em três grupos de pessoas resultou nos escores


descritos na sequência.

Tabela 2.8 − Escores (em pontos) obtidos por pessoa (10 pessoas) e divididos em grupos

Grupos Escores (em pontos) obtidos por pessoa (10 pessoas) Total

Grupo 1: 6 6 6 6 6 6 6 6 6 6 60

Grupo 2: 1 8 9 2 6 10 5 8 7 4 60

Grupo 3: 5 6 7 7 6 5 6 7 5 6 60

Fonte: Elaboração do autor (2006).

Se você calcular a média dos escores para cada grupo, obterá os seguintes resultados.

Para o grupo 1:

ou seja, 6 pontos é o escore médio;

Para o grupo 2:

ou seja, 6 pontos é o escore médio;

Para o grupo 3:

ou seja, 6 pontos é o escore médio.

Observe que os escores médios dos três grupos são iguais. E agora, como
diferenciar um grupo do outro? Olhando somente para os dados, você pode tirar
algumas conclusões: no grupo 1, as pessoas têm o mesmo escore; no grupo 2,
os escores são diversificados; e, no grupo 3, existe uma pequena diversificação,
ou seja, os escores estão bem próximos da média.

72
Probabilidade e Estatística

Pode-se afirmar, quanto à dispersão das séries anteriores, que:

•• grupo 1: não é uma série em que os dados apresentam dispersão


com relação à média, ou seja, os dados estão totalmente
concentrados na média;
•• grupo 2: é uma série de dados em que os valores observados estão
bastante dispersos, ou seja, apresenta muitos valores distantes da
média. Podemos dizer que é uma série dispersa;
•• grupo 3: há uma pequena diferença de alguns dados com relação
à média, ou seja, apresenta uma pequena dispersão com relação à
média, os dados estão concentrados em torno da média.

Em resumo, nos grupos 1 e 3, a média pode servir como uma medida


representativa, mas, no grupo 2, a média não resulta representativa.

Para identificar esses tipos de situações é que usamos as medidas de dispersão.


Essas medidas são a maneira mais adequada para quantificar a dispersão dos
dados e avaliar a representatividade da média.

As principais medidas denominadas de dispersão absolutas são: amplitude total,


desvio médio simples, variância e desvio padrão.

O desvio médio simples, não menos importante, não será visto neste estudo,
pois, para o objetivo que se pretende alcançar, a variância e o desvio padrão são
mais adequados.

Cálculos da variância e do desvio padrão


Para começar a trabalhar com dispersão, é necessário que você conheça as
definições e as formas de representação da variância e do desvio padrão.

A variância é a média dos quadrados dos desvios de cada valor da série com relação à
média. Ficou complicado? Não se preocupe, a seguir você vai aprender como calcular!

O desvio padrão é a raiz quadrada da variância, pois assim fica mais fácil analisar e
comparar com a média; se usássemos a variância, as unidades seriam ao quadrado,
enquanto que o desvio padrão apresentaria a mesma unidade de medida que a média.

Veja a seguir como representá-las.

73
Capítulo 2

Quadro 2.2 − Representação do desvio padrão

População Amostra

(x) variância S2 (x) variância

(x) desvio padrão s (x) desvio padrão

σ = 18ª letra do alfabeto grego, chama-se sigma.

Fonte: Elaboração do autor (2006).

•• A variância e o desvio padrão para dados brutos


Neste item, você vai aprender como calcular a variância e o desvio padrão para dados
brutos. Preste atenção! A fórmula para população e para amostra são diferentes.

O quadro a seguir apresenta as fórmulas utilizadas para calcular a variância e o


desvio padrão.

Quadro 2.3 − Fórmulas para o cálculo de medidas de dispersão com dados brutos

Medidas População Amostra

Variância

Desvio padrão

Fonte: Elaboração do autor (2006).

Observação: a diferença entre as duas fórmulas da variância são os


denominadores. Para a população, usamos n e, para a amostra, usamos n – 1.
Como, ao trabalharmos com uma amostra para estimar valores de uma população,
a variabilidade dos dados é maior, então, dessa maneira, é mais indicado usarmos
n – 1 para que não subestimemos a dispersão. O n – 1 é usado, nesse caso,
como uma correção para a variância da amostra. Para amostras com mais de 30
elementos, essa correção torna-se irrelevante.

Para você entender melhor, imagine que a média de depósitos diários de


uma agência bancária seja de 120.000 reais e a variância, de 25.000 reais ao
quadrado. Seria difícil comparar reais com reais ao quadrado. Para tanto, ao fazer
uso do desvio padrão, o qual corresponde à raiz quadrada de 25.000 reais ao
quadrado, teríamos 5.000 reais. E essa é a mesma unidade de medida da média.

74
Probabilidade e Estatística

Daremos continuidade ao exemplo, para calcular a variância e o desvio padrão.


Acompanhe a resolução passo a passo.

Exemplo 1: uma vez dadas as notas: 6; 7; 7,8 e 8.

Passo 1: calcular a média: observe que, na média para a população, usa-se a


letra grega μ.

Passo 2: agora, calcular os desvios ao quadrado -

- = (6 – 7,20) = (-1,20)2= 1,4400

- = (7 – 7,20) = (−0,20)2 = 0,0400

- = (7,8 – 7,20) = (0,60)2 = 0,3600

- = (8 – 7,20) = (0,80)2 = 0,6400

Passo 3: calcular a média dos quadrados dos desvios, ou seja, a variância. Aqui,
você vai calcular para a população e para a amostra.

• Caso sejam dados de uma população:

Então:

• Caso sejam dados de uma amostra:

Então:

Passo 4: calcular o desvio padrão, calculando a raiz da variância.

• Caso sejam dados de uma população:

• Caso sejam dados de uma amostra:

75
Capítulo 2

Interpretação dos dados – Para dados de uma população, a variabilidade das


notas é de 0,79 pontos. Para dados de uma amostra, a variabilidade das notas é
de 0,91 pontos. Ou seja, a média é 7,20 e para a amostra de notas poderia chegar
a 7,20-0,91 = 6,29 e 7,20 +0,91 = 8,11.

•• A variância e o desvio padrão para dados agrupados sem


intervalos (variável discreta)
Agora, você vai calcular a variância e o desvio padrão para dados que foram
organizados em tabelas, ou seja, após a coleta, eles foram organizados em
categorias e tabelas, nas quais os dados estão agrupados sem intervalos.

Observe as fórmulas que são utilizadas para calcular esse tipo de dados, a
variância e o desvio padrão.

Quadro 2.4 − Fórmulas para o cálculo de medidas de dispersão com dados agrupados sem intervalos

Medidas População Amostra

Variância

Desvio padrão

Fonte: Elaboração do autor (2006).

Acompanhe o exemplo a seguir para compreender como realizar o cálculo dos


dados agrupados sem intervalos.

Exemplo: a tabela apresenta dados referentes à remuneração de funcionários de


uma empresa. Foram levantados o número de funcionários e sua faixa salarial, em
número de salários-mínimos.

76
Probabilidade e Estatística

Tabela 2.9 − Remuneração de funcionários

Nº de salários- Nº de xi.fi (x − )2.fi


mínimos (xi) funcionários (fi) (1-3,33)2.29 = 157,4381
1 29 29 157,4381

2 28 56 49,5292

3 20 60 2,1780

4 18 72 8,0820

5 16 80 44,4560

6 15 90 106,9335

7 9 63 121,1607

∑ 135 450 489,7757

∑ fi ∑ xi.fi S (x − i
)2.fi

Fonte: Elaboração do autor (2010).

Agora, acompanhe o cálculo passo a passo.

Passo 1: inicie por somar a coluna das frequências simples (fi) para obter ∑fi
(frequência total); ∑fi = 135.

Passo 2: calcule a média: multiplique cada xi por sua correspondente fi e escreva


na coluna xi. fi, some os valores calculados e escreva esse resultado no final da
coluna e divida pelo resultado do passo 1 (∑ fi).

Para facilitar os cálculos, arredondamos a média em duas casas decimais.

Passo 3: calcule a soma dos quadrados dos desvios e multiplique por fi, esta
coluna vai ser utilizada na parte de cima da fórmula da variância, - 2 . fi:

• 1 − 3,33 = (−2,33)2 = 5,4289 . 29 = 157,4381


• 2 − 3,33 = (−1,33)2 = 1,7689 . 28 = 49,5292
• 3 − 3,33 = (−0,33)2 = 0,1089 . 20 = 2,1780
• 4 − 3,33 = (0,67)2 = 0,4489 . 18 = 8,0802

77
Capítulo 2

• 5 − 3,33 = (1,67)2 = 2,7785 . 16 = 44,4560


• 6 − 3,33 = (2,67)2 = 7,1289 . 15 = 106,9335
• 7 − 3,33 = (3,67)2 = 13,4689 . 9 = 121,1607

Some os valores: (∑ - 2
. fi = 489,7757

Neste passo, usa-se quatro casas decimais, deixando para arredondar para duas
casas somente o resultado.

Passo 4: calcule a variância.

• Caso sejam dados de uma população:

Na variância, serão usadas quatro casas decimais, pois ainda será necessário extrair
a raiz quadrada para chegar ao desvio padrão.

• Caso sejam dados de uma amostra:

Passo 5: calcule o desvio padrão.

• Caso sejam dados de uma população:

• Caso sejam dados de uma amostra:

Interpretação dos dados − Para dados de uma população, a variabilidade


do número de salários é de 1,90 salários. Para dados de uma amostra, a
variabilidade do número de salários é de 1,91 salários.

•• Dados agrupados com intervalos (variável contínua)


Neste item, você poderá ver como se calcula a variância e o desvio padrão para
dados agrupados com intervalos (variável contínua).

78
Probabilidade e Estatística

Observe as fórmulas que são utilizadas para calcular esse tipo de dados.

Quadro 2.5 − Fórmulas para o cálculo de medidas de dispersão com dados agrupados com intervalos

Medidas População Amostra

Variância

Desvio padrão

Fonte: Elaboração do autor (2010).

Para o caso de dados agrupados com intervalos, usa-se o ponto médio – PM –


de cada intervalo, pois não se tem um valor específico para usar. O ponto médio
serve como uma boa aproximação.

Agora, vamos analisar um exemplo para realizar os cálculos de medidas de


dispersão com dados agrupados com intervalos.

Tabela 2.10 − Volume de vendas mensal, em milhares de reais, dos representantes de uma empresa que
fabrica remédios – outubro/2010

Nº de vendas Nº de
PM PM.fi (PMi − )2.fi
(em mil reais) representantes (fi)
(17,3 - 24,75)2.12 = 666,0300
15,9 |-- 18,7 12 17,3 207,6 666,0300

18,7 |-- 21,5 8 20,1 160,8 172,9800

21,5 |-- 24,3 12 22,9 274,8 41,0700

24,3 |-- 27,1 5 25,7 128,5 4,5125

27,1 |-- 29,9 3 28,5 85,5 42,1875

29,9 |-- 32,7 6 31,3 187,8 257,4150

32,7 |-- 35,5 10 34,1 341,0 874,2250

Total (∑fi) 56 1.386 2.058,4200

∑ fi ∑ PMi . fi S (PMi − )2.fi

Fonte: Elaboração do autor (2010).

Acompanhe os cálculos passo a passo.

79
Capítulo 2

Passo 1: primeiro, some a coluna das frequências simples (fi) para obter ∑fi
(frequência total); ∑fi = 56.

Passo 2: calcule a média; nesse caso, calcule o ponto médio de cada intervalo,
multiplique cada PM por sua correspondente fi e escreva na coluna PM.fi; e some
os valores e divida o resultado pelo resultado do passo 1 (∑fi). Assim, você obterá:

Passo 3: calcule a soma dos quadrados dos desvios e multiplique por fi, esta
coluna vai ser utilizada na parte de cima da fórmula da variância, - . fi .

• 17,3 − 24,75 = (−7,45)2 = 55,5025 . 12 = 666,0300


• 20,1 − 24,75 = (−4,65)2 = 21,6225 . 8 = 172,9800
• 22,9 − 24,75 = (−1,85)2 = 3,4225 . 12 = 41,0700
• 25,7 − 24,75 = (0,95)2 = 0,9025 . 5 = 4,5125
• 28,5 − 24,75 = (3,75)2 = 14,0625 . 3 = 42,1875
• 31,3 − 24,75 = (6,55)2 = 42,9025 . 6 = 257,4150
• 34,1 − 24,75 = (9,35)2 = 87,4225 . 10 = 874,2250

Some os valores :

∑ - . fi .= 2.058,4200.

Passo 4: calcule a variância.

• Caso sejam dados de uma população:

• Caso sejam dados de uma amostra:

Passo 5: calcule o desvio padrão.

• Caso sejam dados de uma população:

80
Probabilidade e Estatística

• Caso sejam dados de uma amostra:

Interpretação dos dados − Para dados de uma população, a variabilidade


do volume de vendas é de 6,06 mil reais. Para dados de uma amostra, a
variabilidade do volume de vendas é de 6,12 mil reais.

•• Interpretação do desvio padrão


O desvio padrão é uma importante medida de dispersão. É com ele que você
irá quantificar a dispersão dos dados de uma série com relação à sua média.
Preste atenção:

•• quanto maior o valor do desvio padrão, mais dispersos estão os


valores. Pode-se dizer, também, que mais distantes estão da média;
•• quanto menor o valor do desvio padrão, menos dispersos estão os
valores. Pode-se dizer, também, que mais próximos estão da média.

Veja a figura, a seguir, para compreender melhor o que foi colocado.

Figura 2.2 − Quanto mais distantes da média, mais dispersos os dados estão

S=0
7
6
S=0,8 S=1,2
5
f=3,0
4
3
2
1

1 2 3 4 5 6 7 1 2 3 4 5 6 7 1 2 3 4 5 6 7 1 2 3 4 5 6 7

O desvio padrão cresce quando a dispersão dos dados aumenta

Fonte: Triola (1999, p. 42).

81
Capítulo 2

Outra utilização do desvio padrão

Muitas séries, quando representadas por seu polígono de frequências, com certo
ajuste nas curvas, apresentam um formato semelhante a um sino, uma curva
simétrica (observando que a média, a moda e a mediana estão posicionadas ao
centro), como mostra o gráfico a seguir.

Gráfico 2.1 − Gráfico da curva normal

x
Fonte: Elaboração do autor (2006).

Para séries de dados que apresentam esse tipo de representação, pode-


se trabalhar com a área abaixo do polígono. A área abaixo é proporcional à
frequência total. Essa curva é chamada de Curva Normal ou Curvas de Gauss,
e suas principais características são:

•• a curva caracteriza-se por ter a forma de um sino;


•• a curva normal é simétrica com relação à média;
•• a área limitada pela curva e pelo eixo das abscissas é 1 ou 100%;
•• a curva é assintótica, isto é, aproxima-se indefinidamente do eixo
das abscissas sem tocá-lo;
•• a curva normal é unimodal, ou seja, possui um só pico ou ponto de
frequência máxima, ponto este que coincide com a moda, a média
e a mediana.

Como relacionar a curva com o desvio padrão? Veja a curva a seguir.

Gráfico 2.2 − Gráfico da curva normal

34,13% 34,13%

13,59% 13,59%
2,15% 2,15%

σ σ σ μ σ σ σ

Fonte: Elaboração do autor (2006).

82
Probabilidade e Estatística

Exemplo: em uma série em que μ = 80 e o σ (x)=3, pode-se interpretar esses


valores da seguinte forma:

•• os valores da série estão concentrados em torno da média, que é de


80 unidades;
•• o intervalo [μ − σ(x); μ + σ(x)] contém, aproximadamente, 68,26% dos
elementos da série, ou seja, o intervalo [77;83];
•• o intervalo [μ − 2σ(x); μ + 2σ(x)] contém, aproximadamente, 95,44%
dos elementos da série, isto é, o intervalo [74;86];
•• o intervalo [μ − 3σ(x); μ + 3σ(x)] contém, aproximadamente, 99,74%
dos elementos da série, ou seja, o intervalo [71;89].

A curva normal será utilizada nos cálculos de distribuição de probabilidade

Coeficiente de variação
•• Séries de dados com médias iguais
Acompanhe o exemplo: considere dois grupos de pessoas, nos quais foram
feitos levantamentos de suas rendas. Os resultados desse levantamento foram
os seguintes:

Tabela 2.11 – Resultado do levantamento de renda de uma população

Grupo 1 Grupo 2

Média: μ = 122 pontos Média: μ = 122 pontos

Desvio padrão: σ(x) = 4,5 pontos Desvio padrão: σ(x) = 7,5 pontos

Fonte: Elaboração do autor (2006).

Compare a dispersão das duas séries:

•• note que as médias são iguais;


•• o desvio padrão do grupo 1 é 4,5, e o do grupo 2 é 7,5; portanto, o grupo
que apresenta maior dispersão quanto ao nível de renda é o grupo 2;
•• conclusão: os níveis de renda do grupo 2 são mais dispersos
com relação ao grupo 1 (valores mais distantes da média); ou, os
integrantes do grupo 1 têm renda mais semelhantes entre eles do
que os integrantes do grupos 2.

83
Capítulo 2

Para comparar duas séries de dados usando medidas de dispersão absolutas


(variância e desvio padrão) é necessário que as médias sejam iguais, caso
contrário, usamos uma medida de dispersão relativa que veremos nesta seção.

•• Séries de dados com médias diferentes


Como você pôde observar no item anterior, para comparar duas séries de dados
quanto a suas dispersões, pode-se usar valores absolutos dos desvios padrão,
mas somente quando as médias são iguais.

Quando as médias são diferentes, utiliza-se o Coeficiente de Variação (CV), que


é uma medida de dispersão relativa.

O coeficiente de variação é a relação do desvio com a média. Veja a fórmula a seguir.

Tabela 2.12 – Fórmula do coeficiente de variação

Para a população Para a amostra

Fonte: Elaboração do autor (2006).

A série que apresentar maior coeficiente de variação será a série de maior


dispersão dos dados. O resultado é expresso em percentual (%), ou seja, quanto
o desvio padrão representa da média.

Acompanhe o exemplo a seguir para compreender como realizar o cálculo.

Exemplo: considere dois grupos de pessoas, nos quais foram feitos levantamentos
de suas rendas. Os resultados desse levantamento foram os seguintes.

Tabela 2.13 – Resultado do levantamento

Grupo 1 Grupo 2

Desvio padrão: σ(x) = 9,8 reais Desvio padrão: σ(x) = 7,5 reais

Média: μ = 145 reais Média: μ = 95 reais

Fonte: Elaboração do autor (2006).

84
Probabilidade e Estatística

•• note que as médias são diferentes;


•• o desvio padrão do grupo 1 é 9,8; e, o do grupo 2 é 7,5; portanto,
o grupo que apresenta maior dispersão absoluta quanto ao nível de
renda é o grupo 1;
•• como as médias são diferentes, devemos calcular o coeficiente de
variação, pois, simplesmente pela dispersão absoluta, não podemos
afirmar nada (se fossem iguais, bastaria a dispersão absoluta).
· Para o grupo 1:

· Para o grupo 2:

O grupo que apresenta maior coeficiente de variação é o grupo 2. Ou seja, os


níveis de renda observados no grupo 2 são mais dispersos com relação ao grupo
1 (valores mais distantes da média).

Comparando os dois, você poderia dizer que, no grupo 1, as pessoas têm a


renda mais próxima da média do grupo do que no Grupo 2, que, por sua vez,
as pessoas apresentam níveis de renda mais diferenciados da média do grupo,
comparando os dois grupos.

Para comparar a dispersão dos dados de duas séries de médias diferentes, usamos
o coeficiente de variação. Ele compara o desvio padrão com a média (proporção)
entre o desvio padrão e a média da série, sendo, assim, considerado uma forma
mais eficaz de comparação e, portanto, prevalecendo sobre a absoluta.

85
Capítulo 2

Atividades de autoavaliação
Ao final de cada unidade, você realizará atividades de autoavaliação. O gabarito
está disponível no final do livro didático, mas se esforce para resolver as
atividades sem a ajuda do gabarito, pois, assim, você estará promovendo (e
estimulando) a sua aprendizagem.

1. Uma empresa procurou estudar a ocorrência de uso de drogas lícitas –


bebidas alcoólicas – por seus empregados, tendo, para isso, realizado um
levantamento sobre o número de dias por semana que cada um dos empregados
costuma beber. Calcule e interprete a média. Os dados correspondentes são:

Consumo de bebidas alcoólicas por semana pelos funcionários

No de dias (xi) No de func. (fi) xi . fi

0 10

1 16

2 14

3 8

4 5

5 4

6 4

7 3

Total (∑fi) 64

Fonte: Pesquisa de campo (dados fictícios)

2. Os dados seguintes representam a renda de uma amostra de famílias de


um bairro de classe baixa de Florianópolis, em reais (dados fictícios). Calcule e
interprete a média.

Renda de famílias de um bairro de classe baixa de Florianópolis

Renda (R$) No de famílias (fi) PM PM.fi


112 | --- 115 2
115 | --- 118 6
118 | --- 121 4
121 | --- 124 9
124 | --- 127 8
127 | --- 130 7
Total (∑fi) 36
Fonte: Dados fictícios

86
Probabilidade e Estatística

3. Nos itens a seguir, estão dois conjuntos de dados. Calcule a mediana para
cada um deles e interprete seus resultados.

a. Conjunto 1

15 19 13 21 16 17 15 12 13

Sugestão: use a tabela a seguir para organizar e posicionar os dados.

b. Conjunto 2

17 18 14 14 15 15 16 16 13

Sugestão: use a tabela a seguir para organizar e posicionar os dados.

4. Nas opções a seguir, estão três conjuntos de dados. Encontre a moda para
cada um deles e interprete seus resultados.

a. Conjunto 01

7 6 5 8 2 1 3 2 1

1 7 6 8 5 1 2 2 7

b. Conjunto 02

5 6 8 2 3 5 3 3

2 6 5 8 3 2 5 6

c. Conjunto 03

5 6 3 7 5 3 2 1

1 6 7 2 8 4 8 4

87
Capítulo 2

5. Em um grupo de pacientes acometidos de fobias, foi levantado o tempo


para tratamento, em anos, conforme tabela abaixo. Calcule o Q3, o D9 e o P35 e
interprete seus resultados.

Tempo para tratamento de fobias, em anos:

4 6 8 2 5 9 4 3 8 9 5 4

Use a tabela abaixo para organizar e posicionar os dados.

6. Os dados a seguir representam o tempo em minutos usados por um grupo


de seis pessoas na realização de um teste. Calcule a variância e o desvio padrão,
considerando como uma população.

Tempo (em min.): 25, 22, 36, 20, 29, 38.

7. Os escores obtidos por cinco pessoas em um teste estão relacionados a


seguir. Calcule a variância e o desvio padrão, considerando como uma amostra.

Tempo: 15, 10, 9, 23, 31.

8. Uma empresa procurou estudar a ocorrência de uso de drogas lícitas – bebidas


alcoólicas – por seus empregados, tendo, para isso, tem-se realizado um levantamento
sobre o número de dias por semana que cada um dos empregados costuma beber.
Calcule a variância e o desvio padrão, considerando que os dados são de uma amostra
(sugere-se utilizar colunas para facilitar o cálculo). Os dados correspondentes são:

88
Probabilidade e Estatística

Consumo de bebidas alcoólicas por semana pelos funcionários

Nº de xi . fi
Nº de dias (xi) (x − )2.fi
funcionários (fi)
0 10
1 16
2 14
3 8
4 5
5 4
6 4

7 3

∑ 64

Fonte: Elaboração autor, 2016.

9. Na tabela a seguir, estão relacionados dados relativos à idade de um grupo


de 63 estudantes matriculados em uma disciplina da Unisul Virtual. Calcule a
variância e o desvio padrão, considerando que são dados da população (sugere-
se utilizar colunas para facilitar o cálculo).

Idade dos estudantes da disciplina Estatística

Idade (xi) Nº de estudantes (fi) xi . fi (xi − μ )2.fi


17 5
18 20
19 22
20 10
21 6

∑ 63

Fonte: Dados fictícios elaborados pelo autor.

89
Capítulo 2

10. Os dados abaixo representam a renda de uma amostra de famílias de um


bairro de classe baixa de Florianópolis, em reais. (dados fictícios). Calcule a
variância e o desvio padrão, considerando como sendo dados de uma amostra.

Renda de famílias de um bairro de classe baixa de Florianópolis

Renda (R$) No de famílias (fi) PM PM.fi (PMi − )2.fi

112 | --- 115 2


115 | --- 118 6
118 | --- 121 4
121 | --- 124 9
124 | --- 127 8

127 | --- 130 7

Total (∑fi) 36
Fonte: Elaboração do autor, 2016.

11. Analise cada caso, comparando quanto à dispersão dos dados, e responda
as perguntas:

a. Qual das séries apresenta maior dispersão absoluta (comparar os


desvios padrão)?
b. Qual das séries apresenta maior dispersão relativa (comparar os
coeficientes de variação)?
c. Conclua qual das séries realmente apresenta maior dispersão (não
se esqueça de que o coeficiente de variação é mais eficaz para
determinar a dispersão de uma série).
11.1

Série A Série B

μ = 57; σ(x) = 5,6 μ = 96; σ(x) = 8,2

11.2

Série A Série B

μ = 64; σ(x) = 12 μ = 96; σ(x) = 18

90
Capítulo 3

Probabilidade

Seção 1
Principais conceitos
A partir de agora, você iniciará o estudo da Estatística Indutiva, que tem como
base o estudo de probabilidades.

Talvez você deva estar perguntando-se: probabilidade? O que é? Tenho certeza


de que muitas vezes você já pensou em “possibilidades” de algo acontecer. Será
que vai chover? Será que serei escolhido para participar de um grupo? Será que
vou encontrar meu amigo hoje? etc.

Muitas vezes, não podemos prever acontecimentos como esses, ou seja, podem
acontecer ou não. Você até poderia associar isso tudo à sorte ou ao azar, enfim,
ao acaso. E é aqui que o estudo de probabilidade entra. Tentar formular e calcular
modelos matemáticos que definam essas situações e possibilitem a você tomar
suas decisões e, assim, conduzir sua vida, suas experiências e seus caminhos;
esse é um dos principais objetivos desta unidade.

Nesta unidade, você também conhecerá como é possível expressar em


números algumas situações com a finalidade de possibilitar um melhor
tratamento matemático a elas. Serão apresentados os tipos de distribuições de
probabilidades e como se calcula probabilidade usando a distribuição discreta e a
distribuição contínua de probabilidades.

Vamos começar com os conceitos de fenômenos, o que é um espaço amostral


e o que são eventos. Esses são alguns dos conceitos mais importantes que são
utilizados na probabilidade. O objetivo é que você compreenda como aplicar
esses conhecimentos no seu dia a dia.

91
Capítulo 3

Fenômenos (ou experimentos)


Você pode entender por fenômeno quaisquer acontecimentos, sejam eles naturais
ou não. Eles podem ser classificados em dois tipos: determinísticos ou aleatórios.

Fenômenos determinísticos: são fenômenos em que as condições iniciais


determinam um único resultado.

Fenômenos aleatórios: são fenômenos em que as condições iniciais não


determinam a possibilidade da existência de um resultado em particular.

Em resumo, quando você pode determinar o resultado de um fenômeno, você irá


chamá-lo de determinístico, mas quando os resultados do fenômeno não podem
ser determinados, você irá chamá-lo de aleatório, pois este pode apresentar
qualquer resultado dentro de um grupo de esperados (mais de um).

Veja, a seguir, exemplos de cada um deles.

Exemplo: para ilustrar, considere dois dados diferentes. O dado 1 tem as faces
com o mesmo número de pontos em cada face, e o dado 2 é um dado normal,
tem as faces com números de pontos diferentes.

•• Dado 1: tem as faces com o mesmo número de pontos;


•• Dado 2: é um dado normal, tem as faces com números de pontos
diferentes e não é viciado (observe que um dado viciado é aquele
que, ao ser jogado, sempre sai o mesmo número).

Fenômeno determinístico: se você jogar o dado 1 várias vezes, sob as


mesmas condições, este sempre irá apresentar o mesmo número de pontos
na face voltada para cima. Nesse caso, você pode dizer que é um fenômeno
determinístico, pois não existe outra possibilidade de resultado, e é possível
prever qual será.

Fenômeno aleatório: se você jogar o dado 2 várias vezes, sob as mesmas


condições, este poderá apresentar resultados diferentes a cada lançamento.
Nesse caso, você pode dizer que é um fenômeno aleatório, pois existem várias
possibilidades de resultado, e não é possível prever qual será.

A partir do exposto, conclui-se que o estudo de probabilidade é baseado nos


fenômenos aleatórios. Você pode dizer que o estudo de probabilidades está
intimamente ligado ao acaso.

92
Probabilidade e Estatística

Espaço amostral
Observe que quando se trabalha com experimentos que admitem mais de um
resultado, torna-se interessante definir o conjunto de todos esses resultados;
nesse caso, você pode chamar esse conjunto de espaço amostral. O símbolo
para representar o conjunto do espaço amostral é S (letra maiúscula).

Espaço amostral é o conjunto de todos os possíveis resultados de um


experimento (fenômeno) aleatório.

Veja, a seguir, exemplos sobre o espaço amostral.

Ao verificar os exemplos, lembre-se de que o número de elementos do conjunto


do espaço amostral é representado por n(S):

n(S) = número de elementos de S.

Exemplo 1: você pode usar o dado 2, citado no exemplo anterior, e estudar todas
as possibilidades. Pode-se construir o seguinte conjunto.

S = {1, 2, 3, 4, 5, 6}: observe que são todas as possibilidades de pontos de um


dado normal.

Exemplo 2: um médico trabalha com um grupo de pessoas com problemas


de alcoolismo. O grupo é composto por cinco pessoas, das quais duas delas
apresentam cirrose e três não apresentam cirrose (veja legenda).

Cn – Pessoa número “n” com cirrose;


Pn – Pessoa número “n” sem cirrose.

Exemplo:

C1 – pessoa número 1 com cirrose;

P1 – pessoa número 1 sem cirrose.

Pode-se construir o seguinte conjunto:

S = {C1, C2, P1, P2, P3}: observe que são todas as possibilidades entre as
pessoas do grupo.

93
Capítulo 3

Exemplo 3: um psicólogo trabalha com um grupo de pessoas e estuda os


distúrbios do sono. O grupo é composto por sete pessoas, das quais cinco
apresentam distúrbios e duas não apresentam distúrbios (veja legenda).

Dn – Pessoa número “n” com distúrbio;


Pn – Pessoa número “n” sem distúrbio.

Exemplo:

D1 – pessoa número 1 com distúrbio;

P1 – pessoa número 1 sem distúrbio.

Pode-se construir o seguinte conjunto:

S = {D1, D2, D3, D4, D5, P1, P2}: observe que são todas as possibilidades entre
as pessoas do grupo.

Exemplo 4: um grupo de pessoas que apresentam diferenças na cor do cabelo


(veja legenda).

Pn - Pessoa número “n” com cabelos pretos;


Ln - Pessoa número “n” com cabelos louros;
Cn - Pessoa número “n” com cabelos castanhos;
Rn - Pessoa número “n” com cabelos ruivos.

Sabendo que, nesse grupo, tem três pessoas com cabelos pretos, duas com
cabelos louros, três com cabelos castanhos e uma com cabelos ruivos, como fica
o conjunto do espaço amostral? Pense e anote, a seguir, como você acha que
fica o conjunto do espaço amostral do exemplo.

S = {______________________________________}

Agora, compare se o seu conjunto do espaço amostral está igual ao seguinte


conjunto do espaço amostral.

S = {P1, P2, P3, L1, L2, C1, C2, C3, R1}: observe que são todas as possibilidades
entre as pessoas do grupo.

Qual é o número de elementos dos espaços amostrais citados nos exemplos


dados? Veja:

No exemplo 1: n(S) = 6;
No exemplo 2: n(S) = 5;
No exemplo 3: n(S) = 7;
No exemplo 4: n(S) = 9.

94
Probabilidade e Estatística

Eventos
Quando você tiver que estudar algum experimento aleatório, deverá identificar
as diferentes variações de resultados possíveis dentro do espaço amostral.
Você pode chamar de evento cada uma dessas variações, ou seja, cada uma
dessas partes (subconjuntos) do espaço amostral é um evento. O símbolo para
representar o subconjunto de um evento é A (letra maiúscula).

Um evento é qualquer subconjunto do espaço amostral determinado pelo


experimento (fenômeno) aleatório em estudo.

Ao verificar os exemplos, lembre-se de que o número de elementos de evento é


representado por n(A):

n(A) = número de elementos de A.

Usando os exemplos citados anteriormente, você pode observar:

Exemplo 1: você pode usar o dado 2, citado no exemplo anterior, e estudar todas
as possibilidades.

Pode-se construir o seguinte evento:

A: sair um número par na face superior.

A = {2, 4, 6}: observe que são todas as possibilidades de pontos pares de dado normal.

Exemplo 2: um médico trabalha com um grupo de pessoas com problemas


de alcoolismo. O grupo é composto por cinco pessoas, das quais duas delas
apresentam cirrose e três não apresentam cirrose (veja legenda).

Cn – Pessoa número “n” com cirrose;


Pn – Pessoa número “n” sem cirrose.

Pode-se construir o seguinte conjunto:

B: ser uma pessoa sem cirrose.


B = {P1, P2, P3}: observe que são todas as possibilidades de pessoas sem cirrose.

Exemplo 3: um professor trabalha com um grupo de pessoas e estuda os


distúrbios do humor. O grupo é composto por sete pessoas. Cinco delas
apresentam distúrbios e duas não apresentam distúrbios (veja legenda).

95
Capítulo 3

Dn – Pessoa número “n” com distúrbio;


Pn – Pessoa número “n” sem distúrbio.

Pode-se construir o seguinte evento:

C: ser uma pessoa com distúrbio.


C = {D1, D2, D3, D4, D5}: observe que são todas as possibilidades de pessoas
com distúrbio.

Exemplo 4: um grupo de pessoas que apresentam diferenças na cor do cabelo


(veja legenda).

Pn − Pessoa número “n” com cabelos pretos;


Ln − Pessoa número “n” com cabelos louros;
Cn − Pessoa número “n” com cabelos castanhos;
Rn − Pessoa número “n” com cabelos ruivos.

Sabendo que nesse grupo você tem três pessoas com cabelos pretos, duas com
cabelos louros, três com cabelos castanhos e uma com cabelos ruivos, como fica
o subconjunto do evento pessoas com cabelos ruivos?

Pode-se construir o seguinte evento:

D: ser uma pessoa com cabelos ruivos.


D = {R1}: observe que é a única possibilidade com cabelos ruivos.

Qual é o número de elementos dos eventos citados nos exemplos anteriores?

No exemplo 1: n(A) = 3;

No exemplo 2: n(B) = 3;

No exemplo 3: n(C) = 5;

No exemplo 4: n(D) = 1.

Tipos de eventos
Existem três tipos de eventos, os quais são:

•• Evento simples: formado por apenas um elemento do espaço amostral.


Exemplo: D: ser uma pessoa com cabelos ruivos. (Veja o exemplo 4).
D = {R1} ⇒ n(D) = 1

96
Probabilidade e Estatística

•• Evento composto: formado por dois ou mais elementos do


espaço amostral.
Exemplo: B: ser uma pessoa sem cirrose. (Veja o exemplo 2).
B = {P1, P2, P3} ⇒ n(B) = 3

•• Evento impossível: não ocorre, seja qual for a realização do


experimento aleatório.
Exemplo: F: ser uma pessoa com cabelos verdes naturais. (Veja o
exemplo 4).
F = { } ⇒ n(F) = 0

•• Evento certo: é quando o evento é o próprio espaço amostral.


Exemplo: E: ser uma pessoa com alcoolismo. (Veja o exemplo 2).
E = {C1, C2, P1, P2, P3} ⇒ n (E) = 5 = n(S)

Operações com eventos


As operações com eventos são muito semelhantes às operações com conjuntos,
até porque os eventos nada mais são do que conjuntos. Veja, a seguir, mais
detalhes sobre esse assunto.

•• União de eventos
Se existem os eventos A e B de um espaço amostral S, a união desses eventos
existe se pode ocorrer A ou B.

Figura 3.1 − Representação em diagrama da união entre eventos

S
A B

Fonte: Elaborado pelo autor (2006).

A união de A e B pode ser representada por: A soma B ou A∪B. A união


corresponde a toda a área colorida.

97
Capítulo 3

•• Interseção de eventos
Se existem os eventos A e B de um espaço amostral S, a intersecção desses
eventos existe se pode ocorrer A e B, simultaneamente.

Figura 3.2 − Representação em diagrama da intersecção entre eventos

S
A B

Fonte: Elaborado pelo autor (2006).

A intersecção de A e B pode ser representada por: A vezes B ou A∩B. A intersecção


corresponde a toda a área colorida.

•• Complemento de um evento
É um evento formado por todos os elementos pertencentes a S, mas que não
pertencem a A.

Figura 3.3 − Representação em diagrama do complementar de um evento

S
A
A'

Fonte: Elaborado pelo autor (2006).

Complementar de A – pode ser representado por: Ᾱ, A’ ou CA. O complementar


de A corresponde a toda a área colorida.

98
Probabilidade e Estatística

•• Subtração de eventos
Você pode dizer que A menos B é se, e somente se, ocorre A e não ocorre B.

Figura 3.4 − Representação em diagrama da subtração de eventos

S
A B

Fonte: Elaborado pelo autor (2006).

A subtração de eventos pode ser representada por A − B, que corresponde a


toda a área colorida.

•• Eventos excludentes
Dois ou mais eventos são ditos excludentes (mutuamente exclusivos) se a
realização de um dos eventos excluir a realização do outro, ou de outros eventos.

Figura 3.5 − Representação em diagrama da subtração de eventos

S
A

B
C

Fonte: Elaborado pelo autor (2006).

Se, quando A ocorrer, exclui ocorrerem os outros, isso quer dizer que não há
intersecção entre eles! A e B são mutuamente exclusivos, e B e C não são
mutuamente exclusivos.

Agora que você já estudou os conceitos mais importantes utilizados na


probabilidade, é hora de saber os conceitos de probabilidade propriamente ditos
e como são feitos os seus cálculos!

99
Capítulo 3

Seção 2
Cálculo de probabilidade
Nesta seção, vamos estudar os conceitos de probabilidade e a forma de fazer
seus cálculos! Acompanhe as duas definições mais importantes dentro do
estudo de probabilidades. São elas: a definição clássica de probabilidade e a
frequência relativa.

Veja, então, separadamente, cada uma dessas definições.

•• Probabilidade clássica
Antes de conhecer como calcular a probabilidade clássica, saiba como ela é possível.

A probabilidade de ocorrer um determinado resultado na realização de um


experimento é igual ao quociente entre o número de casos favoráveis ao sucesso
(número de elementos do evento A) e o número de casos possíveis (número de
elementos do espaço amostral S).

Observe a fórmula a seguir.

•• Probabilidade de um evento A ocorrer:

= p = sucesso.

Observação: a probabilidade de não ocorrência pode ser representada por:

= q = fracasso.

Observe que, se você quiser o resultado em porcentagem, deve multiplicá-lo por


100 ao final.

Veja, a seguir, alguns exemplos do cálculo de probabilidade clássica.

Exemplo 1: em um levantamento feito com oito moradores de um condomínio,


verificou-se que dois são casados, dois são solteiros, três são divorciados e um é
viúvo. Qual a probabilidade de, ao escolher um morador ao acaso, ele ser casado?
E qual a probabilidade de, ao escolher um morador ao acaso, ele ser divorciado?

100
Probabilidade e Estatística

Compreenda passo a passo.

Legenda
Estado civil:
C – Casado (dois moradores) C1, C2;
S – Solteiro (dois moradores) S1, S2;
D – Divorciado (três moradores) D1, D2, D3;
V – Viúvo (um morador) V1.

Passo 1: identificar os elementos do espaço amostral e do evento solicitado.

S: moradores do condomínio S = {C1, C2, S1, S2, D1, D2, D3, V1};
A: moradores casados A = {C1, C2};
B: moradores divorciados B = {D1, D2, D3}.

Passo 2: identificar o número de elementos de cada conjunto.

n(S) = 8;
n(A) = 2;
n(B) = 3.

Passo 3: usar a fórmula da probabilidade.

Observação: após efetuar a divisão, é só multiplicar por 100 para obter a


probabilidade na forma percentual.

•• Para o evento A: P(A) = 0,25 ou 25,00%

•• Para o evento B: P(A) = 0,375 ou 37,50%

Passo 4: interpretar os dados.

Como interpretar esses dados? A probabilidade de um morador casado ser escolhido


é de 25%, e a probabilidade de um morador divorciado ser escolhido é de 37,5%.

101
Capítulo 3

Exemplo 2: em um levantamento realizado com um grupo de 118 chefes de


famílias com diferentes vínculos de trabalho, obteve-se os seguintes resultados
(dados fictícios).

Figura 3.6 – Resultado do levantamento

Pesquisa dos motivos de estresse


No de
Tipos de vínculo
pessoas
Evento A M Funcionário público municipal 29 n(A)
E Funcionário público estadual 24
F Funcionário público federal 20
Evento C C Comerciário 17 n(C)
T Temporário 17
Evento B I Comércio informal 11 n(B)
Total 118
Espaço Tamanho do espaço
amostral amostral - n(S)

Fonte: Elaborado pelo autor (2006).

Se você escolher ao acaso uma pessoa do grupo pesquisado, qual a


probabilidade de ela ter vínculo do tipo:

a. funcionário público municipal;


b. comerciário;
c. comércio informal.

Compreenda passo a passo.

Passo 1: identificar os elementos do espaço amostral e do evento solicitado.

S: todas as pessoas pesquisadas;


A: pessoa com vínculo do tipo funcionário público municipal;
B: pessoa com vínculo do tipo comerciário;
C: pessoa com vínculo do tipo comércio informal.

Passo 2: identificar o número de elementos de cada conjunto.

n(S) = 118;
n(A) = 29;
n(B) = 17;
n(C) = 11.

102
Probabilidade e Estatística

Passo 3: usar a fórmula da probabilidade.

Obs: após efetuar a divisão, é só multiplicar o resultado por 100 para obter a
probabilidade na forma percentual.

Para o evento A P(A) = 0,2458 ou 24,58%.

Para o evento B P(B) = 0,0932 ou 9,32%.

Para o evento C P(C) = 0,1441 ou 14,41%.

No exemplo anterior, você calculou a probabilidade para três eventos. A


seguir, você montará uma tabela com as probabilidades para todos os eventos
calculados. Siga os passos.

Compreenda passo a passo.

Passo 1: identificar os elementos do espaço amostral e do evento solicitado.

S: todas as pessoas pesquisadas (no caso, pessoas acometidas de estresse);


D: pessoa com vínculo do tipo funcionário público estadual;
E: pessoa com vínculo do tipo funcionário público federal;
F: pessoa com vínculo do tipo temporário.

Passo 2: identificar o número de elementos de cada conjunto.

n(S) = 118;
n(D) = 24;
n(E) = 20;
n(F) = 17.

Passo 3: usar a fórmula da probabilidade.

Obs: após efetuar a divisão, é só multiplicar o resultado por 100 para obter a
probabilidade na forma percentual.

103
Capítulo 3

Para o evento D P(D) = 0,2034 ou 20,34%.

Para o evento E P(E) = 0,1695 ou 16,95%.

Para o evento F P(F) = 0,1441 ou 14,41%.

Passo 4: montar a tabela com as probabilidades correspondentes a cada evento.

Tabela 3.1 – Levantamento com 90 chefes de famílias sobre os diferentes vínculos de trabalho

Tipos de vínculo No de pessoas Probabilidade

M Funcionário público municipal 29 0,2458


E Funcionário público estadual 24 0,2034
F Funcionário público federal 20 0,1695
C Comerciário 17 0,1441
T Temporário 17 0,1441
I Comércio informal 11 0,0932
Total 118 1*

* Repare que a soma é 1 ou 100%


Fonte: Elaboração do autor (2006).

Agora que você já compreendeu o conceito clássico de probabilidade e como


realizar os cálculos, é hora de compreender o que é frequência relativa e como
realizar os cálculos.

Frequência Relativa
A frequência relativa de um evento A é calculada dividindo o número de vezes
que ocorre o evento A pelo total de observação do experimento. É chamada,
também, de probabilidade avaliada ou probabilidade estimada.

Veja a fórmula abaixo.

Frequência relativa de um evento A.

frA = número de vezes que ocorreu A


número total de observações

104
Probabilidade e Estatística

Na verdade, a frequência relativa é calculada quando você deparar-se com


situações em que o cálculo da probabilidade de um evento não é possível. Nesse
caso, só é possível o cálculo de uma aproximação, a qual, por sua vez, consiste em
analisar o experimento e, com os resultados obtidos, calcular a frequência relativa.

É importante que você saiba que essa aproximação para o cálculo de probabilidade
só será considerável caso haja um número bastante grande de tentativas de
execução do experimento. Como fazer isso? Veja os exemplos a seguir.

•• Exemplos do cálculo da frequência relativa.


Em um teste feito com cobaias em laboratório, foi analisada uma delas e, após
inúmeras vezes, sob efeito de estímulos (comida, reação a dor etc.), ela executou
um comando, que era empurrar uma pequena alavanca. Foi observado que, após
3500 estímulos, a cobaia executou o comando 875 vezes. Qual é a frequência
relativa para o evento A: a cobaia executar o comando?

Como realizar o cálculo passo a passo.

Passo 1: identificar o numerador e o denominador da fórmula.

Número total de observações: 3500.


Número de vezes que ocorre A: 875.

Passo 2: usar a fórmula da frequência relativa.

Obs: após efetuar a divisão, é só multiplicar o resultado por 100 para obter a
probabilidade na forma percentual.

frA = número de vezes que ocorreu A


número total de observações

Passo 3: interpretar os dados.

A frequência relativa para a cobaia executar a tarefa é de 25%; ou, ainda, a


probabilidade estimada da cobaia executar a tarefa é de 25%.

105
Capítulo 3

•• Algumas considerações.
Consideremos S um espaço amostral, e A, B, C são eventos contidos em S, então:

a. para cada evento A → 0 ≤ P(A) ≤ 1 (a probabilidade de A vai de 0 a


1 ou de 0% a 100%);

b. P(S) = 1 ↔ ;

c. sejam A, B e C todos os eventos possíveis do espaço amostral, então


P(A) + P(B) + P(C) = 1 ou 100%;

d. quando A e B são mutuamente exclusivos: P(A ∪ B) = P(A) + P(B);


e. quando A e B não são mutuamente exclusivos: P(A ∪ B) = P(A) +
P(B) – P(A ∩ B);
f. se A, B, C, ... são uma sequência de eventos mutuamente
exclusivos, então P(A ∪ B ∪ C ∪...) = P(A) + P(B) + P(C) + ....

Seção 3
Distribuição de probabilidades
A variável aleatória é uma ferramenta na análise estatística que possibilita a
atribuição de números para resultados de experimentos, adequando, assim, o
problema para um melhor tratamento matemático. Dentro da Estatística, ela é
considerada uma função que associa os números aos eventos de um espaço
amostral. Você poderá entender melhor se começar analisando um exemplo.

•• Exemplos de variável aleatória e distribuição de probabilidades.


Exemplo 1: se o experimento consistir em dois lançamentos de uma moeda, e a
variável aleatória (v.a.), definida como o nº de caras obtidas em dois lançamentos
de uma moeda, então você terá:

v.a. ⇒ X = nº de caras obtidas em dois lançamentos de uma moeda;

X definirá uma variável aleatória que poderá assumir os valores descritos na


tabela a seguir (K = cara e C = coroa).

106
Probabilidade e Estatística

Tabela 3.2 − Organização dos resultados e valores

Resultados Resultados Resultados possíveis nos Valor VA


1º lançamento 2º lançamento dois lançamentos

K K KK 2

K C KC 1

C K CK 1

C C CC 0
Fonte: Elaboração do autor (2006).

Você pode observar que existe apenas uma possibilidade para cada situação e o total
de possibilidades é 4; então, o cálculo da probabilidade dá-se da seguinte forma.

Escrevendo na tabela, atribuindo a probabilidade de cada linha, você terá


conforme na sequência.

Tabela 3.3 − Distribuição de probabilidade

Resultados possíveis
Valor VA Probabilidade
nos dois lançamentos

KK 2 1
/4

KC 1 1
/4
Duas possibilidades
CK 1 1
/4
de sair uma cara
CC 0 1
/4

Fonte: Elaboração do autor (2006).

Essa tabela caracteriza a distribuição de probabilidade, que é a probabilidade


de ocorrência de cada um dos valores da variável aleatória.

Note que o valor 1 repete-se, não é? Então, você pode agrupar e montar uma
nova tabela sem as repetições. É claro que se agrupam os valores repetidos. Você
deve somar as probabilidades, não se esqueça disso. Observe a seguir.

107
Capítulo 3

Tabela 3.4 − Agrupamento de resultados

Ao agrupar os
No de caras (Valor v.a) Probabilidade
resultados da variável
2 1
/4 aleatória (uma cara -1),
1 1
/2 você deve somar as
probabilidade:
0 1
/4

Fonte: Elaboração do autor (2006).

O estudo de probabilidades é uma ferramenta de apoio à decisão. É com base em


seu estudo que você terá oportunidade de suporte para analisar os experimentos,
organizar suas possibilidades e, então, partir para a ação, adotando o resultado
que julgar mais eficaz.

A variável aleatória e a distribuição de probabilidades são muito utilizadas


nesse sentido. Você pode ver que, a cada valor da variável, corresponde uma
probabilidade de ocorrência.

Como a variável aleatória possibilita a atribuição de valores aos eventos, você


pode encontrar dois tipos de situação.

Variáveis aleatórias discretas: elas podem assumir um conjunto constante


discreto, ou seja, enumerável, finito de valores.

Exemplo: número de caras resultante de lançamentos de uma moeda,


quantidade de caminhões de determinado modelo, número de defeitos por peça,
entre outros, são exemplos deste tipo de variáveis.

Variáveis aleatórias contínuas: são as variáveis em que não conseguimos


enumerar seus possíveis resultados, por estes formarem um conjunto infinito de
valores em um intervalo de números reais.

Exemplo: peso, altura, temperatura, tempo de transporte, custo de uma operação etc.

Baseado nesses dois conceitos, você pode atribuir a cada um dos tipos de
variáveis aleatórias uma distribuição de probabilidades de acordo com o tipo de
variável, veja a figura a seguir.

Figura 3.7 − Tipos de distribuição de probabilidade

Variável aleatória Distribuição discreta


discreta de probabilidade

Variável aleatória Distribuição contínua


contínua de probabilidade
Fonte: Elaboração do autor (2011).

108
Probabilidade e Estatística

Como você pôde observar, cada tipo de variável gera um tipo de distribuição de
probabilidade. Em resumo, os tipos de distribuição de probabilidades são:

•• distribuição discreta de probabilidades; e


•• distribuição contínua de probabilidades.

Como elas são diferentes, os métodos de cálculos das probabilidades também são.

Você vai estudar, na próxima seção, os modelos mais importantes e mais


aplicados dentro da área de seu curso, que são a distribuição binomial, para a
variável discreta, e a distribuição normal, para a contínua 1.

Uma distribuição discreta de probabilidade de uma variável aleatória atribui


probabilidades aos distintos valores dessa variável. Observe que essa distribuição
não atribui probabilidade para intervalos, e sim para cada valor ou para um
conjunto de valores da variável.

Uma das principais distribuições discretas é a binomial. Veja, a seguir, como se


calcula probabilidade usando esse método.

A distribuição binomial é o método utilizado para cálculo de probabilidades de


experimentos que se repetem algumas vezes e seguem algumas características.

A distribuição binomial é aplicável se:

1. o experimento que você está observando for repetido n vezes


independentes;
2. cada tentativa (repetição) admitir somente dois resultados:
· sucesso: denotado por S;
· fracasso: denotado por F.

A probabilidade de sucesso é denotada por p ⇒ P(S) = p, e a probabilidade de


fracasso é denotada por q ⇒ P(F) = q.

Importante: a soma das probabilidades de sucesso e fracasso é igual a 100%,


ou seja, é igual a 1 ⇒ p + q = 1.

A soma é utilizada se você estiver interessado em estudar o número de sucessos


e fracassos sem importar a ordem em que acontecem.

1. Para o bom andamento de seu estudo, é importante que você entenda bem a diferença entre as duas
variáveis, a discreta e a contínua!

109
Capítulo 3

Diante do exposto, é importante salientar que:

•• a distribuição binomial só é aplicável caso ocorram os dois casos


citados anteriormente;
•• os termos sucesso e fracasso são usados se o resultado esperado
ocorre ou não, ou seja, depende do objetivo de seu estudo.

Veja o exemplo, a seguir, para compreender como realizar os cálculos.

Em um exame, você deseja saber a probabilidade de erro de uma determinada


questão. Esta apresenta cinco alternativas (a, b, c, d, e) e somente uma está
correta. Qual é a probabilidade de sucesso?

Nesse caso, o objetivo é estudar a probabilidade de erro, então, o sucesso


refere-se ao erro. Para calcular a probabilidade de sucesso, você deve calcular a
probabilidade de erro da questão.

Veja como se calcula passo a passo.

Passo 1: identificar os elementos do espaço amostral e do evento solicitado.


Evento A e espaço amostral S.

A: errar a questão;
S: todas as opções (a, b, c, d, e).

Passo 2: identificar o número de elementos do evento e do espaço amostral.

n(A) = 4 (se somente uma está correta, sobram quatro incorretas);


n(S) = 5.

Passo 3: usar a fórmula da probabilidade.

→ a probabilidade de sucesso é, então, p = 0,8.

Qual é a probabilidade de fracasso?

110
Probabilidade e Estatística

Veja, a seguir, passo a passo.

Passo 1: identificar os elementos do espaço amostral e do evento solicitado.

B: acertar a questão;
S: todas as opções (a, b, c, d, e).

Passo 2: identificar o número de elementos do evento e do espaço amostral.

n(B) = 1 (se somente uma está correta);


n(S) = 5.

Passo 3: usar a fórmula da probabilidade.

- a probabilidade de fracasso é, então, q = 0,20

Observe:

p + q = 0,8 + 0,2 = 1 ou 100%

Desta forma, para achar o fracasso, poderia diminuir o sucesso 0,80 de 1,


então: 1-0,80 = 0,20.

Analise o seguinte exemplo: estudar a probabilidade de errar, como no


exemplo anterior. Ainda citando o exemplo anterior: nesse problema, você
estudou a probabilidade de errar somente uma questão do exame, mas e para
estudar as possibilidades de erro ou acerto de questões de um exame inteiro?
É aí que entra a distribuição binomial.

No exemplo anterior, você calculou a probabilidade de sucesso (errar) para


somente uma tentativa (questão). Agora, você vai calcular, para n tentativas, a
probabilidade de k sucessos. Acompanhe.

Seja X o número de sucessos em n tentativas do experimento.

Então, a fórmula para determinar a probabilidade de um dado número k de


sucessos é dada por:

Em que:

111
Capítulo 3

Sendo:

Cn,k = combinação de n elementos organizados em grupos de k elementos;


n = tentativas do experimento;
k = número de sucessos desejados;
p = probabilidade de sucesso (ocorrência do evento);
q = probabilidade de fracasso (não ocorrência do evento).

Notação: n! (fatorial)

n! = n.(n − 1).(n − 2). ... .

k! = k.(k − 1).(k − 2). ... .

Veja, a seguir, exemplos do cálculo de probabilidade usando a distribuição binomial.

Exemplo 1: uma prova com quatro questões, cada uma apresenta cinco
alternativas (a, b, c, d, e) e somente uma está correta. Qual a probabilidade de
errar duas questões?

Nesse caso, o objetivo é estudar a probabilidade de erro, então o sucesso refere-


se ao erro. Veja, a seguir, como se calcula passo a passo.

Passo 1: calcular a probabilidade de errar (no caso, sucesso) para cada questão.

A: errar a questão;
S: todas as opções (a, b, c, d, e);

n(A) = 4 (se somente uma está correta, sobram quatro incorretas);


n(S) = 5;

− a probabilidade de sucesso é, então, p = 0,80.

Passo 2: calcular a probabilidade de acertar (no caso, fracasso) para cada questão.

Você pode calcular de dois modos.

1. Primeiro modo de cálculo:


B: acertar a questão;
S: todas as opções (a, b, c, d, e);

112
Probabilidade e Estatística

n(B) = 1 (se somente uma está correta);


n(S) = 5;

− a probabilidade de fracasso, então q = 0,20.

2. Segundo modo de cálculo:


p + q = 1 ⇒ 0,8 + q = 1 ⇒ q = 1 – 0,8 ⇒ q = 0,20

Passo 3: identificar cada um dos componentes da fórmula.

n = 4 (total de repetições – são quatro questões com as mesmas características);


k = 2 (número de sucessos – errar duas questões);
p = 0,80 (probabilidade de sucesso, calculado anteriormente);
q = 0,20 (probabilidade de fracasso, calculado anteriormente).

Passo 4: calcular a probabilidade usando a fórmula apresentada.

Passo 5: como interpretar esses dados?

A probabilidade de uma pessoa errar duas questões de um teste de quatro questões


é de 15,36%. Note que não é 50%, pois você deve levar em consideração que cada
questão tem sua probabilidade e, também, você pôde agrupar as questões de várias
maneiras (errar a 1ª e a 3ª, ou a 2ª e a 4ª, ou a 1ª e a 4ª, e assim por diante).

Tudo o que você acabou de estudar, neste tópico, é o método de cálculo de


probabilidade usando a distribuição binomial. A intenção, com esse estudo, é que
você tenha uma noção desse processo, porém sem maiores aprofundamentos.

113
Capítulo 3

Cálculo de probabilidade usando distribuição contínua de


probabilidade.
Uma distribuição contínua de probabilidade de uma variável aleatória atribui
probabilidades a intervalos de valores dessa variável. Note que essa distribuição
atribui probabilidade para intervalos, e não para um valor dessa variável.

Uma das principais distribuições contínuas é a distribuição normal. No decorrer


deste tópico, você vai estudar um pouco dessa distribuição, além de aprender a
calcular probabilidade usando esse método.

A distribuição normal.
Como você estudou anteriormente, quando se utiliza uma variável aleatória
contínua, pode-se atribuir probabilidade a essa variável. Conforme a seção anterior,
os processos definidos a partir de contagens conduzem aos modelos que envolvem
variáveis aleatórias discretas, enquanto que os processos definidos a partir de
medidas conduzem aos modelos que envolvem variáveis aleatórias contínuas.

Figura 3.8 − Tipos de distribuições de probabilidade

Contagens Variável aleatória


discreta

Variável aleatória
Medidas
contínua

Fonte: Elaboração do autor (2011).

Podemos citar, como exemplos de variáveis contínuas, a altura das pessoas, a


temperatura corporal, o peso, os escores obtidos em testes psicológicos etc.

Antes de começar o estudo do cálculo de probabilidade usando a distribuição


normal, vamos relembrar alguns conceitos.

Considere a distribuição de frequências e seu histograma a seguir.

114
Probabilidade e Estatística

Tabela 3.6 − Tempo, em minutos, para as entregas urbanas da empresa X

Tempo (em minutos) Nº de entregas (fi)

15,9 |--- 18,7 2

18,7 |--- 21,5 6

21,5 |--- 24,3 10

24,3 |--- 27,1 14

27,1 |--- 29,9 10

29,9 |--- 32,7 6

32,7 |--- 35,5 2

Total (∑fi) 50

Fonte: Elaboração do autor (2011).

Histograma

Gráfico 3.2 – Tempo, em minutos, para as entregas urbanas da empresa X

16

14

12
No de entregas

10

15,9 |-- 18,7 18,7 |-- 21,5 21,5 |-- 24,3 24,3 |-- 27,1 27,1 |-- 29,9 29,9 |-- 32,7 32,7 |-- 35,5

Tempo em minutos
Fonte: Elaboração do autor (2011).

Observe que o gráfico é construído no sistema de eixos cartesianos, não é


mesmo? No eixo horizontal, são marcados os valores ou intervalos das classes
assumidos pela variável. No eixo vertical, marcamos as frequências simples,
que servirão para marcar a altura dos retângulos, indicando, assim, o número de
observações (ocorrências) de cada valor ou classe da variável.

115
Capítulo 3

Como a altura de cada retângulo é proporcional à frequência simples, a área de


cada retângulo também é. Considerando isso, a soma das áreas dos retângulos
também é proporcional à frequência total.

Continuando com a recordação, veja, agora, o polígono de frequências. Para


construir um polígono de frequência de dados, é só unir, por linhas, os pontos
médios das bases superiores dos retângulos do histograma.

Acompanhe o exemplo a seguir.

Gráfico 3.3 – Tempo, em minutos, para as entregas urbanas da empresa X

16

Polígono de Estes triângulos


14
Frequência compensam os
12
No de entregas

que ficam fora


10 do polígono
8

0
,3

,5
,7

,5

,1

,9

,7
24

35
18

21

27

29

32
|--

|--
|--

|--

|--

|--

|--
,5

,7
,9

,7

,3

,1

,9
21

32
15

18

24

27

29

Tempo em minutos

Fonte: Elaboração do autor (2011).

Você pôde observar que a área do histograma é igual à área abaixo do polígono
de frequências, ou seja, os triângulos que ficam fora são compensados por
aqueles que estão adicionados por dentro.

O gráfico expressa os tempos que a empresa levou para realizar 100% das
entregas de um determinado período.

Você observou que o polígono de frequências tem um formato especial? Sim, ele tem
o formato de um sino. Essa curva é chamada de curva normal ou curva de Gauss-
Laplace e tem algumas características bem especiais. Conheça-a no tópico a seguir.

116
Probabilidade e Estatística

Características da curva normal.


Analisando o polígono de frequências da maioria das séries, você pode observar,
com certo ajuste, que elas aproximam-se de uma distribuição normal, ou seja,
apresentam um gráfico semelhante conforme pode ser observado a seguir.

Gráfico 3.4 − Curva de Gauss-Laplace

X = Me = Mo X

Fonte: Adaptado de Silva (1997, p.70).

Principais características da curva normal.


Dentre as principais, podemos citar algumas, tais como:

a. a curva caracteriza-se por ter a forma de um sino;


b. a curva tem 2 pontos de inflexão (lugar onde a curva modifica-se);
c. a curva normal é simétrica com relação à média (é igual tanto à
esquerda, quanto à direita da média);
d. a área limitada pela curva e pelo eixo das abscissas é 1 ou 100%
(sendo assim, por ser simétrica, tem 50% da área à esquerda e
50% da área à direita da média);
e. a curva é assintótica, isto é, aproxima-se, indefinidamente, do eixo
das abscissas sem tocá-lo;
f. a curva normal é unimodal, isto é, possui um só pico ou ponto de
frequência máxima, ponto este em que coincidem a moda, a média
e a mediana;
g. a função que define a curva é .

117
Capítulo 3

A distribuição normal de probabilidade usa como base a curva normal.

Sabendo que a área abaixo do polígono (curva) representa proporcionalmente


a frequência total da série, e com o uso da média e do desvio padrão tem-se
condições de realizar o estudo de concentração dos dados em torno da média.

Com relação à área abaixo da curva, analise o gráfico a seguir.

Gráfico 3.5 − Distribuição normal, com percentuais em referência ao desvio padrão

3 4 ,1 3 %

1 3 ,5 9 % 0 ,5 o u 5 0 %
2 ,1 5 %
X
Fonte: Adaptado de Triola (1999, p.43).

Veja, a seguir, alguns exemplos para compreender como realizar os cálculos do


desvio padrão.

Em um teste, a média dos escores de um grupo de pessoas foi de μ = 80, e


o desvio padrão foi de σ(x) = 3. Pode-se interpretar esses valores da forma
mostrada na sequência.

Os valores da série estão concentrados em torno da média:

•• o intervalo (μ − σ(x); μ + σ(x)) contém, aproximadamente, 68,26%


dos elementos da série, ou seja, o intervalo (77; 83) → (80 − 3 = 77
e 80 + 3 = 83);
•• o intervalo (μ − 2σ(x); μ + 2σ(x)) contém, aproximadamente, 95,44%
dos elementos da série, ou seja, o intervalo(74; 86) → (80 − 6 = 74
e 80 + 6 = 86);
•• o intervalo (μ − 3σ(x); μ + 3σ(x)) contém, aproximadamente, 99,74%
dos elementos da série, ou seja, o intervalo (71; 89) → (80 − 9 = 71
e 80 + 9 = 89).

Veja, no gráfico a seguir, a ilustração desse exemplo.

118
Probabilidade e Estatística

Gráfico 3.6 − Distribuição normal, com percentuais em referência ao desvio padrão

9 9 ,7 4 %
9 5 ,4 4 %
6 8 ,2 6 %

3 4 ,1 3 % 3 4 ,1 3 %

1 3 ,5 9 % 1 3 ,5 9 %
2 ,1 5 % 2 ,1 5 %

71 74 77 =80 83 86 89

Fonte: Adaptado de Triola (1999, p.43).

Como ler os gráficos? Aí vão algumas sugestões:

• o percentual de entregas com tempo entre 77 e 83 minutos é de 68,26% (ou,


ainda, a probabilidade de escolher uma entrega que tenha sido feita entre 77
e 83 minutos é de 68,26%);

• o percentual de entregas com tempo entre 74 e 86 minutos é de 95,44% (ou,


ainda, a probabilidade de escolher uma entrega que tenha sido feita entre 74
e 86 minutos é de 95,44%);

• o percentual de entregas com tempo entre 71 e 89 minutos é de 99,74% (ou,


ainda, a probabilidade de escolher uma entrega que tenha sido feita entre 71
e 89 minutos é de 99,74%).

Como você pôde observar, os percentuais estão ligados à média e ao desvio


padrão e, por sua vez, determinam os intervalos a serem estudados. Esses
percentuais são obtidos calculando a área entre a curva e o eixo X, entre os
extremos do intervalo que você está estudando. Exemplo: (77; 83).

Baseado nesse estudo, você poderá calcular a probabilidade de algum evento


que resulte em um intervalo. Veja como fazer esses cálculos no próximo tópico.

119
Capítulo 3

Descrição do método de cálculo


A probabilidade em uma distribuição contínua de probabilidade (probabilidade
de ocorrência de um intervalo) é obtida calculando a área entre a curva e o eixo
X, como você já viu em estudos anteriores. Essa área é calculada com o uso de
uma ferramenta matemática chamada de integral definida da função, ou seja,
dada a função a seguir, a área entre a curva e o eixo X, no intervalo (a; b), é
calculada da seguinte forma.

Gráfico 3.7 − Distribuição normal, com intervalo definido

f
P (a < x < b )

a b x
Fonte: Adaptado de Silva (1997, p.71).

A determinação dessa área usando o cálculo de integral é bastante complicada


e não será usado em seu estudo. Para superar essa dificuldade, utiliza-se outra
distribuição, chamada de Distribuição Normal Padronizada (ou Reduzida). O artifício
consiste em transformar a variável X, com média μ e desvio padrão σ, em uma
variável Z, com média 0 e desvio padrão 1, para que você possa fazer utilização da
tabela de Z (variável padronizada) com os valores das áreas já calculados.

Como padronizar a variável X e para quê?

Essa padronização é adotada para tornar o cálculo de probabilidade da


ocorrência de intervalo mais fácil e mais simples. Qualquer distribuição X com
as características citadas anteriormente pode ser transformada na distribuição
normal padronizada (ou reduzida) Z, para que seja possível o cálculo de áreas.

A transformação da variável aleatória X na variável padronizada dá-se mediante o


uso da fórmula a seguir.

120
Probabilidade e Estatística

Cálculo da variável padronizada.

Em que:

X1 = valor da variável aleatória (limite do intervalo);


μ = média;
σ = desvio padrão.

Acompanhe os exemplos a seguir para compreender como realizar o cálculo.

Exemplo 1: a área a ser calculada está no intervalo que vai da média até x1.
Nesse caso, só é necessário o cálculo de um limite do intervalo.

Gráfico 3.8 e 3.9 − Padronização de uma distribuição normal

P( < x< x1)

x1 x

P(0 < z< z1 )

0 z1 z
Fonte: Adaptado de Silva (1997, p.71).

Nesse caso, a probabilidade de ocorrer o intervalo da média até o x1 é igual à


probabilidade de ocorrer o intervalo de 0 à Z1 ⇒ P(μ< x < x1 ) = P (0 < z < z1).

Exemplo 2: a área a ser calculada está no intervalo que vai de x1 até x2. Nesse
caso, é necessário o cálculo de dois limites do intervalo (Z1 e Z2).

Cálculo da variável padronizada.

121
Capítulo 3

Em que:

X1 e X2 = valores da variável aleatória (limites do intervalo);


μ = média;
σ = desvio padrão.

Gráficos 3.10 e 3.11 − Padronização de uma distribuição normal

P(x1< x< x2)

x1 x2 x
P(z1< Z < z2)

z1 0 z2 z
Fonte: Adaptado de Silva (1997, p.71).

Nesse caso, a probabilidade de ocorrer o intervalo entre x1 e x2 é igual à


probabilidade de ocorrer o intervalo entre Z1 e Z2 ⇒ P(x1 < x < x2) = P (z1 < z < z2).

Até aqui, você conheceu como padronizar os valores da variável aleatória X. Agora,
você irá aprender como usar a tabela 2 de áreas da distribuição padronizada.

Veja, a seguir, um gráfico com representação da área dada pela tabela.

Gráfico 3.12 − Distribuição normal padronizada

Área
0 z
Fonte: Triola (1999, Anexos).

Observe que, conhecendo a área especificada na tabela, qualquer tipo de área


poderá ser calculada usando a simetria da curva.

2. Com o valor de Z calculado, basta encontrar o valor na tabela (ver tabela no final deste livro didático).

122
Probabilidade e Estatística

Observe os exemplos a seguir com atenção.

Exemplo 1: em um levantamento executado por uma empresa de entregas, resultou


que o tempo médio para a realização das entregas era de 21 minutos e o desvio
padrão foi de 7 minutos. Ao escolher, ao acaso, uma das entregas realizadas, qual a
probabilidade de o tempo para realizá-la estar entre 21 e 28 minutos?

Calculando passo a passo.

Passo 1: identificar todos os elementos que compõem o problema.

•• média: μ = 21;
•• desvio padrão: σ(x) = 7;
•• os limites do intervalo: como um dos limites é a própria média, você
só terá que calcular um Z, o outro limite é 28 ⇒ X = 28.

Passo 2: calcular a variável padronizada Z.

⇒Z=1

Passo 3: identificar, no gráfico, qual é a área que você deve encontrar.

Gráficos 3.13 e 3.14 − Padronização de uma distribuição normal

Área
μ=21 x=28

Área
0 z=1
Fonte: Elaboração do autor (2011).

Passo 4: procurar, na tabela, o Z = 1,00 e encontrar sua área correspondente.

123
Capítulo 3

Z 0,00 0,01 0,02


•• Primeiro, você deve procurar o valor 0,0 0,0000 0,0040 0,0080
1,0 na primeira coluna. 0,l 0,0398 0,0438 0,0478
0,2 0,0793 0,0832 0,0871
•• Depois, procurar, na primeira linha, 0,3 0,1179 0,1217 0,1255
o valor 0,00 (é como se separasse o 0,4 0,1554 0,1591 0,1628
número 1,00 em dois, uma parte seria 0,5 0,1915 0,1950 0,1985
1,0 e a outra seria o 0,00). 0,6 0,2257 0,2291 0,2324
0,7 0,2580 0,2611 0,2642
•• No cruzamento da coluna em que 0,8 0,2881 0,2910 0,2939
está o 0,00 e da linha em que está o 0,9 0,3159 0,3186 0,3212
1,0, você encontrará um número (no 1,0 0,3413 0,3438 0,3461
1,1 0,3643 0,3665 0,3686
caso é 0,3413).
1,2 0,3849 0,3869 0,3888
•• Esse número é a área entre Z e 0. 1,3 0,4032 0,4049 0,4066

Passo 5: responder e interpretar.

P(21 < x < 28) = 0,0000 + 0,3413 ou 34,13%

A probabilidade do tempo para realizar uma entrega estar entre 21 e 28


minutos é de 34,13%.

Exemplo 2: em média, a vida útil de um modelo de máquina de empacotar é de


24 anos, com um desvio padrão de 6 anos. Levando em consideração que a vida
útil desse tipo de máquina distribui-se normalmente, qual a probabilidade de uma
máquina, adquirida recentemente pela empresa, durar entre 17, 52 e 29,7 anos?

Calculando passo a passo.

Passo 1: identificar todos os elementos que compõem o problema.

•• a média: μ = 24;
•• desvio padrão: σ(x) = 6;
•• os limites do intervalo: como os limites são diferentes da média,
você deve calcular Z para os dois valores (x1 = 17,52 e x2 = 29,7).

Passo 2: calcular as variáveis padronizadas Z1 e Z2.

124
Probabilidade e Estatística

Note que obrigatoriamente você deve utilizar o valor de Z com duas casas
decimais, por conta da formatação da tabela Z.

Passo 3: identificar, no gráfico, qual é a área que você deseja encontrar.

Gráfico 3.15 e 3.16 − Padronização de uma distribuição normal

Área
x2=17,52 μ=24 x1=29,7

Área
z=-1,08 0 z=0,95

Fonte: Adaptado de Silva (1997, p.71).

Veja que a área está entre –1,08 e 0,95.

Não se preocupe com o sinal negativo de Z1. Esse sinal serve apenas para indicar
que a área está à esquerda da média (zero), por isso o negativo. Como a curva é
simétrica, a área tanto à esquerda como à direita é calculada da mesma maneira,
e o uso da tabela também é o mesmo.

Passo 4: procurar, na tabela, o Z1 = −1,08 e Z2 = 0,95 e encontrar suas áreas


correspondentes.

Procurando o Z1:

•• primeiro, procurar o valor 1,0 na primeira coluna;


•• depois, procurar, na primeira linha, o valor 0,08 (é como se separasse
o número 1,08 em dois, uma parte seria 1,0, e a outra, seria o 0,08);

125
Capítulo 3

•• no cruzamento da coluna na qual está o 0,08 e da linha na qual está


o 1,0, você encontrará um número (no caso, é 0,3599). Esse número
é a área entre Z1 e 0.

Tabela 3.7 − Tabela de valores normais Z

Cruzando a
linha com a
coluna.
Procurar 1,0

Procurar 0,08 Z 0,00 0,01 ... 0,07 0,08


0,0 0,0000 0,0040 ... 0,0279 0,0319
0,l 0,0398 0,0438 ... 0,0675 0,0714
0,2 0,0793 0,0832 ... 0,1064 0,1103
... ... ... ... ... ...
0,8 0,2881 0,2910 ... 0,3078 0,3106
0,9 0,3159 0,3186 ... 0,3340 0,3365
Cruzando a 1,0 0,3413 0,3438 ... 0,3577 0,3599
linha com a 1,1 0,3643 0,3665 ... 0,3790 0,3810
coluna. 1,2 0,3849 0,3869 ... 0,3980 0,3997

Fonte: Elaboração do autor (2011).

Agora, falta procurar o Z2! Veja como fazer:

•• primeiro, você deve procurar o valor 0,9 na primeira coluna;


•• depois, procurar, na primeira linha, o valor 0,05 (é como se separasse
o número 0,95 em dois, uma parte seria 0,9, e a outra, seria o 0,05);
•• no cruzamento da coluna na qual está o 0,05 e da linha na qual está
o 0,9, você encontrará um número (no caso, é 0,3289). Esse número
é a área entre Z2 e 0.

Tabela 3.8 – Parte da tabela de valores normais Z


Z 0,00 ... 0,04 0,05
0,0 0,0000 ... 0,0160 0,0199
0,l 0,0398 ... 0,0557 0,0596
... ... ... ... ...
0,7 0,2580 ... 0,2704 0,2734
0,8 0,2881 ... 0,2995 0,3023
0,9 0,3159 ... 0,3264 0,3289
1,0 0,3413 ... 0,3508 0,3531
1,1 0,3643 ... 0,3729 0,3749

Fonte: Elaboração do autor (2011).

126
Probabilidade e Estatística

Passo 5: responder e interpretar.

Como você tem duas áreas, o próximo passo é somar. Veja o gráfico a seguir.

Gráfico 3.17 − Soma das áreas determinadas pela padronização

Fonte: Elaboração do autor (2011).

P(17,52 < x < 29,7) = 0,3599 + 0,3289 = 0,6888 ou 68,88%.

A probabilidade de uma máquina, adquirida recentemente pela empresa, durar


entre 17,52 e 29,7 anos é de 68,88%.

Exemplo 3: em média, a vida útil de um modelo de máquina de empacotar é de


24 anos, com um desvio padrão de 6 anos. Levando em consideração que a vida
útil desse tipo de máquina distribui-se normalmente, qual a probabilidade de uma
máquina, adquirida recentemente pela empresa, durar mais do que 29,7 anos?

Calculando passo a passo.

Passo 1: identificar todos os elementos que compõem o problema.

•• a média: μ = 24;
•• o desvio padrão: σ(x) = 6;
•• os limites do intervalo: o intervalo é limitado abaixo por x = 29,7 e não
tem limite acima. Então, você deve calcular Z somente pelo valor de x.

Passo 2: calcular a variável padronizada Z.

127
Capítulo 3

Passo 3: identificar, no gráfico, qual é a área que você deseja encontrar.

Gráficos 3.18 e 3.19 − Padronização de uma distribuição normal.

Área
μ=24 x1=29,7

Área
0 z=0,95

Fonte: Elaboração do autor (2011).

Veja que a área está de 0,95 para cima.

Passo 4: procurar, na tabela, o Z = 0,95 e encontrar sua área correspondente.

Como usar a tabela?

•• primeiro, você deve procurar o valor 0,9 na primeira coluna;


•• depois, procurar, na primeira linha, o valor 0,05 (é como se separasse
o número 0,95 em dois, uma parte seria 0,9 e a outra, seria o 0,05);
•• no cruzamento da coluna na qual está o 0,05 e da linha na qual está
o 0,9, você encontrará um número (no caso, é 0,3289). Esse número
é a área entre Z2 e 0.

Cruzando a
Tabela 3.9 − Parte da tabela normal Z
linha com a
coluna.
Procurar 0,9

Procurar 0,05 Z 0,00 ... 0,04 0,05


0,0 0,0000 ... 0,0160 0,0199
0,l 0,0398 ... 0,0557 0,0596
... ... ... ... ...
0,7 0,2580 ... 0,2704 0,2734
0,8 0,2881 ... 0,2995 0,3023
0,9 0,3159 ... 0,3264 0,3289
Cruzando a 1,0 0,3413 ... 0,3508 0,3531
linha com a 1,1 0,3643 ... 0,3729 0,3749
coluna.

Fonte: Elaboração do autor (2011).

128
Probabilidade e Estatística

Passo 5: interpretar e responder.

Como a área dada pela tabela é sempre entre zero e Z, como calcular a área de
Z para cima?

Você lembra que a curva normal é simétrica e que, de cada lado, tem 50% da
área total. Então, se a metade tem 50%, ou 0,5, e você diminuir dessa área a área
encontrada, restará a área que você quer encontrar. Veja o gráfico a seguir.

Gráfico 3.20 − Determinar a área limitada abaixo pelo valor padronizado e sem limite acima

0,3289

0,5-0,3289
0 z=0,95
Fonte: Elaboração do autor (2011).

A área cinza-escuro é calculada diminuindo 0,3289 (área entre zero e Z –


encontrada na tabela) de 0,5.

P(x > 29,7) = 0,5000 – 0,3289 = 0,1711 ou 17,11%.

Então, a probabilidade de uma máquina, adquirida recentemente pela empresa,


durar mais do que 29,7 anos é de 17,11%.

Além dos casos que você estudou nos exemplos, ainda há outros. Um deles
pode ser ilustrado a seguir.

Gráfico 3.21 − Determinar a área limitada abaixo pelo valor padronizado e sem limite acima

0,3413 0,5
ou
34,13% ou
50%
X

Fonte: Elaboração do autor (2011).

Caso o limite inferior do intervalo esteja à esquerda da média, o processo é o


mesmo, calcular o Z, encontrar a área na tabela e, no final, calcular a área final.
No caso anterior, note que você terá que juntar as duas áreas, a cinza-claro com
a cinza-escuro. Lembre-se de que a área, na metade da curva, é de 0,5 ou 50%.
Somando as duas: 0,5000 + 0,3413 = 0,8413 ou 84,13%.

129
Capítulo 3

Atividades de autoavaliação
Ao final de cada unidade, você realizará atividades de autoavaliação. O gabarito
está disponível no final do livro didático, mas se esforce para resolver as
atividades sem a ajuda do gabarito, pois, assim, você estará promovendo (e
estimulando) a sua aprendizagem.

1. Em um estudo realizado sobre os padrões de indecisão, depressão e ansiedade


em adolescentes, revelou-se que a relação com os pais era fator influenciador
dessas reações. Nessa estudo, foi pesquisado um total de 1500 adolescentes, e em
675 casos, os jovens sofriam com o autoritarismo dos pais. Qual a probabilidade de
ser escolhido, ao acaso, um jovem que sofra com o autoritarismo dos pais?

2. Segundo o IBGE, na Grande Florianópolis, as pessoas com dez anos ou mais


de idade, foram agrupadas na tabela abaixo, de acordo com seu estado civil.

Desquitado(a)
Casado(a) ou separado(a) Divorciado(a) Viúvo(a) Solteiro(a) Total
judicialmente

3. O teste chamado Tarefa de Memória Seletiva (TMS) testa alguns aspectos


da memória verbal. Este baseia-se em ouvir, lembrar e aprender doze palavras
apresentadas à pessoa que está sendo testada. Diversos aspectos da memória
verbal, tais como lembrança total, armazenamento na memória de longa duração
etc., são combinados para produzir um escore global. Sabendo que, para um
grupo determinado de pessoas, a média dos escores foi de 126 pontos e que o
desvio padrão foi de 10 pontos, determine o que é pedido a seguir.

a. Calcule Z (variável padronizada) para x = 116, para x = 136, para


x = 131 e para x = 141 pontos.
b. Qual a probabilidade de escolher uma pessoa com escore maior
do que 136 pontos?
c. Qual a probabilidade de escolher uma pessoa com escore entre
126 e 131 pontos?
d. Qual a probabilidade de escolher uma pessoa com escore entre
116 e 141 pontos?

130
Capítulo 4

Amostragem e cálculo de estimativa

Seção 1
Principais conceitos
Neste capítulo, você conhecerá com mais detalhes o que é amostra e poderá
aumentar seus conhecimentos sobre como escolher, calcular e para que usar
amostras em pesquisas e levantamentos de dados. Você terá a oportunidade de
verificar como é importante o estudo da amostragem, uma vez que é uma das
ferramentas essenciais que pode apoiar suas decisões.

Você também conhecerá como proceder para calcular o erro padrão de uma estimativa.

Você já deve ter visto, nos jornais ou na televisão, quando anunciam resultados
de uma pesquisa eleitoral, informarem que os resultados têm uma margem de
erro. Isto ocorre devido ao fato do uso da amostragem, ou seja, quando uma
pesquisa baseia-se apenas em uma parcela da população.

Como não é possível executar a pesquisa com a totalidade dessa população, os


resultados não são exatos, necessitando, assim, do cálculo da margem de erro.
Dessa forma, você vai entender como se procede para encontrar esse erro.

Serão usados alguns termos que são fundamentais no entendimento dos cálculos
e da interpretação. Sendo assim, antes de saber como se calcula o erro de uma
estimativa, é muito importante que você aprenda alguns conceitos importantes.

A amostragem está intimamente ligada aos estudos de Estatística descritiva


e probabilidades. Além de estarem ligados, são dependentes uns dos outros.
Veja a figura a seguir.

131
Capítulo 4

Figura 4.1 − Relações dos estudos estatísticos

Amostragem

Estatística descritiva Probabilidade

Fonte: Elaboração do autor (2006).

Como é feita essa relação entre os três? Com o estudo deste capítulo, você vai
poder compreender melhor. Conheça, a seguir, alguns conceitos importantes
para o estudo da amostragem.

População
População é o conjunto total de elementos com, pelo menos, uma característica
em comum, cujo comportamento interessa estudar.

Notação:

N = número de elementos da população (tamanho da população).

•• Censo: é uma coleção de dados relativos a todos os elementos de


uma população.
•• Parâmetro: é utilizado para designar alguma característica descritiva
dos elementos da população (percentagem, média etc.).

Amostra
Amostra é o conjunto de elementos ou observações, recolhidos a partir de um
subconjunto da população, que se estuda com o objetivo de tirar conclusões
para a população de onde foi recolhida.

Notação:

n = número de elementos da amostra (tamanho da amostra).


Contudo, qual tamanho de amostra usar? Essa sempre é a dúvida de muitos
pesquisadores. O tamanho da amostra muitas vezes depende da experiência
e do conhecimento do pesquisador. Experiência em saber qual o tamanho que
realmente representará, com fidelidade, a população e o conhecimento do
pesquisador sobre o tema e sobre a população-alvo do estudo. Dessa forma,
você verá duas formas de calcular o tamanho da amostra, que são as seguintes:

132
Probabilidade e Estatística

•• quando não se tem informações sobre a população: se o pesquisador


não tem acesso às medidas, como desvio padrão, percentuais etc.
•• quando se tem informações sobre a população: se o pesquisador
tem acesso às medidas, como desvio padrão, percentuais etc.

Quando não se tem informações sobre a população.

Nesse caso, é necessária a especificação do erro amostral pretendido


pelo pesquisador. Sugeridas por Barbetta (2002), as formas de cálculo
do tamanho da amostra, quando você não tem acesso a informações da
população, são as que seguem.

a. Quando não se conhece o tamanho da população.

1
Tamanho da amostra: n0 = .
E2

Em que:

n0 = primeira aproximação para o tamanho da amostra;


E = erro amostral tolerável.

(Usar o erro na forma unitária, exemplo: erro de 2%, usar 0,02).

b. Quando se conhece o tamanho da população.

N .n0
Tamanho da amostra: n= .
N + n0

Em que:

n0 = primeira aproximação para o tamanho da amostra;


N = tamanho da população;
n = tamanho da amostra.

Veja, a seguir, um exemplo de como realizar os cálculos.

Um pesquisador deseja realizar um estudo para com estudantes do Ensino


Fundamental da rede municipal de escolas da cidade de Florianópolis. Nessa
pesquisa, ele irá tolerar um erro amostral de 4%, e gostaria de saber qual seria o
tamanho da amostra necessária para realizar sua pesquisa, nos seguintes casos.

133
Capítulo 4

a. O pesquisador não conhece o número total de estudantes do


Ensino Fundamental da cidade.
Calculando passo a passo.

Passo 1: identificar os elementos da fórmula.

n0 = tamanho aproximado da amostra;


E = erro amostral tolerável = 4% ou 0,04 (é só dividir por 100).

Passo 2: usar a fórmula.

1 1 1
n0 = 2
= 2
= = 625 n0 = 625 estudantes.
(E) (0,04) 0,0016

Um tamanho aproximado para a amostra seria de 625 estudantes do Ensino


Fundamental.

b. O número total de estudantes do Ensino Fundamental da cidade


é de 27.000 alunos.
Calculando passo a passo.

Passo 1: identificar os elementos da fórmula.

n0 = tamanho aproximado da amostra;


E = erro amostral tolerável = 4% ou 0,04;
N = tamanho da população = 27000.

Passo 2: usar a fórmula.

1 1 1
n0 = = = = 625 n0 = 625 estudantes.
( E ) 2 (0,04) 2 0,0016

Um tamanho aproximado para a amostra seria de 625 estudantes do Ensino


Fundamental. Observe que o pesquisador teve acesso à informação de que a
população seria de 27.000 estudantes, então você deve passar para o passo seguinte.

Passo 3: calcular o tamanho da amostra usando a população com a seguinte fórmula.

N .n0 27000.625 16875000


n= = = = 610,86
N + n0 27000 + 625 27625

Arredondando, seriam 611 estudantes.

134
Probabilidade e Estatística

c. Quando se tem informações sobre a população.


Neste caso, além da margem de erro tolerável, seriam necessárias informações
como desvio padrão, percentual dos indivíduos que apresentam as características
estudadas etc. Essas informações poderiam ser obtidas de pesquisas anteriores
ou, até mesmo, de uma pré-pesquisa. Nesta última, seria preciso uma
amostragem prévia para realizar os levantamentos necessários. Embora, não seja
de nosso interesse aprofundar o estudo sobre este assunto, a seguir estão as
fórmulas para se calcular o tamanho da amostra para os dois casos existentes,
para estimar a proporção (percentual) e a média populacional.

Quadro 4.1 − Tamanho da amostra, proporção (percentual) e média populacional

Para a estimativa da proporção


Para a estimativa da média populacional
populacional (percentual)

Para amostragem com reposição Para amostragem com reposição


(população infinita) (população infinita)

( (
2 2
Z .σ(x) Z . pq
ˆˆ
n= e n=
e2

Para amostragem sem reposição Para amostragem sem reposição


(população infinita) (população infinita)

Z2. σ2 (x)N ˆ ˆN
Z2 . pq
n= n=
e (N-1)+Z2.σ2 (x)
2 e (N-1)+Z2. pq
2
ˆˆ

Onde: Onde:

n = tamanho da amostra; n = tamanho da amostra;


N = tamanho da população; N = tamanho da população;
e = erro amostral; e = erro amostral;
σ = desvio padrão; p = percentual de elementos com a
Z = limite do intervalo (dist. Normal) característica estudada;
q = percentual de elementos sem a
característica estudada;
Z = limite do intervalo (dist. Normal)

Fonte: Elaboração do autor (2006).

Representatividade da amostra na população

Quando você está cozinhando, após temperar a comida, costuma mexer com
uma colher, não é? Por que você mexe? Para que o tempero fique bem misturado
com a comida. Correto? Qual é o passo seguinte? Provar! Claro, você pega
apenas um pouco da comida para saber como está o gosto. Para tanto, não é
necessário comer tudo!

135
Capítulo 4

Em resumo, o processo de amostragem é bem semelhante. Para que a prova de


comida seja representativa, você teve, antes, que mexer bem, tornando, assim,
uma mistura homogênea. Se for bem misturada, qualquer amostra que você colha,
em qualquer lugar da panela, dará uma boa noção de como o todo (a comida) está.

Em pesquisas, o processo é bem semelhante!

Você lembra-se da pesquisa de intenções de voto? Em época de campanha


eleitoral, quando um instituto de pesquisa faz uma pesquisa, ele tem que
selecionar eleitores que representem as mais diversas camadas sociais, regiões,
raças etc., tornando, assim, a amostra representativa da população.

Você saberia dizer se os dados levantados, com base em alguns poucos


elementos, podem trazer informações precisas acerca de uma população inteira?

De certa forma, sim! Você não terá informações exatas da população usando uma
amostra, mas, sim, uma aproximação bastante precisa. É importante salientar
que, por não haver pesquisado a totalidade dos elementos, você é levado a
concluir que os dados nunca representarão um reflexo exato da população.

Exemplos bem conhecidos são as pesquisas eleitorais divulgadas pelos meios


de comunicação. Veja.

Gráfico 4.1 − Exemplo dos dados de uma pesquisa eleitoral

39%
37%
35%

26% 24% 26%


A
B
15% C
11% D
9%

10% 11%
7%

Agosto Setembro Outubro

Fonte: Elaboração do autor (2006).

Como era a notícia que deu origem a esta tabela?

“A pesquisa de outubro apresentou os seguintes resultados: o candidato A tem


39% das intenções de voto, o candidato B tem 26% das intenções de voto,
o candidato C tem 9% das intenções de voto e o candidato D tem 7% das
intenções de votos. O erro é de 2%”.

136
Probabilidade e Estatística

De fato, existe uma margem de erro. Esse erro, relatado na notícia, gera um
intervalo, ou seja, as intenções de votos para o candidato A podem variar de 37%
a 41%. Por se tratar de uma pesquisa feita por amostragem, você não pode dizer
que o candidato terá realmente 39% das intenções de votos.

Quais são as informações que a amostragem pode fornecer?

Como você já viu em Estatística, esses intervalos são divididos em dois tipos, de
acordo com a variável estudada. Vale relembrar.

Figura 4.2 − Variável aleatória discreta e intervalo de produção; variável aleatória contínua e intervalo da média

Variável aleatória Intervalo de proporção


discreta (percentual)

Variável aleatória Intervalo da média


contínua

Fonte: Elaboração do autor (2006).

•• Intervalos de proporção: como visto no exemplo anterior, correspondem


aos percentuais das intenções de votos. Exemplos: proporção de famílias,
percentual de pacientes, proporção de cobaias etc.
•• Intervalos da média: são intervalos baseados em medidas. São
sempre calculados pela média destas. Exemplo: escore médio, peso
médio, altura média etc.

Outra informação importante para a definição do erro é o conhecimento do que,


em Estatística, é chamado de nível de confiança.

Nível de confiança
O nível de confiança é a probabilidade de o intervalo conter o parâmetro
estimado, ou seja, pode-se entender que o valor ou percentual da população
que você está tentando estimar tem a probabilidade de estar em um intervalo
que seria o definido pelo erro.

Intervalo de confiança
Intervalo de confiança é aquele que contém o parâmetro estudado com
determinada probabilidade (nível de confiança), ou seja, citando o exemplo da
pesquisa eleitoral, é o intervalo calculado com o erro. Veja os valores no exemplo
citado nesta seção: “... as intenções de voto para o candidato A podem variar de
37% a 41%”. Esse é o intervalo de confiança.

137
Capítulo 4

Curva normal
Você poderia perguntar-se, a partir do que foi apresentado, qual relação pode
estabelecer-se entre o nível de confiança e o intervalo de confiança. Como o nível
de confiança é a probabilidade de a estimativa estar correta e essa probabilidade
determina um intervalo (o intervalo de confiança), é possível usar a curva normal
para identificar a ambos. Veja a figura a seguir

Figura 4.3 − Curva normal

Nível de
confiança
%

Intervalo de confiança
Fonte: Elaborado pelo autor (2006).

Note que o nível de confiança é um percentual definido pelo intervalo de –z a z.


Como a curva é simétrica, metade da área vai de –z a zero, e a outra metade vai
de zero a z, ou seja, ambas são iguais. Isso é muito importante na definição do
valor de z. Para descobri-lo, você deve calcular a metade do nível de confiança e
usar a tabela da distribuição normal padronizada.

Exemplo 1

Nível de confiança: NC = 95%. Encontrar o valor de z na tabela.

Calculando passo a passo.

Passo 1: dividir o NC por dois. Antes disso, não se esqueça de usar o valor do
nível de confiança na forma decimal, ou seja, dividido por 100.

95 0,95
NC = = 0,95 = 0,475
100 2

Passo 2: procurar esse valor na tabela e encontrar o z correspondente. O valor


é referente à área entre zero e z, localizado na região central da tabela. Veja a
tabela a seguir.

138
Probabilidade e Estatística

Tabela 4.1 − Tabela de valores normais

Fonte: Elaboração do autor (2006).

Localizada a área, é só seguir a coluna onde está o valor até a primeira linha,
encontrando o número 0,06. Na horizontal, basta traçar a linha até a primeira
coluna, encontrando o valor correspondente a 1,9. Juntando, ou somando os dois
valores, você encontra o valor 1,96 para z, ou seja, z = 1,96.

Exemplo 2

Nível de Confiança: NC = 90%. Encontrar o valor de z na tabela.

Calculando passo a passo.

Passo 1: dividir o NC por dois. Para tanto, sempre usar o valor do nível de
confiança na forma decimal, ou seja, dividido por 100.

90 0,90
NC = = 0,90 = 0,45
100 2

139
Capítulo 4

Passo 2: procurar esse valor na tabela e encontrar o z correspondente. O valor


é referente à área entre zero e z, localizado na região central da tabela. Veja a
figura a seguir.

Tabela 4.2 − Tabela de valores normais

Fonte: Elaboração do autor (2006).

Encontrando a área, é só seguir a coluna na qual está o valor até a primeira


linha. Note que o valor situa-se entre 0,4495 e 0,4505 e, sendo assim, você deve
usar o valor compreendido entre 0,04 e 0,05 como se fosse um ponto médio, ou
seja, 0,045. Seguindo a linha até a primeira coluna, você encontra o valor 1,6.
Efetuando-se a soma, chega-se ao valor 1,645 para z, ou seja, z = 1,645.

Para calcular o erro, é necessário conhecer ou estabelecer previamente o nível


de confiança. Não existe uma regra específica para a determinação do nível de
confiança. Ele é determinado pelo pesquisador, com base em sua experiência e, em
geral, os mais usados são 90% e 95%, os zês são, respectivamente, 1,645 e 1,96.

Na seção seguinte, você aprenderá a usar o nível de confiança e a saber como se


calcula o erro da estimativa e o intervalo correspondente.

140
Probabilidade e Estatística

Seção 2
Estimativas para a proporção populacional
Antes de começar a calcular o erro da estimativa, conheça algumas notações:

•• p̂ = proporção da mostra (percentual) – probabilidade de sucesso;


•• p = proporção da população – probabilidade de sucesso;
•• q̂ = proporção da mostra (percentual) – probabilidade de fracasso;
•• q = proporção da população – probabilidade de fracasso.

Para diferenciar um percentual da amostra do percentual da população, tanto


de sucesso quanto de fracasso, deve-se usar o acento circunflexo (“chapéu”)
para a amostra.

Veja os exemplos a seguir.

Exemplo 1: em uma determinada população, foi retirada uma amostra antes da


eleição, e verificou-se que 30% dos eleitores votariam no candidato Théo. Após
a realização da eleição, verificou-se que o total de votantes (da população) para
esse candidato foi de 33%. Com base nisso, você deve indicar os percentuais de
sucesso e fracasso tanto para a população quanto para a amostra de votantes e
não votantes em relação ao candidato em questão.

Quadro 4.2 − População e amostra

População Amostra

Percentual de votantes em Théo = 33%; Percentual de votantes em Théo = 30%;


p = 33% (percentual de sucesso da população). p̂ = 30% (percentual de sucesso da amostra).
Percentual de eleitores que não votam em Théo: Percentual de eleitores que não votam em Théo:
calcule o percentual de fracasso sempre na forma calcule o percentual de fracasso sempre na forma
decimal, ou seja, dividindo o percentual por 100. decimal, ou seja, dividindo o percentual por 100.
33 30
p= = 0,33 pˆ = = 0,30
100 100
q = 1 – p = 1 – 0,33 = 0,67 qˆ = 1 − pˆ = 1 − 0,30 = 0,70

Depois, multiplique por 100 para encontrar Depois, multiplique por 100 para encontrar
novamente o percentual: novamente o percentual:
q = 0,67. 100 = 67% qˆ = 0,70.100 = 70%
(percentual de fracasso da população). (percentual de fracasso da amostra).

Fonte: Elaboração do autor (2006).

141
Capítulo 4

Observação: note que a diferença, além dos valores, está em identificar o


percentual da amostra com o acento circunflexo (“chapéu”).

A seguir, veja um exemplo mais elaborado.

Exemplo 2: em uma determinada população, foi retirada uma amostra de 200


votantes antes da eleição e verificou-se que 60 eleitores votariam no candidato Théo.
Após a realização da eleição, verificou-se que o total de votantes (da população) era
de 3000 eleitores e que 990 votaram no referido candidato. Então, você deve indicar
os percentuais de sucesso e fracasso tanto para a população quanto para a amostra
de votantes e não votantes em relação ao candidato mencionado.

Quadro 4.3 − População e amostra

População Amostra

Passo 1: identificar os valores. Passo 1: identificar os valores.

N = 3000 (tamanho da população); n = 200 (tamanho da amostra);


X = 990 (número de votantes no candidato). X = 60 (número de votantes no candidato).

Passo 2: cálculo do percentual de votantes no Passo 2: cálculo do percentual de votantes no


candidato. candidato.

990 60
p= = 0,33 pˆ = = 0,30
3000 200

Percentual de votantes em Théo = 33%; Percentual de votantes em Théo = 30%;


p = 33% (percentual de sucesso da população). pˆ = 30% (percentual de sucesso da amostra).

Percentual de eleitores que não votam em Théo: Percentual de eleitores que não votam em Théo:
calcule o percentual de fracasso sempre na forma calcule o percentual de fracasso sempre na forma
decimal, ou seja, dividindo o percentual por 100. decimal, ou seja, dividindo o percentual por 100.

p = 0,33 pˆ = 0,30
q = 1 – p = 1 – 0,33 = 0,67 qˆ = 1 − pˆ = 1 − 0,30 = 0,70

No final, multiplique por 100 para encontrar No final, multiplique por 100 para encontrar
novamente o percentual: novamente o percentual:

q = 0,67. 100 = 67% qˆ = 0,7.100 = 70%


(percentual de fracasso da população). (percentual de fracasso da amostra).

Fonte: Elaboração do autor (2006).

E para calcular o erro e o intervalo de uma estimativa?

Para fazer uma estimativa, após ter os resultados e calculado os percentuais,


você deve calcular o erro da estimativa e o seu intervalo (intervalo de confiança).
Veja, a seguir, a fórmula para o cálculo do erro.

142
Probabilidade e Estatística

pˆ qˆ
e = Ζ.
n

Em que:

e = erro da estimativa;
z = limite do intervalo definido pelo nível de confiança;
p̂ = proporção da mostra (percentual) – probabilidade de sucesso (ex.: percentual
de votantes em relação a um determinado candidato);
q̂ = proporção da mostra (percentual) – probabilidade de fracasso (ex.:
percentual dos eleitores que não votam em determinado candidato);
n = tamanho da amostra.

O intervalo é calculado subtraindo-se o erro do percentual e, em seguida,


somando-se o erro a esse percentual. Veja, na sequência, a notação usada.

P( pˆ − e < p < pˆ + e) = NC

Em que:

P = probabilidade de o valor estimado estar no intervalo calculado;


p̂ = proporção da mostra (percentual) – probabilidade de sucesso (exemplo:
percentual da amostra de votantes em relação a um determinado candidato);

P = proporção da população (percentual) que se quer estimar – probabilidade


de sucesso (ex.: percentual da população de votantes em relação a um
determinado candidato);

NC = nível de confiança.

Veja os exemplos a seguir.

Exemplo 1: uma pesquisa recente, efetuada com uma amostra de 300 eleitores
de uma pequena cidade, indicou que 35% deles votariam no candidato Arthur.
Faça uma estimativa para a totalidade dos eleitores (população) dessa cidade que
votarão no referido candidato. Use um nível de confiança de 95%.

143
Capítulo 4

Calculando passo a passo.

Passo 1: calcular e procurar o z na tabela. Dividir o NC por dois. Para tanto,


não se esqueça de usar o valor do nível de confiança na forma decimal, ou seja,
dividido por 100.

95 0,95
NC = = 0,95 = 0,475
100 2
Como vimos anteriormente, o z para o nível de confiança de 95% sempre será 1,96.

Passo 2: discriminar cada elemento da fórmula de cálculo do erro e aplicá-la ao


caso em análise.

pˆ qˆ
e = Ζ.
n

Em que:

e = erro da estimativa;
z = 1,96 (para o NC de 95%);
35
p̂ = 35% ou = 0,35 (percentual da amostra de eleitores que votam no candidato);
100
qˆ = 1 − 0,35 = 0,65 (percentual da amostra dos eleitores que não votam no candidato);
n = 300 (tamanho da amostra).

Cálculo do erro

pˆ qˆ 0,35.0,65 0,2275
e = Ζ. = 1,96. = 1,96. =
n 300 300

e = 1,96. 0,000758333 = 1,96.0,02754 = 0,05397 ou 5,40%

Ao final do cálculo, deve-se multiplicar o resultado por 100, para que ele fique em
porcentagem. Os meios de comunicação (TV, rádio, jornais, etc.), ao informarem os
resultados de uma pesquisa citam “... com um erro de 5,40% a mais ou a menos”.

144
Probabilidade e Estatística

Passo 4: calcular o intervalo da estimativa. Neste passo, o cálculo pode ser efetuado
na forma percentual ou decimal. Interpretando os resultados obtidos, tem-se que as
intenções de votos para o candidato referido devem ficar entre 29,60% e 40,40%.
Segundo as notações da Estatística, esse intervalo escreve-se da seguinte forma.

pˆ − e = 0,35 − 0,054 = 0,2960 ou 29,60%.

pˆ − e = 0,35 + 0,054 = 0,4040 ou 40,40%.

Interpretando os resultados obtidos, tem-se que as intenções de votos para o


candidato referido devem ficar entre 29,60% e 40,40%.

Segundo as notações da Estatística, esse intervalo escreve-se da seguinte forma.

P( pˆ − e < p < pˆ + e ) = 0,95


P(0,35 − 0,054 < p < 0,35 + 0,54 ) = 0,95

P(0,2960 < p < 0,4040) = 0,95 ou P(29,60% < p < 40,40%) = 95%.

Que leitura você pode fazer desses resultados?

O intervalo da estimativa para a totalidade dos eleitores que votariam no


candidato mencionado está compreendido entre 29,60% e 40,40%, com base
em um nível de confiança de 95%.

Veja os exemplos a seguir.

Exemplo 2: um levantamento de alunos aprovados e reprovados feito com


base no sistema municipal de educação de um município, referente ao Ensino
Fundamental, usando uma amostra de 2500 alunos, indicou que 1500 alunos
dentre eles haviam sido reprovados. Com um nível de confiança de 90%, faça
uma estimativa para a população de alunos que foram reprovados no Ensino
Fundamental do sistema municipal de educação.

145
Capítulo 4

Calculando passo a passo

Passo 1: como não foi indicado o percentual de alunos da amostra que foram
reprovados, você deve, em primeiro lugar, calcular esse percentual.

n = 2500 (tamanho da amostra);


X = 1500 (número de alunos reprovados).

Cálculo do percentual

1500
pˆ = = 0,60
2500
pˆ = 1 − 0,60 = 0,40

Você pode manter o resultado na forma decimal, pois o cálculo do erro também
é feito assim.

Z para 90% é sempre 1,645.

Passo 3: discriminar cada elemento da fórmula de cálculo do erro e aplicá-la ao


caso em exame.

pˆ qˆ
e = Ζ.
n

Em que:

e = o que se quer calcular (erro da estimativa);

z = 1,645;
60
p̂ = 60% ou = 0,60 (percentual da amostra de alunos reprovados);
100

qˆ = 1 − 0,60 = 0,40 (percentual da amostra de alunos que não foram reprovados);


n = 2500 (tamanho da amostra).

146
Probabilidade e Estatística

Cálculo do erro

pˆ qˆ 0,60.0,40 0,24
e = Ζ. = 1,645. = 1,645. = 1,645. 0,000096
n 2500 2500

e = 1,645 × 0,009797959 = 0,01612 ou 1,16%.


Ao final, não se esqueça de multiplicar o resultado por 100 para transformá-lo
novamente em porcentagem.

Passo 4: calcular o intervalo da estimativa.

Neste passo, o cálculo pode ser feito na forma percentual ou decimal.

pˆ − e = 0,60 − 0,016 = 0,5840 ou 58,40 %;

pˆ − e = 0,60 + 0,016 = 0,6160 ou 61,60 %.

Interpretando os resultados obtidos, tem-se que de 58,40% a 61,60% da totalidade


dos alunos cursando o Ensino Fundamental na rede municipal foram reprovados.

Segundo as notações de Estatística, escreve-se esse intervalo da seguinte forma.

P( pˆ − e < p < pˆ + e ) = 0,90


P(0,60 − 0,016 < p < 0,60 + 0,016) = 0,90

P(0,5840 < p < 0,6160) = 0,90 ou P(58,40% < p < 61,60%) = 90%.

Que leitura você pode fazer?

O intervalo da estimativa para a totalidade dos alunos cursando o Ensino


Fundamental na rede municipal que foram reprovados está compreendido entre
58,40% e 61,60%, com base em um nível de confiança de 90%.

Você aprendeu como calcular o erro referente à estimativa do percentual de uma


população. Na sequência, você verá como calcular o erro de uma estimativa para
a média de uma população.

147
Capítulo 4

Seção 3
Estimativas para média populacional
Ao realizar uma pesquisa por amostragem, além de calcular percentuais, você
pode obter algumas médias como, por exemplo, a média das alturas, das idades,
dos pesos etc. O processo é semelhante, ou seja, calcula-se o erro e o intervalo.
O que muda é a forma de cálculo do erro. Isso vale para as séries de dados
amostrais que podem ser aproximados por uma distribuição normal.

Para calcular o erro de uma estimativa da média populacional, você vai precisar
da média de uma amostra e do desvio padrão. Este pode ser obtido com base na
própria população, se for possível, ou na amostra. O desvio padrão da amostra
pode ser usado como uma aproximação.

Veja, a seguir, a fórmula para o cálculo do erro.

S ( x)
e = Ζ.
n

Em que:

e = erro da estimativa;
z = limite do intervalo definido pelo nível de confiança;
S(x) = desvio padrão da amostra (ou da população, se possível);
n = tamanho da amostra.

O intervalo é calculado subtraindo-se o erro da média da amostra e somando-se


o erro à referida média. Veja, na sequência, a notação usada.

P ( x − e < μ < x + e) = NC

Em que:

P = probabilidade de o valor estimado estar no intervalo calculado;


x = média da amostra;
μ = média da população (o que você vai estimar);
NC = nível de confiança.

148
Probabilidade e Estatística

Veja os exemplos a seguir.

Exemplo 1: em sondagem realizada com base nos alunos do curso de Matemática


das quintas séries de uma determinada escola, o resultado geral apresentou uma
média de 6,7, com um desvio padrão de 1,2. Com esse tipo de informação, pode-se
realizar uma série de análises. A partir desses dados, calcule uma estimativa (erro
e intervalo), considerando essa série com uma distribuição normal para a média
populacional a um nível de confiança de 95%, e que a amostra foi de 35 alunos.

Calculando passo a passo.

Passo 1: identificar o z com NC de 95% ou seja, z =1,96.

Passo 2: discriminar cada elemento da fórmula de cálculo do erro e aplicá-la ao


caso em questão.

S ( x)
e = Ζ.
n

Em que:
e = o que se quer calcular (erro da estimativa);
z = 1,96;
S(x) = 1,2 (desvio padrão da amostra);
n = 35 (tamanho da amostra).

Cálculo do erro
S ( x) 1,2 1,2
e = Ζ. = 1,96. = 1,96. = 1,96.0,20284 = 0,3976 ou 0,40.
n 35 5,91607978

Não é necessário multiplicar por 100, pois esse resultado não indica um
percentual, mas, sim, pontos (a nota).

Passo 4: calcular o intervalo da estimativa.

Neste passo, como na estimativa para o percentual, você deve subtrair e somar o
erro à média.
x − e = 6,70 − 0,40 = 6,30
x + e = 6,70 + 0,40 = 7,10

149
Capítulo 4

Interpretando os resultados obtidos, tem-se que a média das notas da totalidade


dos alunos está compreendida entre 6,30 e 7,10 pontos, aproximadamente.

Segundo as notações de Estatística, escreve-se esse intervalo da seguinte forma.

P( x − e < μ < x + e) = 0,95

P(6,70 − 0,40 < μ < 6,70 + 0,40) = 0,95

P(6,30 < μ < 7,10) = 0,95

Que leitura você pode fazer?

O intervalo da estimativa para a média das notas da totalidade dos alunos está
compreendido entre 6,30 e 7,10 pontos, aproximadamente, com um nível de
confiança de 95%.

Exemplo 2: em uma pesquisa realizada com diversas turmas de uma escola,


os alunos levaram 39 minutos, em média, para terminar uma avaliação de
Matemática. O tamanho da amostra era de 100 estudantes. O desvio padrão
dessa amostra foi de 18 minutos. Com base em um nível de confiança de 90%,
qual seria a estimativa para a média populacional da escola e a sua interpretação?

Calculando passo a passo

Passo 1: identificar o z com NC de 90%, ou seja, z = 1,645.

Passo 2: discriminar cada elemento da fórmula de cálculo do erro e aplicá-la ao


caso em questão.

S ( x)
e = Ζ.
n

Em que:
e = o que se quer calcular (erro da estimativa);
z =1,645;
S(x) = 18 (desvio padrão da amostra);
n = 100 (tamanho da amostra).

150
Probabilidade e Estatística

Cálculo do erro

S ( x) 18 18
e = Ζ. = 1,645. = 1,645. = 1,645.1,8 = 2,961 ou 2,96.
n 100 10

Não é necessário multiplicar por 100, pois esse resultado não indica um
percentual, mas, sim, minutos.

Passo 3: calcular o intervalo da estimativa. Neste passo, como na estimativa para


o percentual, você deve subtrair e somar o erro à média.

x − e = 39 − 2,96 = 36,04

x + e = 39 + 2,96 = 41,96

Interpretando os resultados obtidos, tem-se que o tempo médio para a realização


da avaliação está compreendido entre 36,04 e 41,96 minutos, aproximadamente.

Segundo as notações de Estatística, escreve-se esse intervalo da seguinte forma.

P( x − e < μ < x + e) = 0,90


P(39 − 2,96 < μ < 39 + 2,96) = 0,90
P(36,04 < μ < 41,96) = 0,90

Que leitura você pode fazer?

O intervalo da estimativa para a média do tempo de execução da avaliação está


compreendido entre 36,04 e 41,96 minutos, com um nível de confiança de 90%.

151
Capítulo 4

Seção 4
Análise de variância − ANOVA

Como comparar as características de várias amostras


Logo após calcular a estimativa de uma média populacional, podemos ter outro
desafio: definir se as médias de várias populações são mesmo semelhantes ou
existem diferenças que superam os próprios problemas do processo de amostragem.

Isso porque, muitas vezes, amostras de diferentes populações são selecionadas


com a finalidade de se avaliarem possíveis diferenças entre as distribuições
populacionais de alguma característica de interesse.

Podemos citar alguns exemplos dessas situações.

Exemplos

•• Seleção de lotes de parafusos fabricados em diferentes empresas


com diferentes equipamentos, para avaliar se a distribuição
(populacional) do valor médio do diâmetro da cabeça dos parafusos
produzidos varia com a marca do equipamento usado na fabricação.
•• Para curar certa doença, existem quatro tratamentos possíveis: A, B, C e
D. Pretende-se saber se existem diferenças significativas nos tratamentos,
no que diz respeito ao tempo necessário para eliminar a doença.
•• Análise de amostras de água de diversos pontos da cidade para verificar
se existe variação na distribuição de alguma característica (nível de
ácidos, por exemplo) associada à qualidade da água entre bairros.

Em muitos casos, uma análise descritiva dos dados indica que modelos
gaussianos ou normais são compatíveis com suas distribuições. Em outras
palavras, sob o ponto de vista estatístico, podemos considerar as k amostras
disponíveis como provenientes de populações normais com médias µ1, µ2, ..., µk.

Se não existirem razões contrárias, podemos também supor que as amostras são
independentes. Adicionalmente, a análise descritiva muitas vezes sugere que as k
populações têm a mesma variância σ2 (desconhecida).

O problema proposto pode, então, ser encarado como um teste da hipótese de


que as médias são iguais: H: µ1 = µ2 = ... = µk. E, nessas situações, a técnica
para resolver problemas desse tipo (e muitos outros semelhantes) é chamada de
análise de variância de um fator.

152
Probabilidade e Estatística

Considerando que existem k populações de interesse, nas quais se estuda uma


característica comum X1, X2, ..., Xk, são as variáveis aleatórias que representam
tais característica nas populações 1, 2, ..., k, respectivamente. Assim, a hipótese
a testar é: µ1 = µ2 = ... = µk.

Nesse problema, as k populações podem ser vistas como k níveis de um mesmo


fator. E, assim, a questão é saber se o fator exerce alguma influência na variação
da característica em estudo (a média, neste caso).

Caso o problema apresente somente um fator, estaremos trabalhando com


análise de variância de um fator, conhecido como ANOVA de um único fator.
Claro que também existe ANOVA de múltiplos fatores, mas esse tema não será
abordado neste estudo.

Analisando o problema com um exemplo.

Exemplo: o Sr. Fernando Fernandes é dono de uma Indústria Metal-Mecânica


e pretende comprar três fábricas de parafusos para suprimentos da sua própria
indústria. Para isso, precisa analisar o volume de fabricação das fábricas a
comprar, já que ele precisa que as três tenham produções semelhantes de
parafusos para prover regularmente à sua indústria.

Para isso, o Sr. Fernando Fernandes seleciona aleatoriamente cinco semanas do


semestre, nas quais observa o volume de fabricação semanal de cada fábrica (ou
seja, as três amostras são independentes).

Os dados amostrais estão registrados na seguinte tabela.

Tabela 4.3 − Dados amostrais

Semanas Fábrica 1 Fábrica 2 Fábrica 3


Semana 1 47 55 54
Semana 2 53 54 50
Semana 3 49 58 51
Semana 4 50 61 51
Semana 5 46 52 49

xi (médias amostrais) x1 = 49 x2 = 56 x3 = 51 x = 52

Fonte: Elaboração do autor (2011).

Representamos por Xi o volume de fabricação semanal na Fábrica i (i = 1, 2, 3) e,


por µi o valor médio de Xi.

153
Capítulo 4

A média da fábrica 1 é dada pela soma das semanas e dividida por 5, ou seja,
145/5= 49. Para a fábrica 2,280/5 = 56 e para a fábrica 255/5 = 51, note que a
média das médias das três fábricas é a soma das média (última linha da tabela)
dividida por 3.

Neste exemplo, existe apenas um fator de interesse, o fator “fábrica”, que


apresenta três níveis ou grupos: fábrica 1, fábrica 2 e fábrica 3. Assim, cada nível
do fator define uma população de média µi.

Assim, o que o Sr. Fernando Fernandes pretende saber é se as médias dos três níveis,
ou populações, são iguais, isto é, pretende-se saber se a hipótese é certa ou não.

H: µ1 = µ2 = µ3

(Hipótese de igualdade na fabricação média das três fábricas).

Então, a questão a responder é: serão as médias amostrais x1 = 49, x2 = 56,


x3 = 51, diferentes porque há diferenças entre as médias populacionais: µ1 =
µ2 = µ3? Ou serão essas diferenças atribuídas a flutuações amostrais?

Podemos, então, formular as seguintes hipóteses.

H: µ1 = µ2 = µ3

Ou, em outras palavras, a hipótese está afirmando que não há diferença entre o
volume médio de fabricação das três fábricas.

Lembre-se: como toda hipótese, as pesquisas (testes em nosso caso) poderão


confirmá-la ou negá-la!

Pressupostos para resolver a questão


A aplicação da análise de variância pressupõe a verificação das seguintes condições:

•• as amostras devem ser aleatórias e independentes;


•• as amostras devem ser extraídas de populações normais;
•• as populações devem ter variâncias iguais.

Assim, temos duas situações possíveis demonstradas a seguir.

•• A hipótese H é verdadeira
As diferenças observadas entre as médias amostrais são devidas a flutuações
amostrais. Ou seja, nesse caso, teremos que µ1 = µ2 = µ3: todas as amostras
provêm de populações com médias iguais.

154
Probabilidade e Estatística

Como se supôs que todas as populações são normais e têm variâncias iguais,
isto é, o mesmo que extrair todas as amostras de uma única população (de
uma única fábrica).

Gráfico 4.2 − Distribuição populacional quando µ1 = µ2 = µ3 = µ

Fonte: Elaboração do autor (2011).

•• A hipótese H é falsa
As diferenças observadas entre as médias amostrais são demasiado grandes para
serem devidas unicamente a flutuações amostrais.

Aqui, as médias das populações não são iguais, ou seja, pelo menos duas
fábricas têm volumes de produção média diferentes. As amostras recolhidas
provêm de populações diferentes.

Gráfico 4.3 − Distribuição populacional quando µ1 ≠ µ2 ≠ µ3

µ3 µ1 µ2
Fonte: Elaboração do autor (2011).

Teste ANOVA
Para testar a hipótese, devemos trabalhar com o valor da Estatística de teste F
(Anexo 2), que é outro valor que surge de outra distribuição de probabilidade, que
a semelhança da distribuição normal tem uma tabela para calcular seu valor, no
qual devemos entrar com os graus de liberdades (número de dados da amostra
diminuído um) para obter o valor correspondendo a certo nível de confiança, por
exemplo, NC = 95%, que equivale a um nível de significância de 5% ou α = 5%.

155
Capítulo 4

Então, a Estatística de teste mede a razão entre a variação entre grupos e a


variação dentro dos grupos.

A hipótese H é, pois, rejeitada para valores grandes da Estatística F.

A tabela ANOVA tem a seguinte estrutura.

Tabela 4.4 − Tabela ANOVA

Fonte: Elaboração do autor (2011).

Por exemplo, para n = 3 (três grupos) e m = 5 (cinco amostras por grupo), resultam em:

•• GLn = 3 – 1 = 2 (graus de liberdade do numerador, 2 = K);


•• GLm = 15 – 3 = 12 (graus de liberdade do denominador, 15 = 3 x 5 = N).

Ao final da seção, você pode achar a tabela completa para determinar o PC


(ponto crítico) ou estatística F, para um nível de confiança de 95%.

Assim, na tabela, procura-se na primeira coluna (GL do denominador) a linha do 12


e, na primeira fila, a linha do 2 (GL do numerador), resulta em um valor do estatístico
F: F = 3,89. Este valor definido pela tabela é conhecido como Ponto Crítico ou PC.

Devemos aclarar que existem diversas tabelas de F, cada uma delas calculada
para um grau de significância diferente, a tabela de nosso trabalho é a tabela para
um grau de significância de 5%.

156
Probabilidade e Estatística

Agora, temos que calcular o valor de F para nosso experimento, e, se o valor do F


calculado for maior do que o valor de F tabelado (PC), a hipótese deverá ser rejeitada.

Dessa forma, para calcular nosso valor de F amostral, devemos utilizar uma
tabela de layout para organizar nossos cálculos.

A tabela, chamada de Tabela ANOVA, tem a seguinte estrutura tradicional.

Tabela 4.5 − Tabela ANOVA

Fonte: Elaboração do autor (2011).

Nessa tabela, temos:

SST = é a soma de quadrados total e mede a variação total nos dados;

SSA = é a soma de quadrados entre os níveis (grupos) do fator e mede a variação


entre grupos (populações), é designada por variação explicada, pois ela é
explicada pelo fato de as amostras poderem provir de populações diferentes;

SSE = é a soma de quadrados dentro dos níveis (grupos) do fator e mede a


variação dentro dos grupos (populações), é, por vezes, designada por variação
residual, pois é atribuída a flutuações dentro da mesma população, portanto não
pode ser explicada pelas possíveis diferenças entre os grupos (populações).

Também temos que:

MSA = é a soma média de quadrados entre grupos;

MSE = é a soma média de quadrados dentro dos grupos ou residual.

Pode-se provar que

SST = SSA + SSE;

157
Capítulo 4

e, também, que

(K − 1) + (N – K) = N – 1.

Isso permite verificar os cálculos da tabela ANOVA.

Assim, sob o pressuposto da hipótese ser verdadeira, tem-se:

A hipótese deve ser rejeitada se o valor observado de F situar-se à direita do ponto


crítico; isto é, rejeita-se H se Fobs ≥ pc, em que o ponto crítico PC é dado por

Então, para nosso exemplo da compra das fábricas por parte do Sr. Fernando
Fernandes, vamos ver o que podemos concluir ao nível de significância de 0.05,
ou seja, a um nível de confiança NC = 95%.

Cálculo de SSE

Calculamos cada desvio de X menos a média de cada grupo, ou seja, de cada


fábrica, e somamos, agora vamos somar as somas finais.

SSE=30+50+14=94

Cálculo de SSA

O SSa é a diferença entre a média de cada fábrica menos a média das médias
elevada ao quadrado e multiplicada pelo n, no caso 5 de cinco semanas.

158
Probabilidade e Estatística

Assim, a tabela ANOVA resulta, numericamente, para o exemplo, nos seguintes valores.

Tabela 4.6 − Tabela ANOVA

Fonte: Elaboração do autor (2011).

E, se a hipótese H é verdadeira, resultará em

Então, o F calculado para o nosso exemplo é 65/7,83, que resulta em 8,30. Note
que é um F 2/12, ou seja, vamos procurar na Tabela F, coluna2 e linha 12.

Da tabela F, a gente já identificou o valor F para os graus de liberdade 2 e 12, e


95% de confiança.

E, segundo a tabela ANOVA, o valor observado da estatística F é

E, como resultando que 8,3 > 3,89, então a hipótese (H: µ1 = µ2 = µ3) é rejeitada
ao nível de significância de 0,05, ou nível de confiança de 95%; isto é, existem
diferenças significativas entre as médias amostrais das vendas, e há, portanto,
evidência de que existem pelo menos duas lojas com volumes médios de
produção diferentes entre elas.

Em outras palavras, o fator fábrica exerce uma influência significativa sobre o volume
médio da produção de parafusos: tem, ao menos, uma fábrica que está produzindo
bem menos ou bem mais do que as outras, desequilibrando o suprimento constante
de parafusos de que a indústria de Fernando Fernandes precisa.

159
Capítulo 4

Atividades de Autoavaliação
1. Estão listadas, a seguir, uma série de estudos e a margem de erro que o
pesquisador irá adotar como tolerável, bem como o tamanho da população-alvo
desse estudo. Calcule o tamanho da amostra necessária para realizar as pesquisas,
considerando que o pesquisador não tem acesso ao tamanho da população e que
o pesquisador tem acesso ao tamanho da população (calcular para os dois casos).

Tabela 1 − Tipos de estudos, margem de erro e tamanho da população e da amostra

Erro Tamanho da Tamanho da


Tema do estudo tolerável população amostra
a) Estudo socioeconômico com
0,03 5600
estudantes da Unisul
b) Estudo com famílias do bairro Rio
0,04 9400
Vermelho, em Florianópolis
c) Estudo da fecundidade na cidade de
0,06 125.000
Florianópolis
d) Estudo com adolescentes de uma
0,09 250
escola usuários de drogas
e) Estudo de Índice de massa corporal
0,05 4.000
dos estudantes da Unisul
f) Pesquisa de intenções de voto no
0,02 80.000.000
Brasil

Fonte: Elaboração do autor (2006).

2. Leia a notícia da IstoÉ on-line (2004).

Florianópolis / SC – Caça ao tucano

Sem contar com o apoio do governador, da prefeita Ângela Amin (PP) e de caciques
da política catarinense, Dário Berger, candidato da coligação PSDB-PMN, é a
grande surpresa até o momento nas eleições em Florianópolis. Concorrendo pela
primeira vez a um cargo público de expressão, Berger vem liderando com folga a
corrida eleitoral em Floripa. Pela pesquisa ISTOÉ/Databrain – feita entre os dias 26 e
27 de julho, com 700 entrevistados, margem de erro de 2,74 pontos porcentuais e
coeficiente de confiança de 90% – Berger apresenta tranquilos 26,4% das intenções
de voto. O levantamento foi registrado no TRE-SC com o número 559/2004. (Dados
adaptados de ISTOÉ ON-LINE, 2004).

160
Probabilidade e Estatística

Com os dados da matéria, mostre os cálculos que foram feitos para se chegar ao
erro de 2,74 pontos percentuais, e encontre o intervalo da estimativa.

3. Uma amostragem com 250 alunos foi feita em escolas, e, entre outras
perguntas, questionou-se sobre o peso dos alunos da quinta-série. O peso
médio dos alunos entrevistados foi de 29,3 Kg, e apresentou um desvio padrão
de 3,4 Kg. Usando um nível de confiança de 95%, calcule uma estimativa para a
totalidade (população) de alunos da quinta-série.

4. O diretor de marketing de uma indústria pretende comprar uma nova


máquina para fabricar parafusos. Você foi designado para estudar três marcas
semelhantes, cada uma delas combina, de modo diferente, fatores como o preço
do produto, volume de fabricação, condições de consumo de energia etc.

Qualquer um dos equipamentos pode ser utilizado na sua indústria, não


havendo qualquer tipo de influência no rendimento pela presença dos outros
equipamentos da indústria.

Para saber se há diferença entre o volume de produção das três máquinas


visando à sua eficácia, cada uma delas é testada, aleatoriamente, funcionando
em algumas das lojas dos fabricantes durante um período de duração limitada.
Note que as lojas de venda são selecionadas de modo que as três amostras
sejam aleatórias e independentes entre si.

A quantidade de peças produzidas durante esse período consta na tabela a seguir.

Máquina 1 Máquina 2 Máquina 3

8 10 7

6 8 5

5 12 8

6 7 6

7 9 7

10 5

11

Soma 32 67 38

Seja Xi a variável aleatória que representa o volume de produção de cada


máquina i (i = 1,2,3), também admitamos que X1, X2 e X3 têm distribuição normal
com iguais variâncias e fixemos o nível de confiança do teste em 95%, ou seja,
trabalharemos com um nível de significância de 5%.

161
Capítulo 4

A hipótese a testar é: H: µ1 = µ2 = µ3, ou seja: aceita-se que não há diferença entre


os níveis de produção relativamente ao volume médio de peças que podem fabricar.

Assim, para resolver o problema, calcule o ponto crítico pelo médio do estatístico
F da tabela da distribuição para um nível de significância de 5%. Verifique se
aceita ou rejeita a hipótese de trabalho e crie a tabela ANOVA.

162
Capítulo 5

Regressão Linear simples

Seção 1
Correlação linear simples
Os métodos que você estudou até o momento são eficazes para analisar e interpretar
somente uma variável de cada vez. Se eles servem para a análise de uma variável,
como analisar e comparar duas variáveis simultaneamente? Para compreender como
solucionar tal situação, você irá conhecer a correlação linear simples.

A correlação é uma ferramenta destinada ao estudo da relação entre duas


variáveis quantitativas, além de fornecer a intensidade dessa relação.

Para você estudar como usar a correlação linear simples, é importante que você
conheça o que é diagrama de dispersão e o coeficiente de correlação linear de
Pearson. Conheça melhor esses assuntos a seguir.

Diagrama de dispersão
O diagrama de dispersão ajuda a definir a correlação entre duas variáveis
quantitativas de modo gráfico. Em outras palavras, a relação entre duas variáveis,
X e Y, pode ser vista em um diagrama, no qual são marcados os pontos
correspondentes aos pares ordenados gerados pela relação X→Y, e (x,y) são
esses pares ordenados. Dessa forma, constrói-se um diagrama de dispersão.

Quanto mais esses pontos estão próximos à reta imaginária gerada pela nuvem
de pontos, mais forte será a correlação. Observe o gráfico a seguir e acompanhe
os exemplos apresentados.

No gráfico abaixo, os pares ordenados são gerados pela relação entre a altura
das pessoas em centímetros e o peso em quilos.

163
Capítulo 5

Gráfico 5.1 − Diagrama de dispersão

Fonte: Elaboração do autor (2006).

Coeficiente de correlação linear de Pearson


O coeficiente de correlação permite que você analise a força ou a existência da
correlação entre duas variáveis. Considerando que n é o número de observações
(tamanho da amostra), o coeficiente será dado pela seguinte fórmula.

n. ∑ x. y − [(∑ x )(
. ∑ y )]
rxy =
[n ∑ x 2 2
][ 2
− (∑ x ) . n ∑ y 2 − (∑ y ) ]

Em que:

r = resultado do coeficiente de correlação linear de Pearson;


n = número de observações;
x = valores assumidos pela variável X;
y = valores assumidos pela variável Y.

O coeficiente de Pearson pode variar de −1 a +1 → [−1,+1].

Quanto ao resultado de r, você deve considerar cinco situações, descritas no


quadro a seguir.

164
Probabilidade e Estatística

Quadro 5.1 − Resultados possíveis do valor de x

Valor de r Correlação entre as variáveis


r próximo de 0 Correlação linear pouco significativa.
r=0 Não há correlação linear entre as variáveis.
r próximo de –1 Há correlação linear negativa (significativa).
r = –1 Há correlação linear negativa perfeita.
r próximo de +1 Há correlação linear positiva (significativa).
r = +1 Há correlação linear positiva perfeita.

Fonte: Elaboração do autor (2006).

Tipos de correlações
Segundo os resultados de r, as correlações podem assumir diferentes tipos, os
quais você pode acompanhar detalhadamente a seguir.

a) Correlação linear positiva


Neste caso, o coeficiente de Pearson estará entre 0 e 1 → intervalo (0,1). É
próximo de 1, é forte, porém não é igual a 1, perto de 1, estamos falando em algo
acima de 0,8. Note que os pontos estão perto da reta de regressão, porém não
estão exatamente em cima da reta.

Gráfico 5.2 − Correlação linear positiva: altura e peso

Fonte: Elaborado pelo autor (2006).

Interpretação: se o x cresce o y cresce também, no exemplo, se a altura cresce,


o peso cresce; se o x decresce o y decresce também.

165
Capítulo 5

b) Correlação linear perfeita positiva


Neste caso, o coeficiente de Pearson r será igual a +1, neste caso, os pontos
estão perfeitamente alinhados em cima da reta.

Gráfico 5.3 − Correlação linear perfeita positiva: altura e peso

Fonte: Elaborado pelo autor (2006).

A interpretação é a mesma, ou seja, se o x cresce, o y cresce também. No


exemplo, se altura cresce, o peso cresce e, se o x decresce, o y decresce
também. Dizemos que eles apresentam a mesa tendência.

c) Correlação linear negativa


Neste caso, o coeficiente de Pearson estará entre 0 e −1, no caso próximo de −1:
intervalo [−1,0].

Gráfico 5.4 − Correlação linear perfeita negativa: idade e nota

Fonte: Elaborado pelo autor (2006).

Interpretação: o x cresce e o y decresce, no exemplo, se a idade cresce, a nota


decresce; e, se o x decresce, o y cresce, no exemplo, se a idade decresce, a nota
cresce. São inversamente proporcionais.

166
Probabilidade e Estatística

d) Correlação linear perfeita negativa


Neste caso, o coeficiente de Pearson r será −1: os pontos estão perfeitamente
alinhados sobre a reta de regressão.

Gráfico 5.5 − Correlação linear perfeita negativa: idade e nota

7 8 9 10 11 12 13 14 15 16

Fonte: Elaborado pelo autor (2006).

A interpretação é a mesma, ou seja, se o x cresce, o y decresce, no exemplo, se


a idade cresce, a nota decresce; e, se o x decresce, o y cresce.

e) Correlação linear nula ou ausência de correlação


A seguir, veja um exemplo de quando não há correlação entre as variáveis X e Y,
neste caso, o coeficiente de Pearson é igual a zero, r = 0. Note que não há uma
tendência nos pontos de dispersão, diferentemente dos exemplos anteriores.

Gráfico 5.6 − correlação linear nula ou ausência de correlação: altura e nota

Fonte: Elaborado pelo autor (2006).

167
Capítulo 5

Como calcular o coeficiente de correlação?


Para obter esta resposta, acompanhe com atenção o exemplo.

Exemplo: calcule o coeficiente de correlação de Pearson e construa o diagrama de


dispersão para uma turma de alunos, correlacionando altura e peso, descritos a seguir.

Tabela 6.1 – Altura e peso dos alunos de uma série

Fonte: Elaboração do autor (2006).

Calculando passo a passo.

Passo 1: acrescente, na tabela, mais três colunas para auxiliar nos cálculos.
Some os elementos da coluna x (altura) e escreva o total na última linha,
obtendo, assim, a Some os elementos da coluna y (peso) e escreva o total
na última linha, obtendo, assim, a (veja tabela).

Passo 2: calcule os elementos da terceira coluna (x.y), multiplicando cada um dos


elementos da coluna x por cada um dos elementos da coluna y.

(160).(61) = 9760
(155).(56) = 8680
(152).(55) = 8360
......
(177).(77) = 13629

Em seguida, some todos eles e escreva o total na última linha, obtendo, assim, a

168
Probabilidade e Estatística

Passo 3: calcule os elementos da quarta coluna (x2), elevando ao quadrado, cada


um dos elementos da coluna x.

(160)2 = 25600
(155)2 = 24025
(152)2 = 23104
....
(177)2=31329

Em seguida, some todos eles e escreva o total na última linha, para obter, assim, a

Passo 4: calcule os elementos da quinta coluna (y2), elevando, ao quadrado, cada


um dos elementos da coluna y.

(61)2 = 3721
(56)2 = 3136
(55)2 = 3025
....
(77)2 = 5929

Em seguida, some todos eles e escreva o total na última linha, para obter, assim, o

Passo 5: calcule o coeficiente de correlação utilizando a fórmula vista anteriormente.

n = número de observações (10 alunos) → n = 10.

Os elementos, a seguir, foram calculados nos passos anteriores:

Observação: é importante lembrar que:

1. ≠

Note que no primeiro caso, você multiplica os elementos x e y, depois soma


a multiplicação no fim, e, no segundo caso, você soma x e y primeiro, depois
multiplica a soma final.

169
Capítulo 5

2. ≠
Neste caso, a diferença consiste no elevar ao quadrado, no primeiro caso, você
eleva ao quadrado cada variável x, depois soma. No segundo caso, você soma
primeiro o x e depois eleva a soma ao quadrado.

Se você escrever na fórmula, terá:

Passo 6: agora, construa o diagrama de dispersão. Para construí-lo; você deve


marcar os pontos de cada par ordenado, usando, para isso, os valores da coluna
das alturas, como x, e da coluna dos pesos, como y, formando (x, y). Veja o
gráfico a seguir.

Gráfico 5.7 − Altura e peso

Fonte: Elaborado pelo autor (2006).

170
Probabilidade e Estatística

Interpretação do resultado final do coeficiente de correlação: o coeficiente de


correlação resultou em um número positivo e próximo de 1 (r = 0,98), sendo
assim, a correlação entre a altura dos alunos e o peso é positiva (significativa), ou
seja, quanto maior a altura do aluno, maior será seu peso, e, quanto menor for a
sua altura, menor será o seu peso.

Seção 2
Análise de regressão linear
Para fazer a análise da regressão, nos casos em que é possível estabelecer uma
correlação entre duas variáveis, você terá que usar essa relação para prever
valores para uma delas (sempre a variável que for adotada como Y), mas isso só
será possível quando for conhecido o valor da outra variável, no caso, a variável
X. E essa previsão só tem significado caso a força da correlação seja significativa
ou perfeita (quando r está próximo ou igual a +1 ou −1). Essa força dá-se pela
proximidade dos pontos do diagrama de dispersão à reta de regressão.

A reta de regressão é obtida pela aproximação dos pontos do diagrama.

Para encontrar uma equação que auxilie a prever os valores de Y, usa-se o


Método dos Mínimos Quadrados, o qual você conhecerá a seguir.

A escolha da variável que será o Y está relacionada à variável que o pesquisador


deseja estimar. No exemplo anterior, se a intenção é a de estimar o peso dos
alunos, então o Y deve ser a variável peso. Caso a necessidade fosse a de
estimar a altura dos alunos, a variável Y passaria a ser a altura.

Método dos mínimos quadrados


Pode-se representar a reta imaginária pela equação exposta na sequência.

Reta de regressão:

Sendo:

171
Capítulo 5

Em que:

= valor predito de y (a ser estimado);


x = valor da variável x para determinado elemento da amostra;
y = valor da variável y para determinado elemento da amostra;
n = nº total de observações (tamanho da amostra);
b = a intersecção do eixo y (ou coeficiente linear da reta);
a = coeficiente de inclinação da reta (ou coeficiente angular da reta).

Ao predizer um valor de Y com base em determinado valor de X, quanto mais


significativa a correlação linear, mais precisa torna-se a previsão.

Interpolação: estimativas com valores entre os da série.

Extrapolação: estimativas com valores fora dos da série.

Resíduo: é a diferença entre um valor amostral, observado Y, e o valor predito,


com base na equação de regressão.

A tabela, a seguir, descreve as alturas e os pesos dos alunos de uma turma.


Você deverá:

a. construir a equação de uma reta de regressão para prever o peso


dos alunos;
b. prever o peso ( ) de um aluno com 175 cm (x) de altura.

Tabela 5.2 – Altura e peso dos alunos de uma série

Fonte: Elaborado pelo autor (2006).

172
Probabilidade e Estatística

Calculando passo a passo.

•• Para o item a:
Considerando que a tabela é a mesma do exemplo da Seção 1 (cálculo do coeficiente
de correlação), não será necessário calcular as colunas nem os totais (veja a tabela).

Equação da reta de regressão →

Passo 1: sendo assim, você pode começar calculando a inclinação da reta (a).

Inclinação da reta (a):

Agora, identifique os elementos da fórmula:


n = 10.

Os elementos, a seguir, foram calculados nos passos anteriores;

;
;
;
.

Se você escrever na fórmula, terá:

173
Capítulo 5

Passo 2: calcule a intersecção com o eixo y, item (b).

Intersecção do eixo y (b):

Agora, identifique os elementos da fórmula:


n = 10.

Os elementos, a seguir, foram calculados nos passos anteriores.

;
;
.

Passo 3: construa a equação da reta de regressão.

Após calcular a e b, tem-se:

a = 0,72;

b = − 53,76;

•• Para o item b:
Fazer a previsão para um aluno que mede 175 cm. Você deve usar 175 como X = 175.
Substituir o valor de X na equação de regressão.

Como interpretar? A previsão para o peso deste aluno que mede 175 cm é de 72,24 Kg.

174
Probabilidade e Estatística

Atividades de autoavaliação
Ao final de cada unidade, você realizará atividades de autoavaliação. O gabarito
está disponível no final do livro didático, mas se esforce para resolver as
atividades sem a ajuda do gabarito, pois, assim, você estará promovendo (e
estimulando) a sua aprendizagem.

1. Uma turma da oitava série realizou avaliações em duas disciplinas,


Matemática e Biologia; as notas obtidas estão na tabela abaixo. Usando estes
dados, calcule o que se pede.

Aluno Nota Matemática Nota Biologia X.Y X2 Y2

1 9,5 3,4 32,3 90,3 11,6


2 9,0 5,4 48,6 81,0 29,2
3 8,5 6,0 51,0 72,3 36,0
4 8,0 6,0 48,0 64,0 36,0
5 8,0 5,0 40,0 64,0 25,0
6 7,5 7,0 52,5 56,3 49,0
7 7,5 9,0 67,5 56,3 81,0
8 6,0 7,5 45,0 36,0 56,3
9 5,0 8,0 40,0 25,0 64,0
10 4,0 8,0 32,0 16,0 64,0

Totais 73,0 65,3 456,9 561,0 452,0

a. Calcule o coeficiente de correlação entre as duas variáveis,


identifique o tipo de correlação e interprete o resultado.
b. Construa uma equação para a relação indicada (a equação da reta
de regressão) para possibilitar o cálculo de estimativas para a nota
de Biologia (Y), segundo a nota de Matemática (X).
c. Estime a nota de Biologia, considerando que um aluno tenha
tirado nota 6,5 (X) em Matemática. Substitua na equação da reta
construída no item b.

175
Considerações Finais

Muitas vezes deparamos-nos com situações em que temos que lidar com
muitos dados e não sabemos como vamos lidar com eles. O conteúdo e as
atividades apresentados nesta unidade de aprendizagem têm como objetivo
desenvolver habilidades e proporcionar ferramentas para os profissionais que
lidam com esse tipo de situação.

Desde a apresentação de relatórios e trabalhos científicos a pesquisas, controle,


testes, projeções e previsões, a Estatística está sempre presente. Afinal, no dia
a dia, lidamos com uma grande quantidade de informações, então pergunto: de
que vale ter tanta informação se não sabemos o que fazer com ela? Espera-se
que todo o conhecimento que você adquiriu nesta unidade de aprendizagem seja
suporte para as suas análises, opiniões e decisões.

Muito sucesso profissional!

Prof. Luiz Dornelles

177
Referências

ACÇÃO LOCAL DE ESTATÍSTICA APLICADA – ALEA. 1999-2010. Disponível em:


<http://alea-estp.ine.pt>. Acesso em: 15 ago. 2010.

ANDERSON, David R.; SWEENEY, Dennis J.; WILLIAMS, Thomas A. Estatística


aplicada à administração e economia. 2. ed. São Paulo: Cengage Learning,
2007. ISBN 9788522105212. Disponível em: <https://aplicacoes.unisul.br/
pergamum/biblioteca_s/php/login_usu.php?flag=minhabib lioteca_redirect.php>.
Acesso em: 11 fev. 2015. Acesso restrito via Minha Biblioteca.

ARANGO, Héctor Gustavo. Bioestatística teórica e computacional. Rio de


Janeiro: Guanabara, 2001.

ASSOCIAÇÃO NACIONAL DE ENTIDADES PROMOTORAS DE EMPREENDIMENTOS


INOVADORES - Anprotec. 2008. Disponível em: <http://www.anprotec.org.br>.
Acesso em: 15 ago. 2010.

BANCO CENTRAL DO BRASIL. 2010. Disponível em: <http://www.bcb.gov.br/>.


Acesso em: 15 ago. 2010.

BARBETTA, Pedro Alberto. Estatística aplicada às ciências sociais. 5. ed. rev.


Florianópolis: Ed. UFSC, 2002.

CRESPO, Antônio Arnot. Estatística fácil. São Paulo: Saraiva, 2001.

DEPARTAMENTO INTERSINDICAL DE ESTATÍSTICA E ESTUDOS


SOCIOECONÔMICOS – DIEESE. 2010. Disponível em: <http://www.dieese.org.
br/>. Acesso em: 3 ago. 2010.

DOANE, David P. Estatística aplicada à administração e à economia. Porto


Alegre: ArtMed, 2011. 2. v. ISBN 9788563308962. Disponível em: <https://
aplicacoes.unisul.br/pergamum/biblioteca_s/php/login_usu.php?flag=minhabib
lioteca_redirect.php>. Acesso em: 11 fev. 2015. Acesso restrito via Minha
Biblioteca.

INSTITUTO BRASILEIRO DE GEOGRAFIA E ESTATÍSTICA – IBGE. 2010.


Disponível em: <http://www.ibge.gov.br/>. Acesso em: 3 set. 2010.

LARSON, Ron; FARBER, Elizabeth. Estatística aplicada. 2. ed. São Paulo: Pearson
Prentice Hall, 2004. 476 p. ISBN 8587918591. Disponível em: <https://aplicacoes.
unisul.br/pergamum/biblioteca_s/php/login_usu.php?flag=minhabib lioteca_redirect.
php>. Acesso em: 11 fev. 2015. Acesso restrito via Minha Biblioteca.

179
LEVIN, Jack. Estatística aplicada às ciências humanas. São Paulo: Habra, 1987.

MORETTIN, Luiz Gonzaga. Estatística básica. São Paulo: Makron Books, 1999

MORETTIN, Pedro Alberto; BUSSAB, Wilton de O. Estatística básica. 8. ed. São


Paulo: Saraiva, 2008. 2 v. ISBN 9788502208001. Disponível em: <https://aplicacoes.
unisul.br/pergamum/biblioteca_s/php/login_usu.php?flag=minhabib lioteca_redirect.
php>. Acesso em: 11 fev. 2015. Acesso restrito via Minha Biblioteca.

PINHEIRO, João Ismael D. Estatística básica: a arte de trabalhar com dados. Rio
de Janeiro: Elsevier, 2009. 288 p. ISBN 9788535230307. Disponível em: <https://
aplicacoes.unisul.br/pergamum/biblioteca_s/php/login_usu.php?flag=minhabib
lioteca_redirect.php>. Acesso em: 11 fev. 2015. Acesso restrito via Minha
Biblioteca. SARAIVA. Segurança e medicina do trabalho. 8. ed. atual. São Paulo,
2011. 1044 p. ISBN 9788502134294.

PORTAL BRASIL. 2010. Disponível em: <http://www.portalbrasil.net/>. Acesso


em: 3 set. 2010.

POPULATION REFERENCE BUREAU. La juventud del mundo 2000. Washington


DC: Population Reference Bureau, 2000. Disponível em: <http://www.prb.org/
SpanishContent.aspx>. Acesso em: 3 março 2011.

SINDICATO DA HABITAÇÃO – SECOVI/RS. 2010. Disponível em: <http://www.


secovi-rs.com.br/index.asp>. Acesso em: 10 ago. 2010.

SILVA, Ermes Medeiros da. Estatística. São Paulo: Atlas, 1996. v.1.

______. Estatística para os cursos de Economia, Administração e Ciências


Contábeis. São Paulo: Atlas, 1999.

SPIEGEL, M. R. Estatística. São Paulo: Makron Books, 1994.

PIEGEL, Murray R.; STEPHENS, Larry J. Estatística. 4. ed. Porto Alegre:


Bookman, 2009. 2 v. ISBN 9788577805204. Disponível em: <https://aplicacoes.
unisul.br/pergamum/biblioteca_s/php/login_usu.php?flag=minhabib lioteca_redirect.
php>. Acesso em: 11 fev. 2015. Acesso restrito via Minha Biblioteca.

TRIBUNAL SUPERIOR ELEITORAL. 2010. Disponível em: <http://www.tse.gov.br>.


Acesso em: 20 set. 2010.

TRIOLA, Mario F. Introdução à Estatística. Rio de Janeiro: LTC, 1999.

VIEIRA, Sônia. Introdução à bioestatística. 6. ed. Rio de Janeiro: Campus, 2000.

______. Princípios de Estatística. São Paulo: Pioneira, 2003.

WILD, Christopher J. Encontros com o acaso. Rio de Janeiro: LTC, 2004.

180
Sobre os Professores Conteudistas

Luiz Arthur Dornelles Júnior


Graduado em Matemática pela Fundação Universidade do Rio Grande (FURG). É
professor da Universidade do Sul de Santa Catarina (UNISUL) desde 2000, onde leciona
as disciplinas de Estatística, Métodos Quantitativos e Programação Linear. Atualmente,
está cursando Especialização em Educação Matemática na UNISUL Virtual.

Gabriel Cremona Parma (2ª edição)


Doutor em Engenharia Civil, na área de Gestão Territorial, pela Universidade
Federal de Santa Catarina (UFSC). Mestre em Engenharia Civil, pela Universidade
Federal de Santa Catarina (UFSC). Cartógrafo: UNL, Argentina. Consultor
especializado em Geoprocessamento e Controle de Qualidade de Dados
Geoespaciais. Atua como professor e pesquisador na Universidade do Sul de
Santa Catarina (UNISUL) e na Universidade Federal de Santa Catarina (UFSC). Ex-
professor na Universidade Nacional do Litoral (UNL), Argentina.

Joseane Borges de Miranda


É bacharel em Ciências Econômicas na UFSC (1998), seu TCC objetivou
analisar o impacto da política cambial sobre os preços agrícolas em Santa
Catarina. É pós-graduada em Economia Industrial, pela Universidade Federal
de Santa Catarina (2000), sua dissertação de Mestrado foi focada nos aspectos
macroeconômicos da competitividade sistêmica no setor de revestimento de
Santa Catarina. Créditos de doutorado do programa de pós-graduação da UFSC,
chamado EGC (Engenharia e Gestão do Conhecimento), a área de conhecimento
é Engenharia do Conhecimento. É professora, há mais de 12 anos, da disciplina
Econometria, nos cursos de Economia. Na Unisul, é professora presencial nos
cursos de Engenharias de Produção, Civil e Ambiental. A maioria das unidades de
aprendizagem ministradas são de Probabilidade e Estatística, Macroeconomia.
Na UV (Unisul Virtual), é professora on-line das unidades de aprendizagem
Gestão do Conhecimento, Finanças Internacionais, Probabilidade e Estatística
e Econometria. É coautora do Livro de Matemática nas Ciências Sociais, é
autora dos Livros: Engenharia Econômica; Econometria I e Econometria II e
coordenadora do curso de bacharelado Ciências Econômicas, da Unisul Virtual.

181
182
Respostas e comentários das
atividades de autoavaliação

Capítulo 1
1. O censo é uma coleção de dados sobre uma população, enquanto que a
estimação usa dados de uma amostra para avaliar um parâmetro (característica
descritiva dos elementos da população).

2. Deve-se escolher elementos com as mesmas características da população,


ou seja, elementos que realmente representem a população. Aqui, você pode
citar exemplos (escolher clientes de níveis sociais diferentes para estudar grau
de satisfação, escolher amostras de diversos locais de um lago para análise
etc.). Isso é necessário para que você possa realmente refletir a realidade, sem
distorcer ou conduzir os resultados.

3. Nesta questão, você deve citar exemplos do seu dia a dia, por exemplo, as
listadas na tabela a seguir.

Variável Exemplos

Qualitativa nominal Nacionalidade

Qualitativa ordinal Atendimento (ótimo, muito bom, ... , muito ruim)

Quantitativa discreta Número de filhos

Quantitativa contínua Escore de teste psicológico

4. A classificação que você pode fazer é:

•• os dados coletados por meio de questionário − primários;


•• os dados coletados no Ministério − secundários.

183
5. Observe, no quadro a seguir, a resposta para esta questão.

DESCRIÇÃO DA VARIÁVEL CLASSIFICAÇÃO

Saldo em conta corrente em R$ Quantitativa contínua

Idade do cliente Quantitativa contínua

Sexo do cliente Qualitativa nominal

Classe econômica Qualitativa ordinal

Estado civil Qualitativa nominal

Número de defeitos do produto Quantitativa discreta

Consumo de energia em kWh Quantitativa contínua

Número de filhos Quantitativa discreta

Comprimento da peça Quantitativa contínua

Tempo de espera em caixa eletrônico (em minutos) Quantitativa contínua

Nome de país exportador de petróleo Quantitativa nominal

Grau de satisfação no atendimento em uma loja comercial Qualitativa nominal

Número de alunos de uma universidade Quantitativa discreta

6. Montagem da tabela.

Principais motivos de tensão Nº de clientes


(estresse)

Morte de um filho 16

Morte do cônjuge 12

Morte dos pais ou irmãos 11

Divórcio 8

Doença grave 7

Demissão 6

Total 60

184
7. Montagem da tabela.
Acidentes de trabalho nos últimos 36 meses

Nº de acidentes Nº de meses

3 4

4 5

5 9
6 7
7 5
8 6
Total 36

8. Montagem da tabela.
Renda das famílias de um bairro de classe baixa de Florianópolis

Renda família (R$) Nº de pacientes

112 |---- 115 2


115 |---- 118 6
118 |---- 121 4
121 |---- 124 9
124 |---- 127 8

127 |---- 130 7

Total 36

185
9. Completando a tabela.
Número de operários acidentados em cada mês

Nº de Nº de meses fa Fr fp (%)
acidentados

3 4 4 0,1111 11,11
4 5 9 0,1389 13,89
5 9 18 0,2500 25,00
6 7 25 0,1944 19,44
7 5 30 0,1389 13,89
8 6 36 0,1667 16,67
Total (Σfi) 36 1,0000 100,0

a. 18 meses (9+5+4);
b. 27 meses (9+7+5+6);
c. 25% dos meses;
d. 13,89% dos meses.

10. O histograma e o polígono de frequências deverão ser semelhantes ao


apresentado a seguir.

186
Capítulo 2
1. Em primeiro lugar, construa a tabela.

Consumo de bebidas alcoólicas por semana pelos funcionários.

Número de dias Número de xi.fi


(xi) funcionários (fi)
0 10 0
1 16 16
2 14 28
3 8 24
4 5 20
5 4 20
6 4 24
7 3 21
Total (Σfi) 64 153

Em segundo lugar, calcule a média, dividindo a soma da coluna xi.fi pela soma da
coluna fi. O resultado é a média.

Interpretação: o número médio de dias de consumo de álcool pelos funcionários


é de 2,39 dias.

2. Usando um processo semelhante ao anterior, em primeiro lugar, você deve


calcular o ponto médio. Em seguida, multiplicar o ponto médio pela fi de cada
linha e, porteriormente, escrever o resultado na coluna PM.fi. Some esses
números no final da coluna, conforme a tabela.

187
Renda de famílias de um bairro de classe baixa de Florianópolis

Renda (R$) Número de famílias PM PM.fi

112 |---- 115 2 113,5 227

115 |---- 118 6 116,5 699

118 |---- 121 4 119,5 478

121 |---- 124 9 122,5 1102,5

124 |---- 127 8 125,5 1004

127 |---- 130 7 128,5 899,5

Total (Σfi) 36 4410

Em segundo lugar, divida o resultado da soma (ΣPM.fi) pela soma dos números
da coluna fi.

Interpretação: o nível da renda familiar é de 122,5 reais.

3. a) Conjunto 1

Primeiro passo: escrever, na tabela, os dados organizados em ordem crescente


(Rol) e, na linha de baixo, as posições.

12 13 13 15 15 16 17 19 21

1ª 2ª 3ª 4ª 5ª 6ª 7ª 8ª 9ª

Segundo passo: calcular a posição, levando em consideração que a série tem 9


elementos, sendo, assim, é ímpar.

188
Terceiro passo: encontrar, na tabela p, o elemento que ocupa a 5ª posição.

12 13 13 15 15 16 17 19 21

1ª 2ª 3ª 4ª 5ª 6ª 7ª 8ª 9ª

Me = 15 – o tempo de internação mediano é de 15 dias.

Interpretação: 50% dos valores observados são menores ou iguais a 15, e 50%
dos valores observados são maiores ou iguais a 15.

b) Conjunto 2

Primeiro passo: escrever, na tabela, os dados organizados em ordem crescente


(Rol) e, na linha de baixo, as posições.

14 14 15 15 16 16 17 18

1ª 2ª 3ª 4ª 5ª 6ª 7ª 8ª

Segundo passo: calcular a posição, levando em consideração que a série tem 8


elementos, sendo, assim, é par.

A mediana ocupa uma posição entre a 4ª e a 5ª posições.

Terceiro passo: encontrar, na tabela, os elementos que ocupam as posições 4ª e 5ª.

14 14 15 15 Me 16 16 17 18

1ª 2ª 3ª 4ª 5ª 6ª 7ª 8ª

Elemento da 4ª posição = 15;


Elemento da 5ª posição = 16.

189
Quarto passo: calcular a média.

Me = (15+16)/2 = 15,5.

Interpretação: 50% dos valores observados são menores ou iguais a 15,5, e


50% dos valores observados são maiores ou iguais a 15,5.

4. a) Conjunto 1

•• Organizando os dados.

1 1 1 1 2 2 2 2 3

5 5 6 6 7 7 7 8 8

A série tem duas modas: Mo1 = 1 e Mo2 = 2.

Interpretação moda 1: o valor mais frequente é 1.

Interpretação moda 2: o valor mais frequente é 2.

b) Conjunto 2

•• Organizando os dados.

2 2 2 3 3 3 3 5

5 5 5 6 6 6 8 8

A série tem duas modas: Mo1 = 3 e Mo2 = 5.

Interpretação moda 1: o valor mais frequente é 3.

Interpretação moda 2: o valor mais frequente é 5.

c) Conjunto 3

•• Organizando os dados.

1 1 2 2 3 3 4 4

5 5 6 6 7 7 8 8

A série não tem moda, pois não tem nenhum dado que se repita mais do que os outros.

Interpretação moda: é uma série amodal, ou seja, não tem valor(es) mais frequente(s).

190
Nome da disciplina

5. Primeiro passo: escrever, na tabela, os dados organizados em ordem


crescente (Rol) e, na linha de baixo, as posições.

2 3 4 4 4 5 5 6 8 8 9 9

1ª 2ª 3ª 4ª 5ª 6ª 7ª 8ª 9ª 10ª 11ª 12ª

•• Para o terceiro quartil.

Segundo passo: calcular a posição. Considerando n= 12.

Ou seja, Q3 está entre a 9ª e a 10ª posições.

Terceiro passo: calcular o terceiro quartil.

Valor que ocupa a 9ª posição = 8;

Valor que ocupa a 10ª posição = 8.

Então, calcule da seguinte forma.

Interpretação :75% dos dados observados são menores ou iguais a 8, e 25%


dos dados observados são maiores ou iguais a 8.

•• Para o nono decil (note que D9 = P90).

Quarto passo: calcular a posição. Considerando n= 12.

Ou seja, D9 está entre a 11ª e a 12ª posições.

191
Quinto passo: calcular o nono decil.

Valor que ocupa a 11ª posição = 9;

Valor que ocupa a 12ª posição = 9.

Então, calcule da seguinte forma.

Interpretação: 90% dos dados observados são menores ou iguais a 9, e 10%


dos dados observados são maiores ou iguais a 9.

•• Para o trigésimo quinto percentil.

Sexto passo: calcular a posição. Considerando n = 12.

Ou seja, P35 está entre a 4ª e a 5ª posições.

Sétimo passo: calcular o trigésimo quinto percentil.

Valor que ocupa a 4ª posição = 4;

Valor que ocupa a 5ª posição = 4.

Então, calcule da seguinte forma.

Interpretação: 35% dos dados observados são menores ou iguais a 4, e 65%


dos dados observados são maiores ou iguais a 4.

192
6. Nesta questão, você pode seguir os seguintes passos.

Passo 1: calcular a média.

Obs.: não se esqueça de que, na média, usamos a letra grega μ para a população.

Passo 2: calcular os quadrados dos desvios (xi – μ)2.

(x1 – μ)2 = (25 − 28,33)= (−3,33) 2 = 11,0889

(x2 – μ)2 = (22 − 28,33) = (−6,33) 2 = 40,0689

(x3 – μ)2 = (36 − 28,33) = (7,67) 2 = 58,8289

(x4 – μ)2 = (20 − 28,33) = (−8,33) 2 = 69,3889

(x5 – μ)2 = (29 − 28,33) = (0,67) 2 = 0,4489

(x6 – μ)2 = (38 − 28,33) = (9,67) 2 = 93,5089

Somando todos os resultados, temos 273,3334.

Passo 3: calcular a média dos quadrados dos desvios. Aqui, você vai calcular
para a população (variância).

Variância

Então σ2(x) = 45,5556.

193
Passo 4: calcular o desvio padrão calculando a raiz da variância.

Desvio padrão

Interpretação: a variabilidade de tempo de execução do teste é de 6,75 minutos.

7. O modo de calcular é o mesmo da questão anterior, só muda no final, ao


calcular a variância, usamos a fórmula para amostra.

Passo 1: calcular a média.

Passo 2: calcular os quadrados dos desvios (xi – ) 2

(x1 – ) 2 = (15 – 17,6) = (–2,6)2 = 6,76

(x2 – ) 2 = (10 – 17,6) = (–7,6)2 = 57,76

(x3 – ) 2 = (9 – 17,6) = (–8,6) 2 = 73,96

(x4 – ) 2 = (23 – 17,6) = (5,4) 2 = 29,16

(x5 – ) 2 = (31 – 17,6) = (13,4) 2 = 179,56

Somando todos os resultados, temos 347,20.

Passo 3: calcular a média dos quadrados dos desvios. Aqui, você vai calcular
para a amostra (variância).

Variância

Então, s2 (x) = 86,80.

194
Passo 4: calcular o desvio padrão calculando a raiz da variância.

Desvio padrão

= 9,3166

Interpretação: a variabilidade dos escores é de 9,32 pontos.

8. O primeiro passo é calcular a média.

Consumo de bebidas alcoólicas por semana pelos funcionários

Nº de xi.fi
Nº de dias (xi) funcionários (fi) (xi – ) 2.fi

0 10 0 57,10
1 16 16 30,88
2 14 28 2,10
3 8 24 2,96
4 5 20 12,95
5 4 20 27,24
6 4 24 52,12
7 3 21 63,75
∑ 64 153 249,10

Vamos calcular passo a passo.

Passo 1: devemos somar a coluna das frequências simples (fi) para obter Σfi
(frequência total).

Σfi = 64

Passo 2: calcular a média, multiplicar cada xi por sua correspondente fi e escrever


na coluna xi.fi; somar os valores calculados e escrever no final da coluna esse
resultado, e dividir o resultado pelo resultado do passo 1 (Σfi).

195
Passo 3: calcular os quadrados dos desvios, (xi – )2.fi

0 – 2,39 = (–2,39)2 = 5,71×10 = 57,10

1 – 2,39 = (–1,39) 2 = 1,93×16 = 30,88

2 – 2,39 = (–0,39) 2 = 0,15×14 = 2,10

3 – 2,39 = (0,61) 2 = 0,37×8 = 2,96

4 – 2,39 = (1,61) 2 = 2,59×5 = 12,95

5 – 2,39 = (2,61) 2 = 6,81×4 = 27,24

6 – 2,39 = (3,61) 2 = 13,03×4 = 52,12

7 – 2,39 = (4,61) 2 = 21,25×3 = 63,75

Somar os valores obtidos.

Σ(xi – )2.fi = 249,10

Passo 4: calcular a variância para a amostra.

Passo 9: calcular o desvio padrão.

Desvio padrão igual a 1,99.

9. Mais uma vez, vamos calcular passo a passo. Comparando com a anterior,
a diferença está em que aquela era para amostra, enquanto que esta é para a
população. Sugestão: use as colunas para facilitar os cálculos.

196
Idade dos estudantes da disciplina Estatística

Nº de estudantes xi.fi (xi – μ)2.fi


Idade (xi) (fi)

17 5 85 17,4845

18 20 360 15,1380

19 22 418 0,3718

20 10 200 12,769

21 6 126 27,2214

∑ 63 1189 72,9847

Passo 1: devemos somar a coluna das frequências simples (fi) para obter Σfi
(frequência total).

Σfi = 63

Passo 2: calcular a média, multiplicar cada xi por sua correspondente fi e escrever


na coluna xi.fi; somar os valores calculados e escrever no final da coluna esse
resultado, que é o Σxi.fi, dividir o resultado pelo resultado do passo 1 (Σfi).

Passo 3: calcular os quadrados dos desvios, Σ(xi – μ)2.fi.

17 – 18,87 = (–1,87)2 = 3,4969×5= 17,4845

18 – 18,87 = (–0,87)2 = 0,7569×20 = 15,1380

19 – 18,87 = (0,13) 2 = 0,0169×22 = 0,3718

20 – 18,87 = (1,13) 2 = 1,2769×10 = 12,769

21 – 18,87 = (2,13) 2 = 4,5369×6= 27,2214

Somar os valores obtidos na sexta coluna, Σ(xi – μ)2.fi.

Σ(xi – μ)2.fi = 72,9847

197
Passo 4: calcular a variância para a amostra.

Passo 9: calcular o desvio padrão.

Desvio padrão igual a 1,08.

10. Quando você tiver que calcular o desvio padrão para uma tabela com
intervalos, use o mesmo processo, apenas substituindo o xi pelo ponto médio.

Renda de famílias de um bairro de classe baixa de Florianópolis

Nº de famílias PM PM.fi
Renda (R$) (fi) (PMi − )2.fi

112 |-- 115 2 113,5 227 162


115 |-- 118 6 116,5 699 216

119,5
118 |-- 121 4 478 36
122,5

121 |-- 124 9 125,5 1102,2 0


124 |-- 127 8 128,5 1004 72

127 |-- 130 7 899,5 252

Total (∑fi) 36 4410 738

Vamos calcular passo a passo.

Passo 1: somar a coluna das frequências simples (fi) para obter Σfi (frequência total).

Σfi = 36

198
Passo 2: cálculo da média, calcular o ponto médio de cada intervalo (112+115)/2
= 113,5 primeiro PM, e multiplicar cada PM por sua correspondente fi e escrever
na coluna PM.fi, somar os valores calculados nessa coluna e escrever o total.
Dividir o resultado pelo resultado do Passo 1 (Σfi).

Passo 3: calcular os quadrados dos desvios (PMi – )2.fi

113,5 – 122,5 = (–9)2 = 81×2 = 162

116,5 – 122,5 = (–6)2 = 36×6 = 216

119,5 – 122,5 = (–3)2 = 9×4 = 36

122,5 – 122,5 = (0)2 = 0×9 = 0

125,5 – 122,5 = (3)2 = 9×8 = 72

128,5 – 122,5 = (6)2 = 36×7 = 252

Somar os valores obtidos.

Σ(PMi – )2.fi = 738

Passo 4: calcular a variância.

Passo 5: calcular o desvio padrão.

O desvio padrão é igual a 4,59.

199
11.

11.1

a) A mais dispersa em termos absolutos é a série B (maior desvio padrão).

b) Você tem que calcular o coeficiente de variação.

•• Para a série A.

•• Para a série B.

A série com maior dispersão relativa é a série A (maior coeficiente de variação).

c) Concluindo: a série mais dispersa é a série A.

11.2

a) A mais dispersa em termos absolutos é a série B (maior desvio padrão).

b) Você tem que calcular o coeficiente de variação.

•• Para a série A.

•• Para a série B.

As duas séries apresentam o mesmo valor para os coeficientes de variação.

c) Concluindo: as duas séries apresentam a mesma dispersão.

200
Capítulo 3
1.

Passo 1: para começar, você deve identificar o evento e o espaço amostral.

A: jovens sofriam com o autoritarismo dos pais.

S: adolescentes.

Passo 2: identificar o número de elementos do evento e do espaço amostral.

n(A) = 675;

n(S) = 1500.

Passo 3: calcular usando a fórmula.

0,45 ou 45%.

2.

Passo 1: para começar, você deve identificar os eventos e o espaço amostral.

A: casado(a);
B: solteiro(a);
C: divorciado(a);
S: total pesquisado.

Passo 2: identificar o número de elementos dos eventos e do espaço amostral.

n(A) = 267.867;
n(B) = 333.974;
n(C) = 16.779;
n(S) = 665.541.

201
Passo 3: calcular usando a fórmula apresentada a seguir.

0,4025 ou 40,25%

0,5018 ou 50,18%.

0,0252 ou 2,52%.

3.

a) Calcule Z (variável padronizada) para x = 116, x = 136, para x = 131 e para


x = 141 pontos.

Passo 1: identificar todos os elementos que compõe o problema.

a média: μ = 126;

o desvio padrão: σ(x) = 10;

os limites do intervalo: X = 116; X = 136; X = 131; X = 141.

Passo 2: calcular a variável padronizada Z.

•• Para X = 116.

Z = −1

•• Para X = 136.

Z=1

202
•• Para X = 131.

Z = 0,5

•• Para X = 141.

Z = 1,5

b) Qual a probabilidade de se escolher uma pessoa com escore maior do que


136 pontos?

Passo 1: identificar, no gráfico, o intervalo e a área que você deve calcular (usar o
z calculado no item anterior, para x = 136, o z = 1).

Passo 2: procurar, na tabela, a área correspondente a z = 1 (não se esqueça de


que a área dada na tabela é sempre entre 0 e z).

Z = 1 → Área = 0,3413.

Passo 3: calcular a probabilidade.

A área dada na tabela é de 0 a Z (0,3413), mas o intervalo solicitado é de 136 para


cima. Nesse caso, você deve subtrair de 0,5 (total de área de um lado da curva) o
valor encontrado (0,3413).

P(x > 136) = 0,5000 – 0,3413 = 0,1587 ou 15,87%.

203
c) Qual a probabilidade de se escolher uma pessoa com escore entre 126 e 131
pontos? Note que 126 é a média. Esse fica mais fácil.

Passo 1: identificar, no gráfico, o intervalo e a área que você deve calcular (usar o
z calculado no item anterior, para x = 131, o z = 0,5)

Passo 2: procurar na tabela a área correspondente à z = 0,5 (não se esqueça de


que a área dada na tabela é sempre entre 0 e z).

Z = 0,5 → Área = 0,1915.

Passo 3: calcular a probabilidade.

A área dada na tabela é de 0 a Z (0,1915), e o intervalo solicitado é entre 0 e Z,


então, você já tem o resultado.

P(126 < x < 131) =0,5000 + 0,1915 ou 19,15%.

204
d) Qual a probabilidade de se escolher uma pessoa com escore entre 116 e
141 pontos?

Passo 1: identificar, no gráfico, o intervalo e a área que você deve calcular (usar
os valores de z calculados no item anterior, para x = 116, o z = −1 e para x = 141, o
z = 1,5).

Passo 2: procurar, na tabela, a área correspondente à z1 = –1 e z2 = 1,5 (não se


esqueça de que a área dada na tabela é sempre entre 0 e z).

Z1 = –1 → Área = 0,3413 (não se esqueça de que a curva é simétrica, e o sinal só


indica de que lado está a área).

Z2 = 1,5 → Área = 0, 4332.

Passo 3: calcular a probabilidade.

A área solicitada é a soma das duas áreas, a correspondente à Z1 (0,3413), e a


correspondente à Z2 (0,4332).

P(116 < x < 141) = 0,3413 + 0,4332 = 0,7745 ou 77,45%.

205
Capítulo 4
1.

a) Estudo socioeconômico com estudantes da Unisul.

Passo 1: identificar os elementos da fórmula.

n0 = tamanho aproximado da amostra;

E = erro amostral tolerável = 0,03;

N = tamanho da população = 5600.

Passo 2: usar a fórmula.

n0 = 1111,11 → arredondando, temos 1111 pessoas.

Um tamanho aproximado para a amostra seria de 1111 pessoas. Observe que


o pesquisador teve acesso à informação de que a população seria de 5600
pessoas, então você deve passar para o passo seguinte.

Passo 3: calcular o tamanho da amostra usando a população com a seguinte fórmula.

Arredondando, seriam 927 pessoas.

b) Estudo com famílias do bairro Rio Vermelho, em Florianópolis.

Passo 1: identificar os elementos da fórmula.

n0 = tamanho aproximado da amostra;

E = erro amostral tolerável = 0,04;

N = tamanho da população = 9400.

206
Passo 2: usar a fórmula.

n0 = 625 crianças.

Um tamanho aproximado para a amostra seria de 625 crianças. Observe que


o pesquisador teve acesso à informação de que a população seria de 9400
crianças, então você deve passar para o passo seguinte.

Passo 3: calcular o tamanho da amostra usando a população com a seguinte fórmula.

Arredondando, seriam 586 crianças.

c) Estudo da fecundidade na cidade de Florianópolis.

n0 = 278;

n = 277.

d) Estudo com adolescentes de uma escola usuários de drogas.

n0 = 123;

n = 83.

f) Estudo do índice de massa corporal dos estudantes da Unisul.

n0 = 400;

n = 364.

g) Pesquisa de intenções de voto no Brasil.

n0 = 2500;

n = 2500.

207
2.

Passo 1: como já foi indicado o percentual de eleitores que votam no candidato,


só falta calcular o percentual dos eleitores que não votam no candidato ( )

Você pode deixar na forma decimal, pois, para calcular o erro, é usado dessa forma.

Passo 2: identificar o z com NC de 90%, o z = 1,645.

Passo 3: discriminar cada elemento da fórmula de cálculo do erro e calcular o

Em que:

e = erro da estimativa;

z = 1,645.

p̂ = 26,4% ou (percentual da amostra de eleitores que votam no candidato);

(percentual da amostra dos eleitores que não votam no candidato);

n = 700 (tamanho da amostra).

Cálculo do erro

=1,645.

ou 2,74%.

208
Passo 4: calcular o intervalo da estimativa.

Neste passo, o cálculo pode ser na forma percentual ou decimal.

ou

3.

Passo 1: identificar o z para o NC de 95%, z=1,96.

Passo 2: discriminar cada elemento da fórmula de cálculo do erro e calculá-lo.

Em que:

e = o que você quer calcular (erro da estimativa);

z = 1,96;

S(x) = 3,4 (desvio padrão da amostra);

n = 250 (tamanho da amostra).

Cálculo do erro

Observação importante: não é necessário multiplicar por 100, pois esse


resultado não indica percentual, neste caso, ele indica quilos!

209
Passo 3: calcular o intervalo da estimativa.

4.

Passo 1:

Cálculo dos graus de liberdade para definição do ponto crítico:

GLn = 3 – 1 = 2 (graus de liberdade do numerador, isto porque são 3 máquinas, ou


seja, K=3);

GLm = 18 – 3 = 15 (graus de liberdade do denominador).

É o resultado de N menos K, N é composto por 5 peças na máquina 1, mais 7


peças da máquina 2, mais 6 peças da máquina 3.

Agora, procurando na tabela de F para 5% de nível de significância, entrando na coluna


da esquerda com GLm = 15 e na fila superior com GLn=2, resulta: F (5%,2,15) = 3,68.

Vamos calcular as médias das amostras:

Máquina 1 = 32/5= 6,40;

Máquina 2 = 67/7= 9,57;

Máquina 3 = 38/6= 6,33.

E a média das médias = (6,40+9,57+6,33)/3 = 22,30/3 = 7,43

Cálculo do SSE

Máquina 1

(8-6,40)^2+(6-6,40)^2+(5-6,40)^2+(6-6,40)^2+(7-6,40)^2 = 5,20

210
Máquina 2

(10-9,57)^2+(8-9,57)^2+(12-9,57)^2+(7-9,57)^2+(9-9,57)^2+(10-9,57)^2+(11-9,57)^2=17,68

Máquina 3

(7-6,33)^2+(5-6,33)^2+(8-6,33)^2+(6-6,33)^2+(7-6,33)^2+(5-6,33)^2=7,34

Somando as três, temos: 5,20+17,68+7,34 = 30,22.

SSE = 30,22

Cálculo do SSA

SSA = 5(6,40-7,43)^2 + 7(9,57-7,43)^2 + 6(6,33-7,43)^2 = 44,62

Cálculo do MSE

MSE = 30,22/15 = 2,01

Cálculo do MSA

MSA = 44,62/2 = 22,31

E o valor observado de F resulta em:

F(2/15) = 22,31/2,01= 11,01.

Então, ao nível de significância de 0.05 (95% de nível de confiança), rejeita-se


a hipótese H de igualdade de médias de produção, pois o valor observado da
estatística de teste F é maior do que o ponto crítico ou o F tabelado.

Há, portanto, evidência estatística de que as três máquinas não são iguais
relativamente ao volume médio de produção.

Em outras palavras: a marca da máquina influencia significativamente a


quantidade de peças fabricadas por ela.

211
A tabela ANOVA resulta nos seguintes valores.

Graus de
Fonte de variação Soma de quadrados Variância Razão F
liberdade

Entre grupos SSA =44,62 2 MSA = 22,31 11,01

Residual SSE = 30,22 15 MSE = 2,01

Total SSE = 74,84 17

Capítulo 5
1. a)

Passo 1: como as colunas já estão calculadas, você pode começar identificando


os elementos da fórmula.

n =10 (número de alunos)

∑x = 73;

∑y = 65,3;

∑x.y = 456,9;

∑x2 = 561;

∑y2 = 456,9.

Passo 2: calcule o coeficiente de correlação utilizando a fórmula vista no passo anterior.

212
Passo 3: analisando o resultado, você pode classificar e interpretar
contextualizando-o na situação descrita.

Classificação: a correlação entre as notas de Matemática e Biologia pode ser


classificada como negativa forte.

Como interpretar?

O coeficiente de correlação resultou em um número negativo e próximo de 1 (r =


–0,73842), sendo assim, a correlação entre as notas de Matemática e Biologia é
negativa (significativa), ou seja, quanto maior a nota em Matemática, menor será a nota
em Biologia, e quanto menor a nota em Matemática, maior será a nota em Biologia.

b)

Passo 1: para a equação da reta, conforme mostrada abaixo, você pode começar
calculando a inclinação da reta (a).

Equação da reta de regressão → b+a.X

Inclinação da reta (a).

Agora, identifique os elementos da fórmula.

n = 10 (número de alunos);

∑x = 73;

∑y = 65,3;

∑x.y = 456,9;

∑x2 = 561;

213
Se você escrever na fórmula, terá:

Passo 2: calcule a intersecção com o eixo y (b).

Intersecção do eixo y (b).

Identifique os elementos da fórmula.

n = 10 (número de alunos);

∑x = 73;

∑y = 65,3;

214
Passo 3: construa a equação da reta de regressão.

Após calcular a e b, tem-se:

b+a.X;

11,671171-0,70427.X.

c)

Para calcular a estimativa, você necessita de um valor para X, que é dado no item
c), ou seja, X = 6,5. Para estimar a nota de Biologia, você precisa de uma nota de
Matemática. Observe o seguinte procedimento:

X = 6,5;

11,671171 − 0,70427.X;

11,671171 − 0,70427.(6,5);

11,671171 − 4,577755;

7,09.

Interpretação: se um aluno tirar 6,5 em Matemática, possivelmente, ele tirará em


torno de 7,09 na nota de Biologia.Anexos

215
Anexos

Tabela 3.7 - Tabela de áreas da distribuição padronizada.

Fonte: Triola (1999)

216
217

Das könnte Ihnen auch gefallen