Beruflich Dokumente
Kultur Dokumente
4ª Edição
PONTIFÍCIA UNIVERSIDADE CATÓLICA DE MINAS GERAIS
Grão Chanceler Dom Walmor Oliveira de Azevedo
2009
Impresso no Brasil
ATENDIMENTO E INFORMAÇÕES:
Telefone: (31) 3238-5656
www.virtual.pucminas.br/faleconosco
Sumário
Apresentação ........................................................................................... 5
MÓDULO 1 ....................................................................... 6
MÓDULO 2 ...................................................................... 72
ANEXOS........................................................................ 118
Anexo A. TNA – Tabela de Números Aleatórios ...........................................................119
Anexo B. Tabela da Curva Normal – (Faixa Central) .....................................................120
Anexo C. Apêndice Matemático..............................................................................121
Anexo D. Estudo de Caso......................................................................................123
Glossário.............................................................................................. 138
Referências Bibliográficas......................................................................... 141
Apresentação
Este texto foi elaborado para ser um material de referência para o aluno no estudo
da disciplina Probabilidade e Estatística na modalidade a distância.
A disciplina será desenvolvida em um semestre letivo e o conteúdo está constituído
de 9 capítulos, dividido em 2 Módulos. O módulo I contemplará a Estatística Descriti-
va e o módulo II, a Probabilidade e Estatística Inferencial.
A apresentação, em uma mesma obra, de conteúdos comumente encontrados em vá-
rios livros, visa garantir ao estudante da graduação o acesso a informações, o enten-
dimento delas e sua utilização como instrumento de análises de dados. Instrumentos
estes que permitam a viabilidade de conclusões por meio de afirmações estatísticas.
Como material de apoio, a consulta à bibliografia recomendada é essencial para a
aprendizagem.
Como sistemática de apresentação, esclareço que, em todos os capítulos, são apre-
sentados exemplos com o objetivo de tornar mais claros os temas tratados.
Para que o aluno tenha um bom aproveitamento, é importante estudar detalhada-
mente cada unidade do programa, analisar os exemplos e os exercícios resolvidos.
Será também fundamental solucionar os exercícios propostos.
No capítulo 2, estaremos utilizando uma TNA (Tabela de Números Aleatórios), neces-
sária para resolução dos exercícios e avaliações. Nos capítulos 7 e 8, faremos uso de
uma outra tabela, a Tabela da Curva Normal, que devera ser consultada para a reso-
lução dos exercícios e avaliações. Estas duas tabelas são instrumentos de suma im-
portância no estudo da Estatística. Muito simples de serem utilizadas, elas podem ser
encontradas, como anexos.
Módulo 1
Capítulo 1.
Natureza e Fundamentos do Método Estatístico
Abordando temas relacionados ao método estatístico, esta unidade tem como objeti-
vos Gerais:
Demonstrar a importância da Estatística na vida diária;
Mostrar como podemos utilizá-la de forma correta;
Ensinar como compor tabelas a partir de dados numéricos;
Ensinar como representar dados numéricos em gráficos.
Desde a Antigüidade, há indícios de que 3000 anos A.C., reis e imperadores se preocupa-
vam em obter informações, não só em relação a população mas também às riquezas eco-
nômicas, informações essas que seriam utilizadas para a taxação de impostos e para fins de
alistamento militar. Por estar desde os primórdios ligada ao governo tem a origem associada
a palavra status.
A estatística é também comumente associada às pesquisas de opinião pública, aos vários
índices governamentais, aos gráficos e às médias publicadas diariamente na imprensa. Na
realidade, entretanto, a estatística engloba muitos outros aspectos, sendo fundamental na
análise de dados provenientes de quaisquer processos onde exista variabilidade.
É possível distinguir duas concepções para a palavra ESTATÍSTICA: no plural (estatísticas),
indica qualquer coleção de dados numéricos, reunidos com a finalidade de fornecer informa-
ções acerca de uma atividade qualquer. Assim, por exemplo, as estatísticas demográficas
referem-se aos dados numéricos sobre nascimentos, falecimentos, matrimônios, desquites
Amostragem
É o processo de escolha da amostra. É a parte inicial de qualquer estudo estatístico, e con-
siste na escolha criteriosa dos elementos a serem submetidos ao estudo. Geralmente, as
População e amostra
O estudo de qualquer fenômeno, seja ele natural, social, econômico ou biológico, exige a
coleta e a análise de dados estatísticos. A coleta de dados é, pois, a fase inicial de qualquer
pesquisa.
É com base nos dados da amostra que se desenvolvem os estudos, visando a fazer inferên-
cias sobre a população.
Estatística Descritiva
É a parte mais conhecida. Quem vê o noticiário, na televisão ou nos jornais, sabe quão fre-
qüente é o uso de médias, índices e gráficos nas notícias.
A tomada de decisões sobre a população, com base em estudos feitos sobre os dados da
amostra, constitui o problema central da inferência estatística.
Exemplo 1.7.
Suponha que a distribuição das alturas de todos os habitantes de um país possa ser repre-
sentada por uma distribuição normal. Mas não conhecemos de antemão a média da distribu-
ição. Devemos, pois, estimá-la.
Definição do problema
Após a escolha do tema, a primeira fase do trabalho consiste em uma definição ou formula-
ção correta do problema a ser estudado. O analista além de considerar detidamente esse
problema objeto do estudo, deverá examinar outros levantamentos realizados no mesmo
campo e que sejam análogos. Esses dados podem conter parte da informação de que ne-
cessita.
Planejamento
O passo seguinte, compreende a fase do planejamento, que consiste em se determinar o
procedimento necessário para se resolver o problema e, em especial, como levantar infor-
mações sobre o assunto, objeto do estudo. É preciso planejar o trabalho a ser realizado ten-
do em vista o objetivo que se pretende atingir. É nessa fase que será escolhido o tipo de
levantamento a ser utilizado. Pode-se utilizar de dois tipos de levantamento:
Levantamento censitário, quando a contagem for completa, abrangendo todo o universo;
Levantamento por amostragem, quando a contagem for parcial.
Os dados devem ser apresentados sempre de forma adequada, qualquer que seja a finali-
dade, tornando mais preciso o exame do fenômeno que está sendo objeto de tratamento
estatístico.
Há duas formas de apresentação ou exposição dos dados observados, que não se excluem
mutuamente:
Apresentação tabular – É a apresentação numérica dos dados. Consiste em dispor os
dados em linhas e colunas distribuídas de modo ordenado, segundo algumas regras prá-
ticas adotadas pelos diversos sistemas estatísticos. As tabelas têm a vantagem de con-
seguir expor, sinteticamente e em um só local, os resultados sobre determinado assunto,
de modo a se obter uma visão global daquilo que se pretende analisar.
Apresentação gráfica – É a apresentação geométrica dos dados numéricos. Embora a
apresentação tabular seja de extrema importância no sentido de facilitar a análise numé-
rica dos dados, não permite ao analista obter uma visão tão rápida, fácil e clara do fenô-
meno e sua variação como aquela conseguida através de um gráfico.
Exemplo 1.10
Países Horas
Coréia 46,2
Japão 42,2
Brasil 41,8
Inglaterra 39,6
França 38,2
Os dados estatísticos resultantes da coleta direta da fonte, sem outra manipulação que não
a contagem ou medida, são chamados dados absolutos.
Dados Relativos são o resultado de comparações por quociente (razões) que se estabele-
cem entre dados absolutos e têm por finalidade realçar ou facilitar as comparações entre
quantidades.
Exemplo 1.11
Também chamada de série temporal, série histórica, série evolutiva ou marcha, identifica-se
pelo caráter variável do fator cronológico. Assim, deve-se ter:
Elemento variável: Época
Elementos Fixos: Local e Fenômeno
Exemplo 1.12
Janeiro 2300
Fevereiro 1800
Março 2200
Abril 2210
Maio 2360
Junho 2600
Julho 2690
Agosto 3050
Setembro 3500
Outubro 3440
Novembro 3100
Dezembro 2760
Série Geográfica
Vendas
Unidades da Federação (em milhares de reais)
Paraná 2230
Outros 420
Série Específica
Também chamada de série categórica ou série por categoria, identifica-se pelo caráter vari-
ável de fator especificativo. Assim, deve-se ter:
Elemento variável: Fenômeno
Exemplos 1.14
Tabela 1.5. Operadora WKX – Venda de bilhetes aéreos por Linha – 1995
Vendas
Linha do Produto (em milhares de reais)
Linha A 6450
Linha B 9310
Linha C 15750
Até 80 41 326
Fonte: Serviço de Estatística da Previdência e Trabalho (Dados alterados para melhor compreensão)
As tabelas apresentadas anteriormente são tabelas estatísticas simples, onde apenas uma
série está representada. É comum, todavia, haver necessidade de apresentar, em uma úni-
ca tabela, mais do que uma série. Quando as séries aparecem conjugadas, tem-se uma
tabela de dupla entrada. Em uma tabela desse tipo são criadas duas ordens de classifica-
ção: uma horizontal (linha) e uma vertical (coluna).
Exemplos 1.15
A) Série específico-temporal (Tabela 1.7)
B) Série geográfico-temporal (Tabela 1.8)
Fonte: IPEA
Unidades da Produção
Federação 1937 1938 1939
Podem existir, se bem que mais raramente, pela dificuldade de representação, séries com-
postas de três ou mais entradas.
Obs.: Nem sempre uma tabela representa uma série estatística. Por vezes, os dados reunidos não
revelam uniformidade, sendo meramente um aglomerado de informações gerais sobre deter-
minado assunto, as quais, embora úteis, não apresentam a consistência necessária para se
configurar uma série estatística.
Exemplo 1.16
Tabela com resumos de dados, mas que não representa uma série estatística.
Gráfico em Linhas
Constitui uma aplicação do processo de representação das funções num sistema de coor-
denadas cartesianas.
Exemplo 1.17: Operadora WKX – Venda de bilhetes aéreos – Mercado Interno – 1995 (Ta-
bela 1.3)
Figura 1.1. Operadora WKX – Venda de bilhetes aéreos – Mercado Interno – 1995
3700
3500
3300
3100
Quantidade
2900
2700
2500
2300
2100
1900
1700
Jan Fev Mar Abr Mai Jun Jul Ago Set Out Nov Dez
Meses
Obs.:
O gráfico acima, e os outros aqui mostrados foram construídos utilizando-se o soft-
ware Excel, é possível utilizar outros softwares.
Mas construir gráficos manualmente também é simples basta utilizar uma escala a-
dequada, régua e/ou compasso.
Podemos representar também uma tabela composta. Veja o exemplo.
7000
6000
5000
Quantidade
Acre
4000 Amazonas
Pará
3000 Mato Grosso
Outros Estados
2000
1000
0
1937 1938 1940
Anos
Fonte: Anuário Estatístico do Brasil – IBGE (Dados alterados para melhor compreensão)
Gráfico em Colunas
É a representação de uma série por meio de retângulos, dispostos verticalmente.
Exemplo 1.19: Ver Tabela 1.1 – Quantas horas se trabalha em cada País – 2001
50
40
30
Horas
20
10
0
Coréia Japão Brasil Estados Inglaterra França
Unidos
Paises
Fonte: Organização Internacional do Trabalho (OIT).
Privado Público
6000
5000
4000
Salários
3000
2000
1000
0
Consultor/Auditor Advogado Economista Bioquímico
Cargos
Gráfico em Barras
É semelhante ao gráfico em colunas, porém, os retângulos são dispostos horizontalmente.
Exemplo 1.21
Tabela 1.11. Taxa de juros real anual – 2004
Países Taxa em %
Brasil 9,2
Turquia 8,5
Israel 7,0
Filipinas 5,1
Rússia 3,2
Brasil
Turquia
Paises
África do Sul
Israel
Filipinas
Rússia
0% 2% 4% 6% 8% 10%
Porcentagem
Gráfico em Setores
É a representação gráfica de uma série estatística em círculo, por meio de setores. É utiliza-
do principalmente quando se pretende comparar cada valor da série com o total.
Exemplo 1.22
Anos alunos
2002 900
2003 1200
2004 1500
Total 3600
O total é representado pelo círculo, que fica dividido em tantos setores quantas são as par-
tes. As áreas dos setores são respectivamente proporcionais aos dados da série.
Para 1975: 3600 – 360º Para 1976: 3600 – 360º Para 1977: 3600 – 360º
Gráfico Polar
É o gráfico ideal para representar séries temporais cíclicas, isto é, séries que apresentam
em seu desenvolvimento determinada periodicidade, como, por exemplo, a variação da pre-
cipitação pluviométrica ao longo do ano, ou da temperatura ao longo do dia, o consumo de
energia elétrica durante o mês ou o ano etc.
Janeiro 12
Fevereiro 13
Março 14
Abril 12
Maio 15
Junho 19
Julho 17
Agosto 18
Setembro 14
Outubro 16
Novembro 12
Dezembro 18
Janeiro
20
Dezembro Fevereiro
15
Novembro 10 Março
5
Outubro 0 Abril
Setembro Maio
Agosto Junho
Julho
Para a Série abaixo calcule os valores percentuais e represente os dados por meio de um
gráfico.
Dados obtidos no site:
http://www.anp.gov.br/doc/dados_estatisticos/Producao_de_Derivados_m3.xls
Meses Produção
Janeiro 226.351
Fevereiro 202.052
Março 227.291
Abril 228.004
Maio 241.135
Junho 228.004
Julho 202.179
Agosto 284.395
Setembro 202.328
Outubro 211.278
Novembro 200.953
Dezembro 200.867
Solução: Para calcularmos os valores percentuais de cada mês temos que considerar o va-
lor total (100%) como sendo o todo e, aplicando uma regra de 3, chegaremos ao valor per-
centual correspondente. É possível também dividir diretamente o valor da parte (mês consi-
derado) pelo total, e para obtermos a resposta em porcentagem basta multiplicarmos por
100.
Podemos escolher qualquer um dos gráficos que estudamos, para representar os dados e
ou porcentagens, mas como os valores são muito próximos o gráfico em setores e o gráfico
polar não apresentariam uma visão muito clara. Como estamos falando em volume de pro-
dução devemos optar por um gráfico em colunas que já demonstra uma idéia de volume.
12,00
10,00
porcentagem
8,00
6,00
4,00
2,00
0,00
Jan Fev Mar Abr Mai Jun Jul Ago Set Out Nov Dez
Meses
Nesta unidade, veremos quais as técnicas que podemos utilizar para compor uma
amostra. São objetivos específicos desta unidade:
Familiarizar o leitor com a terminologia empregada na pesquisa de um fenômeno;
Identificar os fatores que afetam a quantidade de informações de um fenômeno;
Explicar como utilizar as Tabelas de Números Aleatórios (TNA) para selecionar
amostras aleatórias.
Exemplo 2.1
Vamos considerar uma situação mais próxima do cotidiano de todos nós. Na cozinha de
nossa casa a cozinheira para saber se uma panela de arroz esta temperada precisa de co-
mer todo o conteúdo da panela?
É claro que não!!! Ela simplesmente prova (pega uma amostra) uma pequena quantidade e
o que sente nesta pequena quantidade generaliza para todo o conteúdo da panela de arroz.
É um exemplo bem lúdico, mas é com este mesmo principio que vamos trabalhar com a-
mostras.
Usualmente, trabalhamos apenas com uma parte (amostra) da população. A inferência esta-
tística nos fornece elementos para generalizar, de maneira segura, as conclusões obtidas na
amostra para a população. Para as inferências serem corretas, é necessário garantir que a
amostra seja representativa da população, isto é, a amostra deve possuir as mesmas carac-
terísticas básicas da população, no que diz respeito ao fenômeno pesquisado.
Dados coletados de forma descuidada podem ser tão inúteis que nenhum processamento
estatístico consegue aproveitá-los.
Para que possamos fazer inferências válidas sobre a população a partir de uma amostra, é
preciso que essa seja representativa. Uma das formas de se conseguir representatividade é
fazer com que o processo de escolha da amostra seja, de alguma forma, aleatório. Além
disso, a aleatoriedade permite o cálculo de estimativas dos erros envolvidos no processo de
inferência.
Basicamente, existem dois métodos para composição da amostra: probabilístico e não pro-
babilístico (intencional).
O método de amostragem probabilística exige que cada elemento da população possua
determinada probabilidade de ser selecionado. Normalmente, possuem a mesma proba-
bilidade. Assim, se N for o tamanho da população, a probabilidade de cada elemento será
1/N. Somente com base em amostragens probabilísticas é possível realizar inferências
sobre a população, a partir dos parâmetros estudados na amostra. As principais técnicas
probabilísticas são:
- Amostragem Aleatória Simples;
- Amostragem Aleatória Estratificada;
- Amostragem Sistemática;
- Amostragem por Conglomerado.
Por serem as principais técnicas estudas, serão detalhadamente exploradas no item 2.3.
Os métodos não probabilísticos são amostragens em que há uma escolha deliberada dos
elementos que compõem a amostra. Não é possível generalizar os resultados das pes-
quisas para a população, uma vez que as amostras não probabilísticas não garantem a
representatividade da população. São elas:
- Amostragem Acidental;
- Amostragem Intencional;
- Amostragem por Quotas.
Amostragem Acidental – É formada por elementos que vão aparecendo, que são possí-
veis de se obter até completar o número de elementos da amostra.
Exemplo 2.3: Pesquisa de opinião, em que os entrevistados são acidentalmente escolhi-
dos.
Amostragem Intencional – É formada por elementos escolhidos por determinado critério,
As amostras aleatórias podem ser escolhidas por diversos métodos. Os mais utilizados são:
tabelas de números aleatórios (TNA) e softwares para gerar números aleatórios. Na prática,
a amostra aleatória simples é escolhida unidade por unidade. As unidades da população são
numeradas de 1 a N. Em seguida, escolhe-se, na tabela de números aleatórios (TNA), (ou
por computador) n números compreendidos entre 1 e N. Esse processo é equivalente a um
sorteio no qual se colocam todos os números misturados dentro de uma urna. As unidades
correspondentes aos números escolhidos formarão a amostra.
Obs.:
1. Um exemplo de TNA encontra-se no final da unidade 2.
2. A TNA (Tabela de Números Aleatórios) – consiste em tabelas que apresentam seqüências
dos dígitos de 0 a 9 distribuídos aleatoriamente nas linhas (horizontais) e colunas (verticais).
Para obtermos os elementos da amostra usando a TNA, sorteamos uma linha e uma coluna
qualquer para começarmos a leitura. Por exemplo: escolho 3ª linha 15ª coluna o digito en-
contrado é 5. A leitura da tabela pode ser feita horizontalmente (da direita para a esquerda
ou vice-versa), verticalmente (de cima para baixo ou vice-versa), diagonalmente (no sentido
ascendente ou descendente). A opção, porém, deve ser feita antes de ser iniciado o proces-
so.
OBS: Como a leitura na TNA é Livre (podemos fazer a leitura em todos os sentidos), vamos adotar
em nossos exercícios, avaliações e trabalhos, a leitura da TNA na vertical, de cima para baixo, con-
siderando sempre as colunas da esquerda para a direita.
Atenção: Foi escolhido ao acaso a 9ª linha e 5ª coluna. Para você realizar qualquer ativida-
de você também pode estar escolhendo ao acaso uma linha e uma coluna pra entrar na
TNA. Mas para resolver os exercícios, avaliações e atividades estes dados serão fornecidos
para facilitar a correção.
É preferível a utilização de outras técnicas de amostragem que a aleatória simples, pois es-
sas levam em consideração a composição da população, facilitando o trabalho de seleção
de amostras e aumentando a precisão.
No primeiro tipo, sorteia-se igual número de elementos em cada estrato. Esse processo é
utilizado quando o número de elementos por estrato for aproximadamente o mesmo.
No outro caso, utiliza-se a amostragem estratificada proporcional, cujo processo de calcular
o número de amostras por estrato é:
N → Nº de unidades total da população
n → Nº de unidades total de amostras Na na n
= → na = .Na
Na → Nº de unidades que compõem um determinado estrato (A) N n N
na → Nº itens que serão amostrados do estrato (A)
M 54 5,4 5
F 36 3,6 4
Total 90 9,0 9
Para estarmos selecionando quem serão os 9 (nove) alunos vamos enumerar (os alunos)
de 01 a 90, sendo que de 01 a 54 correspondem ao estrato Masculino e de 55 a 90, ao
estrato feminino. O próximo passo é o mesmo do exemplo anterior.
Exemplo 2.9
Vamos considerar a seguinte situação: Em um levantamento da população de uma cidade,
podemos dispor do mapa indicando cada quarteirão e não dispor de uma relação atualizada
dos seus moradores.
Atenção: Para sabermos a população total teremos que fazer Inferência, este tema será
estudado na unidade 8. Neste momento estamos apenas estudando as técnicas para retirar
amostras.
1º item → b
2º item → b + K
3º item → b + 2k
4º item → b + 3k
5º item → b + 4k e assim sucessivamente até o final, ou seja, até conseguir o total de
elementos da amostra.
Exemplo 2.10
Suponhamos uma rua contendo quinhentos prédios, dos quais desejamos obter uma amos-
tra formada de vinte prédios. (Vamos considerar para a leitura da TNA, 9ªLinha e 5ª Coluna.)
Lembre-se que a escolha da linha e coluna é ao acaso, estou simplesmente dando uma
referência para podermos chegar ao mesmo resultado.
Solução: Do enunciado temos: N = 500 (população); n=20 (amostra)
a) Calcular K (intervalo de amostragem)
b) K=500/20, K=25
c) b= 12 (valor encontrado na TNA)
d) Composição da amostra
1º item → 12 3º item → 12 + 2*25 = 62
2º item → 12 + 25 = 37 20º item → 12 +19*25 = 487
Obs.: Não é preciso fazer nos exercícios todos os itens, o objetivo é o aluno saber utilizar a técnica.
COLUNA 1 5 9 13 17 21 25 29 33 37 41 45 49
LINHA
01 9486 9821 6074 1432 0995 0157 0071 9871 6678 0140 9522 0995 1735
02 3155 9878 3359 8244 8952 0084 1558 4775 1699 1652 2555 4765 2709
03 6136 2824 6030 4256 3870 5725 2204 5318 8337 3867 6184 2018 3522
04 7249 9182 8669 7423 1768 8147 7285 8390 9134 9863 9486 9821 6074
05 0071 9871 6678 0140 9522 0995 1735 1248 9807 1910 3155 9878 3359
06 1558 4775 1699 1652 2555 4765 2709 0561 4397 1135 6136 2824 6030
07 2204 5318 8337 3867 6184 2018 3522 0941 5569 5800 7249 9182 8669
08 7285 8390 9134 9863 9486 9821 6074 1432 0995 0157 0071 9871 6678
09 1735 1248 9807 1910 3155 9878 3359 8244 8952 0084 1558 4775 1699
10 2709 0561 4397 1135 6136 2824 6030 4256 3870 5725 2204 5318 8337
11 3522 0941 5569 5800 7249 9182 8669 7423 1768 8147 7285 8390 9134
12 6074 1432 0995 0157 0071 9871 6678 0140 9522 0995 1735 1248 9807
13 3359 8244 8952 0084 1558 4775 1699 1652 2555 4765 2709 0561 4397
14 6030 4256 3870 5725 2204 2318 8337 3867 6184 2018 3522 0941 5569
15 8669 7423 1768 8147 7285 8390 9134 9863 9486 9821 6074 1432 0995
16 6678 0140 9522 0995 1735 1248 9807 1910 3155 9878 3359 8244 8952
17 1699 1652 2555 4765 2709 0561 4397 1135 6136 2824 6030 4256 3870
18 8337 3867 6184 2018 3522 0941 5569 5800 7249 9182 8669 7423 1768
19 9134 9863 9486 9821 6074 1432 0995 0157 0071 9871 6678 0140 9522
20 9807 1910 3155 9878 3359 8244 8952 0084 1558 4775 1699 1652 2555
21 4397 1135 6136 2824 6030 4256 3870 5725 2204 5318 8337 3867 6184
22 5569 5800 7249 9182 8669 7423 1768 8147 7285 8390 9134 9863 8486
23 0995 0157 0071 9871 6678 0140 9522 0995 1735 1248 9807 1910 3155
24 8952 0084 1558 4775 1699 1652 2555 4765 2709 0568 4397 1135 6136
25 3870 5725 2204 5318 8337 3867 6184 2018 3522 0941 5569 5800 7249
26 7425 3566 6151 4731 6489 2491 2765 8525 7849 1488 8833 2597 1333
27 8961 8175 0879 6945 8029 9119 5990 1063 9444 8320 1740 6131 9907
28 3298 6173 1741 3874 9321 3748 7507 0170 0568 9112 1275 0924 3054
29 2276 4898 2394 1098 4063 5393 0226 8144 4778 7471 1764 4939 8063
30 9557 8114 1576 9767 1486 7161 5606 6295 3503 5050 9549 2500 9666
31 8650 1920 2533 7755 5324 3731 3414 2153 3815 0626 5718 8679 6801
32 2885 8101 1467 0080 7962 5999 9562 5819 1562 6793 2065 0239 8253
33 1841 8626 0344 4344 7446 0867 6157 8935 4413 2363 7187 8980 2488
34 4638 8030 0018 7760 9819 4276 0650 3516 5159 9236 3257 1694 7157
35 1320 7033 1218 5605 4206 2878 0230 1740 4553 8729 5827 7176 8703
36 1488 5803 6790 9368 0465 4819 0065 7633 3950 2109 7027 5824 5057
37 4353 4347 8565 2231 8789 4231 2585 0157 2037 7835 1320 8999 9181
38 7816 5817 9764 8789 7387 2172 0896 1038 6047 9539 3510 1343 8098
39 8600 9738 5415 8426 7152 8705 5829 0164 8330 9152 6045 8129 2293
40 1057 1550 8773 3003 4302 4034 2478 1078 0429 7189 0778 3260 5969
Exemplo 3.1
J F M A M J J A S O N D
1995 6 2 5 1 0 3 2 1 3 5 5 3
1996 5 4 2 1 3 4 1 4 5 4 0 1
1997 3 1 2 4 3 1 4 1 0 3 0 2
1998 2 2 0 3 1 4 2 0 1 1 5 2
0 0 0 0 0 0 1 1 1 1 1 1
1 1 1 1 1 2 2 2 2 2 2 2
2 2 3 3 3 3 3 3 3 3 4 4
4 4 4 4 4 5 5 5 5 5 5 6
Dados discretos – a variável é discreta quando assume valores em pontos da reta real. (Os
dados são discretos quando temos um conjunto enumerável de itens).
Exemplo 3.3
• Número de erros em um livro: 0,1,2,3,4,....
• Número de filhos de vários casais: 1,2,3,4,.....
• Quantidade de acidentes em determinada rodovia: 4,10,12,15,....
Dados contínuos – a variável pode assumir, teoricamente, qualquer valor em certo interva-
lo da reta real. (Os dados são contínuos quando temos um conjunto mensurável de itens)
Nº de aparelhos Nº de meses
com defeitos
0 06
1 11
2 09
3 08
4 08
5 05
6 01
Total 48
Dados agrupados com intervalo de classes: os valores da variável não aparecem indivi-
dualmente, mas agrupados em intervalo nas classes.
Exemplo 3.6
Notas Nº de alunos
0 |--- 20 020
20 |--- 40 065
40 |--- 60 230
60 |--- 80 160
Total 580
3.2.1. Amplitude total (A) – é a diferença entre o maior e o menor valor do rol.
A = Xmax – X mim
Exemplo 3.7:
Vamos considerar a estatura, em cm, de 40 alunos do Colégio A. (Dados ordenados em
ordem crescente, por colunas)
150 154 155 157 160 161 162 164 166 169
151 155 156 158 160 161 162 164 167 170
152 155 156 158 160 161 163 164 168 172
153 155 156 160 160 161 163 165 168 173
Exemplo 3.8
Considerando o exemplo anterior (tabela 3.3) temos: n=40
Pela formula de Sturges: K= 1+3,3log40 = 6,28 → K=6
Adotando K = n , temos k = 40 =6,3 → K=6
Classe i = 1, 2, 3, 4, 5 e 6
Obs.: A quantidade de classes é um processo de escolha, podemos utilizar qualquer uma das fórmu-
las acima a mais utilizada é: K≅ n
h = 23/ 6 = 3,83 → h = 4
Atenção: h é sempre um número inteiro. E mais prático fazer arredondamento para o núme-
ro inteiro maior. Em muitos casos quando fazemos o arredondamento para o menor inteiro
pode acontecer de faltar classe para os últimos itens.
Exemplo 3.10
Como montar um quadro de distribuição de Freqüência
Do exemplo anterior (Tabela 3.3), temos:
A= 23, K= 6, h=4, e Xmin=150
Para determinarmos o limite inferior da 1ª classe consideramos o valor de Xmin.
Portanto o quadro fica assim composto:
Na 1ª classe: l1 = 150 e L1 = 150 + h = 150 + 4 = 154.
Na 2ª classe: l2 = 154 e L2 = 154+h = 154+4 = 158.
Na 3ª classe: l3 = 158 e L3 = 158 + h =158 + 4 = 162
e assim sucessivamente até a 6ª classe (porque K= 6)
i Classes ni
1 150 | 154 4
2 154 | 158 9
3 158 | 162 11
4 162 | 166 8
5 166 | 170 5
6 170 | 174 3
Σ 40
Limites superiores
O ponto médio da classe, que é representado por (xi) é como o próprio nome indica, o ponto
que divide o intervalo de classe em duas partes iguais. Para obtermos o ponto médio de
uma classe, calculamos:
linf + Lsup
xi =
2
Exemplo 3.11
Considerando a segunda classe do exemplo anterior, temos:
154 + 158
x2 = = 156 → x 2 = 156
2
Simples (n i )
Absoluta
Acumulada (N i )
Frequência
Relativa Simples ( f i )
Acumulada (Fi )
Freqüências absoluta simples da classe i (ni) – são os valores que realmente represen-
tam o número de dados de cada classe. A soma das freqüências simples é igual ao número
total dos dados.
Freqüências relativas simples (fi) – são os valores das razões entre as freqüências sim-
ples e o número total de dados.
ni
fi =
n
Exemplo 3.13:
Considerando a segunda classe do exemplo anterior, temos: f2 = 9/40=0,225.
Obs.: as freqüências relativas permitem a análise ou facilitam as comparações.
Freqüência absoluta acumulada (Ni) – é o total das freqüências de todos os valores inferi-
ores ao limite superior do intervalo de uma dada classe:
Exemplo 3.14:
Obs.: Fi pode ser entendido como sendo a percentagem de observações abaixo do limite superi-
or da classe i.
K = 1 + 3,3 log n ou k = n
Exemplo 3.16
Vamos considerar a estatura de 50 estudantes do sexo masculino da Universidade XYZ.
Como podemos agrupar estes dados? Vamos considerar o que acabamos estudar. Vamos
calcular as freqüências e o ponto médio das classes.
33 35 35 39 41 41 42 45 47 48
50 52 53 54 55 55 57 59 60 60
61 64 65 65 65 66 66 66 67 68
69 71 73 73 74 74 76 77 77 78
80 81 84 85 85 88 89 91 94 97
i Classes ni Ni fi Fi xi
1 30 | 40 4 4 0,08 0,08 35
2 40 | 50 6 10 0,12 0,20 45
3 50 | 60 8 18 0,16 0,36 55
4 60 | 70 13 31 0,26 0,62 65
5 70 | 80 9 40 0,18 0,80 75
6 80 | 90 7 47 0,14 0,94 85
Σ 50 1
Obs.: Não temos somatório de freqüência absoluta acumulada, pois a freqüência acumulada da
última classe já é o total de itens e também não temos freqüência relativa acumulada pelo
mesmo motivo. Também não temos o somatório dos pontos médios.
ni
12
30 40 50 60 70 80 90 100 Classes
Polígono de Freqüência
ni
12
35 45 55 65 75 85 95 Ponto médio
50
47
40
31
18
10
30 40 50 60 70 80 90 100 classes
Obs.: Uma distribuição de freqüência sem intervalos de classe é representada graficamente por um
diagrama onde cada valor da variável é representado por um segmento de reta vertical e de
comprimento proporcional à respectiva freqüência.
ni
12
1 2 3 4 5 6 xi
4.1. Introdução
Nas seções anteriores, vimos a sintetização dos dados sob a forma de tabelas, gráficos e
distribuições de freqüências. Agora, vamos destacar o cálculo das medidas que possibilitam
localizar a maior concentração de valores de uma dada distribuição, isto é, se essa concen-
tração se localiza no início, no meio ou no final de uma distribuição ou, ainda, se há uma
distribuição uniforme. Tais medidas possibilitam comparações de séries de dados entre si
pelo confronto desses números.
Para ressaltar as tendências de cada distribuição, isoladamente, ou em confronto com ou-
tras, necessitamos introduzir os elementos típicos da distribuição, que são:
Medidas de posição;
Medidas de variabilidade ou dispersão;
Medidas de assimetria;
Medidas de curtose.
As medidas de posição mais importantes são as medidas de tendência central, que desta-
camos a seguir:
A média aritmética;
A mediana;
A moda.
Exemplo 4.1
Suponha que o tempo de vida útil de 10 aparelhos de telefone são:
10 29 26 28 15 23 17 25 0 20.
Solução:
Como os dados não estão agrupados utilizamos:
10
∑x
i =1
i = 10 + 29 + 26 + 28 + 15 + 23 + 17 + 25 + 0 + 20 = 193
10
∑x i
193
x= i =1
= = 19,3 (portanto a média de vida útil dos aparelhos é de 19,3 anos)
n 10
∑x ×n i i
Xi: valor encontrado na classe
ni: n° de observações por classe – freqüência simples
x = i =1
n: nº total de observações
n
Exemplo 4.2
Nos valores abaixo, qual o valor médio?
Classes 0 1 2 3 4 5 6 Σ
ni 06 11 09 08 08 05 01 48
Solução:
Para o cálculo da média precisamos calcular o produto de x1 por ni.
Classes 0 1 2 3 4 5 6 Σ
ni 06 11 09 08 08 05 01 48
xi . ni 0 11 18 24 32 25 6 116
Utilizando a fórmula
n
∑x ×n i i 116
x = i =1 X= = 2,42 → X = 2,42
n 48
Exemplo 4.3
Nos valores abaixo, qual o valor médio?
ni 3 10 17 8 5 43
ni 3 10 17 8 5 43
Utilizando a Fórmula:
n
∑x ×n i i
X= i =1
n
109,5
X = = 2,55 → X = 2,55
43
Às vezes, a média pode ser um número diferente de todos os da série de dados que ela
representa. Veja o Exemplo 4.1.
3 4 4 5 6 7 8 9 9 9 10 11 12 13
Classes 0 1 2 3 4 5 6 Σ
ni 06 11 09 08 08 05 01 48
nmo − nant
Mo = linf + hMo
1º Processo: Fórmula de Czuber:
( nmo − nant ) + ( nmo − n post )
onde constatamos:
X = Média
ni 3 10 17 8 5 43
Solução:
Como os dados estão agrupados em intervalos de classe vamos utilizar a fórmula de Czuber
a classe modal é a classe 2|----3 (classe com maior freqüência)
linf = 2
hMo = 1
nMo = 17
nant = 10
npost =8
Substituindo esses valores na fórmula, temos:
17 − 10
Mo = 2 + 1
(17 − 10) + (17 − 8)
Mo= 2,44
Para uma série com número ímpar de itens: a mediana corresponde ao valor central.
EMd – elemento mediano: indica a posição da mediana.
n ímpar
EMd = (n+1)/2
Md = X (E Md )
n par X (E Md ) + X (E Md +1)
EMd = n/2 Md =
2
3 4 4 5 6 7 8 9 9 9 10 11 12 13
Solução:
Como os dados não estão agrupados temos verificar se os elementos estão em ordem
(crescente ou decrescente), no nosso exemplo os elementos já estão ordenados.
O total de itens é 14, portanto n é par.
Emd= n/2 = 14/2= 7 (vamos verificar qual o elemento que ocupa a 7ª posição)
1ª 2ª 3ª 4ª 5ª 6ª 7ª
3 4 4 5 6 7 8 9 9 9 10 11 12 13
Neste caso, o problema consiste em determinar o ponto do intervalo em que está compre-
endida a mediana.
Exemplo 4.8
Nos valores abaixo, qual o valor mediano?
Classes 0 1 2 3 4 5 6 Σ
ni 06 11 09 08 08 05 01 48
Solução:
n
Como os dados estão agrupados sem intervalo de classe vamos utilizar: E MD =
2
Emd= 48/2 = 24 (não precisamos verificar se n é par ou ímpar, temos que fazer esta verificação so-
mente para dados não agrupados!!!)
1ª 2ª 3ª
Classes 0 1 2 3 4 5 6 Σ
ni 06 11 09 08 08 05 01 48
Ni 06 17 26 34 42 47 48 –
Exemplo 4.9
Determinar a mediana para a distribuição:
ni 3 10 17 8 5 43
Solução: Como os dados estão agrupados com intervalo de classe vamos utilizar:
n
∑2 − N ant
Md = linf + hMd
n Md
1ª 2ª 3ª
ni 3 10 17 8 5 43
Ni 3 13 30 38 43 –
n
∑2 − N ant
21,5 − 13
Md = l inf + h Md M D = 2 + 1 = 2,5
n Md 17
M G = n x1.x2 . x3 .....xn
Dados agrupados
x i : ponto médio
M G = n x1 1 x 2 2 x 3 3 ....x n n
n n n n
ni: n° de observações
n: nº total de itens
n n
Mh = = n
n1 n n n ni
x1
+ 2 + 3 + ........ + n
x2 x3 xn ∑
i =1 xi
Exemplo 4.10
Utilizando o exemplo 4.9 qual o valor encontrado para a Média Harmônica e Média Geomé-
trica?
Solução:
Cálculo da Média Geométrica – utilizando a fórmula
MG = n
x1n1 x 2 n2 x 3n3 .... x n nn
ni 3 10 17 8 5 43
Ni 3 13 30 38 43 –
Q3 = 3º quartil, valor situado de tal modo que as três quartas partes (75%) dos termos são
menores que ele e uma quarta parte 25% é maior.
Onde temos:
n: tamanho da amostra
linf: limite inferior da classe do quartil considerado
hQ: intervalo de classe do quartil considerado
nQ: freqüência simples absoluta do quartil considerado
Nant: freqüência acumulada anterior à classe do quartil considerado
Decis: dividem a distribuição em 10 partes iguais
Di = decil i=1,2,3, …, 9
Pk = centil i=1,2,3, …, 99
1º Passo: Calcula-se em que classe esta o Pk que queremos
2º Passo: Pela Nac identifica-se a classe Pk
3º Passo: Aplica-se a fórmula
Exemplo 4. 11
Num acampamento infantil, foram obtidas as seguintes estaturas:
Estaturas 120|--- 128 128|---136 136|--- 144 144|--- 152 152|--- 160
freqüência 6 12 16 13 7
Calcule:
a) O 1º Quartil (Q1);
b) O 4º Decil (D4);
Solução:
Primeiro vamos estruturar a tabela de distribuição de Freqüências, como estamos traba-
lhando com intervalos de classe, temos que calcular os pontos médios de cada classe. De-
pois iremos utilizar as fórmulas para cada item que queremos calcular.
Estaturas (cm)
i ni Ni Xi (Ponto médio)
(Classes)
Total 54 - -
Onde:
n
− N ant linf: limite inferior da classe do quartil considerado = 128
Q1 = lQ1 + .h
4
nQ1 hQ: intervalo de classe do quartil considerado = 8
nQ: freqüência simples absoluta do quartil considerado = 12
Nant: freqüência acumulada anterior à classe do quartil considerado =6
Q1 = 128 +
(13,5 − 6) * 8 = 133
12
b) Cálculo de D4
Primeiramente identificamos a classe onde está localizado o valor que será utilizado,
Kn 4 . 54
= = 21,6 = 27 , através da freqüência acumulada identificamos a classe que
10 10
encontra o 27º, que é a 3ª classe com limites de 136 |--- 144
Agora usaremos a fórmula
onde:
Kn lDK: limite inferior da Classe Dk = 136
− N ( ant )
+ h
1 n: tamanho da amostra = 54
DK = l D K
nDK h: amplitude da classe = 8
nDK: freqüência da classe = 16
N(ant): freqüência acumulada da classe anterior = 18
D4 = 136 +
(21,6 − 18) * 8 = 137,8
16
5.1. Dispersão
Medidas de dispersão são medidas estatísticas utilizadas para avaliar o grau de variabilida-
de, ou dispersão, dos valores obtidos em torno do valor médio. Servem para medir a repre-
sentatividade da média.
Amplitude (A)
Absoluta Variância (S 2 )
Medidas de Dispersão Desvio Padrão (S)
Relativa Coeficiente de variação (CV)
A amplitude é a diferença entre o maior e o menor dos valores da série. A utilização da am-
plitude total como medida de dispersão é muito limitada, pois sendo uma medida que de-
pende apenas dos valores extremos, é instável, não sendo afetada pela dispersão dos valo-
res internos.
Variância (S2)
n
∑ ( xi − x)
_
1
x 2 .n − (∑ x .n )2
S2 = ∑
2 i i
n −1
i i
S =
2 i =1
n
n −1
Onde temos que:
Para dados agrupados sem intervalo de classe, xi é o valor da variável.
1 (∑ xi .ni )
n _ 2
∑ ( xi − x ) 2
S2 = i =1 S =2
n
∑ i i
x 2
.n −
n
n
S = S2
Coeficiente de variação é uma medida relativa de dispersão útil para a comparação em ter-
mos relativos do grau de concentração. O coeficiente de variação é a relação entre o desvio
padrão (S) e a média x ..
S
CV =
x
5.2. Assimetria
Denomina-se assimetria o grau de afastamento de uma distribuição da unidade de simetria.
As medidas de assimetria referem-se à forma da curva de uma distribuição de freqüência,
mais especificamente do polígono de freqüência ou do histograma.
Em uma distribuição simétrica, tem-se igualdade dos valores da média, mediana e moda.
Simetria
X = Mo = Md
Mo Md X
X Md Mo
Existem várias fórmulas para o cálculo do coeficiente de assimetria. As mais utilizadas são:
Quando:
5.3. Curtose
Curtose é o grau de achatamento (ou afilamento) de uma distribuição em comparação com
uma distribuição padrão (chamada curva normal). De acordo com o grau de curtose, classi-
ficamos três tipos de curvas de freqüência:
Mesocúrtica: é uma curva básica de referência chamada curva padrão ou curva normal;
Estaturas 120|--- 128 128|---136 136|--- 144 144|--- 152 152|--- 160
freqüência 6 12 16 13 7
b) Desvio Padrão
c) Coeficiente de Variação
d) Coeficiente de Assimetria
Resolução:
a) Cálculo da Variância
Como estamos trabalhando com dados agrupados com intervalo de classes temos que
calcular o ponto médio de cada classe.
Estaturas 120|--- 128 128|---136 136|--- 144 144|--- 152 152|--- 160 Σ
ni 6 12 16 13 7 54
1 (∑ xi .ni )
2
= 1 1070048 − (7584 )
2
S =
2
n −1
∑ xi .ni − n
2
54 − 1 54
= 92,78
S = S 2 = 922,18 = 7,01
S = S 2 = 92,18 = 7,01
S = S 2 = 9,18 = 7,01
S = S 2 = 92,78 = 9,63
∑x ×n i i
7584
X= i =1
= = 140,44
n 54
S 9 , 63
CV = = = 0 , 068 = 6 ,8 %
X 140 , 44
Introdução
Todas as vezes que se estudam fenômenos que podem ser observados, é imprescindível
distinguir o próprio fenômeno e o modelo matemático (determinístico ou probabilístico) que
melhor o explique.
Os fenômenos estudados pela estatística são fenômenos cujo resultado, mesmo em condi-
ções normais de experimentação, variam de uma observação para outra, dificultando a pre-
visão de um resultado.
A observação de um fenômeno casual é recurso poderoso para se entender a variabilidade
do mesmo. Entretanto, com suposições adequadas e sem observar diretamente o fenôme-
no, podemos criar um modelo teórico que reproduza de forma bastante satisfatória a distri-
buição das freqüências, como se o fenômeno estivesse sendo observado diretamente. Tais
modelos são os chamados modelos de probabilidades.
Os fenômenos determinísticos são previsíveis, e conduzem sempre a um mesmo resultado
quando as condições são as mesmas. Ex: tempo de queda livre de um corpo. Mantidas as
mesmas condições, as variações obtidas para o valor do tempo de queda livre de um corpo
são extremamente pequenas (em alguns casos, desprezíveis).
Os fenômenos aleatórios são imprevisíveis e podem conduzir a diferentes resultados mes-
mo quando as condições são as mesmas. Ex: lançamento de um dado.
Espaço Amostral
Exemplo 6.2
No lançamento de 5 moedas, o número de pontos amostrais (resultados possíveis) é 25 =
32. Portanto, S= 32.
Evento
Evento Aleatório – É representado pela letra (E) – O evento aleatório é qualquer subconjun-
to de um espaço amostral. É também o resultado obtido de cada experimento aleatório, não
é previsível.
O complemento de um evento é constituído de todos os resultados obtidos no espaço amos-
tral que não façam parte do evento.
Os eventos são mutuamente excludentes, quando não têm elemento em comum, ou se não
podem ocorrer simultaneamente.
Exemplo 6.3
Na extração de uma só carta de baralho, os eventos “a carta é de copas” e a “carta é de
ouros” são mutuamente excludentes, porque uma carta não pode ser ao mesmo tempo de
copas e de ouros.
Já os eventos “a carta é de copas” e “a carta é uma figura” não são mutuamente excluden-
tes, porque algumas cartas de copas são também figuras.
Muitas vezes, é útil representar graficamente um espaço amostral, porque isso torna mais
fácil visualização dos elementos.
Sejam A e B dois eventos de S, as seguintes operações podem ser efetuadas e são defini-
das e representadas a seguir:
A) Reunião – A ∪ B – O evento reunião é formado pelos pontos amostrais que pertencem
a pelo menos um dos eventos.
A ∪ B = {∈1 (∈) S / ∈1∈ A ou ∈1∈ B}
Eventos Equiprováveis
No estudo de probabilidade (definição clássica) quando se associa a cada ponto amostral a
mesma probabilidade, o espaço amostral chama-se equiprovável ou uniforme. Os eventos
Ei,i=1,2,3......n são equiprováveis quando P(Ei)=P(E2)=P(En)= P, isto é, quando todos têm a
mesma probabilidade de ocorrer: P=1/n. Todo o nosso estudo estará baseado neste concei-
to
Se os n pontos amostrais (eventos) são equiprováveis, a probabilidade de cada um dos pon-
tos amostrais é 1/n.
1 r
P( A) = r ∴ P( A) =
n n
Exemplo 6.4
Retira-se uma carta de um baralho completo de 52 cartas. Qual a probabilidade de sair um
rei ou uma carta de espadas?
Exemplo 6.5
E = Jogar um dado e observar o resultado.
S = {1,2,3,4,5,6}
Sejam os eventos A= ocorrer nº par e B= ocorrer nº ímpar.
Então, A e B são mutuamente exclusivos, pois a ocorrência de um número par e ímpar não
pode ser verificada na mesma experiência.
3. Teorema da soma: Se A e B são dois eventos quaisquer, então temos que a Probabili-
dade da união dos eventos A e B é:
P(A ∪ B) = P (A) + P (B) – P (A ∩ B)
Teoria da Contagem
Dados dois eventos, o primeiro dos quais pode ocorrer de m maneiras distintas e o segundo
pode ocorrer de n maneiras distintas, então os dois eventos conjuntamente podem ocorrer
de m.n maneiras distintas. O cálculo da probabilidade de um evento reduz-se a um proble-
ma de contagem. Assim é que a Análise Combinatória tem fundamental importância para se
contar o nº de casos favoráveis e o total de casos. Para problemas simples ou com poucos
elementos, pode-se contar o número de resultados de forma direta, sem necessidade de
recorrer às fórmulas matemáticas da análise combinatória. Para problemas mais complexos,
recorre-se às combinações e arranjos para determinar o número de casos.
Combinação
São agrupamentos de r elementos, de forma que os r elementos sejam distintos entre si
apenas pela espécie. A posição dos elementos não importa.
O Número de combinações de r elementos combinados p a p sendo p<r é calculado por:
r r!
Cr , p = =
p p!( r − p )!
Nota: O Símbolo fatorial! denota o produto dos inteiros positivos em ordem decrescente.
Por exemplo, 6! = 6.5.4.3.2.1= 720. Por definição, 0! = 1.
Exemplo 6.6
Quantas comissões de três pessoas podem ser formadas com um grupo de dez pessoas?
Solução: Como a ordem das três pessoas na comissão não importa (não gera outra comis-
são), temos que trabalhar com combinação.
r= 10, p=3 substituindo estes valores na fórmula temos:
Exemplo 6.7
Considerando um grupo de dez pessoas, quantas chapas diferentes podemos ter para uma
eleição de presidente, tesoureiro e secretário?
Solução: Como a ordem das três pessoas na comissão gera outro resultado,, temos que
trabalhar com Arranjos.
r= 10, p=3 substituindo estes valores na fórmula temos:
10! 10 . 9 .8 . 7 . 6 . 5 . 4 . 3 .2 .1 10 .9 .8 .7!
A10,3 = = = = 10.9.8 = 720
(10 − 3)! 7! 7!
Exemplo 6.8
Dois dados são lançados. Consideremos os eventos
A={(x1,x2) / x1+x2=10} e B={(x1,x2) / x1 > x2}, onde x1 é o resultado do dado 1 e x2 é o resulta-
do do dado 2. Avaliar P(A); P(B); P(A/B) e P(B/A).
Solução:
P(A)= 3/36 =1/12 P(A/B)=1/15
P(B) =15/36 =5/12 P(B/A)=1/3
Teorema do Produto
Independência Estatística
Um evento A é considerado independente de um outro evento B se a probabilidade de A é
igual à probabilidade condicional de A dado B.
Exemplo 6.9
Em um lote de 12 peças, 4 são defeituosas, 2 peças são retiradas uma após a outra, sem
reposição. Qual a probabilidade de que ambas sejam boas?
A = {a 1ª peça é boa}
B = {a 2ª peça é boa}
P(A ∩ B) = P(A). P(B/A) = 8/12.7/11 = 14/33
Isto é, se P(A) = P(A/B) «É evidente que, se A é independente de B, B é independente de A;
P(B) = P(B/A). Se A e B são independentes, então temos que
P(A ∩ B) = P(A).P(B)
Obs.: O Teorema de Bayes é também chamado de Teorema da Probabilidade a Posteriori. Ele rela-
ciona uma das parcelas da probabilidade total com a própria probabilidade total.
O teorema de Bayes é uma generalização da probabilidade condicional no caso de mais de
dois eventos.
Exemplo 6.10
1. Sendo P(A) = 1/3, P(B) = ¾ e P(A ∪ B) = 11/12, calcular P(A/B).
Solução:
P( A ∩ B) P
A
B
=
Como P ( A / B ) = )/(B
P
A
, devemos calcular P(A ∩ B).
P( B) P
B
2. Em certo colégio, 5% dos homens e 2% das mulheres têm mais de 1,80 m de altura. Por
outro lado, 60% dos estudantes são homens. Se um estudante é selecionado aleatoria-
mente e tem mais de 1,80m de altura, qual a probabilidade de que o estudante seja mu-
lher?
Solução:
Temos que:
P(Ma/H) = 0,05 (Probabilidade de Homem ter mais de 1,80 m)
P(Ma/M) = 0,02 (Probabilidade de Mulher ter mais de 1,80 m)
P(H) = 0,6 (Probabilidade de ser homem)
P(M) = 0,4 (Probabilidade de ser mulher)
P(M/Ma)= ? (Probabilidade de ser mulher e que tenha mais que 1,80 m)
S X
R
s
Variável
Aleatória X(s)
Exemplo:
E: lançamento de duas moedas;
X: nº de caras obtidas nas duas moedas;
S = {(c,c), (c,r), (r,c),(r,r)}
X = 0 → corresponde ao evento (r,r) com probabilidade ¼
X = 1 → corresponde ao evento (r,c), (c,r) com probabilidade 2/4
X = 2 → corresponde ao evento (c,c) com probabilidade ¼.
Empregamos a termo variável aleatória para descrever o valor que corresponde ao resulta-
do de determinado experimento.
As variáveis aleatórias também podem ser discretas ou continuas veja as definições:
Dada a variável aleatória discreta X, assumindo os valores x1, x2, …, xk, chamamos espe-
rança matemática de X ao valor:
E ( X ) = ∑ x ⋅ p( x)
E de desvio padrão de X a
DP ( X ) = Var ( X )
Vamos estudar alguns modelos probabilísticos, que podem ser usados em várias situações.
Ressaltamos, em cada situação, devemos identificar qual modelo é o mais adequado.
1. Distribuição de Bernoulli
Dado um experimento aleatório E realizado repetidas vezes, sempre nas mesmas condi-
ções, de tal forma que o resultado pode ser um Sucesso (s) (se acontecer o evento espe-
rado) ou um Fracasso (f) (se o evento não se realizar).
Variância:
Var ( X ) = E ( X 2 ) − [ E ( X )]2
1
E ( X 2 ) = ∑ xi2 P( xi ) = 0 2 q + 12 p = p
i=0
Var ( X ) = p − p 2 = p (1 − p ) = pq
2. Distribuição Binomial
Uma variável aleatória tem distribuição binomial quando o experimento ao qual está rela-
cionada pode apresentar apenas dois resultados (sucesso ou fracasso). Este modelo fun-
damenta-se nas seguintes hipóteses:
n provas independentes e do mesmo tipo são realizadas;
cada prova admite dois resultados – Sucesso ou Fracasso;
a probabilidade de sucesso em cada prova é p e de fracasso 1 – p = q
(porque p+q= 1)
qX =
.)0(P( X = 0) = q.q.q.q.q.....q = q n
P
n
P( X = x) = p x q n − x Expressão geral da
distribuição Binomial
x
Exemplo 7.1
Uma moeda não viciada é lançada 8 vezes. Encontre a probabilidade de:
a) dar 5 caras;
b) pelo menos uma cara;
c) no máximo 2 caras.
Solução: Utilizando o modela da distribuição binomial temos:
a) x = sair cara, p = 0,5 (probabilidade do sucesso de X), q = 0,5 (probabilidade do fracasso
de X0, n = 8 (número de repetições do evento).
8! 40320
P( X = 5) = .0,5 5.0,58−5 = .0,58 = 0,21875 = 21,88%
5!(8 − 5)! 120.6
3. Distribuição de Poisson
Exemplo 7.2
Em média, são feitas 2 chamadas por hora para certo telefone. Calcular a probabilidade de
se receber no máximo 3 chamadas em 2 horas e a probabilidade de nenhuma chamada em
90 minutos.
Solução: No exemplo acima temos uma média de acontecimento por intervalo de tempo, por
isto vamos utilizar a Distribuição de Poisson para calcular a Probabilidade pedida.
λ = 2 por hora, para 2 horas λ= 4 (é proporcional ou seja se λ= 2 para uma hora, para 2 ho-
ras λ = 4)
x= número de chamadas
Pede-se para calcular a probabilidade de no máximo 3 chamadas, ou seja estamos queren-
do os valores de x menores que 3
Figura 7.1. Probabilidade como área sob a curva entre dois pontos
P(a<X<b)
a b
∫ f ( x ) dx = 1
caracterizará uma v.a. contínua.
Dada a v.a. contínua X, assumindo os valores no intervalo entre a e b, chamamos valor mé-
dio ou esperança matemática de X ao valor
b
E ( X ) = ∫ x ⋅ f ( x ) dx
a
e de desvio padrão de X a
DP ( X ) = Var ( X )
Se X é uma v.a. contínua com f.d.p. f(x), definimos a sua função de distribuição acumulada
F(x) como:
1. Distribuição Normal
1 ( x − µ) 2
exp − −∞ < x < ∞
2σ
f(x) =
σ 2π
2
Como se pode observar por meio da equação acima, a distribuição normal inclui os parâ-
metros µ e σ, os quais possuem os seguintes significados:
µ: posição central da distribuição (média, µx)
σ: dispersão da distribuição (desvio padrão, σx)
Se uma variável aleatória X tem distribuição normal com média µ e variância σ2, escre-
vemos: X ∼ N(µ,σ2)
A figura 7.2 ilustra uma curva normal típica, com seus parâmetros descritos graficamente.
f(x)
σ
µ: média
σ: desvio padrão
µ x
Distribuições normais com o mesmo desvio padrão e médias diferentes possuem a mesma
dispersão, mas diferem quanto à localização. Quanto maior a média, mais à direita está a
curva. A figura 7.4 ilustra o fato, onde a curva A possui média maior que a curva B(µA > µB).
Figura 7.3. Distribuições normais com mesma média e desvios padrão diferentes
B
A
Figura 7.4. Distribuições normais com mesmo desvio padrão e médias diferentes
B A
µB µA
99.73 %
95.46 %
68.26 %
Portanto, 68,26% dos valores populacionais caem entre os limites definidos como média
mais ou menos um desvio padrão (µ ± 1σ); 95,46% dos valores caem entre média mais ou
menos dois desvios padrão (µ ± 2σ); e 99,73% dos valores caem entre média mais ou me-
nos três desvios padrão (µ ± 3σ).
terá uma distribuição N(0,1). Essa transformação é ilustrada pela figura 7.6:
X
µ-3σ µ-σ µ µ+σ µ+3σ
µ-2σ µ+2σ
X-µ
σ
Z
-3 -2 -1 0 1 2 3
Exemplo 7.3
Extrudados tubulares possuem tensão de escoamento (tensão a partir da qual o material se
deforma plasticamente), que segue uma distribuição normal com média de 210 MPa com
desvio padrão de 5 MPa. Em notação estatística, X ∼ N(210,52). É desejado que tais extru-
dados tenham tensão de escoamento de pelo menos 200 MPa. Portanto, a probabilidade do
extrudado não atingir a especificação desejada é:
200 − 210
Solução: P(X < 200) = P Z < 5
= P(Z < –2).
P(X<200)
X
180 190 200 210 220 230 240
P(Z<-2)
Z
-6 -4 -2 0 2 4 6
-z z
Definições
AMOSTRAS ESTIMADORES: θ’
Distribuição Amostral
Considere todas as possíveis amostras de tamanho n que podem ser extraídas de determi-
nada população. Se para cada uma delas se calcular um valor do estimador, tem-se uma
distribuição amostral desse estimador. Como o estimador é uma variável aleatória, pode-se
determinar suas características, isto é, encontrar sua média, variância, desvio-padrão.
As distribuições amostrais são fundamentais para o processo de inferência estatística.
Teorema 1 – A média da distribuição amostral das médias, denotada por µ(x’), é igual à
média populacional µ.
E (x’) = µ(x’) = µ
Assim, é provado que a média das médias amostrais é igual à média populacional.
σ 2
VAR ( x ' ) = σ 2
x' =
n
σ2 N −n
σ ( x' ) =
2
n N −1
σ N −n
σ x' =
E o desvio padrão
n N −1
Sendo que: µ (x’) = µ
Teorema 4 – Se a população tem ou não distribuição normal com média µ e variância σ2,
então a distribuição das médias amostrais será normalmente distribuída com média µ e va-
σ2
riância .
n
Esses quatro teoremas provam que a média amostral (x’) tem distribuição normal com mé-
σ2
dia igual à média da população (µ) e variância dada por para populações infinitas, as-
n
σ2 N −n
sim como para populações finitas. Ou, ainda:
n N −1
σ2 σ2 N − n σ N
x' ≈ N µ ; ou x' ≈ N µ ; µ ≈
;'x
N
n n N − 1 N
com distribuições padronizadas dadas por:
xi − µ xi − µ
Zi = Zi =
σ ou σ N −n
n n N − 1
Para população infinita Para população finita
Exemplo 8.1
Temos uma população de 5000 alunos de uma faculdade. Sabemos que a altura média dos
alunos é de 175 cm e o desvio padrão, de 5 cm. Retiramos uma amostra sem reposição, de
tamanho n = 100. Qual o valor do desvio padrão amostral?
8.2. Estimação
Há dois tipos fundamentais de estimação: por ponto e por intervalo.
Estimação pontual
O problema da estimação pontual surge quando estamos interessados em alguma caracte-
rística numérica de uma distribuição desconhecida (ex: média, variância) e desejamos calcu-
lar, a partir de observações, um número que inferimos que seja uma aproximação da carac-
terística numérica em questão.
Para ilustrar alguns dos problemas com os quais nos deparamos quando estimamos a mé-
dia de uma população com base em dados amostrais, vamos recorrer a um estudo em que
planejadores industriais procuraram determinar o tempo médio que um adulto leva para
montar um robô “fácil de montar”. Com uma amostra aleatória obtém-se os seguintes dados
(em minutos) para 36 pessoas que montaram o robô:
17 13 18 19 17 21 29 22 16 28
21 15 26 23 24 20 8 17 17 21
32 18 25 22 16 10 20 22 19 14
30 22 12 24 28 11
A média desta amostra é x’ = 19,9 minutos. Na ausência de qualquer outra informação, po-
demos tomar esta cifra como uma estimativa de µ, o “verdadeiro” tempo médio que um adul-
to leva para montar o robô.
Esse tipo de estimativa é chamada estimativa pontual, pois consiste de um único número,
ou um único ponto na escala dos números reais. Embora se trate da forma mais comum de
expressar estimativas, ela deixa margem para não poucas questões. Por exemplo, não nos
diz em quantas informações a estimativa se baseia, nem tampouco nos informa sobre o ta-
manho possível do erro.
Intervalo de confiança (IC) para a média populacional (µ) quando a Variância (σ2) é
conhecida.
Como se sabe, o estimador de µ é x’. Também é conhecida a distribuição de probabilidade
de x’:
σ2
x' ≈ N µ ; para as populações infinitas,
n
σ 2 N − n
x' ≈ N µ ; para as populações finitas.
n N − 1
Ou seja: P − Z α ≤ Z ≤ Z α = 1−α
2 2
Substituindo-se o valor de Z, tem-se: P − Z ≤ x'− µ ≤ Z = 1−α
α
σ α
2 2
n
σ σ
P x'− Z α ≤ µ ≤ x'+ Z α = 1−α
2 n 2 n
Como poderá ser verificado, a aplicação da fórmula é extremamente simples. Fixa-se o valor
de 1 – α, ou (1 – α)100= %, e observa-se na tabela de distribuição normal padrão o valor
das abscissas que deixam α/2 em cada uma das caudas. Com os valores de x’ (média a-
mostral), σ=desvio padrão da população, que neste caso é conhecido, e n (tamanho da a-
mostra), constrói-se o intervalo.
Para o caso de populações finitas, usa-se a seguinte fórmula:
σ N −n σ N −n
P x'− Z α ≤ µ ≤ x'+ Z α = 1−α
2 n N −1 2 n N − 1
Solução:
σ = 5; n = 100 x’ = 500 (1 – α)100=95%
o gráfico da distribuição normal padrão será:
2,5%
95% 2,5%
-1,96 1,96
lembre-se que para descobrir a abscissa 1,96, entrou-se na tabela de distribuição normal
padronizada com o valor 0,475 = 47,5, já que a tabela é de faixa central.
Substituindo na fórmula:
σ σ
P x'− Z α ≤ µ ≤ x'+ Z α = 1−α
2 n 2 n
5 5
P 500 − 1,96 ≤ µ ≤ 500 + 1,96 = 95%
100 100
Testamos hipóteses para tomarmos uma decisão entre duas alternativas. Por essa razão, o
Teste de Hipótese é um Processo de Decisão Estatística.
Tipos de Hipótese – Designa-se por H0, chamada hipótese nula, a hipótese estatística a ser
testada, e por H1 a hipótese alternativa. A hipótese nula expressa uma igualdade, enquanto
a hipótese alternativa é dada por uma desigualdade.
Exemplo 8.3
H 0 : µ = 1,65m
para testes bilaterais (dá origem a um teste bicaudal)
H 1 : µ ≠ 1,65m
H 0 : µ = 1,65m
para testes unilaterais à direita (dá origem a um teste unilateral à direita)
H 1 : µ > 1,65m
H 0 : µ = 1,65m
para testes unilaterais à esquerda (dá origem a um teste unicaudal à esquerda)
H 1 : µ < 1,65m
Calcula-se com o valor do parâmetro θ0, dado por H0, o valor crítico, valor observado na
amostra ou valor calculado (Vcalc);
Fixa-se duas regiões: uma de não rejeição de H0 (RNR) e uma de rejeição de H0 ou críti-
ca (RC) para o valor calculado, ao nível de risco dado;
Se o valor observado (Vcalc) ∈ Região de Não Rejeição, a decisão é a de não rejeitar H0;
Se Vcalc ∈ Região Crítica, a decisão é a de rejeitar H0.
Devemos observar que quando se fixa α, determinamos para os testes bilaterais, por exem-
plo, valores críticos (tabelados), Vα, tais que:
P(|Vcalc| ≥ Vα)= α → RC
De uma população normal com variância 36, toma–se uma amostra casual de tamanho 16,
obtendo-se x’=43. Ao nível de 10%, testar as hipóteses:
H 0 : µ = 45
H1 : µ ≠ 45
Solução: Como o teste é para média de populações normais com variância conhecida, usa-
remos a variável Z: N(0,1) como critério.
x '− µ H 0 σ
Z= σ x' =
σx '
´ n
Zα=Z5%=1,64
P ( Z ≥ Zα ) = α → P ( Z ≥ 1,64) = 0,10
Como Zcalc=–1,33
Temos que Zcalc ∈ RNR
Logo, a decisão é não rejeitarmos H0, isto é, a média é de 45, com 10% de risco de não re-
jeitarmos uma hipótese falsa.
H 0 : µ = 26
H1 : µ < 26
∴Zcalc ∈ RNR
Não se rejeita H0, isto é, ao nível de 5% podemos concluir que a afirmação do fabricante é
falsa.
H 0 : µ = 206
H1 : µ > 206
∴RNR=(–∞; 1,28)
∴Zcalc ∈ RC
Como Zcalc > Zα, rejeita-se H0, isto é, ao nível de 10% o fabricante pode concluir que a resis-
tência média de suas lajotas aumentou.
Erros de Decisão
Tipos de Erro – Há dois tipos possíveis de erro ao testar uma hipótese estatística. Pode-se
rejeitar uma hipótese quando ela é, de fato, verdadeira, ou aceitar uma hipótese quando ela
é, de fato, falsa. A rejeição de uma hipótese verdadeira é chamada “erro tipo I”. A aceitação
de uma hipótese falsa constitui um “erro tipo II”.
As probabilidades desses dois tipos de erros são designadas, respectivamente, por α e β.
A probabilidade α do erro tipo I é denominada “nível de significância” do teste.
Realidade
H0 verdadeira H0 falsa
Observe que o erro tipo I só poderá ser cometido se, se rejeitar H0; e o erro do tipo II, quan-
do se aceitar H0.
O objetivo, obviamente, é reduzir ao mínimo as probabilidades dos dois tipos de erros. Infe-
lizmente, essa é uma tarefa difícil porque, para uma amostra de determinado tamanho, a
probabilidade de se incorrer em um erro tipo II aumenta à medida que diminui a probabilida-
de do erro I. E vice-versa. A redução simultânea dos erros poderá ser alcançada pelo au-
mento do tamanho da amostra.
Em muitas situações, torna-se interessante e útil estabelecer uma relação entre duas
ou mais variáveis. A matemática estabelece vários tipos de relações entre variáveis,
por exemplo, as relações funcionais e as correlações.
Relações Funcionais
São relações matemáticas expressas por sentenças matemáticas, cujos exemplos apresen-
tamos a seguir:
Área do retângulo (A=a.b) é a relação entre os lados do retângulo;
São relações estabelecidas após uma pesquisa. Com base nos resultados da pesquisa, são
feitas comparações que eventualmente podem conduzir (ou não) à ligação entre as variá-
veis.
Exemplo: relação entre a idade e a estatura de uma criança, ou a relação entre a classe
social de uma pessoa e o número de viagens por ela realizado.
No estudo estatístico, a relação entre duas ou mais variáveis denomina-se correlação. A
utilidade e importância das correlações entre duas variáveis podem conduzir à descoberta
de novos métodos, cujas estimativas são vitais em tomadas de decisões.
100 18
90 16
80 14
70
12
60
10
50
8
40
30 6
20 4
10 2
0 0
0 1 2 3 4 5 6 0 1 2 3 4 5
25 100
90
20 80
70
15 60
50
10 40
30
5 20
10
0 0
0 1 2 3 4 5 6 0 1 2 3 4 5 6
8,5 18
8 16
14
7,5
12
7 10
6,5 8
6
6
4
5,5 2
5 0
0 2 4 6 8 10 12 14 0 1 2 3 4 5
n∑ xi yi − (∑ xi )(∑ yi )
r=
[n∑ x 2
i
2
][
− (∑ xi ) * n∑ yi2 − (∑ yi )
2
]
Temos
r = o coeficiente de Pearson
n = o número de observações
xi = variável independente
yi =variável dependente
O valor do coeficiente de correlação r tem a variação entre +1 e –1, ou seja, está limitado
entre os valores do Intervalo [–1,+1].
r = +1 (correlação positiva entre as variáveis);
r = – 1 (correlação perfeita negativa entre as variáveis);
r = 0 (não há correlação entre as variáveis ou, ainda, a correlação não é linear, caso exis-
ta).
Quanto mais próximo o valor de r estiver do valor “1”, mais forte a correlação linear.
Quanto mais próximo o valor de r estiver do valor “0”, mais fraca a correlação linear.
0< |r| <0,3: a correlação é fraca e fica difícil estabelecer relação entre as variáveis. Em
porcentagem: 0< |r| < 30%;
0,3 ≤ |r| < 0,6: a correlação é fraca, porém, podemos considerar a existência de relativa
correlação entre as variáveis. Em porcentagem: 30% ≤ |r| < 60%;
0,6 ≤ |r| <1: a correlação é de média para forte; a relação entre as variáveis é significati-
va, o que permite coerência com poucos conflitos na obtenção das conclusões. Em por-
centagem: 60% ≤ |r| ≤ 100 %.
Exemplo 9.1
Uma pesquisa pretende verificar se há correlação significativa entre o peso total do lixo des-
cartado, por dia, numa empresa com o peso do papel contido nesse lixo.
Hotel H1 H2 H3 H4 H5 H6 H7 H8 H9 H10
Peso total 10,47 19,85 21,25 24,36 27,38 58,09 33,61 35,75 38,33 49,14
Peso do papel 2,43 5,12 6,88 6,22 8,84 8,76 7,54 8,47 9,55 11,43
14
12
10
Peso do papel
0
10 20 30 40 50 60 70
Peso total do lixo
n∑ xi yi − (∑ xi )( yi )
r=
[n∑ x 2
i
2
][
− (∑ xi ) * n∑ yi2 − (∑ yi )
2
]
Peso total (xi) Peso papel (yi) xi yi xi2 yi2
n ∑ xi yi − (∑ xi )(∑ yi )
r=
[n∑ x 2
i
2
][
− (∑ xi ) * n ∑ yi2 − (∑ yi )
2
]
10 * 2396,68 − 288,21 * 75,24
r=
[10 * 9377,52 − ( 288,21) 2 ] * [10 * 623,47 − (75,24) 2 ]
23966,8 − 21684,9 2281,83 2281,83
r= = = = 0,9206
[93775,2 − 83065] * [6234,7 - 5661,1] 10 710,21 * 573,59 2478,57
r = 0,921 ou r = 92,1%
Observamos, assim: 0,6 ≤ r ≤ 1 . Esse resultado indica que há uma forte correlação entre
as variáveis ou, ainda, que a correlação entre as duas variáveis é bastante significativa.
Nesse caso, podemos concluir haver coerência na afirmação de que existe correlação entre
o peso total do lixo descartado e o peso do papel contido nesse lixo.
X é a variável independente
Y → Y” é a variável dependente; na verdade, é a variável correlacionada com a variável X e
sobre a qual se obtém um valor estimado.
Esse tipo de notação, de Y para Y’, caracteriza que não se trata de uma relação funcional
para a determinação da reta, e sim de uma relação estatística, em que a distribuição está
baseada em estimativas de dados colhidos por amostragem.
Sendo a e b os parâmetros de equação da reta, esses podem ser calculados por meio das
fórmulas:
n ∑ xi yi − ∑ xi * ∑ yi
a= b = y − ax
n ∑ xi2 − (∑ xi ) 2
Sendo:
n = número de observações dos dados amostrais
Exemplo 9.2
Determine a equação da reta de regressão do exemplo anterior, que trata de uma pesquisa
entre o peso total do lixo descartado por dia com o peso do papel contido nesse lixo.
Para a obtenção da equação da reta de regressão, elabora-se inicialmente uma tabela con-
tendo nas colunas as variáveis dependentes (yi), as independentes (xi) e os produtos xiyi e
xi2.
2281,83
a= = 0,213
10710,2
Para o traçado de uma reta, basta que se conheça dois de seus pontos. Assim, com base
na equação da reta acima, pode-se estabelecer dois pontos para X e Y’.
14
y = 0,2131x + 1,3836
12
10
0
0 10 20 30 40 50 60
COLUNA 1 5 9 13 17 21 25 29 33 37 41 45 49
LINHA
01 9486 9821 6074 1432 0995 0157 0071 9871 6678 0140 9522 0995 1735
02 3155 9878 3359 8244 8952 0084 1558 4775 1699 1652 2555 4765 2709
03 6136 2824 6030 4256 3870 5725 2204 5318 8337 3867 6184 2018 3522
04 7249 9182 8669 7423 1768 8147 7285 8390 9134 9863 9486 9821 6074
05 0071 9871 6678 0140 9522 0995 1735 1248 9807 1910 3155 9878 3359
06 1558 4775 1699 1652 2555 4765 2709 0561 4397 1135 6136 2824 6030
07 2204 5318 8337 3867 6184 2018 3522 0941 5569 5800 7249 9182 8669
08 7285 8390 9134 9863 9486 9821 6074 1432 0995 0157 0071 9871 6678
09 1735 1248 9807 1910 3155 9878 3359 8244 8952 0084 1558 4775 1699
10 2709 0561 4397 1135 6136 2824 6030 4256 3870 5725 2204 5318 8337
11 3522 0941 5569 5800 7249 9182 8669 7423 1768 8147 7285 8390 9134
12 6074 1432 0995 0157 0071 9871 6678 0140 9522 0995 1735 1248 9807
13 3359 8244 8952 0084 1558 4775 1699 1652 2555 4765 2709 0561 4397
14 6030 4256 3870 5725 2204 2318 8337 3867 6184 2018 3522 0941 5569
15 8669 7423 1768 8147 7285 8390 9134 9863 9486 9821 6074 1432 0995
16 6678 0140 9522 0995 1735 1248 9807 1910 3155 9878 3359 8244 8952
17 1699 1652 2555 4765 2709 0561 4397 1135 6136 2824 6030 4256 3870
18 8337 3867 6184 2018 3522 0941 5569 5800 7249 9182 8669 7423 1768
19 9134 9863 9486 9821 6074 1432 0995 0157 0071 9871 6678 0140 9522
20 9807 1910 3155 9878 3359 8244 8952 0084 1558 4775 1699 1652 2555
21 4397 1135 6136 2824 6030 4256 3870 5725 2204 5318 8337 3867 6184
22 5569 5800 7249 9182 8669 7423 1768 8147 7285 8390 9134 9863 8486
23 0995 0157 0071 9871 6678 0140 9522 0995 1735 1248 9807 1910 3155
24 8952 0084 1558 4775 1699 1652 2555 4765 2709 0568 4397 1135 6136
25 3870 5725 2204 5318 8337 3867 6184 2018 3522 0941 5569 5800 7249
26 7425 3566 6151 4731 6489 2491 2765 8525 7849 1488 8833 2597 1333
27 8961 8175 0879 6945 8029 9119 5990 1063 9444 8320 1740 6131 9907
28 3298 6173 1741 3874 9321 3748 7507 0170 0568 9112 1275 0924 3054
29 2276 4898 2394 1098 4063 5393 0226 8144 4778 7471 1764 4939 8063
30 9557 8114 1576 9767 1486 7161 5606 6295 3503 5050 9549 2500 9666
31 8650 1920 2533 7755 5324 3731 3414 2153 3815 0626 5718 8679 6801
32 2885 8101 1467 0080 7962 5999 9562 5819 1562 6793 2065 0239 8253
33 1841 8626 0344 4344 7446 0867 6157 8935 4413 2363 7187 8980 2488
34 4638 8030 0018 7760 9819 4276 0650 3516 5159 9236 3257 1694 7157
35 1320 7033 1218 5605 4206 2878 0230 1740 4553 8729 5827 7176 8703
36 1488 5803 6790 9368 0465 4819 0065 7633 3950 2109 7027 5824 5057
37 4353 4347 8565 2231 8789 4231 2585 0157 2037 7835 1320 8999 9181
38 7816 5817 9764 8789 7387 2172 0896 1038 6047 9539 3510 1343 8098
39 8600 9738 5415 8426 7152 8705 5829 0164 8330 9152 6045 8129 2293
40 1057 1550 8773 3003 4302 4034 2478 1078 0429 7189 0778 3260 5969
Distribuição Normal
Z 0 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
0,00 0,0000 0,0040 0,0080 0,0120 0,0160 0,0199 0,0239 0,0279 0,0319 0,0359
0,10 0,0398 0,0438 0,0478 0,0517 0,0557 0,0596 0,0636 0,0675 0,0714 0,0753
0,20 0,0793 0,0832 0,0871 0,0910 0,0948 0,0987 0,1026 0,1064 0,1103 0,1141
0,30 0,1179 0,1217 0,1255 0,1293 0,1331 0,1368 0,1406 0,1443 0,1480 0,1517
0,40 0,1554 0,1591 0,1628 0,1664 0,1700 0,1736 0,1772 0,1808 0,1844 0,1879
0,50 0,1915 0,1950 0,1985 0,2019 0,2054 0,2088 0,2123 0,2157 0,2190 0,2224
0,60 0,2257 0,2291 0,2324 0,2357 0,2389 0,2422 0,2454 0,2486 0,2517 0,2549
0,70 0,2580 0,2611 0,2642 0,2673 0,2704 0,2734 0,2764 0,2794 0,2823 0,2852
0,80 0,2881 0,2910 0,2939 0,2967 0,2995 0,3023 0,3051 0,3078 0,3106 0,3133
0,90 0,3159 0,3186 0,3212 0,3238 0,3264 0,3289 0,3315 0,3340 0,3365 0,3389
1,00 0,3413 0,3438 0,3461 0,3485 0,3508 0,3531 0,3554 0,3577 0,3599 0,3621
1,10 0,3643 0,3665 0,3686 0,3708 0,3729 0,3749 0,3770 0,3790 0,3810 0,3830
1,20 0,3849 0,3869 0,3888 0,3907 0,3925 0,3944 0,3962 0,3980 0,3997 0,4015
1,30 0,4032 0,4049 0,4066 0,4082 0,4099 0,4115 0,4131 0,4147 0,4162 0,4177
1,40 0,4192 0,4207 0,4222 0,4236 0,4251 0,4265 0,4279 0,4292 0,4306 0,4319
1,50 0,4332 0,4345 0,4357 0,4370 0,4382 0,4394 0,4406 0,4418 0,4429 0,4441
1,60 0,4452 0,4463 0,4474 0,4484 0,4495 0,4505 0,4515 0,4525 0,4535 0,4545
1,70 0,4554 0,4564 0,4573 0,4582 0,4591 0,4599 0,4608 0,4616 0,4625 0,4633
1,80 0,4641 0,4649 0,4656 0,4664 0,4671 0,4678 0,4686 0,4693 0,4699 0,4706
1,90 0,4713 0,4719 0,4726 0,4732 0,4738 0,4744 0,4750 0,4756 0,4761 0,4767
2,00 0,4772 0,4778 0,4783 0,4788 0,4793 0,4798 0,4803 0,4808 0,4812 0,4817
2,10 0,4821 0,4826 0,4830 0,4834 0,4838 0,4842 0,4846 0,4850 0,4854 0,4857
2,20 0,4861 0,4864 0,4868 0,4871 0,4875 0,4878 0,4881 0,4884 0,4887 0,4890
2,30 0,4893 0,4896 0,4898 0,4901 0,4904 0,4906 0,4909 0,4911 0,4913 0,4916
2,40 0,4918 0,4920 0,4922 0,4925 0,4927 0,4929 0,4931 0,4932 0,4934 0,4936
2,50 0,4938 0,4940 0,4941 0,4943 0,4945 0,4946 0,4948 0,4949 0,4951 0,4952
2,60 0,4953 0,4955 0,4956 0,4957 0,4959 0,4960 0,4961 0,4962 0,4963 0,4964
2,70 0,4965 0,4966 0,4967 0,4968 0,4969 0,4970 0,4971 0,4972 0,4973 0,4974
2,80 0,4974 0,4975 0,4976 0,4977 0,4977 0,4978 0,4979 0,4979 0,4980 0,4981
2,90 0,4981 0,4982 0,4982 0,4983 0,4984 0,4984 0,4985 0,4985 0,4986 0,4986
3,00 0,4987 0,4987 0,4987 0,4988 0,4988 0,4989 0,4989 0,4989 0,4990 0,4990
3,10 0,4990 0,4991 0,4991 0,4991 0,4992 0,4992 0,4992 0,4992 0,4993 0,4993
3,20 0,4993 0,4993 0,4994 0,4994 0,4994 0,4994 0,4994 0,4995 0,4995 0,4995
3,30 0,4995 0,4995 0,4995 0,4996 0,4996 0,4996 0,4996 0,4996 0,4996 0,4997
3,40 0,4997 0,4997 0,4997 0,4997 0,4997 0,4997 0,4997 0,4997 0,4997 0,4998
3,50 0,4998 0,4998 0,4998 0,4998 0,4998 0,4998 0,4998 0,4998 0,4998 0,4998
3,60 0,4998 0,4998 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999
3,70 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999
3,80 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999
3,90 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000
1.2. Quando o primeiro algarismo a ser abandonado é 6,7,8, ou 9, aumenta-se de uma uni-
dade ao algarismo a permanecer.
Ex: 43,67 passa a 53,7 ; 63,19 passa a 63,2 ; 87,99 passa a 88,0
Obs.: Não devemos nunca fazer arredondamento sucessivos. Exemplo: 17,3452 passa a
17,3 e não para 17,35 e depois para 17,4.
Porcentagem são razões em que um valor total está associado a uma quantidade de 100%
e, pro meio de uma regra de três, podemos estabelecer a correspondência entre uma parce-
la do valor total e seu valor percentual.
Total → 100 %
Parcela → x%
Exemplo: a afirmação de que ente os principais mercados emissores de turistas para o Bra-
sil (em 1998) encontra-se a Argentina, com 31%, significa que a cada 100 turistas que en-
tram no Brasil 31 são argentinos. Se entrarem 1200 turistas no Brasil, qual a estimativa so-
bre a quantidade de argentinos?
Cenário
Joana trabalha em uma companhia aérea. Por responder pelo SAC (suporte de atendimento
ao consumidor), o diretor de sua área solicitou-lhe que elaborasse um estudo comparativo
dos serviços prestados pela empresa com os similares da concorrência. Joana decidiu in-
vestigar os passageiros de três companhias aéreas – usuários de vôos locais desembarca-
dos em Guarulhos. Para definir e levantar as informações mais relevantes para seu estudo,
ela compõe um questionário no qual indaga sobre a qualidade de alguns dos serviços ofere-
cidos pelas empresas de aviação em geral – como alimentação de bordo, atendimento no
check-in, trabalho das comissárias, pontualidade de vôo etc. Os entrevistados expressaram
seu grau de satisfação com as empresas pelas quais viajaram conferindo-lhes notas entre 0
e 10. Os 132 passageiros entrevistados (36 da Cia. A, 57 da B e 39 da C) atribuíram às res-
pectivas empresas os graus de satisfação expressos no Quadro 3.1.
4,4 4,5 4,6 4,7 4,8 4,8 4,9 4,9 5,0 5,0 5,1 5,1
Cia. A
5,2 5,2 5,2 5,3 5,3 5,3 5,3 5,3 5,4 5,4 5,4 5,4
5,5 5,5 5,6 5,6 5,7 5,8 5,8 5,9 6,0 6,1 6,2 6,3
3,1 3,1 3,2 3,2 3,3 3,3 3,4 3,5 3,5 3,6 3,6 3,7
Cia. B 3,7 3,8 3,8 3,9 3,9 3,9 4,0 4,0 4,0 4,0 4,1 4,1
4,1 4,2 4,2 4,3 4,3 4,4 4,4 4,5 4,5 4,5 4,6 4,6
4,6 4,7 4,7 4,7 4,7 4,8 4,8 4,9 4,9 5,0 5,0 5,1
3,7 3,8 3,9 3,9 4,0 4,0 4,1 4,1 4,2 4,2 4,3 4,3
Cia. C
4,3 4,4 4,4 4,4 4,5 4,5 4,5 4,6 4,6 4,6 4,7 4,7
4,7 4,7 4,8 4,8 4,8 4,8 4,8 4,9 4,9 4,9 4,9 5,0
Joana precisa resumir esses dados antes de apresentá-los à sua diretoria. O resumo deve
lhe dar o máximo de informação e possibilitar-lhe a comparação das empresas. Primeiro
Joana pode resumir as notas em tabelas de distribuição de freqüências simples e acumula-
Descrevendo Dados
Apesar de em geral uma imagem valer por mil palavras, também é útil encontrar números
que descrevam os conjuntos de dados, uma vez que os gráficos podem ser afetados pela
escala adotada e, ainda que permitam boa visualização do conjunto de dados, sua interpre-
tação tende a ser quase sempre subjetiva. Além disso, alguns descritores numéricos deter-
minados de dados amostrais permitem inferir propriedades e parâmetros populacionais.
Os dados são coletados da própria população ou de suas amostras. As medidas descritivas
calculadas a partir daí são chamadas respectivamente estatísticas ou parâmetros.
Para a maioria das situações verificadas no cotidiano de uma empresa bastam, como medi-
das de centro, a média aritmética, a mediana e a moda.
Média Aritmética
Para fins de cálculo, entende-se média aritmética como a soma dos valores de um conjunto
de dados dividida pelo número de itens avaliados.
Populacional Amostral
∑x ∑x
µ= x=
N n
x f xf
. . .
. . .
. . .
Total ∑ f = N (ou n) ∑ xf
Uma conclusão possível de se extrair das notas médias atribuídas às companhias é que o
atendimento que a Cia. A presta a seus clientes parece ser melhor que os das empresas B e
C.
Cliente A B C D E F G H I J
Tempo (min) 59,3 58,6 62,7 65,4 59,0 67,3 62,8 68,1 59,4 63,7
Dos valores registrados infere-se o tempo médio de ocupação dos quartos. A média é dada
por:
59,3 + 58,6 + 62,7 + 65,4 + 59,0 + 67,3 + 62,8 + 68,1 + 59,4 + 63,7
x= = 62,63
10
Tal resultado indica que em média os clientes ocupam os quartos por pouco mais de uma
hora. Disso pode-se inferir facilmente que, se o hotel tem 20 quartos, e se cada um for ocu-
pado em média por duas pessoas, ele atenderá pouco menos de 40 pessoas por hora. Se a
despesa média por pessoa for de R$15,00, seu faturamento por hora estará um pouco abai-
xo de R$600,00.
Exemplo 3
O que ocorria com o tempo médio do hotel mencionado no Exemplo 2 se o cliente denotado
B tivesse ocupado o quarto por apenas dez minutos?
Calculando o tempo médio para a nova condição, tem-se:
59,3 + 10,0 + 62,7 + 65,4 + 59,0 + 67,3 + 62,8 + 68,1 + 59,4 + 63,7
x= = 57,77
10
A suposta “pressa” do cliente B faria a média cair de 62,63 minutos para 57,77. Grosso mo-
do, pode-se dizer que, nessa condição, a expressão um pouco abaixo teria de ser substituí-
da por um pouco acima!
Os resultados dos Exemplos 2 e 3 revelam uma propriedade da média aritmética que é: a
média aritmética sempre é afetada por todos os valores computados.
0
4,4 4,5 4,6 4,7 4,8 4,9 5 5,1 5,2 5,3 5,4 5,5 5,6 5,7 5,8 5,9 6 6,1 6,2
média = 5,319
Cia. Aérea B
4,5
4
3,5
3
2,5
2
1,5
1
0,5
0
1
7
3,
3,
3,
3,
3,
4,
4,
4,
4,
4,
5,
5,
5,
5,
média = 4,325
0
3,7 3,8 3,9 4 4,1 4,2 4,3 4,4 4,5 4,6 4,7 4,8 4,9 5 5,1
média = 4,508
Mediana
a. 32 32 35 36 36 37 38
38
39 39 39 40 40 45 46
b. 32 35 36 36 37 38
38 39
39 39 40 40 42 45
38 + 39
md = = 38,5
2
No item b, a disposição gráfica dos dados também permite visualizar que metade dos dados
é inferior à mediana, e metade, superiores a ela, isto é, metade dos valores é menor que
38,5, e metade é maior que 38,5.
Conforme mencionado, a mediana não é afetada pelos extremos do conjunto de dados. As-
sim, no item b do Exemplo 5, a eventual troca de 45 por 95 e de 32 por 13 não modifica a
mediana, que continua sendo md=38,5.
De suas análises, Joana constata que as medianas de satisfação das companhias A e B
estão próximas às respectivas médias de satisfação (5,3 e 4,3, respectivamente). Quanto à
mediana de satisfação da Cia. C, a figura 4 mostra estar ligeiramente acima da média (mé-
dia de 4,5 contra uma mediana de 4,6).
0
3,7 3,8 3,9 4 4,1 4,2 4,3 4,4 4,5 4,6 4,7 4,8 4,9 5 5,1
Moda
A moda, simbolizada por mo, é a mas simples das medidas de centro: é o valor mais fre-
qüente em uma distribuição, sendo simplesmente o que aparece em maior números de ve-
zes. Seu conceito está muito próximo da idéia de moda da linguagem vulgar, em que estar
na moda significa essencialmente vestir-se como a maioria.
Exemplo 6
Determine a moda da seguinte distribuição:
32 32 35 36 37 38 38 39 39 39 40 40 42 45
O valor que mais ocorre na distribuição é o 39 (aparece três vezes). Logo, a moda é igual a
39.
Por corresponder ao ponto mais alto, a moda é instantaneamente revelada pelos histogra-
mas e polígonos de freqüência das distribuições de dados.
Cia. Aérea A
6
0
4,4 4,5 4,6 4,7 4,8 4,9 5 5,1 5,2 5,3 5,4 5,5 5,6 5,7 5,8 5,9 6 6,1 6,2
moda = 5,3
Em geral, a moda é fácil de identificar. A dificuldade possível é que, para ela, vale tudo: po-
de não existir, pode ser única e pode ser múltipla. Inexiste quando ninguém se destaca,
quando todos os valores são igualmente comuns; é única quando há um elemento de des-
taque, o mais freqüente; é múltipla quando duas ou mais medidas se destacam igualmente,
mas de modo mais acentuado que as demais. Distribuições sem moda alguma são denomi-
nadas retangulares; as com uma moda apenas, unimodais, e as com várias modas, polimo-
dais.
Exemplo 8
Determine a moda da seguinte distribuição:
32 32 32 36 37 38 38 39 39 39 40 40 42 45
Há duas modas, 32 e 39 (esses valores ocorrem três vezes, e mais vezes que quaisquer
outros).
Cia. Aérea B
4,5
4
3,5
3
2,5
2
1,5
1
0,5
0
1
7
3,
3,
3,
3,
3,
4,
4,
4,
4,
4,
5,
5,
5,
5,
bimodal
Na distribuição das notas da Cia. B há duas modas, 4,0 e 4,7 (essas notas ocorrem quatro
vezes). Ou seja, essa distribuição, assim como a do Exemplo 8, é bimodal.
Exemplo 10
Tome a distribuição do Exemplo 9, mude o último valor de 45 para 55 e determine a moda e
a mediana.
32 32 35 36 37 38 38 39 39 39 40 40 42 55
A moda e a mediana do conjunto de dados assim composto são: mo = 39 e md = 38,5 (média
entre o sétimo e o oitavo elemento). Como a mudança proposta não alterou tais medidas de
centro, pode-se dizer que a moda e a mediana nem sempre são sensíveis a mudanças nos
valores individuais ou nos extremos da distribuição (a mediana é afetada quando se mudam
os termos centrais da distribuição; a moda se altera quando mudam as freqüências dos va-
lores que a definem).
A moda tem algumas propriedades úteis. Exemplo, sua determinação é rápida e fácil. É que,
como basta achar o valor mais freqüente, ela independe da ordenação dos valores, dos ex-
tremos da distribuição e de quaisquer de seus valores intermediários.
A média, a mediana e a moda trazem diferentes informações a respeito do centro dos con-
juntos de dados. Em relação à simetria da distribuição, sabe-se que:
nas distribuições simétricas, a média, a mediana e a moda apontam o mesmo valor;
Moda
Mediana
Média
Figura 8. Simetria: µ = md = mo
Moda
Mediana
Média
Medidas de Variabilidade
Embora dêem boa idéia das características dos dados sob análise, as medidas de tendência
central não informam completamente sobre o comportamento dos conjuntos de medidas.
Além de um número que tipifique o centro da distribuição, é importante ter alguma noção da
variabilidade ou flutuação das medidas.
Existem várias medidas que apontam o espalhamento dos dados em torno de determinado
valor. Para muitos propósitos bastam três medidas de dispersão: Amplitude, Variância e o
Desvio-Padrão.
Amplitude
Uma medida simples de dispersão é o intervalo ou amplitude dos dados. Por correspon-
der à diferença entre o maior e o menor valor observado, pode-se escrever:
A amplitude informa a distância entre os extremos dos dados ou de sua distribuição – ra-
zão pela qual costuma ser apresentada citando-se simplesmente o piso e o teto dos da-
dos. Medidas com essa característica têm a virtude de ser de fácil computação: não é
preciso tecer considerações sobre quaisquer outros elementos, está-se desobrigado de
determinar quem são eles, como se distribuem, qual o grau de concentração em torno de
algum ponto; o defeito natural dessa facilidade é abrir mão de informações relevantes,
como sobre o grau concentração ou espalhamento dos dados em torno de algum ponto.
Mas há casos particulares em que ela informa alguma coisa até sobre isso. Para distribu-
ições simétricas, por exemplo, a semiamplitude indica a distância máxima dos dados em
relação ao respectivo centro.
A amplitude cumpre bem seu papel quando aplicada a informações cujo fator relevante é
exatamente o extremo, como no caso das temperaturas diárias (mínima: 19 ºC; máxima:
27 ºC), de marés (baixa-mar: 0,1; preamar:1,6), durações dos dias (nascente: 06h46min;
poente: 19h54min) e estações do ano (verão: de 21-12 a 20-3; inverno: de 21-6 a 21-9).
Mas toda avaliação do espalhamento dos dados é útil, ao menos em uma primeira com-
paração de distintos conjuntos de dados. A comparação das amplitudes das companhias
aéreas avaliadas por Joana – Cia. A: 1,9; Cia. B:2,6; Cia. C:1,4 – sugere que o grau de
satisfação dos usuários da Cia. B é um pouco mais disperso que o apresentado pelos cli-
entes das demais empresas. Seu defeito é não levar em conta o número de observações.
Cliente 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
Tempo (min) 5,5 10,3 6,6 6,8 9,5 6,7 0,5 9,2 7,6 10,7 9,2 2,9 6,0 8,6 4,5
À primeira vista, pode-se supor que, sendo a dispersão do tempo de espera da ordem de
dez minutos, e sendo o maior valor igual a 10,7 minutos, os dados estão bem dispersos, que
o tempo de espera é bem variado. Todavia, um olhar mais atento mostra que há poucos
pequenos tempos de espera e que o piso dos dados está longe do segundo valor, ou seja,
0,5 fica muito afastado de 2,9. Na verdade, a maioria dos tempos de espera está entre cinco
e dez minutos., para um tempo médio de espera em torno de sete minutos.
Um modo razoável de medir a variabilidade dos dados é associá-la a alguma medida de
centro. Pode-se querer saber quanto em média os dados distam de um valor central típico.
Medidas com essa característica são a variância e o desvio-padrão.
Variância
A variância de um conjunto qualquer de dados é determinada pelo formulário a seguir:
Populacional Amostral
Populacional Amostral
Desvio-Padrão
A variância é uma medida com magnitude distinta da dos dados originais. Para que a
variabilidade seja comparável com os dados que a originam, deve-se expressá-la na
mesma unidade de medida. Isso resulta em uma nova medida de dispersão, dada pela
raiz quadrada positiva da variância. Essa nova medida, denominada desvio-padrão, é
assim definida:
Populacional Amostral
Amostra Com reposição – quando um elemento sorteado puder ser sorteado nova-
mente.
Amostra Sem reposição – quando o elemento sorteado só puder figurar uma única vez
na amostra.
Amostra por Conglomerado – é uma amostra aleatória simples na qual cada unidade
de amostragem é um grupo, ou um conglomerado de elementos.
Amostra Sistemática – é mais fácil de executar e, por isso, está menos sujeita a apre-
sentar erros cometidos pelo entrevistador, freqüentemente proporciona mais informações
por custo unitário.
Amplitude total (A) – é a diferença entre o maior e o menor valor da tabela de distri-
buição.
Área sob a Curva Normal – Área que está entre a curva e a reta-base contendo 100%
ou todos os casos em qualquer distribuição normal dada.
Correlação Curvilínea – Relação entre X e Y que começa como positiva (ou negativa) e
Desvio Padrão – Raiz quadrada da média dos quadrados dos desvios em relação à mé-
dia de uma distribuição. Medida de variabilidade que reflete o desvio típico a contar da
média.
Estatística: é uma medida numérica que descreve uma característica de uma amostra.
Freqüências Relativas Simples (fi) – são os valores das razões entre as freqüências
simples e o número total de dados.
Limite de Classe – Ponto a meio caminho entre intervalos de classe adjacentes que
serve para preencher a lacuna entre eles.
Média – Soma de um conjunto de escores dividida pelo número total no conjunto. É uma
medida de tendência central.
intervalos de classe.
Ponto Médio – o próprio nome indica, o ponto que divide o intervalo de classe em duas
partes iguais.
Variância – Média dos quadrados dos desvios em relação a média de uma distribuição.
Medida de variabilidade em uma distribuição.
BUSSAB, W.O. e Morettin, P.A. Estatística Básica. São Paulo: Atual, 1987.
FONSECA, J.S. e Martins, G.A. Curso de Estatística. São Paulo: Atlas, 1993.
LAPPONI, J.C. Estatística usando Excel 5 e 6. São Paulo: Lapponi Treinamento e Editora, 1997.
MORETTIN, L.G. Estatística Básica – Vol. 2 – Inferência. São Paulo: Makron Books, 1999.
MORETTIN, L.G. Estatística Básica – Vol.1 – Probabilidade. São Paulo: Makron Books, 1999.
TIBONI,C.G. R. Estatística Básica para o curso de Turismo. São Paulo: Atlas, 2002.
ATENDIMENTO E INFORMAÇÕES:
Telefone: (0xx31) 3238-5656
www.virtual.pucminas.br/faleconosco