Sie sind auf Seite 1von 80

Universidade Federal de Mato Grosso

Instituto de Cincias Exatas e da Terra


Departamento de Estatstica
Notas de aula de Estatstica - Geologia
Anderson Castro Soares de Oliveira
2011
SUMRIO
1 Introduo 4
1.1 Amostragem . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
1.1.1 Amostragem Simples . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
1.1.2 Amostragem Sistemtica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
1.1.3 Amostragem Estraticada . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
1.2 Mtodo Estatstico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
2 Estatstica Descritiva 9
2.1 Tipo de Variveis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
2.2 Grcos e Tabelas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
2.2.1 Variveis Qualitativas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
2.2.2 Variveis Quantitativas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
2.3 Somatrio . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
2.4 Medidas de Posio . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
2.4.1 Mdia Aritmtica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
2.4.2 Mediana . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
2.4.3 Moda . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
2.4.4 Simetria . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20
2.5 Exemplos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20
2.5.1 Variveis Quantitativas Discretas . . . . . . . . . . . . . . . . . . . . . . . . 20
2.5.1.1 Dados Originais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20
2.5.1.2 Dados Agrupados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
2.5.2 Variveis Quantitativas Contnuas . . . . . . . . . . . . . . . . . . . . . . . . 21
2.5.2.1 Dados Originais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
2.5.2.2 Dados Agrupados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22
2.6 Medidas de disperso . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
2.6.1 Amplitude Total . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
2.6.2 Varincia e Desvio Padro . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
2.6.3 Coeciente de Variao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
2.6.4 Erro Padro da Mdia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
2.7 Exemplos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26
2.7.1 Variveis Quantitativas Discretas . . . . . . . . . . . . . . . . . . . . . . . . 26
2.7.1.1 Dados Originais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26
2.7.1.2 Dados Agrupados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26
2.7.2 Variveis Quantitativas Contnuas . . . . . . . . . . . . . . . . . . . . . . . . 27
2.7.2.1 Dados Originais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
2.7.2.2 Dados Agrupados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
3 Noes de Probabilidade 30
3.1 Espao Amostral e Eventos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
3.1.1 Operao com eventos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
3.2 Probabilidade . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32
3.2.1 Probabilidade Condicional e Independncia de Eventos . . . . . . . . . . . . 33
3.2.2 rvores de probabilidade . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35
3.2.3 Varivel Aleatria . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36
3.3 Distribuies Discretas de Probabilidade . . . . . . . . . . . . . . . . . . . . . . . 38
3.3.1 Esperana Matemtica e Varincia de uma VAD . . . . . . . . . . . . . . . . 39
3.3.2 Distribuio Uniforme Discreta . . . . . . . . . . . . . . . . . . . . . . . . . 40
3.3.2.1 Parmetros Caractersticos da Distribuio Uniforme . . . . . . . . . 40
3.3.3 Distribuio Bernoulli . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40
3.3.3.1 Parmetros Caractersticos da Distribuio Uniforme . . . . . . . . . 41
3.3.4 Distribuio Binomial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41
3.3.4.1 Parmetros Caractersticos da Distribuio Binomial . . . . . . . . . 43
3.3.5 Distribuio de Poisson . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44
3.3.5.1 Parmetros Caractersticos da Distribuio de Poisson . . . . . . . . . 45
3.4 Distribuies Contnuas de Probabilidade . . . . . . . . . . . . . . . . . . . . . . . 46
3.4.1 Esperana Matemtica e Varincia de uma fdp . . . . . . . . . . . . . . . . 48
3.4.2 Distribuio Uniforme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49
3.4.2.1 Parmetros Caractersticos da Distribuio Uniforme . . . . . . . . . 50
3.4.3 Distribuio Normal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50
3.5 Distribuies Amostrais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55
3.5.1 Distribuio Amostral da Mdia (X) . . . . . . . . . . . . . . . . . . . . . . 55
3.5.1.1 Teorema do Limite Central (TLC) . . . . . . . . . . . . . . . . . . . . 55
3.5.1.2 Distribuio t de student . . . . . . . . . . . . . . . . . . . . . . . . . 56
3.5.2 Distribuio amostral para proporo . . . . . . . . . . . . . . . . . . . . . . 58
3.5.3 Distribuio Amostral da Varincia . . . . . . . . . . . . . . . . . . . . . . . 59
3.5.3.1 Distribuio Qui-Quadrado . . . . . . . . . . . . . . . . . . . . . . . . 59
3.5.3.2 Distribuio F . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59
4 Inferncia Estatstica 66
4.1 Estimao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66
4.1.1 Estimao Pontual . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67
4.1.2 Estimao Intervalar . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67
4.1.2.1 Intervalo de Conana para proporo p . . . . . . . . . . . . . . . . 67
4.1.2.2 Intervalo de Conana para mdia . . . . . . . . . . . . . . . . . . 68
4.1.2.3 Intervalo de Conana para varincia
2
e para o desvio padro . 70
4.2 Teoria da Deciso Estatstica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71
4.2.1 Teste de Hiptese . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71
4.2.2 Teste para uma nica mdia . . . . . . . . . . . . . . . . . . . . . . . . . . . 71
4.2.3 Teste de hipteses para propores . . . . . . . . . . . . . . . . . . . . . . . 73
4.2.4 Resumo das etapas aplicadas a qualquer teste de hipteses . . . . . . . . . 74
4.3 Regresso e Correlao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75
1
INTRODUO
Estatstica um conjunto de conceitos e mtodos cientcos para coleta, organizao, descri-
o, anlise e interpretao de dados experimentais, que permitem concluses vlidas e tomadas
de decises razoveis.
Classicao: Usualmente, a estatstica se divide em:
Estatstica descritiva - a parte que tem por objetivo organizar, apresentar e sintetizar
dados observados de determinada populao, sem pretenes de tirar concluses de carter
extensivo.
Teoria de probabilidade - objetiva descrever e prever as caractersticas de populaes in-
nitas
Inferncia Estatstica a parte que, baseando-se em estudos realizados sobre os dados de
uma amostra, procura inferir, induzir ou vericar leis de comportamento da populao da
qual a amostra foi retirada. A estatstica inferencial tem sua estrutura fundamentada na
teoria matemtica das probabilidades. , tambm denida como um conjunto de mtodos
para a tomada de decises.
No estudo da estatstica alguns conceitos so importantes:
Populao (N) - Conjunto de todos os elementos relativos a um determinado fenmeno que
possuem pelo menos uma caracterstica em comum, a populao o conjunto Universo.
Exemplos:
Todos os clientes de uma determinada empresa;
Todos os produtos fabricados em uma determinada empresa;
Amostra (n) - um subconjunto da populao e dever ser considerada nita, a amostra deve
ser selecionada seguindo certas regras e deve ser representativa, de modo que ela represente
todas as caractersticas da populao como se fosse uma fotograa desta.
Pesquisa Estatstica: qualquer informao retirada de uma populao ou amostra, po-
dendo ser atravs de Censo ou Amostragem
Censo - atividade de inspecionar (observar) todos os elementos de uma populao, objeti-
vando conhecer, com certeza suas caractersticas;
Introduo 5
Amostragem - o processo de retirada de informaes dos "n"elementos amostrais, no
qual deve seguir um mtodo criterioso e adequado (tipos de amostragem).
Figura 1.1: Representao de PopulaoAmostra
Dados estatsticos: qualquer caracterstica que possa ser observada ou medida de alguma
maneira. As matrias-primas da estatstica so os dados observveis.
Varivel: aquilo que se deseja observar para se tirar algum tipo de concluso, geralmente
as variveis para estudo so selecionadas por processos de amostragem. Os smbolos uti-
lizados para representar as variveis so as letras maisculas do alfabeto, tais como X, Y,
Z, ... que pode assumir qualquer valor de um conjunto de dados. As variveis podem ser
classicadas dos seguintes modos:
1.1 AMOSTRAGEM
Na realizao de qualquer estudo quase nunca possvel examinar todos os elementos da
populao de interesse. Temos usualmente de trabalhar com uma amostra da populao. A
inferncia estatstica nos d elementos para generalizar, de maneira segura, as concluses obtidas
da amostra para a populao.
errneo pensar que, caso tivssemos acesso a todos os elementos da populao, seramos
mais preciosos. Os erros de coleta e manuseio de um grande nmero de dados so maiores do
que as imprecises a que estamos sujeitos quando generalizamos, via inferncia, as concluses de
uma amostra bem selecionada.
Em se tratando de amostra, a preocupao central que ela seja representativa. Assim que
decidimos obter informaes atravs de um levantamento amostral, temos imediatamente dois
problemas:
Denir cuidadosamente a populao de interesse
Selecionar a caracterstica que iremos pesquisar.
Introduo 6
H duas grandes divises no processo de amostragem: a probabilstica e a no-probabilstica.
A amostragem probabilstica tambm chamada de amostragem aleatria ou ao acaso. Este
tipo de amostragem submetida a tratamento estatstico que permite compensar erros amostrais.
Hoje, dicilmente se aceita uma amostragem no-probabilistica, exceto nos casos em que a
amostragem probabilstica no pode ser feita.
A amostragem no-probabilstica, por no fazer uso de forma aleatria de seleo, no aceita
diversas aplicaes estatsticas e, por isto, preterida.
Pontos importantes:
muito dispendioso entrevistar cada pessoa de toda uma populao; recorremos, ento,
as amostras;
Usa-se a proporo de pessoas em uma amostra, portadoras de determinada caracterstica,
para estimar a proporo, na populao das que tem essa caracterstica.
O melhor mtodo de escolha de uma amostra a escolha aleatria, isto , que toda amostra
possvel tenha a mesma chance de ser escolhida.
Antes de se proceder a observao de uma determinada populao surge a questo se a
amostragem ser com ou sem reposio. Se o tamanho da amostra insignicante em
relao populao o impacto da reposio ser desprezvel, porm, se a amostra for
grande ento a reposio ou no pode causar um impacto signicativo no resultado da
probabilidade.
Como as caractersticas das populaes estatsticas variam, s vezes, necessrio se adequar
esta populao estatstica para submet-la a um critrio de seleo possvel, sem, contudo,
perder seu carter aleatrio.
1.1.1 Amostragem Simples
Objetivo: Obter uma amostra representativa quando os elementos da populao so todos
homogneos. Neste processo de amostragem todos os elementos da populao tm a mesma
probabilidade de serem amostrados. A caracterstica principal que todos os elementos da
populao tm igual probabilidade de pertencer amostra.
Procedimento: Na prtica a amostragem aleatria simples pode ser realizada numerando-se
a populao de 1 a N e sorteando-se, a seguir, por meio de um dispositivo aleatrio qualquer, k
nmeros dessa seqncia, os quais correspondero aos elementos pertencentes amostra.
Exemplo: Vamos obter uma amostra representativa, de 10% dos valores, para obtermos a
estatura mdia de noventa alunos de uma escola:
Numeramos os alunos de 01 a 90
Sorteamos os nmeros, de 01 a 90, um a um, nove nmeros que formaro a amostra.
1.1.2 Amostragem Sistemtica
Objetivo: Aumentar a representatividade da amostra dando maior cobertura populao.
usada quando todos os elementos so homogneos.
Introduo 7
Procedimento: Quando os elementos da populao j esto ordenados, no h necessidade
de construirmos um sistema de referncia, para selecionarmos a amostra. So exemplos os
pronturios mdicos de um hospital, os prdios de uma rua, uma linha de produo, os nomes
em uma lista telefnica, etc. Nestes casos a seleo dos elementos que constituiro a amostra pode
ser feita por um sistema imposto pelo pesquisador. A esse tipo de amostragem denominamos de
sistemtica.
Exemplo: Consideremos uma populao, com elementos ordenados, de tamanho N e dela
tiramos uma amostra de tamanho n, atravs de uma amostragem sistemtica, da seguinte ma-
neira:
Denimos FS como fator de sistematizao, dado por FS = N/n.
Sorteamos um nmero entre 1 e FS. Esse nmero simbolizado por m, que ser o primeiro
elemento da amostra.
O segundo elemento da amostra o de nmero FS +m.
O terceiro elemento da amostra o de nmero 2FS +m.
O k-simo elemento da amostra o nmero (k 1)FS +m
Exemplo: Uma rua contm 1000 prdios, dos quais desejamos obter uma amostra sistemtica
formada por 100 deles.
FS = 1000/100 = 10
m ser um nmero entre 1 e 10. Vamos supor que m = 7. Ento temos:
1
o
elemento da amostra = (1 1)10 + 7 = 7 > 7
o
elemento da populao.

.
.
.
100
o
elemento da amostra = (100 1)10 + 7 = 997 > 997
o
elemento da populao.
1.1.3 Amostragem Estraticada
Objetivo: Melhorar a representatividade da amostra quando os elementos da populao so
heterogneos, porm, podem ser agrupados em subpopulaes (ESTRATOS) contendo elementos
homogneos.
Procedimento: A populao dividida em grupos ou estratos contendo elementos homogneos
e as amostras so retiradas separadamente de cada um desses grupos.
Exemplo; Dada a populao de 50.000 operrios da indstria, selecionar uma amostra pro-
porcional estraticada de 5% de operrios para estimar seu salrio mdio. Usando a varivel
critrio "cargo"para estraticar essa populao, e considerando amostras de 5% de cada estrato
obtido, chegamos ao seguinte quadro:
1.2 MTODO ESTATSTICO
O Mtodo Estatstico pode ser descrito pelas etapas a seguir:
Introduo 8
CARGO POPULAO 5% AMOSTRA
Chefes de seo 5000 5(5000)/100 = 250 250
Operrios especializados 15000 5(15000)/100 = 750 750
Operrios no especializados 30000 5(30000)/100 = 1500 1500
TOTAL 50000 5(50000)/100 = 2500 2500
Denio do problema - Consiste na:
formulao correta do problema;
examinar outros levantamentos realizados no mesmo campo (reviso da literatura);
saber exatamente o que se pretende pesquisar denindo o problema corretamente
(variveis, populao, hipteses, etc.)
Planejamento -Determinar o procedimento necessrio para resolver o problema:
Como levantar informaes;
Tipos de levantamentos: Por Censo (completo); Por Amostragem (parcial).
Cronograma, Custos, etc.
Coleta da dados - Consiste na obteno dos dados referentes ao trabalho que desejamos
fazer.;
A coleta pode ser: Direta - diretamente da fonte ou Indireta - feita atravs de outras
fontes.
Os dados podem ser obtidos pela prpria pessoa (primrios) ou se baseia no registro
de terceiros (secundrios).
Apurao dos dados - Consiste em resumir os dados, atravs de uma contagem e agrupa-
mento. um trabalho de coordenao e de tabulao.
Apresentao dos dados - a fase em que vamos mostrar os resultados obtidos na coleta e
na organizao. Esta apresentao pode ser:
Tabular (apresentao numrica)
Grca (apresentao geomtrica)
Anlise e interpretao dos dados - a fase mais importante e tambm a mais delicada.
Tira concluses que auxiliam o pesquisador a resolver seu problema.
2
ESTATSTICA DESCRITIVA
A estatstica descritiva parte da estatstica que lida com a organizao, resumo e apresen-
tao de dados. Esta feita por meio de:
Tabelas;
Grcos;
Medidas Descritivas (mdia, varincia, entre outras).
2.1 TIPO DE VARIVEIS
As variveis podem ter valores numricos ou no numricos.
Variveis Qualitativas (ou categricas) - so as caractersticas que no possuem valores
quantitativos, mas, ao contrrio, so denidas por vrias categorias, ou seja, representam
uma classicao dos indivduos
Variveis nominais: no existe ordenao dentre as categorias.
Exemplos: sexo, cor dos olhos, fumante/no fumante, doente/sadio.
Variveis ordinais: existe uma ordenao entre as categorias.
Exemplos: escolaridade (1
o
, 2
o
, 3
o
graus), estgio da doena (inicial, intermedirio,
terminal), ms de observao (janeiro, fevereiro,..., dezembro).
Variveis Quantitativas - so as caractersticas que podem ser medidas em uma escala
quantitativa, ou seja, apresentam valores numricos
Variveis discretas: so aquelas variveis que pode assumir somente valores inteiros
num conjunto de valores. gerada pelo processo de contagem
Exemplos: nmero de lhos, nmero de empregados, nmero de processos.
Variveis contnuas: so aquelas variveis que podem assumir um valor dentro de um
intervalo de valores. gerada pelo processo de medio
Exemplos: presso arterial, idade, salrio, atraso de transmisso de bytes por uma
rede de internet.
Estatstica Descritiva 10
2.2 GRFICOS E TABELAS
2.2.1 Variveis Qualitativas
Para resumir dados qualitativos, utiliza-se contagens, propores, porcentagens, taxas por
1000, taxas por 1.000.000, etc, dependendo da escala apropriada. Por exemplo, se encontrar-
mos que 7 empresas com faturamento mensal acima de R$20.000,00 em uma amostra de 500
propriedades, poderamos expressar isto como uma proporo (0,014) ou percentual (1,4%).
Freqentemente o primeiro passo da descrio de dados criar uma tabela de frequncias.
Antes de montar a tabela de distribuio de frequncias temos algumas denies:
Frequncia - medida que quantica a ocorrncia dos valores de uma varivel a um dado
conjunto de dados. As frequncias podem ser:
Absoluta (fa) - contagem das observaes de uma varivel;
Relativa (fr) - diviso da frequncia absoluta pelo total de observaes
fr =
fa
n
Percentual (fp) - a frequncia relativa multiplicada por 100
fp = 100 fr
Exemplo:Para estudar a hidrodinmica foram coletadas 16 amostras no esturio de um de-
terminado rio, em que foram obtidos as seguintes variveis:
Tabela 2.1: Variveis observadas de 16 amostras no esturio de um determinado rio.
amostra Microoganismo Abundnciia amostra Microrganismo Abundnciia
1 Foraminferos Raro 9 Palinomorfos Frequente
2 Foraminferos Frequente 10 Palinomorfos Muito Frequente
3 Foraminferos Frequente 11 Tecamebas Raro
4 Foraminferos Frequente 12 Tecamebas Raro
5 Foraminferos Muito Frequente 13 Tecamebas Raro
6 Foraminferos Muito Frequente 14 Tecamebas Frequente
7 Palinomorfos Raro 15 Tecamebas Frequente
8 Palinomorfos Raro 16 Tecamebas Muito Frequente
Neste apresentado duas variveis qualitativas sendo:
Microrganismos - varivel qualitativa nominal;
Abundncia - varivel qualitativa ordinal.
Para resumir separadamente cada varivel podemos utilizar a tabelas simples, que so na
maioria das vezes sucientes para descrever dados qualitativos especialmente quando existem
poucas categorias.
Para a varivel Microrganismos , podemos utilizar as frequncias apresentadas na tabela 2.2:
Estatstica Descritiva 11
Tabela 2.2: Distribuio de frequncia de microrganismo de 16 amostras no esturio de um
determinado rio.
Microrganismo Frequncia Frequncia Frequncia
Absoluta Relativa Percentual
(fa) (fr) (fp)
Foraminferos 6 0,375 37,50%
Palinomorfos 4 0,250 25,00%
Tecamebas 6 0,375 37,50%
Total 16 1,000 100,00%
Para a varivel qualidade no atendimento, alm das frequncias utilizadas para a varivel
Microrganismos, podemos utilizar mais duas frequncias:
Frequncia Acumulada (FA)- obtida pelo soma das frequncias absolutas;
Frequncia Percentual Acumulada (FP) - obtida pela soma das frequncias percentuais.
Tabela 2.3: Distribuio de frequncia de abundncia de 16 amostras no esturio de um deter-
minado rio.
Abundncia Frequncia Frequncia Frequncia Frequncia Frequncia
Absoluta Relativa Percentual Acumulada Percentual
(fa) (fr) (fp) (FA) Acumulada
(FP)
Raro 6 0,375 37,50% 6 37,50%
Frequente 6 0,375 37,50% 12 75,00%
Muito Frequente 4 0,250 25,00% 16 100,00%
Total 16 1,000 100,00%
Dados qualitativos so usualmente bem ilustrados num simples grco de barras onde a altura
da barra igual frequncia. O grco na Figura 2.1 apresenta as frequncias percentuais da
Tabela 2.2.
Em alguns casos podemos estar interessados em resumir duas variveis qualitativas ao mesmo
tempo, neste caso vamos estudar a relao entre duas variveis qualitativas que pode ser repre-
sentada em uma tabulao cruzada. Nesta tabela conta-se quantos valores correspondem a cada
par de possveis resultados, para as duas variveis. O resultado pode ser apresentado como
frequncia absoluta ou relativa, em relao as colunas ou as linhas (nunca ambas).
Tabela 2.4: Distribuio de frequncia absoluta de 16 amostras no esturio de um determinado
rio de acordo com abundncia e o tipo de microrganismos
Microoganismo Abundncia
Raro Frequente Muito Frequente Total geral
Foraminferos 1 3 2 6
Palinomorfos 2 1 1 4
Tecamebas 3 2 1 6
Total geral 6 6 4 16
O grco de barras, com barras justapostas de acordo com categorias diferentes, pode ser
usado para apresentar a relao entre duas variveis qualitativas.
Estatstica Descritiva 12
Figura 2.1: Abundncia de microrganismos em 16 amostras no esturio de um determinado rio
Figura 2.2: Distribuio de frequncia absoluta de 16 amostras no esturio de um determinado
rio de acordo com abundncia e o tipo de microrganismos
2.2.2 Variveis Quantitativas
Da mesma forma que as variveis qualitativas, podemos resumir dados quantitativos por
meio de tabelas de frequncias, entretanto a distino entre as variveis quantitativas discretas
e contnuas na forma de preparao destas tabelas.
A tabela de distribuio de frequncias de uma varivel discreta , em geral bastante seme-
lhante das variveis qualitativas ordinais, pois os valores inteiros que a varivel assume podem
ser considerados como "categorias", ou "classes naturais".
Exemplo: Sejam dados referentes a um levantamento onde observou-se 20 rochas, nas quais
contou-se o nmero de minerais comuns encontrados em cada rocha.
Estatstica Descritiva 13
Tabela 2.5: Nmero de minerais comuns encontrados em 20 rochas.
2 3 5 6
2 4 5 6
2 4 5 7
2 5 5 7
2 5 5 7
Observa-se que a disposio da varivel nmero minerais comuns semelhante a de uma
varivel qualitativa ordinal com 6 categorias e sua distribuio de frequncia pode ser vista na
tabela 2.6. A representao grca pode ser feita por meio de um grco de colunas conforme
gura 2.3.
Tabela 2.6: Distribuio de frequncias do nmero de minerais comuns encontrados em 20 rochas.
Abundncia Frequencia Frequencia Frequencia Frequencia Frequencia
Absoluta Relativa Percentual Acumulada Percentual
(fa) (fr) (fp) (FA) Acumulada
(FP)
2 5 0,25 25% 5 25%
3 1 0,05 5% 6 30%
4 2 0,10 10% 8 40%
5 7 0,35 35% 15 75%
6 2 0,10 10% 17 85%
7 3 0,15 15% 20 100%
Total 20 1,00 100%
Figura 2.3: nmero de minerais comuns encontrados em 20 rochas.
A construo de tabelas de distribuio de frequncias para variveis quantitativas contnuas
feita agrupando os dados em classes e obtendo as frequncias observadas em cada classe.
importante notar que ao resumir dados referentes a uma varivel contnua sempre se perde alguma
Estatstica Descritiva 14
informao j que no temos idia de como se distribuem as observaes dentro de cada classe.
Para isso temos duas denies:
Amplitude (A) - corresponde a diferena enter o maior valor e o menor valor de um conjunto
de dados;
Amplitude da classe (c) - consiste na diferena entre o limite superior e o limite inferior de
uma classe em uma distribuio de frequncia.
O procedimento para construir tabelas de distribuio frequncias para variveis quantitativas
contnuas envolve os seguintes passos (algoritmo):
Decidir sobre o numero de classes k, entre 5 e 20. Para que a deciso no seja totalmente
arbitrria pode-se usar a raiz quadrada do total de valores como o nmero de classes, ou
seja, k

=

n
Determinar a amplitude dos dados: A = Max - Min.
Determinar a amplitude de classe c:
c =
A
k 1
Determinar o limite inferior da primeira classe LI
1
:
LI
1
= Min
c
2
Determinar o limite superior da primeira classe LS
1
:
LS
1
= LI
1
+c
sendo que o limite inferior da segunda classe LI
2
igual ao LS
1
, e assim
LS
2
= LI
2
+c
e assim, sucessivamente todas as classes vo sendo construdas.
Aps a construo das classes, so contados quantos dados esto contidos em cada classe
e se obtem as frequncias.
Tabela 2.7: Dados ordenados, relativos ao teor de enxofre em jazidas de carvo.
3,70 5,43 6,49 6,77 7,42 7,76 8,30
4,58 5,45 6,53 6,95 7,49 7,85 8,31
4,60 5,66 6,64 7,09 7,56 8,11 8,76
4,73 5,80 6,72 7,15 7,62 8,14 9,05
5,30 6,16 6,72 7,27 7,71 8,17 9,63
Estatstica Descritiva 15
k =

30 = 5, 91 6
A = Max Min = 9, 63 3, 70 = 5, 93
c =
A
k 1
=
5, 93
4
= 1, 19
LI
1
= Min
c
2
= 3, 70
1, 19
2
= 3, 7 0, 6 = 3, 10
Tabela 2.8: Distribuio de frequncias, relativa ao teor de enxofre em jazidas de carvo.
Classes Frequncia Frequncia Frequncia Frequncia Frequncia
Absoluta Relativa Percentual Acumulada Percentual
(fa) (fr) (fp) (FA) Acumulada
(FP)
6,27 7,62 3 0,10 10% 3 10%
7,62 8,97 7 0,23 23% 10 33%
8,97 10,32 10 0,33 33% 20 67%
10,32 11,67 6 0,20 20% 26 87%
11,67 13,02 4 0,13 13% 30 100%
30 1,00 100%
Uma forma de representar gracamente distribuio de frequncia das variveis contnuas
por meio do histograma e do polgono de frequncia . Para elaborao deste grco comum
utilizar a chamada densidade de frequncia absoluta (dfa)
dfa =
fr
c
O histograma semelhante ao grco de barras verticais, no eixo vertical pode-se utilizar as
frequncias ou densidades de frequncias e no eixo horizontal as classes. O polgono de frequncias
um grco de linhas em que no eixo vertical pode-se utilizar as frequncias ou densidades de
frequncias e no eixo horizontal o ponto mdio de cada classe.
Muitas vezes, a anlise da distribuio de frequncias acumuladas mais interessante do que
a de frequncias simples, representada pelo histograma. O grco usado na representao grca
da distribuio de frequncias acumuladas de uma varivel contnua a ogiva, apresentada na
Figura ??. Para a construo da ogiva, so usadas as frequncias acumuladas (absolutas ou
percentuais) no eixo vertical e os limites superiores de classe no eixo horizontal.
O primeiro ponto da ogiva formado pelo limite inferior da primeira classe e o valor zero,
indicando que abaixo do limite inferior da primeira classe no existem observaes. Da por
diante, so usados os limites superiores das classes e suas respectivas frequncias acumuladas,
at a ltima classe, que acumula todas as observaes. Assim, uma ogiva deve comear no valor
zero e, se for construda com as frequncias relativas acumuladas, terminar com o valor 100.
Estatstica Descritiva 16
Figura 2.4: Histograma e Polgono de frequncias do relativa ao teor de enxofre em jazidas de
carvo
Figura 2.5: Ogiva para o teor de enxofre em jazidas de carvo.
Estatstica Descritiva 17
2.3 SOMATRIO
Um somatrio um operador matemtico que nos permite representar facilmente somas
muito grandes ou at innitas. representado com a letra grega sigma , e denido por:
n

i=1
x
i
em que corresponde a soma dos termos "x
i
, em que o ndice i varia de 1 a n.
Regras do somatrio:
Somatrio de uma constante
Se k uma constante, ento
n

i=1
k = k +k +k +... +k = nk
Somatrio do produto de uma constante por uma varivel
Se k uma constante e x
i
uma varivel
n

i=1
kx
i
= kx
1
+kx
2
+kx
3
+... +kx
n
= k(x
1
+x
2
+x
3
+... +x
n
) = k
n

i=1
x
i
Somatrio de uma soma algbrica
O somatrio de uma soma de variveis igual soma dos somatrios de cada varivel
n

i=1
(x
i
+y
i
) =
n

i=1
x
i
+
n

i=1
y
i
Se a e b so constantes e x
i
uma varivel
n

i=1
(a +bx
i
) =
n

i=1
a +
n

i=1
bx
i
= na +b
n

i=1
x
i
Observaes:
n

i=1
x
i
y
i
=
n

i=1
x
i
n

i=1
y
i
n

i=1
x
2
i
=
_
n

i=1
x
i
_
2
Exemplos: Seja X = {4, 7, 9, 12, 3}, Obter
5

i=1
x
i
= 35,
4

i=1
2x
i
= 64,
5

i=2
3x
i
= 93
Estatstica Descritiva 18
Sabendo que
3

i=1
x
i
= 6,
3

i=1
x
2
i
= 14, determinar
a)
3

i=1
(x
i
+ 1) =
3

i=1
x
i
+
3

i=1
1 = 6 + 3 = 9
b)
3

i=1
(x
i
1)
2
=
3

i=1
_
x
2
i
2x
i
+ 1
_
=
3

i=1
x
2
i
2
3

i=1
x
i
+
3

i=1
1 = 14 12 + 3 = 5
2.4 MEDIDAS DE POSIO
Medidas de Posio - So medidas de tendncia central, ou seja, representativas do valor
central, ao redor do qual se agrupam a maioria dos valores.
2.4.1 Mdia Aritmtica
A mdia de uma populao ou amostra a soma de todos os elementos da populao (amostra)
dividida pelo nmero de elementos. Esta medida apresenta a mesma unidade dos dados.
Para a populao a mdia representada por
=
N

i=1
x
i
N
em que N o tamanho da populao
Para a amostra a mdia representada por
X =
n

i=1
x
i
n
em que n o tamanho da amostra.
Quando os dados so agrupados (Distribuio de freqncia) a mdia representada por
X =
n

i=1
fa
i
x
i
n

i=1
fa
i
em que
para variveis discretas x
i
o prprio valor da varivel
para variveis contnuas x
i
o ponto mdio da classe
fa
i
o freqncia absoluta de x
i
Estatstica Descritiva 19
A mdia calculada dos dados originais e dados agrupados podem ser diferentes, devido ao
erro de agrupamento. O erro de agrupamento obtido fazendo a diferena entre o valor obtido
pelos dados originais e o valor obtido pelos dados agrupados.
2.4.2 Mediana
Num conjunto de dados ordenados, a mediana (M
d
) o valor que deixa metade da freqncia
abaixo dele. A mediana, como a mdia, possui a mesma unidade de cada observao.
A mediana pode ser obtida por meio da expresso:
M
d
=
_

_
Xn+1
2
se n for mpar
Xn
2
+X
n+2
2
2
se n for par
Para calcular a mediana em dados agrupados necessrio observar a freqncia acumulada
para denir a classe mediana.
A posio da mediana (P) obtida fazendo
P =
_

_
n+1
2
se n for mpar
n
2
se n for par
Denida a classe mediana utiliza-se a expresso abaixo para obter a mediana
M
d
= LI
i
+
n
1
n
2
c
em que:
LI
i
o limite inferior da classe mediana
c a amplitude da classe mediana
n
1
a diferena entre a Posio da mediana e a freqncia acumulada da classe anterior a
classe mediana
n
2
a freqncia absoluta da classe mediana
2.4.3 Moda
A moda M
o
de um conjunto de dados o valor mais freqente e tambm tem a mesma
unidade dos dados. Para obter a moda basta observar qual o dado que mais se repete.
Para dados agrupados de variveis continuas a moda se localiza na classe de maior freqncia
(classe modal) e obtida por meio da expresso:
M
o
= LI
i
+

1

1
+
2
c
LI
i
o limite inferior da classe modal;
Estatstica Descritiva 20
c a amplitude da classe modal;

1
a diferena da freqncia da classe modal e a freqncia da classe imediatamente
anterior;

2
a diferena da freqncia da classe modal e a freqncia da classe imediatamente
posterior.
2.4.4 Simetria
A determinao das medidas de posio permite discutir sobre a simetria da distribuio dos
dados.
Distribuio simtrica - X = M
d
= M
o
Distribuio assimtrica - ocorrem diferenas entre os valores da mdia, mediana e moda.
A assimetria pode ser:
direita - X > M
d
> M
o
esquerda - X < M
d
< M
o
2.5 EXEMPLOS
2.5.1 Variveis Quantitativas Discretas
Sejam dados referentes a um levantamento onde observou-se 25 rochas, nas quais contou-se
o nmero de minerais comuns encontrados em cada rocha.
Tabela 2.9: Nmero de minerais comuns encontrados em 25 rochas
1 3 4 5 6
2 3 4 5 6
2 3 4 5 6
2 3 5 5 7
2 4 5 5 8
2.5.1.1 Dados Originais
Para calcular a mdia temos:
X =
n

i=1
x
i
n
=
1 + 2 +... + 8
25
=
105
25
= 4, 2

= 4
Para calcular a mediana temos n = 25 (mpar), ento
M
d
= Xn+1
2
= X25+1
2
= X
13
= 4
Para calcular a moda, basta vericar o valor que mais se repete, logo 5.
Estatstica Descritiva 21
2.5.1.2 Dados Agrupados
Tabela 2.10: Distribuio de freqncia para o nmero de minerais comuns encontrados em 25
rochas
Nmero de fa fa x FA
folhas atacadas x
1 1 1 1
2 4 8 5
3 4 12 9
4 4 16 13
5 7 35 20
6 3 18 23
7 1 7 24
8 1 8 25
total 25 105
Mdia
X =
n

i=1
fa
i
x
i
n

i=1
fa
i
=
105
25
= 4, 2

= 4
Mediana- obter a classe mediana
n + 1
2
=
25 + 1
2
= 13
Md=4 Moda - valor que mais repete 5
2.5.2 Variveis Quantitativas Contnuas
Tabela 2.11: Dados ordenados, relativos ao teor de enxofre em jazidas de carvo.
6,94 7,27 7,46 7,97 8,03 8,37
8,56 8,66 8,88 8,95 9,30 9,33
9,55 9,76 9,80 9,82 9,98 9,99
10,14 10,19 10,42 10,44 10,66 10,88
10,88 11,16 11,80 11,88 12,25 12,34
2.5.2.1 Dados Originais
Para calcular a mdia temos:
X =
n

i=1
x
i
n
=
7, 27 + 7, 46 + 7, 97 + 8, 03 +... + 12, 34
200
=
291, 66
30
= 9, 722

= 9, 72
Estatstica Descritiva 22
Para calcular a mediana temos n = 30 (par), ento
M
d
=
X
n
2
+Xn+2
2
2
=
X30
2
+X30+2
2
2
=
X
15
+X
16
2
=
9, 80 + 9, 82
2
= 9, 81
2.5.2.2 Dados Agrupados
Tabela 2.12: Resumo da distribuio de freqncias, relativa ao teor de enxofre em jazidas de
carvo.
Classes x Frequencia fa x Frequencia
Absoluta Acumulada
(fa) (FA)
6,27 7,62 6,94 3 20,82 3
7,62 8,97 8,29 7 58,03 10
8,97 10,32 9,64 10 96,4 20
10,32 11,67 10,99 6 65,94 26
11,67 13,02 12,34 4 49,36 30
Total 30 290,55
Assim,
X =
n

i=1
fa
i
x
i
n

i=1
fa
i
=
290, 55
30
= 9, 685

= 9, 68
Para dados agrupados, primeiro vamos obter a classe mediana
n
2
=
30
2
= 15
Assim a classe mediana a que contm a freqncia acumulada 15, ou seja a classe 8, 97 10, 32.
Ento temos:
LI
i
= 8, 97
c=1,35
n
1
= 15 10 = 5
n
2
= 10
Substituindo nas formula, temos
M
d
= LI
i
+
n
1
n
2
c = 8, 97 +
5
10
1, 35 = 8, 97 + 0, 67 = 9, 64
Para obter a moda, primeiro vamos obter a classe modal.
A maior freqncia absoluta 10, assim a classe modal 8, 97 10, 32. Assim, temos
M
o
= LI
i
+

1

1
+
2
c
Estatstica Descritiva 23
LI
i
= 8, 97;
c = 1, 35;

1
= 10 7 = 3;

2
= 10 6 = 4
M
o
= LI
i
+

1

1
+
2
c = 8, 97 +
3
3 + 4
1, 35 = 8, 97 + 0, 58 = 9, 55
Na tabela 2.13 apresentado uma comparao dos valores obtidos pelos dados originais e
agrupados.
Tabela 2.13: Comparao dos valores obtidos pelos dados originais e agrupados
Medida Descritiva Dados Originais Dados Agrupados Erro de agrupamento
X 9,72 9,68 0,04
M
d
9,81 9,64 0,17
M
0
no se aplica 9,55
Estatstica Descritiva 24
2.6 MEDIDAS DE DISPERSO
As medidas de posio so importantes para caracterizar um conjunto de dados, mas no
so sucientes para caracterizar completamente a distribuio dos dados. Para isso necessrio
obter as medidas de disperso, que medem a variabilidade dos dados.
Por exemplo: Considere as amostras referentes a altura, em cm, de dois grupos de pessoas.
Grupo A: 185 185 185
Grupo B: 187 183 185
As mdia para os dois a mesma X
A
= 185 e X
B
= 185.
Baseando-se apenas na mdia, os dois grupos so considerados como de mesma altura. O
grupo A tem todas as observaes iguais a mdia. J no grupo B ocorre uma certa disperso nos
dados.
Variabilidade a disperso dos dados em torno de um valor central.
2.6.1 Amplitude Total
Amplitude Total (A) a diferena entre o maior e o menor valor da amostra. Essa medida
bastante simples, e obtida pela expresso:
A = Max Min
Para dados agrupados a amplitude total a diferena entre o ponto mdio da ltima e da
primeira classe.
Para expressar variabilidade a amplitude total no muito usada, pois baseia-se em apenas
dois dados.
2.6.2 Varincia e Desvio Padro
A varincia baseada pela quadrado dos desvios dos dados em relao mdia.Esta medida
expressa na unidade dos dados ao quadrado.
Para a populao a varincia representada por

2
=
N

i=1
(x
i
)
2
N
em que N o tamanho da populao
Para a amostra a varincia representada por
S
2
=
n

i=1
_
x
i
X
_
2
n 1
em que n o tamanho da populao
Para dados agrupados, a varincia obtida por meio da expresso:
Estatstica Descritiva 25
Para a populao a varincia representada por

2
=
k

i=1
(x
i
)
2
fa
i
k

i=1
fa
i
Para a amostra a varincia representada por
S
2
=
n

i=1
_
x
i
X
_
2
fa
i
k

i=1
fa
i
1
O desvio padro a raz quadrada positiva da varincia. Esta medida expressa na mesma
unidade dos dados.
Para a populao o desvio padro representada por
=

2
Para a amostra o desvio padro representada por
S =

S
2
em que n o tamanho da populao
2.6.3 Coeciente de Variao
O coeciente de variao (CV ) uma medida de disperso que expressa o desvio padro em
termos da mdia de forma percentual
CV = 100
S
X
Se as amostras tiverem unidade diferentes ou mdias diferentes o CV pode ser utilizado para
comparar a variabilidade entre duas amostras.
2.6.4 Erro Padro da Mdia
O erro padro da mdia uma medida de disperso que d a preciso com que a mdia
populacional est sendo estimada. obtido pela frmula
S(X) =
S

n
em que:
S o desvio padro da amostra;
Estatstica Descritiva 26
n o tamanho da amostra.
2.7 EXEMPLOS
2.7.1 Variveis Quantitativas Discretas
Sejam dados referentes a um levantamento onde observou-se 25 rochas, nas quais contou-se
o nmero de minerais comuns encontrados em cada rocha.
Tabela 2.14: Nmero de minerais comuns encontrados em 25 rochas
1 3 4 5 6
2 3 4 5 6
2 3 4 5 6
2 3 5 5 7
2 4 5 5 8
2.7.1.1 Dados Originais
A amplitude total
A = Max Min = 8 1 = 7
Temos que a mdia X = 4 e como se trata de uma amostra temos:
S
2
=
n

i=1
_
x
i
X
_
2
n 1
=
_
(1 4)
2
+ (2 4)
2
+... + (8 4)
2
_
25 1
= 3, 041666667

= 3, 04
O desvio padro
S =

S
2
=
_
3, 04 = 1, 7435595

= 2
O coeciente de variao
CV = 100
S
X
= 100
2
4
= 50%
O erro padro da mdio
S(X) =
S

n
=
2

25
= 0, 4
2.7.1.2 Dados Agrupados
A amplitude total
A = Max Min = 8 1 = 7
Estatstica Descritiva 27
Tabela 2.15: Distribuio de freqncia para o nmero de minerais comuns encontrados em 25
rochas
Nmero de fa fa x FA
folhas atacadas x
1 1 1 1
2 4 8 5
3 4 12 9
4 4 16 13
5 7 35 20
6 3 18 23
7 1 7 24
8 1 8 25
total 25 105
Temos que a mdia X = 4 e como se trata de uma amostra temos:
S
2
=
n

i=1
_
x
i
X
_
2
fa
i
k

i=1
fa
i
1
=
(1 4)
2
1 + (2 4)
2
4 + (3 4)
2
4 + (4 4)
2
4 + (5 4)
2
7 + (6 4)
2
6 + (7 4)
2
1 + (8 4)
2
1
25 1
=
73
24
= 3, 041667

= 3, 04
O desvio padro
S =

S
2
=
_
3, 04 = 1, 7435595

= 2
O coeciente de variao
CV = 100
S
X
= 100
2
4
= 50%
O erro padro da mdio
S(X) =
S

n
=
2

25
= 0, 4
2.7.2 Variveis Quantitativas Contnuas
Tabela 2.16: Dados ordenados, relativos ao teor de enxofre em jazidas de carvo.
6,94 7,27 7,46 7,97 8,03 8,37
8,56 8,66 8,88 8,95 9,30 9,33
9,55 9,76 9,80 9,82 9,98 9,99
10,14 10,19 10,42 10,44 10,66 10,88
10,88 11,16 11,80 11,88 12,25 12,34
Estatstica Descritiva 28
2.7.2.1 Dados Originais
Amplitude total
A = Max Min = 12, 34 6, 94 = 5, 40
Temos que a mdia X = 9, 72 e como se trata de uma amostra temos:
S
2
=
n

i=1
_
x
i
X
_
2
n 1
=
_
(6, 94 9, 72)
2
+ (7, 27 9, 72)
2
+... + (12, 34 9, 72)
2
_
30 1
= 2, 074986

= 2, 0750
O desvio padro
S =

S
2
=
_
2, 0750 = 1, 4404760

= 1, 44
O coeciente de variao
CV = 100
S
X
= 100
1, 44
9, 72
= 14, 81%
O erro padro da mdia
S(X) =
S

n
=
1, 44

30
= 0, 262906

= 0, 26
2.7.2.2 Dados Agrupados
Tabela 2.17: Resumo da distribuio de freqncias, relativa ao teor de enxofre em jazidas de
carvo.
Classes x Frequencia x X (x X)fa
Absoluta
(fa)
6,27 7,62 6,94 3 7,5076 22,5228
7,62 8,97 8,29 7 1,9321 13,5247
8,97 10,32 9,64 10 0,0016 0,016
10,32 11,67 10,99 6 1,7161 10,2966
11,67 13,02 12,34 4 7,0756 28,3024
Total 30 74,6625
Assim, Amplitude total
A = Max Min = 12, 34 6, 94 = 5, 40
Estatstica Descritiva 29
Temos que a mdia X = 9, 68 e como se trata de uma amostra temos:
S
2
=
n

i=1
_
x
i
X
_
2
fa
i
k

i=1
fa
i
1
=
74, 6625
29
= 2, 5745689

= 2, 5746
O desvio padro
S =

S
2
=
_
2, 5746 = 1, 604556

= 1, 60
O coeciente de variao
CV = 100
S
X
= 100
1, 60
9, 68
= 16, 53%
O erro padro da mdia
S(X) =
S

n
=
1, 60

30
= 0, 29
Tabela 2.18: Comparao entre as medidas de disperso obtidas pelo dados no agrupados e
agrupados
Medida Descritiva Dados Originais Dados Agrupados Erro de agrupamento
A 5,40 5,40 0
S
2
2,0750 2,5746 0,4996
S 1,44 1,60 0,16
CV 14,81% 16,53% 1,72
S(X) 0,26 0,29 0,03
3
NOES DE PROBABILIDADE
J vimos que para se obter informaes sobre alguma caracterstica da populao, podemos
utilizar uma amostra. Estudaremos agora a probabilidade, que uma ferramenta usada e neces-
sria para se fazer ligaes entre a amostra e a populao, de modo que a partir de informaes
da amostra se possa fazer armaes sobre caractersticas da populao.
As probabilidades so utilizadas para exprimir a chance de ocorrncia de determinado evento.
O estudo das probabilidades importante pois elas so a base para o estudo estatstico
A teoria de probabilidades tem por objetivo o estudo de fenmenos aleatrios. Um fenmeno
chamado de aleatrio se ele tem a seguinte propriedade: quando observado repetidamente sob
as mesmas condies ele produz resultados diferentes. Mesmo que a chance da ocorrncia seja
alta, os resultados no so conhecidos antes de ocorrer, mas de certa forma, mantm uma certa
regularidade, o que permite determinar a chance de ocorrncia; a Probabilidade.
Exemplos:
Jogar uma moeda repetidamente e observar o resultado da face de cima;
Jogar um dado e observar o nmero mostrado na face superior;
Nmero de lhos de um casal;
Observao: quando a possibilidade de repetir o fenmeno est na mo do experimentador,
este fenmeno aleatrio chamado de experimento aleatrio.
3.1 ESPAO AMOSTRAL E EVENTOS
Espao amostral () - o conjunto de todos os possveis resultados de um experimento.
Um espao amostral
Exemplo:
Lanamento de um dado no viciado. Neste caso o espao amostral
= {1, 2, 3, 4, 5, 6}
Lanar uma moeda duas vezes e observar as faces obtidas
= {(Ca, Co), (Ca, Ca), (Co, Ca), (Co, Co)}
Noes de Probabilidade 31
No lanamento de um dado pode-se interessar, por exemplo, somente na ocorrncia de nmero
mpares. O subconjunto A = {1, 3, 5} do espao amostral representa o evento A denido pela
ocorrncia de nmeros mpares.
Evento - um subconjunto do espao amostral que representa um resultado denido.
Ponto amostral - apenas um elemento do espao amostral.
3.1.1 Operao com eventos
Sejam A e B dois eventos de um mesmo espao amostral O evento interseco de A e B,
denotado A B, e o evento em que A e B ocorrem simultaneamente.
Dois eventos A e B so mutuamente exclusivos ou disjuntos se eles no podem ocorrer simul-
taneamente A B = .
O evento Unio de A e B, denotado A B, e o evento em que A ocorre ou B ocorre (ou
ambos).
O evento complementar de A, denotado A
c
, o evento em que A no ocorre.
Exemplo: Seja o espao amostral = {1, 2, 3, 4, 5, 6} e considere os eventos:
A = {1, 3, 5} B = {2, 4, 6} C = {3, 4, 5, 6}
Vamos fazer as seguintes operaes:
A B = Conjuntos mutuamente exclusivos ou disjunto
A C = {3, 5}
A B = {1, 2, 3, 4, 5, 6} =
A B
c
= {1, 3, 5} = A os elementos de que no esto no conjunto B B
c
{1, 3, 5}
Noes de Probabilidade 32
3.2 PROBABILIDADE
Probabilidade - freqncia relativa associada a um varivel descritora de uma populao.
Num espao amostral , a probabilidade de ocorrer um evento A, representado por P(A),
dado pela medida de A em nas seguintes condies: Exemplo: A probabilidade de ocorrer face
mpar no lanamento de um dado no viciado
P(A) =
n
N
=
3
6
=
1
2
= 0, 5 = 50%
Algumas propriedades de probabilidade:
A probabilidade de ocorrncia de vale 1, ou seja, P() = 1
Probabilidade de em evento certo e de um evento impossvel
P() = 1; P() = 0
A probabilidade de ocorrncia do evento A no negativa, ou seja, P(A) 0
Domnio da Probabilidade
0 P(A) 1
Regra da Adio de probabilidades de dois eventos A e B:
P(A B) = P(A) +P(B) P(A B)
No exemplo do lanamento de um dado seja os eventos A = {2, 4, 6} e B = {3, 4, 5, 6}. A
unio entre os dois conjuntos daria {2, 3, 4, 5, 6}. Assim:
P(A B) =
5
6
= 0, 83 = 83%
Utilizando a regra da adio teriamos:
P(A B) = P(A) +P(B) P(A B) =
3
6
+
4
6

2
6
=
5
6
= 0, 83 = 83%
em que A B = {4, 6}
Probabilidade complementar
P(A
c
) = 1 P(A)
No exemplo do lanamento de um dado seja o evento A = {3, 4, 5, 6}, ento A
c
= {1, 2},
logo
P(A) =
4
6
e P(A
c
) =
2
6
utilizando a regra da probabilidade complementar teriamos:
P(A
c
) = 1 P(A) = 1
4
6
=
6 4
6
=
2
6
Noes de Probabilidade 33
Numa pesquisa sobre esporte na escola entrevistou-se 500 alunos, e obteve os seguintes dados:
200 alunos no praticam esporte (evento A);
150 alunos praticam futebol (evento B);
200 alunos praticam basquetebol (evento C)
Qual a probabilidade de um aluno escolhido ao acaso
praticar futebol e basquetebol?
no praticar esporte?
praticar futebol ou basquetebol?
Probabilidade de praticar futebol e basquetebol. P(B C)
200 + 150 + 200 = 550 550 500 = 50 (n de alunos que praticam ambos esportes)
P(B C =
50
500
= 0, 10
Probabilidade de no praticar esporte?
P(A) =
200
500
= 0, 4
Probabilidade de praticar futebol ou basquetebol. P(B C)
P(B C) = P(B) +P(C) P(B C) =
150
500
+
200
500

50
500
=
300
500
= 0, 60
3.2.1 Probabilidade Condicional e Independncia de Eventos
A probabilidade condicional surge, por exemplo, quando se deseja calcular a probabilidade
de um evento A ocorrer sabendo que um evento B j ocorreu.
Sejam A e B dois eventos associados a um mesmo espao amostral . Denota-se por P(A|B)
a probabilidade condicionada do evento A, quando o evento B tiver ocorrido.
Sempre que calculamos P(A|B), estamos essencialmente calculando P(A) em relao ao
espao amostral reduzido devido a B ter ocorrido, em lugar de faze-lo em relao ao espao
amostral original .
Dados dois eventos A e B , a probabilidade condicional de A dado que ocorreu B represen-
tada por P(A|B) e denida por
P(A|B) =
P(A B)
P(B)
, P(B) = 0.
Isso signica que a probabilidade de A ocorrer, dado que B ocorreu, igual probabilidade
de ocorrncia simultnea de A e B dividida pela probabilidade de ocorrncia de B.
Exemplo: Na tabela a seguir temos dados referentes a alunos matriculados em trs cursos de
uma universidade em dado ano.
Qual a probabilidade de escolhermos um aluno ao acaso e ele ser:
Noes de Probabilidade 34
Tabela 3.1: Dados referentes a alunos de uma dada universidade.
Cursos Sexo Total
Feminino Masculino
Administrao 70 40 110
Psicologia 10 20 30
Geologia 20 15 35
Total 100 75 175
Homem (H) e da Administrao (Adm)?
P(H Adm) =
40
175
= 0, 2285
b) Homem (H) ou da Administrao (Adm)?
P(H Adm) = P(H) +P(Adm) P(H Adm)
=
75
175
+
110
175

40
175
=
145
175
= 0, 8285
Psicologia (Psi) ou Geologia (Geo)?
P(Psi Geo) = P(Psi) +P(Geo) P(Psi Geo)
=
30
175
+
35
175
0 =
65
175
= 0, 3714
De ser um aluno da psicologia dado que mulher.
P(Psi|M) =
P(Psi M)
P(M)
=
10
175
100
175
=
10
175
175
100
=
10
100
= 0, 10
Das expresses acima resulta a regra do produto, que se refere ao clculo da probabilidade
do evento interseo,
P(A B) = P(A|B).P(B)
A ordem do condicionamento pode ser invertida. Para trs eventos, por exemplo, pode-se
escrever:
P(A B C) = P(A).P(B|A).P(C|A B) (3.1)
Dois eventos A e B so independentes se a ocorrncia de um no altera a probabilidade
de ocorrncia do outro, isto , P(A|B) = P(A) ou P(B|A) = P(B), ou ainda, a seguinte forma
equivalente:
P(A B) = P(A).P(B)
Noes de Probabilidade 35
3.2.2 rvores de probabilidade
A contruo de uma rvore de probabilidade fornece uma ferramenta muito til para a
soluo de problemas envolvendo duas ou mais etapas. A rvore consiste em uma representao
grca na qual diversas possibilidades so representadas, juntamente com as respectivas proba-
bilidades condicionadas a cada situao. Isso permite, pela utilizao direta da regra do produto
das probabilidades, associar a cada n terminal da rvore a respectiva probabilidade.
O uso das rvores de probabilidade ajudam e simplicam o entendimento da aplicao de
dois teoremas que sero apresentados a seguir, conforme ser visto no exemplo.
Exemplo: Em certo colgio, 5% dos homens e 2% das mulheres tm mais de 1,80m de altura.
Por outro lado, 40% dos estudantes so homens. Sorteando-se um estudante aleatoriamente,
qual a probabilidade de:
Ser mulher (M) e ter mais de 1,80m?
P(M > 1, 80) = 0, 60 0, 02 = 0, 012
Ter mais de 1,80m?
P(> 1, 80) = P(M > 1, 80) +P(H > 1, 80)
P(H > 1, 80) = 0, 40 0, 05 = 0, 02
P(> 1, 80) = 0, 012 + 0, 02 = 0, 032
Um estudante escolhido ao acaso e tem mais de 1,80m. Qual a probabilidade de que o
estudante seja mulher?
P(M| > 1, 80) =
P(M > 1, 80)
P(> 1, 80)
=
0, 012
0, 032
= 0, 375
Noes de Probabilidade 36
3.2.3 Varivel Aleatria
Varivel Aleatria - varivel descritora de populaes, cujos valores so associados a proba-
bilidades de ocorrncia.
Exemplo: Um estudante submetido a trs questes de mltipla escolha, em cada questo
tinha cinco alternativas. Logo a chance de acerta uma questo no chute 20%
Correto (C) - P(C) = 20% =
1
5
Errado (E) - P(E) = 80% =
4
5
A questes e resultados possveis so:
= {CCC, CCE, CEC, CEE, ECC, ECE, EEC, EEE}
Supondo que sua varivel aleatria acertar a questo, temos que o ocorrncia no espao
amostral pode ser:
=
_
CCC
3
,
CCE
2
,
CEC
2
,
CEE
1
,
ECC
2
,
ECE
1
,
EEC
1
,
EEE
0
_
As probabilidade dos pontos amostrais so:
P(CCC) =
1
5
1
5
1
5
=
1
125
P(CCE) =
1
5
1
5
4
5
=
4
125
P(CEC) =
1
5
4
5
1
5
=
4
125
P(CEE) =
1
5
4
5
4
5
=
16
125
P(ECC) =
4
5
1
5
1
5
=
4
125
P(ECE) =
4
5
1
5
4
5
=
16
125
P(EEC) =
4
5
4
5
1
5
=
16
125
P(EEE) =
4
5
4
5
4
5
=
64
125
Noes de Probabilidade 37
Pode-se construir uma tabela, em que X o nmero de questes corretas e f(x) a probabi-
lidade de ocorrer o resultado X.
x 0 1 2 3
f(x) 64/125 48/125 12/125 1/125
Nesta tabela X assume os valores (X = 0, 1, 2, 3) que so valores numricos que descrevem
os resultados da experincia, logo os valores de X so de uma varivel aleatria.
Uma funo que transforma em resultados de um espao amostral em nmeros reais, chama-se
varivel aleatria.
X o nome da varivel aleatria denida. Ex. nmero de questes corretas;
x so os valores assumidos pela varivel. Ex. x = 0, 1, 2, 3.
Noes de Probabilidade 38
3.3 DISTRIBUIES DISCRETAS DE PROBABILIDADE
A distribuio discreta descreve quantidades aleatrias (dados de interesse) que podem as-
sumir valores particulares e os valores so nitos. Por exemplo, uma varivel aleatria discreta
pode assumir somente os valores 0 e 1, ou qualquer inteiro no negativo, etc.
Exemplos
1. Lana-se uma moeda 10 vezes e anota-se o nmero de caras. Este nmero pode ser 0, 1, 2
...10.
2. Em uma pesquisa de mercado feita com 200 pessoas, perguntam-se estes compram um
determinado produto. O nmero de pessoas que compram o produto varia de 0 a 200.
3. Conta-se o nmero de acidentes que ocorrem em uma rodovia num feriado prolongado. O
nmero de acidentes em questo pode ser: 0, 1, 2... Como no temos um valor que limite
esse nmero, supomos que o nmero de acidentes qualquer inteiro no negativo.
4. Nmero de chamadas telefnicas que chegam a uma central em um intervalo de tempo.
Existem vrias distribuies discretas ou modelos probabilsticos discretos que podem ser
usados em diversas situaes prticas. O problema determinar qual modelo mais adequado
para a situao em estudo, e como aplic-lo adequadamente.
A distribuio discreta uma funo f(x) que associa a cada valor x da varivel aleatria a
sua respectiva probabilidade. Esta funo deve atender duas condies:
1. f(x) 0;
2.

f(x) = 1
Ex.: Para a trs questes, considerando X nmero de acertos e x=(0,1,2,3)
x 0 1 2 3
f(x) 64/125 48/125 12/125 1/125
Vericao da duas condies:
1. f(x) 0;
Para x < 0 f(x) = 0
Para 0 x 2 f(x) > 0
Para x > 2 f(x) = 0
2.

f(x) =
64
125
+
48
125
+
12
125
+
1
125
=
125
125
= 1
Uma funo de probabilidade discreta pode ser representada por
f(x) ou P(x) ou P(X = x)
Noes de Probabilidade 39
Outra forma de representar uma distribuio de probabilidade de uma varivel alearia por
meio de sua funo de distribuio acumulado, que denida por
F(x) = P(X x) =
n

i=1
P(X = x
i
)
Utilizando o exemplo das questes, temos que a funo de distribuio
x 0 1 2 3
f(x) 64/125 48/125 12/125 1/125
Assim a funo de distribuio acumulada dada por
x 0 1 2 3
F(x) 64/125 112/125 124/125 125/125
E sua representao grca:
3.3.1 Esperana Matemtica e Varincia de uma VAD
Denio: Seja X uma V.A.D., com valores possveis x1, x2, ..., xn; Seja P(x
i
) = P(X =
x
i
), i = 1, 2, ..., n. Ento, o valor esperado de X (ou Esperana Matemtica de X), denotado por
E(X) denido como
E(X) =

i=1
x
i
P(x
i
)
esta expresso tambm denominado o valor mdio de X.
Denio: Seja X uma V.A.D. . Dene-se a varincia de X, denotada por V (X) ou
2
X
, da
seguinte maneira:
V (X) =

i=1
(x
i
E(X))
2
P(x
i
) = ou V (X) = E(X
2
) (E(X))
2
e a raiz quadrada positiva de V(X) denominada o desvio-padro de X, e denotado por
X
.
Noes de Probabilidade 40
No exemplo das questes
E(X) =
4

i=1
x
i
P(x
i
) = 0
64
125
+ 1
48
125
+ 2
12
125
+ 3
1
125
= 0 +
48
125
+
24
125
+
3
125
= 0, 60
V (x) =
4

i=1
(x
i
E(X))
2
P(x
i
) = (0 0, 60)
2
64
125
+ (1 0, 60)
2
48
125
+ (2 0, 60)
2
12
125
+ (3 0, 60)
2
1
125
= 0, 36
64
125
+ 0, 16
48
125
+ 1, 96
12
125
+ 5, 76
1
125
=
23, 04
125
+
7, 68
125
+
23, 52
125
+
5, 76
125
=
60
125
= 0, 48
V (X) = E(X
2
) (E(X))
2
E(X
2
) =
4

i=1
x
2
i
P(x
i
) = 0
2
64
125
+ 1
2
48
125
+ 2
2
12
125
+ 3
2
1
125
= 0
64
125
+ 1
48
125
+ 4
12
125
+ 9
1
125
= 0 +
48
125
+
48
125
+
9
125
=
105
125
= 0, 84
V (X) = 0, 84 (0, 60)
2
= 0, 84 0, 36 = 0, 48
3.3.2 Distribuio Uniforme Discreta
a mais simples das distribuies discretas e recebe o nome de uniforme porque todos os
valores da varivel aleatria so assumidos com a mesma probabilidade.
Exemplo o lanamento de um dado no viciado, denindo como X, a varivel aleatria que
representa a face voltada para cima, X assume os valores x = 1, 2, 3, 4, 5, 6 com a mesma proba-
bilidade 1/6.
A distribuio uniforme neste caso dada por
f(x) =
1
6
para x = 1, 2, 3, 4, 5, 6
Generalizado obtm-se a funo de probabilidade
f(x) =
1
k
para x = x
1
, x
2
, x
3
, ..., x
k
k numero de termos.
Verica-se ento que f(x) depende de k.
3.3.2.1 Parmetros Caractersticos da Distribuio Uniforme
1. Mdia =
k+1
2
No exemplo dos dados =
6+1
2
= 3, 5
2. Varincia
2
=
k
2
1
12
No exemplo dos alrgicos sigma
2
==
6
2
1
12
= 2, 92 s
3.3.3 Distribuio Bernoulli
Na prtica existem muitos experimentos que admitem apenas dois resultados. Exemplos:
Noes de Probabilidade 41
1. Uma pea classicada como boa ou defeituosa;
2. Um entrevistado concorda ou no com a armao feita;
3. Um servidor de internet est ativo ou no;
4. Numa linha de produo observa-se se um item defeituoso ou no.
Situaes com alternativas dicotmicas podem ser representadas genericamente por respostas
do tipo sucesso-fracasso.
Esses experimentos recebem o nome de ensaio de Bernoulli e originam uma varivel alea-
tria com distribuio Bernoulli. Neste caso, consideramos uma experincia com dois possveis
resultados
Sucesso P(sucesso) = p;
Fracasso P(fracasso) = q.
Temos que:
= {Sucesso, Fracasso} P() = 1
p +q = 1 q = 1 p
3.3.3.1 Parmetros Caractersticos da Distribuio Uniforme
1. Mdia = p
No exemplo dos dados =
6+1
2
= 3, 5
2. Varincia
2
= pq
No exemplo dos alrgicos sigma
2
==
6
2
1
12
= 2, 92 s
3.3.4 Distribuio Binomial
Na maior parte das vezes, so realizados n ensaios de Bernoulli. O interesse est no nmero
X de ocorrncias de sucessos.
Exemplos:
1. lanar uma moeda cinco vezes e observar o nmero de caras;
2. numa linha de produo, observar dez itens, e vericar quantos so defeituosos;
3. vericar, num dado instante, o nmero de processadores ativos, num sistema com multi-
processadores;
Uma experimento binomial dado da seguinte forma:
1. consiste em n ensaios de Bernoulli;
2. cujos ensaios so independentes; e
3. para o qual a probabilidade de sucesso em cada ensaio sempre igual a p, 0 < p < 1
Noes de Probabilidade 42
A varivel aleatria X, correspondente ao nmero de sucessos num experimento binomial,
tem distribuio binomial com parmetros n e p, com funo de probabilidade dada por
f(x) = C
n
x
p
x
q
nx
A frmula de clculo de uma combinao a seguinte:
C
n
x
=
_
n
x
_
=
n!
x! (n x)!
A funo f(x) permite calcular a probabilidade de acontecer o resultado x (nmero de sucessos
da varivel aleatria), no importando a ordem de ocorrncia de x dentro da experincia.
Exemplo: Numa famlia com n = 5 lhos, qual a probabilidade de no haver homens? Qual
a probabilidade de haver dois homens? n = 5, p =
1
2
, q =
1
2
f(x) = C
5
x
p
x
q
5x
; x = 0, 1, 2, 4, 5
A varivel aleatria representa o nmero de homens (lhos do sexo masculino) encontrado
em famlias de 5 lhos
1. x = 0 homem
f(x) = C
5
0
p
0
q
50
=
5!
0! (5 0)!
_
1
2
_
0
_
1
2
_
5
=
1
32
= 0, 0313 ou 3, 13%
2. x = 2 homens
f(x) = C
5
2
p
2
q
52
=
5!
2! (5 2)!
_
1
2
_
2
_
1
2
_
3
=
20
2
1
4
1
8
=
10
32
= 0, 3125 ou 31, 25%
Exemplo: Lanada oito moedas (ou uma moeda oito vezes), qual a chance de obter
Trs caras?
no mximo trs caras?
no mnimo quatro caras?
A varivel aleatria x neste caso o nmero de caras obtidos no lanamento, logo neste caso
o sucesso sair cara nas moedas lanadas. Assim temos:
n = 8, p =
1
2
= 0, 5 q = 1 q = 1 0, 5 = 0, 5
Noes de Probabilidade 43
A funo de probabilidade
f(x) = C
n
x
p
x
q
nx
Probabilidade de sair trs caras
P[X = 3] = C
8
3
p
3
q
83
=
8!
3! (8 3)!
(0, 5)
3
(0, 5)
5
= 56 0, 125 0, 03125 = 0, 2187 ou 21, 87%
Probabilidade de sair no mximo trs caras
P[X 3] = P[X = 0] +P[X = 1] +P[X = 2] +P[X = 3]
P[X = 0] = C
8
0
p
0
q
80
= 0, 0039
P[X = 1] = C
8
1
p
1
q
81
= 0, 0313
P[X = 2] = C
8
2
p
2
q
82
= 0, 1094
P[X = 3] = 0, 2187
P[X 3] = 0, 0039 + 0, 0313 + 0, 1094 + 0, 2187 = 0, 3633 ou 36, 33%
Probabilidade de sair no mnimo quatro caras
P[X 4] = P[X = 4] +P[X = 5] +P[X = 6] +P[X = 7] +P[X = 8]
ou
P[X 4] = 1 P[X < 4] = 1 (P[X = 0] +P[X = 1] +P[X = 2] +P[X = 3])
= 1 0, 3633 = 0, 6367 ou 63, 67%
3.3.4.1 Parmetros Caractersticos da Distribuio Binomial
1. Mdia = np
2. Varincia
2
= npq
3. Desvio Padro =

npq
Utilizando o exemplo das moedas temos:
1. Mdia = np = 8 0, 5 = 4
2. Varincia
2
= 8 0, 5 0, 5 = 2
3. Desvio Padro =

npq =

2 = 1, 41
Noes de Probabilidade 44
3.3.5 Distribuio de Poisson
A distribuio de Poisson empregada em experimentos nos quais no se est interessado no
nmero de sucessos obtido em n tentativas, como ocorre no caso da distribuio binomial, mas
sim no nmero de sucessos ocorridos durante um intervalo contnuo, que pode ser um intervalo
de tempo, espao, comprimento, rea, ou volume. Alguns exemplos de variveis que podem ter
a distribuio de Poisson so:
1. nmero de defeitos por centmetro quadrado;
2. nmero de acidentes por dia;
3. nmero de clientes por hora;
4. nmero de chamadas telefnicas recebidas por minuto;
5. nmero de falhas de um computador num dia de operao;
6. nmero de relatrios de acidentes enviados a uma companhia de seguros numa semana.
A distribuio de Poisson tem a seguinte funo de probabilidade
f(x) = e

x
x!
, x = 0, 1, 2, 3, ....
em que:
x uma varivel aleatria discreta;
e base dos logaritmos neperianos (2,718...)
- mdia da distribuio (p)
Exemplo: O nmero mdio de dias por ano que ocorrem chuvas acima de 50mm.h
1
em uma
determinada regio 1,5. Qual a probabilidade de haver mais de dois dias com chuvas acima
dessa intensidade.
P[X = x] = e

x
x!
P[X > 2] = 1 P[X 2] = 1 (P[X = 0] +P[X = 1] +P[X = 2])
P[X = 0] = = e
1,5
1, 5
0
0!
= 0, 2231
P[X = 1] = = e
1,5
1, 5
1
1!
= 0, 3347
P[X = 2] = = e
1,5
1, 5
2
2!
= 0, 2510
P[X > 2] = 1 (0, 2231 + 0, 3347 + 2510) = 1 0, 8088 = 0, 1912 ou19, 12%
A distribuio de Poisson tambm conhecida na prtica com lei dos eventos raros. Evento
raro pode ser considerado quando n 50 e p 0, 10.Nestes casos podemos utilizar a distribuio
de Poisson para probabilidades de situaes que seriam utilizadas uma distribuio binomial.
Noes de Probabilidade 45
Exemplo: A probabilidade de que um indivduo apresente reao alrgica aps a aplicao
de um soro de 0,002. Esse mesmo soro foi aplicado a um grupo de 1800 pessoas, qual a
probabilidade de que duas pessoas apresentem reao alrgica? n=1800 p=0,002
= 1800 0, 002 = 3, 6 alrgicos
P[X = x] = e

x
x!
P[X = 2] = = e
3,6
3, 6
2
2!
0, 1770ou 17, 70%
3.3.5.1 Parmetros Caractersticos da Distribuio de Poisson
1. Mdia =
No exemplo dos alrgicos = 3, 6
2. Varincia
2
=
No exemplo dos alrgicos
2
= 3, 6 s
3. Desvio Padro =

No exemplo da sementes =

3, 6 = 1, 9
Noes de Probabilidade 46
3.4 DISTRIBUIES CONTNUAS DE PROBABILIDADE
So distribuies de variveis aleatrias contnuas. Uma varivel aleatria contnua toma
um numero innito no numervel de valores (intervalos de nmeros reais), os quais podem ser
associados com medidas numa escala contnua. Exemplos:
1. Mede-se a altura de uma mulher em uma cidade. O valor encontrado um nmero real.
Aqui tambm sabemos que esse nmero no passa de 3 metros, mas conveniente considerar
qualquer numero real positivo.
2. Em um exame fsico para selecionar um jogador de futebol medido o peso de cada candi-
dato; aqui tambm consideramos que o resultado pode ser qualquer nmero real positivo.
3. Em campanhas preventivas de hipertenso arterial comum de tempos em tempos medir-se
o nvel de colesterol. O valor de cada medida pode ser um nmero real no negativo.
4. Para pacientes que se apresentam num hospital a primeira atitude medir-se a temperatura;
o valor da temperatura um nmero real que se pode considerar compreendido entre 35
o
e 42
o
C.
5. Retira-se uma lmpada da linha de produo e coloca-se a mesma em um soquete acendendo-
a; observa-se a mesma at que se queime. O tempo de durao da lmpada um numero
real no negativo.
As variveis continuas cam completamente denidas por qualquer uma das seguintes funes
Funo densidade de probabilidade f(x) - denida para todo o x em que a varivel est
denida.
Funo Acumulada ou de distribuio F(x) - representa a probabilidade acumulada at x
F(x) = P(X x)
Se a varivel aleatria contnua a sua funo de probabilidade uma funo contnua
conhecida por funo de densidade de probabilidade (fdp). Esta funo atende duas condies:
1. f(x) 0 x R
2.
_
R
f(x)dx = 1
Das duas condies verica-se que
P(a < x < b) =
_
b
a
f(x)dx
Noes de Probabilidade 47
Calculo de probabilidades em variveis continuas
P(X a) = F(a) =
_
a

f(x)dx
P(a X b) = F(b) F(a) =
_
b
a
f(x)dx
P(X > a) = 1 F(a)
P(X = a) = 0, para todo o valor de a
No casa das variveis contnuas a funo de distribuio acumulada, que denida por
F(x) = P(X x) =
_
x

f(x)dx
E sua representao grca:
Ex.: O tempo gasto, em minutos, por um estudante para responder a uma questo de um
teste uma varivel aleatria contnua com funo dada por
f(x) =
_
x
4
para 1 x 3
0 para outros valores
Pela notao verica-se que o estudante gasta um tempo entre 1 e 3 minutos.
Vericar as duas condies
1. f(x) 0 x R
Para x < 1 f(x) = 0
Para 1 x 3 f(x) > 0
Para x > 3 f(x) > 0
2.
_
R
f(x)dx = 1
_

f(x)dx =
_

x
4
dx =
_
3
1
x
4
dx =
1
4
_
3
1
xdx =
1
4
x
2
2
_
3
1
=
1
4
_
3
2
2

1
2
2
_
=
1
4
_
9
2

1
2
_
=
1
4
8
2
= 1
Noes de Probabilidade 48
Para obter a probabilidade utiliza-se a integral, por exemplo,
P(2 < x < 3) =
_
3
2
x
4
dx
=
1
4
_
3
2
xdx
=
1
4
x
2
2
_
3
2
=
1
4
_
3
2
2

2
2
2
_
=
1
4
_
9
2

4
2
_
=
1
4
5
2
=
5
8
= 0, 625
3.4.1 Esperana Matemtica e Varincia de uma fdp
Denio: Seja X uma V.A. continua, com fdp f(x). Ento, o valor esperado de X (ou
Esperana Matemtica de X), denotado por E(X) denido como
E(X) =
_

xf(x)dx
esta expresso tambm denominado o valor mdio de X.
Denio: Seja X uma V.A.D. . Dene-se a varincia de X, denotada por V (X) ou
2
X
, da
seguinte maneira:
V (X) =
_

(x E(X))
2
f(x)dx ou V (X) = E(X
2
) (E(X))
2
em que
E(X
2
) =
_

x
2
f(x)dx
e a raiz quadrada positiva de V(X) denominada o desvio-padro de X, e denotado por
X
.
No exemplo da o tempo gasto, em minutos, por um estudante para responder a uma questo
de um teste, temos que:
E(X) =
_

xf(x)dx =
_
3
1
x
x
4
dx = 2, 17
V (X) =
_

(x E(X))
2
f(x)dx =
_
3
1
(x 2, 17)
2
x
4
dx = 0, 30
E(X
2
) =
_

x
2
f(x)dx =
_
3
1
x
2
x
4
dx = 5, 00
V (X) = E(X
2
) (E(X))
2
= 5 (2, 17)
2
= 0, 30
Noes de Probabilidade 49
3.4.2 Distribuio Uniforme
Se X uma V. A. C. assumindo qualquer valor num intervalo (a, b) pertencente a R, com a
mesma probabilidade, diz-se que X tem distribuio uniforme.
A funo de densidade da distribuio uniforme dada por
f(x) =
_
1
ba
para x (a, b)
0 para x (a, b)
em que:
a o menor valor assumido por x;
b o maior valor assumido por x;
A representao grca de f(x) a seguinte:
A funo de distribuio dada por:
F(x) =
_

_
0 se x < a
xa
ba
se a x b
1 se x > b
rea de um retngulo
A = B.h
= (b a)
_
1
b a
_
A = 1
Outra forma de ver a rea:
A =
_
b
a
1
b a
dx
=
1
b a
_
b
a
dx
=
1
b a
x
_
b
a
=
1
b a
(b a) = 1
Noes de Probabilidade 50
Realmente uma funo de densidade, pois a f(x) 0 e a rea igual a 1.
Exemplo. Se uma VAC assume qualquer valor no intervalo (2, 3) com a mesma probabili-
dade, a distribuio uniforme tem a seguinte funo de densidade:
f(x) =
_
1
3(2)
=
1
5
para x (2, 3)
0 para x (2, 3)
Qual a probabilidade de x estar entre 0 e 2?
P(0 x 2) = b.h = 2.
1
5
=
2
5
= 0, 4
P(0 x 2) = F(2) F(0)
F(2) =
2 + 2
5
=
4
5
F(0) =
0 + 2
5
=
2
5
P(0 x 2) =
4
5

2
5
=
2
5
= 0, 4
3.4.2.1 Parmetros Caractersticos da Distribuio Uniforme
1. Mdia =
a +b
2
No exemplo =
2 + 3
2
= 0, 5
2. Varincia
2
=
(b a)
2
12
No exemplo
2
=
(3 (2))
2
12
=
25
12
= 2, 08
3. Desvio Padro =
b a

12
No exemplo =
3 (2)

12
=
5

12
= 1, 44
3.4.3 Distribuio Normal
A distribuio Normal corresponde a mais importante distribuio de variveis aleatrias
contnuas, em razo da sua enorme aplicao nos mais variados campos do conhecimento. Sua
funo de densidade de probabilidade dada por:
f(x) =
1

2
2
exp
_

(x )
2
2
2
_
, < x <
em que os parmetros e
2
so respectivamente a mdia e a varincia da distribuio.
A distribuio normal apresenta a seguinte propriedades:
1. simtrica em relao a ;
2. O ponto mximo de f(x) ocorre em x = . Neste ponto as trs medidas de posio (mdia,
moda e mediana) se confundem;
Noes de Probabilidade 51
3. A rea compreendida abaixo da curva normal e a acima do eixo x vale 1 ou 100%;
A distribuio Normal com mdia = 0 e varincia
2
= 1 conhecida como distribuio
Normal reduzida ou padronizada. Uma varivel aleatria com essa distribuio geralmente
simbolizada pela letra Z.
O clculo de probabilidades de uma distribuio Normal feito pela integral denida no
intervalo da varivel objeto de estudo:
_
b
a
1

2
2
exp
_

(x )
2
2
2
_
dx
Devido a diculdade de resoluo dessa integral, procurou-se mtodos alternativos para obten-
o das probabilidades. Uma das formas mais utilizadas por meio de tabela de probabilidades
de uma distribuio Normal padro (Z).
Uma propriedade interessante de uma varivel aleatria X que segue qualquer distribuio
Normal a de que ela pode ser transformada em uma varivel normal padro Z, por meio da
expresso
z =
x

As reas referentes varivel Z so geralmente tabeladas do tipo


P(0 < Z < z)
Exemplo: A produo diria de uma fabricante de tintas uma varivel aleatria X com
distribuio normal com mdia = 10000gales e varincia
2
= 1000000gales
2
. A direo
dessa fabrica quer criar um bnus de incentivo aos funcionrios, que ser pago se a produo
mdia diria exceder 11000gales. Qual a probabilidade da empresa pagar o bnus? Quero saber
P(X > 11000), primeiro vamos padronizar esta varivel, sendo =

2
=

1000000 = 1000
Primeiro vamos padronizar esta varivel
z =
x

=
11000 10000
1000
= 1, 0
Assim,
P(X > 11000) = (Z > 1, 0)
Noes de Probabilidade 52
Como a tabela me fornece apenas o valor de que est entre 0 e z, ento temos
P(X > 11000) = P(Z > 1, 0) = 0, 5 P(0 < Z < 1, 0) = 0, 5 0, 3413 = 0, 1587
Assim a probabilidade da empresa pagar o bonus de 0,1587.
Um membro da direo da fbrica diz que se a empresa tiver produo mdia diria entre
9000 e 9500 gales em um ms anterior, no tem como pagar o bnus mesmo que o funcionrios
tenha excedido os 11000gales. Nesse caso qQual a probabilidade no pagar o bnus.
Quero saber P(9000 < x < 9500), primeiro vamos padronizar esta varivel
z
1
=
x
1

=
9000 10000
1000
= 1 z
2
=
x
2

=
9500 10000
1000
= 0, 5
Ento
P(9000 < x < 9500) = P(1 < z < 0, 5)
Como na tabela tem apenas valores postivos e a distribuio normal simtrica temos que
P(1 < z < 0, 5) = P(0, 5 < z < 1, 0)
Utilizando a tabela temos que
P(0, 5 < z < 1, 0) = P(0 < z < 1, 0) P(0 < z < 0, 5) = 0, 3413 0, 1915 = 0, 1498
Assim, a probabilidade de P(9000 < x < 9500) = 0, 1498
Noes de Probabilidade 53
Qual a probabilidade da empresa produzir entre 9500 e 11000 gales por dia. Utilizando as
padronizaes j realizadas temos que
P(9000 < x < 11000) = P(0, 5 < z < 1, 0)
Assim,
P(0, 5 < z < 1, 0) = P(0 < z < 1, 0) +P(0 < z < 0, 5) = 0, 3413 + 0, 1915 = 0, 5328
Noes de Probabilidade 54
Tabela 3.2: Distribuio Normal - probabilidade do valor de z padronizado estar entre 0 e o valor
tabulado nas margens
z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
0,0 0,0000 0,0040 0,0080 0,0120 0,0160 0,0199 0,0239 0,0279 0,0319 0,0359
0,1 0,0398 0,0438 0,0478 0,0517 0,0557 0,0596 0,0636 0,0675 0,0714 0,0753
0,2 0,0793 0,0832 0,0871 0,0910 0,0948 0,0987 0,1026 0,1064 0,1103 0,1141
0,3 0,1179 0,1217 0,1255 0,1293 0,1331 0,1368 0,1406 0,1443 0,1480 0,1517
0,4 0,1554 0,1591 0,1628 0,1664 0,1700 0,1736 0,1772 0,1808 0,1844 0,1879
0,5 0,1915 0,1950 0,1985 0,2019 0,2054 0,2088 0,2123 0,2157 0,2190 0,2224
0,6 0,2257 0,2291 0,2324 0,2357 0,2389 0,2422 0,2454 0,2486 0,2517 0,2549
0,7 0,2580 0,2611 0,2642 0,2673 0,2704 0,2734 0,2764 0,2794 0,2823 0,2852
0,8 0,2881 0,2910 0,2939 0,2967 0,2995 0,3023 0,3051 0,3078 0,3106 0,3133
0,9 0,3159 0,3186 0,3212 0,3238 0,3264 0,3289 0,3315 0,3340 0,3365 0,3389
1,0 0,3413 0,3438 0,3461 0,3485 0,3508 0,3531 0,3554 0,3577 0,3599 0,3621
1,1 0,3643 0,3665 0,3686 0,3708 0,3729 0,3749 0,3770 0,3790 0,3810 0,3830
1,2 0,3849 0,3869 0,3888 0,3907 0,3925 0,3944 0,3962 0,3980 0,3997 0,4015
1,3 0,4032 0,4049 0,4066 0,4082 0,4099 0,4115 0,4131 0,4147 0,4162 0,4177
1,4 0,4192 0,4207 0,4222 0,4236 0,4251 0,4265 0,4279 0,4292 0,4306 0,4319
1,5 0,4332 0,4345 0,4357 0,4370 0,4382 0,4394 0,4406 0,4418 0,4429 0,4441
1,6 0,4452 0,4463 0,4474 0,4484 0,4495 0,4505 0,4515 0,4525 0,4535 0,4545
1,7 0,4554 0,4564 0,4573 0,4582 0,4591 0,4599 0,4608 0,4616 0,4625 0,4633
1,8 0,4641 0,4649 0,4656 0,4664 0,4671 0,4678 0,4686 0,4693 0,4699 0,4706
1,9 0,4713 0,4719 0,4726 0,4732 0,4738 0,4744 0,4750 0,4756 0,4761 0,4767
2,0 0,4772 0,4778 0,4783 0,4788 0,4793 0,4798 0,4803 0,4808 0,4812 0,4817
2,1 0,4821 0,4826 0,4830 0,4834 0,4838 0,4842 0,4846 0,4850 0,4854 0,4857
2,2 0,4861 0,4864 0,4868 0,4871 0,4875 0,4878 0,4881 0,4884 0,4887 0,4890
2,3 0,4893 0,4896 0,4898 0,4901 0,4904 0,4906 0,4909 0,4911 0,4913 0,4916
2,4 0,4918 0,4920 0,4922 0,4925 0,4927 0,4929 0,4931 0,4932 0,4934 0,4936
2,5 0,4938 0,4940 0,4941 0,4943 0,4945 0,4946 0,4948 0,4949 0,4951 0,4952
2,6 0,4953 0,4955 0,4956 0,4957 0,4959 0,4960 0,4961 0,4962 0,4963 0,4964
2,7 0,4965 0,4966 0,4967 0,4968 0,4969 0,4970 0,4971 0,4972 0,4973 0,4974
2,8 0,4974 0,4975 0,4976 0,4977 0,4977 0,4978 0,4979 0,4979 0,4980 0,4981
2,9 0,4981 0,4982 0,4982 0,4983 0,4984 0,4984 0,4985 0,4985 0,4986 0,4986
3,0 0,4987 0,4987 0,4987 0,4988 0,4988 0,4989 0,4989 0,4989 0,4990 0,4990
3,1 0,4990 0,4991 0,4991 0,4991 0,4992 0,4992 0,4992 0,4992 0,4993 0,4993
3,2 0,4993 0,4993 0,4994 0,4994 0,4994 0,4994 0,4994 0,4995 0,4995 0,4995
3,3 0,4995 0,4995 0,4995 0,4996 0,4996 0,4996 0,4996 0,4996 0,4996 0,4997
3,4 0,4997 0,4997 0,4997 0,4997 0,4997 0,4997 0,4997 0,4997 0,4997 0,4998
3,5 0,4998 0,4998 0,4998 0,4998 0,4998 0,4998 0,4998 0,4998 0,4998 0,4998
3,6 0,4998 0,4998 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999
3,7 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999
3,8 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999
3,9 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000
Noes de Probabilidade 55
3.5 DISTRIBUIES AMOSTRAIS
Ao retirarmos uma amostra aleatria de uma populao e calcularmos a partir desta amostra
qualquer quantidade, encontramos a estatstica, ou seja, chamaremos os valores calculados em
funo dos elementos da amostra de estatsticas.
3.5.1 Distribuio Amostral da Mdia (X)
Se considerarmos o processo de seleo de uma amostra aleatria simples como um experi-
mento, a mdia da amostra X a descrio numrica do resultado do experimento. Assim, a
mdia da amostra X uma varivel aleatria. Como resultado, tal como outras variveis aleat-
rias, X tem uma mdia ou um valor esperado, uma varincia e uma distribuio de probabilidade.
Como os valores possveis de X so os resultados de diferentes amostras aleatrias simples, a
distribuio da probabilidade de X chamada de distribuio amostral. Pode-se assim dizer que
a mdia aleatria X o valor esperado de , isto , E(X) = , em que a mdia da populao.
Seja
2
X
a varincia da distribuio de amostragem de X; por propriedade da varincia est
sera
2
X
=

2
n
3.5.1.1 Teorema do Limite Central (TLC)
Ao selecionar amostras aleatrias simples de tamanho n a partir de uma populao com
parmetros (,
2
) a distribuio amostral da mdia das amostras X pode ser aproximada pela
distribuio normal de probabilidade medida que o tamanho de amostra se torna maior.Assim:
Se a populao tem distribuio normal, ento a mdia amostral ter uma distribuio
aproximadamente normal, independentemente da forma da distribuio de frequncias da
populao de onde foi retirada a amostra;
Se o tamanho n da amostra for sucientemente grande maior ou igual a 30 elementos),
ento a mdia de uma amostra aleatria retirada de uma populao ter uma distribuio
aproximadamente normal, independentemente da forma da distribuio de frequncias da
populao de onde foi retirada a amostra.
Portanto, a distribuio da mdia amostral aproximadamente normal e seus valores de
mdia e desvios padro esto relacionados com mdia
X
= e varincia
2
X
=

2
n
Noes de Probabilidade 56
Como a distribuio da mdia amostral uma distribuio normal, podemos transforma-la
em uma varivel normal padro Z, por meio da expresso
z =
x

n
Exemplo: Uma industria eltrica fabrica lmpadas que tm vida til distribuda com mdia
de 800horas e varincia igual 1600(horas)
2
. Qual a probabilidade de uma amostra aleatria de
tamanho n = 64 ter vida til superio a 806, 65horas
Temos que = 800 e
2
= 1600 e = 40, ento
X
= 800 e
2
X
=
1600
64
,
Queremos P(X > 10, 0), primeiro vamos padronizar
z =
x

n
=
806, 65 800
40

64
=
6, 65
40
8
= 1, 33
Ento:
P(X > 806, 65) = P(z > 1, 33) = 0, 5 P(0 < z < 1, 33) = 0, 5 0, 4082 = 0, 0918
3.5.1.2 Distribuio t de student
A distribuio t de Student aparece naturalmente no problema de se determinar a mdia de
uma populao (que segue a distribuio normal) a partir de uma amostra. Neste problema, no
se sabe qual a mdia ou o desvio padro da populao, mas ela deve ser normal.
A varivel aleatria T dada por:
t =
X
S/

n
segue uma distribuio t de Student com = n 1 graus de liberdade, e a funo de densidade
dada por
f(t) =
(
+1
2
)

2
)
_
1 +
t
2

_
(
+1
2
)
,
Grau de liberdade pode ser entendido como nmero de termos independentes (dimenso da
amostra) a serem avaliados na populao.
Algumas caractersticas da distribuio t de student:
Noes de Probabilidade 57
simtrica em relao a zero;
Todas curvas tem mximo em t = 0;
Existe uma curva para cada tamanho de amostra (n) e o valor = n1 (nmero de graus
de liberdade) usado para obteno de valores na tabela;
A medida que n cresce a distribuio t se aproxima da normal padro z;
Valores de probabilidade de t so obtidos em tabelas. A tabela de t informa o valor acima
do qual se encontra a area
Exemplo: Seja uma amostra n = 15. Qual o valor de t acima do qual tem-se 5% de
probabilidade. = 0, 05, = 15 1 = 14, pela tabela temos que t=1,761
Exemplo: Qual o valor de t acima do qual tem-se 90% de probabilidade = 0, 90; =
15 1 = 14, pela simetria da distribuio o valor que deixa 10% da rea sua esquerda com o
sinal negativo.
= 0, 10; = 15 1 = 14, ento t = 1, 345, pela simetria = 0, 90; = 15 1 = 14,
t = 1, 345
Noes de Probabilidade 58
3.5.2 Distribuio amostral para proporo
Considere que uma populao a proporo de elementos que portadores de certa caracterstica
p . Denindo uma varivel aleatria, da seguinte maneira
X =
_
1 se o indivduo for portador da caractristica
0 se o indivduo nofor portador da caractristica
Logo E(X) = p e V ar(X) =
2
.
Como os resultados individuais so 0 (fracasso) ou 1 (sucesso), temos que Y =

n
i=1
x
i
o total de indivduos de resultados em n ensaios, que correspondem aos sucessos (indivduo
for portador da caracterstica), porque aos resultados que correspondem aos fracassos, esto
associados o valor zero.
Assim, Y tem distribuio binomial com parmetros n (tamanho da amostra) e p (proporo
de indivduos portadores da caracterstica), em que:
p =
Y
n
=
n

i=1
x
i
n
ou seja,p igual mdia da varivel aleatria X
Como Y tem distribuio binomial b(n, p), com mdia = np e varincia
2
= npq. Conse-
quentemente,
E[p] = E
_
Y
n
_
=
1
n
E[Y ] =
1
n
np = p
V ar[p] = E
_
Y
n
_
=
1
n
2
E[Y ] =
1
n
2
npq =
pq
n
Assim, pelo Teorema Limite Central, quando n grande (n > 30), a proporo amostral p de
sucessos em n ensaios de Bernoulli tem distribuio aproximadamente normal com mdia = p
e varincia
2
=
pq
n
, e assim podemos utilizar a padronizao:
z =
p

=
p p
_
pq
n
exemplo:
Noes de Probabilidade 59
3.5.3 Distribuio Amostral da Varincia
3.5.3.1 Distribuio Qui-Quadrado
H casos em que se est mais interessado na varincia do que na mdia da amostra. Por
exemplo, em las de espera. Mesmo conhecendo-se o tempo mdio de espera, a informao do
grau de variabilidade deste tempo importante. A distribuio usada neste caso conhecida
como Distribuio Qui-Quadrado, denida como:

2
=
(n 1)S
2

2
e a funo de densidade dada por
f(x) =
1
2
/2
(/2)
x
/21
e
x/2
I
{x0}
,
Da mesma forma que a distribuio t, existe uma curva para distribuio Qui-quadrado para
cada tamanho de amostra (n) e o valor = n 1 (nmero de graus de liberdade) usado para
obteno de valores na tabela.
A tabela de
2
fornece o valor acima do qual encontra-se a rea
Exemplo: Uma amostra com n = 15. Qual o valor que deixa sua direita 5% da rea?
= 0, 05, = 15 1 = 14, pela tabela temos que t=1,761
3.5.3.2 Distribuio F
A distribuio F est entre aquela distribuies de probabilidade mais importantes na esta-
tstica, tem maior destaque na rea de experimentao agrcola. Essa distribuio denida pela
Noes de Probabilidade 60
varivel resultante da razo duas varincias:
F =
S
2
1

2
1
S
2
2

2
2
e a funo de densidade dada por
f(x) =

1
+
2
2
_
_

2
_

1
2
x

1
2
1

1
2
_

2
2
_
_
1 +

1
x

2
_

1
+
2
2
Para se obter valores tabelados da distribuio F, necessrio observar dois graus de libera-
dade
1
= n
1
1 e
2
= n
2
1, o primeiro associado varincia amostral do numerador, e o
segundo associado varincia amostral do denominador.
A tabela de F informa o valor acima do qual se encontra a area e existe uma tabela para
cada valor e diferentes combinaes de
1
e
2
.
Exemplo: Para duas amostras de F
Noes de Probabilidade 61
Tabela 3.3: Distribuio t de student - valores para P(t > t
c
) = , considerando =
0, 250; 0, 200; 0, 150; 0, 100; 0, 050; 0, 025; 0, 010; 0, 005; 0, 001.
GL
= n 1 0,250 0,200 0,150 0,100 0,050 0,025 0,010 0,005 0,001
1 1,000 1,376 1,963 3,078 6,314 12,706 31,821 63,656 318,289
2 0,816 1,061 1,386 1,886 2,920 4,303 6,965 9,925 22,328
3 0,765 0,978 1,250 1,638 2,353 3,182 4,541 5,841 10,214
4 0,741 0,941 1,190 1,533 2,132 2,776 3,747 4,604 7,173
5 0,727 0,920 1,156 1,476 2,015 2,571 3,365 4,032 5,894
6 0,718 0,906 1,134 1,440 1,943 2,447 3,143 3,707 5,208
7 0,711 0,896 1,119 1,415 1,895 2,365 2,998 3,499 4,785
8 0,706 0,889 1,108 1,397 1,860 2,306 2,896 3,355 4,501
9 0,703 0,883 1,100 1,383 1,833 2,262 2,821 3,250 4,297
10 0,700 0,879 1,093 1,372 1,812 2,228 2,764 3,169 4,144
11 0,697 0,876 1,088 1,363 1,796 2,201 2,718 3,106 4,025
12 0,695 0,873 1,083 1,356 1,782 2,179 2,681 3,055 3,930
13 0,694 0,870 1,079 1,350 1,771 2,160 2,650 3,012 3,852
14 0,692 0,868 1,076 1,345 1,761 2,145 2,624 2,977 3,787
15 0,691 0,866 1,074 1,341 1,753 2,131 2,602 2,947 3,733
16 0,690 0,865 1,071 1,337 1,746 2,120 2,583 2,921 3,686
17 0,689 0,863 1,069 1,333 1,740 2,110 2,567 2,898 3,646
18 0,688 0,862 1,067 1,330 1,734 2,101 2,552 2,878 3,610
19 0,688 0,861 1,066 1,328 1,729 2,093 2,539 2,861 3,579
20 0,687 0,860 1,064 1,325 1,725 2,086 2,528 2,845 3,552
21 0,686 0,859 1,063 1,323 1,721 2,080 2,518 2,831 3,527
22 0,686 0,858 1,061 1,321 1,717 2,074 2,508 2,819 3,505
23 0,685 0,858 1,060 1,319 1,714 2,069 2,500 2,807 3,485
24 0,685 0,857 1,059 1,318 1,711 2,064 2,492 2,797 3,467
25 0,684 0,856 1,058 1,316 1,708 2,060 2,485 2,787 3,450
26 0,684 0,856 1,058 1,315 1,706 2,056 2,479 2,779 3,435
27 0,684 0,855 1,057 1,314 1,703 2,052 2,473 2,771 3,421
28 0,683 0,855 1,056 1,313 1,701 2,048 2,467 2,763 3,408
29 0,683 0,854 1,055 1,311 1,699 2,045 2,462 2,756 3,396
30 0,683 0,854 1,055 1,310 1,697 2,042 2,457 2,750 3,385
40 0,681 0,851 1,050 1,303 1,684 2,021 2,423 2,704 3,307
50 0,679 0,849 1,047 1,299 1,676 2,009 2,403 2,678 3,261
60 0,679 0,848 1,045 1,296 1,671 2,000 2,390 2,660 3,232
80 0,678 0,846 1,043 1,292 1,664 1,990 2,374 2,639 3,195
100 0,677 0,845 1,042 1,290 1,660 1,984 2,364 2,626 3,174
120 0,677 0,845 1,041 1,289 1,658 1,980 2,358 2,617 3,160
240 0,676 0,843 1,039 1,285 1,651 1,970 2,342 2,596 3,125
480 0,675 0,842 1,038 1,283 1,648 1,965 2,334 2,586 3,107
700 0,675 0,842 1,037 1,283 1,647 1,963 2,332 2,583 3,102
1000 0,675 0,842 1,037 1,282 1,646 1,962 2,330 2,581 3,098
Noes de Probabilidade 62
Tabela 3.4: Disitruio Qui-quadrado - Valores de
2
para P(
2
>
2
c
com =
0, 995; 0, 9900, 975; 0, 950; 0, 900; 0, 750; 0, 500; 0, 250; 0, 100; 0, 050; 0, 025; 0, 010; 0, 005.
n
0,995 0,990 0,975 0,950 0,900 0,750 0,500 0,250 0,100 0,050 0,025 0,010 0,005
1 3,93E-05 1,57E-04 0,001 0,004 0,016 0,102 0,455 1,323 2,706 3,841 5,024 6,635 7,879
2 0,010 0,020 0,051 0,103 0,211 0,575 1,386 2,773 4,605 5,991 7,378 9,210 10,597
3 0,072 0,115 0,216 0,352 0,584 1,213 2,366 4,108 6,251 7,815 9,348 11,345 12,838
4 0,207 0,297 0,484 0,711 1,064 1,923 3,357 5,385 7,779 9,488 11,143 13,277 14,860
5 0,412 0,554 0,831 1,145 1,610 2,675 4,351 6,626 9,236 11,070 12,832 15,086 16,750
6 0,676 0,872 1,237 1,635 2,204 3,455 5,348 7,841 10,645 12,592 14,449 16,812 18,548
7 0,989 1,239 1,690 2,167 2,833 4,255 6,346 9,037 12,017 14,067 16,013 18,475 20,278
8 1,344 1,647 2,180 2,733 3,490 5,071 7,344 10,219 13,362 15,507 17,535 20,090 21,955
9 1,735 2,088 2,700 3,325 4,168 5,899 8,343 11,389 14,684 16,919 19,023 21,666 23,589
10 2,156 2,558 3,247 3,940 4,865 6,737 9,342 12,549 15,987 18,307 20,483 23,209 25,188
11 2,603 3,053 3,816 4,575 5,578 7,584 10,341 13,701 17,275 19,675 21,920 24,725 26,757
12 3,074 3,571 4,404 5,226 6,304 8,438 11,340 14,845 18,549 21,026 23,337 26,217 28,300
13 3,565 4,107 5,009 5,892 7,041 9,299 12,340 15,984 19,812 22,362 24,736 27,688 29,819
14 4,075 4,660 5,629 6,571 7,790 10,165 13,339 17,117 21,064 23,685 26,119 29,141 31,319
15 4,601 5,229 6,262 7,261 8,547 11,037 14,339 18,245 22,307 24,996 27,488 30,578 32,801
16 5,142 5,812 6,908 7,962 9,312 11,912 15,338 19,369 23,542 26,296 28,845 32,000 34,267
17 5,697 6,408 7,564 8,672 10,085 12,792 16,338 20,489 24,769 27,587 30,191 33,409 35,718
18 6,265 7,015 8,231 9,390 10,865 13,675 17,338 21,605 25,989 28,869 31,526 34,805 37,156
19 6,844 7,633 8,907 10,117 11,651 14,562 18,338 22,718 27,204 30,144 32,852 36,191 38,582
20 7,434 8,260 9,591 10,851 12,443 15,452 19,337 23,828 28,412 31,410 34,170 37,566 39,997
21 8,034 8,897 10,283 11,591 13,240 16,344 20,337 24,935 29,615 32,671 35,479 38,932 41,401
22 8,643 9,542 10,982 12,338 14,041 17,240 21,337 26,039 30,813 33,924 36,781 40,289 42,796
23 9,260 10,196 11,689 13,091 14,848 18,137 22,337 27,141 32,007 35,172 38,076 41,638 44,181
24 9,886 10,856 12,401 13,848 15,659 19,037 23,337 28,241 33,196 36,415 39,364 42,980 45,558
25 10,520 11,524 13,120 14,611 16,473 19,939 24,337 29,339 34,382 37,652 40,646 44,314 46,928
26 11,160 12,198 13,844 15,379 17,292 20,843 25,336 30,435 35,563 38,885 41,923 45,642 48,290
27 11,808 12,878 14,573 16,151 18,114 21,749 26,336 31,528 36,741 40,113 43,195 46,963 49,645
28 12,461 13,565 15,308 16,928 18,939 22,657 27,336 32,620 37,916 41,337 44,461 48,278 50,994
29 13,121 14,256 16,047 17,708 19,768 23,567 28,336 33,711 39,087 42,557 45,722 49,588 52,335
30 13,787 14,953 16,791 18,493 20,599 24,478 29,336 34,800 40,256 43,773 46,979 50,892 53,672
40 20,707 22,164 24,433 26,509 29,051 33,660 39,335 45,616 51,805 55,758 59,342 63,691 66,766
50 27,991 29,707 32,357 34,764 37,689 42,942 49,335 56,334 63,167 67,505 71,420 76,154 79,490
60 35,534 37,485 40,482 43,188 46,459 52,294 59,335 66,981 74,397 79,082 83,298 88,379 91,952
70 43,275 45,442 48,758 51,739 55,329 61,698 69,334 77,577 85,527 90,531 95,023 100,425 104,215
80 51,172 53,540 57,153 60,391 64,278 71,145 79,334 88,130 96,578 101,879 106,629 112,329 116,321
90 59,196 61,754 65,647 69,126 73,291 80,625 89,334 98,650 107,565 113,145 118,136 124,116 128,299
100 67,328 70,065 74,222 77,929 82,358 90,133 99,334 109,141 118,498 124,342 129,561 135,807 140,170
Noes de Probabilidade 63
Tabela 3.5: Limites unilaterais de F ao nvel de 10% de probabilidade com os graus de liberdade

1
e
2

2

1
1 2 3 4 5 6 7 8 9 10 11
1 39,863 49,500 53,593 55,833 57,240 58,204 58,906 59,439 59,858 60,195 60,473
2 8,526 9,000 9,162 9,243 9,293 9,326 9,349 9,367 9,381 9,392 9,401
3 5,538 5,462 5,391 5,343 5,309 5,285 5,266 5,252 5,240 5,230 5,222
4 4,545 4,325 4,191 4,107 4,051 4,010 3,979 3,955 3,936 3,920 3,907
5 4,060 3,780 3,619 3,520 3,453 3,405 3,368 3,339 3,316 3,297 3,282
6 3,776 3,463 3,289 3,181 3,108 3,055 3,014 2,983 2,958 2,937 2,920
7 3,589 3,257 3,074 2,961 2,883 2,827 2,785 2,752 2,725 2,703 2,684
8 3,458 3,113 2,924 2,806 2,726 2,668 2,624 2,589 2,561 2,538 2,519
9 3,360 3,006 2,813 2,693 2,611 2,551 2,505 2,469 2,440 2,416 2,396
10 3,285 2,924 2,728 2,605 2,522 2,461 2,414 2,377 2,347 2,323 2,302
11 3,225 2,860 2,660 2,536 2,451 2,389 2,342 2,304 2,274 2,248 2,227
12 3,177 2,807 2,606 2,480 2,394 2,331 2,283 2,245 2,214 2,188 2,166
13 3,136 2,763 2,560 2,434 2,347 2,283 2,234 2,195 2,164 2,138 2,116
14 3,102 2,726 2,522 2,395 2,307 2,243 2,193 2,154 2,122 2,095 2,073
15 3,073 2,695 2,490 2,361 2,273 2,208 2,158 2,119 2,086 2,059 2,037
20 2,975 2,589 2,380 2,249 2,158 2,091 2,040 1,999 1,965 1,937 1,913
30 2,881 2,489 2,276 2,142 2,049 1,980 1,927 1,884 1,849 1,819 1,794
40 2,835 2,440 2,226 2,091 1,997 1,927 1,873 1,829 1,793 1,763 1,737
50 2,809 2,412 2,197 2,061 1,966 1,895 1,840 1,796 1,760 1,729 1,703
60 2,791 2,393 2,177 2,041 1,946 1,875 1,819 1,775 1,738 1,707 1,680
120 2,748 2,347 2,130 1,992 1,896 1,824 1,767 1,722 1,684 1,652 1,625
240 2,727 2,325 2,107 1,968 1,871 1,799 1,742 1,696 1,658 1,625 1,598

2

1
12 13 14 15 20 30 40 50 60 120 240
1 60,705 60,903 61,073 61,220 61,740 62,265 62,529 62,688 62,794 63,061 63,194
2 9,408 9,415 9,420 9,425 9,441 9,458 9,466 9,471 9,475 9,483 9,487
3 5,216 5,210 5,205 5,200 5,184 5,168 5,160 5,155 5,151 5,143 5,138
4 3,896 3,886 3,878 3,870 3,844 3,817 3,804 3,795 3,790 3,775 3,768
5 3,268 3,257 3,247 3,238 3,207 3,174 3,157 3,147 3,140 3,123 3,114
6 2,905 2,892 2,881 2,871 2,836 2,800 2,781 2,770 2,762 2,742 2,732
7 2,668 2,654 2,643 2,632 2,595 2,555 2,535 2,523 2,514 2,493 2,482
8 2,502 2,488 2,475 2,464 2,425 2,383 2,361 2,348 2,339 2,316 2,304
9 2,379 2,364 2,351 2,340 2,298 2,255 2,232 2,218 2,208 2,184 2,172
10 2,284 2,269 2,255 2,244 2,201 2,155 2,132 2,117 2,107 2,082 2,069
11 2,209 2,193 2,179 2,167 2,123 2,076 2,052 2,036 2,026 2,000 1,986
12 2,147 2,131 2,117 2,105 2,060 2,011 1,986 1,970 1,960 1,932 1,918
13 2,097 2,080 2,066 2,053 2,007 1,958 1,931 1,915 1,904 1,876 1,861
14 2,054 2,037 2,022 2,010 1,962 1,912 1,885 1,869 1,857 1,828 1,813
15 2,017 2,000 1,985 1,972 1,924 1,873 1,845 1,828 1,817 1,787 1,771
20 1,892 1,875 1,859 1,845 1,794 1,738 1,708 1,690 1,677 1,643 1,626
30 1,773 1,754 1,737 1,722 1,667 1,606 1,573 1,552 1,538 1,499 1,478
40 1,715 1,695 1,678 1,662 1,605 1,541 1,506 1,483 1,467 1,425 1,402
50 1,680 1,660 1,643 1,627 1,568 1,502 1,465 1,441 1,424 1,379 1,354
60 1,657 1,637 1,619 1,603 1,543 1,476 1,437 1,413 1,395 1,348 1,321
120 1,601 1,580 1,562 1,545 1,482 1,409 1,368 1,340 1,320 1,265 1,232
240 1,573 1,552 1,533 1,516 1,451 1,376 1,332 1,302 1,281 1,219 1,180
Noes de Probabilidade 64
Tabela 3.6: Limites unilaterais de F ao nvel de 5% de probabilidade com os graus de liberdade

1
e
2

2

1
1 2 3 4 5 6 7 8 9 10 11
1 161,448 199,500 215,707 224,583 230,162 233,986 236,768 238,883 240,543 241,882 242,983
2 18,513 19,000 19,164 19,247 19,296 19,330 19,353 19,371 19,385 19,396 19,405
3 10,128 9,552 9,277 9,117 9,013 8,941 8,887 8,845 8,812 8,786 8,763
4 7,709 6,944 6,591 6,388 6,256 6,163 6,094 6,041 5,999 5,964 5,936
5 6,608 5,786 5,409 5,192 5,050 4,950 4,876 4,818 4,772 4,735 4,704
6 5,987 5,143 4,757 4,534 4,387 4,284 4,207 4,147 4,099 4,060 4,027
7 5,591 4,737 4,347 4,120 3,972 3,866 3,787 3,726 3,677 3,637 3,603
8 5,318 4,459 4,066 3,838 3,687 3,581 3,500 3,438 3,388 3,347 3,313
9 5,117 4,256 3,863 3,633 3,482 3,374 3,293 3,230 3,179 3,137 3,102
10 4,965 4,103 3,708 3,478 3,326 3,217 3,135 3,072 3,020 2,978 2,943
11 4,844 3,982 3,587 3,357 3,204 3,095 3,012 2,948 2,896 2,854 2,818
12 4,747 3,885 3,490 3,259 3,106 2,996 2,913 2,849 2,796 2,753 2,717
13 4,667 3,806 3,411 3,179 3,025 2,915 2,832 2,767 2,714 2,671 2,635
14 4,600 3,739 3,344 3,112 2,958 2,848 2,764 2,699 2,646 2,602 2,565
15 4,543 3,682 3,287 3,056 2,901 2,790 2,707 2,641 2,588 2,544 2,507
20 4,351 3,493 3,098 2,866 2,711 2,599 2,514 2,447 2,393 2,348 2,310
30 4,171 3,316 2,922 2,690 2,534 2,421 2,334 2,266 2,211 2,165 2,126
40 4,085 3,232 2,839 2,606 2,449 2,336 2,249 2,180 2,124 2,077 2,038
50 4,034 3,183 2,790 2,557 2,400 2,286 2,199 2,130 2,073 2,026 1,986
60 4,001 3,150 2,758 2,525 2,368 2,254 2,167 2,097 2,040 1,993 1,952
120 3,920 3,072 2,680 2,447 2,290 2,175 2,087 2,016 1,959 1,910 1,869
240 3,880 3,033 2,642 2,409 2,252 2,136 2,048 1,977 1,919 1,870 1,829

2

1
12 13 14 15 20 30 40 50 60 120 240
1 243,906 244,690 245,364 245,950 248,013 250,095 251,143 251,774 252,196 253,253 253,783
2 19,413 19,419 19,424 19,429 19,446 19,462 19,471 19,476 19,479 19,487 19,492
3 8,745 8,729 8,715 8,703 8,660 8,617 8,594 8,581 8,572 8,549 8,538
4 5,912 5,891 5,873 5,858 5,803 5,746 5,717 5,699 5,688 5,658 5,643
5 4,678 4,655 4,636 4,619 4,558 4,496 4,464 4,444 4,431 4,398 4,382
6 4,000 3,976 3,956 3,938 3,874 3,808 3,774 3,754 3,740 3,705 3,687
7 3,575 3,550 3,529 3,511 3,445 3,376 3,340 3,319 3,304 3,267 3,249
8 3,284 3,259 3,237 3,218 3,150 3,079 3,043 3,020 3,005 2,967 2,947
9 3,073 3,048 3,025 3,006 2,936 2,864 2,826 2,803 2,787 2,748 2,727
10 2,913 2,887 2,865 2,845 2,774 2,700 2,661 2,637 2,621 2,580 2,559
11 2,788 2,761 2,739 2,719 2,646 2,570 2,531 2,507 2,490 2,448 2,426
12 2,687 2,660 2,637 2,617 2,544 2,466 2,426 2,401 2,384 2,341 2,319
13 2,604 2,577 2,554 2,533 2,459 2,380 2,339 2,314 2,297 2,252 2,230
14 2,534 2,507 2,484 2,463 2,388 2,308 2,266 2,241 2,223 2,178 2,155
15 2,475 2,448 2,424 2,403 2,328 2,247 2,204 2,178 2,160 2,114 2,090
20 2,278 2,250 2,225 2,203 2,124 2,039 1,994 1,966 1,946 1,896 1,870
30 2,092 2,063 2,037 2,015 1,932 1,841 1,792 1,761 1,740 1,683 1,654
40 2,003 1,974 1,948 1,924 1,839 1,744 1,693 1,660 1,637 1,577 1,544
50 1,952 1,921 1,895 1,871 1,784 1,687 1,634 1,599 1,576 1,511 1,476
60 1,917 1,887 1,860 1,836 1,748 1,649 1,594 1,559 1,534 1,467 1,430
120 1,834 1,803 1,775 1,750 1,659 1,554 1,495 1,457 1,429 1,352 1,307
240 1,793 1,761 1,733 1,708 1,614 1,507 1,445 1,404 1,375 1,290 1,237
Noes de Probabilidade 65
Tabela 3.7: Limites unilaterais de F ao nvel de 2,5% de probabilidade com os graus de liberdade

1
e
2

2

1
1 2 3 4 5 6 7 8 9 10 11
1 647,789 799,500 864,163 899,583 921,848 937,111 948,217 956,656 963,285 968,627 973,025
2 38,506 39,000 39,165 39,248 39,298 39,331 39,355 39,373 39,387 39,398 39,407
3 17,443 16,044 15,439 15,101 14,885 14,735 14,624 14,540 14,473 14,419 14,374
4 12,218 10,649 9,979 9,605 9,364 9,197 9,074 8,980 8,905 8,844 8,794
5 10,007 8,434 7,764 7,388 7,146 6,978 6,853 6,757 6,681 6,619 6,568
6 8,813 7,260 6,599 6,227 5,988 5,820 5,695 5,600 5,523 5,461 5,410
7 8,073 6,542 5,890 5,523 5,285 5,119 4,995 4,899 4,823 4,761 4,709
8 7,571 6,059 5,416 5,053 4,817 4,652 4,529 4,433 4,357 4,295 4,243
9 7,209 5,715 5,078 4,718 4,484 4,320 4,197 4,102 4,026 3,964 3,912
10 6,937 5,456 4,826 4,468 4,236 4,072 3,950 3,855 3,779 3,717 3,665
11 6,724 5,256 4,630 4,275 4,044 3,881 3,759 3,664 3,588 3,526 3,474
12 6,554 5,096 4,474 4,121 3,891 3,728 3,607 3,512 3,436 3,374 3,321
13 6,414 4,965 4,347 3,996 3,767 3,604 3,483 3,388 3,312 3,250 3,197
14 6,298 4,857 4,242 3,892 3,663 3,501 3,380 3,285 3,209 3,147 3,095
15 6,200 4,765 4,153 3,804 3,576 3,415 3,293 3,199 3,123 3,060 3,008
20 5,871 4,461 3,859 3,515 3,289 3,128 3,007 2,913 2,837 2,774 2,721
30 5,568 4,182 3,589 3,250 3,026 2,867 2,746 2,651 2,575 2,511 2,458
40 5,424 4,051 3,463 3,126 2,904 2,744 2,624 2,529 2,452 2,388 2,334
50 5,340 3,975 3,390 3,054 2,833 2,674 2,553 2,458 2,381 2,317 2,263
60 5,286 3,925 3,343 3,008 2,786 2,627 2,507 2,412 2,334 2,270 2,216
120 5,152 3,805 3,227 2,894 2,674 2,515 2,395 2,299 2,222 2,157 2,102
240 5,088 3,746 3,171 2,839 2,620 2,461 2,341 2,245 2,167 2,102 2,047

2

1
12 13 14 15 20 30 40 50 60 120 240
1 976,708 979,837 982,528 984,867 993,103 1001,414 1005,598 1008,117 1009,800 1014,020 1016,137
2 39,415 39,421 39,427 39,431 39,448 39,465 39,473 39,478 39,481 39,490 39,494
3 14,337 14,304 14,277 14,253 14,167 14,081 14,037 14,010 13,992 13,947 13,925
4 8,751 8,715 8,684 8,657 8,560 8,461 8,411 8,381 8,360 8,309 8,283
5 6,525 6,488 6,456 6,428 6,329 6,227 6,175 6,144 6,123 6,069 6,042
6 5,366 5,329 5,297 5,269 5,168 5,065 5,012 4,980 4,959 4,904 4,877
7 4,666 4,628 4,596 4,568 4,467 4,362 4,309 4,276 4,254 4,199 4,171
8 4,200 4,162 4,130 4,101 3,999 3,894 3,840 3,807 3,784 3,728 3,699
9 3,868 3,831 3,798 3,769 3,667 3,560 3,505 3,472 3,449 3,392 3,363
10 3,621 3,583 3,550 3,522 3,419 3,311 3,255 3,221 3,198 3,140 3,110
11 3,430 3,392 3,359 3,330 3,226 3,118 3,061 3,027 3,004 2,944 2,914
12 3,277 3,239 3,206 3,177 3,073 2,963 2,906 2,871 2,848 2,787 2,756
13 3,153 3,115 3,082 3,053 2,948 2,837 2,780 2,744 2,720 2,659 2,628
14 3,050 3,012 2,979 2,949 2,844 2,732 2,674 2,638 2,614 2,552 2,520
15 2,963 2,925 2,891 2,862 2,756 2,644 2,585 2,549 2,524 2,461 2,429
20 2,676 2,637 2,603 2,573 2,464 2,349 2,287 2,249 2,223 2,156 2,121
30 2,412 2,372 2,338 2,307 2,195 2,074 2,009 1,968 1,940 1,866 1,827
40 2,288 2,248 2,213 2,182 2,068 1,943 1,875 1,832 1,803 1,724 1,682
50 2,216 2,176 2,140 2,109 1,993 1,866 1,796 1,752 1,721 1,639 1,594
60 2,169 2,129 2,093 2,061 1,944 1,815 1,744 1,699 1,667 1,581 1,534
120 2,055 2,014 1,977 1,945 1,825 1,690 1,614 1,565 1,530 1,433 1,376
240 1,999 1,958 1,921 1,888 1,766 1,628 1,549 1,497 1,460 1,354 1,289
4
INFERNCIA ESTATSTICA
Nas geologia, assim como em qualquer outra cincia, existe a necessidade de obter-se con-
cluses (fazer inferncias) a respeito de parmetros de uma populao. A impossibilidade de
avaliar toda a populao faz com que a partir de amostras possamos obter estimativas daqueles
parmetros. A teoria da estimao preocupa-se com a obteno do respectivo estimador para
um determinado parmetro.
Parmetro: uma constante (um nmero) que caracteriza uma populao. Exemplo: mdia
populacional , varincia populacional
2
, etc. Em geral, os parmetros so desconhecidos.
Estimador: uma expresso algbrica utilizada para obter um valor aproximado de um
parmetro. Exemplo:
X =
n

i=1
x
i
n
.
Estimativa: o valor numrico de um estimador. determinada usando os dados amostrais.
Exemplo: Mediante uma pesquisa queremos conhecer o tamanho mdio da superfcie agrcola
produtiva das propriedades rurais do Brasil.
Populao: Todas as propriedades rurais do Brasil;
Amostra: por exemplo, 500 propriedades;
Parmetro: Tamanho mdio da superfcie agrcola produtiva .
Estimador:
X =
n

i=1
x
i
n
.
Estimativa: X = 5 alqueires (valor aproximado para ) .
4.1 ESTIMAO
um processo de induo, na qual usamos dados extrados de uma amostra para produzir
inferncia sobre a populao. Esta inferncia s ser vlida se a amostra for signicativa.
Inferncia Estatstica 67
Tipos de Estimaes de Parmetros
1. Estimao Pontual;
2. Estimao Intervalar
4.1.1 Estimao Pontual
usada quando a partir da amostra procura-se obter um nico valor de certo parmetro
populacional, ou seja, obter estimativas a partir dos valores amostrais.
A estimativas so os valores amostrais obtidos para a mdia, varincia, proporo, etc. Os
valores de X, S
2
, S estimam, respectivamente ,
2
e .
4.1.2 Estimao Intervalar
Uma outra maneira de se calcular um estimativa de um parmetro desconhecido, construir
um intervalo de conana [a, b] para esse parmetro com uma probabilidade de 1 (nvel
de conana) de que o intervalo contenha o verdadeiro parmetro, usando as distribuies de
amostragem podemos obter expresses do tipo:
P(a b) = 1
Dessa maneira ser o nvel de signicncia, isto , o erro que se estar cometendo ao armar
que o parmetro est entre o limite inferior e o superior calculado.
4.1.2.1 Intervalo de Conana para proporo p
Consideremos uma populaco cujos elementos podem ser classicados em dois tipos: Sucesso
e Insucesso. Pretende-se estimar a proporo p de sucessos na populao.
Dada uma amostra de tamanho n, uma estimativa pontual de p dada por p =
x
n
. Nesse caso
a estimativa obtida por uma varivel aleatria X que representa o nmero de sucessos contidos
numa amostra de tamanho n. E desta forma temos que X tem uma distribuio binomial. Numa
distribuio binomial podemos utilizar os parmetros caracteristicos n, p e q. Esse parmetros
podem ser utilizados para uma aproximao a uma distribuio normal, considerando = np e

2
= npq.
Assim, se n for sucientemente grande o intervalo de conana para uma proporo pode ser
obtido da seguinte forma:
P
_
p z

2
_
p q
n
p p +z

2
_
p q
n
_
= 1
Exemplo: Foi tomado uma amostra de 30 arenitos, em 12 deles foram encontrados estratica-
o cruzada. Obtenha o intervalo de conana de 95% para proporo de estraticao cruzada
na amostra de arenito.
Nesse caso o sucesso a presena estraticao cruzada em arenito, assim
p =
x
n
=
12
30
= 0, 40
Inferncia Estatstica 68
Como p = 0, 40, temos que q = 1 p = 1 0, 40 = 0, 60
Como queremos o intervalo de conana a 95%, temos que:
1 = 0, 95 = 1 0, 95 = 0, 05

2
=
0, 05
2
= 0, 025
Assim, temos que o valor tabelado de z

2
= 1, 96
P
_
p z

2
_
p q
n
p p +z

2
_
p q
n
_
= 0, 95
P
_
0, 40 1, 96
_
0, 40 0, 60
30
p 0, 40 + 1, 96
_
0, 40 0, 60
30
_
= 0, 95
P (0, 40 0, 08 p 0, 40 + 0, 80) = 0, 95
P (0, 32 p 0, 48) = 0, 95
Assim,
IC
95%
() = [0, 32; 0, 48]
4.1.2.2 Intervalo de Conana para mdia
Na prtica quando no se conhece a mdia X tambm no se conhece a varincia, nesse caso
utilizamos o intervalo de conana:
P
_
X t

2
S

n
X +t

2
S

n
_
= 1
Exemplo: Foi tomada uma amostra de 15 gros de quartzo e medido o maior eixo, fornecendo
uma mdia 1, 2mm e varincia de 0,09mm
2
. Encontre um intervalo de conana de 95% para a
mdia do maior eixo de gros de quartzo.
Primeiramente temos que obter o valor tabelado de t, como queremos o intervalo de conana
a 95%, temos que:
1 = 0, 95 = 1 0, 95 = 0, 05

2
=
0, 05
2
= 0, 025
Olhando na tabela o valor que deixa 0,025 de rea acima com = 15 1 = 14, temos
t

2
= 2, 145 Temos que: X = 1, 2, S
2
= 0, 09 S =

0, 09 = 0, 3
Inferncia Estatstica 69
P
_
X t

2
S

n
X +t

2
S

n
_
= 1
P
_
1, 2 2, 145
0, 3

15
1, 2 + 2, 145
0, 3

15
_
= 0, 95
P (1, 2 0, 17 1, 2 + 0, 166) = 0, 95
P (1, 03 1, 37) = 0, 95
Assim,
IC
95%
() = [1, 03; 1, 37]
Pelo Teorema Limite Central, quando a amostra sucientemente grande (n 30), a mdia
amostral X tem, aproximadamente, distribuico normal de mdia
X
= e varincia
2
X
=

2
n
Assim, a distribuio amostral da mdia amostral uma distribuio normal. Na prtica o
valor de no , em geral, conhecido. Uma vez que a amostra sucientemente grande, a subs-
tituico de pelo seu estimador S na varivel Z, no invalida que esta tenha aproximadamente
distribuico normal. Ento quando n 30 pode-se utilizar a distribuio Normal para obter o
intervalo de conana para a mdia.
P
_
X z

2
S

n
X +z

2
S

n
_
= 1
Exemplo: No exemplo do maior eixo de gros de quartzo suponha que tenho sido tomada
uma amostra de tamanho 121.
Nesse caso temos:
X = 1, 2 S
2
= 0, 09 S =
_
0, 09 = 0, 3 n = 31

2
= 0, 025
Utilizando a distribuio t, temos = 121 1 = 120, ento t

2
= 2, 042
P
_
X t

2
S

n
X +t

2
S

n
_
= 1
P
_
1, 2 1, 98
0, 3

121
1, 2 + 1, 98
0, 3

121
_
= 0, 95
P (1, 2 0, 05 1, 2 + 0, 05) = 0, 95
P (1, 15 1, 25) = 0, 95
Utilizando a distribuio z, temos z

2
= 1, 96
P
_
X t

2
S

n
X +t

2
S

n
_
= 1
P
_
1, 2 1, 96
0, 3

121
1, 2 + 1, 96
0, 3

121
_
= 0, 95
P (1, 2 0, 05 1, 2 + 0, 05) = 0, 95
P (1, 15 1, 25) = 0, 95
Inferncia Estatstica 70
4.1.2.3 Intervalo de Conana para varincia
2
e para o desvio padro
Quando a populao da qual foi amostra foi coletada for Normal, pode-se obter um intervalo
de conana para a varincia
2
dada por:
P
_
(n 1)S
2

2

2

(n 1)S
2

2
_
= 1
e IC para o desvio padro dado por
P
_
(n 1)S
2

2

2

(n 1)S
2

2
= 1
_
Exemplo: No exemplo dos 15 gros de quartzo, obter o intervalo de conana de 95% para a
varincia e para o desvio padro do maior eixo.
Temos que
0,05
2
= 0, 025, nesse caso precisamos obter na tabela Qui-Quadrado o valores
0,025
e
10,025
=
0,975
, com = 14 graus de liberdade, ento

0,025
= 26, 119
0,975
= 5, 629
Nesse exemplo foi fornecido o desvio padro amostral S = 15, assim a varincia amostral
S
2
= 15
2
= 225.
P
_
(n 1)S
2

2

2

(n 1)S
2

2
_
= 0, 95
P
_
14 0, 09
26, 119

2

14 0, 09
5, 629
_
= 0, 95
P
_
0, 0482
2
0, 2238
_
= 0, 95
A partir do intervalo da varincia obtemo o IC do desvio padro
P
_
_
0, 0482
_
0, 2238
_
= 0, 95
P (0, 22 0, 47) = 0, 95
Assim,
IC
95%
(
2
) = [0, 0482; 0, 2238] IC
95%
() = [0, 22; 0, 47]
Inferncia Estatstica 71
4.2 TEORIA DA DECISO ESTATSTICA
4.2.1 Teste de Hiptese
uma metodologia estatstica que permite tomar deciso sobre uma ou mais populaes
baseando no conhecimento de informaes da amostra.
Ao tentarmos a xao de decises, conveniente a formulao de suposies ou de conjeturas
acerca das populaes de interesse, que, em geral, consistem em consideraes sobre parmetros
das mesmas. Essas suposies, que podem ser ou no verdadeiras, so denominadas de Hipteses
Estatsticas, que podem ser:
HIPTESE NULA - aquela Hiptese Estatstica, prexada, formulada sobre o parmetro
populacional estudado, e sempre uma armativa. representada por H
0
.
HIPTESE ALTERNATIVA - So quaisquer hipteses que diram da Hiptese Nula. Pode
ser representada por H
1
ou H
a
Os processos que habilitam a decidir se aceitam ou rejeitam as hipteses formuladas, ou
determinar se a amostra observada difere, de modo signicativo, dos resultados esperados, so
denominados de Testes de Hipteses ou Testes de Signicncia.
Tabela 4.1: Erros possveis de se cometer no processo de tomada de deciso
Decises possveis Estados possveis
Ho verdadeira Ho falsa
Aceitao de Ho Deciso correta Erro do tipo II
Rejeio de Ho Erro do tipo I Deciso correta
Ao testar uma hiptese estabelecida, a probabilidade mxima com a qual se sujeitaria a correr
o risco de um erro do tipo I denominada de Nvel de Signicncia do Teste e representada
por .
Estudaremos testes de hipteses com uma hiptese nula (H
0
) e uma hiptese alternativa
(H
a
). A partir da formulao de (H
0
) e (H
a
), podemos denir se teste de hiptese unilateral
ou bilateral.
Consideremos o parmetro estudado e
0
valor inicialmente suposto para. Podemos formular
as seguintes hipteses:
_
H
0
: =
0
H
1
: =
0
Teste Bilateral
_
H
0
: =
0
H
1
: >
0
Teste Unilateral
_
H
0
: =
0
H
1
: <
0
Teste Unilateral
4.2.2 Teste para uma nica mdia
Suponha que X uma varivel aleatria Normal com mdia desconhecida e varincia
2
desconhecida. E queremos testar a hiptese de que a mdia igual a um certo valor especicado
Inferncia Estatstica 72

0
. O teste de hiptese pode ser formulado como segue:
_
H
0
: =
0
H
1
: =
0
Para testar a hiptese, toma-se uma amostra aleatria de n 30 observaes com varincia
desconhecida se calcula a estatstica
t
c
=
x
0
S

n
Rejeita-se H
0
teste bilateral se |t
c
| > t

2
.
teste unilateral se |t
c
| > t

.
Para testar a hiptese, toma-se uma amostra aleatria de n > 30 observaes com varincia
desconhecida se calcula a estatstica
z
c
=
x
0
S

n
Rejeita-se H
0
teste bilateral se |z
c
| > z

2
.
teste unilateral se |z
c
| > z

.
Exemplo: Foram medidos, em mm, o eixo maior de 9 gros de quartzo em uma lmina de
arenito, obtendo-se mdia X = 0, 9mm e desvio padro S = 0, 3. Deseja-se testar a hiptese nula,
utilizando a signicncia = 0, 05 de que essa amostra provm de um corpo arenoso (populao)
cuja mdia = 0, 5mm.
Temos as seguintes hipteses
_
H
0
: = 0, 5
H
1
: > 0, 5
t
c
=
x
0
S

n
=
0, 9 0, 5
0,3

9
= 4
Nesse caso, trata-se de um teste unilateral, considerando o grau de liberdade = n 1 =
9 1 = 8 temos o valor tabelado para t t
0,05
= 1, 860.
Concluso: Como 4 > 1, 860 |t
c
| > t

rejeita-se H
0
ao nvel de 5% de signicncia, logo
essa amostra proveniente de outra populao.
Exemplo: Foram retiradas 36 amostras de uma jazida de carvo, em que foram medidos os
valores de espessura obtendo-se mdia de 1,12 e varincia de 0,25. Deseja-se testar a hiptese
nula, utilizando a signicncia = 0, 05 de que essa amostra igual ao de uma jazida cuja
espessura mdia = 1, 22.
_
H
0
: = 1, 22
H
1
: = 1, 22
Inferncia Estatstica 73
Temos x = 1, 12, S
2
= 0, 25 S = 0, 5 e n > 30, podemos utilizar o teste Z, = 0, 05
z
c
=
x
0
S

n
=
1, 12 1, 22
0,5

36
= 1, 22
Nesse caso, trata-se de um teste bilateral, temos que observar o valor tabelado para z

2
=
z
0,05
2
= z
0,025
= 1, 960.
Concluso: Observando |z
c
| = 1, 22, temos que como 1, 22 < 1, 96 |z
c
| < z

2
no existe
evidncias para rejeitar H
0
ao nvel de 5% de signicncia, logo a espessura mdia dessa jazida
igual a 1,22
4.2.3 Teste de hipteses para propores
Assim como para a mdia, existem testes de hipteses associados a propores, estes testes
so a respeito do parmetro populacional p. Com os dados coletados de uma amostra de tamanho
n, pode-se vericar o numero de sucessos X, e estimar a proporo p.
As hipteses a serem testadas a respeito do parmetro p, so as seguintes:
_
H
0
: p = p
0
H
1
: p = p
0
Teste Bilateral
_
H
0
: p = p
0
H
1
: p > p
0
Teste Unilateral
_
H
0
: p = p
0
H
1
: p < p
0
Teste Unilateral
em que: p
0
o valor alegado para a proporo populacional.
Para testar as hipteses sobre propores pode-se utilizar a distribuio normal , nesse caso
se calcula a estatstica
z
c
=
p p
0
_
p
0
q
0
n
Rejeita-se H
0
teste bilateral se |z
c
| > z

2
.
teste unilateral se |z
c
| > z

.
Para obter os valores de z tabelados, o mais prtico consultar a tabela de t, na ltima linha,
quando os graus de liberdades so sucientemente grandes.
Exemplo: Deseja-se testar se a proporo de estraticao em arenitos igual a 0,30, utili-
zando a signicncia = 0, 05. Para isso foi tomado uma amostra de 30 arenitos, em 12 deles
foram encontrados estraticao cruzada.
Temos que p
0
= 0, 30 q
0
= 1p
0
= 10, 30 = 0, 70, nmero de sucessos X = 12, tamanho
da amostra n = 30, assim temos:
p =
X
n
=
12
30
= 0, 40
Inferncia Estatstica 74
Utilizando um teste bilateral
_
H
0
: p = 0, 30
H
1
: p = 0, 30
Calculando o valor de z
c
z
c
=
p p
0
_
p
0
q
0
n
=
0, 40 0, 30
_
0, 3 0, 7
30
= 1, 20
Nesse caso, trata-se de um teste bilateral, temos que observar o valor tabelado para z

2
=
z
0,05
2
= z
0,025
= 1, 960.
Concluso: Observando |z
c
| = 1, 20, temos que como 1, 20 < 1, 96 |z
c
| < z

2
no existe
evidncias para rejeitar H
0
ao nvel de 5% de signicncia, logo a proporo de estraticao
cruzada estatisticamente igual a 0,30
4.2.4 Resumo das etapas aplicadas a qualquer teste de hipteses
1. Determinar as hipteses nula e alternativa.
2. Selecionar a estatstica de teste que ser usada para decidir rejeitar ou no a hiptese nula.
3. Especicar o nvel de signicncia para o teste.
4. Usar o nvel de signicncia para desenvolver regra de deciso que indica os valores
crticos da estatstica de teste que levar a rejeio de H
0
.
5. Coletar os dados amostrais e calcular a estatstica de teste.
6. Comparar o valor da estatstica do teste com o(s) valor(es) crtico(s) especicado(s) na
regra de deciso para determinar se H
0
deve ser rejeitado;
Inferncia Estatstica 75
4.3 REGRESSO E CORRELAO
Nas unidades anteriores, descrevemos a distribuio de valores de uma nica varivel, com
esse objetivo aprendemos a calcular medidas de tendncia central e variabilidade. Porm, se
considerarmos duas ou mais variveis surge um novo problema: as relaes que podem existir
entre as variveis estudadas.
Por exemplo, a relaes entre Peso e altura.
Para estudar a relao entre duas variveis quantitativas na utilizamos a anlise de regresso
e correlao destas variveis.
Correlao um nmero entre -1 e 1 que mede o grau de relacionamento entre duas variveis
quantitativas
Regresso o estudo que busca ajustar uma equao a um conjunto de dados de forma que
a relao entre duas variveis quantitativas possa ser expressa matematicamente.
Denimos um conjunto de variveis (x, y), sendo x a varivel independente e y a varivel
dependente.A primeira forma de vericar a relao de duas variveis traar o grco de disperso
dos dados.
O grco de disperso contm uma varivel independente representada no eixo horizontal e
a varivel dependente representada no eixo vertical.
Figura 4.1: indcios de correlao positiva, aumentando x, y tambm aumenta
Figura 4.2: indcios de correlao negativa, aumentando x, y dimunui
O grco de disperso da um idia da existncia de correlao, entretanto no apresenta qual
a magnitude da correlao. Para determinar a magnitude da correlao utilizamos o coeciente
de correlao populacional (). Em geral trabalhamos com amostras, e para estimar o coeciente
Inferncia Estatstica 76
Figura 4.3: indcios de ausncia correlao
de correlao populacional pode-se utilizar o coeciente de correlao amostral.
r =

i
(x
i
x)(y
i
y)

i
(x
i
x)
2

i
(y
i
y)
2
sendo que:
r > 0 - correlao positiva;
r < 0 - correlao negativa;
r = 0 - ausncia de correlao.
O valor obtido para o coeciente de correlao amostral tem como nalidade estimar o po-
pulacional, ou seja, vericar se na populao existe uma associao entre as variveis em estudo.
Desta forma, deve ser realizado um teste de hiptese sobre o coeciente populacional, com
base no resultado obtido na amostra, que pode ser denido da seguinte maneira:
_
H
0
: = 0
H
1
: = 0
Rejeita-se H
0
se |t
c
| > t

2
, em que
t
c
=
r 0
_
1r
2
n2
nesse caso v = n 2 graus de liberdade
Exemplo: Um estudo com espcies de branquipodos do Permiano mediu-se foram medidos
a espessura (x) e altura da valva dorsal (y)
x 10 12 14 16 18 20 22
y 11,8 10,2 12,1 13,2 15,1 15,4 15,6
Inferncia Estatstica 77
Figura 4.4: Grco de disperso
Tabela 4.2: Tabela auxiliar para o clculo da correlao
Observao x y (x x) (y y) (x x)(y y) (x x)
2
(y y)
2
1 10 11,8 -6 -1,5 9 36 2,25
2 12 10,2 -4 -3,1 12,4 16 9,61
3 14 12,1 -2 -1,2 2,4 4 1,44
4 16 13,2 0 -0,1 0 0 0,01
5 18 15,1 2 1,8 3,6 4 3,24
6 20 15,4 4 2,1 8,4 16 4,41
7 22 15,6 6 2,3 13,8 36 5,29
Total 112 93,4 49,6 112 26,25
x =
n

i
x
i
n
=
112
7
= 16
y =
n

i
y
i
n
=
93, 4
7
= 13, 3
r =

i
(x
i
x)(y
i
y)

i
(x
i
x)
2

i
(y
i
y)
2
=
49, 6

112 26, 25
= 0, 9148
Vericou-se que o valor da correlao r=0,9148. Vamos testar a hiptese se este valor
diferente de zero.
_
H
0
: = 0
H
1
: = 0
Temos v = n 2 = 7 2 = 5 graus de liberdade
t
c
=
r 0
_
1r
2
n2
=
0, 9148
_
10,9148
2
5
= 5, 06
Inferncia Estatstica 78
Tomando-se = 0, 05, temos t
0,025;5
= 2, 571.
Como |t
c
| > t

2
, rejeita-se H
0
ao nvel de 5% de signicncia. Logo a correlao diferente
de zero e igual a 0,9148.
Pelo diagrama de disperso e pelo coeciente de correlao, vericamos que existe uma relao
linear entre as variveis X e Y , podemos determinar uma funo que exprima esse relacionamento.
A funo que expressa a relao linear entre X e Y dada por
y = a +bx +
em que:
a coeciente linear, interpretado como o valor da varivel de dependente quando a varivel
inpendente igual a 0;
b coeciente de regresso, interpretado como acrscimo na varivel dependente para a
variao de uma unidade na varivel.
so os erros aleatrios de uma populao normal, com mdia 0 e varincia constante.
Os estimadores para os coecientes so:
a = y bx b =

i
(x
i
x)(y
i
y)

i
(x
i
x)
2
A anlise de varincia uma tcnica utilizada para se testar o ajuste da equao como um
todo, ou seja, um teste para vericar se a equao de regresso obtida signicativa ou no.
Tabela 4.3: Anlise de Varincia para Regresso Linear Simples
Fontes de Variao GL Soma de Quadrados (SQ) Quadrado Mdio (QM) Fc
Regresso 1 SQRegresso QMRegresso QMRegresso/QMErro
Erro n-2 SQErro QMErro
Total n-1 SQTotal
SQTotal =

i
(y
i
y)
2
SQRegresso =
_

i
(x
i
x)(y
i
y)
_
2

i
(x
i
x)
2
SQErro = SQTotal SQRegresso
QMRegresso = SQRegresso
QMErro =
SQErro
n 2
_
H
0
: a = 0 ou b = 0
H
1
: a = 0 e b = 0
Inferncia Estatstica 79
O teste de hiptese para avaliar se o modelo de regresso signicativo feito da seguinte
forma:
Estabelecer o nvel de signicncia ;
Obter o valor tabelado F

;
Rejeita-se a hiptese H
0
, se F
c
> F

.
O coeciente de determinao r
2
, denido por:
r
2
=
SQRegresso
SQTotal
0 < r
2
< 1
ele representa a porcentagem da variao total que explicada pela equao de regresso, quanto
maior o seu valor melhor.
Aps ter vericado o ajuste da equao de regresso pode-se utiliza-la para fazer previses
dentro da magnitude da varivel.
Exemplo: Utilizando o exemplo das espcies de branquipodos do Permiano.
Vamos ajustar o modelo
y = a +bx
Utilizando os calculo da tabela 4.2
b =

i
(x
i
x)(y
i
y)

i
(x
i
x)
2
=
49, 6
112
= 0, 44
a = y bx
= 6, 26
Assim a equao de regresso igual a
y = 6, 26 + 0, 44x
Vamos vericar se a regresso signicativa
SQTotal =

i
(y
i
y)
2
= 26, 25
SQRegresso =
_

i
(x
i
x)(y
i
y)
_
2

i
(x
i
x)
2
=
(49, 6)
2
112
= 21, 97
SQErro = SQTotal SQRegresso
= 26, 25 21, 97 = 4, 28
Inferncia Estatstica 80
Tabela 4.4: Anlise de Varincia para Regresso Linear Simples
Fontes de Variao GL Soma de Quadrados (SQ) Quadrado Mdio (QM) Fc F

Regresso 1 21,97 21,97 25,55 6,60


Erro 5 4,28 0,86
Total 6 26,25
Como o F
c
> F

, rejeita-se H
0
, logo o modelo de regresso linear signicativo.
Obtendo o r
2
r
2
=
SQRegresso
SQTotal
=
21, 97
26, 25
= 0, 8370 = 83, 70%
Assim verica-se que a espessura explica 83, 70% da altura da valva dorsal .
Figura 4.5: Valores observados (pontos) e preditos (linha)

Das könnte Ihnen auch gefallen