Beruflich Dokumente
Kultur Dokumente
ESTATSTICA BSICA
ERECHIM/RS
2009
SUMRIO
1 A NATUREZA DA ESTATSTICA
2 POPULAO E AMOSTRA
2.3 AMOSTRAGEM
Existem tcnicas que garantem, tanto quanto possvel, o acaso na escolha
Dessa forma, cada elemento deve ter a mesma chance de ser escolhido
Vantagens: Menor custo
Menor tempo
Material destrutivo
2.3.1 Amostragem casual ou aleatria simples
equivalente ao sorteio
Ex: alunos numerados de 1 a 20
no =
1
E a2
onde:
no= aproximao do tamanho da amostra
n=
Nxn
N+n
o
o
onde:
n= tamanho da amostra
N= tamanho da populao
Exemplos:
1) Considerando que se desejasse determinar o tamanho da amostra, num avirio com 15 mil
frangos de corte, para estimar o peso total de frangos vivos para comercializao. Considere um erro
de 2,5% para mais e para menos.
N= 15000
no =
1 = 1600
0,025 2
n=
z
n =
Nvel de confiana (1 - )
0,90
0,95
0,99
= desvio padro
Zc
1,65
1,96
2,58
E= erro mximo desejvel
Exemplo:
Supondo-se que se deseje determinar o tamanho da amostra visando obter o preo mdio da hora
mquina para a semeadura de milho em dada regio. Conforme estudo prvio, o desvio-padro para
o aluguel de aproximadamente R$ 30,00. Use nvel de confiana de 95%.
a) Qual o tamanho da amostra se a margem de erro para a mdia obtida esteja a menos de R$ 10,00
da verdadeira mdia?
2
10
b) Qual o tamanho da amostra se a margem de para a mdia obtida esteja a menos de R$ 5,00 da
2
3 SRIES ESTATSTICAS
3.1 INTRODUO
So as tabelas (????) e os quadros (???)
Sintetizar os resultados
Devem ser de fcil interpretao
Reproduzir fielmente os resultados
A Tabela o Quadro so compostos por:
Corpo: conjunto de linhas e colunas que contem informaes sobre a varivel em estudo.
Cabealho: parte superior da tabela que especifica o contedo das colunas.
Coluna indicadora: parte da tabela que especifica o contedo das linhas.
Linhas: retas imaginrias no sentido horizontal.
Casa ou clula: espao destinado a um nico nmero.
Ttulo: conjunto de informaes, mais completas possveis, localizadas ?????.
Pode ter os elementos complementares como fonte, notas e chamadas, colocadas no rodap.
Exemplo:
Tabela 3.1 - Comparao entre a armazenagem no Brasil quanto localizao, em funo da capacidade
Localizao
Capacidade (%)
Cidades
52
32
Fazendas
11
Portos (terminal)
Safra
Produo (1000 t)
2005/06
41682,2
2006/07
42426,8
2007/08
58652,2
2008/09
50268,0
Capacidade (milhes de t)
Centro-Oeste
43,95
Nordeste
7,24
Norte
2,46
Sudeste
20,52
Sul
51,33
Brasil
125,51
Rebanho
Bovinos
207.157
Sunos
34.064
Ovinos
15.558
Caprinos
10.307
10
Pases
Perodo
EUA
Brasil
Argentina
China
2004/05
85,013
53,000
39,000
17,400
2005/06
83,368
55,000
40,500
16,350
2006/07
87,001
59,000
48,800
15,967
2007/08
72,859
61,000
46,200
14,000
2008/09
80,536
57,000
43,800
16,800
Massa (kg)
Nmero de sunos
50 l 60
60 l 70
70 l 80
80 l 90
Total
10
11
a) Percentagens
Nmero de partes de um todo, o qual apresenta 100 partes, expresso em percentual
Exemplo:
Tabela 3.7 - Resultados da avaliao final da disciplina X
Condio
Nmero de alunos
Percentual
Aprovado direto
220
57,89
Reprovado direto
18
4,74
Aprovado c/ recuperao
101
26,58
Reprovado na recuperao
41
10,79
Total
380
100,00
b) Coeficientes
So razes entre o nmero de ocorrncias e o nmero total, no expressos em percentagem.
# Coeficiente de natalidade: nmero de nascimentos / populao total
# Coeficiente de mortalidade: nmero de bitos / populao total
c) Taxas
So os coeficientes multiplicados por uma potncia de 10 (10, 100, 1000) para tornar mais
inteligvel o resultado.
# Taxa de mortalidade: coeficiente de mortalidade x 1000
# Taxa de nascimentos: coeficiente de nascimento x 1000
# Taxa de juros
d) ndices
So razes entre duas grandezas de modo que uma no inclui a outra.
Exemplo:
# Densidade demogrfica: Populao / superfcie
# Produo per capita: valor total da produo / populao
# Consumo per capita: consumo total / populao
# Renda per capita: renda total / populao
12
4 GRFICOS ESTATSTICOS
4.1 INTRODUO
Deve produzir uma impresso rpida e fcil dos resultados.
- Portanto, deve ser:
# simplicidade
# claro
# verdadeiro
Os principais tipos de grficos so os histogramas, cartogramas e pictogramas.
4.1.1 Grfico em linha
Exemplo: Dados da produo de milho, Tabela 2.
Quando usado?
4.1.2 Grfico em colunas ou barras
# Colunas: quando verticalmente
# Barras: quando horizontalmente
# Dicas:
13
14
Dados fictcios
Figura 5 - Mdias de precipitao pluviomtrica durante determinado ano.
4.1.6 Cartograma
a representao sobre uma carta geogrfica.
Usado quando o objetivo o de demonstrar dados estatsticos relacionados com reas
geogrficas.
Em geral usamos:
- Pontos: Para representar dados absolutos (populao)
- Hachuras ou cores: representar dados relativos (densidade)
Exemplo: habitantes em determinado estado
15
4.1.7 Pictograma
Mtodo grfico que melhor demonstra os resultados ao pblico geral, pois atraente e
sugestivo.
A representao feita por figuras.
Semelhante ao grfico de barras.
Exemplo: Populao, exportao, doenas, etc.
16
5 DISTRIBUIO DE FREQNCIA
5,0
9,0
3,1
5,5
7,0
7,5
8,0
6,5
6,0
6,0
4,5
5,5
4,0
8,0
6,5
3,1
5,5
7,0
4,0
6,0
7,5
4,5
6,0
8,0
5,0
6,5
8,0
5,5
6,5
9,0
5.2 FREQNCIA
o nmero de dados de observao que ficam relacionados com determinada varivel.
# Freqncia de uma classe: nmero de valores da varivel pertencente classe.
Obs.: Simbologia empregada para determinar as classes:
= 3,1 < x < 4,3
l = 3,1 x < 4,3
l = 3,1 < x 4,3
ll = 3,1 x 4,3
17
Exemplo:
k=
15
k= 3,87
k= 4,0
I
1
2
3
4
5
Peso kg (AC)
3,0 l 4,2
4,2 l 5,4
5,4 l 6,6
6,6 l 7,8
7,8 ll 9,0
CC
3,6
4,8
6,0
7,2
8,4
Fi
2
2
6
2
3
fj
0,13
0,13
0,41
0,13
0,20
Fi`
2
4
10
12
15
fj`
0,13
0,26
0,67
0,80
1,00
AC= 1,20 kg
Exemplo:
1 classe
LI= 3,0
LS= LI + AC LS= 3,0 + 1,20 LS= 4,20
2 classe
LI= LI da 1 classe
LS= 4,20 + 1,20 LS= 5,40
5.3.5 Amplitude total da distribuio (AT)
a diferena entre o valor superior da ltima classe e limite inferior da primeira classe.
Exemplo:
AT= 9,00 3,00
AT= 6,0 kg
18
CC= 4,8 kg
F1`= 2
F2`= F1+F2
F2`= 2+2
F2`= 4
f1`= 0,13
f2`= 0,13+0,27
f2`= 0,4
19
Figura 5.1- Distribuio de freqncia absoluta, do peso de 15 sunos da raa landrace, na fase inicial,
expresso em kg.
Figura 5.2 - Distribuio de freqncia absoluta, do peso de 15 sunos da raa landrace, na fase inicial,
expresso em kg.
20
Figura 5.2 - Distribuio de freqncia acumulada, do peso de 15 sunos da raa landrace, na fase inicial,
expresso em kg.
Mo
a.2) Assimtrica
Na prtica no encontramos curvas perfeitamente simtricas. Essas curvas apresentam cauda,
a qual mais longa de um lado do que do outro.
Podem ser:
# Assimtrica positiva: Cauda para a direita
21
Jota
Jota invertido
22
6 MEDIDAS DESCRITIVAS
6.1 INTRODUO
Os elementos tpicos da distribuio so:
# As medidas de posio
# As Medidas de variao ou disperso
# As Medidas de assimetria
# As Medidas de curtose
Estas medidas so:
- de fcil interpretao
- apropriadas para processos mais elaborados
- representativas
Temos: Dados no agrupados
Dados agrupados (com e sem intervalo de classe)
23
6.2.1 Mdia
a) Mdia aritmtica simples
a.1) Para dados no agrupados
a mais utilizada, sendo de fcil obteno e de simples compreenso.
X=
X = mdia aritmtica
Xi= valores observados
n= nmero de observaes.
Exemplo: peso mdio, em kg, de 5 ovinos jovens.
X=
e = Xi X
Exemplo:
e= (9,3-7,88) + (8,1-7,88) + (6,3-7,88) + (6,9-7,88) + (8,8-7,88)
e= 1,42 + 0,22 + (-1,58) + (-0,98) + (0,92)
- Propriedades da mdia
# Primeira propriedade
A soma dos desvios, obtidos a partir da mdia, zero.
e= 0
Exemplo:
e= 1,42 + 0,22 + (-1,58) + (-0,98) + (0,92)
e= 0
# Segunda propriedade
Somando-se ou subtraindo-se de todas as observaes uma constante, a mdia fica
aumentada ou diminuda desta constante.
Y = Xn k ou
Y=
24
Exemplo:
Y=
(9,3 + 2,0) + (8,1 + 2,0) + (6,3 + 2,0) + (6,9 + 2,0) + (8,8 + 2,0)
5
Y=
49,4
= 9,88 kg ou
5
Y= 7,88 +2,0
Y= 9,88 kg
# Terceira propriedade
Multiplicando-se ou dividindo-se de todas as observaes uma constante, a mdia ficar
multiplicada ou dividida por esta constante.
Y = Xn k ou
Y=
n
Exemplo:
Y=
(9,3 2,0) + (8,1 2,0) + (6,3 2,0) + (6,9 2,0) + (8,8 2,0)
5
Y=
78,8
= 15,76 kg ou
5
Y= 7,88*2
Y= 15,76 kg
# Quarta propriedade
A soma de quadrados dos desvios em relao mdia mnima, pois menor que a soma
dos quadrados a partir de qualquer nmero.
Exemplo:
- Desvios reais:
e2= (1,42)2 + (0,22)2 + (-1,58)2 + (-0,98)2 + (0,92)2
e2= 6,368 kg
Se a mdia fosse 10:
e2= (9,3-10)2 + (8,1-10)2 + (6,3-10)2 + (6,9-10)2 + (8,8-10)2
e2= (-0,7)2 + (-1,9)2 + (-3,7)2 + (-3,1)2 + (-1,2)2
e2= 28,84 kg
25
b) Mdia ponderada
b.1) Dados no agrupados
Quando aos valores so atribudos pesos diferenciados.
X p = Xn Peso
Exemplo: Considere que para uma turma sero feitas trs avaliaes, sendo a primeira valendo 30%
da nota final, a segunda 50% e a terceira o restante. Suponha que as notas obtidas de um aluno
foram, respectivamente, 6,5; 7,2 e 5,8. Qual ser a mdia final do aluno?
X =
XnFi
Fi
Tabela 6.1 Municpios com registros de ocorrncia da ferrugem da soja, em determinada regio
Ocorrncias
0
1
2
3
4
Total
X=
Municpios (Fi)
15
10
8
5
2
40
( 0 15 ) + ( 1 10 ) + ( 2 8 ) + ( 3 5 ) + ( 4 2 )
= 1,225 ocorrncias por municpio
40
X =
CCnFi
Fi
I
1
2
3
4
5
Peso (kg)
3,0 l 4,2
4,2 l 5,4
5,4 l 6,6
6,6 l 7,8
7,8 ll 9,0
CC
3,6
4,8
6,0
7,2
8,4
Fi
2
2
6
2
3
fj
0,13
0,13
0,41
0,13
0,20
Fi`
2
4
10
12
15
fj`
0,13
0,26
0,67
0,80
1,00
Consideramos que todos os valores includos no intervalo de classe coincidem com CC.
26
Logo:
X=
Obs: se fosse utilizado todos os valores observados a mdia seria 6,14 kg/planta.
- Usos da mdia
# obter a medida de posio de maior estabilidade
# necessidade de tratamento algbrico posterior
c) Mdia geomtrica
usada para mdias proporcionais de crescimento quando uma medida subseqente depende
de medidas prvias.
X g = n n1 nn
Exemplo:
- populao em 1990= 2 milhes
- populao em 2000= 8 milhes
- Qual em 1995? No 5 milhes
X = 2 2 8 = 4 milhes
27
Moda
Moda
Mo
Curva modal
Curva no modal
Moda
1Moda
1
Curva bimodal
Moda
2Moda
2
28
- Emprego da moda
- quando desejamos uma medida rpida e aproximada de posio
- quando a medida de posio deve ser o valor tpico da distribuio
6.2.3 A mediana (Md)
o nmero que se encontra no centro de uma srie de dados de observao, dispostos
segundo uma ordem.
a) Dados no agrupados
a.1) Nmero impar de observaes
n +1
2
Md =
Md =
11 + 1
Md = 6 posio logo Md = 11 coelhos/cria
2
n +1
2
12 + 1 = 6,5 posio
2
Ento:
Md =
11 + 11
22
Md =
Md = 11 leites/porca
2
2
b) Dados agrupados
semelhante quele dos dados no agrupados, implicando, porm na determinao prvia
das freqncias acumuladas.
29
I
1
2
3
4
5
Aplicaes
0
1
2
3
4
Total
Fi (lavouras)
15
10
8
5
2
40
Fi
15
25
33
38
40
Ento:
Md=
Fi
40
=
= 20 posio
2
2
Fi
, entretanto temos que determinar o valor dentro do intervalo de classe.
2
Exemplo:
Tabela 6.4 - Distribuio de freqncia da produtividade de figueiras, expresso em kg/planta
i
1
2
3
4
5
Peso (kg)
3,0 l 4,2
4,2 l 5,4
5,4 l 6,6
6,6 l 7,8
7,8 ll 9,0
Md=
CC
3,6
4,8
6,0
7,2
8,4
Fi 15
=
= 7,5 posio
2
2
Fi
2
2
6
2
3
Fi
2
4
10
12
15
30
- Emprego da mediana
- obter o ponto que divide a distribuio em duas partes iguais
- h valores extremos que afetam de maneira acentuada a mdia
- a varivel em estudo o salrio
6.2.4 Separatrizes
a) Os quartis
Valores de uma srie que a dividem em quatro partes iguais.
H, portanto 3 quartis, conforme segue:
# Primeiro quartil (Q1): primeiro 25% da srie
# Segundo quartil (Q2): Coincide com a mediana (Q2=Md)
# Terceiro quartil (Q3): 75% da srie
a.1) Dados no agrupados
a.1.1) Nmeros pares de dados de observao
Qk =
kn+2
4
1 12 + 2
logo Q1 =
= 3,5 posio, logo Q1 = 10 coelhos/cria
4
Q2 =
2 x 12 + 2
= 6,5 posio
4
logo Q2 =
11 + 11
= 11 coelhos/cria
2
Q3 =
3 x 12 + 2
= 9,5 posio
4
12 + 12
logo Q3 =
= 12 coelho/cria
2
31
Qk =
1 (11 + 1)
= 3 posio
4
logo Q1 = 10 coelhos/cria
Para o segundo quartil
Q2 =
2(11 + 1)
= 6 posio
4
3(11 + 1)
= 9 posio
4
logo Q3 = 12 coelhos/cria
a.2) Dados agrupados
a.2.1) Sem intervalo de classe
Neste caso suficiente identificar a freqncia acumulada imediatamente superior.
Qk=
k Fi
, onde k o nmero de ordem do quartil.
4
Tabela 6.5 - Municpios com registros de ocorrncia da ferrugem da soja, em determinada regio
i
1
2
3
4
5
Aplicaes
0
1
2
3
4
Total
Fi (lavouras)
15
10
8
5
2
40
Fi
15
25
33
38
40
32
k Fi
, onde k o nmero de ordem do quartil.
4
Entretanto, neste caso interpolar, pois existe um intervalo de valores em cada classe.
Exemplo:
Tabela 6.6 - Distribuio de freqncia da produtividade de figueiras, expresso em kg/planta
I
Peso (kg)
CC
Fi
Fi
1
3,0 l 4,2
3,6
2
2
2
4,2 l 5,4
4,8
2
4
3
5,4 l 6,6
6,0
6
10
4
6,6 l 7,8
7,2
2
12
5
7,8 ll 9,0
8,4
3
15
Para o primeiro quartil
Q1=
k Fi 1 15
=
= 3,75 posio
4
4
k Fi 3 15
=
= 11,25 posio
4
4
33
Interpolao
(7,8-6,6)1,2 2
X ------ 1,25 (11,25-10)
Q3= 0,75 kg
Q3= 6,6+0,75= 7,35 kg/planta
b) Os decis
Dividem a distribuio em 9 partes iguais
So indicados por D1, D2, ..., D9
Dk= k Fi , sendo k o nmero de ordem do decil.
10
b.1) Dados agrupadas com intervalo de classe
Exemplo:
Tabela 6.7 - Distribuio de freqncia da produtividade de figueiras, expresso em kg/planta
I
1
2
3
4
5
Peso (kg)
3,0 l 4,2
4,2 l 5,4
5,4 l 6,6
6,6 l 7,8
7,8 ll 9,0
CC
3,69
4,87
6,05
7,23
8,41
Fi
2
2
6
2
3
Para o decil 4
D4= k Fi = 4 15 = 6 posio
10
10
Logo D4 est situado na classe 3, no intervalo de 5,4 a 6,6
Interpolao:
(6,6 5,4)1,2 6
X ------ 2(6-4)
X= 0,4 kg
D4= 5,4+0,4= 5,8 kg por planta
c) Os percentis ou centis
Dividem a distribuio em 99 partes iguais
So indicados por P1, P2, ..., P61, P99
Sendo assim sabe-se que P50= Md, P25= Q1 e P75= Q3.
Pk=
k Fi
, sendo k o nmero de ordem do percentil.
100
Fi
2
4
10
12
15
34
Para o percentil 90
P90= k Fi = 90 15 = 13,5 posio
100
100
Logo P90 est situado na classe 5, no intervalo de 7,82 a 9,00
Interpolao:
(9,0-7,8)1,2 3
X 1,5 (13,5-12,0)
X= 0,6 kg
P90= 7,8+0,6= 8,4 kg por planta
35
Local
A
B
C
Jan
0
239
99
Fev
12
220
105
Mar
25
200
110
Abr
80
100
109
Mai
121
46
100
Jun
150
2
112
Perodo
Jul
Ago
210
250
0
0
104
98
Set
230
55
101
Out
105
88
100
Nov
50
140
105
Dez
15
158
105
Mdia
104
104
104
36
AT= 112 98 = 14 mm
7.2.2 Dados agrupados
a) Sem intervalos de classe
Tambm empregamos a frmula que segue:
AT= LS ltima classe LI primeira classe
Tabela 2 Municpios com registros de ocorrncia da ferrugem da soja, em determinada regio
i
1
2
3
4
5
Ocorrncias
0
1
2
3
4
Total
Municpios
15
10
8
5
2
40
Fi
15
25
33
38
40
Logo:
AT= 4 0 = 4 ocorrncias / municpio
b) Com intervalos de classe
Neste caso, a amplitude total a diferena entre o limite superior da ltima classe e o limite
inferior da primeira classe.
AT= LS ltima classe LI primeira classe
Exemplo:
Tabela 3 - Distribuio de freqncia da produtividade de figueiras, expresso em kg/planta
I
Prod. (kg/planta)
CC
Plantas
Fi
1
3,0 l 4,2
3,69
2
2
2
4,2 l 5,4
4,87
2
4
3
5,4 l 6,6
6,05
6
10
4
6,6 l 7,8
7,23
2
12
5
7,8 ll 9,0
8,41
3
15
Logo:
AT= 9,0 3,0 = 6,0 kg / figueira
37
di= (Xi - X ) = 0
obtido a partir do somatrio dos quadrados dos desvios em relao a mdia, dividido pelos
valores observados ou destes descontados de uma unidade.
Para clculo usamos:
n= para populao
n-1= para amostra
Frmula dedutiva
- Para populao
n
S2 =
( Xi X )2
( X 1 X ) 2 + ( X 2 X ) 2 + ...( Xn X ) 2 i =1
=
n
38
- Para amostra
n
( Xi X ) 2
S 2 = i =1
n 1
Frmula de clculo
- Para populao
n 2 n
Xn
Xn
S2 = i = 1
i = 1
n
n
- Para amostra
2
n
n
2
Xn
Xn
n
2
S = i = 1
i = 1 x
n
1
n
b) Desvio padro
definido como a raiz quadrada da varincia.
Tanto para populao ou amostra
S = S2
39
- Propriedades do desvio:
1) Somando-se ou subtraindo-se uma constante a todos os valores observados, o desvio
padro no se altera.
2) Multiplicando-se ou dividindo-se uma constante a todos os valores observados (diferente de
zero), o desvio padro fica multiplicado ou dividido por essa constante.
# Observaes:
- Tanto a varincia como o desvio padro no so adequados para comparar valores com
mdias muito diferentes, mesmo que a unidade seja igual.
- No passvel de comparao entre valores com distintas unidades.
Exemplo para dados no agrupados
Exemplo 2: Nmero de coelhos por cria, considerando uma amostragem.
8, 9, 10, 10, 10, 11, 11, 11, 12, 12, 13, 13
# Pela frmula dedutiva, a varincia e o desvio padro so os seguintes:
- Mdia
12 1
(11 10,83) 2 + (11 10,83) 2 + (11 10,83) 2 + (12 10,83) 2 + (12 10,83) 2 + (13 10,83) 2 + (13 10,83) 2
12 1
(2,83) 2 + (1,83) 2 + (0,832 + (0,83) 2 + (0,83) 2 + (0,17) 2 + (0,17) 2 + (0,17) 2 + (1,17) 2 + (1,17) 2 + (2,17) 2 + (2,17) 2
S2 =
11
S2 =
25,67
= 2,34 coelhos/cria
11
- Desvio padro
Xn2 Xn
x n
S2= i=1
i=1
n
n n 1
40
Xi2
64
81
100
100
100
121
121
121
144
144
169
169
1434
- Varincia
1434 130 2 12
S =
12 12 11
S = 2,34
S= 1,53 coelhos/cria
7.4.2 Para dados agrupados
a) Sem intervalos de classe
Como temos intervalos de classes, fazemos uma modificao da frmula:
Varincia
- Para populao
n
S 2=
Fi Xn2
i=1
Fi
Fi Xn
i=1
Fi
- Para amostra
Obs.: Para amostra se multiplica o resultado por
Fi
Fi 1
41
Desvio padro
S = S2
Exemplo
Consideraremos o exemplo da ferrugem como uma amostra.
Tabela 7.4 - Municpios com registros de ocorrncia da ferrugem da soja, em determinada regio
i
1
2
3
4
5
soma
Ocorrncias
0
1
2
3
4
10
Municpios
15
10
8
5
2
40
FiXi
0
10
16
15
8
49
Ento temos:
Varincia
119 49 2 40
S 2 =
= 1,51 ocorrncias/municpio
40 40 39
Desvio padro
S 2=
Fi CCi
i =1
Fi
Fi CC
i =1
Fi
- Para amostra
Obs.: Para amostra se multiplica o resultado por
Fi
Fi 1
Exemplo:
Consideraremos o exemplo do peso de sunos como uma amostra:
FiXi2
0
10
32
45
32
119
42
I
1
2
3
4
5
Prod. (kg/planta)
3,0 l 4,2
4,2 l 5,4
5,4 l 6,6
6,6 l 7,8
7,8 ll 9,0
CC (Xi)
3,6
4,8
6,0
7,2
8,4
30,25
Plantas
2
2
6
2
3
15
FiCC
7,38
9,74
36,3
14,46
25,23
93,11
FiCC2
27,2322
47,4338
219,615
104,5458
212,1843
611,0111
Varincia
611,0111 93,11 2 15
S 2 =
= 1,13 kg/planta
15
15
14
Desvio padro
CV =
100
X
Para os trs exemplos temos:
a) Dados no agrupados
X = 10,83 coelhos/cria
S 2 = 2,14 coelhos/cria
S= 1,46 coelhos/cria
CV =
1,46
100 = 13,48%
10,83
43
1,228
100 = 100,24%
1,225
X = 6,207 kg/planta
S 2 = 1,13 kg/planta
S = 1,06 kg/planta
CV =
1,06
100 = 17,08%
6,207
Interpretao do CV:
- Baixo (menor que 10): dados com pouca variao
- Mdio (entre 10 e 20): dados com variao mdia
- Alto (maior que 20): dados com variaes elevadas
CVT =
100
Md
Exemplo: Distribuio de freqncia da produtividade de figueiras, expresso em kg/planta.
S= 1,06 kg/planta
Md= 6,1 kg/planta
CVT =
1,06
100
6,1
CVT= 17,38%
44
8.1 ASSIMETRIA
o grau de afastamento de uma distribuio em relao a um determinado ponto referncia
(pode ser a mdia) chamado de eixo de simetria.
a) Simtrica: mdia, moda e mediana coincidem.
= Md = Mo X = Md
= Mo
X Mo = 0 distribuio simtrica
45
b) Coeficiente de assimetria
Entretanto, a mediada anterior absoluta, apresentando a mesma deficincia do desvio
padro, ou seja, no permite a comparao entre mediadas de duas distribuies.
Portanto, para comparao usaremos o coeficiente de assimetria de Pearson:
3( X Md)
As =
S
Interpretao:
- Simtrica: As = 0
- Assimetria fraca: IAsI < 0,15
- Assimetria moderada: 0,15 < IAsI < 1,0
- Assimetria forte: IAsI > 1
Obs.: conforme o sinal pode ser assimtrica positiva ou negativa
Exemplo 1:
-1
Tabela 8.1 - Consumo de leo diesel (l h ), por diferentes tratores agrcolas, durante a semeadura
Consumo (l h-1)
4,0 I 5,0
5,0 I 6,0
6,0 I 7,0
7,0 I 8,0
8,0 I 9,0
I
1
2
3
4
5
Trator
10
23
36
23
10
102
Fi
10
33
69
92
102
-1
X = (4,5 x 10) + (5,5 x 23) +...+(8,5 x 10) = 6,5 l h
x= 0,5
S 2=
Fi Xi 2 Fi Xi
i =1
i =1
n
n
S2 =
4435,5 663
102
102
= 1,24 l h-1
CC (Xn)
4,5
5,5
6,5
7,5
8,5
FiXn
45
126,5
234
172,5
85
663
FiXn2
202,5
695,75
1521
1293,75
722,5
4435,5
46
3(6,5 6,5)
Logo: As =
= 0 simtrica
1,24
Exemplo 2:
-1
Tabela 8.2 - Consumo de leo diesel (l h ), por diferentes tratores agrcolas, durante a semeadura
Consumo (l h-1)
4,0 I 5,0
5,0 I 6,0
6,0 I 7,0
7,0 I 8,0
8,0 I 9,0
I
1
2
3
4
5
Trator
10
20
30
40
2
102
Fi
10
30
60
100
102
CC (Xn)
4,5
5,5
6,5
7,5
8,5
FiXn
45
110
195
300
17
667
FiXn2
202,5
605
1267,5
2250
144,5
4469,5
-1
X = (4,5 x 10) + (5,5 x 30) +...+(8,5 x 2) = 6,54 l h
x= 0,7
4469,5 667
102
102
Logo: As =
= 1,06 l h-1
3(6,54 6,7)
= 0,45 assimtrica negativa moderada
1,06
Exemplo 3:
-1
Tabela 8.3 - Consumo de leo diesel (l h ), por diferentes tratores agrcolas, durante a semeadura
I
1
2
3
4
5
Consumo (l h-1)
4,0 I 5,0
5,0 I 6,0
6,0 I 7,0
7,0 I 8,0
8,0 I 9,0
Trator
2
40
30
20
10
102
Fi
2
42
72
92
102
CC (Xn)
4,5
5,5
6,5
7,5
8,5
-1
X = (4,5 x 2) + (5,5 x 40) +...+(8,5 x 10) = 6,46 l h
FiXn
9
220
195
150
85
659
FiXn2
40,5
1210
1267,5
1125
722,5
4365,5
47
x= 0,3
4365,5 659
102
102
Logo: As =
= 1,06 l h-1
3(6,46 6,3)
= 0,45 assimtrica positiva moderada
1,06
8.2 CURTOSE
o grau de achatamento de uma distribuio em relao a distribuio padro, denominada
curva normal.
Temos 3 tipos:
- Leptocrtica: mais fechada que a normal ou mais aguda.
- Platicrtica: mais aberta que a normal ou achatada.
- Mesocrtica: a curva normal, sendo a referencial.
Exemplo: fazer no quadro.
8.2.1 Coeficiente de curtose
Para avaliar a curtose usa-se a seguinte frmula:
CC =
Q3 Q1
2(P90 P )
10
Interpretao:
- Leptocrtica: CC<0,263
- Platicrtica: CC>0,263
- Mesocrtica: CC = 0,263
Exemplo: Distribuio de freqncia do peso de 15 sunos da raa landrace, nos primeiros 30
dias de idade.
Q1= 5,31 kg
CC =
Q3= 7,38 kg
P10= 3,985 kg
P90= 8,41 kg
7,38 5,31
= 0,234 - logo, a distribuio considerada leptocrtica.
2(8,41 3,985)
48
Produtividade (kg/ha)
Adubao Produtividade
100
2560
150
3000
200
3398
250
3378
300
4050
350
4298
400
4500
4500
4000
3500
3000
2500
2000
50
150
250
350
450
Adubo (kg/ha)
Produtividade (kg/ha)
Adubao Produtividade
400
4400
450
4000
500
3710
550
3480
600
3045
650
2871
700
2569
4500
4000
3500
3000
2500
2000
300
400
500
600
700
800
Adubao (kg/ha)
49
c) Sem correlao
4500
Produtividade (kg/ha)
Adubao Produtividade
100
2584
150
4012
200
3015
250
3958
300
2781
350
3451
400
2800
4000
3500
3000
2500
2000
0
100
200
300
400
500
Adubao (kg/ha)
r=
[n X
n X i Yi ( X i . Yi )
][
2
2
2
2
i ( X i ) . n Yi ( Yi )
50
Produtividade (l/dia)
15,1
Xi.Yi
75,50
Xi
25,00
Yi
228,01
5,3
5,6
5,9
15,3
15,7
16,0
81,09
87,92
94,40
28,09
31,36
34,81
234,09
246,49
256,00
6,2
6,5
16,2
15,9
100,44
103,35
38,44
42,25
262,44
252,81
6,8
7,1
16,4
17,0
111,52
120,70
46,24
50,41
268,96
289,00
7,4
55,80
16,7
144,30
123,58
898,50
54,76
351,36
278,89
2.316,69
Logo:
r=
9x898,50 - 55,80x144, 30
(9x351,36 - 55,80 2 )x (9x 2316,69 144,30 2 )
= 0,94158
Concluso: Existe uma correlao positiva entre a dose de rao fornecida e a produtividade de leite
de 94,16%.
9.4 COEFICIENTE DE DETERMINAO (R2)
Mede a proporo de variao de Y que explicada linearmente pela variao de X.
Os valores de r2 ficam entre 0 e 1.
r2= (r)2
r2= (0,94158)^2
r2= 0,88658
Concluso: Pode-se afirmar que 88,66% do aumento de produtividade de leite explicada
linearmente pela dose de rao fornecida.
9.5 EQUAO DA RETA E DETERMINAO DOS PARMETROS
Tem por objetivo descrever atravs de um modelo matemtico a relao entre duas variveis.
A modelo que descreve :
Y=a + bX
Onde:
a= parmetro
b= parmetro da inclinao da reta.
Os parmetros so obtidos pelas equaes:
51
n XnYn ( Xn Yn )
b=
n Xn 2 ( Xn )
b=
b= 0,7111
a= 11,6244
Logo o modelo fica descrito por:
Y= 11,6244 + 0,7111X
Obs: Para cada quilo de rao que for fornecido, teria um incremento de 0,7111 litros de leite.
Ento o grfico fica assim apresentado:
Produtividade (l/ha)
17,5
17,0
y = 0,7111x + 11,624
R2 = 0,8866
16,5
16,0
15,5
15,0
4,5
5,5
6,5
7,5
8,5
Rao (kg)
52
10 ANLISE COMBINATRIA
10.1 INTRODUO
A necessidade de calcular o nmero de possibilidades existentes nos chamados jogos de
azar levou ao desenvolvimento da Anlise Combinatria. Trata-se de uma parte da Matemtica que
estuda os mtodos de contagem. Esses estudos foram iniciados j no sculo XVI, pelo matemtico
italiano Niccollo Fontana (1500-1557), conhecido como Tartaglia. Depois dele vieram os franceses
Pierre de Fermat (1601-1665) e Blaise Pascal (1623-1662).
10.2 FATORIAL
Para resolver problemas de Anlise Combinatria precisamos utilizar uma ferramenta
matemtica chamada Fatorial.
Seja n um nmero inteiro no negativo. Definimos o fatorial de n (indicado pelo smbolo n!) como
sendo:
n! = n .(n-1) . (n-2) . ... .4.3.2.1 para n 2.
Exemplos:
a) 6! = 6.5.4.3.2.1 = 720
b) 4! = 4.3.2.1 = 24
c) 7! = 7.6.5.4.3.2.1 = 5040
d) 10! = 10.9.8.7.6.5.4.3.2.1
e) 3! = 3.2.1 = 6
Perceba que 7! = 7.6.5.4!, ou que
6! = 6.5.4.3!, e assim sucessivamente.
Casos especiais:
0! = 1
1! = 1
10.3 PRINCPIO FUNDAMENTAL DA CONTAGEM - PFC
Se determinado acontecimento ocorre em etapas independentes, e se a primeira etapa pode
ocorrer de k1 maneiras diferentes, a segunda de k2 maneiras diferentes, e assim sucessivamente,
ento o nmero total T de maneiras de ocorrer o acontecimento, composto por n etapas, dado
por:
T = k1. k2 . k3 . ... . kn
53
Exemplo 1:
No Brasil as placas dos veculos so confeccionadas usando-se 3 letras do alfabeto e 4
algarismos. Qual o nmero mximo de veculos que poder ser licenciado?
Imaginemos a seguinte situao: Placa ACD 2172.
Como o alfabeto possui 26 letras e nosso sistema numrico possui 10 algarismos (de 0 a 9),
podemos concluir que: para a 1 posio, temos 26 alternativas, e como pode haver repetio, para a
2, e 3 tambm teremos 26 alternativas. Com relao aos algarismos, conclumos facilmente que
temos 10 alternativas para cada um dos 4 lugares. Podemos ento afirmar que o nmero total de
veculos que podem ser licenciados ser igual a:
T= 26 x 26 x 26 xx10 x 10 x 10 x 10 = 175.760.000
No Brasil, antes da alterao do sistema de emplacamento de automveis, as placas dos
veculos eram confeccionadas usando-se 2 letras do alfabeto e 4 algarismos. Qual o nmero mximo
de veculos que podia ser licenciado neste sistema?
Imaginemos a seguinte situao: Placa AC 2172.
T= 26.26.10.10.10.10= 6.760.000
Percebe-se que a incluso de apenas uma letra faz com que sejam licenciados,
aproximadamente, mais 170.000.000 de veculos.
!!
!! !
Exemplo 1:
Considerando que desejamos formar arranjos de 3 nmeros (centenas) a partir dos seguintes
nmeros: 1, 2, 3, 4, 5, 6 e 7.
!!,! =
!!
!!! !
54
Exemplo 2:
Usando-se as 26 letras do alfabeto, quantos arranjos distintos com 4 letras podem ser
montados?
!!",! =
!"!
!"!! !
!!
!! !
An, n = n!/(n-n)! = n!/0! = n!/1 = n!
Chega-se ento relao:
Pn = n!
Exemplo 1:
Quantas possibilidades de agrupamentos h com os elementos A, B, C?
So possveis as seguintes permutaes: ABC, ACB, BAC, BCA, CAB e CBA.
De forma matemtica: P3 = 3! = 3.2.1 = 6
Exemplo 2:
Calcule o nmero de formas distintas de 5 pessoas ocuparem os lugares de um banco retangular de
cinco lugares.
P5 = 5! = 5.4.3.2.1 = 120
Exemplo 3
Denomina-se ANAGRAMA o agrupamento formado pelas letras de uma palavra, que podem ter ou
no significado na linguagem comum. Os possveis anagramas da palavra REI so: REI, RIE, ERI,
EIR, IRE e IER. Calcule o nmero de anagramas da palavra MUNDIAL.
P7 = 7! = 7.6.5.4.3.2.1 = 5040
55
!!!,!,!,.. =
!!
!! !! !!. .
Exemplo 1
Determine o nmero de anagramas da palavra MATEMTICA (no considere o acento).
Temos 10 elementos, com repeties M (repetida duas vezes), a letra A (trs vezes) e a letra T (duas
vezes).
Na frmula anterior, teremos: n=10, a=2, b=3 e c=2.
!"!
!,!,!
!!"
= !!!!!! =151200
!!! =
!!
!! (! !)!
Exemplo 1:
Resolvendo o problema dos grupos de 3 pessoas, temos:
!!! =
5!
= 10 !"#$%&'!" !" !"! ! !"!
3! (5 3)!
Exemplo 2
Uma prova consta de 15 questes das quais o aluno deve resolver 10. De quantas formas ele poder
escolher as 10 questes?
Observe que a ordem das questes no muda o teste. Logo, podemos concluir que se trata de um
problema de combinao de 15 elementos com taxa 10.
!"
!!"
=
15!
= 3003 !"#$%&'!" !" !"! ! !"!
10! (15 10)!
56
11.1 INTRODUO
Os clculos de probabilidade pertencem ao campo da matemtica
A maioria dos fenmenos de que trata estatstica de natureza aleatria ou probabilstica.
As razes da Teoria de Probabilidade encontram-se nos jogos de azar, cuja origem remonta ao
sculo XVII (Chevalier de Mer, Fermat e Pascal).
Bernoulli (1713) introduziu a base matemtica da teoria fazendo relao entre probabilidade e
freqncia relativa.
O conhecimento dos aspectos fundamentais do clculo da probabilidade fundamental para o
estudo da estatstica Inferencial.
Por exemplo:
# Acerto em jogo
# Defeito em algum produto (mquina, pea)
# Seguros sobre bens durveis
# Nmeros de animais em determinado intervalo de peso
# Seca
57
- Todo experimento aleatrio pode ter resultados estveis se for repetido um nmero
suficientemente grande.
58
Exemplos:
1) No lanamento de uma moeda, j vimos que S = {K, C}. Temos os eventos:
A = {K}: ocorrncia de cara (evento elementar)
B = {C}: ocorrncia de coroa (evento elementar)
S = {K, C}: ocorrncia de cara ou coroa (evento certo)
: ocorrncia de nem cara nem coroa (evento impossvel)
2) No lanamento de dois dados, alguns dos eventos so:
A = {(1, 3), (2, 2), (3, 1)}: Ocorrncia de soma 4.
B = {(1, 1), (2, 2), (3, 3), (4, 4), (5, 5), (6, 6)}: ocorrncia de resultados iguais nos dois
lanamentos.
Logo Quando:
- E = S, E chamado evento certo
- E S e E um conjunto unitrio, E um evento elementar ( est contido)
- E = , E chamado evento impossvel
Exemplo: Lanar um dado
A= {1, 2, 3} S A evento de S
B= {1, 2, 3, 4, 5, 6} S B evento certo
C= {4} S evento elementar
D= S evento impossvel
= conjunto vazio
{}= conjunto cujo componente vazio
Por exemplo:
1) Ao lanarmos uma moeda h dois resultados possveis: Logo temos S1= {K, C}
2) Ao lanarmos um dado h seis resultados possveis: Logo temos: S2= {1, 2, 3, 4, 5, 6}
3) Ligar uma lmpada e medir o tempo que ele fica ligada.
Logo temos S3= {t 0}
Assim teremos:
S1 e S2 so enumerveis e denominados discretos.
S3 no enumervel e denominado contnuo.
59
Exemplo 4
SS
AA
BB
Situao 1
A= {1, 2, 3}
B= {3, 4}
A e B so eventos de S.
A U B= {1, 2, 3, 4}
A B= {3}
Situao 2:
A= {2, 4, 6}
B= {1, 3, 5}
A U B= {1, 2, 3, 4, 5, 6}
A B= { }
11.4.1 Possibilidades para a ocorrncia de eventos aleatrios
a) Unio (A U B)
formado pelos pontos amostrais que pertencem a, pelo menos, um dos eventos.
A= {1, 2, 3}
B= {3, 4}
A U B= {1, 2, 3, 4}
b) Interseco (A B)
formado pelos pontos que pertencem simultaneamente aos eventos A e B.
A= {1, 2, 3}
B= {3, 4}
A B= {3}
c) Complementao (S A = )
Lanam-se 2 moedas, seja A: sada de faces iguais e B: sada de cara na primeira moeda.
Logo:
S= {(C, C), (C, K), (K, C), (K, K)}
A= {(C, C), (K, K)}
B= {(C, C), (C, K)}
60
11.5.1 Clssica
Num experimento aleatrio, sendo S o seu espao amostral, admitindo que todos os elementos
de S tenham a mesma chance de acontecer, ou seja, que S um subconjunto equiprovvel.
Exemplos: Dado, baralho, bolas pretas e brancas
Denominamos de probabilidade de um evento A (A S) o nmero real P(A), tal que:
P(A)=
Exemplo 1:
Qual a probabilidade, entre 6 alternativas, do aluno errar a questo. As chances so
equiprovveis.
P(A)= 1/6 ou 16,67%
11.5.2 Pela freqncia relativa
Realizando-se um experimento um grande nmero de vezes, pode-se determinar qual a
chance de determinado evento ocorrer. A freqncia de ocorrncia desse evento a estimativa da
probabilidade.
P(A)=
# Onde:
1) 0 P(A) 1
2) P(A)= 1, se, e somente se, A ocorrer em todas as n situaes
3) P(A)= 0, se, e somente se, A nunca ocorrer nas n situaes
61
Exemplo 1:
Qual a probabilidade de uma pessoa ser atingida por um raio num perodo de um ano. O
espao amostral consiste de 2 eventos, no equiprovveis. Digamos que numa determinada regio
caia 122110 raios em um ano e, em mdia, 199 atinjam pessoas, segundo registros locais.
Qual a probabilidade de uma pessoa ser atingida, sabendo-se que a populao total de
80.000.000 de pessoas.
P(A)=
199
1
=
hab
80.000.000 402.010
Exemplo 2: Uma companhia de seguros automotivos tem na sua base de registros as seguintes
informaes sobre acidentes de trnsito durante um perodo X:
- 3.102 por falhas mecnicas;
- 8.080 por defeitos na pista;
- 32.581 por imprudncia, sendo destes, 21.022 por excesso de velocidade e 11.559 por
ultrapassagem em local proibido.
Qual a probabilidade de ocorrncia de acidente por defeitos na pista e por excesso de
velocidade?
# defeitos P(A)= 8.080/43.763 = 18,46%
# velocidade P(B)= 21.022/43.763 = 48,04%
11.5.3 Axiomtica (kolmogorov)
Axioma - uma afirmao que no possvel de demonstrao.
Probabilidade ou medida de probabilidade a funo P definida em S que se associa a cada
evento a um nmero real, que satisfaz os axiomas seguintes:
1) 0 P(A) 1
2) P(S)=1
3) Se A e B so mutuamente exclusivos P(A U B) = P(A) + P(B)
11.4.4 Regras bsicas da probabilidade
a) Adio
Usa-se essa regra para calcular a probabilidade da ocorrncia de eventos mutuamente
exclusivos
P(A U B)= P(A) + P(B) P( A B)
Onde P(A /ou B)= denota a interseo de A e B
b) Multiplicao
Usa-se essa regra para calcular a probabilidade da ocorrncia de eventos independentes
62
1 1
1
=
6 6 36
1 1 2 1
+ = =
6 6 6 3
63
P (X = x) =
P(x)
P(S)
Exemplo 1:
Digamos que numa determinada regio sejam roubados em um ms, em mdia, 9 veculos da
marca X, segundo registros locais.
Qual a probabilidade de um veculo da marca X ser roubado no perodo de um ano, sabendose que o nmero total de carros emplacados de 833524, sendo 8,3% da marca X.
P(X= 9)=
9 12
108
=
= 0,156%
833524 x 0,083 69183,5
P(B A )
P(A B)
ou P(B/A) =
P(B)
P(A)
Total
91
25
64
20
200
109
75
86
30
300
Total
200
100
150
50
500
P(B M)
P(M)
64
P(M)= 200/500
25
P(B/M) = 500 = 0,1250 ou 12,5% de ser braford dado ser macho
200
500
Si
= S isto , os eventos S so exaustivos, pois sua unio esgota ou exaure todo o espao
i =1
amostral S.
Partio de S subdividido, sendo A um evento arbitrrio de S, com P(A) > 0.
P(Si / A)=
P (Si A )
P(A)
S5
S5
A
A
S6
S6
S3
S3
S4
S4
P (Si A)
i =n
P( Si ) * P(A \ Si )
n
P( B d ) P( B) * P( d / B)
=
P(d)
P( d )
65
Mas a pea defeituosa pode provir de qualquer uma das mquinas, logo:
P(d)= P(A)*P(d / A) + P(B)*P(d / B) + P(C)*P(d / C)
P(d)= (0,40 x 0,02) + (0,35 x 0,01) + (0,25 x 0,03) = 0,019 ou 1,9%
Ento:
P(B / d)=
0,35 * 0,01
= 0,184 = 18,4%
0,019
66
12 VARIVEIS ALEATRIAS
12.1 INTRODUO
Muitos experimentos produzem resultados no numricos, sendo conveniente transformar
seus resultados em nmeros. Isto feito atravs da varivel aleatria, que uma regra que associa
um valor numrico a cada ponto do espao amostral.
Ento, uma varivel aleatria (geralmente representada por x) que tem um valor numrico
nico (determinado aleatoriamente) para cada resultado de um experimento.
Exemplo:
Lanam-se duas moedas e observa-se o resultado.
O espao amostral pode ser S={KK, KC, CK, CC}
Uma varivel aleatria de interesse X= {nmero de coroas}. A cada evento simples,
associamos um nmero, que o valor assumido pela varivel aleatria X:
Evento
KK
KC
CK
CC
Outro passo fundamental associar cada valor a sua probabilidade, obtendo o que
denominamos de uma distribuio de probabilidade.
Esta fica caracterizada pelos valores da v.a. X e pela regra, ou funo, que associa a cada
valor uma probabilidade, denominada funo de probabilidade, representada por f(x).
Valores de X
Probabilidade f(x)
1/4
1/2
1/4
67
10
11
12
f(x)
1/36
2/36
3/36
4/36
5/36
6/36
5/36
4/36
3/36
2/36
1/36
X . f(x)
E(X) = 2*(1/36)+3*(2/36)+4*(3/36)+...+12*(1/36) = 7
Neste caso a esperana matemtica a mdia populacional ponderada, conforme pode ser
f(x)
10
11
12
Exemplo 2: Um produtor rural, com 40 anos, obtm um emprstimo agrcola para implantao
de lavouras anuais no valor de R$ 30.000, para pagar no prazo de um ano. Sabe-se que a
probabilidade de um homem com esta idade falecer antes de completar 41 anos de 3,53 em 1.000.
Entretanto, ele deseja fazer um seguro de vida por esse prazo, pois caso morra antes deste perodo
a divida fique remida (a companhia seguradora ficar responsvel pelo pagamento). Qual o prmio
que ele deve pagar a seguradora para cobrir o risco de morte, sem contabilizar os seus encargos e
lucro?
O prmio que deve ser pago a esperana de perda da companhia.
Sendo X a perda da companhia, a distribuio de probabilidade X dada por:
X
30.000
f(x) = P(X = x)
1-(3,53/1.000)
3,53/1.000
X * f(x)
105,90
68
Var(X)
Exemplo:
X
P(X)
X * P(X)
X2 * P(X)
-2
1/5
-2/5
4/5
-1
1/5
-1/5
1/5
1/5
1/5
3/5
9/5
1/5
5/5
25/5
x= 1
E(X2)= 39/5
Var(X)= E(X2) 2
Var(X)= 39/5 -12
Var(X)= 6,8
dp(X)= 2,61
b.1) Propriedades da varincia
Para a e b constantes, temos:
1. Var(a)> 0
2. Var(X + a) = Var(X)
69
3. Var(b*X)= b2 Var(X)
4. Var(a bX) = b2 Var(X)
5. Var(X Y) = Var(X) + Var(Y) 2 Cov(X, Y)
500
600
600
800
800
800
700
700
700
600
Y
4
Totais
500
1/10
1/10
600
2/10
1/10
3/10
700
1/10
2/10
3/10
800
1/10
2/10
3/10
Totais
1/10
3/10
6/10
10/10
70
P(X)
X . P(X)
500
1/10
500/10
600
3/10
1800/10
700
3/10
2100/10
800
3/10
2400/10
E(X)= 680
P(X)
Y . P(X)
1/10
4/10
3/10
15/10
6/10
36/10
E(X)= 5,5
Freqncias (dias)
0,10
0,20
12
0,40
0,20
0,10
30
1,00
71
Os valores de x1, x2, x3, ... , xn e seus correspondentes p1, p2, p3, ..., pn definem uma
distribuio de probabilidade.
Ao definir distribuio de probabilidade estabelecemos uma relao entre a varivel aleatria
X e os valores da varivel P. Esta relao define uma funo.
Os valores de xi (i= 1, 2, 3, ..., n) formam o domnio da funo e os valores pi (i= 1, 2, 3, ...,
n) o seu conjunto imagem.
denominada funo de probabilidade, sendo:
f(x)= P(X = xi)
A funo de P(X = xi) determina a distribuio de probabilidade da varivel aleatria X.
Lanamento de 2 moedas, sendo cara o objetivo.
Nmero de caras (X)
P(X = x)
1/4
2/4
1/4
= 1
f(x)
0,10
0,20
0,40
0,20
0,10
0,45
f(x)
0,4
0,35
0,3
0,25
0,2
0,15
0,1
0,05
0
0
72
73
3!
1
3-1
(1/6) . (5/6)
1!
(3
1)!
P(X= 1)=
a)
5 1 1
P(X = 2) =
2 2 2
5 2
5! 1 1
P(X = 2) =
2!(5 - 2)! 2 2
4
b)
5 1 1
P(X = 4) =
4 2 2
5 2
5 4
5! 1 1
P(X = 4) =
4!(5 - 4)! 2 2
0
5 1 1
P(X = 0) =
0 2 2
1
c)
= 0,3125 ou 31,25%
5 1 1
P(X = 1) =
1 2 2
P(X = 2) = 31,25%
5 0
51
5 4
= 0,1563 ou 15,63%
5! 1 1
=
0!(5 - 0)! 2 2
1
5! 1 1
=
1!(5 - 1)! 2 2
5 0
= 0,0313 ou 3,13%
51
= 0,1563 ou 15,63%
x n x
P(X = x)=
N
n
Onde:
x: nmero desejado
n: tamanho amostra
74
N: populao
k: considerado sucesso
N-k: insucesso
Onde resolvido atravs da combinao simples:
C n, x=
n!
x ! (n x )! ou
n!
n
igual a
x ! (n x )!
x
Exemplo1: Lotes com 40 peas so considerados aceitveis se contm, no mximo, trs peas
defeituosas. O processo de amostragem consiste em extrair aleatoriamente 5 peas de cada lote e
rejeit-lo se for obtida pelo menos uma pea defeituosa das cinco extradas. Qual a probabilidade de
se encontrar uma pea defeituosa, sabendo-se que h trs peas defeituosas em todo lote?
Soluo: N= 40
P(X = 1)=
n= 5
k= 3
x=1
3 40 3 3 37
.
.
1 5 1 1 4
=
=
40
40
5
5
3! 37!
. 66045 )
P(X = 1)= 1!.2! 4!.33! = (3)(
= 0,3011 ou 30,11%
(658008)
40!
5!.35!
Exemplo 2: Uma caixa contm 12 lmpadas das quais 5 esto queimadas. So escolhidas 6
lmpadas ao acaso. Qual a probabilidade de que:
(a) Exatamente duas estejam queimadas?
(b) Pelo menos uma esteja boa?
(c) Pelo menos duas estejam queimadas?
(d) O nmero esperado de lmpadas queimadas?
a) N= 12
n= 6
k=5
x=2
5!
7!
5 12 5
.
P(X = 2)= 2 6 - 2 2!(5 2)! 4!(7 4)! 10 35
=
=
= 0,3788 ou 37,88%
12!
924
12
6!(12 6)!
6
b) N= 12
n= 6
k=5
x=1
75
e - . x
, x= 0, 1, 2, ...
x!
76
Em certo tipo de fabricao de fita magntica, ocorrem defeitos a uma taxa de 1 a cada 2000
metros. Qual a probabilidade de que um rolo com 2000 metros de fita magntica:
(a) No tenha defeitos?
(b) Tenha no mximo dois defeitos?
(c) Tenha pelo menos dois defeitos?
Soluo:
Neste caso, tem-se:
= Taxa de defeitos a cada 2000 metros
X= nmero de defeitos a cada dois mil metros
x= 0, 1,2, 3, ...
e - 1.10
= 0,3679 ou 36,79%
0!
a)
P(X = 0) =
b)
P(X 2) =
c)
e - 1.10 e - 1.11
= 1 (0,3679 2) = 0,2642 ou 26,42%
P(X 2) =1 P(X 1) = 1
+
0!
1!
P(X = x) = q
x1
xp
77
Exemplo: Numa seqncia de lanamentos de uma moeda honesta ao ar, em que cada
lanamento pode dar Cara ou Coroa, pretende-se estimar a probabilidade que a primeira cara se
obtenha no 5 lanamento.
1 x 2
, onde x IR
exp
Em que:
= mdia aritmtica da populao
= desvio padro populacional
exp= constante 2,718
f=(x)f
=(x)
+
+
x
x
78
Z=
x
, varivel normal padronizada.
79
Exemplos do uso de z:
1. Uma fbrica de tratores tem em seus dados estatsticos que a vida mdia til de sua mquina de
15 anos, apresentado distribuio normal, com desvio padro de 2,8 anos, qual o intervalo de vida
til de 95% dos tratores?
P (95%) P (0,95/2) P (0,475)
Logo P (0,95)= z
Ento valor Z= 1,96
P(0,95)= 1,96
P(0,95)= 15 1,96 x 2,8
P(0,95)= 15 5,488
Portanto:
P(maior durabilidade)= 20,488 anos
P(menor durabilidade)= 9,512
Concluso: Espera-se que 95% dos tratores tero sua vida til entre 9,512 e 20,488 anos. Ser
pouco provvel encontrar um trator que dure menos (P = 2,5%) ou que dure mais (P = 2,5%).
2. Qual a probabilidade de se encontrar trator com vida til entre 13 e 16 anos?
Calculam-se dois valores de z:
Agora quero a Probabilidade, logo preciso determinar o valor de Z para os 2 valores.
Z=
Assim temos:
zmenor= 13 15 = -0,71
2,8
zmaior= 16 15 = 0,36
2,8
Na tabela temos:
A rea entre z = 0 e z = -0,71 0,26115 ou 26,115%
A rea entre z = 0 e z = 0,36 = 0,14058 ou 14,058%
Portanto, a probabilidade de se encontrar trator com vida til entre 13 e 16 anos :
P(13<x<16)= 26,115 + 14,058 = 40,17%
3. Qual a probabilidade de se encontrar um trator que tenha vida til superior a 25 anos?
Novamente a probabilidade.
zmaior =
25 15 = 3,57
2,8
Na tabela temos:
80
81
13 INTERVALO DE CONFIANA
Pode ser utilizada, nesse caso, a tabela Z sempre que tivermos uma das seguintes situaes:
1 - se n 30, considerada suficientemente grande, pode-se adotar o desvio padro S
2 - se n < 30, sendo a populao estudada normalmente distribuda e o desvio padro
populacional conhecido.
Ento:
Se x for a mdia observada duma amostra aleatria de dimenso n duma populao normal (ou
duma populao qualquer desde que n suficientemente grande, mas nesse caso o intervalo
apenas aproximado) com varincia conhecida S2, um intervalo de confiana a 100 x (1-)% para
dado por:
E=Z
ICinferior ( ) = X E
__
ICinferior ( ) = X + E
Temos o IC inferior e o IC superior
82
Exemplo:
Determinada empresa que trabalha com erva mate tm em seus registros as seguintes informaes
estatsticas sobre o empacotamento, que aps pesar 100 pacotes, obtiveram como mdia de peso
de cada pacote 1005 g com desvio padro amostral de 45 g. Considerando que a distribuio dos
pesos seja considerada normal, determine qual o Erro e os IC inferior e superior para 95% dos
pacotes produzidos pela ervateira.
E = 1,96
45
= 8,82 g
100
E=t
S
n
ICinferior ( ) = X E
__
ICinferior ( ) = X + E
Pode-se usar o valor exato da Tabela t (usar GL), ou conforme Quadro abaixo:
Exemplo:
Determinada empresa que trabalha com erva mate tm em seus registros as seguintes informaes
estatsticas sobre o empacotamento, que aps pesar 10 amostras, obtiveram como mdia de peso
de cada pacote 1015 g com desvio padro 65 g. Considerando que a distribuio dos pesos seja
83
considerada normal, determine qual o Erro e os IC inferior e superior para 99% dos pacotes
produzidos pela ervateira.
E = 2,75
65
10
= 56,5 g
Por intervalo
Teste de Hipteses
Pegamos por exemplo a nota dos alunos de uma Universidade. O mais provvel de
acontecer, dado que a maioria dos alunos est perto da mdia, que a mdia amostral, tambm,
fique prxima da verdadeira mdia. Podemos calcular todas essas probabilidades, uma vez que
podemos aproximar a distribuio da mdia amostral para a distribuio normal.
d) Teste F
14.2.1 Teste Z para avaliao de uma mdia populacional
Para tal procedimento utilizado o teste Z. Para este teste de hipteses devemos conhecer a
varincia populacional. Esta tabela pode ser unilateral ou bilateral.
_
A estatstica do teste baseada na mdia amostral ( x ). Pode ser demonstrado que a mdia
amostral tem distribuio aproximadamente normal com mdia e varincia 2/2, onde n o
tamanho da amostra.
A estatstica do teste z para 1 mdia :
_
cal
Exemplo:
Uma mquina automtica de encher pacotes de caf enche-os segundo uma distribuio normal,
com mdia e varincia 400 g. O valor de pode ser fixado num mostrador situado numa posio
um pouco inacessvel dessa mquina. A mquina foi regulada para = 500 g. Desejamos, de meia
em meia hora, colher uma amostra de 16 pacotes e verificar se a produo est sob controle, isto ,
_
se = 500 g ou no. Se uma dessas amostras apresentasse uma mdia x = 492 g, voc pararia ou
no a produo para verificar se o mostrador est na posio correta? Usar = 1%.
cal
492 500
= 1,60
20
16
Z (0,01)= -2,33
Concluso: Aceito a hiptese H0, portanto no pararia a produo para verificar a posio do
mostrador, com P0,01.
x
t cal = s
n
Deciso sobre o nvel de significncia de Z:
t cal t tab = rejeita-se H0
t cal < t tab = aceita-se H0
Determinada firma desejava comprar cabos tendo recebido do fabricante a informao de que a
tenso mdia de ruptura 8000 kgf. Para analisar se a afirmao do fabricante verdadeira,
efetuou-se um teste de hiptese unilateral. Se um ensaio com 6 cabos forneceu uma tenso mdia
de ruptura de 7750 kgf, com desvio padro de 145 kgf, a qual concluso chegar, usando um nvel de
significncia de 5%?
cal
7750 8000
= 4,22
145
6
Agora precisamos obter o valor tabelado (t), para = 0,05 e GL 5, onde encontramos:
t tab (5; 0,05)= 2,571
Concluso: Aceita-se H0, os cabos apresentam tenso mdia de 8000 kgf, P0,05.
b) Para comparao de duas mdias
Primeiramente devemos realizar a anlise descritiva para comparar as duas mdias.
b.1) Anlise descritiva
Considere que se deseje comparar o desempenho de 2 turmas de alunos, uma diurna e outra
noturna, avaliando 11 alunos ao acaso em cada turma. Sabe-se que ambas as aulas so ministradas
pelo mesmo educador, sendo a mesma disciplina e utilizando o mesmo mtodo de ensino. As notas
obtidas esto na Tabela 1.
Tabela 1- Notas obtidas por duas turmas de alunos, uma noturna e outra diurna, submetidas aulas com o
mesmo educador e utilizando o mesmo mtodo
Observando os valores, pode-se verificar que as notas obtidas pela turma diurna so
superiores as obtidas pela turma noturna.
Para facilitar a observao, podemos calcular a mdia, onde temos:
- Mdia turma diurna:
__
X (TD) =
__
X (TD) =
Xn
n
X (TN) =
__
X (TN) =
Xn
n
Com as mdias calculadas pode-se supor que o desempenho de notas da turma diurna foi
superior.
Mas, apenas com a mdia no temos uma resposta confivel, pois depende da variabilidade
da amostra coletada.
Logo podemos determinar a varincia, o desvio e a varincia da mdia.
a) Varincia da amostra:
2
n
n
Xi
Xi
x n
S 2 = i = 1
i = 1 n 1
n
n
S 2 (TD ) =
x
11
11
10
S2(TD) = 1,95
# Para turma diurna
476,33 70,9 2 11
S2 (TN ) =
x
11
11 10
S2(TN ) = 1,93
b) Desvio padro ou erro padro da amostra:
S = S2
# Para turma diurna
S (TD ) = 1,95
S (TD)= 1,40
# Para turma noturna
S (TN ) = 1,93
S (TN)= 1,39
c) Varincia da mdia:
S2 Y =
S2
n
1,95
11
S2 Y (TN) =
1,93
11
S2 Y (TN) = 0,1755
10
S =
Y
S2
n
1,95
11
S =
Y
S = 0,4210
Y
1,93
11
S = 0,4189
Y
Logo podemos construir uma tabela para facilitar a compreenso dos resultados:
Tabela 2- Mdias e erros padres das mdias das notas obtidas pelos alunos diurnos e noturnos
Perodo
Estatstica
Mdia
Erro padro da mdia
Diurno
Noturno
7,39
6,45
0,4210
0,4189
pond
11
X X2
1
1
1 2
+
n n SPond
2
1
t=
Dando continuidade ao exemplo da Tabela 1, das notas obtidas por duas turmas de alunos, teremos:
a) = 5% ou 0,05
__
__
b) X (TD) = 7,39
c) S2(TD) = 1,95
X (TN) = 6,45
S2(TN ) = 1,93
7,39 6,45
1 1
+ 1,94
11 11
=1,583
Agora precisamos obter o valor tabelado (t), para = 0,05 e GL 20, onde encontramos o valor
de t= 2,086
t cal= 1,583
t (0,05; 20)= 2,086
Concluso: Conforme resultado do teste t (P0,05), deve-se aceitar a hiptese H0. Logo pode
concluir que a diferena das notas obtidas entre os dois grupos de alunos no pode ser atribuda ao
perodo que estudam.
Observao: Pode-se estar incorrendo para o erro tipo II, ou seja, aceitar a hiptese H0
apesar de haver diferenas reais entre os dois grupos de notas.
14.2.3 Teste Qui-quadrado (2)
O teste de Qui-quadrado faz parte dos chamados testes no paramtricos, ou seja, que no
dependem dos parmetros populacionais, nem de suas respectivas estimativas.
O teste de Qui-quadrado pode ser usado principalmente como:
i) Teste de aderncia
ii) Teste de independncia
iii) Teste de homogeneidade
Veremos, a princpio, apenas o teste de aderncia, sendo os demais testes filosoficamente (e
at mesmo mecanicamente) similares, mas aplicveis quando queremos estudar a relao entre
duas ou mais variveis de classificao.
Teste de Aderncia
12
!
!!"#
=
Onde:
Oi freqncia observada da categoria (evento) i
Ei freqncia esperada da categoria (evento) i
A expresso acima nos d um valor sempre positivo e tanto menor quanto maior for o
acordo entre as freqncias observadas e as freqncias esperadas, calculadas com base em
H 0.
A hiptese H0 afirmar no haver discrepncias entre as freqncias observadas e o as
freqncias esperadas, ou H0 ser colocada em termos de distribuio de probabilidade que vamos
por prova.
!
!
!
!
O valor de !!"#
comparado com !!"#
, sendo se !!"#
!!"!
, rejeita-se H0.
!
Tambm, precisamos obter !!"#
a partir da significncia e dos graus de liberdade v (v= k - 1 -
!
!!"#
=
15 30
30
(35 30)!
= 11,66
30
!
!!"#
0,01 (0,99); 2 = 9,210
Concluso: Rejeita-se H0, logo pode dizer que a idade da me tem influncia sobre o
nascimento de crianas pr-maturas.
14.2.4 Teste F para comparao de duas varincias
Mesma idia dos testes para mdias, teste z e t, porm usa-se a razo das varincias, e no
a sua diferena, como no caso dos testes para mdias.
A estatstica do teste dada por:
!!"# =
!!!
!!!
13
!!"# =
Equipe A
0,784
6
Equipe B
1,520
7
!!! 1,520
=
= 1,94
!!! 0,784
D
t=
EPMDD
EPMDD=
SD
n
14
Seja Di a diferena (no mesmo indivduo) entre as observaes registradas, para n pares. A mdia
_
Horas de sono
Droga Trat. Padro
8,6
8,2
8,8
8,3
8,1
7,6
9,8
9,4
9,7
8,9
8,0
7,2
8,4
8,5
9,5
9,3
9,5
9,1
Di
0,4
0,5
0,5
0,4
0,8
0,8
-0,1
0,2
0,4
D = 0,433
SD= 0,27
EPMDD= 0,27 = 0,09
9
t=
0,433
= 4,81
0,09
que a mdia da amostra x extrada para o teste, sem rejeitar a hiptese nula.
A partir do exposto e da definio de p-value, temos:
O p-value o nvel de significncia observado.
Se o p-value for maior ou igual a ento a hiptese nula ser aceita.
Se o p-value for menor ou igual a ento a hiptese nula ser rejeitada. Quanto menor for o
p-value, mais forte ser a evidncia para rejeitar a hiptese nula.
A deciso do teste de hipteses ser resultado da comparao do p-value com o nvel de
significncia que o analista julgar mais adequado.
15
REFERNCIAS
BUNCHAFT, Guenia; KELLNER, Sheilah Rubino de Oliveira. Estatstica sem mistrios. 4. ed.
Petrpolis: Vozes, 2002. 227 p.
BUSSAB, Wilton de Oliveira; MORETTIN, Pedro A. Estatstica bsica. 4. ed. So Paulo: Atual, 1999.
321 p.
CALEGARE, lvaro J. A. Introduo ao delineamento de experimentos. So Paulo: Edgard Blcher,
2001. 130p.
CRESPO, Antnio Arnot. Estatstica fcil. 18. ed. So Paulo: Saraiva, 2004. 224 p.
FARIAS, Alfredo Alves de; CSAR, Cibele Comini; SOARES, Jos Francisco. Introduo
estatstica. 2. ed. Rio de Janeiro: LTC, 2003. xiii, 340p.
FONSECA, Jairo Simon da; MARTINS, Gilberto de Andrade. Curso de estatstica. 6. ed. So Paulo:
Atlas, 2006. 320 p.
FREIRE, Clarice Azevedo De Luna. Anlise de modelos de regresso linear com aplicaes.
Campinas, SP: Unicamp, 1999. 356 p.
HINES, William; MONTGOMERY, Douglas C; GOLDSMAN, David M.; BORROR, Connie M.;
FLORES, Vera Regina Lima de Farias e (Trad.). Probabilidade e estatstica na engenharia. Rio de
Janeiro: LTC, 2006. x, 588 p.
LAPPONI, Juan Carlos. Estatstica usando Excel. So Paulo: Lapponi Treinamento e Editora, 2000.
450 p.
MAGALHES, Marcos Nascimento; LIMA, Antonio Carlos de. Noes de probabilidade e estatstica.
6. ed. So Paulo: EDUSP, 2005. xiv, 392 p.
MOORE, David S; FLORES, Vera Regina Lima de Farias e (Colab.). A estatstica bsica e sua
prtica. Rio de Janeiro: LTC, 2000. xv, 482p.
MORETTIN, Luiz Gonzaga. Estatstica bsica. So Paulo: Makron Books do Brasil, 2000. xi, 182 p.
GOMES, Frederico Pimentel. Curso de estatstica experimental. 14. ed. Piracicaba, SP: F. Pimentel
Gomes, EDUSP, 2000. 477 p.
STORCK, Lindolfo (Org.). Experimentao vegetal. 2. ed. Santa Maria: Universidade Federal de
Santa Maria, 2006. 198 p.
TRIOLA, Mario F. Introduo estatstica. 7. ed. Rio de Janeiro: Livros Tcnicos e Cientficos, 1999.
xviii, 410p.
VIEIRA, Sonia. Estatstica experimental. 2. ed. So Paulo: Atlas, 1999. 185 p.