Sie sind auf Seite 1von 102

UNIVERSIDADE REGIONAL INTEGRADA DO ALTO URUGUAI E DAS MISSES

DEPARTAMENTO DE CINCIAS AGRRIAS


APOSTILA DE AULA

ESTATSTICA BSICA

Professor Dr. Lauri Loureno Radnz


UFFS- Campus Erechim

ERECHIM/RS
2009

SUMRIO

1 A NATUREZA DA ESTATSTICA ...................................................................................................... 2


1.1 CONSIDERAES GERAIS ........................................................................................................... 2
1.2 TIPOS DE CONHECIMENTO ......................................................................................................... 2
1.2.1 Conhecimento emprico ............................................................................................................. 2
1.2.2 Conhecimento filosfico ............................................................................................................ 2
1.2.3 Conhecimento teolgico ............................................................................................................ 2
1.2.4 Conhecimento cientfico ............................................................................................................ 2
1.3 MTODO DE PESQUISA ................................................................................................................ 2
1.3.1 Pesquisa bibliogrfica ................................................................................................................ 2
1.3.2 Pesquisa documental ................................................................................................................. 3
1.3.3 Levantamento ............................................................................................................................. 3
1.3.4 Estudo de caso ........................................................................................................................... 3
1.3.5 Estudo de prottipo .................................................................................................................... 3
1.3.6 Pesquisa no experimental ....................................................................................................... 3
1.3.7 Pesquisa ao ............................................................................................................................. 3
1.3.8 Pesquisa participante ................................................................................................................. 3
1.4 O MTODO CIENTFICO ................................................................................................................ 3
1.5 FASES DO MTODO ESTATSTICO ............................................................................................. 4
1.5.1 Planejamento .............................................................................................................................. 4
1.5.2 Coleta dos dados ........................................................................................................................ 4
1.5.3 Crtica dos dados ........................................................................................................................ 4
1.5.4 Apurao dos dados .................................................................................................................. 4
1.5.5 Exposio ou apresentao ...................................................................................................... 4
1.5.6 Anlise dos resultados .............................................................................................................. 4
2 POPULAO E AMOSTRA .............................................................................................................. 5
2.1 CLASSIFICAO DAS VARIVEIS ................................................................................................ 5
2.2 POPULAO E AMOSTRA ............................................................................................................ 5
2.3 AMOSTRAGEM ............................................................................................................................... 5
2.3.1 Amostragem casual ou aleatria simples ................................................................................ 5
2.3.2 Amostragem proporcional estratificada ................................................................................... 6
2.3.3 Amostragem sistemtica ........................................................................................................... 6
2.4 DETERMINAO DO TAMANHO DA AMOSTRA .......................................................................... 6
2.4.1 Populao conhecida e desvio padro desconhecido ........................................................... 6
2.4.2 Populao desconhecida e desvio padro conhecido ........................................................... 7
3.1 INTRODUO ................................................................................................................................. 8
3.2 SRIES ESTATSTICAS ................................................................................................................. 9

3.2.1 Sries histricas, cronolgicas, temporais ............................................................................. 9


3.2.2 Sries geogrficas, espaciais, territoriais ................................................................................ 9
3.2.3 Sries especficas ou categricas ............................................................................................ 9
3.2.4 Sries conjugadas ou tabelas de dupla entrada ................................................................... 10
3.2.5 Sries de distribuio de freqncia ...................................................................................... 10
3.3 DADOS ABSOLUTOS E DADOS RELATIVOS ............................................................................. 10
3.3.1 Dados absolutos ....................................................................................................................... 10
3.3.2 Dados relativos ......................................................................................................................... 10
4 GRFICOS ESTATSTICOS ............................................................................................................ 12
4.1 INTRODUO ............................................................................................................................... 12
4.1.1 Grfico em linha ........................................................................................................................ 12
4.1.2 Grfico em colunas ou barras ................................................................................................. 12
4.1.3 Grficos em colunas ou barras mltiplas .............................................................................. 13
4.1.4 Grficos de setores ou pizza ................................................................................................... 13
4.1.5 Grficos polares ou radar ........................................................................................................ 13
4.1.6 Cartograma ................................................................................................................................ 14
4.1.7 Pictograma ................................................................................................................................ 15
5 DISTRIBUIO DE FREQNCIA ................................................................................................. 16
5.1 TABELA PRIMITIVA E ROL .......................................................................................................... 16
5.2 FREQNCIA ............................................................................................................................... 16
5.3 ELEMENTOS DE UMA DISTRIBUIO DE FREQNCIA ........................................................ 16
5.3.1 Classe de freqncia ou classe .............................................................................................. 16
5.3.2 Determinar o nmero de classes ............................................................................................ 16
5.3.3 Limites de classes .................................................................................................................... 17
5.3.4 Intervalos das classes ou amplitudes das classes (AC) ...................................................... 17
5.3.5 Amplitude total da distribuio (AT) ....................................................................................... 17
5.3.6 Amplitude amostral (AA) .......................................................................................................... 18
5.3.7 Ponto mdio de uma classe ou centro de classe (CC) ......................................................... 18
5.3.8 Freqncia simples ou absoluta (Fi) ...................................................................................... 18
5.3.9 Freqncias relativas (fj) ......................................................................................................... 18
5.3.10 Freqncia absoluta acumulada (Fi) ................................................................................... 18
5.3.11 Freqncia relativa acumulada (fj`) ...................................................................................... 18
5.4 REPRESENTAO GRFICA ...................................................................................................... 19
5.4.1 Histograma (grfico de coluna) ............................................................................................... 19
5.4.2 Polgono de freqncia ............................................................................................................ 19
5.4.3 Polgono de freqncia acumulada ........................................................................................ 19
5.4.4 Formas da curvas de freqncia ............................................................................................. 20
6 MEDIDAS DESCRITIVAS ................................................................................................................ 22
6.1 INTRODUO ............................................................................................................................... 22

6.2 MEDIDAS DE POSIO ............................................................................................................... 22


6.2.1 Mdia .......................................................................................................................................... 23
6.2.2 A moda (Mo) .............................................................................................................................. 26
6.2.3 A mediana (Md) ......................................................................................................................... 28
6.2.4 Separatrizes .............................................................................................................................. 30
7 MEDIDAS DE DISPERSO OU VARIAO OU DE VARIABILIDADE ......................................... 35
7.1 INTRODUO ............................................................................................................................... 35
7.2 AMPLITUDE TOTAL ...................................................................................................................... 35
7.2.1 Dados no agrupados .............................................................................................................. 35
7.2.2 Dados agrupados ..................................................................................................................... 36
7.3 AMPLITUDE INTERQUARTLICA ................................................................................................. 36
7.3.1 Dados no agrupados (pares ou impares) ............................................................................. 37
7.3.2 Dados agrupados (com ou sem intervalo de classe) ............................................................ 37
7.4 VARINCIA E DESVIO PADRO ................................................................................................. 37
7.4.1 Para dados no agrupados ...................................................................................................... 37
7.4.2 Para dados agrupados ............................................................................................................. 40
7.5 COEFICIENTE DE VARIAO DE PEARSON (CV) .................................................................... 42
7.6 COEFICIENTE DE VARIAO DE THORNDIKE - CVT .............................................................. 43
8 MEDIDAS DE ASSIMETRIA E DE CURTOSE ................................................................................ 44
8.1 ASSIMETRIA ................................................................................................................................. 44
8.1.1 Relao de assimetria .............................................................................................................. 44
8.2 CURTOSE ..................................................................................................................................... 47
8.2.1 Coeficiente de curtose ............................................................................................................. 47
9 REGRESSO LINEAR SIMPLES .................................................................................................... 48
9.1 INTRODUO ............................................................................................................................... 48
9.2 GRFICO DA DISPERSO .......................................................................................................... 48
9.3 COEFICIENTE DE CORRELAO LINEAR (R) .......................................................................... 49
9.4 COEFICIENTE DE DETERMINAO (R2) ................................................................................... 50
9.5 EQUAO DA RETA E DETERMINAO DOS PARMETROS ................................................ 50
10 ANLISE COMBINATRIA ........................................................................................................... 52
10.1 INTRODUO ............................................................................................................................. 52
10.2 FATORIAL ................................................................................................................................... 52
10.3 PRINCPIO FUNDAMENTAL DA CONTAGEM - PFC ................................................................ 52
10.4 ARRANJOS SIMPLES ................................................................................................................. 53
10.5 PERMUTAES SIMPLES ........................................................................................................ 54
10.6 PERMUTAES COM ELEMENTOS REPETIDOS ................................................................... 55
10.7 COMBINAES SIMPLES ......................................................................................................... 55
11 INTRODUO A TEORIA DA PROBABILIDADE ........................................................................ 56
11.1 INTRODUO ............................................................................................................................. 56

11.2 CLASSIFICAO DOS MODELOS ............................................................................................ 56


11.3 ESPAO AMOSTRAL OU PONTOS AMOSTRAIS (S) .............................................................. 57
11.3.1 Tipos de espao amostral ...................................................................................................... 57
11.4 EVENTO (E) ................................................................................................................................ 57
11.4.1 Possibilidades para a ocorrncia de eventos aleatrios .................................................... 59
11.5 DEFINIO DE PROBABILIDADE ............................................................................................. 60
11.5.1 Clssica ................................................................................................................................... 60
11.5.2 Pela freqncia relativa .......................................................................................................... 60
11.5.3 Axiomtica (kolmogorov) ....................................................................................................... 61
11.4.4 Regras bsicas da probabilidade .......................................................................................... 61
11.4.5 Tipos de eventos .................................................................................................................... 62
11.4.6 Probabilidade subjetiva ......................................................................................................... 62
11.4.7 Probabilidade atravs da freqncia relativa ...................................................................... 63
11.4.8 Probabilidade condicional ..................................................................................................... 63
11.4.9 Teorema de Bayes .................................................................................................................. 64
12 VARIVEIS ALEATRIAS ............................................................................................................ 66
12.1 INTRODUO ............................................................................................................................. 66
12.2 ESPERANA MATEMTICA ...................................................................................................... 66
12.3 VARIVEL ALEATRIA DISCRETA ........................................................................................... 69
12.3.1 Distribuio conjunta de duas variveis aleatrias ............................................................ 69
12.3.2 Distribuies marginais de probabilidade e esperana de X ............................................. 70
12.3.3 Probabilidade pela distribuio de Bernoulli ou binomial ................................................. 72
12.3.4 Probabilidade pela distribuio hipergeomtrica ............................................................... 73
12.3.5 Probabilidade pela distribuio de Poisson ........................................................................ 75
12.3.6 Probabilidade geomtrica ...................................................................................................... 76
12.4 VARIVEIS ALEATRIAS CONTNUAS .................................................................................... 77
12.4.1 Probabilidade pela distribuio normal ou de Gauss ......................................................... 77
13 INTERVALO DE CONFIANA ...................................................................................................... 81
13.1 PARA MDIA, QUANDO A VARINCIA CONHECIDA ........................................................... 81
13.2 PARA MDIA, QUANDO VARINCIA POPULACIONAL NO CONHECIDA ......................... 82
14 INFERNCIA ESTATSTICA E TESTE DE HIPTESES ................................................................ 2
14.1 INFERNCIA ESTATSTICA ......................................................................................................... 2
14.1.1 Populao e amostra ................................................................................................................ 4
14.1.2 Tipos de amostragem ............................................................................................................... 4
14.2 TESTE SIGNIFICNCIA OU DE HIPTESES .............................................................................. 4
14.2.1 Teste Z para avaliao de uma mdia populacional ............................................................. 6
14.2.2 Teste t para avaliao de uma ou duas mdias ..................................................................... 7
14.2.3 Teste Qui-quadrado (2) ......................................................................................................... 11
14.2.4 Teste F para comparao de duas varincias ..................................................................... 12

14.2.5 Teste t para dados pareados ................................................................................................. 13


14.2.6 Teste de Hiptese valor-P (p-value) ................................................................................... 14
REFERNCIAS ................................................................................................................................... 15

1 A NATUREZA DA ESTATSTICA

1.1 CONSIDERAES GERAIS


- A estatstica um ramo da matemtica que fornece mtodos para a coleta, organizao, descrio,
anlise e interpretao de dados e para a utilizao dos mesmos na tomada de decises
- Desde a antiguidade vrios povos j registravam os nascimentos, bitos, etc
- A qualidade das decises depende da verdadeira informao dos indicadores
- Os indicadores podem ser obtidos de levantamentos, que podem ser contnuos, regulares e
espordicos
- Foi utilizada para acompanhar as coisas do estado (status)
- A partir do sculo XVII inicia-se a utilizao da estatstica
- Depois de 1960 a informtica da um grande impulso a estatstica
- Exemplo?????

1.2 TIPOS DE CONHECIMENTO


1.2.1 Conhecimento emprico
- Obtido ao acaso, aps diversas tentativas
1.2.2 Conhecimento filosfico
- Atravs do raciocnio e da reflexo humana (razo)
1.2.3 Conhecimento teolgico
- Gerado pela f divina ou crena religiosa
1.2.4 Conhecimento cientfico
- o conhecimento racional, sistemtico e verificvel

1.3 MTODO DE PESQUISA


- Mtodo um conjunto de meios dispostos convenientemente para se chegar a um fim
1.3.1 Pesquisa bibliogrfica
- Elaborada a partir de material j publicado

1.3.2 Pesquisa documental


- Materiais que no receberam tratamento analtico
1.3.3 Levantamento
- Questionrio, formulrio, entrevista
1.3.4 Estudo de caso
????
1.3.5 Estudo de prottipo
?????
1.3.6 Pesquisa no experimental
- Investigao sistemtica e emprica
1.3.7 Pesquisa ao
- Resoluo de um problema coletivo
O pesquisador fica envolvido de forma cooperativa
1.3.8 Pesquisa participante
- O pesquisador se inclui na pesquisa
1.4 O MTODO CIENTFICO
- Modelo padro de pesquisa que permite que qualquer pessoa que realize determinada pesquisa
dentro da metodologia proposta possa encontrar resultados similares
a) Mtodo experimental
Consiste em manter constante toda a causa (fatores), exceto uma, variando esta
convenientemente
Exemplo????
b) Mtodo estatstico
Na impossibilidade de manter as causas constantes, admitem-se todas essas causas
presentes, registrando-se e procurando-se determinar o que a influncia.
Ex: causas que definem o preo do produto

1.5 FASES DO MTODO ESTATSTICO


A coleta, a organizao e a descrio dos dados esto a cargo da estatstica descritiva
A anlise e a interpretao ficam a cargo da estatstica indutiva ou inferencial
1.5.1 Planejamento
Se refere a execuo
1.5.2 Coleta dos dados
Pode ser direta ou indireta
a) Direta: realizada com a prpria tomada de dados. Ex.: nascimentos, importao, produo
A coleta de dados direta pode ser classificada relativamente ao fator tempo em:
a.1) Contnua: Ex.: freqncia as aulas
a.2) Peridica: Ex.: Censo
a.3) Ocasional: Ex.: doenas
b) Indireta: inferida de outros dados. Ex.: peso mdio ao abate, produtividade
1.5.3 Crtica dos dados
Pode ser externa ou interna
1.5.4 Apurao dos dados
Manual ou eletrnica
1.5.5 Exposio ou apresentao
Tabelas e grficos
1.5.6 Anlise dos resultados
Atravs da estatstica indutiva e inferencial

2 POPULAO E AMOSTRA

2.1 CLASSIFICAO DAS VARIVEIS


Cada fenmeno corresponde a um nmero de resultados possveis
Varivel o conjunto de resultados possveis de um fenmeno
Exemplo:
# Sexo: so apenas dois
# Filhos: expresso pelos nmeros naturais
# Estatura: assume diferentes valores dentro de determinado intervalo
A varivel pode ser:
a) Qualitativa: so expressas por atributos (sexo, cor da pele, etc.).
b) Quantitativa: Expressa em nmeros, sendo:
b.1) Varivel contnua: pode assumir qualquer valor entre dois limites, teoricamente.
Ex: Produo de gros
b.2) Varivel discreta: s pode assumir valores pertencentes a um conjunto enumervel.
Ex: nmero de leites por cria

2.2 POPULAO E AMOSTRA


# Populao: Conjunto de indivduos de, pelo menos, uma caracterstica comum
Ex: Grupo de estudantes, aves de um avirio
# Amostra: Subconjunto finito de uma populao, o qual deve ser representativo

2.3 AMOSTRAGEM
Existem tcnicas que garantem, tanto quanto possvel, o acaso na escolha
Dessa forma, cada elemento deve ter a mesma chance de ser escolhido
Vantagens: Menor custo
Menor tempo
Material destrutivo
2.3.1 Amostragem casual ou aleatria simples
equivalente ao sorteio
Ex: alunos numerados de 1 a 20

2.3.2 Amostragem proporcional estratificada


Quando a populao se divide em extratos
Ex: alunos do sexo masculino e feminino
2.3.3 Amostragem sistemtica
Quando os elementos da populao j esto ordenados
Ex: Propriedades rurais em determinada estrada, prdios de certa rua, etc
Neste caso a amostra pode ser obtida por um sistema imposto pelo pesquisador

2.4 DETERMINAO DO TAMANHO DA AMOSTRA


2.4.1 Populao conhecida e desvio padro desconhecido
1) Aproximao do tamanho da amostra

no =

1
E a2

onde:
no= aproximao do tamanho da amostra

E a2 = margem de erro amostral aceitvel (decimal)


2) Tamanho da amostra

n=

Nxn
N+n

o
o

onde:
n= tamanho da amostra
N= tamanho da populao
Exemplos:
1) Considerando que se desejasse determinar o tamanho da amostra, num avirio com 15 mil
frangos de corte, para estimar o peso total de frangos vivos para comercializao. Considere um erro
de 2,5% para mais e para menos.
N= 15000
no =

1 = 1600
0,025 2

n=

15000 x 1600 = 1445,78 = 1446 frangos


15000 + 1600

2) Para populao do RS, estimada em 10,6 milhes de habitantes?


3) De um povoado com 289 habitantes?

2.4.2 Populao desconhecida e desvio padro conhecido


Tabela Z

z
n =

Nvel de confiana (1 - )
0,90
0,95
0,99

= desvio padro

Onde: z= grau de confiana

Zc
1,65
1,96
2,58
E= erro mximo desejvel

Exemplo:
Supondo-se que se deseje determinar o tamanho da amostra visando obter o preo mdio da hora
mquina para a semeadura de milho em dada regio. Conforme estudo prvio, o desvio-padro para
o aluguel de aproximadamente R$ 30,00. Use nvel de confiana de 95%.
a) Qual o tamanho da amostra se a margem de erro para a mdia obtida esteja a menos de R$ 10,00
da verdadeira mdia?
2

1,96 x 30 = 34,6 = 35 prestadores de servio


n =

10

b) Qual o tamanho da amostra se a margem de para a mdia obtida esteja a menos de R$ 5,00 da
2

verdadeira mdia? n = 1,96 x 30 = 138,3 = 134 prestadores de servio


5

3 SRIES ESTATSTICAS

3.1 INTRODUO
So as tabelas (????) e os quadros (???)
Sintetizar os resultados
Devem ser de fcil interpretao
Reproduzir fielmente os resultados
A Tabela o Quadro so compostos por:
Corpo: conjunto de linhas e colunas que contem informaes sobre a varivel em estudo.
Cabealho: parte superior da tabela que especifica o contedo das colunas.
Coluna indicadora: parte da tabela que especifica o contedo das linhas.
Linhas: retas imaginrias no sentido horizontal.
Casa ou clula: espao destinado a um nico nmero.
Ttulo: conjunto de informaes, mais completas possveis, localizadas ?????.
Pode ter os elementos complementares como fonte, notas e chamadas, colocadas no rodap.
Exemplo:
Tabela 3.1 - Comparao entre a armazenagem no Brasil quanto localizao, em funo da capacidade

Localizao

Capacidade (%)

Cidades

52

Zona rural (empresas e cooperativas)

32

Fazendas

11

Portos (terminal)

Fonte: CONAB, 2006.

A Tabela e o Quadro devem ser auto-explicativos.


Segundo a resoluo 886 do IBGE, nas clulas devemos colocar:
# Um trao horizontal (-): valor zero
# Trs pontos (...): quando no temos dados
# Um ponto de interrogao (?): quando temos dvidas
# Zero (0): quando o valor muito pequeno para ser expresso pela unidade empregada. Se tiver
decimais os mesmo devero ser usados (0,0; 0,00; 0,000).

3.2 SRIES ESTATSTICAS

3.2.1 Sries histricas, cronolgicas, temporais


Compara resultados ao longo de determinado perodo.
Tabela 3.2 - Evoluo da produo de milho, no Brasil, durante o perodo de 2005 a 2009

Safra

Produo (1000 t)

2005/06

41682,2

2006/07

42426,8

2007/08

58652,2

2008/09

50268,0

Fonte: Conab, agosto 2009.

3.2.2 Sries geogrficas, espaciais, territoriais


Compara resultados para diferentes locais
Tabela 3.3 - Situao da armazenagem de gros em diferentes do Brasil
Regio

Capacidade (milhes de t)

Centro-Oeste

43,95

Nordeste

7,24

Norte

2,46

Sudeste

20,52

Sul

51,33

Brasil

125,51

FONTE: CONAB, 2009.

3.2.3 Sries especficas ou categricas


Descrevem os valores coletados segundo especificaes ou categorias.
Tabela 3.4 Rebanho efetivo para as principais categorias animais, em 2005

Rebanho

Quantidade (1000 cabeas)

Bovinos

207.157

Sunos

34.064

Ovinos

15.558

Caprinos

10.307

Fonte: Mapa, 2009.

10

3.2.4 Sries conjugadas ou tabelas de dupla entrada


Apresentam mais de uma varivel na mesma tabela.
Exemplo:
Tabela 3.5 - Principais produtores mundiais de soja, durante as safras 2004 a 2009, expresso em milhes de
toneladas

Pases

Perodo

EUA

Brasil

Argentina

China

2004/05

85,013

53,000

39,000

17,400

2005/06

83,368

55,000

40,500

16,350

2006/07

87,001

59,000

48,800

15,967

2007/08

72,859

61,000

46,200

14,000

2008/09

80,536

57,000

43,800

16,800

Fonte: USDA, 2009.

3.2.5 Sries de distribuio de freqncia


Ser visto posteriormente devida sua grande importncia.
Pode ser com intervalo de classe ou sem.
Exemplo peso sunos: 51, 57, 60, 62, 65, 67, 69, 70, 79, 85
Tabela 3.6 - Peso de um grupo de bovinos com determinada faixa de idade

Massa (kg)

Nmero de sunos

50 l 60

60 l 70

70 l 80

80 l 90

Total

10

3.3 DADOS ABSOLUTOS E DADOS RELATIVOS


3.3.1 Dados absolutos
Resultantes da coleta direta, provenientes da contagem ou medida.
3.3.2 Dados relativos
So resultantes de comparaes por quociente que se estabelece entre os dados absolutos,
realando as possveis diferenas.
So indicados por percentagens, ndices, coeficientes e taxas.

11

a) Percentagens
Nmero de partes de um todo, o qual apresenta 100 partes, expresso em percentual
Exemplo:
Tabela 3.7 - Resultados da avaliao final da disciplina X

Condio

Nmero de alunos

Percentual

Aprovado direto

220

57,89

Reprovado direto

18

4,74

Aprovado c/ recuperao

101

26,58

Reprovado na recuperao

41

10,79

Total

380

100,00

b) Coeficientes
So razes entre o nmero de ocorrncias e o nmero total, no expressos em percentagem.
# Coeficiente de natalidade: nmero de nascimentos / populao total
# Coeficiente de mortalidade: nmero de bitos / populao total
c) Taxas
So os coeficientes multiplicados por uma potncia de 10 (10, 100, 1000) para tornar mais
inteligvel o resultado.
# Taxa de mortalidade: coeficiente de mortalidade x 1000
# Taxa de nascimentos: coeficiente de nascimento x 1000
# Taxa de juros
d) ndices
So razes entre duas grandezas de modo que uma no inclui a outra.
Exemplo:
# Densidade demogrfica: Populao / superfcie
# Produo per capita: valor total da produo / populao
# Consumo per capita: consumo total / populao
# Renda per capita: renda total / populao

12

4 GRFICOS ESTATSTICOS

4.1 INTRODUO
Deve produzir uma impresso rpida e fcil dos resultados.
- Portanto, deve ser:
# simplicidade
# claro
# verdadeiro
Os principais tipos de grficos so os histogramas, cartogramas e pictogramas.
4.1.1 Grfico em linha
Exemplo: Dados da produo de milho, Tabela 2.

Fonte: Conab, 2009


Figura 1 - Evoluo da produo de milho, no Brasil, durante o perodo de 2005 a 2009.

Quando usado?
4.1.2 Grfico em colunas ou barras
# Colunas: quando verticalmente
# Barras: quando horizontalmente

Fonte: Conab, 2009.


Figura 2 - Situao da armazenagem de gros em diferentes do Brasil.

# Dicas:

13

- Todas as colunas ou barras devem ter a mesma largura.


- Escrever de baixo para cima ou da direita para esquerda.
- Usar ordem cronolgica ou decrescente.
- A distncia entre colunas ou barras no dever ser menor que a metade da largura e nem
maior que 2/3.
4.1.3 Grficos em colunas ou barras mltiplas
Geralmente empregado quando queremos representar, simultaneamente, dois ou mais
fenmenos.

Fonte: USDA, 2009


Figura 3 - Principais produtores mundiais de soja, durante as safras 2004 a 2009, expresso em milhes de
toneladas.

4.1.4 Grficos de setores ou pizza


Construdo com base em um circulo. empregado sempre que desejamos ressaltar a
participao do dado num todo.

Fonte: Conab, 2009


Figura 4 - Situao da armazenagem de gros em diferentes do Brasil, expresso em milhes de t.

# Observao: - No deve ser empregado quando houver muitos dados, normalmente at 7.


4.1.5 Grficos polares ou radar
ideal para representar sries temporais cclicas.
Exemplo: Precipitao ao longo do ano, consumo de energia eltrica durante o ms.

14

Dados fictcios
Figura 5 - Mdias de precipitao pluviomtrica durante determinado ano.

4.1.6 Cartograma
a representao sobre uma carta geogrfica.
Usado quando o objetivo o de demonstrar dados estatsticos relacionados com reas
geogrficas.
Em geral usamos:
- Pontos: Para representar dados absolutos (populao)
- Hachuras ou cores: representar dados relativos (densidade)
Exemplo: habitantes em determinado estado

Figura 6 Predominncia por setores no PIB brasileiro em 2009.

15

4.1.7 Pictograma
Mtodo grfico que melhor demonstra os resultados ao pblico geral, pois atraente e
sugestivo.
A representao feita por figuras.
Semelhante ao grfico de barras.
Exemplo: Populao, exportao, doenas, etc.

Figura 7 Evoluo na matrcula no ensino superior no Brasil.

16

5 DISTRIBUIO DE FREQNCIA

5.1 TABELA PRIMITIVA E ROL


Exemplo: Dados de produtividade de plantas de figueira.
Tabela 5.1 Quantidade de figo produzido por planta, expresso em kg

5,0
9,0
3,1

5,5
7,0
7,5

8,0
6,5
6,0

6,0
4,5
5,5

4,0
8,0
6,5

Acima difcil de obter concluses


Portanto, ordenar os dados, sendo a tabela ento denominada de ROL.
Tabela 5.2 Quantidade de figo produzido por planta, ordenados de forma crescente, expresso em kg

3,1
5,5
7,0

4,0
6,0
7,5

4,5
6,0
8,0

5,0
6,5
8,0

5,5
6,5
9,0

5.2 FREQNCIA
o nmero de dados de observao que ficam relacionados com determinada varivel.
# Freqncia de uma classe: nmero de valores da varivel pertencente classe.
Obs.: Simbologia empregada para determinar as classes:
= 3,1 < x < 4,3
l = 3,1 x < 4,3
l = 3,1 < x 4,3
ll = 3,1 x 4,3

5.3 ELEMENTOS DE UMA DISTRIBUIO DE FREQNCIA


5.3.1 Classe de freqncia ou classe
So os intervalos de variao de valores na classe.
So representados simbolicamente por i, sendo i= 1,2,3,...,k
k= nmero total de classes da distribuio.
5.3.2 Determinar o nmero de classes
Mais usual a regra de Sturges.
k= 1 + 3,32 logn

17

n= nmero total de dados de observao.


Exemplo:
k= 1 + 3,32 log15 =k= 4,9
Logo sero k= 5
Tambm, pode ser empregada a seguinte regra:
k=

Exemplo:
k=

15

k= 3,87

k= 4,0

5.3.3 Limites de classes


So os extremos de cada classe.
LI= limite inferior
LS= limite superior
Tabela 5.3 - Distribuio de freqncia da produtividade de figueiras, expresso em kg

I
1
2
3
4
5

Peso kg (AC)
3,0 l 4,2
4,2 l 5,4
5,4 l 6,6
6,6 l 7,8
7,8 ll 9,0

CC
3,6
4,8
6,0
7,2
8,4

Fi
2
2
6
2
3

fj
0,13
0,13
0,41
0,13
0,20

Fi`
2
4
10
12
15

fj`
0,13
0,26
0,67
0,80
1,00

5.3.4 Intervalos das classes ou amplitudes das classes (AC)


o tamanho da classe.
AC= Amplitude variao AC = 9,0 - 3,0
k
5,0

AC= 1,20 kg

Exemplo:
1 classe
LI= 3,0
LS= LI + AC LS= 3,0 + 1,20 LS= 4,20
2 classe
LI= LI da 1 classe
LS= 4,20 + 1,20 LS= 5,40
5.3.5 Amplitude total da distribuio (AT)
a diferena entre o valor superior da ltima classe e limite inferior da primeira classe.
Exemplo:
AT= 9,00 3,00

AT= 6,0 kg

18

5.3.6 Amplitude amostral (AA)


a diferena entre o valor mximo e o mnimo observado.
AA= 9,0 3,1 AA= 5,9 kg
Obs.: Neste caso igual amplitude total da distribuio.
5.3.7 Ponto mdio de uma classe ou centro de classe (CC)
Ponto que divide o intervalo de classe em duas partes iguais.
Conforme a tabela 5.3 temos para a classe 2:
CC= (4,2 + 5,4)/2

CC= 4,8 kg

5.3.8 Freqncia simples ou absoluta (Fi)


So os valores que realmente representam o nmero de dados de cada classe.
Exemplo:
F 1= 2
Fi= n
5.3.9 Freqncias relativas (fj)
So os valores que de cada classe expresso em decimal.
fj= (Fi)/(Fi)
Exemplo:
f1= 2/15 f1= 0,13
5.3.10 Freqncia absoluta acumulada (Fi)
igual a soma das freqncias simples, classe a classe.
Exemplo:
F1= F1

F1`= 2

F2`= F1+F2

F2`= 2+2

F2`= 4

5.3.11 Freqncia relativa acumulada (fj`)


igual a soma das freqncias relativas, classe a classe.
f1`= f1
f2`= f1+f2

f1`= 0,13
f2`= 0,13+0,27

f2`= 0,4

19

5.4 REPRESENTAO GRFICA


Pode ser representado por histograma e polgono de freqncia e polgono de freqncia
acumulada.
Histograma Utiliza o centro de classe.
Polgono de freqncia Utiliza o centro de classe.
Polgono de freqncia acumulada Utiliza os limites superiores dos intervalos de classe.
5.4.1 Histograma (grfico de coluna)
Exemplo: Freqncia absoluta
Utiliza o centro de classe.

Figura 5.1- Distribuio de freqncia absoluta, do peso de 15 sunos da raa landrace, na fase inicial,
expresso em kg.

5.4.2 Polgono de freqncia


Utiliza o centro de classe.

Figura 5.2 - Distribuio de freqncia absoluta, do peso de 15 sunos da raa landrace, na fase inicial,
expresso em kg.

5.4.3 Polgono de freqncia acumulada


Exemplo: Freqncia acumulada
Utiliza os limites superiores dos intervalos de classes.

20

Figura 5.2 - Distribuio de freqncia acumulada, do peso de 15 sunos da raa landrace, na fase inicial,
expresso em kg.

5.4.4 Formas da curvas de freqncia


a) Curvas em forma de sino: mximo no centro
Muitas curvas apresentam estas formas, como exemplo, altura, notas, peso, etc.
Esta curva assume a forma simtrica ou assimtrica, sendo esta ltima a mais comum.
a.1) Simtrica
No ocorre com muita freqncia.

Mo

Figura 5.5 - Distribuio de freqncia simtrica.

a.2) Assimtrica
Na prtica no encontramos curvas perfeitamente simtricas. Essas curvas apresentam cauda,
a qual mais longa de um lado do que do outro.
Podem ser:
# Assimtrica positiva: Cauda para a direita

Figura 5.6 - Distribuio de freqncia simtrica positiva.

21

# Assimtrica negativa: Cauda para a esquerda

Figura 5.7 - Distribuio de freqncia assimtrica negativa.

a.3) Curvas em forma de jota


Mximo ocorre em uma das extremidades.
Exemplo: fenmenos econmicos e financeiros.

Jota

Jota invertido

Figura 5.8 - Distribuio de freqncia em forma jota.

a.3) Curvas em forma de U


Mximo em ambas as extremidades.
Exemplo: Mortalidade por faixa etria.

Figura 5.9 - Distribuio de freqncia em forma U.

a.4) Distribuio retangular ou linear


Rara, pois apresenta todas as classes com a mesma freqncia.

Figura 5.10 - Distribuio de freqncia linear.

22

6 MEDIDAS DESCRITIVAS

6.1 INTRODUO
Os elementos tpicos da distribuio so:
# As medidas de posio
# As Medidas de variao ou disperso
# As Medidas de assimetria
# As Medidas de curtose
Estas medidas so:
- de fcil interpretao
- apropriadas para processos mais elaborados
- representativas
Temos: Dados no agrupados
Dados agrupados (com e sem intervalo de classe)

6.2 MEDIDAS DE POSIO


Esta estatstica representa uma srie de dados, orientando-os quanto a posio da distribuio
em relao ao eixo horizontal.
Podem ser:
a) Tendncia central: Os D.O. tendem a se agrupar em torno dos valores centrais.
- mdia
- mediana
- moda
b) Separatrizes: Separa a distribuio em partes iguais
- prpria mediana
- quartis
- decis
- percentis

23

6.2.1 Mdia
a) Mdia aritmtica simples
a.1) Para dados no agrupados
a mais utilizada, sendo de fcil obteno e de simples compreenso.

X=

(X1 + X2 + ... + Xn)


n

X = mdia aritmtica
Xi= valores observados
n= nmero de observaes.
Exemplo: peso mdio, em kg, de 5 ovinos jovens.

X=

9,3 + 8,1 + 6,3 + 6,9 + 8,8


= 7 ,88 kg
5

- Desvio ou erro em relao mdia


a diferena entre cada valor observado e a mdia aritmtica.

e = Xi X
Exemplo:
e= (9,3-7,88) + (8,1-7,88) + (6,3-7,88) + (6,9-7,88) + (8,8-7,88)
e= 1,42 + 0,22 + (-1,58) + (-0,98) + (0,92)
- Propriedades da mdia
# Primeira propriedade
A soma dos desvios, obtidos a partir da mdia, zero.
e= 0
Exemplo:
e= 1,42 + 0,22 + (-1,58) + (-0,98) + (0,92)
e= 0
# Segunda propriedade
Somando-se ou subtraindo-se de todas as observaes uma constante, a mdia fica
aumentada ou diminuda desta constante.

Y = Xn k ou
Y=

(X1 k) + (X2 k) + ... + (Xn k)


n

24

Exemplo:

Y=

(9,3 + 2,0) + (8,1 + 2,0) + (6,3 + 2,0) + (6,9 + 2,0) + (8,8 + 2,0)
5

Y=

49,4
= 9,88 kg ou
5

Y= 7,88 +2,0
Y= 9,88 kg
# Terceira propriedade
Multiplicando-se ou dividindo-se de todas as observaes uma constante, a mdia ficar
multiplicada ou dividida por esta constante.


Y = Xn k ou

(X1 k) + (X1 k) + (Xn k)

Y=
n
Exemplo:

Y=

(9,3 2,0) + (8,1 2,0) + (6,3 2,0) + (6,9 2,0) + (8,8 2,0)
5

Y=

78,8
= 15,76 kg ou
5

Y= 7,88*2
Y= 15,76 kg
# Quarta propriedade
A soma de quadrados dos desvios em relao mdia mnima, pois menor que a soma
dos quadrados a partir de qualquer nmero.
Exemplo:
- Desvios reais:
e2= (1,42)2 + (0,22)2 + (-1,58)2 + (-0,98)2 + (0,92)2
e2= 6,368 kg
Se a mdia fosse 10:
e2= (9,3-10)2 + (8,1-10)2 + (6,3-10)2 + (6,9-10)2 + (8,8-10)2
e2= (-0,7)2 + (-1,9)2 + (-3,7)2 + (-3,1)2 + (-1,2)2
e2= 28,84 kg

25

b) Mdia ponderada
b.1) Dados no agrupados
Quando aos valores so atribudos pesos diferenciados.

X p = Xn Peso
Exemplo: Considere que para uma turma sero feitas trs avaliaes, sendo a primeira valendo 30%
da nota final, a segunda 50% e a terceira o restante. Suponha que as notas obtidas de um aluno
foram, respectivamente, 6,5; 7,2 e 5,8. Qual ser a mdia final do aluno?

X p = (6,5 0,3 + 7,2 0,5 + 5,8 0,2) = 6,71


b.2) Dados agrupados
b.2.1) Sem intervalos de classe
Avaliao da ocorrncia da ferrugem da soja em determinada regio.

X =

XnFi
Fi

Tabela 6.1 Municpios com registros de ocorrncia da ferrugem da soja, em determinada regio

Ocorrncias
0
1
2
3
4
Total

X=

Municpios (Fi)
15
10
8
5
2
40

( 0 15 ) + ( 1 10 ) + ( 2 8 ) + ( 3 5 ) + ( 4 2 )
= 1,225 ocorrncias por municpio
40

b.2.2) Com intervalos de classes

X =

CCnFi
Fi

Exemplo: Produtividade de figueiras


Tabela 6.2 - Distribuio de freqncia da produtividade de figueiras, expresso em kg/planta

I
1
2
3
4
5

Peso (kg)
3,0 l 4,2
4,2 l 5,4
5,4 l 6,6
6,6 l 7,8
7,8 ll 9,0

CC
3,6
4,8
6,0
7,2
8,4

Fi
2
2
6
2
3

fj
0,13
0,13
0,41
0,13
0,20

Fi`
2
4
10
12
15

fj`
0,13
0,26
0,67
0,80
1,00

Consideramos que todos os valores includos no intervalo de classe coincidem com CC.

26

Logo:

X=

(2 3,6) + (2 4,8) + (6 6,0) + (2 7,2) + (3 8,4)


= 6,16 kg/planta
15

Obs: se fosse utilizado todos os valores observados a mdia seria 6,14 kg/planta.
- Usos da mdia
# obter a medida de posio de maior estabilidade
# necessidade de tratamento algbrico posterior
c) Mdia geomtrica
usada para mdias proporcionais de crescimento quando uma medida subseqente depende
de medidas prvias.

X g = n n1 nn
Exemplo:
- populao em 1990= 2 milhes
- populao em 2000= 8 milhes
- Qual em 1995? No 5 milhes

X = 2 2 8 = 4 milhes

6.2.2 A moda (Mo)


Observao que ocorre com maior freqncia.
a) Dados no agrupados
o dado de observao que mais se repete.
Exemplo: Nmero de cachos por planta de mamona.
1, 3, 2, 5, 4, 3, 2, 3, 1, 2, 3, 3
Mo= 3 cachos planta
As distribuies podem ser:
a.1) amodal: No existe um valor com maior freqncia
Exemplo: Peso ao nascer de terneiros
41, 34, 39, 43, 38, 45, 37, 31, 42, 47
a.2) unimodal ou modal: Apenas um conjunto com maior freqncia
Exemplo: Nmero de cachos por planta de mamona

27

a.3) multimodal: Apresentam mais de um conjunto com maior freqncia


Exemplo: Nmero de coelhos por cria
10, 12, 8, 10, 9, 12, 11, 13, 10, 11, 11
Logo temos 2 modas: 10 e 11 (bimodal)
b) Dados agrupados
b.1) Sem intervalo de classe
s avaliar os valores na tabela 6.1 (apresentada anteriormente), e observar o valor com
maior freqncia.
Logo a maior freqncia 15, ento a moda :
Mo= 0 ocorrncias por municpio
b.2) Com intervalo de classe
A classe que apresenta maior freqncia denominada classe modal.
A moda o CC
Exemplo: Produtividade figueiras

Tabela 6.3 - Distribuio de freqncia da produtividade de figueiras, expresso em kg/planta


I
Peso (kg)
CC
Fi
1
3,0 l 4,2
3,6
2
2
4,2 l 5,4
4,8
2
3
5,4 l 6,6
6,0
6
4
6,6 l 7,8
7,2
2
5
7,8 ll 9,0
8,4
3
Ento:
Classe modal a 3
A moda 6,0 kg/planta
- Expresses grficas da moda
Na curva de freqncia a moda o valor que corresponde, no eixo das abscissas, ao ponto de
ordenada mxima.

Moda
Moda
Mo

Curva modal

Curva no modal

Moda
1Moda
1
Curva bimodal

Moda
2Moda
2

28

- Emprego da moda
- quando desejamos uma medida rpida e aproximada de posio
- quando a medida de posio deve ser o valor tpico da distribuio
6.2.3 A mediana (Md)
o nmero que se encontra no centro de uma srie de dados de observao, dispostos
segundo uma ordem.
a) Dados no agrupados
a.1) Nmero impar de observaes

n +1
2

Md =

Exemplo: Nmero de coelhos por cria


10, 12, 8, 10, 9, 12, 11, 13, 10, 11, 11
Primeiramente ordenamos a srie:
8, 9, 10, 10, 10, 11, 11, 11, 12, 12, 13

Md =

11 + 1
Md = 6 posio logo Md = 11 coelhos/cria
2

a.2) Nmero par de observaes


A mediana ser o valor mdio entre os 2 valores observados.
Md =

n +1
2

Exemplo: Nmero de coelhos por cria


8, 9, 10, 10, 10, 11, 11, 11, 12, 12, 13, 13
Md =

12 + 1 = 6,5 posio
2

Ento:

Md =

11 + 11
22
Md =
Md = 11 leites/porca
2
2

b) Dados agrupados
semelhante quele dos dados no agrupados, implicando, porm na determinao prvia
das freqncias acumuladas.

29

b.1) Sem intervalo de classe


Neste caso suficiente identificar a freqncia acumulada imediatamente superior metade
da soma das freqncias. A mediana quele valor da varivel que corresponde a tal freqncia
acumulada.
Md= Fi
2
Tabela 6.4 - Municpios com registros de ocorrncia da ferrugem da soja, em determinada regio

I
1
2
3
4
5

Aplicaes
0
1
2
3
4
Total

Fi (lavouras)
15
10
8
5
2
40

Fi
15
25
33
38
40

Ento:
Md=

Fi
40
=
= 20 posio
2
2

Assim, o valor mediano est na classe 2.


Md= 1 ocorrncia por municpio
b.2) Com intervalo de classe
Md=

Fi
, entretanto temos que determinar o valor dentro do intervalo de classe.
2

Exemplo:
Tabela 6.4 - Distribuio de freqncia da produtividade de figueiras, expresso em kg/planta

i
1
2
3
4
5

Peso (kg)
3,0 l 4,2
4,2 l 5,4
5,4 l 6,6
6,6 l 7,8
7,8 ll 9,0

Md=

CC
3,6
4,8
6,0
7,2
8,4

Fi 15
=
= 7,5 posio
2
2

O valor est na 3 classe, entre os valores 5,4 e 6,6.


Interpolao:
1,2 (6,6-5,4) 6
x 3,5 (7,5-4)
x= 0,7 kg
Md= 5,4+0,7 = 6,1 kg

Fi
2
2
6
2
3

Fi
2
4
10
12
15

30

- Emprego da mediana
- obter o ponto que divide a distribuio em duas partes iguais
- h valores extremos que afetam de maneira acentuada a mdia
- a varivel em estudo o salrio
6.2.4 Separatrizes
a) Os quartis
Valores de uma srie que a dividem em quatro partes iguais.
H, portanto 3 quartis, conforme segue:
# Primeiro quartil (Q1): primeiro 25% da srie
# Segundo quartil (Q2): Coincide com a mediana (Q2=Md)
# Terceiro quartil (Q3): 75% da srie
a.1) Dados no agrupados
a.1.1) Nmeros pares de dados de observao
Qk =

kn+2
4

Exemplo: Nmero de coelhos por cria


8, 9, 10, 10, 10, 11, 11, 11, 12, 12, 13, 13
Obs.: Colocar os valores em ordem crescente.
Para o primeiro quartil

1 12 + 2
logo Q1 =
= 3,5 posio, logo Q1 = 10 coelhos/cria
4

Para o segundo quartil

Q2 =

2 x 12 + 2
= 6,5 posio
4

logo Q2 =

11 + 11
= 11 coelhos/cria
2

Para o terceiro quartil

Q3 =

3 x 12 + 2
= 9,5 posio
4

12 + 12
logo Q3 =
= 12 coelho/cria
2

31

a.1.2) Nmeros impares de dados de observao


k( n + 1)
4

Qk =

Exemplo: Nmero de coelhos por cria


8, 9, 10, 10, 10, 11, 11, 11, 12, 12, 13
Para o primeiro quartil
Q1 =

1 (11 + 1)
= 3 posio
4

logo Q1 = 10 coelhos/cria
Para o segundo quartil
Q2 =

2(11 + 1)
= 6 posio
4

logo Q2 =11 coelhos/cria


Para o terceiro quartil
Q3 =

3(11 + 1)
= 9 posio
4

logo Q3 = 12 coelhos/cria
a.2) Dados agrupados
a.2.1) Sem intervalo de classe
Neste caso suficiente identificar a freqncia acumulada imediatamente superior.
Qk=

k Fi
, onde k o nmero de ordem do quartil.
4

Tabela 6.5 - Municpios com registros de ocorrncia da ferrugem da soja, em determinada regio

i
1
2
3
4
5

Aplicaes
0
1
2
3
4
Total

Fi (lavouras)
15
10
8
5
2
40

Para o primeiro quartil


Q1= 1 * 40 = 40 = 10 posio, est na classe 1
4
4
Logo: Q1= 0 ocorrncias por municpio

Fi
15
25
33
38
40

32

Para o segundo quartil


Q2= igual a mediana
Q2= 2 * 40 = 80 = 20 posio, est na classe 2
4
4
Logo Q2= 1 ocorrncia por municpio
Para o terceiro quartil
Q3= 3 * 40 = 120 = 30 posio, est na classe 3
4
4
Logo: Q1= 2 ocorrncias por municpio
a.2.2) Com intervalo de classe
Igual a anterior.
Qk=

k Fi
, onde k o nmero de ordem do quartil.
4

Entretanto, neste caso interpolar, pois existe um intervalo de valores em cada classe.
Exemplo:
Tabela 6.6 - Distribuio de freqncia da produtividade de figueiras, expresso em kg/planta
I
Peso (kg)
CC
Fi
Fi
1
3,0 l 4,2
3,6
2
2
2
4,2 l 5,4
4,8
2
4
3
5,4 l 6,6
6,0
6
10
4
6,6 l 7,8
7,2
2
12
5
7,8 ll 9,0
8,4
3
15
Para o primeiro quartil
Q1=

k Fi 1 15
=
= 3,75 posio
4
4

Ento o Q1 est na segunda classe, entre o intervalo de 4,2 l 5,4


Interpolao:
(5,4-4,2) 1,2 2
X ---- 1,75 (3,75-2)
x= 1,05 kg
Q1= 4,2 + 1,05 = 5,25 kg/planta
Para o terceiro quartil
Q3=

k Fi 3 15
=
= 11,25 posio
4
4

Ento o Q3 est situado na classe 4, entre o intervalo 6,6 l 7,8

33

Interpolao
(7,8-6,6)1,2 2
X ------ 1,25 (11,25-10)
Q3= 0,75 kg
Q3= 6,6+0,75= 7,35 kg/planta
b) Os decis
Dividem a distribuio em 9 partes iguais
So indicados por D1, D2, ..., D9
Dk= k Fi , sendo k o nmero de ordem do decil.
10
b.1) Dados agrupadas com intervalo de classe
Exemplo:
Tabela 6.7 - Distribuio de freqncia da produtividade de figueiras, expresso em kg/planta

I
1
2
3
4
5

Peso (kg)
3,0 l 4,2
4,2 l 5,4
5,4 l 6,6
6,6 l 7,8
7,8 ll 9,0

CC
3,69
4,87
6,05
7,23
8,41

Fi
2
2
6
2
3

Para o decil 4
D4= k Fi = 4 15 = 6 posio
10
10
Logo D4 est situado na classe 3, no intervalo de 5,4 a 6,6
Interpolao:
(6,6 5,4)1,2 6
X ------ 2(6-4)
X= 0,4 kg
D4= 5,4+0,4= 5,8 kg por planta
c) Os percentis ou centis
Dividem a distribuio em 99 partes iguais
So indicados por P1, P2, ..., P61, P99
Sendo assim sabe-se que P50= Md, P25= Q1 e P75= Q3.
Pk=

k Fi
, sendo k o nmero de ordem do percentil.
100

Fi
2
4
10
12
15

34

Exemplo: Distribuio de freqncia da produtividade de figueiras, expresso em kg/planta

Para o percentil 90
P90= k Fi = 90 15 = 13,5 posio
100
100
Logo P90 est situado na classe 5, no intervalo de 7,82 a 9,00
Interpolao:
(9,0-7,8)1,2 3
X 1,5 (13,5-12,0)
X= 0,6 kg
P90= 7,8+0,6= 8,4 kg por planta

35

7 MEDIDAS DE DISPERSO OU VARIAO OU DE VARIABILIDADE


7.1 INTRODUO
Indicam a variabilidade dos dados.
Ex: Precipitao mensal em trs localidades, durante perodo de 1 ano.
No podemos saber como a distribuio desta chuva ao longo do ano
Tabela 1 Precipitao mdia mensal em trs localidades, durante o perodo de 1 ano

Local
A
B
C

Jan
0
239
99

Fev
12
220
105

Mar
25
200
110

Abr
80
100
109

Mai
121
46
100

Jun
150
2
112

Perodo
Jul
Ago
210
250
0
0
104
98

# Qual cidade apresenta dados mais homogneos?


# Qual a localidade com maior e menor disperso?
# A mdia, por si s, uma boa medida?
Logo temos como medidas de disperso:
- Amplitude total
- Varincia
- Desvio padro
- Coeficiente de variao

7.2 AMPLITUDE TOTAL


a diferena entre a maior e a menor medida.
Maior a amplitude total, maior a disperso.
7.2.1 Dados no agrupados
AT= X(mximo) X(mnimo)
Exemplo 1:
Para a cidade A, temos:
AT= 250 0 = 250 mm
# Para a cidade B
AT= 239 0 = 239 mm
# Para a cidade C

Set
230
55
101

Out
105
88
100

Nov
50
140
105

Dez
15
158
105

Mdia
104
104
104

36

AT= 112 98 = 14 mm
7.2.2 Dados agrupados
a) Sem intervalos de classe
Tambm empregamos a frmula que segue:
AT= LS ltima classe LI primeira classe
Tabela 2 Municpios com registros de ocorrncia da ferrugem da soja, em determinada regio

i
1
2
3
4
5

Ocorrncias
0
1
2
3
4
Total

Municpios
15
10
8
5
2
40

Fi
15
25
33
38
40

Logo:
AT= 4 0 = 4 ocorrncias / municpio
b) Com intervalos de classe
Neste caso, a amplitude total a diferena entre o limite superior da ltima classe e o limite
inferior da primeira classe.
AT= LS ltima classe LI primeira classe
Exemplo:
Tabela 3 - Distribuio de freqncia da produtividade de figueiras, expresso em kg/planta
I
Prod. (kg/planta)
CC
Plantas
Fi
1
3,0 l 4,2
3,69
2
2
2
4,2 l 5,4
4,87
2
4
3
5,4 l 6,6
6,05
6
10
4
6,6 l 7,8
7,23
2
12
5
7,8 ll 9,0
8,41
3
15
Logo:
AT= 9,0 3,0 = 6,0 kg / figueira

7.3 AMPLITUDE INTERQUARTLICA


a diferena entre o terceiro e o primeiro quartil.
AIQ= Q3 Q1

37

7.3.1 Dados no agrupados (pares ou impares)


Exemplo: Nmero de coelhos por cria
8, 9, 10, 10, 10, 11, 11, 11, 12, 12, 13, 13
Q1= 10 coelhos/cria
Q3= 12 coelhos/cria
AIQ= 12 10 = 2 coelho/cria
7.3.2 Dados agrupados (com ou sem intervalo de classe)
Exemplo: Distribuio de freqncia da produtividade de figueiras, expresso em kg/planta
Q1= 5,25 kg/planta
Q3= 7,35 kg/planta
Logo:
AIQ= 7,35 5,25 = 2,1 kg/planta

7.4 VARINCIA E DESVIO PADRO


# Tanto o desvio padro como as varincias so usadas como medidas de disperso.
7.4.1 Para dados no agrupados
a) Varincia
Baseia-se nos desvios em torno da mdia.

di= (Xi - X ) = 0
obtido a partir do somatrio dos quadrados dos desvios em relao a mdia, dividido pelos
valores observados ou destes descontados de uma unidade.
Para clculo usamos:
n= para populao
n-1= para amostra
Frmula dedutiva
- Para populao
n

S2 =

( Xi X )2

( X 1 X ) 2 + ( X 2 X ) 2 + ...( Xn X ) 2 i =1
=
n

38

- Para amostra
n

( Xi X ) 2

S 2 = i =1

n 1

Frmula de clculo
- Para populao

n 2 n

Xn
Xn

S2 = i = 1
i = 1
n
n

- Para amostra

2
n
n

2
Xn
Xn

n
2
S = i = 1
i = 1 x
n
1
n

Isto por que:


1) como

( Xi X ) = 0, ento somente n-1 desvios so independentes.


i =1

2) o divisor n-1 torna S2 uma medida melhor do que S2 divido por n.

Interpretao dos valores da varincia


Normalmente resulta num valor elevado, pois um nmero em unidade quadrada em relao
varivel em questo, o que a torna de pouca aplicabilidade.
# Varincia pequena= valores prximos a mdia
# Varincia grande= valores distantes da mdia
# Na varincia o ponto de referncia a mdia

b) Desvio padro
definido como a raiz quadrada da varincia.
Tanto para populao ou amostra

S = S2

39

- Propriedades do desvio:
1) Somando-se ou subtraindo-se uma constante a todos os valores observados, o desvio
padro no se altera.
2) Multiplicando-se ou dividindo-se uma constante a todos os valores observados (diferente de
zero), o desvio padro fica multiplicado ou dividido por essa constante.
# Observaes:
- Tanto a varincia como o desvio padro no so adequados para comparar valores com
mdias muito diferentes, mesmo que a unidade seja igual.
- No passvel de comparao entre valores com distintas unidades.
Exemplo para dados no agrupados
Exemplo 2: Nmero de coelhos por cria, considerando uma amostragem.
8, 9, 10, 10, 10, 11, 11, 11, 12, 12, 13, 13
# Pela frmula dedutiva, a varincia e o desvio padro so os seguintes:
- Mdia

X = 130/12 = 10,83 coelhos/cria


- Varincia
S2 =

(8 10,83) 2 + (9 10,83) 2 + (10 10,83) 2 + (10 10,83) 2 + (10 10,83) 2 +

12 1

(11 10,83) 2 + (11 10,83) 2 + (11 10,83) 2 + (12 10,83) 2 + (12 10,83) 2 + (13 10,83) 2 + (13 10,83) 2

12 1
(2,83) 2 + (1,83) 2 + (0,832 + (0,83) 2 + (0,83) 2 + (0,17) 2 + (0,17) 2 + (0,17) 2 + (1,17) 2 + (1,17) 2 + (2,17) 2 + (2,17) 2
S2 =
11

S2 =

25,67
= 2,34 coelhos/cria
11

- Desvio padro

S = 2,34 = 1,53 coelhos/cria


# Pela frmula de clculo temos:
2
n
n

Xn2 Xn
x n
S2= i=1
i=1
n
n n 1

40

Tabela 7.3- Nmero de coelhos por cria

Xi2
64
81
100
100
100
121
121
121
144
144
169
169
1434

Peso dos cordeiros (Xi)


8
9
10
10
10
11
11
11
12
12
13
13
130

- Varincia

1434 130 2 12

S =

12 12 11

S2= (119,5 - 117,36)x 12/11


S2= 2,34 coelhos/cria
- Desvio padro

S = 2,34
S= 1,53 coelhos/cria
7.4.2 Para dados agrupados
a) Sem intervalos de classe
Como temos intervalos de classes, fazemos uma modificao da frmula:
Varincia
- Para populao
n

S 2=

Fi Xn2
i=1

Fi

Fi Xn

i=1

Fi

- Para amostra
Obs.: Para amostra se multiplica o resultado por

Fi
Fi 1

41

Desvio padro

S = S2
Exemplo
Consideraremos o exemplo da ferrugem como uma amostra.
Tabela 7.4 - Municpios com registros de ocorrncia da ferrugem da soja, em determinada regio

i
1
2
3
4
5
soma

Ocorrncias
0
1
2
3
4
10

Municpios
15
10
8
5
2
40

FiXi
0
10
16
15
8
49

Ento temos:
Varincia

119 49 2 40

S 2 =

= 1,51 ocorrncias/municpio
40 40 39

Desvio padro

S = 1,51 = 1,228 registros/municpio

b) Com intervalos de classe


Varincia
- Para populao
n

S 2=

Fi CCi
i =1

Fi

Fi CC

i =1

Fi

- Para amostra
Obs.: Para amostra se multiplica o resultado por

Fi
Fi 1

Exemplo:
Consideraremos o exemplo do peso de sunos como uma amostra:

FiXi2
0
10
32
45
32
119

42

Tabela 7.5 - Distribuio de freqncia da produtividade de figueiras, expresso em kg/planta

I
1
2
3
4
5

Prod. (kg/planta)
3,0 l 4,2
4,2 l 5,4
5,4 l 6,6
6,6 l 7,8
7,8 ll 9,0

CC (Xi)
3,6
4,8
6,0
7,2
8,4
30,25

Plantas
2
2
6
2
3
15

FiCC
7,38
9,74
36,3
14,46
25,23
93,11

FiCC2
27,2322
47,4338
219,615
104,5458
212,1843
611,0111

Varincia

611,0111 93,11 2 15
S 2 =

= 1,13 kg/planta

15
15

14

Desvio padro

S = 1,13 = 1,06 kg/planta

7.5 COEFICIENTE DE VARIAO DE PEARSON (CV)


o desvio padro expresso em percentagem da mdia.
O desvio padro por si s no indica muita coisa por que:
- Difcil comparar grupos de valores quando as mdias so bastante distintas, mesmo que
expressos na mesma unidade.
- No possvel comparar grupos de valores expresso em unidades distintas.
Logo o Coeficiente de Variao :

CV =

100

X
Para os trs exemplos temos:
a) Dados no agrupados

X = 10,83 coelhos/cria
S 2 = 2,14 coelhos/cria
S= 1,46 coelhos/cria

CV =

1,46
100 = 13,48%
10,83

b) Dados agrupados sem intervalo de classe

X = 1,225 ocorrncias de ferrugem municpio

43

S2 =1,51 ocorrncias de ferrugem municpio

S = 1,228 ocorrncias de ferrugem municpio


CV =

1,228
100 = 100,24%
1,225

c) Dados agrupados com intervalo de classe

X = 6,207 kg/planta

S 2 = 1,13 kg/planta

S = 1,06 kg/planta
CV =

1,06
100 = 17,08%
6,207

Interpretao do CV:
- Baixo (menor que 10): dados com pouca variao
- Mdio (entre 10 e 20): dados com variao mdia
- Alto (maior que 20): dados com variaes elevadas

7.6 COEFICIENTE DE VARIAO DE THORNDIKE - CVT


igual ao quociente entre o desvio padro e a mediana.

CVT =

100

Md
Exemplo: Distribuio de freqncia da produtividade de figueiras, expresso em kg/planta.
S= 1,06 kg/planta
Md= 6,1 kg/planta

CVT =

1,06
100
6,1

CVT= 17,38%

44

8 MEDIDAS DE ASSIMETRIA E DE CURTOSE

8.1 ASSIMETRIA
o grau de afastamento de uma distribuio em relao a um determinado ponto referncia
(pode ser a mdia) chamado de eixo de simetria.
a) Simtrica: mdia, moda e mediana coincidem.

= Md = Mo X = Md
= Mo

b) Assimtrica positiva: apresenta mediana e mdia direita da moda.

Mo < Md < X Mo <


Md < X
c) Assimtrica negativa: apresenta mediana e mdia esquerda da moda.

< Md < Mo X < Md


< Mo

8.1.1 Relao de assimetria


a) Mdia e moda
Baseando-se nas relaes entre mdia e moda, podemos considerar:

X Mo = 0 distribuio simtrica

X Mo > 0 distribuio assimtrica positiva

X Mo < 0 distribuio assimtrica negativa

45

b) Coeficiente de assimetria
Entretanto, a mediada anterior absoluta, apresentando a mesma deficincia do desvio
padro, ou seja, no permite a comparao entre mediadas de duas distribuies.
Portanto, para comparao usaremos o coeficiente de assimetria de Pearson:

3( X Md)
As =
S
Interpretao:
- Simtrica: As = 0
- Assimetria fraca: IAsI < 0,15
- Assimetria moderada: 0,15 < IAsI < 1,0
- Assimetria forte: IAsI > 1
Obs.: conforme o sinal pode ser assimtrica positiva ou negativa
Exemplo 1:
-1

Tabela 8.1 - Consumo de leo diesel (l h ), por diferentes tratores agrcolas, durante a semeadura

Consumo (l h-1)
4,0 I 5,0
5,0 I 6,0
6,0 I 7,0
7,0 I 8,0
8,0 I 9,0

I
1
2
3
4
5

Trator
10
23
36
23
10
102

Fi
10
33
69
92
102

Conforme a relao mdia e moda:

-1
X = (4,5 x 10) + (5,5 x 23) +...+(8,5 x 10) = 6,5 l h

Mo= 6,5 l h-1


Logo temos: 6,5-6,5= 0 l h-1 distribuio simtrica
Conforme o coeficiente de assimetria:
Md= 102/2 = 51 posio
Logo est na classe 3, entre os valores 6 e 7:
36 1,0
18 x

x= 0,5

Md= 6,0 + 0,5 = 6,5 l h-1


n

S 2=

Fi Xi 2 Fi Xi
i =1

i =1

n
n

S2 =

4435,5 663

102
102

= 1,24 l h-1

CC (Xn)
4,5
5,5
6,5
7,5
8,5

FiXn
45
126,5
234
172,5
85
663

FiXn2
202,5
695,75
1521
1293,75
722,5
4435,5

46

3(6,5 6,5)
Logo: As =
= 0 simtrica
1,24

Exemplo 2:
-1

Tabela 8.2 - Consumo de leo diesel (l h ), por diferentes tratores agrcolas, durante a semeadura

Consumo (l h-1)
4,0 I 5,0
5,0 I 6,0
6,0 I 7,0
7,0 I 8,0
8,0 I 9,0

I
1
2
3
4
5

Trator
10
20
30
40
2
102

Fi
10
30
60
100
102

CC (Xn)
4,5
5,5
6,5
7,5
8,5

FiXn
45
110
195
300
17
667

FiXn2
202,5
605
1267,5
2250
144,5
4469,5

Conforme a relao mdia e moda:

-1
X = (4,5 x 10) + (5,5 x 30) +...+(8,5 x 2) = 6,54 l h

Mo= 7,5 l h-1


Logo temos: 6,54-7,5= -0,96<0 distribuio assimtrica negativa
Conforme o coeficiente de assimetria:
Md= 102/2 = 51 posio
Logo est na classe 3, entre os valores 6 e 7:
30 1,0
21 x

x= 0,7

Md= 6,0 + 0,7 = 6,7 l h-1


S2 =

4469,5 667

102
102

Logo: As =

= 1,06 l h-1

3(6,54 6,7)
= 0,45 assimtrica negativa moderada
1,06

Exemplo 3:
-1

Tabela 8.3 - Consumo de leo diesel (l h ), por diferentes tratores agrcolas, durante a semeadura

I
1
2
3
4
5

Consumo (l h-1)
4,0 I 5,0
5,0 I 6,0
6,0 I 7,0
7,0 I 8,0
8,0 I 9,0

Trator
2
40
30
20
10
102

Fi
2
42
72
92
102

CC (Xn)
4,5
5,5
6,5
7,5
8,5

Conforme a relao mdia e moda:

-1
X = (4,5 x 2) + (5,5 x 40) +...+(8,5 x 10) = 6,46 l h

Mo= 5,5 l h-1


Logo temos: 6,46-5,5= 0,96>0 distribuio assimtrica positiva

FiXn
9
220
195
150
85
659

FiXn2
40,5
1210
1267,5
1125
722,5
4365,5

47

Conforme o coeficiente de assimetria:


Md= 102/2 = 51 posio
Logo est na classe 3, entre os valores 6 e 7
30 1,0
9 x

x= 0,3

Md= 6,0 + 0,3 = 6,3 l h-1


S2 =

4365,5 659

102
102

Logo: As =

= 1,06 l h-1

3(6,46 6,3)
= 0,45 assimtrica positiva moderada
1,06

8.2 CURTOSE
o grau de achatamento de uma distribuio em relao a distribuio padro, denominada
curva normal.
Temos 3 tipos:
- Leptocrtica: mais fechada que a normal ou mais aguda.
- Platicrtica: mais aberta que a normal ou achatada.
- Mesocrtica: a curva normal, sendo a referencial.
Exemplo: fazer no quadro.
8.2.1 Coeficiente de curtose
Para avaliar a curtose usa-se a seguinte frmula:
CC =

Q3 Q1
2(P90 P )
10

Interpretao:
- Leptocrtica: CC<0,263
- Platicrtica: CC>0,263
- Mesocrtica: CC = 0,263
Exemplo: Distribuio de freqncia do peso de 15 sunos da raa landrace, nos primeiros 30
dias de idade.
Q1= 5,31 kg

CC =

Q3= 7,38 kg

P10= 3,985 kg

P90= 8,41 kg

7,38 5,31
= 0,234 - logo, a distribuio considerada leptocrtica.
2(8,41 3,985)

48

9 REGRESSO LINEAR SIMPLES


9.1 INTRODUO
uma anlise bivariada, pois tem o objetivo de estudar a relao entre duas variveis.
Usados para fatores de tratamento quantitativos.
9.2 GRFICO DA DISPERSO
Pode indicar correlao linear positiva, negativa ou inexistncia de correlao.
Tambm til para identificar existncia de valores aberrantes.
A varivel X a independente e Y a dependente.
a) correlao positiva
5000

Produtividade (kg/ha)

Adubao Produtividade
100
2560
150
3000
200
3398
250
3378
300
4050
350
4298
400
4500

4500
4000
3500
3000
2500
2000
50

150

250

350

450

Adubo (kg/ha)

Grfico 1 - Produtividade de determinada cultura em funo da aplicao de adubo.


b) correlao negativa
5000

Produtividade (kg/ha)

Adubao Produtividade
400
4400
450
4000
500
3710
550
3480
600
3045
650
2871
700
2569

4500
4000
3500
3000
2500
2000
300

400

500

600

700

800

Adubao (kg/ha)

Grfico 2 - Produtividade de determinada cultura em funo da aplicao de adubo.

49

c) Sem correlao
4500

Produtividade (kg/ha)

Adubao Produtividade
100
2584
150
4012
200
3015
250
3958
300
2781
350
3451
400
2800

4000
3500
3000
2500
2000
0

100

200

300

400

500

Adubao (kg/ha)

Grfico 3 - Produtividade de determinada cultura em funo da aplicao de adubo.

9.3 COEFICIENTE DE CORRELAO LINEAR (R)


Indica:
- o grau de intensidade da correlao entre as duas variveis
- o sentido dessa correlao (positivo ou negativo).
Obteno pelo coeficiente de Pearson:

r=

[n X

n X i Yi ( X i . Yi )

][

2
2
2
2
i ( X i ) . n Yi ( Yi )

onde n o nmero de observaes.


Os valores de r esto sempre entre -1 e 1, sendo adimensional.
Assim:
r= 1 correlao entre as duas variveis perfeita e positiva;
r= -1 correlao entre as duas variveis perfeita e negativa;
r= 0 ausncia de correlao entre as duas variveis.

Exemplo 1 - Calcular o coeficiente de correlao para os dados a seguir:

50

Tabela 1 Produtividade de leite em funo da dose diria de rao


Rao (kg)
5,0

Produtividade (l/dia)
15,1

Xi.Yi
75,50

Xi
25,00

Yi
228,01

5,3
5,6
5,9

15,3
15,7
16,0

81,09
87,92
94,40

28,09
31,36
34,81

234,09
246,49
256,00

6,2
6,5

16,2
15,9

100,44
103,35

38,44
42,25

262,44
252,81

6,8
7,1

16,4
17,0

111,52
120,70

46,24
50,41

268,96
289,00

7,4
55,80

16,7
144,30

123,58
898,50

54,76
351,36

278,89
2.316,69

Logo:

r=

9x898,50 - 55,80x144, 30
(9x351,36 - 55,80 2 )x (9x 2316,69 144,30 2 )

= 0,94158

Concluso: Existe uma correlao positiva entre a dose de rao fornecida e a produtividade de leite
de 94,16%.
9.4 COEFICIENTE DE DETERMINAO (R2)
Mede a proporo de variao de Y que explicada linearmente pela variao de X.
Os valores de r2 ficam entre 0 e 1.
r2= (r)2
r2= (0,94158)^2
r2= 0,88658
Concluso: Pode-se afirmar que 88,66% do aumento de produtividade de leite explicada
linearmente pela dose de rao fornecida.
9.5 EQUAO DA RETA E DETERMINAO DOS PARMETROS
Tem por objetivo descrever atravs de um modelo matemtico a relao entre duas variveis.
A modelo que descreve :
Y=a + bX
Onde:
a= parmetro
b= parmetro da inclinao da reta.
Os parmetros so obtidos pelas equaes:

51

n XnYn ( Xn Yn )

b=

n Xn 2 ( Xn )

Clculo dos parmetros:

b=

9 898,50 - 55,80 144,30


9 351,36 - 55,80 2

b= 0,7111


a= 11,6244
Logo o modelo fica descrito por:
Y= 11,6244 + 0,7111X
Obs: Para cada quilo de rao que for fornecido, teria um incremento de 0,7111 litros de leite.
Ento o grfico fica assim apresentado:

Produtividade (l/ha)

17,5
17,0

y = 0,7111x + 11,624
R2 = 0,8866

16,5
16,0
15,5
15,0
4,5

5,5

6,5

7,5

8,5

Rao (kg)

Grfico 1 - Produtividade de leite em funo da dose diria de rao.


Concluso da regresso linear:
Espera-se que 88,66% das vezes a variao da produtividade de leite explicada linearmente pela
dose de rao, sendo que o fornecimento de cada quilo de rao proporciona o incremento de 0,71
litro de leite.
Obs.: A regresso s pode estimar valores para o intervalo avaliado.
Exemplo: Estime a produtividade em funo de alguma dose de rao

52

10 ANLISE COMBINATRIA

10.1 INTRODUO
A necessidade de calcular o nmero de possibilidades existentes nos chamados jogos de
azar levou ao desenvolvimento da Anlise Combinatria. Trata-se de uma parte da Matemtica que
estuda os mtodos de contagem. Esses estudos foram iniciados j no sculo XVI, pelo matemtico
italiano Niccollo Fontana (1500-1557), conhecido como Tartaglia. Depois dele vieram os franceses
Pierre de Fermat (1601-1665) e Blaise Pascal (1623-1662).
10.2 FATORIAL
Para resolver problemas de Anlise Combinatria precisamos utilizar uma ferramenta
matemtica chamada Fatorial.
Seja n um nmero inteiro no negativo. Definimos o fatorial de n (indicado pelo smbolo n!) como
sendo:
n! = n .(n-1) . (n-2) . ... .4.3.2.1 para n 2.
Exemplos:
a) 6! = 6.5.4.3.2.1 = 720
b) 4! = 4.3.2.1 = 24
c) 7! = 7.6.5.4.3.2.1 = 5040
d) 10! = 10.9.8.7.6.5.4.3.2.1
e) 3! = 3.2.1 = 6
Perceba que 7! = 7.6.5.4!, ou que
6! = 6.5.4.3!, e assim sucessivamente.
Casos especiais:
0! = 1
1! = 1
10.3 PRINCPIO FUNDAMENTAL DA CONTAGEM - PFC
Se determinado acontecimento ocorre em etapas independentes, e se a primeira etapa pode
ocorrer de k1 maneiras diferentes, a segunda de k2 maneiras diferentes, e assim sucessivamente,
ento o nmero total T de maneiras de ocorrer o acontecimento, composto por n etapas, dado
por:
T = k1. k2 . k3 . ... . kn

53

Exemplo 1:
No Brasil as placas dos veculos so confeccionadas usando-se 3 letras do alfabeto e 4
algarismos. Qual o nmero mximo de veculos que poder ser licenciado?
Imaginemos a seguinte situao: Placa ACD 2172.
Como o alfabeto possui 26 letras e nosso sistema numrico possui 10 algarismos (de 0 a 9),
podemos concluir que: para a 1 posio, temos 26 alternativas, e como pode haver repetio, para a
2, e 3 tambm teremos 26 alternativas. Com relao aos algarismos, conclumos facilmente que
temos 10 alternativas para cada um dos 4 lugares. Podemos ento afirmar que o nmero total de
veculos que podem ser licenciados ser igual a:
T= 26 x 26 x 26 xx10 x 10 x 10 x 10 = 175.760.000
No Brasil, antes da alterao do sistema de emplacamento de automveis, as placas dos
veculos eram confeccionadas usando-se 2 letras do alfabeto e 4 algarismos. Qual o nmero mximo
de veculos que podia ser licenciado neste sistema?
Imaginemos a seguinte situao: Placa AC 2172.
T= 26.26.10.10.10.10= 6.760.000
Percebe-se que a incluso de apenas uma letra faz com que sejam licenciados,
aproximadamente, mais 170.000.000 de veculos.

10.4 ARRANJOS SIMPLES


Temos um Arranjo quando os agrupamentos conseguidos ficam diferentes ao se inverter a
posio dos seus elementos.
Perceba que, se quisermos formar centenas de algarismos distintos, utilizando apenas os 5
primeiros nmeros mpares (1; 3. 5; 7; 9) teremos as seguintes centenas:135; 137;139; 153, 157, e
assim sucessivamente.
Se invertermos a posio dos elementos de qualquer uma destas centenas conseguiremos
outra centena diferente: 135 351. Temos ento um ARRANJO de 5 nmeros (1; 3; 5; 7; 9) em
grupos de trs (centenas).
Representando o nmero total de arranjos de n elementos tomados k a k (taxa k) por An,k ,
teremos a seguinte frmula:
!!,! =

!!

!! !

Exemplo 1:
Considerando que desejamos formar arranjos de 3 nmeros (centenas) a partir dos seguintes
nmeros: 1, 2, 3, 4, 5, 6 e 7.

!!,! =

!!
!!! !

= 210 arranjos de trs a trs

54

Exemplo 2:
Usando-se as 26 letras do alfabeto, quantos arranjos distintos com 4 letras podem ser
montados?

!!",! =

!"!
!"!! !

= 358800 arranjos de quatro a quatro

10.5 PERMUTAES SIMPLES


Permutaes simples de n elementos distintos so os agrupamentos formados com todos os
n elementos e que diferem uns dos outros pela ordem de seus elementos. De outro modo, podemos
entender permutao simples como um caso especial de arranjo, onde n = k, ou seja:
!!,! =

!!

!! !


An, n = n!/(n-n)! = n!/0! = n!/1 = n!
Chega-se ento relao:
Pn = n!
Exemplo 1:
Quantas possibilidades de agrupamentos h com os elementos A, B, C?
So possveis as seguintes permutaes: ABC, ACB, BAC, BCA, CAB e CBA.
De forma matemtica: P3 = 3! = 3.2.1 = 6
Exemplo 2:
Calcule o nmero de formas distintas de 5 pessoas ocuparem os lugares de um banco retangular de
cinco lugares.
P5 = 5! = 5.4.3.2.1 = 120
Exemplo 3
Denomina-se ANAGRAMA o agrupamento formado pelas letras de uma palavra, que podem ter ou
no significado na linguagem comum. Os possveis anagramas da palavra REI so: REI, RIE, ERI,
EIR, IRE e IER. Calcule o nmero de anagramas da palavra MUNDIAL.
P7 = 7! = 7.6.5.4.3.2.1 = 5040

55

10.6 PERMUTAES COM ELEMENTOS REPETIDOS


Se entre os n elementos de um conjunto, existem a elementos repetidos, b elementos
repetidos, c elementos repetidos e assim sucessivamente, o nmero total de permutaes que
podemos formar dado por:

!!!,!,!,.. =

!!

!! !! !!. .

Exemplo 1
Determine o nmero de anagramas da palavra MATEMTICA (no considere o acento).
Temos 10 elementos, com repeties M (repetida duas vezes), a letra A (trs vezes) e a letra T (duas
vezes).
Na frmula anterior, teremos: n=10, a=2, b=3 e c=2.
!"!

!,!,!
!!"
= !!!!!! =151200

10.7 COMBINAES SIMPLES


Temos uma combinao quando os agrupamentos conseguidos permanecem iguais ao se
inverter a posio dos seus elementos.
Perceba que se houverem cinco pessoas entre as quais desejamos formar grupos de trs, o
grupo formado por Joo, Pedro e Lus o mesmo grupo formado por Lus, Pedro e Joo. Temos,
ento, uma combinao de cinco elementos em grupos de trs.
Representando por Cn,k o nmero total de combinaes de n elementos tomados k a k (taxa
k), temos a seguinte frmula:

!!! =

!!

!! (! !)!

Exemplo 1:
Resolvendo o problema dos grupos de 3 pessoas, temos:

!!! =

5!
= 10 !"#$%&'!" !" !"! ! !"!
3! (5 3)!

Exemplo 2
Uma prova consta de 15 questes das quais o aluno deve resolver 10. De quantas formas ele poder
escolher as 10 questes?
Observe que a ordem das questes no muda o teste. Logo, podemos concluir que se trata de um
problema de combinao de 15 elementos com taxa 10.
!"
!!"
=

15!
= 3003 !"#$%&'!" !" !"! ! !"!
10! (15 10)!

56

11 INTRODUO A TEORIA DA PROBABILIDADE

11.1 INTRODUO
Os clculos de probabilidade pertencem ao campo da matemtica
A maioria dos fenmenos de que trata estatstica de natureza aleatria ou probabilstica.
As razes da Teoria de Probabilidade encontram-se nos jogos de azar, cuja origem remonta ao
sculo XVII (Chevalier de Mer, Fermat e Pascal).
Bernoulli (1713) introduziu a base matemtica da teoria fazendo relao entre probabilidade e
freqncia relativa.
O conhecimento dos aspectos fundamentais do clculo da probabilidade fundamental para o
estudo da estatstica Inferencial.
Por exemplo:
# Acerto em jogo
# Defeito em algum produto (mquina, pea)
# Seguros sobre bens durveis
# Nmeros de animais em determinado intervalo de peso
# Seca

11.2 CLASSIFICAO DOS MODELOS


a) Determinsticos
aquele cujo resultado conhecido a priori. Todos os experimentos determinsticos podem
ser representados por um modelo determinstico.
Ex.: rea de um crculo
Pode ser facilmente determinada, basta conhecer seu raio.
a= r2
b) Probabilsticos ou aleatrios
o experimento cujo resultado final no pode ser determinado com certeza.
o experimento cujos resultados no so previsveis, mesmo que ele seja repetido inmeras
vezes em condies idnticas.
Exemplo: Jogar um dado e verificar o resultado
Encontrar uma pea com defeito.
Caractersticas
- Todo experimento aleatrio pode ser repetido sob condies essencialmente idnticas.

57

- Todo experimento aleatrio pode ter resultados estveis se for repetido um nmero
suficientemente grande.

11.3 ESPAO AMOSTRAL OU PONTOS AMOSTRAIS (S)


o conjunto de todos os possveis resultados de um experimento aleatrio.
Cada experimento, em geral, pode ter vrios resultados possveis.
No lanamento de uma moeda, os resultados possveis so cara (K) e coroa (C). O espao
amostral :
S = {K, C}
No lanamento de um dado, o espao amostral :
S = {1, 2, 3, 4, 5, 6}
No lanamento de duas moedas, uma aps a outra.
S = {(K, K), (K, C), (C, K), (C, C)}
Ao extrairmos uma bola de uma urna contendo bolas brancas, vermelhas e pretas.
S = {B, V, P}
No lanamento de dois dados, um aps o outro.
S = {(1, 1), (1, 2), (1, 3) ... (6, 5), (6, 6)}
11.3.1 Tipos de espao amostral
# Enumervel: o espao amostral que se consegue enumerar todos os elementos do
conjunto.
Ex.: jogo do dado
# No enumervel: aquele conjunto cujos elementos no podem ser numerados.
Exemplo: lmpada - acender e anotar o tempo.

11.4 EVENTO (E)


Tambm, pode ser representado por qualquer letra.
um subconjunto do espao amostral.
O evento pode ser:
# certo: prprio espao amostral
# Impossvel: aquele evento que no tem possibilidade de aparecer. Ex: dado 1 a 6, evento
impossvel aparecer 1>x>6.
# Elementar: quando o conjunto unitrio.
Os eventos de um s elemento so chamados eventos elementares.
O espao S o evento certo e o evento impossvel.

58

Exemplos:
1) No lanamento de uma moeda, j vimos que S = {K, C}. Temos os eventos:
A = {K}: ocorrncia de cara (evento elementar)
B = {C}: ocorrncia de coroa (evento elementar)
S = {K, C}: ocorrncia de cara ou coroa (evento certo)
: ocorrncia de nem cara nem coroa (evento impossvel)
2) No lanamento de dois dados, alguns dos eventos so:
A = {(1, 3), (2, 2), (3, 1)}: Ocorrncia de soma 4.
B = {(1, 1), (2, 2), (3, 3), (4, 4), (5, 5), (6, 6)}: ocorrncia de resultados iguais nos dois
lanamentos.
Logo Quando:
- E = S, E chamado evento certo
- E S e E um conjunto unitrio, E um evento elementar ( est contido)
- E = , E chamado evento impossvel
Exemplo: Lanar um dado
A= {1, 2, 3} S A evento de S
B= {1, 2, 3, 4, 5, 6} S B evento certo
C= {4} S evento elementar
D= S evento impossvel
= conjunto vazio
{}= conjunto cujo componente vazio
Por exemplo:
1) Ao lanarmos uma moeda h dois resultados possveis: Logo temos S1= {K, C}
2) Ao lanarmos um dado h seis resultados possveis: Logo temos: S2= {1, 2, 3, 4, 5, 6}
3) Ligar uma lmpada e medir o tempo que ele fica ligada.
Logo temos S3= {t 0}
Assim teremos:
S1 e S2 so enumerveis e denominados discretos.
S3 no enumervel e denominado contnuo.

59

Exemplo 4
SS
AA

BB

Situao 1
A= {1, 2, 3}
B= {3, 4}
A e B so eventos de S.
A U B= {1, 2, 3, 4}
A B= {3}
Situao 2:
A= {2, 4, 6}
B= {1, 3, 5}
A U B= {1, 2, 3, 4, 5, 6}
A B= { }
11.4.1 Possibilidades para a ocorrncia de eventos aleatrios
a) Unio (A U B)
formado pelos pontos amostrais que pertencem a, pelo menos, um dos eventos.
A= {1, 2, 3}
B= {3, 4}
A U B= {1, 2, 3, 4}
b) Interseco (A B)
formado pelos pontos que pertencem simultaneamente aos eventos A e B.
A= {1, 2, 3}
B= {3, 4}
A B= {3}
c) Complementao (S A = )
Lanam-se 2 moedas, seja A: sada de faces iguais e B: sada de cara na primeira moeda.
Logo:
S= {(C, C), (C, K), (K, C), (K, K)}
A= {(C, C), (K, K)}
B= {(C, C), (C, K)}

60

A U B= {(C, C), (C, K), (K, K)}


A B= {(C, C)}
= {(C, K), (K, C)}
__

B = {(K, C), (K, K)}


d) Excluso
Quando os dois eventos no tm nenhum elemento comum.
A= {2, 4, 6}
B= {1, 3, 5}
A B= { }
11.5 DEFINIO DE PROBABILIDADE

11.5.1 Clssica
Num experimento aleatrio, sendo S o seu espao amostral, admitindo que todos os elementos
de S tenham a mesma chance de acontecer, ou seja, que S um subconjunto equiprovvel.
Exemplos: Dado, baralho, bolas pretas e brancas
Denominamos de probabilidade de um evento A (A S) o nmero real P(A), tal que:
P(A)=

nmero de casos favorveis ao evento (A)


nmero de casos possveis (S)

Exemplo 1:
Qual a probabilidade, entre 6 alternativas, do aluno errar a questo. As chances so
equiprovveis.
P(A)= 1/6 ou 16,67%
11.5.2 Pela freqncia relativa
Realizando-se um experimento um grande nmero de vezes, pode-se determinar qual a
chance de determinado evento ocorrer. A freqncia de ocorrncia desse evento a estimativa da
probabilidade.
P(A)=

nmero de vezes observadas da situao desejada (A)


nmero total de observaes (S)

# Onde:
1) 0 P(A) 1
2) P(A)= 1, se, e somente se, A ocorrer em todas as n situaes
3) P(A)= 0, se, e somente se, A nunca ocorrer nas n situaes

61

Exemplo 1:
Qual a probabilidade de uma pessoa ser atingida por um raio num perodo de um ano. O
espao amostral consiste de 2 eventos, no equiprovveis. Digamos que numa determinada regio
caia 122110 raios em um ano e, em mdia, 199 atinjam pessoas, segundo registros locais.
Qual a probabilidade de uma pessoa ser atingida, sabendo-se que a populao total de
80.000.000 de pessoas.
P(A)=

199
1
=
hab
80.000.000 402.010

Exemplo 2: Uma companhia de seguros automotivos tem na sua base de registros as seguintes
informaes sobre acidentes de trnsito durante um perodo X:
- 3.102 por falhas mecnicas;
- 8.080 por defeitos na pista;
- 32.581 por imprudncia, sendo destes, 21.022 por excesso de velocidade e 11.559 por
ultrapassagem em local proibido.
Qual a probabilidade de ocorrncia de acidente por defeitos na pista e por excesso de
velocidade?
# defeitos P(A)= 8.080/43.763 = 18,46%
# velocidade P(B)= 21.022/43.763 = 48,04%
11.5.3 Axiomtica (kolmogorov)
Axioma - uma afirmao que no possvel de demonstrao.
Probabilidade ou medida de probabilidade a funo P definida em S que se associa a cada
evento a um nmero real, que satisfaz os axiomas seguintes:
1) 0 P(A) 1
2) P(S)=1
3) Se A e B so mutuamente exclusivos P(A U B) = P(A) + P(B)
11.4.4 Regras bsicas da probabilidade
a) Adio
Usa-se essa regra para calcular a probabilidade da ocorrncia de eventos mutuamente
exclusivos
P(A U B)= P(A) + P(B) P( A B)
Onde P(A /ou B)= denota a interseo de A e B
b) Multiplicao
Usa-se essa regra para calcular a probabilidade da ocorrncia de eventos independentes

62

P(A /e B)= P(A) x P(B)


11.4.5 Tipos de eventos
a) Evento complementar
Sabe-se que um evento pode ocorrer ou no. Sendo a probabilidade de que ele ocorra
denotada por A e que no ocorra por , temos a relao:
P(A ou )= P(A) + P() = 1
P()= 1- P(A)
Eventualmente, devemos determinar a probabilidade de um evento A no ocorrer.
O complemento de um evento A, denotado por , consiste em todos os resultados em que o
evento A no ocorre.
Ex.: tirar 4 num dado 1/6, logo a probabilidade de no tirar 4 5/6.
b) Eventos independentes
Quando a realizao de um evento no afeta a probabilidade da realizao do outro.
Por exemplo, quando lanamos dois dados, o resulto obtido em um independente do outro.
Se dois eventos so independentes a probabilidade que eles ocorram simultaneamente igual
ao produto das probabilidades dos dois.
Para serem independentes P(A B)= P(A) x P(B), ou seja, se P(A)= 0,8, P(B)=0,35 e P(A
B)= 0,28, logo A e B so independentes.
Exemplo: qual a probabilidade de obtermos 2 no lanamento do primeiro dado e 6 no segundo.
P=

1 1
1
=
6 6 36

c) Eventos mutuamente exclusivos


Quando a realizao de um exclui a realizao do outro.
Assim, ao lanar uma moeda o evento tirar cara e o evento tirar coroa so mutuamente
exclusivos.
Ento a probabilidade de que um ou outro ocorra igual a soma das probabilidades.
Exemplo: ao lanar um dado a probabilidade de tirar 1 ou 4 .
P=

1 1 2 1
+ = =
6 6 6 3

11.4.6 Probabilidade subjetiva


Consiste no palpite. Baseia-se no conhecimento de fatores relevantes.
Exemplo: alunos quando no estudaram para uma prova
Para seguro de um animal de alta gentica para uma exposio.
baseada em conhecimentos relevantes.

63

11.4.7 Probabilidade atravs da freqncia relativa


Realizando-se um experimento um grande nmero de vezes, pode-se determinar qual a
chance de determinado evento ocorrer. A freqncia de ocorrncia desse evento a estimativa da
probabilidade.

P (X = x) =

P(x)
P(S)

Exemplo 1:
Digamos que numa determinada regio sejam roubados em um ms, em mdia, 9 veculos da
marca X, segundo registros locais.
Qual a probabilidade de um veculo da marca X ser roubado no perodo de um ano, sabendose que o nmero total de carros emplacados de 833524, sendo 8,3% da marca X.
P(X= 9)=

9 12
108
=
= 0,156%
833524 x 0,083 69183,5

11.4.8 Probabilidade condicional


Sejam os eventos A, B, denota-se P(A/B) a probabilidade condicionada do evento A, quando B
tiver ocorrido ou a probabilidade condicional do evento A dado B definida por:
P(A/B) =

P(B A )
P(A B)
ou P(B/A) =
P(B)
P(A)

Podemos dizer que:


P(A B): nmero de casos favorveis a (AB) e
P(B): nmero de casos favorveis a B.
Exemplo:
Considerando criador de gado tem 500 cabeas no seu campo, sabendo-se que destas 300
so fmeas (F) e 200 machos (M). Destes, 200 so da raa charols (A), 100 da raa braford (B),
150 da raa devon (C) e 50 da raa nelore (D). Considerar que a distribuio de animais para sexo
conforme a tabela abaixo.
Sendo escolhido ao acaso um animal, qual a probabilidade de ser braford, dado ser macho.
A

Total

91

25

64

20

200

109

75

86

30

300

Total

200

100

150

50

500

Logo temos: P(B/M) =

P(B M)
P(M)

64

P(B M)= 25/500

P(M)= 200/500

25
P(B/M) = 500 = 0,1250 ou 12,5% de ser braford dado ser macho
200
500

11.4.9 Teorema de Bayes


Tem-se uma partio do espao amostral S em um nmero finito de eventos Si (i= 1, 2,3,...,
n) se:
a) Os Si so mutuamente excludentes dois a dois, isto , Si Sj = para i j.
b)

Si

= S isto , os eventos S so exaustivos, pois sua unio esgota ou exaure todo o espao

i =1

amostral S.
Partio de S subdividido, sendo A um evento arbitrrio de S, com P(A) > 0.
P(Si / A)=

P (Si A )
P(A)

O teorema de Bayes uma generalizao da probabilidade condicional para mais de dois


eventos.
SS
S2
S2
S1

S5
S5

A
A
S6
S6

S3
S3
S4
S4

P(A)= P(S1 A) + P(S2 A) +...+ P(Sn A) =

P (Si A)

i =n

Pela probabilidade condicional:


P(Si / A)=

P( Si ) * P(A \ Si )
n

P (Si) * P(A \ Si)


i=n

Exemplo: Numa fbrica trs mquinas denominadas A, B e C, que correspondem, respectivamente,


por 40, 35 e 25% da produo, sendo de 2, 1, 3% as peas defeituosas produzidas pelas mquinas
na mesma ordem. Sabe-se que a pea defeituosa, qual a probabilidade, tomada ao acaso, de ter
sido produzida pela mquina B?
Denominaremos B o evento fabricado pela mquina B e d o evento defeito.
Queremos a P(B / d).
P(B / d)=

P( B d ) P( B) * P( d / B)
=
P(d)
P( d )

65

Mas a pea defeituosa pode provir de qualquer uma das mquinas, logo:
P(d)= P(A)*P(d / A) + P(B)*P(d / B) + P(C)*P(d / C)
P(d)= (0,40 x 0,02) + (0,35 x 0,01) + (0,25 x 0,03) = 0,019 ou 1,9%
Ento:
P(B / d)=

0,35 * 0,01
= 0,184 = 18,4%
0,019

Qual a probabilidade de ter sido fabricada por C e ter defeito?


P(C / d)= P(C) P(C/d) = 0,25 * 0,03 = 0,395 = 39,5%
P(d)
0,019

66

12 VARIVEIS ALEATRIAS

12.1 INTRODUO
Muitos experimentos produzem resultados no numricos, sendo conveniente transformar
seus resultados em nmeros. Isto feito atravs da varivel aleatria, que uma regra que associa
um valor numrico a cada ponto do espao amostral.
Ento, uma varivel aleatria (geralmente representada por x) que tem um valor numrico
nico (determinado aleatoriamente) para cada resultado de um experimento.
Exemplo:
Lanam-se duas moedas e observa-se o resultado.
O espao amostral pode ser S={KK, KC, CK, CC}
Uma varivel aleatria de interesse X= {nmero de coroas}. A cada evento simples,
associamos um nmero, que o valor assumido pela varivel aleatria X:
Evento

KK

KC

CK

CC

Outro passo fundamental associar cada valor a sua probabilidade, obtendo o que
denominamos de uma distribuio de probabilidade.
Esta fica caracterizada pelos valores da v.a. X e pela regra, ou funo, que associa a cada
valor uma probabilidade, denominada funo de probabilidade, representada por f(x).
Valores de X

Probabilidade f(x)

1/4

1/2

1/4

Obs.: A varivel aleatria pode ser denominada:


a) Discreta: se seu espao amostral enumervel. Ex.: nmero de expectadores
b) Contnua: se seu espao amostral no enumervel. Ex.: carga de uma pilha

12.2 ESPERANA MATEMTICA


Podemos definir, para as distribuies de probabilidade, as mesmas medidas de tendncia
central e de disperso utilizadas nas distribuies de freqncias.
A mdia de uma v.a. X tambm chamado valor esperado, ou esperana matemtica ou
esperana de X. representada por E(X) e se define como:
E(X) = xi f(xi),

67

estendendo-se o somatrio a todos os valores possveis de X.


uma mdia ponderada dos xi,em que os pesos so as probabilidades associadas.
A esperana matemtica uma medida de centro, ou de tendncia central de uma distribuio.
Portanto, E(X) tambm chamada mdia populacional, denotada por .
Exemplo 1: consideremos a soma dos pontos que aparecem na jogada de dois dados. Os
valores possveis da soma de X, com suas probabilidades associadas f(x) = P(X = x) so:
x

10

11

12

f(x)

1/36

2/36

3/36

4/36

5/36

6/36

5/36

4/36

3/36

2/36

1/36

X . f(x)
E(X) = 2*(1/36)+3*(2/36)+4*(3/36)+...+12*(1/36) = 7
Neste caso a esperana matemtica a mdia populacional ponderada, conforme pode ser

f(x)

observado no grfico abaixo:

10

11

12

Exemplo 2: Um produtor rural, com 40 anos, obtm um emprstimo agrcola para implantao
de lavouras anuais no valor de R$ 30.000, para pagar no prazo de um ano. Sabe-se que a
probabilidade de um homem com esta idade falecer antes de completar 41 anos de 3,53 em 1.000.
Entretanto, ele deseja fazer um seguro de vida por esse prazo, pois caso morra antes deste perodo
a divida fique remida (a companhia seguradora ficar responsvel pelo pagamento). Qual o prmio
que ele deve pagar a seguradora para cobrir o risco de morte, sem contabilizar os seus encargos e
lucro?
O prmio que deve ser pago a esperana de perda da companhia.
Sendo X a perda da companhia, a distribuio de probabilidade X dada por:
X

30.000

f(x) = P(X = x)

1-(3,53/1.000)

3,53/1.000

X * f(x)

105,90

68

E(X) = 30.000 * 0,00353 + 0 * (1-0,00353) = R$ 105,90


Ento este o prmio que deve ser pago a seguradora para cobrir o risco de morte, mas no
valor total sero acrescidos o encargo e lucro.
Claro que este valor s vlido para um grande nmero de segurados e no apenas poucos.
a) Propriedades
Se a e b so constantes e X uma v.a., ento:
1) E(a) = a
2) E(bX) = bE(X)
3) E(X Y) = E(X) E(Y)
4) E(aX b) = aE(X) b
5) E(X x) = 0
b) Varincia e desvio padro
# Varincia: mediada que avalia a disperso (ou concentrao) de probabilidade em torno da
mdia.
2 = Var(X) = E[(X )2] = E(X2) 2
# Desvio padro:
= dp(X) =

Var(X)

Exemplo:
X

P(X)

X * P(X)

X2 * P(X)

-2

1/5

-2/5

4/5

-1

1/5

-1/5

1/5

1/5

1/5

3/5

9/5

1/5

5/5

25/5

x= 1

E(X2)= 39/5

Var(X)= E(X2) 2
Var(X)= 39/5 -12
Var(X)= 6,8
dp(X)= 2,61
b.1) Propriedades da varincia
Para a e b constantes, temos:
1. Var(a)> 0
2. Var(X + a) = Var(X)

69

3. Var(b*X)= b2 Var(X)
4. Var(a bX) = b2 Var(X)
5. Var(X Y) = Var(X) + Var(Y) 2 Cov(X, Y)

12.3 VARIVEL ALEATRIA DISCRETA

12.3.1 Distribuio conjunta de duas variveis aleatrias


Quando objetivamos estudar mais de um resultado de um experimento aleatrio.
Exemplo:
Considerando o salrio e o tempo de servio de dez funcionrios de determinada empresa,
determine a distribuio conjunta de probabilidade da varivel X: salrio (reais) e da varivel Y:
tempo servio (anos).
Funcionrio

500

600

600

800

800

800

700

700

700

600

Construiremos uma tabela de dupla entrada, onde colocaremos as probabilidades conjuntas


de X e Y.

Y
4

Totais

500

1/10

1/10

600

2/10

1/10

3/10

700

1/10

2/10

3/10

800

1/10

2/10

3/10

Totais

1/10

3/10

6/10

10/10

Assim a probabilidade de P(X=600, Y=5) = 2/10 e P(X=800, Y=5) = 0

70

12.3.2 Distribuies marginais de probabilidade e esperana de X


Distribuio marginal de X (salrio), dos dados anteriores temos:
X

P(X)

X . P(X)

500

1/10

500/10

600

3/10

1800/10

700

3/10

2100/10

800

3/10

2400/10

E(X)= 680

Logo a mdia salarial de R$ 680,00


Distribuio marginal de Y (tempo trabalho), dos dados anteriores temos:
X

P(X)

Y . P(X)

1/10

4/10

3/10

15/10

6/10

36/10

E(X)= 5,5

Logo o tempo mdio de servio de 5 anos e 6 meses.


Consideremos a distribuio de freqncia em relao ao nmero de multas em
determinada rodovia.
Tabela 2 Freqncia de multas de transito
Multas

Freqncias (dias)

Probabilidades para 1 dia

0,10

0,20

12

0,40

0,20

0,10

30

1,00

A esta tabela denominamos distribuio de probabilidade.


Seja X uma varivel aleatria que pode assumir valores x1, x2, x3, ... , xn. A cada valor xi
correspondem pontos do espao amostral. Associamos, ento, a cada valor xi a probabilidade pi de
ocorrncia de tais pontos no espao amostral.
Ento para que uma funo f(x) seja uma distribuio de probabilidade necessrio que:
1. p(x) = 1, onde x toma todos os valores possveis
2. 0 P(x) 1, para todo x

71

Os valores de x1, x2, x3, ... , xn e seus correspondentes p1, p2, p3, ..., pn definem uma
distribuio de probabilidade.
Ao definir distribuio de probabilidade estabelecemos uma relao entre a varivel aleatria
X e os valores da varivel P. Esta relao define uma funo.
Os valores de xi (i= 1, 2, 3, ..., n) formam o domnio da funo e os valores pi (i= 1, 2, 3, ...,
n) o seu conjunto imagem.
denominada funo de probabilidade, sendo:
f(x)= P(X = xi)
A funo de P(X = xi) determina a distribuio de probabilidade da varivel aleatria X.
Lanamento de 2 moedas, sendo cara o objetivo.
Nmero de caras (X)

P(X = x)

1/4

2/4

1/4
= 1

a) Representao grfica de uma distribuio de probabilidade


H vrias representaes grficas para uma distribuio de probabilidade, como histograma,
o polgono de freqncia, etc.
Para a tabela das multas de carro j que os valores possveis da soma de X, com suas
probabilidades associadas f(x) = P(X = x) so:
x

f(x)

0,10

0,20

0,40

0,20

0,10

0,45
f(x)
0,4
0,35
0,3
0,25
0,2
0,15
0,1
0,05
0
0

72

Exemplo 1: P(x) = x/5 (onde x toma os valores 0, 1, 2, 3) define uma funo de


probabilidade?
Para que seja definida uma distribuio de probabilidade deve satisfazer as condies
anteriores.
P(x) = P(0) + P(1) + P(2) + P(3)
= 0/5 + 1/5 + 2/5 + 3/5 = 6/5, logo P(x) 1
Como no satisfaz a primeira condio no uma distribuio de probabilidade.
Exemplo 2: P(x) = x/3 (onde x pode ser 0, 1 ou 2) define uma funo de probabilidade?
P(x) = 0/3 + 1/3 + 2/3 = 3/3 = 1
As duas condies so satisfeitas, pois P(x) = 1 e os valores de P(x) esto entre 0 e 1.

12.3.3 Probabilidade pela distribuio de Bernoulli ou binomial


Existem apenas duas situaes: A ocorre ou A no ocorre, pode-se determinar a
probabilidade de A no ocorrer como sendo q = 1 - p. Em certas situaes a probabilidade p
denominada de probabilidade de sucesso e a probabilidade q de probabilidade de fracasso.
Observao:
a) As probabilidades permanecem constantes durante todo experimento
b) As provas so independente uma das outras, ou seja, a ocorrncia de sucesso ou falha
no modifica a probabilidade futura.
A probabilidade dada por:
n
x

P(X= x)= px . qn-x


na qual:
P(X= x)= a probabilidades que evento se realize x vezes em n provas
p= probabilidade que o evento obtenha sucesso
q= probabilidade de insucesso
n= nmero de opes
x= nmero desejado de ocorrncias
n!
n
. ( uma combinao)
o coeficiente binomial de n sobre x, igual a
x ! (n x )!
x

Exemplo 1: Determinar a probabilidade de se obter um nico 2 em trs jogadas um dado.


3
1

P(X= 1)= (1/6)1 . (5/6)3-1

73

3!
1
3-1
(1/6) . (5/6)
1!
(3
1)!

P(X= 1)=

P(X= 1)= 0,3472 ou 34,72%


Exemplo 2:
Considerando X como sendo a VAD igual a nmero de vezes que ocorre face cara em 5
lanamentos de uma moeda equilibrada, determinar a probabilidade de ocorrer:
(a) Duas caras
(b) Quatro caras
(c) No mximo duas caras
2

a)

5 1 1
P(X = 2) =
2 2 2

5 2

5! 1 1

P(X = 2) =
2!(5 - 2)! 2 2
4

b)

5 1 1
P(X = 4) =
4 2 2

5 2

5 4

5! 1 1

P(X = 4) =
4!(5 - 4)! 2 2
0

5 1 1
P(X = 0) =
0 2 2
1

c)

= 0,3125 ou 31,25%

5 1 1
P(X = 1) =
1 2 2
P(X = 2) = 31,25%

5 0

51

5 4

= 0,1563 ou 15,63%

5! 1 1

=
0!(5 - 0)! 2 2
1

5! 1 1

=
1!(5 - 1)! 2 2

5 0

= 0,0313 ou 3,13%

51

= 0,1563 ou 15,63%

P(X 2) = P(X = 0) + P(X = 1) + P(X = 2) = 50,00%

12.3.4 Probabilidade pela distribuio hipergeomtrica


O modelo hipergeomtrico trata da retirada sem reposio, enquanto que a distribuio de
Bernoulli (binomial) as retiradas so com reposio.
Considere-se um conjunto de N elementos, r dos quais tem uma determinada caracterstica (r
N) e N -r no tenham esta caracterstica. Extra-se n elementos (n N) sem reposio. Seja X a
varivel aleatria igual ao nmero de elementos que possuem a caracterstica entre os n retirados. X
denominada de varivel aleatria hipergeomtrica.
k N k
.

x n x

P(X = x)=
N

n

Onde:
x: nmero desejado
n: tamanho amostra

74

N: populao
k: considerado sucesso
N-k: insucesso
Onde resolvido atravs da combinao simples:
C n, x=

n!
x ! (n x )! ou

n!
n
igual a
x ! (n x )!
x

Exemplo1: Lotes com 40 peas so considerados aceitveis se contm, no mximo, trs peas
defeituosas. O processo de amostragem consiste em extrair aleatoriamente 5 peas de cada lote e
rejeit-lo se for obtida pelo menos uma pea defeituosa das cinco extradas. Qual a probabilidade de
se encontrar uma pea defeituosa, sabendo-se que h trs peas defeituosas em todo lote?
Soluo: N= 40
P(X = 1)=

n= 5

k= 3

x=1

3 40 3 3 37
.
.
1 5 1 1 4
=
=
40
40

5
5

3! 37!

. 66045 )
P(X = 1)= 1!.2! 4!.33! = (3)(
= 0,3011 ou 30,11%
(658008)
40!

5!.35!

Exemplo 2: Uma caixa contm 12 lmpadas das quais 5 esto queimadas. So escolhidas 6
lmpadas ao acaso. Qual a probabilidade de que:
(a) Exatamente duas estejam queimadas?
(b) Pelo menos uma esteja boa?
(c) Pelo menos duas estejam queimadas?
(d) O nmero esperado de lmpadas queimadas?
a) N= 12

n= 6

k=5

x=2

5!
7!
5 12 5

.

P(X = 2)= 2 6 - 2 2!(5 2)! 4!(7 4)! 10 35
=
=
= 0,3788 ou 37,88%
12!
924
12

6!(12 6)!
6

b) N= 12

n= 6

k=5

x=1

Se forem retiradas 6 lmpadas e somente 5 esto queimadas, ento necessariamente uma


ser boa, portanto:
P(pelo menos uma boa)= 100%, ou seja:
P(X5)= P(X=0) + P(X=1) + P(X=2) + P(X=3) + P(X=4) + (P(X=5)

75

P(X5)= 0,76% + 11,36% +37,88% + 37,88% 11,36%+ 0,76= 100%

c) P(X2)= P(X=0) + P(X=1) + P(X=2)


P(X2)= 0,76% + 11,36% +37,88%= 50%
d) E(X) = (rn) / N = 5.6 / 12 = 30/12 = 5/2 = 2,50
12.3.5 Probabilidade pela distribuio de Poisson
Em estudos de fenmenos de ocorrncias raras.
A distribuio de Poisson adequada para descrever situaes onde existe uma probabilidade
de ocorrncia em um campo ou intervalo contnuo, geralmente tempo ou rea
Por exemplo, o nmero acidentes por ms, nmero defeitos por metro quadrado, nmero
clientes atendidos por hora.
Nota-se que a varivel aleatria discreta (nmero de ocorrncia), no entanto a unidade de
medida contnua (tempo, rea).
# Condies de aplicao:
(i) Eventos definidos em intervalos no sobrepostos so independentes;
(ii) Em intervalos de mesmo comprimento, so iguais as probabilidades de ocorrncia de um
mesmo nmero de sucessos;
(iii) Em intervalos muito pequenos, a probabilidade de mais de um sucesso desprezvel;
(iv) Em intervalos muito pequenos, a probabilidade de um sucesso proporcional ao
comprimento do intervalo.
# A funo de probabilidade dada por:
P(X = x) =

e - . x
, x= 0, 1, 2, ...
x!

em que a taxa de ocorrncia, que np.


Exemplo:

76

Em certo tipo de fabricao de fita magntica, ocorrem defeitos a uma taxa de 1 a cada 2000
metros. Qual a probabilidade de que um rolo com 2000 metros de fita magntica:
(a) No tenha defeitos?
(b) Tenha no mximo dois defeitos?
(c) Tenha pelo menos dois defeitos?
Soluo:
Neste caso, tem-se:
= Taxa de defeitos a cada 2000 metros
X= nmero de defeitos a cada dois mil metros
x= 0, 1,2, 3, ...
e - 1.10
= 0,3679 ou 36,79%
0!

a)

P(X = 0) =

b)

P(X 2) =

c)

e - 1.10 e - 1.11
= 1 (0,3679 2) = 0,2642 ou 26,42%
P(X 2) =1 P(X 1) = 1
+
0!
1!

e - 1.10 e - 1.11 e - 1.12


+
+
= 0,3679 + 0,3679 + 0,1839 = 0,9197 ou 91,97%
0!
1!
2!

12.3.6 Probabilidade geomtrica


A distribuio geomtrica a menos usada dentre as distribuies. Ela est relacionada ao
nmero de tentativas de um processo de Bernoulli, antes do primeiro sucesso ser obtido. Em
problemas de confiabilidade, este fato passa a ser algo importante, que deve ser considerado. Por
exemplo: a clula de potncia de um satlite pode durar indefinidamente at que haja uma coliso
com um micro meteoro. Cada dia considerado como uma tentativa no processo de Bernoulli.
A expresso matemtica para esta distribuio dada abaixo:
para x=1,2,3,...

P(X = x) = q

x1

xp

Sendo X o nmero de tentativas no processo de Bernoulli at que o primeiro sucesso seja


atingido e p a probabilidade de sucesso.
Exemplo 1: Cada dia h uma probabilidade de p=0,01 que um satlite seja danificado em
uma coliso. A probabilidade de sobrevivncia diria conseqentemente igual a 1-p=0,99. Calcule
a probabilidade de que o satlite seja danificado exatamente no vigsimo e centsimo dias de
operao.

77

Exemplo: Numa seqncia de lanamentos de uma moeda honesta ao ar, em que cada
lanamento pode dar Cara ou Coroa, pretende-se estimar a probabilidade que a primeira cara se
obtenha no 5 lanamento.

12.4 VARIVEIS ALEATRIAS CONTNUAS

12.4.1 Probabilidade pela distribuio normal ou de Gauss


a mais importante das distribuies contnuas de probabilidade.
A curva obtida praticamente simtrica, denominada curva normal, pois primeiramente se
suspeitava que todos os fenmenos normais apresentavam distribuio deste tipo.
Todas as curvas normais representativas de distribuies de freqncias podem ser
transformadas em uma curva normal padro.
A distribuio normal tem sua funo de probabilidade dada por:
f(x) =

1 x 2


, onde x IR
exp

Em que:
= mdia aritmtica da populao
= desvio padro populacional
exp= constante 2,718
f=(x)f
=(x)

+
+

x
x

Figura 10.1- Curva normal.


a) Varivel normal padronizada (distribuio Z)
Para facilitar a determinao da probabilidade foram criados valores em tabelas para as
probabilidades da varivel aleatria normal.

78

Mas, necessria a transformao da v.a. X na v.a. Z.


Os valores de z permitem delimitar a rea sob a curva.
Logo para transformar X e Z temos:

Z=

x
, varivel normal padronizada.

Onde a sua mdia 0 (zero), e seu desvio padro 1.


Exemplo do uso da tabela Z:
Qual a rea sob a curva normal contida entre z = 0 e z = 1?
Procura-se o valor 1 na primeira coluna da tabela e o valor da coluna 0,00. O valor da
interseco de 0,3413, ou seja 34,13%.
Entretanto, lembrando que a curva normal simtrica, sabe-se que a rea sob a curva
normal contida entre z = 0 e z = -1 tambm 34,13%.
Portanto, a rea referente a -1 < z < 1 vale 68,26%.

Figura 10.2- Demonstrao da probabilidade sob a rea da curva.


b) Caractersticas da distribuio normal
1- A mdia da distribuio normal .
2- O desvio padro .
3- A moda ocorre em x= .
4- A curva normal simtrica em relao a , com probabilidade igual de ocorrer valores
maiores e menores que as mdias.
5- A curva tem inflexes nos pontos x= .
6- A curva normal assntota (aproxima-se do eixo sem alcan-lo).
7- A rea total sob a curva normal e acima do eixo horizontal igual a 1.
8- A rea sob a curva normal contida entre .......... igual a:
P(x)= 1 68,26%
P(x)= 2 95,44%
P(x)= 3 99,74%
Logo a probabilidade de X :
P(x)= z

79

Exemplos do uso de z:
1. Uma fbrica de tratores tem em seus dados estatsticos que a vida mdia til de sua mquina de
15 anos, apresentado distribuio normal, com desvio padro de 2,8 anos, qual o intervalo de vida
til de 95% dos tratores?
P (95%) P (0,95/2) P (0,475)
Logo P (0,95)= z
Ento valor Z= 1,96
P(0,95)= 1,96
P(0,95)= 15 1,96 x 2,8
P(0,95)= 15 5,488
Portanto:
P(maior durabilidade)= 20,488 anos
P(menor durabilidade)= 9,512
Concluso: Espera-se que 95% dos tratores tero sua vida til entre 9,512 e 20,488 anos. Ser
pouco provvel encontrar um trator que dure menos (P = 2,5%) ou que dure mais (P = 2,5%).
2. Qual a probabilidade de se encontrar trator com vida til entre 13 e 16 anos?
Calculam-se dois valores de z:
Agora quero a Probabilidade, logo preciso determinar o valor de Z para os 2 valores.

Z=

Assim temos:
zmenor= 13 15 = -0,71
2,8
zmaior= 16 15 = 0,36
2,8
Na tabela temos:
A rea entre z = 0 e z = -0,71 0,26115 ou 26,115%
A rea entre z = 0 e z = 0,36 = 0,14058 ou 14,058%
Portanto, a probabilidade de se encontrar trator com vida til entre 13 e 16 anos :
P(13<x<16)= 26,115 + 14,058 = 40,17%
3. Qual a probabilidade de se encontrar um trator que tenha vida til superior a 25 anos?
Novamente a probabilidade.
zmaior =

25 15 = 3,57
2,8

Na tabela temos:

80

A rea entre z = 0 e z = 3,57 0,49992 ou 49,992%.


Portanto, a probabilidade do trator durar mais de 25 anos :
P(x>25)= 50 - 49,992 = 0,008%

81

13 INTERVALO DE CONFIANA

13.1 PARA MDIA, QUANDO A VARINCIA CONHECIDA


Definimos como Nvel de confiana (1 - ) a probabilidade de que o intervalo construdo contenha o
verdadeiro valor da mdia populacional que est sendo estimada.

Pode ser utilizada, nesse caso, a tabela Z sempre que tivermos uma das seguintes situaes:
1 - se n 30, considerada suficientemente grande, pode-se adotar o desvio padro S
2 - se n < 30, sendo a populao estudada normalmente distribuda e o desvio padro
populacional conhecido.
Ento:
Se x for a mdia observada duma amostra aleatria de dimenso n duma populao normal (ou
duma populao qualquer desde que n suficientemente grande, mas nesse caso o intervalo
apenas aproximado) com varincia conhecida S2, um intervalo de confiana a 100 x (1-)% para
dado por:

E=Z

Onde: E o erro, conforme o estabelecido.


Logo:
__

ICinferior ( ) = X E
__

ICinferior ( ) = X + E
Temos o IC inferior e o IC superior

Quadro 1- Valores de Z para diferentes intervalos confiana.

82

Exemplo:
Determinada empresa que trabalha com erva mate tm em seus registros as seguintes informaes
estatsticas sobre o empacotamento, que aps pesar 100 pacotes, obtiveram como mdia de peso
de cada pacote 1005 g com desvio padro amostral de 45 g. Considerando que a distribuio dos
pesos seja considerada normal, determine qual o Erro e os IC inferior e superior para 95% dos
pacotes produzidos pela ervateira.

E = 1,96

45

= 8,82 g

100

ICinferior(95) = 1005 8,82 = 996,2 g

ICsuperior(95) = 1005 + 8,82 = 1013,8 g


Concluso: Espera-se que 95% dos pacotes de erva mate apresentem peso entre 996,2 e 1013, 8 g

13.2 PARA MDIA, QUANDO VARINCIA POPULACIONAL NO CONHECIDA


Quando o desvio padro da populao no for conhecido, a estimativa da mdia da populao
dever ser realizada com a distribuio t (student), pois com a distribuio Z se obtm um resultado
aproximado para n>30.

E=t

S
n

Onde: E o erro, conforme o estabelecido.


S desvio padro da amostra
Logo:
__

ICinferior ( ) = X E
__

ICinferior ( ) = X + E

Pode-se usar o valor exato da Tabela t (usar GL), ou conforme Quadro abaixo:

Exemplo:
Determinada empresa que trabalha com erva mate tm em seus registros as seguintes informaes
estatsticas sobre o empacotamento, que aps pesar 10 amostras, obtiveram como mdia de peso
de cada pacote 1015 g com desvio padro 65 g. Considerando que a distribuio dos pesos seja

83

considerada normal, determine qual o Erro e os IC inferior e superior para 99% dos pacotes
produzidos pela ervateira.

E = 2,75

65
10

= 56,5 g

ICinferior(95) = 1015 56,5 = 958,5 g


ICsuperior(95) = 1015 + 56,5 = 1071,5 g
Concluso: Espera-se que 99% dos pacotes de erva mate apresentem peso entre 958,5g e 1071,5g.

14 INFERNCIA ESTATSTICA E TESTE DE HIPTESES

14.1 INFERNCIA ESTATSTICA


Latim: Inferentia - Ato de inferir (tirar por concluso).
Casos especiais:
Inferncia Dedutiva (certa).
Inferncia Indutiva (incerta, h um nvel de probabilidade envolvido).
Exemplos:
Dedutiva: Premissa principal - um dos ngulos de um tringulo retngulo tem sempre 90.
Premissa secundria - T um tringulo retngulo.
Concluso: T tem um ngulo de 90 (particular para o geral).
Indutiva: 107 sementes so plantadas, deseja-se saber quantas daro flores brancas e quantas
vermelhas. H um nvel de probabilidade envolvido para cada flor (cor) (geral para o particular).
Usualmente, impraticvel observar toda uma populao, seja pelo custo alto seja por
dificuldades operacionais. Examina-se ento uma amostra, de preferncia bastante representativa,
para que os resultados obtidos possam ser generalizados para toda a populao.
O que desejamos saber se os resultados obtidos podem ser extrapolados para toda a
populao, pois se a informao s serve para o grupo amostrado, qual o significado da pesquisa.
Mas, podemos considerar este resultado para toda a populao?
preciso beber todo o vinho de uma garrafa para se saber se o mesmo bom?
O que desejamos poder inferir os resultados.
Logo, inferncia estender a informao obtida da parte estudada para toda a populao.
Entretanto, a inferncia deve ser feita com certa confiabilidade, utilizando-se para tal um teste
estatstico.
At agora preparamos o caminho para poder entrar nos problemas da inferncia estatstica.
Vimos as diversas tcnicas da anlise exploratria de dados, as tcnicas de amostragem e a teoria
de probabilidades, cada uma dessas reas constitui o trip da inferncia estatstica (Figuras 1 e 2).

Figura 1- Esquema geral do processo estatstico.

Figura 2- Esquema do processo de inferncia estatstica.

A inferncia estatstica se divide em duas grandes reas:


Pontual
Estimao
Inferncia
Estatstica

Por intervalo
Teste de Hipteses

Pegamos por exemplo a nota dos alunos de uma Universidade. O mais provvel de
acontecer, dado que a maioria dos alunos est perto da mdia, que a mdia amostral, tambm,
fique prxima da verdadeira mdia. Podemos calcular todas essas probabilidades, uma vez que
podemos aproximar a distribuio da mdia amostral para a distribuio normal.

14.1.1 Populao e amostra


a) Populao objetivo ou alvo: a totalidade de elementos que esto sob discusso e das quais se
deseja informao.
b) Amostra: conjunto representativo da populao.
14.1.2 Tipos de amostragem
Existem tcnicas que garantem, tanto quanto possvel, o acaso na escolha
Dessa forma, cada elemento deve ter a mesma chance de ser escolhido
Vantagens: Menor custo
Menor tempo
Material destrutivo
a) Amostragem casual ou aleatria simples
equivalente ao sorteio
Ex: alunos numerados de 1 a 20

b) Amostragem proporcional estratificada


Quando a populao se divide em extratos
Ex: alunos do sexo masculino e feminino
c) Amostragem sistemtica
Quando os elementos da populao j esto ordenados
Ex: Propriedades rurais em determinada estrada, prdios de certa rua, etc
Neste caso a amostra pode ser obtida por um sistema imposto pelo pesquisador

14.2 TESTE SIGNIFICNCIA OU DE HIPTESES


Os testes de significncia (tambm conhecidos como testes de hipteses) correspondem a
uma regra decisria que nos permite rejeitar ou no rejeitar uma hiptese estatstica com base nos
resultados de uma amostra.
Hiptese uma suposio quanto ao valor de um parmetro populacional, ou uma afirmao
quanto natureza da populao.
No basta saber que a mdia dos alunos amostrados do diurno apresenta valores superiores
aos do noturno, necessrio saber que todos os alunos (populao), sob iguais condies, tero
esta diferena de desempenho.

Os testes estatsticos fornecem condies para o pesquisador fazer a inferncia com


determinada confiabilidade.
Com os testes estatsticos possvel estabelecer o nvel de significncia, que fornece a idia
de que muito provvel que um resultado, similar ao obtido na amostra, ocorra com toda a
populao.
Logo teremos duas hipteses:
H0: Hiptese de nulidade, onde se considera que as mdias so iguais
HA ou H1: Hiptese alternativa, onde considera que as mdias so diferentes
Assim teremos dois tipos de erros:
Erro tipo I rejeitar H0 quando ela verdadeira
Erro tipo II aceitar H0 quando h diferenas entre tratamentos (falsa)
A probabilidade do erro tipo I denotada por e do erro tipo II por .
Ento se estabelece o nvel de significncia para , normalmente menor e igual a 5%
(P0,05).
Deciso sobre o nvel de significncia:
valor cal valor tab = rejeita-se H0
valor cal < valor tab = aceita-se H0
ou
teste cal < teste tab 0,05 = NS
teste 0,05 < teste cal < teste 0,01 = significativo
teste 0,01 < teste cal < teste 0,001 = muito significativo
teste cal > teste 0,001 = altamente significativo
- Etapas para os testes de hipteses:
a) Enunciar as hipteses (H0 e HA);
b) Fixar o nvel de significncia e identificar a estatstica do teste;
c) Determinar a regio crtica (faixa de valores que nos levam rejeio da hiptese H0) e a regio
de aceitao em funo do nvel pelas tabelas estatsticas apropriadas;
d) Baseado na amostra, calcular o valor da estatstica do teste
e) Concluir: Se estatstica do teste pertence regio crtica rejeita-se H0, caso contrrio aceita-se.
Veremos os seguintes testes:
a) Teste z
b) Teste t
c) Teste de Qui-quadrado (teste 2)

d) Teste F
14.2.1 Teste Z para avaliao de uma mdia populacional
Para tal procedimento utilizado o teste Z. Para este teste de hipteses devemos conhecer a
varincia populacional. Esta tabela pode ser unilateral ou bilateral.
_

A estatstica do teste baseada na mdia amostral ( x ). Pode ser demonstrado que a mdia
amostral tem distribuio aproximadamente normal com mdia e varincia 2/2, onde n o
tamanho da amostra.
A estatstica do teste z para 1 mdia :
_

cal

Deciso sobre o nvel de significncia de Z:


Z cal Z tab = rejeita-se H0
Z cal < Z tab = aceita-se H0

Exemplo:
Uma mquina automtica de encher pacotes de caf enche-os segundo uma distribuio normal,
com mdia e varincia 400 g. O valor de pode ser fixado num mostrador situado numa posio
um pouco inacessvel dessa mquina. A mquina foi regulada para = 500 g. Desejamos, de meia
em meia hora, colher uma amostra de 16 pacotes e verificar se a produo est sob controle, isto ,
_

se = 500 g ou no. Se uma dessas amostras apresentasse uma mdia x = 492 g, voc pararia ou
no a produo para verificar se o mostrador est na posio correta? Usar = 1%.

cal

492 500
= 1,60
20
16

Z (0,01)= -2,33
Concluso: Aceito a hiptese H0, portanto no pararia a produo para verificar a posio do
mostrador, com P0,01.

14.2.2 Teste t para avaliao de uma ou duas mdias


utilizado quando a varincia populacional desconhecida, devendo-se calcular a varincia
da amostra. Pode ser empregado para amostras pequenas.
a) Para avaliao de uma mdia
A estatstica do teste t para uma mdia :
_

x
t cal = s
n
Deciso sobre o nvel de significncia de Z:
t cal t tab = rejeita-se H0
t cal < t tab = aceita-se H0
Determinada firma desejava comprar cabos tendo recebido do fabricante a informao de que a
tenso mdia de ruptura 8000 kgf. Para analisar se a afirmao do fabricante verdadeira,
efetuou-se um teste de hiptese unilateral. Se um ensaio com 6 cabos forneceu uma tenso mdia
de ruptura de 7750 kgf, com desvio padro de 145 kgf, a qual concluso chegar, usando um nvel de
significncia de 5%?

cal

7750 8000
= 4,22
145
6

Agora precisamos obter o valor tabelado (t), para = 0,05 e GL 5, onde encontramos:
t tab (5; 0,05)= 2,571
Concluso: Aceita-se H0, os cabos apresentam tenso mdia de 8000 kgf, P0,05.
b) Para comparao de duas mdias
Primeiramente devemos realizar a anlise descritiva para comparar as duas mdias.
b.1) Anlise descritiva
Considere que se deseje comparar o desempenho de 2 turmas de alunos, uma diurna e outra
noturna, avaliando 11 alunos ao acaso em cada turma. Sabe-se que ambas as aulas so ministradas
pelo mesmo educador, sendo a mesma disciplina e utilizando o mesmo mtodo de ensino. As notas
obtidas esto na Tabela 1.

Tabela 1- Notas obtidas por duas turmas de alunos, uma noturna e outra diurna, submetidas aulas com o
mesmo educador e utilizando o mesmo mtodo

Turma diurna (TD)


9,5
8,1
4,8
7,4
6,4
7,0
6,1
8,4
6,8
9,3
7,5

Turma noturna (TN)


5,4
8,7
6,6
8,0
5,4
3,7
6,2
7,5
6,7
5,7
7,0

Observando os valores, pode-se verificar que as notas obtidas pela turma diurna so
superiores as obtidas pela turma noturna.
Para facilitar a observao, podemos calcular a mdia, onde temos:
- Mdia turma diurna:
__

X (TD) =
__

X (TD) =

Xn
n

9,5 + 8,1 + ... + 7,5


= 7,39
11

- Mdia turma noturna:


__

X (TN) =
__

X (TN) =

Xn
n

5,4 + 8,7 + ... + 7,0


= 6,45
11

Com as mdias calculadas pode-se supor que o desempenho de notas da turma diurna foi
superior.
Mas, apenas com a mdia no temos uma resposta confivel, pois depende da variabilidade
da amostra coletada.
Logo podemos determinar a varincia, o desvio e a varincia da mdia.
a) Varincia da amostra:
2
n
n

Xi
Xi

x n
S 2 = i = 1
i = 1 n 1
n
n

# Para turma diurna


620,37 81,3 2 11

S 2 (TD ) =

x
11
11

10

S2(TD) = 1,95
# Para turma diurna
476,33 70,9 2 11

S2 (TN ) =

x
11
11 10

S2(TN ) = 1,93
b) Desvio padro ou erro padro da amostra:

S = S2
# Para turma diurna

S (TD ) = 1,95
S (TD)= 1,40
# Para turma noturna

S (TN ) = 1,93
S (TN)= 1,39
c) Varincia da mdia:
S2 Y =

S2
n

# Para turma diurna


S 2 Y (TD) =

1,95
11

S2Y (TD) = 0,1773

# Para turma noturna

S2 Y (TN) =

1,93
11

S2 Y (TN) = 0,1755

10

d) Desvio padro ou erro padro da mdia:

S =
Y

S2
n

# Para turma diurna

1,95
11

S =
Y

S = 0,4210
Y

# Para turma noturna


S =
Y

1,93
11

S = 0,4189
Y

Logo podemos construir uma tabela para facilitar a compreenso dos resultados:
Tabela 2- Mdias e erros padres das mdias das notas obtidas pelos alunos diurnos e noturnos

Perodo

Estatstica
Mdia
Erro padro da mdia

Diurno

Noturno

7,39

6,45

0,4210

0,4189

A mdia e o erro padro da mdia so estatsticas descritivas, pois descrevem a amostra.


Observando-se os valores, pode-se verificar que a nota obtida pelos alunos diurnos foi melhor
que a obtida pelo noturno.
Entretanto, ser que esta resposta pode ser inferida para toda a populao de alunos, que
esto sobre as mesmas condies.
b.2) Teste t propriamente dito
o teste mais usado para comparao de duas mdias.
Para calcular o valor de t precisamos:
a) Estipular o valor de
b) Obter a mdia de cada grupo
c) Determinar a varincia de cada grupo
d) Calcular a varincia ponderada, dada pela frmula:
S2

pond

(n1 1)S12 + (n 2 1)S22


=
(n1 1) + (n 2 1)

e) Assim, obtemos o valor de t calculado:

11

X X2
1
1
1 2
+

n n SPond
2
1

t=

Dando continuidade ao exemplo da Tabela 1, das notas obtidas por duas turmas de alunos, teremos:

a) = 5% ou 0,05
__

__

b) X (TD) = 7,39
c) S2(TD) = 1,95

X (TN) = 6,45

S2(TN ) = 1,93

(11 1)1,95 + (11 1)1,93 =1,94


d) S2 pond =
(11 1) + (11 1)
e) t =

7,39 6,45
1 1
+ 1,94
11 11

=1,583

Agora precisamos obter o valor tabelado (t), para = 0,05 e GL 20, onde encontramos o valor
de t= 2,086
t cal= 1,583
t (0,05; 20)= 2,086
Concluso: Conforme resultado do teste t (P0,05), deve-se aceitar a hiptese H0. Logo pode
concluir que a diferena das notas obtidas entre os dois grupos de alunos no pode ser atribuda ao
perodo que estudam.
Observao: Pode-se estar incorrendo para o erro tipo II, ou seja, aceitar a hiptese H0
apesar de haver diferenas reais entre os dois grupos de notas.
14.2.3 Teste Qui-quadrado (2)
O teste de Qui-quadrado faz parte dos chamados testes no paramtricos, ou seja, que no
dependem dos parmetros populacionais, nem de suas respectivas estimativas.
O teste de Qui-quadrado pode ser usado principalmente como:
i) Teste de aderncia
ii) Teste de independncia
iii) Teste de homogeneidade
Veremos, a princpio, apenas o teste de aderncia, sendo os demais testes filosoficamente (e
at mesmo mecanicamente) similares, mas aplicveis quando queremos estudar a relao entre
duas ou mais variveis de classificao.
Teste de Aderncia

12

Existe apenas uma varivel e o que se testa o padro hipottico de freqncias ou a


distribuio da varivel.
A estatstica do teste dada por:
(!" !")!
!"

!
!!"#
=

Onde:
Oi freqncia observada da categoria (evento) i
Ei freqncia esperada da categoria (evento) i
A expresso acima nos d um valor sempre positivo e tanto menor quanto maior for o
acordo entre as freqncias observadas e as freqncias esperadas, calculadas com base em
H 0.
A hiptese H0 afirmar no haver discrepncias entre as freqncias observadas e o as
freqncias esperadas, ou H0 ser colocada em termos de distribuio de probabilidade que vamos
por prova.
!
!
!
!
O valor de !!"#
comparado com !!"#
, sendo se !!"#
!!"!
, rejeita-se H0.
!
Tambm, precisamos obter !!"#
a partir da significncia e dos graus de liberdade v (v= k - 1 -

r, onde k o nmero de categorias em que foi dividida a amostra; e r o nmero de parmetros


estimados para o clculo das Ei.
Exemplo:
Suponhamos que um pesquisador, desejando colocar prova a hiptese de que a idade da
me tem certa influncia sobre o nascimento de criana prematura, verificou que, dentre 90 casos de
prematuridade, 40 envolviam mes com idade inferior a 18 anos; 15 envolviam mes de 18 a 35
anos e 35 mes com idade acima de 35 anos. Isto leva o pesquisador a manter sua hiptese? Use
nvel de significncia de 0,01.
Espera-se 30 casos para cada 1 das trs situaes
40 30
30

!
!!"#
=

15 30
30

(35 30)!
= 11,66
30

!
!!"#
0,01 (0,99); 2 = 9,210

Concluso: Rejeita-se H0, logo pode dizer que a idade da me tem influncia sobre o
nascimento de crianas pr-maturas.
14.2.4 Teste F para comparao de duas varincias
Mesma idia dos testes para mdias, teste z e t, porm usa-se a razo das varincias, e no
a sua diferena, como no caso dos testes para mdias.
A estatstica do teste dada por:
!!"# =

!!!
!!!

Onde: !!! = Varincia da amostra A

13

!!! = Varincia da amostra B


Fcal(gl1; gl2; ), sendo gl1 do numerador e gl2 do denominador
A distribuio F no simtrica e, portanto, no possui a rea da cauda superior, FS, igual a
rea da cauda inferior, FI. Neste caso, a regra de deciso :
Se Fcal > FSc ou Fcal < FIc , para gl1 e gl2, ento rejeita-se H0. Caso contrrio, aceita-se H0.

Na prtica colocamos no numerador a varincia de maior valor e concentramos a deciso na


cauda superior.
Exemplo: Deseja-se comparar a varincia do desempenho de duas equipes de atletismo.
Particularmente, testar se elas so estatisticamente diferentes, assumindo-se de 5%. As varincias
observadas so apresentadas na tabela abaixo:
Varincia
n

!!"# =

Equipe A
0,784
6

Equipe B
1,520
7

!!! 1,520
=
= 1,94
!!! 0,784

Ftab (6; 5; 0,05)= 4,95


Concluso: Aceita-se a hiptese H0, com P0,05, portanto as varincias so consideradas iguais.
14.2.5 Teste t para dados pareados
Dados pareados so aqueles registrados em pares (o indivduo controle de si mesmo).
Por exemplo, um estudo compara o efeito de um colrio oftlmico com o de simplesmente higienizar o
olho. Um grupo de pacientes usa, durante um perodo, a colrio no direito, enquanto o olho esquerdo
recebe apenas o anti-sptico.
a) Hipteses
H 0: D = 0
H A: D 0
Onde D a mdia populacional, sobre a qual desejamos inferir.
b) Estatstica do teste
Como as observaes esto relacionadas, construmos o teste sobre as diferenas observadas
em cada par.
_

D
t=
EPMDD

EPMDD=

SD
n

14

Seja Di a diferena (no mesmo indivduo) entre as observaes registradas, para n pares. A mdia
_

das diferenas de todos os indivduos chamamos D , e o desvio-padro das diferenas de SD.


Exemplo: Um hipntico foi aplicado em um grupo de pacientes que tinham se submetido
anteriormente a um tratamento padro. Foi observado o nmero de horas de sono de cada paciente
nos dois momentos. Deseja-se testar se a diferena mdia observada no nula, considerando-se
um nvel de significncia de 5%.
Paciente
1
2
3
4
5
6
7
8
9

Horas de sono
Droga Trat. Padro
8,6
8,2
8,8
8,3
8,1
7,6
9,8
9,4
9,7
8,9
8,0
7,2
8,4
8,5
9,5
9,3
9,5
9,1

Di
0,4
0,5
0,5
0,4
0,8
0,8
-0,1
0,2
0,4

D = 0,433
SD= 0,27
EPMDD= 0,27 = 0,09
9
t=

0,433
= 4,81
0,09

t(8; 0,05)= 2,306


Concluso: Como fcal > ftab, rejeita-se a hiptese H0, logo h diferenas entre os perodos de sono.
14.2.6 Teste de Hiptese valor-P (p-value)
O p-value definido como a probabilidade de qualquer mdia da amostra ser mais extrema
_

que a mdia da amostra x extrada para o teste, sem rejeitar a hiptese nula.
A partir do exposto e da definio de p-value, temos:
O p-value o nvel de significncia observado.
Se o p-value for maior ou igual a ento a hiptese nula ser aceita.
Se o p-value for menor ou igual a ento a hiptese nula ser rejeitada. Quanto menor for o
p-value, mais forte ser a evidncia para rejeitar a hiptese nula.
A deciso do teste de hipteses ser resultado da comparao do p-value com o nvel de
significncia que o analista julgar mais adequado.

15

REFERNCIAS

BUNCHAFT, Guenia; KELLNER, Sheilah Rubino de Oliveira. Estatstica sem mistrios. 4. ed.
Petrpolis: Vozes, 2002. 227 p.
BUSSAB, Wilton de Oliveira; MORETTIN, Pedro A. Estatstica bsica. 4. ed. So Paulo: Atual, 1999.
321 p.
CALEGARE, lvaro J. A. Introduo ao delineamento de experimentos. So Paulo: Edgard Blcher,
2001. 130p.
CRESPO, Antnio Arnot. Estatstica fcil. 18. ed. So Paulo: Saraiva, 2004. 224 p.
FARIAS, Alfredo Alves de; CSAR, Cibele Comini; SOARES, Jos Francisco. Introduo
estatstica. 2. ed. Rio de Janeiro: LTC, 2003. xiii, 340p.
FONSECA, Jairo Simon da; MARTINS, Gilberto de Andrade. Curso de estatstica. 6. ed. So Paulo:
Atlas, 2006. 320 p.
FREIRE, Clarice Azevedo De Luna. Anlise de modelos de regresso linear com aplicaes.
Campinas, SP: Unicamp, 1999. 356 p.
HINES, William; MONTGOMERY, Douglas C; GOLDSMAN, David M.; BORROR, Connie M.;
FLORES, Vera Regina Lima de Farias e (Trad.). Probabilidade e estatstica na engenharia. Rio de
Janeiro: LTC, 2006. x, 588 p.
LAPPONI, Juan Carlos. Estatstica usando Excel. So Paulo: Lapponi Treinamento e Editora, 2000.
450 p.
MAGALHES, Marcos Nascimento; LIMA, Antonio Carlos de. Noes de probabilidade e estatstica.
6. ed. So Paulo: EDUSP, 2005. xiv, 392 p.
MOORE, David S; FLORES, Vera Regina Lima de Farias e (Colab.). A estatstica bsica e sua
prtica. Rio de Janeiro: LTC, 2000. xv, 482p.
MORETTIN, Luiz Gonzaga. Estatstica bsica. So Paulo: Makron Books do Brasil, 2000. xi, 182 p.
GOMES, Frederico Pimentel. Curso de estatstica experimental. 14. ed. Piracicaba, SP: F. Pimentel
Gomes, EDUSP, 2000. 477 p.
STORCK, Lindolfo (Org.). Experimentao vegetal. 2. ed. Santa Maria: Universidade Federal de
Santa Maria, 2006. 198 p.
TRIOLA, Mario F. Introduo estatstica. 7. ed. Rio de Janeiro: Livros Tcnicos e Cientficos, 1999.
xviii, 410p.
VIEIRA, Sonia. Estatstica experimental. 2. ed. So Paulo: Atlas, 1999. 185 p.

Das könnte Ihnen auch gefallen