You are on page 1of 214

Universidade Estadual de Londrina

Centro de Cincias Exatas


Departamento de Estatstica

Estatstica Aplicada
Veterinria

Prof. Silvano Cesar da Costa

L O N D R I N A
Estado do Paran - Brasil

Sumrio
Pgina

Lista de Tabelas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Lista de Figuras

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

1 Introduo

Aplicaes da Estatstica

1.2

Planejamento de uma pesquisa

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . . . . . . . . . . . . . .

Vantagens da amostragem sobre o censo . . . . . . . . . . . . . . . . . . . .

Amostragem

2.1

Introduo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

2.2

Tcnicas de Amostragem

2.3

1.1

1.2.1

vi

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

10

2.2.1

Amostragem simples ao acaso ou amostragem aleatria simples . . . . . . . .

10

2.2.2

Amostragem sistemtica

. . . . . . . . . . . . . . . . . . . . . . . . . . . .

12

2.2.3

Amostragem estraticada . . . . . . . . . . . . . . . . . . . . . . . . . . . .

13

Etapas de uma pesquisa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

16

3 Conceitos elementares

20

3.1

Diviso da estatstica

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

20

3.2

Tipos de variveis

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

21

3.3

Dimensionamento da amostra . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

23

3.3.1

Determinao do tamanho amostral para variveis qualitativas

. . . . . . . .

24

3.3.2

Determinao do tamanho amostral para variveis quantitativas

. . . . . . .

25

4 Estatstica Descritiva
4.1

4.2

4.3

30

Organizao e apresentao de dados . . . . . . . . . . . . . . . . . . . . . . . . . .

30

4.1.1

Elementos essenciais de uma tabela . . . . . . . . . . . . . . . . . . . . . . .

30

4.1.2

Elementos complementares de uma tabela

. . . . . . . . . . . . . . . . . . .

32

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

33

4.2.1

Construo de uma distribuio de frequncia de variveis discretas . . . . . .

33

4.2.2

Construo de uma distribuio de frequncia para variveis contnuas

. . . .

35

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

40

Distribuio de frequncias

Tabelas de dupla entrada

5 Grcos
5.1

5.2

5.3

42

Apresentao grca de variveis qualitativas . . . . . . . . . . . . . . . . . . . . . .

43

5.1.1

Grco em colunas

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

43

5.1.2

Grco em barras

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

46

5.1.3

Grco em colunas justapostas . . . . . . . . . . . . . . . . . . . . . . . . .

47

5.1.4

Grco em colunas compostas

. . . . . . . . . . . . . . . . . . . . . . . . .

48

5.1.5

Grco em setores circulares

. . . . . . . . . . . . . . . . . . . . . . . . . .

50

5.1.6

Grco em setores retangulares . . . . . . . . . . . . . . . . . . . . . . . . .

52

Apresentao grca de variveis discretas . . . . . . . . . . . . . . . . . . . . . . .

53

5.2.1

Grco em basto . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

53

Apresentao grca de variveis contnuas . . . . . . . . . . . . . . . . . . . . . . .

54

5.3.1

Histograma

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

54

5.3.2

Polgono de frequncias . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

55

5.3.3

Grco de ramo-e-folhas

. . . . . . . . . . . . . . . . . . . . . . . . . . . .

56

Construo de um grco ramo-e-folhas . . . . . . . . . . . . . . .

56

5.3.3.1

5.4

5.3.4

Grco de Caixas (ou Box Plot )

. . . . . . . . . . . . . . . . . . . . . . . .

57

5.3.5

Grco de disperso . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

58

5.3.6

Grco de Setores Proporcionais

. . . . . . . . . . . . . . . . . . . . . . . .

59

5.3.7

Grco de Linhas

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

61

Iluso dos Grcos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

62

6 Medidas de Posio

64

6.1

Mdia Aritmtica Simples . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

64

6.2

Mdia Aritmtica Ponderada

65

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

6.3

Mdia Geomtrica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

67

6.4

Mediana

70

6.5

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

6.4.1

Determinao da mediana de valores no tabulados

. . . . . . . . . . . . . .

70

6.4.2

Mediana de dados agrupados em classes

. . . . . . . . . . . . . . . . . . . .

72

Moda . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

72

6.5.1

. . . . . . . . . . . . . . . . . . . .

73

. . . . . . . . . . . . . . . . . . . . . .

77

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

77

6.7.1

Separatrizes de dados no agrupados . . . . . . . . . . . . . . . . . . . . . .

77

6.7.2

Separatrizes de dados agrupados

. . . . . . . . . . . . . . . . . . . . . . . .

79

6.7.3

Grco de caixa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

82

Moda para dados agrupados em classes

6.6

Utilizao das medidas de tendncia central

6.7

Medidas Separatrizes

6.8

Assimetria e Curtose

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

84

6.8.1

Assimetria . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

84

6.8.2

Curtose

86

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

7 Medidas de disperso ou variabilidade

92

7.1

Amplitude Total . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

92

7.2

Desvio Absoluto Mdio

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

93

7.3

Varincia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

95

7.3.1

Varincia de Dados Brutos Populacionais . . . . . . . . . . . . . . . . . . . .

95

7.3.2

Varincia de Dados Brutos Amostrais . . . . . . . . . . . . . . . . . . . . . .

95

7.3.3

Varincia de Dados Agrupados

. . . . . . . . . . . . . . . . . . . . . . . . .

97

7.3.4

Propriedades da varincia . . . . . . . . . . . . . . . . . . . . . . . . . . . .

98

7.4

Desvio Padro . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

100

7.5

Coeciente de Variao

100

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

8 Anlise Combinatria

107

8.1

Fatoriais

8.2

Princpio Fundamental da Contagem

. . . . . . . . . . . . . . . . . . . . . . . . . .

108

8.3

Permutaes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

110

8.3.1

. . . . . . . . . . . . . . . . . . . . . . . . . .

111

Arranjos e Combinaes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

114

8.4.1

114

8.4

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

Quantidade de Permutaes

Combinaes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

107

8.4.2

Arranjos

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

115

8.5

Quantidade de Arranjos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

117

8.6

Quantidade de Combinaes

118

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

9 Noes sobre a teoria das probabilidades


9.1

9.2

Conceitos Bsicos em Probabilidade

. . . . . . . . . . . . . . . . . . . . . . . . . .

121

9.1.1

Experimento Aleatrio . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

121

9.1.2

Espao Amostral . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

122

9.1.3

Evento . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

122

Conceito de Probabilidade . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

123

9.2.1

. . . . . . . . . . . . . . . . . . . . . . . . . .

123

. . . . . . . . . . . . . . . . . . . . . . . . . . . . .

126

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

126

Operaes com Eventos . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

126

9.4.1.1

Unio de Eventos: . . . . . . . . . . . . . . . . . . . . . . . . . . .

126

9.4.1.2

Interseo de Eventos:

. . . . . . . . . . . . . . . . . . . . . . . .

127

9.4.1.3

Sub-Conjuntos:

. . . . . . . . . . . . . . . . . . . . . . . . . . . .

127

9.4.1.4

Eventos Disjuntos:

. . . . . . . . . . . . . . . . . . . . . . . . . .

127

9.4.1.5

Complemento: . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

128

Conceito Clssico ou a priori

9.3

Propriedades da Probabilidade

9.4

Diagramas de Venn
9.4.1

9.4.2
9.5

121

Regras de Clculo de Probabilidades

. . . . . . . . . . . . . . . . . . . . . .

128

Probabilidade Condicional . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

131

9.5.1

Probabilidade Condicional no Diagrama de Venn . . . . . . . . . . . . . . . .

132

9.5.2

Aplicao da Probabilidade Condicional

. . . . . . . . . . . . . . . . . . . .

133

9.5.3

Valor das Predies

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

136

9.5.4

Probabilidade da Interseco de Dois Eventos

9.5.5

. . . . . . . . . . . . . . . . .

137

Amostragem Sem Reposio

. . . . . . . . . . . . . . . . . . . . . . . . . .

138

9.5.6

Amostragem com Reposio

. . . . . . . . . . . . . . . . . . . . . . . . . .

139

9.5.7

Teorema de Bayes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

141

10 Variveis aleatrias discretas


10.1 Conceitos Iniciais

146

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

10.2 Varivel Aleatria Discreta

146

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

148

10.2.1 Distribuio de uma Varivel Aleatria . . . . . . . . . . . . . . . . . . . . .

148

10.2.2 Funo de Probabilidade

. . . . . . . . . . . . . . . . . . . . . . . . . . . .

149

10.2.3 Valor mdio ou Esperana Matemtica de Y . . . . . . . . . . . . . . . . . .

150

10.2.4 Varincia de Y . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

151

10.2.5 Distribuio acumulada de uma varivel aleatria

. . . . . . . . . . . . . . .

152

. . . . . . . . . . . . . . . . . . . . . . .

154

. . . . . . . . . . . . . . . . . . . . . . . . . . . .

154

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

156

10.3 Principais Distribuies de Probabilidades


10.3.1 Distribuio de Bernoulli
10.3.2 Distribuio Binomial

10.3.3 Distribuio de Poisson

. . . . . . . . . . . . . . . . . . . . . . . . . . . . .

160

10.3.4 Aproximao da Distribuio Binomial pela Distribuio de Poisson . . . . . .

164

10.3.5 Distribuio Geomtrica . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

165

11 Variveis aleatrias contnuas

172

11.1 Distribuio Normal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

175

11.1.1 Introduo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

175

11.1.2 Propriedades da Distribuio Normal . . . . . . . . . . . . . . . . . . . . . .

176

11.2 Distribuio Normal Padro . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

178

11.3 Uso da Tabela da Distribuio Normal Padro . . . . . . . . . . . . . . . . . . . . .

180

12 Introduo inferncia estatstica

191

12.1 Distribuio Amostral da Mdia . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

192

12.2

198

Distribuio Amostral da Proporo

. . . . . . . . . . . . . . . . . . . . . . . . . .

Lista de Tabelas
Pgina

mg/100 ml.

Tabela 1.1 -

cido arcrbico, em

. . . . . . . . . . . . . . . . . . . . . . . .

Tabela 2.1 -

Dados sobre tilpias do Nilo, coletados por alunos do curso de Medicina Veterinria da Universidade Estadual de Londrina, no ano de 2005.

Tabela 2.2 -

Diagnsticos de radiograas de trax

Tabela 3.1 -

Dados dos alunos do

1o

. . . . . . . .

11

. . . . . . . . . . . . . . . . . . . . . .

16

ano do curso de Medicina Veterinria, da Universidade

Estadual de Londrina, do ano de 2005.


Tabela 3.2 -

. . . . . . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

Tabela 3.3 -

Tamanho amostral e erro de preciso.

Tabela 4.1 -

Animais atendidos no Hospital Veterinrio (HV) da Universidade Estadual de


Londrina (UEL), no ano de 2005.

. . . . . . . . . . . . . . . . . . . . .

28

31

32

Nmero de lhotes de cadelas submetidas a inseminao articial no Hospital


. . . . . . . . . . . . . . . . . . . . . . . . . .

34

Frequncias dos intervalos entre cios observados em um rebanho leiteiro da raa


Holands, segundo a classicao de Gaines (1994).

Tabela 4.5 -

27

Espcies de animais atendidos no Hospital Veterinrio da Universidade Estadual

Veterinrio da UEL em 2005.


Tabela 4.4 -

. . . . . . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . . . . . . . . .

de Londrina. Londrina - Paran, 2002.


Tabela 4.3 -

21

Dados parciais coletados no Hospital Veterinria da Universidade Estadual de


Londrina, ano 2013.

Tabela 4.2 -

Distribuio de frequncia dos pesos

(kg)

. . . . . . . . . . . . . .

36

de 30 ces das raas Fila Brasileiro e

Pastor Alemo, coletados no Hospital Veterinrio da UEL, em 2003.

. . . . .

38

Tabela 4.6 -

Acasalamentos fecundos e infecundos por raa.

Tabela 4.7 -

Nmero de cabeas da produo pecuria dos estados do Sul do Brasil em 2012. 41

Tabela 5.1 -

Nmero de atendimentos no Hospital Veterinrio, da Universidade Estadual de


Londrina, no primeiro semestre de 2003.

Tabela 6.1 -

Distribuio de frequncia dos pesos

(kg)

. . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . . . . .

de

30

40

62

ces das raas Fila Brasileiro e

Pastor Alemo, coletados no Hospital Veterinrio da Universidade Estadual de


Londrina, em 2003.
Tabela 6.2 -

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

Efeito da temperatura de armazenamento e tempo aps a ordenha sobre o


crescimento bacteriano.

Tabela 6.3 -

67

. . . . . . . . . . . . . . . . . . . . . . . . . . . . .

68

Tempo (em semanas) de sobrevida de ratos com cncer induzido experimentalmente.

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

Tabela 6.4 -

Peso mdio (kg) das leitegadas da raa Landrace, ao nascer.

Tabela 6.5 -

Suicdios ocorridos no Brasil em 1986, segundo a causa atribuda.

Tabela 6.6 -

Peso mdio em ratos por idade.

Tabela 7.1 -

Pesos de cinco coelhos de quatro raas distintas.

Tabela 7.2 -

Desvios e desvios absolutos para pesos dos animais da raa Alaska.

. . . . . .

94

Tabela 7.3 -

Desvios e quadrado dos desvios para pesos dos animais da raa Alaska . . . . .

96

Tabela 7.4 -

Pesos das carcaas de bovinos.

98

Tabela 7.5 -

Teor de gordura (g/24

Tabela 7.6 -

Pesos dos frangos de uma granja.

Tabela 7.7 -

Distribuio de frequncia da dosagem de cido rico.

Tabela 7.8 -

Nmero de acidentes na rodovia X.

Tabela 9.1 -

Distribuio dos animais quanto ao Porte e Sexo.

Tabela 9.2 -

Esquema padro de sntese dos dados para vericao da qualidade de um teste


clnico.

Tabela 9.3 -

Tabela 9.4 -

horas)

. . . . . . . . .

73
80

. . . . . . .

89

. . . . . . . . . . . . . . . . . . . . . . . . .

90

. . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . . . . . . . . . .
em 43 crianas.

92

. . . . . . . . . . . . . . . . .

103

. . . . . . . . . . . . . . . . . . . . . . . .

104

. . . . . . . . . . . . .

104

. . . . . . . . . . . . . . . . . . . . . . .

105

. . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

132

134

Resultados da tomograa computadorizada em 67 pacientes com metstase e


83 sem metstase do carcinoma heptico. . . . . . . . . . . . . . . . . . . . .

135

Probabilidades necessrias para o clculo dos ndices VPP e VPN. . . . . . . .

136

Tabela 10.1 - Distribuio da varivel aleatria

Y.

Tabela 10.2 - Distribuio da varivel aleatria

. . . . . . . . . . . . . . . . . . . . . .
de Bernoulli.

. . . . . . . . . . . . . . . .

148
155

Tabela 10.3 - Nmero de consultas realizadas pelos liados ao plano de sade.

Tabela 12.1 - Distribuio das Mdias

. . . . . . .

163

. . . . . . . . . . . . . . . . . . . . . . . . . . . . .

194

Lista de Figuras
Pgina

Figura 5.1 -

Raas caninas atendidas no Hospital Veterinrio da Universidade Estadual de


Londrina em 2003.

Figura 5.2 -

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

Percentual de raas caninas atendidas no Hospital Veterinrio da Universidade


Estadual de Londrina em 2003.

Figura 5.3 -

. . . . . . . . . . . . . . . . . . . . . . . . .

44

Cor dos Olhos dos alunos do 1 ano do curso de Medicina Veterinria da Universidade Estadual de Londrina em 2011.

Figura 5.4 -

43

. . . . . . . . . . . . . . . . . . . .

45

Raas caninas atendidas no Hospital Veterinrio da Universidade Estadual de


Londrina em 2003.

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

46

Figura 5.5 -

Produo pecuria dos estados do sul do Brasil no ano de 2012.

. . . . . . .

47

Figura 5.6 -

Produo pecuria dos estados do sul do Brasil no ano de 2008.

. . . . . . .

49

Figura 5.7 -

Categoria dos animais atendidos no Hospital Veterinrio da Universidade Estadual de Londrina, no ano de 2005.

Figura 5.8 -

50

Categoria dos animais atendidos no Hospital Veterinrio da Universidade Estadual de Londrina, no ano de 2005.

Figura 5.9 -

. . . . . . . . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . . . . . . . .

Relao entre tolerncia ao cigarro e gnero dos estudantes.

. . . . . . . . .

51
52

Figura 5.10 - Nmero de lhotes de cadelas submetidas a inseminao articial no Hospital


Veterinrio da UEL em 2003.

. . . . . . . . . . . . . . . . . . . . . . . . . .

53

Figura 5.11 - Nmero de atendimentos dirios, do Hospital Veterinrio, da Universidade Estadual de Londrina, nos ltimos 50 dias.

. . . . . . . . . . . . . . . . . . . .

54

Figura 5.12 - Nmero mdio de atendimentos dirios, do Hospital Veterinrio, da Universidade


Estadual de Londrina, nos ltimos 50 dias.

. . . . . . . . . . . . . . . . . . .

55

Figura 5.13 - Comparao de pesos (g) de tilpias para quatro equipes de alunos do curso de
Medicina Veterinria da Universidade Estadual de Londrina em 2003.

. . . . .

58

Figura 5.14 - Relao entre peso e comprimento de tilpias do Nilo, do tanque de piscicultura
da Universidade Estadual de Londrina, 2003.

. . . . . . . . . . . . . . . . . .

59

Figura 5.15 - Relao entre peso e comprimento de tilpias do Nilo, controladas para a varivel
tempo de recuperao da anestesia, do tanque de piscicultura da Universidade
Estadual de Londrina, 2003.

. . . . . . . . . . . . . . . . . . . . . . . . . . .

60

Figura 5.16 - Peso mdio de 10 tilpias, do tanque de piscicultura da UEL, acompanhadas


durante 8 semanas.

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

61

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

62

Figura 5.18 - Grco Correto. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

62

Figura 5.17 - Grco distorcido.

Figura 6.1 -

Esquema para obteno da moda pelo mtodo de Czuber, do nmero de atendimentos do Hospital Veterinrio da UEL, 2005.

. . . . . . . . . . . . . . . .

74

. . . . . . . . . . . . . . . . . . . . . . . . . .

83

Figura 6.2 -

Esboo do grco de caixas.

Figura 6.3 -

Frequncia cardaca dos animais atendidos no Hospital Veterinrio, da Universidade Estadual de Londrina, em 2003.

Figura 6.4 -

. . . . . . . . . . . . . . . . . . . . .

83

Frequncias respiratrias dos animais atendidos no Hospital Veterinrio, da Universidade Estadual de Londrina, em 2003.

. . . . . . . . . . . . . . . . . . .

Figura 10.1 - Grco das probabilidades de prenhez dos animais.


Figura 10.2 - Distribuio acumulada da prenhez dos animais.
Figura 10.3 - Grco da distribuio Binomial, para
sucesso

p = 0, 30.

n = 10

87

. . . . . . . . . . . . . . .

148

. . . . . . . . . . . . . . . .

153

ensaios com probabilidade de

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

157

Figura 10.4 - Grco da distribuio de Poisson, cuja mdia () 4,0. . . . . . . . . . . . .

161

1 3
y .
4

. . . . . . . . . . . . . . . . . . . . . . . . .

173

Figura 11.2 - Grco da Distribuio Normal.

. . . . . . . . . . . . . . . . . . . . . . . . .

176

Figura 11.1 - Grco da funo

f (y) =

Figura 11.3 - Probabilidade entre as reas

b.

. . . . . . . . . . . . . . . . . . . . . . . .

176

Figura 11.4 -

desvio da mdia.

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

177

Figura 11.5 -

desvios da mdia. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

177

Figura 11.6 -

desvios da mdia. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

177

Figura 11.7 - reas sob a curva normal.

. . . . . . . . . . . . . . . . . . . . . . . . . . . .

Figura 11.8 - Relao entre mdias e desvios da distribuio normal.

. . . . . . . . . . . . .

177
178

Figura 11.9 - reas sob a curva normal padro.

. . . . . . . . . . . . . . . . . . . . . . . .

179

Captulo 1

Introduo
A estatstica, de uma forma geral, trata da organizao, interpretao e apresentao de
dados, sejam de contagens ou mensuraes. A palavra

estatstica est associada idia de coleo

de dados (nmeros).
Mesmo sem serem estudiosos da rea, as pessoas convivem com informaes estatsticas
praticamente todos os dias, seja atravs de rdio, televiso, jornais ou relatrios tcnicos das mais
diversas reas.
Vrias denies so dadas estatstica, entre elas:
Estatstica a arte e cincia de coletar, analisar e interpretar dados.
A estatstica uma cincia da tomada de deciso diante de incertezas.
Estatstica a cincia de fazer uso efetivo dos dados numricos relativos aos grupos de
indivduos ou de experimentos.
O pensamento estatstico ser um dia to necessrio para o cidado quanto a habilidade
de ler e escrever. (Wells, H. G., 1993)
A estatstica preocupa-se com a compreenso do mundo real atravs da informao que
ns extramos da classicao e mensurao. Sua caracterstica distintiva lidar com a
variabilidade e a incerteza, que esto em toda parte. (Bartholomew, 1995)
Ao conjunto de mtodos estatsticos usados no tratamento da variabilidade nas cincias
mdicas e biolgicas, convencionou-se chamar de

Bioestatstica.

A Bioestatstica fornece mtodos para se tomar decises timas na presena de incerteza,


estabelecendo faixas de conana para a eccia dos tratamentos e vericando a inuncia de fatores
de risco no aparecimento de doenas.
1

Captulo 1. Introduo

1.1 Aplicaes da Estatstica


As aplicaes da estatstica se desenvolveram de tal forma que, hoje, praticamente todo
campo de estudo se benecia da utilizao de mtodos estatsticos. Alguns exemplos da aplicabilidade
da estatstica na Medicina Veterinria so:

Exemplo 1: Comparao do uso de rastreabilidade para sunos em grupo e individual1


Com o acrscimo da demanda do mercado consumidor nacional e internacional por

dutos rastreados,

pro-

urge o desenvolvimento de conhecimento sobre processos de identicao e ras-

treamento de informaes na produo animal. Este trabalho teve como objetivo comparar dois tipos
de rastreabilidade em sunos: individual e de grupo, utilizando o sistema de identicao e registro de
dados eletronicamente. Os

50 leites foram identicados ao nascer e as variveis peso e converso

alimentar serviram de base para comparao entre os dois sistemas. Uma amostra foi considerada
a partir do erro admissvel, estabelecido pelo produtor.

Exemplo 2: Fatores de Risco Associados com a Prevalncia Sorolgica de Salmonela em


Granjas Comerciais de Sunos do Sul do Brasil2 .
Devido a complexa ecologia da Salmonela, estudos epidemiolgicos tm sido realizados
para identicar os fatores de risco para a infeco, cuja eliminao reduzir o nmero de sunos
portadores de salmonela ao abate. O presente trabalho objetivou identicar esses fatores associados
com infeco por Salmonela em granjas de sunos comerciais dos estados do Rio Grande do Sul e
Santa Catarina. A identicao da infeco foi realizada atravs da reao sorolgica de sunos na
terminao. O estudo conduzido foi observacional transversal em 33 granjas de ciclo completo e 32
unidades de terminao de leites nos estados do RS e SC. Em cada granja foi aplicado um questionrio
que contemplava informaes sobre manejo, alimentao, ambincia e condies higinico-sanitrias
do rebanho. Foi coletado sangue de aproximadamente 40 animais uma semana antes do abate. O soro
foi submetido ao teste de Elisa polivalente para Salmonela dos sorovares Typhimurium, Choleraesuis
e Anatum. Durante a visita foram tambm coletadas amostras de gua e rao, avaliadas quanto
presena de coliformes pela tcnica de fermentao em tubos mltiplos. A rao, alm da avaliao
da granulometria, foi submetida a contagem de coliformes e pesquisa de Salmonela pela tcnica
bacteriolgica e por PCR. Os resultados destes exames e as respostas do questionrio foram usadas
na anlise de fatores de risco como variveis explicativas (180 variveis) e os resultados da prevalncia


Brazilian Journal of Veterinary Research and Animal Science (2004) 41:327-331


Comunicado Tcnico 309 - Embrapa Sunos - Concrdia, SC

Planejamento de uma pesquisa

sorolgica constituram a varivel resposta.

Inicialmente, atravs de teste de

2 ,

foi estudada a

associao entre variveis resposta e explicativas como anlise preliminar. As variveis explicativas
associadas com a varivel resposta

(p 20), foram submetidas a anlise de correspondncia mltipla.

Exemplo 3: Corte da cauda em leites: estudo comparativo de dois mtodos3 .


O objetivo deste trabalho foi de avaliar a inuncia do corte e do esmagamento da cauda,
a nvel do ltimo tero da cauda dos leites sobre a ocorrncia de hemorragia, de diarria, e o ganho
de peso dos leites at os 21 dias de idade. O experimento foi conduzido no sistema de produo
de sunos da EMBRAPACNPSA, em Concrdia/SC, envolvendo um total de 251 leites das raas
Landrace, Large White e Mestios destas raas, distribudos nos seguintes tratamentos: Tratamento
A (TA) corte do ltimo tero da cauda; Tratamento B (TB) esmagamento do ltimo tero da cauda.
O corte foi realizado com o auxlio de uma tesoura e o esmagamento com uma tesoura sem o com
os referidos bordos arredondados. O corte ou o esmagamento da cauda foi sempre realizado ao nvel
do ltimo tero da cauda, nas primeiras horas da manh do primeiro dia de vida dos leites, no TA,
logo aps o corte o restante da cauda foi mergulhada em uma soluo de iodo.

Os leites foram

examinados de hora em hora durante as primeiras 10 horas aps o corte ou esmagamento da cauda
com o objetivo de vericar a ocorrncia de hemorragia ou diarria para os dois tratamento. Os animais
do TB foram examinados duas vezes ao dia com o objetivo de determinar o dia da queda da cauda.
Quanto presena ou ausncia de diarria adotou-se os seguintes critrios: ausncia de diarria (fezes
consistentes ou pastosas); e, presena de diarria (fezes lquidas com ou sem desidratao dos leites).
Todos os leites foram pesados no dia do nascimento e aos 21 dias de idade.

1.2 Planejamento de uma pesquisa


O planejamento de uma pesquisa essencial para o desenvolvimento de trabalhos acadmicos e cientcos. Ele servir como um roteiro para orientar o trabalho de pesquisa, denindo as
etapas a serem realizadas, os instrumentos de avaliao e a metodologia a ser usada.
O planejamento possibilita ao pesquisador seguir uma disciplina de trabalho no s referente aos procedimentos lgicos, como tambm em termos de organizao de tempo e cumprimento
de prazos.
Alguns pontos importantes para o planejamento de uma pesquisa so:

1. Planejamento do problema:
!

Comunicado Tcnico 173 - Embrapa Sunos - Concrdia, SC

Captulo 1. Introduo
a) denio da importncia do problema que se pretende estudar;
b) determinao do objetivo e nalidade do estudo;
c) determinao das variveis que sero observadas (ou coletadas) e a forma como as mesmas
sero obtidas (mensurao, contagem, questionrio, etc.).

2. Avaliao da informao existente:


reviso bibliogrca.

3. Formulao de hipteses.
Em toda pesquisa, exceto naquelas meramente descritivas ou exploratrias, a formulao de
uma hiptese estatstica necessria para sua comprovao ou rejeio.

4. Vericao da hiptese:
consiste da coleta de dados, anlise estatstica e apresentao dos resultados.

5. Parte nal:
concluso ou discusso, bibliograa, anexos, apndices.

Alguns termos tcnicos so bastante comuns na estatstica, tais como:

a)

Populao

- dene-se como populao ao conjunto de todos os elementos (animais, plantas,

pessoas, etc) que possuam pelo menos uma caracterstica comum, a qual se deseja estudar.

Parmetro - uma medida numrica que descreve uma caracterstica de uma populao.

So

valores xos, geralmente desconhecidos e usualmente representados por caracteres gregos.

Exemplos:
pulacional),

b)

Amostra

(mdia populacional),

(proporo populacional),

(varincia populacional),

(desvio-padro po-

(tamanho populacional), etc.

- a amostra pode ser denida como um subconjunto da populao e, a partir dela,

faz-se inferncia sobre as caractersticas da populao. Uma amostra tem que ser representativa
da populao.

Estatstica

- uma medida numrica que descreve uma caracterstica de uma amostra.

Representada por caracteres latinos.

Exemplos: y (mdia amostral), s2


(proporo amostral),

(varincia amostral),

(tamanho da amostra), etc.

(desvio padro amostral),

Planejamento de uma pesquisa

Como exemplo, considere uma pesquisa realizada com 30 alunos do primeiro ano, do
curso de Medicina Veterinria, da Universidade Estadual de Londrina, no ano de 2013, em que a
estatura mdia foi de

y
= 1, 74 m.

Como essa estatura se baseia em uma amostra, trata-se de uma

estatstica.
Realizou-se a mesma pesquisa com

todos

os alunos do primeiro ano, do curso de Me-

dicina Veterinria, da Universidade Estadual de Londrina, no ano de 2013, e a estatura mdia foi de

= 1, 75 m.

Neste caso,

um

parmetro,

pois baseia-se em toda a populao de alunos do

primeiro ano do curso de Medicina Veterinria, da UEL, ano de 2013.


O aspecto a ser estudado, observado ou medido em cada elemento da populao recebe o
nome de

varivel.

So exemplos de variveis: estatura, gnero, idade, peso, renda, grau de instruo,

nmero de animais eutanasiados, nmero de animais capturados, etc.


No havendo condies de se trabalhar com todos os elementos da populao (
retira-se uma amostra representativa (

censo),

amostragem) da populao para o estudo.

1.2.1 Vantagens da amostragem sobre o censo


Um levantamento por amostragem apresenta algumas vantagens sobre o censo, tais
como:

a)

custo reduzido:

devido ao nmero de dados coletados ser menor do que o censo, o custo da

pesquisa ca reduzido;

b)

tempo:

quando se utiliza a amostragem ao invs do censo, gasta-se menos tempo para concluso

do estudo, pois trabalha-se com menos elementos. Por outro lado, quando o produto perecvel,
a amostragem a nica soluo;

c)

aprofundamento:

a pesquisa amostral pode ser mais detalhada, visto que so examinados me-

nos elementos. Portanto, uma pesquisa

amostral

com exames clnicos e laboratoriais pode ser

mais informativa do que realizar o censo usando como instrumento de coleta de informao um
questionrio.

Algumas tcnicas amostrais podem ser utilizadas para a obteno da amostra.

Captulo 1. Introduo

Exerccios
1) Seja

a varivel tempo, em segundos, de recuperao da anestesia de tilpias, com 7 observaes:

yi = {y1 y2 y3 y4 y5 y6 y7 } .
yi = {17, 0 8, 9 28, 7 20, 5 8, 9 26, 1 43, 9} .

Calcular (passo-a-passo):

a) Soma de todos os tempos:

yi ;

c)

i=1
b) Soma dos 5 primeiros tempos:

yi ;

i=2
5

yi ;

d) Quadrado da soma:

i=1

e) Soma de Quadrados:

)2
yi

i=1

yi2 ;

i=1
n

f ) A mdia aritmtica simples dos tempos:

g) Suponha a constante

k = 15

e calcule

y =

yi

i=1

k yi ;

i=1
h) Soma dos desvios em relao a

k:

(yi k);
i=1

i) Soma dos desvios em relao mdia:

(yi y).

O que voc observa de diferente em relao

i=1
ao item anterior?
j) Demonstre algebricamente o resultado encontrado no item anterior;
k) Soma de quadrado dos desvios:

(yi y)2 ;
i=1

l) Considerando-se

y como

uma constante, desenvolva algebricamente o seguinte quadrado:

(yi y)2 ;
i=1

Planejamento de uma pesquisa


2) Considere a varivel

X,

tempo (s) de induo da anestesia, para as mesmas 7 tilpias, respecti-

vamente:

xi = {165 183 161 147 146 152 174}


Calcule:

a)

xi yi ;

b)

i=1

xi

i=1

3) As quantidades de cido ascrbico, em miligramas por

yi ;

i=1

100

mililitros, presentes em

80

qumicos de plasma humano, esto indicadas na Tabela 1.1:

mg/100 ml.

Tabela 1.1  cido arcrbico, em

cido ascrbico (em

mg/100ml)

Frequncias

(fi )

Ponto Mdio

0, 0 0, 2

0,1

0, 2 0, 4

0,3

0, 4 0, 6

18

0,5

0, 6 0, 8

35

0,7

0, 8 1, 0

16

0,9

1, 0 1, 2

1,1

80

80

Total

(xi )

Determine:

a)

fi ,

i = 1, 2, . . . , 6;

c)

i=1
b)

e)

)2
xi fi

i=1

xi fi ,

i = 1, 2, . . . , 6;

i=1
k

( k

d)

x2i fi ;

i=1

xi fi

i=1
k

i=1

fi

i = 1, 2, . . . , 6.

Que medida voc encontrou?

i = 1, 2, . . . , 6;

exames

Captulo 1. Introduo

f)

k
1
2
xi fi
V =

n1
i=1

)2
xi fi

i=1
k

fi

i = 1, 2, . . . , 6;

i=1

Nem sempre podemos construir o futuro para nossa


juventude, mas podemos construir nossa juventude
para o futuro.

Captulo 2

Amostragem
2.1 Introduo
Usualmente trabalha-se com apenas uma amostra da populao. Em geral, selecionase uma amostra (ou parte) da populao em estudo e, a partir dela, tabula-se a caracterstica (ou
varivel) que est sendo avaliada.

Esta caracterstica pode ser o peso de ces, a raa dos felinos,

se o animal vacinado ou no, gastos com medicamentos ou quaisquer outras caractersticas.

partir dos resultados obtidos na amostra, o pesquisador dever estend-los para toda a populao,
estabelecendo inclusive as margens de erro e acerto nas previses.

A realizao do censo no garante que a pesquisa esteja livre de erros. Os erros de coleta
e manuseio de um grande nmero de dados, em geral, so maiores do que as imprecises a que se
est sujeito quando generaliza-se, via inferncia, as concluses de uma amostra bem selecionada.

Para que se possa fazer inferncias vlidas sobre a populao, a partir de uma amostra,
necessrio que esta seja representativa da populao.

No tarefa simples denir uma amostra

representativa da populao e, por isso, uma forma de se conseguir essa representatividade fazer com
que o processo de escolha da amostra seja, de alguma forma, aleatrio, introduzindo desta maneira o
conceito de amostra probabilstica, conforme discutido em Bolfarine & Bussab, 2005.

Denida a populao, preciso estabelecer a

tcnica de amostragem, isto , o proce-

dimento que ser adotado para escolher os elementos que iro compor a amostra.
9

10

Captulo 2. Amostragem

2.2 Tcnicas de Amostragem


Os tipos de amostragem que sero apresentados so probabilsticos sendo que sua principal caracterstica poder ser submetido a tratamento estatstico, o que permite compensar erros
amostrais. A amostragem no probabilstica quando alguns elementos da populao no tem chance
de pertencer a amostra, como por exemplo, amostras intencionais, a esmo ou de voluntrios.

2.2.1 Amostragem simples ao acaso ou amostragem aleatria simples


um mtodo de selecionar,
tamanho

N,

sem reposio,

elementos de uma populao de

conhecido e nito, em que todo elemento da populao tem igual probabilidade de

ser escolhido para a amostra, sendo cuidadosamente planejada para se evitar qualquer tendenciosidade.

Processo de coleta:
n

Todos os

elementos da populao devem ser enumerados. Sorteia-se, ento,

elementos para compor a amostra.

Este sorteio pode ser feito com o auxlio de uma tabela de

nmeros aleatrios, com a utilizao de algum programa computacional ou utilizando-se uma urna
que recebe os nmeros de

N.

Os elementos correspondentes aos nmeros escolhidos iro compor

a amostra.

Utilizao:
Exemplo 1:

Este tipo de amostragem utilizado quando a populao for considerada homognea.

Proceder a um sorteio, em sala de aula, com 45 alunos, para compor uma amostra de

tamanho 5.

Soluo:

Para selecionar a amostra usando o

R, basta utilizar o comando:

sala = 1:45
sample(sala, 5, replace=F)
# ou, simplesmente,
sample(45, 5, replace=F)

Tcnicas de Amostragem
Obs.:

a opo

11

replace=F quer dizer que um aluno sorteado no poder ser sorteado novamente, ou

seja, a amostragem que est sendo realizada


com reposio, basta trocar o

Exemplo 2:

(false ) por

sem reposio.

(true ):

Caso se proceda a uma amostragem

replace=T.

Considere um conjunto de dados com muitas variveis e muitos indivduos e se queira

retirar uma amostra desse conjunto para um estudo, como apresentado na Tabela 2.1 .
Tabela 2.1  Dados sobre tilpias do Nilo, coletados por alunos do curso de Medicina Veterinria da
Universidade Estadual de Londrina, no ano de 2005.

Tilpia

Turma

Equipe

Induo

Peso

Comp

Alt

Comp_cabea

2000

2021

165

408,5

29,0

7,3

7,8

17,0

2000

2021

183

400,0

29,5

9,0

7,3

8,9

2000

2021

161

397,2

29,3

8,7

8,0

28,7

2000

2021

108

431,6

29,5

9,1

7,6

115,0

.
.
.

.
.
.

.
.
.

.
.
.

.
.
.

.
.
.

.
.
.

.
.
.

500

2000

2021

147

309,4

25,8

8,1

6,7

As variveis

Alt

.
.
.
20,5

Induo (tempo para anestesiar a tilpia) e Recup (tempo para se recuperar

da anestesia) so dadas em segundos; A varivel


(comprimento),

Recup

(altura) e

Comp_cabea

Peso

dada em gramas; J as variveis

Comp

(comprimento da cabea) so dadas em centmetros.

Pode-se pensar, neste caso, em duas situaes em que a amostragem simples ao acaso utilizada.

I. No primeiro caso, em que uma amostra ser retirada para uma


mao no

varivel especca,

a progra-

ca exatamente como no Exemplo 1, ou seja, para se retirar uma amostra aleatria

de tamanho 15 para a varivel

comprimento (cm),

tem-se

dados = read.table(`http://www.uel.br/pessoal/silvano/Dados/Tilapia.txt',
dec=`,', head=T)
attach(dados)
names(dados)
(amostra = sample(Comp, 15, replace=F))


Disponvel em: http://www.uel.br/pessoal/silvano/Dados/Veter/Tilapia.txt, com apenas 40 indivduos.

12

Captulo 2. Amostragem

II. No segundo caso, o objetivo retirar uma

amostra de indivduos,

sendo que cada indivduo

manter os valores observados de cada varivel. Neste caso, necessrio carregar o pacote

car.

Os comandos so:

require(car)
(saida = some(dados, n=15, replace=FALSE))

2.2.2 Amostragem sistemtica


Os elementos so escolhidos utilizando-se algum tipo de sistema.

Um professor,

utilizando-se de sua lista de chamada, poderia compor uma amostra chamando todos os alunos cujo
nmero na pauta terminasse em um determinado digito. Assim, o professor chamaria para compor
sua amostra, por exemplo, todos os alunos com nmeros terminados em zero, ou seja, os nmeros

10, 20, 30, 40

e assim por diante.

Esta amostragem utilizada quando a populao est naturalmente ordenada, como


chas em um chrio, listas telefnicas, quando os elementos da populao so prdios de uma rua,
etc.
Suponha que a administrao da UEL quisesse fazer uma pesquisa com seus

13.000

alunos. Neste caso, poderia-se obter uma relao completa dos mesmos e selecionar um a cada

50

para compor a amostra. Esse mtodo simples e utilizado com frequncia.

Processo de coleta:

seja

o intervalo de amostragem

o tamanho da populao e

N
k= .
n

Sorteia-se um nmero

elementos correspondentes aos nmeros:

Utilizao:
Exemplo:

o tamanho da amostra, ento calcula-se

entre

k,

formando a amostra dos

x, x + k, x + 2k, . . ..

Este tipo de amostragem utilizado quando a populao est naturalmente ordenada.

Considere a populao formada pelos 400 alunos do curso de Medicina Veterinria da

Universidade Estadual de Londrina, no ano de 2014.

O Colegiado do Curso decide realizar uma

pesquisa para saber o grau de conhecimento dos alunos quanto prosso escolhida. Dispe-se de
uma lista, em ordem alfabtica, de todos os alunos. Uma amostra de 50 estudantes ser selecionada.
Proceda escolha desta amostra.

Tcnicas de Amostragem

13

Soluo:

Para selecionar a amostra usando o

R, basta utilizar o comando:

n = 50 ; N = 400 ; k = N/n
(amostra = sample(k, 1))
(amostras = seq(amostra, N, k))

2.2.3 Amostragem estraticada


Se uma populao considerada heterognea em relao ao atributo que se quer pesquisar, mas possvel distinguir sub-populaes mais ou menos homogneas, deve-se utilizar a amostragem estraticada.
Por exemplo, se os alunos dos vrios cursos da UEL so diferentes em relao ao atributo
a ser pesquisado, pode-se considerar cada curso como um estrato.

Para obter uma amostra dos

alunos da UEL, seria razovel obter uma amostra dentro de cada curso e depois reunir as informaes
numa nica amostra, que seria representativa dos alunos da UEL.

Processo de coleta:

deve-se dividir as

unidades da populao em

disjuntos e homogneos e selecionar, ao acaso, amostras de tamanhos


o tamanho da amostra seja

N1 , N2 , . . . , Nj

n1 , n2 , . . . , nj ,

estratos

de modo que

n = n1 + n2 + . . . + nj .

O tipo de amostragem estraticada mais comum a proporcional, que consiste em


selecionar os elementos de uma amostra entre os vrios estratos em nmero proporcional ao tamanho
de cada um dos estratos.

Procedimento:
1) calcular a frao de amostragem dada por:

f=

n
;
N

14

Captulo 2. Amostragem

2) calcular o nmero de elementos a ser sorteado em cada estrato:

n1 = N 1 f ;

n2 = N2 f ;

. . .;

nj = Nj f

sendo:

(nmero de elementos da populao);

Nj
n

(nmero de elementos do estrato

j );

(tamanho da amostra a ser selecionada).

Exemplo 1:

Deve-se extrair uma amostra de tamanho

N = 2.000,
N4 = 100.

que consiste de 4 estratos de tamanhos

n = 80

de uma populao de tamanho

N1 = 500, N2 = 1.200, N3 = 200

Se a alocao deve ser proporcional, qual o tamanho da amostra a ser extrada de cada

um dos quatro estratos?

Soluo:

Os comandos do

so:

n = 80 ; N1 = 500 ; N2 = 1200 ; N3 = 200 ; N4 = 100


N = N1 + N2 + N3 + N4 ; f = n / N
n1 = f*N1 ; n2 = f*N2 ; n3 = f*N3 ; n4 = f*N4
(amostras = cbind(n1, n2, n3, n4))
(amostra.1 = sample(N1, n1, replace=F))
(amostra.2 = sample(N2, n2, replace=F))
(amostra.3 = sample(N3, n3, replace=F))
(amostra.4 = sample(N4, n4, replace=F))

Exemplo 2:

Considere o conjunto de dados tilpia, que tem 4 estratos (Equipes: 1011, 1012, 2021,

2022), e o objetivo retirar uma amostra de tamanho 5 para cada extrato da varivel comprimento
(Comp). Os comandos so

Tcnicas de Amostragem

15

dados = read.table(`http://www.uel.br/pessoal/silvano/Veter/Dados/Tilapia.txt',
dec=`,', head=T)
attach(dados)
names(dados)
(Amostras = tapply(Comp, Equipe, sample, size=5))

Caso o nmero de amostras dentro de cada estrato seja diferente, pode-se utilizar o pacote

sampling,

em que possvel determinar se as amostras retiradas dentro de cada estrato sero do tipo:
amostragem aleatria simples

require(sampling)
amost.estrat.simples = strata(dados, c(``Equipe"), size = c(5, 7, 3, 4),
method = ``srswor")
(amostras.est.simples = getdata(dados, amost.estrat.simples))

Observe a coluna Stratum, no arquivo de sada do

R.

amostragem sistemtica

amost.estrat.sist = strata(dados, c(``Equipe"), size = c(5, 7, 3, 4),


method = ``systematic", pik=Equipe)
(amostras.est.sist = getdata(dados, amost.estrat.sist))

Pode-se citar, ainda, a amostragem por conglomerado e a amostragem por convenincia.

No importa quo bem se planeje e execute o processo de coleta de amostras, h sempre


a possibilidade de um erro nos resultados.

Erro amostral:

a diferena entre um resultado amostral e o verdadeiro resultado populacional.

Tais erros resultam de utuaes amostrais aleatrias.

Exemplo:

escolha aleatoriamente

50 chas de ces da raa Poodle

atendidos no Hospital Veterinrio

da UEL e verique o peso mdio (kg ) desses animais. Retirada uma outra amostra de

50

animais,

16

Captulo 2. Amostragem

provvel que se obtenha um peso mdio (kg ) diferente.

Ocorre um

erro no amostral

quando os dados amostrais so coletados, registrados ou analisados

incorretamente. Tais problemas resultam em um erro que no seja uma simples utuao amostral
aleatria, como por exemplo, a escolha de uma amostra no aleatria e tendenciosa, a utilizao de
um instrumento de mensurao defeituoso, uma questo formulada de modo tendencioso, um grande
nmero de recusas de resposta ou a cpia incorreta dos dados amostrais.
Muitos desses erros so provenientes do prprio observador, devido ao grau de treinamento (experincia), o excesso de trabalho, seu estado fsico e/ou condies ambientais.
Como exemplo, cita-se o caso de cinco radiologistas que examinaram, em diferentes
pocas, separadas por um perodo de dois meses, as mesmas 1.200 radiograas de trax, com a
nalidade de diagnosticar a existncia de tuberculose pulmonar. As radiograas de tamanho-padro
foram lidas separadamente por cada radiologista e os resultados se encontram na Tabela 2.2.

Tabela 2.2  Diagnsticos de radiograas de trax.

Radiologista

Nmero de radiograas consideradas positivas

1a

Leitura

2a

Leitura

118

139

69

78

83

88

96

89

106

92

Deve-se concluir que tais discordncias no reetem uma variao real e sim, erros cometidos por quem procedeu leitura do material radiogrco.

2.3 Etapas de uma pesquisa


Considerando-se que as fases do planejamento foram seguidas, deve-se levar em considerao algumas etapas para que a validao da hiptese possa ser aceita. Essas etapas so relativas
aos dados propriamente, como a unidade de medida, a unidade amostral, dentre outras. Essas etapas
so:

a)

populao

- a populao a ser trabalhada deve ser bem denida, identicando-se corretamente

Etapas de uma pesquisa

17

os seus elementos para que a amostra coletada represente os dados da populao;

b)

dados a serem coletados - ao se efetuar a coleta dos dados importante vericar se todos esses
dados sero importantes para os propsitos da pesquisa, e se nenhum dado essencial est sendo
omitido;

c)

mtodos de medidas - antes de se coletar os dados necessrio e importante que a metodologia


de sua coleta seja estruturada. Deve-se decidir preliminarmente se os dados sero coletados por
chas, por declarao de entrevistados, por telefone, por respostas a um questionrio, etc. Em
qualquer das alternativas, h necessidade de um perfeito treinamento em toda a equipe de trabalho,
a m de que haja um critrio nico de registro;

d)

unidade de amostragem - se a pesquisa for realizada atravs de levantamento por amostragem,


deve-se denir qual a unidade de amostragem, que pode ser: uma pessoa, uma famlia, uma
empresa, um quarteiro, uma planta, um animal, etc.;

e)

escolha do tipo de amostragem

- de acordo com o objetivo da pesquisa e do tipo de popula-

o, deve-se escolher a melhor tcnica para selecionar a amostra: amostragem simples ao acaso,
amostragem estraticada, etc.;

f)

vericao preliminar

- a vericao preliminar no pode faltar em qualquer pesquisa. Deve-se

testar em uma pequena parte da populao as seguintes caractersticas: se a tcnica a ser utilizada
para a coleta a melhor possvel; se a forma escolhida de registro das informaes no deve ser
alterada; se os coletores esto bem treinados, enm deve-se vericar a ecincia da metodologia
a ser empregada;

g)

anlise dos dados - apurados os resultados, os mesmos devem ser analisados estatisticamente.

Os

dados podem ser apresentados em forma de tabelas ou grcos. Podem ser calculadas algumas
medidas, alguns testes estatsticos e realizadas algumas inferncias.

Aps a anlise cuidadosa,

deve-se elaborar um relatrio completo contendo os objetivos da pesquisa, a metodologia utilizada,


a anlise de todos os resultados, suas concluses, a bibliograa e, se necessrio os anexos, como
por exemplo, cpia do questionrio.

18

Captulo 2. Amostragem

Exerccios
1) Um pesquisador est interessado em avaliar o Peso (kg ) de animais domsticos das espcies
caninas e felinas, no importando a raa. Para isso, ele dispe de uma lista de dados, disponvel
em

http://www.uel.br/pessoal/silvano/Veter/Dados/HV.txt,

com a relao dos animais

atendidos no Hospital Veterinrio da Universidade Estadual de Londrina, durante um certo perodo.

(a) Retire uma amostra aleatria de 25 animais. Explique o processo de seleo. Quantos so
da espcie canina e felina?
(b) importante para o pesquisador coletar amostras de cada espcie. Sendo assim, que tipo
de amostragem ele deve utilizar?
(c) Considerando o item 1b, retire uma amostra de tamanho 20 para a espcie canina e de
tamanho 5 para a espcie felina. Relacione as amostras retiradas. Qual o peso mdio dos
dados? E para cada um dos estratos?

2) A enumerao dos pronturios de animais atendidos pelo Hospital Veterinrio da Universidade


Estadual de Londrina reiniciada sempre no primeiro dia til de cada ano. Assim, o pronturio do
primeiro animal atendido no ano de 2014 recebeu o nmero 1 e, assim, sucessivamente. No ano
de 2013, foram 3.756 novos pronturios. Uma pesquisa de satisfao com os proprietrios cujos
animais foram atendidos em 2013 ser realizada. Para isto, uma amostra de 300 proprietrios ser
estudada. Que tipo de amostragem voc usaria e porqu? Enumere a amostra coletada.

3) Um hematologista deseja fazer uma nova vericao de uma amostra de tamanho 10 dos 854
espcimes de sangue analisados por um laboratrio em determinado ms. Para isto, ele cria uma
estrutura amostral numerando como 001, 002, ..., 854. Use a tabela de nmeros aleatrios ou
calculadora para escolher que espcimes de sangue sero selecionados? Explique como escolheu
os nmeros da tabela aleatria.

4) Deve-se retirar uma amostra estraticada de tamanho

4.000,

que consiste de 3 estratos de tamanhos

n = 60

de uma populao de tamanho

N1 = 2.000, N2 = 1.200, N3 = 800.

Para que a

alocao seja proporcional, qual deve ser o tamanho da amostra a ser retirada de cada estrato?

Etapas de uma pesquisa

19

5) Deseja-se realizar um estudo, junto comunidade universitria da Universidade Estadual de Londrina, quanto posse e cuidado com os animais domsticos. Explique de que forma voc planejaria
esta pesquisa. Tambm, elabore 10 questes relativas ao assunto que ser pesquisado.

Nem tudo o que pode ser contado conta, e nem tudo


que conta pode ser contado.
(George Gallup).

Captulo 3

Conceitos elementares
3.1 Diviso da estatstica
A estatstica uma cincia dividida basicamente em duas partes:

estatstica descritiva

- descreve e analisa determinada populao (ou amostra), sem pretender tirar

concluses; de carter mais genrico.

Os elementos bsicos para essa anlise so:

tabelas,

grcos e medidas numricas como a mdia, moda e mediana.

estatstica indutiva ou inferncia estatstica

- preocupa-se com a anlise e interpretao dos da-

dos experimentais, e tem como objetivo tirar concluses sobre populaes com base nos resultados observados em amostras extradas dessas populaes.

Tanto a estatstica descritiva quanto a indutiva so realizadas em funo da coleta de


dados, sejam populacionais ou amostrais. A questo ento : como obter os dados estatsticos? Que
tipo de variveis so obtidas?
Em relao a primeira questo, eles podem ser obtidos atravs de: coleta documental,
entrevista, questionrio, formulrio, observao, experimento, etc. importante que a obteno dos
dados seja realizada utilizando-se da metodologia apresentada no Captulo 2.
Os tipos de variveis encontradas dependero, obviamente, do tipo de estudo realizado.
A classicao dos tipos de variveis passveis de serem encontradas so descritos na seo 3.2.
20

Tipos de variveis

21

3.2 Tipos de variveis


Em estatstica usual a manipulao de grandes conjuntos de dados, que constituem a
matria-prima das pesquisas estatsticas.

Para simplicar seu manuseio, costuma-se represent-los

atravs de variveis, usando-se as expresses

variveis qualitativas e variveis quantitativas para

distingui-los.

Exemplo:

Foi elaborado um questionrio com 34 questes para se traar o perl dos alunos do

1o

ano do curso de Medicina Veterinria, da Universidade Estadual de Londrina, no ano de 2005. As


variveis analisadas, entre outras, so apresentadas na Tabela 3.1.

Tabela 3.1  Dados dos alunos do

1o

ano do curso de Medicina Veterinria, da Universidade Estadual

de Londrina, do ano de 2005.

Aluno

Gnero

Procedncia

Nmero de

Estatura

irmos

(m)

Grau de
instruo dos pais

Masculino

Londrina

1,73

Superior incompleto

Masculino

Londrina

1,71

Segundo grau

Feminino

Campinas

1,65

Superior completo

.
.
.

.
.
.

.
.
.

.
.
.

.
.
.

.
.
.

27

Feminino

So Paulo

1,68

Primeiro grau

28

Masculino

Londrina

1,76

Primeiro grau

29

Feminino

Arapongas

1,58

Superior completo

Algumas respostas so numricas e outras em forma de atributo ou qualidade. Assim,


pode-se classicar as variveis como:

1.

Variveis categricas (ou qualitativas) - apresentam como possveis realizaes uma qualidade (ou atributo) do indivduo pesquisado. O nmero de categorias pode depender do interesse
do estudo. Elas se dividem em:

a)

variveis categricas nominais

- caracterizado por dados que consistem apenas em

nomes, rtulos ou categorias, no existindo nenhuma ordenao nos possveis resultados.

Exemplo:

Gnero dos estudantes, estado civil, tipo sanguneo, cor dos olhos, cor dos

cabelos, raa, respostas do tipo sim, no, etc.

22

Captulo 3. Conceitos elementares


b)

variveis categricas ordinais - os dados possuem uma ordenao natural.


Exemplo:

Grau de instruo (Ensino Fundamental, Ensino Mdio, Ensino Superior), classe

social (alta, mdia, baixa), presso sangunea (baixa, normal, alta), etc.

2.

Variveis numricas (ou quantitativas)

- apresentam como possveis realizaes, nmeros

resultantes de uma contagem ou mensurao (medida). Elas se dividem em:

a)

variveis numricas discretas - so aquelas que assumem valores em pontos da reta real,
frequentemente resultam de uma contagem e no possuem unidade de medida.

Exemplo:

Nmero de lhotes, nmero de animais eutanasiados, nmero de pulges em

plantas, nmero de animais hidratados, nmero de bactrias em uma lmina, nmero de


consultas mdicas em um determinado perodo, nmero de erros em um livro, nmero de
acidentes, etc.
b)

variveis numricas contnuas

- os possveis resultados podem assumir, teoricamente,

qualquer valor em certo intervalo da reta real, normalmente resultam de uma mensurao e
apresentam unidade de medida.

Exemplo:

Estatura, salrio, idade, peso, presso sangunea, temperatura, taxa de colesterol,

etc.

A importncia dessa classicao justica-se porque cada tipo de varivel resposta exige
um mtodo de anlise estatstica especco. Esquematicamente, tem-se:

3
Nominal

Qualitativas

q8

q
q
q

q
q

qq
+
q
q
q
q
q
Ordinal
qq
qqq
q
q
qqq
qqq

&

Variveis

3
Discreta

Quantitativas

+
Contnua

Dimensionamento da amostra

23

De acordo com Ogliari e Andrade (2005),

A distino entre variveis contnuas e discretas muitas vezes articial, pois depende
da aproximao (preciso) utilizada.

Por exemplo, idade uma varivel de medida de

tempo, portanto, por denio, uma varivel aleatria contnua, porm, em muitos
casos ela medida em anos completos (discretizao da varivel), o que a torna uma
varivel discreta.

Portanto, poder ocorrer situaes em que uma varivel contnua ser tratada como uma
varivel discreta.

3.3 Dimensionamento da amostra


muito comum ao pesquisador indagar sobre o nmero de elementos para uma amostra
quando pretende realizar uma pesquisa de campo, laboratrio ou um simples levantamento.
A determinao do tamanho da amostra depende de alguns fatores:

a)

Tamanho da populao-alvo - quanto ao nmero de elementos que a compe, pode-se classicar


em nitas e innitas. Na obteno do tamanho amostral ser importante esta informao.

b)

Varincia ou percentual

- em alguns estudos so empregadas caractersticas que apresentam

determinada variabilidade. Em outros casos, observa-se a porcentagem de certas caractersticas


em um conjunto. Dependendo do tipo de pesquisa, usa-se a varincia ou a porcentagem.

c)

Nvel de conana - deve-se imaginar que, ao se apresentar um valor percentual, referente taxa
de prevalncia do fenmeno estudado na amostra observada, esse valor tem, em relao ao valor
percentual da populao, uma diferena, que , a priori, arbitrada pelo pesquisador. Esta diferena
arbitrada considerada tendo em conta um nvel de acerto que normalmente consideramos de 95%
ou 99% de conana, ou seja, o nvel de conana de que a diferena arbitrada realmente ocorra
at o limite de diferena proposto.
Os nveis de conana propostos rotineiramente so de
pela letra

99%

de conana.

Simbolizado

Z, este valor substitudo na frmula (3.1) por uma constante 1, 96 quando o nvel de

conana corresponde a

d)

95%

95%

Informao de literatura

e por

2, 58

quando o nvel de conana de

99%.

- toda pesquisa a realizar, em que o objetivo a taxa de prevalncia

de certo fenmeno, apresenta, na literatura, resultados que se pode utilizar para a determinao

24

Captulo 3. Conceitos elementares


do valor de
ou seja,

em relao ao valor de

Chama-se

ao valor complementar de

para

100%,

+ (1 ) = 100%.

Quando na literatura de referncia no se encontra o valor de


consequentemente

e)

considera-se este igual a

50%,

1 = 50%.

Erro de amostragem ou preciso - ao proceder-se s tcnicas de amostragem para determinao


do tamanho amostral (n), entende-se que a amostra obtida representar um determinado valor
para a taxa de prevalncia de certo evento. Normalmente esperada uma diferena em relao
taxa de prevalncia da populao-alvo. A esta diferena chama-se erro de amostragem ou preciso,
a qual, geralmente, arbitrada pelo pesquisador.

3.3.1 Determinao do tamanho amostral para variveis qualitativas


Quando se dispe de variveis nominais ou ordinais, utiliza-se as seguintes frmulas:

n0 =

z 2 (1 )
( p)2

(3.1)

n=

n0
n0
1+
N

(3.2)

em que:

n0 :

amostra inicial;

z:

nvel de conana;

valor obtido de trabalhos anteriores (literatura);

N:

tamanho da populao;

= p:

o erro de preciso arbitrado pelo pesquisador.

Em populaes

nitas

so utilizadas as frmulas (3.1) e (3.2).

innitas, apenas a frmula (3.1) deve ser utilizada.

Para populaes

Dimensionamento da amostra
Exemplo:

25

Com o objetivo de se vericar a incidncia de listeriose

regio, determine o tamanho da amostra, considerando-se


uma prevalncia

()

de 2%,

z = 1, 96

em uma populao de certa

N = 40.000.

e um erro de preciso de

Para este caso, considere

4%.

Soluo:

3.3.2 Determinao do tamanho amostral para variveis quantitativas


Para variveis quantitativas, tem-se:

n0 =

z2 2
2

(3.3)

n=

n0
n0
1+
N

(3.4)

sendo:

a varincia obtida de trabalhos anteriores.

=x
:


o erro de preciso arbitrado pelo pesquisador.

Doena rara, mas muito grave, causada, usualmente, pelo consumo de alimentos contaminados com a bactria

Listeria monocytogenes.

26
Obs.:

Captulo 3. Conceitos elementares


Caso no se disponha de

2 (varincia populacional), realiza-se uma pr-amostragem, retirando-

se, por exemplo, 30 observaes da populao e calcula-se o desvio padro da caracterstica a estudar;
Para populaes nitas, utilizam-se as frmulas (3.3) e (3.4) e, para populaes innitas,
apenas a frmula (3.3) utilizada.

Exemplo:

Numa pesquisa para se determinar a taxa mdia do teor de hemoglobina em fmeas bovinas

da raa Aquitnica, com idade acima de 12 meses, depara-se com o problema de denir-se o tamanho
da amostra. Sem informaes a priori, seleciona-se uma amostra de

30 animais e determina-se o valor

do teor de hemoglobina de cada animal e, a seguir, calcula-se a varincia (captulo 7), cujo valor, por
exemplo, de
preciso de

Soluo:

1, 72 (g/dl)2 .

0, 15 g/dl.

Determine o tamanho da amostra, considerando-se

z = 1, 96

e uma

Dimensionamento da amostra

27

Exerccios
1) Classique cada uma das variveis apresentadas na Tabela 3.2 em qualitativa (nominal ou ordinal)
ou quantitativa (discreta ou contnua).
Tabela 3.2  Dados parciais coletados no Hospital Veterinria da Universidade Estadual de Londrina,
ano 2013.

Sexo

Castrado

Espcie

Peso (kg )

No

Canina

20,0

Londrina

No

Canina

20,0

Londrina

No

Canina

13,0

No

Canina

No

TR

FC

FR

Magro

38,3

124

Normal

28

Londrina

Normal

39,5

100

80

2,5

Londrina

Magro

35,1

132

Canina

11,2

Londrina

Magro

38,9

144

120

No

Canina

11,0

Camb

Magro

39,2

100

40

No

Canina

10,2

Londrina

Normal

38,4

208

No

Canina

10,2

Londrina

Caqutico

39,5

100

32

No

Canina

10,0

Londrina

Normal

39,6

96

32

No

Canina

10,0

Camb

Obeso

39,7

156

36

No

Felina

3,3

Camb

Normal

39,0

220

48

Sim

Felina

2,2

Londrina

Normal

39,6

72

No

Felina

3,5

Londrina

Normal

39,4

208

64

No

Felina

3,3

Londrina

Normal

39,0

96

36

Sim

Felina

2,7

Londrina

Magro

39,2

126

28

No

Felina

6,5

Londrina

Magro

38,6

220

No

Felina

6,5

Londrina

Normal

38,9

184

60

Sim

Felina

5,4

Londrina

Magro

38,8

168

32

No

Felina

5,3

Londrina

38,2

176

68

No

Felina

4,5

Londrina

Magro

38,2

148

60

No

Felina

3,1

Camb

Obeso

39,7

200

40

No

Felina

3,0

Londrina

Normal

38,1

160

46

No

Felina

2,9

Rolndia

Normal

36,5

172

88

No

Felina

Londrina

Normal

37,5

120

56

Considere: TR - temperatura retal (

Cidade

Irmos

EN

C ); FC - frequncia cardaca (bpm); FR - frequncia respi-

ratria (mpm); EN - estado nutricional.

28

Captulo 3. Conceitos elementares

2) Considerando-se as equaes

n0 =

z2 2
2

n=

n0
n0
1+
N

para determinao do tamanho amostral

para variveis quantitativas, mostre passo-a-passo, que o tamanho amostral para populao innita
pode ser expresso pela seguinte equao:

n=

em que

3) Fixe

N
,
N ( )2
1+ 2
z

representa o erro de preciso.

z = 1, 96, s2 = 4

e considere a populao innita.

Complete a Tabela 3.3 do tamanho

amostral (n0 ) em funo do erro de preciso ().


Tabela 3.3  Tamanho amostral e erro de preciso.

=x

n0

3,0
2,0
1,5
1,0
0,5
0,1
0,01

O que voc pode observar da relao acima?

4) Considere os seguintes valores:

= 0, 3

nanceiros, coletar 100 amostras.

z = 1, 96.

O pesquisador s poder, por problemas

Qual o erro de preciso desse experimento?

Demonstre os

clculos passo-a-passo.

5) Refaa o item anterior, considerando-se uma populao de tamanho

N = 1.000.

6) Um pesquisador est interessado em avaliar a temperatura retal (TR, em grau Celsius) de animais domsticos das espcies caninas e felinas, no importando a raa.

Sabe-se, de estudos

anteriores, que a varincia da temperatura retal nestas duas espcies de aproximadamente

1, 1513 o C 2 .

Para isso, ele dispe de uma lista com a relao dos animais atendidos no Hos-

pital Veterinria da Universidade Estadual de Londrina, durante um certo perodo, disponvel em

http://www.uel.br/pessoal/silvano/Veter/Dados/HV.txt.

Dimensionamento da amostra
a) Considerando-se

z = 1, 96

29
0, 3 o C ,

e um erro de preciso de

quantas amostras so necessrias

para a realizao do estudo?


b) importante para o pesquisador coletar amostras de cada espcie. Sendo assim, que tipo de
amostragem ele deve utilizar?
c) Relacione as amostras retiradas. Qual a temperatura retal mdia dos dados? E para cada um
dos estratos?

7) Suponha que um pesquisador tenha diversas gaiolas que contenham, cada uma,

ratos. Qual a

maneira de selecionar 2 ratos de cada gaiola, para uma amostra?

8) Dada uma populao de


sistemtica de

elementos, estabelea trs formas distintas de se obter uma amostra

elementos.

9) Um hematologista deseja fazer uma nova vericao de uma amostra de tamanho


espcimes de sangue analisados por um laboratrio mdico em determinado ms.
ele cria uma estrutura amostral numerando como

001, 002, . . . , 854.

10

dos

854

Para isto,

Use a tabela de nmeros

aleatrios ou a calculadora para escolher que espcimes de sangue sero selecionados? Explique
como selecionou a amostra.

10) Deve-se retirar uma amostra estraticada de tamanho

4.000,

que consiste de 3 estratos de tamanhos

n = 60

de uma populao de tamanho

N1 = 2.000, N2 = 1.200, N3 = 800.

Para que a

alocao seja proporcional, qual deve ser o tamanho da amostra a ser retirada de cada estrato?

11) Os empregados de um hospital tm etiquetas de identicao numeradas consecutivamente de


a

563.

Deve-se escolher um comit de

10

101

pessoas, selecionadas aleatoriamente. Use a tabela de

nmeros aleatrios para escolher os nmeros das etiquetas. Explique como escolheu os nmeros
da tabela aleatria.

Quando todos pensam igual, porque


ningum est pensando.
(Walt Lippman).

Captulo 4

Estatstica Descritiva
4.1 Organizao e apresentao de dados
A apresentao de dados na forma de tabela um dos mtodos estatsticos mais simples
e utilizado. Uma tabela estatstica consegue expor os resultados de determinada pesquisa ou parte
dela, sinteticamente, em que se tem uma viso mais clara e fcil dos resultados obtidos. Ao dispor
os dados em linhas e colunas, distribudos de forma ordenada, segundo regras estabelecidas, tem-se
as tabelas estatsticas.

4.1.1 Elementos essenciais de uma tabela


O objetivo de se construir tabelas obter uma viso geral do que ocorre com os dados
observados, condensando as informaes. Os elementos essenciais de uma tabela so:

a)

Ttulo:

uma indicao que precede a tabela estatstica e que contm a designao do fenmeno

observado, o local e a poca em que ocorreu;

b)

Cabealho:

colocado na parte superior da tabela, tem por nalidade especicar o contedo das

colunas;

c)

Corpo:

corresponde ao conjunto de colunas e de linhas que contm, respectivamente, em ordem

vertical e horizontal, informaes sobre o fenmeno estudado.

Chama-se casa (ou casela) ao

cruzamento de uma coluna com uma linha. As casas nunca devero car em branco, contendo
sempre um nmero ou um sinal convencional:

i)  (trao), quando o dado no existe;


30

Organizao e apresentao de dados


ii)
iii)

...
0

31

(trs pontos), quando a informao existe mas no est disponvel;

(zero), quando o valor numrico for menor que a metade da unidade de medida adotada

para expressar os dados;


iv) X (letra x), quando o dado for omitido a m de evitar a individualizao das informaes, nos
casos onde existe apenas um ou dois informantes.

d)

Coluna indicadora:

a parte da tabela que tem por nalidade especicar o que contm as linhas;

Toda tabela dever ter identicao feita com algarismos arbicos, de modo crescente,
precedidos da palavra

Tabela,

podendo ser subordinada ou no a captulos ou sees de um docu-

mento.
A Tabela 4.1 um exemplo sobre a maneira de se resumir e apresentar dados coletados,
relativos uma pesquisa ou experimento.
Tabela 4.1  Animais atendidos no Hospital Veterinrio (HV) da Universidade Estadual de Londrina
(UEL), no ano de 2005.

Categoria dos animais

Frequncias

Pequeno porte

20.650

Mdio porte

12.300

Pequeno porte
Total

5.700
38.650

Fonte: HV da UEL.
Na Tabela 4.1, o ttulo :

Animais atendidos no Hospital Veterinrio da Universidade Estadual de Londrina, no ano


de 2005.
O cabealho constitudo por:

Categorias dos animais


A coluna indicadora contm as especicaes:

Pequeno porte
Mdio porte
Grande porte

Frequncias

32

Captulo 4. Estatstica Descritiva

O corpo da tabela formado por:

20.650
12.300
5.700

4.1.2 Elementos complementares de uma tabela


Os elementos complementares de uma tabela estatstica so os seguintes: fonte, notas e
chamadas, que de preferncia so colocados no rodap.
a)

Fonte:

a indicao do rgo ou entidade responsvel pelo fornecimento dos dados ou pela sua

elaborao. colocada no rodap da tabela;

b)

Notas:

so informaes destinadas a esclarecer ou conceituar o contedo das tabelas, ou indicar a

metodologia adotada na coleta ou preparo dos dados. Devem ser colocadas embaixo da indicao
da fonte;

c)

Chamadas:

so informaes de natureza especca referindo-se a um item especco da tabela,

colocada aps a nota. Devem ser feitas atravs de algarismos arbicos escritos entre parnteses,
e colocados direita da coluna;
A Tabela 4.2 um exemplo sobre a maneira de se resumir e apresentar dados coletados,
relativos uma pesquisa ou experimento.
alunos do

1o

Os dados foram coletados no Hospital Veterinrio por

ano do curso de Medicina Veterinria da Universidade Estadual de Londrina, em pesquisa

realizada em 2002.
Tabela 4.2  Espcies de animais atendidos no Hospital Veterinrio da Universidade Estadual de Londrina. Londrina - Paran, 2002.

Espcies

Percentual (%)

Canina

85,00

Felina

11,07

Equina

2,50

Bovina

0,71

Lagarto

0,36

Roedor

0,36

Fonte: Hospital Veterinrio da Universidade Estadual de Londrina.


Nota: Utilizou-se uma amostragem sistemtica para selecionar as chas dos animais.

Distribuio de frequncias

33

Observaes:
As tabelas so constitudas por trs traos horizontais paralelos, um para separar o topo, outro
para separar o cabealho e o terceiro para o rodap. No so usados traos verticais para separar
os dados;

Devem ser identicadas na parte superior iniciada com a palavra Tabela e seu nmero de ordem,
em algarismos arbicos seguidos de hfen, separando o ttulo.

As tabelas devem ser numeradas consecutivamente ou identicadas com nmeros relacionados ao


captulo ou seo nas quais esto inseridas e seu nmero de ordem. Exemplo: vide Tabela 4.2.

No caso da tabela ter de ocupar mais de uma pgina, no ser delimitada na parte inferior e
o cabealho ser repetido na pgina seguinte.

Nesse caso, usa-se no cabealho, ou na coluna

indicadora, a expresso continua ou concluso, conforme o caso.

Quando no for possvel dispor a tabela na posio normal de leitura, ela dever ser apresentada
de forma que a rotao se efetue no sentido horrio.

4.2 Distribuio de frequncias


Uma maneira de sintetizar os dados atravs de distribuio de frequncias, que consiste
na construo de uma tabela a partir dos dados brutos em que se considera a frequncia com que
cada observao ocorre. A interpretao dos resultados obtidos em tabelas de frequncias pode ser
auxiliada pela anlise grca.

4.2.1 Construo de uma distribuio de frequncia de variveis discretas


Quando a varivel resposta do tipo quantitativa discreta, para se apresentar os dados
em forma de tabela, basta escrever em uma coluna os valores da varivel discreta estudada em ordem
crescente (ou decrescente) e assinalar, em outra coluna paralela, o nmero de vezes que cada um
desses valores foi observado, isto , a frequncia absoluta de cada valor. Uma terceira coluna ser
destinada a indicar a frequncia relativa com que cada um desses valores ocorreram na amostra. A
tabela assim obtida denominada tabela de distribuio de frequncias.

Exemplo 1 -

Os dados a seguir referem-se ao nmero de lhotes de cadelas submetidas insemi-

nao articial, no Hospital Veterinrio da UEL, em 2005. Os seguintes nmeros de lhotes foram

34

Captulo 4. Estatstica Descritiva

observados:

Dados Brutos:

Quando os dados esto dispostos sem qualquer ordem lgica, recebem o nome de dados brutos.
Ao organizarmos os dados brutos, em ordem crescente ou decrescente de grandeza,
obtemos o rol:

Rol:

Pode-se obter como informaes pelo rol:

Li :

limite inferior do rol,

Ls :

limite superior do rol,

A:

amplitude

total

Li = 0;

dos

Ls = 5;
dados,

que

diferena

entre

maior

menor

valor

do

rol

A = Ls Li = 5 0 = 5.
Uma tabela de distribuio de frequncia pode ser construda, tanto a partir dos dados
brutos como do rol. Para o exemplo em questo, tem-se:
Tabela 4.3  Nmero de lhotes de cadelas submetidas a inseminao articial no Hospital Veterinrio
da UEL em 2005.
Nmero de Filhotes

Frequncia Absoluta (fi )

Frequncia relativa (fr %)

3,33

13,33

20,00

10

33,34

23,33

6,67

Fonte: Hospital Veterinrio da UEL.


Para obter-se as frequncias relativas,

fr , divide-se cada frequncia absoluta pelo tamanho

da amostra:

fr =

fi
.
n

Essas frequncias relativas costumam ser expressas em porcentagens:

fr % =

fi
100.
n

Distribuio de frequncias

35

Evidentemente a soma das frequncias absolutas igual ao nmero total das cadelas que foram
submetidas inseminao articial.
Para se construir a Tabela 4.3, usando o

R, os comandos so:

Filhotes = c(5,4,3,4,3,1,4,4,5,3,0,1,3,2,2,3,2,3,4,2,3,3,1,1,3,3,4,2,4,2)
(filhotes.caes = table(Filhotes))
(percentual.caes = round(100*prop.table(filhotes.caes), dig=2))
(tabela.filhotes = cbind(filhotes.caes, percentual.caes))
colnames(tabela.filhotes) = c(`Freq. Absoluta', `Percentual')
tabela.filhotes

4.2.2 Construo de uma distribuio de frequncia para variveis contnuas


Ao contrrio das variveis discretas, as variveis contnuas assumem, em geral, muitos
valores.

Isto quer dizer que se usssemos as tabelas de frequncias, como no caso das variveis

discretas teramos uma tabela com muitas linhas, tornando-a pouco operacional.
este problema usa-se descrever as variveis numricas contnuas atravs de

Para contornar

tabelas de classes de

frequncias ou tabelas de intervalo.


Considere os seguintes dados, referentes aos pesos

(kg)

de ces das raas Fila brasileiro

e Pastor Alemo, coletados no Hospital Veterinrio da UEL em 2003.

Dados Brutos
5,5

19,0

28,0

30,0

33,0

40,0

40,0

40,3

40,5

12,6

12,6

14,2

14,2

17,5

17,5

18,0

19,0

19,2

21,0

21,0

27,0

27,0

27,0

27,2

28,0

28,0

30,0

30,0

39,8

13,5

O que se pode dizer sobre os ces com base nestes dados? possvel ter uma ideia clara,
apenas observando os nmeros? O passo seguinte, optativo, poderia ser a obteno do rol:

Rol
5,5

12,6

12,6

13,5

14,2

14,2

17,5

17,5

18,0

19,0

19,0

19,2

21,0

21,0

27,0

27,0

27,0

27,2

28,0

28,0

28,0

30,0

30,0

30,0

33,0

39,8

40,0

40,0

40,3

40,5

36

Captulo 4. Estatstica Descritiva


Qual o nmero de classes a ser usado?

O nmero ideal de classes a ser utilizado em

uma tabela, pode depender mais do bom senso do pesquisador, de acordo com seus interesses e
necessidades, do que de regras pr-estabelecidas. Um exemplo disso a Tabela 4.4 que mostra os

cios observados, segundo a classicao de Gaines .

Tabela 4.4  Frequncias dos intervalos entre cios observados em um rebanho leiteiro da raa Holands, segundo a classicao de Gaines (1994).

Intervalos entre cios (dias)

Percentual (%)

0 3

0,1

4 17

6,3

18 24

44,6

25 35

5,8

36 48

16,3

> 48

27,0

Caso no haja, por parte do pesquisador, um motivo para o uso de intervalos de classes
diferentes, pode-se optar pela utilizao de uma das regras para se construir os intervalos de classes.
Dentre as vrias regras existentes, duas tem sido adotadas:

a)

Critrio de Sturges - Herbert Sturges2 considera um histograma de frequncias idealizado com k


divises, sendo que a i-sima diviso dada pelo coeciente binomial
Quando

(k1)
i

, i = 0, 1, . . . , k 1.

aumenta, este histograma se aproxima da forma de uma densidade normal. O tamanho

amostral total dado por:

n=

)
k1 (

k1
i=0

= (1 + 1)k1 = 2k1

Gaines, J.D. Proceedings for annual meeting. Kansas City: Society for Theriogenology, 1994.

ductive eciency of dairy herds : p.86-107.


Sturges, H. The choice of a class-interval. J. Amer. Stat. Association, 21, 6566, 1926.

Analysis of repro-

Distribuio de frequncias

37

Aplicando-se logaritmos em ambos os membros, tem-se:

log2 n = log2 2k1


log2 n = k 1
k = 1 + log2 n
e, fazendo-se transformao da base logartmica, chega-se a:

k = 1+

log10 n
log10 n
=1+
log10 2
0, 301029

k = 1 + 3, 3 log n

que o nmero de classes sugeridas, por este critrio;

b)

Critrio da Raiz Quadrada - tem-se k = n.


Outras regras para escolha do nmero de classes de um histograma so sugeridas na

literatura. Para o exemplo em questo, o nmero de classes recomendado ser dado por:

k = 1 + 3, 3 log 30
= 1 + 3, 3 1, 4771

ou

k=

30 = 5, 4772.

= 5, 8745
Logo, sero utilizadas, aproximadamente,

k=6

classes ou intervalos para representar a

distribuio dos dados. A amplitude de cada intervalo ser:

a =

amplitude total
nmero de classes

40, 5 5, 5
= 5, 9579.
5, 8745

Assim, os dados podero ser resumidos em 6 classes de amplitude

a = 6 kg

como amplitude das

classes.
A primeira classe de frequncias um intervalo do tipo

(l + 2a)

e assim sucessivamente.

l (l + a),

a segunda

(l + a)

Com este tipo de notao estamos indicando que o intervalo

fechado esquerda e portanto pertencem classe valores iguais ao extremo inferior dessa classe.
Tambm estamos indicando que o intervalo aberto direita e portanto no pertencem classe
valores iguais ao extremo superior.

38

Captulo 4. Estatstica Descritiva

Assim, tem-se:
Tabela 4.5  Distribuio de frequncia dos pesos

(kg)

de 30 ces das raas Fila Brasileiro e Pastor

Alemo, coletados no Hospital Veterinrio da UEL, em 2003.

Pesos (kg )

Frequncias absolutas (fi )

Ponto mdio

Frequncias relativas (fr %)

11

3,33

11

17

14

16,67

17

23

20

26,67

23

29

26

23,33

29

35

32

13,33

35

41

38

16,67

Fonte: Hospital Veterinrio da UEL


A construo da Tabela 4.5 simplicou muito a interpretao dos dados, com apenas seis
classes (linhas) conseguiu-se condensar os

30 dados.

Com uma rpida olhada na tabela j se nota que

a maioria dos ces concentram-se nas classes centrais, ou seja, entre

17

29

quilos, havendo poucos

animais nas classes extremas. No entanto isto tem um preo, por exemplo, tudo que se sabe agora
que apenas um valor est entre

5, 0

11, 0 kg ,

cinco valores esto entre

11, 0

17, 0 kg ,

e assim

por diante. Mas no se sabe quais so esses valores. Dessa forma, como no se conhece os dados
originais, como acontece muitas vezes em certas publicaes cientcas, deve-se utilizar o ponto mdio
da classe, como um valor representativo. Assim, tudo se passa como se os dados originais fossem
constitudos por um valor igual a

20, 0 kg ,

8 kg ,

por cinco valores iguais a

14, 0 kg ,

por oito valores iguais a

etc.
Para estruturar a tabela de frequncias usando o

R, basta utilizar o comando:

caes = c(5.5,19.0,28.0,30.0,33.0,40.0,40.0,40.3,40.5,12.6,
12.6,14.2,14.2,17.5,17.5,18.0,19.0,19.2,21.0,21.0,
27.0,27.0,27.0,27.2,28.0,28.0,30.0,30.0,39.8,13.5)
hist(caes, plot=F, breaks=c(5,11,17,23,29,35,41), right=F)

Caso queira construir a tabela da forma exata como apresentado na Tabela 4.5,
acrescente os seguintes comandos:

Distribuio de frequncias

39

histo = hist(caes, plot=F, breaks=c(5,11,17,23,29,35,41), right=F)


histo.caes = cbind(c(histo$counts))
(prop = 100*round(prop.table(histo.caes), 4))
tab.caes = cbind(histo.caes, prop)
colnames(tab.caes) = c('fi', 'Percentual')
rownames(tab.caes) = c('5|-11','11|-17','17|-23','23|-29','29|-35','35|-41')
tab.caes

Exemplo:

Dados brutos de rao

(kg)

utilizada em 40 dias em uma granja.

Dados Brutos (kg )


0,71

2,63

3,63

1,94

3,69

2,77

1,42

2,48

3,77

2,75

2,04

2,16

4,05

1,80

2,22

2,06

1,20

1,67

5,41

1,57

3,09

2,16

3,94

2,06

3,55

3,56

3,57

2,39

2,48

1,53

2,67

2,18

3,93

3,34

2,78

3,26

3,06

3,32

3,37

0,75

i) Encontre o nmero de classes para a construo de uma tabela para estes dados;

Soluo:

ii) Encontre a amplitude total dos dados;

Soluo:

iii) Encontre a amplitude das classes;

Soluo:

40

Captulo 4. Estatstica Descritiva

iv) Dena os limites inferior e superior de cada classe:

Soluo:

v) Construa a tabela com as frequncias simples e acumuladas.

Soluo:

4.3 Tabelas de dupla entrada


Um tipo de tabela muito importante e bastante utilizada a tabela de dupla entrada,
em que os elementos da amostra ou da populao so classicados de acordo com dois fatores, sendo
cada entrada relativa a um dos fatores. Exemplos so apresentados nas Tabelas 4.6 e 4.7. Os dados
apresentados na Tabela 4.7 foram obtidos na pgina do Instituto Brasileiro de Geograa e Estatstica - IBGE,

http://www.ibge.gov.br/estadosat/temas.php?sigla=rs&tema=pecuaria2012,

acessada em 05 de fevereiro de 2014.


Tabela 4.6  Acasalamentos fecundos e infecundos por raa.

Acasalamentos

Raas

Fecundos

Infecundos

Charolesa

606

394

Indubrasil

508

632

Nelore

394

406

Fonte: Fictcia

Tabelas de dupla entrada

41

Tabela 4.7  Nmero de cabeas da produo pecuria dos estados do Sul do Brasil em 2012.

Estados

Pecuria

Totais

Paran

Santa Catarina

Rio Grande do Sul

Bovinos

9.413.937

4.072.960

14.140.654

27.627.551

Sunos

5.518.927

7.480.183

6.213.316

19.212.426

Ovinos

638.923

307.651

4.095.648

5.042.222

Equinos

325.837

122.565

468.691

917.093

Caprinos

176.130

57.243

100.283

333.656

Bubalinos

24.502

13.898

74.792

113.192

Muares

39.132

1.965

2.888

43.985

1.710

925

1.747

4.382

16.139.098

12.057.390

25.098.019

53.294.507

Asininos
Totais

Fonte: IBGE - 2012.


Para construir a Tabela 4.7, utilizando os dados diretamente do site do IBGE, bastam os seguintes
comandos do

R:

pec_pr = read.csv2('http://www.ibge.gov.br/estadosat/download/pr_pecuaria2012.csv',
sep=';', head=F)
pr = data.frame(pec_pr[1:8, -3])
pec_sc = read.csv2('http://www.ibge.gov.br/estadosat/download/sc_pecuaria2012.csv',
sep=';', head=F)
sc = data.frame(pec_sc[1:8, -3])
pec_rs = read.csv2('http://www.ibge.gov.br/estadosat/download/rs_pecuaria2012.csv',
sep=';', head=F)
rs = data.frame(pec_rs[1:8, -3])
rebanhos = data.frame(PR=pr, SC=sc[ , 2], RS=rs[ , 2])
pecuaria = data.frame(rebanhos[with(rebanhos, order(-RS)), ])
names(pecuaria) = c('Pecuria', 'Paran', 'Santa Catarina', 'Rio Grande do Sul')
require(xtable)
xtable(pecuaria)

Captulo 5

Grcos
O objetivo da representao grca apresentar de maneira clara, rpida e objetiva os
dados coletados na primeira fase do trabalho estatstico. Um grco tem a funo de transmitir uma
idia visual do comportamento de um conjunto de valores, de forma a se poder tirar concluses claras
de tabelas complicadas.

Ele tanto serve para simplicar como pode facilmente enganar.

Existem

algumas regras para a confeco de grcos, dadas a seguir:

a) toda representao grca deve ter ttulo, escala e fonte dos dados, de forma a dispensar qualquer
esclarecimento adicional;

b) a numerao dos grcos feita utilizando-se algarismos arbicos;

c) a primeira srie de variveis dever car no eixo das abscissas (X ). Consequentemente, a segunda
no eixo das ordenadas (Y );

d) as escalas devem crescer da esquerda para a direita e de baixo para cima;

e) as legendas explicativas devem ser colocadas, de preferncia, direita do grco.

f ) as distncias que indicam as unidades de escala devem ser rigorosamente uniformes;

g) ao lado da escala da abscissa deve ser escrita a caracterstica relativa mesma. Em cima da escala
da ordenada deve constar a caracterstica correspondente. A razo da altura para a largura pode
variar de 60% a 80% para que a gura tenha boas propores (simetria e equilbrio);

Existem inmeras formas grcas interessantes, sero apresentados apenas alguns tipos
de grcos.
42

Apresentao grca de variveis qualitativas

43

5.1 Apresentao grca de variveis qualitativas


5.1.1 Grco em colunas
O grco em colunas e em barras consistem em construir retngulos, em que uma das
dimenses proporcional magnitude a ser representada
igual para todas as colunas ou barras.

(ni

ou

fi ),

sendo a outra arbitrria, porm

Essas colunas so dispostas paralelamente umas s outras,

horizontal ou verticalmente. Alm do ttulo e fonte de referncias devemos observar o seguinte:

a) as barras devem ter todas a mesma largura;

b) a distncia entre as barras deve ser constante e de preferncia menor que a largura das barras.

Considere o

grco em colunas apresentado na Figura 5.1:


120

100

Frequncias

80

60

40

20

0
Pinscher

Pastor
Alemo

Poodle

Rottweiller

SRD

Outros

Raas dos Ces

Figura 5.1  Raas caninas atendidas no Hospital Veterinrio da Universidade Estadual de Londrina
em 2003.

O programa

para construir o grco de colunas dos dados absolutos dado por:

caes = c(37, 20, 19, 16, 75, 103)


names(caes) = c("Pinscher","Pastor \n Alemo","Poodle","Rottweiller","SRD","Outros")
par(mai=c(1,1,.2,.2))
barplot(caes, ylim=c(0, 120), space=0.6, xlab="Raas dos Ces", ylab="Frequncias",
col="LightYellow", las=1, cex.axis=1, cex.names=1, cex.lab=1)
abline(h=0, lwd=1)

44

Captulo 5. Grcos
Nem sempre interessante utilizar os dados absolutos no eixo das ordenadas. de uso

mais frequente apresent-la utilizando-se a porcentagem. A Figura 5.2 apresenta os mesmos dados
utilizados na Figura 5.1, s que transformando os valores absolutos em porcentagem.

40

Percentuais (%)

30

20

10

0
Pinscher

Pastor
Alemo

Poodle

Rottweiller

SRD

Outros

Raas dos Ces

Figura 5.2  Percentual de raas caninas atendidas no Hospital Veterinrio da Universidade Estadual
de Londrina em 2003.

Observe o clculo das porcentagens nos comandos do

R:

caes = c(37, 20, 19, 16, 75, 103)


names(caes) = c("Pinscher","Pastor \n Alemo","Poodle","Rottweiller","SRD","Outros")
caes.prop = round(100*prop.table(caes), 2)
par(mai=c(1,1,.2,.2))
barplot(caes.prop, ylim=c(0, 40), space=0.6, las=1, xlab="Raas dos Ces",
ylab="Percentuais (%)", col="LightYellow", cex.axis=1, cex.names=1, cex.lab=1)
abline(h=0, lwd=1)

Observe que neste caso, so fornecidos os totais observados para cada categoria. Caso
o grco fosse construdo a partir de um banco de dados, seria necessrio tabular os valores de cada
categoria primeiro. Considere os dados dos pers dos alunos do curso de Medicina Veterinria do ano
de 2011. Na Figura 5.3 so apresentados os resultados para a cor dos olhos, em porcentagem.

Apresentao grca de variveis qualitativas

45

80

Percentual (%)

60

40

20

0
Castanhos

Verdes

Azuis

Pretos

Cor dos olhos

Figura 5.3  Cor dos Olhos dos alunos do 1 ano do curso de Medicina Veterinria da Universidade
Estadual de Londrina em 2011.

O programa

para construir o grco de colunas percentual a partir de um banco de dados dado

por:

rm(list=ls())
require(foreign)
perfil = read.epiinfo('http://www.uel.br/pessoal/silvano/Veter/Dados/Perfil2011.rec')
names(perfil) ; attach(perfil)
(tab.olhos = table(Q6))
names(tab.olhos) = c('Azuis','Castanhos','Pretos', 'Verdes')
barplot(tab.olhos, xlab="Cor dos olhos", ylab="Frequncias", col="LightYellow", las=1)
abline(h=0, lwd=1)
#------------------------------------# Ordenando por valores decrescentes #------------------------------------(tab.olhos.ord = sort(tab.olhos, decreasing = T))
barplot(tab.olhos.ord, xlab="Cor dos olhos", ylab="Frequncias",
col="LightYellow", las=1)
abline(h=0, lwd=1)
#---------------------------# Utilizando os percentuais #----------------------------

46

Captulo 5. Grcos

par(mai=c(1,1,.15,.2))
barplot(100*prop.table(tab.olhos.ord), ylim=c(0,80), xlab="Cor dos olhos",
ylab="Percentual (%)", col="LightYellow", las=1, space=0.7)
abline(h=0, lwd=1)

Quando os rtulos dos eixos (atributo) da varivel so longos, pode-se optar pelo grco
de barras.

5.1.2 Grco em barras


Considerando o mesmo conjunto de dados dos ces, utilizados na construo do grco
de colunas, pode-se construir o

grco em barras que apresentado na Figura 5.4.

Outros

SRD

Raas dos Ces

Pinscher

Pastor
Alemo

Poodle

Rottweiller

20

40

60

80

100

120

Frequncias

Figura 5.4  Raas caninas atendidas no Hospital Veterinrio da Universidade Estadual de Londrina
em 2003.

Observar que, em termos de programao


grco de barras o comando

horiz=T

R,

o que diferencia o grco de colunas do

e a denio dos limites para o eixo

X.

Apresentao grca de variveis qualitativas

47

caes = c(37, 20, 19, 16, 75, 103)


names(caes) = c("Pinscher", "Pastor \n Alemo", "Poodle", "Rottweiller", "SRD", "Outros")
(caess = sort(caes, decreasing=F))
names(caess) = c('Rottweiller','Poodle','Pastor \n Alemo',
'Pinscher','SRD','Outros')
par(mar=c(4.5, 6.7, 1, 1), mgp=c(5.5, .5, 0))
barplot(caess, las=1, horiz=T, space=.7, col="LightYellow", ylab="Raas dos Ces",
xlab="", bty='l', xlim=c(0,120), cex.axis=1, cex.names=1)
mtext("Frequncias", side=1, line=2)
abline(v=0)

5.1.3 Grco em colunas justapostas


Quando uma das variveis qualitativas tem mais de um nvel, uma forma de apresentao
comumente usada atravs do grco de colunas justapostas, que consiste em colocar lado-a-lado
os nveis da variveis.
Considere os dados apresentados na Tabela 4.7. Vamos comparar o nmero de cabeas
da produo pecuria dos estados do sul do Brasil, levando em considerao apenas as duas maiores
produes, que so os bovinos e sunos. A comparao apresentada na Figura 5.5.

1500

Bovinos
Sunos

Nmero de cabeas
(x 10.000)

1000

500

0
Rio Grande do Sul

Paran

Santa Catarina

Estados

Figura 5.5  Produo pecuria dos estados do sul do Brasil no ano de 2012.

48

Captulo 5. Grcos
Os comandos do

para construo do grco de colunas justapostas so dados por:

rm(list=ls())
cabecas=c(14140654, 9413937, 4072960,
6213316, 5518927, 7480183,
4095648, 638923, 307651,
468691, 325837, 122565,
100283, 176130, 57243,
74792, 24502, 13898,
2888, 39132,
1965,
1747,
1710,
925)/10000
(dados = matrix(cabecas, nrow=8, byrow=T))
rownames(dados) = c('Bovinos','Sunos','Ovinos','Equinos','Caprinos',
'Bubalinos','Muares','Asininos')
colnames(dados) = c('Rio Grande do Sul','Paran','Santa Catarina')
dados
#----------------------------# Apenas Bovinos e Sunos #----------------------------(parte = dados[1:2, 1:3])
par(mai=c(1, 1.2, .2, .2))
ylim = range(0, 1600, by=300)
barplot(parte, beside=T, col = c("lightgreen", "lightblue"), ylim=ylim,
angle=c(90, 0), xlab="Estados", ylab='', las=1)
legend(7, 1400, angle=c(90,0), legend=rownames(parte), bty='n',
fill=c('lightgreen','lightblue'), cex=1)
mtext('Nmero de cabeas \n (x 10.000)', side=2, line=4)
abline(h=0)

5.1.4 Grco em colunas compostas


Pode-se comparar os nveis de uma varivel dentro de cada categoria em uma nica
coluna. Esta forma de apresentao atravs do grco de colunas compostas apresentado na Figura
5.6.
Considere os dados apresentados na Tabela 4.7. Vamos comparar o nmero de cabeas
da produo pecuria dos estados do sul do Brasil, levando em considerao apenas as duas maiores
produes, que so os bovinos e sunos. A comparao apresentada na Figura 5.6.

Apresentao grca de variveis qualitativas

49

2000
Bovinos
Sunos

Nmero de cabeas
(x 10.000)

1500

1000

500

0
Rio Grande do Sul

Paran

Santa Catarina

Estados

Figura 5.6  Produo pecuria dos estados do sul do Brasil no ano de 2008.

Os comandos do

para construo do grco de colunas compostas so dados por:

cabecas=c(14115643, 9585600, 3864724, 5320252, 4631600, 7846398, 4009938, 579764,


4009938, 579764, 256965, 454938, 393544, 101943, 94545, 167382, 55995,
70868, 27918, 23295, 3867, 44684, 2182, 1600, 1988, 708)/10000
(dados = matrix(cabecas, nrow=8, byrow=T))
rownames(dados) = c('Bovinos', 'Sunos', 'Ovinos', 'Equinos', 'Caprinos',
'Bubalinos', 'Muares', 'Asininos')
colnames(dados) = c('Rio Grande do Sul','Paran','Santa Catarina')
(parte = dados[1:2,1:3])
par(mai=c(1,1,.2,.2))
ylim = range(0, 2000, by=200)
barplot(parte, beside=F, las=1, col=c("green", "blue"), ylim=ylim, angle=c(90,0),
density=c(15,15), xlab="Estados", ylab="Nmero de cabeas \n (x 10.000)")
legend(2.8, 2000, angle=c(90,0), legend=rownames(parte), bty='n', density=c(20,20),
fill=c('green','blue'), cex=1)
abline(h=0)

50

Captulo 5. Grcos

5.1.5 Grco em setores circulares


uma forma adequada de se visualizar a proporo que cada categoria representa em
relao ao total dos dados, permitindo comparaes entre as categorias. Constitui-se num crculo no
qual so destacados,

setores circulares, cada qual com rea proporcional frequncia do i-simo

valor assumido pela varivel.

n
f

Tomando-se os dados da Tabela

360o

io

fi

360
fi .
n

??, tem-se v = 3, desse modo, o crculo ser dividido em trs setores

circulares. Assim, o nmero total de observaes,


e a frequncia

io =

corresponde ao ngulo

io .

n = 38.650,

corresponde ao total dos graus,

360o

Assim, tem-se:

1o =

360
360
20.650 = 192, 34o 2o =
12.300 = 114, 57o
38.650
38.650

3o =

360
5.700 = 53, 09o
38.650

Figura 5.7  Categoria dos animais atendidos no Hospital Veterinrio da Universidade Estadual de
Londrina, no ano de 2005.

O programa

para construo do grco de setores dado por:

anim = c(650, 230, 70)


names(anim) = paste(c("Pequeno Porte", "Mdio Porte", "Grande Porte"),

Apresentao grca de variveis qualitativas

51

round(100*anim/sum(anim), dig=1), "%")


pie(anim, col=c("LightYellow","white", "green"),
cex=1.3, border="red", clockwise=F)
Caso se queira incluir os nomes das categorias dentro do grco, bastam os seguintes comandos:

#--------------------------------------# Incluindo os nomes dentro do grfico #--------------------------------------par(mar=c(1, 1, 1, 1))


pie(anim, labels=`', col=c("LightYellow", "white", "green"), radius=1)
text(0, .5, "Pequeno Porte \n (68,4%)", col= "black", cex=.9)
text(0.2, -.5, "Mdio Porte \n (24,2%)", col= "black", cex=.9)
text(0.7, -.15, "Grande Porte \n (7,4%)", col= "black", cex=.9)
O resultado apresentado na Figura 5.8.

Pequeno Porte
(68,4%)

Grande Porte
(7,4%)

Mdio Porte
(24,2%)

Figura 5.8  Categoria dos animais atendidos no Hospital Veterinrio da Universidade Estadual de
Londrina, no ano de 2005.

52

Captulo 5. Grcos

5.1.6 Grco em setores retangulares


Uma forma interessante de apresentao grca do relacionamento entre duas variveis
qualitativas utilizando o grco de setores retangulares.
A Figura 5.9 mostra o sentimento das pessoas em relao tolerncia ao cigarro. Os
dados so apresentados no livro de Magalhes & Pedroso e integram as informaes de um questionrio
estudantil.
Indiferente

14 %

Incomoda muito

Incomoda pouco

32 %

28 %

Gnero

Feminino

Masculino

6 %

14 %
6 %

Tolerncia ao Cigarro

Figura 5.9  Relao entre tolerncia ao cigarro e gnero dos estudantes.

O programa

para construo do grco de setores dado por:

pedroso = read.table("http://www.uel.br/pessoal/silvano/Veter/Dados/questionario.txt",
head=T, dec=".", sep="")
attach(pedroso)
Sexo = factor(Sexo, label=c("Feminino", "Masculino"))
Toler = factor(Toler, label=c("Indiferente", "Incomoda muito", "Incomoda pouco"))
dupla.ent.p = round(100*prop.table(table(Toler, Sexo)), 2)
par(mar=c(3.1, 2.7, 1, 1), cex.lab=1.2, col.lab='black')
plot(dupla.ent.p, col="LightYellow", xlab="Tolerncia ao Cigarro", ylab='Gnero',
main='', las=1, cex.axis=1.1)
text(.25, .65, paste(dupla.ent.p[1,1],'%', sep=' '), col= "red", cex=1.1)
text(.49, .65, paste(dupla.ent.p[2,1],'%', sep=' '), col= "red", cex=1.1)
text(.82, .65, paste(dupla.ent.p[3,1],'%', sep=' '), col= "red", cex=1.1)
text(.25, .12, paste(dupla.ent.p[1,2],'%', sep=' '), col= "blue", cex=1.1)

Apresentao grca de variveis discretas

53

text(.49, .05, paste(dupla.ent.p[2,2],'%', sep=' '), col= "blue", cex=1.1)


text(.83, .12, paste(dupla.ent.p[3,2],'%', sep=' '), col= "blue", cex=1.1)

5.2 Apresentao grca de variveis discretas


Para variveis quantitativas discretas, a representao grca pode ser feita utilizando-se
o grco de basto.

5.2.1 Grco em basto


Este grco constitudo de linhas verticais ou horizontais traadas num eixo de coordenadas cartesianas. Na Figura 5.10 apresentado o grco de basto relativo aos dados da Tabela 4.3.

10

Freqncias

0
0

Nmero de Filhotes

Figura 5.10  Nmero de lhotes de cadelas submetidas a inseminao articial no Hospital Veterinrio da UEL em 2003.

O programa

para construo do grco de basto dado por:

Filhotes = c(5, 4, 3, 4, 3, 1, 4, 4, 5, 3, 0, 1, 3, 2, 2, 3,
2, 3, 4, 2, 3, 3, 1, 1, 3, 3, 4, 2, 4, 2)
sort(Filhotes)
(tab.cad = table(Filhotes))
par(mai=c(1,1,.2,.3),mgp=c(3, 1, 0))

54

Captulo 5. Grcos

plot(tab.cad, xlab="Nmero de Filhotes", ylab="Frequncias",


col="red", lwd=2, type="h", bty="l", cex.axis=1.3, las=1)
abline(h=0)

5.3 Apresentao grca de variveis contnuas


A representao grca de dados relativos a uma varivel contnua, dispostos em uma
tabela de classes de frequncias, pode ser feita atravs de um histograma ou polgono de frequncias.

5.3.1 Histograma
uma sequncia de retngulos justapostos, em que cada retngulo tem como base a
amplitude do intervalo e como altura as respectivas frequncias (absoluta ou relativa). A Figura 5.11
mostra a distribuio do nmero de atendimentos dirios, do Hospital Veterinrio, da Universidade
Estadual de Londrina, nos ltimos 50 dias.

20

Frequncias

15

10

0
12

18

24

30

36

42

48

54

Nmero de atendimentos

Figura 5.11  Nmero de atendimentos dirios, do Hospital Veterinrio, da Universidade Estadual de


Londrina, nos ltimos 50 dias.

Pode-se notar que a distribuio dos dados aproximadamente simtrica e no apresenta


grande variabilidade e, ainda, que o nmero de atendimentos dirios mais comum est entre 30 e 36

Apresentao grca de variveis contnuas

55

atendimentos/dia.
O programa

para construo do grco de basto dado por:

atend=c(49,39,42,43,45,22,23,24,25,23,32,30,31,32,33,12,15,16,19,20,18,30,31,32,33,
33,26,26,27,28,28,27,33,30,31,32,33,29,29,27,28,41,39,38,35,37,35,34,36,36)
par(mai=c(1, 1, .2, .2))
hist(atend, breaks=c(12,18,24,30,36,42,48,54), freq=T, right=F, col="red", main="",
ylim=c(0,20), las=1, xaxt="n", xlab='', ylab='Frequncias', border="blue", density=10)
mtext('Nmero de atendimentos', side=1, line=2) ; abline(h=0)
axis(1, at = c(12,18,24,30,36,42,48,54), line=-1)

Obs.:

Caso queira acrescentar os valores observados no grco, basta acrescentar o comando

labels=T.

5.3.2 Polgono de frequncias


Pode ser usado como alternativa para o histograma. Para se traar o polgono de frequncias,
une-se os pontos cujas abscissas so os pontos mdios das classes e as ordenadas so as respectivas frequncias.
Depois para fechar o polgono unimos os extremos da gura com o eixo das abscissas, nos pontos em que
estariam os pontos mdios de uma classe imediatamente inferior primeira e de uma classe imediatamente
superior ltima.

20

Frequncias

15

10

0
9

15

21

27

33

39

45

51

57

Pontos Mdios

Figura 5.12  Nmero mdio de atendimentos dirios, do Hospital Veterinrio, da Universidade Estadual de Londrina, nos ltimos 50 dias.

Os comandos do

para construo do polgono de frequncias so dados por:

56

Captulo 5. Grcos

atend=c(49,39,42,43,45,22,23,24,25,23,32,30,31,32,33,12,15,16,19,20,18,30,31,32,33,
33,26,26,27,28,28,27,33,30,31,32,33,29,29,27,28,41,39,38,35,37,35,34,36,36)
(histo = hist(atend, breaks=c(12,18,24,30,36,42,48,54), las=1, freq=T, right=F, xlab='',
ylab="Frequncias", col="LightYellow", main="", ylim=c(0,20), plot=F))
(pontos.medios = c(9, histo$mids, 57))
(fr = c(0, histo$counts, 0))
par(mai=c(1,1,.2,.2))
plot(pontos.medios, fr, type="l", lwd=2, bty="l", xlab="Pontos Mdios",
ylab="Frequncias", col="red", main="", ylim=c(0,20),las=1, xaxt="n")
axis(1, at=c(pontos.medios))
abline(h=0)

5.3.3 Grco de ramo-e-folhas


Agrupar os dados em classes condensa os dados originais e, como resultado, algum detalhe
perdido. Uma vantagem do

ramo-e-folhas

que as observaes individuais so preservadas, enquanto que

no histograma elas so perdidas.


Considere os dados relativos ao nmero de atendimentos dirios, do Hospital Veterinrio, da
Universidade Estadual de Londrina, nos ltimos 50 dias.

12 15 16 18 19 20 22 23 23 24 25 26 26 27 27 27 28 28 28 29 29 30 30 30 31
31 31 32 32 32 32 33 33 33 33 33 34 35 35 36 36 37 38 39 39 41 42 43 45 49

5.3.3.1 Construo de um grco ramo-e-folhas


a) Denir a unidade de medida que dividir cada valor em duas partes: ramo e folha. Para o conjunto de
dados do nmero de atendimentos no Hospital Veterinrio, a diviso foi separar a dezena da unidade,
considerando-se que os dados pertencentes ao intervalo 0 a 4, cam em um ramo e de 5 a 9 em outro:

12

ramo = 1 e folha = 2

15

ramo = 1 e folha = 5

16

ramo = 1 e folha = 6

18

ramo = 1 e folha = 8

19

ramo = 1 e folha = 9

45

ramo = 4 e folha = 5

49

ramo = 4 e folha = 9

Apresentao grca de variveis contnuas

57

b) Escrever os ramos em ordem crescente verticalmente e passar uma linha vertical direta deles.

c) Associar cada folha ao respectivo ramo.

d) Ordenar, em cada ramo, as folhas em ordem crescente da esquerda para a direita.

Assim, o grco de ramos-e-folhas para os dados do nmero de atendimentos :

1 | 2
1 | 5689
2 | 02334
2 | 56677788899
3 | 0001112222333334
3 | 55667899
4 | 123
4 | 59

Os comandos do

para construo do polgono de frequncias so dados por:

atend=c(49,39,42,43,45,22,23,24,25,23,32,30,31,32,33,12,15,16,19,20,18,30,31,32,33,
33,26,26,27,28,28,27,33,30,31,32,33,29,29,27,28,41,39,38,35,37,35,34,36,36)
stem(atend)

Obs.:

note que o resultado mostrado no

5.3.4 Grco de Caixas (ou

console do R

e no em uma janela grca.

Box Plot )

O chamado grco de caixa (ou box plot, box-whisker plot ), tem por nalidade a deteco de
observaes discrepantes e o estudo da simetria da distribuio.
O grco de caixas d uma idia da posio, disperso, assimetria, caudas e dados discrepantes.
A posio central dada pela mediana e a disperso por

dq .

As posies relativas de

q1 , q2 , q3

do uma noo

da assimetria da distribuio. Os comprimentos das caudas so dados pelas linhas que vo do retngulo aos
valores remotos e pelos pontos atpicos (Bussab & Morettin, 2003).
A Figura 5.13 mostra a comparao, atravs do grco de caixas, dos pesos

(g)

de tilpias do

nilo, coletados por quatro equipes de alunos do curso de Medicina Veterinria, no tanque de piscicultura da
Universidade Estadual de Londrina, no ano de 2003.

58

Captulo 5. Grcos

500

Pesos (g)

450

400

+
+

1012

2021

2022

350

300

250
1011

Equipes

Figura 5.13  Comparao de pesos (g) de tilpias para quatro equipes de alunos do curso de Medicina
Veterinria da Universidade Estadual de Londrina em 2003.

A determinao dos quartis e demais valores para a construo do grco de caixas ser visto
no Captulo 6.
Os comandos do

para construo do grco de caixas so dados por:

tilapia = read.table("http://www.uel.br/pessoal/silvano/Veter/Dados/Tilapia.txt",
head=T, dec='.')
attach(tilapia)
names(tilapia)
(medias = tapply(Peso, factor(Equipe), mean))
par(mai=c(1,1,.2,.2))
boxplot(Peso~factor(Equipe), xlab='Equipes', ylab='Pesos (g)', las=1, bty='l',
col="LightYellow", pch=19, outline=F)
points(medias, pch="+", cex=1.5, col="blue")

5.3.5 Grco de disperso


aquele em que cada dado representado por um ponto

(X, Y )

do sistema de coordenadas

cartesianas. O objetivo deste tipo de diagrama vericar se existe algum tipo de associao entre as variveis
observadas.

Apresentao grca de variveis contnuas

59

500

450

Peso (g)

400

350

300

250

200
22

24

26

28

30

Comprimento (cm)

Figura 5.14  Relao entre peso e comprimento de tilpias do Nilo, do tanque de piscicultura da
Universidade Estadual de Londrina, 2003.

Da Figura 5.14 nota-se uma relao linear crescente entre as variveis Peso e Comprimento. No
Captulo

?? ser estudado como ajustar uma equao linear a um conjunto de dados.


Deve-se tomar cuidado na anlise deste tipo de grco, uma vez que as variveis correlacionadas

no necessariamente esto sujeitas a uma relao de causa e efeito.


Os comandos do

para construo do grco de disperso so dados por:

tilapia = read.table("http://www.uel.br/pessoal/silvano/Veter/Dados/Tilapia.txt",
header=TRUE, dec=",")
attach(tilapia)
names(tilapia)
par(mai=c(1, 1, .2, .2))
plot(Peso ~ Comp, las=1, xlab="Comprimento (cm)", ylab="Peso (g)", pch=19, col="blue",
cex=1.2, bty="l")
detach(tilapia)

5.3.6 Grco de Setores Proporcionais


Uma forma interessante de apresentar a relao entre trs variveis atravs do grco de
setores proporcionais. Ele uma variao do grco de disperso, sendo que a magnitude do crculo indica a
contribuio de uma terceira varivel.

60

Captulo 5. Grcos
A Figura 5.15 mostra a relao entre o peso

controladas pelo tempo

(s)

(g)

e comprimento

(cm)

das tilpias do Nilo,

de recuperao da anestesia. A varivel Tempo de Recuperao indicada pelo

raio de cada circunferncia. Quanto maior o raio, maior o tempo que o animal levou para se recuperar da
anestesia.

500

Pesos (g)

400

300

200

22

24

26

28

30

32

Comprimento (cm)

Figura 5.15  Relao entre peso e comprimento de tilpias do Nilo, controladas para a varivel tempo
de recuperao da anestesia, do tanque de piscicultura da Universidade Estadual de
Londrina, 2003.

A Figura 5.15 mostra que h tilpias que demoraram mais tempo a se recuperar da anestesia. Os comandos
do

para construo do grco de setores proporcionais so dados por:

tilapias = read.table('http://www.uel.br/pessoal/silvano/Veter/Dados/Tilapia.txt',
head=T, dec=',')
attach(tilapias)
names(tilapias)
symbols(Peso~Comp, circles = Recup/500,
inches=F, bty="l", bg="LightGreen", xlab="Comprimento (cm)",
ylab="Pesos (g)", fg="blue", las=1)

Apresentao grca de variveis contnuas

61

5.3.7 Grco de Linhas


Quando as observaes so feitas ao longo do tempo, os dados so denominados temporais ou
longitudinais e uma representao adequada para este tipo de dados o grco de linhas. Consiste em colocar
no eixo horizontal do grco a escala temporal (ano, ms, dia, etc) e no eixo vertical a varivel a ser estudada
(frequncia, taxa ou medida tomada).

usual unir os pontos atravs de segmentos de reta, da o nome

recebido.

420

Pesos (g)

400

380

360

340

320

Semanas

Figura 5.16  Peso mdio de 10 tilpias, do tanque de piscicultura da UEL, acompanhadas durante 8
semanas.

Os comandos do

para construo do grco de linhas so dados por:

prod = read.table("http://www.uel.br/pessoal/silvano/Veter/Dados/Tilapia.txt",
head=T, dec=",")
(dados=data.frame(Prod=sort(prod[1:8,4]), Semanas=1:8))
attach(dados)
par(mai=c(1,1,.2,.2))
plot(Semanas, Prod, las=1, xlab="Semanas", ylab="Pesos (g)", lwd=2.5, type="b",
bty="l", col="blue", xaxt='n')
axis(1, at=c(0,1,2,3,4,5,6,7,8))
detach(prod)
Um cuidado a se ter com grcos, com as escalas adotadas. Muitas vezes uma mudana de
escala pode dar uma impresso errnea sobre a realidade dos acontecimentos.

62

Captulo 5. Grcos

5.4 Iluso dos Grcos


Embora os grcos sejam utilizados para que se tenha uma visualizao mais rpida, clara e
objetiva do comportamento dos dados, muitas vezes eles so utilizados, de forma errnea, para dar uma
impresso que no condiz com a realidade.
Para o propsito de mostrar uma aplicao grca ilusria, considere os dados (ctcios) apresentados na Tabela 5.1, referentes ao nmero de atendimentos realizados pelo Hospital Veterinrio, da Universidade Estadual de Londrina, no primeiro semestre de 2003.

Tabela 5.1  Nmero de atendimentos no Hospital Veterinrio, da Universidade Estadual de Londrina,


no primeiro semestre de 2003.

Meses

Nmero de atendimentos

Janeiro

410

Fevereiro

430

Maro

450

Abril

408

Maio

408

Junho

405

Fonte: Fictcia
Os grcos, com escalas diferentes, para representar os dados da Tabela 5.1, so dados pelas
Figuras 5.17 e 5.18.
450

450

400

350

Nmero de atendimentos

Nmero de atendimentos

440

430

420

300

250

200

150

100

410

50

400

0
Janeiro

Fevereiro

Maro

Abril

Maio

Meses

Figura 5.17  Grco distorcido.

Junho

Janeiro

Fevereiro

Maro

Abril

Maio

Junho

Meses

Figura 5.18  Grco Correto.

Observe que na Figura 5.17 tem-se a impresso de que houve um nmero muito grande de

Iluso dos Grcos

63

atendimentos comparado aos outros meses. Perceba que a escala do grco comea em 400 atendimentos.
J na Figura 5.18 a escala comea no zero e percebe-se que no ms de maro houve, realmente, um nmero
maior de atendimentos, mas que a quantidade de atendimentos a mais no to signicativa quanto quela
apresentada na Figura 5.17. Logo, cuidado ao analisar grcos, seja crtico.
Os comandos do

para construo desses grcos so dados por:

atend = c(410,430,450,408,408,405)
names(atend) = c('Janeiro', 'Fevereiro', 'Maro', 'Abril', 'Maio', 'Junho')
barplot(atend-400, las=1, xlab='Meses', ylab='Nmero de atendimentos',
col='red', yaxt='n', space=0.6, density=10)
axis(2, at=seq(0,50, by=10), lab=seq(400,450, by=10), las=1)
abline(h=0, col='black', lwd=1)
barplot(atend, las=1, xlab='Meses', ylab='Nmero de atendimentos',
col='red', yaxt='n', space=0.6, density=10)
axis(2, at=seq(0,450, by=50), las=1)
abline(h=0, col='black', lwd=1)
Uma grande variedade de modelos grcos, aplicados s mais diversas reas, pode ser encontrada
na seguinte pgina:

http://bm2.genes.nig.ac.jp/RGM2/index.php?clear=all.

Captulo 6

Medidas de Posio
Viu-se que o resumo de dados atravs de grcos e tabelas de frequncias fornece muitas informaes sobre o comportamento de uma varivel. Muitas vezes, deseja-se resumir ainda mais esses dados,
apresentando um ou alguns valores que sejam representativos do conjunto em estudo.
As medidas de posio so utilizadas para sintetizar, em um nico nmero, o conjunto de
dados observados da varivel em estudo. Usualmente emprega-se uma das seguintes medidas de posio (ou
localizao) central: mdia, mediana ou moda.

6.1 Mdia Aritmtica Simples


A medida de tendncia central mais comumente usada para descrever resumidamente um
conjunto de dados, tabelados ou no, a mdia aritmtica simples, ou simplesmente mdia e representa-se
por

y.

denida como a soma das observaes dividida pelo nmero delas.

Exemplo:

Os pesos, em

kg ,

de

10

coelhos da raa Nova Zelndia Branco foram anotados, obtendo-se os

seguintes valores:

3, 7 3, 8 4, 8 5, 1 3, 9 4, 1 4, 2 4, 0 4, 5 5, 0.
Logo, a mdia ser:

y =

3, 7 + 3, 8 + 4, 8 + 5, 1 + 3, 9 + 4, 1 + 4, 2 + 4, 0 + 4, 5 + 5, 0
= 4, 31 kg.
10

Os comandos do

4 para o clculo da mdia so dados por:

pesos = c(3.7, 3.8, 4.8, 5.1, 3.9, 4.1, 4.2, 4.0, 4.5, 5.0)
mean(pesos)

64

Mdia Aritmtica Ponderada


Genericamente, seja

65
y1 , y2 , . . . , yn

os

valores da varivel

Y,

obtidos pelo pesquisador.

mdia aritmtica pode ser escrita como:

1
yi
n i=1
n

y =

sendo

yi

o valor observado do i-simo indivduo e

(6.1)

o total de observaes.

Quando dados de uma amostra de determinada populao so utilizados, a mdia aritmtica


calculada ser uma estimativa, pois emprega-se apenas uma frao do conjunto total.

6.2 Mdia Aritmtica Ponderada


A mdia aritmtica considerada ponderada se os valores observados tiverem pesos diferentes.
Este o critrio denido para o clculo da mdia nal para a disciplina de Estatstica do curso de Medicina
Veterinria, cujos pesos so:

em que

a nota obtida na listas;

Prova

Peso (pi )

P1

P2

P3

P4

P 1 , P2 , P3

Portanto, para calcular a mdia nal tem-se a

y =

P4

so as notas obtidas nas provas e os respectivos pesos.

mdia ponderada, dada por:

P1 + P2 + 2 P3 + 2 P4 + T
5

pi
i=1

em que o valor

pi

refere-se soma dos pesos.

i=1
De forma genrica, tem-se:

y =

yi pi

i=1

i=1

pi

66
sendo

Captulo 6. Medidas de Posio


yi

o valor que a varivel recebe e

Exemplo:

pi

seu respectivo peso.

Considere que as notas de um determinado aluno, obtidas na disciplina de Estatstica, foram:

P1

P2

P3

P4

P5

Notas

8,5

6,5

7,7

9,0

7,5

10,0

Pesos

Calcule a mdia nal.

Soluo:

Os comandos do

para o clculo da mdia ponderada so:

Provas = c(8.5, 6.5, 7.7, 9.0, 7.5, 10.0)


pesos = c(1, 1, 2, 2, 3, 1)
(MF = weighted.mean(Provas, pesos))

Caso as observaes estejam agrupadas em

distribuies de frequncias,

o clculo da mdia

passa a ser:

y =

y i fi

i=1
k

,
fi

i=1

sendo

yi

o valor observado (ou ponto mdio da classe),

o nmero de classes e

fi

as frequncias observadas.

Portanto, o clculo da mdia para dados agrupados, nada mais que o clculo de uma

mdia ponderada em

que os pesos so dados pelas frequncias observadas.

Exemplo:

Considere a distribuio de frequncias dos pesos de ces das raas Fila Brasileira e Pastor Alemo,

atendidos no Hospital Veterinrio da UEL em 2003 e apresentado na Tabela 6.1.

Mdia Geomtrica

67

Tabela 6.1  Distribuio de frequncia dos pesos

(kg)

de

30

ces das raas Fila Brasileiro e Pastor

Alemo, coletados no Hospital Veterinrio da Universidade Estadual de Londrina, em


2003.
Pesos
5
11
17
23
29
35

(kg)

Freq. absolutas (fi )

11
17
23
29
35
41

Freq. Acum. (Fac )

Ponto mdio

(yi )

yi fi

1
5
8
7
4
5

Total

30

Fonte: Hospital Veterinrio da UEL


Calcule a mdia de pesos dos animais.

Soluo:

Os comandos do

para o clculo da mdia para dados agrupados so:

yi = c(8,14,20,26,32,38)
fi = c(1,5,8,7,4,5)
(media = weighted.mean(yi, fi))

Obs.:

A mdia sofre muita inuncia de valores atpicos. Por outro lado, tima se a distribuio dos dados

for aproximadamente normal.

6.3 Mdia Geomtrica


Quando os valores observados crescem de forma exponencial, a mdia aritmtica pode no
representar bem o conjunto de dados.

Neste caso, deve-se utilizar a mdia geomtrica dos dados, que

calculada por:

yg = n y1 y2 . . . yn

ou

yg =

yi

(6.2)

i=1

A Contagem Bacteriana Total - CBT relaciona-se principalmente com prticas de higiene durante
a ordenha e limpeza do equipamento de ordenhar. Sendo assim, considere os dados apresentados na Tabela 6.2

68

Captulo 6. Medidas de Posio

referentes a CBT encontrada no leite, considerando-se a temperatura de armazenamento e o tempo aps a


ordenha.

Tabela 6.2  Efeito da temperatura de armazenamento e tempo aps a ordenha sobre o crescimento
bacteriano.

Temperatura de
armazenamento

(o C)

3 horas

9 horas

24 horas

9.000

9.000

10.000

15

10.000

46.000

5.000.000

25

18.000

1.000.000

57.000.000

35

30.000

35.000.000

800.000.000

Fonte:

Obs.:

Tempo de armazenamento

http://www.laticinio.net/inf_tecnicas.asp?cod=62

O leite deve atingir a temperatura de

4 oC

em no mximo 2 horas aps a ordenha.

Determine a mdia geomtrica do nmero de bactrias encontrada nos trs tempos apresentados
na Tabela 6.2.

Soluo:

Os comandos do

para o clculo da mdia geomtrica, entre outros, so:

require(psych)
cbt_3 = c(9000, 10000, 18000, 30000)
cbt_9 = c(9000, 46000, 1000000,35000000)
cbt_24 = c(10000, 5000000, 57000000, 800000000)
geometric.mean(cbt_3)
geometric.mean(cbt_9)

Mdia Geomtrica

69

geometric.mean(cbt_24)
Observe que necessrio instalar o pacote

psych.

No caso de se utilizar o pacote

asbio,

os

comandos seriam:

require(asbio)
cbt_3 = c(9000, 10000, 18000, 30000)
G.mean(cbt_3)
Pode ser necessrio o uso de logaritmos para o clculo da mdia geomtrica. Nesta situao,
aplica-se o logaritmo ao segundo termo da Equao (6.2), obtendo-se:

log yg

yg

1
(log10 y1 + log10 y2 + + log10 yn )
n

10

log10 y1 + log10 y2 + + log10 yn


n

Caso as observaes estejam agrupadas em

distribuies de frequncias, a mdia geomtrica

ponderada passa a ser:

yg =

y1f1 y2f2 . . . ynfn

70

Captulo 6. Medidas de Posio

Exemplo:

Determine a mdia geomtrica para os dados da Tabela (6.1).

Soluo:

6.4 Mediana
A mediana, denotada por

M d, uma quantidade que, como a mdia, tambm procura caracteri-

zar o centro da distribuio de frequncias quando os valores so dispostos em ordem crescente ou decrescente
de magnitude.

o valor que divide o conjunto ordenado de valores em duas partes com igual nmero de

elementos, ou seja, 50% das observaes cam acima da mediana e 50% cam abaixo.
Para calcular a mediana deve-se, em primeiro lugar, ordenar os dados para que se possa localizar
a posio da mediana e assim encontrar seu valor.

O nmero que indica a ordem ou posio em que se

encontra o valor correspondente mediana denominado elemento mediano (EM d ).

6.4.1 Determinao da mediana de valores no tabulados


Para determinar a mediana preciso ordenar os dados; em seguida aplique um dos processos a
seguir:

a) A varivel em estudo discreta e

mpar.

Neste caso a mediana ser o valor da varivel que ocupa a

posio:

EM d =

Exemplo:

n+1
.
2

O nmero de pacientes atendidos no Hospital Veterinrio da UEL, nos ltimos 11 dias foi:

10 12
Determine a mediana.

11

17 21 18

16

17 20

15

27

Mediana

71

Ordenados os valores, tm-se:

10 11

12

15 16 17

17

18 20

21

27.

Portanto, o elemento mediano ser:

EM d =

11 + 1
= 6,
2

ou seja, a mediana se encontra na sexta posio da lista ordenada de valores. Logo, a

mediana

neste

caso ser: 17 pacientes.

Os comandos do

4 para clculo da mediana so:

pacientes = c(10, 12, 11, 17, 21, 18, 16, 17, 20, 15, 27)
median(pacientes)
Obs.: Caso queira ordenar os elementos, o comando :

sort(pacientes)
b) A varivel em estudo discreta e

par.

Neste caso a mediana, por conveno, ser a mdia aritmtica

dos valores que ocupam as posies:

(
EM d =

Exemplo:

n
2

n+2
2

)
.

Acrescentando-se mais um dia aos dados do nmero de paciente atendidos pelo Hospital Vete-

rinrio da UEL, tem-se:

10 11

12

14 15 16

17

17 18

20

21

27.

Portanto, a mediana ser a mdia aritmtica dos valores cujos elementos so:

(
EM d =

Logo,

Md =

12
=6
2

)
12 + 2
=7 .
2

16 + 17
= 16, 5.
2

A mediana uma medida resistente a valores atpicos (muito grandes ou muito pequenos).
Os comandos do

4 para clculo da mediana so:

pac = c(10, 11, 12, 14, 15, 16, 17, 17, 18, 20, 21, 27)
median(pac)

72

Captulo 6. Medidas de Posio

6.4.2 Mediana de dados agrupados em classes


Quando os valores da varivel estiverem agrupados em classes, admite-se que os valores da
varivel na distribuio de frequncias distribuam-se continuamente. A mediana ser, neste caso, o valor da
varivel, para o qual 50% da frequncia total (n/2) ca situada abaixo e outra metade acima. O elemento
mediano para dados agrupados em classes ser n/2 (no importa se par ou mpar).
Para determinao da mediana aplica-se a seguinte frmula:

(EM d Fac1 )
a,
fM d

M d = Li +

(6.3)

sendo:

Li
a

= limite inferior da classe mediana;

= amplitude do intervalo de classe mediana;

fM d

= frequncia simples (absoluta) da classe mediana;

Fac1

Exemplo:

= frequncia acumulada anterior classe mediana;

Determinar a mediana dos dados da Tabela 6.1.


Todos os termos utilizados na Equao (6.3) so referentes classe mediana; logo, deve-se,

primeiramente, determinar a classe mediana encontrando-se o elemento mediano, dado por:

EM d =
Portanto, a classe mediana :

23 29,

n
30
=
= 15.
2
2

uma vez que, at 29, tem-se 21 observaes, e at 23 apenas 14.

Logo, substituindo-se os termos na expresso 6.3, tem-se:

Md
Md

(15 14)
6
7
= 23, 86 kg.
= 23 +

6.5 Moda
Outra medida que pode ser utilizada a

moda,

representada por Mo, denida como a

realizao mais frequente do conjunto de valores observados.


Se dois valores ocorrem com a mesma frequncia mxima, cada um deles ser a moda, e o
conjunto se denomina bimodal. Se mais de dois valores ocorrem com a mesma frequncia mxima, cada um
deles uma moda, e o conjunto multimodal. Quando nenhum valor repetido, o conjunto no tem moda
(amodal). A moda pode ser obtida mesmo que a varivel seja

qualitativa.

Moda

73

Exemplo 1:

Considere a estatura (em cm) dos alunos do curso de Medicina Veterinria:

155 161 163 163 168 168 168 169 172 175.
Logo, a altura modal entre esses alunos
Os comandos do

M o = 168 cm,

pois este valor se repetiu em maior nmero de vezes.

4 para o clculo da moda so dados por:

estat = c(155, 161, 163, 163, 168, 168, 168, 169, 172, 175)
tab.est = table(estat)
estat.mo = names(tab.est)[tab.est == max(tab.est)]
estat.mo

Exemplo 2:

O conjunto de nmeros 1, 2, 3, 4 e 5 no tem moda (Amodal).

Exemplo 3:

O conjunto de nmeros 1, 2, 2, 3, 4, 4 e 5 tem duas modas (bimodal), 2 e 4.

Exemplo 4:

Considere os seguintes dados:

Tipo Sanguneo

Frequncia

277

141

102

37

AB

O sangue tipo O ocorreu com maior frequncia. Ento a moda dessa amostra sangue tipo O.

6.5.1 Moda para dados agrupados em classes


Para dados agrupados em uma tabela de distribuio de frequncias para

tivas discretas,

variveis quantita-

a determinao da moda imediata, bastando, para isso, consultar na tabela, o valor que

apresenta maior frequncia, sendo este a moda. Considerando-se os dados da Tabela 6.3, determine a moda.

Tabela 6.3  Tempo (em semanas) de sobrevida de ratos com cncer induzido experimentalmente.

Sobrevida (semanas)

30

Nmero de ratos

10

Neste caso, a moda 6 semanas, pois o valor que ocorre com maior frequncia.
Para dados agrupados em uma tabela de distribuio de frequncias para

variveis quantita-

tivas contnuas, pode-se utilizar um dos seguintes mtodos:


a)

Moda bruta - o mtodo mais rudimentar para o clculo da moda em tabelas de frequncias, com valores
agrupados em classes. Consiste em tomar o ponto mdio da classe modal (aquela que apresenta maior
frequncia).

74
b)

Captulo 6. Medidas de Posio


Mtodo de Czuber - O processo para clculo da moda para dados agrupados o geomtrico, a partir do
histograma de frequncias. Este mtodo baseado na inuncia que as classes adjacentes exercem sobre
a moda, deslocando-a no sentido da classe de maior frequncia. Considere a Figura 6.1.

Figura 6.1  Esquema para obteno da moda pelo mtodo de Czuber, do nmero de atendimentos
do Hospital Veterinrio da UEL, 2005.

Processo:
Na Figura 6.1, marca-se, na classe modal, os vrtices A, B, C e D;
Traa-se retas

AC

BD;

No ponto de interseco dessas retas (E), traa-se uma perpendicular ao eixo das ordenadas, localizando
o ponto

Mo ,

O ponto

Mo

onais a

anterior e
Por

valor da moda;
divide a intervalo da classe modal

2 ,

sendo

(a)

em duas partes, cujos comprimentos so proporci-

a diferena entre a frequncia da classe modal e da classe imediatamente

a diferena entre as frequncias da classe modal e da imediatamente posterior;

traa-se a reta

FG

paralela ao eixo das abscissas, obtendo-se, assim, os segmentos

que representam as alturas dos tringulos


Sendo

Li

(Mo ),

verica-se, da Figura 6.1 que:

o limite inferior e

Ls

ABE

EG,

CDE ;

o limite superior da classe modal e

Mo = Li + x;


EF

a distncia entre

Li

e a moda

(6.4)

Emanuel Czuber: nasceu em 19/01/1851 em Praga, Repblica Tcheca e morreu em 22/08/1925 em Gnigl, Austria.

Moda

75
Sendo os tringulos

ABE

CDE

semelhantes (pois possuem dois ngulos iguais), tem-se que:

EF
EG

AB
CD

x
ax

1
2

x2
x

= a1 x1
=

1
a
1 + 2

(6.5)

Substituindo-se (6.5) em (6.4), tem-se:

M o = Li +

1
a,
1 + 2

(6.6)

em que:

Li
a

c)

= limite inferior da classe modal;

= amplitude do intervalo da classe modal;

= diferena entre a frequncia da classe modal e a imediatamente anterior;

= diferena entre a frequncia da classe modal e a imediatamente posterior;

Frmula de Pearson - em distribuies moderadamente assimtricas pode ser usada a frmula de Pearson,
dada por:

Mo
x
= 3M d 2

em que:

Md
x

= o valor da mediana;

= a mdia amostral;

(6.7)

76

Captulo 6. Medidas de Posio

Exemplo:

Determinar a moda pelos mtodos: moda bruta, Czuber e Pearson da seguinte distribuio:

Classes

fi

Fi

10

20

10

10

20

30

15

25

30

40

20

45

40

50

15

60

50

60

68

60

70

70

Total
a) A classe modal

30 40,

70

logo, pelo mtodo da moda bruta, tem-se que a moda

35;

b) Pelo mtodo de Czuber, tem-se:

Mo =

Li +

1
a,
1 + 2

Mo =

30 +

5
10 = 35.
5+5

c) Pelo mtodo de Pearson, tem-se:

Mo

x
= 3M d 2

Mo

= 3 35 2 35, 29 = 34, 42.

Observaes:
a) mdia, mediana e moda tm interpretaes diferentes, mas ajudam igualmente a representar um conjunto
de dados. A mdia pode ser vista como ponto de equilbrio das observaes, a mediana como o ponto
mdio e a moda como o ponto de mxima frequncia;
b) dados categricos (ou qualitativos) no tem mdia nem mediana, mas podem ter moda.
c) se a distribuio dos dados absolutamente

simtrica

em torno de um valor central, ento a mdia, a

mediana e a moda coincidem;


d) se a mdia for maior do que a moda, a distribuio de frequncia tem
e) se a mdia for menor que a moda, tem-se

assimetria positiva;

assimetria negativa da distribuio de frequncia;

Na seo 6.8, pgina 84, apresentado formas de se calcular a assimetria e a curtose de uma
conjunto de dados.

Utilizao das medidas de tendncia central

77

6.6 Utilizao das medidas de tendncia central


a)

Escolha da mdia:
i) quando a distribuio dos dados pelo menos aproximadamente simtrica;
ii) quando for necessrio obter posteriormente outros parmetros que podem depender da mdia, como
por exemplo a varincia, o desvio padro, etc.

b)

Escolha da mediana
i) quando h valores extremos;
ii) quando deseja-se conhecer o ponto central da distribuio;
iii) quando a distribuio dos dados muito assimtrica.

c)

Escolha da moda
i) quando a medida de interesse o ponto mais tpico ou popular dos dados;
ii) quando precisa-se apenas de uma rpida idia sobre a tendncia central dos dados.

6.7 Medidas Separatrizes


Dados simtricos so adequadamente descritos pela mdia e pelo desvio-padro.

Quando os

dados so assimtricos, a mediana identica mais adequadamente o centro de um conjunto de dados. Para
entender bem uma distribuio, pode-se conhecer valores acima ou abaixo dos quais se encontra uma determinada porcentagem dos dados atravs da medidas separatrizes. Separatriz de uma srie de

termos colocados

em ordem crescente de valor, o termo da srie que a divide em duas partes quaisquer. As principais separatrizes so a

mediana, os quartis, os decis e os percentis.

6.7.1 Separatrizes de dados no agrupados


O percentil de ordem
tal que

100 p

de um conjunto de valores dispostos em ordem crescente um valor

(100 p)% das observaes esto nele ou abaixo dele e 100(1p)% esto nele ou acima dele (0 < p < 1).
Assim, o percentil generaliza qualquer tipo de medida separatriz. Logo, tem-se:

i) o percentil de ordem 50

(P50 )

a mediana;

ii) os percentis de ordens 25, 50 e 75, representados por

P25 = Q1 , P50 = Q2

P75 = Q3 ,

respectivamente,

so chamados quartis (inferior, mediano e superior).


H vrios mtodos para o clculo do percentil de ordem
apresentados 9 mtodos diferentes.

100 p,

ou seja

P100 p .

No

so

78

Captulo 6. Medidas de Posio


Seja

o nmero de valores no nulos para uma varivel e seja

valores ordenados, tal que

y1

o menor valor e

yn

percentil o valor tal que a rea a esquerda dele

y 1 , y2 , , yn

o maior. Para um dado valor de

p.

representando os

entre 0 e 1, o p-simo

O p-simo percentil calculado como:

y +y
(i+1)
(i)
, se f = 0
2
yp =
y
se f > 0
(i+1) ,
em que

a parte inteira e

a parte fracionria de

np = i + f .

damento. Para obter as medidas separatrizes por este mtodo no

Aplicam-se aqui os critrios de arrendon-

R,

basta optar pelo type = 2.

Um outro critrio, que pode ser adotado, considerar a estatstica de ordem par mais prxima.
Neste caso, no

Exemplo:

R,

basta escolher a opo type = 3.

Considere os seguintes comprimentos (cm) de tilpias do nilo:

29, 0 29, 5 29, 3 25, 8 29, 8 24, 3 27, 0 29, 6 30, 0 28, 5
Determinar os percentis:

0, 20 0, 34 0, 45.

Medidas Separatrizes

79

Soluo:

Os comandos do

4 so:

tilap = c(29.0,29.5,29.3,25.8,29.8,24.3,27.0,29.6,30.0,28.5)
quantile(tilap, probs=c(0.20,0.34,0.45), type=2)
quantile(tilap, probs=c(0.20,0.34,0.45), type=3)

6.7.2 Separatrizes de dados agrupados


Assim como a mediana divide os dados em duas partes iguais, os trs quartis, denotados por

Q1 , Q2

Q3 ,

dividem as observaes ordenadas em quatro partes iguais. O primeiro quartil separa os 25%

inferiores dos 75% superiores dos valores ordenados; o segundo quartil a mediana e o terceiro quartil separa
os 75% inferiores dos 25% superiores dos dados.
Para o clculo dos quartis, utiliza-se uma frmula semelhante da mediana, dada por:

( in
4

Qi = Li +

Fac1

)
a,

fQi

(6.8)

em que:

Li
a

= limite inferior da classe quartlica;

= amplitude do intervalo da classe quartlica;

fQi

= frequncia simples (absoluta) da classe quartlica;

Fac1

= frequncia acumulada anterior classe quartlica;


Analogamente, h nove decis, denotados por

D 1 , D 2 , D3 , . . . , D 9

grupos com cerca de 10% deles em cada grupo. A frmula dada por:

( in
Di = Li +

10

Fac1
fDi

)
a,

(6.9)

que dividem os dados em 10

80

Captulo 6. Medidas de Posio

em que:

Li
a

= limite inferior da classe decil;

= amplitude do intervalo da classe decil;

fDi

= frequncia simples (absoluta) da classe decil;

Fac1

= frequncia acumulada anterior classe decil;

H nalmente, 99 percentis, que dividem os dados em 100 grupos com cerca de 1% em cada
grupo. A frmula dada por:

( in
)
Fac1
Pi = Li + 100
a,
fPi

(6.10)

em que:

Li
a

= limite inferior da classe percentil;

= amplitude do intervalo da classe percentil;

fPi

= frequncia simples (absoluta) da classe percentil;

Fac1

Exemplo:

= frequncia acumulada anterior classe percentil;

Considere a distribuio de frequncias dos pesos mdios (kg) das leitegadas

da raa Landrace,

ao nascer, apresentada na Tabela 6.4.

Tabela 6.4  Peso mdio (kg) das leitegadas da raa Landrace, ao nascer.
Pesos mdios (kg)

Frequncias

12, 0 12, 5

12, 5 13, 0

10

13, 0 13, 5

12

13, 5 14, 0

23

14, 0 14, 5

17

14, 5 15, 0

10

15, 0 15, 5

15, 5 16, 0

Determine:

Conjunto dos leites, que nasceram de um parto

Medidas Separatrizes
a) a mdia, a mediana e a moda;

Soluo:

b) a distribuio simtrica? Se no, que tipo de assimetria?

Soluo:

c) Determine:

Soluo:

Q1 , Q2 , Q3 , D5 , D6 , P95 ;

81

82

Captulo 6. Medidas de Posio


Uma forma direta de se determinar os valores das medidas separatrizes utilizando o grco de

frequncias acumuladas percentuais (conhecida como Ogiva de Galton).

6.7.3 Grco de caixa


Uma aplicao interessante para os quartis a construo do chamado grco de caixa (ou box
plot, box-whisker plot), que tem por nalidade a deteco de observaes discrepantes e o estudo da simetria
da distribuio. Tal grco foi apresentado no Captulo 5, na pgina 57.

Para a construo de um grco de caixa necessrio:

1) calcular o primeiro quartil (Q1 ), a mediana (Md) e o terceiro quartil (Q3 );

2) calcular a amplitude interquartlica (ou distncia interquartlica), dada por

3) calcular os limite inferior e superior. Tem-se que o limite inferior


dado por

LS = Q3 + 1, 5dq .

LI = Q1 1, 5dq

Traa-se uma linha a partir do centro de

da mesma forma com o valor de

Q3 ,

d q = Q3 Q1 ;

Q1

e o limite superior

at o limite inferior, e procede-se

traando-se a linha at o valor do limite superior;

4) vericar se h observaes discrepantes. As observaes que estiverem acima do limite superior ou abaixo
do limite inferior sero consideradas discrepantes do restante dos dados. So, em geral, representadas por
um asterisco (*) ou ().

Na Figura 6.2 so apresentados os quartis, bem como os limites inferior e superior, alm da
mdia e de outliers.

Medidas Separatrizes

83

Figura 6.2  Esboo do grco de caixas.

Exemplo:

Na Figura 6.3 apresentado as frequncias cardacas dos animais atendidos no Hospital Veterinrio,

da Universidade Estadual de Londrina, em 2003, por sexo.

Freqncia Cardaca

200

150

100

50

Fmeas

Machos
Sexo dos Animais

Figura 6.3  Frequncia cardaca dos animais atendidos no Hospital Veterinrio, da Universidade Estadual de Londrina, em 2003.

Pelo grco, observa-se que as fmeas tm batimentos cardacos mais homogneos que os ma-

84

Captulo 6. Medidas de Posio

chos, embora haja alguns animais com batimentos discrepantes em relao ao seu grupo. Em termos mdios,
percebe-se que a mdia de batimentos cardacos para machos e fmeas aproximadamente igual.
Para construo do grco, os comandos do

4 so:

dados = read.table("http://www2.uel.br/pessoal/silvano/Dados/Dados_HV.txt", sep="\t",


header=T, dec=",")
attach(dados)
names(dados)
medias = by(FC, Sexo, mean, na.rm=TRUE)
boxplot(FC~Sexo, xlab="Sexo dos Animais", names=c("Fmeas", "Machos"),
ylab="Frequncia Cardaca", col="LightYellow", las=1)
# Opes: border="red")
points(medias, pch="+", cex=1.5, col="red")
detach(dados)

6.8 Assimetria e Curtose


6.8.1 Assimetria
Numa distribuio estatstica, a assimetria o quanto sua curva de frequncia se desvia ou se
afasta da posio simtrica, possibilitando analisar uma distribuio de acordo com as relaes entre suas
medidas de moda, mdia e mediana. Pode-se caracterizar a distribuio de frequncia em:

a) Assimetria nula ou simtrica.


Uma distribuio dita

simtrica

quando apresenta o mesmo valor para a moda, a mdia e a mediana,

ou seja,

y = M d = M o.
b) Assimtrica direita ou positiva.
Quando a cauda da curva da distribuio declina para direita, tem-se uma distribuio com

curva assi-

mtrica positiva:
y > M d > M o.
c) Assimtrica esquerda ou negativa;
Analogamente, quando a cauda da curva da distribuio declina para esquerda, tem-se uma distribuio
com

curva assimtrica negativa:


y < M d < M o.

Assimetria e Curtose

85

Gracamente, tem-se um eixo de referncia ou eixo de simetria, que traado sobre o valor
da mdia da distribuio. Sempre que a curva da distribuio se afastar do referido eixo, ser considerada
como tendo um certo grau de afastamento, que considerado como uma assimetria da distribuio. Ou seja,
assimetria o grau de afastamento que uma distribuio apresenta do seu eixo de simetria.
Existem diversos mtodos para o clculo da medida de assimetria e, entre eles:
a) o

1o coeciente

de assimetria de Pearson, que dado por:

As =

y M o
s

para dados amostrais.


b) o

2o coeciente

de assimetria de Pearson.

Quando a distribuio for quase simtrica ou moderadamente assimtrica, pode-se calcular o grau de
assimetria substituindo-se a moda pela mediana, segundo a relao emprica proposta por Pearson:

As =

c) o

3(
y M d)
s

coeciente quartil de assimetria que, em seu clculo, recorre apenas aos quartis.

Trata-se de uma medida muito til quando no for possvel empregar o desvio-padro como medida de
disperso. denido por:

Asq =
d) o

Q3 2 M d + Q1
Q3 Q1

coeciente momento de assimetria.

Outra medida utilizada para avaliar a assimetria de uma distribuio de frequncias o coeciente momento
de assimetria, calculado com base nos momentos centrados da segunda e terceira ordem, denido por:

m3
Asm = ( )3
m2
em que:

(yi y)3 fi

m3 =

Obs.:

i=1

A assimetria calculada usando o

(yi y)2 fi

m2 =

i=1

baseada no coecente momento de assimetria.

A interpretao do coeciente de assimetria, em qualquer dos casos :

simtrica;
As > 0 a distribuio assimtrica positiva;
As < 0 a distribuio assimetrica negativa.
As = 0,

ento a distribuio

86

Captulo 6. Medidas de Posio

6.8.2 Curtose
A curtose uma medida de disperso que indica at que ponto a curva de frequncias de uma
distribuio se apresenta mais alada ou mais achatada do que uma curva-padro, denominada curva normal.
Para avaliar o grau de curtose de uma curva ou distribuio de frequncias, pode-se adotar dois
tipos de medidas:

a)

coeciente percentlico de curtose.


a medida mais elementar usada para avaliar o grau de curtose de uma distribuio ou curva de frequncias.
denido por:

kp =
em que,

dq

a distncia interquartlica;

D9

dq
2 (D9 D1 )

o nono decil e

se

k = 0, 263,

a curva ou distribuio mesocrtica;

se

k > 0, 263,

a curva ou distribuio platicrtica;

se

k < 0, 263,

a curva ou distribuio leptocrtica;

D1

No caso da distribuio normal padro, o valor da curtose

o primeiro decil. Neste caso, tem-se que:

k = 0, 263,

caracterizando uma curva meso-

crtica.

b)

coeciente momento de curtose.


Utiliza-se do quociente entre o momento centrado de quarta ordem e o quadrado do momento centrado
de segunda ordem, dado por:

km =
em que

m4

m4
m22

o quarto momento central e

ou, ainda,
s2

km =

m4
(s2 )2

a varincia.

A interpretao da curtose :

Se o valor da curtose for

km = 3, ento tem o mesmo achatamento que a distribuio normal.

Chama-se

a estas funes de mesocrticas ;


Se o valor

km > 3

ento a distribuio em questo mais alta (afunilada) e concentrada que a

distribuio normal. Diz-se desta funo probabilidade que leptocrtica, ou que a distribuio tem
caudas pesadas (o signicado que relativamente fcil obter valores que se afastam da mdia a vrios
mltiplos do desvio padro);
Se o valor

km < 3

ento a funo de distribuio mais achatada que a distribuio normal.

Chama-se-lhe platicrtica.

Obs.:

A curtose calculada usando o

baseada no coecente momento de curtose.

Assimetria e Curtose
Exemplo:

87

Na Figura 6.4 so apresentadas as frequncias respiratrias dos animais atendidos no Hospital

Veterinrio, da Universidade Estadual de Londrina, em 2003.

0.020

Densidade de Probabilidade

0.015

0.010

0.005

0.000
0

20

40

60

80

100

120

140

160

180

200

Frequncia Respiratria

Figura 6.4  Frequncias respiratrias dos animais atendidos no Hospital Veterinrio, da Universidade
Estadual de Londrina, em 2003.

Pelo grco, observa-se que a moda

(M o = 32) menor que a mdia (


y = 53, 8), caracterizando

uma distribuio assimtrica positiva.


Para construo do histograma e das medidas de assimetria e curtose, os comandos do

4 so:

rm(list=ls())
dados = read.table("http://www2.uel.br/pessoal/silvano/Dados/Dados_HV.txt", sep="\t",
header=T, dec=",")
attach(dados) ; names(dados)
(media = mean(FR, na.rm=T)) ; (desvio = sd(FR, na.rm=T)) ;
(minimo = min(FR, na.rm=T)) ;

(maximo = max(FR, na.rm=T))

tab.est = table(FR) ; (moda = names(tab.est)[tab.est == max(tab.est)])


par(mai=c(1,1,.2,.2))
hist(FR, breaks=c(0, 20, 40, 60,80, 100, 120, 140, 160, 180, 200), freq=F, right=F, xlab=`',
ylab=`', col=`LightYellow', main=`', ylim=c(0,.02), las=1, xaxt="n", border="blue", labels=F)
mtext(`Frequncia Respiratria', side=1, line=1.5)
mtext(`Densidade de Probabilidade', side=2, line=4)
abline(h=0) ; abline(v=media, col=`red', lwd=2, lty=2)
axis(1, at = c(0, 20, 40, 60,80, 100, 120, 140, 160, 180, 200), line=-1.2)
y = seq(minimo-10, maximo, 0.01)
lines(y, dnorm(y, media, desvio), col="red", lwd=1.5)
require(moments)

skewness(FR, na.rm=T) ; kurtosis(FR, na.rm=T)

88

Captulo 6. Medidas de Posio

Exerccios - Medidas de Posio


1) Em uma pesquisa sobre diabetes mellitus, foram coletados os seguintes valores de glicemia em jejum:

80

85

86

90

95

96

99

100

101

103

103

103

104

105

108

108

109

110

110

110

a) Agrupar os dados em classes e calcular a mdia aritmtica, a moda (bruta e Czuber) e a mediana;
b) Determine, sem agrupar os dados em classes (dados brutos): a mdia aritmtica, a moda e a mediana.
Utilize-se do

4 e de calculadora.

2) Em um estudo sobre instituies de atendimento mdico, foram obtidos dados da disponibilidade de leitos
de 50 dessas instituies:

48

53

58

62

64

66

69

71

77

81

49

54

58

62

64

67

69

72

77

82

50

55

59

63

65

67

70

73

78

83

52

56

60

64

65

67

70

74

78

86

52

57

61

64

66

68

71

76

80

90

a) Determine a mdia e a mediana dos dados e, tambm, determine o terceiro quartil e interprete-o;
b) Construa o histograma;
c) Construa o grco de caixas (box plot ).
d) Agora, utilizando o

4, refaa os clculos anteriores.

e) Agrupar os dados em classes (Sturges) e calcular a mdia, a moda (bruta e Czuber) e a mediana.

Compare os resultados obtidos e discuta-os.

3) Os dados abaixo representam a largura mxima de amostras de crnios de animais machos.


mdia, a mediana e a moda. Conrme os resultados utilizando-se do

131 119

138

125

129 126

131

132

Calcule a

4.

126 128

128

131

4) A amplitude total de um conjunto de nmeros 500. Se a distribuio de frequncias apresenta 20 classes,


qual dever ser o limite inferior e o ponto mdio da
35?

5a

classe, se o limite superior da

1a

classe igual a

Assimetria e Curtose

89

5) Os nveis de cido rico, em (mg/100

ml), encontrados nos exames bioqumicos de sangue de 10 pacientes

de um laboratrio, so os seguintes:

5, 1

4, 0

6, 4

5, 0

5, 5

9, 0

5, 5

5, 5

6, 0

8, 0

Com base nessas informaes, calcular:

a) a mdia aritmtica simples;

d) a mediana;

b) a mdia geomtrica;

e) a moda.

c) a mdia harmnica;

Conrme os clculos utilizando-se do

4 ou da sua calculadora.

6) Com base nos dados apresentados na Tabela 1.1, pgina 7, calcular a mdia aritmtica simples, a mdia
geomtrica, a mdia harmnica, a mediana e moda de cido ascrbico no plasma.

7) Qual o tipo mais comum de suicdio apresentado na Tabela 6.5? A esse tipo de medida estatstica, qual o
nome que se d?

Tabela 6.5  Suicdios ocorridos no Brasil em 1986, segundo a causa atribuda.

Causa atribuda

Frequncias

Alcoolismo

263

Diculdade nanceira

198

Doenca mental

700

Outro tipo de doena

189

Desiluso amorosa

416

Outras

217

Total

1983

Fonte: IBGE (1988)

Qual a probabilidade de um indivduo que se suicidou, t-lo feito por desiluso amorosa?

8) Consideremos 12 observaes (ordenadas) do tempo de internao (dias) de animais de pequeno porte do


Hospital Veterinrio da UEL:

10

13

15

17

17

18

19

Obtenha os quartis e interprete estes valores. Construa o grco de caixas usando o

21

4.

90

Captulo 6. Medidas de Posio

9) Com base nos dados da Tabela 6.6, calcule o peso mdio dos ratos em cada idade. Usando o

4, construa o

grco de caixas para a varivel peso, considerando-se cada rato (apenas um grco com todos os ratos).
Compare os resultados e comente.

Tabela 6.6  Peso mdio em ratos por idade.

Nmero do rato

Idades
30

34

38

42

46

76,2

95,5

99, 2

122,7

134,6

81,5

90,0

101,2

125,9

136,2

50,0

60,0

47,5

50,0

63,5

79,2

65,1

75,7

63,2

74,8

64,5

74,1

72, 2
72, 3
94, 7
88, 5
88, 1
96, 0

85, 3
84, 0

62, 3
57, 5
82, 1
79, 3
79, 0
92, 6

110,0

98, 7
100,0

98, 3

10) Trinta pessoas foram consultadas sobre sua cor favorita. Suas respostas foram:

Vermelho

Azul

Azul

Roxo

Preto

Preto

Azul

Marrom

Vermelho

Azul

Amarelo

Azul

Verde

Amarelo

Preto

Amarelo

Azul

Verde

Azul

Verde

Azul

Preto

Preto

Azul

Azul

Azul

Laranja

Vermelho

Verde

Vermelho

Construa uma tabela de frequncias para os dados.

Qual a escolha modal e a frequncia relativa (ou

porcentagem) desta cor?

11) Calcule para a tabela de frequncias abaixo sua respectiva mdia e mediana.

Xi
Fi

19

25

28

12) Determinar o quarto decil, o primeiro quartil e o septuagsimo segundo percentil da seguinte distribuio:

Classes

4 9
9 14
14 19
19 24

fi
8
12
17

Fi

Assimetria e Curtose

91

Se voc seguir apenas por caminhos traados, chegar onde todos poderiam chegar.
Alexandre Graham Bell

Captulo 7

Medidas de disperso ou
variabilidade
As medidas de disperso servem para indicar o quanto os dados se apresentam dispersos em
relao ao seu valor mdio.

Considere os dados referentes aos pesos de cinco animais, de quatro raas de

coelhos: Alaska, Beli, Califrnia e Chinchila, apresentados na Tabela 7.1.

Tabela 7.1  Pesos de cinco coelhos de quatro raas distintas.

Pesos (em kg)

Raas dos coelhos

Mdias

Animal 1

Animal 2

Animal 3

Animal 4

Animal 5

Alaska

3,0

3,5

4,5

4,0

5,0

4,0

Beli

4,2

3,8

4,1

3,9

4,0

4,0

Califrnia

3,0

3,0

4,0

5,0

5,0

4,0

Chinchila

4,0

4,0

4,0

4,0

4,0

4,0

Analisando-se os resultados da Tabela 7.1, verica-se que a mdia de pesos para as quatro raas
a mesma, ou seja, quatro quilos. Embora o valor mdio seja o mesmo, a varivel peso tem um comportamento
diferente dentro de cada raa. Assim, para a raa Alaska, o peso varia de 3,0 a 5,0 quilos; para a raa Beli,
a variao de 3,8 a 4,2 quilos; para a Califrnia, de 3,0 a 5,0 quilos; para a Chinchila, no h variao. Em
geral, um alto grau de uniformidade ou pequena disperso desejvel.

7.1 Amplitude Total


A maneira mais simples de se medir a variabilidade de uma varivel atravs da distncia entre
o maior e o menor valor observado em um conjunto de dados. Essa diferena a amplitude total, denotada

92

Desvio Absoluto Mdio


por

93

At .
Para os dados apresentados na Tabela 7.1, a amplitude total ser:

Raa dos coelhos

Amplitude total

Alaska

At = 5, 0 3, 0 = 2, 0 kg

Beli

At = 4, 2 3, 8 = 0, 4 kg

Califrnia

At = 5, 0 3, 0 = 2, 0 kg

Chinchila

At = 4, 0 4, 0 = 0, 0 kg

O problema em se considerar a amplitude total como medida de disperso dos dados, o fato
dela levar em considerao em seu clculo, apenas os valores extremos e no todos os valores. Assim, dois
conjuntos de dados podem apresentar a mesma amplitude total, mesmo que tenham disperso muito diferente.
Embora fcil de calcular e de interpretar, no deve ser usada normalmente como medida de disperso.
Uma forma de se calcular as amplitudes usando os comandos do

4 :

coelhosd = c(3.0,3.5,4.5,4.0,5.0,4.2,3.8,4.1,3.9,4.0,
3.0,3.0,4.0,5.0,5.0,4.0,4.0,4.0,4.0,4.0)
coelhos = matrix(coelhosd, 4,5, byrow=T)
colnames(coelhos) = c('Animal1','Animal2','Animal3','Animal4','Animal5')
rownames(coelhos) = c('Alaska', 'Beli','Califrnia','Chinchila')
coelhos
alaska = range(coelhos[1,])

diff(alaska)

belie = range(coelhos[2,])

diff(belie)

california = range(coelhos[3,]) ;

diff(california)

chinchila = range(coelhos[4,])

diff(chinchila)

7.2 Desvio Absoluto Mdio


Outra forma de se medir a variabilidade de uma varivel quanticando a disperso das observaes em relao a um ponto especco na distribuio, em geral, a mdia. Claro que poderia-se pensar em
calcular os desvios em relao a, por exemplo, mediana. distncia entre os valores observados e a mdia ou
mediana, d-se o nome de desvio, logo

Desvio = yi y

ou

Desvio = yi M d

94

Captulo 7. Medidas de disperso ou variabilidade

Considere os pesos dos animais da raa Alaska, apresentados na Tabela 7.1 e calcule os desvios em torno da
mdia. Esses clculos so apresentados na Tabela 7.2.

Tabela 7.2  Desvios e desvios absolutos para pesos dos animais da raa Alaska.

Animais

Desvios:

(yi y)

Desvios absolutos:

|yi y|

3, 0 4, 0 = 1, 0

|3, 0 4, 0| = 1, 0

3, 5 4, 0 = 0, 5

|3, 5 4, 0| = 0, 5

4, 5 4, 0 =

0, 5

|4, 5 4, 0| = 0, 5

4, 0 4, 0 =

0, 0

|4, 0 4, 0| = 0, 0

5, 0 4, 0 =

1, 0

|5, 0 4, 0| = 1, 0

Soma

(yi y) = 0

i=1

|yi y| = 3, 0

i=1

Observe que a soma dos desvios em relao mdia sempre zero, logo, ela no informativa a
respeito da variabilidade dos dados, portanto, melhor utilizar a soma dos valores absolutos dos desvios, que
ser sempre positiva. A soma dos valores absolutos ser tanto maior quanto maior o nmero de observaes
(n).
O desvio absoluto mdio pode ser calculado como:

1
|yi y|
n i=1
n

dy =

Para a raa Alaska, o desvio absoluto mdio :

dy =

3, 0
= 0, 6 kg .
5

Caso os dados estejam agrupados em uma tabela de distribuio de frequncias, o clculo do


desvio mdio ser calculado por:

No

1
dy =
|yi y|fi
n i=1
n

4 o clculo dos desvios absolutos mdios, por raa, :

n1 = length(coelhos[1,]) ; (dm1 = (1/n1)*(sum(abs(coelhos[1,] - mean(coelhos[1,])))))


n2 = length(coelhos[2,]) ; (dm2 = (1/n2)*(sum(abs(coelhos[2,] - mean(coelhos[2,])))))
n3 = length(coelhos[3,]) ; (dm3 = (1/n3)*(sum(abs(coelhos[3,] - mean(coelhos[3,])))))
n4 = length(coelhos[4,]) ; (dm4 = (1/n4)*(sum(abs(coelhos[4,] - mean(coelhos[4,])))))
desvios_medios = cbind(dm1, dm2, dm3, dm4) ; desvios_medios

Para o clculo do desvio absoluto mdio dos dados, independentemente de raa, tem-se:

Varincia

95

n = length(coelhosd)
desvio_medio = (1/n)*(sum(abs(coelhosd - mean(coelhosd))))

7.3 Varincia
A medida de variabilidade mais utilizada a varincia, que simplesmente a soma dos quadrados
dos desvios, divididos pelo total de observaes menos um. Pode-se calcular a varincia para dados provenientes
de uma populao ou amostra e de dados brutos ou agrupados em classes.

7.3.1 Varincia de Dados Brutos Populacionais


Quando se coleta dados de toda populao-alvo ou simplesmente populao, o clculo da varincia se d da seguinte forma:

(yi )2

2 =

i=1

(7.1)

7.3.2 Varincia de Dados Brutos Amostrais


Se as informaes coletadas so provenientes de uma amostra da populao, ento a varincia
calculada da seguinte maneira:

(yi y)2

s2 =

i=1

n1

(7.2)

Considere os dados da Tabela 7.1 e calcule a varincia para os pesos dos animais da raa Alaska. Na Tabela
7.3 so apresentados os desvios calculados.

96

Captulo 7. Medidas de disperso ou variabilidade


Tabela 7.3  Desvios e quadrado dos desvios para pesos dos animais da raa Alaska.

Animais

Desvios:

(yi y)

Quadrado dos desvios:

(yi y)2

3, 0 4, 0 = 1, 0

(3, 0 4, 0)2 = 1, 00

3, 5 4, 0 = 0, 5

(3, 5 4, 0)2 = 0, 25

4, 5 4, 0 =

0, 5

(4, 5 4, 0)2 = 0, 25

4, 0 4, 0 =

0, 0

(4, 0 4, 0)2 = 0, 00

5, 0 4, 0 = 1, 0
n

(yi y) = 0

(5, 0 4, 0)2 = 1, 00
n

(yi y)2 = 2, 5

Soma

i=1

i=1

Logo, a varincia ser:

(yi y)2

s2 =

i=1

n1

2, 5
= 0, 625 kg 2 .
51

Uma forma computacionalmente mais eciente, para o clculo da varincia, obtida quando se
desenvolve a soma de quadrados dos desvios, da seguinte maneira:

(yi y)2

i=1

(yi2 2yi y + y2 )
i=1

y
yi2 2

i=1

i=1

yi + n
y2

i=1

yi2

yi

n
n
i=1
2

yi
yi + n
n
n i=1 i=1

n
(
)2
yi

yi2

i=1

i=1

(7.3)

Substituindo-se 7.3 em 7.2, tem-se:

s2 =
y2

n 1 i=1 i

)2
yi

i=1

O clculo da varincia dos pesos para cada raa, usando o

(7.4)

4 dado por:

Varincia

97

var1 = (1/(n1-1))*(sum((coelhos[1,] - mean(coelhos[1,]))^2))


var2 = (1/(n2-1))*(sum((coelhos[2,] - mean(coelhos[2,]))^2))
var3 = (1/(n3-1))*(sum((coelhos[3,] - mean(coelhos[3,]))^2))
var4 = (1/(n4-1))*(sum((coelhos[4,] - mean(coelhos[4,]))^2))
cbind(var1, var2, var3, var4)

Para o clculo da varincia dos pesos de todos os coelhos, sem levar em considerao a raa, :

media = mean(coelhosd)

media

n = length(coelhosd)

variancia = (1/(n-1))*sum((coelhosd - media)^2)


variancia

ou, simplesmente

var(coelhosd)

7.3.3 Varincia de Dados Agrupados


Quando os dados esto dispostos em uma tabela de fequncias, para se calcular a varincia basta
levar-se em considerao as frequncias de cada classe. Logo, multiplica-se o numerador da equao 7.2 por

fi

e obtm-se:

(yi y)2 fi

s2 =

i=1

n1

Desenvolvendo-se o quadrado dos desvios, chega-se a:

s2 =
y 2 fi

n 1 i=1 i

Exemplo:

n
(

)2
yi fi

i=1

Considere a distribuio de fequncia da Tabela 7.4. Determine a varincia.

(7.5)

98

Captulo 7. Medidas de disperso ou variabilidade


Tabela 7.4  Pesos das carcaas de bovinos.
Pesos (kg)

Frequncias (fi )

Ponto mdio (yi )

120 140
140 160
160 180
180 200
200 220
220 240
240 260

130

12

150

15

170

17

190

14

210

11

230

250

Usando-se a frmula (7.5), tem-se:

s =
3.214.200
86 1

)2

16.340

86

s2 = 1.289, 411765 kg2

fi = c(8,12,15,17,14,11,9)
xi = c(130,150,170,190,210,230,250)
nc = sum(fi) ; nc
xifi = sum(xi*fi)
xi2fi = sum(xi^2*fi)
var_carcaa = 1/(nc-1) * (xi2fi - xifi^2/nc)

claro que, com a facilidade computacional e a disponibilidade de programas estatsticos gratuitos como o

4, se o pesquisador dispe dos dados brutos, recomendvel que as estatsticas sejam baseadas

neles. As distribuies de frequncias servem, neste caso, apenas para apresentar as informaes de forma
resumida.

7.3.4 Propriedades da varincia


As propriedades da varincias so:

a) somar (ou subtrair) um valor constante e arbitrrio

a cada elemento de um conjunto de nmeros no

altera a varincia;

b) multiplicar (ou dividir) por um valor constante e arbitrrio

cada elemento de um conjunto de nmeros,

a varincia ca multiplicada (ou dividida) pelo quadrado da constante.

Varincia
Exemplo:

99
Considere uma constante

c=4

e os seguintes valores observados para a varivel

Y = {2, 4, 5, 8, 10, 12}


a) Calcule a varincia dos dados;

Soluo:

b) Acrescente a constante a cada valor de

e calcule a varincia;

Soluo:

c) Subtraia a constante de cada valor de

e determine a varincia;

Soluo:

d) Multiplique cada valor de

pela constante e calcule a varincia;

Soluo:

e) Divida cada valor de

pela constante e calcule a varincia;

Soluo:

f ) O que se observou dos resultados obtidos?

Y:

100

Captulo 7. Medidas de disperso ou variabilidade

Soluo:

7.4 Desvio Padro


Observe que, devido ao fato de se elevar os desvios ao quadrado, a unidade de medida tambm
ca elevada ao quadrado, gerando escalas sem sentido prtico. Assim, caso a unidade de mensurao seja
metros (m), a unidade de medida da varincia ser

m2 .

Uma forma de se obter uma medida de disperso com a mesma unidade de medida dos dados observados , simplesmente, extrair a raiz quadrada da varincia, obtendo-se o desvio padro. Ele representado
por

s.

Logo,

s=

s2 .

Para os dados dos coelhos da raa Alaska, a varincia calculada foi

s2 = 0, 625 kg 2 .

Portanto,

o desvio padro dado por:

s2

0, 625 kg 2
=

= 0, 790569415 kg.

No

4, basta extrair a raiz quadrada das varincias de cada raa calculadas anteriormente.

sd1 = sqrt(var1)

sd2 = sqrt(var2)

sd3 = sqrt(var3)

sd4 = sqrt(var4)

cbind(sd1, sd2, sd3, sd4)


ou, se de forma direta:

sd(coelhosd)

7.5 Coeciente de Variao


A interpretao do desvio padro depende da ordem de grandeza da varivel em estudo. Assim,
um desvio padro de 10 pode ser insignicante se os valores tpicos observados forem em torno de 10.000,
mas pode ser muito signicativo para um conjunto de dados cuja observao tpica seja 100.

Coeciente de Variao

101

Logo, pode ser conveniente expressar a variabilidade dos dados de uma varivel de modo

inde-

pendente da sua unidade de medida utilizada, tirando a inuncia da ordem de grandeza da varivel.

Tal

medida denominada coeciente de variao.


O coeciente de variao de Pearson a razo entre o desvio padro e a mdia. Em geral, o
resultado multiplicado por 100, para que o coeciente de variao seja dado em porcentagem. dado por:

CV =

s
100
y

Sua utilidade est em fornecer uma medida para a homogeneidade de um conjunto de dados.
Quanto menor o coeciente de variao, mais homogneo o conjunto de dados.

Esta medida pode ser

bastante til na comparao de duas variveis ou dois grupos que, a princpio, no so comparveis.
Em geral, considera-se:
a) Baixa disperso:
b) Mdia disperso:
c) Alta disperso:

CV < 15%;
15% < CV < 30%

CV > 30%

Em experimentos realizados em laboratrio, em que todas as condies podem ser controladas,


espera-se que o coeciente de variao seja baixo, ou seja, menor que 10%.

102

Captulo 7. Medidas de disperso ou variabilidade

Exemplo:

Calcular a mdia, a varincia, o desvio padro e o coeciente de variao para as variveis Estatura

(cm), Peso (kg ) e Idade (anos) de dez alunos aleatoriamente selecionados:

Estatura (cm)

= 177 162 188 157 166 153 158 176 168 163

Peso (kg)

= 68, 0 83, 0 72, 0 99, 9 51, 0 52, 0 52, 0 66, 5 80, 0 48, 0

Idade (anos)

= 18, 0 20, 1 20, 5 17, 7 19, 2 18, 9 26, 9 20, 1 20, 7 19, 3

Qual varivel apresenta maior variabilidade?

Soluo:

Coeciente de Variao

103

Exerccios - Medidas de Disperso

Quando procedemos a uma investigao cientca em que utilizamos dados de uma frao representativa de uma populao (amostra), a mdia aritmtica determinada apresentar, em relao
mdia populacional, um afastamento.
Se outras amostras fossem retiradas da populao, apresentariam mdias aritmticas que teriam outros afastamentos em relao mdia populacional. Para se determinar a mdia destes
afastamentos utilizamos o

erro-padro da mdia, cujo clculo expresso pela frmula:


s
sx =
n

1) Embora os gastroenterologistas infantis reconhecessem a utilidade diagnstica do teor de gordura fecal, at


1984 no existia um padro de referncia desta medida para crianas brasileiras. Para preencher esta lacuna,
o Prof. Francisco Penna, titular da Pediatria da UFMG, examinou 43 crianas sadias que produziram os
valores da Tabela 7.5 expressos em

g/24 horas.

Tabela 7.5  Teor de gordura (g/24

horas)

em 43 crianas.

3,7

1,6

2,5

3,0

3,9

1,9

3,8

1,5

1,1

1,8

1,4

2,7

2,4

2,1

2,1

3,3

3,2

2,3

2,3

2,4

0,8

3,1

1,8

1,0

2,0

2,0

1,3

2,7

2,9

3,2

1,9

1,6

2,9

2,0

1,0

2,7

3,0

1,3

1,5

4,6

2,1

2,8

1,9

Baseando-se nos dados brutos, pede-se:

a) faa o histograma, o grco de caixas e discuta-os;

b) determine o teor mdio de gordura;

c) determine a varincia dos dados;

d) determine o desvio padro e interprete-o;

e) determine o erro-padro.

2) Em uma granja foi observada a distribuio dos frangos em relao ao peso, apresentada na Tabela 7.6.

104

Captulo 7. Medidas de disperso ou variabilidade


Tabela 7.6  Pesos dos frangos de uma granja.

Peso (gramas)

Frequncia absoluta

960 980

60

980 1000

160

1000 1020

280

1020 1040

260

1040 1060

160

1060 1080

80

a) Qual a mdia da distribuio?


b) Determine o desvio padro dos dados.
c) Determine o erro-padro dos dados.
d) Qual o inconveniente de se usar a varincia como medida de variabilidade?

3) Uma das caractersticas da gota, distrbio hereditrio que ocorre especialmente em homens, a hiperuricemia (excesso de cido rico no sangue). Embora nem todos os indivduos com hiperuricemia desenvolvam
manifestaes clnicas de gota, h muito tempo tem-se reconhecido que o componente hereditrio da doena est ligado a uma tendncia para hiperuricemia. A Tabela 7.7 apresenta a distribuio de frequncias
das dosagens de cido rico srico em 267 homens sadios.

Tabela 7.7  Distribuio de frequncia da dosagem de cido rico.

cido rico (mg/dL)

3, 0 3, 5

3, 5 4, 0

15

4, 0 4, 5

33

4, 5 5, 0

40

5, 0 5, 5

54

5, 5 6, 0

47

6, 0 6, 5

38

6, 5 7, 0

16

7, 0 7, 5

15

7, 5 8, 0

8, 0 8, 5

8, 5 9, 0

Total

Pede-se:

Frequncia absoluta

267

Coeciente de Variao

105

a) calcule a mdia;
b) determine a varincia dos dados;
c) determine o desvio padro e interprete-o.

4) Em trabalho laboratorial realizado no Jockey Club Brasileiro, vericou-se que os animais apresentaram

 em torno de 42% e desvio padro de 5%. O mesmo trabalho realizado

um valor mdio de hematcrito

no Jockey Club de Porto Alegre apresentou valor mdio de hematcrito igual a 38% e varincia de 25%.
Opinar sobre os Coecientes de Variao (CV).

5) Calcular a mdia aritmtica e desvio padro dos seguintes dados relativos dosagem de hemoglobina
vericada em 12 animais bovinos(mg ):

15

14

13

11

13

14

13,5

12

16

14,5

12

9.

6) Em 25 pessoas adultas do sexo masculino, observou-se em relao ao teor de hemoglobina um valor mdio
igual a

13, 7 mg .

O erro padro da mdia foi igual a

0, 45 mg .

Determinar o CV e opinar sobre o seu

valor.

7) Na Tabela 7.8 apresenta-se a distribuio de frequncias quanto ao nmero de acidentes por dia, durante
setenta dias, na rodovia X. Determinar a mdia aritmtica e o desvio padro.

Tabela 7.8  Nmero de acidentes na rodovia X.

Nmero de acidentes
Nmero de dias

8) O efeito da castrao sobre a espessura (em

21

16

12

mm)

de toucinho de leites foi avaliado em um experimento,

cujos resultados esto disponvel na pgina:

http://www2.uel.br/pessoal/silvano/Dados/Toucinho.txt.
Usando o

R:

a) Construa o histograma;
b) Faa o grco de caixas considerando apenas um grupo. Refaa o grco para comparar a espessura
entre tipos; Discuta os resultados observados;
c) Calcule a mdia, o desvio-padro e o coeciente de variao das espessuras para cada tipo. Interprete.

Hematcrito (ou Ht ou Htc) a percentagem ocupada pelos glbulos vermelhos ou hemcias no volume total de
sangue.

106

Captulo 7. Medidas de disperso ou variabilidade

d) Repita os clculo efetuados no item (8c) para todos os animais e compare os resultados.

9) O tempo (em meses) entre a remisso

! de 48 pacientes de uma determinada

de uma doena e a recidiva

clnica foi registrado. Os dados ordenados so apresentados a seguir, separadamente para machos (M) e
fmeas (F):

Machos

Fmeas

10

12

15

15

15

16

18

18

22

22

24

10

10

11

11

12

18

a) Faa o grco de caixas para comparar o tempo entre machos e fmeas;


b) Calcule a mdia, o desvio-padro e o coeciente de variao para cada gnero. Interprete.
c) Repita os clculo efetuados no item (9b) para todos os 48 pacientes. Compare os resultados.

A diferena entre as pessoas que


tm sucesso e as que fracassam,
que as primeiras nunca desistem.

Remisso completa o termo utilizado em Medicina para designar a fase da doena aonde no h sinais de atividade
da mesma mas no possvel concluir como cura.
!
Recidiva (popularmente conhecido como recada) o retorno da atividade de uma doena.

Captulo 8

Anlise Combinatria
A Anlise Combinatria a parte da Matemtica em que se estuda as tcnicas de contagem
de agrupamentos que podem ser feitos com elementos de um dado conjunto.
de agrupamentos que se pode formar: um em que se leva em conta a
agrupamento e outro em que a

So basicamente dois tipos

ordem dos elementos

dentro do

ordem dos elementos irrelevante.

Um requisito bsico simplicao das frmulas da Anlise Combinatria o fatorial, que ser
explicado a seguir.

8.1 Fatoriais
Indica-se por

5!

(leia-se: cinco fatorial) o produto dos cinco primeiros naturais positivos:

5! = 5 4 3 2 1
portanto,

5! = 120.
Tem-se tambm:

4!

4 3 2 1 = 24

7!

7 6 5 4 3 2 1 = 5.040

Dado um nmero natural qualquer

n,

sendo

n > 1,

dene-se:

n! = n (n 1) (n 2) 3 2 1

e os seguintes casos particulares:

1! = 1

e
107

0! = 1

108

Captulo 8. Anlise Combinatria


Note que:

0! =

1! =

2! =

21=2

3! =

321=6

4! =

4 3 2 1 = 24

5! =

5 4 3 2 1 = 5 4! = 120

6! =

6 5 4 3 2 1 = 6 5! = 720

e assim por diante. Ao desenvolver um fatorial, colocando-se os fatores em ordem decrescente, pode-se parar
onde for conveniente, indicando os ltimos fatores tambm na notao fatorial.

Calcule:
a)

9!

b)

10!

c)

11!

d)

e)

f)

g)

h)

i)

5!15!
13!7!

j)

6!

k)

10!
9!
10!
12!
6!
8!
10!
4!6!
12!
10!2!

l)
m)

n)

o)

5!

4 5! 6 3!
30 + 0! 3 1!
13!
5!
+ 13
3!10!
3!2!
n!
(n 1)!

(n + 1)!
n!

p) Calcule

Para o clculo de fatoriais, no

R,

na equao

n! = 12 (n 2)!

basta

factorial(9)
factorial(10)/factorial(9)

8.2 Princpio Fundamental da Contagem


Imagine que h apenas dois residentes (R1 e
chegam, simultaneamente, 3 animais (A1 ,

A2

A3 )

R2 )

no Hospital Veterinrio da UEL de planto e

para serem atendidos.

Princpio Fundamental da Contagem

109

Pode-se pensar nas seguintes possibilidades de atendimento:


R1
A1
R2

R1
A2
R2

R1
A3
R2
Assim, cada animal poderia ser atendido por um dos dois residentes, gerando as seguintes
possibilidades:

A1 R1 , A1 R2 , A2 R1 , A2 R2 , A3 R1 , A3 R2 .

Portanto, h seis maneiras diferentes dos animais

serem atendidos.

Princpio Fundamental da Contagem:


Se uma ao composta de duas etapas sucessivas, sendo que a primeira pode ser realizada de
e, para cada uma destas, a segunda pode ser realizada de
se realizar a ao

m maneiras

maneiras, ento, o nmero de maneiras de

m n.

Exerccios:
1) Com os algarismos

1, 2, 3, 4

quantos nmeros naturais de trs algarismos podem ser escritos? Destes

nmeros, quantos so formados por algarismos diferentes?

2) Quantas placas de licena de automveis podem ser formadas por 3 letras e 4 algarismos sendo as letras
apenas vogais e sendo os algarismos distintos?

3) Uma sorveteria oferece uma taa de sorvete que pode vir coberto com calda de chocolate ou de morango
ou de caramelo. Se o sorvete pode ser escolhido entre 10 sabores diferentes, quantas so as opes para
um cliente escolher a taa com a cobertura?

4) Uma moeda ser lanada 6 vezes e a cada vez ser anotado o resultado obtido, cara ou coroa, formando
assim uma sequncia de 6 resultados. Quantas sequncias diferentes podem ser formadas?

110

Captulo 8. Anlise Combinatria

5) Dez alunos da UEL cadastraram-se para adotar animais do Hospital Veterinrio.

Sabe se que h duas

espcies de animais para serem adotadas: Canina e Felina. Da espcie Felina h 3 raas e da canina 5
raas. De quantas maneiras os animais podero ser adotados?

8.3 Permutaes
Com os seguintes smbolos

, ,

Denomina-se

), ( ), (

), (

Cada uma dessas sucesses chamada de

pode-se formar as seguintes sucesses:

), (

), ( ).

permutao dos trs smbolos.

permutao de n elementos dados a toda sucesso de n termos formada com os n elementos

dados.

Duas permutaes dos mesmos objetos so diferentes se a ordem dos objetos numa delas
diferente da ordem em que os objetos esto colocados na outra.

Exemplos:
1) Formar os anagramas da palavra UEL.

Soluo:

No

R,

tem-se

require(combinat)
U = c(`U',`E',`L')
permn(U)
2) Formar os anagramas da palavra LILI.

Soluo:

No

R,

tem-se

require(combinat)
L = c(`L',`I',`L',`I')
permn(L)

Permutaes

111

3) Forme todos os anagramas da palavra RIMA que comeam com consoante.

Soluo:

No

R,

tem-se

require(combinat)
R = c(`I',`M',`A')
permn(R)
M = c('R','I','A')
permn(M)

Exerccios:
1) Forme todas as permutaes dos algarismos

1, 2

3.

2) Forme todas as permutaes das letras a, b, c e d.


3) Forme todos os anagramas da palavra AZUL que comeam pela letra Z.
4) Forme todos os anagramas da palavra PAPAI que comeam e terminam por vogal.

8.3.1 Quantidade de Permutaes


Geralmente se est interessado no

nmero de permutaes

que podem ser feitas com deter-

minados elementos. Para determinar esse nmero, tem-se que considerar duas situaes possveis:
permutaes com elementos distintos;
permutaes com elementos repetidos.

Permutaes de elementos distintos


Quantas permutaes podem ser formadas com as letras A, B, C, D e E?

(, , , , )
1a etapa:

escolher a

1a

letra da permutao.

possibilidades para esta etapa.

Ela pode ser A ou B ou C ou D ou E. H, portanto, 5

112

Captulo 8. Anlise Combinatria

2a etapa:

escolher a

2a

letra da permutao. Tem-se 4 possibilidades para esta etapa, uma vez que uma das

letras j ter sido eliminada.

3a etapa:

escolher a

3a

letra da permutao. Tem-se 3 possibilidades para esta etapa.

4a etapa:

escolher a

4a

letra da permutao. Tem-se 2 possibilidades para esta etapa.

5a etapa:

escolher a

5a

letra da permutao. Tem-se 1 possibilidade para esta etapa.

Pelo princpio fundamental da contagem, conclui-se que possvel formar

5! = 120

54321 =

permutaes diferentes. Indica-se o nmero de permutaes de cinco elementos diferentes por

P5 .

Assim, tem-se:

P5 = 5! = 120.
Assim, racionando da mesma forma, conclui-se que o nmero de permutaes de

n elementos distintos dado

por:

Pn = n!

A soluo no

R,

para o nmero de permutaes possveis, dada por:

require(combinat)
nsamp(n=5, k=5, replace=FALSE, ordered=TRUE)

Exemplos:
1) Quantos so os anagramas da palavra BRASIL?

Soluo:

Os comandos a seguir, no

R,

calculam o nmero de permutaes e quais so elas.

require(combinat)
nsamp(n=6, k=6, replace=FALSE, ordered=TRUE)
DD = c('B','R','A','S','I','L')
Perm = unlist(permn(DD))
t(array(Perm, dim = c(6, gamma(7))))

Permutaes

113

2) Com os algarismos

1, 3, 4, 6, 7

9,

quantos nmeros pares de seis algarismos distintos podem ser escritos?

Soluo:
Para formar um nmero par deve-se primeiro escolher o algarismo da casa das unidades, que pode ser o 4 ou 6.
Como so algarismos distintos, a quantidade de nmeros pares que se pode formar :
2 P5 = 2 5! = 2 120 = 240.

Permutaes com elementos repetidos


Quantas permutaes podem ser formadas com elementos no distintos? Por exemplo, com as
letras

A, A,

B,

h apenas 3 permutaes:

(A, A, B), (A, B, A)


Se as letras A e A fossem distintas (por exemplo

A1

A2 ,

(B, A, A)

ento as permutaes seriam:

(A1 , A2 , B), (A2 , A1 , B), (A1 , B, A2 ), (A2 , B, A1 ), (B, A1 , A2 )

(B, A2 , A1 )

Sabe-se que o nmero de permutaes de 3 elementos distintos

P3 = 3! = 6.

elementos tiver 2 elementos repetidos, este nmero ca dividido por

2!

V-se que se entre os 3

(que o nmero de permutaes dos

2 elementos se eles forem considerados distintos). Indica-se o nmero de permutaes de 3 elementos sendo
2 repetidos por

P32 .

Tem-se:

P32 =
Quando se tem

elementos, dos quais

n1

3!
6
= = 3.
2!
2

so repetidos de um tipo,

n2

so repetidos de outro tipo,

repetidos de outro tipo e assim por diante, o nmero de permutaes que se pode formar dado por:

Pnn1 ,n2 ,n3 , ,nk =

n!
,
n1 !n2 !n3 ! nk !

(n1 + n2 + n3 + + nk = n)

Exemplos:
1) Quantos so os anagramas da palavra ELEGER?

Soluo:
ELEGER 6 letras, sendo 3 E, 1 L, 1 G, 1 R. O nmero de anagramas :
P63 =

6!
6 5 4 3!
=
= 120
3!
3!

n3

so

114

Captulo 8. Anlise Combinatria

2) Quantos so os anagramas da palavra ESTATSTICA?

Soluo:
ESTATSTICA 11 letras, sendo 1 E, 2 S, 3 T, 2 A, 2 I, 1 C. O nmero de anagramas :
3,2,2,2
P11
=

11!
= 831.600
3!2!2!2!

3) Quantos so os anagramas da palavra VETERINRIA?

Soluo:
VETERINRIA 11 letras, sendo 1 V, 2 E, 1 T, 2 R, 2 I, 1 N, 2 A. O nmero de anagramas :
2,2,2,2
P11
=

11!
= 2.494.800
2!2!2!2!

Exerccios:
1) Quantos nmeros pares so obtidos permutando-se os algarismos

1, 2, 2, 3, 3, 3

4?

2) Determine o nmero de permutaes que podem ser feitas com as letras de cada palavra:

a) ORDEM

c) AMAZONAS

b) DOMINAR

d) MANADA

3) Sete atletas participam de uma prova de atletismo.

No ocorrendo nenhum empate, quantas so as

classicaes possveis nesta prova?


4) De quantas formas 5 sinais +, 3 sinais - e 2 sinais   podem ser colocados em sequncia?
5) Numa mesa de bilhar h 4 bolas vermelhas, 3 bolas brancas, 2 amarelas e uma verde, encostadas umas
nas outras, em linha reta. De quantas maneiras pode-se dispor estas bolas obtendo coloridos diferentes?

8.4 Arranjos e Combinaes


8.4.1 Combinaes
H no Hospital Veterinrio da UEL dois animais para serem adotados. Como h quatro pessoas
interessadas, Andressa, Fernanda, Herick e Igor, ser realizado um sorteio. Os alunos sorteados podero ser:
Andressa e Fernanda

ou

Andressa e Herick

ou

Andressa e Igor

Fernanda e Herick

ou

Fernanda e Igor

ou

Herick e Igor

Arranjos e Combinaes

115

Cada uma dessas possibilidades um agrupamento das 4 pessoas tomadas 2 a 2.


agrupamentos, a ordem citada dos elementos no importa.

Em cada um destes

Note, por exemplo, que sortear Andressa e

Fernanda ou Fernanda e Andressa exatamente a mesma coisa.


Quando se agrupam elementos em que a
chamados de

combinaes.

ordem do agrupamento no importa,

estes so

As combinaes so conjuntos cujos elementos so escolhidos entre os elementos

dados.

Denominam-se

combinaes

de

elementos distintos tomados

elementos distintos escolhidos entre os

aos conjuntos formados de

elementos dados.

No exemplo citado, considerando-se os elementos

Andressa, Fernanda, Herick e Igor

as combinaes destes 4 elementos tomados 2 a 2 so:


{Andressa e Fernanda}

{Andressa e Herick}

{Andressa e Igor}

{Fernanda e Herick}

{Fernanda e Igor}

{Herick e Igor}

Observe que duas combinaes so diferentes apenas quando tm elementos diferentes.

8.4.2 Arranjos
Suponha que os animais a serem adotados so de espcies diferentes: um canino e um felino.
Assim, a

1a

pessoa sorteada adotar o co e a

2a

pessoa sorteada adotar o gato. Neste caso, se as pessoas

sorteadas fossem Andressa e Fernanda, nesta ordem, Andressa caria com o co e a Fernanda com o gato.
Mas, se os sorteados fossem Fernanda e Andressa, nesta ordem, Fernanda caria com o co e Andressa com
o gato.
Tem, neste caso, uma situao em que os agrupamentos:

Andressa e Fernanda

Fernanda e Andressa

so considerados agrupamentos diferentes.


Quando se agrupam elementos de modo que em cada agrupamento
elementos, estes agrupamentos so chamados

arranjos

dos

arranjos.

de

elementos distintos tomados

distintos escolhidos entre os

elementos dados.

Denominam-se

importa a ordem

No exemplo citado, considerando-se os elementos

s sucesses formadas de

termos

116

Captulo 8. Anlise Combinatria


Andressa, Fernanda, Herick e Igor

os arranjos destes 4 elementos tomados 2 a 2 so:


(Andressa, Fernanda)

(Andressa, Herick)

(Andressa, Igor)

(Fernanda, Andressa)

(Fernanda, Herick)

(Fernanda, Igor)

(Herick, Andressa)

(Herick, Fernanda)

(Herick, Igor)

(Igor, Andressa)

(Igor, Fernanda)

(Igor, Herick)

Observe que dois arranjos so diferentes se tiverem elementos diferentes, ou se tiverem os mesmo elementos
porm em ordens diferentes.

Exemplos:
1) Formar as combinaes dos algarismos

1, 3, 5, 7

tomados

2.

Soluo:
As combinaes so os conjuntos de dois algarismos escolhidos entre os algarismos dados:
{1, 3}, {1, 5}, {1, 7}, {1, 9}, {3, 5}, {3, 7}, {3, 9}, {5, 7}, {5, 9}, {7, 9}

2) Formar os arranjos dos algarismos

1, 3, 5

tomados

3.

Soluo:
Os arranjos so as sucesses de trs algarismos distintos escolhidos entre os algarismos dados:
(1, 3, 5), (1, 3, 7), (1, 5, 7), (1, 5, 3), (1, 7, 3), (1, 7, 5)
(3, 1, 5), (3, 1, 7), (3, 5, 1), (3, 5, 7), (3, 7, 1), (3, 7, 5)
(7, 1, 3), (7, 1, 5), (7, 3, 1), (7, 3, 5), (7, 5, 1), (7, 5, 3)

Exerccios:
1) Forme as combinaes das letras a, b, c e d tomadas duas a duas.
2) Forme os arranjos das letras a, b, c e d tomadas duas a duas.
3) Quatro equipes, A, B, C e D, esto classicadas para o quadrangular nal de um campeonato em que as
trs primeiras colocadas sero premiadas (com prmios diferentes).
a) Escreva todas as possibilidades para as trs primeiras colocaes no campeonato.
b) Cada uma destas possibilidades corresponde a um arranjo ou a uma combinao das equipes tomadas
trs a trs?

Quantidade de Arranjos

117

4) Cesar, Diego, Maisa, Nara e Sabrina entregaram o trabalho relativo pesquisa feita no Hospital Veterinrio
da UEL e dois deles sero escolhidos para uma apresentao perante a classe.

a) Escreva todas as possibilidades de escolha dos dois que faro a apresentao do trabalho.
b) Cada uma destas possibilidades corresponde a um arranjo ou a uma combinao dos 5 alunos tomados
dois a dois?

8.5 Quantidade de Arranjos


O nmero de arranjos de

elementos tomados

ser denotado por

An,k

(ou pelo smbolo

Akn ).
Para determinar esta quantidade de arranjos, deve-se formar uma sucesso de
entre os

k termos escolhidos

elementos dados:

1o termo

1o

2o

3o

pode ser qualquer um dos

ko

. . .,

elementos dados; h, portanto,

possibilidades para

ele.
Para cada uma destas possibilidades, o

2o termo do arranjo poder ser qualquer um dos (n 1)


(n 1)

elementos restantes, excludo aquele j escolhido. H, portanto,

3o

Para cada par de elementos j escolhidos, o


elementos restantes. H, portanto,

(n 2)

possibilidades para o

2o

termo.

termo poder ser qualquer um dos

possibilidades para o

3o

(n 2)

termo.

E assim por diante.

(
Arranjo

possibilidades

1o

2o

3o

. . .,

ko

(n 1)

(n 2)

n (k 1)

Pelo princpio fundamental da contagem, conclui-se que a quantidade de arranjos que podem ser
formados :

An,k =

n!
(n k)!

Exemplos:
1) Quantos so os arranjos de 6 elementos, tomados 3 a 3?

118

Captulo 8. Anlise Combinatria


Soluo:
An,k =

n!
(n k)!

6!
(6 3)!

A6,3 =

A6,3 = 120

2) Vinte equipes cursos disputam o campeonato interno da UEL de futebol de salo. Quantas so as possibilidades de classicao nos dois primeiros lugares (campeo e vice-campeo)?

Soluo:
An,k =

n!
(n k)!

A20,2 =

20!
(20 2)!

A20,2 = 380

Exerccios:
1) Calcule os nmeros

a)

A5,2

c)

A10,4

b)

A8,5

d)

A12,3

2) Numa corrida de frmula 1 h 24 pilotos participando e apenas os dez primeiros colocados ganham pontos.
Quantas so as possibilidades de classicao nos 10 primeiros lugares?

3) Com as letras da palavra FLAMENGO, quantas palavras distintas formadas de 5 letras distintas podem
ser escritas? (As palavras no precisam ter sentido na linguagem comum).

4) Sero eleitas duas pessoas para representarem os alunos do curso Medicina Veterinria.

Uma ser o

representante principal e a outra ser suplente. Dez alunos esto interessados. Quantos so os possveis
resultados da eleio.

8.6 Quantidade de Combinaes


O nmero de combinaes de
smbolo

Cnk .

elementos tomados

ser denotado por

Para determinar esta quantidade de combinaes deve-se lembrar que com

a1 , a2 , a3 , , ak

Cn,k

(ou pelo

elementos distintos:

Quantidade de Combinaes
podem ser obtidas

k!

119

permutaes:

(a1 , a2 , a3 , , ak ), (a2 , a1 , a3 , , ak ), (a3 , a1 , a2 , , ak ), etc


Isto signica que a partir de uma combinao pode-se obter

k!

arranjos dos

Ento, o nmero de combinaes igual ao nmero de arranjos dividido por

Cn,k =

elementos tomados

k.

k!:

An,k
k!

Logo

Cn,k =

n!
k!(n k)!

Exemplos:
1) Quantas so as combinaes de 6 elementos tomados 2 a 2?

Soluo:
Cn,k =

n!
k!(n k)!

C6,2 =

6!
2!(6 2)!

2) Em um experimento com camundongos sero utilizados 5 deles.

C6,2 = 15

No laboratrio h 15 camundongos

em condies homogneas e que podem ser utilizados no experimento. De quantos modos diferentes o
experimento pode ser realizado?

Soluo: Como so 15 camundongos e apenas 5 sero utilizados no experimento, basta calcular o nmero de
combinaes possveis.
Cn,k =

n!
k!(n k)!

Exerccios:
1) Calcule os nmeros:

C15,5 =

15!
5!(15 5)!

C15,5 = 3.003

120

Captulo 8. Anlise Combinatria

a)

C8,6

c)

C7,4

b)

C12,3

d)

C100,2

2) Calcule o valor de

na equao

Cn,2 = n + 2.

3) Numa festa compareceram 36 pessoas.

Se cada uma delas cumprimentou todas as outras ao chegar,

quantos cumprimentos foram realizados?


4) Numa urna h 12 etiquetas numeradas, 6 com nmeros positivos e 6 com nmeros negativos. De quantos
modos pode-se escolher 4 etiquetas diferentes tal que o produto dos nmeros nelas marcados seja positivo?

Captulo 9

Noes sobre a teoria das


probabilidades
Conceitos probabilsticos so necessrios para se estudar fenmenos aleatrios, isto , situaes
em que os resultados possveis so conhecidos, mas no se pode saber a priori qual deles ocorrer.
Caso os fenmenos estudados, repetidos sob as mesmas condies iniciais, levem sempre ao
mesmo resultado, eles so chamados de determinsticos.
O

tem um pacote chamado

prob,

muito interessante, para clculo de probabilidades.

Tal

pacote ser utilizado neste captulo, para tanto carregue o pacote:

>

require(prob)

9.1 Conceitos Bsicos em Probabilidade


9.1.1 Experimento Aleatrio
um processo de coleta de dados relativo a um fenmeno que acusa variabilidade em seus
resultados. Os resultados no sero previsveis, sero diferentes mesmo que as condies iniciais sejam sempre
as mesmas.

Exemplos:
a) o lanamento de uma moeda;
b) lanar trs moedas justas e observar as faces voltadas para cima;
c) lanar um dado e observar a face voltada para cima;
d) anotar o resultado de um exame de gravidez;
e) colocar 20 sementes em um germinador e observar, aps um certo perodo de tempo, o nmero de sementes
germinadas;

121

122

Captulo 9. Noes sobre a teoria das probabilidades


Quando se tem um experimento aleatrio, no se pode prever com certeza o resultado. Pode-se,

no entanto, descrever todos os possveis resultados deste experimento.

9.1.2 Espao Amostral


O conjunto de

todos os resultados possveis de um experimento aleatrio chamado de espao

amostral. Vamos represent-lo por

Exemplos:
a) o lanamento de uma moeda:

= {C, K},

em que: C = cara e K = coroa;

>

tosscoin(1);

>

urnsamples(1:2, x = c(`C',`K'), size=1, replace=TRUE, ordered=TRUE)

b) lanar trs moedas justas e observar as faces voltadas para cima:

= {CCC, CCK, CKC, CKK, KCC, KKC, KCK, KKK};


>

tosscoin(3);

>

urnsamples(1:2, x = c(`C',`K'), size=3, replace=TRUE, ordered=TRUE)

c) lanar um dado e observar a face voltada para cima;

= {1, 2, 3, 4, 5, 6};
>

rolldie(1)

d) anotar o resultado de um exame de gravidez;

= {P ositivo, N egativo};
>

urnsamples(1:2, x = c(`Positivo',`Negativo'), size=1, replace=TRUE, ordered=TRUE)

e) colocar 20 sementes em um germinador e observar, aps um certo perodo de tempo, o nmero de sementes
germinadas:

= {0, 1, 2, . . . , 20}
>

urnsamples(1:20, x = c(0:20), size=1, replace=T, ordered=TRUE)

9.1.3 Evento
qualquer subconjunto do espao amostral. Os eventos so geralmente representados por letras
maisculas, como A, B, C,

. . ..

Dentre os eventos a considerar, deve-se incluir o prprio espao amostral

(evento certo) e o conjunto vazio (evento impossvel).

Conceito de Probabilidade
Exemplo:

123

Um experimento foi conduzido com a nalidade de se conhecer a ecincia de um tratamento na

cura de certa doena. Para tanto, trs doentes foram tratados com a referida droga. O espao amostral

dado por:

= {CCC; CCC; CCC; CC C; C CC; CCC; CCC, C C C}


em que: C = cura e

= no cura.

O espao amostral, construindo no

>

R,

ser dado por:

(Tr = urnsamples(1:2, x = c('C','NC'), size=3, replace=T, ordered=TRUE))

Considere os seguintes eventos:

A = {Obter duas curas}

B = {Obter quatro curas}

A = {CCC; CCC; CCC}

B=

>A

O evento

= Tr[c(2,3,5),]

denominado evento impossvel.

9.2 Conceito de Probabilidade


9.2.1 Conceito Clssico ou a priori
Pelo conceito clssico, tem-se que:

a) a probabilidade denida com base em dados do experimento aleatrio;

b) a probabilidade obtida antes de o experimento ser realizado e, da, o nome a priori;

O conceito clssico surgiu no sculo XVII a partir dos jogos de azar e dene a probabilidade de
o evento

ocorrer como sendo:

P (A) =

Exemplo:

Nmero de resultados favorveis a A


Nmero de resultados possveis

No lanamento de um dado honesto, qual a probabilidade de o resultado ser um nmero:

a) mpar?

b) Menor que 3?

c) Primo?

Assim, para o clculo de probabilidades de modelo igualmente provveis usando o

R,

tem-se:

124

Captulo 9. Noes sobre a teoria das probabilidades

(S.dado = round(rolldie(1, makespace=TRUE), 4))


probspace(1:6)
iidspace(c(`1',`2',`3',`4',`5',`6'), ntrials = 1, probs = c(1/6,1/6,1/6,1/6,1/6,1/6))
> I = sum(S.dado[c(1,3,5),2]) ; I
> M = sum(S.dado[c(1,2),2]) ; M
> P = sum(S.dado[c(2,3,5),2]) ; P
Observe que as trs primeiras linhas so formas diferentes de se obter as probabilidades dos
valores observados do lanamento de um dado.
importante notar que a denio clssica exige que os resultados tenham todos a mesma
chance. Se os resultados no tm a mesma chance, deve-se apelar para a estimativa pela frequncia relativa.
Mas como podemos calcular as probabilidades a priori nas seguintes situaes:
a) Uma pessoa que fuma um pacote de cigarros por dia desenvolver cncer;
b) Ocorrer uma geada no prximo inverno;
c) Haver uma exploso na populao de desfolhadores presentes numa oresta de eucalipto;
d) Encontrar uma rvore de mogno num parcela de

numa oresta nativa;

400 m3 /ha.

e) A produo mdia de uma oresta superar

Exemplo:

1 ha

Planejamento Familiar

Um casal planeja ter lhos at terem uma menina e no mximo quatro lhos. Qual a probabilidade de este
casal ter uma lha?
Esta questo pode ser respondida com o uso de simulao:
1) Utilize a tabela de nmeros aleatrios e selecione 20 nmeros:

1 2 7

0 3

5 6 3

0 6

2 1

2) Os nmeros pares representam meninas (F) e os mpares, meninos (M):

3) Agrupe os nmeros de acordo com planejamento do casal para simular as diferentes possibilidades de lhos.
Numere cada simulao como uma famlia:

Observe que 8 famlias foram geradas por simulao.

Conceito de Probabilidade

125

4) Calcule a probabilidade de ocorrncia do evento

P (A)

A=

{o casal ter uma lha}:

Nmero de ocorrncias de A

Nmero de repeties

P (A) =

8
= 1.
8

a) Ser que a probabilidade de 100%?


b) Ser que se for selecionado um outro conjunto de 20 nmeros aleatrios obter-se- a mesma probabilidade?

Para responder s questes anteriores, repete-se a simulao com vrios grupos. Assim, tem-se:

Grupo

No

10

11

12

13

14

15

16

17

18

19

de

Famlias

No

de

Famlias com
Filhas

O clculo da probabilidade, por simulao, :

P (A)

Total de famlias com lhas


Nmero total de famlias

P (A) =

O clculo da probabilidade pode ser efetuado da seguinte forma:

Nmero de tentativas

Probabilidades

0, 5

0, 5 0, 5 =

0, 5 0, 5 0, 5 =
F

0, 5 0, 5 0, 5 0, 5 =

0,5
0,25
0,125
0,0625

0, 9375
Que uma aplicao do modelo geomtrico.

Exemplo:
1) Dentre 10.878 partos sucessivos que ocorreram em uma maternidade de So Paulo, e que resultaram em
crianas vivas, 100 foram de gmeos. Qual a probabilidade (em porcentagem) de nascimento de um par de
gmeos entre os recm-nascidos vivos que podem ser estimados a partir desses dados? Considere o evento

como sendo nascimento de um par de gmeos.

20

126

Captulo 9. Noes sobre a teoria das probabilidades

9.3 Propriedades da Probabilidade


As probabilidades sempre se referem a ocorrncia de eventos e, independentemente do conceito
utilizado, clssico ou frequentista, o modelo de probabilidade em Bioestatstica ter sempre uma

coerncia

interna que resulta dos axiomas de probabilidade:


0 P (A) 1
P () = 1
P () = 0

Obs.:

Se

for o evento complementar de

A,

ento

= 1 P (A).
P (A)

9.4 Diagramas de Venn


9.4.1 Operaes com Eventos
Em muitos problemas de probabilidade
interessam-nos eventos que podem ser expressos
em termos de dois ou mais eventos, formando
unies, intersees e complementos.

Os espaos

amostrais e os eventos, especialmente as relaes

diagramas de Venn, que auxiliam na visualizao


entre os eventos, costumam ser ilustrados por
dos conceitos bsicos de probabilidade.

9.4.1.1 Unio de Eventos:


O evento unio de A e B equivale ocorrncia de A, ou de B, ou ambos. Contm os elementos
do espao amostral que esto em pelo menos um dos dois conjuntos.
Diz-se ocorre A
Notao:

>

union(A, B)

ou B .

Diagramas de Venn

127

9.4.1.2 Interseo de Eventos:


A interseo de dois eventos
simultaneamente em
Notao:

>

e em

B.

B,

o evento que consiste de todos os elementos contidos

Contm todos os pontos comuns a A e B.

intersect(A, B)

9.4.1.3 Sub-Conjuntos:
Diz-se:  B sub-conjunto de

A

ou  B implica em

A.

B A = A
BA
B A = B

Notao:

S
B
A

9.4.1.4 Eventos Disjuntos:


Dois eventos A e B, dizem-se disjuntos ou mutuamente exclusivos, quando a ocorrncia de um
deles impossibilita a ocorrncia do outro. Os dois eventos no tm elementos em comum.

128

Captulo 9. Noes sobre a teoria das probabilidades

S
B
A

Notao:

B=

9.4.1.5 Complemento:
o evento que consiste de todos os elementos do espao amostral que

no esto contidos em

A, ou seja, a negao de A.
Notao:

Ac .

Ac A = S
c
A
Ac A =

Sc
A

>

setdi(A, B)

9.4.2 Regras de Clculo de Probabilidades


Utilizando os diagramas de Venn torna-se mais fcil compreender algumas regras que surgem
naturalmente no clculo de probabilidades.

Regra 1: Probabilidade da unio de eventos


P (A B) = P (A) + P (B) P (A B)

Se

forem mutuamente exclusivos, tm-se

P (A B) = 0,

e o teorema ca sendo:

P (A B) = P (A) + P (B)

Diagramas de Venn
Exemplo:

129

Considere o experimento lanamento de um dado e os seguintes eventos:

a) A = sair o nmero 3;

b) B = sair nmero par, e

c) C = sair nmero mpar.

Determinar:

P (A);

P (B);

P (A B);

P (C);

P (A C)

P (Ac ).

Soluo:

Obs.:

Pode-se determinar a probabilidade da unio de trs ou mais eventos, usando a teoria de conjuntos.

Assim, se considerarmos trs eventos,

P (A B C) =

A, B

C,

a probabilidade da unio dos trs eventos dada por:

P [(A B) C]

= P (A B) + P (C) P [(A B) C]
= P (A) + P (B) P (A B) + P (C) P (A C) P (B C) + P (A B C)
P (A B C) = P (A) + P (B) + P (C) P (A B) P (A C) P (B C) + P (A B C)

> (S = rolldie(1, makespace=TRUE))


> (A = subset(S, X1 == "3"))
> (B = subset(S, X1 %in% c(2,4,6)))
> (C = subset(S, X1 %in% c(1,3,5)))
> prob(A) ; prob(B) ; prob(C)
> union(A, B) ; prob(union(A,B))
> union(A, C) ; prob(union(A,C))
> setdiff(S, A) ; prob(setdiff(S, A))

130

Captulo 9. Noes sobre a teoria das probabilidades

Regra 1B: Probabilidade da unio de eventos disjuntos


Se

so disjuntos

AB =

P (A B) = 0.

Portanto, a probabilidade da unio de eventos disjuntos ca:

P (A B) = P (A) + P (B)

Regra 2: Probabilidade da unio de uma sequncia de eventos disjuntos


Se

A1 , A2 , A3 , . . . ,

formam uma sequncia de eventos disjuntos, ento:

)
Ai

i=1

Exemplo:

P (Ai ).

i=1

No lanamento de duas moedas temos:

= pelo menos uma cara,

= duas coroas. Qual a

probabilidade de duas coroas ou pelo menos uma cara?

Soluo:

> (L = tosscoin(2, makespace=TRUE))


> A1 = subset(L, toss1=="H") ; A2 = subset(L, toss2=="H")
> (A = union(A1, A2))
> (B = subset(L, toss1=='T' & toss2=='T'))
> prob(union(A,B))

Regra 3: Probabilidade do complemento


Do diagrama de Venn, tm-se que

P (S) = 1,

e que

A Ac =

sendo

P () = 0,

A Ac = S P (A Ac ) = P (S).

logo:

P (A Ac ) = P (S)
P (A) + P (Ac ) = 1
P (Ac ) = 1 P (A).

Mas, sabe-se que:

Probabilidade Condicional
Exemplo:

131

Um dado lanado 10 vezes, qual a probabilidade de A = pelo menos um 6?

Soluo:

9.5 Probabilidade Condicional


Algumas vezes a chance de um particular evento acontecer depende do resultado de algum
outro evento. Por exemplo, a chance de um paciente com alguma doena sobreviver o prximo ano depende,
naturalmente, de ter sobrevivido no presente perodo.
A probabilidade do evento

condicional de A dado B,

denota-se por

ocorrncia de ambos os eventos

>

A, quando se sabe que o evento B

P (A|B).

ocorreu, chamada

probabilidade

Pode ser determinada dividindo-se a probabilidade de

pela probabilidade do evento

B,

como se mostra a seguir:

P (A|B) =

P (A B)
,
P (B)

se

P (B) > 0

P (B|A) =

P (A B)
,
P (A)

se

P (A) > 0

prob(A, given=B)

ou, ainda,

>

prob(B, given=A)
Na probabilidade condicional, a ocorrncia de um evento altera a probabilidade de ocorrncia de

outro evento.

Exemplo:

Em uma pesquisa realizada no Hospital Veterinrio da Universidade Estadual de Londrina, no ano

de 2010, foram coletadas diversas informaes e, entre elas, o Porte do animal e o Sexo do mesmo, conforme
apresentado na Tabela 9.1.

132

Captulo 9. Noes sobre a teoria das probabilidades


Tabela 9.1  Distribuio dos animais quanto ao Porte e Sexo.
Porte

Sexo
Pequeno

Total

Mdio

Grande

Fmea

649

41

77

767

Macho

495

27

65

587

1.144

68

142

1.354

Total

Considerando-se que o animal escolhido de mdio porte, qual a probabilidade de ser fmea? Dado que o
animal macho, qual a probabilidade de ser de grande porte?

Soluo:

9.5.1 Probabilidade Condicional no Diagrama de Venn


Nota-se, atravs do diagrama de Venn, que a probabilidade condicional apenas uma reduo
do espao amostral, ao evento que j ocorreu.

Se o evento A ocorreu, o resultado est em

Se o evento B ocorreu, o resultado est em

A, ou seja,

B, ou seja,

Exemplo:

P (A B)
P (B|A) =
P (A).

Um nmero sorteado ao acaso entre os inteiros

qual a probabilidade de que seja o nmero 9?

Soluo:

P (A|B) =

1, 2, . . . , 15.

P (A B)
P (B).

Se o nmero sorteado for mpar,

Probabilidade Condicional

133

Para resolver o problema com a utilizao do

R,

basta simular o lanamento de um dado com

15 faces, da seguinte forma:

> (S = rolldie(1, nsides = 15, makespace = TRUE))


> (A = subset(S, X1 %in% c(1,3,5,7,9,11,13,15)))
> (B = subset(S, X1 %in% c(9)))
> prob(B, given=A)

9.5.2 Aplicao da Probabilidade Condicional




Epictetus , no sculo II D.C., arma que as aparncias para a mente so de quatro tipos:

as coisas so o que parecem ser;

ou so e no parecem ser;

ou no so, mas parecem ser;

ou no so, nem parecem ser.

de forma que pode-se resumir essa relao entre

Mente

Parecer

+
-

parecer e ser em uma tabela da seguinte forma:

Ser

As coisas so o que parecem ser

No so mas parecem ser

So mas no parecem ser

No so e nem parecem ser

Da mesma forma, pode-se pensar na relao entre uma doena e o teste para detect-la. Pode-se
resumir esta relao da seguinte forma:

http://epiclcn.blogspot.com.br/ em 14/06/2012.

134

Captulo 9. Noes sobre a teoria das probabilidades

Relao

Teste

Doena

Verdadeiro positivo

Falso positivo

Falso negativo

Verdadeiro negativo

Portanto, o bom uso de um teste diagnstico requer, alm de consideraes clnicas, o conhecimento de medidas que caracterizam a sua qualidade: a sensibilidade, a especicidade e os parmetros que
reetem a sua capacidade de produzir decises clnicas corretas: valor da predio positiva (VPP) e o valor
da predio negativa (VPN).
Na anlise da qualidade de testes diagnsticos, interessa conhecer duas

probabilidades condi-

cionais que, pela sua importncia, recebem nomes especiais: sensibilidade e especicidade.
A sensibilidade, denotada por

s,

denida como:

s = P (T+ |D+ ),
ou seja, a probabilidade de o teste ser positivo sabendo-se que o paciente que est sendo examinado doente.
Portanto, a sensibilidade mede a capacidade de reao do teste em um paciente doente
A especicidade, denotada por

e,

denida como:

e = P (T |D ),
ou seja, a probabilidade de o teste ser negativo sabendo-se que o paciente examinado no portador da
doena. Logo, a especicidade mede a capacidade de no reao do teste em pacientes no portadores da
doena.
Na etapa de pesquisa para a determinao do grau de conabilidade de um teste diagnstico, o
pesquisador utiliza-o primeiramente em dois grupos muito especcos de pessoas: um de portadores da doena
e outro de pacientes sem a doena em questo. Os resultados desta etapa da pesquisa podem ser resumidos
na forma da Tabela 9.2.

Tabela 9.2  Esquema padro de sntese dos dados para vericao da qualidade de um teste clnico.

Teste

Doena

Total

Positivo

Negativo

Presente

a+b

Ausente

c+d

Total

a+c

b+d

Para denir os ndices que descrevem o grau de conabilidade de um teste, precisamos trabalhar
com os seguintes eventos:

Probabilidade Condicional

135

T+

corresponde a teste positivo;

corresponde a teste negativo;

D+

corresponde a indivduo portador da doena;

corresponde a indivduo no portador da doena.


Usando a notao da Tabela 9.2 e a denio de probabilidade condicional, tm que a sensibili-

dade e a especicidade so dadas, respectivamente, por:

Sensibilidade

s=

Exemplo:

Especicidade

a
a+b

e=

d
c+d

 estudaram a qualidade da tomograa computadorizada para o diagnstico de

Linder & Singer

metstase de carcinoma de fgado, e os resultados resumidos na Tabela 9.3.

Tabela 9.3  Resultados da tomograa computadorizada em 67 pacientes com metstase e 83 sem


metstase do carcinoma heptico.

Metstase de

Tomograa computadorizada

Total

carcinoma heptico

Positiva (T+ )

Negativa (T )

Presente (D+ )

52

15

67

Ausente (D )

74

83

61

89

150

Total

A sensibilidade e a especicidade da tomograa computadorizada so estimadas por:

Sensibilidade

Especidade

s=

a
a+b

e=

d
c+d

s=

52
= 0, 776
67

e=

74
= 0, 892
83

Existem alguns pacotes no

que calculam a sensibilidade e especicidade do teste. Entre eles

pode-se citar: DiagnosisMed e epibasix, cujas aplicaes encontram-se a seguir.

> require(DiagnosisMed)
> diagnosis(52, 15, 9, 74)
> require(epibasix)
> dados = cbind(c(52,15), c(9,74))
> sensSpec(dados)


Diagnosing liver metastases: a Bayesian analysis.

Journal of Clinical Oncology, v.3, p.379-88, 1986

136

Captulo 9. Noes sobre a teoria das probabilidades

9.5.3 Valor das Predies


A sensibilidade e a especicidade, embora sendo ndices ilustrativos e bons sintetizadores das
qualidades gerais de um teste, tm uma limitao sria: no ajudam a deciso da equipe mdica que, recebendo
um paciente com resultado positivo do teste, precisa avaliar se o paciente est ou no doente. No se pode
depender apenas da sensibilidade e a especicidade, pois estes ndices so provenientes de uma situao em
que h certeza total sobre o diagnstico, o que no acontece no consultrio mdico. Da a necessidade destes
dois outros ndices que reetem melhor a realidade prtica.

Neste momento, interessa mais conhecer os

seguintes ndices denominados valor da predio positiva (VPP) e valor da predio negativa (VPN), denidos
respectivamente por:
Valor da predio positiva (VPP) a probabilidade do paciente estar realmente doente quando
o resultado do teste positivo.

V P P = P (D+ |T+ ) =

a
a+c

Valor da predio negativa (VPN) a probabilidade do paciente no estar doente quando o


resultado do teste negativo.

V P N = P (D |T ) =

d
b+d

Estes valores so probabilidade condicionantes, tal que o evento condicionante o resultado do


teste, aquele que na prtica acontece primeiro.
Uma forma de se calcular o VPP e VPN, em funo da sensibilidade e prevalncia da doena,

atravs da Tabela 9.4, sugerida por Vecchio . Seja p a prevalncia

da doena na populao de interesse,

isto , a proporo de pessoas doentes.

Tabela 9.4  Probabilidades necessrias para o clculo dos ndices VPP e VPN.

Populao

Proporo com resultado

Proporo

Positivo

Negativo

Doente

ps

p(1-s)

Sadia

1 - p

(1 - p) (1 - e)

(1 - p)e

Total

ps + (1 - p)(1 - e)

p (1 - s) + (1  p)e

Assim, o valor da predio positiva :


Predictive value of a single diagnostic test in unselected populations. The New England Journal of Medicine,
v.274, p.1171-3, 1966
a contagem do nmero de casos que existe em uma populao de pacientes em um momento especco no
tempo.

Probabilidade Condicional

137

V P P = P (D+ |T+ ) =

ps
.
ps + (1 p)(1 e)

O valor da predio negativa dado por:

V P N = P (D |T ) =

(1 p)e
.
p(1 s) + (1 p)e

Para o exemplo da Tabela 9.3, considere que a prevalncia de metstase de carcinoma de fgado
de 2%, os valores de predio da tomograa computadorizada so:

V PP
V PP

0, 02 0, 776
ps
=
ps + (1 p)(1 e)
0, 02 0, 776 + (1 0, 02)(1 0, 8916)
= 0, 1275.
=

V PN
V PN

(1 p)e
(1 0, 02) 0, 892
=
p(1 s) + (1 p)e
0, 02 (1 0, 776) + (1 0, 02) 0, 8916)
= 0, 9949.
=

Portanto, o valor de predio positiva baixo enquanto que o valor de predio negativa
bastante alto. Se o resultado da tomograa computadorizada negativo, a chance de no haver metstase
de 99,5%. O clculo de VPP e VPN no

V PP

usando o pacote DiagnosisMed dado por:

a
a+c

V PN =

d
b+d

9.5.4 Probabilidade da Interseco de Dois Eventos


A probabilidade condicional permite-nos calcular diretamente a probabilidade da interseco de
dois eventos. Assim,

P (A|B) =

>

P (A B)
P (B)

P (A B) = P (B) P (A|B)

P (A B)
P (A)

P (A B) = P (A) P (B|A)

prob(B)*prob(A, given=B)

ou, ainda.

P (B|A) =

>

prob(A)*prob(B, given=A)

138

Captulo 9. Noes sobre a teoria das probabilidades

Exemplo:

Considere os seguintes eventos:

= retirar uma carta de copas do baralho e

= retirar um s

do baralho. Determine a probabilidade desses eventos ocorrerem simultaneamente.

Soluo:

> require(MASS)
> CC = cards(makespace=TRUE)
> (A = subset(CC, suit == "Heart"))
> (B = subset(CC, rank == "A"))
> (B = subset(CC, rank %in% "A"))
> prob(A)*prob(B, given=A)
> fractions(prob(A)*prob(B, given=A))

9.5.5 Amostragem Sem Reposio


Considere uma urna contendo 3 bolas brancas e duas bolas pretas de onde so feitas duas
extraes de 1 bola ao acaso e

sem reposio.

Considere os seguintes eventos:


B1: sair bola branca na primeira extrao;
B2: sair bola branca na segunda extrao;
P1: sair bola preta na primeira extrao;
P2: sair bola preta na segunda extrao.
Os eventos B1 e B2 so independentes?

Os eventos P1 e P2 so independentes?

Pede-se:
a) Calcular a probabilidade de sair branca na

1a

extrao e preta na

2a

extrao.

b) Construir o espao amostral e indicar as probabilidades associadas a cada um dos pontos amostrais.
Calcular as probabilidades:

Probabilidade Condicional
a) de sair bola branca na
b) de sair bola preta na

2a

2a

139

extrao;

extrao;

c) de ter sado bola preta na primeira extrao sabendo-se que (dado que) saiu bola branca na segunda
extrao;
d) de ter sado bola preta na primeira extrao sabendo-se que (dado que) saiu bola preta na segunda extrao.

9.5.6 Amostragem com Reposio


Considere o mesmo caso anterior, mas
da

2a

com reposio

da

1a

bola extrada, antes da extrao

bola.

Os eventos B1 e B2 so independentes?

Os eventos P1 e P2 so independentes?

Construir o espao amostral e indicar as probabilidades associadas a cada um dos pontos amostrais.
Calcular as probabilidades:
a)

P (B2 );

b)

P (P2 );

c)

P (B2 |B1 );

d)

P (B2 |P1 );

e)

P (P2 |B1 );

f)

P (P2 |P1 );

Independncia de Eventos
Dois eventos so considerados independentes quando a ocorrncia de um deles no depende da
ocorrncia do outro, isto ,

P (A|B) = P (A)

P (B|A) = P (B).

Logo, o teorema do produto para dois

eventos independentes dado por:

P (A B) = P (A) P (B)

Exemplo 1:

Efeitos colaterais com o uso de certa droga ocorrem em 10% de todos os pacientes que a tomam.

Dois pacientes de um mdico esto tomando a droga.

140

Captulo 9. Noes sobre a teoria das probabilidades

a) Qual a probabilidade de que ambos os pacientes apresentem os efeitos colaterais?

Soluo:

b) Qual a probabilidade de que pelo menos um apresente os efeitos colaterais ?

Soluo:

Exemplo 2:

Suponha que a probabilidade de uma pessoa ser do tipo sanguneo O 40%, ser A 30% e ser

B 20%. Suponha ainda que a probabilidade de

Rh+

de 90% e que o fator independe do tipo sanguneo.

Nestas condies, qual a probabilidade de uma pessoa tomada ao acaso da populao ser:

a) O e

Rh+ ?

Soluo:

b) AB e

Rh ?

Soluo:

Probabilidade Condicional

141

9.5.7 Teorema de Bayes


Uma das relaes mais importantes envolvendo probabilidades condicionais e dada pelo

de Bayes.

Sejam

A1 , A2 , A3 , , Ak

Teorema

eventos mutuamente excludentes cuja unio o espao amostral

que suas probabilidades sejam conhecidas. Assim, se

P (Ai |B) =

um evento qualquer, tem-se o seguinte teorema:

P (Ai ) P (B|Ai )
k

i = 1, , k.

P (Ai )P (B|Ai )

i=1

Exemplo:

Sabe-se que dos animais atendidos pelo Hospital Veterinrio da Universidade Estadual de Londrina,

40% so provenientes da regio norte, 15% da regio sul, 20% da regio leste, 15% da regio oeste da cidade
de Londrina e os 10% restantes so provenientes de outras cidades. Observou-se, ainda, que 5% dos animais
da regio norte foram submetidos a algum procedimento cirrgico, enquanto que para as outras regies os
percentuais foram: 3% para a regio sul, 8% para a regio leste, 4% para a regio oeste e 15% para outras
cidades. Uma cha escolhida aleatoriamente acusou que o animal foi submetido a um procedimento cirrgico.
Qual a probabilidade desse animal ser de outra cidade?

Soluo:

142

Captulo 9. Noes sobre a teoria das probabilidades

Exerccios - Probabilidades
1) Para cada um dos casos abaixo, escreva o espao amostral correspondente e conte seus elementos.

a) Uma moeda lanada duas vezes e observam-se as faces obtidas.


b) Um dado lanado duas vezes e a ocorrncia de face par ou mpar observada.
c) Uma urna contm 10 bolas azuis e 10 vermelhas com dimenses rigorosamente iguais. Trs bolas so
selecionadas ao acaso com reposio e as cores anotadas.
d) Em uma cidade, famlias com 3 crianas so selecionadas ao acaso, anotando-se o gnero de cada uma.

2) Em 750 pessoas utilizadas para pesquisa de tipo sanguneo, vericou-se:

Tipos

Pessoas

85

193

252

Sorteando-se uma pessoa ao acaso, qual a probabilidade da mesma ser do tipo sangneo AB?

3) Uma urna contm duas bolas brancas (B ) e trs bolas vermelhas (V ). Retira-se uma bola ao acaso da
urna. Se for branca, lana-se uma moeda; se for vermelha, ela devolvida urna e retira-se outra. D o
espao amostral para o experimento.

4) Lance um dado at que a face 5 aparea pela primeira vez. Enumere os resultados possveis desse experimento.

5) Dentre seis nmeros positivos e oito negativos, dois nmeros so escolhidos ao acaso e multiplicados. Qual
a probabilidade de que o produto seja positivo?

6) Um casal pretende ter lhos. Admitindo probabilidades iguais para ambos os sexos, qual a probabilidade
de que venha a ter trs lhos do mesmo sexo?

7) Num grupo de 30 animais, 12 esto com parasitose intestinal. Trs animais so escolhidos ao acaso, um
aps o outro, sem reposio. Qual a probabilidade de pelo menos 2 deles no estarem infectados?
8) Considere o lanamento de dois dados. Considere os eventos:
A = soma dos nmeros obtidos igual a 9, e
B = nmero do primeiro dado maior ou igual a 4.
Enumere os elementos de A ou B. Obtenha

A B, A B

Ac

e suas probabilidades.

Probabilidade Condicional

143

9) Uma universidade tem 10 mil alunos dos quais 4 mil so considerados esportistas. Temos ainda que 500
alunos so do curso de biologia diurno, 700 da biologia noturno, 100 so esportistas e da biologia diurno
e 200 so esportistas e da biologia noturno. Um aluno escolhido ao acaso e pergunta-se a probabilidade
de:
a) ser esportista;
b) ser esportista e aluno da biologia noturno;
c) no ser da biologia;
d) ser esportista ou aluno da biologia;
e) no ser esportista nem aluno da biologia.

10) Uma fazenda contm quatro bezerros Nelore, cinco Gir e seis Guzer. Outra fazenda contm cinco bezerros
Nelore, seis Gir e dois Guzer. Sorteia-se um bezerro de cada fazenda. Qual a probabilidade de que ambos
sejam da mesma raa?

11) Num cruzamento de galos de pescoo pelado com galinhas do mesmo tipo, temos a probabilidade de

1/4

para obter um lho de pescoo coberto. Numa ninhada de seis pintos, qual a probabilidade de que nenhum
tenha pescoo coberto?

12) Sabendo-se que 2% dos exames clnicos feitos por um laboratrio apresentam falha humana, 1% falha
tcnica e 2,5% pelo menos uma das duas falhas, qual a probabilidade de um exame ter as duas falhas?

13) Uma fazenda composta de 70% de animais machos e 30% de fmeas. Sabe-se que 40% dos machos e
60% das fmeas so da raa Nelore. Qual a probabilidade de que escolhido um animal da raa Nelore, ele
seja macho?

14) Uma escola do ensino mdio do interior de So Paulo tem 40% de estudantes do gnero masculino. Entre
estes, 20% nunca viram o mar, ao passo que, entre as meninas, essa porcentagem de 50%.

Qual a

probabilidade de que um aluno selecionado ao acaso seja:


a) do gnero masculino e nunca tenha visto o mar;
b) do gnero feminino ou nunca tenha visto o mar.

15) O Londrina Esporte Clube ganha com probabilidade


a probabilidade de chuva de

0, 3.

0, 7

se chove e com

0, 8

se no chove. Em agosto

O Londrina Esporte Clube ganhou uma partida em agosto, qual a

probabilidade de ter chovido nesse dia?

16) Dos animais de uma fazenda, 60% so castrados. Se no for castrado, a probabilidade de ter tido um distrbio hormonal de 10%, enquanto que para os demais essa probabilidade aumenta para 30%. Pergunta-se:

144

Captulo 9. Noes sobre a teoria das probabilidades

a) qual a probabilidade do animal escolhido ao acaso ter tido um distrbio hormonal?


b) Se o animal sorteado tiver distrbio hormonal, qual a probabilidade de no ser castrado?

17) Uma urna contm 10 bolas verdes, 8 vermelhas, 4 amarelas, 4 pretas e cinco brancas, todas de mesmo
raio. Uma bola retirada ao acaso. Qual a probabilidade de a bola escolhida ser:

a) no verde;

c) vermelha ou preta;

b) no-branca ou vermelha;

d) verde, vermelha ou amarela.

18) Uma urna contm 15 cartes enumerados de 1 a 15.

Um carto retirado aleatoriamente.

Qual a

probabilidade de o nmero no carto ser mltiplo de 3?

19) Joga-se um dado branco e um dado preto. Calcule a probabilidade de:

a) Ocorrer soma 6;

c) ocorrer soma 2;

b) ocorrer soma 11;

d) no ocorrer nem soma 2 e nem 8.

20) Uma carta retirada de um baralho comum de 52 cartas. Qual a probabilidade de:

a) sair uma carta vermelha;

c) sair um rei ou uma carta de copas.

b) sair uma carta de copas;

21) Um nmero inteiro escolhido ao acaso dentre os nmeros

1, 2, 3, . . . , 30.

Qual a probabilidade de:

a) o nmero ser divisvel por 3;


b) o nmero ser divisvel por 5;
c) o nmero ser divisvel por 5 ou por 3;
d) o nmero no ser divisvel nem por 3 e nem por cinco.

22) Uma moeda viciada, de maneira que as caras so 3 vezes mais provveis de aparecer do que as coroas.
Se esta moeda lanada duas vezes. Qual a probabilidade de ocorrer cara apenas uma vez?

Probabilidade Condicional
23) Das 8 alunas de uma classe, 3 tm olhos azuis.

145
Se duas delas so escolhidas aleatoriamente, qual a

probabilidade de:

a) ambas terem olhos azuis;


b) nenhuma ter olhos azuis;
c) pelo menos uma ter olhos azuis?

24) De 120 estudantes, 70 estudam matemtica, 80 estudam portugus e 40, matemtica e portugus. Se um
estudante escolhido aleatoriamente, encontre a probabilidade dele:

a) estudar matemtica ou portugus;

d) no estudar matemtica;

b) s estudar portugus;

e) no estudar nem portugus e nem estudar mate-

c) s estudar matemtica;

mtica.

25) Em uma prova caram dois problemas. Sabe-se que 132 alunos acertaram o primeiro problema, 86 erraram
o segundo, 120 acertaram os dois e 54 acertaram apenas um problema. Qual a probabilidade de que um
aluno, escolhido ao acaso:

a) no tenha acertado nenhum problema;


b) tenha acertado apenas o segundo problema;
c) tenha acertado a pelo menos um problema.

26) Um professor de probabilidade props a seus alunos o seguinte problema: So dadas duas moedas, uma
perfeita (probabilidade de cara igual 1/2), e outra com duas caras. Uma moeda escolhida ao acaso e
lanada trs vezes. Qual a probabilidade que seja obtida 3 caras?

Captulo 10

Variveis aleatrias discretas


10.1 Conceitos Iniciais
Exemplo:
Um pesquisador desenvolveu uma nova tcnica de inseminao articial que, segundo ele, garante
60% de sucesso. Um fazendeiro resolveu aplicar esta nova tcnica em seus animais. Para isso ele selecionou
3 animais de seu rebanho.
Considere inicialmente, o experimento:
resultado. Seja

o evento o animal emprenhar e

aplicar a nova tcnica de inseminao e observar o


o evento o animal no emprenhar.

a) Construir o espao amostral associado a esse experimento;


b) Calcular as probabilidades associadas a cada um dos elementos do espao amostral;
c) Considerar

Y o nmero de animais prenhes

e associar um valor

a cada um dos elementos do espao

amostral.

O diagrama da rvore facilita a visualizao do espao amostral, quando o tamanho da amostra


a ser coletada no grande.

146

Conceitos Iniciais

147
Resultados Possveis

<E

E
E

"

E
J

<E

"

<E

"

<E

"

Probabilidades

EEE

0,216

EE E

0,144

E EE

0,144

EE

0,096

EEE

0,144

EE

0,096

EE

0,096

E
E

0,064

Logo, o espao amostral dado por:

{
}
E EE,
EE
E,
EEE,

E,
E
EE,
E
E
E

= EEE, EE E,
EE

e as probabilidades associadas a cada ponto do espao amostral so dadas por:

P (EEE) = 0, 216
= 0, 144
P (EE E)

P (EEE)
= 0, 144

P (EE E) = 0, 096

P (E EE)
= 0, 144

P (E E E) = 0, 096

EE)

P (E
= 0, 096

P (E E E) = 0, 064

148

Captulo 10. Variveis aleatrias discretas

10.2 Varivel Aleatria Discreta


Uma funo denida sobre o espao amostral
de pontos do conjunto real dita uma

e assumindo valores num conjunto enumervel

varivel aleatria discreta.

10.2.1 Distribuio de uma Varivel Aleatria


O conjunto dos valores da varivel e as respectivas probabilidades, ou seja,

i = 1, . . . , n chamado distribuio
n

Observao:
P (yi ) = 1.
i=1
Costuma-se adotar, tambm, a notao
assumir o valor

da varivel aleatria

P (Y = yi )

Y = {nmero

de animais prenhe} dada por:

yi

P (Y = yi )

0,064

0,288

0,432

0,216

Y.

cuja representao grca apresentada na Figura 10.1.

0.40

0.35

0.30
Probabilidades

P (yi ),

para designar a probabilidade de a varivel aleatria

Tabela 10.1  Distribuio da varivel aleatria

0.25

0.20

0.15

0.10

0.05
0

Y.

yi .

Portanto, a distribuio da varivel aleatria

yi

Nmero de Sucessos

Figura 10.1  Grco das probabilidades de prenhez dos animais.

Varivel Aleatria Discreta

149

Qual a porcentagem esperada de :

a) trs animais emprenharem?

b) nenhum animal emprenhar?

c) pelo menos um animal emprenhar?

Para elaborar a Tabela 10.1 e construir o grco usando o

R,

bastam os comandos:

vacas = 0:3
prob_suc = 0.6
prenhez = data.frame(Pr = dbinom(vacas, 3, prob_suc))
rownames(prenhez) = 0:3
prenhez
plot(vacas, dbinom(vacas, size=3, prob=prob_suc), xlab="Nmero de Sucessos",
ylab="Probabilidades", main=`', axes=F, type="h", col=`blue')
points(vacas, dbinom(vacas, size=3, prob=prob_suc), pch=16, , col=`blue')
axis(1, vacas)
axis(2, seq(0, 0.45, .05), las=1)
abline(h=0, col="gray", cex=2.5, lwd=2)
box(bty=`l')

10.2.2 Funo de Probabilidade


A funo que fornece as probabilidades de ocorrncias dos valores que a varivel aleatria pode
assumir chamada funo de probabilidades.

Exemplo:

A funo de probabilidades da varivel

Y ={nmero

( )
3
P (Y = y) =
0, 6y (1 0, 6)3y ,
y

em que

(3)
y

Exerccios:

y = 0, . . . , 3.

3!
.
y!(3 y)!

Calcular

P (Y = 0), P (Y = 1), P (Y = 2)

interpretar o resultado.

Soluo:

de animais prenhe} dada por:

P (Y = 3),

atravs da funo de probabilidades e

150

Captulo 10. Variveis aleatrias discretas

10.2.3 Valor mdio ou Esperana Matemtica de Y


Para responder sobre qual o nmero mdio esperado de animais emprenhados?

necessrio

calcular o valor mdio denido por:

Dada a varivel aleatria

Y , assumindo os valores y1 , y2 , . . . , yn com as respectivas probabilidades

P (y1 ), P (y2 ), . . . , P (yn ),

chamamos valor mdio ou

Y = E(Y ) =

esperana matemtica de Y

ao valor:

(10.1)

yi P (yi )

i=1

Exemplo:

Portanto,

Para os dados da Tabela 10.1, calcula-se a esperana de

yi

P (Y = yi )

0,064

0,288

0,432

0,216

Total

1,000

E(Y ) =

Interpretao:

como:

yi P (Y = yi )

animais emprenhados.

Espera-se obter um nmero mdio de

animais emprenhados.

Propriedades da Esperana Matemtica


Supondo

uma constante e

da esperana matemtica:
a)

E(k) = k

variveis aleatrias, pode-se denir as seguintes propriedades

Varivel Aleatria Discreta


b)

E(kX) = kE(X)

c)

E(X Y ) = E(X) E(Y )

d)

E(X k) = E(X) k

e) Se

151

so variveis aleatrias independentes, ento:

E(XY ) = E(X)E(Y ).

10.2.4 Varincia de Y
Dada a varivel aleatria

Y,

Y2 = V (Y ) =

chamamos de varincia de

n [

]2
yi E(Y ) P (yi ).

Y,

ao valor:

(10.2)

i=1

Logo, para o exemplo dado:

Portanto,

P (Y = y)

[yi E(Y )]2

[yi E(Y )]2 P (Y = y)

0,064

3,24

0,20736

0,288

0,64

0,18432

0,432

0,04

0,01728

0,216

1,44

0,31104

Total

1,000

V (Y ) = 0, 72.

Y =

0,72000

Assim, o desvio padro e o coeciente de variao so dados, respectivamente, por:

V (Y ) = 0, 8485281

CV =

Uma maneira mais prtica para o clculo da varincia de

Y2 = V (Y ) = E(Y 2 ) [E(Y )]

em que

E(Y 2 ) =

i=1

Logo,

yi2 P (Y = yi ).

Y
100 = 47, 14%.
Y

152

Captulo 10. Variveis aleatrias discretas

yi2

yi2 P (Y = y)

0,000

0,000

0,288

0,288

0,288

0,432

0,864

1,728

0,216

0,648

1,944

Total

1,000

1,8

P (Y = y)

0,064

y P (Y = y)

3,960

Assim,

[
]2
E(Y 2 ) E(Y )
( )2
3, 96 1, 8

V (Y ) =
V (Y ) =

V (Y ) = 0, 72.

Propriedades da Varincia
Supondo

uma constante e

variveis aleatrias, pode-se denir as seguintes propriedades

para a varincia:

a)

V (k) = 0

b)

V (kX) = k 2 V (X)

c)

V (X Y ) = V (X) V (Y ) + 2 COV (X, Y )

d)

V (X Y ) = V (X) V (Y ),

e)

V (X k) = V (X)

f ) Se

Obs.:

O fato de

se

so independentes.

so variveis aleatrias independentes, ento:

COV (X, Y ) = 0

no implica que

COV (XY ) = E(XY ) E(X) E(Y ) = 0.

sejam independentes.

10.2.5 Distribuio acumulada de uma varivel aleatria


O conjunto dos valores da varivel e as probabilidades acumuladas at os respectivos valores, ou
seja,

yi

F (yi ) = P (Y yi )

i = 1, 2, . . . , n

chamada distribuio acumulada da varivel aleatria

Obter a tabela de distribuio acumulada de probabilidades da varivel aleatria


acumulada de

relativos inseminao articial dos apresentados na Tabela 10.1.

Y.

ou distribuio

Varivel Aleatria Discreta

153

yi

P (Y = yi )

0,064

0,288

0,432

0,216

F(Y) =

P (Y yi )

cujo grco apresentado na Figura 10.2

1.0

Probabilidades

0.8

0.6

0.4

0.2

0.0

0.5

1.0

1.5

2.0

2.5

3.0

Nmero de Sucessos

Figura 10.2  Distribuio acumulada da prenhez dos animais.

Interpretar o valor

F (2).

(Acum = cumsum(dbinom(0:3, size=3, prob=0.6)))


Prenhez = data.frame(Acum)
rownames(Prenhez) = 0:3
Prenhez
plot(0:3, cumsum(dbinom(0:3, size=3, prob=0.6)), type=`s',
col=`blue', xlab=`Nmero de Sucessos', ylab="Probabilidades",
main="", las=1, bty=`l')#, xaxt=`n')
points(0:3, cumsum(dbinom(0:3, size=3, prob=0.6)), pch=19, col=`blue')

Exerccios:
1) Considere um pasto com 3 vacas da raa Holandesa e 5 vacas da raa Gir. Sero retirados do pasto 3
animais, atravs de sorteio e
raa Gir. Pede-se:

sem reposio.

Dena a varivel

como sendo o nmero de animais da

154

Captulo 10. Variveis aleatrias discretas

a) obter uma tabela contendo todos os possveis resultados desse experimento e as probabilidades associadas a cada um deles;
b) obter a distribuio da varivel aleatria

2) Seja

e um grco que a represente.

a varivel aleatria discreta nmero de bitos observados mensalmente no Hospital Veterinrio,

cuja distribuio de probabilidades dada por:

P (y)

0,1

0,2

0,3

0,2

0,1

0,1

Pede-se:

a) obter a funo de distribuio acumulada

F (y) para a varivel aleatria Y

e um grco que a represente;

b) calcular o nmero mdio de ovos;


c) calcular:
d) calcular

E(4Y ), E(Y + 1), E(Y 2 )


V ar(2Y )

e a varincia de Y;

V ar(Y + 1).

3) Em um experimento com chocadeira automtica so colocados 5 ovos e observado o nmero de ovos


eclodidos. Sabendo-se que teoricamente, 90% dos ovos eclodem, obter:

a) a distribuio de probabilidades da varivel aleatria

= {nmero de ovos eclodidos} e um grco

que a represente;
b) a probabilidade de pelo menos 3 ovos eclodirem;
c) a esperana e a varincia de

Y.

10.3 Principais Distribuies de Probabilidades


10.3.1 Distribuio de Bernoulli
 o espao amostral composto por apenas dois resultados pos-

Nos experimentos de Bernoulli

sveis: sucesso (resultado de interesse) ou fracasso (resultado pelo qual no estamos interessados).

Exemplos:
a) Lanar

uma moeda.

b) Inseminar

Pode sair cara ou coroa;

um animal.

Pode emprenhar ou no;

c) Colocar

uma estaca em um vaso com terra.

d) Plantar

uma semente.

Pode enraizar ou no;

Pode germinar ou no;

Jakob Bernoulli (Nascido em 27/12/1654 em Basel, Sua e falecido em 16/08/1705), tambm conhecido como
Jacob, Jacques ou James Bernoulli.

Principais Distribuies de Probabilidades


Seja

<

"

155

a varivel aleatria nmero de sucessos e

a probabilidade de ocorrer sucesso. Assim,

Resultados Possveis

Probabilidades

S (Sucesso)

1p
Y com

F (F racasso)

A distribuio de probabilidade de

0
distribuio de Bernoulli, com parmetro

dada

por:

Tabela 10.2  Distribuio da varivel aleatria

P (Y = y)

1p

Total

de Bernoulli.

Pode-se calcular a mdia desta distribuio utilizando-se a Equao (10.2.3). Assim:

= E(Y ) =

yi P (Y = yi )

i=1

= E(Y ) = 0 (1 p) + 1 p

= E(Y ) = p

Da Equao (10.2.4), pode-se calcular a varincia que :

V (Y ) =

n [
]2

yi E(Y ) P (Y = yi )

V (Y ) = E(Y 2 ) [E(Y )]2

i=1

V (Y ) = (0 p)2 (1 p) + (1 p)2 p

ou

[
]
V (Y ) = 02 (1 p) + 12 p [p]2

V (Y ) = p2 (1 p) + p(1 p)2

V (Y ) = p p2

V (Y ) = p(1 p)

V (Y ) = p (1 p)

Portanto,

V (Y ) = p(1 p)

E(Y ) = p
e

Notao: Y Be(p).
Funo de Probabilidades:

A funo de probabilidades de uma distribuio de Bernoulli dada por:

156

Captulo 10. Variveis aleatrias discretas


P (Y = y) = py (1 p)1y ,

y = 0, 1.

10.3.2 Distribuio Binomial


a mais importante das distribuies de probabilidades discretas.

Tem esse nome devido ao

clculo das probabilidades ser feito usando termos da expanso do binmio de Newton. O teorema do binmio
de Newton dado por:

(x + y)

n ( )

n
k=0

xnk y k

( )
( )
( )
( )
n n0 0
n n1 1
n n2 2
n nn n
x
y +
x
y +
x
y + ... +
x
y
0
1
2
n
( )
( )
n n2 2
n n3 3
n
n1 1
= x + nx
y +
x
y +
x
y + . . . + yn
2
3

=
(x + y)

em que

( )
n
n!
=
.
k
k!(n k)!

Casos particulares do Binmio de Newton so:

(x + y) = x + y
2

(x + y) = x2 + 2xy + y 2
3

(x + y) = x3 + 3x2 y + 3xy 2 + y 3
4

(x + y) = x4 + 4x3 y + 6x2 y 2 + 4xy 3 + y 4


Para que a varivel aleatria de um experimento tenha distribuio binomial necessrio atender
as seguintes condies:
a) supor uma srie de

realizaes

independentes

(o resultado de um experimento no afetado pelo

resultado dos outros) de Bernoulli;


b) a probabilidade de sucesso em cada realizao sempre

constante e igual a p;

c) o nmero de sucessos observado um nmero inteiro entre

n.

Ento diz-se que a varivel aleatria Y = {nmero de sucessos} nos


com parmetros

ensaios tem

distribuio binomial

p.

Notao: Y Bin(n, p).


Funo de Probabilidades:
Bin(n, p)

A funo de probabilidades de uma varivel

dada por:

( )
n y
P (Y = y) =
p (1 p)ny ,
y

y = 0, 1, . . . , n.

com distribuio binomial

Principais Distribuies de Probabilidades


em que

( )
n
n!
; p
=
y
y!(n y)!

157

a probabilidade de sucesso e

(1 p)

a probabilidade de fracasso.

Bin(10; 0, 3),

Considere uma varivel aleatria com distribuio binomial


uma varivel, cujo nmero de ensaios ser igual a

10

ou seja, o estudo de

realizaes e a probabilidade de sucesso igual a

30%.

O grco desta situao apresentado na Figura 10.3.

0.25

Probabilidades

0.20

0.15

0.10

0.05

0.00
0

10

Nmero de Sucessos

Figura 10.3  Grco da distribuio Binomial, para

n = 10

ensaios com probabilidade de sucesso

p = 0, 30.
Para gerar o grco da distribuio no

4 bastam os seguintes comandos:

par(mai=c(.8, .8, .2, .2))


plot(dbinom(db, size=10, prob=0.3) ~ db, type="h", col=`blue',
bty=`l', xlab="Nmero de Sucessos", ylab="Probabilidades", main=`', axes=F)
points(db, dbinom(db, size=10, prob=0.3), pch=16, , col=`blue')
axis(1, db)
axis(2, seq(0, 0.45, .05), las=1)
abline(h=0, col="gray", cex=1.5, lwd=1)
box(bty=`l')
Se o interesse for apenas nos valores das probabilidades, os mesmos podem ser obtidos com:

data.frame(Pr=dbinom(0:10, size=10, prob=0.3))


A esperana e a varincia de uma varivel aleatria
dadas, respectivamente, por:

com distribuio binomial

Bin(n, p)

so

158

Captulo 10. Variveis aleatrias discretas


V (Y ) = n p (1 p)

E(Y ) = n p
e

Exemplo 1:

Uma moeda lanada dez vezes. Qual a probabilidade de se obter duas caras? Determine a

esperana e a varincia.

Soluo:

dbinom(2, size=10, prob=0.5)


moeda = 0:10
(proba = dbinom(moeda, size=10, prob=0.5) )
require(distrEx)
Y = DiscreteDistribution(supp=moeda, prob=proba)
E(Y) ; var(Y) ; sd(Y)
plot(proba ~ moeda, las=1, type="h", col=`blue',
xlab="Nmero de Sucessos", ylab="Probabilidades", main=`')
abline(h=0, col=`gray')
axis(1, at=c(0:10))

Exemplo 2:

Uma infeco experimental em camundongos determina morte de 30% dos animais a ela subme-

tidos. Qual a probabilidade de obter num lote de 10 animais, uma mortalidade de, no mximo 20%?

Soluo:

Principais Distribuies de Probabilidades

159

dbinom(0:10, 10, .3)


pbinom(2, size=10, prob=0.3)

Exemplo 3:

Voc leva sua cadela ao veterinrio e descobre atravs de um exame de ultrasonograa que ela

est grvida de 8 lhotes.


a) Qual a probabilidade de que exatamente 3 dos lhotes sejam fmeas?

Soluo:

dbinom(3, size=8, prob=0.5)

b) Qual a probabilidade de que existam um nmero igual de machos e fmeas?

Soluo:

dbinom(4, size=8, prob=0.5)

c) Qual a probabilidade de que existam mais machos do fmeas?

Soluo:

160

Captulo 10. Variveis aleatrias discretas

pbinom(3, size=8, prob=0.5)

10.3.3 Distribuio de Poisson


 largamente empregada quando se deseja contar o nmero de ocor-

A distribuio de Poisson

rncias (sucessos) de um evento de interesse, por unidade de tempo, comprimento, rea ou volume. tambm
chamada de distribuio dos eventos raros.

Exemplos:
a) Nmero de insetos de uma espcie coletados por armadilha por dia;

b) Nmero de furos em pneus por

c) Nmero de bactrias por

ml

km

rodado;

de urina;

d) Nmero de pacientes que chegam a um pronto atendimento de uma pequena cidade durante a madrugada;

e) Nmero de rvores de uma certa espcie, por

ha.

Note que os possveis valores que as variveis descritas podem assumir so:

0, 1, . . . ,.

O comportamento dessas variveis pode ser descrito pela chamada

Funo de Probabilidades:

A funo de probabilidades de uma varivel

distribuio de Poisson.

com distribuio Poisson

P oi()

dada por:

P (Y = y) =

em que

e y
,
y!

y = 0, 1, . . .

igual ao nmero mdio de ocorrncias do evento de interesse por unidade de tempo, distncia ou

rea.

Notao: Y P oi().
O grco gerado pela funo de probabilidades de uma distribuio de Poisson, para
apresentado na Figura 10.4.

Simon-Denis Poisson, matemtico Francs, 17811840.

= 4,

Principais Distribuies de Probabilidades

161

0.20

Probabilidades

0.15

0.10

0.05

0.00
0

10

11

12

Figura 10.4  Grco da distribuio de Poisson, cuja mdia

Obs.:

Para valores de

maiores que 12, com

= 4,

= 4, 0.

as probabilidades tendem a zero.

Os pressupostos bsicos para a utilizao do modelo so:


1) as condies permanecem estveis no decorrer do tempo, isto , a taxa mdia de ocorrncias () constante
ao longo do tempo;

2) intervalos de tempo disjuntos so independentes, isto , a informao sobre o nmero de ocorrncias em


um intervalo nada revela sobre o nmero de ocorrncias em outro intervalo.
A esperana e a varincia de uma varivel aleatria

com distribuio Poisson

P oi()

so

dadas, respectivamente, por:

E(Y ) =

V (Y ) =
e

Exemplo 1:

Um pesquisador est interessado no nmero de ovos depositados por uma espcie de pssaro.

Na primavera, ele procura e encontra 80 ninhos. O nmero mdio de ovos por ninho foi 3,8 e a varincia foi
3,1. Porque a varincia aproximadamente igual mdia, ele acha que pode ser razovel descrever o nmero
de ovos por ninho como tendo uma distribuio Poisson com mdia 3,8.

a) Construa o grco da distribuio;

plot(0:12, dpois(0:12, lambda=3.8), type=`h', las=1, bty=`l',


xlab=`Nmero de Ovos', ylab="Probabilidades", axes=F)
points(0:12, dpois(0:12, lambda=3.8), pch=19, col=`red')
axis(1, at=c(0:12), line=-1.15)
axis(2, seq(0, 0.25, 0.05), las=1)
abline(h=0, col="black")

162

Captulo 10. Variveis aleatrias discretas

b) Se esta realmente representa a distribuio populacional, qual seria a probabilidade de no encontrar ovo
num ninho?

Soluo:

dpois(0, lambda=3.8)

c) Qual seria a probabilidade de encontrar um ninho com mais do que 5 ovos?

Soluo:

1 - ppois(5, lambda=3.8)

d) Qual a probabilidade de encontrar de 3 a 6 ovos?

Soluo:

dpois(3:6, 3.8)
sum(dpois(3:6, 3.8))

Exemplo 2:

Uma vacina contra a febre aftosa tem probabilidade igual a

0, 001

de no imunizar um animal.

Se forem vacinados cinco mil animais, qual a probabilidade de no carem imunes:

a) trs animais;

Principais Distribuies de Probabilidades

163

Soluo:

dpois(3, lambda=5)

b) dois animais ou mais.

Soluo:

1 - ppois(1, lambda=5)

Exemplo 3:

O nmero de consultas mdicas anuais de um associado de um plano de sade , naturalmente,

um nmero nito.

Uma aproximao, que simplica a especicao de sua distribuio, supor que pode

tomar qualquer valor do conjunto {0, 1, 2, . . . }. Em um plano de sade com 5.694 liados, ao m de um
ano, foram realizadas

13.098

consultas, de acordo com os dados apresentados na Tabela 10.3.

Tabela 10.3  Nmero de consultas realizadas pelos liados ao plano de sade.

Nmero de consultas

Frequncias

Frequncias

589

304

1.274

126

1.542

39

1.144

10

663

Pede-se:
a) Especique o modelo de Poisson para esses dados.

Soluo:

Nmero de consultas

164

Captulo 10. Variveis aleatrias discretas

b) Qual a probabilidade de se ter 7 consultas ou mais?

Soluo:

ncons = c(0, 1, 2, 3, 4, 5, 6, 7, 8, 9)
Obs = c(589, 1274, 1542, 1144, 663, 304, 126, 39, 10, 3)
(saude = data.frame(ncons, Obs)) ; attach(saude)
(media = weighted.mean(ncons, Obs))
dpois(0:9, lambda=media)
1 - ppois(6, lambda=media)

c) Compare os valores observados com o esperado pelo modelo.

Soluo:

(Esp = round(5694*dpois(0:9, lambda=media), 0))


(compara = data.frame(ncons, Obs, Esp))

10.3.4 Aproximao da Distribuio Binomial pela Distribuio de Poisson


A distribuio de Poisson,

bin(n, p)

quando

Exemplo:

Seja

for pequeno,

P ois(),

com

= np uma boa aproximao distribuio binomial

for bastante grande e de tal forma que

np 7.

a varivel aleatria efeito colateral a um medicamento. De acordo com o fabricante do

medicamento, a probabilidade de um animal sofrer efeito colateral devido ao medicamento de 0,0005. O


plantel da fazenda de 10.000 animais. Calcule:

Principais Distribuies de Probabilidades

165

a) a probabilidade de nenhum animal sofrer efeito colateral;

Soluo:

n = 10000
p = 0.0005
lambda = n*p
dpois(0, lambda)

b) a probabilidade de pelo menos um animal sofrer efeito colateral;

Soluo:

1 - dpois(0, lambda)

c) a probabilidade do nmero de animais com efeitos colaterais estar entre 3 e 5 animais, inclusive.

Soluo:

ppois(5, lambda) - ppois(2, lambda)

10.3.5 Distribuio Geomtrica


Destinada ao clculo de probabilidades de situaes em que so feitas sucessivas tentativas
independentes de um mesmo experimento aleatrio at que aparea o
como sucesso e

como fracasso, e realizarmos

1 sucesso.

Assim, se designarmos

n ensaios at que ocorra o primeiro sucesso, o espao amostral

deste experimento ser o conjunto:

= {S, F S, F F S, . . . , F F F S, . . .}

166

Captulo 10. Variveis aleatrias discretas


Logo, um elemento tpico desse espao amostral uma sequncia de comprimento

primeiras

n1

posies temos

F,

ou seja, ocorrncia de fracassos e na

n-sima

n em que nas

ocorre o sucesso

S.

A distribuio geomtrica apresenta duas parametrizaes importantes, que tem interpretaes


distintas. Uma das parametrizaes da funo geomtrica conta o nmero de ensaios de Bernoulli necessrio
para se obter um sucesso. Assim neste tipo de parametrizao no possvel se ter o zero, portanto nesta
parametrizao da geomtrica o domnio ser o conjunto dos nmeros naturais sem o zero.
As principais caractersticas so:
a)

o nmero de ensaios necessrios para obter o

primeiro sucesso;

b) as tentativas so sucessivas e independentes, com probabilidade de sucesso

p;

A funo de probabilidade dada por:

P (X = x) = p (1 p)x1

x = 1, 2, . . .

A segunda parametrizao da geomtrica conta o nmero de falhas at que ocorra o primeiro


sucesso. Note que neste tipo de parametrizao pode-se incluir o zero como sendo um possvel resultado, pois
pode-se ter sucesso j no primeiro ensaio de Bernoulli. esta parametrizao que usada como padro pelo

R.
a)

As principais caractersticas so:

o nmero de falhas at obter o

primeiro sucesso;

b) as tentativas so sucessivas e independentes, com probabilidade de sucesso

p;

A funo de probabilidade dada por:

P (Y = y) = p (1 p)y

Notao:

Exemplo:

y = 0, 1, 2, . . .

Y G(p).
A probabilidade de se encontrar aberto o sinal de trnsito numa esquina

0, 20.

Qual a probabilidade

de que seja necessrio passar pelo local 5 vezes para encontrar o sinal aberto pela primeira vez?

Soluo:

dgeom(4, prob=0.20)

Principais Distribuies de Probabilidades


Exemplo:

167

Um casal com problemas para engravidar, recorreu a uma tcnica de inseminao articial no

intuito de conseguir o primeiro lho. A ecincia da referida tcnica de


o casal obtenha xito na terceira tentativa?

Soluo:

dgeom(2, prob=0.40)

0, 40.

Qual a probabilidade de que

168

Captulo 10. Variveis aleatrias discretas

Exerccios - Variveis Aleatrias Discretas


Procure fazer os clculos utilizando uma calculadora e depois
utilize o R para comprovar os resultados manuais.

R$ 30.000, 00

1) Uma seguradora paga

em caso de acidente de carro e cobra uma taxa de

Sabe-se que a probabilidade de que um carro sofra acidente de


por carro segurado? Resp:

3%.

Quanto espera a seguradora ganhar

E(Y ) = R$100, 00.

2) Suponha que um nmero seja sorteado de 1 a 10, inteiros positivos.

Seja

o nmero de divisores do

nmero sorteado. Calcular o nmero mdio de divisores do nmero sorteado. Resp:

3) Seja

uma varivel com distribuio binomial com parmetros

os grcos da distribuio de

Y,

em que se aumenta o valor de

4) Num jogo de dados,

paga

para os valores de

Se sair face 1 em dois dados apenas,

ganha

R$ 80, 00.

Calcular o lucro lquido mdio de

4.000

E(Y ) = 3, 15

ou
e

ganha

R$ 50, 00,

A
A

E(Y ) = R$ 9, 21.

pessoas em cada carro que v ao litoral num sbado so,

0, 10.

Qual o nmero mdio de pessoas por carro? Se chegam

10

horas de contagem? Resp:

R$ 600, 00

e retira aleatoriamente uma

pessoas.

bolas numeradas de

bola. Se retirar a bola

faa

e se sair 1 nos trs dados,

em uma jogada. Resp:

carros por hora, qual o nmero esperado de pessoas, em

6) Uma urna contm

1, 2, 3, 4

0, 05, 0, 20, 0, 40, 0, 25

126.000

R,

e lana 3 dados. Se sair face 1 em um dos dados apenas,

R$ 20, 00.

no litoral

Utilizando o

n?

R$ 20, 00

5) As probabilidades de que haja

Y Bin(n, 0, 20).

E(Y ) = 2, 7.

= 5, 10, 15, 20, 30, 50. O que voc nota medida

ganha

respectivamente:

R$ 1.000, 00.

6 recebe R$ 1.500, 00;

6.

Uma pessoa paga

se retirar as bolas

2, 3, 4 ou 5 nada recebe;

ir escolher outra bola, sem repor a primeira, e se esta segunda for a bola 6, recebe

contrrio, nada recebe. Calcular quanto a pessoa que est jogando espera lucrar. Resp:

e se retirar a bola

R$3.600, 00;

caso

R$ = 230, 00.

7) Uma moeda lanada 20 vezes. Qual a probabilidade de sarem 8 caras? Calcule a esperana e varincia.
Faa o grco da distribuio usando o

R.

Resp: 0,12013; 10; 5.

8) Sabe-se que 20% dos animais submetidos a um certo tratamento no sobrevivem. Se esse tratamento foi
aplicado em 20 animais e se X o nmero de no sobreviventes:
a) faa o grco da distribuio;
b) qual o nmero mdio esperado de animais sobreviventes; Resp: 16.
c) Calcule a varincia e o desvio padro de X; Resp: 3,2 ; 1,788854.

Principais Distribuies de Probabilidades


d) Calcular a

P (2 < X 4);

e) Calcular a

P (X 2).

169

Resp: 0,4236.

Resp: 0,9308.

9) Em 30 bezerros nascidos, 60% foi do sexo feminino.

Calcular o valor esperado (esperana) e o desvio

padro esperado. Faa o grco. Resp: 18; 2,683282.

10) Seja

X Bin(10, 2/3).

Calcular:

a) P(X=3); Resp: 0,01626


b)

P (X 2);

Resp: 0,003404

c)

P (X 4);

Resp: 0,98034

d)

P (3 < X < 5);

Resp: 0,05690235

e) E(X) e V(X). E(X) = 6,6667 e V(X) = 2,2222.

11) Sabe-se que 10% das vacinas de um determinado laboratrio tem validade vencida. Retiram-se, casualmente, 10 vacinas de uma partida, qual a probabilidade de:
a) todas as vacinas estarem com validade vencida? Resp:
b) no mximo trs com validade vencida? Resp:
c) existir vacina com validade vencida? Resp:
d) uma vacina com validade vencida? Resp:

1, 0 1010

0, 9298

0, 6513

0, 3874

Qual o nmero mdio de vacinas vencidas? Resp:

E(X) = 1

12) Suponha que sabido que 30% de uma certa populao so imunes a alguma doena. Se uma amostra
aleatria de tamanho 10 selecionada desta populao, qual a probabilidade de que:
a) ela contenha exatamente 4 pessoas imunes? Resp: 0,20012
b) ela contenha mais que 4 pessoas imunes? Resp: 0,15027.
c) Construa a distribuio de probabilidade e faa o grco.

13) Em uma grande populao, 16% dos membros so canhotos. Em uma amostra aleatria de tamanho 10,
encontre:
a) a probabilidade de que exatamente dois sejam canhotos; Resp: 0,28555
b)

P (X 2);

Resp: 0,49195

c)

P (X < 2);

Resp: 0,50805

d)

P (1 X 4).

Resp: 0,81209

170

Captulo 10. Variveis aleatrias discretas

14) Suponha que a probabilidade de recuperao para uma certa doena seja conhecida e igual a 0,4. Se 15
contraem a doena (assuma como sendo uma amostra aleatria), qual a probabilidade que:

a) trs ou mais se recuperem? Resp: 0,972886


b) quatro ou mais? Resp: 0,909498
c) cinco ou mais? Resp: 0,782722
d) menos que 3? Resp: 0,027114

15) Considerando que a probabilidade de nascer uma criana do sexo feminino de 47%, qual a probabilidade
de que uma famlia de 6 lhos seja constituda por seis crianas do sexo feminino? Resp: 0,01077922

16) Um administrador de hospital, que tem estudado as admisses ao setor de emergncias diariamente, por
um perodo de alguns anos, chegou a concluso que elas so distribudas de acordo com a distribuio
de Poisson. Os registros do hospital revelam que as admisses ao setor de emergncias so, em mdia,
trs por dia, durante este perodo. Dado que o administrador est correto em assumir uma distribuio de
Poisson, encontra a probabilidade que:

a) exatamente duas admisses ao setor de emergncias ocorrero em um dado dia; Resp: 0,2240
b) nenhuma admisso ao setor de emergncias ocorrer em um dado dia; Resp: 0,0498
c) ocorram trs ou quatro admisses ao setor de emergncias em um dado dia. Resp: 0,3920

17) Em um estudo sobre um certo organismo aqutico, um grande nmero de amostras foram coletados de
um tanque, e o nmero de organismos em cada amostra foi contado. O nmero mdio de organismos por
amostra foi encontrado como sendo dois. Assumindo o nmero de organismos tendo uma distribuio de
Poisson, encontre a probabilidade que:

a) a prxima amostra coletada conter um ou mais organismos; Resp: 0,8647


b) a prxima amostra coletada conter exatamente trs organismos; Resp: 0,1804
c) Faa o grco da distribuio.

18) Um contador eletrnico de bactrias registra, em mdia, 5 bactrias por

cm3

de um lquido. Admitindo-se

que esta varivel tenha distribuio de Poisson:

a) qual o desvio padro do nmero de bactrias por

cm3 ?

Resp: 5

3
b) Encontre a probabilidade de que pelo menos duas bactrias ocorram num volume de lquido de 1cm .
Resp: 0,9596

Principais Distribuies de Probabilidades

171

19) Se a probabilidade de um indivduo sofrer uma reao nociva, resultante da infeco de um determinado
soro 0,0001. Determinar a probabilidade de, entre 2.000 indivduos:

a) exatamente trs sofrerem a reao; Resp: 0,0011


b) mais de dois sofrerem a reao. Resp: 0,0012

20) Num livro de 800 pginas h 800 erros de impresso. Qual a probabilidade de que uma pgina contenha
pelo menos 3 erros? Resp: 0,080301

21) Seja X a varivel aleatria nmero de plantas com mutao, em um total de n plantas irradiadas, e

p = 0, 0004

a probabilidade de uma planta irradiada apresentar mutao. Calcular, usando a distribuio

de Poisson como uma aproximao binomial:

a) a probabilidade de no aparecer nenhuma planta com mutao em 900 plantas irradiadas; Resp: 0,69768
b) a probabilidade de aparecer ao menos uma planta com mutao em 900 plantas irradiadas; Resp:
0,30232

22) Seja X o nmero de rvores de castanha-jarana (Lecythis lurida) por hectare numa oresta tropical. Suponha que X tem distribuio de Poisson (essa espcie distribui-se aleatoriamente pela regio) com mdia
3 plantas por hectare. Pede-se:

a) Calcular a probabilidade de se encontrar no mximo uma rvore dessa espcie, ao se observar 1 hectare
dessa oresta. Resp: 0,19915
b) Calcular a probabilidade de se encontrarem 3 ou mais rvores dessa espcie ao se observar 1 hectare
dessa oresta. Resp: 0,57681

A esperana a ltima que morre, mas a primeira a ser calculada".

Captulo 11

Variveis aleatrias contnuas


Uma varivel aleatria contnua pode tomar um nmero innito de valores, e esse valores podem
ser associados a mensuraes em uma escala contnua e as probabilidades necessrias ao seu estudo so
calculadas como a rea abaixo da curva da distribuio, chamada de funo densidade de probabilidade.

Denio:
a)

Uma varivel aleatria contnua

contnua em

se existir uma funo

f (y),

tal que:

f (y) 0, y ;

b) a rea entre o grco da funo

f (y)

e o eixo

igual a 1, ou seja,

f (y) dy = 1.

A funo

f (y)

chamada funo densidade de probabilidade (f.d.p.).

Observa-se que:

[
]
P aY b =

f (y)dy,

(11.1)

a
corresponde rea limitada pela funo

f (y),

eixo

e pelas retas

Y =a

Y = b.

Da relao entre a probabilidade e a rea sob a funo, a incluso ou no dos extremos


equao (11.1) no afetar os resultados. Assim, ser admitido que

[
]
[
]
[
]
[
]
P a<Y <b =P aY <b =P a<Y b =P aY b .

Exemplo:

Seja uma funo

f (y)

dada por:

0,

f (y) =
ay 3 ,

0,

se

y 0;

se

0 < y 2;

se

y>2

172

na

173
a

em que

uma constante. Obter

varivel aleatria contnua

de modo que

f (y)

seja uma funo densidade de probabilidade de uma

Y.

Soluo:

Se

Y = 2,

o eixo

f (y)
e a

uma funo densidade de probabilidade, a rea compreendida pelas retas

f (y),

Y = 0,

mostrada na Figura 11.1, ser igual a 1.

2.0

f(x)

1.5

1.0

0.5

0.0
0.0

0.5

1.0

2.0

Figura 11.1  Grco da funo

f (y) =

1 3
y .
4

A esperana matemtica (ou valor mdio) e a varincia de uma varivel aleatria contnua
so dadas, respectivamente, por:

Y = E(Y ) =

y f (y)dy

( )
2
Y2 = V (Y ) = E Y 2 [E(Y )]

em que,

E(Y ) =

y 2 f (y)dy .

Y,

174
Exerccio:

Captulo 11. Variveis aleatrias contnuas


Seja

uma varivel aleatria contnua com funo de probabilidade dada por:

f (y) =

a) Fazer o grco de

2y

se

y < 0;

se

0 y 1;

se

y > 1;

f (y);

Soluo:

b) Vericar se

f (y)

uma funo densidade de probabilidade;

Soluo:

c) Calcular

P (0 < Y < 0, 5);

Soluo:

d) Calcular a mdia e o desvio padro de Y.

Soluo:

Distribuio Normal

Se

175

uma varivel aleatria contnua com funo densidade de probabilidade

sua funo de distribuio acumulada

F (y)

F (y) = P (Y y) =
a

dene-se a

como:

Se

f (y)

f (t)dt.

forem dois nmeros reais quaisquer, tem-se que:

P (a < Y < b) = F (b) F (a).

11.1 Distribuio Normal


11.1.1 Introduo
Dentre todas as distribuies de probabilidades, sejam discretas ou contnuas, a mais estudada e
mais utilizada a distribuio normal. As principais razes que fazem a distribuio Normal o modelo mais
importante na estatstica so:
1) Muitas variveis biomtricas tendem a ter distribuio Normal. Isto ocorre principalmente quando a varivel
inuenciada por um grande nmero de fatores que atuam de modo independente e aditivo;
2) A distribuio das mdias amostrais de uma varivel qualquer tendem a ter distribuio Normal, mesmo
que a varivel em si no tenha distribuio Normal;
3) Muitos testes e modelos estatsticos tm como pressuposio a normalidade dos dados, isto , que os
dados possuem distribuio Normal.
A distribuio Normal tambm conhecida como distribuio Gaussiana em homenagem a
Karl F. Gauss (1777-1855), brilhante matemtico e fsico alemo, que a desenvolveu no incio do sculo XIX.
Entretanto, Abraham de Moivre (1667-1754) foi o primeiro a anunciar a equao da distribuio em 1733 e
Pierre-Simon Marquis de Laplace (1749-1827), famoso matemtico e fsico francs, a redescobriu na mesma
poca que Gauss. Para evitar uma questo internacional de originalidade o famoso estatstico ingls Karl
Pearson passou a cham-la de distribuio Normal em 1920.
A funo densidade de probabilidade de uma varivel aleatria contnua
buio normal, dada por:

Y,

seguindo uma distri-

176

Captulo 11. Variveis aleatrias contnuas


1

e 2

1
f (y) =
2 2

)2
,

para

< Y < ,

(11.2)

em que:

R,

a posio central da distribuio (mdia);

2 > 0,
y

a disperso da distribuio (varincia);

so os valores que a varivel aleatria em estudo

= 100

2 = 100,

assume,

apresentado na Figura 11.2.

0.4

0.4

0.3

0.3

f(x)

f(x)

cujo grco, supondo-se

0.2

0.2

0.1

0.1

0.0

0.0
a
60

80

100

120

140

Figura 11.2  Grco da Distribuio Normal.

Figura 11.3  Probabilidade entre as reas

b.

Esta distribuio apropriada para modelar variveis aleatrias contnuas, que assumem valores
em algum subconjunto dos nmeros reais.
pertencer a um certo intervalo

[a; b]

Neste caso, s faz sentido falar na probabilidade da varivel

que dada pela rea sob a curva e dentro deste intervalo.

Para se calcular a probabilidade da varivel aleatria

assumir valores entre

a rea compreendida entre estes intervalos usando a Equao 11.2. Assim:

P (a Y b) =
a

2 2

e 2

)2
dy

como pode ser observado na Figura 11.3.

11.1.2 Propriedades da Distribuio Normal


As principais caractersticas dessa funo so:
1) A funo gera um grco em forma de sino, sendo unimodal e simtrica;

a e b basta calcular

Distribuio Normal

177

2) denida por dois parmetros: a mdia () e o desvio padro ( ), sendo que a mdia controla a localizao
do centro da distribuio ( o ponto de simetria), j o desvio padro controla a disperso da curva ao redor
da mdia;
3) O ponto de mximo de

f (y)

o ponto

Y = ;

4) No possui limite inferior ou superior;


5) Unidades padres: o desvio padro dene unidades padres na distribuio a partir da mdia, isto , a
disperso dos dados controlada pelas unidades de desvio padro, como mostrado na Figura 11.7.

99,7%

95,4%

68,3%

Figura 11.4 

+ 2

desvio da mdia. Figura 11.5 

+ 3

desvios da mdia.Figura 11.6 

Figura 11.7  reas sob a curva normal.

6) Notao:

Exemplo:

Y N (, 2 ).

Suponha que os pesos de animais adultos da raa pastor alemo possam ser descritos por uma

distribuio normal, com mdia

26 kg

42 kg ,

34 kg

e desvio padro

4 kg .

Neste caso, a proporo dos ces tm pesos entre

por exemplo, a proporo da rea sob a curva normal entre

cerca de 95% dos ces tem pesos entre

26

42 kg .

26

42.

Ento neste exemplo,

Em termos probabilsticos, se a varivel aleatria

representa o peso dos ces e se um co for selecionado ao acaso ento

P ( 2 < Y < + 2) = P (26 < Y < 42) = 0, 9545


O clculo direto de probabilidades envolvendo a distribuio normal exige recursos do clculo
avanado e, mesmo assim, dada a forma da funo densidade, no um processo muito elementar. Por isso,
elas foram tabeladas, permitindo-nos obter diretamente o valor da probabilidade desejada. Note-se, entretanto,
que a funo densidade da normal depende de dois parmetros,

de modo que se as probabilidades

fossem tabeladas diretamente a partir dessa funo, seriam necessrias tabelas de dupla entrada, complicando
consideravelmente as coisas.

178

Captulo 11. Variveis aleatrias contnuas


O desvio padro representa o espalhamento na distribuio.

Assim, utilizando-se a ideia de

espalhamento como interpretao, de se esperar que uma distribuio normal com desvio padro 2 seja
mais espalhada que uma distribuio normal com um desvio padro 1. A Figura 11.8(a) mostra as curvas
com mesma mdia e desvios variando de

1
2 a

3.

Se xado o desvio padro para a distribuio e variando-se as mdias, tem-se um deslocamento da


mdia ao longo do eixo

Y.

Quanto maior for a mdia mais deslocada direita estar a curva. A Figura 11.8(b)

ilustra o fato.

0.8

0.4

sigma=1/2
sigma=1
sigma=2
sigma=3

0.3

f(x)

f(y)

0.6

Mdia = 1
Mdia = 6

0.4

0.2

0.2

0.1

0.0

0.0
5

10

(a) Relao entre os desvios xada a mdia da distri- (b) Relao entre as mdias da distribuio, xado o desbuio.
vio padro.

Figura 11.8  Relao entre mdias e desvios da distribuio normal.

Devido as diculdades de clculo e em se construir tabelas da funo dependendo de dois parmetros, recorre-se a uma mudana de varivel, transformando a varivel aleatria

na varivel aleatria

Z.

Essa nova varivel chama-se varivel normal padronizada, ou reduzida.

11.2 Distribuio Normal Padro


Denomina-se distribuio normal padro, a distribuio normal de mdia zero e varincia 1. As
probabilidades associadas a distribuio normal reduzida so facilmente obtidas em tabelas.
Os problemas da vida real, entretanto, no se apresentam j na forma reduzida, ao contrrio,
so formulados em termos da varivel normal original

Y,

com mdia

e desvio-padro

antes de passarmos sua resoluo, padronizar ou reduzir a varivel aleatria normal

Y,

Y .

preciso ento,

transformando-a na

Distribuio Normal Padro


varivel aleatria

179

Z.

O resultado da padronizao a obteno de uma escala de distribuio denominada escala


reduzida, escala

ou escore

Z,

que mede o afastamento das variveis em relao mdia em nmero de

desvios-padro. Assim,

Z=

y
,

em que:
Z = nmero de desvios padres a contar da mdia;
y = o valor que a varivel aleatria assume;

= mdia da populao;

= desvio padro populacional.


Logo, substituindo-se esses valores na equao (11.2), tem-se a funo densidade padro da

distribuio normal:

1
z2
1
f (z) =
e 2 ,
2

para

< Z < .

cujos grcos so apresentados na Figura 11.9.

68,3%

99,7%

95,4%

(a) 1 desvio da mdia.

(b) 2 desvio da mdia.

(c) 3 desvio da mdia.

Figura 11.9  reas sob a curva normal padro.

Quando a padronizao utilizada, a mdia da distribuio assume valor

V (Z) = 1.

E(Z) = 0 e varincia

Esses valores foram obtidos atravs da aplicao das propriedades do valor esperado e varincia,

180

Captulo 11. Variveis aleatrias contnuas

considerando que

Y N (, 2 ):
[

]
Y
= E

1
E(Y )
=

1
=
( )

E(Z)

[
V (Z) =
=
=

E(Z) = 0.

1
V (Y )
2
1
2
2

V (Z) = 1.

Notao: Z N (0, 1).


De modo inverso, a varivel Normal Padronizada

pode ser transformada em qualquer varivel

Normal:

Z N (0, 1)

Y = Z +

Y N (, 2 ).

11.3 Uso da Tabela da Distribuio Normal Padro


Exemplo 1:

Seja

Z N (0; 1).

Usando a tabela da distribuio normal padro, calcular:

a) P(0 < Z < 1,57)

g) P(-2,22 < Z < -1,35)

b) P(0 < Z < 1,08)

h) P(-1,93 < Z < -0,80)

c) P(-1,89 < Z < 0)

i) P(0,52 < Z < 1,23)

d) P(-0,58 < Z < 0)

j) P(1,25 < Z < 2,23)

e) P(-1,23 < Z < 1,05)

k) P(Z > -1,27)

f ) P(-0,85 < Z < 1,92)

l) P( Z < 2,23)

Para encontrar as probabilidades dos itens do exemplo 1, basta usar a funo acumulada do

pnorm(q, mean = 0, sd = 1).

R,

cuja sintaxe

Sendo a mdia igual a 0 e o desvio igual a 1, no necessrio especic-los

na funo. Assim, para o item (a), por exemplo, o clculo ca:

pnorm(1.57) - pnorm(0)

Exemplo 2:

Sabendo-se que

Z N (0; 1)

e usando a tabela da distribuio normal padro, obter

tal que:

Uso da Tabela da Distribuio Normal Padro

181

a) P(0 < Z < z) = 0,43699

g) P(Z < z) = 0,82121

b) P(0 < Z < z) = 0,475

h) P(Z < z) = 0,30234

c) P(-z < Z < 0) = 0,35314

i) P(Z > z) = 0,95254

d) P(-z < Z < 0) = 0,49492

j) P(Z > z) = 0,07493

e) P(-z < Z < z) = 0,95

k) P(Z < z) = 0,36693

f ) P(-z < Z < z) = 0,97

l) P(Z < z) = 0,5

Para encontrar as probabilidades dos itens do exemplo 2, basta usar a funo

qnorm(p, mean = 0, sd = 1, lower.tail = TRUE, log.p = FALSE).

desvio igual a 1, no necessrio especic-los na funo.

qnorm

do

R,

cuja sintaxe

Sendo a mdia igual a 0 e o

Assim, para os itens (a) e (c), por exemplo, o

clculo ca:

qnorm(0.5 + 0.43699)
qnorm(0.5 - 0.35314)

Exemplo 3:

Seja

Y N (4; 1).

Determine:

a)

P (Y 4);

d)

P (5 < Y < 7);

b)

P (4 < Y < 5);

e)

P (Y 1);

c)

P (2 < Y < 5);

f)

P (0 Y 2);

Para encontrar as probabilidades dos itens do exemplo 3, basta usar a funo

pnorm

do

R.

Como a mdia

igual a 4 e o desvio-padro igual a 1, necessrio especic-los na funo. Assim, para os itens (a) e (b), por
exemplo, o clculo ca:

pnorm(4, 4, 1)
pnorm(5, 4, 1) - pnorm(4, 4, 1)

Exemplo 4:

Seja

Y N (3, 16),

ou seja, a varivel

grco da distribuio e determine

Soluo:

P (3 < Y < 8).

tem mdia igual a

=3

e varincia

2 = 16.

Faa o

182

Captulo 11. Variveis aleatrias contnuas

Exemplo 5:

A estatura mdia dos alunos da UEL de

= 1, 75m e desvio padro = 0, 15m.

Assumindo-se

que a varivel estatura (Y) seja normalmente distribuda, calcule a probabilidade de um aluno aleatoriamente
selecionado ter estatura entre

1, 70m

1, 80m.

Soluo:

Exemplo 6:

- Vagas:

Aplicao da Distribuio Normal a dados do Vestibular.

60

Total de Pontos Obtidos:

PROVAS
1

Classicao:

77 -

A/N

PTS

TPTS

NP

39

1,667

65,013

65,013

52,318

13,712

592,6

7,502

4,6

34,509

Lngua Port./Literatura

14

2,3

32,2

69,909

55,397

13,029

611,4

Lngua Estrangeira

0,8

3,2

Especca A

16

2,5

40

Especca B

16

2,5

40

80

52,319

15,814

676,2

Conhecimentos Gerais
Redao

1880,2

Uso da Tabela da Distribuio Normal Padro

183

Desempenho do Primeiro e do ltimo Classicado no Curso

Classicao
1
60

Pontuao
2.150,2
1.899,3

184

Captulo 11. Variveis aleatrias contnuas

Distribuio Normal

zt

0,00

0,01

0,02

0,03

0,04

0,05

0,06

0,07

0,08

0,09

0,0

0,00000

0,00399

0,00798

0,01197

0,01595

0,01994

0,02392

0,02790

0,03188

0,03586

0,1

0,03983

0,04380

0,04776

0,05172

0,05567

0,05962

0,06356

0,06749

0,07142

0,07535

0,2

0,07926

0,08317

0,08706

0,09095

0,09483

0,09871

0,10257

0,10642

0,11026

0,11409

0,3

0,11791

0,12172

0,12552

0,12930

0,13307

0,13683

0,14058

0,14431

0,14803

0,15173

0,4

0,15542

0,15910

0,16276

0,16640

0,17003

0,17364

0,17724

0,18082

0,18439

0,18793

0,5

0,19146

0,19497

0,19847

0,20194

0,20540

0,20884

0,21226

0,21566

0,21904

0,22240

0,6

0,22575

0,22907

0,23237

0,23565

0,23891

0,24215

0,24537

0,24857

0,25175

0,25490

0,7

0,25804

0,26115

0,26424

0,26730

0,27035

0,27337

0,27637

0,27935

0,28230

0,28524

0,8

0,28814

0,29103

0,29389

0,29673

0,29955

0,30234

0,30511

0,30785

0,31057

0,31327

0,9

0,31594

0,31859

0,32121

0,32381

0,32639

0,32894

0,33147

0,33398

0,33646

0,33891

1,0

0,34134

0,34375

0,34614

0,34849

0,35083

0,35314

0,35543

0,35769

0,35993

0,36214

1,1

0,36433

0,36650

0,36864

0,37076

0,37286

0,37493

0,37698

0,37900

0,38100

0,38298

1,2

0,38493

0,38686

0,38877

0,39065

0,39251

0,39435

0,39617

0,39796

0,39973

0,40147

1,3

0,40320

0,40490

0,40658

0,40824

0,40988

0,41149

0,41309

0,41466

0,41621

0,41774

1,4

0,41924

0,42073

0,42220

0,42364

0,42507

0,42647

0,42785

0,42922

0,43056

0,43189

1,5

0,43319

0,43448

0,43574

0,43699

0,43822

0,43943

0,44062

0,44179

0,44295

0,44408

1,6

0,44520

0,44630

0,44738

0,44845

0,44950

0,45053

0,45154

0,45254

0,45352

0,45449

1,7

0,45543

0,45637

0,45728

0,45818

0,45907

0,45994

0,46080

0,46164

0,46246

0,46327

1,8

0,46407

0,46485

0,46562

0,46638

0,46712

0,46784

0,46856

0,46926

0,46995

0,47062

1,9

0,47128

0,47193

0,47257

0,47320

0,47381

0,47441

0,47500

0,47558

0,47615

0,47670

2,0

0,47725

0,47778

0,47831

0,47882

0,47932

0,47982

0,48030

0,48077

0,48124

0,48169

2,1

0,48214

0,48257

0,48300

0,48341

0,48382

0,48422

0,48461

0,48500

0,48537

0,48574

2,2

0,48610

0,48645

0,48679

0,48713

0,48745

0,48778

0,48809

0,48840

0,48870

0,48899

2,3

0,48928

0,48956

0,48983

0,49010

0,49036

0,49061

0,49086

0,49111

0,49134

0,49158

2,4

0,49180

0,49202

0,49224

0,49245

0,49266

0,49286

0,49305

0,49324

0,49343

0,49361

2,5

0,49379

0,49396

0,49413

0,49430

0,49446

0,49461

0,49477

0,49492

0,49506

0,49520

2,6

0,49534

0,49547

0,49560

0,49573

0,49585

0,49598

0,49609

0,49621

0,49632

0,49643

2,7

0,49653

0,49664

0,49674

0,49683

0,49693

0,49702

0,49711

0,49720

0,49728

0,49736

2,8

0,49744

0,49752

0,49760

0,49767

0,49774

0,49781

0,49788

0,49795

0,49801

0,49807

2,9

0,49813

0,49819

0,49825

0,49831

0,49836

0,49841

0,49846

0,49851

0,49856

0,49861

3,0

0,49865

0,49869

0,49874

0,49878

0,49882

0,49886

0,49889

0,49893

0,49896

0,49900

3,1

0,49903

0,49906

0,49910

0,49913

0,49916

0,49918

0,49921

0,49924

0,49926

0,49929

3,2

0,49931

0,49934

0,49936

0,49938

0,49940

0,49942

0,49944

0,49946

0,49948

0,49950

3,3

0,49952

0,49953

0,49955

0,49957

0,49958

0,49960

0,49961

0,49962

0,49964

0,49965

3,4

0,49966

0,49968

0,49969

0,49970

0,49971

0,49972

0,49973

0,49974

0,49975

0,49976

3,5

0,49977

0,49978

0,49978

0,49979

0,49980

0,49981

0,49981

0,49982

0,49983

0,49983

3,6

0,49984

0,49985

0,49985

0,49986

0,49986

0,49987

0,49987

0,49988

0,49988

0,49989

3,7

0,49989

0,49990

0,49990

0,49990

0,49991

0,49991

0,49992

0,49992

0,49992

0,49992

3,8

0,49993

0,49993

0,49993

0,49994

0,49994

0,49994

0,49994

0,49995

0,49995

0,49995

3,9

0,49995

0,49995

0,49996

0,49996

0,49996

0,49996

0,49996

0,49996

0,49997

0,49997

Uso da Tabela da Distribuio Normal Padro

185

Exerccios
1) Suponha que

= 8; 2 = 4,

a) Construa o grco de

ou seja,

Y N (8; 4).

Y;

x <- seq(1.419, 14.581, length.out=100)


plot(x, dnorm(x, mean=8, sd=2), xlab=expression(x),
ylab=expression(f(x)), type="l", las=1, bty='l')
abline(h=0, col="gray")
b) Construa o grco da funo acumulada;

plot(x, pnorm(x, mean=8, sd=2), xlab=expression(x),


ylab=expression(F(x)), type="l", las=1, bty='l')
abline(h=0, col="gray")
remove(.x)
c) Calcule:
i)

P (Y 9, 5);

Esta probabilidade pode ser calculada usando o

R,

atravs do seguindo comando:

pnorm(c(9.5), mean=8, sd=2, lower.tail=FALSE);


ii)

P (6 Y 10).

Esta probabilidade pode ser calculada usando o R, atravs do seguindo comando:

pnorm(c(10), mean=8, sd=2, lower.tail=TRUE) pnorm(c(6), mean=8, sd=2, lower.tail=TRUE)

2) Em uma populao de indivduos adultos de sexo masculino, a estatura mdia


de

1, 70 m

e desvio padro

0, 08 m.

a) Qual o intervalo de alturas em que 95% da populao est compreendida?

qnorm(c(0.025, 0.975), mean=1.7, sd=0.08)

b) Na mesma populao, qual a probabilidade de um indivduo ter estatura entre

pnorm(c(1.82), mean=1.7, sd=0.08, lower.tail=TRUE) pnorm(c(1.6), mean=1.7, sd=0.08, lower.tail=T)

1, 60

1, 82 m?

186

Captulo 11. Variveis aleatrias contnuas

c) Qual a probabilidade de se encontrar um indivduo com estatura menor que

1, 58?

pnorm(c(1.58), mean=1.7, sd=0.08)

3) Na curva gaussiana padro obtenha o valor de

z0

tal que a rea entre a mdia da curva e

z0

seja

0, 40.

qnorm(c(.1, .9))

4) Um teste de aptido para o exerccio de certa prosso exige uma sequncia de operaes a serem executadas rapidamente uma aps outra. Para passar no teste, o candidato deve complet-lo em

80

minutos no

mximo. Admita que o tempo para completar o teste seja uma varivel aleatria N(90, 400).
a) Qual a porcentagem dos candidatos com chances de serem aprovados?

pnorm(80, mean=90, sd=20)


b) Os melhores 5% recebero um certicado especial. Qual o tempo mximo para fazer jus a tal certicado?

qnorm(0.05, mean=90, sd=20)

5) sabido que, para adultos do sexo masculino, gozando de boa sade, em uma certa populao, a temperatura corporal segue distribuio gaussiana com mdia de 36,8 graus e desvio-padro de 0,15 graus.
a) Se considerarmos 1.000 dessas pessoas, quantas se esperariam com temperatura entre 36,8 e 37,2
graus?

(prob = pnorm(c(37.2), mean=36.8, sd=.15) - pnorm(c(36.8), mean=36.8, sd=.15))


(Esp = 1000*prob)
b) Em qual intervalo de temperaturas esto 98% dos adultos masculinos sadios desta populao?

qnorm(c(0.01, 0.99), mean=36.8, sd=0.15)

6) Um pesquisador deseja criar um padro para identicar presena de infeco bacteriana (Pseudomonas sp)
no trato respiratrio atravs de cultura de escarro. Para isto, coletaram-se dados de pessoas sabidamente
sadias e determinou-se o nmero de colnias encontradas em cada cultura. Foram encontrados os seguintes
resultados:

17

22

23

23

23

23

24

24

24

24

24

24

25

25

25

25

25

25

25

26

28

28

29

30

30

31

31

35

35

35

36

40

41

41

41

42

51

54

56

56

56

58

60

68

79

Uso da Tabela da Distribuio Normal Padro

187

Determine uma faixa de normalidade de 95% para o nmero de colnias de bactrias no trato respiratrio
de pessoas sadias, usando o mtodo da curva de Gauss.

escarro = c(17, 22, 23, 23, 23, 23, 24, 24, 24, 24, 24, 24, 25, 25, 25, 25, 25, 25,
25, 26, 28, 28, 29, 30, 30, 31, 31, 35, 35, 35, 36, 40, 41, 41, 41, 42,
51, 54, 56, 56, 56, 58, 60, 68, 79)
(n = length(escarro))
(mdia = mean(escarro))
(var.amostra = var(escarro))
(var.pop = ((n-1)/n) * varincia)
# ou,
(var.pop = sum((escarro - mean(escarro))^2) / n)
qnorm(c(.025, .975), mean=mdia, sd=sqrt(var.pop))

7) As alturas de 10.000 alunos de um colgio tm distribuio aproximadamente normal, com mdia


e desvio-padro

170 cm

5 cm.

a) Qual o nmero esperado de alunos com altura superior a

165 cm?

(prob = pnorm(165, mean=170, sd=5, lower.tail=F))


(Esp = 10000*prob)
b) Qual o intervalo simtrico em torno da mdia que conter 75% das alturas dos alunos?

qnorm(c(0.125, 0.875), mean=170, sd=5)

8) O peso da carcaa de um animal segue uma distribuio

N (50kg ; 4kg 2 ).

inferior a um desvio-padro abaixo da mdia, ela vendida a

R$ 60, 00,

Se o peso de uma carcaa

caso contrrio, por

R$ 80, 00.

Qual o preo mdio de venda de uma carcaa?

(inf = pnorm(48, mean=50, sd=2))


(sup = pnorm(48, mean=50, sd=2, lower.tail=FALSE))
(Esp = inf*60 + sup*80)

9) Mensuraes de pesos foram realizadas in vivo em 142 fmeas de bovinos da raa Nelore.
desvio padro obtidos foram:

= 390, 19 kg

distribuio normal:

a) Esquematizar o grco da distribuio;

= 45, 23 kg .

A mdia e

Assumindo-se que os pesos seguem uma

188

Captulo 11. Variveis aleatrias contnuas

x = seq(280, 500, length = 142)


y = dnorm(x, mean=390.19, sd=45.23)
plot(x, y, type="l", lwd=2, col="red", bty='l',
xlab='Pesos (kg)', ylab="Probabilidade")
b) Calcular a proporo esperada de animais com pesos acima de

395 kg ;

(prob.b = pnorm(395, mean=390.19, sd=45.23, lower.tail=FALSE))


(Esp.b = 142*prob.b)
c) Calcular a proporo esperada de animais com pesos abaixo de

380, 17 kg ;

(prob.c = pnorm(380.17, mean=390.19, sd=45.23))


(Esp.c = 142*prob.c)
d) Calcular a proporo esperada animais com pesos acima de

385, 0 kg ;

(prob.d = pnorm(385, mean=390.19, sd=45.23, lower.tail=FALSE))


(Esp.d = 142*prob.d)
e) Calcular a proporo esperada de animais com pesos entre

385

390 kg ;

(prob.e = pnorm(390, mean=390.19, sd=45.23) pnorm(385, mean=390.19, sd=45.23))


(Esp.e = 142*prob.e)
f ) Se 25% dos animais com menor peso forem abatidos, qual o peso mnimo dos animais remanescentes?

qnorm(.25, mean=390.19, sd=45.23)


g) Qual o peso mnimo para um animal estar entre os 5% com maior peso?

qnorm(.05, mean=390.19, sd=45.23, lower.tail=FALSE)

10) Uma amostra de 120 sunos mestios, com seis meses de idade, apresenta quanto ao peso (em kg):

= 80kg
a) Quantos sunos tm peso entre

= 12kg.

(prob = pnorm(92, mean=80, sd=12) - pnorm(68, mean=80, sd=12))


(Esp = 120*prob)

Uso da Tabela da Distribuio Normal Padro

189

b) Qual a probabilidade de um suno escolhido ao acaso pesar entre

72

82 kg ?

(prob = pnorm(82, mean=80, sd=12) - pnorm(72, mean=80, sd=12))


c) Qual a probabilidade de um suno pesar entre

92

104 kg ?

(prob = pnorm(104, mean=80, sd=12) - pnorm(92, mean=80, sd=12))

11) A distribuio dos pesos de coelhos criados numa granja pode muito bem ser representado por uma

N (3, 50kg ; 0, 36kg 2 .

Um abatedouro comprar 10.000 coelhos dessa granja e os classicar de acordo

com o peso, da seguinte forma: 20% dos mais leves como pequenos, os 40% seguintes como mdios,
os 30% seguintes como grandes e os 10% restantes como extras.

Quais os limites de peso para cada

classicao?

(Leves = qnorm(.2, mean=3.5, sd=0.6))


(Mdios = qnorm(c(.2, .6), mean=3.5, sd=0.6))
(Grandes = qnorm(c(.6, .9), mean=3.5, sd=0.6))
(Extras = qnorm(.1, mean=3.5, sd=0.6, lower.tail=FALSE))

12) Dada a funo abaixo, vericar para que valor de


probabilidade. Calcular a

E(X)

pode ser considerada uma funo densidade de

V (X).

kx2
f (x) =
0

se

0 x 2;

se

x<0

ou

x > 2.

k = 8/3 ; E(X) = 32/3 ; V(X) = 256/15

13) Suponha que o peso de animais recm-nascidos (em kg) pode ser considerado uma varivel aleatria com
a seguinte densidade:

1
1

x+

10
10

9
3
f (x) =
x+

40
20

0,

se

0 x 2;

se

2 < x 6;

caso contrrio.

Qual a probabilidade de, escolhendo ao acaso um animal, ele ter peso:

a) inferior a

3 kg ;

190

Captulo 11. Variveis aleatrias contnuas

p = 0,6625
b) entre

4 kg ;

p = 0,25

Aprender a nica coisa que a mente nunca se cansa,


nunca tem medo e nunca se arrepende.
Leonardo da Vinci.

Captulo 12

Introduo inferncia estatstica


O objetivo da inferncia estatstica estudar uma determinada populao baseando-se em informaes obtidas atravs da amostra coletada.
Os modelos probabilsticos procuram medir a variabilidade de fenmenos casuais de acordo com
as ocorrncias. Na prtica, frequentemente o pesquisador tem alguma idia sobre a forma da distribuio, mas
no dos valores exatos dos parmetros que a especicam.

Exemplo:

Suponha que a distribuio das estaturas dos alunos da UEL possa ser representada por um modelo

gaussiano e que os parmetros populacionais, mdia e varincia, fossem conhecidos e iguais, respectivamente,
a

1, 72 m e 0, 0225 m2 .

1, 75 m?

Qual a probabilidade de um aluno, aleatoriamente selecionado, ter altura entre

1, 65 m

Se os dados seguem uma distribuio normal, ento tem-se que a funo densidade de probabilidade dada
por:

f (y) =

1 y 2
1

e 2 ( ) , < Y < +
2

1,75

P (1, 65 Y 1, 75) =
1,65

1 y1,72 2
1

e 2 ( 0,15 ) dy = 0, 2589
0, 15 2

pnorm(1.75, mean=1.72, sd=0.15, lower.tail=T) - pnorm(1.65, mean=1.72, sd=0.15, lower.tail=T)


# ou
diff(pnorm(c(1.65, 1.75), mean=1.72, sd=0.15))
Nessa situao (parmetros populacionais conhecidos), no haveria necessidade de usar a inferncia estatstica.
Raramente se consegue obter a distribuio exata de alguma varivel, ou por que isso muito dispendioso, ou
muito demorado ou s vezes porque consiste num processo destrutivo.
A soluo trabalhar com amostra, analis-la e inferir propriedades para a populao.

191

192

Captulo 12. Introduo inferncia estatstica


J se discutiu a diferena entre estatsticas (amostragem) e parmetros (populao).

Assim,

tem-se:

Parmetro

Estatstica

s2

Desvio padro

Proporo

Mdia
Varincia

Considere:

Y =

yi
i=1

em que que:

chamado estimador e

y = 1, 73 m

, por exemplo, a estimativa.

12.1 Distribuio Amostral da Mdia


Considere a seguinte populao: 1, 3, 5, 5, 7. Seja

a varivel aleatria valor assumido por um

elemento sorteado ao acaso dessa populao.


a) Obter a distribuio de

Y.

P(Y=y)

1/5

1/5
Total

b) Calcular a mdia

Y = E(Y )

e a varincia

[
]2
2 = E(Y 2 ) E(Y ) .

Distribuio Amostral da Mdia

193

Soluo:

c) Considerar todas as possveis amostras de tamanho


varivel aleatria nmero selecionado na

n = 2, com reposio,

extrao e

extrao. Obter a distribuio amostral da estatstica

Amostra

Y1 + Y2
Y =
2

Probabilidade

Y2 ,

dessa populao. Seja

Y1

a varivel aleatria nmero selecionado na

Y1 + Y2
Y =
2

Amostra

Y1 + Y2
Y =
2

Probabilidade

1/25

(5;1)

1/25

(1;3)

1/25

(5;3)

1/25

(1;5)

1/25

(5;5)

1/25

(1;5)

1/25

(5;5)

1/25

(1;7)

1/25

(5;7)

1/25

(3;1)

1/25

(7;1)

1/25

(3;3)

1/25

(7;3)

1/25

(3;5)

1/25

(7;5)

1/25

(3;5)

1/25

(7;5)

1/25

(3;7)

1/25

(7;7)

1/25

(5;1)

1/25

(5;3)

1/25

(5;5)

1/25

(5;5)

1/25

(5;7)

1/25

53 = 125,

(mdia).

(1;1)

O nmero de amostras de tamanho 2 possveis da populao :

52 = 25.

Se fosse de tamanho 3, teramos:

no caso de amostras com reposio. E se fosse sem reposio?

194

Captulo 12. Introduo inferncia estatstica


0.25

Tabela 12.1  Distribuio das Mdias

P (Y = y)

1/25

2/25

Probabilidades

0.20

0.15

0.10

0.05

1/25

0.00

Total

4
Mdias

Calcular a mdia

Y = E(Y )

e a varincia

[
]2
Y2 = E(Y 2 ) E(Y ) .

Soluo:

y = 1:7
probab=c(1, 2, 5, 6, 6, 4, 1)/25
require(distrEx)
Y = DiscreteDistribution(supp=y, prob=probab)
E(Y) ; var(Y) ; sd(Y)
par(mai=c(1, 1, .2, .5))
plot(probab~y, las=1, type="h", bty="l", col="blue",
xlab="Mdias", ylab="Probabilidades")
points(y, prob, pch=19, col="blue")

Distribuio Amostral da Mdia


Para se retirar uma amostra de tamanho
Para o exemplo dado, pode-se retirar

195
n

de uma populao de tamanho

N,

basta usar o

R.

uma amostra usando os seguintes comandos:

popul = c(1, 3, 5, 5, 7)
(amostra = sample(popul, 2, replace=T))
# ou
tilapia = read.table('http://www.uel.br/pessoal/silvano/Dados/Tilapia.txt', head=T)
attach(tilapia)
(amostra.tila = sample(Peso, 20, replace=F))

Para efetuar os procedimentos realizados de forma direta no

R, necessrio a construo de uma

funo, encontrada no material da Fiocruz, que execute as tarefas. Dada por:

permuta2.ou.3 <- function (x, N, n)


{
if (n!=2 && n!=3) stop("Esta funo para obter permutaes
2 a 2 ou 3 a 3 apenas")
z <- matrix(0, nrow=N^n, ncol=n)
z[,1] <- rep(x, each=N^(n-1))
z[,2] <- rep(x, times=N^(n-2), each=N^(n-2))
if(n==3)
{
z[,3] <- rep(x, times=N^(n-1))
}
z
}
amostras.2 <- permuta2.ou.3(popul, 5, 2) ; amostras.2
O

R,

por default, calcula a varincia e o desvio padro

da amostra.

Para se determinar a

varincia de uma populao necessrio denir uma funo para efetuar tal clculo, dada por:

var.pop <- function(x)


{ Var = sum((x-mean(x))^2)/length(x) }
(var.pop(popul))
# ou, simplesmente:
n = length(popul)
(var.pop = var(popul)*(n-1)/n)
Assim, pode-se determinar as mdias das amostras e a varincia populacional aplicando-se:

196

Captulo 12. Introduo inferncia estatstica

(medias.2 <- round(apply(amostras.2, 1, mean), 2))


table(medias.2)
cbind(table(medias.2))
(var.pop(medias.2))

Teorema:

Seja

uma varivel aleatria com mdia

aleatria simples de

Y.

e varincia

2 ,

e seja

(Y1 , Y2 , . . . , Yn )

uma amostra

Ento:

2
.
Y2 = V (Y ) =
n

Y = E(Y ) =

Quando o tamanho da amostra aumenta, independentemente da forma da distribuio da populao, a distribuio amostral de

aproxima-se cada vez mais de uma distribuio normal. Esse resultado, fundamental

na teoria da Inferncia Estatstica, conhecido como Teorema Central do Limite.

Teorema:

Para amostras aleatrias simples (Y1 , Y2 , . . . , Yn ), retiradas de uma populao com mdia

2 ,

varincia

com mdia

a distribuio amostral da mdia


2
e varincia

aproxima-se, para

grande, de uma distribuio normal,

, ou seja,

Y N

Se a populao for normal, ento

(
)
2
,
.
n

ter distribuio

exata

(12.1)

normal. Aceita-se que para amostras com mais

de 30 observaes a aproximao normal j pode ser considerada boa.

Corolrio:
e

, e

(Y1 , Y2 , . . . , Yn ) for uma


1
Y = (Y1 , Y2 , . . . , Yn ), ento:
n
Se

Z=

em que

e = Y

Y a
N (0, 1),

(12.2)

signica aproximadamente distribudo. A diferena entre a estatstica

e o parmetro

isto ,

chamado erro amostral da mdia.


Usando o

no

amostra aleatria simples de uma populao qualquer, com mdia

possvel gerar amostras da populao para comprovar o Teorema. Os comandos

so:

require(TeachingDemos)
clt.examp(n = 50, reps = 10000, nclass =16)

Distribuio Amostral da Mdia


Exemplo 1:
mdia

197

Suponha que os comprimentos de jacars adultos de uma certa raa siga o modelo normal com

= 1, 69 m

e varincia igual a

0, 01 m2 .

Uma amostra de dez animais foi sorteada aleatoriamente.

Qual a probabilidade da mdia do comprimento dessa amostra estar entre

1, 63

1, 69 m?

Soluo:

Exemplo 2:

Os camares machos da espcie Farfantepenaeus paulensis, para serem considerados adultos,

devem apresentar um comprimento total maior ou igual a


machos adultos a mdia dos comprimentos seja igual a

a) Qual a probabilidade de que numa amostra de

22 mm.

Suponha que numa populao de camares

= 27, 3 mm

n = 35

e o desvio padro

= 7, 8 mm.

camares, obtenha-se uma mdia

Y < 22 mm?

Soluo:

b) Qual deve ser o valor para a mdia do comprimento total,

Soluo:

a m de que

P rob(Y 22) = 0, 05?

198

Captulo 12. Introduo inferncia estatstica

12.2

Distribuio Amostral da Proporo


Considere o

que

1, 69 m.

Seja

Yi

exemplo 1 em que os jacars sero considerados adultos se o comprimento for maior

o comprimento do i-simo jacar escolhido, tal que:

Yi =

Logo,

Yi

ser

para jacars adultos e

1,

se

Xi > 1, 69 m

0,

se

Xi 1, 69 m

para jacars jovens.

variveis aleatrias, uma vez que elas assumem o valor

As quantidades

Y1 , Y2 , , Y10

tambm so

0 ou 1 dependendo do valor assumido Xi , que tambm

uma varivel aleatria. Considere os seguintes dados:

10

Xi

1,58

1,63

1,72

1,75

1,69

1,68

1,70

1,64

1,77

1,74

Yi

Portanto, a proporo

de jacars adultos ser estimada pela proporo de comprimentos maiores que 1, 69 m

encontrada na amostra,

p.

A estimativa obtida foi:

p=
indicando que

Denio:

50%

Seja

Y1 + Y2 + + Y10
0 + 0 + 1 + + 1
=
= 0, 5
10
10

de todos os jacars so considerados adultos.


a proporo das unidades de uma populao que possuem uma determinada caracterstica

(proporo de sucessos). A populao pode ser denida como uma varivel

Y =

sendo

P (Y = 1) =

tal que:

1,

se o elemento da populao tem a caracterstica;

0,

se o elemento da populao no tem a caracterstica,

P (Y = 0) = 1 .

Alguns exemplos so:


a) observar as capivaras machos;

b) observar as rvores com cancro numa oresta de eucalipto;

c) observar os eleitores do candidato A;

d) observar as pessoas que se sentem mal aps tomar uma vacina.


Se amostras aleatrias de tamanho
a distribuio amostral de

n forem tomadas de uma populao com proporo , ento,

tem as seguintes propriedades:

Distribuio Amostral da Proporo


(
1)

E(p) = p = E

Yi

199

= = p um estimador sem vis de ;


n
( n
)

Yi
(1

)
(1 )
V ar(p) = p2 = V ar
=
= p =
.
n
n
n
i=1
i=1

2)

Se o tamanho da amostra cresce, o desvio padro da proporo amostral decresce;


3) Se a populao original tem uma distribuio qualquer, para

sucientemente grande

(n > 30), p

ter

distribuio aproximadamente normal:

[
]
(1 )
a
p N ,
,
n

em que

p
z=

(1)
n

N (0, 1)

signica aproximadamente distribudo.

Quando
de

desconhecida e a amostra com reposio grande, determina-se

p=

y
,
n

estimativa

Logo,

p =

Exemplo 1:

p(1 p)
.
n

Deseja-se saber qual a proporo de pessoas da populao portadoras de determinada doena.

Retira-se uma amostra de 400 pessoas, obtendo-se 8 portadores da doena. Determine a proporo estimada
de pessoas portadoras da doena e o desvio padro.

Soluo:

Exemplo 2:

Um fabricante arma que sua vacina contra gripe imuniza

80%

dos casos. Uma amostra de 25

indivduos que tomaram a vacina foi sorteada e testes foram feitos para vericar a imunizao ou no desses
indivduos. Se o fabricante estiver correto, qual a probabilidade da proporo de imunizados na amostra ser
inferior

0, 75?

E superior

0, 85?

200
Soluo:

Captulo 12. Introduo inferncia estatstica