Sie sind auf Seite 1von 48

100

90

60
50
40
30
20
10
0
Sim

No

Anlise Descritiva de
Dados

Sindicalizao

Parte II: Organizando e apresentando


os dados de variveis quantitativas
20

Tabelas e Grficos

Porcentagem

80
70

10

0
20

30

40

IdadeMotorista

50

Relembrando: Planilha de Dados

Distribuio de Frequncias

Variveis Discretas

Variveis discretas que assumem


poucos valores distintos

[ Ellison, 2004 ]

30
20
10
0

Frequncia Relativa (%)

40

Florestas

Nmero de espcies

Variveis discretas que assumem


poucos valores distintos

[ Ellison, 2004 ]

30
20
10
0

Frequncia Relativa (%)

40

Pntanos

Nmero de espcies

30
20
0

10

Frequncia Relativa (%)

30
20
10
0

Frequncia Relativa (%)

40

40

Comparando os dois tipos de habitats

Nmero de espcies

Nmero de espcies

Varivel discreta que assume um grande


nmero de valores distintos
[Reis e Reis, 2001]

Soluo: agrupar valores em classes

Estudando a
Distribuio de Frequncias

Variveis Contnuas

Variveis contnuas assumem muitos valores


distintos

Soluo: agrupar valores em classes

600
400

0.05

0.05

0.21

1.82

10.27

32.64

44.89

10.06

200

Frequencia Absoluta

800

Histograma de
frequncias

10

15

20

Area das folhas, cm2

Grfico para a distribuio de frequncias de variveis contnuas

0.20

Histograma de
densidade

0.10

Soma das reas de todas as


barras = 100%

0.05

2 x 0.0514 = 0.1027

frequncia relativa da classe


Densidade =
tamanho da classe
0.00

Densidade

0.15

rea da barra = frequncia


relativa da classe

10

15

20

Vantagem do histograma de densidade


0.20

Clculo da frequncia em classes


diferentes daquelas apresentadas no
histograma.

0.10

( 1 x 0.2244 ) +
( 2 x 0.1632 ) +

0.05

( 1 x 0.0513 ) = 0.6022

0.00

Densidade

0.15

Exemplo: qual a frequncia de


plantas com rea foliar entre 7.0 e 11.0
cm2?

10

15

20

Classificao da Distribuio de Frequncias de uma


Varivel Contnua quanto a sua Forma
Frequncia relativa (%)

Simtrica

5
4
3
2
1
0
50

60

70

80

90

100 110 120 130 140 150

Varivel

Assimtrica

Com concentrao
esquerda

Com concentrao
direita

10

Frequncia relativa (%)

Frequncia relativa (%)

9
7
6
5
4
3
2
1
0

5
4
3
2
1
0

10

20

Varivel

30

92

93

94

95

96

97

98

Varivel

99

100 101 102

80
60
40
20
0

Frequencia Relativa Acumulada

100

Ogiva: grfico das frequncias acumuladas

10

15

rea das folhas, cm2

20

O eixo horizontal utiliza os limites superiores das classes

80
60
40
20
0

Frequencia Relativa Acumulada

100

Uma ogiva
sempre termina
em 100%

Uma ogiva
sempre comea
em 0%

10

15

rea das folhas, cm2

20

100

Qual o percentual de plantas que


possuem rea foliar abaixo de 11 cm2?

80
60
40
20
0

Frequencia Relativa Acumulada

92

10

15
11
rea das folhas, cm2

20

80
60
20

40

50

Frequencia Relativa Acumulada

100

Qual o valor de rea foliar que deixa 50%


das plantas abaixo dele?

10

15

rea das folhas, cm2

20

Formas bsicas para a distribuio de


frequncias de uma varivel contnua

Assimtrica
(concentrao
esquerda)
ou (cauda direita)

Simtrica

Assimtrica
(concentrao
direita)
ou (cauda esquerda)

80
60

Variedade 1
Variedade 2

20

40

A distribuio da rea foliar


das plantas da variedade 2
mais assimtrica
concentrada esquerda
do que a distribuio da
rea foliar das plantas da
variedade 1.

Frequencia Relativa Acumulada

100

Comparando duas distribuies de frequncias

10

15

rea das folhas, cm2

20

Visualizando pequenos
conjuntos de dados
Diagrama de Pontos
Diagrama de Ramo-e-folhas

Diagrama de Pontos

[Reis e Reis, 2001]

Diagrama de Ramo-e-Folhas
Nmero de espcies de formigas em 22 pontos de coleta
em habitats de floresta (valores ordenados)
4 4 5 6 6 6 6 6 7 7 7 8 9 9 10 10 12 14 15 16 17 18

Separando os dados pelas dezenas, uma em cada linha


4 4 5 6 6 6 6 6 7 7 7 8 9 9
10 10 12 14 15 16 17 18

Diagrama de Ramo-e-Folhas
Separando as unidades de cada dezena em dois grupos:
de 0 a 4 e de 5 a 9
4 4
5 6 6 6 6 6 7 7 7 8 9 9
10 10 12 14
15 16 17 18

Colocando as dezenas em evidncia


0| 4
0| 5
ramos
1| 0
1| 5

4
6 6 6 6 6 7 7 7 8 9 9
0 2 4
6 7 8

folhas

Diagrama de Ramo-e-Folhas

Ramo-e-Folhas duplo

Estudando uma varivel


ao longo do tempo

Grfico de linha
(Sries Temporais)

Sries temporais (ou sries histricas) so um


conjunto de observaes de uma mesma
varivel quantitativa (discreta ou contnua)
feitas ao longo do tempo.
Nmero de ovos de Aedes Aegypti em
ovitrampas ao longo de 10 semanas
Semana

10

Ovos

15

14

22

24

25

28

23

20

25

22

Os grficos mais comuns para a representao


de uma srie temporal so os
grficos de linha.

Nmero de ovos por armadilha


15

20

25

30

2
4
6

Semana

8
10

Nmero de ovos por armadilha


0

10

20

30

40

2
4
6

Semana

8
rea 1
rea 2
rea 3

10

Nvel de gua do Rio Negro

4
2
0
-2
-4
-6

Altura em relao a um ponto arbitrrio

(mdias mensais das observaes dirias, em metros)

1900

1920

1940

1960

Ano

1980

Cuidados ao elaborar um grfico de linhas :


a escala do grfico
Grfico de linhas para o preo mdio do litro de leite
Folha de So Paulo (set/2001)
0,40
0,35
0,30
0,25
0,20
0,15
0,10
0,05
0,00
Maio

Junho

Julho

Agosto

[Reis e Reis, 2001]

Efeitos da mudana no incio e/ou final da


escala do grfico de linhas da srie temporal
do preo do leite.
0,40

0,36

0,40

0,35

0,34
0,35

0,30

0,32

0,25

0,30

0,30

0,20

0,28
0,25

0,15

0,26

0,10

0,20
M aio

Junho

Julho

A gosto

0,24
Maio

Junho

Julho

A gos to

Maio

Junho

Julho

A gos to

[Reis e Reis, 2001]

Efeitos de
alteraes na
dimenso
horizontal
do grfico de
linhas da srie
do preo do
leite

0,60

0,60

0,55

0,55

0,50

0,50

0,45

0,45

0,40

0,40

0,35

0,35

0,30

0,30

0,25

0,25

0,20

0,20

0,15

0,15

0,10

0,10

0,05

0,05

0,00

0,00
Maio

Junho

Julho

0,60
0,55
0,50
0,45
0,40
0,35
0,30
0,25
0,20
0,15
0,10
0,05
0,00
Maio

Junho

Julho

Agosto

Agosto

Alguns cuidados
O incio do eixo vertical seja o valor
mnimo possvel para a varivel que est
sendo representada (para o caso do
preo de leite, o valor zero, leite de graa)

0,40

0,35

0,30

0,25

O final do eixo vertical seja tal que a


srie fica centrada em relao ao eixo
vertical
Os tamanhos dos eixos sejam o mais
parecidos possvel .

0,20

0,15

0,10
M aio

Junho

Julho

Agosto

Praticando Estatstica
Como fazer

histogramas, ogivas, ramo-e-folhas e


grficos de linhas

usando o

Como fazer usando o R ?


Grfico de Barras para Dados de Variveis Discretas
Quando no se conhece as frequncias das classes
(dados brutos)
ants <- read.table("ants.txt",header=T)
tabela <- table(ants$Srich[ants$Habitat=="Forest"])
barplot(tabela, ylab="Frequncia Absoluta",
main="Riqueza de Espcies de Formigas",
xlab="Nmero de espcies de formigas",
col="darkred")

Como fazer usando o R ?


Grfico de Barras para Dados de Variveis Discretas
Quando j se conhece as frequncias das classes
Classes <- c(1, 2, 3, 4, 5, 6)

# Classes

Formigas.pantano <- c(4.0,16.0,40.0,24.0,8.0,8.0)


# Frequncias Relativas das classes
names(Formigas.pantano) <- Classes

#Nomes das classes

barplot(Formigas.pantano, ylab="Frequncia Relativa(%)",


main="Riqueza de Espcies de Formigas",
xlab="Nmero de espcies de formigas",
col="darkblue")

Como fazer usando o R ?


Histograma de Frequncias
hist(ciclame$Area,breaks=seq(4,20,by=2),
xlim=c(4,20), xlab="Area das folhas, cm2",
ylab="Frequencia Absoluta", main="",
col="lightgreen")

Histograma de Densidade
hist(ciclame$Area,breaks=seq(4,20,by=2),
xlim=c(4,20), xlab="Area das folhas, cm2",
ylab="Frequencia Absoluta", main="",
col="purple", freq=F)

Como fazer usando o R ?

Desenhando
a ogiva

Construindo as classes e
frequncias acumuladas

Ogiva
classes<-hist(ciclame$Area,
breaks=seq(4,20,by=2))[[1]]
frequencias<-hist(ciclame$Area,
breaks=seq(4,20,by=2))[[2]]
freq.cum<- round(cumsum(frequencias)/
sum(frequencias),4)*100
plot(classes,c(0,freq.cum),type="l",lwd=2,
xlim=c(4,20), xlab="rea das folhas, cm2",
ylab="Frequencia Relativa Acumulada",
main="",col="red")

Como fazer usando o R ?


Ramo-e-folhas
# Riqueza de Especies em Habitats de Floresta
stem(ants$Srich[ants$Habitat=="Forest"])

# Riqueza de Especies em Habitats de Floresta


stem(ants$Srich[ants$Habitat=="Bog"])

Como fazer usando o R ?


Grficos de Linhas
rionegro<-read.table("rionegro.txt",header=T)
# Lendo a srie temporal mensal de alturas (height)
plot(rionegro$Year,rionegro$Height,type="b",
xlab="Ano",
ylab="Altura em relao a um ponto arbitrrio")
abline(h=0)

# Linha horizontal na altura zero

Fim da terceira aula


Anlise Descritiva de Dados:
Organizando e apresentando Dados de
Variveis Quantitativas

Prxima Aula
Anlise Descritiva de Dados:
Resumindo os Dados de Variveis
Quantitativas

Referncias Bibliogrficas
ELLISON, A. E (2004). Bayesian inference in ecology. Ecology Letters, 7,
509520.
REIS, E.A.; REIS, I.A. (2001) Anlise Descritiva de Dados- Tabelas e
Grficos, Relatrio Tcnico do Departamento de Estatstica da UFMG.
Disponvel em: http://www.est.ufmg.br

Das könnte Ihnen auch gefallen