Sie sind auf Seite 1von 34

ANLISE DESCRITIVA

Texto da aula Prof Carmen Diva Saldiva de Andr Prof. Gilberto Alvarenga Paula

FORMATAO & DESIGN Clber da Costa Figueiredo figuecl@usp.br Thiago Rodrigo Alves Carneiro thiagorodrigo@ime.usp.br

Classificao das variveis Varivel


Qualquer caracterstica associada a uma populao

Classificao
Qualitativa
nominal ordinal

Quantitativa
contnua discreta

Exemplo Arquivo Pulse do Minitab


Refere-se a um experimento feito por alunos. Cada aluno registrou sua altura, peso, sexo, hbito de fumar, nvel de atividade fsica usual e pulsao em repouso. Ento todos eles jogaram moedas e aqueles que tiraram cara fizeram corrida estacionria por um minuto. Depois disso todos os alunos mediram novamente sua pulsao.

Informaes do arquivo Pulse MTB > INFO Information of the worksheet


Column C1 C2 C3 C4 C5 C6 C7 C8 Count Name 92 Pulse1 (Pulsao antes de correr) 92 Pulse2 (Pulsao depois de correr) 92 Ran (1:correu, 2:no correu) 92 Smokes (1:fumante, 2:no fumante) 92 Sex (1:masculino, 2:feminino) 92 Height 92 Weight 92 Activity (1:leve, 2:moderada, 3:forte)

Informaes do arquivo Pulse


Pulse1 Pulse2 Ran Smokes Sex 64 88 1 2 1 58 70 1 2 1 62 76 1 1 1 66 78 1 1 1 64 80 1 2 1 74 84 1 2 1 84 84 1 2 1 68 72 1 2 1 62 75 1 2 1 ...... Height Weight Activity 66.00 140 2 72.00 145 2 73.50 160 3 73.00 190 1 69.00 155 2 73.00 165 1 72.00 150 3 74.00 190 2 72.00 195 2

Variveis Quantitativas Medidas de posio

Mdia Mediana Moda Quartis Mximo Mnimo

Variveis Quantitativas Medidas de disperso

Amplitude Varincia Desvio padro Intervalo interquartil Coeficiente de Variao

Variveis quantitativas no arquivo Pulse


MTB > DESCRIBE C1 C2 C6 C7

Descriptive Statistics
Variable Pulse1 Pulse2 Height Weight N Mean Median Tr Mean StDev SEMean 92 72.87 71.00 72.61 11.01 1.15 92 80.00 76.00 78.85 17.09 1.78 92 68.72 69.00 68.78 3.66 0.38 92 145.15 145.00 144.52 23.74 2.48

Variveis quantitativas no arquivo Pulse

MTB > DESCRIBE C1 C2 C6 C7 Descriptive Statistics


Variable Pulse1 Pulse2 Height Weight Min 48.00 50.00 61.00 95.00 Max Q1 100.00 64.00 140.00 68.00 75.00 66.00 215.00 125.00 Q3 80.00 87.00 72.00 156.50

Descrever a pulsao em repouso segundo o sexo


MTB > DESCRIBE C1; SUBC > BY C5. Descriptive Statistics
Variable Sex N Mean Median Tr Mean StDev SEMean Pulse1 1 57 70.42 70.00 70.27 9.95 1.32 2 35 76.86 78.00 76.65 11.62 1.96

Descrever a pulsao em repouso segundo o sexo


MTB > DESCRIBE C1; SUBC > BY C5. Descriptive Statistics
Variable Pulse1 Sex 1 2 Min Max 48.00 92.00 58.00 100.00 Q1 63.00 66.00 Q3 75.00 86.00

Calcular o intervalo-interquartil para cada sexo

Variveis Qualitativas

Para dados qualitativos podemos construir tabelas que os quantificam por categoria de classificao

Variveis qualitativas no arquivo Pulse

Ran Smokes Sex Activity

Variveis qualitativas no arquivo Pulse

MTB > TALLY C3 C4 C5 C8

Summary Statistics for Discrete Variables


Ran Count Smokes Count Sex Count Activity Count 1 35 1 28 1 57 0 1 2 57 2 64 2 35 1 9 N= 92 N= 92 N= 92 2 61 3 21 N= 92

H indcios de associao entre sexo e hbito de fumar?


MTB > Table 'Sex' 'Smokes'; SUBC > Counts; SUBC > RowPercents.
Rows: Sex 1 20 35.09 8 22.86 28 30.43 Columns: Smokes 2 All 37 57 64.91 100.00 27 35 77.14 100.00 64 92 69.57 100.00

1
2

All

Dentre as mulheres, qual a porcentagem das que correram?


MTB > Table 'Ran' 'Sex'; SUBC> Counts; SUBC> ColPercents.
Rows: Ran Columns: Sex 1 2 All 24 11 35 42.10 31.43 38.04 33 24 57 57.90 68.57 61.96 57 35 92 100.00 100.00 100.00

1
2

All

Grficos
para variveis quantitativas

Histograma

O histograma para uma varivel contnua obtido agrupando-se os valores dessa varivel em classes.

Caractersticas do Histograma - Bases iguais


Construir um retngulo para cada classe, com base igual ao tamanho da classe e altura proporcional frequncia da classe.

Exemplo 1
Faixa Etria Frequncia 20 30 40 30 40 50 10 20 10 40 Proporo 0,25 0,50 0,25

Histograma de frequncia (proporo)

f 0,6 -

0,5 0,4 0,3 0,2 0,1 0,0 20 30 40 50 idade

Histograma de densidade
rea (frequncia) = base x altura (densidade) f = 10 x h h = (f / 10)
h 0,06 0,05 0,04 0,03 0,02 -

0,01 0,00 20 30 40 50 idade

Bases diferentes
Construir um retngulo para cada classe, com base igual ao tamanho da classe e rea do retngulo igual frequncia da classe. A altura ser dada por: h = f/base f: frequncia relativa

Exemplo 1 modificado
Faixa Etria Frequncia 20 30 35 30 35 50 10 15 15 Proporo 0,250 0,375 0,375

h 0,025 0,075 0,025

Histograma de frequncia

0,6 0,5 0,4 0,3 0,2 0,1 0,0 20 30 35 50 idade

Faz sentido?

Histograma de densidade
h 0,07 -

0,06 0,05 0,04 -

0,03 0,02 0,01 0,00 20 30 35 50 idade

Arquivo PULSE Histograma da altura (Height)


MTB > HIST C6
Distribuio de frequncia para altura (arquivo PULSE)

Classe de altura f

fr

20

60,25-61,75 61,75-63,25 63,25-64,75 64,75-66,25 66,25-67,75 67,75-69,25 69,25-70,75 70,75-72,25 72,25-73,75 73,75-75,25 Total

1 10 2 13 7 20 7 15 9 8 92

0,011 0,109 0,022 0,141 0,076 0,217 0,076 0,163 0,098 0,087 1

Frequency

10

0 61,0 62,5 64,0 65,5 67,0 68,5 70,0 71,5 73,0 74,5

Height

Arquivo Pulse Diagrama de pontos (Dotplot) da pulsao em repouso


MTB > DOTPLOT C1
. . : : : : .: : :... . ::::: : :::: . .: . : . : : :.: : : : : : : : : : : : .. : : : . : . ---+---------+---------+---------+---------+---------+50 60 70 80 90 100 Pulse1

Arquivo Pulse Dotplot da pulsao em repouso segundo Sexo


MTB > DotPlot 'Pulse1'; SUBC> Same; SUBC> By 'Sex'.
: Sex 1 : : : . . : . .: : : :. . . : : : : ::: : : ::. . . : . : : --+---------+---------+---------+---------+---------+-

. . : . . . : . : : : : : : : : ..: . . : . --+---------+---------+---------+---------+---------+50 60 70 80 90 100 Pulse1

Sex 2

Diagrama de caixa (Boxplot)

Representa os dados atravs de um retngulo construdo com os quartis e fornece informaes sobre valores extremos

Construo do Boxplot
linha auxiliar _Q3+1,5d

* *

_Q3+1,5d

* *

altura

_Q3

_Q3

_Q3

_Q3

_md

_md

_md

_Q1

_Q1

_Q1

_Q1

_Q1-1,5d

_Q1-1,5d

*
Q1 = 1 quartil md = mediana Q3 = 3 quartil

d = diferena interquartil

Arquivo Pulse Boxplot da pulsao em repouso


MTB > BOXPLOT C1

Arquivo Pulse Boxplot da pulsao em repouso MTB > BOXPLOT C1*C5

Arquivo Cholest Boxplot do nvel de colesterol segundo o nmero de dias aps o enfarto

Diagrama de disperso

Avalia o comportamento conjunto de duas variveis quantitativas

Arquivo Pulse Relao entre o peso a altura dos alunos


MTB > PLOT C6*C7

Das könnte Ihnen auch gefallen