You are on page 1of 33

Estatstica Descritiva Anlise das variveis quantitativas

Medidas Resumo
Curso: Anlise de dados e uso da informao no SUS
Ting Hui-Ching outubro/2008

No ponto de nibus ...

Dados Brutos

Onibus 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32

Tempo 15 15 17 20 25 15 14 13 17 25 30 23 13 18 17 15 16 28 23 19 16 14 15 13 12 17 18 34 25 21 34 15

Tabela de Frequncia
Tempo 12 13 14 15 16 17 18 19 20 21 23 25 28 30 34 Total Global N 1 3 2 6 2 4 2 1 1 1 2 3 1 1 2 32

Anlise Descritiva

Medidas Resumo

Distribuicao de onibus por tempo de espera

Quantidade de onibus

8 6 4 2 0 12 13 14 15 16 17 18 19 20 21 23 25 28 30 34 Tempo (em minutos)

Medidas Resumo
Resposta breve e rpida que sintetize a informao Caracterizar a tendncia central ou disperso dos dados
Ex: Tempo de espera de um nibus da linha A
n Mdia Mediana Desvio Padro Mnimo Mximo 32 19 17 6 12 34

Mdia Aritmtica ( x )
Como calcular? Soma de uma srie de valores dividida pelo nmero de valores

Mdia Aritmetica ( x )
Exemplo
Dosagem de hemoglobina (mg) em 8 indivduos 15; 14; 13; 11; 13; 14; 13,5; 12 x = 105,5/8 = 13,2

Frmula
x =

xi i=1
n

Exemplo: Os grupos so iguais?


A 0 5 X =5 B

10

5 5

X =5 Medidas de disperso

Quantificar a variabilidade dos dados

A 0 5 X =5

Medidas de Disperso
(0-5) + (5-5) + (10-5) 10 (0-5) + (5-5) + (10-5) 3 (Varincia) Desvio Padro
2 2 2

Varincia

Frmula:

Var(x)=

(xi x)
i=1

n-1

Varincia amostral

B 5 5 X =5

Medidas de Disperso
(5-5) + (5-5) + (5-5) 5 Var(B) = (5-5) + (5-5) + (5-5) 3 -1 (Varincia) DP (B)= 0 Desvio Padro
2 2 2

=0

Exemplo: Os grupos so iguais?


A 0 5 X =5 D.P. = 5 B

10

5 5

X =5 D.P.=0

Ao comparar mdias, precisamos lembrar do desvio padro!!!

A magnitude de Varincia e Desvio Padro depende da magnitude dos dados.

Exemplo: Estudo de efeito de vacina de gripe em crianas portadores de doenas crnicas Caracterizao da amostra
Medidas Resumo n Mdia Mediana Desvio Padro Mnimo Mximo Idade (anos) 156 6 6 2 1 10 Peso (kg) 157 19,4 19,6 6,2 5,0 37,9 Estatura (cm) 156 109 112 16 66 138

Observe d.p.

Como saber se um desvio padro grande ou pequeno?

Coeficiente de Variao (CV)


Frmula: CV = Desvio Padro Mdia CV expressa a variabilidade relativa mdia
Ex: Estudo de efeito de vacina de gripe em crianas portadores de doenas crnicas
Medidas Resumo Mdia Desvio Padro CV(%) Idade (anos) 6 2 39 Peso (kg) 19,4 6,2 32 Estatura (cm) 109 16 14

X 100

Mediana (Md)
Como calcular?
1) Ordenar os valores de forma crescente 2) Identificar o valor que separa a distribuio em duas metades com o mesmo nmero de eventos

Mediana (Md)
Exemplo 1: Um tipo de cirurgia foi realizado por
cinco mdicos, cada um nos seguintes tempos: 48 ; 42; 52; 95; 46

Soluo:
Valores ordenados: 42, 46, 48, 52, 95.

Md =48

Mediana (Md)
Exemplo 2: Dosagem de hemoglobina (mg) em
8 indivduos 15; 14; 13; 11; 13; 14; 13,5; 12

Soluo:
Valores ordenados: 11; 12; 13; 13; 13,5; 14; 14; 15 Md =(13+13,5)/2 = 13,25

Mediana (Md)
Exerccio: Encontre Mediana
seguinte amostra 5; 10; 15; 100 Qual medida se aproxima mais a realidade da amostra? e mdia na

Soluo:
Mdia = 32,5 Mediana= 12,5

Comentrios
No caso de amostra pequena, mdia sofre mais a influencia dos valores extremos do que a mediana

Moda (Mo)
Como calcular? o valor mais freqente em um conjunto de dados Comentrios Distribuies podem ter uma ou mais modas (unimodal, bimodais, trimodais ou amodais) Uma medida de concentrao dos valores a menos utilizada dentre as medidas de tendncia central

Moda (Mo)
Exemplo
Dosagem de hemoglobina (mg) indivduos 15; 14; 13; 11; 13; 14; 13,5; 12 Modas: 13 e 14 em 8

Exerccio: Qual companhia mais adequada?


Um estudante est procurando um estgio para o prximo ano. As companhias A e B tm programas de estgios e oferecem uma remunerao por 20 horas semanais com as seguintes caractersticas (em salrios mnimos)
Companhia Mdia Mediana Moda A 2,5 1,7 1,5 B 2,0 1,9 1,9

Outras Medidas de Posio ou Locao


Quartil
Dividir o conjunto ordenado de observaes em 4 partes iguais.

Decil Percentil Mnimo Mximo

10 partes iguais 100 partes iguais

Amplitude=Mximo-Mnimo

Quartil
Conjunto de dados ordenados e dividido em 4 partes iguais 50%
Md

50%

Min

Q1

Q2

Q3

Max

1o Quartil (Q1) = o valor que divide o conjunto em duas partes, sendo que 25% dos valores so menores e 75% dos valores so maiores do que o valor determinado 2o Quartil (Q2) = mediana (50% acima e 50% abaixo ) 3o Quartil (Q3) = o valor da srie em que temos 75% dos valores abaixo e 25% dos valores acima do valor determinado

Desenho Esquemtico (Boxplot)


Mximo Q3

Mediana Q1 Mnimo

Intervalo Interquartil (IQ=Q3-Q1)

Desenho Esquemtico (Boxplot)


Dado Discrepante (Outlier) Pontos Soltos *

Pontos externos

IQ

IQ

Mostrar a distribuio Identificar outliers

Exemplo: Manual para pacientes com doena renal cronica


Statistics N Mean Median Std. Deviation Minimum Maximum Percentiles Valid Missing escore1 28 0 18,75 18,50 3,668 11 26 16,25 18,50 21,00 escore2 28 0 27,68 28,00 ,723 25 28 28,00 28,00 28,00

25 50 75

Exemplo: Manual para pacientes com doena renal cronica

P<0,001

Medidas Resumo
Medidas de posio
Medidas de tendncia central:
Media

Medidas de disperso
Amplitude Desvio Padro/ Varincia Intervalo Interquartil Coeficiente de variao

Mediana Moda Outras:


Mnimo Mximo Quartil Decil Percentil

Com as medidas resumo, podemos:


Analise de consistncia discrepantes (Identificar dados

Resumir os dados para que sejam informativos Obter informaes que indiquem possveis modelos a serem utilizados na inferncia estatstica

Inferncia Estatstica

Tcnicas de Anlise Bivariada


Varivel 1 Varivel 2 Descrio dos dados Testes Qui-quadrado ANOVA, tstudent testes no paramtricos Coeficiente de correlao

Qualitativa Tabela de contingncia Qualitativa Quantitativa Medidas resumo Quantitativa Qualitativa Quantitativa Grfico de disperso

Associao entre 2 variveis quantitativas


Ex: Determinada concentrao da substncia X (em mg/l) versus ganho de peso em 15 bois de mesma raa e idade
X 0.2 0.5 0.6 0.7 1 1.5 2 2.5 3 3.5 4 4.5 5 5.5 6 Y 9.4 11.4 12.3 10.2 11.9 13.6 14.2 16.2 16.2 17.7 18.8 19.9 25.5 24.7 23.1

Diagrama de Disperso
30

Ganho de Peso

25 20 15 10 5 0 0 1 2 3 4 5 6 7

Concentracao da Substancia

Qual a relao entre as variveis?

Referncias
Estatstica Bsica. Morettin, P. A. e Bussab, W. O. Editora Atual Noes de Probabilidade e Estatstica. Magalhes, M.N. e Lima, A.C.P. EDUSP Noes de Estatstica. Botter, D.A, Paula, G.A ; Leite, J.G.; Cordani, L.K. IME-USP