Sie sind auf Seite 1von 55

Bioestatstica

Descrio e apresentao de dados

Estatstica Descritiva
Considere um conjunto de dados obtidos via amostra (ou mesmo toda a populao).

O objetivo nesse momento ser o de organizar, resumir e apresentar estes dados, de tal forma que possamos interpret-los luz dos objetivos da pesquisa. Esta parte do tratamento de dados chamada de Estatstica Descritiva.

Dados Estatsticos
Em um conjuntos de dados, temos os indivduos e as informaes relativas a esses indivduos, as variveis. Segue que: a) Indivduo ou unidade elementar: a entidade de base sobre a qual o observador realiza um certo nmero de medies. Exemplo: um paciente, um usurio, um empregado, um dente, uma cidade, um pas, um eleitor, etc...

Dados Estatsticos
b) Variveis: conjunto de informaes levantadas para cada indivduo. Exemplo: no caso de um estudo clnico, os indivduos seriam os pacientes atendidos e as variveis seriam o sexo, a idade, presso d/s, altura, tipo de sangue, nmero de cries Quanto ao tipo as variveis podem ser quantitativas e qualitativas. Quanto funo no estudo as variveis podem ser respostas ou explicativas. A tcnica estatstica depende do tipo de varivel.

Tipos de Variveis
- Quantitativa: quando seus possveis valores so assumidos numa escala numrica: salrio, idade, altura, peso, etc... Pode ser:
Pode ser: Discreta: resultado de uma contagem; Contnua: resultado de uma medio.

Tipos de Variveis
- Qualitativa: quando seus possveis valores assumem modalidades no numricas (categricas), como sexo, profisso, escolaridade, regio, nvel hierrquico, etc...
Pode ser:

Nominal: vrios atributos; Ordinal: varivel ordenada (nvel hierrquico, nvel de satisfao).

Planilha de dados

VAR 1 1 2 3 .... .... n

VAR 2

...................

VAR p

Apresentao dos dados


As tabelas e grficos permitem fazer uma apresentao dos dados e, transmitindo mais rapidamente as informaes pertinentes ao estudo. O tipo de grfico e tabela ir depender do tipo de varivel:

TABELAS

Variveis Quantitativas
Tabela de freqncias (nmero de casos) Consiste em agrupar os dados em classes prestabelecidas tais que, quando reunidos, abrangem todo o conjunto de dados.

Tabelas de Freqncias
O nmero de casos em cada classe chamado freqncia absoluta. A percentagem de dados em cada classe estamos nos referindo freqncia relativa. A soma das freqncias (absoluta ou relativa) das classes anteriores chamada freqncia acumulada (absoluta ou relativa respectivamente).

Tabelas de Freqncias
classes freq. absoluta (fa) freq. relativa (fr) (%) freq. acumulada freq. acumulada absoluta (FA) relativa (FR) (%)

classe 1 ....... ....... classe k TOTAL n = total de dados

100(%)

n = total de dados -

100 (%) -

Tabelas de Freqncias
O nmero de classes uma escolha arbitrria. Em geral, usam-se de 5 (cinco) a 20 (vinte) classes.

No devemos, em geral, nem detalhar nem comprimir demais a tabela.

Variveis Qualitativas
Consiste em colocar as categorias e as respectivas freqncias (absoluta e relativa) de cada categoria.

Tabelas de Freqncias
S exo

Frequncia Sexo Feminino Masculino T otal No Respondeu T otal 290 191 481 1 482

% 60,2 39,6 99,8 ,2 100,0

% Vlido 60,3 39,7 100,0

Tabelas de Freqncias
Qual a rea preferida?

Exatas

Freqncia 72

% 14,9

% Vlido 19,2

Humanas
Biomdicas Total No Total

198
105 375 107 482

41,1
21,8 77,8 22,2 100,0

52,8
28,0 100,0

GRFICOS

Variveis Quantitativas
Histograma Polgono de Freqncias Box-Plot Grfico de Mdias

Histograma
A Figura a seguir mostra um histograma, construdo a partir de uma tabela de freqncias. So retngulos justapostos, feitos sobre as classes da varivel em estudo. Sobre cada classe tem-se um retngulo, cuja altura corresponde freqncia observada desta classe. O histograma pode ser construdo tanto com as freqncias absolutas quanto com as freqncias relativas.

Histograma
300

200

100

0 8, 74 10, 19 11, 64 13, 09 14, 54

Hem o glob in a em h em o cue

80

60

40

20

Co leste rol

0 0, 39 0 0, 37 0 0, 35 0 0, 33 0 0, 31 0 0, 29 0 0, 27 0 0, 25 0 0, 23 0 0, 21 0 0, 19 0 0, 17 0 0, 15 0 0, 13 0 0, 11

Histograma

Histograma
160 140 120 100 80 60 40 20 0 25,0 75,0 125,0 175,0 225,0 275,0 325,0 375,0 425,0 475,0 525,0

T rig licerd ios

Histograma
160 140 120 100 80 60 40 20 0 135 ,0 140 ,0 145 ,0 150 ,0 155 ,0 160 ,0 165 ,0 170 ,0 175 ,0 177 ,5 137 ,5 142 ,5 147 ,5 152 ,5 157 ,5 162 ,5 167 ,5 172 ,5

Alt ura e m cen tme tros

Polgono de freqncias
16 14 12 10 8 6 4 2 0 0 5 15 25 35 45 55 65 75

Grfico de Linhas
Dados Prevalncia e Incidncia 1980 a 1998
40

30

20

10 prevalncia 0 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 incidncia

ANO

Variveis Qualitativas
Grfico de Barras

Grfico de Setores circulares

Grfico de Barras e Setores


Qual sua rea de preferncia?
60 50
Biomdic as

40

28,0% Exatas

Percentual

30

19,2%

20

10

0 Humanas Biomdicas Exatas


Humanas 52,8%

Medidas de posio
Objetivam resumir um conjunto de valores em um nico valor.

Medidas
Medidas

Posio

Disperso

Assimetria

Curtose

Tendncia Central Medidas de Ordem

Desvio Mdio Desvio Padro Varincia Coef. de Variao

Medida de Assimetria Positiva Negativa

Medida de Achatamento

Medidas de Posio
DMedidas de Posio Digite o ttulo aqui

Tendncia Central

Medidas de Ordem

- Mdia - Mediana - Moda

- Quartil - Percentil

Mediana
A mediana o valor que divide a distribuio dos dados ao meio. Ou seja, deixa os 50% menores valores de um lado, e os 50% maiores valores do outro lado. Para se calcular a mediana, os dados devem estar ordenados. Por exemplo, ordenando-se as notas da turma D temos: 0, 5, 6, 7, 7.3, 7.5, 8.5. A mediana da turma C a 4a. (quarta) observao ordenada, porque essa observao deixa 3 outras de um lado (0, 5, 6) e 3 do outro (7.3, 7.5, 8.5). Logo a mediana vale 7.

Mediana
Nem todos os conjuntos de dados tm um valor central to ntido como exposto acima. Por exemplo, se tivermos um nmero par de observaes? Assim, vamos definir um critrio para acharmos a mediana: A mediana de um conjunto de dados ordenados, representada por Md ser o valor que: n mpar o valor que ocupa a posio (n + 1)/2. n par: a mdia dos valores que ocupam as posies (n/2) e (n/2 + 1)

Vantagens da Mediana
Fcil de calcular;

no afetada por valores extremos; um valor nico; pode ser aplicada nas escalas ordinal, intervalar e proporcional.

Desvantagens da Mediana
Difcil de incluir em equaes matemticas;
No utiliza todos os valores da varivel.

Moda
Moda (Mo) o valor da varivel que mais se repete, o que possui maior freqncia. Uma varivel pode ter mais de uma moda (bimodal, trimodal, etc...). A moda uma medida resistente, pois est relacionada somente com a freqncia de um ou mais valores da varivel. Por exemplo, a mudana de um valor da varivel pode no afetar a moda.

Vantagens da Moda
Fcil de calcular;

No afetada por valores extremos; Pode ser aplicada em qualquer escala: nominal, ordinal, intervalar e proporcional.

Desvantagens da Moda
Pode estar afastada do centro dos valores;
Difcil de incluir em equaes matemticas; No utiliza todos os valores da varivel; A varivel pode ter mais de uma moda; Algumas variveis no tm moda.

Mdia Aritmtica
O conceito de mdia aritmtica, ou simplesmente mdia, bastante familiar. Matematicamente, ela a soma de todos os valores divididos pelo nmero de valores somados.

Mdia Aritmtica
Caractersticas Importantes da Mdia: 1. A mdia est posicionada de forma equilibrada entre os valores da varivel; 2. Todos os valores da varivel so includos no clculo da mdia; 3. A mdia um valor nico que pertence ao intervalo dos dados; 4. A mdia influenciada pelos valores extremos.

Vantagens da Mdia
Fcil de compreender e aplicar;
utiliza todos os valores da varivel; um valor nico;

fcil de incluir em equaes matemticas;


pode ser aplicada nas escalas intervalar e proporcional.

Desvantagens da Mdia
afetada por valores extremos;
necessrio conhecer todos os valores da varivel.

Qual das 3 medidas usar?


Quando procuramos conhecer valores mdios : a mdia. Ex.: em controle de qualidade, a mdia utilizada para determinar se o processo est operando ao redor de um valor esperado, o alvo.
Se a varivel tiver valores extremos, a mediana mais adequada. Ex.: varivel salrio.

A moda um valor tpico. Variveis qualitativas. Produtos mais consumidos.

Medidas de Ordem
O interesse est em conhecer a posio de um determinado valor em relao ao grupo de valores.
Calcular: Quartis Percentis

Quartis
Os quartis so os valores que dividem os dados ordenados em quatro partes, com igual nmero de dados. O primeiro quartil (Q1) delimita os 25% menores valores. O terceiro quartil (Q3) o valor que separa os 25% maiores valores. O segundo quartil a prpria mediana.

Box-Plot
O diagrama dos 5 nmeros uma forma de resumir os dados com os quartis, extremos e o nmero de observaes do conjunto de dados. Atravs desses nmeros podemos ter informaces sobre a posio central, disperso e assimetria da distribuio de freqncias. uma maneira de representar graficamente aspectos relevantes de uma distribuio de freqncias.

Box-Plot
Basicamente, traa-se dois retngulos: um representando o espao entre o quartil inferior e a mediana; e o outro o espao entre a mediana e o quartil superior. Esses dois retngulos representam a faixa dos 50% valores mais tpicos da distribuio. Entre os Quartis e os extremos, traase uma linha. Essa linha traada at o limite de Q3 + 1,5(Q3 Q1) para a parte superior e Q1 1,5(Q3 Q1) para a inferior. Valores que caem fora dessas linhas so considerados valores discrepantes, sendo indicados por pontos.

Box-Plot
400 300

200

100
3 9

0
N = 4 0

T axa d e co le ste ro l

Percentis
Ordenados os dados, os percentis so medidas que separam percentuais dos dados. Percentil 1: separa 1% dos menores dados; Percentil 20: separa 20% dos menores dados; Percentil 80: separa 80% dos menores dados e 20% dos maiores; etc....

Medidas de Disperso
Medem o grau de variabilidade de um conjunto de dados

DMedidas de Disperso Digite o ttulo aqui

- Desvio Mdio - Varincia - Desvio Padro - Coeficiente de Variao

MEDIDAS DE DISPERSO
DESVIO MDIO: soma dos mdulos dos desvios dividido pelo total de dados. VARINCIA: soma dos quadrados dos desvios dividido pelo total de dados menos 1 (amostra).

DESVIO PADRO: raiz quadrada positiva da varincia.


COEFICIENTE DE VARIAO: Mede o grau de variao relativa. (desvio-padro dividido pela mdia)

Exemplo
Exemplo: A tabela abaixo mostra as notas finais dos alunos de trs turmas e a nota mdia de cada turma.
TURMA A B C 4 1 0 5 2 6 NOTAS DOS ALUNOS 5 6 6 7 4 6 6 9 7 7 7 7,5 7 10 7,5 8 10 MDIA 6,0 6,0 6,0

Medidas de Disperso
Essas medidas do uma idia de quo homogneos ou heterogneos so os dados.
Para calcularmos essas medidas, devemos considerar os desvios de cada valor em relao mdia. Depois, constri-se uma mdia desses desvios. Por exemplo, considere as notas da turma A:

Desvio da Mdia
Notas da turma A 4 5 5 6 6 7 7 8 Soma Desvio = Nota Mdia 4 6 = 2 5 6 = 1 5 6 = 1 66= 0 66= 0 76= 1 76= 1 86= 2 0

Varincia
Notas da turma A 4 5 5 6 6 7 7 8 Soma Desvio = Nota Mdia 4 6 = 2 5 6 = 1 5 6 = 1 66= 0 66= 0 76= 1 76= 1 86= 2 0 (Desvio)2 4 1 1 2 0 s 0 1 1 4 12

i 1 xi x
n

n1

Varincia
sempre um nmero positivo;
se todos os valores de uma amostra forem iguais, a varincia zero;

a varincia uma medida afetada pelos valores extremos da varivel.