Beruflich Dokumente
Kultur Dokumente
Introduo
Tipos de Variveis
Tabelas e Grficos
Medidas Resumo
Disciplina: Bioestatstica
Prof. Dr. Helber Barros Gomes
2015
Objetivos da disciplina
Geral
Introduzir conceitos e tcnicas bsicas da estatstica para apresentao e
anlise de dados.
Especfico
Capacitar para interpretao crtica de resultados de anlises que envolveram
procedimentos estatsticos de menor complexidade.
Programa
Bibliografia
Bibliografia Bsica
BUSSAB, W.O., MORETTIN, P.A. 2002. Estatstica Bsica. 5a edio, So Paulo:
Editora Saraiva.
MAGALHES, M.N., LIMA, A.C.P. 2004. Noes de Probabilidade e Estatstica. 6a
edio, So Paulo. Editora EDUSP.
PRIMACK, R.B., RODRIGUES, E. 2001. Biologia da Conservao. Londrina-PR.
Bibliografia Complementar
ALTMAN, D.G. 1999. Practical Statistics for medical research. Boston: Chapman
& Hall/Crc, 611 p.
SOARES, J.F., SIQUEIRA, A.L. 1999. Introduo estatstica mdica. Belo
Horizonte, UFMG: Coopmed Editora Mdica.
TRIOLA, M.F. 2008. Introduo estatstica. 10 ed. Rio de Janeiro.
Avaliao
Listas de exerccios
A cada uma ou duas semanas, resolver e entregar uma lista de exerccios. As
listas podem ser entregues em grupos de, no mximo, 3 alunos.
Provas
1 prova com peso 1, relativa matria dada at o momento.
2 prova com peso 2,relativa matria dada aps a 1 prova.
Prova substitutiva Relativa toda a matria. Permitida somente ao aluno que
tenha feito pelo menos uma prova e no tenha obtido NF > 7. A nota obtida
substituir a menor nota das duas provas anteriores.
O que Estatstica?
Estatstica: constitui uma parte da matemtica aplicada que tem como finalidade
obter concluses sobre os verdadeiros parmetros do universo, utilizando para
isso a coleta, a organizao, a descrio, a anlise e a interpretao dos dados.
Dois ramos da estatstica:
Estatstica descritiva: se preocupa com a organizao, sumarizao e descrio
de um conjunto de dados.
Construo de tabelas, grficos, clculo de medidas.
Amostragem
Definio: o estudo de uma amostra. Quando no h a possibilidade de realizar
um estudo sobre todos os elementos da populao, utiliza-se a amostragem.
Populao: o conjunto de todos os elementos, em um estudo.
Exemplo: Universitrios de So Paulo, neste semestre.
Amostragem
Amostragem Aleatria
Cada elemento da populao tem a
mesma chance de ser escolhido.
Amostragem Estratificada
Classificar a populao em, ao
menos dois estratos e extrair uma
amostra de cada um.
Amostragem Sistemtica
Amostragem
Amostragem
Exemplo: Em uma pesquisa eleitoral, um instituto de pesquisa procura, com base
nos resultados de um levantamento aplicado a uma amostra da populao,
estimar a inteno de voto dessa populao.
As estimativas so fornecidas com um valor e uma margem de erro.
O quadro a seguir refere-se inteno de voto no 1 turno das eleies para
presidente do Brasil em 2002.
Voto estimulado, em % do total
de votos. A ltima pesquisa ouviu
2.202 eleitores. Margem de erro de
2,09%.
Amostragem
Tabela 1.1 Informao do estado civil, grau de instrues, nmero de filhos, idade e
procedncia de 36 funcionrios sorteados ao acaso da empresa MB. (Bussab e Morettin).
Estatstica descritiva
Primeira Etapa:
Resumo dos dados = Estatstica Descritiva
Tipos de Dados
( Varivel )
Qualitativos
Nominal
- Profisso
- Sexo
- Raa
- Religio
Ordinal
- Escolaridade
- Grau de instruo
- Classe social
- Estgio da doena
Quantitativos
Discreto
Contnuo
- Nmero de filhos
- Peso
- Nmero de
- Altura
parceiros sexuais
- Presso arterial
- Contagem de
- Glicemia
Clulas tumorais
- Ndulos retirado - Colesterol srico
- Idade
Medidas Resumo
Medidas de posio
Medidas de tendncia central:
Mdia
Mediana
Moda
Quartis
Percentil
Medidas de disperso
Amplitude
Varincia
Desvio Padro
Coeficiente de Variao
Tabela de Frequncia
Dados
Brutos
nibus Tempo
1
15
2
15
3
17
4
20
5
25
6
15
7
14
8
13
9
17
10
25
11
30
12
23
13
13
14
18
15
17
16
15
17
16
18
28
19
23
20
19
21
16
22
14
23
15
24
13
25
12
26
17
27
18
28
34
29
25
30
21
31
34
32
15
Anlise
Descritiva
Tempo
12
13
14
15
16
17
18
19
20
21
23
25
28
30
34
Total Global
N
1
3
2
6
2
4
2
1
1
1
2
3
1
1
2
32
Medidas
Resumo
Medidas Resumo
32
Moda
15
Mdia
19
Mediana
17
Desvio Padro
Mnimo
12
Mximo
34
n de filhos
0
1
2
3
4
i
1
2
3
4
5
6
fi
2
6
10
12
4
S = 34
Estaturas (cm)
150 |-- 154
154 |-- 158
158 |-- 162
162 |-- 166
166 |-- 170
170 |-- 174
fi
4
9
11
8
5
3
S = 40
xi * fi
0
6
20
36
16
S = 78
xi
152
156
160
164
168
172
xi * fi
608
1404
1760
1312
840
516
S = 6440
Medidas Resumo
Medidas de Posio: Tendncia Central
Mediana (Md): A mediana o valor da varivel que ocupa a posio central de um
conjunto de n dados ordenados.
Posio da mediana: (n+1) / 2
Exemplo 1: Um tipo de cirurgia foi realizado por cinco mdicos, cada um nos
seguintes tempos:
48; 42; 52; 95; 46
Soluo:
Valores ordenados: 42; 46; 48; 52; 95
Md = 48
Medidas Resumo
Medidas de Posio: Tendncia Central
Exemplo 2: Dosagem de hemoglobina (mg) em 8 indivduos.
15; 14; 13; 11; 13; 14; 13,5; 12
Soluo:
Valores ordenados: 11; 12; 13; 13; 13,5; 14; 14; 15
Md: (13+13,5) / 2 = 13,25
Observao:
Para amostra pequena, a mdia sofre mais a influncia de valores extremos do
que a mediana.
Medidas Resumo
Medidas de Posio: Tendncia Central
Moda (Mo): o valor mais frequente em um conjunto de dados.
Exemplo 1: 4; 5; 4; 6; 5; 8; 4; 3; 4
Mo = 4
Exemplo 2: Dosagem de hemoglobina (mg) em 8 indivduos.
15; 14; 13; 11; 13; 14; 13,5; 12
Mo = 13 e 14
Observaes:
Distribuies podem ter uma ou mais modas (unimodal, bimodal, multimodal,
amodal).
a menos utilizada dentre as medidas de tendncia central.
Medidas Resumo
Medidas de Posio: Outras Medidas
Quartis (Q): Dividem a distribuio em 4 partes iguais.
1 Quartil (Q1) = o valor que divide o conjunto de em duas partes, sendo que 25% dos
valores so menores e 75% dos valores so maiores do que o valor determinado.
3 Quartil (Q3) = o valor da srie em que temos 75% dos valores menores e 25% dos
valores acima do valor determinado.
i
1
2
3
4
5
6
Estaturas (cm)
150 |-- 154
154 |-- 158
158 |-- 162
162 |-- 166
166 |-- 170
170 |-- 174
fi
4
9
11
8
5
3
S = 40
fant
4
13
24
32
37
40
i
1
2
3
4
5
6
Estaturas (cm)
150 |-- 154
154 |-- 158
158 |-- 162
162 |-- 166
166 |-- 170
170 |-- 174
fi
4
9
11
8
5
3
S = 40
fant
4
13
24
32
37
40
Medidas Resumo
Medidas de Disperso (Variabilidade)
Representam o quanto os dados de uma amostra esto dispersos em relao a um
parmetro.
Exemplo:
Tendncia central
Temperatura mdia na superfcie da Terra: 14C
Variao
Temperatura mxima: +45C
Temperatura mnima: -60C
Medidas Resumo
Medidas de Disperso (Variabilidade)
Amplitude (A): a diferena entre o maior e o menor valor observado.
,
A = max min
Exemplo: Considere as notas de um teste de 3 grupos de alunos.
Grupo 1: 3, 4, 5, 6, 7
Grupo 2: 1, 3, 5, 7, 9
Grupo 3: 5, 5, 5, 5, 5
Soluo:
Grupo 1, A = (7 - 3) = 4
Grupo 2, A = (9 - 1) = 8
Grupo 3, A = (5 - 5) = 0
Medidas Resumo
Medidas de Disperso (Variabilidade)
Varincia (S2): Medida que baseia os desvios de uma amostra em relao a mdia
aritmtica dos quadrados dos desvios.
Cada valor
assumido pela
varivel
Mdia
Somatrio
Varincia
Tamanho da
amostra
Desvio Padro (S): Medida que tende a dar significado varincia na estatstica
descritiva. dado pela raiz quadrada da varincia.
Desvio Padro
Varincia
5,4
-1,0
1,00
6,9
0,5
0,25
6,6
0,2
0,04
7,2
0,8
0,64
5,7
-0,7
0,49
6,1
-0,3
0,09
7,1
0,7
0,49
5,8
-0,6
0,36
6,8
0,4
0,16
6,4
Medidas Resumo
Medidas de Disperso (Variabilidade)
Coeficiente de Variao (CV): uma comparao, em termos percentuais, do
desvio padro de uma srie de dados em relao ao valor mdio dessa srie.
Observao:
Vantagem
Medidas Resumo
Medidas de Disperso (Variabilidade)
Coeficiente de Variao (CV)
Exemplo: Considere os seguintes resultados das medidas das estaturas e dos
pesos de um mesmo grupo de indivduos.
S
Estaturas
175 cm
5,0 cm
Pesos
68 kg
3,0 kg
Qualitativa ordinal
Observao:
Alm de economizar espao na
apresentao, permite que as
comparaes sejam feitas de
maneira mais rpida.
A Fig. 4.5 mostra um grfico de barras que pode ser usado da comparao da
distribuio de frequncias de uma varivel em vrios grupos.
Quando estamos trabalhando com uma varivel discreta que assume poucos valores, podemos dar a
ela o mesmo tratamento dado s variveis qualitativas ordinais, assumindo que cada valor uma
classe e que existe uma ordem natural nessas classes.
Quando estamos trabalhando com uma varivel discreta que pode assumir um grande nmero de
valores distintos como, por exemplo, o nmero de ovos que um inseto pe durante sua vida, a
construo da tabela de frequncias e de grficos considerando cada valor como uma categoria fica
invivel.
A soluo agrupar os valores em classes ao montar a tabela, como mostra a Tabela 4.4.
A escolha do nmero de classes e do tamanho das classes depende da amplitude dos valores a serem
representados (no exemplo, de 10 a 44) e da quantidade de observaes no conjunto de dados.
Classes muito grandes resumem demais a informao contida nos dados, pois foram a construo de
poucas classes.
O grfico da Figura 4.12, com classes de tamanho trs, uma alternativa ao grfico da Figura 4.9.
Varincia:
Desvio Padro:
P = (n+1) / 2
Variveis quantitativas contnuas: Seus valores podem ser qualquer nmero real e
ainda geralmente existe um grande nmero de valores diferentes. Assim, como
proceder para construir uma tabela de frequncias neste casos?
Primeiro Intervalo
Limite Inferior: LI 1 = min
Limite Superior: LS 1 = LI 1 + h
Segundo Intervalo
Limite Inferior: LI 2 = min
Limite Superior: LS 2 = LI 2 + h
K simo Intervalo
Limite Inferior: LI k = min
Limite Superior: LS k = LI k + h
Primeiro Intervalo
LI 1 = 4
LS 1 = 4 + 3,9 = 7,9
Segundo Intervalo
LI 1 = 7,9
LI 1 = 7,9 + 3,9 = 11,8
Tendncia Central
Variabilidade
Forma
Tendncia Central
A tendncia central da distribuio de frequncias de uma varivel caracterizada pelo valor (ou faixa
de valores) tpico da varivel.
Uma das maneiras de representar o que tpico atravs do valor mais frequente da varivel,
chamado de moda. Ou, no caso da tabela de frequncias, a classe de maior frequncia, chamada de
classe modal. No histograma, esta classe corresponde quelas com barra mais alta (pico).
A classe modal do peso dos ursos fmeas claramente a terceira, de 50 a 75 kg (Fig. 4.15). Por outro
lado, para os ursos machos, tem-se dois picos: um de 50 a 75 kg e outro de 150 a 175 kg (Fig. 4.16).
Assim, dizemos que a distribuio de frequncias do peso dos ursos fmeas unimodal (apenas uma
moda) e dos ursos machos bimodal (duas modas).
A Figura 4.22 mostra um diagrama de pontos para os tempos de espera de 21 clientes de dois bancos,
um com fila nica e outro com fila mltipla, com o mesmo nmero de atendentes.
A distribuio de frequncias de uma varivel pode ter vrias formas, mas existem trs formas bsicas,
apresentadas na Figura 4.23 atravs de histogramas.
Quando uma distribuio simtrica em torno de um valor (o mais frente), significa que as
observaes esto igualmente distribudas em torno desse valor (metade acima e metade abaixo).
Sries temporais (ou sries histricas) so um conjunto de observaes de uma mesma varivel
quantitativa (discreta ou contnua) feitas ao longo do tempo. Exemplo: temperaturas medidas
diariamente em uma regio.
A representao grfica de uma srie temporal feita atravs do grfico de linha, como pode ser visto
nas Figuras 5.1 e 5.2 a seguir.
Este diagrama usado principalmente para visualizar a relao/associao entre duas variveis, mas
tambm muito til para:
Comparar o efeito de dois tratamentos no mesmo indivduo.
Verificar o efeito tipo antes/depois de um tratamento.