Sie sind auf Seite 1von 68

Aula 01 Estatstica Descritiva

Introduo
Tipos de Variveis
Tabelas e Grficos
Medidas Resumo

Disciplina: Bioestatstica
Prof. Dr. Helber Barros Gomes

2015

Objetivos da disciplina
Geral
Introduzir conceitos e tcnicas bsicas da estatstica para apresentao e
anlise de dados.
Especfico
Capacitar para interpretao crtica de resultados de anlises que envolveram
procedimentos estatsticos de menor complexidade.
Programa

O curso compreende trs grandes tpicos:


Anlise descritiva e exploratria de dados.
Noes de probabilidades e distribuies de probabilidades.
Introduo procedimentos de inferncia estatstica.

Bibliografia

Bibliografia Bsica
BUSSAB, W.O., MORETTIN, P.A. 2002. Estatstica Bsica. 5a edio, So Paulo:
Editora Saraiva.
MAGALHES, M.N., LIMA, A.C.P. 2004. Noes de Probabilidade e Estatstica. 6a
edio, So Paulo. Editora EDUSP.
PRIMACK, R.B., RODRIGUES, E. 2001. Biologia da Conservao. Londrina-PR.
Bibliografia Complementar
ALTMAN, D.G. 1999. Practical Statistics for medical research. Boston: Chapman
& Hall/Crc, 611 p.
SOARES, J.F., SIQUEIRA, A.L. 1999. Introduo estatstica mdica. Belo
Horizonte, UFMG: Coopmed Editora Mdica.
TRIOLA, M.F. 2008. Introduo estatstica. 10 ed. Rio de Janeiro.

Avaliao
Listas de exerccios
A cada uma ou duas semanas, resolver e entregar uma lista de exerccios. As
listas podem ser entregues em grupos de, no mximo, 3 alunos.
Provas
1 prova com peso 1, relativa matria dada at o momento.
2 prova com peso 2,relativa matria dada aps a 1 prova.
Prova substitutiva Relativa toda a matria. Permitida somente ao aluno que
tenha feito pelo menos uma prova e no tenha obtido NF > 7. A nota obtida
substituir a menor nota das duas provas anteriores.

Clculo da Nota Final


NF = (0,3ME+0,7MP).
ME: mdia aritmtica das listas de exerccios.
MP: mdia ponderada de duas provas.

Por que estudar Estatstica?


[Do fr. Statistique.] Substantivo feminino.
1. Parte da matemtica em que se investigam os processos de obteno, organizao e
anlise de dados sobre uma populao ou sobre uma coleo de seres quaisquer, e os
mtodos de tirar concluses e fazer avaliaes ou predies com base nesses dados.

2. Qualquer parmetro de uma amostra, como mdia, o desvio-padro, a varincia.


3. Conjunto de elementos numricos respeitantes a um fator social.
4. Representao e explicao sistemtica, por observaes quantitativas de massa, dos
acontecimentos e das leis da vida social que deles se podem deduzir.
5. Mtodo que objetiva o estudo dos fenmenos de massa, i.e., os que dependem de uma
multiplicidade de causas, e tem por fim representar, sob forma analtica ou grfica, as
tendncias caractersticas limites desses fenmenos.

O que Estatstica?

Estatstica: constitui uma parte da matemtica aplicada que tem como finalidade
obter concluses sobre os verdadeiros parmetros do universo, utilizando para
isso a coleta, a organizao, a descrio, a anlise e a interpretao dos dados.
Dois ramos da estatstica:
Estatstica descritiva: se preocupa com a organizao, sumarizao e descrio
de um conjunto de dados.
Construo de tabelas, grficos, clculo de medidas.

Estatstica inferencial ou indutiva: mtodos que tornam possvel a estimao de


caractersticas de uma populao baseada nos resultados amostrais.

Amostragem
Definio: o estudo de uma amostra. Quando no h a possibilidade de realizar
um estudo sobre todos os elementos da populao, utiliza-se a amostragem.
Populao: o conjunto de todos os elementos, em um estudo.
Exemplo: Universitrios de So Paulo, neste semestre.

Amostra: um subconjunto da populao, ou seja, uma parcela representativa da


populao.
Exemplo: 300 universitrios de So Paulo, neste semestre.
Parmetros: so caractersticas numricas de uma populao.
Exemplo: mdia e/ou desvio padro populacional.
Estatsticas: so caractersticas numricas de uma amostra.
Exemplo: mdia e/ou desvio padro amostral.

Amostragem

Amostragem Aleatria
Cada elemento da populao tem a
mesma chance de ser escolhido.

Amostragem Estratificada
Classificar a populao em, ao
menos dois estratos e extrair uma
amostra de cada um.
Amostragem Sistemtica

Escolher cada elemento de ordem k.

Amostragem

Amostragem por Conglomerados


Dividir em sees a rea populacional,
selecionar aleatoriamente algumas dessas
sees e tomar todos os elementos das
mesmas.
Amostragem de Convenincia
Utilizar resultados de fcil acesso.

Amostragem
Exemplo: Em uma pesquisa eleitoral, um instituto de pesquisa procura, com base
nos resultados de um levantamento aplicado a uma amostra da populao,
estimar a inteno de voto dessa populao.
As estimativas so fornecidas com um valor e uma margem de erro.
O quadro a seguir refere-se inteno de voto no 1 turno das eleies para
presidente do Brasil em 2002.
Voto estimulado, em % do total
de votos. A ltima pesquisa ouviu
2.202 eleitores. Margem de erro de
2,09%.

Fonte: Pesquisa Toledo & Associados.

Amostragem

Tabela 1.1 Informao do estado civil, grau de instrues, nmero de filhos, idade e
procedncia de 36 funcionrios sorteados ao acaso da empresa MB. (Bussab e Morettin).

Estatstica descritiva

O que fazer com as observaes que coletamos?

Primeira Etapa:
Resumo dos dados = Estatstica Descritiva

Tipos de Dados

( Varivel )
Qualitativos

Nominal

- Profisso
- Sexo
- Raa
- Religio

Ordinal

- Escolaridade
- Grau de instruo
- Classe social
- Estgio da doena

Quantitativos

Discreto

Contnuo

- Nmero de filhos
- Peso
- Nmero de
- Altura
parceiros sexuais
- Presso arterial
- Contagem de
- Glicemia
Clulas tumorais
- Ndulos retirado - Colesterol srico
- Idade

Medidas Resumo

Medidas de posio
Medidas de tendncia central:

Mdia

Mediana

Moda

Outras medidas de posio:

Quartis

Percentil

Medidas de disperso

Amplitude

Varincia

Desvio Padro

Coeficiente de Variao

Tabela de Frequncia

Dados
Brutos

nibus Tempo
1
15
2
15
3
17
4
20
5
25
6
15
7
14
8
13
9
17
10
25
11
30
12
23
13
13
14
18
15
17
16
15
17
16
18
28
19
23
20
19
21
16
22
14
23
15
24
13
25
12
26
17
27
18
28
34
29
25
30
21
31
34
32
15

Anlise
Descritiva

Tempo
12
13
14
15
16
17
18
19
20
21
23
25
28
30
34
Total Global

N
1
3
2
6
2
4
2
1
1
1
2
3
1
1
2
32

Medidas
Resumo

Medidas Resumo

Resposta breve e rpida que sintetize a informao.


Caracterizar a tendncia central ou disperso dos dados.
Exemplo: Tempo de espera de um nibus da linha A.

32

Moda

15

Mdia

19

Mediana

17

Desvio Padro

Mnimo

12

Mximo

34

n de filhos
0
1
2
3
4

i
1
2
3
4
5
6

fi
2
6
10
12
4
S = 34

Estaturas (cm)
150 |-- 154
154 |-- 158
158 |-- 162
162 |-- 166
166 |-- 170
170 |-- 174

fi
4
9
11
8
5
3
S = 40

xi * fi
0
6
20
36
16
S = 78

xi
152
156
160
164
168
172

xi * fi
608
1404
1760
1312
840
516
S = 6440

Medidas Resumo
Medidas de Posio: Tendncia Central
Mediana (Md): A mediana o valor da varivel que ocupa a posio central de um
conjunto de n dados ordenados.
Posio da mediana: (n+1) / 2
Exemplo 1: Um tipo de cirurgia foi realizado por cinco mdicos, cada um nos
seguintes tempos:
48; 42; 52; 95; 46

Soluo:
Valores ordenados: 42; 46; 48; 52; 95
Md = 48

Medidas Resumo
Medidas de Posio: Tendncia Central
Exemplo 2: Dosagem de hemoglobina (mg) em 8 indivduos.
15; 14; 13; 11; 13; 14; 13,5; 12
Soluo:
Valores ordenados: 11; 12; 13; 13; 13,5; 14; 14; 15
Md: (13+13,5) / 2 = 13,25

Observao:
Para amostra pequena, a mdia sofre mais a influncia de valores extremos do
que a mediana.

Medidas Resumo
Medidas de Posio: Tendncia Central
Moda (Mo): o valor mais frequente em um conjunto de dados.
Exemplo 1: 4; 5; 4; 6; 5; 8; 4; 3; 4
Mo = 4
Exemplo 2: Dosagem de hemoglobina (mg) em 8 indivduos.
15; 14; 13; 11; 13; 14; 13,5; 12
Mo = 13 e 14

Observaes:
Distribuies podem ter uma ou mais modas (unimodal, bimodal, multimodal,
amodal).
a menos utilizada dentre as medidas de tendncia central.

Medidas Resumo
Medidas de Posio: Outras Medidas
Quartis (Q): Dividem a distribuio em 4 partes iguais.

1 Quartil (Q1) = o valor que divide o conjunto de em duas partes, sendo que 25% dos
valores so menores e 75% dos valores so maiores do que o valor determinado.

2 Quartil (Q2) = mediana (50% acima e 50% abaixo).

3 Quartil (Q3) = o valor da srie em que temos 75% dos valores menores e 25% dos
valores acima do valor determinado.

i
1
2
3
4
5
6

Estaturas (cm)
150 |-- 154
154 |-- 158
158 |-- 162
162 |-- 166
166 |-- 170
170 |-- 174

fi
4
9
11
8
5
3
S = 40

fant
4
13
24
32
37
40

i
1
2
3
4
5
6

Estaturas (cm)
150 |-- 154
154 |-- 158
158 |-- 162
162 |-- 166
166 |-- 170
170 |-- 174

fi
4
9
11
8
5
3
S = 40

fant
4
13
24
32
37
40

Medidas Resumo
Medidas de Disperso (Variabilidade)
Representam o quanto os dados de uma amostra esto dispersos em relao a um
parmetro.

Exemplo:
Tendncia central
Temperatura mdia na superfcie da Terra: 14C
Variao
Temperatura mxima: +45C
Temperatura mnima: -60C

Medidas Resumo
Medidas de Disperso (Variabilidade)
Amplitude (A): a diferena entre o maior e o menor valor observado.
,

A = max min
Exemplo: Considere as notas de um teste de 3 grupos de alunos.
Grupo 1: 3, 4, 5, 6, 7
Grupo 2: 1, 3, 5, 7, 9
Grupo 3: 5, 5, 5, 5, 5

Soluo:
Grupo 1, A = (7 - 3) = 4
Grupo 2, A = (9 - 1) = 8
Grupo 3, A = (5 - 5) = 0

Medidas Resumo
Medidas de Disperso (Variabilidade)
Varincia (S2): Medida que baseia os desvios de uma amostra em relao a mdia
aritmtica dos quadrados dos desvios.
Cada valor
assumido pela
varivel

Mdia

Somatrio

Varincia

Tamanho da
amostra

Desvio Padro (S): Medida que tende a dar significado varincia na estatstica
descritiva. dado pela raiz quadrada da varincia.

Desvio Padro
Varincia

5,4

-1,0

1,00

6,9

0,5

0,25

6,6

0,2

0,04

7,2

0,8

0,64

5,7

-0,7

0,49

6,1

-0,3

0,09

7,1

0,7

0,49

5,8

-0,6

0,36

6,8

0,4

0,16

6,4

Medidas Resumo
Medidas de Disperso (Variabilidade)
Coeficiente de Variao (CV): uma comparao, em termos percentuais, do
desvio padro de uma srie de dados em relao ao valor mdio dessa srie.

Observao:
Vantagem

permite a comparao de amostras com unidades diferentes.

Medidas Resumo
Medidas de Disperso (Variabilidade)
Coeficiente de Variao (CV)
Exemplo: Considere os seguintes resultados das medidas das estaturas e dos
pesos de um mesmo grupo de indivduos.
S
Estaturas

175 cm

5,0 cm

Pesos

68 kg

3,0 kg

Determine qual das duas grandezas possui maior grau de disperso.


Estatura
Peso

Organizao e Representao de dados

Uma das formas de organizar e resumir a informao contida em dados


observados por meio de tabelas de frequncias e grficos.

Tabela de frequncia relaciona categorias (ou classes) de valores, juntamente com


a contagem (ou frequncia) do nmero de valores que se enquadram em cada
categoria ou classe.

Variveis qualitativas: Podemos construir tabelas de frequncia que os


quantificam por categoria de classificao e sua representao grfica mediante
grfico de barras, grfico setorial ou em forma de pizza.

Organizao e Representao de dados: Qualitativo

Exemplo: Considere a varivel Grau de Instruo dos dados da Tabela 1.1.


(Varivel qualitativa)

Organizao e Representao de dados: Qualitativo


Variveis Qualitativas Nominais e Ordinais

Organizao e Representao de dados: Qualitativo


Variveis Qualitativas Nominais e Ordinais
Qualitativa nominal

Qualitativa ordinal

Observao: Note que as frequncias


acumuladas no fazem sentido em distribuio
de frequncias de variveis para as quais no
existem uma ordem natural nas categorias, como
o caso das qualitativas nominais.

Organizao e Representao de dados: Qualitativo


Variveis Qualitativas Nominais e Ordinais
Uma situao diferente ocorre quando desejamos comparar a distribuio de
frequncias de uma mesma varivel em vrios grupos.
Se quisermos usar o grfico de setores para fazer essa comparao, devemos
fazer quatro grficos, um para cada regio, com duas fatias cada um. Uma
alternativa a construo de um grfico de colunas (barras), como
apresentados nas Figuras 4.3 e 4.4.

Observao:
Alm de economizar espao na
apresentao, permite que as
comparaes sejam feitas de
maneira mais rpida.

Organizao e Representao de dados: Qualitativo


Variveis Qualitativas Nominais e Ordinais

A Fig. 4.5 mostra um grfico de barras que pode ser usado da comparao da
distribuio de frequncias de uma varivel em vrios grupos.

A Fig. 4.6 apresenta a distribuio de frequncias da varivel em vrios grupos


simultaneamente.

Organizao e Representao de dados: Quantitativo

Variveis quantitativas discretas: Organizam-se mediante tabelas de frequncias e


a representao grfica mediante grfico de barras.
Exemplo: Considere a varivel Nmero de Filhos dos dados da Tabela 1.1.

Tabela 2.1: Distribuio de frequncias de funcionrios de uma empresa, segundo


o nmero de filhos.

Organizao e Representao de dados: Quantitativo


Variveis Quantitativas Discretas
Observao: A partir da Tabela 2.1 podemos recuperar as 20 observaes da
Tabela 1.1, ou seja, aqui a informao dos dados originais no so perdidos.
Representao grfica: Diagrama de Barras.

Organizao e Representao de dados: Quantitativo


Variveis Quantitativas Discretas

Quando estamos trabalhando com uma varivel discreta que assume poucos valores, podemos dar a
ela o mesmo tratamento dado s variveis qualitativas ordinais, assumindo que cada valor uma
classe e que existe uma ordem natural nessas classes.

Observao: Na comparao da distribuio de frequncias de uma varivel


entre dois ou mais grupos de tamanhos (nmero de observaes) diferentes,
devemos usar as frequncias relativas na construo do histograma. Deve-se,
tambm usar a mesma escala em todos os histogramas, tanto na escala
vertical quanto na horizontal.

Organizao e Representao de dados: Quantitativo


Variveis Quantitativas Discretas

Quando estamos trabalhando com uma varivel discreta que pode assumir um grande nmero de
valores distintos como, por exemplo, o nmero de ovos que um inseto pe durante sua vida, a
construo da tabela de frequncias e de grficos considerando cada valor como uma categoria fica
invivel.

A soluo agrupar os valores em classes ao montar a tabela, como mostra a Tabela 4.4.

Organizao e Representao de dados: Quantitativo


Variveis Quantitativas Discretas

A escolha do nmero de classes e do tamanho das classes depende da amplitude dos valores a serem
representados (no exemplo, de 10 a 44) e da quantidade de observaes no conjunto de dados.

Classes muito grandes resumem demais a informao contida nos dados, pois foram a construo de
poucas classes.

Organizao e Representao de dados: Quantitativo


Variveis Quantitativas Discretas

Os limites inferiores e superiores de cada classe dependem do tamanho (amplitude) da classe


escolhida, que deve ser, na medida do possvel, igual para todas as classes.

O grfico da Figura 4.12, com classes de tamanho trs, uma alternativa ao grfico da Figura 4.9.

Organizao e Representao de dados: Quantitativo

Exerccio: Com base na Tabela 2.1 determinem as medidas de posio e disperso


de filhos dos funcionrios.
Equaes:
Mdia:
Mediana:

Varincia:
Desvio Padro:

P = (n+1) / 2

Organizao e Representao de dados: Quantitativo

Variveis quantitativas contnuas: Seus valores podem ser qualquer nmero real e
ainda geralmente existe um grande nmero de valores diferentes. Assim, como
proceder para construir uma tabela de frequncias neste casos?

A alternativa consiste em construir classes ou faixas de valores e contar o nmero


de ocorrncias em cada faixa.

Exemplo: No caso da varivel salrio da Tabela 1.1, podemos considerar as


seguintes faixas de valores: [4,0 ; 7,0); [7,0 ; 10,0); ...
Notao: 4,0 |-- 7,0

Organizao e Representao de dados: Quantitativo

Procedimento de construo de tabelas de frequncias para variveis contnuas:


1.
2.
3.
4.
5.
6.

Escolher o nmero de intervalos de classe (k)


Identificar o menor valor (min) e o valor mximo (max) dos dados.
Calcular a amplitude dos dados (A): A = max-min.
Calcular o comprimento de cada intervalo de classe (h): h = A / K.
Arredondar o valor de h de forma que seja obtido um nmero conveniente.
Obter os limites de cada intervalo de classe.

Primeiro Intervalo
Limite Inferior: LI 1 = min
Limite Superior: LS 1 = LI 1 + h

Organizao e Representao de dados: Quantitativo

Segundo Intervalo
Limite Inferior: LI 2 = min
Limite Superior: LS 2 = LI 2 + h
K simo Intervalo
Limite Inferior: LI k = min
Limite Superior: LS k = LI k + h

Organizao e Representao de dados: Quantitativo


Exemplo: Considere a varivel salrio descrita na Tabela 1.1.
Procedimentos:
1.Considere k = 5.
2.min = 4 e max = 23,30.
3.A = max min = 23,30 4 = 19,30.
4.h = A / k = 19,3 / 5 = 3,86.
5.h 3,9
6.Clculo dos limites de cada intervalo:

Primeiro Intervalo
LI 1 = 4
LS 1 = 4 + 3,9 = 7,9

Segundo Intervalo
LI 1 = 7,9
LI 1 = 7,9 + 3,9 = 11,8

Os demais limites dos intervalos foram gerados seguindo o procedimento anterior.

Organizao e Representao de dados: Quantitativo


Representao Grfica:
Histograma de frequncias relativas (em %) para a varivel salrio.

Organizao e Representao de dados: Quantitativo


Representao Grfica:
Histograma de frequncia acumulada relativa (em %).

Organizao e Representao de dados


Distribuio de Frequncia
Aspectos Gerais da Distribuio de Frequncias

Ao estudarmos a distribuio de frequncias de uma varivel quantitativa, seja em um grupo apenas


ou comparando vrios grupos, devemos verificar basicamente trs caractersticas:

Tendncia Central
Variabilidade
Forma
Tendncia Central

A tendncia central da distribuio de frequncias de uma varivel caracterizada pelo valor (ou faixa
de valores) tpico da varivel.

Uma das maneiras de representar o que tpico atravs do valor mais frequente da varivel,
chamado de moda. Ou, no caso da tabela de frequncias, a classe de maior frequncia, chamada de
classe modal. No histograma, esta classe corresponde quelas com barra mais alta (pico).

Organizao e Representao de dados


Distribuio de Frequncia
Aspectos Gerais da Distribuio de Frequncias
Exemplo: ursos marrons

A classe modal do peso dos ursos fmeas claramente a terceira, de 50 a 75 kg (Fig. 4.15). Por outro
lado, para os ursos machos, tem-se dois picos: um de 50 a 75 kg e outro de 150 a 175 kg (Fig. 4.16).

Assim, dizemos que a distribuio de frequncias do peso dos ursos fmeas unimodal (apenas uma
moda) e dos ursos machos bimodal (duas modas).

Organizao e Representao de dados


Distribuio de Frequncia
Aspectos Gerais da Distribuio de Frequncias
Variabilidade

Para descrever adequadamente a distribuio de frequncias de uma varivel quantitativa, alm da


informao do valor representativo da varivel (tendncia central), necessrio dizer tambm o
quanto estes valores variam, ou seja, o quo dispersos eles so.

A Figura 4.22 mostra um diagrama de pontos para os tempos de espera de 21 clientes de dois bancos,
um com fila nica e outro com fila mltipla, com o mesmo nmero de atendentes.

Organizao e Representao de dados


Distribuio de Frequncia
Aspectos Gerais da Distribuio de Frequncias
Forma

A distribuio de frequncias de uma varivel pode ter vrias formas, mas existem trs formas bsicas,
apresentadas na Figura 4.23 atravs de histogramas.

Quando uma distribuio simtrica em torno de um valor (o mais frente), significa que as
observaes esto igualmente distribudas em torno desse valor (metade acima e metade abaixo).

A assimetria de uma distribuio pode ocorrer de duas formas:


Quando os valores concentram-se esquerda.
Quando os valores concentram-se direita.

Organizao e Representao de dados


Distribuio de Frequncia
Aspectos Gerais da Distribuio de Frequncias
Sries Temporais

Sries temporais (ou sries histricas) so um conjunto de observaes de uma mesma varivel
quantitativa (discreta ou contnua) feitas ao longo do tempo. Exemplo: temperaturas medidas
diariamente em uma regio.

Um dos objetivos do estudo de sries temporais conhecer o comportamento da srie ao longo do


tempo.

A representao grfica de uma srie temporal feita atravs do grfico de linha, como pode ser visto
nas Figuras 5.1 e 5.2 a seguir.

Organizao e Representao de dados


Distribuio de Frequncia
Aspectos Gerais da Distribuio de Frequncias
Sries Temporais

Ao analisar e construir um grfico de linhas, devemos estar


atentos a certos detalhes que podem mascarar o verdadeiro
comportamento dos dados.

Organizao e Representao de dados


Distribuio de Frequncia
Diagrama de Disperso

O diagrama de disperso um grfico onde pontos no espao cartesiano XY so usados para


representar simultaneamente os valores de duas variveis quantitativas medidas em cada elemento
do conjunto de dados.

Este diagrama usado principalmente para visualizar a relao/associao entre duas variveis, mas
tambm muito til para:
Comparar o efeito de dois tratamentos no mesmo indivduo.
Verificar o efeito tipo antes/depois de um tratamento.

Exemplo: Ursos marrons

Organizao e Representao de dados: Quantitativo

Organizao e Representao de dados: Quantitativo

Exemplo: Considere os dados da Tabela 1.1.

Das könnte Ihnen auch gefallen