Sie sind auf Seite 1von 66

Profa. Dra.

Maria Ivanilde Silva Arajo

2014
Ementa
Estatstica (60 h)
Consideraes Iniciais: Teoria da estimao
Conceitos Preliminares
Intervalo de Confiana
Fases do trabalho estatstico
Noes de Testes de
Distribuio de Frequncia hipteses
Apresentao Tabular e Uso de programas
Grfica estatsticos e aplicaes em
cincias sociais
Medidas de Posio e
Variabilidade
Noes sobre probabilidade
Distribuies especiais

Prof Dr Maria Ivanilde Araujo- UFAM 2


Bibliografia

M. I. Arajo e A. A. Balieiro, Apostila de Bioestatstica. UFAM,


2009.
Bussab W. de O.; Morettin, P. A. Estatstica Bsica - 7 Edio.
So Paulo. Ed. Saraiva, 2011.
VIEIRA, S. Elementos de Estatistica, 4 Edio. Ed. Atlas, 2003.
BARBETA, P.A., Estatstica Aplicada s Cincias Sociais, 7 ed.,
So Paulo: LTC, 2010.

Prof Dr Maria Ivanilde Araujo- UFAM 3


Cronograma das aulas
Data Contedo Horrio
Apresentao e discusso do Plano de Ensino, definio 10:00 12:00
28/04/14 do horrio de atendimento, datas e formato das avaliaes
08:00 10:00
Conceitos Preliminares. Conceitos Fundamentais da
30/04/14 Estatstica
Fases do trabalho estatstico: Planejamento, Questionrio, 10:00 12:00
05/05/14 coleta e apurao
Organizao e apresentao de dados Tabelas e 08:00 10:00
07/05/14 Anlise Exploratria de Dados - AED
12/05/14 Pacotes Estatst. e Exemplos prticos de fixao - AED 10:00 12:00
Organizao e apresentao de dados Gficos e Anlise 10:00 12:00
19/05/14 Exploratria de Dados - AED
21/05/14 Distribuio de Frequencia + Banco de dados 08:00 -10:00

26/05/14 Pacotes Estatst. e Exemplos prticos de fixao 10:00 12:00

28/05/14 1 Avaliao 08:00 10:00

02/06/14 Medidas de Posio: Mdia 10:00 12:00

Prof Dr Maria Ivanilde Araujo- UFAM 4


Cronograma das aulas Horrio
Data Contedo
04/06/14 Moda, Mediana 08:00 10:00

09/06/14 Dia para trabalhar o banco de dados (Exerccios) 10:00 12:00

11/06/14 Medidas de variabilidade: Amplitude, Varincia 08:00 10:00

16/06/14 Desvio Padro, Coeficiente de Variao 10:00 12:00

30/06/14 Dia para trabalhar o banco de dados (Exerccios) 08:00 10:00

02/07/14 2 Avaliao 10:00 12:00

07/07/14 Distribuio Binomial 08:00 10:00

09/07/14 Distribuio Normal 10:00 12:00

14/07/14 Distribuio Normal padro 08:00 10:00

16/07/14 Exerccios 10:00 12:00

21/07/14 Intervalo de Confiana: introduo 08:00 10:00

23/07/14 Intervalo de Confiana para mdia 10:00 12:00

Prof Dr Maria Ivanilde Araujo- UFAM 5


Cronograma das aulas
Data Contedo Horrio

28/07/14 Intervalo de Confiana para proporo 08:00 10:00

30/07/14 Dia para trabalhar o banco de dados (Exercciosh 10:00 12:00

04/08/14 Viagem 08:00 10:00

06/08/14 Viagem 10:00 12:00

11/08/14 Teste de hiptese: Introduo 08:00 10:00

13/08/14 Teste de hiptese para mdia 10:00 12:00

18/08/14 Teste de hiptese para proporo 08:00 10:00

20/08/14 Exemplos fixao: Distrib., Estimao (+ banco dados) 10:00 12:00

25/08/14 Exemplos prticos de Teste de Hiptese 08:00 10:00

27/08/14 Dia para trabalhar o banco de dados (Exerccios) 10:00 12:00

08/09/14 Avaliao Final

Prof Dr Maria Ivanilde Araujo- UFAM 6


Conceitos
Estatstica
Estatstica Indutiva e Inferencial
Exemplos de utilizao da estatstica
Populao e amostra
Parmetro e estatstica
Dados primrios e secundrios
Censo
Varivel

Prof Dr Maria Ivanilde Araujo- UFAM 7


Conceitos
Estatstica: a cincia que tem por objetivo
planejar, coletar, tabular, analisar e interpretar
informaes e delas extrair concluses que permitam
a tomada de decises acertadas mediante
incertezas.

reas: Estatstica Descritiva e Estatstica


Inferencial ou Indutiva

Prof Dr Maria Ivanilde Araujo- UFAM 8


Conceitos
Populao: o conjunto de elementos (valores, pessoas,
medidas etc.) que tem pelos menos uma caracterstica em
comum.
Alunos de 5 a 12 anos da rede pblica do municpio de
Gurupi-TO (para verificao de parasitas intestinais)
Idosos integrantes da Unati - Universadade Aberta
Terceira Idade (importncia da relao mdico paciente,
percepo sobre a atuao do mdico)
Calendula officinalis L. (ASTERACEA). Influncia do processo
extrativo nas caractersticas fsicas e qumicas dos extratos.

Amostra: um subconjunto de elementos extrados de uma


populao.

Prof Dr Maria Ivanilde Araujo- UFAM 9


Conceitos
Parmetro: uma medida numrica que descreve
uma caracterstica de uma populao.
Estatstica: uma medida numrica que descreve
uma caracterstica da amostra.
Dados primrios: dados coletados pelo prprio
pesquisador e sua equipe.
Dados secundrios: no foram obtidos pelo
pesquisador e sua equipe (diversas fontes como
artigos em peridicos, institutos de pesquisa,
DATASUS, IBGE, OMS, OPAS).

Prof Dr Maria Ivanilde Araujo- UFAM 10


Conceitos

Censo: uma coleo de dados relativos a todos


os elementos de uma populao.

Varivel: a caracterstica de interesse que


medida em cada elemento da amostra ou
populao, podendo ter resultados numricos ou
no. Seus valores variam de elemento a elemento.

Prof Dr Maria Ivanilde Araujo- UFAM 11


Variveis - Classificao

Nominal
Qualitativa
Ordinal
Varivel
Quantitativa Discreta

Contnua

Prof Dr Maria Ivanilde Araujo- UFAM 12


Tipos de estudo
Estudo observacional: verificamos e medimos
caractersticas especficas, mas no tentamos manipular
ou modificar os elementos a serem estudados.
Estudo transversal: dados so observados, medidos e
coletados em um ponto no tempo.
Estudo retrospectivo ou de caso controle: os dados
so coletados do passado, voltando-se no tempo.
Estudo prospectivo ou longitudinal ou de coorte:
os dados so coletados no decorrer do tempo, de grupos
(coortes) que compartilham fatores comuns.

Prof Dr Maria Ivanilde Araujo- UFAM 13


Experimentos
Controlando os efeitos das variveis
Experimentos cegos: o sujeito no sabe se est
recebendo o tratamento ou o placebo.
Planejamento experimental completamente
aleatorizado: os sujeitos so colocados nos
tratamentos atravs de um processo de seleo
aleatria.
Planejamento rigorosamente controlado:
sujeitos so escolhidos cuidadosamente de modo que
em cada bloco sejam similares.

Prof Dr Maria Ivanilde Araujo- UFAM 14


Tipos de estudos

Prof Dr Maria Ivanilde Araujo- UFAM 15


Levantamento de dados
Problemas usuais - Representatividade
Fator associado forma de amostragem.
Na seleo da amostra procura-se reproduzir as
caractersticas observveis da populao - uso do
critrio de proporcionalidade.
Em caso de desconhecimento da composio da
populao deve-se utilizar algum critrio de
aleatoriedade (sorteio).
Amostra tendenciosa concluses sem
consistncia.

Prof Dr Maria Ivanilde Araujo- UFAM 16


Levantamento de dados

Problemas usuais Fidedignidade


Relacionada preciso ou qualidade dos
dados.
Motivos da falta de preciso:
Falhas nos instrumentos de aferio;
Problemas nos questionrios empregados na
obteno dos dados;
Falha humana.

Prof Dr Maria Ivanilde Araujo- UFAM 17


Levantamento de dados

A importncia da coleta de dados


Cuidado na hora de coletar informaes;
No adianta uma metodologia perfeita e
um bom planejamento se na hora da
coleta dos dados houver alguma influncia
do entrevistador perante o entrevistado;
As pessoas que so contratadas para fazer
as entrevistas devem passar por um bom
treinamento.

Prof Dr Maria Ivanilde Araujo- UFAM 18


Amostragem

Se os dados amostrais no forem coletados de


maneira apropriada, eles podem ser de tal
modo inteis que nenhuma manipulao
estatstica poder salv-los.
A aleatoriedade comumente desempenha
papel crucial na determinao de quais dados
coletar.

Prof Dr Maria Ivanilde Araujo- UFAM 19


Amostragem
Vantagens do levantamento por amostragem:
custo menor, menor tempo e objetivos mais amplos.
Situaes para trabalho com amostras: populao
muito grande, dificuldade de acesso, grande nmero de
variveis.
Tipos
Aleatria
Estratificada
Sistemtica
Conglomerados
Convenincia
Prof Dr Maria Ivanilde Araujo- UFAM 20
Distribuies de Frequncias
Relacionam categorias ou classes de valores, juntamente com
contagens (ou frequncia) do nmero de valores que se
enquadram em cada categoria.
Exemplo: VARIVEL QUALITATIVA

Indgenas por etno-regio de origem, Manaus, 2007


Etno-Regio n %
Juru, Juta, Purus, Javari 51 7,35
Marau-Andir 148 21,33
Rio Negro 315 45,39
Solimes 129 18,59
Tapajs-Madeira 38 5,48
Outras regies 13 1,87
Total 694 100,00
Prof Dr Maria Ivanilde Araujo- UFAM 21
Tabelas
Tabela de distribuio de frequncia
Considere o seguinte conjunto de dados:
21, 21, 21, 22, 22, 23, 23, 24, 25, 25, 25, 25, 26, 26,
26, 28, 30.
Construa uma distribuio com todas as
frequncias.
Soluo:

Prof Dr Maria Ivanilde Araujo- UFAM 22


Tabelas
X fi fac fr far
21 3 3 3/17 3/17
22 2 5 2/17 5/17
23 2 7 2/17 7/17
24 1 8 1/17 8/17
25 4 12 4/17 12/17
26 3 15 3/17 15/17
28 1 16 1/17 16/17
30 1 17 1/17 17/17
17 1
Prof Dr Maria Ivanilde Araujo- UFAM 23
Tabelas
Para a construo de tabelas de frequncias para
variveis contnuas, os dados devem ser
agrupados em intervalos de classes.

Para a construo das classes algumas definies


so necessrias:

Prof Dr Maria Ivanilde Araujo- UFAM 24


Tabelas
Amplitude Total ou Range (R): a
diferena entre o maior e o menor valor
observado.
Ex.: R = 30 - 21 = 9.

Prof Dr Maria Ivanilde Araujo- UFAM 25


Tabelas
Intervalos de Classe: Conjunto de
observaes apresentadas na forma contnua,
sem superposio de intervalos, de tal modo que
cada valor do conjunto de observao possa ser
alocado em um, e apenas um, dos intervalos.

Prof Dr Maria Ivanilde Araujo- UFAM 26


Tabelas
O nmero k de intervalos para cada conjunto de
observaes com n valores pode ser calculado como:
k = 1 + 3,322(log10 n) (frmula de Sturges)
Ex.: para um conjunto com 50 observaes obtemos
log10(50) 1,699;

k = 1 + 3,322 x 1,699 6,6 7 intervalos


O tamanho w de cada intervalo obtido pela diviso
do valor da diferena entre o maior e o menor valor, R,
pelo nmero de intervalos k:
w = R/k

Prof Dr Maria Ivanilde Araujo- UFAM 27


Tabelas
Etapas para a construo de tabelas de
frequncia para dados agrupados:

1)Encontrar o menor e o maior valor (mnimo e


mximo) do conjunto de dados.
2)Calcular o nmero de classes que englobem todos
os dados sem haver superposio dos intervalos.

Prof Dr Maria Ivanilde Araujo- UFAM 28


Tabelas
3) Contar o nmero de elementos que pertencem a
cada classe.

4) Determinar a frequncia relativa de cada classe.

Prof Dr Maria Ivanilde Araujo- UFAM 29


Tabelas
Exemplo:
O conjunto de dados abaixo representa as idades de
mulheres responsveis pelos domiclios. Construa
intervalos de classes para o mesmo.
19 19 20 21 23 23 23 23 24 24 25 25 26 26 26 27
27 27 29 29 29 29 30 31 31 31 33 33 33 34 37 37
37 37 40 40 40 40 43 43 44 44 47 48 48 48 51 52
52 53

Prof Dr Maria Ivanilde Araujo- UFAM 30


Tabelas
Soluo: Intervalo de
Freqncia
classe
se utilizar a frmula de
19 |------- 24 8
Sturges
R = 53 19 = 34 e n = 24 |------- 29 10
50 29 |------- 34 11
Ento: 34 |------- 39 5
K = 1 + 3,322 x 1,699 39 |------- 44 6
7 intervalos 44 |------- 49 6
W = 34/7 5 idades 49 |------- 54 4
em cada
Prof Dr Maria Ivanilde Araujo- UFAM 31
Tabelas
Ou construir intervalos empiricamente:

Intervalo
de classe Freqncia

10 |------- 20 2
20 |------- 30 20
30 |------- 40 12
40 |------- 50 12
50 |------- 60 4

Prof Dr Maria Ivanilde Araujo- UFAM 32


Tabelas
Os extremos dos intervalos so conhecidos como
limites de classes.

Procedendo-se desse modo, ao resumir os dados


referentes a uma varivel contnua perde-se
informaes.

Prof Dr Maria Ivanilde Araujo- UFAM 33


Apresentao de dados -
Tabelas
Componentes

Distribuio dos pacientes segundo as escalas de ABVD e


Ttulo AIVD, Hopital H, Manaus-AM, 2014
Cabealho Variveis f f (%)
Atividades Bsica da Vida Diria (ABVD)
Independncia (6 ou mais) 49 79,03
Dependncia Parcial (4 - 5) 9 14,52 Corpo
Coluna Dependncia Importante (2 ou menos) 4 6,45
Indicadora
Atividades Instrumentais da Vida Diria
Independncia (7 - 9) 26 41,94 Clula
Dependncia Parcial (4 - 6) 17 27,42
Dependncia importante (0 - 3) 19 30,65
Rodap: f: Freqncia; f(%): Freqncia Relativa
Fonte: Labio
Prof Dr Maria Ivanilde Araujo- UFAM 34
Representao tabular
Apresentao de tabelas
A tabela deve ser simple, clara e objetiva. Grandes
volumes de dados devem ser divididos em vrias
tabelas.
A tabela deve ser auto-explicativa.
Nenhuma casa da tabela deve ficar em branco,
apresentando sempre um nmero ou um smbolo.
As tabelas, excludos os ttulos, sero delimitadas,
no alto e em baixo, por traos horizontais grossos,
preferencialmente.
Prof Dr Maria Ivanilde Araujo- UFAM 35
Representao tabular
Apresentao de tabelas
Recomenda-se no delimitar as tabelas direita
e esquerda, por traos verticais.
Ser facultativo o emprego de traos verticais
para a separao de colunas no corpo da tabela.
Deve-se manter a uniformidade quanto ao
nmero de casas decimais.
Os totais e subtotais devem ser destacados.

Prof Dr Maria Ivanilde Araujo- UFAM 36


Tabelas de contingncia
Conjugando duas sries em uma nica tabela, obtm-se uma
tabela de dupla entrada.
Distribuio segundo tratamento de diabetes e cultura
No Indgena Indgena
Varivel (Mdulo - DIABETES) f f (%) f f (%) P
Est fazendo tratamento
contra Diabetes?
No, mas j fez 4 14,29 3 14,29
No, nunca fez 5 17,86 4 19,05
Sim, com comprimido 10 35,71 8 38,10 0,99
Sim, com insulina 2 7,14 2 9,52
Sim, somente com dieta 7 25,00 4 19,05
Total 28 100,00 21 100,00
Fonte: Labio
Prof Dr Maria Ivanilde Araujo- UFAM 37
Grficos
Os grficos so representaes pictricas dos
dados.

Tem por finalidade dar uma ideia, a mais imediata


possvel, dos resultados obtidos, permitindo
chegarse a concluses sobre a evoluo do
fenmeno ou sobre como se relacionam os valores
da srie.

Prof Dr Maria Ivanilde Araujo- UFAM 38


Grficos
A escolha do grfico mais apropriado ficar a
critrio do analista.

Contudo, os elementos simplicidade, clareza e


veracidade devem ser considerados quando da
elaborao de um grfico.

Prof Dr Maria Ivanilde Araujo- UFAM 39


Grficos
Grficos para variveis qualitativas

Dentre os grficos para representar variveis


qualitativas temos o grfico de barras e em
setores (grfico de pizza).

Prof Dr Maria Ivanilde Araujo- UFAM 40


Grficos

Prof Dr Maria Ivanilde Araujo- UFAM 41


Grficos

Fonte: questionrio aplicado aos alunos da UFAM, com ingresso no ano de 2003.
*134 alunos no responderam esta questo

Prof Dr Maria Ivanilde Araujo- UFAM 42


Grfico
Grfico de composio em setores: Destina-se
a representar a composio, usualmente em
porcentagem, de partes de um todo.

Consiste num crculo de raio arbitrrio,


representando o todo, dividido e setores, que
corresponde as partes de maneira proporcional.

Prof Dr Maria Ivanilde Araujo- UFAM 43


Grficos

Prof Dr Maria Ivanilde Araujo- UFAM 44


Grficos
Grfico para variveis quantitativas:

Os tipos de grficos geralmente so utilizados


nesse caso: Grfico de disperso, Histograma,
polgono de frequncia e grfico de linhas.

Prof Dr Maria Ivanilde Araujo- UFAM 45


Grficos
Grfico de disperso:
Os valores so representados por pontos ao
longo da reta.

Exemplo: Taxa de glicemia dos idosos que


procuram atendimento no Centro de Ateno
Integrada da Melhor Idade CAIMI.

Prof Dr Maria Ivanilde Araujo- UFAM 46


Grficos

Prof Dr Maria Ivanilde Araujo- UFAM 47


Grficos
Histograma:
um grfico de barras contguas, com bases
proporcionais aos intervalos das classes e a rea
de cada retngulo proporcional respectiva
frequncia.
Exemplo: Idade dos idosos que procuram
atendimento no Centro de Ateno Integrada da
Melhor Idade CAIMI.

Prof Dr Maria Ivanilde Araujo- UFAM 48


Grficos
Histograda da Idade

81
Frequncia

60

49

27
0 20

12 7 3

60 65 70 75 80 85 90

Idade

Prof Dr Maria Ivanilde Araujo- UFAM 49


Grficos
Polgono de frequncia: um grfico em linha,
onde as frequncias so marcadas sobre
perpendiculares ao eixo horizontal, levantadas
pelos pontos mdios dos intervalos de classe. Para
conseguir um polgono, ligamos os extremos da
linha obtida aos pontos mdios da classe anterior
primeira e da posterior ltima, da distribuio.

Prof Dr Maria Ivanilde Araujo- UFAM 50


Grficos
Grfico de linhas: indicado para dados
coletados ao longo do tempo, ou de medidas
repetidas.

Atravs desse grfico possvel constatar algum


tipo de tendncia e identificar alguns eventos
inusitados, como por exemplo, o surto de uma
determinada doena.

Prof Dr Maria Ivanilde Araujo- UFAM 51


Grficos

Fonte: Relatrio de Gesto UFAM/2012

Prof Dr Maria Ivanilde Araujo- UFAM 52


Distribuies de Frequncias
Exerccio: VARIVEL QUANTITATIVA

Distribuio de frequncia para dados agrupados ou tabulados em classes.

Idade dos socilogos em anos


36 39 40 40 40
42 43 44 44 45
45 45 47 49 49
50 50 51 52 53
55 57 58 59 59

Prof Dr Maria Ivanilde Araujo- UFAM 53


Distribuies de Frequncias
Dados agrupados em classes

Idade de 25 socilogos
Idade Frequncia
35 I-- 40 2
40 I-- 45 7
45 I-- 50 6
50 I-- 55 5
55 I-- 60 5
Fonte: Dados Fictcios

Prof Dr Maria Ivanilde Araujo- UFAM 54


Medidas de tendncia central
Valor do ponto em torno do qual os dados se
distribuem

Prof Dr Maria Ivanilde Araujo- UFAM 55


Medidas de tendncia central

Prof Dr Maria Ivanilde Araujo- UFAM 56


Medidas de tendncia central

Prof Dr Maria Ivanilde Araujo- UFAM 57


Medidas de tendncia central

Prof Dr Maria Ivanilde Araujo- UFAM 58


Medidas de tendncia central

Prof Dr Maria Ivanilde Araujo- UFAM 59


Medidas de tendncia central
Mdia aritmtica: Clculo da mdia de dados em Tabela de
Distribuio de frequncia
Classe Ponto Mdio Frequncia
1,5 2,0 1,75 3
2,0 2,5 2,25 16
2,5 3,0 2,75 31
3,0 3,5 3,25 34
3,5 4,0 3,75 11
4,0 4,5 4,25 4
4,5 5,0 4,75 1
n=100
Mdia (X): ponto mdio de cada classe x respectiva frequncia dividido pelo n

X = 1,75x3 + 2,25x16 + ... + 4,25x4 + 4,75x1 = 300 = 3


100 100
Prof Dr Maria Ivanilde Araujo- UFAM 60
Medidas de Variabilidade

Prof Dr Maria Ivanilde Araujo- UFAM 61


Medidas de Variabilidade

Prof Dr Maria Ivanilde Araujo- UFAM 62


Medidas de Variabilidade
Medida de disperso: indicadores do grau de variabilidade
dos indivduos em torno das medidas de tendncia central
Varincia: Medir os desvios em relao a mdia
No h mdia dos desvios pois sua soma igual a zero

Ex.: 0,4,6,8,7
X (mdia) : 0+4+6+8+7 = 25 = 5
5 5
X X (desvio em relao a mdia)
0 5 = -5
4 5 = -1 A soma dos desvios igual a zero
6 5 = 1
8 5 = 3 (-5 + -1)+1+3+2= - 6 + 6 = 0
7 5 = 2
Prof Dr Maria Ivanilde Araujo- UFAM 63
Medidas de Variabilidade
Varincia: Soma dos quadrados dos desvios
Dados Desvios Quadrado dos desvios
X (X X) (X X) 2

0 -5 25
4 -1 1
6 1 1
8 3 9
7 2 4
x=5 (x x) = 0 (x x) 2 = 40

A soma do quadrado dos desvios no usada como medida de


disperso, porque o seu valor cresce com o n de dados

Prof Dr Maria Ivanilde Araujo- UFAM 64


Medidas de Variabilidade
Varincia

Ento, para medir a disperso dos dados em relao


mdia, usa-se a varincia (S2) que leva em considerao
on

S2 = soma dos quadrados dos desvios


n1

Para os dados: 0, 4, 6, 8 e 7 a S2 = 40 = 40 = 10
5 1 4

Prof Dr Maria Ivanilde Araujo- UFAM 65


Medidas de Variabilidade
Desvio Padro
Raiz quadrada da varincia, sendo representava por S; tem a mesma
unidade de medida dos dados

Ex.: 0,4,6,8,7. S2 (varincia) = 10


s (desvio padro): 10 = 3,16

Coeficiente de varincia (CV)


Razo entre o desvio padro e a mdia x 100
CV = 6 x 100
X
Ex.: Grupo I: 3,1,5 anos (x = 3 anos; s2 = 4; s=2) : CV = 66,7%
Grupo II: 55,57,53 anos (x = 55 anos; s2 = 4; s = 2) : CV = 3,64%

Vejam disperso dos dados em ambos os grupos a mesma, mas os


CV so diferentes (no grupo I a disperso relativa ALTA)

Prof Dr Maria Ivanilde Araujo- UFAM 66

Das könnte Ihnen auch gefallen