Beruflich Dokumente
Kultur Dokumente
CAPÍTULO 1
REVISÃO(somatório e arredondamento)
VARIÁVEIS
POPULAÇÃO E AMOSTRAS
DISTRIBUIÇÃO DE FREQÜÊNCIAS
GRÁFICOS
RODRIGO NAPOLI
TELMA PICHETH
2010
REVISÃO DE MATEMÁTICA
ARREDONDAMENTO ESTATÍSTICO
3º) Quando o nº a ser arredondado for seguido de um número igual a 5, e nada mais,
o nº deverá ser par.
Se já é par, se mantém. Se for ímpar é acrescido de uma unidade
Ex: 4,65 = 4,6
4,75 = 4,8
4º) Quando o nº a ser arredondado for seguido de um número igual a 5, e este for seguido de
um ou mais números, o nº é acrescido de uma unidade.
Ex: 12,657 = 12,7
0,88501 = 0,89
1
SOMATÓRIOS
n
∑ xi = x1 + x2 + ... + xn
i =1
onde:
obs.: Em estatística sempre que se usa somatório utilizam-se todo os valores da variável
(série), portanto o uso do índice é dispensável.
∑ x = x1 + x2 + ... + xn
2
ESTATÍSTICA
ESTATÍSTICA é o conjunto de métodos e processos quantitativos que serve para
estudar e medir fenômenos coletivos (Dugé de Bernonville).
A ESTATÍSTICA é coleta, apresentação, análise e interpretação de dados numéricos
(Jairo Simon da Fonseca).
Pode-se estudar a estatística com dois objetivos:
Reunir, sumariar, sistematizar dados numéricos de modo a torná-los rapidamente
compreensíveis; é a chamada ESTATÍSTICA DESCRITIVA, constituem-se de métodos
destinados a resumir o melhor possível uma massa de informações numéricas.
Com os dados sistematizados fazer análises e tirar conclusões, que é a INFERÊNCIA
ESTATÍSTICA, ou seja, apresenta os instrumentos que permitem extrapolar os resultados.
Por “extrapolação” entende-se: considerar que a informação obtida junto de um número
restrito de pessoas é a expressão de todas, e que permite, de fato, generalizar as conclusões
tiradas.
UTILIDADE DA ESTATÍSTICA
Sempre que estivermos trabalhando com medidas ou contagens precisaremos da
estatística descritiva.
A biologia, como toda ciência experimental, faz uso freqüente das técnicas estatísticas.
A genética, Ecologia, Nutrição humana, animal e vegetal, etc., apóiam-se essencialmente na
Estatística.
Para se testar novos métodos terapêuticos, ou de diagnóstico ou estabelecer a
superioridade de certa dieta, ou saber a probabilidade de certo fenômeno ocorrer será
sempre a Estatística que ajudará a resolver estas questões com a utilização de um
planejamento experimental adequado e aplicação da inferência estatística.
3
VARIÁVEIS
Variável é a característica de interesse que é medida em cada elemento da amostra ou
população. Como o nome diz, seus valores variam de elemento para elemento. As variáveis
podem ter valores numéricos ou não numéricos.
Variáveis podem ser classificadas da seguinte forma:
1.VARIÁVEIS QUANTITATIVAS: são as características que podem ser medidas em uma
escala quantitativa, ou seja, apresentam valores numéricos que fazem sentido.
Podem ser contínuas ou discretas.
- Variáveis discretas: características mensuráveis que podem assumir apenas um número
finito ou infinito contável de valores e, assim, somente fazem sentido valores inteiros. Geralmente são
o resultado de contagens. Exemplos: número de filhos, número de bactérias por litro de leite, número
de cigarros fumados por dia.
- Variáveis contínuas, características mensuráveis que assumem valores em uma
escala contínua (na reta real), para as quais valores fracionais fazem sentido. Usualmente
devem ser medidas através de algum instrumento. Exemplos: peso (balança), altura (régua),
tempo (relógio), pressão arterial, idade.
2.VARIÁVEIS QUALITATIVAS (ou categóricas): são as características que não possuem valores
quantitativos, mas, ao contrário, são definidas por várias categorias, ou seja, representam uma
classificação dos indivíduos.
Podem ser nominais ou ordinais.
- Variáveis nominais: não existe ordenação dentre as categorias. Exemplos: sexo,
cor dos olhos, fumante/não fumante, separar o lixo ou não, doente/sadio.
- Variáveis ordinais: existe uma ordenação entre as categorias. Exemplos:
escolaridade (1o, 2o, 3o graus), mês de observação (janeiro, fevereiro,..., dezembro), estágio
da doença (inicial, intermediário, terminal).
As distinções são menos rígidas do que a descrição acima insinua. Uma variável
originalmente quantitativa pode ser coletada de forma qualitativa.
Por exemplo, a variável idade, medida em anos completos, é quantitativa (contínua); mas, se
for informada apenas a faixa etária (0 a 5 anos, 6 a 10 anos, etc...) ou categorizada em criança
jovem, adulto e idoso, é qualitativa (ordinal). Outro exemplo é o peso dos lutadores de boxe,
uma variável quantitativa (contínua) se trabalhamos com o valor obtido na balança, mas
qualitativa (ordinal) se o classificarmos nas categorias do boxe (peso-pena, peso-leve, peso-
pesado, etc.).
Outro ponto importante é que nem sempre uma variável representada por números é
quantitativa. O número do telefone de uma pessoa, o número da casa, o número de sua
identidade. Às vezes o sexo do indivíduo é registrado na planilha de dados como 1 se
masculino e 2 se feminino, por exemplo. Isto não significa que a variável sexo passou a ser
quantitativa!
4
AMOSTRAGEM
Com uma amostra aleatória evitamos ser tendenciosos e inserir um viés na pesquisa.
TIPOS DE POPULAÇÃO:
TIPOS DE ESTUDO:
- população hipotética: quando a população for composta de todos os pacientes que sofrem
(ou que virão a sofrer) determinada doença e recebam ou venham receber determinado
tratamento. Os doentes que forem estudados serão considerados uma amostra.
-melhor resultado, pois com um número menor de observações o estudo poderá ser mais
detalhado, mais aprofundado.
OBS – contudo o processo amostral traz a probabilidade de ERRO AMOSTRAL, cujo controle
será realizado através de métodos estatísticos adequados.
- Casual simples
- Casual sistemática
- Estratificada proporcional
5
AMOSTRA CASUAL SIMPLES
Casual é o mesmo que aleatório, portanto temos que garantir a todos os elementos da
população a mesma chance de ser escolhido, para tal deve haver um sorteio desde que seja
honesto.
PROCEDIMENTO:
Sorteia-se ao acaso, os nºs a serem usado da tabela, utilizando-se um método definido à
priori, observa-se os nºs que se seguem anotando todos aqueles que servem aos nºs da
listagem da população. Os 4 primeiros números nessas condições são os números de ordem
da listagem que farão parte da amostra. Por exemplo, desejamos uma amostra com 4
elementos (n=4) da população de árvores da tabela 2 (N=240). Podemos definir a priori que o
método a ser utilizado será considerar da tabela 1 (números aleatórios) a partir da quarta
coluna, sendo lidos de cima para baixo desconsiderando os primeiros dígitos que não
servem. Desta forma teremos como sorteados os seguintes números:
57 – 155 – 178 - 69
A partir destes números temos as medidas dos diâmetros destas árvores (tabela 2) sendo
desta forma:
no árvore DAP (mm)
57 135
155 121
178 117
69 131
N = 240 n=6
h=N/n
= 240 / 6
= 40
6
Usando a tabela de nos casuais, determino o 1º elemento da amostra. Suponha-se ter
sido o nº 87. Somando-se a ele 40 (que representa o intervalo) temos 127 que será o 2º nº de
ordem da amostra.
AMOSTRA ESTRATIFICADA
Suponha-se que as árvores que fazem parte da tabela 2 estão assim classificados:
Classe A(árvores que estão no platô) _____> 120 elementos (001 a 120)
Se quiséssemos uma amostra que representasse 10% da população ela teria que
possuir 24 elementos pois:
Para obter-se uma amostra estratificada tem-se que retirar 10% de cada estrato da
população.
7
Desta forma fica determinado quantos elementos de cada extrato devem ser retirados
da população. Então, usando a amostra casual simples ou sistemática, sorteiam-se os
elementos que farão parte da amostra.
Se não podemos ter uma lista da população, uma amostra casual pode tornar-se
extremamente difícil ou mesmo impossível de se obter. Basta pensar em como obter uma
amostra casual de casas de uma cidade ou de pacientes de uma determinada doença.
Não existe uma solução única, mas sempre se tenta introduzir alguma forma de
casualidade no procedimento. No caso de casas pode-se sortear pontos num mapa e tomar as
casas mais próximas daquele ponto. Isto só será um bom procedimento se as casas estiverem
uniformemente distribuídas no mapa.
Muitas vezes parece impossível alcançar a casualidade desejada, mas sempre há um
recurso. Um pesquisador que, para um estudo, não tenha possibilidade de sortear seus
entrevistados, poderá, para evitar qualquer viés no sorteio, considerar como sua amostra os
10 primeiras pessoas que passarem por determinado local onde o estudo está sendo
desenvolvido.
8
TABELA 1 - NÚMEROS CASUAIS
9
TABELA 2 – DAP (diâmetro na altura do peito) DE ARVORES DE UMA FLORESTA EM REGENERAÇÃO
DAP DAP DAP DAP DAP DAP
Nº (mm) Nº (mm) Nº (mm) Nº (mm) Nº (mm) Nº (mm)
A1 170 41 135 81 133 B121 114 161 122 201 92
2 186 42 135 82 133 122 114 162 125 202 94
3 169 43 135 83 147 123 114 163 125 203 94
4 161 44 135 84 133 124 114 164 125 204 94
5 161 45 149 85 133 125 114 165 123 205 90
6 167 46 134 86 133 126 126 166 123 206 109
7 151 47 141 87 132 127 126 167 117 207 94
8 161 48 133 88 132 128 127 168 119 208 104
9 167 49 149 89 131 129 117 169 119 209 103
10 147 50 147 90 132 130 131 170 119 210 108
11 156 51 169 91 132 131 131 171 114 211 108
12 147 52 131 92 131 132 130 172 114 212 108
13 141 53 147 93 131 133 126 173 125 213 98
14 169 54 156 94 139 134 127 174 124 214 108
15 154 55 136 95 139 135 122 175 119 215 109
16 137 56 135 96 139 136 122 176 118 216 109
17 151 57 135 97 132 137 122 177 119 217 108
18 154 58 135 98 165 138 130 178 117 218 112
19 154 59 135 99 141 139 130 179 115 219 112
20 146 60 150 100 140 140 129 180 125 220 112
21 145 61 150 101 140 141 127 181 125 221 103
22 141 62 150 102 140 142 114 182 125 222 103
23 136 63 138 103 132 143 114 183 125 223 100
24 150 64 137 104 132 144 114 184 125 224 98
25 150 65 137 105 132 145 114 185 124 225 94
26 136 66 137 106 132 146 114 186 123 226 109
27 186 67 137 107 132 147 114 187 123 227 109
28 147 68 137 108 132 148 114 188 120 228 106
29 150 69 131 109 132 149 117 189 120 229 104
30 150 70 131 110 131 150 117 190 120 230 104
31 186 71 131 111 132 151 117 191 126 231 104
32 146 72 131 112 132 152 122 192 140 232 98
33 154 73 156 113 138 153 121 C 193 94 233 98
34 147 74 135 114 140 154 121 194 94 234 110
35 169 75 134 115 140 155 121 195 113 235 112
36 150 76 134 116 139 156 120 196 113 236 112
37 136 77 141 117 131 157 114 197 106 237 110
38 136 78 141 118 131 158 119 198 106 238 113
39 135 79 133 119 147 159 127 199 106 239 112
40 135 80 133 120 131 160 126 200 106 240 112
10
DISTRIBUIÇÃO DE FREQÜÊNCIAS
Quando estamos trabalhando com um grande nº de dados, a estatística descritiva nos
oferece um recurso técnico para que possamos sistematizá-los, a fim de que teremos algumas
informações sobre estes dados. Uma destas técnicas é a Distribuição de Freqüências que
permite agrupar dados observando a freqüência que ocorre dentro de intervalos de medidas
(quando se tratar de variável contínua) ou a freqüência dentro de cada categoria (quando a
variável for discreta).
A partir deste ponto é necessário determinar o número de classes e o intervalo destas classes.
Existe uma fórmula que calcula o número de classes apropriado para o tamanho da
população apresentada (Fórmula de Sturges: K = 1+3,32 log N) entretanto esta fórmula
apenas dá uma sugestão desta quantidade, para que não sejam nem muitas classes e nem
poucas. A definição final é subjetiva sendo do pesquisador a palavra final desta quantidade.
11
Exemplo – Idades de 50 alunos (já no ROL):
15 - 24 - 25 - 27 - 28 - 28 - 30 - 30 - 31 - 32
32 - 33 - 33 - 34 - 34 - 34 - 34 - 35 - 35 - 35
36 - 36 - 37 - 37 - 37 - 38 - 38 - 38 - 38 - 39
39 - 39 - 40 - 40 - 40 - 40 - 41 - 41 - 43 - 43
44 - 45 - 48 - 48 - 48 - 49 - 50 - 51 - 51 - 60
Foi definido que esta distribuição usará como intervalo de classe 8 anos. Desta forma inicia-
se a 1ª classe com o valor mais baixo da distribuição – Vmin (neste caso o no 15). A partir daí
soma-se a este número o valor do intervalo, sendo assim:
Cada classe possui limites superiores e inferiores, sendo que, para variáveis contínuas
agrupadas em classes, o limite superior de uma classe é igual ao limite inferior da classe
seguinte. Sendo assim no exemplo acima percebemos que o limite superior (Ls) da primeira
classe vale 23 anos, assim como o limite inferior (Li) da segunda classe também vale 23 anos.
O ponto médio (Pm) de uma classe é calculado através da fórmula: Pm = [(Li + Ls) /2] ,
sendo assim para a primeira classe o ponto médio será:
Pm1 = (Li1 + Ls1) / 2
Pm1 = (15 + 23) / 2
Pm1 = 38 / 2
Pm1 = 19 anos
12
FREQÜÊNCIA PERCENTUAL (f%)
É o percentual que cada freqüência absoluta representa em função do total de observações.
São úteis na comparação de 2 ou mais conjuntos de dados e nos permite uma maior
compreensão dos dados. (f% = f / n * 100)
15 ⎪—— 23 => f=1 / 50 * 100 => f% = 2%
23 ⎪—— 31 => f=7 /50 * 100 => f% = 14%
31 |—— 39 => f = 21 /50 * 100 => f% = 42%
39 |—— 47 => f = 13 /50 * 100 => f% = 26%
47 |—— 55 => f = 7 /50 * 100 => f% = 14%
55 ⎪—— 63 => f=1 /50 * 100 => f% = 2%
NOMENCLATURA
Linf – limite inferior de classe – (são os números que iniciam cada classe)
Lsup – limite superior de classe – (são os números que encerram cada classe)
PM – ponto médio da classe – (Linf + Lsup) / 2
13
APRESENTAÇÃO DE DADOS EM GRÁFICOS
Muitas vezes os dados (ou resultados) podem ser melhor representados através de um
gráfico. Apesar de apresentar uma precisão menor da informação, esta é passada de uma
forma rápida, mostrando visualmente as características gerais de todo o conjunto de
informações.
Como norma geral todo gráfico deve apresentar necessariamente título e escala. A
escala deve sempre crescer da esquerda para a direita e de baixo para cima. E sempre que
necessário uma legenda explicativa deve ser apresentada (de preferência ao lado direito do
gráfico).
Os tipos de gráficos mais usados:
Para variáveis qualitativas ou quantitativas discretas (não agrupadas):
- Gráfico de barras
- Gráfico de setores (pizza)
Para variáveis quantitativas agrupadas:
- Histograma
- Polígono de freqüências
- Gráfico de setores (pizza)
GRÁFICO DE BARRAS: Usado para representar a freqüência de dados qualitativos ou
quantitativos discretos (não agrupados). Cada categoria possui uma barra e o tamanho desta
e dada pela sua freqüência. Os gráficos de barra geralmente são apresentados na
vertical(também chamados de colunas), isto é, no eixo das abscissas (horizontal) apresentam-
se as categorias e no eixo das ordenadas (vertical) as freqüências, entretanto, se houver
muitas categorias este gráfico pode ser invertido, sendo assim apresentado na horizontal.
Nos gráficos de barras é possível ainda apresentar de forma comparativa as freqüências de
diferentes subcategorias
Exemplos:
14
GRÁFICO DE SETORES (PIZZA): Este tipo de gráfico é usado para representar freqüências
percentuais ou relativas de variáveis qualitativas ou quantitativas. Eventualmente podemos
apresentar associados a este gráfico os valores absolutos, mas o gráfico trás a informação
relativa entre as diferentes categorias da variável. Sua construção vai ser dada levando-se em
conta que a circunferência total representa 100% (o todo), e cada setor terá seu tamanho
proporcional à freqüência percentual da categoria.
Exemplos:
Idades (anos) f
45 |-- 53 3
53 |-- 61 11
61 |-- 69 12
69 |-- 77 9
77 |-- 85 4
85 |-- 93 1
Σ 40
15
POLÍGONO DE FREQUÊNCIAS: Esta é uma outra forma de representar as distribuições de
freqüências.
Sua construção é dada de forma similar ao histograma, mas agora usaremos o ponto
médio de cada classe para representar toda a classe. Em vez de usarmos barras usamos uma
linha para ligar os pontos médios da distribuição, sendo que é necessário marcar outras duas
classes (nas duas extremidades) com valores de freqüência igual a zero.
Pesos (kg) f f%
45 ⏐—— 50 26 13%
50 ⏐—— 55 50 25 %
55 ⏐—— 60 100 50 %
60 ⏐—— 65 24 12 %
∑ 200 100 %
16
NOME: _________________________________________________________________
EXERCÍCIO 1- arredondamento
Arredondar para obter números com duas casas decimais
a) 10,348 =
e) 2,625 =
b) 4,112 =
f) 1,066 =
c) 5,875 =
g) 7,4255 =
d) 0,052 =
EXERCÍCIO 2 - somatório
Considerando-se:
X:{2; 2; 4; 8} Y: {5; 7; 8; 2}
calcule:
a) ∑ x =
b) ∑ y =
c) ∑ (x)2 =
∑ 4y
d) ∑ (2x + 3y) =
EXERCÍCIO 3 - variáveis
Cite 1 exemplo de variável discreta: _________________________________________________
Cite 1 exemplo de variável contínua: _________________________________________________
Cite 1 exemplo de variável nominal __________________________________________________
Cite 1 exemplo de variável ordinal ___________________________________________________
EXERCÍCIO 4 - amostragem
1 - Montar uma amostra casual simples com 6 elementos da tabela 2. Para tal considerar
como método definido a priori: a partir da 1ª coluna da tabela de nos casuais (tabela 1).
17
2 - Montar uma amostra casual sistemática de tamanho 8 (n=8) da tabela 2. Para tal
considerar como método definido a priori: a partir da 3ª coluna da tabela de nos casuais
(tabela 1).
4 - Construir uma amostra estratificada simples da população da tabela 2. Esta amostra deve
ser constituída por 5% da população, e o método usado será a partir da 5ª coluna (se acabar
esta coluna olhar a coluna da direita, e assim por diante).
2
EXERCÍCIO 5 - distribuição de frequências
1. Os resultados da análise da idade de tartarugas marinhas em uma amostra de 40
indivíduos estão descritos abaixo:
45 49 50 53 53 53 54 57 58 58
59 60 60 60 62 63 63 64 64 65
65 66 67 67 68 68 69 70 71 72
72 73 74 75 76 80 81 81 83 93
Determinar:
a) As distribuições de freqüências com intervalo de 8 anos.
3
2. Com os dados de anos decorridos da fragmentação em remanescentes de florestas fazer
uma distribuição de freqüências:
46 47 50 51 52 53 56 56 56 57
58 60 61 61 63 63 64 65 68 68
68 68 69 70 71 71 72 72 72 73
74 75 75 75 75 76 76 77 77 78
79 80 80 80 81 82 85 86 90 95
Sugestão: intervalo =10
Determinar:
a) Freqüência Absoluta;
b) Distribuição de freqüência acumulada;
c) Distribuição de freqüência percentual;
d) Distribuição de freqüência percentual acumulada;
4
3. As notas de 32 estudantes de uma turma estão descritas no quadro abaixo:
5
4. Construa um quadro de distribuição de freqüências, com intervalo de 0,70 mg. Kg-1 da
seguinte amostra:
Teores totais de Cobalto em amostras de solo de diferentes áreas de duas toposseqüências da microbacia
de Caetés, Paty do Alferes, RJ. Média de três repetições (retirado de RAMALHO et al., Contaminhação
da microbacia de caetés com metais pesados pelo uso de agroquímicos. Pesq. Agropec. Brás. 35(7):
1289-1303, jul 2000.)
Medidas em mg.Kg-1
2,78 2,79 2,83 2,9 3,34 3,67
4,16 4,17 4,18 4,18 4,23 4,48
4,62 4,71 4,75 4,75 4,81 4,86
5,37 5,4 6,42 6,86 6,89 6,93
∑
-
6
6.Complete o quadro e responda:
peso de aves (g) f fa f%
200 |--- 250 2 __ __
250 |--- 300 __ 7 10
300 |--- 350 8 15 16
350 |--- 400 20 __ __
400 |--- 450 __ 45 20
450 |--- 500 5 50 10
___ ___