Beruflich Dokumente
Kultur Dokumente
Montes Claros
Julho/2010
Exemplos: o nmero de operrios de uma grande construo uma varivel quantitativa discreta porque
representa uma contagem; j o peso desses operrios uma varivel quantitativa contnua porque
representa mensuraes que podem tomar qualquer valor em um intervalo contnuo.
2.3 Nveis de mensurao de variveis
uma forma adicional de se classificarem os dados. H quatro nveis de mensurao de variveis:
nominal, ordinal, intervalar e razo.
2.3.1 Nvel nominal
Caracterizado por dados que consistem apenas de nomes, rtulos ou categorias. Os dados no podem ser
dispostos segundo um esquema ordenado (como de baixo para cima).
Exemplos:
Respostas do tipo sim, no ou indeciso.
O sexo dos estudantes em uma turma de matemtica.
2.3.2 Nvel ordinal
Envolve dados que podem ser dispostos em alguma ordem, mas as diferenas entre os valores desses
dados no podem ser determinadas, ou no tem sentido.
Exemplos:
Um editor classifica alguns originais como excelentes, alguns como bons e alguns como maus.
(No podemos determinar uma diferena quantitativa entre bom e mau, por exemplo).
Nas olimpadas de matemtica, Joo foi classificado em 3; Carlos em 7 e Joana em 10 lugar.
(Podemos determinar a diferena entre os 3 e 7 lugares, mas a diferena de 4 no tem qualquer
significado).
2.3.3 Nvel intervalar
anlogo ao nvel ordinal, com a propriedade adicional de que podemos determinar diferenas
significativas entre os dados. Todavia, no existe um ponto de partida zero inerente, ou natural (onde no
haja qualquer quantidade presente). As temperaturas 98,2F e 98,6F so exemplos de dados nesse nvel
intervalar de mensurao. Os valores se apresentam ordenados, e podemos determinar diferenas entre
eles (em geral chamadas distancias entre os dois valores). Entretanto, no h ponto de partida natural. O
valor 0F pode parecer um ponto de partida, mas inteiramente arbitrrio, e no representa ausncia de
calor. um erro dizer que 50F duas vezes mais quente que 25F.
Exemplos:
Os anos 1000, 2000, 1776 e 1944. (O tempo no comeou no ano zero e, assim, o 0 arbitrrio, e no
um ponto de partida zero natural).
As temperaturas anuais mdias (em graus Celsius) das capitais brasileiras.
2.3.4 Nvel razo
o nvel de intervalo modificado de modo a incluir o ponto de partida zero inerente (onde o zero
significa nenhuma quantidade presente). Para valores nesse nvel, tantos as diferenas como as razes tm
significado.
Exemplos:
Pesos dos artigos de material plstico descartado pelas residncias (0 kg indica que nenhum plstico
foi descartado, e 10 kg representa duas vezes 5 kg).
Durao (em minutos) de filmes.
4
Distncias (em km) percorridas por carros em um teste de consumo de consumo de combustvel.
3 AMOSTRAGEM
So as tcnicas utilizadas para se extrair a amostra da populao. A amostragem pode ser probabilstica ou
no probabilstica. Na amostragem probabilstica so realizados sorteios para alocao dos elementos da
amostra, j na amostragem no probabilstica no se procede ao sorteio. O tamanho da populao ,
geralmente, designado por N e o tamanho da amostra por n.
3.1 Amostragem probabilstica
Este tipo de amostragem garante o acaso na escolha. Assim, cada elemento da populao tem a mesma
chance ser selecionado. Isto garante a representatividade da amostra e a validade das inferncias que
sero feitas a partir dela. Sero discutidos aqui, sucintamente, quatro tipos de amostragem probabilstica.
3.1.1 Amostragem casual ou aleatria simples
Equivale a um sorteio dos indivduos que faro parte da amostra
Procedimento:
Enumera-se a populao de 1 a N
Sorteiam-se os indivduos.
Antigamente, os sorteios eram feitos por meio de tabelas de nmeros aleatrios. Hoje em dia, utilizase uma calculadora cientfica ou, o que mais comum, um software estatstico.
Exemplo
Uma populao composta de 200 indivduos. Retire uma amostra de tamanho 10, utilizando sua
calculadora cientfica.
Amostra:
____
n
N
n 1564
0,20
N 7820
N
n
N 80
8
n 10
____
A fim de descrever uma amostra (ou uma populao), conveniente o clculo de algumas medidas que a
caracterizam. Estas medidas quando bem interpretadas fornecem informaes valiosas sobre o conjunto
de dados.
A rigor, tais medidas so calculadas com o objetivo de produzir uma sntese numrica que represente o
conjunto de dados. Por exemplo, quando dizemos que a nota mdia de uma turma, em uma prova, foi 70
pontos; esta mdia, se consistente, equivale ao valor que sintetiza satisfatoriamente a nota da turma como
um todo.
Essas medidas se classificam em dois grandes grupos: as medidas de tendncia central (mdia, mediana e
moda) e as medidas de disperso ou variabilidade (varincia, desvio padro, coeficiente de variao).
Alm destas, h o escore padronizado que uma medida que tenta captar a posio relativa de um
indivduo dentro de um grupo.
Cada uma dessas medidas ser discutida aqui com mais detalhes.
4.2 Medidas de tendncia central
4.2.1 Mdia aritmtica simples ( x )
Para calcular a mdia aritmtica simples ( x ) l-se: xis barra de um conjunto de dados, basta somar
todos os valores e dividir pela quantidade deles, assim:
x
x
n
90
94
80
70
92
70
72
90 94 80 70 92 70 72 568
81 kg
7
7
x n 1
2
n 1
. Ou seja, a medida do indivduo que ocupa a posio
. Para o
70
Termo central:
70
72
x n1 x 7 1 x4
2
80
90
92
94
Como a mediana ocupa a posio central, podemos no presente exemplo dizer que 50% dos alunos
tiveram pesos menores ou iguais a 80 kg e os outros 50% pesos maiores ou iguais a 80 kg.
2 caso: n par
Neste caso, preciso identificar os dois termos centrais e calcular a mdia entre eles. O valor obtido
considerado a mediana. Matematicamente, as ordens (posies) dos dois termos centrais so dadas por: o
x
primeiro n e o segundo por x n .
2
70
72
80
90
92
94
n=6
Portando: Md =
80 90
Md = 85 kg
2
70
70
72
80
90
92
94
90
94
80
70
92
70
72
muito baixos) e a mdia tende a ficar superestimada (ou subestimada) e, portanto, no sintetizando ou
representando bem a amostra. Neste caso, recomendvel utilizar a mediana. J a moda uma medida
que capta um valor tpico dos dados.
No exemplo em questo, h uma ligeira assimetria nos dados, pois, a moda menor que a mediana que,
por sua vez, menor que a mdia. Entretanto, como mdia e mediana so relativamente prximas (81 e
80, respectivamente), a princpio, pode-se optar por sintetizar a amostra de pesos dos alunos com a mdia
aritmtica simples.
O tpico seguinte (medidas de disperso) avalia melhor a representatividade da mdia.
n 1
A rigor, o denominador desta expresso deveria ser n. Entretanto, por razes relacionadas inferncia
estatstica, pode-se mostrar que conveniente dividir a soma dos quadrados das diferenas por n 1.
Retomando o exemplo da amostra dos pesos de 7 alunos, e lembrando que x 81, a varincia :
Pesos:
90
s2
n 1
94
80
70
92
70
72
90 81 2 94 81 2 80 81 2 70 81 2 92 81 2 70 81 2 72 81 2
7 1
9 2 13 2 1 2 11 2 11 2 11 2 9 2
6
116 kg2
6
6
esto razoavelmente prximas da mdia e, portanto, esta representa bem o conjunto de dados. A frmula
do desvio padro :
s
n 1
Para o exemplo anterior, como a expresso sob o radical j foi calculada, o desvio padro :
s
116 kg 2 10,8
kg
Concluso: a amostra revelou uma mdia foi de 81 kg com um desvio padro de 10,8 kg.
4.3.3 Coeficiente de variao (CV)
Coeficiente de variao (CV): ... conveniente exprimir a variabilidade em termos relativos, isto porque,
por exemplo, um desvio padro de 10 pode ser insignificante se a observao tpica 10.000, mas
altamente significativo para uma observao tpica 100. Toma-se ento uma medida relativa da
variabilidade, comparando o desvio padro com a mdia. Esta medida o coeficiente de variao. J
vimos que o desvio padro tem a mesma unidade de medida que os dados, de modo que o coeficiente de
variao adimensional. A grande utilidade do coeficiente de variao permitir a comparao das
variabilidades de diferentes conjuntos de dados. (SOARES, 1991).
O coeficiente de variao dado por: CV
s
x
A
B
78
92
8
15
CV
?
?
8
0,10
78
CV B
15
0,16 .
92
CV 0,10
0,10 CV 0,20
0,20 CV 0,30
CV 0,30
: Baixa disperso
: Disperso moderada
: Disperso alta
: Disperso muito alta
xi x
.
s
Retomando o exemplo das notas da prova de Clculo I das turmas A e B do 1 perodo de Engenharia
Civil, suponha que o Joo aluno da turma A e tirou 85 pontos na prova; j a Maria aluna da turma B e
tirou 90 pontos no teste. A questo : em termos relativos, qual dos dois alunos, Joo ou Maria, obteve
melhor desempenho?
Estatsticas das notas de um teste de lngua portuguesa
Estatsticas
Turmas
s
x
A
B
78
92
8
15
ZJ
85 78
0,875
8
ZM
90 92
0,133
15
Concluso: embora Maria tenha uma nota superior do Joo, em termos relativos a pontuao obtida por
Joo melhor do que a de Maria, pois (0,875 > 0,133).
5 ESTATSTICA DESCRITIVA, ANLISE EXPLORATRIA DE DADOS (CONTINUAO)
5.1 Distribuio de freqncia (variveis quantitativas)
As distribuies de freqncias so tabelas que descrevem os dados estatsticos a fim de facilitar sua
compreenso. Hoje em dia, com a expanso dos softwares, essas tabelas so obtidas com muita facilidade
e, portanto, no so construdas manualmente.
5.1.1 Distribuio de freqncia sem intervalos de classe
Notao:
11
i: so as classes
xi: valores assumidos pela varivel
fi: freqncia simples ou absoluta
fri: freqncia relativa simples
Fi: freqncia acumulada
n: equivale ao fi
Exemplo: amostra das idades (em anos) de uma amostra de alunos.
TABELA 1
Distribuio de freqncia das idades em anos de uma amostra de alunos
i
xi
fi
fri
Fi
1
19
8
0,121
8
2
20
12
0,182
20
3
22
17
0,258
37
4
25
13
0,197
50
5
27
12
0,182
62
6
30
4
0,060
66
66
1,000
AA
, onde AA a amplitude amostral e corresponde
i
154
155
155
155
155
156
156
156
157
158
158
160
160
160
160
160
161
161
161
161
162
162
163
163
164
164
164
165
166
167
168
168
169
170
172
173
AA 23
3,83333 4
i
6
1
2
3
4
5
6
150 |
154 |
158 |
162 |
166 |
170 |
154
158
162
166
170
174
152
156
160
164
168
172
4
9
11
8
5
3
40
0,100
0,225
0,275
0,200
0,125
0,075
1,000
4
13
24
32
37
40
100
P10
b)
P25
c)
P67
d)
P97
Resoluo
k n
k n
b)
100
k n
c)
100
10 40
100
25 40
100
a)
100
67 40
100
P67
163,1
2
2
13
k n
97 40
100
d)
100
P97
171,55
2
2
Q1
Q2
Q3
Max
Para o exemplo Q1 = 156,1 (que corresponde ao P25) e Q3 = 164,4 (que equivale ao P75 confira!).
7 Mdia pondera x p
A media pondera utilizada quando se atribuem pesos distintos para os valores da varivel. dada por:
xp
x p
p
i
Onde xi so os valores da varivel e pi so os pesos. A mdia aritmtica simples uma mdia ponderada
onde os pesos so iguais.
EXERCCIOS LISTA 01
1) Para cada uma das descries abaixo, indique o seu significado escolhendo um dos seguintes
conceitos: populao, um parmetro, censo, variveis quantitativas, variveis qualitativas, variveis
discretas, experimento, uma estatstica, estudo observacional.
a)
b)
c)
d)
e)
f)
g)
h)
Coleo completa de todos os elementos, com pelo menos uma caracterstica comum, a serem
estudados.
Consistem em nmeros que representam contagens ou medidas.
Medida numrica que descreve uma caracterstica numrica de uma populao.
Resultam de um conjunto finito de valores possveis, ou de um conjunto enumervel desses valores.
Coleo de dados relativos a todos os elementos de uma populao.
Medida que descreve uma caracterstica numrica de uma amostra.
Dados que podem ser separados em diferentes categorias que se distinguem por alguma caracterstica
no numrica.
Situao em que verificamos e medimos caractersticas especficas, mas no modificamos os
elementos a serem estudados.
14
i)
2) D um exemplo para cada um dos seguintes nveis de mensurao de variveis: nominal, ordinal e
razo.
3) Nos itens a, b, c, d abaixo, indique se a descrio dada corresponde a um estudo observacional ou a
um experimento.
a)
b)
c)
d)
Uma pesquisa tenta captar a opinio da populao sobre sua preferncia em morar em casa ou
apartamento. _______________________________________
Em uma turma de educao fsica, estuda-se o efeito dos exerccios fsicos sobre a presso sangunea,
determinando-se que metade dos estudantes ande mil metros cada dia, enquanto a outra metade corra
mil metros diariamente. ______________________________________________________________
Em determinada cidade, faz-se um levantamento do nmero de pessoas contaminadas com o vrus
HIV, de acordo com o sexo. ___________________________________________________________
A fim de aumentar a produtividade de tomate de sua plantao, um produtor faz um rgido controle
sobre a irrigao (quantidade de gua diria) e a luminosidade (incidncia de raios solares) nos
tomateiros de sua produo. ___________________________________________________________
4) Deve-se extrair uma amostra de tamanho n=600 de uma populao de tamanho N=5.000, que consiste
de quatro estratos com as seguintes quantidades de elementos: N 1=3.000, N2=1.000, N3=800 e
N4=200. Se a alocao deve ser proporcional, qual o tamanho da amostra em cada estrato?
5) Retire uma amostra de tamanho n=10 de uma populao ordenada composta de 200 elementos,
utilizando o processo de amostragem sistemtica. Explique todo o procedimento adotado.
6) Explique o que amostragem por conglomerados e exemplifique.
7) Construir uma tabela de distribuio de freqncia com intervalos de classe para os dados abaixo que
representam uma amostra de pesos (kg) do curso de Engenharia (veja exemplo da tabela 2 acima).
Utilizar as frmulas vistas no contedo para definir o nmero de classes (i) e a amplitude do intervalo
(h).
42,1
52,1
57,1
63,7
75,0
43,7
52,7
58,3
63,9
75,2
45,1
53,0
59,7
65,8
75,8
46,2
53,8
60,1
66,9
76,0
47,1
54,0
60,1
67,0
78,2
47,8
54,7
60,1
67,9
79,3
49,3
55,8
61,0
68,0
80,2
50,2
55,9
62,1
70,2
82,7
50,4
56,7
62,9
72,1
84,1
51,3
56,9
63,0
74,5
90,1
b)
Medidas do dimetro (em mm) interno de anis forjados de pisto de um motor de automvel. Os
dados so: 1; 3; 15; 0; 5; 2; 5 e 4.
Tempo de esgotamento de um fluido isolante entre eletrodos a 34 kV. Os tempos em minutos so:
0,19; 0,78; 0,96; 1,31; 2,78; 3,16; 4,15; 4,67; 4,85; 6,50; 7,35; 8,01; 8,27; 12,06; 31,75; 32,52; 33,91;
36,71 e 72,89.
15
c)
d)
e)
f)
Medida da espessura de xido em pastilhas que so estudas para verificar a qualidade em um processo
de fabricao de semicondutores. Os dados, em angstroms, so: 1264; 1280; 1301; 1300; 1292; 1307 e
1275.
Experimento para testar a resistncia resultante em tubos circulares com calotas soldadas nas
extremidades. Os resultados em kN so: 96; 96; 102; 102; 102; 104; 104; 108; 126; 126; 128; 128;
140; 156; 160; 160; 164 e 170.
Dados sobre acomodao visual (uma funo do movimento do olho), quando reconhecendo um
padro de mancha em um vdeo CRT de alta resoluo. Os dados so: 36,45; 67,90; 38,77; 42,18;
26,72; 50,77; 39,30 e 49,71.
Dados referentes a medidas de intensidade solar direta (watts/m 2), em dias diferentes, no sul da
Espanha: 562; 869; 708; 775; 704; 809; 856; 655; 806; 878; 909; 918; 558; 768; 870; 918; 940; 946;
661; 820; 898; 935; 952; 957; 693; 835; 905; 939; 955; 960; 498; 653; 730 e 753.
9) Abaixo se encontra uma amostra dos pesos (kg) de uma turma de matemtica, ao final do 2 semestre
de 2006 e ao final do 1 semestre de 2007.
Nmero do aluno
Peso ao final do 2 semestre/2006
Peso ao final do 1 semestre/2007
Escore padronizado do 2 semestre
Escore padronizado do 1 semestre
01
66
64
02
70
66
03
68
68
04
71
63
05
69
66
06
67
67
07
70
62
08
69
64
09
71
63
10
70
68
Nota do Tibrcio
72
91
85
70
84
92
Peso
3,6
1,1
2,1
2,5
1,8
1,6
13) Os dados abaixo mostram a resistncia compresso de 80 corpos de prova da liga alumnio-ltio,
medidas em psi (medida de presso ou libra por polegada quadrada).
16
76
87
97
101
105
110
115
118
120
121
123
131
133
133
134
135
135
141
142
143
145
146
148
149
149
150
150
151
153
154
154
156
157
157
158
159
160
161
163
164
Calcule:
a)
b)
c)
d)
e)
f)
g)
17