Beruflich Dokumente
Kultur Dokumente
2012-2
2012-2
TCNICO EM CONTABILIDADE
MDULO 2
ESTATSTICA
21
ESTATSTICA
CONCEITOS BSICOS
ESTATSTICA: Cincia (ou mtodo) que trata da coleta, organizao, descrio e anlise de dados. Pode ser
dividida em duas reas:
-
POPULAO (OU UNIVERSO): Conjunto de elementos que possuem alguma caracterstica em comum e que
interessa estudar. Quando estudamos todos os elementos de uma populao, estamos fazendo um CENSO ou
um RECENSEAMENTO.
AMOSTRA: um subconjunto de uma populao, uma parte do todo. Quando estudamos apenas uma
amostra de uma populao, estamos fazendo uma AMOSTRAGEM. As razes de se recorrer a amostras
so: menor custo e tempo para levantar dados; melhor investigao dos elementos observados.
Amostragem: um conjunto de tcnicas usadas para selecionar a amostra. um estudo ou anlise das
relaes existentes entre as amostras e a populao.
Pode ser intencional: quando o pesquisador mesmo seleciona a amostra, que pode ser voluntria (quando o
componente da populao se oferece voluntariamente para a pesquisa), ou sistemtica (quando a populao j
se encontra ordenada e em extratos onde no h necessidade da construo de um sistema de referencia).
Pode ser Aleatria: Tipo um sorteia lotrico. Exemplo: enumera-se a populao de 1 a n e sorteia-se k nmeros
dessa populao que ser o equivalente aos elementos da amostra.
Exemplos de Experimentos Aleatrios
21
3
a)
b)
c)
d)
e)
21
4
QUANTITATIVA: expressa uma quantidade, quando seus valores so expressos pr nmeros. Esses nmeros
podem ser obtidos por um processo de contagem ou medio.
Exemplos:
Populao: Todos os agricultores do Estado do Rio Grande do Sul.
Variveis: nmero de filhos tidos, extenso da rea plantada, altura, idade.
Populao: Populao dos bairros perifricos do municpio de Porto.
Variveis: nmero de quartos, rea da casa em m2, nmero de moradores da casa.
Varivel quantitativa pode ser Discreta ou Continua:
- DISCRETA: so aquelas que podem assumir apenas valores inteiros em pontos da reta real. possvel
enumerar todos os possveis valores da varivel.
Exemplos:
Populao: Universitrios do Estado do Rio Grande do Sul.
Variveis: nmero de filhos, nmero de quartos da casa, nmero de moradores, nmero de irmos.
- CONTNUA: so aquelas que podem assumir qualquer valor num certo intervalo (contnuo) da reta real.
No possvel enumerar todos os possveis valores. Essas variveis geralmente, provm de medies.
Populao: Todos os agricultores do Estado do Rio Grande do Sul.
Variveis: idade, renda familiar; extenso da rea plantada (em m2), peso e altura das crianas agricultoras.
Exerccios
Resolva o que puder dos exerccios em casa para que em aula possa aproveitar melhor o tempo para as
dvidas.
Classifique as variveis em qualitativas e quantitativas (Continuas ou discretas):
A - Universo: alunos da ETEP
Varivel: cor dos cabelos
21
5
ESTATSTICA DESCRITIVA
ORGANIZAO DE DADOS:
SRIE ESTATSTICA: Conjunto de dados organizados de acordo com algum critrio (tempo, local ou categoria).
Pode ser apresentada por meio de tabelas e/ou grficos.
Ex 1:
Ex 2:
Acima, vimos dois exemplos de sries (uma temporal e outra geogrfica) apresentadas sob a forma de
tabelas. Temos que tomar o cuidado de no confundir tabelas com quadros ou grades, a diferena est na forma
de apresentar os dados.
Outra forma de apresentar dados estatsticos atravs de grficos, que so muito utilizados pelos veculos de
comunicao. Os principais tipos de grficos so:
Inflao mensal medida pelo IPCA: ndice Nacional de Preos ao
Consumidor Amplo - Brasil - 2009
21
10%
2% 4%
50%
34%
solteiro
casado
divorciado
vivo
outros
DISTRIBUIO DE FREQUNCIAS: uma tabela em que os valores (ou categorias) de uma varivel so
associados s suas frequncias (nmero de repeties).
21
Peso (kg)
45
50
50
55
55
60
60
65
65
70
70
75
75
80
80
85
85
90
Total
21
8
-
frequncia absoluta simples (f): no exemplo, f3=24, significando que 24 alunos pesam de 55 kg a menos de
60 kg.
limite inferior de classe (li): indica o ponto de incio de cada classe.
limite superior de classe (ls): indica o fim de cada classe.
amplitude de classe (h): indica a extenso de cada classe.
h ls li . No exemplo, h3 ls3 li 3 60 55 5
Ponto mdio de classe (X): indica o ponto central do intervalo, usado como representante de todos os
valores contidos na classe.
li ls3 55 60
li ls
. No exemplo, X 3 3
X
57 ,5
2
2
2
OBSERVAO: Se fssemos fazer um grfico para esta tabela, o mais indicado seria um grfico de colunas,
colocando no eixo horizontal os limites de classe (inferiores e superiores). Neste caso em particular, o grfico de
colunas recebe o nome de HISTOGRAMA. Uma alternativa seria substituir cada intervalo pelo seu ponto mdio.
Desta forma, passaramos a ter um grfico de linha que chamado de POLGONO DE FREQUNCIAS.
f
x100
f
Peso (kg)
45
50
50
55
55
60
60 65
65
70
70
75
75
80
80 85
85
90
Total
Fr (%)
2,8
12,2
25,5
46,6
66,0
82,1
89,9
96,6
100,0
-
21
9
Vejamos algumas interpretaes:
f4= 38 alunos pesam de 60 a menos de 65 kg.
F5= 119 alunos pesam de 45 a menos de 70 kg.
fr2= 9,4% dos alunos pesam de 50 a menos de 55 kg.
Fr6= 82,1% dos alunos pesam de 45 a menos de 75 kg.
F7-F3=162-46= 116 alunos pesam de 60 a menos de 80 kg.
EXERCCIO: Os dados a seguir representam o tempo gasto (em minutos) pelos funcionrios de uma empresa
para realizar uma tarefa. Construa, para estes dados, uma distribuio de frequncias com cinco classes de
amplitudes iguais entre si.
22
26
29
20
33
27
39
28
30
25
28
32
31
22
26
28
32
29
31
28
30
37
21
23
34
25
38
27
29
30
21
31
37
25
28
24
26
28
28
31
27
28
36
32
21
30
25
26
27
29
DESCRIO DE DADOS: feita atravs de medidas sintticas que do informaes sobre determinadas
caractersticas do conjunto.
Medidas de Tendncia Central: Mdia Aritmtica, Moda e Mediana
Tomem-se como dados as seguintes classificaes de um aluno no final do 1 perodo do 12 ano:
12, 13, 13, 13, 14, 15, 15, 16, 16, 17, 17
Mdia - A mdia aritmtica calcula-se somando as classificaes, dividindo este total pelo seu nmero:
(12 + 13 + 13 + 13 + 14 + 15 + 15 + 16 + 16 + 17 + 17 ) / 11 = 14,6
Moda - o valor com maior frequncia, 13.
Mediana a observao que separa 50% dos valores mais baixos dos 50% mais altos. Tendo as
classificaes ordenadas, verifica-se facilmente que o 15 separa 50% das classificaes mais baixas (12, 13, 13,
13 e 14) de 50% das classificaes mais altas (15, 16, 16, 17 e 17).
Nota: Como o nmero de observaes era mpar (11) havia um valor central. Nos casos em que o
nmero de observaes par temos dois valores centrais. Ento, para obter a mediana, calcula-se a mdia
destes dois valores centrais.
EXEMPLO 1: Os dados a seguir representam o nmero de aparelhos de TV por domiclio, para uma amostra de
domiclios de um determinado bairro. Determine a mdia de aparelhos de TV por domicilio
2
21
10
EXEMPLO 2: Considere os dados a seguir, que representam o nmero de dependentes para uma amostra de
funcionrios de uma empresa. Determine o valor mdio de dependentes destes funcionrios.
Nmero de dependentes
0
1
2
3
4
5
Total
Nmero de funcionrios
17
25
32
21
12
8
115
EXEMPLO 3: A seguir, encontramos a idade para uma amostra de alunos de uma universidade. Determine a
idade mdia para esta amostra de alunos.
Idade (anos)
18
20
20
22
22
24
24
26
26
28
28
30
Total
Nmero de alunos
27
28
19
11
7
4
96
Exerccios
1. Os dados abaixo representam o nmero de vezes que uma amostra de alunos de uma universidade
pratica atividades fsicas, por semana.
(a) Construa a distribuio de frequncias adequada para estes dados.
(b) Com base na distribuio construda, obtenha e interprete f3 e fr5.
21
11
(c) Qual o percentual de alunos que pratica atividades fsicas no mnimo trs vezes por semana?
3 2 5 1 0 5 2 3 3 4
1 3 0 6 4 4 6 1 0 0
3 5 3 2 3 4 1 6 1 0
3 2 3 3 4 4 5 2 3 0
1 2 2 3 3 3 4 5 4 6
2. Uma amostra de clientes de uma locadora de DVDs foi observada quanto ao tipo de filme preferido,
quanto ao nmero de filmes que retira a cada locao e quanto idade (em anos). Foram obtidos os
dados a seguir. Para cada uma das variveis, construa a distribuio de frequncias que julgar mais
adequada. Faa um grfico das informaes da letra a.
a) Tipo de filme
Drama
Suspense
Ao
Drama
Comdia
Terror
Drama
Ao
Ao
Suspense
Comdia
Comdia
Suspense
Terror
Suspense
Ao
Drama
Ao
Terror
Comdia
Ao
Ao
Suspense
Drama
Comdia
Ao
Suspense
Comdia
Drama
Suspense
Terror
Ao
Comdia
Terror
Ao
Comdia
Drama
Comdia
Suspense
Ao
b) Nmero de filmes
c) Idade
25 32 33 18 24 20 35 40 17 22
34 15 28 37 37 29 19 20 21 27
34 43 34 37 23 29 19 22 25 30
32 33 37 41 42 18 24 27 29 32
94
100
109
110
88
87
93
94
82
81
90
79
84
90
100
105
107
88
94
102
75
78
104
98
97
86
85
90
101
79
82
90
80
105
78
83
88
91
81
86
88
94
87
89
92
84
87
81
88
21
12
4. Uma amostra de alunos de uma universidade foi investigada com relao s seguintes variveis: V1:
idade (em anos); V2: nmero de faltas na disciplina A, no semestre; V3: nmero de disciplinas
matriculadas; V4: tempo gasto diariamente com deslocamento (em minutos) e V5: nota final na disciplina
A. Foram obtidos os dados a seguir:
a) V1
23
20
25
19
22
28
26
21
18
24
b) V2
c) V3
d) V4
35
44
50
62
20
15
27
32
24
48
e) V5
7,5
6,0
9,0
8,5
7,0
4,5
8,0
7,0
5,5
6,5
(fr)
Fr
6. Uma amostra de alunos de uma escola foi investigada quanto ao nmero de irmos, resultando os dados
a seguir.
Nmero de irmos
0
1
2
3
4
5
(fr)
Fr
21
13
Total
(a) Identifique e interprete f5 e fr2.
(b) Qual o percentual de alunos que tm pelo menos trs irmos?
(c) Qual o nmero mdio de irmos para esta amostra de alunos?
QUESTO: Imagine que os dados a seguir representem o peso (em kg) dos integrantes de duas equipes
esportivas (dados populacionais). Qual a mdia de peso dos atletas de cada equipe?
Equipe A:
Equipe B:
60
68
65
69
70
70
75
71
80
72
MEDIDAS DE VARIABILIDADE
Indicam o grau de disperso dos valores em relao aos valores centrais.
1. VARINCIA ABSOLUTA: baseada na diferena entre cada valor e a mdia do conjunto. , por definio, a
mdia quadrtica das diferenas dos valores em relao sua mdia.
Vamos encontrar a varincia para os dados da equipe A:
350
60
65
70
75
80
70
5
Temos que fazer a diferena de cada valor em relao mdia e elevar ao quadrado cada uma delas.
60 70 2 10 2 100
65 70 2 5 2 25
70 70 2 0 2 0
75 70 2 52 25
80 70 2 10 2 100
Somando estes quadrados, temos 250. Para fazer a mdia dos quadrados, dividimos esta soma por 5, que
o nmero de observaes. Isto nos d uma varincia absoluta de 250/5=50 kg2.
Fazendo o mesmo clculo para os dados da equipe B, chegamos a uma varincia absoluta de 10/5=2 kg2.
Como esta uma medida de disperso, percebe-se que ela consegue expressar como os pesos so mais
distantes na equipe A.
Amostra: S 2
X X
n1
Usamos n-1 no denominador da varincia amostral (ao invs de n) para obtermos uma melhor aproximao da
varincia populacional.
Quando trabalhamos com a varincia absoluta, temos uma medida quadrtica, o que a torna muito abstrata.
Afinal, o que significa dizer que a varincia de 50 kg 2? Para eliminarmos esta dificuldade, devemos extrair a
raiz quadrada do resultado. Obtemos, ento, a medida de disperso mais conhecida: o DESVIO-PADRO.
21
14
2. DESVIO-PADRO: a raiz quadrada da varincia absoluta. Ele expresso na mesma unidade da varivel
original, sendo mais til nas aplicaes prticas. Ele d uma ideia do afastamento mdio das observaes
em relao mdia.
- Populao: 2
- Amostra: S S 2
Na questo das equipes esportivas, o desvio-padro da equipe A 50 7,07 kg; o da equipe B
2 1,41 kg. Isto significa que, na equipe A, o peso mdio dos atletas de 70 kg e o peso de cada atleta se
afasta, em mdia, 7,07 kg em relao aos 70 kg. Na equipe B, o peso mdio tambm de 70 kg, sendo que
cada atleta se afasta, em mdia, 1,41 kg desta mdia.
Exerccios:
1. Os dados a seguir representam o tempo gasto (em minutos) por uma amostra de funcionrios para
realizar uma tarefa. Determine a mdia e o desvio-padro.
12
15
14
18
13
17
13
15
18
2. Para cada um dos conjuntos abaixo (dados amostrais), determine as medidas de tendncia central e o
desvio-padro:
(a)
24
15
18
23
17
28
24
19
(b)
10
12
13
(c)
31
38
39
40
42
35
39
43
23
37
44
3. Determine a mdia e o desvio-padro para o conjunto abaixo, que representa as idades (em anos) de
uma amostra de frequentadores de um bar.
25
20
23
22
24
Populao:
Amostra: g
S
X
21
15
B: Mdia de 500 unidades e Desvio-padro de 5 unidades
Em qual dos conjuntos houve maior homogeneidade?
DETERMINSTICO: conduz sempre ao mesmo resultado, qualquer que seja o nmero de repeties do
experimento.
ALEATRIO: no possvel prever o resultado de uma repetio em particular, mesmo que o experimento
tenha sido repetido vrias vezes.
21
16
Evento C={face par}={2,4,6}
INTERSECO: O evento
PROBABILIDADE: um nmero entre zero e um, que expressa a chance de ocorrncia de um evento. escrita
em forma de porcentagem.
CLCULO DE PROBABILIDADE:
EXEMPLO: Imagine o lanamento de um dado equilibrado (um cubo perfeito, em que todas as faces sejam
igualmente provveis). Neste caso, n=6, pois o espao amostral possui 6 resultados.
Evento A={3}
Evento B={2,5}
Evento C={face par}
21
17
ENFOQUE SUBJETIVO: A probabilidade de um evento ocorrer obtida atravs de uma avaliao subjetiva,
feita por um especialista no assunto, usando toda a informao disponvel.
PROPRIEDADES DAS PROBABILIDADES:
EXERCCIO 2: Imagine que os funcionrios de uma empresa estejam distribudos segundo o municpio de
origem e o meio de transporte utilizado para ir ao trabalho, de acordo com a grade a seguir:
Munic
pio
Soma
40
10
50
Meio de transporte
Carro
21
18
nibus
50
60
110
Trem
30
10
40
Soma
120
80
200
seja do municpio A
v de carro para o trabalho
no v de carro para o trabalho
seja do municpio A e v de carro para o trabalho
seja do municpio A ou v de carro para o trabalho
v de carro ou de trem para o trabalho
v de carro para o trabalho, sabendo-se que do municpio A.
Neste caso, como sabemos que o funcionrio do municpio A, no estamos mais trabalhando com 200
40
funcionrios, mas apenas 120. Destes, 40 vo de carro. Logo, a probabilidade
0,333 . Estamos
120
calculando o que se chama de PROBABILIDADE CONDICIONAL, que representa a probabilidade de
ocorrer um evento (ir de carro) em uma condio especfica (ser do municpio A). A maneira de simbolizar o
que calculamos P C / A .
60
0,75
80
EXEMPLO: Voltando ao exerccio 1, sabamos que, em determinada escola, 80% dos alunos foram aprovados
em Portugus, 70% foram aprovados em Matemtica e 60% foram aprovados em Portugus e Matemtica.
Seleciona-se ao acaso um aluno:
(a) Sabendo-se que foi aprovado em Portugus, qual a probabilidade de que tenha sido aprovado em
Matemtica?
(b) Sabendo-se que foi aprovado em Matemtica, qual a probabilidade de que tenha sido aprovado em
Portugus?
21
19
P={aprovao em Portugus} P P 0,8
M={aprovao em Matemtica} P M 0,7
P P M 0,6
(a) P(M/P)
(b) P(P/M)
TEOREMA DO PRODUTO: Sejam A e B dois eventos quaisquer. Ento P A B P A . P B / A .
EXEMPLO: Em uma caixa existem 5 fichas amarelas, 3 fichas brancas e 2 fichas verdes. Selecionam-se, ao
acaso e sem reposio, duas fichas da caixa. Determine a probabilidade de que:
(a)
(b)
(c)
(d)
(e)
(f)
os dois resolvam.
pelo menos um deles resolva.
somente o aluno A resolva.
nenhum deles resolva.
EXERCCIOS:
1. Uma urna contm 5 bolas brancas, 4 vermelhas e 3 azuis. Extraem-se, ao acaso e sem reposio, 3 bolas.
Determine a probabilidade de que:
21
20
(a) nenhuma seja vermelha;
(b) exatamente uma seja vermelha;
(c) todas sejam da mesma cor.
2. Num perodo de um ms, 100 pacientes sofrendo de determinada doena foram internados em um hospital.
Informaes sobre o mtodo de tratamento aplicado em cada paciente e o resultado final obtido esto no
quadro abaixo.
Tratamento
Resultado
Soma
Cura total
24
16
40
Cura parcial
24
16
40
Morte
12
20
Soma
60
40
100
21
21
Uma vez que cada par de mdia e desvio-padro gera uma distribuio normal especfica, as tabelas de
probabilidade so baseadas em uma distribuio em particular: a Distribuio Normal Padronizada, que possui
mdia igual a zero e desvio-padro igual a um. Qualquer valor de uma varivel X normalmente distribuda pode
x
ser padronizado atravs da expresso z
.
EXEMPLO 7: Admita que o peso dos alunos de uma escola seja normalmente distribudo com mdia de 50 kg e
desvio-padro de 4 kg.
(a)
(b)
(c)
(d)
(e)
(f)
(g)
(h)
(i)
(j)
EXERCCIOS:
1. O contedo lquido das garrafas de 300 ml de um refrigerante normalmente distribudo com mdia de
300 ml e desvio-padro de 2 ml.
(a) Determine o percentual de garrafas cujo contedo seja inferior a 306 ml.
(b) Entre 200 garrafas, quantas devero ter menos de300 ml?
2. O peso de 600 estudantes normalmente distribudo com mdia de 65,3 kg e desvio-padro de 5,5 kg.
Determine o nmero de estudantes que pesam:
(a) entre 60 e 70 kg;
(b) mais de 63,2 kg;
(c) menos de 68 kg.
21
22
(a)
(b)
(c)
(d)
3. As notas em um teste padronizado de escolaridade tm distribuio normal com mdia igual a 100 e
desvio-padro igual a 10. Determine a probabilidade de um indivduo submetido ao teste ter nota:
maior que 120;
maior que 80;
entre 85 e 115;
maior que 100.
4. O volume de correspondncia recebido por uma firma quinzenalmente tem distribuio normal com
mdia de 4000 cartas e desvio-padro de 200 cartas. Qual a porcentagem de quinzenas em que a firma
recebe:
(a) entre 3600 e 4250 cartas?
(b) mais de 3400 cartas?
(c) mais de 4636 cartas?
21