Beruflich Dokumente
Kultur Dokumente
Marcelo Tavares
2012
2 edio
1 impresso 2011
T231e
Tavares, Marcelo
Estatstica aplicada administrao / Marcelo Tavares. 2. ed. reimp. Florianpolis:
Departamento de Cincias da Administrao / UFSC; [Braslia] : CAPES : UAB, 2012.
220p. : il.
Inclui bibliografia
Bacharelado em Administrao Pblica
ISBN: 978-85-7988-099-5
1. Administrao Mtodos estatsticos. 2. Estatstica. 3. Probabilidades. 4. Educao a
distncia. I. Coordenao de Aperfeioamento de Pessoal de Nvel Superior (Brasil). II.
Universidade Aberta do Brasil. III. Ttulo.
CDU: 519.2:65
PRESIDNCIA DA REPBLICA
MINISTRIO DA EDUCAO
COORDENAO DE APERFEIOAMENTO DE PESSOAL DE NVEL SUPERIOR CAPES
DIRETORIA DE EDUCAO A DISTNCIA
EQUIPE TCNICA
Coordenador do Projeto Alexandre Marino Costa
Coordenao de Produo de Recursos Didticos Denise Aparecida Bunn
Capa Alexandre Noronha
Projeto Grfico e Finalizao Annye Cristiny Tessaro
Editorao Rita Castelan
Ilustrao Livia Remor Pereira
Reviso Textual Claudia Leal Estevo Brites Ramos
Mara Aparecida Andrade R. Siqueira
Crditos da imagem da capa: extrada do banco de imagens Stock.xchng sob direitos livres para uso de imagem.
SUMRIO
Apresentao.................................................................................................... 9
Unidade 1 Fases do Mtodo Estatstico, Populao e Amostra
Fases do Mtodo Estatstico....................................................................... 15
Definio do Problema...................................................................... 16
Planejamento........................................................................................ 17
Coleta de Dados................................................................................ 17
Organizao de Dados......................................................................... 18
Apresentao de Dados......................................................................... 19
Anlise e Interpretao de Dados................................................................ 20
Populao e Amostras................................................................................. 23
Amostragens Probabilsticas............................................................... 29
Amostragem no Probabilstica.......................................................... 38
Unidade 4 Probabilidade
Introduo.......................................................................................... 99
Experimento Aleatrio....................................................................... 101
Espao Amostral............................................................................... 103
Evento......................................................................................... 104
Definies de Probabilidades........................................................................ 105
Probabilidade Condicional........................................................................ 111
Regra do Produto e Eventos Independentes.................................................. 114
Algumas Regras Bsicas de Probabilidade...................................................... 120
Apresentao
APRESENTAO
Seja bem-vindo ao estudo da Estatstica!
Esperamos que esta disciplina seja uma experincia
interessante e enriquecedora. Pensando nisso, elaboramos o material
com cuidado para que voc aprenda os principais conceitos
associados Estatstica, que vem se tornando cada vez mais
importante no competitivo ambiente de negcios e de gesto. Juntos,
iremos viajar pelo mundo dos nmeros associados estatstica e
suas relaes no dia a dia do gestor pblico.
O principal objetivo que voc tenha a oportunidade de
ampliar seu conhecimento sobre o universo da estatstica. Dessa
forma, no sero feitas neste material dedues e demonstraes
matemticas de expresses. Ser tentado um entendimento mais
abstrato das expresses a serem utilizadas.
Voc j deve estar acostumado a utilizar a estatstica, ou
ferramentas estatsticas, no seu dia a dia, sem saber que a esta
utilizando. Se voc acha que a estatstica se resume apenas a
nmeros e a grficos, est redondamente enganado. Dessa forma,
estaremos, a partir de agora, entrando em um mundo no qual os
nmeros iro sempre lhe falar ou lhe contar alguma coisa. O seu
trabalho usando a estatstica passar a ser o de ajudar a planejar a
obteno de dados, a interpretar e a analisar os dados obtidos e a
apresentar os resultados de maneira a facilitar a sua tomada de
decises como gestor na rea pblica.
Para gerar tabelas, grficos e utilizar tcnicas estatsticas,
temos uma infinidade de softwares que fazem isso automaticamente.
Entretanto, para podermos descobrir quais as respostas que os dados
podem nos dar para determinados questionamentos, necessrio
Mdulo 4
que voc saiba a teoria estatstica e treine suas aplicaes por meio
de estudos de casos, ou situaes.
Sempre surgem, ento, perguntas do tipo: quais variveis
devem ser medidas? Como retirar amostras da populao que se
deseja estudar? Que tipo de anlise realizar? Como interpretar os
resultados? Espero que no final da leitura deste material voc tenha
condies de responder de forma clara a essas perguntas e a outras
que podem ser feitas.
necessrio termos em mente que a estatstica uma
ferramenta para o gestor ou para o executivo, nas respostas aos
porqus de seus problemas. Contudo, para que ela seja bem
utilizada, necessrio conhecer os seus fundamentos e os seus
princpios e, acima de tudo, que o gestor desenvolva um esprito
crtico e de anlise; pois fcil mentir usando a estatstica, difcil
falar a verdade sem usar a estatstica.
Atualmente, as empresas tm procurado admitir como
gestores os profissionais que tenham um nvel de conhecimento de
estatstica alto, pois esse conhecimento tem resultado em diferena
significativa nos processos decisrios.
Para estudar na modalidade a distncia o contedo da
disciplina Estatstica Aplicada Administrao preciso que voc
tenha disciplina intelectual que, para desenvolver, somente
praticando e, ainda, uma postura crtica, sistemtica. Ou seja, ao
invs de voc atuar como passivo e concordar com tudo o que diz
o texto, voc deve duvidar, contestar, criticar, comentar e
descobrir o que o autor quer dizer. O ato de estudar exige que
voc faa exerccios e entenda o que est fazendo, no sendo
apenas um mero executor de frmulas. Isso implica o entendimento
dos conceitos apresentados neste material.
Uma vez que a leitura uma atividade, voc deve ser ativo.
Tenha certeza de que um estudante consegue aprender mais do que
o outro medida que se aplica mais e capaz de uma atividade
maior de leitura. E aprende melhor se exigir mais de si mesmo e do
texto que tem diante de si.
10
Apresentao
Mdulo 4
11
UNIDADE 1
FASES DO MTODO ESTATSTICO,
POPULAO E AMOSTRA
Entender as relaes entre as fases do mtodo estatstico e apliclas no desenvolvimento de seus projetos;
Entender os diversos tipos de amostragem e saber como apliclos quando for desenvolver qualquer tipo de projeto em que se
utilize planos amostrais.
14
definio do problema;
planejamento do processo de resoluo;
coleta dos dados;
organizao de dados;
apresentao de dados; e
anlise e interpretao dos resultados.
Mdulo 4
15
DEFINIO
DO
PROBLEMA
Unidade, ao longo da
disciplina.
16
PLANEJAMENTO
Aps voc definir o problema, preciso determinar um
processo para resolv-lo e, em especial, a forma de como obter
informaes sobre a varivel ou as variveis em estudo. nessa
fase que devemos decidir pela observao da populao ou de uma
amostra. Portanto, voc precisa:
Planejamento da pesquisa
Mdulo 4
17
questionrio;
observao;
experimentao; e
pesquisa bibliogrfica.
A coleta de dados que voc vai fazer pode ser realizada de
forma direta com base nos elementos de registros ou pelo prprio
pesquisador atravs de questionrios.
Definio do problema
Planejamento da pesquisa
ORGANIZAO DE DADOS
*Atributo estatstico
toda medida estatstica, por exemplo, mdia.
Fonte: Elaborado pelo
autor.
*Tratamento estatstico
implica analisar os dados utilizando tcnicas
estatsticas. Fonte: Elaborado pelo autor.
18
Definio do problema
Planejamento da pesquisa
APRESENTAO
DE
DADOS
Mdulo 4
19
Definio do problema
Planejamento da pesquisa
ir aprender na Unidade 5.
20
Planejamento da pesquisa
Concluses
Mdulo 4
21
22
POPULAO E AMOSTRAS
Antes, precisamos entender o que uma populao e o que
uma amostra. Se considerarmos somente os habitantes de uma
cidade que contribuem com o pagamento do IPTU, podemos
considerar essas pessoas como sendo a populao, pois apresentam
caractersticas em comum; sendo, nesse caso, o fato de que elas esto
na mesma cidade e contribuem, todas, com o imposto do IPTU.
Suponha, todavia, que voc queira trabalhar com apenas
uma par te dessa populao, a qual apresente as mesmas
caractersticas da populao da qual voc ter uma amostra, ou
seja, uma poro ou frao da populao que preserva todas as
caractersticas importantes dos elementos que a integram.
Nessa populao, geralmente, voc poder medir uma
varivel, por exemplo, a renda dessas pessoas. Assim, voc poder
querer calcular a renda mdia dessa populao de pessoas que
contribuem com o IPTU (mdia populacional () que corresponde,
geralmente, a um valor desconhecido chamado de parmetro). Como
voc no vai medir toda a populao, podemos obter uma amostra
que represente essa populao e, estudando a amostra, voc ter
condies de calcular a mdia amostral (x) que corresponde ao
estimador, e o resultado obtido (valor numrico) corresponder
estimativa. Para entender melhor essa relao, observe a Figura 2,
a seguir.
Mdulo 4
23
Populao
m=?
s=?
Amostragem
Amostra
0 = R$587,00
24
Mdulo 4
25
26
Mdulo 4
27
*Plano de amostragem
plano de como ser feita
a retirada da amostra da
populao. Fonte: Elaborado pelo autor.
*Unidades amostrais
correspondem s unidades selecionadas. Fonte:
Elaborado pelo autor.
28
AMOSTRAGENS PROBABILSTICAS
Como j mencionamos, essa amostragem caracterizada
pela chance conhecida de mensurarmos uma amostra. Os principais
mtodos de amostragem so: aleatria (casual) simples, sistemtica,
estratificada e conglomerado. Veja a seguir a descrio de cada
uma delas.
Mdulo 4
29
Amostragem Sistemtica
Em algumas situaes como amostrar pessoas que ficam em
uma fila, conveniente retirar da populao os elementos que iro
compor a amostra de forma cclica (em perodos), por exemplo,
quando os elementos da populao se apresentam ordenados. Porm,
de fundamental importncia que a varivel de interesse no
apresente ciclos de variao coincidente com os ciclos de retirada,
pois esse fato tornar a amostragem no representativa. Essa tcnica
de amostragem o que denominamos de amostragem sistemtica.
Para entender melhor, vamos imaginar que voc queira retirar
uma amostra dos currculos apresentados pelos candidatos em um
processo seletivo, e a varivel de interesse corresponde idade deles.
Pode ocorrer que pessoas de uma determinada faixa etria deixem
para entregar o currculo no ltimo dia. Ento, se pegssemos de forma
aleatria, poderamos estar subestimando ou superestimando a idade
mdia. Nessa situao, foram recebidos 500 currculos ordenados por
ordem de entrega. Considerando que amostrar 50 currculos o
suficiente para estimar a idade mdia dos candidatos, utilizamos a
tcnica de amostragem sistemtica, pois pode ocorrer que um grupo
de pessoas da mesma faixa etria tenha feito a inscrio em grupo e,
30
Mdulo 4
31
Amostragem Estratificada
Quando a varivel de interesse apresenta uma
heterogeneidade na populao e essa heterogeneidade permite a
identificao de grupos homogneos, voc pode dividir a populao
em grupos (estratos) e fazer uma amostragem dentro de cada estrato,
garantindo, assim, a representatividade de cada estrato na amostra.
Podemos verificar que pesquisas eleitorais apresentam uma
grande heterogeneidade em relao inteno de votos quando
32
Mdulo 4
33
Pequeno porte
N1 = 700
Mdio porte
N2 = 100
Grande porte
N3 = 27
34
PROPORO
N DE CIDADES
ESTRATOS
Pequeno porte
N1 = 700
Mdio porte
N2 = 100
Grande porte
N3 = 27
N DE CIDADES
PROPORO
N DE CIDADES AMOSTRADA
EM CADA ESTRATO
Pequeno
porte
N1 = 700
Mdio
porte
N2 = 100
n2 = 0,1209.200 = 24,18 24
Grande
porte
N3 = 27
n3 = 0,0326.200 = 6,52 6
Mdulo 4
35
36
Mdulo 4
37
AMOSTRAGEM
NO
PROBABILSTICA
Amostragem a Esmo
Imagine uma caixa com 1.000 parafusos. A enumerao
desses parafusos ficaria muito difcil e a AAS tornar-se-ia invivel.
Ento, em situaes desse tipo, supondo que a populao de
parafusos seja homognea, escolhemos a esmo a quantidade relativa
ao tamanho da amostra. Quanto mais homognea for a populao,
mais podemos supor a equivalncia com uma AAS. Dessa forma,
os parafusos sero escolhidos para compor a amostra de um
determinado tamanho sem nenhuma norma ou a esmo. Da vem o
nome desse tipo de amostragem.
38
Amostragem Intencional
A amostragem intencional corresponde quela em que o
amostrador deliberadamente escolhe certos elementos para
pertencer amostra por julgar tais elementos bem representativos
da populao.
Um exemplo desse tipo de amostragem corresponde
situao em que desejamos saber a aceitao de uma nova marca
de whisky a ser inserida no mercado de uma cidade. Somente
entraro para compor a amostra pessoas que faam uso da bebida
e que tenham condies financeiras de comprar essa nova marca
(classe social de maior poder aquisitivo).
Mdulo 4
do tamanho desses
grupos, podemos
recorrer a pesquisas
feitas anteriormente
pelo IBGE.
39
Complementando...
Lembre-se de que a construo do conhecimento um processo que
deve ser cclico e renovado a cada dia; para tanto, procure descobrir
mais acerca desse mundo estatstico seguindo esta orientao:
Programa
mamiraua.org.br/download/Default.aspx?dirpath=e:\home\mamiraua\
Web\download\BioEstat 5 Portugues&tipo=diretorio>. Acesso em: 18
nov. 2010. Esse programa permite que voc realize os mtodos de
amostragem, apresentados aqui, computacionalmente.
40
Resumindo
Nesta Unidade, voc conheceu conceitos bsicos
relacionados estatstica e aprendeu a retirar amostras de
populaes. Esses conceitos sero importantes para a compreenso
de novas informaes contidas nas Unidades posteriores.
Mdulo 4
41
Atividades de aprendizagem
Depois de ter visto todos os conceitos das fases do mtodo
estatstico, a classificao de variveis e os diferentes
planos amostrais, resolva as atividades a seguir. Lembre-se
de que as respostas de todas as atividades de aprendizagem
esto no final do livro. Em caso de dvidas, voc deve
consultar seu tutor.
42
b) Um pesquisador de empresa area seleciona aleatoriamente dez voos para entrevistar todos os passageiros
desses voos.
c) Uma prefeitura testa uma nova estratgia de cobrana
selecionando aleatoriamente 250 consumidores com
renda inferior a R$ 300,00 e 250 consumidores com renda de ao menos R$ 300,00.
d) Um eleitor indeciso resolve escolher seu candidato da
seguinte forma: escreve o nome de cada um deles em
cartes separados, mistura-os e extrai um nome, no
qual ir votar.
e) Um pesquisador ficou em um ponto de checagem da
polcia (esquina), onde, a cada cinco carros que passavam, era feito um teste de bafmetro para checar a sobriedade do motorista.
f) Em uma pesquisa com 1.000 pessoas, estas foram
selecionadas usando-se um computador para gerar nmeros de telefones para os quais eram, ento, discados.
g) Uma prefeitura, para no perder uma fbrica de montagem de carros, auxiliou em uma pesquisa na qual a
empresa dividiu seus carros em cinco categorias:
subcompacto, compacto, mdio, intermedirio e grande; e est entrevistando 200 proprietrios de cada categoria para saber da satisfao deses clientes e, assim, ajudar a melhorar as vendas.
h) Motivada pelo fato de um estudante ter morrido por
excesso de bebida, uma universidade fez um estudo
sobre o hbito de beber dos estudantes e, para isso,
selecionou dez salas de aula e entrevistou os estudantes que l estavam.
Mdulo 4
43
UNIDADE 2
DISTRIBUIES DE FREQUNCIAS
E REPRESENTAO GRFICA
46
DISTRIBUIES DE FFREQUNCIAS
Caro estudante,
Vamos dar incio a segunda Unidade de nossa disciplina e,
nela, voc encontrar conceitos relacionados distribuio
de frequncias e representao grfica que lhe permitiro
sintetizar uma grande quantidade de dados em tabelas e
em grficos representativos.
Quando coletamos informaes, sejam de populaes ou
de amostras, como vimos na Unidade anterior, geralmente
trabalhamos com uma quantidade grande de observaes.
Mas, como vamos apresentar esses resultados? Precisamos,
ento, aprender como sintetizar esses dados e coloc-los
de forma que as pessoas possam entender as informaes
obtidas.
Uma forma de fazermos isso utilizando distribuies de
frequncias e anlises grficas, as quais aprenderemos a
partir de agora, j que entraremos no mundo da estatstica,
que se preocupa com a forma de apresentao dos dados.
Vamos comear?
Quando coletamos os dados para uma pesquisa,
as observaes realizadas so chamadas de dados brutos*.
Um exemplo de dados brutos corresponde ao percentual dos
trabalhadores que contribuem com o Instituto Nacional de Seguro
Social (INSS) em 20 cidades de uma determinada regio do Brasil
no ano de 2008 (dados simulados pelo autor a partir de um caso
real). Os dados so apresentados na Tabela 1 na forma em que
foram coletados, por esse motivo so denominados dados brutos.
Geralmente, esse tipo de dado traz pouca ou nenhuma informao
ao leitor, sendo necessrio organiz-lo, com o intuito de aumentar
sua capacidade de informao.
Mdulo 4
47
51
50
58
50
44
46
57
42
41
60
58
41
50
54
60
52
46
52
51
46
51
57
41
46
51
58
42
50
52
58
44
50
52
60
45
50
54
60
48
analisada
so
Mdulo 4
49
| 48,5
50
k = n, para n 100
k = 5 log n, para n> 100
Considerando que nessa pesquisa n = 20 consumidores;
temos, ento, o nmero de classes definido por k = n = 20 = 4,47;
e, como o nmero de classes inteiro, usaremos 5 classes.
O arredondamento utilizado nesse material o padro de algarismos
significativos (como foi aprendido no segundo grau). O nmero de
classes pode tambm ser definido de uma forma arbitrria, sem o
uso dessa regra.
Aps determinarmos o nmero de classes (k) em que os
dados sero agrupados, determinamos a amplitude do intervalo
de classe (c). E, para calcularmos a amplitude do intervalo de
classe, vamos, primeiramente, calcular a amplitude total dos
dados (A), que corresponde diferena entre o maior valor
observado e o menor valor observado.
No nosso caso (usando dados da Tabela 2), teremos
A = 60 41 =19%.
Com base nesse valor da amplitude total (A) calculado, iremos
obter a amplitude do intervalo de classe (c), como mostrado a seguir:
Onde:
c = amplitude de classe;
A= amplitude total; e
k = nmero de classes.
Substituindo os valores j encontrados nessa expresso e
considerando o caso do exemplo que estamos resolvendo, teremos:
Mdulo 4
51
|
43,5 |
48,5 |
53,5 |
58,5 |
38,5
CLASSES (%)
|
43,5|48,5
48,5|53,5
53,5|58,5
58,5|63,5
38,5 43,5
?
?
?
?
?
Total
Fonte: Elaborada pelo autor
52
FREQUNCIA
Sendo:
fai= frequncia absoluta da classe i.
: somatrio das frequncias absolutas para i
variando de 1 at n classes, ou seja, somar as
frequncias
de
cada
uma
das
classes
(fa1+fa 2+fa3+......+fan).
Apresentando os dados na forma de distribuio de frequncia,
voc consegue sintetizar as informaes contidas neles, alm de facilitar
sua visualizao. Considerando essa discusso, elaboramos a Tabela
4, que traz as frequncias (fa e fr) relacionadas varivel analisada.
Mdulo 4
53
CLASSES (%)
|
43,5|48,5
48,5| 53,5
53,5|58,5
58,5|63,5
38,5 43,5
Total
FA ( CIDADES)
FR (PROPORO DE CIDADES )
0,15
0,20
0,35
0,20
0,10
20
1,00
54
CLASSES (%)
|
43,5|48,5
48,5| 53,5
53,5|58,5
58,5|63,5
38,5 43,5
FREQ. ACUMULADA
0,15
0,35
14
0,70
18
0,90
20
1,00
Total
Os valores das
Mdulo 4
na Tabela 3, em caso de
55
DISTRIBUIO DE FREQUNCIAS
DE UMA VARIVEL QUALITATIVA
Quando voc trabalha com variveis qualitativas, os
atributos so as variaes nominativas da varivel. A construo
da tabela consiste em contar as ocorrncias dos nveis de cada
atributo. O resultado da contagem define a frequncia absoluta do
atributo. Para podermos entender isso, tomemos como exemplo uma
pesquisa na qual se procurou avaliar as frequncias de cada gnero
(homem ou mulher) de uma determinada cidade, que considera os
servios prestados pela prefeitura como satisfatrios, em uma amostra
de 50 pessoas. Esses resultados so apresentados na Tabela 6.
Tabela 6: Distribuio de frequncias do gnero de pessoas que consideram os
servios prestados pela prefeitura como satisfatrios
GNERO
FA
FR
Masculino
20
0,40
Feminino
30
0,60
Total
50
1,00
56
DIA
N.R.
DIA
N.R.
DIA
N.R.
DIA
N.R.
DIA
N.R.
13
19
25
14
20
26
15
21
27
10
16
22
28
11
17
23
29
12
18
24
30
FREQ. RELATIVA
0.3
0.17
0.23
0.17
0.07
0.07
Total
30
Mdulo 4
57
58
REPRESENTAO GRFICA
v
v
dirpath=e:\home\mamiraua\
Web\download\BioEstat
5 Portugues&tipo=
distribuies de
frequncias e de
Mdulo 4
59
60
Mdulo 4
61
frequncias e grficos,
Exemplo
62
Mdulo 4
63
64
FA
FRI
FAC
93,91
0,11
143,78
0,14
193,65
243,52
293,39
343,26
28
1,0
CLASSES
|
93,91 |
143,78 |
193,65 |
243,52 |
293,39 |
44,04
Total
Exemplo
Imagine que a rea de superviso de atendimento de controle
de uma prefeitura verificou a quantidade de materiais que foram
rejeitados em quilograma (kg) da fbrica Manda Brasa S.A., que
havia vencido uma licitao conforme os resultados apresentados
na Tabela 10.
Tabela 10: Frequncia dos materiais rejeitados pela fbrica Manda Brasa S.A.
|
|
|
|
|
|
FI
14
20
18
26
15
32
38
Total
50
Fonte: Elaborada pelo autor
Mdulo 4
65
66
Resumindo
Nesta Unidade, voc aprendeu a representar um conjunto de observaes e resumi-lo em tabelas e grficos. Esses conceitos sero importantes na compreenso e no entendimento de um conjunto de dados.
Mdulo 4
67
Atividades de aprendizagem
Agora que voc j viu os conceitos relacionados a
distribuies de frequncias e a representao grfica de
um conjunto de observaes, faa a atividade proposta a
seguir. Em caso de dvida, lembre-se de que voc tem um
tutor pronto a lhe auxiliar.
55
42
57
40
28
44
28
40
30
55
35
25
55
40
38
50
55
40
60
68
UNIDADE 3
MEDIDAS DE POSIO E DISPERSO
Mdulo 4
69
70
MEDIDAS DE POSIO
Caro estudante,
A partir de agora, iremos conhecer uma nova forma de
caracterizar um conjunto de observaes. Para isso, voc
ir aprender novos conceitos de medidas de posio e de
disperso.
Para o entendimento dessas medidas de posio e de
disperso, sero utilizadas as duas situaes apresentadas
a seguir. Sempre que mencionarmos as situaes, voc deve
vir at esta pgina para entender como esto sendo
realizados os clculos.
Preparado para mais esse desafio?
Ento, vamos l!
Mdulo 4
71
FREQUNCIA ABSOLUTA
11
12
16
12 16
16 20
5
Fonte: Elaborada pelo autor
de medidas de posio e
de disperso, utilize o
programa estatstico
44
46
51
54
54
55
56
56
56
58
59
60
61
61
61
62
63
63
www.juliobattisti.com.br/
tutoriais/celsonunes/
openoffice007.asp>.
MDIA
72
Mdulo 4
73
Onde:
xi o ponto mdio da classe i;
fai representa frequncia absoluta da classe i; e
fr i a frequncia relativa da classe i.
Considerando a situao do nmero de casas na rua
(Tabela 11), a mdia ser dada por:
74
Mdulo 4
75
prximo mdulo.
MODA
Em algumas situaes, voc ver que necessria a
informao do nmero de observaes que mais ocorre em um
conjunto de dados. No caso da taxa de efetivao da cobrana,
verificamos que a taxa que mais ocorre 56 e 61. Assim, podemos
definir a moda (Mo) como sendo o valor em um conjunto
76
Onde:
Li : limite inferior da classe modal;
d1 : diferena entre a frequncia da classe modal e a
imediatamente anterior;
d2 : diferena entre a frequncia da classe modal e a
imediatamente posterior; e
c : amplitude da classe modal.
No caso em que, para facilitar um projeto de aplicao da
rede de esgoto de certa regio de uma cidade, os engenheiros da
Prefeitura Municipal tomaram uma amostra de 52 ruas, contando
o nmero de casas (Tabela 11), teremos que a classe modal a
quarta, pois apresenta maior frequncia (valor igual a 16).
Utilizando a expresso mostrada anteriormente, teremos:
Mdulo 4
77
MEDIANA
Outra medida de posio que voc pode utilizar a
mediana (Md), que consiste em um conjunto de valores dispostos
segundo uma ordem (crescente ou decrescente). A mediana o
valor situado de tal forma no conjunto ordenado que o separa em
dois subconjuntos de mesmo nmero de elementos, ou seja, 50%
dos dados so superiores mediana e 50% so inferiores.
O smbolo da mediana dado por Md ou , e a sua posio
dada por meio do da expresso:
E (elemento central) = (n+1) / 2
Considerando um conjunto de dados com nmero mpar de
elementos (1, 2, 5, 9, 10, 12, 13), a posio da mediana ser dada
por (7 + 1)/2 = 4 posio. Portanto, a partir dos dados ordenados,
o nmero que se encontra na 4 posio o 9 e, assim, a mediana
ser igual a 9 (temos trs valores abaixo e trs valores acima, ou
50% acima da mediana e 50% abaixo).
E, caso o nmero de elementos do conjunto de dados seja par,
por exemplo, (1, 2, 6, 8, 9, 12, 11, 13) a posio da mediana ser:
E = ( 8 + 1)/2 = 4,5 posio
78
Onde:
li : limite inferior da classe mediana;
n : nmero total de elementos;
fantac : frequncia acumulada anterior classe mediana;
fmed : frequncia absoluta da classe mediana; e
c: amplitude da classe mediana.
Portanto, resolvendo o caso em que, para facilitar um projeto
de aplicao da rede de esgoto de certa regio de uma cidade, os
engenheiros da Prefeitura Municipal tomaram uma amostra de 52
ruas, contando o nmero de casas por rua; voc ver que a posio
da mediana ser dada por:
(8
Mdulo 4
79
SEPARATRIZES
80
Mdulo 4
81
(i = 1, 2, ... , 9)
82
MEDIDAS DE DISPERSO
Como vimos anteriormente, possvel sintetizar um conjunto
de observaes em alguns valores representativos, como mdia,
mediana, moda e separatrizes. Em vrias situaes, necessrio
visualizar como os dados esto dispersos.
Mdulo 4
83
= 121mil pessoas
AMPLITUDE TOTAL
A amplitude total a diferena entre o maior e o menor valor
observado, como vimos na Unidade 2.
Sendo assim, retomando nossos exemplos das cidades A, B
e C, temos:
AA = 124 118 = 6 mil pessoas
AB = 121 121 = 0 mil pessoas
AC = 125 116 = 9 mil pessoas
Desse modo, podemos identificar que a amplitude do
conjunto C bem maior do que nos demais e o conjunto B apresenta
amplitude igual a zero.
Essa medida apresenta a vantagem de ser facilmente
calculada. Entretanto, o seu inconveniente que ela muito afetada
pelos valores extremos, pois no seu clculo no so consideradas
todas as observaes.
84
VARINCIA
Uma boa medida de disperso deve ter as seguintes
caractersticas:
Mdulo 4
85
*Grau de liberdade o
nmero de determinaes independentes (dimenso da amostra)
menos o nmero de
parmetros
estatsti-
86
DESVIO PADRO
Um inconveniente da varincia que ela expressa em
unidades ao quadrado, ou seja, caso esteja trabalhando com
milhares de reais, o resultado ser expresso em milhares de reais2,
o que causa algumas dificuldades de interpretao.
Para resolver esse problema, podemos nos utilizar do desvio
padro que definido como a raiz quadrada positiva da varincia,
sendo expresso na mesma unidade em que os dados foram coletados.
Mdulo 4
87
COEFICIENTE DE VARIAO
A varincia e o desvio padro so medidas de disperso
absolutas, desse modo, apenas podem ser utilizados para comparar
a variabilidade de dois ou mais conjuntos de dados quando estes
apresentarem:
88
mesma mdia;
mesmo nmero de observaes; e
estiverem expressos nas mesmas unidades.
Ento, para voc comparar qualquer conjunto de dados
quanto sua variabilidade quando, pelo menos, uma dessas
condies no satisfeita, necessrio lanar mo de uma medida
de disperso relativa como o coeficiente de variao (CV), que
expressa a variabilidade dos dados em relao a sua mdia de forma
percentual. Sua expresso ser dada por:
Exemplo
Imagine uma situao referente ao nmero de documentos
falsificados que aparecem em um determinado setor da prefeitura e
o valor arrecadado por hora de um tipo de multa em reais.
Em qual das duas variveis ocorre maior variabilidade, ou variao?
DOCUMENTOS FALSIFICADOS (N)
MULTA (REAIS)
Mdia
22
800
Desvio padro
100
Mdulo 4
89
Mdia:
Mediana: Md = 16, lembrando que, para encontrar a
mediana, necessariamente os dados devem estar
ordenados.
90
Mdia:
Mediana: Md = 18, lembrando que, para encontrar a
mediana, necessariamente os dados devem estar
ordenados.
Prefeitura A
Varincia:
Desvio padro:
Coeficiente de variao:
Prefeitura B
Varincia:
Desvio padro:
Coeficiente de variao:
Mdulo 4
91
| 15
15 | 25
25 | 35
35 | 45
45 | 55
55 | 65
5
Soma
Frequncia (F i )
2
7
20
5
4
2
40
92
vo pertencer a mesma
classe.
Mdulo 4
93
Srie A: {3,96; 3,17; 3,55; 3,61; 4,11; 4,57; 4,97; 5,91; 5,99; 5,74}
Srie B: {1,46; 2,09; 3,04; 5,12; 7,80; 8,25; 9,95; 15,24; 17,40; 21,74}
Srie A
Mdia:
Varincia:
Desvio padro:
Coeficiente de variabilidade:
Srie B
Mdia:
Varincia:
Desvio padro:
Coeficiente de variabilidade:
Observe que na srie A mais fcil fazermos estimativas
precisas, pois ela apresenta menor disperso.
94
Resumindo
Nesta Unidade, voc aprendeu conceitos bsicos sobre
as medidas de posio e de disperso e, desse modo, sabe,
agora, caracterizar um conjunto de observaes. Esses conceitos so de extrema importncia para as inferncias estatsticas, para os testes de hipteses e para as informaes
contidas nas Unidades posteriores dessa disciplina.
Mdulo 4
95
Atividades de aprendizagem
Agora que voc j sabe como calcular e como utilizar as
principais medidas de posio e de disperso, exercite-as
fazendo as atividades, a seguir, que sero importantes na
consolidao dos conhecimentos adquiridos. Em caso de
dvida, lembre-se de consultar seu tutor por meio do AVEA.
1. Considere a sequncia numrica apresentada, a seguir, que mostra as idades de motociclistas e de seus caronas na poca em que
morreram em acidentes fatais de trnsito.
7
38
27
14
18
34
16
42
28
24
40
20
23
31
37
21
30
25
17
28
33
25
23
19
51
18
29
96
UNIDADE 4
PROBABILIDADE
98
Unidade 4 Probabilidade
INTRODUO
Caro estudante,
Vamos iniciar mais uma Unidade e nela veremos os conceitos
de probabilidade. importante que voc esteja atento aos
exerccios resolvidos e, medida que for avanando,
relembre os conceitos aprendidos anteriormente.
Preparado para mais esse desafio?
Ento, vamos juntos!
Mdulo 4
99
Fe n m e n o s d e t e r m i n s t i c o s: aqueles que
invariavelmente do o mesmo resultado se repetidos
sob condies especficas. Um exemplo a acelerao
da gravidade na ausncia de ar (vcuo). Nesse caso,
o resultado sempre ser o mesmo, pois no temos
variaes que venham a influenciar o resultado.
100
Unidade 4 Probabilidade
EXPERIMENTO ALEATRIO
Para voc calcular uma probabilidade, necessrio ter um
experimento aleatrio, ou seja, qualquer processo que venha a gerar
um resultado incerto ou casual.
Para que um processo possa ser considerado um experimento
aleatrio, ele deve ter as seguintes caractersticas:
(frequncia
Mdulo 4
101
A incerteza est
associada chance de
ocorrncia que
atribumos ao resultado
de interesse.
102
Unidade 4 Probabilidade
)
ESPAO AMOSTRAL (
Vamos considerar a situao em que um funcionrio pblico
consegue ou no atingir sua meta de produtividade.
Os Diagramas de Venn
elementos de um
conjunto.
Mdulo 4
103
EVENTO
Qualquer subconjunto do espao amostral () associado ao
experimento aleatrio chamado de evento, ou seja, um
determinado resultado que ocorra dentro do espao amostral. Ento,
em nosso exemplo, teremos que o funcionrio pblico que cumprir
a meta ser considerado como um dos eventos que compem o
espao amostral. Nesse caso, o nosso espao amostral apresenta
dois eventos apenas (cumprir ou no cumprir a meta).
Geralmente, calculamos as chamadas probabilidades desses
eventos associados ao nosso espao amostral. Por isso a
importncia de voc ter esse conceito bem definido em sua mente!
Imagine que algumas secretarias municipais oferecem, por
cortesia, cadeiras suficientes em determinado setor para que os
contribuintes possam esperar confortavelmente; e, outras secretarias,
no oferecem essa cortesia. Vamos ver como esse problema pode
ser formulado dentro do contexto de experimento aleatrio, espao
amostral e eventos.
O experimento a seleo de uma secretaria e a observao
do fato dessa secretaria oferecer ou no a cortesia. H dois pontos
amostrais no espao correspondente a esse experimento:
S:{a secretaria oferece a cortesia}
N:{a cortesia de cadeira no oferecida pela secretaria}
Um ponto importante a ser considerado o de que nem
sempre as chances de ocorrncia dos eventos so iguais a 50%,
como no caso do lanamento de uma moeda. Nessa situao,
provavelmente a chance da secretaria oferecer a cortesia de assentos
(S) poder ser bem maior do que a de no oferecer (N).
104
Unidade 4 Probabilidade
DEFINIES DE PROBABILIDADES
Saiba mais Pierre Fermat (1601-1665)
probabilidades.
Fonte:
<http://
ecalculo.if.usp.br/historia/fermat.htm>.
Acesso em: 24 nov. 2010.
Blaise Pascal (1623-1662)
Com apenas trs anos, perdeu a me.
O pai encarregou-se diretamente da sua
educao, desenvolvendo um mtodo
singular de educao com exerccios e
jogos de disciplinas, como Geografia,
Histria e Filosofia. Contudo, seu pai
acreditava que a Matemtica somente
Mdulo 4
105
*Mutuamente
exclu-
dentes a ocorrncia de
um evento exclui a ocorrncia do outro. Fonte:
P (E) =
*Igualmente provveis
ocorrem com a mesma
probabilidade.
Fonte:
m
N
Onde:
m: nmero de eventos favorveis probabilidade E que
se deseja calcular, ou seja, o nmero de vezes que E
acontece; e
N: nmero total de ocorrncias dentro do espao amostral.
* Reprodutibilidade
ocorrncia de diversas
vezes de um mesmo evento. Fonte: Elaborado pelo
autor.
106
Unidade 4 Probabilidade
Carlos
Jackeline
Giulyana
Girlene
Cludio
Larissa
Mdulo 4
107
Carlos
Cludio
2
=
6
108
Unidade 4 Probabilidade
* Eventos mutuamente
exclusivos so aqueles
que no podem acontecer simultaneamente.
Fonte: Elaborado pelo
autor.
A AB B
A A B B
Mdulo 4
109
Ac
S
Figura 16: Espao amostral
Fonte: Elaborada pelo autor
110
Unidade 4 Probabilidade
PROBABILIDADE CONDICIONAL
A partir de agora veremos outros conceitos de probabilidade
e para tanto voc deve considerar os dados, a seguir, referentes a
uma prefeitura, em que foram selecionados, a partir de uma
amostragem estratificada (vista anteriormente), 101.850
contribuintes das classes mdia-baixa e alta. Posteriormente, foi
feita a verificao do nmero de contribuintes, de cada classe
social, que pagaram um determinado tributo em dia (evento:
pagaram) e tambm o nmero de contribuintes das classes
estudadas que no pagaram em dia o tributo (evento: no pagaram).
Para compreender essa descrio, observe os resultados descritos
na Tabela 13:
Tabela 13: Contribuintes pagantes e no pagantes
MDIA-BAIXA
ALTA
TOTAL
Pagaram (P)
39.577
8.672
48.249
No Pagaram (NP)
46.304
7.297
53.601
Total
85.881
15.969
101.850
Mdulo 4
111
112
Unidade 4 Probabilidade
Mdulo 4
113
P( A / B) =
P( A B )
P( B )
114
Unidade 4 Probabilidade
P( A B)
=> P( A B ) = P ( A / B ) P( B ) => P( A B ) = P( A )P ( B )
P( B )
SETOR
TOTAL
15 a 20 (R1)
70
40
110
20 a 25 (R2)
15
15
30
25 a 30 (R3)
10
20
30
30 a 35 (R4)
20
10
30
Total
115
85
200
Mdulo 4
115
P ( R1 / B) =
P (R1 B )
0, 20
=
= 0,4706
P (B )
0, 425
independentes, a
relao de
interseces presentes
na Tabela 14.
116
Unidade 4 Probabilidade
P (A) = 4/8 =
em negrito ocorrem no
P (B) = 4/8 =
P( A / B) =
1
P( A B)
2 1
= 4 = = => P (A / B) = P (A) => =
1
4 2
P(B)
2
Exemplo
Um estudante chega atrasado em 40% das aulas e esquece
o material didtico em 18% das aulas. Supondo eventos
independentes, calcule a probabilidade de:
a) O estudante chegar na hora e com material.
b) No chegar na hora e ainda sem material.
Como o exerccio afirma que o estudante chega atrasado em
40% das aulas, entendemos que 40% = 0,40, ou seja, ele no chegar
atrasado = 60% = 0,6. O exerccio afirma tambm que ele esquece
Mdulo 4
117
PREO
QUALIDADE
SOMA
Alta
42
56
98
Mdia
37
21
58
Baixa
13
97
110
Total
92
174
266
118
Unidade 4 Probabilidade
Por fim, para ser da classe baixa, dado que atribuiu maior
importncia ao fator qualidade, o clculo feito por:
P (classe baixa / qualidade ) =
Mdulo 4
119
120
Unidade 4 Probabilidade
P( A / B) =
P( A B)
P( B)
Mdulo 4
121
Resumindo
Nesta Unidade, voc ampliou o seu conhecimento
quanto ao termo probabilidade.
Descrevemos as abordagens clssicas das frequncias
relativa e subjetiva da probabilidade e entendemos os termos experimento, espao amostral e evento.
Vimos a definio dos termos probabilidade condicional e probabilidade conjunta, alm de aprendermos a calcular as probabilidades aplicando as regras da adio e da
multiplicao. Para intensificar nosso estudo, vimos esses
conceitos aplicados a partir da apresentao de exemplos.
Caso algum conceito no tenha ficado claro, retome a
leitura, pois eles sero importantes para a compreenso de
novas informaes contidas nas Unidades posteriores.
122
Unidade 4 Probabilidade
Atividades de aprendizagem
Agora que voc j entendeu todos os conceitos relacionados
aos clculos de probabilidade apresentados, resolva as
atividades apresentadas, a seguir, e, em caso de dvidas,
no hesite em consultar o seu tutor.
1. Considerando as probabilidades de trs fiscais A, B e C, que trabalham independentemente, efetivarem uma autuao quando
abordam uma obra so 2/3, 4/5 e 7/10, respectivamente. Se cada
um abordar uma obra, qual a probabilidade de que pelo menos
um efetive a multa?
2. Sendo A e B dois mestres que j esto suficientemente treinados
em partidas de xadrez e jogam 120 partidas, das quais A ganha 60,
B ganha 40 e 20 terminam empatadas; A e B concordam em jogar
trs partidas. Determine a probabilidade de:
a) A ganhar todas as partidas.
b) Duas partidas terminarem empatadas.
c) A e B ganharem alternadamente.
3. Em um perodo de um ms, 100 funcionrios de uma prefeitura
que trabalham com resduos txicos, sofrendo de determinada
doena, foram tratados. As informaes sobre o mtodo de tratamento aplicado a cada funcionrio e o resultado final obtido esto na tabela a seguir:
Mdulo 4
123
TRATAMENTO
Resultado
Cura Total
24
16
Cura Parcial
24
16
Morte
12
Sorteando-se aleatoriamente um desses funcionrios, determine a probabilidade de o funcionrio escolhido ter sido:
a) Submetido ao tratamento A.
b) Totalmente curado.
c) Submetido ao tratamento A e ter sido parcialmente
curado.
d) Submetido ao tratamento A ou ter sido parcialmente
curado.
124
Unidade 4 Probabilidade
UNIDADE 5
DISTRIBUIO DE PROBABILIDADES
DISCRETAS E CONTNUAS
Mdulo 4
125
126
INTRODUO
Caro estudante,
Como voc progrediu nos conhecimentos bsicos de
probabilidade, agora iremos trabalhar com as chamadas
distribuies de probabilidades. Essas distribuies
auxiliam no clculo de probabilidades e, ainda, nos
processos de estimao e de deciso, conforme veremos
na prxima Unidade. Estudaremos as distribuies de
amostragem e dimensionamento de amostras que, tambm,
sero vistas nesta Unidade.
Bons estudos e conte conosco para auxili-lo sempre que
necessrio.
Vamos comear com alguns conceitos preliminares.
Para que voc tenha condies de entender as distribuies,
necessrio conhecer bem o que uma varivel aleatria*, que
pode ser discreta ou contnua.
Um exemplo de uma varivel aleatria discreta (v.a.) a
quantidade de aes que tiveram queda em um determinado dia,
em uma carteira composta por cinco aes diferentes. A funo
ser dada por:
Mdulo 4
127
a chance que uma varivel pode assumir ao longo de um espao de valores. Fonte: Elaborado
pelo autor.
128
DISTRIBUIES DISCRETAS
Imagine uma situao na qual somente podem ocorrer dois
possveis resultados, sucesso e fracasso. Veja alguns exemplos:
Mdulo 4
129
p para x = 1,
P ( X = x ) = q = 1 - p para x = 0
0 para x diferente de 0 ou 1
DISTRIBUIO BINOMIAL
Para que uma situao possa se enquadrar em uma
distribuio binomial, deve atender as seguintes condies:
130
onde:
p probabilidade de sucesso em cada ensaio;
q = 1-p a probabilidade de fracasso em cada
ensaio;
de n valores tomados x a x
Mdulo 4
131
Exemplo
Vamos considerar que algumas pessoas entram em uma loja
no perodo prximo ao dia das mes. Sabemos que a probabilidade
de uma pessoa do gnero masculino comprar um presente de 1/3.
Se entrarem quatro pessoas do gnero masculino na tal loja, qual a
probabilidade de que duas venham a comprar presentes?
Se essas quatro pessoas entram na loja e duas delas
compram, podemos colocar as possibilidades da seguinte forma
(C compra e no-C no compra). O espao amostral
associado ao experimento :
C, C, no-C, no-C ou C, no-C, no-C, C ou C, no-C, C,
no-C ou no-C, no-C, C, C ou no-C, C, no-C, C ou no-C,
C, C, no-C
Logo, calculando as probabilidades usando as regras do e
(multiplicao, pois so independentes) e do ou (soma), a
probabilidade de 2 clientes do gnero masculino comprarem
presentes :
1 1 2 2 1 2 2 1 1 2 1 2 2 2 1 1 2 1 2 1 2 1 1 2
p= + + + + +
3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3
1 1 2 2
p = 6
3 3 3 3
2
1 2
p = 6
3 3
p=
24
81
@ 29 ,63 %
1 4 4.3.2.1 4 24
4!
1 2
P ( X = 2) = C42 . =
. . =
. =
@ 0,2963 ou 29,63%
2!.(4 - 2)! 9 9 2.1.2.1 81 81
3 3
132
so:
Mdia = n.p
Varincia = n.p.q
Exemplo
Como na binomial so n
ensaios de Bernoulli e a
Mdulo 4
133
DISTRIBUIO
DE
POISSON
lx
P( X = x) = e .
x!
-l
134
Onde:
e =2,7182 (base dos logartmos neperianos); e
corresponde a frequncia mdia de sucesso no intervalo
contnuo que se deseja calcular a probabilidade.
Exemplo
A anlise dos dados dos ltimos anos de uma empresa de
energia eltrica forneceu o valor mdio de um blecaute por ano.
Pense na probabilidade de isso ocorrer no prximo ano:
a) Nenhum blecaute.
b) De 2 a 4 blecautes.
c) No mximo 2 blecautes.
Note que o exemplo afirma que a cada ano acontece em
mdia um blecaute, ou seja, o nmero de sucesso ocorrido em
um inter valo contnuo. Verificamos que a varivel tem
Distribuio Poisson:
lx
P( X = x) = e .
x!
-l
e -1 .10 0,3679.1
=
= 0,3679 ou 36,79%
0!
1
b)
-1
e .1
0,3679.1
=
= 0,3679 ou 36,79%
1!
1
Mdulo 4
135
probabilidade um dia, o
ser igual a 3.
-l
P( X = x) = e .
lx
x!
P(X = 4) = e
-3
34
= 0,1680
4!
30
= 0 ,0498
0!
P ( X = 20) = e -21
136
2120
= 0 ,0867
20!
Mdia = Varincia =
Mdulo 4
137
DISTRIBUIES CONTNUAS
Dentre as vrias distribuies de probabilidade contnuas,
abordaremos aqui apenas a distribuio normal, pois ela apresenta
grande aplicao em pesquisas cientficas e tecnolgicas. Grande
parte das variveis contnuas de interesse prtico segue essa
distribuio, aliada ao Teorema do Limite Central (TLC), que a
base das estimativas e dos testes de hipteses realizados sobre a
mdia de uma populao qualquer, e garante que a distribuio
amostral das mdias segue uma distribuio normal,
independentemente da distribuio da varivel em estudo, como
ser visto mais adiante.
DISTRIBUIO NORMAL
A funo densidade de probabilidade da distribuio normal
dada por:
f ( x) =
1
s 2 p
1 x- m
-
2 s
exp
, x R.
Onde:
e so a mdia e o desvio padro, respectivamente, da
distribuio de probabilidade.
corresponde a 3,1415 e exp a uma funo exponencial.
138
* Campanular relativo
campnula; objeto em
forma de sino. Fonte:
Houaiss (2009).
Mdulo 4
139
A varivel x tem
z=
140
x- m
s
z=
x -m m -m
=
= 0 na distribuio normal reduzida.
s
s
Para x = + temos:
z=
x -m m +s -m s
=
= = 1 e, assim por diante.
s
s
s
Podemos definir a distribuio normal reduzida ou
padronizada como sendo uma distribuio da varivel
Z que apresenta distribuio normal com mdia zero
e varincia 1 (Z N (0;1)).
Mdulo 4
141
142
x - m 75000 - 60000
=
= 1,50
s
10000
z=
1,5
0,5
0,4332
1,5
Mdulo 4
143
0,3413
0,3414
-1,00
1,00
144
0,3413
0
0,3 1,00
1,00
0,1179
0,3
Mdulo 4
145
DISTRIBUIES AMOSTRAIS
Com as distribuies amostrais, voc pode inferir propriedades
de um agregado maior (a populao) a partir de um conjunto menor
(a amostra), ou seja, inferir sobre parmetros populacionais,
dispondo apenas de estatsticas amostrais. Portanto, torna-se
necessrio um estudo detalhado das distribuies amostrais, que so
base para intervalos de confiana e testes de hipteses.
Para que voc tenha condies de fazer afirmaes sobre
um determinado parmetro populacional (ex: ), baseados na
estimativa x, obtida a partir dos dados amostrais, necessrio
conhecer a relao existente entre x e isto , o comportamento de
x, quando se extraem todas as amostras possveis da populao,
ou seja, sua distribuio amostral.
Para obtermos a distribuio amostral de um estimador,
necessrio conhecer o processo pelo qual as amostras foram
retiradas, isto , se amostras foram retiradas com reposio ou
sem reposio. Neste material, iremos considerar apenas as
situaes de amostragens com reposio.
Dessa forma, a partir do comportamento da estatstica
amostral, podemos aplicar um teorema muito conhecido na
estatstica como Teorema do Limite Central (TLC). Esse teorema
prope que, se retirarmos todas as possveis amostras de tamanho
n de uma populao, independente de sua distribuio, e
verificarmos como as estatsticas amostrais obtidas se distribuem,
teremos uma distribuio aproximadamente normal, com x
(mdia das medias amostrais igual mdia populacional)
2
e varincia das mdias s x =
146
s2
(varincia das mdias
n
x-m
Ento, por meio do TLC, a estatstica ser dada por: z = s
.
n
Confira a indicao de
um programa para
clculo amostral na
seo Complementando
ao final desta Unidade.
DISTRIBUIO t DE STUDENT
Na prtica, muitas vezes no se conhece 2 e trabalha-se
com amostras pequenas, ou seja, menor ou igual a 30. Assim, voc
conhece apenas sua estimativa s (desvio padro amostral).
Substituindo por seu estimador s, na expresso da varivel
padronizada, obtemos a seguinte varivel:
t=
x-m
s
(expresso semelhante a Z)
n
menos o nmero de
estatsti-
Mdulo 4
147
ta
148
Mdulo 4
149
a = 0,01
0
2,764
a 2 = 0,025
-2,086
150
0,95
0
a 2 = 0,025
2,086
DISTRIBUIO
DE
QUI-QUADRADO
c2 =
(n - 1) s 2
tem distribuio 2 com n-1 graus de liberdade.
s2
Por meio da Tabela 17, voc pode ver como feita a utilizao
da distribuio de qui-quadrado com graus de liberdade (GL).
Mdulo 4
151
Para obter probabilidades ou o valor da estatstica de quiquadrado, voc ir proceder do mesmo modo que na tabela da
distribuio t de Student. Na primeira linha, temos os valores de ,
na primeira coluna temos os graus de liberdade e no meio da tabela
temos os valores da estatstica de qui-quadrado.
152
0,025
a = 0,975
3,25
0,10
a = 0,90
Mdulo 4
153
DISTRIBUIO
DE
s 2A
F=
s 2B
s 2A
s 2B
154
Mdulo 4
155
a = 0,10
1 - a = 0,90
2,092
156
NOES DE ESTIMAO
Um dos principais objetivos da estatstica inferencial
consiste em estimar os valores de parmetros populacionais
desconhecidos (estimao de parmetros) utilizando dados
amostrais. Ento, qualquer caracterstica de uma populao pode
ser estimada a partir de uma amostra aleatria, desde que esta
amostra represente bem a populao.
Os parmetros
populacionais mais
comuns a serem
Mdulo 4
157
Na seo Distribuies
Amostrais, abordamos
esse assunto. Se julgar
necessrio, retome o
contedo.
158
ESTIMAO
POR INTERVALOS
Mdulo 4
159
160
Mdulo 4
161
DIMENSIONAMENTO
DE
AMOSTRAS
e = za
2 n
s
n = za
2
e
za . s
n= 2
e
n=
( za )2 . s 2
2
e2
Onde
e correspondem s estimativas de sucesso e de
fracasso, respectivamente, obtidos a partir de resultados amostrais.
162
Complementando...
Atravs do link que apresentamos a seguir, voc poder fazer clculos das
distribuies de probabilidade discretas ou contnuas, de dimensionamento
de amostras e de intervalos de confiana.
Programa
estatstico
Bioestat.
Disponvel
em:
<http://
www.mamiraua.org.br/download/Default.aspx?dirpath=e:\home\
mamiraua\Web\download\BioEstat 5 Portugues&tipo=diretorio>.
Acesso em: 19 nov. 2010.
Mdulo 4
163
Resumindo
Nesta Unidade, voc aprendeu sobre as principais distribuies de probabilidade, sejam elas discretas ou contnuas, e como utiliz-las. Tambm conheceu as distribuies
de amostragem e, quando utiliz-las, e noes bsicas de
estimao (intervalos de confiana) e dimensionamento de
amostras. Essas informaes sero muito importantes para
a compreenso da prxima Unidade.
164
Atividades de aprendizagem
Para verificar se voc est acompanhando o que
apresentamos nesta Unidade, procure responder s
atividades propostas, a seguir. Se tiver dificuldades para
resolv-las, consulte seu tutor.
Mdulo 4
165
166
UNIDADE 6
TESTES
DE
HIPTESES
amostrais; e
Mdulo 4
167
168
INTRODUO
Caro estudante,
Vamos conhecer agora os principais testes de hipteses
utilizados na inferncia estatstica.
Voc, como gestor, muitas vezes ter de tomar decises
baseadas na anlise de dados a partir de um teste de
hiptese. Portanto, esteja atento ao contedo que iremos
apresentar a voc nesta ltima Unidade, pois ao longo da
leitura voc certamente perceber a importncia desse
assunto quando tratamos de Estatstica Aplicada
Administrao. Bom estudo!
Mdulo 4
169
170
Mdulo 4
171
A hiptese alternativa
H0: p = 0,06;
H1: p > 0,06.
172
Note que o
conhecimento das
distribuies amostrais
vistas na Unidade 5
muito importante. Caso
Mdulo 4
173
174
Mdulo 4
175
Onde:
x : mdia amostral;
: mdia populacional;
: desvio padro populacional; e
n: tamanho da amostra.
Imagine a seguinte situao: um gestor pblico sabe
que, para montar um determinado negcio em um bairro de
Curitiba, necessrio que nele circulem, no mnimo, 1.500 pessoas
por dia. Para o tipo de bairro em questo, possvel supor o desvio
padro como sendo igual a 200 pessoas. Uma amostra aleatria
formada por 12 observaes revelou que passariam pelo local
176
Denominamos esse
desvio como
populacional, pois,
baseados nas
caractersticas do bairro
(conhecimento prvio),
podemos supor o valor
do desvio.
= 0,05
Mdulo 4
177
Onde:
x : mdia amostral;
: mdia populacional;
s : desvio padro amostral; e
n: tamanho da amostra.
178
Mdulo 4
179
= 0,05
A estatstica escolhida t de Student.
Substituindo os valores do problema na expresso, teremos:
padro amostral e no
distribuio t de Student.
180
Mdulo 4
181
= 0,5184 com n1 = 14
= 0,2025 com n2 = 21
Ento, a varivel de teste do teste F ser:
s12
F=
s22
s 12
s2
2
F =
s1
s 22
= 00 ,, 5184
= 2,56
2025
182
Mdulo 4
183
H1
1 2 < d 0
1 2 = d0
1 2 > d 0
1 2 d0
184
Z =
( X 1 - X 2 ) - (m 1 - m 2)
2
1
/ n1 + s 2 / n2
Onde:
X1: mdia da amostra 1; X2: mdia da amostra 2; : mdia
da populao 1; :mdia da populao 2;
: varincia da
populao 1; : varincia da populao 2; n1: tamanho da amostra
1 e n2 tamanho da amostra 2.
1160
1140
Desvio padro
90
80
Tamanho amostra
100
100
MARCAS
Mdia
Como fazer:
Vamos retirar os dados apresentados em nossa situao:
Amostra A: n = 100; x = 1160; s = 90
Amostra B: n = 100; x = 1140; s = 80
Mdulo 4
185
ab a b
ab
O teste t deve ser bilateral, j que a preocupao est na
verificao do fato da mdia da prefeitura A ser diferente da mdia
da prefeitura B.
= 0,05
A estatstica usada ser Z, pois as amostras so grandes
(n > 30), apesar de no termos os desvios padro populacionais.
Sendo assim, nessa situao, ainda utilizamos a estatstica de Z.
Substituindo os valores na estatstica, teremos:
Zc =
902 802
+
100 100
= 1,67
186
t=
( X 1 - X 2 ) - ( m1 - m2 )
s p1 / n1 + 1 / n 2
Sp =
( n 1 - 1 )s 1 2 + (n 2 - 1 )s 2 2
n1 + n2 - 2
Unidade 5.
Mdulo 4
187
ab a b
ab
informado no problema,
= 0,05
anteriormente.
188
Sp =
tc =
5.12 + 4.1 2
=1
6 + 5- 2
1 1
+
na nb
1 1
+
6 5
0,5
= 0,82
0,6055
v = na + nb 2 = 6 + 5 2 = 9 (grau de liberdade)
Mdulo 4
189
t=
( X 1 - X 2 ) - (m1 - m 2 )
2
1
/ n1 + s 2 / n 2
190
AUTOMVEL
TAMANHO DA AMOSTRA
MDIA DE CONSUMO
DESVIO PADRO
Andaluz
12 unidades
14 km/l
2 km/l
Reluzente
10 unidades
15 km/l
4 km/l
Resoluo:
Nessa situao, faremos um teste de hiptese para diferena
entre mdias populacionais. Como as amostras so pequenas,
precisamos saber se as varincias so estatisticamente iguais ou no.
Para isso, vamos testar se as varincias populacionais so estatisticamente iguais ou no por meio de teste de F. As hipteses so:
Mdulo 4
191
V=
sA2 sR2
+
nA nR
2
s
s
n
nA
+ R
n A - 1 nR - 1
t=
2
A
(xA
2
R
4 + 16
12 10
4
12
11
16
10
+
3, 74
3,74
=
= 12, 89 @ 13
0, 01 + 0,28 0, 29
- xR ) - (m andaluz - m reluzente )
s A2 sR2
+
nA nR
-1
= -0,72
1,39
192
D=
d
i =1
n 2
d i
n
i =1
2
d
i
n
S D = i =1
n -1
t =
D - dO .
SD / n
Mdulo 4
193
Antes
6,6
6,5
9,0
10,3
11,3
8,1
6,3
11,6
Depois
6,8
2,4
8,5
8,1
6,1
3,4
2,0
7,4
194
Antes
6,6
6,5
10,3
11,3
8,1
6,3
11,6
Depois
6,8
2,4
7,4
8,5
8,1
6,1
3,4
-0,2
4,1
1,6
1,8
3,2
2,9
9,6
t=
D - dO
3,125 - 0
=
= 3,03
S D / n 2, 9114 / 8
0,95
(RAH0)
0
a = 0,05
(RRH0)
1,895
Mdulo 4
195
Vimos sobre a
Distribuio de Bernolli
z=
( p1 - p 2 ) - ( p1 - p2)
p 1q1 p 2 q2
n1
n2
Onde:
e : correspondem proporo de sucesso nas amostras
1 e 2, respectivamente; e
p1
um menos a proporo
de sucesso.
196
80
= 0,16; q = 0,84
500
Pernambuco: n = 600; p =
150
= 0,25; q = 0,75
600
Mdulo 4
197
198
TESTE DO QUI-QUADRADO
DE INDEPENDNCIA
O teste do qui-quadrado de independncia est associado a
duas variveis qualitativas, ou seja, a uma anlise bidimensional.
Muitas vezes, queremos verificar a relao de dependncia entre as
duas variveis qualitativas a serem analisadas.
Nesse caso, procuramos calcular a frequncia de ocorrncia
das caractersticas dos eventos a serem estudados. Por exemplo,
podemos estudar a relao entre o sexo de pessoas (masculino e
feminino) e o grau de aceitao do governo estadual (ruim, mdio
e bom). Ento, obteremos, por exemplo, o nmero de pessoas
(frequncia) que so do sexo feminino e que acham o governo bom.
Todos os cruzamentos das duas variveis so calculados.
Vamos apresentar a voc, como exemplo, os possveis
resultados da situao sugerida anteriormente (dados simulados).
GRAU DE ACEITAO
SEXO
RUIM
MDIO
BOM
TOTAL
Masculino
157
27
74
258
Feminino
206
10
216
Total
363
27
84
474
Mdulo 4
199
Onde:
k corresponde ao nmero de classes (frequncias
encontradas). Voc pode verificar que fo corresponde frequncia
observada, ou seja, ao valor encontrado na tabela de contingncia.
J fe corresponde frequncia esperada caso as variveis
no tenham nenhuma relao de dependncia, ou seja, caso as
duas variveis sejam independentes. Por causa dessa definio, o
clculo da frequncia esperada (fe) ser obtido por:
200
MUITO
Homem
32
Mulher
16
40
Resoluo:
Definindo primeiro as hipteses H0 e H 1.
H0: uso do MSN independe do sexo.
H1: uso do MSN depende do sexo.
Agora, iremos calcular as frequncias esperadas, que so os
valores que esto entre parnteses. Confira os clculos das outras
frequncias esperadas cujos valores (fe) aparecem entre parnteses.
USO DO MSN
SEXO
POUCO
MUITO
Homem
8 (10)
Mulher
16 (14)
24
32 (30)
40 (42)
40
72
56
96
Mdulo 4
201
202
Mdulo 4
203
204
onde:
n : nmero total de pares;
r2 : coeficiente de correlao ao quadrado; e
: parmetro da correlao populacional (considerado
igual a zero).
A hiptese H0 ser de que (rho) = 0 e a hiptese H1, que
iremos utilizar, ser de que (rho) 0.
Situao:
Vamos determinar o coeficiente de correlao entre a
porcentagem de aplicao do total de recursos com Educao em
uma prefeitura (x) e o grau de conhecimento mdio da populao
da cidade (y). Para isso, foram avaliadas dez cidades.
Mdulo 4
205
DA POPULAO DA CIDADE
70
10
40
20
27
30
22
40
18
50
16
60
15
70
14
80
13
90
12
x = x
i
2
i
y = y
i
2
i
206
x y = x y + x y ....... + x y =
x y = 5 . 70 + 10 . 40 + ....... + 90 . 12 = 7470
i
10
10
Mdulo 4
207
Complementando...
Atravs do link que apresentamos a seguir, voc poder fazer os testes de
hipteses e de estimativas de correlao de Pearson.
208
Resumindo
Nesta Unidade, conhecemos os principais testes de
hipteses e vimos suas aplicaes no dia a dia da gesto de
empresas pblicas.
Apresentamos a estrutura de um teste de hiptese,
de testes de hipteses para mdias, de diferena entre mdias e de diferena entre propores.
Verificamos que o teste de qui-quadrado pode ser utilizado para medir a dependncia entre variveis qualitativas. Dessa forma, voc ter plenas condies de aplicar e de
interpretar um teste estatstico de maneira correta.
Mdulo 4
209
Atividades de aprendizagem
Chegou o momento de analisarmos se voc entendeu o que
estudamos at aqui! Para saber, procure, resolver as
atividades propostas a seguir. Lembre-se: voc pode contar
com o auxilio de seu tutor.
210
Mdulo 4
211
Respostas das
Atividades de aprendizagem
Unidade 1
1. a) Qualitativa Nominal.
b) Qualitativa Ordinal.
c) Quantitativa Discreta.
d) Quantitativa Contnua.
2. a) Amostragem Sistemtica.
b) Amostragem por Conglomerado.
c) Amostragem Estratificada.
d) Amostragem Aleatria Simples.
e) Amostragem Sistemtica.
f) Amostragem Aleatria Simples.
g) Amostragem Estratificada.
h) Amostragem por Conglomerado.
Unidade 2
1. a) n = 20, A = 35, k = 5 (aproximadamente), c = 8,75, Li1a
= 20,925.
CLASSES
212
FREQUNCIAS ABSOLUTAS
20,625 29,375
29,375 38,125
38,125 46,875
46,875 55,625
55,625 64,375
Total
20
CLASSES
FREQUNCIAS ACUMULADA
20,625 29,375
29,375 38,125
38,125 46,875
12
46,875 55,625
17
55,625 64,375
20
b)
Unidade 3
1.
Md =
Mdulo 4
213
2. Mdia
21.0
Mediana
18.0
Moda
10.0
Desvio padro
12.0
214
a) = 1,4
R= 0,40817
b) = 2,8
R=0,76892
c) = 5,6
R=0,97559
4. Para X = 2200
Para X = 1700
Z=0
5. a) X = 20
X = 24
P(20 < X < 24) = P(0 < Z < 0,8) = 0,2881 (28,81 %).
b) X = 16
X = 20 Z = 0
P(16 < X < 20) = P (-0,8 < Z < 0) = P(0 < Z < 0,8) = 0,2881 = 28,81
c) X = 28 Z = (28 - 20 )/ 5 = 1,6
P(X > 28) = P (Z > 1,6) = 0,5 - 0,4452 = 0,0548
6. 1 = 0,95 = 0,05 /2 = 0,025
ZZ
Concluso: como o valor calculado foi maior do que o
tabelado (1,64), ele caiu na regio de rejeio de H0.
Mdulo 4
215
2. HA B H1 2
t0,025 = 2,060
Concluso: como o valor calculado foi maior do que o
tabelado (2,060), ele caiu na regio de rejeio de H 0.
3. H1 2 H 1 2
216
CONSIDERAES FINAIS
Com os conhecimentos de estatstica adquiridos ao longo
deste livro, voc agora j pode imaginar quantas anlises estatsticas
podem ser feitas. A anlise de dados est presente at em uma
simples ligao telefnica que uma empresa de crdito faz para
voc. A empresa cruza informaes como sexo, renda mensal e
hbitos de consumo para oferecer um produto na medida certa.
Para fazer tudo isso, necessrio, entretanto, conhecimento
bsico de estatstica para que empresas de Gesto Pblica ou no
venham a descobrir como transformar quantidades de nmeros e de
grficos em informaes que serviro para reduzir os custos e aumentar
os lucros. O problema que falta gente qualificada e com conhecimento
de mercado para realizar as anlises de dados. Para voc trabalhar
com conceitos estatsticos em qualquer setor, necessrio desenvolver
um raciocnio lgico e, tambm, administrar informaes, alm de
procurar entender como e por que as coisas acontecem.
Para decidir algo importante, necessrio avaliar os riscos
e as oportunidades. Para que isso seja feito com muita preciso,
necessria a estatstica!
Assim, voc poder aplicar os conhecimentos de estatstica
aprendidos em reas, como a de Recursos Humanos, de Produo,
Financeira e muitas outras que voc ir identificar medida que
seus conhecimentos na rea de Administrao forem aumentando.
Espero que voc tenha gostado de trabalhar com Estatstica e
que ela seja uma importante ferramenta a ser utilizada em seu dia a dia.
Um grande abrao e sucesso em sua vida profissional, com
bastante estatstica, o que desejamos a voc.
Professor Marcelo Tavares
Mdulo 4
217
Referncias
ARANGO, Hector G. Bioestatstica: terica e computacional. Rio de
Janeiro: Guanabara Koogan, 2001.
218
Referncias Bibliogrficas
Mdulo 4
219
M INICURRCULO
Marcelo Tavares
Possui Graduao (1989) e Mestrado (1993)
pela Universidade Federal de Lavras, e Doutorado pela Escola Superior de Agricultura Luiz de
Queiroz/USP (1998). Atualmente, professor Associado II da Universidade Federal de Uberlndia (UFU). Tem experincia na rea
de Estatstica Aplicada e atua, principalmente, nos seguintes temas: modelagem estatstica, estatstica, amostragem, controle de
qualidade e estatstica multivariada. Tambm foi coordenador do
Curso de Especializao em Estatstica Empresarial do Ncleo de
Estudos Estatsticos e Biomtricos da Faculdade de Matemtica e,
atualmente, Coordenador da Universidade Federal de Uberlndia
na Universidade Aberta do Brasil (UAB) e ministro das disciplinas
de Estatstica para o Curso de Administrao da UFU.
220