Sie sind auf Seite 1von 142

EstatsticaAplicada

Estatstica Aplicada
Administrao
Administrao
Prof. Marcelo Tavares
Copyright 2007. Todos os direitos desta edio reservados ao Sistema Universidade Aberta do Brasil. Nenhuma parte deste material

poder ser reproduzida, transmitida e gravada, por qualquer meio eletrnico, por fotocpia e outros, sem a prvia autorizao, por escrito,

do autor.
PRESIDENTE DA REPBLICA
Luiz Incio Lula da Silva

MINISTRO DA EDUCAO
Fernando Haddad

SECRETRIO DE EDUCAO A DISTNCIA


Carlos Eduardo Bielschowsky

DIRETOR DO DEPARTAMENTO DE POLTICAS EM EDUCAO A DISTNCIA DPEAD


Hlio Chaves Filho

SISTEMA UNIVERSIDADE ABERTA DO BRASIL


Celso Costa

COMISSO EDITORIAL DO PROJETO PILOTO UAB/MEC


Marina Isabel Mateus de Almeida (UFPR)
Teresa Cristina Janes Carneiro (UFES)
Antonio Roberto Coelho Serra (UEMA)
Jonilto Costa Sousa (UnB)
Vicente Chiaramonte Pires (UEM)
Ozrio Kunio Matsuda (UEM)
Anderson de Barros Dantas (UFAL)

ORGANIZAO DO CONTEDO
Prof. Marcelo Tavares

PROJETO GRFICO
Annye Cristiny Tessaro
Mariana Lorenzetti

DIAGRAMAO
Annye Cristiny Tessaro
Victor Emmanuel Carlson

REVISO DE PORTUGUS
Renato Tapado
Patrcia Regina da Costa
Sumrio
Introduo.....................................................................................07

UNIDADE 1 Estatstica descritiva

Estatstica descritiva....................................................................................11

UNIDADE 2 Introduo a probabilidades

Introduo a probabilidades........................................................................41

UNIDADE 3 Amostragem

Amostragem............................................................................73

UNIDADE 4 Testes de Hipteses

Testes de Hipteses..............................................................................103
Referncias.....................................................................................133
Anexos.....................................................................................135
Introduo

O cidado comum pensa que a estatstica se resume apenas a


apresentar tabelas de nmeros em colunas esportivas e/ou econmicas
de jornais e revistas, ilustradas com grficos, pilhas de moedas, etc.,
ou quando muito associam a estatstica previso de resultados eleito-
rais. A estatstica no se limita somente a compilar tabelas de dados e
os ilustrar graficamente. Sir Ronald Fisher (1890-1962), em seus tra-
balhos, iniciou a estatstica como mtodo cientfico. Desta forma, o
trabalho do estatstico passou a ser o de ajudar a planejar a obteno
de dados, interpretar e analisar os dados obtidos e apresentar os resul-
tados de maneira a facilitar a tomada de decises razoveis.
Didaticamente, podemos dividir a estatstica em duas partes: a
estatstica descritiva e a inferncia estatstica.
A estatstica descritiva preocupa-se com a forma pela qual pode-
mos apresentar um conjunto de dados em tabelas e grficos, e tambm
resumir as informaes contidas nestes dados mediante a utilizao de
medidas estatsticas. Para saber mais v ao
J a inferncia estatstica baseia-se na teoria das probabilidades site www.ibge.gov.br
para estabelecer concluses sobre todo um grupo (chamado popula-
o), quando se observou apenas uma parte (amostra) representativa
desta populao.
Uma grande quantidade de informaes importantes que auxili-
am na tomada de decises est no site do Instituto Brasileiro de Geo-
grafia e Estatstica (IBGE). Todo o clculo das estatsticas pode ser
feito por meio de calculadoras cientficas e tambm softwares estats- Uma sugesto de
ticos. As planilhas eletrnicas permitem o clculo de diversas estatsti- referncia
cas e confeco de grficos de forma mais rpida e eficiente. NEUFELD, John L.
necessrio ter em mente que a estatstica uma ferramenta Estatstica Aplicada
para o gestor ou executivo, nas respostas dos porqus de seus pro- Administrao usando
blemas que podem ser explicados por uma anlise de dados. Para ela Excel. v.1. So Paulo:
ser bem usada, necessrio conhecer os seus fundamentos e princpi- Prantice Hall, 2003
os, e acima de tudo que o gestor ou executivo desenvolva um esprito
crtico e jamais deixe de pensar. Pois fcil mentir usando a estatsti-
ca, o difcil falar a verdade sem usar a estatstica.
Atualmente, as empresas tm procurado profissionais como exe-
cutivos que tenham um nvel de conhecimento de estatstica alto, pois
este conhecimento tem feito uma diferena grande nos processos
decisrios em empresas.
Este livro ser dividido em quatro Unidades:

Unidade 1 Estatstica Descritiva (Descrio de amostras


por meio de distribuies de freqncias, e medidas de posi-
o e disperso);
Unidade 2 Probabilidades (Conceitos bsicos de probabili-
dades, variveis aleatrias uni e bidimensionais) e Distribui-
es de Probabilidades (discretas e contnuas);
Unidade 3 Amostragem (probabilstica e no probabilstica),
Distribuies Amostrais (Distribuies t de Student, qui-qua-
drado e F) e Intervalos de Confiana (mdia, proporo); e
Unidade 4 Processos Decisrios (Testes de Hipteses).
UNIDADE

1
Estatstica
Estatstica descritiva
descritiva
Curso de Graduao em Administrao a Distncia

Objetivo

Esta Unidade tem por objetivo fazer com que voc tenha condies

de descrever e apresentar os resultados de um conjunto de observaes


de forma clara, objetiva e passando o mximo de informaes possveis.

Para tal objetivo, sero abordadas as distribuies de freqncias, anlises

grficas, medidas de posio e disperso.

10
Mdulo 4

Estatstica descritiva

Qualquer conjunto de dados, tais como o tempo de uma ligao


telefnica, a velocidade de processamento de um computador, a pro-
poro de participao no mercado das empresas de um determinado
setor, suscetibilidade de empresas a uma determinada mudana no
mercado, opinio dos alunos quanto didtica de um professor, etc.,
contm informao sobre algum grupo de indivduos. As possveis
diferenas entre indivduos determinam a variao que est sempre
presente na anlise de dados.
Uma caracterstica que pode assumir diferentes valores de indi-
vduo para indivduo denominada varivel, pois de outra forma se-
ria denominada constante.
A classificao das variveis em qualitativas e quantitativas foi
apresentada na disciplina de Metodologia de Pesquisa. Caso no se
lembre, reveja o material de Metodologia de Pesquisa.
Desta forma, apenas para relembrar, como voc faria a classifi-
cao das seguintes variveis?

a) Nmero de pginas desta unidade;


b) peso dos funcionrios do setor de marketing de uma
empresa;
c) tipos de empresas em relao a adoo de determina-
da tcnica; e
d) tamanho de empresas (pequena, mdia e grande).

Respostas: a) quantitativa discreta; b) quantitativa contnua;


c) qualitativa nominal; d) qualitativa ordinal.

Os dados qualitativas so divididos em nominais e ordinais;


enquanto os dados quantitativas so divididos em discretas e
contnuas.

11
Curso de Graduao em Administrao a Distncia

GLOSSRIO Quando voc coleta os dados para uma pesquisa, estas observa-
*Dados Brutos: es so chamadas de dados brutos. Um exemplo de dados brutos
dados na forma em corresponde ao tempo em minutos que consumidores de uma determi-
que foram coletados, nada operadora de telefonia celular utilizariam em um ms (dados simu-
sem nenhum trata- lados pelo autor a partir de um caso real). Os dados foram obtidos em uma
mento.Fonte: pesquisa de mercado e apresentados na forma em que foram coletados
Lacombe (2004) (Tabela 1), por este motivo so denominados dados brutos*.
Geralmente, este tipo de dado traz pouca ou nenhuma informa-
o ao leitor, sendo necessrio organizar os dados, com o intuito de
aumentar sua capacidade de informao.

C T C T C T C T C T

1 104 9 122 17 129 25 144 33 183

2 108 10 142 18 138 26 151 34 138

3 138 11 106 19 122 27 146 35 115

4 101 12 201 20 161 28 82 36 179

5 163 13 169 21 167 29 137 37 142

6 141 14 120 22 189 30 132 38 111

7 90 15 210 23 132 31 172 39 140

8 154 16 98 24 127 32 87 40 136

Tabela 1: Tempo (T) em minutos de uso de telefone celular por consu-


GLOSSRIO midores (C) de uma determinada operadora
*Rol a mais sim-
ples organizao
numrica. a orde- Como voc pode observar na Tabela 1, a simples organizao
nao dos dados em dos dados em um rol* aumenta muito a capacidade de informao
ordem crescente ou destes. Na Tabela 2, voc pode verificar que o menor tempo observa-
decrescente.
do foi 82 minutos, e o maior, 210 minutos, o que nos fornece uma
*Amplitude Total amplitude total* de variao da ordem de 128 minutos.
corresponde dife- Outra informao que podemos obter nos dados por meio da
rena entre o maior
Tabela 2 (organizada em rol crescente) que alguns tempos, como
e o menor valor ob-
122 min, 132 min, 138 min e 142 min, foram os mais freqentes, ou
servado em um con-
junto de dados. No- seja, os mais citados na pesquisa.
taremos por A.

12
Mdulo 4

82 111 132 142 167

87 115 136 142 169

90 120 137 144 172

98 122 138 146 179

101 122 138 151 183

104 127 138 154 189

106 129 140 161 201

108 132 141 163 210

Tabela 2: Tempo em minutos de uso de telefone celular por consumido-


res de uma determinada operadora (dados em rol crescente).

Ento surge uma pergunta:


Como voc pode organizar os dados de uma forma mais efi-
ciente, na qual se possa apresentar uma quantidade maior
de informaes?

Uma maneira de organizar um conjunto de dados para voc


melhor represent-lo por meio de uma tabela de distribuio de
freqncias (tabela onde so apresentadas as freqncias de cada uma
das classes). GLOSSRIO
Distribuindo-se os dados observados em classes* e contando-se *Classes: Interva-
o nmero de observaes contidas em cada classe, obtm-se a fre- los nos quais os va-
lores da varivel
qncia de classe. Veja que a disposio tabular dos dados agrupa-
analisada so agru-
dos em classes, juntamente com as freqncias correspondentes, se
pados.
denomina distribuio de freqncias.

Por exemplo, para o caso do tempo em minutos do uso de


celulares, pode-se desejar incluir em uma nica classe todos
os indivduos que possuam tempo entre 128 e 138 minutos
assim, a classe ir variar de 128 a 138 minutos.

13
Curso de Graduao em Administrao a Distncia

Para identificar uma classe, deve-se conhecer os valores dos limites


inferior e superior da classe, que delimitam o intervalo de classe.
Neste ponto, surge uma dvida.

Indivduos que apresentem tempo exatamente iguais a 128 ou


a 138 minutos pertencem ou no a esta classe? (128 a 138)

Deste modo, surge a necessidade de definir a natureza do inter-


valo de classe, se aberto ou fechado. Portanto, podemos ter exem-
plo de notao dos diferentes tipos de intervalos: Intervalos abertos*
128 min 138 min; Intervalos fechados* 128 min ||
Este tipo de intervalo 138 min. Pode-se ter ainda intervalos mistos*, como por exemplo:
o mais utilizado. 128 min | 138 min.

GLOSSRIO
*Intervalos abertos Vamos, ento, a partir dos dados do exemplo relativo ao tem-
os limites da classe po de utilizao dos celulares, construir uma distribuio de
(inferior e superior) freqncia e ao longo deste exerccio identificar conceitos
no pertencem a ela. presentes em uma distribuio de freqncias.
*Intervalos fecha-
dos os limites de
Ento, vamos exercitar.
classe (superior e
Para elaborar uma distribuio de freqncias necessrio que
inferior) pertencem
classe em questo. primeiramente, se determine o nmero de classes (k) em que os da-
dos sero agrupados. Por questes de ordem prtica e esttica, sugere-
*Intervalos mistos
se utilizar de 5 a 20 classes. O nmero de classes (k) a ser utilizado,
um dos limites per-
tence classe, e o pode ser calculado em funo do nmero de observaes (n).
outro, no. Na pesquisa, como temos n = 40 consumidores, teremos, ento,
o nmero de classes definido por = = 6,32, e como o
, para nmero de classes inteiro, usaremos 6 classes. O arredondamento
n 100; , utilizado neste material o padro de algarismos significativos (como
para n > 100 foi aprendido no Ensino Mdio). O nmero de classes pode tambm
ser definido de uma forma arbitrria sem o uso desta regra.

14
Mdulo 4

Aps voc determinar o nmero de classes (k) em que os dados


sero agrupados, deve-se, ento, determinar a amplitude do interva-
onde:
lo de classe (c).
Para calcularmos a amplitude do intervalo de classe, vamos pri- c = amplitude de
meiramente calcular a amplitude total dos dados (A), que classe; A = amplitude
corresponde diferena entre o maior valor observado e o menor total; e k = nmero de
valor observado. No nosso caso, teremos A = 210 82 =128 mm. classes.
Com base neste valor da amplitude total (A) calculado, vamos
obter a amplitude do intervalo de classe (c), como mostrado a seguir:

Deve ficar claro para voc, que existem outros procedimentos


para determinao da amplitude do intervalo de classe que podem ser
encontrados na literatura.
Conhecida a amplitude de classes, voc deve determinar os in-
tervalos de classe. O limite inferior e o superior das classes devem ser
escolhidos de modo que o menor valor observado esteja localizado no
ponto mdio (PM) da primeira classe.
Partindo deste raciocnio, ento, o limite inferior da primeira
PM = onde:
classe ser:
LI: Limite inferior; e
Limite inf. 1 = menor valor .
LS: Limite superior
No nosso caso, temos: Limite inf. 1 = 82 = 69,2 min

Definindo, ento, o limite inferior da primeira classe, para obter-


mos as classes da nossa distribuio, basta que somemos a amplitude
do intervalo de classe a cada limite inferior.
Assim, teremos:

69,2 | 94,8 primeira classe


94,8 | 120,4 segunda classe
20,4 | 146,0 terceira classe
146,0 | 171,6 quarta classe
171,6 | 197,2 quinta classe
197,2 | 222,8 sexta classe
15
Curso de Graduao em Administrao a Distncia

Ento, voc pode obter uma tabela como a apresentada a seguir.

A freqncia absoluta (fa) corresponde ao numero de ob-


servaes que temos em uma determinada classe ou em um
determinado atributo de uma varivel qualitativa e a freqn-
cia relativa (fr) corresponde proporo do nmero de ob-
servaes em uma determinada classe em relao ao total
de observaes que temos.
Esta freqncia pode ser expressa em termos porcentuais. Para
isto, basta multiplicar a freqncia relativa obtida por 100.

Classes (mm) Freqncia

69,2 | 94,8 ?

94,8 | 120,4 ?

120,4 | 146,0 ?

146,0 | 171,6 ?

171,6 | 197,2 ?

197,2 | 222,8 ?

Total

Tabela 3: Distribuio de freqncias do tempo em minutos de uso de


telefone celular por consumidores de uma determinada operadora

Na tabela, aparece uma nova denominao chamada freqn-


cia. Podem ter freqncias chamadas de freqncia absoluta (fa),
freqncia relativa (fr) e freqncia acumulada (discutida posterior-
mente).
O clculo da freqncia relativa obtido por meio da seguinte
expresso:
, com fai = freqncia absoluta da classe i.

Apresentando os dados na forma de distribuio de freqncia,


voc consegue sintetizar as informaes contidas neles, alm de facili-

16
Mdulo 4

tar sua visualizao. Na Tabela apresentada a seguir, temos as freqn-


cias (fa e fr) relacionadas ao tempo de utilizao do aparelho celular.

Classes (mm) fa (consumidores) fr (proporo de consumidores)

69,2 | 94,8 3 0,075

94,8 | 120,4 8 0,200

120,4 | 146,0 16 0,400

146,0 | 171,6 7 0,175

171,6 | 197,2 4 0,100

197,2 | 222,8 2 0,050

Total 40 1,000

Tabela 4: Distribuio de freqncias do tempo em minutos de uso de


telefone celular por consumidores de uma determinada operadora

Como ficaria, ento, a interpretao da distribuio de freqncias?


Pode-se verificar claramente na Tabela 4 que os tempos de utili-
zao do celular das 40 pessoas avaliadas em questo esto concen-
trados nas classes segunda, terceira e quarta, decrescendo em direo
s classes do incio e do fim da tabela. A apresentao dos dados em
forma de distribuio de freqncia facilita ainda o clculo manual de
vrias medidas estatsticas de interesse e sua apresentao grfica.
GLOSSRIO
Alm das freqncias absolutas e relativas, muitas vezes pode-
*Freqncia Acu-
se estar interessado na quantidade de observaes que existe acima ou
mulada Freqn-
abaixo de um determinado ponto na distribuio. cia Acumulada
Desta forma, podemos trabalhar com a freqncia acumulada*. corresponde soma
A ttulo de ilustrao, voc pode visualizar nas Tabelas 4 e 5, da freqncia da-
respectivamente, as freqncias acumuladas para cima e para baixo quela classe s fre-
dos tempos de utilizao das 40 pessoas avaliadas na pesquisa. A fre- qncias de todas as
qncia acumulada apresentada na Tabela 4 pode ser obtida da se- classes abaixo dela.
guinte forma: abaixo do limite superior da primeira classe, temos trs
pessoas que esto presentes nesta classe, como pode ser visto na Ta-
bela 3 da distribuio de freqncias absoluta. Quando consideramos
a segunda classe, a freqncia acumulada corresponde ao nmero de

17
Curso de Graduao em Administrao a Distncia

pessoas que temos abaixo do limite superior desta classe, ou seja, as


oito pessoas da segunda classe mais as trs pessoas da primeira classe,
totalizando 11 pessoas abaixo de 120,4 minutos. Para as outras clas-
ses, o raciocnio semelhante.

Tempo (mim) Freq. acumulada Freq. acumulada (relativa)

69,2 | 94,8 0 0,000

94,8 | 120,4 3 0,075

120,4 | 146,0 11 0,275

146,0 | 171,6 27 0,675

171,6 | 197,2 34 0,850

197,2 | 222,8 38 0,950

Total 40 1,000

Tabela 5: Distribuio de freqncia acumulada do tempo em minutos


de uso de telefone celular por consumidores de uma determinada
operadora

Um bom exemplo de aplicao das distribuies de freqncias


acumuladas corresponde identificao de uma determinada freqn-
cia abaixo ou acima de um determinado valor que no corresponde ao
limite superior ou inferior de uma classe qualquer.
Podemos, ento, querer verificar qual a porcentagem de pessoas
que utilizam o celular por um tempo inferior a 146 minutos, e para
isto, basta consultar diretamente a Tabela 4 e verificar a freqncia
acumulada abaixo deste valor (6,75%), pois o valor 146 minutos
corresponde a um dos limites de classe apresentados nesta tabela.

E se voc quiser saber a proporo de pessoas que utilizam


o celular por menos de 150 minutos?

Para podermos obter esta freqncia, necessrio que venha-


mos a pressupor que os tempos de utilizao estejam uniformemente

18
Mdulo 4

distribudos dentro das classes. O clculo baseado nos dados da Ta-


bela 4 e so apresentados a seguir.

Freq. acumulada relativa abaixo da classe imediatamente


inferior a 150 (abaixo de 146) = 0,675; e
Freq. acumulada relativa abaixo da classe imediatamente
superior a 150 (abaixo de 171,6) = 0,850;

Proporo de consumidores com tempo de uso abaixo de


146,0 min = 0,675
Proporo de consumidores com tempo de uso abaixo de
171,6 min = 0,850
Freq. entre 146,0 e 171,6 min = 0,175
de 146,0 a 171,6 min so 25,6 min
de 146,0 a 150,0 min so 4,0 min
assim,
(diferena) no tempo variao (diferena) na proporo
25,6 min -------------------------------------------- 0,175
4,0 min ------------------------------------------------- x

Portanto, fazendo o clculo da regra de trs apresentada anteri-


ormente, teremos o valor de x.

Portanto, como abaixo de 140,0 min existe uma proporo


de 0,675 e entre 140,0 e 150 min existe uma proporo de
0,0273, conclui-se, ento, que abaixo de 150 min existe uma
proporo de 0,7023 (0,675 + 0,0273). Em termos
porcentuais, isto corresponde a 70,23% dos consumidores.

19
Curso de Graduao em Administrao a Distncia

importante ressaltar que este resultado aproximado, devido


perda de informao pelo fato de a tabela ser intervalar, ou seja, as
classes esto em intervalos.
Quando voc trabalha com variveis qualitativas, os atributos
so as variaes nominativas da varivel. A construo da tabela con-
siste em contar as ocorrncias de cada atributo. O resultado da conta-
gem define a freqncia absoluta do atributo. Para podermos entender
isto, tomemos como exemplo uma pesquisa na qual se procurou avali-
ar o nmero de pessoas de diferentes sexos em uma determinada em-
presa. Estes resultados so apresentados na Tabela 6.

Sexo fa fr

Masculino 20 0,40

Feminino 30 0,60

Total 50 1,00

Tabela 6: Distribuio de freqncias do nmero de


funcionrios em relao ao seu sexo em 2006

Tomando, por exemplo, o caso de uma varivel aleatria dis-


creta (conceito visto em Metodologia de Pesquisa), realizou-se no
SAC (Servio de Atendimento ao Consumidor) de uma empresa um
estudo referente ao nmero de reclamaes (N.R.) atendidas diaria-
mente, durante um certo ms, obtendo os seguintes resultados:

N.R. Dia N.R. Dia N.R. Dia N.R. Dia N.R.

0 7 1 13 0 19 1 25 0

2 8 2 14 0 20 0 26 3

1 9 2 15 1 21 0 27 4

5 10 3 16 2 22 2 28 0

3 11 0 17 3 23 0 29 2

2 12 3 18 5 24 4 30 1

20
Mdulo 4

Dispondo estes dados em um rol (crescente), tem-se:

000000000111112222222333334455

Podemos, ento, apresentar a seguir estes dados em uma distri-


buio de freqncias. Neste caso, no necessrio definir intervalos
de classes, porque a variao dos valores pequena.

Numero de reclamaes por dia Nmero de dias (fa) Freq. Relativa

0 9 0.3

1 5 0.17

2 7 0.23

3 5 0.17

4 2 0.07

5 2 0.07

Total 30 1

Tabela 7: Nmero de reclamaes atendidas diariamente,


durante certo ms

Verificamos que os valores da varivel discreta correspondem a


cada uma das classes.
Surge, ento, uma pergunta:

As tabelas de distribuio de freqncias so a nica forma


que voc tem de apresentar um conjunto de dados?

Para responder a esta pergunta, vamos falar um pouco sobre al-


gumas formas de representao grfica de tabelas de freqncia.
Logicamente, dependendo do tipo de varivel, temos um grfico mais
adequado. Os diferentes tipos de grfico, (histogramas, polgonos de
freqncia, ogivas, grficos de setores, pictogramas e outros) permi-
tem uma melhor visualizao de resultados. Estes grficos podem ser
obtidos utilizando planilhas eletrnicas, como por exemplo, o Excel.

21
Curso de Graduao em Administrao a Distncia

GLOSSRIO Os histogramas* so grficos utilizados para representar tabe-


*histograma las intervalares.
Histogramas: so
constitudos por um
conjunto de retn-
gulos, com as bases
assentadas sobre um
eixo horizontal, ten-
do o centro da mes-
ma no ponto mdio
da classe que repre-
senta, e cuja altura
proporcional fre-
qncia da classe.
Figura 1: Histograma representativo da distribuio de
*Polgono de fre- freqncias do tempo em minutos de uso de telefone celular
qncias um gr- por consumidores de uma determinada operadora
fico de anlise no
qual as freqncias
das classes so loca- J o polgono de freqncia*, voc pode obter pela simples
lizadas sobre per-
unio dos pontos mdios dos topos dos retngulos de um histograma.
pendiculares levan-
Completa-se o polgono unindo as extremidades da linha que ligam os
tadas nos pontos
mdios das classes. pontos representativos das freqncias de classe aos pontos mdios
das classes, imediatamente, anterior e posterior s classes extremas,
que tm freqncia nula.

Figura 2: Polgono de Freqncias do tempo em minutos de uso de telefone celular


por consumidores de uma determinada operadora

22
Mdulo 4

Quando temos uma tabela de varivel qualitativa, um tipo de


grfico adequado para apresentar os resultados corresponde ao grfi-
co de setores, tambm popularmente conhecido como grfico tipo
pizza. Sua construo simples: sabe-se que o ngulo de 360 equiva-
le a 100% da rea da circunferncia; assim, para obter-se o ngulo do
setor cuja rea representa uma determinada freqncia, basta resolver
uma regra de trs simples, como a apresentada a seguir:

360 ---------------- 100%


x ------------------- Freq. Relativa (Porcentual)

Figura 3: Grfico do sexo de pessoas que trabalham em


uma determinada empresa

Os grficos chamados de ogivas correspondem a um polgono


de freqncias acumuladas, nas quais estas freqncias so localiza-
das sobre perpendiculares levantadas nos limites inferiores ou superi-
ores das classes, dependendo se a ogiva representar as freqncias
acumuladas.

23
Curso de Graduao em Administrao a Distncia

Figura 4: Ogiva "abaixo de" do tempo em minutos que consumidores


de uma determinada operadora de telefonia celular utilizariam em um
ms se houvesse uma reduo na tarifa de 20%

Aps o estudo da construo de distribuies de freqncias e


grficos que as representam, voc deve ser capaz de organizar um
conjunto de dados, por meio de uma distribuio de freqncias (ab-
soluta, relativa, e acumuladas) e represent-lo graficamente.

Saiba mais...
Visite o site de como usar a planilha Cal, do pacote
OpenOffice, nas estatsticas descritivas, em: http://www2.ufpa.br/
dicas/open/oo-ind.htm

Vamos, ento, fazer um exerccio para fixar os conhecimentos


adquiridos. (As respostas esto no final do livro.)

24
Mdulo 4

Exerccio 1: tem-se a seguir o tempo em minutos de reunies


em um setor de uma empresa.

45 51 50 58
50 44 46 57
42 41 60 58
41 50 54 60
52 46 52 51

a) Construa a distribuio de freqncias absoluta, relativa e


acumulada; e
b) Determine o nmero de reunies em que o tempo foi me-
nor do que 50, a partir da distribuio de freqncias.

-
Medidas de posio
GLOSSRIO
*A mdia aritmti-
As medidas de posio ou de tendncia central constituem uma ca, ou simplesmen-
forma mais sinttica de apresentar os resultados contidos nos dados te mdia de um con-
observados, pois representam um valor central, em torno do qual os junto de n observa-
dados se concentram. As medidas de tendncia central mais emprega- es, x1, x2,...,xn
definida como:
das so a mdia, a mediana e a moda.
A mdia aritmtica* a mais usada das trs medidas de posi-
o mencionadas, por ser a mais comum e compreensvel delas, bem
como pela relativa simplicidade do seu clculo, alm de prestar-se bem O somatrio ()
ao tratamento algbrico. corresponde soma
Considerando o caso do nmero de reclamaes em um SAC de todos os valores
(ver em distribuies de freqncia), se voc somar todos os valores obtidos.
do nmero de reclamaes e dividir pelo nmero de dias, voc ter
ento a mdia aritmtica ( ) do nmero de reclamaes.
Ento, o valor obtido ser: = 1,73 reclamaes por dia.

25
Curso de Graduao em Administrao a Distncia

Voc pode interpretar este resultado da mdia como sendo o


nmero de reclamaes mdio por dia, que de 1,73, po-
dendo ocorrer dias em que o nmero de reclamaes pode
ser maior ou menor que o valor mdio encontrado.

Portanto, de uma forma mais geral, podemos interpretar a mdia


GLOSSRIO como sendo um valor tpico do conjunto de dados. Pode ser um valor
*Hiptese Tabular que no pertence ao conjunto de dados.
Bsica todas as Se os dados estiverem agrupados na forma de uma distribuio
observaes conti- de freqncia em classes, lana-se mo da Hiptese Tabular Bsica*
das numa classe so para o clculo da mdia.
consideradas iguais Ento, voc vai calcular a mdia por meio da seguinte expresso:
ao ponto mdio da
classe.

sendo xi: ponto mdio da classe i; fai: freqncia absoluta da classe i;


fri : freqncia relativa da classe i.

Considerando o caso do tempo de uso em minutos do celular


(ver no item distribuies de freqncias), a mdia ser dada por:

O valor de 82 apresentado na expresso corresponde ao ponto


mdio da primeira classe, o qual foi obtido pela soma dos limites supe-
rior e inferior, dividido por dois, ou seja, a mdia aritmtica. Os pon-
tos mdios das outras classes so obtidos de forma similar.

26
Mdulo 4

Existem outros tipos de mdia que podem ser utilizados, como


por exemplo, mdia ponderada (utilizada quando existe algum fator
de ponderao), mdia geomtrica (quando os dados apresentam uma
distribuio que no simtrica) e outras.
s vezes, associam-se s observaes x1,x 2,...,xn determinadas
ponderaes ou pesos w1,w2,...,wn, que dependem da importncia atri-
buda a cada uma das observaes; neste caso, a mdia ponderada
dada por:

Como exemplo, voc pode considerar um processo de avaliao


de um funcionrio em trs etapas. Um funcionrio apresentou as se-
guintes notas durante a avaliao: 1 etapa = 90; 2 etapa = 70; 3 etapa
= 85, e os pesos de cada etapa so 1, 1 e 3, respectivamente. Qual o
score mdio final do funcionrio?

Outro tipo de mdia corresponde geomtrica (Mg). Ela cal-


culada pela raiz n-sima do produto de um conjunto de n observaes,
x1,x2,...,xn, associadas s freqncias absolutas f1,f2,..., fn, e, respecti-
vamente, dada por:

Este tipo de mdia, voc vai trabalhar na disciplina de Ma-


temtica Financeira.
Em algumas situaes, voc ver que necessria a informao
do nmero de observaes que mais ocorre em um conjunto de dados.

27
Curso de Graduao em Administrao a Distncia

No caso do nmero de reclamaes no SAC, verifica-se que o que


mais ocorre zero, ou seja, em vrios dias no ocorre nenhuma recla-
mao. Assim, podemos, ento, definir a moda (Mo) como sendo o
valor em um conjunto de dados que ocorre com maior freqn-
cia. Um conjunto de dados pode ser unimodal (uma moda) ou amodal
(no possuir moda, pois no existe nenhum valor que ocorre com mai-
or freqncia) ou multimodal (possui mais de uma moda).
Quando os dados no esto em intervalos de classes, basta olhar
o valor que ocorre com maior freqncia.
Para dados agrupados em intervalos de classes, voc pode cal-
cular a moda por meio do mtodo de Czuber, que se baseia na influn-
cia das classes adjacente na moda, deslocando-se no sentido da classe
de maior freqncia. A expresso que voc utilizar :

onde:
Li: limite inferior da classe modal;
d1: diferena entre a freqncia da classe modal e a imediata-
mente anterior;
d2: diferena entre a freqncia da classe modal e a imediata-
mente posterior; e
c: amplitude da classe modal.
No caso do tempo de uso de aparelhos celulares (ver a tabela no
item distribuio de freqncias), teremos que a classe modal a ter-
ceira, pois apresenta maior freqncia. Utilizando a expresso mostra-
da anteriormente, teremos:

Uma caracterstica importante da moda que ela no afetada


pelos valores extremos da distribuio, desde que estes valores no
constituam a classe modal.

28
Mdulo 4

Desta forma, a moda deve ser utilizada quando desejamos obter


uma medida rpida e aproximada de posio ou quando a medida deva
ser o valor mais freqente da distribuio.
Outra medida de posio que voc pode utilizar a mediana (Md).

Em um conjunto de valores dispostos segundo uma ordem


(crescente ou decrescente), o valor situado de tal forma no
conjunto que o separa em dois subconjuntos de mesmo n-
mero de elementos, ou seja, 50% dos dados so superiores
mediana, e 50% so inferiores.

O smbolo da mediana dado por Md ou . A posio da medi-


ana dada por meio da expresso: E (elemento central) = (n+1) / 2.
Considerando um conjunto de dados com nmero mpar de ele-
mentos como (1, 2, 5, 9, 10, 12, 13), a posio da mediana ser dada
por (7 + 1)/2 = 4 posio. Portanto, a partir dos dados ordenados, o
nmero que se encontra na 4 posio o 9, e assim a mediana ser
igual a 9. (Temos trs valores abaixo e trs valores acima ou 50%
acima da mediana, e 50% abaixo)
Caso o nmero de elementos do conjunto de dados for par, como
por exemplo, (1, 2, 6, 8, 9, 12, 11, 13), encontra-se a posio da medi-
ana (( 8 + 1)/2 = 4,5 posio). Como a posio 4,5 est entre a 4 e a
5 posio, calcula-se a mdia entre os valores que ocupam estas posi-
es. O valor encontrado de 8,5 corresponde mediana.
Quando os dados esto agrupados na mediana devemos encon-
trar a classe mediana.
Se os dados esto agrupados em intervalos de classe, como no
caso do tempo de utilizao do telefone, utilizaremos a seguinte ex-
presso:

29
Curso de Graduao em Administrao a Distncia

onde: li: limite inferior da classe mediana; n: nmero total de elemen-


tos; fantac: freqncia acumulada anterior classe mediana; fmed: fre-
qncia absoluta da classe mediana e a amplitude da classe mediana.
Portanto, resolvendo o caso do tempo de utilizao dos celula-
res, teremos que a posio da mediana ser dada por E = 40/2 = 20
elemento, o qual est na terceira classe (120,4 | 146), que corresponde
classe mediana.

Em um conjunto de dados, a mediana, a moda e a mdia no


necessariamente devem apresentar o mesmo valor. Uma informao
importante de que a mediana no influenciada pelos valores extre-
mos. Comparando os resultados encontrados para uma amostra em
relao s medidas de posio estudadas e verificando a inter-relao
entre elas, voc pode concluir que seus valores podem nos dar um
indicativo da natureza da distribuio dos dados, em funo das re-
gras definidas a seguir:

Outras medidas de posio denominadas separatrizes sero de-


finidas a seguir.
A principal caracterstica das medidas separatrizes consiste na
separao da srie em partes iguais que apresentam o mesmo nmero
de valores.
As principais so os quartis, decis e percentis.
Os quartis so valores de um conjunto de dados ordenados, que
os dividem em quatro partes iguais. necessrio, portanto, trs quartis

30
Mdulo 4

(Q1, Q2 e Q3) para dividir um conjunto de dados ordenados em quatro


partes iguais.
Q1 : deixa 25% dos elementos abaixo dele.
Q2 : deixa 50% dos elementos abaixo dele e coincide com a
mediana.
Q3 : deixa 75% dos elementos abaixo dele.

A figura abaixo mostra bem o quartis:

Se considerarmos o exemplo do nmero de reclamaes por dia


em um SAC, teremos de forma semelhante a figura anterior:

Para valores no tabelados, pode ser dito que o primeiro quartil


pode ser obtido como a mediana da primeira metade dos dados, e para o
terceiro quartil, como a mediana da segunda metade. Para dados tabela-
dos, a frmula da mediana pode ser adaptada para os demais quartis.

Medidas de disperso

Como foi visto anteriormente, podemos sintetizar um conjunto


de observaes em alguns valores representativos como mdia, medi-
ana, moda e quartis. Em vrias situaes, torna-se necessrio visualizar
como os dados esto dispersos. Tomando como exemplo vrias em-
presas que apresentem salrios mdios iguais, podemos concluir, en-
to, que a contribuio social (% do salrio) ser a mesma? Somente

31
Curso de Graduao em Administrao a Distncia

com base no salrio mdio, sim, mas estaramos chegando a uma con-
cluso errada. A variao em termos de faixas salariais pode ser dife-
rente, apesar de apresentarem a mesma mdia. Pensando no que foi
dito anteriormente, considere o valor (em reais) ganho por dia de trs
grupos de empregados (A: 70, 70, 70, 70, 70; B: 50, 60, 70, 80, 90; C:
5, 15, 50, 120, 160).
Podemos verificar que, apesar de apresentarem a mesma mdia
(70), os trs grupos apresentam comportamento diferenciado, pois o
grupo A o mais homogneo, e o grupo C o que apresenta maior
variao de ganho por dia. Portanto, devemos sempre inserir junto a
uma medida de posio uma medida que avalie esta distribuio, ou
seja, a variabilidade de um conjunto de dados. Portanto, quanto maior
a variabilidade, maior ser a disperso das observaes.
Uma primeira medida de disperso que vamos comentar a
O termo amplitude amplitude total. No caso dos ganhos dirios, podemos obter os se-
total foi visto anterior- guintes resultados:
mente na construo
de uma distribuio de AA = 70 70 = 0 A B = 90 50 = 40 AC = 160 5 = 155
freqncia em classes.
Verificamos, ento, que o grupo C o que apresenta maior vari-
Relembrando, a
abilidade, e que o grupo A corresponde ao de menor variabilidade.
diferena entre o
Deste modo, o grupo C corresponde quele que teve maior vari-
maior e o menor valor
abilidade em torno da mdia.
observados.
No caso de dados agrupados, a amplitude total calculada por
meio da diferena entre o ponto mdio da ltima classe e o ponto m-
dio da primeira classe.
A amplitude total tem a desvantagem de s levar em conta os
dois valores extremos, por isso apenas uma indicao aproximada
da disperso. Outra desvantagem que a amplitude total apresenta
muita variao de uma amostra para outra, mesmo que ambas sejam
extradas da mesma populao.
Portanto, voc deve trabalhar com uma medida que leve em con-
siderao todas as observaes. Desta forma, podemos querer verifi-
car o quanto um conjunto de observaes est mais prximo ou mais
distante de uma medida, que no caso ser a mdia. Ento, voc pode

32
Mdulo 4

calcular o desvio de cada valor em relao mdia ( ), e se


fizermos o somatrio destes desvios, o resultado ser igual a zero. Se
voc elevar este desvio ao quadrado e somar, teremos o que chama-
mos de soma de quadrado dos desvios. Dividindo este somatrio pelo
total de observaes, teremos uma idia da disperso das observaes
em relao mdia. Esta medida que acabamos de visualizar de forma
intuitiva corresponde varincia. Portanto, voc pode concluir que a
varincia sempre assumir valores positivos.

Quando o nosso interesse o de tirar inferncias vlidas para


toda a populao a partir de uma amostra (poro repre-
sentativa da populao), deve-se trocar na frmula da
varincia N por n 1, onde:
N corresponde ao tamanho da populao; e
n corresponde ao tamanho da amostra utilizada.

As expresses para clculo das varincias populacional e amostral


so apresentadas a seguir.

Quando temos os dados agrupados em intervalos de classes, o xi


corresponde ao ponto mdio da classe, e fi freqncia da classe.
Como a varincia calculada a partir dos quadrados dos desvi-
os, ela um nmero que apresenta a unidade elevada ao quadrado em
relao varivel que no est elevada ao quadrado; isto se torna um
inconveniente em termos de interpretao do resultado. Por isso, defi-
niu-se uma nova medida, o desvio-padro, que a raiz quadrada da
varincia, com mais utilidade e interpretao prticas, representada por

33
Curso de Graduao em Administrao a Distncia

s ou . A varincia uma medida que tem pouca utilidade na Estats-


tica Descritiva, mas ser extremamente importante na Inferncia Esta-
tstica e em combinaes de amostras. Tambm importante frisar
que, na grande maioria das situaes, trabalhamos com amostras, en-
to devemos utilizar o desvio-padro amostral.
No caso dos ganhos dirios, calculando a varincia de cada um
dos grupos que correspondem a uma amostra, encontramos os seguin-
tes resultados:

sA = 0 reais; sB = 15,81 reais; sC=67,54 reais.

O desvio-padro, quando analisado isoladamente, no d mar-


gem a muitas concluses. Por exemplo, para uma distribuio cuja
mdia 300, um desvio-padro de 2 unidades pequeno, mas para
uma distribuio cuja mdia 20, ele j no to pequeno.

Importante!
Condies para se usar o desvio-padro ou varincia para com-
parar a variabilidade entre grupos:

mesmo nmero de observaes;


mesma unidade; e
mesma mdia.

Alm disso, se quisermos comparar duas ou mais amostras de


valores expressas em unidades diferentes, no poder ser possvel fa-
zer a comparao por meio do desvio-padro, pois ele expresso na
mesma unidade dos dados. Tambm necessrio que os conjuntos de
observaes tenham o mesmo tamanho. Podemos, ento, considerar a
situao na qual se avaliou o custo indireto de fabricao (CIF) de um
produto em reais e o tempo gasto em uma mquina para fabricao
deste produto em segundos.

x S

CIF 175 reais 5 reais

Tempo 68 segundos 2 segundos

34
Mdulo 4

A princpio, voc poderia concluir que o CIF apresenta maior


variabilidade. Entretanto, as condies citadas anteriormente deveriam
ser satisfeitas para que se pudesse utilizar o desvio-padro para compa-
rar a variabilidade. Como as condies no so satisfeitas, devemos ten-
tar expressar a disperso dos dados em torno da mdia, em termos
porcentuais. Ento, utilizaremos uma medida estatstica chamada de
coeficiente de variao (CV). O coeficiente ser dado por meio da ex-
presso:
, onde s e foram definidos anteriormente

Para a situao do CIF e tempo, teremos:

Portanto, nesse grupo de indivduos, o tempo de horas, mquina


apresenta maior disperso do que o custo indireto de fabricao (CIF),
mudando, assim, a concluso anterior.
Ao final desta parte de medidas de posio e disperso, voc
deve ser capaz de calcular as medidas de posio e disperso, e
interpret-las.
Caso no consiga, voc deve voltar ao texto e fixar melhor os
conceitos.
Seguem abaixo exerccios para fixao dos conhecimentos ad-
quiridos nos assuntos de medida de posio e de disperso. Voc deve
resolver todos eles.

Exerccio 2: a tabela abaixo apresenta uma distribuio de fre-


qncias das reas de 400 lotes:
A partir da tabela acima, calcule:

35
Curso de Graduao em Administrao a Distncia

reas (m2) N de lotes

300 | 400 14

400 | 500 46

500 | 600 58

600 | 700 76

700 | 800 68

800 | 900 62

900 | 1000 48

1000 | 1100 22

1100 | 1200 6

a) mdia, mediana e moda;


b) desvio padro e coeficiente de variao;
c) o ponto mdio da stima classe;
d) a amplitude do intervalo da segunda classe;
e) a freqncia relativa da sexta classe;
f) a freqncia acumulada da quinta classe;
g) o n de lotes cuja rea no atinge 700 m2;
h) o n de lotes cuja rea atinge e ultrapassa 800 m2; e
i) a classe do 72 lote.

Exerccio 3: os dez funcionrios de uma pequena empresa rece-


beram os seguintes salrios, em reais:

230, 210, 100, 140, 160, 120, 390, 450, 100 e 200

Calcule as medidas de posio e disperso em relao aos salrios

36
Mdulo 4

Exerccio 4: uma loja vende cinco produtos bsicos A, B, C, D


e E. O lucro por unidade comercializada destes produtos vale, res-
pectivamente $ 200,00; $ 300,00; $ 500,00; $ 1.000,00; $ 5.000,00. A
loja vendeu em determinado ms 20; 30; 20; 10; 5 unidades, respectiva-
mente. Qual foi o lucro mdio por unidade comercializada por esta loja?

Exerccio 5: uma empresa tem duas filiais praticamente idnticas


quanto s suas caractersticas funcionais. Um levantamento sobre os
salrios dos empregados dessas filiais resultou nos seguintes valores:

Filial A: xA = 400 e SA = 20
Filial B: xB = 500 e SB = 25

Podemos afirmar que as duas filiais apresentam a mesma disperso?

Saiba mais...
Sobre clculo de mdias e funes em planilhas, visite o site:
http://www.juliobattisti.com.br/tutoriais/celsonunes/
openoffice007.asp
Mais exerccios referentes ao assunto esto no site:
http://www.famat.ufu.br/prof/marcelo/exercicios.htm

37
UNIDADE

2
Introduo
Introduo aa probabilidades
probabilidades
Curso de Graduao em Administrao a Distncia

40
Mdulo 4

Introduo a probabilidades

Quando estamos falando de probabilidade, queremos identificar


a chance de ocorrncia de um determinado resultado de interesse, em
situaes nas quais no possvel calcular com exatido o valor real
do evento. Desta forma, trabalhamos com chances ou probabilidades.
Uma situao, para exemplificarmos este fato, est associada
seguinte pergunta: meu vendedor poder cumprir sua meta de venda
na semana que vem? O espao amostral* simbolizado por S ou
nesta situao ser atinge a meta e no atinge a meta. Para calcular a
GLOSSRIO
probabilidade de cumprir a meta, voc pode usar a intuio (subjeti-
*Espao amostral
vo) ou usar a freqncia relativa das ltimas dez semanas em que o
conjunto de possibi-
vendedor esteve trabalhando (objetivo).
lidades, ou seja, os
Portanto, para calcularmos uma probabilidade, necessrio que possveis resultados
tenhamos um experimento aleatrio*, que apresenta as seguintes ca- associados a um ex-
ractersticas: a) cada experimento pode ser repetido indefinidamente perimento aleatrio.
sob as mesmas condies (n); b) no se conhece a priori o resultado *Experimento alea-
do experimento, mas podem-se descrever todos os possveis resulta- trio qualquer pro-
dos; e c) quando o experimento for repetido um grande nmero de cesso que venha a
vezes, surgir uma regularidade do resultado, isto , haver uma esta- gerar um resultado
incerto ou casual.
bilidade da frao (freqncia relativa) da ocorrncia de um par-
ticular resultado, onde r corresponde ao nmero de vezes que um de-
terminado resultado aconteceu.
Nos experimentos ou situaes mencionadas, voc pode notar
que a incerteza sempre est presente, o que quer dizer que, se estes
experimentos forem repetidos em idnticas condies, no se pode
determinar qual o resultado ocorrer.
A incerteza est associada chance de ocorrncia que atribu-
mos ao resultado de interesse.
Consideremos, como exemplo, os funcionrios que trabalham
no setor de marketing de uma determinada empresa. Sabe-se que nes-

41
Curso de Graduao em Administrao a Distncia

te setor trabalham seis funcionrios. Um experimento ao acaso seria a


escolha aleatria de um dos funcionrios. Podemos considerar como
evento de interesse o sexo do funcionrio escolhido. Voc, ento, vai
aplicar os conceitos vistos acima e novos conceitos associados a pro-
babilidades.

GLOSSRIO Conjunto de possibilidades (Espao amostral): S = {Carlos,


Jackeline, Giulyana, Girlene, Cludio, Larissa}.
*Evento qualquer
subconjunto de um Conjunto de possibilidades favorveis (Funcionrios do
espao amostral. sexo masculino que correspondem a um evento*): {Carlos,
Cludio}.
Qual a probabilidade de escolher um funcionrio ao acaso e
ele ser do sexo masculino? (Sugesto: verificar o nmero de
funcionrios do sexo masculino).

Dados trs eventos, A (funcionrio ser do sexo feminino) e B


(seu nome comea com a letra G) e C (seu nome comea com a letra
C) dos funcionrios do setor de marketing apresentado anteriormente:

A B o evento em que A e B ocorrem simultaneamente:


{Giulyana, Girlene}.
A C o evento em que A ocorre ou C ocorre (ou ambos):
{Carlos, Jackeline, Giulyana, Girlene, Cludio, Larissa}.
A o evento em que A no ocorre (complementar de A):
{Carlos, Claudio}.

Dois eventos so considerados mutuamente exclusivos, se a


ocorrncia de um exclui a ocorrncia do outro.
Voc pode, ento, definir a probabilidade como uma funo que
atribui um nmero real aos eventos de (se A um evento de ,
P(A) a probabilidade de A), que satisfaz:

1. P() = 0, P() = 1

42
Mdulo 4

2. 0 P(A) 1
3. Regra da soma: dados dois eventos mutuamente exclusi-
vos A e C de ,
P(AC) = P(A) + P(C)

O smbolo corresponde ocorrncia de um evento impos-


svel, ou seja, que no pode ocorrer no espao amostral con-
siderado.

OBS: Caso os eventos no sejam mutuamente exclusivos, na


regra da soma, devemos considerar que a interseco ser contada duas
vezes. Ento, devemos retirar na regra da soma a interseco.
P(AB) = P(A) + P(B) P(AB)
Considerando os eventos A, B e C definidos anteriormente, cal-
cule as probabilidades mencionadas na pgina anterior para fixao
dos conceitos.
Para inserirmos outros conceitos de probabilidade, voc deve
considerar os dados a seguir referentes ao acesso e cadastro em dois
sites, por pessoas em uma determinada regio. O site 1 segue o padro
normal, enquanto o site 2 corresponde a uma nova proposta de apre-
sentao de informaes.

Acessa e cadastra Acessa e no


no site cadastra no site Total

Site 1 39.577 8.672 48.249

Site 2 46.304 7.297 53.601

Total 85.881 15.969 101.850

Um acesso a um dos sites escolhido ao acaso. Podemos consi-


derar, ento, que o nosso espao amostral () corresponder ao con-
junto de 101.850 acessos.
H os seguintes eventos de interesse:

S1 = nmero de acessos feitos no site 1.

43
Curso de Graduao em Administrao a Distncia

S2 = nmero de acessos feitos no site 2.


AC = o site acessado, e o cadastro feito pelo internauta.
S1 AC = o internauta acessa o site 1 e faz o cadastro no site.
S1 AC = o internauta acessa o site 1 ou faz o cadastro no site.

Voc pode obter, ento, algumas probabilidades como:

S2 = S1 P(S2) = P( S1) = 1 P( S1) = 1 0,473 = 0,527


P(S1 AC) = P(S1) + P(AC) P(S1 AC)
= 0,473 + 0,843 0,388
= 0,928

Se voc relembrar a interpretao da probabilidade, consideran-


do A um evento de um espao amostral associado a um experimento
aleatrio, voc pode ter duas formas de atribuir probabilidades aos
eventos de um espao amostral:

P{A} uma intuio (subjetiva) que se deposita na ocorrn-


cia de A.
Interpretao freqntista (objetiva).

Quando n cresce: fn(A) se aproxima da P(A), por isso foram rea-


lizadas n repeties independentes do experimento.
No exemplo anterior, se voc souber que um acesso sorteado do
site 1, qual a probabilidade de que ocorra a efetuao do cadastro?

44
Mdulo 4

Temos uma informao parcial: o acesso do site 1.

Vamos designar a probabilidade de AC, quando se sabe que o


acesso ocorreu no site 1, que chamaremos de P(AC /S1) e denomin-
la probabilidade (condicional) de AC dado S1 (lembre-se que o
smbolo / no corresponde a uma diviso).
natural atribuirmos:

Note que:

Portanto, voc pode generalizar para dois eventos A e B quais-


quer de um experimento aleatrio. Desta forma, podemos dizer que a
probabilidade condicional de A dado B (nota-se por P (A / B)) defi-
nida como:

Podemos, ento, definir a regra do produto, ou seja, a partir da


probabilidade condicionada definida anteriormente, obteremos a cha-
mada regra do produto para a probabilidade da interseo de dois even-
tos A e B de um espao amostral:

Passe a probabilidade de ocorrncia de B na probabilidade


condicionada e multiplique pela probabilidade de ocorrn-
cia de A sabendo que B j aconteceu.

45
Curso de Graduao em Administrao a Distncia

P (A ) = P (A / ) . P (B)

Se dois eventos A e B so independentes, ento P{A / B} = P{A}


ou P{B / A} = P(B).
Deste modo, se A e B forem independentes, voc pode verificar que:

Veja esta outra situao, utilizando os conceitos de probabilida-


de condicionada e independncia de eventos. Considere a tabela a se-
guir, representativa da distribuio da renda anual de produtores ru-
rais e duas cooperativas em uma determinada regio.

Cooperativas
Faixa de renda anual (em R$1.000) A B Total

15 a 20 (R1) 70 40 110

20 a 25 (R2) 15 15 30

25 a 30 (R3) 10 20 30

30 a 35 (R4) 20 10 30

Total 115 85 200

Observando-se os dados acima, se verifica que a probabilidade


de um cooperado aleatoriamente escolhido ser:

a) da cooperativa A: P(A) = 115/200 = 0,575


b) da cooperativa B: P(B) = 85/200 = 0,425
c) de ter renda entre R$ 15.000,00 e R$ 20.000,00:
P(R1) = 110/200 = 0,550
d) da cooperativa B e ter renda entre R$ 15.000,00 e
R$ 20.000,00: P(B R1) = 40/200 = 0,20
e) ter renda entre R$ 15.000,00 e R$ 20.000,00 dado que
da cooperativa B: P(R1/B) = 40/85 = 0,4706 ou

46
Mdulo 4

Como P(R1) P(R1/B), conclui-se que os eventos cooperativa


e renda so dependentes. Para que sejam consi-
Um exemplo de aplicao dos conceitos de independncia de derados independen-
eventos pode ser visualizado por meio do lanamento de uma moeda tes, a relao de
no viciada (no existe preferncia para cara ou coroa) trs vezes. independncia deve
Considere os seguintes eventos: ser vlida para todas
as interseces presen-
A = no primeiro lanamento da moeda, sai cara, e tes na Tabela 11.
B = no segundo lanamento da moeda, sai cara.

Obs: considere C = cara e R = coroa


Verifique se verdadeira a hiptese de que os eventos A e B so
independentes. O espao amostral e os eventos so apresentados a
seguir:

= {CCC, CCR, CRC, CRR, RCC, RCR, RRC, RRR}


(A) = {CCC, CCR, CRC, CRR}
(B) = {CCC, CCR, RCC, RCR}

Os resultados que esto em negrito ocorrem no espao


amostral (8) somente duas vezes.

P(A B) = 2/8 = 1/4


P (A) = 4/8 = 1/2
P (B) = 4/8 = 1/2

Portanto,

P(A B) = P (A) . P(B) => 1/4 = 1/2 . 1/2 ou

P (A / B) = P (A) => 1/2 = 1/2

47
Curso de Graduao em Administrao a Distncia

Ento, provamos que os eventos so independentes.


Vamos resolver alguns exerccios relacionados aos concei-
tos de probabilidade vistos anteriormente. (Os resultados
esto no final do livro.)

Exerccio 1: as probabilidades de trs vendedores, A, B e C,


que trabalham independentemente, efetivarem uma venda quando abor-
dam um cliente so 2/3, 4/5 e 7/10, respectivamente. Se cada um abor-
dar um cliente, qual a probabilidade de que pelo menos um efetive a
venda?

Exerccio 2: A e B so dois mestres que j esto suficientemen-


te treinados em partidas de xadrez e jogam 120 partidas, das quais A
ganha 60, B ganha 40, e 20 terminam empatadas. A e B concordam
em jogar trs partidas. Determinar a probabilidade de:

a) A ganhar todas as trs partidas;


b) duas partidas terminarem empatadas; e
c) A e B ganharem alternadamente.

Exerccio 3: num perodo de um ms, cem funcionrios de uma


empresa que trabalha com resduos nucleares, sofrendo de determina-
da doena, foram tratados. Informaes sobre o mtodo de tratamento
aplicado a cada funcionrio e o resultado final obtido esto na tabela
abaixo:

Tratamento
A B

Cura total 24 16

Resultado Cura parcial 24 16

Morte 12 8

a) Sorteando-se aleatoriamente um desses funcionrios, de-


termine a probabilidade de que o funcionrio escolhido:

48
Mdulo 4

a1) tenha sido submetido ao tratamento A;


a2) tenha sido totalmente curado;
a3) tenha sido submetido ao tratamento A e tenha sido
parcialmente curado; e
a4) tenha sido submetido ao tratamento A ou tenha sido
parcialmente curado.

Exerccio 4: para selecionar seus funcionrios, uma empresa ofe-


rece aos candidatos um curso de treinamento durante uma semana.
Ao final, eles so submetidos a uma prova, e 25% so classificados
como bons (B), 50%, como mdios (M), e os demais 25%, como fra-
cos (F). Como medida de economia, o departamento de seleo pre-
tende substituir o treinamento por um teste contendo perguntas de co-
nhecimentos gerais e especficos. Mas, para isso, gostaria de conhecer
qual a probabilidade de um indivduo aprovado no teste ser considera-
do fraco caso fizesse o teste. De acordo com os resultados, receberam
os conceitos: aprovado (A) ou reprovado (R). Sabendo que
P(A B) = 0,20; P(A M) = 0,25 e P(A F) = 0,05; encontrar P(A/F).

Variveis aleatrias

Voc pode definir uma varivel aleatria como sendo uma fun-
o que associa valores reais aos eventos de um espao amostral, e
que pode ser discreta ou contnua.
Um exemplo de uma varivel aleatria discreta (v.a) consiste
em verificar o nmero de aes que tiveram queda em um determina-
do dia, em uma carteira composta por cinco aes diferentes. A fun-
o ser dada por:
X= nmero de aes que tiveram queda em um determinado
dia. Define uma varivel aleatria discreta, que pode assumir os va-
lores 0, 1, 2, 3, 4, 5.

49
Curso de Graduao em Administrao a Distncia

Vamos considerar agora uma situao na qual se verificou o tem-


po gasto por um vendedor para convencer um cliente a adquirir um
determinado produto. A funo ser:
Y= tempo gasto por um vendedor para convencer um cliente a
adquirir um determinado produto. Define uma varivel aleatria con-
tnua, que pode assumir infinitos valores.
Se uma varivel aleatria X pode assumir os valores x1, x2,..., xn

com probabilidades respectivamente iguais a p1, p2,..., pn, e ,

tem-se definida uma distribuio de probabilidade.

importante ressaltar que a varivel aleatria tem notao


de letra maiscula, e seus possveis valores, minsculos, como
apresentado no pargrafo anterior.

Se a varivel X em questo for discreta, sua distribuio carac-


terizada por uma funo de probabilidade (P(X=x)), que associa pro-
babilidades no nulas aos possveis valores da varivel aleatria.
Para o exemplo do nmero aes da carteira, as probabilidades
obtidas so mostradas na funo de probabilidade que corresponde
tabela abaixo.

X 0 1 2 3 4 5

P(X=x) 1/10 1/10 2/10 3/10 4/10 5/10 =1,00

Se a varivel X for contnua, somente haver interesse na proba-


bilidade de que a varivel assuma valores dentro de determinados in-
tervalos, sendo sua distribuio de probabilidades caracterizada por
uma funo densidade de probabilidade (f.d.p.), f(x), a qual dever
possuir as seguintes propriedades:

f(x) 0;

50
Mdulo 4

A rea compreendida entre os pontos a e b, da funo f(x) e


o eixo das abscissas, corresponde probabilidade da vari-
vel X assumir valores entre a e b.

Para o caso do tempo gasto para convencer um cliente a adquirir


um produto, podemos, por exemplo, ter a funo abaixo, que corresponde
a uma distribuio normal que ser vista posteriormente:

, que a distribuio normal.

A funo repartio ou distribuio acumulada, representada por


F(x), corresponde probabilidade de a varivel aleatria ser menor ou
igual a um determinado valor de x.
Se a varivel for discreta, a distribuio acumulada ser dada
por F(x) = P(X x), ou seja, voc deve somar todas as probabilidades
que se tem abaixo de um determinado valor, inclusive este.
J no caso de uma varivel contnua, o F(x) ser dado pela rea
que vai de at o ponto x a ser considerado. Portanto, teremos:
Integral de at o ponto x (visto no mdulo de Matemtica).

Agora, voc vai ver um exemplo de utilizao destes conceitos.


Seja a seguinte varivel aleatria contnua, definida pela funo
densidade de probabilidade (f.d.p):

51
Curso de Graduao em Administrao a Distncia

graficamente, tem-se:

a) Obtenha o valor de k.
Como f(x) uma fdp:

O resultado encontrado corresponde inclinao da reta,


ou seja, o quanto que a funo aumenta, quando a varivel x
acrescida de uma unidade.

b) calcular F(1).

F(1) = P(X 1) =

Para o estudo de variveis aleatrias, at este ponto, considerou-


se que o resultado do experimento em questo seria registrado como
um nico valor x. Todavia, existem casos em que h interesse por dois
resultados simultneos, como por exemplo, observar o peso e altura

52
Mdulo 4

de uma pessoa, o sexo e desempenho no trabalho, etc. Para tanto, faz-


se necessria a seguinte definio:

Sejam E um experimento aleatrio, e S o espao amostral


associado a E.
Sejam X e Y duas variveis aleatrias. Ento, (X,Y) define
uma varivel aleatria bidimensional, que pode ser discre-
ta, contnua ou mista.

O principal objetivo da anlise de variveis aleatrias


bidimensionais avaliar simultaneamente dois resultados de uma situ-
ao associando as probabilidades individuais e conjuntas.
Vamos, ento, definir probabilidades ou distribuies conjuntas
e marginais.
A distribuio conjunta a distribuio simultnea das duas va-
riveis, ou seja, a interseco das variveis e as distribuies margi-
nais so as distribuies isoladas de cada varivel. Estas distribuies
so assim chamadas por ocuparem, em uma tabela, a parte central e as
margens das tabelas, respectivamente. Voc pode visualizar este fato
na tabela apresentada na pgina seguinte.
Se (X,Y) uma varivel aleatria bidimensional discreta, sua
funo de probabilidade, representada por P(X = xi ;Y = yi) que asso-
cia um valor p(xi, yi) a cada valor do par (X,Y), deve satisfazer as
seguintes condies:

P(xi, yi) = 0

Veja a seguinte situao: uma pesquisa foi realizada para verifi-


car a existncia de relao entre a utilizao de um produto (baixa,
mdia ou alta) e o grau de instruo das pessoas (Fundamental, Mdio
e Superior). Como os resultados associam duas variveis, ento temos
uma distribuio de probabilidade de variveis aleatrias
bidimensionais. No resultado encontrado (mostrado a seguir), temos
um quadro chamada de contingncia.

53
Curso de Graduao em Administrao a Distncia

Instruo
Utilizao
Fundamental Mdio Superior Total

Alta 100 120 65 285

Mdia 350 100 20 470

Baixa 150 80 15 245

Total 600 300 100 1000

Vamos, ento, calcular o quadro das probabilidades (dividindo


cada valor por 1.000 que o tamanho da amostra utilizada.

Instruo
Utilizao
Fundamental Mdio Superior Total
Distribuio
Alta 0.100 0.120 0.065 0.285
Marginal da
Mdia 0.350 0.100 0.020 0.470 Utilizao.

Baixa 0.150 0.080 0.015 0.245

Total 0.600 0.300 0.100 1.000

Distribuio Conjun-
Distribuio Marginal
ta do Grau de Ins-
do Grau de Instruo.
truo e Utilizao.

Resolva agora estes dois exerccios e, caso tenha dvida, releia o


texto relativo a variveis aleatrias (os resultados esto no final do livro).

Exerccio 5: uma empresa tem quatro caminhes de aluguel.


Sabendo-se que o aluguel feito por dia e que a distribuio diria do
nmero de caminhes alugado a seguinte, determine:

N de caminhes alugados / dia 0 1 2 3 4

Probabilidade de alugar 0,1 0,2 0,3 0,3 0,1

a) Qual a probabilidade de alugar num dia mais de dois


caminhes?
b) Qual a probabilidade de alugar no mnimo um cami-
nho?

54
Mdulo 4

c) Qual a probabilidade de alugar no mximo dois caminhes?


d) Determine a funo de distribuio acumulada.
e) Qual o valor de F(3)? O que significa este resultado?

Exerccio 6: a proporo de lcool em um certo composto pode


ser considerada uma varivel aleatria com a seguinte funo de den-
sidade:

Calcule a probabilidade da proporo de lcool neste composto


entre 0,20 e 0,25.

Distribuies de variveis aleatrias discretas

Distribuio Uniforme Discreta

Enquadram-se aqui as distribuies em que os possveis valores


da varivel aleatria tenham todos a mesma probabilidade de ocorrn-
cia. Logo, se existem n valores possveis, cada um ter probabilidade
igual a 1/n.
Ex. Seja o lanamento de um dado e a varivel aleatria X =
face superior do dado,
tem-se que:

X 1 2 3 4 5 6

P(X=x) 1/6 1/6 1/6 1/6 1/6 1/6 =1

ou P(X=x) = 1/6
Desta forma, voc pode verificar que esta varivel segue uma
distribuio uniforme discreta, pois a varivel discreta, e todos os pos-
sveis resultados da varivel aleatria tm a mesma probabilidade (1/6).

55
Curso de Graduao em Administrao a Distncia

Distribuio de Bernoulli

Imagine uma situao na qual s podem ocorrer dois possveis


resultados, sucesso e fracasso. Veja alguns exemplos:

uma venda efetuada ou no em uma ligao de call center;


um cliente pode ser adimplente ou inadimplente;
uma pea produzida por uma cia. pode ser perfeita ou defei-
tuosa; e
um consumidor que entra numa loja pode comprar ou no
comprar um produto.

Associando-se uma varivel aleatria X aos possveis resulta-


dos do experimento, de forma que:

X= 1 se o resultado for sucesso,


X= 0 se o resultado for fracasso.

Ento, a varivel aleatria X, assim definida, tem distribuio


Est relacionado com Bernoulli, com p sendo a probabilidade de ocorrer sucesso, e
o objetivo do trabalho q = (1-p) a probabilidade de ocorrer fracasso.
a ser realizado. A funo de probabilidade da Distribuio de Bernoulli dada
por:

A mdia e a varincia sero obtidas por:

Mdia = p
Varincia = pq

Contextualizando a distribuio de Bernoulli, temos a seguinte


situao: a experincia tem mostrado que, durante as vendas de Natal,
um cliente que entra em uma determinada loja tem 60% de chance de
comprar um produto qualquer. Temos, portanto, uma probabilidade
de sucesso (o cliente adquirir um produto qualquer) de 0,6 e uma

56
Mdulo 4

probabilidade de no adquirir um produto de 0,4 (vem da diferena


q = 1-0,6).

Distribuio binomial

Para que uma situao possa se enquadrar em uma distribuio


binomial, deve atender s seguintes condies: Pense, como exemplo
de forma didtica no
so realizadas n repeties (tentativas) independentes; lanamento de uma
cada tentativa uma prova de Bernoulli (s podem ocorrer moeda 50 vezes, e
dois possveis resultados); e veja se esta situao se
a probabilidade p de sucesso em cada prova constante. enquadra nas condi-
es da distribuio
Se uma situao atende a todas as condies acima, ento a va- binomial.
rivel aleatria X = nmero de sucessos obtidos nas n tentativas ter
uma distribuio binomial, com n tentativas e p (probabilidade de su-
cesso).
Simbolicamente, temos: X ~ B(n,p) com a interpretao dada a
seguir:

A varivel aleatria x tem distribuio binomial com n en-


saios e uma probabilidade p de sucesso. (em cada ensaio).

A funo de probabilidade utilizada para clculo de probabili-


dades, quando a situao se enquadra na distribuio binomial, ser
dada por meio da seguinte expresso:

, onde n! corresponde ao fatorial de n.

p = probabilidade de sucesso em cada ensaio


q = 1-p = probabilidade de fracasso em cada ensaio

57
Curso de Graduao em Administrao a Distncia

Para exemplificar a utilizao da distribuio binomial, voc deve


considerar que pessoas entram em uma loja no perodo prximo ao
Dia das Mes. Sabe-se que a probabilidade de uma pessoa do sexo
masculino comprar um presente de 1/3. Se entrarem quatro pessoas
do sexo masculino nesta loja, qual a probabilidade de que duas ve-
nham a comprar presentes?
Se as quatro pessoas entram na loja e duas delas compram, po-
demos colocar as possibilidades da seguinte forma (C compra e no-
C no compra). O espao amostral associado ao experimento :

C, C, no-C, no-C ou C, no-C, no-C, C ou C, no-C, C,


no-C ou
no-C, no-C, C, C ou no-C, C, no-C, C ou no-C, C, C,
no-C

Logo, calculando as probabilidades usando as regras do e


(multiplicao, pois so independentes) e do ou (soma), a probabi-
lidade de dois clientes do sexo masculino comprarem presentes :

Como na binomial so
Agora, voc deve calcular utilizando a funo de probabilidade
n ensaios de Bernoulli
apresentada anteriormente e verificar que o resultado ser o mesmo.
e a distribuio tem
Os valores da mdia e da varincia da distribuio binomial so:
mdia p, a mdia da
binomial ser np. Mdia = np
Raciocnio semelhante Varincia = npq
feito para a
varincia. Um outro exemplo de utilizao da distribuio binomial o
seguinte. Em um determinado processo de fabricao, 10% das peas

58
Mdulo 4

produzidas so consideradas defeituosas. As peas so acondiciona-


das em caixas com cinco unidades cada uma. Considere que cada pea
tem a mesma probabilidade de ser defeituosa (como se houvesse repe-
tio no experimento de retirar uma pea).

a) Qual a probabilidade de haver exatamente trs peas de-


feituosas numa caixa?
P = 0,1 n = 5
b) Qual a probabilidade de haver duas ou mais peas defei-
tuosas em uma caixa?
c) Qual a probabilidade de uma caixa no apresentar nenhu-
ma pea defeituosa?
d) Supondo que a empresa pague uma multa de R$ 10,00
por caixa que apresente peas defeituosas, qual o valor espe-
rado desta multa em um lote de 1.000 caixas?
P(uma caixa ter pea defeituosa) = 1- P(X=0) = 0,4095

Temos, ento, uma nova varivel aleatria (nmero de caixas


com peas defeituosas), a qual chamaremos de Y em um lote de 1.000
caixas, que segue uma distribuio binomial com n=1.000 e p=0,4095.

E(Y) = np = 1000.0,4095 = 409,5 caixas.


Multa Esperada = 409,5 . R$ 10,00 = R$ 4.095,00

Distribuio de Poisson

Voc pode empregar a distribuio de Poisson em situaes nas


quais no est interessado no nmero de sucessos obtidos em n tenta-
tivas, como ocorre no caso da distribuio binomial, entretanto este
nmero de sucessos deve estar dentro de um intervalo contnuo, ou
seja, o nmero de sucessos ocorridos durante um intervalo cont-
nuo, que pode ser um intervalo de tempo, espao, etc. Imagine que
voc queira estudar o nmero de suicdios ocorridos em uma cidade
durante um ano ou o nmero de acidentes automobilsticos ocorridos
numa rodovia em um ms, ou o nmero de defeitos encontrados em

59
Curso de Graduao em Administrao a Distncia

um rolo de arame ovalado de 500 m. Estas situaes so exemplos


que se enquadram na distribuio de Poisson.
Note que, nos exemplos acima, no h como voc determinar a
probabilidade de ocorrncia de um sucesso, mas sim a freqncia mdia
de sua ocorrncia, como por exemplo, dois suicdios por ano, que de-
nominaremos .
Em uma situao com estas caractersticas, a varivel aleatria
X = nmero de sucessos em um intervalo contnuo ter uma distribui-
o Poisson, com (freqncia mdia de sucesso). Simbolicamente,
podemos utilizar a notao X ~ P().

A varivel aleatria x tem uma distribuio de Poisson com


uma freqncia mdia de sucesso .

A funo de probabilidade da distribuio de Poisson ser dada


por meio da seguinte expresso:

Onde e =2,7182 (base dos logaritmos neperianos) e corresponde


freqncia mdia de sucesso no intervalo contnuo em que se deseja
calcular a probabilidade.
Vamos considerar que o Corpo de Bombeiros de uma determi-
nada cidade recebe, em mdia, trs chamadas por dia. Queremos sa-
ber, ento, qual a probabilidade de do Corpo de Bombeiros receber:

a) quatro chamadas num dia:


Como o intervalo em X~P(3)
que se deseja calcular
a probabilidade um
dia, ento, o ser b) nenhuma chamada em um dia:
igual a 3.

60
Mdulo 4

c) 20 chamadas em uma semana:


= 21 chamadas por semana Como o intervalo
desejado uma sema-
na, ou seja, sete dias,
ento, em uma semana
Uma caracterstica da distribuio de Poisson que as estatsti-
a freqncia mdia de
cas da distribuio (mdia e varincia) apresentam o mesmo valor, ou
chamadas ser de sete
seja, so iguais a . Ento, teremos:
dias vezes 3 chama-
das/dia.
Mdia = Varincia =

Vamos fazer alguns exerccios relativos distribuio


binomial e de Poisson.

Exerccio 7: no Brasil, a proporo de microempresas que fe-


cham em at um ano de 10%. Em uma amostra aleatria de 20
microempresas, qual a probabilidade de cinco terem fechado em at
um ano de criao?
R: P(X = 5) = = 0,03192

Exerccio 8: entre 2.000 famlias de baixa renda, com quatro


crianas e considerando que a chance de nascer uma criana do sexo
masculino igual do sexo feminino, em quantas famlias se espera-
ria que tivessem:

n=4ep=
a) dois meninos? R: P(x=2) . 2.000 = 0,3750 . 2.000 = 750
famlias.
b) Um ou dois meninos? R: [P(1) + P(2)] . 2.000 = (0,25 +
0,375) . 2.000 = 1.250 famlias.
c) Nenhum menino? R: P(0) . 2.000 = 0,0625 . 2.000 = 125
famlias.

61
Curso de Graduao em Administrao a Distncia

Exerccio 9: a probabilidade de compra de um aparelho de celu-


lar igual a 30%. Observando oito compradores, qual a probabilidade
de quatro deles comprarem este aparelho?

R: P(X = 4) = = 0,13614

Exerccio 10: chegam caminhes a um depsito razo de 2,8


caminhes/hora, segundo uma distribuio de Poisson. Determine a
probabilidade de chegarem dois ou mais caminhes:

a) num perodo de 30 minutos;


b) num perodo de 1 hora; e
c) num perodo de 2 horas.
R: 1- [P(0) + P(1)]
a) = 1,4 R= 0,40817
b) = 2,8 R=0,76892
c) = 5,6 R=0,97559

Distribuies de Probabilidade Contnuas

Dentre as vrias distribuies de probabilidade contnuas, ser


abordada aqui apenas a distribuio normal, pois apresenta grande
aplicao em pesquisas cientficas e tecnolgicas. Grande parte das
variveis contnuas de interesse prtico segue esta distribuio, aliada
ao Teorema do Limite Central (TLC), que a base das estimativas e
dos testes de hipteses, realizados sobre a mdia de uma populao
qualquer, e garante que a distribuio amostral das mdias segue uma
distribuio normal, independentemente da distribuio da varivel em
estudo, como ser visto mais adiante.

62
Mdulo 4

A funo densidade de probabilidade da distribuio normal


dada por:

onde e so a mdia e desvio-padro, respectivamente, da distri-


buio de probabilidade e corresponde a 3,1415 e exp a uma funo
exponencial.
O grfico da distribuio normal, utilizando a funo mostrada
anteriormente, e os conceitos vistos no mdulo de Matemtica, so
dados por:

Voc encontrar a seguir as principais propriedades da distribui-


o normal.

1) simtrica em relao ao ponto x = (50% abaixo e 50%


acima da mdia).
2) Tem forma campanular (sino).
3) As trs medidas de posio, mdia, mediana e moda se
confundem no ponto de mximo da curva (x = ).
4) Fica perfeitamente definida conhecendo-se a mdia e o
desvio-padro, pois outros termos da funo so constantes.
5) Tem dois pontos de inflexo em x = .

63
Curso de Graduao em Administrao a Distncia

6) assinttica em relao ao eixo das abscissas .

7) A rea compreendida entre a curva e eixo x igual a

1 .

Condio para ser uma funo densidade de probabilidade.

Portanto, a rea sob a curva entre os pontos a e b, em que a < b,


representa a probabilidade da varivel X assumir um valor entre a e b.

Conceitos vistos em Matemtica e em variveis aleatrias.

Deste modo, a probabilidade de um ponto qualquer nula:

A notao utilizada para a distribuio normal ser a apresenta-


da a seguir:
A varivel X tem X~N(,)
distribuio normal com
mdia m e desvio s.
Verifica-se que a probabilidade em um ponto zero, pois de
um ponto a ele mesmo no existe rea, e como nas distribui-
es contnuas a rea entre a funo e o eixo das abscissas
corresponde probabilidade.

Como voc pode notar, o clculo de probabilidades via distri-


buio normal envolve a soluo de integrais que no so nada trivi-
ais. Em virtude da grande aplicao da distribuio normal, procurou-
se tabelar os valores de probabilidade, que seriam obtidos por meio da

64
Mdulo 4

integrao da funo densidade de probabilidade normal num deter-


minado intervalo.
A dificuldade para processar esse tabelamento se prendeu na
infinidade de valores que (mdia) e (desvio padro) poderiam as-
sumir. Nestas condies, teria que se dispor de uma tabela para cada
uma das infinitas combinaes de e , ou seja, em cada situao que
se quisesse calcular uma probabilidade.
Para resolver este problema, podemos obter uma nova forma para
a distribuio normal, que no seja influenciada por e . O problema
foi solucionado mediante o emprego de uma nova varivel, definida
por , que transforma todas as distribuies normais em uma

distribuio normal reduzida, ou padronizada, de mdia zero e des-


vio-padro um, z ~ N(0,1).
Assim, utilizamos apenas uma tabela para o clculo de probabi-
lidades, para qualquer que seja a curva correspondente a uma distri-
buio normal.
Portanto, para um valor de x = numa distribuio normal qual-
quer, corresponde o valor:

, na distribuio normal reduzida.

Para x = + , tem-se

, e assim por diante.

Ento, podemos definir a distribuio normal reduzida ou pa-


dronizada como sendo uma distribuio da varivel Z que apresenta
distribuio normal com mdia zero e varincia um (Z ~ N (0;1)).
A Figura da distribuio normal padronizada apresentada a
seguir:

65
Curso de Graduao em Administrao a Distncia

Figura 5: rea sob a curva normal padronizada


compreendida entre os valores 0 e Z
Fonte: elaborado pelos autores

Veja que na tabela da distribuio normal, os valores apresentados


na primeira coluna correspondem parte inteira e decimal do valor de Z,
enquanto os valores da primeira linha correspondem parte centesimal.
J os valores encontrados no meio da tabela correspondem s probabili-
dades dos respectivos valores compreendidos entre zero e Z.

66
Mdulo 4

Para que voc possa entender a utilizao da distribuio normal,


vamos considerar a situao em que se estudou a durabilidade de um
certo tipo de pneu. Verificou-se que esta durabilidade seguia uma distri-
buio normal com durao mdia 60.000 km e desvio-padro 10.000
km. Procurou-se, ento, responder os seguintes questionamentos:
Olhando este valor na
a) Qual a probabilidade de um pneu aleatoriamente escolhi- tabela de z, encontra-
do durar mais de 75.000 km? remos no meio da
X~ N(60000;100002) e procura-se calcular a P(X > 75000) = ? tabela o valor de
0,4332, que
corresponde proba-
P(X > 75000) = P(z > 1,50) bilidade de z estar
= 0,5 - P(0 < z < 1,50) = 0,4332 = entre zero e 1,5.

= 0,5 -0,4332 Retirou-se a probabili-


= 0,0668 dade encontrada de
0,5, pois este valor
b) Qual a probabilidade de um pneu aleatoriamente escolhi- corresponde proba-
do durar entre 50.000 e 70.000 km? bilidade de zero at o
infinito.
P(50000 < X < 70000) = ?
Como sugesto, faa o
desenho da curva com
os valores de x e
depois transforme para
os valores de z.

P(50000 < X < 70000) = P( -1,00 < z < 1,00) = 0,3413 +


0,3413 = 0,6826

c) Qual a probabilidade de um pneu aleatoriamente escolhi-


do durar entre 63.000 e 70.000 km?

P(63.000 < X < 70.000) = ?

67
Curso de Graduao em Administrao a Distncia

P(63000 < X < 70000) = P( 0,30 < z < 1,00) = 0,3413 +


0,1179 = 0,2234

d) Qual a probabilidade de um pneu aleatoriamente escolhi-


do durar exatamente 70.000 km?
P (X = 70000) = 0

e) O fabricante deseja fixar prazo de garantia, em quilme-


tros, de tal modo que, se a durao do pneu for inferior ga-
rantia, o pneu seja trocado. De quantos quilmetros deve ser
este prazo, para que somente 1% dos pneus sejam trocados?

x // P(X < x ) = 0,01 ==> z // P(Z < z) = 0,01


z = -2,33

Resolva a seguir os exerccios relativos distribuio normal e


confira os resultados no final do livro.

Exerccio 11: as rendas mensais dos graduados em um curso de


especializao em uma grande empresa so normalmente distribudas
com uma mdia de R$ 2.000 e um desvio-padro de R$ 200. Qual o
valor de Z para uma renda X de R$ 2.200? R$ 1.700?

68
Mdulo 4

Exerccio 12: o uso dirio de gua por pessoa em uma determi-


nada cidade normalmente distribudo com mdia igual a 20 litros e
desvio-padro igual a 5 litros.

a) Que percentagem da populao usa entre 20 e 24 litros


por dia?
b) Que percentagem usa entre 16 e 20 litros?
c) Qual a probabilidade de que uma pessoa selecionada ao
acaso use mais do que 28 litros?

Exerccio 13: um consultor verificou que as mdias obtidas em


uma avaliao aps um treinamento tem distribuio normal com uma
mdia igual a 72 e desvio-padro 5. Ele decide atribuir conceitos para
o seu treinamento tal que os melhores 15 % recebem conceito A. Qual
a mdia mnima que o funcionrio submetido ao treinamento precisa
receber para obter um conceito A?

Saiba mais...
Mais exerccios referentes ao assunto esto no site:
http://www.famat.ufu.br/prof/marcelo/exercicios.htm

69
UNIDADE

3
Amostragem
Amostragem
Curso de Graduao em Administrao a Distncia

72
Mdulo 4

Amostragem

A amostragem (processo de retirada de amostras de uma popu-


lao) uma das etapas fundamentais na tomada de decises nos di-
versos nveis gerenciais, pois uma amostragem mal executada, com
certeza, resultar em estatsticas pouco confiveis e em uma tomada
de deciso possivelmente imprecisa.
Esta Unidade tem como objetivo apresentar a voc alguns con-
ceitos e definies essenciais para conduzir convenientemente uma
operao de amostragem, visando principalmente coleta de dados
socioeconmicos.
No so contemplados todos os aspectos referentes da
amostragem, como por exemplo, o aspecto terico das vrias tcnicas GLOSSRIO
disponveis. Voc ver os aspectos mais importantes da amostragem e *Populao o
de maior aplicabilidade dentro das vrias reas da Administrao. conjunto de elemen-
Primeiramente, torna-se necessrio definirmos populao e amos- tos que apresentam
tra. Se considerarmos todos os atuais clientes de uma empresa da rea uma ou mais carac-
tersticas em comum.
de telefonia, podemos considerar estas pessoas como sendo a popula-
o* que caracteriza os clientes da empresa de telefonia, pois a popu- *Parmetro um
lao apresenta caractersticas em comum, sendo, neste caso, o fato de valor desconhecido
associado a uma ca-
utilizarem esta empresa de telefonia.
racterstica da popu-
Se quisermos utilizar uma parte desta populao, que apresente
lao.
as mesmas caractersticas daquela teremos uma amostra, ou seja, uma
*Estimador uma
poro ou frao da populao que preserva todas as caractersticas
funo (frmula)
importantes dos elementos que a integram.
que permite estimar
Se considerarmos esta populao de clientes, voc pode deter- o valor de um
minar o tempo mdio em que o cliente fica utilizando no dia o apare- parmetro (estimati-
lho de telefone fixo (mdia populacional (), que corresponde geral- va), baseando-se
mente a um valor desconhecido, chamado de parmetro*. Como voc nas observaes de
no vai medir toda a populao, podemos obter uma amostra que re- uma amostra.
presente esta populao, e estudando a amostra, voc ter condies
de calcular a mdia amostral (x), que corresponde ao estimador*, e o
resultado obtido (valor numrico) corresponder estimativa.
73
Curso de Graduao em Administrao a Distncia

A amostragem o estudo das relaes existentes entre a amos-


tra, a populao de onde ela foi extrada e a forma como ocorre esta
extrao. til na avaliao de grandezas desconhecidas da popula-
o, freqentemente denominadas parmetros, com base no conhe-
cimento de grandezas correspondentes das amostras, geralmente cha-
madas estimativas ou estatsticas (Teoria da Estimao). Tambm
auxilia na verificao de diferenas observadas entre duas ou mais
amostras (tratamentos), para voc saber se estas diferenas so devi-
das a uma variao casual ou se so verdadeiramente relacionadas aos
efeitos de tratamentos (Teoria da Deciso).
Portanto, a amostragem tem por objetivo principal determinar
meios e mtodos para estudar as populaes atravs de amostras. Ob-
serve que, quando obtemos informaes a partir das amostras e tenta-
mos atingir as populaes, estamos realizando uma inferncia.
Em resumo, podemos dizer que amostra um subconjunto da
populao, necessariamente finito, pois todos os seus elementos sero
examinados para efeito da realizao do estudo estatstico desejado.
Se considerarmos, nesta populao de clientes, o tempo de utilizao
diria do telefone fixo, teremos uma varivel aleatria, cuja mdia
populacional corresponde ao parmetro mdia do tempo de utiliza-
o diria do telefone fixo de todos os clientes atuais da empresa tele-
fnica. Em geral, a populao muito grande, e a mdia populacional
estimada por meio de uma amostra retirada desta populao, pelo
clculo da mdia amostral x, que corresponde ao estimador, e o resul-
tado obtido (valor numrico) corresponder estimativa. O problema
de estimao de parmetros um dos importantes tpicos da estatsti-
ca inferencial e ser estudado posteriormente.
A utilizao da amostragem ocorre, geralmente, quando quere-
mos avaliar populaes muito grandes ou infinitas.
As principais vantagens da utilizao do estudo por amostras
representativas (aquelas que mantm as caractersticas da populao
de onde a amostra foi retirada) em relao ao censo (avaliao de
toda a populao) so:

74
Mdulo 4

ocorre uma reduo no custo, pois sendo os dados obtidos


apenas de uma frao da populao, as despesas so meno-
res do que as oriundas de um censo. Tratando-se de grandes
populaes, podem-se obter resultados suficientemente pre-
cisos, para serem teis, de amostras que representam apenas
uma pequena frao da populao;
na prtica ou no dia-a-dia das organizaes, necessrio que
os resultados sejam obtidos com a maior rapidez possvel.
Portanto, com a amostragem, voc pode apurar os dados e
sintetiz-los mais rapidamente do que em uma contagem com-
pleta. Este um fator primordial, quando se necessita urgen-
temente das informaes. Se o resultado de uma pesquisa for
conhecido muito tempo depois, bem possvel que a situa-
o que voc pretendia resolver, seja, nesse momento, com-
pletamente diferente da que existia no momento da coleta
dos dados;
outra vantagem corresponde a uma maior amplitude e flexi-
bilidade. Em certos tipos de investigao, como pesquisas de
mercado, tem-se que utilizar pessoal bem treinado e equipa-
mento altamente especializado, cuja disponibilidade limita-
da para a obteno de dados. O censo completo torna-se im-
praticvel, e resta a escolha em obter as informaes por meio
de uma amostra. Portanto, com um nmero reduzido de
entrevistadores, por exemplo, o treinamento a ser aplicado
neles de qualidade muito maior do que em um grupo maior
de entrevistadores; e
a ltima vantagem a ser citada aqui a maior exatido dos
resultados. Em virtude de se poder empregar pessoal de melhor
qualidade e intensivamente treinado, e por se tornar exeqvel a
superviso mais cuidadosa do campo de trabalho e do GLOSSRIO
processamento de dados, favorecendo a uma reduo no volu- *Representatividade
me de trabalho, portanto, uma amostragem pode, na realida- corresponde
de, proporcionar resultados mais exatos do que o censo. possibilidade de
manter as mesmas
Desta forma, podemos dizer que as amostras a serem trabalha- caractersticas pre-
das devem apresentar uma caracterstica importante, que corresponde sentes na populao.
representatividade*. Para que as concluses da teoria de
amostragem sejam vlidas, as amostras devem ser escolhidas de modo

75
Curso de Graduao em Administrao a Distncia

a serem representativas da populao. Isso significa que a amostra deve


possuir as mesmas caractersticas bsicas da populao, no que diz
respeito (s) varivel(eis) que desejamos estudar. Desta forma, o pla-
no de amostragem deve ser formulado para garantir esta
representatividade.

Com um plano amostral apropriado, voc considera que seja


possvel garantir a representatividade da amostra devido a
um erro amostral?
Reflita em uma situao.

Uma vez tendo decidido realizar a pesquisa selecionando uma


amostra da populao, preciso elaborar o plano de amostragem.
O plano de amostragem consiste em definir as unidades amostrais*,
maneira pela qual a amostra ser retirada (o tipo de amostragem), e o
prprio tamanho da amostra.
Estas unidades amostrais podem corresponder aos prprios ele-
GLOSSRIO
mentos da populao, quando h acesso direto a eles, ou qualquer
*Unidades amostrais
correspondem s outra unidade que possibilite chegar at eles. Voc pode considerar
unidades selecionadas como populao os domiclios de uma cidade e que se deseje avaliar o
na amostragem para perfil socioeconmico. A unidade amostral ser cada um dos domic-
calcular as estatsticas. lios, que corresponder aos elementos da populao. Caso a unidade
amostral for definida como os quarteires, a unidade amostral no
corresponder aos elementos populacionais.
Podemos ter dois tipos de amostragem, as probabilsticas e as
no probabilsticas, as quais sero definidas a seguir.

Amostragem probabilstica: quando todos os elementos da


populao tiveram uma probabilidade conhecida e diferente
de zero de pertencer amostra (ex: 50 funcionrios em uma
atividade de treinamento, e voc deve selecionar dez funcio-
nrios). A realizao deste tipo de amostragem s possvel
se a populao for finita e totalmente acessvel.
Amostragem no probabilstica: quando no se conhece a
probabilidade de um elemento da populao pertencer amos-

76
Mdulo 4

tra. Por exemplo, quando somos obrigados a colher a amos-


tra na parte da populao a que temos acesso.

Voc pode notar que a utilizao de uma amostra probabilstica


melhor para garantir a representatividade da amostra, pois o acaso
ser o nico responsvel por eventuais discrepncias entre populao
e amostra. Estas discrepncias so levadas em considerao nas
inferncias estatsticas.
Os principais esquemas amostrais so apresentados a seguir.

Amostragem aleatria (casual) simples

Voc deve utilizar a amostragem aleatria simples somente quan-


do a populao for homognea em relao varivel que se deseja
estudar. Geralmente, atribumos uma numerao a cada indivduo da
populao, e atravs de um sorteio aleatrio os elementos que vo Pode ser feito por
compor a amostra so selecionados. Todos os elementos da popula- meio da gerao de
o tm a mesma probabilidade de pertencer amostra. um nmero aleatrio.
Imagine que voc queira amostrar um nmero de pessoas que
esto fazendo um determinado concurso com n inscritos. Como a po-
pulao finita, devemos enumerar cada um dos n candidatos e sorte-
ar n deles.

77
Curso de Graduao em Administrao a Distncia

Amostragem sistemtica

Em algumas situaes, conveniente retirar da populao os


elementos que vo compor a amostra de forma cclica (em perodos),
por exemplo, quando os elementos da populao se apresentam orde-
nados. Porm, de fundamental importncia que a varivel de interes-
se no apresente ciclos de variao coincidente com os ciclos de reti-
rada, pois este fato tornar a amostragem no aleatria. Esta tcnica
de amostragem se chama amostragem sistemtica. Para podermos en-
tender melhor, vamos imaginar que voc queira retirar uma amostra
de currculos apresentados para um processo seletivo, e a varivel de
interesse corresponde idade dos candidatos. Pode ocorrer que pes-
soas de uma determinada faixa etria deixem para entregar o currculo
no ltimo dia. Ento, se pegssemos os currculos de forma aleatria,
poderamos estar subestimando ou superestimando a idade mdia.
Nesta situao foram recebidos 500 currculos ordenados por ordem
alfabtica. Deseja-se amostrar 50 currculos para estimar a idade m-
dia dos candidatos. Ser utilizada a tcnica de amostragem sistemti-
ca, supondo que as idades estejam aleatoriamente distribudas na po-
pulao, ou seja, sem qualquer ciclo de repetio.
Primeiramente, deve-se enumerar a populao de 1 a 500 e cal-
cular uma constante (K) que servir como fator de ciclo para retirada dos
currculos amostrados. Ento, podemos dividir os 500 currculos pelo ta-
manho da amostra (50) que se deseja trabalhar. Teremos uma constante
igual a 10, e os elementos sero amostrados a cada dez elementos. Gene-
ralizando, ento, teremos que a constante (K) ser dado por K= N/n, onde
N o tamanho da populao, e n, o tamanho da amostra.
Aps a definio do valor de K, sorteia-se o ponto inicial da
amostragem, ou seja, um dos elementos do primeiro intervalo consti-
tudo pelos elementos populacionais numerados de 1 at 10. Escolhe-
se o seguinte, que ser o elemento de ordem (i + K); e assim por dian-
te, sempre somando-se K ordem do elemento anterior, at completar
a escolha dos n elementos que vo compor a amostra. Um esquema
apresentado a seguir.

78
Mdulo 4

Para fixar os conceitos de amostragem sistemtica, faa um es-


quema de amostragem para saber a opinio dos usurios de um banco
em relao ao tempo de atendimento.

O banco possui uma listagem de 33.400 clientes em uma de-


terminada cidade. A pesquisa ser feita por telefone, utili-
zando uma estrutura de call center. Deseja-se trabalhar com
uma amostra de 300 clientes. Como seria organizada a
amostragem sistemtica?

Amostragem Estratificada

Quando a varivel de interesse apresenta uma heterogeneidade


na populao e esta heterogeneidade permite a identificao de gru-
pos homogneos, voc pode dividir a populao em grupos (estratos)
e fazer uma amostragem dentro de cada estrato, garantindo, assim, a
representatividade de cada estrato na amostra.
Podemos verificar que pesquisas eleitorais apresentam uma gran-
de heterogeneidade em relao inteno de votos, quando conside-
ramos, por exemplo, a faixa salarial ou o nvel de escolaridade. Ento,
se fizssemos uma amostragem aleatria simples, poderamos incluir
na amostra uma maior quantidade de elementos de um grupo, e, pro-
porcionalmente, este grupo pequeno em relao populao. Desta
forma, no teramos uma amostra representativa da populao a ser
estudada. Ento, podemos dividir a populao em grupos (estratos)
que so homogneos para a caracterstica que estamos avaliando, ou
seja, neste caso, a inteno de votos.

79
Curso de Graduao em Administrao a Distncia

Como estamos dividindo a populao em estratos (grupos) que


so homogneos dentro de si, podemos, ento, caracterizar a
amostragem estratificada. Para efetuarmos a amostragem estratificada
de forma proporcional, precisamos primeiramente definir a propor-
o do estrato em relao populao.

Proporo do estrato h ser igual ao nmero de elementos


presentes neste estrato (Nh) dividido pelo tamanho da popu-
lao (N) (Nh/N).

Aps voc obter esta proporo do estrato em relao popula-


o, deve-se multiplicar o tamanho total da amostra (n) pela propor-
o de cada estrato na populao (Nh/N).

Assim, teremos um tamanho de amostra em cada estrato, pro-


porcional ao tamanho do estrato em relao populao.

A Figura 11 mostra como feita a escolha dos elementos de


cada estrato (A, B, C, D) que voc pode fazer usando amostragem
aleatria simples devido ao fato de os estratos serem homogneos in-
dividualmente, considerando a varivel de interesse.

80
Mdulo 4

Para que voc possa fixar os conceitos de amostragem


estratificada, resolva a seguinte situao.

Exerccio 1: uma franquia de fast food com foco em sandu-


ches, apresenta lojas em todo o mundo. Para fazer uma pesquisa de
satisfao dos clientes, dividiu-se a populao de lojas em trs estratos
(pases desenvolvidos, pases em desenvolvimento e pases do grupo
asitico). Pretende-se trabalhar com uma amostra de tamanho n = 200.
Com as informaes a seguir, faa o esquema de uma amostragem
estratificada.

Estratos Tamanho do estrato (no de lojas)

Pases desenvolvidos N1 = 700

Pases em desenvolvimento N2 = 420

Pases do grupo asitico N3 = 270

Amostragem por conglomerados

Apesar de a amostragem estratificada apresentar resultados


satisfatrios, a sua implementao dificultada pela falta de informa-
es sobre a populao para fazer a estratificao. Para poder contor-
nar este problema, voc pode trabalhar com o esquema de amostragem
chamado amostragem por conglomerados.
Os conglomerados so definidos em funo da experincia do
gestor ou pesquisador. Geralmente, podemos definir os conglomera-
dos por fatores geogrficos, como por exemplo, bairros e quarteires.
A utilizao da amostragem por conglomerados possibilita uma redu-
o significativa do custo do processo de amostragem. Portanto, um
conglomerado um subgrupo da populao, que individualmente re-
produz a populao, ou seja, individualmente os elementos que o com-
pem so muito heterogneos entre si. Este tipo de amostragem muito
til quando a populao grande, por exemplo, no caso de uma pes-
quisa em nvel nacional.
Para efetuarmos a amostragem por conglomerados, primeiramen-
te definimos o conglomerado e assim dividimos a populao nos con-

81
Curso de Graduao em Administrao a Distncia

glomerados. Sorteamos os conglomerados por meio de um processo


aleatrio e avaliamos todos os indivduos presentes no conglomerado,
que chamado de amostragem por conglomerados em um estgio.
Caso faamos um sorteio de elementos dentro de cada conglomerado,
teremos uma amostragem por conglomerados em dois estgios. Segue
abaixo o esquema de uma amostragem por conglomerados em um nico
estgio. Cada quadrado corresponde a uma residncia.

A Pesquisa Nacional por Amostra de Domiclios (PNAD) do


IBGE feita por conglomerados em trs estgios.

Saiba mais...
Sobre a Pesquisa Nacional por Amostra de Domiclios
(PNAD), consulte o site www.ibge.com.br.

82
Mdulo 4

O clculo do tamanho amostral ser visto em conjunto com a


parte de intervalos de confiana.

Amostragem No Probabilstica

Quando trabalhamos com a amostragem no probabilstica, no


conhecemos a priori a probabilidade que um elemento da populao
tem de pertencer amostra. Neste caso, no possvel calcular o erro
decorrente da generalizao dos resultados das anlises estatsticas da
amostra para a populao de onde a amostra foi retirada.
Utilizamos, geralmente, a amostragem no probabilstica por sim-
plicidade ou por impossibilidade de se obter uma amostra probabilstica,
como seria desejvel.
Os principais tipos de amostragem no probabilstica que temos
so amostragem sem norma ou a esmo, intencional e por cotas.

Amostragem a esmo

Imagine uma caixa com 1.000 parafusos. A enumerao destes


parafusos ficaria muito difcil, e a amostragem aleatria simples se tor-
na invivel. Ento, em situaes deste tipo, supondo que a populao
de parafusos seja homognea, escolhemos a esmo a quantidade relati-
va ao tamanho da amostra. Quanto mais homognea for a populao,
mais podemos supor a equivalncia com uma AAS.
Desta forma, os parafusos sero escolhidos para compor a amos-
tra de um determinado tamanho sem nenhuma norma ou a esmo. Da
vem o nome deste tipo de amostragem.

Amostragem intencional

A amostragem intencional corresponde quela em que o


amostrador deliberadamente escolhe certos elementos para pertencer
amostra, por julgar tais elementos bem representativos da popula-
o. Um exemplo deste tipo de amostragem corresponde situao
em que se deseja saber a aceitao em relao a uma nova marca de
whisky a ser inserida no mercado de uma cidade. Somente entraro
para compor a amostra pessoas que faam uso da bebida e que tenham

83
Curso de Graduao em Administrao a Distncia

condies financeiras de comprar esta nova marca (classe social de


maior poder aquisitivo).

Amostragem por cotas

Neste tipo de amostragem, a populao dividida em grupos, e


seleciona-se uma cota proporcional ao tamanho de cada grupo. Entre-
tanto, dentro de cada grupo no feito sorteio, e sim os elementos so
procurados at que a cota de cada grupo seja cumprida. Em pesquisas
eleitorais, a diviso de uma populao em grupos (considerando, por
exemplo, o sexo, o nvel de escolaridade, a faixa etria e a renda)
pode servir de base para a definio dos grupos, partindo da suposi-
o de que estas variveis definem grupos com comportamentos dife-
renciados no processo eleitoral. Para se ter uma idia do tamanho des-
tes grupos, pode-se recorrer a pesquisas feitas anteriormente pelo IBGE
(Instituto Brasileiro de Geografia e Estatstica).

Distribuies amostrais

Com as distribuies amostrais, voc pode inferir propriedades


de um agregado maior (a populao) a partir de um conjunto menor (a
amostra), ou seja, inferir sobre parmetros populacionais, dispondo
apenas de estatsticas amostrais.
Portanto, torna-se necessrio um estudo detalhado das distribui-
es amostrais, que so base para intervalos de confiana e testes de
hipteses.
Portanto, para que voc tenha condies de fazer afirmaes sobre
um determinado parmetro populacional (ex: ), baseadas na estimati-
va x, obtido a partir dos dados amostrais, necessrio conhecer a rela-
o existente entre x e , isto , o comportamento de x, quando se
extraem todas as amostras possveis da populao, ou seja, sua distri-
buio amostral.
Para obtermos a distribuio amostral de um estimador, neces-
srio conhecer o processo pelo qual as amostras foram retiradas, isto
, se amostras foram retiradas com reposio ou sem reposio.

84
Mdulo 4

Portanto, a partir do comportamento da estatstica amostral, pode-


se aplicar um teorema muito conhecido na estatstica como Teorema
do Limite Central. Este teorema prope que, se retirarmos todas as
possveis amostras de tamanho n de uma populao independente de
sua distribuio, e verificarmos como as estatsticas amostrais obtidas
se distribuem, teremos uma distribuio aproximadamente normal, com
(mdia das mdias amostrais igual mdia populacional)

e varincia das mdias (varincia das mdias mostrais

igual varincia da populao dividida pelo tamanho da amos-


tra), se a amostragem for realizada com reposio, ou

, se a amostragem for realizada sem reposio em

uma populao finita ( > 0,05), independentemente da distribui-


o da varivel em questo.
Portanto, considerando a distribuio
Para saber mais
amostral de mdias, quando se conhece a
Considere uma populao formada pelos n-
varincia ou a amostra grande (n > 30),
meros {1 , 2, 3}. Sabemos que esta popula-
utilizamos a estatstica z da distribuio nor- o apresenta = 2 e varincia 2 = 2/3.
mal vista anteriormente, independente da dis- Retire todas as amostras possveis com n=2,
tribuio da populao. Ento, por meio do fazendo com e sem reposio e calcule a m-
teorema do limite central, a estatstica ser dia das mdias amostrais (2 ) e a varincia
das mdias amostrais ( ). Compare com

dada por: . os resultados da populao e veja se o teorema


verdadeiro. Pesquise este problema em sites
Porm, ocorre que, na prtica, muitas da internet ou outros livros de Estatstica.
das vezes no se conhece e trabalha-se
2

com amostras pequenas, ou seja, menores ou iguais a 30. Assim, voc


conhece apenas sua estimativa s (desvio-padro amostral). Substituin-
do por seu estimador s, na expresso da varivel padronizada, ob-
tm-se a varivel:

(expresso semelhante a Z)

85
Curso de Graduao em Administrao a Distncia

Corresponde ao a qual segue uma distribuio t de Student com (n-1) graus de liber-
divisor do clculo da dade.
varincia amostral, ou A distribuio t apresenta as seguintes caractersticas:
seja, n - 1. Nmero de
variveis na amostra simtrica em relao mdia, que zero;
que variam livremente, tem forma campanular (semelhante normal);
na definio da Esta- quando n tende para infinito, a distribuio t tende para a
tstica. distribuio normal, na prtica, a aproximao considerada
boa quando n >30; e
possui n-1 graus de liberdade.
Vamos aprender a utilizar a Tabela da distribuio de t de Student.
Na Tabela t de Student, na primeira linha temos o valor de , que
corresponde probabilidade (rea) acima de um determinado
valor da tabela. Na figura a seguir, temos o conceito de (rea mais
escura).

Observe que na Tabela de t (a seguir), temos na primeira coluna


os graus de liberdade (GL) e no centro da tabela, teremos os valores
da estatstica t de Student. Na primeira linha temos os valores de .

86
Mdulo 4

Tabela 8: Limites unilaterais da distribuio t de Student


ao nvel de probabilidade
Fonte: www.dpi.inpe.br/~camilo/estatistica/06estimao.ppt

Para exemplificar o uso da tabela, consideremos que desejamos


encontrar a probabilidade de ser maior do que um valor de t igual a
2,764, trabalhando com uma amostra de tamanho n = 11. Portanto,
teremos 10 graus de liberdade e nesta linha procuramos o valor que
desejamos encontrar, 2,764. Subindo na Tabela em direo ao en-
contraremos um valor de 0,01 na primeira linha, ou seja, esta a pro-
babilidade de ser maior do que 2,764, com 10 graus de liberdade.

87
Curso de Graduao em Administrao a Distncia

Retirando-se uma amostra de n elementos de uma populao


normal com mdia e varincia 2, ento, pode-se demonstrar que a
distribuio amostral da varincia amostral segue uma distribuio
de 2 (qui-quadrado) com n-1 graus de liberdade. A varivel da es-
tatstica de qui-quadrado ser dada por:

tem distribuio 2 com n-1 graus de liberdade.

Esta distribuio sempre positiva, o que pode ser comprovado


pela prpria definio da varivel. Esta distribuio assimtrica, como
pode ser visto no grfico da distribuio mostrado a seguir.

No esquema a seguir, temos como feita a utilizao da distri-


buio de qui-quadrado com g graus de liberdade.

Fonte: www.dpi.inpe.br/~camilo/estatistica/06estimao.ppt

88
Mdulo 4

A distribuio de F de Snedecor corresponde distribuio da


razo de duas varincias. Temos, ento, duas populaes que apre-
sentam varincias populacionais e delas so retiradas amostras, nas
quais so calculadas varincias amostrais. A relao entre essas
varincias que nos d a distribuio de F. A estatstica da distribui-
o apresentada a seguir:

segue uma distribuio F com g1 = n1 -1 e g2 = n2 -1

graus de liberdade para o numerador e denominador respectivamente.


A utilizao da Tabela apresentada a seguir:

Fonte: www.dpi.inpe.br/~camilo/estatistica/06estimao.ppt

Nota-se que, no caso da tabela de F, o valor de que corresponde


rea extrema direita da curva, apresentado no ttulo da tabela,
pois para cada valor de temos uma tabela diferente.
Uma aplicao prtica da distribuio de F est na verificao
da homogeneidade das varincias provenientes de duas populaes
normais e independentes.
A seguir, so apresentados exerccios, que possibilitam o treino
de utilizao das tabelas de t, 2 e F. Como sugesto, sempre faa o
desenho da curva para melhor entender como utilizar a tabela.

89
Curso de Graduao em Administrao a Distncia

Exerccio 2: obter os seguintes valores da distribuio t de


Student:
a) P (-2,160 < t < a) = 0,95 com 13 g.l;
b) P (a < t < 1,708) = 0,90 com 25 g.l;
c) P (t > a) = 0,05 com 20 g.l.

Exerccio 3: obter os seguintes valores da distribuio de 2:


a) P (2 > a) = 0,025 com 21 g.l;
b) P (2 < a) = 0,025 com 21 g.l;
c) P(2 > a) = 0,95 com 15 g. l.

Exerccio 4: obter os seguintes valores da distribuio F de


Snedecor:
a) P(F > a) = 0,10 com g1 = 5 e g 2 = 25 g.l;
b) P(F < a) = 0,90 com n1 = 6 e n2 = 26 g.l;
c) P(F > a) = 0,05 com g1 = 13 e g2 = 29 g.l.

Estimao

Um dos principais objetivos da estatstica inferencial consiste


em estimar os valores de parmetros populacionais desconhecidos (es-
timao de parmetros) utilizando dados amostrais. Ento, qualquer
caracterstica de uma populao pode ser estimada a partir de uma
amostra aleatria, desde que esta amostra represente bem a popula-
o. Os parmetros populacionais mais comuns a serem estimados so
a mdia, o desvio-padro e a proporo. A estatstica inferencial apre-
senta uma relevncia alta, j que na maioria das decises que um gestor
ou pesquisador deve tomar, esto associadas utilizao de dados
amostrais. Consiste em tirar concluses de uma populao a partir de
amostra representativa dela, tendo uma grande importncia em muitas
reas do conhecimento.

90
Mdulo 4

A partir de uma amostra de 800 clientes (escolhidos aleatoria-


mente entre todos os clientes que abasteceram na primeira quinzena
de um determinado ms) de um posto de gasolina que possuem carros
populares, verificou-se que o consumo mdio de gasolina foi de R$
200,00 por quinzena.

Reflita sobre a afirmao abaixo:


Ento, podemos inferir que o consumo mdio da popula-
o de clientes da primeira quinzena do ms em estudo,
proprietrios de carros populares que abastecem neste
posto de gasolina de R$ 200,00.

Esta uma estimativa que chamamos de pontual, ou seja, infe-


rimos sobre a populao, considerando apenas o valor da estimativa.
Essas estimativas por ponto no nos do uma idia sobre confiana e
as margens de erro que deveriam ser aplicadas ao resultado. Tudo que
ns sabemos, por exemplo, que o consumo mdio de gasolina foi
estimado como R$ 200,00 por quinzena, independente do tamanho da
amostra e da variabilidade inerente dos dados. Se fosse usado um ta-
manho grande de amostra e houvesse pouca variabilidade, teramos
grandes razes para acreditar no resultado. Mas no sabemos nada, se
tivermos apenas uma estimativa por ponto. No entanto, podemos esti-
mar ou fazer inferncias sobre os valores da populao usando uma
segunda abordagem, chamada estimativas por intervalos ou inter-
valos de confiana, que do o intervalo dentro do qual se espera que
esteja o valor da populao, com uma dada probabilidade ou um nvel
de confiana. Neste caso, poderamos inferir, por exemplo, que o con-
sumo de carros populares que abastecem no posto de gasolina est no
intervalo de R$ 180,00 a R$ 220,00, e ainda afirmamos isto com, por
exemplo, uma certeza de 95%.

91
Curso de Graduao em Administrao a Distncia

Em resumo, podemos dizer que a estimativa pontual fornece


uma estimativa nica de um parmetro e que a estimativa
intervalar nos d um intervalo de valores possveis, no qual
se admite que esteja o parmetro populacional com uma pro-
babilidade conhecida.

Como a estimativa por intervalos nos fornece uma informao


mais precisa em relao ao parmetro, esta a melhor forma de esti-
mar o parmetro populacional. Ento, para voc estimar parmetros
populacionais por meio de dados amostrais, necessrio o conheci-
mento da distribuio amostral da estatstica que est sendo usada como
estimador (visto anteriormente).
Considere que, em uma loja em um shopping, voc coletou uma
amostra de clientes do ms anterior e verificou que eles apresentavam
uma idade mdia de 24,2 anos. Surge, ento, uma pergunta: este valor
encontrado est prximo da mdia da populao de clientes do ms
anterior? A distribuio da mdia amostral, segundo o teorema central
do limite apresenta uma distribuio aproximadamente normal (consi-
derando um tamanho amostral suficientemente grande). Pelo que foi
visto na Unidade 2 (distribuio normal), se considerarmos uma pro-
babilidade de 99%, teremos que 99% mdias amostrais estaro dentro
do intervalo correspondente ao limite inferir de 2,57 desvios-padro
abaixo da mdia da varivel, mdia amostral e ao limite superior de
2,57 desvios-padro acima da mdia. Em funo da dificuldade de
encontrarmos um valor exato, ento trabalhamos com intervalos de
confiana. Podemos concluir que existe uma chance de 1% de que a
mdia no esteja dentro deste afastamento da mdia de 2,57 desvios-
padro, e convertendo este afastamento na unidade dos dados, tere-
mos o chamado intervalo de confiana.

Ento, um intervalo de confiana d um intervalo de valores,


centrado na estatstica amostral, no qual julgamos, com um
risco conhecido de erro, estar o parmetro da populao.

92
Mdulo 4

Este 1% do exemplo anterior pode ser chamado de nvel de


significncia ou , que nos d a medida da incerteza desta inferncia.
O geralmente assume valores entre 1 e 10%.

Ento, a partir de informaes de amostras, devemos calcu-


lar os limites de um intervalo, valores crticos, que em
(1-)% dos casos inclua o valor do parmetro a estimar e
em % dos casos no inclua o valor do parmetro, como
pode ser visto na Figura.

O nvel de confiana 1 - a probabilidade de o intervalo de


confiana conter o parmetro estimado. Em termos de varivel normal
padro Z, isto representa a rea central sob a curva normal entre os
pontos -Z e Z.

93
Curso de Graduao em Administrao a Distncia

Voc pode observar que a rea total sob a curva normal unit-
ria. Se a rea central 1 -, o ponto -z representa o valor de Z, que
deixa sua esquerda a rea /2, e o ponto z representa o valor de Z,
que deixa sua direita a rea /2.
Vamos ento aprender como construir alguns intervalos de
confiana.

Intervalo de confiana para a mdia populacional quando o


desvio-padro populacional conhecido.

Vamos imaginar a seguinte situao: o Departamento de Re-


cursos Humanos de uma grande empresa informa que o tempo de exe-
cuo de tarefas que envolvem participao manual varia de tarefa
para tarefa, mas que o desvio-padro permanece aproximadamente
constante, em 3 minutos. Uma nova tarefa est sendo implantada na
empresa. Uma amostra aleatria do tempo de execuo de 50 destas
novas tarefas forneceu o valor mdio de 15 minutos. Determine um
intervalo de confiana de 95% para o tempo mdio de execuo desta
nova tarefa.
Primeiramente, voc precisa identificar que o desvio-padro
populacional conhecido, e tambm a amostra considerada grande (n
> 30). Ento, a construo do intervalo de confiana ser feita utilizan-
do a mdia amostral, que aproximadamente normal. Utilizaremos para
a obteno dos limites de confiana a curva normal padro Z.
Como os limites so dados por meio da estatstica calculada a
partir dos dados amostrais e da margem de erro (fornecida pela estats-
tica da distribuio multiplicada pelo desvio-padro da distribuio
amostral), teremos, nesta situao, os limites calculados por meio da
seguinte expresso:

94
Mdulo 4

Logo, o intervalo de confiana tem centro na mdia amostral:


calculando na nossa situao, teremos:

1 = 0,95 = 0,05 /2 = 0,025

olhando na tabela de Z, voc encontrar Z /2 = 1,96

Interpretao do resultado: em cada grupo de 100 amos-


tras retiradas de 50 clientes, espera-se que em 95 delas a mdia
esteja dentro do intervalo de 14,168 a 15,831.

Fator de correo para populao finita

Quando voc estiver trabalhando com um tamanho de amostra


que no seja to pequeno em relao ao tamanho da populao, e se a
amostragem realizada for sem reposio, necessrio que se faa uma
correo na estimativa do erro-padro da distribuio amostral. O fa-
tor de correo para populao finita, amostragem sem reposio,
dado por: onde N: tamanho da populao e n: tamanho da

amostra.

95
Curso de Graduao em Administrao a Distncia

Uma regra prtica para uso da correo dada por meio da re-
lao entre o tamanho da amostra e o tamanho da populao. Ento,
se , devemos fazer a correo para populao finita, e tere-

mos o desvio-padro igual a .

Esta correo, quando necessria, deve ser utilizada para qual-


quer distribuio amostral.
Resolva agora o exerccio proposto a seguir.

Exerccio 5: considere, por exemplo, que as despesas mensais


com alimentao das 1.000 cabeas de gado de uma fazenda so nor-
malmente distribudas com desvio-padro de US$ 3,00. Uma amostra
de cem bois revelou uma despesa mdia mensal de US$ 27,00. Deter-
mine o intervalo de confiana de 90% para a despesa mdia com ali-
mentao dos bois desta fazenda.
Desenvolvendo a expresso do erro mostrada anteriormente, te-
remos o tamanho de amostra para estimao da mdia populacional,
quando o desvio-padro populacional conhecido, como mostrado
a seguir:

Se voc verificar que a amostragem foi feita sem reposio em


uma populao finita, conforme dito anteriormente, devemos utilizar
o fator de correo.
Imagine a seguinte situao: que tamanho de amostra ser ne-
cessrio para produzir um intervalo de 95% de confiana para a ver-
dadeira mdia populacional, com erro de 1,0, se o desvio-padro da
populao 10,0?

96
Mdulo 4

Intervalo de confiana para a mdia populacional, quando o


desvio-padro populacional no conhecido e a amostra
pequena (n < 30)

Nesta situao, no temos uma boa estimativa do desvio-padro


populacional, devido ao tamanho reduzido da amostra utilizado (n <
30). A nica diferena em relao ao intervalo de confiana, quando o
desvio-padro conhecido ou a amostra grande (apresentado anteri-
ormente), que, no lugar da distribuio normal (Z) vamos trabalhar
com a distribuio t de Student. Portanto, a expresso para o intervalo
de confiana apresentada a seguir:

Todas as demais consideraes apresentadas anteriormente per-


manecem, bem como a interpretao do intervalo de confiana.
Considere que, para uma dada semana, foi tomada uma amostra
aleatria de 28 empregados horistas selecionados de um grande n-
mero de funcionrios de uma fbrica, a qual apresentou um salrio
mdio de R$ 180,00 com um desvio-padro de R$ 14,00. Estimar o
salrio mdio para todos os empregados horistas da fbrica, de tal
maneira que se tenha uma confiana de 95% de que o intervalo esti-
mado inclua a mdia da populao.
Calculando na nossa situao, teremos:

1- = 0,95 = 0,05 /2 = 0,025

Olhando na tabela de t, voc encontrar t/2 = 2,052 ( com 27


graus de liberdade)

97
Curso de Graduao em Administrao a Distncia

Intervalo de confiana para a estimao


da proporo populacional

Voc deve considerar que, geralmente, a proporo de sucessos


em uma populao (p), na maioria das vezes desconhecida. Ento, o
que fazemos? Calculamos uma estimativa da proporo de sucessos
na populao a partir de uma amostra retirada desta, a qual denomina-
mos . A distribuio amostral de uma proporo apresenta uma m-

dia p e desvio-padro .
Para construirmos o intervalo de confiana para p desconheci-

da, determinamos na amostra e consideramos .

Portanto, considerando um nvel de significncia , teremos:

a) intervalo de confiana para p: ;

b) margem de erro da estimativa: ;e

c) tamanho da amostra: .

Todas as demais consideraes apresentadas anteriormente


permanecem, bem como a interpretao do intervalo de con-
fiana.

Um despachante que cuida da documentao de automveis est


interessado em estimar a proporo de clientes que trocaram de carro
no ltimo ano para oferecer seus servios. Para isto, amostrou 80 cli-
entes do seu cadastro e consultou-os por telefone, verificando que 30
deles teriam trocado de carro no ltimo ano. Determine o tamanho da
amostra necessrio para estimar com 95% de confiana esta propor-
o com erro mximo de 4%.

98
Mdulo 4

Veja esta outra situao agora: considere que uma empresa de


pesquisa de mercado faz contato com uma amostra de cem homens em
uma grande comunidade e verifica que uma proporo de 0,40 na
amostra prefere lminas de barbear fabricadas por seu cliente, em vez
de qualquer outra marca. Determine o intervalo de confiana de 95%
para a proporo de todos os homens na comunidade que preferem
essa marca.

1- = 0,95 = 0,05 /2 = 0,025

Olhando na tabela de Z, voc encontrar Z /2 = 1,96

Saiba mais...
Mais exerccios referentes ao assunto esto no site: http://
www.famat.ufu.br/prof/marcelo/exercicios.htm

99
UNIDADE

4
Testes
Testes de
de Hipteses
Hipteses
Curso de Graduao em Administrao a Distncia

102
Mdulo 4

Testes de Hipteses

Na teoria de deciso estatstica, os testes de hipteses assumem


uma importncia fundamental, j que estes permitem nos dizer, por
exemplo, se duas populaes so de fato iguais ou diferentes, utilizan-
do para isso amostras destas populaes. Desta forma, a tomada de
deciso de um gestor, deve estar baseada na anlise de dados a partir
de um teste de hiptese.

Ento, voc pode definir as hipteses a serem testadas, reti-


rar as amostras das populaes a serem estudadas, calcular
as estatsticas delas e, por fim, determinar o grau de aceita-
o de hipteses baseadas na teoria de deciso, ou seja, se
uma determinada hiptese ser validada ou no.

Para voc decidir se uma hiptese verdadeira ou falsa, ou seja,


se ela deve ser aceita ou rejeitada, considerando uma determinada
amostra, precisamos seguir uma srie de passos. Os passos so mos-
trados a seguir.

1) Definir a hiptese de igualdade (H0) e a hiptese alternati-


va (H1) para tentar rejeitar H0 (possveis erros associados
tomada de deciso).
2) Definir o nvel de significncia ().
3) Definir a distribuio amostral a ser utilizada.
4) Definir os limites da regio de rejeio e aceitao.
5) Calcular a estatstica da distribuio escolhida a partir dos
valores amostrais obtidos e tomar a deciso.

Voc deve tomar a deciso baseada na seguinte regra: se o valor


da estatstica da distribuio calculado estiver na regio de rejeio,

103
Curso de Graduao em Administrao a Distncia

rejeitar, ento, a hiptese nula, seno a deciso ser que a hiptese


nula no poder ser rejeitada ao nvel de significncia determinada.
Diversos conceitos sero apresentados ao longo do detalhamento
dos passos a serem seguidos na formulao de um teste de hiptese.
Detalhamento dos passos na formulao de um teste de hiptese:

1) Formular as hipteses (Ho e H1).


Primeiramente, vamos estabelecer as hipteses nula e alterna-
tiva. Para exemplificar, voc deve considerar um teste de hiptese
para uma mdia. Ento, a hiptese de igualdade chamada de hipte-
se de nulidade ou Ho. Suponha que voc queira testar a hiptese de
que o tempo mdio de ligaes igual a 50 segundos. Ento, esta
hiptese ser simbolizada da maneira apresentada a seguir:

Ho: = 50 (hiptese de nulidade)

Esta hiptese, na maioria dos casos, ser de igualdade.


Se voc rejeitar esta hiptese, vai aceitar, neste caso, outra hip-
tese, que chamamos de hiptese alternativa. Este tipo de hiptese
simbolizada por H1 ou Ha.
As hipteses alternativas mais comuns so as apresentadas a se-
guir a partir do nosso exemplo:

H1: > 50 (teste unilateral ou unicaudal direita)


O tempo mdio de ligao superior a 50 segundos
H1: < 50 (teste unilateral ou unicaudal esquerda)
O tempo mdio de ligao inferior a 50 segundos
H1: 50 (teste bilateral ou bicaudal)
O tempo mdio de ligao pode ser superior ou inferior a 50
segundos.

Surge uma dvida. Qual hiptese alternativa voc


utilizar? A resposta bem simples.

104
Mdulo 4

A hiptese alternativa ser definida por voc, em funo do tipo


de deciso que deseje tomar.
Veja o seguinte exemplo: voc inspeciona uma amostra de uma
grande remessa, encontrando-se 8% defeituosa. O fornecedor garante
que no haver mais de 6% de peas defeituosas em cada remessa. O
que devemos responder, com auxlio dos testes de significncia, se a
afirmao do fornecedor verdadeira.
As hipteses que voc vai formular so:

H0: p=0,06; H1: p>0,06. A hiptese alternativa


s pode ser maior,
importante ressaltar que o sinal de igual para a hiptese Ho pois o fornecedor
corresponde a um sinal de menor ou igual (neste exemplo), pois o garante que no
teste unilateral direita (p1 > 0,06). Portanto, sempre que o teste for haver mais de 6%.
unilateral, deve ser feita esta considerao.

2) Definir o nvel de significncia.

O nvel de significncia de um teste dado pela probabilidade


de se cometer erro do tipo I (ocorre quando voc rejeita a hiptese
Ho e esta hiptese verdadeira). Com o valor desta probabilidade
fixada, voc pode determinar o chamado valor crtico, que separa a
chamada regio de rejeio da hiptese Ho da regio de aceitao da
hiptese Ho.
Na Figura abaixo, as reas escuras correspondem significncia
do teste, ou seja, probabilidade de se cometer o chamado erro tipo I
(rejeitar Ho quando ela verdadeira). Esta probabilidade chamada
de , e geralmente os valores mais utilizados so 0,01 e 0,05. O com-
plementar do nvel de significncia chamado de nvel de confiana e
dado por 1 - .

105
Curso de Graduao em Administrao a Distncia

3) Definir a distribuio amostral a ser utilizada.

A estatstica a ser utilizada no teste, voc definira em funo da


distribuio amostral a qual os dados seguem. Se voc fizer um teste
de hiptese para uma mdia ou diferena entre mdias, utilize a distri-
buio de Z ou t de Student. Outro exemplo se voc quiser comparar
a varincia de duas populaes, ento dever trabalhar com a distribui-
o F, ou seja, da razo de duas varincias. Note que o conhecimento
das distribuies amostrais vistas na Unidade 3 muito importante.

4) Definir os limites da regio de rejeio.

Os limites entre as regies de rejeio e aceitao da hiptese


Ho, voc definir em funo do tipo de hiptese H1, do valor de (n-
vel de significncia) e da distribuio amostral utilizada. Consideran-
do um teste bilateral, voc ter a regio de aceitao (no-rejeio)
com uma probabilidade de 1- e uma regio de rejeio com probabi-
lidade ( /2 + /2).

106
Mdulo 4

Atravs da amostra obtida, voc deve calcular a estimativa que


servir para aceitar ou rejeitar a hiptese nula.

5) Tomar a deciso.

Para tomar a deciso, voc deve calcular a estimativa do teste


estatstico que ser utilizado para rejeitar ou no a hiptese Ho. A es-
trutura deste clculo para a mdia de forma generalista dada por:

Podemos exemplificar pela distribuio de Z, que ser:

Se o valor da estatstica estiver na regio crtica (de rejeio),


rejeitar Ho; caso contrrio, aceitar H0. O esquema abaixo mostra bem
a situao de deciso.

107
Curso de Graduao em Administrao a Distncia

Teste de hiptese para mdia populacional

Quando voc retira uma amostra de uma populao e calcula a


mdia desta amostra, possvel verificar se a afirmao sobre a mdia
populacional verdadeira. Para tanto, basta verificar se a estatstica
do teste estar na regio de aceitao ou de rejeio da hiptese Ho.
Aqui voc tem trs situaes distintas:

1) se o desvio-padro da populao conhecido ou a amos-


tra considerada grande (n >30), a distribuio amostral a
ser utilizada ser da Normal ou Z e a estatstica-teste que

voc utilizar ser: .

Onde x: mdia amostral; : mdia populacional; : desvio-


padro populacional e n: tamanho da amostra.

2) agora, se voc no conhecer o desvio-padro populacional


e a amostra for pequena ( ), ento, a distribuio
amostral a ser utilizada ser a t de Student, e a estatstica-

teste ser: . Onde x: mdia amostral; : mdia

populacional; s : desvio-padro amostral e n: tamanho da


amostra.

Uma observao importante: quando trabalhamos com amos-


tras grandes, ou seja, n > 30, a distribuio de Z e t de Student
apresentam comportamentos prximos e valores da estatsti-
ca prximos tambm.

Veja uma situao utilizando o teste de hiptese para uma mdia


usando Z. Registros dos ltimos anos de funcionrios de uma determi-
nada empresa atestam que sua mdia num teste de QI foi 115, com um
desvio-padro de 20. Para saber se uma nova equipe de funcionrios
tpica desta empresa, retirou-se uma amostra aleatria de 50 funcion-

108
Mdulo 4

rios desta nova equipe, encontrando-se mdia de 118. Com uma


significncia de 5%, teste a hiptese de que esta nova equipe apresente
a mesma caracterstica dos funcionrios da empresa, com relao ao QI.

Agora voc deve resolver o seguinte exerccio:

Exerccio 1: um fabricante afirma que seus pneus radiais supor-


tam em mdia uma quilometragem com mais de 40.000 km. Para tes-
tar essa afirmao, um comprador selecionou uma amostra de 49 pneus.
Os testes nessa amostra forneceram uma mdia de 43.000 km. Sabe-
se que a quilometragem de todos os pneus tem desvio-padro de 6.500
km. Se o comprador testar essa afirmao ao nvel de significncia de
5%, qual ser sua concluso? Resposta no final do
Veja agora uma situao aplicando o teste t de Student. livro.
O tempo mdio gasto para profissionais da rea de Cincias
Contbeis realizarem um determinado procedimento tem sido de 50
minutos. Um novo procedimento est sendo implementado. Neste novo
procedimento, retirou-se uma amostra de 12 pessoas, com um tempo
mdio de 42 minutos e um desvio-padro de 11,9 minutos. Teste a
hiptese de que a mdia populacional no novo procedimento menor
do que 50.

109
Curso de Graduao em Administrao a Distncia

Teste de hiptese para a razo de duas varincias.

Este teste de hiptese utilizado para saber se duas varincias


populacionais so estatisticamente iguais ou se uma maior do que a
outra. Ento, utilizando a distribuio F, poderemos formular o teste
de hiptese da razo entre duas varincias e chegar concluso base-
ados apenas nas estimativas calculadas a partir das amostras.
As hipteses Ho e H1 sero:

Como estamos utilizando um teste unilateral direita (ques-


tes didticas), ento, no clculo da estatstica de F, teremos
a maior varincia dividida pela menor varincia.

A maior varincia amostral encontrada ser chamada de S12 (pro-


veniente de uma amostra de tamanho n1), e a menor varincia amostral
ser chamada S22 (proveniente de amostra de tamanho n2).
Vamos supor que tivssemos duas amostras provenientes de duas
populaes. Desejamos saber se as varincias das populaes so estatis-
ticamente iguais ou uma maior do que a outra. Considere uma
significncia de 2,5%. Os resultados amostrais so apresentados a seguir:

S12 = 0,5184 com n1 = 14

S22 = 0,2025 com n2 = 21

A estatstica ser dada por:


Ento, a varivel de teste do teste F ser:

110
Mdulo 4

Como em H o , estou considerando que as varincias


populacionais so iguais, ento, na expresso acima as duas varincias
populacionais vo se cancelar. No nosso exemplo, teremos:

O valor tabelado (crtico) da distribuio de F ser obtido na


tabela da distribuio com uma significncia de 2,5%. Considerando
como graus de liberdade iguais a 13 (n1 1) para o numerador (v1) e
20 (n2 1) para o denominador (v2), chegaremos ao seguinte resulta-
do: valor tabelado igual a 2,637.
O valor calculado da estatstica foi menor do que o tabelado,
ento, ele caiu na regio de aceitao de Ho. Assim, aceitamos Ho e
consideramos que a varincia da populao 1 estatisticamente igual
varincia da populao 2, ou seja, no ocorre uma diferena entre elas.
Este teste servir de base na escolha do prximo teste (diferena
entre mdias para amostras independentes), ou seja, escolher o tipo de
teste a ser utilizado.

Teste de hiptese para a diferena entre mdias


populacionais

Quando queremos comparar a mdia de duas populaes, retira-


mos amostras das duas, e estas amostras podem apresentar tamanhos
diferentes. Vamos considerar as situaes de amostras independentes
(as populaes no apresentam nenhuma relao entre si) e amostras
dependentes (uma populao sofre uma interveno e avalia-se antes
e depois da interveno para saber se esta resultou em algum efeito).

1 situao: amostras independentes e grandes (n>30).


2 situao: amostras independentes e pequenas, mas que
apresentam varincias populacionais estatisticamente iguais.
3 situao: amostras independentes e pequenas, mas que apre-
sentam varincias populacionais estatisticamente desiguais.
4 situao: amostras dependentes.

111
Curso de Graduao em Administrao a Distncia

Agora voc vai estudar cada uma destas situaes. Lembre-se


que as consideraes anteriores em relao aos passos para formula-
o dos testes de hipteses permanecem as mesmas.
A grande diferena que voc vai ver ocorre s na determinao
das hipteses a serem testadas. A hiptese Ho ser:

Ho : 1 1 = d 0

Onde: 1: mdia da populao 1 e 2: mdia da populao 2.

J do corresponde a uma diferena qualquer que voc deseje tes-


tar. Geralmente, quando queremos saber se as mdias das duas popu-
laes so estatisticamente iguais, utilizamos o valor de do igual a zero.
As hipteses alternativas seguem a mesma linha de raciocnio.
Abaixo temos um quadro que nos auxiliar a visualizar estas conside-
raes.

Ho H1

1 2 < d0
1 2 = d0 1 2 > d0
1 2 d0

importante ressaltar que, se as hipteses alternativas forem


unilaterais, o sinal da hiptese Ho ser menor ou igual, maior ou
igual, dependendo da hiptese alternativa, apesar de utilizarmos a
notao de igual (conforme comentado anteriormente).
Todas as outras consideraes em relao aos testes de hiptese
permanecem as mesmas. Vamos, ento, procurar entender cada situa-
o para os testes de hipteses para diferena entre mdias.

1 situao: amostras independentes e grandes (n>30).


Como estamos trabalhando aqui com amostras grandes, ou quan-
do se conhecem os desvios-padro populacionais, devemos trabalhar
com a distribuio amostral de Z (raciocnio semelhante ao utilizado

112
Mdulo 4

no teste de hiptese para uma mdia). Portanto, a estatstica do teste


ser dada por:

Onde: x1: mdia da amostra 1; x2: mdia da amostra 2 1: mdia


da populao 1; 2: mdia da populao 2; 12: varincia da popula-
o 1; 22: varincia da populao 2; n1: tamanho da amostra 1 e n2
tamanho da amostra 2.

OBS: se trabalharmos com amostras grandes podere-


mos substituir as varincias populacionais pelas
varincias amostrais.

Vamos, ento, ver como podemos aplicar o teste de hiptese


para a diferena entre mdias nesta situao.
Foram retiradas amostras de aparelhos usados de duas marcas, e
os resultados so apresentados na tabela a seguir. Verifique se as duas
marcas tm uma mesma durabilidade ou se so diferentes, com uma
significncia de 0,05.

Marcas A B

Mdia 1.160 1.140

Desvio-padro 90 80

tamanho amostra 100 100

113
Curso de Graduao em Administrao a Distncia

2 situao: amostras independentes e pequenas, mas que apre-


sentam varincias populacionais estatisticamente iguais.
Como as amostras com que estamos trabalhando so pequenas,
e as varincias populacionais, desconhecidas, ento, voc deve traba-
lhar com a distribuio t de Student.
Aqui consideraremos que as varincias populacionais so esta-
tisticamente iguais, pois esta situao influenciar nos clculos e, con-
seqentemente, no processo decisrio. Para saber se as varincias po-
dem ser consideradas iguais, deve-se fazer um teste da razo de duas
varincias (teste F) mostrado anteriormente.
A estatstica do teste ser dada por:

Aqui aparece um termo novo (Sp). Ele corresponde ao desvio-


padro ponderado pelos graus de liberdade, ou seja, calculamos um
novo desvio-padro, no qual o fator de ponderao corresponde ao
grau de liberdade de cada amostra. Veja a seguir:

Para voc encontrar o valor tabelado que limita as regies de


aceitao e rejeio na tabela t de Student (revise na Unidade 3), o
nmero de graus de liberdade (v) ser dado por:

Vamos agora resolver um exemplo.


Um treinamento na rea contbil de um grupo empresarial mi-
nistrado a 12 profissionais pelo mtodo convencional. Um segundo
grupo de dez profissionais recebeu o mesmo treinamento por um m-
todo programado. Os resultados de notas dos dois mtodos so apre-
sentados na tabela a seguir. Determine se h diferena entre os dois
mtodos considerando uma significncia de 0,01.

114
Mdulo 4

Mtodo Convencional Programado

Mdia 85 81

Desvio-padro 4 5

OBS: no teste F, no foram encontradas diferenas entre as


varincias populacionais.

Agora voc deve resolver o seguinte exerccio:


Exerccio 2: duas tcnicas de venda so aplicadas em dois gru-
pos de vendedores. A tcnica A foi aplicada em um grupo de 12 ven-
dedores, resultando em um nmero de vendas efetivadas em mdia de
76 e uma varincia de 50. J a tcnica B foi aplicada em um grupo de
15 vendedores, resultando em um nmero de vendas efetivadas em
mdia de 68 e uma varincia de 75. Considerando as varincias esta-
tisticamente iguais, e com uma significncia de 0,05, verifique se as
mdias so estatisticamente iguais.

3 situao: amostras independentes e pequenas, mas que apre-


sentam varincias populacionais estatisticamente desiguais. A diferena
desta situao para a anterior que voc considera que as populaes
apresentam varincias estatisticamente desiguais. Tambm utilizare-

115
Curso de Graduao em Administrao a Distncia

mos a estatstica do teste a partir da distribuio t de Student. A esta-


tstica-teste ser dada por:

Outra diferena esta no clculo do nmero de graus de liberda-


de, pois nesta situao utilizaremos uma aproximao que dada pela
expresso a seguir:

Se este valor calculado apresentar valores decimais, deve ser feito


o arredondamento para um nmero inteiro. Vamos a um exemplo.
Para estudar o efeito da certificao ambiental no valor de em-
presas, consideraram-se amostras de empresas da mesma rea, com e
sem certificao ambiental. Obtiveram-se os seguintes resultados. Aps
ter sido testado, verificou-se que as populaes apresentam varincias
desiguais. Teste a hiptese de que os dois padres de empresas apre-
sentam mdias de valor diferentes.
Mtodo Com certificao ambiental Semcertificao ambiental

Mdia 24,0 13,3

Desvio-padro 1,7 2,7

N 8 21

116
Mdulo 4

Resolva agora este exerccio:

Exerccio 3: um empresrio deseja saber se h futuros profissio-


nais mais promissores em escolas de regies pobres e de regies ricas.
Uma amostra de 16 estudantes de uma zona pobre resultou em um
teste especfico, uma mdia de 107 pontos e um desvio-padro de 10
pontos. J 14 estudantes de regio rica apresentaram uma mdia de
112 pontos e um desvio-padro de 8 pontos. Voc deve verificar se a
mdia dos pontos dos dois grupos diferente ou igual, para que o
empresrio possa saber se ele pode investir em qualquer uma das re-
as ou uma das reas mais promissora (primeiro, verifique se as
varincias so estatisticamente iguais ou diferentes).

4 situao: amostras dependentes.


Relembrando, amostras dependentes ocorrem quando se faz uma
interveno e se deseja saber se os resultados antes da interveno so
iguais aos resultados depois da interveno.
Um ponto importante nesta situao que so calculadas pri-
meiramente as diferenas de antes e depois. Esta diferena chamada
de di. Ento, voc pode ver que:
di = valor antes - valor depois
Com base nestas diferenas (di) voc vai calcular a mdia (D) e
o desvio- padro destas diferenas (SD)

Veja que estas frmulas so iguais s de clculo da mdia e des-


vio-padro apresentados na Unidade 1. Neste caso, no lugar da vari-
vel x, so utilizados os valores de di (diferenas).
Com estes valores, a estatstica teste ser dada por:

117
Curso de Graduao em Administrao a Distncia

O valor de n corresponde ao nmero de diferenas calculadas, e


o grau de liberdade para ser olhado na tabela t de Student ser dado
por n - 1.
Em um estudo, procurou-se investigar a no-eficcia de uma
propaganda na percepo de clientes. O Quadro a seguir d os resul-
tados de pessoas selecionadas anteriormente. No nvel de 5% de
significncia, teste a afirmao de que as percepes sensoriais so
inferiores aps a propaganda, ou seja, a propaganda no eficaz. (Os
valores se referem a antes e depois da propaganda; medidas em uma
escala de zero a doze.)

Pessoa A B C D E F G H

Antes 6,6 6,5 9,0 10,3 11,3 8,1 6,3 11,6

Depois 6,8 2,4 7,4 8,5 8,1 6,1 3,4 2,0

Teste de hiptese para diferena entre propores

Em diversas situaes, o que nos interessa saber se a propor-


o de sucessos (evento de interesse) em duas populaes apresenta a
mesma proporo ou no. Neste caso, os dados seguem uma distribui-
o de Bernoulli (vista na Unidade 2) com mdia p e varincia pq.
Portanto, a expresso da estatstica-teste (no caso utilizaremos a distri-
buio de Z) ser dada por:

118
Mdulo 4

Nesta expresso, voc tem:

correspondem proporo de sucesso nas amostras 1


e 2, respectivamente.
p1 e p2 correspondem proporo de sucesso nas populaes
1 e 2, respectivamente.

Voc deve se lembrar que a proporo de fracasso (q) dada


por um, menos a proporo de sucesso.
Vejamos, ento, como aplicar o teste da diferena de propores.
Uma questo de teste considerada boa, se permitir discriminar
entre estudantes preparados e estudantes no preparados. A primeira
questo de um teste foi respondida corretamente por 62, dentre 80
alunos preparados, e por 23, dentre 50 alunos no preparados. Com
um nvel de 5% de significncia, teste a afirmao de que esta questo
foi respondida corretamente por uma proporo maior de estudantes
preparados.

Teste do qui-quadrado de independncia

O teste do qui-quadrado de independncia est associado a duas


variveis qualitativas, ou seja, uma anlise bidimensional (visto na
Unidade 2). Voc se lembra que as tabelas de contingncia permitem
verificar a relao de dependncia entre as duas variveis analisadas.

119
Curso de Graduao em Administrao a Distncia

Neste caso, procura-se calcular a freqncia de ocorrncia das


caractersticas dos eventos a serem estudados. Por exemplo, podemos
estudar a relao entre o sexo de pessoas (masculino e feminino) e o
grau de aceitao do governo (ruim, mdio e bom). Ento, voc vai
obter, por exemplo, o nmero de pessoas (freqncia) que so do sexo
feminino e que acham o governo bom. Todos os cruzamentos das duas
variveis so calculados.
Vamos apresentar a voc, como exemplo, os possveis resulta-
dos da situao apresentada anteriormente (dados simulados).

Funo
Sexo
Ruim Mdio Bom Total

Masculino 157 27 74 258

Feminino 206 0 10 216

Total 363 27 84 474

Podemos, ento, querer determinar o grau de associao entre


essas duas variveis, ou seja, se o grau de aceitao do governo de-
pende do sexo ou existe uma relao de dependncia.
As hipteses a serem testadas so:

Ho: varivel linha independe da varivel coluna


H1: varivel linha est associada com a varivel coluna

A estatstica de qui-quadrado ser dada por meio da seguinte


expresso:

Onde o valor k corresponde ao nmero de classes (freqncias


encontradas). Voc pode verificar que fo corresponde freqncia
observada, ou seja, o valor encontrado na tabela de contingncia.
J fe corresponde freqncia esperada caso as variveis no
tenham nenhuma relao de dependncia, ou seja, as duas variveis

120
Mdulo 4

sejam independentes. Em funo desta definio, a freqncia espera-


da (fe) ser obtida por:

Neste caso, os graus de liberdade (v), para que possamos olhar a


tabela de qui-quadrado, so dados por:

v = (h-1) (k-1) nas tabelas com h linhas e k colunas

Ento, para cada clula da tabela de contingncias, voc vai cal-


cular a diferena entre fe e. fo. Esta diferena elevada ao quadrado
para evitar que as diferenas positivas e negativas se anulem. A divi-
so pela freqncia esperada feita para obter diferenas em termos
relativos.
Para entendermos melhor o teste de qui-quadrado do tipo inde-
pendncia, vamos trabalhar com a seguinte situao: para testar se
determinada droga era capaz de inibir a absoro de lcool pelo orga-
nismo humano, realizou-se um experimento com a participao de 60
voluntrios (homens saudveis, idade entre 25 e 28 anos). Metade dos
voluntrios tomou a droga, e a outra metade no tomou. Todos os
voluntrios tomaram duas doses de usque. Uma hora mais tarde, sele-
cionou-se uma amostra do sangue de cada sujeito, observando-se os
resultados a seguir. Usando 5% de significncia, pode-se concluir que
o resultado do teste est associado ingesto da droga?

Teste Droga Presena de lcool Ausncia de lcool

Tomaram 8 32

No tomaram 16 40

Ho: Presena ou ausncia de lcool independe de tomar droga


H1: Presena ou ausncia de lcool est associado a tomar droga

121
Curso de Graduao em Administrao a Distncia

Teste Droga Presena de lcool Ausncia de lcool

56 . 24 Tomaram 8 (10) 32 (30) 40


= 14
96 No tomaram 16 (14) 40 (42) 56

24 72 96

Valores entre parnteses (fe)

v = (2-1) . (2-1) = 1 gl
= 0,05 Qui-quadrado tabelado = 3,8415

Como o valor calculado (0,914) foi menor do que o tabela-


do, ento o calculado caiu na regio de aceitao de Ho.
Portanto, no temos indcios para rejeitar a hiptese Ho, ou
seja, o uso da droga no levou a uma inibio da absoro
de lcool.

Anlise de varincia

A anlise de varincia um teste de hiptese utilizado para a


comparao de mais de duas populaes. Imagine que voc queira
comparar o grau de endividamento de empresas de trs setores (inds-
tria, comrcio e prestao de servios). Para a comparao, necess-
rio que voc tenha repeties, pois elas que mediro a variao do
acaso. Ento, voc deve selecionar uma amostra de dez empresas de
cada setor (repeties).
Para realizar uma anlise de varincia, dividimos a variao to-
tal de um conjunto de tratamentos a serem comparados com as suas

122
Mdulo 4

respectivas repeties. No nosso exemplo, os setores da indstria


correspondem aos tratamentos. Voc tem, ento, dois componentes:
variao ENTRE e variao DENTRO.
A variao ENTRE corresponde variao encontrada entre as
mdias dos tratamentos, em relao a uma mdia geral. Esta variao
mede a diferena que ocorre entre os tratamentos.
J a variao DENTRO do tratamento, como o prprio nome
diz, a variao que ocorre entre as repeties de cada tratamento.
Voc pode ver que as avaliaes das repeties dentro de cada trata-
mento correspondem variao do acaso. Ento, voc tem o quadro a
seguir, que sintetiza tudo o que discutimos.

Vamos, ento, aprender a calcular a variao ENTRE, DEN-


TRO E TOTAL.
Aqui sero apresentadas expresses simplificadas para o clcu-
lo das variaes. Estas variaes correspondem a clculos de somas
de quadrados, semelhantes s aprendidas na Unidade 1 para clculo
da varincia.
A variao ENTRE tratamento aquela atribuda estritamente
variabilidade das mdias dos tratamentos em relao mdia geral.
A variao DENTRO de tratamentos aquela devida variao
de cada observao em relao mdia do tratamento. a variao
devida a todas as fontes que causam variaes nos experimentos (aca-
so), excetuando os tratamentos.
A variao total a variao de cada observao em relao
mdia geral. Ento, temos a seguir as expresses para clculo das so-
mas de quadrados:

123
Curso de Graduao em Administrao a Distncia

Onde: y: mdia geral de todos os tratamentos; r: nmero de re-


peties e t: nmero de tratamentos.

Como voc sabe, a variao TOTAL igual variao ENTRE


mais variao DENTRO. Portanto, o clculo da variao DENTRO
(efeitos do acaso) ou a soma de quadrados DENTRO obtida por
meio da seguinte diferena:

SQDENTRO = SQTOTAL SQENTRE

O valor da soma de quadrado DENTRO obtido por diferena,


devido maior dificuldade de sua obteno, principalmente em es-
quemas de anlise de varincia mais complexos.
Esse tipo de anlise de varincia chamado de anlise com um
fator ou de um critrio. o mais simples de todos os esquemas de
anlise de varincia, sendo recomendado quando todas as condies
experimentais so homogneas (no h uma variao em uma deter-
minada direo). prprio para situaes (experimentos) nas quais se
possa garantir homogeneidade.
Este processo foi desenvolvido por Fisher com o objetivo de
repartir a varincia de uma varivel aleatria em partes ortogonais (in-
dependentes) correspondentes a tratamentos (fator) e erro experimen-
tal (variaes do acaso).
Voc pode vislumbrar agora que os objetivos da anlise de
varincia so obter estimativas precisas das mdias dos tratamentos,

124
Mdulo 4

diferenas entre mdias e testar hipteses sobre igualdade de mdias


de tratamentos.
As hipteses na anlise de varincia so:

Ho: t1= t2 = ... = tt (no existe diferena entre as mdias dos


tratamentos)
H1: no mnimo, um dos tratamentos difere dos demais.

Na anlise de varincia, so obtidas os quadrados mdios (QM),


que so estimativas no tendenciosas das varincias envolvidas na
anlise. Da vem o nome anlise de varincia. Estes quadrados mdios
so obtidos pela diviso da soma de quadrado pelo respectivo grau de
liberdade. Ento, voc tem:

A forma pela qual voc obtm os graus de liberdade apresen-


tada a seguir:

Fonte de Variao G. L. (grau de liberdade)

Tratamento (Entre) t 1 = nmero de tratamentos menos um

Resduo (Dentro) t (r 1) = nmero de tratamento vezes numero de repeties menos um

Total tr 1 = nmero de tratamento vezes numero de repeties menos um

Ento, voc precisa testar se a varincia do fator (ENTRE) dife-


re da varincia do acaso (DENTRO). A distribuio amostral que voc
estudou na Unidade 3, que compara duas varincias, a distribuio
F ou da razo de duas varincias.
Portanto, voc pode utilizar o teste de F para verificar a validade
da hiptese Ho descrita anteriormente. O teste apresentado a seguir:

Comparamos o valor calculado na anlise de varincia com o


valor de tabela F (v1, v2), em que v1 e v2 so, respectivamente, os

125
Curso de Graduao em Administrao a Distncia

graus de liberdade de tratamentos e de resduos. Se Fcalc > Ftab, te-


mos que o experimento foi significativo, ou seja, indica que existe
uma probabilidade superior a 1 de que pelo menos um dos trata-
mentos difere dos demais.
O quadro da anlise de varincia pode ser resumido da seguinte
forma:

Fonte de Variao G. L. S. Q. Q. M. Fcalc F (v1,v2)

Tratamento t-1 SQTrat QMTrat F calculado F tabela


Resduo t(r-1) SQResduo QMResduo

Total tr-1 SQTotal

G. L. = graus de liberdade

Vamos, ento, fazer um exemplo para entender melhor esta an-


lise: com o objetivo de comparar um determinado ndice inflacionrio
em trs regies metropolitanas em um perodo de cinco meses, voc
obteve os resultados apresentados a seguir. Verifique, por meio de uma
anlise de varincia, se as mdias so estatisticamente iguais ou no.

Regies Metropolitanas
Meses R1 R2 R3

1 1,60 1,20 2,00

2 2,00 1,10 1,80

3 2,20 1,20 1,40

4 1,70 1,30 1,60

5 1,80 1,00 1,90

Total 5,30 5,80 8,70

As hipteses desta anlise de varincia so:

Ho: R1= R2 = R3 (no existe diferena entre as mdias das


regies)
H1: pelo menos uma das regies difere das demais em mdia.

126
Mdulo 4

As repeties, ou seja, os meses so independentes, pois so


considerados apenas repeties.

OBS: o teste F para anlise de varincia ser sempre um teste


unilateral direita, em funo do tipo de hiptese alternativa.

Clculos das somas de quadrados:

FV GL SQ QM Fcal Significncia

Entre 2 1,401 0,701 1.,2943 0,0006

Dentro 12 0,516 0,043

Total 14 1,9173

Tabela 8: Anlise de varincia

Concluso: existe diferena significativa entre as regies, pois


o F tabelado (tabela de 5% e v1=2 gl e v2 = 12 gl) foi menor
do que o calculado (16,29), fazendo assim com que o F cal-
culado tenha cado na regio de rejeio da hiptese Ho.

127
Curso de Graduao em Administrao a Distncia

Saiba mais...
Mais exerccios referentes ao assunto esto no site:
http://www.famat.ufu.br/prof/marcelo/exercicios.htm

Respostas dos exerccios propostos

Unidade 1

Exerccio 1:

a)
Classes Freqncias absolutas

38,5 | 43,5 3

43,5 | 48,5 4

48,5 | 53,5 7

53,5 | 58,5 4

58,5 | 63,5 2

Total 20

Classes Freqncia acumulada para baixo

abaixo de 43,5 3

abaixo de 48,5 7

abaixo de 53,5 14

abaixo de 58,5 18

abaixo de 63,5 20

Classes Freqncia acumulada para cima

acima de 38,5 20

acima de 43,5 17

acima de 48,5 13

acima de 53,5 6

acima de 58,5 2

128
Mdulo 4

b) variao entre nmero das classes variao de freqncias

5 ------------------------------------------------ 7

1,5 --------------------------------------------- x

; como abaixo de 48,5 temos 7, e entre 48,5 e

53,5 temos 5, ento, abaixo de 50, teremos: 7 +2,1 = 9,1.

Exerccio 2:
j) Mdia = 715,5 reais; Mediana = 708,82; Moda = 669,23
k) Desvio-padro = 13,79 e coeficiente de variao = 1,92%
l) R: 950
m) R: 100
n) R: 0,155
o) R: 262
p) R: 194
q) R: 138
r) 3 classe

Exerccio 3:
x = 210; s = 10,96; CV = 5,22%; Md = 180; Mo = 100

Exerccio 4:
Mdia = 682,35

Exerccio 5:
Sim. Apresentam o mesmo CV.

Unidade 2

Exerccio 1:
R: 1 (1/3 * 1/5 * 3/10) = 0,98

Exerccio 2:
a) R: 0,125; b) R: 0,0694; c) R: 0,1388

129
Curso de Graduao em Administrao a Distncia

Exerccio 3:
a1) R: 60/100; a2) R: 40/100; a3) R: 24/100; a4) R: 76/100

Exerccio 4:
R: 0,05/0,25 = 0,2

Exerccio 5:
a) R: 0,4; b) R:0,9; c) R:0,6;
d) R: 0 1 2 3 4

0,1 0,3 0,6 0,9 1

e) R: 0,9. Probabilidade de alugar no mximo trs caminhes.

Exerccio 6:
R: 0,0089

Exerccio 7:
R: P (X = 5) = = 0,03192

Exerccio 8:
Distribuio binomial com n = 4 e p =
a) R: P(x=2) . 2.000 = 0,3750 . 2.000 = 750 famlias
b) R: [P(1) + P(2)] . 2.000 = (0,25 + 0,375) . 2.000 = 1.250 famlias
c) R: P(0) . 2.000 = 0,0625 . 2.000 = 125 famlias

Exerccio 9:
R: P(X = 4) = = 0,13614

Exerccio 10:
R: 1 [P(0) + P(1)], onde a distribuio de probabilidade uma
Poisson com parmetro lambda.
a) = 1,4 R = 0,40817
b) = 2,8 R = 0,76892
c) = 5,6 R = 0,97559

130
Mdulo 4

Exerccio 11:

Para X = 2200

Para X = 1700

Exerccio 12:
a) X = 20 Z = 0

X = 24
P(20 < X < 24) = P(0 < Z < 0,8) = 0,2881 (28,81 %).

b) X = 16
X = 20 Z = 0
P(16 < X < 20) = P (-0,8 < Z < 0) = P(0 < Z < 0,8) = 0,2881 = 28,81
c) X = 28 Z = (28 - 20 )/ 5 = 1,6
P( X > 28) = P (Z > 1,6) = 0,5 0,4452 = 0,0548

Exerccio 13:
seja X a mnima mdia.
O Z correspondente 1,04 (aproximadamente)

Unidade 3

Exerccio 1:
n1 = 101; n2 = 60; n3 = 39
Exerccio 2:
a) a = 2,160; b) a = 1,708; c) a = 1,725
Exerccio 3:
a) a = 34,4789; b) a = 10,2829; c) a = 7,2609
Exerccio 4:
a) a = 2,092; b) a = 2,092; c) a = 2,075

131
Curso de Graduao em Administrao a Distncia

Unidade 4

Exerccio 1:
(Sugesto: siga os passos para realizar um teste de hiptese.)

Como o valor calculado foi maior que o tabelado (1,64), ele caiu
na regio de rejeio de Ho.

Exerccio 2:

Como o valor calculado foi maior que o tabelado (2,060), ele


caiu na regio de rejeio de Ho.

Exerccio 3:

v=29,7425 =30 (graus de liberdade obtido pela aproximao)


t0,025 = 2,042 ( com 30 gl )

Concluso: como o valor calculado caiu na regio de aceitao,


ento as mdias so estatisticamente iguais, o que indica que as duas
regies apresentam o mesmo potencial.

132
Mdulo 4

REFERNCIAS

ARANGO, H. G. Bioestatstica Terica e Computacional.


Rio de Janeiro: Guanabara Koogan, 2001

BARBETTA, P. A. Estatstica Aplicada s Cincias Sociais.


4 ed. Florianpolis: Ed. da UFSC, 2002.

BEIGUELMAN, B. Curso Prtico de Bioestatstica. Ribeiro Preto:


Revista Brasileira de Gentica, 1996.

BRAULE, Ricardo. Estatstica Aplicada com Excel: para cursos de


Administrao e Economia. Rio de Janeiro: Campus, 2001.

BUSSAB, W. O.; MORETTIN, P. Estatstica Bsica. So Paulo:


Atual, 2002.

COSTA NETO, P. L. de O. Estatstica. So Paulo: Edgard Blcher,


2002.

DOWNING, D.; CLARK, J. Estatstica Aplicada. So Paulo:


Saraiva, 2000.

FONSECA, Jairo Simon da; MARTINS, Gilberto de Andrade. Curso


de Estatstica. Rio de Janeiro: LTC, 1982.

FREUD, J. E.; SIMON, G. A. Estatstica aplicada. Bookman, 2000,


403 p.

LEVINE, D. M.; BERENSON, M. L.; STEPHAN, D. Estatstica:


teoria e aplicaes (usando o Microsoft Excel em portugus). LTC,
2000, 812 p.

MORETTIN, L. G. Estatstica Bsica: Probabilidade. V. 1. So


Paulo: Makron Books, 1999.

________. Estatstica Bsica: Inferncia. V. 2. So Paulo: Makron


Books, 1999.

SOARES, J. F.; FARIAS, A. A.; CESAR, C. C. Introduo


Estatstica. Rio de Janeiro: LTC, 1991.

SPIEGEL, M. Probabilidade e Estatstica. Mc Graw Hill. 1993.

133
Curso de Graduao em Administrao a Distncia

STEVENSON, William J. Estatstica Aplicada Administrao.


So Paulo: Harper, 1981.

TRIOLA, M. F. Introduo Estatstica. Rio de Janeiro: LTC,


1999.

WONNACOTT, T. H., WONNACOTT, R. J. Estatstica Aplicada


Economia e Administrao. Rio de Janeiro: LTC,1981.

134
Mdulo 4

Anexos

Tabela 1: rea sob a curva normal padronizada compreendida entre os valores 0 e Z

135
Curso de Graduao em Administrao a Distncia

Tabela 2: Limites unilaterais da distribuio t de Student ao nvel de probabilidade

136
137
Mdulo 4

Tabela 3: Limites unilaterais da distribuio de 2 ao nvel de probabilidade


Curso de Graduao em Administrao a Distncia

138
Tabela 4: Limites unilaterais da distribuio F de Fisher-Snedecor ao nvel de 10% de probabilidade
139
Mdulo 4

Tabela 5: Limites unilaterais da distribuio F de Fisher-Snedecor ao nvel de 5% de probabilidade


Curso de Graduao em Administrao a Distncia

140
141
Mdulo 4

Tabela 6: Limites unilaterais da distribuio F de Fisher-Snedecor ao nvel de 2,5% de probabilidade


Curso de Graduao em Administrao a Distncia

Tabela 7: Limites unilaterais da distribuio F de Fisher-Snedecor ao nvel de 1,0% de probabilidade

142

Das könnte Ihnen auch gefallen