You are on page 1of 17

1.

Introdução
O sucesso de uma análise estatística envolve aspectos importantes sobre as formas de
amostragem. Neste sentido, não basta que se saiba descrever convenientemente os
dados de uma amostra e que se dominem perfeitamente as técnicas estatísticas para
que se possa executar, com êxito, um trabalho estatístico completo. Antes de tudo, é
preciso garantir que a amostra ou amostras que serão usadas sejam obtidas por
processos adequados. Se erros grosseiros forem cometidos no momento de seleccionar
os elementos da amostra, o trabalho todo ficará comprometido e os resultados finais
serão provavelmente bastante incorretos. Deve-se, portanto, tomar especial cuidado
quanto aos critérios que serão usados na selecção da amostra. O que é necessário
garantir, em suma, é que a amostra seja representativa da população. Isso significa que,
a menos de certas pequenas discrepâncias inerentes à aleatoriedade sempre presente,
em maior ou menor grau, no processo de amostragem, a amostra deve possuir as
mesmas características básicas da população, no que diz respeito às variáveis que se
desejam pesquisar.
Os problemas de amostragem podem ser mais ou menos complexos e sutis,
dependendo das populações e das variáveis que se desejam estudar.
Em resumo, a obtenção de soluções adequadas para o problema de amostragem exige,
em geral, muito bom senso e experiência. Além disso, é muitas vezes conveniente que
o trabalho do estatístico seja complementado pelo de um especialista do assunto em
questão.
2. Conceitos preliminares

População
Universo ou população é o conjunto dos elementos a serem estudados que contêm
uma característica em comum.
Unidade Amostral
As unidades amostrais são as unidades selecionadas para se chegar aos elementos da
própria população. Podem ser os próprios elementos da população, quando há acesso
direto a eles, ou qualquer outra unidade que possibilite chegar até eles.
Amostra
Uma amostra trata-se de um subconjunto do universo ou da população, por meio do
qual se estabelecem ou se estimam as características desse universo ou população.
Amostragem
Processos de obtenção de uma amostra a partir de uma população.

3. Métodos de Amostragem
“A amostragem será probabilística (aleatória) se todos os elementos da população
tiverem probabilidade conhecida, e diferente de zero, de pertencer à amostra. Caso
contrário, a amostragem será não-probabilística (não-aleatória).”
A amostragem probabilística pode ser classificada em:

 Amostragem Aleatória Simples;


 Amostragem Aleatória Sistemática;
 Amostragem Estratificada;
 Amostragem por Conglomerados ou Clusters;
 Amostragem por multi-etapas, e
 Amostragem multi-fásica.
A amostragem não-probabilística pode ser classificada em:

 Amostragem Acidental;
 Amostragem intencional;
 Amostragem a esmo ou sem norma;
 Amostragem sequencial;
 Amostragem snowball ou bola de neve, e
 Amostragem por quotas.
3.1. Amostragem Probabilística

3.1.1. Amostragem Aleatória Simples


Esse tipo de amostragem, também chamada simples ao acaso, aleatória, casual, simples,
elementar, randômica, etc., é equivalente a um sorteio lotérico. Nela, todos os
elementos da população têm igual probabilidade de pertencer à amostra, e todas as
possíveis amostras têm também igual probabilidade de ocorrer.
Este tipo de amostragem probabilística somente é recomendável se a população for
homogénea em relação à variável de interesse.
Sendo 𝑁 o número de elementos da população e 𝑛 o número de elementos da amostra,
𝑛
cada elemento da população tem probabilidade 𝑁 de pertencer à amostra. A essa
𝑛
relação denomina-se fração de amostragem. Por outro lado, sendo a amostragem
𝑁
feita sem reposição, a suposição que fazemos em geral, é que existem (𝑛) possíveis
amostras, todas igualmente prováveis. Na prática, a amostragem simples ao acaso pode
ser realizada numerando-se a população de 1 a 𝑁, sorteando-se, a seguir, por meio de
um dispositivo aleatório qualquer, 𝑛 números dessa sequência, os quais corresponderão
aos elementos sorteados para a amostra. Um instrumento útil para realizar o sorteio
acima descrito é a tabela de números ao acaso. Tal tabela é simplesmente constituída
por inúmeros dígitos que foram obtidos por algum processo equivalente a um sorteio.
Procedimentos:
1. Enumerar os 𝑁 elementos da população;
2. Sortear, sem reposição, 𝑛 números compreendidos entre 1 a 𝑁;
3. Os elementos correspondentes aos números escolhidos formarão a amostra de
n elementos;
Exemplo 1: Dada uma população de 200 elementos (𝑁 = 200), seleccione uma amostra
de 12 elementos (𝑛 = 12).
1. Enumeram-se os elementos da seguinte forma: 000, 001, 002, … , 𝑁
2. Sortear, sem reposição, 20 números aleatórios da tabela de números aleatórios
188 119 72 118 153 70
157 36 181 148 70 107

3. Os elementos cujas posições coincidem com os números da tabela, farão parte


da amostra.
Exemplo 2: Queremos realizar uma pesquisa de opinião sobre a qualidade do curso de
Engenharia Eléctrica no ISPSongo, que tem cerca de 300 estudantes, perguntando
aspectos relactivos ao encadeamento das disciplinas no currículo. Decidimos utilizar
amostragem aleatória simples para selecionar os respondentes. Este método de
amostragem é o mais apropriado? A amostragem aleatória simples pode ser utilizada
quando houver homogeneidade na população em relação à variável de interesse. No
presente caso estamos interessados na opinião dos estudantes sobre o currículo. É
razoável imaginar que um aluno do primeiro ano tenha um conhecimento diferente do
currículo do que outro do terceiro ano, acarretando em diferentes opiniões, que
deveriam ser registradas. Se utilizarmos uma amostragem aleatória simples, totalmente
por acaso, apenas alunos dos anos mais adiantados, ou dos anos iniciais,
comprometendo o resultado da pesquisa. Assim, como não há homogeneidade na
população acerca da variável de interesse, a amostragem aleatória simples não é
apropriada para este caso.
3.1.2. Amostragem Aleatória Sistemática
Quando os elementos da população se apresentam ordenados e a retirada dos
elementos da amostra é feita periodicamente, temos uma amostragem sistemática.
Quando a lista de respondentes for muito grande a utilização de amostragem aleatória
simples pode ser um processo moroso. Utiliza-se então uma variação, a amostragem
sistemática, que também supõe que a população é homogénea em relação à variável de
interesse.
Assim, por exemplo, em uma linha de produção, podemos, a cada dez itens produzidos,
retirar um para pertencer a uma amostra da produção diária.
Procedimentos:
1. Definir a quantidade de elementos da amostra
𝑁
2. Obter um intervalo de amostragem 𝐾; 𝐾 = 𝑖𝑛𝑡( 𝑛 )
3. Sortear um número 𝑟 inteiro entre 1 e 𝐾.
4. A amostra será composta pelos elementos na ordem: (𝑟, 𝑟 + 𝑘, 𝑟 + 2𝑘 …)
Exemplo 3: Em uma população de 100 elementos, deseja-se uma obter uma amostra de
10 elementos.
1. 𝑁 = 100
100
2. 𝐾 = 10 = 10
3. Seja 𝑟 = 3
4. 𝑟1 = 3;
𝑟2 = 3 + 10 = 13;
𝑟3 = 3 + 2 ∗ 10 = 23

𝑟10 = 3 + 9 ∗ 10 = 93
A amostra consistirá dos elementos {3,13,23,33,43,53,63,73,83,93}.
3.1.3. Amostragem Estratificada
Muitas vezes a população se divide em subpopulações ou estratos, sendo razoável supor
que, de estrato para estrato, a variável de interesse apresente um comportamento
substancialmente diverso, tendo, entretanto, comportamento razoavelmente
homogéneo dentro de cada estrato. Em tais casos, se o sorteio dos elementos da
amostra for realizado sem se levar em consideração a existência dos estratos, pode
acontecer que os diversos estratos não sejam convenientemente representados na
amostra, a qual seria mais influenciada pelas características da variável nos estratos
mais favorecidos pelo sorteio. Evidentemente, a tendência da ocorrência de tal facto
será tanto maior quanto menor o tamanho da amostra. Para evitar isso, pode-se adotar
uma amostragem estratificada.
A amostragem estratificada consiste em especificar quantos elementos da amostra
serão retirados em cada estrato.
É costume considerar três tipos de amostragem estratificada: uniforme, proporcional e
óptima. Na amostragem estratificada uniforme, sorteia-se igual número de elementos
em cada estrato. Na proporcional, o número de elementos sorteados em cada estrato é
proporcional ao número de elementos existentes no estrato. Evidentemente, a
amostragem estratificada uniforme será, em geral, recomendável se os estratos da
população forem pelo menos aproximadamente do mesmo tamanho; caso contrário,
será em geral preferível a estratificação proporcional, por fornecer uma amostra mais
representativa da população. A amostragem estratificada óptima, por sua vez, toma, em
cada estrato, um número de elementos proporcional ao número de elementos do
estrato e também à variação da variável de interesse no estrato, medida pelo seu desvio
padrão. Pretende-se assim otimizar a obtenção de informações sobre a população, com
base no princípio de que, onde a variação é menor, menos elementos são necessários
para bem caracterizar o comportamento da variável.
Dessa forma, com um menor número total de elementos na amostra, conseguir-se-ia
uma quantidade de informação equivalente à obtida nos demais casos. As principais
dificuldades para a utilização desse tipo de amostragem residem nas complicações
teóricas relacionadas com a análise dos dados e em que, muitas vezes, não podemos
avaliar de antemão o desvio-padrão da variável nos diversos estratos. Constituem
exemplos em que uma amostragem estratificada parece ser recomendável a
estratificação de uma cidade em bairros, quando se deseja investigar alguma variável
relacionada à renda familiar; a estratificação de uma população humana em homens e
mulheres, ou por faixas etárias; a estratificação de uma população de estudantes
conforme suas especializações, etc.
Procedimentos:
1. Dividir a população em 𝐿 subpopulações chamadas estratos.
𝑛
2. Calcular a fração f da amostragem dada por 𝑓 = 𝑁 ;
3. Calcular o número de elementos a serem sorteados em cada estrato
𝑛𝑖 = 𝑁𝑖 . 𝑓;
4. Realizar a amostragem aleatória simples dentro de cada estrato.
Exemplo 4: Um estudo deve ser feito para se apurar a preferência em marcas de
smartphones na cidade de Inhambane. Para isso, os especialistas têm uma população
de 10000 pessoas distribuídas por 4 grupos: 5000 são adolescentes, 2500 são jovens,
1500 são adultos e 1000 são idosos.
Os especialistas estimaram que a amostra deve ter no mínimo 500 pessoas para se
considerar representativa.
a) Determine a taxa ou fracção de amostragem.
b) Determine, usando amostragem estratificada proporcional, o número de
pessoas que deverão ser extraídas em cada estrato.
Resolução:
𝑛 500
a) 𝑁 = 10000; 𝑛 = 500; 𝑓 = 𝑁 = 10000 = 0.05 = 5%
b) 𝑛𝑖 = 𝑁𝑖 . 𝑓
𝑁1 + 𝑁2 + 𝑁3 + 𝑁4 = 10000

Adolescentes 𝑵𝟏 = 𝟓𝟎𝟎𝟎 𝒏𝟏 = 𝟓𝟎𝟎𝟎 ∗ 𝟎. 𝟓 = 𝟐𝟓𝟎𝟎


Jovens 𝑁2 = 2500 𝑛2 = 2500 ∗ 0.5 = 1250
Adultos 𝑁3 = 1500 𝑛1 = 1500 ∗ 0.5 = 750
Idosos 𝑁4 = 1000 𝑛1 = 1000 ∗ 0.5 = 500
Total 10000 5000

3.1.4. Amostragem por Conglomerados ou Clusters


Quando a população apresenta uma subdivisão em pequenos grupos, chamados
conglomerados, é possível e muitas vezes conveniente fazer-se a amostragem por meio
desses conglomerados, a qual consiste em sortear um número suficiente de
conglomerados, cujos elementos constituirão a amostra. Ou seja, as unidades de
amostragem, sobre as quais é feito o sorteio, passam a ser os conglomerados e não mais
os elementos individuais da população. Esse tipo de amostragem é às vezes adotado por
motivos de ordem prática e económica.
Os conglomerados também são grupos mutuamente exclusivos de elementos da
população, mas são definidos de forma mais arbitrária do que os estratos: é bastante
comum definir os conglomerados geograficamente.
São exemplos de conglomerados: quarteirões, famílias, organizações, agências,
edifícios, etc.
Procedimentos:

 Divide-se a população em conglomerados;


 Sorteiam-se os conglomerados (usando tabela de números aleatórios ou
qualquer outro método não viciado);
 Pesquisam-se todos os elementos dos conglomerados sorteados, ou sorteiam-se
elementos deles.
Conglomerados vs Estratificada
A principal diferença entre a amostragem de conglomerados e a amostragem
estratificada é a unidade de amostragem.

 Conglomerados: Todos os conglomerados existentes; (Todas as cidades,


empresas, etc)
 Estratificada: Os elementos da população;
Exemplo 5: Dividir a população em conglomerados.

Elementos Conglomerados
Eleitores Domicílios
Trabalhadores Empresas
Alunos Escolas

3.1.5. Amostragem por multi-etapas


Amostragem multi-etapa é uma extensão do conceito de amostragem por
conglomerados. Esta amostragem é utilizada quando o tamanho dos conglomerados é
muito grande que torna não prático estudar todos os elementos que pertencem ao
conglomerado, e ao mesmo tempo os elementos nos conglomerados são homogéneos
de tal forma que pode-se estudar alguns elementos para conhecer toda a característica
do conglomerado.
O procedimento da amostragem em duas ou mais etapas consiste em seleccionar no
primeiro estágio uma amostra aleatória simples de conglomerados e no segundo
estágio, seleccionar uma amostra aleatória simples de unidades estatísticas em cada
conglomerado. O conjunto de todos os elementos obtidos nos conglomerados constitui
a amostra. Este processo pode multiplicar-se por mais de duas etapas.
3.1.6. Amostragem multi-fásica
Há que salientar algumas diferenças nestes dois processos de amostragem: multi-etapas
e multi-fásica. No primeiro processo as unidades amostrais variam de uma etapa para
outra, enquanto na amostragem multi-fásica define-se sempre a mesma unidade
amostral para todas as fases de extracção de amostra. Na primeira fase, recolhe-se dado
sobre determinadas características dos inquiridos. Estas informações servem de base
para definir uma segunda amostra que responderá a um questionário com um nível de
profundidade mais elevado.
3.2. Amostragem Não-Probabilística
A obtenção de uma amostra probabilística exige que se obtenha uma listagem com os
elementos da população. Em suma, exige acesso a todos os elementos da população,
que a população acessível seja igual à população alva. Nem sempre é possível obter tal
listagem na prática, o que teoricamente inviabilizaria a retirada de uma amostra
aleatória. Então deve-se recorrer à amostragem não probabilística.
Ao usar a amostragem não probabilística o pesquisador não sabe qual é a probabilidade
de que um elemento da população tem de pertencer à amostra. Portanto, os resultados
da amostra não podem ser estatisticamente generalizados para a população, porque
não se pode estimar o erro amostral. Se as características da população acessível forem
semelhantes às da população alvo os resultados podem ser equivalentes aos de uma
amostragem probabilística, mas não podemos garantir a sua confiabilidade.
Alguns dos usos habituais da amostragem não probabilística são os seguintes:
a) Como etapa preliminar em projetos de pesquisa;
b) Em projetos de pesquisa qualitativa;
c) Em casos onde a população de trabalho não pode ser enumerada.

3.2.1. Amostragem Acidental


A amostra acidental é um subconjunto da população formado por elementos que são
possíveis de obter até completar o número de elementos necessários para a amostra,
porém sem nenhuma segurança de que os elementos constituem uma amostra
exaustiva de todos subconjuntos possíveis do universo. Os elementos da amostra são
escolhidos por serem os mais acessíveis ou fáceis de serem avaliados.
Geralmente é utilizada nas investigações de opinião pública onde os entrevistados são
escolhidos acidentalmente, por exemplo, pesquisas de opinião entre amigos.
3.2.2. Amostragem intencional
O pesquisador deliberadamente escolhe alguns elementos para fazer parte da amostra,
com base no seu julgamento de aqueles seriam representativos da população. Este tipo
de amostragem é bastante usado em estudos qualitativos. Obviamente o risco de obter
uma amostra viciada é grande, pois se baseia totalmente nas preferências do
pesquisador, que pode se enganar (involuntária ou "voluntariamente").
3.2.3. Amostragem a esmo ou sem norma
Amostragem a esmo ou sem norma é a amostragem em que o pesquisador, para
simplificar o processo, procura ser aleatório sem, no entanto, realizar propriamente o
sorteio usando algum dispositivo aleatório confiável.
Os resultados da amostragem a esmo são, em geral, equivalentes aos de uma
amostragem probabilística se a população é homogênea e se não existe a possibilidade
do pesquisador ser inconscientemente influenciado por alguma característica dos
elementos da população.

3.2.4. Amostragem sequencial


Outro tipo de amostragem dirigida que pode ser considerada relactivamente
semelhante ao método multi-fásico é o da amostragem sequencial. A diferença é que
neste processo de amostragem, a realização da fase seguinte só é decidida depois de
analisados os resultados da fase anterior.

3.2.5. Amostragem snowball ou bola de neve


Particularmente importante quando é difícil identificar respondentes em potencial. A
cada novo respondente que é identificado e entrevistado, pede-se que identifique
outros que possam ser qualificados como respondentes.
Este processo de amostragem é praticamente aconselhado quando se pretende estimar
características relativamente raras na população total.
3.2.6. Amostragem por quotas
Análogo ao método de amostragem estratificada, porém sem a aleatoriedade das
amostras. Normalmente escolhidos por conveniência.
Parece semelhante a uma amostragem estratificada proporcional, da qual se diferencia
por não empregar sorteio na selecção dos elementos. A população é dividida em vários
subgrupos, na realidade é comum dividir em um grande número para compensar a falta
de aleatoriedade, e selecciona-se uma quota de cada subgrupo, proporcional ao seu
tamanho. Por exemplo, em uma pesquisa de opinião eleitoral poderíamos dividir a
população de eleitores por sexo, nível de instrução, faixas de renda entre outros
aspectos, e obter cotas proporcionais ao tamanho dos grupos. Na amostragem por cotas
os elementos da amostra são escolhidos pelos entrevistadores (de acordo com os
critérios...), geralmente em pontos de grande movimento, o que sempre acarreta certa
subjectividade (e impede que qualquer um que não esteja passando pelo local no exato
momento da pesquisa possa ser seleccionado). Na prática muitas pesquisas são
realizadas utilizando amostragem por quotas.
Procedimentos:
1. Classificação da população em termos de propriedades que se sabe, ou presume,
serem relevantes para a característica a ser estudada;
2. Determinação da proporção 𝑁1 , 𝑁2 , 𝑁3,…, 𝑁𝑘 da população para cada
característica, com base na constituição conhecida, presumida ou estimada, da
população 𝑁;
3. Fixação de quotas(𝑛𝑖 ) a selecionar no grupo 𝑁𝑖 para pertencer a amostra 𝑛𝑖 =
𝑛∗𝑁𝑖
.
𝑁

Exemplo 6: Seja uma população com N = 2000 unidades, divididas em três grupos com
N1 = 800; N2 = 700 e N3 = 500. Pretende-se extrair desta população uma amostra de
tamanho 500. Encontre as quotas ou percentagem que devem ser tiradas em cada
grupo.
Resolução:
A proporção dos elementos no subgrupo populacional é igual a proporção nos grupos
cuja soma formará o número das unidades na amostra: 𝑛𝑖 = 𝑛 ∗ 𝑝(𝑖)

Na População de tamanho N Na amostra de tamanho n


𝑵𝒊 𝑁𝑖 𝑃𝑖 (%) 𝑃𝑖 (%) 𝑛𝑖 𝑛𝑖
𝑵𝟏 800 40 40 200 𝑛1
𝑵𝟐 700 35 35 175 𝑛2
𝑵𝟑 500 25 25 125 𝑛3
Soma 2000 100 100 500 Soma

4. Determinação do tamanho de uma amostra


Os tamanhos das amostras são relactivos, isto é, depende do tamanho da população.
Para determinar as amostras existem várias fórmulas, consoante o parâmetro em
critério. As mais utilizadas são as que se baseiam na percentagem (proporção) do
fenómeno.
Existem alguns factores que determinam o tamanho de uma amostra, tais como:
1. Amplitude do universo
Os universos de pesquisa podem ser finitos ou infinitos. Convencionou-se que os finitos
são aqueles cujo número de elementos não excede a 100.000. Universos infinitos, por
sua vez, são aqueles que apresentam elementos em número superior a esse.
2. Nível de confiança estabelecido
O nível de confiança de uma amostra refere-se à área da curva normal definida a partir
dos desvios-padrão em relação à sua média.
1 desvio padrão = 68% de representatividade
2 desvios = 95,5% de seu total
3 desvios = 99,7% da amostra ou população
ATENÇÃO: quanto maior o nível de confiança,
maior o tamanho da população.

Curva normal
ou Sino
3. Erro máximo permitido
Os resultados obtidos numa pesquisa elaborada a partir de amostras não são
rigorosamente exatos em relação ao universo. Esses resultados apresentam sempre um
erro de medição. Nas pesquisas sociais trabalha-se usualmente com uma estimativa de
erro entre 3 e 5%.
ATENÇÃO: quanto maior a amostra, menor o erro.
4. - Percentagem com que o fenómeno se verifica
A estimação prévia da percentagem com que se verifica um fenômeno é muito
importante para a determinação do tamanho da amostra.
Se p > 50% - situação favorável para o estimador (pode-se ter uma amostra pequena);
Se p = 50% - situação não favorável para o estimador (a amostra deve ser grande)
Se p < 50% - situação muito desfavorável para o estimador (a amostra necessariamente
deve incluir o maior número possível de unidades do universo).
4.1. Cálculo do Tamanho da Amostra
Procedimentos:
1. Analisar o questionário, ou roteiro da entrevista e escolha uma variável que
julgue mais importante para o estudo. Se possível, escolha mais do que uma
variável.
2. Verificar o nível de mensuração da variável: se nominal, ordinal ou intervalar.
3. Considerar o tamanho da população: finita ou infinita.
4. Se a variável escolhida for intervalar e a população considerada infinita, pode-
se determinar o tamanho da amostra pela fórmula:
𝑍∗𝜎 2
𝑛=( )
𝑑

onde:

𝑍 = abscissa da distribuição normal padrão, fixado um nível de (1−∝)% de


confiança para construção do intervalo de confiança para a média.

 Se o nível for de 90%, 𝑍 = 1.645


 Se o nível for de 95,5%, 𝑍 = 2
 Se o nível for de 95%, 𝑍 = 1.96
 Se o nível for de 99%, 𝑍 = 2.57

Geralmente, utiliza-se 𝑍 = 2 , isto é, admite-se (1−∝)% = 95.5%

𝜎= desvio padrão da população, expressão na unidade variável desvio padrão da


população, expressão na unidade variável.

𝑑 = erro amostral, expresso na unidade da variável. O erro amostral é a máxima

diferença que o investigador admite suportar entre 𝜇 e 𝑋̅, isto é, |𝜇 − 𝑋̅| < 𝑑, onde 𝜇 é
a verdadeira média populacional, que ele não conhece, e 𝑋̅ será a média

amostral a ser calculada a partir da amostra.

5. Se a variável escolhida for intervalar e a população finita, tem-se:

𝑍2 ∙ 𝜎 2 ∙ 𝑁
𝑛=
𝑑2 (𝑁 − 1) + 𝑍 2 ∙ 𝜎 2

Onde: 𝑍 = abscissa da distribuição normal padrão (comentado no ponto 4);

𝜎 = desvio padrão da população (comentado no ponto 4) ;

𝑁 = tamanho da população;

𝑑 = erro amostral (comentado no ponto 4).

6. Se a variável escolhida for nominal ou ordinal, e a população considerada


infinita, você poderá determinar o tamanho da amostra pela fórmula:
𝑍 2 ∙ 𝑝̂ ∙ 𝑞̂
𝑛=
𝑑2

Onde: 𝑍 = abscissa da distribuição normal padrão (comentado no ponto 4)

𝑝̂ = estimativa da verdadeira proporção de um dos níveis da variável escolhida.


Por exemplo, se a variável escolhida for porte da empresa, 𝑝̂ podará ser a
estimativa da verdadeira proporção de grandes empresas do sector que está
sendo estudado. Será expresso em decimais. Assim, se 𝑝̂ = 30%, teremos: 𝑝̂ =
0.3; 𝑞̂ = 1 − 𝑝̂ .

Obs.: se 𝑝̂ e 𝑞̂ forem desconhecidos, substituímos 𝑝̂ e 𝑞̂ por 0,5, obtendo a

seguinte estimativa:
𝑍 2 ∙ 0.25
𝑛=
𝑑2

𝑑 = erro amostral, expresso em decimais. O erro amostral neste caso será a máxima
diferença que o investigador admite suportar entre 𝑝 e 𝑝̂ , isto é: |𝑝 − 𝑝̂ | < 𝑑, em que 𝑝
é a verdadeira proporção, que ele não conhece, e 𝑝̂ será a proporção (frequência
relativa) do evento a ser calculado a partir da amostra.

7. Se a variável escolhida for nominal ou ordinal e a população finita, tem-se:


𝑍 2 ∙ 𝑝̂ ∙ 𝑞̂ ∙ 𝑁
𝑛= 2
𝑑 (𝑁 − 1) + 𝑍 2 ∙ 𝑝̂ ∙ 𝑞̂

Onde: 𝑍 = abscissa da distribuição normal padrão (comentado no ponto 4);

𝑝̂ = estimativa da verdadeira proporção;


𝑞̂ = 1 − 𝑝̂ .

𝑁 = tamanho da amostra;

𝑑 = erro amostral

Estas fórmulas são básicas para qualquer tipo de composição da amostra; todavia,
existem fórmulas específicas segundo o critério de composição da amostra. Se o
investigador escolhe mais de uma variável, deve optar pelo maior “𝑛” obtido.

4.2.Distribuições amostrais

Tirar conclusões de uma população a partir dos resultados observados na amostra é Um


dos problemas da inferência estatística. É da responsabilidade do observador da
amostra usar relações mais adequadas entre os parâmetros populacionais e as
estatísticas amostrais. Estimador é qualquer variável aleatória função dos elementos
amostrais. O valor numérico de um estimador é denominado uma estimativa.

4.2.1. Distribuição amostral da média

Se for extraída uma amostra de tamanho 𝑛, a média da amostra será 𝑥. Se forem


extraídas 𝑘 amostras do tamanho 𝑛, e para cada amostra for calculada a estimativa da
média amostral, forma- se uma população das médias amostrais e a distribuição
correspondente chama-se distribuição amostral das médias.

𝑋̅ = {𝑥
̅̅̅,
1 ̅̅̅,
𝑥2 𝑥̅̅̅,
3 … , ̅̅̅}
𝑥𝑘

Teorema 1. A média da distribuição amostral das médias, denotada por µ(x) é igual a
média populacional µ, isto é;

𝐸(𝑥̅ ) = 𝜇(𝑥̅ ) = 𝜇
Teorema 2. Se a população é infinita ou se a amostragem é com reposição, então a
variância da distribuição amostral das médias é dada por:

𝜎2
𝜎 2 (𝑥̅ ) =
𝑛

Teorema 3. Se a população é finita, ou se amostragem é sem reposição, então a variância


da distribuição amostral das médias é dada por:

2 (𝑥̅ )
𝜎2 𝑁 − 𝑛
𝜎 = ∙( )
𝑛 𝑁−1

4.2.2. Distribuição amostral das proporções

Se 𝑝 é a proporção de ocorrência com sucesso de um evento e 𝑞 = 1 − 𝑝, seu insucesso,


e uma amostra de tamanho 𝑛 é extraída de 𝑁, a amostra fornecerá uma proporção 𝑝 =
𝑛
de eventos ocorridos com sucesso. Para 𝑘 amostras de tamanho 𝑛 receber-se-á uma
𝑁
distribuição amostral das proporções µ𝑝, desvio padrão, 𝜎𝑝 que são dadas pelas
fórmulas:

𝑛 𝑝(1−𝑝)
a) Amostra com reposição: 𝜇𝑝 = 𝑝 = 𝑁 ; 𝜎𝑝 = √ 𝑛

𝑛 𝑝(1−𝑝) 𝑁−𝑛
b) Amostra sem reposição: 𝜇𝑝 = 𝑝 = 𝑁 ; 𝜎𝑝 = √ ∙ √𝑁−1
𝑛
4.2.3. Distribuição amostral das variâncias

Seja 𝜎 2 a variância populacional e 𝑠 2 (variância amostral), o estimador da variância


populacional. Se se desejar saber qual é a distribuição da variância amostral, pode – se
usar a relação:

2∙𝜎4
𝐸(𝑠 2 ) = 𝜎 2 e 𝑣𝑎𝑟((𝑠 2 ) = 𝑛−1

Onde 𝑠 2 tem distribuição do qui – quadrado com (𝑛 − 1) graus de liberdade ou seja:

(𝑛 − 1 ∙ 𝑠 2 )
≈ 𝑥 2 𝑛−1
𝜎2

Graficamente a relação entre a variância amostral e a variância populacional é dada pela


distribuição de qui-quadrado.

4.2.4. Distribuição amostral das médias quando a variância populacional não é


conhecida

Como – se pode deduzir, para uma população normal, a amostra extraída dela, deverá
ser normal, consequentemente a sua distribuição amostral também o será, isto é:
𝜎2
Se 𝑋 ≈ 𝑁(𝜇; 𝜎 2 ) então, 𝑥̅ ≈ 𝑁(𝜇; )
𝑛

Ou seja, a distribuição normal padronizada é dada por:

𝑥̅ − 𝜇
𝑧= 𝜎
√𝑛

Como não se conhece o valor da variância (𝜎 2 ), portanto o valor do desvio padrão


populacional (𝜎), é substituído pela variável aleatória 𝑠 (desvio padrão amostral), e
procuramos a distribuição da estatística 𝑡. Neste caso, pode-se mostrar que t em uma
distribuição de Student com 𝑛 − 1 graus de liberdade, assim:

𝑥̅ − 𝜇
𝑡𝑛−1 = 𝑠
√𝑛
5. Conclusão

Após concluir-se o trabalho, concluiu-se que os principais requisitos de uma amostra


probabilística é que esta deve ser homogénea e representativa da população da qual foi
retirada e uma amostra será tanto mais ideais quanto mais próximos forem seus
atributos da equiprobabilidade e independência.
O rigor de amostragem decresce à medida que se parte das formas de amostragem
probabilísticas a não probabilísticas, no entanto cada uma destas técnicas tem sua
importância, pois uma vez que não seja possível realizar amostras probabilísticas devido
a impossibilidades de amostragem, como ocorrência de populações infinitas ou em
último caso optando pela simplicidade, de forma que a probabilidade de alguns ou todos
os elementos da população pertença à amostra desconhecida a segunda opção deverá
ser a alternativa.