Beruflich Dokumente
Kultur Dokumente
INTEGRADAS
JACAREPAGUÁ
APOSTILA DE
ESTATÍSTICA
Curso: Administração
SUMÁRIO
1. Estatística 04
1.1 Definição de Estatística 04
1.2 Definição de Estatística 04
1.3 Fase do Método Estatístico 05
1.3.1 Coleta de Dados 05
1.3.2 Crítica dos Dados 06
1.3.3 Apresentação dos Dados 06
1.3.4 Análise dos Resultados 06
2. Amostragem 07
2.1 Tipos de Variáveis 07
2.2 População 08
2.3 Amostra 08
2.4 Técnicas de Amostragem 09
2.4.1. Amostragem Probabilística 09
2.4.2. Amostragem Não Probabilística 10
7. Exercícios 32
7.1 Capítulo 3 32
7.2 Capítulo 4 33
7.3 Capítulo 5 35
7.4 Capítulo 6 36
8. Referências Bibliográficas 38
1. Estatística
1.1. Introdução
Tabelas
Coleta de Crítica dos Apresentação
Análises
dados dados dos dados Gráficos
Após a crítica, os dados devem ser apresentados sob forma adequada (tabelas
ou gráficos), para o melhor entendimento do fenômeno que está sendo estudado.
2. Amostragem
2.2. População
2.3. Amostra
2.4.1. Amostragem Probabilística: É uma amostra selecionada de tal forma que cada
item ou pessoa na população estudada têm uma probabilidade (não nula) conhecida de
ser incluída na amostra. Pode-se destacar três:
Amostragem Sistemática
Definição: É aquela em que os elementos da população se apresentam ordenados e a
retirada é realizada através de um sistema preestabelecido.
Exemplo: Numa lista telefônica, sorteia-se um entre os 100 primeiros assinantes e a
partir deste retira-se outro a cada 100.
Amostragem Estratificada
Definição: É um processo de amostragem usado quando as populações são
heterogêneas. Divide-se a população em sub-populações denominados estratos. Após
a determinação dos estratos, seleciona-se uma amostra aleatória de cada um dos
estratos. Tipos de variáveis que podem ser usadas em estratificação: idade, classes
sociais, sexo, profissão, salário, procedência, etc.
Exemplo: Numa pesquisa de renda média familiar podemos dividir uma cidade nos
seguintes estratos: bairros de classe A, bairros de classe B, bairros de classe C, etc. e
em seguida retirar um número proporcional de elementos de cada estrato para formar a
amostra estratificada.
Amostragem intencional
Definição: É aquela em que o pesquisador deliberadamente escolhe certos elementos
para pertencer à amostra, por julgar tais elementos bem representativos da população.
Exemplo: Muitas amostragens de pesquisa de opinião são obtidas dessa maneira, por
motivo de tempo e custo.
A representação gráfica das séries estatísticas tem por finalidade dar uma idéia,
a mais imediata possível, dos resultados obtidos, permitindo chegar a conclusões
sobre a evolução do fenômeno ou sobre como se relacionam os valores da série. A
escolha do gráfico mais apropriado ficará a critério do analista.
Contudo, os elementos simplicidade, clareza e veracidade devem ser
considerados quando da elaboração de um gráfico.
Os principais tipos de gráficos.
Parte _____ x o
400
300
VENDAS
200
100
0
1991 1992 1993 1994 1995 1996 1997
Anos
Dados
Dados Dados
Qualitativos Quantitativos
a) Dados brutos: O conjunto dos dados numéricos obtidos após a crítica dos valores
coletados. Os seguintes valores poderiam ser os dados brutos: 24, 23, 22, 28, 35,
21, 23, 33.
fi
observações: fr = .
n
4.4 Freqüência Acumulada Relativa (far)
A freqüência acumulada relativa é o valor da freqüência acumulada dividido pelo
f ac
número total de observações: far = .
n
4.5.1 Histograma
4.5.2. Ogiva
47 43 50 50 50 46 45 48
51 48 48 44 41 45 44 46
43 43 45 47 43 42 45 44
48 45 45 57 47 45 46 43
51 40 52 47 52 46 53 49
57 - 40
h= = 2,8 ≅ 3
6
4.6.1 Histograma
5.1. Média:
X= 5
onde ∑ f i = n ou N
Então: X=
∑x f
i i
= X=
56
= 5,6
∑f i 10
X=
∑ Pm f i µ=∑ m i
P f
para amostra para população
∑ fi ∑ fi
L inf + L sup
Pm =
2
Então: X= ∑ Pm f i = X = 58 = 2,9
∑ fi 20
A mediana é um valor real que separa o rol em duas partes deixando à sua
esquerda o mesmo número de elementos que a sua direita. Portanto, a mediana é um
valor que ocupa a posição central em uma série. Ela é denotada por: Md.
n +1
= posição .
o
2
Exemplo: Determinar a mediana do conjunto: x: 2, 20, 12, 23, 20, 8, 12.
Ordenando os termos: 2, 8, 12, 12, 20, 20 ,23.
7 + 1 o
Como n=7 (ímpar), então a posição do termo central é =4 .
2
Portanto, a mediana é o quarto elemento do Rol: Md = 12 .
Se n é par: a mediana será a média aritmética dos dois termos centrais, ou seja, os
o o
n n
termos que ocupam as posições e + 1
2 2
Exemplo: Determinar a mediana da série: x: 7, 21, 13, 15, 10, 8, 9, 13.
Ordenando os termos: 7, 8, 9, 10, 13, 13, 15, 21.
8
=4 e
o
Como n=8 (par), então a posição dos dois termos centrais são
2
8 o
+ 1 = 5
2
Então, a mediana será a média do terceiro e quarto elemento do Rol.
o o
n + 1 9 + 1
aquele que ocupará a posição = = 5º. Para encontrar o quinto
2 2
elemento da distribuição, construímos uma nova coluna na tabela e determinamos as
freqüências acumuladas.
xi fi fac
2 1 1
5 4 5
6 3 8
8 1 9
∑ 9
n / 2 − fant
Md = l md + . h
f md
onde: lmd = limite inferior da classe mediana. A classe mediana é obtida através de n/2;
fant = freqüência acumulada da classe anterior a classe mediana;
fmd = freqüência absoluta da classe mediana;
h = amplitude da classe (h=Lsup – linf)
Solução: O número de elementos é 20, então a classe mediana será: n/2 = 20/2=10º.
Identifica-se a classe mediana através da freqüência acumulada, ou seja, qual classe
está o 10º elemento. Observando a freqüência acumulada, temos o 10º elemento na 2ª
classe.
classes fi fac
2 |------ 4 2 2
4 |------ 6 9 11
6 |------ 8 8 19
8 |------ 10 1 20
∑ 20
a) x: 2, 8, 3, 5, 4, 5, 3, 5, 5, 1.
O elemento de maior freqüência é 5. Portanto, Mo = . É uma seqüência
unimodal, pois só temos uma moda.
b) X: 6, 10, 5, 6, 10, 2.
Este conjunto de dados apresenta o elemento 6 e 10 como elementos de maior
freqüência. Portanto, Mo = e Mo = . Por isso é chamada de bimodal.
Quando não houver elementos que se destaque pela maior freqüência, dizemos
que a série é amodal.
Exemplo: x: 3, 3, 3, 4, 4, 4.
Não há moda, pois os elementos têm a mesma freqüência.
5 4
6 3
8 1
∑ 9
Observamos que a maior freqüência absoluta é o número 4, que corresponde ao
elemento 5 da distribuição. Portanto, a moda é Mo = 5
∆1
M O = l mo + ⋅h
∆1 + ∆ 2
∆1
M O = l mo + ⋅h
∆1 + ∆ 2
MO = 5
A variância é uma média aritmética calculada a partir dos quadrados dos desvios
obtidos entre os elementos da série e a sua média.
Quando o conjunto de dados representa uma população a variância é denotada
por σ2(x) e o desvio padrão correspondente por σ(x).
Quando o conjunto de dados representa uma amostra a variância é denotada
por s2(x) e o desvio padrão correspondente por s(x).
2
s = ∑ (x i − X)2
, para a amostra;
n −1
σ =2∑ (x i − µ )2
, para a população.
N
O desvio padrão é a raiz quadrada positiva da variância.
s = s 2 , para a amostra;
σ = σ 2 , para a população.
∑ xifi
Solução: Primeiro, calculamos a média: X = =
∑ fi
σ 2
=
∑(x i − µ ) 2 . fi
=
20
=5
N 4
2
s = ∑ fi (xi − X)2
, para a amostra;
n −1
σ =
2 ∑ fi (xi − µ )2
, para a população.
N
O desvio padrão é a raiz quadrada positiva da variância.
s = s 2 , para a amostra;
σ = σ 2 , para a população.
µ=∑ i i =
xf
Primeiro, calculamos a média:
∑ fi
Como estamos trabalhando com uma população a variância é dada por:
2
σ = ∑ fi (xi − µ )2
=
N
O desvio padrão será:
σ= =
2
s = ∑ f i ( Pm − X ) 2
, para a amostra;
n −1
σ =
2 ∑ f i ( Pm − µ ) 2
, para a população.
N
s = s 2 , para a amostra;
σ = σ 2 , para a população.
X= ∑ Pm f i =
∑ fi
Como estamos trabalhando com uma população a variância é dada por:
2
σ = ∑ f i ( Pm − µ ) 2
=
N
O desvio padrão será:
σ= =
σ
CV = ⋅ 100 para população
µ
s
CV = .100 para amostra
X
Se: CV ≤ 15% ⇒ Baixa dispersão – Homogênea, estável, regular.
15% < CV< 30% ⇒ Média dispersão.
CV ≥ 30% ⇒ Alta dispersão – Heterogênea.
7. Exercícios:
7.1. Capítulo 3
1. Um estudo sobre o problema do desemprego na Grande São Paulo, no período
1985-1996, realizado pelo SEADE-DIEESE, apresentou o seguinte gráfico sobre a
taxa de desemprego:
16%
15%
Taxa de de se mpre go
14%
13%
12%
11%
10%
9%
8%
7%
6%
85 86 87 88 89 90 91 92 93 94 95 96 97
Ano
2. Uma pesquisa de opinião foi realizada para avaliar os níveis de audiência de alguns
canais de televisão, entre 20h e 21h, durante determinada noite. Os resultados
obtidos estão representados no gráfico de barras a seguir:
120
100
80
60
40
20
0
TvA TvB TvC TvD Nenhum Canal
7.2. Capítulo 4
1. Considere os resultados finais, numa determinada disciplina, obtidos por 20
estudantes de uma dada Universidade: 9, 14, 12, 8, 14, 12, 16, 16, 8, 14,11, 12, 14,
11, 11, 18, 14, 18, 15, 15. Construa uma distribuição de freqüências para esses
dados.
7.3. Capítulo 5
1. O Serviço de Recursos Humanos da Roth Young fez uma pesquisa sobre os
salários anuais para gerentes assistentes de lojas de departamentos Os dados são
mostrados na tabela abaixo (dados em mil dólares): (amostra)
Salário (US$) fi
1000 | 1200 2
1200 | 1400 6
1400 | 1600 10
1600 | 1800 5
1800 | 2000 2
Pede-se:
a) Calcule as freqüências acumuladas, relativas e as acumuladas relativas;
b) O limite superior da classe1?(R: 1200)
c) O limite inferior da classe 3? (R:1400)
d) O ponto médio da classe 2/(R:1300)
e) Qual a porcentagem de salários anuais menor que US$ 1200? (R: 8%)
f) Qual a porcentagem de salários anuais maior que US$ 1600? (R: 28%)
g) Qual o salário anual médio? (R: US$ 1492)
h) Qual o salário mediano? (R: US$ 1490)
i) Qual o salário modal? (R: US$ 1488,89)
Determine:
a) a distribuição de freqüências;
b) a porcentagem de empregados que tiveram um número de faltas anuais ≤ 2? (R:
30%)
3. Uma companhia afirma que o índice médio de nicotina dos cigarros que fabrica está
dentro do limite estabelecido pelas organizações mundiais de combate ao câncer.
Um laboratório que estuda os males do cigarro à saúde realiza uma análise,
utilizando uma amostra de 7 cigarros dessa companhia e obtém as seguintes
quantidades de nicotina (em mg):
25 24 23 22 29 23 23
Sabendo que o índice médio de nicotina recomendado por essas organizações deve
variar entre 21mg/cigarro e 22mg/cigarro, responda:
a) Qual é o índice médio de nicotina encontrado na amostra; (R: 24 mg/cig)
b) Qual é o índice modal de nicotina encontrado na amostra; (R: Mo=23mg/cig)
c) Qual é o índice mediano de nicotina encontrado na amostra; (R: Md=23 mg/cig)
d) Na sua opinião, o fabricante está obedecendo ao índice médio de nicotina
recomendado pelas organizações internacionais? Justifique a sua resposta!
7.4. Capítulo 6
Classe de pH Freqüência
4,5 |------ 5,5 6
5,5 |------ 6,5 3
6,5 |------ 7,5 4
7,5 |------ 8,5 7
2. O transporte público e o automóvel são dois meios de transportes que uma pessoa
pode usar para ir ao trabalho diariamente. Amostras de tempo para cada meio de
transporte estão registradas a seguir. Os tempos estão em minutos.
Transporte público 28 29 32 37 33 25 29 32 41 34
Automóvel 29 31 33 32 34 30 31 32 35 33
Qual o meio de transporte deve ser o preferido pelas pessoas? Justifique. (R: o
automóvel, pois tem a menor variabilidade)
8. Referências Bibliográficas
ANDERSON, D. R., SWEENEY, D. J., WILLIAMS, T. A. Estatística Aplicada à
Administração e Economia. 1. ed. São Paulo: Thomson Learning, 2002.
LARSON, R; FARBER, B. Estatística Aplicada. 2 ed. São Paulo: Prentice Hall, 2004.