Beruflich Dokumente
Kultur Dokumente
ESTATÍSTICA APLICADA
1. Variáveis e Gráficos
1.1 – Estatística
Exemplo:
A coordenação de um colégio pretende levantar dados sobre os alunos do 3º
ano do ensino médio, candidatos ao vestibular. O que você acha que a coordenação
pode anotar, porque é variável e o que você acha que não deve anotar, porque é
constante?
Solução:
A coordenação pode levantar dados sobre a renda familiar, sobre as
carreiras pretendidas, que são variáveis, mas não deve levantar dados sobre a
alfabetização porque, entre candidatos ao vestibular, a resposta seria uma
constante, já que todos possuem, no mínimo o ensino médio!
Exercícios:
População – todos os
elementos do conjunto
que interessa.
Parãmetro
Amostra – subconjunto
não vazio de uma
população
Estimador
Quando os dados são obtidos de toda uma população, diz-se que foi feito
um recenseamento. Quando são obtidos dados de apenas parte da população, diz-
se que foi feita uma amostragem. O conjunto de dados obtidos de toda a população
é denominado censo.
Censo é uma avaliação direta de um parâmetro, utilizando-se todos os
componentes da população.
Estimação é uma avaliação indireta de um parâmetro, com base em um
estimador através do cálculo de probabilidades.
As principais propriedades do censo são:
• admite erro processual zero e tem confiabilidade 100 %;
• é caro;
• é lento;
• é quase sempre desatualizado;
• nem sempre é viável.
Comentário Importante:
Exercícios:
Exercícios:
Tabela 1
Informação sobre dados sócio-econômicos das famílias dos alunos do Colégio XXX.
Responsável
Número Salário
Família Estado Educação de Idade Estado de Familiar
Nº Civil Filhos (anos/meses) Procedência (R$)
01 Casado Superior 02 39 a 05 m RJ 1.250,00
02 Solteiro Fundamental 03 40 a 07 m BA 2.152,00
03 Solteiro Fundamental 02 37 a 03 m RJ 1.870,00
04 Casado Médio 03 40 a 10 m SE 1.470,00
05 solteiro superior 04 38 a 02 m MG 1.120,00
Ordinal
Variável
Discreta
Quantitativa
Contínua
UniverCidade 13
Estatística Aplicada - Prof. Célio Cayres
___________________________________________________________________________________
Para cada tipo de variável existem técnicas mais apropriadas para resumir
as informações.
Por exemplo:
Exemplos:
Número Notação Científica Número Notação Científica
10 101 0,00021 21 x 10-5
1.000 103 856.000.000 856 x 106
100.000 105 0,0000001 10-8
Note que, por exemplo, multiplicando-se 0 número 846 por 106, tem-se o
mesmo resultado que os deslocar a vírgula, para a direita, 6 (seis) casas. Já
multiplicando-se 21 por 10-5, tem-se o mesmo resultado do que deslocando-se a
vírgula para a esquerda 5 (cinco) casas.
1.7 – Gráficos
Ordenada
Abscissa
Origem
Exemplo:
Um levantamento feitos na Secretaria de uma escola, com relação ao
número de alunos que não adimpliram o pagamento das mensalidades, no
vencimento, no primeiro semestre do ano 20XX, possibilitou a elaboração da tabela
abaixo:
UniverCidade 17
Estatística Aplicada - Prof. Célio Cayres
___________________________________________________________________________________
Com base nos dados apresentados vamos construir cada um dos gráficos
enumerados.
a) Gráfico de Linhas
Fevereiro
Março
Abril
Maio
Junho
Meses
b) Gráfico de Colunas
20
Número de alunos
15
10
0
Janeiro Fevereiro Março Abril Maio Junho
Meses
Gráfico de Colunas em 3D
20
de alunos
15
Número
10
5
0
S1
Janeiro
Fevereiro
Março
Abril
Maio
Junho
Meses
c) Gráfico de Barras
Junho
Maio
Abril
Meses
Março
Fevereiro
Janeiro
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
de alunos
Número
d) Gráfico de Setores
86 -------- 100 %
17 --------- X%
Sabendo-se que o produto dos meios é igual ao produto dos extremos, têm-
se que:
UniverCidade 22
Estatística Aplicada - Prof. Célio Cayres
___________________________________________________________________________________
86 x X = 17 x 100 %
logo,
X = (17 x 100%) / 86
X = 19,8 %
Freqüência
Meses Número de alunos Relativa
Janeiro 17 19,8
Fevereiro 12 14,0
Março 09 10,5
Abril 19 22,0
Maio 13 15,1
Junho 16 18,6
TOTAL 86 100,0
Freqüência Ângulo
Meses Número de alunos Relativa
Janeiro 17 19,8 71,28
Fevereiro 12 14,0 50,40
Março 09 10,5 37,80
Abril 19 22,0 79,20
Maio 13 15,1 54,36
Junho 16 18,6 66,96
TOTAL 86 100,0 360,00
Janeiro Fevereiro
Março Abril
Maio Junho
Maio Fevereiro
15% 14%
Março
Abril 10%
22%
ou
Maio Fevereiro
15% 14%
Março
Abril 10%
22%
2 – Distribuições de Freqüência
2.1 – Dados brutos
X: 2; 3; 2; 1; 2; 1; 2; 3; 2; 2; 2; 3; 1; 1; 1; 3; 3; 2; 3; 1.
Não está importando, para a análise, a correlação entre que aluno tirou qual
nota, ou seja, o que está em observação são as notas.
Deve-se, então, para facilitar a observação, ordenar os dados.
Vamos ordena-los em ordem crescente:
X: 1; 1; 1; 1; 1; 1; 2; 2; 2; 2; 2; 2; 2; 2; 3; 3; 3; 3; 3; 3.
UniverCidade 26
Estatística Aplicada - Prof. Célio Cayres
___________________________________________________________________________________
2.2 – Rol
É a partir do rol que poder-se-á verificar qual será a forma mais eficiente de
representar de forma tabular os dados obtidos.
Quando os valores distintos forem em número reduzido pode-se optar pela
representação através de uma variável discreta. Quando o número de valores
distintos for grande, normalmente a melhor opção será a construção de uma
variável contínua.
Tabela XXX
Notas dos alunos da Turma XX em Língua Portuguesa
Vamos optar pelo último tipo (7 __ 9), e desta forma podemos definir
como intervalo de classe a diferença entre o limite superior e o limite inferior
da classe. Portanto, no exemplo, 9 – 7 = 2 é o intervalo ou amplitude do
intervalo de classe.
H=L-l
UniverCidade 31
Estatística Aplicada - Prof. Célio Cayres
___________________________________________________________________________________
At = Xmáx - Xmin
sobreposição.
UniverCidade 34
Estatística Aplicada - Prof. Célio Cayres
___________________________________________________________________________________
O número de classe a ser utilizado depende muito da experiência do
pesquisador e das questões que ele pretende responder com a variável contínua.
- Critério da Raiz
K= n
Como o número K de classes deve ser necessariamente um número inteiro e
como dificilmente o resultado é um número inteiro, deixa-se como opção para o
valor de K o valor inteiro mais próximo do resultado, uma unidade a menos ou a
mais que este valor.
K = 42
Tem-se que K = 6,4807406984, portanto o valor inteiro mais próximo do
resultado é 6. As opções para K então são: 5, 6 e 7.
Dados Brutos
Y: 7,2 4,9 9,8 6,4 4,8 4,6 6,8
5,9 8,5 8,7 1,2 2,5 4,3 6,7
9,5 5,4 1,3 7,6 5,9 6,7 8,6
9,5 9,3 7,4 8,6 8,1 5,9 1,8
7,8 7,2 8,4 6,8 8,2 6,9 7,4
6,3 4,6 4,9 8,7 9,3 8,8 5,8
At = 8,6.
UniverCidade 36
Estatística Aplicada - Prof. Célio Cayres
___________________________________________________________________________________
At
h=
K
Utilizando o critério do par mais próximo para o arredondamento, verifica-se
que h = 1,4.
1 1 __ 2,5 3
2 2,5 __ 4 1
3 4 __ 5,5 7
4 5,5 __ 7 11
5 7 __ 8,5 9
6 8,5 __ 10 11
Total 42
Acumulada
1 1 __ 2,5 3 3
2 2,5 __ 4 1 4
3 4 __ 5,5 7 11
4 5,5 __ 7 11 22
5 7 __ 8,5 9 31
6 8,5 __ 10 11 42
Total 42
Qual foi o percentual de alunos com notas iguais ou superiores a 5,5, porém
inferiores a 7?
f i ......................... f %
f i x100
f rel =
f total
relativa
1 1 __ 2,5 3 7,14 %
2 2,5 __ 4 1 2,38 %
3 4 __ 5,5 7 16,67 %
4 5,5 __ 7 11 26,19 %
5 7 __ 8,5 9 21,43 %
6 8,5 __ 10 11 26,19 %
Total 42 100,00 %
f acm x100
f relacm =
f total
No exemplo, tem-se que:
Freqüência Freqüência
acumulada
1 1 __ 2,5 3 3 7,14 %
2 2,5 __ 4 1 4 9,52 %
3 4 __ 5,5 7 11 26,19 %
4 5,5 __ 7 11 22 52,38 %
5 7 __ 8,5 9 31 73,81 %
6 8,5 __ 10 11 42 100,00 %
Total 42
Observe que a freqüência relativa acumulada da última classe deve ser igual
à 100 %, por estar considerando a distribuição como um todo.
acumulada
Total 42 100,00 %
Nos capítulos anteriores foi visto com apresentar dados numéricos tanto em
forma de tabelas quanto na forma de gráficos. Agora, como pode-se fazer essas
informações terem sentido?
a) Tendência central
b) Variação
Y = { 2, 3, 4, 6, 7, 9 }
Pode-se, então, convencionar que uma série pode ser identificada por
simbologias que representem o elemento e a posição que ele ocupa.
Se for simbolizado por X a variável nota e por i o índice que indica a posição
da variável na série, pode-se passar a indicar a soma da série da seguinte forma:
Soma = x1 + x 2 + x3 + ... + x 42
ou seja, estariam sendo indicadas as variáveis e seu posicionamento na
série.
Desta forma, a soma de uma série onde não se conheça o número de termo
poderá ser indicada da seguinte forma:
UniverCidade 46
Estatística Aplicada - Prof. Célio Cayres
___________________________________________________________________________________
Soma = x1 + x2 + x3 + ... + xn
Matematicamente a expressão indicada acima pode ser reduzida, utilizando-
se a notação em somatório e para tanto será utilizada a letra grega sigma - Σ que
n
x1 + x2 + x3 + ... + xn = ∑ xi
i =1
X é o “nome” dos
n é o último termos a serem
elemento a ser n somados
somado
∑xi =1
i
i é uma
Σ é a simbologia observação
que indica soma. individual da
série, ou seja, a
posição do
termo na série
i=1 indica o
primeiro elemento
da série que será
somado
15
∑x
i =1
i
UniverCidade 47
Estatística Aplicada - Prof. Célio Cayres
___________________________________________________________________________________
IMPORTANTE:
Para que uma soma possa ser
representada pela notação em somatório
é fundamental que i assuma todos os
valores inteiros consecutivos entre dois
valores dados (o termo inicial e o termo
final da soma).
UniverCidade 48
Estatística Aplicada - Prof. Célio Cayres
___________________________________________________________________________________
b) a mediana;
c) a moda.
8 + 8 + 7 + 9 + 9 + 10 + 8 + 9 + 7 + 8 + 9 + 10 + 10 + 10 + 9 + 9 + 8 + 8 + 8 + 9 + 8
Média =
21
∑x
n =1
i
Média =
n
(média é igual a soma dos n termos de uma série, do primeiro até o último,
dividido pelo número total de termos).
7 2
8 8
9 7
10 4
UniverCidade 50
Estatística Aplicada - Prof. Célio Cayres
___________________________________________________________________________________
Fonte: dados hipotéticos.
Verifica-se que a variável (x) é a idade dos alunos, e que cada variável
possui uma freqüência (fi).
7 2 14
8 8 64
9 7 63
10 4 40
TOTAL 21 181
∑x
i =1
i fi
Média =
n
UniverCidade 51
Estatística Aplicada - Prof. Célio Cayres
___________________________________________________________________________________
(leia-se: média é igual à soma das variáveis i, multiplicadas pelas
respectivas freqüências i, da primeira até a última, dividido pelo número de
elementos).
∑x f
i =1
i i
Média = n
∑f
i =i
i
Notas em Geografia
Bimestre Nota
1º 6,0
2º 7,2
3º 5,5
4º 7,8
UniverCidade 52
Estatística Aplicada - Prof. Célio Cayres
___________________________________________________________________________________
Fonte: dados hipotéticos.
Notas em Geografia
1º 6,0 1 6,0
2º 7,2 2 14,4
3º 5,5 3 16,5
4º 7,8 4 31,2
TOTAL 10 68,1
∑x p
i =1
i i
Média = n
∑p
i =1
i
Como proceder?
li + Li
mi =
2
(leia-se: o ponto médio da classe i é igual à média aritmética da soma do
limite inferior da classe i e o limite superior da classe i).
1 1 __ 2,5 3 1,75
2 2,5 __ 4 1 3,25
3 4 __ 5,5 7 4,75
4 5,5 __ 7 11 6,25
UniverCidade 54
Estatística Aplicada - Prof. Célio Cayres
___________________________________________________________________________________
5 7 __ 8,5 9 7,75
6 8,5 __ 10 11 9,25
Total 42
Distância = m4 – m3
_ ∑fm
i =1
i i
X = n
∑f
i =1
i
UniverCidade 55
Estatística Aplicada - Prof. Célio Cayres
___________________________________________________________________________________
(leia-se: média aritmética é igual ao somatório dos produtos das freqüências
das classes i pelos pontos médios das classes i, dividido pelo somatório das
freqüências das classes i).
Freqüência Ponto fi mi
médio
Classe Notas (fi)
(mi)
Total 42 281,50
_
281,50
X = = 6,7
42
UniverCidade 56
Estatística Aplicada - Prof. Célio Cayres
___________________________________________________________________________________
Posição = (n + 1) /2
Veja o exemplo:
Sejam as idades:
Y = { 8, 9, 10, 11, 7, 6, 12 }
Y = { 6, 7, 8, 9, 10, 11, 12 }
Posição = ( n + 1 ) / 2
Posição = ( 7 + 1 ) / 2
Posição = 4
UniverCidade 58
Estatística Aplicada - Prof. Célio Cayres
___________________________________________________________________________________
A mediana (md), então, será aquele termo que ocupar a 4ª posição no rol,
ou seja, md = 9 anos.
Y = { 6, 7, 8, 9, 10, 11, 12 }
Termos à Termos à
esquerda da direita da
mediana mediana
Mediana
O termo que ocupa a posição central (mediana) é definido com sendo aquele
que for igual à média aritmética dos elementos que ocuparem as posições
anteriormente definidas.
Veja no exemplo:
Mediana (md) = ( 9 + 10 ) /2
UniverCidade 59
Estatística Aplicada - Prof. Célio Cayres
___________________________________________________________________________________
Mediana (md) = 9,5.
Deve-se lembrar que a mediana é o termo que divide a série em duas partes
iguais. Desta forma, a interpretação será de que 50 % (metade) dos valores do rol
são valores menores ou iguais a 9,5 e 50 % (metade) dos valores do rol são
valores maiores ou iguais a 9,5.
Mediana = 9,5
1 1 __ 2,5 3 1,75
2 2,5 __ 4 1 3,25
3 4 __ 5,5 7 4,75
4 5,5 __ 7 11 6,25
5 7 __ 8,5 9 7,75
6 8,5 __ 10 11 9,25
Total ( Σ ) 42
1 1 __ 2,5 3 3 1,75
2 2,5 __ 4 1 4 3,25
3 4 __ 5,5 7 11 4,75
4 5,5 __ 7 11 22 6,25
5 7 __ 8,5 9 31 7,75
6 8,5 __ 10 11 42 9,25
Total ( Σ ) 42
Freqüência
1 1 __ 2,5 3 Do 1º até o 3º
2 2,5 __ 4 1 Do 4º até o 4º
Total ( Σ ) 42
UniverCidade 62
Estatística Aplicada - Prof. Célio Cayres
___________________________________________________________________________________
n
− Fant
md = l md +2 xh
f md
Onde:
md = mediana
lmd = limite inferior da classe mediana
n = número de elementos da série
Fant = freqüência acumulada da classe anterior à classe mediana
fmd = freqüência simples da classe mediana
h = amplitude do intervalo de classe.
Na distribuição, verifica-se:
lmd = 5,5
n = 42
Fant = 11 (freqüência acumulada da 3ª classe)
fmd = 11
h = 1,5
Então:
42
− 11
md = 5,5 + 2 x1,5
11
UniverCidade 63
Estatística Aplicada - Prof. Célio Cayres
___________________________________________________________________________________
Resolvendo a expressão:
a) inicialmente efetua-se a divisão que aparece no numerador:
21 − 11
md = 5,5 + x1,5
11
b) efetua-se a adição do numerador:
10
md = 5,5 + x1,5
11
c) efetua-se a divisão:
md = 5,5 + 0,91x1,5
d) efetua-se a multiplicação
md = 5,5 + 1,37
e) efetua-se a adição.
md = 6,87
O que ocorreu?
De um modo geral, todas as medidas calculadas para uma variável contínua
serão valores aproximados para estas medidas, uma vez que ao agrupar-se os
UniverCidade 64
Estatística Aplicada - Prof. Célio Cayres
___________________________________________________________________________________
dados segundo uma variável contínua, há perda de informações quanto a
identidade dos dados.
Xi Fi
2 2
4 1
5 2
6 1
7 3
8 1
9 1
f post
mo = l mo + xh
f ant + f post
Onde:
UniverCidade 67
Estatística Aplicada - Prof. Célio Cayres
___________________________________________________________________________________
mo = moda
lmo = limite inferior da classe modal
fpost = freqüência simples da classe posterior à classe modal
fant = freqüência simples da classe anterior à classe modal
h = amplitude do intervalo de classe
Freqüência
1 1 __ 2,5 3
2 2,5 __ 4 1
3 4 __ 5,5 7
4 5,5 __ 7 11
5 7 __ 8,5 9
6 8,5 __ 10 11
Total ( Σ ) 42
lmo = 5,5
fpost = 9 (freqüência da Classe 5)
fant = 7 (freqüência da Classe 3 )
h = 1,5.
9
mo = 5,5 + x1,5
7+9
9
mo = 5,5 + x1,5
16
mo = 5,5 + 0,84
mo = 6,34
lmo = 8,5
fpost = 0 (freqüência da Classe 7)
fant = 9 (freqüência da Classe 5 )
h = 1,5.
0
mo = 8,5 + x1,5
0+9
0
mo = 8,5 + x1,5
16
UniverCidade 69
Estatística Aplicada - Prof. Célio Cayres
___________________________________________________________________________________
mo = 8,5
n +1
Q1 =
2
2(n + 1) n + 1
Q2 = =
4 2
3(n + 1)
Q3 =
4
UniverCidade 72
Estatística Aplicada - Prof. Célio Cayres
___________________________________________________________________________________
Há algumas regras que devem ser seguidas para a obtenção dos quartis
pelas fórmulas de ponto de posicionamento:
Σ 23
Vamos calcular:
UniverCidade 73
Estatística Aplicada - Prof. Célio Cayres
___________________________________________________________________________________
n + 1 23 + 1 24
Q1 = = = =6
4 4 4
Isto equivale dizer que Q1 pode ser determinado como sendo a sexta
observação ordenada, ou seja a terceira nota 6 (seis) divide a distribuição em duas
partes, onde à esquerda têm-se 25 % da distribuição e à direita 75 % da
distribuição.
Σ 23
UniverCidade 74
Estatística Aplicada - Prof. Célio Cayres
___________________________________________________________________________________
in
− f acmant
Qi = li + 4 xh
fclasse
Onde:
1 1 __ 2,5 3
2 2,5 __ 4 1
3 4 __ 5,5 7
4 5,5 __ 7 10
5 7 __ 8,5 8
6 8,5 __ 10 11
Total 40
Acumulada
1 1 __ 2,5 3 3
2 2,5 __ 4 1 4
3 4 __ 5,5 7 11
4 5,5 __ 7 10 21
5 7 __ 8,5 8 29
6 8,5 __ 10 11 40
Total 40
UniverCidade 77
Estatística Aplicada - Prof. Célio Cayres
___________________________________________________________________________________
Em seguida determina-se o ponto de posicionamento do quartil desejado (no
caso, o Q1 ).
in 1x 40
Q1 = = = 10
4 4
40
−4
Q1 = 4 + 4 x1,5
7
10 − 4
Q1 = 4 + x1,5
7
6
Q1 = 4 + x1,5
7
Q1 = 4 + 0,85714 x1,5
Q1 = 4 + 1,28571
Q1 = 5,28571
Q1 ≅ 5,3
1 ≤ Q1 < 5,3
3 x 40 120
Q3 = = = 30
4 4
120
− 29
Q3 = 8,5 + 4 x1,5
11
30 − 29
Q3 = 8,5 + x1,5
11
1
Q3 = 8,5 + x1,5
11
Q3 = 8,5 + 0,09091x1,5
Q3 = 8,5 + 0,13637
Q3 = 8,63637
Q3 ≅ 8,6
Desta forma pode-se concluir que serão contemplados com aulas de redação
os alunos com notas superiores a 8,6 ( as 25 % maiores notas da turma).
a) o primeiro decil, D1, é o valor que faz com que 10 % das observações
seja menores do quem o valor calculado e 90 % das observações sejam
maiores;
b) o segundo decil, D2, é o valor que faz com que 20 % das observações
seja menores do quem o valor calculado e 80 % das observações sejam
maiores;
c) o terceiro decil, D 3, é o valor que faz com que 30 % das observações
seja menores do quem o valor calculado e 70 % das observações sejam
maiores, e assim sucessivamente até o
d) o nono decil, D9, é o valor que faz com que 90 % das observações seja
menores do quem o valor calculado e 10 % das observações sejam
maiores.
i (n + 1)
Di =
10
UniverCidade 81
Estatística Aplicada - Prof. Célio Cayres
___________________________________________________________________________________
Onde:
i = decil que se deseja determinar
n = freqüência total
3( n + 1)
D3 =
10
6( n + 1)
D6 =
10
8( n + 1)
D8 =
10
As regras que devem ser seguidas para a obtenção dos decis pelas fórmulas
de ponto de posicionamento são as mesmas as que foram apresentadas para a
obtenção dos quartis.
Σ 103
4(n + 1)
D4 =
10
4(103 + 1)
D4 =
10
4 x104 416
D4 = =
10 10
D4 = 41,6
in
− f acmant
Di = li + 10 xh
fclasse
Onde:
Pelo o que pode ser verificado, 20 % das menores rendas corresponde aos
valores que estiverem à esquerda do D2.
Para que se possa determinar o valor que ocupa tal posição, inicialmente
deve-se indicar as freqüência total e freqüências acumuladas da distribuição:
Σ 141
282
− 14
D2 = 900,00 + 10 x150,00
17
28,2 − 14
D2 = 900,00 + x150,00
17
14,2
D2 = 900,00 + x150,00
17
D2 = 900,00 + 0,83529 x150,00
D2 = 900,00 + 125,29
D2 = 1.025,29
Desta forma pode-se concluir que poderão ser contemplados com a bolsa de
estudos os alunos cuja renda familiar for inferior à R$ 1.025,29 ( ou seja ou valores
que estiverem à esquerda do D2 ).
e) o primeiro percentil, P1, é o valor que faz com que 1 % das observações
seja menores do quem o valor calculado e 99 % das observações sejam
maiores;
f) o segundo percentil, P2, é o valor que faz com que 2 % das observações
seja menores do quem o valor calculado e 98 % das observações sejam
maiores;
g) o terceiro percentil, P3, é o valor que faz com que 3 % das observações
seja menores do quem o valor calculado e 97 % das observações sejam
maiores, e assim sucessivamente até o
h) o nonagésimo nono percentil, P99, é o valor que faz com que 99 % das
observações seja menores do quem o valor calculado e 1 % das
observações sejam maiores.
i (n + 1)
Pi =
100
Onde:
i = decil que se deseja determinar
n = freqüência total
14( n + 1)
P14 =
100
39( n + 1)
P39 =
100
77( n + 1)
P77 =
100
As regras que devem ser seguidas para a obtenção dos percentis pelas
fórmulas de ponto de posicionamento são as mesmas as que foram apresentadas
para a obtenção dos quartis e dos decis.
Σ 147
22(n + 1)
P22 =
100
22(147 + 1)
P22 =
100
22 x148 3.256
P22 = =
100 100
P22 = 32,56
in
− f acmant
Pi = li + 100 xh
fclasse
Onde:
Pelo o que pode ser verificado, 15 % das maiores idades corresponde aos
valores que estiverem à direita do P85.
Para que se possa determinar o valor que ocupa tal posição, inicialmente
deve-se indicar as freqüência total e freqüências acumuladas da distribuição:
Σ 212
in 85 x 212
P85 = = = 180,2
100 100
18020
− 160
P85 = 14 + 100 x2
189
180,2 − 160
P85 = 14 + x2
189
20,2
P85 = 14 + x2
189
P85 = 14 + 0,10688 x 2
P85 = 14 + 0,21376
P85 = 14,21376
Desta forma pode-se concluir que a idade mínima para que o aluno seja
incentivado am matricular-se no turno da noite é de 14,21376 anos.
Quanto menor for a distância entre a menor nota e a maior nota, maior será
a confiança na média.
UniverCidade 94
Estatística Aplicada - Prof. Célio Cayres
___________________________________________________________________________________
At = Li − li
- Amplitude Total em uma variável contínua
Ex:
UniverCidade 95
Estatística Aplicada - Prof. Célio Cayres
___________________________________________________________________________________
Grupo B: 1, 3, 5, 7 e 9
UniverCidade 96
Estatística Aplicada - Prof. Célio Cayres
___________________________________________________________________________________
Sabe-se que a média aritmética (média) é igual a 5 (cinco).
Pode-se indicar o Grupo B como sendo formado pelos seguintes elementos:
Grupo B : x1, x2, x3, x4, x5
Desvio = (1-5)+(3-5)+(5-5)+(7-5)+(9-5)
Desvio = (-4)+(-2)+(0)+(2)+(4)
Desvio =0
Simbolizando:
Desvio = (1-5)+(3-5)+(5-5)+(7-5)+(9-5)
Desvio = (-4)+(-2)+(0)+(2)+(4)
Desvio = 12
UniverCidade 97
Estatística Aplicada - Prof. Célio Cayres
___________________________________________________________________________________
Para aprimorar o resultado, deve-se determinar a média do desvio,
passando-se a ter o conceito do desvio médio:
Simbolizando:
∑x
i =1
i − média
DM =
n
Desta forma, o desvio médio do grupo B seria:
(1 − 5) + (3 − 5) + (5 − 5) + (7 − 5) + (9 − 5)
DM =
5
12
DM = ∴ DM = 2,4
5
∑f i =1
i xi − média
DM = n
∑f
i =1
i
∑f i =1
i xi − média
DM =
n
Se o exemplo:
Média =
∑fm i i
∑f i
Então:
UniverCidade 99
Estatística Aplicada - Prof. Célio Cayres
___________________________________________________________________________________
Classe Idades Nº de Alunos Ponto médio fimi
(fi) (mi)
1 8 __ 12 15 10 150
2 12 __ 16 18 14 252
3 16 __ 20 36 18 648
4 20 __ 24 45 22 990
5 24 __ 28 10 26 260
Σ 90 2.300
Média =
∑fm i i
∑f i
2.300
Média =
90
Média = 25,6anos
Σ 90 2.300 882,4
∑f
i =1
i xi − média
DM = n
∑f
i =1
i
882,4
DM = ∴ DM = 9,8anos
90
UniverCidade 100
Estatística Aplicada - Prof. Célio Cayres
___________________________________________________________________________________
Grupo B: 1, 3, 5, 7 e 9
Sabe-se que a média aritmética (média) é igual a 5 (cinco).
Desvio = (1 − 5) 2 + (3 − 5) 2 + (5 − 5) 2 + (7 − 5) 2 + (9 − 5) 2
Desvio = (−4) 2 + (−2) 2 + (0) 2 + (2) 2 + (4) 2
Desvio = 16 + 4 + 0 + 4 + 16
Desvio = 40
O valor encontrado deve ser interpretado com uma unidade que será o grau
ao quadrado. Não faz sentido.
UniverCidade 102
Estatística Aplicada - Prof. Célio Cayres
___________________________________________________________________________________
Foi visto anteriormente que deve-se dividir o resultado pelo número de
observações, para o cálculo do desvio médio. Entretanto, considerando uma série
de conceitos que não são objeto deste estudo, o resultado será dividido pelo
número de observações menos um (n-1).
40
Desvio =
5 −1
Desvio = 10
2 ∑ (x i − média) 2
δ =
n −1
A variância mede a dispersão média em torno da média aritmética, isto é,
como as observações maiores flutuam acima dela e as observações menores se
distribuem abaixo dela.
δ = ∑ ( x − média)
i
n −1
δ = 10
δ = 3,2
Seja o exemplo:
UniverCidade 104
Estatística Aplicada - Prof. Célio Cayres
___________________________________________________________________________________
δ 2
=
∑ f (m − média )
i i
n −1
E sabendo-se que o desvio padrão nada mais é do que a raiz quadrada da
variância, logo
δ = δ2
Verifica-se:
8744,6
δ2 =
124 − 1
2
δ = 71,1
b) o desvio padrão
δ = 71,1
δ = 8,4anos
UniverCidade 106
Estatística Aplicada - Prof. Célio Cayres
___________________________________________________________________________________
5. Correlação e Regressão
Seja o exemplo:
- Foi efetuada uma pesquisa onde foram verificadas as alturas e os pesos
de um grupo de alunos, o que possibilitou a construção da seguinte
tabela:
80
70
60
50
Pesos
40
30
20
10
0
155 160 165 170 175
Alturas
5 – Clique com o botão esquerdo do mouse sobre Avançar>, duas vezes, e sua
tela terá este formato
UniverCidade 110
Estatística Aplicada - Prof. Célio Cayres
___________________________________________________________________________________
6 – Posicione o cursor sobre a área Título, clique com o botão esquerdo do mouse
e preencha o título do gráfico. Repita a operação em Eixo de Valores X
(corresponde às alturas) e em Eixo de Valores Y (corresponde aos pesos);
7 – Clique com o botão esquerdo do mouse sobre Linhas de Grade e desmarque
as opções que estiverem ativadas. Repita a operação em Legenda. Em seguida
clique com o botão esquerdo do mouse sobre Avançar >;
8 – Clique em Concluir.
UniverCidade 111
Estatística Aplicada - Prof. Célio Cayres
___________________________________________________________________________________
16
14
12
10
0
0 50 100 150 200 250
14
12
10
0
0 50 100 150 200 250
9,6
9,4
9,2
9
8,8
8,6
8,4
8,2
8
7,8
0 50 100 150 200 250
20
18
16
14
12
10
8
6
4
2
0
0 50 100 150 200 250
18
16
14
12
10
8
6
4
2
0
0 50 100 150 200 250
60
50
40
30
20
10
0
0 50 100 150 200 250
140
120
100
80
60
40
20
0
0 20 40 60 80 100
180
160
140
120
100
80
60
40
20
0
0 20 40 60 80 100 120
Muitas vezes, mesmo que não se disponha dos dados, é possível que sejam
interpretadas as correlações entre duas variáveis.
Identifique o tipo de correlação entre as seguintes variáveis:
As soluções são:
a) forte correlação negativa;
b) correlação positiva fraca;
c) correlação positiva fraca.
UniverCidade 116
Estatística Aplicada - Prof. Célio Cayres
___________________________________________________________________________________
Esquematizando:
-1 0 1
n∑ xy − (∑ x)(∑ y )
r=
{n(∑ x 2 ) − (∑ x) 2 }x{n(∑ y 2 ) − (∑ y ) 2
Seja o exemplo:
Foi efetuado um levantamento sobre a renda das famílias dos alunos de uma
escola e o número de filhos de cada família, o que possibilitou a construção da
tabela abaixo:
0
0,00 1.000,00 2.000,00 3.000,00 4.000,00 5.000,00
3 – Clique OK;
UniverCidade 120
Estatística Aplicada - Prof. Célio Cayres
___________________________________________________________________________________
5 – Clique OK.
UniverCidade 122
Estatística Aplicada - Prof. Célio Cayres
___________________________________________________________________________________
Referências: