Beruflich Dokumente
Kultur Dokumente
Sum
ario
1 Estatstica Descritiva
1.1 Dados . . . . . . . . . . . . .
1.2 Introducao . . . . . . . . . . .
1.2.1 Introducao . . . . . . .
1.2.2 Metodos . . . . . . . .
1.2.3 Conceitos . . . . . . .
1.2.4 Amostragem . . . . . .
1.3 Estatstica Descritiva . . . . .
1.3.1 Apresentacao de dados
1.3.2 Tipos de Dados . . . .
1.3.3 Organizacao de Dados
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
3
3
4
4
4
4
5
5
5
5
6
Captulo 1
Estatstica Descritiva
1.1
Dados
Como exemplo desta secao, utilizaremos um questionario que foi aplicado aos alunos do
primeiro ano de uma escola de Sao Paulo. Os dados foram retirados do livro: Nocoes de
Probabilidade e Estatstica/ Marcos Nascimento Magalhaes, Antonio Carlos Pedroso de
Lima - 6ed. e estao no SOL em um arquivo excel.
Id: identificacao do aluno;
Turma: turma a que o aluno foi alocado (A ou B);
Sexo: F se feminino, M se masculino;
Idade: idade em anos;
Alt: altura em metros;
Peso: peso em quilogramas;
Filhos: n
umero de filhos na famlia;
Fuma: habito de fumar, sim ou nao;
Toler: tolerancia ao cigarro: I indiferente, P incomoda pouco e M incomoda muito;
Exerc: horas de atividade fsicas, por semana;
Cine: n
umero de vezes em que vai ao cinema por semana;
OpCine: opniao a respeito das salas de cinema da cidade: (B) regular a boa, (M )
muito boa;
TV: horas gastas assistindo TV, por semana;
OpTV: opiniao a respeito da qualidade da programacao na TV: (R) Ruim, (M )
media, (B) boa e (N ) nao sabe.
1.2
Introduc
ao
1.2.1
Introdu
c
ao
1.2.2
M
etodos
Estatstica Descritiva: e utilizada na etapa inicial da analise para que possamos nos
familiarizar com os dados, e tirarmos conclusoes informais e diretas sobre a populacao
com base nos dados observados. Utilizamos as seguintes tecnicas (para resumir os dados):
Graficos;
Tabelas;
Medidas;
Probabilidade: e a teoria matematica que permite medir incertezas sobre fenomenos
aleatorios. Construirmos modelos probabilsticos para descrever o comportamento de objetos aleatorios.
Infer
encia Estatstica: tecnicas que permitem extrapolar para a populacao, conclusoes obtidas de subconjuntos ou amostras desta populacao. As principais tecnicas
usadas sao:
Estimacao pontual;
Intervalo de confianca;
Teste de hipoteses;
1.2.3
Conceitos
Populac
ao: e o grande conjunto de dados que contem a caracterstica de interesse. Esse
termo refere-se nao somente a uma colecao de indivduos, mas tambem ao alvo sobre o
qual reside nosso interesse. Assim nossa populacao pode ser:
a populacao brasileira;
a totalidade de carros produzida no Brasil;
4
1.2.4
Amostragem
A selecao da amostra pode ser feita de varias maneiras, dependendo, entre outros fatores,
do grau de conhecimento que temos da populacao, da quantidade de recursos disponveis
e assim por diante.
Devemos ressaltar que, em princpio, a selecao da amostra tenta fornecer um subconjunto de valores o mais parecido possvel com a populacao que lhe da origem. As
amostragem mais usadas sao:
Amostragem casual simples;
Amostragem Estratificada;
Amostragem Sistematica;
1.3
Estatstica Descritiva
1.3.1
Apresenta
c
ao de dados
1.3.2
Tipos de Dados
1.3.3
Organiza
c
ao de Dados
Com o objetivo de visualizar o comportamento do conjunto de dados, normalmente construmos uma nova tabela denominada tabela de frequencia. A tabela de frequencia mais
simples e aquela que lista os valores observados para determinada variavel e o n
umero de
ocorrencia de cada um desse valores.
A representacao grafica de uma tabela de frequencia e chamado de grafico de barras
no caso de variaveis qualitativas ou quantitativas discretas ou histograma no caso de
variaveis quantitativas continuas.
Como exemplo vamos construir tabelas de frequencia para algumas variaveis do banco
de dados. Nas tabelas de frequencia iremos usar a frequencia absoluta (Freq. Abs) que
e propria contagem dos valores e a frequencia relativa (Freq. Rel.) que e a frequencia
absoluta dividida pelo total de observacoes na amostra.
10
Freq. Abs.
Freq. Rel.
26
26/50 = 52%
24
24/50 = 48%
50
50/50=100%
Turma
A
B
Total
15
20
25
Turma
Atraves da tabela e do grafico acima podemos perceber que a distribuicao dos alunos
e aproximadamente igual entre as turmas A e B.
Tabela de frequencia e grafico de barras para a variavel Idade. Incluindo tambem a
frequencia relativa acumulada (F.R.A.), que a cada nvel da variavel acumula a frequencia
relativa dos nveis anteriores.
15
20
F.R.A.
18%
62%
76%
84%
90%
90%
94%
96%
100%
10
Freq. Rel.
18%
44%
14%
08%
06%
00%
04%
02%
04%
100%
Freq. Abs.
9
22
7
4
3
0
2
1
2
50
Idade
17
18
19
20
21
22
23
24
25
Total
17
18
19
20
21
23
24
25
Idade
Podemos perceber pela tabela e grafico que dentre os alunos intrevistados, a maioria
dos alunos possuem idade entre 17 e 19 anos (76%) apenas 10% dos alunos possem idades
acima de 22 anos.
Tabela de frequencia e Histograma para a variavel Peso. A tabela de frequencia
para variaveis quantitativas contnuas e ligeiramente diferente, uma vez que este tipo
de variavel assume muitos valores distntos, devemos agrupa-los em classes e contar o
total de indivdos dentro de cada classe. O grafico de barras para essa tipo de variavel e
chamado de histograma mas a interpretacao e basicamente a mesma.
15
20
Freq. Rel.
20%
46%
12%
10%
10%
2%
100%
10
Freq. Abs.
10
23
6
5
5
1
50
Peso
40 a 50
50 a 60
60 a 70
70 a 80
80 a 90
90 a 100
Total
40
50
60
70
80
90
100
Peso
Podemos concluir que boa parte dos alunos possuem peso entre 50 a 60 quilos, apenas
2% possum peso acima de 90 quilos.
Algoritmo para a construcao de uma tabela de frequencia para variaveis contnuas.
Comece selecionando o n
umero desejado de classes;
7
Escolha o ponto inicial, pode ser o valor mnimo ou ligeramente menor do que o
mnimo.
Adicione a amplitude de classe ao ponto inicial, obtendo o primeiro intervalo de
valores, ou seja, a primeira classe;
Para obter a segunda classe, basta pegar o limite superior da classe anterior e somar
a amplitude de classe.
Repita o algoritmo ate que voce tenha uma classe que englobe o valor maximo da
amostra.
Vale lembrar que o algoritmo acima e uma base para se construir a tabela, a tabela
final deve conter classes com limites claros e de facil interpretacao.