Sie sind auf Seite 1von 8

Estatsticas e Probabilidades

Notas de Aula - Unibh

Renato de Almeida Nascimento

Sum
ario
1 Estatstica Descritiva
1.1 Dados . . . . . . . . . . . . .
1.2 Introducao . . . . . . . . . . .
1.2.1 Introducao . . . . . . .
1.2.2 Metodos . . . . . . . .
1.2.3 Conceitos . . . . . . .
1.2.4 Amostragem . . . . . .
1.3 Estatstica Descritiva . . . . .
1.3.1 Apresentacao de dados
1.3.2 Tipos de Dados . . . .
1.3.3 Organizacao de Dados

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

3
3
4
4
4
4
5
5
5
5
6

Captulo 1
Estatstica Descritiva
1.1

Dados

Como exemplo desta secao, utilizaremos um questionario que foi aplicado aos alunos do
primeiro ano de uma escola de Sao Paulo. Os dados foram retirados do livro: Nocoes de
Probabilidade e Estatstica/ Marcos Nascimento Magalhaes, Antonio Carlos Pedroso de
Lima - 6ed. e estao no SOL em um arquivo excel.
Id: identificacao do aluno;
Turma: turma a que o aluno foi alocado (A ou B);
Sexo: F se feminino, M se masculino;
Idade: idade em anos;
Alt: altura em metros;
Peso: peso em quilogramas;
Filhos: n
umero de filhos na famlia;
Fuma: habito de fumar, sim ou nao;
Toler: tolerancia ao cigarro: I indiferente, P incomoda pouco e M incomoda muito;
Exerc: horas de atividade fsicas, por semana;
Cine: n
umero de vezes em que vai ao cinema por semana;
OpCine: opniao a respeito das salas de cinema da cidade: (B) regular a boa, (M )
muito boa;
TV: horas gastas assistindo TV, por semana;
OpTV: opiniao a respeito da qualidade da programacao na TV: (R) Ruim, (M )
media, (B) boa e (N ) nao sabe.

1.2

Introduc
ao

1.2.1

Introdu
c
ao

O que e Estatstica e para que serve?


Estatstica: e uma ciencia que desenvolve metodologias para coletar, descrever, orga uma ferramenta poderosa para tomada de decisao,
nizar, analisar e interpretar dados. E
resolucao de problemas, planejamento de produtos e processos, com in
umeras aplicacoes.
A grosso modo podemos dividir a Estatstica em tres areas:
Estatstica Descritiva
Probabilidade
Inferencia Estatstica

1.2.2

M
etodos

Estatstica Descritiva: e utilizada na etapa inicial da analise para que possamos nos
familiarizar com os dados, e tirarmos conclusoes informais e diretas sobre a populacao
com base nos dados observados. Utilizamos as seguintes tecnicas (para resumir os dados):
Graficos;
Tabelas;
Medidas;
Probabilidade: e a teoria matematica que permite medir incertezas sobre fenomenos
aleatorios. Construirmos modelos probabilsticos para descrever o comportamento de objetos aleatorios.
Infer
encia Estatstica: tecnicas que permitem extrapolar para a populacao, conclusoes obtidas de subconjuntos ou amostras desta populacao. As principais tecnicas
usadas sao:
Estimacao pontual;
Intervalo de confianca;
Teste de hipoteses;

1.2.3

Conceitos

Populac
ao: e o grande conjunto de dados que contem a caracterstica de interesse. Esse
termo refere-se nao somente a uma colecao de indivduos, mas tambem ao alvo sobre o
qual reside nosso interesse. Assim nossa populacao pode ser:
a populacao brasileira;
a totalidade de carros produzida no Brasil;
4

o sangue no corpo de uma pessoa;


um subconjunto desta populacao.:
Amostra: E
a populacao de Minas Gerais;
um conjunto de 10 carros para testes;
uma ampola de sangue colhida para um exame;
Par
ametro (): resumo de uma caracterstica obtido a partir de todos os elementos
de uma populacao.
Estatstica: Resumo da caracterstica de interesse levando-se em conta apenas os
elementos da amostra.

1.2.4

Amostragem

A selecao da amostra pode ser feita de varias maneiras, dependendo, entre outros fatores,
do grau de conhecimento que temos da populacao, da quantidade de recursos disponveis
e assim por diante.
Devemos ressaltar que, em princpio, a selecao da amostra tenta fornecer um subconjunto de valores o mais parecido possvel com a populacao que lhe da origem. As
amostragem mais usadas sao:
Amostragem casual simples;
Amostragem Estratificada;
Amostragem Sistematica;

1.3

Estatstica Descritiva

1.3.1

Apresenta
c
ao de dados

A questao inicial e: dado um conjunto de dados, como tratar os valores, numericos


ou nao, a fim de se extrair informacoes a respeito de uma ou mais caractersticas de
interesse? Basicamente faremos uso de tabelas de frequencias e graficos, notando que tais
procedimento devem levar em conta a natureza dos dados.

1.3.2

Tipos de Dados

Qualitativos: representam uma qualidade dos elementos da populacao, normalmente


nao mensuraveis numericamente. Podem ser:
Nominais: o conjunto das possveis respostas nao possui uma ordenacao natural.
Ordinais: e possvel ordenar o conjunto das possveis respostas.
5

Quantitativos: representam uma quantidade numericamente mensuravel dos elementos da populacao.


Podem ser:
Discretos: em geral sao fruto de uma contagem. O conjunto de possveis respostas
e enumeravel.
Contnuos: O conjunto de possveis respostas e um intervalo de n
umeros reais.

1.3.3

Organiza
c
ao de Dados

Com o objetivo de visualizar o comportamento do conjunto de dados, normalmente construmos uma nova tabela denominada tabela de frequencia. A tabela de frequencia mais
simples e aquela que lista os valores observados para determinada variavel e o n
umero de
ocorrencia de cada um desse valores.
A representacao grafica de uma tabela de frequencia e chamado de grafico de barras
no caso de variaveis qualitativas ou quantitativas discretas ou histograma no caso de
variaveis quantitativas continuas.
Como exemplo vamos construir tabelas de frequencia para algumas variaveis do banco
de dados. Nas tabelas de frequencia iremos usar a frequencia absoluta (Freq. Abs) que
e propria contagem dos valores e a frequencia relativa (Freq. Rel.) que e a frequencia
absoluta dividida pelo total de observacoes na amostra.

10

Freq. Abs.
Freq. Rel.
26
26/50 = 52%
24
24/50 = 48%
50
50/50=100%

Turma
A
B
Total

15

20

25

Tabela de frequencia e grafico de barras para a variavel Turma.

Turma

Atraves da tabela e do grafico acima podemos perceber que a distribuicao dos alunos
e aproximadamente igual entre as turmas A e B.
Tabela de frequencia e grafico de barras para a variavel Idade. Incluindo tambem a
frequencia relativa acumulada (F.R.A.), que a cada nvel da variavel acumula a frequencia
relativa dos nveis anteriores.

15

20

F.R.A.
18%
62%
76%
84%
90%
90%
94%
96%
100%

10

Freq. Rel.
18%
44%
14%
08%
06%
00%
04%
02%
04%
100%

Freq. Abs.
9
22
7
4
3
0
2
1
2
50

Idade
17
18
19
20
21
22
23
24
25
Total

17

18

19

20

21

23

24

25

Idade

Podemos perceber pela tabela e grafico que dentre os alunos intrevistados, a maioria
dos alunos possuem idade entre 17 e 19 anos (76%) apenas 10% dos alunos possem idades
acima de 22 anos.
Tabela de frequencia e Histograma para a variavel Peso. A tabela de frequencia
para variaveis quantitativas contnuas e ligeiramente diferente, uma vez que este tipo
de variavel assume muitos valores distntos, devemos agrupa-los em classes e contar o
total de indivdos dentro de cada classe. O grafico de barras para essa tipo de variavel e
chamado de histograma mas a interpretacao e basicamente a mesma.

15

20

Freq. Rel.
20%
46%
12%
10%
10%
2%
100%

10

Freq. Abs.
10
23
6
5
5
1
50

Peso
40 a 50
50 a 60
60 a 70
70 a 80
80 a 90
90 a 100
Total

40

50

60

70

80

90

100

Peso

Podemos concluir que boa parte dos alunos possuem peso entre 50 a 60 quilos, apenas
2% possum peso acima de 90 quilos.
Algoritmo para a construcao de uma tabela de frequencia para variaveis contnuas.
Comece selecionando o n
umero desejado de classes;
7

Calcule a amplitude de classe, arredonde o n


umero para cima quando necessario.
amplitude de classe =

(valor maximo) - (valor mnimo)


n
umero de classes

Escolha o ponto inicial, pode ser o valor mnimo ou ligeramente menor do que o
mnimo.
Adicione a amplitude de classe ao ponto inicial, obtendo o primeiro intervalo de
valores, ou seja, a primeira classe;
Para obter a segunda classe, basta pegar o limite superior da classe anterior e somar
a amplitude de classe.
Repita o algoritmo ate que voce tenha uma classe que englobe o valor maximo da
amostra.
Vale lembrar que o algoritmo acima e uma base para se construir a tabela, a tabela
final deve conter classes com limites claros e de facil interpretacao.

Das könnte Ihnen auch gefallen