Sie sind auf Seite 1von 5

UFRRJ, Prof.

: Felipe Leite Coelho

Universidade Federal Rural do Rio de Janeiro


Prof: Felipe Leite Coelho

Analise exploratoria de dados

1
UFRRJ, Prof.: Felipe Leite Coelho

1 Analise exploratoria de dados

1.1 Introducao

O que e a Estatstica?
E a parte da ciencia que tem por objetivo:

a coleta, a analise e a modelagem de dados parciais (amostra);

fazer inferencia para o conjunto total de dados (populacao).

Os dados podem ser obtidos por observacao ou experimento.

Definicoes:

Definicao 1 Populacao: conjunto de indivduos (ou objetos, elementos) que tem em comum
pelo menos uma variavel observavel que pode ser representada por uma v.a. X.

Definicao 2 Amostra: e qualquer subconjunto da populacao.

Definicao 3 Variavel: e uma caracterstica qualquer do objeto em estudo.

Uma variavel pode ser classificada por quantitativa (discreta, contnua) ou qualitativa
(nominal, ordinal).

1.2 Apresentacao dos dados

Tabelas e graficos.

1.2.1 Tabela de frequencias

Considere que:

k e o numero de classes;

ni e a frequencia absoluta, n1 + n2 + + nk = n;
ni
fi e a frequencia relativa, fi = ;
n
i
X
fiac e a frequencia relativa acumulada, fiac = fj .
j=1
2
UFRRJ, Prof.: Felipe Leite Coelho

Tabela 1: Tabela de frequencias.


Classes ni fi fiac Percentual
c1 n1 f1 f1ac 100 f1
c2 n2 f2 f2ac 100 f2
.. .. .. ..
. . . .
ck nk fk 1 100 fk
Total n 1 100%

Importante: O numero de classes (k) para uma tabela de frequencias pode ser obtido
utilizando os seguintes metodos:

Metodo da raiz quadrada:



n, se n > 25;

k =
5, caso contrario.

Metodo de Sturges:
k = 1 + 3, 22 log10 n (1)

Exemplo 1: Construa uma tabela de frequencias para os dados da variavel idade.


Dados: 17,18,18,17,20,21,22,21,21,20,19,19,18,18,19,20,20,20,22,22.

Exemplo 2: Considere o conjunto de dados de idade (em meses) de uma determinada


planta.
1 2 2 2 3 4 5 5 6 6
7 9 10 11 11 12 13 15 19 20
Obtenha uma tabela de frequencias com 5 classes iniciando no menor valor do conjunto.

1.2.2 Tabela de dupla entrada

Considere quatro diferentes bancos com agencias de mesmo porte em tres avenidas de
uma cidade.

3
UFRRJ, Prof.: Felipe Leite Coelho

PP Tabela 2: Dados
PP Avenida A
P PP
PP 1 A2 A3 Total
Banco PP
P P
B1 25 35 24
B2 32 28 27
B3 27 33 31
B4 41 60 25
Total

Exemplo 3: Construa uma tabela de dupla entrada para os dados abaixo.

Tabela 3: Dados
B1,A1 B1,A2 B2,A1 B2,A2

25 35 41 60
32 28 35 67
27 33 38 59

Exemplo 4: Foi realizada uma pesquisa com 20 funcionarios de uma empresa para avaliar
a preferencia entre dois produtos (A e B). A tabela abaixo apresenta os resultados das
seguintes caractersticas investigadas: Renda do trabalho em numero de salarios mninos
(X); Sexo (F - feminino e M - masculino); Preferencia entre o produto A e B.
Entrevistado 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
No salarios (X) 2 3,7 1,7 3 4 5 1,4 3 3 1,8 6 4,8 2,3 1,5 3,2 2,2 1 4,4 2 2
Sexo M M F M F M M F F F M M F M F F M F M F
Preferencia A B A B B B A B A A B B A A A A A B A A

a) Faca uma tabela de frequencias de dupla entrada para as variaveis qualitativas.


b) Construa o histograma para variavel numero de salarios mnimos.
c) Faca um grafico para a tabela de dupla entrada.

1.2.3 Graficos

Tipos de graficos:

setores, diagrama circular;


4
UFRRJ, Prof.: Felipe Leite Coelho

barras (ou colunas);

histograma;

diagrama de ramo e folhas;

linhas.

1.2.4 Referencias

BUSSAB. W. O. ; MORETTIN, P. A. Estatstica Basica. 5ed. Saraiva, 2003.

MAGALHAES, M.N ; LIMA, A.C.P DE. Nocoes de Probabilidade e Estatstica. 5ed.,


Sao Paulo: Ed. Edusp, 2005.

JAMES, Barry R. Probabilidade: um curso em nvel intermediario. 2ed., Rio de Ja-


neiro: IMPA, Projeto Euclides, 2002.

Das könnte Ihnen auch gefallen