Sie sind auf Seite 1von 26

Anlise Exploratria de Dados

Aula 03
Etapas da Anlise Exploratria/Variveis/Sries
Estatsticas
Prof. Hemlio Fernandes Campos Colho

30 de Abril de 2014

Prof. Hemlio Fernandes Campos Colho

Anlise Exploratria de Dados Aula 03

Etapas da Anlise Exploratria/Estatstica


Descritiva
(1)

Denio do problema:

Trata de uma completa formulao

do problema em questo.
(2)

Denio do objetivo:

Trata de denir a meta a ser

alcanada diante do problema em questo.

(3)

Planejamento:

Consiste em determinar a metodologia para

lidar com o problema em questo, atravs do levantamento de


informaes sobre o tema em estudo. O planejamento implica
em obter respostas para uma srie tradicional de perguntas
envolvendo
quem, o que, sempre, por que, para que, para
quando.

Prof. Hemlio Fernandes Campos Colho

Anlise Exploratria de Dados Aula 03

Exemplo
Suponha que em Joo Pessoa exista o interesse na obteno de
informaes sobre determinada virose que atinge parte da populao
da cidade em determinada poca do ano. O primeiro trabalho da
equipe encarregada da pesquisa, ser evidentemente, o de obter
resposta para as perguntas organizadas da seguinte forma:

Prof. Hemlio Fernandes Campos Colho

Anlise Exploratria de Dados Aula 03

Exemplo
Suponha que em Joo Pessoa exista o interesse na obteno de
informaes sobre determinada virose que atinge parte da populao
da cidade em determinada poca do ano. O primeiro trabalho da
equipe encarregada da pesquisa, ser evidentemente, o de obter
resposta para as perguntas organizadas da seguinte forma:

Quem tem interesse em obter as informaes?


O que devemos procurar saber?
Ser executada sempre? A pesquisa ser peridica ou
ocasional?
Por que as informaes so necessrias e desejveis?
Para que se desejam as informaes?
Para quando a pesquisa deve ser concluda?
Prof. Hemlio Fernandes Campos Colho

Anlise Exploratria de Dados Aula 03

continuao
Sempre preciso levar em considerao o seguinte:
(a) O exame das informaes disponveis, ou seja, anlise de tudo
que foi publicado sobre o assunto, obtendo-se relatrios sobre
atividades semelhantes ou correlatas;
(b) A denio da populao de interesse, ou seja, necessrio
saber qual o conjunto que vai ser pesquisado, distribuindo e
classicando os elementos pertencentes a esse conjunto, de
modo a permitir um trabalho mais organizado e mais fcil;
(c) A construo adequada de um questionrio;
(d) A escolha pelo tipo de levantamento, ou seja, deve-se decidir
por um censo (analisar todos os indivduos da populao) ou
por um levantamento amostral (obteno de amostra a partir
de uma metodologia existente).

Prof. Hemlio Fernandes Campos Colho

Anlise Exploratria de Dados Aula 03

continuao

(e) A programao das atividades a serem desenvolvidas;

(f ) O custo total de todas as etapas do trabalho a ser


desenvolvido;

(g) Cuidadosa anlise das informaes disponveis;

(h) Se em (b) a opo for um levantamento amostral, realizar o


delineamento da amostra.

Prof. Hemlio Fernandes Campos Colho

Anlise Exploratria de Dados Aula 03

continuao
(4)

Coleta de dados:
(a) Feita aps o planejamento e a devida determinao das
caractersticas mensurveis do fenmeno de interesse
(coletivamente tpico) que se quer pesquisar.
(b) A coleta de dados pode ser feita de vrias formas. A forma
ideal aquela que maximiza todos os recursos disponveis,
dados os objetivos e a preciso estipulados de forma prvia.
(c) Quando os dados forem referentes a indivduos, a coleta
poder ser realizada mediante respostas a questionrios
previamente elaborados.
(d) Por m, importante lembrar da classicao dos dados
(primrios e secundrios) e das formas de coleta de dados
(direta e indireta) denidos anteriormente.

Prof. Hemlio Fernandes Campos Colho

Anlise Exploratria de Dados Aula 03

continuao
(5)

Apurao e apresentao dos dados:

A apurao baseia-se

na validao dos dados coletados, buscando eventuais falhas


que tenham ocorrido durante a coleta de dados.

(6)

Apresentao dos dados:

Consiste da apresentao dos

dados atravs de tabelas e grcos, tornando mais fcil o


exame do fenmeno sob estudo.

(7)

Anlise estatstica e apresentao dos resultados:

So

calculadas quantidades de interesse atravs de alguma tcnica


existente, com o intuito de descrever, de forma aproximada, a
realidade referente ao fenmeno em questo. O interesse
maior reside em se tirar concluses que auxiliem o pesquisador
a resolver seu problema. Nesta fase, calculam-se medidas cuja
nalidade principal descrever o fenmeno que se est
investigando.
Prof. Hemlio Fernandes Campos Colho

Anlise Exploratria de Dados Aula 03

Variveis

Quando temos o interesse de investigar elementos em uma


determinada pesquisa, de nosso interesse analisar um
resultado referente uma ou mais caractersticas de interesse.
da natureza dos dados em qualquer rea do conhecimento
que exista variao, ou ainda, variabilidade.
Nesse sentido, denimos como varivel como sendo uma
caracterstica de interesse que est sujeita variabilidade.

Prof. Hemlio Fernandes Campos Colho

Anlise Exploratria de Dados Aula 03

continuao

Alguns exemplos de variveis:

Nome da Varivel Possveis valores (ou rtulos)


Sexo

Masculino (1); Feminino (2)

Estado Civil

Solteiro(a) (1); Casado(b) (2); Vivo(c) (3)

Idade

0, 1, 2, 3, . . .

Peso

0, 24.5, 100.2, . . .

Altura

1.55, 2.10,

Prof. Hemlio Fernandes Campos Colho

...

Anlise Exploratria de Dados Aula 03

continuao
Nesse contexto, temos ento que Varivel qualquer caracterstica
sujeita a variao.
Algumas variveis, como sexo e estado civil apresentam como
possveis resultados ou realizaes uma qualidade (ou
atributo);
J outras variveis como peso e altura (por exemplo)
apresentam como possveis realizaes nmeros resultantes de
contagens ou medies.
Normalmente, so utilizadas letras (A, B, X, Y, Z, etc.) para
representar as variveis.
Conforme suas caractersticas particulares, as variveis podem
ser classicadas como:

quantitativas e qualitativas

Prof. Hemlio Fernandes Campos Colho

Anlise Exploratria de Dados Aula 03

Nveis de Mensurao das Variveis

(1)

Varivel Qualitativa:
Uma varivel dita ser

qualitativa quando apresenta como

possveis realizaes qualidades ou atributos.


Exemplos:

Sexo, Estado Civil, Escolaridade, Bairro, Curso,

Departamento, Etnia, etc.

Prof. Hemlio Fernandes Campos Colho

Anlise Exploratria de Dados Aula 03

continuao

Variveis qualitativas so divididas em dois tipos:


(a)

Nominais:

Nomeiam, rotulam ou classicam um objeto,

pessoa ou alguma caracterstica por meio de nmeros ou


outros smbolos;

(b)

Exemplos:

Sexo, Bairro, etc.

Ordinais:

As categorias mantm uma relao de ordem.

Exemplos:

Escalas de qualidade

(Pssimo/Ruim/Regular/Bom/timo), Escolaridade, etc.

Prof. Hemlio Fernandes Campos Colho

Anlise Exploratria de Dados Aula 03

continuao

(2)

Varivel Quantitativa:

Uma varivel dita ser

quantitativa quando apresenta como

possveis realizaes nmeros ou quantidades.

Prof. Hemlio Fernandes Campos Colho

Anlise Exploratria de Dados Aula 03

continuao
Variveis quantitativas so divididas em dois tipos:
(a)

Discretas:

Assumem apenas valores pertencentes a um

conjunto nito ou enumervel;


Exemplos:

Nmero de lhos

(0, 1, 2, . . .),
(0, 1, 2, . . .), etc.
comprados

(b)

Contnuas:

(0, 1, 2, . . .),

Nmero de livros

Nmero de acidentes de trnsito

Assumem qualquer valor num certo intervalo de

variao.
Exemplos:

Peso, Altura, Renda, Preo do Dlar, Teor alcolico

de bebidas, Taxa de mortalidade, etc.

Prof. Hemlio Fernandes Campos Colho

Anlise Exploratria de Dados Aula 03

Esquema Ilustrativo 1

Prof. Hemlio Fernandes Campos Colho

Anlise Exploratria de Dados Aula 03

Esquema Ilustrativo 2

Prof. Hemlio Fernandes Campos Colho

Anlise Exploratria de Dados Aula 03

EXEMPLO
Exemplo:

Uma empresa realizou uma pesquisa junto a seus

funcionrios. Os funcionrios responderam a um questionrio que


originou a seguinte tabela:

Prof. Hemlio Fernandes Campos Colho

Anlise Exploratria de Dados Aula 03

Tabelas Estatsticas
Em geral, uma tabela estatstica deve apresentar a seguinte
estrutura:
Cabealho;
Corpo;
Rodap.
O cabealho deve conter informao suciente para responder s
seguintes questes:
O que est representando?
Onde ocorreu?
Quando ocorreu?

observao:

Uma tabela sempre apresenta as laterais abertas.

Caso as laterais estejam fechadas, chamamos de quadro.

Prof. Hemlio Fernandes Campos Colho

Anlise Exploratria de Dados Aula 03

continuao
O corpo so as colunas e subcolunas onde efetivamente registramos
os dados e o rodap reservado para observaes pertinentes
tabela, e para o registro da fonte dos dados.
De um modo geral, em uma tabela estatstica devem ser
considerados os seguintes itens:

Elementos essenciais:
1

Ttulo: Indicao que precede a tabela e que contm a


designao do fato observado, o local e a poca em foi
registrado;

Cabealho: Parte superior da tabela que especica o


contedo das colunas;

Coluna Indicadora: Parte da tabela que especica o contedo


das linhas.

Corpo da Tabela: Conjunto de colunas e linhas que contm


as informaes sobre a varivel em estudo.

Prof. Hemlio Fernandes Campos Colho

Anlise Exploratria de Dados Aula 03

continuao
Elementos complementares:
(a) Fonte: Indicao da entidade responsvel pelo fornecimento
do conjunto de dados ou pela sua elaborao;
(b) Notas: Informaes de natureza geral destinadas a conceituar
ou esclarecer o contedo das tabelas ou a indicar a
metodologia adotada no levantamento ou na elaborao dos
dados;
(c) Chamadas: Informaes da natureza especca sobre
determinada parte da tabela, que tem como objetivo
conceituar ou esclarecer sobre os dados obtidos.

Prof. Hemlio Fernandes Campos Colho

Anlise Exploratria de Dados Aula 03

Sries Estatsticas

Consistem na apresentao das informaes em forma de tabelas,


objetivando sintetizar os dados observados. Em um sentido amplo,
uma srie estatstica uma sucesso de valores expressando dados
estatsticos referidos a qualquer varivel. Uma Srie Estatstica
pode ser:

Prof. Hemlio Fernandes Campos Colho

Anlise Exploratria de Dados Aula 03

continuao
1. Histrica, Cronolgica ou Temporal

Os dados so observados segundo a poca de ocorrncia. Ou seja,


identica-se pelo carter varivel do fator cronolgico. Assim, temos que
o elemento varivel a poca, enquanto que os elementos xos so o
local e o fato.;
Exemplo:

Evoluo da relao candidato/vaga (20022006) do curso de


Biomedicina da Universidade Federal de Pernambuco
Ano Candidato/vaga
2002
11, 7
2003
12, 2
2004
9, 84
2005
13, 6
2006
9, 3
Fonte: COVEST

Prof. Hemlio Fernandes Campos Colho

Anlise Exploratria de Dados Aula 03

continuao
2.Geogrca ou de Localizao

Apresenta como elemento varivel o fator geogrco. Ou seja, os dados


so observados segundo a localidade de ocorrncia;
Exemplo:

Produto Interno Bruto (PIB) a preos correntes segundo Grandes Regies


- 2004 (em unidades de R$ 1.000)
Regio
PIB
Norte
93.423.001
Nordeste
248.445.303
Sul
321.781.051
Sudeste
970.244.552
Centroeste 132.727.147
Fonte: IBGE

Prof. Hemlio Fernandes Campos Colho

Anlise Exploratria de Dados Aula 03

continuao
3.Especca, por categoria ou especicativa

identicada pelo carter varivel do elemento fator. Ou seja, os dados


so agrupados segundo a modalidade de ocorrncia;
Exemplo:

Nmero de acidentes de trnsito por tipo de veculo na Regio


Metropolitana do Recife, em setembro de 2007
Tipo de Veculo
No de acidentes
Automvel de passeio
243
Caminho
123
nibus
97
415
Motocicleta
Total
878
Fonte: Dados Hipotticos

Prof. Hemlio Fernandes Campos Colho

Anlise Exploratria de Dados Aula 03

continuao
4.Mista (ou tabela cruzada)

a combinao de um ou mais tipos de sries descritas anteriormente.


Exemplo:

Produo Agrcola por regio, segundo os principais produtos - 1994


(valores em toneladas)

Fonte: Dados ctcios


Prof. Hemlio Fernandes Campos Colho

Anlise Exploratria de Dados Aula 03

Das könnte Ihnen auch gefallen