Sie sind auf Seite 1von 13

Captulo Criao de Bancos de Dados

Angelo Giuseppe Roncalli da Costa Oliveira

INTRODUO grau de instruo e moradia so exemplos de variveis


categricas (Berqu, 1981).
As pesquisas epidemiolgicas, assim como todas as
pesquisas de carter quantitativo, pressupem uma
seqncia de etapas que vo do planejamento da PRINCPIOS GERAIS PARA A
pesquisa at a elaborao do relatrio final, passando CRIAO DE BANCOS DE
pela coleta e processamento dos dados. Uma atribuio
DADOS
precpua da estatstica aplicada aos estudos
epidemiolgicos a consolidao de dados obtidos de
Com os recursos tecnolgicos atualmente
amostras ou populaes de modo que estes possam ser
disponveis, no se admite mais que os dados
lidos e interpretados em seu conjunto.
envolvidos em pesquisas epidemiolgicas sejam
Desse modo, a etapa subseqente coleta de dados a
tabulados manualmente. Alm de demorada,
construo de um banco em que tais dados sejam
desgastante e limitada, a tabulao manual submete o
organizados de forma a facilitar as tarefas de anlise.
estudo a um risco elevado de erros. Com o advento e a
Este captulo abordar as estratgias necessrias para a
disseminao da informtica, a tabulao eletrnica
construo de bancos de dados em pesquisas
tornou a anlise de dados epidemiolgicos muito mais
epidemiolgicas, dando especial destaque tabulao
rpida, eficiente e segura. Com isso, a descrio e a
eletrnica a partir dos principais programas de
anlise dependem, fundamentalmente, de uma
gerenciamento de dados.
cuidadosa elaborao do banco de dados da pesquisa.
A correspondncia entre o banco de dados e o
instrumento da coleta de dados na pesquisa facilita a
ENTENDENDO AS VARIVEIS digitao e, posteriormente, a anlise dos dados.
Outras recomendaes importantes so:
As pesquisas epidemiolgicas envolvem o estudo
de caractersticas que no so distribudas de modo 1. Estabelecimento de cdigos para as variveis
uniforme na populao. O conceito de varivel categricas.
refere-se justamente a estas caractersticas A codificao das variveis pode ser efetuada
populacionais no uniformes, que se prope descrever durante a construo do instrumento de coleta de
e analisar no mbito das pesquisas epidemiolgicas. dados. Caso isso no tenha sido feito, a codificao
Grosso modo, varivel pode ser definida como a poder ser realizada por ocasio da entrada dos dados
expresso numrica de qualquer evento da natureza. em uma base eletrnica. Os cdigos devem ser,
tudo aquilo que se deseja estudar e que pode ser preferencialmente, numricos e com um nico dgito, a
traduzido em nmeros, seja atravs de contagem, no ser, obviamente, quando se trabalha com variveis
mensurao ou classificao. As variveis, portanto, quantitativas que demandam outras escalas de medida.
esto associadas a eventos contbeis, mensurveis ou Podem ser usadas letras como cdigos, quando o
classificveis; e, considerando a natureza complexa dos nmero de categorias passa de 10, ou quando
objetos de estudo da epidemiologia, possuem necessrio estabelecer uma diferenciao entre as
limitaes diretamente proporcionais subjetividade categorias, como o caso dos registros de condio
do evento. Ao contarmos uma certa quantidade de dentria, em que os cdigos numricos dizem respeito
eventos ou medirmos alguns deles, geramos variveis aos dentes permanentes e as letras correspondem aos
ditas quantitativas; ao classificamos os eventos obtemos dentes decduos. A utilizao de cdigos numricos
variveis do tipo categricas. Peso, altura, CPO, glicemia facilita bastante a digitao, pelo fato de permitirem
so exemplos de variveis quantitativas e sexo, etnia,
Criao de Bancos de Dados 399
efetuar a digitao exclusivamente atravs do teclado identificao de valores aberrantes, possivelmente fruto
numrico do computador, uma estratgia muito de erros de digitao ou anotao, permitindo assim
utilizada por digitadores profissionais. sua correo.

2. Criao de cdigos de excluso. 6. Criao de pgina de cdigos.


Embora alguns programas de bancos de dados Em funo das recomendaes anteriores,
ignorem as clulas deixadas em branco na anlise, importante criar uma tabela em que sejam explicitadas
recomenda-se evitar deixar a varivel sem as informaes relativas ao banco de dados,
preenchimento, para evitar confuso. A maioria dos particularmente os cdigos empregados. Em alguns
programas permite que um determinado cdigo, por programas, como o SPSS ou o Microsoft Excel, essa
exemplo o algarismo 9, seja interpretado como informao faz parte da estrutura do banco. Quando
informao no disponvel (missing), o que facilita for necessrio disponibilizar o banco de dados em uma
bastante a anlise. linguagem de uso comum para diferentes programas
de informtica, como os arquivos de extenso DBF,
3. Utilizao de dados quantitativos brutos. necessrio apresentar em anexo a tabela de cdigos
Na medida do possvel, o dado deve ser captado em correspondente, como exemplificado no Quadro 1.
sua expresso numrica primria, evitando categorias
estabelecidas a priori. Esta recomendao til tanto na Criando um banco de dados
construo do instrumento de coleta de dados, como na H uma quantidade considervel de programas de
criao do banco informatizado. Ao se avaliar a renda bancos de dados. Alguns so mais sofisticados e
mensal familiar, por exemplo, mais prtico captar a exigem conhecimentos de programao, sendo mais
renda em reais para, somente durante a anlise aplicveis s reas comercial e financeira.
estabelecer as faixas de renda ou transformao em Especificamente para pesquisas epidemiolgicas,
outra unidade, como salrios mnimos. Ao se obter a existem bons programas que permitem a construo do
informao j includa em faixas pr-estabelecidas, banco de dados e sua posterior anlise. A despeito de
perde-se a informao original, alm de haver o risco cada um deles possuir suas especificidades, a lgica de
de uma distribuio heterognea da varivel entre os criao dos bancos de dados muito semelhante entre
elementos amostrais. A classificao de faixas de renda eles, bastando, na maioria dos casos, seguir as
(por exemplo, menos de um salrio mnimo, de um a recomendaes anteriores. Descreveremos aqui as
dois e dois ou mais salrios mnimos) pode ser muito informaes mais importantes para a criao de bancos
til para pesquisas envolvendo populao de baixa em trs dos mais populares programas disponveis, o
renda, mas teria pouca utilidade em bairros de classe Microsoft Excel, o SPSS (Statistical Package for Social
mdia alta. Outro exemplo diz respeito escolaridade, Science) e o Epi-Info.
que pode ser expressa em nmero de anos de estudo,
evitando a obteno da informao por graus (ensino Utilizando o Microsoft Excel
fundamental, mdio e superior). O Microsoft Excel uma conhecida planilha eletrnica
integrada ao pacote de aplicativos de escritrio mais
4. Critrios de validao de entrada. utilizado em computadores pessoais no Brasil, o
Os programas de bancos de dados permitem a Microsoft Office. Na verdade, o Excel no um
criao de critrios de validao de entrada de dados. programa de banco de dados e, em princpio poderia
Isso particularmente importante quando diferentes no ser o aplicativo mais adequado para trabalhar com
digitadores contribuem para a informatizao dos dados epidemiolgicos. Contudo, a facilidade de seu
dados e diminui consideravelmente os erros de uso, sua versatilidade e popularidade permitem a
digitao. construo de bancos de dados relativamente simples,
quando se trabalha com dados numricos e / ou
5. Verificao de erros de digitao. categricos. Para questionrios mais complexos, com
O cumprimento da recomendao anterior reduz o campos descritivos, recomenda-se utilizar programas
risco de erros de digitao. Mesmo assim, podem especficos para questionrios, como o Epi-Info ou, caso
ocorrer erros quando se digitam dados vlidos porm se tenha em mente alguma anlise de carter
no correspondentes ao registro que consta na ficha de qualitativo, h outras opes como o Evoc ou Alcest.
coleta. Em alguns casos, recomenda-se a digitao Mas, para estudos envolvendo o clculo de medidas de
dupla ou mesmo tripla para minimizar o risco de erros. tendncia central e de disperso, bem como freqncias
Aps o banco pronto, ainda deve ser realizada uma absolutas e percentuais, o Excel uma boa opo,
avaliao, por amostragem, do percentual de erros de embora no contemple recursos para anlises de
digitao. A simples verificao da distribuio de inferncia.
freqncia das variveis em estudo possibilita a
Criao de Bancos de Dados 400

QUADRO 4.1 Descrio das variveis constantes em um banco de dados


Varivel Descrio Tipo Categorias

UF Unidade da Federao Categrica Nominal Cdigo do IBGE

FLUOR Presena de gua Fluoretada Categrica Nominal 1- Fluoretado


2- No-Fluoretado
9- Sem Informao

ESCOLA Tipo de Escola Categrica Nominal 1- Pblica


2- Privada
9- Sem Informao

IDADE Idade em anos Quantitativa Discreta Dado numrico

SEXO Sexo Categrica Nominal 1- Masculino


2- Feminino
9- Sem Informao

DENTAL16 Cdigo CPO para dente 16 Categrica Nominal 0- Hgido


1- Cariado
2- Restaurado com crie
3- Restaurado sem crie
4- Extrado por crie
5- Extrado por outras razes
9- No examinado
Fonte: Exemplo retirado do banco de dados do Projeto SBBrasil 2003 (Brasil, 2004).

Outra vantagem do Excel que o formato XLS de anlise de dados e construo de tabelas e grficos,
seus arquivos passvel de leitura direta por boa parte no sero tratadas neste captulo.
dos programas estatsticos, como o SPSS, o S+ ou o
Statistica. Alm disso, pode exportar para outros 1. Definio das variveis
formatos, como o Dbase (DBF - Data Base File) um Em primeiro lugar, devem ser definidas as variveis
padro quase universal de bancos de dados. Ademais, que constituiro o banco de dados, com suas
em geral, seus arquivos no so muito grandes (a no respectivas codificaes, conforme indicado
ser quando se exagera nas formataes de cores e anteriormente. Essas variveis preenchero toda a
linhas), o que facilita a troca de informaes em meio primeira linha da planilha, sendo cada linha
virtual. O Excel tem uma capacidade razovel de subseqente reservada para o preenchimento das
armazenamento de dados, e serve bem a muitas informaes relativas a cada elemento da amostra.
finalidades das pesquisas epidemiolgicas. O limite de importante observar que, embora o programa
linhas em uma planilha de 65.536; o que significa que aceite nomes com tamanho ilimitado, recomenda-se
pesquisas com um nmero de unidades amostrais algumas precaues ao nomear as variveis. Entre
superior a este limite tero que recorrer a outros essas precaues, sugere-se no exceder oito caracteres,
programas. Sua capacidade de armazenamento para bem como evitar o uso de cedilha, acentos, traos (a
variveis bastante considervel, permitindo o uso de no ser o trao subscrito ou underline) e espaos. Isso
at 256 colunas. se justifica para facilitar o processo de exportao do
arquivo para outras plataformas, as quais solicitam
ETAPAS PARA A CONSTRUO DE BANCOS essas restries. O SPSS, por exemplo, apenas aceita os
NO EXCEL primeiros oitos caracteres registrados para os nomes de
Considera-se que o leitor possua conhecimentos variveis, e o Epi-Info aceita at 10 caracteres. Do
bsicos sobre o funcionamento de planilhas mesmo modo, ao se utilizar o Epi-Info em sua verso
eletrnicas(*), como as operaes comuns aos 6.04 em MS-DOS, somente caracteres padro sero
programas do pacote Microsoft Office, como aceitos. Alm disso, ao serem criadas variveis com
salvamento de arquivos, impresso, formatao, entre nomes de extenso reduzida, o banco fica menor e mais
outras. Consideraes mais complexas, relativas fcil de ser utilizado.

*
( ) Foi utilizada, para os exemplos deste captulo, a verso 2002 para () O MS-DOS (Microsoft Disk Operating System), foi um dos primeiros
Windows XP. Verses anteriores para Windows 98 ou da famlia Sistemas Operacionais a serem utilizados em computadores pessoais.
do Office 2000 podem apresentar ligeiras diferenas na Tinha uma interface ainda pouco amigvel e hoje est praticamente
apresentao visual e nas funes. em desuso com o advento do Sistema Windows.
FIG. 4.1. Exemplo de banco de dados no Excel.

O banco de dados apresentado como exemplo, a de validao para a entrada dos dados, o que agiliza
seguir, o produto de um formato de pesquisa muito o processo e evita erros de digitao.
comum em Epidemiologia em Sade Bucal, o Para criar estas regras, marca-se a coluna da
levantamento epidemiolgico. As variveis que varivel, clica-se em Dados e escolhe-se a opo
constam no arquivo advm da ficha bsica proposta Validao. Em seguida abre-se uma caixa de
pela OMS e adaptada recentemente para o Projeto dilogo como a ilustrada a seguir, que exemplifica a
SBBrasil 2003 (vide o captulo 3 da primeira parte). validao da varivel Tipo de Escola. Na primeira
Observe que, na planilha, foram includas as interface de dilogo que se abre (usualmente
variveis na primeira linha com o cuidado de criar denominada orelha) o item Configuraes
uma varivel IDENT (Identificao), onde os permite que se informe que cdigos podem ser
elementos amostrais so devidamente numerados. aceitos para aquela varivel. H diversas opes para
se realizar esta operao, como escolher uma lista,
2. Validando a entrada de dados estabelecer um intervalo numrico, entre outras. Para
Aps criar a estrutura do banco de dados e antes o caso em que se trabalha com listas de cdigos,
de comear a digitao, importante acrescentar deve-se colocar esta lista de cdigos em outro ponto
alguns aperfeioamentos disponibilizados pelas da planilha e informar, na caixa de dilogo, onde se
ferramentas do Excel. Em primeiro lugar, como em encontra essa informao.
qualquer banco de dados, podem ser criadas regras

FIG. 4.2 Caixa de dilogo das funes para validao da entrada de dados no Excel.
Criao de Bancos de Dados 402

FIG. 4.3 Aspecto da planilha aps a validao, quando a clula selecionada.

Na orelha Mensagem de entrada pode-se optar Um recurso para manter linhas e colunas sempre
pela visualizao de uma mensagem de ajuda visveis a criao e o congelamento de painis.
informando os cdigos vlidos, que aparece quando o Para esta finalidade, seleciona-se a clula que limita
cursor passa pela clula. Este recurso particularmente a linha e coluna (em geral a B2) e, no menu Janela,
til em bancos um pouco mais complexos e que sero escolhe-se a opo Congelar painis. Como resposta,
trabalhados por digitadores externos. o programa cria uma demarcao abaixo da primeira
Finalmente, a orelha Alerta de erro permite que se linha e direita da primeira coluna (veja Figura 4).
customize a mensagem que surgir quando da
tentativa de entrada de um dado que no seja vlido 4. Utilizao da ferramenta Formulrios
(veja nas Figura 4.2 e 4.3). Outra opo que facilita a digitao no Excel
oferecida pelo recurso de Formulrios. Clicando em
3. Criando painis e agilizando o processo de Dados e em seguida em Formulrios, aparece uma
digitao janela como ilustrada na Figura 5. Todas as clulas da
A seguir, a criao de painis outro importante primeira linha so identificadas como variveis e os
recurso de formatao da planilha, que facilita a dados podem ser digitados como num programa de
digitao. Como a primeira linha da planilha banco de dados. Dentre as desvantagens desta opo,
corresponde ao nome das variveis, interessante que est o fato de que ela s permite trabalhar com no
esta primeira linha esteja sempre visvel durante a mximo 25 variveis. Para bancos com maior nmero
navegao, o que geralmente no acontece quando se de variveis, os dados devero ser digitados
tem um banco de dados com mais de 30 elementos diretamente na planilha. Alm disso, ao se utilizar o
amostrais. O mesmo vale para a primeira coluna, a qual modo formulrio, perdem-se as informaes de
sempre destinada para os cdigos de identificao. validao.
Criao de Bancos de Dados 403

FIG. 4.4 Passos para a criao e congelamento de painis.

FIG. 5.5 Janela de entrada de dados da opo Formulrios.


Criao de Bancos de Dados 404
Utilizando o SPSS
O SPSS (Statistical Package for the Social Sciences) um dos principais produtos da SPSS Inc. uma empresa
de software sediada em Chicago e com atividades na rea de sistemas de informtica desde o fim da dcada de
1960 (SPSS, 2004). Trata-se de um programa bastante utilizado na rea acadmica para anlises estatsticas, ao lado
do SAS (Statistical Analysis System) e do Statistica.
O SPSS tem uma interface parecida com a do Excel, e permite a entrada de dados visualizando o banco de
dados como um todo. Contudo, por se tratar de um programa especfico para anlise de dados, possui inmeras
outras potencialidades. Dentre as facilidades para operaes com arquivos, suas verses mais recentes permitem
ler arquivos de praticamente todos os programas mais importantes, como o prprio Excel e outras planilhas
eletrnicas como Lotus, alm do formato Dbase (.dbf). Sua grande desvantagem o preo muito elevado, fator que,
na maioria dos casos, restringe sua aplicao para usurios corporativos.

Etapas para a construo de bancos no SPSS


Uma das vantagens de programas especficos de bancos de dados facilitar a definio de variveis. Neste
sentido, a primeira medida a se tomar definir as variveis. A tela de abertura do SPSS, quando se opta pela
abertura de um banco de dados novo, tem duas modalidades de exibio (ou views): a visualizao dos dados (Data
View) e das variveis (Variable View). O exemplo a seguir advm do mesmo banco ilustrado no item anterior
quando discutimos o Excel.
Pode-se observar que, no Variable View, cada varivel definida a partir dos seguintes parmetros (veja na
Figura 6):
Name: Nome da varivel. Conforme discutimos anteriormente, deve-se limitar a oito caracteres, sem utilizao de
cedilhas, acentos e espaos.
Type: Tipo de varivel. Existem diversos tipos disponveis, porm os mais utilizados so o formato String, para
variveis categricas, e o Numeric, para dados quantitativos, alm de diferentes opes para o registro de datas.
Trata-se de uma propriedade importantes, pois ir definir a forma como o programa interpretar o dado. Uma
varivel do tipo String, por exemplo no permite operaes matemticas nem a obteno de medidas de tendncia
central e de variabilidade; para sua anlise, s podero ser obtidas freqncias.
Width: Tamanho do campo. Deve ser informado com quantos caracteres formada cada categoria da varivel. Por
exemplo, se estamos trabalhando com renda e o mximo encontrado foi de 20 mil reais, ento o campo dever ter 5
algarismos. Embora colocar um tamanho maior que o necessrio no atrapalhe a anlise, importante se ater ao
nmero correto, pois isso ir economizar bytes, gerando um banco de dados menor e, conseqentemente, de mais
fcil manuseio.
Decimals: Nmero de casas decimais. Aplicvel somente para as variveis numricas, um complemento da
especificao anterior.
Label: Rtulo da varivel. Deve-se colocar o nome que descreve a varivel e que dever aparecer quando as
anlises forem solicitadas. Caso no seja informado, aparecer o nome da varivel.
Values: Valores atribudos aos dados. Aplica-se s variveis categricas, e muito importante na hora da gerao
dos relatrios. A Figura 7 mostra um exemplo de codificao para a varivel Tipo de Escola.
Missing: Informao no disponvel. Quando, por algum motivo, no se tem o dado disponvel, deve-se entrar
com um valor que indique a ausncia de informao. importante que seja informado, neste item, qual o valor que
referencia esta condio, para que o programa o exclua dos clculos.
Measure: Escala de medida. Trata-se de um complemento do tipo de varivel. H as opes Scale, quando os dados
advm de medidas quantitativas, Nominal, para dados categricos nominais e Ordinal, para variveis categricas
do tipo ordinal.
Uma vez finalizado o processo de definio das variveis, pode-se prosseguir com a entrada dos dados.
Criao de Bancos de Dados 405

Figura 6. Tela do Variable View do SPSS.

Figura 7. Caixa de dilogo para atribuio dos valores das categorias da varivel Tipo de Escola.

Algumas diferenas entre o SPSS e Excel


Uma diferena importante que existe na elaborao de bancos no Excel e no SPSS diz respeito s ocasies
em que se pretende avaliar a associao entre dados das variveis dependentes e independentes. Para o SPSS, as
categorias da varivel independente (grupos de estudo, por exemplo) devem ser identificadas como variveis
especficas; enquanto no Excel, cada cruzamento da varivel dependente com a independente deve ser codificado
como uma varivel especfica no banco.
Para ficar mais claro, vamos utilizar o seguinte exemplo: um pesquisador deseja verificar o efeito de
bochechos com diferentes substncias sobre o ndice de sangramento gengival em trs momentos distintos (antes
do uso, imediatamente aps e um ms depois do uso). Neste caso, temos, como varivel dependente, os valores do
ndice de sangramento gengival e, como independentes, o grupo (as trs diferentes substncias) e o tempo (antes,
logo aps e um ms depois). O banco de dados desta pesquisa construdo no Excel teria a estrutura mostrada na
Figura 8 a seguir.
Criao de Bancos de Dados 406

Figura 8. Modelo de entrada de dados para o Excel.

Pode-se observar que so criadas nove variveis oriundas de todos os cruzamentos da varivel dependente
com as duas independentes, gerando nove combinaes possveis (ROMA_LB = Rom na linha-base, CLOREX_LB
= Clorexidina na linha-base, PLAC_LB = Placebo na linha-base, ROMA_AP = Rom imediatamente aps e assim
por diante). Desse modo, as estatsticas descritivas podero ser obtidas colocando-se as frmulas abaixo do ltimo
valor (na linha 13). Do mesmo modo, as anlises estatsticas podem ser realizadas informando as colunas em que se
encontram os dados que se deseja testar.
Este mesmo banco teria que ser estruturado no SPSS de uma forma diferente, para considerar tempo e
grupo como variveis. Neste caso, ele ficaria com o formato ilustrado na Figura 9. Observe que, neste caso, apenas
trs variveis so criadas, a dependente (Sangramento Gengival, ou sang) e as independentes (tempo e grupo). Os
tempos foram codificados como 1 Linha-Base, 2 Imediatamente aps e 3 Um ms depois. Os grupos foram
codificados como 1 Rom, 2 Clorexidina e 3 Placebo. Esse procedimento necessrio pelo fato de a anlise no
SPSS exigir, como entrada, a especificao das variveis dependente e independente, de modo diferente do Excel.
Assim, importante decidir qual programa ser utilizado para a anlise, e projetar o banco de dados de
forma apropriada antes de comear a digitao.
Criao de Bancos de Dados 407

Figura 9. Modelo de entrada de dados para o SPSS.

Utilizando o Epi-Info
O Epi-Info foi criado ainda em meados dos anos 1980s pelo Centers for Disease Control and Prevention (CDC)
sediado em Atlanta, EUA. Foi desenvolvido por Andrew Dean e colaboradores com o objetivo de servir de suporte
para entrada e processamento de dados epidemiolgicos, para uso em Sade Pblica (Dean, 1994; Dean et al, 2004).
um programa de domnio pblico, ou seja, sua distribuio livre e gratuita, podendo ser copiado de stios da
Internet em vrias partes do mundo, sendo o principal deles o do prprio CDC (www.cdc.gov/epiinfo)
Desde suas verses iniciais, ainda em ambiente MS-DOS, o Epi-Info foi adquirindo popularidade crescente,
e hoje usado em mais de 180 pases. Segundo as ltimas informaes divulgadas no stio do CDC, at 2003, cerca
de 1 milho de downloads haviam sido realizados e h registros da traduo de seu manual para 13 lnguas
diferentes.
A partir do ano 2000, foi lanada uma verso para ambiente Windows, a qual no agradou muito no incio,
em funo de falhas ainda presentes. Uma verso aperfeioada foi lanada em 2002, a qual ficou conhecida como
Epi-Info 2002. A verso mais recente a 3.3, disponvel no CDC desde outubro de 2004.
A lgica da construo de bancos no Epi-Info semelhante de outros programas, como o SPSS, e tambm
est sujeita s recomendaes relativas estruturao e codificao das variveis. Contudo, um grande diferencial
a interface do Epi-Info para a entrada de dados. Ao contrrio dos programas em que o nome das variveis
informado na primeira linha e os dados so digitados diretamente na planilha, o Epi-Info permite que se construa
um formulrio com o mesmo aspecto da ficha utilizada para a coleta dos dados, o que facilita bastante o processo
de digitao (CDC, 2002).

Construindo bancos de dados no Epi-Info


O exemplo a seguir tomou como base o modelo de coleta de dados do Projeto SBBrasil, em que o
instrumento de coleta era composto por uma ficha de exame com os dados de sade bucal e um questionrio
socioeconmico e de acesso a servios (Brasil, 2004). O Epi-Info, em sua verso para ambiente Windows, trabalha
com o conceito de projetos; ou seja, possvel manter, em um nico arquivo, diversos modelos de questionrio,
denominados views. No nosso exemplo, o projeto deu origem ao nome do arquivo (SBBrasil_Exemplo) e o
primeiro view foi denominado FichaExame. Esta uma vantagem interessante, pois cada questionrio pode ser
gravado em uma tabela de dados distinta, porm todos so mantidos em um mesmo arquivo, o que pode ser til
quando se trabalha com pesquisas de carter multicntrico. Alm disso, possvel criar diversas pginas em um
mesmo questionrio, de modo a organizar melhor a entrada de dados.
A Figura 10 exemplifica o incio da construo do modelo de entrada de dados. Na tela de abertura do Epi-
Info, escolhe-se a opo Make view. Clicando em File New solicitado o nome do Projeto, que ser salvo como
nome do arquivo. Em seguida, em uma nova janela, deve-se entrar com o nome do questionrio (view). A partir
da, define-se cada campo de entrada, de acordo com a ficha da coleta de dados. Clicando com o boto direito do
Criao de Bancos de Dados 408
mouse, abre-se uma janela em que as definies de campo podem ser especificadas (veja Figura 10). Seus principais
elementos so os seguintes:
Question of prompt: Rtulo do campo. Aqui deve ser colocada a denominao do campo da forma como
desejamos que aparea no questionrio. possvel, por intermdio do boto, direita do campo (Font for Prompt)
formatar a fonte, com relao ao tamanho e tipo, de acordo com os tipos de fonte disponveis no computador.
Field or Variable: Caractersticas da varivel. De modo anlogo ao SPSS, define-se aqui as caractersticas da
varivel (numrica, texto, data etc.), incluindo seu padro de entrada (nmero de caracteres ou algarismos) e o tipo
de fonte.
Field name: Nome da varivel. Coloca-se o nome como se deseja que a varivel seja armazenada. Novamente,
recomenda-se a utilizao de caracteres-padro em nmero mximo de 10. este o nome que aparecer na tabela
de dados, quando da exportao do banco para outros formatos.
Code Tables: Para variveis codificadas em modo texto (Text), padro utilizado para as variveis categricas,
possvel definir os cdigos vlidos. Funciona do mesmo modo que a opo Values do SPSS e as opes de
validao do Excel.

Figura 10. Caixa de dilogo das definies dos campos de entrada no Epi-Info.

Para melhor organizar o questionrio, assemelhando-o ficha de coleta, possvel criar grupos de campos.
No caso do exemplo, a ficha original continha um cabealho, informaes gerais, e campos especficos dos ndices
utilizados. Neste caso, os campos podem ser agrupados de modo a separ-los, de acordo com estas categorias. Para
criar grupos, preciso, primeiro, marcar o conjunto de campos que se deseja agrupar. Em seguida clica-se em
Insert e depois em Group. Na caixa de dilogo que se abre, basta informar o nome do campo e definir algumas
caractersticas de formatao como a cor do campo. A Figura 11 ilustra a forma final da tela de entrada de dados da
primeira parte da ficha. Observa-se que possvel construir um questionrio muito semelhante ficha de coleta e
com um padro esttico agradvel.
Criao de Bancos de Dados 409

Figura 11. Tela de entrada de dados aps definio de campos e grupos.

Ainda com relao organizao do questionrio, importante informar ao programa a ordem de entrada
dos dados. De modo geral, medida em que so criados os campos, o Epi-Info estabelece a ordem de criao como
a ordem de entrada. Contudo, vezes, em funo da posio na grade, ou mesmo quando se utilizam recursos de
copiar e colar, a ordem de entrada pode variar. Nestes casos, antes de se efetuar a entrada de dados, importante
checar a ordem de entrada clicando em Edit e, em seguida em Order of Field Entry (Taborder). A caixa de dilogo
mostrar o conjunto de campos e a sua seqncia. Para mudar para a seqncia desejada, basta marcar o campo e
usar as opes Up e Down nos botes direita (Figura 12).

Figura 12. Caixa de dilogo da ordenao da entrada dos campos.

Finalmente, o mdulo de entrada de dados do Epi-Info tem uma ferramenta adicional para a criao de
pginas. Em alguns casos, um mesmo questionrio pode ter vrias partes ou uma pesquisa pode utilizar
questionrios diferentes, e pode ser desejvel o armazenamento de todos os dados em um nico banco. Na janela
esquerda do modo de edio de questionrio (vide Figura 10), esto disponveis as opes para o gerenciamento de
pginas. Clicando em Add page uma nova pgina ser criada e, a partir da procede-se da mesma forma. Tendo
concludo o delineamento do questionrio, procede-se entrada dos dados por intermdio do mdulo Enter. No
prprio modo de edio, escolhe-se a opo File e Enter data.

Para usurios do Epi-Info 6.04 para DOS


Usurios tradicionais do Epi-Info em sua verso para MS-DOS (a ltima foi a 6.04d, janeiro de 2001) podem
encontrar dificuldades de adaptao verso para Windows. Isso pode ser devido ao fato de as mudanas terem se
dado no apenas no aspecto da plataforma, mas tambm em sua concepo.
O Epi-Info para DOS trabalhava com a idia de questionrios individualizados especficos para cada tipo
de pesquisa e com um modelo de banco de dados esttico. Na verso Windows, a lgica da organizao passa pela
concepo de projetos e de bancos de dados dinmicos, podendo-se criar vrias tabelas de dados em um mesmo
arquivo. Contudo, seus mecanismos de entrada e processamento de dados ficaram infinitamente melhores e mais
seguros. A validao de entrada, em substituio criao e arquivos com extenso CHK da verso DOS resultou
mais fcil e rpida. desnecessrio sublinhar os ganhos em termos de uma interface mais amigvel e uma
qualidade esttica superior.
Criao de Bancos de Dados 410
Apesar de a nova verso permitir o gerenciamento de bancos de dados criados com as verses anteriores, o
novo padro de arquivo (extenso MDB), o qual semelhante ao produzido pelo Microsoft Access, pode
apresentar incompatibilidades com arquivos gravados em formato da verso para DOS (extenso REC). Do mesmo
modo, a importao de questionrios da verso antiga (extenso QES) trabalhosa, em especial quando os
questionrios foram elaborados de forma complexa.

Referncias Bibligrficas
Berqu ES, Souza JMP, Gotlieb SLD. Bioestatstica. 2. ed. So Paulo: EPU, 1981.
BRASIL. Ministrio da Sade. Projeto SBBrasil 2003. Braslia, 2004. Capturado na Internet: www.sbbrasil.cjb.net.
Dean AG et al. Epi Info. Database and statistics software for public health professionals. Atlanta, EUA: Center
for Disease Control and Prevention. verso 3.2.2, 2004.
Dean AG. Microcomputers and the future of epidemiology. Public Health Reports 1994;109(3):439-41.
Center for Disease Control and Prevention. Epidemiology Program Office. Epi Info users' manual. Atlanta: CDC,
2002.
SPSS. Statistical Package for the Social Sciences. Chicago, 2004. Capturado na Intenet: www.spss.com.

Das könnte Ihnen auch gefallen