Beruflich Dokumente
Kultur Dokumente
Outra vantagem do Excel que o formato XLS de anlise de dados e construo de tabelas e grficos,
seus arquivos passvel de leitura direta por boa parte no sero tratadas neste captulo.
dos programas estatsticos, como o SPSS, o S+ ou o
Statistica. Alm disso, pode exportar para outros 1. Definio das variveis
formatos, como o Dbase (DBF - Data Base File) um Em primeiro lugar, devem ser definidas as variveis
padro quase universal de bancos de dados. Ademais, que constituiro o banco de dados, com suas
em geral, seus arquivos no so muito grandes (a no respectivas codificaes, conforme indicado
ser quando se exagera nas formataes de cores e anteriormente. Essas variveis preenchero toda a
linhas), o que facilita a troca de informaes em meio primeira linha da planilha, sendo cada linha
virtual. O Excel tem uma capacidade razovel de subseqente reservada para o preenchimento das
armazenamento de dados, e serve bem a muitas informaes relativas a cada elemento da amostra.
finalidades das pesquisas epidemiolgicas. O limite de importante observar que, embora o programa
linhas em uma planilha de 65.536; o que significa que aceite nomes com tamanho ilimitado, recomenda-se
pesquisas com um nmero de unidades amostrais algumas precaues ao nomear as variveis. Entre
superior a este limite tero que recorrer a outros essas precaues, sugere-se no exceder oito caracteres,
programas. Sua capacidade de armazenamento para bem como evitar o uso de cedilha, acentos, traos (a
variveis bastante considervel, permitindo o uso de no ser o trao subscrito ou underline) e espaos. Isso
at 256 colunas. se justifica para facilitar o processo de exportao do
arquivo para outras plataformas, as quais solicitam
ETAPAS PARA A CONSTRUO DE BANCOS essas restries. O SPSS, por exemplo, apenas aceita os
NO EXCEL primeiros oitos caracteres registrados para os nomes de
Considera-se que o leitor possua conhecimentos variveis, e o Epi-Info aceita at 10 caracteres. Do
bsicos sobre o funcionamento de planilhas mesmo modo, ao se utilizar o Epi-Info em sua verso
eletrnicas(*), como as operaes comuns aos 6.04 em MS-DOS, somente caracteres padro sero
programas do pacote Microsoft Office, como aceitos. Alm disso, ao serem criadas variveis com
salvamento de arquivos, impresso, formatao, entre nomes de extenso reduzida, o banco fica menor e mais
outras. Consideraes mais complexas, relativas fcil de ser utilizado.
*
( ) Foi utilizada, para os exemplos deste captulo, a verso 2002 para () O MS-DOS (Microsoft Disk Operating System), foi um dos primeiros
Windows XP. Verses anteriores para Windows 98 ou da famlia Sistemas Operacionais a serem utilizados em computadores pessoais.
do Office 2000 podem apresentar ligeiras diferenas na Tinha uma interface ainda pouco amigvel e hoje est praticamente
apresentao visual e nas funes. em desuso com o advento do Sistema Windows.
FIG. 4.1. Exemplo de banco de dados no Excel.
O banco de dados apresentado como exemplo, a de validao para a entrada dos dados, o que agiliza
seguir, o produto de um formato de pesquisa muito o processo e evita erros de digitao.
comum em Epidemiologia em Sade Bucal, o Para criar estas regras, marca-se a coluna da
levantamento epidemiolgico. As variveis que varivel, clica-se em Dados e escolhe-se a opo
constam no arquivo advm da ficha bsica proposta Validao. Em seguida abre-se uma caixa de
pela OMS e adaptada recentemente para o Projeto dilogo como a ilustrada a seguir, que exemplifica a
SBBrasil 2003 (vide o captulo 3 da primeira parte). validao da varivel Tipo de Escola. Na primeira
Observe que, na planilha, foram includas as interface de dilogo que se abre (usualmente
variveis na primeira linha com o cuidado de criar denominada orelha) o item Configuraes
uma varivel IDENT (Identificao), onde os permite que se informe que cdigos podem ser
elementos amostrais so devidamente numerados. aceitos para aquela varivel. H diversas opes para
se realizar esta operao, como escolher uma lista,
2. Validando a entrada de dados estabelecer um intervalo numrico, entre outras. Para
Aps criar a estrutura do banco de dados e antes o caso em que se trabalha com listas de cdigos,
de comear a digitao, importante acrescentar deve-se colocar esta lista de cdigos em outro ponto
alguns aperfeioamentos disponibilizados pelas da planilha e informar, na caixa de dilogo, onde se
ferramentas do Excel. Em primeiro lugar, como em encontra essa informao.
qualquer banco de dados, podem ser criadas regras
FIG. 4.2 Caixa de dilogo das funes para validao da entrada de dados no Excel.
Criao de Bancos de Dados 402
Na orelha Mensagem de entrada pode-se optar Um recurso para manter linhas e colunas sempre
pela visualizao de uma mensagem de ajuda visveis a criao e o congelamento de painis.
informando os cdigos vlidos, que aparece quando o Para esta finalidade, seleciona-se a clula que limita
cursor passa pela clula. Este recurso particularmente a linha e coluna (em geral a B2) e, no menu Janela,
til em bancos um pouco mais complexos e que sero escolhe-se a opo Congelar painis. Como resposta,
trabalhados por digitadores externos. o programa cria uma demarcao abaixo da primeira
Finalmente, a orelha Alerta de erro permite que se linha e direita da primeira coluna (veja Figura 4).
customize a mensagem que surgir quando da
tentativa de entrada de um dado que no seja vlido 4. Utilizao da ferramenta Formulrios
(veja nas Figura 4.2 e 4.3). Outra opo que facilita a digitao no Excel
oferecida pelo recurso de Formulrios. Clicando em
3. Criando painis e agilizando o processo de Dados e em seguida em Formulrios, aparece uma
digitao janela como ilustrada na Figura 5. Todas as clulas da
A seguir, a criao de painis outro importante primeira linha so identificadas como variveis e os
recurso de formatao da planilha, que facilita a dados podem ser digitados como num programa de
digitao. Como a primeira linha da planilha banco de dados. Dentre as desvantagens desta opo,
corresponde ao nome das variveis, interessante que est o fato de que ela s permite trabalhar com no
esta primeira linha esteja sempre visvel durante a mximo 25 variveis. Para bancos com maior nmero
navegao, o que geralmente no acontece quando se de variveis, os dados devero ser digitados
tem um banco de dados com mais de 30 elementos diretamente na planilha. Alm disso, ao se utilizar o
amostrais. O mesmo vale para a primeira coluna, a qual modo formulrio, perdem-se as informaes de
sempre destinada para os cdigos de identificao. validao.
Criao de Bancos de Dados 403
Figura 7. Caixa de dilogo para atribuio dos valores das categorias da varivel Tipo de Escola.
Pode-se observar que so criadas nove variveis oriundas de todos os cruzamentos da varivel dependente
com as duas independentes, gerando nove combinaes possveis (ROMA_LB = Rom na linha-base, CLOREX_LB
= Clorexidina na linha-base, PLAC_LB = Placebo na linha-base, ROMA_AP = Rom imediatamente aps e assim
por diante). Desse modo, as estatsticas descritivas podero ser obtidas colocando-se as frmulas abaixo do ltimo
valor (na linha 13). Do mesmo modo, as anlises estatsticas podem ser realizadas informando as colunas em que se
encontram os dados que se deseja testar.
Este mesmo banco teria que ser estruturado no SPSS de uma forma diferente, para considerar tempo e
grupo como variveis. Neste caso, ele ficaria com o formato ilustrado na Figura 9. Observe que, neste caso, apenas
trs variveis so criadas, a dependente (Sangramento Gengival, ou sang) e as independentes (tempo e grupo). Os
tempos foram codificados como 1 Linha-Base, 2 Imediatamente aps e 3 Um ms depois. Os grupos foram
codificados como 1 Rom, 2 Clorexidina e 3 Placebo. Esse procedimento necessrio pelo fato de a anlise no
SPSS exigir, como entrada, a especificao das variveis dependente e independente, de modo diferente do Excel.
Assim, importante decidir qual programa ser utilizado para a anlise, e projetar o banco de dados de
forma apropriada antes de comear a digitao.
Criao de Bancos de Dados 407
Utilizando o Epi-Info
O Epi-Info foi criado ainda em meados dos anos 1980s pelo Centers for Disease Control and Prevention (CDC)
sediado em Atlanta, EUA. Foi desenvolvido por Andrew Dean e colaboradores com o objetivo de servir de suporte
para entrada e processamento de dados epidemiolgicos, para uso em Sade Pblica (Dean, 1994; Dean et al, 2004).
um programa de domnio pblico, ou seja, sua distribuio livre e gratuita, podendo ser copiado de stios da
Internet em vrias partes do mundo, sendo o principal deles o do prprio CDC (www.cdc.gov/epiinfo)
Desde suas verses iniciais, ainda em ambiente MS-DOS, o Epi-Info foi adquirindo popularidade crescente,
e hoje usado em mais de 180 pases. Segundo as ltimas informaes divulgadas no stio do CDC, at 2003, cerca
de 1 milho de downloads haviam sido realizados e h registros da traduo de seu manual para 13 lnguas
diferentes.
A partir do ano 2000, foi lanada uma verso para ambiente Windows, a qual no agradou muito no incio,
em funo de falhas ainda presentes. Uma verso aperfeioada foi lanada em 2002, a qual ficou conhecida como
Epi-Info 2002. A verso mais recente a 3.3, disponvel no CDC desde outubro de 2004.
A lgica da construo de bancos no Epi-Info semelhante de outros programas, como o SPSS, e tambm
est sujeita s recomendaes relativas estruturao e codificao das variveis. Contudo, um grande diferencial
a interface do Epi-Info para a entrada de dados. Ao contrrio dos programas em que o nome das variveis
informado na primeira linha e os dados so digitados diretamente na planilha, o Epi-Info permite que se construa
um formulrio com o mesmo aspecto da ficha utilizada para a coleta dos dados, o que facilita bastante o processo
de digitao (CDC, 2002).
Figura 10. Caixa de dilogo das definies dos campos de entrada no Epi-Info.
Para melhor organizar o questionrio, assemelhando-o ficha de coleta, possvel criar grupos de campos.
No caso do exemplo, a ficha original continha um cabealho, informaes gerais, e campos especficos dos ndices
utilizados. Neste caso, os campos podem ser agrupados de modo a separ-los, de acordo com estas categorias. Para
criar grupos, preciso, primeiro, marcar o conjunto de campos que se deseja agrupar. Em seguida clica-se em
Insert e depois em Group. Na caixa de dilogo que se abre, basta informar o nome do campo e definir algumas
caractersticas de formatao como a cor do campo. A Figura 11 ilustra a forma final da tela de entrada de dados da
primeira parte da ficha. Observa-se que possvel construir um questionrio muito semelhante ficha de coleta e
com um padro esttico agradvel.
Criao de Bancos de Dados 409
Ainda com relao organizao do questionrio, importante informar ao programa a ordem de entrada
dos dados. De modo geral, medida em que so criados os campos, o Epi-Info estabelece a ordem de criao como
a ordem de entrada. Contudo, vezes, em funo da posio na grade, ou mesmo quando se utilizam recursos de
copiar e colar, a ordem de entrada pode variar. Nestes casos, antes de se efetuar a entrada de dados, importante
checar a ordem de entrada clicando em Edit e, em seguida em Order of Field Entry (Taborder). A caixa de dilogo
mostrar o conjunto de campos e a sua seqncia. Para mudar para a seqncia desejada, basta marcar o campo e
usar as opes Up e Down nos botes direita (Figura 12).
Finalmente, o mdulo de entrada de dados do Epi-Info tem uma ferramenta adicional para a criao de
pginas. Em alguns casos, um mesmo questionrio pode ter vrias partes ou uma pesquisa pode utilizar
questionrios diferentes, e pode ser desejvel o armazenamento de todos os dados em um nico banco. Na janela
esquerda do modo de edio de questionrio (vide Figura 10), esto disponveis as opes para o gerenciamento de
pginas. Clicando em Add page uma nova pgina ser criada e, a partir da procede-se da mesma forma. Tendo
concludo o delineamento do questionrio, procede-se entrada dos dados por intermdio do mdulo Enter. No
prprio modo de edio, escolhe-se a opo File e Enter data.
Referncias Bibligrficas
Berqu ES, Souza JMP, Gotlieb SLD. Bioestatstica. 2. ed. So Paulo: EPU, 1981.
BRASIL. Ministrio da Sade. Projeto SBBrasil 2003. Braslia, 2004. Capturado na Internet: www.sbbrasil.cjb.net.
Dean AG et al. Epi Info. Database and statistics software for public health professionals. Atlanta, EUA: Center
for Disease Control and Prevention. verso 3.2.2, 2004.
Dean AG. Microcomputers and the future of epidemiology. Public Health Reports 1994;109(3):439-41.
Center for Disease Control and Prevention. Epidemiology Program Office. Epi Info users' manual. Atlanta: CDC,
2002.
SPSS. Statistical Package for the Social Sciences. Chicago, 2004. Capturado na Intenet: www.spss.com.