Sie sind auf Seite 1von 56

COMO

DIGITALIZAR
DOCUMENTOS
DE ARQUIVO

ALEX RICARDO BRASIL

Associação de Arquivistas de São Paulo


04 e 05 de setembro de 2008
2
APRESENTAÇÃO

A digitalização de documentos tem sido, num ritmo crescente, praticada,


no Brasil e no mundo, por instituições que investem nesse tipo de tecnologia
devido às inúmeras e inegáveis vantagens de se manter um banco de dados
com versões digitais dos documentos acumulados em papel.
De fato, a verdadeira revolução que a informática trouxe consigo,
particularmente nas duas últimas décadas, aproximou, por assim dizer, o
mundo, como que diminuindo o seu tamanho em virtude da facilidade que a
tecnologia tem proporcionado para uma maior circulação e dinamização da
informação produzida pelas instituições e pessoas. Arquivos, museus,
bibliotecas, centros de documentação e memória têm agora – a um custo não
proibitivo – uma ferramenta extraordinariamente poderosa para superar as
barreiras do tempo e da distância para o acesso ao documento anteriormente
armazenado em papel, proporcionando visualizações remotas, rápidas e
simultâneas para múltiplos consulentes, seja para fins administrativos,
agilizando a tomada de decisões do órgão, seja para assegurar uma ampla
socialização de acervos documentais de interesse público, possibilitando um
maior alcance social da sua missão institucional.
Mas lembrando o sentido de uma anedota popular segundo a qual a
Informática surgiu para resolver problemas que ela mesma criou, a sedução
fácil pelo que a digitalização proporciona resulta no desenvolvimento de
aplicações não raras vezes mal pensadas em decorrência exatamente desse
encantamento com os seus usos e possibilidades, acabando por trazer, a
médio e longo prazos, conseqüências graves de manutenção, preservação e
acesso às imagens digitalizadas, por conta da fragilidade do documento digital,
causando prejuízos irreparáveis à própria instituição, ou, em se tratando de
documentos de interesse público, até mesmo à sociedade.
Veremos que, em grande parte, os problemas que a digitalização
apresenta podem ser encaminhados à própria Informática a fim de que nos
ajude a solucioná-los, mas seguramente a Arquivologia representa, hoje, uma
forte aliada na busca dessas soluções.
O objetivo deste curso é, além de abordar as rotinas básicas que
envolvem os procedimentos de captura e gravação de imagens, tornar possível
a compreensão da digitalização como parte de um processo bem mais amplo,
que se inicia com a própria concepção do documento em seu suporte original –
3
no caso, o papel, e termina com o seu derradeiro destino, definido com base no
seu potencial informativo.
Em foco estará o documento de arquivo que, como se verá, é dotado de
um estatuto próprio que o torna singular para aqueles que o gerenciam e dele
se utilizam, e que por isso mesmo exige cuidados especiais para que a sua
confiabilidade possa ser assegurada pelo tempo necessário para ser utilizado
como elemento de prova e informação.

Alex Ricardo Brasil


São Paulo, 2008

4
DIGITALIZAÇÃO: CONCEITO

Basicamente a digitalização pode ser compreendida como a conversão


de documentos não-digitais para o meio digital, ou seja, para um ambiente em
que as informações são codificadas em dígitos binários com o propósito de
serem processadas por computador.
Exemplos de documentos não-digitais são:

- a informação visual de natureza textual ou iconográfica registrada em


papel ou outro suporte, e cujo acesso se dá diretamente às pessoas
sem mediação de máquina.
Ex.: fotografias, livros, plantas de engenharia, partituras musicais.

- as informações auditivas, visuais ou audiovisuais registradas por


processos analógicos, sejam eles químicos, mecânicos ou eletrônicos,
e cujo acesso se dá às pessoas com mediação de máquina.
Ex.: fitas K7, filmes em VHS, discos de vinil, microfilmes, películas
cinematográficas.

A digitalização é conseguida por meio de um dispositivo de captura


(câmera digital, scanner, placa de som ou placa de vídeo, conforme cada
situação) e na maioria dos casos depende de um computador que, por sua vez,
processa com um software específico as informações capturadas, produzindo
um arquivo digital que, como tal, é constituído exclusivamente por um código
binário, ou seja, uma seqüência de “uns” e “zeros”, que são, na verdade, as
duas únicas instruções que o computador compreende.
Os exemplos a seguir mostram que não é possível fazer a distinção
visual entre uma cadeia de bits de um arquivo que contém uma música e um
arquivo que contém uma imagem, pois a decodificação depende
exclusivamente de um software (programa) de leitura capaz de estabelecer a
equivalência entre os códigos binários e a sua representação, seguindo os
mesmos critérios utilizados pelo software que produziu o arquivo. Dito de outro
modo, a natureza do documento digital faz com que uma mesma seqüência
binária possa representar tanto um texto digitado quanto um desenho
digitalizado, uma música ou um filme. A chave, por assim dizer, para
decodificar os dados e interpretá-los, tornando-os inteligíveis para nós como
5
imagem, texto ou som é o software de leitura, que fará o caminho em sentido
inverso ao percorrido pelo software que codificou a informação.

Primeiras linhas da seqüência binária do arquivo Versão em código binário da frase “como
de som de entrada do Windows XP, em formato digitalizar documentos de arquivo”, escrito no
“wav”. bloco de notas do Windows.

Imagem vetorial e imagem rasterizada

Como o foco deste curso é a digitalização de documentos textuais, para


que você possa compreender as duas formas diferentes de se produzir uma
imagem digital, observe atentamente as duas imagens abaixo, imaginando que
elas estão sendo exibidas num monitor de computador.

A primeira figura acima foi gerada a partir de um editor de texto, como o


Word, e a segunda foi gerada por meio de um scanner que digitalizou um
documento impresso em papel, transformando-o em imagem digital.
Note que, não importando o quanto a imagem da primeira figura é
ampliada no computador, como demonstra a ampliação do pingo do “i”, os

6
limites e os detalhes serão sempre muito bem definidos geometricamente. A
segunda imagem, contudo, sempre irá perdendo definição e os limites ficarão
cada vez mais tênues à medida que for aumentada para visualização de
detalhes.
No segundo caso, também, é possível perceber que a imagem é
composta por pequenos quadrados, sendo que seu tamanho e sua quantidade
podem variar conforme a qualidade da imagem.
Uma imagem digital vetorial como a da primeira figura é obtida a partir
de elementos geométricos como pontos, retas, curvas, elipses e polígonos, os
quais se mostrarão sempre perfeitos independentemente do grau de ampliação
da imagem. A imagem digital do tipo raster, ou rasterizada, por sua vez, como
no segundo caso, é constituída por vários pontos, chamados de pixels, que, na
verdade, não passam de quadradinhos de diferentes cores, porém de tamanho
fixo – conforme a qualidade desejada, previamente definida –, e que
preenchem todo o espaço ocupado pela imagem.
Exemplos de documentos digitais vetorialmente construídos são: textos
digitados em editores de texto, planilhas e bancos de dados; desenhos
animados feitos com a tecnologia flash; plantas desenhadas pelo Autocad e
textos e desenhos feitos com o software Corel Draw.
Exemplos de imagens do tipo raster são: fotografias digitais, imagens
digitalizadas e desenhos feitos com o aplicativo Paint do Windows.
Esses dois tipos de imagens apresentam diferenças substanciais quanto
à nitidez, tamanho do arquivo e possibilidades de uso, mas é importante que se
diga que uma imagem digitalizada será sempre do tipo raster. Isso significa
que um texto digitalizado será sempre, para o computador, uma imagem de um
texto, e não um texto propriamente dito, e é exatamente por isso que não é
possível realizar buscas de caracteres em uma imagem digitalizada, como
fazemos em um texto produzido no Word, por exemplo. Ou seja, o computador,
diferentemente do modo com que produz e interpreta imagens vetoriais, não
identifica letras e números numa imagem rasterizada de um texto, mas apenas
pixels que representam a imagem do documento, originalmente em papel.
Contudo, notaremos mais adiante que é possível obter, por meio de programas
especiais, mas sempre com alguma margem de erro, textos vetoriais de
imagens rasterizadas, tornando pesquisável o conteúdo textual da imagem de
um documento digitalizado.

7
UM BREVE HISTÓRICO

As condições para se iniciar experimentos com a rasterização de


imagens já existiam desde meados dos anos de 1950, quando surgiram os
primeiros computadores cujos processadores eram à base de transistores,
menores, mais baratos, mais rápidos e bem menos susceptíveis de falhas em
relação à válvula, componente utilizado anteriormente.
Esse conjunto de qualidades do novo componente eletrônico possibilitou
uma maior disseminação dos computadores comerciais, permitindo que
empresas privadas e instituições de pesquisa pudessem adquirir máquinas
processadoras que até então eram de uso exclusivamente governamental.
O primeiro computador inteiramente transistorizado (sua CPU era dotada
de 800 componentes) data de 1955, e foi desenvolvido pela Bell Laboratories.
Chamava-se TRADIC, e a ele sucederam-se inúmeros outros modelos
adquiridos por universidades, companhias de seguro, bancos e institutos de
pesquisa.

Dentre as pesquisas no campo


da rasterização que ocorreram nesse
contexto de busca de ampliação das
possibilidades comerciais do
computador, destacaram-se as
desenvolvidas simultaneamente por
Rudolf Hell, na Alemanha, e H. Philip
Peterson, nos Estados Unidos.
Hell inventou, em 1963, o
“Chromagraph”, um sistema no qual a
Tradic, primeiro computador transistorizado,
imagem era anexada a um tambor recebendo manutenção.

rotativo, para ser então digitalizada. Seu

invento ficou conhecido como “scanner de tambor”, sendo uma tecnologia


utilizada até hoje em editoração, por possibilitar uma rasterização de altíssima
qualidade, da ordem de 12.000 dpi (pontos por polegada).

8
Era da Hell a fabricação dos
primeiros scanners que chegaram no
Brasil no início da década de 1980. Eram
os CP-340 “Jumbo”, utilizados para
confecção de fotolitos.
Chromagraph, modelo de 1965

Rudolf Hell faleceu em 2002, e sua empresa já havia sido adquirida pela
Siemens em 1981.
H. Philip Peterson, da Control Data Corporation, empresa fabricante do
computador CDC-3200, começou suas experiências com a digitalização de
cromos e negativos no final da década de 1950. Criou o TX2 Eye, ou
Charactron, um scanner de transparências, e das suas experiências com
digitalização sobreviveram ao tempo algumas versões impressas da sua “Mona
Lisa digital”, de 1964, obtidas com grande qualidade a partir de um negativo
35mm contendo a foto do famoso quadro de Da Vinci. Após 14 horas de
digitalização, o invento de Peterson produziu uma imagem de 1,50m X 1,20m
contendo 100.000 pixels e impressa em uma impressora de impacto de
caracteres prontos (não-matricial), comum à época.
O invento de Peterson não teve nenhum futuro comercial à época,
diferentemente de seu contemporâneo alemão. Porém, as versões impressas
de sua “Mona Lisa Digital”, hoje expostas no Museu do Computador em
Boston, são reconhecidas hoje como um dos primeiros exemplos da chamada
“Arte Ascii” (pronuncia-se “áski”), que utiliza caracteres para compor imagens.

Detalhe da “Mona Lisa Digital”, de Peterson (1964), impressa com caracteres.

9
O advento dos circuitos integrados, ou chips (que nasceram
condensando dezenas de transistores de forma interligada, aumentando
extraordinariamente a velocidade de processamento de dados), aliou-se, de um
lado, ao surgimento dos discos flexíveis de 8 polegadas (tornando-o um meio
de armazenagem de dados bem mais econômico e de maior portabilidade em
relação ao rolo de fita magnética dos computadores de grande porte), e, de
outro lado, ao desenvolvimento de softwares específicos para os computadores
de pequeno porte, trazendo, a partir dos anos 70, a possibilidade de sua
produção em série. Máquinas como o Altair 8800, lançado em 1974, e o Apple
II, de 1977, foram transformadas em sucessos absolutos de vendas, tornando
possível, e de forma progressiva a partir de então, a aquisição de
computadores – ou microcomputadores (como começavam a ser chamados) –,
até mesmo por pequenas empresas ou usuários domésticos de classe média.

O final da década de 1970 vê surgir,


também, a viabilidade de uso comercial de
semicondutores sensíveis à luz, como o CCD
(Charge-Coupled Device) ou o CMOS
(Complementary Metal–Oxide–Semiconductor),
que até hoje são a base dos dispositivos de
captura de imagens (scanners e câmeras
fotográficas digitais).
Assim, se nos anos 1970 os enormes
Altair8800 “scanners de tambor” da Hell se popularizavam em

gráficas e editoras, o início da década seguinte vê o surgimento dos primeiros


aparelhos digitalizadores de pequeno porte para microcomputadores. Eram
scanners manuais, semelhantes aos leitores de códigos de barra de hoje. Para
capturar a imagem – em tons de cinza, claro – era necessário percorrê-la com
o pequeno aparelho manualmente em velocidade constante. Obviamente a
precisão não era o forte do sistema.
Mas não demorou para os scanners de
mesa rapidamente adquirirem popularidade nos
anos 80, impulsionados também pelo
desenvolvimento de tecnologias de compressão de
imagem, como o JPEG (Joint Photograph Experts Scanner de mão

10
Groups), criado em 1983 para fotografias, e o TIFF (Tagged Image File
Format), nascido em 1986 para aplicações voltadas a trabalhos gráficos que
não admitissem perdas de qualidade na compactação. E, como fortes aliados,
surgem os meios de armazenagem de dados de pequenas dimensões e de alta
capacidade para a época, como as fitas DLT (1984) e o CD-R (1988). Estavam
plenamente abertas as possibilidades de uso nas mais diversas áreas
institucionais, e dentre as quais o campo da gestão documental, que é o que
mais nos interessa.
A ampliação em ritmo acelerado das redes corporativas e da rede
mundial de computadores a partir dos anos de 1990 surgiu como
potencializadora das aplicações de digitalização, provocando, por conseguinte,
necessidades crescentes de compartilhamento de documentos. Por conta
disso, fabricantes como Microtek e Fujitsu passaram a oferecer, então,
scanners com alimentação automática e cada vez mais velozes, para darem
conta de demandas elevadas que surgiam para a digitalização de acervos
documentais de arquivos públicos e privados de grandes corporações.
Nos Estados Unidos apareceu, então, o conceito de Document Imaging
para caracterizar a tecnologia voltada à digitalização de documentos e ao
gerenciamento de um banco de imagens institucional. A expressão, embora
inadequada – pois a imagem do documento é apenas o produto de um
processo composto por um conjunto de procedimentos, dos quais a
digitalização é só um deles, como veremos – passou a representar uma
solução para o acúmulo ininterruptamente mais crescente de papéis nas
organizações, contrariando os futuristas dos anos 80 que acreditavam que o
documento eletrônico traria como uma de suas conseqüências um mundo
corporativo sem papel.
A década de 1990, por conta da força que o apelo da digitalização
possuía, testemunhou a ameaça da descontinuidade de programas de
microfilmagem em arquivos e outras instituições de custódia no mundo todo,
um equívoco devido essencialmente à incompreensão das 2 tecnologias, que
hoje sabemos que não são concorrentes, e muito menos excludentes entre si,
mas complementares no binômio preservação/ acesso.
Mas nos últimos anos a microfilmagem ganhou nova força, impulsionada
pelas soluções híbridas de microfilmagem eletrônica oferecidas inicialmente
pela Kodak, e que permitem, por meio de um único equipamento, digitalizar e
microfilmar a mesma imagem simultaneamente.

11
6 RAZÕES PARA DIGITALIZAR DOCUMENTOS

Independentemente do porte da instituição, seja ela uma pequena


empresa ou uma grande corporação, a digitalização deve ser vista como uma
tecnologia que pode proporcionar, se bem implementada, inegáveis avanços
no tratamento da informação registrada em papel.
As razões apresentadas a seguir podem servir como elementos de
auxílio para estratégias de convencimento junto às instâncias administrativas
que têm poder decisório para adoção de tecnologias no campo da gestão
documental.

- Maior velocidade de acesso ao documento.

Ainda que a instituição que opte por digitalizar seus documentos não
disponha de uma rede corporativa que possibilite o compartilhamento de
informações por essa via, manter versões digitalizadas de documentos em
papel proporcionará seguramente um acesso bem mais rápido às imagens a
serem consultadas do que recorrer à localização do papel em pastas ou caixas.
Imaginemos uma situação em que não sabemos exatamente qual
documento atenderá à nossa necessidade por uma informação específica, pois
não temos muita informação sobre ele, ou mesmo uma outra situação em que
sabemos exatamente que documento pretendemos consultar, porém não
temos dados satisfatórios sobre ele para uma localização precisa. Isso
implicará, evidentemente, o levantamento de todos os prováveis papéis que,
conforme o nível de detalhamento das informações que tivermos sobre o objeto
que se pretende localizar, pode até resultar numa quantidade de documentos
que inviabilize uma localização num espaço de tempo que esteja nos limites da
razoabilidade
O tempo gasto para “cercar” a pesquisa, localizar as pastas ou caixas e
retirar os documentos será, com certeza, bem superior ao tempo gasto quando
a pesquisa é feita por meio de um sistema de banco de dados que retorne,
quase que instantaneamente no monitor, as imagens dos possíveis
documentos.

12
- Possibilidade de acesso remoto ao documento.

A existência de redes corporativas ou mesmo de uma simples conexão


com a Internet torna possível algo impensado algumas décadas atrás: atender
remotamente num curto espaço de tempo – e independentemente da distância,
no caso do acesso à rede mundial de computadores – uma solicitação de
consulta a um determinado documento, por meio da visualização direta pela
Intranet, Internet ou por remessa do documento via correio eletrônico. Ou, mais
ainda, tornar disponível ao próprio usuário, em uma página na Internet ou
Intranet, um banco de imagens intermediado por um sistema de consulta
que possibilite ao próprio consulente localizar rapidamente o documento
desejado.

- Possibilidade de acessos simultâneos ao mesmo documento

Algo impossível para o documento em papel, a digitalização tornou


possível o compartilhamento da imagem do mesmo documento a inúmeros
pesquisadores simultaneamente, qualquer que seja o local onde estiverem,
bastando o acesso ao ambiente virtual interno da instituição, em se tratando de
consulentes internos, ou acesso a uma conexão com a Internet, em se tratando
de usuários externos.

- Possibilidade de replicação de séries documentais completas para


intercâmbio entre instituições

Pelas facilidades com que o documento digital pode ser replicado, um


horizonte extraordinário se abre com isso para intercâmbio entre unidades da
mesma instituição, arquivos, museus e centros de memória: séries
documentais completas podem ser copiadas sem que haja perda de qualidade
da imagem, diferentemente do microfilme, cujas cópias são obtidas com perda
de qualidade, por se tratar de um meio de armazenagem analógico.

Dá-se essa situação para os casos em que, por diversas razões pode
não interessar a disponibilização, via Intranet ou Internet, de determinadas
imagens, seja por estarem protegidas por direito autoral, seja devido à alta
13
resolução que dificulta a sua publicação ou ainda, por se tratarem de
documentos administrativos, que interessem apenas a grupos específicos
dentro da própria instituição.

- Preservação de documentos originais

É sabido, pela própria prática e por razões óbvias, que o manuseio


contínuo de documentos originais provoca a sua deterioração, por razões que
podem ser: ação cumulativa ao longo do tempo, sobre o papel, dos raios
ultravioleta presentes nas lâmpadas fluorescentes; acidificação do papel em
decorrência do contato com o suor ou com a gordura presente na pele da mão
do manuseador; enfraquecimento e deformação natural do papel por conta do
manuseio; ou negligência pura do consulente para com o documento, não
empregando os mínimos cuidados para resguardá-lo.
Assim, de modo semelhante ao microfilme, a captura da imagem do
documento em papel pode ter como objetivo preservar o original da ação
destruidora natural provocada pelo manuseio.

- Economia de espaço físico

Eis uma questão polêmica em se tratando da digitalização, pois


pressupõe que seja possível o descarte de documentos após digitalizados, algo
absolutamente reprovável por aqueles que acreditam que não há amparo legal
para isso.
Contudo, no momento certo tentarei demonstrar que, para alguns casos
bem específicos – como para os documentos públicos de guarda temporária –
o descarte não apenas é possível como a imagem digitalizada pode ter valor
probatório suficiente para todos os efeitos legais, ainda que, no Brasil, não haja
uma norma superior que legitime tal prática.
O fato é que, inegavelmente, a digitalização é uma ferramenta
tecnológica poderosíssima para a racionalização do acúmulo de papéis e
otimização do uso do espaço físico para armazenagem de documentos. Trata-
se apenas, na verdade, de assegurar um elevado grau de confiabilidade no
processo que resulte em segurança para que o agente público, dotado de fé
pública, autentique, quando necessário, as cópias impressas a partir das
imagens armazenadas em um ambiente arquivístico seguro.
14
DOCUMENTO DE ARQUIVO E GESTÃO DOCUMENTAL: CONCEITOS
FUNDAMENTAIS

Vimos em que consiste, tecnicamente, a digitalização de documentos e


as vantagens que a implantação dessa tecnologia pode proporcionar à
instituição que a adota. Mas, da decisão inicial pela digitalização até a sua
efetiva implantação, há um longo caminho a percorrer. Afinal, questões
políticas como estratégias de convencimento junto às instâncias superiores,
além de dúvidas meramente técnicas que vão do tipo de equipamento a ser
utilizado à escolha ou desenvolvimento do software adequado à aplicação,
passando – ou esbarrando! – no problema orçamentário, precisarão ser
enfrentadas com um cuidado especialíssimo, pois a experiência tem mostrado
que soluções mal pensadas ou mal planejadas resultam em prejuízos por
vezes dificilmente recuperados, como no caso de perda de informações
decorrente do uso e gerenciamento mal conduzidos do sistema.
Para a realização plena de uma aplicação de digitalização é preciso ter
em mente que a digitalização propriamente dita é apenas uma de uma série de
rotinas e procedimentos necessários para que o processo como um todo
contemple satisfatoriamente o seu propósito.
Mas antes de entrarmos no detalhamento desse processo, vamos
analisar as especificidades dos documentos custodiados por instituições de
natureza diversa, como são o arquivo, a biblioteca, o museu e o centro de
memória ou documentação, para compreender o porquê da necessidade de
uma abordagem diferenciada ao documento arquivístico quando se fala em
digitalização.
Como observação fundamental, é preciso dizer que quando se fala em
“arquivo” deve-se entender que não se trata de uma unidade de depósito de
documentos, mas sim de todo o acervo documental da instituição,
independentemente do lugar em que se encontram os documentos, estejam
eles em caixas colocadas nas estantes, soltos sobre as mesas, dentro de
gavetas ou mesmo emprestados para algum usuário (por exemplo, processos
judiciais retirados por advogados).
De fato, a própria lei 8.159, conhecida como a “lei dos arquivos”, assim
define “arquivo” em seu Art. 2º:

15
“Consideram-se arquivos, para os fins desta Lei, os
conjuntos de documentos produzidos e recebidos por órgãos
públicos, instituições de caráter público e entidades
privadas, em decorrência do exercício de atividades
específicas, bem como por pessoa física, qualquer que seja
o suporte da informação ou a natureza dos documentos.”

Portanto, tal como é compreendido pela arquivística contemporânea, o


documento de arquivo, diferentemente dos demais, é criado ou recebido por
uma instituição num processo natural, não-seletivo, decorrente das atividades
inerentes a ela. Ou seja, em se tratando de um museu, uma biblioteca ou um
centro de memória, a instituição não apenas pode como deve selecionar tudo
aquilo que servirá para instruir, informar ou entreter os seus usuários. Mas
numa instituição arquivística o documento é criado ou acolhido naturalmente,
sem que haja um processo seletivo ou vontade expressa para a sua aceitação
ou criação.
E como ele invariavelmente nasce para fazer prova de alguma atividade
da instituição, preservar essa característica testemunhal do documento de
arquivo é essencial para que os seus usuários, internos e externos, possam,
dito de uma forma mais simples, ter assegurados os direitos que decorrem do
potencial informativo-probatório que ele possui.
Por essa razão a legislação brasileira (por meio de leis, decretos e
resoluções do Conselho Nacional de Arquivos – CONARQ) ampara o
documento de arquivo originário de órgãos públicos de todas as esferas e
instâncias administrativas, estabelecendo a obrigatoriedade de as instituições
implantarem programas de gestão documental, a fim de assegurar, em relação
a ele, uma melhor racionalização da sua produção/ acumulação e condições
adequadas de preservação e acesso.
Instrumentos necessários para a execução de um programa de gestão
documental são os planos de classificação e tabelas de temporalidade. Os
primeiros expõem as atividades-meio e as atividades finalísticas da instituição,
elencando os tipos documentais acumulados por cada uma dessas atividades,
estabelecendo os seus códigos de classificação. As tabelas, por sua vez,
definem os prazos de guarda dos documentos, considerando o tempo de
esgotamento dos valores que podem possuir (fiscal, jurídico-legal, histórico-
informativo relevante, etc.).
16
Neste ponto, é necessário destacar que a definição de prazos de guarda
de documentos deve levar em consideração o seu potencial informativo e
probatório, independentemente do suporte, seja ele papel, meio magnético ou
meio óptico, o que significa que, tendo sido o documento digitalizado, ele
continuará mantendo a sua temporalidade “original” de guarda, e os
procedimentos de descarte da informação deverão continuar sendo seguidos.

L100 GESTIÓN DE LA INVESTIGACIÓN


L101 Organización y programación de la investigación
L102 Proyectos de investigación
L103 Programatión de la investigación
L104 Ayudas a la investigación
L105 Información y difusión de convocatorias
L106 Convenios y transferencia de tecnologia
L107 Convenios con empresas
L108 Convenios con centros de investigación
L109 Contratos
L110 Contratos de estudios juridicos
L111 Solicitud de ayudas
L112 Infraestructura cientifica
L113 Proyectos de investigación
L114 Becas
L115 Ayudas a la movilidad del personal investigador
L116 Plan de fomento a la investigación
L117 Organización y asistencia a congresos
L118 Difusión de los resultados de la investigación
L119 Evaluación de la investigación

Detalhe do plano de classificação de documentos da Universidade Carlos III de Madri

Planos de classificação e tabelas de temporalidade, além de cuidados


com o acesso e a preservação, são elementos essenciais, portanto, para o
estabelecimento de um sistema de arquivamento eficiente, que deve ter como
meta manter os documentos de arquivo sob condições de guarda adequadas
pelo tempo necessário para que possam ser utilizados como elemento de
17
prova e informação, assegurando que as informações neles existentes possam,
no menor intervalo de tempo possível, ser disponibilizadas quando solicitadas.
Assim, o ideal, de fato, é digitalizar conjuntos documentais devidamente
organizados, com as séries documentais necessariamente identificadas,
classificadas, ordenadas, dimensionadas e avaliadas no sentido da definição
dos seus prazos de guarda.
O conceito de “série documental” é definida pelo Dicionário Brasileiro de
Terminologia Arquivística como “o conjunto de documentos do mesmo tipo
documental”. Exemplos de séries são: os cartões de ponto dos empregados de
uma empresa; os processos de julgamento de reclamação trabalhista, de uma
Vara do Trabalho; os planos de vôo de uma companhia de aviação; etc.

Detalhe da tabela de temporalidade de documentos do Tribunal Regional Eleitoral de São Paulo, em que se encontram
relacionadas as atividades e os documentos que compõem as séries documentais, além dos prazos de guarda.

Exemplos de prováveis conseqüências decorrentes do erro estratégico


de não dar a devida atenção ao gerenciamento arquivístico dos documentos
são:

- a digitalização de séries documentais volumosas, porém de limitado


valor informativo, e com uma demanda de consulta praticamente nula;
- a digitalização de séries documentais incompletas porque a
desorganização do acervo torna difícil a localização dos segmentos
faltantes;
- a digitalização indiscriminada de documentos, “mesclando” diferentes
séries documentais ou fragmentos de séries em uma única base de
dados, tornando difícil o seu gerenciamento;
18
- a manutenção desnecessária e custosa de imagens de documentos na
base de dados que já tiveram esgotados os seus valores de uso, mas
que, pela ausência de um programa de gestão não passaram por um
processo de avaliação que definisse o seu prazo de guarda; e
- a digitalização equivocada de documentos que já poderiam ter sido
descartados por não apresentarem valores relevantes de uso.

Há uma máxima que deve ser sempre lembrada: “digitalizar uma


bagunça produz uma bagunça digitallizada”.
Tecnologias de reprodução de documentos de arquivo, como
digitalização, devem ser pensadas, portanto, como soluções que contribuam
para atender à missão institucional dos arquivos, sendo mister, por
conseguinte, em primeiro lugar, inseri-las num programa de gestão documental
de modo a permitir o seu uso com a racionalidade necessária para evitar
desperdícios de recursos decorrentes de equívocos de definição sobre o que
deve ser digitalizado; e, em segundo lugar, preservar a autenticidade e a
confiabilidade dos documentos uma vez digitalizados, sem os quais estes
perderão grande parte do sentido da sua existência.

Detalhe da tabela de temporalidade de documentos do Sistema de Arquivos do Estado de São Paulo

19
DEFINIÇÃO DO UNIVERSO DOCUMENTAL A SER DIGITALIZADO

A aplicação da digitalização tratada neste curso se dará para o


documento de arquivo em sua fase acabada, cujo trâmite administrativo se
encontra concluído. Essa etapa do chamado ciclo vital dos documentos de
arquivo corresponde à fase intermediária, posterior à fase corrente, em que o
documento não cumpriu totalmente a finalidade precípua para a qual ele foi
produzido, necessitando, portanto, ser mantido junto às unidades
administrativas da instituição por onde circula ou, ainda que já tenha cumprido
a sua função, possui uma freqüência de consulta suficientemente alta que
justifique a sua manutenção fisicamente na própria unidade que o utiliza.
No arquivo intermediário – normalmente um espaço centralizado de
custódia para todos os documentos da instituição que encerraram a sua fase
corrente, e com pouca freqüência de consulta – o documento ficará mantido
por um tempo variável conforme o prazo definido para cada tipo.
Importante ressaltar que, embora um documento em arquivo
intermediário, individualmente, possa ter uma baixa freqüência de consulta, a
série documental como um todo, à qual ele pertence, pode possuir uma
elevada demanda de solicitações de empréstimos dos documentos que a
compõem, por se tratar de um conjunto documental extremamente numeroso e
de elevado potencial informativo como um todo. Um exemplo típico é o caso
dos prontuários de funcionários aposentados, falecidos ou desligados. Cada
prontuário específico raramente é consultado, mas a soma das solicitações
individuais de consultas ou empréstimos (normalmente para embasar
certidões) corresponde normalmente a um número exorbitante, tornando a
série “prontuários” um conjunto documental de elevada freqüência de uso, e
essa é uma das razões que tornam a série documental o verdadeiro objeto da
digitalização.
Uma outra razão para que o objeto da digitalização seja sempre a série
documental se deve ao fato de que, arquivisticamente falando, o valor
secundário que um documento pode ter para a pesquisa científica, salvo
situações de caráter excepcionalíssimo, não está no seu conteúdo individual,
mas sim em todo o conjunto seriado do qual ele é elemento integrante.
Por exemplo: em um Tribunal de Justiça os processos de julgamento de
mandado de segurança podem ser objeto de pesquisa para estudar a relação
entre determinado momento político e as tendências dos julgadores para
20
concessão ou não de liminares, e isso só será possível fazer através de
estudos estatísticos, aliado a outros métodos de pesquisa, do total das
decisões dentro do recorte cronológico desejado da série, composta por todos
os documentos do mesmo tipo (processo de mandado de segurança).
Assim, como regra básica podemos definir a série documental como
sendo o objeto da digitalização, seja pelo seu relevante valor científico, seja
pela sua elevada demanda de consulta.
Em relação às séries documentais de guarda temporária, é fundamental
esclarecer que elas tendem, naturalmente, a não ser completas, pois à medida
que os prazos de guarda forem expirando, frações da série estarão sempre
sendo destruídas, estando os documentos em papel ou em meio digital,
conforme já mencionado.

GERENCIAMENTO ELETRÔNICO DE IMAGENS DE DOCUMENTOS – GEID:


FUNDAMENTOS E ETAPAS

No Brasil, o conceito de Gerenciamento Eletrônico de Imagens de


Documentos – GEID é bem mais correto em relação à expressão norte-
americana equivalente (Document Imaging) no sentido de ser mais
adequadamente denominado para fazer justiça à amplitude da aplicação,
considerando o conjunto de procedimentos ou etapas presentes no processo,
que são:

- a preparação dos documentos a serem digitalizados;


- a sua digitalização;
- o controle de qualidade das imagens;
- a sua indexação;
- a sua armazenagem em ambiente seguro; e
- a recuperação da imagem quando solicitada.

A digitalização em larga escala pressupõe uma organização do trabalho


em linha de produção, que deve ser constituída por um número de estações de
trabalho suficiente para que as rotinas sejam simultaneamente realizadas por
diferentes pessoas. Claro que é possível também, para realidades documentais
menores, que apenas 1 ou 2 funcionários dêem conta de todas as etapas. Mas,
21
de todo modo, é fundamental observar que a criação de um ambiente
arquivisticamente seguro para a realização do processo exige que cada etapa
seja rigorosamente documentada com o registro de metadados tecnológicos
e de contexto.
Por metadados tecnológicos devemos entender as informações de
descrição do ambiente tecnológico utilizado em todas as fases do sistema, os
quais devem, no mínimo, mencionar:
- software de captura utilizado;
- modelo do equipamento de captura utilizado;
- meio de armazenagem – preferencialmente óptico, conforme
veremos adiante – utilizado para preservação das imagens (CD-R,
MO, DVD-R, BD-R, HD-DVD-R);
- formato de arquivo de imagens utilizado (pdf, jpeg, tiff ou bmp); e
- formato de arquivo utilizado para preservação dos índices (xml, txt,
csv).

Os metadados de contexto referem-se ao tetrágono onde-que-quem-


quando referente à realização das rotinas:

- identificação da instituição e da unidade administrativa em que o


serviço foi realizado;
- identificação do conjunto documental digitalizado e seu código de
classificação;
- identificação das pessoas que realizaram cada etapa;
- menção das datas em que foi realizada cada etapa do processo;

Uma indagação natural sobre o registro desses metadados é


simplesmente como fazê-lo. Mas, para responder essa dúvida, consideremos
antes que a preservação dessas informações é tão importante quanto a
preservação das próprias imagens e de seus índices, pois serão elas que
garantirão a segurança, para um futuro gerente do processo, ou futuro usuário
interno, de que o processo foi realizado em um ambiente arquivisticamente
confiável.
É então de se esperar que tais metadados estejam registrados de uma
forma facilmente acessível, e que, portanto, não dependam de algum sistema
sofisticado de acesso que dificulte ou inviabilize a sua leitura futura.
22
No caso dos metadados tecnológicos uma possibilidade seria registrá-
los em um arquivo no formato “txt”, produzido pelo aplicativo “bloco de notas”
do Windows, o qual, devido à sua simplicidade, é um dos formatos mais
seguros para preservação de informações textuais digitais. O arquivo deverá,
então, ser gravado juntamente com as imagens e os índices na unidade de
armazenagem própria gerada para preservação dos dados (veremos também,
mais adiante, o propósito e as configurações interna e externa de uma mídia de
preservação, a qual seguirá, também, o princípio da simplicidade para
armazenagem de imagens e índices).
Quanto aos metadados de contexto, a melhor possibilidade seria
preservar os próprios relatórios diários em papel que documentarão, inclusive –
e principalmente –por quem, onde e quando cada operação foi realizada, além,
por óbvio, da indicação do conjunto de documentos trabalhado.
Analisemos agora, mais detalhadamente, em que consiste cada etapa
de um sistema de gerenciamento eletrônico de imagens de documentos.

Preparação

O objetivo da preparação é deixar os documentos fisicamente aptos para


serem processados digitalmente. Para tanto, é essencial que eles sejam
agrupados por lotes que contenham uma quantidade que não exceda a
capacidade do alimentador automático do scanner.
Os lotes de documentos devem, para facilitar a sua circulação na linha
de trabalho, ser acondicionados em pastas, cujo modelo a ser adotado tem de
facilitar o manuseio dos papéis o máximo possível.
Nessa fase deve ser observado o seguinte:

- os documentos devem ser retirados das pastas, caixas ou dos outros


invólucros originais de acondicionamento;
- a conferência do lote deve ser rigorosamente feita a fim de verificar se
todos os itens documentais do intervalo estão presentes, sendo que a ausência
de alguma peça deve ser mencionada na ficha de lote;

- grampos, clipes e outros materiais estranhos ao documento devem ser


retirados;
- sujidades devem ser removidas dos documentos;

23
- dobras e amassos necessitam ser desfeitos na medida do possível, e
Itens documentais em precário estado de conservação que corram o risco de
ser danificados durante a digitalização automática, em decorrência da “puxada”
do documento, devem ser mencionados na ficha de lote, indicando a
necessidade de digitalização manual;
- a intervenção no documento deve se dar apenas para um reparo físico,
não devendo ser feitas anotações, alterações, realces ou retoques, pois isso
pode ser caracterizado como adulteração do conteúdo, comprometendo a sua
confiabilidade.
- documentos constituídos de muitas folhas poderão ser separados por
uma folha em branco, caso o software de captura utilizado possua o recurso de
detecção automática de início e fim do documento.

Digitalização

Trata-se do chamado processo de captura, momento em que o scanner


converterá a imagem do documento em um arquivo digital, produzindo uma
imagem rasterizada.
Em se tratando de documentos textuais em bom estado de preservação
a digitalização deverá ser feita pelo alimentador automático, o que torna esta
etapa a mais rápida do processo, consumindo um tempo que, conforme a
velocidade do scanner e tamanho do lote, pode variar de 2 a 20 minutos.
Uma resolução de imagem de 200 dpi será suficiente para a obtenção
de bons resultados para textos com caracteres a partir de tamanho 12. Mas,
obviamente, testes devem sempre ser feitos para avaliar o resultado final,
observando que resoluções acima de 400 dpi não trarão ganho significativo de
qualidade na imagem e resultarão em arquivos que ocuparão, por isso mesmo,
sobrecarga desnecessária na unidade de armazenagem ou, se for o caso, na
rede por onde a imagem poderá trafegar.
O formato digital a ser adotado em caso de documentos multipaginados,
ou seja, compostos por múltiplas folhas, deverá ser o TIFF, ainda que,
posteriormente as imagens sejam exportadas para o formato PDF.
Uma das tecnologias de compactação de imagem incorporadas pelo
formato TIFF é o chamado “padrão fax”, tecnicamente conhecido como ITU-G4,
e que possibilita uma compressão da ordem de 385 vezes menor que a
imagem não compactada, resultando em arquivos de imagem de 30 a 40 kb
por página. Tal sistema de compressão, contudo, não produz imagens em tons
de cinza (e muito menos coloridas), mas sim em preto e branco, sem tons
intermediários, o que significa que só pode ser empregado para digitalização

24
de documentos cujas cores ou matizes de cinza, eventualmente presentes, não
sejam necessárias para compreensão do seu conteúdo informacional.
Porém, caso o documento possua gráficos coloridos ou fotografias, o
padrão JPEG deverá ser utilizado para geração de arquivos com extensão
JPG.
Os softwares de captura para aplicações em gerenciamento de imagens
normalmente trabalham com a possibilidade de agrupar em um único arquivo
PDF diversos arquivos de imagem produzidos com diferentes algoritmos de
compressão, como o ITU-G4, o JPEG , o GIF ou o TIFF com seu sistema
próprio de compactação, buscando otimizar a produção do documento digital.
O formato PDF, que hoje agrega até tecnologias multimídia, permitindo a
geração de arquivos que combinam texto, fotografias, música e vídeo, vem
sendo continuamente empregado para aplicações de gerenciamento de
imagens de documentos. Entretanto, nesse caso, normalmente o arquivo é
produzido por “exportação” a partir de um arquivo TIFF.
Para o caso da criação de um banco de imagens fotográficas – que
usualmente interessa a museus e centros de documentação ou de memória –,
ainda que sejam produzidos arquivos JPEG para circulação sob demanda na
rede ou publicação, é altamente recomendável a produção também de arquivos
com tecnologias de compressão que não impliquem perdas de qualidade da
imagem, devendo, neste caso, ser armazenadas em uma “mídia de
preservação”, como veremos adiante. O TIFF – ou o PDF gerado a partir dele –
novamente é a melhor opção.

Controle de qualidade (CQ)

Nesse momento as imagens serão analisadas para verificação técnica


da qualidade e, se necessário, submetidas a tratamentos possíveis para
correção de defeitos que comprometam a inteligibilidade do texto. Caso não
seja possível a recuperação por processamento digital de uma imagem
incorreta, como é o caso, por exemplo, de digitalização apenas parcial (imagem
cortada), deverá ela retornar para uma nova digitalização, com o devido
apontamento na ficha de lote.

25
SERVIÇO DE DIGITALIZAÇÃO DE DOCUMENTOS

PREPARAÇÃO

LOTE Nº: ________ TIPO DOCUMENTAL: ____________________________ CLASSIF.: __________

CONTEÚDO: ___________________________________________________________ CAIXA: _________

OBSERVAÇÕES: _________________________________________________________________________

Realizada por: _______________________ DATA:_____/_____/______

DIGITALIZAÇÃO CONTROLE DE QUALIDADE


Realizada por:
APROVADO PARA INDEXAÇÃO
_______________________
REDIGITALIZAR DOCUMENTOS (relação no verso)

DATA:_____/_____/______ Realizado por: _______________________ DATA:_____/_____/______

REDIGITALIZAÇÃO

REDIGITALIZAR DOCUMENTOS : __________________________________________________________

_________________________________________________________________________________________

_________________________________________________________________________________________

OBSERVAÇÕES: _________________________________________________________________________

Realizada por: _______________________ DATA:_____/_____/______

CONTROLE DE QUALIDADE INDEXAÇÃO


Realizada por:
APROVADO
_______________________
REDIGITALIZAR DOCUMENTOS (relação em outra ficha)

Realizado por: _______________________ DATA:_____/_____/______ DATA:_____/_____/______

Exemplo de ficha de lote para digitalização de documentos

26
O CQ é feito também para “limpeza” da imagem, objetivando remover
marcas provenientes de sujeira, dobras, grampos, clipes e furos.
Um operador responsável pelo CQ é capaz, com a prática, de aprovar
uma imagem por visualização bem rápida no monitor, podendo levar poucos
segundos a cada página, não sendo compensador, portanto, numa relação
custo/ benefício ,um CQ realizado por amostragem.

Indexação

Índices são um tipo de metadados que visam garantir a recuperação das


imagens a partir de palavras-chave extraídas do seu conteúdo. Por exemplo:
nome dos interessados, número e ano do documento e assunto tratado.
Tal procedimento pode ser realizado de duas formas diferentes: por
digitação manual ou através de softwares de reconhecimento óptico de
caracteres – OCR (Optical Characters Recognition), os quais convertem
imagens de textos em textos vetoriais (pesquisáveis, portanto), com um índice
de acerto variável conforme a qualidade da imagem, podendo chegar a cerca
de 97%.
Atualmente se entende que os índices devem constituir, na verdade, um
banco de dados à parte, cujos registros estabelecem uma relação com as
imagens correspondentes, trazendo a indicação do local em que elas se
encontram armazenadas, permitindo ao aplicativo que gerencia o sistema uma
rápida exibição do documento solicitado, por meio de um visualizador próprio
incorporado.

Armazenagem e recuperação das imagens quando requeridas

Vimos que um sistema de arquivamento eficiente deve assegurar que os


documentos sejam disponibilizados para consulta no menor intervalo de tempo
possível, e, para tanto, devem ser mantidos sob custódia pelo prazo necessário
a fim de que sejam utilizados como elemento de prova e informação. É assim
com o papel e não será diferente com o documento digitalizado.

27
Nesse sentido, as etapas da armazenagem e da recuperação são,
seguramente, as que melhor têm de ser pensadas, constituindo-se mesmo nas
mais vitais da aplicação.
Pois o problema do documento digital é que a sua fragilidade exige,
diferentemente do papel, o que pode se chamar de uma atitude consciente
para a sua preservação. E preservação digital é muito mais do que a mera
conservação do suporte, o que significa, em primeiro lugar, que não basta
garantir condições de guarda ideais para o meio físico que contém os dados
(disco óptico, disquete, cartão de memória, fita magnética) – o que por si só já
é um grande desafio. É necessário também assegurar que os dados estejam
em suportes que sejam comportados pelas unidades de leitura disponíveis ao
longo do tempo em que os documentos precisarem ser consultados.
O exemplo dos discos flexíveis de 5 ¼ polegadas permite uma
compreensão clara da situação: tais discos eram comuns nos anos 1980 e até
meados de 1990, mas se tornaram obsoletos com o advento dos disquetes de
3 ½ polegadas e dos CD’s. Contudo, não é raro encontrar disquetes de 5 ¼
em boas condições de guarda em instituições públicas ou privadas, sem que
existam equipamentos de leitura para acesso aos dados neles inseridos.
A solução, neste caso, é uma constante vigilância no sentido de que os
dados sejam regularmente migrados para um novo padrão universalmente
aceito, sempre quando o anterior estiver em franco processo de
descontinuidade.
Em segundo lugar, é necessário que, durante os seus prazos de guarda,
os dados estejam sempre em formatos de arquivo digital compatíveis com os
softwares de leitura disponíveis. Tais formatos, levando em consideração a
possibilidade de obsolescência destes, podem não ser aqueles em que foram
originalmente criados.
Novamente há que se promover, sempre que necessário, a conversão
dos dados para formatos compatíveis com os softwares disponíveis ao logo do
período em que os documentos precisarem ser preservados.
Por último, há a questão da necessidade de criar mecanismos de
segurança para que os dados não sejam intencionalmente alterados durante o
seu prazo de guarda, dada a possibilidade que o documento digital abre nesse
campo, pois tanto imagens como documentos textuais digitais podem
facilmente ser editados sem que evidenciem rastros de adulteração.
Assim, podemos concluir, por ora, que preservação digital é um conjunto
de cuidados e procedimentos que asseguram ao documento digital a sua
acessibilidade e a sua integridade ao longo do seu prazo de guarda, através
das seguintes estratégias:
28
- preservação física adequada do suporte;
- atualização tecnológica do suporte quando preciso;
- atualização tecnológica do formato digital dos dados quando preciso; e
- preservação da integridade dos dados.

Mas, enfim, qual o caminho a seguir que leve à consecução de tais


estratégias, garantindo uma armazenagem que permita uma recuperação
segura dos dados enquanto estes precisarem ser mantidos sob custódia?
As informações no anexo 2 referentes às diferentes naturezas dos
suportes informáticos atualmente existentes apontam para a adoção dos discos
rígidos como excelentes para a publicação das imagens, dada a elevada
velocidade de acesso aos dados com que trabalham. Devem, contudo, ser
combinados com o uso de programas que imprimam segurança contra
alteração acidental ou intencional de dados, como o uso de assinaturas digitais
ou validações das imagens baseadas em códigos “hash”, além do
estabelecimento de trilhas de auditoria, durante todas as etapas da aplicação.
Além disso, rotinas diárias de cópias de segurança dos dados devem,
obrigatoriamente, ser adotadas contra eventuais panes nos equipamentos, as
quais podem causar perda de dados de valor incalculável. Em instituições de
médio e grande porte as rotinas de cópias de segurança são realizadas em
fitas magnéticas, sendo atribuições das unidades de informática que gerenciam
os servidores de dados, e é altamente recomendável em sistemas de
digitalização que o servidor de imagens utilizado pela aplicação seja, também,
integrado aos procedimentos de backup dessa equipe.
Por sua vez, à unidade de Arquivo da instituição deve caber,
obrigatoriamente, a função de guarda, preferencialmente em ambiente
climatizado, das imagens digitalizadas e dos índices em formatos de aceitação
universal para intercâmbio de bancos de dados. Tal custódia dos dados deve
se dar em meios ópticos de qualidade arquivística do tipo WORM (Write Once
Read Many, ou “grava uma vez, lê várias vezes”), que são os mais capazes de
assegurar longevidade e incorruptibilidade dos dados gravados, conforme
argumentado no anexo 2.
A função das “mídias de preservação” é assegurar, em situações
extremas de perdas de dados (leia-se imagens e índices) por acidente, ato
criminoso, negligência, ou mesmo inacessibilidade por uma razão qualquer,
além da indisponibilidade das cópias de segurança, que o banco de dados
possa ser reconstruído a partir dos dados “brutos”, por assim dizer,
devidamente armazenados. Uma outra situação é quando se dá a extinção da
própria instituição e seu fundo arquivístico passa a ser custodiado por outra
instituição, que pode até ser um centro de documentação. A reconstrução
29
poderá se dar para o mesmo software que gerenciava originalmente o banco,
ou para outro software de banco de dados, desde que os programas adotados
trabalhem com o conceito de interoperabilidade (capacidade de comunicação
entre 2 sistemas diferentes).
Uma mídia de preservação apresenta, na forma, a aposição de
inscrições que são elementos validadores de seu status, tais como logomarca
da instituição, numeração própria, código de classificação da série documental
e descrição genérica do intervalo documental armazenado; e, no conteúdo,
possui tão somente gravadas as imagens em formato universal
(preferencialmente TIFF) e um arquivo em formato texto para interoperabilidade
(xml, csv, txt) contendo os índices. Pode possuir, também, um arquivo em
formato txt contendo metadados tecnológicos e de contexto, conforme
mencionado no início deste capítulo.
Mas um ambiente institucional arquivisticamente seguro que adote um
sistema de gerenciamento eletrônico de imagens de documentos jamais estará
completo se não for acompanhado da existência de um ato normativo que
oficialmente reconheça a aplicação, impondo as obrigações necessárias para a
sua manutenção e a normalização das rotinas através de manual de
procedimentos.

PREFEITURA DO MUNICÍPIO DE ANTANHO


Seção de Arquivo Geral

Disco óptico n°:


39-A
Conteúdo:
Série:
Pareceres de 15.250
jurídicos
a 25.000
Classificação:
136.1.5

Jacobino Bustamante
Chefe da Seção de Arquivo

Exemplo hipotético de mídia óptica devidamente identificada e validada para preservação de imagens digitalizadas

30
CONFERINDO VALOR JURÍDICO-PROBATÓRIO AO DOCUMENTO
DIGITALIZADO

Considerando que não há, no Brasil, um diploma legal que reconheça a


autenticidade de imagens digitalizadas para fins probatórios em procedimentos
administrativos e judiciais, diferentemente da microfilmagem (devidamente
regulamentada através da Lei 5433/68 e do Decreto 1799/96) há, em geral, o
entendimento de que não é viável juridicamente o uso de versões digitalizadas
de documentos em papel para instrução processal. Tampouco, pela mesma
razão, seria possível o descarte de documentos de guarda temporária, após
rasterizados para o meio digital.
Entendo, contudo, que se o obstáculo de lege ferenda impede o uso da
digitalização para tais finalidades por empresas privadas, empresas públicas e
sociedades de economia mista, ele pode ser superado em se tratando de
órgãos da administração pública direta, autarquias e fundações públicas.
De fato, uma análise atenta sobre o tema que leve em consideração
elementos da principiologia do Direito, combinados com jurisprudência já
existente e dispositivos do Código de Processo Civil brasileiro, conduzir-nos-á
a um entendimento favorável ao uso, para todos os fins, do documento
digitalizado pelos 3 tipos de entidades de direito público mencionadas.
Com efeito, o art. 384 do CPC estabelece que reproduções obtidas por
qualquer processo de repetição valem como certidão “quando o escrivão portar
fé pública a sua conformidade com o original”, e o art. 389, inc. I, do mesmo
código, determina que “o ônus da prova quando se tratar de falsidade de
documento cabe à parte que a argüir”. Isso significa que a cópia de um
documento declarada como autêntica, em conformidade com o original, por um
agente da administração dotado de fé pública, não poderá ser recusada pela
autoridade policial ou julgadora para instrução de processos administrativos,
inquéritos policiais e autos judiciais, a não ser que a parte contrária demonstre
a falsidade do documento.
Na esfera administrativa, a Portaria normativa nº 5/2002 da Secretaria
de Logística e Tecnologia da Informação do Ministério do Planejamento,
Orçamento e Gestão não deixa dúvidas quanto à questão:

“O processo deve ser autuado, preferencialmente, por um


documento original; no entanto, pode ser autuado utilizando-se
uma cópia de documento, considerando-se que o servidor tem
31
fé pública para autenticar documentos e fazer reconhecimento
de firmas.”

No âmbito judicial, o Acórdão de 17/03/1999, no Agravo de Instrumento


nº 105.464.4/7, do Tribunal de Justiça de SP, que discutiu validade jurídica de
certidão negativa de débito fiscal federal emitida pela Receita Federal, decidiu
que

“A própria Receita Federal admite, mediante Portaria, a validade


da certidão negativa obtida por meio eletrônico, não havendo
razão jurídica relevante para negar validade ao documento.”

Isto quer dizer que, segundo o órgão julgador, as instituições públicas


têm plena competência para declarar como autênticos os documentos de seus
arquivos ou mesmo declarar como autênticas as cópias extraídas por elas
mesmas de documentos pertencentes a seus arquivos.
Tal assertiva vai ao encontro de um princípio básico do Direito
Administrativo, segundo o qual o administrador público no Brasil é dotado de
poder regulamentador, exercido, na sua esfera de atuação, por meio de
diplomas infra-legais como resoluções, portarias, ordens de serviço e atos
administrativos de outras espécies diplomáticas, cabendo a ele, portanto,
disciplinar as atividades do órgão no âmbito de suas competências.
Assim sendo, é perfeitamente lícito que o administrador regulamente
aplicações de digitalização de documentos na sua esfera de atuação,
estabelecendo as regras para um ambiente arquivisticamente seguro para que
os servidores dotados de fé pública, como o são funcionários efetivos dos
órgãos da administração pública direta, autarquias e fundações públicas,
possam declarar como autênticas as cópias extraídas de originais digitalizados.
Além disso, é possível, inclusive, autorizar o descarte dos documentos
originais, desde que sejam de guarda provisória, aplicando por analogia o que
dispõem os diplomas legais referentes à microfilmagem.
Um exemplo de um dispositivo normatizador para um sistema de
gerenciamento eletrônico de imagens de documentos encontra-se no anexo 4,
e nele podem ser observados os elementos que definem um conjunto de regras
que visa dar segurança administrativa para garantir a confiabilidade da
aplicação, com todas as cautelas que a situação exige.
32
ANEXO 1 – TIPOS DE SCANNERS

Os scanners com alimentação automática, ou seja, aqueles que


possuem um dispositivo (“bandeja”) para empilhamento de folhas são, devido
ao seu alto rendimento, os que devem ser utilizados em aplicações para
digitalização de documentos em larga escala.
Não são equipamentos indicados para trabalhos gráficos de alta
qualidade, pois a resolução máxima de imagem com que operam é da ordem
de 600 dpi (pontos por polegada), o que é, contudo, mais do que suficiente
para uso em sistemas de gerenciamento eletrônico de imagens de
documentos, para os quais são indicados, via de regra, resoluções entre 200 e
300 dpi.
As diferenças de preço entre scanners situados na mesma faixa de
velocidade de digitalização residem, basicamente, na capacidade de as
máquinas aceitarem ou não alimentação manual via flatbed, na capacidade de
aceitarem ou não papéis em formato superior ao A4 (21 cm X 29,4 cm), como o
A3 (29,7 cm X 42 cm), na capacidade de digitalizarem frente e verso da folha
simultaneamente, no sistema de captura utilizado, que pode ser CCD (Charge-
Coupled Device) ou CIS (Contact Image Sensor), e outros recursos adicionais,
como detecção automática de grampos e correções automáticas de defeitos na
imagem.
Essencial para um contínuo e perfeito funcionamento das máquinas é a
manutenção preventiva, a ser realizada regularmente, de preferência por
profissionais especializados, devendo, sempre quando necessário, promover a
substituição de consumíveis gastos (roletes, correias e outras peças que se
desgastam naturalmente com o uso) e limpeza e regulagem das partes móveis,
que acumulam partículas de sujeira, o que pode ocasionar deficiências nas
imagens capturadas e complicações mecânicas no funcionamento do aparelho,
levando a danos maiores no equipamento.
No Brasil o mercado de scanners para digitalização em larga escala é
disputado por 4 fornecedores: Fujitsu, Kodak, Canon e Avision.
Esses scanners são classificados, segundo os fabricantes, em 3
categorias, conforme a necessidade de uso:

34
- Scanners desktop:

São máquinas que digitalizam de 10 a 25 ppm (páginas por minuto), e


que suportam uma capacidade diária aproximada de 2.000 folhas por dia.

Situam-se na faixa de preço de R$3.000,00.

Scanner Avision AV210, digitaliza 20 Scanner Canon DR 2580 C digitaliza 25 páginas


páginas por minuto por minuto frente e verso. É também dotado de
alimentador manual

- Scanners departamentais:

Digitalizam entre 25 e 50 ppm, suportando uma carga máxima diária de


10.000 folhas por dia.

Seu preço pode variar de R$3.000,00 a R$20.000,00, conforme o


modelo.

Modelo Fi4340-C da Fujitsu, digitaliza 40 páginas Scanner i280 da Kodak, que digitaliza
por minuto, frente e verso documentos longos e 50 páginas por minuto a 200
dpi, frente e verso.

35
- Scanners de produção:

São os mais rápidos do mercado, correspondendo a modelos que


digitalizam de 50 a 200 páginas por minuto.

Seu custo de aquisição oscila entre R$20.000,00 e R$100.000,00.

Modelos DR-9080-C da Canon e Fi5900-C da Fujitsu , respectivamente, ambos capazes de digitalizar 100
páginas por minuto, frente e verso. Possuem alimentador automático com capacidade de 500 folhas.

36
ANEX0 2 - MEIOS DE ARMAZENAGEM PARA DOCUMENTOS DIGITAIS

Até o final dos anos 80 todos os modelos de suportes disponíveis no


mercado para armazenagem de dados digitais pertenciam a uma mesma
“família”: a dos meios magnéticos, que seguem invariavelmente o mesmo
princípio de gravação, segundo o qual uma “cabeça” produz, em contato com a
superfície (ou bem próximo dela) um campo eletromagnético variável, o qual
orienta, conforme o dígito binário a ser gravado, as partículas microscópicas -
também sensíveis ao eletromagnetismo.
Essa tecnologia, presente nas fitas, nos discos rígidos e nos discos
flexíveis, surgiu, nos anos 50, para “destronar” os cartões perfurados, e reinou
absoluta por mais de 30 anos, até uma nova família de mídias para dados
começar a ser utilizada a partir de 1988: a dos discos óticos, como o CD-R e o
DVD-R, cujos bits são gravados a partir de microperfurações, numa camada
interna da mídia, feitas por um feixe de raio laser.
Hoje, há uma terceira família de dispositivos de armazenagem com um
futuro promissor: as memórias flash, presentes em câmeras fotográficas,
telefones celulares e pen drives.
Mas, diante de uma multiplicidade de modelos para cada uma das
famílias, como escolher o meio mais adequado para armazenar documentos
digitalizados?
O ponto de partida para se chegar a uma resposta é a idéia de que para
cada finalidade de gravação há um tipo de suporte mais indicado para uso. Em
sistemas de digitalização deve-se pensar que a armazenagem deve atender a
3 propósitos distintos: o da disponibilização para acesso rápido, o da cópia de
segurança e o da preservação.
Do ponto de vista da preservação dos dados, a experiência ao longo dos
anos mostrou serem os meios magnéticos menos estáveis do que os meios
óticos, devido à sensibilidade que apresentam em relação a campos
magnéticos e ao desgaste provocado pelas partes móveis do dispositivo, além
da degradação química decorrente da umidade relativa do ar, que ataca o
metal que compõe a camada de gravação.
Embora os discos óticos também se degradem com o passar do tempo –
particularmente se expostos a condições climáticas e atmosféricas precárias de

37
armazenagem – tendem a ter uma durabilidade bem maior se fabricados com
compostos químicos que assegurem uma maior sobrevida dos dados.
É o que apontou um estudo, realizado em 1995 pelo norte-americano
National Media Laboratory, que, através de processos laboratoriais de
envelhecimento acelerado, concluiu que o meio magnético é o menos durável
como suporte para guarda de dados. Em primeiro lugar ficou o papel, seguido
do microfilme e, na terceira posição, o disco óptico.
Analisemos agora as possibilidades de uso para os diferentes tipos de
suportes pertencentes às famílias magnética, ótica e flash. Entre parênteses
será informada, para cada caso, a capacidade aproximada de imagens
possíveis de serem armazenadas.

Meios magnéticos

- Fita

As fitas magnéticas surgiram em 1935 na Alemanha para gravação de


áudio. Mas em 1951 foram utilizadas, pela primeira vez, em formato de rolo de
12,65mm, para receber dados de um computador, o UNIVAC I, e desde então
evoluíram paulatinamente para formatos cada vez mais compactos e mais
densos.
Os formatos mais usuais atualmente são:

- AIT (Advanced Inteligente Tape), desenvolvido


pela Sony em 1996, e atualmente com capacidade
de 50 gb (1.000.000 de imagens), vendida a
R$200,00;

- DLT (Digital Linear Tape), lançada em 1984 pela


DEC (atual HP), e disponível hoje com
capacidades de 10 a 300 gigabytes (6.000.000 de
imagens), sendo comercializadas por valores entre
R$100,00 e R$250,00;

38
- LTO (Linear Tape Open), desenvolvida pelo
consórcio HP-IBM-Seagate em 2000, encontra-se
disponível atualmente na versão LTO-4, com
capacidade de 800 gigabytes (16.000.000 de
imagens), com custo aproximado por unidade de
R$500,00.

Têm, portanto, alta capacidade de armazenagem de dados, além de


alta velocidade de gravação. A leitura dos dados, contudo, é realizada de forma
seqüencial, ou seja, para acessar dados gravados no final da fita, o dispositivo
de leitura necessita percorrê-la por inteiro, caso a cabeça esteja posicionada no
início.
Permitem, também, o reaproveitamento para nova gravação de dados,
embora existam alguns modelos (como o LTO-3) que impedem essa
possibilidade por questões de segurança.
Dependem de dispositivos de leitura e gravação caros para uso
doméstico, com preços da ordem de R$3.000 a R$13.000,00 conforme o
modelo de fita.
Do ponto de vista mercadológico é um meio de armazenagem de
bastante aceitação, pois seu conjunto de características faz com que seja
amplamente utilizada como mídia para cópias de segurança em instituições de
elevado porte que gerenciam grandes quantidades de dados.

- Disco rígido

Também conhecido pelas iniciais HD (Hard Disk), foi desenvolvido em


1956 pela IBM como alternativa para os cartões perfurados (hoje obsoletos) e
fitas magnéticas.
Corresponde ao principal meio de armazenagem de dados nos
computadores atualmente. Tem como principais características alta densidade
(sendo comuns hoje os de 160 gigabytes), baixíssimo custo (média de R$1,00
por gigabyte) e alta velocidade de gravação e leitura dos dados. Porém, por ser
uma unidade complexa alimentada por corrente elétrica, constituída de muitas

39
partes móveis e componentes eletrônicos não é um meio de armazenagem
confiável do ponto de vista da durabilidade.

Mini disco rígido


da Toshiba, de 2
gigabytes

Ramac, o primeiro disco rígido, desenvolvido em 1956. Modelo de disco rígido de 160 gigabytes,
Tinha capacidade de armazenagem de 5 mb. comum nos computadores atualmente.

O HD Centera, desenvolvido pela


empresa norte-americana EMC em 2001, é um
disco rígido de conteúdo fixo, ou seja, que
impede o apagamento dos dados, uma vez
HD Centera
gravados, e seu uso está direcionado para
aplicações que exigem segurança máxima contra apagamento intencional ou
acidental de dados.
Por suas características os discos rígidos são as melhores mídias para
publicação de dados.

- Discos portáteis

Seu uso está em franco declínio, devido à limitada


capacidade de armazenagem de dados e baixa durabilidade,
no caso dos disquetes de 3 ½ polegadas, ou ao custo
elevado, comparativamente aos discos óticos regraváveis
(CD-RW), no caso dos discos ZIP e JAZ.
40
Discos óticos

- CD (Compact Disc)

Popularmente conhecido como CD, e inicialmente criado para


revolucionar a indústria fonográfica, teve a sua versão para armazenagem de
dados desenvolvida pela Philips em parceria com a Sony em 1988, e desde
então vem se consagrando como a mídia mais popular existente para
armazenagem de programas, jogos e gravação doméstica de dados.
Pode receber até 900 megabytes de informações digitais ou 700 mb
(15.000 imagens) na versão mais comum, sendo apresentado em 3 espécies
diferentes: o CD-ROM (Read Only Memory, ou “Memória Somente de Leitura”),
que já é adquirido com dados gravados em fábrica; o CD-R (Recordable, ou
“gravável”) para ser gravado apenas uma vez; e o CD-RW (Rewritable, ou
“regravável”) que permite gravação e apagamento para reaproveitamento
inúmeras vezes.
É um meio de armazenagem de alta aceitação, pelo baixo custo do
suporte e do leitor/gravador, e imunidade a campos magnéticos, com a
vantagem adicional de ser compatível com os leitores das gerações de discos
óticos que surgiram depois dele (ver adiante).
Seu custo varia conforme o tipo e a qualidade do material utilizado na
fabricação, podendo chegar a R$20,00 a unidade para os de qualidade
arquivística (camada reflexiva à base de ouro ou liga de outro e prata, e
camada de gravação feita à base de um composto altamente estável,
denominado ftalocianina). Neste caso, são ideais para armazenagem de dados
por períodos prolongados.

41
- DVD (Digital Video Disc)

Em 1997 o DVD, com as mesmas dimensões do CD, começou a ser


utilizado para gravação doméstica de documentos digitais. Dos diferentes
padrões inicialmente desenvolvidos (DVD-R, DVD+R, DVD-RAM) o DVD-R foi
o que mais se popularizou. Possui uma capacidade para receber até 4.7
gigabytes de dados (100.000 imagens) na sua versão mais comum, que pode
ser dobrada nos discos de dupla camada (dual layer).
Tal como o CD, a qualidade do material utilizado em sua composição
influencia diretamente na longevidade dos dados gravados.

- HD-DVD (High Density Digital Versatile Disc) e BD (Blu- ray)

Baseados na tecnologia do raio laser violeta, são formatos concorrentes,


desenvolvidos para entretenimento doméstico (home cinema).
O HD-DVD foi desenvolvido em 2005 por um consórcio de grandes
empresas do ramo, como Toshiba, NEC e Sanyo. Possui uma capacidade de
armazenagem de até 60 gigabytes para as versões de dupla face e dupla
camada, sendo mais comum o disco de 15 gb (300.000 imagens), com um lado
e uma única camada.
O Blu Ray foi criado pelo consórcio BDA (Blu-ray Disc Association) em
2006, e possui uma capacidade de armazenagem de 25 gigabytes (500.000
imagens) de dados nas versões de uma única camada.
As mídias virgens de HD-DVD e Blu-ray ainda não são muito comuns no
Brasil, embora já estejam disponíveis no mercado ao preço de R$60,00 e
R$90,00 a unidade, respectivamente.
Como ambos os padrões estão em franco processo de concorrência,
lutando por espaços no mercado, não é possível ainda saber qual delas
sobreviverá.

Dispositivos flash-ram

Reúnem qualidades extraordinárias como meios de armazenagem: são


pequenos, fisicamente resistentes por não possuírem partes móveis, serem

42
imunes a campos eletromagnéticos, possuírem alta estabilidade, baixíssimo
consumo de energia, além de serem ultra leves e totalmente silenciosos
quando em operação. São utilizados em geral para armazenagem provisória de
dados (transporte, transferência) apresentados na forma de pen drives, ou para
memória de aparelhos eletrônicos (celulares, câmeras fotográficas, mp3
players), com capacidades que variam de 500mb a 16gb.
A desvantagem fica por conta do fato de que após um tempo, que varia
conforme a quantidade de vezes em que é submetido a processos de
gravação, o dispositivo flash pode apresentar defeitos, decorrentes de sua
capacidade limitada de suportar ciclos de gravação.
A palavra flash se deve ao fato de que o processo de gravação ocorre
simultaneamente em múltiplos endereços de memória, em “relâmpagos”.
Embora haja uma diversidade de padrões no mercado, o fato de todos
possuírem a mesma interface de comunicação com o computador (USB) faz
com que o problema da compatibilidade seja minimizado.
Os modelos mais comuns em uso são:

- Pen drive, lançado em 1998 pela empresa


israelense M-Systems, com capacidade atual de até
4 gb (80.000 imagens). Preço: R$140,00;

- Memory Stick, padrão da Sony, desenvolvido em


1998, de capacidade máxima atual de 4gb (80.000
imagens). Preço: R$200,00;

- XD-Picture, criado pela Fujifilm e pela Olympus em


2002, com capacidade de 2 gb (40.000 imagens).
Preço: R$160,00;

- Compact flash, desenvolvido pela Sandisk em 1994,


capaz de guardar até 8 gb (160.000 imagens).
Preço: R$700,00.

- Secure Digital, padrão criado pelas empresas


Panasonic, SanDisk e Toshiba, lançado em 2000,
sendo que armazenam atualmente até 4 gb de
dados (80.000 imagens). Preço: R$300,00.

43
ANEX0 3 – FORMATOS DE IMAGENS DIGITAIS

Até meados dos anos 80 os diferentes formatos digitais de imagem que


existiam conviviam sem compatibilidade entre os programas que os criavam.
Eram os chamados formatos “proprietários”, de uso exclusivo dos respectivos
softwares.
Porém, isso criava dificuldades para emplacar comercialmente
aplicações para imagem digital em um mundo que testemunhava uma
crescente penetração da informática nos mais diversos setores sociais:
governo, comércio, indústria, serviços e até mesmo residências.
Surgiram, então, os grupos de trabalho designados por organismos
normalizadores internacionais – como a ISO (do grego isos, que significa
“igualdade”) e o ITU (International Telecommunication Union) –, e com a
finalidade de estabelecer os padrões de formatos de imagens digitais a serem
adotados pelos desenvolvedores de softwares.
Seguramente a adoção de padrões universalmente aceitos, combinada,
obviamente, com demais cautelas preservacionistas, é a melhor forma de
garantir condições de acessibilidade futura a documentos digitalizados. Por
essa razão a digitalização de documentos de arquivo deve ser realizada
sempre com softwares que adotem os formatos de arquivo descritos a seguir,
observando-se, naturalmente, a melhor indicação para cada caso.

JPEG

São as iniciais de Joint Photograph Experts Group, um comitê conjunto


entre a ISO e o ITU, formado em 1986, 3 anos após estudos iniciados pela ISO
para encontrar métodos que assegurassem um padrão de qualidade de
imagem digital a ser seguido.
Resultou num formato que possibilita uma compressão com nível
controlado de perda da definição da imagem, de modo a assegurar o seu uso
para várias aplicações, desde fotografias digitais de alta qualidade até arquivos
pequenos de baixa qualidade para publicação em sítios da Internet.

44
Entretanto, é sempre importante lembrar que um arquivo jpeg é composto
apenas por uma única página, diferentemente dos formatos TIFF e PDF.
O formato JPEG foi normalizado pela ITU/T.81, publicada em 1992 e
pela ISO 10918-1, publicada em 1994. Acabou sendo, também, incorporado
por outros formatos que trabalham com imagens, como o TIFF e o PDF,
conforme veremos a seguir.

TIFF

O TIFF foi criado em 1986 pela empresa Aldus Corporation, e hoje é um


formato proprietário pertencente à Adobe Systems. Mas apesar de ser um
formato proprietário, é de uso livre, adotado por praticamente todos os tipos de
aplicações que trabalham com imagens rasterizadas, devido à sua
versatilidade, não tendo nenhum concorrente à altura.
Seu nome vem de Tagged Image File Format, ou “Formato de Arquivo
de Imagem com Etiquetas”. As “etiquetas” são informações internas do arquivo
armazenadas juntamente com a imagem, e que correspondem à descrição do
formato da imagem (como preto e branco, tons de cinza ou colorida), e tipo de
compactação aplicada a ela, pois, como foi dito, o TIFF trabalha com diferentes
algoritmos de compressão, como o JPEG para fotografias e o “padrão fax” para
documentos textuais em preto e branco.
Uma outra grande qualidade é que pode armazenar documentos
compostos por múltiplas páginas, diferentemente do JPEG. Além disso, o TIFF
pode produzir imagens coloridas utilizando um algoritmo de compressão
denominado LZW que não compromete a qualidade da imagem, podendo
atingir uma diminuição do tamanho do arquivo da ordem de 1/10.
Mas para digitalização de documentos de arquivo textuais, deve ser
adotado o “padrão fax”, que corresponde ao formato definido pela norma ITU-
T/G4, e que produz imagens em preto e branco, possibilitando uma redução de
tamanho do arquivo da ordem de 1/300, conforme a ilustração a seguir:

45
TIFF sem compactação:
11 mb (1:1)

TIFF escala de cinza:


1,38 mb (1:8)

TIFF compactado com o padrão ITU-T/G4:


30 kb (1:385)

46
PDF

São as iniciais de Portable Document Format, ou “Formato de


Documento Portátil. Trata-se de um formato desenvolvido pela Adobe Systems
em 1990. É, portanto, um formato proprietário, porém, tal como o TIFF, é
“aberto”, de uso livre, e hoje tem a segurança de ter sido objeto de
normalização por meio da ISO 19005-1/2005, que define parâmetros de
geração de arquivos sob esse formato para preservação por longo tempo (o pdf
gerado com essas especificações chama-se “PDF-A”).
O grande diferencial do documento PDF é que ele comporta imagens
não apenas rasterizadas, mas também vetoriais, além de possibilitar a
incorporação de recursos audiovisuais, como som e imagem em movimento, o
que o torna um formato multiuso.
As imagens rasterizadas, que são as que mais nos interessam, são
armazenadas por ele utilizando os padrões JPEG ou TIFF, conforme
configurado pelo usuário no software que irá gerar o PDF. E, tal qual o TIFF,
produz também arquivos multipaginados.
O software que abre os arquivos pdf é o Acrobat Reader, disponível
gratuitamente na Internet.

47
ANEXO 4: PORTARIA N° 68/2006 DO TRE/SP

O DESEMBARGADOR ALVARO LAZZARINI,


PRESIDENTE DO TRIBUNAL REGIONAL
ELEITORAL DE SÃO PAULO, no uso de suas
atribuições, resolve:

regulamentar o gerenciamento eletrônico de


imagens de documentos no âmbito da Secretaria
do Tribunal Regional Eleitoral de São Paulo.

Artigo 1º - A Secretaria do Tribunal Regional Eleitoral do


Estado de São Paulo utilizará o Sistema de Gerenciamento Eletrônico de
Imagens de Documentos.
Artigo 2º - Para efeitos desta Portaria considerar-se-á:
I – Gerenciamento Eletrônico de Imagens de Documentos:
o uso coordenado de todas as técnicas eletrônicas de captação, gravação,
processamento, armazenamento, transferência e o uso de quaisquer
imagens de documentos produzidos ou recebidos por esta Secretaria no
exercício de suas atividades;
II – Digitalização de documentos: a conversão das imagens
dos documentos em imagens eletrônicas codificadas em meio digital;
III – Mídia de armazenagem eletrônica: o suporte físico
apto a receber gravação digital de dados;
IV – Formato proprietário de arquivo digital: o formato de
arquivo digital para uso exclusivo por software;
V – Formato universal de arquivo digital: o formato de
arquivo digital de uso irrestrito.

48
Artigo 3º - Serão fases obrigatórias do Sistema de
Gerenciamento Eletrônico de Imagens de Documentos:
a) a preparação dos documentos;
b) a digitalização;
c) o controle de qualidade das imagens digitalizadas;
d) a indexação;
e) a gravação em mídia de armazenagem própria;
f) a validação da mídia e
g) a recuperação da imagem e sua impressão, quando
requeridas.
Artigo 4º - Para garantir a segurança das informações,
ficarão vedados:
I – a gravação de imagens eletrônicas de documentos para
fins de preservação em mídias de armazenagem magnéticas ou de outro
tipo que não ofereça segurança física contra edição ou apagamento
eletrônico de dados, intencional ou acidental;
II – o uso de formatos proprietários de arquivo digital,
devendo-se adotar formatos universais para produção das imagens
eletrônicas dos documentos;
III – a circulação interna, na Secretaria do Tribunal, das
mídias de armazenagem eletrônica contendo imagens de documentos
judiciais;
IV – a reprodução, para público externo, das mídias de
armazenagem eletrônica contendo imagens de documentos.
Artigo 5º - Deverá a Secretaria prover medidas para:
I – migrar dados de mídias de armazenagem eletrônica
obsoletas para outra mídia de armazenagem de uso universal consolidado;
II – migrar as imagens de documentos em formato digital
obsoleto para outro formato digital de uso universal consolidado;
III – manter em condições climáticas de guarda adequadas
os meios de armazenagem que contenham imagens eletrônicas de
documentos, a fim de assegurar sua durabilidade.
Parágrafo único: Farão parte integrante das imagens
eletrônicas dos documentos os seus dados de indexação correspondentes.

49
Artigo 6º - Ficarão autorizadas, para os fins de direito e a
expensas do requerente, a impressão em papel e a autenticação, por
servidor da Secretaria, da imagem eletrônica do documento existente na
mídia de armazenagem, desde que essa imagem tenha sido obtida em
conformidade com o disposto nesta Portaria.
Artigo 7º - Ficará vedado o descarte de documentos em
papel previstos como de guarda permanente, mesmo após digitalizados para
os fins indicados nesta Portaria.
Parágrafo único: Ficará autorizado o descarte dos
documentos em papel que não sejam de guarda permanente, aplicando-se à
imagem eletrônica, neste caso, a mesma temporalidade de guarda de seu
equivalente em papel.
Artigo 8º - Caberá à Diretoria-Geral a identificação dos
tipos documentais que terão suas imagens eletrônicas disponibilizadas para
consulta via Internet ou Intranet.
Artigo 9º - Caberá à Secretaria de Administração a
centralização dos serviços regulamentados por esta Portaria, submetendo à
Diretoria-Geral as questões relevantes.
Artigo 10 - Para aplicação desta regulamentação serão
seguidas as rotinas descritas no Manual de Procedimentos anexo, que
integra esta Portaria.
Artigo 11 – Esta Portaria entrará em vigor na data de sua
publicação.

CUMPRA-SE.
PUBLIQUE-SE.

Tribunal Regional Eleitoral do Estado de São Paulo, em 26


de janeiro de 2006.

Alvaro Lazzarini
Presidente

50
MANUAL DE PROCEDIMENTOS
relativos ao gerenciamento eletrônico de imagens de documentos
Portaria nº 69/2006

1. DA ABERTURA DO LIVRO DE REGISTRO E CONTROLE DE MÍDIAS

1.1. Deverá ser aberto, lavrando-se o “Termo de Abertura” próprio, o “Livro de


Registro e Controle de Mídias”, com páginas numeradas e rubricadas pelo
Diretor-Geral da Secretaria.

1.2. O “Termo de Abertura” deverá seguir o exemplo abaixo:

“Contém este livro 50 (cinqüenta) folhas numeradas de 1


(um) a 50 (cinqüenta), devidamente rubricadas com a
minha rubrica “...........”e servirá para o registro e controle
das mídias utilizadas para gravação de imagens de
documentos por esta dependência.”
São Paulo, ___ de ___________ de _____.
[assinatura do Diretor-Geral]

1.3. Cada página do livro deverá conter as seguintes informações:

· 1.3.1. número da mídia, correspondente a um número seqüencial a partir de


1 (um) a ser atribuído pela própria dependência;
· 1.3.2. identificação da série documental contida na mídia e do intervalo da
série documental, (por exemplo: “acórdãos, de 90.000 a 100.000”);
· 1.3.3. identificação das datas-limites inicial e final dos documentos contidos
na mídia (por exemplo: “13/12/1985-19/09/1988”);
· 1.3.4. tipo de mídia e capacidade de armazenagem (por exemplo: CD-R);
· 1.3.5. identificação do fabricante e do ano de fabricação da mídia;
· 1.3.6. número de série da mídia, atribuído pelo fabricante;
· 1.3.7. formato do arquivo digital das imagens (por exemplo: PDF);
· 1.3.8. identificação do software utilizado para gravação dos dados;
· 1.3.9. identificação do software utilizado para leitura das dados;
· 1.3.10. identificação do Sistema Operacional empregado;
· 1.3.11. data da gravação da mídia;
· 1.3.12. datas das gravações das cópias e identificação das dependências
que as detém;
· 1.3.13. recibo de entrega das cópias;
· 1.3.14. data da migração dos dados, se ocorrer, e número da mídia para a
qual os dados foram migrados;
· 1.3.15. data de descarte da mídia, se ocorrer, e
· 1.3.16. identificação e assinatura do servidor responsável pela dependência
digitalizadora dos documentos.

51
2. DA PREPARAÇÃO DOS DOCUMENTOS PARA DIGITALIZAÇÃO

2.1. A preparação visa tornar os documentos aptos a ser processados


eletronicamente. O objetivo é assegurar que as imagens dos documentos
resultem em digitalização de melhor qualidade de leitura.

2.2. Nesta fase, o procedimento será:

· 2.2.1. Os documentos devem ser removidos de caixas, pastas ou outros


invólucros;
· 2.2.2. O objeto da digitalização para os efeitos desta regulamentação é a
série documental completa, não se admitindo a seleção de alguns e
exclusão de outros;
· 2.2.3. Os documentos compostos por múltiplas folhas devem ser conferidos
a fim de se verificar peças faltantes;
· 2.2.4. Os documentos devem ser agrupados por lotes;
· 2.2.5. Deve ser preservado o ordenamento original da série documental;
· 2.2.6. Para digitalização de séries documentais acumuladas, os
documentos deverão ser digitalizados seguindo a ordem inversa de sua
acumulação, ou seja, do mais recente para o mais antigo;
· 2.2.7. Os lotes devem ser compostos por unidades da mesma série
documental;
· 2.2.8. Os grampos, os clipes e os outros materiais estranhos ao documento
devem ser retirados;
· 2.2.9. As sujidades devem ser removidas dos documentos;
· 2.2.10. As dobras no documento devem ser desfeitas;
· 2.2.11. É permitido apenas o reparo físico de documentos danificados,
sendo vedados anotações, alterações, realces ou retoques;
· 2.2.12. A fim de proporcionar um melhor manuseio e trâmite durante a
produção, os lotes poderão ser provisoriamente acondicionados, separados
em capas, em envelopes ou em pastas apropriadas.

3. DA DIGITALIZAÇÃO

3.1. Nesta fase, serão seguidas as instruções de uso do software e do scanner


fornecidas por seus fabricantes, atentando-se para o seguinte:

· 3.1.1. As configurações de resolução de imagem devem estar ajustadas


para valor entre 200 e 400 dpi. Valores abaixo de 200 dpi comprometem a
qualidade da imagem obtida e valores superiores a 400 dpi produzem
imagens que vão ocupar espaço excessivo na mídia de armazenagem
eletrônica de dados, sem proporcionar ganho significativo de qualidade;
· 3.1.2. Será adotada a digitalização colorida apenas para os documentos
que utilizam cor como elemento gráfico necessário para compreensão de
seu conteúdo;
· 3.1.3. Após a digitalização de cada lote de documentos deverá ser
verificado se todos os documentos que compõem o lote foram, de fato,
digitalizados.

52
4. DO CONTROLE DE QUALIDADE DAS IMAGENS DIGITALIZADAS

4.1. Deverá ser realizado controle de qualidade rigoroso para garantir que as
imagens digitalizadas tenham qualidade aceitável, tanto para visualização pelo
monitor do computador, quanto para a impressão.

4.2. Nesta fase, o procedimento será:

· 4.2.1. Todas as imagens deverão ser analisadas por visualização no


monitor;
· 4.2.2. Pelo menos uma imagem de cada lote deve ser impressa para
análise;
· 4.2.3. A análise deverá levar em consideração o alinhamento da imagem, a
nitidez, a inexistência de cortes e a legibilidade do texto nela contido;
· 4.2.4. Caso alguma imagem do lote não seja aprovada no controle de
qualidade, deverá retornar para nova preparação ou nova digitalização,
conforme a natureza do problema identificado, devendo o arquivo digital da
imagem reprovada ser apagado do disco rígido do computador.

5. DA INDEXAÇÃO

5.1. A indexação possibilitará o acesso ao documento, constituindo-se,


portanto, em procedimento essencial para que um Sistema de Gerenciamento
Eletrônico de Imagens de Documentos possa atender plenamente as
necessidades de consulta ao seu banco de imagens.

5.2.Os índices deverão ser planejados para não comprometerem a


recuperação da informação desejada, de modo que, nesta fase, os parâmetros
dos índices, além da própria indexação em si, deverão ser definidos e
elaborados de acordo com o descrito a seguir:

· 5.2.1. Cada documento, individualmente, deverá ser indexado;


· 5.2.2. Serão utilizados como parâmetros de indexação obrigatórios para
todos os documentos: a menção à espécie ou ao tipo de documento (por
exemplo: acórdão, ficha financeira, cartão de ponto); o código de
classificação do documento; o ano do documento; o número do documento,
quando existir, e a dependência da qual o documento é originário;
· 5.2.3. O número do processo será parâmetro obrigatório para documentos
que resultaram de um processo judicial ou administrativo;
· 5.2.4. O nome do servidor será parâmetro obrigatório para documentos de
Recursos Humanos;
· 5.2.5. Outros parâmetros serão definidos com base nas informações
fornecidas para localização do documento em papel correspondente;
· 5.2.6 Será utilizado vocabulário próprio no procedimento de indexação dos
assuntos tratados no documento;
· 5.2.7. Os parâmetros de indexação obrigatórios deverão ser preenchidos
manualmente, sem a utilização de ferramentas de reconhecimento óptico
de caracteres (OCR);
53
6. DA GRAVAÇÃO DAS IMAGENS EM MÍDIA DE ARMAZENAGEM
PRÓPRIA

6.1. Todos os arquivos eletrônicos das imagens digitalizadas serão copiados do


disco rígido do computador e gravados para a mídia de armazenagem,
devendo ser observado:

· 6.1.1. Cada mídia deverá receber arquivos digitais correspondentes às


imagens de documentos que integram uma única série documental, não
podendo existir, em uma única mídia, dois ou mais tipos documentais
diferentes;
· 6.1.2. Todos os arquivos eletrônicos das imagens dos documentos contidos
na mídia deverão corresponder a um único algoritmo de compactação, não
podendo existir, em uma única mídia, dois ou mais formatos diferentes de
arquivo digital de imagem (por exemplo: TIFF e PDF);
· 6.1.3. Deverão ser geradas, em cada processo de gravação, duas mídias
de idêntico conteúdo;
· 6.1.4. Após o processo de gravação, as duas mídias de idêntico conteúdo
deverão receber um mesmo número de registro, que deverá obedecer a
uma numeração seqüencial única, que se iniciará com o número 1 (um). Tal
número será referenciado no livro de registro de mídias (vide item 1);
· 6.1.5. As duas mídias, de idêntico conteúdo, deverão se distinguir por meio
da adição, após o número de registro, da letra “A” em uma delas, e “B” na
outra, devendo, a primeira, ser considerada cópia de armazenagem, e a
segunda, cópia de trabalho;
· 6.1.6. Após numeradas, cada mídia deverá receber, adicionalmente, as
seguintes anotações:
- “TRE/SP”
- sigla da dependência responsável pela digitalização
- série documental e intervalo da série (por exemplo: “acórdãos, de
100.000 a 110.000”)
- datas-limites inicial e final dos documentos contidos na mídia (por
exemplo: “13/12/1985-19/09/1988”)
- data da gravação dos dados
- nome e assinatura do servidor responsável pela gerência do sistema;
· 6.1.7. Para melhor segurança contra riscos de danos nas mídias do tipo
CD-R, fica vedado o emprego de etiquetas auto-adesivas, devendo as
inscrições ser efetuadas com caneta ou impressora apropriadas;
· 6.1.8. Após a gravação e identificação das mídias, os arquivos eletrônicos
das imagens contidos no disco rígido deverão ser apagados, devendo
antes, ser transferidos para alimentar um banco de imagens a ser
disponibilizado para consulta via intranet ou internet, se for o caso;
· 6.1.9. Cópias adicionais poderão ser geradas, a pedido escrito e
devidamente fundamentado pela dependência solicitante, a partir das
mídias “A” (cópia de armazenagem) e “B” (cópia de trabalho), seguidos para
tanto os procedimentos de identificação acima descritos. As cópias deverão
se distinguir das demais por meio da adição de novas letras após o número
de registro, seguindo-se a ordem alfabética;
· 6.1.10. Em sistemas cujos arquivos digitais de imagem não sejam também
constituídos pelos seus índices correspondentes, os dados de indexação
54
deverão, obrigatoriamente, ser gravados na mídia, juntamente com os
arquivos de imagem a eles associados;
· 6.1.11. A destruição dos documentos em papel cujas imagens já tenham
sido devidamente gravadas em meio eletrônico e cuja temporalidade de
guarda não tenha sido definida como permanente, deverá seguir os
procedimentos de descarte já regulamentados.

7. DA EMISSÃO DIÁRIA DO RELATÓRIO DE DIGITALIZAÇÃO DE


DOCUMENTOS

7.1. Diariamente deverá ser emitido o “Relatório de digitalização de


documentos”, que conterá as seguintes informações referentes aos
documentos processados durante o dia:

· 7.1.1 data em que foram realizadas atividades de processamento eletrônico


de imagens de documentos;
· 7.1.2 identificação dos documentos preparados, nome e assinatura do
servidor responsável pela preparação;
· 7.1.3 identificação dos documentos digitalizados, nome e assinatura do
servidor responsável pela digitalização;
· 7.1.4 identificação dos documentos cujas imagens foram aprovadas no
controle de qualidade, nome e assinatura do servidor responsável pelo
controle de qualidade;
· 7.1.5 identificação dos documentos indexados, nome e assinatura do
servidor responsável pela indexação;
· 7.1.6 identificação dos documentos cujas imagens foram gravadas na mídia
de armazenagem, nome e assinatura do servidor responsável pela
gravação e
· 7.1.7 nome e assinatura do responsável pela dependência digitalizadora
dos documentos.

8. DA GUARDA E PRESERVAÇÃO DAS MÍDIAS

8.1. Após a gravação dos dados, as mídias “A” deverão ser mantidas em
ambiente apropriado para sua conservação e as mídias “B” e seguintes, se
houver, utilizadas para consulta, atentando-se para o seguinte:

· 8.1.1. O local deve ficar ao abrigo da luz, isento de umidade, livre de


temperaturas elevadas e livre de alterações bruscas de temperatura;
· 8.1.2.As condições climáticas para conservação de mídias ópticas terá
temperatura não superior a 20ºC e umidade relativa do ar não superior a
40%;
· 8.1.3. As mídias serão mantidas, quando não estiverem em uso, em seus
recipientes próprios;
· 8.1.4. As superfícies das mídias não serão tocadas durante o seu
manuseio, devendo, também, ser mantidas, a todo momento, livres de
contatos com outros objetos;

55
· 8.1.5. O acesso às mídias “A” será restrito ao responsável pela
dependência onde elas estiverem armazenadas.

9. DA EMISSÃO DE CÓPIAS EM PAPEL AUTENTICADAS DAS IMAGENS


DOS DOCUMENTOS

9.1. O carimbo de autenticação da reprodução em papel de uma imagem


eletrônica do sistema, quando requerida por algum interessado, deverá seguir
o modelo abaixo:

TRIBUNAL REGIONAL ELEITORAL DE SÃO PAULO

Certifico e dou fé que o presente documento é cópia autêntica do original


digitalizado e arquivado na mídia nº __________, nos termos da Portaria
nº 69/2006.
[assinatura do servidor]
[dependência], em ____/_____/_____ ___________________________
[identificação do servidor]

9.2. A autenticação via chancela mecânica deverá conter, no mínimo, as


seguintes informações: “TRE-SP”, “Cópia autêntica do original digitalizado e
arquivado na mídia nº ____, nos termos da Portaria nº 69/2006. Certifico e dou
fé”, identificação da dependência autenticadora, data e identificação do
servidor.

10. DA DESTRUIÇÃO DA MÍDIA APÓS ESGOTADA A TEMPORALIDADE


DE GUARDA DOS DOCUMENTOS NELA ARMAZENADOS.

10.1. A mídia, cujo conteúdo corresponder integralmente a imagens com


temporalidade de guarda vencida, deverá ser destruída por processo que
inviabilize a sua leitura.

10.2. Na hipótese do item anterior, deverão ser destruídas a cópia de


armazenagem, a cópia de trabalho e as demais cópias que tiverem sido
geradas a partir delas.

10.3. Serão aplicadas ao processo de descarte das mídias, contendo imagens


eletrônicas de documentos, as mesmas cautelas adotadas para o descarte de
documentos em papel.

10.4. O descarte da mídia deverá ser devidamente registrado no livro de


registro e controle de mídias (vide item 1.3).

56
O QUE HÁ PARA LER

Sobre Arquivologia e Gestão Documental:

BELLOTTO, Heloísa Liberalli. Arquivística: objetos, princípios e rumos. SP:


Associação de Arquivistas de São Paulo, 2002. 43p.

Idem. Arquivos permanentes: tratamento documental. 2ª ed. rev. e ampl. RJ:


Editora da FGV, 2004

Idem; CAMARGO, Ana Maria de Almeida. Dicionário de Terminologia


Arquivística. São Paulo:AAB-SP, Secretaria de Estado da Cultura, 1996.

BERNARDES, Ieda Pimenta. Como avaliar documentos de arquivo. São Paulo:


Arquivo do Estado, 1998. 38p.

FONSECA, Maria Odila. Arquivologia e ciência da informação. Rio de Janeiro:


Editora da FGV, 2005. 124p.

GONÇALVES. Como classificar e ordenar documentos de arquivo. São Paulo:


Arquivo do Estado, 1998, 38p.

PAES, Marilena Leite. Arquivo: teoria e prática. 3ª ed. rev. e ampl. RJ: Editora
FGV: 2004

PAZIN, Márcia. Arquivos de empresas: tipologia documental. SP: Asociação


de Arquivistas de São Paulo, 2005. 39p.

SCHELLENBERG, Theodore R. Arquivos modernos: princípios e técnicas. 2ª


ed. RJ: Editora FGV, 2002

Sobre prazos de guarda para documentos públicos:

CONARQ. CONSELHO NACIONAL DE ARQUIVOS. Resolução n° 14, de 24 de


outubro de 2001. Aprova a versão revista e ampliada da Resolução n° 4, de 28 de
março de 1996, que dispõe sobre o Código de Classificação de Documentos de
Arquivo para a Administração Pública: atividades-meio, a ser adotado como
modelo para os arquivos correntes dos órgãos e entidades integrantes do Sistema
Nacional de Arquivos (SINAR), e os prazos de guarda e a destinação de
documentos estabelecidos na Tabela Básica de Temporalidade e Destinação de
Documentos de arquivo Relativos as Atividades-Meio da Administração Pública.
Disponível em <http:www.arquivonacional.gov.br>

SAESP. SISTEMA DE ARQUIVOS DO ESTADO DE SÃO PAULO. Decreto n°


48.897, de 27 de agosto de 2004. Dispõe sobre os Arquivos Públicos, os
documentos de arquivo e sua gestão, os Planos de Classificação e a Tabela de
Temporalidade de Documentos da Administração Pública do Estado de São

32
Paulo, define normas para a avaliação, guarda e eliminação de documentos de
arquivo e dá providências correlatas. Disponível em <http:www.saesp.gov.br>

Sobre digitalização e documentos eletrônicos

BALDAM, Roquemar; VALLE, Rogério; CAVALCANTI, Marcos. GED:


Gerenciamento Eletrônico de Documentos. São Paulo, Editora Érica: 2002

SANTOS, Vanderlei Batista dos. Gestão de documentos eletrônicos: uma


visão arquivística. 2ª ed. rev. e ampl. Brasília: ABARQ, 2005.

RONDINELLI, Rosely Curi. Gerenciamento arquivístico de documentos


eletrônicos. Rio de Janeiro, Editora da FGV: 2002.

33