Beruflich Dokumente
Kultur Dokumente
ndice
1 Introduccin
2 Propiedades de la preservacin digital
3 Amenazas a la integridad de los documentos digitales
4 Polticas de preservacin digital
5 Estrategias de preservacin digital
5.1 Refresco
5.2 Metadatos
5.3 Preservacin de la tecnologa
5.4 Migracin
5.5 Emulacin
5.6 Replicado (copia de seguridad)
5.7 Arqueologa digital
5.8 Preservacin en lnea
5.9 Combinacin de estrategias
6 Implementacin
6.1 Conversin
6.2 Calidad
6.3 Tramitacin de la coleccin
6.4 Organizacin
6.5 Caracterizacin
6.6 Detalle
7 Modelo de referencia Open Archival Information System (OAIS)
7.1 Agencias aeroespaciales y preservacin digital
7.2 Definicin
7.3 Procesos
7.4 Metadatos
7.5 Metadatos de representacin y metadatos de preservacin
7.6 Objetivos
8 Aspectos legales de la preservacin
8.1 Derechos de propiedad intelectual afectados
8.2 Actividades de preservacin vs. derechos
8.3 Lmites a los derechos
8.4 Iniciativas favorables a la preservacin
8.5 Proteccin de las medidas tecnolgicas
9 Iniciativas y proyectos
10 Desarrollo de un programa de preservacin
10.1 Propuesta de un plan de preservacin combinando para ello varias estrategias
11 Trustworthy Digital Repositories
11.1 Atributos
11.2 Responsabilidades
11.3 Certificacin y auditora
12 Referencias
13 Bibliografa
14 Vase tambin
Introduccin
La primera evidencia conocida es de escritura signos pictricos sobre tablillas de arcilla secadas al sol data
de aproximadamente seis mil aos atrs. Desde la antigedad hasta el presente, la escritura ha experimentado
una evolucin sostenida, dando origen a una de las paradojas ms grandes de la historia: nuestra capacidad de
registrar informacin ha aumentado exponencialmente con el tiempo, mientras que la longevidad de los
medios utilizados para almacenarla ha disminuido de manera equivalente. As, an son legibles los fragmentos
de papiro de escritura egipcia de hace 4.500 aos o manuscritos y otros documentos de la poca medieval,
pero la durabilidad del moderno papel es bastante menor. El primer desafo mundial en tema de preservacin
documental surge por la extraordinaria fragilidad de los libros impresos a partir de la segunda mitad del siglo
XIX, a causa del elevado grado de degradacin del papel fabricado con madera, llamado tambin papel
friable. Este problema se dio a conocer a mediados del siglo XX y recibi el nombre de "fuego lento" -slow
fire-, porque era tan letal para los libros como los incendios, pero a un ritmo ms lento. La leccin no fue
aprendida, y durante el siglo XX continan decayendo la permanencia, durabilidad y resistencia de los nuevos
medios de registro, como por ejemplo el de una cinta magntica, que puede quedar ilegle slo treinta aos
despus de su fabricacin. El medio de registro ms reciente el disco ptico puede alcanzar una vida ms
prolongada, sin embargo, esto tampoco garantiza su perdurabilidad, y es que es probable que los actuales
medios pticos de almacenamiento superen ampliamente la vida til del sistema informtico que lo cre.
De lo anterior podemos concluir que nos encontramos ante un nuevo paradigma en preservacin:
tradicionalmente, la conservacin del documento fsico equivala a la conservacin de la informacin que
contena, y por tanto, garantizaba su usabilidad, sin embargo en los documentos digitales preservar el soporte
es condicin necesaria, pero no suficiente: hay que considerar otras cuestiones, tanto de conservacin como de
usabilidad: La fiabilidad e integridad de la informacin, ya que la grabacin de datos digitales no se hace en
un soporte fijo y los datos se pueden reproducir, alterar o borrar con gran facilidad; la obsolescencia de los
soportes digitales, que han de ser renovados con cierta frecuencia; la necesidad del entorno informtico
original u otro que pueda interpretar la cadena de bits que contiene la informacin; y la necesidad de que los
usuarios sepan utilizarlo.
Esto ocurre con gran parte de los contenidos que se producen en el mundo, y que pueden ser desde
composiciones artsticas hasta datos personales, pasando por los resultados de la actividad de organismos
pblicos y privados o pensamientos y sentimientos de seres humanos. Muchos de ellos tienen un inters
histrico, cientfico o cultural y conviene conservarlos para que sean conocidos y utilizados por nosotros y por
las generaciones que nos sucedan, ahora bien, la extensa variedad de formatos - texto, bases de datos,
grabaciones sonoras, pelculas, imgenes,... - la volatilidad, la obsolescencia tcnica, el deterioro fsico y la
inestabilidad de Internet, entre otras muchas causas, constituyen un gran riesgo para este conocimiento
acumulado, poniendo de manifiesto la necesidad de llevar a cabo una actividad de preservacin responsable
por parte las instituciones. Para los organismos que tienen a su cargo el acopio y la preservacin del
patrimonio digital cultural, se ha convertido en un problema apremiante definir qu elementos deben
conservarse para las generaciones futuras y cmo proceder en su seleccin y conservacin.2 La necesidad de
salvaguardar esta forma relativamente nueva de patrimonio documental requiere un consenso internacional
sobre su acopio, preservacin y difusin, y as algunas instituciones inician proyectos, elaboran normativas o
crean directrices que sientan las bases para que esta nueva forma de patrimonio no desaparezca en silencio.
Algunos ejemplos de ello son los proyectos NEDLIB,3 DigiCult,4 PADI,5 Kulturarw3,6 o Patrimonio.es;7
la resolucin 2002/C 162/02 del Consejo de Europa: Conservar la memoria del maana;8 o la Carta sobre la
preservacin del patrimonio digital de la UNESCO9
Propiedades de la preservacin digital
Para conservar los objetos digitales es necesario que su comprensin y gestin se realice desde su
singularidad, que combina el fenmeno fsico con las codificaciones lgicas. Por ello, a la hora de la
preservacin digital vamos a encontrar puntos comunes con su hermana la preservacin analgica, pero
tambin caractersticas propias derivadas de su naturaleza:
Se trata de una serie de actividades encaminadas a un mismo fin, y no slo de tcnicas aisladas, es
decir, no vale de nada conservar un fichero si no se garantiza que luego se pueda acceder a l para
utilizarlo. Por ello, hay que llevar a cabo tareas que comprenden adems de los procedimientoss
tcnicos la planificacin y la gestin de los recursos
Su finalidad es la futura utilizacin de los documentos. La garanta del futuro uso del recurso digital
representa un reto mayor que solamente mantener la cadena de bits.
Se pretende preservar la informacin en vez del documento fsico: La preservacin a largo plazo
implica la provisin de acceso indefinido a los documentos o, como mnimo, al contenido de stos",10
aunque numerosos expertos recomiendan que se mantenga tambin la cadena de bits original.
Voluntad de mantenimiento a largo plazo, mediante nuevas operaciones de tratamiento si stas fueran
necesarias en el futuro. Un informe sobre las necesidades de preservacin digital en el Reino Unido
define "largo plazo" aplicado a documentos digitales como un periodo de ms de veinte aos.11
La obsolescencia tecnolgica: Debido a la rpida evolucin tecnolgica los recursos digitales pueden
quedar "hurfanos", es decir, inutilizables por falta de todos o alguno de los elementos informticos
hardware, software o soportes fsicos - de su entorno original. Este concepto no significa que dichos
elementos hayan dejado de funcionar, sino que ya no se puede acceder a ellos e interpretarlos o hacerlos
funcionar. Un claro ejemplo lo constituye la desaparicin de los disquetes de tres pulgadas y media. En
la actualidad ningn fabricante de ordenadores proporciona de serie un dispositivo capaz de leer y de
escribir en dichos discos; y aunque an es posible solicitar una disquetera externa a algunos fabricantes,
es un artculo difcil de encontrar, y cada vez lo ser ms. Por ello, se hace necesario la migracin de los
datos a otros soportes tecnolgicos actuales.
La degradacin de los soportes. La "fragilidad" o inestabilidad del soporte, debida tanto a factores
internos como a factores externos, pueden conducir, tarde o temprano, a la prdida de la informacin
grabada en l. Los factores internos se asocian a la propia composicin de los materiales de los
soportes pticos o magnticos. Estos soportes envejecen y se deterioran, perdindose informacin o
producindose errores de lectura. Entre los factores externos que pueden afectar a la degradacin de los
soportes, destacar las fluctuaciones elevadas de temperatura y de humedad. Para ayudar a comprender
como puede llegar a perjudicar a la esperanza de vida de los soportes pticos y magnticos, se adjunta la
siguiente tabla que refleja la degradacin del soporte como consecuencia del incremento de temperatura
y de humedad relativa (Jones y Beagrie, 2001, pg.130):12
Soporte / Hum. rel. 25 h. r. 30 h. r. 40 h. r. 50 h. r. 50 h. r.
Soporte / Temp. 10 C 15 C 20 C 25 C 28 C
Adems la IFLA proporciona unas recomendaciones generales y particulares para facilitar la conservacin y el
manejo de los diferentes soportes para su conservacin, que se muestran en la siguiente tabla simplificada:
- Discos pticos - Limpiar con pistola de aire o en su defecto, con un papel de tis no abrasivo
Datos fcilmente alterados o destruidos. Debido a errores humanos, al mal funcionamiento de los
sistemas o a acciones mal intencionadas, los datos pueden ser eliminados o falseados. Adems, tambin
existe el riesgo de que la informacin se pierda debido a la falta de control de las versiones de un
recurso.13
Cmo debemos preservar el documento? Debemos decidir entre preservar esencialmente el contenido,
incluso mejorar la legibilidad o utilidad mediante las tecnologas disponibles en el momento de su
recuperacin o mantener el aspecto y comportamiento original, con las limitaciones que esto pueda
representar.15
Qu recursos debemos preservar? En primer lugar deberemos tener en cuenta la obligacin legal, y
despus consideraciones como el valor intrnseco del material, si el material se ajusta a la poltica de
seleccin, si otra institucin ha asumido ya la responsabilidad, su estado fsico, el uso actual y potencial, la
relacin coste-efectidad del tratamiento, etc. En general se prioriza en este orden: 1. Documentos nacidos
digitales. 2. Documentos digitalizados sin versin analgica. 3. Documentos digitalizados con versin
analgica.
Cundo hay que iniciar el tratamiento? Cuanto antes mejor. El abandono benigno en los documentos
analgicos poda no ser excesivamente daino, pero en los digitales es letal. Son necesarias soluciones
preventivas que detecten la amenaza antes de que el dao se haya producido y vigilancia continuada tanto en
el documento como en los metadatos. Se recomienda tener en cuenta la preservacin desde el mismo momento
de la creacin del documento, mediante una adecuada seleccin de los formatos, soportes y metadatos.
Para garantizar el xito de los esfuerzos de la preservacin digital se requerir un nivel ms elevado de
implicacin institucional que suele matizarse en los dos conceptos siguientes:
Cabe recordar que actualmente los factores institucionales, no los tecnolgicos, se consideran el principal
obstculo para el avance de la preservacin digital.
Refresco
Es la transferencia de los datos de un soporte a otro nuevo para reducir el riesgo de la prdida de datos debida
a la degradacin lgica por el uso y el paso del tiempo. Se efecta sin producir cambio alguno en el software o
el formato, es decir, no es una solucin contra la obsolescencia tecnolgica, ya que el continente se renueva
sin alterar el contenido, aunque en ocasiones el refresco coincide con un cambio generacional del soporte,
como cuando se pasa informacin de cintas o discos originales a modelos actuales. La frecuencia con la que se
realiza el refresco vara segn la poltica institucional y el tipo de soporte, pero siempre debera realizarse
dentro del plazo recomendado por el fabricante.
Metadatos
Se pueden crear los metadatos durante la produccin de los documentos o simplemente crear unos bsicos con
la posibilidad de ampliarlos. Existen dos tipos de metadatos:
De conservacin (describen como acceder a los datos) con dos tipos de informacin necesaria:
De contenido: detalles sobre como representar el formato del documento (estos metadatos de representacin
cambian y se actualizan).
Migracin
Es la estrategia ms utilizada hoy en da. Este mtodo consiste en convertir los documentos almacenados a
nuevos formatos con el fin de no perder la informacin que contienen. Mediante este proceso se mantienen las
caractersticas esenciales de los datos, aunque se pueden producir pequeos cambios que con el paso del
tiempo y la acumulacin de migraciones pueden verse amplificados. Por so, se convierte en un proceso poco
fiable si se utilizaron componentes muy especficos de software, lo que conlleva una incompatibilidad entre
sistemas. La migracin tambin puede utilizarse en la extensin o formato de los documentos, por ejemplo,
trasladar un documento en formato Microsoft Word 95 a uno Microsoft Word 97/2000/XP, para aumentar su
funcionalidad.
Migracin sobre la demanda: se trata de separar el cdigo binario de su entorno y soporte original en el
momento en el que se deposite el recurso. Junto con esta cadena de bits, se guardan los metadatos tcnicos que
especifican cmo debe migrarse a otros entornos. De ese modo el centro evita tener que realizar migraciones
peridicas de toda la coleccin para poder concentrar los esfuerzos y recursos en los documentos con una
demanda constatada. Aunque mediante este mtodo se ahorran los esfuerzos de las migraciones peridicas, al
mismo tiempo se requiere mayor dedicacin en la presentacin y la actualizacin de los metadatos tcnicos
que han de ser modificados paralelamente a la evolucin de la tecnologa (Cedars guide to digital
preservation..., 2002).[1] (http://web.archive.org/web/http://www.leeds.ac.uk/cedars/guideto/dpstrategies)
Migracin a un formato estndar: se refiere a la migracin del documento original a un formato neutral o
estandarizado, con una mayor duracin prevista. Por ejemplo, muchos centros pasan los documentos textuales
de diferentes formatos a XML, PDF u otros formatos abiertos. Por esta razn y por contar, como
consecuencia, con un mayor nmero de usuarios, se prev que estos formatos tendrn una vida ms larga que
un formato propietario.
En una medida parecida, algunos depsitos slo admiten determinados formatos. De esta manera, los
depsitos pueden centrar sus esfuerzos y recursos en la gestin del fondo digital en vez de desperdigarlos en
procesar unos formatos minoritarios. Algunas instituciones incentivan o incluso obligan a los autores a utilizar
formatos estndares para la creacin de documentos. En cambio, otras asumen la responsabilidad de convertir
el fichero a un formato estandarizado en el momento de ingresar el documento.
Migracin sucesiva o conversin en serie: mediante esta tcnica (conocida en ingls como serial conversion
y tambin Backward compatibility) se actualizan los documentos con cada cambio incremental del software,
sea necesario o no la operacin interna. Es obvio que cuando se introducen nuevas versiones de software es
justamente cuando existe mayor motivo por parte de los fabricantes para facilitar la conversin. De esta
manera, se corre el riesgo de perder la oportunidad cuando el formato est a punto de desaparecer y existan
menos facilidades para realizar la migracin.
La migracin tiene varios inconvenientes, entre los ms importantes destacan los siguientes:
No se puede evitar la alteracin del documento original. Esta alteracin puede afectar a la estructura, al
contenido, a la apariencia y a la funcionalidad en mayor o menor grado. Por la inevitabilidad de algunas
alteraciones, los procesos seguidos durante la migracin han de ser documentados mediante los
metadatos tcnicos, igual que cualquier efecto que hayan producido en el documento. De este modo los
futuros usuarios sabrn qu diferencias existen entre el documento original y la versin recuperada.
No es muy adecuado para los objetos digitales que contienen una variedad de formatos, ya que cada uno
de stos necesitar recibir un tratamiento diferente, lo que hace muy difcil la automatizacin del
proceso. Actualmente la catalogacin tradicional no capta con exactitud la presencia de los diferentes
elementos incorporados en el documento, lo que dificulta an ms la migracin de cada formato en el
momento oportuno.
Emulacin
La emulacin permite simular el comportamiento del software original con el que se crearon los documentos
digitales, de forma que puedan ejecutarse y utilizarse pudiendo prescindir del programa de origen. Los
partidarios de la emulacin creen que esta estrategia ofrece la mejor solucin para preservar recursos digitales
ms complejos, ya que es la nica que garantiza la recuperacin del documento original sin las inevitables
alteraciones que ocurren en la migracin. Jeff Rothenberg, el principal defensor de esta estrategia,
argumentaba que la emulacin era la nica manera capaz al menos en teora de garantizar la conservacin
de los datos junto con sus elementos esenciales, en lo que se refiere tanto a su apariencia como a su
funcionalidad "de manera coherente, automtica y homologable para diferentes tipos de documentos"18 El
problema es que este proceso requiere el mantenimiento de una cantidad de informacin considerable -
emulador, SO, aplicacin y datos - y por otro lado conservar los emuladores de cada software no tiene sentido,
ya que tambin se quedaran obsoletos. Adems, diferencia de la migracin, la emulacin no est tan
experimentada y requiere unos conocimientos informticos muy avanzados.
Preservacin en lnea
Algunos expertos proponen esta opcin frente al almacenamiento de la informacin en soportes fsicos por el
coste de los dispositivos de almacenamiento en lnea, bastante menor, y por la utilizacin de formatos como el
HTML y el XML, que se prevn ms duraderos que los formatos de programas de propiedad, y adems se
actualizan sobre la marcha de manera natural. Sus inconvenientes seran que no se elimina la necesidad de
realizar migraciones, slo se aplaza, y tampoco se evita el riesgo de destruccin fsica de un archivo
almacenado en un nico servidor.
Combinacin de estrategias
Comnmente, pueden ser necesarias varias estrategias para abarcar toda la variedad de objetos y
caractersticas que se deben preservar. Adems, los programas de preservacin deben considerar asimismo las
posibles ventajas de la redundancia y aplicar ms de un tipo de actuacin, ya que una sola estrategia, aunque
est bien planificada, puede fallar y dejar el documento inservible. As, por ejemplo, es conveniente considerar
que un documento puede contener tanto texto como imgenes, objetos multimedia, etc. y ocuparse de los
problemas de obsolescencia de cada elemento por separado, sin olvidarse, por otro lado, del deterioro de los
soportes.19
Implementacin
Los documentos o imgenes digitales estn formados por un conjunto de pxeles distribuidos en un nmero
predefinido de filas y de columnas. Los archivos se transforman en mapas de bits mediante dispositivos
electrnicos como escneres o cmaras. En la transformacin se adquiere una cierta resolucin y
posteriormente los datos se encapsulan en un formato de almacenamiento. Todo esto hace que haya ciertos
aspectos a tener en cuenta cuando ejecutamos un sistema de preservacin digital.
Conversin
Los programas de digitalizacin capturan y presentan el formato digitalizado de todo el contenido del archivo
transformado, de forma que quede concatenado en un solo documento o en una pequea coleccin. Para
determinar cuales son las partes importantes del documento se suele comparar la imagen o imgenes digitales
con la original teniendo en cuenta la calidad, resolucin con la que se transform el documento, etc. Todo esto
para determinar cual ser la mejor forma de realizar la conversin, de la informacin que tenemos en soporte
papel a digital, para su almacenamiento
Calidad
Para garantizar que los datos digitales tienen la mxima similitud, sobre todo en rasgos importantes, con el
documento original es imprescindible llevar un buen control de la calidad, para minimizar los errores (que
podran acumularse por diversas transformaciones sucesivas). No existe ninguna norma que estandarice este
control de la calidad, ya que cada documento, requiere un trato distinto fundamentado en sus caractersticas
ms bsicas.
Tramitacin de la coleccin
La permanencia a lo largo del tiempo de una coleccin digital no solo depende de factores de calidad o de
conversin, sino tambin de una buena gestin, por lo que se refiere, al almacenamiento acorado de los
documentos o datos escaneados, mediante organizacin (ya sea por tamao, nombre, etc.), nominacin
adecuada y una buena descripcin de los datos. Para hacer una buena tramitacin es preciso identificar cada
uno de los archivos como nico dentro del conjunto, acompandolo de una buena descripcin y si es preciso,
por el uso de metadatos.
Organizacin
Previamente a la nominacin y descripcin de los documentos es necesario definir como van a ser
almacenados. El mtodo ms habitual es organizar los datos tal y como lo hara la misma computadora, por lo
que se tiene que tener en cuenta el avance tecnolgico para evitar incompatibilidades entre mquinas,
asegurando que la coleccin pueda preservarse y asimismo, crecer.
Caracterizacin
Los ordenadores no son capaces de relacionar documentos por su contenido, es decir, no son capaces de
identificar que rasgos son comunes entre dos o ms archivos. Hay dos modos de caracterizar o identificar las
imgenes:
Para establecer la identificacin de los documentos se adopta uno de los criterios, teniendo en cuenta que el
elegido deber utilizarse a lo largo de toda la coleccin sin posibilidad de cambio.
Detalle
Para llevar a cabo la descripcin de cada documento es necesario el uso de los metadatos para facilitar la
tramitacin de la coleccin y el uso de los datos que esta contiene. Hay proyectos actuales que distinguen
hasta tres categoras o tipos de metadatos:
Segn el proyecto o coleccin que llevemos a cabo utilizaremos un tipo de metadatos u otro.
Fue desarrollado originalmente por la NASA con la ayuda de otras agencias aeroespaciales ante la
preocupacin por la conservacin de sus archivos digitales.21 En enero de 2002 se publica como estndar del
Consultative Committee for Space Data Systems CCSDS 650.0-B-1 y, finalmente, al ao siguiente el modelo
termin convirtindose en la norma internacional ISO 14721:2003 (http://www.iso.org/iso/catalogue_detail?cs
number=24683) Open Archival Information System (OAIS), actualmente existe una norma revisada y
actualizada, la ISO 14721:2012 (http://www.iso.org/iso/catalogue_detail?csnumber=57284)
El modelo de referencia OAIS persigue una doble finalidad, conservar la informacin y facilitar a la
comunidad el acceso futuro a la misma. Esta doble finalidad responde al hecho de que los soportes en los que
se almacena la informacin digital tienen una vida muy corta y la informacin debe sobrevivir migrando a
otros soportes o a otros entornos de software para que el acceso a la misma sea posible22
Definicin
OAIS no muestra el diseo concreto de un programa, ms bien ofrece una serie de pistas que sirven para
estandarizar la forma en que los materiales a preservar deben ser gestionados, desde su ingreso hasta el acceso
pblico. Estas pistas deben ser adaptadas por cada institucin a sus propias necesidades.23
Es un modelo de referencia que pretende reducir los malentendidos, y segn la propia definicin del protocolo
OAIS, un modelo de referencia es:24 Un marco para la comprensin de las relaciones importantes entre las
entidades de un mismo entorno y para el desarrollo de los estndares o especificaciones bsicas que apoyan
ese entorno. Un modelo de referencia se basa en un pequeo nmero de conceptos unificadores y puede ser
utilizado como base para la educacin y para explicar los estndares a alguien no especialista25
- SIP (Submission information package): Es el paquete tal como llega al depsito procedente de los
productores, junto con sus metadatos, para ser incorporado al OAIS.
- AIP (Archival information package): Al SIP se le aade, como mnimo, la informacin necesaria para su
gestin y preservacin a largo plazo.
- DIP (Disemination information package): El paquete de informacin tal como se entrega al consumidor y
contiene la informacin necesaria para que el consumidor pueda utilizarlo
Procesos
Segn el modelo OAIS, un archivo digital debe componerse de seis procesos bsicos,23 que podemos ver
reflejados en el siguiente grfico:
Almacenamiento/Almacn del archivo (archival storage): En este proceso, los ficheros de datos son
almacenados en un soporte fsico y se proporcionan los servicios necesarios para el almacenamiento,
mantenimiento y recuperacin.
Gestin/Administracin de datos (data Management): Se gestionan los metadatos de los ficheros: los
originales, que formaban parte del IP, los que fueron creados en el proceso de ingesta y todos aquellos
que se generen a lo largo de la vida de los ficheros.
Planificacin para la preservacin (preservation planning):En este proceso se deciden las polticas que
se van a aplicar, se monitorea el entorno y se sigue una vigilancia tecnolgica para detectar cuando un
formato se vuelve obsoleto y proceder a la migracin a un nuevo formato. La finalidad es asegurar que
la informacin permanezca disponible en el futuro.
Metadatos
Para poder realizar la preservacin de forma efectiva, OAIS reconoce dos tipos de metadatos:
RI (Representation information): es la informacin necesaria para interpretar los datos tcnicos del
paquete de informacin y es lo que permitir convertirlo a otros formatos y hacerlo recuperable28
PDI(Preservation description information): Esta informacin ser la que posibilite la interpretacin
descriptiva que permita identificar y recuperar el contenido de la informacin durante un largo periodo
de tiempo. Incluye datos referentes a los derechos de autor, restricciones de uso etc.29
Dublin Core: es un sistema de descripcin de recursos de informacin. Este estndar (ISO 15836:2003)
se caracteriza por ser un sistema general, independiente, extensible y econmico. Est formado por 15
elementos que se clasifican en tres grupos: Descripcin del recurso: datos sobre las caractersticas
bibliogrficas del recurso, Propiedad intelectual: autor, editor de la obra e Instancia: fecha de
creacin, formato, tipo e idientificador (URL, DOI, ISBN). Todos los elementos son repetibles y
opcionales y van precedidos de los caracteres DC. Existe un Dublin Core Simple y Dublin Core
Calificado. Este segundo esquema es una ampliacin del DC Simple y determina el significado de cada
uno de los 15 elementos iniciales aadindole calificadores. Se pretende mitigar la generalidad de las
propiedades principales del sistema para describir cualquier tipo de recurso electrnico.
Marcxml:30 es la codificacin de los registros MARC en XML para facilitar la captura e integracin de
estos registros en los procesos de recopilacin propios de desarrollos OAI e incluir metadatos MARC en
el texto completo de documentos codificados en XML.
MODS:31 sistema XML para codificar metadatos e informacin bibliogrfica. Basado en el MARC21
consta de 20 elementos principales que se subdividen en elementos ms especficos para una
estructuracin del contenido ms precisa. Son etiquetas alfanumricas que posibilitan una descripcin
ms detallada que el sistema Dublin Core pero menos compleja que el MARC.
METS:32 sistema que codifica en formato electrnico el propio objeto digital. Adems de contener los
metadatos descriptivos aade metadatos administrativos y de gestin. Los mets son documentos XML
que recogen la estructura de un objeto digital formado por varios archivos en distinto formato y la forma
en la que se organizan estos archivos en el documento digital.
El sistema de metadatos de preservacin de objetos digitales (PDI) que destaca en el panorama bibliotecario
es:
Este sistema divide los metadatos en cinco categoras: Entidad intelectual: detalla la tipologa documental
del objeto digital. Objeto: formato electrnico de la entidad intelectual. Se clasifican en cuatro tipos:
bitstream, secuencia de bites; file, archivos; filestream, tipo de archivo (comprimidos, encriptados);
representation, conjunto de archivos que representan al documento. Eventos: los distintos procesos que se
llevan a cabo en un documento digital para su preservacin (registro, almacenamiento, migracin, etc.).
Agentes: personas, instituciones o aplicaciones informticas relacionadas con un evento. Derechos: permiso
del autor de la obra para ejecutar las tareas que conlleva la preservacin digital.
Objetivos
La implantacin del modelo de referencia OAIS persigue los siguientes fines:
Recibir informacin proveniente de organismos productores y que cumpla las condiciones establecidas
para su incorporacin al archivo.
Fijar los criterios de seleccin de los contenidos que van a ser preservados, respetando los derechos de
autor y favoreciendo el depsito de los materiales por parte de los productores.
Permitir el acceso pblico a la informacin que se preserva.
Asegurar la comprensin de la informacin almacenada y preservada, por parte de los potenciales
destinatarios de la misma, sin que stos necesiten de ningn soporte para ello.
Establecer procesos y polticas concretas que garanticen la preservacin de los documentos frente a
riesgos eventuales y la difusin de copias legales y autnticas de los mismos.
Los derechos de explotacin o derechos econmicos pueden ser cedidos, pagando o de manera gratuita, y
habitualmente lo son, a travs de los contratos de edicin. Equivalen al copyright, derecho caracterstico de la
tradicin anglosajona.
Por lo que respecta concretamente a la preservacin, la ley dice en su artculo 37, que se permite la
reproduccin de obras, sin nimo lucrativo y con fines exclusivos de investigacin o conservacin, por
parte de bibliotecas, museos, fonotecas, filmotecas o archivos pblicos o que pertenezcan a entidades
culturales o cientficas. Al mismo tiempo se permite, sin necesidad de consentimiento del autor, la
comunicacin y puesta a disposicin pblica de obras, con fines de investigacin, por parte de los
establecimientos citados antes, adems de por centros integrantes del sistema educativo espaol, mediante
red interna y a travs de terminales localizados en dichos establecimientos.
Creative Commons. Son licencias que permiten el uso legal de una obra, garantizando la autora. Se clasifican
en cuatro tipos, combinables entre s: Reconocimiento (By) del autor; No Comercial (NC), se permite
cualquier uso, salvo la explotacin comercial; Sin obra derivada (ND, Non derivative), prohbe la
modificacin o reutilizacin de parte de la obra, para la creacin de otra; Compartir igual (SA, Same as),
obliga a publicar bajo la misma licencia, cualquier obra derivada.
Copyleft. Licencias que en contraposicin al copyright, permiten la modificacin y distribucin de una obra,
pero siempre respetando aquellos derechos que el autor no quiera ceder. Favorece el trabajo en colaboracin.
Este punto puede llegar a representar un grave riesgo de cara a la preservacin, ya que si no se pueden utilizar
legalmente mecanismos para suprimir las medidas tecnolgicas de proteccin, ser imposible, a largo plazo,
acceder a muchas obras porque habrn desaparecido los cdigos de paso de la proteccin o del organismo o el
mecanismo de autorizacin, o simplemente por la imposibilidad de hacer una copia de refresco debido a que
sta saldr con una degradacin sustancial respecto al original a causa de las medidas de proteccin
integradas.
El otro punto que se debe considerar es que los derechos de explotacin son temporales y cuando la obra pase
a dominio pblico debe poder ser utilizada sin obstculos. Si las medidas de proteccin no se pueden suprimir
en el momento en el que obra pasa a dominio pblico, se puede decir que este artculo de la legislacin
referente al dominio pblico ha quedado, en buena parte, liquidado en lo que respecta a la produccin digital.
De igual modo, quedan seriamente reducidos los lmites y las excepciones permitidas en el contexto impreso,
tales como las reproducciones para uso privado, para uso de discapacitados, y para investigacin o
conservacin en determinadas instituciones; con la irona de estar pagando cnones sobre soportes que
despus las medidas tecnolgicas de proteccin de los derechos no dejan utilizar para las actividades en
concepto de las cuales se aplican estos cnones.
Iniciativas y proyectos
PREMIS working group (OCLC): [2] (http://web.archive.org/web/http://www.oclc.org/research/projects/pmw
g/)
El objetivo de un proyecto ideal de preservacin de documentos digitales abarca la aplicacin universal a todo
tipo de documentos y medios digitales capaz de facilitar la gestin de documentos mediante la utilizacin de
etiquetas manteniendo la funcionalidad, el formato y funcionamiento del documento original.
La estrategia de la preservacin viene dada por diferentes aspectos como la legalidad, la economa y los
requisitos de uso. Los tipos de estratgicas en el programa de preservacin son:
1. Migracin
2. Emulacin
1. Impresin en papel
2. Sistema hbrido: Combinacin de digitalizacin y microfilmacin
3. Conservacin de los contenidos de la red
Tiempo 0
Se toman medidas concretas que aunque sean pequeas preservan y protegen el flujo de datos de nuestros documentos digital
Si se parte que tenemos una institucin con documentos en Word (versin 6) almacenados en disquetes de 51/4
ya obsoletos el primer paso ser el cambio de soporte a otro ms actual mediante la migracin.
Tiempo 1
Los discos 5 han sido sustituidos por disquetes 31/2 que empiezan a deteriorarse con el tiempo.
Las mquinas lectoras se encuentran en buenas condiciones y como estrategia bsica se recomienda la
preservacin tecnolgica ya que permite visualizar los documentos digitales en su equipo original y mediante
su programa original.
La institucin debe optar por actualizar el soporte, renovar los discos y conservar los parmetros de humedad y termperat
Tiempo 2
En el momento que los disquetes 31/2 caen en desuso la institucin inicia la migracin del medio y realiza la transferenci
La lectura de los documentos en Word 6 tendrn que migrarse a un nuevo formato, para ello la mayora de la plantilla debe
Se elige el formato para almacenar los datos, la mayora se eligen en formato TIFF (formato de fichero de
imagen con etiquetas)por ser un formato muy utilizado o PDF si se trata de textos.
Tiempo 3
Los cambios tan radicales que empiezan a experimentar las apliaciones y los sistemas operativos son una
amenaza para el acceso a la informacin de los documentos en formato Word 6 entonces la institucin realiza
las siguientes actividades:
Imprime los documentos que contienen nicamente texto y que son de suma importancia para la
organizacin.
Genera un emulador capaz de mantener las aplicaciones originales del documento digital y soluciona
la obsolescencia informtica.
Migra los datos de los documentos mayoritariamente consultados al formato ms actual del procesador
de textos.
Guarda la informacin en medios y soportes de iguales caractersticas atendiendo a estrategias
consensuadas de forma internacional.
Asocia el mayor nmero de metadatos posibles a cada documento.
Tiempo 4
Es la fase en la que la institucin documenta las incidencias y la toma de decisin adoptadas durante las diferentes fase
Aceptar la responsabilidad del mantenimiento a largo plazo de los recursos digitales en nombre de sus
depositarios y en beneficio de sus usuarios, presentes o futuros
Tener un sistema organizativo que apoyara la viabilidad a largo plazo del repositorio institucional y de
la informacin digital alojada en ella.
Demostrar responsabilidad y sostenibilidad econmica.
Disear su sistema de acuerdo con los estndares y convenciones ms comnmente aceptados con el fin
de asegurar el mantenimiento continuo, el acceso y la seguridad de los objetos digitales almacenados en
ellos.
Establecer metodologas de evaluacin de los sistemas que satisfagan las demandas de fiabilidad de la
comunidad.
Desarrollar polticas, prcticas y actuaciones que puedan ser medidas y auditadas.
El informe finalizaba con una serie de recomendaciones a la RLG, la OCLC y otras organizaciones entre las
que destacaban:
Atributos
Un Trusted digital repository debe desarrollar:
El cumplimiento del estndar OAIS (Reference Model for an Open Archival Information System), ya
que proporciona un marco comn para la descripcin y comparacin de arquitecturas y operaciones de
archivos digitales.
Responsabilidad administrativa, para la consecucin de estndares nacionales y/o internacionales para el
desarrollo fsico, apoyo y recuperacin de procedimientos y sistemas de seguridad.
Viabilidad organizacional, con el fin de reflejar un compromiso a largo plazo del mantenimiento,
almacenamiento y acceso a largo plazo en beneficio de depositarios y usuarios.
Sostenibilidad financiera que respalde el proyecto
La adecuacin tecnolgica y procedimental, que afectan a las estrategias, al equipo informtico, la
implementacin, etc.
Un sistema de seguridad, con sistemas de autenticacin, recuperacin y cortafuegos.
Transparencia de los procedimientos, con documentacin, mecanismos de monitorizacin, etc.
Responsabilidades
responsabilidad profesional y organizacional de alto nivel: atendiendo a 3 niveles bsicos como el
entendimiento de sus propios requerimientos locales, la comparticin de responsabilidades a travs de
acuerdos entre consorcios, comunidades y la identificacin y comprensin del funcionamiento de las
responsabilidades a compartir. Factores a tener en cuenta seran: el alcance de las colecciones, la gestin
de la preservacin y su ciclo de vida, el amplio rango de interesados, la propiedad del material y otros
temas legales y los costes implcitos.
infraestructura organizacional
gestin del objeto digital
gestin de la infraestructura y de la seguridad
Para la elaboracin de este documento se tuvo en cuenta la aportacin de varios estndares, destacando entre
ellos la norma ISO 14721:2003[17] (http://www.iso.org/iso/catalogue_detail.htm?csnumber=24683) The Open
Archival Information System Reference Model.
Sostenibilidad financiera. Debern tener planes a corto y largo plazo que sostengan el plan de
preservacin, que den ser transparentes y acordes con la prctica. Deben analizar e informar acerca de
riesgos financieros, inversiones, beneficios y costos.
gestin del riesgo de la infraestructura tcnica. Debe identificarse y controlarse los riesgos en las
operaciones de preservacin y objetivos asociados con la infraestructura tcnica, mediante el empleo de
tecnologa que vigile y monitorice los sistemas, que avisen de los cambios a realizar tanto en hardware
como en software, los cuales deben ser los apropiados en todo momento y deben garantizar el backup y
detectar prdidas o corrupcin de datos, que en caso de ocurrir, se documentar tanto el problema como
los pasos para la resolucin. Deben tener definidos los procesos de almacenamiento y los cambios en el
software (refresco, migracin, etc) y llevar el control del nmero y localizacin de las copias de todos
los objetos digitales.
gestin del riesgo de seguridad. Debe mantener un anlisis sistemtico de factores de riesgos de
seguridad asociados con los datos, sistemas, personal e instalacin fsica.
Referencias
1. Biblioteca de Catalua: http://www.bnc.cat/esl/Profesionales/Preservacion-digital2 (Fecha de consulta: l9/03/14)
2. http://www.unesco.org/new/es/communication-and-information/access-to-knowledge/preservation-of-documentary-
heritage/digital-heritage/
3. http://www.nedlib.org
4. http://www.digicult.info
5. http://www.nla.gov.au/padi/index.html
6. http://web.archive.org/web/http://openlinkprofiler.org/r/kulturaw3.kb.se
7. http://www.patrimonio.es
8. http://www.bne.es/es/Colecciones/Adquisiciones/DepositoLegal/.../unesco.pdf
9. http://www.unesco.org/webworld/mdm
10. Soler, Joan(2009). La preservacin de documentos electrnicos.Barcelona:UOC. ISBN 978-84-9788-728-1
11. Digital Preservation Coalition(2006). Informe Mind the gap: assesing digital preservation needs in the UK.
http://www.dpconline.org/docs/reports/uknamindthegap.pdf
12. Jones, Maggie; Beagrie, Neil (2001). Preservation management of digital materiales: a handbook. Londres: British
Library. p. 130.
13. Keefer, Alicia; Gallart, Nuria (2007). La preservacin de recursos digitales: el reto para las bibliotecas del siglo
XXI. Barcelona: UOC. ISBN 978-84-9788-567-6.
14. Llueca Fonollosa, Ciro (2012). Preservacin Digital UNMSM. http://www.slideshare.net/cirollueca/preservacin-
digital-cirollueca-unmsm-2012. Consultado el 19 de marzo de 2014
15. Keefer, Alicia; Gallart, Nuria(2007). La preservacin de recursos digitales: el reto para las bibliotecas del siglo
XXI. Barcelona: UOC
16. Keefer, Alicia; Gallart, Nuria (2012). Preservacin de recursos de informacin digital. [material docente]
Barcelona: UOC
17. Keefer & Gallart (2012). Preservacin de los recursos de la informacin digital. Barcelona: UOC.
18. Rothenberg, Jeff (1999). Ensuring the Longevity of Digital Information
19. Rivera Donoso, Miguel Angel (2009). Directrices para la creacin de un programa de preservacin digital. Serie
Bibliotecologa y Gestin de Informacin N 43, Marzo 2009. ISSN 0718-1701 (https://www.worldcat.org/issn/071
8-1701)
20. Termens, Mikel (2013). Preservacin digital. Barcelona: UOC. ISBN 978-84-9029-819-0.
21. Keefer & Gallart (2007). La preservacin de recursos digitales. El reto para las bibliotecas del siglo XXI.
Barcelona: UOC. ISBN 978-84-9788-567-6.
22. SILI, Teresa (2005). Fundamentos tecnolgicos del acceso abierto: Open Archives Initiative y Open Archival
Information System (http://www.elprofesionaldelainformacion.com/contenidos/2005/septiembre/8.pdf). El
Profesional de la Informacin. Consultado el 18 de marzo de 2014.
23. RIVERA DONOSO, Miguel ngel (2009). Directrices para la creacin de un programa de preservacin (http://e
prints.rclis.org/12989/1/Serie_N%C2%B043_Preservacion_digital.pdf). Serie Bibliotecologa y Gestin de
Informacin N 43. Consultado el 19 de marzo de 2014.
24. CCSDS (junio de 2012). Recommendation for space sata system practices - Reference model for an open archival
information system (OAIS) - Recommended practice CCSDS 650.0-M-2 (http://public.ccsds.org/publications/arch
ive/650x0m2.pdf.) (en ingls). Consultado el 20 de marzo de 2014. Texto p.24 ignorado (ayuda)
25. "A framework for understanding significant relationships among the entities of some environment, and for the
development of consistent standards or specifications supporting that environment. A reference model is based on a
small number of unifying concepts and may be used as a basis for education and explaining standards to a non-
specialist"
26. http://www.digitalizacion.unam.mx/
27. SEDICI. Bibliotecas y Repositorios Digitales Tecnologa y Aplicaciones : la preservacin en el RI (http://sedici.u
nlp.edu.ar/bitstream/handle/10915/25303/Clase_4__primera_parte_.pdf?sequence=5). Consultado el 21 de marzo
de 2014.
28. Jordi Serra Serra (diciembre de 2003). L'administraci electrnica i la gesti de documents (http://bid.ub.edu/11s
erra.htm). BID Biblioteconoma y documentacin (en cataln). Consultado el 22 de marzo de 2014.
29. Keefer & Gallart (2007)
30. Library of Congress. MARC21 xml Schema (http://www.loc.gov/standards/marcxml///) (en ingls). Consultado
el 31 de marzo de 2014.
31. Library of Congress. Metadata Object Description Schema: MODS (http://www.loc.gov/standards/mods/).
Consultado el 31 de marzo de 2014.
32. Library of Congress. Metadata Encoding and Transmission Standar: METS (http://www.loc.gov/standards/mets/)
(en ingls). Consultado el 31 de marzo de 2014.
33. Library of Congress. Preservation Metadata Maintenance Activity (PREMIS) (http://www.loc.gov/standards/pre
mis/) (en ingls). Consultado el 31 de marzo de 2014.
34. PREMIS Data Dictionary for Preservation Metadata (http://www.loc.gov/standards/premis/v2/premis-2-2.pdf)
(en ingls). Consultado el 31 de marzo de 2014.
35. Trusted Digital Repositories: attributes and responsabilities. RLG-OCLC Report. RLG. 2002.
36. Trustworthy Repositories Audit & Certification: Criteria and Checklist. Version 1.0. Chicago: CRL. 2007.
Bibliografa
Directrices para la creacin de un Programa de Preservacin Digital (http://eprints.rclis.org/handle/10
760/12989). Consultado el 19 de marzo de 2014.
Espaa, Ministerio de Educacin, Cultura y Deporte. Propiedad Intelectual (http://www.mcu.es/propi
edadInt/CE/InformacionGeneral/InformacionGeneral.html). Consultado el 19 de marzo de 2014.
Eito Brun, Ricardo (2008). Lenguaje de marcas para la gestin de recursos digitales. Aproximacin
tcnica, especificaciones y referencia. TREA. pp. 415-426. ISBN 978-84-9704-347-2.
Keefer, Alice (diciembre de 2005). Aprosimaci al moviment open access" (http://bid.ub.edu/15kee
fer.htm). bid, textos universitaris de biblioteconomia i documentaci,15 (en cataln). Consultado el 14
de marzo de 2014.
Keefer & Gallart (2007). La preservacin de recursos digitales. El reto para las bibliotecas del siglo
XXI. UOC. pp. 163-183. ISBN 978-84-9788-567-6.
Ortiz Ancona, Dante (29 de noviembre de 2012). Preservacin digital: problemticas, estrategias,
metadatos, infraestructura y polticas (http://eprints.rclis.org/18590/1/PreservacionDigital2012.pdf).
Consultado el 27 de marzo de 2014.
Real Decreto Legislativo 1/1996, de 12 de abril, por el que se aprueba el texto refundido de la Ley de
Propiedad Intelectual (https://www.boe.es/buscar/act.php?id=BOE-A-1996-8930). BOE, num.97 de
22/04/1996, Espaa: Ministerio de Cultura. Consultado el 10 de marzo de 2014.
Garca Melero, Luis Angel A (2004). Algunas iniciativas relacionadas con la recopilacin y
conservacin del patrimonio digital. (http://www.anabad.org/archivo/docdown.php?id=143). Ponencia
presentada en el Foro Biblioteca y Sociedad: experiencias de innovacin y mejora organizadas por
ANABAD en Murcia del 14 al 16 octubre de 2004
Preservacin digital UNMSM (http://www.slideshare.net/cirollueca/preservacin-digital-ciro-llueca-un
msm-20129). Consultado el 19 de marzo de 2014.
Rothenberg, Jeff (1999). Ensuring the Longevity of Digital Information.
Conway, Paul (2000). La preservacin en el mundo digital. Santiago de Chile: Centro Nacional de
Conservacin y Restauracin DIBAM.
Proyecto CEDARS (http://web.archive.org/web/https://www.ukoln.ac.uk/metadata/cedars/).
Archivado desde el original (https://www.ukoln.ac.uk/metadata/cedars/) el 28 de noviembre de 2015.
Consultado el 19 de marzo de 2014.
El desarrollo de un programa de preservacin ideal para documentos digitales. Brbara MUOZ
DESOLANO Y PALACIO. Revista General de Informacin y Documentacin 145 2005, vol. 15 nm.
2, 145-156.
KENNETHThibodeau: Conservacin y transferencia de documentos electrnicos: situacin
actual.En:XIV Congreso Internacional de Archivos: (Sevilla, 15 a 29 de septiembre de 2000). [Sevilla]:
Diputa-cin de Sevilla, [2000]. p. 11
FRESKO, Mark; TOMBSKenneth:Digital preservation guidelines: the state of the art in libraries,
museums and archives. Luxemburgo: Comisin Europea DG XII/E-4, 1998
GRANGER, Stewart: Emulation as a digital preservation strategy[en lnea]. En:D-Lib Magazine2000,
6(10):16. (online (http://www.dlib.org/dlib/october00/granger/10granger.html))
UNESCO: Directrices para la preservacin del patrimonio digital [en lnea]. p. 131. 2003. (PDF (http://u
nesdoc.unesco.org/images/0013/001300/130071s.pdf))
De Giusti, Marisa R. (2014). Una metodologa de evaluacin de repositorios digitales para asegurar la
preservacin en el tiempo y el acceso a los contenidos (http://sedici.unlp.edu.ar/handle/10915/43157)..
Tesis doctoral, Universidad Nacional de La Plata
Bot, Juan-Jos (2012). Propuesta de un modelo de preservacin digital para pequeas y medianas
instituciones sanitarias (http://tdx.cat/handle/10803/96254).. Tesis doctoral, Universitat de Barcelona
Vase tambin
Formato
Metadato
Biblioteca digital
Bibliotecario digital
Custodia electrnica
Migracin de datos
Obtenido de https://es.wikipedia.org/w/index.php?title=Preservacin_digital&oldid=98309134
Se edit esta pgina por ltima vez el 12 abr 2017 a las 20:32.
El texto est disponible bajo la Licencia Creative Commons Atribucin Compartir Igual 3.0; pueden
aplicarse clusulas adicionales. Al usar este sitio, usted acepta nuestros trminos de uso y nuestra
poltica de privacidad.
Wikipedia es una marca registrada de la Fundacin Wikimedia, Inc., una organizacin sin nimo de
lucro.