Sie sind auf Seite 1von 26

Jakob Voß

Langzeitarchivierung
Digitale Bibliothek
Digitale Bibliothek
WS 2008/2009

Fachhochschule Hannover
Informationsmanagement (BA)
1. Dezember 2008

Die Inhalte dieser Präsentation stehen (sofern nicht weiter angegeben) von Jakob Voß
freigegeben unter der Creative Commons Attribution-Share Alike 3.0 Unported Lizenz.
Warum Langzeitarchivierung?
– Digital = Verlustfrei kopier- und modifizierbar
– Abhängig von (!)
– Datenträger und Lesegeräte
– Betriebssystem, Software, Dateiformate

Jakob Voß: Lehrveranstaltung Digitale Bibliothek (WS 2008/2009)


FHH Hannover, Bachelor-Studiengang Informationsmanagement
Ziel und Probleme
– Erhaltung für die Nachwelt („Langzeit“)
– Nutzbarkeit
– Authentizität
– Probleme
– Datenverlust (Naturkatastrophen, Viren,
Menschen Software- und Hardwarefehler)
– Inkompatibilität (!)
– Was soll gesichert werden?
– Wer ist dafür verantwortlich?

Jakob Voß: Lehrveranstaltung Digitale Bibliothek (WS 2008/2009)


FHH Hannover, Bachelor-Studiengang Informationsmanagement
Beispiel: NASA
– Die Originalaufnahmen der Mondlandung (Apollo 11)
sind nicht auffindbar (Video vor der Konvertierung).
http://en.wikipedia.org/wiki/Apollo_program_missing_tapes

– Magnetbänder mit Daten über Mondstaub (Apollo 11,


12 und 14) waren ebenfalls verlegt, wurden aber
wiedergefunden und konnten erst mit einem
speziellen Bandlaufwerk (IBM 729 Mark V) aus dem
Australischen Computermuseum gelesen werden.
Jakob Voß: Lehrveranstaltung Digitale Bibliothek (WS 2008/2009)
FHH Hannover, Bachelor-Studiengang Informationsmanagement
Was heisst „Langzeit“?
„Langzeit ist die Umschreibung eines nicht näher fixierten
Zeitraumes, währenddessen wesentliche nicht vorhersehbare
technologische und soziokulturelle Veränderungen eintreten, die
sowohl die Gestalt als auch die Nutzungssituation digitaler
Ressourcen in rasanten Entwicklungszyklen vollständig
umwälzen werden.“ (S. 567)
Schwens/Liegmann: Langzeitarchivierung digitaler Ressourcen.
In: Grundlagen der praktischen Information und Dokumentation, 2004

Jakob Voß: Lehrveranstaltung Digitale Bibliothek (WS 2008/2009)


FHH Hannover, Bachelor-Studiengang Informationsmanagement
Abgrenzung

“Langzeitarchivierung digitaler Objekte umfasst alle Maß-


nahmen, die dazu dienen, digitale Objekte für die Nachwelt
dauerhaft zu erhalten. Der Begriff ist eng verwandt mit
Langzeitverfügbarkeit, die jedoch die dauerhafte
Benutzbarkeit mehr in den Vordergrund stellt.“
Nestor-Glossar, Eintrag vom 20.2.2004

Retrodigitalisierung: Nachträgliche Digitalisierung,


Erschließung und Archivierung von analogen Publikationen
(Zeitungen, Zeitschriften, Bücher, Akten, Photographien etc.).

Jakob Voß: Lehrveranstaltung Digitale Bibliothek (WS 2008/2009)


FHH Hannover, Bachelor-Studiengang Informationsmanagement
Was ist zu tun?
– Substanzerhaltung der Daten (Bitstream)
– Kopieren, digital signieren, Backups
– Ein Problem: DRM
– Benutzbarkeit sicherstellen
– Standards zur Kodierung Digitaler Objekte
– Originalobjekte (z.B. Dateiformat...)
– Umgebung (z.B. Betriebssystem, Programm)
– Konvertierungsschritte

Jakob Voß: Lehrveranstaltung Digitale Bibliothek (WS 2008/2009)


FHH Hannover, Bachelor-Studiengang Informationsmanagement
Grundsätzliche Verfahren
– Digitalisierung

– Museum: Erhalt der Hard- und Software


– Emulation der Hard- und Software
– Migration auf neue Systeme (Konvertierung)

– Zusätzlich: Kopie in analoger Form


– Vor allem Mikroform (>500 Jahre!)

Jakob Voß: Lehrveranstaltung Digitale Bibliothek (WS 2008/2009)


FHH Hannover, Bachelor-Studiengang Informationsmanagement
Technisches Museum
– Erhalt der technischen Umgebung
– ggf. Auffrischen der Daten durch Umkopieren
– Bis
– irgendwas kaputtgeht
– niemand mehr damit umgehen kann
– Notwendig aber nicht für die Masse geeignet

Jakob Voß: Lehrveranstaltung Digitale Bibliothek (WS 2008/2009)


FHH Hannover, Bachelor-Studiengang Informationsmanagement
Emulation
– Nachahmung der ursprünglichen Umgebung
– Emulatoren und technische Metadaten
– Nachteile
– Grenzen der Emulation
– Wer entwickelt und wartet die Emulatoren?
– Danke, Computerspiele-Liebhaber!

Jakob Voß: Lehrveranstaltung Digitale Bibliothek (WS 2008/2009)


FHH Hannover, Bachelor-Studiengang Informationsmanagement
Migration
– Konvertierung in neue Umgebung
– Metadaten der Konvertierung
– Nachteile
– Konvertierung ist aufwändig und komplex
– Datenverlust, Übersetzung ist nicht Original
– Vorteil
– Nutzbarkeit in aktuellen Umgebungen

Jakob Voß: Lehrveranstaltung Digitale Bibliothek (WS 2008/2009)


FHH Hannover, Bachelor-Studiengang Informationsmanagement
Zusammenfassung
– Langzeitarchivierung ist immer aufwändig
– Alle drei Strategien (Museum, Emulation,
Konvertierung) haben Berechtigung
– Bei jedem Schritt zusätzliche Metadaten
– Exponentielles Wachstum
– Gut: Speicherplatz und Rechenleistung
wachsen ebenfalls exponentiell
– Schlecht: Auch Fehler potenzieren sich

Jakob Voß: Lehrveranstaltung Digitale Bibliothek (WS 2008/2009)


FHH Hannover, Bachelor-Studiengang Informationsmanagement
Schritte bei der LZA

Migration/Emulation
mit Beschreibung
Vorlage

Digitalisierung
analog Erhalt
Nutzung
digital
Beschreibung

Auffinden auch digital zu


analog (Konversion)
Sicherungskopie

Jakob Voß: Lehrveranstaltung Digitale Bibliothek (WS 2008/2009)


FHH Hannover, Bachelor-Studiengang Informationsmanagement
Digitalisierung: Buchscanner

– „Buch zerschneiden und ab in den Kopierer“


– Profigeräte
– Kirtas, Qidenus, Treventus: 1500 p/h ~ 100.000€
– 4DigitalBooks: 3000 p/h ~ 200.000€
– Aufwand vor allem durch
Heterogenität der Vorlagen
– Spezialscanner für Rara (z.B. Buchspiegel)
Julian Ball, 2008: Report of Public Exhibition of Automated Book
Scanners Hosted at the BSB Munich
http://digitisation.jiscinvolve.org/files/2008/10/automated-book-scanners-munich

Jakob Voß: Lehrveranstaltung Digitale Bibliothek (WS 2008/2009)


FHH Hannover, Bachelor-Studiengang Informationsmanagement
Speicherung: Redundanz
– LOCKSS (Lots of copies keep stuff Save)
– Mehrere Kopien (Mindestanzahl) verteilt
unter Teilnehmern der Föderation
– Regelmäßiger Vergleich von Kopien
– Problem: Kontrolle über Zugriff schwierig,
deshalb müssen Rechteinhaber zustimmen

Jakob Voß: Lehrveranstaltung Digitale Bibliothek (WS 2008/2009)


FHH Hannover, Bachelor-Studiengang Informationsmanagement
Wer digitalisiert und archiviert?

– Viele verstreute Projekte an Bibliotheken


und Archiven
– DigiZeitschriften
– Google Books
– Internet Archive
– Open Content Alliance
– Verlage bieten höchsten Verfügbarkeit
– Archivierung nur sehr unterschiedlich
(mäßig bis garnicht)
Jakob Voß: Lehrveranstaltung Digitale Bibliothek (WS 2008/2009)
FHH Hannover, Bachelor-Studiengang Informationsmanagement
Regeln und Empfehlungen
– DFG-Praxisregeln im Förderprogramm
„Kulturelle Überlieferung“
– Notwendig für Förderung durch die DFG
– Empfehlungen der DBV AG Handschriften /
Alte Drucke
– Good Practice Handbuch zur Digitalisierung im
Rahmen des MINVERA-Projekt (2004)
– IFLA Guidelines for Digitization Projects (2002)

Jakob Voß: Lehrveranstaltung Digitale Bibliothek (WS 2008/2009)


FHH Hannover, Bachelor-Studiengang Informationsmanagement
Kodierung und Nutzung: DFG-Viewer

– Programm zur einheitlichen Anzeige


von Digitalisaten aus Repositories
– Verwendung als Webservice möglich
– Struktur- und Metadaten in
– Metadata Encoding & Transmission Standard (METS)
– Metadata Object Description Schema (MODS)

http://dfg-viewer.de/

Jakob Voß: Lehrveranstaltung Digitale Bibliothek (WS 2008/2009)


FHH Hannover, Bachelor-Studiengang Informationsmanagement
METS-Beispiel
<mets:mets xmlns:mets="http://www.loc.gov/METS/">
 <mets:dmdSec>
  <mets:mdWrap MIMETYPE="text/xml" MDTYPE="MODS" >
   <mets:xmlData>
    <mods:mods version="3.0" xmlns:mods="http://www.loc.gov/mods/v3">
       [Me tadat en d es d igit ali sier ten  Objek tes:  T it el , A ut or .. .]
    </mods:mods>
 </mets:mdWrap>
 </mets:dmdSec>
 <mets:amdSec>
      [Me tadat en d es D igit ali sat es: Ad minis tr at ion,  Recht e ... ]
 </mets:amdSec>
 <mets:fileSec>
       [V er we is a uf ei nzelne  Dat eien:  Imag es .. .]
 </mets:fileSec>
 <mets:structMap>
       [Gl iede run g, R eih enf olge , Zus ammen hang  ...]
 </mets:structMap>
</mets:mets>

Jakob Voß: Lehrveranstaltung Digitale Bibliothek (WS 2008/2009)


FHH Hannover, Bachelor-Studiengang Informationsmanagement
DFG-Viewer

METS/MODS
OAI-PMH

Repository Anzeige

Images

Jakob Voß: Lehrveranstaltung Digitale Bibliothek (WS 2008/2009)


FHH Hannover, Bachelor-Studiengang Informationsmanagement
Angebot für BA-Thema
Entwicklung einer Export-Schnittstelle für
Struktur- und Metadaten aus Wikisource.

DFG-Viewer
Wikisource METS/MODS
...

ZVDD-XML ZVDD

Jakob Voß: Lehrveranstaltung Digitale Bibliothek (WS 2008/2009)


FHH Hannover, Bachelor-Studiengang Informationsmanagement
Einige weitere Standards
– Open Archival Information System (OAIS)
ISO 14721: „TÜV für Langzeitarchive“
– LMER: Langzeitarchivierungsmetadaten
für elektronische Ressourcen: DNB und
Nationalbibliothek von Neuseeland)
– URN zur Identifizierung von Objekten
„Was keine URI hat, existiert nicht!“
– Grundsätzlich ist noch viel im Fluß

Jakob Voß: Lehrveranstaltung Digitale Bibliothek (WS 2008/2009)


FHH Hannover, Bachelor-Studiengang Informationsmanagement
Digitalisierungszentren
– Professionelle Hardware noch immer teuer
– Spezielles Know-How notwendig
– OCR und Bildbearbeitung
– Metadaten
– Dokumentenmanagement und Storage
– Deshalb: Service- und Kompetenzzentren
in Göttingen und München
– Infrastruktur, Beratung und Kooperation
– Interessante Praktikumsplätze?

Jakob Voß: Lehrveranstaltung Digitale Bibliothek (WS 2008/2009)


FHH Hannover, Bachelor-Studiengang Informationsmanagement
ZVDD
– Zentrales Verzeichnis digitalisierter Drucke
– Vorrangig erstmal Sammlung von Metadaten

Jakob Voß: Lehrveranstaltung Digitale Bibliothek (WS 2008/2009)


FHH Hannover, Bachelor-Studiengang Informationsmanagement
Literaturhinweise
– Tutorials der Cornell University Library
– Digital Imaging Tutorial
http://www.library.cornell.edu/preservation/tutorial/contents.html

– Digital Preservation Management


http://www.icpsr.umich.edu/dpm/
– Schwens/Liegmann: Langzeitarchivierung digitaler
Ressourcen. In: Grundlagen der praktischen Information
und Dokumentation, Saur 2004
– Kompetenznetzwerk Langzeitarchivierung
http://www.langzeitarchivierung.de/

– Haber, 2007: Digitalisierung und digitale Archivierung


http://infoclio.ch/downloads/infoclio_digitalisierung.pdf

Jakob Voß: Lehrveranstaltung Digitale Bibliothek (WS 2008/2009)


FHH Hannover, Bachelor-Studiengang Informationsmanagement
Bis nächste Woche
– Fällt nicht aus, sondern Pflichtveranstaltung!
– Probelehrveranstaltungen in Raum 2.39
– 08:00-08:45, 10:00-10:45, 12:00-12.45
– 14:30-15:15 und 16.30-17:15

Jakob Voß: Lehrveranstaltung Digitale Bibliothek (WS 2008/2009)


FHH Hannover, Bachelor-Studiengang Informationsmanagement