Sie sind auf Seite 1von 2

Abstract zu einem Vortrag im

Workshop der Arbeitsgruppe „Elektronisches Publizieren“ der Union der deutschen Akademien der Wissenschaft in Zusammenarbeit mit der Sächsischen Akademie der Wissenschaften und der Deutschen Nationalbibliothek http://www.saw leipzig.de/aktuelles/personendateien

21. bis 23. September 2009, Sächsische Akademie der Wissenschaften, Leipzig

Musica migrans Lebensläufe mittel und osteuropäischer Musiker des 19. Jahrhunderts

Dr. Lutz Maicher – Topic Maps Lab, Institut für Informatik Universität Leipzig, www.topicmapslab.de Prof. Dr. G. Heyer – Abteilung für Automatische Sprachverarbeitung, Universität Leipzig Prof. Dr. H. Loos –Institut für Musikwissenschaften, Universität Leipzig

In der ersten Phase von „Musica migrans“ (http://www.musicamigrans.de) arbeiteten von August

2007 bis Juli 2008 das Institut für Musikwissenschaft und das Institut für Informatik an einem

webbasierten, dezentralen System zur Erfassung der Biographien deutscher Musiker im östlichen

Europa und östlicher Musiker in Deutschland. Die Datenerfassung und eingabe erfolgte durch 28

musikwissenschaftliche Forscher in Ost und Mitteleuropa.

Ziel des Vorhabens war die normalisierte Erfassung relevanter Personen und deren spezifischer

Lebensdaten, insbesondere Geburts und Sterbedaten bzw. orte, Konfessionen und nationale

Zugehörigkeiten. Daneben werden die aus Quellen reproduzierbaren Etappen der Ausbildungs ,

Berufs und Reisewege der Musiker zusammengetragen. Zu jeder Etappe werden, wenn bekannt,

Startund Enddatum, Institution und ausgeführte Tätigkeit erfasst. Für jede strukturierte Aussage

innerhalb der Datenbasis können weitere Zusatzinformationen in Freitext hinzugefügt werden.

Für die Nutzung der Daten mit anderen relevanten musikhistorischen Quellen oder in externen

Anwendungen (Interoperabilität) ist die normalisierte Repräsentation der Informationen notwendig.

Dabei ist die konsistente Nutzung von standardisierten Kennungen (Identifiern, IDs) für alle Entitäten

in der Datenbasis von großer Bedeutung. Die im Rahmen von Musica migrans genutzte Technologie

Topic Maps erlaubt, dass für jede Entität eine Menge von synonymen Kennungen gespeichert und

verarbeitet werden können. Dies erlaubt die parallele Nutzung verschiedener Standardisierungen.

Im bestehenden System erhalten alle Entitäten zumindest eine projektintern normalisierte Kennung.

Darüber hinaus werden für Personen, wenn vorhanden, Wikipedia URLs als Kennungen benutzt. Die

Nutzung weiterer, standardisierter Kennungen für die Personen und anderer Entitäten der

Datenbasis wie Tätigkeiten und Berufe wird forciert. Für Orte und Regionen wird Geonames.org als

Gazetteer genutzt. Somit kommen Geonames IDs als Kennungen zum Einsatz. Mangels eines umfassenden Registers für Musikinstitutionen (in dieser Zeit und dieser Region) werden in Phase 1 Institutionen nur schwach normalisiert gespeichert, d.h. ohne standardisierte Kennungen.

In der derzeit laufenden zweiten Phase des Vorhabens wird ein Register für Musikinstitutionen erstellt. Es werden aus verschiedenen Quellen umfangreiche Informationen zu der reichen Landschaft an Musikinstitutionen in diesem Zeitraum und dieser Region zusammengetragen und strukturiert gespeichert.

Technologisch basiert die Datenbank in Musica migrans auf dem internationalen Industriestandard Topic Maps (ISO 13250). In Topic Maps wird für jeden Aussagegegenstand der realen Welt, sei es eine Person, eine Institution, ein Datum, eine Konfession oder ein Ort, ein Topic erstellt. Dieser Topic ist dann der Repräsentant des Aussagegegenstandes in der Datenbank und trägt alle Informationen, die über den Aussagegegenstand gespeichert werden sollen, zusammen. Jede Beziehung zwischen Aussagegegenständen in der realen Welt, wie z.B. die Präsidentschaft einer Person in einem Gesangsverein, wird als typisierte Beziehung zwischen den entsprechenden Topics in der Datenbank repräsentiert. Jedes Topic wird somit zu einem zentralen Informationshub für genau einen Aussagegegenstand, mit Beziehungen zu einer Vielzahl anderer Topics. Aus der vernetzten Welt entstehen somit hoch vernetzte Datenbanken, aus denen stark vernetzte Webseiten erstellt werden – die viele Zusammenhänge offenlegen.