Sie sind auf Seite 1von 49

Jakob Voß

Semantic Web und FRBR


Digitale Bibliothek
Digitale Bibliothek
WS 2008/2009

Fachhochschule Hannover
Informationsmanagement (BA)
20. Oktober 2008

Die Inhalte dieser Präsentation stehen (sofern nicht weiter angegeben) von Jakob Voß
freigegeben unter der Creative Commons Attribution-Share Alike 3.0 Unported Lizenz.
Grundidee
– Computer sollen „verstehen“
– Heterogene Daten weltweit vernetzen
– Logische Beschreibung mit
Regeln und automatischen
Schlussfolgerungen
– Weniger „Semantik“ als
„Verknüpfung von Daten“

Jakob Voß: Lehrveranstaltung Digitale Bibliothek (WS 2008/2009)


FHH Hannover, Bachelor-Studiengang Informationsmanagement
Erste Voraussetzung:
URIs als Identifikatoren

Jakob Voß: Lehrveranstaltung Digitale Bibliothek (WS 2008/2009)


FHH Hannover, Bachelor-Studiengang Informationsmanagement
Identifikatoren in Bibliotheken
– Verlags-IDs (ISSN, ISBN, DOI...)
– Datensatz-IDs im Katalog (z.B. PPN)
– Sigel, ISIL, MARC-Codes für Einrichtungen
– Notationen einer Klassifikation (z.B. RVK)
– Nummer von Normdateien (z.B. PND, GKD...)
– Signaturen von Büchern

– Frage: Was genau wird jeweils identifiziert?

Jakob Voß: Lehrveranstaltung Digitale Bibliothek (WS 2008/2009)


FHH Hannover, Bachelor-Studiengang Informationsmanagement
URIs als Identifikatoren
– Uniform Resource Identifier
– unabhängig vom Zugriffsmechanismus
– jede mögliche Art von Resource
– weltweit eindeutig, hierarchisches System
– Allgemeine Syntax: schema:identifier
– http://... URL
– info:isbn:... info-URI
– urn:... URN
– ...
Jakob Voß: Lehrveranstaltung Digitale Bibliothek (WS 2008/2009)
FHH Hannover, Bachelor-Studiengang Informationsmanagement
URI, IRI, URN, URL...
– URN und URL sind Teilmengen von URI
– IRI: Internationalisierte URI (Unicode)
– Im Semantic Web wird jedes Objekt durch
(mindestens) eine URI identifiziert
– Einfache Variante: Permalinks

– Mehr als Technik: Commitment


– Identifikation != Definition der Bedeutung

Jakob Voß: Lehrveranstaltung Digitale Bibliothek (WS 2008/2009)


FHH Hannover, Bachelor-Studiengang Informationsmanagement
Zweite Voraussetzung:
RDF als gemeinsames
Daten(meta)modell

Jakob Voß: Lehrveranstaltung Digitale Bibliothek (WS 2008/2009)


FHH Hannover, Bachelor-Studiengang Informationsmanagement
Resource Description Framework

RDF = URI + Unicode + Tripel (+ Regeln)


= „Semantik“

Objekt
Prädikat
Subjekt
Prädikat
"Literal"@lang

Jakob Voß: Lehrveranstaltung Digitale Bibliothek (WS 2008/2009)


FHH Hannover, Bachelor-Studiengang Informationsmanagement
RDF-Beispiel

Abkürzung von URIs durch Namensräume


@prefix skos: <http://www.w3.org/2004/02/skos/core#> .
@prefix agro: <http://www.fao.org/aos/agrovoc> .

skos:Concept
rdf:type
agro:c385
skos:prefLabel
"Ananas"@de

Jakob Voß: Lehrveranstaltung Digitale Bibliothek (WS 2008/2009)


FHH Hannover, Bachelor-Studiengang Informationsmanagement
Feldbasiertes Format
– Einfache Daten
– Titel : Zettelwirtschaft
– Autor : Krajewski, Markus
– Pica+
– 021A :
– a : Zettelwirtschaft
– 028A :
– d : Markus
– a : Krajeski

Jakob Voß: Lehrveranstaltung Digitale Bibliothek (WS 2008/2009)


FHH Hannover, Bachelor-Studiengang Informationsmanagement
Abbildung nach RDF
– Statt Feldern werden URIs verwendet
– 021A$a =>
http://purl.org/dc/elements/1.1/title

– 028A$d =>
http://xmlns.com/foaf/0.1/fir stN ame

– 028A$a =>
http://xmlns.com/foaf/0.1/secondN ame

Jakob Voß: Lehrveranstaltung Digitale Bibliothek (WS 2008/2009)


FHH Hannover, Bachelor-Studiengang Informationsmanagement
Abbildung nach RDF
– Alle Objekte erhalten eine eigene URI
– Das Buch:
http://d­nb.info/96327841X
– Die Person:
http://d­nb.info/gnd/13150794X
– Verknüpfung von Semantischen Entitäten
– http://purl.org/dc/elements/1.1/title
– http://purl.org/dc/elements/1.1/cr eat or
– http://xmlns.com/foaf/0.1/fir stN ame
– http://xmlns.com/foaf/0.1/secondN ame

Jakob Voß: Lehrveranstaltung Digitale Bibliothek (WS 2008/2009)


FHH Hannover, Bachelor-Studiengang Informationsmanagement
RDF-basiertes Format
@prefix foaf <http://xmlns.com/foaf/0.1/>.
@prefix dc <http://purl.org/dc/elements/1.1/>.

<http://d­nb.info/96327841X>
dc:title "Zettelwirtschaft" ;
N3
dc:creator <http://d­nb.info/gnd/13150794X> .

<http://d­nb.info/gnd/13150794X>
foaf:firstName "Markus" ;
foaf:secondName "Krajeski" .

dc:title
http://d-nb.info/96327841X Zettelwirtschaft

dc:creator Graph
foaf:firstName
Markus
http://d-nb.info/gnd/13150794X
foaf:secondName Krajewski

Jakob Voß: Lehrveranstaltung Digitale Bibliothek (WS 2008/2009)


FHH Hannover, Bachelor-Studiengang Informationsmanagement
Kodierung als RDF/XML
<?xml version="1.0" encoding="UTF­8" ?>
<rdf:RDF xmlns:rdf ="ht tp :// ww w.w3 .o rg/1 99 9/0 2/ 22­ rdf ­s ynt ax­ ns #"
         xmlns:foa f=" ht tp: // xm lns .c om/ foaf /0 .1/ "
         xmlns:dc=" ht tp: // pur l.o rg/ dc/ el eme nt s/ 1.1/ ">

  <rdf:Description about="http :/ /d­ nb .in fo/9 63 27841X">


    <dc :t itl e>Zettelwirtschaft</dc:title>
    <dc :c reat or  rdf:Resource="http :/ /d­ nb. in fo/g nd /1 3150 79 4X" />
  </rdf:Description>

  <rdf:Description about="http :/ /d­ nb .in fo/g nd /1 3150 79 4X">


    <foa f:f ir stNam e>Markus</foaf:firstName>
    <foa f:s eco nd Nam e>Krajewski</foaf:secondName>
  </rdf:Description>

</rdf:RDF>

Erste Version: 2001, aktuelle Version: 2004


Ein Hinderungsgrund des Semantic Web
Jakob Voß: Lehrveranstaltung Digitale Bibliothek (WS 2008/2009)
FHH Hannover, Bachelor-Studiengang Informationsmanagement
Cool URIs for the Semantic Web

http://example.com/xy z

ID

Accept: application/rdf+xml 303
redirect

RDF HTML

http://example.com/xy z.rdf http://example.com/xy z. htm l

Menschenlesbare und Maschinenlesbare Informationen unter einer URI

Jakob Voß: Lehrveranstaltung Digitale Bibliothek (WS 2008/2009)


FHH Hannover, Bachelor-Studiengang Informationsmanagement
Linked Data
– Benutze URIs, um Objekte zu identifizieren.
– Benutze HTTP URIs, so dass Objekte
nachgeschlagen werden können.
– Wenn jemand eine URI nachschlägt, stelle
zweckdienliche Informationen bereit.
– Biete Links zu anderen URIs, so dass
weitere Objekte nachgeschlagen werden
können.

Tim Berners Lee (2006): Linked Data Design Issues


http://www.w3.org/DesignIssues/LinkedData.html
Jakob Voß: Lehrveranstaltung Digitale Bibliothek (WS 2008/2009)
FHH Hannover, Bachelor-Studiengang Informationsmanagement
– Initiative, um offene Datensammlungen in
RDF verlinkt im Web zugänglich zu machen
– Eine der größten Datensammlungen dabei:
– DBpedia (http://dbpedia.org)
– Daten erzeugt aus Wikipedia

Jakob Voß: Lehrveranstaltung Digitale Bibliothek (WS 2008/2009)


FHH Hannover, Bachelor-Studiengang Informationsmanagement
Jakob Voß: Lehrveranstaltung Digitale Bibliothek (WS 2008/2009)
FHH Hannover, Bachelor-Studiengang Informationsmanagement
LOD-Wachstum

Mai 2007 September 2008

Jakob Voß: Lehrveranstaltung Digitale Bibliothek (WS 2008/2009)


FHH Hannover, Bachelor-Studiengang Informationsmanagement
Once upon a time...

Bild: Comuter History Museum


Das ARPANET 1969
Jakob Voß: Lehrveranstaltung Digitale Bibliothek (WS 2008/2009)
FHH Hannover, Bachelor-Studiengang Informationsmanagement
Bibliotheksdaten ins
Semantic Web bringen!
– Vorhandene Identifikatoren
in (HTTP) URIs umwandeln
– Vorhandene Datenformate auf
RDF und Ontologien abbilden
– Daten als „Linked Open Data“
verfügbar machen

Jakob Voß: Lehrveranstaltung Digitale Bibliothek (WS 2008/2009)


FHH Hannover, Bachelor-Studiengang Informationsmanagement
z.B. Normdateien
– URIs für August Strindberg
– http://dbpedia.org/page/August_Strindberg
– http://libris.kb.se/resource/auth/94541
– http://d-nb.info/gnd/118619314
– ...
– Mehr Verknüpfungen bitte!
– Gleiche Objekte kombiniert mit owl:sameAs

Jakob Voß: Lehrveranstaltung Digitale Bibliothek (WS 2008/2009)


FHH Hannover, Bachelor-Studiengang Informationsmanagement
Weitere Bestandteile:
Ontologien, Schlussfolgerung,
Abfragen, Anwendungen...

Jakob Voß: Lehrveranstaltung Digitale Bibliothek (WS 2008/2009)


FHH Hannover, Bachelor-Studiengang Informationsmanagement
Komplexere Anfragen
– Beispiele:
– Filme, deren Musik jemand gemacht hat,
der im Jahr 1965 geboren wurde
– Bücher, deren Autor gleichzeitig Thema
des Buches ist
– Formulierung in SPARQL („SQL für RDF“)
– Besser: Anfrage zusammenklicken

Jakob Voß: Lehrveranstaltung Digitale Bibliothek (WS 2008/2009)


FHH Hannover, Bachelor-Studiengang Informationsmanagement
Beispielanfrage

Filme, deren Musik jemand gemacht music


hat, der im Jahr 1965 geboren wurde? ? ?
born

1965

music
„Dancer in the Dark“ „Björk“

born
Problem: Die Prädikate „music“ (hat-darin-Musik-
gemacht) und „born“ (ist-geboren-im-Jahr) müssen
bekannt und einheitlich verwendet werden! 1965

Jakob Voß: Lehrveranstaltung Digitale Bibliothek (WS 2008/2009)


FHH Hannover, Bachelor-Studiengang Informationsmanagement
Vernüpfungen versch. Quellen
OPAC

dc:subject
Buch über Björk PND:119525054

owl:sameAs

dc:creator
Dancer in the Dark Björk

dbpedia:birthYear
DBpedia

1965

Jakob Voß: Lehrveranstaltung Digitale Bibliothek (WS 2008/2009)


FHH Hannover, Bachelor-Studiengang Informationsmanagement
Beispielanfrage und Daten
RDF-Daten von http://libris.kb.se/resource/auth/94541:

<rdf:Description rdf:about="http://libris.kb.se/resource/bib/5761604">
    <dc:subject rdf:resource="http://libris.kb.se/resource/auth/94541"/>
    <dc:creator rdf:resource="http://libris.kb.se/resource/auth/94541"/>
</rdf:Description>

dc:subject
kb:bib/5761604 kb:auth/94541
dc:creator

– Sollte eine Autobiographie sein (ist aber nicht)


– Vermeidung von Redundanzen
– Anfragen zur Verbesserung der Qualität
Jakob Voß: Lehrveranstaltung Digitale Bibliothek (WS 2008/2009)
FHH Hannover, Bachelor-Studiengang Informationsmanagement
Ontologien
– Spezifizieren, welche Prädikate möglich sind
– Spezifizieren Objekttypen (Klassen)
– Ermöglichen, Spezielles auf Einfaches
abzubilden
– Geben zusätzliche Regeln an zur
– Schlussfolgerung (Inferenz)
– Integrität (Validierung)
– „Datenformate“ für das Semantic Web

Jakob Voß: Lehrveranstaltung Digitale Bibliothek (WS 2008/2009)


FHH Hannover, Bachelor-Studiengang Informationsmanagement
Schlussfolgerungsregeln
– Wenn ... dann auch ...
– A frbr:creator B => B rdf:type frbr:Work
– Vorsicht, explosiv!
– Gefahr von vorschnellen
Verallgemeinerungen!
– Siehe
– Bowker and Star (1999): Sorting Things out.
Classification and its consequences
– Voss (2007): The Semantic Web and
why Wikipedia should bother.

Jakob Voß: Lehrveranstaltung Digitale Bibliothek (WS 2008/2009)


FHH Hannover, Bachelor-Studiengang Informationsmanagement
Functional Requirements for
Bibliographic Records (FRBR)
– Abstraktes Datenmodell für
bibliographische Informationen
– 1998 von der IFLA verabschiedet
– http://www.ifla.org/VII/s13/frbr/frbr.htm
– Drei Gruppen von Entitäten
1) Work, Expression, Manifestation, Item
2) Person, CorporateBody
3) Concept, Event, Object, Place

Jakob Voß: Lehrveranstaltung Digitale Bibliothek (WS 2008/2009)


FHH Hannover, Bachelor-Studiengang Informationsmanagement
Semantic FRBR
– Vom abstrakten Datenmodell zur Ontologie
– Seit 1998 : IFLA verschläft Webstandards?
– keine Bezugnahme auf W3C, RFC...
– keine Implementierung
– fehlender technischer Sachverstand?
– 2004: erster Versuch von FRBR in RDF
– 2005: zweiter Versuch (IFLA-unabhängig)

Jakob Voß: Lehrveranstaltung Digitale Bibliothek (WS 2008/2009)


FHH Hannover, Bachelor-Studiengang Informationsmanagement
FRBR – Gruppe 1
Entitäten

Work
– Romeo und Julia

Expression
– Erste gedruckte
Fassung

Manifestation – Erstauflage

Item – Exemplar in der


British Library

Jakob Voß: Lehrveranstaltung Digitale Bibliothek (WS 2008/2009)


FHH Hannover, Bachelor-Studiengang Informationsmanagement
FRBR – Gruppe 1
Entitäten

Work
– Romeo und Julia

Expression
– der Film mit di Caprio

Manifestation – DVD-Version

Item – Exemplar in
Stadtbücherei

Jakob Voß: Lehrveranstaltung Digitale Bibliothek (WS 2008/2009)


FHH Hannover, Bachelor-Studiengang Informationsmanagement
FRBR – Gruppe 1
Entitäten

Work
– Romeo und Julia

– der Film mit di Caprio


Expression
– deutsche Fassung
Manifestation – TV-Ausstrahlung

Item – Auf Video mitgeschnitten

Jakob Voß: Lehrveranstaltung Digitale Bibliothek (WS 2008/2009)


FHH Hannover, Bachelor-Studiengang Informationsmanagement
FRBR – Gruppe 1
Attribute

Work
– Titel, Datum...

Expression – Sprache, Umfang...

Manifestation – Herausgeber, Ort...

Item
– Anmerkungen,
Provenienz...

Jakob Voß: Lehrveranstaltung Digitale Bibliothek (WS 2008/2009)


FHH Hannover, Bachelor-Studiengang Informationsmanagement
FRBR-Entitäten
in Bibliotheken

Work

xISBN
thingISBN Expression
... Bisherige
Kataloge
Manifestation
Verfüg-
barkeits- Digitalisierung
recherche
Item

Jakob Voß: Lehrveranstaltung Digitale Bibliothek (WS 2008/2009)


FHH Hannover, Bachelor-Studiengang Informationsmanagement
FRBR – Gruppe 1
Relationen 1/4

Work
realization realizationOf

Expression
embodiment embodimentOf

Manifestation
exemplar exemplarOf

Item

Jakob Voß: Lehrveranstaltung Digitale Bibliothek (WS 2008/2009)


FHH Hannover, Bachelor-Studiengang Informationsmanagement
FRBR – Gruppe 1
Relationen 2/4
Endeavour

Work

Expression
relatedEndeavour relatedEndeavour

part partOf
Manifestation

Item

Jakob Voß: Lehrveranstaltung Digitale Bibliothek (WS 2008/2009)


FHH Hannover, Bachelor-Studiengang Informationsmanagement
FRBR – Gruppe 1
Relationen 3/4

subject
Work

abridgement abridgementOf
revision Expression revisionOf
translation translationOf

alternate Manifestation alternateOf


arrangement arrangementOf

reconfiguration Item reconfigurationOf

Jakob Voß: Lehrveranstaltung Digitale Bibliothek (WS 2008/2009)


FHH Hannover, Bachelor-Studiengang Informationsmanagement
FRBR – Gruppe 1
Relationen 4/4

adaption adaptionOf
complement Work complementOf
imitation imitationOf
successor successorOf
summarization summarizationOf
supplement Expression supplementOf
transformation transformationOf

Manifestation
reproduction reproductionOf

Item

Jakob Voß: Lehrveranstaltung Digitale Bibliothek (WS 2008/2009)


FHH Hannover, Bachelor-Studiengang Informationsmanagement
FRBR – Gruppe 2
Entitäten und Attribute

ResponsibleEntity

– Name, Titel... Person

– Name, Ort... CorporateBody

Jakob Voß: Lehrveranstaltung Digitale Bibliothek (WS 2008/2009)


FHH Hannover, Bachelor-Studiengang Informationsmanagement
FRBR – Gruppe 2
Relationen
responsibleEntity
responsibleEntityOf

creator
Work
creatorOf
ResponsibleEntity
realizer
Expression
realizerOf Person

producer
Manifestation
producerOf CorporateBody

owner
Item
ownerOf

Jakob Voß: Lehrveranstaltung Digitale Bibliothek (WS 2008/2009)


FHH Hannover, Bachelor-Studiengang Informationsmanagement
FRBR – Gruppe 3
Entitäten und Relation

subject
Work Subject

Concept Place

Event Object

ResponsibleEntity
Endeavour

Jakob Voß: Lehrveranstaltung Digitale Bibliothek (WS 2008/2009)


FHH Hannover, Bachelor-Studiengang Informationsmanagement
FRBR – Gruppe 3
Entitäten und Relation

subject
Work Subject

dc:subject Concept Place

skos:Concept Event Object

ResponsibleEntity
besser (auch) auf
SKOS zurückgreifen! Endeavour

Jakob Voß: Lehrveranstaltung Digitale Bibliothek (WS 2008/2009)


FHH Hannover, Bachelor-Studiengang Informationsmanagement
Wo wird FRBR benötigt?
– Ergebnisse von Bennett et al. (2003):
– Werk hat durchnittlich 1,5 Manifestationen
– 78% aller Werke haben nur eine Manifestation
– 99% aller Werke in WorldCat haben <= 7
– Nur 30.000 (~1%) haben mehr als 20
– Aber: die populären Fälle haben mehr!
– Gute Interfaces für einfache und
umfangreiche Fälle erforderlich!

Jakob Voß: Lehrveranstaltung Digitale Bibliothek (WS 2008/2009)


FHH Hannover, Bachelor-Studiengang Informationsmanagement
Weiteres FRBR-Beispiel
Brema [ca. 1750].
Matthäus Seutter (1678-1756)
Work Tobias Conrad Lotter (1717-1777)

Vorzeichnung
Expression

Kupferstich Digitalisat
Manifestation

Weimar Bremen Thumbnail


Item

Jakob Voß: Lehrveranstaltung Digitale Bibliothek (WS 2008/2009)


FHH Hannover, Bachelor-Studiengang Informationsmanagement
Weiteres FRBR-Beispiel
Brema [ca. 1750].
Matthäus Seutter (1678-1756)
Work Tobias Conrad Lotter (1717-1777)

Kupferstich
Expression

Kolor- Digitalisat
Manifestation ierungen

Weimar Bremen Thumbnail


Item

Jakob Voß: Lehrveranstaltung Digitale Bibliothek (WS 2008/2009)


FHH Hannover, Bachelor-Studiengang Informationsmanagement
Probleme des Semantic Web
– Daten und Anwendungen (Henne-Ei)
– Visualisierung und Anfrageformulierung
– Datenqualität
– Unvollständige Daten
– Unterschiedliche Interpretationen
– Widersprüche
– Nicht zu unterschätzen!
– Semantik vs. Pragmatik (Theorie & Praxis)

Jakob Voß: Lehrveranstaltung Digitale Bibliothek (WS 2008/2009)


FHH Hannover, Bachelor-Studiengang Informationsmanagement
Dankeschön
&
auf
Wiedersehen!

Jakob Voß: Lehrveranstaltung Digitale Bibliothek (WS 2008/2009)


FHH Hannover, Bachelor-Studiengang Informationsmanagement