Sie sind auf Seite 1von 43

Reprsentation von Bedeutung

[D. Jurafsky, J.H. Martin 2000, Kap. 14]

Die Bedeutung sprachlicher Ausdrcke (uerungen) kann


in einer formalen Struktur wiedergegeben werden:

Semantische Reprsentation
Als Darstellungsmittel werden semantische
Reprsentationssprachen entwickelt, deren Funktion es ist,
semantische Reprsentationen auf ein Modell eines
Weltausschnitts abzubilden.

Semantische Reprsentationen sollen:

aus der (morphologischen, syntaktischen) Struktur


sprachlicher uerungen ableitbar sein.

als Ausgangsbasis fr Prozesse dienen, die sprachliche


Ausdrcke aus formalen Notationen erzeugen.

Reprsentationssprachen bestehen aus Symbolen


(Relationen, Wrtern, ...) und Kombinationsregeln fr diese
1

Elemente.

x,yHaving(x)Haver(Speaker,x)HadThing(y,x)Car(y)

Having

Haver

HadThing

Speaker

Car

Car

Having
POSSBY

Haver:Speaker

Speaker

HadThing:Car

Anforderungen an semantische Reprsentationen

Als Beispielszenario dienen hier Anfragen ber Restaurants,


die etwa von einem natrlichsprachlichen Beratungssystem
fr Touristen verstanden und beantwortet werden sollen.

Diskutiert werden Anforderungen hinsichtlich folgender


Eigenschaften:

Verifizierbarkeit

Eindeutigkeit

Kanonische Form

Inferenzen

Ausdrucksstrke
4

Verifizierbarkeit
Diese Eigenschaft einer semantischen Reprsentation bezieht
sich auf ihre Auswertbarkeit, d.h. auf den Bezug zu einem
modellierten Weltausschnitt, fr den die uerung etwa als
zutreffend oder nicht zutreffend bewertet werden kann.

DoesMaharaniservevegetarianfood?
Eine sehr vereinfachte semantische Reprsentation knnte die
folgende Darstellung sein:

Serves (Maharani, VegetarianFood)

Diese Reprsentation kann mit den bekannten Fakten des


Modells (der Wissensbasis) verglichen werden.

Im Erfolgsfall ist die Proposition wahr und die


Antwort Yes.

Bei Misserfolg ist die Proposition falsch und die


Antwort No (unter der closed-world assumption),
oder Unknown (open-world assumption).

Eine Beziehung zwischen der Reprsentation und dem


Modell kann auch indirekt ber Inferenzen erfolgen.

Eindeutigkeit
Natrlichsprachliche Ausdrcke sind notorisch mehrdeutig,
und dies auf vielerlei Ebenen (morphologisch, lexikalisch,
syntaktisch, semantisch, ...).

Iwannaeatsomeplacethatscloseto
ICSI.
Hier ist das direkte Objekt ein unwahrscheinlicher Kandidat
fr das semantische Objekt von eat.
Semantische Reprsentationen sollten mglichst eindeutig
sein, um auf ein Modell abgebildet werden zu knnen.
Gegenbeispiel:

HanslasdenBriefseinerMuttervor.
Mit Mehrdeutigkeit ist der Begriff der Vagheit verbunden,
der jedoch nicht immer mehrdeutige semantische
Reprsentationen (und deren Auflsung) erfordert. Dies
hngt vielmehr vom Anwendungszusammenhang ab.

IwanttoeatItalianfood.

Kanonische Form
Unterschiedliche sprachliche Oberflchenuerungen sollen
auf dieselbe semantische Reprsentation abgebildet werden.

DoesMaharanihavevegetariandishes?
DotheyhavevegetarianfoodatMaharani?
ArevegetariandishesservedatMaharani?
DoesMaharaniservevegetarianfare?
Unterschiedliche syntaktische Ausprgungen und
lexikalische Realisierungen (have,served;dishes,
food, ...) bedeuten (in einem Anwendungskontext) das
Gleiche.
Solche Lesarten knnen durch den Kontext (hoffentlich)
disambiguiert werden (word-sense disambigiation).

Syntaktische Regularitten bilden hier eine Hilfe, etwa


Aktiv- vs. Passivkonstruktionen:

Maharaniservesvegetariandishes.
VegetariandishesareservedbyMaharani.

Inferenzen
Oftmals gibt es keine direkte Entsprechung zwischen
semantischen Reprsentationen und Modellelementen.

CanvegetarianseatatMaharani?
Inferenzen (Schlussfolgerungen, Ableitungen) mssen hier
fr eine Beziehung zwischen semantischer Reprsentation
und dem Modell sorgen.

Bei Inferenzen spielen Variablen eine wichtige Rolle, die im


Modell instanziiert werden knnen.

IdliketofindarestaurantwhereI
cangetvegetarianfood.
Eine sehr einfache Reprsentation wre hier etwa:

Serves (x, VegetarianFood)

10

Und die Ergebnisse einer Suche knnte dann die Menge aller
Instanzen fr x sein.

11

Prdikat-Argument Struktur
Vielen (wenn nicht allen) natrlichen Sprachen liegt eine
Prdikat-Argument Struktur zugrunde, und zwar sowohl im
syntaktischen Bereich wie im semantischen.

Verben werden durch ihre Valenz charakterisiert, die sich auf


die obligatorischen und fakultativen syntaktischen
Funktionen bezieht:

HansschenktseinerFraueinBuch.
HansschenkteinBuch.
*HansschenktseinerFrau.
Die syntaktischen Funktionen knnen auch durch
semantische Merkmale beschrieben werden:
(Selektionsrestriktionen, Thematische Rollen, Tiefenkasus).

hnliches lsst sich auch fr andere Wortklassen nutzen:

IchsitzeinderKirche.

InLoc (ich, Kirche)

IchgeheindieKirche.

InDir (ich, Kirche)

Makeareservationforthisevening
foratablefortwopersonsat8.
12

Reservation (Hearer, Today, 8PM, 2)

13

Prdikatenlogik und sprachliche Ausdrcke


Terme beschreiben Objekte des Modells

Konstanten stehen fr Objekte der modellierten


Welt:

Maharani, Harry, Zimmer537

Funktionen reprsentieren Kennzeichnungen von


Objekten:

LocationOf (Maharani)

Variablen stehen fr potentielle Objekte des


Modells

Prdikate beschreiben Relationen zwischen einer Anzahl


von Objekten (Argumenten):
Maharaniservesvegetarianfood.
Serves (Maharani, VegetarianFood)
Einstellige Prdikate knnen Attribute oder Kategorien
von Objekten darstellen:

Restaurant (Maharani)

Mithilfe von Konnektiven knnen komplexe Formeln


gebildet werden:
Ionlyhave5dollarsandIdonthavea
lotoftime.

14

Have (Speaker, FiveDollars) Have (Speaker,


LotOfTime))
ber die geeignete Wahl von Prdikaten, Funktionen usw.
macht die Logik keine Aussage. (!!!)

15

BNF-Definition der prdikatenlogischen Syntax

Formula AtomicFormula

Formula Connective Formula

Quantifier Variable ,... Formula

Formula

(Formula)

AtomicFormula

Term

Predicate (Term, ...)

Function (Term ,...)

Constant

Variable

Connective

Quantifier

Constant

A VegetarianFood Maharani ...

Variable

y ...
16

Predicate

Serves

Near ...

Function

LocationOf

17

CuisineOf ...

Prdikatenlogik und Wahrheit


PrdikatenlogischeFormelnerhaltenihreSemantikdurch
Wahrheitswerte(True,False)aufGrundderSachverhaltein
einemModell.

AyCarambaisnearICSI.

Near (LocationOf (AyCaramba), LocationOf (ICSI))

WenndasErgebnisderbeidenFunktionenderDefinitiondes
PrdikatsNearentspricht,dannistdieFormelwahr,ansonsten
falsch.

Wahrheitswerttabelle:

PQ

PQ

PQ

F
F
T
T

F
T
F
T

T
T
F
F

F
F
F
T

F
T
T
T

T
T
F
T

18

Die Semantik von Negation und Konjunktion entsprechen in


etwa der alltagssprachlichen Bedeutung von nicht und
und. Bei der Disjunktion und Implikation ist dies nicht so.

19

Quantoren und Variablen


Existentiell quantifizierte Variablen entsprechen oft
indefiniten Kennzeichnungen:
arestaurantthatservesMexicanfoodnearICSI
x Restaurant (x)
Serves (x, MexicanFood)
Near (LocationOf (x), LocationOf (ICSI))
Durch Instanziierung der Variablen erhlt man Ausdrcke,
die im Modell verifiziert werden knnen.
Die Gesamtformel ist dann wahr, wenn es mindestens eine
gltige Variablenbelegung gibt..

Fr allquantifierte Variablen mssen alle Instanziierungen


verifizierbar sein.
Allvegetarianrestaurantsservevegetarian
food.
x VegetarianRestaurant (x)
Serves (x, VegetarianFood)

20

Hier zeigt sich die Problematik der Implikation, die eben


nicht Kausalitt bedeutet. Auch bei falscher Prmisse ist das
Ergebnis wahr.

21

Inferenzen im der Prdikatenlogik


Das zentrale Inferenzverfahren ist Modus Ponens (wenndann Ableitungen).

Schema:

, seien Formeln

Wenn die linke Seite (Prmissen) einer Implikation wahr ist,


dann ist auch die rechte Seite (Konklusion) wahr.

Beispiel:

VegetarianRestaurant (Rudys)
x VegetarianRestaurant (x) Serves (x, VegetarianFood)
Serves (Rudys, VegetarianFood)

Prinzipiell knnen neue Fakten die Implikation aktivieren


(feuern). Bei dieser Vorwrtsverkettung (Deduktion) werden
weitere neue Fakten erzeugt, die wiederum Implikationen
auslsen knnen, usw., usf.
22

In Produktionssystemen wird die Deduktion durch


Kontrollwissen modifiziert, die ber das Feuern von Regeln
entscheidet.

Das Modus-Ponens Schema kann auch fr


Rckwrtsverkettung (Abduktion) verwendet werden.

Wenn eine Anfrageformel nicht in der Wissensbasis


enthalten ist, dann wird nach einer Implikationsregel
gesucht, deren Konklusion der Anfrage entspricht.
Wenn die Prmissen der Regel verifiziert werden knnen, ist
die Anfrageformel wahr.

In obigem Beispiel wrde die Anfrageformel


Serves (Rudys, VegetarianFood)
durch Instanziierung der Implikationsregel verifiziert.

Knnen die Prmissen nicht explizit verifiziert werden (wie


im Beispiel), dann spricht man von plausiblen Inferenzen
oder Annahmen (die Implikation ist auch dann wahr, wenn
die Prmissen falsch sind).
23

Kategorien (Konzepte und Instanzen)


Eine einfache Reprsentation fr die Typsortierung von
Instanzen (Konstanten, Objektnamen) sind einstellige
Prdikate:
VegetarianRestaurant (Maharani)
Diese Prdikate erlauben es nicht, Aussagen ber den Typ zu
machen:
MostPopular (Maharani, VegetarianRestaurant)
ist keine zulssige prdikatenlogische Formel.

Ein Ausweg besteht in der Reifikation (Verdinglichung), d.h.


die Typzugehrigkeit als Objekt zu modellieren:
ISA (Maharani, VegetarianRestaurant)
Die Relation ISA ordnet Modellobjekte einer Klasse zu.

Auf dieselbe Weise knnen dann auch Beziehungen zwischen


Klassen etabliert werden:
AKO (VegetarianRestaurant, Restaurant)

24

Durch die Relation AKO (a kind of) knnen


Klassenhierarchien aufgebaut und das Vererben von
Eigenschaften realisiert werden.

Instanzen: Modellobjekte, Objektnamen, Referenzobjekte...


Konzepte: Klassen, Typen, Begriffe, ...

25

Reprsentation von Aktionen, Ereignissen


Die semantische Darstellung von Verben und ihren
(obligatorischen und fakultativen) Argumenten durch
Prdikat ausdrcke ist problematisch.
(1)
(2)
(3)
(4)
(5)
(6)
(7)

Iate.
Iateaturkeysandwich.
Iateaturkeysandwichatmydesk.
Iateatmydesk
Iatelunch.
Iateaturkeysandwichforlunch.
Iateaturkeysandwichforlunchatmy
desk.

Logische Prdikate haben eine feste Argumentenzahl.


(1s)
(2s)
(3s)
(4s)
(5s)
(6s)
(7s)

Eating1 (Sp)
Eating2 (Sp, TS)
Eating3 (Sp, TS, D)
Eating4 (Sp, D)
Eating5 (Sp, L)
Eating6 (Sp, TS, L)
Eating7 (Sp, TS, L, D)

Wenn (7s) wahr ist, dann sind es auch die anderen Prdikate.
Eine Beziehung der Eating-Prdikate und Konzepten wie
Hunger, Nahrung ist mhselig.

Ein mglicher Ausweg: Bedeutungspostulate, wie z.B.:


w,x,y,z Eating7 (w,x,y,z) Eating6 (w, x, y)
26

Dies wrde jedoch die semantische Reprsentation von


Stzen sehr kompliziert und mhsam gestalten.
Eine Alternative wre, ein Prdikat mit maximaler
Argumentenzahl und Leerstellen zu whlen:
(1s) w,x,y Eating (Sp, w, x, y)
(2s) w,x Eating (Sp, TS, w, x)
(3s) w Eating (Sp, TS, w, D)
(4s) w,x Eating (Sp, w, x, D)
(5s) w,x Eating (Sp, w, L, x)
(6s) w Eating (Sp, TS, L, w)
(7s) Eating (Sp, TS, L, D)
Hier wrden die Formeln mit ausgefllten Argumentstellen
diejenigen mit Existenz-quantifizierten Variablen
implizieren.

Nachteil ist allerdings noch, dass alle semantischen


Beschreibungen von Essens-Aktionen mit einer Mahlzeit
verbunden sind (3. Argument). Das ist kontraintuitiv.

Auerdem sind Beziehungen zwischen den


Prdikatausprgungen formal nicht herleitbar.
IchameinMittagessen(5s)
IchaamSchreibtisch(4s)
27

impliziert nicht:
IchameinMittagessenamSchreibtisch
w Eating (Sp, w, L, D)
Was fehlt ist die Referenz auf ein spezielles Ereignis.

Hier kann wieder die Reifikation helfen, d.h. fr das Prdikat


wird ein Term eingefhrt, und die Argumentstellen werden
zu Prdikaten.
(2) Iateaturkeysandwich.
w ISA (w, Eating) Eater (w, Sp) Eaten (w, TS)

(1) Iate.
w ISA (w, Eating) Eater (w, Sp)

(6) Iateaturkeysandwichforlunch.
w ISA (w, Eating)
Eater (w, Sp) Eaten (w, TS) MealEaten (w, Lunch)

Vorteile:
Fr Verben muss keine feste Argumentanzahl
vorgesehen werden
28

Nur die im Satz spezifizierten thematischen Rollen


erscheinen in der semantischen Reprsentation
Bedeutungspostulate werden nicht bentigt;
Ereignisvariablen und ihre Instanziierungen sorgen fr
die logischen Beziehungen zwischen Formeln.

29

Reprsentation temporaler Angaben


Die zeitliche Einordnung von Aktionen und Ereignissen
wurde bisher vernachlssigt, bzw ausgeklammert.
Man unterscheidet hier zwischen Temporal-Logik und

Tempus-Logik.

Das Phnomen der Zeit kann man sich zunchst als

Zeitstrahl vorstellen, der kontinuierlich fliet.

Ereignisse sind auf diesem Zeitstrahl als Zeitpunkte


oder Zeitintervalle angeordnet.

Es gibt einen ausgezeichneten Zustand JETZT, relativ


zu dem Vergangenheit, Gegenwart und Zukunft
angeordnet werden knnen.

Beispiele fr dieselbe Ereignissorte aber mit


verschiedenem Tempus:
(1) IarrivedinNewYork.
(2) IamarrivinginNewYork
(3) IwillarriveinNewYork.
Ohne Bercksichtigung der Tempusunterschiede:
30

w ISA (w, Arriving)


Arriver (w, Speaker) Destination (w, NewYork)

Zeitliche Information kann der Ereignisvariablen zugewiesen


werden, beispielsweise ber:
die Dauer des Ereignisses (Intervall)
das Ende des Ereignisses (Zeitpunkt)
die Relation zum JETZT-Zeitpunkt (Sprechzeit)

Fr die Beispiele (1) (3) knnte das wie folgt aussehen:


(1s) i, e, w ISA (w, Arriving)
Arriver (w, Speaker) Destination (w, NewYork)
IntervalOf (w, i) EndPoint (i, e) Prec (e, Now)
(2s) i, e, w ISA (w, Arriving)
Arriver (w, Speaker) Destination (w, NewYork)
IntervalOf (w, i) MemberOf (i, Now)
(3s) i, e, w ISA (w, Arriving)
Arriver (w, Speaker) Destination (w, NewYork)
IntervalOf (w, i) EndPoint (i, e) Prec (Now, e)

31

Leider (und typischerweise) ist die Beziehung zwischen


Verbtempus und Zeiteinheiten nicht trivial:
(4)WeflyfromSanFranciscotoBostonat10.
(5)Flight1390willbeatthegateanhournow
(6)Flight1902arrivedlate.
(7)Flight1902hadarrivedlate.

32

33

1.

Die ermordete Frau M. wurde in ihrer Wohnung


in der Y-Gasse 7 kurz vor Mitternacht von ihrer
Nachbarin, Frau N., aufgefunden, die sofort die
Polizei rief.

2.

Laut Amtsarzt Dr. Z. muss die Tat zwischen 22.30


und 23.30 ausgefhrt worden sein.

3.

Verdchtigt wurde Herr K. aus O.-hausen, der


nachweislich die Bar Annabell in D.-burg um
23.10 Uhr verlassen hatte.

4.

Von der Bar Annabell bis zur Y-Gasse 7 braucht


man mindestens 30 Minuten.
34

Die Temporallogik von J. Allen


[Allen 1983, 1984]
Als Basiseinheiten werden Zeitintervalle angenommen, die
beliebig klein sein knnen (und dadurch quasi Zeitpunkte
sein knnen).
Fr zwei Zeitintervalle A und B gilt, dass sie in genau 13
Relationen zueinander stehen knnen, z.B.:
(A before B)
(A overlaps B)
(A meets B)

Der Kalkl definiert Zusammenhnge der Relationen


zwischen mehreren Zeitintervallen (Transitivitt).

Wenn bekannt ist, dass


35

(A Relation1 B) und (B Relation2 C)


dann lassen sich Aussagen darber machen, in welcher
Relation A und C stehen knnen, z.B.:
(A overlaps B) (B meets C)
(A before C)

36

Die 13 primitiven Relationen zwischen Zeitintervallen:


Relation

Symbol

Inverse
Relation

Beispiel

_________________________________________________________________

(A before B)

<

>

AAAA BBBB

(A equals B)

AAAA
BBBB

(A meets B)

mi

AAAABBBB

(A overlaps B)

oi

AAAA
BBBB

(A during B)

di

AAAA
BBBBBBB

(A starts B)

si

AAAA
BBBBBB

(A finishes B)

fi

AAAA
BBBBBB

37

Netzwerkdarstellung temporaler Relationen


Intervalle lassen sich als Knoten in einem Netzwerk
reprsentieren, die durch zeitliche Relationen miteinander
verbunden sind. Hierdurch lassen sich Verkettungen von
Ereignissen modellieren.

1.

(A during B)

NA ---(d) NB

2.

(A during B)
(A before B)
(B during A)

NA ---(< d di) NB

3.

(A before B)
(A after B)
(A meets B)
(B meets A)

NA ---(< > m mi) NB

Man kann alle Relationen auch mithilfe der meets-Relation


und Hilfsintervallen definieren:

(A during B)
w, x, y, z (w meets x meets A meets y meets z)
(w meets B meets z)
(A starts B)
x, y, z (x meets A meets y meets z)
38

(x meets B meets z)

39

40

Reprsentation von berzeugungen (Beliefs)


Eine Reihe von sprachlichen Ausdrcken sind nicht ohne
weiteres auf die reale Welt bzw. auf eine modellierte Welt
abbildbar:
glauben,wnschen,sichvorstellen,wissen,...
Die Objekte dieser Verben sind oft (dass-) Stze und drcken
Beziehungen zwischen dem Subjekt und einer
hypothetischen Welt, bzw. mglichen Welt aus.
IbelievethatMaryateBritishfood.

Die reifizierte Reprsentation von Ereignissen knnte die


folgende Darstellung nahelegen:
u, v ISA(u, Believing) ISA(v, Eating)
Believer(u, Speaker) BelievedProp(u, v)
Eater(v, Mary) Eaten(v, BritishFood)
Bei der Konjunktion mssen jedoch alle Formeln wahr sein,
d.h. auch die drei, in denen nur die Variable v vorkommt.

Die einfachere Darstellung von Verben als Prdikate hilft


auch nicht:
Believing (Speaker, Eating (Mary, BritishFood))
41

Dies ist auerdem kein gltiger Ausdruck, denn die


Argumente von Prdikaten mssen Terme sein.

Der Ausweg besteht in der Einfhrung von Operatoren, die


vollstndige logische Formeln als Argumente haben.

Believes ( u Believer(u, Speaker),


v ISA(v, Eating)
Eater(v, Mary) Eaten(v, BritishFood)

Dies ist jedoch eine Anreicherung der Prdikatenlogik und


erfordert u.a. zustzliche Inferenzmechanismen, wie fr alle
Modallogiken.
Problematisch ist z.B. die Gleichheit von Termen:
SnowhasdelayedFlight1054.
Johnssistersflightservesdinner.
Wenn diese Terme referenzidentisch sind, knnen sie
substituiert werden.
Dies funktioniert nicht mehr bei Modallogiken:
JohnknowsthatsnowhasdelayedFlight1054.
Johnknowsthathissistersflightserves
dinner.
42

Hieraus kann nicht gefolgert werden:


Johnknowsthatsnowhasdelayedhissisters
flight.
Man unterscheidet hier zwischen referentiell opaken und
referentiell transparenten Kontexten.

43