1. Einfuhrung
Vorbemerkungen
1 Einfuhrung
% Vorbemerkungen
% Wissen
% Wissensverarbeitung
% Wissensmanagement
% Data Mining
% Die Folien zur Vorlesung (Skript) stehen auf der Homepage vor der
Vorlesung zur Verfugung.
% Format: PDF, zwei- und vierseitig
% Sie konnen
also die ausgedruckten Folien mit in die Vorlesung brin-
gen und dort mit schriftlichen Bemerkungen versehen.
% Benutzen Sie zum Drucken bitte die vierseitige Version des Skriptes.
1. Einfuhrung
Vorbemerkungen
Ubungen
% Bearbeitungszeit: abhangig
von den Aufgaben, i.d.R. eine oder zwei
Wochen
% LN: Ubungsaufgaben
++, (Richtlinie 50% der zu vergebenden Punk-
te)
% Prufung
Diplom: Zusammen mit dem Stoff aus dem 6. Semester fur
Ausgewahlte Kapitel ...
% Prufungsform:
mundlich
(Witt/Becker)
% Prufungstermine:
7.2.2001 und 3.4.2001
1. Einfuhrung
Vorbemerkungen
Literatur
C. Beierle, G. Kern-Isberner, Methoden wissensbasierter Systeme,
Vieweg, 2000.
J. Heinsohn, R. Socher-Ambrosius, Wissensverarbeitung: Eine Einfuhrung,
Spektrum Akademischer Verlag, 1999.
K. W. Tracy, P. Bouthoorn, Object-oriented Artificial Intelligence Using
C++, Computer Science Press, 1997.
E. Rich, Artificial Intelligence, McGraw-Hill, 1983.
M. R. Genesereth, N. J. Nilsson, Logische Grundlagen der Kunstlichen
Intelligenz, Vieweg, 1989.
T. A. Runkler, Information Mining, Vieweg, 2000.
M. Ester, J. Sander, Knowledge Discovery in Databases, Springer,
2000.
Inhalt (geplant)
1. Einfuhrung
2. Intelligente Suchverfahren
3. Aussagen- und Pradikatenlogik
6. Clusteranalyse
7. Probabilistische Netze
1. Einfuhrung
Wissen
Auswirkungen von
1 Euro = 0.96 Dollar
Wissen
auf Zinsen und
Aktienkurse
Ergebnis
eines
Lernvorgangs
Devisenkurs Information
1 Euro = 0.96 Dollar
Kontext
0.96 Daten
1. Einfuhrung
Wissen
Wissen, Kennen, Konnen
% konnen,
wenn es sich um motorische Fahigkeiten handelt.
Ableitung
przise
unsicher
Wissen Art
unvollstndig
vage
Reprsentation
1. Einfuhrung
Wissensverarbeitung
Wissensebenen
% Reprasentationsebene
(z.B. Aussagenlogik, Pradikatenlogik)
% Implementierungsebene (z.B. Prolog-Statements)
Wissen
Daten (Fakten
Software und Wissens
Entwickler Regeln) ingenieur
Programm Inferenz
maschine
1. Einfuhrung
Wissensmanagement
Wissensmanagement
Wissensmanagement
Knowledge management
Wissenserschlieung Wissensverteilung
Data Warehouse
Knowlede Discovery Information Retrieval
Data Mining Wissensportale
Dokumentenanalyse Wissenslandkarten
Multimedia Discovery DokumentenManagement
XML und KM Workflow Management
WWW und KM
1. Einfuhrung
Wissensmanagement
3,4,5 3
4
5
Data Warehouse
Informationsspeicherung
Informationsverdichtung
% die fur
einen groen Teil des Datenbestandes gultige,
% bislang unbekannte,
% potentiell nutzliche
und
% leicht verstandliche
Zusammenhange zum Ausdruck bringen.
1. Einfuhrung
Data Mining
ClusterAnalyse
Klassifikation
Mustersuche
2. Suchverfahren Einfuhrung
2 Suchverfahren
Farbeproblem
B
C
D E
Beispiel 2.1. Die angegebene Landkarte mit den Landern A, B, C, D
und E ist so mit den Farben rot, blau, gelb und orange zu farben, da
keine zwei benachbarten Lander die gleiche Farbe haben.
2. Suchverfahren Einfuhrung
Farbeproblem (2)
Ineffizient!
Suchbaum
Farbeproblem (3)
[,,,,,]
H
Es scheint sinnvoller zu sein, die Lander der Rei-
A > o
A > b
he nach zu farben.
A > r
H
A > g
So kann man Zwischenzustande bei der Pro-
[b,,,,] [r,,,,] [g,,,,] [o,,,,]
blemlosung
durch Teilfarbungen beschreiben, et-
B > r B > o
wa
IJ
U
XQ
P
K
KL
QRDS
KV
RW
NM O
TO
B > g
IJ
P
H
QRDS
RDQ S
XT
TO
H
[b,g,r,,] [b,g,o,,]
Die Problemlosung startet mit der leeren
XI
Farbung .
D > o D > r H
Ziel ist es, eine komplette zulassige
Farbung zu
[b,g,r,o,] [b,g,o,r,] erreichen.
H
E > g E > g
Die Schritte im Laufe der Problemlosung las-
sen sich durch Zustandsubergangsoperatoren
[b,g,r,o,g] [b,g,o,r,g] beschreiben.
Wissensverarbeitung und Data Mining FH Bonn-Rhein-Sieg, WS 01/02 23 Wissensverarbeitung und Data Mining FH Bonn-Rhein-Sieg, WS 01/02 22
2. Suchverfahren Einfuhrung
Suchbaum (2)
% Die Losung
des Farbeproblems sich als Suchbaum darstellen.
lat
2. Suchverfahren Einfuhrung
Routenproblem
B E
A
Ziel
Start F
C D
Beispiel 2.2. Gegeben ist eine Karte mit Stadten und Straen, die die
Stadte miteinander verbinden.
Suchbaum: Tafel .
Zustandsraum
2. Suchverfahren
Fur
Suchproblem lat
sich das Wissen reprasentie-
ren durch:
H
Ein Zustand stellt das Wissen zu einem be-
stimmten Zeitpunkt der Losungsfindung dar.
Zustandsubergangsoperatoren
beschreiben, wie
ausgehend von einem Zustand andere Zustande
angeben.
Die Menge der Zielzustande charakterisiert die
dar.
Losungen
des Problems. Zielzustande lassen
sich in der Regel nur implizit angeben, z.B. uber
27
% Die Berechnung der Nachfolger eines Knotens Y wird als Expansion
Wissensverarbeitung und Data Mining FH Bonn-Rhein-Sieg, WS 01/02 26
2. Suchverfahren Zustandsraum
Uninformierte Suchverfahren
31
Zu Beginn der Suche besteht die Agenda aus
Uninformierte Suchverfahren (3)
_`
\^]
aus der Agenda genommen.
_`
\^]
d.h. alle Nachfolger von
gleichen Schema ab.
dem Startzustand.
gefunden.
da eingefugt.
_`
\]
_`
werden.
Losung
2. Suchverfahren
\^]
Wenn
_`
\^]
Ist
[ [ [ [ [ [
2. Suchverfahren Uninformierte Suchverfahren
Tiefensuche
Z Liefert ein Knoten, der kein Zielknoten ist, keine neuen Knoten, so
wird die Suche fortgesetzt an dem nachstgelegenen Knoten, fur
den
noch nicht alle Nachfolger expandiert wurden.
33
D
_`
\]
G
C
A
B
E
K
Tiefensuche (2)
F
H
A
(E,F,C,D)
(K,F,C,D)
C
Agenda
(G,H,D)
(B,C,D)
(F,C,D)
(C,D)
G
(A)
Schritt
B
1
2
3
4
5
6
7
E
K
2. Suchverfahren
2. Suchverfahren Uninformierte Suchverfahren
Breitensuche
35
D
_`
\]
G
C
D
A
B
E
F
Breitensuche (2)
(D,E,F,G,H)
(E,F,G,H,I)
(F,G,H,I,K)
A
(C,D,E,F)
C
(G,H,I,K)
Agenda
(B,C,D)
G
(A)
Schritt
B
1
2
3
4
5
6
7
E
K
2. Suchverfahren
2. Suchverfahren Uninformierte Suchverfahren
Algorithmen
Algorithmus 2.1. [Tiefensuche]
Beispiel 2.4. Ein Weinhandler hat drei Kruge,
Beispiele
einen von 9 Liter, einen von 7 Liter und einen von
4 Liter Inhalt.
g l
c h
Tafel .
Wissensverarbeitung und Data Mining FH Bonn-Rhein-Sieg, WS 01/02 39 Wissensverarbeitung und Data Mining FH Bonn-Rhein-Sieg, WS 01/02 38
2. Suchverfahren Uninformierte Suchverfahren
Definition 2.1. Ein Suchverfahren heit vollstandig, wenn fur
jeden
Suchbaum jeder Knoten expandiert werden konnte, solange noch kein
Zielknoten gefunden wurde.
Z Ein vollstandiges
Suchverfahren ist fair in dem Sinne, da jeder Kno-
ten die Chance hat, expandiert zu werden.
Z Ein vollstandiges
Sucherfahren findet auch bei unendlichen
Suchbaumen
stets eine Losung, falls eine existiert.
Z Breitensuche ist vollstandig.
Z Tiefensuche ist nur bei endlichen Suchbaumen
vollstandig.
Breitensuche findet eine optimale Losung (falls existent), Tiefensuche
nicht.
Komplexitaten:
Z Fur
Breiten- und Tiefensuche ist der ungunstigste
Fall, da die
Losung
in der auersten rechten Ecke des Suchbaums liegt.
Z q
Zeitkomplexitat
r d |
, mit
q
Verzweigungsrate und
uq
Tiefe
des Zielknotens.
Z Bei der Tiefensuche enthalt
die Agenda die Knoten des aktuellen
q r uz|
Suchpfades sowie deren Nachfolger
Platzkomplexitat .
Z Bei der Breitensuche kann die Agenda eine komplette Ebene des
q
r d |
Suchbaums enthalten
Platzkomplexitat .
Informierte Suchverfahren
Z Fur
groere
Suchbaume sind Breiten- und Tiefesuche nicht effizient
genug.
Z Vielversprechender sind Ansatze,
bei denen Problemwissen zur
Steuerung des Suchprozesses eingesetzt wird.
Z Dies kann dadurch geschehen, da die Zustande
(Knoten) danach
bewertet werden, wie erfolgversprechend sie sind.
Z Man schatzt
beispielsweise fur
jeden Knoten, wie nahe er an einem
Zielknoten liegt.
Z Solch eine Bewertung nennt man heuristische Funktion.
Heuristische Funktion
45
.
Wissensverarbeitung und Data Mining FH Bonn-Rhein-Sieg, WS 01/02
Heuristische Funktion (2)
3
4
5
heuristische Funktionen:
Beispiel 2.5. [Schiebepuzzle]
richtigen Stelle liegen.
8
2
4
1
3
5
6
7
\ \
Startzustand
* *
\ \
2. Suchverfahren
Mogliche
Hier:
Hier:
* *
stand
[ [
2. Suchverfahren Informierte Suchverfahren
1 2 3 1 3 1 3
8 4 8 2 4 8 2 4
7
m"6q 5 7 6
m q 5 7 6
m1q 5
q q iq
Z kann Zustande
unterscheiden, die von
gleich bewertet werden.
Bestensuche
Z Bei der Bestensuche erfolgt die Expansion eines Knotens auf Basis
der heuristischen Funktion.
Z Hierzu werden in der Agenda die Knoten zusammen mit ihrer Bewer-
tung abgelegt.
Z Es wird nun jeweils der Knoten der Agenda expandiert, der die ge-
ringste Bewertung aufweist.
Z Die Agenda hat also die Form einer Prioritatswarteschlange
(priority
queue).
Z Ansonsten ist die Bestensuche analog zur Tiefen- und Breitensuche.
49
_`
\^]
D:6
G
C
A
B
H:2
C:5
Agenda
B:4
A:9
F:8
Schritt
K:
E:7
2. Suchverfahren
1
2
3
4
2. Suchverfahren Informierte Suchverfahren
k 2.4. Eine heuristische Funktion heit
Definition r |1fair
k gdw. es zu je-
dem nur endlich viele Knoten a gibt mit a .
an.
Bestensuche und Optimalitat
2. Suchverfahren
Definition
Die Kosten
a erreichbar.
yr |
Beim Ubergang
[
Die Bestensuche vernachlassigt die Kosten bei
der Anwendnung der Operatoren.
2.5. Es sei
[
Wird die Gute
einer Losung charakterisiert durch
diese Operatorkosten, so findet die Bestensuche
yr |(oDq
von a nach a^
allgemein keine optimale Losung.
a a
Beispiel 2.7. Routenproblem: Man finde einen
kurzesten
Weg von A nach B. Die heuristische
f///3
ymr
Funktion sei als die Luftlinienentfernung zum Ziel-
z|
B
Bewertung von Losungen
Ziel
A D
von
C
yr
Bestensuche wahlt
A,B,D, obwohl A,C,D kurzer
ist.
a a ^
z|
53
a eine Folge von Zustanden
Informierte Suchverfahren
auf
Wissensverarbeitung und Data Mining FH Bonn-Rhein-Sieg, WS 01/02 52
2. Suchverfahren Informierte Suchverfahren
Zulassiger
Schatzer Fur
ymr "
ymr "
a
a
2. Suchverfahren
r |
h r |
| q r
| q f3h
a
|
oDq
oDq
\
r /|
zulassiger
Schatzer
bzw. zulassig gdw.
bzw.
\
\
fur
alle Zustande des Zustandsraums.
einen Zustand a sei:
fyr |
fyr |
Beispiel 2.8. Zulassige
Schatzer sind:
Problem: Finde (falls moglich)
[
die heuristischen Funktionen aus Beispiel 2.3 fur
das Schiebepuzzle und ist Zielzustand .
[
die Luftlinienentfernung beim Routenproblem.
[
Bei kombinatorischen Optimierungsproblemen
werden als zulassige
Schatzer
haufig effizient
losbare Relaxationen des Problems verwendet.
Beispiel: minimaler Spannbaum als Relaxation
fur
die Berechnung eines minimalen Hamilton-
a in einen Zielzustand , die minimale Kosten aufweist, d.h.
schen Weges.
ist Weg vom Startzustand nach a
ist Weg von a zu einem Zielzustand
54
Informierte Suchverfahren
Der A*-Algorithmus
2. Suchverfahren
Fall sein!
Der A*-Algorithmus basiert auf:
Closed verwaltet.
\
1. einer Bewertung fur
die Zustande, wobei
r |
die bisher geringsten Kosten zur Erreichung
\
des Zustands angibt,
2. einer (ublicherweise
zulassigen) heuristischen
\
\
\
57
schon expandierte Knoten der
Informierte Suchverfahren
Fuge
in die Agenda ein; Der A*-Algorithmus (3)
Algorithmus 2.4. [A*]
Problem hat keine Losung; STOP;
_`
\^]
_`
\]
Entferne aus der Agenda;
_`
Fuge
in Closed ein;
\^]
ist Zielknoten
ist Losung; STOP;
^
%
$
"!
"(
#
'&
)
!
(
#
^
Fuge
in die Agenda mit Bewertung ein;
+
$
,&
%
$
!
"(
#
&
)
!
(
#
^
^
Wissensverarbeitung und Data Mining FH Bonn-Rhein-Sieg, WS 01/02 59 Wissensverarbeitung und Data Mining FH Bonn-Rhein-Sieg, WS 01/02 58
.
.
.
.
2. Suchverfahren Informierte Suchverfahren
A*-Anwendungsbeispiel
Fur
2. Suchverfahren
/
Asymetrisches Traveling Salesman Problem:
besten Weg an.
9
einen Knoten
/
ausgeschlossen sind
gibt
9
Zustandsubergang:
Ein- bzw. Ausschlu einer
0213/54
Kante
9
Zielzustand: enthaltene Kanten
man von sukzessive den Verweisen
9
06187
4
Schatzung: des Suchpfades.
/
Fur
eine Tour mu man jede Stadt mindestens
folgt.
Der A*-Algorithmus (4)
60
Informierte Suchverfahren
;
<
&
Ohne Kante : 129 Entfernungsmatrix:
;
<
&
Mit Kante : 18 + 63 = 81 1 2 3 4 5 6
:
1 3 93 13 33 9
:
1 2 4 5 6 2 4 77 42 21 16
:
:
1 0 2 30 6 3 45 17 36 16 28
:
:
2 0 30 17 12 4 39 90 80 56 7
:
:
3 29 1 12 0 5 28 46 88 33 25
:
:
4 32 83 49 0 6 3 88 18 46 92
:
5 3 21 0 0
Erste Abschatzung: 81
=
;
<
;
&
&
Mit und ohne : 113
Reduzierte Matrix:
=
;
<
;
&
&
Mit und mit : 81
1 2 3 4 5 6
:
1 2 4 5 1 0 75 2 30 6
:
:
1 0 2 30 2 0 58 30 17 12
:
:
2 0 30 17 3 29 1 12 0 12
:
:
3 29 1 0 4 32 83 58 49 0
:
:
5 3 21 0 5 3 21 48 0 0
:
6 0 85 0 35 89
Wissensverarbeitung und Data Mining FH Bonn-Rhein-Sieg, WS 01/02 63 Wissensverarbeitung und Data Mining FH Bonn-Rhein-Sieg, WS 01/02 62
Informierte Suchverfahren
64
: 104
: 104
: 114
: 103
: 127
> =
@ ?
& & &
>
, ohne
@ & ? ? ? &
: 101
: 84
< @
& & & &
> >
, ohne
, ohne
? & ? &
= = =
: 84
? ? ?
& & & & &
> >
, ohne
, ohne
? ? & ? & ? ? & ?
: @ @ @
28
& & & & & &
; ; : ; ; ; ; ; ;
4
0
< & < & < & < & < & < & < & < &
:
20
2
Mit
Mit
Mit
Mit
Mit
Mit
Mit
1
3
5
.
Fur
ACBED und FHG D man den Dijkstra-Algorithmus.
erhalt
.
Fur
AIG D man die Bestensuche.
erhalt
.
Fur
AIG J und FHG D man die Breitensuche.
erhalt
.
Fur
und
AKG man die Tiefensuche, wenn man Wie-
erhalt LMJ FNG D
derbelebungen verbietet (Ubergang von Closed in die Agenda).
F
Eigenschaften von A*
den.
2. Suchverfahren
knoten,
Satz 2.1. [Terminierung, Fairness] Es gelte:
ist zulassig.
ausgehend von
9
021"W\4
Jeder Zustand besitzt nur endlich viele Nachfol-
W
P
O
&
es existiere , so da fur
die Kosten bei
P
%
S
Q
R
&
einem Zustandsubergang
stets
Es gelte:
gilt und
9
es gibt einen erreichbaren Zielzustand.
XY1ZW[4
mit dem Erreichen eines Zielzustandes.
und
U
Beweis. Tafel .
67
Dann ist der Zielknoten , mit dem A* terminiert, ein optimaler Ziel-
Informierte Suchverfahren
Beweis. Tafel . ]
Korollar 2.3. Gegeben seien die Voraussetzungen von Satz 2.2. Der
gefundene optimale Zielknoten sei . Dann wurden wahrend des Laufs
W
von A* nur Zustande mit / expandiert.
^_1`/a4cbdXe1ZW\4
Wahl guter Schatzer
.
Die Eigenschaften der heuristischen Funktion haben einen wesentli-
chen Einflu auf die Performanz der Suche mit A*.
.
Eine zulassige
heuristische Funktion ist um so besser, je naher sie
dem Optimalwert zur Erreichung eines Zielzustandes kommt.
.
F f besser informiert als F gdw. Fh13/54cijF f 13/a4 fur
alle Zustande / gilt.
.
F f nicht schlechter informiert als F gdw. Fh13/54kbjF f 13/a4 fur
alle Zustande
/ gilt.
Wahl guter Schatzer (2)
.
Gegeben sind die Voraussetzungen von Satz 2.2,
.ml l
bzw. f
seien A*-Algorithmen, die zulassige
Schatzer F bzw. F f
verwenden und
.
F f sei besser informiert als . F
V l l
Dann wird jeder Zustand , der von / f expandiert wird, auch von
expandiert.
Beweis. Tafel . ]
Monotone Schatzer
F
heuristische Funktion heit monotoner Schatzer gdw. gilt:
.
Fh1ZW\4on D fur
alle Zielzustande . W
.
Fur
alle Zustande / und alle Nachfolger /pf von / gilt:
Fh13/54kbjAY13/rqs/ f 4utvFh13/ f 4
Beispiel 2.9. Alle Schatzer aus Beispiel 2.8 sind auch monotone
Schatzer.
72
Ist der Knoten durch Expansion des Knotens
Schatzer.
Monotone Schatzer
.
P
w
*
entstanden, so gilt
U
P
Satz 2.5. Es gelte:
mehr selektiert.
Beweis. Tafel .
Dann ist
2. Suchverfahren
und
9 9 T T T
.
Zustandsraum: Zustande, Zustandsuberg
ange, Startzustand, Ziel-
zustande
.
Systematische Suche im Zustandsraum: Breitensuche, Tiefensuche
.
Heuristische Funktionen: Schatzung der Entfernung zum Ziel
.
Bestensuche garantiert keine Optimalitat
.
A*: Operatorkosten plus heuristischer Funktion
.
A* liefert optimale Losungen bzgl. Operatorkosten
9
Prognosen, logische Ableitungen erstellen
x
y
9
Es ist Fakten und Regeln gegeben. Was
Reprasentation von Wissen durch Formeln eines
kann daraus gefolgert werden? Beispiel: Wenn
adaquaten Logikkalkuls
es regnet, dann ist die Strae na. Was kann aus
9
der Tatsache, da es regnet, gefolgert werden? Herleitung (Inferenz) von neuem Wissen auf Ba-
sis der Kalkuls.
9
Erklarungen finden
x
y
Wie lat
sich ein Fakt mit Hilfe der Regeln Anwendungsgebiete der Logik in der Wissensverar-
erklaren? Beispiel: Die Strae ist na. Wie kann beitung:
das sein?
9
Inferenz in Expertensystemen
9
Hypothesen prufen
9
x
y
Logikprogrammierung, deduktive Datenbanken
Konnen aus den Fakten und den Regeln
z
9
Wissensverarbeitung und Data Mining FH Bonn-Rhein-Sieg, WS 01/02 75 Wissensverarbeitung und Data Mining FH Bonn-Rhein-Sieg, WS 01/02 74
.
.
.
.
3. Logik Inferenz
3. Logik
Arten der Inferenz
unprazise
9
Deduktion
Zum Starten eines Autos ist eine aufgeladene
raumlich-zeitliches
Batterie notwendig. Bei unserem Auto ist die Bat-
Angaben
Qualifikationsproblem
terie leer. Wir schlieen, da wir unser Auto nicht
starten konnen.
Wissen
9
Induktion
Wir haben wiederholt beobachtet, da ein Auto
Logik
nicht startet und die Batterie leer ist. Wir haben
Abduktion
Zum Starten eines Autos ist eine aufgeladene
Batterie notwendig. Unser Auto lat sich nicht
starten. Wir schlieen, da die Batterie leer ist.
77
Inferenz
Signatur
Am Beispiel der Aussagenlogik erklaren wir schrittweise wichtige Ele-
mente eines logischen Systems.
.
Zunachst
benotigt ein logisches System ein Vokabular,
.
d.h. eine Menge von Namen, die Dinge der realen Welt beschreiben
konnen.
.
Eine derartige Menge von Namen wird als Signatur bezeichnet und
ublicherweise
durch gekennzeichnet.
{
.
Den Namen ist i.d.R. eine gewisse Stelligkeit zugeordnet.
3. Logik Aussagenlogik
Aussagenlogische Signatur
{}|u~n \g5q[p\[5\q[p[\5a a[
Formeln
.
Formeln ermoglichen
es, Dinge der reprasentierten Welt auszu-
drucken.
.
Formeln entsprechen einer gewissen Syntax (sie sind wohlgeformt).
.
Diese Syntax legt eine Wissensreprasentationssprache fest.
.
Formeln sind ublicherweise
rekursiv aufgebaut.
.
Die atomaren Formeln ergeben sich aus der Signatur.
.
Mit logischen Verknupfungsoperatoren
(den Junktoren) werden aus
atomaren Formeln schrittweise komplexere Formeln aufgebaut.
sind aussagenlogi-
81
eine aussagenlogische Signa-
Aussagenlogische Formeln
Die Elemente der Menge
genlogische Formeln:
ist die Menge
Definition 3.2. Fur
und
meln.
Falls
3. Logik
tur
benutzen statt dessen die folgenden Bindungsprio-
weise verzichten wir i.d.R. auf die Klammerung und
Bemerkung 3.1. Zur Vereinfachung der Schreib-
82
Aussagenlogik
Aquivalenz
Implikation
Negation
ritaten:
3. Logik
3. Logik Aussagenlogik
-Interpretation
Die Syntax einer Logik legt ausschlielich deren auere Form fest,
sie sagt aber nichts uber
die Bedeutung der Formeln aus.
Benotigt wird eine Verbindung zwischen den syntaktischen Elemen-
ten der Logik und den Objekten der zu reprasentierenden Welt.
Diese Verbindung wird durch eine sogenannte -Interpretation her-
gestellt.
Eine -Interpretation einer Signatur ist die Zuordnung von den Ele-
menten der Signatur (Namen) zu den Elementen der zu reprasen-
tierenden Welt.
Erfullungsrelation
Belegung
Definition 3.3. Es sei eine aussagenlogische
Die Interpretation liefert uns nur einen Wahrheits-
Signatur.
wert fur
die atomaren Formeln.
"
Wir benotigen eine Ausdehnung der Semantik Eine Abbildung heit
aussagenlogische Interpretation oder Belegung
auf alle Formeln .
fur
.
Dieses stellt uns eine Erfullungsrelation
bereit.
,
bezeichnet die Menge der Belegungen
fur
.
Durch solch eine Erfullungsrelation
ist definiert,
ob eine Formel in einer -Interpretation wahr Beispiel 3.2. Fur die Signatur aus Beispiel 3.1 ist
ist oder nicht, d.h. definiert durch
Eine Erfullungsrelation
definiert hierzu im we-
sentlichen die Semantik der Junktoren.
eine mogliche Belegung.
Wissensverarbeitung und Data Mining FH Bonn-Rhein-Sieg, WS 01/02 85 Wissensverarbeitung und Data Mining FH Bonn-Rhein-Sieg, WS 01/02 84
(nicht-
atomare) aussagenlogische Formeln. Durch die fol-
86
Aussagenlogik
ausgedehnt:
Semantik der Aussagenlogik
gelte:
,
Definition 3.4. Es seien
gdw.
von auf die Menge
und
3. Logik
Fur
3. Logik Aussagenlogik
Modell
erfullt
und
bezeichnen als -Modell fur
.
Fur
eine Menge von Formeln gelte gdw. \3
fur
alle . ist dann ein Modell fur
die Formelmenge .
Erfullbarkeit
Formel
Dagegen ist
Besonders interessant sind Formeln, die fur
alle In-
terpretationen wahr bzw. falsch sind.
Kraht
der Hahn auf dem Mist, andert sich das
Wetter oder es bleibt wie es ist
[p\[
Definition 3.6. Eine Formel heit
kein Modell fur
erfullbar
gdw. es ein Modell fur
die Formel gibt.
\g5
unerfullbar
(Kontradiktion) gdw. es kein Modell
die Formel
fur
die Formel gibt.
Modell (2)
[p\[
5[\5
allgemeingultig
(Tautologie) gdw. jede Interpreta-
5
falsifizierbar gdw. es eine Interpretation gibt, die
kein Modell fur die Formel ist.
mengen verwendet.
aus Beispiel 3.2 ist ein Modell fur
Aussagenlogik
88
die
Modus Ponens
In einem wissensbasierten System wollen wir
Modus Tollens
Wir konnen eine Wissensbasis als eine Menge
betrachten.
Eine solche Menge entspricht Und-Elimination
der Konjunktion .
Unser ubliches
Verstandnis
von Folgerung lat
sich so ausdrucken:
Ist eine Formel immer Oder-Introduktion
dann folgt aus .
Damit konnen wir die Erfullungsrelation
auf Resolutionsregel
eine Beziehung zwischen Formeln und Formel-
mengen ausdehnen.
Wissensverarbeitung und Data Mining FH Bonn-Rhein-Sieg, WS 01/02 91 Wissensverarbeitung und Data Mining FH Bonn-Rhein-Sieg, WS 01/02 90
gdw. je-
gdw. je-
bzw. aus
aussa-
92
Aussagenlogik
gdw.
G ist.
G ist.
Semantische Folgerung (2)
.
F auch ein Modell fur
gelte
gelte
In diesem Fall schreiben wir
eine Formelmenge
Definition 3.7. Es seien
folgt semantisch .
gilt.
Formelmengen
genlogische Formeln.
des Modell fur
alle
fur
Fur
Fur
3. Logik
3. Logik Aussagenlogik
\g5
5[\ \ 5
[ p\[
\ 5[\gp[
\g5
Kann aus die Aussage 5 [p\[gp[ gefolgert werden, d.h. gilt
5[\p[ ?
2. Besitzer wertvoller Mobel ( ) sollten keine Katze anschaffen, da die-
se die Mobel zerkratzen wurde.
3. Ein Hund erfordert ein freistehendes Haus ( ), damit sich kein Nach-
fuhlt.
bar durch das Bellen gestort
3. Logik Aussagenlogik
ist Tautologie gdw. " ist unerfullbar.
gdw. ist Tautologie.
gdw. $#%"&
ist unerfullbar.
Bemerkung 3.2. Die Aquivalenzen
konnen auf Formelmengen %('
ausgedehnt werden.
3. Logik Aussagenlogik
Kalkul
Schon das kleine Beispiel 3.6 verdeutlichte, da Inferenz auf Basis
der Definition der semantischen Folgerung ineffizient ist.
Allgemein mussen
fur
eine Formelmenge mit ) verschiedenen
schen Form) (Bedingungen) eine For-
mel der Form (Schlussfolgerung) abgeleitet
werden kann.
So konnen aus den Tautologien von Beispiel 3.4 Ein Kalkul
besteht aus einer Menge von logi-
Inferenzregeln gebildet werden. Aus dem Modus schen Axiomen und Inferenzregeln.
Ponens ergibt sich die Inferenzregel:
Die Axiome sind entweder eine Menge von ele-
mentaren Tautologien (positiver Kalkul)
oder
eine Menge von elementaren Widerspruchen
Ist eine Formel aus den Formeln (negativer Kalkul).
durch eine Folge von Anwendungen der Infe-
renzregeln ableitbar, so schreibt man
Die Inferenzregeln sind Vorschriften, nach denen
aus Formeln andere Formeln abgeleitet werden
konnen.
Wissensverarbeitung und Data Mining FH Bonn-Rhein-Sieg, WS 01/02 99 Wissensverarbeitung und Data Mining FH Bonn-Rhein-Sieg, WS 01/02 98
3. Logik Aussagenlogik 3. Logik
Also gilt:
0
Ein Kalkul
ist korrekt gdw. alle syntaktischen Ab-
5[\
leitungen auch semantische Folgerungen sind,
d.h. fur
Formeln und gilt:
. \
-
impliziert
K5[\5
[ag
[p\[
5
g
Ein Kalkul
ist vollstandig gdw. alle semantischen Nochmals angewandt ergibt sich:
12 .
[p\[
Kalkul
[ag
5[\p[
konnen, d.h. fur
Formeln und gilt:
\
M
5[\
(3)
impliziert
/
der Inferenzregel Modus Ponens leiten wir ab:
Beispiel 3.7. Gegeben sei die Formelmenge
[p[\
5[
Ein Kalkul
ist widerlegungsvollstandig gdw. aus
[
/
meln und gilt:
impliziert
aus Beispiel 3.5. Mit
Aussagenlogik
100
Semantische Aquivalenz
Beispiel 3.8. Syntaktisch unterschiedliche Formel konnen identische
Wahrheitswerte haben. Man betrachte die Formeln " 546 und " 5# Z
"7 :
: : " 8; 49
}Z " 8; #%"&
: ; : :
; : : :
; ; : :
heien semantisch aquivalent gdw. < fur
jede Belegung M Z
gilt. \3
Wenn und
semantisch aquivalent sind, schreiben wir hierfur
= .
Idempotenz
Assoziativitat
Distributivitat
Absorption
Dop. Negation
Kommutativitat
Lemma 3.2. Wichtige semantische Aquivalenzen
103
Aussagenlogik
(2)
?>
>
> @> > >
>
> ?> ?> > > > >
sind:
3. Logik
3. Logik Aussagenlogik
Normalformen
Fur
die maschinelle Inferenz ist die Darstellung einer Formel in einer
standardisierten und moglichst einfachen Form wichtig.
Definition 3.9.
Eine Formel ist ein Literal gdw. eine atomare Formel oder die
3. Logik Aussagenlogik
Eine Formel ist in disjunktiver Normalform DNF gdw.
eine Dis-
junktion von Konjunktionen von Literalen ist, d.h.
Normalformen
sind in KNF.
Die Formeln
<" 8#Z S4 <"[
M #%"RX2 und $4%"&
sind in DNF.
3. Logik Aussagenlogik
Transformation in Normalform
Umformungsregeln fur
KNF/DNF-Transformation:
Schritt 1 \
" 849
" "
] \
" 849 }Z \
" 8#%"&
$#9 F46 Z \
Z84Z F# _846
$49 F#6 Z \
Z8#Z F4 _8#6
Klauselform
Fur
die maschinelle Inferenz benutzt man eine Mengendarstellung der
KNF, die sogenannte Klauselform.
Definition 3.10.
Eine Klausel ist eine Menge von Literalen `ACaJGJGJGJbATQdc , die der Dis-
junktion A C 4PGJGJG/4eA Q entspricht.
Die Klausel `,c ist die leere Klausel. Sie wird in der
: Form f geschrie-
3. Logik Aussagenlogik
Die Klauselform einer Formel in KNF mit
Fur
die maschinelle Inferenz benutzt man Resoluti- Beispiel 3.10. Resolution basiert auf folgendem
on in Verbindung mit Klauselform. Schema:
o
o
q
n
o
Definition 3.11. Seien Klauseln und sei
r
r
Wenn es regnet ( ), gehe ich ins Kino ( ), also
o
oq
n
o
eine atomare Formel mit und .
n
.
Dann heit die Klausel mit
n
s
s
r
r
n
t
Wenn es nicht regnet ( ), gehe ich ins
o
o
q
p
p
Schwimmbad ( ), also .
o
o
q
Resolvente von und . Hieraus folgt, da ich ins Kino oder ins
Schwimmbad gehe, also
Ein Resolutionsschritt wird wie folgt dargestellt:
vxw
p
p
n
o
n
o
vxy
u
Wissensverarbeitung und Data Mining FH Bonn-Rhein-Sieg, WS 01/02 111 Wissensverarbeitung und Data Mining FH Bonn-Rhein-Sieg, WS 01/02 110
3. Logik Aussagenlogik
Resolution (3)
Beispiel 3.11. Modus Ponens und Modus Tollens konnen als Spezial-
fall der Resolution dargestellt werden:
zk|~} z{S|} z/{} z{S|}
z/} z/{S|~}
3. Logik Aussagenlogik
Resolution (4)
Beispiel 3.12. Herleitung der Aussage aus Beispiel 3.6 mit der Reso-
lutiosregel: b_< KW
B
b_< (~<
(~_.
Resolution (6)
beweis.
Satz 3.3. Es sei eine Klauselmenge und es sei-
en . Fur
eine Resolvente von und
gilt .
Insbesondere ist genau dann erfullbar,
wenn
der Resolutionsregeln.
Beim Resolutionskalkul
erfullbar
ist.
fuhrt
Wissensverarbeitung und Data Mining FH Bonn-Rhein-Sieg, WS 01/02
Dies nutzt man im Resolutionskalkul aus. Um zu
Resolution (5)
entsteht, die die leere Klausel enthalt.
Klauseln, die sich aus & ergeben, die leere Klausel ab.
auch die ursprungliche
Klauselmenge unerfull-
bar sein.
Aussagenlogik
Das letzte Beispiel zeigt den direkten Beweis einer Formel mit Hilfe
114
Dies bedeutet, man leitet aus den Klauseln von vereinigt mit den
, in dem man zeigt, da 56& unerfullbar
man stattdessen einen Widerspruchs-
Resolution (7)
Beispiel 3.13. Herleitung der Aussage aus Beispiel 3.6 mit dem Reso-
lutionskalkul:
b<< ( K
B (
3. Logik Aussagenlogik
(_ ( D
( (~
(Z (Z
Wissensverarbeitung und Data Mining FH Bonn-Rhein-Sieg, WS 01/02 117
3. Logik Aussagenlogik
Die leere Klausel kann nur dann abgeleitet werden, wenn die ur-
sprungliche
Klauselmenge unerfullbar
ist Korrektheit
Das Resolutionskalkul
findet fur
jede unerfullbare
Klauselmenge eine
Widerlegung, d.h. die leere Klausel wird abgeleitet Vollstandig-
keit
3. Logik Aussagenlogik
Fur
Aussagenvariablen gibt es hochstens
verschiedene Klau-
seln, die aus diesen Aussagenvariablen gebildet werden konnen.
Beweis. Tafel .
3. Logik Aussagenlogik
Aus den Variablen entsteht durch Festlegung einer Syntax eine Wis-
sensreprasentationssprache (Menge der Formeln).
Eine Interpretation gibt den Variablen eine Bedeutung.
Die Erfullungsrelation
dehnt diese Bedeutung auf alle Formeln aus
Uber
die Erfullungsrelation
wird der Begriff der semantischen Folge-
rung festgelegt.
Ein Kalkul
stellt die Aquivalenz zwischen semantischer Folgerung
und syntaktischen Operationen her.
Pradikatenlogik
In der Aussagenlogik ist es nicht moglich, Aussagen uber
ganze Klas-
sen von Objekten zu machen, so da Schlufolgerungen fur
individuelle
Objekte moglich sind.
Es sei gegeben:
3. Logik
Pradikatenlogik
Pradikatenlogische Signatur
Mit der Pradikatenlogik (1. Stufe) wollen wir Sachverhalte beschreiben,
die folgendes enthalten konnen.
Aussagen uber
Objekte, auch quantifizierende
Wie in der Aussagenlogik brauchen wir dazu zunachst einen Vorrat an
Bezeichnern.
Pradikatenlogische Signatur (2)
l
,m
Definition 3.12. Eine (PL1-)Signatur ^ jh besteht aus
,
Jedes Symbol %,m2W hat eine feste Stelligkeit 5 .
3. Logik
Pradikatenlogik
PL1-Terme
Definition 3.15. Es sei eine Menge von Varia-
Auf Basis der Terme konnen wir nun die Formeln
blensymbolen und sei eine PL1-
der Pradikatenlogik definieren.
Signatur. Dann ist die Menge der PL1-
Formeln wie folgt definiert: Definition 3.14. Es sei eine Menge von Varia-
blensymbolen und sei eine PL1-
1. Jede atomare Formel uber
und ist eine PL1- Signatur. Dann ist die Menge der atomaren Formeln
Formel. uber
und wie folgt definiert:
2. Ist
ein -stelliges Pradikatensymbol mit
/
eine atomare Formel.
Pl1-Formeln.
Wissensverarbeitung und Data Mining FH Bonn-Rhein-Sieg, WS 01/02 127 Wissensverarbeitung und Data Mining FH Bonn-Rhein-Sieg, WS 01/02 126
3. Logik
Pradikatenlogik
PL1-Formeln (3)
Beispiel 3.14. Den anfangs dargestellten Sachverhalt konnten wir
durch folgende Formeln ausdrucken.
.
. B
! . #
"
h&,
x % $ j
Die Frage, ob Martin und Peter programmieren konnen, wurde
dann als
PL1-Formel lauten:
h&,
'
m(,
%$ B ! $ ) *
ei-
129
sowie einer Abbildung , die jedem -stelligen
nun die
besteht
eine PL1-
Pradikatenlogik
, der Tragermenge
zuordnet.
.
Wissensverarbeitung und Data Mining FH Bonn-Rhein-Sieg, WS 01/02
tur von Formeln festgelegt. Wir mussen
,
jedem -stelligen Pradikatensymbol
zuordnet und
+ ,
Interpretation
-
, 2
.-
(Grundbereich, Universum),
Signatur. Eine -Interpretation
-
.
einer nichtleeren Menge
-
ne -stellige Relation
/
Definition 3.16. Es sei
ner Bedeutng belegen.
Funktion-, Pradikaten-
,
Funktionssymbol
-
,
1/ 0
-
.
on
3. Logik
aus:
und ei-
130
Es sind noch nicht alle sprachlichen Symbole der
PL mit einer Bedeutung belegt, es fehlen noch die
Pradikatenlogik
eine -
3 - -76
:
- , 5
4
-
3
unter
, -6
Termauswertung
+ -
5
.
, + 4
fur
08 /
, eine -Interpretation
+ -
in
-76 3
54 .
30
ne Variablenbelegung
. , 8
-76
8
-76
Interpretation und
54 5
30
Variablen.
Funktion
/
4
3. Logik
3. Logik
Pradikatenlogik
PL1-Semantik
A@
Definition 3.19. Es sei 9;: =<?> > eine -Interpretation, B eine Men-
ge von Variablensymbolen und CEDFB G(H I < > eine Variablenbelegung.
CKJMLON;DB G&H
<?> bezeichne die Modifikation von C an der Stelle P zu Q ,
d.h: V
S fur
PX:Y
W S
CKJML7NRTS7U#:
Q fur
PZ:YS
Dann ist der Wahrheitswert einer Formel [ \E]^`_abcdeRfBU in 9 unter C
(geschrieben g h[ji ik>mlon ) wie folgt definiert:
p Fur
eine atomare Formel qKRkSsrut*v*v*v*tSxw
U gilt:
@
g g qKRkS r t*v*v*v*tS w U=i i >mlon :YyF_%z{b|D~} ROg gS r i >mlon tmvvmv*tg gS w i i >*ln U\ > Rq&U
p Fur
eine Formel P[ gilt:
p Fur
eine Formel FP[ gilt:
g P[ji ik>*ln:Yy _!z bD} es gibt ein Q\<?> mit g go[i ik>mlonxf:YyF_%z{b
3. Logik
Pradikatenlogik
Variablenbindungen
Tritt P in einer Formel ohne umgebenden Quantor auf, so ist P eine freie
Variable.
Variablenbindungen (2)
3. Logik
Pradikatenlogik
PL1-Semantik (2)
mit
137
hei-
Pradikatenlogik
-
Interpretationen und alle Variablenbelegungen
alle
PL1-Formeln
und
Wissensverarbeitung und Data Mining FH Bonn-Rhein-Sieg, WS 01/02
gdw. fur
Definition 3.22. Zwei PL1-Formeln
en semantisch aquivalent
fur
7
Aquivalenzen
Lemma 3.6.
3. Logik
gilt:
3. Logik
Pradikatenlogik 3. Logik
Pradikatenlogik
Skolemisierung Normalformen
Definition 3.23. Eine Formel , in der alle Quan-
toren auen stehen, heit Pranexform.
Skolemisierung dient der Elimination von Existenz-
Eine Pranexform, die als Junktor nur noch Konjunk-
quantoren. Wir betrachten eine Pranexform:
tion, Disjunktion und Negation enthalt,
wobei die
Negation nur unmittelbar vor Atomen auftritt, heit
h
vereinigungstechnische Normalform (VNF).
Zum Ersatz von
wahlen wir ein neues Funktions- Mit folgenden Schritten kann jede PL1-Formel in ei-
zeichen der Stelligkeit und fuhren folgende Ope-
ne aquivalente Formel in VNF uberf
uhrt
werden:
ration aus:
1. Umbennung von Variablen derart, da keine Va-
1. Streiche
aus der Pranexform. riable sowohl frei als auch gebunden auftritt und
hinter allen vorkommenden Quantoren stehen
2. Ersetze in der verbleibenden Formel an allen verschiedene Variablen.
Stellen durch .
da sie nur noch unmittelbar vor Atomen auftritt.
Die Funktion heit Skolemfunktion bzw. fur
4. Die Quantoren werden ganz nach auen ge-
Skolemkonstante. schoben.
Wissensverarbeitung und Data Mining FH Bonn-Rhein-Sieg, WS 01/02 139 Wissensverarbeitung und Data Mining FH Bonn-Rhein-Sieg, WS 01/02 138
3. Logik
Pradikatenlogik
Normalformen (2)
6. Jetzt konnen alle Allquantoren entfernt werden.
7. Mit Hilfe der de Morganschen Regeln konnen disjunktive Normalform
DNF bzw. konjunktive Normalform KNF analog zur Aussagenlogik
erzeugt werden.
ein Mechanismus zur Instanziierung von Variablen
141
Konstanten und die
Pradikatenlogik
eine Substitution.
auf
wird der Definitionsbereich von zunachst
rekursive Anwendung von in der Form
Substitution
fur
fur
fur
man eine Abbildung
Definition 3.24. Es sei
k
an.
ausgedehnt. Durch
Eine Substitution
s
.
Abbildung
benotigt.
Durch
erhalt
3. Logik
Fur
3. Logik
Pradikatenlogik
Unifikation
Die Unifikation ist eine Substitution, bei der Terme gleichgemacht wer-
den.
3. Logik
Pradikatenlogik
Allgemeinster Unifikator
p Fur
jeden Unifikator von und S existiert eine Substitution , so da
Z gilt.
Bemerkung 3.4. Es gibt einen Algorithmus, der fur zwei Terme und
S entscheidet, ob sie unifizierbar sind und gegebenenfalls einen allge-
meinsten Unifikator berechnet.
3. Logik
Allgemeinster Unifikator (2)
(c)
(c)
(b)
(d)
Regel
Gegeben seien zwei Terme und . Die Berechung
des allgemeinsten Unifikators geschieht wie folgt:
Q
Man startet mit als allgemeinsten Unifikator
und wendet sukzessive die folgenden Regeln an:
R1U{tQ
Ungeloste
(a) Sind und Konstanten, so sind sie unifizierbar
gdw. gleich ist.
P&uRUtAR1U{tQ
(b) Ist eine Variable und eine Konstante, so sind
R1PtAR1UtUKRTRUt7{tQU
Unifikationen
.
`
`
(c) Ist
eine Variable und ein Term der Form
, so sind sie unifizierbar gdw. nicht
P&R1FUA
P&RR1UxUtOF`R1UA
bar sind. Man erweitere um die Substitutionen,
P&RRQUUtOF`R1QUst!Q{
Pradikatenlogik
die sich aus der Unifikation der und ergeben.
145
Wissensverarbeitung und Data Mining FH Bonn-Rhein-Sieg, WS 01/02 144
3. Logik
Pradikatenlogik
Resolution in PL1
haben keine gemeinsamen Variablen.
147
PL1-Klauseln.
, ein ne-
Pradikatenlogik
und
Wissensverarbeitung und Data Mining FH Bonn-Rhein-Sieg, WS 01/02
Die Klausel heit PL1-Resolvente von
Resolution in PL1 (2)
.
hat die folgende Form:
Definition 3.27. Es seien
(b) Es gibt positive Literale
gdw. folgendes gilt:
Unifikator von
gatives Literal
und
3. Logik
(c)
(a)
3. Logik
Pradikatenlogik
3. Logik Logikprogrammierung
Logikprogrammierung
Hornklauseln
Fur
viele Anwendungen reichen drei Arten logischer Formeln aus:
(a) Formeln
798 der
8 Form ,.-0/ 121213/ ,$4 5 6 bzw. als Klausel
,.-:;1<1;12: ,$4=:>6@? , die Regeln darstellen.
7
(b) Ein Faktum wir durch eine einelementige Klausel ,A? ausgedruckt.
(c) Eine Anfrage der Form Folgt , - / 121;1B/ , 4 aus den Fakten
und
798 Regeln?8 wird als Klausel in negierter Form geschrieben:
,.-:;1<1;12: ,$4C? .
3. Logik Logikprogrammierung
Definition 3.28. Eine Hornklausel ist eine Klausel mit hochstens ei-
nem positiven Literal.
Definition 3.29. Ein logisches Programm ist eine endliche Menge von
Regeln und Fakten.
3. Logik Logikprogrammierung
Prolog
Anfrage:
FG WNXNYVZ$[>Y L Z _
D Fur
Logikprogramme wird eine spezielle und effizientere Form der
Resolution verwendet, die sogenannte SLD-Resolution (Linear Re-
solution with Selection Function for Definite Clauses).
D Hierzu wird jeweils das erste Literal der Zielklausel mit einem Regel-
kopf oder einem Faktum resolviert.
3. Logik Logikprogrammierung
Beispiel 3.20.
: Pfad(a,d)
{Y/b}
fail : Pfad(b,d)
{X/b, Y/d}
: Kante(b,d)
OK
Crashkurs Prolog
Beispiel 3.21. Gesucht sind alle dreistellgen Zahlen, die durch 5 und
6 teilbar sind und bei der Division durch 9 den Rest 3 liefern.
ndo XRX cVp [ h=_ F GrqsctqQkscVp [ hLdu^vOL<JfLM$L wLxyLzOL{OL |L}$L~Vs_P
3. Logik Logikprogrammierung
Prolog-Grundlagen
D
Konstanten und Pradikate beginnen in Prolog mit einem Kleinbuch-
staben.
D Variablen beginnen mit einem Grobuchstaben.
D In Anfragen sind Variablen existenzquantifiziert.
G Y aCcSp [ \ LT o #Q_gP
D
Bei der Losungssuche werden Variablenbelegungen generiert.
Unifikation: \ W c9aCcSp
D
Unifikationen werden ubernommen:
G Y d
a cVp [ \ LT o #Q_iL Y aCcSp [\ L Y pdQ_gP
3. Logik Logikprogrammierung
Beispiel 3.22. Losung
des Farbeproblems aus Kapitel 2:
X#Y cVpVkRQT [ LL yLejL _ FG XNY Vp k=c [ _iL N
X Y pVk=c [ _L # X Y p9ksc [ =
_iL
X Y V
N [
p k=c _iL X N Y pVk=c
[ _L
SR L V Q yL V Q L VQ L
SR yL SR L
SR jL VQI L
SR P
3. Logik Logikprogrammierung
Datentypen in Prolog
Listen in Prolog
3. Logik Logikprogrammierung
X#Y ` [ LH Y ` _ FG J o G JfL
XNY ` [ f J LH Y
` JS_L
H ` Y o Y
rH `i J P
X#Y ` [ vOL<JV_gP
Grund: unvollstandige Spezifikation
`dc o Tsc W p o q n Y [ dh _ F G n Y s
[ _iLcNl2#aCcSp c o cVp [ Lhd_gP
c#l<badcVp c o R
cVp [ L h=_ F G K J L h$Lv o 0 hq Z P
W p o q n Y s [ =h _ T c W p o q n Y [ hd_LC9L X#Y o $P
F G0`dc o s
W p o q n Y s [
= h _ F Gh i J P
3. Logik Logikprogrammierung
Prolog genutzt Negation as failure, d.h. eine negierte Anfrage ist wahr,
wenn sie nicht bewiesen werden kann.
not/1 liefert keine Variablenbelegung und entspricht somit nicht der lo-
gischen Negation.
Die Verwendung des Cut im letzten Beispiel entsprach genau der Ne-
gation in Prolog.
ndo R X X V
c p [ =
h _ F GrqsctqQkscVp [ h L u^vOL<JfLMOL wyLxLz$L{$L |yL}yL~=_P
n Y s [ h Y # _ F G =
n o Q
X X cSp [ d
h _iL n=o XQX cSp [ _iLh Y s o Jtv Ih P
`dc o Tsc W p o q n Y [ dh _ F G n Y s
[ _iLcNl2#aCcSp c o cVp [ Lhd_gP
c#l<badcVp c o R
cVp [ L h=_ F G K J L h$Lv o 0 hq Z P
D Signatur
D Erfullungsrelation
, die die Semantik von Formeln festlegt.
3. Logik Logikprogrammierung
D Klauselform zur kanonischen Darstellung von Formeln
D Kalkul
zur Durchfuhrung
der maschinellen Inferenz (Vollstandigkeit,
Korrektheit)
D
Resolution als Inferenzverfahren in Aussagen- und Pradikatenlogik
D
Unifikation in der Pradikatenlogik
D
Logikprogramm: eingeschrankte
Pradikatenlogik und angepates
Resolutionsverfahren
Entscheidungsbaum
D
Ein Blatt reprasentiert eine der Klassen.
D
Ein innerer Knoten reprasentiert ein Attribut.
D
Eine Kante reprasentiert einen Test auf dem Attribut des Vaterkno-
tens.
Klassifikation mit Entscheidungsbaumen
D indem man ausgehend von der Wurzel jeweils die den Knoten zuge-
ordneten Attribute uberpr
uft
und
D so lange den Kanten folgt, die mit den Attributwerten des Objekts
markiert sind,
D bis man einen Blattknoten erreicht.
D Der dem Blattknoten zugeordnete Wert entspricht der Klasse, der
das Objekt zugeordnet wird.
Beispiel 4.2. Ein Entscheidungsbaum zur Risikoabschatzung fur
eine
KFZ-Versicherung:
Autotyp
> 60 <= 60
Entscheidungsbaume und Regeln
D
Entscheidungsbaume
reprasentieren Regeln in kompakter Form.
D Jeder Pfad von der Wurzel zu einem Blattknoten entspricht einer lo-
gischen Formel in der Form einer if-then-Regel.
Problem der Generierung von Entscheidungsbaumen
D Ziel ist es, aus einer Menge von Beispielen (der sogenannten Trai-
ningsmenge) einen Entscheidungsbaum zu generieren.
D Ein Beispiel der Trainingsmenge besteht aus einer Menge von
Attribut/Wert-Paaren zusammen mit der Klassifikation.
D Aus dieser Trainingsmenge ist ein Entscheidungsbaum aufzubauen,
der die Beispiele richtig klassifiziert.
D Fur
so einen generierten Entscheidungsbaum hofft man, da dieser
auch Beispiele, die nicht aus der Trainingsmenge stammen, mit ho-
her Wahrscheinlichkeit richtig klassifiziert.
Overfitting
Beispiel 4.5. Zwei Entscheidungsbaume fur
die Trainingsmenge aus
Beispiel 4.4:
Alter
Autotyp
< 30 > 60
= LKW <> LKW
>= 30 and <= 60
D
der moglichst kompakt ist.
D
Die Wichtigkeit hangt von der Differenzierung der Beispielmenge ab.
Attributauswahl fur
das Kinoproblem:
ja: 1, 2, 5, 6, 7, 8, 11, 15
nein: 3, 4, 9, 10, 12, 13, 14
Gruppe
P
F a
ja: 1, 2, 5, 6, 7, 8, 11, 15
nein: 3, 4, 9, 10, 12, 13, 14
Kategorie
DR SF
AC KO
Bei der rekursiven Konstruktion konnen die folgenden Situationen auf-
treten:
2. Die Menge der Beispiele zu einem Knoten ist leer. In diesem Fall
kann man eine Default-Klassifikation angeben. Man wahlt zum Bei-
spiel die Klasse, die unter den Beispielen des Vaters am haufigsten
vorkommt.
Generiere fur
jeden moglichen Attributwert einen Nachfolgerknoten
und verteile die Beispiele auf die Nachfolger gema ihres Attribut-
werts.
Setze das Verfahren fur
jeden Nachfolger fort.
Partitionen fur
Attribute
Typen von Partitionen fuer nominale Attribute
Attribut Attribut
=a1 =a3 in A1 in A2
=a2
Attribut Attribut
Attributauswahl
Dazu stellen wir fest, wieviel Information wir nach dem Test eines Attri-
buts noch benotigen.
negative Beispiele.
Teilmenge habe positive und
Der ID3-Algorithmus
N Kategorie @ Kategorie bekannt
" % % % % % % 3
46 (
, * /. '% ( &
* / . %'( &
* / . %', &
* 2
'% & ( ( 3 3 3 3 , ,
(
,
Beispiel 4.8. Man berechne N N fur
alle Attribute und zeige damit,
da das Attribut Gruppe bei Anwendung von ID3 auf das Kinoproblem
als Attribut fur
den Wurzelknoten selektiert wurde.
Tafel .
ID3 fur
Man berechne den Entscheidungsbaum gema das Kinopro-
blem. Tafel .
Bemerkung 4.1.
7 Dies Konzept wird mit Hilfe der Entropie auf Klassen verallgemei-
nert.
7 8 und
Der Informationsgehalt einer Beispielmenge mit Klassen
Beispielen in Klasse 8 (9: ;
) ist dann:
@<:= ;<;2>K? A@CBDEs
% @CBDE %
Beine bit
4 % %
Beine F @CBDGE F IFH C@ BDJEFH
3 , bit
4 %
Beine ( @CBDGE E @CBDJE E
, bit
H H H H
% (
N Beine ? @ 4 %% , , % % K 3 % %
4 bit
,
Wissensverarbeitung und Data Mining FH Bonn-Rhein-Sieg, WS 01/02 193
4. Induktion von Regeln Lernen von Entscheidungsbaumen
Der C4.5-Algorithmus
7
Der (absolute) Informationsgewinn # N hat den Nachteil, da die-
ser Attribute mit zahlreichen Werten bevorzugt.
Beispiel 4.10.
7 Bei einer medizinischen Diagnose werde als eines der Attribute die
PIN eines Patienten benutzt.
7 Dieses Attribut habe soviele Werte, wie es Patienten in der Datei gibt.
*%?
PIN bekannt ?
7 Fur
die Diagnose ist die PIN dagegen nutzlos.
S YTV>NRWYP
N[ N \ J@CBD E
$
als nachstes
C4.5 wahlt +L9ON)QP N
Attribut dasjenige aus, bei dem #
maximal ist.
Assoziationsregeln
7
Assoziationsregeln beschreiben gewisse Zusammenhange und Re-
gelmaigkeiten zwischen verschiedenen Dingen, z.B. den Artikeln
eines Warenhauses.
7
Die Zusammenhange sind allgemeiner Art und nicht notwendiger-
weise kausal bedingt.
7
Man unterstellt aber, da implizite strukturelle Abhangigkeiten vorlie-
gen. Diese mochte man erkennen.
Support
Definition 4.2. Es sei c dk] eine Itemmenge. Der Support von c ist
der Anteil aller Transaktionen aus g , die c enthalten:
Assoziationsregel
c _z , also
Definition 4.3. Gegeben seien zwei disjunkte Itemmengen
c_z df] und c {z | .
Eine Assoziationsregel hat die Form c } z .
die Regel c }
Eine Transaktion erfullt z gdw. c ~z d N gilt, d.h. N
alle Items der Assoziationsregel.
enthalt
Konfidenz
K^oN<p$gtc ~z dNraG
vP1WYQh-Mvy c } zA
K^oN<p$gtc dkNa
S-l OUPmLAN c } A z
S-l OUPmLAN c
Bemerkung 4.2. Die Konfidenz ist eine bedingte Haufigkeit bzw. be-
dingte Wahrscheinlichkeit.
Beispiel 4.12.
Transaktion Items
1 Brot, Kaffee, Milch, Kuchen
2 Kaffee, Milch, Kuchen
3 Brot, Butter, Kaffee, Milch
4 Milch, Kuchen
5 Brot, Kuchen
6 Brot
7 Support und Konfidenz sind Parameter mit denen die Relevanz einer
Regel beurteilt wird.
7
Beide Mazahlen sollten moglichst gro sein.
7 Finde alle Itemmengen, deren Support S-l ist. Diese Item-
mengen heien haufige Itemmengen (frequent itemsets).
7
Finde in jeder haufigen Itemmenge alle Assoziationsregeln
J eJ
}
U
mit und mit Konfidenz MvPW .
Die wesentliche Schwierigkeit besteht in der Losung des ersten Teilpro-
blems.
die Menge ] insgesamt Items, so sind prinzipiell
Enthalt 3` Itemmen-
gen auf ihren Support hin zu untersuchen.
Apriori-Algorithmus
Somit folgt:
7
Alle Teilmengen einer haufigen
Itemmenge sind ebenfalls haufige
Itemmengen.
7
Alle Obermengen einer nicht haufigen Itemmenge sind ebenfalls
nicht haufig.
: | np mit !J
{
3A[ ^S2222 E i a6AG ^S;<;<A E '-a A
~^ 2222 E i i a
A !vp J
% -Teilmengen S von vJ
S p Ag
^AvAa
A
A
J
E
Itemm. Support Itemm. Support
^ A,B a ^ A,B a 25% Itemm. Support
^ A,C a } ^ A,C a 50% ^ A,C a 50%
^ A,E a ^ A,E a 25% ^ B,C a 50%
^ B,C a ^ B,C a 50% ^ B,E a 75%
^ B,E a ^ B,E a 75% ^ C,E a 50%
^ C,E a ^ C,E a 50%
H H H
Itemm. Support } Itemm. Support Itemm. Support
^ B,C,E a ^ B,C,E a 50% ^ B,C,E a 50%
Unterstutzung
der Teilmengenoperation
7
Im Apriori- und im AprioriGen-Algorithmus werden sehr haufig Teil-
mengen uberpr
uft.
7 Einfugen
einer Itemmenge c ^'22220e5a :
Zunachst c bis zu einem Blatt, in das die
erfolgt eine Suche fur
Itemmenge eingefugt werden soll.
Ist in dem Blatt Platz fur
eine weitere Itemmenge vorhanden, dann
wird c dort eingefugt.
Kann das Blatt keine Itemmenge mehr aufnehmen, dann wird es
zu einem inneren Knoten und die Eintrage x auf
werden gema
neue Blatter verteilt.
0 1 2 0 1 2 0 1 2
7
jedes NpN wird x N bestimmt und in den resultieren-
Wurzel: Fur
den Sohnen wird weitergesucht.
7 Blatt: Prufung,
welche der in dem Blatt enthaltenen Itemmengen die
Transaktion N erfullen.
0 1 2 0 1 2 0 1 2
Nach der Bestimmung der haufigen Itemmengen mussen noch die As-
soziationsregeln mit einer Konfidenz IMvPW bestimmt werden. Die-
se werden aus den haufigen Itemmengen generiert.
c _z
Gegeben seien Itemmengen mit z c . Dann gilt:
vPWUQh-v c z } z n MvP W
vPWUQh-v c z ?} z nMvPW fur
alle z dz
Bei der Regelgenerierung nutzt man wiederum die Umkehrung aus.
Man beginnt mit einer moglichst
kleinen Menge z und schliet alle
Obermengen von z aus, falls gilt:
vP1WYQh-Mvy c z ?} z < vPm1W
7 Fur
alle Konklusionen xj<pZj[$ uberpr
uft
man nun, ob
vPWUQh-Mvy c xj ?} x j[n$MvP1W
gilt. Falls ja, dann wird die Regel ausgegeben, ansonsten wird xj
aus j[ entfernt.
Warenkorbanalyse
Zusammenfassung
7
Entscheidungsbaume
Aufbau einer Klassifikationshierarchie fur
eine Trainingsmenge
top-down, rekursives Verfahren
Wesentlich ist die Attributauswahl
ID3-Algorithmus: Attributauswahl auf Basis der Entropie
7 Assoziationsregeln
Wesentlich: Berechnung haufiger Itemmengen
Apriori-Algorithmus zur Berechnung haufiger Itemmengen
Unterstutzung
des Apriori-Algorithmus durch Hash-Trees
Aus den haufigen Itemmengen werden unter Einsatz von Apriori-
Gen die Assoziationsregeln generiert.
5. Clusteranalyse Vorbemerkungen
5 Clusteranalyse
7
Bei der Generierung von Entscheidungsbaumen im vorigen Kapitel
wurde von Datensatzen ausgegangen, die als einen Attributwert eine
Klassenzugehorigkeit enthalten.
7
In vielen Anwendungen ist solch eine Klassenzugehorigkeit nicht
verfugbar
oder zu aufwendig zu bestimmen.
7
Unter Umstanden ist noch nicht einmal bekannt, welche Klassen es
gibt und wie sie charakterisiert werden konnten.
7
Mit Verfahren der Clusteranalyse lassen sich Klassenzugehorigkei-
ten aus den gegebenen Daten schatzen.
g ~ ;2~
3 | % 2222>
fur
3b{ | fur
Q
% <;22>K0
5. Clusteranalyse Vorbemerkungen
7
alle Datensatze innerhalb der Cluster einen geringen Abstand und
7
alle Datensatze in verschiedenen Clustern einen groen Abstand
voneinander haben.
Der Abstand soll dabei die Ahnlichkeit zwischen Objekten zum Aus-
druck bringen, d.h.
7
kleiner Abstand bedeutet ahnliche Objekte und
7
groer Abstand bedeutet unahnliche Objekte.
Abstand bzw. Ahnlichkeit wird durch den Begriff der Metrik formalisiert.
Metrik
h 0N<
1. fur _pu
alle .
h 0N?
2. genau dann, wenn .
3. h 0N? h f_K fur _pu
alle .
4. h _bnIh _C/.h fb fur _Zpu
alle g .
Das Tupel u h# heit metrischer Raum.
5. Clusteranalyse Vorbemerkungen
7 h 0C? ;
E
euklidische Norm:
7 h N ;
J ^_V
Anzahl verschiedener Attributwerte: mit
falls M=V
_V? % sonst
7 Fur
Mengen c und z :
c ~zA c {z
h czA
c ~z
7
Durch das Zusammenlegen von ahnlichen Clustern entsteht bottom-
up die Hierarchie.
5. Clusteranalyse SAHN-Clustering
5. Clusteranalyse SAHN-Clustering
7 Der Parameter h legt fest, bis zu welchem Abstand Cluster ver-
schmolzen werden.
7
Schritt 3 bedeutet: Die einzelnen Cluster ^ werden aus der Clu-
sterstruktur mit den Datensatzen
entfernt und ein neues Cluster aus
vereinigt mit den Datensatzen
aus wird in die Clusterstruktur
eingefugt.
Dendogramm
7
Die Hohe von Verbidungslinien entspricht dem Abstand zwischen
Clustern. So ist direkt erkennbar, wieviele Cluster entstehen, wenn
man h variiert.
b
a
g
f
e f g a b c d
d
5. Clusteranalyse c-Means
c-Means Verfahren
7
Cluster konnen auch durch ihre Zentren 9 charakterisiert werden.
7
Die Zuordnung der einzelnen Datensatze zu den Clustern kann
dann mit der Nachste-Nachbar-Regel
erfolgen, d.h. K gehort
zu Clu-
ster genau dann, wenn gilt:
h _ ? Z h 0
7 Als Clusterzentren nimmt man ublicherweise
den Schwerpunkt der
Datensatze des Clusters:
%
9 K
O
222;S .
1. Initialisiere Prototypen b
2. Ordne die Datensatze gema
der Nachste-Nachbar-Regel
den
Zentren zu. So entstehen neue Cluster ;<;2 .
22220 .
4. Ausgabe der Clusterstruktur und der Zentren #