1 Algorithmen Datenmanagement Und Datenstrukturen - Kapitel 4

4 Algorithmen, Datenmanagement
und Datenstrukturen
25. Juni 2022 Ihr Name - bitte anpassen über "Einfügen" / Kopf- und Fußzeile 1
Algorithmen und Datenstrukturen
Abstraktionsebenen
Güting, R.; Dieker, S.: Datenstrukturen und Algorithmen. 4. Auflage, Springer Vieweg, 2018..
Algorithmen und Datenstrukturen
Abstraktionsebenen
 Ein Algorithmus realisiert eine Funktion, die entsprechend eine Spezifikation
eines Algorithmus darstellt. Ein Algorithmus stellt seinerseits eine
Spezifikation einer zu realisierenden Prozedur (oder Funktion oder
Methode im Sinne einer Programmiersprache) dar.
 Eine Datenstruktur ist eine Implementierung einer Algebra oder eines ADT
auf algorithmischer Ebene. Eine Datenstruktur kann selbst wieder in einer
Programmiersprache implementiert werden; auf der programmier-
sprachlichen Ebene sind eng verwandte Begriffe die des (Daten-) Typs,
der Klasse oder des Moduls.
Algorithmen
Algorithmus-Begriff
In der Informatik unterscheidet man üblicherweise zwischen Verfahren zur Lösung von
Problemen und ihrer Implementation in einer bestimmten Programmiersprache
auf bestimmten Rechnern. Man nennt die Verfahren Algorithmen.
-> handelt sich um eine Arbeitsanweisung, die zeigt, wie eine Aufgabe zu lösen ist
Ein Algorithmus ist eine endliche Vorschrift zur eindeutigen Überführung von
Eingabegrößen zu Ausgabegrößen in einer endlichen Zahl von Schritten.
Die meisten Algorithmen erfordern jeweils geeignete Methoden zur Strukturierung der
von den Algorithmen manipulierten Daten. Algorithmen und Datenstrukturen gehöre
also zusammen. Die richtige Wahl von Algorithmen und Datenstrukturen ist ein
Wichtiger Schritt zur Lösung eines Problems mithilfe von Computern
Ein Algorithmus ist allgemeingültig:
Algorithmus als allgemein gültige Handlungsanweisung , die nicht nur zu einem
bestimmten Problem, sondern zu allen gleichartigen Aufgaben passt
(z.B. Wie sortiert man Zahlen? Statt Wie sortiert man 3 Zahlen?)
Ein Algorithmus ist ausführbar:
Es müssen endlich viele Anweisungen eindeutig, verständlich und in einer
klaren Reihenfolge gegeben sein
von Rimscha, M.: Algorithmen kompakt und verständlich. 3. Auflage, Springer Vieweg, 2014.
25. Juni 2022 Prof. Holland/ rote und schwarze Hervorhebungen von Dipl.-Inform. H. Göhre 6
Algorithmen
Der Weg vom Problem zur Lösung
Das Ziel einer Problemlösung ist, ausgehend von einer Problemstellung ein System
zu finden, das diese Lösung darstellt. Diese Vorgehensweise lässt sich in
drei Schritten wie folgt aufgliedern.
Müller, H.; Weichert, F.: Vorkurs Informatik. 4. Auflage, Springer Vieweg, 2015.
Algorithmen
Algorithmus
Beispiel: Backrezept Marmorkuchen
Zutaten:
300g Mehl, 1 TL Backpulver, 300g Butter, 5 Eier, 250g
Zucker, 1 Prise Salz, 3 EL ungesüßtes Kakaopulver,
1 guter El Schokocreme
Zubereitung:
• Butter mit Zucker und Salz schaumig rühren. https://www.kochbar.de/rezept/227342/Marmorkuchen-a-la-Julia.html
• Eier vorsichtig zugeben.
• Backpulver zum Mehl geben und über die Eier-Buttermasse sieben.
• Kastenkuchen oder Kranzkuchenform gut ausfetten und eventuell mit Semmelbrösel
oder Gries ausstreuen.
• Die Hälfte des Teiges einfüllen. Unter die andere Hälfte das Kakaopulver und
Schokocreme rühren.
• Auf den hellen Teig geben und mit einer Gabel spiralförmig durch den Teig ziehen.
Oberfläche glatt streichen.
• Im Backofen bei 180 Grad 50-60 Minuten backen.
• Kuchen 10 min in der Form auskühlen lassen.
• Den fertigen Marmorkuchen aus der Form stürzen und auf einem Kuchengitter vollständig
erkalten lassen.
Algorithmen
Algorithmus
Beispiel: Backrezept Marmorkuchen
Das Backrezept weist die Eigenschaften eines

Algorithmus auf:
 Endlichkeit der Länge der Beschreibung
https://www.kochbar.de/rezept/227342/Marmorkuchen-a-la-Julia.html
 Terminierung (Beendigung nach endlich vielen Schritten/Operationen)
 eindeutige Reihenfolge der Operationen
 allein die eindeutige Wirkung der Anweisungsfolge mag beim Backen nicht immer
gegeben sein: die resultierenden Kuchen könnten durchaus etwas unterschiedlich
aussehen und schmecken
Algorithmen
Divide and Conquer
Divide-and-Conquer-Verfahren zur Lösung eines Problems der Größe N
1. Divide: Teile das Problem der Größe N in (wenigstens) zwei annähernd gleich große
Teilprobleme, wenn N > 1 ist; sonst löse das Problem der Größe 1 direkt.
2. Conquer: Löse die Teilprobleme auf dieselbe Art (rekursiv).
3. Merge: Füge die Teillösungen zur Gesamtlösung zusammen
Beispiel: Türme von Hanoi

Es sind n Scheiben unterschiedlichen Durchmessers gegeben, welche geordnet zu
einem Turm geschichtet sind, wobei die untere Scheibe ist die Größte.
Der Turm steht auf einem Anfangsplatz. Unter Verwendung eines Hilfsplatzes soll
dieser Turm nun zu einem Zielplatz transportiert werden. Dabei darf pro Zug nur eine
Scheibe bewegt werden und keine größere Scheibe auf eine Kleinere gelegt werden.
Ottmann, T.; Widmayer, P.: Algorithmen und Datenstrukturen. 6. Auflage, Springer Vieweg, 2017.
Algorithmen
Divide and Conquer
Türme von Hanoi
Transportiere n-1 Scheiben vom

Anfangsplatz A auf den Hilfsplatz C.
Transportiere die letzte Scheibe vom

Anfangsplatz A auf den Zielplatz C.
Transportiere n-1 Scheiben vom

Hilfsplatz C auf den Zielplatz B.
Solymosi, A.; Grude, U.: Grundkurs Algorithmen und Datenstrukturen in JAVA. 6. Auflage, Springer Vieweg, 2017..
Video (2,5 min):
Tower of Hanoi: Six Rings Solution 6. - Bing video
25.06.2022 Ihr Name - bitte anpassen über "Einfügen" / Kopf- und Fußzeile 14
Algorithmen
Algorithmenentwurf
Problem: Minimum einer Menge von Zahlen
Gegeben: Eine Folge a0,...,an−1 von positiven ganzen Zahlen, n > 0.
Gesucht: Der kleinste Wert a der gegebenen Zahlen, d. h. a = min(a0,...,an−1)
Das Minimum einer Menge von Zahlen lässt sich jedoch einfacher finden.
Eine naheliegende Strategie ist, die Menge Element für Element durchzugehen
und sich das kleinste bisher gesehene Element zu merken. Dies ist die
Vorgehensweise, der auch im Pseudocode darstellbar ist. Pseudocode ist eine leicht
formalisierte, aber noch nahe an der üblichen Sprache durchgeführte Formulierung
eines Algorithmus
GOTO OneNote => wie wird ein "Merker" eingesetzt?
Algorithmen
Algorithmenentwurf
Problem: Minimum einer Menge von Zahlen
Ablaufbeispiel als gegebene Folge: 11,7,8,3,15,13,9,19,18,10,4
Übung: Wie müsste der Pseudocode modifiziert werden, sodass das Maximum gesucht wird?
Algorithmen
Algorithmenentwurf
Zentrale Begriffe von Algorithmen
Variablen dienen dazu, Daten zu speichern, und haben einen eindeutigen Namen,
über den sie angesprochen werden.
Wertzuweisung an Variablen: Variablenname := Ausdruck; z.B. i:=1
Ein Block fasst eine Folge von Anweisungen zu einer einzigen Anweisung zusammen.
Schreibweise: {Anweisung 1; .... Anweisung n;}
Algorithmen
Algorithmenentwurf
Mit der bedingten Anweisung ist ein Befehlskonstrukt gegeben, mit dem Alternativen in einem
Algorithmus formuliert werden können. Sie besteht aus einer Bedingung, die dem Schlüsselwort
„wenn“ folgt. Abhängig von der Gültigkeit der Bedingung wird dann eine von zwei Anweisungen
ausgeführt, die ebenfalls Bestandteile der bedingten Anweisung sind:
Wenn Bedingung, dann Anweisung 1;

Sonst Anweisung 2;
Grafische Darstellung durch Struktogramme
Algorithmen
Übung
Struktogramme
Gegeben sei folgender Algorithmus:
a := 1;
b:= 3;
Wenn b < 2, dann a := a - 1;
sonst a := a + 1;
Welchen Wert haben a und b nach Ausführung dieses Algorithmus?
Zeichnen Sie ein Struktogramm analog zur Abbildung
Algorithmen
Algorithmenentwurf
Eine Schleife ermöglicht es, einen Algorithmenteil mehrmals zu wiederholen.

Hierbei wird die Häufigkeit der Wiederholung durch eine Bedingung festgelegt.
Solange Bedingung, führe aus: Anweisung

Solange i < n ist, fuehre aus:
{
Wenn ai < merker, dann merker := ai;
i := i+1;
}
Algorithmen
Algorithmenentwurf
Durch eine Ausgabeanweisung wird ein Wert ausgegeben.

Gib Ausdruck zurueck;
Beispiel: Gib merker zurueck;
Struktogramm Minimum-Suche
Datentypen
Unter einem Datentyp wird eine Menge von Daten gleicher Art verstanden.
Ein Beispiel ist der Ganzzahldatentyp int,
Beispiel primitive Datentypen: Programmiersprache JAVA
Datenstrukturen
Weitere Datentypen
Arrays
Der Datentyp Array repräsentiert die Menge der endlichen Folgen aus Werten eines
gegebenen Datentyps.
Die Werte der Folge sind, stets beginnend mit 0, aufsteigend indiziert.
Variablendeklaration: besteht aus der Angabe des Namens der Variablen und eines
Datentyps: int[] a;
int[] a = {11,7,8,3,15,13,9,19,18,10,4}; (mit Wertzuweise)
Die Länge des Arrays ist die Anzahl der Elemente: a.length (im Beispiel Wert 11)
Zeichenfolgen
Eine Zeichenfolge setzt sich aus einer Folge von Zeichen zusammen, also bspw. „abcd“,
„Sebastian Maier“, „a+b“.
String name = ”Sebastian Maier”;

Arithmetische Ausdrücke
Arithmetische Operatoren Vergleichsoperatoren
Beispiele
int a = (3 + 9) + 4 * (5 + 3);
boolean w = ((3 == 7) || (3 != 7)) && (2 <= 2); (true oder false)
Arithmetische Ausdrücke
Ermitteln Sie den Wahrheitswert der angeführten Booleschen Ausdrücke.
(1) ((8 - 2) < 6) && (7 != 3)
(2) (8 > 2) || (7 <= 3)
(3) (8 == 8) && (16 % 2 == 3)
(4) (8 != 4) || (-1 < 2 && 7 > 3)
Algorithmen
Rekursive Algorithmen
Rekursion ist ein allgemeines Prinzip zur Lösung von Problemen, bei der die
Berechnung auf die eigene Berechnung direkt oder indirekt zurückverweist.
Mit dieser wird auf dieselbe Weise verfahren. Die Rückführung bricht ab,
wenn eine vorgegebene Abbruchbedingung erreicht wird. Ein Beispiel für die
natürliche Anwendbarkeit von Rekursion ist das „Divide and Conquer-Prinzip“.
Wir möchten die Fakultät n! einer Zahl n > 0 berechnen, also das Produkt aller Zahlen
von 1 bis n:
n !=1⋅2⋅3⋅...n
Iterative Berechnung der Fakultät
Rekursive Berechnung der Fakultät
Algorithmen
Rekursive Algorithmen
Fakultät mit n=5
Rekursive Methodenaufrufe und Rückwärts-Einsetzen
fakultaet(5) Methodenaufruf
5 * fakultaet(4) 1. rekursiver Aufruf
5 * 4 * fakultaet(3) 2. rekursiver Aufruf
5 * 4 * 3 * fakultaet(2) 3. rekursiver Aufruf
5 * 4 * 3 * 2 * fakultaet(1) 4. rekursiver Aufruf
5*4*3*2*1 Abbruchbedingung; keine weiteren Aufrufe
5*4*3*2 Einsetzen des Ergebnisses aus 3. Aufruf
5*4*6 Einsetzen des Ergebnisses aus 2. Aufruf
5 * 24 Einsetzen des Ergebnisses aus 1. Aufruf
120 Resultat
Datenstrukturen
Listen
Bei einer einfachen Liste werden die Elemente unsortiert aneinandergehängt.
Die Datenstruktur Liste speichert eine variable Anzahl von Elementen. Im Speicher
können die Elemente irgendwo stehen. Die einzelnen Elemente sind miteinander
verkettet — die Nachbareigenschaft wird über Referenzen hergestellt.
Die Größe einer Liste ist variabel. Zur Laufzeit kann eine Liste beliebig viele Elemente
aufnehmen. Man bezeichnet deshalb eine Liste als eine dynamische Struktur.
Beispiel Array vs. Liste:
EDCETH – Lineare Datentypen. Die Liste Abgerufen am: 15.02.2019.
Datenstrukturen
Lineare Listen
Eine Liste ist eine verkettete Folge von Elementen, die aus Standarddatentypen
zusammengesetzt sind und für die gilt:
1. Es gibt genau ein Listenelement, das keinen Vorgänger hat und Listenanfang heißt.
Auf dieses Element zeigt der Listenanker.
2. Es gibt genau ein Listenelement, das keinen Nachfolger hat und Listenende heißt.
3. Die übrigen Listenelemente haben genau einen Vorgänger und genau einen
Nachfolger.
4. Alle Listenelemente sind vom Listenanker aus durch Nachfolgerbildung in endlich

vielen Schritten erreichbar
Operationen mit Listen

 Erzeugen und Einketten eines Listenelements
 Traversieren einer Liste
 Ausketten und Löschen eines Listenelements
 Suchen eines Listenelements
Datenstrukturen
Lineare Listen
Liste
Einketten
Ausketten und
Löschen
Datenstrukturen
Gerichtete Graphen
Ein gerichteter Graph G besteht aus einer endlichen Menge V von Knoten und einer
endlichen Menge E von Kanten, d.h. G = (V,E).
Eine Kante e ∈ E wird durch das Paar (p,q) von Knoten p,q ∈ V dargestellt,
die sie verbindet, d.h. e = (p,q). Dabei ist e von p nach q gerichtet.
Die Kanten werden grafisch durch Pfeile repräsentiert.
Grafische Darstellung des gerichteten Graphen G = (V,E) mit V = {1,2,3,4},

E = {(1,2),(2,2),(1,3),(3,4),(4,3)}.
Man sagt dann, Kante (v, w) ist inzident mit v und w; Knoten v und w sind benachbart,
adjazent oder Nachbarn.
Datenstrukturen
Gerichtete Graphen
Ein Pfad ist eine Folge von Knoten v1, ..., vn, so dass für 1 ≤ i ≤ n–1 gilt: (vi, vi+1) ϵ E.
Die Länge des Pfades ist die Anzahl der Kanten auf dem Pfad, also n–1.
Ein Pfad heißt einfach, wenn alle Knoten auf dem Pfad paarweise verschieden sind.
Ein einfacher Pfad, dessen Länge mindestens 1 ist und in dem der erste und der letzte
Knoten identisch sind (v1 = vn), heißt Zyklus.
Im Graphen G1gibt es einen einfachen Pfad <1, 2, 4, 5, 3>. Die Folge <1, 2, 1, 2, 4>
beschreibt einen nicht-einfachen Pfad, <1, 2, 1>, <3, 3> und <3, 5, 3> sind Zyklen.
Graph G1
Datenstrukturen
Darstellungen von Graphen
Adjazenzmatrix
Sei V = {1, ..., n}. Die Adjazenzmatrix für G = (V, E) ist eine boolesche n x n -Matrix A
mit
Meist werden true und false durch 1 und 0 dargestellt.
Adjazenzmatrix
für G1:
GOTO OneNote => Graph in eine 2dim Matrix umsetzen
Datenstrukturen
Darstellungen von Graphen
Adjazenzlisten
Man verwaltet für jeden Knoten eine Liste seiner (Nachfolger)-Nachbarknoten.
Über einen Array der Länge n = |V| ist jede Liste direkt zugänglich.
Adjazenzlisten
für G1:
Datenstrukturen
Binäre Bäume
Ein binärer Baum B ist ein gerichteter Graph, der einen ausgezeichneten Knoten w,
die sogenannte Wurzel, besitzt, die folgende Eigenschaften hat:
(1) w besitzt keine oder zwei ausgehende, aber keine eingehenden Kanten.
(2) Wenn w keine ausgehenden Kanten hat, ist w der einzige Knoten von B.
(3) Wenn w zwei ausgehende Kanten e1 = (w,w1) und e2 = (w,w2) hat, und w
zusammen mit e1, e2 aus B entfernt wird, dann besteht der Restgraph aus zwei
Graphen B1 und B2, für die gilt:
(3.1) wi hat die Eigenschaft einer Wurzel des Restgraphen Bi, i = 1,2.
(3.2) Es gibt keine Kante, die zwischen einem Knoten aus B1 und einem Knoten
aus B2 oder umgekehrt verläuft.
Datenstrukturen
Binäre Bäume
Datenstruktur eines binären Suchbaums
Datenstrukturen
Binäre Bäume
Algorithmus Suche für einen binären Suchbaum

1 Algorithmus suche(s, aktuellerKnoten)
2{
3 Wenn aktuellerKnoten ein Blatt ist, dann gib ’’nein’’ zurueck;
4 sonst
5 {
6 Wenn s = Wert von aktuellerKnoten, dann gib ’’ja’’ zurueck;
7 sonst
8 {
9 Wenn s < Wert von aktuellerKnoten, dann
10 suche(s, linkerNachfahre);
11 sonst suche(s, rechterNachfahre);
12 }
13 }
14 }
Datenstrukturen
Mengen
Mengenproblem
Gegeben sei eine geordnete Basismenge an möglichen Schlüsselwerten A zur
Identifikation von Datensätzen. Sei ferner A = {a1, . . . , an} ⊂ A die Menge der
in einer Datenstruktur gespeicherten Elemente. Dann müssen zur Bewältigung
des Mengenproblems die folgenden Operationen effizient auf der Menge A
durchführbar sein:
Einfügen: Füge den neuen Schlüssel b ∈ A in A ein,
Suchen: Entscheide für ein b ∈ A, ob b ∈ A
Löschen: Entferne b ∈ A aus
Alle-Elemente: Alle Elemente in A werden in einer nicht genauer spezifizierten
Reihenfolge ausgegeben
Beispiel: Sei A die Menge aller fünfstelligen Zahlen und A = {30159, 71679, 04105}
die Postleitzahlen als Schlüssel dreier Firmenfilialen. Dann liefert die Anfrage
Suche(71679) die Daten der zugehörigen Filiale. Suche(81671) würde
zu einer Meldung führen, dass das gesuchte Element nicht enthalten ist.
Nach Löschen(30159) und Einfügen(65189) enthält die Menge die Filialen
mit den Schlüsseln 71679, 04105 und 65189.
Algorithmen
Sortieren
Sortierproblem
Beispiel: Die Filialen müssen gemäß unterschiedlicher Kriterien in einer sortierten
Reihenfolge angezeigt werden, z.B. geordnet nach Umsatz oder Zeitpunkt
der Eröffnung.
Eine Folge von n Objekten mit den Schlüsseln a1, . . . , an ist so zu sortieren, dass
die Schlüssel gemäß einer Vergleichsrelation < in aufsteigender Reihenfolge stehen.
Die Anordnung von Elementen mit gleichem Schlüssel ist
beliebig. Eine Operation Sortieren realisiert eine bijektive Abbildung
π : {1, . . . , n} → {1, . . . , n} (Permutation), sodass gilt:
aπ(1) ≤ aπ(2) ≤ . . . ≤ aπ(n)
Sortieren wird auf die Folge mit den Schlüsseln <7, 3, 1, 4>
Angewendet, dann werden die Elemente gemäß π wie
folgt umsortiert:
π(1) = 3; π(2) = 2; π(3) = 4; π(4) = 1;
Weicker, K.; Weicker, N.: Algorithmen und Datenstrukturen. Springer Vieweg, 2013.
Algorithmen
Sortieren
Sortieren durch Auswahl

Man bestimme diejenige Position j1, an der das Element mit minimalem
Schlüssel unter a[1],...,a[N] auftritt und vertausche a[1] mit a[ j1]. Dann bestimme man
diejenige Position j2, an der das Element mit minimalem Schlüssel unter a[2],...,a[N]
auftritt (das ist das Element mit zweitkleinstem Schlüssel unter allen N Elementen),
und vertausche a[2] mit a[ j2] usw., bis alle Elemente an ihrem richtigen Platz stehen.
Gegeben sei ein Feld mit sieben Schlüsseln:
Das kleinste Element steht an Position 2; Vertauschen von a[1] und a[2] ergibt:
Algorithmen
Sortieren
Sortieren durch Auswahl
Das zweitkleinste Element steht jetzt an Position 5; Vertauschen von a[2] und a[5] ergibt:
Die weiteren vier Schritte (Bestimmung des i-kleinsten Elements und jeweils
Vertauschen mit a[i]) kann man kurz wie folgt zusammenfassen:
i=3: 2 4 8 17 15 43 47
i=4: 2 4 8 15 17 43 47
Algorithmen
Sortieren
Sortieren durch Einfügen

Die N zu sortierenden Elemente werden nacheinander betrachtet und in die jeweils
bereits sortierte, anfangs leere Teilfolge an der richtigen Stelle eingefügt.
Nehmen wir also an, a[1],...,a[i − 1] seien bereits sortiert, d. h. a[1].key ≤ ... ≤
a[i-1].key. Dann wird das i-te Element a[i] an der richtigen Stelle in die Folge
a[1],...,a[i − 1] eingefügt.
Betrachten wir wieder das Feld a mit den sieben Schlüsseln 15, 2, 43, 17, 4, 8, 47.
Die aus nur einem einzigen Element bestehende Teilfolge a[1] ist bereits sortiert.
Einfügen von a[2] in diese Folge verlangt die Verschiebung von a[1] um eine Position
nach rechts und liefert:
bereits sortiertes Anfangsstück
Algorithmen
Sortieren
Sortieren durch Einfügen

Einfügen von a[3] erfordert keine Verschiebung. Einfügen von a[4] bewirkt die
Verschiebung von a[3] um eine Position nach rechts und liefert:
Weitere Schritte
Algorithmen
Bubblesort
Bubblesort durchläuft die Liste a[1],...,a[N] der Datensätze und betrachtet dabei je zwei
benachbarte Elemente a[i] und a[i + 1], 1 ≤ i < N. Ist a[i].key > a[i + 1].key,
so vertauscht man a[i] und a[i + 1].
Ablauf: Gegeben sei wieder das Feld mit den sieben Schlüsseln
Nach dem 1. Durchlauf werden folgende Vertauschungen durchgefüht:

15, 2
2, 15, 43, 17
17, 43, 4
4, 43, 8
8, 43, 47
Nach dem ersten Durchlauf ist die Reihenfolge der Schlüssel des Feldes a
2, 15, 17, 4, 8, 43, 47.
Der zweite Durchlauf liefert die Reihenfolge
2, 15, 4, 8, 17, 43, 47.
Der dritte Durchlauf liefert schließlich
2, 4, 8, 15, 17, 43, 47,
Algorithmen
Bubblesort
Bubblesort Programmgerüst
Algorithmen
Quicksort (Sortieren durch rekursives Teilen)
Um eine Folge F = k1,...,kN von N Schlüsseln nach aufsteigenden Werten zu sortieren,

wählen wir ein beliebiges Element k ∈ {k1,...,kN} und benutzen es als Angelpunkt,
genannt Pivotelement, für eine Aufteilung der Folge ohne k in zwei Teilfolgen F1 und F2.
F1 besteht nur aus Elementen von F, die kleiner oder gleich k sind, F2 nur aus
Elementen von F, die größer oder gleich k sind. Ist F1 eine Folge mit i− 1 Elementen
und F2 eine Folge mit N −i Elementen, so ist i die endgültige Position des
Pivotelements k. Also kann man das Sortierproblem dadurch lösen, dass man F1 und
F2 rekursiv auf dieselbe Weise sortiert und die Ergebnisse zusammensetzt.
Prinzipieller Ablauf:
Im nebenstehenden Beispiel ist das Pivotelement zunächst
ganz rechts orange markiert. Wir sehen von oben nach unten,
welche Elemente betrachtet werden: Die schwarzen Pfeile
markieren diejenigen Elemente, die »überlesen« werden,
weil sie schon auf der richtigen Seite stehen.
Die orangefarbigen Pfeile markieren die zu tauschenden
Elemente. In der untersten Darstellung des Felds sieht man,
wie der von links kommende und der von rechts kommende
Index sich überkreuzen.
Algorithmen
Beispiel
Wir erläutern den Aufteilungsschritt am Beispiel eines Aufrufs von quicksort(a, 4, 9)
für den Fall, dass die Folge der Schlüssel im Bereich a[4]...a[9] die Schlüssel
5, 7, 3, 1, 6, 4 sind. Es gilt
Algorithmen
Quicksort Programmgerüst
Sortieren durch Partitionieren
Algorithmen
Quicksort Programmgerüst
Teilschritt zur Aufteilung des Felds im Quicksort-Algorithmus
Algorithmen
Aufgabe
Die Liste L=[6, 13, 3, 7, 9, 7, 2, 1, 15, 10, 5, 6] soll mit Quicksort sortiert werden.
Das Pivotelement ist 6.
Algorithmen
Mergesort (Sortieren durch Verschmelzen)
Mergesort folgt der Strategie eine Folge durch rekursives Aufteilen zu sortieren.
Im Unterschied zu Quicksort wird aber hier die Folge in gleich große Teilfolgen aufgeteilt.
Die (rekursiv) sortierten Teilfolgen werden dann verschmolzen.
Methode
Eine Folge F = k1,...,kN von N Schlüsseln wird sortiert, indem sie
zunächst in zwei möglichst gleich große Teilfolgen F1 = k1,...,k⌈ N/2 ⌉ und F2 =
k⌈ N2 ⌉+1,...,kN aufgeteilt wird. Dann wird jede dieser Teilfolgen mittels Mergesort sortiert.
Algorithmus
Mergesort(F : Folge);
{sortiert Schlüsselfolge F nach aufsteigenden Werten}
Falls F die leere Folge ist oder nur aus einem einzigen Schlüssel besteht, bleibt F
unverändert; sonst:
Divide: Teile F in zwei etwa gleich große Teilfolgen, F1 und F2;

Conquer: Mergesort(F1); Mergesort(F2);
{jetzt sind beide Teilfolgen F1 und F2 sortiert}
Merge: Bilde die Resultatfolge durch Verschmelzen von F1 und F2.
Algorithmen
Mergesort Prozedur
procedure mergesort (var a : sequence; l, r : integer);

{sortiert a[l] bis a[r] nach aufsteigenden Schlüsseln}
var
m : integer;
begin
if l < r {sonst : leere oder einelementige Folge}
then
begin
m := (l + r) div 2; {das ist die Mitte der Folge}
mergesort(a,l,m);
mergesort(a,m + 1,r);
{a[l]...a[m] und a[m + 1]...a[r] sind sortiert}
merge(a,l,m,r) {Verschmelzen}
end
end
Algorithmen
Beispiel
Betrachten wir die Folge F = 2, 1, 3, 9, 5, 6, 7, 4, 8, 10.
Zunächst wird F aufgeteilt in die beiden Teilfolgen F1 = 2, 1, 3, 9, 5 und

F2 = 6, 7, 4, 8, 10.
Dann werden beide Teilfolgen mittels Mergesort sortiert.

Das ergibt F1 = 1, 2, 3, 5, 9 und F2 = 4, 6, 7, 8, 10.
Diese beiden Folgen werden zur Folge F = 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 verschmolzen.
WIE?
Algorithmen
Beispiel
F1 = 1, 2, 3, 5, 9 und F2 = 4, 6, 7, 8, 10 werden mittels merge(a,l,m,r) verschmolzen:
Zunächst zeigen zwei Positionszeiger i und j auf die Anfangselemente beider Folgen,
also 1 und 4:
Grundbegriffe
Grundlagen Datenbanken
Charakteristika von Datenbanken
Eine Datenbank hat die langfristige

Aufbewahrung von Daten als Aufgabe
Die Sicherheit vor Verlusten ist eine

Hauptmotivation, etwas „auf die Bank zu
bringen“.
Eine Bank bietet Dienstleistungen für

mehrere Kunden an, um effizient arbeiten zu
können.
Grundbegriffe
Datenredundanz vs. Datenintegration
Ohne Datenbanken: Datenredundanz
Basis- oder Anwendungssoftware verwaltet ihre eigenen Daten in ihren (eigenen)

Dateiformaten
- Textverarbeitung: Texte, Artikel und Adressen
- Buchhaltung: Artikel, Adressen
- Lagerverwaltung: Artikel, Aufträge
- Auftragsverwaltung: Aufträge, Artikel, Adressen
- CAD-System: Artikel, Technische Bausteine
Daten sind redundant: mehrfach gespeichert
Probleme: Verschwendung von Speicherplatz, „Vergessen“ von Änderungen;

keine zentrale, „genormte“ Datenhaltung
Grundbegriffe
Ohne Datenbanken: Datenredundanz
Mehrere Benutzer oder Anwendungen können nicht parallel auf den

gleichen Daten arbeiten, ohne sich zu stören
Anwendungsprogrammierer/Benutzer können Anwendungen nicht

programmieren/benutzen, ohne
- interne Darstellung der Daten
- Speichermedien oder Rechner
zu kennen (Datenunabhängigkeit nicht gewährleistet)
Datenschutz und Sicherheit sind nicht gewährleistet
Grundbegriffe
Datenredundanz vs. Datenintegration
Mit Datenbanken: Datenintegration

Die gesamte Basis- und Anwendungssoftware arbeitet auf den selben
Daten, z.B. Adressen und Artikel werden nur einmal gespeichert
- Datenbanksysteme können große Mengen an Daten effizient

verwalten (Anfragesprachen)
- Benutzer können parallel auf Datenbanken arbeiten
(Transaktionskonzept)
- Datenschutz (kein unbefugter Zugriff) und Datensicherheit (kein
ungewollter Datenverlust) werden vom System gewährleistet
Grundbegriffe
Prinzipien
Datenbank-Management-System (DBMS)
Unter einem Datenbank-Management-System (DBMS) versteht man ein
Softwarepaket, welches in der Lage ist, (Anwender-) Daten in einem
Computersystem zu verwalten.
Spricht man von einem relationalen Datenbank-Management-System,
meint man damit, dass dieses DBMS für die Verwaltung der Daten intern
eine bestimmte Technologie benutzt und dass es bestimmten
Anforderungen genügt.
Datenbank-System (DBS)
Unter einem Datenbank-System versteht man ein DBMS mit zusätzlich
einer oder mehreren Datenbanken zur Sammlung von nicht redundanten
Daten, die von mehreren Applikationen benutzt werden.
Fasel, D.; Meier, A.: Big Data. Grundlagen, Systeme und Nutzungspotentiale. Springer Vieweg, 2016.
Datenbanksystem
Wo sind meine Daten?
Komponenten eines Datenbanksystems
Datenbankmanagement-
System: Software zum Aufbau,
zur Verwaltung, zur Kontrolle
und zur Manipulation der Daten
Schneider, M.: Implementierungskonzepte für Datenbanksysteme. Springer-Verlag, Berlin, 2004.
Grundbegriffe
Grundmerkmale von DBMS
- verwalten persistente (langfristig zu haltende) Daten
- verwalten Datenmengen effizient
- Datenmodell, mit dessen Konzepten alle Daten einheitlich beschrieben

werden (Integration)
- Transaktionskonzept
- Datenschutz, Datenintegrität (Konsistenz), Datensicherheit
Grundprinzip moderner DBS
- 3-Ebenen-Architektur
- Trennung zwischen Schema (Tabellenstruktur) und Instanz (etwa

Tabelleninhalt)
Schneider, M.: Implementierungskonzepte für Datenbanksysteme. Springer-Verlag, Berlin, 2004.
Klassischer Ansatz
Datenbanksystem
Relationale Datenbanken
Das Relationenmodell von Edgar Frank Codd (1970) drückt Daten und die Beziehungen zwischen
diesen tabellarisch aus. Auf dieser Basis entstanden erste relationale Datenbanksysteme, die
SQL oder vergleichbare Datenbanksprachen unterstützten (SQL als deskriptive Sprache steht zur
Datenbeschreibung,-manipulation und -selektion zur Verfügung).
Klassischer Ansatz
Datenbanksystem
Eigenschaften eines relationalen Datenbanksystems nach Meier und Kaufmann

Modell: Alle Daten und Beziehungen werden in Tabellen ausgedrückt und unterliegen
daher dem Relationenmodell.
Schema: Die Definition der Tabellen und der Merkmale werden im relationalen
Datenbankschema abgelegt. Darüber hinaus werden die Identifikationsschlüssel und
Regeln zur Integrität definiert.
Sprache: Das Datenbanksystem verwendet SQL zur Datendefinition, -selektion und -
manipulation.
Architektur: Die Verwaltungskomponente entkoppelt die Anwendungsprogramme von
der Speicherungskomponente und gewährleistet so eine große Datenunabhängigkeit.
Mehrbenutzerbetrieb: Das System sorgt dafür, dass mehrere Benutzer gleichzeitig
die gleiche Datenbank abfragen und und bearbeiten, parallel ablaufende Transaktionen
sich nicht behindern oder die Korrektheit der Daten beeinträchtigen.
Konsistenz: Das Datenbanksystem stellt Hilfsmittel zur Gewährung der Datenintegrität
zur Verfügung und sorgt so für die fehlerfreie und korrekte Speicherung der Daten.
Datensicherheit und Datenschutz: Das Datenbanksystem bietet Mechanismen zum
Schutz der Daten vor Zerstörung, Verlust oder unbefugtem Zugriff.
Meier, A.; Kaufmann, M. : SQL- & NoSQL-Datenbanken. 8. Auflage, Springer-Verlag, 2016.
Klassischer Ansatz
Datenbanken
Anwendungsentwicklung
Jarosch, H.: Grundkurs Datenbankentwurf. 4. Auflage, Springer Vieweg, 2016.

. Juni 2022
25. Ihr Name - bitte anpassen über "Einfügen" / Kopf- und Fußzeile 78
Klassischer Ansatz
Datenbanken
Schritte zur Erstellung einer Datenbank

Der Datenbankentwurf, d. h. die Erstellung einer Datenbank aufgrund der Realität,
erfolgt in mehreren Schritten und muss vom Datenbank-Designer in Abstimmung mit
dem Kunden im Rahmen eines Phasenkonzeptes erfolgen.
Phasenkonzept zur Erstellung einer Datenbank
Herrmann, F.: Datenorganisation und Datenbanken. Springer Vieweg, 2018.
Klassischer Ansatz
Datenbanken
Beschreibung von Strukturierungs-Möglichkeiten der Daten
Jarosch, H.: Grundkurs Datenbankentwurf. 4. Auflage, Springer Vieweg, 2016.
Klassischer Ansatz
Konzeptioneller Datenbankentwurf
Der konzeptionelle Datenbankentwurf erfolgt in drei Schritten. Zunächst erfolgt in
den ersten beiden Schritten die Erfassung und Beschreibung aller relevanten
Datenobjekte (und der zwischen diesen Datenobjekten bestehenden Beziehungen).
Anschließend werden im dritten Schritt die erfassten Datenobjekte und Beziehungen in
einem semantischen Datenmodell (Semantik = Bedeutungslehre) grafisch dargestellt.
Hierfür wird häufig das Entity-Relationship-Modell eingesetzt.
Ein Objekt ist ein Element, das eindeutig identifziert und anhand seiner Eigenschaften
unterschieden werden kann. Ein Objekt kann:
• etwas physisch Existierendes, zum Beispiel ein Kunde, ein Hersteller oder ein
Fahrrad, oder
• etwas konzeptionell Existierendes, zum Beispiel eine Firma, ein Mietvertrag, eine
Arbeitsstelle oder ein Universitätsabschluss
sein.
Im Entity-Relationship-Modell nach Chen werden Objekte als Entitäten und
Objekttypen als Entitätstypen bezeichnet. Somit bezeichnet eine Entität ein eindeutig
unterscheidbares Objekt und ein Entitätstyp eine Sammlung (oder Menge) von
Entitäten mit gleichen Attributen (Eigenschaften).
Klassischer Ansatz
Beispiele für Entitätstypen, Entitäten, Attribute und Attributwerte
Klassischer Ansatz
Beziehungstypen
Beziehungen sind Assoziationen zwischen Entitätstypen, die im ERM durch Rauten
und dargestellt werden. Eine Beziehung besteht zum Beispiel zwischen der Kundin
„Anja Maier“ und dem von ihr gemieteten Fahrrad „Scale 70“.
Gleichartige Beziehungen zwischen Entitäten bzw. Entitätstypen werden im ERM von
Chen zu Beziehungstypen zusammengefasst.
Arten von Beziehungen im ER-Modell
Klassischer Ansatz
Beziehungstypen
Beispiel Beziehungen
zwischen
Entitätstypen
Beipiel-ER-Modell
ER-Modell
Übung
Jeder Rennstall besitzt einen eindeutig identifizierenden Namen sowie einen

Leiter. Die Fahrer erhalten eine Fahrernummer und werden durch Name,
Vorname und Gewicht beschrieben. Ein Fahrer fährt für einen Rennstall. Rennen
werden durch einen Namen, das Datum und eine Streckenlänge beschrieben. An
einem Rennen nehmen mehrere Fahrer teil, wobei Startposition und Ergebnis
festgehalten werden.
Bestimmen Sie die Entity- und Relationship-Typen mit ihren Attributen und
zeichnen dazu ein ER-Diagramm.
Klassischer Ansatz
Relationenmodell
Das Relationenmodell wurde vom englischen Mathematiker Edgar Frank Codd konzipiert und
1970 unter dem Titel ‚A Relational Model of Data for Large Shared Data Banks‘ bei den
Communications of the ACM veröffentlicht.
Das Relationenmodell kennt als einziges Konstrukt das einer Tabelle. Eine
Tabelle oder Relation ist eine Menge von Tupeln (Datensätzen). Jedes Tupel besteht
wiederum aus einer Menge von Attributen (Merkmalen), welche die Eigenschaften des
Tupels aus vordefinierten Wertebereichen in Spalten darstellen:
Auszug Relationenmodell
für Filme und Filmemacher
Klassischer Ansatz
Abfragesprachen
Das Ergebnis einer Abfrage (Query) ist ein Auszug des Datenbestandes.
SQL (Structured Query Language) ist eine Abfragesprache für die Auswertung
relationaler Datenbanken.
Grundstruktur
SELECT Merkmale der Resultatstabelle
FROM Tabelle oder Tabellen
WHERE Selektionsbedingung
SELECT Jahr
FROM FILM
WHERE Titel = ‚The Matrix‘;
In der Tabelle FILM wird das Tupel mit dem

Titel ‚The Matrix‘ gesucht, bevor es auf die
Spalte ‚Jahr‘ projiziert wird und das Resultat ‚1999‘ erzeugt.
Klassischer Ansatz
Abfragesprachen
Kombination mehrerer Tabellen
Wie lautet der Name des Schauspielers, der im Film ‚The Matrix‘ den ‚Neo‘ darstellte?
Das entsprechende SQL-Statement lautet:
SELECT Name
FROM FILM, SPIELT, DARSTELLER
WHERE FILM.F# = SPIELT.F# AND
SPIELT.D# = DARSTELLER.D# AND
Titel = ‚The Matrix‘ AND
Rolle = ‚Neo‘;
Herausforderung
Datenmanagement im Wandel
Datenmanagement im Zeitalter von Big Data und Self-Service

BARC-Studie „Datenmanagement im Wandel - Data Warehousing und
Datenintegration im Zeitalter von Self-Service und Big Data“
• Veränderung in der Unternehmensführung durch den strategischen Wandel
zu einer datengetriebenen Wirtschaft
• Entscheidungsträger entdecken den Wert von Daten für den

Unternehmenserfolg
• Daten sollen umfassender und schneller nutzbar gemacht werden
• Als Erwartung werden innovative und profitable Anwendungsmöglichkeiten

aus der IT und den Fachbereichen dargeboten
• Eine zentrale Datenstrategie sollte im Einsatz sein

https://barc.de/blog/datenmanagement-im-wandel-infografik
Abgerufen: 16.02.2019
BARC-Studie
BARC-Studie
BARC-Studie
BARC-Studie
BARC-Studie
hohe Bewertung der

Datenmanagement-Aktivitäten
Strukturierte und unstrukturierte Daten
Welche Daten habe ich und wo setze ich sie ein?
http://www.absatzwirtschaft.de/big-data-analytics-im-marketing-2-19095/
Strukturierte und unstrukturierte Daten
Neue Datengrundlagen
Bewertbarkeit
Was sind meine Daten Wert?
How much is your personal data worth?

Use our calculator to check how much multibillion-dollar data broker industry might
pay for your personal data
https://ig.ft.com/how-much-is-your-personal-data-worth/?ft_site=falcon#axzz2z2agBB6R Abgerufen: 16.02.2019
Neuer Ansatz
Datenbanksystem
NoSQL-Datenbanken
Unter der Bezeichnung NoSQL-Datenbanken werden verschiedene Arten von
Datenbank-systemen zusammengefasst, die sich nicht am relationalen Modell
orientieren. Diese Datenbanken, denen verschiedene Datenbankmodelle zugrunde
liegen können, sind horizontal skalierbar und lassen sich für Big-Data-Anwendungen
einsetzen. NoSQL-Datenbanken nutzen statt Tabellen zum Beispiel Wertepaare,
Objekte, Dokumente oder Listen und Reihen für die Organisation der Daten.
Folgende typischen Eigenschaften zeichnen die NoSQL-Systeme aus:
 horizontale Skalierbarkeit
 Vermeiden von unnötiger Komplexität
 hohe Performance und ein hoher Durchsatz
 Nutzung von allgemein gebräuchlicher Hardware
 Es existiert kein fixes Datenbankschema
 Vermeidung von relationalen Ansätzen des Datenmappings
 Einfachheit in der Installation und Konfiguration von verteilten Datenbank-Clustern
sowie die Unterstützung der aktuellen Hardwaregenerationen
Struktur NoSQL
Datenbanksystem
Grundstruktur eines NoSQL-Datenbanksystems
Beispiel
Nutzung von SQL- und NoSQL-Datenbanken für einen Webshop
Key-Value
NoSQL-Datenbankmodelle
Key-Value-Datenbanken
Key-Value-Datenbanken sind einfach-strukturierte Datenspeicher, in denen sämtliche Daten in
Form von Schlüssel-Wert-Paaren gespeichert sind (Beispiel Cassandra).
Zu jedem Schlüssel existiert genau ein assoziiertes deskriptives Datenobjekt. Dieses stellt den
Wert zum zugehörigen Schlüssel dar.
Durch Angabe des Schlüssels kann der zugehörige Wert abgefragt werden.
Weder die Schlüssel noch die Werte bestehen bei aus komplexen Datenstrukturen. Als
grundlegendes Prinzip dieser Datenbanken wurde definiert, dass der Schlüssel eineindeutig
ist. Es wird auf den Aufbau von Indexstrukturen verzichtet und die Datenstruktur möglichst
einfach gehalten. Datensätze können schnell gelesen / geschrieben werden.
Dokumente
Dokumentenorientierte Datenbanken
Dokumentenorientierte Datenbanken weisen ebenfalls eine Schlüssel-Wert-Paar-Speicherstruktur
auf, allerdings sind ihre Werte komplexe Datenstrukturen als Dokumente. Diese Dokumente
haben untereinander keine Beziehung und sind lediglich eine strukturierte Sammlung von Daten.
Demnach ist eine dokumentenorientierte Datenbank eine Sammlung (Collection) von semi-
strukturierten Dokumenten. (Beispiele: MongoDB, Couchbase, CouchDB)
Die Datenstrukturen der Dokumente haben

die Form von rekursiv verschachtelten
Attribut-Wert-Paaren und besitzen keine
referenzielle Integrität. Sie sind schemafrei.
In jedem Dokument können beliebige
Attribute verwendet werden. Diese müssen
nicht zuerst in einem Schema definiert
werden.
Die Werte können atomar, Listen oder selbst
wieder Objekte sein. Meist wird das JSON-
Format für solche Dokumente verwendet.
Spaltenorientierte vs. zeilenorientierte Speicherung
Spaltenorientierte Datenbanken
Spaltenorientierte Datenbanken sind eine Erweiterung des Key-Value-Konzepts um mehr
Struktur. Auf der einen Seite werden performant große Datenmengen verarbeitet (Key-Value-
Datenbanken) und auf der anderen Seite wird die Möglichkeit zur Strukturierung des
Datenraumes (Schema) gegeben. Die Datenspeicherung erfolgt im mehrdimensionalen
Tabellen, wobei die Adressierung von Datenobjekten mit Zeilenschlüsseln erfolgt.
Zeilen- und spaltenorientierte Speicherung
Graphstrukturen
Graph-Datenbanken
Graph-Datenbanken spezialisieren sich auf die Speicherung vernetzter Informationen und deren
effiziente Traversierung in Graphen. Sie bilden die Graphstruktur eines Datensatzes explizit ab
und stellen entsprechende Operationen zur effizienten Durchsuchung und Manipulation dieser
Struktur bereit. Knoten und Kanten eines Graphen können durch Eigenschaften (Properties)
durch Key-Value-Beziehungen bezeichnet werden.
Property-Graph
Graphstrukturen
Graphenmodell
Im Graphenmodell haben die Knoten ebenso wie die Kanten eindeutige Namen und je nach
Bedarf auch Eigenschaften. Filme beispielsweise werden im Knoten FILM abgelegt, mit den
Eigenschaften Titel und Jahr (Erscheinungsjahr). Entsprechend werden die Knoten
DARSTELLER, REGISSEUR und GENRE definiert. Die Kante SPIELT ist gerichtet und führt
vom Knoten DARSTELLER zum Knoten FILM; sie weist als Eigenschaft die Rollen der
Schauspieler in unterschiedlichen Filmen aus.
Graphstrukturen
Abfragesprache Cypher für Graphdatenbanken

Cypher ist eine deklarative Abfragesprache, um Muster in Graphdatenbanken
extrahieren zu können. Der Anwender spezifiziert seine Suchfrage durch die Angabe
von Knoten und Kanten. Daraufhin berechnet das Datenbanksystem alle
gewünschten Muster, indem es die möglichen Pfade (Verbindungen zwischen Knoten
und Kanten) auswertet.
Graphstrukturen
Cypher
Grundelemente
MATCH Identifikation von Knoten und Kanten sowie Deklaration von
Suchmustern
WHERE Bedingungen zur Filterung von Ergebnissen
RETURN Bereitstellung des Resultats, bei Bedarf aggregiert
Möchte man das Erscheinungsjahr des Films‚ The Matrix’ berechnen, so lautet die
Anfrage in Cypher:
MATCH (m: FILM {Titel: „The Matrix“})
RETURN m.Jahr
In dieser Abfrage wird die Variable m für den Film ‚The Matrix‘ losgeschickt, um das
Erscheinungsjahr dieses Filmes durch m.Jahr zurückzugeben. Die runden Klammern drücken bei
Cypher immer Knoten aus, d. h. der Knoten (m: FILM) deklariert die Laufvariable m für den Knoten
FILM. Neben Laufvariablen können konkrete Attribut-Wert-Paare in geschweiften Klammern
mitgegeben werden. Da wir uns für den Film ‚The Matrix‘ interessieren, wird der Knoten (m: FILM)
um die Angabe {Titel: „The Matrix“} ergänzt
Neuer Ansatz
Datenbanksystem
Konsistenzgewährung
Eric Brewer von der Universität Berkeley stellte an einem Symposium im Jahre 2000
die Vermutung auf, dass die drei Eigenschaften der Konsistenz (Consistency), der
Verfügbarkeit (Availability) und der Ausfalltoleranz (Partition Tolerance) nicht
gleichzeitig in einem massiv verteilten Rechnersystem gelten können.
Consistency (C): Wenn eine Transaktion auf einer verteilten Datenbank mit
replizierten Knoten Daten verändert, erhalten alle lesenden Transaktionen den
aktuellen Zustand, egal über welchen der Knoten sie zugreifen.
Availability (A): Unter Verfügbarkeit versteht man einen ununterbrochenen Betrieb

der laufenden Anwendung und akzeptable Antwortzeiten.
Partition Tolerance (P): Fällt ein Knoten in einem replizierten Rechnernetzwerk oder
eine Verbindung zwischen einzelnen Knoten aus, so hat das keinen Einfluss auf das
Gesamtsystem. Zudem lassen sich jederzeit Knoten ohne Unterbruch des Betriebs
einfügen oder wegnehmen.
Neuer Ansatz
Datenbanksystem
CAP-Theorem
Das CAP-Theorem sagt aus, dass in einem massiv verteilten Datenhaltungssystem
jeweils nur zwei Eigenschaften aus den drei der Konsistenz (C), Verfügbarkeit (A)
und Ausfalltoleranz (P) garantiert werden können.
Mit anderen Worten lassen sich in einem massiv verteilten System entweder
Konsistenz mit Verfügbarkeit (CA) oder Konsistenz mit Ausfalltoleranz (CP) oder
Verfügbarkeit mit Ausfalltoleranz (AP) kombinieren, alle drei sind nicht gleichzeitig zu
haben.
Neuer Ansatz
Datenbanksystem
Transaktionskonzepte ACID und BASE

Das klassische Transaktionskonzept ACID setzt auf Atomarität (Atomicity),
Konsistenz (Consistency), Isolation (Isolation) und Dauerhaftigkeit (Durability).
Die leichtere Variante BASE (Basically Available, Soft State, Eventually Consistent)
erlaubt, dass replizierte Rechnerknoten zwischenzeitlich unterschiedliche Daten-
versionen halten und erst zeitlich verzögert aktualisiert werden.
Herausforderung
Digitalisierung als Herausforderung
Daten brauchen Datenintegration

 Die fachliche Bedeutung der Daten wächst und mit ihr die Relevanz von Daten
 zur besseren Steuerung, Optimierung, Automatisierung und Entdecken neuer

Chancen/Innovationen
 „Wert aus Daten“ zu generieren treibt Initiativen sowohl im Fachbereich als auch in
der IT
 Das Resultat sind mehr und andere Daten, Rollen, Analysen, Anwendungen
und Systeme mit neuen und anderen Anforderungen, die bestehende
Infrastrukturen oftmals vor Herausforderungen stellen
 Datenintegration beschreibt fachliche und technische Konzepte für den Zugriff

auf/Bereitstellung von Daten unabhängig ihrer Quelle für allgemeine oder spezielle
Anwendungen zur Generierung von Wert aus Daten
Datenintegration
Sichtweise
 Nutzersicht: Prozess, der benötigt wird, um aus unterschiedlichsten Informationen
einen tatsächlichen Wissensgewinn zu erzielen
Stahl, R.; Staab, P.: Die Vermessung des Datenuniversums, Springer Vieweg, 2017.
Datenintegration
Stufen der Integration

 Logische Zentralisierung der Daten, um Daten zu sammeln.
 Gemeinsames Ordnungssystem schaffen durch einheitliche Modellierungsmethodik.
 Semantische Angleichung zum inhaltlichen Verständnis. (Beispiel: Begriffe Kredit,
Preis oder Höhe werden jeweils gleich verstanden).
Datenintegration
Prozesskette der Datenintegration und -aufbereitung
Datenintegration
Datenintegration für Reporting, OLAP und Mining-Verfahren
Rossak, I.: Datenintegration, Carl Hanser Verlag, München, 2013.
Datenintegration
Heterogenität
Als Heterogenität wird die unterschiedliche Art und Weise wie etwas modelliert,
strukturiert und realisiert ist, beschrieben. Heterogenität entsteht meist im Ergebnis der
autonomen Modellierung, Implementierung und Verwaltung von Informationssystemen.
■ Technische Heterogenität
■ Syntaktische Heterogenität
■ Strukturelle Heterogenität
■ Semantische Heterogenität
Datenintegration
Technische Heterogenität
Technische Heterogenität bezieht sich vor allem auf Unterschiede hinsichtlich der
verwendeten Hardware, Software, Schnittstellen und Anfragesprachen, d. h. nicht
unmittelbar auf die Unterschiede hinsichtlich der Daten selbst, sondern Unterschiede
hinsichtlich des Zugriffs darauf (Anfragesprachen, Austauschformate, Protokolle usw.).
Ebene mögliche Ausprägung

Anfragemöglichkeit Anfragesprache, parametrisierte
Funktionen, Formulare (engl.
canned queries)
Anfragesprache SQL, XQuery, Volltextsuche
Austauschformate Binärdaten, XML, HTML,

tabellarisch
Kommunikationsprot HTTP, JDBC, SOAP
okolle
Datenintegration
Syntaktische Heterogenität
Syntaktische Heterogenität resultiert aus der technischen Heterogenität und bezieht
sich auf die technischen Unterschiede in der Darstellung gleicher Sachverhalte, z. B.
verwendete Datentypen und -formate, Zeichensätze, Dateistrukturen usw.
Folgende Beispiele repräsentieren einige der typischen syntaktischen Unterschiede,

die entstehen, wenn Datenbestände unabhängig voneinander entworfen und gepﬂegt
werden:
■ Verwendung von unterschiedlichen Datentypen wie z. B. boolean vs. bit, ﬂoat vs.
decimal
■ Verwendung von unterschiedlichen Zeichensätzen und Kodierungen wie z. B.
Unicode, UTF-8, ASCII,ISO/IEC 8859
■ Verwendung von unterschiedlichen Trennzeichen wie z. B. Komma, Semikolon,
Tabulator
■ Verwendung von unterschiedlichen Dateiformaten wie z. B. csv, xml, xls, txt
Datenintegration
Strukturelle Heterogenität
Beschreiben zwei unterschiedliche Schemata den gleichen Ausschnitt der realen Welt,
so spricht man von struktureller Heterogenität.
Gründe: unterschiedliche Wissenstände der Entwickler, anders gestellte

Anforderungen, andere Funktionalität bzgl. Modellttyp, Tabellenstruktur, Standardwerte,
Formate, Integritätsbedingungen, Normalisierungsgrad etc.
Ausprägungen:
Verwendung von unterschiedlichen Datenmodellen oder Modellierungssprachen wie z. B. ER-
Modell, UML
Verwendung von unterschiedlichen Modellierungsebenen wie z. B. Modellierung eines Sachver-
haltes als Wert, Attribut oder Relation
Verwendung von unterschiedlichen Standardwerten und Formaten wie z. B. bei Telefonnummern,
Datumswerten
Verwendung von unterschiedlichen Integritätsbedingungen wie z. B. Schlüsselfelder, Wertelisten
Datenintegration
Semantische Heterogenität
Semantische Heterogenität bezieht sich vor allem auf die unterschiedlichen
Bedeutungen und Kontexte, in denen die Daten der jeweiligen Quellsysteme
verwendet werden, z. B. Benennungen, Kodes, Bemaßungen und Skalen, Bedeutung
von NULL-Werten (unbekannt, nicht erfasst, nicht vorhanden).
Beispiele für semantische Unterschiede:
Verwendung von unterschiedlichen Benennungen für gleiche Sachverhalte
(Synonyme, Abkürzungen, Akronyme) wie z. B. IT oder EDV oder IuK
Verwendung von gleichen Benennungen für unterschiedliche Sachverhalte
(Homonyme) wie z. B. „Fälligkeit“ bei Rechnungen oder Gewinnausschüttungen
Verwendung von unterschiedlichen Skalen Klassifzierungen wie z. B. bei der Einteilung
der Altersgruppe in die Altersgruppe ab 6 Jahre, ab 14 Jahre, ab 18 Jahre oder die
Einteilung in die Altersgruppe unter 20 Jahre, 20–30 Jahre, 30–40 Jahre, über 40
Jahre
Verwendung von unterschiedlichen Bemaßungen und Skalen für die Messung gleicher
Größen wie z. B. Angabe der Geschwindigkeit in km/h oder mph
Chancen und Herausforderungen im Umfeld BI & Big Data
Studie Institut für Business Intelligence (IBI) „Competing on Analytics –

Herausforderungen – Potenziale und Wertbeiträge von Business Intelligence und Big Data“
Verständnis von Big Data

Analytische Potentiale

Potentiale für Geschäftsziele

Treiber der zukünftigen

Nutzung von Big Data
BUSINESS INTELLIGENCE
Business Intelligence
Begriff
„All about how to capture, access, understand, analyze and turn one of the most
valuable assets of an enterprise – raw data – into actionable information.”
Azvine, B.; Cui, Z.; Nauck, D. D. (2005): Towards real-time business intelligence. In: BT Technology
Journal, 2005 (23(2005)3), S. 214–225.
„Applications and technologies, which are used to gather, provide access to

and analyze data and information about the organizations, to help make better
decisions”.
Wu, Liya; Barash, G.; Bartolini, C.: A Service-oriented Architecture for Business Intelligence. In: IEEE
International Conference on Service-Oriented Computing and Applications, 2007 2007 (SOCA '07.
2007), S. 279–285.
„The process is composed of methods that organizations use to develop useful

information…“. (Prozess von der methodischen Datenanalyse zur
Informationsgewinnung und Entscheidungsfindung)
Jourdan, Zack; Rainer, R. Kelley; Marshall, Thomas E.: Business Intelligence: An Analysis of the
Literature. In: Information Systems Management 2008 (25(2008)2), S. 121–131.
Traditionelles Framework Business Intelligence
Seufert, A.; Sexl, S.: Competing on Analytics –Wettbewerbsvorsprung durch Business Intelligence. In: Gleich, Ronald (Ed.): Challenge Controlling 2015,
Haufe Verlag, Freiburg i. Br., pp. 201-218
Data Warehouse Architektur
http://datawarehouse4u.info/images/data_warehouse_architecture.jpg
Online Analytical Processing (OLAP)
• Daten im DWH werden in einem multidimensionalen Datenmodell (MDM)

vorgehalten und können Themen- und Zeit-bezogen in unterscheidlichen
Aggregationsstufen betrachtet werden.
• MDMs können über OLAP explorativ ausgewertet werden
• Anforderungen an OLAP: Fast, Analysis, Shared, Multidimensional,
Information (FASMI)
• OLAP-Cube Grundoperationen: Pivotierung, Drill-down, Drill-through

(vertikal), Drill-across (horizontal) , Slice & Dice (Würfel in Scheiben zerlegt)
Framework Operational Business Intelligence
Innovative Informationsnutzung durch BI als Schlüssel im Wettbewerb
Business Intelligence als Enabler für Prozessoptimierung und Benchmarking

Herausforderung Prozesstransparenz und -optimierung
 automatisierte Erfassung und Dokumentation der Prozesse (manuelle IST-
Erfassung oft unzureichend, fehlende Dokumentation, nicht aktuelle Prozessdaten)
 automatisierte quantitative Analyse der Prozessdaten (eine modellbasierte
Analyse automatisiert gewonnene Prozessdaten; Nutzung von
Entscheidungsmodellen und -methoden zur manuellen (OLAP) oder
datengetriebenen Analyse (Data Mining) im Rahmen der Prozessanalyse)
 Identifikation von Ineffizienzen in Prozessen (Transparenz über Schwachstellen
in Prozessen schaffen; typische Prozessabfolgen, Kunden-/Prozesssegmente und
Prozessausreißer identifizieren)
 Benchmarking der Prozessdaten und der Analyseergebnisse (Nach der
Analyse und Kennzahlberechnung werden die Prozessdaten im Rahmen eines
Benchmarkings aufbereitet, um prozessuale und finanzielle Kennzahlausprägungen
in Relation zu den anonymisierten Werten der anderen Teilnehmer eines
Benchmarkings zu stellen und Rückschlüsse für Optimierungen zu ziehen)
Business Intelligence as a Service
Seufert, A.; Sexl, S.: Competing on Analytics –Wettbewerbsvorsprung durch Business Intelligence. In: Gleich, Ronald (Ed.): Challenge Controlling 2015,Haufe Verlag, Freiburg i. Br., pp. 201-218
IaaS – Infrastructure as a Service: ständig steigende Datenvolumina stehen der
Forderung einer immer schnelleren Auswertung und Analyse, bis hin zu Real-Time-BI
gegenüber -> steigende Anforderungen an die Skalierbarkeit und Verfügbarkeit der
Infrastruktur. Die Skalierbarkeit von Cloud-Applikationen könnte darüber hinaus die
Kollaboration bei rechen- und datenintensiven Themen fördern (z.B.
Forschungsallianzen).
PaaS – Platform as a Service: neue Anforderungen hin zu plattformübergreifender

Softwareentwicklung unter zunehmender Einbeziehung externer Services und Dienste;
die Software für die Unternehmenssteuerung muss leicht angepasst und verwaltet
werden können, beliebig skalierbar und funktional erweiterbar sowie
plattformbergreifend verfügbar sein.
SaaS – Software as a Service: Der Bereich SaaS lässt sich analog zum klassischen
BI-Ansatz in die Ebenen Datenbereitstellung, Informationsgenerierung/ Modelle und
Präsentation/Informationsaufbereitung unterteilen. Auf der Basis des Cloud-
Verständnisses sind jedoch wesentliche konzeptionelle Erweiterungen vorstellbar.
DaaS – Datenbereitstellung durch Data as a Service: Grundlage ist eine
konsistente, abgestimmte Datenbasis; traditionell Data-Warehouse -> Ziel ist der
automatisierte Aufbau einer themenbezogenen, integrierten Datenhaltung für
Entscheidungszwecke
Mögliche Erweiterungen:
Die Datenversorgungsschicht in der Architektur der BI-Cloud umfasst dabei nicht nur
die Aufbereitung unternehmensinterner Datenbestände, sondern kann vielmehr die
Rolle eines globalen Datenmarktplatzes einnehmen, bei dem qualitätsgesichert
externe Informationen aufbereitet und den Unternehmen bereitgestellt werden.
App-Store für Daten erstellen, in dem professionell aufbereitete Daten i.S. einer
Wertschöpfungskette für Daten zur weiteren Verarbeitung angeboten werden. Die
technische Aufbereitung kann als Input für die MaaS-Ebene, als Schnittstelle zu in-
/externen Cloud-Datenbanken oder in weitere standardisierte Formate wie Web
Services, RSS Feeds etc. erfolgen.
Ein weiterer Vorteil für den Endkonsumenten eines Datenmarktplatzes könnte in einer
zentralen und einheitlichen Abrechnung bestehen.
Framework Data as a Service
MaaS – Informationsgenerierung durch Model as a Service: Grundlage sind OLAP
(Online Analytical Processing) sowie Data Mining als Basistechnologien, um komplexe
mehrdimensionale Modelle zu entwickeln, Muster zu identifizieren oder auch Ursachen
und Wirkungszusammenhänge zu erkennen und relevante Inhalte zu identifizieren.
Es können darüberhinaus umfangreiche betriebswirtschaftliche Methoden und Modelle
(z.B. Kundenklassifizierungen, Customer-Lifetime-Value-Analysen etc.) aufbereitet,
bereitgestellt und ggf. um Branchenspezifika ergänzt werden. Potenziale liegen in der
Vernetzung der in der Cloud existierenden Informationen und deren Anbindung an
Prozesse im Rahmen des Operational BI:
 Supply-Chain-Analyse (Bewertung von Lieferanten und Lieferketten anhand von in
der Cloud existierenden Informationsdiensten),
 Marktforschung (Bewertung von Social-Media-Inhalten in Bezug auf das eigene
Unternehmen oder Produkte),
 Produktion und Logistik (Einfluss von Wetter-, Umwelt-, und Verkehrsfaktoren)
VaaS – Präsentation / Informationsaufbereitung durch Visualisation as a Service:
Die generierten Informationen werden im klassischen BI üblicherweise über einen
Windows-Client oder das Internet/Intranet aufbereitet und verteilt. Vielfach erfolgt der
Zugang über Portale, die dem Benutzer einen zentralen Einstiegspunkt in
verschiedene Analysesysteme bieten -> Märkte für die Visualisierung schaffen
Die oberste Ebene der BI-Cloud-Architektur hat zum Ziel, die über die MaaS-Schicht
bereitgestellten Modelle für den Endanwender auf der Basis eines standardisierten
Information Designs zugreifbar und nutzbar zu machen. Visualisierungsdienste, i.d.R.
in Form webbasierter Applikationen (Web Parts, Web Services), integrieren dabei
Berichte, Analysen, Kennzahlen oder Planungssheets nahtlos in bestehende
Unternehmensportale und bieten die Modelle für die Weiterverwendung in zusätzlichen
Analysefrontends an.
Der wachsende Bedarf an BI-Applikationen für mobile Endgeräte beschleunigt die
Entwicklung einer VaaS-Schicht, da hierfür insbesondere die Schnittstellen zur
Datenbewirtschaftung aus der MaaS-/DaaS-Schicht vereinheitlich werden.
Big Data vs. Business Intelligence
Vergleich Big Data vs. Business Intelligence
http://www.e-salzburg.com/bi-framework/upload/surveys/971476/images/framework.png Abruf: 28.05.18
Integrierte Anwendungslandschaft
Transformation zur Nutzung von Big Data
Integrierte Anwendungslandschaft mit traditionellen Systemen und Big-

Data-Lösungen
Technologische Aspekte
Transformation zur Nutzung von Big Data
Was wird technologisch benötig?
Prozess für Analytics-Maßnahmen
CRISP-DM
CRISP-DM (CRoss-Industry Standard Process for Data Mining)
Wozu benötigt man einen standardisierten Prozess?
Der Prozess der

Rahme für Speicher- und
Wissensentdeckung Wiedereinsetzpunkte
Muss verlässlich und
reproduzierbar sein – hilft bei der Planung und Verwaltung
der Analyseaufgaben
auch für Menschen mit
geringem Data Mining leichterer Einstieg für den Anwender
Hintergrundwissen. als Leitlinie
Morik, TU Dortmund, Wissensentdeckung in Datenbanken

www-ai.cs.uni-dortmund.de/LEHRE
Data Mining Prozess
CRISP-DM
CRISP-DM (CRoss-Industry Standard Process for Data Mining)
https://statistik-dresden.de/archives/1128
Datenanalyse durchführen
Analyse von Big Data & Big Data Technologien
Datenanalyseprozess
Studie Krcmar: Innovationspotentialanalyse für die neuen Technologien für das Verwalten und Analysieren von großen Datenmengen
(Big Data Management)
Datenvisualisierung
Grundlagen und Zieldefinition
Die Datenvisualisierung beschäftigt sich mit der visuellen Darstellung

großer Datenmengen und deren Zusammenhängen.
Daten werden nicht in komplexen Tabellen dargestellt, sondern in
Dashboards visualisiert.
Beispiel Microsoft Excel Beispiel Microsoft Power BI
Das Ziel ist schnell einen Überblick über komplexe Informationen zu

geben. Die Management gerechte Darstellung steht im Fokus.
Datenvisualisierung
Grundlagen und Zieldefinition
Die Disziplin der Datenvisualisierung hat starke Schnittmengen mit der
Mensch-Maschine-Interaktion.
Die Betrachtung der Daten benötigt nicht unbedingt eine Hypothese und Zielrichtung:
Explorativ Konformativ Präsentation

Startpunkt
• Daten ohne • Hypothese über • Fakten in einer

Hypothese über Daten Datenquelle
die Daten
• Interaktiv, • Ziel-orientierte • Auswahl einer

Prozess
ungerichtete Untersuchung der angemessenen

suche nach Hypothese Analysetechnik
Trends und
Strukturen
• Visualisierung der • Hochwertige
• Visualisierung von Daten, die eine Visualisierung, in
Ergebnis
Daten, die eine Bestätigung oder der Fakten

Hypothese Ablehnung der präsentiert
beinhalten Hypothese werden
bedeuten
https://data-science-blog.com/blog/2015/06/06/daten-visualisierung-eine-wissenschaft-fur-sich-oder-auch-zwei/
Stand Juni 2018
Vortragsfolien zu : 9. Fachtagung Datenbanksysteme in Büro, Technik und Wissenschaft (BTW ' 01), Deutsche Informatik Akademie (DIA),
Oldenburg, Germany, 2001
Von Daten zur Visualisierungsperspektive
Warum visualisieren?
Mehr Wahrnehmung nutzen

Datenperspektive ausreichend?
Anscombe Quartett
Visualisiert - Sind die Daten nun unterschiedlich?
https://interworks.com/blog/dmurray/2017/06/29/anscombes-quartet-tableau-way/ Abgerufen: 30.06.2018
Visualisierungsperspektive
Visualisierungsmöglichkeit Interaktive Aufbereitung

Im Kontrast zu statischen Diagrammen können Visualisierungen interaktive aufbereitet
werden und das Filtern und Interagieren mit dem Inhalt zulassen.
http://www.zeit.de/politik/deutschland/wahlland-2013
Visualisierungsperspektive
Beispieldesign erstellen
Audience – Wähler der Landtagswahl
High Level Goal Representation Interaction Design Prototype

Intent Intent
Die Wahler- Wahlbezirke Auswählen und
gebnisse unterscheiden filter der
erkunden. und vergleichen Bezirke.
Low Level Goal Representation Interaction

Technique Technique
Wahldaten filter Scatter Plot mit Bezirke und
und nach Partei skalierten und Parteien fürs
und Bezirke gefärbten Filtern
gruppieren Punkten selektieren
Diagrammtypen
Beispiele von Visualisierungstechniken
Streudiagramm
zeigt die Punkte der Beobachtungen in
einem zweidimensionalen Datenraum.
Ermöglichst die Ableitung von Trends,
Erkennen von Position und Anzahl von
Clusterzentren, Konzentration, Streuung, etc.
Liniendiagramm
Zeigt die Entwicklung von Werten gruppiert
pro Beobachtung oder Kategorie. Entwicklung
pro Zeit und Darstellung des Verlaufs im
zweidimensionalen Datenraum
Diagrammtypen
Beispiele von Visualisierungstechniken
Ampel / Tacho Diagramm

Zeige die Ausprägung eines Wertes im
Verhältnis und mit Bezugsrahmen.
Ampeln eignen sich zur Darstellung eines
Status (Grün, Gelb, Rot).
Ähnlich können Tachometer genutzt werden
um den Wert in einem Referenzrahmen zu zeigen.
KPI / Wert
Darstellen eines einzelnen Wertes als Summe,
Faktor oder Differenz.
Bsp: Menge Kunden, Summe Umsatz,
Differenz Umsatz – Kosten.
Power BI
Praktische Übung
Laden Sie sich Power BI Desktop herunter und installieren sie es.
https://powerbi.microsoft.com/de-de/downloads/
Power BI
Praktische Übung Power BI
Verbinden Sie sich mit der Datenquelle (Ofeed)

http://services.odata.org/V3/Northwind/Northwind.svc/
Laden Sie alle Tabellen.
Power BI
Schematischer Aufbau PowerBI
Arbeitsbereich Visualisierungen Daten je Tabelle
Navigation:
Arbeitsbereich,
Datenansicht,
Tabellenstruktur
Konfiguration der
Arbeitsblätter Elemente
Power BI
In der Demo Datenquelle sehen Sie die Verbindungen der

Relationalen Datenbank mit den Schlüsselattributen.
Power BI
Übung
Erstellen Sie auf einem ersten Arbeitsblatt folgendes Diagramm:

Umsatz Umsatz pro
pro Land Kategorie
Umsatz
pro Land
Anteil am
Gesamtumsatz
THE END
;-)

1 Algorithmen Datenmanagement Und Datenstrukturen - Kapitel 4

Hochgeladen von

Dokumentinformationen

Originaltitel

Copyright

Verfügbare Formate

Dieses Dokument teilen

Dokument teilen oder einbetten

Freigabeoptionen

Stufen Sie dieses Dokument als nützlich ein?

Sind diese Inhalte unangemessen?

Copyright:

Verfügbare Formate

1 Algorithmen Datenmanagement Und Datenstrukturen - Kapitel 4

Hochgeladen von

Copyright:

Verfügbare Formate

4 Algorithmen, Datenmanagement

Das Backrezept weist die Eigenschaften eines

 Endlichkeit der Länge der Beschreibung

 Terminierung (Beendigung nach endlich vielen Schritten/Operationen)

 eindeutige Reihenfolge der Operationen

Beispiel: Türme von Hanoi

Türme von Hanoi

Transportiere n-1 Scheiben vom

Transportiere die letzte Scheibe vom

Transportiere n-1 Scheiben vom

Tower of Hanoi: Six Rings Solution 6. - Bing video

Gegeben: Eine Folge a0,...,an−1 von positiven ganzen Zahlen, n > 0.

Gesucht: Der kleinste Wert a der gegebenen Zahlen, d. h. a = min(a0,...,an−1)

Ablaufbeispiel als gegebene Folge: 11,7,8,3,15,13,9,19,18,10,4

Wenn Bedingung, dann Anweisung 1;

Grafische Darstellung durch Struktogramme

Gegeben sei folgender Algorithmus:

Welchen Wert haben a und b nach Ausführung dieses Algorithmus?

Zeichnen Sie ein Struktogramm analog zur Abbildung

Eine Schleife ermöglicht es, einen Algorithmenteil mehrmals zu wiederholen.

Solange Bedingung, führe aus: Anweisung

Durch eine Ausgabeanweisung wird ein Wert ausgegeben.

Beispiel primitive Datentypen: Programmiersprache JAVA

int[] a = {11,7,8,3,15,13,9,19,18,10,4}; (mit Wertzuweise)

String name = ”Sebastian Maier”;

Arithmetische Operatoren Vergleichsoperatoren

Ermitteln Sie den Wahrheitswert der angeführten Booleschen Ausdrücke.

(1) ((8 - 2) < 6) && (7 != 3)

(2) (8 > 2) || (7 <= 3)

(3) (8 == 8) && (16 % 2 == 3)

(4) (8 != 4) || (-1 < 2 && 7 > 3)

Iterative Berechnung der Fakultät

Rekursive Berechnung der Fakultät

Fakultät mit n=5

Rekursive Methodenaufrufe und Rückwärts-Einsetzen

Bei einer einfachen Liste werden die Elemente unsortiert aneinandergehängt.

Beispiel Array vs. Liste:

EDCETH – Lineare Datentypen. Die Liste Abgerufen am: 15.02.2019.

4. Alle Listenelemente sind vom Listenanker aus durch Nachfolgerbildung in endlich

Operationen mit Listen

EDCETH – Lineare Datentypen. Die Liste Abgerufen am: 15.02.2019.

Grafische Darstellung des gerichteten Graphen G = (V,E) mit V = {1,2,3,4},

Meist werden true und false durch 1 und 0 dargestellt.

Datenstruktur eines binären Suchbaums

Algorithmus Suche für einen binären Suchbaum

π(1) = 3; π(2) = 2; π(3) = 4; π(4) = 1;

Sortieren durch Auswahl

Gegeben sei ein Feld mit sieben Schlüsseln:

Sortieren durch Auswahl

Sortieren durch Einfügen

bereits sortiertes Anfangsstück

Sortieren durch Einfügen

Nach dem 1. Durchlauf werden folgende Vertauschungen durchgefüht:

Um eine Folge F = k1,...,kN von N Schlüsseln nach aufsteigenden Werten zu sortieren,

Das Pivotelement ist 6.

Divide: Teile F in zwei etwa gleich große Teilfolgen, F1 und F2;

procedure mergesort (var a : sequence; l, r : integer);

Zunächst wird F aufgeteilt in die beiden Teilfolgen F1 = 2, 1, 3, 9, 5 und

Dann werden beide Teilfolgen mittels Mergesort sortiert.

Diese beiden Folgen werden zur Folge F = 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 verschmolzen.

Charakteristika von Datenbanken

Eine Datenbank hat die langfristige

Die Sicherheit vor Verlusten ist eine