Sie sind auf Seite 1von 27

Grundlagen der Datenbanken

Dr. Dr. Sergej Sizov

WeST Institute for Web Science and Technologies


1

Data Engineering
Modellierung Prozesse

Algorithmen

Data Engineering & Management

Statistik

Logik

Systembau

Kosten / Wert

Google
Google kauft YouTube fr 1.6 Mrd $ (2006) fr Software (?), die Google selbst hat

100

Daten

10

Software

Bekannte Suchalgorithmen + Data Management 100,000 Rechner a 500 Euro

Hardware

Wo bentigt man Methoden des Data Engineering?


Desktop Einloggen (single sign-on) Textverarbeitung Filesystem Addressen Handy, Smartcards, Auto Nein, aber oft schmerzlich vermisst! Neuere Entwickungen: Eingebettete Datenbanken (z.B. fr Smartcards) Banken Telekom Besser wre die Frage: Wo bentigt man keine Methoden des Data Engineering?!

Wertvolle Daten
Addressdaten Personaldaten Kundendaten (einer Bank) Umfragedaten Warenbestandsdaten Transaktionsdaten (Telefonanrufe, Einkufe,) Konstruktionsdaten (Auto, Motor, Kugellager,) Geoinformationsdaten (Straen, Leitungen, Flsse, Immissionen,) .

Daten Information Wissen


Wissen: Vorlesung Grundlagen der Datenbanken am 19. Oktober 2011, 14.15 Uhr in E-011 Informationen: 19. Oktober 2011, 14.15 Uhr, . Daten: 201110191415, Kein Wissen ohne Daten bergang vom Daten- zum Wissensmanagement ist nahtlos
7

Berhmte Systeme
Datenbanksysteme: Oracle DB, IBM DB2, Mysql, Postgres, Microsoft SQL Server, Microsoft Access, etc. Suchsysteme: Google, Yahoo Berhmte/interessante Anwendungen: SAP R3 Ihr Bankkonto Ihre Haftpflichtversicherung The GDB Human Genome Database wer-kennt-wen Flickr, YouTube Amazon
8

Kernfragen
Wie verwaltet man Daten? Intuitiv? Konsistent? Effizient? Sicher? Nebenlufig? Data & Knowledge Engineering

Ziele der Vorlesung


Analytisches Verstndnis des Data Engineering Kenntnisse verschiedener Datenbankparadigmen Erweiterte Kenntnisse der Standard-Datenbankanfragesprache SQL Didaktische Methoden Vorlesung (v.a. sinnvoll durch mitdenken und fragen!) Papierbung: analytisches Verstndnis Praxisbung: Umgang mit praktischen Problemen Arbeit in Teams bernahme von Verantwortung fr die Arbeit anderer

10

Aufgaben
Theoretische Aufgaben Orientiert am Vorlesungsstoff Praktische Aufgaben Erstellen und Benutzen einer DB Umgang mit einfachen, aber realistischen und (relativ) groen Datenmengen Integration von DBs und Anwendungen

11

Folgendes Buch liegt der Vorlesung zugrunde: Alfons Kemper und Andre Eickler Oldenbourg Verlag, Mnchen, 2006 6. aktualisierte und erweiterte Auflage

12

Zulassung zur Klausur


Erfolgreiche Abnahme aller praktischen bungsaufgaben, um zur Klausur zugelassen zu werden. Teilnahme an der ersten Klausur und der zweiten Klausur ist zwingend. Das gilt auch fr Klausurzulassungen aus vergangenen Semestern! Teilnahme an der Nachklausur nur mglich bei Teilnahme sowohl an der ersten als auch an der zweiten Klausur. Endnote = 40% aus der ersten Klausur + 60% aus der zweiten Klausur ODER 100% aus der Nachklausur (siehe Regelung Nachklausur oben!)
13

BUNGSBETRIEB

14

Handhabung der Daten (historisch)


Postrelationale Datenmodelle Schwerpunkt der Vorlesung Relationale Datenmodelle Satzorientierte Datenmodelle (Codasyl) Dateisysteme Bnder 90er 80er 70er 60er 50er
15

Motivation fr den Einsatz eines Datenbank-Verwaltungssystems


Typische Probleme: Redundanz und Inkonsistenz (Frau Meier wird Frau MeierRoss)

Beschrnkte Zugriffsmglichkeiten (alle 100 Eigenschaften von Frau Meier lesen, um ihre Telefonnummer zu sehen?) Probleme beim Mehrbenutzerbetrieb (zwei berweisungen gleichzeitig?) Sicherheitsprobleme (jeder Mitarbeiter darf jedes Gehalt sehen?) hohe Entwicklungskosten fr Anwendungsprogramme (k * 100 PersJahre) ......... ?
16

Datenbank vs DBMS
Anwendung

DBMS (DB ManagementSystem)


Ordner A

Datenbank

Ordner B

File 1

File 2

17

Gegenstand der Vorlesung

Wie kann ich DBMS einsetzen? Data Engineering


Ordner A

Ordner B

File 1

File 2

18

Gegenstand der Vorlesung (zum kleineren Teil)


Ordner A

Ordner B

File 1

File 2

Ordner A

Ordner A

Ordner B

File 1

File 2

Ordner B

File 1

File 2

19

Die Abstraktionsebenen des Datenbankentwurfs

Konzeptuelle Ebene

Wie sieht die Welt aus ? Welche Strukturen werden von der Anwendung manipuliert? Wie wird gespeichert ?
20

Logische Ebene

Physische Ebene

Die Abstraktionsebenen des Datenbankentwurfs

Konzeptuelle Ebene

Studenten sind Personen mit Matrikel-Nr 1 Tabelle fr Uni-Angehrige und 1 Tabelle fr Studenten, mit Verbindungen Element mit Matrikel-Nr 1234567 wird abgelegt auf Block 19
21

Logische Ebene

Physische Ebene

Datenmodellierung
Ausschnitt der realen Welt Intellektuelle Modellierung Konzeptuelles Schema (ER-Modell)

Semi-automatische Transformation Netzwerk Schema


22

Relationales Schema

Objektorientiertes Schema

Die Abstraktionsebenen eines DBMS


Sicht 1 (Verwaltung)

...

Sicht k (Bibliothek)

Logische Ebene

Datenunabhngigkeit: physische Unabhngigkeit logische Datenunabhngigkeit

Physische Ebene

23

Modellierung einer Beispielanwendung


reale Welt: Hochschule
Studenten, Vorlesungen, Professoren...

Konzeptuelle Modellierung
MatrNr

Studenten
Name
Semester

Professoren
lesen VorlNr

PersNr Name

hren

Vorlesungen

Titel SWS
24

Logische Datenmodelle
Netzwerkmodell Hierarchisches Datenmodell Relationales Datenmodell Objektorientiertes Datenmodell Deduktives Datenmodell

25

Das relationale Datenmodell


Studenten MatrNr Name 26120 Fichte 25403 Jonas ... ... hren MatrNr VorlNr 25403 5022 26120 5001 ... ...

Vorlesungen Nr Titel 5001 Grundzge 5022 Glaube und Wissen ... ...

Select Name From Studenten, hren, Vorlesungen Where Studenten.MatrNr = hren.MatrNr and hren.VorlNr = Vorlesungen.Nr and Vorlesungen.Titel = `Grundzge; update set where Vorlesungen Titel = `Grundzge der Logik Nr = 5001;

26

DB-Anfragen: Flexibilitt
Eine Bedingung spezifiziert die entsprechende Teilmenge der Treffer (Tupeln, Dokumente, ) in der Datenbank. Boolsche Operationen (AND; OR; NOT) werden verwendet, um Bedingungen / Treffermengen zu kombinieren. Wieviele unterschiedliche Teilmengen der Datensammlung lassen sich mit 3 unterschiedlichen Bedingungen spezifizieren? a) 7 b) 8 c) 16 d) 256
Kombinationsmglichkeiten fr 8 Teilmengen:

1 4

2 5 7 6

3 8

(0 0 0 0 0 0 0 0) bis (1 1 1 1 1 1 1 1)

28 = 256
27