Sie sind auf Seite 1von 197

Vorlesung 1

Eintscheidungsinformatik

Conf. univ.dr. Boldeanu Dana


Contact: boldeanud@cig.ase.ro
Dana-Maria
Boldeanu
• Ao. Prof. an der Wirtschaftsuniversität Bukarest (seit 2001) -
MIS-Abteilung
• Exekutivdirektor des „Center for Advanced Studies on
Electronic“ (seit 2009)
• Ao. Prof. an der rumänisch-französischen INDE Professional
MBA (seit 2016)
Ausbildung
• ASE, Fakultät für Buchhaltungs- und
Managementinformationssysteme (Bachelor- und
Masterstudiengänge)
• ASE, Fakultät für internationale Wirtschaftswissenschaften,
Masterstudiengang „Forschung und Lehrerbildung für
Wirtschaftswissenschaften“
• Buchhaltungs- und Managementinformationssysteme
Promotionsstipendium (ITEC Toulouse)

Forschung: Universitätsmanagement, Anti-Aging, Audit, E-Services,


Informationstechnologie-Infrastruktur
Vorlesungsziele: Erlernen der
Grundbegriffe

❖ Computer-Unterstützung Entscheidung

❖ aufstrebende Technologien für Business


Intelligence Analytics und Data
Warehousing

❖ effektiven Einsatz dieser Systeme


VORLESUNGINHALTE
1. Entscheidungsunterstützungssysteme in
Organisationen – Decission support systems
2. Analytische Unterstützung für die
Entscheidungsfindung
3. Datawarehouse - Grundbegriffe, Design und
Entwicklung
4. Die Analyse der Daten von OLAP
5. Data mining
6. Big data
Seminar Anwendungen
• Erwenden von MS Excel-Optionen zur Sensitivitätsanalyse
(Szenarien, Zielwertsuche (Goal Seek), Data Table und
Grafiken für Trensanalyse), Optimierung und Prognose
• Möglichkeiten der Datenaggregation und Strukturierung mit
Datenanalyse - OLAP (MS Excel)
• Power BI - business analytics service – als Visualisierung BI
Tools
• KPI Dashboards – MS Excel und Power BI
Auswertung
Inhalt Prozent der Gesamtnote

Seminar 50%
• 10% - Anwesenheit und Seminararbeit
• 10% - Aufgabe Präsentation 2021 IT-
Trends
• 30% - Test – MS Excel+Power BI

Vorlesung 50%
(mündliche Online-Prüfung)
Die Struktur der Vorlesungen und Seminare

• Im Lehrplan (Syllabus) definiert (e-learning Plattform online.ase.ro)

• 7 Vorlesungen und 14 Seminare - alle unterstützenden Materialien


werden auf die e-Learning-Plattform hochgeladen

8
Aufgabe Präsentation 2021 IT-Trends

Top Ten der IT-Trends 2021


• Internet der Verhaltensweisen
• Datenschutzverbessernde
Berechnung
• Verteilte Cloud
• Cybersicherheitsnetz
• KI-Technik
• Intelligentes zusammensetzbares
Geschäft
• Hyperautomation
• usw.

Termin: den 7. December 2020 am Seminar


Literaturhinweise - https://www.gartner.com/smarterwithgartner/gartner-top-strategic-technology-trends-for-2021/
Software für Seminare

• Melden Sie sich mit dem


Studentenkonto usernameIDM +
”@ stud.ase.ro” an.

https://www.office.com

• Herunterladen Sie Office 365 ->


MS Excel

Power BI Desktop

https://www.microsoft.com/en-us/download/details.aspx?id=58494
Die intelligent Wissen wird die Fähigkeit, im Interesse
des Unternehmens kurz / mittel / lang wirken
verstärken können:

❑Referral Probleme / Gelegenheit


❑Design-Aktionspläne, um die Probleme zu beheben
oder die Möglichkeiten
❑Auswertung der Aktionspläne - Kosten/Nutzen/Dauer
❑Die Auswahl des besten / versprechende Aktionsplan
❑Die Planung für die Umsetzung
Warum brauchen wir Business Intelligence (BI)? - 1

Kunde: “Wozu brauche ich BI? Mein Shop-Umsatz wächst doch jedes Jahr um
20%!”
BI Firmen: “Nun, mit BI hätten Sie womöglich noch bessere Entscheidungen
getroffen und der Shop wäre jedes Jahr um 42% gewachsen!”

• Der Kampf um Kunden, Umsatz und Anteile wird online härter und härter:
Immer mehr Anbieter (z. B. klassische Filialisten oder Shopping-Clubs) mit
immer größeren Werbebudgets drängen auf den Markt und verschärfen den
Wettbewerb.

• Die Folge: Der Druck, auf allen Ebenen zu optimieren, steigt in immer
höherer Geschwindigkeit.

• An dieser Stelle kommt Business Intelligence ins Spiel: Ihr unschätzbarer


Wert liegt darin, dass sie jeden noch so kleinen Geschäftsprozess messbar
macht und, kombiniert mit anderen Messungen, in aggregierter Form als
tragfähige Entscheidungsgrundlage für operative Einheiten wie z. B.
Marketing und Einkauf dienen kann.
BI ermöglicht ganzheitliche Analysen zur nachhaltigen
Strategieentwicklung Ihres Unternehmens.

• Mit Hilfe von BI zusätzlich nach weiteren Kennzahlen


und betrachten den Kunden somit als langfristige
Investition.

• Abhängig von ihrem (v. a. zukünftigen) Kaufpotential


werden die Kunden, unterteilt in Gruppen, nun mit
unterschiedlichen strategischen Maßnahmen bezüglich
Kommunikation und Marketing bedacht, was insgesamt
zu einem deutlich höheren return on investments (ROI)
führt.
Warum brauchen wir Business Intelligence (BI)? - 2

• Die Hauptproblematik bei der Umsetzung einer zukunftsweisenden,


strategieorientierten Analyse Ihrer Geschäftsprozesse liegt in der immensen
Masse von Daten, die es zu integrieren gilt. Denn: Nur eine ganzheitliche
Betrachtung ist eine zielführende Betrachtung!

• Jeder einzelne Bereich Ihres Unternehmens hat eigene IT-Tools, mit denen
das operative Geschäft abgewickelt wird. Es entstehen große, separate
Datenlager, in denen riesige, doch meist unerschlossene Potentiale
schlummern.

• Die Herausforderung besteht nun darin, die relevanten Daten aus heterogenen
Quellen sinnvoll miteinander zu verknüpfen – für bessere, fundierte
Entscheidungen. Manuell kann das nur bedingt geleistet werden.
Warum brauchen wir Business Intelligence (BI)? - 2

• Mit den unterschiedlichen BI-Systemen, die der Markt zu bieten hat, können
Sie diese Herausforderung sowohl technisch als auch inhaltlich meistern.
Zunächst wird mit der BI-Lösung ein großes, integriertes Datenlager (Data
Warehouse) aufgebaut, in das (mehrmals täglich) die relevanten Daten aus den
verschiedenen Quellen automatisch eingespeist werden.

• Auf Basis dieser aggregierten Datengrundlage lassen sich dann die ganzheitlich
generierten Kennzahlen ermitteln – ohne manuellen Aufwand, aber dafür mit
Funktionen wie z. B. einfach zu setzenden Abweichungsalarmen, der
Möglichkeit, durch detaillierte Analyse wichtige Zusammenhänge unmittelbar
zu erkennen sowie vor allem der automatischen Generierung von intelligenten
Kennzahlen und damit einhergehenden konkreten Handlungsempfehlungen.

• Auf diese Weise schaffen BI-Lösungen strukturelle und strategische


Klarheit durch Transparenz sowie das Aufzeigen bisher unbeachteter
Zusammenhänge zwischen den operativen Einheiten Ihres Unternehmens.
Business Intelligence
• Die Fähigkeit, vorhandene Daten in nützliche
Informationen, die wir bieten eine reichhaltige
Einblicke in Unternehmen heute zu
transformieren und eine Vorstellung von seiner
Zukunft.

• Allgemeines Konzept, das die Werkzeuge der


Business-und Informatik, verwendet werden,
um Daten in Informationen, Informationen in
Entscheidungen und Beschlüsse bei Klagen
verwandeln zusammen bringt.
Was ist BI wirklich?
Business Intelligence ist nicht...

• ...das generieren von bunten Grafiken für die Anlage


• ...punktuelles Auswerten ohne Kenntnis der Basisdaten
• ...das bloße Kaufen von Software
• ...den Kilopreis eines Hamburgers mit dem eines Dacia
Logans zu vergleichen
Business Intelligence
• Business Intelligence bezeichnet die Sammlung,
Auswertung und Darstellung aller in einem Unternehmen
vorhandenen Geschäftsdaten.
• In der Praxis versteht man in den meisten Fällen unter BI
die Automatisierung des Berichtswesens (Reporting).
• Eine wichtige Grundlage sind die Daten aus der
Finanzbuchhaltung. Rein monetäre Betrachtungen sind im
kommunalen Bereich aber nicht ausreichend, da
Kommunalverwaltungen leistungsorientiert und nicht
gewinnorientiert arbeiten.

• Man benötigt also ein kommunalspezifisches BI-


System!
Business Intelligence
Bereitstellung von Informationen
• Unterschiedliche Informationsbedürfnisse
abzudecken.Jeder soll genau die Informationen bekommen,
die er/sie braucht, um seiner Verantwortung und
Verantwortlichkeit entsprechend steuern zu können
Zuverlässige Datenbasis
• Bessere und konsistentere Datenqualität (Vertrauen in
Daten)
Daten beherrschbarmachen und Fakten schaffen
• Zu viele Daten bedeuten fast immer keine Information
• Aus Daten Informationen gewinnen –für bessere
Transparenz um schnell, rechtzeitig und aktiv reagieren zu
können
Business Intelligence
Das Ziel dabei:
• Der Verwaltungsführung und der Politik sollen
Informationen bereit gestellt werden, die wichtige
Entscheidungen erleichtern
• Zielorientiertsteuern (Kennzahlen, Scorecards..)
Es sollen die richtigenInformationenzum richtigen
Zeitpunkt in der richtigen Form als
Entscheidungsgrundlage zur Verfügung stehen.
Vorteile BI
• Vorteil 1: Business Intelligence-Systeme - Darstellung
der Auswertung
- Nicht jede Unternehmenssoftware ist in der Lage, Daten
entscheidungsorientiert zu präsentieren. Ein Business
Intelligence-System verdichtet komplexe Informationen aus
unterschiedlichen
• Vorteil 2: Business Intelligence-Systeme – mit
Kennzahlen geschäftliche Entscheidungen unterstützen
- Im betrieblichen Alltag gibt es viele Situationen, die
schnelle Entscheidungen erfordern.
- Ein Business Intelligence-System umfasst unzählige Daten,
aus denen man mit wenigen Handgriffen relevante
Informationen herausfiltern kann – ohne Unterstützung der
IT-Abteilung oder externer Dienstleister.
Vorteile BI
• Vorteil 3: Business Intelligence-Systeme -
Automatisierung der Berichte
Auch im Controlling belasten Routinetätigkeiten die
Mitarbeiter.
Mithilfe eines Business Intelligence-Systems lassen sich
Standardprozesse – zum Beispiel bei periodischen Berichten
– weitgehend automatisieren.
• Vorteil 4: Business Intelligence-Systeme –
Reduziert Reportingkosten
So wichtig Controlling auch ist: Es sollte kein Selbstzweck
sein. Wie in anderen Unternehmensbereichen stellt sich auch
hier die Frage nach der Wirtschaftlichkeit. Die meisten
Kosten werden durch einen hohen manuellen Aufwand oder
starre Berichtsstrukturen verursacht.
Vorteile BI
• Vorteil 5: Business Intelligence-Systeme - Umsatz- und
Gewinnchancen erkennen
Business Intelligence-Systeme schafft Freiräume für Markt-,
Kunden- oder Risikoanalysen. Die breitere Informationsbasis
erlaubt es, Marktchancen zu erkennen, Kunden gezielter zu
bedienen oder vermeidbare Risiken zu umgehen. Aspekte, die
sich allesamt positiv auf die Umsatz- und Gewinnentwicklung
auswirken.
• Vorteil 6: Business Intelligence-Systeme - flexibel
anpassbar
Sie lassen sich problemlos an unterschiedliche
Anforderungen anpassen, um beispielsweise die
Informationsbedürfnisse und Berechtigungen verschiedener
Abteilungen abzudecken.
Vorteile BI
• Vorteil 7: Business Intelligence-Systeme - Einfach zu
handhaben
Business Intelligence-Systeme sind speziell auf die Analyse
komplexer Datenbestände ausgerichtet. Zahlen lassen sich
bequem verfolgen, neue Auswertungen mühelos aufbauen.
Das fördert die Controlling-Kultur im Unternehmen und
vermeidet „Bauchentscheidungen“.
• Vorteil 8: Business Intelligence- Systeme - Einfache
Bedienung
Um sich in das Berichtswesen eines ERP-
Systems einzuarbeiten, sind oft mehrtägige Schulungen
erforderlich. Dank klarer Strukturen und effizienter Prozesse
sinkt der Aufwand bei einem Business Intelligence-System
auf wenige Stunden.
• Unter den Business-Intelligence-Technologien
gruppiert unterstützt die Unternehmen, die
Informations Wertigkeiten von Daten im Laufe der
Zeit in ihre EDV-Systeme angesammelt entwickelt
haben.
• Moderne Technologien der Speicherung und
Verarbeitung orientiert intelligente Ausschöpfung
dieses Potenzials sind in drei Hauptrichtungen
verhängt:
➢Data Warehouse
➢OLAP
➢Data mining
Informationssystem - Perspektiven und Dimensionen
Informationssystem (IS)
• Was ist ein Informationssystem (IS)?
– Der Satz von Komponenten, die Verarbeitung und
Verbreitung der Informationen die Speicherung und
Wissen, um den Prozess der Entscheidungsfindung
innerhalb der Organisation zu unterstützen.

• Stellt die Grundlage der Prozesse und Geschäftsmodelle

Input Verarbeitung Output

27
Informationssystem - ein Ansatz in
Bezug auf Business
• Eine Lösung auf Basis von Organisations-
und Führungsinformationstechnologien,
um umweltpolitische Herausforderung
• Ein Tool, das Wert für die Organisation
schafft
• Organisations-und Führungs Dimension
Größe

12/3/2020
Informationssystem - Organisationsgröße
• MENSCHEN
– Manager, Wissensarbeiter, für die Arbeitnehmer,
Produktion / Service-Mitarbeiter, Experten
• STRUKTUR
– Funktionen, Hierarchie-Management
• GESCHÄFTSPROZESSE
– Ähnliche Aktivitäten, um eine objektive, formellen
und informellen Regeln zu erreichen
• KULTUR
– Set von den meisten Mitgliedern der Organisation
akzeptiert Werte
12/3/2020
Informationssystem - Größenverwaltung

• Manager bestimmen Strategien /


Maßnahmen, um die Herausforderungen der
Organisations / Geschäftsmöglichkeiten
treffen
• Manager müssen handeln
– kreativ
– verantwortlich

12/3/2020
Informationssystem –
technologische Dimension

• HARDWARE und SOFTWARE


• Datenbankverwaltungs Technologien
• Communications-Technologien

• IT-Infrastruktur

12/3/2020
Informationssystem (IS) -
technologische Ansatz
• Eine strukturierte Gruppe von Ressourcen:
Hardware, Software, Personen, Daten,
Verfahren für die
– Sammlung
– Speicherung
– Verarbeitung und
– Verbreitung von Informationen innerhalb der
Organisation
12/3/2020
IS Komponenten

Organisations Komponenten:
• Informationen
• Geschäftsprozesse
Technische Komponenten:
• Verfahren
• Hardware
• Software
12/3/2020
Daten / Informationen / Wissen
• DATEN
– Einfache quantitative Beobachtungen
• INFORMATIONEN
– Daten begleitet von signifikanten (für einen
bestimmten Benutzer in einem gegebenen
Kontext)
• WISSEN
– Bedeutung der komplexen Beziehungen
zwischen den Informationen in einem
12/3/2020
bestimmten Kontext etabliert
Daten / Information / Wissen
Unabhängig INTELLIGENZ
von Kontext
WISSEN das Verständnis
der Prinzipien

INFORMATION das Verständnis den


Modellen

Verstehen Beziehungen

DATEN Verständnis
legere

12/3/2020
IS Typologie
• Transaction Processing Systems (TPS)
• Management Information Systems (MIS)
• Decision Support Systems (DSS)
• Executive Support Systems (ESS)

Executive Support
Systems (ESS)

Management
Decision Support
Information
Systems (DSS)
Systems (MIS)

Transaction
Processing
Systems (TPS)

36
Transaction Processing Systems
(TPS)

• Input: Transaktionen und Ereignisse


• Verarbeitung: Sortieren, Auflistung,
Aktualisierung
• Output: Ausführliche Berichte, Listen
• Users: Operational personnel

37
Management Information
Systems (MIS)

• Input: Zusammenfassung von Transaktionsdaten,


High-Volume-Daten
• Verarbeitung: Einfache Modelle, Low-Level-
Analysen
• Output: Summary reports
• Users: Middle managers

38
Decision Support Systems (DSS)
Entscheidungsunterstützungssysteme

• Input: Optimiert Datenbanken für statistische


Analysen
• Verarbeitung: Simulationen und Analysen
Statistiken
• Output: Antworten auf Fragen, die Ergebnisse der
statistischen Tests
• Benutzer: Mittlere Führungskräfte
39
Executive Support Systems (ESS)

• Input: Aggregierten Daten von innerhalb und


außerhalb der Organisation
• Verarbeitung : Interaktive und grafische
Simulationen
• Output: Forecasts
• Users: Senior managers

40
Grundlagen
Entscheidungsunterstützungssysteme (EUS)
Entscheidungsprozess
Intelligence-Phase
• Scan der Umwelt
• Analyse der Ziele
• Sammlung von Daten
• Problemidentifikation und Kategorisierung
des Problems
• Verantwortlichkeiten bzgl. der
Problemlösung
Entscheidungsprozess Design-
Phase
• Entwicklung von alternativen
Handlungsoptionen
• Analyse potenzieller Lösungen
• Modellgestaltung
• Machbarkeitstest
• Ergebnisvalidierung
• Selektion des Auswahlprinzips
Entscheidungsprozess Choice-
Phase
• Festlegung der Verfahrensweise
– Analyseverfahren
– Algorithmen
– Heuristiken
• Test die Modells
Entscheidungsprozess
Implementation-Phase
• Umsetzung der Lösung
– Umgang mit Widerständen
– Unterstützung durch das höhere
Management
– User Training
Eigenschaften eines EUS

• Entscheidungsunterstützungssysteme
zeichnen sich durch die folgenden
Eigenschaften aus:
– flexibel
– adaptiv
– interaktiv
– GUI-basiert
– iterativ
– Modelleinsatz
Eigenschaften und Leistungsvermögen von EUS
Bibliographie

• Entscheidungsunterstützungssysteme Organisatorisches -
Prof. Dr. Peter Chamoni, Mercator School of
Management, 2012 (Source: http://www.msm.uni-
due.de/index.php?id=3337&no_cache=1)
• Management Information Systems – Managing the
digital firm, K.C. Laudon, J.P. Laudon, Twelfth Edition,
Pearson Education, 2012
• Business intelligence - Jonathan McCarthy, 2011,
Source: afis.ucc.ie/fcarton/IS%206214/10-
11/UCC%20BI%20Slides.ppt
• Decision support systems and Business intelligence
systems, Turban, Efraim, Aronson Jay, Ed. Pearson
Education, 2007
• Management Information systems & Decision support
systems – F. Albescu, I.Pugna – ed. DualTech, 2003
Entscheidungsunterstützungssystemen
basierend auf Modellen

Vorlesung 2
Vorlesung Inhalt:

• Management-Subsystem-Modelle
• Modellierung
• Modelle und Methoden
• Optimierung des Algorithmus - der mathematischen
Programmierung
• Lösen linearer Programmierung Problem mit Microsoft
EXCEL (Solver)
• Beispiele
Management-Subsystem-Modelle
Modelle (Modelle Bibliothek)
• gesetzt quantitativer Modelle (statistische,
finanziell, Prognose), sortiert nachverschiedenen
Kriterien (Organisationsebene für die sie bestimmt
sind, Feld, etc.)
• Es gibt dem System die Fähigkeit zu
analysieren und Probleme zu lösen.

SGM (Model Manager)


• schaffen neue Modelle (LP, vorgefertigte
Module / Unterprogramme, etc.)
• Aktualisierung der bestehenden Modelle
• Korrelationsmuster
Wörterbuch der Modelle - ein Katalog von
Modellen, deren Definitionen, Umfang oder
andere Informationen über ihre Verwendung
enthalten.

Prozessor-Ausführung und Integrationsmuster


• Gebrauchsanweisung nach Modell und Auslegung
SGM weitergeleitet
• Operationen, die mehrere Modelle
• Integration der Entscheidungsunterstützung in
anderen Anwendungen.
Die erste Generation von
Entscheidungsunterstützungssystemen

Sie werden verwendet, um die


Entscheidungsfindung in Situationen, die
einen gewissen Grad an Reproduzierbarkeit
und es erfordern, zu unterstützen, oder es
kann an die spezifischen Methoden zu lösen.
• nimmt Aufgaben gut etabliert
• Eingreifen des Menschen eine wichtige
Rolle
• Modellauswahl
• Wahl der Auswahlkriterien
Modellierung
Ist ein wesentliches Element in den meisten
Entscheidungsunterstützungssysteme, und im Fall der
modellbasierten absolut notwendig.
Es bedeutet:
• Konzeptualisierung von einem Problem (allgemein als
Folge der Phaseninformation im Entscheidungsprozess
definiert)
• ihre abstrakten Ausdrücke quantitativ und / oder
qualitativ.
Es gibt zahlreiche Klassen von spezialisierten Modelle und
Methoden, sie zu lösen (operative Forschung, Finanzen,
Betriebswirtschaft)
Problem zu modellieren Problem loesung Problemlösung
lösen model

Numerische Simulationen

Anpassung und Interpretation


Anwendungsmodellierung in Organisationen

Domains:
• Produktion
• Verteilung
• Buchhaltung
• Personalstelle/Personalverwaltung
Techniken:
• Entscheidungstheorie
• Unternehmensforschung
Modelle und Methoden

Ein Modell kann als eine vereinfachte Darstellung (eine


Abstraktion) der Wirklichkeit definiert werden.
Diese Vereinfachung ist erforderlich aufgrund der Tatsache, dass
• Realität ist zu komplex, um genau beschrieben werden,
• einige Aspekte der es irrelevant für die Lösung eines bestimmten
Problems.
Die vereinfachte Darstellung der Realität in einem Muster mit
einer größeren oder geringeren Grad der Abstraktion erreicht
werden.
Modelle und Methoden

Je nach dem Grad der Abstraktion, können Modelle in


die folgenden Kategorien eingeteilt werden:
• Iconic-Modellen - ähnlich wie Darstellungen der
Wirklichkeit, in verschiedenen Maßstäben (Fotos)
• Analog-Modelle - höheren Grad der Abstraktion, die
symbolischen Darstellungen der Wirklichkeit (Chart,
Entwicklung, usw.)
• Quantitative Modelle (Mathematik) - der Komplex
mit der höchsten Ebene der Abstraktion und die
Verwendung von DSS
Struktur eines quantitativen Modells
Jedes Modell verfügt über drei Grundkomponenten:
✓ Entscheidungsvariablen - mögliche
Handlungsalternativen zu beschreiben. Die Höhe dieser
Variablen wird durch den Entscheidungsträger bestimmt
✓ Parameter - Variablen, die das Ergebnis beeinflussen
kann aber nicht von den Entscheidungsträger gesteuert
werden.
Im allgemeinen werden diese Variablen sind
Einschränkungen des Problems, was seine mögliche
Lösungen.
✓ Ergebnis Variablen- sind abhängige Variablen, so dass
keine besonderen Aktionen und Parameter
(unkontrollierbare Variablen)-Modell.
Diese Komponenten sind durch mathematische
Beziehungen verbunden (wobei quantitative Modelle).
Beispiele

Domain Entscheidungsvariablen Variable Ergebnisse Unkontrollierbare


Variablen und
Parameter
Finanzanlagen Alternative Investments und ihre Erwartete Ertrags, Risiko, Inflation
Ebene erwartete Rendite Wettbewerb
Dauer der Investition Liquidität Zinssatz
Zeitmessung zu investieren
Marketing Budget für die Werbung Marktanteil Verbraucher Einkommen
Kundenzufriedenheit
Rechtzeitig Wettbewerbspolitik
Buchhaltung Verwendung von Computer Die Kosten der Informatik Systemen
Audit-Programm
Datenverarbeitungs Rechtliche Bestimmungen
Der Fehler
Produktion Die Menge des Produkts Gesamtkosten, Qualität Die Produktionskapazität,
Versorgungsebene Mitarbeiterzufriedenheit Technologie, Warenpreis
KLASSE VON ZIELE LÖSUNGSMETHODE
MODELLEN BESONDERE
Optimierungsprobleme in der Das Finden der besten Entscheidungstabellen
Zwischenzeit einige (optimale) Lösung für ein paar
Decision Trees
Alternativen alternative
Der Optimierungsalgorithmus Finden der optimalen Lösung Lineare Programmierung
durch ein für eine sehr große oder
(Simplex-Algorithmus)
unendliche Anzahl von
Alternativen durch iterative
Optimierungs
Optimierung einer Finden der besten Lösung in Modelle auf Lager
Formulierung mit einem einzigen Schritt durch
(Basierend auf Formel)
die Verwendung einer
Simulation Das Finden einer optimalen Arten der Simulation
Lösung oder zufriedenstellend
(Monte Carlo Metode)
durch das Experimentieren
verschiedene mögliche
Alternativen
Heuristiken (die einzige Die Suche nach einer Heuristische
quantitative DSS) zufriedenstellenden Lösung
Programmierung
unter Verwendung von Regeln
Expertensysteme
Andere Modelle Behebt ein Problem, wie Finanzmodellieren
"what if" mit einer Formel
Vorhersagemodelle Prognose der Zukunft für ein Vorhersagemodelle
bestimmtes Szenario
Markov-Analyse
Die am häufigsten verwendeten Arten von
Modellen in den Prozess der
Entscheidungsfindung in der Wirtschaft

• Optimierungsprobleme in der Zwischenzeit


einige Alternativen

• Optimierung des Algorithmus - die


mathematische Programmierung (zB. Simplex)

• Simulation

• Prognosen
Optimierungsprobleme in der Zwischenzeit einige
Alternativen

• Entscheidungstabellen (für uni-und Multi-Kriterien-


Probleme)

• Entscheidungsbäume (Decision Tree)

• jede Alternative ist beigefügt Schätzungen der Teilnahme


an der Erreichung des Ziels (und die Wahrscheinlichkeit, sie
zu erreichen)

• Werte und Wahrscheinlichkeiten werden in einer Tabelle


oder ein Diagramm aufgeführt.

Die Entscheidung ist, die beste Alternative aus einer


endlichen Anzahl von möglichen Alternativen zu wählen.
Entscheidungstabellen

Es ist ein systematischer Weg, um die Informationen, die


eine Entscheidungssituation charakterisiert darstellen:

- Naturzustände: der Satz von Bedingungen in der die


Aktion
- Entscheidungskriterien: Ansichten, die sein kann
(und ist) als das Problem
- Varianten (Alternativen) Entscheidung: Modalitäten
der Aktion, aber, dass der Entscheidungsträger kann
beschließen, dass es kein Verschulden seiner
- Folgen der Entscheidung: Auswirkungen von
Variationen komponiert, Kriterien und Zustände der
Natur;
- die Anzahl der Folgen >= Anzahl von Kriterien
Zustände
Varianten
Z1 Z2 …. Zn
V1 * * … *
V2 * * … *

VN * * … *
Entscheidung Problem
Wählen Sie die beste Alternative zu wissen:
• Die Umsätze werden deutlich ansteigen ->
P = 60%
• Die Umsätze werden weniger ansteigen ->
P = 40%
• Wenn es um höhere Umsatzvolumen wir stellen die
Frage nach dem neuen Speichervolumen von Waren.
Mögliche Varianten:
V1. mieten ein weiteres Lager (Die Kosten sind 200)
V2. mieten einen Raum komplett (Die Kosten sind 800)
V3. nichts zu tun (Die Kosten sind 0)
Zustand
Varianten Kosten Ergebnis1 Ergebnis2
1. Viel 2. Wenig
V1 4000 1300 200 3800 1100
V2 5000 1800 800 4200 1000
V3 3000 1000 0 3000 1000

Lösung:
V1: 3800*60% + 1100*40% = 2620
V2: 4200*60% + 1000*40% = 2920
V3: 3000*60% + 1000*40% = 2200
Bemerkungen:
a) in Bezug auf die Sicherheit Entscheidung
wird auf der Grundlage des gewichteten
Wert jeder Varianten um einen Faktor von
Bedeutung für den Entscheider genommen
werden.
b) in Bezug auf das Risiko auf dieser Werte
Wahrscheinlichkeiten eingreifen .
c) in Bezug auf Unsicherheit gibt es
mathematischen Regeln.
Entscheidungen unter Sicherheit

Angenommen, die genaue Kenntnis der künftigen


wirtschaftlichen Ereignisse.

Offenbar idealistisch, kann diese Situation für


bestimmte Arten von Aktivitäten auftreten.

Eine solche Entscheidung Regel zielt darauf ab:


• niedrigsten Kosten
• bessere Produktivität
• maximalen Gewinn
Entscheidungen unter Risiko

Der Entscheider hat eine gewisse Kenntnis der objektiven


Entscheidungsumfeld und ist in der Lage, um die
Wahrscheinlichkeit der möglichen Werte unkontrollierbaren
Variablen stellen und die Ergebnisse der einzelnen Strategien
analysiert
Diese Entscheidungen werden auf der Basis der mathematischen
Kriterien Erwartung gemacht.

Da wird die Entscheidung zu einer Reihe von Konsequenzen


führen, ist jede der Folgen mit einer Wahrscheinlichkeit verbunden.

So definierte Wahrscheinlichkeitsverteilung ermöglicht der


Entscheidungsträger, um die Version mit dem besten
Erwartungswert zu wählen.

Anzeige - Das Problem, das im Rahmen der Unsicherheit in der


Gefahr gebracht werden.
Entscheidungen unter Unsicherheit

Erfordert Kenntnisse der historischen Kenntnisse der


wirtschaftlichen Ereignisse, durch die Auswahl der Prognose-
und Entscheidungsfindung.

Normalerweise werden diese Entscheidungen sind in der


Kategorie "Orientierung".

In diesem Fall ist die Wahl von Optionen auf den folgenden
Kriterien:
• Objektiv - die logisches Denken einbeziehen
• Subjektiv - basierend auf der Idee der zukünftigen
Entscheidungsträger.

Subjektive Kriterien wird jedes zukünftiges Ereignis mit einer


Wahrscheinlichkeit
Optimierung des Algorithmus - der
mathematischen Programmierung
Mathematical Programming ist eine Reihe von Methoden und
Werkzeugen, um Management-Probleme, wo die Entscheider
müssen eine begrenzte Menge an Ressourcen, verschiedene
Aktivitäten, um den Wert einer objektiven (messbaren) optimieren
zuordnen zu lösen.
Mathematische Programmierung beinhaltet:
a) Die Zielfunktion - ein messbares Ziel deren Wert maximiert
oder minimiert werden, abhängig von den Werten der
Entscheidungsvariablen in die Formulierung einbezogen.
b) Die Entscheidungsvariablen
c) Die Parameter
d) Die Beziehungen zwischen ihnen
Optimierung durch mathematische
Programmierung
• Mathematische Programmierung

- Eine Reihe von Tools zur Lösung von


Managementproblemen, bei denen der Entscheidungsträger
knappe Ressourcen unter konkurrierenden Aktivitäten
zuweisen muss, um ein messbares Ziel zu optimieren.

• Optimal Lösung: Die bestmögliche Lösung für ein modelliertes


Problem
– Linear programmierung (LP):
Ein mathematisches Modell zur
optimalen Lösung von
Ressourcenzuordnungsproblemen. Alle Beziehungen
sind linear
LP Problem Characteristics
1. Begrenzte Menge an wirtschaftlichen Ressourcen
2. Ressourcen werden bei der Herstellung von
Produkten oder Dienstleistungen verwendet
3. Zwei oder mehr Möglichkeiten (Lösungen,
Programme), die Ressourcen zu nutzen
4. Jede Aktivität (Produkt oder Dienstleistung) erzielt
eine Rendite in Bezug auf das Ziel
5. Die Zuordnung wird normalerweise durch
Einschränkungen eingeschränkt
Linear programmierung Schritte
• 1. Identifizieren Sie …
– Entscheidungsvariblen
– Ziel/Objektive Funktion
– Objektive Funktionskoeffizienten
– Beschränkungen
• Kapazitäten / Anforderungen Zeile

• 2. Stellen Sie das Modell dar


– LINDO: Schreiben Sie mathematische Formulierung
– EXCEL: Eingabe von Daten in bestimmte Zellen in Excel mit
Solver Werkzeug
• 3. Führen Sie das Modell aus und beobachten Sie die Ergebnisse
Lineare Programmierung

Es ist das beliebteste und am häufigsten verwendete


Verfahren.
Diese ist, die min /max eine objektive Funktion eines oder
mehrerer variabler bestimmen
Diese Funktion erfordert:
– eine Reihe von messbaren Wert für die Suche nach der
optimalen - die Entscheidungsvariablen;
– eine Reihe von Beschränkungen für diese Variablen, die
als lineare Beziehungen (Gleichheit oder Ungleichheit
auf bestimmte Werte) dargestellt werden - zum
Beispiel, einer Ressourcenallokation Problem ist, ist
ihre Menge begrenzt.
- Eine Zielfunktion - eine lineare mathematische
Beziehung zwischen Entscheidungsvariablen und
Zweck, deren Wert maximiert werden muss (Höhe
des Gewinns) oder minimiert (die Kosten);

- Die Existenz von Verbindungen zwischen all diesen


Elementen in der linearen
Programmierungsmodell durch mathematische
Beziehungen (Gleichungen), die bestimmte
Koeffizienten beteiligt vertreten.
Entscheidungsvariablen : x1,x2,x3…,xn
F(max)(min) →
f(x1,x2,…xn)=a1*x1+a2*x2+….an*xn
Zwänge/Beschränkungen:
a11*x1+a12*x2+a1n*xn <=b1
a21*x1+a22*x2+a2n*xn >=b2
………
am1*x1+am2*x2+amn*xn <=bm

x1, x2, x3…, xn >=0


b1,b2, b3……bm - Parameters
Lösen linearer Programmierung Problem mit
Microsoft EXCEL (Solver)
Schritte:
1. Definieren Sie das Modell (individuelle)
2. Die Umsetzung in der
Tabellenkalkulationsmodell (im MS Excel
Datei individuelle)
3. Verwenden Sie ein Werkzeug, um
Entscheidung zu unterstützen Solver
(angegeben Simplex-Algorithmus bei der
Lösung von Problemen der linearen
Programmierung implementiert).
Beispiel Entscheidungsproblem

Ob die Produkte P1, P2, P3 mit der folgenden


- Einheit Gewinn: 45/50/30 und
- Nachfrage: 35/20/10
Die Zielfunktion: Gewinnmaximierung
Entscheidungsvariablen:
Die optimale Menge der einzelnen Elemente (x1,
x2, x3), so daß f(x1, x2, x3) = der maximale
Wert
Bemerkung: Herstellung eines Produkts
beinhaltet die fünf Werkstaetten und zwar:
P1 P2 P3 Erhältlich Stunden

W1 3 1 2 150

W2 4 2 5 200

W3 5 6 3 350

W4 2 3 2 220

W5 1 2 4 120
Optimierungsmodell
F (max)(x1,x2,x3) = 45*x1 + 50*x2 + 30*x3
Zwänge:
3*x1 + 1*x2 + 2*x3 <=150
4*x1 + 2*x2 + 5*x3 <=200
5*x1 + 6*x2 + 3*x3 <=350
2*x1 + 3*x2 + 2*x3 <=220
1*x1 + 2*x2 + 4*x3 <=120
x1>=35 x1>=0
x2>=20 x2 >=0
x3>=10 x3 >=0
x1,x2,x3 Є N*
LP Beispiel
The Product-Mix Linear Programming Model
• MBI Corporation
• Entscheidung: Wie viele Computer sollen nächsten Monat gebaut werden?
• Zwei Arten von Großrechner (mainframe computers): CC7 und CC8
• Beschränkungen: Arbeitzeit Grenzen, Rohstoffe Grenzen, Marketing
Untergrenzen

CC7 CC8 Rel Limit


Arbeitzeit (days) 300 500 <= 200,000 /Monat
Rohstoffe ($) 10,000 15,000 <= 8,000,000 /Monat
Menge 1 >= 100
Menge 1 >= 200
Gewinn ($) 8,000 12,000 Max

Objective: Maximalen Gesamtgewinn / Monat


Lineare Programmierung Loesung

• Entscheidungsvariable:
X1: Masseinheit/Stueck von CC-7
X2: Masseinheit/Stueck von CC-8

• Ziel Function:
Maxim Z (Gewinn)
Z=8000*X1+12000*X2

• Beschraenkungen:
300*X1 + 500*X2  200000
10000*X1 + 15000*X2  8000000
X1  100
X2  200
X1 – integer
X2 - integer
Lineare Programmierung Loesung
Bibliographie
• Entscheidungsunterstützungssysteme Organisatorisches - Prof. Dr.
Peter Chamoni, Mercator School of Management, 2012 (Source:
http://www.msm.uni-due.de/index.php?id=3337&no_cache=1)
• Management Information Systems – Managing the digital firm, K.C.
Laudon, J.P. Laudon, Twelfth Edition, Pearson Education, 2012
• Business intelligence - Jonathan McCarthy, 2011, Source:
afis.ucc.ie/fcarton/IS%206214/10-11/UCC%20BI%20Slides.ppt
• Decision support systems and Business intelligence systems, Turban,
Efraim, Aronson Jay, Ed. Pearson Education, 2007
• Management Information systems & Decision support systems – F.
Albescu, I.Pugna – ed. DualTech, 2003
• Albescu, F., Pugna, I. – Note de curs SIAD, CIG, ASE, Bucuresti,
2014
• Klaus Fuchs-Kittowski, Wissens-Ko-Produktion – Verarbeitung,
Verteilung und Entstehung von Informationen in kreativlernenden
Organisationen, 2000 Source:
http://www.wissenschaftsforschung.de/JB00_9-88.pdf
• Source: https://www.tso.de/produkte/business-intelligence
Beispiel Optimierungsmodell

1. Ein Eisverkaeufer produziert jede Stunde bis zu 10 kg Eis der Sorten A bzw. B .

A B
Verkaufspreis 80 eur/kg 65 eur/kg
Kosten 50 eur/kg 40 eur/kg
Energieaufwand 5 kWh/kg 2 kWh/kg
absetzbar 6 kg 9 kg

Es stehen hoechstens 30 kWh stuendlich zur Verfuegung.


Zu maximieren sei die Differenz aus Preis und Kosten
Definieren Sie das Optimierungsmodell und die objektive Funktion um den Gewinn zu
maximieren. (2,5p)

Die vorgeschlagene Lösung:

Übersichtliches Zusammenstellen der Aufgabe

Sorten A B Gesamt
Verkaufspreis 80 eur/kg 65 eur/kg
Kosten 50 eur/kg 40 eur/kg
Energieaufwand 5 kWh/kg 2 kWh/kg 30
absetzbar 6 kg 9 kg

Mathematische Formulierung der Aufgabe


Die Entscheidungsvariablen – x und y sind die stuendlich zu produzierenden Mengen fuer Sorte A
x kg bzw. y kg fuer Sorte B.

Zielfunktion zur Gewinnmaximierung Z(max) -> f(x, y)= 80*x + 65*y – 50*x-40*y = 30*x+25*y

Nebenbedingungen
x+y<=10
5*x+2*y<=30
x<=6
y<=9

Nichtnegativitätsbedingung
x >=0, y>=0
x, y € N*

Graphische Betrachtung
Möchte man die 1. Nebenbedingung

x+y<=10
in ein Koordinatensystem einzeichnen, muss man die Ungleichung nach y auflösen
y<=10-x
und anschließend die Ungleichung als Geradengleichung interpretieren

y=10-x

Wenn Sie davon ausgehen, x = 0 dann y=10


Wenn Sie davon ausgehen, y = 0 dann x=10

Man moecte die 2. Nebenbedingung


5*x+2*y<=30
und anschließend die Ungleichung als Gleichung interpretieren

2*y=30-5*x

Wenn Sie davon ausgehen, x = 0 dann y=15


Wenn Sie davon ausgehen, y = 0 dann x=6

Die 3. Nebenbedingung lautet: x<=6


x<=6 = > Das ist eine Parallele zur y-Achse mit dem Achsenschnittpunkt x=6

Die 4. Nebenbedingung lautet: y<=9


y<=9 => Das ist eine Parallele zur x-Achse mit dem Achsenschnittpunkt y=9

Der zugelassene Bereich ist der Durchschnitt endlich vieler Halbebenen und somit ein sogenanntes
konvexes Polyeder mit endlich vielen Eckpunkten.
Die Zielfunktion wird ebenfalls durch eine Gerade dargestellt.

Die Optimale Loesung


Da das Optimum einem Eckpunkt des Leistungsbereichs entspricht, lesen wir diese zunächst ab:
P1(6,0), P2(0,9), P3 (1,9), P4(3,7)

Die mit schwarz markierte Zone interessiert uns. ( Das Polyeder mit 4 Eckpunkten das am Ende
entsteht). Der maximale Eckpunkt ist derjenige an der Kreuzung der ersten zwei Nebenbedingungen.

Jetzt setzen wir die Punkte in die Zielfunktion ein und bestimmen das Maximum.
Z(x,y)=30*x+25*y
z(6,0)=30*6+25*0=180
z(0,9)=30*0+25*9= 225
z(1,9)=30*1+25*9=255
z(3;7)=30*3+25*7=265 => Maximum!

Antwort:
Der maximale Gewinn wird erzielt, wenn der Eisverkaeufer 3 Sorten des Typ A und 7 Sorten des Typ
B produziert.
Eine Einführung in OLAP
(Online Analytical Processing)

Vorlesung 4
Online Analytical Processing (OLAP)

• OLAP wird neben dem Data-Mining zu den Methoden


der analytischen Informationssysteme gezählt.
• OLAP wird weiterhin den hypothesengestützten Analysemethoden
zugeordnet.
➢Der Analyst muss vor der eigentlichen Untersuchung wissen,
welche Anfragen er an das OLAP-System stellen möchte.
➢Seine Hypothese wird dann durch das Analyseergebnis
bestätigt oder widerlegt.

• OLAP-Systeme bilden in diesem Zusammenhang oft die


technologische Grundlage für aktuelle Business-Intelligence-
Anwendungen.
• Typische Einsatzszenarien für entsprechende OLAP-Systeme sind
u. a. das Berichtswesen und Analyse, aber auch Planung und
Budgetierung in folgenden Bereichen: Controlling,
Finanzabteilungen, Vertrieb, Produktion, Personal und
Management Unternehmenssteuerung.
Wofür wird OLAP (Online Analytical Processing)
benötigt? (1)

OLAP erleichtert die Analyse von Kennzahlen unter


verschiedenen Gesichtspunkten (Dimensionen)

Wie gross ist der


Wie gross ist der Umsatz pro Umsatz pro Zeit und
Zeit, Geschäftsbereich und Produkt?
Kundengruppe?

...
Wofür wird OLAP (Online Analytical Processing)
benötigt? (2)

Weitere Gewinn pro Produkt und Monat?


Kennzahlen Kosten pro Produkt und Monat?

Anteil des Gewinns der einzelnen


Berechnete Produkte am Gesamtgewinn?
Kennzahlen Veränderung des Umsatzes im
Vergleich zum Vormonat?

Umsatz pro
Weitere
Distributionskanal?
Dimensionen
Gewinn pro
und Hierarchien
Kundengruppe?

Grafische Geeignete graphische


Darstellungen Darstellungen?
...
Einführungsbeispiel
Wein-Shop (1)

Umsatz pro Zeit und Produkt

Umsatz
Jan Feb Mrz Q1 Apr ... 2000
Merlot 33 55 56 144 18 ... 760
Cabernet-S. 72 136 117 325 74 ... 1338
Shiraz 85 128 99 312 92 ... 1662
Rotweine 190 319 272 781 184 ... 3760
Chardonnay 55 69 99 223 84 ... 1051
Zinfandel 22 17 47 86 39 ... 493
Weissweine 77 86 146 309 123 ... 1544
Alle Produkte 267 405 418 1090 307 ... 5304
Einführungsbeispiel
Wein-Shop (2)

Umsatz pro Zeit, Produkt und Region

Umsatz, Alle Regionen


Jan Feb Mrz Q1 Apr
Umsatz, Oesterreich ... 2000
Merlot Jan 33Feb55Mrz56 Q1 144Apr18 ... ... 2000760
Umsatz, Deutschland
Cabernet-S.
Merlot 372 136
4 117
4 325 374 ... ... 1338
11
Umsatz, Schweiz Jan Feb Mrz Q1 Apr ... 200043
Shiraz
Cabernet-S. 8852611
128 1499 33 312 1292 ... ... 156 1662
Merlot 11 22 59 4 ... 299
RotweineJan 16
Shiraz
Feb Mrz
190 12319 29 Q1 Apr
272 781 35
57 184... 2000
... ...480 3760
305
Cabernet-S.
MerlotChardonnay 1916 2554 49 119 18 ...
Rotweine 2755 2730
69 477499 10111 ...84 418
223 50 ...... ...402 1051
504
Shiraz
Cabernet-S. 29 34 35 98 18
Zinfandel 48 1171
Chardonnay 22 1754
17 24173
47 5244
86 24...39 702
... ... 213 493
Rotweine
Shiraz 4056 82114 35106 157276 3940 ... ... 955 1181
Weissweine
Zinfandel 477 386 146
3 309
10 123
5 ... ... 1544
Chardonnay 10719 17818 11953 40490 9427 ... ... 2075
Rotweine 48280
Alle Produkte 15
Weissweine 267 20405 27418 1090
62 1529307 ... ... 293 5304
Zinfandel
Chardonnay 25 6 34 5 2212 81 23 33 ... ... 356 202
Alle Produkte 42 47
Weissweine 1225 923 3265 53 74 163 79 ...
113 1942 ... ... 211 684797
Zinfandel
Alle Produkte 3781 43
Weissweine 137 54171 134389 5282 ... ... 567 1865
Alle Produkte 144 221 173 538 146 ... 2642
Einführungsbeispiel
Wein-Shop (3)

Umsatz pro Zeit, Produkt, Region, Distributionskanal, ...


Um satz, Oesterreich, Alle Distributionskanäle

Umsatz, Schweiz, Alle Distributionskanäle Um satz, Oesterreich, Telefon


Um satz,Merlot Oesterreich, Jan
Jan
Hom33
Feb Mrz Q1
Feb 55Mrz 56 Q1144Apr 18... ... 2000760
epage
Apr ... 2000

Cabernet-S.
Merlot Jan 3 72 Feb 4136 Mrz 4117Q1 11Apr 325 3... 74 ...
... 2000 1338
43
Jan Feb Mrz
Umsatz, Schweiz, Telefon Q1 Apr ... 2000
Um satz, Oesterreich, Fax
Shiraz
Cabernet-S.
Merlot Jan 11 Feb 8 8526 Mrz
111282214Q19959 Apr 333124...12 ... 92... ...299 156
2000 1662
Rotw
Shiraz
Cabernet-S.
Merlot eine 19 16 16190
25 54 12 319
30 49 Um
29 272
74 satz,
119 57Alle
781
18
11 ... Regionen,
35
... 184
...
418 ... Alle
480 Distributionskanäle
3760
305
Merlot
Umsatz, Jan 33 Feb 55Mrz 56 Q1144Apr 18... ... 2000760
Schweiz, Homepage
Um satz, Bern, Alle Distributionskanäle
Um satz, Bern, Telefon Jan Feb Mrz Q1 Rotw
Rotw
Shiraz
Cabernet-S.
Apr
Chardonnay
eine
Zinfandel... 2000
48 29 27715534 275469Um
Um
3547 satz,
173 9998Alle
Merlot
satz, Alle
101 Regionen,
4422318
Regionen,
... 84
... 50
Jan
Jan
Hom
Telefon
...702
33 Feb
epage
Feb
...402 5041051 Mrz
55 Mrz 56 Q1
Q1
144 Apr
Apr ...
18 ... ... 2000
2000
760
Shiraz Chardonnay
eine 40 56 118222114 17351710624 15747 276 52 39 8640 ... 39
... 24 ...955... 213493
1181
Merlot
Um satz, Jan 33 Feb 55Mrz 56 Q1144Apr
Bern, Hom epage 18 ... ... 2000 760 MerlotCabernet-S. 3 72 4136 4 117 11 325 3 74
... ... 1338
43
Umsatz, Cabernet-S.
Schweiz, Fax Jan 3 72
MerlotCabernet-S.
Merlot
Um satz, Bern, Fax Feb 4136
Jan 3 72 Mrz 4117Q1 11Apr
Feb 4136 325 3... 74... 2000
Mrz 4117Q1 11Apr
Rotw
Chardonnay
... 431338
Zinfandel
eine
325 Zinfandel
Weissw eine 107 19 178
Chardonnay
3... 74 ...Produkte
... 2000
Alle
Weissw eine431338 6 15267 5 20405
25 34
Um
4 7718 119 satz,
3 8653 404
1227
Alle
314690 10
Shiraz
Cabernet-S.
22Merlot
Regionen,
41823 62
81
94309
1090
33
27
Jan
15
JanFax
... ...5123
...11
... 29 307Feb
...
356
Feb
... ...482 80
2075
85
8 ...202 11
Mrz
1544
128
26 Mrz 2214Q19959 Apr
5304
293
Q1 Apr
333124...12
...
... 92
2000
... ...299 156
2000 1662
Shiraz
Cabernet-S.
Merlot 8 8526 Mrz
Jan 11 Feb 111282214Q19959 Apr 333124...Weissw
12
...
Alle 92
2000 ...299 156
...Produkte
eine 1662 25 42 23 Merlot47 ShirazRotw
Cabernet-S.
65 74 113eine
163 42 19
79
...16 16
... 190
25 54
684 12319
30
797 49 29 272
74 119 57
11 781
18... 35
... 184 ...
418 ...
480 3760
305
Zinfandel 12 9 32 53 19 ... 211
Shiraz Jan 11 Feb
Cabernet-S.
Merlot
Merlot Rotw eine
Shiraz
Cabernet-S.
Chardonnay
Rotw eine
8 8526Mrz
27
111282214Q19959 Apr
19054 1230
19 16 1625
55 27
319492974
69
333124...12... 922000
47
272
99
11781
119 57
101
18
223
... ...299 1561662
...184
35
...Alle
Weissw
50
...418... 305
eine480
Produkte
84
... ...
3760 81Um satz,
1051
504
37
Um
Deutschland,
Rotw
54Shiraz
43137 Cabernet-S.
satz,
171
Deutschland,
Chardonnay
134 eine Alle Distributionskanäle
389 52 82
Jan
Telefon
...48...29 27
Feb
71
567
Mrz
5534 2754693547
1865
Q1
1739998 101
Apr
44223
...
18 ... 84
... 50
2000
...702...402 504
1051
Shiraz
Cabernet-S. 48 29 71 34 54 35 173 98 18
44 Alle ...
... Produkte 702 402 144 221 Shiraz
173 Rotw Zinfandel
Chardonnay
eine
538 146 ...40 2642 56 11 8222
114 173517
106 24
157 47
276 52 86
40
39 ... 24
... 39
...
955 ...
1181 213493

Merlot Rotweine 19 16 1625


Shiraz
Cabernet-S.
Zinfandel
Chardonnay
Rotw
Shiraz eine
190541230
40 56 118222
Weissw eine 107 19 178
Zinfandel
Chardonnay
Rotw eine
319492974
114 173517
4 7718 119
272119 57
10624
3 8653 40411781
18... 35...184...418...480 3053760
15747 39 86
276 52
314690 10
40
94309
27
... 39
... 24
... ...5123
...955... 213493Um satz,
1181
... ...482 80
2075 Um satz,
1544
Merlot
Deutschland,
Rotw
Cabernet-S.
Merlot
Deutschland,
Weissw
Zinfandel
Chardonnay
eine
Jan
Fax
Weissw
Hom33
Jan
Alle Produkte
Zinfandel
Chardonnay
72
Feb 55Mrz
epage
eine
Feb 4136
3eine
107 19 178
Mrz 6415
25
4567718Q1
117 Q15 20
267
34
3144
119 8653Apr
3251227
11Apr
405
22
3146
404
3...
418
81
1890
74
... ...10309
... ...62
23 2000
2000760
94 27
1090
33 15
... ...5123
1338
43 ...307
... 29
... ...482 80
2075
...356
1544
...202 293
5304
Alle Produkte
Weissw eine 267 5 2022
25 6 1534 405122781 41823 621090 ...307
... 29 ...356...202 2935304Merlot Shiraz
Cabernet-S. Jan 11
Alle Produkte 8
Feb 85 26 11
Mrz128 22 14Q1 99 59 33
Apr 3124 ...12
... 92
...
2000 ...
299 1561662
Zinfandel
Chardonnay 33 15 Weissw eine 12 25 42 9 23 4732 657453113 163 19 42 ... 79
... ...211684 797
Chardonnay 48 29 2771553427546935471739998 101
Rotweine
Shiraz
Cabernet-S.
Alle Produkte
Weissw
Zinfandel eine 44223
12 25 42 9 23 4732 657453113 16318... 50... 84...702...402 5041051
19 42 ... ...211684 797Merlot
... 79 Shiraz
Cabernet-S.
Zinfandel
Rotw eine Alle19Produkte
Weissw eine
Um
16 1625 19054 1230
satz, ...,27
31949
Alle
29272
37 81 7443 137 57
119 781
1154
Distributionskanäle
18... 35
171 ... 184
134389
...418...480823053760
52 ... ... 567 1865
Alle Produkte
Weissw eine 37 81 43137 54 171 134 389 82
52 ... ... 5671865 Rotw
Shiraz
Cabernet-S.Chardonnay
eine 48 29 2771 55 34 54 69 35 47
173 99 98 101
44 223
18... 50
... 84
...
702 ...
402 5041051
Alle Produkte 144 221 173 538 146 ... 2642
Shiraz Zinfandel 40 56 1182221141735171062415747276 52
Chardonnay
Rotweine
Alle Produkte 144 221 173
39 86
53840... 24... 39...9551181
146 ... ... 213493
2642 Rotw
Shiraz Zinfandel
Chardonnay
eine
Weissw
Zinfandel
Chardonnay
Rotw eine eine Um
Um 40satz,
107
56 1182
Merlot
satz,19
...,
...,
4
178
22
Hom
77
Telefon
114
18
173517
epage
3
119
10624
86 53
157
Jan
3
Jan
47
146
404
276 52
33
90
39
Feb
10
Feb
86
40
55
309
27
94 ...
... 24
Mrz
...Mrz
5
...
39
...955
56
123...
2075
... Q1
1181
Q1
...
482
213493
144 Apr
1544
80
Apr ...
18 ... ... 2000
2000
760
Alle Produkte
Weissw eine Merlot
Um satz, 25Cabernet-S.
...,6 15
Fax267 5 2022 405Jan
122781 3 72
418 Feb
23 62 4136
Mrz
1090 ... 29 4117
307 Q1
... 11Apr
...202325
293 3... 74
5304 ... 2000
... 43
1338
Weissweine107 19 178
Zinfandel
Chardonnay
Rotweine 4 7718 119
3 8653 404
314690 1094309
27... ...51232075
... ...482 801544 Zinfandel
Chardonnay
eine Merlot
Alle Produkte
Weissw
Zinfandel Cabernet-S.
12Shiraz
34
25 42 9 23 47 Jan
32 65 11 8113
74Feb
53 8526163
33
11
15
19128
Mrz 422214
...
...
...Q199
79
356
59
...
211 Apr33312
684 4...12
797 ... 92 ... ...299 156
2000 1662
ShirazRotw
Cabernet-S.
eine Merlot37 81 43137 5419
Alle Produkte
Weissw eine 16 16
171 13425 190 54 12
389 523082319 49 29 272
... ...74 567119 57 781
18
11 ...
1865 35
... 184 ...
418 ...
480 305
3760
Alle Produkte25 6 1534
Weissweine
Zinfandel
Chardonnay 267 52022405122781
41823 62
... 331090
...
15... 29...307...356...202 2935304
Jan FebAlleMrz
ProdukteQ1 Rotw
Shiraz
Cabernet-S. eine
Chardonnay
144 ...221 2000
Apr
Chardonnay
Rotw
Shiraz Zinfandel
eine
173 48
40
29
56
27
538 7155
118222114
34 275469
146 ...
173517
35
106
47
173
24
157
9998
2642
47
276
10144
52
39
223
18
86
40
...
...
50
...
24
...
...
84 702
...955
39
...
402 504
1051
... 213493
1181
... Merlot Jan 3 Feb 4 Mrz 4 Q111 Apr 3 ...... 200043
Alle Produkte 12 25 42 9 234732 657453113 163
Weissweine
Zinfandel ... Merlot
19 42... 79... ...211684 797
Cabernet-S.
Cabernet-S.
Jan 3 Feb 8
816 4Mrz
411Mrz 414 Q1 1133
1112 4 1429
Rotw
Apr
3357 3...
Zinfandel
3eine
12
Weissw
Weissw eine 107 19 178
Chardonnay
...... ... 2000 43
Zinfandel
Chardonnay
12...
eine
Alle Produkte
156
25 6
4 7718 119
1534
267 5 2022
3 8653 404
405122781
314690 10
41823 62
94309
27
1090
33 15
... ...5123
... 29
... 307
... ...482 80
2075
...356
1544
...202 293
5304
Merlot Shiraz Jan 3 Feb Q1 11 Apr 35...2000
... 43156 305
Alle Produkte
Weissw
Zinfandel eine 12 25 42 9 23 4732 657453113 163 19 42... 79
... ...211684 797
Merlot Shiraz 3 8 27 16 4 11 27 12 29
4 14 47 57
11 33 101 3 12 35
... ... ...
50 ...43156 504 305
Alle Produkte 37 81 43137 54171 134389 52 82... ... 5671865
Weissweine Cabernet-S.
Rotw
Cabernet-S.
Shiraz
Rotw eine
eine
Chardonnay 8 16 2711 11 12 2714 17 29 472433 5710112
52 35...Alle
Weissw50... Produkte
eine
24... ...
156305504 213
37 81 43137 54171 134389 52 82 ... ... 567 1865
Shiraz
RotwChardonnay
eine 16 27 1112 27 1729 47 24 57101 5235 50 Alle Produkte
...24... ... 305504213 144 221 173 538 146 ... 2642

Alle Produkte 144 221Rotw 173 538 2711 111462717 17... 4724 242642
eine
Chardonnay
Chardonnay
101 52 50 24
52
... ...
24 ...
504213
213
Was ist OLAP (Online Analytical Processing) ?
OLAP ist:
• ein Überbegriff für die Technologien, Methoden und
Werkzeuge zur Ad-hoc-Analyse multidimensionaler
Informationen
• eine Komponente der entscheidungsorientierten
Informationsverarbeitung.

Region
Produkt
OLAP Umsatz Zeit

… …
Was ist OLAP (Online Analytical Processing) ?

• OLAP-Datenbanken (Online Analytical Processing)


ermöglichen Business Intelligence-Abfragen.
• OLAP ist eine Datenbanktechnologie, die nicht für die
Verarbeitung von Transaktionen, sondern für die
Abfrage und Berichtserstellung optimiert wurde.
• Die Quelle für OLAP stellen OLTP-Datenbanken
(Online Transactional Processing) dar, die meist in
Data Warehouses gespeichert sind. OLAP-Daten sind
von diesen herkömmlichen Daten abgeleitet und
werden in Strukturen aggregiert, die eine
anspruchsvolle Analyse zulassen.
Was ist OLAP (Online Analytical Processing) ?
• OLAP-Daten sind zudem hierarchisch organisiert und nicht in
Tabellen, sondern in Cubes (Wuerfel) gespeichert. Es handelt
sich um eine hoch entwickelte Technologie, die mithilfe von
mehrdimensionalen Strukturen schnellen Zugriff auf Daten
für die Analyse ermöglicht
• OLAP-Systeme beziehen ihre Daten entweder aus den
operationalen Datenbeständen eines Unternehmens oder
aus einem Data-Warehouse (Datenlager).
• Der Einsatz eines Data-Warehouse verhindert, dass die
Analysedaten mit den transaktionsorientierten
Datenbeständen in Kontakt kommen und die
Leistungsfähigkeit beeinträchtigt wird.
• Ebenso ist die Leistung eines OLAP-Systems von der
verwendeten Datenhaltungsform und deren Anbindung an
den Analyse-Client abhängig.
OLAP
• OLAP-Datenbanken enthalten zwei Datentypen:
❖ Fakten/ Kennzahlen - also numerische Daten, d.
h. die Mengen und Durchschnittswerte, mit deren
Hilfe Sie fundierte Geschäftsentscheidungen
treffen
❖ Dimensionen/ Eigenschaften - also Kategorien,
mit deren Hilfe Sie diese Measures organisieren.
• Ein OLAP-Würfel setzt sich aus Eigenschaften
(sogenannte Dimensionen) und Kennzahlen
(sogenannten Fakten) zusammen.
• Weit verbreitete Werkzeuge zur Erstellung von OLAP-
Würfeln sind z.B. Microsoft SQL Server Analysis
Services oder IBM Cognos Business Intelligence
Power Play.
OLAP Dimensionen
• Die Dimensionen bilden eine multidimensionale
Struktur. Daher kommt auch die Bezeichnung
Würfel, in Anlehnung an die gleichnamige,
dreidimensionale Grundform.
• In OLAP-Würfeln ist die Anzahl an Dimensionen
theoretisch unbegrenzt.
• Jede Dimension besteht aus hierarchisch
strukturierten, distinkten Werten, den sogenannten
Ausprägungen.
• Solche Ausprägungen können die Monatsangabe sein, eine andere
Achse könnte den Absatz, den Netto-Umsatz und den Preis
umfassen, und die dritte Achse die Produkte 1 bis n.
• Alle möglichen Kombinationen von Ausprägungen aller
Dimensionen bilden die Menge von Kontenpunkten im Würfel.
Dimensionen und Hierarchien
• Der Begriff Dimension leitet sich von der
konzeptionellen Darstellung der Daten als
multidimensionaler Würfel, auch OLAP-Würfel genannt,
ab.
• Dimensionen: hierbei handelt es sie um das
Auswahlkriterium, bzw. auch mehrere Kriterien, wonach
die Analyse gegliedert wird, wie z.B. Zeit (Jahr / Monat /
Tag), Produkt, Lager, Kundenstamm, Region, Vertreter,
etc.
• Hierarchien:Dimensionen können als
Erweiterung hierarchisch aufgebaut sein und geben den
Auswertungen eine Struktur.
• Als Beispiel der Dimension “Zeit” ist eine mögliche
Hierarchie: Jahr –> Halbjahr –> Quartal –> Tag. Hierarchien
sind durch eine baumartige Struktur gekennzeichnet.
OLAP Kennzahlen/Fakten

• Für jeden solchen Kontenpunkt können Kennzahlen


festgelegt werden, z.B. der Umsatz pro Monat und
Region.
• Diese Kennzahlen können nun über die
verschiedenen Hierarchiestufen der Dimensionen
oder andere Gruppierungen aggregiert werden.
Dadurch eignen sich OLAP-Würfel sehr gut zur
Analyse von Detaildaten und zur Erforschung
unbekannter Zusammenhänge.
• OLAP-Würfel finden deshalb oft in Controlling-
Abteilungen Anwendung.
OLAP-Würfel (Daten Würfel)
• Englisch OLAP cube oder data cube, auch Cube-
Operator

• Die Bezeichnung OLAP


(Online Analytical Processing) stammt aus der
Datenanalyse.

• Diese Art der Darstellung ist für die Analyse von


Daten von Vorteil, da auf verschiedene Aspekte
(Dimensionen) der Daten auf gleiche Weise
zugegriffen wird.
• Daher auch der Einsatz bei OLAP-Anwendungen,
welche die Daten in einem Data-Warehouse
analysieren oder visuell aufbereiten.
OLAP-Würfel (Daten Würfel)

• In einem OLAP-Würfel besteht die Datenstruktur aus


Dimensionen/ Eigenschaften und Kennzahlen, die als Fakten
abgelegt werden.

• Fakten und Dimensionen können auch in Fakten und


Dimensionstabellen verwaltet werden.

• Die Faktentabelle enthält die Metriken und Kennzahlen,


wohingegen die Dimensionstabelle, die eine Dimension
eines OLAP-Würfels darstellt, die Beschreibungen enthält.
Dimensionen innerhalb eines OLAP-Würfels zugeordnet.
• Z.B. kann die Kennzahl "Umsatz" den dimensionalen Ausprägungen Ort "Köln",
Monat "Mai" und Produktkategorie "Non-Food" zugeordnet sein. In diesem Beispiel
wird also der Umsatz für Non-Food-Produkte in Köln im Monat Mai angezeigt.

Beispiel eines OLAP-Würfel mit verschiedenen Dimensionen


Schematische Darstellung der OLAP-Dimensional Model
OLAP Charakteristika Dimensionen

Daten werden über Dimensionen beschrieben.

Merlot
Produkte

Cabernet-S.
Shiraz

Chardonney
Deutschland
Zinfandel Oesterreich
Schweiz

Aug

Nov
Sep
Feb

Dez
Jun
Jan

Apr
Mrz

Okt
Mai

Jul

Zeit
OLAP Charakteristika Hierarchien

Dimensionen können Hierarchien haben.

Alle Produkte

Rotweine
Produkte

Merlot

Cabernet-S.
Shiraz

Weissweine

Chardonney Alle Regionen


Deutschland
Zinfandel Oesterreich
Schweiz

2000
Aug

Nov
Sep
Feb

Jun

Dez
Jan

Apr
Mrz

Okt
Mai

Jul
Q1

Q2

Q3

Q4
Zeit
OLAP Charakteristika
Flexible Präsentation (1)

Die multidimensionalen Daten können am Bildschirm flexibel


präsentiert werden.

Umsatz, Jun
Grundoperationen CH D A Alle Regionen
Rotweine 200 100 50 350
Weissweine 120 110 30 260
Alle Produkte 320 210 80 610
Roll-
Drill- Umsatz, Jun up
down CH D A Alle Regionen
Rotweine 200 100 50 350
Chardonnay 25 34 22 180
Zinfandel 12 9 32 80
Weissweine 120 110 30 260
Alle Produkte 320 210 80 610
Grundoperationen - ROLUP
Ein Roll-up entspricht also einem Hinauszoomen aus dem aktuellen
Datenwürfel, was dazu
führt, dass das Ergebnis einen geringeren Detailgrad hat,
z.B. Rollup des Würfels (Produktkategorie / Monat / Stadt) zu
(Produkttyp / Monat / Stadt).
• Dieses Hinauszoomen geschieht entlang einer oder mehrerer
Dimensionen, z.B. Roll-Up
Beispiel oben oder Roll-up zu (Produkttyp / Quartal / Stadt).
• Es ist auch möglich, zur Wurzel TopD einer oder mehrerer
Dimensionen zu navigieren.
Geschieht dies entlang aller Dimensionen, beinhaltet das Ergebnis
nur noch einen Fakt
Grundoperationen - Drill-Down

• Drill-Down ist die inverse Operation zu Roll-Up.


• Ermöglicht Navigation von einem gröberen Detailgrad
zu einem feineren Detailgrad (Hineinzoomen) entlang
mindestens einer Dimension.
• Z.B. von (Produkttyp / Quartal / Stadt) zu (Kategorie /
Monat / Stadt).
OLAP Charakteristika - Grundoperationen

Flexible Präsentation (2)

Die multidimensionalen Daten können am Bildschirm flexibel


präsentiert werden.

Kennzahlen Umsatz
Slice & Dice
Umsatz
Alle Regionen
Gewinn
Produkte Rotweine 3200
Regionen Weissweine 1900
Zeit Alle Produkte 5100

Umsatz
Kennzahlen Alle Regionen
Umsatz
Eine beliebige Kombination Qtr1 900
Gewinn
Qtr2 1300
von Dimensionen und Aus- Produkte
Regionen Qtr3 1200
prägungen kann angezeigt Qtr4 1700
Zeit
werden. 2000 5100
Grundoperationen

• Slicen: bei dem Slicen wird aus dem OLAP-Würfel


eine Scheibe “herausgeschnitten”. Z.B. das Produkt
A über den gesamten Zeitraum und über alle Länder.
Die Scheibe ist eine Teilmenge des OLAP-Würfels
in einer Dimension auf einen festen Wert
eingeschränkt.

• Dicen: unter Dicen versteht man das Vertauschen


des Betrachtungswinkel auf die Teilmenge, die beim
Slicen aus dem Würfel geschnitten wurde. Wenn
man sich die Teilmenge in einem zweidimensionalen
Koordinatensystem vorstellt werden beim Dicen die
X-Achse und die Y-Achse vertauscht.
OLAP Charakteristika
Flexible Präsentation (3)

Die multidimensionalen Daten können am Bildschirm flexibel


präsentiert werden.

Umsatz Slice & Dice


CH D A Alle R.
Rotw. Qtr1 200 100 50 350 Umsatz
Weissw. 120 110 30 260 Rotw. Weissw. Alle P.
Alle P. 320 210 80 610 Qtr1 CH 200 120 320
Rotw. Qtr2 180 90 50 320 D 100 110 210
... ... ... ... ... A 50 30 80
Alle P. 270 130 80 480 Alle R. 350 260 610
Rotw. 2000 910 390 180 1480 Qtr2 CH 180 100 280
Weissw. 370 310 190 870 D 90 50 140
Alle P. 1280 700 370 2350 ... ... ... ...
2000 CH 910 370 1280
D 390 310 700
Die Achsen können A 180 190 370
beliebig ausgetauscht Alle R. 1480 870 2350
werden.
OLAP und Data Warehousing
Was ist ein Data Warehouse?
Ein Data Warehouse ist ein Datenbanksystem, in dem die
entscheidungsrelevanten Daten eines Unternehmens in
konsolidierter Form gesammelt werden, um sie für
Auswertungen zugänglich zu machen.
Reservie- Personal-
Operative Auftrags- ver-
rungs- verarbeitung ...
Systeme system waltung

Reservie- Auftrags- Personal-


rungs- verarbeitung ver-
system waltung
Data
Warehouse ...
Datawarehouse: unter dem Datawarehouse versteht man eine
Datenbank, in der aus unterschiedlichen Quellen Daten geladen
werden, die die Quelle für die Berichte und Analysen darstellen.
Den Vorgang des Befüllens der Datawarehouse Datenbank nennt
man den ETL-Prozess. Bei diesem Prozess wird zusätzlich auch noch
sichergestellt, dass die Daten in sich konsistent sind und performant
abgefragt werden können.

ETL-Prozess: ETL steht für:


• Extraktion = relevante Daten aus den verschieden Quellen
extrahieren
• Transformation = Daten bearbeiten und auf das Format der
Zieldatenbank zu bringen
• Load = Daten in das Datawarehouse schreiben.

Der ETL Prozess wird verwendet um Daten aus einer oder mehreren
Datenbanken zu bearbeiten und in das Datewarehouse zu
schreiben.
OLAP und Data Warehousing
Zwei Sichten auf den gleichen Prozess
Data Warehousing OLAP

Operative Data Data Client


Systeme Warehouse Marts Applications
Reporting
Ad-hoc Analyse
Data Mining
...
Schritte in der OLAP-Erstellungsprozess
OLAP-Architekturen

ROLAP
Relationales Komplexe Anfragen können hohe
OLAP Antwortzeiten verursachen 
Daten werden
relational
Grosse Datenmengen verarbeitbar ☺
gespeichert
Hybrides OLAP
HOLAP

Query and OLAP-


Calculation Frontend
Engine

MOLAP
Multidimen-
sionales OLAP
Schnelle Antwortzeiten auch auf
komplexe Anfragen

Daten werden
multidimensional
Verarbeitbare Datenmenge beschränkt 
gespeichert
Unterschiede zwischen transaktions-orientierten
und analyseorientierten Systemen

Transaktionsorientierte Systeme Auswertungsorientierte Systeme


Operative Systeme

OLTP OLAP
(Online Transaction Processing) (Online Analytical Processing)

Häufige, einfache Anfragen Weniger häufige, komplexe Anfragen

Kleine Datenmengen je Anfrage Grosse Datenmengen je Anfrage

Operieren hauptsächlich auf aktuellen Operieren auf aktuellen und


Daten historischen Daten

Schneller Update wichtig Schnelle Kalkulation wichtig


→ Datenbanksystem kann nicht gleichzeitig für OLTP- und für OLAP-
Anwendungen optimiert werden
Paralleles Ausführung von OLAP-Anfragen auf operationalen Datenbe-
ständen könnte Leistungsfähigkeit der OLTP-Anwendungen beeinträchtigen
Zukünftige Entwicklungen

Integration von OLAP und Data


Mining und anderen Methoden
der entscheidungsorientierten Stärkere Beteiligung
Informationsverarbeitung der akademischen
Welt an der OLAP-
Weiterentwicklung
Weiterentwicklung und
rasche Verbreitung von
Web-OLAP Auf spezifische vertikale
oder horizontale Märkte
ausgerichtete OLAP-
Weiterentwicklung der technischen
Applikationen
Konzepte (z.B. optimale Verteilung
von Speicherung und Kalkulation,
verbesserte Metadatenverwaltung, ... )
Bibliographie
• Mala Bachmann. Eine Einführung in OLAP (Online Analytical Processing),
September 2000, www.swisseduc.ch/informatik/.../olap/docs/olap.ppt
• Erik Thomsen. OLAP Solutions: Building Multidimensional Information
Systems. Wiley, 1997.
• Alex Berson und Stephen J. Smith. Data Warehousing, Data Mining &
OLAP. McGraw-Hill, 1997.
• Nils Clausen. OLAP. Multidimensionale Datenbanken. Produkte, Markt,
Funktionsweisen und Implementierung. Addison Wesley, 1998.
• http://office.microsoft.com/de-de/excel-help/ubersicht-uber-olap-online-
analytical-processing-HP010177437.aspx#BMwhat_is_on-
line_analytical_processing
• http://www.itwissen.info/definition/lexikon/OLAP-Wuerfel-OLAP-
cube.html
• http://www.itwissen.info/definition/lexikon/OLAP-Wuerfel-OLAP-
cube.html
• www.olapreport.com
• www.olapcouncil.org
• http://www.linearis.at/blog/2012/11/19/das-neue-excel-2013-teil-2-
business-intelligence-funktionen/
Modellbasierten EUS (2)

Vorlesung 3
Wiederholung
Was ist lineare Programmierung?

• Die lineare Optimierung kann als


(praktische) Anwendung linearer
Ungleichungssysteme verstanden werden.

• Die Linearfunktion mit n Variablen soll


minimiert oder maximiert werden.

• Für die Variablen müssen dabei gewisse die


Nebenbedingungen erfüllt sein.
Lineare Programmierung
• Unter einem linearen Optimierungsproblem (LP)
versteht man die Aufgabe, eine linerare
Zielfunktion
z = F(x1,. .. ,xp) = c1*x1 + · · · + cp*xp
zu maximieren oder zu minimieren unter Beachtung
von linearen Nebenbedingungen der Form
ai1*x1 + · · · + aip*xp ≤ bi (i = 1, .. ., m1)
ai1*x1 + · · · + aip*xp = bi (i = m1 + 1,. .. ,m2)
ai1*x1 + · · · + aip*xp ≥ bi (i = m2 + 1,. .. ,m)
und meist auch von Vorzeichenbedingungen xj ≥ 0
für einige oder alle j = 1, ...., p
Nichtnegativitätsbedingung

Entscheidungsvariablen x1, x2, …xn >=0

• Bei den meisten Aufgaben aus der Praxis gibt es


eine Beschränkung der Entscheidungsvariablen
auf Werte größer/gleich Null. Grund dafür ist, dass
diese in der Regel keine negativen Werte
annehmen können.
• So kann zum Beispiel ein Unternehmen keine
"negative Anzahl" an Produkten produzieren.
Was bedeutet die
Nichtnegativitätsbedingung graphisch?

Quelle: http://www.mathebibel.de/lineare-optimierung
Was bedeutet die
Nichtnegativitätsbedingung graphisch?

Quelle: http://www.mathebibel.de/lineare-optimierung
Was bedeutet die
Nichtnegativitätsbedingung graphisch?

Quelle: http://www.mathebibel.de/lineare-optimierung
Produktionsproblem
• In einer Fabrik werden zwei verschiedene Sorten von
Kabeln hergestellt und für 150 € (Typ A) bzw. 100 € (Typ
B) pro 100 Meter verkauft.
– Für Kabel des Typ A benötigt man 16kg Plastik und 4kg
Kupfer.
– Für Kabel des Typ B benötigt man 6kg Plastik und 12kg
Kupfer.
• Die produzierte Menge von B darf nicht größer sein als die
doppelte Menge von A.
• Außerdem beträgt der Materialvorrat derzeit nur 252kg
Plastik und 168kg Kupfer.
• Welche Mengen der beiden Kabelsorten maximieren unter
Einhaltung der Nebenbedingungen den Umsatz der Firma?
1.) Übersichtliches Zusammenstellen der Aufgabe

Kabeln Kabeln Maximal Kapazität


Typ A Typ B Vorrat
Plastik 16 6 252
Kupfer 4 12 168
Verkaufspreis 150 100
2.) Mathematische Formulierung des Problems

Zielfunktion Z=Fmax(x, y)= 150*x+100*y

Die Nebenbedingungen 16*x+6*y<=252

4*x+12*y<=168
und wegen y <= 2x gilt:
2x−y>=0
Die Nichtnegativitätsbedingungen
x1>=0; x2>=0;
y1>=0; y2>=0
3.) Graphische Betrachtung
Möchte man die 1. Nebenbedingung
16x+6y<=252
in ein Koordinatensystem einzeichnen, muss man die Ungleichung nach y
auflösen
6y≤−16x+252
y≤−8/3x+42
und anschließend die Ungleichung als Geradengleichung interpretieren
y=−8/3x+42
Wenn Sie davon ausgehen, x = 0 dann y=42
Wenn Sie davon ausgehen, y = 0 dann x=15,75

Die farbige Fläche gibt den Bereich an,


der die 1. Nebenbedingung erfüllt.
3.) Graphische Betrachtung
Möchte man die 2. Nebenbedingung 4x+12y≤168
in ein Koordinatensystem einzeichnen, muss man die Ungleichung nach y
auflösen 12y≤−4x+168 => y≤−1/3x+14
und anschließend die Ungleichung als Geradengleichung interpretieren
y=−1/3x+14
Wenn Sie davon ausgehen, x = 0 dann y=14
Wenn Sie davon ausgehen, y = 0 dann x=42
Die farbige Fläche gibt den den Bereich an,
der die 2. Nebenbedingung erfüllt.
3.) Graphische Betrachtung
Die 3. Nebenbedingung lautet:
"Die produzierte Menge von B darf nicht größer sein als die
doppelte Menge von A."
...oder mathematisch formuliert: y≤2x

Die farbige Fläche gibt den Bereich an, der die 3.


Nebenbedingung erfüllt.
3.) Graphische Betrachtung
Die Lösungsmenge des linearen Ungleichungssystems.
16x+6y≤252
4x+12y≤168
y≤2x
..ist in der nebenstehenden Graphik farblich
hervorgehoben.
4.1) Optimale Lösung bestimmen (Rechnerisch)
• Da das Optimum einem Eckpunkt des Lösungsbereichs
entspricht, lesen wir diese zunächst ab:
P1(0,0); P2(6,12); P3(12,10); P4(15,75;0);
• Jetzt setzen wir die Punkte in die Zielfunktion ein und
bestimmen das Maximum.
z(x,y)=150x+100y
z(0,0)=150⋅0+100⋅0=0€
z(6,12)=150⋅6+100⋅12=2.100€
z(12,10)=150⋅12+100⋅10=2.800€→Maximum!
z(15,75;0)=150⋅15,75+100⋅0=2.362,50€
• Antwort:
Die Fabrik maximiert ihren Umsatz unter Einhaltung der
Nebenbedingungen, wenn sie 12 mal 100m Kabel vom Typ A
und 10 mal 100m Kabel vom Typ B produziert.
4.2) Optimale Lösung bestimmen (Graphisch)
• Wir lösen die Zielfunktion zunächst nach y auf...
z(x,y)=150x+100y=0 => 100y=−150x => y=−1,5x
• ..um diese in das Koordinatensystem zu zeichnen. Danach verschieben wir
die Gerade solange parallel, bis wir den letzten Eckpunkt des
Lösungsbereichs erreichen.
Das Optimum (hier: Maximum) ist in der Graphik durch einen gelben Punkt
dargestellt.
Zusammenfassung:

• Zielfunktion aufstellen
• Restriktionen als ungleichungen aufstellen
• Restriktionen und Zielfunktion einzeichnen
• Rechtsverschiebung der Zielfunktion bis zum äußersten
Tangentialpunkt des Beschraenkungspolyeders
• Optimale Mengen in Gewinnfunktion einsetzen
Literaturangabe

1. Prof. Dr. Peter Becker, “Lineare Programmierung”,


Fachbereich Informatik, Fachhochschule Bonn-Rhein-
Seig, Quelle: http://www2.inf.fh-rhein-
sieg.de/~pbecke2m/or/lp1.pdf
2. https://www.youtube.com/watch?v=oE09DyUQZtM
3. http://www.mathebibel.de/lineare-optimierung
4. https://www.youtube.com/watch?v=rO0-OtVs6nA
Logische Modellierung von
OLAP Würfel

Vorlesung 4

Conf. dr. Dana Boldeanu


Data-Warehouse (DWH) – I
Wiederholung
• Ein Data-Warehouse (DWH) ist gemäß Definition ein von
operativen Datenverarbeitungssystemen separiertes
Datenbanksystem, in dem Daten verschiedener, mitunter
sehr heterogener Quellen zusammengeführt, verdichtet und
langfristig archiviert werden.

• Zahlreiche Unternehmen überführen historische Daten


operativer Datenverarbeitungssysteme in regelmäßigen
Abständen in ein solches Datenlager und bereiten diese dort
für spätere Zugriffe und strategische Analysen im Rahmen
der Business Intelligence (BI) auf.
DWH – II
Wiederholung
Aus operativen Daten werden dispositive Daten:
• Operative Daten: Bei operativen Daten handelt es sich um
transaktionsorientierte Informationen, die in Unternehmen
während des Tagesgeschäfts anfallen und von Administrations-
und Abrechnungssystemen generiert werden. Zu den typischen
Datenquellen zählen operative Datenverarbeitungssysteme wie
Buchhaltungsprogramme, Warenwirtschaftssysteme,
Enterprise-Resource-Planning (ERP) oder Auskunfts- und
Bestellsysteme.

• Dispositive Daten: Werden operative Daten an einer


zentralen Stelle zusammengeführt (aggregiert), langfristig
gespeichert und für Analysen aufbereitet, spricht man von
dispositiven Daten.
OLAP
• Ein DWH bietet Analysten eine umfassende Sicht auf
heterogene Datenbestände und ermöglicht die Aggregation
betrieblicher Kennzahlen im Rahmen des Online Analytical
Processings (OLAP).

• Als zentrale Sammelstelle aller relevanten


Unternehmensdaten dient das DWH dem
unternehmensinternen Wissensmanagement. Anwendern
wird dabei in der der Regel nur der Lesezugriff gewährt.

• Ein DWH fungiert als Datenbasis für Data-Mining-


Methoden und ist Grundlage aller Überlegungen im
Rahmen des Leistungsmanagements und der strategischen
Unternehmensausrichtung.
Wiederholen
Eine multidimensionale Datenstruktur im Data Warehouse besteht
immer aus drei grundlegenden Objekten, den Fakten, den
Dimensionen und den Regeln (Roland &Gluchowski, 1997)

Fakten (auch Kennzahlen, Messgrößen, Measures, Measured Facts)


sind Variablen, die eine Unternehmenskennzahl repräsentieren (z.B.
Umsatz, Gewinn, Kosten, Rentabilität). Sie sind das Ergebnis
unternehmerischer Tätigkeit.
Fakten können in verschiedene Versionen aufgeteilt werden (z.B. Ist-
Umsatz, Soll-Umsatz).

Kennzahl ist Größe mit konzentrierter Aussagekraft zur Diagnose,


Überwachung und Steuerung eines Systems
– meist betriebswirtschaftliche Größen, z.B. Umsatz / Gewinn /
Rentabilität
– komplexe Beziehungen zwischen Kennzahlen möglich
Wiederholen
Dimensionen spiegeln die unternehmerische Sichtweise wieder, nach
der die Fakten aufgeschlüsselt werden (z.B. Kunden, Produkte,
Regionen, Zeit).

Diese Dimensionen lassen sich zu Hierarchien verdichten (z.B. Kunde


– Kundengruppe oder Kunde-Kundeklasse).

Innerhalb einer Dimension unterscheidet man zwischen


Dimensionselementen, nach denen verdichtet wird (z.B. Produkt), und
Dimensionsattributen, die lediglich beschreibenden Charakter haben
(z.B. Abmessungen).

Dimension: Datentyp
– Dimensionselement: Element / Ausprägung
– Attribute: Klassifikations-/Kategorienattribute (inkl. eines
Primärattributs) sowie „dimensionale Attribute“ (zusätzliche
beschreibende Eigenschaften, z.B. Produktfarbe / Gewicht)
Wiederholung

• Regeln sind Vorschriften, die festlegen, wie eine


Kennzahl berechnet wird

z.B. Gesamtwert =Menge * Einzelpreis

• Arten von Kennzahlen


– additive: additive Aggregation hinsichtlich aller Dimensionen
möglich
– semi-additive: additive Aggregation nur hinsichtlich
ausgewählter Dimensionen möglich
– nicht-additive (Beispiele: Durchschnittswerte, Prozentanteile)
Beispiel für Dimensionen und Fakttabelle
Data Cube

Source: https://dbs.uni-leipzig.de/file/dw-ss08-kap3.pdf
Das multidimensionale Modellierung
Variablen (Metriken, Messwerte oder Kennzahlen)
sind die quantitative, messbare in herkömmlichen
Maßeinheiten (als kg, Schnitte, Geldeinheiten).
Eine Variable ist ein numerisches Attribut eines
Elements der Basis von Fakten, Indikator oder der
Maßnahme, die die Leistung des Modells Aktivität
analysieren.

Beispiele - Umsatzvolumen (Menge / Wert), Volumen


der Käufe, Transportkosten, Schuldenvolumen, das
Volumen der Ansprüche, Gewinn, Volumen von Steuern.
=> zentralisiert quantitativen Daten
Sammlung von Fakten
Sammlung von Fakten - eine Reihe von verwandten
Daten, die aus Variablen und Daten Kontext.

Apostelgeschichte Thema Analysemodelle. Eine Tat


ist das Maß Tätigkeit am Schnittpunkt aller
Informationen mit der Tätigkeit bestimmt.

• Eine Transaktion Aktivität oder Veranstaltung


• Der Zustand eines Objekts
• Ändert den Zustand eines Objekts
Dimensionen
• Im Gegensatz dazu enthält die Dimensionstabelle die
„beschreibenden“ Daten.
• Die Faktentabelle enthält Fremdschlüssel auf die
Dimensionseinträge, die deren Bedeutung definieren.
• Typischerweise stellt die Gesamtmenge der Fremdschlüssel
auf die Dimensionstabellen gleichzeitig den Primärschlüssel
in der Faktentabelle dar.
• Das impliziert, dass es jeden Eintrag zu einer Kombination
von Dimensionen nur einmal geben kann.
• Dimensionstabellen sind vergleichsweise statisch und
üblicherweise erheblich kleiner als Faktentabellen.
• Die Bezeichnung „Dimension“ rührt daher, dass jede
Dimensionstabelle eine Dimension eines mehrdimensionalen
OLAP-Würfels darstellt.
Dimensionen
Dimensionen - Aktivitätsparameter, entsprechende Aussparung
im globalen Aktivitätsmessung => Aggregation Kriterien
Zeit (Tag, Monat, Jahr, Quartal, Saison), Standort,
geographische Gebiet, Kunden, Lieferanten, Produkt oder
Gruppen (Klasse, Unterklasse) Kunden, Produkte,
Mitarbeiter, Organisationsstruktur

Die Dimensionen modellierung eine Perspektive; es besteht aus


Parametern entsprechend der Informationen, auf die Aktivität
misst variieren.

Realwerte budgetiert, geschätzte Werte: Alle Varianten können


Maßnahmen Größe modelliert werden. Diese etwas künstliche
Dimension genannt Szenario
Logische Modellierung
Dimensional Model Umsetzung erfolgt in der
Beziehung so:

• jede Dimension entspricht einer Tabelle, die als


Dimensionen.
• jeden Fakt entspricht einer Tabelle, die als
Faktentabellen
Relationale Speicherung: Star-Schema

Faktentabelle bildet Zentrum des Star-Schemas und enthält die


Detail-Daten mit den zu analysierenden Kennzahlen

-> 1 Dimensionstabelle pro Dimension, die nur mit Faktentabelle


verknüpft ist (-> sternförmige Anordnung der Tabellen)
Star-Schema: Beispiel

Dimensionstabelle

Faktentabelle

Dimensionstabelle
Source: (Mansmann and Scholl, 2008)
Star/Stern-Schema formal
✓ Formale Definition: Star-Schema besteht aus einer Menge
von Tabellen D1 , ...Dn ,
– Dimensionstabellen Di bestehend aus (i.a. künstlichen)
Primärschlüssel di und Dimensionsattributen
– Faktentabelle F bestehend aus Fremdschlüsseln d1 , ... dn
sowie Maßgrößen (Kennzahlen) als weiteren Attributen
– Die Dimensionstabellen sind i.a. denormalisiert, d.h. nicht in
dritter Normalform Faktentabelle F (PA1 PA2, …, PAn; f1, f2,
…, fm)
Die Faktentabelle

Merkmale der Faktentabelle:

• Eine große Anzahl von Tupeln - Millionen, die das


kartesische Produkt der Abmessungen ist

• Seine Größe wächst dynamisch entsprechend der


Datenmenge für jeden Aktualisierungszyklus der
Datenbank geladen wird, und in Abhängigkeit von
der Menge der Daten in der historischen Datenbank
gespeichert.
Die Faktentabelle
• Tabelle, die die Leistung des Unternehmens
widerspiegelt analysiert. Enthält alle wichtigen
Schritte.

• Der Primärschlüssel der Tabelle ist ein


Schlüssel der Primärschlüssel der
Dimensionstabellen zusammengesetzt

• Normiert und hat eine indirekte Verbindung


zwischen der Größe
Allgemeine Schritte des Verfahrens
zum Entwerfen eines Datenlager

• Abgrenzung des Wirtschaftsprozesses


modelliert werden
• Die Granularität
• Größe Auswahl - Kriterien Aggregation
• Die Auswahl der Maßnahmen
Source: https://data-science-blog.com/blog/2018/05/02/datenmodell-sternschema/
Sternschema
Beobachtungen

– Anzahl der Datensätze in Faktentabelle entspricht Anzahl


der belegten Zellen einer multi-dimensionalen Matrix

– leere Dimensionskombinationen unproblematisch, da nur


relevante Kombinationen in der Faktentabelle auftreten.

– dennoch oft riesige Faktentabellen

– Dimensionstabellen vergleichsweise klein, teilweise jedoch


auch umfangreich (Kunden, Artikel etc.)
Vorteile Nachteile
Durch mehrfaches
Einfaches Modell Speichern identischer
ermöglicht eine Werte steigt die
intuitive Bedienung. Redundanz in den
Dimenionstabellen
Bei häufigen Abfragen
Vor- und Nachteile Veränderungen und
sehr großer
über Sternschema Erweiterungen können
Datenmodell Dimensionstabellen
leicht umgesetzt
verschlechtern sich die
werden.
Antwortzeiten
Durch Verzicht der
Normalisierung in den
Erhöhter
Dimensionstabellen ist
Speicherbedarf durch
die hierarchische
Nicht-Normalisierung
Beziehung innerhalb
der Dimensionstabellen
einer Dimension leicht
darstellbar
Beispiel

Abschnitt des relationalen Modell einer Bankentransaktionsanwend:

Kunde TRANSAKTIONEN Transaktionskosten

Kunde_id Tranzaktion_nb Provision_id


Kundename Tranzaktiondatum Name
Adresse Verfahren Beschreibung
Kundenart Kunde_id Kosten
Konto Operator_id Aenderungdatum
Telefon Menge
Eroeffnungsdatum Provision_id

Kundentransaktionen sind Transaktionen wie Zahlungen, Zahlungseingänge,


eine Kaution in Bar oder Abheben aus dem persönlichen Konto
Die Kosten für jede Transaktion ist die Bankprovision,die verschieden für
jedes Verfahren ist und sich mit der Zeit veraendern kann.
Die Tansaktionen werden in mehreren Filialen in verschiedenen Orten
durchgeführt.

Erstellen Sie das betreffende konzeptuelle Modell des Datenlagers


(Data Warehouse)
Dimensionale Modellierung
Dimensionen:
• Zeit – mit Attributen Zeit_ID, Tag, Monat, Semester, Jahr (je
nach Grad der Detaillierung, wo wir die Datenanalyse erreichen wollen)
• Verfahren – mit Attributen Verfahren_ID, Verfahrensname
• Filiale - mit Attributen Filiale_ID, Filialenname, Ort, Gebiet
• Kunde - mit Attributen Kunde_ID, Kundenname, Kundenart
Kennzahlen:
• Gesamtsumme der Provisionen verbunden mit den Verfahren
Dimension Dimension
ZEIT VERFAHREN

Zeit_id Verhfahren_id
Tag Fakttabelle Verrfahrenname
Monat
Semester TRANSAKTIONEN
Jahr
Zeit_id
Verfahren_id
Filiale_id
Kunde_id
SummeProvision Dimension
FILIALE
Dimension
KUNDE Filiale_id
Filialename
Kunde_id Ort
Kundename Gebiet
Kundenart

Sternmodell Lösung
SNOWFLAKE MODEL (Schneeflocke Modell)
Das Snowflake Model (Schneeflocke Modell) ist eine
Erweiterung des Star Model in der Weise, daß hier
Hierarchien in den Dimensionen zugelassen sind.
SNOWFLAKE Schema (Schneeflocke Modell)

- explizite Repräsentation der Dimensionshierarchien.

- normalisierte Dimensionstabellen – leicht geringere Redundanz,


geringerer Änderungsaufwand – erhöhte Zugriffskosten (höherer
Join-Aufwand)

Star-Schema ist Snowflake-Schema meist vorzuziehen!


Schneeflocke: Beispiel

Source: (Mansmann and Scholl, 2008)


Besondere Aspekte von dimensionale
Gestaltung
Additivität Fakten
• Fakten sind numerische und Additiv und verwendet in der
Regel für eine kontinuierliche (Maßnahmen sind
numerische und additiv zusammenfasst, damit eine große
Anzahl der Einträge in einigen Datensätzen).
• Semi-Additiv Fakten sind Fakten, die erst nach einer
bestimmten Größe zusammengesetzt werden können
(Aktien, Kontostände, Mess-Indikatoren)
• Nicht additive Fakten können nicht alle
zusammengesetzt werden (berechnet als Verhältnis
zwischen anderen Indikatoren - z.b. Rentabilitaet)
Verkaeufe
Zeit Produkt
IDZeit IDProdukt
IDZeit
IDProdukt
Tag Produktname
Monat Gesamtbetrag MarkeProdukt
Quartal Gesamtwert Produktsubkategorie
Semester AnzahlKunden Produktkategorie
Jahr Bruttogewinnspanne Bezirk

Bruttogewinnspanne = Bruttoertrag / Produktkosten


Die Bruttogewinnspanne ist nicht Additiv, weil es als das
Verhältnis der Mengen und die Menge der Rationen berechnet
wird.
Verkaeufe

Zeit Produkt
IDZeit
IDZeit IDProdukt IDProdukt
Tag Gesamtbetrag Produktname
Monat Gesamtwert MarkeProdukt
Quartal Produktkosten Produktsubkategorie
Semester AnzahlKunden Produktkategorie
Jahr Bezirk

Gesamtbetrag, Gesamtwert und Produktkosten sind


vollkommen additiv.
AnzahlKunden ist semi-additiv.
Bibliographie

1. Irina Pugna – Note de curs SIAD, CIG, ASE, Bucuresti, 2014


2. Svetlana Mansmann, Prof. Dr. Marc H. Scholl, 2008,
“Modellierungsansätze”, Universität Konstanz, online at
http://www.inf.uni-konstanz.de
3. Prof. Dr.-Ing. Kai-Uwe Sattler, Prof. Dr. Gunter Saake, Dr. Veit
Köppen, 2011, “Multidimensionales Datenmodell”, Universität
Magdeburg, Institut für Technische und Betriebliche
Informationssysteme, online at http://wwwiti.cs.uni-magdeburg.de/
4. Gabriel Roland, Gluchowski Peter: Semantische
Modellierungstechniken für multidimensionale Datenstrukturen, HMD
195/1997
5. Michael Hartung (2011), “Data Warehousing Kapitel 3:
Mehrdimensionale Datenmodellierung und Operationen“, Universität
Leipzig Institut für Informatik, online at http://dbs.uni-
leipzig.de/file/dwh_ss11_kap3.pdf
Um ein Data Warehouse auf Basis einer Datenbank relationaler Struktur der
gespeicherten Verkaufsdaten zu entwerfen:

KUNDE (KundenID, Kundenname, Ort, Region, Kundenkategorie,


Kundenunterkategorie)
RECHNUNG (RechnungNr, Rechnungsdatum, KundenID, Rabatt, MwSt)
RECHNUNGSZEILEN (Rechnungsnr, Dienstcode, Menge, Preis)
DIENST (Dienstcode, Dienstname, Dienstkategorie, Dienstunterkategorie,
Dienstklasset, Dienstunterklasse)

a) Identifikation von Dimensionen und Kennzahlen.

Die vorgeschlagene Lösung:

Dimension DKUNDE (KundeID, Kundenname, Ort, Region, Kundenkategorie,


Kundenunterkategorie)
Dimension DDIENST (Dienstcode, Dienstname, Dienstkategorie, Dienstunterkategorie,
Dienstklasse, Dienstunterklasse)
Dimension DZEIT (IDZeit, Rechnungsdatum, Monat, Quartal, Semester, Jahr, Saison)

Mögliche Kennzahlen zu erhalten – Sumof Menge, Sumof Wert, Sumof Total Rabatt,
Sumof Total MwSt, Sumof Gesamtwertert MwSt, Gesamtwert Rabatt
Die Berechnungen sind:
Wert=Sum(Menge*Preis)
Gesamtrabatt=Sum(Menge*Preis*Rabatt)
Gesamt MwSt=Sum(Menge*Preis*MwSt)
Gesamtwert mit MwSt=Sum(Menge*Preis*(1+MwSt))
Gesamtwert mit Rabatt=SUM(Menge*Preis-Menge*Preis*Rabatt)

Tabelle Fakten ABRECHNUNG (KundeID, DienstCode, IDZeit, Sumof Menge, Sumof


Wert, Sumof Gesamtrabatt, Sumof Gesamt MwSt, Sumof Gesamtwert mit MwSt,
Gesamtwert mit Rabatt)
b) Identifizierung von alternativen Hierarchien

Dimension Dkunde

Hierarchie Region Hierarchie Kategorie


Region Kundenkategorie
Ort Kundenunterkategorie
KundenID KundenID

Dimension Dzeit

Hierarchie Kalender Hierarchie Saison


Jahr Saison
Semester Monat
Quartal Rechnungsdatum
Monat
Rechnungsdatum

Dimension DDIENST

Hierarchie Kategorie Hierarchie Klasse


Dienstkategorie Dienstklasse
Dienstunterkategorie Dienstunterklasse
Dienstcode Dienstcode
c) Konzeptuelles Modell des Datenlagers - Sternmodell

Oder
Schneeflockenmodell

i.Entwerfen Sie OLAP Würfel zum Markieren des gesamten Verkaufswerts fuer jeden
Kunden, Monat und Dienstleistunsgskategorien im Jahr 2009

Die vorgeschlagene Lösung:

Der OLAP Wuerfel ist eine virtuelle Tridimensionelle Darstellung einer Abfrage an das
Ladenlager mit drei Dimensionen: Zeit (dargestellt durch Monat und Jahr), Kunde (durch
Kundennamen dargestellt) und durch Kategorie Dienst (in einer Kategorie von Dienst sind
mehrere Dienstleistungen inbegriffen).
Die Kennzahl wird auf die drei Dimensionen berechnet und angezeigt und wird durch
den Gesamtverkaufswert (SumofWert) dargestellt. Stellen Sie sich den Gesamtwert in
jedem Monat des Kalenderjahrs 2009 von Geschäftskunden des Supermarkts Carrefour
vor, fuer verschiedene Kategorien von Dienstleistungen (Zahlungen - Bargeld / Karten /
Gutscheine, Versicherung, Bezahlung von Rechnungen, kostenlose Lieferung nach
Hause
Aufgabe

Es wird folgende relationale Datenbank gegeben:

WARE(W_Code, W_Name, Masseinheit, W_Kategorie, W_Unterkategorie, Marke)

LIEFERANT(LieferantCode, Lieferantenname, Ort, Land, Tel, Lieferantklasse)

LIEFERWEISE(Lieferweise_ID, Benennung, Verkehrsmittel)

BESTELLUNG(Bestellung_Nr, B_Datum, Lieferdatum, Lieferweise_ID, LieferantCode)

BESTELLTE WARE(Bestellung_Nr, W_Code, Menge, Preis, Transportkost)

Erstellen Sie das betreffende konzeptuelle Modell des Datenlagers (Data Warehouse).
Lösung
Die Datenanalyse kann aus verschiedenen Perspektiven (Dimensionen)
durchgeführt werden.
In Tabelle Bestellung Attributten B_Datum und Lieferdatum identifizieren.
Deshalb können wir eine Zeitdimension identifizieren. Die Zeitdimension
wird durch eine ID identifiziert und können verschiedene Hierarchien
enthalten je nachdem, wie detailliert wir wollen Analyse zu tun.

Dimension ZEIT: ZeitID, Tag, Monat, Trimester, Saison, Semester,


Jahr

Dimension WARE: WareID, W_Kategorie, W_Unterkategorie, Marke

Dimension LIEFERANT: LieferatCode, Lieferantname,


Lieferantenklasse, Ort, Land

Dimension LIEFERWEISE: Lieferweise_ID, Transportweise,


Verkehrsmittel
Die Faktentabelle enthält die Fakten. Die Fakten sind diejenigen
quantitativen Werte fuer welche die Aggregation Sinn hat.

In unserem Beispiel können wir die folgenden Kennzahlen


berechnen:

• Gesamte Anzahl Transaktionen (CountOfBestellung_Nr)


• Gesamtbestelltmenge (SumOfMenge)
• Gesamttransportkosten (SumOfTransportKost)
• Bestellungsgesamtwert (Sum(Menge*Preis))

Für jede Kennzahl koennen die Operation und die Funktion,die


man verwendet, angezeigt werden z.B. fuer Gesamtbestelltmenge
ist SumOfMenge.
Aufgrund dieses Schrittes erhält man folgendes Datenlagermodell
(Schneeflockenmodell):
Dimension Dimension
ZEIT WARE
Fakttabelle
Zeit_id BESTELLUNGEN WareID
Tag 1 1 Warename
Monat Zeit_id W_Kategorie
Trimester * * W_Unterkategorie
WareID
Saison Lieferantcode Marke
Semester Lieferweise_ID *
Jahr * Anzahl Bestellungen Dimension
Gesamtbestelltmenge LIEFERWEISE
Dimension Gesamttransportkosten
Bestellungsgesamtwert Lieferweise_ID
LIEFERANT 1 Transportweise
Lieferantcode Verkehrsmittel
1
Lieferantname
Lieferantenklasse
OrtID

*
Dimension Dimension
ORT LAND
1 1
OrtID Land_ID
Ortname Landname
*
Land_ID
Big Data

Vorlesung 4
Wie werden die Daten gespeichert?

Traditionelle Datawarehouse
DMBS OLAP
OLTP

NoSQL
Traditionelle Datenbank
Traditionelle
DMBS
OLTP

(Quelle: Selle, 2016)


Data Warehouse
Datawarehouse
OLAP

(Quelle: Selle, 2016)


In Memory Datenbank

(Quelle: Selle, 2016)


NoSQL Datenbank

(Quelle: Selle, 2016)


Was ist Big Data?
• Bislang fehlt eine allgemeingültige, klare Definition von Big Data.
• Generell kann Big Data als jedes Dataset definiert werden, welches die
Grenzen und Möglichkeiten der konventionellen IT übersteigt.
• Big Data handelt von allem, was mit herkömmlicher Technologie aufgrund
der Größe der Daten nicht mehr funktioniert, d. h. etwa große
Datenmengen zu erfassen, zu speichern, zu durchsuchen, zu verteilen, zu
analysieren und zu visualisieren.
• Standard-Datenbanken und -Tools haben zunehmend Probleme, mit der
steigenden Flut an Daten fertig zu werden:
• Relative Datenbanken scheitern am Volumen,
• ETL-Prozesse sind zu langsam und haben Schwierigkeiten mit den vielfältigen
Datenformaten,
• die traditionelle BI ist daher zu langsam und kann die Massen an unstrukturierten
Daten nicht mehr effektiv verarbeiten.
Was ist Big Data?
• Der aus dem englischen Sprachraum stammende Begriff Big
Data (von englisch big ‚groß‘ und data ‚Daten‘) bezeichnet Datenmengen, welche
• zu groß,
• zu komplex,
• zu schnelllebig oder
• zu schwach strukturiert
sind, um sie mit manuellen und herkömmlichen Methoden
der Datenverarbeitung auszuwerten.[1]
• Im deutschsprachigen Raum ist der traditionellere
Begriff Massendaten gebräuchlich.
• „Big Data“ wird häufig als Sammelbegriff für digitale Technologien verwendet, die
in technischer Hinsicht für eine neue Ära digitaler Kommunikation und
Verarbeitung und in sozialer Hinsicht für einen gesellschaftlichen Umbruch
verantwortlich gemacht werden.[2]
Definition von Big Data
• Der Branchenanalyst Doug Laney (derzeit bei Gartner) hat bereits 2001 die heute anerkannte
Definition von Big Data als die drei Vs Volume, Velocity und Variety (Volumen, Geschwindigkeit
und Vielfalt) formuliert1.
• Volume. Viele Faktoren tragen zum wachsenden Datenvolumen bei. Über die Jahre gespeicherte
Transaktionsdaten. Unstrukturierte Datenströme aus sozialen Medien. Wachsende Mengen erfasster Sensor-
und Machine-to-Machine-Daten. In der Vergangenheit waren übermäßige Datenmengen vor allem ein
Speicherproblem. Mit sinkenden Speicherkosten treten andere Probleme in den Vordergrund, wie die
Bestimmung der Relevanz in großen Datenmengen und die Nutzung von Analysen zur Wertschöpfung aus
relevanten Daten.
• Velocity. Die Datenströme bewegen sich in nie da gewesener Geschwindigkeit und müssen zeitnah verarbeitet
werden. RFID-Tags, Sensoren und Smart Metering sorgen dafür, dass riesige Datenströme nahezu in Echtzeit
verarbeitet werden müssen. Schnell genug reagieren zu können, um der Datengeschwindigkeit gerecht zu
werden, stellt für die meisten Unternehmen eine Herausforderung dar.
• Variety. Die Daten fallen heute in unterschiedlichsten Formaten an. Strukturierte, numerische Daten in
traditionellen Datenbanken, aus Branchenanwendungen erstellte Daten, unstrukturierte Textdokumente, E-
Mail, Video, Audio, Börsentickerdaten und Finanztransaktionen. Das Verwalten, Verbinden und Beherrschen
der unterschiedlichen Daten stellt für viele Unternehmen noch immer ein Problem dar.
Was ist Big Data Analytics?

• Big Data ist vor allem für den Bereich der Business Intelligence (BI) relevant,
welcher sich mit der Analyse von Daten (Erfassung, Auswertung, Darstellung)
befasst.
• Big Data Analytics beschreibt die systematische Auswertung/Analyse großer
Datenmengen mit Hilfe neu entwickelter Software.
• Big Data Software umfasst im Gegesatz zu herkömmlichen Software Lösungen
besondere Funktionen und Techniken, die die parallele Verarbeitung vieler Daten
ermöglicht.
• Verarbeitung vieler Datensätze
• schneller Import von Daten
• schnelle Suche und Abfrage von Daten
• gleichzeitige Bearbeitung mehrerer Abfragen
• Analyse unterschiedlicher Informationstypen
BI / Big Data in einer integrierten Anwendungslandschaft
Literaturhinweise
• META Group, "3D Data Management: Controlling Data Volume, Velocity, and
Variety." Februar 2001.
• W. Christl: Kommerzielle digitale Überwachung im Alltag. PDF,
auf: crackedlabs.org, November 2014, S. 12.
• R. Reichert: Big Data: Analysen zum digitalen Wandel von Wissen, Macht und
Ökonomie. transcript Verlag, Bielefeld 2014, S. 9.
• Prof. Dr. Stefan Selle, Data Analytics Wie sich Daten sinnvoll nutzen lassen, 2016
http://ikt.saarland/fileadmin/saaris/medien/PDF_Vortraege/IKT/22.02.2016/Data
_Analytics_20160222_final.pdf
• https://www.sas.com/de_at/insights/big-data/test-rss-what-is-big-data.html
• http://www.softselect.de/wissenspool/big-data
• https://wr.informatik.uni-
hamburg.de/_media/teaching/wintersemester_2015_2016/bd-1516-
einfuehrung.pdf

Das könnte Ihnen auch gefallen