Sie sind auf Seite 1von 24

Grundlagen von OLAP

Prof. Dr. Norbert Ketterer - HS Fulda

OLTP vs. OLAP


Was sind die unterschiedlichen Charakteristika unter den Aspekten:

Anfragen wie wird auf die Systeme zugegriffen? Daten was sind die Quellen& die Eigenschaften der Daten? Anwender was ist der typische Anwender?

Prof. Dr. Norbert Ketterer - HS Fulda

OLTP vs. OLAP - Anfragen


Fokussierung von operativen Systemen auf viele meist schnelle Lese- und Schreibvorgnge Dabei werden eher wenige Datenstze zeitgleich adressiert

Wir haben eine relativ einfache Anfragestruktur (einige SQL-Statements zum Insert/ Update und Lesen der DB)

Analytische Systeme hingegen verlangen zeitlich aufwndigere Transaktionen da meist komplexe Anfragen aus der Gesamtmenge an Datenstzen bewltigt werden mssen

Es handelt sich hauptschlich um Lesetransaktionen

[GOM06] Bemerkung: wir werden feststellen, dass im SAP-BI die Datenstrukturen fr umfangreiche Anfragen optimiert sind
Prof. Dr. Norbert Ketterer - HS Fulda

OLTP vs. OLAP - Daten


Operative Systeme beziehen ihre Daten meist nur aus einer einzigen Datenquelle Daten liegen in einer sehr dynamischen Form vor Analytische Systeme knnen ihrer Aufgabe berhaupt erst durch die Integration der Daten aus mehreren Datenquellen gerecht werden Daten liegen abgeleitet und konsolidiert vor

[GOM06]

Prof. Dr. Norbert Ketterer - HS Fulda

OLTP vs. OLAP - Anwender


Operative Systeme werden eher durch Sachbearbeiter bedient, die damit beschftigt sind, Daten zu erfassen oder abzufragen Der typische Anwender eines analytischen Systems ist meist ein Entscheidungstrger, Controller oder Analyst eines Unternehmens

[GOM06]

Prof. Dr. Norbert Ketterer - HS Fulda

OLAP und Multidimensionalitt


Zentrales Charakteristikum von OLAP ist Multidimensionalitt Multidimensionalitt entspricht einer natrlichen Sichtweise auf die Welt diese Sichtweise besteht auch bei den Anwendern des OLAP Beispiel aus unserem Leben: Der Wochenendeinkauf

Dimension Preis -> Summe war 120 Euro; wir knnen dies aber auch detaillieren nach 50 Euro bei Lidl, 30 Euro bei Aldi, 20 Euro bei tegut und 20 Euro bei sonstigen Dimension Ware -> 30% Fleisch, 40% Gemse, 10% Tiernahrung (fr das Haustier !), 20% Getrnke; wir knnen dies aber auch detaillieren nach 20% Wurst und Schinken, 10% Hhnerbrste, 10% Kartoffeln, etc Dimension Nhrstoffe -> 30% Eiwei, 40% Kohlenhydrate, etc; wir knnten dies auch detaillieren speziell durch Kreuzung der Dimensionen: etwa von den 30% Eiwei werden 80% durch Fleisch und der Rest durch Getrnke (Milch, etc. ) abgedeckt, etc.

Prof. Dr. Norbert Ketterer - HS Fulda

OLAP/ Multidimensionalitt

Multidimensionalitt wird im BWServer durch spezielle InfoProvider (sog. Info-Cubes) realisiert. Neben Info-Cubes existieren weitere Typen von Info-Providern.

[JON08]

Prof. Dr. Norbert Ketterer - HS Fulda

Multidimensionalitt im betrieblichen Umfeld


Betriebswirtschaftliche Variablen bzw. Kennzahlen (etwa: Umstze, Kosten, Prognosen, Verkufe) werden entlang unterschiedlicher Dimensionen (wie z.B. Kunden, Artikel, Regionen) angeordnet. Bildlich gesprochen entspricht diese Anordnung mehrdimensionalen Wrfeln, deren Kanten durch einzelne Dimensionen reprsentiert werden i.d.R. exisitert auch immer noch die Dimension der Zeit im Wrfel Das Ziel von OLAP besteht darin, dass die Anwender flexible komplexe Auswertungen mit geringem Zeitaufwand eigenstndig durchfhren knnen
Bsp fr Multidimensionalitt:

Artikel xy Region ab Kunden cd .... + MM.YYYY

Artikel

Regionen Kunden [HA04] Prof. Dr. Norbert Ketterer - HS Fulda

Die 12 Regeln von OLAP


1.

2. 3. 4. 5.

Definiert von Codd, Codd und Sally als Anforderung an OLAP [HA04]: Multidimensionale Sicht auf Daten dies ermglicht eine Navigation in den Datenwrfeln mit beliebigen Projektionen, Verdichtungen und Detaillierungen Transparenz nahtlose Integration in Benutzerumgebungen Offene Architektur Zugriffsmglichkeiten auf heterogene Datenbasen; Einbindung in logische Gesamtsicht Ein gleichbleibendes Antwortverhalten selbst bei vielen Dimensionen und groen Datenvolumina Client-Server-Architektur - ermglicht verteilte Datenhaltung und verteile Programmausfhrung

Prof. Dr. Norbert Ketterer - HS Fulda

Die 12 Regeln von OLAP Teil 2


6. 7.

8. 9. 10. 11. 12.

Generische Multidimensionalitt alle Dimensionen stimmen in Ihren Verwendungsmglichkeiten berein (Anmerkung: bis auf die Zeit) Dynamische Haltung Betriebswirtschaftliche Modelle sind oft gering besetzt (hnlich einer dnn besetzten Matrix in der Mathematik) -> warum ist dies so ? Die Handhabung dnn besetzter Wrfel ist wichtig fr OLAP, da sonst Speicheranforderung zu hoch Mehrbenutzerfhigkeit gleichzeitiger Zugriff von Benutzern auf Analysebestnde, verbunden mit Sicherungs- und Berechtigungskonzepten Kennzahlberechnung und Konsolidierung unbeschrnkte dimensionsbergreifende Operationen innerhalb einer Datenmanipulationssprache Ergonomische Benutzerfhrung ermglicht intuitive Datenmanipulation und Navigation (dies betrifft auch das Laden) Flexibles Berichtswesen die Mehrdimensionalitt soll ein leichtes und flexibles Berichtswesen ermglichen Anzahl Dimensionen und Aggregationsebenen es soll eine unbegrenzte Anzahl von Dimensionen und Aggregationsebenen existieren (FRAGE: was knnte eine Aggregationsebene sein ?)

10

Prof. Dr. Norbert Ketterer - HS Fulda

Fakten, Kennzahlen und Merkmale


Geschftsdaten in einem Data Warehouse werden in Fakten, Kennzahlen und Merkmale unterteilt [GOM06] Fakten: Fakten sind numerische Messgren, die betriebliche Sachverhalte beschreiben.

Fakten werden hufig auch als Basiskennzahlen bezeichnet, da aus ihnen durch arithmetische Operationen Kennzahlen abgeleitet werden

In SAP-BI werden Fakten in Info-Objekten des Typs Kennzahl abgelegt.


11
Prof. Dr. Norbert Ketterer - HS Fulda

Fakten, Kennzahlen und Merkmale


Kennzahlen: Kennzahlen sind Fakten oder aus Fakten abgeleitete Gren. Sie haben informativen Charakter und dienen dazu, durch systematisches Vergleichen Ursachen und Trends ableiten zu knnen.

Umsatz und Kosten knnen als Fakten gelten, aus denen die Kennzahl Gewinn berechnet wird. Kennzahlen erhalten jedoch erst durch die Zuordnung weiterer, beschreibender Merkmale eine Aussagekraft.

In SAP-BI werden Fakten in Info-Objekten des Typs Kennzahl abgelegt oder in Auswertungen aus Basiskennzahlen berechnet
12
Prof. Dr. Norbert Ketterer - HS Fulda

Fakten, Kennzahlen und Merkmale


Merkmale: Merkmale sind betriebswirtschaftliche Bezugsgren, nach denen eine sinnvolle Gruppierung von Kennzahlen mglich ist.

Kunden, Produkte, Regionen sind Beispiele fr mgliche Merkmale die Dimensionen des Wrfels werden aus Merkmalen aufgebaut diese Merkmale knnen in einer Hierarchie angeordnet sein Ein spezifisches Merkmal, welches oft eine besondere Bercksichtigung im DW bedarf ist das Merkmal Zeit

Beispiel: Umsatz in Hessen fr April 2010 in der Sparte Haushaltsprodukte -> was sind Merkmale, was sind Kennzahlen ?

13

Prof. Dr. Norbert Ketterer - HS Fulda

OLAP-Operationen
Es existiert eine Vielzahl von Anfrageoperationen, die auf multidimensionalen Datenstrukturen zur Datenanalyse verwendet werden knnen Da die Anfrageoperationen der Untersttzung des OLAP-Konzepts dienen, werden sie auch als OLAPOperationen bezeichnet Die grundlegendsten OLAP-Operationen werden anhand einer Hochschule vorgestellt (Beispiel aus [GOM06])
14
Prof. Dr. Norbert Ketterer - HS Fulda

Der Datenwrfel
Der Datenwrfel enthlt Information ber Studentenzahlen Dimensionen werden hier nur durch wenige Merkmale reprsentiert

Studienfach - SOZ (Soziologie), EuWi (Europische Wirtschaft), VWL (Volkswirtschafslehre), BWL (Betriebswirtschaftslehre) und WI (Wirtschaftsinformatik) -> die Fcher knnen aber zu SOWI zusammengefasst werden Studienabschnitt - GS (Grundstudium) und HS (Hauptstudium) Zeit - Dimension Zeit enthlt die einzelnen Semester

15

[GOM06]

Prof. Dr. Norbert Ketterer - HS Fulda

OLAP-Operation Rotate
Rotate: Um verschiedene Sichten auf den betrachteten Datenbestand zu erhalten, wird der Datenwrfel durch diese Operation gedreht. Dieses Vertauschen der Dimensionen wird im Deutschen auch als Pivotierung oder Rotation bezeichnet

[GOM06]
16
Prof. Dr. Norbert Ketterer - HS Fulda

OLAP-Operation Drill-Down
Drill-Down: Erlaubt das Durchlaufen von Verdichtungsebenen innerhalb einer Dimensionshierarchie, indem von einem bestimmten Aggregationsniveau auf die nchsttiefere und damit detailliertere Verdichtungsstufe gestiegen wird

[GOM06]
17
Prof. Dr. Norbert Ketterer - HS Fulda

OLAP-Operation Roll-Up
Roll-Up: Komplementr zum Drill-Down ermglicht diese Operation den Wechsel eines Aggregationsniveaus zur jeweils hheren Verdichtungsebene innerhalb einer Dimensionshierarchie

[GOM06]
18
Prof. Dr. Norbert Ketterer - HS Fulda

OLAP-Operation Slice
Slice: Bei einem dreidimensionalen Datenwrfel bewirkt diese Operation das Herausschneiden einer Scheibe aus dem Datenbestand, woraus sich eine zweidimensionale Matrix ergibt. Es werden also individuelle Sichten erzeugt und die Dimensionalitt verringert

[GOM06]
19
Prof. Dr. Norbert Ketterer - HS Fulda

OLAP-Operation Dice
Dice: Durch diese Operation knnen einzelne Teilwrfel aus dem gesamten Hypercube extrahiert werden. Die Anzahl der Dimensionen bleibt erhalten, whrend sich jedoch die Hierarchie einzelner Dimensionen verndern kann

[GOM06]
20
Prof. Dr. Norbert Ketterer - HS Fulda

OLAP-Operation Drill-Across
Drill-Across: Ermglicht den Wechsel zwischen Datenwrfeln, um beispielsweise eine Kennzahl ber mehrere Wrfel zu verfolgen, wenn Ist- und Soll-Daten in separaten Wrfeln gehalten werden. Wichtig ist hierbei, dass die Dimensionen der verwendeten Wrfel die gleiche Granularitt aufweisen In SAP: vertauschen der Merkmale zwischen den Drill-Down-Pfaden

21

Prof. Dr. Norbert Ketterer - HS Fulda

OLAP-Operation Drill-Through
Drill-Through: Ist im Zuge der Operation Drill-Down die hchste Detaillierungsstufe erreicht, kann die physische Datenquelle durch diese Operation gewechselt werden, um noch detaillierte Daten zur Verfgung stellen zu knnen. Dieser Rckgriff kann sowohl andere relationale Quellen (z.B. operative Basisdaten), als auch weitere Datenwrfel umfassen und sollte findet fr den Nutzer unbemerkt stattfinden

22

Prof. Dr. Norbert Ketterer - HS Fulda

bung: OLAP-Operationen am Beispielcube


Wir fhren nun OLAP-Operationen in einem Beispielcube durch, um einige Fragen zu beantworten wir begeben uns also auf die Anwendersicht. Der Cube hat den Namen: WD_SD_C03 Bevor Sie sich auf die Anwendersicht begeben, beantworten Sie bitte die folgenden Fragen:

Welche Kennzahlen reprsentiert der Cube? Welche Merkmale besitzt der Cube? An welches Objekt gibt der Cube Daten weiter? Von welchem Objekt erhlt der Cube Daten? In dieser Transaktion verzweigen Sie ins Meta-Data-Repository (via Druckbuttons links) Hier verwenden Sie idealerweise die Suchfunktion zur Auffindung des Cubes Es kann sein, dass die Suche etwas langwierig ist . Sie drfen parallel im Internet surfen aber nur auf dieser Seite dabei drfen Sie auch die Fragen der nchsten Seite beantworten:
http://g92as1.informatik.tumuenchen.de:50100/irj/servlet/prt/portal/prtroot/pcd!3aportal_content!2fcom.sap.pct!2fplatform_add_ons!2fcom.sap.ip.bi!2fiViews!2fco m.sap.ip.bi.bex?QUERY=W_BACHELOR_DEMO_1&VARIABLE_SCREEN=X&DUMMY=1

Um diese vorherigen Fragen beantworten zu knnen, gehen Sie am Besten in die Workbench.

23

Prof. Dr. Norbert Ketterer - HS Fulda

bung: OLAP-Operationen cont.


Fhren Sie einige OLAP-Operation ber das WEB-Interface an dem Cube aus Versuchen Sie, die folgenden Fragen zu beantworten geben Sie auch die Sequenz (inklusive Typ) der OLAP-Operationen an, die hierfr notwendig waren. Wenn Sie verwirrt sind, knnen Sie der Einfachheit halber noch einmal ber den Link neu einsteigen!

Wie viel offene Auftrge (in Euro) bestehen noch fr den NB Speedy II? Wie viel offene Auftrge (in Euro) bestehen noch fr alle Produkte, wenn wir uns auf die Verkaufsorganisationen Hamburg und London konzentrieren ? Was ist der Gesamtwert an offenen Auftrgen fr alle Produkte? Ist dieser Gesamtwert in Kanada hher als in Australien? Ihr Manager mchte eine bersicht der Korrelation des Landes mit dem Vertriebsweg haben (bezglich des offenen Auftragswertes). Eine Korrelationsmatrix hat zwei Dimensionen, wie erzeugen Sie dies? ber welche Sparten werden unsere Produkte vertrieben?
Was sind die offenen Auftragswerte in jeder Sparte? Zu welcher Sparte gehrt unser NB Speedy II?

Erzeugen Sie eine Grafik aller offenen Auftrge pro Vertriebsorganisation was ist das Wahrzeichen der Stadt, dessen Vertriebsorganisation besonders negativ auffllt?

24

Prof. Dr. Norbert Ketterer - HS Fulda