Vorlesungsskript
Klausurumfang
BA-Mosbach
Dozent: Günter Drews
v4.2
Das Vorlesungsmanuskript ist nur für den Gebrauch innerhalb der Vorlesung zu verwenden
und darf nicht weiter gegeben oder gesamt oder in Teilen veröffentlicht werden.
1 EINFÜHRUNG.............................................................................................................................. 4
1.1 Ziele der Vorlesung .......................................................................................................4
1.2 Vorgehensweise ............................................................................................................5
2 WARENWIRTSCHAFT .............................................................................................................. 6
2.1 Begriff der Warenwirtschaft: ..........................................................................................6
2.2 Prozesse in der Warenwirtschaft...................................................................................6
2.2.1 Begriff des Prozesses....................................................................................................... 6
2.2.2 Prozessbeschreibungen ................................................................................................... 8
2.2.3 Das H-Modell bei Prozessen der Warenwirtschaft ....................................................... 10
3 WARENWIRTSCHAFTSSYSTEME ....................................................................................... 13
3.1 Operative und analytische Systeme ............................................................................13
3.2 Klassifikation und Umfang von Warenwirtschaftssysteme ..........................................16
3.2.1 Abgrenzung zu ERP-Systemen....................................................................................... 16
3.2.2 Klassifikation der Warenwirtschaftssysteme ................................................................. 16
3.2.3 Zentrale und Filial-Warenwirtschaftssysteme............................................................... 17
3.3 Technologische und organisatorische Basis ...............................................................19
3.3.1 Basis-Informationen ...................................................................................................... 19
3.3.2 Marktposition ................................................................................................................ 20
3.3.3 DV-Kriterien.................................................................................................................. 21
3.3.4 Bedienungsaspekte ........................................................................................................ 22
3.3.5 Organisationsstrukturen................................................................................................ 22
3.3.6 Filialmanagement.......................................................................................................... 23
3.3.7 Führungsinformation..................................................................................................... 23
3.3.8 Datenaustausch ............................................................................................................. 24
3.4 Die Datenbasis: Stammdaten und Transaktionsdaten ................................................25
3.4.1 Stammdaten ................................................................................................................... 25
3.4.2 Die EAN......................................................................................................................... 26
3.4.3 Klassifizierungen ........................................................................................................... 29
3.4.4 Weitere standardisierte Kennzeichen ............................................................................ 31
3.4.5 Bewegungsdaten ............................................................................................................ 34
3.5 Die Prozesse ...............................................................................................................35
3.5.1 Der Beschaffungsprozess............................................................................................... 35
3.5.2 Das Lager ...................................................................................................................... 41
3.5.3 Der Distributionsprozess............................................................................................... 42
3.6 Der Softwareauswahlprozess......................................................................................45
3.7 Der Softwareeinführungsprozess ................................................................................46
3.7.1 Die Herausforderung .................................................................................................... 46
3.7.2 Einführungsstrategien ................................................................................................... 46
3.7.3 Einführungsmodelle....................................................................................................... 46
3.7.4 Das Key-User Konzept .................................................................................................. 48
4 DATA WAREHOUSE IN DER WARENWIRTSCHAFT ...................................................... 49
4.1 Problemstellung...........................................................................................................49
4.1.1 Motivation ..................................................................................................................... 49
4.1.2 Wo drückt der Schuh: Grenzen der traditionellen Entscheidungsunterstützung........... 51
4.1.3 Geforderte Lösung......................................................................................................... 52
4.2 Aufbau eines Data Warehouse....................................................................................53
4.3 OLAP ...........................................................................................................................55
4.3.1 Das Datenmodell ........................................................................................................... 55
4.3.2 Kennzahlen (Fakten) ..................................................................................................... 56
4.3.3 Dimensionen .................................................................................................................. 62
People
Technology Process
Quelle: Ernst&Young
Analysen und auch konkrete Projekte haben in Organisationen immer drei Dimensionen:
• eine menschliche Dimension
• eine technische Dimension
• und eine organisatorische Dimension
Warenwirtschaft umfasst die Planungs- Steuerungs- und Kontrollprozesse für den gesamten
Warenfluss, vom Einkauf bis zum Verkauf, in Handels- und Produktionsbetrieben in mengen-
und wertmäßiger Hinsicht
Alle (einplanenden und ausführenden)Tätigkeiten, die in irgendeiner Weise mit Mengen-
Veränderungen zu tun haben
Eines der bekanntesten Prozessmodelle einer Unternehmung ist das Modell der
Wertschöpfungskette nach Porter
„Innerhalb des Prozesses erfolgt durch die Kombination der Einsatzgüter ein definierter
Wertzuwachs, der als Prozessergebnis weitergeleitet wird. Dieser Wertzuwachs (oder
Wertschöpfung) ist die Differenz zwischen dem Wert des Output (Marktpreis oder interner
Verrechnungspreis) und dem Wert des Input (Kosten der Wertschöpfungsaktivitäten) und
bildet letztendlich die vom Unternehmen erzielte Gewinnspanne. „Wert“ kann demgemäss
als derjenige Geldbetrag definiert werden, den ein interner oder ein externer Kunde zu
zahlen bereit ist. Aus diesem Wert heraus entstehen Wettbewerbsvorteile (Kostenvorteile),
wenn er die Kosten der Wertschöpfung übersteigt. (....)
Mit seine Wertkettenmodell stellt der amerikanische Wirtschaftswissenschaftler Porter
ein "analytisches Instrument“ vor, mit dessen Hilfe sämtliche Aktivitäten eines Unternehmens
und deren Wechselwirkungen systematisch untersucht werden können (.......).
Die Wertkette (value chain) gliedert ein Unternehmen in strategisch bedeutsame
Aktivitäten. Sie zeigt den Gesamtwert und besteht aus den wertschöpfenden Aktivitäten
("Wertaktivitäten“ nach Porter) und der Gewinnspanne. Wenn ein Unternehmen die
verschiedenen Aktivitäten besser und/oder zu geringeren Kosten durchführen kann als
konkurrierende Unternehmen, entstehen Wettbewerbsvorteile. Die Wertaktivitäten lassen
sich in primäre und sekundäre (unterstützende) Aktivitäten unterteilen, die je nach Branche
für den Wettbewerbsvorteil von entscheidender Bedeutung sein können (....)
• Die primären Aktivitäten beinhalten die physische Herstellung und den Vertrieb des
Produkts. Porter unterscheidet hier fünf Kategorien: die Eingangslogistik (Empfang,
Lagerhaltung und Distribution von Betriebsmitteln und Material), die Operationen (Be-
und Verarbeitung des Inputs), den Bereich Marketing und Vertrieb (Einsatz der
Marketinginstrumente, um die potentiellen Kunden zum Kauf des Produkts zu bewegen),
die Ausgangslogistik (Sammlung, Lagerung und physische Distribution des Produkts an
die Abnehmer) und den Kundendienst (Installation, Reparatur, Ersatzteilversorgung und
Produktanpassung).
• Demgegenüber sorgen die sekundären Aktivitäten dafür, dass die primären Tätigkeiten
überhaupt stattfinden können, indem sie die erforderlichen Inputs (Technologien,
2
Michael Hammer, James Champy:Business Reengineering. Eine Radikalkur für das Unternehmen.
München 1999. S.14.
2.2.2 Prozessbeschreibungen
Der VDMA gibt in seiner Broschüre Prozesse beschleunigen und gewinnorientiert steuern4
Folgende 12 Regeln zur Beschreibung eines Prozesses:
1. Prozess Identifikation
a. Wie wird dieser Prozess bezeichnet
b. Wo beginnt der Prozess und wo endet er?
2. Prozess Eigner
a. Wer ist für die Beschreibung und die Weiterentwicklung des Prozesses
verantwortlich?
3. Prozess Beteiligte
a. Wer übernimmt eine Aufgabe in diesem Prozess?
b. Welche Funktion hat diese Person?
4. Prozess Ziel
a. Was ist die Aufgabe dieses Prozesses?
b. Welcher Nutzen hat dieser Prozess für den Kunden und das Unternehmen?
c. Wie können die Ziele gemessen und verfolgt werden.
5. Kunde (intern/extern)
a. Wer profitiert von den Ergebnissen (Dies können sein: Verantwortliche eines
Folgeprozesses, ein Folgeprozess an sich, der Gesetzgeber, der Käufer,
Benutzer, Anwender eines Produktes
6. Prozess Eingaben
a. Was löst den Prozess aus?
b. Was wird vom Prozess benötigt um ihn erfolgreich durchführen zu können? (Das
kann sein: Informationen, Dokumente, Produkte, festgelegte Zyklen)
7. Prozess Regelungen
a. Welche Vorgaben und Regeln gibt es für den Prozess? (Verfahren, Anweisungen,
Richtlinien, Methoden, Kriterien)
b. Welchen Einfluss haben diese Regeln auf den Prozess?
8. Prozess Ergebnis
a. Was ist das Ergebnis des Prozessablaufs? (Dies kann ein Produkt, eine
Dienstleistung, eine Entscheidung sein)
b. Wie wird das Ergebnis geprüft?
9. Nachweise und Dokumentation
a. Welche Dokumente und Aufzeichnungen werden für den Prozess benötigt?
b. Welche Dokumente und Aufzeichnungen werden von dem Prozess erzeugt?
10. Kennzahlen zur Steuerung
a. Mit welchen Kenngrößen wird der Prozess gesteuert? (Dies sind klassischerweise
Termin, Kosten- oder Zeitgrößen)
11. Wechselwirkung
a. Welche anderen Prozesse haben Einfluss auf diesen Prozess?
b. Welche Prozesse werden von diesem Prozess beeinflusst?
12. Prozess Lieferant
3 3
Dietmar Vahs: Organisation. Einführung in die Organisatonstheorie und –praxis. Stuttgart 2001. S.
194 ff.
4
VDMA (Hrsg):Prozesse beschleunigen und gewinnorientiert steuern. Frankfurt a. M 2002 (VDMA-
Verlag) S. 22 ff.
Modellübersicht
Lagerprozess
Dienstleistungs
Streckenprozess
prozess
Aktionsprozess Zentralregulierungsprozess
Lagerprozesse
5
Das H-Modell stammt aus Becker,Schütte: Handelsinformationssysteme. 2. Aufl. Landsberg/Lech
2004.
Die nachfolgenden Folien, die sich auf das H-Modell beziehen sind entnommen aus:http://www.wi.uni-
muenster.de/is/projekte/handels-h-modell/lager/index.cfm abgerufen am 30.11.2005: Lehrstuhl für WI
und IM: Prof. Dr. Jörg Becker, Das Handels-H-Modell.
Das WI-Executive Program Information Management für (Nachwuchs-) Führungskräfte.
Journal Information Systems and e-Business Management (ISeB)
Das Zentralregulierungsgeschäft
6
Quelle:Lehner, Wolfgang: Datenbanktechnologie für Data-Warehouse-Systeme. Heidelberg 2003. S.
18
Offene Warenwirtschaftssysteme:
Ein WWS wird als offen bezeichnet, wenn es entweder nur eingangs- oder
ausgangsorientiert arbeitet, d.h. entweder nur Daten über den Eingang bzw. Ausgang von
Waren registriert und verarbeitet. Es werden nur Eingangsdaten oder Ausgangsdaten erfasst
und kein Bezug oder Abgleich hergestellt
Geschlossene WWS:
Geschlossene Warenwirtschaftssysteme (GWWS) werden aus einer Zusammenführung der
Bestandsdaten von eingangs- bzw. ausgangsbezogenen Komponenten gebildet. Dabei
werden Daten über Warenbewegungen und Abverkäufe miteinander in Beziehung gesetzt. In
einem geschlossenen WWS werden die Warenbestände in allen Unternehmenseinheiten
artikelgenau geführt und kurzfristig fortgeschrieben. Während ein WWS in der Vergangenheit
durch eine Inventuraufnahme und Ermittlung der Differenz geschlossen wurde, d.h. ein Soll-
Ist-Abgleich durchgeführt wurde, kann dies heute durch Übernahme von Abverkaufsdaten
aus Scannerkassen und Anlieferungsdaten, automatisch erfolgen. (Hertel S. 6)
6 2
B e s ta n d s fü h ru n g B e s te llu n g
W W S -In v e n tu r A u ftra g s rü c k s ta n d
1
S ta m m -
d a te n
( L is t u n g )
5 3
VK- W a r e n e in g a n g
D a te n e rfa s s u n g A u s z e ic h n u n g
L a g e ru n g
4
R e c h n u n g s p rü fu n g
R e g u lie r u n g
B u c h h a ltu n g
7
Einstufigen-mehrstufige WWS
· Keine DV -Anbindung,
· reines POS-System ohne Filialwarenwirtschaft,
· Kombination von Filial-Warenwirtschaft und POS-System,
· Remote-Anbindung der Filiale an die Zentral-Warenwirtschaft.
Der Remote-Zugriff auf zentrale Warenwirtschaftssysteme gewinnt vor allem durch die
Internet-Technologie und Intranet-Lösungen an Popularität. Einige Warenwirtschaftssysteme
können vollständig über handelsübliche Browser bedient werden, so dass die Installation von
Software in der Filiale entfällt.“8
8
[BECK] S.104ff
Finanzbuchhaltung
Controlling Systemmerkmal 1:
Liquiditaetsplanung Basisinformation
Anlagenbuchhaltung 25.11.2006 - v5
Kassenbuch
Kostenstellenrechnung
Kostentraegerrechnung
Lagerverwaltung Weitere Funktionsbereiche
Personalwirtschaft
Personaleinsatzplanung
PPS
Zeiterfassung
EShop
Dokumentenmanagement
Customer Relationsship Management
Erst-Installation Installationszahlen
Systemmerkmal 2
Marktposition
25.11.2006 - v3
Engeraete
Betriebssystem
Programmiersprachen
Systemmerkmal 3
DV-Kriterien
25.11.2006 - v5 Datenbank System
Webfaehigkeit
Lizenzpolitik
Zeichenorientiert
Graphisch Frontends
Regelbasierte Systemkonfiguration
Webfrontend Betriebswirtschaftliche
Vordefinierte Prozessalternativen
Flexibilitaet
Sytemmerkmal 4: Pictogrammbasierte Definition von Workflows
Bedienungsaspekte User Exits
Berichtsgenerator
19.12.2006 - v5
Individuelle Menuegestaltung
Anpassbarkeit Berichte und
Maskeneditor Komplette Tastatursteuerung
Masken
Ausblenden von Maskenfeldern
Generelle systemweite Anpassungen
Berechtigungskonzept
Benutzerspezifische Anpassungen
Suchmechanismen
3.3.5 Organisationsstrukturen
Firmenuebergreifende Artikelstamm
Stammdaten Lieferantenstamm
Kundenstamm
Zentral-Filial-Strukturen
Mehrfirmenfaehigkeit
Firmenuebergreifende
Einkaufsvereinbarungen
Systemmerkmal 5:
Organisationsstrukturen
25.11.2006 - v4
Artikelgruppen
Firmenuebergreifende Hierarchien Einkaufsgruppen
Vertriebsgruppen
Manuell
Lieferung zwischen Firmen
Automatisch
Firmenuebergreifende
Bestandstransparenz
Elektronischer Ordersatz
Zentral
Dezentral
Dispositionsprinzip
Gemischt
Nachschubdisposition (one-sell-one-buy)
Automatische Bestandsverschiebung
25.11.2006 - v5
Gutscheinverwaltung
Download
Verdichtete Verkaufsvorgaenge
Unverdichtete Verkaufsvorgaenge
Upload
Anbindung an ein Kassensystem Warenbewegungen
Geldbewegungen
Eigene PC-Kasse
Kassenschnittstellen
3.3.7 Führungsinformation
Perioden
Artikel
Bezugsobjekt
Kunden
Regionen
Auftragseingang
Lieferungen
Prozessphase
Fakturen
Reklamationen
Systemmerkmal 23
Fuehrungsinformationssystem
Ist/Plan
30.11.2005 - v3 Vergleich Ist/Ist Vormonat
Ist/Ist Vorjahr
Kunden
Artikel
ABC-Analyse Umsatz
Deckungsbeitrag
Plan/Ist Abweichungen
Kundenanfrage
Kundenangebot
Belegarten Distribution Kundenauftrag
Kundenlieferavis
Kundenrechnung
Systemmerkmal 24
Datenaustausch
30.11.2005 - v2 SEDAS
EDI-Formate DATANORM
Weitere
EANCOM
Subset
Weitere
3.4.1 Stammdaten
Stammdaten sind Daten, die über einen längeren Zeitraum unverändert sind. Zu den
wichtigsten Stammdaten zählen:
• der Artikelstamm
• der Kundenstamm
• der Lieferantenstamm
Eine eindeutige Identifikation der einzelnen Stammsätze ist besonders wichtig. Möglichkeiten
dazu sind
• Identnummer
o Eindeutige und unverwechselbare Kennzeichnung. Am einfachsten eine
fortlaufende Nummerierung
• Klassifizierungsnummer
o “sprechende” Nummer. Vergabe von Nummern auf Grund von Eigenschaften
oder Attribute einer Menge gleichartiger Objekte
• Verbundnummern
o Ein klassifizierender Teil ist mit einer Zählnummer verbunden (Autokennzeichen)
• Parallelnummer
o Der identifizierende Teil ist vom klassifizierenden Teil getrennt
• Sachmerkmalsleiste nach DIN 4000
o Zusammenstellung der für eine Objektgruppe wichtigen Merkmale.
Stellung ein.
Quelle: „Handels-H-Modell“ EINKAUF Vorlesung Handelsinformationssysteme Prof. Dr. J.
Becker SS 2005
Die Europäische Artikelnummer gibt es als 13stellige oder verkürzte 8stellige Ziffernfolge.
Für die obige Abbildung heißt das: Herstellerland ist Deutschland, der Hersteller ist BASF,
das Produkt eine Videokassette E 300.
Den Schlüssel zu den Nummernsystemen bildet die ILN. Die in ihr enthaltene Basisnummer
ist Grundlage für die darauf aufbauenden EAN-Artikelnummern, Nummern der
Versandeinheiten etc. Diese werden durch das regelgerechte Anfügen eigener
Nummernbestandteile von den Unternehmen selbst gebildet.
Diese ebenfalls 13-stellige Lokationsnummer besteht aus einer 7-, 8- oder 9-stelligen
Basisnummer, welche den jeweiligen Wirtschaftsteilnehmer identifiziert, einer 5-, 4- oder 3-
stelli-gen Nummer, die vom Wirtschaftsteilnehmer selbst generiert werden kann, sowie einer
1-stelligen Prüfziffer. Die selbst zu generierenden Ziffern ermöglichen es Unternehmen
beispielsweise für einzelne Filialen, Abteilungen oder auch einzelne Wareneingangsrampen
unterschiedliche Lokationsnummern zu definieren.
Die EAN ermöglicht eine eindeutige Identifizierung von Waren. Sie besteht ebenfalls aus 13
Stellen und ist vergleichbar der ILN Typ 2 zusammengesetzt. Die 7-, 8- oder 9-stellige
Basisnummer dient der Identifizierung des Markenherstellers (Hersteller oder Lieferant),
während die nächsten 5, 4 bzw. 3 Ziffern die handelsbetriebsinternen Artikelnummern sind,
welche vom jeweiligen Handelsbetrieb generiert werden. Die letzte Ziffer ist erneut eine
international abgestimmte Prüfziffer. Auch die EAN kann in strichcodierter Form dargestellt
Zur Prüfziffer:
Mit Hilfe der letzten Ziffer, der Prüfziffer, können falsche Artikelnummern festgestellt werden.
Dabei wird wie folgt geprüft: Von links nach rechts werden die einzelnen Ziffern abwechselnd
mit den Faktoren 1 und 3 multipliziert und die Produkte addiert. Der EAN wird nur dann
akzeptiert, wenn die so gebildete Prüfsumme ohne Rest durch 10 teilbar ist. Soll also die
Prüfziffer bestimmt werden, so bildet man zunächst die Prüfsumme für die ersten 12 Stellen.
Die richtige Prüfziffer ergibt sich dann durch Ergänzung zum nächsten Vielfachen
von 10.
3.4.3 Klassifizierungen
3.4.3.1 Standardwarenklassifikation10
Die Standard-Warenklassifikation wird bereits seit 1978 in Deutschland genutzt. Aufbauend
auf der Binnenhandelsstatistik des Statistischen Bundesamtes umfasst sie heute nach
mehrmaliger Aktualisierung eine Vielzahl der unterschiedlichsten Warenbereiche und kann
damit branchenübergreifend eingesetzt werden. Besonders hohe Akzeptanz genießt die
Standard-Warenklassifikation in der Konsumgüterwirtschaft zur Unterstützung der
Geschäftsbeziehungen zwischen Industrie und Handel.
Aufbau
9
http://www.darmstadt.ihk24.de/servicemarken/branchen/Handel,_Absatzwirtschaft/~$EAN.jsp
abgerufen am 12.12.2006
10
Quelle:GS1: http://www.gs1-
germany.de/internet/content/produkte/ean/dienstleistungen/klassifikationen/gpc/index_ger.html vom
17.12.2006
Aufbau
Aufbau
Die hierarchische aufgebaute UNSPSC-Klassifikation umfasst vier Stufen. Ist ein tieferer
Detaillierungsgrad erwünscht, kann sie durch eine weitere, unternehmensspezifische Stufe
ergänzt werden.
Da die UNSPSC lediglich der reinen Klassifikation von Produkten dient, wird sie in
verschiedenen Segmenten, wie z. B. in den Bereichen Food, Beverages,Tobacco Products,
optimal durch die GPC ergänzt. Letztere bietet unter ihrer Brick-Ebene (entspricht der
Commoditiy-Ebene bei UNSPSC) Merkmale, mit deren Hilfe Anwender Produkte näher
beschreiben können.
10 Kohlenbergbau, Torfgewinnung
11 Gewinnung von Erdöl und Erdgas, Erbringung damit verbundener Dienstleistungen
12 Bergbau auf Uran- und Thoriumerze
13 Erzbergbau
14 Gewinnung von Steinen und Erden, sonstiger Bergbau
15 Ernährungsgewerbe
16 Tabakverarbeitung
17 Textilgewerbe
18 Bekleidungsgewerbe
19 Ledergewerbe
40 Energieversorgung
41 Wasserversorgung
45 Baugewerbe
3.4.4.2 Länderkennzeichen
1. ISO-2/Stat. BA - Länderkurzbezeichnungen – ISO-Alpha-2-Codes der ISO (International
Organization for Standardization) bzw. die vom Statistischen Bundesamt (Stat. BA)
verwandten Abkürzungen (ISO 3166 (-1,-2,-3)
2. ISO-3 – Währungskürzel – ISO-Alpha-3-Codes der ISO (International Organization for
Standardization)
3. LKZ - Länderkennziffer nach der Außenhandelsstatistik
4. Kurzbezeichnung - Länderkurzbezeichnungen nach der Außenhandelsstatistik
5. Präf.-Kürzel - Länderkürzel nach dem Präferenzrecht
6. KFZ-Kennzeichen – Kraftfahrzeugkennzeichen
Kasse /POS
Prognosen
Kundenauftrag
Netzplan im Projekt
Bedarfsplanung
Lagerbestand
Manuelle Eingaben
Warenverteilung
Produktion Einkauf Lager
Service + Reparatur
Auftragsvorschläge
Bedarfe aus verschiedenen Bereichen gehen in die Bedarfsplanung ein. Ergebnis der
Bedarfsplanung sind Einkaufs- Lager, ggf. Produktionsvorschläge
E in k a u f
W a re n - R echnungs- K re d ito r e n -
D is p o s itio n e in g a n g p rü fu n g b u c h h a ltu n g
L ie f e r a n t e n - L ie f e r a n t e n -
E in k a u f v e r w a l tu n g p f le g e
L ie f e r a n t e n -
b e w e r tu n g
A r ti k e l -
v e r w a l tu n g
K o n d i ti o n e n - R e chn u ng -
v e r w a l tu n g k o n d it io n e n
N a c h t r ä g lic h e
K o n d i t io n e n
K o n tr a k t- M e n ge n -
v e r w a l tu n g k o n t ra kt
W e r tk o n t r a k t
L ie f e rp la n
D is p o s it io n L im it re c h n u n g
B e d a r fs - V e rb r a u c h s -
rech n u n g g e s te u e r te
P rog n o se
P ro g ram m -
geb un de ne
B e d a rf sre c h n u n g
B e s t e ll- L ie f e ra n t e n -
m e n g en - a u sw a h l
rech n u n g
L ie f e r m e n g e n
u n d – z e it e n
f e s t le g e n
A u f t e ilu n g
B e s t e ll-
ü b e r m it t lu n g
B e s t e ll-
ü b e rw a c h u n g
Bei der verbrauchsgesteuerten Produktion erfolgt der Anstoß zur Disposition über die
Verfolgung des Lagerbestandes.
In der Bestellpunktdisposition wird erfolgt eine Bedarfsauslösung, wenn ein zuvor definierter
Lagerbestand unterschritten wird. In der Bestellrhythmusdisposition erfolgt die
Bedarfsauslösung in einem definierten Zeitintervall.
Bestellpunktsdisposition
11
11
[EBEL] S.259 [TEMPEL] S.249 ff
s: Bestellpunkt
T: Bestellrhythmus
q: feste oder optimale Bestellmenge
S: Höchstbestand
Quelle: Bernd Ebel: Produktionswirtschaft. 8. Auflage. Leipzig 2003. Anstatt vom Bestellpunktrythmus
spricht man einfacher vom Bestellrythmus
W aren-
W a r e n e in g a n g e in g a n g s -
p la n u n g
W a re n a n -
n ahm e
W aren- Q u a n t it a t iv e
k o n t r o ll e W a re n -
k o n t ro lle
Q u a l i ta t i v e
W a re n -
k o n t ro lle
W aren- E rf a s s u n g m it
e in g a n g s - B e s t e llb e z u g
e rf a s s u n g
E rfa s s u n g
o hne
B e s t e llb e z u g
R ü c k s ta n d s - M a n u e lle
a u fl ö s u n g Z u t e ilu n g
A u t o m a ti s c h e
Z u t e ilu n g
W aren-
e in la g e ru n g
E le k t ro n is c h e
R echn un gen
R e ch nu ngs -
e rf a s s u n g
R e ch nu ngs -
k o n t r o l le
N a c h t rä g lic h e
V e r g ü tu n g
D e b it o r e n - D e b i t o re n -
b u c h h a ltu n g s ta m m d a te n -
p f le g e
B u ch u n g
R e ch n u n g / B u ch u n g
G u ts c h ri ft/ n a c h tr . R e ch n u n g
A b rec h n u n g
B u ch u n g
G u ts c h r ift
B u ch u n g
n a c h t r ä g li c h e
A b re ch n u n g
E in z u g un d A b n e h m e r-
A b b u ch u n g r e g u l ie r u n g
Z a h ll a u f
R e g u l ie r u n g d u r c h
m a n u e l le ( n )
E in zu g / A b b u c h u ng
B u c hu n g d e s
Z a hlu n g s -
e in g a n g s
M a h n u ng
K r e d it -
m a n a g e m e n t
V e r z in s u n g
L a g e rs t a m m -
La ge r d a t e n p f le g e
U m la g e r u n g
u nd
U m b uchu n g
M TV -
V e r w a lt u n g
In v e n t u r d u r c h - I n v e n t u r d u rc h -
fü h r u n g fü h r un g L ag er
I n v e n t u r d u rc h -
f ü h ru n g F ilia le
La ge r-
s te u e r u ng
Marketing
W aren- D ebitore n-
Ve rkauf ausgan g Fakturieru ng bu ch haltung
3.5.3.1 Marketing
K un den -
M a rk e t in g m a na gem e nt
S o r ti m e n t s - S o rt im e n t s -
p o l i ti k b ild u n g /
A rt ik e llis t u n g
A b s a tz -
p la n u n g
K o n d i t io n s -
p o l i ti k
P r o v is io n s -
p o l i ti k
A n g e b o ts -
V erkau f b e a r b e it u n g P r e is a u s k u n f t
S c h r if t lic h e s
A n ge bo t
A us-
s c h re ib u n g s -
b e a r b e it u n g
A u ft r a g s -
b e a r b e it u n g A u f t r a g s a rt e n
V e rf ü g -
b a r k e it s -
p r ü fu n g
B o n it ä t s -
p r ü fu n g
R e k l a m a ti o n s -
b e a r b e it u n g
A u ß e n d i e n s t-
u n te r s t ü t z u n g
W aren au s- T o u re n -
ga ng p la n u n g
K o m m is -
s io n ie r p la n u n g
K o m m is - K o m m is -
s i o n ie r u n g s io n ie ru n g s -
s t r a te g ie
K o m m is -
s io n ie rb e le g
W A - E rf a s s u n g
/ B e s ta n d s -
bu chu n g
V e r sa n d -
a b w ic k lu n g
L ie f e rs c h e in -
F a k t u rie ru n g b e w e rt u n g
R e ch n un gs - E in z e l-
e r s t e llu n g re c h n u n g
S a m m e l-
re c h n u n g
G u t- /
L a s t s c h rif t e n -
e r s t e llu n g
B e re c h n u n g
n a c h t rä g lic h e r
V e r g ü tu n g
Stabilisierungsphase Optimierungsphase
Perspektiven
Erwartete
Performance
Performance
des Altsystems
3.7.2 Einführungsstrategien
Prinzipielle Einführungsstrategien
Im Verhältnis von Prozessen und Software
• 1:1 Einführung: Die alten Prozesse werden 1:1 unverändert im
Warenwirtschaftssystem abgebildet.
• Zunächst werden die Geschäftsprozesse optimiert und danach die Software
implementiert
• Simultane Geschäftsprozessoptimierung und Einführung des
Warenwirtschaftssystems
3.7.3 Einführungsmodelle
Es gibt unterschiedliche Modelle der Einführung von Warenwirtschaftssystemen
Man kann sich an den Vorschlägen der Hersteller (z.B. SAP, Microsoft u.a.) orientieren, an
Modellen der Unternehmensberatungen oder an Vorschlägen von Institutionen, z.B. V-
Modell, das im öffentlichen Bereich weit verbreitet ist,
Review Istzustand
Soll-Gesch. Gaps
Vorgänge Abbild. bearbeiten
definieren. der
Kern-
prozesse
in
Abgleich BaaN Umsetzungs-
Visioning mit planung des
BaaN BaaN IV-
Managem. Best Einsatzes
ziele Practice
Um-
setzungs- Integration
Planung BaaN
Infra- Infra-
struktur struktur
vervoll- einführen
ständigen
Schulungs- Betreuung
Ergebnisse konzept nach Pro-
Phase 2 Imple- umsetzen duktivstart
mentie-
rung
Optimi-
System- rung
test planen
Verantwortung Verantwortung
12
BI bedeutet Business Intelligence. Der Begriff wird hier gleichbedeutend mit Performance
Manaegment, Data Warehousing oder analytischen Informationssystemen verwendet
• Gesamtumsatz 121300 €
• Einzelhandel: 99.000€; Großhandel: 22.300€
• Damenfahrräder: 57.300€; Herrenfahrräder: 64.000€
• Billigheim: 34.000€; Mosbach: 87.300€
• Billigheim/EH: 34.000€; Billigheim/GH: 0€; Mosbach/EH: 65.000€; Mosbach/GH: 22.300€
• Etc.
Klassische BI-Frage (am Beispiel der Frage: Wie viel Umsatz wurde mit Herrenfahrrädern in
Mosbach gemacht?)
• Umsatz: kann aus Tabelle Rechn_Pos‘s (über Re_Art-Menge *Re_DM/Stck) entnommen
werden.
• Herrenfahrräder: kann aus Tabelle Art-Gruppen entnommen werden (man braucht aber
auch die Tabelle Artikel um den Bezug zur Tabelle Rechn_Pos‘n herstellen zu können
• Mosbach :kann aus Tabelle Orte entnommen werden (man braucht aber auch die
Tabellen Läden und Rechnungsköpfe um den Bezug zur Tabelle Rechn_Positionen
herstellen zu können).
• FAZIT: Um eine Antwort auf die oben gestellte Frage zu bekommen muss man zunächst
wissen, welche der Tabellen zu verbinden sind, dann muss man die (in diesem Falle 6!!!
Tabellen) miteinander verbinden.
• Data-Mining Frage (am Beispiel der Frage: Was sind die Faktoren, die zu den geringen
Umsätzen in Mosbach am meisten beitragen; ist es eher die Artikelgruppe
Herrenfahrräder oder eher die Zeitgruppe 2.Quartal, oder beides zusammen oder … oder
?)Solche Fragen lassen sich auf der Basis von traditionellen Warenwirtschafts-
Datenbanken kaum beantworten.
• Methodeneinsatz (am Beispiel der Frage: Verhalten sich A-Artikel anders als B-
Artikel).Solche Fragen lassen sich auf der Basis von traditionellen Warenwirtschafts-
Datenbanken kaum beantworten.
Vorgefertigte Berichte decken nicht den „Analyse“-Bedarf ab sondern nur den Bedarf an
regelmäßiger Informationen
• Das ad-hoc-Erstellen von Abfragen ist für den Mitarbeiter aber sehr zeitaufwändig
• Es ist kaum vorstellbar, dass man so viele Abfragen „vorgefertigt“ abspeichert, wie man
braucht um „ad hoc“ zu navigieren
• Je mehr Abfragen vorgefertigt sind, desto weniger wird sich der Mitarbeiter an den
genauen Inhalt von z.B. Abfrage 4711 erinnern
• FAZIT heute: „Listen anschauen“ statt „Navigation“
Ausgabe
Modellierung
Administration
ETL-Bereich
Der prinzipielle Aufbau eines Data Warehouses besteht aus drei Schichten:
Der ETL-Bereich:
Daten extrahieren, Daten transformieren, Daten laden. Das ist die Schicht, in der Daten aus
verschiedenen internen und externen, strukturierten und unstrukturierten Datenquellen in
eine zentrale Datenbasis überführt werden. Zu den strukturierten Datenquellen zählen in
erster Linie die Datenbanken der operativen Anwendungssysteme (ERP, WWS,CRM; SCM
etc). Unstrukturierte Daten sind vorwiegend Textdateien. Externe Quellen sind meist Seiten
aus dem Internet
Beim Aufbau eines Data Warehouses ist dies der aufwändigste Bereich. Zunächst müssen
die Datenquellen ausgewählt werden und über einen längeren Zeitraum auch zuverlässig
verfügbar sein. Bei externen Datenquellen ist das kein einfacher Prozess. In diesem
Zusammenhang wurde auch der Begriff Data Farming oder Web Farming geprägt, das heißt
das systematischen und nachhaltige Auswählen von zuverlässigen internen und externen
Datenquellen. Die Datenquellen werden transformiert, d.h. in einheitliche Schemata
umgewandelt, um Fehler bereinigt, mit fehlenden Daten ergänzt und dann nach bestimmten
Vorschriften (real time, periodisch) in die zentrale Datenbasis übernommen.
• Query / Reporting
o Abfragegeneratoren
o Berichtsgeneratoren
Beispiel: Cristal Reports
• Statistical Analysis
o Regressionen
o Korrelationen etc
• Multidimensionale Analyse
o Klassisches BI
• Data Mining
o Suche nach in Daten „versteckten“ Strukturen
Die OLAP-Methoden und Werkzeuge kommen dann zum Einsatz, wenn für das
Management wichtige Zusammenhänge bekannt , in den Datenstrukturen des Data
Warehouses modelliert sind und in Cubes zur Verfügung gestellt werden.
„Ein Polizist trifft in der Nacht einen Betrunkenen, der unter einer Laterne sucht. Er erklärt
dem Wachmann, er habe seine Schlüssel verloren, "irgendwo da drüben", dabei zeigt er ins
Dunkle. Natürlich fragt ihn der Polizist, warum er die Schlüssel unter der Laterne sucht und
nicht da, wo er sie verloren hat. Antwort: Weil man im Licht besser sieht!"14
13
Tom de Marco: Contolling Software Projects. Englewood Cliffs, New Jersey, 1982. S.3.
14
Joseph Weizenbaum nach einem Essay von Martin Ebner in der Nürtinger Zeitung vom 11.11.2006
„Wozu brauchen wir Computer?“
Anforderungen an Kennzahlensysteme
Einzelne Kennzahlen sind vieldeutig und wenig aussagefähig. Kennzahlen-Systeme
dagegen bringen Kennzahlen in eine sachlogische Beziehung und richten sie auf ein
übergeordnetes Ziel aus . Die sachlogischen Beziehungen können systematischer,
mathematischer oder empirischer Natur sein.
Die Entwicklung eines Kennzahlensystems für ein bestimmtes Unternehmen ist eine
anspruchsvolle Modellierungsaufgabe.
Kennzahlensysteme sind zum Beispiel ROI nach dem duPontschen Schema oder Return on
Logistics (Cap Gemini Kennzahlensystem).
Für die Messung muss man sich auf Regeln festlegen, was jeweils gemessen werden soll:
Für die Bewertung der Bestandskosten können die bilanziellen Richtlinien herangezogen
werden (Durchschnittswerte: 12 Monatswerte kumuliert /12)
Zu den Logistikkosten zählen die Kosten der Auftragsabwicklung, der Absatzplanung, des
Einkaufes etc.
Bestände
Input Liefertreue
Logistik
Logistik-
Output
kosten
Liefertreue
(% Einhaltung bestätigter Liefertermine)
RoL =
Bestände Logistikkosten
X
(% vom Umsatz) (% vom Umsatz)
Dieses Kennzahlensystem kann nun zu externen oder internen Benchmarks benutzt werden:
Als eine erste Faustregel gilt: eine optimierte Logistik erreicht einen RoL von 1 (z. B. durch
100 % Liefertreue, 10 % Bestände und 10 % Logistikkosten)
Benchmark-Vergleich
Benchmarks + Durchschnitt –
91% 88% 85%
100%
Liefertreue
Bestände 12 % 18% 27%
(% vom Umsatz)
Logistikkosten 7,5% 8,0% 8,3% 8,6%
(% vom Umsatz)
RoL 0,9 0,61 0,51 0,46
Im Projektmanagement ist ein Kennzahlensystem weit verbreitet, das unter dem Namen
magisches Dreieck eingeführt wurde. Das magische Dreieck beschreibt den Zusammenhang
von Qualität des zu liefernden Ergebnisses , Zeit und Aufwand. Der Ausdruck magisch wird
verwendet um den Zusammenhang der drei Ziele zu verdeutlichen. Wenn man mit einem der
drei Ziele in Verzug zu geraten droht, kann man das oft nur kompensieren, indem man die
anderen beiden Ziele kompromittiert. Kommt man z.B. mit dem Zeitziel in Verzug, kann das
eventuell kompensiert werden, indem man mehr Mitarbeiter in ein Projekt steckt, was aber
sicher zu Lasten des Aufwandszieles geht.
Die Methode ist aber so flexibel, dass auch mehr als vier und andere als die „klassischen“ je
nach Anwendungsgebiet verwendet werde.
Die Balanced Scorecard ist als Instrument des strategischen Managements zu sehen, das
heißt das die Steuerungsgrößen aus der Strategie und der für diese Strategie wichtigen
kritischen Erfolgsfaktoren abgeleitet werden. Die daraus zu entwickelnden Kennzahlen
müssen so gewählt werden, dass der Zielerreichungsgrad messbar ist und Abweichungen
frühzeitig erkennbar sind.
Insofern ist die Balanced Scorecard auch ein Hilfsmittel des Changemanagements, da sie
den Rückkopplungsprozess von der Strategie bis zur Überprüfung des Umsetzungserfolges
systematisch implementiert. Dieser Rückkopplungsprozess umfasst die Phasen:
n
n
me
hle
en
die Organisation
ah
za
ab
ßn
nn
e
rg
l
Zie
Ma
Vo
Ke
Kunden Prozess- Perspektive
Bewertung und Effiziente und
Steuerung von kundenorientierte
n
n
n
Vision
me
me
hle
hle
Kunden- und Optimierung von
en
en
ah
ah
za
za
ab
ab
Marktsegmenten Geschäfts-
ßn
und
nn
ßn
nn
e
rg
e
rg
l
l
Zie
Ma
Ke
Vo
Ma
Ke
prozessen
Zie
Vo
Strategie
n
me
Verbesserung des
n
hle
en
ah
Potentials der
ab
za
ßn
rg
e
nn
Mitarbeiter
Ma
l
Zie
Vo
Ke
Die einzelnen Kennzahlen können nicht losgelöst voneinander betrachtet werden. Deshalb
gibt die Balance Scorecard auch Rechenschaft über die Abhängigkeiten der Kennzahlen
voneinander in einer Ursachen Wirkungskette. Die Mitarbeiterkompetenz in der
Innovationsdimension wirk sich auf die Prozessqualität in der Prozess-Dimension aus, diese
wiederum auf die Liefertreue in der Kundendimension und im Endeffekt auf den Gewinn in
der Finanzdimension.
Anwendungen im Handel:
Eine Operationalisierung eine Handels-BSC und einen möglichen Zusammenhang zwischen
den Zielen zeigen folgende Abbildungen [BECK S.81 ff]
Heterarchien
Parallele Hierarchien
4.3.4 Navigation
Wenn Dimensionen hierarchisch strukturiert sind, kann man die Daten anhand der
Hierarchiestufen entlang verdichtet oder detailliert.
Detaillierung und Verdichten sind zwei der Navigationsmethoden, die sich im
Zusammenhang mit den OLAP Methoden eingebürgert haben. Zusammen mit Slicing, Dicing
und Pivotierung bilden sie die Navigationsmethoden, die in den meisten OLAP-Werkzeugen
implementiert sind:
• Drill Down: Das Herunterbrechen (Detaillieren) der Information in kleinere Einheiten
• Roll up: Das Aggregieren (Verdichten) der Information zu größeren Einheiten
• Slicing: Das „Herausschneiden“ von Informationsscheiben, z.B alle Produktgruppen eines
Jahres. Das bedeutet das Setzen von Filtern um kleinere Informationseinheiten zu
bekommen
• Dicing: Eine Sonderform der "slice"-Technik. Als Filter werden dabei Intervalle gesetzt.
Das Ergebnis ist wiederum ein kleinerer Würfel, der schneller analysiert werden kann.
• Pivotierung: Das Vertauschen von Dimensionsachsen
15
Abschnitt ist entnommen aus: o.V.:Data Warehouse.: http://wwwai.wu-wien.ac.at/~koch/lehre/inf-
sem-ss-01/pachernik/main.html abgerufen am 20.9.2006
"Slicing" Quelle:
"
Ergebnis des "Slicings": Verkaufsdaten der Kunden zu einem Produkt im Zeitablauf
In Anschluss daran könnte ein weiterer Navigationsschritt darin bestehen, einen Filter auf
einen interessanten Kunden zu setzen und nach Produkten "aufzureißen". Dies entspricht
einem Drehe" des Datenwürfels. Das Ergebnis ist ein Report für einen bestimmten Kunden,
der die verkauften Produkte im Zeitablauf darstellt.
Ergebnis der Rotation: verkaufte Produkte nach Monaten zu einem bestimmten Kunden
"Dicing" ist eine Sonderform der "slice"-Technik. Hier wird durch das Setzen von Intervallen
als Filter eine Untermenge aus dem Datenwürfel ausgeschnitten. Das Ergebnis ist wiederum
ein kleinerer Würfel, der schneller analysiert werden kann.
"Drill Across"
"Drill Through"
Einige Data Warehouse Systeme bieten die Möglichkeit, auch auf Daten zu reporten, die gar
nicht im Warehouse selbst, sondern nur in den OLTP-Systemen gespeichert sind. Ein
Beispiel hierfür könnten einzelne Buchhaltungs-Belege sein. Diese Fähigkeit wird "Drill
Through" genannt.
Abschließend soll jedoch darauf hingewiesen werden, das die genannten Begriffe in der
Literatur teilweise unterschiedliche Bedeutung haben. z. B verwendet Cognos den Begriff
Dicing eher im Sinne von Pivotierung also Rotation.
Data Mining Methoden kommen dann zum Einsatz, wenn nicht bekannt ist, wie die
vorhandenen Datenbestände zu interpretieren sind. Während bei den OLAP-Methoden
Zusammenhänge bekannt und modelliert sind, helfen die Data Mining Methoden bei der
Hypothesenbildung. Betriebswirtschaftliche Anwendungsgebiete , bei denen sie mit Erfolg
eingesetzt wurden sind Marketing, Produktion, Personalwirtschaft, Einkauf mit den
Beispielen:
Analyse Anwendungsfelder
• 17Churn-Analysen und Service-Optimierung Die Churn-rate ist die Rate der
Vertragskündigungen oder die Rate der Geschäftskunden, die dauerhaft in einem
anderen Geschäft einkaufen. Die Gründe dieser Fluktuationen geben oftmals
Aufschluss über mögliches Optimierungspotential in der Kundenbeziehung.
Andererseits dient die Churn-Analyse auch als Frühwarnsystem.
• Warenkorb-Analyse Durch die Analyse der Warenverkäufe kann überprüft werden, ob
positive oder negative Korrelationen zwischen den einzelnen Produkten bestehen (z.
B. wird Bier häufig zusammen mit Chips oder Grillwaren gekauft). Mit diesen
Informationen lässt sich das Sortiment und die Produktpositionierung optimieren.
• Zielgruppen-Analyse: Data Warehousing und Data-Mining erlauben es, die klassische
Zielgruppenanalyse um eine Dimension zu erweitern. Verschiedenste Variablen des
Kaufverhaltens können genauestens untersucht werden. Somit kann vom
bestehenden Sortiment auf Kundenprofile geschlossen werden, «die als ‹Schablone›
für Neukunden dienen können. Mit Hilfe dieser Profile können ausserdem
Vorhersagemodelle erstellt werden, welche die Wahrscheinlichkeit vorhersagen
können, ob ein neues Produkt ein Erfolg werden kann oder nicht.
• Vertriebs-Targeting: Hier wird vor allem eine geographische Analyse der
Kaufgewohnheiten durchgeführt. Mit den gewonnenen Erkenntnissen können die
Vertriebsressourcen optimiert und die Marketingaktivitäten koordiniert werden.
• Budget-Analysen: Mit Hilfe der Zielgruppenanalyse kann auch festgestellt werden,
wie effektiv das Budget bezüglich einzelner Kampagnen eingesetzt wurde: «so
16
WEKA ist ein Open Source Data Minino Werkzeug, das an der Universität von Waikato in
Neuseeland entwickelt wurde und eine weite Verbreitung gefunden hat.
17
Churn ist ein Kunstwort aus change und turn
4.4.1 Klassifikationsmethoden
4.4.1.1 Entscheidungsbaum
Ist ein Berufstätiger kreditwürdig, wenn er jünger als 30 Jahre ist, ein Einkommen < 100000€
hat und 250000€ Schulden?
Eine Anwendung der Klassifikationsanalyse ist zum Beispiel die Beurteilung der
Kreditwürdigkeit von Bankkunden. Hier werden zuerst die bisherigen Kreditnehmer, die
ihren Kredit zurückbezahlten, in der Gruppe „kreditwürdig“ zusammengefasst. Die
Kunden, die ihren Kredit nicht zurückbezahlten, bilden dann die Gruppe „nicht
kreditwürdig“. Anhand dieser bekannten Testdaten entwickelt das Verfahren nun einen
Entscheidungsbaum mit zum Beispiel folgenden Komponenten: Verschuldungsgrad,
Alter, Einkommen, Sicherheiten...... Anhand des Entscheidungsbaumes kann man nun
bei der Kreditvergabe in Zukunft den Kunden anhand der Informationen Alter,
Lieferant A B C
Lieferanteil 70% 20% 10%
Mangelhafte Stücke pro Lieferung 10% 30% 20%
a) Frage: Wie groß ist der Anteil der mangelhaften Stücke überhaupt?
b) Mit welcher Wahrscheinlichkeit ist ein mangelhaftes Stück vom Lieferant A?
P(h) (A priori Wahrscheinlichkeit), ist die Wahrscheinlichkeit eines Ereignisses h, die man
aufgrund von Vorwissen kennt. Ich kenne die Wahrscheinlichkeit von Sack 1 oder ich kenne
die Wahrscheinlichkeiten auf Grund von Testdatenbeständen (Aus meinen Testfällen weiß
ich zum Beispiel, dass 5/11 aller Patienten zur Risikoklasse hoch gehören).
P(D/h): (likelyhood) Ist die Wahrscheinlichkeit eines Ereignisses D unter der Voraussetzung,
dass h eintritt. (Wenn ich Sack 1 ausgewählt habe, die Wahrscheinlichkeit einer blauer
Kugel).
Naiv deshalb, weil das Verfahren auf der Annahme der Unabhängigkeit der Merkmale
beruht.
4.4.2 Assoziation
Das Ziel der Assoziation ist es interessante Verbindungen der Attribute von Datensätzen zu
finden. Man möchte z.B. wissen, von welchem Produkt eine Verbundwirkung ausgeht. Die
Ergebnisse liefern Antworten auf zahlreiche Fragen, wie etwa:
Was als interessant zu bewerten ist wird mit zwei Kriterien beschrieben:
Support und Confidence.
Der Support einer Assoziationsregel ist ein Maß für die Anzahl (absolut oder in %) der
Datensätze für die die Assoziationsregel zutrifft. Confidence bezeichnet die Anzahl der
Datensätze für die die Assoziationsregel zutrifft im Verhältnis zu allen Datensätzen auf die
sie anwendbar ist.
Mit diesen Maßen kann durch die Vorgabe von minimalen Support und Konfidenzen
gesteuert werden, ab wann eine Assoziation als interessant angesehen wird. Denn sonst
treten in einer umfangreichen Datenbasis fast beliebig viele Assoziationen auf. Dies hat auch
einen positiven Einfluss auf die Rechenzeit des Verfahrens.
Beispiel:
Berechnen Sie Support und Confidence. Welche Schlüsse ziehen Sie daraus
Lösung
support{Aftershave} --> {Bier}= Anzahl aller Transaktionen, die Aftershave und Bier
enthalten / Alle Transaktionen = ¼
Confidence {Aftershave} --> {Bier}= Anzahl aller Transaktionen, die Aftershave und Bier
enthalten / Anzahl der Transaktionen, die Aftershave enthalten = ½
{Aftershave} --> {Chips} s= 0
{Bier} --> {Chips} s= 2/4, c=2/3
{Chips} --> {Aftershave} s=0
{Aftershave} --> {Bier,Chips} s=0
Ausgehend von dieser Zielsetzung besteht die Schwierigkeit der Assoziationsanalyse nun
darin, geeignete Algorithmen zu finden, die in der Lage sind, die gesuchten Regeln effizient
zu generieren. Dazu wurde 1993 von der Gruppe um Rakesh Agrawal am IBM
Forschungszentrum in Almaden die ersten Algorithmen zur Erzeugung von
Assoziationsregeln entwickelt, der bis heute die in verschiedenen Varianten angewendet
wird.
Ziel des Apriori Algorithmus ist es, die Menge aller häufigen Itemkombinationen (engl.
„itemsets“) möglichst effizient zu bestimmen. Zu nutze macht man sich dabei die Regel dass
alle Teilmengen einer häufigen Objektmenge ebenfalls häufig sind. Dies ist die Apriori-Regel.
Oder anders ausgedrückt: Wenn ein Item A zu einem Itemset I hinzugefügt wird, kann das
Ergebnis nicht häufiger sein, als I.
Kommt z.B. die Itemmenge {Butter, Marmelade} in der Grundgesamtheit in 40% aller Fälle
vor, so kann die Itemmenge {Butter, Marmelade, Zucker} auf keinen Fall diesen Prozentsatz
übersteigen. Erfüllt nun die Itemmenge {Butter, Marmelade} nicht den Mindestsupport, so
kann keine erweiterte Itemmenge der Form {Butter, Marmelade, ...} den Mindestsupport
erreichen.
Das Schaubild zeigt die exemplarische Vorgehensweise des Apriori Algorithmus anhand
einer Warenkorbanalyse (# ist dabei definiert als die Häufigkeit einer Itemmenge). Die
Datenbasis besteht aus acht Transaktionen. Alle häufigen Itemmengen sollen in der
Datenbasis mindestens zweimal enthalten sein. Dies entspricht einem Mindestsupport von
2/8=25%. Im ersten Schritt werden die Häufigkeiten der 1-Itemmengen gezählt. Die Items
“Honig“ und “Marmelade“ werden dabei nicht in die Ergebnismenge L1 aufgenommen, da sie
nicht den Mindestsupport erreichen. Aus L1 wird die Hypothesenmenge C2 (Join-step)
generiert in dem alle items miteinander kombiniert werden. In Schritt drei werden die
Häufigkeiten der Kandidaten C2 anhand ihres Auftretens in der Datenbasis D ermittelt.
Wiederum reicht der Support zweier Itemmengen nicht aus, um in die Menge der häufigen
Itemsets aufgenommen zu werden.
Schritt vier verdeutlicht die Funktion des Prune Step (Prune = entfernen aller nicht häufigen
Untermengen). Da bei dem 3-Item-Kandidat {Brot,
Butter, Wurst} die Teilmenge {Butter, Wurst} nicht häufig und somit nicht mehr als einmal
in der Datenbasis vorhanden ist, kann die Itemmenge {Brot, Butter, Wurst} ebenfalls nicht
mehr als einmal auftreten. Aus diesem Grund wird dieser Kandidat sowie der Kandidat
{Brot, Käse, Wurst} im Prune Step eliminiert.
Die Vorgehen wird solange fortgesetzt, bis CK und damit auch LK eine leere Menge bildet.
Als Ergebnis liefert der Apriori Algorithmus die Mengen aller häufigen Itemsets mit ihren
dazugehörigen Häufigkeiten.
18
Klaus D. Wilde: Data Mining im Marketing (Vorlesung)
Katholische Universität Eichstätt-Ingolstadt
http://www.ku-eichstaett.de/Fakultaeten/WWF/Lehrstuehle/WI/Lehre/dm_v/ abgerufen am 10.11.2003
Idee:
• Zuordnung einer endlichen Menge von Items zu Kategorien,Klassen oder Gruppen
(Cluster) mit dem Ziel einer möglichst großen Ähnlichkeit zwischen Items im selben
und einer möglichst großen Unähnlichkeit zwischen Items in verschiedenen Clustern
• Cluster sind vorher nicht bekannt
• je kleiner die Distanz: Items sind ähnlicher
• je größer die Distanz: items werden unähnlicher
19
19
Quelle: TEMPEL.142 ff
Mit dieser Funktion und der zugehörigen Formel werden Werte in den Prognosezeitraum
übertragen, die auf dem Mittelwert der Variablen für eine bestimmte Anzahl vorhergehender
Perioden beruhen. Die prognostizierten Werte basieren auf der folgenden Formel.
Darin gilt:
• N ist die Anzahl der vorhergehenden Perioden, die in den gleitenden Durchschnitt
einbezogen werden
• Aj ist der aktuelle Wert zum Zeitpunkt j
• Fj ist der prognostizierte Wert zum Zeitpunkt j
Anmerkung: Die Anzahl der Punkte auf einer Trendlinie mit gleitendem Durchschnitt ist
gleich der Gesamtzahl der Punkte in der Datenreihe abzüglich der Punkte, die Sie für die
Periode angeben.
Beispiel:
Anzahl der Perioden, die rollierend einbezogen werden: N = 5
Aktuelle Periode: t = 8
Prognose für Periode t + 1 = 9
Summiert werden die Werte über folgende Perioden:
(A8 + A7+ + A6 + A5 + A4 )/5
Für Index j = 1 ergibt sich t-j+1 = 8-1+1=8
Für Index j = 2 ergibt sich t-j+1 = 8-2+1 = 7 und so weiter bis
Index j=N = 5 t-j+1 = 8-5+1=4
Bei der exponentiellen Glättung handelt es sich um ein Prognoseverfahren, mit dem
Zukunftswerte auf der Basis vergangener Werte vorhergesagt werden.
Dabei werden die Vergangenheitswerte mit einem sog. Glättungsfaktor gewichtet, der
exponentiell abnimmt je weiter man in die Vergangenheit zurückgeht. Es werden dadurch die
jüngeren Vergangenheitswerte stärker bewertet. Das kommt dadurch zustande, dass immer
die errechneten alten Prognosewerte mit einbezogen werden um die neuen zu errechnen,
aber da der Glättungsfaktor mit eingeht, kommen diese Vergangenheitswerte, je weiter sie
zurückliegen immer weniger stark zum Tragen .
Der systematische Anteil des Modells heißt auch glatte Komponente, weil er in den gängigen
Modellen durch eine glatt verlaufende Kurve repräsentiert wird. Bezüglich des Störterms εt
wird - analog zum Regressionsmodell - angenommen, dass er zufällig um den Wert Null
schwankt, also keinen systematischen Beitrag liefert.
Das Komponentenmodell in dieser Form beinhaltet also, dass sich die beobachteten Werte
zu jedem Zeitpunkt t zusammensetzen aus einer Trendfunktion, einer Saisonkomponente
und einem nicht erklärten Rest, der auf Zufallseinflüsse zurückgeht.
Bei manchen Anwendungen innerhalb und vor allem außerhalb der Ökonomie ist keine
Saisonkomponente erkennbar, etwa bei Zeitreihen für Aktienkurse. Man hat dann ein reines
Trend-Modell
yt = g t + st + ε t
80
Zeitraums ist der Indexwert t = 1 60 5 90
zugewiesen. Die Daten legen den 40 6 94
20
Ansatz eines linearen Trendmodells 0
7 105
nahe. 0 2 4 6 8 10 12 8 107
Wie wird die Umsatzentwicklung in Jahre 9 114
den nächsten Jahren sich verhalten ? 10 120
∧
Der für β (lies: beta-Dach) errechnete Wert gibt an, um wieviel Millionen Euro pro Jahr sich
der Umsatz der Brauerei tendenziell verändert. Diesen Wert benötigt man noch zur
∧
Berechnung des KQ-Schätzwerts α (lies: alpha-Dach). Die nach dem KQ-Prinzip
geschätzte Trendgerade ist hier also durch die Gleichung = 52,068 + 6,933 t gegeben.
Mit Regressionsgerade
140
120
100
80
Umsatz
60
40
20
0
1 2 3 4 5 6 7 8 9 10
yt 62 66 68 76 90 94 105 107 114 120
Prognose 59,001 65,934 72,867 79,8 86,733 93,666 100,599 107,532 114,465 121,398
Jahr
20
Wikipedia, Cotrolling: http://de.wikipedia.org/wiki/Controlling, abgerufen am 20.9.2006