Sie sind auf Seite 1von 20

Vorlesung Geschäftsprozessmanagement DHBW Mannheim 2022

Vorlesung Geschäftsprozessmanagement –
2. Themenblock – Technische Aspekte von
Dokumentenmanagement-Systemen

Dipl.-Inform. Christoph Altenhofen / Christoph.Altenhofen@iao.fraunhofer.de
DHBW Mannheim, 2022

Das Modell der AIIM


Einordnung der verschiedenen Dokumenten-Technologien

Quelle: http://de.wikipedia.org/wiki/Bild:ECM_Komponenten.jpg

Seite 6 © Fraunhofer IAO - offen -

2. Themenblock - Technische Aspekte von


Dokumentenmanagement 1
Vorlesung Geschäftsprozessmanagement DHBW Mannheim 2022

Gliederung

Dokumenten- Dokumenten- Ablage/


Dokumenten-Erstellung
Erfassung Erschließung Archivierung

Seite 7 © Fraunhofer IAO - offen -

Gliederung

Dokumenten- Dokumenten- Ablage/


Dokumenten-Erstellung
Erfassung Erschließung Archivierung

Seite 8 © Fraunhofer IAO - offen -

2. Themenblock - Technische Aspekte von


Dokumentenmanagement 2
Vorlesung Geschäftsprozessmanagement DHBW Mannheim 2022

Dokumenten-Erstellung/Modifikation
Unterstützung durch ein DMS

Grundsätzliche Funktionen eines DMS


▪ Versionierung
▪ Check-In/Check-Out-Mechanismen
▪ Vorlagenkonzept

Weitergehende Unterstützungsmöglichkeiten
▪ Abbildung von Freigabeworkflows

Seite 9 © Fraunhofer IAO - offen -

Gliederung

Dokumenten- Dokumenten- Ablage/


Dokumenten-Erstellung
Erfassung Erschließung Archivierung

Seite 11 © Fraunhofer IAO - offen -

11

2. Themenblock - Technische Aspekte von


Dokumentenmanagement 3
Vorlesung Geschäftsprozessmanagement DHBW Mannheim 2022

Erfassung elektronischer Dokumente


Direkte Übernahme aus der Anwendung möglich

Aus vielen Werkzeugen direkte Übernahme möglich


▪ Office-Anwendungen
▪ Mail-Werkzeuge
▪ CAD-Anwendungen
▪ …

Dateiformat sollte dem System bekannt sein

Erfassung und Erschließung für den Anwender oftmals in einem Arbeitsgang (bspw. »drag & drop« einer Datei ins
DMS)

Seite 13 © Fraunhofer IAO - offen -

13

Mögliche Erfassungsverfahren für Papierdokumente


Verschiedene Technologien im Einsatz

Verfahren: Bewertung:

Manuelle Erfassung (z.B. Eintippen von Überweisungsaufträgen, Manuelle Erfassung


Krankenscheinen, Arztabrechnungen usw.) ▪ Nur bei kleinen Mengen bzw. problematischen Vorlagen sinnvoll

Erfassung mittels Scanner Scanner


▪ Technik vergleichbar mit Kopierern ▪ Als Standard etabliert
▪ Von kleinen bis großen Volumina im Einsatz
▪ Robust und relativ schnell

Erfassung über Kameras Kameras


▪ Dokument wird mittels Digitalkamera fotografiert ▪ Bei Notwendigkeit extrem schneller Erfassung bzw. bei Erfassung
empfindlicher Vorlagen
▪ Zusätzlich heute Fotografieren von Belegen mittels Smartphone

Seite 14 © Fraunhofer IAO - offen -

14

2. Themenblock - Technische Aspekte von


Dokumentenmanagement 4
Vorlesung Geschäftsprozessmanagement DHBW Mannheim 2022

Erfassung von Papierdokumenten


Einflussfaktoren für den Erfassungsaufwand

▪ Notwendige Vorlagenaufbereitung (Klammern entfernen, glätten, aus Folienhüllen entnehmen, sortieren, kopieren ...)
▪ Qualität der Vorlagen (Kontrast, Format, Papierqualität ...)
▪ Art der benötigten Information (Farbe, S/W, Graustufen ...)
▪ Qualitätsanforderungen an die Scans (Auflösung, Weiterverarbeitung ...)
▪ Benötigte Nachbearbeitung (Filtern, Bereinigen, Transformieren ...)
▪ Erforderliche Dokumentationspflichten
▪ Zu erfassende Datenmengen

Wichtiger Grundsatz:
Nicht jedes Dokument muss auch auf der höchsten Qualitätsstufe digitalisiert werden
→ Schutzbedarfsanalyse

Seite 16 © Fraunhofer IAO - offen -

16

Erfassungsvarianten bei Papierdokumenten


Die grundlegenden Alternativen im »Wer?« und »Wann?«

Alternativen bzgl. Personal Alternativen bzgl. Arbeitsablauf

Erfassung durch einen externen Dienstleister Frühes Scannen:


▪ Für alle Dokumente ▪ Scannen vor der Bearbeitung und Verteilung der elektronischen
▪ Nur für den Altbestand Dokumente
▪ Nur für bestimmte Formate oder Dokumente ▪ → Digitaler Workflow

Erfassung durch eigene Mitarbeiter Spätes Scannen:


▪ Ggf. temporär durch Externe verstärkt ▪ Verteilung der Papierdokumente und Erfassung erst nach Abschluss
der Bearbeitung
▪ → Langzeitablage

Seite 17 © Fraunhofer IAO - offen -

17

2. Themenblock - Technische Aspekte von


Dokumentenmanagement 5
Vorlesung Geschäftsprozessmanagement DHBW Mannheim 2022

Frühes vs. Spätes Scannen


Was bedeutet das?

Frühes Scannen Spätes Scannen

Vorteile: Vorteile:
▪ Verteilung elektronischer Dokumente ▪ Geringerer Umstellungsaufwand für die Sachbearbeiter
→ Einsparung von Postverteilzeiten ▪ Nur relevante Dokumente werden im System aufgenommen
▪ Dokument unmittelbar nach Eingang elektronisch abgelegt
→ Sicherheit, Zugriffsmöglichkeit, Nutzung im HomeOffice Nachteile:
▪ Keine Beschleunigung der Postverteilzeiten
Nachteile: ▪ Gefahr des »Verlierens« von Dokumenten vor der Archivierung
▪ Auch unwichtige Dokumente landen im System ▪ Dokumente stehen im HomeOffice nur analog (= als Papier) zur
▪ Nacherfassungsprozess (für nicht zu erfassende Dokumente) Verfügung
umzusetzen ▪ Dokumente erst nach der abgeschlossenen Bearbeitung für Andere
▪ Zeitliche Rahmenbedingungen beachten im System recherchierbar
▪ Größerer Umstellungsaufwand für die Sachbearbeiter

Das Dokument sollte bei der Sachbearbeitung bereits im


System erschlossen werden!

Seite 18 © Fraunhofer IAO - offen -

18

»Frühes Scannen«
Beispielhafter Ablauf der Erfassung am Posteingang

Posteingang und Scannen und


Vorbereitung der Basis-Erschließung Sachbearbeitung
Qualitätskontrolle
Dokumente

Seite 19 © Fraunhofer IAO - offen -

19

2. Themenblock - Technische Aspekte von


Dokumentenmanagement 6
Vorlesung Geschäftsprozessmanagement DHBW Mannheim 2022

Platzierung der Scanstelle


Viele Alternativen denkbar

Bei interner Erfassung Bei Outsourcing der Erfassung Grundsätze

▪ Direkt am Arbeitsplatz der Sachbearbeitung ▪ Beim Dienstleister vor Ort Position abhängig vom
▪ An zentraler Stelle in der Abteilung (bspw. ▪ Inhouse mit Maschinen und Arbeitskräften Erfassungsprozess!
Sekretariat) des Dienstleisters
▪ An allen Orten im Unternehmen, an denen Viele Alternativen und Kombinationen
Papierdokumente entgegengenommen denkbar
werden (z.B. Warenannahme, Außenstelle,
Poststelle) Geeignete Alternative (oder Kombination
▪ An einer zentralen Stelle des von Alternativen) ist individuell zu
Unternehmens bestimmen
(z.B. neue Stelle, Archiv, Poststelle)

Seite 20 © Fraunhofer IAO - offen -

20

Gliederung

Dokumenten- Dokumenten- Ablage/


Dokumenten-Erstellung
Erfassung Erschließung Archivierung

Seite 25 © Fraunhofer IAO - offen -

25

2. Themenblock - Technische Aspekte von


Dokumentenmanagement 7
Vorlesung Geschäftsprozessmanagement DHBW Mannheim 2022

Erschließungs- vs. Suchaufwand


Zwei Seiten der gleichen Medaille

Erschließung Wiederauffindung

Hoch
Suchaufwand

Niedrig Erschließungsaufwand Hoch

Seite 26 © Fraunhofer IAO - offen -

26

Manuelle Attributierung
Der Standardfall zur Dokumentenerschließung

Die Erschließung erfolgt durch den Bearbeiter

Vergabe der Attributwerte auch für unstrukturierte Dokumente möglich

Abstraktion des Attributwerts vom Inhalt möglich

2 grundsätzliche Probleme:
▪ Tippfehler des Benutzers
▪ Differierende Begriffswelten
(z.B. Unfallbericht, Unglücksfall, Beschreibung Unfallhergang, Schilderung Autounfall mit Personenschaden)

Möglichkeit zur Lösung der Probleme: Normierung der erlaubten Werte


▪ Validierung der Einträge (z.B. Abgleich mit Kunden-DB, Prüfziffern)
▪ Schlagwortlisten
▪ Thesaurus

Seite 27 © Fraunhofer IAO - offen -

27

2. Themenblock - Technische Aspekte von


Dokumentenmanagement 8
Vorlesung Geschäftsprozessmanagement DHBW Mannheim 2022

Die Entwicklung vom Freitext zu Thesaurus


Bei großen Begriffsräumen unerlässlich
Alle Wörter als Stichwörter
Synonymproblem
Relevanzproblem
Mehrdeutigkeit
selektive eingeschränktes
Vergabe Vokabular
restriktiv
unstrukturiert Schlagwortliste
strukturieren
ergänzen vergrößern
zunehmend
unzuv erläs s ig
freie
Verschlagwortung
uns trukturiert

Thesaurus

Seite 29 © Fraunhofer IAO - offen -

29

Domänenspezifischer Thesaurus
Zwei Beispiele (www.openthesaurus.de)

Seite 30 © Fraunhofer IAO - offen -

30

2. Themenblock - Technische Aspekte von


Dokumentenmanagement 9
Vorlesung Geschäftsprozessmanagement DHBW Mannheim 2022

Erschließung gescannter Dokumente mittels Optical Character Recognition (OCR)


Voraussetzung zur digitalen Weiterverarbeitung von Papierdokumenten

Papier- Digitalisieren /
dokument(e) Einscannen

Texterkennung
Bitmap-Abbild
durch OCR

abcdefg
hijklmnop Text in Weiterverarbeitung
qrstuvw
xyz ASCII-Code des Dokuments

Seite 31 © Fraunhofer IAO - offen -

31

Abgrenzung OCR vs. ICR


Vom einzelnen Zeichen zum Layout

OCR: ICR (Intelligent Character Recognition):

Suche nach Suche nach


▪ Einzelzeichen ▪ Layout (Strukturerkennung)
▪ Worten
Automatische Erkennung von Formularen
Teilweise mit Unterstützung von Wortlisten und Thesauri
Automatische Erkennung der Dokumentklassifikation
Probleme
▪ Bspw. Erkennung von Ziffern
(statt der Ziffer 8 erkennt die OCR die Ziffer 6)
▪ Erkennung von Handschriften

Seite 32 © Fraunhofer IAO - offen -

32

2. Themenblock - Technische Aspekte von


Dokumentenmanagement 10
Vorlesung Geschäftsprozessmanagement DHBW Mannheim 2022

OCR / ICR-Einsatz
Belegqualität und Weiterverarbeitung entscheidend

Erkennungsrate der Texterkennung bei 99,8%


▪ Stark abhängig von der Qualität der Vorlage

Schriftarterkennung
▪ Alle gängigen Maschinenschriften
▪ Handschrifterkennung noch im Stadium der Entwicklung (Ausnahme: Massenbelege)

Vereinfachung der Erkennung über die Definition von Ausschnitten und Informationsart
→ automatisch identifizierbares Formular

Seite 33 © Fraunhofer IAO - offen -

33

Generelle Herausforderung der Text-Erkennung


Es wird exakt das gelesen, was auch da steht

Software ist der menschlichen »Brainware« unterlegen


▪ »DIE S0FTW4RE SI3HT NUR D4S, W4S 4UCH D4 ST3HT«
▪ Abstiarkton vom Ilnaht siwoe Koktrerur von Sciherebehlfrn nur begnrezt mciöglh

Einsatz von Wörterbüchern zur Validierung der Erkennung kann Ergebnisse verbessern
▪ Bei »normierter« oder normaler Sprache gute Ergebnisse
▪ Bei Fachsprache ggf. problematisch (außer Kontext ist bekannt)

Sichere Erkennung von Ziffern/Zahlen setzt Validierung voraus


▪ Interne Validierung/Plausibilitätsprüfung (bspw. Prüfziffer oder »Bruttopreis = Nettopreis + Steuer«)
▪ Validierung mittels (externer) Datenbanken (Kunden-ID, BIC, …)

Seite 34 © Fraunhofer IAO - offen -

34

2. Themenblock - Technische Aspekte von


Dokumentenmanagement 11
Vorlesung Geschäftsprozessmanagement DHBW Mannheim 2022

Mögliche Dokumentenstrukturen bei der automatischen Attributierung


Unstrukturierte Dokumente nach wie vor problematisch

Definierte, feste Struktur


▪ Formularauslese-Funktionalität
▪ Automatische Felderkennung
▪ Validierung der erkannten Inhalte möglich

Unstrukturierte, dynamische Dokumentenstruktur


▪ Sehr komplexe Funktionalität notwendig
▪ Bisher nur in ersten Ansätzen realisiert und auf dem Markt erhältlich
▪ Aktuelles Ziel: Erkennung des Dokumenttyps und einzelner herausragender Attribute

Seite 35 © Fraunhofer IAO - offen -

35

Gliederung

Dokumenten- Dokumenten- Ablage/


Dokumenten-Erstellung Input-Management
Erfassung Erschließung Archivierung

Seite 42 © Fraunhofer IAO - offen -

42

2. Themenblock - Technische Aspekte von


Dokumentenmanagement 12
Vorlesung Geschäftsprozessmanagement DHBW Mannheim 2022

Aktueller Trend im DMS-Markt


Automatisierte Posteingangslösungen

Sollen Posteingang automatisieren

Oftmals Kombination verschiedener Software-Komponenten


▪ Scannsoftware inkl. OCR-Komponente
▪ Formularerkennung und/oder Freiform-Verarbeitung
▪ Datenextraktion und –validierung
▪ Datenübergabeschnittstelle in kaufm. Software (bspw. SAP)

Ziel:
▪ Möglichst Blindverarbeitung der eingehenden Dokumente

Bewertung
▪ Systeme funktionieren bei homogenem Ausgangsmaterial relativ gut
▪ Automatisierungsrate extrem von Qualität des Ausgangsmaterials abhängig
▪ Komplexe Buchungen (bspw. mehrere Bestellungen auf einer Rechnung oder Teillieferungen) problematisch

Seite 43 © Fraunhofer IAO - offen -

43

Gliederung

Dokumenten- Dokumenten- Ablage/


Dokumenten-Erstellung
Erfassung Erschließung Archivierung

Seite 45 © Fraunhofer IAO - offen -

45

2. Themenblock - Technische Aspekte von


Dokumentenmanagement 13
Vorlesung Geschäftsprozessmanagement DHBW Mannheim 2022

Suche nach Dokumenten/Informationen


Grundlegende Recherchemethoden

hierarchisch direkt Navigation

Ordner wählen Stichwörter Index Einstieg

Inhaltsverzeichnis Boolesche Verknüpfung


Links

gewünschte Dokumente

Seite 46 © Fraunhofer IAO - offen -

46

Direktes Retrieval
Das Standardverfahren im DMS

Abgleich von
▪ Benutzerfrage und
▪ Datenbankinhalt

Formulierung der Suchanfrage mittels


▪ Schlüsselwörtern
▪ Verknüpfung durch Boolesche Operatoren
▪ Thesaurus
▪ Fragekatalog
▪ Relevance Feedback

Seite 47 © Fraunhofer IAO - offen -

47

2. Themenblock - Technische Aspekte von


Dokumentenmanagement 14
Vorlesung Geschäftsprozessmanagement DHBW Mannheim 2022

Prinzip des direkten Information-Retrieval

Informationsbedarf Dokumenten-
sammlung

Feedback stellt
Attributierung
Anfrage
Vergleich der
Anfrage mit dem
Dokumenten-
bestand

relevant/
nicht relevant Ergebnisliste
(Dokumente, die auf
die Anfrage passen)

Seite 48 © Fraunhofer IAO - offen -

48

Fakten-Retrieval
Die einfachste Variante der Informationssuche

Keine aufwändige Suche sondern quasi »holen statt suchen«


▪ Versicherungsakte L2030571120/03P
▪ Auftragsnummer 950715128-14
▪ Aktenzeichen MIP/TS/DNP 96041

Seite 49 © Fraunhofer IAO - offen -

49

2. Themenblock - Technische Aspekte von


Dokumentenmanagement 15
Vorlesung Geschäftsprozessmanagement DHBW Mannheim 2022

Die zwei Welten der Informationssuche


Fakten- oder Dokumenten-Retrieval

exakte Frage unscharfes


Informationsdefizit

Information Retrieval-
Datenbank-Systeme System/DMS für
für Faktenwissen Dokumente

Seite 50 © Fraunhofer IAO - offen -

50

Grundsätzliche Ebenen der Recherche


Suche über und in Dokumenten

Auf den Meta-Attributen


▪ Beschreiben den Inhalt
▪ Werden individuell (je Dokument-Typ) vergeben
▪ Beispiele:
▪ Abgabe-Datum
▪ Titel der Studienarbeit
▪ Matrikel-Nummer des Studierenden
▪ Stichworte

In dem eigentlichen Dokumentinhalt


▪ Alle im Dokument vorkommenden Worte stehen zur Recherche zur Verfügung
→ Volltextrecherche

Seite 51 © Fraunhofer IAO - offen -

51

2. Themenblock - Technische Aspekte von


Dokumentenmanagement 16
Vorlesung Geschäftsprozessmanagement DHBW Mannheim 2022

Volltextrecherche
Grundlegendes Konzept der Umsetzung

Verschlagwortung erfolgt unmittelbar bei der Übernahme des Dokuments ins System
▪ Unmittelbar nach dem Einstellen im System wird das Dokument verarbeitet und der Volltextindex des Dokuments erstellt
▪ Verarbeitung kann (je nach Größe und Leistungsfähigkeit der Software) wenige Minuten dauern
▪ Teilweise Verarbeitung auf separater Hardware/CPU

Unmittelbare Aktualisierung bei Änderung oder Löschen des Dokuments erforderlich

Index legt Möglichkeiten bei der Recherche fest


▪ Gehen Suchoptionen wie »ähnlich wie«, »nahe bei« oder »innerhalb eines Absatzes« ?

Auch bei großem Dokumentenbestand relativ schnelle Suche, da die Suche auf dem Volltextindex (d.h. auf einer
Datenbank) ausgeführt wird

Seite 52 © Fraunhofer IAO - offen -

52

Volltextrecherche
Linguistische Rechercheunterstützung

Standardfunktionalität Ausgefeiltere Konzepte

Varianten Synonymliste
▪ Calcium, Kalzium ▪ Vorgangsbearbeitung  Workflow
▪ Prozess, Prozeß ▪ DMS  ECM
▪ Dokumenten-Management, Dokumentenmanagement ▪ File  Datei
▪ e-business, E-Business, e-Business, E-business
Mehrsprachige Suche
Morphologie
▪ Folien, Folie Thesaurus
▪ Dokument, Dokumentes, Dokuments ▪ Oberbegriff/ Unterbegriff
▪ verwandter Begriff

Seite 53 © Fraunhofer IAO - offen -

53

2. Themenblock - Technische Aspekte von


Dokumentenmanagement 17
Vorlesung Geschäftsprozessmanagement DHBW Mannheim 2022

Repräsentation des Resultats der Suche


Unterstützung des Anwenders ist entscheidend

Liste von Dokumenten (Hit-Liste)


▪ Titel
▪ Autor
▪ Relevante Attribute
▪ Zusammenfassung (Abstract)
▪ Thumbnails
▪ Gesamtes Dokument
▪ …

Sortiert nach
▪ Wichtigkeit / Relevanz
▪ Datum (chronologisch)
▪ Dokumentenname (alphabetisch)
▪ Attributgruppierung
▪ …

Seite 54 © Fraunhofer IAO - offen -

54

Qualität des Suchergebnisses


Evaluation des Suchergebnisses

Effizienz
▪ Benötigte Prozessorleistung
▪ Notwendiger Energieeinsatz
▪ Benötigter Speicherplatz

Effektivität gefunden relevant


▪ Relevanz
𝑟𝑒𝑙𝑒𝑣𝑎𝑛𝑡 ∩ 𝑔𝑒𝑓𝑢𝑛𝑑𝑒𝑛
▪ Recall:
𝑟𝑒𝑙𝑒𝑣𝑎𝑛𝑡

𝑟𝑒𝑙𝑒𝑣𝑎𝑛𝑡 ∩ 𝑔𝑒𝑓𝑢𝑛𝑑𝑒𝑛
Daten-Basis
▪ Precision:
𝑔𝑒𝑓𝑢𝑛𝑑𝑒𝑛

Seite 56 © Fraunhofer IAO - offen -

56

2. Themenblock - Technische Aspekte von


Dokumentenmanagement 18
Vorlesung Geschäftsprozessmanagement DHBW Mannheim 2022

Gliederung

Dokumenten- Dokumenten- Ablage/


Dokumenten-Erstellung
Erfassung Erschließung Archivierung

Seite 61 © Fraunhofer IAO - offen -

61

COLD
Was ist das?

COLD = Computer-Output on Laserdisk


▪ Begriff bezeichnete ursprünglich Verfahren, um Großrechnerausgaben mittels digitaler Archivmedien dauerhaft zu archivieren
▪ Große Anzahl von Dokumenten »in einem Rutsch« verarbeitet (z.B. 1000 Lieferscheine in einem File)

Heute:
▪ Synonym für die Schnittstelle zur automatischen Übergabe von Dokumenten aus Vorsystemen (insbes. ERP-Systemen) in ein
ECM-System (bspw. Archiv)

Für beide gilt:


Automatische Übernahme und Verschlagwortung ist im allgemeinen relativ problemlos

Seite 62 © Fraunhofer IAO - offen -

62

2. Themenblock - Technische Aspekte von


Dokumentenmanagement 19
Vorlesung Geschäftsprozessmanagement DHBW Mannheim 2022

Gliederung

Dokumenten- Dokumenten- Ablage/


Dokumenten-Erstellung
Erfassung Erschließung Archivierung

Seite 66 © Fraunhofer IAO - offen -

66

Begriffsbestimmung
Was ist Ablage/ Archivierung?

Übernahme und Verwaltung von Dokumenten


▪ Auch Verwaltung der Attributdaten
▪ Ggf. Speicherung der Dokumente in verschiedenen Formaten (Primär- und Langzeitformat)

Ablage der Dokumente auf geeigneten Medien


▪ Optische Medien oder spezielle Festplatten-Speicher bei revisionssicherer Archivierung
▪ RAID- oder Caching-Systeme bei schnellem Datenzugriff

Bereitstellung von Mechanismen zur effizienten Verwaltung der Medien


▪ Umsetzung entsprechender Backup- und Spiegelungskonzepte

Bereitstellung von Mechanismen zur Umsetzung gesetzlicher Anforderungen


▪ Einhaltung von Aufbewahrungsfristen
▪ Unterstützung bei Löschfristen

Seite 67 © Fraunhofer IAO - offen -

67

2. Themenblock - Technische Aspekte von


Dokumentenmanagement 20

Das könnte Ihnen auch gefallen