Sie sind auf Seite 1von 48

White Paper

Systemarchitektur

Version 1.2

Februar 2010

DocuWare AG

Therese-Giehse-Platz 2

82110 Germering
Impressum:

DocuWare AG

Therese-Giehse-Platz 2

82110 Germering

Telefon: +49.89.89 4433-0

Telefax: +49.89.841 9966

E-Mail: infoline@docuware.com

Disclaimer:

Dieses Dokument wurde nach bestem Wissen mit großer Sorgfalt zusammengestellt.
Sämtliche Angaben beziehen sich auf DocuWare-Produkte ab Version DocuWare 5.1c.
Es sollen im Wesentlichen die technische Grundstruktur der DocuWare-Produkte
erläutert werden. Abweichungen einzelner Funktionen von der jeweils verfügbaren
Version, die von geringer oder kurzfristiger Bedeutung sind, sind möglich.

© Copyright 2010 DocuWare AG, alle Rechte vorbehalten.

2
Inhalt

Inhalt
1. Zielsetzung des White Papers ......................................................................... 5

2. Die Anforderungen der Zukunft ....................................................................... 6

3. Überblick Systemarchitektur ........................................................................... 8


3.1. Design-Vorgaben ..................................................................................................................... 8
3.1.1. Anforderungen aus Betreibersicht ....................................................................................................... 8
3.1.2. Anforderungen aus Benutzersicht...................................................................................................... 10

3.2. N-Tier-Architektur .................................................................................................................. 12

3.3. DocuWare-Systemarchitektur............................................................................................... 13

3.4. Betriebssysteme und Systemvoraussetzungen ................................................................. 15


3.4.1. Client-Systeme .................................................................................................................................. 15
3.4.2. DocuWare-Server .............................................................................................................................. 15
3.4.3. Infrastruktur-Komponenten ................................................................................................................ 16
3.4.4. Terminalserver ................................................................................................................................... 16

3.5. Zusammenfassung ................................................................................................................ 16

4. Authentication Server ..................................................................................... 17


4.1. Passwörter .............................................................................................................................. 18

4.2. Login im LAN/VPN ................................................................................................................. 18

4.3. Login via Internet ................................................................................................................... 19

4.4. Berechtigungskonzept .......................................................................................................... 19


4.4.1. Rollen ................................................................................................................................................ 19
4.4.2. Profile ................................................................................................................................................ 20
4.4.3. Benutzer und Gruppen ...................................................................................................................... 20

5. Content Server ................................................................................................ 21


5.1. Archiv ...................................................................................................................................... 22

5.2. Ablagestruktur........................................................................................................................ 23

5.3. Plattenkonzept........................................................................................................................ 24

5.4. Unterstützte Ablagemedien .................................................................................................. 25


5.4.1. Festplatten, RAID .............................................................................................................................. 25
5.4.2. Optische Wechselplatten ................................................................................................................... 25
5.4.3. Jukeboxen ......................................................................................................................................... 26
5.4.4. Content Adressed Storage (CAS) ...................................................................................................... 26
5.4.5. NetApp Storage ................................................................................................................................. 27

5.5. Header-Datei ........................................................................................................................... 27

5.6. Metadaten ............................................................................................................................... 28

5.7. Dokument................................................................................................................................ 29

3
Inhalt

6. Datenbanken ................................................................................................... 30
6.1. Datenbank-Struktur ............................................................................................................... 30

6.2. Integrierte Datenbank ............................................................................................................ 31

6.3. Direkte Datenbank-Kopplung ............................................................................................... 31

6.4. Datenbank-Administration .................................................................................................... 32

7. Webbasierte Anwendungen ........................................................................... 33


7.1. Dokumentzugriff mittels Web Client .................................................................................... 33
7.1.1. Web Client Server.............................................................................................................................. 33
7.1.2. Imaging Server .................................................................................................................................. 33
7.1.3. Thumbnail Server .............................................................................................................................. 34
7.1.4. Web Instanzen ................................................................................................................................... 34
7.1.5. Web Client ......................................................................................................................................... 34
7.1.6. Click-Once Anwendungen ................................................................................................................. 35
7.1.7. Silverlight Plug-In für Web-Briefkörbe ................................................................................................ 35
7.1.8. Integration des Web Client in andere Anwendungen ......................................................................... 35

7.2. Webbasierte Administration ................................................................................................. 35

8. Process Management Framework ................................................................. 36


8.1. Workflow Server ..................................................................................................................... 36

8.2. Vordefinierte Batch-Prozesse ............................................................................................... 37

9. Volltext-Index .................................................................................................. 38
9.1. Funktionsprinzip .................................................................................................................... 38

9.2. Volltext-Tabellen und -Dateien ............................................................................................. 39

10. Verteilte und redundante Archive .................................................................. 40


10.1. Satellitenarchive..................................................................................................................... 40

10.2. Mobile Nutzer.......................................................................................................................... 41

10.3. Selbsttragende Archive ......................................................................................................... 41

11. Integration ....................................................................................................... 42

12. Skalierbarkeit .................................................................................................. 44


12.1. Clustering und Lastverteilung .............................................................................................. 45

12.2. Sonstige Performance-Maßnahmen .................................................................................... 45

13. Glossar ............................................................................................................ 46

4
Zielsetzung des White Papers

1. Zielsetzung des White Papers


Dieses White Paper ist das erste einer Reihe von Dokumenten, die dem technisch
interessierten Leser die Architektur des DocuWare-Systems erläutern. Es werden die
zugrunde liegenden Technologien erwähnt sowie ihre Anwendung durch das DocuWare-
System beschrieben.

Der Leser kann sich damit ein technisch fundiertes Urteil über das DocuWare-System bilden
und die Leistungsfähigkeit im Hinblick auf Anpassungsfähigkeit, Skalierbarkeit und
Performance bei bestehenden Anforderungen einschätzen. Es werden die getroffenen
Maßnahmen erläutert, um einerseits Zugangs- und Zugriffssicherheit zu erreichen und
andererseits Ausfälle von vorneherein zu vermeiden oder zumindest die Auswirkungen für
die Benutzer zu minimieren. Weiterhin liegt ein Schwerpunkt auf den Integrationsaspekten,
damit der Leser eine Vorstellung davon bekommt, wie sich das DocuWare-System im IT-
Umfeld mit anderen Systemen verhält und inwieweit im Sinne des Investitionsschutzes und
minimaler Administrationsaufwendungen (Total Cost of Ownership) Anpassungen
erforderlich sind.

Die technischen Mitarbeiter bei Kunden, Beratungsunternehmen, Fachzeitschriften und


Vertriebspartnern sind gleichermaßen angesprochen. Vorausgesetzt wird lediglich
technisches Grundlagenwissen über den Aufbau moderner Software-Applikationen,
idealerweise von Dokumenten-Management-Systemen. Detaillierte Kenntnisse aktueller oder
vorheriger DocuWare-Systeme sind nicht erforderlich.

Als erstes White Paper dieser Serie gibt das vorliegende Papier einen Überblick über die
Gesamtarchitektur. Des Weiteren existieren White Paper zu den Themen Sicherheit und
Integrationen.

5
Die Anforderungen der Zukunft

2. Die Anforderungen der Zukunft


DocuWare ist sowohl in Deutschland als auch international einer der führenden Hersteller für
Dokumenten-Management-Systeme. Dies ist das wichtigste und beste Urteil über die
Qualität und Leistungsfähigkeit der Systeme. Ein Erfolgsfaktor ist die intuitive Installation,
Bedienung und Administration des Systems.

Der Erfolg führt dazu, dass DocuWare-Systeme in zunehmend größeren und komplexeren
Installationen eingesetzt werden. Dieses White Paper zeigt auf, dass das DocuWare-System
technisch für diese größeren und komplexeren Umgebungen vorbereitet ist und auch ein
solides Fundament für die Anforderungen der Zukunft bildet.

Bei dem Wettbewerb um größere und komplexere Installationen misst sich DocuWare mit
anderen Konkurrenten als bisher, die aber größtenteils ihre Komplexität nach außen tragen.
DocuWare hingegen hält es für wichtig, die bisherigen Erfolgsfaktoren zu erhalten und
weiterhin führend in der Einfachheit bei Installation, Bedienung und Administration zu sein.

Obwohl heute nach wie vor eindeutig die konventionelle Nutzung von Archiven dominiert, ist
die Marktentwicklung hin zum „Integrierten Dokumenten-Management (IDM)“ und langfristig
hin zu „Enterprise Content Management“-System abzusehen.

Während die inhaltliche Definition bzgl. Enterprise Content Management (ECM) noch nicht
abgeschlossen ist, sind die Anforderungen des IDM in großen Teilen bereits heute aktuell
und werden auch durch die DocuWare-Systeme größtenteils abgedeckt.

Abbildung 1: Einsatzgebiete und Umsetzung der IDM-Anforderungen in DocuWare

Integriertes Dokumenten-Management muss unabhängig sein von „Zeit und Raum“. Das
heißt, es muss überall verfügbar sein, unabhängig davon, ob sich der Benutzer in der
Unternehmenszentrale, in einer Niederlassung, beim Kunden oder im Home-Office befindet.
Dazu gehört auch, dass die Ablage von Dokumenten nicht zwangsweise dort erfolgen muss,
wo die Dokumente anfallen, und dass die Dokumente unabhängig von dem Ort, von dem
aus sie archiviert wurden, zur Verfügung stehen.

6
Die Anforderungen der Zukunft

Hinzu kommen die unterschiedlichen Anforderungen der Kunden. Teilweise müssen enorme
Dokumentmengen erfasst und abgespeichert werden, obwohl wenige Zugriffe stattfinden.
Teilweise handelt es sich um relativ geringe Dokumentvolumen, auf die durch sehr viele
Benutzer aus unterschiedlichen Lokationen kontinuierlich zugegriffen werden muss.

Eine Differenzierung zwischen den Systemen und die Bewertung der Eignung für
große/komplexe Installationen müssen daher heute vor allem aufgrund der
Systemarchitektur erfolgen. Wichtig ist die Evaluierung der folgenden Kriterien:
 Administration
Intuitive und einheitliche Administration für das Gesamtsystem zur Reduktion der
Wartungskosten, einem Teil der Total Cost of Ownership (TCO).
 Skalierbarkeit
Um die Anforderungen zu erfüllen, kann es notwendig sein, ein großes
standortübergreifendes System zu realisieren oder aber mehrere kleinere Installationen,
falls dies den organisatorisch-technischen Gegebenheiten besser entspricht. Auf jeden
Fall braucht der mobile Nutzer die Möglichkeit, Teilarchive auf seinem Notebook zu
transportieren.
Es versteht sich von selbst, dass diese unterschiedlichen Anforderungen nicht mit
verschiedenen Systemen, sondern mit der gleichen Technik in unterschiedlichen
Ausbaustufen abgedeckt werden sollen.
 Sicherheit
Speziell bei Archiven spielt das Thema Sicherheit in den unterschiedlichsten Facetten
eine große Rolle. Einerseits ergibt sich über die Grundforderung der Revisionssicherheit
bereits die Notwendigkeit zumindest Datenverluste bei Ausfällen zuverlässig zu
vermeiden. Ist der Kunde von der Verfügbarkeit des Systems abhängig, was zunehmend
der Fall ist, so ergeben sich erhöhte Anforderungen an die Ausfallsicherheit.
Weiterhin spielt die Abbildung der organisatorischen Kompetenzen und Befugnisse eine
wesentliche Rolle. Die für den Benutzer verfügbare Funktionalität und die zugreifbaren
Dokumente müssen im Sinne der Zugangs- und Zugriffssicherheit flexibel nach
organisatorischen Gesichtspunkten eingeschränkt werden können.
 Integrationsfähigkeit
Die Verfügbarkeit von Schnittstellen, die Nutzung vorhandener IT-Infrastruktursysteme,
die Einhaltung von Standards und die Offenheit bzgl. Systeminternas sind die
bestimmenden Elemente für die Integrationsfähigkeit in die heutigen komplexen und
heterogenen IT-Landschaften.
 Migrationsfähigkeit
Bekanntlich hat die Informationstechnik sehr kurze Innovationszyklen, während die
Archive teilweise eine sehr lange Lebensdauer haben. Migration hat somit viel mit der
oben erwähnten Integrationsfähigkeit zu tun. Hinzu kommen
Kompatibilitätsanforderungen bzgl. der Systemgenerationen sowie Migrationstools.
In dem vorliegenden Dokument liegt der Schwerpunkt auf der Gesamtarchitektur. Zu den
Themen Sicherheit und Integrationsfähigkeit existieren weitere White Paper, die die Details
zu den genannten Aspekten beschreiben.

7
Überblick Systemarchitektur

3. Überblick Systemarchitektur
3.1. Design-Vorgaben
Die Architektur des DocuWare-Systems wurde gezielt entwickelt, um ein stabiles Fundament
für die heutige Funktionalität wie auch für die absehbaren zukünftigen Anforderungen zu
bilden.

Um die volle IDM-Funktionalität in großen und komplexen Installationen anbieten zu können


und die aufgeführten Anforderungen an Skalierbarkeit, Integrationsfähigkeit etc. zu erfüllen,
wurden die Design-Vorgaben unterteilt in
 Anforderungen aus Betreibersicht und
 Anforderungen aus Benutzersicht.

3.1.1. Anforderungen aus Betreibersicht

Zu den Anforderungen aus Betreibersicht gehören:


 Mandantenfähigkeit, Unterstützung ASP-Modelle (Application Service Provider)
 Eignung für Betrieb in externen Rechenzentren
 Unterstützung browserbasierter Web-Zugriffe
 Unterstützung unterschiedlicher Sprachräume
 Unterstützung komplexer Installationen über mehrere Standorte hinweg
 Unterstützung sehr großer, revisionssicherer Dokumentablagen
 Offenheit für System-und Speichertechnologien
 Zusammenführung und Erweiterung der Workflow- und Automatisierungsfunktionen in
einem Process Management Framework
 Administration sämtlicher Module über ein Werkzeug
 Optimaler Betrieb im Microsoft-Umfeld
 Optimale Einbindung von Datenbanktechnologien der führenden Anbieter, unabhängig
vom Betriebssystem
Diese Anforderungen werden im Folgenden kurz beschrieben, weil sie wesentlich für die
Gestaltung der Systemarchitektur waren.

Mandantenfähigkeit und ASP-Unterstützung

DocuWare-Systeme sind voll mandantenfähig, d.h. ein Outsourcing-Dienstleister kann ein


System für unterschiedliche Kunden betreiben. Für jeden Kunden können Nutzer, Ablagen,
Funktionsmodule, Sprachunterstützung etc. völlig unabhängig voneinander definiert werden,
ohne Rücksicht auf die Einstellungen in anderen Mandanten nehmen zu müssen. Dazu
gehört natürlich auch, dass mehrere völlig unterschiedliche Archive, z.B. für unterschiedliche
Mandanten, mit verschiedenen Ablagestrukturen und/oder unterschiedlichen Speicher-
technologien gemeinsam in einem DocuWare-System betrieben werden können.

Realisiert wird dies durch die Definition verschiedener „Organisationen“ in der Administration,
wobei jede „Organisation“ für einen Mandanten steht. Weiterhin ist es möglich, für jeden
Kunden eigene Administratoren mit entsprechenden Rechten zu definieren und damit auch
zeitlich parallel kundenspezifische Konfigurationen vorzunehmen.

8
Überblick Systemarchitektur

Lediglich die Änderungen an Hardware und Basiskonfiguration, z.B. Art und Anzahl Server,
die das Gesamtsystem betreffen, erfordern eine abgestimmte Vorgehensweise. Dazu ist ein
separater „System-Administrator “ vorgesehen, der zwar befugt ist, solche
Systemänderungen durchzuführen, aber bzgl. der Datenbestände einzelner Mandanten
durchaus in seinen Rechten begrenzt sein kann. Über die Protokollierung kann die Nutzung
nachvollzogen und Sicherheit hergestellt werden.

Über die eingebaute Protokollierung ist auch eine Abrechnungsbasis für den Betrieb im ASP-
Modell verfügbar. Ein DocuWare-Betreiber kann daher als Dienstleister für mehrere Kunden
unterschiedliche DocuWare-Konfigurationen gleichzeitig fahren.

Web-Zugriffe

Mit dem Web Client bietet DocuWare die Möglichkeit, über Internet/Intranet/Extranet auf die
DocuWare-Archive zuzugreifen. Alle wesentlichen Funktionen, wie Dokumente öffnen, mit
Anmerkungen und Stempeln versehen, Indexbegriffe ändern und Dokumente ablegen,
stehen so unabhängig vom Arbeitsplatz und ohne Installation am Client-Rechner zur
Verfügung.

Mehrere Sprachräume

Als internationaler Anbieter ist die volle Unterstützung der wichtigsten romanischen,
germanischen, slawischen und Sprachen sowie Japanisch und Arabisch eine wesentliche
Anforderung. Dazu gehört nicht nur die Übersetzung der Oberflächenelemente, sondern z.B.
auch die Unterstützung verschiedener Zahlen- und Datums-Formate.

DocuWare nutzt auf der Serverseite und bei den neueren Client-Komponenten den Unicode.
Unicode-Zeichen (UTF8) werden sowohl für die Oberflächen als auch für die Datenhaltung
benutzt. Damit können in einem Archiv Dokumente und zugehörige Indexdaten aus
unterschiedlichen – auch asiatischen - Sprachräumen gemeinsam verwaltet werden. Dies
gilt auch für die Nutzung des Volltext-Index.

Standortunabhängigkeit

Um in größeren Organisationen als Infrastruktur dienen zu können, müssen die Systeme


standortübergreifend funktionieren. Standortübergreifende Archive und Teilarchive,
Kommunikation zwischen den Komponenten über WAN-Technologie, entfernte
Administration und Synchronisationsmechanismen sind daher wesentliche Bestandteile der
Architektur.

Große, revisionssichere Installationen

Die heutige Hardware erlaubt die Speicherung enormer Informationsmengen, so dass viele
Kunden bereits über gewaltige Archive verfügen. Die Software sollte dafür keine Begrenzung
darstellen. Es wurde darauf geachtet, dass das DocuWare-System beliebig große
Dokumentmengen mit der vollen Funktionalität, inkl. Sicherheitsfunktionen verarbeiten kann.

Offenheit für System- und Speichertechnologien

Aufgrund der oben geschilderten Notwendigkeit, sich in heterogene IT-Landschaften optimal


integrieren zu können, wurde großer Wert auf die Unterstützung und Nutzung bestehender
De-facto-Standards gelegt. Dies bezieht sowohl die Nutzung von vorhanden Directory-,
Datenbank- und Mail-Servern, als auch die Offenheit für unterschiedliche
Speichertechnologien mit ein.

9
Überblick Systemarchitektur

Process Management Framework

Im täglichen Betrieb eines DMS gibt es viele Routineaufgaben, z.B. zur Dokumentüber-
nahme aus Datenquellen, die sich weitgehend automatisieren lassen. Gleichermaßen
ergeben sich bei den Benutzern – vor allem in administrativen Bereichen – häufig gleichartig
wiederkehrende Abläufe. Es bestand daher die Forderung, ein leistungsfähiges Werkzeug
für die Automatisierung von sowohl systeminternen als auch von benutzerorientierten
Abläufen zu entwickeln.

Die Anforderungen an modernes Dokumenten-Management gehen heute über die reine


Informationssammlung und -bereitstellung weit hinaus. Eine weitestmögliche
Automatisierung erfordert flexibel definierbare Prozesse für die Dokumenterfassung und
Weiterverarbeitung. Darüber hinaus steuern Dokumente heute vielfältig Arbeitsabläufe in den
Organisationen. Die elektronische Abbildung dieser Prozesssteuerung durch Dokumenten-
Workflow-Funktionen gehört zu den Aufgaben des Dokumenten-Managements.

Das DocuWare-System verfügt zu diesem Zweck über den Workflow Server, der sämtliche
Automationsprozesse steuert und als Workflow-Engine für den Dokumenten-Workflow dient.

Administration sämtlicher Module über ein Werkzeug

Komplexe Systeme, mit vielen Modulen, Schnittstellen und Optionen neigen zu exponentiell
steigendem Administrationsaufwand. Der Name DocuWare steht hingegen für einfach zu
installierende, zu bedienende und zu administrierende Systeme. Dieses Ziel wird auch in
Zukunft weiterverfolgt. Somit bestand die Forderung, auch große und komplexe
Installationen über ein zentrales, einfach zu handhabendes Werkzeug administrieren zu
können.

Datenbanktechnologien der führenden Anbieter

Optimale Einbindung von Datenbanktechnologien der führenden Anbieter unabhängig vom


Betriebssystem ist erforderlich, um das DocuWare-System möglichst transparent und
problemlos in die bestehenden Infrastrukturen einbinden zu können. Diese Anforderung
ergibt sich sowohl aus Gründen des Investitionsschutzes als auch wegen der effizienteren
Administrierbarkeit.

Offenheit für unterschiedliche Speichertechnologien

Verschiedene Speichertechnologien stehen seit geraumer Zeit in einem harten Wettbewerb


zueinander. Die jeweiligen Stärke- / Schwäche-Profile ändern sich entsprechend schnell.
Andererseits müssen Archivsysteme effiziente und sichere Ablagen über lange Zeiträume
gewähren. Offenheit für unterschiedliche Speichertechnologien, unabhängig vom
Betriebssystem ist daher entscheidend, um diese Sicherheit und Effizienz über die gesamte
Ablagezeit zu erreichen.

3.1.2. Anforderungen aus Benutzersicht

Auch wenn die Anforderungen aus Betreibersicht essentiell für die Systemarchitektur sind,
so ergibt sich der Nutzen für den Anwender dennoch aus der Funktionalität des
Dokumenten-Management-Systems. An dieser Stelle sind die Funktionen summarisch
aufgelistet, um einen Überblick der Anforderungen zu geben. Detaillierte Beschreibungen
sind der entsprechenden Produktliteratur und der DocuWare Web-Site zu entnehmen
(www.docuware.com).

10
Überblick Systemarchitektur

Kategorie Abdeckung heute


Imaging Voll integrierter Scan-Client
Flexible Integration von Netzwerkscannern und Digitalkopierern, zum Teil mit
direkten Konnektoren
Integrierte Funktionen für die Bildverbesserung
Barcode-Erkennungen, zonenbasierte und Volltext-OCR
Dokumentklassifikation
Dokument-Viewer mit hoher Darstellungsqualität, umfangreichen Funktionen und
breiter Formatunterstützung, sowohl im Web- als auch im Windows-Client
Integration von High-End Imaging- und Klassifikationswerkzeugen (Ascent Capture,
VRS, AnyDoc …)
COLD/ERM High Performance COLD mit effizientem Speicherformat
Flexible Anpassung von Spool-Dateien an Klassifizierungsregeln
Schneller Import von Spool-Dateien
Tiff-Drucker als leistungsstarke Komponente für das Imaging
Integration Leistungsstarker Konnektor für SAP R/3
Archivierungs- und Recherchekonnektor für Notes / Domino
Konnektor zu SharePoint
Integration für die Mail-Archivierung aus Outlook und Exchange
Einfache, menügeführte Integration in fast alle Windows-Anwendungen
Integration des Web Clients oder einzelnen Elementen davon in andere
Anwendungen über URL
Konnektoren zur direkten Anbindung von Multifunktionskopierern verschiedener
Anbieter
Verschiedenste Programmierschnittstellen zur Ansteuerung von DocuWare aus
anderen Anwendungen heraus
Das White Paper Integrationen bietet Ihnen eine detaillierte Beschreibung der
Integrationsmöglichkeiten von DocuWare
Dokumenten Volle Viewer-Unterstützung für viele Formate „Codierter Informationen (CI)“,
Management einschließlich umfassender Anmerkungs-Funktionen
Automatischer Import und Klassifizierung von CI-Dateien, einschließlich E-Mail und
Office-Dateien
Sichere Locking-Mechanismen für das Bearbeiten von CI-Dateien mit ihren
Originalprogrammen
Überwachung der Manipulation von CI-Dateien durch Checksummen-Funktionen
und elektronische Signaturen
Check-in / Check-out für einfaches Versionsmanagement
Herunterladen oder Versenden von Dokumenten im Original- oder PDF-Format
Records Revisionssichere Archivierung aller Arten von CI- und NCI-Dokumente (NCI=Nicht
Management Codierte Information)
Export- und Migrationsfunktionen
Verwaltung und Überwachung von Aufbewahrungsfristen
Flexible Zugriffssicherung durch die Integration der Netzwerk-User-Directories
Protokollierung der Benutzerzugriffe auf die Dokumente

11
Überblick Systemarchitektur

Repository Unterstützung aller Arten von Speichertechnologien


Universelle Datenbankunterstützung, incl. Volltext
Offene, standard-basierte Architektur
Voll skalierbar
Flexible Zugriffskontrolle
Elektronische Signaturen
Umfangreiche Administrationswerkzeuge
Unterstützung marktführender Sicherheits- und Backuptechnologien
Windows- und Beide Clients einfach zu benutzen und zu administrieren
Web-Client
Abdeckung aller Imaging und Dokumentenmanagement-Funktionen mit einem
einheitlichen, durchgängigen Benutzerinterface
Web-Client nahtlos in fast alle Web-Anwendungen integrierbar
Workflow Einfacher regelbasierter Dokumenten-Workflow für Ad-hoc- und Production-
Workflow
Herausragende Benutzerfreundlichkeit durch den Einsatz der Stempeltechnologie
Automatisches Document Batch Processing
Sonstige ECM Nahtlose Integration von IDM-Funktionen in Web-Seiten
Steuerung der Dokumentbereitstellung im Web über Standard-IDM-Funktionen in
DocuWare
Offene Architektur des Dokumenten-Repositorys ermöglicht die Aufnahme aller
Digital-Asset-Typen

In den folgenden Kapiteln wird dargestellt, wie die oben beschriebenen Anforderungen in der
Systemarchitektur umgesetzt wurden.

3.2. N-Tier-Architektur
Die Architektur des DocuWare Systems folgt dem „N-tier-Konzept“, das eine
Weiterentwicklung des Client-Server-Konzepts darstellt. Das Konzept charakterisiert sich
dadurch, dass
 stark dialogorientierte Funktionen auf den Arbeitsplatzsystemen ablaufen,
 die Applikationslogik auf einem oder mehreren zentralen DocuWare-Servern lokalisiert
ist,
 mehrere Applikationen gemeinsame Ressourcen auf einem oder mehreren zentralen
Hintergrund-Servern nutzen.
Wie schon im klassischen Client-Server-Konzept, so steht auch hier der Begriff Server für
einen Software-Dienst und nicht für eine Hardware. Ein DocuWare-System besteht in diesem
Sinn immer aus mehreren (Software-)Servern, die aber - im Extremfall - alle auf einem
Hardware-System gleichzeitig ablaufen können.

12
Überblick Systemarchitektur

Abbildung 2: Grundsätzliche Produktarchitektur

3.3. DocuWare-Systemarchitektur
An dieser Stelle geben wir einen Überblick über die Architekturkomponenten. Die einzelnen
Komponenten werden anschließend in eigenen Kapiteln detaillierter beschrieben.

Ein DocuWare-System besteht mindestens aus den folgenden Software-Komponenten:


 Windows-Client
Um die Möglichkeiten der N-Tier-Architektur optimal zu nutzen, sind dialogintensive
Funktionen in der Client-Komponente auf jedem Arbeitsplatz zusammengefasst. Damit
wird ein Optimum an Bedienkomfort und Performance erreicht.
Weiterhin enthält der Windows-Client immer auch einen Scan-Client, so dass diese
Funktionalität –bei Verfügbarkeit eines Scanners am Arbeitsplatz – direkt bereit steht.
Durch die Bereitstellung der Scan-Funktionalität an jedem Client-Arbeitsplatz soll dem
Trend zum dezentralen Scannen Rechnung getragen werden. Dabei wird das Ziel
verfolgt, dem einzelnen Anwender die Erfassung von Informationen so einfach wie
möglich zu machen.
 Authentication Server
Der Authentication Server verwaltet sämtliche Ressourcen und Benutzer. Er ist die
zentrale „Schaltstelle“, die Anmeldungen (Login) entgegennimmt, Berechtigungen prüft,
Funktionen frei gibt und Ressourcen, z.B. Server den Benutzern zuweist.
 Content Server
Der Content Server verwaltet die logischen Archive. Er bedient sich dazu der Datenbank
zur Verwaltung der Indexdaten und sonstigen Anmerkungen zu den Dokumenten. Die
Dokumente selbst werden zusammen mit der Header-Datei in der Dateiablage abgelegt
(siehe Kapitel 5 „Content Server“).

13
Überblick Systemarchitektur

Abbildung 3: Systemarchitektur Minimalsystem

Aus diesem Basissystem heraus ist das DocuWare-System funktional ausbaufähig und in
feinen Stufen skalierbar. Das folgende Bild zeigt beispielhaft
 die funktionale Ergänzung um Prozess-Server,
 die Einbindung von Web-Clients mittels Web Client Server,
 die Nutzung separater Hardware-Systeme für
 Authentication Server und Workflow Server einerseits und
 Content Server andererseits,
 Datenbank und Dateiablage

Abbildung 4: Funktional erweitertes und optimiertes System

 Workflow Server
Der Workflow Server steuert sämtliche Automations- und Workflowprozesse. Zu den
Automationsprozessen gehören z.B. Dokumentenimport, -export, Archivsynchronisation,
Migration und Volltext-Indexierung.
 Web Client Server und Imaging Server
Über den Web Client Server, der wiederum auf den Imaging Server zugreift, können
Web Clients eingebunden werden. Die Nutzer dieser Clients benötigen lediglich einen
Browser (Internet Explorer oder Firefox) und können damit Dokumente in DocuWare-
Archiven ablegen, recherchieren, anzeigen, mit Anmerkungen und Stempeln versehen
und vieles mehr.

14
Überblick Systemarchitektur

Die Kommunikation zwischen den Komponenten erfolgt über Standard-Protokolle wie


TCP/IP und HTTP. Damit können auch standortübergreifende Systeme problemlos durch die
Nutzung der Internet-Technologie realisiert werden. Entsprechend dem Sicherheitsbedürfnis
ist die Kommunikation auch über VPN (Virtual Private Network) machbar.

Abbildung 5: Standortübergreifende Archive mit Master (m) und Satellite (s)

Diese Architektur erlaubt nicht nur den wechselseitigen Zugriff auf entfernte Archive, sondern
ebenfalls den Aufbau von redundanten Archiven, um unabhängig von Standort und
Übertragungskapazität auf den gleichen Archiven arbeiten zu können. Unabhängig von der
Art des Archivs („Master“ oder „Satellite“) kann in beiden Standorten die volle DocuWare-
Funktionalität inkl. Übernahme beliebiger Dokumente genutzt werden. Die Synchronisation
zwischen „Master“ und „Satellite“ erfolgt über den Workflow Server (siehe 8.1). Die gewählte
Architektur folgt damit vor allem den Anforderungen zur Skalierung über Standortgrenzen
hinaus in regional weit verzweigte Betriebsstätten einer Organisation.

3.4. Betriebssysteme und Systemvoraussetzungen

3.4.1. Client-Systeme

Auf der Client-Seite werden sämtliche Versionen von Microsoft Windows ab Version
Windows XP unterstützt. D. h. für diese Windows-Versionen ist ein Rich-Client verfügbar, der
sämtliche Funktionen des DocuWare-Systems zugänglich macht.

Über den Web Client Server können Benutzer mittels eines Web Browsers auf DocuWare
zugreifen.. Für den vollen Funktionsumfang bestehen für diese Web Clients folgende
Voraussetzung: Windows XP oder höher und Internet Explorer ab Version 6 oder Firefox ab
Version 2. Der Web Client kann aber auch mit Firefox auf Mac- oder Linux-Systemen
verwendet werden. (Einschränkungen im Funktionsumfang siehe 7.1.6 Click-Once
Anwendungen und 7.1.7 Silverlight Plug-In für Web-Briefkörbe.)

3.4.2. DocuWare-Server

Die Server des DocuWare-Systems sind auf Basis der .NET-Architektur von Microsoft
realisiert. Durch die Optimierung auf die Microsoft-Plattformen sind Installation und
Administration erheblich vereinfacht und es wurde maximale Performance erzielt.

15
Überblick Systemarchitektur

Obwohl das DocuWare-System eine Reihe eigener Server umfasst, benötigt es keine
Windows-Server-Lizenz, sondern lediglich die „Windows-Engine“. Damit ergeben sich klare
Vorteile bei der Wirtschaftlichkeit des Systems, auch bei Installationen mit mehreren
DocuWare-Servern.

DocuWare Server sind somit auf allen Plattformen lauffähig, die eine der Versionen Windows
XP/2003 oder höher unterstützen.

3.4.3. Infrastruktur-Komponenten

Essenziell benötigt DocuWare eine Datenbank und eine Dateiablage. Mit MySQL ist bereits
eine leistungsfähige Datenbank im Basissystem enthalten. Als Dateiablage kann ein
DocuWare Server beliebiges Windows-Dateisystem, z.B. das
der Content Server-Plattform genutzt
werden. Für beide Aufgaben werden häufig
dedizierte, bereits vorhandene
File Store User Directory Database Hardwaresysteme genutzt, die eventuell
LDAP auch auf Nicht-Windows-Plattformen
lokalisiert sind. Auch diese „Ressourcen“
Active können mit DocuWare genutzt werden.
Directory

NT Domain

Abbildung 6: Integration Offene Systeme

3.4.4. Terminalserver

Die Lauffähigkeit des DocuWare-System unter Nutzung des Microsoft Terminalserver und
der Citrix Metaframe Erweiterungen wurde ausgiebig getestet. Somit ist die Nutzung durch
sehr einfache Windows-Stationen in diesem Umfeld gewährleistet.

3.5. Zusammenfassung
DocuWare-Systeme lassen sich optimal in vorhandene IT-Landschaften integrieren, ohne
dass redundante Installations- und Administrationsaufwendungen, z.B. für Datenbanken oder
eine zusätzliche Benutzerverwaltung, anfallen.

Zusammenfassend kann man festhalten, ein DocuWare-System besteht immer aus


 einem oder mehreren DocuWare-Clients,
 einem Authentifizierungs-Server,
 einem oder mehreren weiteren DocuWare Server-Modulen.
Mindestens ein Content Server muss vorhanden sein. Dieser Content-Server greift immer zu
auf
 eine oder mehrere Datenbanken, ggf. auf fremden Servern,
 eine oder mehrere Dokumentablagen.
Für Web-Clients und automatisierte Prozesse stehen weitere Server-Module für funktionale
Erweiterungen zur Verfügung. Die Server-Funktionalität kann auf vielen Hardware-Systemen
verteilt sein. Die Integration mit „Nicht-Windows“-Systemen ist möglich.

16
Authentication Server

4. Authentication Server
Der Authentication Server verwaltet sämtliche Benutzer und Ressourcen des
Gesamtsystems. Die Nutzung des Systems erfordert zunächst immer eine Anmeldung am
Authentication Server.

Er ist zuständig für


 das Login der Benutzer,
 die Lizenzverwaltung,
 die Verwaltung der benutzerspezifischen Einstellungen.
Damit DocuWare mandantenfähig sein kann, sind Benutzer „Organisationen“ zugeordnet, die
über den Authentication Server verwaltet werden. Eine Organisation ist damit eine logische
Struktur. Diese umfasst:
 Benutzer und Benutzergruppen
 Logische Archive, inkl. zugehöriger Platten
 Prozesse
 Templates für Stempel, Erkennungsschemata für OCR (Optical Character Recognition)
und Barcode, Auswahllisten
 Protokollierung
Pro DocuWare-System existiert genau ein Authentication Server, der
organisationsübergreifend agiert. Um Ausfällen vorzubeugen oder eine sehr hohe Anzahl
von Benutzeranfragen besser bedienen zu können, kann der Authentication Server
redundant installiert sein. Benutzt wird der Authentication Server somit durch
 eine oder mehrere Organisationen mit jeweils
 mindestens einem oder vielen Benutzern.
DocuWare arbeitet mit internen User-IDs statt mit dem Benutzernamen des Login. Nur diese
User-IDs dienen als Datenbank-Schlüssel. Somit können Benutzer jederzeit umbenannt
werden, ohne die zugeordneten Einstellungen ändern zu müssen.

Abbildung 7: Authentifizierung

17
Authentication Server

Bei der Anmeldung eines Benutzers überprüft der Authentication Server auch die Lizenzen
für die verschiedenen DocuWare-Server, die diesem Nutzer zur Verfügung stehen. Es
werden sowohl „Concurrent Licenses“ als auch „Named Licenses“ unterstützt.

4.1. Passwörter
Passwörter werden generell verschlüsselt bzw. als Hash-Wert abgespeichert. Dies gilt auch
für Systemeinstellungen, wie z.B. das Login beim Datenbank-Server.

Konkret wird das sogenannte „salted“ Hash-Verfahren verwendet, bei dem durch
Kombination mit einem Zufallswert auch bei zwei identischen Passwörtern nicht der gleiche
Hashwert entsteht. Passwörter sind damit weder lesbar noch reproduzierbar

Die Möglichkeiten des Login werden bei der Definition des Benutzers spezifiziert. Die
Benutzerverwaltung obliegt dem Organisations-Administrator.

4.2. Login im LAN/VPN


Unterstützt werden die folgenden Methoden für das Login:
 DocuWare Login
Der Benutzer muss sich über Benutzernamen und Kennwort, wie in DocuWare
hinterlegt, als berechtigt ausweisen. Unabhängig von den verschiedenen DocuWare
Servern muss sich der Benutzer nur einmal einloggen.
 Trusted Login (Single Sign-On)
Der Client identifiziert sich – ohne weitere Benutzereingabe – über den Login-Namen
des Windows-Betriebssystems. Der Authentication Server prüft den Login mittels der
Benutzerverwaltung von Windows.
Über dieses Verfahren ist auch die Kooperation mit anderen Single-Sign-On-Systemen
möglich. Unterstützt werden dabei Verzeichnisdienste auf Basis von LDAP und Windows
Active Directory.
Login in DocuWare erfolgt immer über den Authentication Server. Das Login-Verfahren
enthält gleichzeitig die Prüfung der für den Nutzer verfügbaren Lizenzen.

DocuWare arbeitet mit einem „Ticket-Granting-Ticket“ (TGT), bei dem ein Benutzer bzw.
Client sich am Authentication Server identifiziert, um einen Service nachfragt, ein „Ticket“
erhält und mit diesem Ticket den Service eines anderen Servers, z.B. eines Content Server,
nutzen kann. Um sich am Authentication Server zu identifizieren, benötigt der Client
„Credentials“, die er – wie oben erläutert –entweder über die Benutzereingabe (DocuWare-
Login) oder durch die Windows-Benutzerverwaltung (Trusted-Login) erhält. Der
Authentication Server hat damit die zentrale Kontrollfunktion über die Sessions im System
und kann somit einerseits Sicherheitsvorgaben umsetzen und auch bei Ausfall oder
Überlastung von einzelnen Servern aktiv reagieren.

Die Kommunikation zwischen Client und Servern und zwischen den Servern erfolgt
gesichert. Unterstützt werden die Protokolle NTLM und Kerberos. Zwischen den DocuWare-
Servern wird wegen der höheren Sicherheit optional Kerberos genutzt, bei der
Kommunikation mit externen Systemen wird nach Möglichkeit ebenfalls Kerberos benutzt.
Lediglich wenn das Partner-System dies nicht unterstützt, z.B. bei älteren Windows-
Versionen, wird aus Kompatibilitätsgründen auch NTLM angewendet.

18
Authentication Server

Abbildung 8: Ticket-Granting-Ticket-Verfahren

Die einzelnen Authentifizierungsschritte des Ticket-Granting-Ticket-Verfahrens laufen ohne


für den Benutzer spürbaren Zeitverzug im Hintergrund ab.

4.3. Login via Internet


Prinzipiell erfolgt die Anmeldung entfernter Nutzer über die Web-Technologie ähnlich dem
beschriebenen Verfahren für DocuWare-Login für LAN-/VPN-Nutzer. Jedoch findet die
Kommunikation nicht direkt zwischen Web-Client und DocuWare-Server statt, sondern es ist
der Web Client Server zwischengeschaltet, der von IIS (Internet Information Services)
gehostet wird. Ggf. sind auch noch Proxy-Server und Firewalls zwischengeschaltet, die
jedoch auf den Ablauf der hier beschriebenen Sessions keinen Einfluss haben.

4.4. Berechtigungskonzept
Mitarbeiter in großen Organisationen absolvieren komplexe Abläufe und unterliegen einer
Vielzahl von Regularien. Um ihre Aufgaben erfüllen zu können, benötigen sie
Berechtigungen zur Benutzung vorhandener Funktionen, Daten und Dokumente. Dabei sind
auch Beschränkungen erforderlich, um nur berechtigten Personen bestimmte Befugnisse
erteilen zu können und um die Übersichtlichkeit für alle Beteiligten zu erhalten.

4.4.1. Rollen

Das DocuWare-System bedient sich dafür neben den „Benutzergruppen“ des so genannten
Rollenkonzeptes, bei dem „Rollen“ definiert werden können, denen dann wiederum
Berechtigungsprofile (Sammlung von Einzelrechten) zugeordnet werden können. Die „Rolle“
fasst somit Berechtigungen und keine Benutzer zusammen. Sie richtet sich typischerweise
an den notwendigen Rechten für die Erfüllung einer bestimmten Aufgabe in einem
betrieblichen Prozess aus.

Durch die Zuordnung einer Rolle zu einem Benutzer oder einer Gruppe von Benutzern,
erhalten diese die Berechtigungen, die in den entsprechenden Profilen vordefiniert wurden.

Eine Rolle verfügt über ein oder mehrere Profile, das die ausführbaren Funktionen definiert
und ein oder mehrere Profile, die die Zugriffe auf die abgelegten Dokumente bestimmen
(siehe „Funktionsprofil“ und „Archivprofil“ im Glossar). Einem Benutzer oder einer Gruppe
können eine oder mehrere Rollen zugewiesen sein.

19
Authentication Server

Abbildung 9: Berechtigungskonzept (Bx = Berechtigung, Ux = Benutzer)

4.4.2. Profile

Es können mit einer Position bzw. einer „Rolle“ in einer Organisationseinheit ganz
unterschiedliche Aufgaben mit der Notwendigkeit für mehrere Berechtigungen
zusammenhängen. Daher werden die Einzelberechtigungen zu Profilen zusammengefasst.
So können beispielsweise einer Rolle „Chefeinkäufer“ die Profile für das Genehmigen von
Urlaubsanträgen und für das Einkaufen komplexer IT-Systeme zugewiesen werden, weil
beide Aufgaben mit dieser Position verbunden sind, obwohl sie miteinander direkt nichts zu
tun haben.

Generell wird unterschieden zwischen


 Archivprofilen und
 Funktionsprofilen.
Während Archivprofile eine Zusammenstellung der Rechte auf einem logischen Archiv
darstellen, bilden Funktionsprofile die Möglichkeiten zur Nutzung oder Verwehrung einzelner
DocuWare-Funktionen ab.

4.4.3. Benutzer und Gruppen

Den Benutzern werden die Rollen entsprechend ihrer Aufgaben in der Organisation
zugewiesen. Typischerweise füllen Benutzer verschiedene Rollen aus und häufig agieren
mehrere Benutzer in den gleichen Rollen. Benutzer können daher zu „Gruppen“
zusammengefasst werden.

Eine „Gruppe“ ist immer eine Summe von Benutzern. Gruppen können selbst keine weiteren
Gruppen enthalten. Ein Nutzer kann in mehreren Gruppen vertreten sein. Nutzern können
Profile und Einzelberechtigungen auch direkt zugewiesen werden.

Da DocuWare den Austausch mit externern Benutzerverwaltungssystemen erlaubt, die


typischerweise auch „Gruppen“ kennen, lässt sich über diese Einstellungen auch eine
einfach zu administrierende Zuordnung der DocuWare-Rechte zu extern verwalteten
Benutzer realisieren.

20
Content Server

5. Content Server
Clients und andere Server greifen über den Content Server auf A und Datenbank-
Informationen zu. Der Content Server ist damit zuständig für die Gewährleistung eines
einheitlichen Zugriffs und die zentrale Kontrolle bzw. Protokollierung der Archivnutzung.

Die verschiedenen Organisationen, die ein DocuWare-System benutzen, können gleichzeitig


verschiedene Content-Server nutzen. Die Content Server sind alle einzeln skalierbar, so
dass eine optimale Lastverteilung innerhalb eines DocuWare-Systems leicht realisierbar ist.
Alle Content-Server verwalten die Index- und Metadaten der abgelegten Dokumente in einer
oder mehreren Datenbanken.

Der Content Server verwaltet dazu „logische Archive“, denen die Dokumente zugeordnet
sind. Er ist zuständig für sämtliche Zugriffe auf die zugeordneten Archive sowohl für die
Ablage von Dokumenten als auch für die Recherche und die Reproduktion von Dokumenten.

Um die Abbildung auf Wechselmedien zu erleichtern, werden dem Archiv „logische Platten“
zugeordnet und mit ihrer Kapazität spezifiziert. So kann sichergestellt werden, dass
bestimmte Dokumente später auch physikalisch zusammen gespeichert werden und damit
leichter ausgelagert, vernichtet oder transportiert werden können.

Abbildung 10: Logische Ablagestruktur

Lokalisiert sind die „Platten“ in einem „Speicherort“. Ein Speicherort kann eine beliebige
Dateiablage sein. Für die Dateiablage werden verschiedene Ablagemedien (siehe 5.4)
unterstützt. Auch innerhalb einer Dateiablage sind unterschiedliche Medien möglich.

Jede Organisation kann mehrere Archive haben. Jedes Archiv nutzt eine Datenbank zur
Verwaltung der Indexdaten und einen oder mehrere Speicherorte zur Ablage der Dokumente
und Header-Dateien.

Wie bereits erwähnt, können Archive standortübergreifend in einer Master-Satelliten-Struktur


aufgebaut werden. Die Synchronisation zwischen Master und Satellit übernimmt der
Workflow Server. Für den Anwender bieten Master und Satellit die gleichen Funktionalitäten.
In beiden Archiven können beliebig Dokumente hinzugefügt und – wenn erlaubt – auch
geändert oder gelöscht werden. Ein Archiv verfügt über eine weltweit eindeutige, nicht
veränderbare Kennung, so dass auch bei der Verbindung der Systeme keine Konflikte
aufgrund zufälliger Namensgleichheit entstehen können.

21
Content Server

Beim Design der DocuWare Server war die Erreichung einer hohen Sicherheit ein
wesentliches Designkriterium. Zu den wichtigsten Sicherheitsmaßnahmen des Content
Servers gehören die im Folgenden gelisteten Punkte 1:
 Anwender und Administratoren benötigen keine Kenntnisse und damit auch keine
Zugriffsrechte auf die interne Ablagestruktur
 Dokumente und Dateien können verschlüsselt in der Dateiablage abgespeichert werden
(Nur in Verbindung mit Enterprise Server)
 Dateien werden über einen „Hash-Algorithmus“ mit einer Art Prüfsumme versehen, die
Veränderungen sofort offensichtlich macht.
 Bei gleichzeitigem Zugriff verschiedener Nutzer auf dieselben Dokumente wird die
Konsistenz durch das DocuWare-System sichergestellt.
Weitere Sicherheitsmaßnahmen finden sich in der folgenden Beschreibung der wesentlichen
Elemente von Content Server und Archiven.

5.1. Archiv
Im Folgenden ist die Art der Ablage der Daten und Dokumente im DocuWare-System
beschrieben. Ablage und Zugriff auf die Dokumente wird durch den Content Server
verwaltet, Administratoren und Benutzer benötigen keinen direkten Zugriff auf die
Dokumente, weil sie über die DocuWare-Software zugreifen. Die Beschreibung dient somit
primär der Transparenz und Nachvollziehbarkeit.

Ein Archiv ist eine organisationsabhängige Einheit und kennzeichnet sich durch die
benutzerdefinierten Angaben über die Plattenverwaltung und die Indexdaten zu den
Dokumenten.

Jede Organisation hat mindestens ein oder mehrere logische(s) Archiv(e) für die
Dokumentablage. Im Einzelnen werden über die Archiveinstellungen bestimmt:
 Allgemeine Angaben zum Archiv, wie z.B. Name des Archivs
 Zu benutzende Datenbank und weitere Datenbank-Einstellungen
 Zu benutzende Dateiablage und ggf. deren Aufteilung in logische Platten mit jeweiliger
Kapazitätsbeschränkung
 Zugriffsrechte (und Archivprofile) für das Archiv und für einzelne Felder
 Benutzerdialoge für Ablage, Suche und Ergebnisliste
 Web-Instanz(en), in denen das Archiv zur Verfügung steht (für den Zugriff über Web
Client)
Bei der Einrichtung eines Archivs wird ebenfalls der Content Server, über den dieses Archiv
erreichbar ist, festgelegt. Weiterhin werden wesentliche Funktionalitäten über die
Archiveinstellungen bestimmt. So sind beispielsweise sowohl die Verfügbarkeit eines
Volltext-Index als auch Art und Umfang der für die Dokumentbearbeitung verfügbaren
Stempel und elektronischen Signaturen abhängig von den Archiveinstellungen.

Optional kann ein Archiv über mehrere Content Server erreicht werden. Die Zuweisung
erfolgt, gesteuert durch den Authentication Server, beim Login der Benutzer. Damit ist

1
Aufgrund der Bedeutung des Themas „Sicherheit“ für DocuWare existiert ein weiteres White Paper,
welches sich explizit und ausführlich mit den implementierten Sicherheitsmaßnahmen beschäftigt.

22
Content Server

einerseits eine Lastverteilung über mehrere Content Server möglich und zusätzlich kann eine
„Umschaltung“ beim Ausfall eines Content Servers erfolgen.

5.2. Ablagestruktur
Schwarz-weiß gescannte Dokumente in DocuWare werden typischerweise in Form von je
einer TIFF-Datei pro Dokumentseite abgelegt. Die Ablage farbiger Scans erfolgt als JPEG-
oder PNG-Datei. Speziell für Im- und Export kann DocuWare auch Multipage-TIFF-Dateien
handhaben. Alle übrigen von DocuWare übernommenen Dokumente, z.B. PDF- und Office-
Dateien, werden in ihrem Originalformat verwaltet. Die Dokumentablage in den
Speicherorten enthält neben dem abgelegten Dokument selbst weiterhin eine „Header-Datei“
sowie ggf. weitere Dateien für Sprachanmerkungen.

Pro abgelegtem Dokument können so eine Reihe von Dateien zu verwalten sein. Ein
Dokument im DocuWare-Verständnis kann sogar aus einer Kombination mehrerer TIFF-,
Office-, PDF und anderer Dateien bestehen, etwa wenn DocuWare eine E-Mail mit mehreren
Anhängen als zusammengehöriges Dokument übernimmt. DocuWare bezeichnet diese
Teildokumente auch als „Seiten“ (siehe 5.5 bis 5.7). DocuWare erstellt für jedes abzulegende
Dokument ein eigenes Dokumentverzeichnis. Die Verwaltung erfolgt über die erwähnte
Header-Datei im XML-Format. Jedes Dokument erhält eine eindeutige, fortlaufende
Nummer, die DOCID. Diese wird für jedes neue Dokument automatisch erhöht.

Um größtmögliche Flexibilität und Offenheit zu erreichen, erfolgt die Abbildung der


Dokumentablage auf ein Dateiverzeichnis, von dem aus ggf. externe Speichersysteme
angesprochen werden. Die Möglichkeiten von Dateiverzeichnissen sind jedoch abhängig von
dem zugehörigen Betriebssystem. Aufgrund der angestrebten Offenheit und Unabhängigkeit
bzgl. der Ablagesysteme orientiert sich DocuWare an den Möglichkeiten der folgenden
Dateisysteme:
 CD-ROM-Standards ISO 9660 und Joliet
 DVD-Standard
 Microsoft NTFS, FAT16, FAT32
 Linux-Dateisysteme (ext2, Minix, NFS etc.)
 Novell File System
Daraus ergaben sich die Randbedingungen für die Struktur der DocuWare-Dokumentablage.
Da in einem Verzeichnis aus Kompatibilitäts- und Performancegründen nur 256 Dateien
abgelegt werden sollen, müssen mehrere Hierarchieebenen verwendet werden.

DocuWare nutzt vier Ebenen und kann damit pro Archiv über 4 Mrd. (2564 = 4.294.967.296)
Dokumente verwalten. Unterhalb des vom Administrator zugewiesen Dateiverzeichnisses
wird das DocuWare-Verzeichnis adressiert durch Archivnamen, Plattennummern, drei
Verzeichnisebenen und die Dokumentebene.

23
Content Server

Wird dem Archiv beispielsweise das Verzeichnis „D:\DOCS“ zugewiesen und als Archivname
„VERKAUF“ gewählt, so finden sich die Dokumente der ersten Platte in folgendem
Unterverzeichnis:

Verzeichnis zu Header zu
Platte 1 Dokument 1 Dokument 1

D:\ DOCS\ VERKAUF.000001 \000\000\000 \00000001\ 00000001.XML

Neben der Header-Datei, finden sich in dem Dokumentverzeichnis die Dateien zu dem
abgelegten Dokument, die alle mit der Bezeichnung „F“ (=File) und einer laufenden Nummer
versehen sind. Sound-Anmerkungen zu dem Dokument (gesprochener Text etc.) sind über
die Nutzung des Namens „A“ (=Annotations), die Nummer der zugehörigen F-Datei sowie
eine laufende Nummer zu identifizieren.

Ein Dokument, das aus unterschiedlichen Teilen besteht und über Sprachanmerkungen
verfügt, würde dann beispielsweise folgendermaßen dargestellt:

\00000001\ 00000001.XML
\ F1.pdf
\ F2.doc
\ F3.tif
\ A1_1.wav
\ A1_2.wav

5.3. Plattenkonzept
Die Dokumente eines Archivs werden in so genannten DocuWare-Platten abgespeichert.
DocuWare-Platten sind Verzeichnisse in der Dateiablage, die einen von DocuWare
vorgegebenen Namen tragen. Die Unterteilung der Dokumentablage in logische Platten dient
der Organisation der Speichermedien.

Diese – logischen – Platten können jederzeit oder bei Erreichen einer vorher eingestellten
Größe, auf ein anderes – physikalisches – Medium übertragen werden. Dadurch ergibt sich
bei der Verwaltung der Dokumente mit DocuWare der Vorteil, dass die Dokumente nach
vordefinierten Regeln oder automatisch auf andere physikalische Medien ausgelagert
werden können. DocuWare bietet dazu komfortable Unterstützungsfunktionen an, die auch
eine Automatisierung der entsprechenden Schritte erlauben.

Das Konzept der logischen Platten und die offengelegte Ablagestruktur bietet dem
Administrator sehr hohe Transparenz und Flexibilität in seiner täglichen Arbeit mit der
Ablage. Aufgrund dieser Orientierung an den verbreiteten Standards kann dies, wenn
gewünscht, auch – weniger komfortabel – über die Werkzeuge des Betriebssystems
geschehen.

24
Content Server

5.4. Unterstützte Ablagemedien


Je nach Dokumentenvolumen, Zugriffs- und Aufbewahrungsanforderungen ist der Einsatz
unterschiedlicher Speichermedien notwendig. Weiterhin spielen bei der Gestaltung der
Speichersysteme Sicherheitsgesichtspunkte eine große Rolle. Durch seine standardbasierte
Architektur unterstützt DocuWare hier ein breites Spektrum an Optionen.

Unterstützt werden sowohl lokale Festplatten als auch (virtuelle) Netzwerk-Ablagen und
externe Speichersysteme. Auf welcher technologischen Basis diese Ablagen realisiert sind,
ist für DocuWare unerheblich. Bei Einhaltung der Konventionen für Windows-Dateisysteme
kann DocuWare beliebige Ablagemedien unterstützen. Daher sind moderne
Speicherverfahren wie RAID-Systeme, NetApp-Speicherlösungen, Network Attached
Storage (NAS), andere „Shared Disk“-Systeme oder Storage Area-Networks (SAN) nutzbar,
sofern sie sich als virtuelles Laufwerk in das Windows-Dateisystem einbinden lassen.

Zusätzlich werden einige Jukeboxen und spezielle Speichersysteme direkt unterstützt. D.h.
DocuWare liefert Software, mit der diese Speichersysteme als DocuWare-Dateiablage
analog der Benutzung von Windows-Dateiablagen in ein Archiv einbindbar sind.

Es ist einstellbar, ob Dateien bei der Archivierung direkt auf das Zielmedium geschrieben
werden sollen, z.B. bei WORM-Einsatz um maximale Sicherheit zu erhalten, oder ob
zunächst eine Zwischenspeicherung auf der virtuellen Platte erfolgt, weil beispielsweise
CDs/DVDs nicht sukzessive brennbar sind.

Im Folgenden werden die unterschiedlichen Medien und ihr Einsatzgebiet aufgeführt:

5.4.1. Festplatten, RAID

Pro GB Speicher können ca. 20.000 DIN A4 Seiten abgespeichert werden. Dies entspricht in
etwa 40 gut gefüllten Aktenordnern. Es besteht zusätzlich die Möglichkeit, mehrere
Festplatten zu einem sogenannten Disk-Array zusammenzuschalten. Diese Arrays sind für
einen Speicherbedarf von bis zu 150 GB die ideale Lösung für ein Archivsystem, wenn die
Magnetspeicherung kein prinzipielles Problem darstellt.

In der Form eines RAID (Redundant Array of Independent Disks) erhält man durch die
Redundanz erhöhte Sicherheit gegen Datenverlust bei Ausfall einer Festplatte und kann – je
nach RAID-Level – den Austausch während des laufenden Betriebes vornehmen.

5.4.2. Optische Wechselplatten

Auf einer optischen Wechselplatte (CD, DVD, Blu-Ray, WORM) können bis zu 50 GByte an
Daten gespeichert werden. Dies entspricht bis zu 800.000 reinen Textseiten. Der Einsatz
solcher Laufwerke ist ohne Jukebox nur im Einzelplatzsystem sinnvoll. Der Vorteil dieser
Systeme liegt darin, dass ein Archiv beliebig erweitert werden kann, indem weitere Platten
eingelegt werden. Die Verwaltung und Nummerierung der Platten wird von DocuWare
vorgenommen. Wenn die Platten gemäß den Vorschlägen von DocuWare beschriftet sind, ist
ein Wiederfinden der Dokumente auch bei mehreren Platten denkbar einfach.

Lange Zeit galten optische Wechselmedien als „revisionssicher“ im Vergleich zur


Magnetspeicherung und wurden deshalb auch dann bevorzugt, wenn eine Speicherung auf
Magnetplatten möglich gewesen wäre. Das DocuWare-System stellt jedoch auch auf
Magnetspeichern sicher, dass keine Veränderungen vorgenommen werden können oder
diese zumindest auffallen.

25
Content Server

5.4.3. Jukeboxen

Bei Jukeboxen handelt es sich um „Plattenroboter“ für den automatischen Wechsel von
optischen Medien in typischerweise ein bis vier Laufwerken. Jukeboxen bieten heute die
größte Speichermenge im Online-Zugriff. Kleinere Lösungen speichern 10 GB, High-End-
Maschinen bis zu mehreren tausend Gigabyte. Diese Geräte bieten sich als Medien für
Netzwerke an, in denen sehr große Datenmengen anfallen. Die Zugriffsgeschwindigkeit
hängt von der Anzahl der eingebauten Laufwerke ab. Bei häufigen Plattenwechseln liegt die
Zugriffszeit bei mehreren Sekunden pro Bilddatei.

Analog zu den plattenbasierten Jukeboxen können auch moderne Bandsysteme (Tape


Libraries), z.B. WORM-Bänder eingesetzt werden, mit denen sich kostengünstig ebenfalls
sehr große Ablagekapazitäten realisieren lassen. Voraussetzung ist lediglich, dass die
Systeme sich in das Windows-Dateisystem integrieren lassen. Teilweise liegen auch
Zertifizierungen durch DocuWare vor.

Jukeboxen können über spezielle Zugangssoftware ebenfalls transparent in das Windows


Dateiverzeichnis eingebaut werden und sind dann auch für DocuWare nutzbar. Die
zusätzlich direkt von DocuWare unterstützten – und z.T. zertifizierten – Speichersysteme
sind unter www.docuware.com aufgeführt.

5.4.4. Content Adressed Storage (CAS)

Während die Anforderungen an die Revisionssicherheit bisher typischerweise zum Einsatz


eines optischen Mediums führte, etablieren sich bei großen Volumina mittlerweile RAID-
basierte Speicherlösungen, die durch spezielle Software ähnliche Eigenschaften wie WORM-
Medien aufweisen. Es handelt sich um geschlossene Subsysteme, die sich typischerweise
durch folgende Merkmale charakterisieren:
 Anwendung und Nutzer haben keinerlei Kenntnis über den Ort der physikalischen
Ablage einer Datei im Subsystem. Versehentliche oder vorsätzliche Veränderung des
Bestandes durch Nutzer/Administratoren ist nicht möglich.
 Datei erhält über ein „Hashing“ analog dem Signaturverfahren einen spezifischen
„Fingerabdruck“, der gleichzeitig als Adresse dient.
 Identische Kopien werden nur einmal gespeichert.
 Datei erhält automatisch eine Zeitsignatur.
 Ablage und Zugriff können von unterschiedlichen Systemen auf unterschiedlichen
Plattformen erfolgen. D.h. mit DocuWare abgelegte Dokumente können prinzipiell von
Applikationen auf anderen Plattformen gelesen werden.
 Kapazität kann im laufenden Betrieb erweitert werden. Daten werden automatisch
verteilt. Damit kann auch automatisch auf andere Medien (innerhalb des gleichen
Systems) migriert werden.
 System verfügt über Redundanz, Fehlerüberwachung und – soweit möglich –
selbstständige Fehlerbehebung
Um diese Funktionen zu nutzen, muss die Anwendung jedoch eine spezifische Schnittstelle
des CAS-Systems ansprechen. Die direkt von DocuWare unterstützten CAS sind unter
www.docuware.com gelistet.

Wie erwähnt, realisiert DocuWare die CAS-Funktionalität teilweise ebenfalls auf


Applikationsebene, unabhängig von dem Speichersystem. CAS-Systeme sind somit dann zu
empfehlen, wenn besonders hohe Anforderungen an Kapazität, Performance und Sicherheit
gestellt werden.

26
Content Server

5.4.5. NetApp Storage

Die NetApp-Speicherlösungen basieren auf einem von NetApp hauseigenen Betriebssystem


und lassen sich in verschiedenste Speichernetzwerke integrieren (NAS, SAN, iSCSI). Sie
sind insbesondere für die Verwaltung großer Datenmengen und die Langzeitarchivierung von
WORM-Dokumenten vorgesehen. Das Unternehmen bietet spezielle Software für das
Datenmanagement an. Diese unterstützt unter Anderem folgende Aufgaben:
 Verwaltung von Speichernetzwerken
 Leistungsoptimierung
 Anwendungsintegration (z.B. mit VMware, SAP, Oracle, Windows, Exchange,
SharePoint)
 Datensicherung und -wiederherstellung
 Archivierung
 Sicherstellung der Einhaltung gesetzlicher vorgeschriebener Aufbewahrungsfristen
("retention periods")
Zusammen mit DocuWare steht NetApp Storage nur für die Speicherung von Dokumenten
zur Verfügung und erfordert eine Enterprise-Lizenz von DocuWare.

5.5. Header-Datei
Alle in DocuWare verwalteten Dokumente haben eine Header-Datei, die sowohl die für
dieses Dokument vergebenen Meta- und Indexdaten als auch die Anmerkungen, Stempel,
Signaturen etc. enthält. Indexdaten werden einerseits in die Datenbank und andererseits
auch in die Header-Datei zum Dokument geschrieben. Diese doppelte Datenhaltung gibt
größte Sicherheit. Selbst bei einem Totalausfall der Datenbank ohne Backup stehen die
Dokumente und Indexdaten trotzdem noch zur Verfügung.

Header-Dateien sind als XML-Datei realisiert. Durch die Verwendung dieses Standard-
Dateiformats ergeben sich für den Kunden folgende Vorteile:
 Stärkere Unabhängigkeit vom Anbieter durch Offenlegung der internen
Verwaltungsstrukturen
 Maximale Transparenz durch les- und schreibbare Formate
 Vereinfachter Austausch mit allen standardkonformen Systemen, inkl. zukünftiger
DocuWare-Generationen
 Vereinfachter Austausch mit Capturing-Systemen und Scan-Dienstleistern
DocuWare benutzt dieses Format für die Speicherung der Metadaten und
Dokumentergänzungen. Der Content selbst wird aus Performancegründen separat
gespeichert (Ausnahme Export). DocuWare verwendet die XML-Datei nicht nur für NCI,
sondern für alle im DocuWare System verwalteten Dokumente. Für jede Datei, die
Bestandteil eines DocuWare-Dokumentes ist, existiert in der XML-Datei ein eigener
Abschnitt, der jeweils eigene Metadaten enthalten kann.

27
Content Server

Es lassen sich im Wesentlichen unterscheiden:


 Dokument Beschreibung (Document Description)
Informationen, die das gesamte Dokument betreffen, z.B. Signaturen und
Verschlüsselung
 Metadaten (Document Metadata)
Alle zu beschreibenden Daten (Indexdaten) für das Dokument, die aus Benutzer- oder
Systemsicht benötigt werden, inkl. DOCID, Plattennummer etc.
 Seiteninformationen (Page Rendition Content Description)
Seitenbezogene Ergänzungen, wie z.B. Text- oder Sprachanmerkungen, Ebenen, Red-
Lining etc.
Für den Austausch zwischen DocuWare-Systemen an verschiedenen Standorten können in
einem reservierten Bereich Dateien direkt eingebunden werden. Die folgende Abbildung
zeigt die Struktur der XML-Header-Datei.

Abbildung 11: Struktur des XML-Headers (vereinfacht)

5.6. Metadaten
Innerhalb des Bereiches Metadaten sind sowohl die vom Benutzer vergebenen Attribute
(Indexdaten, Field Properties) gespeichert als auch die Daten, die von DocuWare für die
Verwaltung benötigt werden (System Properties), wie z.B. die DOCID hinterlegt. Diese Daten
sind identisch zu den Indexdaten, die zu der Datei in der Datenbank vorgehalten werden.

DocuWare stellt die Integrität zwischen Datenbank und Header-Datei sicher. Sollte eine
Datenbank unwiederbringlich verloren gehen (kein lauffähiges Backup verfügbar), können
somit aus den einzelnen Header-Dateien die Datenbank-Informationen wieder hergestellt
werden. Dieser Vorgang kann jedoch sehr zeitintensiv sein, so dass er nicht als Substitut für
eine herkömmliche Datensicherung dienen sollte.

28
Content Server

Innerhalb der Ablageinformationen (Store Properties) werden Informationen über die Historie
und das logische Archiv der Datei gespeichert. Bei den Applikationsspezifika (Application
Properties) handelt es sich um Informationen, die für die Integration mit anderen
Applikationen, z.B. SAP, benötigt werden.

5.7. Dokument
Ein Dokument in DocuWare kann aus mehreren Dateien verschiedenen Formats (TIFF,
Word, PDF etc) bestehen, die wiederum aus mehreren Seiten bestehen können.

Beispiele:
I. Ein 3-seitiges Papierdokument, das durch Scannen in DocuWare erfasst wurde,
besteht aus drei einseitige Dateien (von DocuWare erzeugte s/w TIFF-Dateien).

II. Für ein Dokument werden eine von DocuWare erzeugte s/w TIFF-Datei, eine 3-seitige
Word-Datei und eine 2-seitige PDF-Datei zusammengeheftet. Das Dokument besteht
dann aus drei Dateien:

1. Datei: s/w TIFF-Datei mit der Seite 1


2. Datei des Dokuments: Word-Datei mit den Seiten 1, 2 und 3
3. Datei des Dokuments: PDF-Datei mit den Seiten 1 und 2

Annotationen (Red-Lining in mehreren Layern, Text- und Sprachanmerkungen etc.) können


innerhalb eines Dokuments in jeder Datei vorgenommen werden, innerhalb einer Datei
jedoch nur auf der ersten Seite.

Wie in Adobe PDF werden die Annotationen mit Ihren Merkmalen und zusätzlichen
Attributen, z.B. Benutzerinformationen gespeichert und zur Laufzeit durch den Viewer
reproduziert. Es sind daher keine zusätzlichen Image-Dateien notwendig und die
Annotationen können flexibel geändert und nachvollzogen werden.

29
Datenbanken

6. Datenbanken
Die Installation einer relationalen Datenbank ist Voraussetzung für den Betrieb von
DocuWare. Sie wird sowohl für die Speicherung und Recherche in den strukturierten
Indexdaten der Dokumente als auch für den Volltext-Index verwendet. Weiterhin legt
DocuWare wesentliche Systeminformationen, z.B. des Authentication Server, in der
Datenbank ab.

Bei der Installation richtet DocuWare optional automatisch die mitgelieferte, integrierte
Datenbank ein, es sei denn, der Administrator wählt die Option explizit ab, etwa um
ausschließlich die bereits im Einsatz befindlichen Systeme zu nutzen.

DocuWare unterstützt unterschiedliche Datenbank-Systeme innerhalb eines DocuWare-


Systems. Der Administrator kann für jedes Archiv wählen, welche Datenbank genutzt werden
soll. Auch der nachträgliche Wechsel auf ein anderes Datenbank-System ist möglich.

6.1. Datenbank-Struktur
Die Recherche der in DocuWare abgelegten Dokumente erfolgt immer über eine Datenbank.
Dazu werden die Indexdaten des Dokumentes entweder in strukturierter Form (relational)
und optional in Form eines Volltext-Index abgelegt.

Neben den für den Benutzer wesentlichen Suchkriterien verwaltet die Datenbank auch die
systeminternen Informationen zum Speichern und Wiederfinden der Dokumente in den
Speicherorten.

Das wesentliche kennzeichnende Merkmal eines Dokumentes ist dabei die DOCID. Bei der
DOCID handelt es sich um eine pro Archiv eindeutige Nummer für ein Dokument, das aus
vielen Dateien bestehen kann.

Besondere Bedeutung haben naturgemäß die benutzerdefinierten Felder. Mit ihnen wird
festgelegt, nach welchen Begriffen und Kategorien die Dokumente abgelegt und wieder
gesucht werden.

Durch die separaten Stichworttabellen ist es grundsätzlich möglich, beliebig viele Stichwörter
zu einem Dokument zu speichern. Außerdem ist es möglich, mehrere Stichwortfelder in
einem Archiv anzulegen. Die Geschwindigkeit beim Suchen innerhalb des Stichwortfeldes ist
dabei sehr hoch, da in der Tabelle ein Index auf die Stichwort-Spalte gesetzt wird. Wenn
dann der entsprechende Eintrag gefunden wurde, kann direkt über die DOCID auf die
Datenbankeinträge der gefundenen Dokumente zugegriffen werden.

30
Datenbanken

Die Datenbank verwaltet im Wesentlichen die folgenden Tabellen:


Bezeichnung Bedeutung Tabellenname
Systemtabelle Beschreibt alle in dieser Datenbank verwalteten DWSYS
Archive mit deren Namen, ID, aktuellem
Speichermedium (DiskID)
Plattentabelle Beschreibt die Platten im System. D.h. alle Platten <Archivname>_DISKS
aller Archive mit ihren Nummern und
Restkapazitäten
Archivhaupttabelle Beschreibt die Dokumente pro Archiv über stets <Archivname>
vorhandene Systemfelder wie, z.B.
Anzahl Seiten, Plattennr., Ablagedatum,
Versionsnummer,
Zugriffprotokollinformationen,
Synchronisierungsinformationen (nur bei
Satelliten)
und benutzerdefinierte Felder mit den Feldtypen
- Text,
- Datum/Zeit,
- Numerisch,
- Bemerkung
Stichwort-Tabellen Für jedes Stichwort Feld, das in einem Archiv <Archivname>_<Name
angelegt wird, wird eine Tabelle angelegt, die das Stichwortfeld>
Stichwort direkt mit der DOCID verknüpft.
Locking-Tabelle Beschreibt die Dokumente eines Archivs, die für <Archivname>_LOCK
Veränderungen gesperrt sind mit Datum/Zeit, User
und Computer bei dem das Dokument in
Bearbeitung ist sowie Informationen über Check-In
/ Check-Out Status.

6.2. Integrierte Datenbank


Die Datenbank MySQL gehört als „integrierte Datenbank“ zum Standard-Lieferumfang. Bei
Benutzung der integrierten Datenbank werden alle notwendigen Einstellungen automatisch
während der Installation vorgenommen. Diese Einstellungen stellen gleichzeitig die
Standardwerte für die Benutzung anderer Datenbanken dar.

6.3. Direkte Datenbank-Kopplung


Die marktführenden Datenbanksysteme (MS SQL, Oracle, MySQL) werden direkt an das
DocuWare-System gekoppelt. Die direkte Kopplung unterscheidet sich für den Benutzer
nicht von anderen Datenbanken. Die Zugriffe laufen lediglich nicht über die ODBC-
Schnittstelle, sondern die Datenbank wird direkt mit ihren spezifischen SQL-Kommandos
angesprochen. Daraus ergibt sich ein Geschwindigkeitsvorteil.

31
Datenbanken

6.4. Datenbank-Administration
Datenbanken können auf eigenständigen Servern (außerhalb des DocuWare-
Serverbereiches) lokalisiert sein und DocuWare kann gleichzeitig mit mehreren Datenbank-
Verbindungen zu unterschiedlichen Servern und verschiedenen Datenbanken arbeiten. Ob
mehrere Verbindungen gleichzeitig zu einer Datenbank aufgebaut werden können, ist
abhängig von der verwendeten Datenbank.

32
Webbasierte Anwendungen

7. Webbasierte Anwendungen
Der Trend bei IT-Anwendungen geht immer mehr hin zu webbasierten Lösungen. Installation
und Wartung auf Client-Rechnern werden dadurch überflüssig, Zugriff auf die Anwendung ist
von überall und von allen Rechnern, unabhängig vom Betriebssystem, aus möglich. Einzige
Voraussetzung ist eine Internetverbindung.

Auch DocuWare geht diesen Weg. Mit dem Web Client wird der Archivzugriff realisiert.
Recherche und Ablage von Dokumenten ist aus Anwenderperspektive analog zum Windows-
Client realisiert, technologisch ist es jedoch eine komplette Neuentwicklung basierend auf
ASP.NET, JAVA-Script, AJAX und Silverlight.

Die Administration des DocuWare-Systems wird ebenfalls zunehmend webbasiert


umgesetzt. Perspektivisch soll die komplette Administration über Internetverbindung möglich
sein. Technologisch wird auch hier auf Silverlight gebaut.

7.1. Dokumentzugriff mittels Web Client

7.1.1. Web Client Server

Basis für den Archivzugriff über Internet ist der Web Client Server, der innerhalb des
DocuWare-Systems als ein weiteres Servermodul installiert wird. Der Web Client Server
stellt die Benutzeroberfläche, die im Browser-Fenster angezeigt wird, zur Verfügung.
Für einen Archivzugriff verbindet sich der Anwender über Internet mittels Web Client mit dem
Web Client Server. Letzterer leitet die Anfrage an den Authentication Server zur Prüfung des
Benutzerkontos und der Rechte für den Archivzugriff über den Content Server weiter. Aus
der Perspektive vom Authentication Server und Content Server verhält sich der Web Client
Server wie ein Client.

Abbildung 12: Achivzugriff über Web Client Server

7.1.2. Imaging Server

Der Imaging Server, ein weiterer Bestandteil für den webbasierten Dokumentzugriff,
konvertiert die archivierten Dokumente, die im Viewer des Web Clients angezeigt werden
sollen, in ein Grafik-Format. Dadurch können alle gängigen Dateiformate in hoher Qualität
angezeigt und ausgedruckt werden, ohne dass am Client-Rechner etwas installiert werden

33
Webbasierte Anwendungen

muss. Des Weiteren ist der Imaging Server für die Konvertierung der Dateien in PDF und die
Textsuche im Viewer des Web Clients verantwortlich.

Der Web Client Server kommuniziert direkt mit dem Imaging Server. Innerhalb eines
DocuWare-Systems können mehrere Imaging Server installiert werden, so dass eine
Lastverteilung möglich ist.

7.1.3. Thumbnail Server

Im Web Client können Dokumente im Viewer und im Briefkorb als Thumbnails dargestellt
werden. Um eine höhere Performance zu erreichen, werden die Thumbnails nicht für jeden
Aufruf neu berechnet, sondern in einer dedizierten Datenbank gespeichert und bei Bedarf
von dort für die Anzeige bereitgestellt. Das Speichern und Abfragen von Thumbnails
übernimmt der Thumbnail Server, der sowohl zum Web Client Server als auch zur
Datenbank Verbindung hat.

Abbildung 13: Web Client Server mit Imaging Server und Thumbnail Server

7.1.4. Web Instanzen

Für einen Web Client Server können beliebig viele Web-Instanzen eingerichtet werden.
Jeder dieser Instanzen wird eine eindeutige URL zugeordnet. Über diese URL verbindet sich
der Anwender mit dem Web Client Server und ruft so die entsprechende Instanz im Web
Client auf.

Pro Instanz wird festgelegt, welche Archive und Archivdialoge zur Verfügung stehen und wie
die Anmeldung am DocuWare-System erfolgt.

7.1.5. Web Client

Der Web Client ist das Benutzerinterface für den webbasierten Archivzugriff.
Indem der Anwender im Browser eine URL zu einer Web-Instanz aufruft, wird der Web Client
im Browserfenster angezeigt. Über den Web Client lassen sich alle wesentlichen Funktionen
des Dokumentenmanagement-Systems ausführen: Dokumente öffnen, mit Anmerkungen
und Stempeln versehen, Indexbegriffe ändern, Dokumente ablegen, versenden und vieles
mehr.

34
Webbasierte Anwendungen

Technologisch basiert der DocuWare Web Client auf ASP.NET und Ajax (Asynchronous
JavaScript and XML). Dank dieser Technologien bearbeitet der Web Client Recherchen sehr
schnell, und der Anwender bekommt unmittelbar eine Antwort auf seine Anfrage. Grundlage
des Web Clients sind einzelne Steuerelemente, sogenannte Web Parts.
Der Web Client kommt prinzipiell ohne jegliche Installation am Client-Rechner aus und ist
Betriebssystem unabhängig. Lediglich für Funktionen, die nicht rein browserbasiert
umsetzbar sind, werden Anwendungen am Client-Rechner installiert (siehe folgende Kapitel).

7.1.6. Click-Once Anwendungen

Das Versenden von archivierten Dokumenten über den lokalen Mail-Client, einer weiteren
Funktion des DocuWare Web Clients, ist technisch nicht vollständig browserbasiert möglich.
Es muss eine DocuWare-Anwendung, ein sogenannter Smart Client, am lokalen Client-
Rechner installiert werden.
DocuWare verwendet dazu die Click-Once-Technologie von Microsoft. Der Anwender lädt so
per Mausklick einmalig beim ersten Mail-Versand die DocuWare-Anwendung herunter, die
automatisch am lokalen Client-Rechner installiert wird. Hierzu sind keine
Administrationsrechte unter Windows erforderlich. Ein Update dieser Anwendung kann
automatisch erfolgen.

Ebenso wird für die browserbasierte Client-Anwendung des DocuWare Zusatzmoduls


SmartConnect eine lokale Anwendung benötigt. Auch diese wird über das Click-Once-
Verfahren am Client-Rechner installiert.

Voraussetzung für Click-Once-Anwendungen ist ein Windows-Betriebssystem.

7.1.7. Silverlight Plug-In für Web-Briefkörbe

Das Bearbeiten von Dokumenten, wie z.B. Heften, Entheften und Vorindexieren, erfolgt in
DocuWare in sogenannten Briefkörben. Für den Web Client befinden sich solche Briefkörbe
im Allgemeinen nicht auf dem lokalen Rechner, sondern im Netzwerk. Diese Briefkörbe,
auch Web-Briefkörbe genannt, werden vom Content Server verwaltet. Damit der Benutzer
des Web-Clients solche Web-Briefkörbe nutzen kann, ist die lokale Installation eines
Silverlight Browser-Plug-In erforderlich. Voraussetzung für ein Silverlight Browser-Plug-In ist
ein Windows- oder Mac-Betriebssystem.

7.1.8. Integration des Web Client in andere Anwendungen

Die Integrationsmöglichkeiten des Web Client sind vielfältig. Es kann sowohl der Web Client
als Ganzes in andere Anwendungen eingebaut werden als auch einzelne Elemente wie
Ergebnisliste oder Anzeigefenster. Die Integration funktioniert mit Windows- und Web-
Programmen über spezielle URL-Aufrufe.

Eine vollständige Übersicht über die Integrationsmöglichkeiten des DocuWare Web Clients
ist im White Paper „Integrationen“ enthalten.

7.2. Webbasierte Administration


Langfristiges Ziel ist es, die Administration des DocuWare-Systems soweit wie möglich
webbasiert zu realisieren. Umgesetzt ist dieses Ziel bereits für einige neuere Elemente, wie
das Verwalten von Web-Briefkörben und E-Mail-Alerts sowie für die Administration der
DocuWare Zusatzmodule SmartConnect und CONNECT to MFP.

Technologisch wird hier auf Silverlight gebaut, d.h. der Administrator benötigt ein Silverlight
Browser-Plug-In. Voraussetzung dafür ist ein Windows- oder Mac-Betriebssystem.

35
Process Management Framework

8. Process Management Framework


Ein wesentliches Nutzenpotenzial von DMS liegt in der Automatisierung von
Routinetätigkeiten und in der Unterstützung bestehender Prozesse. Dazu gehören sowohl
systemorientierte Standardabläufe als auch anwendungs- und nutzerabhängige Prozesse.

DocuWare hat als übergeordneten Architekturrahmen das Process Management Framework


definiert, das die Verwaltung und Abarbeitung der Prozesse beschreibt. Es lassen sich drei
Prozesskategorien unterscheiden:
 Dokumenten-Stapel-Verarbeitung (Document Batch Process)
Diese Prozesse benötigen keine Benutzer-Interaktion, sondern sie realisieren
Standardabläufe, z.B. Import, Speicherung, Export, Migration und Löschen von
Dokumenten und Daten.

 Dokumenten Workflow
Die automatische Versendung, inkl. Benutzer-Interaktion von Dokumenten entlang
vordefinierter Wege ist eine der häufigsten Workflow-Anwendungen. Von Rechnungen,
über Bestellanforderungen bis zu Urlaubsanträgen sind Dokumente – speziell in
größeren Organisationen – über mehrere Stationen zu erstellen, zu genehmigen und zu
buchen. Diese Prozesse lassen sich mit dem Document Workflow steuern und
verfolgen.

 Datenaustausch mit Fremdapplikationen (Data Acquisition and Distribution, EAI)


Ein Dokumenten-Management-System muss Daten und Dokumente aus verschiedenen
anderen Systemen übernehmen und teilweise, auf Anforderung durch diese Systeme,
auch wieder übergeben. Die Systeme stellen somit häufig eine Form der „Enterprise
Application Integration (EAI)“ dar, weil sie als generelle Infrastruktur vielen
Anwendungen und vielen Anwendern dienen. Realisiert werden diese Prozesse derzeit
über die Module LINK, AUTOINDEX und ACTIVE IMPORT.

8.1. Workflow Server


Für die Steuerung von automatisierbaren (Teil-)Prozessen existiert mit dem Workflow Server
ein eigenes Servermodul in DocuWare, das die verschiedenen Funktionalitäten zur
Automatisierung von Arbeitsschritten anbietet und als zentrales Element für diese Aufgaben,
inkl. deren Administration fungiert.

Der Workflow Server ist die zentrale Workflow-Engine zur Ausführung der vordefinierten
Workflows. Workflows kennzeichnen sich durch folgende Merkmale:
 Auslösendes Ereignis
 Eingabedaten
 Diverse logisch getrennte Verarbeitungsschritte
 Ausgabedaten
Analog zu diesem Modell agiert der Workflow Server. Ereignisse können sowohl durch
Nutzeraktionen als auch durch zeitliche Vorgaben oder das Erreichen bestimmter
Systemzustände, z.B. „Platte voll“, ausgelöst werden.

Durch ein solches Ereignis wird ein bestimmter Workflow gestartet, der dann gemäß seiner
Vorgaben typischerweise zunächst Eingabedaten einliest. Die Eingabe kann durch
Interaktion oder durch das Lesen einer Datei aus einem bestimmten Verzeichnis oder von
Daten aus einer Datenbank erfolgen.

36
Process Management Framework

Die Verarbeitung erfolgt in verschiedenen Verarbeitungsschritten, die in sich eine


Transaktion darstellen. D.h. kann ein Schritt nicht erfolgreich abgeschlossen werden, gibt der
Workflow Server eine Meldung in eine Datei (Protokoll) aus und der letzte gültige
Zwischenstand wird wiederhergestellt.

Bei erfolgreicher Verarbeitung in einem Schritt, erfolgt automatisch die Übergabe des
(Zwischen-)ergebnisses an den nächsten Verarbeitungsschritt und am Schluss die Ausgabe
entweder an den Benutzer in ein Verzeichnis oder auch an das DocuWare-Archiv.

Durch ein Zwischenergebnis oder durch die Workflow-Aufgabe gesteuert, können neue
Ereignisse ausgelöst werden, die wiederum andere Workflows initiieren können.
Verschiedene Workflows können parallel die gleichen Aufgaben lösen und sich dazu auch
derselben Ressourcen, z.B. Verzeichnisse, Archive etc. bedienen. Der Workflow Server stellt
sicher, dass die Integrität der Daten bestehen bleibt. Über das Monitoring ist der
Verarbeitungsstatus der Prozesse insgesamt und auch der einzelnen Workflow-Aufgabe
jederzeit transparent.

Innerhalb eines DocuWare-Systems können mehrere Workflow Server installiert werden.


Einzelnen Workflows wird dann ein bestimmter Workflow Server zugewiesen. Auf diese
Weise kann eine Lastverteilung bei den Workflow Servern realisiert werden.

8.2. Vordefinierte Batch-Prozesse


DocuWare nutzt die beschriebene Funktionalität des Workflow Server selbst für
systemorientierte Standardabläufe. Derzeit werden über den Workflow Server die
verschiedenen Abläufe, die mit Dokumentenstapel agieren, gesteuert.

Vordefinierte Prozesse werden sowohl bei der DocuWare-Erstinstallation implementiert als


auch bei der – ggf. auch späteren – Installation zusätzlicher Erweiterungsmodule.
Entsprechende Berechtigungen vorausgesetzt, können Nutzer die vordefinierten Prozesse
nach eigenen Bedürfnissen ändern. Typischerweise ist dies eine Aufgabe des Organisation-
Administrators.

Für die folgenden Aufgaben existieren vordefinierte Workflows, die durch den Workflow
Server gesteuert werden:
 Migration
 Export von Archiven oder Teilarchiven
 Erzeugung und Synchronisation von Satellitenarchiven
 Erzeugung von selbsttragen CD/DVD-Archiven
 Ergänzen von Indexinformationen aus externen Datenquellen (AUTOINDEX)
 Wiederherstellen der Indexeinträge (Restore)
 Löschen von Dokumenten, die über Filter definiert werden
 Erzeugen bzw. Aktualisieren des Volltextkatalogs
 Übername von Dokumenten aus Spool-Dateien (COLD/READ)

37
Volltext-Index

9. Volltext-Index
9.1. Funktionsprinzip
Zur DocuWare-Funktionalität gehört generell ein Volltext-Index, dessen Benutzung für den
Anwender jedoch optional ist. Der Volltext-Service nutzt die gleiche Datenbank wie der
Content Server, legt dort jedoch seine eigenen Tabellen an. Der Zugriff auf die Archiv-
Datenbank und die Dokumente erfolgt beim Erzeugen des Volltext-Indexes direkt, also ohne
zwischengeschalteten Content Server.

Die Volltext-Recherche ist voll in die Client-Funktionalität sowohl für den Windows- als auch
für den Web-Client integriert. Somit werden weder spezielle Datenbanken benötigt, noch
muss sich der Anwender mit verschiedenen Recherche-Clients auseinandersetzen. Lediglich
bei der Konfiguration der Archive ist zu entscheiden, ob ein Volltext-Index für die Dokumente
erstellt werden soll. Die Volltext-Recherche erfolgt über den Content Server

Die wesentlichen Vorteile dieser Volltext-Architektur sind:


 Arbeitet mit allen von DocuWare unterstützen Datenbanken
 Keine speziellen Erfordernisse für die Verwendung im Web Client
 Keine Restriktionen für die Verwendung im Web Client
 „Wildcards“ (?, *) können auch am Beginn des Suchstrings stehen
Da die Indexierung größerer Dokumentmengen erhebliche Computer-Ressourcen
beanspruchen kann, erfolgt die Volltext-Indexierung in der DocuWare-Architektur als
eigenständiger Workflow auf dem Workflow Server, der im Hintergrund, unabhängig von
anderen Transaktionen innerhalb von DocuWare ausgeführt wird. In den meisten Fällen ist
der Volltext-Index nicht unmittelbar nach Dokumenteingang erforderlich, so dass eine
organisatorische Optimierung dadurch erfolgen kann, dass die Indexierung in Zeiten
geringerer Systemlast, typischerweise nachts, gelegt werden kann.

Für jedes logisches Archiv ist ein Volltext-Index erstellbar. Welche Dokumente in den
Volltext-Index aufgenommen werden sollen, bestimmt sich durch die Zugehörigkeit zu einem
bestimmten Archiv. Da sehr viele Archive in einem DocuWare-System vorhanden sein
können, kann es entsprechend viele Volltext-Indexe geben.

Da die generelle Fluktuation von Dokumenten im Archiv durch den Content Server verwaltet
wird, ist eine Kommunikation zwischen Content Server und Volltext-Workflow notwendig,
obwohl beide unabhängig agieren. Dies geschieht „indirekt“ über die Volltext-Haupttabelle, in
die der Content Server neu zu indizierende Dokumente oder Dateien einträgt und gelöschte
entsprechend markiert. Der Volltext-Workflow arbeitet daraufhin die notwendigen
Änderungen ab und setzt entsprechende Statusfelder.

Neben den Fundstellen für die einzelnen Begriffe, erfolgt gleichzeitig eine Bewertung der
voraussichtlichen Relevanz eines Begriffs. Die Ergebnisliste einer Volltextrecherche sortiert
sich entsprechend dieser Relevanz (bzw. Nicht-Relevanz = Noise).

Um den Volltext-Index nicht mit irrelevanten Begriffen, wie Artikel (der, die, das), Personal-
pronomen etc. zu belasten, beinhaltet der Volltext-Prozess eine „Stoppwortliste“, die bei der
Volltext-Indexierung automatisch als Filter dient. Diese Liste ist durch den Archiv-
Administrator veränderbar. Damit können spezifische, im Unternehmen sehr häufig
verwendete Begriffe von vornherein aus dem Volltext-Index ausgeschlossen werden, weil sie
für die Recherche nicht dienlich sind. Beispielsweise ist der Begriff DocuWare im Hause
DocuWare nicht zur Differenzierung geeignet. Weiterhin können Dateien über ihre Endung
aus dem Volltext ausgeschlossen werden, um beispielsweise Grafiken auszuschließen.

38
Volltext-Index

Um performant nach Teilstrings suchen und Wildcards auch vor dem Suchbegriff platzieren
zu können, wird ein spezieller Algorithmus verwendet, der sich „Multi-Suffix-Tree“ (MST)
nennt. Dieses Verfahren arbeitet mit zwei speziellen Dateien, über die zunächst der richtige
Eintrag in der Dictionary-Tabelle identifiziert wird, der dann alle weiteren Informationen
(Relevanz, Position etc.) verfügbar macht.

Der eigentliche Volltext-Index wird über die beiden Dateien (MST-Datei, Stringlist-Datei)
realisiert, die je Archiv innerhalb des Dateisystems gespeichert werden. Die einzelnen
Wörter und Teilstrings sind als Baumstruktur in der MST-Datei gespeichert. Die Stringlist-
Datei ist eine Liste von IDs, über die alle Wörter und Teilstrings mit den Einträgen der
Dictionary-Tabelle verknüpft sind.

9.2. Volltext-Tabellen und -Dateien


Für jedes Archiv, welches Volltext-Informationen beinhalten soll, müssen diese Tabellen
vorhanden sein. Im Folgenden werden die Tabellen, die für die Volltext-Suche benötigt
werden, und die von DocuWare erzeugten Index-Dateien kurz beschrieben.
Bezeichnung Bedeutung
Volltext- Enthält pro Datei eines Dokuments Informationen über die letzte
Haupttabelle Indexierung. Diese Tabelle wird von dem Content Server aktualisiert und
dient dem Volltext-Workflow als „Aufgabenliste“.
Dictionary-Tabelle In dieser Tabelle wird jeder String, der aus einem Dokument herausgezogen
wurde, einmal gespeichert. Gleichzeitig wird hier auch mitgezählt, wie oft das
Wort im Archiv vorkommt, in wie vielen Dokumenten es vorkommt, und
welchen NOISEWert dieses Wort hat. Der NOISE-Wert zeigt die
Wahrscheinlichkeit an, mit der das Wort relevant ist.
Index-Tabelle In der Index-Tabelle wird gespeichert, welcher String in welchem Dokument
wie häufig und auf welcher Seite vorkommt. Dadurch wird die Zuordnung
eines Wortes zu einem Dokument möglich.
Ranking Info Mit Hilfe dieser Tabelle kann DocuWare die Suchergebnisse nach Relevanz
Tabelle sortieren. Dazu wird auch der oben schon angesprochene NOISE-Wert
berücksichtigt.
MST-Datei Baumstruktur der Wörter und Teilstrings
Stringlist-Datei Wortverzeichnis mit Einsprungpunkten in die Dictionary-Tabelle

39
Verteilte und redundante Archive

10.Verteilte und redundante Archive


Über die Möglichkeiten aktueller Betriebs- und Netzwerksysteme ist eine
standortübergreifende Nutzung der DocuWare-Archive heute problemlos zu realisieren. Das
gilt sowohl für den Zugriff entfernter Clients auf die DocuWare-Server als auch für die
Kommunikation der Server untereinander. DocuWare hat dazu das Modell der
„Satellitenarchive“ entwickelt.

Weiterhin ist häufig der Export von (Teil-)archiven gewünscht, um beispielsweise bestimmte
Informationen mobilen Benutzern auch außerhalb der Firmeninfrastruktur zur Verfügung zu
stellen. Dazu dienen die so genannten „Selbsttragende Archive“.

Durch den Einsatz moderner Sicherheitstechnologien, wie z.B. VPN´s, Firewalls etc. kann
Missbrauch weitestgehend vermieden werden. In diesem Kapitel werden daher lediglich die
direkt von DocuWare bereitgestellten Funktionen für verteilte und redundante Archive
besprochen.

10.1. Satellitenarchive
Wie bereits unter Systemarchitektur (siehe 3.3) und Workflow Server (siehe 8.1) erwähnt,
kann sich eine DocuWare-Installation über mehrere Standorte erstrecken. Weiterhin kann in
einer eigentlich eigenständigen DocuWare-Installation auch ein „Satellitenarchiv“ einer
anderen Lokation etabliert werden. Dabei erfolgt – einstellbar – eine periodische
Synchronisation zwischen den Standorten, um beide Bestände aktuell zu halten.

Die Architektur der Satellitenarchive kennzeichnet sich über die folgenden Merkmale:
 Es kann mehrere Satellitenarchive zu einem Master geben.
 Ein Satellitenarchiv kann selbst wiederum Master für andere Satellitenarchive sein, aber
es hat immer nur einen Master.
Unabhängig von der Art des Archivs („Master“ oder „Satellit“) kann in beiden Standorten die
volle DocuWare-Funktionalität, inkl. Übernahme beliebiger Dokumente genutzt werden.
Sofern zwischen zwei Synchronisationsläufen ein Dokument auf beiden Seiten verändert
wurde, greifen die Regeln des vordefinierten Workflows. Es ist genau definiert, wie mit
gelöschten, veränderten und neuen Dokumenten auf beiden Seiten zu verfahren ist. Sofern
Modifikationen am Dokument und/oder am Indexeintrag zum Dokument festgestellt wurden,
lauten die verfügbaren Einstellungen:
 Master überschreibt Satellit
 Satellit überschreibt Master
 Letzte Änderung ist gültig
 Keine Aktion, sondern Aufnahme in Log-Datei
Im letzten Fall kann dann eine manuelle Nachbearbeitung erfolgen.

Es lassen sich Zeitvorgaben für die Synchronisationen machen oder die Workflows manuell
starten.

40
Verteilte und redundante Archive

10.2. Mobile Nutzer


Neben der Realisierung standortübergreifender Archive sind Satellitenarchive vor allem auch
für mobile Nutzer vorgesehen. Ähnlich wie bei den Groupware-Clients der bekannten
Anbieter ist hiermit auch für die Archivnutzer eine komfortable Nutzung der Funktionalität
unabhängig von dem aktuellen Online- oder Offline-Status möglich.

D. h. das Dokumente auch im Offline-Betrieb nicht nur gelesen, sondern auch bearbeitet
werden können. Neue Dokumente lassen sich in das Archiv einbringen und über die
Workflow-Steuerung lassen sich offene Aufgaben erledigen, z. B. Freigaben erteilen.

Die Synchronisation mit dem Master erfolgt zeitgesteuert oder von Hand gestartet durch den
Anwender. Da Veränderungen meist nur in Teilbereichen des Archivs erfolgen bzw. erfolgen
dürfen, lassen sich über die sehr leistungsfähige Filterfunktion die Synchronisationsbereiche
vorgeben. Die benutzerindividuelle Beschränkung der Synchronisation auf einzelne Archive
und Teilbereiche von Archiven ist besonders wichtig, um sowohl den Speicherbedarf auf den
mobilen PCs als auch das Datentransfervolumen bei der regelmäßigen Synchronisation so
gering wie möglich zu halten.

Technisch gesehen handelt es sich bei einem Mobilen Nutzer um eine Single-User-
Installation, bei der ein komplettes DocuWare-System, inklusive Authentication Server,
Content Server und ggf. Workflow Server auf einem Rechner – typischerweise ein Notebook
- installiert ist.

10.3. Selbsttragende Archive


Selbsttragende Archive ermöglichen es, ein (Teil-)Archiv auf ein externes Speichermedium
zu kopieren, um die Inhalte, unabhängig von der normalen Infrastrukturumgebung, auf einem
anderen System recherchieren zu können. Die Systemarchitektur entspricht nicht der o. e.
Single-User-Installation, sondern dem Export eines oder mehrerer (Teil-)Archive mit
zusätzlichen Recherchemöglichkeiten.

Um eigenständig zu funktionieren, verfügen diese Installationen über eine lokale Datenbank.


Alle notwendigen Bestandteile für die Nutzung des Archivs sind zusammen mit den Daten
und Dokumenten auf einem Medium, z.B. CD oder DVD, gemeinsam gespeichert. Auf dem
Zielsystem ist keine Software-Installation erforderlich. Sie kann jedoch optional erfolgen, um
die Geschwindigkeit noch weiter zu steigern.

Dieses Archiv kann somit flexibel auf unterschiedlichsten Computern, z.B. Notebooks
genutzt werden, ohne dass eine Verbindung zur sonstigen IT-Infrastruktur besteht. Die
Kapazität des Archives ist lediglich von der Mediumskapazität abzüglich der
Recherchesoftware abhängig.

Typische Einsatzfelder sind:


 Auslagerung von Altbeständen
 Sicherheitskopien von Teilarchiven
 Zusammenarbeit mit externen Partnern, z. B. Dienstleistern oder Unterauftragnehmern
 Publizieren und verteilen von Katalogen, Teilelisten und Zeichnungen
 Bereitstellung von Normen und technischen Dokumentationen, z. B. für Entwicklung,
Qualitätssicherung, Einkauf und Vertrieb
Wenn keine Änderungen gemacht werden sollen oder dürfen, ist auch der Einsatz zur reinen
Recherche – eben ohne Synchronisation – auf einem Notebook sinnvoll.

41
Integration

11. Integration
Archivsysteme müssen sich typischerweise in ein bestehendes IT-Umfeld integrieren. Die
Herausforderung ist dabei nicht nur Koexistenz zu ermöglichen, sondern durch Austausch
von Daten und Dokumenten mit Fremdsystemen ein systemtechnisches Optimum zu
erreichen, ohne gleichzeitig komplexe und hochgradig redundante
Administrationsaufwendungen hinnehmen zu müssen.

Durch die Aufteilung in verschiedene Server und die Bereitstellung entsprechender


Schnittstellen sowie der Orientierung an Standards, löst das DocuWare-System dieses
Problem in eleganter Weise. Beispielsweise können Benutzerdaten, die in Active Directories
oder in LDAP-Verzeichnissen gepflegt werden, durch DocuWare übernommen werden. Dazu
gehört natürlich auch eine Synchronisation der Änderungen im laufenden Betrieb.

Weiterhin lassen sich beliebige Speichertechnologien nutzen, sofern sie sich als Windows-
Dateiverzeichnis darstellen lassen. Dies ist bei allen namhaften Systemen möglich. Damit
sind DocuWare-Archive auch unter Einbeziehung von Non-Microsoft-Systemplattformen
(z.B. Linux, Novell, Solaris) realisierbar.

Die Einbindung „fremder“ Plattformen ist weiterhin möglich für Datenbank-Server, Mail-
Systeme, Web-Server oder Applikationen, zu denen Schnittstellen bestehen, wie z.B. SAP.

Abbildung 14: Integrationsfähigkeit

Aufgrund der Bedeutung des Themas „Integration“ gibt es hierzu ebenfalls ein „White Paper“.

Die folgende Grafik bietet bereits hier einen Überblick darauf, wie mit Fremdapplikationen auf
DocuWare aufgesetzt werden kann. Detailliert ist auch dies im White Paper „Integrationen“
beschrieben.

42
Integration

Abbildung 15: DocuWare Architektur mit Schnittstellen für Fremdanwendungen

43
Skalierbarkeit

12.Skalierbarkeit
DocuWare-Systeme sind hochgradig skalierbar. Dies beginnt mit Einzelplatzsystemen und
endet mit organisations- und standortübergreifenden Systemen mit Tausenden von Nutzern
und einer Verteilung über mehrere Server.

Abbildung 16: Skalierbarkeit; „DocuWare Client“ subsummiert Windows Client und Web Client

DocuWare-Installationen können als eigenständige Systeme auf einem einzigen Rechner


installiert sein. Dieser Rechner verfügt dann über sämtliche Module: Authentication Server,
Content Server, Workflow Server, Datenbank-Server und den zugehörigen Client. Die
Architektur und die funktionalen Möglichkeiten entsprechen den größeren Installationen.

Das Mehrbenutzersystem in einem lokalen Netzwerk wird jedoch der häufigste


Installationsfall sein. Bei intensiver Nutzung kommt die Leistungsfähigkeit der beschriebenen
Systemarchitektur voll zum Tragen, weil die Funktionalität nach organisatorischen,
technischen und performanceorientierten Gesichtspunkten auf verschieden konfigurierten
Servern verteilt sein kann.

Netzwerktechnisch sind TCP/IP-Netze Voraussetzung, die heute flächendeckend verbreitet


sind. Für die DocuWare-Server werden MS-Windows-Plattformen benötigt, die aber – wie
unter Integration beschrieben – mit anderen Plattformen zusammenarbeiten können.

44
Skalierbarkeit

12.1. Clustering und Lastverteilung


Sämtliche Zugriffe auf die Dokumente zur Ablage oder Reproduktion erfolgen über den
Content-Server. Ein Content Server kann dabei auch für mehrere Archive zuständig sein.

Bei großen Installationen und intensiver Nutzung des Systems kann der Content Server
daher zum Engpassfaktor werden. In diesem Fall ist die Last auf mehrere Content Server
aufzuteilen. Fällt ein Content Server aus, wird durch einen Neustart des Clients von dem
Authentication Server ein neuer Content Server (CTS) zugewiesen.

Abbildung 17: Lastverteilung auf mehrere Content Server

Weiterhin ist Lastverteilung durch die Plattformvarianten der Systemhersteller, z.B. Microsoft
Cluster-Lösung, möglich. Durch die modulare Struktur und die N-tier-Architektur lassen sich
die dort gegebenen Möglichkeiten optimal nutzen, weil das System die Ressourcen
bedarfsgerecht zuordnen kann.

Details zur Ausfallsicherheit des DocuWare-Systems enthält das White-Paper „Security“.

12.2. Sonstige Performance-Maßnahmen


DocuWare-Clients nutzen standardmäßig „Caching“. D.h. angeforderte Dokumente werden
in einem lokalen Speicher, temporär zwischengespeichert, weil die Nutzer während eines
gewissen Zeitraums meist mehrfach auf dieselben Dokumente zugreifen.

Der Organisations-Administrator kann entsprechende Kapazitätsvorgaben bei der


Einrichtung der Clients machen. Wird diese Kapazität erreicht, so wird ein Teil dieses
Speichers geleert, um Raum für neue Dokumente zu schaffen. Optional wird der Cache am
Ende einer User-Session geleert.

Weiterhin kann eingestellt werden, dass im Cache immer nur aktuelle Daten gehalten
werden. D.h. alle Daten ab einem vorgegebenen Alter werden automatisch gelöscht.

Integration mit anderen IT-Systemen, redundante Archive, Installation mehrerer Instanzen


der jeweiligen Server-Komponenten, Verteilung auf mehrere Hardware-Systeme etc. sind
alles Möglichkeiten, um die Performance und Ausfallsicherheit des DocuWare-Systems den
Anforderungen anpassen zu können. Die Architektur bietet somit Flexibilität bei der
Gestaltung von technisch und wirtschaftlich optimalen Konfigurationen.

45
Glossar

13.Glossar

Administrative Rechte Administrative Rechte umfassen die Rechte zur Änderung von
Archivdefinitionen oder Definitionen innerhalb einer Organisation.
Archiv Ein „Archiv“ ist in DocuWare eine logische Einheit, die Dokumente
entgegennimmt, speichert, sucht und wieder bereitstellt. Ein Archiv umfasst
immer die Dateiablage, in der die Dokumente physikalisch gespeichert sind,
sowie die zugehörigen Datenbanktabellen, die Indexdaten und andere
beschreibende oder ergänzende Elemente zu dem Dokument enthalten.
Optional kann ein Archiv auch einen Volltext-Index enthalten, der die
Dokumente zusätzlich über die Volltext-Information zugänglich macht.
Für die Dateiablage können unterschiedliche Ablagemedien Verwendung
finden. Dazu werden den Archiven „logische Platten“ zugeordnet, die nach
vorgegebenen Regeln auf physikalische Ablagemedien abgebildet werden.
Ein Archiv ist eine Sammlung verschlagworteter Dokumente. Für Archive
können fein abgestimmte Zugriffs- und administrative Rechte vergeben
werden.
Archiv-Administrator Nutzer, dem das Administrationsrecht für ein Archiv gegeben wurde. Er
kann dieses Recht nicht weitergeben.
Archiv-Besitzer Nutzer, der ein Archiv anlegt und administrieren darf. Dieser verwaltet die
Archivstruktur und vergibt die Zugriffsrechte auf das Archiv. Das Recht zur
Administration kann weitergegeben werden, d.h. der Besitzer kann die
Administrationsaufgabe delegieren.
Archivprofil Ein Archivprofil umfasst die Zugriffsrechte auf ein Archiv. Dazu gehören
unter anderem die Zugriffsrechte auf Indexfelder oder Dokumente, die auch
von bestimmten Indexeinträgen abhängig sein können (feldabhängige
Rechte). Ein Archivprofil kann auch administrative Rechte innerhalb eines
Archivs umfassen. Ein Archivprofil wird innerhalb eines Archivs definiert.
Benutzer In diesem White Paper ist ein Benutzer immer ein DocuWare Benutzer.
Benutzer können zu Gruppen zusammengefasst werden. Benutzer erhalten
Rechte sowohl über Einzelrechte, Profile oder Rollen.
COLD Einziges proprietäres Dateiformat in DocuWare ist das COLD-Format. Es ist
ein ANSI-Format und nimmt die Text-Spooldaten beim Einlesen mit
DocuWare COLD/READ auf.
DocuWare-Client DocuWare-Client ist ein Oberbegriff für den Windows- und den Web Client.
Der Windows-Client wird auf einem Windows-Rechner installiert und läuft
dort als eigene Anwendung. Zusammen mit den DocuWare-Servern ergibt
er eine funktionsfähige Installation. In einem DocuWare-System ist immer
mindestens ein Windows-Client erforderlich.
Über den DocuWare Web Client kann man über das Internet auf
DocuWare-Archive zugreifen. Eine Installation am Client-Rechner ist nicht
erforderlich. Im DocuWare-System muss dafür der Web Client Server
installiert sein.
DocuWare-Server DocuWare-Server ist ein Oberbegriff und umfasst alle Server-Module wie
Authentication Server, Content Server, Workflow Server, Imaging Server
und Web Client Server.
DocuWare-System Das DocuWare-System umfasst eine komplette DocuWare-Installation mit
allen dafür erforderlichen sowie eventuell optionalen Komponenten. Ein
DocuWare-System kennzeichnet sich durch gemeinsame Hardware und
Systemeinstellungen für eine oder mehrere „Organisationen“ aus. Teilweise
wird anstatt vom DocuWare-System auch einfach von DocuWare
gesprochen.

46
Glossar

Dokument Ein „Dokument“ ist ein Oberbegriff für die im Archiv abgelegten Objekte, die
aus Benutzersicht eine logische Einheit - eben ein Dokument - bilden. Ein
Dokument kann aus einer beliebigen Anzahl von Dateien bestehen. Häufig
wird es sich um gescannte Informationen im TIFF oder Multi-TIF-Format
handeln. Dateien aus Output-Management-Systemen, Office- oder Grafik-
applikationen oder gar Binärdateien werden aber gleichartig behandelt.

Eine Datei kann eine oder mehrere Seite(n) repräsentieren. Eine Datei kann
aber auch Stempel, Signaturen, Anmerkungen o.ä. ergänzende
Informationen zum Dokument beinhalten. Dokumente können weiterhin aus
Dateien mit unterschiedlich formatierten Inhalten bestehen. So können eine
Office-Datei, zusammen mit einer E-Mail-Datei und mehreren TIFF-Dateien
zusammen ein Dokument darstellen. Eindeutig identifiziert wird das
Dokument über die DOCID.

Feldabhängige Rechte Feldabhängige Rechte sind Rechte, die abhängig von bestimmten
Indexfeldeinträgen sind.
Funktionsprofil Ein Funktionsprofil umfasst Zugriffsrechte auf Funktionen des DocuWare
Clients. Dazu gehören u.a. die Zugriffsrechte auf Menüfunktionen und
Stempel. Funktionsprofile werden auf Organisationsebene definiert. Ein
Funktionsprofil kann auch administrative Rechte auf Organisationsebene
umfassen.
Gruppe Unabhängig von Rollen können Benutzer zu Gruppen zusammengefasst
werden, denen dann ebenfalls Rollen zugewiesen werden können. Eine
Gruppe ist somit eine Zusammenfassung von Benutzern. Gruppen können
ausschließlich über Rollen Rechte zugewiesen werden. Gruppen dienen der
einfacheren Administration von mehreren Benutzern.
Header DocuWare verwendet das XML-Format für die Speicherung der Metadaten
(Indexdaten) und Dokumentergänzungen (Anmerkungen, Stempel etc.). Der
Content selbst wird aus Performancegründen separat gespeichert
(Ausnahme Export).

Zusammengefasst werden diese Informationen in der „XML-Header-Datei“.


Für jedes in DocuWare abgelegte Dokument existiert eine solche Header-
Datei, die mit dem Dokument selbst („Content“) in der Dateiablage abgelegt
wird.

Indexdaten Siehe Header


JPEG Joint Photographic Experts Group. Spezifikation zur verlustbehafteten
Kompression von Farbbildern. "Verlustbehaftet" bedeutet, dass
Bildinformationen beim Speichern irreversibel verloren gehen. JPEG wird
eingesetzt, um Bilder mit großem Farbraum (großer Bittiefe) zu
komprimieren.
Menüfunktion Eine Menüfunktion umfasst eine Funktion innerhalb des DocuWare Clients.
Dazu gehören u.a. die Funktionen Scannen und Dokumente anzeigen oder
bearbeiten.
Metadaten Siehe Header
Organisation Eine Organisation umfasst im Wesentlichen das Management der Benutzer
und der Archive. Innerhalb der Organisation werden keine Hardware-
Administrationen durchgeführt. Die gesamte Systemverwaltung erfolgt auf
Systemebene.
Organisations- Der Organisations-Administrator verwaltet wie schon sein Name sagt eine
Administrator Organisation. Ein DocuWare-System kann eine oder auch mehrere
Organisationen umfassen. Der Organisations-Administrator verwaltet
insbesondere die Rechte und Benutzer einer Organisation. Er hat keine
Zugriffsrechte auf Archive und ihre Verwaltung.

47
Glossar

PNG Abkürzung für "portable network graphic format". Das vom World Wide Web
Consortium (W3C) entwickelte und als Standard verabschiedete Format ist
lizenzfrei und soll GIF- und JPEG-Bilder ablösen - komprimierend und ohne
gravierende Qualitätseinbußen.
Profile Profile sind die Zusammenfassung von Einzelrechten. Profile werden in
Archivprofile und Funktionsprofile unterschieden. Profile können entweder
administrative Rechte oder Zugriffsrechte auf ein Archiv enthalten.
Rechte Rechte erlauben die Ausführung von bestimmten Funktionalitäten innerhalb
des DocuWare Systems. Einzelrechte können in Archiven und auf
Organisationsebene vergeben werden.
Rolle Benutzer haben in den Unternehmensorganisationen verschiedene Rollen,
die sich aus Ihrer Stellung in der Hierarchie (z.B. Genehmigung von
Urlaubsanträgen) und aus Ihrer Aufgabenbeschreibung (z.B. Einkäufer)
ergeben. Entsprechende Rollen lassen sich in DocuWare abbilden, um die
Installation und Administration zu vereinfachen. Dazu werden Funktionen
und Zugriffsrechte in Profilen zusammengefasst, die den Rollen zugewiesen
werden.

Das Rollenkonzept wird auch vom DocuWare-System selbst benutzt, in


dem bestimmte Rollen mit entsprechenden Profilen für administrative
Aufgaben bereits vordefiniert sind.
Eine Rolle ist eine Zusammenfassung von Profilen. Rollen können keine
Einzelrechte beinhalten. Vordefinierte Rollen erlauben die einfache Vergabe
von administrativen Rechten.
System Siehe DocuWare System
System-Administrator Der System-Administrator verwaltet das System, insbesondere aus
Hardwaresicht. Dazu gehören u.a. die Verwaltung der
Datenbankverbindungen, die Verwaltung der Kommunikationswege und die
Ablagepfade für die Dokumente. Der System-Administrator hat keine
Zugriffsrechte auf Organisationsinformationen, insbesondere kann er nicht
in die Benutzerverwaltung eingreifen.
TIFF Tagged Image File Format: Wichtigstes Format in DocuWare ist Schwarz-
Weiß (1-bit) TIFF, nach CCITT Group 4 komprimiert. Dieses Format hat sich
für die elektronische Archivierung gescannter Dokumente als Standard
durchgesetzt. Zur Archivierung erzeugt DocuWare für jede Seite eines
Dokumentes eine Datei.

Vordefinierte Rollen Vordefinierte Rollen werden vom DocuWare System mitgeliefert und
garantieren die Arbeitsfähigkeit des Systems bei einer ersten Installation.
Vordefinierte Rollen sind der System-Administrator, der Organisations-
Administrator und der Archiv-Besitzer.
Workflow Ein Workflow ist eine vordefinierte Folge von Arbeitsschritten, die bei dem
Eintreffen eines vordefinierten Ereignisses automatisch innerhalb von
DocuWare ausgeführt wird.
Workflow Server Der Workflow Server ist das Modul, das die Workflows zur Laufzeit ausführt.
XML Siehe Header
Zugriffsrechte Zugriffsrechte umfassen Zugriffe auf Archive oder Menüfunktionen
innerhalb des DocuWare Clients.

48

Das könnte Ihnen auch gefallen