Beruflich Dokumente
Kultur Dokumente
Systemarchitektur
Version 1.2
Februar 2010
DocuWare AG
Therese-Giehse-Platz 2
82110 Germering
Impressum:
DocuWare AG
Therese-Giehse-Platz 2
82110 Germering
E-Mail: infoline@docuware.com
Disclaimer:
Dieses Dokument wurde nach bestem Wissen mit großer Sorgfalt zusammengestellt.
Sämtliche Angaben beziehen sich auf DocuWare-Produkte ab Version DocuWare 5.1c.
Es sollen im Wesentlichen die technische Grundstruktur der DocuWare-Produkte
erläutert werden. Abweichungen einzelner Funktionen von der jeweils verfügbaren
Version, die von geringer oder kurzfristiger Bedeutung sind, sind möglich.
2
Inhalt
Inhalt
1. Zielsetzung des White Papers ......................................................................... 5
3.3. DocuWare-Systemarchitektur............................................................................................... 13
5.2. Ablagestruktur........................................................................................................................ 23
5.3. Plattenkonzept........................................................................................................................ 24
5.7. Dokument................................................................................................................................ 29
3
Inhalt
6. Datenbanken ................................................................................................... 30
6.1. Datenbank-Struktur ............................................................................................................... 30
9. Volltext-Index .................................................................................................. 38
9.1. Funktionsprinzip .................................................................................................................... 38
4
Zielsetzung des White Papers
Der Leser kann sich damit ein technisch fundiertes Urteil über das DocuWare-System bilden
und die Leistungsfähigkeit im Hinblick auf Anpassungsfähigkeit, Skalierbarkeit und
Performance bei bestehenden Anforderungen einschätzen. Es werden die getroffenen
Maßnahmen erläutert, um einerseits Zugangs- und Zugriffssicherheit zu erreichen und
andererseits Ausfälle von vorneherein zu vermeiden oder zumindest die Auswirkungen für
die Benutzer zu minimieren. Weiterhin liegt ein Schwerpunkt auf den Integrationsaspekten,
damit der Leser eine Vorstellung davon bekommt, wie sich das DocuWare-System im IT-
Umfeld mit anderen Systemen verhält und inwieweit im Sinne des Investitionsschutzes und
minimaler Administrationsaufwendungen (Total Cost of Ownership) Anpassungen
erforderlich sind.
Als erstes White Paper dieser Serie gibt das vorliegende Papier einen Überblick über die
Gesamtarchitektur. Des Weiteren existieren White Paper zu den Themen Sicherheit und
Integrationen.
5
Die Anforderungen der Zukunft
Der Erfolg führt dazu, dass DocuWare-Systeme in zunehmend größeren und komplexeren
Installationen eingesetzt werden. Dieses White Paper zeigt auf, dass das DocuWare-System
technisch für diese größeren und komplexeren Umgebungen vorbereitet ist und auch ein
solides Fundament für die Anforderungen der Zukunft bildet.
Bei dem Wettbewerb um größere und komplexere Installationen misst sich DocuWare mit
anderen Konkurrenten als bisher, die aber größtenteils ihre Komplexität nach außen tragen.
DocuWare hingegen hält es für wichtig, die bisherigen Erfolgsfaktoren zu erhalten und
weiterhin führend in der Einfachheit bei Installation, Bedienung und Administration zu sein.
Obwohl heute nach wie vor eindeutig die konventionelle Nutzung von Archiven dominiert, ist
die Marktentwicklung hin zum „Integrierten Dokumenten-Management (IDM)“ und langfristig
hin zu „Enterprise Content Management“-System abzusehen.
Während die inhaltliche Definition bzgl. Enterprise Content Management (ECM) noch nicht
abgeschlossen ist, sind die Anforderungen des IDM in großen Teilen bereits heute aktuell
und werden auch durch die DocuWare-Systeme größtenteils abgedeckt.
Integriertes Dokumenten-Management muss unabhängig sein von „Zeit und Raum“. Das
heißt, es muss überall verfügbar sein, unabhängig davon, ob sich der Benutzer in der
Unternehmenszentrale, in einer Niederlassung, beim Kunden oder im Home-Office befindet.
Dazu gehört auch, dass die Ablage von Dokumenten nicht zwangsweise dort erfolgen muss,
wo die Dokumente anfallen, und dass die Dokumente unabhängig von dem Ort, von dem
aus sie archiviert wurden, zur Verfügung stehen.
6
Die Anforderungen der Zukunft
Hinzu kommen die unterschiedlichen Anforderungen der Kunden. Teilweise müssen enorme
Dokumentmengen erfasst und abgespeichert werden, obwohl wenige Zugriffe stattfinden.
Teilweise handelt es sich um relativ geringe Dokumentvolumen, auf die durch sehr viele
Benutzer aus unterschiedlichen Lokationen kontinuierlich zugegriffen werden muss.
Eine Differenzierung zwischen den Systemen und die Bewertung der Eignung für
große/komplexe Installationen müssen daher heute vor allem aufgrund der
Systemarchitektur erfolgen. Wichtig ist die Evaluierung der folgenden Kriterien:
Administration
Intuitive und einheitliche Administration für das Gesamtsystem zur Reduktion der
Wartungskosten, einem Teil der Total Cost of Ownership (TCO).
Skalierbarkeit
Um die Anforderungen zu erfüllen, kann es notwendig sein, ein großes
standortübergreifendes System zu realisieren oder aber mehrere kleinere Installationen,
falls dies den organisatorisch-technischen Gegebenheiten besser entspricht. Auf jeden
Fall braucht der mobile Nutzer die Möglichkeit, Teilarchive auf seinem Notebook zu
transportieren.
Es versteht sich von selbst, dass diese unterschiedlichen Anforderungen nicht mit
verschiedenen Systemen, sondern mit der gleichen Technik in unterschiedlichen
Ausbaustufen abgedeckt werden sollen.
Sicherheit
Speziell bei Archiven spielt das Thema Sicherheit in den unterschiedlichsten Facetten
eine große Rolle. Einerseits ergibt sich über die Grundforderung der Revisionssicherheit
bereits die Notwendigkeit zumindest Datenverluste bei Ausfällen zuverlässig zu
vermeiden. Ist der Kunde von der Verfügbarkeit des Systems abhängig, was zunehmend
der Fall ist, so ergeben sich erhöhte Anforderungen an die Ausfallsicherheit.
Weiterhin spielt die Abbildung der organisatorischen Kompetenzen und Befugnisse eine
wesentliche Rolle. Die für den Benutzer verfügbare Funktionalität und die zugreifbaren
Dokumente müssen im Sinne der Zugangs- und Zugriffssicherheit flexibel nach
organisatorischen Gesichtspunkten eingeschränkt werden können.
Integrationsfähigkeit
Die Verfügbarkeit von Schnittstellen, die Nutzung vorhandener IT-Infrastruktursysteme,
die Einhaltung von Standards und die Offenheit bzgl. Systeminternas sind die
bestimmenden Elemente für die Integrationsfähigkeit in die heutigen komplexen und
heterogenen IT-Landschaften.
Migrationsfähigkeit
Bekanntlich hat die Informationstechnik sehr kurze Innovationszyklen, während die
Archive teilweise eine sehr lange Lebensdauer haben. Migration hat somit viel mit der
oben erwähnten Integrationsfähigkeit zu tun. Hinzu kommen
Kompatibilitätsanforderungen bzgl. der Systemgenerationen sowie Migrationstools.
In dem vorliegenden Dokument liegt der Schwerpunkt auf der Gesamtarchitektur. Zu den
Themen Sicherheit und Integrationsfähigkeit existieren weitere White Paper, die die Details
zu den genannten Aspekten beschreiben.
7
Überblick Systemarchitektur
3. Überblick Systemarchitektur
3.1. Design-Vorgaben
Die Architektur des DocuWare-Systems wurde gezielt entwickelt, um ein stabiles Fundament
für die heutige Funktionalität wie auch für die absehbaren zukünftigen Anforderungen zu
bilden.
Realisiert wird dies durch die Definition verschiedener „Organisationen“ in der Administration,
wobei jede „Organisation“ für einen Mandanten steht. Weiterhin ist es möglich, für jeden
Kunden eigene Administratoren mit entsprechenden Rechten zu definieren und damit auch
zeitlich parallel kundenspezifische Konfigurationen vorzunehmen.
8
Überblick Systemarchitektur
Lediglich die Änderungen an Hardware und Basiskonfiguration, z.B. Art und Anzahl Server,
die das Gesamtsystem betreffen, erfordern eine abgestimmte Vorgehensweise. Dazu ist ein
separater „System-Administrator “ vorgesehen, der zwar befugt ist, solche
Systemänderungen durchzuführen, aber bzgl. der Datenbestände einzelner Mandanten
durchaus in seinen Rechten begrenzt sein kann. Über die Protokollierung kann die Nutzung
nachvollzogen und Sicherheit hergestellt werden.
Über die eingebaute Protokollierung ist auch eine Abrechnungsbasis für den Betrieb im ASP-
Modell verfügbar. Ein DocuWare-Betreiber kann daher als Dienstleister für mehrere Kunden
unterschiedliche DocuWare-Konfigurationen gleichzeitig fahren.
Web-Zugriffe
Mit dem Web Client bietet DocuWare die Möglichkeit, über Internet/Intranet/Extranet auf die
DocuWare-Archive zuzugreifen. Alle wesentlichen Funktionen, wie Dokumente öffnen, mit
Anmerkungen und Stempeln versehen, Indexbegriffe ändern und Dokumente ablegen,
stehen so unabhängig vom Arbeitsplatz und ohne Installation am Client-Rechner zur
Verfügung.
Mehrere Sprachräume
Als internationaler Anbieter ist die volle Unterstützung der wichtigsten romanischen,
germanischen, slawischen und Sprachen sowie Japanisch und Arabisch eine wesentliche
Anforderung. Dazu gehört nicht nur die Übersetzung der Oberflächenelemente, sondern z.B.
auch die Unterstützung verschiedener Zahlen- und Datums-Formate.
DocuWare nutzt auf der Serverseite und bei den neueren Client-Komponenten den Unicode.
Unicode-Zeichen (UTF8) werden sowohl für die Oberflächen als auch für die Datenhaltung
benutzt. Damit können in einem Archiv Dokumente und zugehörige Indexdaten aus
unterschiedlichen – auch asiatischen - Sprachräumen gemeinsam verwaltet werden. Dies
gilt auch für die Nutzung des Volltext-Index.
Standortunabhängigkeit
Die heutige Hardware erlaubt die Speicherung enormer Informationsmengen, so dass viele
Kunden bereits über gewaltige Archive verfügen. Die Software sollte dafür keine Begrenzung
darstellen. Es wurde darauf geachtet, dass das DocuWare-System beliebig große
Dokumentmengen mit der vollen Funktionalität, inkl. Sicherheitsfunktionen verarbeiten kann.
9
Überblick Systemarchitektur
Im täglichen Betrieb eines DMS gibt es viele Routineaufgaben, z.B. zur Dokumentüber-
nahme aus Datenquellen, die sich weitgehend automatisieren lassen. Gleichermaßen
ergeben sich bei den Benutzern – vor allem in administrativen Bereichen – häufig gleichartig
wiederkehrende Abläufe. Es bestand daher die Forderung, ein leistungsfähiges Werkzeug
für die Automatisierung von sowohl systeminternen als auch von benutzerorientierten
Abläufen zu entwickeln.
Das DocuWare-System verfügt zu diesem Zweck über den Workflow Server, der sämtliche
Automationsprozesse steuert und als Workflow-Engine für den Dokumenten-Workflow dient.
Komplexe Systeme, mit vielen Modulen, Schnittstellen und Optionen neigen zu exponentiell
steigendem Administrationsaufwand. Der Name DocuWare steht hingegen für einfach zu
installierende, zu bedienende und zu administrierende Systeme. Dieses Ziel wird auch in
Zukunft weiterverfolgt. Somit bestand die Forderung, auch große und komplexe
Installationen über ein zentrales, einfach zu handhabendes Werkzeug administrieren zu
können.
Auch wenn die Anforderungen aus Betreibersicht essentiell für die Systemarchitektur sind,
so ergibt sich der Nutzen für den Anwender dennoch aus der Funktionalität des
Dokumenten-Management-Systems. An dieser Stelle sind die Funktionen summarisch
aufgelistet, um einen Überblick der Anforderungen zu geben. Detaillierte Beschreibungen
sind der entsprechenden Produktliteratur und der DocuWare Web-Site zu entnehmen
(www.docuware.com).
10
Überblick Systemarchitektur
11
Überblick Systemarchitektur
In den folgenden Kapiteln wird dargestellt, wie die oben beschriebenen Anforderungen in der
Systemarchitektur umgesetzt wurden.
3.2. N-Tier-Architektur
Die Architektur des DocuWare Systems folgt dem „N-tier-Konzept“, das eine
Weiterentwicklung des Client-Server-Konzepts darstellt. Das Konzept charakterisiert sich
dadurch, dass
stark dialogorientierte Funktionen auf den Arbeitsplatzsystemen ablaufen,
die Applikationslogik auf einem oder mehreren zentralen DocuWare-Servern lokalisiert
ist,
mehrere Applikationen gemeinsame Ressourcen auf einem oder mehreren zentralen
Hintergrund-Servern nutzen.
Wie schon im klassischen Client-Server-Konzept, so steht auch hier der Begriff Server für
einen Software-Dienst und nicht für eine Hardware. Ein DocuWare-System besteht in diesem
Sinn immer aus mehreren (Software-)Servern, die aber - im Extremfall - alle auf einem
Hardware-System gleichzeitig ablaufen können.
12
Überblick Systemarchitektur
3.3. DocuWare-Systemarchitektur
An dieser Stelle geben wir einen Überblick über die Architekturkomponenten. Die einzelnen
Komponenten werden anschließend in eigenen Kapiteln detaillierter beschrieben.
13
Überblick Systemarchitektur
Aus diesem Basissystem heraus ist das DocuWare-System funktional ausbaufähig und in
feinen Stufen skalierbar. Das folgende Bild zeigt beispielhaft
die funktionale Ergänzung um Prozess-Server,
die Einbindung von Web-Clients mittels Web Client Server,
die Nutzung separater Hardware-Systeme für
Authentication Server und Workflow Server einerseits und
Content Server andererseits,
Datenbank und Dateiablage
Workflow Server
Der Workflow Server steuert sämtliche Automations- und Workflowprozesse. Zu den
Automationsprozessen gehören z.B. Dokumentenimport, -export, Archivsynchronisation,
Migration und Volltext-Indexierung.
Web Client Server und Imaging Server
Über den Web Client Server, der wiederum auf den Imaging Server zugreift, können
Web Clients eingebunden werden. Die Nutzer dieser Clients benötigen lediglich einen
Browser (Internet Explorer oder Firefox) und können damit Dokumente in DocuWare-
Archiven ablegen, recherchieren, anzeigen, mit Anmerkungen und Stempeln versehen
und vieles mehr.
14
Überblick Systemarchitektur
Diese Architektur erlaubt nicht nur den wechselseitigen Zugriff auf entfernte Archive, sondern
ebenfalls den Aufbau von redundanten Archiven, um unabhängig von Standort und
Übertragungskapazität auf den gleichen Archiven arbeiten zu können. Unabhängig von der
Art des Archivs („Master“ oder „Satellite“) kann in beiden Standorten die volle DocuWare-
Funktionalität inkl. Übernahme beliebiger Dokumente genutzt werden. Die Synchronisation
zwischen „Master“ und „Satellite“ erfolgt über den Workflow Server (siehe 8.1). Die gewählte
Architektur folgt damit vor allem den Anforderungen zur Skalierung über Standortgrenzen
hinaus in regional weit verzweigte Betriebsstätten einer Organisation.
3.4.1. Client-Systeme
Auf der Client-Seite werden sämtliche Versionen von Microsoft Windows ab Version
Windows XP unterstützt. D. h. für diese Windows-Versionen ist ein Rich-Client verfügbar, der
sämtliche Funktionen des DocuWare-Systems zugänglich macht.
Über den Web Client Server können Benutzer mittels eines Web Browsers auf DocuWare
zugreifen.. Für den vollen Funktionsumfang bestehen für diese Web Clients folgende
Voraussetzung: Windows XP oder höher und Internet Explorer ab Version 6 oder Firefox ab
Version 2. Der Web Client kann aber auch mit Firefox auf Mac- oder Linux-Systemen
verwendet werden. (Einschränkungen im Funktionsumfang siehe 7.1.6 Click-Once
Anwendungen und 7.1.7 Silverlight Plug-In für Web-Briefkörbe.)
3.4.2. DocuWare-Server
Die Server des DocuWare-Systems sind auf Basis der .NET-Architektur von Microsoft
realisiert. Durch die Optimierung auf die Microsoft-Plattformen sind Installation und
Administration erheblich vereinfacht und es wurde maximale Performance erzielt.
15
Überblick Systemarchitektur
Obwohl das DocuWare-System eine Reihe eigener Server umfasst, benötigt es keine
Windows-Server-Lizenz, sondern lediglich die „Windows-Engine“. Damit ergeben sich klare
Vorteile bei der Wirtschaftlichkeit des Systems, auch bei Installationen mit mehreren
DocuWare-Servern.
DocuWare Server sind somit auf allen Plattformen lauffähig, die eine der Versionen Windows
XP/2003 oder höher unterstützen.
3.4.3. Infrastruktur-Komponenten
Essenziell benötigt DocuWare eine Datenbank und eine Dateiablage. Mit MySQL ist bereits
eine leistungsfähige Datenbank im Basissystem enthalten. Als Dateiablage kann ein
DocuWare Server beliebiges Windows-Dateisystem, z.B. das
der Content Server-Plattform genutzt
werden. Für beide Aufgaben werden häufig
dedizierte, bereits vorhandene
File Store User Directory Database Hardwaresysteme genutzt, die eventuell
LDAP auch auf Nicht-Windows-Plattformen
lokalisiert sind. Auch diese „Ressourcen“
Active können mit DocuWare genutzt werden.
Directory
NT Domain
3.4.4. Terminalserver
Die Lauffähigkeit des DocuWare-System unter Nutzung des Microsoft Terminalserver und
der Citrix Metaframe Erweiterungen wurde ausgiebig getestet. Somit ist die Nutzung durch
sehr einfache Windows-Stationen in diesem Umfeld gewährleistet.
3.5. Zusammenfassung
DocuWare-Systeme lassen sich optimal in vorhandene IT-Landschaften integrieren, ohne
dass redundante Installations- und Administrationsaufwendungen, z.B. für Datenbanken oder
eine zusätzliche Benutzerverwaltung, anfallen.
16
Authentication Server
4. Authentication Server
Der Authentication Server verwaltet sämtliche Benutzer und Ressourcen des
Gesamtsystems. Die Nutzung des Systems erfordert zunächst immer eine Anmeldung am
Authentication Server.
Abbildung 7: Authentifizierung
17
Authentication Server
Bei der Anmeldung eines Benutzers überprüft der Authentication Server auch die Lizenzen
für die verschiedenen DocuWare-Server, die diesem Nutzer zur Verfügung stehen. Es
werden sowohl „Concurrent Licenses“ als auch „Named Licenses“ unterstützt.
4.1. Passwörter
Passwörter werden generell verschlüsselt bzw. als Hash-Wert abgespeichert. Dies gilt auch
für Systemeinstellungen, wie z.B. das Login beim Datenbank-Server.
Konkret wird das sogenannte „salted“ Hash-Verfahren verwendet, bei dem durch
Kombination mit einem Zufallswert auch bei zwei identischen Passwörtern nicht der gleiche
Hashwert entsteht. Passwörter sind damit weder lesbar noch reproduzierbar
Die Möglichkeiten des Login werden bei der Definition des Benutzers spezifiziert. Die
Benutzerverwaltung obliegt dem Organisations-Administrator.
DocuWare arbeitet mit einem „Ticket-Granting-Ticket“ (TGT), bei dem ein Benutzer bzw.
Client sich am Authentication Server identifiziert, um einen Service nachfragt, ein „Ticket“
erhält und mit diesem Ticket den Service eines anderen Servers, z.B. eines Content Server,
nutzen kann. Um sich am Authentication Server zu identifizieren, benötigt der Client
„Credentials“, die er – wie oben erläutert –entweder über die Benutzereingabe (DocuWare-
Login) oder durch die Windows-Benutzerverwaltung (Trusted-Login) erhält. Der
Authentication Server hat damit die zentrale Kontrollfunktion über die Sessions im System
und kann somit einerseits Sicherheitsvorgaben umsetzen und auch bei Ausfall oder
Überlastung von einzelnen Servern aktiv reagieren.
Die Kommunikation zwischen Client und Servern und zwischen den Servern erfolgt
gesichert. Unterstützt werden die Protokolle NTLM und Kerberos. Zwischen den DocuWare-
Servern wird wegen der höheren Sicherheit optional Kerberos genutzt, bei der
Kommunikation mit externen Systemen wird nach Möglichkeit ebenfalls Kerberos benutzt.
Lediglich wenn das Partner-System dies nicht unterstützt, z.B. bei älteren Windows-
Versionen, wird aus Kompatibilitätsgründen auch NTLM angewendet.
18
Authentication Server
Abbildung 8: Ticket-Granting-Ticket-Verfahren
4.4. Berechtigungskonzept
Mitarbeiter in großen Organisationen absolvieren komplexe Abläufe und unterliegen einer
Vielzahl von Regularien. Um ihre Aufgaben erfüllen zu können, benötigen sie
Berechtigungen zur Benutzung vorhandener Funktionen, Daten und Dokumente. Dabei sind
auch Beschränkungen erforderlich, um nur berechtigten Personen bestimmte Befugnisse
erteilen zu können und um die Übersichtlichkeit für alle Beteiligten zu erhalten.
4.4.1. Rollen
Das DocuWare-System bedient sich dafür neben den „Benutzergruppen“ des so genannten
Rollenkonzeptes, bei dem „Rollen“ definiert werden können, denen dann wiederum
Berechtigungsprofile (Sammlung von Einzelrechten) zugeordnet werden können. Die „Rolle“
fasst somit Berechtigungen und keine Benutzer zusammen. Sie richtet sich typischerweise
an den notwendigen Rechten für die Erfüllung einer bestimmten Aufgabe in einem
betrieblichen Prozess aus.
Durch die Zuordnung einer Rolle zu einem Benutzer oder einer Gruppe von Benutzern,
erhalten diese die Berechtigungen, die in den entsprechenden Profilen vordefiniert wurden.
Eine Rolle verfügt über ein oder mehrere Profile, das die ausführbaren Funktionen definiert
und ein oder mehrere Profile, die die Zugriffe auf die abgelegten Dokumente bestimmen
(siehe „Funktionsprofil“ und „Archivprofil“ im Glossar). Einem Benutzer oder einer Gruppe
können eine oder mehrere Rollen zugewiesen sein.
19
Authentication Server
4.4.2. Profile
Es können mit einer Position bzw. einer „Rolle“ in einer Organisationseinheit ganz
unterschiedliche Aufgaben mit der Notwendigkeit für mehrere Berechtigungen
zusammenhängen. Daher werden die Einzelberechtigungen zu Profilen zusammengefasst.
So können beispielsweise einer Rolle „Chefeinkäufer“ die Profile für das Genehmigen von
Urlaubsanträgen und für das Einkaufen komplexer IT-Systeme zugewiesen werden, weil
beide Aufgaben mit dieser Position verbunden sind, obwohl sie miteinander direkt nichts zu
tun haben.
Den Benutzern werden die Rollen entsprechend ihrer Aufgaben in der Organisation
zugewiesen. Typischerweise füllen Benutzer verschiedene Rollen aus und häufig agieren
mehrere Benutzer in den gleichen Rollen. Benutzer können daher zu „Gruppen“
zusammengefasst werden.
Eine „Gruppe“ ist immer eine Summe von Benutzern. Gruppen können selbst keine weiteren
Gruppen enthalten. Ein Nutzer kann in mehreren Gruppen vertreten sein. Nutzern können
Profile und Einzelberechtigungen auch direkt zugewiesen werden.
20
Content Server
5. Content Server
Clients und andere Server greifen über den Content Server auf A und Datenbank-
Informationen zu. Der Content Server ist damit zuständig für die Gewährleistung eines
einheitlichen Zugriffs und die zentrale Kontrolle bzw. Protokollierung der Archivnutzung.
Der Content Server verwaltet dazu „logische Archive“, denen die Dokumente zugeordnet
sind. Er ist zuständig für sämtliche Zugriffe auf die zugeordneten Archive sowohl für die
Ablage von Dokumenten als auch für die Recherche und die Reproduktion von Dokumenten.
Um die Abbildung auf Wechselmedien zu erleichtern, werden dem Archiv „logische Platten“
zugeordnet und mit ihrer Kapazität spezifiziert. So kann sichergestellt werden, dass
bestimmte Dokumente später auch physikalisch zusammen gespeichert werden und damit
leichter ausgelagert, vernichtet oder transportiert werden können.
Lokalisiert sind die „Platten“ in einem „Speicherort“. Ein Speicherort kann eine beliebige
Dateiablage sein. Für die Dateiablage werden verschiedene Ablagemedien (siehe 5.4)
unterstützt. Auch innerhalb einer Dateiablage sind unterschiedliche Medien möglich.
Jede Organisation kann mehrere Archive haben. Jedes Archiv nutzt eine Datenbank zur
Verwaltung der Indexdaten und einen oder mehrere Speicherorte zur Ablage der Dokumente
und Header-Dateien.
21
Content Server
Beim Design der DocuWare Server war die Erreichung einer hohen Sicherheit ein
wesentliches Designkriterium. Zu den wichtigsten Sicherheitsmaßnahmen des Content
Servers gehören die im Folgenden gelisteten Punkte 1:
Anwender und Administratoren benötigen keine Kenntnisse und damit auch keine
Zugriffsrechte auf die interne Ablagestruktur
Dokumente und Dateien können verschlüsselt in der Dateiablage abgespeichert werden
(Nur in Verbindung mit Enterprise Server)
Dateien werden über einen „Hash-Algorithmus“ mit einer Art Prüfsumme versehen, die
Veränderungen sofort offensichtlich macht.
Bei gleichzeitigem Zugriff verschiedener Nutzer auf dieselben Dokumente wird die
Konsistenz durch das DocuWare-System sichergestellt.
Weitere Sicherheitsmaßnahmen finden sich in der folgenden Beschreibung der wesentlichen
Elemente von Content Server und Archiven.
5.1. Archiv
Im Folgenden ist die Art der Ablage der Daten und Dokumente im DocuWare-System
beschrieben. Ablage und Zugriff auf die Dokumente wird durch den Content Server
verwaltet, Administratoren und Benutzer benötigen keinen direkten Zugriff auf die
Dokumente, weil sie über die DocuWare-Software zugreifen. Die Beschreibung dient somit
primär der Transparenz und Nachvollziehbarkeit.
Ein Archiv ist eine organisationsabhängige Einheit und kennzeichnet sich durch die
benutzerdefinierten Angaben über die Plattenverwaltung und die Indexdaten zu den
Dokumenten.
Jede Organisation hat mindestens ein oder mehrere logische(s) Archiv(e) für die
Dokumentablage. Im Einzelnen werden über die Archiveinstellungen bestimmt:
Allgemeine Angaben zum Archiv, wie z.B. Name des Archivs
Zu benutzende Datenbank und weitere Datenbank-Einstellungen
Zu benutzende Dateiablage und ggf. deren Aufteilung in logische Platten mit jeweiliger
Kapazitätsbeschränkung
Zugriffsrechte (und Archivprofile) für das Archiv und für einzelne Felder
Benutzerdialoge für Ablage, Suche und Ergebnisliste
Web-Instanz(en), in denen das Archiv zur Verfügung steht (für den Zugriff über Web
Client)
Bei der Einrichtung eines Archivs wird ebenfalls der Content Server, über den dieses Archiv
erreichbar ist, festgelegt. Weiterhin werden wesentliche Funktionalitäten über die
Archiveinstellungen bestimmt. So sind beispielsweise sowohl die Verfügbarkeit eines
Volltext-Index als auch Art und Umfang der für die Dokumentbearbeitung verfügbaren
Stempel und elektronischen Signaturen abhängig von den Archiveinstellungen.
Optional kann ein Archiv über mehrere Content Server erreicht werden. Die Zuweisung
erfolgt, gesteuert durch den Authentication Server, beim Login der Benutzer. Damit ist
1
Aufgrund der Bedeutung des Themas „Sicherheit“ für DocuWare existiert ein weiteres White Paper,
welches sich explizit und ausführlich mit den implementierten Sicherheitsmaßnahmen beschäftigt.
22
Content Server
einerseits eine Lastverteilung über mehrere Content Server möglich und zusätzlich kann eine
„Umschaltung“ beim Ausfall eines Content Servers erfolgen.
5.2. Ablagestruktur
Schwarz-weiß gescannte Dokumente in DocuWare werden typischerweise in Form von je
einer TIFF-Datei pro Dokumentseite abgelegt. Die Ablage farbiger Scans erfolgt als JPEG-
oder PNG-Datei. Speziell für Im- und Export kann DocuWare auch Multipage-TIFF-Dateien
handhaben. Alle übrigen von DocuWare übernommenen Dokumente, z.B. PDF- und Office-
Dateien, werden in ihrem Originalformat verwaltet. Die Dokumentablage in den
Speicherorten enthält neben dem abgelegten Dokument selbst weiterhin eine „Header-Datei“
sowie ggf. weitere Dateien für Sprachanmerkungen.
Pro abgelegtem Dokument können so eine Reihe von Dateien zu verwalten sein. Ein
Dokument im DocuWare-Verständnis kann sogar aus einer Kombination mehrerer TIFF-,
Office-, PDF und anderer Dateien bestehen, etwa wenn DocuWare eine E-Mail mit mehreren
Anhängen als zusammengehöriges Dokument übernimmt. DocuWare bezeichnet diese
Teildokumente auch als „Seiten“ (siehe 5.5 bis 5.7). DocuWare erstellt für jedes abzulegende
Dokument ein eigenes Dokumentverzeichnis. Die Verwaltung erfolgt über die erwähnte
Header-Datei im XML-Format. Jedes Dokument erhält eine eindeutige, fortlaufende
Nummer, die DOCID. Diese wird für jedes neue Dokument automatisch erhöht.
DocuWare nutzt vier Ebenen und kann damit pro Archiv über 4 Mrd. (2564 = 4.294.967.296)
Dokumente verwalten. Unterhalb des vom Administrator zugewiesen Dateiverzeichnisses
wird das DocuWare-Verzeichnis adressiert durch Archivnamen, Plattennummern, drei
Verzeichnisebenen und die Dokumentebene.
23
Content Server
Wird dem Archiv beispielsweise das Verzeichnis „D:\DOCS“ zugewiesen und als Archivname
„VERKAUF“ gewählt, so finden sich die Dokumente der ersten Platte in folgendem
Unterverzeichnis:
Verzeichnis zu Header zu
Platte 1 Dokument 1 Dokument 1
Neben der Header-Datei, finden sich in dem Dokumentverzeichnis die Dateien zu dem
abgelegten Dokument, die alle mit der Bezeichnung „F“ (=File) und einer laufenden Nummer
versehen sind. Sound-Anmerkungen zu dem Dokument (gesprochener Text etc.) sind über
die Nutzung des Namens „A“ (=Annotations), die Nummer der zugehörigen F-Datei sowie
eine laufende Nummer zu identifizieren.
Ein Dokument, das aus unterschiedlichen Teilen besteht und über Sprachanmerkungen
verfügt, würde dann beispielsweise folgendermaßen dargestellt:
\00000001\ 00000001.XML
\ F1.pdf
\ F2.doc
\ F3.tif
\ A1_1.wav
\ A1_2.wav
5.3. Plattenkonzept
Die Dokumente eines Archivs werden in so genannten DocuWare-Platten abgespeichert.
DocuWare-Platten sind Verzeichnisse in der Dateiablage, die einen von DocuWare
vorgegebenen Namen tragen. Die Unterteilung der Dokumentablage in logische Platten dient
der Organisation der Speichermedien.
Diese – logischen – Platten können jederzeit oder bei Erreichen einer vorher eingestellten
Größe, auf ein anderes – physikalisches – Medium übertragen werden. Dadurch ergibt sich
bei der Verwaltung der Dokumente mit DocuWare der Vorteil, dass die Dokumente nach
vordefinierten Regeln oder automatisch auf andere physikalische Medien ausgelagert
werden können. DocuWare bietet dazu komfortable Unterstützungsfunktionen an, die auch
eine Automatisierung der entsprechenden Schritte erlauben.
Das Konzept der logischen Platten und die offengelegte Ablagestruktur bietet dem
Administrator sehr hohe Transparenz und Flexibilität in seiner täglichen Arbeit mit der
Ablage. Aufgrund dieser Orientierung an den verbreiteten Standards kann dies, wenn
gewünscht, auch – weniger komfortabel – über die Werkzeuge des Betriebssystems
geschehen.
24
Content Server
Unterstützt werden sowohl lokale Festplatten als auch (virtuelle) Netzwerk-Ablagen und
externe Speichersysteme. Auf welcher technologischen Basis diese Ablagen realisiert sind,
ist für DocuWare unerheblich. Bei Einhaltung der Konventionen für Windows-Dateisysteme
kann DocuWare beliebige Ablagemedien unterstützen. Daher sind moderne
Speicherverfahren wie RAID-Systeme, NetApp-Speicherlösungen, Network Attached
Storage (NAS), andere „Shared Disk“-Systeme oder Storage Area-Networks (SAN) nutzbar,
sofern sie sich als virtuelles Laufwerk in das Windows-Dateisystem einbinden lassen.
Zusätzlich werden einige Jukeboxen und spezielle Speichersysteme direkt unterstützt. D.h.
DocuWare liefert Software, mit der diese Speichersysteme als DocuWare-Dateiablage
analog der Benutzung von Windows-Dateiablagen in ein Archiv einbindbar sind.
Es ist einstellbar, ob Dateien bei der Archivierung direkt auf das Zielmedium geschrieben
werden sollen, z.B. bei WORM-Einsatz um maximale Sicherheit zu erhalten, oder ob
zunächst eine Zwischenspeicherung auf der virtuellen Platte erfolgt, weil beispielsweise
CDs/DVDs nicht sukzessive brennbar sind.
Pro GB Speicher können ca. 20.000 DIN A4 Seiten abgespeichert werden. Dies entspricht in
etwa 40 gut gefüllten Aktenordnern. Es besteht zusätzlich die Möglichkeit, mehrere
Festplatten zu einem sogenannten Disk-Array zusammenzuschalten. Diese Arrays sind für
einen Speicherbedarf von bis zu 150 GB die ideale Lösung für ein Archivsystem, wenn die
Magnetspeicherung kein prinzipielles Problem darstellt.
In der Form eines RAID (Redundant Array of Independent Disks) erhält man durch die
Redundanz erhöhte Sicherheit gegen Datenverlust bei Ausfall einer Festplatte und kann – je
nach RAID-Level – den Austausch während des laufenden Betriebes vornehmen.
Auf einer optischen Wechselplatte (CD, DVD, Blu-Ray, WORM) können bis zu 50 GByte an
Daten gespeichert werden. Dies entspricht bis zu 800.000 reinen Textseiten. Der Einsatz
solcher Laufwerke ist ohne Jukebox nur im Einzelplatzsystem sinnvoll. Der Vorteil dieser
Systeme liegt darin, dass ein Archiv beliebig erweitert werden kann, indem weitere Platten
eingelegt werden. Die Verwaltung und Nummerierung der Platten wird von DocuWare
vorgenommen. Wenn die Platten gemäß den Vorschlägen von DocuWare beschriftet sind, ist
ein Wiederfinden der Dokumente auch bei mehreren Platten denkbar einfach.
25
Content Server
5.4.3. Jukeboxen
Bei Jukeboxen handelt es sich um „Plattenroboter“ für den automatischen Wechsel von
optischen Medien in typischerweise ein bis vier Laufwerken. Jukeboxen bieten heute die
größte Speichermenge im Online-Zugriff. Kleinere Lösungen speichern 10 GB, High-End-
Maschinen bis zu mehreren tausend Gigabyte. Diese Geräte bieten sich als Medien für
Netzwerke an, in denen sehr große Datenmengen anfallen. Die Zugriffsgeschwindigkeit
hängt von der Anzahl der eingebauten Laufwerke ab. Bei häufigen Plattenwechseln liegt die
Zugriffszeit bei mehreren Sekunden pro Bilddatei.
26
Content Server
5.5. Header-Datei
Alle in DocuWare verwalteten Dokumente haben eine Header-Datei, die sowohl die für
dieses Dokument vergebenen Meta- und Indexdaten als auch die Anmerkungen, Stempel,
Signaturen etc. enthält. Indexdaten werden einerseits in die Datenbank und andererseits
auch in die Header-Datei zum Dokument geschrieben. Diese doppelte Datenhaltung gibt
größte Sicherheit. Selbst bei einem Totalausfall der Datenbank ohne Backup stehen die
Dokumente und Indexdaten trotzdem noch zur Verfügung.
Header-Dateien sind als XML-Datei realisiert. Durch die Verwendung dieses Standard-
Dateiformats ergeben sich für den Kunden folgende Vorteile:
Stärkere Unabhängigkeit vom Anbieter durch Offenlegung der internen
Verwaltungsstrukturen
Maximale Transparenz durch les- und schreibbare Formate
Vereinfachter Austausch mit allen standardkonformen Systemen, inkl. zukünftiger
DocuWare-Generationen
Vereinfachter Austausch mit Capturing-Systemen und Scan-Dienstleistern
DocuWare benutzt dieses Format für die Speicherung der Metadaten und
Dokumentergänzungen. Der Content selbst wird aus Performancegründen separat
gespeichert (Ausnahme Export). DocuWare verwendet die XML-Datei nicht nur für NCI,
sondern für alle im DocuWare System verwalteten Dokumente. Für jede Datei, die
Bestandteil eines DocuWare-Dokumentes ist, existiert in der XML-Datei ein eigener
Abschnitt, der jeweils eigene Metadaten enthalten kann.
27
Content Server
5.6. Metadaten
Innerhalb des Bereiches Metadaten sind sowohl die vom Benutzer vergebenen Attribute
(Indexdaten, Field Properties) gespeichert als auch die Daten, die von DocuWare für die
Verwaltung benötigt werden (System Properties), wie z.B. die DOCID hinterlegt. Diese Daten
sind identisch zu den Indexdaten, die zu der Datei in der Datenbank vorgehalten werden.
DocuWare stellt die Integrität zwischen Datenbank und Header-Datei sicher. Sollte eine
Datenbank unwiederbringlich verloren gehen (kein lauffähiges Backup verfügbar), können
somit aus den einzelnen Header-Dateien die Datenbank-Informationen wieder hergestellt
werden. Dieser Vorgang kann jedoch sehr zeitintensiv sein, so dass er nicht als Substitut für
eine herkömmliche Datensicherung dienen sollte.
28
Content Server
Innerhalb der Ablageinformationen (Store Properties) werden Informationen über die Historie
und das logische Archiv der Datei gespeichert. Bei den Applikationsspezifika (Application
Properties) handelt es sich um Informationen, die für die Integration mit anderen
Applikationen, z.B. SAP, benötigt werden.
5.7. Dokument
Ein Dokument in DocuWare kann aus mehreren Dateien verschiedenen Formats (TIFF,
Word, PDF etc) bestehen, die wiederum aus mehreren Seiten bestehen können.
Beispiele:
I. Ein 3-seitiges Papierdokument, das durch Scannen in DocuWare erfasst wurde,
besteht aus drei einseitige Dateien (von DocuWare erzeugte s/w TIFF-Dateien).
II. Für ein Dokument werden eine von DocuWare erzeugte s/w TIFF-Datei, eine 3-seitige
Word-Datei und eine 2-seitige PDF-Datei zusammengeheftet. Das Dokument besteht
dann aus drei Dateien:
Wie in Adobe PDF werden die Annotationen mit Ihren Merkmalen und zusätzlichen
Attributen, z.B. Benutzerinformationen gespeichert und zur Laufzeit durch den Viewer
reproduziert. Es sind daher keine zusätzlichen Image-Dateien notwendig und die
Annotationen können flexibel geändert und nachvollzogen werden.
29
Datenbanken
6. Datenbanken
Die Installation einer relationalen Datenbank ist Voraussetzung für den Betrieb von
DocuWare. Sie wird sowohl für die Speicherung und Recherche in den strukturierten
Indexdaten der Dokumente als auch für den Volltext-Index verwendet. Weiterhin legt
DocuWare wesentliche Systeminformationen, z.B. des Authentication Server, in der
Datenbank ab.
Bei der Installation richtet DocuWare optional automatisch die mitgelieferte, integrierte
Datenbank ein, es sei denn, der Administrator wählt die Option explizit ab, etwa um
ausschließlich die bereits im Einsatz befindlichen Systeme zu nutzen.
6.1. Datenbank-Struktur
Die Recherche der in DocuWare abgelegten Dokumente erfolgt immer über eine Datenbank.
Dazu werden die Indexdaten des Dokumentes entweder in strukturierter Form (relational)
und optional in Form eines Volltext-Index abgelegt.
Neben den für den Benutzer wesentlichen Suchkriterien verwaltet die Datenbank auch die
systeminternen Informationen zum Speichern und Wiederfinden der Dokumente in den
Speicherorten.
Das wesentliche kennzeichnende Merkmal eines Dokumentes ist dabei die DOCID. Bei der
DOCID handelt es sich um eine pro Archiv eindeutige Nummer für ein Dokument, das aus
vielen Dateien bestehen kann.
Besondere Bedeutung haben naturgemäß die benutzerdefinierten Felder. Mit ihnen wird
festgelegt, nach welchen Begriffen und Kategorien die Dokumente abgelegt und wieder
gesucht werden.
Durch die separaten Stichworttabellen ist es grundsätzlich möglich, beliebig viele Stichwörter
zu einem Dokument zu speichern. Außerdem ist es möglich, mehrere Stichwortfelder in
einem Archiv anzulegen. Die Geschwindigkeit beim Suchen innerhalb des Stichwortfeldes ist
dabei sehr hoch, da in der Tabelle ein Index auf die Stichwort-Spalte gesetzt wird. Wenn
dann der entsprechende Eintrag gefunden wurde, kann direkt über die DOCID auf die
Datenbankeinträge der gefundenen Dokumente zugegriffen werden.
30
Datenbanken
31
Datenbanken
6.4. Datenbank-Administration
Datenbanken können auf eigenständigen Servern (außerhalb des DocuWare-
Serverbereiches) lokalisiert sein und DocuWare kann gleichzeitig mit mehreren Datenbank-
Verbindungen zu unterschiedlichen Servern und verschiedenen Datenbanken arbeiten. Ob
mehrere Verbindungen gleichzeitig zu einer Datenbank aufgebaut werden können, ist
abhängig von der verwendeten Datenbank.
32
Webbasierte Anwendungen
7. Webbasierte Anwendungen
Der Trend bei IT-Anwendungen geht immer mehr hin zu webbasierten Lösungen. Installation
und Wartung auf Client-Rechnern werden dadurch überflüssig, Zugriff auf die Anwendung ist
von überall und von allen Rechnern, unabhängig vom Betriebssystem, aus möglich. Einzige
Voraussetzung ist eine Internetverbindung.
Auch DocuWare geht diesen Weg. Mit dem Web Client wird der Archivzugriff realisiert.
Recherche und Ablage von Dokumenten ist aus Anwenderperspektive analog zum Windows-
Client realisiert, technologisch ist es jedoch eine komplette Neuentwicklung basierend auf
ASP.NET, JAVA-Script, AJAX und Silverlight.
Basis für den Archivzugriff über Internet ist der Web Client Server, der innerhalb des
DocuWare-Systems als ein weiteres Servermodul installiert wird. Der Web Client Server
stellt die Benutzeroberfläche, die im Browser-Fenster angezeigt wird, zur Verfügung.
Für einen Archivzugriff verbindet sich der Anwender über Internet mittels Web Client mit dem
Web Client Server. Letzterer leitet die Anfrage an den Authentication Server zur Prüfung des
Benutzerkontos und der Rechte für den Archivzugriff über den Content Server weiter. Aus
der Perspektive vom Authentication Server und Content Server verhält sich der Web Client
Server wie ein Client.
Der Imaging Server, ein weiterer Bestandteil für den webbasierten Dokumentzugriff,
konvertiert die archivierten Dokumente, die im Viewer des Web Clients angezeigt werden
sollen, in ein Grafik-Format. Dadurch können alle gängigen Dateiformate in hoher Qualität
angezeigt und ausgedruckt werden, ohne dass am Client-Rechner etwas installiert werden
33
Webbasierte Anwendungen
muss. Des Weiteren ist der Imaging Server für die Konvertierung der Dateien in PDF und die
Textsuche im Viewer des Web Clients verantwortlich.
Der Web Client Server kommuniziert direkt mit dem Imaging Server. Innerhalb eines
DocuWare-Systems können mehrere Imaging Server installiert werden, so dass eine
Lastverteilung möglich ist.
Im Web Client können Dokumente im Viewer und im Briefkorb als Thumbnails dargestellt
werden. Um eine höhere Performance zu erreichen, werden die Thumbnails nicht für jeden
Aufruf neu berechnet, sondern in einer dedizierten Datenbank gespeichert und bei Bedarf
von dort für die Anzeige bereitgestellt. Das Speichern und Abfragen von Thumbnails
übernimmt der Thumbnail Server, der sowohl zum Web Client Server als auch zur
Datenbank Verbindung hat.
Abbildung 13: Web Client Server mit Imaging Server und Thumbnail Server
Für einen Web Client Server können beliebig viele Web-Instanzen eingerichtet werden.
Jeder dieser Instanzen wird eine eindeutige URL zugeordnet. Über diese URL verbindet sich
der Anwender mit dem Web Client Server und ruft so die entsprechende Instanz im Web
Client auf.
Pro Instanz wird festgelegt, welche Archive und Archivdialoge zur Verfügung stehen und wie
die Anmeldung am DocuWare-System erfolgt.
Der Web Client ist das Benutzerinterface für den webbasierten Archivzugriff.
Indem der Anwender im Browser eine URL zu einer Web-Instanz aufruft, wird der Web Client
im Browserfenster angezeigt. Über den Web Client lassen sich alle wesentlichen Funktionen
des Dokumentenmanagement-Systems ausführen: Dokumente öffnen, mit Anmerkungen
und Stempeln versehen, Indexbegriffe ändern, Dokumente ablegen, versenden und vieles
mehr.
34
Webbasierte Anwendungen
Technologisch basiert der DocuWare Web Client auf ASP.NET und Ajax (Asynchronous
JavaScript and XML). Dank dieser Technologien bearbeitet der Web Client Recherchen sehr
schnell, und der Anwender bekommt unmittelbar eine Antwort auf seine Anfrage. Grundlage
des Web Clients sind einzelne Steuerelemente, sogenannte Web Parts.
Der Web Client kommt prinzipiell ohne jegliche Installation am Client-Rechner aus und ist
Betriebssystem unabhängig. Lediglich für Funktionen, die nicht rein browserbasiert
umsetzbar sind, werden Anwendungen am Client-Rechner installiert (siehe folgende Kapitel).
Das Versenden von archivierten Dokumenten über den lokalen Mail-Client, einer weiteren
Funktion des DocuWare Web Clients, ist technisch nicht vollständig browserbasiert möglich.
Es muss eine DocuWare-Anwendung, ein sogenannter Smart Client, am lokalen Client-
Rechner installiert werden.
DocuWare verwendet dazu die Click-Once-Technologie von Microsoft. Der Anwender lädt so
per Mausklick einmalig beim ersten Mail-Versand die DocuWare-Anwendung herunter, die
automatisch am lokalen Client-Rechner installiert wird. Hierzu sind keine
Administrationsrechte unter Windows erforderlich. Ein Update dieser Anwendung kann
automatisch erfolgen.
Das Bearbeiten von Dokumenten, wie z.B. Heften, Entheften und Vorindexieren, erfolgt in
DocuWare in sogenannten Briefkörben. Für den Web Client befinden sich solche Briefkörbe
im Allgemeinen nicht auf dem lokalen Rechner, sondern im Netzwerk. Diese Briefkörbe,
auch Web-Briefkörbe genannt, werden vom Content Server verwaltet. Damit der Benutzer
des Web-Clients solche Web-Briefkörbe nutzen kann, ist die lokale Installation eines
Silverlight Browser-Plug-In erforderlich. Voraussetzung für ein Silverlight Browser-Plug-In ist
ein Windows- oder Mac-Betriebssystem.
Die Integrationsmöglichkeiten des Web Client sind vielfältig. Es kann sowohl der Web Client
als Ganzes in andere Anwendungen eingebaut werden als auch einzelne Elemente wie
Ergebnisliste oder Anzeigefenster. Die Integration funktioniert mit Windows- und Web-
Programmen über spezielle URL-Aufrufe.
Eine vollständige Übersicht über die Integrationsmöglichkeiten des DocuWare Web Clients
ist im White Paper „Integrationen“ enthalten.
Technologisch wird hier auf Silverlight gebaut, d.h. der Administrator benötigt ein Silverlight
Browser-Plug-In. Voraussetzung dafür ist ein Windows- oder Mac-Betriebssystem.
35
Process Management Framework
Dokumenten Workflow
Die automatische Versendung, inkl. Benutzer-Interaktion von Dokumenten entlang
vordefinierter Wege ist eine der häufigsten Workflow-Anwendungen. Von Rechnungen,
über Bestellanforderungen bis zu Urlaubsanträgen sind Dokumente – speziell in
größeren Organisationen – über mehrere Stationen zu erstellen, zu genehmigen und zu
buchen. Diese Prozesse lassen sich mit dem Document Workflow steuern und
verfolgen.
Der Workflow Server ist die zentrale Workflow-Engine zur Ausführung der vordefinierten
Workflows. Workflows kennzeichnen sich durch folgende Merkmale:
Auslösendes Ereignis
Eingabedaten
Diverse logisch getrennte Verarbeitungsschritte
Ausgabedaten
Analog zu diesem Modell agiert der Workflow Server. Ereignisse können sowohl durch
Nutzeraktionen als auch durch zeitliche Vorgaben oder das Erreichen bestimmter
Systemzustände, z.B. „Platte voll“, ausgelöst werden.
Durch ein solches Ereignis wird ein bestimmter Workflow gestartet, der dann gemäß seiner
Vorgaben typischerweise zunächst Eingabedaten einliest. Die Eingabe kann durch
Interaktion oder durch das Lesen einer Datei aus einem bestimmten Verzeichnis oder von
Daten aus einer Datenbank erfolgen.
36
Process Management Framework
Bei erfolgreicher Verarbeitung in einem Schritt, erfolgt automatisch die Übergabe des
(Zwischen-)ergebnisses an den nächsten Verarbeitungsschritt und am Schluss die Ausgabe
entweder an den Benutzer in ein Verzeichnis oder auch an das DocuWare-Archiv.
Durch ein Zwischenergebnis oder durch die Workflow-Aufgabe gesteuert, können neue
Ereignisse ausgelöst werden, die wiederum andere Workflows initiieren können.
Verschiedene Workflows können parallel die gleichen Aufgaben lösen und sich dazu auch
derselben Ressourcen, z.B. Verzeichnisse, Archive etc. bedienen. Der Workflow Server stellt
sicher, dass die Integrität der Daten bestehen bleibt. Über das Monitoring ist der
Verarbeitungsstatus der Prozesse insgesamt und auch der einzelnen Workflow-Aufgabe
jederzeit transparent.
Für die folgenden Aufgaben existieren vordefinierte Workflows, die durch den Workflow
Server gesteuert werden:
Migration
Export von Archiven oder Teilarchiven
Erzeugung und Synchronisation von Satellitenarchiven
Erzeugung von selbsttragen CD/DVD-Archiven
Ergänzen von Indexinformationen aus externen Datenquellen (AUTOINDEX)
Wiederherstellen der Indexeinträge (Restore)
Löschen von Dokumenten, die über Filter definiert werden
Erzeugen bzw. Aktualisieren des Volltextkatalogs
Übername von Dokumenten aus Spool-Dateien (COLD/READ)
37
Volltext-Index
9. Volltext-Index
9.1. Funktionsprinzip
Zur DocuWare-Funktionalität gehört generell ein Volltext-Index, dessen Benutzung für den
Anwender jedoch optional ist. Der Volltext-Service nutzt die gleiche Datenbank wie der
Content Server, legt dort jedoch seine eigenen Tabellen an. Der Zugriff auf die Archiv-
Datenbank und die Dokumente erfolgt beim Erzeugen des Volltext-Indexes direkt, also ohne
zwischengeschalteten Content Server.
Die Volltext-Recherche ist voll in die Client-Funktionalität sowohl für den Windows- als auch
für den Web-Client integriert. Somit werden weder spezielle Datenbanken benötigt, noch
muss sich der Anwender mit verschiedenen Recherche-Clients auseinandersetzen. Lediglich
bei der Konfiguration der Archive ist zu entscheiden, ob ein Volltext-Index für die Dokumente
erstellt werden soll. Die Volltext-Recherche erfolgt über den Content Server
Für jedes logisches Archiv ist ein Volltext-Index erstellbar. Welche Dokumente in den
Volltext-Index aufgenommen werden sollen, bestimmt sich durch die Zugehörigkeit zu einem
bestimmten Archiv. Da sehr viele Archive in einem DocuWare-System vorhanden sein
können, kann es entsprechend viele Volltext-Indexe geben.
Da die generelle Fluktuation von Dokumenten im Archiv durch den Content Server verwaltet
wird, ist eine Kommunikation zwischen Content Server und Volltext-Workflow notwendig,
obwohl beide unabhängig agieren. Dies geschieht „indirekt“ über die Volltext-Haupttabelle, in
die der Content Server neu zu indizierende Dokumente oder Dateien einträgt und gelöschte
entsprechend markiert. Der Volltext-Workflow arbeitet daraufhin die notwendigen
Änderungen ab und setzt entsprechende Statusfelder.
Neben den Fundstellen für die einzelnen Begriffe, erfolgt gleichzeitig eine Bewertung der
voraussichtlichen Relevanz eines Begriffs. Die Ergebnisliste einer Volltextrecherche sortiert
sich entsprechend dieser Relevanz (bzw. Nicht-Relevanz = Noise).
Um den Volltext-Index nicht mit irrelevanten Begriffen, wie Artikel (der, die, das), Personal-
pronomen etc. zu belasten, beinhaltet der Volltext-Prozess eine „Stoppwortliste“, die bei der
Volltext-Indexierung automatisch als Filter dient. Diese Liste ist durch den Archiv-
Administrator veränderbar. Damit können spezifische, im Unternehmen sehr häufig
verwendete Begriffe von vornherein aus dem Volltext-Index ausgeschlossen werden, weil sie
für die Recherche nicht dienlich sind. Beispielsweise ist der Begriff DocuWare im Hause
DocuWare nicht zur Differenzierung geeignet. Weiterhin können Dateien über ihre Endung
aus dem Volltext ausgeschlossen werden, um beispielsweise Grafiken auszuschließen.
38
Volltext-Index
Um performant nach Teilstrings suchen und Wildcards auch vor dem Suchbegriff platzieren
zu können, wird ein spezieller Algorithmus verwendet, der sich „Multi-Suffix-Tree“ (MST)
nennt. Dieses Verfahren arbeitet mit zwei speziellen Dateien, über die zunächst der richtige
Eintrag in der Dictionary-Tabelle identifiziert wird, der dann alle weiteren Informationen
(Relevanz, Position etc.) verfügbar macht.
Der eigentliche Volltext-Index wird über die beiden Dateien (MST-Datei, Stringlist-Datei)
realisiert, die je Archiv innerhalb des Dateisystems gespeichert werden. Die einzelnen
Wörter und Teilstrings sind als Baumstruktur in der MST-Datei gespeichert. Die Stringlist-
Datei ist eine Liste von IDs, über die alle Wörter und Teilstrings mit den Einträgen der
Dictionary-Tabelle verknüpft sind.
39
Verteilte und redundante Archive
Weiterhin ist häufig der Export von (Teil-)archiven gewünscht, um beispielsweise bestimmte
Informationen mobilen Benutzern auch außerhalb der Firmeninfrastruktur zur Verfügung zu
stellen. Dazu dienen die so genannten „Selbsttragende Archive“.
Durch den Einsatz moderner Sicherheitstechnologien, wie z.B. VPN´s, Firewalls etc. kann
Missbrauch weitestgehend vermieden werden. In diesem Kapitel werden daher lediglich die
direkt von DocuWare bereitgestellten Funktionen für verteilte und redundante Archive
besprochen.
10.1. Satellitenarchive
Wie bereits unter Systemarchitektur (siehe 3.3) und Workflow Server (siehe 8.1) erwähnt,
kann sich eine DocuWare-Installation über mehrere Standorte erstrecken. Weiterhin kann in
einer eigentlich eigenständigen DocuWare-Installation auch ein „Satellitenarchiv“ einer
anderen Lokation etabliert werden. Dabei erfolgt – einstellbar – eine periodische
Synchronisation zwischen den Standorten, um beide Bestände aktuell zu halten.
Die Architektur der Satellitenarchive kennzeichnet sich über die folgenden Merkmale:
Es kann mehrere Satellitenarchive zu einem Master geben.
Ein Satellitenarchiv kann selbst wiederum Master für andere Satellitenarchive sein, aber
es hat immer nur einen Master.
Unabhängig von der Art des Archivs („Master“ oder „Satellit“) kann in beiden Standorten die
volle DocuWare-Funktionalität, inkl. Übernahme beliebiger Dokumente genutzt werden.
Sofern zwischen zwei Synchronisationsläufen ein Dokument auf beiden Seiten verändert
wurde, greifen die Regeln des vordefinierten Workflows. Es ist genau definiert, wie mit
gelöschten, veränderten und neuen Dokumenten auf beiden Seiten zu verfahren ist. Sofern
Modifikationen am Dokument und/oder am Indexeintrag zum Dokument festgestellt wurden,
lauten die verfügbaren Einstellungen:
Master überschreibt Satellit
Satellit überschreibt Master
Letzte Änderung ist gültig
Keine Aktion, sondern Aufnahme in Log-Datei
Im letzten Fall kann dann eine manuelle Nachbearbeitung erfolgen.
Es lassen sich Zeitvorgaben für die Synchronisationen machen oder die Workflows manuell
starten.
40
Verteilte und redundante Archive
D. h. das Dokumente auch im Offline-Betrieb nicht nur gelesen, sondern auch bearbeitet
werden können. Neue Dokumente lassen sich in das Archiv einbringen und über die
Workflow-Steuerung lassen sich offene Aufgaben erledigen, z. B. Freigaben erteilen.
Die Synchronisation mit dem Master erfolgt zeitgesteuert oder von Hand gestartet durch den
Anwender. Da Veränderungen meist nur in Teilbereichen des Archivs erfolgen bzw. erfolgen
dürfen, lassen sich über die sehr leistungsfähige Filterfunktion die Synchronisationsbereiche
vorgeben. Die benutzerindividuelle Beschränkung der Synchronisation auf einzelne Archive
und Teilbereiche von Archiven ist besonders wichtig, um sowohl den Speicherbedarf auf den
mobilen PCs als auch das Datentransfervolumen bei der regelmäßigen Synchronisation so
gering wie möglich zu halten.
Technisch gesehen handelt es sich bei einem Mobilen Nutzer um eine Single-User-
Installation, bei der ein komplettes DocuWare-System, inklusive Authentication Server,
Content Server und ggf. Workflow Server auf einem Rechner – typischerweise ein Notebook
- installiert ist.
Dieses Archiv kann somit flexibel auf unterschiedlichsten Computern, z.B. Notebooks
genutzt werden, ohne dass eine Verbindung zur sonstigen IT-Infrastruktur besteht. Die
Kapazität des Archives ist lediglich von der Mediumskapazität abzüglich der
Recherchesoftware abhängig.
41
Integration
11. Integration
Archivsysteme müssen sich typischerweise in ein bestehendes IT-Umfeld integrieren. Die
Herausforderung ist dabei nicht nur Koexistenz zu ermöglichen, sondern durch Austausch
von Daten und Dokumenten mit Fremdsystemen ein systemtechnisches Optimum zu
erreichen, ohne gleichzeitig komplexe und hochgradig redundante
Administrationsaufwendungen hinnehmen zu müssen.
Weiterhin lassen sich beliebige Speichertechnologien nutzen, sofern sie sich als Windows-
Dateiverzeichnis darstellen lassen. Dies ist bei allen namhaften Systemen möglich. Damit
sind DocuWare-Archive auch unter Einbeziehung von Non-Microsoft-Systemplattformen
(z.B. Linux, Novell, Solaris) realisierbar.
Die Einbindung „fremder“ Plattformen ist weiterhin möglich für Datenbank-Server, Mail-
Systeme, Web-Server oder Applikationen, zu denen Schnittstellen bestehen, wie z.B. SAP.
Aufgrund der Bedeutung des Themas „Integration“ gibt es hierzu ebenfalls ein „White Paper“.
Die folgende Grafik bietet bereits hier einen Überblick darauf, wie mit Fremdapplikationen auf
DocuWare aufgesetzt werden kann. Detailliert ist auch dies im White Paper „Integrationen“
beschrieben.
42
Integration
43
Skalierbarkeit
12.Skalierbarkeit
DocuWare-Systeme sind hochgradig skalierbar. Dies beginnt mit Einzelplatzsystemen und
endet mit organisations- und standortübergreifenden Systemen mit Tausenden von Nutzern
und einer Verteilung über mehrere Server.
Abbildung 16: Skalierbarkeit; „DocuWare Client“ subsummiert Windows Client und Web Client
44
Skalierbarkeit
Bei großen Installationen und intensiver Nutzung des Systems kann der Content Server
daher zum Engpassfaktor werden. In diesem Fall ist die Last auf mehrere Content Server
aufzuteilen. Fällt ein Content Server aus, wird durch einen Neustart des Clients von dem
Authentication Server ein neuer Content Server (CTS) zugewiesen.
Weiterhin ist Lastverteilung durch die Plattformvarianten der Systemhersteller, z.B. Microsoft
Cluster-Lösung, möglich. Durch die modulare Struktur und die N-tier-Architektur lassen sich
die dort gegebenen Möglichkeiten optimal nutzen, weil das System die Ressourcen
bedarfsgerecht zuordnen kann.
Weiterhin kann eingestellt werden, dass im Cache immer nur aktuelle Daten gehalten
werden. D.h. alle Daten ab einem vorgegebenen Alter werden automatisch gelöscht.
45
Glossar
13.Glossar
Administrative Rechte Administrative Rechte umfassen die Rechte zur Änderung von
Archivdefinitionen oder Definitionen innerhalb einer Organisation.
Archiv Ein „Archiv“ ist in DocuWare eine logische Einheit, die Dokumente
entgegennimmt, speichert, sucht und wieder bereitstellt. Ein Archiv umfasst
immer die Dateiablage, in der die Dokumente physikalisch gespeichert sind,
sowie die zugehörigen Datenbanktabellen, die Indexdaten und andere
beschreibende oder ergänzende Elemente zu dem Dokument enthalten.
Optional kann ein Archiv auch einen Volltext-Index enthalten, der die
Dokumente zusätzlich über die Volltext-Information zugänglich macht.
Für die Dateiablage können unterschiedliche Ablagemedien Verwendung
finden. Dazu werden den Archiven „logische Platten“ zugeordnet, die nach
vorgegebenen Regeln auf physikalische Ablagemedien abgebildet werden.
Ein Archiv ist eine Sammlung verschlagworteter Dokumente. Für Archive
können fein abgestimmte Zugriffs- und administrative Rechte vergeben
werden.
Archiv-Administrator Nutzer, dem das Administrationsrecht für ein Archiv gegeben wurde. Er
kann dieses Recht nicht weitergeben.
Archiv-Besitzer Nutzer, der ein Archiv anlegt und administrieren darf. Dieser verwaltet die
Archivstruktur und vergibt die Zugriffsrechte auf das Archiv. Das Recht zur
Administration kann weitergegeben werden, d.h. der Besitzer kann die
Administrationsaufgabe delegieren.
Archivprofil Ein Archivprofil umfasst die Zugriffsrechte auf ein Archiv. Dazu gehören
unter anderem die Zugriffsrechte auf Indexfelder oder Dokumente, die auch
von bestimmten Indexeinträgen abhängig sein können (feldabhängige
Rechte). Ein Archivprofil kann auch administrative Rechte innerhalb eines
Archivs umfassen. Ein Archivprofil wird innerhalb eines Archivs definiert.
Benutzer In diesem White Paper ist ein Benutzer immer ein DocuWare Benutzer.
Benutzer können zu Gruppen zusammengefasst werden. Benutzer erhalten
Rechte sowohl über Einzelrechte, Profile oder Rollen.
COLD Einziges proprietäres Dateiformat in DocuWare ist das COLD-Format. Es ist
ein ANSI-Format und nimmt die Text-Spooldaten beim Einlesen mit
DocuWare COLD/READ auf.
DocuWare-Client DocuWare-Client ist ein Oberbegriff für den Windows- und den Web Client.
Der Windows-Client wird auf einem Windows-Rechner installiert und läuft
dort als eigene Anwendung. Zusammen mit den DocuWare-Servern ergibt
er eine funktionsfähige Installation. In einem DocuWare-System ist immer
mindestens ein Windows-Client erforderlich.
Über den DocuWare Web Client kann man über das Internet auf
DocuWare-Archive zugreifen. Eine Installation am Client-Rechner ist nicht
erforderlich. Im DocuWare-System muss dafür der Web Client Server
installiert sein.
DocuWare-Server DocuWare-Server ist ein Oberbegriff und umfasst alle Server-Module wie
Authentication Server, Content Server, Workflow Server, Imaging Server
und Web Client Server.
DocuWare-System Das DocuWare-System umfasst eine komplette DocuWare-Installation mit
allen dafür erforderlichen sowie eventuell optionalen Komponenten. Ein
DocuWare-System kennzeichnet sich durch gemeinsame Hardware und
Systemeinstellungen für eine oder mehrere „Organisationen“ aus. Teilweise
wird anstatt vom DocuWare-System auch einfach von DocuWare
gesprochen.
46
Glossar
Dokument Ein „Dokument“ ist ein Oberbegriff für die im Archiv abgelegten Objekte, die
aus Benutzersicht eine logische Einheit - eben ein Dokument - bilden. Ein
Dokument kann aus einer beliebigen Anzahl von Dateien bestehen. Häufig
wird es sich um gescannte Informationen im TIFF oder Multi-TIF-Format
handeln. Dateien aus Output-Management-Systemen, Office- oder Grafik-
applikationen oder gar Binärdateien werden aber gleichartig behandelt.
Eine Datei kann eine oder mehrere Seite(n) repräsentieren. Eine Datei kann
aber auch Stempel, Signaturen, Anmerkungen o.ä. ergänzende
Informationen zum Dokument beinhalten. Dokumente können weiterhin aus
Dateien mit unterschiedlich formatierten Inhalten bestehen. So können eine
Office-Datei, zusammen mit einer E-Mail-Datei und mehreren TIFF-Dateien
zusammen ein Dokument darstellen. Eindeutig identifiziert wird das
Dokument über die DOCID.
Feldabhängige Rechte Feldabhängige Rechte sind Rechte, die abhängig von bestimmten
Indexfeldeinträgen sind.
Funktionsprofil Ein Funktionsprofil umfasst Zugriffsrechte auf Funktionen des DocuWare
Clients. Dazu gehören u.a. die Zugriffsrechte auf Menüfunktionen und
Stempel. Funktionsprofile werden auf Organisationsebene definiert. Ein
Funktionsprofil kann auch administrative Rechte auf Organisationsebene
umfassen.
Gruppe Unabhängig von Rollen können Benutzer zu Gruppen zusammengefasst
werden, denen dann ebenfalls Rollen zugewiesen werden können. Eine
Gruppe ist somit eine Zusammenfassung von Benutzern. Gruppen können
ausschließlich über Rollen Rechte zugewiesen werden. Gruppen dienen der
einfacheren Administration von mehreren Benutzern.
Header DocuWare verwendet das XML-Format für die Speicherung der Metadaten
(Indexdaten) und Dokumentergänzungen (Anmerkungen, Stempel etc.). Der
Content selbst wird aus Performancegründen separat gespeichert
(Ausnahme Export).
47
Glossar
PNG Abkürzung für "portable network graphic format". Das vom World Wide Web
Consortium (W3C) entwickelte und als Standard verabschiedete Format ist
lizenzfrei und soll GIF- und JPEG-Bilder ablösen - komprimierend und ohne
gravierende Qualitätseinbußen.
Profile Profile sind die Zusammenfassung von Einzelrechten. Profile werden in
Archivprofile und Funktionsprofile unterschieden. Profile können entweder
administrative Rechte oder Zugriffsrechte auf ein Archiv enthalten.
Rechte Rechte erlauben die Ausführung von bestimmten Funktionalitäten innerhalb
des DocuWare Systems. Einzelrechte können in Archiven und auf
Organisationsebene vergeben werden.
Rolle Benutzer haben in den Unternehmensorganisationen verschiedene Rollen,
die sich aus Ihrer Stellung in der Hierarchie (z.B. Genehmigung von
Urlaubsanträgen) und aus Ihrer Aufgabenbeschreibung (z.B. Einkäufer)
ergeben. Entsprechende Rollen lassen sich in DocuWare abbilden, um die
Installation und Administration zu vereinfachen. Dazu werden Funktionen
und Zugriffsrechte in Profilen zusammengefasst, die den Rollen zugewiesen
werden.
Vordefinierte Rollen Vordefinierte Rollen werden vom DocuWare System mitgeliefert und
garantieren die Arbeitsfähigkeit des Systems bei einer ersten Installation.
Vordefinierte Rollen sind der System-Administrator, der Organisations-
Administrator und der Archiv-Besitzer.
Workflow Ein Workflow ist eine vordefinierte Folge von Arbeitsschritten, die bei dem
Eintreffen eines vordefinierten Ereignisses automatisch innerhalb von
DocuWare ausgeführt wird.
Workflow Server Der Workflow Server ist das Modul, das die Workflows zur Laufzeit ausführt.
XML Siehe Header
Zugriffsrechte Zugriffsrechte umfassen Zugriffe auf Archive oder Menüfunktionen
innerhalb des DocuWare Clients.
48