Beruflich Dokumente
Kultur Dokumente
Fach:
Einfache IT-Systeme
Verfasser:
Steffen Zimmermann
Klasse:
I660
Lehrer:
Steffen Zimmermann
Bethmannschule, Frankfurt
Inhaltsverzeichnis
Inhaltsverzeichnis............................................................................................................................2
1.
Einleitung ................................................................................................................................3
2.
3.
3.2.
3.3.
Die Winkelschnittanalyse.................................................................................................7
3.4.
Die Fontnenumformung.................................................................................................8
4.
OCR-Programme....................................................................................................................8
4.1.
4.2.
4.3.
4.4.
4.5.
5.
6.
OCR-Hardware ....................................................................................................................14
6.1.
7.
7.2.
7.3.
BlueWings/Capture.....................................................................................................18
7.4.
Schrifterkennung fr Blinde...........................................................................................19
7.5.
Verkehrsberwachung ...................................................................................................19
7.6.
8.
8.2.
9.
Fazit .......................................................................................................................................23
10.
11.
Literaturverzeichnis.........................................................................................................25
Seite 2 von 25
Steffen Zimmermann
Bethmannschule, Frankfurt
1. Einleitung
Wenn man ein analoges Dokument in digitaler Form auf die Festplatte
bannen
mchte,
gibt
es
auch
heutzutage
nur
verschiedene
Mglichkeiten.
Die einfachste und gnstigste Variante ist das pure Abtippen des
Textes. Der Vorteil liegt darin, dass sich die Texterkennung im Gehirn
des Lesers abspielt. Die Erkennungsrate drfte also bei 100% liegen,
wenn man Analphabetismus vernachlssigt. Leider gehen aber auch
die Formatierungen verloren, sie mssen mhsam zu Fu in das
neue Dokument bertragen werden. Dabei sieht das Endprodukt, auch
nach stundenlangen Korrekturen, meist nicht so aus wie das Original.
Die zweite Mglichkeit ist das pure Abspeichern der Dokumente als
Grafikdateien. Dabei bleiben natrlich alle Informationen des Originals
erhalten.
Genutzt
wird
dieses
Verfahren
bei
sensiblen
wie
z.B.
einfache
.txt-Dateien,
knnen
von
jedem
Seine
binre
Welt
kann
nichts
mit
unterschiedlichen
machen.
Gilb,
ausgebleichte
Schrift
oder
Kaffeeflecken
Seite 3 von 25
Steffen Zimmermann
Bethmannschule, Frankfurt
Methode
zur
Erkennung
von
Buchstaben
in
digitalisierten
Dokumenten.
Optische
Das
Dokument
wird
durch
optische
Abtastung
in
bis
zu
42
Bit
(4,4
Billionen)
und
die
Zeichenerkennung
keine
Die
eingescannte
bzw.
von
der
Digitalkamera
Seite 4 von 25
Steffen Zimmermann
Bethmannschule, Frankfurt
das
Programm
die
unterschiedlichen
Laufweiten
eines
Zeichen
Dabei
werden
wird
vorgegangen,
mehrere
nicht
sondern
mehr
Muster
streng
vielmehr
mit
wren
beispielsweise:
eher
Seite 5 von 25
Steffen Zimmermann
Bethmannschule, Frankfurt
Fr
die
Auswertung
der
Zeichen
knnen
zwei
verschiedene
3.1.
Bei dieser Methode wird das eingelesene Zeichen mit den in einer
Tabelle gespeicherten Bitmustern verglichen. Dieses Verfahren eignet
sich vor allem bei Vorlagen mit hoher Druckqualitt, die nur wenige
Variationen
an
Schriften
aufweisen,
wie
z.B.
bei
Bcher
oder
in
Frage
hchstmgliche
kommenden
Schablonen
bereinstimmung
erreicht
verglichen,
ist.
Um
bis
die
smtliche
ihrer
mangelhaften
Flexibilitt
kommt
die
Steffen Zimmermann
Bethmannschule, Frankfurt
3.2.
Dieses
geometrischen
analysiert
Eigenschaften
die
der
3.3.
Ein
Die Winkelschnittanalyse
besonderes
Verfahren
zur
Bildung
von
Merkmalen
ist
die
Steffen Zimmermann
Bethmannschule, Frankfurt
3.4.
Die Fontnenumformung
Fontnenumformung,
die
sich
wieder
mehr
der
lsst
sich
mit
entsprechenden
Referenzobjekten
4. OCR-Programme
4.1.
Steffen Zimmermann
Bethmannschule, Frankfurt
4.2.
Noch besser sehen soll die TexterkennungsSoftware OmniPage 11. Doch auch wenn sie an
Funktionalitt zugelegt hat, zeigte der Test die
vom
Hersteller
versprochenen
40
Prozent
OmniPage
nicht
gerade
zu
den
gnstigsten
Texterkennungsprogrammen. Cross Updates von einem anderen OCRProgramm sind allerdings bereits fr etwa 300 Mark (Stand August
2001) erhltlich. [E2, L5]
4.3.
ansonsten
billigeren
identisch
Programms
aussehenden,
aber
OCR-Texterkennung
der
Erkennungsgenauigkeit
geht.
Insgesamt
sind
die
Steffen Zimmermann
Bethmannschule, Frankfurt
4.4.
Optical
Character
Recognition.
Das
Bildschirmaufbau
verwirrt
zunchst
hinweg.
Nach
der
Einstellung
der
passenden
Seite 10 von 25
Steffen Zimmermann
Bethmannschule, Frankfurt
4.5.
Millennium
TextBridge Pro Millennium ist eine einfach zu
bedienende und sehr bersichtliche OCR-Software.
Der Anwender wird Schritt fr Schritt durch den
gesamten Vorgang geleitet. Das gute Handbuch
und die Online-Hilfe bentigt man kaum.
Die Texterkennung klappt sehr gut. Aber: Bei Tabellen und der
Erkennung von Bildern muss oft per Hand korrigiert werden, was
unntig Zeit kostet. Hinzu kommt die etwas zu lange Trainingsphase.
Durch speicherbare Vorlagen und die Aufnahme nicht erkannter Wrter
in das Wrterbuch wird nicht nur die Erkennungsrate verbessert,
sondern auch die Umsetzung des ursprnglichen Layouts in einer
Textverarbeitung. Allerdings sollte die Vorlage gut lesbar sein.
Die Auswahl an Bildformaten ist leider etwas beschrnkt. Ebenso
fehlen Bildbearbeitungsfunktionen.
Dafr untersttzt TextBridge ber 60 verschiedene Sprachen. Auch die
Integration in gngige Textverarbeitungsprogramme ist gut gelst.
[L5]
Vorlage/Programm
FineReader
OmniPage
Readiris
Recognita
TextBridge
Musterbrief
11/23
10/21
8/-
6/10
10/-
Musterbrief-Fax
16/29
18/42
12/-
13/19
19/-
Fontliste
9/17
16/35
11/-
7/21
9/-
Spiegel
17/32
18/34
13/-
11/20
12/-
Tabelle
Visitenkarte
12/16
5/6
38/39
1
7/-
4/4
4/-
Zeit fr Bildeinlesen, Segmentieren und Erkennung (Schwarzwei-/Graustufenscan); P-II233, 32 MByte RAM, Win95
1
Seite 11 von 25
Steffen Zimmermann
Bethmannschule, Frankfurt
Erkennungsgte [L4]
Program
FineRead
OmniPag
er
Vorlage
Brief
in %
Korrekturen
Readiris
in %
in %
TextBrid
ge
Zahl der
Korrekturen
Zeichen
abs.
1449
0,41
10
0,69
0,48
10
0,69
14
1449
0,55
0,62
11
0,76
1449
22
1,52
40
2,76
70
4,83
62
4,28
33
1449
29
2,00
40
2,76
27
1,86
1628
10
0,61
0,55
16
0,98
165
0,98
19
1628
10
0,61
12
0,74
105
0,61
1231
0,73
93
0,73
13
1,06
19
1,54
1231
0,32
83
0,65
24
1,95
627
11
1,75
15
2,39
-4
-4
24
627
1,28
27
4,31
-4
207
1,93
11
5,31
3,86
1,45
11
207
0,97
10
4,83
1,93
abs.
Korrekturen
Recognit
abs.
Korrekturen
in %
abs.
Korrekturen
in %
abs.
0,97
(sw)
Brief
(Graust.)
Brief-Fax
2,28
(sw)
Brief-Fax
(Graust.)
Fontliste
1,17
(sw)
Fontliste
Graustufen
Spiegel
(sw)
0,32
Spiegel
(Graustufe
n)
Tabelle
(sw)
3,83
Tabelle
(Graustufe
n)
Visitenkart
e (sw)
Visitenkart
e (Graust.)
Seite 12 von 25
5,31
Steffen Zimmermann
Bethmannschule, Frankfurt
FineReader OmniPage
Readiris
Recognita
TextBridge
Arial/13
Times/14
Arial/12,5
Times/11,5
Arial/12
Arial/15
Times/13
Times/14
Times/12
Times/11,5
Arial/12
Times/13
Courier/13
Times/12
Courier/11,5
Times/11,5
Courier/10
Courier/12
Arial/12
Times/12
Arial/11
Times/11,5
Arial/12
Arial/15
Times/12
Times/12
Times/11,5
Times/11,5
Arial/9
Courier/12
Courier/12
Times/11
Courier/11,5
Times/11,5
Courier/9
Courier/12
Arial/11
Times/11
Arial/10,5
Times/9,5
Arial/9
Arial/12
Times/11
Times/11
Times/10
Times/9,5
Arial/9
Times/11
Courier/11
Times/10
Courier/10,5
Times/9,5
Courier/9
Courier/10
Arial/10
Times/10
Arial/9,5
Times/9,5
Arial/9
Arial/12
Times/10
Times/10
Times/10
Times/9,5
Arial/9
Times/11
Courier/10
Times/9
Times/9
Times/9,5
Courier/9
Courier/10
Arial/9
Arial/8
Arial/8
Times/8,5
Arial/9
Arial/10
Times/9
Times/9
Times/9
Times/8,5
Arial/9
Times/9
Courier/9
Times/9
Times/9
Times/8,5
Courier/9
Courier/10
Arial/8
Times/9
Arial/8
Times/7,5
Arial/9
Arial/10
Times/8
Times/9
Times/9
Times/7,5
Arial/9
Times/8
Courier/8
Times/8
Times/7,5
Times/7,5
Courier/9
Courier/7
Arial/7
Arial/6
Times/9
Times/6
Arial/9
Arial/7
Times/7
Times/8
Times/7,5
Times/6
Arial/6
Times/7
Courier/7
Times/8
Times/7,5
Times/6
Courier/6
Times/7
Arial/6
Times/8
Arial/5,5
Times/6
Arial/6
Arial/7
Times/6
Times/8
Times/7,5
Times/6
Arial/6
Courier/6
Courier/6
Times/6
Times/7
Times/6
Courier/6
Courier/6
4 bereinst.
Font
Seite 13 von 25
Steffen Zimmermann
Bethmannschule, Frankfurt
6. OCR-Hardware
6.1.
Der Pocket Reader ist ein Stiftscanner, der gedruckten Text einzeilig
einliest (400dpi) indem man den Stift wie einen Textmarker ber den
Text bewegt.
Der eingescannte Text wird automatisch ber die integrierte OCRSoftware in ASCII-Text umgewandelt und auf dem einzeiligen Display
zur Kontrolle dargestellt. Der Erfolg kann durch ein eingebautes
internes
(aber
nicht
erweiterbares),
mehrsprachiges
Wrterbuch
Steffen Zimmermann
Bethmannschule, Frankfurt
ist
sicher
nicht
das
geheime
Ziel.
Da
sind
die
Praxis
Einige Beispiele, auf die man sehr hufig trifft, sind berweisungen
oder
auch
Briefe.
Die
Deutsche
Post
AG
hat
in
ihren
Steffen Zimmermann
Bethmannschule, Frankfurt
OCR-A
OCR-B
EAN/JAN
Euroean/Japanese Article Number
mit OCR-B nach DIN 66008
Leseergebnisse
Korrekturmaske
werden
angezeigt,
wo
nun
die
nacheinander
nicht
oder
nicht
in
einer
zweifelsfrei
Steffen Zimmermann
Bethmannschule, Frankfurt
7.2.
und
Bildschirmmasken
erlauben
ein
einfaches
und
Bildvorverarbeitung,
dynamische
Zonennachfhrung,
FormFile
gelesenen
Text
unmittelbar
dem
Originaltext
Seite 17 von 25
Steffen Zimmermann
Bethmannschule, Frankfurt
7.3.
BlueWings/Capture
,,BlueWings/Capture
ist
ein
Hochleistungssystem
fr
die
Informationen
anderen
Anwendungen
fr
die
Weiterverarbeitung zur Verfgung. Die einzelnen Arbeitsschritte Scannen oder Faximport, Klassifizieren der Dokumente, Erkennen,
Prfen
und
sowie
das
Exportieren
der
Daten
laufen
bei
Rechnungen,
berweisungen,
Fragebgen
und
andere
Seite 18 von 25
Steffen Zimmermann
Bethmannschule, Frankfurt
Geschwindigkeit
Kosten
Qualitt
Die
Erhhung
der
Datenqualitt
durch
automatische
Plausibilittsprfungen.
Personal
Zusatznutzen
Quelle: [L6]
7.4.
Schrifterkennung fr Blinde
die
Programmfunktionen
Arbeit
und
alle
zu
erleichtern,
Eigenschaften
sind
ber
die
smtliche
Tastatur
erreichbar. [L6]
7.5.
Verkehrsberwachung
In den USA werden seit ca. 5 Jahren die grten Ballungsgebiete mit
Videokameras berwacht. Davon sind die Verkehrswege natrlich nicht
ausgenommen. So ergibt sich ein weiterer Anwendungsbereich fr
Texterkennung: die Analyse von Nummernschildern.
Eine Kamera wird dabei ber kritischen Verkehrsabschnitten platziert
(wie z.B. Brcken, Fhren, Kreuzungen). Sie machen mit Hilfe von
Infrarotsensoren, Lichtschranken oder Belastungssensoren im Boden
einen Schnappschuss des Fahrzeuges. Dieses Bild wird sofort nach
dem Nummernschild durchsucht, durch OCR-Software extrahiert und
an eine zentrale Datenbank weitergeleitet (siehe Abbildung).
Die so gewonnenen Daten knnen nun weiterverarbeitet werden, sei es
um Verkehrssnder zu finden, gestohlene Autos zu identifizieren oder
ein geflschtes Nummernschild zu erkennen.
Seite 19 von 25
Steffen Zimmermann
Bethmannschule, Frankfurt
7.6.
Unter dem Begriff OCR Rich Content Search bietet die Firma Cobion
einen
Suchdienst
an,
der
nicht
nur
Textdokumente
nach
den
diese,
noch
vor
der
es
zu
einem
Ergebnis
Seite 20 von 25
Steffen Zimmermann
Bethmannschule, Frankfurt
8.1.
GmbH
Die BHB Immobilien - Verwaltungs GmbH (BHB) in Mnchen, ist eine
kleine
innovative
Objektgesellschaften
Immobilienverwaltung.
mit
insgesamt
45
Sie
betreut
Objekten
ca.
35
(vorwiegend
eingescannt
und
dann
in
eine
Textdatei
zur
Weiterverarbeitung umgewandelt.
Die BHB ist sehr zufrieden mit der OCR- Scannersoftware. Die
Anwendung ist unkompliziert und schnell. Ein Nacharbeiten des
eingescannten Textes lsst sich aber trotzdem nicht vermeiden, da
Abstze, Umlaute, Aufzhlungen etc. nicht oder nicht vollstndig als
solche erkannt werden. In jedem Fall wird fr das Nachbearbeiten
wesentlich weniger Zeit bentigt, als wenn man den ganzen Text per
Hand eingeben wrde. [L6]
Seite 21 von 25
Steffen Zimmermann
Bethmannschule, Frankfurt
8.2.
Seite 22 von 25
Steffen Zimmermann
Bethmannschule, Frankfurt
9. Fazit
Wie die verschiedenen Tests (die zum Teil doch sehr widersprchlich
waren) gezeigt haben, befinden sich die OCR-Softwareprodukte in
einem stndigen Prozess der Verbesserung. Dennoch ist nicht davon
auszugehen, dass in naher Zukunft OCR-Programme die Fhigkeiten
des menschlichen Auges und die Erkennungsgenauigkeit des Gehirns
erreichen werden.
Nichts desto trotz sind die bereits vorhandenen Programme eine
wirkliche Errungenschaft fr Unternehmen, die ihre Daten vollstndig
elektronisch archivieren wollen. Denn nicht nur die Erfassung des
bereits vorhandenen Datenbestandes (der meist nur in Papierform
vorhanden ist) wird dadurch erheblich erleichtert. Sondern auch die
Erweiterung der Datenbank gestaltet sich mit einem Scanner und einer
anschlieenden Texterkennung durch OCR wesentlich einfacher. Es
wre doch eine schne Vorstellung, nicht mehr in den Keller laufen zu
mssen, nur weil man ein Dokument bentigt, welches schon 2 Jahre
alt ist.
Seite 23 von 25
Steffen Zimmermann
Bethmannschule, Frankfurt
10.
E1
E2
Cross Update
Heute ist jeder Scanner mit einer deutlich eingeschrnkten OCRSoftware ausgestattet. Diese ist fr einfache Texte zwar
ausreichend, beherrscht meistens nur den Automatik-Modus ohne
Eingriffsmglichkeiten. Sie reicht aber aus, um statt einer
Vollversion ein Upgrade, ein so genanntes Cross Update, zu
erwerben. Dabei muss man vorher nicht einmal das Produkt des
gleichen Herstellers verwendet haben
E3
Erkennungsgenauigkeit
Sie liegen nach Stand der Technik zwischen:
> 99,9% bei Normschriften
bei > 98% fr Druck und Maschinenschriften
bei ca. 95% fr Handschrift - Ziffern in Kstchen
unter 95% fr Handschrift - Buchstaben geblockt [L6]
Seite 24 von 25
Steffen Zimmermann
Bethmannschule, Frankfurt
11.
Literaturverzeichnis
L1
L2
L3
Marco Corti & Olivier Frfel, Scanner & OCR-Software, Mrz 2001
Semesterarbeit Zrcher Hochschule Winterthur
L4
L5
L6
L7
L8
L9
Seite 25 von 25