Sie sind auf Seite 1von 3

Du hast den Film "Fahrenheit 451" gesehen, bist aber zu faul Dein Lieblingsbuch auswendigzulernen?

Du ziehst es lieber vor, das Buch durch Verbreitung im Internet fr alle Zeit zu sichern?! Gute Wahl! Diese Anleitung wird Dir helfen ein Buch zu digitalisieren und im PDF-Format abzulegen. Wenn Du einen Scanner leihen kannst und ber einen Internetzugang hast, solltest keine weiteren Ausgaben haben. Alles was Du brauchst ist Zeit, Zeit und nochmals Zeit. Aber am Ende wirst Du mit etwas Flei eine 100% Kopie des Buches haben, und da anders als beim Rippen von Hrspielen unabhngig von der Qualitt der Vorlage. Um Dir kurz einen Ausblick zu geben wieviel Zeit Du investieren mut: Fr das erste ???-Buch habe ich ca. 10 Arbeitsstunden gebraucht. Aber mit etwas bung und zunehmender Automatisierung (Einsatz von Makros in Word) verringert sich die Arbeitszeit auf ca. 6-7 Stunden. Diese Anleitung sollte nicht als ultimative Lsung verstanden werden. Bekanntlich fhren viele Wege nach Rom. Die Reihenfolge der Arbeitsschritte kann sicherlich an einigen Stellen variiert werden, aber nach einiger bung wirst Du selbst herausfinden, was Dir am Besten liegt.

Was braucht man denn dazu?


Was habe ich denn verwendet: einen x-beliebigen Scanner der 300dpi schafft. Texterkennungssoftware "Text Bridge Classic" -- war beim Scanner dabei. Ich denke eine Texterkennung sollte bei jedem Scanner mitgeliefert werden. Wenn die halbwegs vernftig arbeitet, brauchst Du dafr kein Geld auszugeben, um das abschlieende Korrekturlesen wirst Du auch bei einer Top-Software nicht herumkommen. Als Textverarbeitung habe ich Word97 verwendet, aber auch hier gilt: nimm was Du bereits hast. Fr die Generierung von PDF's gibt es jetzt mehrer Mglichkeiten: 1. Adobe Acrobat Exchange Das habe ich verwendet, und das ist auch denke ich -- die beste Mglichkeit (hatte aber Glck an das Teil zukommen). Das Programm installiert den "pdf-Writer"-Druckertreiber auf Deinem Rechner, ber den Du automatisch in ein Datei in PDF-Format ausdrucken kannst. Anschlieend kannst Du in Acrobat Exchange die PDF-Datei bearbeiten (Inhaltsverzeichnis usw). Ist aber als Original nicht ganz billig. 2. pdf-Distiller Der Distiller wandelt PostScript-Dateien (*.ps) in pdf-Dateien um. Die pdf-Dateien knnen anschlieend mit dem Distiller nicht bearbeitet werden, das geht nur mit Acrobat Exchange. Ein Distiller kommt auf ca. 150 DM, hier gibt es auch preiswertere Angebote von anderen Softwareherstellern. 3. pdf-Distiller im Internet Hier kommt die 0 DM Alternative, die habe ich zu Beginn angewendet. Im Internet gibt es fr die Wandlung *.ps (PostScript) nach *.pdf sog. Internet-Distiller. Du ldst einfach ein mit WinZip komprimiertes PostScript-File in ein Verzeichnis auf der Internetseite und kannst Dir nach ein paar Minuten Dein *.pdf File aus einem Output-Ordner downloaden. Das Ganze ist zwar anonym, aber jeder hat Zugriff auf die Datei im Output-Ordner. Hierzu Links zu zwei Internet-Distiller: http://www.babinszki.com/distiller http://www2.wiwi.uni-marburg.de/pdf/ 4. Acrobat Framemaker Das ist wre die Alternative zu Textverarbeitung und Distiller. Ist aber als absolutes Profiprogramm (legal) entsprechend teuer und lohnt sich nicht.

Jetzt komm zur Sache...


Ganz grob gliedert sich das Ganze in: 1. Scannen 2. Texterkennungssoftware darberlaufenlassen und abspeichern in *.wri 3. Text mit Copy/Paste in Textverarbeitung 4. Formatierung des Textes von Hand und Rechtschreibeprfung 5. Erstellung der ersten pdf-Version 6. Korrekturlesen 7. Endgltige pdf-Version

Scannen und Texterkennung:


Gescannt habe ich mit 300dpi Auflsung. Je hher Du hier die Auflsung whlst, um so besser wird bis zu einem gewissen Grad -- auch das Ergebins der Texterkennung sein, aber um so lnger dauert auch der Scanvorgang, und ein 100%iges Ergebnis darfst Du von der Texterkennung (auch OCRSoftware genannt) nicht erwarten. Also 300-400dpi sind schon ok. Gewhlt wir 1Bit-"Farb"format (schwarzwei-Format). In der Regel verarbeitet eine OCR-Software nur dieses Format. Das Scannen machst Du aus der OCR-Software heraus. Das kannst Du so automatisieren, da Du das Buch auf den Scanner legst, ne Taste drckst, der Scanner scannt die zwei Buchseiten und macht die Texterkennung. Danach wird umgeblttert und weiter gehts. Ab und zu (so nach 20 Seiten) wird zur Sicherheit abgespeichert. Bspw. im *.wri Format, um die Textformatierungen zu erhalten (das kann *.txt nicht). Word-Format wre zwar optimal, aber meine OCR-Software hatte damit so seine Probleme. Die Qualitt Deiner Texterkennung erkennst Du jetzt daran wie fehlerfrei es den Text erkennt und wie gut es die Textformatierungen bernimmt. Aber sei nicht geschockt -- hier kann es zum Teil recht bel aussehen. Fr ein ???-Buch kannst Du hierfr 1,5 Stunden einplanen. Wenn Grafiken in dem Buch enthalten sind, mut Du die separat mit einer Grafik-Software (z.B. Corel PhotoPaint) einscannen. Als Auflsung drften 200dpi zum Ausdrucken gengen. Natrlich kann Dein Drucker 'ne hhere Auflsung, aber wie sieht es mit Deinen Augen aus!? Und Du willst bestimmt nicht das 90% der spteren Dateigre durch die Grafiken bestimmt wird. Willst Du allerdings, da die Grafiken noch annehmbar aufgelst werden, wenn man im Acrobat Reader hineinzoomt, mut Du hher auflsen. Die Grafiken der ???-Bcher sind bspw. mit 500dpi aufgelst.

Bearbeiten in Word97:
So, Dein Text ist jetzt auf mehrere *.wri Dateien verteilt. ffne die Dateien mit dem WordPad von Windows, markiere den Text und kopieren ihn ber die Zwischenablage in Word 97 (Copy/Paste). Es ist ganz ratsam sich in Word eine Dokumentvorlage anzulegen und die Seite hier auf das richtige Format fr Seitengre und Rand einzustellen, wenn Du nmlich mehrere Bcher einer Serie digitalisierst braucht Du nicht stndig das Seitenformat neu einzustellen. Jetzt hast Du den Text in der Textverarbeitung und normalerweise sieht das ganze noch ziemlich sch... aus. So, jetzt beginnt die eigentliche Arbeit. Spiel ein bichen mit Schriftgre (bei ??? TmsNewR. 11), Rndern usw. herum, so da die Textabstze und Seitenumbrche bestmglich mit dem Original bereinstimmen (Textformat Blocksatz einstellen!). Die Zeit die Du hier investiert sparst Du beim Einstellen der Textabstze von Hand. Danach suche nach den Standardfehlern mit "Suchen/Ersetzen". Jede Texterkennung hat so Ihre Macken: doppelte Leerzeichen, Leerzeichen zwichen Buchstaben und Satzzeichen usw. Aber die herauszufinden ist eben die Erfahrung, die Du nach dem ersten Buch dann hast.

Jetzt wre der beste Zeitpunkt die Rechtschreibeprfung darberlaufen zu lassen; mu aber nicht unbedingt sein, da Du zum Abschlu eh den ganzen Text nochmals liest. Danach mut Du Seite fr Seite durchgehen und die Abstze und Seitenumbrche eventuell einzurichten. (Nur ein Satz, aber am meisten Arbeit.) Wenn Du willst kannst Du den Text in Word korrekturlesen und Dir eine Vorab-pdf-Version sparen. Das mut Du selbst herausfinden was Dir am besten liegt. Die Grafiken sollten aber zum Schlu importiert werden. Word 97 hat die Angewohnheit, da die Grafiken beim Textumbruch eventuell verlorengehen und dann mut Du sie neu importieren. Zum Schlu hast Du das Buch im *.doc Format, was zum Archivieren gengt, aber zum Lesen am Bildschirm und zur Weitergabe ungeeignet ist. Zum Ausdrucken ist Word allerdings wegen der Formattierungsmglichkeiten (doppelseitiger Ausdruck usw) besser. Noch was, gib keine doc-Dateien weiter, wenn Du sie nicht auf einem anonymen Rechner erstellt hast. D.h. Benutzername im Betriebssystem und in Word anonym. Um eine doc-Datei wieder "anonym zu machen", mut Du mit dem Hex-Editor an die Datei ran.

Erstellen der pdf-Datei:


1. Acrobat Exchange und PDF-Writer Mit dem Exchange pdf-writer druckst Du den Text einfach in eine Datei aus, sowie Du mit dem Drucker ausdrucken wrdest. PDF-Writer whlst Du im Druckmen der Textverarbeitung aus. 2. PDF-Distiller Wenn Du den Distiller verwendest, brauchst Du eine PostScript-Datei (*.ps) des Buches. Um die zu erzeugen bentigst Du einen Druckertreiber der PostScript ausgibt, zum Beispiel den "HP LaserJet 5P/5MP PostScript", den Du auf Deiner WindowsInstallations-CD findest. Die Datei erzeugst Du in dem Du statt auf den Drucker in eine Datei ausdruckst. Stell sicher das unter Eigenschaften des Treibers "PostScript(OptimaleGeschwindigkeit)" eingetragen ist mit EncapsulatePostScript (EPS) funktioniert der Distiller nicht. Auch mu die Seitegre von Dokument und im Treiber bereinstimmen. Bei der Installation oder in den Eingeschaften mut Du "in Datei drucken" einstellen. Normalerweise gibt Dir der Treiber nach dem Ausdruck eine ziemlich groe *.prn Datei aus. Die Dateierweiterung kannst Du im WindowsExplorer einfach in *.ps umbenennen. Dazu in den Optionen vom WindowsExplorer "Keine MS-DOS Erweiterung..." deaktivieren. Wenn Du den Distiller auf Deinem Rechner installiert hast, einfach die *.ps Datei ffnen (Doppelklick), der Distiller startet dann automatisch. Bei Verwendung eines Internet-Distillers mut Du die *.ps Datei mit WinZip komprimieren und auf der Internetseite in ein Verzeichnis hochladen (siehe Beschreibung auf deren Homepage). In Netscape: Datei --> Seite bertragen...

So, das war's. Ich hoffe die Beschreibung ist nicht nur lang sondern auch vollstndig. Bleibt mir nur noch Dir viel Spa beim Arbeiten zu wnschen.