Sie sind auf Seite 1von 7

Die altgyptischen Sargtexte Verfahrensschritte bei der Erschlieung eines groen und komplizierten Textcorpus Author(s): Wolfgang Schenkel

and Knut Buroh Source: Historical Social Research / Historische Sozialforschung, Vol. 20, No. 3 (75), PCSoftware fr die statistische Analyse in der Historischen Sozialforschung (1995), pp. 144-149 Published by: GESIS - Leibniz-Institute for the Social Sciences, Center for Historical Social Research Stable URL: http://www.jstor.org/stable/20755987 . Accessed: 28/10/2013 10:05
Your use of the JSTOR archive indicates your acceptance of the Terms & Conditions of Use, available at . http://www.jstor.org/page/info/about/policies/terms.jsp

.
JSTOR is a not-for-profit service that helps scholars, researchers, and students discover, use, and build upon a wide range of content in a trusted digital archive. We use information technology and tools to increase productivity and facilitate new forms of scholarship. For more information about JSTOR, please contact support@jstor.org.

GESIS - Leibniz-Institute for the Social Sciences, Center for Historical Social Research is collaborating with JSTOR to digitize, preserve and extend access to Historical Social Research / Historische Sozialforschung.

http://www.jstor.org

This content downloaded from 196.204.163.100 on Mon, 28 Oct 2013 10:05:44 AM All use subject to JSTOR Terms and Conditions

beitet haben, zur Durchsicht gegeben. Ergeben sich bei der Durchsicht noch sachliche ?nderungen, so werden diese wiederum in die zentrale Arbeitsdatei eingetragen. Die korrigierteDatei geht nochmals zum Satz. werden erst nach Ab Nachbesserungen, die nur die Typographie betreffen, schlu? aller sachlichen ?nderungen ausgef?hrt Sie tangieren die zentrale Ar beitsdatei nichtmehr. Die Ergebnisse der Umstellung haben wir schon 1992 auf der Tagung der Arbeitsgemeinschaft Philosophische Editionen inBerlin vorgetragen. Die mei ste Zeit, die ich seither an dem Projekt gearbeitet habe, habe ich damit ver bracht, die Programme denW?nschen des Verlegers anzupassen, um .B. Edi tionskonventionen oder aus Bleisatzzeit her?bergerettete Konventionen wieder zu ?bernehmen. Diese Arbeiten haben nichtsmit der editorischenArbeit zu tun. Sie haben die vorgesehene Datemtruktur weder erweitertnoch umgesto?en. Auch aus dieser Erfahrung heraus pl?diere ich f?r eine Trennung von wis senschaftlichereditorischerArbeit und technischer Herstellung der Edition. Die Satzaufbereitung kostet viel Zeit und bringt der inhaltlichenArbeit nichts. Ein Arbeitsmittel wie TUSTEP, das sowohl die wissenschaftlichen Arbeits schritte als auch die mehr technischenArbeitsg?nge von Satzherstellung und Aufbereitung f?r andere Publikationsformen gleicherma?en unterst?tzt, ohne da? ein Systemwechsel notwendig wird, erleichtertdie reibungslose Integration aller Arbeitsschritte in einen Gesamtablauf, trotzder hier erfolgreichpraktizier tenArbeitsteilung.

Die alt?gyptischen Sargtexte Verfahrensschritte bei der Erschlie?ung eines gro?en und komplizierten Textcorpus
Wolfgang Schenkel,Knut Buroh*
1. Das ?gyptologische Projekt Die alt?gyptischen Sargtexte sind Texte, die zwischen dem Ende des 3. und der Mitte des 2. vorchristlichen Jahrtausends meist auf den Innenw?nden von ka Personen betuchter stenf?rmigen S?rgen angebracht wurden. Sie sind in der Hauptsache gedacht alsWissensvorrat f?r den Verstorbenen zum Gebrauch im Jenseits.Dem ?gyptologen sind sie eine wahre Fundgrube f?r religionshisto rische und linguistische Fragen. * Protokolldes 62. Kolloquiums ?ber die Anwendung derEDV inden Geisteswissen an derUniversit?t schaften T?bingen am 26. November 1994.

144

This content downloaded from 196.204.163.100 on Mon, 28 Oct 2013 10:05:44 AM All use subject to JSTOR Terms and Conditions

Die Texte stehen in einer lebenden Texttradierung und -Weiterentwicklung zwischen den Pyramidentexten aus der Mitte des 3. vorchristlichen Jahrtau sends und dem Totenbuch, das seit der Mitte des 2. Jahrtausends v. Chr. die Sargtexte abl?st. Dem Umfang nach sind die Sargtexte die gr??te der drei Textgruppen. Sie umfassen soweit ediert Texte imGesamtumfang von ca. 140 000 laufenden W?rtern. Die Texte sind soweit ediert - im Schnitt 3,8Mal bezeugt, so da? das Textcorpus insgesamtmehr als eine halbe Million laufende W?rter umfa?t. Da die Textzeugen nicht unbetr?chtlich voneinander abwei chen, ist letztereZahl die f?r das Projekt ma?gebende. F?r die Verarbeitung im Computer wurden die Texte nicht in der Hierogly phenzeichenfolge erfa?t, die die Edition bietet -eine solche linguistisch zu w?re hochkompliziert-, sondern in einer linguistischen Trans interpretieren, kription, die mit graphematischen Informationen angereichert ist,mithin in zweiter Linie auch die Hieroglyphenzeichenfolge abbildet. Urspr?nglich war Ziel, eine Konkordanz zu den Sargtexten zu erstellen, d. h. die Belege f?r die einzelnen Lexeme mit ihrem Kotext wiederzugebea Dieses Ziel wurde zwar nicht aufgegeben, aber einstweilen noch vertagt, da eine me chanische Gewinnung der Kotexte entweder,wenn .B. als Kotexte einheitlich

sinnvolle Textabschnitte wie S?tze oder Teils?tze gew?hlt w?rden, diese die Konkordanz zu volumin?s machten, oder, wenn man mechanisch k?rzere Ko texte ohne R?cksicht auf den Sinnzusammenhang abgrenzen w?rde, die Kon kordanz nur schwer zu benutzen w?re, da ?gyptischeWortformen - inHiero glyphen oder in Transkription- in weit h?herem Ma?e mehrdeutig sind als etwa deutsche. Statt dessen werden, um auch einmal ein Ergebnis zu haben, Register produziert, lexikalische,morphologische, graphematische. Danach sol len die Texte syntaktisch analysiertwerden und die syntaktischen Strukturen bei der Abgrenzung von Kotexten f?r die Zwecke einer echten Konkordanz genutzt werdea Im ?brigen werden ?bergro?e Belegmengen f?r ein und dasselbe Textele ment - Lexeme sind bis gegen 30 000 Mal belegt - mit Hilfe manueller Ein da? ein Leser die Aufstellungen auch griffederart reduziert oder strukturiert, tats?chlich benutzen kann (statt .B. 10 000 Belege nachzuschlagen, w?rde man besser die Edition durchlesen).

2. Die philologische Prozedur Die Aufnahme der Texte (in Transkription) ist so kompliziert und damit feh werden kana Im ?brigen leranf?llig,da? sie nicht in einem Zug durchgef?hrt stand weder von Anfang an noch stehtheute fest,was man notiert, und was nicht; die Anspr?che wuchsen und wachsen mit dem Projekt Anfangs bestand die Textaufhahme vor allem aus der Notation des Wortlauts und textkritischen Zus?tzen, sp?terkamen Angaben zu den Graphien hinzu, schlie?lich soll k?nf - und tig einmal eine syntaktischeAnalyse zugeordnet werden dergleichen

145

This content downloaded from 196.204.163.100 on Mon, 28 Oct 2013 10:05:44 AM All use subject to JSTOR Terms and Conditions

mehr. Die Erstellung der Texte f?r die Verarbeitung im Computer erfolgt also zyklisch oder besser: spiralf?rmig. Die Textaufhahmen werden in Etappen ?aufgeschaukelt?. Dabei liefern fr?hereEtappen oftmehr als den Textbestand selbst: Die mehrfach bezeugten Texte wurden derart gewonnen, da? ein - be wurde und durch Korrektur in die an liebiger- ersterTextzeuge vervielf?ltigt deren Textzeugen verwandelt wurde. Oden F?r die Zufugung der graphemati schen Informationen zu den zuvor hergestellten Transkriptionendes Wortlauts wurde ein graphematischesW?rterbuch produziert, das jede m?gliche Graphie einmal enthielt,und aus diesem wurden dann die Graphien der einzelnenWort

formbelege ausgew?hlt. F?r das ?Aufschaukeln? der Tbxtaufhahme istvon wesentlichem Belang, da? zwischen den Zyklen Register erstelltwerden k?nnen - .B. sehr fr?h schon ein lexikalisches Register-, mit deren Hilfe man die Textaufhahmen auf Kon sistenz hin ?berpr?fen kann. 3. Die TUSTEP-Prozedur Es gibt stets eine ma?gebende Fassung des Textcorpus. Diese Fassung bietet die Texteinheiten in einer Reihenfolge, .B. in der Folge des Textes oder in der lexikalischen Folge. Will man die Elemente in andererReihenfolge haben, mu? diese ?Ma?gebende Textfassung? des Corpus entsprechend umsortiert werden. Es spricht allerdings nichts dagegen, neben der ?Ma?gebenden Textfassung? des Corpus in einer bestimmten Sortierung auch nicht-ma?gebende Fassungen in anderer Sortierung zu haben. Abstrakt ?berlegt, w?re die Arbeit mit einer Datenbank praktischer, in der Praxis dagegen ist das gew?hlte Verfahren ohne Datenbank durchaus zweckm??ig, da man sich im allgemeinen inder Folge der Zyklen sehr lange auf eine einzige Reihenfolge konzentriert Die ?Ma?gebende Textfassung? mu? drei Bedingungen erf?llen: - Sie mu? am B?dschirm lesbar und auf der Tastatur (bzw. mit der Maus) schreibbar und korrigierbar sein. - Sie mu? nach unterschiedlichen Gesichtspunkten intern sortierbar sein. - Sie mu? als Schnittstelle f?rden Druck dienen k?nnen, also alle Informatio nen zur Steuerung des Druckbildes implizit enthalten (zurUmsetzung in ein Druckbild siehe unten ? 4). Wesentliche TUSTEP-Eigenschaften - neben den allgemeinen Qualit?ten sind f?runsere Zwecke vor allem diese: - Die M?glichkeit, den Zeichenvorrat durch Zeichenkombinationen zu erwei Weiterverar tern,dann aber diese Zeichenkombinationen bei der internen beitung (Sortierung) auf einfache Weise in Einzelzeichen umcodieren zu k?nnen; - die M?glichkeit, Daten sozusagen zweidimensional zu organisieren und um zuorganisieren (1. Dimension: Zeilen, 2. Dimension: ?Spalten?, d. h. durch Trennzeichen gekennzeichnete Abschnitte in der Zeile), m. a.W. lange und

146

This content downloaded from 196.204.163.100 on Mon, 28 Oct 2013 10:05:44 AM All use subject to JSTOR Terms and Conditions

komplizierte Datens?tze, die internals Einheit manipuliert werden (Sortie rung), am Bildschirm durch Zerlegung in Abschnitte und Aufteilung auf mehrere Zeilen ?berschaubar zu machen. Den immensen positiven Qualit?ten des Werkzeugs TUSTEP stehen ein paar Nachteile gegen?ber, etwa diese: - Um praktisch arbeiten zu k?nnen, mu? das Textcorpus in Dateien von je etwa einem Hundertstel zerlegt werden. Andernfalls w?re das Zerst?rungs risiko bei (fehlerhaften)Pauschalkorrekturen zu hoch und die Wartezeit am Bildschirm beim Suchen - und Korrigieren - zu gro?. Anderfalls w?rden auch die Zeilennummern zu gro? oder unpraktisch gro?. Im ?brigen m?ssen, wenn durch eine Korrektur die Sortierfolge ge?ndertw?rde, u. U. Daten aus einem Hundertstel in ein anderes manuell verschoben werden. Daten, die eliminiertwerden ( .B. nur erg?nzteWortformen) m?ssen ma nuell inHilfsdateien ausgegliedert werden, da sie nicht einfach unsichtbar gemacht werden k?nnen und damit den ?berblick ?ber das Material am Bildschirm behindern w?rden. - Die Transkriptionen haben eine Struktur, die mit TUSTEP-Mitteln allein nicht in einen Sortierschl?ssel umgesetzt werden kann (Zerlegung in diverse Hauptinformationen und vielf?ltige Indizes hierzu); f?r solche Hauptinfor mationen und vor allem Indizes werden je eigene Sortieralphabete ben?tigt, die mit den zugelassenen drei TUSTEP-Sortieralphabeten nur durch trick reiche, schwer durchschaubare ?berlagerung verschiedener Alphabete rea lisiertwerden k?nnen. Die genannten Problem-Punkte sind f?r die Zwecke des Projekts praktisch gel?st. Es steht zu vermuten, da? die Probleme weitestgehend mit den spezi fischen Besonderheiten der benutzten Transkriptionund mit der Eigenart des Textcorpus zusammenh?ngen, Speziall?sungen also gerechtfertigtsind.

4. Beispiel einer Druckausgabe: der Druck der lexikalischen Konkordanz Da ein wesentliches Ziel des Projekts ist, die wichtigsten Ergebnisse in der klassischen Form eines gedrucktenBuches zu ver?ffentlichen, das nach wie vor f?r den ?gyptologen das meistgebrauchte Arbeitsmittel darstellt,war es von einem gewissen Grad der ?Aufschauklung? und Sortierung der Daten an sinn voll und erw?nscht, diese schon als Teil- oder Zwischenergebnis in einer der endg?ltigen Druckgestalt nahekommenden, wenn nicht sogar identischenForm zu produzieren. Als Schnittstelle zu diesem Produktionsschrittdient die oben ? 3 emgef?hrte ?Ma?gebende Textfassung?, die die Daten in ihrerjeweils ak tuellstenForm enth?lt Die einzelnen S?tze der ?Ma?gebenden Textfassung? werden hierzu durch eine Kaskade von TUSTEP-Kopiereund TUSTEP-Satz-Programmen ge schickt, in deren Verlauf die Daten verglichen und reduziert, interne Codes in

147

This content downloaded from 196.204.163.100 on Mon, 28 Oct 2013 10:05:44 AM All use subject to JSTOR Terms and Conditions

explizite TUSTEP-Satz-Codes umgewandelt sowie f?r den Satz und f?r das Druckbild n?tige Erg?nzungen vorgenommen werden. Am Ende des Durch laufs steht ein TUSTEP-Satz-Programm, das dann die endg?ltige Ausgabe, letztlich auf Papier besorgt. Die Schritte im einzelnen: - Ein VORPROGRAMM (TUSTEP-Kopiere, bestehend aus 42 Durchg?ngen mit 282 Parameterzeilen) eliminiert aus jedem Datensatz der ?Ma?gebenden Textfassung? die Datenteile, die f?r das in diesem Prognunrnablauf ange strebteErgebnis (Druckseite) nicht auszuwerten sind. Des weiteren werden hier implizit eindeutige Grenzmarkierungen zwischen den hierarchischen Teilen eines Datensatzes f?rdie weitere Abarbeitung in von TUSTEP leich ter zu erkennende explizite Markierungen ausgetauscht Als letzteswerden hier sog. ?Flags? gesetzt, d. h. es werden Datensatzteile aus ihrem festen Platz in der ?Ma?gebenden Textfassung? ausgeschnitten, und an einer nur f?r die Druckfassung ben?tigten anderen Stelle durchMarkierungen ersetzt - Das PROGRAMM (TUSTEP-Kopiere, bestehend aus 96 Durchg?ngen mit 2058 Parameterzeilen) erledigt als zweite Komponente die Hauptarbeit des Druck-Paketes. Hier werden die einzelnen Komponenten der Datens?tze der ?Ma?gebenden Tfextfassung? hierarchisch miteinander verglichen und je nach Ergebnis des Vergleichs im Programm weitergereicht Da die Einga bedaten eine alphabetisch sortiertelexikalische Liste darstellen, bei der jeder Datensatz die vollst?ndige grammatische und orthographische Beschreibung einesWortes der Sargtexte enth?lt,werden hier die Angaben zuWortwurzel, Wortform, Orthographie etc. verglichen, bei Wiederholung eliminiert und dem vorangegangenen Datensatz hierarchisch zugeordnet (Parameter av-ev,
ak-ek, axx-exx).

- In einem NACHPROGRAMM (TUSTEP-Kopiere, bestehend aus 23 Durch 490 Parameterzeilen) werden in den vorherigen Te?programmen g?ngen mit noch nicht l?sbare Sonderfalle (wie .B. Komposita) oder zur?ckgestellte zu PROGRAMM verarbeitet analog - Den Abschlu? der TUSTEP-Kopiere Reihe bildet ein SATZVORBEREI TUNGS-Programm (TUSTEP-Kopiere, bestehend aus 28 Durchg?ngen mit

302 Parameterzeilen), das im wesentlichen alle verbliebenen projekt-spezi fischenCodes inTUSTEP-Satz-Codes austauscht und .B. lebende Kolum nentitel aus den aktuellen Daten ermitteltund erg?nzt. - Den Druck schlie?lich in besorgt ein einfaches TUSTEP-Satzr^ogramm, dem nur noch datenunabh?ngige Pauschalanweisungen gesetzt werden, .B. Schriftgr??en oder ?berschriftengestaltung.

relativ hohe Zahl von Durchg?ngen und Parameterzeilen l??t die Frage aufkommen, ob eine Zusammenfassung von Verarbeitungsschritten in TU STEP-Kopiere nicht m?glich und w?nschenswert w?re. Zwar ist dies theore tisch ohne weiteres denkbar, in der Praxis ginge dies aber auf Kosten der Nachvollziehbarkeit der einzelnen Programmschritte und ihrer Wirkungen im Die

148

This content downloaded from 196.204.163.100 on Mon, 28 Oct 2013 10:05:44 AM All use subject to JSTOR Terms and Conditions

komplexen Daten- und Codebestand. Durch die Verteilung auf vier, in ihren Aufgaben klar voneinander getrennteTeilprogramme, wird die Fehlersuche und Manuelle ?Sch?nung? der TUSTEP Fehlerbeseitigung wesentlich vereinfacht. die in den Zwischenaus ist nicht Datenfehler, vorgesehen. Satz-Ausgabedatei drucken festgestelltwerden, werden in der ?Ma?gebenden Textfassung?, also in den Quelldaten korrigiert,Programmfehler im Programm abgefangen. Wie bereits erw?hnt, ist es unterden gegenw?rtigen Bedingungen jederzeitm?glich, einen Ausdruck zu erstellen, der der endg?ltigen zu druckenden Form weitest gehend entspricht. ImWesentlichen h?ngt es vom angestrebtenPerfektionsgrad der ?Ma?gebenden Textfassung? ab, wann der Druck erfolgen kann.

149

This content downloaded from 196.204.163.100 on Mon, 28 Oct 2013 10:05:44 AM All use subject to JSTOR Terms and Conditions