Sie sind auf Seite 1von 7
Die altägyptischen Sargtexte Verfahrensschritte bei der Erschließung eines großen und komplizierten Textcorpus

Die altägyptischen Sargtexte Verfahrensschritte bei der Erschließung eines großen und komplizierten Textcorpus Author(s): Wolfgang Schenkel and Knut Buroh

Source: Historical Social Research / Historische Sozialforschung, Vol. 20, No. 3 (75), PC-

Software für die statistische Analyse in der Historischen Sozialforschung (1995), pp. 144-149 Published by: GESIS - Leibniz-Institute for the Social Sciences, Center for Historical Social Research

Stable URL: http://www.jstor.org/stable/20755987 .

Accessed: 28/10/2013 10:05

Your use of the JSTOR archive indicates your acceptance of the Terms & Conditions of Use, available at . http://www.jstor.org/page/info/about/policies/terms.jsp

.

JSTOR is a not-for-profit service that helps scholars, researchers, and students discover, use, and build upon a wide range of content in a trusted digital archive. We use information technology and tools to increase productivity and facilitate new forms of scholarship. For more information about JSTOR, please contact support@jstor.org.

.

information about JSTOR, please contact support@jstor.org. . GESIS - Leibniz-Institute for the Social Sciences, Center

GESIS - Leibniz-Institute for the Social Sciences, Center for Historical Social Research is collaborating with JSTOR to digitize, preserve and extend access to Historical Social Research / Historische Sozialforschung.

http://www.jstor.org

This content downloaded from 196.204.163.100 on Mon, 28 Oct 2013 10:05:44 AM All use subject to JSTOR Terms and Conditions

beitet haben, zur Durchsicht gegeben. Ergeben sich bei der Durchsicht noch

so werden diese wiederum indie zentrale Arbeitsdatei

eingetragen. Die korrigierte Datei geht nochmals zum Satz.

sachliche ?nderungen,

Nachbesserungen, die nur die Typographie betreffen, werden erst nach Ab

schlu? aller sachlichen ?nderungen ausgef?hrt Sie beitsdatei nichtmehr.

tangieren die zentrale Ar

Die Ergebnisse der Umstellung haben wir schon 1992 auf der Tagung der Arbeitsgemeinschaft Philosophische Editionen inBerlin vorgetragen. Die mei ste Zeit, die ich seither an dem Projekt gearbeitet habe, habe ich damit ver bracht, die Programme denW?nschen des Verlegers anzupassen, um . B. Edi tionskonventionenoder aus Bleisatzzeit her?bergerettete Konventionen wieder zu ?bernehmen. Diese Arbeiten haben nichtsmit der editorischenArbeit zu tun. Sie haben die vorgesehene Datemtruktur weder erweitertnoch umgesto?en. Auch aus dieser Erfahrung heraus pl?diere ich f?r eine Trennung von wis senschaftlichereditorischerArbeit und technischer Herstellung der Edition. Die Satzaufbereitung kostet viel Zeit und bringt der inhaltlichenArbeit nichts.

Ein Arbeitsmittelwie TUSTEP,

das sowohl die wissenschaftlichen Arbeits

schritteals auch die mehr technischen Arbeitsg?nge von Satzherstellung und Aufbereitung f?r andere Publikationsformen gleicherma?en unterst?tzt, ohne

da? ein Systemwechsel notwendig wird, erleichtertdie reibungslose Integration allerArbeitsschritte ineinen Gesamtablauf, trotzder hier erfolgreichpraktizier

ten Arbeitsteilung.

Die alt?gyptischenSargtexte Verfahrensschrittebei der Erschlie?ung eines gro?en

und kompliziertenTextcorpus

Wolfgang Schenkel, Knut Buroh*

1. Das ?gyptologische Projekt

Die alt?gyptischen Sargtexte sind Texte, die zwischen dem Ende des 3.

und der

Mitte des 2. vorchristlichen Jahrtausendsmeist auf den Innenw?nden von ka

stenf?rmigenS?rgen betuchter Personen angebracht wurden. Sie sind in der Hauptsache gedacht alsWissensvorrat f?rden Verstorbenen zum Gebrauch im

Jenseits.Dem ?gyptologen

rische und linguistische Fragen.

sind sie eine wahre Fundgrube f?r religionshisto

* Protokolldes 62.

Kolloquiums

?ber die

Anwendung

derEDV indenGeisteswissen

schaftenan derUniversit?t T?bingen am 26. November 1994.

144

This content downloaded from 196.204.163.100 on Mon, 28 Oct 2013 10:05:44 AM All use subject to JSTOR Terms and Conditions

Die Texte stehen in einer lebenden Texttradierung und -Weiterentwicklung zwischen den Pyramidentexten aus der Mitte des 3. vorchristlichen Jahrtau sends und dem Totenbuch, das seit der Mitte des 2. Jahrtausends v. Chr. die

Sargtexte abl?st. Dem Umfang nach sind die Sargtexte die gr??te der drei

Textgruppen. Sie umfassen - soweit ediert - Texte im Gesamtumfang von ca.

140 000 laufendenW?rtern.

Die Texte sind - soweit ediert - im Schnitt 3,8 Mal

bezeugt, so da? das Textcorpus insgesamt mehr als eine halbe Million laufende

W?rter umfa?t. Da

die Textzeugen nicht unbetr?chtlich voneinander abwei

chen, ist letztereZahl die f?rdas Projekt ma?gebende.

F?r die Verarbeitung im Computer wurden die Texte nicht in der Hierogly

phenzeichenfolge erfa?t, die die Edition bietet -eine

interpretieren, w?re hochkompliziert-, sondern in einer linguistischen Trans kription, die mit graphematischen Informationen angereichert ist, mithin in zweiter Linie auch die Hieroglyphenzeichenfolge abbildet. Urspr?nglich war Ziel, eine Konkordanz zu den Sargtexten zu erstellen, d. h.

die Belege f?rdie einzelnen Lexeme mit ihremKotext wiederzugebea

Ziel wurde zwar nicht aufgegeben, aber einstweilen noch vertagt, da eine me chanische Gewinnung derKotexte entweder, wenn . B. als Kotexte einheitlich sinnvolle Textabschnitte wie S?tze oder Teils?tze gew?hlt w?rden, diese die

Konkordanz zu volumin?s machten, oder, wenn man mechanisch k?rzere Ko

texteohne R?cksicht auf den Sinnzusammenhang abgrenzen w?rde, die Kon kordanz nur schwer zu benutzen w?re, da ?gyptische Wortformen - inHiero

glyphen oder in Transkription- inweit h?herem Ma?e mehrdeutig sind als etwa deutsche. Statt dessen werden, um auch einmal ein Ergebnis zu haben,

Register produziert, lexikalische, morphologische, graphematische. Danach sol len die Texte syntaktischanalysiert werden und die syntaktischen Strukturen

solche linguistisch zu

Dieses

bei der Abgrenzung von Kotexten f?r die Zwecke

genutzt werdea Im ?brigen werden ?bergro?e Belegmengen f?r ein und dasselbe Textele

einer echten Konkordanz

ment - Lexeme

sind bis gegen 30 000 Mal

belegt - mit Hilfe manueller

Ein

griffe derart reduziert oder strukturiert, da? ein Leser die Aufstellungen

auch

tats?chlich benutzen kann (statt

. B.

man besser die Edition durchlesen).

10 000 Belege nachzuschlagen, w?rde

2. Die philologische Prozedur

Die Aufnahme der Texte (in Transkription) ist so kompliziert und damit feh

leranf?llig, da? sie nicht in einem Zug durchgef?hrt werden kana

stand weder von Anfang an noch stehtheute fest, was man notiert, und was

nicht; die Anspr?che wuchsen und wachsen mit dem Projekt Anfangs bestand die Textaufhahme vor allem aus der Notation desWortlauts und textkritischen Zus?tzen, sp?ter kamen Angaben zu den Graphien hinzu, schlie?lich soll k?nf

Im ?brigen

tig einmal eine syntaktischeAnalyse

zugeordnet werden - und dergleichen

145

This content downloaded from 196.204.163.100 on Mon, 28 Oct 2013 10:05:44 AM All use subject to JSTOR Terms and Conditions

mehr. Die Erstellung der Texte f?rdie Verarbeitung im Computer erfolgt also

zyklisch oder besser: spiralf?rmig. Die

?aufgeschaukelt?. Dabei

selbst: Die mehrfach bezeugten Texte wurden derart gewonnen, da? ein -

liebiger- erster Textzeuge vervielf?ltigt wurde und durchKorrektur indie

deren Textzeugen verwandelt wurde. Oden F?r die

Textaufhahmen werden

in Etappen

liefernfr?here Etappen oftmehr als den Textbestand

be

an

Zufugung der graphemati

schen Informationenzu den zuvor hergestellten Transkriptionen desWortlauts

wurde ein graphematisches W?rterbuch produziert, das jede m?gliche Graphie einmal enthielt, und aus diesem wurden dann die Graphien der einzelnenWort

formbelege ausgew?hlt. F?r das ?Aufschaukeln? der Tbxtaufhahme istvon wesentlichem Belang, da?

zwischen den Zyklen Register erstelltwerden k?nnen -

ein lexikalisches Register-, mit deren Hilfe man die Textaufhahmen aufKon

sistenz hin ?berpr?fen kann.

. B. sehr fr?h schon

3. Die TUSTEP-Prozedur

Es gibt stets eine ma?gebende Fassung des Textcorpus. Diese Fassung bietet die Texteinheiten in einer Reihenfolge, . B. inder Folge des Textes oder inder lexikalischen Folge. Will man die Elemente inanderer Reihenfolge haben, mu?

diese ?Ma?gebende Textfassung? des Corpus entsprechend umsortiertwerden. Es spricht allerdings nichts dagegen, neben der ?Ma?gebenden Textfassung? des Corpus in einer bestimmten Sortierung auch nicht-ma?gebende Fassungen in anderer Sortierung zu haben. Abstrakt ?berlegt, w?re die Arbeit mit einer

Datenbank

Datenbank

durchaus zweckm??ig, da man sich im allgemeinen inder Folge der

praktischer, in der Praxis dagegen istdas gew?hlte Verfahren ohne

Zyklen sehr lange auf eine einzige Reihenfolge konzentriert

Die ?Ma?gebende Textfassung? mu? drei Bedingungen erf?llen:

- Sie mu? am B?dschirm lesbar und auf der Tastatur (bzw. mit der Maus)

schreibbar und korrigierbar sein.

-

- Sie mu? als Schnittstelle f?rden Druck dienen k?nnen, also alle Informatio

nen zur Steuerung des Druckbildes implizit enthalten (zurUmsetzung inein Druckbild siehe unten ? 4).

Sie mu?

nach unterschiedlichen Gesichtspunkten internsortierbarsein.

Wesentliche TUSTEP-Eigenschaften f?runsere Zwecke vor allem diese:

- neben den allgemeinen Qualit?ten sind

-

Die M?glichkeit, den Zeichenvorrat

durch Zeichenkombinationen zu erwei

tern, dann aber diese Zeichenkombinationen bei der internenWeiterverar

-

umcodieren zu

k?nnen;

die M?glichkeit, Daten sozusagen zweidimensional zu organisieren und um

zuorganisieren (1. Dimension: Zeilen, 2. Dimension:

Trennzeichen gekennzeichnete Abschnitte in der Zeile), m. a.W. lange und

?Spalten?, d. h. durch

beitung (Sortierung) auf einfache Weise

in Einzelzeichen

146

This content downloaded from 196.204.163.100 on Mon, 28 Oct 2013 10:05:44 AM All use subject to JSTOR Terms and Conditions

komplizierte Datens?tze, die internals Einheit manipuliert werden (Sortie rung), am Bildschirm durch Zerlegung inAbschnitte und Aufteilung auf mehrere Zeilen ?berschaubar zu machen.

Den immensen positiven Qualit?ten des Werkzeugs TUSTEP

Nachteile gegen?ber, etwa diese:

-

stehen ein paar

Um praktisch arbeiten zu k?nnen, mu? das Textcorpus inDateien von je

-

-

etwa einem Hundertstel zerlegt werden. Andernfalls w?re

das

Zerst?rungs

risiko bei (fehlerhaften) Pauschalkorrekturen zu hoch und dieWartezeit am

Anderfalls w?rden

auch die Zeilennummern zu gro? oder unpraktischgro?. Im ?brigen m?ssen, wenn durch eine Korrektur die Sortierfolge ge?ndertw?rde, u. U. Daten aus einem Hundertstel in ein anderesmanuell verschoben werden.

Bildschirm beim Suchen - und Korrigieren - zu gro?.

Daten, die eliminiertwerden ( . B. nur erg?nzteWortformen) m?ssen ma nuell inHilfsdateien ausgegliedert werden, da sie nicht einfach unsichtbar

gemacht werden k?nnen und damit den ?berblick Bildschirm behindernw?rden.

?ber das Material

am

Die

allein

nicht in einen Sortierschl?ssel umgesetzt werden kann (Zerlegung indiverse

Hauptinformationen und vielf?ltige Indizes hierzu); f?r solche Hauptinfor

mationen und vor allem Indizes werden je eigene Sortieralphabete ben?tigt, die mit den zugelassenen drei TUSTEP-Sortieralphabeten nur durch trick reiche, schwer durchschaubare ?berlagerung verschiedener Alphabete rea lisiertwerden k?nnen.

Transkriptionen haben eine Struktur, die mit TUSTEP-Mitteln

Die

genannten Problem-Punkte sind f?r die Zwecke

des Projekts praktisch mit den

spezi

gel?st. Es stehtzu vermuten, da? die Probleme

weitestgehend

fischen Besonderheiten der benutzten Transkription und mit der Eigenart des

Textcorpus zusammenh?ngen, Speziall?sungen also gerechtfertigt sind.

4. Beispiel einer Druckausgabe: der Druck der lexikalischen Konkordanz

Da ein wesentliches Ziel des Projekts ist, die

in der

vor

das meistgebrauchte Arbeitsmittel darstellt, war es von

wichtigsten Ergebnisse

klassischen Form eines gedruckten Buches zu ver?ffentlichen, das nach wie

f?r den ?gyptologen

einem gewissen Grad der ?Aufschauklung? und Sortierung

voll und erw?nscht, diese schon als Teil- oder Zwischenergebnis in einer der endg?ltigen Druckgestalt nahekommenden, wenn nicht sogar identischenForm zu produzieren. Als Schnittstelle zu diesem Produktionsschrittdient die oben

? 3 emgef?hrte

tuellstenForm enth?lt

Die einzelnen S?tze der ?Ma?gebenden Textfassung? werden hierzu durch

eine Kaskade

schickt, in deren Verlauf die Daten verglichen und reduziert, interneCodes in

der Daten an sinn

?Ma?gebende Textfassung?, die die Daten in ihrer jeweils ak

von TUSTEP-Kopiere-

und

TUSTEP-Satz-Programmen

ge

147

This content downloaded from 196.204.163.100 on Mon, 28 Oct 2013 10:05:44 AM All use subject to JSTOR Terms and Conditions

explizite TUSTEP-Satz-Codes umgewandelt sowie f?r den Satz und f?r das

Druckbild n?tige Erg?nzungen vorgenommen werden. Am Ende des Durch

laufs steht ein TUSTEP-Satz-Programm, das dann die endg?ltige Ausgabe, letztlichauf Papier besorgt. Die Schritte im einzelnen:

-

Ein VORPROGRAMM

(TUSTEP-Kopiere,

bestehend aus 42 Durchg?ngen

mit

282 Parameterzeilen) eliminiert aus jedem Datensatz der ?Ma?gebenden

Textfassung? die Datenteile, die f?r das in diesem Prognunrnablauf ange strebte Ergebnis (Druckseite) nicht auszuwerten sind. Des weiteren werden

hier implizit eindeutige Grenzmarkierungen zwischen den hierarchischen Teilen eines Datensatzes f?rdie weitere Abarbeitung in von TUSTEP leich

-

ter zu erkennende explizite Markierungen ausgetauscht Als

letzteswerden

hier sog. ?Flags? gesetzt, d. h. es werden Datensatzteile aus ihrem festen

Platz in der ?Ma?gebenden Textfassung? ausgeschnitten, und an einer nur

f?rdie Druckfassung ben?tigten anderen Stelle durch Markierungen ersetzt

(TUSTEP-Kopiere, bestehend aus 96 Durchg?ngen mit

2058 Parameterzeilen) erledigt als zweite Komponente die Hauptarbeit des

Das PROGRAMM

Druck-Paketes.

Hier werden die einzelnen Komponenten

der Datens?tze der

?Ma?gebenden

Tfextfassung? hierarchisch miteinander

verglichen und je

nach Ergebnis

des Vergleichs im Programm weitergereicht Da

die Einga

bedaten eine alphabetisch sortiertelexikalische Liste darstellen, bei der jeder

Datensatz die vollst?ndige grammatische und orthographischeBeschreibung einesWortes der Sargtexte enth?lt, werden hier die Angaben zu Wortwurzel,

Wortform, Orthographie etc. verglichen, bei Wiederholung eliminiert und dem vorangegangenen Datensatz hierarchisch zugeordnet (Parameter av-ev,

-

-

ak-ek,

axx-exx).

In einem NACHPROGRAMM

(TUSTEP-Kopiere,

bestehend aus 23 Durch

g?ngen mit 490 Parameterzeilen)

zur?ckgestellte oder noch nicht

analog zu PROGRAMM verarbeitet

werden in den vorherigenTe?programmen

l?sbare Sonderfalle (wie

. B. Komposita)

Den Abschlu? der TUSTEP-Kopiere

TUNGS-Programm

(TUSTEP-Kopiere,

Reihe bildet ein SATZVORBEREI

bestehend aus 28 Durchg?ngen mit

302 Parameterzeilen), das imwesentlichen alle verbliebenen projekt-spezi

fischenCodes inTUSTEP-Satz-Codes austauscht und . B. lebende Kolum

nentitel aus den aktuellenDaten ermitteltund erg?nzt.

- Den

Druck

schlie?lich besorgt ein einfaches TUSTEP-Satzr^ogramm,

dem nur noch

Schriftgr??en oder ?berschriftengestaltung.

datenunabh?ngige Pauschalanweisungen gesetzt werden,

in

. B.

Die

relativ hohe Zahl von Durchg?ngen

aufkommen, ob eine Zusammenfassung

STEP-Kopiere

und Parameterzeilen l??t die Frage

von Verarbeitungsschritten in TU

dies theore

tisch ohne weiteres denkbar, in der Praxis ginge dies aber auf Kosten der

nicht m?glich und w?nschenswert w?re. Zwar ist

Nachvollziehbarkeit der einzelnen Programmschritte und ihrer Wirkungen

im

148

This content downloaded from 196.204.163.100 on Mon, 28 Oct 2013 10:05:44 AM All use subject to JSTOR Terms and Conditions

komplexen Daten- und Codebestand. Durch die Verteilung auf vier, in ihren

Aufgaben klar voneinander getrennteTeilprogramme, wird die Fehlersuche und

Fehlerbeseitigung wesentlich vereinfacht.Manuelle

Satz-Ausgabedatei

drucken festgestellt werden, werden in der ?Ma?gebenden Textfassung?, also in den Quelldaten korrigiert,Programmfehler im Programm abgefangen. Wie bereits erw?hnt, istes unterden gegenw?rtigen Bedingungen jederzeitm?glich, einen Ausdruck zu erstellen, der der endg?ltigen zu druckenden Form weitest

?Sch?nung? der TUSTEP

istnicht vorgesehen. Datenfehler, die in den Zwischenaus

gehend entspricht. ImWesentlichen h?ngt es vom angestrebtenPerfektionsgrad der ?Ma?gebenden Textfassung? ab, wann der Druck erfolgen kann.

149

This content downloaded from 196.204.163.100 on Mon, 28 Oct 2013 10:05:44 AM All use subject to JSTOR Terms and Conditions