Sie sind auf Seite 1von 16

4 Sprachwissenschaftliche Methoden

4.1 Introspektion und Empirie


Die Sprachwissenschaft arbeitet mit verschiedenen Forschungsmethoden und sttzt sich
dabei auf Daten, die sie wissenschaftlich auswertet. In diesem Kapitel werden einige
Mglichkeiten des sprachwissenschaftlichen Zugangs kurz vorgestellt. Ausfhrlichere
Darstellungen und Hilfe bei der eigenen Forschungsplanung geben ROTHSTEIN (2011),
aus der Perspektive des Deutschen als Fremd- und Zweitsprache SETTINIERI et al. (2014).
Speziell den Fremdsprachenunterricht fokussiert DOFF (2012).
Auf welche Art und Weise knnen Sprachdaten gewonnen werden? Der einfachste
Zugang ist sicherlich, das eigene Sprachwissen zu reflektieren. Einen solchen Zugang
bezeichnet man als Introspektion (Innenschau). Ausgehend von der eigenen Sprach-
kompetenz lassen sich z.B. verschiedene Mglichkeiten des Satzbaus ausprobieren (Die
Linguistin studiert den Satzbau. Den Satzbau studiert die Linguistin. *Linguistin die Satzbau
den studiert.) und als grammatikalisch korrekt oder inkorrekt (*) bewerten. Introspektion
ist Bestandteil jeder wissenschaftlichen Forschung. Als alleiniger Zugang der
Sprachbeschreibung ist sie allerdings nicht hinreichend.
Zum einen knnen viele sprachwissenschaftliche Fragen nicht durch Introspektion be-
antwortet werden, z.B. die, welches r fr die deutsche Standardsprache charakteris-
tisch ist, ob sich die Sprache verschiedener sozialer Gruppen unterscheidet, welches
Modalverb im Deutschen am hufigsten verwendet wird etc. Antworten ergeben sich erst
durch den Einbezug einer Vielzahl von Sprachdaten verschiedener Sprecherinnen und
Sprecher. Zum anderen ist das Sprachwissen eines Einzelnen stets lckenhaft und durch
seine individuellen Spracherfahrungen geprgt. Ein Linguist, der eine Sprachbeschrei-
bung allein auf seine eigene Sprachkompetenz grndet, luft Gefahr, unzutreffende Beur-
teilungen vorzunehmen. Ein Abgleich des individuellen Wissens mit dem allgemeinen
Sprachgebrauch ist notwendig. Ein Beispiel: Bei der Untersuchung mndlicher Sprache
ausgehend von Gesprchsaufnahmen stellte man fest, dass Konjunktionen wie weil oder
obwohl in der mndlichen Sprache meist mit Zweitstellung des Verbs auftreten (s.
(Ts1) Nee, es ist berhaupt nicht gut. Weil da sitzen viel zu viel Leute drin).1 Eine Befragung
des eigenen Wissens htte diese Konstruktion als ungrammatikalisch klassifiziert, da
die Grammatikschreibung von einer Verbendstellung in Nebenstzen ausgeht.2 Erst der
Blick auf zahlreiche authentische Daten gesprochener Sprache setzte neue berlegungen
in Gang. Dem grammatischen Phnomen liegt kein Vergessen der gelernten Regeln,
sondern ein Bedrfnis der Sprecher zugrunde, das auf die besonderen
Handlungsumstnde von Mndlichkeit zurckgeht (s. Kap. 16).
Neben dem Problem der Verallgemeinerbarkeit bringt ein introspektives Vorgehen ein
weiteres Problem mit sich, nmlich das der Wahrnehmbarkeit bzw. Bewusstheit
bestimmter sprachlicher Erscheinungen und Formen. So werden manche linguistische
Phnomene (z.B. Hrerrckmeldungen durch hm) erst dann bemerkt, wenn man wei,
dass es sie gibt. Beide Probleme, Verallgemeinerbarkeit und Bewusstheit, sind nicht

1 Verbzweitstellung bedeutet, dass das finite Verb als zweites Satzglied im Satz auftritt: da
(Lokaladverbiale) sitzen drin (Prdikat) viel zu viel Leute (Subjekt). Konjunktionen wie weil werden nicht
als Satzglieder angesehen.
2 Bei Verbendstellung wrde der Satz lauten: weil da viel zu viele Leute drin sitzen.
2 Kapitel 4

trivial, sondern stellen sich als grundstzliche Forschungsprobleme auch bei alternativen
Herangehensweisen, die als empirische Methoden der introspektiven Sprachbetrachtung
gegenbergestellt werden knnen.
Empirie (von griech. empeiria) bedeutet Erfahrung. Bei einem empirischen sprach-
wissenschaftlichen Vorgehen nhert man sich dem Untersuchungsgegenstand ausgehend
von Daten, die systematisch durch verschiedene Verfahren erhoben werden knnen.
Grundstzlich unterscheiden lassen sich hier als Herangehensweisen die Informanten-
befragung, das Experiment, die Beobachtung und die Aufzeichnung und Auswertung
authentischer Daten. Natrlich spielt Introspektion auch bei diesen Verfahren eine Rolle:
In vielen Zusammenhngen ist es hilfreich, wenn Linguisten auf eigene Sprachkenntnisse
zurckgreifen oder Sprecher einer Sprache zur Einschtzung von Formen oder
uerungen befragt werden knnen.
Die wissenschaftliche Untersuchung entscheidet sich oft fr eine der methodischen
Herangehensweisen. Manchmal werden aber auch mehrere methodische Verfahren auf
einen Gegenstand angewendet und die Ergebnisse der verschiedenen Heran-
gehensweisen zueinander in Beziehung gesetzt. Ein solches Vorgehen bezeichnet man als
Triangulation. So kann z.B. einer (mndlichen oder schriftlichen) Spracherhebung in
einer alltglichen Umgebung eine Informantenbefragung vorausgehen. Ein gezieltes
Interview mit den Sprechenden oder Schreibern kann folgen; auch knnen
Untersuchungsergebnisse gegebenenfalls mit diesen besprochen und diese Gesprche als
weitere Datenquelle genutzt werden. Da das Ergebnis einer solchen Forschung durch
mehrere Verfahren abgesichert ist, gelten triangulatorische Verfahren als besonders
wertvoll, sind aber entsprechend aufwendig in ihrer Durchfhrung.
Mchte man, wie in Forschungen zum Spracherwerb, Aussagen ber zeitliche
Verlufe machen, bieten sich zwei Forschungsdesigns an. Zum einen kann die Methode
der Lngsschnittstudie (Langzeitstudie) gewhlt werden. Bei einer solchen Heran-
gehensweise begleitet man die Probanden, also die Versuchspersonen oder untersuchten
Personen, ber einen lngeren Zeitraum, oft mehrere Jahre oder gar Jahrzehnte hinweg,
wobei in bestimmten Abstnden Daten erhoben werden. Eine andere Mglichkeit ist die
Querschnittstudie. Dabei erhebt man zu einem bestimmten Zeitpunkt Sprachdaten in
verschiedenen Altersgruppen und schliet dann auf einen zeitlichen Verlauf. Zwei groe
Studien zum Erwerb des Deutschen durch auslndische Arbeiter, das Heidelberger
Forschungsprojekt Pidgin-Deutsch und das Projekt ZISA (Zweitspracherwerb
italienischer und spanischer Arbeiter) (vgl. Kap. 19.1), waren beispielsweise als
Querschnittstudien angelegt.
An wissenschaftliche Forschung besteht der Anspruch, auch von anderen nachprfbar
zu sein. Dazu muss nachvollziehbar sein, wie die Ergebnisse gewonnen wurden. Auch
das zugrundeliegende Datenmaterial selbst sollte daher umfassend oder zumindest in
Ausschnitten3 fr eine berprfung und gegebenenfalls erneute Analyse zugnglich
sein. So ist es wissenschaftlicher Standard, Ausschnitte aus den Daten (z.B. Fragebgen,
Beispieltexte, Transkripte) zu verffentlichen, die das Vorgehen belegen und die
Argumentation nachvollziehbar werden lassen.

3 Nicht immer werden die in Projekten erhobenen Sprachdaten vollstndig verffentlicht. Oft erlaubt allein
der Umfang der Materialien keine umfassende Publikation, schon wegen der Druckkosten und des
Aufwands fr die Aufbereitung des Daten.
Kapitel 4 3

4.1.1 Informantenbefragung und Experiment


Die Befragung von Informanten bildet ein Vorgehen, das bei der Beschreibung oraler,
d.h. rein mndlich vorkommender Sprachen insbesondere im 18./19. Jahrhundert hufig
genutzt wurde. So geht die Beschreibung vieler Indianersprachen auf die Befragung von
mehrsprachigen Personen zurck, die den Ethnologen oder Linguisten, die selbst nicht
ber entsprechende Sprachkenntnisse verfgten, ber ihre Erstsprachen Auskunft
gaben.4 Hufige Verfahren der Informantenbefragung sind die (schriftliche) Fragebogen-
Untersuchung und das (mndliche) Interview.
In einer Befragung durch Fragebogen lassen sich, insbesondere in Zeiten des Internet,
viele Probanden erreichen. Sie besitzt zudem den groen methodischen Vorteil einer
Standardisierung, d.h. einer Vergleichbarkeit der gewonnenen Daten. Je nach
Konstruktion der Fragen wird der Untersuchungsgegenstand unter Umstnden
allerdings auch sehr stark eingeschrnkt. Grundstzlich lassen sich verschiedene
Fragetypen unterscheiden. Den am strksten begrenzten Fragetyp bilden Multiple-
choice-Fragen, die in ihrer Formulierung bereits eine bestimmte Sicht auf den
Gegenstand bieten und mgliche Antworten vorgeben. Die so gewonnenen Ergebnisse
sind daher nur eingeschrnkt aussagekrftig. Eine Frage wie Wie gut sprechen Sie
Deutsch? mit den Antwortmglichkeiten muttersprachlich, flieend, weniger gut,
nicht gut, schlecht gibt z.B. nur Auskunft ber die Selbsteinschtzung der Befragten;
sie sagt jedoch nichts darber aus, inwieweit sie zutrifft. Problematisch sind auch die
wertenden Kategorien, da darunter Unterschiedliches verstanden werden kann.
So genannte halboffene oder offene Fragen, die selbst formulierte Antworten der
Befragten zulassen, sind weniger stark in den Antwortmglichkeiten eingeschrnkt. Sie
sind statistisch allerdings wesentlich schwerer auszuwerten. Als Beispiel fr eine
Fragebogenuntersuchung durch halboffene Fragen kann die umfangreiche
Datenerhebung zu den deutschen Dialekten durch WENKER herangezogen werden, die in
den Deutschen Sprachatlas mndete. Angeschrieben wurden die Schullehrer an
zahlreichen Schulen im deutschen Sprachgebiet. Sie wurden um die bertragung von 40
Beispielstzen in den Ortsdialekt gebeten, wobei gegebenenfalls bei den Schlern
nachzufragen sei. Die Stze, unter ihnen z.B. Der gute alte Mann ist mit dem Pferd(e) auf
dem Eis eingebrochen und in das kalte Wasser gefallen (Wenkersatz Nr. 4) waren aufgrund
ihrer Lautstruktur ausgewhlt worden.5 Da die schriftliche bertragung der dialektalen
Lautung ein methodisches Problem bildete, wurden die erhobenen Daten in
Folgeuntersuchungen gezielt um Tonaufnahmen ergnzt.6
In Fragebogenuntersuchungen finden sich auch oft offene Fragen, z.B., wenn die
Befragten zu Kommentaren aufgefordert werden. Charakteristisch sind offene Fragen fr
den Untersuchungstyp Interview. So stellte William LABOV in einer berhmten
Untersuchung zum afroamerikanischen Englisch beispielsweise die Eingangsfrage

4 Manchmal handelte es sich dabei allerdings nur um ein oder zwei Personen, die ber keine linguistischen
Kenntnisse verfgten. Entsprechend haben sich einige der Sprachbeschreibungen im Nachhinein z.T. als
unzutreffend erwiesen, so etwa die der sprachlichen Relativittstheorie zugrundeliegenden
Beschreibungen des Hopi als zeitloser Sprache durch Whorf (vgl. Kap. 3.4.2).
5 Die verschiedenen Stze und Beispiele fr beantwortete Fragebgen sind ber das REDE-Portal
zugnglich (s. Internet-Einstiege); das Vorgngerprojekt Digitaler Wenker-Atlas wurde in die Plattform
integriert.
6 Die Tonbeispiele der verschiedenen Wenker-Stze in ihrer jeweils dialektalen Umsetzung wurden
mittlerweile digitalisiert und knnen ber das REDE-Portal heutzutage geographisch punktgenau von
Karten abgerufen werden (https://regionalsprache.de/SprachGis/Map.aspx).
4 Kapitel 4

Waren Sie schon einmal in Todesgefahr? und forderte so zu Erzhlungen auf, die er
anschlieend strukturell untersuchte. Ein Interview, das spezifisch darauf abzielt, die zu
untersuchenden Personen zu lngeren Ausfhrungen und Erzhlungen zu bewegen,
wird als narratives Interview bezeichnet. Die Interviewenden gehen dabei auf die
uerungen ihrer Gesprchspartner flexibel ein. Nachfragen sind mglich, thematische
Abschweifungen erlaubt, das Gesprch soll so natrlich7 wie mglich verlaufen. Ist fr
das Interview hingegen die Abarbeitung einer Liste zu stellender Fragen vorgesehen,
spricht man von einem strukturierten Interview. Hufig findet sich als Mischform auch
das halbstrukturierte Interview, das eine situationssensitive Gesprchsfhrung bei
gleichzeitiger Ausrichtung an einem Fragenkatalog zulsst, wobei die Fragen nicht
notwendigerweise in einer bestimmten Reihenfolge angesprochen werden mssen.
Das Hervorrufen sprachlicher Daten durch Aufforderungen oder Fragen der
untersuchenden Linguisten bezeichnet man als Elizitierung. Die Elizitierung
sprachlicher Daten ist nicht immer leicht. Auch unterliegen elizitierte Daten einer
gewissen Einschrnkung: Sie werden von den Untersuchten zwar spontan geuert, es
bleibt aber offen, ob das betreffende Phnomen auch ohne Elizitierung im normalen
Alltag so produziert werden wrde. Gerade im Zusammenhang der Untersuchung von
Dialekten oder anderen Varietten stellt sich als weiteres Problem der Einfluss, den die
sprachwissenschaftlichen Interviewer durch ihre eigene Sprechweise unwillentlich auf
die Informanten ausben: Ein nicht dialektkundiger Linguist wird in Interviews nur
schwerlich basisdialektale Sprechweisen erheben knnen.
Auch das sprachwissenschaftliche Experiment ist als Verfahren durch die Elizitierung
von Daten gekennzeichnet. Im Experiment werden Versuchspersonen mit Aufgaben oder
Situationen konfrontiert, die sie bewltigen mssen. Zum Teil werden dabei ihre
sprachlichen uerungen aufgezeichnet, zum Teil geht es aber auch um Reaktionszeiten,
Augenbewegungen (z.B. beim Lesen) oder neuronale Vorgnge, die apparativ erfasst und
gemessen werden (s. Kap. 3.4.3). Fr bestimmte linguistische Fragestellungen ist ein
experimentelles Vorgehen unumgnglich. Ein groer Vorteil des Experiments ist die
Vergleichbarkeit des so gewonnenen Materials. Indem man z.B. untersucht, wie
verschiedene Probanden unterschiedlicher Herkunftssprachen die Aufgabe lsen, eine
Bildgeschichte oder ein Video nachzuerzhlen, lassen sich sprachkontrastiv Einblicke in
die Sprachproduktion oder erwerbsbezogene Phnomene gewinnen.8 Entsprechende
Aufgabenstellungen knnen auf die Erhebung mndlicher oder schriftlicher Sprachdaten
abzielen.

4.1.2 Sammlung und Erhebung authentischer Sprachdaten


Ein grundstzlich anderer Zugang zum Gegenstand besteht darin, ihn in seinem
natrlichen Umfeld, d.h. in seinem nicht durch die Forschenden hervorgerufenen
Auftreten zu untersuchen. Im Unterschied zu elizitierten Daten spricht man dann von
authentischen Sprachdaten. Bei authentischen Sprachdaten handelt es sich um Daten,
die direkt dem sprachlichen Alltag entnommen werden.9 Dies knnen schriftliche Texte

7 Zur Diskussion um Natrlichkeit s. Kap. 4.1.2.


8 Bekannte Beispiele, die von verschiedenen Forschern genutzt werden, sind die frog story, eine Bilder-
buchgeschichte, und der Pear story-Film (Chafe 1980). Zu einem entsprechenden Vorgehen in der
Gestikforschung am Beispiel von Tweety und Sylvester-Cartoons s. die Arbeiten von McNeill u.a.
9 Der Begriff authentisch entspricht hier also nicht der z.T. in fremdsprachendidaktischen Diskussionen
feststellbaren Verwendung des Ausdrucks als von Muttersprachlern produziert. Auch sind nicht alle
echten, spontan gesagten uerungen in diesem Verstndnis authentisch.
Kapitel 4 5

sein, wie sie z.B. in Zeitungen oder Bchern aufzufinden sind (s. Kap. 4.3.1), es kann sich
um mediale Kommunikationsformen wie Werbefilme handeln oder aber um Gesprche
im familiren oder beruflichen Umfeld, die mitgeschnitten werden. Authentische
Gesprche sind fr die Linguistik besonders interessant, gleichzeitig aber am
schwierigsten zu erheben.
Sind die Forschenden selbst in den Situationen anwesend, die von ihnen durch eine
Ton- oder Videoaufzeichnung erfasst werden, bezeichnet man das als teilnehmende
Beobachtung.
Viele der gegenwrtigen linguistischen Forschungen, u.a. die Untersuchung von
Unterrichtskommunikation, sind durch teilnehmende Beobachtung gekennzeichnet.
Umfangreichere Formen der teilnehmenden Beobachtung liegen vor, wenn die
Forschenden lngere Zeit in der zu untersuchenden Sprachgemeinschaft verbringen oder
zeitweilig mit den untersuchten Personen zusammenleben. Man bezeichnet diese Art von
Forschung als Feldforschung. Besonders hufig wird dieses Verfahren in linguistisch-
ethnologischen Forschungszusammenhngen verwendet, so bereits bei BOAS (vgl. Kap.
3). Die Kontaktaufnahme mit den zu untersuchenden Personen, d.h. der Feldzugang,
gestaltet sich je nach Untersuchungsbereich als mehr oder weniger schwer, da der
Einblick in sprachliche Gewohnheiten oft Vertrautheit voraussetzt.
Bereits zu Zeiten der Junggrammatiker war Feldforschung in der Dialektologie blich.
Zum Teil mieteten sich die Forschenden z.B. lngere Zeit in einem Ort ein, um die
lokalen Ortsgrammatiken aufzuzeichnen. Die entsprechende Technologie fr Ton- oder
gar Filmaufnahmen stand dabei jedoch noch nicht zur Verfgung. Man war daher auf die
direkte oder nachtrgliche Mitschrift angewiesen.
Die nachtrgliche Aufzeichnung eines Sprachereignisses bezeichnet man als
Erinnerungszitat. Viele frhe Sprachforschungen, insbesondere auch zum
Spracherwerb, sind auf Erinnerungszitate gesttzt. Da keine Nachprfbarkeit besteht,
gelten Erinnerungszitate heutzutage nicht mehr als verlssliche Quellen; sie hngen von
richtiger Wahrnehmung und vom Gedchtnis des einzelnen ab. Gleichwohl greift man
auch heute manchmal noch auf Erinnerungszitate zurck, da die Aufnahmetechnik nicht
in allen Momenten bereitsteht, in denen man sich eine Aufzeichnung wnscht. Man
spricht dann von quasi-authentischen Belegen. Diese knnen einen Ausgangspunkt fr
weitere Untersuchungen bilden, die dem betreffenden Phnomen empirisch nachgehen.
Die Erfassung authentischer mndlicher Sprachdaten ist fr viele sprach-
wissenschaftliche Fragen, etwa die, wie der Sprecherwechsel in Gesprchen verluft,
welche Funktionen sprachliche Variation erfllt u.a., unumgnglich. Sie ist allerdings
zeitaufwendig, da der Erhebung weitere Aufbereitungen folgen (s. Kap. 4.2). Dadurch ist
die Anzahl der Personen, die erfasst werden, meist geringer als z.B. bei einer Fragebogen-
untersuchung. In der Forschung wird hier von qualitativen Untersuchungsverfahren
gesprochen, die auf eine hohe Probandenzahl zugunsten einer inhaltlich vertieften
Gegenstandsanalyse verzichten.
Den qualitativen Verfahren werden manchmal die quantitativen Verfahren
gegenbergestellt.10 Dies ist insofern nicht richtig, als auch qualitative Studien
quantitative Auswertungen, z.B. von Worthufigkeiten, Lautabweichungen etc. umfassen

10 S. dazu auch Ehlich (1982) Quantitativ oder qualitativ? Bemerkungen zur Methodologiediskussion in
der Diskursanalyse. In: Khle, Karl/ Raspe, Hans-Heinrich (Hgg.) Das Gesprch whrend der rztlichen
Visite. Mnchen: Urban & Schwarzenberg, S. 298-312.
6 Kapitel 4

knnen. Die Frage der Reprsentativitt der Daten, d.h. ihrer Verallgemeinerbarkeit und
Aussagekraft, ist im Rahmen jeder sprachwissenschaftlichen Untersuchung zu stellen
und in der Darstellung der Ergebnisse zu reflektieren (s. Kap. 4.3).

4.2 Aufzeichnung und Verschriftlichung mndlicher Sprachdaten


Whrend schriftliche Texte einer sprachwissenschaftlichen Beobachtung unmittelbar zu-
gnglich sind, ist dies bei der mndlichen Kommunikation nicht der Fall. Vielmehr gehen
der Untersuchung mndlicher Sprache ihre Aufzeichnung (Aufnahme auf Ton- oder
Bild-Ton-Trger) und ihre Verschriftlichung voraus. Da zumeist nicht nur Einzelwrter
und kurze uerungen, sondern oft lngere Gesprche erfasst werden, ergeben sich
verschiedene Arbeitsschritte, die z.T. mit methodischen Entscheidungen verbunden sind.

4.2.1 Aufzeichnung
Bei der Erhebung mndlicher Sprachdaten stellt sich ein besonderes Problem, das unter
dem Stichwort Natrlichkeit von Sprachdaten diskutiert und in der Linguistik seit
WILLIAM LABOV als Beobachterparadox bezeichnet wird. LABOV selbst beschreibt das
Paradox folgendermaen:
Ziel der sprachwissenschaftlichen Erforschung der Gemeinschaft muss sein, herauszufin-
den, wie Menschen sprechen, wenn sie nicht systematisch beobachtet werden; wir knnen
die notwendigen Daten jedoch nur durch systematische Beobachtung erhalten. (1972, S. 147)
Fr die Untersuchung sprachlichen Handelns spielt es also eine zentrale Rolle, ob und
inwieweit die Beobachtung die zu beobachtende Kommunikation mitbestimmt, d.h. ob
sich die Beteiligten anders als sonst verhalten. Die teilnehmende Beobachtung hat den
Vorteil, dass der anwesende Forscher sich im Nachhinein an bestimmte Ereignisse
whrend der Aufnahme erinnern und uerungen, die in Gesprchen fallen, oft besser
deuten kann als jemand, der nicht anwesend war (z.B. uerungen wie Stellst des mal
hin?). Da seine eigene Sprechweise aber die Sprachwahl der Aufnahmesituation
beeinflussen kann, arbeitet man in der Dialektologie und Regionalsprachenforschung z.T.
auch mit Gesprchsaufnahmen, die ohne Anwesenheit der Forschenden durchgefhrt
wurden (vgl. SCHMIDT/HERRGEN 2014:379f.). Das Bewusstsein, beobachtet zu werden,
kann im Verlauf eines Gesprchs in den Hintergrund treten. Das Problem ist aber
grundstzlich vorhanden; manchmal wird auf die Ausnahmesituation auch durch
entsprechende Bemerkungen der Beteiligten Bezug genommen.
Das Beobachterparadox tritt insbesondere bei einer offenen Aufnahme deutlich
hervor, bei der die Beteiligten um den Mitschnitt wissen. Eine verdeckte Aufnahme
(Aufnahme ohne Wissen der Betroffenen) kann das Problem verringern, ist jedoch
ethisch und rechtlich problematisch. So ist es notwendig, bei Sprachaufnahmen im Vor-
oder Nachhinein die Zustimmung der Beteiligten einzuholen und die Daten andernfalls
zu lschen.11 Zudem werden die Gesprchsdaten aus Datenschutzgrnden blicherweise
anonymisiert (so auch bei uns): Namen von Personen, Orten etc. werden in Transkripten
durch hnlich klingende Namen mit gleicher Silbenzahl (z.B. Meier durch Mller) oder
durch Platzhalter (z.B. STRASSE, STADT) ersetzt. In Tonaufnahmen werden persnliche
Angaben ggf. durch einen Ton berblendet.

11 Vorschlge zur Formulierung von Einverstndniserklrungen finden sich im Gesprchsanalytischen


Informationssystem (GAIS, s. Internet-Einstiege).
Kapitel 4 7

Eine im Blick auf die Datenaufzeichnung wichtige Frage betrifft die Aufnahmetechnik.
In sprachwissenschaftlichen Untersuchungen werden soweit mglich12 Gerte und
Mikrophone genutzt, die eine hohe Qualitt der Klangaufzeichnung ermglichen.
Sprachaufnahmen in der freien Wildbahn sind aufgrund der blichen Nebengerusche
in der Lebensumwelt aber zumeist von wesentlich schlechterer Tonqualitt als Radio-
oder Fernsehaufzeichnungen. Eine entscheidende Rolle spielen in diesem Zusammen-
hang auch die Raum- und Gruppengre. Bei der Untersuchung von Sprache in greren
Gruppen, z.B. einem Klassenzimmer, mssen u.U. mehrere Gerte verwendet werden.13
Die Qualittsanforderungen sind zudem abhngig von den jeweiligen Untersuchungs-
zielen. Besondere Erhebungsprobleme stellen sich, wenn auch gestisch-mimische Anteile
einer Interaktion erfasst werden sollen. Hier stellen sich u.a. die Fragen, mit wie vielen
Kameras zu arbeiten ist und welche Personen jeweils aus welcher Entfernung und
welchem Blickwinkel im Bild erfasst werden.
Die im Rahmen von Mitschnitten erhobenen Sprachdaten werden meist nicht gnzlich
ausgewertet, da der Arbeitsaufwand einer detaillierten linguistischen Verschriftlichung
erheblich ist (s. Kap. 4.2.2). Als zweiter Schritt erfolgt daher zunchst die Erstellung einer
berblicksartigen Verlaufsbersicht ber den Inhalt der Aufnahmen und die
exemplarische Auswahl von Gesprchen oder Teilausschnitten, die einer Transkription
und anschlieenden Auswertung unterzogen werden.

4.2.2 Transkription mndlicher Sprachdaten


Die Verschriftlichung mndlicher audio-visueller Sprachdaten wird als Transkription
(Umschrift, von lat. trans hinber, scribere schreiben) bezeichnet. Das weitere Wortfeld
umfasst:
transkribieren (Ttigkeit)
der/die Transkribent/in
das Transkript.
Als wissenschaftliche Methode lsst sich transkribieren im weitesten Sinne mit auf-
schreiben, was man wahrnimmt bersetzen. Eine Transkription ist also eine Ver-
schriftlichung sinnlich wahrgenommener Momente. Neben verschiedenen sprachlichen
Einheiten werden bei vielen Transkriptionen auch Pausen, Gerusche und Nichtsprach-
liches wie Lachen, Niesen etc. festgehalten. Fr die Analyse sind solche Phnomene
interessant, weil sie zum Beispiel Planungsprozesse der Sprecher widerspiegeln (Abbr-
che, Pausen), auf soziale Gegebenheiten Bezug nehmen (Wer spricht wann?), selbst kom-
munikativ sein knnen (z.B. Lachen) oder als Bezugspunkte kommunikativ aufgegriffen
werden knnen (Gesundheit!).
Fr unterschiedliche Untersuchungszwecke und mit unterschiedlichem Forschungs-
hintergrund sind in der Linguistik verschiedene Transkriptionsverfahren (Transkrip-
tionssysteme) entwickelt worden. Transkriptionsverfahren sind kodifizierte Systeme von
Notationsmglichkeiten, die dem Forscher zur Verschriftlichung zur Verfgung stehen.14
Die Wahl des Transkriptionsverfahrens ist abhngig von Gegenstand und Fragestellung
der sprachwissenschaftlichen Untersuchung. So lassen sich Transkriptionsverfahren in
zwei Typen unterteilen, die fr unterschiedliche Zwecke entwickelt worden sind:

12 Hier spielt natrlich die finanzielle Frage der Forschungsfrderung eine groe Rolle.
13 S. z.B. REDDER (1982) zum Projekt Kommunikation in der Schule (KidS).
14 Alphabet- und Silbenschriften sind Transkriptionsverfahren, die gesamtgesellschaftlich verbreitet sind.
8 Kapitel 4

diskursorientierte Verfahren, die auf eine phonetische Umschrift verzichten und


mit der normalen Orthographie arbeiten
phonetisch orientierte Verfahren, die versuchen, Momente der Artikulation so
genau wie mglich zu erfassen.
Bei der Wahl eines Transkriptionsverfahrens sind unter anderem die sich widerspre-
chenden Prinzipien Genauigkeit der Wiedergabe und leichte Lesbarkeit zu berck-
sichtigen. Ein eigenes Feld bildet die Frage der Transkription von visuellen Daten. Hier
sind verschiedene Transkriptionsverfahren in Gebrauch, die von kurzen kategorialen
Erfassungen bis hin zu abbildenden Verfahren reichen.
Gerade bei der Transkription umfangreicherer Daten greift man heutzutage hufig auf
einen Transkriptionseditor zurck, der die Transkriptionsarbeit erleichtert, indem ein
Vor- und Zurckspulen von Audio- oder Videodaten bei gleichzeitigem Schreiben
ermglicht wird. Ein sehr bekannter Editor ist das von einem Entwicklerteam um
THOMAS SCHMIDT erarbeitete Verbundssystem EXMARaLDA, das neben einem
Transkriptions- und Annotationseditor weitere Analysewerkzeuge umfasst.

4.2.3 Diskursorientierte Transkriptionsverfahren


Die Verschriftlichung der Sprachdaten stellt einen zentralen Arbeitsschritt der
linguistischen Diskursforschung dar. Sie ist nicht nur ein notwendiger Schritt, um den
Untersuchungsgegenstand gesprochene Sprache zu erfassen, sondern bereits Bestandteil
der Analyse. Fr den Transkribenten stellt sich oft die Frage, wie man ein gehrtes
Etwas aufschreiben soll. Zu den derzeit gebruchlichsten diskursorientierten Transkrip-
tionsverfahren15 gehren:
das Verfahren der Halbinterpretativen Arbeitstranskription (HIAT),
das System DIDA (Diskurs-Datenbank), das am IDS verwendet wird,
das im Rahmen ethnomethodologischer Arbeiten verwendete Verfahren CATS
(Conversational Analysis Transcription System) bzw.
im deutschsprachigen Raum das Verfahren der Gesprchsanalytischen Transkrip-
tion (GAT), das an CATS anknpft,
das Verfahren CHAT (Codes for Human Analysis of Transcripts), das u.a. im
Rahmen der Erstspracherwerbsforschung verwendet wird.
Gemeinsame Grundprinzipien und Unterschiede diskursorientierter Transkriptionen be-
treffen:
a) das Prinzip der literarischen Umschrift
Bei der Verschriftlichung mndlicher Kommunikation verwenden alle diskurs-
orientierten Verfahren das Prinzip der literarischen Umschrift. Literarische Um-
schrift bedeutet, dass im Rahmen der Transkription die Orthographie des Deut-
schen weitgehend beibehalten wird. Abweichungen in der Aussprache werden
allerdings mit notiert, z.B. Ham Se ma n Moment Zeit? statt Haben Sie mal einen
Moment Zeit?
In einigen diskursorientierten Transkriptionen wird dabei auch auf Gro- und
Kleinschreibung und auf die Verwendung von Satzzeichen verzichtet; bei anderen
werden dagegen die blichen Satzzeichen der deutschen Schriftsprache verwendet.
Notationen ohne Punkt und Komma sind hufig verbunden mit phonetisch-in-
tonatorischen Fragestellungen und einer Transkription der uerungsintonation.

15 Vgl. fr eine bersicht Redder (2001).


Kapitel 4 9

Bei durchgngiger Kleinschreibung dient die Schreibung von uerungsteilen in


Grobuchstaben oft der Kennzeichnung ihrer Akzentuierung.
b) zeilenweise Schreibung versus Partiturschreibung
Ein gleichzeitiges Reden der Gesprchsbeteiligten ist in mndlicher Kommunika-
tion hufig. Einige Transkriptionssysteme verwenden Zeilenschreibung und sehen
zur Kennzeichnung von Gleichzeitigkeit und verschiedenen bergnge Sonderzei-
chen vor (z.B. = fr schneller Anschluss). Andere Transkriptionssysteme ver-
wenden statt dessen das Verfahren der Partiturschreibung, das die Gleichzeitigkeit
von uerungen durchgehend graphisch abbildet (s.u.).
c) Sonderzeichen fr Phnomene mndlicher Kommunikation
In allen diskursorientierten Transkriptionsverfahren werden standardisierte
Zeichen fr charakteristische Phnomene wie Pause, Abbruch, Unverstndliches
etc. verwendet, die zum Teil sehr hnlich sind. Manchmal erfordert eine spezielle
Untersuchungsfrage auch die Einfhrung eines eigenen, neuen Zeichens. Der
Wiedergabe von Transkripten in Monographien oder Aufstzen wird daher oft eine
bersicht ber die verwendeten Transkriptionssymbole vorangestellt.
Am Beispiel der Halbinterpretativen Arbeitstranskription (HIAT)16, einem in der Ange-
wandten Linguistik hufig verwendeten Transkriptionsverfahren, werden im Folgenden
einige Transkriptionszeichen und -weisen vorgestellt, die zugleich einen ersten Einblick
in den Gegenstandsbereich mndliche Kommunikation geben. Die Bezeichnung halb-
interpretativ nimmt auf die in jeder Transkription vorhandene Filterung der Daten
durch den Transkribenten Bezug. Bei der Halbinterpretativen Arbeitstranskription wer-
den die blichen Satzzeichen der deutschen Schriftsprache beibehalten. Da das Verfahren
dem Prinzip der leichten Lesbarkeit folgt, kommt man mit relativ wenigen Sonderzeichen
aus. Andere Verfahren lassen sich von dieser Basis aus leicht aneignen.
Die Gesprchsausschnitte (Ts1) Sprachenlernen, (Ts2) SZ-Verkufer,
(Ts3) Hausarbeit abholen und (Ts4) Film vermitteln Hreindrcke au-
thentischer mndlicher Kommunikation. Abb. 1 zeigt ein Beispiel fr einen nach HIAT
transkribierten Gesprchsausschnitt.

Abb. 1: Nach HIAT transkribierter Transkriptausschnitt


(aus (Ts1) Sprachenlernen)


C [ Aber ich hab ja jetzt/ im letzten Semester hab ich
1

C [ diesen ersten Spanischkurs fr Nicht-Hispanisten
2

> \/
A hmhm (Der) ist lustig. ((lacht))
C /_1gemacht. 1_/ Und das war der vllige Absturz.
/_1lachend
D %
% = zieht lachend Luft ein
3

16 Einfhrend s. Ehlich / Rehbein (1976), ausfhrlicher Ehlich (1993), Ehlich / Rehbein (1979a).
10 Kapitel 4

Das Grundprinzip der Notation in HIAT ist die Partiturschreibung, die Notationsweisen
der Musik aufgreift: In der Transkription erhlt jeder Sprecher eine oder mehrere Zeilen,
in denen notiert wird, was er sagt bzw. tut. Die Gleichzeitigkeit von Phnomenen wird
innerhalb der Partiturklammer graphisch abgebildet. Wie in Musikpartituren werden
aus Platzgrnden Zeilen fr Sprecher weggelassen, wenn sie in dieser Zeit keinen
Einsatz haben.
Pro Sprecher werden u.U. mehrere Transkriptionszeilen genutzt. Das eigentlich Ge-
sprochene wird fr jeden Sprecher in der so genannten Verbalzeile notiert. Starke
Betonung eines Wortes wird durch Unterstreichung erfasst. In einer so genannten Into-
nationszeile (im obigen Transkript durch > gekennzeichnet) werden Angaben zu pro-
sodischen Phnomenen notiert. Hrvermutungen werden in einfache Klammern gesetzt,
z.B. (Der) ist lustig. Fr Nicht Verstandenes wird ein der uerungslnge entsprechender
Leerraum eingeklammert. Gerusche werden in Doppelklammern notiert, z.B. ((lacht)).
Phnomene, die sich ber einen lngeren Zeitraum erstrecken, werden in der Verbalzeile
durch Klammerung mittels /_ _/ angezeigt und in einer Kommentarzeile oder am
Transkriptrand erklrt. Die Klammern werden bei Bedarf nummeriert. Das Zeichen %
wird benutzt, um ein sehr kurzes, punktuelles Phnomen zu notieren, das auerhalb der
Verbalzeile erlutert wird.
Verzgerungen, Abbrche und Pausen kommen in gesprochener Sprache sehr hufig
vor (s. Kap. 16). Um das Langziehen eines Lautes zu kennzeichnen, verwendet man in
HIAT entweder Mehrfachschreibung (z.B. sooo) oder man setzt Doppelpunkte hinter dem
betreffenden Laut (z.B. so::).17 Abbrche und Brche in der uerungskonstruktion
werden durch das Zeichen / erfasst (z.B. Aber ich hab ja jetzt / im letzten Semester hab ich
diesen ersten Spanischkurs fr Nicht-Hispanisten gemacht). Pausen innerhalb von oder
zwischen uerungen werden durch Punkte verschriftlicht. Ein Punkt entspricht einer
kurzen Pause (einem beat), mehrere Punkte zeigen eine lngere Pause an.18 Lngere
Pausen werden in Sekunden angegeben (z.B. ((6s))).
Die Genauigkeit von Transkripten wird fr diskursorientierte Transkriptionen oft als
Relation angegeben (Transkriptionsrelation). Man findet hier Angaben wie 1:30, 1:60
oder 1:600. Die Angaben bedeuten, dass pro Minute gesprochener Sprache 30, 60 oder
(z.B. bei der Erfassung gestischer und prosodischer Daten) sogar 600 Minuten
Transkriptionszeit aufgewendet wurden. Je nach Umfang der Transkription
unterscheidet man zwischen einfachen und erweiterten Transkriptionen.
Erweiterte Transkriptionen sind umfangreicher und erfassen z.B. auch die phonetische
Umsetzung oder das gestische Handeln im Detail.

4.2.4 Phonetisch orientierte Transkriptionsverfahren


In einem phonetisch orientierten Verfahren wird die Lautgestalt des Gehrten erfasst.
Phonetische Transkriptionen sind daher mit einem sehr hohen Zeitaufwand verbunden.
Ein hufig verwendetes Verfahren fr phonetisch orientierte Transkriptionen ist das
Internationale Phonetische Alphabet (IPA); es wird in Kap. 12 dargestellt.
Ein Vergleich von (B1) und (B2) macht deutlich, welche Informationen durch
literarische Umschrift verloren gehen, die durch phonetische Notation erfasst werden
knnen. (B2), ein Auszug aus den Daten des Heidelberger Forschungsprojekts Pidgin-

17 Diese Notation entspricht der Notation von Lnge im Internationalen Phonetischen Alphabet (IPA).
18 In neueren Transkriptionen wird das Zeichen fetter Punkt verwendet, um Pausen zu notieren.
Kapitel 4 11

Deutsch (HPD), zeigt zugleich, dass neben IPA in der Linguistik z.T. auch andere
Verfahren der phonetischen Verschriftlichung Einsatz finden.
B1 Literarische Transkription von Lernersprache
Heute viel . Kollega . kurzarbeiten, nich arbeiten, spazieren, Arbeitsamt bezahle,
Arbeitsamt, achtnzwansi Mark und vierzig Pfenni. Du guck amol, eine . eine .
Kollega . vielleicht zwei Kinder Deutschland, . o(der) . nich Kinda, achtnzwanzig
Mark bezahle eine Tag. Miete bezahle, Strom bezahle, Wasser bezahle, Vespa
bezahle, wo Geld? Egal, . Kollega, egal.
B2 Phonetische Transkription von Lernersprache (HPD 1977, S. 27)
oitc19 fiil /colega/ kucdsawitc, ni arwic, pasia, acwaisam
bcsaalc, awaism, axwansi marko ficsi fni. Duu gukc mool, ainc- ainc /colega/, filai
czswai kinda doislan, /o/ ni kinda, axwansi marko bcsalc ainc tah.
miitc bcsaalc, cstrom bcsaalc, wasa bcsaalc, wspa bcsaalc, woo gl? + (lacht) & &
igaal, /colega/, & & igaal.
Je nach Reichweite der Verschriftlichung mndlicher Sprache wird in der phonetischen
Forschung zwischen breiten und engen phonetischen Transkriptionen unterschieden.
Eine breite phonetische Transkription ist an den Phonemen der betreffenden Sprache
orientiert (s. Kap. 13). Notiert werden lediglich diejenigen Eigenschaften der Aussprache,
denen bedeutungsdifferenzierende Qualitt zugesprochen wird. Zudem wird eine
Segmentierung des Lautstroms durch Spatien (Leerzeichen) sowie durch Interpunktion
vorgenommen, die ber die wahrnehmbaren Eigenschaften des Gesprochenen
hinausgeht. B3 zeigt eine breite Transkription des Textes Nordwind und Sonne, der als
Beispieltext im Handbuch der International Phonetic Association verwendet wird.
B3 breite phonetische Transkription (Kohler 1999, S. 88)
ans ttn z ntvnt n zn, ve fn im baidn
vol d tk ve, als an vand, d n an
vam mantl ghlt va, ds vegs dahekam.
Bei einer engen phonetischen Transkription werden hingegen wesentlich mehr Eigen-
schaften der sprachlichen uerung notiert (s. B4). Erfasst werden u.a. die Realisierung
von Knacklauten [], Entstimmlichungen und Lnge. Die Verwendung von Spatien als
Lesehilfe entfllt.
B4 enge phonetische Transkription (Pompino-Marschall 2009, S. 268)
ansttnzntvntnzn|vefnimbadn
voldtkve|alzavand|dnan
vammantl ghltva|dsvegsdahekam
Will man die Aussprache von Deutschlernenden nher untersuchen, ist eine sehr enge
Notation notwendig, in der z.T. noch weitere Merkmale, etwa die vor- und rck-
verlagerte oder entrundete Umsetzung eines Lautes zu erfassen sind.

4.3 Korpora des Deutschen


Ein Korpus (Neutrum, Pl.: Korpora) ist eine systematisch aufgebaute Sammlung
schriftlicher oder mndlicher Daten.

19 Das Zeichen <c> steht hier fr einen reduzierten Vokal (Schwa-Laut), der sich im Deutschen in unbe-
tonten Nebensilben findet (s. Kap. 12f.).
12 Kapitel 4

Die Frage, wie sich der untersuchte Ausschnitt zur Grundgesamtheit aller Sprach-
daten dieses Typs verhlt, wird unter dem Stichwort Reprsentativitt diskutiert.
Idealiter sollte ein Korpus reprsentativ, d.h. das verkleinerte Abbild der
Grundgesamtheit sein. So wre es beispielsweise unzulssig, eine Beschreibung der
deutschen Aussprache allein auf eine Untersuchung von 2030-jhrigen Sprechern zu
sttzen, die in Mnchen leben. Zwar drfte eine solche Untersuchung durchaus
interessante Ergebnisse erbringen (z.B. mit Blick auf Mehrsprachigkeit in der Stadtregion)
und knnte zur Beantwortung der Frage nach Aussprachestandards im Deutschen
beitragen. Hinsichtlich der Verallgemeinerbarkeit muss jedoch die Frage gestellt werden,
ob die Untersuchung von anderen Altersgruppen und in anderen Regionen dieselben
Ergebnisse erbringen wrde.
Korpora sind grundstzlich und aus forschungspraktischen Grnden begrenzt und
knnen den Untersuchungsbereich Sprache niemals vollstndig abbilden. So knnen
fr eine sychrone Sprachbeschreibung des Deutschen nicht alle mndlichen und schrift-
lichen uerungen seiner gegenwrtigen Sprecher herangezogen werden; auch kann
eine diachrone germanistische Beschreibung sich nicht auf alle auf Deutsch verfassten
Texte der letzten Jahrhunderte sttzen. Untersucht werden knnen lediglich Ausschnitte
diese sind mittlerweile aber schon sehr umfangreich und umfassen Tausende von
Texten und Tonaufnahmen. Eine bersicht ber nationale und internationale
Korpusarchive zum Deutschen geben LEMNITZER / ZINSMEISTER (2006) sowie KALL-
MEYER / ZIFONUN (2007). Die umfangreichste Sammlung von Korpora zum gesprochenen
und geschriebenen Deutsch verwaltet das Institut fr Deutsche Sprache (IDS) in
Mannheim.

4.3.1 Korpora geschriebener Sprache


Zum geschriebenen Deutschen gibt es mittlerweile viele digitalisierte Korpora, die elek-
tronisch ausgewertet werden knnen.
Ein sehr groes Korpus zum geschriebenen Deutschen ist das Deutsche Referenz-
korpus (DeReKo), das am IDS verwaltet wird. Das IDS begann Mitte der 1960er Jahre
mit dem Aufbau elektronischer Korpora. Das Deutsche Referenzkorpus gilt mit ber 29
Milliarden erfasster Wrter als die weltweit grte Datensammlung, die als empirische
Basis zur linguistischen Erforschung des Deutschen der Gegenwart und neueren
Vergangenheit herangezogen wird. Es enthlt belletristische, wissenschaftliche und
populrwissenschaftliche Texte sowie verschiedene weitere Textarten und umfasst
mehrere Einzelkorpora (u.a. das Bonner Zeitungskorpus, Mannheimer Korpus und das
Wendekorpus des Projekts Gesamtdeutsche Korpusinitiative in Zusammenarbeit mit
dem Zentralinstitut fr Sprachwissenschaft (ehem. DDR)). Zudem ist das Deutsche
Referenzkorpus vollstndig morphosyntaktisch annotiert (vgl. Kap. 4.4).
Das Schweizer Textkorpus der Universitt Basel dokumentiert deutschsprachige
Texte aus der Schweiz des 20. Jh. und umfasst rund 20 Millionen Textwrter20; dort
befindet sich auch ein internationales Korpus mit deutschsprachigen Texten des 20. Jh.
aus Deutschland, sterreich, Sdtirol und der Schweiz. Das Austrian Academy Corpus
der sterreichischen Akademie der Wissenschaften (AW) bietet eine umfangreiche
Sammlung von digitalen Volltexten zur deutschen Sprache und Literatur im Unter-
suchungszeitraum 1848 bis 1989.

20 Als Textwort bezeichnet man die fortlaufend auftretenden Wortformen (tokens).


Kapitel 4 13

Ein historisches Referenzkorpus fr das Deutsche ist das Deutsche Textarchiv (DTA),
das einen disziplinbergreifenden Kernbestand deutschsprachiger Texte aus der Zeit von
ca. 1650 bis 1900 als digitalisiertes, linguistisch annotiertes Volltextkorpus bereitstellt.

4.3.2 Korpora gesprochener Sprache


Auch die gesprochene deutsche Sprache ist mittlerweile gut dokumentiert. Eine
umfangreiche Dokumentation der deutschen Dialekte und Regionalsprachen mit
Anbindung an geographische Karten bietet das Archiv Regionalsprache.de (REDE).
Neben den bereits angesprochenen Wenker-Stzen umfassen die Tonaufnahmen
Umsetzungen des klassischen phonetischen Vorlesetextes Nordwind und Sonne,
Interviews mit Exploratoren, Unterhaltungen mit selbst gewhlten Gesprchspartnern
und polizeiliche Notrufannahmegesprche; zudem sind Daten aus verschiedenen
Sprachatlasprojekten integriert.
Das Archiv fr Gesprochenes Deutsch am IDS Mannheim verwaltet die grte
Sammlung von Korpora. Die Aufnahmen und Transkripte dokumentieren binnen- und
auslandsdeutsche Varietten (Dialekte, regionale Umgangssprachen und das gespro-
chene Standarddeutsch) sowie verbale Interaktion in verschiedenen sozialen Zusammen-
hngen, z.B. Konfliktgesprche, Erzhlungen und Gerichtsverhandlungen. Dokumentiert
wird auch Kindersprache beim Erwerb des Deutschen als Zweitsprache (Saarbrcker
Projekt Gastarbeiterkommunikation). Das Archiv umfasst zudem Tonaufnahmen, die
einzelnen der in der Schriftenreihe Phonai verffentlichten Monographien und
Textbnden zugrunde liegen. Viele der am IDS verfgbaren Korpora sind mittlerweile
ber die Datenbank Gesprochenes Deutsch (DGD)21 auch fr externe Nutzer
zugnglich. In kontinuierlichem Aufbau befindet sich das Forschungs- und Lehrkorpus
(FOLK).
Zu den publizierten Transkriptbnden zum Deutschen gehrt das Freiburger
Korpus, das an der Freiburger Forschungsstelle des IDS erarbeitet und als Texte
gesprochener deutscher Standardsprache in den 1970er Jahren in drei Bnden
verffentlicht wurde. Eines der Ziele war es, fr den Unterricht des Deutschen als
Fremdsprache authentische Beispiele bereitzustellen. Darber hinaus gibt es Buch-
publikationen u.a. zu Beratungs- und Schlichtungsgesprche (SCHRDER 1985, 1997), zur
Schulkommunikation (REDDER 1982), zur Telefonkommunikation (BRONS-ALBERT 1984),
zu Gesprchen am Kiosk (MAURER / SCHMITT 1994) und Sprechstundengesprchen an
der Hochschule (BOETTCHER et al. 2005). Einen zusammen mit den Audioaufnahmen
publizierten Transkriptband bieten EHLICH / REDDER (1994).
Weitere Transkriptsammlungen zu verschiedenen Forschungsschwerpunkten werden
gegenwrtig ber die Webseiten des Verlags fr Gesprchsforschung bereitgestellt (s.
Internet-Einstiege). Das gesprochene Deutsch ist zudem in vielen Einzelstudien durch
Transkripte dokumentiert, die zur eigenen Korpuserstellung und als Belegquellen
herangezogen werden knnen. Eine bersicht geben GLAS / EHLICH (2000). Verschiedene
Korpora, die im Rahmen von Projekten entwickelt wurden, finden sich auch an
Universitten.22
Korpora, die speziell fr phonetisch-phonologische Analysen aufbereitet wurden, gibt
es an der Universitt Mnchen (Bayerisches Archiv fr Sprachsignale BAS) und an

21 Einfhrend Fiehler / Wagener (2006) sowie Schmidt (2014).


22 Die Daten sind oft jedoch nur einem eingeschrnkten Personenkreis zugnglich.
14 Kapitel 4

der Universitt Kiel (Kiel Corpus). Sie sind, anders als es ihre Benennungen vielleicht
vermuten lassen, nicht dialektologisch, sondern berregional ausgerichtet. Die
Aufnahmen umfassen vorgelesene und spontane Sprache, z.B. Zahlenreihen (eins, drei,
fnf ), und bilden die Grundlage fr verschiedene Projekte zur Signalverarbeitung
und Entwicklung automatischer Auskunftssysteme (vgl. Kap. 19).

4.4 Korpuslinguistik
Der Ausdruck Korpuslinguistik bezeichnet allgemein einen methodologischen Stan-
dard, der sich in der gegenwrtigen Sprachwissenschaft etabliert hat. Sowohl in der
lexikologischen als auch der semantischen und grammatischen Forschung arbeitet man
mit Korpora; die Gesprochene-Sprache-Forschung wre ohne sie nicht denkbar.
Insbesondere komplexe Handlungsstrukturen (z.B. Reklamationen, Arzt-Patienten-
Gesprche, Verhandlungen) weisen oft vielfltige Variationsmglichkeiten auf. Die fr
bestimmte Institutionen und Diskursarten charakteristischen Handlungsablufe lassen
sich nur durch Analyse einer groen Vielzahl von Gesprchsaufnahmen und
Transkripten herausfinden.
In einem etwas engeren Sinn bezeichnet man als Korpuslinguistik eine linguistische
Teildisziplin, die sich mit dem systematischen Aufbau, der Verwaltung und der
Auswertung von sehr groen Korpora befasst.23 Dabei stellen sich einerseits Fragen der
Annotation (Auszeichnung) linguistischer Daten. Dazu gehrt z.B. die Kennzeichnung
von Wort- und Morphemgrenzen, Kasusformen usw. Durch ein sorgfltiges Tagging wird
eine statistische Auswertung mglich, die die Hufigkeit von Formen ber riesige
Mengen von Sprachdaten hinweg ermitteln kann. Dadurch kann man heutzutage sehr
genau Auskunft ber sprachliche Variation synchroner oder diachroner Art gewinnen.
Fr die sprachvergleichende Forschung von hohem Interesse sind Parallelkorpora
verschiedener Sprachen. Zum anderen bilden auch technische Fragen der Verarbeitung
von Sprachdaten einen Schwerpunkt der Korpuslinguistik; sie schliet somit eng an die
Computerlinguistik an (vgl. Kap. 19). So dient die Arbeit mit Sprachkorpora auch oft
dem Ziel der automatischen Fehlererkennung.
Korpuslinguistisch basierte Informationssysteme zum deutschen Wortschatz sind das
Digitale Wrterbuch der Deutschen Sprache (DWDS) der Berlin-Brandenburgischen
Akademie der Wissenschaften sowie das am IDS angesiedelte Online-Wortschatz-
Informationssystem (OWID) (vgl. Kap. 5). Eine korpusbasierte Auswertung des
deutschen Wortschatzes seit 1998 inklusive einer tagesaktuellen Auswertung
verschiedener Tageszeitungen und Newsdienste bietet das Deutsche Wortschatz-Portal
der Universitt Leipzig; dort erhlt man auch Zugang zur Suche in ber 136
korpusbasierten monolingualen Lexika.
Die Korpuslinguistik versteht sich nicht als reine Hilfswissenschaft, sondern
weitergehend als methodologische Bezugswissenschaft und Korrektiv:
nicht zuletzt ist es nun auch mit einem vertretbaren Aufwand mglich, den gegenwrtigen
Stand der Forschung, wie er in Wrterbchern und Grammatiken kodifiziert ist, auf den
Prfstand zu stellen. (DUFFNER/NF 2006)

23 Einen Einblick geben Hkki Buhofer (2009a, 2009b), Ldeling / Kyto (2008, 2009); zu Korpora in der
Zweitspracherwerbsforschung s. Skiba (2008).
Kapitel 4 15

Ausgewhlte Aufgaben zu Kap. 4 (4 von 17)


4. Handelt es sich bei dem folgenden Beispiel
a) um eine phonetisch orientierte oder
b) um eine diskursorientierte Transkription?
Interview mit einer spanischen Arbeiterin
(CLAHSEN / MEISEL / PIENEMANN 1983, S. 36)
1. ich. arbeite eine spanie schneidrin
2. genau Kaufhalle und Kaufhof. arbeite (bei sowas wie kaufhalle... habe ich
gearbeitet)
3. arbeite mein vater mutter nis (mein vater hat gearbeitet, meine mutter nicht)
4. autofahrer mein vater
5. ich alleine
6. keine bruder un keine schwester
7. anfange (= anfangs) sag nein vatta
8. arbeiten im fabrik sechs mona
9. un nachher in krankenhaus lernen drei jahr in krankenschwester
10. ich (son) heiraten nachher nis mehr. Krankenschwester
11. ich arbeite. in Tbingen, in fabrik handtcher.. sechs mona
12. un nachher universit klinik. lernen drei Jahre
13. un nachher i wiederkommen alle nett
14. an krankenhaus. (paar jahr) arbeiten
15. kenne mein man (im Sinne von: kennenlernen)
7. berlegen Sie sich andere Fragen, durch die eine Erzhlung elizitiert werden knnte.
9. Welche sprachlichen Handlungssituationen oder Personengruppen wrden Sie
durch teilnehmende Beobachtung untersuchen?
12. Sie interessieren sich fr Schimpfwrter und Formen des Schimpfens im Deutschen.
Mit welchem Vorgehen wrden Sie die Phnomene untersuchen? Begrnden Sie
ihre Methodenwahl.

Ausgewhlte weiterfhrende Literatur


Albert, Ruth / Marx, Nicole (22014) Empirisches Arbeiten in Linguistik und Sprachlehrforschung:
Anleitung zu quantitativen Studien von der Planungsphase bis zum Forschungsbericht.
Tbingen: Narr
Bubenhofer, Noah (2009) Sprachgebrauchsmuster. Korpuslinguistik als Methode der Diskurs- und
Kulturanalyse. Berlin: de Gruyter
Deppermann, Arnulf / Hartung, Martin (2012) Was gehrt in ein nationales Gesprchskorpus? In:
Felder, Ekkehard / Mller, Marcus / Vogel, Friedemann (Hgg.) Korpuspragmatik. Thema-
tische Korpora als Basis diskurslinguistischer Analysen. Berlin: de Gruyter, S. 414450
Doff, Sabine (Hg.) (2012): Fremdsprachenunterricht empirisch erforschen. Grundlagen
Methoden Anwendung. Tbingen: Francke Narr Attempto
Kallmeyer, Werner / Zifonun, Gisela (2007) Sprachkorpora: Datenmengen und Erkenntnisfort-
schritt. Berlin: de Gruyter
Keibel, Holger / Perkuhn, Rainer / Kupietz, Marc (2012) Korpuslinguistik. Stuttgart: Fink
Lemnitzer, Lothar / Zinsmeister, Heike (2006) Korpuslinguistik. Tbingen: Narr
16 Kapitel 4

Scherer, Carmen (2006) Korpuslinguistik. Heidelberg: Winter


Schmidt, Thomas (2014): Gesprchskorpora und Gesprchsdatenbanken am Beispiel von FOLK
und DGD. In: Gesprchsforschung - Online-Zeitschrift zur verbalen Interaktion 15, S. 196-
233
Settinieri, Julia/ Demirkaya,/ Feldmeier, Alexis/ Gltekin-Karako, Nazan/ Riemer, Claudia
(Hgg.) (2014) Empirische Forschungsmethoden fr Deutsch als Fremd- und Zweitsprache.
Paderborn: Schningh/UTB
Rothstein, Bjrn (2011): Wissenschaftliches Arbeiten fr Linguisten. Tbingen: Francke Narr
Attempto