Sie sind auf Seite 1von 9

Deutsch -Transkriptionsregeln

Inhaltsverzeichnis

1. Einführung in das Plattformhandbuch ...................................................................................... 3


Erklärung .......................................................................................................................................... 3

Tastenkombination:........................................................................................................................... 3
2. Arbeitsschritte: ....................................................................................................................... 4
3. Transkriptionsrichtlinien.......................................................................................................... 4
3.1 Verwerfen (Discard): ............................................................................................................. 4
3.2 Schnitt: ................................................................................................................................... 4
a) Es geht nicht darum einen ganzen Satz herauszuschneiden. ...................................................... 4
b) Wenn ein Teil des grauen Bereichs unverständlich ist, muss der Schnitt neu gesetzt werden. ..... 4

c) Wenn mehr als ein Sprecher gleichzeitig redet (overlapped): .................................................... 5

d) Wenn der graue Bereich Musik, Melodien, Lieder, Tier- und Naturgeräusche enthält: ............... 5
e) Pause/Stille/Rauschen am Anfang, in der Mitte und am Ende des Audios ................................. 6

f) Modalwörter........................................................................................................................... 6

g) Englisch im Audio: ................................................................................................................... 6

h) Fremdsprachen und starker Dialekt ......................................................................................... 7


3.3 Transkript ............................................................................................................................... 7
a) Transkribieren Sie was Sie hören, aber niemals raten. .............................................................. 7

b) Zwischen Wörtern sind Leerzeichen zu setzen. .......................................................................... 7

c) Verwenden Sie keine Absätze im Text. ..................................................................................... 7

d) Der finale Schnitt muss mindestens zwei transkribierbare Wörter enthalten (Modalwörter
zählen auch dazu).................................................................................................................... 7

e) Zahlen werden ausgeschrieben. ............................................................................................... 7

f) Es werden KEINE Satzzeichen verwendet. Bindestriche sind die Ausnahme. ............................... 8

h) Großschreibung ....................................................................................................................... 8

i) Abkürzungen ........................................................................................................................... 8
j) Umgangssprachliche Wörter und Sprache ................................................................................ 8

k) Nur halb ausgesprochene Wörter (half pronounced words): ..................................................... 8

l) Homophon (gleich klingende Wörter): ..................................................................................... 9

m) Vereinfachte Form/gesprochene Sprache, die von der Standardaussprache abweicht ............... 9


n) Akzente (auch schwache Ausprägung eines regionalen Dialekts) .............................................. 9
o) Schimpfwörter, Beleidigungen, schnelles Audio: ....................................................................... 9

p) Gedicht werden ganz normal transkribiert. .............................................................................. 9

q) Doppelte Leerzeichen zwischen den Wörtern sind kein Problem. ............................................... 9

r) Buchstabieren ......................................................................................................................... 9
1. Einführung in das Plattformhandbuch
Schneiden Sie einen Abschnitt klar verständlicher Sprache aus dem Audio heraus und transkribieren
Sie nur diesen.

Erklärung

• Grauer Bereich: Der grau hinterlegte Teil der Audiospur ist der bearbeitbare, automatisch
generierte Vorschnitt (Default Cut). NUR dieser Teil der Audiospur muss bearbeitet werden.

• Blauer Bereich: Der von Ihnen vorgenommene Schnitt (User Cut) innerhalb des grauen
Bereichs. Der jetzt blau hinterlegte Teil des Audiofiles muss vollständig transkribiert werden.

• Weißer Bereich: Dieser Bereich muss weder bearbeitet noch transkribiert werden. Er liefert
Kontext, um den grauen Bereich bei Unklarheiten besser zu verstehen.

• Einstufung der Audios (Audio Classes)


○ Sprache (Speech) - klar erkennbare gesprochene Worte
○ Verwerfen (Discard) - Audio entspricht nicht den ASR-Sprachanforderungen.

• Textfeld: Hier wird das Audio transkribiert.

• Video: Wird in diesem Projekt nicht angezeigt.

Tastenkombination:

1 - Audio wird an der Stelle abgespielt, wo es zuletzt pausiert wurde.


2 - Pause
3 - Spielt das gesamte Audio ab (inklusive weißer Bereich).
5 - Grauer Vorschnitt wird wiedergegeben.
a - Blauer Zuschnitt wird wiedergegeben
s - Setzt Anfangsschnitt
e - Setzt Endschnitt
2. Arbeitsschritte:
• Schritt 1: Hören Sie sich den grauen Vorschnitt (Default Cut) an.

• Schritt 2: Stufen Sie das Audio ein: Sprache (Speech) oder Verwerfen (Discard)

• Schritt 3: Wenn Sie das Audio als Sprache einstufen (Speech), überprüfen Sie bitte, ob der
Vorschnitt (Default Cut) den Regeln entsprechen angepasst werden muss. Passen Sie den
Ausschnitt gegebenenfalls an (blauer Bereich). Transkribieren Sie anschließend das Gesagte.

• Schritt 4: Aufgabe abgeben (Submit Task) ist der letzte Schritt. Wenn Sie sich für Discard
entscheiden, können Sie die Aufgabe direkt abgeben, ohne das Textfeld zu bearbeiten.

3. Transkriptionsrichtlinien
3.1 Verwerfen (Discard):
• Wenn die gesamte Audiodatei nicht auf Deutsch ist.
• Wenn die gesamte Rede unverständlich oder nicht hörbar ist.
• Wenn die gesamte Audiodatei ein Lied mit Melodie ist oder wenn
im Hintergrund des Gesagten Musik zu hören ist und man den Text
klar verstehen kann.
• Wenn nur ein einziges deutsches Wort vorkommt.

• Wenn die gesamte Audiodatei nur aus Modalwörtern besteht.


• Wenn die gesamte Datei in starkem, für die Allgemeinheit unverständlichem Dialekt ist.
Hinweis: Wenn Sie „Discard“ (verwerfen) wählen, brauchen Sie die Datei nicht zu transkribieren,
klicken Sie einfach auf „Submit“ (übermitteln) und gehen Sie zum nächsten Audio.

3.2 Schnitt:
a) Es geht nicht darum einen sinnergebenden ganzen Satz herauszuschneiden.

b) Wenn ein Teil des grauen Bereichs unverständlich ist, muss der Schnitt neu gesetzt werden.

• Ein transkribierfähiger Schnitt beginnt und endet immer mit einem klar verständlichen
ganzen Wort. Falls das Gesagte im Vorschnitt (Default Cut) am Anfang oder Ende unklar
ist, muss der Schnitt angepasst werden (User Cut – blauer Bereich).

• Undeutliche Worte in der Mitte des Audios werden rausgeschnitten.


Das heißt, man setzt den Schnitt so, dass der unverständliche Teil außerhalb des blauen
Bereichs liegt.
※Beispiel: „Klar verständliche Rede 1 + unklare Rede + klare Rede 2“
→ Setzen Sie den Schnitt so, dass Sie keine unklare Rede in Ihrem zu transkribierenden
Abschnitt haben. Sie können selbst entscheiden, ob Sie den Schnitt so setzen, dass der
blaue Bereich „klare Rede 1“ ODER „klare Rede 2“ umfasst. Transkribieren Sie
anschließend nur das was im blauen Bereich des Audiofiles gesagt wird.

Beachten Sie: Wenn vor dem Gesprochenen laute oder störende Geräusche vorkommen, versuchen
Sie diese abzuschneiden. Das Gleiche gilt für das Ende des Audios. Wenn nach dem letzten Wort
noch laute oder störende Geräusche kommen, müssen diese abgeschnitten werden. Wenn das
Geräusch den Inhalt nicht beeinflusst, können Sie es ignorieren. Bitte transkribieren Sie wie
gewohnt den Ausschnitt.

c) Wenn mehr als ein Sprecher gleichzeitig redet (overlapped):

• Verwerfen: Die gesamte Sprachaufzeichnung enthält überlappende Sprache und es gelingt


Ihnen nicht, zwei zusammenhängende Wörter zu isolieren,

• Abschneiden: Es wird gleichzeitig über verschiedene Dinge geredet und Sie können den
Inhalt NICHT verstehen – bitte schneiden Sie diesen Teil des Audiofiles ab und
transkribieren Sie den klar verständlichen Rest.

• Behalten und transkribieren:


 Wenn die gleichen Worte gleichzeitig und verständlich ausgesprochen werden (im
Chor), bleiben diese im Schnitt und werden transkribiert.
 Wenn mehrere Sprecher zu Wort kommen, ihre Redebeiträge sich aber nicht
überlappen.
 Wenn es eine Hauptstimme in einem Gruppengespräch gibt, die anderen Sprecher
aber nicht klar zu verstehen sind und die Verständlichkeit der Hauptstimme nicht von
den anderen Geräuschen beeinträchtigt wird. Transkribieren Sie die Hauptstimme
und betrachten Sie die anderen Stimmen anderer als Hintergrundgeräusche.
 Wenn mehre Personen sprechen, die Wörter aber klar getrennt, hörbar und
verständlich sind
→ Transkribieren Sie jedes hörbare Wort, sowohl von Sprecher 1 als auch von
Sprecher XYZ. Wenn nur ein Sprecher klar verstanden werden kann, schneiden Sie
die anderen Sprecher aus dem Audio. Wenn Sie den Teil mit unverständlichen
Worten im Audio belassen, zählt das als Fehler.

d) Wenn der graue Bereich Musik, Melodien, Lieder, Tier- und Naturgeräusche enthält:

• Verwerfen:
 Wenn das gesamt Audio ein Lied ist, Musik, Melodien, der Klang von Tier und Natur
und so weiter.
 Wenn der Sprecher ein Lied mitsingt oder zu einer Melodie singt (z.B. Karaoke).

• Abschneiden:
 Wenn im Hintergrund ein Lied läuft, und man den ganzen Text oder einzelne Wörter
klar verstehen kann, muss dieser Teil des Audios abgeschnitten werden. Wenn Sie
keinen Ausschnitt im Audio finden, den Sie transkribieren können, verwerfen Sie die
Datei.

***ABER wenn das Lied im Hintergrund die Verständlichkeit des Sprechers nicht
beeinflusst, transkribieren Sie die Audiodatei und ignorieren Sie die Hintergrundmusik.

• Behalten und transkribieren:

 Wenn es sich bei der Hintergrundmusik um Melodien ohne Text handelt und der
Sprecher klar zu verstehen ist.

 Wenn der Sprecher ein Lied ohne Hintergrundmelodie singt.


e) Pause/Stille/Rauschen am Anfang, in der Mitte und am Ende des Audios

• Pause/Stille/Rauschen am Anfang und am Ende:


Muss abgeschnitten werden. Der Schnitt sollte sehr dicht neben die verständlichen Worte
gesetzt werden.
Ein Beispiel: Der Vorschnitt (Default Cut) ist von Minute 5 - 10.61. Sie sollten das Audio auf
6.586 - 9.319 zurechtschneiden, da es am Anfang des Vorschnitts Rauschen/Stille gibt.

• Pause/Stille/Geräusch in der Mitte:


Wenn das Geräusch das Verständnis des Inhalts beeinträchtigt, schneiden Sie es ab.
Behalten und transkribieren Sie nur den klar verständlichen Teil in deutscher Sprache.
Wenn das Geräusch den Inhalt nicht beeinflusst (egal wie lange es ist), ignorieren Sie es
und transkribieren Sie ganz normal.
※Beispiel: „Sprache1 + Pause/Stille/Geräusch (beeinflusst den Inhalt nicht) + Sprache2“.
→Transkribieren Sie: Sprache1 + Sprache2.
※Beispiel: Sprache 1 + Pause/Stille/Geräusch (beeinflusst den Inhalt) + Sprache 2
→„Sprache 1“ oder „Sprache 2“ schneiden und transkribieren. Transkribieren Sie nicht
beide.
f) Modalwörter
• Nicht zählbare Modalwörter (modal words) müssen immer abgeschnitten werden, egal ob
am Anfang, Ende oder mittendrinnen.
※Beispiel: Sprache 1 + nicht zählbare Modalwörter + Sprache 2
→entweder „Sprache 1“ oder „Sprache 2“ schneiden und transkribieren. Transkribieren
Sie nicht beide.

• Zählbare Modalwörter:
Es dürfen jeweils nur maximal zwei Modalwörter am Anfang und am Ende des zu
transkribierenden Ausschnitts stehen.
※Beispiel: Am Anfang eines Audios lacht jemand (10 x "ha").
→ Schneiden Sie die Datei so zurecht, sodass der blaue Bereich mit nur maximal zwei
Lachern (ha ha) beginnt.
Wenn die Modalwörter in der Mitte des Audios vorkommen und eindeutig zählbar sind,
müssen sie transkribiert werden.
※Sollte sich das Modalwort wiederholen, transkribieren Sie die exakte Anzahl der Wörter.
Wenn Sie in der Mitte eines Audios drei Lacher hören, müssen Sie auch „ha ha
ha“ transkribieren.
***ABER: Lacher aus der Lachkonserve (wie in Sitcoms) sind nicht zählbar und müssen
unbedingt rausgeschnitten werden.

g) Englisch im Audio:

• Englische Wörter am Anfang oder am Ende des Audios:


※Beispiel: „Englisch + Deutsch“ oder „Deutsch + Englisch“ oder „Englisch + Deutsch +
Englisch“
→ Schneiden Sie die englischen Wörter ab und transkribieren Sie nur die Deutschen.
※Beispiel: hello, hi, part, bye, omg (wenn Englisch ausgesprochen)
→ sind nicht am Anfang oder Ende eines Ausschnitts erlaubt.
※Beispiel: „ah Fuck ich wusste das nicht“
→ Modalwort + Englisch + Deutsch = erlaubt

• Englische Wörter in der Mitte des Audios:


※Beispiel: „Deutsch1 + Englisch + Deutsch2“

In der Mitte eines Audios dürfen maximal 3 englische Worte hintereinanderstehen.


Englische Wörter werden auch englisch transkribiert. Die Groß- und Kleinschreibung wird
der deutschen Rechtschreibung angepasst.
Stehen in der Mitte eines Audios mehr als 3 englische Wörter hintereinander muss das
Audio an der Stelle abgeschnitten werden. Der blaue Bereich sollte nur dann entweder
Deutsch1 ODER Deutsch2 umfassen. Nur der blaue Bereich wird transkribiert.

• Eingedeutschte Verben sind am Anfang und am Ende eines Satzes erlaubt


※Beispiel: scrollen, gekillt, liken

h) Fremdsprachen und starker Dialekt


• werden nicht transkribiert.
Aber: Wenn Deutsch mit Akzent gesprochen wird (auch regionale Einschläge) und Sie das
Gesagte leicht verstehen können, muss es transkribiert werden
※Beispiel: ick, gell, Hamburch

• Dialekt/Fremdsprache am Anfang oder Ende des Audios


※Beispiel: „Dialekt/Fremdsprache + Deutsch“ oder „Deutsch + Dialekt/Fremdsprache“
→ Fremdsprache abschneiden und den deutschen Teil transkribieren.

• Dialekt/Fremdsprache in der Mitte des Audios


※Beispiel: „Deutsch 1 + Dialekt/Fremdsprache + Deutsch 2“
→ Schnitt setzen und dementsprechend entweder Deutsch 1 oder Deutsch 2
transkribieren.

Auch vermeintlich deutsche Wörter wie „Cousine“ oder „Ballon“ dürfen nicht am Ende oder am
Anfang des Audios stehen. Nutzen Sie dafür den Duden (https://www.duden.de/woerterbuch).
Wenn im Duden keine Herkunft angegeben ist oder eine Form des Deutschen, Lateinischen oder
Griechischen unter Herkunft steht, darf das Wort am Anfang oder Ende des Audios stehen. Diese
Regel ist auch auf Namen, Eigennamen, Vornamen und Städtenamen anzuwenden.

3.3 Transkript
a) Transkribieren Sie was Sie hören, aber niemals raten.

b) Zwischen Wörtern sind Leerzeichen zu setzen.

c) Verwenden Sie keine Absätze im Text.

d) Der finale Schnitt muss mindestens zwei transkribierbare Wörter enthalten (Modalwörter
zählen auch dazu).

e) Zahlen werden ausgeschrieben.


f) Es werden KEINE Satzzeichen verwendet. Bindestriche sind die Ausnahme.

• Da keine Satzzeichen verwendet werden dürfen, müssen Benutzernamen nicht


transkribiert werden.
※Beispiel: @CharlesJunior
→nicht transkribieren.
Ausnahme: Wenn im Audio eine vollständige E-Mailadresse genannt wird, darf das
@-Zeichen für die Transkription verwendet werden.

g) Wörter und Sätze, die wiederholt werden, müssen dementsprechend oft transkribiert werden.

h) Großschreibung
• Es gelten die Regeln der deutschen Rechtschreibung.
• Substantive wie Stadtname, Straßenname usw. werden großgeschrieben.
※Beispiel: New York, TikTok, Türkei

• Laut deutscher Rechtschreibung werden auch substantivierte Verben großgeschrieben. ※


Beispiel: das Fußballspielen

• Das erste Wort im Textfeld wird klein geschrieben es sei denn, dass es nach den Regeln
der deutschen Rechtschreibung großgeschrieben wird.

i) Abkürzungen
• Gängige Abkürzungen, die als Substantiv agieren werden in Großbuchstaben ohne
Lehrzeichen geschrieben.
※Beispiel: KFC, NBA, UEFA

• Abkürzungen für Wortgruppen wie gws, otw, bwt, imo, lol etc. (get well soon, on the way,
by the way, in my opinion, laugh out loud, etc) werden in Kleinbuchstaben geschrieben.
Wichtig: Wenn sie englisch ausgesprochen werden, dürfen sie nicht am Anfang/Ende des
Audios stehen.
※Beispiel: omg vs. OMG
→ omg = wenn Englisch ausgesprochen, muss es klein geschrieben werden und darf nicht
am Anfang/Ende stehen
→ OMG = wenn Deutsch ausgesprochen, dann in Großbuchstaben und darf überall stehen

• Bzw. etc. ca.: Wenn sie im Audio ausgesprochen werden, dürfen sie nicht abgekürzt
werden und müssen als Wort transkribiert werden.
※Beispiel: bzw. = beziehungsweise

• Obwohl FB und IG Abkürzungen von bekannten Eigennamen sind, werden sie so


transkribiert, wie Sie sie hören.

j) Umgangssprachliche Wörter und Sprache


• Wenn das Gesagte klar verständlich ist, aber nicht im Duden steht oder von der
Standardaussprache abweicht, transkribieren Sie es so, wie sie es hören.

• Wichtig: die deutsche Standardaussprache für Wörter die auf -ig enden ist -ch wie in „ich“.
※Beispiel: Sie hören „Könich“
→ entspricht der Standardaussprache und muss „König“ transkribiert werden.

k) Nur halb ausgesprochene Wörter (half pronounced words):

• Wenn ein halb ausgesprochenes Wort, kein eigenständiges Wort ist, muss es
abgeschnitten werden.
※Beispiel „Ich geh zur Poli(zei)“
→ Poli ist kein eigenständiges Wort und muss daher abgeschnitten werden.

• Wenn ein halb ausgesprochenes Wort, ein eigenständiges Wort ist, bleibt es im Audio.
※Beispiel: "Ich suche das Sommer (fest)“
→Aus dem Kontext ergibt sich, dass es „Sommerfest“ hätte heißen sollen. „Sommer“ ist
aber auch allein ein eigenständiges Wort. Es kann im Audio bleiben und muss somit auch
transkribiert werden.

l) Homophon (gleich klingende Wörter):

• Hören Sie sich die ganze Audiodatei an (inklusive weißer Bereich) und entscheiden Sie
anhand des Kontextes welches Wort gemeint ist.
※Beispiel: seid vs. seit, das vs. dass.

• ※Beispiel 1: Im Ausschnitt der Audiodatei ist zu hören: „Hast du ein Opfer/Offer für
mich“? Außerhalb des Ausschnitts geht das Gesagte weiter „Ich will traden.“
→ Aus dem Kontext (trade = Handeln) kann man ableiten, dass am ehesten nach
„Offer“ (Angebot) gefragt wurde. Die richtige Transkription wäre in diesem Fall "Offer".

• Wenn es mehrere Homophone gibt, die in dem Kontext Sinn ergeben, sind alle richtig.
※Beispiel 2: Der Vorschnitt (Default Cut) der Datei lautet „ war/wahr Bruder“. Es gibt
keinen Kontext. Das Audio vor und hinter dem Vorschnitt ist vernuschelt.
→ Beide Wörter wären daher richtig.

m) Vereinfachte Form/gesprochene Sprache, die von der Standardaussprache abweicht

• Transkribieren Sie, was der Sprecher sagt. Korrigieren Sie keine Grammatikfehler.
※Beispiel 1: „Ich hab gesagt lass ma n bisschen schneller machen.“
→ Dieser Satz darf nicht als „Ich habe gesagt lass mal ein bisschen schneller
machen.“ transkribiert werden.

n) Akzente (auch schwache Ausprägung eines regionalen Dialekts)

• Transkribierten Sie was Sie hören (ich vs. ick, ich habe vs. habsch)

o) Schimpfwörter, Beleidigungen, schnelles Audio:

• Transkribieren Sie alles. Schreiben Sie alles aus. Schönen Sie nichts.
• Wenn das Audio zwar künstlich beschleunigt ist, aber dennoch verständlich, muss es
transkribiert werden.

p) Gedichte werden ganz normal transkribiert.

q) Doppelte Leerzeichen zwischen den Wörtern sind kein Problem.

r) Buchstabieren

• Wenn im Audio ein Wort buchstabiert wird, transkribieren Sie die einzelnen Buchstaben
als Großbuchstaben mit jeweils einem Leerzeichen dazwischen.
Beispiel: „U R L A U B“

3.4 Besondere Wörter


Siehe dazu die Tabelle „term alignment“

Das könnte Ihnen auch gefallen