Sie sind auf Seite 1von 8

Online-Suchinterfaces

für große deutschsprachige


Standardkorpora
Dr. M.О. Katamadze
Digitales Wörterbuch der deutschen Sprache
DWDS als Lexikon und als Korpusressource mit einer Wort-im-Kontext-
Ausgabe (KWIC) sowie mit verschiedenen statistischen Instrumenten nutzbar.
DWDS als Lexikon
Informationen:
• zur Grammatik des Worts (Wortart, Informationen zur Flexion, zu alternativen
Formen, zur Silbentrennung und morphologischen Zusammensetzung),
• zur Bedeutung (mit Wortdefinitionen, getrennt nach verschiedenen Lesarten bei
Polysemen und Homonymen),
• zur Etymologie (nach Pfeifer 1993),
• ein Wortfeld mit assoziierten Lexemen mit Beispielsätzen aus den
DWDSKorpora.
• Angaben zur relativen Worthäufigkeit anhand von Frequenzkurven (pro
Millionen Token im zugrunde liegenden Korpus) auf einer Zeitachse von ca.
1600 bis 2000 anzeigt.
Verlaufskurven zu Wörtern „gendergerecht“, „Flüchtlingskrise“

gendergerecht

Flüchtlingskrise
Wortverlaufskurven und deren linguistisch
relevante Analyse
• kollabieren
• konform
• die Mauer
• debattieren
• integrationsunwillig
• Gendervielfalt
• Gutmensch
• Frauenrecht
• Gleichberechtigung
• postfaktisch
DWDS als Korpusressource
• Suche nach Lemmata
Da DWDS in erster Linie als Lexikon konzipiert ist, sollen sämtliche Formen
eines Paradigmas zu demselben Eintrag führen. Deshalb sucht die Eingabe eines
Suchbegriffs wie Hund automatisch nach der Grundform und somit auch nach
flektierten Formen.

• Suche nach Wortformen


Will man eine bestimmte Form finden, so muss man der gesuchten Form ein @-
Zeichen voranstellen. Die Suche @Hundes findet also ausschließlich die Form
Hundes, einschließlich Groß- und Kleinschreibung.
DWDS als Korpusressource
• Suche nach Wortarten erfolgen mittels der Kategorien des STTS.
Diese werden ohne Anführungszeichen hinter den Ausdruck $p= gesetzt, der die
Suchvariable ›Wortart‹ spezifiziert. Die Suche $p=ADJA findet somit alle als
attributive Adjektive annotierten Einheiten im Korpus.

• Suchen mit regulären Ausdrücken werden wie folgt unterstützt:


Das Sternchen an den Rändern des Suchausdrucks drückt eine beliebige Zeichenkette
aus. Hierdurch werden nur dem Suchausdruck entsprechende Wortformen gefunden:
*wand
findet alle Wortformen, die auf -wand enden.
*igkeit
findet alle Wörter, die auf -igkeit enden.
DWDS als Korpusressource
• Suche nach Abfolgen
Direkte Abfolgen werden durch Nebeneinanderstellen verschiedener Suchelemente
ausgedrückt. Die gesamte Abfolgesuche wird in Anführungszeichen gesetzt. So findet der
Suchausdruck
$p=ART $p=ADJA $p=NN alle unmittelbaren Abfolgen von Artikelwörtern, Adjektiven und
Nomina.
Um einen Maximalabstand bzw. Abstandsbereich zu definieren, wird zwischen dem
präzedenten Ausdruck und dem nachfolgenden Element die maximale Anzahl von
dazwischenstehenden Elementen nach dem Rautenzeichen definiert:
@sein #3 Hund findet Folgen der Wortform sein und dem Lemma Hund, wobei bis zu drei
Elemente dazwischen stehen dürfen. Für den exakten Abstand wird zwischen Raute und Zahl
ein Gleichheitszeichen eingefügt; analog gilt dies für den Ausdruck »größer als« (">") und
»kleiner als« ("<").
Man kann auch die Anfrage präziser formulieren: @sein $p=ADJA #3 Hund