Sie sind auf Seite 1von 7

t!

654
Peteron I0I = G. E. Peterson: Parameters of
vowel quality. In: Journal of Speech and Hearing
Research 4. 1961, I0-29.
Schlesischer Sprachat/as, Band 1. I07= Schlesi
scher Sprachatlas. Hrsg. von Ludwig Erich
/
38. Statistische Datendarstellung
I . Aufgabe der Statistik innerhalb der Dialekto-
logie
2. Stihprobenerhebung
J. Mc|r|sicrun, SkaIIcrun,
4.
5. Varabilittsmessung
6. Klasskationvon Dialcktcn
7. Literatur (in Auswahl)
Aufgabe der Statistik innerhalb der
Dialektologie
Zu einem Teil besteht die Rolle der Statistik
in der Dialektologie in Zhlungen fr die
Herstellung von Orts- und Gebietsgrammati
ken oder Sprachkarten. Die hierfr erforder
lichen Kenntnisse in Statistik und graphi
scher Darstellung ihrer Ergebnisse liegen in
Lehrbchern vor (vgl. z. B. Weber 1972,
Hald 1967, Steel/Torrie 1960, Bosch 1976).
Der andere, bisher kleinere Teil statistischer
Aufgaben in der Dialektologie richtet sich
unmittelbarer auf das Ziel, Regularitten
bzw. Tendenzen in Bau und Funktion ihres
Gegenstandes festzustellen, um dadurch An
stze fr die Formulierung von Gesetzen
bzw. GesetzmBigkeiten zu fnden. Die Ent
wicklung stcht hicr jedoch erst am Anfang
cncsschtl dnvCn Yc2c.
Wegcncr (1880, 28) ist in diescm Zusammen
hang wohl nur ei n Vorlufer dieses Traditions-Ne
ben-Stroms mit seiner Empfehlung ,dem reichs
kanzler vorzuschlagen, im statistischen amte eine
abteilung fr ermittlung der dialectverhltnisse zu
grnden" (im Original gesperrt). hnlich sind Be
mhungen wie die von Doroszewski (1935), lvi
(1960-61), aber auch der Arealtypologie/Neolin
guistik oder der Phonometrie n ur wenig ber erste
Anstze hinausgekommen. Erstaunlich reichhaltig
sind dagegen die bisherigen Ergebnisse der jungen
Bemhungen schulorientierter, soziolinguistisch
beeinfluBter Dialektologen (vgl. Grundlagen
JHk /
V!.. Datenprsentatwn un d Ergeuntsdarstellung
Schmitt. Ban d I: Gnter Bellmann: La ut- und
Formenatlas. Unter Mitarbeit von Wolfgang
Putschke und Werner Veith. Marburg 1967.
Georg Heike, Ko/n
/` /;
1978). - Im Sinne der lange vermuteten Kontro
verse Wenkers mit den Junggrammatikern knnte
man zczcn 0u /rl, rbet/UUigkei ten aufzuhel
DcIc$ smzeD clVa D:<lOrI<CD-0Pyt-
cc |stzusteIIen I
Naumann I916, !5). Wcnn datmI Utllekto

ric niO auI Jo|uncniuri:cbc ici einren


zen wll, mu1 man k1ren, ob nich\ auch hr das
BcdngunrSEchrc Sprche Historie- Ocogra
phe Regelmligkeiten gelten. Regularititen sind
brigens ncht die Regeln der gTg; vgl. Goossens
1977, 13-16; 19 f., differenzierter Klein 1974.
Di e beiden folgenden Abschnitte 2. und
3. wenden einige berlegungen, die fr an
dere empirisch orientierte Disziplinen erar
beitet wurden, auf dialektologische Fragen
an; si e betreffen Datengewinnung un d Da
tenbeschreibung. Auswertungen solcher Da
ten mittels Ableitungen von Malen in den
Abschnitten 4 bis 6 sollen zeigen, wie einige
dialektologische Begriffe mit statistischen
Mitteln weiterentwickelt werden knnen.
hnlichkeitsmessung (vgl. 4.) und Klassif
kation (vgl. 6.) dienen zwar auch der Sprach
kartenherstellung. Darberhinaus kann aber
die Quantifzierung diese Begriffe (wie auch
die Variabilittsmessung, vgl. 5.) geeigneter
machen fr verbesserte Beschreibungen,
U. L. mit grlerer Abstraktheit, al s si e
bpruchlurIcn bictcn knnen, und damit ge
c:Rnetcr mt \ctvcichc und OIIcldlIOnrP,
letzten Endes a1so fr die Entdeckung von
Gesetzml3igkeiten. (Allgemeines bei Steg
mller 1970, Teil A; zur Dialektologie Goos
sens 1977, bes. 7-23)-Zur Demonstration
werden alle Rechnungen mit einfachen, fn
gierten Beispielen durchgefhrt.
2. Stichprobenerhebung
In der Dialektologie erfolgt die Stichproben
erhebung in mehreren Stufen und richtet
38. Statistische Datendarstellung
sich nach dem Zweck der Untersuchung:
(a) Zuerst mu1 man linguistische Einheiten
whlen, deren Reprsentanten im Dialekt
man ermitteln will. Bei einigen Methoden
entfllt dieses Problem, und es werden nur
die hufgsten Einheiten ermittelt, etwa bei
der Analyse von Gesprchen. (b) Wenn es
sich nicht um die spezielle Untersuchung ei
ner Ortschaf han deit, so m uB man eine Aus
wahl der Belegorte (Melpunkte) trefn.
(e) Innerhalb der Belegorte mul man lnfor
manten whlen, wobei man zustzlich meh
rere Attribute (Alter, Geschlecht, sozialer
Status, Textart u. a.) in Betracht ziehen kann.
(d) Nachdem die Erhebungsarbeit abge
schlossen ist und die Belege ggf. zu einem
Dialektatlas verarbeitet wurden, wertet man
di Daten aufrund ei n er W ahId er Atlaskar
n - n
uuu !! tuu\Illu u
(a) Oie Wuh! !nustsc!:cr !inhci/cn,
flls sie in einem Fragebogen eingehen sol
len, geschieht durch eine uutorilu|ive S!ich-
probe, di e ein Forscher aufgrurid sein er Aus
bildung und Kenntnisse bestimmt, und die
die 'wichtigen', 'typischen', 'hufgen' For
men (Lexeme, syntaktische Verbindungen
u. a.) enthlt. Anscheinend liefert diese Me
thode gute Resultate, aber die Wahrschein
Jichkeitstheorie ist nur in speziellen Fllen
anwendbar. Messungen an solchem Material
sollen nur dann durchgefhrt werden, wenn
diese Stichprobe grol genug ist und nicht
n ur. Einheiten ei n er Kategorie enthrt. -
Die Wahl der Ortschaften kann auf mehrere
Weisen durchgefhrt werden:
(b1) Eine einche zulige Stichprobe der
Ortschafen eines Gebietes (Goossens 1971)
oder Dialektes, wenn dieser vorlufig identi
fziert ist, erhlt m an z. B. folgendermalen:
(i) man numeriere die Ortschafen des Ge
bietes und whle dann die Zahlen mit Hilfe
der Tabelle der Zufallszahlen. So bekommt
man etwa das Resultat, wie in der Abb. J.J
dargestellt. (ii) E ine andere MglichkciI :
Man tc!c dus !cbic! in zwci gleichc Teile,
werfe eine Mnze und whle danach einen
Teil. Diesen teile man wieder in zwei Teile
und whle auf dieselbe Weise einen usw., bis
man auf ei ne Ortschaf kommt. Dann wie
derhole man die Prozedur solange, bis man
den notwendigen Stichprobenumfang der
Ortschaften hat. (iii) Eine dritte Mglichkeit:
Man versehe die Karte mit Koordinaten und
whle zufllig jeweils zwei Zahlen, die die
Koordinaten der Ortschaf angeben. - Fr
655
diese Methode ist es charakteristisch, dal al
le Ortschaften unabhngig voneinander ge
whlt werden und jede eine bekannte, nicht
unbedingt dieselbe Wahrscheinlichkeit hat,
in die Stichprobe zu gelangen. Sie kann so
wohl bei der Datenerhebung als auch bei der
Verarbeitung der Kartenbelege verwendet
werden.
(b2) Ei ne systematiche Stichprobe entsteht
so, dal man eine Ortschaf zufllig whlt
und alle anderen in gleichmligen Interval
len (quidistant) nebeneinander. Diese Me
thode liefert in der Dialektologie gute Resul
tate und wurde bei der Identifizierung der
Dialektgrenzen benutzt (Hndler /N a uman n
1976); vgl. Abb. 38.2. Problematisch dabei ist
der Umstand, dal man ein Netz von quidi
stanten Ortschafen kaum HndcI, dhcr mu{
man im allgemenen cn urbcrcs Rostcr ZU-
vIuucvcu

o



Abb. 38.1: Einfache Zufallsstichprobe der Ort
schaften
Abb. 38.2: Systematische Stichprobe von Ort
schafen
(b3) Eine geschichtete Stichprobe entsteht
so, dal man das Gebiet in gleiche Quadrate
aufteilt und innerhalb jedes Quadrats entwe
der eine oder mehrere Ortschafen zufllig
oder systematisch whlt; vgl. Abb. 38.3.
656


Abb. 38.3: Geschichtete (zufillige) Stichprobe von
Ortschaften
(b4) Eine zweistufge Stichprobe entsteht
so, dal man sowohl die Primreinheit als
au eh di e Sekundreinheit zufllig whlt. Di e
Primreinheit kann ein quadratisehes Teilge
biet bestimmter Grle sein, die Sekundr
einheiten sind die Ortsehaften. Eine solche
Stiehprobe wird in Abb. 38.4 dargestellt.


J
!
0
Abb. 38.4: Zweistufge Stichprobe von Ortschaf
ten
( e1) E ine dreistufge Stichprobe entsteht
so, dal m an in einer zweistufgen Stiehprobe
die Informanten aus den gewhlten Ort
sehaften zufllig erhebt. Die W ahi des lnfor
manten sollte immer zufllig sein, wenn kei
ne Faktoren wie Alter, Geschlecht usw. rele
vant sind, s. u. 3. Jedoch sollte man aueh bei
der Bereksiehtigung dieser Faktoren bei je
dem Merkmal die Zuflligkeit anstreben.
Welehes Verfahren zur Festlegung der Ort
sehaften auch verwendet wird, die Auswahl
der Informanten ist immer mindestens zwei-
stufg.
(e2) Eine Klumpenstichprobe entsteht so,
daB man nur wenige Ortsehaften whlt und
in diesen dann eine groBe zufllige oder sy
stematisehe Stiehprobe der Informanten er
hebt oder aueh alle Informanten untersueht.
Viele Erhebungen in der Dialektologie sind
von dieser Art, wobei sieh das Netz der Ort
sehaften allmihlieh verdichtet.
Vl. Datenprsentation und Ergebnisdarstellung
3. Metrisierung, Skalierung, Messung
Fr die Besehreibung der erhobenen Daten
sind die Beschreibungsbegrife sorgfltig zu
formulieren, da von einigen ihrer Eigen
sehafen das weitere statistische Vorgehen
abhngt. Fr die Einfaehheit der Beschrei
bung, aber aueh fr die Gte der erreiehba
ren Ergebnisse kommt es dabei auf mg
liehst weitghe!lde Metrisierung an. (Inwie
fern die Metrisierung zugleich genauer Do
kumentation und der Ermittlung von Ge
setzmBigkeiten dienen kann, zeigt allge
mein Stegmller 1970, 98-105.) - Man un
terscheidet vier SllenarleJ. d. h. vier Mg
lichkeiten, Bese.gsbegriffe so zu for
mulieren, daB ihr Gegenstandsbereieh teil
weise oder ganz auf die rationalen Zahlen
abgebildet werden kann. Unseharf formu
liert, knnen die Skalenarten wie folgt unter
sehieden werden: (a) Nomina/skala oder
klassifkatorisehe Begriffe: die erhobenen
D aten lassen si eh klassifzieren; () Rang
oder Ordinalskala oder komparative Begrif
Te:aiDaten lssen sieh auBerdem in eine
Reihe ordnen; (e) lntervallskala oder Mes
sung als intensive GrBen: au eh di e Abstn
de zwisehen den Daten sind aussagekrftig;
(d) Verhiltnis- oder Ratioskala oder Mes
sung als extensive GrBen: auBerdem be
steht ein Nullpunkt, und es lassen sieh Quo
tienten bilden.
Nur die beiden letztgenannten Flle wird
man umgangssprachlich als 'Messen mit ei
ner Skala' bezeiehnen. Da sie aber die bei
den anderen enthalten un d si eh insgesamt ei
ne vierteilige Aufstufung formulieren lBt,
ist diese _(rminologisehe Ausweitung des
MeBbegriffs slni1v1: ' lfarh dnaeh
auch-ein- Klassifizieren - z. B. Variante x ge
hort zu Dialekt a / zu Dialekt b - oder ein
Vergleiehen - z. B. Text y macht au einen
Beurteiler d en Eindruck grojerer Dialektizitit
a/s Text z - al s Messen bezeiehnen.
Zu einer verbreiteten Betonung des Unter
schieds von qualitativen und quantitativen Begr
fen: (a) Der Unterschied wird durch das Prinzip
der Aufstufung - die Eigenschaften jeder Skala
sind in den Eigenschaften der nchsten jeweils
enthalten - insbesondere durch die Existenz der
komparativen Begriffe aus dem scheinbaren Ge
gensatz in e ine sinnvolle Reihe berfhrt. (b) E ine
genauere Analyse zeigt, da1 sowohl qualitative
wie quantitative Begriffe eine sorgfltige Kon
struktion nach den noch zu nennenden Grundst
zen erfordern (vgl. z. B. Stegmller 1970,
138-152). - Die Tatsache, dal3 umfangreichere
dialektologische Datenmengen zunehmend mit
38. Statistische Datendarstelluno
Rechenanlagen bearbeitet werden, verstrkt die
Argumente fr eine Metrisierung nicht direkt.
Rechner erfordern zunchst Iediglich eine Opera
tionalisierung, auch unter Verwendung nicht-me
trischer Begriffe. Sie erlauben allerdings, metri
sierte Beschreibungen vergleichsweise bequem
weiterzuverarbeiten.
Beim gegenwrtigen Stand von Dialekto
logie und Linguistik ist die Mehrzahl der
verwendeten Skalen von niedrigem Niveau;
ob und wieweit Metrisierungen mglich
sind, ist erst in wenigen Bereiehen geprft
(allerdings lassen sieh z. T. Skalen ableiten,
vgl. dazu die nehsten Absehnitte). - Fr
diese Prfung gelten einige allgemeine Ge
sichtsunkte:
Reehtfertigen die empirisehen Befunde
das MeBniveau? - Knnen Gesetzmlig
keiten im Verhalten der zu messenden Ein
heiten vermutet werden? - Wie verhlt si eh
das MeJniveau zu vorhandenen Konventio
nen?- LBt sieh der Saehverhalt einfacher
formulieren?- Versprieht die gewhlte Be
grifliehkeit, fruehtbar zu werden? - Ist das
Melverfahren praktikabel? - Fr jede Ska
la sin d dann jeweils spezielle Fragen zu stel
len, um die angemessene Skalierung zu fn
den. Um eine weitgehende Metrisierung zu
erreiehen, mssen die Daten so (um)formu
liert werden, daJ alle Informationen, die
naeh den allgemeinen Gesiehtspunkten vor
handen sind, auch bereksiehtigt werden,
aber eben n ur diese.
Fr das obige Beispiel Variante x gehort
zu Dialekt a / zu Dialekt b, wre z. B. zu er
wgen: Sind a un d b disjunkte (nicht ber
lappende) Klassen? - Sind die Klassen ex
haustiv, decken sie also alle mgliehen Wer
te von x ab? - Knnte fr beliebige x1 und
x2 festgestellt werden, welches von beiden
eher zu a und weniger zu b gehrt? Wenn
dies nieht gesagt werden kann, aber Disjunk
tivitt und Exhaustivitt gelten, liegt eine
Nominalskala vor. Kann auch die letztere
Aussage gemaeht werden, Iiegt eine Rang
skala vor. - Knnte fr zwei beliebige Paa
re (x . x2) und (x3, x4) darberhinaus festge
stellt werden, welches auf einer Skala mit
den Polen Zugehrigkeit zu a und Zugeh
rigkeit zu b dichter zusammenliegt? In die
sem Fall wrde eine Interval/skala gelten. -
Fr das zweite Beispiel Schitzung des Dia
lektizititsunterschieds zweier Texte y und z
knnte z. B. folgendes erwogen werden (die
Verwendung einer Rangskala ist bereits
dureh die Aufgabenstellung vorgegeben, es
kann also nur noch um die Angemessenheit
657
einer Intervall- oder gar Verhltnisskala ge
hen): Kann der Dialektizittsvergleieh so
formuliert werden, daJ ein GrBenunter
schied zwischen der Dialektizittsdifferenz
innerhalb des Textpaars (Yo z1) und inner
halb des Textpaars (y2, z2) feststellbar ist? In
diesem Fali gilt Intervallniveau. - Ist eine
Aussage sinnvoll, in der zwei Dialektizitts
differenzen addiert un d mit einer dritten ver
glichen werden? Oder knnte man ber ir
gendeinen Text sagen, daB er gar keine Dia
lektizitt hat, z. B. weil er vllig hochspraeh
lieh ist? Beide Flle (fr sieh) konstituieren
Verhiltnisniveau.
Drei weitere, nicht fngierte Beispiele fr
Metrisierungsfragen seien noeh angefhrt:
(a) Metrisierung von distinktiven Lautmerk
malen. Fr Besehreibung und Vergleich von
Lauten/Phonemen kann die verbreitete Ein
schrnkung auf (binre) Klassifkationen zu
arm sein. Fr eine Skala 'Artikulationsort'
mit Rangniveau z. B. 'vorn - mitte - hin
ten' o d er vielleieht so g ar mit Intervallniveau,
z. B. fr den Vergleieh von solchen Reihen
mit untersehiedlichen Stufenzahlen, spre
chen versehiedene empirisehe Befunde,
Fruehtbarkeit und Einfachheitsberlegungen
(vgl. z. B. Gersi 1971, Ladefoged 1970,
1976, Lehfeldt 1978; vgl. aueh 4.2.).
(b) Metrisierte Dartelung von (Dia-)Sy
stemen. Die Sehwierigke ten eines phoneti
schen Systemvergleiehs, die in der Diskus
sion ber das Diasystem errtert wurden,
knnen vielleicht folgendermaBen gelst
werden: M an versueht nicht, di e Systemele
mente zu vergleichen (was wegen des histo
risch-etymologischen Interesses wohl nahe
lag), weil naeh streng strukturalistischen
Prinzipien Elemente eines Systems nicht mit
denen eines anderen vergleichbar sind. Viel
mehr besehreibt man die Charakteristika des
Systems als Ganzen (Altmann/Lehfeldt
1973; kartographische Vorformen dieses
Vorgehens bei Goossens 1969, 120; 123) und
vergleieht dann die so gewonnenen System
parameter (vgl. 4. 2. (l)).
(e) Bestimmung der Skalenfr ein Mehr
Variabeln-Modell dialektaler Variation.
Wenn man den Zusammenhang dialektaler
Variation mit anderen Faktoren darstellen
will, muB man fr jeden Faktor eine eigene
Skala aufstellen. Es ist blich, solche Skalen
als Dimensionen eines n-dimensionalen Hy
perwrfels oder Hyperraumes zu bezeich
nen. Goossens (1977, 8-12; vgl. auch Klein
1974, Putsehke 1974) hat folgende Faktoren
genannt: Sozialschieht (Goossens: diastrati-
658
sche Dimension) - Historie (diaphasische
Dimension) - Pragmatik/Stilistik ( diasitua
tive Dimension) - Geschlecht - Geogra
phie (diatopische Dimension) - Dialektizi
tt (Hochsprache-Dialekt-Skala, Goossens
1977, 9) -Sprachwillen ( = subjektives Dia
lektizittsurteil). Hiernach ist jede ,Sprech
weise" (Goossens 1977, bes. 7-23) vorzu
stellen als auf diesen sieben Skalen gemes
sen, sozusagen als Punkt in einem 7-dimen
sionalen WrfeL - Bildlieh fortgefahren,
bestnde die Metrisierungsaufgabe dann
weiter darin, die Kanten dieses Wrfels n
her zu bestimmen. Zur Bestimmung d er Ska
lenarten einige Argumente, die das Metrisie
rungsproblem weiter verdeutliehen sollen:
berhaupt die Dimensionen in sieh Rei
hI bild.el. (a!soRangskalen sild), ist ncht
1ur fr diatopishe Dimension zu pr
fen. Goossens (1977, 11) hlt die diatopisehe
renzierung generell fr zweidimensio
nal; ein Gegenbeispiel ist aber sein e eigene
Skizze der germaniseh-romanisehen Spraeh
grenze (vgL Goossens 1977, 47). Die einfaehe
Linearitt muB aueh fr die diasituative und
di e diastratisehe Dimension je nach dem Zu
sammenhang infrage gestellt werden: Reieht
z. B. 'formlos - frmlieh' als Ordnungsbe
griff fr einsehlgig relevante Situationsklas
sen?- Wie sollten auf einer Untersehieht
Obersehieht-Reihe Subkulturen von Jugend
liehen (Rocker vs. Gymnasiasten) eingeord
net werden? f\r die Skalierung. sin d zwei
Folgerungen zu erwgen: entweder Formu
lieng jeweils als Klassen, also Nominalni-
Vcau, oder Aufspaltung der Dimension in ei
Elene, allgemeiner einen Hyperraum,
:was dc Gesamt-Dimensionen-Zahl des Mo
dells erhhenwrde. - Auch bei der Fest
stelhrg der Skalenarten fr die anderen Di
mensionen ist sorgfltige Formulierung er
forderlieh: Soll die Historizitt von spraeh
gesehiehtliehen Fakten naeh Jahren inter
vallskaliert oder naeh Epoehen lediglieh
rangskaliert werden? - Beruht ei n Dialekti
zittsmaB auf Schtzungen, dann liegt zu
nehst eine Rangskala nahe, o d er auf Merk
malshufgkeiten (bei eventueller Gewieh
tung d er Merkmale ), dan n ist ei ne Intervall
skala, u. U. Verhltnisskala angezeigt.
4. hnlichkeitsmessung
Die Vorbereitung zur quantitativen Verar
beitung dialektologiseher Daten erfolgt
dureh die Erstellung einer Belegmatri, die
VL Datenprsentation und Er nisdarstellung
etwa folgendermaBen aussieht (vgL
Abb. 38.5).
X1 x, x, . . .
01 Xnt XJ2\ Xnt
o, X211 X221 x,"
o, X312 X322 X333
04 X412 X422 X432
Os Xsl3 Xs22 Xs32
Abb. 38.5: Belegmatrix
Hier bedeutet:
O; (i = I, 2, . , n)
Xi( = I, ?,- . . , r)
xjk (k = I,?,. . . , s)
die Ortschafen einer Land
schaft,
die einzelnen sprachlichen
Phnomene (bzw. Dialekt
karten mit einem Phno
men),
den k-ten Beleg (Typ) auf der
j-ten Karte fr die i-te Ort
schaft.
Weiter werden bezeichnet mit
l
x
ikl
die Hufgkeit des Belegs
(Typs) k auf der Karte j,
m
i
die Anzahl der Belege auf der
Karte j; wenn fr jede Ort
schaft nur en Beleg vorhan
den ist, so ist mi = n.
Die weitere Behandlung geht von einer idea
lisierten Situation aus, indem angenommen
wird, daB ein Dialekt bzw. die Spraehe einer
Ortsehaf einheitlieh ist. Notfalls lBt sieh ei
ne Unifzierung immer durehfhren. Beim
Vergleich zweier Dialekte geht es hier nur um
hnliehkeit oder Untersehied (prinzipiell
ebenso beim Vergleieh von Dialekt mit
Hoehspraehe). blicherweise beschrnkt
man sich dabei auf den phonetischen oder
den lexikalischen Bereich, aber prinzipiell
knnte man so viele hnlichkeitsarten un
tersuchen, wie man Aspekte zu ersinnen im
stande ist. Die nachfolgenden Ausfhrungen
besehrnken sieh ebenfalls auf diese beiden
Ebenen und zeigen mehrere Spielarten des
Vergleiehs.
4.1. Lexikalisehe hnliehkeit
Diese kann auf zwei Arten gemessen wer
den: (a) Hat man r Belege nur fr zwei Ort
sehaften O
;
und o,., so vergleieht man die
einander entspreehenden Belege und be
trachtet die Proportion der 'identisehen' Be
lege als das MaB der hnlichkeit der Dialek
te zweier Ortsehafen. Forma! ausgedrekt,
38. Statistische Datendarstellung
vergleieht man die Belege xiik und x,.
ik' und
defniert eine Funktion

. wenn k =k'
v(xuk x,.ik
'
) =
O wenn k = k'
so daB di e lexikalisehe hnliehkeit zwischen
O; un d o,. als
.
s (0
;, o,.) =-L v
(xijb X;jk')
r j= |
ausgedrekt werden kann. Aus der Abb. 38.5
ergibt sich z. B. fr 01 und 02 eine lexikali
sehe hnliehkeit von S(01. 02) = 2/3. Die
ses MaB wird blicherweise aueh dann ver
wendet, wenn man eine Matrix von mehre
ren Ortschaften zur V erfgung hat
(b) Die Messung unter (a) seheint jedoeh
etwas grob zu sein; man kann die bereits
vorhandenen Belege aueh gewichten und das
Gewicht fr die hnliehkeitsmessung ver
wenden. Man geht dabei von der berle
gung aus, daB ein Beleg, der nur in zwei Ort
sehafen vorkommt, fr ihre hnlichkeit ge
wiehtvoller ist, als ein soleher, der fast in al
Jen Ortsehaften vorkommt. Ein MaB dieser
Art bekommt man folgendermaBen (vgl. Alt
mann 1977):
Wenn der Beleg
xiik in der Ortsehaf O;
vorkam, dann ist die Wahrseheinliehkeit,
daB er in der Matrix am Belegort o,. aueh
vorkommt, gleieh
lxikl (lx.id-
P (x;'ik' x,i,) = ~
1 m
i m
i-
(2)
wobei lx-id/mi die relative Hufigkeit des Be
leges k auf der Karte j ist. Diese GrBe ist
desto kleiner, je kleiner die Hufigkeit des
Belegs k. Da das Gewieht desto grBer sein
soll, je kleiner lxikl, defniert m1n die hn
liehkeit zweier Ortsehaften O; un d o,. auf d er
Karte j als
sj (0
;
, o,.
) = . - !(xi'jk' xijk) < (k, k') (3)
wobei
<(k, k')= { ;
P (x;'ik' xiik)
wenn k= k'
wenn k = k' . (
4
)
Die Funktion < siehert lediglieh, daB bei un
gleiehen Belegen keine hnliehkeit bereeh
net wird, da fr k = k' gilt
si (O
,
, o,.
) = 1 -P (x,.jk', x,j k `
.
=1-1=0.
P (x;'ik' xiik)
659
Die Funktion < kann man weiter verfeinern,
wenn ntig (vgL 4.2 (e)). U m nun die hn
liehkeit aus allen Karten zu ermitteln, def
niert man das MaB der hnliehkeit zweier
Ortsehafen O, und o,. als
l '
s
(o,, o,.J =- L
s j (o,, o,.) (5 a)
r j> |
1 '
. P (x;'ik' X;ik) < (k, k') J (5 b)
r J= I

= --L P (x;'ik' X;ik) T(k, k') (5 e)
r J= |
Wre die Matrix in Abb. 38.5 auf 5 Ortschaf
ten und 3 Karten besehrnkt, so ergbe sieh
fr d en Vergleich von 01 und 02 di e hnlieh
keit folgendermaBen: Auf allen Karten ist
m= n = 5; auf der ersten Karte kommt x.
11
zweimal vor, daher ist
P(x.1,) = 2/5,
und dieser Beleg ist fr die beiden Ortschaf
ten gleieh, d. h.
2 .
P (x11 X1 =- -.
-
5 4
Auf der zweiten Karte haben wir denselben
Fali, whrend au f d er dritten Karte di e Bele
ge fr 01 un d 02 untersehiedlich sind. Daher
ist nach (5 b)
S(O . 02) = .. - :

-.)
=
5 4 15'
oder naeh (5 e)
S (01 02) = 1--
2 2

'
3 5 4 5 4
9
15
4.2. Phonetisehe hnlichkeit
Die Messung der phonetisehen hnlichkeit
bereitete sehon immer Schwierigkeiten. Es
gibt mehrere Anstze und Diskussionen
(vgL Afendras/Tzannes/Trpanier 1973,
Altmann 1969, Altmann/Lehfeldt 1980,
Austin 1957, Avram 1965-66, 1967 und
1972, Blaek 1970, Gersi 1971, Grimes/
Agard 1959, Heike 1961, Kloster-Jensen
1966, Kucera 1964, Kucera/Monroe
1968, 85 ff., Ladefoged 1970, Meyer-Eppler
1969,408f., Naumann 1976,151-155 und
1977, 199 f., Perebyjnis 1970, 66 f., Peterson/
660
Harary 1961, Saporta 1955, Tolstaja 1968,
Vinogradov 1966), aber die Probleme wur
den bisher nicht zufriedenstellend gelst. -
Man kann hier zwei Aspekte unterscheiden,
nmlich die synchrone und die diachrone
hnlichkeit von Dialekten.
(a) Synchron kann man einzelne Laute/
Phoneme nicht direkt vergleiehen, da man
dureh niehts begrnden kann, warum di e ge
gebenen Vergleiehe und nicht andere dureh
gefhrt wurden. Man m1te alle Phoneme/
Laute mit allen vergleiehen, wobei die Re
sultate ziemlieh verzerrt werden knnten.
Daher ist synchron nur der Verg1eich von
Charakteristiken des ganzen Systems sinn
voll, die in Form von Indiees, Vektoren,
Funktionen u. a. dargestellt werden. Ver
sehiedene Mgliehkeiten wie z. B. Gleiehm-
1igkeit der Merkmalsausnutzung, Entropie,
lexikalische Okonomie, Effektivitt und
Asymmetrie des Transkriptionskodes u. a.
fndet man bei Altmann/Lehfeldt 1979.
(b) Diachron zielt der Vergleieh im we
sentliehen auf phonetisehe Divergenz zweier
Dialekte oder auf die Variett eines Diasy
stems. Vergleieht man zwei Dialekte 01 und
02, so mul m an miteinander diejenigen Lau
te/Phoneme vergleiehen, die sieh etymolo
giseh entspreehen. Falls einem Laut in 01
zwei Laute in 02 entspreehen, so mssen bei
de Vergleiehe in die Bereehnung der Dif
renz eingehen. Man vergleieht selbstver
stndlieh nicht direkt die Laute, sondem ih
re Eigenschaften, die auf sehr untersehiedli
che Weisen defniert und gemessen werden
knnen. An einem knstlichen Beispiel soll
eine der vielen Mgliehkeiten illustriert wer
den. - Seien zwei verwandte Dialekte 01
un d 02 gegeben mit den Vokalinventaren
P1 ={a, e, i, o, u, d}
P2 ={a, e, i, o, u, , },
wobei folgende etymologisehen Entspre
ehungen bestehen:
_ _
a a


I I
o o
u u



Daher mul man z. B. nieht n ur e1 mit e2, son
dern auch O mit e2 vergleiehen, um die Di
vergenz festzustellen. Die Eigensehafen der
VJ. Datenprsentation und Ergebnisdarstellung
Vokale knnen z. B. naeh Ladefoged 1975
folgendermalen quantifziert werden:
a e i o u U
High 1 3 4 3 4 2 3 4
Ba ck I O O I I I O O
Round O O O I I O 1 |
Eine Spalte in dieser Matrix bezeichnet man
als den Vektor V(p) des Phonems/Lautes p
und defniert die Differenz zwisehen dem
Laut/Phonem p im Dialekt 01 und dem Pho
nem/Laut p' im Dialekt 02 als
D (p,, P) = IV' (p,)- V' (p)l (6)
wobei V' der Zeilenvektor und U der Ein
heitsvektor ist. Die senkrechten Linien be
deuten, dal alle Zahlen im resultierenden
Vektor im absoluten Wert (Betrag) zu sehrei
ben sind. So wre z. B.
V(i) = (4, O, O], V(u) = (4, 1, 1],
so dal
D(i, u2) = 1[4, O, O] [4, 1, 1JI [i]
= (0, 1, 1] [i] = 2.
O d er
D{;, e2) = 1(2, 1, O]- (3, O, OJI [i]
= [1, \, O] [ i] = 2,
d. h. (6) ist die Summe der Difrenzen ein
zelner Vektorelemente beider Phoneme/
Laute. Den Durchsehnitt aller solcher Ver
gleiehe kann man als das Maj der histori
schen (phonischen) Divergenz betrachten, for
mal
I

HD(0"02) =- L D(p"
p
,) (7
)
` I = |' p'2 = |
wobei der senkreehte Strich 'T die etymolo
gisehe Entspreehung bedeutet, n ist die An
zahl der Vergleiche, die gr1er sein kann als
!P d oder IP21 (Inventarumfang), weil ein Pho
nem/Laut mehrere Korrespondenzen haben
kann. In dem Beispiel wre
38. Statistische Datendarstell ..
l
HD (O, 02) = -(D (a,, a2) + D (e, e2)
9
+D (i, i2) +D (i1, u2)
+ D(o,o2) + D(o,2)
+ D (u1, u2) + D (u, 2)
+ D(e1,e2)J
l
= -(O + O + O + 2 + O
9
+ I+ 0+ 1 + 2) = 0,67 .
Male dieser Art sind leicht zu konstruieren,
aber mit Vorsieht zu gebrauehen und zu in
terpretieren (Lehfeldt 1978). Das Beispiel
soll nur als Illustration, nieht als Vorbild
dienen. Die Normierung der Vektorelemente
wre in jedem Fal! ratsam.
(e) Verfeinerung der lexikalschen
Ai
mlich
keit. In der Formel (4) haben wir eine Funk
tion < defniert, die den Wert l annahm,
wenn die verglichenen Belege zu einem Typ
gehrten. Mchte man aueh noeh die phoni
sche hnliehkeit in das Mal (5) einbauen, so
knnte man die Funktion < folgendermalen
defnieren:
{ S(W,W
,
)
<{k, k') =
1
P(xi'Jk', xiJk)
wenn k= k'
wenn k k'
(8)
wobei S(W, W2) die hnliehkeitsfunktion
fr zwei Wrter sein soi!. Diese Funktion
sollte so defniert werden, dal, je grler die
hnliehkeit, desto kleiner S(W, W2), und
die Funktion sollte Werte im Intervall (0, l)
annehmen. Dureh grole Ahnlichkeit wrde
P(x;'ik' X;jk) noeh mehr verringert. Weiter
mlte sie als eine Funktion aller Vergleiche
der sieh positionell entspreehenden Phone
me/Laute im Wort defniert werden. Befrie
digende Lsungen gibt es bisher nieht, so
dal lediglieh auf die Anstze von Gersi
(1971) und Naumann (1977) verwiesen wer
den kann.
. Variabilittsmessung
Absolute Idenititt von Phnomenen gibt es
nicht, es gibt lediglich partielle hnlichkei
ten von gewissen Standpunkten aus gesehen.
Daher mul3 man in der Dialektologie zwei
Arten von Variabilitten erfassen knnen:
die Variabilitt einzelner Spracherscheinun
gen, z. B. phonetische Variabilitt der Wr
ter, und die globale Variabilitt eines ldio-
661
lektes, einer Ortschaft, eines Dialekts, d. h.
die Variabilitt der Sprachtrger.
5.1. Spracheinheiten
Die Variabilitt der Spraeheinheiten oder,
allgemeiner, Spraeherscheinungen kann wie
derum qualitativ oder quantitativ gemessen
werden.
(a) Qualitative Variabiltt, z. B. phoneti
sche, bedeutet die phonetisehe Heterogenitt
einer Erseheinung, wobei der Unterschied
zwisehen den Varianten paarweise auf einer
geeigneten Skala gemessen wird und die Va
riabiltt sich als eine Funktion aller gemes
senen Differenzen (z. B. Durchschnitt) er
gibt. Hierbei mssen die einander entspre
ehenden Phoneme/Laute in Spraeheinheiten
verglichen werden, wobei auch der Unter
sehied Laut vs. 0, d. h. ,Laut" gegen ,kein
Laut", festgelegt werden mul. - Das Ver
fahren soi! an einem knstlichen Beispie/ il
lustriert werden: In einem Dialekt wurden
drei phonetische Formen des Wortes ABCD
gefunden (A, B, C, D sind die Laute des
Wortes), nmlich
I. abcd
2. a'be'd'
3. a"b'c' ,
wobei die kleinen Buchstaben die Laute der
einzelnen Wortvarianten bedeuten. Aus ei
ner Differenzfunktion stellt man z. B. folgen
de Lautdifferenzen fest:
D{a, a') =I
D{b, b') = 2
D(a,a") = 1,5
D(c, e') = 4
D(a', a") = 1,7
D(d, d') = 3
D (Laut, 0) = 5
Die Differenz des ersten und des zweiten Be
leges wird folgendermalen berechnet:
4
D(W,
W,)
= L D(p
l;
,p,;)
i|
=D{a,a') + D{b,b)
+ D(c,e') + D(d,d')
=1+0+4+3=8
wobei p1; den i-ten Laut des ersten Wortes
bedeutet. Ebenso ergibt sich
D(W, W3) = 1,5 + 2 + 4 + 5 = 12,5
D(W2, W3) = 1,7 + 2 +O+ 5 = 8,7
Die gesamte Variabilitt eines Wortes ist
dann zu defniren als
662
l
V (W L D (W1, Wj) (9)
ei . j
wobei e die Anzahl der Lautvergleiche ist.
In dem Beispiel ergibt sich
l
V(ABeD) =
}
(8 12, 5 8,7) 2, 6 .
Ist die Wortlnge L bei jedem Vergleich
identisch - was nicht der Fali sein mul,
wenn beispielsweise in zwei Varianten ein
Laut ausgefallen ist - so ergibt sich
IWI-
(IWI - 1)
e= L
2

wobei IWI die Zahl der verglichenen Wrter
(Belege) ist. In dem Beispiel war L 4 und
32
IWI 3, woraus e 4 -
2
- 12. Wenn
jedoch in zwei Varianten derselbe Laut fehlt,
so mul e anders abgezhlt werden; Rech
nungen dieser Art fndet man bei Gersi
1971.
(b) Quantitative Variabilitat. Bei dieser
Messung ist der qualitative Unterschied ein
zelner Varianten irrelevant, man zhlt nur
ab, wie of (in wie vielen Melpunkten) eine
Variante vorkommt. Es gibt bereits viele ge
eignete Male; hier soll fr die quantitative
Variabilitt einer Spracherscheinung die sog.
Wiederholungsrate benutzt werden
K
R= L p} (lO)
j=l
wobei K die Anzahl der unterschiedlichen
Varianten ist, pj f/n ist die relative Hu
fgkeit der Variante j, und n L ist di e
Anzahl aller Melpunkte. - Ein Beispiel:
Fr das Wort W wurden in 100 Melpunkten
5 Varianten W, bis W5 gefunden, und zwar
mit folgenden Hufgkeiten:
f(W1) = 24; f(W ) 30 ; f(W3) = 16;
f(W4) = 5; f(W5) = 25 .
Daraus ergibt sich die quantitative Variabili
tt des W ortes W als
24

2
30


16


R(W) =
100

100

100
5


25



100

100
2382
==0 2382 .
100
2

Dieser lndex bewegt sich im Intervall


(IIK; 1), und man kann ihn auch als Uni-
V!. Datenprsentation und Ergebnisdarstellung
zierungsdrang interpretieren. Je kleiner die
Variabilitt d er sprachlichen Einheit, d. h. j e
strker die Unifzierung verluf, desto gr
ler wird R. Die Unifzierung Ilt sich natr
lich auch mit Hilfe einer Wahrscheinlich
keitsverteilung oder einer Kurve modellie
ren, deren Parameter als eine Funktion des
Unifzierungsdrangs interpretiert werden
knnten.
5.2. Sprachtrger
Di e Variabilitt ist im allgemeinen desto gr
ler, je grler der Sprachtrger. So ist eine
ganze Sprachlandschaf sicherlich heteroge
ner als jeder Dialekt, der in ihr vorkommt,
und eine Ortschaf ist heterogener als ein
Idiolekt. Man kann hier beliebige Zwischen
stufen einbauen, es gil t immer, dal eine
Menge mindestens so heterogen ist wie ihre
Teilmengen. - Im weiteren soll nur die
quantitative Heterogenitt einer Sprachland
schaft betrachtet werden, da sich alle Resul
tate mutatis mutandis au f kleinere Einheiten
bertragen lassen.
Ausgehend von der Abb. 38.5 defnieren
wir mit Hilfe von (lO) das Maj der L-Homo
genitit al s
Ho m (Xj) f
x jk
)
2
k=l mj
S j
L
pf, (11)
k=l
Zu s wurde noch der Index j angefgt, weil
die Anzahl unterschiedlicher Belege s sowie
ihre Gesamtzahl m von Karte zu Karte j un
terschiedlich sein kann. So ergibt sich aus
Abb. 38.5 fr X,
Hom(X1)= -


m1 m1
m,

'


'
=036
Hier ist m1 n. Summiert man nun diesen
lndex fr alle sprachlichen Phnomene
j = 1, 2, . . . , r und dividiert durch di e Zahl
der Phnomene, so bekommt man ein Maj
d er (lexikalischen) Homogenitat einer Sprach
landschaft L als
Ho m (L) = - L L: pf,
-
L L
| J | 'j
!x
)

r j=t k=l r j=l k= j mj
Ein Beispiel soll nach Abb. 38.6 folgender
malen aussehen:
38. Statistische Datendarstellung
X X X X
o, X
l t X1 X13 l X.1
o, X 2l x,, X231 .
.
o, X312 X3
.
.
.
o. . .
.
.. ^
O
s Xs11 .

X 5 .
o. x1-
.

x6
07 X7. x
7
. ..
Abb. 38.6: Belegmatrix
Hier ergibt sich wegen mj = n 7
l
Ho m (L) [Hom (X j ) Ho m (X2)
5
Hom (X3) Hom (X.) Hom (X5)]

''
x

ll '

,
,
,
j


j
.



'
|
x
, |

+
|


.
+
'

'
x
: )

'
x
:
'
'
j |'
x
:

)


|
jx
:, |

.


|

.

2
|

)
|
'x
:
5

'x
:

'

'

'x
:
7'
, |

)
'

|
|

!
)
|)
|

|
|)

)


|`
)
|`
)
,

'
7
!
j
' |
= 0
.4857
X
s
X151
X2s1
XJ51
..
.


.
Umgekehrt kann man die Heterogenitit einer
Sprachlandschaft L als
Het (L) = 1 - Hom (L)
defnieren. In unserem Beispiel htten wir
Het (L) = l - 0,4857 = 0,5143.
(Vgl. dazu Ivis berlegungen zu einem
Mal d er Differenzierungsdichte; prinzipiell
identisch ist sein Mal fr ArealgrBe
l
663
(1960-61, 130-134 und 140 f). Ivi schlgt
vor, vorhandene Isoglossen auszuwerten,
was alle Probleme der Isoglossenfndung in
das Ergebnis eintrgt; vgl. auch Hndler/
Naumann 1976.) Der Index Hom(L) bewegt
sich im Intervall (1/max sj; 1), Het(L) im In
tervall (O; 1-1/max si) , wobei max si das
grBte s in der Belegmatrix ist.

Ein anderes MaB lBt sich folgenderma
Ben aufstellen. Sei
'j
'
j
x jk xjk
(Xj) -L Pjk !d pj, L -ld-
k=l k=l mj mj
(14)
das Maj d er E-Entropie der Spracheinheit X j
(einer Atlaslcarte) , wobei ld der Logarithmus
zur Basis 2 ist, dann ist
l ' 1 ' '
j
L H (XiJ =--L L pj, ld Pjk
fj=l fj=lk=l
(15)
das Maj der (lexikalischen) Entropie einer
Sprachlandscha L. Es ist einfach der
arithmetische Durchschnitt der E-Entropien
der Einheiten. Beispielsweise ergibt sich aus
der Abbildung 38.6 H(X1) folgendermalen
jx."J !x."
H(X1)=- -ld-+-ld-
m1 m1 m1 m,
!x.uJ jx.131 1x.,.1 .


-ld-
-ld-
m, m1 m1 m1

4 4 l l 1 1 l
'
=- -ld-

-ld-

-ld-

-ld-
7 7 7 7 7 7 7 7

ld
3 . 2Jd2
7 7 7 7
= -(0, 5714 ld 0,5714 3 (0, 1429) l d O, 1429]
=-(-0, 4614 -1,2031) 1,6645
Die Tabellen von Jd x fndet man z. B. bei
Meyer-Eppler (1969) oder man berechnet sie
mit Hilfe der Umformung
log
10 x
ld x = log2 x =-= 3, 3219Jog10x.
Jog102
Der Index H(Xi) bewegt sich im Intervall
(0, !d s). Fr die ganze Abbildung 38.6 ergibt
si eh (L) al s
l
(L) =-[H (X1) + H (X2) + H (X3)
5
( X.) + (X5)]
l
=
s
[l,6645 1, 1488 1, 5566
2, 8073 +O]= 1,4354
.l
\f

664
Da das Maximum von H(X;) =!d si ist,
kann man auch ein relativiertes Ma1 aufstel
len, nmlich
H,(Xi
) =H
l;
(16)

woraus die relative Entroie einer Sprach


landscha L sich als
l ' H(X)
H,e(L) =- i
_
1d
!
(17)
r i-l mi
ergibt. Ist mi fr al le Xi gleich, nmlich n, so
wird (17) zu
!
:
H,.1 (L) =-
d
- i H (Xi). (17 a)
r i n jl
In dem Beispiel ist mi = n = 7, so daf si eh
(17 a) als
1,43S4 1, 43S4
H 1(L)==-=0 Sl13
"
!d 7 2,8073 '
ergibt. H
"
1(L) bewegt sich im lntervall (0, 1).
. Klassifkation von Dialekten
Aufgrund der Distanzmessung zwischen den
Ortschafen lft sich auch eine Klassifka
tion der Ortschaften in dial ekthnliche Klas
sen durchfhren. Die Bedingung dafr ist
der paarweise Vergleich aller in Frage kom
menden Ortschafen. Die Klassikationsver
fahren sind heutzutage mechanisiert (vgl.
Steinhausen/Langer 1977) und lassen sich
leicht durchfhren, sind aber mit einigen
Gefahren verbunden. Sie hngen stark von
dem benutzten hnlichkeitsma1 ab, und je
der Algorithmus l iefert etwas andere Resul
tate. - Hier wird lediglich eine einfache Me
thode dargestellt, die sich bei einer kleineren
Menge von Daten auch ,mit der Hand"
durchfhren l ft und eine hierarchische
Ordnung der zu klassifzierenden Elemente
liefert; sie wird in Form eines Algorithmus
entwickelt. Andere Methoden findet man bei
Boek (1974).
Schritt 1. Man berechne die hnlichkei
ten von Dialekten bzw. Distanzen aller Ort
schafen, fr die Belege vorhanden sind. An
hand der Abbildung 38. 7 werden die einzel
nen Schritte il l ustriert. Unter Verwendung
des hnl ichkeitsmales (S) ergibt sich:
! 4 3
S (O> 02) = l-" (
S
+
!
+
. 2
+
. =o S8
5

Vl. Datenprsentation und Ergebnisdarstellung


S(0>03) =O
S (O> 04) = 0,3S usw.
x] x2
X. X

O; 711!
X I
X I!
X1 41
02 X 2
X222
X231 X241
03 XJ1 2
X323 X332
X342
o, X41 1
X.23 X432
Xo!
o, X 5l
x5 2J
X533 Xs42
06 x6 1 3
x623 x633 xs2
Abb. 38.7: Belegmatrix
Schritt 2. Al l e hnlichkeitswerte werden
in eine n X n syrmetrische Matrix eingetra
gen. In der Beispiel ergeben sich die Resul
tate wie in der Abbildung 38. 8 aufgefhrt:
o, 02
03 o, o, 06
OI
I 0,58 O 0, 35 0,15 O
Oz 0,58 I O 0,35 0,15 O
03 O 0 I 0,38 0, 35 0,35
o, 0,35 0,35 0,38 I 0,30 0,15
o, 0,15 0, 1 5 0,35 0,30 I 0,58

06 O O 0,35 0, 15 0,58 I
l
Abb. 38. 8: hnlichkeitsmatrix (unreduziert)
Schritt J. Man suche den gr1ten Wert in
der entstandenen Tabell e und zeichne die
beiden 01 s
.
zusammen. In der Beispiel ist
S (O 0
2
) = S (05, 06) = O, S8 der grfte
Wert, so daf ir ersten Durchgang das Bild
entsteht.
,
01 02
,.
o, 06
Schritt 1. Man fasse die beiden hnlich
sten 01 s in der Matrix zusammen und behal
te nur die jeweils niedrigeren Werte von bei
den. In dem Beispiel sind die Spalten und
Zeilen von 01 un d 02
gleich, so daB di e W er
te direkt zu bernehren sind, whrend bei
05 un d 06 fr S (04, 05 un d 06) = O, l S al s
der kleinere von 0,30 und 0, 1S bertragen
wird; zu oh 02 wird entsprechend o behal
ten. So entsteht Tabel l e 38.9.
o>o2 03 o, U.'-
o>oz ! O 0,35 O
03
O I 0,38 0,35
o, 0,35 0,38 I 0,15
o,, o6
O 0, 35 0, 15 1
Abb. 38.9: hnlichkeitsmatrix (!. Reduktion)
38. Statistische Datendarstellung
Schritt J. M an wiederhole Schritt 3 un d 4
solange, bis al le 01 s verbunden sin d. (Dieser
Algorithmus stammt von Johnson 1967.) Ir
zweiten Durchgang ist aus der Abb. 38. 9 die
grfte Zahl fr S (03, 94) = 0, 38 zu ersehen,
so daf die folgenden Ahnlichkeitsverhltnis
se entstehen:
I
01 02
,.
o, 06
l
03 o,
Die Zusamrenfassung von 03 und 04 ergibt
die Abbildung 38.10:
o> oz 03,04 o,;o, j
o>o2
l
I O
03, 04 O I 0,15
o,, o6 O 0, 15 I
Abb. 38. 10: hnlichkeitsmatrix (2. Reduktion)
Im l etzten Durchgang werden die Klassen
03, 04 mit 05, 06 verbunden, und man be
kommt
,-
OI 02
, -
o, 06 03 o,
Resultate wie dieses sind selten, meistens
sind alle Gruppen auf einer Ebene hher
al s O verbunden. In dem Beispiel wrde
man zwei Dialekte ansetzen, und zwar
D1 = (01 , 02) und D2 = (03, 04, 05, 06 ) . -
Im al l gemeinen Fal i muf man z. B. eine be
stimmte Ebene whlen, auf der man Grup
pen bildet. Im nchsten Bil d (Abb. 38.1 l)
wurden mit einer 'Abbruchkriterium' A drei
Klassen gebildet, mit B vier Klassen:
---- --------t----- ---
A
l
1
------t--- ...(
01 02 03 04 05 06 07 08
Abb. 38. 1 1: Dendrogramm
. Literatur (in Auswahl)
Afendras/Tzannes/Trpanier 1973 = E. A. Afen
dras/N. S. Tzannes/J. G. Trpanier: Distance, va
riation, an d change in phono1ogy: Stochastic
aspects. In: Folia Lingustica 6. 1973, 1-27.
66S
Altmann 1969= Gabrie1 Altmann: Differences
between phonemes. In: Phonetica 19. 1969,
118-132.
Altmann I977 = Gabriel Altmann: Zur hnlich
keitsmessung in d er Dia1ekto1ogie. In: Germani
stische Linguistik 3-4/1977, 305-310.
Altmann/Lehfe/dt 1973= Gabriel Altmann/Wer
ner Lehfe1dt: Allgemeine Sprachtypologie. Mn
chen 1973.
Altmann/Lehfeldt I979= Gabriel Altmann/Wer
ner Lehfeldt: Einfhrung in die quantitative Pho
nologie. 1980.
Austin 1957 = William M. Austin: Criteria for
phonetic similarity. In: Language 33. 1957,
538-544.
Avram 1965~66 =A. Avram: La classification
des phonemes se1on 1eur degr de parent. In: A e
ta Lingustica Hafniensia 9. 1 965-66, 173-178.
Avram 1967=A. Avram: Sur la distance entre
phonemes. Cahiers de linguistique thorique et
appliqu 4. 1967, 17-21.
Avram 197 = A. Avram: Sur la distance entre les
traits phono1ogiques distinctifs In: Cahiers de 1in
guistique thorique et applique 9. 1972,
171-175.
Berry/Baker I968= B. J. L. Berry/ A. M. Baker:
Geographic samp1ing. In: Spatia1 Ana1ysis. A
reader in statistica1 geography. Ed. by B. J. L. Ber
ry/D. F. Marble. Englewood Cliffs 1968, 91-100.
Black 1970=J. W. Black: Interphonemic distan
ces. In: Actes du X Congres Internationale des
Linguistes. Bd. III. Bucureti 1970, 265-278.
Boek 1974 = 1ans Hermann Boek: Automatische
Klassifkation. Theoretische und praktische Me
thoden zur Gruppierung und Strukturierung von
Daten (C1usteranalyse) Gttingen 1974.
Bosch 1976 = K. Bosch: Angewandte mathemati
sche Statistik. Reinbek 1976
Cochran 1956 = W. G. Cochran: Design and
analysis of samp1ing. In: Statistica1 methods. Ed.
by G. W. Snedecor. Ames 1956, 489-523.
Doroszewski |9J5 = W. Doroszewski: Pour une
reprsentation statistique des isoglosses. In: Buli e
tin de la societ de 1inguistique de Paris 36. 1935,
28-43.
Gersi 1971= S1avko Gersi: Mathematisch-stati
stische Untersuchungen zur phonetischen Variabi
litt am Beispie1 von Mundartaufnahmen aus der
Batschka. Gppingen 1971.
Goossens 1969 = Jan Goossens: Strukturelle
Sprachgeographie. Eine Einfhrung in Methodik
und Ergebnisse. Heidelberg 1969.
Goossens 1971 = Jan Goossens: Die Begrenzung
dialektologischer Problemgebiete. In: Zeitschrif
fr Dialekto1ogie und Linguistik 38. 1971,
129-144.
Goossens 1977 = Jan Goossens: Deutsche Dialek
tologie. Berlin. New York 1977.
Grimes/ Agard 1959=J. E. Grimes/F. B. Agard:
666
Linguistic divergence in Romance. In: Language
35. 1959, 588-604.
Grundlagen I978= Grundlagen einer dialektori
entierten Sprachdidaktik. Hrsg. v. Ulrich Am
r non/Ulrich Knoop/lngulf Radtke. Weinheim.
Base! 1978.
Ha/d I967 = A. Hald: Statistical Theory with en
gineering applications. New York 7. Aufl. 1 967.
Hindler/Naumann I976= Harald Hndler/Carl
Ludwig Naumann: Zur Automatisierung der Iso
glossenfndung. In: Germanistische Lingustik
3 -4/1 976, 1 23 -1 59.
Heike I96I= G. Heike: Das phonologische Sy
stem des Deutschen als binres Distiktionssystem.
In: Phonetica 6. 1 961 , 162-176.
lvi I960~6I= Pavle lvi: Osnovni aspekti
strukture dijalekatske diferencijacija. In: Make
donski Jazik 1 1 -1 2. 1960-61 , 82-1 03. Zitiert
na eh der deutschen bersetzung: Grundlegende
Aspekte der Struktur der Dialektdifferenzierung.
In: Zur Theorie des Dialekts. Hrsg. von Joachim
Gschel/Norbert Nail/Gaston van der Elst. (Zeit
schrift fr Dialektologie und Linguistik, Beih.
N. F. 1 6) 1976, 127 -1 5 1 .
Johnson I967 = Steven L. Johnson: Hierarchical
clustering schemes. In: Psychometrika 32. 1 967,
241 -254.
Klein I974= Wolfgang Klein: Variation in der
Sprache. Kronberg 1 974.
Kloster-Jensen I966= M. Kloster-Jensen: L'ide
de resemblance phontique. In: Cahiers de lin
guistique thorique et applique 3. 1 966, 91 -97.
Kucera I964 = H. Kucra: Statistical determina
tion of isotopy. In: Proceedings of the Ninth In
temational Congress of Linguists. The Hague
1 964. 7 1 3-721 .
Kucera/Monroe I968 = H. Kucera/G. K. Mon
roe: A comparative quantitative phonology of
Russian, Czech, and German. New York 1 968.
Ladefoged I970 = Peter Ladefoged: The measure
ment of phonetic similarity. In: Statistical meth
ods in Linguistics 6. 1 970, 23 -32.
Ladefoged I975= Peter Ladefoged: A course in
phonetics. New York 1975.
Lehfeldt I978 = Wemer Lehfeldt: Zur Messung
der phonetischen Lautdifferenz. Eine begriffskriti
sche Untersuchung. In: Glottometrika I. Ed. by
G. Altmann. Bochum 1 978. 26-45.
Meyer-Epp/er I969= Wemer Meyer-Eppler :
Grundlagen und Anwendungen der Informations
theorie. Berln 2. Aufl. 1 969.
Naumann I976= Carl Ludwig Naumann:
Grundzge der Sprachkartographie un d ihrer Au-
V!. Datenprsentation uud Ergebnisdarstellung
tomatisierung. = Germanistische Linguistik.
1 -2/1 976.
Naumann I977= Naumann, Carl Ludwig: Klas
sifkation in der automatischen Sprachkartogra
phie. In: Gerranistische Linguistik 3 -4/1977.
1 8 1 -21 0.
Perebyjnis I970 = V. S. Perebyjnis: Kil'kisni t a ja
kisni charakterystyky systemy fonem sucasnoji
ukrajins'koji literatumoji movy. Kyjiv 1970.
Peterson/Harary I96I= G. E. Peterson/F. Hara
ry: Foundation of phoneric theory. In: Structure
of Language and its mathematical aspects. Ed. by
R. Jacobson. Providence 1 961 . 1 39-1 65.
Putschke I974 = Wolfgang Putschke: Dialektolo
gie. In: Grundzge d er Literatur- un d Sprachwis
senschaft. Hrsg. v. Heinz L. Amold/Volker Sine
mus. Bd. 2: Sprachwissenschaf. Mnchen 1 974.
328-369.
Saporta I955 = S. Saporta: Frequency of conso
nant clusters. In: Language 3 1 . 1955, 25-30.
Steel/Torrie I960= R. G. D. Steel/J. H. Torrie:
Principles and Procedures of Statistics. New York
1 960.
Stegmller I970= W. Stegmller: Theorie und
Erfahrung. Probleme und Resultate der Wissen
schaftstheorie und Analytischen Philosophie.
Bd. . Berln 1 970.
Steinhausen/Langer I977 = Dieter Steinhausen/
Klaus Langer: Clusteranalyse. Einfhrung in Me
thoden und Verfahren der automatischen Klassif
kation. Berln 1 977.
Stenger I97I= Horst Stenger: Stichprobentheo
rie. Wrzburg. Wien 1 97 1 .
Tolstaja I968 = S. M. Tolstaja: Fonologiceskoje
rasstojanije i socetajemost soglasnych v slavjans
kich jazykach. In: Voprosy Jazykoznanija 3. 1968,
66-8 1 .
Vinogradov I966 = V. A. Vinogradov: N ekotoryje
voprosy teorii fonologiceskich oppozicij i nejtrali
zacij. In: Problemy lingvisticeskogo analiza.
Moskva 1 966. 3 -25.
Weber I972 = Ema Weber: Grundril der Biolo
gischen Statistik. Stuttgart 7. Auf. 1 972.
Wegener I880 = Philipp Wegener: ber deutsche
Dialectforschung. In: Zeitschrif fr Deutsche Phi
lologie 1 1 . 1 880. 450-480. Zitiert nach dem Ab
druck in: Zur Theorie des Dialekts. Hrsg. von Joa
chim Gschel/Norbert Nail/Gaston van der Elst.
(Zeitschrif fr Dialektologie und Linguistik, Beih.
N. F. 1 6) 1 976, 1 -29.
Gabriel Altmann, Bochum
Carl Ludwig Naumann, Aachen
39. Kartographische Dater.-rstellung
39. Kartographische Datendarstellung
I . Zur Rolle der Kartographie in der Dialekto-
logie
2. Entwicklungsstand
3. Kartentypen
4. Kartenzwecke
5. Erhebungsergebnisse
6. Klassifikation
7. Symbolisierung
8. 'Isoglossen'
9. Perspektiven
1 0. Literatur (in Auswahl)
I . Zur Rolle der Kartographie in der
Dialektologie
Dialektkarten dienen der Dokumentation
von dialektologischen Fakten zum Zweck
der geographi sch-synoptischen Veranschau
l i chung dial ektgeographi scher Hypothesen
(ber Raumstrukturen, Deutungen, ete.). Die
Dialektkarte ist also ein Dokumentations
und Forschungsmittel. Di e Dial ektkartogra
phie stellt die Methoden zur Herstellung, Be
nutzung und Beurteil ung von Di al ektkarten
bereit. Di e Unterordnung der Dial ektkarto
graphi e unter die Di al ektgeographi e folgt
daraus, daf di e Dialektgeographi e auch ber
andere Werkzeuge verfgt, wi e z. B. di e Sta
tistik. (Ferner l i egt ei ne Unterordnung der
Di alektgeographi e unter die Dialektologi e
zunchst i m Objektbereich begrndet ; hier
mssen aufer den geographischen Aspekten
der Linguistik hi storische, soziale und psy
chische beachtet werden - was dann metho
dische Folgen hat.) Verbreitete Unklarheiten
ber Aufgaben und Abgrenzungen der Dia
lektkartographi e (Freudenberg 1 965, 1 7 6;
Lfl er 197 4, 32) knnen aus d en konkreten
Arbeitsbedi ngungen erklrt werden : Di e
Herstellung von Di alektkarten erfordert ne
ben der Erhebung den grften Arbeitsauf
wand i nnerhalb der Di alektgeographie. Di e
ser Aufwand steigert si ch bei Atl anten paral
l el zur Vergrferung von Erhebungsnetz
und Problembereich ; di e Steigerung geht
aber schnell ber die Paral l el itt hi naus,
wenn das Vorhaben ni cht von einem einzel
nen oder wenigen glei chzeitigen Bearbeiter
bewltigt werden kann, da Fakten- und Me
thodenkenntnisse explizit kommuni zi ert
werden mssen (vgl. Wiegand/Harras 1 97 1 ,
1 0-34). Jahrzehntelange Bearbeitungen und
Abbrche si nd daher i n der Geschi chte der
Di al ektkartographi e ni cht sehr selten. - Es
erstaunt auch ni cht, daf bei sol chen An-
667
strengungen si ch i mmer wieder die Unter
scheidung der Dialektkartographie von der
Di alektgeographi e und di e der Di alektgeo
graphie von der Dialektologie verwischt ha
ben, weil die Krfe fr Auswertungen n a eh
der Kar t e ni cht mehr reichten. Dal der
Zeichentisch zum Denkhorizont wird, l i egt
zunchst ni eh t nher o d er ferner wie en t
sprechende Beschrnkungen bei anderen
materialintensiven empi rischen Arbeiten.
Die Karte erweckt aber aulerdem mit ihren
graphischen Elementen wi e Symbolen und
Lini en in besonderer Wei se einen Schei n
von Konkretheit, der di e i hr vorausgehenden
Prozesse der Auswahl und Interpretation der
Daten (vgl . 3. ) sowie di e i nterpretativen An
teile des Karten-' Lesens' verdunkeln kann,
wei l s i e unmittelbarer wahrgenommen wird
als Texte oder Zahl en. - Dementsprechend
werden h i er u. a. Ziele un d Zwecke von Kar
te und Kartographie zu zeigen sein, damit
ihr Ste/lenwerl deutlicher wird. Ferner muf
auch bei der Darstellung des Kartierungs
vorgangs marki ert werden, wie er eine Aus
wahl , Deutung und Wertung der Fakten
fordert.
2. Entwi cklungsstand
2. 1 . Allgemeine Aspekte
Auch fr di e historische Entwicklung der
Dial ektkartographie wre der Bezug auf die
Arbeitsbedingungen von Dialektkartogra
phen ntzl i ch, um den derzeitigen Stand re
flektierter z u bestimmen ; h i er knnen nu r
Aspekte angedeutet werden. Neben den
obengenannten allgemeinen oder ' i nneren'
Bedi ngungsfaktoren sind Einflsse der wis
senschafl ich-i nstitutionellen Arbeitsbedin
gungen zu beachten - z. B. Identifkati on
von Dial ektkartographie und Dialektol ogi e
auch deswegen, weil hi er ei ne genui ne Me
thode Autonomi e zu begrnden versprach.
Daneben Ei nfsse der allgemeineren Wis
senschaftsgeschichte - nach der i nneren
Gesetzl i chkeit multe der empirische Ansatz
von kleinen zu grolen Stichproben, also von
Karten zu Atl anten, fhren (vgl. Wiegand/
Harras 1 97 1 ) - und mlte in kartographi
sche Synthese mnden (vgl. 4.2.) ; die Kon
frontation mi t dem Struktural i smus fhrte
zunchst wegen der Komplexitt beider Be
reiche zu wechselseiti ger lgnoranz und nur
weni gen Karten. Ferner si nd zu erwgen al ! -