Sie sind auf Seite 1von 47

Akustik

Allgemeines. zum Schall

A.)1.) Schallfeldgrößen
2.) Elektroakustische Wandlerprinzipien
3.) Schallaufzeichnungsverfahren

Sprachakustik

B.)...

Lit.:

1.Peter Zastrow, Phonotechnik, Frankfurter Fachverlag, 3. Auflage, 1984


2.Thomsen, Digitale Audiotechnik, Franzis, 1983
3.Funk und Ton, Verlag für Radio- und Kiontechnik, 1953
4.Franz, Elektroakustik, Franzis, 1990
5.Bernhard Krieg, Tonaufzeichnung Analog, elektor, 1989
6.Gernot Winkler, Tonaufzeichnung Digital, elektor, 1990
7.Richter, Radiotechnik für Alle, 1967
8.Funktechnik ohne Ballast, Franzis, 11. Auflage, 1971
9.CD-Player und R-Dat-Recorder, Vogel, 1. Aufl. 1988

Zum Geleit:
Die vorliegende kleine Abhandlung (zunächst mit Word Perfect 5.0 erstellt)
behandelt interessante Aspekte von Aufnahme- und Wiedergabegeräten, diente
für die Vorbereitung des Verfassers für die mündliche Diplomprüfung im Jahre
1993 im Fach Akustik an der Fachhochschule Frankfurt Main bei Professor
Timme, und basiert stellenweise auf Mitschriften seiner gleichnamigen
Vorlesung.

Die Abhandlung über den Vokaltrakt stammt aus einer Zeitschrift Funk und Ton,
der Sammlung von Herrn Professor Schachenmaier, von denen der Verfasser
einige Jahrgänge retten konnte.

Es würde mich freuen, wenn der geneigte Leser ein paar Anregungen finden
würde. Wie immer, kann man sicherlich noch einiges verbessern.
© Roger Wolf

Schallfeldgrößen
Das Schallfeld ist der von den Schallwellen durchsetze Raum. Er hat keine
definierten Grenzen.

Schall16Hz ≤ f ≤ 20KHzhörbarer Bereich


f ≤ 16Hz Infraschall
f ≥ 20Khz Ultraschall

Der Unterschied zwischen Schallwellen und Elektromagnetischen Wellen be-


steht darin, daß sich Schall nur in einem Medium ausbreiten kann, E-Wellen
jedoch auch im Vakuum. Außerdem muß das Medium komprimierbar sein
vorstellbar über die Federgesetze der Mechanik.

Schall sind longitudinal WellenE-Wellen sind transversal


(länglich) (seitlich)

E- und H-Vektor stehen senkrecht zur Aus-


breitungsrichtung und bilden ein Kreuzpro-
dukt

Die Luftteilchen vollführen eine Pendelbewegung, das Medium bleibt ortsfest.

Unterscheide: Schallschnelle v ! = Schallgeschwindigkeit.

Außerdem ist der Schalldruck p parallel bzw. antiparallel zur Ausbreitungsrich-


tung (Vz-Änderung)

Def.:
Schallschnellev=Augenblicksgeschwindigkeit des Teilchens im
Schallfeld

v = v0 · cos ωt [m/s]wobei v0= Ampl. der Schallschnelle (konst)

Schalldruck p=Augenblicksdruck an einer bestimmten Stelle es Schall-


feldes

p = p0 · cos ωt [μbar] = [N/m2] 1μbar=0.1 N/m2

Schockwellen: Sie können nur entstehen, wenn das Medium an einer Stelle
extrem komprimiert wird, gleichbedeutend mit einer Sprungfunktion entsteht.
Es enstehen Oberwellen. Es liegt eine nichtlineare Kennlinie vor.
Die Resonanzkatastrophe setzt bei der Grenze der Elastizität ein.

Schallgeschwindigkeit c: Geschwindigkeit, mit der sich die Schallwelle aus-


breitet. cLuft ≈ 340 m/scWasser ≈ 1435 m/scFe ≈ 5000 m/s
(je weicher das Medium, desto geringer die Schallgeschwindigkeit.)

Warum ist v0 ! =c ?Stoßmodell muß ersetzt werden, durch Fernwirkungsmodell.


"Schall scheint sich selbst zu überholen."
Schon vor dem Stoß weicht das Teilchen aus.
Es liegen Abstoßungskräfte der e-Hüllen vor.

callg. = λ · f μ·ε = 1/c2Licht wobei


λ = Wellenlänge
f = Frequenz

@1Khz → λLuft = 34 cm

Zur Polarisation

Merke:Es gibt keinen polarisierten Schall.


Schall ist unpolarisiert

Weißes Licht ist unpolarisiert


Reflektiertes Licht (z.B. an Wasser) ist polarisiert

Bewertung des Schalls über die Schallintensität I [W/m2]

I = Schallleistung pro Fläche


I = P/A[W/m2]P = Energie pro Zeit

→I = E / (A·t) dabei ist E die Energie im Schallfeld,


mit E = Epot+Ekin (Beispiel mit dem Pendel)

Bei (fiktiver) Phasensynchronisierung aller Teilchen gilt an einem Zeitpunkt:


E = Ekin= ½· m ·v02 mit m = h·V V=Volumen des betrachteten Schall-
feldausschnittes
damit lautet die Schallintensität I

wobei
(1) h=Höhe V=Volumen A =Fläche
des Schallfeldausschnittes
t =Zeit und v0 =Schallschnelle ist.
Betrachten wir das Volumen des Schallfeldes als Säule mit
V=A·h und aus c = h / t => t = h / c so wird nach einsetzen in (1)

(2) wobei
h= Höhe des Schallfeldauschnittes
v0= Amplitude der Schallschnelle

Dabei wird die Schallintensität I größer, je dichter das Medium ist.

Anm.: Die obige Formel ist sehr theoretisch, da sich die Schallschnelle v0
schlecht feststellen läßt (z.B. durch die Raleigh’sche Scheibe) und der Schall-
druck p überhaupt außen vor bleibt.

In der Praxis wird für die Schallintensität folgende Formel eingesetzt

wobei
(3) p0=Amplitude des Schalldruck
h =Höhe des Schallfeldausschnittes
c =Schallgeschwindigkeit
Akustische dB-Skala

dB=10· log10 (Ix/I0) wobei


I0= 10-12 W/m2
= untere Hörschwelle @1KHz
Ix= vorliegender Wert der Schallintensität

Phon = 10· log10 (I(f) /I0 (f))hier ist die Schallintensität von der Frequenz abhänig
und wird aus der Hörkurve entnommen

dB(A) = 10· log10 (Ix/I0)wobei


Ix der gefilterte A-Kurvenwert ist
I0 = 10-12 W/m2

Anm.:
die Kurve des dB(A) Bewertungsfilters ist die invertierte (d.h. nach oben
geklappte) Hörkurve des Menschen. Allerdings wird die Kurve natürlich grob
vereinfacht um die Filterordnung klein zu halten. Im Bereich von 1..2KHz ist
Phon≈dB

Prinzip der Schallwandler


Das Mikrophon

Die Aufgabe des Mikrophons besteht darin, die von einer Schallquelle, z. B.
einem Musikinstrument oder der menschlichen Stimme, herrührenden Schall-
schwingungen in elektrische Spannungen zu verwandeln. Die Umkehrung ist
der Lautsprecher. Aber nur die meisten oder einige Verfahren sind umkehrbar.

0.) Kohlekörner-Mikrophon
Nachteile:Die Widerstandserhöhung, die unter dem Einfluß der Schallwellen
zwischen den Köhlekörnern auftritt, folgt nur teilweise oder ungenau den
Feinheiten der Tonkurve. Unter Umständen werden bestimmte Frequenzen
benachteiligt, andere wieder bevorzugt. Es kann sogar so weit kommen, daß
neue Frequenzen erzeugt werden, die in den Schallwellen überhaupt fehlen. Wir
wollen jedoch eine möglichst naturgetreue Umformung des Schalls in
elektrische Spannungen. Dieser Forderung widersetzt sich das Kohlekörner-
Mikrophon. Allerdings kann mit hohen Spannungen und ohne Zwischenver-
stärkung gearbeitet werden, was für die Anwendung in der frühen Telefonie ein
Vorteil war.

1.)Elektrodynamisches Prinzip
Es funktioniert als Mikrophon und Laustsprecher. Die Spule bewegt sich in
einem Dauermagnetfeld. Nach dem Induktionsgesetz wirkt eine Gegenspannung

2.)Elektromagnetisches Prinzip
Zum Aufbau:
Über einem U-Magnet ist eine ferromagnetische Platte in einem gewissen
Abstand (Luftspalt = mag. Wid.) angeordnet. Auf den einen Polschuh des
Magneten ist eine Spule aufgewickelt. Im Kreis liegt durch den Dauermagneten
eine magnetische Vorspannung an. der Dynamikbereich ist von diesem Offset
bis zur Abszissen-Achse gegeben. Bei Übersteuerung werden die Bereiche an
der Abszissen-Achse umgeklappt bzw. gespiegelt welches einem Gleichrichter-
effekt entspricht. Das äußert sich in Klirrfaktor, da nach der Fourierzerlegung
neue Frequenzen hinzugekommen sind.
Der Dauermagnet ist notwendig, sonst würde sich die doppelte Frequenz
ausbilden.

Der Unterschied zwischen dem elektrodynamischen und dem elektromagne-


tischen Prinzip besteht darin, daß beim eĺ dynamischen Prinzip die Spule be-
wegt wird und beim eĺmagnetischen Prinzip die Spule im Magnetfeld unbewegt
bleibt.

3.)Kondensatorprinzip
Zum Aufbau:
Es besteht aus einer festen Platte A und einer sehr dünnen leicht durchbiegbaren
Membran B, die in geringem Abstand der Platte A gegenübersteht. Beide Platten
sind durch Zwischenstücke C voneinander isoliert. Man verbindet nun die Platte
B mit einem Wid. R, dessen unteres Ende an dem einen Pol einer Gleich-
stromquelle U liegt. Der andere Pol dieser Stromquelle ist mit der Platte A
verbunden. Die beiden Platten A und B bilden zusammen einen Kondensator,
der von der Stromquelle U über den Widerstand R aufgeladen wird.
Treffen nun Schallschwingungen auf die dünne Membran B, so beginnt diese
mehr oder weniger stark zu schwingen und folgt dem Amplitudenverlauf des
Musiksignals. Dies ist gleichbedeutend mit kleinen Änderungen des Abstandes
zwischen B und A, so daß sich die Kapazität des Kondensators im Rhythmus
der Schallwellen ändert. Die kleinen Kapazitätsschwankungen führen natürlich
auch zu Stromschwankungen im Ladekreis und damit zu Span-
nungsschwankungen am Widerstand R. Wird beispielsweise die Kapazität in
einem kleinen Zeitaugenblick durch Verkleinern des Abstandes zwischen A und
B vergrößert, muß die Stromquelle U e- in die jetzt größere Kapazität liefern.
Wir die Kapazität in einem best. Zeitpunkt kleiner, so fließt ein Teil der e- in
umgekehrter Richtung zur Stromquelle zurück. Die Vibrationen der Membran B
erzeugen also letzten Endes einen Wechselstrom und damit einen Wechsel-
spannungsabfall im Widerstand R, der genau dem zeitlichen Verlauf der auf die
Membran B treffenden Schallschwingung entspricht. Will man die an R auf-
tretende Gleichspannung vollkommen ausschalten, so kann man einen Koppel-
kondensator vorsehen, der nur die Wechselspannung durchläßt.
Die vom Kondensatormikrofon gelieferte Wechselspannung spiegelt sehr ver-
zerrungsfrei den Kurvenverlauf der Schallschwingung wider. Außerdem ist die
abgegebene Wechselspannung an R in weiten Grenzen von der Frequenz der
Schallwellen unabhänig. Allerdings ist die vom Kondensatormikrophon
gelieferte Wechselspannung außerordentlich klein. Damit muß der Widerstand
R groß sein, was große Empfindlichkeit gegenüber Einstreuungen bewirkt und
somit kurze Leitungsführung erfordert, da die eingestreute Spannung von R die
Möglichkeit verbietet, kurzgeschlossen zu werden.

Die Gleichung C = ε0 εr · A/d ist nichtlinear. Die Größe d ist eine hyperbolische
Funktion der Form y = 1/x. Die Ladung ändert sich auch Q = C·U=

- Kondensatorprinzip als Lautsprecher

Bei der Verwendung als Lautsprecher brauche ich große Flächen und großen
DC-Offset (hohe Betriebspannung) über den dann die Wechselspannung mit
ausreichender Dynamik schwingen kann. Durch die große Fläche entsteht einen
relativ linearer Zusammenhang.

5.) Elektretprinzip
eine spezialbehandelte Teflonfolie behält durch starke Erhitzung eine elek-
trische Vorspannung oder polarisierte (eingefrorene) Ladung. Auf der Oberseite
liegt mehr positive Ladung, auf der Unterseite mehr negative Ladung. Teflon
hat keine freien Elektronen (Isolator).

Diese Folie wird nun zwischen zwei metallische Platten gebracht, die Elek-
tronen leiten können und von der Folie influenziert werden. Damit ist keine
Versorgungsspannung nötig. Hier bleibt Q konstant Q= = C∼ · U∼ . Es ändert
sich die Kapazität.

Zum Abhören ein geringfügig überdimensioniertes Elektretmikrophon ver-


wenden, daß sich über das Schallfeld versorgt, um das Nachfüllen der Batterien
zu umgehen.

Der Elektret läßt sich als Lautsprecher in einem Dynamikbereich bis zur Eigen-
spannung verwenden, darüber hinaus entstehen die Verzerrungen aus dem
Gleichrichtereffekt. Der Wirkungsgrad ist gering.
Mann kann auch hier wieder die Fläche und angelegte Spannung erhöhen.

Zur Steigerung der Linearität verwendet man Kämme aus Elektretplatten.


In Telefonen mit Freisprecheinrichtung war die Möglichkeit der Entstehung von
Rückkopplung durch Resonanz.
Um das zu verhindern wurde die Anordnung der Sprechkapsel mit Elektreten
zur Unterdrückung dieses selektiven Systemverhaltens so ausgelegt, das bei der
Resonanzfrequenz der Sekundärschall durch Verlängerung der Anordnung um
λ/2 versetzt wird und sich mit dem Primärschall vom Sprecher durch Interferenz
aufhebt.

6.) Piezo-Prinzip
Der piezoelektrische Effekt beruht auf positiven und negativen Ladungsträgern
innerhalb der Kristallstruktur, die bei Anlegen einer Spannung Verschiebungen
der Ladungsschwerpunkte im Kristallgitter hervorrufen und umgekehrt für
Spannungsänderungen an den Grenzflächen des Kristalls sorgen, wenn das
Material durch mechanische Kräfte verformt wird.

In Oberflächenbauelementen wird z.B. Lithium-Niobat als piezoelektrisches


Substrat verwendet, die als frequenzselektive Bauelemente den LC-Schwing-
kreis ersetzen. Dabei werden elektrische Signale oder Impulse in Oberflä-
chenwellen (Rayleigh-Wellen) verwandelt und umgekehrt wieder in elektrische
Form umgesetzt.

Im Prinzip funktioniert der Schalleffekt bei allen Kristallen, jedoch ist unsicher,
ob sich die minimalen Lageveränderungen auch makroskopisch auswirken.

Piezo-Mikrophone sind akustisch hart und daher gute Unterwasser-Mikrophone,


da eine bessere Impedanzbedingung als bei Luft vorliegt. Bei der Anwendung
als Kristalltonabnehmer liegt die Übersprechdämpfung teilweise unter den
geforderten 20 dB.

7.) Transistor-Prinzip
in einem Transistor mit p n p - Schichtenfolge wird über eine Nadel der Schall
auf die n - Schicht eingekoppelt, was eine Spannungsschwankung hervorrufen
soll. Dieser Effekt ist erst ansatzweise erklärbar und funktioniert nur bei
manchem Transistor. Der Transistor-Effekt ist unumkehrbar.
8.) Plasma-Prinzip
Plasma ist der vierte Aggregatzustand, wobei alle Atome durch starke Ener-
giezufuhr vollständig dis-soziiert sind. Zwei Kohlestäbe (Elektroden) mit
Luftspalt werden von dem zu übertragenden Signal mit starker Energiezufuhr
und niedrigem Wirkungsgrad über einen Schweißtrafo (U ↑ , I ↓) angesteuert.
Es liegt eine masselose kleine Membran vor, mit der hohe Frequenzen ab-
gestrahlt werden können.
Insgesamt liegt ein Dauerexplosion mit zu- und abnehmender Kugelfläche vor,
da zwischen den Elektroden ein Feuerball mit variabler Größe entsteht.
Der Plasmaball bewirkt aber auch eine Signalverzerrung.
Die Luft zwischen den Elektroden wird ionisiert, es entsteht Ozon.

9.) Lichtwandlerprinzip
Der Laserstrahl besitzt eine gauss’ähnliche Helligkeitsverteilung.
Auch die bei Streuung durch Staubteilchen entstehende Strahldivergenz ge-
horcht gauss’förmig.
Im Abhörfall wird der Laserstrahl von einer beweglichen Fensterscheib reflek-
tiert und in Ruhelage auf eine Fotozelle gerichtet. In Abhängigkeit der Durch-
biegung der Fensterscheibe durch den Schall im Raum wird der Lichtstrahl aus-
gelenkt und der Auftreffpunkt des Strahls ändert sich, womit die Fotozelle ein
anderes Spannungspegel abgibt. Damit wird die Bewegung der Scheibe in eine
Winkelmodulation umgesetzt. Bei Dreifachverglasung schwingt die innerste
Scheibe am meisten, die äußere wird am stärksten durch Straßenlärm ausge-
lenkt.
Schallaufzeichnungsverfahren
bei
1. Schallplatte
2. Magnetton
3. Lichtton
4. CD

1. Schallplatte und der Unterschied Schallplatte/CD


Bei der Schallplatte ist gegenüber der CD die Antriebsgeschwindigkeit der
Platte konstant, aber die Relativgeschwindigkeit zwischen Nadel und Platte ist
außen groß und innen klein.
Bei der CD ist die Relativgeschwindigkeit über den Abspielbereich konstant ge-
halten, CLV = Constant Linear Velocity, was allerdings eine Veränderung der
Drehzahl, je nach Abspielradius bedingt.

Bei der Schallplatte läuft die Nadel von außen nach innen, bei der CD von innen
nach außen.

Die effektive Breite für die Schallaufzeichnung auf der Schallplatte ist 10 cm,
bei dPlatte = 30 cm, dLabel = 10 cm. Für 20 Minutenspieldauer und der Umdreh-
ungsgeschwindigkeit von 33⅓/min ergeben sich 666 Rillen je Plattenseite und
bei 100μm Spurabstand ergeben sich 150μm Rillenbreite.
Stereo wird bei der Schallplatte durch Tiefen- und Seitenschrift, sowie der Dre-
hung um 45 Grad erreicht. Bei der Tiefenschrift wird die Amplitude in die Tiefe
aufgezeichnet, also nach unten orientierter Offset (Versatz) in Ruhelage.
Bei der Seitenschrift ist die Mittellage die Ruhelage, die Ausrichtung erfolgt
nach links und rechts entsprechend.

- Die Einkanaligen Schallplatten

Bei mechanischen Schallspeicherverfahren wurde eine Rille in das Trägerma-


terial eingeschnitten oder eingepreßt. Die wellenförmigen Auslenkungn dieser
Rille entsprachen den aufgespielten Tonfrequenzschwingungen. Folgten die
Schlangenlinien sehr eng aufeinander, so bedeutete das eine hohe Frequenz,
gingen die Auslenkungen sehr in die Breite oder in die Tiefe, so bedeutete dies
große Amplituden, also große Lautstärke.
Am Anfang verwendete man die Tiefenschrift. Dabei arbeitete der Schneid-
stichel beim Schneiden der Schallplatte in die Tiefe der Schicht. Die Rille glich
einem Gebirgstal, das am Grund und an den Hängen wellenförmig gestaltet war.
Dann wurde für einkanalige Schallplatten ausschließlich die Seitenschrift
verwendet, wobei der Schneidstichel durch die Tonfrequenzströme seitlich hin-
und her- gesteuert wurde.
Die Rillentiefe blieb dabei gleich, die Tonspur wurde spiralig auf einer Kunst-
stoffscheibe untergebracht. Füllschrift-Verfahren rückten, wenn lange Spiel-
dauern erzielt werden sollten, die Rillen an den Stellen kleiner Amplitude, also
geringer Auslenkung, enger aneinander.

Bei der Herstellung von Schallplatten wurden thermoplastische Werkstoffe in


Stahlmatrizen gepreßt oder bei großen Stückzahlen in Formen gespritzt. Es
handelt sich bei der Herstellung um ein spanabhebendes Verfahren.
Die Urplatte, als Modell zum Herstellen der Preß- oder Spritzformen verwendet,
wurde mit einem Stichel aus einem ebenen Trägermaterial herausgeschnitten.
Daher kommt der Begriff des Mitschneidens, der sich bei Tonbandaufnahmen
eingebürgert hat.

- Die Stereo Schallplatten

Um bei Stereo-Schallplatten zwei Informationen in der gleichen Rille unter-


zubringen, kombinierte man die Tiefen- und Seitenschrift, neigte aber dabei die
beiden Stichelbewegungen um 45 Grad zur Plattenoberfläche. Man verwandt
einen einzigen Stichel, der einmal die rechte und dann wieder die linke Flanke
stärker ausschneidet. Er führte also gleichzeitig zwei um 90 Grad versetzte
Bewegungen aus. In jeder Richtung für sich bedeutete das eine Tiefenschrift,
die jedoch um 45 Grad zur Plattenoberfläche geneigt ist. Die Spur ist um √2
größer geworden.
So enthält dabei die linke Rillenflanke die Information des linken Übertra-
gungskanals und die rechte die des rechten Kanals. Nach dem Gesetz von dem
Parallelogramm der Kräfte setzten sich beide Bewegungen zu einer reinen
Seitenschrift S - S und einer reinen Tiefenschrift T - T zusammen.
Der Stereo Tonabnehmer holt sich aus dieser komplizierten Rille wieder die
beiden um 90 Grad gekreuzten Einzeltonspuren heraus.

Bei Abtastung einer Stereo-Platte mit einkanaligem Tonabnehmer, spricht der


Tonabnehmer nur auf die Seitenauslenkung an (monokompatibel).
Schallplatten-Wiedergabe
Bei der Wiedergabe gleitet die konisch oder eliptisch (biradial) geschliffene, an
ihrer Spitze verrundete Abtastnadel des Tonabnehmers in der Rille der Schall-
platte entlang. Dabei zwingt die an der Nadel vorbeigleitende Tonschrift die Ab-
tastnadel zu Bewegungen, die dem Weg des Schneidstichels bei der Aufzeichn-
ung entsprechen. Je genauer die Nadelspitze der Toninformation folgt, desto
einwandfreier ist die Wiedergabe und desto kleiner die Verzerrungen.

Ton-Abnehmer-Nadel-Material ist Saphir oder Diamant, der Unterschied liegt in


der Standzeit.

Die elektro-mechanische Wandlung der vom Tonabnehmer ausgeführten Bewe-


gungen in elektrische Wechselspannung können durch verschiedene Wandler-
prinzipien geschehen. Dabei wird vor allem das elektromagnetische, das elek-
trodynamische und das piezoelektrische Prinzip angewandt.
Möglich sind aber auch magnetostriktive (von mechanischen Spannungen
abhängige Halbleiterdaten), fotoelektrische oder kapazitive Anordnungen.

Qualität des Tonabnehmer

hängt entscheidend von den Eigenschaften der Abtastnadel und des Abtast-
trägers ab und fordert1.unverfälschte Abtastung der Plattenmodulation
2.minimale Qualitätsbeeinträchtigung bei kleine Fehljustagen
von Tonarm und Nadel
3.minimaler Plattenverschleiß
4.minimale Nadelabnutzung

Bei der Schliff-Geometrie der Abtastnadel ist zu beachten, daß die Nadel tief in
die Plattenrille eingreift, ohne jedoch den Rillengrund zu berühren, sonst kommt
es zu starken Nebengeräuschen und ungleichmäßiger Abtastung der Rille.
Deshalb soll die Berührungsfläche etwas auf der halben Höhe der Rillenwände
liegen, was einen optimalen Verrundungsradius der Nadelkuppe von 15μm bei
Stereorillen bedingt.
Eine exakte Lage der Nadel in der Rille ist jedoch unausreichend, um eine ein-
wandfreie Wiedergabe zu erhalten. Die Nadel muß nämlich beim Abspielen
auch in der Rille bleiben. Bei zu geringer Auflagekraft springt die Nadel aus der
Rille, eine zu große Auflagekraft bewirkt eine geringfügige Abweichung von
der exakten Rillenführung, welche, darüber hinausgehend dass sie die
Wiedergabequalität beeinträchtigt, auch Schäden an der Nadel und an der
Schallplatte verursacht.
Kräftebetrachtung

Die gering anmutende Nadel-Auflagekraft von 30mN übt mit


sin 45° ·30 mN = 21 mN an den Berührungsstellen (Berührung der Rillen-
flanken an zwei genau gegenüberliegenden Stellen, bei senkrechter
Nadelstellung zur Plattenoberfläche) einen erheblichen Flächendruck aus.

Ausgehend von einem Abstand der Berührungspunkte von 5μm, bei unendlich
harten Rillenflanken ergibt sich nach

Flächendruck der Nadel gegen die Rillenflanken

Der errechnete Flächendruck von 10 t/cm2 wird allerdings in der Praxis


unterschritten, weil sich die Berührungspunkte durch elastische Verformung und
einer Flächenbildung durch den Abschliff an der Nadel vergrößern.

Der Schleifvorgang zwischen Platte und Nadel beim Abtasten einer Schallrille
bewirkt bei der hohen Belastung auch beim härtesten Diamanten einen
Abschliff und damit eine Veränderung der Abtastbedingungen.

Die Abnutzung geht bei der neuen Abtastnadel durch die fast punktförmige
Auflagefläche zunächst schnell vor sich. Es schleift sich eine ellipsenförmige
Fläche (Schiffchen) an, womit gleichzeitig die Abnutzungsgeschwindigkeit
durch die Vergrößerung der Auflagefläche herabgesetzt wird.

Bei weiterem Abschliff paßt sich die Nadel der Rillenform an und gelangt mit
der Spitze auf den Rillengrund, was Nebengeräusche und Rauschen bewirkt und
außerdem die Möglichkeit für unverzerrte Wiedergabe verschwindet. Der
Zustand der Nadel hängt weitgehend vom Pflegezustand der Platte ab.

Wenn die Spitze der Nadel durch mechanische Beschädigung (Schlag oder
Stoß) abgesplittert ist, wird die Wiedergabe zwar bereits nur teils unmöglich,
aber es empfiehlt sich stets aufmerksam der akustischen Wiedergabe zu lau-
schen. Bei plötzlich verzerrter Wiedergabe oder erhöhtem Rauschen, ist der
Abtaststift mit Sicherheit beschädigt und muß ausgewechselt werden, sonst wird
die Schallrille beschädigt. Staub und tiefe Kratzer ärgster Feind der Abtastnadel.

Einfluß des Tonarms

Darüber hinaus, dass der Tonarm die Aufgabe hat, das Tonabnehmersystem zu
halten, soll er auch dafür sorgen, daß die Abtastnadel durch die
Schallplattenrille ohne nennenswerte Kräfte geführt wird. So spielt für ein
verzugsfreie Wiedergabe die Geometrie des Tonarms, seine Lagerung, die
Nadelauflagekraft, das anti-skating (Schlittern-Ausgleich) eine Rolle.

Neben dem Tangential-Tonarm, der wie der Schneidstichel im 90 Grad-Winkel


arbeiten, gibt es den schwenkbaren Tonarm, der von einem Punkt außerhalb des
Plattentellers drehbar gelagert ist und die Abtastnadel von außen nach innen
einen Kreisbogen beschreibt und keine durch den Mittelpunkt der Platte gehen-
de Gerade besitzt.
Der schwenkbare Tonarm besitzt gegenüber dem Tangential-Tonarm einen
tangentialen Spurfehlwinkel, die Verzerrungen bedingen, die aber kleiner sind,
als die unvermeidlichen vom Abtastsystem.
Um diesen Fehler klein zu halten, wird der Tonarm nach innen gewinkelt
(gekröpft) und seine Länge größer als den Abstand zwischen Tonarmdrehachse
und Plattentellerachse gewählt (Überhang).

Noch zu beachten sind resonanzfreie Lagerung des Tonarms, Auflagekraft und


skating-Kompensation.

Kanal/Übersprechdämpfung

ist das in dB gemessene Verhältnis, das angibt, welchen Einfluß das Signal des
einen Kanals auf den anderen Kanal hat. Abgesehen vom inneren Aufbau des
Tonabnehmer Systems ist die exakte Senkrechtstellung des Abtastsystems zur
Plattenoberfläche zu beachten. Schon eine geringe Verkantung wirkt sofort auf
die Kanaltrennung, die von der geometrischen Auslegung des Tonarms abhänig
ist und auch auf unkorrekte Befestigung des Systems zurückgeführt werden
kann.

Pegeldifferenz ist der Unterschied in den Ausgangsspannungen beider Kanäle


eines Stereosystems.

Unlineare Verzerrungen entstehen im Tonabnehmersystem selbst, weil die Form


des Schneidstichels von der Form der Abtastnadel abweicht
(Aufzeichnungsverzerrungen), aber auch, wenn die Achse des Abtastsystems
anders als tangential zur Plattenrille verläuft (Abtastverzerrungen)
Da die Rillen von einem dreieck-förmigen Schneidstichel geschnitten und von
einer kugelförmigen Nadel abgetastet werden, kann die Nadel exakt kaum die
gleichen Bewegungen ausführen wie der Stichel, und es ergeben sich
Spurverzerrungen.

Vergleich CD und Schallplatte

CD Schallplatte
Durchmesser [cm] 12 30
Winkelgeschwindigkeit, 200...500 33⅓ bzw. 45
Drehzahl [U/min]
Abtastgeschwindigkeit [m/s] 1,2...1,4 0.2...0.5
Übertragungsbereich [Hz] 5...20.000 30...>20.000 ist von Gerät
zu Gerät sehr unterschied-
lich
Frequenzgang [dB] ± 0.5 stark vom getrieben Auf-
wand abhängig und von der
Anzahl der Abspielvorgänge
der Platte
S/N [dB] >90 >60
Übersprechdämpfung [dB] >90 <35
Klirrfaktor [%] <0,01 <2 außen, 10 innen. Die 10
0.5 würden schon sind weniger auffällig, da es
sehr stark auffallen vor allem den k2 betrifft
Gleichlaufschwankungen von der Mechanik < 0.1
[%] weitgehend
unabhängig, da
quarzgesteuert
Spurabstand [μm] 1,6 ca. 100
Abtastung berührungslos, mechanisch, rillengeführt
laseroptisch
Rillenverlauf von innen nach von außen nach innen
außen
Kanalanzahl [] 2 (4) 1 oder 2(4, CD-4 FM Verf.)
Spielzeit [min] 1 x 60 oder 75 2 x < 35
Empfindlichkeit gegenüber gering groß
Staub
Verschleiß beim Abspielen fehlt soweit stark
Titelzugriff bequem über mit Fingerspitzengefühl von
Elektronik Hand möglich

Insgesamt wird damit teuere Mechanik durch billiges Silizium ersetzt, da eine
analoge Aufnahme mit CD-Parametern sehr teuer wäre.

2. Magnettonverfahren
Beim Aufbau des Tonbandkopfes spricht man zwar von einem Ringkopf,
trotzdem hat der Eisenkern eine ungefähr rechteckige Form. Der Kern muß aus
hochwertigem Dynamoblech oder Ferrit bestehen und sehr verschleißfrei sein,
um zu verhindern, dass der Kern von dem vorbeilaufenden Bandmaterial
abgeschliffen wird. Als Spalteinlage dient eine Folie aus sehr harten
Berylliumkupfer oder Glimmer. Um bei langsamen Bandgeschwindigkeiten
hohe Frequenzen noch gut aufzuzeichnen, muß der Spalt schmaler sein, als die
sich ergebende Wellenlänge aus der höchsten aufzuzeichnenden Frequenz.

Dabei gilt

d. h. bei einer Bandgeschwindigkeit von v = 9,5 cm/s und einer maximalen Fre-
quenz f = 16KHz ergeben sich zuerst

Damit beide Halbwellen der Wechselspannung aufgezeichnet werden können,


also der Bedingung s < ½ λ, muß dieser Wert nochmal auf 3 μm halbiert wer-
den.

Die Spaltbreite muß also kleiner als die halbe Wellenlänge der höchsten Si-
gnalfrequenz sein.

Dieser feine Spalt ist mit bloßem Auge bereits unsichtbar und verlangt äußerst
präzise mechanische Fertigung. Dann muß er gerade sein, da sich sonst die
Halbwellen bei hohen Frequenzen überschneiden und verlorengehen, was in
eine deutlich hörbare Höhenabsenkung zur Folge hat. Da die vom Band abgeta-
steten Magnetfelder außerordentlich klein sind, muß jede Einstreuung von
fremden Störfeldern vermieden werden, da z. B. die 50-Hz-Brummspannung
aus dem Lichtnetz verehrende Folgen haben können. Deswegen sind die Ma-
gnetköpfe im Heimbereich sorgfältig abgeschirmt.

Die Kopfspule wirkt als induktiver Widerstand. Schließt man sie beim
Aufsprechen einfach an den Ausgang eines Verstärkers an, dann würde bei
hohen Frequenzen infolge des großen induktiven Widerstandes nur ein kleiner
Strom fließen und das Band zu wenig magnetisieren, was aber gerade bei
höheren Frequenzen wünschenswert ist. Daher legt man beim Aufsprechen mit
der Kopfwicklung einen größeren Widerstand R (30...200KΩ) in Reihe, da dann
der Strom in diesem Kreis überwiegend von R bestimmt wird und über einen
weiten Frequenzbereich konstant bleibt. Durch zusätzliche Maßnahmen werden
die Höhen noch angehoben um die Spaltverluste auszugleichen.
Das bedeutet, die Frequenztreue beim Magnettonverfahren ist "ausreichend",
bei der Phasentreue durch den induktiven Widerstand der Kopfspule fehlt das.
Bei Aufnahme wird die Information um 90 Grad versetzt, bei der Wiedergabe
nochmals um 90 Grad gegenüber dem Original.

Beim Abspielen tritt ein entgegengesetzer Effekt auf. Es gilt wieder das dy-
namische Prinzip: Magnetfelder und Bewegung ergeben Spannungen in der
Spule. Langsame Magnetfeldänderungen ergeben geringere Spannungen. Dies
trifft für tiefe Frequenzen zu, weswegen die tieferen Töne angehoben werden
müssen. Das bedeutet insgesamt, daß Tonbandverstärker mit kräftiger Höhen-
und Tiefenanhebung arbeiten müssen.

So wäre Linearität möglich, wenn das Band linear wäre, aber wegen den
Hystereseeigenschaften muß deswegen stark in das Frequenzverhalten einge-
griffen werden. (Würde man das Band nur im linearen Bereich betreiben wäre
die Dynamik viel zu gering.) Für den Tonkopf wird Material mit schlanker
Hysterese (magnetisch weich) und für das Band Material mit breiter Hysterese
(magnetisch hart, für gute Speicherung) verwendet

Da das Magnettonverfahren mit einem Spalt arbeitet, muß eine Definition der
Spaltfunktion folgen, die nachher nochmal auf dieses Verfahren angewandt
wird.

Die Spaltfunktion kann mathematisch als Produkt aus der Sinusfunktion mit der
Hyperbel 1/x angesehen werden. Sie ist die Fourier-Transformierte der Π-
Funktion (Rechteck-fkt.) des Spaltes, da der Spalt ein Rechteckfenster ist.

Die Spaltfunktion entsteht bei der Abtastung einer harmonischen Schwingung


durch einen Spalt endlicher Breite. Der Scheitelwert der abzutastenden cos-
Funktion wird exakt nur bei punktförmigem Abgriff erfaßt. Sobald bei realen
Gegebenheiten mechanische Abmessungen ins Spiel kommen, wird der
Funktionswert über die Abtastbreite "verschmiert", d. h. der Mittelwert als
Integralfläche des Funktionswertes zwischen x0 und - x0 geteilt durch die
Spaltbreite 2x0 gebildet. Dieser Mittelwert hängt ab vom Verhältnis der Spalt-
breite zur Schwingungsperiode und stellt die Spaltfunktion dar.
Wenn die Spaltbreite in die Größenordnung der Wellenlänge kommt, ist die
Abtastung offenbar bereits sinnlos (Nulldurchgänge der Spaltfunktion liegen bei
π, 2π.. nπ)

Die Spaltfunktion ist bezogen auf das Argument x als Winkel im Bogenmaß.
Diese Form ist allgemeingültig und kann durch Aufteilung nach Ort und Zeit
auf verschiedene Gebiete übertragen werden. Da ein Winkel durch ωt ersetzt
werden kann und ω wie t getrennt als Variable aufgefaßt werden können, ergibt
sich eine Skala verschiedener Spaltdimensionen,

- als mechanische Länge s, bezogen auf die Wellenlänge,


- als Zeit t, mit Einfluß auf das Frequenzspektrum,
- als Frequenz ω, mit Einfluß auf die Dauer des Einschwingvorgangs.

Zurück zur Betrachtung der Spaltfunktion bei der Magnettonwiedergabe.

Das Magnetband enthält Molekularmagnete, die die Aufzeichnung eines sinus-


förmigen Signals als magnetische Feldstärke H in Längsrichtung des Bandes er-
möglichen. Hierbei wird die Zeitabhängigkeit des sin-Signals in Ortsabhängig-
keit umgesetzt. Maßgebend für die Wellenlänge λ bei einer bestimmten Fre-
quenz f ist die Bandgeschwindigkeit v (Weg/Zeit). Für die Abtastung ist eine
möglichst schmale Trennfuge (Spaltbreite s) erforderlich. Der Flußmittelwert
über diesem Spalt entspricht dabei der Spaltfunktion. Zur Erzeugung der Wie-
dergabe Spannung wird das System Band/Hörkopf als Übertrager betrachtet:
Das Band entspricht der Primärwicklung, der Hörkopf der Sekundärwicklung
mit n Windungen. Nach dem Induktionsgesetz,

wobei
dΘ= Flußänderung im
dt= Zeitabschnitt von n = Windungen ist,
folgt die Wiedergabespannung der zeitlichen Ableitung des Flußes, ist also
proportional zur Frequenz und zur Spaltfunktion. Die dargestellte Kennlinie
zeigt, daß eine Ausnutzung im Linearen Bereich maximal bis zur Frequenz
f = v / 2s gehen kann. Im realen System liegen eine Anzahl weiterer Einflüsse
vor (z. B. Selbstmagnetisierung), die grobe Abschätzung des ausnutzbaren
Bereiches bleibt davon jedoch unberührt. Es versteht sich, daß der durch die
Spaltfunktion hervorgerufene Abtastfehler auch bei Videorecordern eingeht.

Beispiel: Ein Kassettenrecorder habe eine Bandgeschwindigkeit von v=4,75


cm/s, die Spaltbreite betrage s= 2μm. Bestenfalls ist mit der Formel

für den linearen Frequenzbereich ≈ 12Khz erzielbar,


Vergleich zwischen analoger und digitaler Magnetband Auf-
nahmetechnik

Störgrößen der analogen Magnettonaufzeichnung

-relativ hohe, nichtlineare Verzerrungen, die mit der Aussteuerung zunehmen


-begrenzter Dynamik-Bereich
-aussteuerungsabhängiger Frequenzverlauf durch Sättigungseffekte bei kleinen
Wellenlängen
-Intermodulation
-Modulationsrauschen
-starke Zeitbasisfehler (Gleichlaufschwankungen, Phasenschwankungen), die
von der Transportmechanik verursacht werden und das reproduzierte Signal un-
mittelbar beeinflussen
-lineare Verzerrrungen am unteren Ende des Übertragungsbereiches durch
Kopfspiegelresonanzen
-Kopiereffekt
-direkte Abhängigkeit der elektroakustischen Werte von den Eigenschaften des
Magnetbandes
-Addition der Störgrößen beim Duplizieren von Tonträgern

Vorteile der digitalen Aufnahmetechnik

-linearer, eng-tolerierter Frequenzgang innerhalb des vorgegebenen Übertra-


gungsbereiches bei jedem Pegel
-großer Dynamikumfang, der in der Regel Praxisanforderungen genügt
-unmeßbar geringe Gleichlaufschwankungen
-Phasenschwankungen zwischen beiden Kanälen entfallen
-sehr geringe Verzerrungen ab einem Mindestpegel
-mit der Systemdynamik hohe Übersprechdämpfung
-kein Kopiereffekt
-innerhalb der digitalen Ebene unbegrenzte Duplizierbarkeit der Informationen
ohne Qualitätsverlust
Spezifische Probleme der Digitalaufzeichnung

-erfordert eine um den Faktor 40...100 höhere Frequenz-Bandbreite und damit


bei anzustrebendem ökonomischen Bandverbrauch eine um mehrere Größen-
ordnungen höhere Aufzeichnungsdichte als in der Analogtechnik
-Fehlerschutz und Synchronisation machen Zusatzdaten notwendig und ver-
größern den Aufwand an Schaltungskomponenten
-die Zusatzdaten erhöhen die Bitrate und damit nochmals die Bandbreite
-die Daten fallen diskontinuierlich an und müssen zwischengespeichert werden
-mechanischer Schnitt ist nur beschränkt möglich
-elektronischer Schnitt bietet optimale Bearbeitungsmöglichkeiten, erfordert
aber einen höheren Geräteaufwand
-das Magnetband ist vor Umwelteinflüssen zu schützen und sollte möglichst
anders als mechanisch berührt werden, damit unterliegt es Beschränkungen in
der Handhabung

Vorteile und Nachteile des Magnettonverfahrens gegenüber dem Nadel- und


Lichtonverfahren

Vorteile

-Hinterband-KontrolleDie Aufzeichnung kann während der Aufnahme sofort


abgehört werden
-Löschen Die Aufnahme kann spurlos entfernt werden. Ohne Quali-
tätsminderung lassen sich Tonbänder beliebig häufig für Aufzeichnungen
verwenden
-Schneiden Tonbänder lassen sich ebenso wie Kinofilme schneiden
und kleben
-Transportabilität Aufnahme und Wiedergabegeräte lassen sich leichter
transportieren und sind gegen äußere Einflüsse z. B. Temperatur unem-
pfindlicher

-lange Spieldauer gegenüber Schallplatten


-größerer Frequenzbereich
-geringeres Rauschen und damit größere Dynamik
-geringerer Verschleiß
-geringere Verzerrungen
-einfacheres Aufnahme und Umspulverfahren

Nachteile gegen über der Schallplatte

-Einlegen des Bandes ist bei Spulengeräten komplizierter als das Auflegen einer
Schallplatte
-Aufsuchen bestimmter Stellen dauert lange
-Bandmaterial ist teurer als Schallplattenvinyl

Löschvorgang
Voraussetzung für eine Magnetbandaufnahme ist ein völlig entmagnetisiertes
Tonband. Das geschieht bei der Aufnahme durch den Löschkopf, der alle Teile
des Bandes bis zur Sättigung magnetisiert und unter mehrmaligem Durchlaufen
der Hystereseschleife mit sinkender Wechselfeldstärke allmählich bis in den
Nullpunkt entmagnetisiert. Dabei wird der Selbstmagnetisierungseffekt ausge-
nutzt, d. h. je kürzer die aufgezeichnete Wellelänge bei einer best. Bandge-
schwindigkeit v ist, desto kleiner sind die sich in der magnetischen Sicht aus-
bildenden Stabmagnete und desto weniger Feldlinien treten aus dem Tonträger
aus. Dies kann so erklärt werden, daß sich die Magnetisierung der magnetischen
Teilchen mit wachsender Frequenz gegenseitig mehr und mehr aufhebt.

Eine Löschung über ein magnetisches Gleichfeld eines Permanentmagneten


oder Gleichstromlöschung mittels gleichstromerregter Spule ist auch möglich,
aber die Qualitätsminderung übersteigt das zulässige Maß für gute Tonwie-
dergabe. Störend ist dabei weniger der Rauschpegel (er wird durch die HF-
Vormagnetisierung geschwächt), als viel mehr der Verzerrungsanstieg, bei Auf-
zeichnung auf gesättigtees Band (DC-Löschung) anstelle von unmagnetisiertem
Band (HF-Löschung).

Wegen der Löschfrequenz werden die Molekularmagnete beim Passieren des


Löschkopfspaltes mehrere Male gedreht.
Anforderungen an die Löschfrequenz sind:
-sie soll außerhalb des Hörbereiches liegen
-das zu löschende Band muß ausreichend viele Ummagnetisierungen erfahren,
um tatsächlich vollständig entmagnetisiert zu werden
-die Frequenz soll so niedrig sein, daß die im Löschkopf entstehenden Wir-
belstrom- und Verluste wegen Ummagnetisierung in tragbaren Grenzen bleiben.

Aus dem Löschgenerator entnimmt man auch gleichzeitg den Vormagnetisie-


rungsstrom für die Aufnahme. Es wird in praxi immer mindestens das fünf-fa-
che der oberen Grenzfrequenz, gegenüber der des auzunehmendenen Nf-
bereiches gefordert.

DC- und HF-Vormagnetisierung


Bei der Gleichstrom-Magnetisierung wird der Arbeitspunkt in die Mitte des
annähernd geradlinigen Teiles der Magnetisierungskurve gelegt. Der erreichbare
S/N kleiner ist als 40 dB.

Dem niederfrequenten Aufsprechstrom wird ein HF-Strom mit konstanter


Amplitude additiv überlagert (unmoduliert). S/N über 60 dB
Die ungleichmäßige Verteilung und die schwankenden Werkstoffeigenschaften
der magnetischen Teilchen haben zur Folge, daß der Vormagnetisierungseinfluß
um seinen Mittelwert schwankt, was sich als Rauschspannung bei der Wieder-
gabe bemerkbar macht.
Insgesamt besitzt die HF-Vormagnetisierung gegen über der DC-Vormagneti-
sierung Vorteile, wie-geringeren Klirrfaktors
-kleineren Rauschpegel
-größeren Aussteuerbereich mit größerer Dynamik

3. Lichttonverfahren
Beim kommerziellen Kinofilm läuft der Film diskontinuierlich, und der Ton
läuft in einem Bereich, wo er kontinuierlich bewegt werden kann, deswegen
laufen Bild und Ton vom Ort her asynchron.

Verwandt werden hauptsächlich das Intensitätsverfahren und das Schwarz-


Weiß-Verfahren.

1. Intensitätsverfahren

Hier wird die Transparenz des längs zum Filmstreifen abgebildeten Spaltes
proportional zwischen Minimal- und Maximalwert geändert, wobei die
Unterschiede in der Schwärzung = Lautstärke-Unterschiede bedeuten und die
Unterschiede in der Dichte der Linien = Frequenz-Unterschiede darstellen.
Die Tonspurbelichtung geschieht entweder durch unterschiedliche Abbildung
des Lichtspaltes mittels eines der der Amplitude proportional auslenkbaren
Spiegels oder über eine bewegliche Spaltblende von 2 mm Länge und 10 μm
Breite.

2. Schwarz-Weiß-Verfahren (Envellope-Verfahren)

Hierbei gibt es nur die Zustände lichtdurchlässig und lichtundurchlässig. Eine


Einzackenschrift entsteht, wenn z. B. der aufzeichnende Spalt den Lichtstrom
durch eine quer zur Spur bewegte Blende entsprechend zur Tonfrequenz än-
dert. Statt dessen verwendet man in Filmrichtung bewegliche keilförmige
Blenden (Doppelzackenschrift) und verschiebt den Lichtdurchlässigkeitsbe-
reich in die Mitte der Tonspur. Eine gleichmäßigere Ausleuchtung der Ton-
spur kann durch kammartige Mehrfach-Doppel-Blende erzielt werden, bei
der die Mehrfachzackenschrift entsteht.
Die Amplitudenauslenkungen auf der Tonspur legen die Lautstärke fest
und die Anzahl der Wellenberge und -Täler die Tonfrequenzen.
Bei der quer zur Spur beweglichen Spaltblende wird ein Spalt mit konstantem
Lichtstrom (gleichbleibende Lichtquelle) beleuchtet und die Information über
Variation der Strichbreite aufgezeichnet. Der Aufbau verhält sich wie ein Oszil-
loskop, das die Hüllkurve des aufgezeichneten Signals darstellt. Der Strahl wird
über eine feststehende Optik auf den Film projiziert, der sich mit der Geschwin-
digkeit v bewegt.
Bei Stereoaufzeichnung kann die Redundanz wegen der Symmetrie des Signals
eines Kanals ausgenutzt werden.

Verfahren zur Qualitätsverbesserung

- Dolby
Über Kompression wird der Geräuschspannungsabstand verbessert und beim
ältern Tonfilm mit schlechter Dynamik Gleichwertigkeit mit der Schallplat-
tenwiedergabe erreicht.

- Aufzeichnung mit Laser


exaktere Tonspur durch Projektion des punktförmigen Laserstrahls auf einen
steuerbaren Hohlspiegel, der an einen Piezo-Schwinger gekoppelt ist, auf den
Tonspurbereich des Filmes

- Digitalverfahren
Bei der Digitalaufzeichnung werden die n Bit mit Laser so aufgezeichnet, wie
sie nebeneinander dargestellt werden. Bei Wiedergabe wird die gespeicherte
Toninformation, mittels Laserstrahlen abgetastet, über ein Fotoelement emp-
fangen und analog rückgewandelt.

Wie beim Magnettonverfahren muß der Spalt möglichst schmal sein. Der Grad
der Schwärzung gibt die Amplitude des Signals an. Je nach Belichtung und auch
nach Entwicklungsvorgang wird die lichtempfindliche Schicht geschwärzt.

Die Schwärzungskurve (Gradation) gibt Auskunft über die Schwärzung des


Filmmaterials in Abhängigkeit von der Auftreffenden Leuchtdichte E [Lux] und
der Belichtungszeit t [sek] als fotometrische Belichtung H bezeichnet.

H=E·t H=fotometrische Belichtung


E =Leuchtstärke
t=Belichtungszeit

Die fotometrische Belichtung H ist das Produkt aus Be-


lichtungszeit t und Leuchtstärke E.
In der Tonfilmtechnik ist der Logarithmus der reziproken Transparenzdifferenz
TD als Schwärzungsangabe S sinnvoll.

S =Schwärzungkurve, ist der Logarithmus der reziproken Transparenzdifferenz


TD

wobei
Die Transparenzdifferenz TD ein Maß für das vom Fotoelement umgewandel-
te Signal ist mit den Größen
En=erstes Flächenelement mit Leuchtdichte E
En+1=zu En benachbartes Flächenelement mit Leuchtdichte E
und
S =Schwärzung aus
H=fotometrische Belichtung

Die Steilheit des Schwärzungsverlaufs ist gegeben über

Da der Film nur in eine Richtung schwärzbar ist, das Schallereignis aber bipolar
ist, muß der Amplitudenwert Null genau in die Mitte des Schwärzungsbereiches
gelegt werden. Dann ist zu beachten, daß die Schwärzungskurve wie beim
Verstärker gekrümmt ist (→Verzerrungen). Eine Kompensation zur Erweiterung
des Dynamikbereiches ist unmöglich, da jedes Filmmaterial unterschiedlich
ausfällt. Dies hängt mit dem Reifeprozess der AgBr-Emulsion des Filmmaterials
zusammen.
4. CD-Player
Vom analogen Signal zur

(Dpaint-II)

1. Bandbegrenzung mit dem Anti-Aliasing-Filter


Das Abtasttheorem erlaubt keine Frequenzanteile > 0.5 fs. Damit muß der
Frequenzbereich eines Audiosignals begrenzt werden, sonst kommt es zu
Kurvendoppeldeutigkeit, Differenzfrequenzen oder Aliasingverzerrungen als
Rückfaltungen in das Übertragungsband, die die ursprüngliche Information
stören oder verfälschen.
Bei fs = 44,1KHz und einer fg = 20KHz für den Audiofrequenzgang liegen
Basisband und Störspektrum nur 4,1KHz auseinander, nach 0.5· fs - fg.
Das erfordert ein Tiefpassfilter mit steiler Flanke für den Übergang zwischen
Durchlaß-Sperrbereich, um beide Frequenzbänder hinreichend voneinander
trennen zu können.

Daraus ergeben sich mindestens 8 Anforderungen für das Anti-Aliasing-Filter:

1.geringe Welligkeit (d. h. geradliniger Verlauf bis zur oberen Grenzfrequenz)


2.steile Flanke (d. h. scharfer Übergang vom Durchlaß- in den Sperrbereich)
3.hohe Dämpfung oberhalb fmax größer als 80 dB
4.niedriger Klirrfaktor
5.geringes Einschwing- und Ausschwingverhalten (response)
6.geringe Phasenverzerrungen
7.geringe Gruppenlaufzeiten
8.geringes Eigenrauschen (d. h. Eigenrauschen geringer als das des gesamten
digitalen Systems)

Filter mit steilen Flanken zeigen oft starke Phasenverzerrungen im Übergang


von Durchlaß- zu Sperrbereich, starkes Ein- und Ausschwingen, Laufzeiten, so-
wie eine große Welligkeit (Ondulation) im Durchlaß-Bereich.
Im schlimmsten Fall wird aus dem Filter ein Oszillator und das Ursache-Wir-
kungsprinzip ist ungültig geworden.

Dies erfordert eine aufwendige Filter-Dimensionierung. So hat z. B. ein 13 poli-


ger passiver Filter eine Sperrdämpfung zwischen 80 und 100 dB. Um Phasen-
drehungen und Gruppenlaufzeiten zu kompensieren, werden die Filter kaska-
diert. Der Nachteil der mehrpoligen Filter liegt in der hohen Anzahl der Spulen-
kerne und dem damit verbundenen Gewicht. Auch sind die Erfordernisse in
puncto Toleranz und Langzeitstabilität hoch.
Deswegen werden in der Unterhaltungselektronik aktive Filter auf OP-Basis
verwendet, die sehr schnelle und rauscharme OṔs verlangen.

2. Die Sample & Hold - Schaltung


Hier erfolgt die Abtastung des bandbegrenzten Signals, bestehend aus einem
Analogschalter, einem Speicherkondensator und den entsprechenden Puffer-
stufen.
Der Analogschalter wird vom Abtastimpuls geschlossen und geöffnet, also bei
fs=44,1KHz entsprechend alle 22,7μs. Ist der Analogschalter geschlossen
(sample phase), folgt die Ausgangspannung der Eingangsspannung, und der
Hold-Kondensator wird auf den momentanen Amplitudenwert aufgeladen. Wird
nun der Analogschalter geöffnet (hold phase), bleibt im hold-Kondensator die
Spannung des letzten Amplitudenwertes gespeichert. Jede Veränderung der
abgespeicherten Information verfälscht das Original bei der Rückwandlung in
das analoge Audiosignal.
Am Ausgang der S&H-Schaltung kann jetzt die Kondensatorspannung un-
abhängig von der Eingangsspannungsänderung weiterverarbeitet werden.

Dabei entstehen folgende Fehler.

- sample phase
Der Kondensator kann bei den relativ kurzen Abtastintervallen von 22,7μs
weniger als unendlich schnell geladen werden, weil dies durch den
Innenwiderstand des Analogschalters und der vorangegangenen Treiberstufe
unmöglich ist. Diese bedingt eine gewisse Zeit (aquisition time). Die An-
stiegsgeschwindigkeit mit der sich der Kondensator auflädt, wird von einer
Zeitkonstante bestimmt.
- hold phase
Während der Haltephase geschieht ein Ladungsverlust (dropping), da sich
der Kondensator über sein Dielektrikum und über Rest- und Sperrwider-
stände entlädt.

Ladewiderstand und hold-Kondensator bilden einen Tiefpass, der den Frequenz-


gang der S&H-Schaltung beeinflußt (Aperturfehler)

3. Analog-Digital-Wandlung
Hier erfolgt die Umwandlung der einzelnen Amplitudenwerte in eine binäres
Digital-Signal (Quantisierung)

Quantisierung

Abtastfrequenz und Quantisierung stellen die wichtigsten Parameter der digi-


talen Signalverarbeitung dar. Je größer die Quantisierung und damit die Breite
des Datenwortes, desto genauer kann das Eingangssignal wieder rekonstruiert
werden. Die Auflösung in der kleinsten Quantieriungsstufe bei linearer Quanti-
sierung ist:

Jeder quantisierte Abtastwert stellt eine Information über das ursprüngliche


Signal dar und repräsentiert den statistischen Mittelwert zwischen zwei Ab-
tastwerten. Der Quantisierungsfehler beim PCM-Signal beträgt ± ½ LSB, das
sich bei der Rückwandlung als dem Nutzsignal überlagertes weißes Rauschen
bemerkbar macht.

Mit nichtlinearer Quantisierung kann der Datenstrom am Ausgang des D/A-


Wandlers gesenkt werden, was sich dann in einer geringeren Bandbreite des
Übertragungskanals auswirkt.

Dabei steht die Überlegung dahinter, daß Eingangssignale mit hohen Pegeln
wesentlich seltener auftreten, als solche mit niedrigen Pegeln, was somit nur
eine Änderung in den niederwertigen Bits bewirkt, da die die gesamte Wortb-
reite nur selten ausgenutzt wird. Der untere Pegel-Bereich wird höher aufgelöst
als der obere, die entstehenden Signalverzerrungen werden in Kauf genommen.
Die Begrenzung der Wortbreite geschieht, indem das Signal vor der Quanti-
sierung durch eine Kompanderschaltung läuft, die hohe Pegel stärker kompri-
miert und dann gewandelt wird. Oder durch spezielle A/D-Wandler, die über
eine logarithmische Funktion die Quantisierungsintervalle in Abhängigkeit von
der Eingangsamplitude stufen.

Wandlerverfahren
1. Integrationswandler
Rampenwandler (Single slope, dual slope)
Allen Wandlertypen ist gemeinsam, daß die Eingangsspannung mit der
Spannung des Integrators als Referenzwert verglichen wird.
Die wichtigsten Komponenten bilden ein Integrator, ein Komparator und ein
Binärzähler.

2. Wandler nach sukzessiver Approximation


Iterationsverfahren, Wägeverfahren, SAR (Successive Approximation Regi-
ster) Die wichtigsten Komponenten sind der Eingangskomparator, ein
Schieberegister mit Speicher und ein A/D-Wandler

3. Einbit-Wandler

Fehler bei A/D-Wandlern


- Granularrauschen
Bei kleinen Pegeln wird aus einem Sinus ein Rechteck mit zusätzlichen
Oberwellen, wenn nur noch ein Bit zur Verfügung steht. Bei ungünstigen Fre-
quenz- und Pegelverhältnissen können durch die Oberwellen Mischprodukte
entstehen, die als Aliasing-Frequenzen in den Ü-Bereich fallen. Granular
noise wird vom Ohr viel stärker wahrgenommen als der übliche nichtlineare
k3.

- Linearitätsfehler
Abweichung von der geradlinigen Stufung bei linear ansteigender Eingangs-
spannung.

Monotoniefehler (grober Linearitätsfehler)


Abrupte Änderung der binären Wertigkeit trotz gleichmäßig ansteigender
oder abfallender Eingangsspannung.

- Offsetfehler
Verschiebung des Gleichspannungsniveaus, damit Verschiebung der binären
Ausgangswerte des A/D-Wandlers und Begrenzung des Aussteuerbereiches
für positive oder negative Eingangsspannung.

- overflow errors
Bei Überschreiten der für jeden A/D-Wandler typischen maximalen Ein-
gangsspannung, werden die Wandlerstufen übersteuert, worauf der Wandler
ständig mit einem binären Ausgangsignal der höchsten Wertigkeit oder dem
Komplement dazu reagiert. Das Verhalten ist absolut schon unlinear.
Die während der Wandlung auftretenden Fehler addieren sich und verursachen
Verzerrungen, die sich anders verhalten als bei analogen Systemen.
Verzerrungen in digitalen Systemen besitzen in der Regel keinen natürlichen
Oberwellengehalt, sondern entstehen hauptsächlich durch Kombinationsfre-
quenzen. Noch ein wesentlicher Unterschied zur analogen Signalverarbeitung
liegt darin, daß die Verzerrungen bei der digitalen Signalverarbeitung bei
kleinerer Aussteuerung zunehmen.

4. Codierung
Nach dem A/D-Wandler liegt eine binäre Aussage über die Höhe des Ampli-
tudenwertes (Quellcodierung) vor, allerdings ohne die Aussage, ob der abgeta-
stete Wert aus der positiven oder negativen Halbwelle stammt. Deswegen muß
bei Umwandlung eines bipolaren Signals das binäre Ausgangssignal des ADC
mit Polaritätserkennung über das Zweierkomplement erfolgen.

Berechnung der PCM-Bandbreite

Die Datenrate berechnet sich allgemein nach der Formel

Datenrate = fs [KHz] · n [bit]

Für einen Kanal beträgt die

Oder die Datenrate = Abtastrate · Bitbreite = 44,1KHz · 16 Bit = 705,6Kbit/s


(lineare Quantisierung vorausgesetzt)

In einer Periode können optimal zwei Bit übertragen werden. Die Bandbreite
errechnet sich damit aus der halben Datenrate.

, also 705Kbits/s : 2 = 352,8KHz.

Insgesamt wird ersichtlich, daß bei der digitalen Übertragung ein Vielfaches an
Bandbreite benötigt wird. Bei Erhöhung der Quantisierung oder fg muß auch der
Aspekt der Bandbreite betrachtet werden.

Fehlerkorrektur
Es treten Single bit errors und burst errors auf. Die Ursache können soft oder
hard errors sein

Zur Fehlerekennung werden dem Code Redundanzen zugeführt, die über


- Paritätsprüfung (=Exor-Verknüpfung (= Addition ohne Übertrag(=mod
2 Addition))) der einzelnen bits
- Hamming Korrekturbits(Hamming Distanz = Anz. der notwendigen Bits zur
Sicherung eines n-stelligen Datenworts.
-CRC(Darstellung der Bitfolge durch das Polynom M(x).
Es gilt M(x) : G(x) = Q(x) +R(x),
Das zu übertragende Wort ist U(x) = Q(x) + R(x),
wobeiG(x) = Generator-Polynom (muß dem Empfänger bekannt sein
R(x) = Restpolynom
Q(x) = Quotient
U(x) = empfangenes Polynom
Wenn der Rest R(x)=0 ist, liegt kein Übertagungsfehler vor.)

-Interleaving(Einzelne Datenwörter werden abweichend von der Reihenfolge


der Entstehung, eher räumlich und zeitlich verschachtelt übertragen, indem
die Datenwörter einen Zwischenspeicher durchlaufen.)

Fehlerkorrektur durch

- Kreuzparitätsprüfung(Anordnen der Datenwörter in einer Matrix, mit


Bilden er horizontalen und vertikalen Parität. Korrektur des fehlerhaften
Bit am Kreuzungspunkt durch einfaches Invertieren.)
- Faltungungscodes (Darüber hinaus, dass die Redundanzbits aus den
Daten eines Blocks erzeugt werden, werden sie auch aus den Daten und
Redundanzbits der voran gegangenen Blöcke erzeugt.)

Fehlerverdeckung durch previous word hold, wenn keine ausreichende Anzahl


an brauchbaren Datenwörtern zur Interpolation höheren Ordnung zur Verfügung
steht.

Anforderungen an einen Kanalcode


Der Kanalcode ist mitbestimmend für die erforderliche Bandbreite des Über-
tragungskanals und für die Aufzeichnungsdichte bei den Speichermedien.

1.Kanalcodes sollen gleichspannungsfrei sein und keine niederfrequenten


Signalanteile besitzen, damit Signale auf Magnetband aufgezeichnet werden
und über Schaltungen mit Hochpasscharakter geführt werden können.
2.Durch die Kanalcodierung werden im seriellen Datensignal zusätzliche
Pegelwechsel eingeführt. Die spektrale Energieverteilung muß hierbei so
gewählt werden, daß oberhalb der oberen Grenzfrequenz des Kanals keine
weiteren Energieanteile, die noch irgendwelche Informationen enthalten. Bei
Magnetbandaufzeichnung ist die Kopfspaltbreite zu berücksichtigen.
3.Bei serieller Übertragung wird kein Takt mit übertragen, was erfordert, das
der Kanalcode so beschaffen sein muß, daß sich am Ende der Ü-Strecke der
Takt aus den Flanken des Datensignals wieder rückgewinnen läßt.
4.Die verwendete Codiervorschrift muß dem verwendeten Fehlerkorrekturcode
angepaßt sein.

Für den Fall, daß ständiger Wechsel von Hi nach Low vorliegt, kann das NRZ-
Signal als hochfrequente Schwingung der halben Datenrate angesehen werden.
Ein Ü-Kanal mit BP-Eigenschaften wie beim Magnetband, kann nur indirekt
mit einem NRZ-Signal angesteuert werden, da eine Folge mit ununterbrochenen
Folgen aus Hi- und Lo-Pegeln eine Ansteuerung mit reinem DC bedeutet.
Dann produzieren die Ü-Kanäle Zeitbasisfehler, die die korrekte Auswertung
der NRZ-Signale erschweren.

Kenngrößen des Kanalcodes


T = Lauflänge =Abstand zwischen zwei Pegeländerungen, wobei T = Dauer ei-
nes Bits

Tw = Jitter margin oder window margin = Zeitfenster bei der Auswertung des
Datensignals. Durch Gleichlaufschwankungen und andere Störungen entsteht
der Jitter. Wenn der Jitterfehler zu groß ist, z. B. zwei Signal zu unterschiedli-
chen. RLL hat für den Abstand zwischen zwei Pegeländerungen Tmin und Tmax.
Aus Tmin ist die höchste aufzuzeichnende Wellenlänge bei Magnetbandauf-
zeichnung bestimmt.

DSV = Digital Sum Value = Kenngröße für den Gleichspannungsanteil eines


Kanalcodes.

CIRC-Kodierung
CIRC = Cross Interleave Reed Solomon Code = Blockcode, der die Daten-
wörter aufnahmeseitig in einer Matrix anordnet und aus Spalten und Zeilen
Quersummen bildet.

Die Datenblöcke werden gebildet, indem man sechs Abtastwerte zu je 16 Bit


des linken Kanals und sches Abtastwerte zu 16bit des rechten Kanals zu einer
Grupüpe von zwölf Wörtern zu je 16 Bit zusammenfaßt. Aus den zwölf 16 bit
Wörtenern bildet man schließlich einen Datenblock von 24 Wörtern je 8bit =1
Symbol. Den 24 Wörtern werden 4 Wörter (Q-Symbole) als Paritätssymbole
hinzugefügt. Dann werden die Worte im Code gespreizt (interleaving) um die
Wahrscheinlichkeit anzuheben, daß fehlende Datenblöcke wieder ersetzt werden
können. Nach dem Verschachteln werden wieder 4 weitere Paritätssymbole
hinzugefügt, womit ein Datenblock aus 32 Symbolen besteht.

Die gesamte Blockanordnung aus Informations-, P- und Q-Wörtern ist der


Frame. Jeder Frame enthält die Information von 6 Abtastwerten und besitzt die
Wiederholrate von 1/6 fs = 7350 Hz.

Nun wird an die 6 Abtastwerte ein Kontrollsignal aus einem 8-bit Symbol ange-
hängt (bits P-W = Control&Display bits). Es ist zu unterlassen, Vorstehendes
mit den Kontrollsymbolen P und Q zu verwechseln.
Nun wird aus 98 aufeinanderfolgenden Frames mit den Kontrollsignal-Sym-
bolen ein weiterer Datenblock (Steuersignalblock (subcode)).
Die Wiederholrate des subcode ist framerate : 98 = 7350Hz : 98 = 75Hz.
Jede Sekunde Spielzeit ist somit in 75 Einheiten eingeteilt

Auf die Erklärung der P-W areas wird verzichtet.

Der CIRC-Block besteht nach Hinzufügen des Kontrollsignals aus 33 Sym-


bolen. Die Datenstruktur muß noch an die Kanaleigenschaften "Aufnahmela-
ser→CD→Wiedergabelaser angepasst werden.
1.Die Daten müssen mit hoher Informationsdichte ausgelesen werden können,
Informationsträger sind die Pits, deren gegenseitiger Abstand und Größe sehr
gering ist. Eine falsche Fokussierung des Lasers auf der Info-Ebene oder ein
Versatz des Abastsystems zur optischen Achse verursacht Phasenjitter im
abgetasteten Signal. Deswegen muß das Modulationsystem der Kanalkodierung
so beschaffen sein, daß trotz auftretender Abtastfehler eine einwandtfreie
Signalrekonstruktion möglich ist.
2.Im CD-Player muß aus dem Datensignal die bitclock (Systemtakt) zurück-
gewonnen werden: Das übertragene Datensignal ist ein serielles Signal ohne
Taktübertragung. Für das Einlesen der Daten in die Decodierelektronik muß die
Kanalcodierung so beschaffen sein, daß pro Zeiteinheit genügend Pitflanken
erkannt werden können. Die größte Lauflänge Tmax muß so klein wie möglich
sein.
3.Das Datensignal dar keine DC- oder Nf-Komponenten beinhalten (kleiner
DSV-Wert) Die Fehlerspannungen für Tracking und Focus-Servokreise werden
vom Abtastsystem erzeugt und liegen im Frequenzbereich von 0...20KHz und
sind wie die durch Kratzer erzeugten Störsignale niederfrequent. Um diese
Störungen durch ein Hochpaßverhalten des Übertragungskanals beseitigen zu
können, darf das Datensignal selbst keine Nf-Anteile enthalten.
4.Bei der Codierung ist die Fehlerfortpflanzung zu vermeiden. Auftretende
Fehler müssen, davon ausgeschlossen sein, sich über mehrere Datenblöcke
fortzusetzen. Aus diesem Grund muß für die Kanalcodierung ebenfalls eine
blockweise Datenorganisation gewählt werden.
5.Die Kanaldaten müssen in die entsprechende Pitform umgesetzt werden
können.

EFM-Codierung
Bei der CD wird EFM = Eight to Fourteen Modulation angewendet, da nach
Untersuchungen eine optimale Anpassung an den Übertragungskanal des CD-
Systems erreicht wird, wenn im übertragenen Datenwort die Bedingung in der
Reihenfolge der 0-1-Wechsel beachtet wird:
Zwischen zwei binären 1-Werten müssen mindestens zwei binäre 0-Werte auf-
treten, maximal dürfen aber nur 10 binäre 0-Werte hintereinander erscheinen.
(→Lauflänge Tmin = 3 und Tmax = 11)
Diese Bedingung erfüllt erst ein 14-Bit Datenwort, da ein 8-Bit Datenwort diese
geforderte Lauflängenbestimmung untererfüllt, da innerhalb der 256 möglichen
Datenwörter alle Bitkombinationen auftreten können. (Unter den 214 = 16384
möglichen Bitkombinationen gibt es 267 Datenwörter, von denen die 11
übriggebliebenen gestrichen werden.)
Die Umcodierung geschieht über ein ROM als Wörterbuch.

Da die Kanalanpassung immer noch alles andere als optimal ist, werden zur
Reduzierung des DSV-Wertes noch zusätzliche Koppelbits (mergin bits)
eingefügt, die keine Information enthalten, aber durch die min. und max.
Lauflänge des code festgelegt werden. Droht die Lauflänge zu kurz zu werden,
werden die mergin bits auf 0 gesetzt, bei zu langer Lauflänge werden sie auf 1
gesetzt.
Durch die Optimierung des DSV-Wertes wird erreicht, daß im abgetasteten
Datensignal keine Störanteile im Bereich der Servosteuersignal >20KHz auf-
treten.
Datenrate im Übertragungkanal
Bedingt durch die Kanalcodierung und die mergin bits verändert sich die
bisherige Frame-Struktur von 264 auf 561 bits. Zur späteren Selektion der
einzelnen Frames aus dem Datenstrom und zur Syncronisation der Drehzahl der
CD, werden noch 24 sync bits an den Anfang eines jeden Frames gestellt, die
über drei mergin bits an die bisherige Framestruktur angekoppelt werden.

bitsfor
================================
24sync 00.04%
14Kontrollbits 00,02% (bilden den Subcode)
112parity 19,04% zur CIRC-Fehlerkorrektur
102mergin 17,34%

336 audio 57,14%


================================
Σ =588 chn_bits

Also 57,14 % für audio und 42,85 % für das System

d. h. ungefähr 4/7 audio zu 3/7 system, also 3 zu 4

frame_rate = 7350Hz

x_mission_chn= frame_rate·chn_bits
= 7350 ·103·588
= 4,3218Mbit/s (Datenrate im Übertragungskanal)

EFM ist ein aus dem MNRZ-I abgeleiteter Code mit m=8 (Kanalbits) und
n=14 Datenbits.
MNRZ-I = Modified NRZ-I. Hierbei werden m Datenbits durch Hinzufügen
von weiteren Pegelübergängen in n Kanalbits umgewandelt.
Beim NRZ-I = non return to zero inverse wird eine bin. 1 durch einen Pe-
gelsprung in der Mitte der Bitzelle dargestellt.(Nachteil: Code hat sehr viel
Gleichspannungsanteil und ist fremdtaktend.)

Vom PCM-Signal zum analogen Signal


Die Rückwandlung vollzieht sich im Wesentlichen in drei Stufen. Aus dem
PCM-Signal werden mit einem D/A-Wandler PAM-Signale erzeugt, die von
einer S&H-Schaltung in der Breite vergrößert werden. Ein anschließender
Tiefpass integriert die PAM-Impulse und formt das Analogsignal.

Der D/A-Wandler setzt die binäre Zahlenfolge in einen Spannungsimpuls um,


der der Wertigkeit des angelegten PCM-Signals proportional ist.
Die maximale Ausgangsspannung ergibt sich über

- D/A-Wandlerverfahren

Im digitalen Audiobereich werden drei Verfahren zur D/A-Wandlung ange-


wendet.
D/A-Wandler mitKettenleiter-Netzwerk (Stromteilerverfahren mit R-2R-
Netzwerk, preiswert, aber ungenau)
aktivem Stromteiler(jede Stufe besteht aus Umschalter, zwei Widerständen
und einer Konstantstromquelle)

Integrationsverfahren(kostengünstig, bestehend aus Integrator, Zähler,


Komparator und Konstantstromquelle

Die Fehler bei D/A-Wandler sind wie die bei der A/D-Wandlung vorher behan-
delten. Dazu kommt noch die Einschwingzeit, die vergeht, bis sich die Ausg-
gangsspanung nach Anlegen der Eingangsinformation auf ± ½ LSB eingestellt
hat.
Dann treten zwischen zwei Umsetzvorgängen zusätzliche Störsignale auf die als
glitches bezeichnet werden, die am häufigsten in der Mitte des binären Wertebe-
reiches auftreten: Das MSB sei low und die anderen Bit high. Die Eingangs-
wertigkeit sei jetzt um 1 niedriger wird das MSB high und die anderen Schalter
low. Durch ungleichmäßiges Schalten der einzelnen Bits wird für kurze Zeit ein
falscher binärer Eingangswert vorgetäuscht. Der D/A-Wandler springt dabei für
kurze Zeit zu positiven oder negativen Werten hin.

Dies gibt am DAC-Ausgang hörbare glitch-Verzerrungen, die mit einer nochma-


ligen S&H-Schaltung (deglitcher) vermieden werden, die das Signal mit der
gleichen fs wie bei der A/D-Wandlung abtastet. Für die Breite der deglitcher-
Impulse ist die Hälfte des Abtastintervalls gewählt, um den spätereren Inte-
grationsprozess durch den Tiefpass zu begünstigen.
Ausgangs-Tiefpass
Nach dem Deglitcher liegen die bereinigten PAM-Signale erst als vorläufiges
Analog-Signal vor, was eine Integration durch einen Tiefpass bedingt. Daneben
hat der Tiefpass noch die weitere Aufgabe, nur das Basisband durchzulassen.
Die Umwandlung von PCM zu PAM entspricht wieder einem Abtastprozess, bei
dem ein Frequenz-Spektrum aus Basisband und Störspektrum besteht, das um
die Abtastfrequenz und deren Vielfachen Seitenbänder besitzt.
Diese Signalanteile aus den Störspektren können in analogen Folgestufen
Mischprodukte entstehen, mit Energieanteilen im Basisband, was unerwünscht
ist. Die Anforderungen sind genauso wie an das Anti-Aliasing-Filter vor dem
ADC.

Verhalten des Tiefpasses

Am Ausgang des TP-Filters mit der Grenzfrequenz fmax und idealer, rechteckiger
Filtersteilheit entsteht bei Aussteuerung mit einem Dirac-Stoß (unendlich steiler,
kurzer Impuls) ein zeitlicher Verlauf der der Funktion

mit den Nulldurchgängen im Abstand

Wird die Breite (Tastverhältnis) der Pulsamplitudenmodulation-, PAM, -Impulse


des DAC so verkleinert, daß sie durch einen Dirac-Stoß annäherbar sind, kann
die Impulsfolge durch einen steilen Tiefpaß demoduliert werden. Am Ausgang
des Filters entsteht somit eine Folge von si-Funktionen, die sich - bei geeigneter
Dimensionierung der Tiefpaß-Grenzfrequenz im Vergleich zur Abtastrate -
gerade so überlagern, daß die Interpolation einen mit dem Analogsignal
übereinstimmenden Kurvenverlauf ergibt (Nyquist-Kriterium).

Praktisch muß jedoch von einer endlichen Breite der Abtastimpulse ausge-
gangen werden, da die Demodulation von Nadelimpulsen zu geringen Pegel und
damit einen ungünstigen S/N in der Demodulatorschaltung ergäbe. Die Ver-
breiterung erfolgt im Halteglied, in dem die PAM-Impulse mit der Amplitude A
über das gesamte Abtastintervall TA gehalten werden . Das bedeutet für die
Übertragungsfunktion G
einen Amplitudenabfall mit steigender Frequenz f (Apertur), was mit Hilfe einer
Entzerrerschaltung kompensiert werden kann.
Oversampling
Wenn auf störungsfreie Widergabe Wert gelegt wird, darf die höchste Audio-
frequenz nie die halbe fs erreichen. Da am Ausgang des D/A-Wandlers das
Signal alles andere als glockenrein zur Verfügung steht muß ein Tiefpass
zwischen fg=20KHz und den ersten spektralen Anteilen ab 24,1 KHz (fs-fg) voll
wirksam werden, sonst können sich Differenztöne bilden. Die Anforderungen an
das Tiefpassfilter wurden schon erläutert. Der Schaltungstechnische Aufwand,
um die Probleme des Filters auszuschalten sind sehr groß.
Abhilfe schafft die digitale Filterung über Oversampling, was den weiteren
Vorteil eines besseren Störabstandes besitzt, um dem vom Quantisierungs-
rauschen her theoretisch möglichen Fremdspannungsabstand von 96dB näher zu
kommen.

Der Grundgedanke beim Oversampling ist folgender: Erhöhen der Taktfrequenz


in der DSV um den Faktor 4, damit werden alle Spektren bei der vom System
vorgegebenen fs von 44,1KHz
2fs =88,2KHz, 3fs=123,3KHz, 5fs=220,5KHz, 7fs=308,7KHz,...
digital weggefiltert, außer der 4fs=176,4KHz, die noch benötigt wird.
Das digitale Filter ohne Rekursion (wohl Transversalfilter) ist von 96. Ordnung
und kann so ausgelegt werden, daß die Gruppenlaufzeit konstant ist. Da die
Filterparameter ausschließlich numerische Konstanten aus dem ROM sind,
treten keine Problem mit der Toleranz und der Langzeitstabilität auf.

Dadurch ist der Abstand zwischen Nutzspektrum 20..20KHz und dem Stör-
spektrum 176KHz ±20KHz so groß, daß zur Dämpfung der unerwünschten
Frequenzen ein relativ flachen und damit einfacher 12dB-Tiefpass bedeutet, der
wegen seiner geringen Steilheit keine Schankungen in der Gruppenlaufzeit hat.

1-Bit Technik
Mashverfahren
Bitstream-Verfahren
Linearität des Bitstream-Wandlers

Fazit
1. Mit der Multibit-D/A-Wandlung liegen Nichtlinearitäten vor. Die Technik der
1-Bit-Wandler vermeidet diese durch schrittweise Wandlung. Dabei wird die
Digitaltechnik konsequent angewandt: Einfach wandeln, aufwendig rechnen
Interessant ist, daß sich mit der 1-Bit-Technik Wandler realisieren lassen, die
mehr als 16 oder 18 Bit Auflösung bieten, wie dies bei Verstärkern oder
Mischpulten erforderlich ist. Zu beachten ist, daß die volle 16-Bit-Dynamik
nur bei Vollausteuerung zur Verfügung steht, bei geringeren Pegeln wäre das
schnell Lo-Fi , gerade, wenn noch eine Übersteuerungssicherheit vorhanden
sein muß.

2. Das Wandlerproblem ist nur eines der Hauptprobleme der Digitaltechnik. Ein
weiteres besteht in bei den Übertragungs-Fehlern und den Speicherungs-
Fehlern. Gegenüber der Analogtechnik sind diese Fehler viel kritischer.

1 bit Wandlerweise, 1 bit Artikel ?


- Lit.recherche
Aufbau des CD-Players
zum Laser
(Light amplification by stimulated emision of radiation)
(Lichtverstärkung durch erzwungene Strahlungsemission)
Lichtoszillation durch zwei gegenüberliegende halbdurchlässige
Spiegel

Erzeugung bei der Laser-LED


Bei Stromfluß in Durchlaßrichtung erfolgt Lichtabgabe durch Rekombination.

Um bei der Abtastung der Informationsebene zwischen hinlaufendem und


reflektiertem Licht zu unterscheiden zu können, also die Phasenlage und Polari-
sationsebene auszuwerten, muß eine Lichtquelle verwendet werden, deren
Strahlung köhärent (gleichphasig über eine längere Wegstrecke) und monochro-
matisch ist.

Die Transparentschicht der CD besitzt die wichtige Aufgabe, der optischen Bre-
chung der Lichtstrahlen und damit die notwendige Fokussierung.
Brechungsindex = sin (Einfallswinkel) / sin (Austrittswinkel)

Die Informationsauswertung funktioniert über den Interferenzeffekt mit λ/2.

Bestandteile des CD-Players


1.Abtastsystem mit Vorverstärker
2.Servoteil Fokus-Servo (Abtastung der Pitspur)
Tracking-Servo " " "
Schlitten-Servo (radial Führung des Abtastsystems)
Disk-Servo (Drehzahl der CD

3.Digitale Signalverarbeitung (Wandlung des EFM-Signals, Aufhebung der


EFM-Codierung, Fehlerkorrektur, Rückwandlung in Audio-Signal mit DAC

4.Ablaufsteuerung (Koordination der Baugruppen und Auswertung des


Bediener-Interface)

Steuerung - des Lademechanismus


- der Motoren
- der Servos
- Ein/Ausschalten des Lasers
- Auswerten der Befehle der
Bedientasten
- Ansteueŕg d. Anzeigeunit
Sprachakustik

Die Erforschung der Gesangsstimme hat elektrische Modellvorstellungen über


den Kehlkopfgenerator als Impulserzeuger und die Klangfarbenbildung in den
Resonanzräumen von Mund und Rachenraum zutage gefördert.

Der Vokaltrakt (Mund- und Rachenraum) wird dabei durch eine künstliche
Leitung nachgestellt, bestehend aus einer Serienschaltung von Induktivitäten
und parallel geschalteten Kapazitäten. Dies ist ein grundsätzlich anderer Weg
als bei früheren Modellen wie z. B. dem Vocoder, bei denen die Spektralenergie
der Sprache in mehrere Frequenzbänder durch Filter unterteilt ist und
demgemäß die synthetischen Sprachlaute aus dem Energiegehalt solcher Ban-
dpaßfilter zusammengesetzt werden.

Der elektrische Vokaltrakt wurde aufgrund von Röntgenmessungen als Leitung


mit verteilten Konstanten angenähert, dargestellt durch 25 unterteilte Stücke,
jedes als ein Zylinder von 0,5 cm Länge und 6 cm2 Querschnitt. Die Leitung ist
durch einen variablen und verschiebbaren induktiven Widerstand unterteilt als
"Zunge" und ein anderer derartiger Widerstand für die Lippe. Die Schwingung
der Stimmbänder ist durch einen Generator hoher Impedanz mit der Wellenform
einer Kondensatorentladung bzw. eines angenäherten Rechteckimpulses. Die
Strahlungscharakteristik wird wiedergegeben durch eine Spannung an einer
kleinen Induktivität am Ausgang der Leitung als Darstellung des Schalldrucks
außerhalb der Stimmbänder. Der Wellenwiderstand der Ersatzleitung hat einen
niederen Widerstand von 6,7 Ω.
Sind Mund- und Rachenraum als zylindrische Körper angenommen, so bildet
sich infolge des Zungenrückens ein verengter Verbindungskanal. Die Schwi-
ngungserzeugung durch die Stimmbänder ist durch den bewegten Kolben am
linken Ende dargestellt. Der hoch-Impedanz-Generator liefert die Strömungs-
geschwindigkeit i0 die bei den Impedanzänderungen im Vokaltrakt konstant
bleibt, sich aber mit der Frequenz ändert. Infolge der Einschnürung durch die
Lippen ergibt sich noch ein vierter Raum. Die Abschlußwand bedeutet das
Gesicht des Sprechers. Die Abstrahlung der Schallenergie erfolgt mit einer
Geschwindigkeit i. die Nasenhöhle wird vernachlässigt, weil sie bei den meisten
Lauten durch das Gaumensegel geschlossen ist. Abb. 3 zeigt, wie ein Zylinder-
abschnitt mit seinen akustischen Konstanten Widerstand Masse und Elektrizität
sich elektrisch durch ein T-Glied von Impedanzen darstellen läßt, die ihrerseits
wieder hyperbolische Funktionen der Frequenz sind. Es ergibt sich dann nach
Abb. 4 die Gesamtschaltung die in Abb. 5 vereinfacht ist.
Die Übertragungsfunktion dieses Kreises läßt sich darstellen als Verhältnis von
Eingangs zu Ausgangstrom über
Die Resonanzstellen werden bei Nullsetzen des Nenners in Abhänigkeit von der
Frequenz

...
Die Modellvorstellung der menschlichen Stimmfunktion wird durch Einbezie-
hung des Raumes, der einen zusätzlichen Impedanzeffekt hervorruft, erweitert.
Die Steuerung dieser Schwingungen erfolgt beim Singen auf neuralem Wege
primär taktil, sekundär vom Gehör her; beim Sprechen ist es umgekehrt. Dies
wird weiter bestätigt durch die Auffassung der Gehörüberwachung als delayed
feedback.
Dabei bestimmt die Verzugszeit die Geschwindigkeit des Sprechens. Diese
Zeitkonstante, die durch die Nachhallzeit und auch Echos bestimmt wird, kann
im Versuch z. B. durch eine Magnetbandaufnahme studiert werden, die mit
Bruchteilen einer Sekunde wiedergegeben wird. Wenn sich der Sprecher auf
den Nachlaut, ohne Verringerung der Sprechgeschwindigkeit einstellt, beginnt
er zu stottern, oder es tritt motorische Aphasie ein. Aus der Berechnung der
Regelfunktion läßt sich die Laufzeit t0 des cochlear-recurrentielen
Regelkreises, d. h. also die Überwachung über das Gehör bestimmen. Die
Regelgröße mach sich nach der Verzugszeit allerdings weniger plötzlich
bemerkbar, sondern nach einer Übergangszeit τ. Das stabile Arbeiten des
Reglers ist gewährleistet, wenn der Regelgrad
ist, wobei α die Größenordnung eins hat.
Z. B. muß für t0 = 1/100 τ der Regelgrad größer als 1/100 sein, d. h. die
Schwankungen werden auf den hundertsten Teil herabgeregelt. Bei einer
Vergrößerung von t0 auf t0 + Δt0 (z. B. durch Nachhallzeit) muß aber auch τ auf
τ +Δτ verlängert werden, um die Stabilität nach der oberen Gleichung
beizubehalten. Die Sprechzeit verlängert sich dann auf das γ-fache
Aus verschiedenen künstlich eingeführten Verzugszeiten bei dem erwähnten
Magnetton-Versuch kann ein Rückschluß für t0 gezogen werden über
E ergibt sich eine Laufzeit des cochlear-recurrentiellen Regelsystems im

Sprechorgan von etwa 70ms, was erheblich mehr ist als die direkte Laufzeit
Mund →Ohr mit 1ms.
Zur Funktion der Selbststeuerung kann eine Vorstellung in einem neuro-ann-
tomischen Modell gefunden werden. Die neuralen Kontrollwege müssen sich
schließen und alle an einer zerebralen Schaltzentrale zusammenlaufen, damit
von dort aus Eingriffe beim Abweichen von den synchronen Funktionen,
bewußt oder reflexartig vorgenommen werden können. Die Länge jeder Sch-
leife ist ungefähr proportional der für die jeweilige Funktion erforderlichen Zeit.
Der Hörapparat ist in Serie bzw. induktiv gekoppelt mit der Stimmschleife für
die Hörüberwachung des Sprechens. In der Zeichnung sind statt der Dutzend
Nervenfibern zur Ausübung der Funktionen symbolisch nur deren zwei
gezeichnet. Dazu gehören die Artikulation verschieden Stellen des Vokaltrakts,
die Atemsteuerung, die Stimmbändersteuerung, der Mechanismus zu Beugung
der Leute usw. An der Schallstelle wird bei abstraktem Denken nur die äußere
Schleife eingeschaltet, bei stummer Artikulation kommt die Artikulations-
schleife dazu, und schließlich sind beim Sprechen alle Schleifen "unter Strom".
Ist das Kontrollorgan Ohr von dem gesprochenen Laut unbefriedigt, so wird
dieser wiederholt. Die Überwachung der kleinsten Schleife - die, der Artikula-
tion - erfolgt taktil oder auf kinästetischem Wege, die der nächsten (stimmhaft)
durch Gehörüberwachung - beide übrigens reflexartig.

Es handelt sich insgesamt um einen cochlear-recurentielellen Regelkreis.


Weiter ergibt sich, daß bei eine mikrophonmäßig optimale Nachhallzeit im
Studio mit T <2s kaum den optimalen Raumbedingungen für den ausgebildeten
Sänger entsprechen würde, da dieser erst bei 2s < T < 4s zur vollen Entfaltung
in den Grenzen ästhetischer Klangqualität gelangt. Allerdings kann sich der
routinierte Sänger von sehr hoher Stufe der Stimmausbildung den
verschiedenen Raumbedingungen bis zu gewissem Grade anpassen.

Erzeugung von Sprache beim Menschen


Der Sprachtrakt (Rachenhöhle, Mundhöhle, Nasenhöhle, Gaumensegel (An-
und Abkopplung der Nasenhöhle)) wird im falle stimmhafter Sprache (Vokale)
am Kehlkopf mit einem quasi periodischen breitbandigen Anregungssignal
(sägezahnförmig, Hai-flossen-artig, mit Amplitudenabfall ≈1/n2 ) bzw. im Falle
stimmloser Sprache (Zischlaute) mit einem Rauschprozeß beaufschlagt.

Nun kann der Sprachtrakt als ein System gekoppelter mechanischer Hohl-
raumresonatoren (ähnlich einer Orgelpfeife) mit veränderbarem Querschnitt und
damit veränderlicher Resonanzfrequenz aufgefaßt werden, welches ver-
schiedene Teile aus dem Spektrum der Anregung herausfiltert.

Die hieraus entstehende Frequenzzusammensetzung ist verantwortlich (und in


gewisser Weise charakteristisch) für den jeweiligen Sprachlaut.
Phonem =kleinste bedeutungsunterscheidende, aber unselbst be-
deutungstragende sprachliche Einheit
Allophon =phonetische Variante eines Phonems in einer bestimmten Umgebung
von Lauten
Format =Aus der Resonanz in der Mundhöhle entstehender stärkster Teil eines
Vokals

Während die Anregung am Kehlkopf hauptsächlich Amplituden- und Tonhö-


heninformationen (abhänig von der Grundfrequenz der Anregung) enthält, wird
die eigentliche "Erzeugung" der Sprachinformation durch Filterung der Anre-
gung im Sprachtrakt (Vokaltrakt) vorgenommen. Dies bedeutet aber auch, daß
die Resonanzfrequenzen als Merkmalsgrößen für einen Mustererkennungs-
prozess herangezogen werden können. Die Resonanzen machen sich im ge-
glätteten Spektrum durch Überhöhungen (Formanten) bemerkbar.
Zur Spracherkennung kann man sich der Cepstralanalyse (siehe Cepstrum), der
inversen Filterung und der linearen Prediktion bedienen.

Die Sprache s(t) ist das Ergebnis einer Faltung zwischen der Pitchfunktion p(t)
(Anregungsfunktion des Kehlkopfes) und der impuls-response funktion, irf, des
Filtersystems des Vokaltraktes.

s(t) = p(t) ★ h(t)

Vergleich des Informationsgehalts zwischen Männer- und Frauenstimme:


Im Frequenzbereich von 300 ... 3400 Hz bringt der Mann 34 Spektrallinen unter
ausgehend von der Sprachgrundfrequenz f0 von 100Hz.
Die Frau hat aufgrund doppelt so hoher f0 nur 17 Spektrallinien.

Im Zeitbereich kann die Frau allerdings ihre Spektren in der Hälfte der Zeit
mitteilen, womit insgesamt eine Produktgleichheit
34 Spektren : 1 T = 17 Spektren : ½T besteht.

Küpfmüllersche Überlegung

Es gibt die Möglichkeit Sprache mit 8 Bit (schon ausreichendes S/N) @ 8KHz
zu samplen, welches 64Kbit/s Datenrate ergibt. Es geht aber auch adaptive
Deltamodulation.
Dann gibt es die Möglichkeit die Sprache mit 40 Sprechlauten zu codieren,
wofür eine 6 Bit Codierung ausreichen würde. Bei 10 Sprechlauten/s ergeben
sich dann 60 Bit/s. Insgesamt eine um den Faktor 1000 geringer Datenrate.
Hierbei geht also die Diagnostik (Informationen über den Sprecher) verloren.

14.03.2009:
Interessant ist die Codierung von Sloot (ein niederländisches Patent).

23.08.2009:
So mit Open-Office geht wohl die Conversion von wpc → doc …

Das könnte Ihnen auch gefallen