A.)1.) Schallfeldgrößen
2.) Elektroakustische Wandlerprinzipien
3.) Schallaufzeichnungsverfahren
Sprachakustik
B.)...
Lit.:
Zum Geleit:
Die vorliegende kleine Abhandlung (zunächst mit Word Perfect 5.0 erstellt)
behandelt interessante Aspekte von Aufnahme- und Wiedergabegeräten, diente
für die Vorbereitung des Verfassers für die mündliche Diplomprüfung im Jahre
1993 im Fach Akustik an der Fachhochschule Frankfurt Main bei Professor
Timme, und basiert stellenweise auf Mitschriften seiner gleichnamigen
Vorlesung.
Die Abhandlung über den Vokaltrakt stammt aus einer Zeitschrift Funk und Ton,
der Sammlung von Herrn Professor Schachenmaier, von denen der Verfasser
einige Jahrgänge retten konnte.
Es würde mich freuen, wenn der geneigte Leser ein paar Anregungen finden
würde. Wie immer, kann man sicherlich noch einiges verbessern.
© Roger Wolf
Schallfeldgrößen
Das Schallfeld ist der von den Schallwellen durchsetze Raum. Er hat keine
definierten Grenzen.
Def.:
Schallschnellev=Augenblicksgeschwindigkeit des Teilchens im
Schallfeld
Schockwellen: Sie können nur entstehen, wenn das Medium an einer Stelle
extrem komprimiert wird, gleichbedeutend mit einer Sprungfunktion entsteht.
Es enstehen Oberwellen. Es liegt eine nichtlineare Kennlinie vor.
Die Resonanzkatastrophe setzt bei der Grenze der Elastizität ein.
@1Khz → λLuft = 34 cm
Zur Polarisation
wobei
(1) h=Höhe V=Volumen A =Fläche
des Schallfeldausschnittes
t =Zeit und v0 =Schallschnelle ist.
Betrachten wir das Volumen des Schallfeldes als Säule mit
V=A·h und aus c = h / t => t = h / c so wird nach einsetzen in (1)
(2) wobei
h= Höhe des Schallfeldauschnittes
v0= Amplitude der Schallschnelle
Anm.: Die obige Formel ist sehr theoretisch, da sich die Schallschnelle v0
schlecht feststellen läßt (z.B. durch die Raleigh’sche Scheibe) und der Schall-
druck p überhaupt außen vor bleibt.
wobei
(3) p0=Amplitude des Schalldruck
h =Höhe des Schallfeldausschnittes
c =Schallgeschwindigkeit
Akustische dB-Skala
Phon = 10· log10 (I(f) /I0 (f))hier ist die Schallintensität von der Frequenz abhänig
und wird aus der Hörkurve entnommen
Anm.:
die Kurve des dB(A) Bewertungsfilters ist die invertierte (d.h. nach oben
geklappte) Hörkurve des Menschen. Allerdings wird die Kurve natürlich grob
vereinfacht um die Filterordnung klein zu halten. Im Bereich von 1..2KHz ist
Phon≈dB
Die Aufgabe des Mikrophons besteht darin, die von einer Schallquelle, z. B.
einem Musikinstrument oder der menschlichen Stimme, herrührenden Schall-
schwingungen in elektrische Spannungen zu verwandeln. Die Umkehrung ist
der Lautsprecher. Aber nur die meisten oder einige Verfahren sind umkehrbar.
0.) Kohlekörner-Mikrophon
Nachteile:Die Widerstandserhöhung, die unter dem Einfluß der Schallwellen
zwischen den Köhlekörnern auftritt, folgt nur teilweise oder ungenau den
Feinheiten der Tonkurve. Unter Umständen werden bestimmte Frequenzen
benachteiligt, andere wieder bevorzugt. Es kann sogar so weit kommen, daß
neue Frequenzen erzeugt werden, die in den Schallwellen überhaupt fehlen. Wir
wollen jedoch eine möglichst naturgetreue Umformung des Schalls in
elektrische Spannungen. Dieser Forderung widersetzt sich das Kohlekörner-
Mikrophon. Allerdings kann mit hohen Spannungen und ohne Zwischenver-
stärkung gearbeitet werden, was für die Anwendung in der frühen Telefonie ein
Vorteil war.
1.)Elektrodynamisches Prinzip
Es funktioniert als Mikrophon und Laustsprecher. Die Spule bewegt sich in
einem Dauermagnetfeld. Nach dem Induktionsgesetz wirkt eine Gegenspannung
2.)Elektromagnetisches Prinzip
Zum Aufbau:
Über einem U-Magnet ist eine ferromagnetische Platte in einem gewissen
Abstand (Luftspalt = mag. Wid.) angeordnet. Auf den einen Polschuh des
Magneten ist eine Spule aufgewickelt. Im Kreis liegt durch den Dauermagneten
eine magnetische Vorspannung an. der Dynamikbereich ist von diesem Offset
bis zur Abszissen-Achse gegeben. Bei Übersteuerung werden die Bereiche an
der Abszissen-Achse umgeklappt bzw. gespiegelt welches einem Gleichrichter-
effekt entspricht. Das äußert sich in Klirrfaktor, da nach der Fourierzerlegung
neue Frequenzen hinzugekommen sind.
Der Dauermagnet ist notwendig, sonst würde sich die doppelte Frequenz
ausbilden.
3.)Kondensatorprinzip
Zum Aufbau:
Es besteht aus einer festen Platte A und einer sehr dünnen leicht durchbiegbaren
Membran B, die in geringem Abstand der Platte A gegenübersteht. Beide Platten
sind durch Zwischenstücke C voneinander isoliert. Man verbindet nun die Platte
B mit einem Wid. R, dessen unteres Ende an dem einen Pol einer Gleich-
stromquelle U liegt. Der andere Pol dieser Stromquelle ist mit der Platte A
verbunden. Die beiden Platten A und B bilden zusammen einen Kondensator,
der von der Stromquelle U über den Widerstand R aufgeladen wird.
Treffen nun Schallschwingungen auf die dünne Membran B, so beginnt diese
mehr oder weniger stark zu schwingen und folgt dem Amplitudenverlauf des
Musiksignals. Dies ist gleichbedeutend mit kleinen Änderungen des Abstandes
zwischen B und A, so daß sich die Kapazität des Kondensators im Rhythmus
der Schallwellen ändert. Die kleinen Kapazitätsschwankungen führen natürlich
auch zu Stromschwankungen im Ladekreis und damit zu Span-
nungsschwankungen am Widerstand R. Wird beispielsweise die Kapazität in
einem kleinen Zeitaugenblick durch Verkleinern des Abstandes zwischen A und
B vergrößert, muß die Stromquelle U e- in die jetzt größere Kapazität liefern.
Wir die Kapazität in einem best. Zeitpunkt kleiner, so fließt ein Teil der e- in
umgekehrter Richtung zur Stromquelle zurück. Die Vibrationen der Membran B
erzeugen also letzten Endes einen Wechselstrom und damit einen Wechsel-
spannungsabfall im Widerstand R, der genau dem zeitlichen Verlauf der auf die
Membran B treffenden Schallschwingung entspricht. Will man die an R auf-
tretende Gleichspannung vollkommen ausschalten, so kann man einen Koppel-
kondensator vorsehen, der nur die Wechselspannung durchläßt.
Die vom Kondensatormikrofon gelieferte Wechselspannung spiegelt sehr ver-
zerrungsfrei den Kurvenverlauf der Schallschwingung wider. Außerdem ist die
abgegebene Wechselspannung an R in weiten Grenzen von der Frequenz der
Schallwellen unabhänig. Allerdings ist die vom Kondensatormikrophon
gelieferte Wechselspannung außerordentlich klein. Damit muß der Widerstand
R groß sein, was große Empfindlichkeit gegenüber Einstreuungen bewirkt und
somit kurze Leitungsführung erfordert, da die eingestreute Spannung von R die
Möglichkeit verbietet, kurzgeschlossen zu werden.
Die Gleichung C = ε0 εr · A/d ist nichtlinear. Die Größe d ist eine hyperbolische
Funktion der Form y = 1/x. Die Ladung ändert sich auch Q = C·U=
Bei der Verwendung als Lautsprecher brauche ich große Flächen und großen
DC-Offset (hohe Betriebspannung) über den dann die Wechselspannung mit
ausreichender Dynamik schwingen kann. Durch die große Fläche entsteht einen
relativ linearer Zusammenhang.
5.) Elektretprinzip
eine spezialbehandelte Teflonfolie behält durch starke Erhitzung eine elek-
trische Vorspannung oder polarisierte (eingefrorene) Ladung. Auf der Oberseite
liegt mehr positive Ladung, auf der Unterseite mehr negative Ladung. Teflon
hat keine freien Elektronen (Isolator).
Diese Folie wird nun zwischen zwei metallische Platten gebracht, die Elek-
tronen leiten können und von der Folie influenziert werden. Damit ist keine
Versorgungsspannung nötig. Hier bleibt Q konstant Q= = C∼ · U∼ . Es ändert
sich die Kapazität.
Der Elektret läßt sich als Lautsprecher in einem Dynamikbereich bis zur Eigen-
spannung verwenden, darüber hinaus entstehen die Verzerrungen aus dem
Gleichrichtereffekt. Der Wirkungsgrad ist gering.
Mann kann auch hier wieder die Fläche und angelegte Spannung erhöhen.
6.) Piezo-Prinzip
Der piezoelektrische Effekt beruht auf positiven und negativen Ladungsträgern
innerhalb der Kristallstruktur, die bei Anlegen einer Spannung Verschiebungen
der Ladungsschwerpunkte im Kristallgitter hervorrufen und umgekehrt für
Spannungsänderungen an den Grenzflächen des Kristalls sorgen, wenn das
Material durch mechanische Kräfte verformt wird.
Im Prinzip funktioniert der Schalleffekt bei allen Kristallen, jedoch ist unsicher,
ob sich die minimalen Lageveränderungen auch makroskopisch auswirken.
7.) Transistor-Prinzip
in einem Transistor mit p n p - Schichtenfolge wird über eine Nadel der Schall
auf die n - Schicht eingekoppelt, was eine Spannungsschwankung hervorrufen
soll. Dieser Effekt ist erst ansatzweise erklärbar und funktioniert nur bei
manchem Transistor. Der Transistor-Effekt ist unumkehrbar.
8.) Plasma-Prinzip
Plasma ist der vierte Aggregatzustand, wobei alle Atome durch starke Ener-
giezufuhr vollständig dis-soziiert sind. Zwei Kohlestäbe (Elektroden) mit
Luftspalt werden von dem zu übertragenden Signal mit starker Energiezufuhr
und niedrigem Wirkungsgrad über einen Schweißtrafo (U ↑ , I ↓) angesteuert.
Es liegt eine masselose kleine Membran vor, mit der hohe Frequenzen ab-
gestrahlt werden können.
Insgesamt liegt ein Dauerexplosion mit zu- und abnehmender Kugelfläche vor,
da zwischen den Elektroden ein Feuerball mit variabler Größe entsteht.
Der Plasmaball bewirkt aber auch eine Signalverzerrung.
Die Luft zwischen den Elektroden wird ionisiert, es entsteht Ozon.
9.) Lichtwandlerprinzip
Der Laserstrahl besitzt eine gauss’ähnliche Helligkeitsverteilung.
Auch die bei Streuung durch Staubteilchen entstehende Strahldivergenz ge-
horcht gauss’förmig.
Im Abhörfall wird der Laserstrahl von einer beweglichen Fensterscheib reflek-
tiert und in Ruhelage auf eine Fotozelle gerichtet. In Abhängigkeit der Durch-
biegung der Fensterscheibe durch den Schall im Raum wird der Lichtstrahl aus-
gelenkt und der Auftreffpunkt des Strahls ändert sich, womit die Fotozelle ein
anderes Spannungspegel abgibt. Damit wird die Bewegung der Scheibe in eine
Winkelmodulation umgesetzt. Bei Dreifachverglasung schwingt die innerste
Scheibe am meisten, die äußere wird am stärksten durch Straßenlärm ausge-
lenkt.
Schallaufzeichnungsverfahren
bei
1. Schallplatte
2. Magnetton
3. Lichtton
4. CD
Bei der Schallplatte läuft die Nadel von außen nach innen, bei der CD von innen
nach außen.
Die effektive Breite für die Schallaufzeichnung auf der Schallplatte ist 10 cm,
bei dPlatte = 30 cm, dLabel = 10 cm. Für 20 Minutenspieldauer und der Umdreh-
ungsgeschwindigkeit von 33⅓/min ergeben sich 666 Rillen je Plattenseite und
bei 100μm Spurabstand ergeben sich 150μm Rillenbreite.
Stereo wird bei der Schallplatte durch Tiefen- und Seitenschrift, sowie der Dre-
hung um 45 Grad erreicht. Bei der Tiefenschrift wird die Amplitude in die Tiefe
aufgezeichnet, also nach unten orientierter Offset (Versatz) in Ruhelage.
Bei der Seitenschrift ist die Mittellage die Ruhelage, die Ausrichtung erfolgt
nach links und rechts entsprechend.
hängt entscheidend von den Eigenschaften der Abtastnadel und des Abtast-
trägers ab und fordert1.unverfälschte Abtastung der Plattenmodulation
2.minimale Qualitätsbeeinträchtigung bei kleine Fehljustagen
von Tonarm und Nadel
3.minimaler Plattenverschleiß
4.minimale Nadelabnutzung
Bei der Schliff-Geometrie der Abtastnadel ist zu beachten, daß die Nadel tief in
die Plattenrille eingreift, ohne jedoch den Rillengrund zu berühren, sonst kommt
es zu starken Nebengeräuschen und ungleichmäßiger Abtastung der Rille.
Deshalb soll die Berührungsfläche etwas auf der halben Höhe der Rillenwände
liegen, was einen optimalen Verrundungsradius der Nadelkuppe von 15μm bei
Stereorillen bedingt.
Eine exakte Lage der Nadel in der Rille ist jedoch unausreichend, um eine ein-
wandfreie Wiedergabe zu erhalten. Die Nadel muß nämlich beim Abspielen
auch in der Rille bleiben. Bei zu geringer Auflagekraft springt die Nadel aus der
Rille, eine zu große Auflagekraft bewirkt eine geringfügige Abweichung von
der exakten Rillenführung, welche, darüber hinausgehend dass sie die
Wiedergabequalität beeinträchtigt, auch Schäden an der Nadel und an der
Schallplatte verursacht.
Kräftebetrachtung
Ausgehend von einem Abstand der Berührungspunkte von 5μm, bei unendlich
harten Rillenflanken ergibt sich nach
Der Schleifvorgang zwischen Platte und Nadel beim Abtasten einer Schallrille
bewirkt bei der hohen Belastung auch beim härtesten Diamanten einen
Abschliff und damit eine Veränderung der Abtastbedingungen.
Die Abnutzung geht bei der neuen Abtastnadel durch die fast punktförmige
Auflagefläche zunächst schnell vor sich. Es schleift sich eine ellipsenförmige
Fläche (Schiffchen) an, womit gleichzeitig die Abnutzungsgeschwindigkeit
durch die Vergrößerung der Auflagefläche herabgesetzt wird.
Bei weiterem Abschliff paßt sich die Nadel der Rillenform an und gelangt mit
der Spitze auf den Rillengrund, was Nebengeräusche und Rauschen bewirkt und
außerdem die Möglichkeit für unverzerrte Wiedergabe verschwindet. Der
Zustand der Nadel hängt weitgehend vom Pflegezustand der Platte ab.
Wenn die Spitze der Nadel durch mechanische Beschädigung (Schlag oder
Stoß) abgesplittert ist, wird die Wiedergabe zwar bereits nur teils unmöglich,
aber es empfiehlt sich stets aufmerksam der akustischen Wiedergabe zu lau-
schen. Bei plötzlich verzerrter Wiedergabe oder erhöhtem Rauschen, ist der
Abtaststift mit Sicherheit beschädigt und muß ausgewechselt werden, sonst wird
die Schallrille beschädigt. Staub und tiefe Kratzer ärgster Feind der Abtastnadel.
Darüber hinaus, dass der Tonarm die Aufgabe hat, das Tonabnehmersystem zu
halten, soll er auch dafür sorgen, daß die Abtastnadel durch die
Schallplattenrille ohne nennenswerte Kräfte geführt wird. So spielt für ein
verzugsfreie Wiedergabe die Geometrie des Tonarms, seine Lagerung, die
Nadelauflagekraft, das anti-skating (Schlittern-Ausgleich) eine Rolle.
Kanal/Übersprechdämpfung
ist das in dB gemessene Verhältnis, das angibt, welchen Einfluß das Signal des
einen Kanals auf den anderen Kanal hat. Abgesehen vom inneren Aufbau des
Tonabnehmer Systems ist die exakte Senkrechtstellung des Abtastsystems zur
Plattenoberfläche zu beachten. Schon eine geringe Verkantung wirkt sofort auf
die Kanaltrennung, die von der geometrischen Auslegung des Tonarms abhänig
ist und auch auf unkorrekte Befestigung des Systems zurückgeführt werden
kann.
CD Schallplatte
Durchmesser [cm] 12 30
Winkelgeschwindigkeit, 200...500 33⅓ bzw. 45
Drehzahl [U/min]
Abtastgeschwindigkeit [m/s] 1,2...1,4 0.2...0.5
Übertragungsbereich [Hz] 5...20.000 30...>20.000 ist von Gerät
zu Gerät sehr unterschied-
lich
Frequenzgang [dB] ± 0.5 stark vom getrieben Auf-
wand abhängig und von der
Anzahl der Abspielvorgänge
der Platte
S/N [dB] >90 >60
Übersprechdämpfung [dB] >90 <35
Klirrfaktor [%] <0,01 <2 außen, 10 innen. Die 10
0.5 würden schon sind weniger auffällig, da es
sehr stark auffallen vor allem den k2 betrifft
Gleichlaufschwankungen von der Mechanik < 0.1
[%] weitgehend
unabhängig, da
quarzgesteuert
Spurabstand [μm] 1,6 ca. 100
Abtastung berührungslos, mechanisch, rillengeführt
laseroptisch
Rillenverlauf von innen nach von außen nach innen
außen
Kanalanzahl [] 2 (4) 1 oder 2(4, CD-4 FM Verf.)
Spielzeit [min] 1 x 60 oder 75 2 x < 35
Empfindlichkeit gegenüber gering groß
Staub
Verschleiß beim Abspielen fehlt soweit stark
Titelzugriff bequem über mit Fingerspitzengefühl von
Elektronik Hand möglich
Insgesamt wird damit teuere Mechanik durch billiges Silizium ersetzt, da eine
analoge Aufnahme mit CD-Parametern sehr teuer wäre.
2. Magnettonverfahren
Beim Aufbau des Tonbandkopfes spricht man zwar von einem Ringkopf,
trotzdem hat der Eisenkern eine ungefähr rechteckige Form. Der Kern muß aus
hochwertigem Dynamoblech oder Ferrit bestehen und sehr verschleißfrei sein,
um zu verhindern, dass der Kern von dem vorbeilaufenden Bandmaterial
abgeschliffen wird. Als Spalteinlage dient eine Folie aus sehr harten
Berylliumkupfer oder Glimmer. Um bei langsamen Bandgeschwindigkeiten
hohe Frequenzen noch gut aufzuzeichnen, muß der Spalt schmaler sein, als die
sich ergebende Wellenlänge aus der höchsten aufzuzeichnenden Frequenz.
Dabei gilt
d. h. bei einer Bandgeschwindigkeit von v = 9,5 cm/s und einer maximalen Fre-
quenz f = 16KHz ergeben sich zuerst
Die Spaltbreite muß also kleiner als die halbe Wellenlänge der höchsten Si-
gnalfrequenz sein.
Dieser feine Spalt ist mit bloßem Auge bereits unsichtbar und verlangt äußerst
präzise mechanische Fertigung. Dann muß er gerade sein, da sich sonst die
Halbwellen bei hohen Frequenzen überschneiden und verlorengehen, was in
eine deutlich hörbare Höhenabsenkung zur Folge hat. Da die vom Band abgeta-
steten Magnetfelder außerordentlich klein sind, muß jede Einstreuung von
fremden Störfeldern vermieden werden, da z. B. die 50-Hz-Brummspannung
aus dem Lichtnetz verehrende Folgen haben können. Deswegen sind die Ma-
gnetköpfe im Heimbereich sorgfältig abgeschirmt.
Die Kopfspule wirkt als induktiver Widerstand. Schließt man sie beim
Aufsprechen einfach an den Ausgang eines Verstärkers an, dann würde bei
hohen Frequenzen infolge des großen induktiven Widerstandes nur ein kleiner
Strom fließen und das Band zu wenig magnetisieren, was aber gerade bei
höheren Frequenzen wünschenswert ist. Daher legt man beim Aufsprechen mit
der Kopfwicklung einen größeren Widerstand R (30...200KΩ) in Reihe, da dann
der Strom in diesem Kreis überwiegend von R bestimmt wird und über einen
weiten Frequenzbereich konstant bleibt. Durch zusätzliche Maßnahmen werden
die Höhen noch angehoben um die Spaltverluste auszugleichen.
Das bedeutet, die Frequenztreue beim Magnettonverfahren ist "ausreichend",
bei der Phasentreue durch den induktiven Widerstand der Kopfspule fehlt das.
Bei Aufnahme wird die Information um 90 Grad versetzt, bei der Wiedergabe
nochmals um 90 Grad gegenüber dem Original.
Beim Abspielen tritt ein entgegengesetzer Effekt auf. Es gilt wieder das dy-
namische Prinzip: Magnetfelder und Bewegung ergeben Spannungen in der
Spule. Langsame Magnetfeldänderungen ergeben geringere Spannungen. Dies
trifft für tiefe Frequenzen zu, weswegen die tieferen Töne angehoben werden
müssen. Das bedeutet insgesamt, daß Tonbandverstärker mit kräftiger Höhen-
und Tiefenanhebung arbeiten müssen.
So wäre Linearität möglich, wenn das Band linear wäre, aber wegen den
Hystereseeigenschaften muß deswegen stark in das Frequenzverhalten einge-
griffen werden. (Würde man das Band nur im linearen Bereich betreiben wäre
die Dynamik viel zu gering.) Für den Tonkopf wird Material mit schlanker
Hysterese (magnetisch weich) und für das Band Material mit breiter Hysterese
(magnetisch hart, für gute Speicherung) verwendet
Da das Magnettonverfahren mit einem Spalt arbeitet, muß eine Definition der
Spaltfunktion folgen, die nachher nochmal auf dieses Verfahren angewandt
wird.
Die Spaltfunktion kann mathematisch als Produkt aus der Sinusfunktion mit der
Hyperbel 1/x angesehen werden. Sie ist die Fourier-Transformierte der Π-
Funktion (Rechteck-fkt.) des Spaltes, da der Spalt ein Rechteckfenster ist.
Die Spaltfunktion ist bezogen auf das Argument x als Winkel im Bogenmaß.
Diese Form ist allgemeingültig und kann durch Aufteilung nach Ort und Zeit
auf verschiedene Gebiete übertragen werden. Da ein Winkel durch ωt ersetzt
werden kann und ω wie t getrennt als Variable aufgefaßt werden können, ergibt
sich eine Skala verschiedener Spaltdimensionen,
wobei
dΘ= Flußänderung im
dt= Zeitabschnitt von n = Windungen ist,
folgt die Wiedergabespannung der zeitlichen Ableitung des Flußes, ist also
proportional zur Frequenz und zur Spaltfunktion. Die dargestellte Kennlinie
zeigt, daß eine Ausnutzung im Linearen Bereich maximal bis zur Frequenz
f = v / 2s gehen kann. Im realen System liegen eine Anzahl weiterer Einflüsse
vor (z. B. Selbstmagnetisierung), die grobe Abschätzung des ausnutzbaren
Bereiches bleibt davon jedoch unberührt. Es versteht sich, daß der durch die
Spaltfunktion hervorgerufene Abtastfehler auch bei Videorecordern eingeht.
Vorteile
-Einlegen des Bandes ist bei Spulengeräten komplizierter als das Auflegen einer
Schallplatte
-Aufsuchen bestimmter Stellen dauert lange
-Bandmaterial ist teurer als Schallplattenvinyl
Löschvorgang
Voraussetzung für eine Magnetbandaufnahme ist ein völlig entmagnetisiertes
Tonband. Das geschieht bei der Aufnahme durch den Löschkopf, der alle Teile
des Bandes bis zur Sättigung magnetisiert und unter mehrmaligem Durchlaufen
der Hystereseschleife mit sinkender Wechselfeldstärke allmählich bis in den
Nullpunkt entmagnetisiert. Dabei wird der Selbstmagnetisierungseffekt ausge-
nutzt, d. h. je kürzer die aufgezeichnete Wellelänge bei einer best. Bandge-
schwindigkeit v ist, desto kleiner sind die sich in der magnetischen Sicht aus-
bildenden Stabmagnete und desto weniger Feldlinien treten aus dem Tonträger
aus. Dies kann so erklärt werden, daß sich die Magnetisierung der magnetischen
Teilchen mit wachsender Frequenz gegenseitig mehr und mehr aufhebt.
3. Lichttonverfahren
Beim kommerziellen Kinofilm läuft der Film diskontinuierlich, und der Ton
läuft in einem Bereich, wo er kontinuierlich bewegt werden kann, deswegen
laufen Bild und Ton vom Ort her asynchron.
1. Intensitätsverfahren
Hier wird die Transparenz des längs zum Filmstreifen abgebildeten Spaltes
proportional zwischen Minimal- und Maximalwert geändert, wobei die
Unterschiede in der Schwärzung = Lautstärke-Unterschiede bedeuten und die
Unterschiede in der Dichte der Linien = Frequenz-Unterschiede darstellen.
Die Tonspurbelichtung geschieht entweder durch unterschiedliche Abbildung
des Lichtspaltes mittels eines der der Amplitude proportional auslenkbaren
Spiegels oder über eine bewegliche Spaltblende von 2 mm Länge und 10 μm
Breite.
2. Schwarz-Weiß-Verfahren (Envellope-Verfahren)
- Dolby
Über Kompression wird der Geräuschspannungsabstand verbessert und beim
ältern Tonfilm mit schlechter Dynamik Gleichwertigkeit mit der Schallplat-
tenwiedergabe erreicht.
- Digitalverfahren
Bei der Digitalaufzeichnung werden die n Bit mit Laser so aufgezeichnet, wie
sie nebeneinander dargestellt werden. Bei Wiedergabe wird die gespeicherte
Toninformation, mittels Laserstrahlen abgetastet, über ein Fotoelement emp-
fangen und analog rückgewandelt.
Wie beim Magnettonverfahren muß der Spalt möglichst schmal sein. Der Grad
der Schwärzung gibt die Amplitude des Signals an. Je nach Belichtung und auch
nach Entwicklungsvorgang wird die lichtempfindliche Schicht geschwärzt.
wobei
Die Transparenzdifferenz TD ein Maß für das vom Fotoelement umgewandel-
te Signal ist mit den Größen
En=erstes Flächenelement mit Leuchtdichte E
En+1=zu En benachbartes Flächenelement mit Leuchtdichte E
und
S =Schwärzung aus
H=fotometrische Belichtung
Da der Film nur in eine Richtung schwärzbar ist, das Schallereignis aber bipolar
ist, muß der Amplitudenwert Null genau in die Mitte des Schwärzungsbereiches
gelegt werden. Dann ist zu beachten, daß die Schwärzungskurve wie beim
Verstärker gekrümmt ist (→Verzerrungen). Eine Kompensation zur Erweiterung
des Dynamikbereiches ist unmöglich, da jedes Filmmaterial unterschiedlich
ausfällt. Dies hängt mit dem Reifeprozess der AgBr-Emulsion des Filmmaterials
zusammen.
4. CD-Player
Vom analogen Signal zur
(Dpaint-II)
- sample phase
Der Kondensator kann bei den relativ kurzen Abtastintervallen von 22,7μs
weniger als unendlich schnell geladen werden, weil dies durch den
Innenwiderstand des Analogschalters und der vorangegangenen Treiberstufe
unmöglich ist. Diese bedingt eine gewisse Zeit (aquisition time). Die An-
stiegsgeschwindigkeit mit der sich der Kondensator auflädt, wird von einer
Zeitkonstante bestimmt.
- hold phase
Während der Haltephase geschieht ein Ladungsverlust (dropping), da sich
der Kondensator über sein Dielektrikum und über Rest- und Sperrwider-
stände entlädt.
3. Analog-Digital-Wandlung
Hier erfolgt die Umwandlung der einzelnen Amplitudenwerte in eine binäres
Digital-Signal (Quantisierung)
Quantisierung
Dabei steht die Überlegung dahinter, daß Eingangssignale mit hohen Pegeln
wesentlich seltener auftreten, als solche mit niedrigen Pegeln, was somit nur
eine Änderung in den niederwertigen Bits bewirkt, da die die gesamte Wortb-
reite nur selten ausgenutzt wird. Der untere Pegel-Bereich wird höher aufgelöst
als der obere, die entstehenden Signalverzerrungen werden in Kauf genommen.
Die Begrenzung der Wortbreite geschieht, indem das Signal vor der Quanti-
sierung durch eine Kompanderschaltung läuft, die hohe Pegel stärker kompri-
miert und dann gewandelt wird. Oder durch spezielle A/D-Wandler, die über
eine logarithmische Funktion die Quantisierungsintervalle in Abhängigkeit von
der Eingangsamplitude stufen.
Wandlerverfahren
1. Integrationswandler
Rampenwandler (Single slope, dual slope)
Allen Wandlertypen ist gemeinsam, daß die Eingangsspannung mit der
Spannung des Integrators als Referenzwert verglichen wird.
Die wichtigsten Komponenten bilden ein Integrator, ein Komparator und ein
Binärzähler.
3. Einbit-Wandler
- Linearitätsfehler
Abweichung von der geradlinigen Stufung bei linear ansteigender Eingangs-
spannung.
- Offsetfehler
Verschiebung des Gleichspannungsniveaus, damit Verschiebung der binären
Ausgangswerte des A/D-Wandlers und Begrenzung des Aussteuerbereiches
für positive oder negative Eingangsspannung.
- overflow errors
Bei Überschreiten der für jeden A/D-Wandler typischen maximalen Ein-
gangsspannung, werden die Wandlerstufen übersteuert, worauf der Wandler
ständig mit einem binären Ausgangsignal der höchsten Wertigkeit oder dem
Komplement dazu reagiert. Das Verhalten ist absolut schon unlinear.
Die während der Wandlung auftretenden Fehler addieren sich und verursachen
Verzerrungen, die sich anders verhalten als bei analogen Systemen.
Verzerrungen in digitalen Systemen besitzen in der Regel keinen natürlichen
Oberwellengehalt, sondern entstehen hauptsächlich durch Kombinationsfre-
quenzen. Noch ein wesentlicher Unterschied zur analogen Signalverarbeitung
liegt darin, daß die Verzerrungen bei der digitalen Signalverarbeitung bei
kleinerer Aussteuerung zunehmen.
4. Codierung
Nach dem A/D-Wandler liegt eine binäre Aussage über die Höhe des Ampli-
tudenwertes (Quellcodierung) vor, allerdings ohne die Aussage, ob der abgeta-
stete Wert aus der positiven oder negativen Halbwelle stammt. Deswegen muß
bei Umwandlung eines bipolaren Signals das binäre Ausgangssignal des ADC
mit Polaritätserkennung über das Zweierkomplement erfolgen.
In einer Periode können optimal zwei Bit übertragen werden. Die Bandbreite
errechnet sich damit aus der halben Datenrate.
Insgesamt wird ersichtlich, daß bei der digitalen Übertragung ein Vielfaches an
Bandbreite benötigt wird. Bei Erhöhung der Quantisierung oder fg muß auch der
Aspekt der Bandbreite betrachtet werden.
Fehlerkorrektur
Es treten Single bit errors und burst errors auf. Die Ursache können soft oder
hard errors sein
Fehlerkorrektur durch
Für den Fall, daß ständiger Wechsel von Hi nach Low vorliegt, kann das NRZ-
Signal als hochfrequente Schwingung der halben Datenrate angesehen werden.
Ein Ü-Kanal mit BP-Eigenschaften wie beim Magnetband, kann nur indirekt
mit einem NRZ-Signal angesteuert werden, da eine Folge mit ununterbrochenen
Folgen aus Hi- und Lo-Pegeln eine Ansteuerung mit reinem DC bedeutet.
Dann produzieren die Ü-Kanäle Zeitbasisfehler, die die korrekte Auswertung
der NRZ-Signale erschweren.
Tw = Jitter margin oder window margin = Zeitfenster bei der Auswertung des
Datensignals. Durch Gleichlaufschwankungen und andere Störungen entsteht
der Jitter. Wenn der Jitterfehler zu groß ist, z. B. zwei Signal zu unterschiedli-
chen. RLL hat für den Abstand zwischen zwei Pegeländerungen Tmin und Tmax.
Aus Tmin ist die höchste aufzuzeichnende Wellenlänge bei Magnetbandauf-
zeichnung bestimmt.
CIRC-Kodierung
CIRC = Cross Interleave Reed Solomon Code = Blockcode, der die Daten-
wörter aufnahmeseitig in einer Matrix anordnet und aus Spalten und Zeilen
Quersummen bildet.
Nun wird an die 6 Abtastwerte ein Kontrollsignal aus einem 8-bit Symbol ange-
hängt (bits P-W = Control&Display bits). Es ist zu unterlassen, Vorstehendes
mit den Kontrollsymbolen P und Q zu verwechseln.
Nun wird aus 98 aufeinanderfolgenden Frames mit den Kontrollsignal-Sym-
bolen ein weiterer Datenblock (Steuersignalblock (subcode)).
Die Wiederholrate des subcode ist framerate : 98 = 7350Hz : 98 = 75Hz.
Jede Sekunde Spielzeit ist somit in 75 Einheiten eingeteilt
EFM-Codierung
Bei der CD wird EFM = Eight to Fourteen Modulation angewendet, da nach
Untersuchungen eine optimale Anpassung an den Übertragungskanal des CD-
Systems erreicht wird, wenn im übertragenen Datenwort die Bedingung in der
Reihenfolge der 0-1-Wechsel beachtet wird:
Zwischen zwei binären 1-Werten müssen mindestens zwei binäre 0-Werte auf-
treten, maximal dürfen aber nur 10 binäre 0-Werte hintereinander erscheinen.
(→Lauflänge Tmin = 3 und Tmax = 11)
Diese Bedingung erfüllt erst ein 14-Bit Datenwort, da ein 8-Bit Datenwort diese
geforderte Lauflängenbestimmung untererfüllt, da innerhalb der 256 möglichen
Datenwörter alle Bitkombinationen auftreten können. (Unter den 214 = 16384
möglichen Bitkombinationen gibt es 267 Datenwörter, von denen die 11
übriggebliebenen gestrichen werden.)
Die Umcodierung geschieht über ein ROM als Wörterbuch.
Da die Kanalanpassung immer noch alles andere als optimal ist, werden zur
Reduzierung des DSV-Wertes noch zusätzliche Koppelbits (mergin bits)
eingefügt, die keine Information enthalten, aber durch die min. und max.
Lauflänge des code festgelegt werden. Droht die Lauflänge zu kurz zu werden,
werden die mergin bits auf 0 gesetzt, bei zu langer Lauflänge werden sie auf 1
gesetzt.
Durch die Optimierung des DSV-Wertes wird erreicht, daß im abgetasteten
Datensignal keine Störanteile im Bereich der Servosteuersignal >20KHz auf-
treten.
Datenrate im Übertragungkanal
Bedingt durch die Kanalcodierung und die mergin bits verändert sich die
bisherige Frame-Struktur von 264 auf 561 bits. Zur späteren Selektion der
einzelnen Frames aus dem Datenstrom und zur Syncronisation der Drehzahl der
CD, werden noch 24 sync bits an den Anfang eines jeden Frames gestellt, die
über drei mergin bits an die bisherige Framestruktur angekoppelt werden.
bitsfor
================================
24sync 00.04%
14Kontrollbits 00,02% (bilden den Subcode)
112parity 19,04% zur CIRC-Fehlerkorrektur
102mergin 17,34%
frame_rate = 7350Hz
x_mission_chn= frame_rate·chn_bits
= 7350 ·103·588
= 4,3218Mbit/s (Datenrate im Übertragungskanal)
EFM ist ein aus dem MNRZ-I abgeleiteter Code mit m=8 (Kanalbits) und
n=14 Datenbits.
MNRZ-I = Modified NRZ-I. Hierbei werden m Datenbits durch Hinzufügen
von weiteren Pegelübergängen in n Kanalbits umgewandelt.
Beim NRZ-I = non return to zero inverse wird eine bin. 1 durch einen Pe-
gelsprung in der Mitte der Bitzelle dargestellt.(Nachteil: Code hat sehr viel
Gleichspannungsanteil und ist fremdtaktend.)
- D/A-Wandlerverfahren
Die Fehler bei D/A-Wandler sind wie die bei der A/D-Wandlung vorher behan-
delten. Dazu kommt noch die Einschwingzeit, die vergeht, bis sich die Ausg-
gangsspanung nach Anlegen der Eingangsinformation auf ± ½ LSB eingestellt
hat.
Dann treten zwischen zwei Umsetzvorgängen zusätzliche Störsignale auf die als
glitches bezeichnet werden, die am häufigsten in der Mitte des binären Wertebe-
reiches auftreten: Das MSB sei low und die anderen Bit high. Die Eingangs-
wertigkeit sei jetzt um 1 niedriger wird das MSB high und die anderen Schalter
low. Durch ungleichmäßiges Schalten der einzelnen Bits wird für kurze Zeit ein
falscher binärer Eingangswert vorgetäuscht. Der D/A-Wandler springt dabei für
kurze Zeit zu positiven oder negativen Werten hin.
Am Ausgang des TP-Filters mit der Grenzfrequenz fmax und idealer, rechteckiger
Filtersteilheit entsteht bei Aussteuerung mit einem Dirac-Stoß (unendlich steiler,
kurzer Impuls) ein zeitlicher Verlauf der der Funktion
Praktisch muß jedoch von einer endlichen Breite der Abtastimpulse ausge-
gangen werden, da die Demodulation von Nadelimpulsen zu geringen Pegel und
damit einen ungünstigen S/N in der Demodulatorschaltung ergäbe. Die Ver-
breiterung erfolgt im Halteglied, in dem die PAM-Impulse mit der Amplitude A
über das gesamte Abtastintervall TA gehalten werden . Das bedeutet für die
Übertragungsfunktion G
einen Amplitudenabfall mit steigender Frequenz f (Apertur), was mit Hilfe einer
Entzerrerschaltung kompensiert werden kann.
Oversampling
Wenn auf störungsfreie Widergabe Wert gelegt wird, darf die höchste Audio-
frequenz nie die halbe fs erreichen. Da am Ausgang des D/A-Wandlers das
Signal alles andere als glockenrein zur Verfügung steht muß ein Tiefpass
zwischen fg=20KHz und den ersten spektralen Anteilen ab 24,1 KHz (fs-fg) voll
wirksam werden, sonst können sich Differenztöne bilden. Die Anforderungen an
das Tiefpassfilter wurden schon erläutert. Der Schaltungstechnische Aufwand,
um die Probleme des Filters auszuschalten sind sehr groß.
Abhilfe schafft die digitale Filterung über Oversampling, was den weiteren
Vorteil eines besseren Störabstandes besitzt, um dem vom Quantisierungs-
rauschen her theoretisch möglichen Fremdspannungsabstand von 96dB näher zu
kommen.
Dadurch ist der Abstand zwischen Nutzspektrum 20..20KHz und dem Stör-
spektrum 176KHz ±20KHz so groß, daß zur Dämpfung der unerwünschten
Frequenzen ein relativ flachen und damit einfacher 12dB-Tiefpass bedeutet, der
wegen seiner geringen Steilheit keine Schankungen in der Gruppenlaufzeit hat.
1-Bit Technik
Mashverfahren
Bitstream-Verfahren
Linearität des Bitstream-Wandlers
Fazit
1. Mit der Multibit-D/A-Wandlung liegen Nichtlinearitäten vor. Die Technik der
1-Bit-Wandler vermeidet diese durch schrittweise Wandlung. Dabei wird die
Digitaltechnik konsequent angewandt: Einfach wandeln, aufwendig rechnen
Interessant ist, daß sich mit der 1-Bit-Technik Wandler realisieren lassen, die
mehr als 16 oder 18 Bit Auflösung bieten, wie dies bei Verstärkern oder
Mischpulten erforderlich ist. Zu beachten ist, daß die volle 16-Bit-Dynamik
nur bei Vollausteuerung zur Verfügung steht, bei geringeren Pegeln wäre das
schnell Lo-Fi , gerade, wenn noch eine Übersteuerungssicherheit vorhanden
sein muß.
2. Das Wandlerproblem ist nur eines der Hauptprobleme der Digitaltechnik. Ein
weiteres besteht in bei den Übertragungs-Fehlern und den Speicherungs-
Fehlern. Gegenüber der Analogtechnik sind diese Fehler viel kritischer.
Die Transparentschicht der CD besitzt die wichtige Aufgabe, der optischen Bre-
chung der Lichtstrahlen und damit die notwendige Fokussierung.
Brechungsindex = sin (Einfallswinkel) / sin (Austrittswinkel)
Der Vokaltrakt (Mund- und Rachenraum) wird dabei durch eine künstliche
Leitung nachgestellt, bestehend aus einer Serienschaltung von Induktivitäten
und parallel geschalteten Kapazitäten. Dies ist ein grundsätzlich anderer Weg
als bei früheren Modellen wie z. B. dem Vocoder, bei denen die Spektralenergie
der Sprache in mehrere Frequenzbänder durch Filter unterteilt ist und
demgemäß die synthetischen Sprachlaute aus dem Energiegehalt solcher Ban-
dpaßfilter zusammengesetzt werden.
...
Die Modellvorstellung der menschlichen Stimmfunktion wird durch Einbezie-
hung des Raumes, der einen zusätzlichen Impedanzeffekt hervorruft, erweitert.
Die Steuerung dieser Schwingungen erfolgt beim Singen auf neuralem Wege
primär taktil, sekundär vom Gehör her; beim Sprechen ist es umgekehrt. Dies
wird weiter bestätigt durch die Auffassung der Gehörüberwachung als delayed
feedback.
Dabei bestimmt die Verzugszeit die Geschwindigkeit des Sprechens. Diese
Zeitkonstante, die durch die Nachhallzeit und auch Echos bestimmt wird, kann
im Versuch z. B. durch eine Magnetbandaufnahme studiert werden, die mit
Bruchteilen einer Sekunde wiedergegeben wird. Wenn sich der Sprecher auf
den Nachlaut, ohne Verringerung der Sprechgeschwindigkeit einstellt, beginnt
er zu stottern, oder es tritt motorische Aphasie ein. Aus der Berechnung der
Regelfunktion läßt sich die Laufzeit t0 des cochlear-recurrentielen
Regelkreises, d. h. also die Überwachung über das Gehör bestimmen. Die
Regelgröße mach sich nach der Verzugszeit allerdings weniger plötzlich
bemerkbar, sondern nach einer Übergangszeit τ. Das stabile Arbeiten des
Reglers ist gewährleistet, wenn der Regelgrad
ist, wobei α die Größenordnung eins hat.
Z. B. muß für t0 = 1/100 τ der Regelgrad größer als 1/100 sein, d. h. die
Schwankungen werden auf den hundertsten Teil herabgeregelt. Bei einer
Vergrößerung von t0 auf t0 + Δt0 (z. B. durch Nachhallzeit) muß aber auch τ auf
τ +Δτ verlängert werden, um die Stabilität nach der oberen Gleichung
beizubehalten. Die Sprechzeit verlängert sich dann auf das γ-fache
Aus verschiedenen künstlich eingeführten Verzugszeiten bei dem erwähnten
Magnetton-Versuch kann ein Rückschluß für t0 gezogen werden über
E ergibt sich eine Laufzeit des cochlear-recurrentiellen Regelsystems im
Sprechorgan von etwa 70ms, was erheblich mehr ist als die direkte Laufzeit
Mund →Ohr mit 1ms.
Zur Funktion der Selbststeuerung kann eine Vorstellung in einem neuro-ann-
tomischen Modell gefunden werden. Die neuralen Kontrollwege müssen sich
schließen und alle an einer zerebralen Schaltzentrale zusammenlaufen, damit
von dort aus Eingriffe beim Abweichen von den synchronen Funktionen,
bewußt oder reflexartig vorgenommen werden können. Die Länge jeder Sch-
leife ist ungefähr proportional der für die jeweilige Funktion erforderlichen Zeit.
Der Hörapparat ist in Serie bzw. induktiv gekoppelt mit der Stimmschleife für
die Hörüberwachung des Sprechens. In der Zeichnung sind statt der Dutzend
Nervenfibern zur Ausübung der Funktionen symbolisch nur deren zwei
gezeichnet. Dazu gehören die Artikulation verschieden Stellen des Vokaltrakts,
die Atemsteuerung, die Stimmbändersteuerung, der Mechanismus zu Beugung
der Leute usw. An der Schallstelle wird bei abstraktem Denken nur die äußere
Schleife eingeschaltet, bei stummer Artikulation kommt die Artikulations-
schleife dazu, und schließlich sind beim Sprechen alle Schleifen "unter Strom".
Ist das Kontrollorgan Ohr von dem gesprochenen Laut unbefriedigt, so wird
dieser wiederholt. Die Überwachung der kleinsten Schleife - die, der Artikula-
tion - erfolgt taktil oder auf kinästetischem Wege, die der nächsten (stimmhaft)
durch Gehörüberwachung - beide übrigens reflexartig.
Nun kann der Sprachtrakt als ein System gekoppelter mechanischer Hohl-
raumresonatoren (ähnlich einer Orgelpfeife) mit veränderbarem Querschnitt und
damit veränderlicher Resonanzfrequenz aufgefaßt werden, welches ver-
schiedene Teile aus dem Spektrum der Anregung herausfiltert.
Die Sprache s(t) ist das Ergebnis einer Faltung zwischen der Pitchfunktion p(t)
(Anregungsfunktion des Kehlkopfes) und der impuls-response funktion, irf, des
Filtersystems des Vokaltraktes.
Im Zeitbereich kann die Frau allerdings ihre Spektren in der Hälfte der Zeit
mitteilen, womit insgesamt eine Produktgleichheit
34 Spektren : 1 T = 17 Spektren : ½T besteht.
Küpfmüllersche Überlegung
Es gibt die Möglichkeit Sprache mit 8 Bit (schon ausreichendes S/N) @ 8KHz
zu samplen, welches 64Kbit/s Datenrate ergibt. Es geht aber auch adaptive
Deltamodulation.
Dann gibt es die Möglichkeit die Sprache mit 40 Sprechlauten zu codieren,
wofür eine 6 Bit Codierung ausreichen würde. Bei 10 Sprechlauten/s ergeben
sich dann 60 Bit/s. Insgesamt eine um den Faktor 1000 geringer Datenrate.
Hierbei geht also die Diagnostik (Informationen über den Sprecher) verloren.
14.03.2009:
Interessant ist die Codierung von Sloot (ein niederländisches Patent).
23.08.2009:
So mit Open-Office geht wohl die Conversion von wpc → doc …