Beruflich Dokumente
Kultur Dokumente
-eigenschaften.
Rückblick.
2. Sprachsignaldarstellung und -eigenschaften
Darstellung kontinuierlicher Signale im Zeitbereich.
Sprachsignalabschnitte:
x 104 x 104
2 2
1 1
Amplitude
0 0
-1 -1
-2 -2
0 0.05 0.1 0.15 0 0.01 0.02 0.03 0.04 0.05 0.06 0.07
Zeit [s] Zeit [s]
quasi-periodisch rauschförmig
2
2. Sprachsignaldarstellung und -eigenschaften
LTI-Systeme.
x(t) y(t)=Ψ{x(t)}
Eingangssignal Ausgangssignal
3
2. Sprachsignaldarstellung und -eigenschaften
Signaldarstellung im Frequenzbereich, Spektrum.
mit
e jων t = cos(ων t ) + j ⋅ sin(ων t )
ων = ν ⋅ 2π ⋅ f Kreisfrequenz
4
2. Sprachsignaldarstellung und -eigenschaften
Fourer-Reihe.
Periodisches Signal:
n 2π n
jν
∑ cν e ∑ν
t
Reihendarstellung x(t ) ≈ g n (t ) = T
= c e jων t
ν =− n ν =− n
t0 +T 2π
− jν
führt auf spezielle 1 t
Fourier-Koeffizienten
cν =
T ∫
t0
x(t ) ⋅ e T
dt
Liniensprektrum
lim cν = 0
ν →∞
5
2. Sprachsignaldarstellung und -eigenschaften
Fourier-Transformation.
+∞
führt auf spezielle Fourier-Transformierte
∫
− jω t
X ( jω ) = x (t ) ⋅ e dt
−∞ kontinuierl. Sprektrum
x(t ) X ( jω ) = F {x(t )}
6
2. Sprachsignaldarstellung und -eigenschaften
Eingangs- und Ausgangssignale eines LTI-Systems.
H(jω)
X(jω) Y(jω) = X(jω)⋅H(jω)
7
Weiter mit Kapitel 2.5.
2. Sprachsignaldarstellung und -eigenschaften
Statistische Signalbeschreibung.
Wahrscheinlichkeit diskreter Variablen:
Menge aller Elementarereignisse: {xυ } = {x1 , x 2 , x3 , ..., x n }
Zufallsvariable x entspricht genau einem dieser Elementarereignisse.
Wahrscheinlichkeit: W {xυ } ≥ 0 Zuordnung einer nicht-negativen Zahl
W {E} = 1 Wahrscheinlichkeit des sicheren Ereignisses
r
W {y1 ∨ y 2 ∨ y 3 ... ∨ y r }r ≤ m = ∑ W {y i }
i =1
(sich ausschließende Ereignisse)
W {xυ ∨ xυ } = W {xυ } + W {xυ } = W {E} = 1
(komplementäre Ereignisse)
W {xυ } = 1 − W {xυ }
W {xυ }∈ [0;1]
9
2. Sprachsignaldarstellung und -eigenschaften
Statistische Signalbeschreibung.
Wahrscheinlichkeit diskreter Variablen:
Geordnete Ereignismenge: x1 < x2 < x3 < x4 < … < xm, m ≥ r
r
W {x ≤ x r } = W {x1 ∨ x 2 ∨ x3 ... ∨ x r } = ∑ W {xi }
i =1
lim W {x ≤ X } = 0
X → −∞
10
2. Sprachsignaldarstellung und -eigenschaften
Statistische Signalbeschreibung.
Wahrscheinlichkeit kontinuierlicher Variablen:
Verteilungsfunktion: W {x(t ) ≤ X } = Px ( X , t )
lim Px ( X , t ) = 0 lim Px ( X , t ) = 1
X → −∞ X →∞
11
2. Sprachsignaldarstellung und -eigenschaften
Statistische Signalbeschreibung.
Wahrscheinlichkeit kontinuierlicher Variablen:
Verteilungsdichtefunktion: ∂Px ( X , t )
= px ( X , t)
(VDF) ∂X
X
Px ( X , t ) = ∫p
−∞
x (ξ , t ) dξ
⎛ ΔX ⎞ ⎛ ΔX ⎞
= Px ⎜ x + , t ⎟ − Px ⎜ x − ,t ⎟
⎝ 2 ⎠ ⎝ 2 ⎠
= ΔPx ( X , t )
12
2. Sprachsignaldarstellung und -eigenschaften
Statistische Signalbeschreibung.
Wahrscheinlichkeit kontinuierlicher Variablen:
ΔPx ( X , t )
Verteilungsdichtefunktion: px ( X , t) ≈
ΔX
13
2. Sprachsignaldarstellung und -eigenschaften
Statistische Signalbeschreibung.
Wahrscheinlichkeiten zweier Signale:
Verbund-Verteilungsfunktion:
Px1 x2 ( X 1 , X 2 , t1 , t 2 ) = W {( x1 (t1 ) ≤ X 1 ) ∧ ( x2 (t 2 ) ≤ X 2 )}
Verbund-Verteilungsdichtefunktion:
∂ 2 Px1x2 ( X 1 , X 2 , t1 , t 2 )
= p x1x2 ( X 1 , X 2 , t1 , t 2 )
∂X 1∂X 2
∞
p x1 ( X 1 , t1 ) = ∫p
X 2 = −∞
x1 x2 ( X 1 , X 2 , t1 , t 2 ) dX 2
14
2. Sprachsignaldarstellung und -eigenschaften
Statistische Signalbeschreibung.
Wahrscheinlichkeiten zweier Signale:
Verbund-Verteilungsfunktionen hängen im Allg. von X1 und X2 ab.
Sonderfall:
Px1 x2 ( X 1 , X 2 , t1 , t 2 ) = Px1 ( X 1 , t1 ) ⋅ Px2 ( X 2 , t 2 )
p x1 x2 ( X 1 , X 2 , t1 , t 2 ) = p x1 ( X 1 , t1 ) ⋅ p x2 ( X 2 , t 2 )
15
2. Sprachsignaldarstellung und -eigenschaften
Statistische Signalbeschreibung.
Erwartungswert:
∞
E{ f ( x(t ) )} = ∫ f ( x) ⋅ p x ( X , t ) dX
−∞
3 Spezialfälle:
∞
1) y = f(x) = x : E{x(t )} = ∫X ⋅p x ( X , t ) dX = μ x (t ) linearer Mittelwert
−∞
∞
2) y = f(x) = x2 : { } ∫X
E x 2 (t ) = 2
⋅ p x ( X , t ) dX = x 2 (t ) quadratischer Mittelwert
−∞
{ }
3) y = f(x) = (x-μx)2 : E ( x(t ) − μ x ) 2 = x 2 (t ) − μ x (t ) = σ x (t )
2 2
Varianz
16
2. Sprachsignaldarstellung und -eigenschaften
Statistische Signalbeschreibung.
Standardverteilungen:
( X − μ x ( t )) 2
−
1 2σ x 2 ( t )
∝ e−X
2
px ( X , t) = ⋅e
2π σ x (t )
Laplace-Verteilung:
X − μ x (t )
− 2
1 σ x (t ) −X
px ( X , t) = ⋅e ∝e
2σ x (t )
4 Spezialfälle:
1) y = f(x1, x2) = x1 ⋅ x2 : Kreuz-Korrelationsfunktion (KKF)
∞ ∞
E{x1 (t ) ⋅ x 2 (t )} = ∫ ∫X 1 X 2 ⋅ p x1 x2 ( X 1 , X 2 , t1 , t 2 ) dX 1 dX 2 = ϕ x1x2 (t1 , t 2 )
X 1 = −∞ X 2 = −∞
2) y = f (( x1 (t ) − μ x1 )( x 2 (t ) − μ x2 ) ) : Kreuz-Kovarianzfunktion
{
E ( x1 (t ) − μ x1 )( x 2 (t ) − μ x2 ) } = ψ x1x2 (t1 , t 2 )
= ϕ x1 x2 (t1 , t 2 ) − μ x1 (t1 ) ⋅ μ x2 (t 2 )
19
2. Sprachsignaldarstellung und -eigenschaften
Statistische Signalbeschreibung.
4 Spezialfälle (Fortsetzung):
Zufallswerte x1 ⋅ x2 aus demselben Prozess,
aber zu unterschiedlichen Zeitpunkten t1 und t2 = t1 + τ entnommen
3) y = f(t,τ) = x(t) ⋅ x(t+τ) : Auto-Korrelationsfunktion (AKF)
∞ ∞
ϕ xx (τ ) = E{x(t ) ⋅ x(t + τ )} = ∫ ∫X 1 X 2 ⋅ p xx ( X 1 , X 2 ,τ ) dX 1 dX 2
X 1 = −∞ X 2 = −∞
4) Auto-Kovarianzfunktion
ψ xx (τ ) = ϕ xx (τ ) − μ x 2
ψ x x (t1 , t 2 ) = 0
1 2
⎧σ x 2 für τ = 0
ψ xx (τ ) = σ x 2
⋅ δ (τ ) = ⎨
⎩ 0 für τ ≠ 0
Zeitliche Mittelung:
T
1
f [x(t )] = lim ∫ f [x(t )]dt ≠ f (t )
T → ∞ 2T
−T
21
2. Sprachsignaldarstellung und -eigenschaften
Statistische Signalbeschreibung.
Beschreibung nicht-deterministischer Signale im Frequenzbereich:
+∞ +∞
x(−t ) ∗ x(t ) =
−∞
∫ x(−τ ) ⋅ x(t − τ ) dτ = ∫ x(τ ) ⋅ x(t + τ ) dτ = ϕ
−∞
xx (t )
−∞
(Blauert, 1994)
23
2. Sprachsignaldarstellung und -eigenschaften
Kurzzeit-Leistungsdichtesprektrum.
4
x 10
2 140
1.5 120
1
100
0.5
20 log10|X(jω|
80
x(t)
periodisch
0
60
-0.5
40
-1
-1.5 20
-2 0
0 0.05 0.1 0.15 0.2 0 1000 2000 3000 4000
Zeit [s] Frequenz [Hz]
4
x 10
2 140
1.5 120
1
100
0.5
aperiodisch
20 log1 0|X(jω|
80
x(t)
0
60
-0.5
40
-1
-1.5 20
-2 0
0 0.05 0.1 0.15 0.2 0 1000 2000 3000 4000
Zeit [s] Frequenz [Hz]
24
2. Sprachsignaldarstellung und -eigenschaften
Diskrete Signaldarstellung.
Digitale Signaldarstellung:
Zeitdiskret durch Abtastung
Wertdiskret durch Quantisierung
Vorteile:
Störsicherheit: Im Prinzip verlustlose Übertragung
Universalität: Übertragung unterschiedlicher Signale auf demselben Weg
Einfache Verarbeitung durch Digitalrechner
Nachteile:
Quantisierungsfehler durch begrenzten Wertevorrat
Höherer Bandbreitenbedarf durch Abtastung mit mindestens doppelter
Frequenz
25
2. Sprachsignaldarstellung und -eigenschaften
Diskrete Signaldarstellung.
Abtastung:
Zunächst analoges Signal (bandbegrenzt mit fg)
1
Ersetzen durch Impulszug mit Abstand T = , der der Signalform folgt
fA
(Puls-Amplituden-Modulation, PAM)
Abtasttheorem:
1
fA = ≥ 2⋅ fg
T
π
Umkehrung ( )
X e jΩ x(k ) =
1
2π ∫π X (e )⋅ e
jΩ jkΩ
{ ( )}
= F −1 X e jΩ
−
27
2. Sprachsignaldarstellung und -eigenschaften
Diskrete Signaldarstellung.
28
2. Sprachsignaldarstellung und -eigenschaften
Diskrete Signaldarstellung.
Vergleich:
∞
Fourier-Transformation eines diskreten Signals X (e jΩ
) = ∑ x(k ) ⋅ e − jkΩ
k = −∞
M −1 2π
−j μk
Diskrete Fourier-Transformation (DFT) X μ = ∑ x(k ) ⋅ e M
k =0
zeigt:
⎛ jμ 2Mπ ⎞
X μ = X ⎜⎜ e ⎟
⎟
⎝ ⎠
DFT bestimmt Abtastwerte eines kontinuierlichen Spektrums einer endlich
2π
langen Folge in den Frequenzpunkten Ω μ = μ ⋅
M
29
2. Sprachsignaldarstellung und -eigenschaften
Diskrete Signaldarstellung.
x(k ) y (k ) = x(k ) ∗ h0 (k )
h0 (k )
( )
H e jΩ
X e( )jΩ ( ) ( ) ( )
Y e jΩ = X e j Ω ⋅ H e j Ω
∞
Faltung: y (k ) = x(k ) ∗ h0 (k ) =
κ
∑ x(κ ) ⋅ h (k − κ )
= −∞
0
30
2. Sprachsignaldarstellung und -eigenschaften
Diskrete Signaldarstellung.
x(k ) y (k ) = x(k ) ⊗ h0 (k )
h0 (k )
Hμ
Xμ Yμ = X μ ⋅ H μ
M −1
Zyklische Faltung: y (k ) = x(k ) ⊗ h0 (k ) = ∑ x(κ ) ⋅ h ([k − κ ]
0 mod M )
κ=0
M min = max{L x , Lh }
31
2. Sprachsignaldarstellung und -eigenschaften
Diskrete Signaldarstellung.
Verbund-Verteilungsfunktion:
Px1 x 2 (u1 , u2 , k1 , k 2 ) = W {( x1 (k1 ) ≤ u1 ) ∧ ( x2 (k 2 ) ≤ u2 )}
Verbund-VDF: ∂ 2 Px1x2 (u1 , u 2 , k1 , k 2 )
= p x1x2 (u1 , u 2 , k1 , k 2 )
∂u1∂u 2
33
2. Sprachsignaldarstellung und -eigenschaften
Diskrete Signaldarstellung.
Statistische Kennwerte (2/2):
Autokorrelation:
∞ ∞
ϕ xx (λ ) = E{x(k ) ⋅ x(k + λ )} = ∫ ∫u u 1 2 ⋅ p xx (u1 , u 2 , λ ) du1 du 2
u1 = −∞ u 2 = −∞
Darstellungsproblem:
Sprachsignale sind instationär, ändern sich alle 20-30 ms
Gleichzeitige Darstellung des Spektrums und der zeitlichen Änderung?
35
2. Sprachsignaldarstellung und -eigenschaften
Spektrogramm.
zI C tba: R @ S pR a: x @
36
2. Sprachsignaldarstellung und -eigenschaften
Amplitudenverteilung.
Sprachverteilungen: Z.B. als Kombination von Gauss- und Laplace-Verteilung
X X2
− 2 −
0.6 σ1 0.4 2σ 2 2
px ( X ) = ⋅e + ⋅e
2σ 1 2π σ 2
38
2. Sprachsignaldarstellung und -eigenschaften
Amplitudenverteilung.
Korrelation:
Sichtbar in 2-dimensionalen VDFen mit x1(k)=x(k) und x2(k)=x(k+ λ)
λ=1
λ=6