Sie sind auf Seite 1von 32

Kapitel 2: Sprachsignaldarstellung und

-eigenschaften.
2. Sprachsignaldarstellung und -eigenschaften
Darstellung kontinuierlicher Signale im Zeitbereich.

Sprachsignal zur Äußerung „Sichtbare Sprache“:


4
x 10
2

1.5

0.5
Amplitude

-0.5

-1

-1.5

-2
0 0.2 0.4 0.6 0.8 1 1.2 1.4 1.6 1.8 2
Zeit [s]

1
2. Sprachsignaldarstellung und -eigenschaften
Darstellung kontinuierlicher Signale im Zeitbereich.

Sprachsignalabschnitte:

x 104 x 104
2 2

1 1
Amplitude

0 0

-1 -1

-2 -2
0 0.05 0.1 0.15 0 0.01 0.02 0.03 0.04 0.05 0.06 0.07
Zeit [s] Zeit [s]

quasi-periodisch rauschförmig

2
2. Sprachsignaldarstellung und -eigenschaften
LTI-Systeme.

Eingangs- und Ausgangssignal eines Systems:

x(t) y(t)=Ψ{x(t)}

Eingangssignal Ausgangssignal

Beschreibung durch DGL 1. Ordnung mit konstanten Koeffizienten

→ lineares, zeitinvariantes System (LTI-System)

3
2. Sprachsignaldarstellung und -eigenschaften
LTI-Systeme.

Eingangs- und Ausgangssignal eines Systems:


Überlagerungssatz:

⎧ ⎫
Ψ ⎨∑ ai ⋅ xi (t ) ⎬ = ∑ ai Ψ{xi (t )} = ∑ ai y i (t )
⎩ i ⎭ i i

Verschiebungssatz:

Ψ{x (t − T )} = y (t − T )

Anwendung: Zerlegung in Teilsignale zur Ermittelung des Ausgangssignals.

4
2. Sprachsignaldarstellung und -eigenschaften
Signaldarstellung im Frequenzbereich, Spektrum.

Zerlegung in harmonisch-exponentielle Komponenten:

cν ⋅ e jων t , cν ∈ C Spektralwert zur Frequenz ων

mit
e jων t = cos(ων t ) + j ⋅ sin(ων t )
ων = ν ⋅ 2π ⋅ f Kreisfrequenz

Grund: Exponentialfunktionen sind „Eigenfunktionen“ eines LTI-Systems


→ nur Amplitude und Phase ändern sich, Form bleibt erhalten

5
2. Sprachsignaldarstellung und -eigenschaften
Fourer-Reihe.

Periodisches Signal:
n 2π n

∑ cν e ∑ν
t
Reihendarstellung x(t ) ≈ g n (t ) = T
= c e jων t

ν =− n ν =− n

t0 +T
!
für minimale Abweichung εn = ∫ x(t ) − g
2
n (t ) dt = min
t0

t0 +T 2π
− jν
führt auf spezielle 1 t
Fourier-Koeffizienten
cν =
T ∫
t0
x(t ) ⋅ e T
dt
Liniensprektrum

Es gilt: lim{ε n } = 0 also lim{g n (t )} = x(t )


n→∞ n →∞

lim cν = 0
ν →∞

6
2. Sprachsignaldarstellung und -eigenschaften
Fourier-Transformation.

Allgemeines (nicht periodisches) Signal:



1
Integraldarstellung x(t ) ≈ g Ω (t ) = ⋅ ∫ X ( jω ) ⋅ e jω t dω
2π −Ω

für minimale Abweichung

+∞
führt auf spezielle Fourier-Transformierte

− jω t
X ( jω ) = x (t ) ⋅ e dt
−∞ kontinuierl. Sprektrum

x(t ) X ( jω ) = F {x(t )}

Es gilt: lim {ε Ω } = 0 also lim {g Ω (t )} = x(t )


Ω →∞ Ω →∞

7
2. Sprachsignaldarstellung und -eigenschaften
Fourier-Transformation.

Logarithmische Darstellung:

log10 X ( jω ) = log10 X ( jω + j arg{X ( jω )}


(komplexes Spektrum, Betragsspektrum, Phasenspektrum)

Signalpegel 20 ⋅ log10 X ( jω ) [dB]

8
2. Sprachsignaldarstellung und -eigenschaften
Fourier-Transformation.
Sätze:
Symmetrie-Satz: X ( jt ) 2π ⋅ x ( −ω )

Verschiebungs-Satz: x(t ) ⋅ e jω0t X ( j (ω − ω 0 ))


x(t + t 0 ) X ( j ω ) ⋅ e − jω t 0

Faltungs-Satz: x1 (t ) ∗ x 2 (t ) X 1 ( jω ) ⋅ X 2 ( jω )
1
x1 (t ) ⋅ x 2 (t ) X 1 ( jω ) ∗ X 2 ( jω )
2π j
+∞ +∞
Satz von Parseval: 1
∫−∞ x(t ) dt = 2π ∫ X ( jω ) dω
2 2

−∞

9
2. Sprachsignaldarstellung und -eigenschaften
Impulsantwort.
Dirac-Impuls:
+∞
Definition: x (τ ) = ∫ x(t ) ⋅ δ (t − τ ) dt
−∞ +∞
wobei gilt: ∫ δ (t ) dt = 1
−∞
δ (t ) = δ (−t )

Überlagerungsintegral:
+∞
x(t ) = ∫ x(τ ) ⋅ δ (t − τ ) dτ
−∞

Ausgangssignal nach Anregung eines LTI-Systems:


mit δ (t ) : Impulsantwort h(t ) des Systems
mit x(t ) allgemein: +∞
y (t ) = ∫ x(τ ) ⋅ h(t − τ ) dτ
−∞
Faltung
= x(t ) ∗ h(t )
10
2. Sprachsignaldarstellung und -eigenschaften
Faltung.

(Carlson et al., 2002, 54)


11
2. Sprachsignaldarstellung und -eigenschaften
Übertragungsfunktion.
Ausgangssignal nach Anregung eines LTI-Systems:
mit δ (t ) : Impulsantwort h(t ) des Systems
mit x(t ) allgemein: +∞
y (t ) = ∫ x(τ ) ⋅ h(t − τ ) dτ
−∞
Faltung
= x(t ) ∗ h(t )

mit x(t ) = X ( jω 0 ) ⋅ e jω0 t harmonisches Signal:


+∞
y (t ) = h(t ) ∗ x(t ) = X ( jω0 ) ⋅ ∫ h(τ ) ⋅ e jω0 (t −τ ) dτ
−∞
+∞
= X ( jω0 ) ⋅ e jω0 t ⋅ ∫ h(τ ) ⋅ e − jω0 τ dτ
−∞
= x(t ) ⋅ H ( jω0 )

mit H ( jω ) = F {h(t )} = H ( jω ) ⋅ e jϕ (ω ) Übertragungsfunktion


12
2. Sprachsignaldarstellung und -eigenschaften
Eingangs- und Ausgangssignale eines LTI-Systems.

x(t) y(t) = x(t) * h(t)


h(t)

H(jω)
X(jω) Y(jω) = X(jω)⋅H(jω)

Eingangs- LTI- Ausgangs-


signal System signal

13
2. Sprachsignaldarstellung und -eigenschaften
Statistische Signalbeschreibung.
Wahrscheinlichkeit diskreter Variablen:
Menge aller Elementarereignisse: {xυ } = {x1 , x 2 , x3 , ..., x n }
Zufallsvariable x entspricht genau einem dieser Elementarereignisse.
Wahrscheinlichkeit: W {xυ } ≥ 0 Zuordnung einer nicht-negativen Zahl
W {E} = 1 Wahrscheinlichkeit des sicheren Ereignisses
r
W {y1 ∨ y 2 ∨ y 3 ... ∨ y r }r ≤ m = ∑ W {y i }
i =1
(sich ausschließende Ereignisse)
W {xυ ∨ xυ } = W {xυ } + W {xυ } = W {E} = 1
(komplementäre Ereignisse)
W {xυ } = 1 − W {xυ }
W {xυ }∈ [0;1]

14
2. Sprachsignaldarstellung und -eigenschaften
Statistische Signalbeschreibung.
Wahrscheinlichkeit diskreter Variablen:
Geordnete Ereignismenge: x1 < x2 < x3 < x4 < … < xm, m ≥ r
r
W {x ≤ x r } = W {x1 ∨ x 2 ∨ x3 ... ∨ x r } = ∑ W {xi }
i =1

lim W {x ≤ x r } = 1 endliche Menge mit m Ereignissen


r →m

lim W {x ≤ X } = 1 unendlich große Menge


X →∞

lim W {x ≤ X } = 0
X → −∞

15
2. Sprachsignaldarstellung und -eigenschaften
Statistische Signalbeschreibung.
Wahrscheinlichkeit kontinuierlicher Variablen:
Verteilungsfunktion: W {x(t ) ≤ X } = Px ( X , t )

Zufallsprozess: Beschreibt ein Ensemble gleichartiger Variablen,


die der gleichen Erzeugungsvorschrift gehorchen.

Im Allgemeinen: Px ( X , t ) abhängig von der Zeit t

lim Px ( X , t ) = 0 lim Px ( X , t ) = 1
X → −∞ X →∞

16
2. Sprachsignaldarstellung und -eigenschaften
Statistische Signalbeschreibung.
Wahrscheinlichkeit kontinuierlicher Variablen:
Verteilungsdichtefunktion: ∂Px ( X , t )
= px ( X , t)
(VDF) ∂X
X
Px ( X , t ) = ∫p
−∞
x (ξ , t ) dξ

Wahrscheinlichkeit, dass x zum Zeitpunkt t in [X − ΔX 2 ; X + ΔX 2]


ΔX ΔX
X+ X−
⎧ ⎡ ΔX ΔX ⎤ ⎫ 2 2
W ⎨x ∈ ⎢ X −
⎩ ⎣ 2
;X +
2 ⎥ ,t⎬ =
⎦ ⎭
∫p
−∞
x (ξ , t ) dξ − ∫p
−∞
x (ξ , t ) dξ

⎛ ΔX ⎞ ⎛ ΔX ⎞
= Px ⎜ x + , t ⎟ − Px ⎜ x − ,t ⎟
⎝ 2 ⎠ ⎝ 2 ⎠
= ΔPx ( X , t )

17
2. Sprachsignaldarstellung und -eigenschaften
Statistische Signalbeschreibung.
Wahrscheinlichkeit kontinuierlicher Variablen:
ΔPx ( X , t )
Verteilungsdichtefunktion: px ( X , t) ≈
ΔX

→ VDF ist eine inkrementelle, auf das Intervall ΔX bezogene Wahrscheinlichkeit.

18
2. Sprachsignaldarstellung und -eigenschaften
Statistische Signalbeschreibung.
Wahrscheinlichkeiten zweier Signale:
Verbund-Verteilungsfunktion:
Px1 x2 ( X 1 , X 2 , t1 , t 2 ) = W {( x1 (t1 ) ≤ X 1 ) ∧ ( x2 (t 2 ) ≤ X 2 )}

Verbund-Verteilungsdichtefunktion:
∂ 2 Px1x2 ( X 1 , X 2 , t1 , t 2 )
= p x1x2 ( X 1 , X 2 , t1 , t 2 )
∂X 1∂X 2


p x1 ( X 1 , t1 ) = ∫p
X 2 = −∞
x1 x2 ( X 1 , X 2 , t1 , t 2 ) dX 2

19
2. Sprachsignaldarstellung und -eigenschaften
Statistische Signalbeschreibung.
Wahrscheinlichkeiten zweier Signale:
Verbund-Verteilungsfunktionen hängen im Allg. von X1 und X2 ab.
Sonderfall:
Px1 x2 ( X 1 , X 2 , t1 , t 2 ) = Px1 ( X 1 , t1 ) ⋅ Px2 ( X 2 , t 2 )

p x1 x2 ( X 1 , X 2 , t1 , t 2 ) = p x1 ( X 1 , t1 ) ⋅ p x2 ( X 2 , t 2 )

dann sind x1(t1) und x2(t2) statistisch unabhängig!

20
2. Sprachsignaldarstellung und -eigenschaften
Statistische Signalbeschreibung.
Erwartungswert:

E{ f ( x(t ) )} = ∫ f ( x) ⋅ p x ( X , t ) dX
−∞

3 Spezialfälle:

1) y = f(x) = x : E{x(t )} = ∫X ⋅p x ( X , t ) dX = μ x (t ) linearer Mittelwert
−∞

2) y = f(x) = x2 : { } ∫X
E x 2 (t ) = 2
⋅ p x ( X , t ) dX = x 2 (t ) quadratischer Mittelwert
−∞

{
3) y = f(x) = (x-μx)2 : E ( x(t ) − μ x ) 2 } { }
= E x 2 (t ) − 2 ⋅ μ x ⋅ E{x(t )} + μ x
2

= x 2 (t ) − μ x (t ) = σ x (t )
2 2

Varianz
21
2. Sprachsignaldarstellung und -eigenschaften
Statistische Signalbeschreibung.
Standardverteilungen:

Gauss- oder Normalverteilung:

( X − μ x ( t )) 2

1 2σ x 2 ( t )
∝ e−X
2
px ( X , t) = ⋅e
2π σ x (t )

linear logarithmisch (aus Vary et al., 1998)


22
2. Sprachsignaldarstellung und -eigenschaften
Statistische Signalbeschreibung.
Standardverteilungen:

Laplace-Verteilung:
X − μ x (t )
− 2
1 σ x (t ) −X
px ( X , t) = ⋅e ∝e
2σ x (t )

linear logarithmisch (aus Vary et al., 1998)


23
2. Sprachsignaldarstellung und -eigenschaften
Statistische Signalbeschreibung.
Sprachverteilungen: Z.B. als Kombination von Gauss- und Laplace-Verteilung
X X2
− 2 −
0.6 σ1 0.4 2σ 2 2
px ( X ) = ⋅e + ⋅e
2σ 1 2π σ 2

(aus Heute, 1990)


24
2. Sprachsignaldarstellung und -eigenschaften
Statistische Signalbeschreibung.
Erwartungswert zweier Zufallsvariablen:
∞ ∞
E{ f (x1 (t1 ), x2 (t 2 ) )} = ∫ ∫ f (X , X
1 2 ) ⋅ p x1x2 ( X 1 , X 2 , t1 , t 2 ) dX 1dX 2
X 1 = −∞ X 2 = −∞

4 Spezialfälle:
1) y = f(x1, x2) = x1 ⋅ x2 : Kreuz-Korrelationsfunktion (KKF)
∞ ∞
E{x1 (t ) ⋅ x 2 (t )} = ∫ ∫X 1 X 2 ⋅ p x1 x2 ( X 1 , X 2 , t1 , t 2 ) dX 1 dX 2 = ϕ x1x2 (t1 , t 2 )
X 1 = −∞ X 2 = −∞

2) y = f (( x1 (t ) − μ x1 )( x 2 (t ) − μ x2 ) ) : Kreuz-Kovarianzfunktion

{
E ( x1 (t ) − μ x1 )( x 2 (t ) − μ x2 ) } = ψ x1x2 (t1 , t 2 )
= ϕ x1 x2 (t1 , t 2 ) − μ x1 (t1 ) ⋅ μ x2 (t 2 )
25
2. Sprachsignaldarstellung und -eigenschaften
Statistische Signalbeschreibung.
4 Spezialfälle (Fortsetzung):
Zufallswerte x1 ⋅ x2 aus demselben Prozess,
aber zu unterschiedlichen Zeitpunkten t1 und t2 = t1 + τ entnommen
3) y = f(t,τ) = x(t) ⋅ x(t+τ) : Auto-Korrelationsfunktion (AKF)
∞ ∞
ϕ xx (τ ) = E{x(t ) ⋅ x(t + τ )} = ∫ ∫X 1 X 2 ⋅ p xx ( X 1 , X 2 ,τ ) dX 1 dX 2
X 1 = −∞ X 2 = −∞

4) Auto-Kovarianzfunktion

ψ xx (τ ) = ϕ xx (τ ) − μ x 2

Im Falle τ = 0: ϕ xx (0) = ψ xx (0) + μ x 2 = x 2 = σ x 2 + μ x 2


ϕ xx (τ ) ≤ ϕ xx (0) = x 2 = σ x 2 + μ x 2
26
2. Sprachsignaldarstellung und -eigenschaften
Statistische Signalbeschreibung.
Unkorrelierte Signale:

ψ x x (t1 , t 2 ) = 0
1 2

⎧σ x 2 für τ = 0
ψ xx (τ ) = σ x 2
⋅ δ (τ ) = ⎨
⎩ 0 für τ ≠ 0

Zeitliche Mittelung:
T
1
f [x(t )] = lim ∫ f [x(t )]dt ≠ f (t )
T → ∞ 2T
−T

Wenn E { f ( x )} ≠ f (t ) , dann ist f(x) stationär.


E{ f ( x)} = f [x(t )] ≠ f (t ) , dann ist f(x) ergodisch.

27
2. Sprachsignaldarstellung und -eigenschaften
Statistische Signalbeschreibung.
Beschreibung im Frequenzbereich:

X ( jω ) = X ( jω ) ⋅ X * ( jω ) inverse Fourier-Transformation ergibt:


2

+∞ +∞
x(−t ) ∗ x(t ) = ∫ x(−τ ) ⋅ x(t − τ ) dτ = ∫ x(τ ) ⋅ x(t + τ ) dτ = ϕ
−∞ −∞
xx (t )

Signale endlicher Energie:


+∞

∫ x(t ) ⋅ x(t − 0) dt < ∞ konvergiert; X ( jω ) heißt Energiedichtespektrum


2

−∞

Signale endlicher Leistung:


+T
1
∫ x(t ) ⋅ x(t − 0) dt < ∞ konvergiert; X ( jω ) heißt
2
lim
T →∞ 2T
−T
1
+T
Leistungsdichtespektrum
ϕ xx (t ) = lim
T →∞ 2T ∫ x(τ ) ⋅ x(t + τ ) dτ
−T
28
2. Sprachsignaldarstellung und -eigenschaften
Langzeit-Leistungsdichtesprektrum.

(Blauert, 1994)
29
2. Sprachsignaldarstellung und -eigenschaften
Kurzzeit-Leistungsdichtesprektrum.
4
x 10
2 140

1.5 120

1
100

0.5

20 log10|X(jω|
80
x(t)

periodisch
0
60
-0.5

40
-1

-1.5 20

-2 0
0 0.05 0.1 0.15 0.2 0 1000 2000 3000 4000
Zeit [s] Frequenz [Hz]
4
x 10
2 140

1.5 120

1
100

0.5

aperiodisch
20 log1 0|X(jω|

80
x(t)

0
60
-0.5

40
-1

-1.5 20

-2 0
0 0.05 0.1 0.15 0.2 0 1000 2000 3000 4000
Zeit [s] Frequenz [Hz]

30
Backup.

Das könnte Ihnen auch gefallen