Beruflich Dokumente
Kultur Dokumente
Compression de la parole
Compression de la musique
Marco Cagnazzo
11 Octobre 2010
Plan
1 Introduction
2 Compression de la parole
Codeurs simples
Codeurs CELP
Codeur 3GPP AMR-WB
3 Compression de la musique
MP3
AAC
Plan
1 Introduction
2 Compression de la parole
Codeurs simples
Codeurs CELP
Codeur 3GPP AMR-WB
3 Compression de la musique
MP3
AAC
Signal de parole
Signal de parole
Numérisation
Normes de compression
Parole : Réseau téléphonique commuté
Normes de compression
Parole : Communication mobile
Signal de musique
Signal de musique
Normes de compression
Normes de compression
Musique
Évaluation de la qualité
Plan
1 Introduction
2 Compression de la parole
Codeurs simples
Codeurs CELP
Codeur 3GPP AMR-WB
3 Compression de la musique
MP3
AAC
Q
a b
a
LPC
P
X
y(n) = x(n) − xP (n) xP (n) = hk x(n − k)
k =1
P
X
y(n) = ak x(n − k) a0 = 1 ak = −hk
k =0
0 T0 − 1
φ
Codeur CELP
i g a
Codeur CELP
Codeur CELP
Codeur CELP
Construction du dictionnaire
Impulsions uniformément étalées
Tirage de v.a. Gaussiennes centrées
Codes avec structure algébrique (G.729)
Dictionnaire adaptive
On essaye de réduire la périodicité résiduelle
On estime la période et la constant de temps
Codeur CELP
Schéma complet
x(n) 1 p(n)
A(z) A(z/γ)
c
p0 (n)
C Min
1
1 L A(z/γ)
b(n)
p
bz −Q
Codeur CELP
Débit de codage
R = 18/0.010 + (7 + 3 + 17 + 4)/0.005
= 8 kbps
Plan
1 Introduction
2 Compression de la parole
Codeurs simples
Codeurs CELP
Codeur 3GPP AMR-WB
3 Compression de la musique
MP3
AAC
Codeurs perceptuels
Codeurs perceptuels
Codeur
x(n)
Flux
Binaire
N M H Q
Codeurs perceptuels
Décodeur
Flux
Binaire
Q* F
xb(n)
Codeurs perceptuels
Banque de 32 filtres
Répartition uniforme des fréquences entre 0 et 22 kHz
À peu près 700 Hz par sous-bande
Sous-échantillonnage critique et reconstruction
quasi-parfaite (SNR>90dB en absence de quantification)
Dans chaque sous-bande on regroupe 12 échantillon, en
on les code conjointement
Le vecteur de 12 coefficients de la sous-bande k est
indiqué comme yk
Chaque vecteur correspond à environ une dizaine de ms
yk = gk ak
Valeurs normalisées :
X (0) X (1) X (M − 1)
i= ...
g(0) g(1) g(M − 1)
SQ (F ) < Φ(f )
Conclusions
Codage de parole
Modèle psychoacoustique
Modèle de source et de filtre
Quantification vectorielle
Codage de musique
Modèle psychoacoustique
Allocation du débit
Optimisation avec contrainte en boucle fermée