Beruflich Dokumente
Kultur Dokumente
Un signal audio est tout signal acoustique pouvant être audible par l’oreille humaine. Il peut
être de la musique, de la parole, et même de bruits acoustiques. Il est généralement non
stationnaire et redondant. Il est caractérisé par :
- sa fréquence d’échantillonnage : Fe
- le nombre de bits de quantification et de codage : N
- débit D = Fe . N . m
Le signal parole est caractérisé par une représentation formantique alors que la musique
présente un caractère harmonique.
Parole Musique
2.1. pitch Fo: c’est la fréquence fondamentale de la glotte (larynx) qui est caractéristique de
production de la parole : elle caractérise les sons voisés (a, u, i, e,…)
2.2. les formants F1, F2, F3 : qui sont les fréquences de résonance du conduit vocal
(pharynx)
F1 F2 F3
- l’échantillonnage
- la quantification (conversion analogique-numérique) avec compression de
données A ou
- le codage ( PCM, ADPCM, Delta,…)
Si nous voulons restituer le signal vocal, les deux étapes inverses sont nécessaires. La figure 3
présente le schéma du système d’acquisition et de restitution du signal vocal.
microphone
Etage Filtre Passe Convertisseur
Amplificateur Bas N/A
Micro
Haut Parleur
Fig.6 Chaîne d’acquisition et de restitution d’un signal audio
Le signal audio ( musique et/ou parole ) est caractérisé par un spectre s'étalant de 20 Hz à 20
kHz, nécessitant une fréquence d'échantillonnage supérieure à 40 kHz. La réduction de cette
bande, notamment dans le cas du signal parole, autorise l'utilisation d'une fréquence
d'échantillonnage réduite. Le tableau suivant présente quelques valeurs courantes :
Fréquence
Spectre du signal Applications
d'échantillonnage
Qualité téléphonique [300 ; 3 400 Hz] 8 kHz Téléphonie
Qualité "bande 16 kHz
[50 ; 7 000 Hz] PC, audio-conférence (ADPCM)
élargie" 22 kHz
Haute qualité en
[50 ; 15 000 Hz] 32 kHz DAB, NICAM
radiodiffusion
44.1 kHz
Qualité "Hi-Fi" [20 ; 20 000 Hz] CD Audio, Studio numérique, DAT
48 kHz
2.2 Choix du nombre de bits de quantification
Ainsi, en incrémentant le nombre n de bits d'une unité, on augmente le rapport SNR de 6 dB.
Le tableau suivant présente quelques exemples :
La carte son a neuf fréquences d’échantillonnage par défaut qui sont 8 000 Hz, 11025
Hz, 12 000 Hz, 16 000 Hz, 22 050 Hz, 24 000 Hz, 32 000hz, 44 100Hz, 48 000hz, mono ou
stéréo, on peut aussi choisir le codage sur 8 ou 16 Bits. Ces paramètres peuvent être combinés
pour avoir un débit optimal (voir tableau 1).
D = Fe . N . m
Y(x)
x
Figure 7
(S/B) = 6,02 N + 4,77 - 20 log g+10 log[ A /( 1 + Ln(A) ) ] : pour les faibles amplitudes
* Conclusion :
4- CODAGE
Le codage revient à donner une représentation binaire ou autre au signal quantifié.
On a vu qu'une combinaison de N éléments binaires pourra être codée par 2 N amplitudes
quantifiées. Il existe plusieurs types de codage de type temporel ou fréquentiel
P max = V2pp = ( 2N . )2
()max = = 3. 2N-1
soit encore :
()max (en dB) = 10 log ( 3 . 2N-1 ) = 6N + 1,76
Conclusion :