Chapitre 1 TIS - M1P-STR

Chapitre 1
NUMÉRISATION DU SIGNAL AUDIO
1. Caractéristiques d’un signal audio
Un signal audio est tout signal acoustique pouvant être audible par l’oreille humaine. Il peut
être de la musique, de la parole, et même de bruits acoustiques. Il est généralement non
stationnaire et redondant. Il est caractérisé par :
- sa fréquence d’échantillonnage : Fe
- le nombre de bits de quantification et de codage : N
- débit D = Fe . N . m
m= nombre de canaux (en mono : m=1 alors qu’en stéréo m=2)
Le signal parole est caractérisé par une représentation formantique alors que la musique
présente un caractère harmonique.
Parole Musique
2- Paramètres du signal parole
2.1. pitch Fo: c’est la fréquence fondamentale de la glotte (larynx) qui est caractéristique de
production de la parole : elle caractérise les sons voisés (a, u, i, e,…)
2.2. les formants F1, F2, F3 : qui sont les fréquences de résonance du conduit vocal
(pharynx)
F1 F2 F3
3. Modèle électrique du signal parole
4. Numérisation d’un signal audio
La chaîne de numérisation d’un signal audio est composée de trois étages :
- l’échantillonnage
- la quantification (conversion analogique-numérique) avec compression de
données A ou 
- le codage ( PCM, ADPCM, Delta,…)
Echantillonnage Quantification Codage

A l’aide de la carte son d’un ordinateur l'acquisition ou la restitution du signal audio se
fait selon deux étapes :
- 1ére étape : on doit convertir le signal acoustique en un signal analogique
( tension ) cette opération nécessite un Microphone ( convertisseur acoustique analogique).
- 2éme étape : on doit convertir le signal analogique en un signal numérique à
l’aide d’une carte son munie d'un préamplificateur, un filtre anti-repliement et un
convertisseur analogique numérique ( figure 6).
Si nous voulons restituer le signal vocal, les deux étapes inverses sont nécessaires. La figure 3
présente le schéma du système d’acquisition et de restitution du signal vocal.
 microphone
Etage Filtre anti Convertisseur

Amplificateur repliement A/N

Etage Filtre Passe Convertisseur
Amplificateur Bas N/A
Micro
 Haut Parleur
Fig.6 Chaîne d’acquisition et de restitution d’un signal audio
2.1. Choix de la fréquence d'échantillonnage
D'après le théorème de Shannon, la fréquence d'échantillonnage assurant un non repliement

du spectre doit être supérieure à 2 fois la fréquence haute du spectre du signal analogique.
Le signal audio ( musique et/ou parole ) est caractérisé par un spectre s'étalant de 20 Hz à 20
kHz, nécessitant une fréquence d'échantillonnage supérieure à 40 kHz. La réduction de cette
bande, notamment dans le cas du signal parole, autorise l'utilisation d'une fréquence
d'échantillonnage réduite. Le tableau suivant présente quelques valeurs courantes :
Fréquence
Spectre du signal Applications
d'échantillonnage
Qualité téléphonique [300 ; 3 400 Hz] 8 kHz Téléphonie
Qualité "bande 16 kHz
[50 ; 7 000 Hz] PC, audio-conférence (ADPCM)
élargie" 22 kHz
Haute qualité en
[50 ; 15 000 Hz] 32 kHz DAB, NICAM
radiodiffusion
44.1 kHz
Qualité "Hi-Fi" [20 ; 20 000 Hz] CD Audio, Studio numérique, DAT
48 kHz
2.2 Choix du nombre de bits de quantification
Le nombre n de bits utilisés pour le codage des échantillons détermine l'erreur de

quantification maximale proportionnelle à 1/2n. Dans le cas d'une quantification linéaire (pas
de quantification constant sur toute la plage de conversion), on exprime l'erreur due à la
quantification sous la forme d'un rapport Signal à Bruit (SNR : Signal to Noise Ratio) dont
l'expression est la suivante :
Ainsi, en incrémentant le nombre n de bits d'une unité, on augmente le rapport SNR de 6 dB.
Le tableau suivant présente quelques exemples :
Qualité "Hi-Fi" 16-18 bits SNRdB 95 dB

Codage la parole, NICAM 14 bits SNRdB 80 dB
Codage son PC 8 bits SNRdB 40 dB
La carte son a neuf fréquences d’échantillonnage par défaut qui sont 8 000 Hz, 11025
Hz, 12 000 Hz, 16 000 Hz, 22 050 Hz, 24 000 Hz, 32 000hz, 44 100Hz, 48 000hz, mono ou
stéréo, on peut aussi choisir le codage sur 8 ou 16 Bits. Ces paramètres peuvent être combinés
pour avoir un débit optimal (voir tableau 1).
Le débit (D) d’un canal audio est donné par :
D = Fe . N . m
Fe : fréquence d’échantillonnage

N : nombre de bits de codage
M : nombre de canaux (1 : mono ou 2 : stéréo)
3. Quantification audio avec compression de données

a) Quantification logarithmique
En pratique, on préfère assurer un rapport S/B indépendant de la variance ( ou puissance ) du

signal dans une gamme aussi large que possible . On choisit une loi de la forme logarithmique
suivante :
Y(x)
x
Figure 7
Sachant que M = 2N , on aura un rapport signal / bruit :

b) compression selon la loi A et  (utilisée en transmission de la parole )
(S/B) = 6,02 N + 4,77 - 20 log( 1 + Ln(A) ) : pour les grandes amplitudes
(S/B) = 6,02 N + 4,77 - 20 log g+10 log[ A /( 1 + Ln(A) ) ] : pour les faibles amplitudes
La norme européenne utilise en téléphonie une valeur A = 87,56
* Conclusion :
A l'aide de la loi de compression logarithmique, on a amélioré le facteur (S/B) des

faibles signaux de 10 log[A/1+Ln(A)] par rapport à la quantification uniforme (gain de 4
bits pour un CAD de 8 bits)
4- CODAGE
Le codage revient à donner une représentation binaire ou autre au signal quantifié.
On a vu qu'une combinaison de N éléments binaires pourra être codée par 2 N amplitudes
quantifiées. Il existe plusieurs types de codage de type temporel ou fréquentiel
4.1. Puissance d'un codeur
Soit un signal sinusoïdal d'amplitude crête à crête. Si on utilise le principe de

quantification par arrondi, la puissance maximale du codeur est donnée par :
P max = V2pp = ( 2N . )2
ce qui donne : Pmax = 2 (2N-3) q2
4.2. Rapport Signal/Bruit
On rappelle que l'acquisition et la quantification induisent un bruit dont la puissance

est liée à la dynamique du codage. En effet, celle-ci est donnée par le rapport signal-bruit
maximal ()max qui n'est que le quotient de la puissance maximale du codeur Pc par rapport à
celle du bruit de quantification PB . En fait :
()max = = 3. 2N-1
soit encore :
()max (en dB) = 10 log ( 3 . 2N-1 ) = 6N + 1,76
Conclusion :
Chaque bit supplémentaire améliore le rapport signal / bruit de 6dB.

Chapitre 1 TIS - M1P-STR

Hochgeladen von

Dokumentinformationen

Originaltitel

Copyright

Verfügbare Formate

Dieses Dokument teilen

Dokument teilen oder einbetten

Freigabeoptionen

Stufen Sie dieses Dokument als nützlich ein?

Sind diese Inhalte unangemessen?

Copyright:

Verfügbare Formate

Chapitre 1 TIS - M1P-STR

Hochgeladen von

Copyright:

Verfügbare Formate

Chapitre 1

NUMÉRISATION DU SIGNAL AUDIO

1. Caractéristiques d’un signal audio

m= nombre de canaux (en mono : m=1 alors qu’en stéréo m=2)

2- Paramètres du signal parole

3. Modèle électrique du signal parole

4. Numérisation d’un signal audio

La chaîne de numérisation d’un signal audio est composée de trois étages :

Echantillonnage Quantification Codage

Etage Filtre anti Convertisseur

2.1. Choix de la fréquence d'échantillonnage

D'après le théorème de Shannon, la fréquence d'échantillonnage assurant un non repliement

Le nombre n de bits utilisés pour le codage des échantillons détermine l'erreur de

Qualité "Hi-Fi" 16-18 bits SNRdB 95 dB

Le débit (D) d’un canal audio est donné par :

Fe : fréquence d’échantillonnage

3. Quantification audio avec compression de données

En pratique, on préfère assurer un rapport S/B indépendant de la variance ( ou puissance ) du

Sachant que M = 2N , on aura un rapport signal / bruit :

(S/B) = 6,02 N + 4,77 - 20 log( 1 + Ln(A) ) : pour les grandes amplitudes

La norme européenne utilise en téléphonie une valeur A = 87,56

A l'aide de la loi de compression logarithmique, on a amélioré le facteur (S/B) des

4.1. Puissance d'un codeur

Soit un signal sinusoïdal d'amplitude crête à crête. Si on utilise le principe de

ce qui donne : Pmax = 2 (2N-3) q2

4.2. Rapport Signal/Bruit

On rappelle que l'acquisition et la quantification induisent un bruit dont la puissance

Chaque bit supplémentaire améliore le rapport signal / bruit de 6dB.

Das könnte Ihnen auch gefallen