Prise de Son en Studio

Prise de Son en Studio
I. Comprendre le son avant de l’enregistrer
Chaine du signal pour une prise de son

Les niveaux
Signal symétrique et asymétrique
Les différentes connectiques pour la prise de son (XLR et jack)
Les micros dynamiques
Les micros statiques
Les directivités primaires des microphones
Les DI ou Direct Injection
La console de mixage
Les cartes son
Les connectiques
L'ordinateur
Buffer Size et décalage lors de la prise de son
La notion de Bit depth et Sample Rate
Création d’une session d'enregistrement
Explication de l'échelle de visualisation de votre signal audio (dB Full scale)
Le rapport Signal/Bruit (S/N)
Notion de Headroom pour votre prise
Le monitoring
L'écoute au casque fermé vs casque ouvert
II. La prise de son stéréophonique
Le couple AB
Le couple XY
Le couple ORTF
Le microphone MS
La tête artificielle
III. La prise de son en monophonie dirigée (pseudo-stéréophonie)
1
I. Comprendre le son avant de l’enregistrer
La chaîne du son
Tous les éléments sont connectés entre eux d’une manière logique qui suit ce qu’on appelle la chaîne
du son : c’est une manière schématique de représenter le parcours du son, de la source à la
reproduction par les enceintes
Le premier maillon c’est la source sonore qui produit une onde sonore acoustique
Le deuxième maillon c’est le micro : c’est lui qui va transformer l’onde acoustique en signal
électrique : un signal de quelques millivolts
Le troisième maillon c’est la console (table de mixage), ou le préamplificateur ou l’interface

audionumérique qui va amplifier le signal de quelques millivolts à quelques centaines de millivolts
Le quatrième maillon est l’amplificateur qui augmente la puissance vers plusieurs dizaines de volts
Le dernier maillon est le haut-parleur qui transforme le signal électrique de sortie de l’ampli en
énergie acoustique, en onde sonore
Important : Si l’un des éléments de la chaîne est d’une qualité inférieure, toute la chaîne
s’en trouve réduite à cette qualité
Ce principe de chaîne du son peut s’appliquer à toutes les configurations d’amplification et

d’enregistrement
Différentes parties de la chaîne sont souvent intégrées dans un même appareil
Ex :
Les enceintes amplifiées intègrent un ampli et un haut-parleur
2
Les amplis guitare intègrent un pré-ampli, un ampli et un haut-parleur
Le larsen est une boucle de cette chaîne : si on met un micro dirigé vers un haut-parleur il se crée
une boucle  Le son capté par le micro, qui sort du haut-parleur au bout de la chaîne, est re-capté
par le micro
C’est souvent une seule fréquence qui

s’amplifie de plus en plus. Cette
fréquence dépend de plusieurs
paramètres : le lieu, le micro, le haut-
parleur ; ça peut endommager le
matériel et, surtout, les oreilles.
En studio, la meilleure manière

d’éviter un larsen est de différencier le
lieu où l’on enregistre du lieu où l’on
écoute ce qui est enregistré et surtout
de s’écouter jouer avec un casque
fermé sans aucun son dans les
3
enceintes  En plus de risquer un larsen entre le micro et les enceintes, on rajouterait du bruit de
fond à notre enregistrement
Les niveaux
En Audio, il existe différents niveaux de signal. Le niveau, pour faire simple, c’est la « puissance » du
signal
Pour schématiser, c’est un peu la différence qu’il y a entre une pile 1.5 volts, 9 volts, une batterie de
voiture 24 volts et le courant 220 volts de la STEG
On trouve trois niveaux :
Micro (mV)
Le signal est très faible, de quelques millivolts et donc très fragile, sensible aux parasites  C’est le
niveau électrique de sortie d’un micro. Vous pouvez voir sur les docks des fabricants les indications
de ce niveau en millivolts
Instrument (mV)
Un peu plus élevé que le niveau Micro, la sortie d’une guitare par exemple. Ce niveau est néanmoins
tellement faible que le moindre passage à proximité d’un câble de courant ou d’une multiprise peut
le détériorer. Pour être utilisé, il faut amplifier le signal avec un préampli.
Ce type de signal est adapté aux entrées Mic in sur les tables de mixage ou les cartes sons
Un signal micro est en généralement transmis sur un câble XLR en symétrique
Ligne (V)
Signal déjà amplifié, d’un niveau électrique bien supérieur, quelques Volts. C’est le niveau de sortie
d’un lecteur CD, d’un sampler ou même d’une console
4
Ce signal est fiable et beaucoup moins sensible aux parasites qu’un signal Micro. C’est ce niveau-là
qu’on retrouve dans toutes les interconnexions des appareils dans le studio.
Il est noté Line In si c’est une entrée sur une table de mixage ou une carte son et Line Out si c’est une
sortie
Toutes les entrées CD ou Tuner de votre ampli Hifi sont des Line In
Les sorties d’une table de mixage qu’elles soient en Jack ou en XLR sont des Line Out
Haut-parleur
C’est un signal très amplifié, qu’on trouve à la sortie d’un ampli de puissance de plusieurs dizaines de
Volts, mais ça dépend essentiellement de la puissance de l’ampli. Plus un ampli est puissant, plus il
est capable de délivrer un signal élevé
Dans le cas de grosses installations sono ce signal peut même être très dangereux. Ce niveau-là n’est
compatible qu’avec des haut-parleurs, on ne peut pas brancher la sortie d’un ampli de puissance
dans une entrée de console, on ferait tout griller
Les câbles dans lesquels passent les signaux HP sont pratiquement insensibles aux parasites : ils
peuvent passer à côté de câbles de courant sans trop de problèmes.
Les signaux HP sont transmis sur des câbles HP spécifiques, qui sont souvent de gros diamètre, ils
véhiculent beaucoup de puissance
Les signaux symétriques et asymétriques

Dans le domaine de l’audio, il existe deux types de câbles :
Asymétriques
Tous ceux qui transmettent le signal avec un plus (+) et un moins (-). Tous les câbles de type Cinch ou
RCA qui permettent par ex de relier votre lecteur CD à l’ampli ou les Jack Mono qui servent à
brancher une guitare sont des câbles asymétriques. Ils ne contiennent à l’intérieur qu’un seul fil qui
transmet le signal et un blindage (souvent une tresse de masse qui entoure ce fil)
Dans beaucoup de cas où le signal a déjà un bon niveau, comme dans le niveau Ligne, ce type de
câble convient très bien
Par contre, on ne peut pas avoir des câbles asymétriques de 20m de long : le signal se dégrade avec
la longueur. Ce n’est pas audible sur quelques mètres mais ça le devient sur des longueurs
importantes
Des parasites il en existe de toute sorte : des ondes surtout, celles des téléphones portables, les
perturbations que peuvent générer un câble d’alimentation d’un appareil électrique… plus un câble
est long plus il se comporte comme une antenne, plus il aura tendance à récupérer des parasites
Dans le milieu pro il a fallu trouver une solution
Symétriques
On a vu que le signal Micro est très faible et sensible aux parasites. La plupart des micros pro ont une
connectique de sortie en XLR qui possède trois broches comportent deux fils et une masse, toujours
de cuivre en tresse qui sert aussi de blindage).
5
A l’intérieur du micro, électroniquement, le signal est dupliqué : un en phase, le fil plus (+), l’autre en
opposition de phase, le fil (-)
Comme on l’a vu précédemment, si on additionne deux signaux en opposition de phase on obtient

du silence, les deux signaux s’annulent
Dans le cas d’un câble symétrique, les deux signaux sont soustraits à la fin (+) – (-) = (+) (+) ; le signal
est même doublé en intensité.
Si un parasite vient perturber le fil (+) il perturbera de la même manière le fil (-) et quand on
soustraira les deux le parasite disparaîtra
Les différentes connectiques

XLR
JACK
6
Combo
7
Les micros1
Le microphone est un capteur qui transforme l’énergie acoustique, les ondes sonores, en énergie
électrique
On définit un micro par :
1. Son type : la technologie utilisée pour la transformation de l’énergie acoustique en énergie

électrique
2. Sa directivité : sa sensibilité par rapport à l’angle d’incidence de l’onde acoustique, son
champ de captation en quelque sorte
Types
Le microphone électro dynamique
Microphone électrodynamique à bobine mobile (appelé micro dynamique)
Il utilise une bobine de cuivre et un aimant
La bobine, fixée à la membrane, est placée dans le champ magnétique de l’aimant
Chaque mouvement mécanique de la membrane est traduit en tension électrique
Ce microphone a l’avantage d’être robuste et de supporter de très hauts niveaux de pressions

acoustiques. Il est peu sensible au vent et à l’humidité, mais il est sensible au champ magnétique
On note en revanche une perte de définition dans les fréquences aigues, à partir de 15 KHz
Les micro adaptés à la voix ont :
1
Voir :
- Microphones partie 1 : Les principaux types ; https://www.youtube.com/watch?v=WxvmQaxzPxo
- Comment fonctionne un micro? - C'est pas sorcier ;
https://www.youtube.com/watch?v=LNBo4ANgaxs
- A Lesson on Microphone Types – Berklee ; https://www.youtube.com/watch?v=1Zz5kOXK4tE
8
- une courbe de réponse augmentée vers 5 KHz pour donner une meilleure intelligibilité
- un filtre antivent
- un filtre anti pop : atténuation des plosives et des sifflantes
Exemples de micros :
Shure SM58
Shure Beta-58
Shure SM57
Shure Beta-52
Beyer M-88
Les micros dynamiques sont le plus souvent réservés à la scène, ils sont aussi moins chers.
Mais beaucoup d’entre eux sont d’excellente qualité, et beaucoup sont utilisés aussi en studio
Sur les batteries et les guitares il est courant de voir des Shure SM-57, sur la caisse claire ou devant
l’ampli
Le microphone électrostatique
Ou micro statique ; condenser microphone en anglais
Il utilise un système électro statique pour transformer l’énergie mécanique de la membrane en

énergie électrique
La membrane forme une électrode d’un condensateur, l’autre membrane étant fixe
L’électrode mobile est sensible à la pression acoustique et provoque une variation de la capacité du
condensateur formé par ces deux électrodes
9
Une tension continue est appliquée à ce condensateur, et lorsqu’une onde acoustique vient agir sur
la membrane, il en résulte une variation de distance entre les électrodes ce qui provoque une
variation de capacité, ce qui engendre une tension à la sortie
Le faible signal de sortie est élevé par un préamplificateur qui nécessite une alimentation externe
fournie par la table de mixage via le câble micro : c’est l’alimentation Phantom 48 Volts ou par une
pile insérée dans le micro
Ce système permet une grande sensibilité dans les aigus, mais également dans les basses
Sa réponse aux transitoires2 est excellente.
Ils sont en revanche très fragiles, et ne supportent ni les chocs ni le vent, et lorsqu’on les utilise en
extérieur ils devront être équipés d’une bonnette antivent
Leur membrane électrostatique attire la poussière et craint l’humidité.
Ce sont des micros très polyvalents.
Exemples :
Shure SM-81
AKG-C451
Sennheiser MKH40
Neumann KM184
Schoeps
Les statiques sont un très bon choix pour un travail en home studio : ils sont polyvalents, ils
acceptent souvent un très fort volume, et ils sont très sensibles (retranscrivent les moindres détails)
2
« Un son musical ne s'établit et ne s'éteint pas instantanément. On appelle « transitoires » les phénomènes
acoustiques évolutifs en présence lors de l'établissement et de l'extinction des sons. La durée de ces
phénomènes transitoires, mais aussi l'ordre d'apparition et d'extinction des divers composants des sons
(harmoniques et partiels), conditionnent largement le timbre. Dès l'apparition de la bande magnétique, il a été
facile de montrer que les transitoires conditionnent très largement le timbre. En effet, il suffit de lire une bande
de musique de piano à l'envers pour confondre le timbre du piano avec celui de l'accordéon ; il suffit de couper
les attaques du violon pour ne plus reconnaître l'instrument ; il suffit de « gonfler » artificiellement l'extinction
d'un accord de piano pour penser qu'il s'agit d'un accord d'orgue ! »
« − MUS. Durée du transitoire d'attaque. Durée mise par le son à trouver son régime normal (lorsqu'on met en
vibration une corde de violon ou la colonne d'air d'un tuyau d'orgue, le son ne s'établit pas instantanément)
(d'apr. Mus. 1976). »
1
0
Le microphone électrostatique à électret3
Il fait partie de la famille des micros électrostatiques à condensateur
La différence réside dans le fait que la membrane, en matière plastique , est polarisée lors de sa
fabrication
Avec le temps, sa charge s’atténue, ce qui limite sa durée de vie
Il nécessite quand même une alimentation phantom pour alimenter son préamplificateur
Sa miniaturisation fait qu’on le trouve sous de nombreuses et différentes formes : micro cravates, à
pinces, pour s’adapter facilement à certains instruments, pour une prise de son de proximité
(cuivres, percussions, vents)
Il est relativement bon marché, et de qualité s’approchant des micros électrostatiques
On l’utilisera selon les particularités de chaque modèle, leurs courbes de réponse variant selon la
fabrication.
Exemples :
Sennheiser MKE2
3
TRONIK AVENTUR 150 - MICRO ELECTRET - ELECTRONIQUE POUR LES NULS TUTORIEL MODE D'EMPLOI ;
https://www.youtube.com/watch?v=Mw5qfxSLIvE
1
1
Sennheiser ME102
Sennheiser ME104
1
2
Shure SM-98
1
3
Le microphone à ruban
Il fait partie de la famille des micros électrodynamiques, la bobine est remplacée par un ruban en
aluminium servant à la fois de membrane et de bobine
Le ruban, fixé à ses deux extrémités, est placé dans un champ magnétique permanent
Il peut osciller sous la pression acoustique, ce qui fait apparaître une tension à ses extrémités
Ce type de micro est très fragile, sensible au vent et aux bruits de manipulation
On l’utilise pour la prise de son de certaines voix ou instruments acoustiques
C’est une assez vieille technologie qui est aujourd’hui remise au goût du jour. Un micro ruban de
qualité apporte souvent un son très feutré, très proche du son réel
Exemples :
Beyerdynamic M160
Mélodium
1
4
La directivité
La directivité définit la sensibilité par rapport à la provenance d’un son, c’est-à-dire l’angle
d’incidence de l’onde acoustique
Omnidirectionnel
Le microphone omnidirectionnel ne privilégie aucune provenance. Il capte les sons venant de toute
direction.
On l’utilise rarement en sonorisation mais surtout en enregistrement
1
5
Bi-directionnel
Le microphone bi-directionnel est sensible aux sons proveannt de l’avant et de l’arrière de sa
membrane.
Par contre, il ne captera pas les sons provenant des côtés.
C’est le microphone des duos : il permet de placer les interprètes de part et d’autre du micro, et l’on
enregistre les deux sur une seule piste
1
6
Cardioïde
(en forme de cœur)
Le microphone cardioïde est très sensible aux sons venant de l’avant et peu sensible aux sons
provenant de l’arrière
On l’utilisera chaque fois qu’on aura besoin d’isoler une source par rapport à une autre
Hyper-Cardioïde
Le microphone hyper-cardioïde est plus directionnel que le microphone cardioïde ; son champ de
captation est plus allongé vers l’avant et a une légère sensibilité vers l’arrière
On utilise ce type de microphone lorsqu’on a besoin de davantage de sélectivité vers l’avant.
1
7
C’est ce type de directivité qu’ont les microphones canon4 (shotgun microphones en anglais) utilisés
par le perchman ou le cameraman.
Remarques :
- La majorité des microphones ont une directivité donnée mais certains modèles
électrostatiques proposent plusieurs directivités que l’on sélectionne à l’aide d’un
interrupteur
- Certains microphones sont équipés d’un réglage d’atténuation des graves, ou coupe-bas,
qui permet d’atténuer les pops des voix par exemple
- Presque tous les micros pros ont une connectique de sortie en XLR sur trois broches qui
nécessitent un câble symétrique XLR avec deux fils, un + et un – et une masse. A
l’intérieur du micro, un circuit électronique ou un transformateur symétrise le signal
- On trouve aujourd’hui des microphones dits USB ; en fait ce sont des microphones
« normaux » dynamiques ou statiques qui intègrent dans leur corps un préampli, un CAN
et un circuit USB. Ce type de connexion permet surtout de se passer de beaucoup de
matériel et de rentrer directement le son dans son ordinateur. Le micro est reconnu par
le système d’exploitation comme une carte son avec une seule entrée.
La boîte de direct
Ou Direct Injection
N’est pas un microphone, mais pour schématiser c’est un peu l’équivalent du microphone pour les
instruments électriques
Elle est utilisée pour raccorder n’importe quel instrument électrique (guitare, basse, synthétiseur,
sampler…) à un système de sonorisation ou d’enregistrement
Sa fonction principale est de symétriser le signal
Un signal symétrique sera bien plus fiable, plus résistant au parasite, et pourra être transporté sur
des câbles de grande longueur.
La plupart des DI proposent un atténuateur qui va servir à diminuer le niveau du signal d’entrée si
celui-ci est trop important et risque de faire saturer l’entrée de la console
On trouve :
- Une prise jack asymétrique pour l’entrée de l’instrument, (input)

- Une sortie XLR symétrique (output) pour aller sur une entrée micro de la console
- Une prise jack pour sortir vers l’amplificateur du musicien (link) une copie du signal
d’entrée
On trouve des modèles passifs à base de transformateurs qui peuvent fonctionner sans alimentation
Phantom et des modèles dits actifs qui ont une électronique à l’intérieur et qui ont donc besoin
d’une alimentation pour fonctionner
Beaucoup de cartes sons actuelles proposent des entrées « Instrument » qui fonctionnent comme les
DI
4
Voir : On-Camera Shotgun Microphones, A to Z
https://www.bhphotovideo.com/explora/audio/buying-guide/shotgun-microphones
1
8
Exemples :
LA audio DI-2
BSS AR-133
1
9
Behringer Ultra DI
La console de mixage
2
0
Ou table de mixage
Elle a différentes fonctions que nous allons voir en détail.
Elle va surtout être utile si l’on souhaite utiliser plusieurs microphones ou instruments en même
temps
Elle va servir à mélanger les sons provenant de tous les appareils du studio : micros, sampler,
synthés, effets, enregistreurs… et permet d’envoyer des mixages différents dans les casques des
musiciens
Les tables de mixages, qu’elles soient numériques ou analogiques, fonctionnent selon le même
principe, il y a
- Des voies d’entrée : micro, ligne (line), CD, effet

- Des voies de sortie
Le plus souvent, tout cela est regroupé sur l’arrière de la console5
Une console fonctionne par tranche, verticalement, une pour chaque micro
Toutes les tranches ont les mêmes réglages que leurs voisines, on peut comparer ça à une
tuyauterie : des circuits verticaux à partir desquels des robinets envoient dans des circuits
secondaires  Le signal rentre par le haut et ressort par une des sorties une fois traîté
5
Visionnage 360° : Yamaha MGP24 https://www.thomann.de/fr/yamaha_mgp24x.htm
2
1
2
2
2
3
Fonctionnement d’une tranche de console :
- Entrée Micro (MIC) équipée d’un connecteur XLR qui permet de raccorder un signal
microphonique symétrique ; c’est l’entrée du préampli
- Entrée Ligne (Line In) généralement équipée d’un connecteur Jack pour raccorder un
signal dont le niveau est plus important que celui d’un micro
- Gain (ou Trim ou Sens selon les constructeur) : c’est l’étage de préamplification du signal,
il sert à élever le niveau du micro ou de la ligne pour lui donner une valeur qui
correspond aux tensions de fonctionnement des circuits de la console. Le préampli est un
maillon très important de la console, sa qualité conditionne toute la suite du traitement
- PAD / Line / Hi-Z : atténuation, généralement de -20dB, du signal présent à l’entrée
Micro. On l’utilise lorsqu’un signal est trop fort après l’avoir réduit avec un Gain au
minimum
- Coupe bas (Low cut ou HPF High Pass Filter) : filtre passe haut qui coupe les fréquences
inférieures à sa valeur (75, 80 ou 100 Hz en général). On utilise ce filtre chaque fois que
le signal que l’on doit capter ne contient pas de fréquences inférieures à sa valeur > on
évite ainsi d’amplifier des résonnances parasites ou on réduit les pops d’une voix
- Phase (ou inverseur de polarité) : ce commutateur permet d’inverser la polarité du signal
présent à son entrée. Si l’un des deux microphones envoie un signal hors phase par
rapport à l’autre, à cause d’un câble mal soudé par exemple, on utilise le bouton Phase
pour le remettre à l’endroit
- Alimentation Phantom 48 V : l’action de ce bouton envoie un courant d’alimentation à
l’appareil qui lui est connecté (microphone électrostatique, boitier de direct…). On
l’appelle alimentation Phantom parce qu’elle est bien présente mais pas audible. Elle
véhicule le +48 V au travers des câbles connectés en 2 et 3 du XLR
Attention :
Quand on met en service une alimentation 48 V on doit ABSOLUMENT avoir coupé les
enceints ou muté la tranche de la console. La mise en service du 48 V crée un énorme
ploc
Ne jamais envoyer un 48 V à un micro non prévu pour ça (dynamique ou à ruban),
surtout les vieux micros
Les carte sons et interfaces audionumériques (formats, connectiques et synchro)

L’interface audionumérique, qu’on appelle aussi carte son, est l’élément qui transforme le signal en
données compréhensibles par l’ordinateur, elles intègrent forcément un ou plusieurs CAN et CNA
On ne parlera ici que des interfaces pro ou semi pro et pas des cartes sons intégrées aux ordinateurs
portables ou de bureau. Le concept est le même avec moins d’entrée et de sortie
Il en existe de plusieurs sorte, en fonction de la manière dont elles sont raccordées à l’ordinateur
Les formats
PCI / PCI Express
pour les ordinateurs de bureau au format tour
2
4
RME HDSP 9652
RME HDSPe RayDAT
2
5
Carte que l’on insère dans un emplacement ou slot PCI, la carte mère de l’ordinateur
Soit la connectique est directement intégrée sur la carte, soit elle est reliée à un boitier externe par
un câble, souvent au format propriétaire
FireWire
Focusrite Saffire Pro 26
Pour les raccorder à une carte FireWire d’un ordinateur de bureau ou portable
Il existe plusieurs types de câbles et de connectiques FireWire. Elles sont normalement compatibles
entre elles. On trouve du FireWire 400 ou du FireWire 800 plus rapide mais avec des connectiques
différentes. Il existe des adaptateurs
USB
Roland UA-55 Quad-Capture6
6
Visionnage 360° https://www.thomann.de/fr/roland_ua55_quadcapture.htm
2
6
A raccorder avec un port USB libre d’un ordinateur de bureau ou portable
Les cartes avec connectique FireWire sont beaucoup plus utilisées dans les studios pro car le FireWire
est géré par une puce dédiée, il ne demande pas beaucoup de ressources au processeur et à la
mémoire
L’USB au contraire demandera plus de ressources à l’ordinateur, les accès sont moins rapides et
consomment plus de ressources.
Thunderbolt
2
7
Le FireWire est beaucoup plus adapté pour des cartes avec beaucoup d’entrée et de sorties (16 ou
24) et est aussi beaucoup plus fiable.
Sur ces interfaces on peut trouver plusieurs connectiques, pour y entrer des signaux analogiques ou
numériques, ainsi que des sorties.
Tous ces signaux audio passent par le câble FireWire, USB ou le port PCI avant d’être traitées par
l’ordinateur
La connectique7
Souvent, les interfaces proposent des préamplis capables de traiter le signal d’un micro, de lui
donner du gain, et une entrée instrument pour brancher une guitare ou une basse, comme une DI
Ce préampli a un réglage pour le Gain et un indicateur de niveau, au moins de Clip
On trouve de plus en plus couramment des prises dites Combo qui permettent de brancher soit un
XLR soit un Jack
7
Voir La connectique audio et vidéo, analogique et numérique
http://www.son-video.com/Rayons/Cables/EspaceCable/CatCables.html
http://www.figer.com/Publications/prises.htm#.WG7RfeQbg2E
http://www.sen.eme.free.fr/mj/tronc_com/connectiques/Connectiques_diapo.pdf
https://www.easyzic.com/dossiers/les-connecteurs-audio,h56.html
https://www.electronique.ac-bordeaux.fr/Fichiers_Contributions/Connectique_Audio.pdf
2
8
On trouve aussi des entrées Ligne (Line) généralement Jack, symétrique ou non (ça dépend de la
qualité de l’interface) et des entrées / sorties en RCA. Ces entrées permettent d’y connecter des
niveaux élevés, déjà pré amplifiés comme un synthétiseur, un lecteur CD, les sorties direct out d’une
console pour enregistrer en multipiste
Les entrées Mic ou Line sont des entrées analogiques, cela veut dire que derrière, il y a forcément un
CAN pour numériser le signal
Les interfaces audionumériques ont aussi des sorties, souvent en Jack, quelques fois en XLR, qui
permettent de raccorder ses enceintes, un enregistreur externe, ou des effets externes
Les formats numériques
 Le S/PDIF (Sony/Philips Digital InterFace) : format de transfert audionumérique stéréo allant

jusqu’à 24 bits 96 kHz
Sony/Philips Digital Interface Format (S/PDIF) is a consumer-level variation of the AES/EBU digital
audio protocol. S/PDIF audio data can be transmitted several ways, including:
Via coaxial cables with an RCA connector
Via optical TOSLINK
Connectors for S/PDIF signals are found on most consumer digital equipment, such as DAT recorders,
CD players, DVD players, MiniDisc equipment, and some audio interfaces.
 AES/EBU8 : véhicule deux canaux, donc stéréo, d’un signal numérique pouvant aller jusqu’à
24 bits et 192 kHz ; c’est la version pro du SPDIF. On utilise là aussi un câble numérique
différent d’un câble XLR analogique appelé câble AES 110 Ohms
 ADAT (Alesis Digital Audio Tape) : permet de transférer 8 canaux sur une fibre optique avec
une résolution de 24 bits 48 kHz maximum. Il y a souvent une prise optique pour 8 entrées
ADAT et une autre prise optique pour 8 sorties ADAT. C’est un format très utilisé en studio, il
permet de connecter des convertisseurs externes, récupérer les sorties d’une console
numérique équipée en ADAT
Une déclinaison récente de l’ADAT est l’ADAT double speed qui permet de transférer des signaux à
des résolutions supérieures, par contre on perd la moitié des canaux. Une interface fonctionnant en
ADAT double speed peut envoyer et recevoir quatre canaux en 24 bits 96 kHz
Sur la majorité des interfaces, il y aussi des prises Midi in et Midi Out pour connecter des interfaces
midi ou des claviers maîtres
C’est le pilote, ou le logiciel de l’interface, qui permet de configurer la résolution de l’AES/EBU, du

SPDIF ou de l’ADAT
8
Officiellement nommé AES3. Ce standard a été développé conjointement par l'Audio Engineering Society
(AES) et l'European Broadcasting Union (EBU). La première version du standard est sortie en 1985, connue sous
le nom AES/EBU. Une révision a eu lieu en 1992 puis une autre en 2003.
2
9
Les connectiques numériques
 RCA plaqué or ou optique (Radio Corporation of America)9 : on doit utiliser un cable RCA
dédié à deux conducteurs mais différent d’un RCA classique analogique. Il est souvent appelé
câble 75 Ohms
 Toslink
TOSLINK is a connector for optical digital signals. TOSLINK is used for several digital signal formats,
although most devices support only one of these formats:
 S/PDIF (stereo digital)

 AC-3 and DTS (5.1-channel surround)
 ADAT Lightpipe (an 8-channel digital signal)
La synchronisation
En dehors de ce type de connectique, on trouve d’autres prises qui ne véhiculent pas de signal audio,
comme le Word Clock (WC in / out)
Les connectiques WC sont en BNC (Bayonet Neill–Concelman connector)
Ce sont les câbles BNC 75 Ohms que l’on utilisera
Ce Word Clock sert à synchroniser de manière exacte différents appareils numériques avec la même
horloge. C’est un format issu de la vidéo qui permet justement de synchroniser ultra précisément les
appareils audio avec les appareils vidéo
Chaque CAN et CNA a besoin d’une horloge pour fonctionner
44100 Hertz est une fréquence d’horloge : cette fréquence d’échantillonnage donne au convertisseur
un intervalle de temps régulier entre chaque échantillon
D’un convertisseur à l’autre, la fréquence d’échantillonnage peut varier très légèrement ; l’idée du
Word Clock est de transmettre cet intervalle de temps exactement à toutes les machines
numériques. On doit choisir une machine maître de laquelle sortira le Word Clock par la prise Word
Clock Out et on configure les machines dites esclaves pour récupérer ce signal d’horloge sur leur
prises Word Clock in souvent en choisissant comme source d’horloge Ext (pour external)
Ce type de connexion est souvent bien utile lorsqu’on veut faire fonctionner plusieurs machines
numériques en même temps. Il évite des désynchronisations, des déconnexions intempestives et pire
parfois d’énormes bruits numériques
Il existe d’autres formats d’horloge comme le MTC ou le MCPTE
La synchronisation de plusieurs machines numériques peut aussi se faire directement à partir d’un
signal numérique : le SPDIF, l’ADAT, le AES/EBU contiennent des informations d’horloge. On peut très
bien configurer une machine pour qu’elle soit synchronisée sur un signal ADAT, cela simplifie aussi
beaucoup les branchements
9
Radio Corporation of America ou RCA était une entreprise américaine dont le nom, qui appartient aujourd'hui
à Technicolor, est utilisé par Sony BMG Music Entertainment en tant que label discographique et par d'autres
sociétés pour commercialiser des produits électroniques.
RCA a donné son nom aux prises RCA, ou prises cinch, couramment utilisées dans le domaine audio/vidéo.
3
0
L'ordinateur
L’ordinateur est maintenant le point central d’un studio audionumérique : c’est lui qui enregistre,
séquence, égalise, compresse… et tout un tas d’autres fonctions
Ses possibilités sont quasi illimitées, tout ne devient qu’une question de logiciels.
La carte son ou l’interface audionumérique se branche soit sur un port PCI ou PCI express, soit par
l’intermédiaire d’un câble FireWire ou USB. Elle ne peut pas fonctionner comme ça, juste en la
branchant sauf pour de très petites cartes son.
Il faut installer un Pilote (Driver). Chaque fabricant fournit avec son matériel un pilote ; les mises à
jour se trouvent aussi assez facilement sur internet. C’est ce pilote qui va permettre de configurer
l’interface audinumérique. Il existe des pilotes différents selon que l’on travaille sur un MAC ou un
PC.
- En Audio Pro, sur PC, on utilise presque toujours les pilotes dits ASIO : c’est un système
inventé par Steinberg, le fabricant de Cubase ; il est maintenant repris par tous les
fabricants. Ce pilote permet généralement de régler ce qu’on appelle la latence.
- Sur les MAC, directement incorporés dans le système d’exploitation OS, on trouve les
pilotes Core Audio qui permettent eux aussi de faibles latences et l’utilisation
simultanées de plusieurs périphériques.
- Avec Linux, les interfaces audionumériques utilisent des pilotes ALSA (Advanced Linux
Sound Architecture)
Quand on ne fait que lire un fichier sur ordinateur, cette latence n’a pas d’importance, on n’entend
pas le son avant qu’il ne sorte des haut-parleurs. Par contre, si on enregistre sa voix ou un instrument
et qu’on veut écouter en temps réel ce qui est enregistré, cela peut devenir plus problématique. La
différence de temps, même très petite, entre le moment où l’on parle et le moment où le son sort
des enceintes ou du casque est très dérangeante.
La latence est le résultat du traitement numérique ; numériser un signal, le traiter, puis le reconvertir
en en analogique prend forcément un petit peu de temps, sur tout le traitement. C’est un temps très
faible, mais notre oreille est capable de ressentir une différence de temps de quelques
millisecondes : à 10ms on commence à sentir une légère différence, une sensation bizarre ; à 20ms
c’est presque un écho.
Ce temps de latence est directement lié à plusieurs facteurs :
- La qualité de l’interface audionumérique

- La qualité du pilote
- La puissance de l’ordinateur : plus il sera capable de traiter un grand nombre
d’informations vite, moins il y aura de la latence lors du traitement
- La vitesse des disques durs : plus on veut enregistrer de pistes audio en même temps,
plus il faut que le DD soit rapide à écrire les données. Idem pour la lecture d’un grand
nombre de pistes : si le disque n’est pas assez rapide, on entendra des craquements qui
ne viennent pas des sons enregistrés mais de ce qu’on appelle les Buffer Disque
Important : Une latence de 4 à 7ms permet de travailler dans de bonnes conditions
Important :
3
1
- On ne doit pas enregistrer sur le disque dur système de l’ordinateur. En externe :
Thunderbolt, USB 3, Firewire 800  Eviter les problèmes de flux Audio (l’ordinateur stop
l’enregistrement car il n’arrive plus à encaisser le flux audio)
- RAM (Random Access Memory) : minimum de 8Go ; 16 Go de préférence (les
samplers/plugins etc. utilisent beaucoup de mémoire vive)
- Disque du Backup (sauvegarde) : RAID10 de préférence
- Les logiciels crackés sont moins performants
Le buffer size (mémoire tampon)

La latence se règle en configurant le Buffer du pilote. Un buffer est un tampon, une petite partie de
la mémoire qui sert de stockage ultra rapide avant que le son soit traité ou lu.
Plus le buffer est petit, plus la latence est faible.
Il faut que la carte son le permette. Et si on règle trop bas la taille du buffer, on risque aussi des
craquements numériques
 En enregistrement on règle le buffer size sur la plus petite valeur possible (128 samples par
exemple) sans avoir de clics numériques, pour avoir un minimum de latence (décalage)
 On augmente le buffer au mixage
Le séquenceur
Le séquenceur est le cerveau de toute la chaîne audionumérique. En anglais on parle de DAW :
Digital Audio Workstation > Station de travail audionumérique
C’est lui qui enregistre en multipiste l’audio, qui gère les effets, les reverb, les delays
Il peut même servir d’orchestre virtuel avec des instruments MIDI
C’est aussi avec ce logiciel qu’on va router notre signal. Le routing consiste à gérer quelle entrée de
la carte son va être enregistrée sur quelle piste, quelle sortie du logiciel, le master ou un auxiliaire,
pour un retour casque, ou un bus, va sur quelle sortie de la carte.
Surtout, il sert à faire le montage et le mixage.
C’est une console virtuelle et un enregistreur numérique en même temps.
Ils ont tous ce qu’on appelle une Timeline où l’on voit les pistes et les blocs différents du son
enregistré, des fichiers MIDI
On peut choisir de quelle manière il décrit le temps, avec un affichage du tempo et des mesures
Il dispose aussi d’une console de mixage. Cette console fonctionne de la même manière qu’une
console analogique : verticalement d’abord les inserts, les égaliseurs puis les Aux, puis les faders de
chaque piste ; un fader de Master qui lui aussi peut recevoir des inserts ou des Aux
Tous les séquenceurs fonctionnent en gros de la même manière. Les sons sont enregistrés sur le
disque et apparaissent sous la forme de blocs. On peut les copier, les couper, les déplacer… sans
affecter le son original qui est écrit sur le disque dur : on parle de Direct-to-Disk et d’édition non
destructive
10
Le disque du RAID en 7 minutes : https://www.youtube.com/watch?v=WqGeTOt6A0Q
3
2
Les plugins sont tous les traitements que l’on va vouloir apporter au son. Il existe une multitude de
plugins : des égaliseurs, des compresseurs, des gates, des reverbs, des vocoders… Ce sont eux qu’on
va insérer sur les pistes pour traiter le son. Ils fonctionnent généralement en temps réel, c’est-à-dire
que les réglages s’entendent directement.
Selon les plateformes et les séquenceurs, ils ne sont pas au même format. On trouve des plugins :
- Direct X (DX) pour Windows seulement

- Audio Unit (AU) pour Logic et Digital Performer
- VST : format inventé par Steinberg compatible avec la plupart des plateformes
Le moteur audio d’un séquenceur ou d’un logiciel d’enregistrement multipiste fonctionne la plupart
du temps à une résolution de 32 Bits ou 64 Bits ce qui diminue la marge d’erreur lors de l’addition
des signaux numériques sur chaque piste. C’est ce qu’on appelle l’headroom (littéralement : la
« marche au-dessus de la tête). Plus il y a d’headroom, plus l’addition se fait proprement, un peu
comme sur une console analogique.
La notion de Bit depth et Sample Rate

(ou comment le signal analogique est transformé en numérique)
La numérisation d’un signal c’est sa transformation en une suite de chiffres lisibles par un ordinateur
ou un appareil de traitement numérique.
On numérise un signal avec ce qu’on appelle un Convertisseur Analogique Numérique (CAN ou ADC
Analog to Digital Converter)
De la même manière, un son numérisé est converti en signal analogique par un Convertisseur
Numérique Analogique (CNA ou DAC Digital to Analog Converter)
Ces deux opérations sont obligatoires quand on travaille sur un système numérique, elles vont
forcément de pair
En effet, il est facile maintenant de numériser un son mais pour l’écouter il faut forcément à un
moment ou à un autre le reconvertir en analogique, on ne peut pas écouter tel quel un signal
numérique, notre oreille, comme le haut-parleur, sont des appareils analogiques.
Voyons comment fonctionne un CAN
L'échantillonnage
Un signal analogique est continu dans le temps. Le rôle d’un CAN est de convertir ce signal en une
suite de nombres binaires
La méthode de l’échantillonnage consiste à mesurer l’amplitude du signal à des intervalles de temps

réguliers
3
3
On voit sur le schéma
que les impulsions
représentent les
amplitudes du signal
à chaque instant t
Les échantillons sont

comme des images
instantanées du
signal audio qui
assemblés dans une
séquence donnent
une représentation
de la forme d’onde
continue de la même manière que la séquence d’images d’un film projeté dans une succession
rapide donne l’illusion d’une image en mouvement continu11
Pour représenter précisément le signal, il est nécessaire de prélever un grand nombre de ces
échantillons à chaque seconde
Comme on peut le voir à la figure suivante, si on prélève trop peu d’échantillons, ils peuvent alors
être interprétés comme la représentation d’un signal complétement différent du signal d’origine
échantillonné
Plus on prélève d’échantillons par seconde, plus on se rapproche de la courbe analogique d’origine
On comprend facilement que si la fréquence est élevée, c’est-à-dire que le son est très aigu, il va
falloir plus d’échantillons pour le restituer correctement  on parle de Fréquence d’échantillonnage,
qui correspond au nombre d’échantillons créés par seconde
Une fréquence d’échantillonnage à 44.1 KHz (fréquence utilisée pour le CD audio) correspond à
44100 échantillons / seconde
Il a fallu trouver une fréquence d’échantillonnage suffisamment haute pour pouvoir restituer toutes
les fréquences audibles
Ce chiffre 44.1 KHz découle en fait d’une théorie mathématique qu’on appelle le théorème de
Schannon Nyquist : la fréquence d’échantillonnage doit être le double de la fréquence maximale que
l’on veut enregistrer
Dans le cas de 44.1 KHz, la moitié est de 22 KHz, soit au-dessus de la limite supérieure des fréquences
que l’oreille humaine peut entendre
C’est cette fréquence qui a été choisie par Sony et Phillips quand ils ont inventé le CD et c’est
toujours le cas aujourd’hui
Un son échantillonné à 22 KHz par exemple ne pourra contenir aucune fréquence supérieure à 11
KHz, s’il est échantillonné à 11 KHz, il n’y aura aucune fréquence enregistrée supérieure à 5500 Hz
etc.
Ce n’est pas inaudible, mais pas suffisant pour de la musique, ça manque de précision dans les aigus
11
Jouez Malin : comment fait-on du cinéma ? : https://www.youtube.com/watch?v=VVDpA2sZxOE
3
4
On trouve aujourd’hui beaucoup d’interfaces audionumériques, des convertisseurs, qui proposent
des fréquences d’échantillonnage bien supérieures : 48 KHz, 88.2 KHz, 96 KHz, 192 KHz
Au-delà de l’argument commercial, ces fréquences très élevées se basent sur le fait que certaines
fréquences aigues ne sont peut-être pas entendues mais perçues par l’oreille
De plus un convertisseur capable d’échantillonner à un taux élevé, numérise forcément le son
beaucoup plus fidèlement, beaucoup plus proche que le signal analogique d’origine
La résolution ou quantification
Pour l’instant notre signal a été transformé en une multitude d’échantillons qui ont tous une valeur.
Chaque échantillon peut pour l’instant avoir une infinité de valeurs > La quantité de données serait
faramineuse
L’étape d’après dans le convertisseur est la quantification : les données vont être transformées en
nombres binaires  On donne à chaque échantillon la valeur numérique binaire la plus proche
Cette valeur est enregistrée dans plusieurs bits.
Contrairement aux nombres décimaux (ou base dix), qui utilisent les dix chiffres 0 à 9, les nombres
binaires (ou base deux) n’utilisent que les deux chiffres 0 et 1. Le terme bit est une abréviation de
binary digit (chiffre binaire)
1 bit représente une donnée binaire de 0 ou 1 soit deux combinaisons
3
5
2 bits permet 4 combinaisons de valeur soit 0 0 soit 0 1 soit 1 0 soit 1 1
Chaque fois qu’on rajoute un bit on multiplie par 2 le nombre de valeurs
Ex : 3 bits > 8 combinaisons pour numériser un signal
3
6
Conclusion : plus il y a de bits, plus la courbe sera lisse proche du signal d’origine, moins il y aura
d’approximations
8 bits > 2 puissance 8 = 256 valeurs possibles
Conclusion :
LA CONVERSION ANALOGIQUE/NUMERIQUE
On utilise pour ce faire, un convertisseur analogique/numérique (CAN).
Deux paramètres vont régir la numérisation du son, au sein de ce convertisseur :
 L’échantillonnage : définition temporelle

 La quantification : définition d’amplitude
Selon la méthode PCM (Pulse Coded Modulation/Modulation d’impulsion codée), qui est le
standard en audionumérique (ainsi qu’en téléphonie), on va relever à intervalles réguliers la
valeur de l’amplitude de la forme d’onde et coder cette valeur en langage binaire.
3
7
En rouge la forme d'onde analogique, en noir sa représentation numérique. On remarque
que l'amplitude ne peut prendre qu'un nombre de valeurs fini. (Dans cet exemple, 16)
La fréquence d’échantillonnage détermine le nombre d’analyses par seconde. Plus elle est
élevée, plus la définition temporelle sera bonne, et plus le résultat sera fidèle à l’onde de
départ.
3
8
Dans le cas d’un son 16 bits 44.1 Khz  44100 fois par seconde un mot de 16 bits est écrit sur le
disque dur
Le nombre de bits, c’est-à-dire la résolution d’un convertisseur, influence aussi une chose très
importante : la dynamique du son numérisé
Plus la résolution est élevée, plus on a de marge entre le son le plus faible et le son le plus fort
Le plus petit niveau de signal qui peut être codé est forcément plus bas avec une résolution de 24
bits que de 8 bits > il y a plus de valeurs possibles
La résolution de 16 bits qui a été choisie pour le CD permet une plage dynamique, c’est-à-dire un
rapport signal sur bruit de 96 dB ; à 24 bits, environ 144 dB soit plus que notre oreille
A l’intérieur des ordinateurs, les traitements audio sont souvent réalisés en 32 bits ou même 64 bits
ce qui représente un très grand nombre de valeurs et limite les erreurs de calculs
A quelle résolution travailler ?

La résolution
Il ne faut pas oublier que le format final de la majorité des projets musicaux est le CD ; il a pour
caractéristiques 16 bits et 44.1 KHz
Cependant, ce n’est pas forcément une bonne idée d’enregistrer à ce format
En effet, l’ordinateur additionne les pistes sous forme de nombres, il additionne l’intégralité de
chaque signal, y compris le bruit de fond
Si le bruit de fond est déjà important sur une seule piste, il sera dix fois plus important sur un mixage
de 10 pistes
C’est pour cela qu’on choisit en général une résolution de 24 bits pour enregistrer en studio : c’est
celle qui offre le plus petit bruit de fond et la plus grande dynamique
En plus, compte tenu de cette grande dynamique, on n’est pas obligés d’avoir un signal au niveau
maximum tout proche du 0 dbFS > on a donc de la marge et de la souplesse lors de l’enregistrement
Au final, une fois le mixage terminé il est facile de redescendre à 16 bits en utilisant un procédé que
l’on appelle le Dithering12
L’échantillonnage
La majorité des studios pro travaillent en 44.1 kHz ou en 48.2 kHz pour une raison simple : pour
s’adapter au format final, le CD, si on a échantillonné à des fréquences supérieures, on peut
12
Voir
http://fr.audiofanzine.com/mastering/editorial/dossiers/le-dithering-fait-du-bruit.html
https://www.youtube.com/watch?v=zWpWIQw7HWU
3
9
redescendre cette fréquence avec un procédé qu’on appelle le resampling. Le problème, c’est qu’on
rajoute encore un traitement sur le signal et surtout que le resampling fonctionne en faisant une
approximation de chaque échantillon, d’autant plus approximatives si on est à des fréquences
d’échantillonnage qui ne sont pas des multiples de 44.1
A 88.2 kHz le calcul est simple : seul un échantillon sur deux est gardé
A 96 kHz, c’est beaucoup plus compliqué
Une autre raison pour garder un taux d’échantillonnage assez peu élevé est la taille des données que
ça engendre
La taille des données

Pour les fichiers numériques, on parle de débit (Ko/s)
Le débit d’un son audionumérique :
Débit (Ko/s) = Quantité de données (Bits ou Octets) x Fréquence d’échantillonnage (Hz)
Par exemple : 44100 fois par secondes, un échantillon de 16 bits (ou Octets) est enregistré. Donc,
pendant 1 secondes, 16 x 44100 soit 705600 Octets sont enregistrés ce qui nous donné donc un débit
de 705 Ko/s
Un CD audio 44.1 kHz 16 bits occupe une taille approximative de 650 Mo pour 74 min d’audio en
stéréo
1 min. ST 16 bits 44.1 kHz = 10 Mo
Si ce son est en mono, il prendra deux fois moins de place
Si par contre on double la fréquence d’échantillonage le même ST d’une minute prendra deux fois
plus de place sur le DD soit 20 Mo
C’est la même chose quand on augmente la résolution
La formule suivante donne la taille du fichier en fonction du débit et du temps :
Taille (Ko) = temps (s) x débit (Kbits/s) / 8
4
0
Plus les fichiers sont gros, plus ils prennent de la place sur le DD et plus ils prennent de ressources : le
processeur a plus d’informations à traiter, le disque plus de données à lire et à écrire  l’augmentation
de la qualité du son numérique implique d’augmenter aussi la puissance de l’ordinateur
Création d’une session d'enregistrement

Configuration de l’interface audionumérique13
- Branchement de l’interface : USB/Firewire/Thunderbolt
- Téléchargement et installation du pilote approprié : toujours veiller à avoie la dernière
version du pilote ! www.asio4all.com disponible gratuitement
- Choix du pilote – Option > Préférences > Audio
- Audio input / output device : choisir la carte son qui sera utilisée
- Configuration des entrées / sorties de la carte son : activer uniquement celles qui seront
utiliséees > demande moins de ressources au processeur (CPU power)
- Choix de la fréquence d’échantillonage
- Réglage du buffer size : pour PC se rendre dans le panneau de configuration Asio
- Connexion des sorties Monitors/casque : Attention ! Régler les volumes au minimum et
éteindre tous les appareils avant d’effectuer les branchements ! Allumer les enceintes en
dernier
Création d’un Set pour enregistrement14

- Fichier – Création d’un nouveau Set Live > Enregistrer sous
- Choisir la Session View / Arrangement View (Tab)
- Configuration des entrées (Audio From) en fonction du type de source enregistrée
(Mono, Stéréo)
- Configuration Monitor
Réunir et sauvegarder un projet live

- Le type de document que vous créez et sur lequel vous travaillez dans Live s’appelle un « Live
set » qui réside dans un dossier Live qui réunit toutes les données concernées
- Pour sauvegarder un nouveau projet : comme pour la plupart des logiciels, Fichier > Sauver Set
Live sous…  Set Live .als SANS FICHIERS AUDIO
13
Voir : Ableton Live 9 Tutorial - Part 1: Audio Interface Setup
https://www.youtube.com/watch?v=QtE5hjF8Hb8
14
Voir : Ableton Live 9 Tutorial - Part 3: Recording Audio https://www.youtube.com/watch?v=7PbmTaJopec
4
1
- Pour sauvegarder le projet entier (pour partager le projet ou le déplacer…) : Fichier > Réunir et
Sauvegarder
 On retrouve alors un dossier « SAMPLES » dans le Dossier du projet qui devient alors MOBILE ET
AUTONOME
Conseil : Sauvegarder plusieurs copies du projet en fonction de l’état d’avancement.
Présentation du mixeur
- Le mixeur permet de visualiser le flux, le niveau, la force du signal sortant, de chaque piste
- Paramètres : Volume, Panoramique, Bouton « Mute », Bouton « Solo », Bouton « Armement »

- Le mixeur route le signal venant des pistes vers la piste MASTER qui représente la somme des
signaux de toutes les pistes (Très important pour ne pas écrêter)
- Le mixeur est partagé entre le mode Session (plus approprié pour un travail précis et en temps
réel) et le mode Arrangement (différence notable dans la représentation visuelle, moins
complète, mais permet les mêmes opérations)
4
2
Enregistrer dans le mode session
Routage : petit bouton à droite I-O
Spécifier les entrées et les sorties
 Monitor in : on entend le signal

 Monitor Off : on n’entend plus le signal
 Monitor Auto : armement de la piste > on entend le signal entrant > les boutons STOP
deviennent des boutons RECORD
Si on lance l’enregistrement, on entend le signal
A l’arrêt de l’enregistrement le clip qui vient d’être enregistré est bouclé (à la différence de Monitor
in)
Enregistrer dans le mode Arrangement

Vérifier d’abord les routages
Appuyer sur l’icône d’enregistrement (bouton Record)
4
3
On peut faire un décompte
Pour faire revenir le curseur vers le début du morceau en mode Arrangement on double click sur le
bouton STOP
Si j’enregistre mon Set Live, les enregistrements que j’ai effectués sont collectés dans le dossier de
Projet Live (dossier Recorded)
4
4
Explication de l'échelle de visualisation de votre signal audio (dB Full scale)
Lorsqu’on numérise un signal, il est codé
sous forme de chiffres avec un nombre
donné de valeurs.
Même avec des résolutions hautes, ce

nombre de valeurs a une limite : il a été
appelé le 0 dbFS qui signifie Full Scale
(pleine échelle).
C’est la valeur maximale, le niveau

maximal qu’un CAN peut accepter.
Au-delà de cette valeur, il n’y aura plus

de son, mais un bruit numérique, une
énorme saturation appelée Clip sur les
voyants des consoles numériques et des
interfaces audionumériques. Il faut
toujours être en dessous de cette valeur.
Mais il ne faut pas non plus avoir un signal trop faible qui serait proche du bruit de fond surtout à 16
bits
En général, on règle les niveaux de telles sortes que les peaks soient compris entre -12 et -20dB
Il n’y a pas de règle absolue, il faut donc effectuer des recherches en tenant compte du DAW utilisé
et de toute la configuration de la chaîne du son pour obtenir un signal aussi sain que possible et un
S/N satisfaisant.
Le rapport Signal/Bruit (S/N)

Toute machine, électrique15, électronique et même informatique, génère un bruit de fond lié à son
fonctionnement
La mesure du bruit de fond, tout comme celle du rapport signal sur bruit, sera souvent bien plus
parlante que la courbe de réponse
Le bruit de fond est mesuré en décibel
Le souffle qu’on connaît bien, est l’un des composants du bruit de fond
Avec les équipements numériques, c’est précisément à ce niveau, en choisissant des convertisseurs
plus ou moins bons marché, qu’un fabricant pourra réaliser des prix d’appel attractifs (tout porte à
croire qu’un lecteur CD à 50€ sera moins performant qu’un autre à 400€)  Ce ne sera pas tant au
niveau de la courbe de réponse qu’au niveau du niveau de bruit qu’il faudra chercher les différences
Plus le niveau du bruit de fond est faible, meilleure est la qualité de l’appareil, et il doit se trouver à
un niveau très inférieur à celui du signal utile
15
L’électricité est un phénomène physique qui permet de transmettre de l’énergie d’un générateur à un
récepteur, pour produire un mouvement (moteur), de la chaleur, de la lumière… Le générateur transforme une
forme d’énergie quelconque (solaire, chimique, thermique…) en énergie électrique. L’électronique est la
science du traitement des signaux électriques. Elle utilise des composants particuliers (LED, processeur,
transistor…) fonctionnant généralement avec un courant électrique de faible intensité.
4
5
L’un des grands avantages du traitement numérique du signal audio, est de permettre de dissocier le
bruit de fond inhérent à la bande magnétique par exemple, du signal analogique qui une fois codé
s’exprime en données chiffrées complètement insensibles au bruit de fond
Le rapport signal sur bruit (SNR : Signal to Noise Ratio) est le rapport entre le niveau nominal et le
niveau du bruit de fond  Plus ce rapport sera élevé, meilleure sera la qualité de l’appareil, plus la
dynamique de l’appareil est élevée
Si un appareil a un niveau nominal de +10dB et un niveau de bruit mesuré à -60dB on disposera alors
d’un rapport signal sur bruit de 70dB
Si on tient compte de la réserve dynamique prévue par le constructeur entre le niveau nominal et le
niveau maximal, on pourra atteindre environ 80dB (enregistrement à bande magnétique), le niveau
juste avant la distorsion du signal
80dB de rapport signal sur bruit, c’est-à-dire de dynamique, c’est un rapport un peu faible qui
correspond plus à des enregistreurs à bande qu’à des appareils actuels
Juste pour rappel : notre oreille a une dynamique d’environ 130dB
En numérique, le rapport S/N est dépendant du nombre de bits. Plus le nombre de bits est élevé,
plus le rapport S/N est bon.
Ce qu’on cherche à faire pendant la prise de son, c’est d’avoir le meilleur rapport S/N possible, aussi
bien en analogique qu’en numérique
4
6
Notion de Headroom pour votre prise
Donnons-nous quelques définitions simples de notions de base :
 La dynamique1 d’un son = la différence entre l’intensité sonore maximum – son intensité
minimum = dB max – dB min
 Le rapport signal-bruit2 = la différence entre le niveau de référence3 d’un dispositif4
– son niveau de bruit de fond5
Les deux termes sont souvent confondus. La dynamique est le plus simple à comprendre, exemple
: quelle est la dynamique de l’oreille ? = Seuil de destruction – seuil d’audibilité = 130 dB (environ).
Rappelons rapidement que les valeurs exprimées en décibels (dB) ne traduisent que des rapports
(ratio) de valeurs et non des niveaux absolus. Une référence doit être précisée afin d’extraire des
valeurs absolues. Par exemple, dans le cas de l’audition humaine nous parlerons en dB SPL6, unité
qui implique la référence suivante : le seuil d’audibilité = 20 µPa.7 Ainsi, dire que l’oreille humaine
est capable de 140 dB de dynamique c’est dire qu’elle est capable d’accepter des sons 140 dB8 plus
forts que la référence 20 µPa. Une abréviation en dB sans référence suggérée par un symbole accolé
à l’unité ne veut rien dire dans l’absolu. Quelques exemples de références :
Abréviations Références
dBV 1 Volt
dBu 0,775 Volt
dBm 1 milliwatt
dBA dB SPL, courbe de pondération A
dBFS Full Scale PCM
Ainsi, par exemple, dBu (decibels unterminated) signifie décibels comparés à une tension de
référence de valeur 0,775 volts ; dBFS signifie décibels comparés à la pleine étendue (full
scale) PCM (Pulse code Modulation9).
1
Dynamic range
4
7
Résumons nos précédentes définitions par deux schémas :
On voit bien que la « dynamique » d’un support, ou d’un quelconque autre dispositif, est supérieure
au rapport signal-bruit car ce- dernier prend en compte dans sa définition un niveau dit « de
référence » et non le niveau maximum pouvant être atteint par le dispositif10(niveau max). La
différence entre ce niveau max et ce niveau de référence est ce que l’on va pouvoir nommer «
marge de sécurité », ou headroom.
2
Ou rapport signal/bruit = signal to noise ratio (SNR)
3
Pris ici, niveau de référence = niveau nominal = nominal level
4
Sous-entendu un dispositif électronique quelconque : un support d’enregistrement (magnétophone à bande,
enregistreur numérique), une console, un microphone, etc.
5
Bruit de fond = noise floor
6
SPL = Sound Pressure Level. La distance logarithmique est identique entre 1 et 10, 10 et 100, 100 et 1000, etc. et
chaque fois égale à log 10 = 1. Par convention, ce gain de 1 est considéré comme l’unité et est appelé le Bel.
7
20 « micro pascal », ou 10-12 Watts.m-2. Le décibel est un moyen pratique d’exprimer le rapport de deux
amplitudes sonores. Cela donne des valeurs de taille raisonnable qui permettent de mieux saisir l’impression
subjective de variation de l’amplitude d’un son et aussi de compresser l’échelle des niveaux sonores rencontrés
dans la vie courante. Par exemple, on a le choix de dire : l’échelle des intensités sonores perçues par l’oreille
humaine s’étend (environ) de 0,000000000001 Watts.m-2 à 100 Watts.m-2, ou de dire que cette échelle s’étend
de 0 dB SPL à 130 dB SPL. On voit bien que cette deuxième échelle est bien plus facilement manipulable que la
première ! Et ça a été tout l’intérêt de l’invention des logarithmes au XVIème siècle de faciliter les calculs
numériques. Par ailleurs, notez que nous n’utiliserons jamais le terme « volume » pour parler de l’intensité sonore,
ou du niveau sonore. En acoustique, le terme « volume » est utilisé pour caractériser les dimensions d’une
pièce (en m3). Souvent utilisé à l’oral nous le bannirons ici pour parler de l’intensité sonore en toute rigueur.
8
140 dB = 1014
9
Modulation d’impulsion codée = méthode standard non compressée du codage numérique du signal
audio analogique. Sur certaines spécifications techniques de matériel, les constructeurs peuvent ne faire
aucune différence entre ces deux notions.
4
8
Si l’on prend le cas concret d’un magnétophone à bande, le niveau de bruit = le niveau de bruit
de fond électronique, et le niveau max = le niveau maximum enregistrable avant distorsion du
signal utile. Le niveau de référence serait celui autour duquel il faudrait tâcher de travailler = le
point milieu autour duquel on ferait moduler l’intensité du signal audio à enregistrer.
Alors que nous parlions en dB SPL dans le cas de l’audition humaine, nous serons souvent amenés
dans le cas des appareils électroniques à parler en dBu. Dans l’exemple précédent (cf. supra), le
niveau de référence autour duquel on serait amené à faire moduler notre signal audio à enregistrer
serait donc de 0 dBu = 0,775 Volt11. Certains
appareils seront donc capables de recevoir
un signal d’une plus ou moins grande
étendue dynamique en fonction de leurs
caractéristiques techniques, et de garder
leur qualité technique tout le long de cette
plage12.
Prenons l’exemple à gauche

représentant la capacité dynamique
acceptable d’un dispositif électronique
quelconque. Son étendue dynamique est
de 84 dB, et se décompose de la façon
suivante : un rapport signal/bruit de 64 dB
(60dB en dessous de 0dB + sa référence
nominale située à 4 dB dessus du 0 dB = 64
dB) + 20 dB de headroom (marge qui prend
ici pour base la référence nominale à +4
dBu).
4
9
→ 64 dB + 20 dB = 84 dB de dynamique totale acceptable pour le dispositif, avec comme niveau de
référence de l’échelle le niveau nominal situé à +4 dBu, selon la partition vue précédemment (64 dB
en-dessous + 20 dB au-dessus). Au-delà de cette limite le signal utile va se trouver beaucoup trop
distordu, et en-deçà il va être noyé dans le bruit de fond de l’électronique de l’appareil. On comprend
bien tout l’intérêt qu’il y a à maintenir le signal audio à l’intérieur de ces limites tout en ayant pour
point de référence le +4 dBu de l’appareil. En effet, c’est autour de ce-dernier que se situe la plage
optimale d’utilisation du dispositif et que celui-ci présente ses meilleures caractéristiques techniques.
Les règles de l’art consistent à faire fonctionner chaque dispositif de notre chaîne audio (du
microphone à l’enceinte de restitution) dans sa plage optimale de fonctionnement. Pour cela, on doit
faire preuve d’une compréhension et d’une utilisation attentionnée des indicateurs de niveaux des
différents appareils présents dans la chaîne = une bonne compréhension de la métrologie.
Nous ne rentrerons pas ici dans les détails techniques de ce sujet. Juste quelques indications :
En ce qui concerne, du moins, les appareils analogiques : s’ils disposent d’un Vu-mètre, le O VU = le
niveau nominal. VU correspond à Volume Unit, unité de volume. Un vu-mètre (vu meter) est un
appareil de mesure du signal audio dont la réaction tend à correspondre à celle de l’audition humaine,
d’où son utilité. Celui-ci aura tendance à réagir au niveau moyen du signal audio du fait de son temps
d’intégration qui laissera passer l’analyse les rapides transitoires audio.
Un crête-mètre (ou PPM, Peak Program Meter) lui sera sensible à ces-dernières et donnera ainsi des
indications autrement plus fiables concernant la réalité électrique du signal traversant un dispositif,
mais sera moins exploitable du point de vue psycho-acoustique. Il existe une multiplicité de normes
de mesures et de graduations différentes.
Chaque appareil, que ce soit un support d’enregistrement, un transmetteur, un transducteur, etc.

possède des caractéristiques techniques différentes que l’on va devoir adapter à l’intérieure de notre
chaîne audiofréquence.
11
Le niveau de référence des appareils audio professionnels se situe en fait à +4 dBu = 1,23 Volts.
12
C’est là toute la différence entre du matériel bas de gamme et haut de gamme…
5
0
Le monitoring16
16
Voir :
MACKIE : Les enceintes de monitoring (vidéo de la boite

noire) https://www.youtube.com/watch?v=xNE406PSbCY
7 Mistakes To Avoid When Setting Up Studio Monitors https://ask.audio/articles/7-mistakes-to-avoid-when-

setting-up-studio-monitors
Speaker and Studio Monitor Placement Secrets http://arqen.com/acoustics-101/room-setup-speaker-

placement/
Monitor setup guide – Genelec

http://www.genelec.com/sites/default/files/media/Studio%20monitors/Catalogues/genelec_monitor_setup_g
uide_2015.pdf
5
1
L'écoute au casque fermé vs casque ouvert17
Ouvert :
- Son souvent plus naturel, plus ouvert, plus précis
- L'image stéréo plus large
- Profondeur plus importante
- Mixage et Mastering : sensations semblables à des enceintes de monitoring
Fermé :
- Isolation acoustique
- Pas de repisse
17
Voir l’article « Quelle différence entre casque fermé et casque ouvert »
http://www.laboitenoiredumusicien.com/le-mag/quelle-difference-entre-casque-ferme-et-casque-ouvert-
n4321/
Voir : https://www.youtube.com/watch?v=oqsyaHlZ6ro
5
2
5
3

Prise de Son en Studio

Hochgeladen von

Dokumentinformationen

Copyright

Verfügbare Formate

Dieses Dokument teilen

Dokument teilen oder einbetten

Freigabeoptionen

Stufen Sie dieses Dokument als nützlich ein?

Sind diese Inhalte unangemessen?

Copyright:

Verfügbare Formate

Prise de Son en Studio

Hochgeladen von

Copyright:

Verfügbare Formate

Prise de Son en Studio

I. Comprendre le son avant de l’enregistrer

Chaine du signal pour une prise de son

II. La prise de son stéréophonique

III. La prise de son en monophonie dirigée (pseudo-stéréophonie)

Le troisième maillon c’est la console (table de mixage), ou le préamplificateur ou l’interface

Ce principe de chaîne du son peut s’appliquer à toutes les configurations d’amplification et

Différentes parties de la chaîne sont souvent intégrées dans un même appareil

Les enceintes amplifiées intègrent un ampli et un haut-parleur

C’est souvent une seule fréquence qui

En studio, la meilleure manière

On trouve trois niveaux :

Un signal micro est en généralement transmis sur un câble XLR en symétrique

Les signaux symétriques et asymétriques

Dans le milieu pro il a fallu trouver une solution

Comme on l’a vu précédemment, si on additionne deux signaux en opposition de phase on obtient

Les différentes connectiques

On définit un micro par :

1. Son type : la technologie utilisée pour la transformation de l’énergie acoustique en énergie

Microphone électrodynamique à bobine mobile (appelé micro dynamique)

Il utilise une bobine de cuivre et un aimant

La bobine, fixée à la membrane, est placée dans le champ magnétique de l’aimant

Chaque mouvement mécanique de la membrane est traduit en tension électrique

Ce microphone a l’avantage d’être robuste et de supporter de très hauts niveaux de pressions

Les micro adaptés à la voix ont :

Ou micro statique ; condenser microphone en anglais

Il utilise un système électro statique pour transformer l’énergie mécanique de la membrane en

Sa réponse aux transitoires2 est excellente.

Leur membrane électrostatique attire la poussière et craint l’humidité.

Ce sont des micros très polyvalents.

Il fait partie de la famille des micros électrostatiques à condensateur

Avec le temps, sa charge s’atténue, ce qui limite sa durée de vie

Il est relativement bon marché, et de qualité s’approchant des micros électrostatiques

On l’utilise pour la prise de son de certaines voix ou instruments acoustiques

On l’utilise rarement en sonorisation mais surtout en enregistrement

Par contre, il ne captera pas les sons provenant des côtés.

On utilise ce type de microphone lorsqu’on a besoin de davantage de sélectivité vers l’avant.

Sa fonction principale est de symétriser le signal

- Une prise jack asymétrique pour l’entrée de l’instrument, (input)

Elle a différentes fonctions que nous allons voir en détail.

- Des voies d’entrée : micro, ligne (line), CD, effet

Le plus souvent, tout cela est regroupé sur l’arrière de la console5

Les carte sons et interfaces audionumériques (formats, connectiques et synchro)

RME HDSPe RayDAT

Ce préampli a un réglage pour le Gain et un indicateur de niveau, au moins de Clip

Les formats numériques

 Le S/PDIF (Sony/Philips Digital InterFace) : format de transfert audionumérique stéréo allant

Via coaxial cables with an RCA connector

Via optical TOSLINK

C’est le pilote, ou le logiciel de l’interface, qui permet de configurer la résolution de l’AES/EBU, du

 S/PDIF (stereo digital)

Les connectiques WC sont en BNC (Bayonet Neill–Concelman connector)

Ce sont les câbles BNC 75 Ohms que l’on utilisera

Chaque CAN et CNA a besoin d’une horloge pour fonctionner

Il existe d’autres formats d’horloge comme le MTC ou le MCPTE

Ce temps de latence est directement lié à plusieurs facteurs :

- La qualité de l’interface audionumérique

Important : Une latence de 4 à 7ms permet de travailler dans de bonnes conditions

Le buffer size (mémoire tampon)

Plus le buffer est petit, plus la latence est faible.

Il peut même servir d’orchestre virtuel avec des instruments MIDI

Surtout, il sert à faire le montage et le mixage.

C’est une console virtuelle et un enregistreur numérique en même temps.

- Direct X (DX) pour Windows seulement