Beruflich Dokumente
Kultur Dokumente
Avant-propos
VI
Avant-propos
simples traits en profondeur, partir desquels nous donnons des lments de gnralisation.
Cest la seconde anne que ce cours a lieu, et cest donc galement la seconde version seulement
de ce cours crit ! Nous prions davance le lecteur de nous pardonner les erreurs qui ne doivent pas
manquer, et le remercions de nous faire part de toutes les remarques quil voudra bien nous faire
pour amliorer cet ouvrage.
Prliminaires . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1.1 Les constituants de la matire et leurs interactions . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1.2 Interactions des particules . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1.2.1 Origines, ordres de grandeur . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1.2.2 Modles simples . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1.2.3 Consquences macroscopiques de la forme des interactions . . . . . . . . . . . . . . .
1.3 Physique statistique et simulation molculaire . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3
4
4
5
6
8
9
13
13
15
15
16
18
19
22
23
24
25
26
26
27
28
32
33
34
34
35
37
38
38
39
40
40
41
42
VIII
43
43
44
45
48
55
56
59
Lensemble canonique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
4.1 Distribution de Botzmann-Gibbs . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
4.1.1 Couplage avec un thermostat . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
4.1.2 Distribution de Boltzmann-Gibbs et information manquante . . . . . . . . . . . . .
4.2 nergie libre et grandeurs thermodynamiques . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
4.2.1 Dfinition . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
4.2.2 Drives de lnergie libre . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
4.2.3 Minimisation de lnergie libre . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
4.2.4 Calculs avec la fonction de partition . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
4.3 Cas de degrs de libert indpendants . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
4.3.1 Sous-systmes indpendants . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
4.3.2 Indpendance des positions et des quantits de mouvement pour une
collection de particules . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
4.3.3 Gaz parfait, grandeurs idales et dexcs dans les fluides . . . . . . . . . . . . . . . . .
4.3.4 Cas des oscillateurs harmoniques indpendants . . . . . . . . . . . . . . . . . . . . . . . . .
4.4 Quelques remarques sur les applications du formalisme canonique . . . . . . . . . . . . . . .
4.4.1 Gaz, solides et liquides . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
4.4.2 Approche de lquilibre et thermalisation . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
61
61
61
62
64
64
64
65
65
67
67
67
68
68
70
70
70
72
75
76
76
79
81
82
82
85
88
89
91
93
96
97
98
98
99
101
101
103
105
105
IX
115
115
115
116
117
117
117
117
131
131
131
132
133
134
135
137
137
137
138
138
139
139
139
140
140
142
145
146
146
148
149
118
119
119
119
121
122
122
124
125
127
129
151
152
152
153
155
155
157
157
159
159
160
162
164
164
164
164
165
167
168
169
170
11 Le formalisme de Dirac . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
11.1 Formalisme vectoriel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
11.1.1 Grandeurs physiques et observables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
11.1.2 Notations vectorielles : bra-ket . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
11.1.3 Gnralit du formalisme vectoriel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
11.2 Construction des observables : principe de correspondance . . . . . . . . . . . . . . . . . . . . .
11.3 Equation de Schrdinger . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
11.4 La mesure . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
11.4.1 Observable spectre discret . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
11.4.2 Observable gnrale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
11.5 Commutation des observables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
11.5.1 Crochets de commutation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
11.5.2 Evolution dune observable . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
11.5.3 Relations dincertitude de Heisenberg . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
11.5.4 Commutation et stabilit de latome dhydrogne . . . . . . . . . . . . . . . . . . . . . . .
Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
173
173
173
174
175
175
176
176
177
178
179
179
180
181
183
185
187
187
187
189
190
190
192
193
193
194
194
195
199
203
XI
12.6.1 Dfinition . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
12.6.2 Espace de spin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
12.6.3 Manifestations physiques du spin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
12.6.4 Un exemple despace de spin : lespace du spin 12 . . . . . . . . . . . . . . . . . . . . . .
Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
203
203
204
205
207
209
209
209
210
210
211
211
212
213
215
217
217
218
218
220
221
222
249
249
250
250
XII
253
253
254
255
258
258
Partie I
1
Prliminaires
4
4
5
6
8
9
Bien des systmes physiques rencontrs dans la nature sont constitus dun ensemble de particules ou dobjets solides : ainsi les grains de sable, ou les astrodes qui forment les anneaux de
Saturne. Parmi ceux-ci, il est important de bien diffrencier les systmes qui se prtent naturellement un traitement par la physique statistique de ceux qui nen relvent pas. La mcanique
statistique sapplique aux collections dobjets en interaction qui peuvent tre dcrits dans un formalisme hamiltonien. Comme on le verra, ceci demande en particulier que les interactions entre
particules drivent dun potentiel, et que la dynamique du systme conserve lnergie mcanique
totale.
De la conservation de lnergie mcanique dcoule lexistence du phnomne dagitation thermique : dans un chantillon de matire, atomes et molcules ne cessent de se mouvoir, des vitesses
qui semblent leves notre chelle (de lordre de 100 m/s). Ceci contraste bien sr avec lintuition
ordinaire de la matire au repos, et avec lexprience de la dissipation de lnergie mcanique.
une chelle plus grande, les systmes collodaux, composs de particules dont la taille est comprise
entre le nanomtre et le micron (typiquement de petits objets solides immergs dans un fluide),
peuvent parfois tre dcrits par la physique statistique. On peut en effet parvenir dcrire leurs
interactions la manire des forces interatomiques ou intermolculaires, laide dun potentiel, et
il subsiste de plus une forme dagitation thermique, le mouvement brownien.
Macroscopiquement, les collections de particules auxquelles sappliquent la mcanique statistique obissent aux lois de la thermodynamique. Le premier principe de la thermodynamique, qui
affirme la conservation de lnergie, dont les changes prennent la forme soit de travail, soit de
chaleur, est la consquence macroscopique de la conservation de lnergie mcanique au niveau
microscopique. La chaleur est de lnergie distribue dans les degrs de libert microscopiques, de
telle sorte quelle ne se voie pas macroscopiquement.
Adoptant un point de vue statistique, on considrera qu grande chelle le systme est dcrit
par son macrotat, qui est une loi de probabilit sur les microtats, cest--dire sur les valeurs
prises par lensemble des degrs de libert microscopiques du systme, ce qui constitue une simplification considrable par rapport la description de tous les degrs de liberts microscopiques. De
surcrot, les postulats de base de la physique statistique permettront de dterminer le macrotat
correspondant lquilibre thermodynamique, et donc les proprits macroscopiques du systme
en fonction dun petit nombre de grandeurs fondamentales (comme la densit ou la temprature).
1 Prliminaires
Ceci nest pas possible pour tous les ensembles de particules : ainsi, ltat de N grains de sable
(systme pour lequel il ny a pas conservation de lnergie mcanique et agitation thermique),
peut tre caractris mcaniquement, et son tat final (densit, force intergranulaires, etc) peut
tre prdit mais cet tat dpend de tout le dtail du processus par lequel les grains de sable ont
t rassembls et dposs dans la bote !
C
.
r6
(1.1)
1 Prliminaires
La constante C vaut par exemple environ 1077 J.m6 pour la molcule de mthane CH4
et moiti moins pour latome dargon Ar.
Nous avons voqu les interactions attractives entre molcules (neutres) identiques. Lorsque
deux atomes sapprochent jusqu interpntrer leurs nuages lectroniques, une rpulsion trs forte
se manifeste (dorigine quantique, lie au principe de Pauli, voir le chapitre 13). La description
de cette force, dans les modles simples, est faite en fixant un rayon effectif des atomes et des
molcules (on peut donner plusieurs dfinitions dun rayon, voir [22]) de lordre de 1 2 , puis en
proposant des potentiels dinteraction rpulsifs faisant intervenir ce rayon. On ajuste finalement
empiriquement la forme du potentiel en fonction des proprits thermodynamiques mesures.
Nous verrons dans la suite du cours que lnergie des interactions doit tre compare lnergie
thermique kB T (kB ' 1, 38 1023 J/K tant la constante de Boltzmann 3 ), qui vaut environ
4 1021 J = 2, 5 102 eV la temprature de 300 K. Dune faon trs sommaire, on peut dire
que si kB T reste infrieure lnergie dinteraction qui tend confiner les positions des particules
au voisinage dun minimum du potentiel, alors elles resteront piges, tandis quelles pourront
adopter des configurations varies et conserveront une forte mobilit dans le cas contraire.
1.2.2 Modles simples
Le modles des sphres dures
Le modle le plus simple de molcules, dj considr par Boltzmann, est celui de billes solides
impntrables, qui interagissent par des chocs lastiques. On le connat comme le modle des
sphres dures . Il se caractrise par un seul paramtre, le diamtre des particules. Important
historiquement dans lhistoire de la simulation molculaire (voir 1.3), ce modle est une caricature
des interactions fortement rpulsives entre atomes proches. Sa mise en uvre dans une simulation
numrique du mouvement dun ensemble de particules est assez diffrente du cas gnral dune loi
de force rgulire : au lieu de rsoudre une quation diffrentielle, il faut dterminer la squence des
chocs entre lesquels les particules se dplacent vitesse constante sur des trajectoires rectilignes.
En raison de cette particularit on nen fera pas un objet central dtudes dans la partie thorique
de ce cours (mais diffrentes illustrations feront appel aux proprits de ce modle). En dpit de
la diffrence au niveau de la technique de simulation, les proprits physiques des fluides simuls
avec cette interaction ou des interactions plus rgulires restent toutefois assez proches. Ce modle
demeure utile pour la simulation des fluides, car
ses proprits sont trs bien connues et rpertories, et fournissent une base de dpart pour
aborder celles des systmes avec interactions plus ralistes dans une dmarche perturbative ;
il dcrit assez exactement les interactions effectives entre certains types de particules collodales ;
son tude est instructive en raison mme de son apparente singularit : lnergie interne
du fluide de sphres dures se rduit lnergie cintique, comme celle dun gaz parfait.
Limportance des interactions se manifeste au travers deffets configurationnels et entropiques
(raret des configurations possibles densit leve en raison de la gne strique).
Formellement, les sphres dures peuvent tre considres comme interagissant par le potentiel de
paires donn par :
0
si r ,
VSD (r) =
(1.2)
+ si r < .
Modles interactions continues
Pour dcrire la rpulsion courte distance, on peut aussi adopter le modle dit de sphres
molles avec potentiel en puissance inverse de la distance :
3. Le Kelvin (K) est lunit dnergie que lon utilise le plus souvent pour exprimer la temprature.
La constante de Boltzmann nest pas une constante physique fondamentale mais un simple facteur de
conversion, et apparat chaque fois que cette unit est utilise la place du Joule (J).
VSM (r) =
n
r
(1.3)
qui fait apparatre, en plus du diamtre molculaire , une nergie caractristique > 0 et
lexposant n qui dtermine la raideur du potentiel. On peut sattendre retrouver les proprits
des sphres dures dans la limite n +, puisque daprs (1.2) et (1.3) on a VSM (r; , n) VSD (r)
pour tout et r 6= .
Ces potentiels purement rpulsifs sont incapables de rendre compte de la tendance la condensation des molcules basse temprature, qui se manifeste par exemple lorsquun gaz est refroidi
dans une enceinte volume constant : on voit apparatre, en refroidissant, une phase liquide, puis
solide (qui coexistent avec la vapeur). De plus on sait que les molcules neutres sattirent grande
distance, en particulier en raison de lomniprsente force de van der Waals (1.1). Le potentiel de
Lennard-Jones combine la rpulsion exprime par (1.3), pour n = 12, avec une telle attraction, et
scrit :
12 6
VLJ (r) = 4
.
(1.4)
r
r
La figure 1.1 reprsente les potentiels donns par (1.3) et (1.4). Le potentiel de Lennard-Jones dcrit
bien les interactions entre les atomes de gaz rares, tels que largon, pour lequel les paramtres sont
/kB = 120 K, et = 3, 405 .
Fig. 1.1. gauche : potentiels de sphres molles (1.3), avec la limite des sphres dures (1.2) pour
n +. droite : potentiel de Lennard-Jones (1.4).
Plus gnralement, le potentiel de Lennard-Jones donne la forme gnrale qualitative des interactions entre molcules (non ionises) pour lesquelles la forme du nuage lectronique nest pas
trop anisotrope, avec sa rpulsion courte distance et lattraction plus longue porte.
De nombreux raffinements
Pour modliser plus prcisment les interactions des molcules, on a trs souvent recours
un modle qui somme les interactions des atomes. Les atomes formant une mme molcule sont
considrs comme rigidement lis, ou bien (notamment pour les molcules longues) on admet
des degrs de libert internes (angle de torsion, angle didre). Un cas simple dinteraction entre
deux molcules diatomiques est illustr par la figure 1.2. Dans cet exemple, chaque molcule est un
assemblage rigide, le potentiel intermolculaire est la somme dun terme lectrostatique, qui rsulte
par exemple de linteraction de diples permanents, et des interactions entre paires datomes, soit
1 Prliminaires
B
B
Fig. 1.2. Linteraction entre deux molcules diatomiques AB et AB peut tre modlise en sommant
les potentiels dinteractions des paires datomes nappartenant pas la mme molcule, donnant lieu
aux forces portes par les lignes droites en pointills. Chaque molcule peut galement porter un diple
permanent, ici schmatis par une flche.
ici VAA0 +VAB 0 +VBA0 +VBB 0 . Les potentiels interatomiques dans un tel modle peuvent tre choisis
sous une forme de Lennard-Jones. Bien souvent, le choix des paramtres dun modle de potentiel
intermolculaire se fait en partie par ajustement aux donnes exprimentales (ou numriques de
rfrence) disponibles. Cette tape semi-empirique est rendue ncessaire par le souci de conserver
des interactions faciles traiter, et en particulier additives par paires.
Certains atomes, molcules ou ions, se prtent mal ce type dapproche : ce sont en particulier
ceux qui tendent former des solides covalents, par exemple les atomes de silicium ou de carbone.
Les orbitales lectroniques ont alors des formes trs particulires, une description des atomes par
des particules ponctuelles est trs mal adapte, et les interactions sont plus complexes que la
simple force de van der Waals (1.1). De tels systmes se traitent en incluant explicitement des
effets denvironnement dans les potentiels interatomiques, empiriquement ou par un calcul de
structure lectronique pour obtenir la densit lectronique locale (mthodes ab-initio).
Au niveau de ce cours introductif, on se restreindra au cas simples de particules ponctuelles
avec potentiels additifs par paires, fonctions de la seule distance entre voisins et courte porte
(cest--dire que lon pourra ignorer toutes les interactions des paires de particules plus loignes
lune de lautre quune certaine distance de coupure).
1.2.3 Consquences macroscopiques de la forme des interactions
La consquence la plus remarquable, au niveau macroscopique, de linteraction de particules
modlises comme ponctuelles avec un potentiel de sphre de type (1.4) est sans doute lexistence
de transitions de phase. Le diagramme de phases est la reprsentation, dans lespace dont les
coordonnes sont la densit et la temprature 4 , des frontires de stabilit des phases gaz, liquide
et solide (cristallin) pour les petites molcules et en particulier pour les atomes des gaz rares
interagissant par un potentiel de Lennard-Jones. La figure 1.3 reprsente lallure typique de ce
diagramme pour ces potentiels.
Il est possible de retrouver des aspects qualitatifs du diagramme de phases, et des ordres de
grandeurs de certaines proprits thermodynamiques macroscopiques partir des paramtres du
potentiel dinteraction. Par exemple, en admettant que dans les phases liquide et solide du systme
de Lennard-Jones, chaque particule interagisse essentiellement avec 12 voisines situes la distance
minimisant VLJ (r), on peut grossirement estimer lnergie potentielle par particule ep = 6
(6 tant le nombre dinteractions de paires par particule, chacune ntant compte quune seule
fois). On peut donc estimer la chaleur latente dvaporation ou de sublimation ep . Quant la
temprature dvaporation, elle est de lordre de ep /kB .
4. On reverra au chapitre 3 pourquoi ce sont les deux seuls variables dterminant ltat dquilibre
dun systme fluide. Les solides admettent aussi le tenseur des dformations comme variable caractrisant
localement leur tat.
T
F
C
G
G+L
L+S
G+S
(a) En coordonnes , T .
P
(b) En coordonnes P , T .
Fig. 1.3. Schma du diagramme de phase dun systme de Lennard-Jones : (a) dans le plan , T (noter
les rgions de coexistence, deux phases en quilibre la mme temprature nayant pas la mme densit) ;
(b) dans le plan P , T . Au point triple T les trois phases sont en quilibre. Au point critique C la diffrence
entre liquide (L) et gaz (G) disparat, et pour les tempratures suprieures la temprature critique TC ,
ou les pressions suprieures la pression critique PC on na plus quune seule phase fluide F.
De telles estimations ne peuvent pas, cependant, expliquer les transitions de phase. Mme si
de simples considrations nergtiques rendent plausibles le passage du solide cristallin basse
temprature au gaz temprature leve, elles ne peuvent exclure un passage progressif plutt
quune transition soudaine une temprature de changement de phase, et restent de plus inaptes
rendre compte de lexistence de la phase liquide. Le passage du microscopique au macroscopique
rvle aussi des surprises, des phnomnes collectifs impossibles dduire dune approche nave
qui ne prend pas en compte la statistique des grands systmes.
10
1 Prliminaires
justifier larrangement cristallin par la minimisation dune nergie potentielle (comme ce serait le
cas avec un potentiel dinteraction continu comme le potentiel de Lennard-Jones), celle-ci tant
toujours nulle pour le fluide de sphres dures. Cest en fait lentropie qui est responsable de la cristallisation dans ce cas. Cette grandeur est directement lie au nombre de configurations possibles
pour rpartir N sphres dans un volume donn, sans recouvrement. La cristallisation des sphres
dures manifeste donc quau-del dune certaine densit limmense majorit des configurations possibles est constitue darrangements rguliers cristallins (de type cubique faces centres). La
figure 1.4 donne le diagramme de phases des sphres dures, qui ne dpend que de leur densit.
Dune faon gnrale, ce sont souvent les effets entropiques, lies la statistique dans les grands
systmes, qui rservent des surprises.
Fig. 1.4. Diagramme de phases des sphres dures, en coordonnes ,T , o = 3 /6 est la compacit.
La temprature T nayant aucune influence dans ce cas, les frontires sont verticales sur ce graphe. Noter
la zone de coexistence entre fluide et cristal.
Dautres formes dordres, intermdiaires entre le fluide, dont la structure moyenne est isotrope,
et le cristal, apparaissent avec des particules de forme allonge. Ce sont les phases de type cristal
liquide (ou msophases). L aussi, la simulation numrique a rvl limportance des effets entropiques, puisque des particules en forme de btonnets, sans autre interaction que leur mutuelle
exclusion strique, passent densit croissante par plusieurs transitions de phases. Ainsi, celles 5
de la figure 1.5 se prsentent basse densit dans une phase fluide ordinaire, isotrope, sans ordre
dorientation ni de position. densit plus leve apparat la phase nmatique, dans laquelle, les
positions restant sans corrlation longue distance, les grands axes des particules choisissent prfrentiellement une orientation commune. Vient ensuite une phase smectique dans laquelle apparat
en plus un ordre partiel de positions : les centres des particules se concentrent sur une famille de
plans parallles, mais lintrieur de chacune de ces couches on ne trouve pas dordre longue
distance. Enfin la phase de plus haute densit est un solide cristallin. Les limites et les zones de
coexistence dans le diagramme de phases dpendent du rapport daspect des particules
5. Simulations par mthode de Monte-Carlo, dues Peter Bolhuis et Daan Frenkel, de lInstitut de
Physique Atomique et Molculaire, Amsterdam.
11
Fig. 1.5. Diffrentes phases des sphrocylindres durs (cylindres ferms par deux hmisphres) : de
gauche droite et de haut en bas, phases isotrope, nmatique, smectique, cristalline.
Fig. 1.6. Reprsentation schmatique du modle de viscosit ou de diffusion molculaire par sauts. Ici
un vnement de saut exceptionnel a eu lieu entre les deux configurations reprsentes, avant ( gauche)
et aprs ( droite) un bref intervalle de temps. Alors que la plupart des particules, comme le disque gris,
oscillaient lintrieur de la cage formes par leurs voisines, lune dentre elles est parvenue schapper,
dans un mouvemement brusque, figur par la flche.
Cest effectivement le mcanisme de la diffusion molculaire dans les solides cristallins, dans
lesquels les atomes quittent parfois leur site du rseau pour occuper des positions exceptionnelles,
dites interstitielles, ou bien sautent brusquement sur un site cristallin voisin, qui se trouve inoccup
(mouvement de lacune), ce qui est fort rare dans les conditions thermodynamiques usuelles.
Toutefois, ltude des mouvements molculaires dans les liquides, par la simulation numrique,
a rvl que lon ne pouvait pas isoler des vnements de sauts, au moins pour la description de la
dynamique des liquides ordinaires : la diffusion est lie des mouvements collectifs et permanents,
12
1 Prliminaires
dans lesquels les dplacements prsentent une structuration spatiale analogue aux champs de vitesses macroscopiques dans les fluides continus. Conjointement, grce aux informations nouvelles
que lon a acquises sur la dynamique des liquides, on a pu comprendre comment une version gnralise de lhydrodynamique macroscopique pouvait sappliquer jusquaux chelles molculaires.
Une manifestation indirecte en est la validit remarquable, dans les liquides, de la relation de
Stokes-Einstein jusquaux chelles molculaires. Cette relation concerne normalement les particules collodales (de taille msoscopique), et exprime le coefficient de diffusion D dune particule
sphrique de rayon R en suspension dans un liquide de viscosit par :
D=
kB T
.
6R
(1.5)
Lquation (1.5) fournit une bonne approximation du coefficient de diffusion D, dans les liquides
constitus de petites molcules, grossirement assimilables des objets sphriques, si on prend
pour R une valeur infrieure de 30% au rayon molculaire.
2
Description microscopique et statistique des grands systmes
Dans ce chapitre nous dfinissons les objets dtude essentiels du cours de physique statistique.
Nous considrons le cas de N particules ponctuelles en interaction, et introduisons les notations et
proprits de base ncessaires la description statistique de leur mouvement. Nous rappelons aussi
quelques observations sur le comportement des grands systmes et indiquons comment certaines
grandeurs macroscopiques peuvent y tre mesures, et comment caractriser leur structure.
13
15
15
16
18
19
22
23
24
25
26
26
27
28
32
14
Le N-uplet Q volue dans lespace des configurations DN , dont la dfinition dpend des conditions de bord utilises :
si les particules sont libres dexplorer tout lespace, on a D = Rd ;
les particules peuvent tre assujetties demeurer lintrieur dun volume fixe. Il faut alors
se donner un modle physique de ce confinement, par exemple avec des forces drivant dun
potentiel qui crot trs rapidement la traverse de la frontire de D, ou avec des conditions
de bord spculaires (rflexion des impulsions au niveau de linterface) ;
si les particules explorent une bote avec des conditions aux limites priodiques, lespace des
configurations est un tore TdN . Cest trs souvent le cas pour la modlisation numrique
des solides et des fluides : les conditions aux limites priodiques permettent de reprsenter
plus fidlement une portion du matriau entour du mme matriau, alors que si on a des
conditions de bord libres, ou bien encore faisant intervenir une paroi idale impntrable, les
effets de surface ne sont pas ngligeables, voire dominent le comportement du systme.
4
A
1
A
La figure 2.1 illustre les conditions aux limites priodiques dans un espace de dimension d = 2.
Neuf copies de la cellule de simulation centrale (numrote 1) y sont reprsentes. La distance
entre les particules marques A et B est la plus petite entre leurs images les plus proches par
lune des translations qui transforment la cellule de simulation une collection de rpliques. Notant
Ai la copie de la particule A dans la cellule i, cest la distance entre A1 et B2 (ou entre A5 et
B4 , ou entre A7 et B8 ) qui dtermine la force entre A et B. Cette remarque est importante car
nous nous limiterons dans ce cours aux potentiels de courte porte, pour lesquels il suffit dvaluer
linteraction entre les images les plus proches. 2 On peut noter aussi que la position des frontires
de la cellule de simulation na aucune importance, chacune des parties du volume tudi jouant le
2. Pour des potentiels lentement dcroissants (en particulier pour les interactions ioniques ou dipolaires)
il faut additionner toutes les interactions des Ai et des Bj de toutes les cellules obtenues par priodicit
15
mme rle. Ainsi on peut tout aussi bien considrer que le domaine de calcul est le carr reprsent
en pointills sur la figure 2.1. Dans la pratique, on garde la trace chaque instant des positions
des particules dans une seule cellule, et on veille prendre en compte les interactions entre images
les plus proches.
Remarque 2.1 (Taille minimale de la cellule de simulation). On prendra garde ce que la cellule
de simulation soit suffisamment grande pour quune particule ninteragisse quune fois avec une
autre particule ou son image priodique. Par exemple, pour un domaine de simulation cubique de
ct L, il faut que le rayon de coupure rcut du potentiel soit tel que
L > 2rcut .
pi (t)
q i (t) = p H(Q, P) =
,
i
mi
(2.2)
Cest un systme dquations diffrentielles ordinaires (EDO). Par la suite, on fera lhypothse
quil y a une et une seule solution cette EDO. Ceci est le cas par exemple si le champ de force V
est globalement lipschitzien (par application du thorme de Cauchy-Lipschitz). 3 Un systme tel
que (2.2), pos dans R2dN est dit hamiltonien si on peut dfinir des variables Q RdN , P RdN
et une fonction H(Q, P) telle quil puisse scrire sous la forme (2.2). Comme toute EDO, la
dynamique (2.2) est caractrise par son flot.
Dfinition 2.2 (Flot). On appelle flot de la dynamique hamiltonienne (2.2) la famille dapplications (t )t0 qui, au microtat (Q0 , P0 ) E t = 0 font correspondre les microtats (Q(t), P(t))
E tout instant t 0.
On a toujours t+u = t u pour t, u 0, et la famille (t )t0 constitue donc un semi-groupe.
Cela signifie simplement que si lon prend u (Q0 , P0 ) comme condition initiale, on obtient au bout
du temps t la mme valeur (Q0 , P0 ) quen partant de (Q0 , P0 ) et en intgrant sur un temps t + u.
Pour les systmes hamiltoniens, t a un sens (voir (2.4)) et le flot dfinit un groupe.
(y compris linteraction de chaque particule charge avec chacune de ses rpliques). Un tel calcul porte le
nom de somme dEwald pour les charges ou somme dEwald et Kornfeld pour les diples.
3. Dans certains cas, on peut galer montrer quune condition de Lyapounov est vrifie, i.e. on montre
quune certaine fonction W (Q, P) dcrot au cours du temps, cette dcroissance donnant une information
sur le comportement de la solution (par exemple, elle reste dans un compact). Un cas classique concerne
des dynamiques du type q = q 3 . Dans ce cas, on na pas une condition de Lipschitz globale, mais on
montre facilement que la fonction t 7 W (q(t)) = q(t)2 dcrot au cours du temps, ce qui montre que la
solution reste dans le compact B(0, q(0)). Au final, comme la solution est borne, on peut en fait conclure
que la force est borne, et appliquer quand mme le thorme de Cauchy-Lipschitz.
16
q i (t) = vi ,
v i (t) = 1 qi V (Q, P).
mi
Cependant, on prfre trs souvent lcriture (2.2) pour un certain nombre de raisons que nous
dtaillons ci-dessous.
Invariants de la dynamique
On montre tout dabord que la dynamique (2.2) conserve lnergie du systme. On parle
dailleurs en mcanique de systme conservatif. Ceci est une proprit importante de cette dynamique, fondamentale pour la dfinition de lensemble microcanonique (chapitre 3). Elle se prte
de surcrot plus aisment au passage de la mcanique classique la mcanique quantique, comme
on le verra dans la seconde partie de ce cours.
Proprit 2.1 (Conservation du Hamiltonien le long dune trajectoire). On montre facilement que la dynamique (2.2) est telle que lnergie totale H(Q, P) est prserve le long de la
trajectoire. En effet,
dH(Q(t), P(t))
1
1
dLeb (Q, P) =
dq1 . . . dqN dp1 . . . dpN .
3N
N !h
N ! h3N
(2.3)
Le prfacteur fait apparatre N ! et la constante de Planck h ' 6, 626 1034 J.s ; il conduit
valuer le volume dune partie de lespace des phases par un nombre sans dimension. Ce facteur
17
dorigine quantique peut tre omis sans dommage en gnral, du moins en prsence dune seule
espce molculaire. 4
Pour vrifier la conservation de la mesure (2.3), on montre que, pour tout t 0,
|Det(Q,P t (Q, P))| = |Jac t (Q, P)| = 1.
Ainsi, le flot dfinit un changement de variable de Jacobien 1. Cette proprir rsulte du fait
que le champ de vecteurs associ la dynamique hamiltonienne est de divergence nulle (voir [19,
Lemme VII.3.1] pour une preuve de cette assertion). On calcule en effet
divQ (P H) + divP (Q H) =
N
X
(qi pi H pi qi H) = 0.
i=1
On peut comprendre ce rsultat par une analogie avec la mcanique des fluides (voir le cours
de cinmatique des milieux continus), 5 en se reprsentant la dynamique hamiltonienne comme
dcrivant un coulement dans lespace des phases, (2.2) donnant la valeur de la vitesse en chaque
point (champ des vitesses en reprsentation eulrienne). Cette vitesse possde dans ce cas 2dN
coordonnes, qui sont celles de (q i )1iN et (p i )1iN . La conservation du volume est exprime
par la condition de divergence nulle du champ de vitesse (fluide incompressible), au vu de lquation
de la conservation de la quantit de matire.
Caractre chaotique de la dynamique hamiltonienne
On montre ici sur un exemple que la dynamique hamiltonienne est en gnrale exponentiellement sensible aux conditions initiales, au sens o une petite perturbation de la donne initiale
grandit exponentiellement au cours du temps. Or, en pratique, il est impossible de connatre exactement les conditions initiales dun systme donn, et de toute faon il existe une erreur numrique
intrinsque des ordinateurs actuels (de lordre de 1016 ). Ces considrations montrent que la notion de trajectoire dun systme dynamique nest pas forcment la bonne notion. Cest un point qui
aura toute son importance lors de la discussion sur lchantillonnage de la mesure microcanonique
et les schmas numriques dintgration associs ( 3.3).
Exemple 2.1. On considre une particule q R soumise au potentiel V (q) = 12 2 q 2 . Dans ce cas,
les quations du mouvement
q = q,
(q0 , p0 ) = (0, 1),
ont pour solution q(t) = 1/2 p0 exp( t). On voit ainsi quuneperturbation de lordre de sur
limpulsion initiale p0 conduit une perturbation en 1/2 exp( t) au temps t.
La situation prsente dans lExemple 2.1 peut sembler caricaturale, mais est en fait trs
gnrale : en effet, au voisinage de tout maximum local Qmax de la surface dnergie potentielle,
on a localement le dveloppement limit
V (Q) = V (Qmax ) + (Q Qmax )T 2 V (Qmax ) (Q Qmax ) + O(|Q Qmax |3 ),
avec la matrice hessienne 2 V (Qmax ) dfinie ngative. Des dveloppements limits de ce type
montrent galement que la situation rencontre lExemple 2.1 reste valable au voisinage de tout
point-col, o la matrice hessienne du potentiel a au moins une valeur propre ngative - ce qui, en
pratique, vaut pour une grande partie de lespace des phases si le systme est de grande dimension !
Lanalogie avec lcoulement dun fluide peut une fois de plus contribuer rendre intuitive
la proprit de sensibilit aux conditions initiales de la dynamique hamiltonienne dun ensemble
4. Le terme N ! qui exprime lindiscernabilit des particules doit tre conserv en prsence de plusieurs
espces. Dans le calcul de laugmentation dentropie lors dun mlange, son omission conduit au paradoxe
de Gibbs voir le cours Physique des tats de la matire de premire anne [8].
5. Le terme flot est en fait une traduction un peu impropre de langlais flow, cest--dire coulement.
18
de particules en interaction. Deux trajectoires dans lespace des phases, partant de points trs
proches, scartent de plus en plus et finissent par explorer des microtats trs distants, de mme
que lcoulement turbulent dun fluide conduit en mlanger les diffrentes parties. Lorsque lon
matrialise une petite rgion dun coulement turbulent de fluide incompressible, par exemple au
moyen dun traceur color, on voit la matire repre se disperser dans un volume croissant :
lcoulement divergence nulle rapproche les points selon certaines directions, et les loigne selon
dautres, do une divergence des trajectoires. Il en est de mme pour lcoulement incompressible
dans lespace 2d N dimensions E. 6
Rversibilit en temps
Une autre proprit importante de la dynamique hamiltonienne est sa rversibilit en temps.
Si, linstant t, on renverse les vitesses, alors la trajectoire antrieure dans E est parcourue dans
lautre sens. Autrement dit, si on note S lapplication qui change le signe des vitesses alors que les
positions restent les mmes, i.e.
S(Q, P) = (Q, P),
le flot t est tel que :
t S = S t .
(2.4)
Preuve. Soit (Q0 , P0 ) E donn. Notons (Q(t), P(t)) la solution de (2.2) partant de la condition
b
b
initiale (Q0 , P0 ), et (Q(t),
P(t))
la solution de (2.2) partant de la condition initiale S(Q0 , P0 ) =
b
b
(Q0 , P0 ). On vrifie facilement que (Q(t),
P(t))
et S(Q(t), P(t)) = (Q(t), P(t)) satisu
font (2.2), partant de la mme condition initiale (Q0 , P0 ).
t
2.2.3 Intgration de la dynamique hamiltonienne
On parle quelquefois de problme N corps pour dcrire la dynamique hamiltonienne, dans la
mesure o lvolution de la particule i, donne par
i = qi V (q1 , . . . , qN ),
mi q
(2.5)
dpend a priori des positions de toutes les autres particules. On a affaire un systme de N quations diffrentielles ordinaires couples, et linformation physique importante est le potentiel V .
On verra comment intgrer numriquement ces quations au 3.3.4).
On sait bien sr que les problmes N corps, en gnral, ne se rsolvent pas analytiquement
pour N 3 (et en pratique, jamais dans un cas vraiment intressant !). Une rsolution numrique
des quations du mouvement (2.2) (ou (2.5)) nest possible que pour des systmes dau mieux
une centaine de milliers de molcules et sur des temps trs courts, de lordre de 109 s. La dtermination prcise des trajectoires dans lespace des phases pour le mouvement dun ensemble de
N particules avec N de lordre du nombre dAvogadro NA ' 6 1023 est donc impossible. Fort
heureusement, il est possible dvaluer, dans bien des cas pratiques, des proprits macroscopiques
partir de simulations numriques dchantillons assez petits (quelques centaines de particules
suffisent parfois), pendant une dure assez brve (cf. les exemples des 2.3, 3.3.6 et 5.3.2). Insistons une fois de plus sur le fait que la recherche de la prcision dans le calcul numrique des
trajectoires est illusoire et vaine, cause de la sensibilit aux conditions initiales.
6. On peut trouver dans le livre de Diu et al. [10, p. 577] un calcul approch de cet effet, dans le cas
dun gaz de sphres dures, dont le rsultat est saisissant. Les collisions de molcules dair la pression
atmosphrique, modlises comme des billes lastiques, sont telles quelles amplifient les carts angulaires
sur les portions rectilignes de trajectoire entre deux chocs. Les dviations angulaires croissent donc exponentiellement avec le nombre de chocs. Pour quune particule soit dvie de 1 radian sous leffet dune
perturbation infime celle que cause lattraction gravitationnelle dun exprimentateur pesant 70 kg, 1
mtre de distance il suffit de 10 collisions environ, et de 50 collisions si la perturbation est due lattraction gravitationnelle dun lectron une distance gale au rayon de lunivers ! 10 collisions, dans lair
300 K et la pression atmosphrique 105 Pa, correspondent un temps de lordre de la nanoseconde.
19
Heureusement, ce qui importe en pratique, pour retrouver les lois macroscopiques, cest dtudier des comportements moyens, collectifs. Dans la simulation numrique ce sont les proprits du
flot t qui sont importantes, plutt que celles des trajectoires prises une une. On adoptera en
outre un point de vue statistique : on sintressera en particulier la frquence avec laquelle sont
visites diffrentes parties de lespace des phases. Cette approche statistique a donn lieu tout
le dveloppement historique de la physique statistique (avant les ordinateurs et les simulations
numriques). Nous relevons dans le paragraphe suivant quelques observations qualitatives sur le
comportement des grands systmes qui motivent cette dmarche et prcisons quelques notions de
base ncessaires son dveloppement.
(2.7)
soit gale 0,24. Lobservation de lvolution de grandeurs macroscopique donne des rsultats qui
deviennent approximativement constants et indpendants des conditions initiales aprs un certain
temps. On sattend ainsi, dans notre exemple, ce que la moiti des particules soit contenue, en
moyenne, dans chacune des deux moitis du volume. La figure 2.2 illustre ce comportement, avec
une condition initiale dlibrment particulire : dans ces calculs, on a choisi N1 = N et N2 = 0
t = 0. On constate que le rapport X = N2 /N rejoint rapidement 1/2, et fluctue ensuite en ne
scartant que lgrement de cette valeur.
On voit galement que lamplitude des fluctuations diminue lorsque N augmente. On peut montrer que, dans la limite N +, N2 se comporte comme une variable gaussienne de moyenne N/2
et de variance kB T N/4, tant la compressibilit isotherme. On crit (notation utilise dans
la suite de ce document)
N 1
N2 N
, N kB T .
(2.8)
2 4
La variance de N2 tant proportionnelle
au nombre de particules, le rapport cart-type/moyenne
20
Fig. 2.2. volution dans le temps de la fraction du nombre de particules contenue dans une moiti de la
cellule de simulation, partant de zro, pour 4 chantillons avec des valeurs de N diffrentes.
Fig. 2.3. Pour 4 valeurs de N , variance de N2 (a) et densit de probabilit de x = N2 /N (b), compares
la prdiction (2.9), avec la valeur connue k
B T = 0, 199 dans ces conditions thermodynamiques. La
droite pointille sur le graphe (a) est N 7 41 N kB T .
Les donnes statistiques sur les fluctuations de N2 ont t acquises une fois coul un temps
ncessaire loubli de ltat initial particulier (ici, t = 15), quand on peut estimer que les oscillations initiales de N2 (t) sont amorties. Il semble alors que lon ait atteint un tat stationnaire, au
sens statistique du terme, cest--dire que la succession des valeurs prises au cours du temps par la
grandeur observe sapparente la trajectoire dun processus alatoire stationnaire : connaissant
la valeur linstant t, la valeur linstant t0 > t est alatoire et distribue suivant une loi qui ne
dpend que de t0 t. Ceci peut se vrifier par des tests statistiques adquats.
21
Il est intressant de mesurer la fonction dautocorrlation entre les valeurs de N2 des instants
diffrents, que lon dfinit comme :
C(t) = (N2 (t) hN2 i) (N2 (0) hN2 i) .
La notation hi reprsente une moyenne sur le choix de lorigine des temps, pour une longue
trajectoire donne (ventuellement, cette moyenne pourrait galement tre prise sur plusieurs
trajectoires partant de conditions initiales diffrentes). La fonction C(t), normalise par sa valeur
t = 0 (cest--dire la variance de N2 ), est reprsente sur la figure 2.4. Le temps de corrlation de
Fig. 2.4. Fonctions dautocorrlation dpendant du temps, normalises leur valeurs initiales, de N2
(courbe continue) et de k (courbe en pointills). Cette dernire quantit est dfinie par (2.11) et (2.10),
pour un vecteur donde k tel que |k| = 2
. Ici, N = 1999 et = 0,24.
L
N2 est donc assez long, puisque C(t) est toujours oscillant pour t = 30, et donne une indication du
temps de mesure ncessaire pour bien chantillonner la distribution statistique des valeurs prises
par N2 : il faut en principe moyenner sur une dure grande devant le temps de corrlation de N2 ,
pour que la distribution des valeurs observes cesse dtre biaise par ltat initial au dbut des
mesures.
En fait, cette fonction pourrait tre value partir de la connaissance macroscopique de
la thermodynamique et de lhydrodynamique du fluide de sphres dures. On peut en effet faire
lhypothse que les fluctuations de la densit lchelle de la cellule de simulation t = 0 vont,
en moyenne, rgresser comme dil sagissait dun petit cart macroscopique lquilibre global
de lchantillon de fluide tudi. 7 Une telle approche permet de calculer C(t), partir dune
dcomposition de N2 (t) en srie de Fourier. Les longueurs donde les plus faibles ne sont pas bien
dcrites par lapproche macroscopique, mais la dcroissance vers zro de C(t) aux temps longs
est domine par les longueurs donde de lordre de la taille L de la cellule de simulation. La plus
grande est prcisment L, et sur la figure 2.4 on a aussi reprsent la fonction dautocorrlation
de k ,
hk (t)k (0)i
F (k, t) =
,
(2.10)
N
normalise par sa valeur initiale. Le coefficient k est la composante de Fourier du champ de
densit, pour un vecteur donde k tel que |k| = 2
L :
k =
N
X
exp[ik qi ].
i=1
7. Cette hypothse est appele le postulat dOnsager pour la rgression des fluctuations.
(2.11)
22
hk k i
.
N
(2.12)
Cette quantit est relie aux fonctions de corrlation de densit dans lespace rel (voir 2.5.3).
La dpendance en temps de F (k, t), dont la forme est prdite par lhydrodynamique 8 (voir [20]),
concide bien pour les temps assez grands avec celle de la fonction dautocorrlation de N2 .
Enfin, une remarque importante concerne la rversibilit en temps des trajectoires, proprit
que le systme de sphres dures partage avec les systmes hamitoniens du 2.2. Pour les simulations
dont nous rapportons ici les rsultats, cette proprit signifie en principe que si lon renverse les
vitesses de toutes les particules linstant t, alors, linstant 2t, on doit retrouver la configuration
de dpart (t = 0), qui tait telle que toutes les particules se situent dans la moiti de la cellule de
simulation. Or il nen est rien si t est suffisamment grand (t = O(1)) : on observe simplement des
fluctuations analogues celles que lon voit sur la figure 2.3(b). Ceci sexplique une fois encore par
laccumulation derreurs numriques et linstabilit des trajectoires.
Z
0
dN (Q, P) 1.
B
Une telle mesure de probabilit peut admettre une densit fN , auquel cas
Z
dN (Q, P) = fN (Q, P) dQ dP, fN 0,
fN (Q, P) dQ dP = 1,
E
8. La priode des oscillations de F (k, t) sur la figure 2.4 est celle des ondes de compression ondes
acoustiques longitudinales de longueur donde L.
23
mais ce nest pas forcment le cas. On pourrait imaginer que dN (Q, P) est une masse de Dirac
concentre en un point, ou plus gnralement, une mesure restreinte une sous-varit de lespace.
Un tel exemple sera prsent au 3.1.1.
Notons galement que le point de vue probabiliste est naturel en pratique pour un observateur
qui ne dispose que dune information partielle sur le mouvement des N particules et qui les
fluctuations, comme celles de N2 dans lexemple du 2.3, semblent erratiques. Plus fondamentalement, la sensibilit aux conditions initiales interdit de prvoir les trajectoires dans E, en dpit
du dterminisme exprim par (2.2), car les valeurs initiales des 2dN coordonnes de (Q, P) ne
sont jamais connues quavec une prcision finie. Dans la pratique usuelle du calcul numrique, la
prcision relative sur un nombre rel (cod sur 8 octets) est de lordre de 1016 . En fait, pour
certains systmes dynamiques chaotiques analogues (2.2), on peut montrer 9 quil est impossible
de distinguer :
(i) les trajectoires exactes des quations dterministes pour une certaine condition initiale ;
(ii) les trajectoires des quations dterministes calcules avec des erreurs relatives de 1016 ;
(iii) les trajectoires exactes dun modle modifi, un terme de bruit dordre relatif 1016 tant
ajout dans les quations dterministes.
Ce rsultat est appel lemme de poursuite dans [11], car la trajectoire fausse que lon calcule est
en fait une vraie trajectoire pour une certaine condition initiale tellement proche de celle que
lon a prise quon ne la distingue pas avec le niveau de prcision dont on dispose. Pour de tels
systmes dynamiques chaotiques, la distinction entre volution dterministe ou alatoire nest donc
quaffaire de point de vue.
2.4.1 Approche de lquilibre, moyennes et corrlations en temps
On observe en gnral lorsque lon prpare un systme dans un tat particulier, comme dans
lexemple prcdent o toutes les particules sont initialement dans la moiti du volume accessible, que cette situation de dpart est oublie aprs un certain temps, au-del duquel tout semble
indiquer que le macrotat du systme, cest--dire la mesure de probabilit dN (Q, P) des microtats, est indpendante du temps. Un tel macrotat est par dfinition un tat dquilibre au sens
thermodynamique.
Dans la pratique, lorsque lon simule le mouvement de N particules, on repre un instant t0
o linfluence de ltat initial est devenue ngligeable (on peut par exemple tester la stationnarit
de certaines observables, considres comme processus alatoires, voir 5.3) et on remplace la
moyenne densemble (2.13) par une moyenne en temps
1
hAi =
t0 +
(2.14)
t0
dans laquelle on doit prendre assez grand pour avoir un chantillon reprsentatif de la statistique
des fluctuations au cours du temps. La proprit (2.14) est la dfinition pratique de la moyenne
selon le macrotat dquilibre. Dire que les systmes macroscopiques approchent spontanment
dun tat dquilibre, cest dire quil existe un macrotat eq
N tel que, pour toute observable A,
(2.14) concide avec (2.13) pour , t0 assez grands. On fait en sorte une hypothse dergodicit.
Une indication sur les chelles de temps concernes est fournie par les fonctions de corrlation
dpendant du temps. Si A et B sont deux observables, on appelle fonction de corrlation de A et
de B la quantit
CAB (t) = hA(0)B(t)i hAi hBi ,
(2.15)
o B(t) = B(t (Q0 , P0 )), la moyenne tant prise par exemple sur toutes les ralisations de la
dynamique, partant de conditions initiales (Q0 , P0 ) distribues selon dN . Si on admet que les
valeurs prises par les diffrentes observables sont indpendantes des temps loigns (du fait de
9. Nous recommandons la lecture de larticle dAdrien Douady [11] qui illustre ces proprits sur un
modle simple.
24
loubli des conditions initiales), alors CAB (t) tend vers zro pour t +. Une condition ncessaire
pour que les valeurs prises t et t + puissent tre considres comme indpendantes est que
lon ait r , o r est le temps caractristique de dcroissance de CAB . On doit donc prendre
r dans (2.14).
2.4.2 Limite thermodynamique, moyennes et corrlations dans lespace
Cest une constatation dexprience que les observables ayant un sens macroscopique, comme
la pression ou lnergie interne, et qui font intervenir un grand nombre de degrs de libert du
systme ( linstar du nombre N2 dont lvolution est rapporte au 2.3) ne scartent que peu
de leur valeur moyenne, avec des fluctuations qui tendent diminuer, en valeur relative, comme
O(N 1/2 ) lorsque le nombre de particules N augmente. Bien souvent, de telles observables A
peuvent scrire, au moins approximativement,
A=
p
X
Ak ,
(2.16)
k=1
Il est immdiat dans ce cas que le mouvement de chacun des (Qk , Pk ) est indpendant de tous les
autres. On aura alors indpendance statistique entre les fluctuations de chacune des observables
partielles. Lapplication du Thorme de la Limite Centrale (2.16), somme de variables indpendantes quidistribues, assure alors (sachant que le nombre p augmente proportionnellement N )
que A est une variable gaussienne de variance
D
E
2
(A hAi) N.
Toutefois, le cas dun Hamiltonien se dcomposant en une somme de termes faisant intervenir
des degrs de libert indpendants est exceptionnel et correspond aux rares systmes physiques,
comme le gaz parfait, pour lesquels la physique statistique fournit des prdictions exactes.
En gnral, une dcomposition de la forme (2.17) est impossible crire exactement, mais
on peut obtenir une partition approximative en dcoupant le volume total en sous-parties, et en
faisant une hypothse dindpendance grande distance. En effet, si les sous-systmes sont euxmmes assez grands, deux sous-systmes adjacents ne sont corrls que par lintermdiaire des
degrs de libert des molcules situes la proximit de la frontire, dont la contribution dcrot
relativement lorsque la taille des sous-systmes augmente. On peut alors formellement sattendre
ce quun rsultat du type Thorme de la Limite Centrale sapplique, et donc ce que les
fluctuations relatives par rapport aux valeurs moyennes soient en O(N 1/2 ). Une indication utile
25
pour estimer grossirement limportance des fluctuations rsiduelles dans un chantillon de taille
finie est celle de la longueur de corrlation, longueur caractristique de dcroissance vers zro de
lamplitude des corrlations entre les observables qui dpendent des degrs de libert des molcules
au voisinage dun point donn dans le volume occup par le systme. Pour considrer que des soussystmes associs un dcoupage du volume sont approximativement indpendants, une condition
ncessaire est que leur taille soit grande devant la longueur de corrlation.
On appelle limite thermodynamique la limite dans laquelle le nombre de particules N tend vers
linfini, ainsi que le volume V = |D| du systme, tandis que la densit numrique = N/V est
maintenue constante. Dans la limite thermodynamique, les observables du type (2.16) qui rsultent
de la somme de contributions locales peuvent tre considres comme fixes, et on retrouve alors
la description dterministe de la thermodynamique pour les systmes macroscopiques. De telles
grandeurs, qui ont une moyenne croissant proportionnellement N , sont appeles grandeurs extensives. Les grandeurs caractrisant ltat thermodynamique du systme et possdant une limite
thermodynamique finie sont dites intensives (pression, temprature, densit par exemple).
En gnral, il est trs difficile de prdire le comportement des systmes physiques dans la limite
thermodynamique. Les considrations heuristiques qui prcdent ne sont que des arguments de
plausibilit de la rgression des fluctuations dans cette limite (cest--dire que les fluctuations des
observables caractrisant ltat thermodynamique du systme deviennent ngligeables). Il convient
toutefois de vrifier ces prdictions, ce dont on peut sassurer par lexprience et la simulation
numrique. Les exceptions sont associes des phnomnes physiques particuliers, comme les
transitions de phase du second ordre.
2.4.3 Ensembles statistiques
Jusquici, nous avons suppos que lon observait lvolution dans le temps dun systme unique,
et que lon pouvait ventuellement donner le sens de probabilits aux frquences doccurrence des
microtats. Pour motiver et justifier le recours une approche probabiliste, nous avons brivement
invoqu lapparence erratique des fluctuations des grandeurs observables, et le caractre chaotique
de la dynamique hamiltonienne dun grand nombre de particules, cest--dire son imprvisibilit
pratique du fait de la sensibilit aux conditions initiales et la loi dinteraction. La physique
statistique sest construite sur un postulat fondamental (voir 3.1), et qui permet de prdire
les macrotats dquilibre (cest--dire la mesure sur E correspondant lchantillonnage par la
dynamique hamiltonienne dans la limite des temps longs). Grce ce postulat de dpart, on a
deux possibilits pour la dtermination numrique des moyennes des observables :
soit on simule directement le mouvement des particules avec la dynamique hamiltonienne,
cest la mthode de la dynamique molculaire (voir chapitre 3) ;
soit on cherche tirer au sort des microtats selon la loi de probabilit prdite par le postulat,
ce qui conduit aux mthodes de Monte-Carlo (voir chapitre 5).
Traditionnellement, la physique statistique fait appel la notion densemble statistique, qui est
une manire de se reprsenter un macrotat ou une mesure de probabilit sur E. Lide densemble
statistique renvoie une collection fictive de systmes identiques, chacun reprsentant un tirage
au sort selon une certaine loi de probabilit. On distingue diffrents types densemble selon le
modle que lon se donne pour les interactions du systme tudi avec le reste de lunivers. En fin
de compte, les proprits thermodynamiques telles que lquation dtat dun fluide, par exemple,
ne dpendent pas du rcipient qui en contient un chantillon macroscopique. Aussi sattend-on
ce que les diffrents ensembles statistiques, qui sont des constructions abstraites et commodes
pour passer de lchelle microscopique lchelle macroscopique, conduisent aux mmes rsultats
physiques dans la limite thermodynamique.
chacun des ensembles statistiques usuels correspond une mesure de probabilit dquilibre
diffrente sur E. Les ensembles usuels sont caractriss par les paramtres de contrle qui sont
utiliss pour dcrire ltat du systme. Comme on le verra, les macrotats dquilibre correspondant ces diffrents ensembles possdent certaines proprits de maximisation de lentropie. On
distingue ainsi les cas usuels suivants :
26
(i) la situation dun systme isol maintenu dans un volume fixe D (avec V = |D|), compos
de N particules et dont lnergie totale E est constante, est dcrite par lensemble microcanonique ou ensemble (N, V, E). On verra que la mesure sur E qui lui correspond nest
pas la plus commode dutilisation (chapitre 3) ;
(ii) lensemble canonique dcrit la situation dun systme de N particules dans un rcipient
de volume V fix pouvant changer de lnergie avec un autre systme appel thermostat,
qui fixe sa temprature T . On parle donc aussi densemble (N, V, T ) (voir chapitre 4). La
temprature caractrise la propension du systme cder de lnergie ;
(iii) lensemble grand-canonique, ou ensemble (, V, T ), dcrit la situation dun systme, en
contact avec un thermostat, et constitu par des particules se trouvant dans un volume V
donn. Ces particules sont cependant en nombre variable, des changes ayant lieu avec un
certain rservoir de particules. Le potentiel chimique mesure la propension du systme
absorber des particules ;
(iv) lensemble isotherme-isobare, enfin, ou ensemble (N, P, T ), dcrit la situation du systme
en contact avec un thermostat et avec un rservoir de volume qui lui impose une certaine
pression P .
Ces diffrents ensembles statistiques font intervenir des changes (dnergie, de volume, de particules) avec un systme rservoir, suppos trs grand, de telle sorte que la quantit dnergie quil
fournit au systme tudi (ou le nombre de particules, ou le volume) est infime par rapport sa
taille et naffecte pas son tat. Le thermostat est un rservoir dnergie par exemple.
Beaucoup dobservables, en particuler celles que lon peut crire comme somme de contributions
locales ( la manire de (2.16)), ont, des termes de fluctuation en O(N 1/2 ) prs, la mme
moyenne dans les diffrents ensembles statistiques, pourvu que le sens macroscopique du macrotat
considr soit le mme. Toutefois leur variance, cest--dire
D
E
2
Var (A) = (A)2 = (A hAi) ,
(2.18)
est diffrente. Par exemple, la variance de lnergie totale est identiquement nulle dans lensemble
microcanonique (puisque la valeur de H(Q, P) est une constante du mouvement), alors quelle
nest pas nulle dans les ensembles canonique, grand-canonique et isotherme-isobare, en raison des
changes dnergie avec le thermostat.
K=
selon
27
N
X
p2i
,
mi
i=1
1
3k 2 T 2
Var (K)NVE = B
N
2
1
3kB
2cv
.
(2.21)
1 3.
Ce flux a deux origines physiques distinctes. Le mouvement des particules qui traversent la surface
(1)
(2)
x = x
0 lui apporte une contribution J , laquelle sajoute un autre terme J , d aux forces
que les particules situes dun ct de la surface (x < x
0 ) exercent sur les particules situes de
lautre ct (x > x
0 ).
La stationnarit de la quantit de mouvement moyenne contenue dans une tranche quelconque
x
1 < x < x0 montre que
Z
1 L/2
2
L =
J (x ) dx .
L L/2
(1)
Dans cette intgrale, le terme J (x ) ne contribue que pour les valeurs de x correspondant la
coordonne qi du centre dune particule i. Le flux de quantit de mouvement correspondant est
alors
Z L/2
N
X
(1)
J (x )dx =
mvi vi .
L/2
i=1
J(2) (x
0) =
i t.q.
j t.q.
x
0
x
0
Fij ,
rc < qi < x0
< qj < x0 + rc
Fij dsignant la force exerce par la particule i sur la particule j. Dans le calcul de lintgrale de
J(2) chaque paire (i, j) telle que qi < qj contribue pour les x compris entre qi et qj . On a donc,
en symtrisant les rles de i et j,
Z L/2
1X
J(2) (x ) dx =
Fij rij e ,
2
L/2
i6=j
o la somme est tendue tous les couples (i, j) avec i 6= j, et e est le vecteur unitaire le long de
laxe des x . En rassemblant les diffrentes contributions, et en notant que le volume de la cellule
est L3 = |D|, on trouve :
11. Cette condition assure que les conditions de bord priodiques ont un sens.
28
1
n=
|D|
*N
X
1X
mvi vi +
Fij rij
2
i=1
+
n
i6=j
pour tout vecteur n orthogonal lune des faces du cube, de sorte que les deux tenseurs du second
ordre concident :
*N
+
X
1
1X
=
(mvi vi ) +
(Fij rij ) .
|D| i=1
2
i6=j
Dans cette formule, le vecteur rij dsigne la diffrence qj qi entre les positions des copies les
plus proches de i et de j par la priodicit des conditions aux limites. Comme la force drive du
potentiel V, fonction de la distance rij = |rij |, on peut galement crire :
*N
+
X
1
1 X V 0 (rij )
=
(mvi vi )
rij rij
.
(2.22)
|D| i=1
2
rij
i6=j
*N
X
1X
rij V 0 (rij )
mvi2
2
i=1
+
(2.23)
i6=j
kB T
(vi )2 =
.
m
(2.24)
Le premier terme de la pression donne donc kB T . Le gaz parfait est le fluide sans interactions
pour lequel V = 0, on retrouve donc son quation dtat P = kB T .
2.5.3 Microstructure et corrlations de densit
La macrotat dN , que lon suppose symtrique vis--vis des permutations des N particules,
contient toute linformation statistique sur le systme, ce qui est norme. Beaucoup dobservables
dintrt pratique peuvent tre moyennes sans faire appel une connaissance aussi dtaille.
Densit un corps
PN
Si les observables que lon cherche calculer sont de la forme A1 = i=1 1 (qi ), il nest besoin,
pour valuer la moyenne hAi, que de connatre la loi marginale de la position dune particule, obtenue en prenant la marginale de dN par rapport toutes les variables q2 , . . . , qN , p1 , p2 , . . . , pN .
On suppose que dN est domine par la mesure de Lebesgue,
dN (Q, P) = fN (Q, P) dQ dP,
et que la densit fN est rgulire. Multipliant par N et exploitant la symtrie, on dfinit la densit
un corps (1) (r) comme
29
Z
d(1) (r) = N
R
R
On a alors D (1) (r)dr = N et hA1 i = D 1 (r)(1) (r) dr. Dans un systme homogne (les fluides
simples), (1) (r) est constante et concide avec sa moyenne spatiale, qui est simplement la densit
(numrique) = N/V . Dans un solide, (1) (r) prsente des maxima bien marqus au voisinage
des sites du rseau (cristallin ou amorphe) des positions moyennes des particules.
Densit de paires
On peut gnraliser cette approche des densits n corps. Toutefois, en pratique, on sintresse essentiellement la densit 2 corps, qui peut tre mesure exprimentalement par
des techniques de diffusion de rayonnement ou de particules. Par ailleurs, un certain nombre
dobservables rsultent de la somme de contributions de paires de particules (comme lnergie potentielle
dans le cas dun potentiel dinteractions par paires), et sont donc de la forme
P
A2 = 1i,jN, i6=j 2 (qi , qj ). Leurs moyennes font apparatre la densit deux corps (2) (r1 , r2 ),
densit de la loi marginale de la paire de positions (q1 , q2 ), multiplie par N (N 1) (pour raisons
de symtries, tenant compte du nombre total de paires de D D) :
Z
hA2 i =
(2) (r1 , r2 )2 (r1 , r2 )dr1 dr2 ,
DD
avec
(2)
(r1 , r2 ) = N (N 1)
R
On a DD (2) (r1 , r2 )dr1 dr2 = N (N 1). Dans le cas dun systme homogne, (2) (r1 , r2 ) ne
dpend que de r12 = r2 r1 , que lon notera simplement r. Si le systme est de plus isotrope,
alors la densit deux corps (2) (r1 , r2 ) est une fonction scalaire de la norme r = |r| du vecteur
r = r2 r1 . On dfinit la fonction de corrlation de paires g(r) par
(2) (r1 , r2 ) = 2 g(|r2 r1 |),
o est la densit du systme. La fonction g(r) dcrit les corrlations entre positions des particules,
prises deux deux. Si une particule est place lorigine des coordonnes, alors, la distance r, la
densit de particules nest pas mais g(r), cest--dire que
particules entre les
R r le nombre moyenR de
r
distances r1 et r2 dune particule de rfrence nest pas r12 4r2 dr, mais r12 4r2 g(r) dr. Dans
un fluide g(r) tend vers 1 lorsque r +. Si r est infrieur au diamtre du nuage lectronique,
lintrieur duquel la pntration du centre dune autre molcule est interdite par une trs forte
rpulsion, on a g(r) = 0. Entre ces deux limites, g(r) prsente des oscillations caractristiques de
la structure dun liquide.
La figure 2.5 prsente ainsi la fonction g(r) dans le liquide de sphres dures pour la fraction
solide =0,49. On note que g(r) est discontinue en r = . Le premier maximum de g(r) manifeste
laccumulation de particules dans une couche plus dense une certaine distance caractristique
des premires voisines, qui compense partiellement leur exclusion autour du centre de la particule
origine. Les oscillations, rapidement amorties, plus grande distance traduisent une organisation
locale en couches successives, de moins en moins marque mesure que lon sloigne de la particule
centrale. Lamplitude de ces oscillations est une fonction croissante de la densit (ou dcroissante
de la temprature).
Avec un potentiel fortement rpulsif, mais fini, comme dans le cas du fluide de Lennard-Jones,
plutt quune rpulsion de cur dur (cest--dire une stricte exclusion strique courte distance), g(r) passe trs rapidement de zro une valeur maximale correspondant la distance des
particules proches voisines lorsque r augmente, mais sans discontinuit, comme on le voit sur la
figure 2.6.
Dans un solide cristallin, on peut galement dfinir une fonction de corrlation de paires g(r)
analogue, condition de moyenner (2) (r1 , r2 ) sur la position r1 et sur les orientations de r12 :
30
(b) =0,49
(a) =0,24
Fig. 2.5. Fonction de corrlation de paires dans le fluide de sphres dures pour deux valeurs de la fraction
volumique, la plus leve ( =0,49) correspondant la coexistence avec le cristal)
Fig. 2.6. Fonction de corrlation de paires de largon liquide au voisinage du point triple (rsultat
exprimental, cit dans [20])
g(r) =
1
42 |D|
Z Z
(2) (r, r + R(r, )) d dr,
D
(2.25)
R(r, ) dsignant ici le vecteur de norme r et dorientation S. Cette fonction est reprsente
sur la figure 2.7, pour un cristal cubique faces centres de sphres dures. Les pics correspondent
aux distances entre sites du rseau, et leur largeur est lie aux vibrations des atomes autour de
leur position moyenne.
Calcul de quantits moyennes
Un exemple dobservable dont on peut valuer la moyenne avec la fonction de corrlation de
paires est lnergie potentielle dun systme avec interactions de paires :
Z +
Ep = 2N
g(r)r2 V(r) dr,
0
tandis que lnergie cintique moyenne est daprs (2.6) gale 3N kB T /2. La pression, daprs (2.23)
(et en utilisant (2.6)), est donne par
31
Fig. 2.7. Fonction de corrlation de paires dans le cristal de sphres dures pour la compacit = 0,55.
2
P = kB T
(2.26)
Le premier terme de (2.26) est la pression du gaz parfait, dans lequel les molcules sont sans
interaction. Les dinteractions rpulsives, V 0 (r) < 0, tendent logiquement augmenter la pression,
et les interactions attractives, V 0 (r) > 0, la diminuer.
Facteur de structure
On dfinit aussi la fonction de structure (ou facteur de structure), fonction du vecteur donde k
(dont la dimension est linverse dune longueur), par
Z
S(k) = 1 +
[g(r) 1] exp(ik r)dr,
R3
lorsque |g(r)1| dcrot suffisamment vite vers zro. Le facteur de structure S(k) est la transforme
de Fourier de r=0 + (g(r) 1), cest--dire de la densit de paires avec rptition
(2) (r1 , r2 ) = (2) (r1 , r2 ) + (1) (r1 )(r2 r1 ).
(2.27)
r
0
sin(kr)
[g(r) 1] dr.
k
(2.28)
Cette dfinition concide avec (2.12). Le facteur de structure est directement accessible par des
techniques exprimentales de diffusion de rayonnement X ou de neutrons. Il vrifie
lim S(k) = kB T ,
k0
(2.29)
12. Les petites oscillations qui apparaissent sur le graphe aux faibles distances, l o g(r) devrait exactement sannuler, sont des artefacts du calcul numrique de la transforme de Fourier inverse dans (2.28).
32
Exercices
Exercice 2.1 (Invariants de la dynamique hamiltonienne). Montrer que la quantit de
mouvement totale est conserve si on prend des conditions de bord priodiques ou si le systme
nest pas confin, lorsque le potentiel dinteraction entre les particules est invariant par translation,
au sens o, pour tout r Rd ,
V (q1 , q2 , ...qN ) = V (q1 + r, q2 + r, ...qN + r).
Montrer que le moment cintique total nest pas conserv pour des conditions de bord priodiques,
mais quil lest si le systme nest pas confin, condition que le potentiel soit invariant par rotation,
au sens o, quelle que soit la rotation R SO3 (R),
V (q1 , q2 , ...qN ) = V (Rq1 , Rq2 , ...RqN ).
Dans les deux cas, on pourra commencer par traiter le cas simple dun potentiel de paire ne
dpendant que de la distance.
Exercice 2.2. On considre deux systmes hamiltoniens du type (2.2), constitu chacun du mme
nombre N de particules, avec le mme potentiel dinteraction. La masse des particules est m1 dans
le premier et m2 dans le second. Comparer les flots 1t et 2t correspondants. Deux tels systmes
peuvent tre, en pratique, lun de molcules de mthane CH4 , lautre de mthane deutri, CD4
(le deutrium est lisotope de lhydrogne comportant un neutron dans le noyau). Quen dduit-on
sur leurs proprits thermodynamiques ?
Exercice 2.3 (Cas des potentiels en puissance inverse). On considre la dynamique (2.2),
avec le potentiel dinteraction de paire des sphres molles , donn par (1.3).
(1) Quelle est la condition sur lexposant n pour que lnergie reste une grandeur extensive ?
(2) En gnral, dans un fluide, les grandeurs thermodynamiques et les moyennes des observables ne
dpendent que de la densit et de lnergie par particule, e = E/N . Montrer dans ce cas que
P/(kB T ), e/(kB T ) et, gnralement, toute observable sans dimension, ainsi que la fonction
de corrlation de paire fonction de la distance exprime en units de 1/3 , ne dpendent que
de la combinaison e3/n .
Pour les besoins de lexercice on dfinira la temprature T partir de lnergie cintique moyenne :
hEc i =
3
N kB T.
2
3
Postulat fondamental et ensemble microcanonique
34
34
35
37
38
38
39
40
40
41
42
43
43
44
45
48
55
56
59
Nous avons soulign au chapitre 2 la pertinence dune description statistique des fluctuations
des grandeurs observables associes au mouvement conservatif dune collection de particules en
interaction. La notion dquilibre thermodynamique, associe la stationnarit des processus modlisant lvolution dans le temps des observables dun systme isol, fait naturellement apparatre
un macrotat, qui est une mesure de probabilit sur lespace des phase E. Or, jusquici, nous ne
savons valuer que des moyennes sur une trajectoire (ce qui suppose un calcul numrique), au lieu
de moyennes densemble (en rfrence la notion d ensemble statistique voque au 2.4.3).
Le postulat fondamental sur lequel sest construite la physique statistique donne le macrotat
dquilibre, et permet de prdire directement certains rsultats sans passer par le calcul numrique.
De plus, cest partir de la description statistique, en termes de macrotats, que lon peut dfinir
les notions essentielles dentropie, de temprature et de transfert de chaleur, grandeurs dont les
valeurs macroscopiques ne sobtiennent pas en gnral par la moyenne dune observable approprie
(elles nont pas de sens pour un microtat).
Ce chapitre nonce ce postulat de base, et en donne certaines consquences immdiates ( 3.1).
Il rappelle ensuite comment on retrouve lentropie et la temprature ( 3.2), et enfin discute de
la mise en uvre numrique de la simulation par la technique de la dynamique molculaire, qui
34
consiste intgrer les quations du mouvement ( 3.3). On verra que le choix dun algorithme
appropri est dict par des considrations de stabilit, du fait de la ncessit dun chantillonnage
par intgration sur des temps trs longs.
H(Q, P) = E}
la sous-varit de E des tats dnergie gale E. Notons que les sous-varits {M(E), E R}
forment une partition disjointe de E, au sens o
[
E=
M(E), M(E) M(E 0 ) = si E 6= E 0 .
ER
Le postulat fondamental stipule que la sous-varit correspondant la valeur constante E de lnergie, est entirement explore par le systme dans son mouvement, et que le macrotat dquilibre
scrit
dM(E) (Q, P)
1
1
dNVE (Q, P) =
H(Q,P)E =
,
(3.1)
(N, V, E)
(N, V, E) |H(Q, P)|
dM(E) (Q, P) tant la mesure de Lebesgue induite sur la sous-varit M(E), et (N, V, E) une
constante de normalisation (de sorte que dNVE est bien une mesure de probabilit) :
Z
dM(E) (Q, P)
(N, V, E) =
.
M(E) |H(Q, P)|
Laire de lhypersurface M(E) dans E est appele fonction de partition microcanonique. On peut
comprendre la dfinition (3.1) comme la densit de probabilit uniforme par rapport la mesure
de Lebesgue dans le domaine compris entre les hypersurfaces M(E) et M(E + E), dans la limite
E 0. On dit traditionnellement que tous les microtats de mme nergie sont quiprobables .
Ainsi, le postulat fondamental revient faire lhypothse dergodicit suivante :
Ergodicit selon une trajectoire hamiltonienne
Hypothse 3.1. La moyenne par rapport la mesure microcanonique dune observable A sur
E est donne par
1
T + T
lim
A(t (Q0 , P0 )) dt =
0
(3.2)
o E = H(Q0 , P0 ), la mesure dNVE est donne par (3.1), et (t ) est le flot de la dynamique
hamiltonienne (2.2).
On ne peut montrer rigoureusement une telle galit que dans quelques cas (les systmes intgrables, i.e. qui peuvent tre rsolus analytiquement). En revanche, il existe des contre-exemples
simples cette proprit. . . qui montrent donc quil faut tre prudent, et ventuellement modifier la dfinition de la sous-varit explore M(E) en la sparant en ses diffrentes composantes
connexes (voir la Remarque 3.1).
35
(3.3)
1.4
1.2
Position
1.0
0.8
0.6
0.4
0.2
0.0
1.5
1.0
0.5
0.0
0.5
1.0
1.5
Energie
Fig. 3.1. Positions accessibles dans la surface dnergie H(q, p) = 0.6, pour le potentiel (3.3) avec h = 1
et une particule de masse m = 1. Noter quil y a deux composantes connexes et que si la dynamique
hamiltonienne est initialement dans une des composantes, elle y reste.
36
VN
N
X
p2i
.
2m
i=1
(n, R) =
n n/2 Rn1
,
(1 + n2 )
(3N,
2mE),
!
o on a not (n, R) laire de la sphre de rayon R dans Rn :
h3N N
(3.4)
(x) =
0
1
2 xx 2 exp(x) lorsque x +.
(N 1, V, E
(N, V, E)
p2
2m )
(3.5)
formule dans laquelle T (la temprature) est fixe par lnergie selon
E=
3
N kB T.
2
(3.6)
La densit (3.5) dfinit la distribution de Maxwell pour la quantit de mouvement dune particule.
On retrouve ainsi la formule (2.6) de la vitesse quadratique moyenne.
Cas des sphres dures
Dans le cas du modle de sphres dures, (3.1) nous donne directement aussi un rsultat duniformit de la probabilit dans la partie de lespace des configurations telle quaucune paire de
particules ne sinterpntre, la distribution des impulsions tant la mme que pour le gaz parfait.
37
Dans (3.4), il faut remplacer V N = |D|N par la mesure Q, sensiblement plus petite, du domaine
de DN dans lequel les sphres ne sinterpntrent pas. On a :
(N, V, E) =
Q
(3N,
2mE).
h3N N !
(3.7)
Q ' V N (1 4) ,
(3.8)
o la compacit dfinie par (2.7) fait intervenir le volume exclu 1 autour du centre de chaque
sphre.
Notons aussi quen raison de la factorisation (3.7) de la fonction de partition microcanonique,
la distribution de Maxwell pour les vitesses ou les impulsions sapplique directement aussi dans le
cas des sphres dures.
3.1.3 Distribution de Maxwell (cas gnral)
Pour un systme avec des interactions distance, lnergie totale E se partage entre nergie
cintique Ec dpendant de P et nergie potentielle Ep , dpendant de Q.
La distribution de Maxwell sapplique quelles que soient les interactions des particules, et nest
pas limite au gaz parfait. On verra au chapitre 4 que si on considre lensemble canonique, ce
rsultat est immdiat. Dans le cas microcanonique, on peut sen convaincre en notant quaussi
bien lnergie potentielle que lnergie cintique sont des variables extensives, sommes de multiples
contributions locales, et quelles fluctuent trs peu. Si on les considre comme fixes leurs valeurs
les plus probables, on est ramen au cas prcdent.
Remarquons galement, toujours dans la limite des grands systmes, lindpendance statistique
entre impulsions et positions des particules, et lindpendance entre diffrentes coordonnes de P.
Cette indpendance contraste avec les corrlations des positions des particules voisines, dcrites
en partie par la fonction de corrlation de paires introduite au 2.5.3.
Ordres de grandeur
Pour une temprature de lordre de 300 K, selon (3.5) ou (2.6), la vitesse totale en moyenne
quadratique
s
r
p2
3kB T
=
m2
m
est de lordre de 600 m/s pour la molcule deau H2 0 (masse molaire 18 g/mol), 500 m/s pour la
molcule dazote N2 (masse molaire 28 g/mol), 470 m/s pour la molcule doxygne O2 (masse
molaire 32 g/mol). 2
Limite classique de la mcanique quantique pour un ensemble de particules
Les phnomnes de petite chelle chappent la mcanique classique et doivent tre traits
par la physique quantique. Anticipant sur la seconde partie de ce cours, citons la fameuse relation
dindtermination de Heisenberg. Pour une particule donne, on ne saurait dterminer exactement
1. En fait le centre dune sphre est exclu de lintrieur de la sphre dont le rayon est , cest--dire le
diamtre dune sphre dure. Le volume exclu total est donc 4V si V est le volume du systme.
2. Ces valeurs leves des vitesses instantanes ne signifient pas que, dans un gaz ou un liquide, les
molcules parcourent rapidement des distances importantes. En effet, le mouvement des molcules, aprs
un certain temps doubli de la vitesse initiale, sous leffet des interactions, apparat comme erratique
et est bien dcrit comme un mouvement
brownien, de sorte que la distance parcourue pendant le temps
38
(3.11)
La longueur est de lordre dune fraction d pour les petites molcules (eau, azote, dioxyde
de carbone,. . . ) et les atomes (sauf lhydrogne). Comme elle varie en m1/2 et T 1/2 , il est
cohrent de ngliger les effets quantiques pour les noyaux atomiques et les molcules, sauf basse
temprature, ou densit trs leve (cas des toiles naines). Les lectrons, en revanche, doivent
tre traits par la mcanique quantique.
(3.12)
S
E
.
(3.13)
N,V
2e
,
3kB
3
N kB T,
2
(3.15)
39
rsultat que lon avait anticip avec les formules (2.6) et (3.6). Remplaant e par T dans (3.14),
lexpression de lentropie en fonction de la densit et de la temprature fait rapparatre la longueur
donde thermique :
5
S
= ln 3 .
(3.16)
N kB
2
3.2.2 Proprits de lentropie
Lentropie dfinie par (3.12) est bien, on peut le vrifier, celle de la thermodynamique macroscopique. Bien que le lien entre physique statistique microscopique et termodynamique macroscopique
classique soit assez peu dtaill dans ce cours (nous renvoyons aux rfrences [8, 23, 2, 25] pour
des prsentations plus dveloppes), nous indiquons ici quelques proprits fondamentales et utiles
de lentropie, en signalant au passage, lorsquil y a lieu, la cohrence avec la thermodynamique
macroscopique.
Extensivit de lentropie et robustesse du calcul
Lentropie du gaz parfait est extensive (i.e. proportionnelle N ). Il en est de mme, nous
ladmettrons, pour lentropie dun systme avec des interactions, la fonction de partition tant
domine par les termes exponentiels de lordre de exp(N ) avec une constante . Cette extensivit
entrane par (3.13) lintensivit de la temprature.
On peut considrer, pour justifier lextensivit de lentropie, un argument de dnombrement
de configurations accessibles. Soit un dcoupage dun systme macroscopique en p sous-systmes
identiques, identifis par le volume quils occupent ou bien par les particules quils contiennent
(comme dans le 2.4.2). Ils occupent chacun un volume V /p, et contiennent en moyenne N/p
particules et lnergie E/p. Si on nglige les interactions entre sous-systmes diffrents, ainsi que
les fluctuations de lnergie et du volume ou du nombre de particules dans un sous-systme (car elles
naffectent quune proportion ngligeable de lensemble des degrs de libert), on peut remplacer
(N, V, E) par [(N/p, V /p, E/p)]p . On en dduit que lentropie totale est proportionnelle p, et
donc N .
On notera quune erreur dun facteur N dans le calcul de (o est constant), erreur
norme si N est de lordre du nombre dAvogadro, est sans consquence sur le calcul de lentropie,
proportionnelle au logarithme de . De mme, on peut remplacer la surface {H(Q, P) = E}, dans
le calcul de , par le volume tout entier donn par {H(Q, P) E}, sans en affecter lvaluation
de la partie extensive (dominante) de lentropie. On le vrifiera en exercice dans le cas du gaz
parfait.
Enfin, la suppression du facteur h3N dans la mesure de lespace des phases dcale la valeur
de lentropie dune constante 3N ln h. Sans considration de mcanique quantique, lentropie dun
systme classique nest dtermine qu une constante prs.
Extensions de la dfinition
Sous la forme (3.12), lentropie nest dfinie a priori que pour le macrotat de lquilibre
microcanonique. Par extension, on a coutume dassocier une valeur de lentropie tous les
macrotats similaires,
cest--dire pour des mesures de Lebesgue induites sur des sous-varits
{(Q, P) E A1 (Q, P) = A01 , . . . , Ap (Q, P) = A0p }. Le plus souvent, les observables Ai ont un
sens macroscopique, et/ou sont associes certaines fractions macroscopiques du systme. On
crit S(N, V, E, A0 ) sans plus de prcision pour lentropie dun tel macrotat, en se fondant sur la
dfinition (3.12) de lentropie comme logarithme du volume dans lespace des phases. La dfinition
la plus gnrale de lentropie est celle de la thorie de linformation (voir le chapitre 4).
40
(3.17)
o A est un terme born par (N1 N2 )a (avec une certain a < + indpendant des Ni ) et E i
dsigne la valeur la plus probable de Ei . 3 Lnergie E 1 ralise donc le maximum du produit
1 (N1 , V1 , E 1 )2 (N2 , V2 , E E1 ), ou de son logarithme, qui nest autre que la somme des entropies
des deux sous-systmes. On a ainsi
S1 (N1 , V1 , E 1 ) S1 (N2 , V2 , E E 1 )
+
= 0,
E1
E2
cest--dire :
1
1
=
.
T1
T2
Lquilibre thermique (cest--dire lquilibre vis--vis des changes dnergie au moyen dun petit
hamiltonien de couplage) entre deux systmes impose lgalit de leurs tempratures. On retrouve
l une proprit caractristique de la temprature en thermodynamique.
3.2.4 Les drives de la fonction entropie
La dmarche conduisant la dfinition de la temprature, et tablissant lgalit des tempratures entre deux systmes changeant de lnergie par un faible couplage peut tre reproduite
pour le volume, ou bien encore pour le nombre de particules, pourvu que lon sen donne une
dfinition convenable, comme des observables. Leur point commun est dtre des grandeurs qui
se conservent dans les changes, de sorte que si deux sous-systmes changent du volume on a
V = V1 + V2 constant, et sils changent des particules cest N = N1 + N2 qui est constant.
Lorsquil sagit de deux parties dun mme corps, il est normal de considrer que de tels transferts
impliquent aussi des changes dnergie. En plus de lgalit des tempratures, la maximisation
de (3.17) par rapport au partage du volume, N1 et N2 constants, donne alors :
S1
S2
=
.
V1 N1 ,E1
V2 N2 ,E2
Si on identifie S lentropie de la thermodynamique macroscopique des fluides, on sait que
S
P
= ,
(3.18)
V N,E
T
o P est la pression. Lquilibre thermodynamique vis--vis des changes de volume conduit donc
lgalit des pressions, en plus de celle des tempratures. La formule (3.18), applique au gaz
parfait, dont lentropie est donne par (3.16), donne bien
P = kB T.
(3.19)
3. Cette valuation de partir des valeurs les plus probables des observables macroscopiques E1 et
E2 est similaire celle que lon a voque pour justifier la distribution de Maxwell pour les quantits
de mouvement dans le cas gnral : on avait alors argu que lon pouvait en permire approximation
considrer lnergie cintique et lnergie potentielle comme fixes.
41
Si on identifie plutt les deux systmes macroscopiques par leur localisation spatiale, fixant
exactement leurs volumes V1 et V2 mais autorisant des changes de particules, alors la maximisation
de lentropie totale donne lgalit des tempratures de des potentiels chimiques , car
S
= .
N V,E
T
Pour comprendre que la pression dfinie avec (3.18) est bien la pression habituelle, on peut
concevoir un dispositif idal (appel piston adiabatique dans la prsentation traditionnelle de
la thermodynamique) qui est une paroi sur laquelle on exerce une force constante, correspondant
une pression impose P , mais dpourvue dentropie. La maximisation de lentropie totale, alors
gale celle du systme, impose
S
S
S
P
dS(N, V, E P V )
E
=0=
+
=
.
dV
V E,N
E V,N V
V E,N T
Notons quen rcrivant les drives de lentropie values ci-dessus sous la forme
dE = T dS P dV,
on retrouve la dcomposition dune variation dnergie du systme en somme du travail W =
P dV et de la chaleur Q = dS
T reus. On reverra au passage ces notions dans le chapitre 4.
3.2.5 Entropie et fluctuations
Lentropie est jusquici calcule comme intgrale de la mesure microcanonique sur certains
ensembles, correspondant des valeurs imposes de certaines observables macroscopiques. Dans
ce calcul on peut considrer les observables macroscopiques extensives comme fixes leur valeur
la plus probable, dont le voisinage immdiat concentre la distribution de probabilit. En raffinant
lgrement ce calcul, on peut valuer la densit de probabilit dune telle variable A au voisinage
de sa valeur la plus probable A. Lentropie S(A) est maximale pour A = A, et on peut crire
S(A) = S(A)
ce qui correspond
1 2S
(A) (A A)2 ,
2 A2
1 2S
2
(A) exp
(A) (A A) ,
2kB A2
o la drive seconde est value pour A = A. La quantit A est donc distribue selon une loi
gaussienne de moyenne A et de variance
Var (A) =
2 (S/kB )
A2
1
.
Si A est extensive (A N ), alors on a bien Var (A) N , et donc Var (A) /N est intensive.
Lentropie S doit tre maximale pour la valeur A la plus probable de lobservable macroscopique
A, et donc sa drive seconde doit tre ngative. Dans le cas contraire, il se produirait une volution
spontane tendant augmenter lentropie, et ltat de dpart caractris par la valeur A serait
instable.
On peut raisonner de la mme faon avec p observables scalaires, formant un p-uplet (Ak )1kp .
On relie alors [23] les covariances de ces variables la matrice hessienne de lentropie. La stabilit
requiert quelle soit dfinie ngative.
42
S = Sc (E c ) + Sp (E p )
La capacit calorifique volume constant par particule cv se dcompose en une partie lie
(id)
lnergie cintique, cv (on note id pour idale , cest la valeur de cv dans le gaz parfait ou
(ex)
gaz idal) et une partie provenant de lnergie potentielle, que nous notons cv (pour en excs
(id)
E
relativement au gaz parfait). La valeur cv = N1 Tc = 32 kB tant connue, on peut rcrire :
(1/T )
2
=
et
Ec
3N kB T 2
1
(1/T )
1
=
= (ex)
.
3
Ep
(N cv 2 N kB )T 2
N cv T 2
N
k
T
)
,
c
B
3N kB T 2
2N cv 3N kB T 2
2
dont on dduit la formule cherche (2.21).
3.2.6 Discussion
On verra au chapitre 4 que la mesure canonique permet de remdier certains inconvnients de
lapproche microcanonique, lis la contrainte de lnergie totale fixe. En effet, cette contrainte
impose que la mesure dquilibre dans E est concentre sur une sous-varit. Il existe ainsi des corrlations entre les degrs de libert Q, P du systme mme lorsquils sont en principe indpendants,
cest--dire avec un Hamiltonien de la forme (2.17).
Bien que lon ait pu rapidement retrouver certaines notions de la thermodynamique macroscopique, des questions dapparence dlicate doivent tre souleves. Ce cours nentend nullement
clore des dbats anciens et complexes ce propos, et ces difficults connues nont pas empch le
dveloppement de la physique statistique et le succs des simulations numriques. On pourra se
reporter aux rfrences [2, 10, 25].
Ergodicit et degrs de liberts indpendants
Ainsi, prcisment dans le cas dun Hamiltonien prsentant une dcomposition selon (2.17), on
peut noter que le postulat fondamental est en toute rigueur injustifi. En fait, chacune des nergies
des sous-systmes est, en principe, une constante du mouvement, et lergodicit est manifestement
viole. Ainsi, chaque molcule dun gaz parfait devrait conserver indfiniment la mme quantit
de mouvement et la mme nergie cintique, et on voit bien mal comment sa vitesse pourrait
chantillonner la distribution de Maxwell au cours du temps...
Cest un dilemne classique de la physique statistique : avec des degrs de libert indpendants,
les moyennes selon les macrotats dquilibre se calculent aisment, mais le systme ne peut pas
se mettre lquilibre ! En pratique, on suppose que de trs faibles interactions existent, que lon
nglige lorsque lon crit le hamiltonien du systme, mais qui, long terme, parviennent en
thermaliser les diffrentes parties. Ainsi, dans le cas du gaz parfait, on admet loccurrence de rares
collisions entre les molcules.
43
Irrversibilit
Une autre classe de difficults, plus gnrale et plus srieuse, apparat lorsque lon cherche
retrouver la notion thermodynamique dirrversibilit, qui est associe laugmentation de lentropie de la thermodynamique. Nous avons invoqu une condition dentropie maximale en discutant,
par exemple, de la rpartition de lnergie entre deux systmes coupls. Par ailleurs, nous avons
dfini lentropie commme logarithme dun certain volume dans E (admettons que lon donne une
petite paisseur aux sous-varits sur lesquelles on concentre la mesure, quitte la faire tendre
vers zro par la suite). La dynamique hamiltonienne conserve les volumes dans E. Par consquent
lentropie, logarithme du volume sur lequel on rpartit uniformment la densit de probabilit,
est constante. Comment peut-on donc atteindre ltat dentropie maximale, si on part dun tat
dentropie infrieure, dans lequel, par exemple, deux parties macroscopiques du systme sont des
tempratures diffrentes ?
Une explication possible est rechercher dans lemploi de deux notions dentropie diffrentes,
une entropie microscopique lie aux dtails des mouvements dans lespace des phases, et une
entropie macroscopique, qui serait insensible aux dtails fins de la rpartition de la mesure dans E.
Si, t = 0, la mesure est uniforme dans un domaine rgulier A E, alors elle sera uniforme t > 0
dans t (A), qui est une partie de E de mme volume, mais, en raison du caractre chaotique de
la dynamique, de forme beaucoup plus complexe, avec des feuillets et des replis. De faon image,
si A est une boule pleine, alors t (A) ressemble davantage une boulette de papier froiss. Vue
grande chelle, on peut ainsi lui attribuer un volume plus grand, et on peut considrer que cest
un tel volume qui doit tre pris en compte pour valuer lentropie macroscopique. Ainsi, cette
dernire peut augmenter.
En thermodynamique, laugmentation de lentropie est associe lirrversibilit. Les transformations rversibles sont celles qui maintiennent constante lentropie dun systme isol.
44
(3.21)
g 0 (Q, P) =
2dN
q1
g1
q2dN
..
.
.
g2dN
...
q2dN
...
On montre alors
Thorme 3.1 (Symplecticit du flot hamiltonien). Soit H(Q, P) une fonction de C2 (U )
(U E ouvert). Alors, pour tout t fix tel que t existe, le flot t est une transformation symplectique.
Preuve. Soit le flot t de (3.20). On remarque tout dabord que
d t (y)
dt (y)
t (y)
=
=
J H(t (y)) = J 2 H(t (y))
.
dt
y
y
dt
y
y
Ainsi, notant : t 7
t (y)
, on a
y
d
(t)T J (t) = (t)T 2 H(t (y)) J T J (t) + (t)T 2 H(t (y)) J 2 (t) = 0,
dt
en utilisant J T = J. Ceci montre que (y)T J (y) = (0)T J (0) = J, ce qui permet de
u
conclure la symplecticit.
t
En fait, on peut mme montrer quune EDO est localement hamiltonienne si et seulement
si son flot est symplectique. La symplecticit permet de retrouver directement la proprit de
conservation du volume dans lespace des phases. En effet, si g est une application symplectique,
le dterminant de sa matrice jacobienne vaut 1 daprs (3.21). Cette conservation du volume explique de manire heuristique les bonnes proprits numriques de certains schmas dintgration :
en effet, les trajectoires partant du voisinage dun point ne peuvent pas diverger dans toutes les
directions, sans quoi, le volume balay dans lespace des phase augmenterait. La rversibilit en
temps est galement importante de ce point de vue : partant du voisinage dun mme point, si on
a divergence de toutes les trajectoires dans un sens du temps, on a convergence dans lautre. . . ce
qui est absurde !
3.3.2 Approximation et flot numrique
On cherche ici intgrer numriquement (2.2) (ou (3.20)), afin dobtenir des moyennes dobservables, ou bien des fonctions de corrlation dpendant du temps. Etant donn un pas de temps
t, une intgration numrique dune EDO
dy
= f (y).
dt
(3.22)
45
y n+1 = t (y n ).
y(tn+1 ) = y(tn ) +
(3.23)
Une approximation du flot t par un flot numrique t revient donc trouver une approximation
convenable de (3.23).
La convergence dune mthode numrique est souvent caractrise sur une trajectoire, i.e. pour
une condition initiale donne y 0 , et en intgrant sur un temps fix T . On va voir cependant que
la notion de convergence sur une trajectoire nest pas la bonne notion : on va lui prfrer la
convergence dun ensemble de trajectoires et la prservation des proprits particulires du flot
hamiltonien. On parlera ainsi dintgration numrique gomtrique pour caractriser les schmas
prservant des invariants particuliers de la dynamique hamiltonienne. En particulier, comme on
cherche chantillonner des sous-varit qui sont des surfaces de niveau du Hamiltonien, il est
important de bien prserver lnergie du systme au cours du temps, et ce, pour des temps trs
longs sans quoi la sous-varit chantillonne aura peu de rapport avec la sous-varit associe
la dynamique (2.5).
Avant de se lancer dans ltude des schmas numriques, prcisons tout dabord un critre
trs important en pratique : le cot de calcul. En dynamique molculaire, le principal cot dune
itration de la mthode numrique est lvaluation de la force V (q). On peut sen convaincre
aisment en prenant lexemple dun systme comme le fluide de Lennard-Jones, o, en labsence
dhypothse supplmentaires, le calcul des interactions demande deffectuer une boucle sur toutes
les paires de particules, ce qui reprsente un cot de calcul en O(N 2 ).
3.3.3 Schmas dintgration usuels pour les quations diffrentielles ordinaires
Comme les quations de Newton peuvent se mettre sous la forme dune EDO, on peut utiliser
tous les schmas dintgration usuels pour intgrer numriquement (3.20). Nous allons prsenter
successivement les schmas dEuler explicite et implicite, ainsi que des schmas plus fins tels que
les schmas de Runge-Kutta dordres 2 et 4. Ce dernier schma est gnralement un trs bon
schma, et constitue lalgorithme par dfaut de nombreux codes dintgration dEDO gnrales.
Ltude de ces schmas demande de considrer :
lordre des schmas numriques, qui traduit la prcision de la trajectoire calcule, et la
petitesse des erreurs dintgration locales ;
la stabilit (ventuellement la stabilit linraire), qui traduit la robustesse du schma par
rapport laccumulation des erreurs dintgration locales et darrondi.
Les notions dordre, de stabilit, et de stabilit linaire, sont rappeles dans lAppendice B. On
peut dores et dj sentir que la seconde notion, celle de stabilit, sera trs importante car on
souhaite calculer des moyennes sur de longues trajectoires, en chantillonnant correctement le
macrotat dquilibre microcanonique.
Remarque 3.3. Le lecteur prendra garde quil ny a pas de contradiction pour un schma numrique
tre la fois consistant (convergence trajectorielle temps dintgration T fix, dans la limite
t 0) et (linairement) instable (explosion de la norme pour T + t fix).
Remarque 3.4. Il est videmment souhaitable quun schma numrique soit (linairement) stable.
Ce nest toutefois pas une condition suffisante pour tre un bon schma en dynamique molculaire !
On souhaite en effet que le schma conserve bien lnergie du systme, et donc quil ne soit pas
dissipatif.
Schma dEuler explicite.
Le schma dEuler explicite scrit pour une EDO gnrale de la forme (3.22),
46
y n+1 = y n + tf (y n ).
Ceci correspond une approximation de lintgrale apparaissant dans (3.23) par une formule de
quadrature o lon nutilise que linformation lextrmit gauche de lintervalle en temps. Pour
les quations de Newton (2.5), cela conduit au schma
n+1
q
= q n + tM 1 pn ,
(3.24)
n+1
p
= pn tV (q n ).
On a ainsi
1
Euler
p, p tV (q) .
t (q, p) = q + tM
On vrifie facilement que le schma dEuler explicite est dordre 1 (voir lExample B.1). En
effet,
Z
t
Euler
f (y(s)) ds f (y(0))t
|y(t) t (y(0))| =
0
Z t
|f (y(s)) f (y(0))| ds
Z
0
t
avec (s) ]0, s[, en utilisant une ingalit des accroissement finis. On en dduit que la diffrence
entre la solution exacte intgre sur un pas de temps t et lapproximation numrique donne par
le schma est en O(t2 ), ce qui signifie en effet que le schma est dordre 1 (voir la Dfinition B.2).
Retenons galement de ce calcul que la vrification de lordre dun schma consiste en pratique
effectuer des dveloppements de Taylor, et tudier quels termes se compensent. On montre
galement facilement que le schma dEuler explicite est stable (au sens de la Dfinition B.3),
cest--dire robuste des erreurs darrondi et/ou sur les conditions initiales, condition dintgrer
sur un temps T fini et donn a priori. Finalement, ce schma est donc convergent, au sens de la
Dfinition B.4.
En revanche, le schma dEuler explicite est toujours linairement instable en temps long
(Rappelons que cette notion est dfinie au B.3). On peut sen convaincre facilement dans le cas
dune particule de masse 1 soumise au potentiel harmonique V (q) = 21 2 q 2 en dimension 1, auquel
cas on peut rcrire (3.24) sous la forme matricielle
n
q
y n+1 =
= A(t)y n
(3.25)
pn
avec
A(t) =
1
t
.
2 t 1
p
La matrice A(t) a pour valeurs propres = 1 it. Comme | | =
1 + 2 t2 > 1
si t > 0, on en dduit bien que le schma est inconditionnellement linairement instable. En
particulier, partant dune condition initiale (q 0 , p0 ) donne, on a divergence de lnergie :
H(q n , pn ) (1 + 2 t2 )n H(q 0 , p0 ) +
lorsque n +. Ainsi, on nchantillonne pas du tout la surface dnergie constante {H(q, p) =
H(q 0 , p0 )}. Lexprience numrique montre galement que lnergie diverge au cours du temps
pour des potentiels non-linaires gnraux.
47
n+1
Y
= y n + f (Y n ) t/2
n+2
Y
= y n + f (Y n+1 ) t/2
n+3
Y
= y n + f (Y n+2 ) t
et on pose alors
y n+1 = y n + t
(3.27)
Ce schma est dordre 4 (do son nom), et demande 4 valuations de la force par pas de temps.
Concernant la stabilit linaire, on a la formulation matricielle (3.25) avec
(t)2
(t)4
(t)2
+
t 1
1
2
24
6
.
A(t) =
2
2
(t)2
(t)4
(t)
1
+
t 1
6
2
24
4. Cest un bon exercice que de mener ce calcul...
48
(t)6
(t)8
+
.
72
576
Ceci montre que pour t > 0 assez petit (numriquement, t 2, 828427), on a | | < 1.
Ceci montre que le schma de Runge-Kutta dordre 4 est conditionnellement stable en temps long,
mais, en analogie avec le schma dEuler implicite, quil est galement dissipatif dans sa zone de
stabilit, et ne permet donc pas un chantillonnage correct de la sous-varit dnergie constante.
| | =
49
Ce rsultat est dnonc technique, et pose de fortes contraintes sur le systme. On a toutefois
des rsultats analogues sous des hypothses un peu plus faibles. Retenons cependant que ce genre
de rsultat mathmatique est peut-tre sous-optimal, au sens o on na jamais observ en pratique
une drive de lnergie pour un schma symplectique ! On motivera par la suite ce rsultat en
prsentant des rsultats lmentaires danalyse rtrograde. En anticipant, on peut dire que les
bonnes proprits des schmas symplectiques sont la consquence du fait quune nergie approche
est conserve de manire exacte, ce qui signifie que lnergie exacte est conserve de manire
approche.
Outre la notion de symplecticit, le flot hamiltonien jouit dautres proprits, en particulier la
rversibilit en temps, et la symtrie. Ces proprits sont galement importantes pour les schmas
numriques, et mmes suffisantes dans certains cas pour assurer le bon comportement en temps
long. 6
Dfinition 3.3 (Rversibilit en temps dun schma numrique). Dfinissant loprateur
de rversibilit en temps S par S(q, p) = (q, p), on dit quun schma numrique est rversible en
temps si
S t = t S.
Cette proprit est satisfaite pour la grande majorit des schmas numriques associs (2.5),
et en tout cas, tous les schmas que nous allons rencontrer satisfont cette proprit, et ne savre
donc pas tre une proprit discriminante. Ceci nest pas le cas pour la symtrie en temps :
Dfinition 3.4 (Symtrie dun schma numrique). On dit quun schma numrique est
symtrique lorsque
t t = Id.
On vrifie facilement quaucun schma du 3.3.3 ne vrifie cette condition (voir Exercice 3.2).
En revanche le flot hamiltonien vrifie ces deux proprits (la symtrique provenant du fait que le
flot hamiltonien est un groupe).
Exemple 3.1. Vrifions titre dexemple que le schma dEuler explicite est rversible en temps
mais pas symtrique. Rappelons que
1
p, p tV (q) .
Euler
t (q, p) = q + tM
On a ainsi
1
Euler
p, p tV (q) = S q tM 1 p, p + tV (q) = S Euler
t (q, p) = q tM
t (q, p) ,
ce qui montre la rversibilit en temps. En revanche,
Euler
Euler
1
Euler
p, p tV (q)
t t (q, p) = t q + tM
= q + t2 M 1 V (q)p + t(V (q + tM 1 p) V (q))
= (q, p) + O(t2 ),
6. Attention, il existe des schmas symtriques qui ne sont pas symplectiques, et des schmas symplectiques qui ne sont pas symtriques. . . On pourra se reporter au chapitre XI de [19] pour ltude des
proprits des schmas rversibles en temps : on montre que, pour des systmes compltement intgrables
ou quasi-intgrables, la symtrie suffit assurer la conservation des invariants sur des temps exponentiellement longs.
50
On utilise alors une formule de Lie-Trotter. 7 Une approximation numrique de (2.5) obtenue par
cette mthode de dcomposition est par exemple
(q n+1 , pn+1 ) = 2t 1t (q n , pn ).
Les applications 2t , 1t sont symplectiques pour tout temps t car ce sont les flots de dynamiques
hamiltoniennes. Par ailleurs, on vrifie facilement par une formule de drivation des applications
composes que la composition de deux applications symplectiques est encore symplectique. Plus
explicitement, on obtient le schma dit "Euler symplectique A"
n+1
q
= q n + tM 1 pn ,
(3.28)
n+1
p
= pn tV (q n+1 ).
Si on compose les flots dans lautre sens, on obtient encore un schma symplectique, dit "Euler
symplectique B"
n+1
q
= q n + tM 1 pn+1 ,
(3.29)
n+1
p
= pn tV (q n ).
Ces deux schmas sont tous deux explicites et dordre 1, rversibles mais pas symtriques.
Pour ltude de la stabilit linaire, on considre nouveau loscillateur harmonique avec m = 1.
Dans ce cas particulier, on a la formulation matricielle (3.25) avec respectivement
1
t
1 (t)2 t
AEuler A (t) =
,
A
(t)
=
.
(3.30)
Euler B
2 t 1 (t)2
2 t
1
Les valeurs propres de ces matrices sont
(t)2
= 1
it
2
r
1
(t)2
.
4
On a donc bien | | = 1 condition que t < 2. Ceci montre que les schmas dEuler symplectique sont conditionellement linairement stables en temps long. Comme les valeurs propres sont
de module 1, on sattend heuristiquement ce quil ny ait pas de drive de lnergie dans un sens
ou dans lautre.
Remarque 3.5. Insistons sur limportance de la condition de stabilit linaire en temps long t <
2. Cette condition montre que sil existe des frquences hautes dans le systme, le pas de temps
dintgration devra tre trs petit ! La trs bonne stabilit des schmas et la conservation de
lnergie sur des temps longs vient donc avec une contrainte sur le pas de temps maximal que lon
peut utiliser...
7. Avec des mots simples (ou pour ceux qui ont jou au serpent sur leur portable) : pour faire un pas en
diagonale, on fait un pas sur le ct et un pas tout droit. . . Cest lexemple le plus simple de dcomposition.
51
Schma de Strmer-Verlet.
Le schma de Strmer-Verlet est le schma le plus utilis en pratique pour lintgration des
quations (2.5). Il a t dcouvert et redcouvert plusieurs fois au cours du temps, en particulier
par Strmer (1907) en astronomie, et par Verlet (1967) en dynamique molculaire. Mais, comme la
remarqu Feynman, on en trouve dj des traces chez Newton (1687) ! Une trs bonne introduction
sur lhistorique de ce schma est donne dans [18].
La procdure conduisant lobtention des schmas dEuler symplectiques est quelque peu
arbitraire, dans la mesure o il faut dcider dun certain ordre dans la composition. On peut
symtriser cette opration par la composition
t = 2t/2 1t 2t/2 ,
qui conduit au schma de Strmer-Verlet :
Algorithme de Strmer-Verlet
n+1/2
V (q n ),
= pn
p
2
Partant dune configuration initiale (q 0 , p0 ),
q n+1 = q n + tM 1 pn+1/2 ,
On vrifie que ce schma est dordre 2 et quil est symtrique, alors que les schmas dEuler
symplectiques A et B ne le sont pas. Lintrt de la symtrisation est quon peut gagner un ordre
de prcision, en naugmentant pas le nombre dvaluations totales de la force (quitte stocker les
forces calcules au pas prcdent pour la premire mise jour des vitesses sur un demi-pas de
temps).
Concernant la stabilit linaire en temps long, on a, toujours dans le cas de loscillateur harmonique avec des particules de masse m = 1, la formulation matricielle (3.25) avec
(t)2
1
t
2
B (t/2) =
(t)2
(t)2 ,
2
t 1
1
4
2
o AEuler A , AEuler B sont donnes par (3.30). On montre facilement que les valeurs propres de
A(t) sont toutes deux de module 1 si et seulement si t < 2.
Remarque 3.6 (Formulation sans les impulsions). Un calcul simple montre que la solution de (3.31)
vrifie
q n+1 2q n + q n1
M
= V (q n ).
t2
On reconnat ainsi une dicrtisation par diffrences finies centres de lquation du mouvement
M q = V (q).
Finalement, le schma de Strmer-Verlet peut tre construit trs simplement ! En revanche, cette
construction simple ne permet pas de mettre en vidence les proprits structurelles profondes du
schma numrique, et il serait difficile de montrer que lnergie est prserve de manire approche
sur des temps longs avec cette manire de faire.
52
Remarque 3.7 (Algorithme de Verlet gnralis). Dans le cas o le Hamiltonien nest pas sous la
forme sparable (2.1), la dynamique hamiltonienne scrit en gnral
(
q(t)
= p H(q, p),
p(t)
= q H(q, p).
Dans ce cas, le schma de Verlet est
q H(pn+1/2 , q n ),
pn+1/2 = pn
2 h
i
t
q n+1 = q n +
p H(pn+1/2 , q n ) + p H(pn+1/2 , q n+1 ) ,
(y n )T C(t)y n = (y 0 )T C(t)y 0 ,
(t)2
2
C(t) =
4
0
0
1
Ht (q n , pn ) = Ht (q 0 , p0 ),
o le Hamiltonien modifi
Ht (q, p) = H(q, p) (t)2 q 2 /4.
Ainsi, on a bien conservation exacte dune nergie approche O(t2 ) prs, ce qui conduit au
final une conservation de lnergie exacte O(t2 ) pour tout temps.
Elments danalyse rtrograde
Rappelons que lide originale de lanalyse rtrograde est dinterprter le schma numrique
comme la solution exacte dun problme modifi (au lieu de linterprtation usuelle en tant que
solution approche dun problme exact). Cest un rsultat profond de la thorie de lintgration
gomtrique que le systme hamiltonien modifi est encore hamiltonien... Ainsi, le schma numrique conserve bien une nergie approche, ce qui permet de montrer quil conserve de manire
approche lnergie exacte. On a vu un tel rsultat dans le cas de loscillateur harmonique, mais
comment gnraliser ce rsultat ?
La manire de procder est dcrire un dveloppement du flot modifi en puissances de t.
Considrons la dynamique
y(t)
= f (y(t)),
(3.32)
53
t2
F2 (y) + . . . .
2
Il sagit donc de chercher F1 tel que t soit une approximation dordre 2 de t . Pour ce faire, on
dveloppe la solution de (3.33) selon
t2
z(0) + . . .
2
t2 0
= z(0) + t[f (z(0)) + tF1 (z(0)) + . . . ] +
f (z(0))z(0)
2 t
1
= z(0) + tf (z(0)) + t2 f 0 (z(0))f (z(0)) + F1 (z(0)) + O(t3 ).
2
Ainsi,
t (z) t (y) = O(t3 )
si on choisit
1
F1 (y) = f 0 (y)f (y).
2
Ceci montre que le schma dEuler est une approximation dordre 2 de la dynamique
y(t)
= f (y(t))
t 0
f (y(t))f (y(t)).
2
On peut itrer cette construction pour construire une dynamique modifie qui dont le flot est
dordre arbitrairement proche du flot du schma numrique. 8
Dans le cas o la dynamique exacte (3.32) est hamiltonienne, le terme correctif est
1
1
0
M 1
M 1 q V (q)
M 1 p
tF1 (y) =
=
.
q V (q)
2 2q V (q) 0
2 2q V (q) M 1 p
On ne peut pas rcrire ce terme comme drivant dun Hamiltonien selon
p H1 (q, p)
F1 (q, p) =
.
q H1 (q, p)
Si cela tait possible, on aurait
F1 (q, p) =
F11 (q, p)
,
F12 (q, p)
q F11 + p F12 = 0,
ce qui nest pas le cas. Ceci montre que le systme modifi nest pas de type hamiltonien.
8. En fait, on a omis de prciser la constante qui apparait dans le terme O(t3 ) ci-dessus. Une analyse fine montrerait que cette constante diverge avec laugmentation de lordre, et on ne peut donc pas
atteindre un ordre quelconque si facilement... En fait, on ne peut pas crire en gnral ft comme une
srie convergente en puissances de t.
54
1 T 1
p M q V (q).
2
Dans ce cas, la dynamique modifie est encore hamiltonienne, et est associe au Hamiltonien
H1 (q, p) =
2.0
1.9
Energie
1.8
1.7
1.6
1.5
1.4
1.3
0
10
Temps
Fig. 3.2. Evolution temporelle de H et de H t (ligne plus forte) pour le potentiel double-puits, pour
le schma dEuler symplectique avec un pas de temps t = 0, 05. Notons que les variations de H t sont
plus faibles que celles de H.
55
13
12
14
11
13
10
12
log(erreur)
log(erreur)
11
10
8
7
6
9
5
8
4
3
2
6
0.8
1.0
1.2
1.4
1.6
1.8
2.0
2.2
2.4
2.6
2.8
0.5
3.0
1.0
1.5
2.0
2.5
3.0
3.5
4.0
4.5
5.0
5.5
6.0
log(dt)
log(dt)
Fig. 3.3. gauche : trac de log(eT (t)) en fonction de log(t) pour le schma de Runge-Kutta
dordre 4 dans le cas de loscillateur harmonique. droite : cas du schma de Strmer-Verlet.
1.5
1.0
1.0
0.8
Energie
impulsion
0.5
0.0
0.4
0.5
0.2
1.0
1.5
1.5
0.6
0.0
1.0
0.5
0.0
position
0.5
1.0
1.5
50
100
150
200
250
300
350
400
Temps
Fig. 3.4. Intgration en temps long du potentiel double puits par une mthode de Runge-Kutta dordre 4.
On compare ensuite une intgration sur un temps assez long (T = 400) de la dynamique
hamiltonienne pour une particule de masse m = 1 dans le potentiel double puits (3.3), pour h = 1
et t = 0, 2, partant de (q, p) = (0, 1). Les figures 3.4 et 3.5 prsentent les rsultats obtenus pour le
schma de Runge-Kutta dordre 4 et de Strmer-Verlet, respectivement. On voit que dans le cas du
schma de Verlet, lenergie oscille autour de lnergie initiale E = 1, et le portrait de phase montre
que la trajectoire numrique est localise autour de la sous-varit des configurations dnergie
gale 1 (on peut le voir en traant une trajectoire de rfrence avec un pas dintgration trs
petit). En revanche, le schma de Runge-Kutta dordre 4, quoique plus prcis, a un comportement
en temps long moins bon du fait de sa dissipativit. La trajectoire numrique est rapidement pige
dans le puits de gauche, et lnergie dcrot au cours du temps.
9. Cest dailleurs pour cela quon se limite des pas de temps plus grands que 104 , car dans ce cas,
lerreur est de lordre de 1016 , soit la prcision machine...
56
1.5
1.0
1.0
0.8
Energie
impulsion
0.5
0.0
0.4
0.5
0.2
1.0
1.5
1.5
0.6
0.0
1.0
0.5
0.0
0.5
1.0
1.5
position
50
100
150
200
250
300
350
400
Temps
Fig. 3.5. Intgration en temps long du potentiel double puits par le schma de Strmer-Verlet.
En conclusion, on voit bien que la notion dordre local, lie une convergence trajectorielle
en temps court, nest pas la plus pertinente dans le contexte de la dynamique molculaire, o
on cherche calculer des moyennes en temps long selon lhypothse dergodicit du postulat
fondamental.
3.3.6 Application un systme physique
Adimensionnalisation et choix du pas de temps
Il est commode de mettre en uvre les algorithmes prcdents dans un code en travaillant
en units rduites, ne serait-ce quafin de manipuler des nombres qui ne soient ni trop petits, ni
trop grands, ou de vrifier plus rapidement les ordres de grandeurs des rsultats (si on obtient une
quantit moyenne de lordre de 1020 en units rduites, il faut sinquiter). On peut galement se
servir plusieurs fois du mme calcul pour obtenir des rsultats sur des systmes diffrents (dcrits
par les mmes fonctions potentielles, mais avec des paramtres diffrents !). On considre :
lunit de masse m, par exemple la masse de la fraction majoritaire des atomes simuls ;
lunit dnergie, donne par le minimum du potentiel dinteraction liant typique entre deux
molcules (par exemple, pour le potentiel de Lennard-Jones (1.4)) ;
lunit de longueur l, donne par la distance dinteraction typique (par exemple, la distance 21/6 entre deux molcules lies par le potentiel de Lennard-Jones).
On en dduit des units drives, comme lunit de temps t0 . Pour ce faire, on crit que lnergie
cintique typique est en m(/t0 )2 , et donc t0 (m/)1/2 .
Pour un fluide ou solide dargon, de masse molaire M = 39, 95 g/mol, les interactions entre les
atomes sont donnes par le potentiel de Lennard-Jones (1.4), avec comme paramtres /kB = 120 K
et = 3,405 . On en dduit que lunit de masse est m = 6, 64 1026 kg, lunit de longueur
est l = 21/6 = 3, 82 , et donc lunit de temps t0 = 2, 42 1012 s.
Le pas de temps est choisi suffisamment petit pour que lintgration numrique soit stable
sur des temps longs, mais suffisamment grand pour que lon puisse effectivement intgrer sur des
temps longs. En pratique, il est bon de calculer la frquence fondamentale du systme, note ,
et de choisir t tel que t < 2, typiquement, t 0, 1. Pour le potentiel de Lennard-Jones
utilis pour largon, une frquence fondamentale peut tre obtenue par un dveloppement limit
au voisinage de la position dquilibre : 2 = V 00 ()/m, soit 2, 93 1013 s1 . Notons que la
connaissance de la frquence fondamentale permet galement de dduire un temps caractristique
dvolution du problme.
57
Systme de Lennard-Jones
On prsente un cas test rel : un fluide ou un solide dargon. En pratique, on utilise un potentiel
de Lennard-Jones tronqu 10 un certain rayon de coupure rc , typiquement rc 2, 5 3. On
considre ensuite un domaine de simulation de la forme [0, L]3 , avec L > 2rc (sinon, lutilisation
de conditions de bord priodiques na aucun sens, voir Remarque 2.1).
7.0983e21
2.0e21
7.0984e21
0.0e+00
Energie (J)
7.0985e21
7.0986e21
7.0987e21
2.0e21
4.0e21
6.0e21
7.0988e21
8.0e21
7.0989e21
1.0e20
7.0990e21
0.0
0.5
1.0
1.5
2.0
2.5
3.0
3.5
4.0
4.5
5.0
0.0
0.5
1.0
1.5
2.0
2.5
Time (ps)
3.0
3.5
4.0
4.5
5.0
Time (ps)
Fig. 3.6. Gauche : volution de lnergie moyenne par particule pour un solide dargon en structure CFC
la densit = 1456 kg/m3 , pour des vitesses tires initialement selon une maxwellienne une temprature Tinit = 180 K. Droite : volutions conjointes de lnergie totale (ligne pleine), lnergie cintique
(courbe du haut en traits interrompus) et de lnergie potentielle (courbe du bas en traits interrompus).
Il est commode de rpartir initialement les atomes selon un rseau rgulier, par exemple cubique
face centres (CFC) pour des solides, ou cubique simple si on veut simuler un fluide. En effet, cette
dernire structure est moins stable, et est donc plus facile faire fondre. Le paramtre important
est la taille a de la cellule lmentaire du rseau cristallin. Dans lexemple des figures 3.6 et 3.7,
on a considr un cube de 512 cellules lmentaires, pour un rseau CFC de paramtre a =
4, 5 (soit 1024 particules). On tire ensuite des vitesses selon une distribution de Maxwell une
certaine temprature Tinit , et on intgre la dynamique hamiltonienne avec un schma de StrmerVerlet avec un pas de temps t = 5 1015 s, utilisant un rayon de coupure rc = 9 .
200
50
180
0
140
Pression (MPa)
160
120
100
80
50
100
60
40
150
20
0
0.0
0.5
1.0
1.5
2.0
2.5
3.0
Temps (ps)
3.5
4.0
4.5
5.0
0.0
0.5
1.0
1.5
2.0
2.5
3.0
3.5
4.0
4.5
5.0
Temps (ps)
Fig. 3.7. Mmes paramtres que pour la figure 3.6. Gauche : volution de la temprature cintique en
fonction du temps. Droite : pression instantane.
10. Idalement, cette troncature seffectue de manire ce que le potentiel reste C1 (]0, +[), par le biais
dune spline dans un domaine [rmod , rc ]. Mais tous les codes ne font pas les choses aussi proprement, et
souvent on tronque brutalement le potentiel. . .
58
0.0040
0.0030
0.0035
0.0025
Densit de probabilit
Densit de probabilit
0.0030
0.0025
0.0020
0.0015
0.0020
0.0015
0.0010
0.0010
0.0005
0.0005
0.0000
600
400
200
200
400
600
0.0000
600
400
200
200
400
600
Fig. 3.8. Distribution des vitesses vz au temps t = 5 1014 s pour les mmes conditions que pour
la figure 3.6. Gauche : N = 1296 atomes. Droite : N = 16000 atomes. La courbe en ligne pleine est la
maxwellienne de mme variance que la distribution empirique des vitesses.
On montre en figure 3.6 que lnergie est bien conserve pour le pas de temps choisi (erreur
de lordre de 0,01%). On voit galement que les diffrentes composantes de lnergie squilibrent
rapidement pour se stabiliser vers des valeurs peu prs constantes. La figure 3.7 prsente lvolution de la temprature cintique et de la pression en fonction du temps. Il faut moyenner ces
quantits sur la trajectoire pour obtenir une approximation des moyennes densemble (voir le 5.3
pour plus de prcisions sur le calcul des barres derreur et les tests de convergence). Enfin, la
figure 3.8 prsente des distributions de vitesses un instant donn. Comme on sy attendait, cette
distribution des vitesses est bien approche par une distribution de Maxwell, et ce, dautant mieux
que le nombre datomes simuls est grand.
59
Exercices
Exercice 3.1. Vrifier que les schmas de Runge-Kutta (3.27) et le schma de Strmer-Verlet (3.31)
sont respectivement dordres 2 et 4.
Exercice 3.2. Montrer que tous les schmas numriques de ce chapitre sont rversibles en temps,
mais que seul le schma de Verlet est symtrique.
Exercice 3.3. Montrer que, dans le cas dun oscillateur harmonique, les schmas dEuler symplectiques prservent exactement lnergie un terme O(t) prs.
Exercice 3.4. Montrer que la composition de schmas symplectiques est encore symplectique.
Exercice 3.5. On change de coordonnes dans lespace des phases : les qi , pi sont remplacs par
les q0i = fi (Q, P), et les p0i = gi (Q, P), les fi , gi dfinissant un diffomorphisme rgulier dans E, et
telle que les quations de Hamilton dcrivent lvolution des nouvelles variables avec le hamiltonien
H 0 (Q0 , P0 ) = H(Q, P). Montrer que le jacobien de ce changement de variables vaut 1. On pourra
montrer pour ce faire quon a en fait une transformation symplectique.
Exercice 3.6. On considre une collection de N oscillateurs harmoniques identiques, dans un
espace de dimension 1 pour simplifier. Le Hamiltonien du systme scrit :
H(q, p) =
N
X
1 p2
i
i=1
2m
1
+ Kqi2 .
2
4
Lensemble canonique
Le recours lensemble canonique, reprsentatif dun systme dont les changes avec le milieu
extrieur sont des transferts dnergie avec un thermostat, est motiv par le manque de commodit
dutilisation de la mesure microcanonique, et aussi par la proximit avec lexprience : il est
beaucoup plus pertinent de modliser les objets physiques de notre univers quotidien en considrant
que leur temprature est fixe, plutt que leur nergie totale.
61
61
62
64
64
64
65
65
67
67
67
68
68
70
70
70
72
62
4 Lensemble canonique
produit des fonctions de partitions revenant chacun, et cette factorisation correspond lvaluation de lentropie totale comme somme des entropies des deux systmes (voir (3.17)).
Nous nous replaons ici dans ce cadre, et supposons que le second systme, que lon appelle
thermostat, est trs grand, de sorte que son couplage avec le premier, qui est le systme physique
que lon souhaite tudier (et que lon lappellera simplement le systme dornavant), naffecte
son tat que de faon ngligeable. Les variations dentropie du thermostat seront alors traites au
premier ordre dans les variations de son nergie. Ainsi, quelle que soit la valeur de E, on crit
pour lentropie du thermostat, en vertu de la dfinition (3.13) de la temprature :
E
,
T
S0 dsignant lentropie du thermostat lorsquil prend toute lnergie disponible, et T sa temprature. une constante additive prs, lentropie totale vaut donc S(N, V, E) E
T . On obtient ainsi
la densit de probabilit p(E) dune valeur donne de lnergie du systme par (3.12) :
E
p(E) exp
.
kB T
Sth = S0
(4.1)
(4.2)
(4.3)
Le macrotat dquilibre est donc dduit ici de lapproche microcanonique pour la runion du
systme avec le thermostat. La mesure de Botzmann-Gibbs sur E quil dfinit savre trs commode
dutilisation. Dans la pratique on peut effectivement vrifier que le macrotat dquilibre dune
petite partie macroscopique dun grand systme, si son volume et le nombre de particules quelle
contient sont fixs, est bien dcrit par cette distribution.
4.1.2 Distribution de Boltzmann-Gibbs et information manquante
Entropie et dfaut dinformation
Dans lapproche de la thorie de linformation 1 lentropie est dfinie, vis--vis dun observateur,
comme le manque dinformation sur le systme observ. On dfinit ainsi lentropie S [N ] dun
macrotat possdant une densit N par rapport la mesure 0 par
1. On trouvera dans la rfrence [2] une prsentation claire et dtaille de cette approche. En revanche,
la rfrence [25] vite dy avoir recours, en raison du rle quelle fait jouer un observateur humain, et
dfinit lentropie comme ( la constante kB prs) logarithme du volume despace de phases explor par
le systme dans son mouvement .
63
Z
S [N ] = kB
(4.4)
La dtermination du macrotat dentropie maximale est alors motive par lexploitation de linformation disponible sans introduire de choix ou de biais injustifi.
La dfinition (4.4) se justifie dabord pour les distributions de probabilits discrtes, auquel
cas on a affaire lentropie de la thorie de linformation (ou entropie de Shannon)
X
S = kB
pi ln pi .
(4.5)
i
On prend ensuite une limite continue, le choix de la mesure 0 dans E tant naturel car cest
une mesure invariante pour la dynamique hamiltonienne. Pour motiver la dfinition (4.5), on
peut montrer (voir par exemple [2]) quelle est compatible avec les proprits de base que lon
doit attribuer une fonction des pi ayant le sens du manque dinformation, ou de linformation
moyenne acquise par lobservation de lun des vnements discrets possibles. La proprit essentielle
est ladditivit, qui exprime quune information acquise en deux temps, correspondant par exemple
deux niveaux de prcision des observations, est la somme de linformation acquise lors de ltape
grossire et de linformation moyenne acquise lors de ltape la plus fine. Une autre proprit est
que lentropie doit tre maximale lorsque tous les vnements sont quiprobables. La constante kB
fixe conventionnellement lunit dinformation.
La dfinition (4.4) gnralise celle que nous avons utilise au chapitre 3, avec laquelle elle
concide lorsque les macrotats possdent une densit uniforme par rapport la mesure 0 dans
A E de mesure positive finie. En effet, on a alors
Z
1
1
S = kB
ln
d0 = kB ln 0 (A).
0 (A)
A 0 (A)
Maximisation sous contrainte
Faisons lhypothse que lnergie du systme tudi est connue en moyenne, cest--dire que la
valeur de
Z
hHi =
N (Q, P)H(Q, P) d0
(4.6)
E
(4.7)
conduit la condition doptimalit suivante, qui doit tre satisfaite pour toute variation N
de N :
Z
Z
Z
(ln N (Q, P) + 1)N (Q, P) d0 + H(Q, P)N (Q, P) d0 + N (Q, P) d0 = 0,
E
64
4 Lensemble canonique
(4.8)
On peut remarquer que dans la premire approche que nous avons employe pour obtenir la
distribution de Botzmann-Gibbs ( 4.1.1), lentropie du systme tudi se confondait avec lentropie
microcanonique correspondant la valeur la plus probable de lnergie du systme. Ceci entrane
une lgre diffrence pour lnergie libre F , qui disparat dans la limite N +. Dans la pratique,
on utilisera la formule (4.8), et on gardera donc la seconde dfinition de lentropie ( 4.1.2), qui
est la plus gnrale.
4.2.2 Drives de lnergie libre
Les drives de lnergie libre par rapport ses variables naturelles V et T se dduisent des
drives de lnergie interne, ou de lentropie. On a ainsi :
F
E
S
E
S
S
=
ST
=
ST
= S,
(4.9)
T V
T V
T V
S V T V
T V
tandis que
F
E
S
E
E
S
S
=
T
=
+
T
= P.
V T
V T
V T
V S
S V V T
V T
(4.10)
65
E
F
= ,
T
T
T dsignant ici la temprature du thermostat. Il faut donc minimiser lnergie libre (la temprature
tant fixe).
Une application est lquilibre des phases (comme dans les rgions de coexistence des diagrammes de phase des figures 1.3a et 1.4). Deux phases en quilibre sont la mme temprature,
et elles peuvent changer, en plus de la chaleur, du volume et des particules. On a donc galit des
potentiels chimiques et galit des pressions. Pour chaque phase, le potentiel chimique peut tre
pris comme fonction de la densit et de la temprature, ou bien de la pression et de la temprature.
Les indices se rapportant aux deux phases en prsence, on a ainsi la condition
1 (P, T ) = 2 (P, T ),
qui dtermine la ligne de coexistence dans le plan P, T (comme sur la figure 1.3b).
Une autre consquence remarquable de la minimisation de lnergie libre est la comptition
entre nergie et entropie. basse temprature, cest lnergie E qui tend dominer dans lnergie
libre F = E T S. Minimiser lnergie libre, cest alors essentiellement minimiser lnergie. Pour les
systmes usuels composs dun grand nombre de particules, lnergie potentielle est souvent minimale pour des configurations ordonnes basse temprature. Cest lune des raisons pour lesquelles
la phase stable est cristalline basse temprature 4 Des considrations entropiques entrent quand
mme en jeu cependant, et elles peuvent mme dterminer le changement de phase, commme on
la voqu au chapitre 1. En revanche, haute temprature, le terme entropique devient prpondrant, et minimiser lnergie libre revient alors maximiser lentropie. Cest en phase gazeuse et
non dans les phases condenses liquide ou solide 5 que lentropie est la plus grande, parce que les
particules accdent un domaine beaucoup plus tendu.
4.2.4 Calculs avec la fonction de partition
la diffrence de la fonction de partition microcanonique (N, V, E), la fonction de partition
canonique Z, fonction de (N, V, T ), permet des calculs commodes.
Drivation par rapport la temprature
La drive de la fonction de partition par rapport est
Z
Z
= H(Q, P) exp[H(Q, P)]d0 .
E
Comme
hHi =
1
Z
Z
E
4. .
5. On considre ici implicitement un systme maintenu dans une enceinte de volume constant, et dont le
volume est assez grand pour permettre le changement de phase entre liquide et vapeur. basse temprature
il y a condensation et on observe un quilibre liquide-vapeur ou solide-vapeur. Ce sont dans les conditions
isothermes et isobares auquel cas il faut minimiser lenthalpie libre G(N, P, T ) = F + P V , galement
appele nergie libre de Gibbs que lon a une seule phase.
66
4 Lensemble canonique
on a alors
E = hHi =
ln Z
.
(4.11)
2 ln Z
hHi
2
= H 2 hHi = Var (H) =
,
2
ce qui tablit la formule (2.19) pour la capacit calorifique volume constant par particule cv :
Var (H)
1 E
=
cv =
.
N T V
N kB T 2
Drivation par rapport un paramtre du Hamiltonien
Supposons que le Hamiltonien dpende dun certain paramtre . Par exemple, des forces
extrieures sont appliques sur les particules, et apparat dans lexpression du champ de force
correspondant. On a donc un Hamiltonien H H(, q). Un calcul analogue (4.11) donne alors :
F
H
=
,
(4.12)
T
o la notation hi renvoie une moyenne canonique pour la mesure Z1 eH(,q) . Une action
extrieure sur le systme entrane une variation de lnergie des microtats, gale au travail des
forces extrieures. La relation (4.12) signifie donc que la variation dnergie libre dun systme
coupl un thermostat lors de lapplication de sollicitations extrieures est gale la moyenne des
travaux microscopiques pour chaque macrotat visit (paramtr par ), et on identifie ainsi au
second membre, une fois intgr sur un intervalle de , le travail fourni au systme. Notant W ce
travail on a ainsi
F
dW
=
.
T
d
Au sens de la thermodynamique, on a ici une transformation isotherme rversible, cest--dire dans
laquelle le systme reste en quilibre interne et en quilibre avec le milieu extrieur.
Le travail des forces extrieures est gal la variation dnergie libre, qui prend donc le sens
dune nergie potentielle macroscopique pour les volutions temprature constante. Dans les
problmes de statique macroscopiques, temprature constante, on utilise souvent des nergies
potentielles (par exemple lastiques), qui, du point de vue de la thermodynamique, sont en fait des
nergies libres. En particulier, les forces gnralises qui drivent de tels potentiels macroscopiques
sont donc pour une part dues des variations dentropie.
Travail et chaleur
La variation de lnergie interne hHi est, par un calcul analogue (4.11) :
hHi
H
H
H
=
H
hHi
.
67
(4.13)
p
Y
(k)
NVT (Qk , Pk ),
k=1
o
(k)
NVT (Qk , Pk ) =
1
exp [Hk (Qk , Pk )] ,
Zk
Z
Zk =
Q
La fonction de partition globale scrit elle aussi Z = k Zk . Une telle forme de la distribution de
probabilit est caractristique de lindpendance statistique entre les observables dpendant des
Qk , Pk et des Ql , Pl si l 6= k.
4.3.2 Indpendance des positions et des quantits de mouvement pour une
collection de particules
En fait, on peut pour tout Hamiltonien sparable (somme des nergies cintiques associes
chacune des coordonnes des 3N quantits de mouvements pi dune part, et de lnergie potentielle
V (Q) dautre part), tensoriser la mesure de probabilit entre les impulsions et les positions selon
!
p2i,
1
1
1
Y
dNVT (Q, P) =
exp
exp [V (Q)] dQ dP,
N!
2m Zq
1iN
13
o est la longueur donde thermique introduite en (3.10). Ainsi, chacune des composantes pi,
est indpendante des autres et indpendante des positions, et les quantits de mouvement sont
distribues selon la loi de Maxwell (3.5), dont on tablit ainsi la validit gnrale pour des particules
classiques quelles que soient leurs interactions. La fonction de partition Z scrit :
Z
Zq
,
Z
=
exp [V (q1 , q2 , . . . , qN )] dq1 dq2 , . . . dqN .
Z=
q
N !3N
Lintgrale de configuration Zq ne se calcule pas analytiquement en gnral, et il faut recourir des
mthodes numriques approches pour calculer les moyennes densemble pour la mesure canonique
(voir chapitre 5).
6. La covariance des observables A et B est Cov(A, B) = hABi hAi hBi. Ici, les moyennes sont prises
par rapport la mesure de Boltzmann associe au Hamiltonien non perturb H(0, , ).
68
4 Lensemble canonique
VN
.
N !3N
(4.15)
puis, par drivation, lentropie, lnergie interne et la pression, pour lesquelles on retrouve les
rsultats (3.16), (3.15) et (3.19). Le potentiel chimique du gaz parfait vaut :
= kB T ln(3 ).
(4.16)
Il est ngatif et nettement plus grand que kB T en valeur absolue, en raison de lingalit 3 1.
Ceci provient de laugmentation dentropie rsultant de lajout dune particule.
En gnral, lnergie libre et ses drives, pour un systme de N particules avec des interactions, peuvent scrire comme une somme dune contribution idale qui est la valeur de
la grandeur considre dans le gaz parfait, et dune contribution d excs. Cette sparation se
dduit directement de lcriture de la fonction de partition comme produit :
Z = Zid
Zq
,
VN
Var (Ep )
,
N kB T 2
69
1
V (Q0 + U) = V (Q0 ) + U K U + O(|U|3 ),
2
o la matrice symtrique K = 2 V (Q0 ) est appele matrice des raideurs (ou matrice dynamique
en physique des solides). On suppose par la suite que K est dfinie positive (i.e. on se place au
voisinage dun minimum strict). Par un changement de variable diagonalisant K, on peut rcrire
le Hamiltonien comme 8
3N 2
X
pk
1
H(Q, P) =
+ Kk qk2 ,
2m 2
k=1
F = kB T
3N
X
Zk , avec Zk =
ln
k=1
kB T
~k
kB T
. Lnergie libre est alors :
~k
.
(4.17)
(4.18)
Capacit calorifique
Avec une famille doscillateurs harmoniques indpendants, une quantit ne dpendant pas des
pulsations propres est la capacit calorifique. En effet celle-ci est simplement gale au nombre
doscillateurs indpendants, multipli par la constante de Boltzmann kB . La capacit calorifique
volume constant est en effet
S
2F
Cv = T
= T
,
T
T 2
On obtient alors
Cv = 3N kB .
(4.19)
70
4 Lensemble canonique
Ce rsultat constitue la loi de Dulong et Petit pour la capacit calorifique des solides. Les recherches pour expliquer les carts systmatiques cette loi au tournant du 20me sicle (on observe
des capacits calorifiques plus faibles basse temprature) conduisirent lintroduction, dabord
arbitraire, deffets de quantification de lnergie des oscillateurs, qui ultrieurement sexpliqurent
par la mcanique quantique. Daprs (4.18), ces carts sont dautant plus manifestes que la temprature est basse, ou bien que les raideurs sont grandes. Ainsi, le diamant, matriau dont les
modules lastiques sont trs levs, prsente toujours 300 K des carts notables par rapport la
loi de Dulong et Petit.
71
le thermostat se font sur des temps trs longs, de sorte que leur influence ne se fait pas sentir
pendant la dure dtude du systme, lchelle de ses temps de relaxation propres. On admet
cependant que le thermostat a jou son rle de prparation de ltat initial. Cela revient considrer
des configurations initiales distribues selon la mesure canonique, qui voluent ensuite par la
dynamique hamiltonienne du systme dcoupl du thermostat (ce qui est bien cohrent, car la
dynamique hamiltonienne prserve la mesure canonique).
72
4 Lensemble canonique
Exercices
Exercice 4.1. Que vaut la capacit calorifique moolaire volume constant dun gaz de molcules
diatomiques (comme lazote et loxygne de lair) ?
Exercice 4.2. On considre un systme de N particules interagissant par un potentiel de paire,
dans un volume V temprature T , avec des conditions aux limites priodiques.
(1) Au moyen dun changement de variables dans lespace des phases E, montrer que leffet dun
changement de volume sur la distribution de Boltzmann-Gibbs se ramne la variation dun
paramtre du hamiltonien. On veillera utiliser des changements de variable qui conservent
la mesure 0 .
(2) Dduire la formule (2.23) pour la pression, partir de la drive de lnergie libre par rapport
au volume.
Exercice 4.3 (Potentiels en puissance inverse). On se replace dans le cas de lExercice 2.3.
tablir les mmes conclusions partir de la distribution de Botzmann-Gibbs dans lensemble
canonique.
Exercice 4.4. tablir la formule (2.19) sans utiliser la fonction de partition ni la forme de la
mesure canonique, avec une approche similaire la preuve de la formule (2.21) (chapitre 3, page 42).
Exercice 4.5 (Calcul du potentiel chimique par la mthode dinsertion de Widom). On
tudie un systme de N particules dans lensemble canonique, et on cherche valuer le potentiel
chimique dexcs ex .
(1) crire ex en fonction du rapport des intgrales de configuration Zq N + 1 et N particules
(2) On place au hasard une N + 1ime particule, avec une probabilit uniforme dans le volume
V occup par le systme de N particules lquilibre. On note W lnergie potentielle dinteraction de cette particule supplmentaire avec les N premires. Montrer que exp[ex ] est
gale la moyenne sur la position de cette particule test de la moyenne selon la distribution
de lensemble canonique des N particules de exp[W ].
Exercice 4.6 (Frquence des collisions dans un systme de sphres dures). Montrer que
le nombre moyen de collisions par particule et par unit de temps dans un systme de sphres
dures est
r
kB T
2
nc = 2
g(+ ),
m
g(+ ) = limr,
paires en r = .
r>
Exercice 4.7 (Pression du fluide de sphres dures (1)). Pour les sphres dures on ne peut
pas exprimer la pression partir de la formule (2.23), car on na pas de potentiel diffrentiable
pour calculer des forces. On peut nanmoins obtenir une formule fonde sur le bilan de quantit
de mouvement dans les chocs.
(1) Calculer la loi du choc, qui donne les vitesses aprs le choc en fonction des vitesses antrieures
au choc. Les collisions conservent la quantit de mouvement et lnergie cintique.
(2) Montrer que lon a :
2 3
g(+ ) ,
P = kB T 1 +
3
73
N
X
(qi ).
i=1
(1) En utilisant (4.14), calculer au premier ordre la variation de hAi lquilibre induite temprature constante par lapplication du champ extrieur (r), dans le cas o lobservable A est
de la forme :
N
X
A(Q) =
(qi ),
i=1
avec une fonction quelconque. En dduire une expression de la variation du champ de densit
un corps (1) (r) faisant intervenir la densit deux corps (2) introduite en (2.27), du systme
non perturb.
(2) Montrer que pour un systme homogne (fluide) on peut exprimer ce rsultat avec les transformes de Fourier de et de la fonction de corrlation de paires, faisant ainsi apparatre le
facteur de structure S(k) (on pourra admettre pour simplifier que la perturbation sannule
en-dehors dune certaine rgion).
(3) Dans lhypothse o le potentiel appliqu varie lentement dans lespace, crire au premier
ordre la variation du champ de densit du systme fluide qui en rsulte lquilibre, par une
approche purement macroscopique (statique des fluides), faisant apparatre la compressibilit
isotherme .
(4) En dduire la relation (2.29) entre facteur de structure et compressibilit isotherme.
Exercice 4.11 (Deuxime coefficient du viriel). On appelle dveloppement du viriel lcriture
de la pression dun fluide comme srie entire de la densit, sous la forme :
P (, T ) = kB T 1 + b2 (T ) + b3 (T )2 + . . . ,
et le coefficient bi (T ) est le i-me coefficient du viriel. On se propose dvaluer b2 (T ) dans le cas
dun systme de particules interagissant par un potentiel de paire ne dpendant que de la distance,
V(r).
(1) Ecrire lintgrale de configuration Zq en fonction des quantits fij associes aux paires de
particules, dfinies par :
fij = exp[V(rij )] 1,
en adoptant lapproximation suivante dans lintgrande de lintgrale :
Y
X
(1 + fij ) ' 1 +
fij .
1i<jN
1i<jN
74
4 Lensemble canonique
(2) En dduire la pression dexcs et la valeur du deuxime coefficient du viriel b2 (T ). Que vaut-il
pour les sphres dures ? Vrifier que lon retrouve lapproximation donne par (3.8).
(3) Dans le cas gnral, montrer que le dveloppement de la pression jusquau second ordre en
correspond une certaine approximation de basse densit pour la fonction de corrlation de
paires g(r) dans la formule (2.26).
Exercice 4.12 (Modes propres dune chane de ressorts). On considre un systme unidimensionnel form dune chane de particules de masse m lies leurs voisines par des ressorts de
raideur K, avec des conditions aux limites priodiques. Trouver le changement de coordonnes
qui permet dcrire le hamiltonien du systme sous forme dune somme de hamiltoniens associs
des oscillateurs harmoniques indpendants. On cherchera les coordonnes de ces oscillateurs en
considrant des modulations sinusodales du dplacement le long de la chane, avec des longueurs
donde sous-multiples de la longueur de la chane.
5
chantillonnage de la mesure canonique
76
76
79
81
82
82
85
88
89
91
93
96
avec
dcan (q, p) = Z
1 H(q,p)
dq dp,
Z=
eH(q,p) dq dp.
(5.1)
(5.2)
Remarquons que lchantillonnage des impulsions ne pose pas de problme (car les impulsions
peuvent tre considrs comme des variables alatoires gaussiennes indpendantes), et la vraie
difficult est dchantillonner la partie configurationnelle de la mesure canonique, cest--dire la
mesure
Z
dcan (q, p) = Z 1 eV (q) dq,
Z =
eV (q) dq,
DN
o D est lensemble des configurations accessibles. Cette tche nest pas triviale car le nombre de
degrs de liberts du systme est usuellement trs grand, et la mesure dcan trs concentre (i.e.
elle prend des valeurs non ngligeables sur un ensemble de trs petite taille). Des mthodes usuelles
dintgration numrique ou de quadrature (lments finis, diffrences finies, etc) ne peuvent pas
tre utilises du fait de la grande dimension de lespace. En effet, le nombre de points considrer
est bien trop grand : si on utilise par exemple des diffrences finies, il y a K Ndim points considrer,
le nombre de degrs de liberts valant Ndim 1036 dans la pratique. De mme, des mthodes
usuelles dchantillonnage en probabilits (algorithme de rejet, fonction dimportance) ne peuvent
N
76
gnralement pas tre utilises en tant que telles car on ne dispose pas dune bonne approximation
a priori de la mesure chantillonner.
Nous prsentons dans ce chapitre des techniques couramment employes dans la pratique quotidienne de la simulation molculaire pour calculer des moyennes, utilisant une chane de Markov
(en particulier le schma de Metropolis-Hastings), ou des quations diffrentielles stochastiques
(surtout la dynamique de Langevin) convenablement discrtises. Dans les deux cas, on peut montrer que la mesure canonique est prserve par la dynamique. On peut mme obtenir des thormes
de convergence, du type de la Loi des Grands Nombres, pour justifier des limites telles que (5.1).
Ainsi, contrairement au cas microcanonique, lergodicit est ici un rsultat quon peut prouver
rigoureusement. Cependant, on verra aussi que, mme si lergodicit est assure dun point de vue
thorique, il se peut quen pratique les temps de simulations associes soient prohibitivement longs
pour observer la convergence de la moyenne (5.1).
Finissons par un point davertissement important : les dynamiques que nous prsentons dans
ce chapitre ne sont pas des dynamiques physiques ! On doit simplement les considrer comme des
moyens commodes dchantillonner une mesure de probabilit.
Pour lalgorithme de Metropolis originel, cette fonction de proposition doit tre symtrique, au
sens o
T (q, q 0 ) = T (q 0 , q).
77
Algorithme de Metropolis
Algorithme 5.1. Pour n 0,
(1) proposer une nouvelle configuration qn+1 partir de la configuration q n , avec une fonction
de proposition symtrique T (q n , qn+1 ) ;
(2) accepter la nouvelle configuration avec une probabilit
n+1
n
can (
q n+1 )
p = min 1,
= min 1, e[V (q )V (q )] ,
n
can (q )
et poser q n+1 = qn+1 dans ce cas ; sinon q n+1 = q n .
Remarque 5.1 (Accepter avec une probabilit p). En pratique, pour dcider si on effectue une action
avec une probabilit 0 p 1, on tire un nombre alatoire U uniformment entre 0 et 1 (on notera
U U[0, 1]), et on effectue laction si U p. Ainsi, si p est petit, il est peu probable que U p. La
gnration dun nombre alatoire selon U[0, 1] se fait par exemple en Scilab avec la commande rand.
On peut interprter cet algorithme de la manire suivante : si la nouvelle configuration a une
nergie infrieure la configuration actuelle, on laccepte coup sr ; sinon, on laccepte avec une
certaine probabilit, dautant plus grande que la nouvelle nergie est proche de la prcdente. Notons quil est important dassurer quon peut accepter des nergies plus grandes, car cela permet
de franchir des barrires nergtiques (ventuellement en plusieurs coups) et de passer dun minimum local du potentiel un autre. Remarquons galement que lorsquune proposition est rejete,
on garde la configuration prcdente, qui compte donc plusieurs fois dans la moyenne (5.1) (sans
quoi, ladite moyenne serait fausse !).
On peut considrer des fonctions de proposition non symtriques dans la gnralisation lalgorithme propose par Hastings [21] (voir 5.1.2). La preuve de convergence de lAlgorithme 5.1 est
dailleurs faite dans le cadre plus gnral du 5.1.2.
Exemple 5.1 (chantillonnage dun potentiel double puits). On considre une particule astreinte
se mouvoir dans le potentiel unidimensionnel (3.3), savoir
V (q) = h(q + 1)2 (q 1)2 .
On va chantillonner la mesure canonique (5.2) pour = 1, et diffrentes valeurs de h, en utilisant
le schma de Metropolis. Il faut en premier lieu dcider quelle fonction de proposition symtrique
T nous allons utiliser. Le choix le plus simple est dutiliser des incrments indpendants et alatoirement distribus selon une loi uniforme ou gaussienne par exemple. Notant N (a, b) la loi dune
variable gaussienne centre en a et de variance b, et U[a, b] la loi uniforme sur [a, b], on peut
considrer
1
|q 0 q|2
q 0 = q + G, G N (0, 2 )
et donc T (q, q 0 ) = 2
exp
= T (q 0 , q), (5.3)
2 2
ou
1
1|q0 q| = T (q 0 , q).
(5.4)
2
Partant de q 0 = 0, une ralisation de lAlgorithme 5.1 avec la fonction de proposition (5.4) donne,
pour h = 1, = 0, 4 et Niter = 104 itrations, des positions distribues de manire peu prs
gale dans les deux puits, avec des transitions nombreuses entre les puits (voir la figure 5.1).
Lhistogramme des positions visites semble indiquer que les positions sont asymptotiquement
correctement rparties. En revanche, si la barrire nergtique h pour passer dun puits un autre
est plus grande (par exemple h = 4), alors lalgorithme de Metropolis reste longtemps coinc
dans un des puits, ce qui met en pril la convergence numrique de lchantillonnage. On pourrait
q 0 = q + U, U U(, )
et donc T (q, q 0 ) =
78
0.8
3.0
0.7
2.5
Densit de probabilit
Densit de probabilit
0.6
0.5
0.4
0.3
2.0
1.5
1.0
0.2
0.5
0.1
0.0
2.0
1.5
1.0
0.5
0.0
0.5
1.0
1.5
2.0
0.0
2.0
1.5
1.0
0.5
0.0
0.5
1.0
1.5
2.0
(b) h = 4
(a) h = 1
Fig. 5.1. Comparaison entre la densit de probabilit thorique (courbe) et empirique (histogramme)
des configurations visites (algorithme de Metropolis), pour deux valeurs de h.
remdier ce problme en considrant des incrments moins locaux (qui permettraient de passer
directement dun puits un autre, comme 3). Cet exemple montre tout le savoir-faire parfois
ncessaire pour assurer un chantillonnage correct. Ceci est dautant plus vrai que la dimension
du systme est grande.
Exemple 5.2 (Fluide de Lennard-Jones). On considre un fluide de Lennard-Jones, dont les positions des N particules sont notes q = (q1 , . . . , qN ). Partant dune configuration q n donne, on
peut crer une nouvelle configuration de plusieurs manires diffrentes. Par exemple, on peut choisir une particule au hasard (i.e. tirer un entier {1, . . . , N } au hasard) et modifier alatoirement sa
position dun dplacement tir selon une loi uniforme ou gaussienne. Si on dplace par exemple
une particle par un mouvement gaussien standard (en dimension 3) mutipli par un facteur , on
a la fonction de proposition
!
3
N
n+1
n 2
X
Y
|q
q
|
1
1
j
j
T (q n , q n+1 ) =
qkn (qkn+1 )
exp
.
N
2 2
2
j=1
k6=j
En effet, on a une probabilit 1/N de choisir un indice j au hasard (ce qui donne le premier terme
de la somme, qui exprime le fait que parmi les positions qkn+1 , seul qjn+1 est diffrent de qjn ), et
ensuite on effectue un dplacement gaussien pour cette particule, do le second terme. On peut
imaginer bien dautres modifications, par exemple effectuer un dplacement pour chaque particule
selon un ordre dfini (et pas alatoire comme ci-dessus), en acceptant ou rejetant chaque fois
la nouvelle configuration ainsi produite ; ou en dplaant toutes les particules avant de rejeter ou
accepter, auquel cas
!
PN
3N
n+1
n 2
|q
q
|
1
j
j
j=1
T (q n , q n+1 ) =
exp
.
2 2
2
Bien sr, on peut considrer des magnitudes de dplacements i dpendant de la particule en
question (si jamais certaines ont des longueurs dinteraction plus grandes que les autres, on
pourra rduire i ).
Remarque 5.2 (Choix des paramtres de la fonction de proposition et taux de rejet). La doxa en
simulation molculaire est que les paramtres des fonctions de proposition doivent tre choisis
afin que le taux dacception dans lalgorithme de Metropolis soit de lordre de 0,5. Cest une rgle
dusage, fonde sur une constatation empirique, et qui ne peut tre justifie mathmatiquement que
dans certains cas limites analytiques. Mais en pratique, on se rend compte que cette prescription
79
permet en effet datteindre une bonne performance de lalgorithme en terme de variance (i.e.
permet de rduire au mieux lerreur statistique). Lide est que les erreurs statistiques sont lies
la trop grande corrlation entre les configurations chantillonnes. Cette corrlation peut avoir
deux origines pour lalgorithme de Metropolis :
(i) un taux de rejet trop grand conduit considrer souvent q n+1 = q n , ce qui est, en un sens, une
corrlation maximale. Ceci arrive si les dplacements proposs sont trop grands, conduisant
des configurations atypiques ;
(ii) des dplacements trop petits, ce qui conduit certes taux de rejet trs petit, mais les nouvelles
configurations ressemblent alors normment aux prcdentes.
Il sagit donc de trouver un bon compromis entre le fait daccepter dune nouvelle configuration
et le fait davoir des nouvelles configurations assez diffrentes des prcdentes, do cette rgle du
moiti rejet/moiti acceptation.
5.1.2 Le schma de Metropolis-Hastings
Le schma de Metropolis-Hastings a t propos par Hastings en 1970 [21]. On ne fait plus
lhypothse que la fonction de proposition est symtrique, mais on tient compte du biais engendr
par lasymtrie de la proposition en modifiant la probabilit dacceptation/rejet.
Algorithme de Metropolis-Hastings
Algorithme 5.2. Pour n 0,
(1) proposer une nouvelle configuration qn+1 partir de la configuration q n , avec une probabilit T (q n , qn+1 ) ;
(2) accepter la nouvelle configuration avec une probabilit
can (
q n+1 )T (
q n+1 , q n )
n n+1
p = r(q , q ) = min 1,
,
can (q n )T (q n , qn+1 )
et poser q n+1 = qn+1 dans ce cas ; sinon q n+1 = q n .
On vrifie que lon retrouve bien lalgorithme de Metropolis originel dans le cas dune fonction
de proposition symtrique. La chane de Markov correspondante est caractrise par le noyau de
transition
Z
P (q, dq 0 ) = r(q, q 0 )T (q, q 0 ) dq 0 + 1
q ,
qui donne la probabilit, partant de q, darriver dans un voisinage qd0 dune autre configuration
q 0 DN . On peut donc voir le noyau de transition comme une famille de mesures de probabilit
indexe par q DN . La premire partie du noyau de transition provient des pas accepts de q
vers q 0 : on a une probabilit T (q, q 0 ) de proposer la configuration q 0 partant de q, et ensuite une
probabilit r(q, q 0 ) daccepter ce mouvement. La seconde partie du membre de droite rsume tous
les mouvements rejets, pour lesquels on reste la position initiale q. La probabilit de rejet est
la probabilit complmentaire de la probabilit dacceptation, qui est la somme des probabilits
lmentaires dacceptation r(q, q 0 )T (q, q 0 ) dun mouvement de q vers q 0 . On vrifie ainsi que
Z
P (q, dq 0 ) = 1.
DN
80
On dit que la chane de Markov est irrductible si pour tout q DN et tout borlien B B(DN )
de mesure de Lebesgue strictement positive, il existe n 1 tel que P n (q, B) > 0. Cela traduit une
proprit daccessibilit globale de toutes les rgions de lespace des phases (on peut atteindre un
voisinage de nimporte quel point en un nombre fini de pas). Dans le cas du schma de MetropolisHastings, cette accessibilit est lie un choix judicieux de la fonction de proposition T .
Exemple 5.3. Pour le fluide de Lennard-Jones, on peut vrifier facilement que des dplacements
alatoires dune ou plusieurs particules permettent de passer dune configuration nimporte quelle
autre en un nombre fini de pas (comme dans un jeu de taquin, on dplace des particules pour placer
q1 dans la position souhaite, puis on fait de mme pour q2 , etc). Chaque dplacement alatoire
a une probabilit strictement positive (mme si elle est trs petite !) dtre observ, ce qui donne
au final une probabilit strictement positive de passer dune configuration une autre.
On montre que le schma de Metropolis-Hastings converge au sens du thorme suivant.
Thorme 5.1 (Convergence du schma de Metropolis-Hastings). Supposons que la
chane de Markov engendre par le schma de Metropolis-Hastings soit irrductible. Alors, pour
toute observable A L1 (can ), et pour presque tout q 0 DN ,
1X
A(q i ) hAi =
n+ n
i=1
n
lim
DN
p.s.
Remarquons donc que lon peut montrer que la dynamique de Metropolis-Hastings est ergodique, contrairement au cas microcanonique, o lergodicit est une hypothse. La preuve de ce
rsultat utilise un certain nombre de concepts avancs de la thorie des chanes de Markov. Le
lecteur intress pourra se rfrer [27], et nous nous contentons de donner les lments prinipaux
de la preuve.
Preuve. La preuve de la convergence se dcompose en deux parties : (i) on montre tout dabord
que la mesure can est une mesure invariante de la dynamique de Metropolis-Hastings ; (ii) comme
elle est par ailleurs irrductible (et apriodique, car on a une probabilit non nulle de rester sur
place) et admet une mesure de probabilit invariante, on obtient la proprit dergodicit le long
dune trajectoire recherche.
La preuve de convergence se rduit donc montrer linvariance de la mesure cible can . Pour
ce faire, on vrifie que pour toute fonction f L1 (can ),
Z
Z
Z
f (q 0 )can (q)P (q, dq 0 ) dq =
f (q 0 )can (q 0 ) dq 0 .
DN
DN
DN
Ceci traduit en effet de manire faible (en dualit contre des fonctions intgrables) que, partant de can et faisant un pas de la dynamique de Metropolis-Hastings avec le noyau P (terme
can (q)P (q, dq 0 )), on retrouve bien can .
On remarque en premier lieu que, notant a(q, q 0 ) = T (q, q 0 )r(q, q 0 ) la probabilit daccepter un
mouvement de q vers q 0 , on a la proprit dite de bilan dtaill
can (q)a(q, q 0 ) = can (q 0 )a(q 0 , q).
Alors,
DN
DN
f (q 0 )can (q)a(q, q 0 ) dq 0 dq =
Z
DN
DN
Par ailleurs,
Z
Z
Z
f (q 0 )can (q) 1
r(q, Q)T (q, Q) dQ q (dq 0 ) dq =
DN
DN
Z
f (q 0 )can (q 0 ) 1
a(q 0 , Q) dQ dq 0 .
Z
DN
=
DN
DN
(5.5)
DN
DN
81
f (q 0 )can (q 0 ) dq 0 .
u
t
La configuration propose diffre de la configuration originelle cause du terme V (q) qui tend
ramener les configurations vers des minima locaux de lnergie potentielle (donc des configurations
plus probables), le terme alatoire permettant de ne pas systmatiquement diminuer lnergie. La
probabilit datteindre q 0 partant de q est ainsi
r
|q 0 q + V (q)|2
T (q, q 0 ) =
exp
.
4
4
Notons que T (q, q 0 ) 6= T (q 0 , q) en gnral, cause du terme de force V . En pratique, lintensit des perturbations proposes est choisie afin dobtenir un taux dacceptation/rejet proche
de 0,5, afin que lalgorithme soit le plus efficace possible. Ceci peut tre justifi thoriquement
dans certains cas. Nous verrons en 5.3 selon quels critres on peut numriquement chercher un
paramtre optimal. On prsente en figure 5.2 quelques rsultats dchantillonnages obtenus avec
cet algorithme pour le potentiel (3.3), pour = 0, 2 et n = 104 itrations de la chane de Markov.
5.1.3 Quelques raffinements
De nombreux travaux ont propos des amliorations des algorithmes de type Metropolis ou
Metropolis-Hastings. En fait, ce quon cherche amliorer, ce sont les fonctions de proposition T
utilises. Ainsi,
(i) on peut proposer de nouveaux mouvements adapts la physique du systme. Par exemple,
pour des fluides de Lennard-Jones ou des mlanges de fluides, il peut tre intressant de
combiner des mouvements locaux (du type des algorithmes prcdents), et des mouvements non-locaux, comme, par exemple, dplacer une seule particule en tirant sa nouvelle
position compltement alatoirement dans le domaine de simulation (ou seulement parmi
des zones de lespace densit plus faible), changer le type dune particule, casser une
liaison chimique et en recrer une autre ailleurs, etc ;
82
0.9
1.6
0.8
1.4
1.2
Densit de probabilit
Densit de probabilit
0.7
0.6
0.5
0.4
0.3
0.8
0.6
0.4
0.2
0.2
0.1
0.0
2.0
1.0
1.5
1.0
0.5
0.0
0.5
1.0
1.5
0.0
2.0
2.0
1.5
1.0
0.5
0.0
0.5
1.0
1.5
2.0
Fig. 5.2. Comparaison entre la densit de probabilit thorique (courbe) et empirique (histogramme)
des configurations visites (algorithme de Metropolis-Hastings, version MALA avec = 0.2).
(ii) on peut galement utiliser des manires plus abstraites de proposer des nouveaux mouvements : un cas typique est celui o lon simule deux rpliques du systme des tempratures diffrentes, une temprature haute (on sattend donc ce que la chane de
Markov des configurations chantillonnes cette temprature converge plus rapidement),
et une temprature basse ; les configurations proposes la temprature basse tant celles
chantillonnes par la temprature haute. Cette technique, connue sous le nom de parallel
tempering permet de lutter contre la mtastabilit 1 du systme (voir lExercice 5.3).
q0 = q 0 ,
(5.7)
les variables (Wti+1 ti )i=0,...,n1 tant par ailleurs indpendantes. On peut donc voir lEDS (5.7)
comme la limite lorsque t 0 du schma numrique (il sera suffisant, pour les besoins de ce
cours, davoir cette image en tte) :
1. Cest dire une convergence numrique trs lente, voir la 5.3 pour plus de prcisions.
q n+1 = q n + t Gn ,
83
(5.8)
25
25
20
20
15
15
10
10
5
y
o q n est une approximation de qnt , les (Gn )nN tant des variables alatoires gaussiennes standard indpendantes. Notons que lincrment du mouvement brownien est distribu selon une gaussienne de variance t,ce qui revient en pratique ajouter une variable alatoire gaussienne multiplie par un facteur t.
On dduit facilement de (5.8) que q n est une variable gaussienne centre et q 0 et de variance n 2 t (et en fait, dans ce cas simple, q n et qnt sont distribus selon les mmes lois). La
10
10
15
15
20
20
25
25
20
15
10
10
15
20
25
25
25
20
15
10
10
15
20
25
Fig. 5.3. Deux ralisations dun mouvement brownien (5.7) selon la discrtisation (5.8) pour t = 0, 1
et nt = 100.
figure 5.3 prsente deux ralisations (i.e. deux trajectoires) de (5.7), avec la discrtisation (5.8),
dans le cas dun mouvement brownien de dimension 2. Un mouvement brownien de dimension d
est Wt = (W1,t , . . . , Wd,t ), o chacun des Wi,t est un mouvement brownien standard de dimension 1, ces diffrents mouvements browniens tant par ailleurs indpendants.
Evolution en temps de la loi de qt
Nous avons caractris qt par sa loi (gaussienne centre en x0 , de variance 2 t), ce qui tait facile
car nous en avions une expression analytique explicite. De tels calculs ne peuvent toutefois pas
tre mens analytiquement en gnral, et il faut savoir comment volue la loi des solutions dune
EDS. Pour cela, il est commode de considrer un ensemble (infini) de ralisations de lEDS (5.7),
partant de configurations initiales distribues selon une mesure d 0 = (q) dq. Les configurations
sont alors distribues au temps t selon la loi de densit (t, ). 2
Nous allons prsent tablir formellement lquation aux drives partielles (EDP) satisfaite
par . Nous omettons volontairement de prciser les notions de rgularit de fonctions et les
espaces fonctionnels adquats. Lesprance (la moyenne) dune fonction A est, au temps t,
Z
E(A(qt )) =
A(q) (t, q) dq.
DN
Pour simplifier, on se place dans le cas o qt R (on indiquera ensuite comment les rsultats sont
modifis dans le cas dun espace de dimension suprieure), auquel cas Gn N (0, 1). On regarde
commment E(A(q n )) varie dune itration lautre. Pour ce faire, on utilise la discrtisation (5.8),
et on effectue un dveloppement de Taylor :
2. Nous admettrons que, pour t > 0, la loi de la variable alatoire qt est effectivement densit par
rapport la mesure de Lebesgue. Cela provient de la proprit rgularisante de lquation dvolution
parabolique satisfaite par cette loi.
84
2 t 00 n
3/2
n
0 n
n
n 2
= E A(q ) + t A (q ) G +
A (q )(G ) + O(t )
2
2 t
= E(A(q n )) + t E(A0 (q n ))E(Gn ) +
E(A00 (q n ))E((Gn )2 ) + O(t3/2 )
2
2 t
= E(A(q n )) +
E(A00 (q n )) + O(t3/2 ),
2
en utilisant, pour passer de la deuxime la troisime ligne, lindpendance des variables alatoires
q n et Gn et la linarit de lesprance. Ainsi,
Z
Z
2 t 00
A(q) ((n + 1)t, q) dq =
A(q) +
A (q) (nt, q) dq + O(t3/2 ).
(5.9)
2
DN
DN
Une intgration par parties donne (on suppose que les termes de bords valent 0 ou se compensent) :
Z
q (nt, q) dq = O( t).
t
2
DN
Lorsque t 0 avec nt t, on obtient :
Z
2 2
A(q) t (t, q)
q (t, q) dq = 0.
2
DN
Cette quation tant valable quelle que soit la fonction A, on en dduit que
t =
2 2
.
2 q
2
,
2
(t = 0, ) = ().
Cette EDP est lquation de Fokker-Planck associe lEDS (5.7). On a ainsi une simple quation
de diffusion. Si on part initialement dune mesure de Dirac en x0 , on sait que lon trouve au temps
t une gaussienne de variance 2 t, centre en x0 . Rappelons en effet que la solution lmentaire de
lquation de la chaleur
2
t =
, (t = 0, ) = 0 ,
2
en dimension 3N est bien
3N/2
1
q2
,
(t, q) =
exp
2 2 t
2 2 t
comme on peut le vrifier directement.
Une quation diffrentielle stochastique modle
La dynamique brownienne ci-dessus tait une diffusion libre sur tout lespace. On souhaiterait
la modifier afin dobtenir un processus qui chantillonne la mesure canonique. Une manire de
faire est dajouter un terme de drive, qui ramne la dynamique vers les zones importantes de la
mesure (i.e. vers des valeurs pas trop grandes de V ) au lieu de laisser la diffusion schapper. On
peut penser par exemple une dynamique de gradient perturbe par un mouvement brownien,
telle que
85
(5.10)
(5.11)
q n+1 = q n V (q n ) t + t Gn ,
o les Gn sont des vecteurs gaussiens standard indpendants et identiquement distribus (i.i.d.)
de dimension dN .
Notant encore (t, ) la loi de qt , on montre que lquation de Fokker-Planck associe
lEDS (5.10) est
2
t = (V ) +
= L.
2
On peut en effet motiver cette quation par un travail similaire celui fait ci-dessus pour la
diffusion libre. Il apparat un terme supplmentaire de la forme
Z
tA(q) V (q) (nt, q) dq
DN
dans (5.9), quon transforme laide dune intgration par parties pour liminer laction des
drives sur la fonction A.
On peut alors vrifier que, si
2
2 = ,
(5.12)
86
0.8
1.5
0.7
1.0
0.5
0.5
0.0
Densit de probabilit
0.6
0.4
0.3
0.5
0.2
1.0
0.1
0.0
2.0
1.5
1.5
1.0
0.5
0.0
0.5
1.0
1.5
2.0
1000 2000 3000 4000 5000 6000 7000 8000 9000 10000
Iteration n
Fig. 5.4. Ralisation de lEDS (5.10) avec la discrtisation (5.11) pour t = 0, 05, nt = 50, = 1 pour
le potentiel (3.3).
force de frottement visqueux, et une force fluctuante, cense reprsenter les impacts incessants des
molcules du fluide sur la particule brownienne 3 . La dynamique de Langevin est ainsi donne par
lEDS suivante :
pi,t
dt,
dqi,t =
m
(5.13)
p
2
.
(5.14)
La calcul qui mne cette relation est analogue au calcul qui mne (5.12). Il suffit de noter que
lquation de Fokker-Planck associe (5.13) est
2
t = M 1 p q + q V p + p (M 1 p) +
p ,
2
et que exp(H) en est une solution stationnaire.
Rgimes limites
Notons que si = 0 (et donc = 0), on retrouve la dynamique hamiltonienne usuelle (voir
la figure 5.5 pour une illustration). On peut galement montrer quon retrouve (5.10) dans la
limite m 0. Cependant, en pratique, la dynamique de Langevin est souvent plus efficace pour
chantillonner la mesure canonique que sa limite de fortes frictions (5.10) (voir par exemple [5]).
3. En fait ceci na pas grand sens : les petites molcules qui constituent la particule brownienne sont tout
aussi agites que celles du fluide. De plus, la sparation dchelles de temps, sur laquelle se fonde le modle,
entre grosses particules (lentes) et molcules du fluide (rapides) ignore le couplage entre le mouvement des
particules browniennes et ceux du fluide la mme chelle : ainsi la vitesse moyenne dans un volume de
fluide gal celui de la particule varie lentement, elle aussi. Le modle de Langevin, bien quayant jou
un rle important pour le traitement de diffrents phnomnes une chelle msoscopique en espace et
en temps, nest pas une description correcte de la dynamique des particules browniennes, pour laquelle il
a initialement t invent. Fort heureusement, il concide dans ce cas, pour des temps assez longs, avec le
modle dEinstein, qui consiste crire (5.10), et est pleinement justifi pour les particules collodales en
suspension. Et quelle que soit la validit physique de lquation de Langevin, cela ne remet bien sr pas en
cause lusage qui en est fait ici, o on fait appel une dynamique fictive pour chantillonner une mesure.
87
pi,t
dt + dWi,t est par exemple
mi
pn+1
= pni qi V (qin ) t
i
pni
t + t Gni ,
mi
avec (Gni )i,n des vecteurs gaussiens standard indpendants. On peut ainsi discrtiser lEDS (5.13)
par le schma suivant, qui consiste faire un demi-pas de temps en impulsions, un pas de temps
en positions, et un demi-pas de temps en impulsions :
pn t 1
t
n+1/2
i
+ tGni ,
= pni qi V (q n )
pi
2
m
2
2
n+1/2
p
,
qin+1 = qin + t i
mi
t
pn+1 t 1
n+1/2
pn+1
qi V (q n+1 )
= pi
i
+ tGni .
i
2
mi 2
2
Pour des questions de stabilit numrique, on a implicit le second demi-pas de temps en impulsions, mais on peut remettre le schma sous forme explicite :
pni
t
n+1/2
n
n
n
V
(q
)
+
p
=
p
+
qi
i ,
i
i
2
mi
n+1/2
p
qin+1 = qin + t i
,
(5.15)
mi
t
t n
1
n+1/2
n+1
pi
=
qi V (q n+1 ) +
Gi .
pi
t
2
2
1 + 2m
i
1
p
Notons que si = 0 (et donc = 0), on retrouve le schma de Verlet usuel. Notons galement que
3
4
4
1.5
1.0
0.5
0.0
0.5
(a) = 0, 1
1.0
1.5
1.5
1.0
0.5
0.0
0.5
1.0
1.5
(b) = 3
Fig. 5.5. Trajectoire dune ralisation de la dynamique de Langevin avec la discrtisation (5.15) pour t =
0.005, nt = 5 pour le potentiel (3.3). Pour petit (a), les trajectoires sont (localement) proches des
trajectoires hamiltoniennes. Lorsque augmente (b) ainsi, en raison de (5.14), que lamplitude du bruit
le caractre erratique de la dynamique est plus apparent.
lon emploie deux fois le mme nombre alatoire dans la premire et la dernire quations car on
a, dans un certaine mesure, coup en deux le terme alatoire. Dans le cas V = 0 et = 0, on
alors
pn+1
= pni + t Gni ,
i
88
qui est bien une discrtisation consistante de dpi,t = dWt . On aurait galement pu intgrer la
premire et la dernire quation en employant des nombres alatoires indpendants, mais auquel
cas il aurait fallu tenir compte du fait quon intgre pendant un temps t/2. On aurait ainsi des
mises jour des demi-pas de temps de la forme
r
pni t
t n
n+1/2
n
n t
= pi qi V (q )
pi
+
G ,
2
mi 2
2 i
et
pn+1
i
n+1/2
avec Gni , Gi
n+1/2
pi
qi V (q
n+1
pn+1 t
t
i
+
)
2
mi 2
t n+1/2
G
,
2 i
indpendants.
Convergence
On peut montrer, pour toute friction ( condition que soit donn par (5.14)) que
lEDS (5.13) admet la mesure canonique comme mesure invariante, et que, partant dune condition
initiale quelconque et moyennant quelques hypothses sur le potentiel dinteraction V (voir [5]),
on a
Z
Z
1 T
lim
A(qt , pt ) dt =
A(q, p) dcan (q, p).
T + T 0
E
En pratique, on discrtise convenablement (5.13) (avec le schma (5.15) par exemple), et on calcule
une approximation de la moyenne densemble par
Z
Niter
X1
1
A(q n , pn ) =
A(q, p) dcan (q, p) + O(t).
Niter + Niter
E
n=0
lim
89
lorsque N +, o
N 1
1 X
AN =
A(q n , pn ),
N n=0
sa moyenne densemble. La quantit est la variance de la chane de Markov, et peut se dcomposer comme la somme dune variance intrinsque (gale la variance qui rsulterait dune moyenne
de variables alatoires indpendantes), et dune variance additionnelle provenant des corrlations
entre les configurations successives :
2 = Varcan (A) + 2
+
X
Ecan (A(q 0 , p0 ) hAican )(A(q n , pn ) hAican ) ,
(5.17)
n=1
Varcan (A) = Ecan (A hAican )2 .
Ainsi,on peut dire que lerreur statistique commise en approchant hAican par AN est de lordre
de / N . Il est donc important en pratique de bien estimer , afin dobtenir des estimations
prcises de la moyenne densemble, ou au moins de quantifier correctement les erreurs. On peut
par exemple obtenir un intervalle de confiance 95% selon
90
N
X
1
A(q i )A(q j ) .
Varcan (AN ) = 2 Ecan
N
i,j=1
Supposons que la chane soit stationnaire (pour cela, il faut attendre un temps assez long, dit
temps de thermalisation, pour que la chane soit lquilibre), cest--dire que
h
i
Ecan A(q i )A(q j ) = Ecan A(q 0 )A(q |ij| ) .
Alors,
N Varcan (AN ) = Ecan (A2 ) + 2
N
X
k
1
Ecan A(q 0 )A(q k ) .
N
k=1
Supposant que
+
X
Ecan A(q 0 )A(q k ) < +,
k=1
+
X
Ecan A(q 0 )A(q k ) ,
k=1
t
num
N
0,
1
(1 t/2)
91
.
Pour montrer ce rsultat, on commence par remarquer que si on part dune distribution gaussienne
centre, on conserve une distribution gaussienne centre. On peut donc crire q n N (0, an ) la
n-ime itration. On cherche la limite de an lorsque n +. On crit pour cela une quation
sur la variance an :
p
2t n 2
E((q n+1 )2 ) = E (1 t)2 (q n )2 + 2(1 t) 2t 1 q n Gn +
(G ) ,
et donc
an+1 = (1 t)2 an +
2t
.
1
.
(1 t/2)
lorsque n +.
5.3.2 Convergence de certaines observables
Pour les systmes rels, on ne peut pas savoir si on a vraiment converg ou non vers la loi cible.
Tout ce quon peut faire, cest vrifier que certaines moyennes reprsentatives ont converg.
Utilisation de ralisations indpendantes
On peut penser tester la convergence de la moyenne dune observable le long dune trajectoire. Ceci nest toutefois quune condition ncessaire de convergence, pas suffisante en pratique.
En effet, lorsque la dynamique dchantillonnage reste coince dans un tat mtastable, seule
une exploration locale est faite. Ainsi, dans le cas de la figure 5.1b, si lobservable en question
tait A(q, p) = q, on aurait une moyenne fausse (autour de 1), mais une variance plus petite que
dans la situation de la figure 5.1a !
Il faut ajouter la convergence le long dune trajectoire une mesure de la convergence sur les
diffrentes ralisations possibles. Pour cela, on considre M ralisations indpendantes du processus
dchantillonnage, partant de M conditions initiales indpendantes 5 (q 1,0 , p1,0 ), . . . , (q M,0 , pM,0 ).
On note (q m,n , pm,n )n=0,...,N 1 les configurations chantillonnes partant de la condition initiale
(q m,0 , pm,0 ). Pour une observable donne A, on calcule la moyenne trajectorielle pour chacune des
ralisations :
N 1
1 X
Am
=
A(q m,n , pm,n ),
N
N n=0
la moyenne empirique globale :
M
1 X m
A ,
AN =
M m=1 N
M
2
N X m
AN AN .
M m=1
2
lim M,N
.
2
En effet, (5.16) montre que pour N assez grand, on a N Var Am
hAi
can ' .
N
lim
M + N +
5. Obtenir de telles conditions initiales est dj un dfi en soi ! Usuellement, on thermalise le systme
avec dynamique de Langevin par exemple, et on choisit les conditions initiales parmi les configurations
visits, en veillant les prendre suffisamment espaces afin de limiter la corrlation. On peut ventuellement
effectuer cette dynamique une temprature plus leve pour augmenter encore plus la dcorrlation.
92
Akn =
kn
X
A(qi ),
k = 1, . . . , m
i=(k1)n+1
sont approximativement distribues selon N (hAican , 2 /n), o 2 est donne par (5.17). Un estimateur de 2 est donc
m
n X k
2
n,m
(An Anm )2 ,
=
m1
k=1
Anm
tant la moyenne sur toute la trajectoire. On peut galement obtenir une estimation
2
de lerreur statistique commise en approchant 2 par n,m
, voir [14] pour plus de dtails. Dans
tous les cas, la mthode nest valide que si la longueur de corrlation typique est (beaucoup) plus
petite que la taille des blocs. En pratique, on augmente progressivement la taille des blocs, ce qui
fait que la variance estime augmente (car on prend de plus en plus compte de la corrlation) et
on regarde quelle valeur la variance se stabilise.
A1nm
Quelques exemples
Exemple 5.7 (Exemple analytique). On reprend la chane de Markov (5.18). La figure 5.6 prsente
des estimations de la variance 2 , obtenues en utilisant plusieurs rpliques indpendantes, ou des
moyennes par blocs, dans le cas = 1 et t = 0, 05. Rappelons que la valeur analytique de la
variance est 2/(t) = 40.
10
10
Trajectorial average
10
10
15
20
25
2
Fig. 5.6. Gauche : Variance N,M
en fonction de la longueur N de la trajectoire, avec M = 100
2
trajectoires indpendantes. Lapproximation linaire (ligne en traits interrompus) donne N,M
' 40N 1 .
Droite : Estimation de la dviation standard par moyenne par blocs, en fonction de la taile n = 2p des
blocs (ligne pleine). On a moyenn sur 100 estimations indpendantes (intervalle de confiance en traits
pointills).
93
est symtrique (V (q) = V (q)) et la position q. La position moyenne devrait tre gale 0, mais il
est possible que la lente convergence numrique empche une estimation prcise de cette moyenne
densemble ; alors que la convergence de lobservable nergie potentielle devrait tre nettement
plus rapide puisque la mtastabilit ne laffecte pas. La figure 5.7 prsente les estimations de la
variance obtenues par les mthodes dcrites ci-dessus. Comme prvu, la variance de lobservable
position est bien plus grande que celle de lobservable nergie potentielle.
Position
Energy
10
10
10
Trajectorial average
10
10
10
15
20
25
30
2
Fig. 5.7. Gauche : Variance N,M
en fonction de la longueur N de la trajectoire, avec M = 100 trajectoires
indpendantes. Lapproximation linaire (ligne en traits interrompus) donne 2 ' 2500 pour lobservable
position, et 2 ' 0.20 pour lobservable nergie potentielle. Droite : Estimation de la dviation standard
par moyenne par blocs, en fonction de la taile n = 2p des blocs (ligne pleine), pour lobservable position.
On a moyenn sur 100 estimations indpendantes (intervalle de confiance en traits pointills). La valeur
estime de la variance est 2 ' 2800.
94
N
1 X p2i
,
3N kB i=1 mi
415
415
410
410
405
405
Kinetic temperature
Kinetic temperature
doit tre gale la temprature vise. La figure 5.8 donne les valeurs de Tc observes en fonction
de lindice ditration, pour des systmes de tailles diffrentes. On observe bien la bonne moyenne,
et la variance est gale 2T 2 /N , conformment la prdiction (exercice).
400
395
390
400
395
390
385
1000
6000
Time step
11000
385
1000
6000
Time step
11000
Fig. 5.8. Evolution typique de la temprature cintique au cours du temps, pour un fluide dargon de
densit = 1400 kg/m3 la temprature cible T = 400 K. On note que les fluctuations de Tc diminuent
lorsque N augmente.
Capacit calorifique
On calcule prsent la capacit calorifique molaire volume constant.
Cv =
NA
(hH 2 i hHi2 )
N kB T 2
pour T = 400 ou 600 K. On utilise un pas de temps t = 1014 s T = 400 K avec t/m = 0, 01,
et t = 5 1015 s, t/m = 0, 005 T = 600 K. Les valeurs de rfrence sont extraites de
tables thermodynamiques 6 , et donnes dans la lgende des diffrents tracs de Cv en fonction du
nombre de pas de temps de simulation (figure 5.9).
On observe, en particulier, la convergence des rsultats, avec une prcision augmentant avec
le nombre de pas de temps. En moyenne, 500 000 pas de temps semblent suffisants pour assurer
une convergence de lordre de 0,2 J/K/mol (soit une erreur relative de lordre de 1 %). On ne la
pas fait ici, mais une manire plus rigoureuse de proposer une barre derreur est de calculer la
variance de Cv , ce qui demande le calcul du moment dordre 4 de lnergie ou plusieurs simulations
indpendantes.
Bien entendu, la partie idale de Cv se calcule aisment, puisquelle vaut simplement
(R = NA kB ' 8,314J/K tant la constante des gaz parfaits)
6. Toutes les rfrences exprimentales que nous considrons pour largon sont tires du NIST Chemistry
Webbook, http://webbook.nist.gov/chemistry/fluid/
95
18.3
18.2
18.3
18.1
18.0
18.1
17.9
17.9
17.8
17.7
17.7
17.6
17.5
17.5
17.4
17.3
1e5
2e5
3e5
4e5
5e5
6e5
17.3
1e5
2e5
3e5
4e5
5e5
6e5
Fig. 5.9. Estimation de la capacit calorifique molaire volume constant Cv en fonction du nombre de
pas de temps.
Cvid =
3
R ' 12,471 J/K.
2
700
1800
600
1600
500
Densit (kg/m^3)
Densit (kg/m^3)
1400
1200
1000
800
600
400
300
200
400
100
200
0
0
200
400
600
800
1000
Pression (MPa)
10
15
20
25
30
35
40
Pression (MPa)
Fig. 5.10. Loi dtat de largon T = 300 K (+) compare des mesures exprimentales (courbe
pleine).
La figure 5.10a compare les rsultats numriques aux donnes exprimentales, ce qui donne
un trs bon accord. On notera que lon peut atteindre par la simulation des rgimes inaccessibles
exprimentalement. Sur la figure 5.10b apparat la tangente lorigine, dont la pente est donne
par la loi des gaz parfaits, soit, avec P en MPa et la densit de masse en kg/m3 ,
P = 6, 2433 102 .
96
Exercices
Exercice 5.1. Lalgorithme Hybrid Monte-Carlo a t propos dans [12] pour chantillonner la
mesure canonique. Cest une chane de Markov, dfinie par la procdure suivante.
Hybrid Monte Carlo
Algorithme 5.3. Pour une configuration initiale q 0 M et > 0,
(1) gnrer des impulsions pn selon la maxwellienne la temprature inverse et calculer
lnergie E n = H(q n , pn ) de la configuration (q n , pn ) ;
(2) calculer (q n , pn ) = (pn, , q n, ), en intgrant la dynamique hamiltonienne sur lintervalle de temps [0, ] en partant de la condition initiale (q n , pn ) ;
(3) calculer lnergie E n, = H(q n, , pn, ) de la nouvelle configuration et accepter la nouvelle
configuration q n, avec une probabilit
n = min(1, e(E
n,
E n )
).
(1) Montrer que les tapes (1) et (2) de lalgorithme (dans le cas o est le flot de la dynamique
hamiltonienne) prservent la mesure canonique.
(2) Montrer que si est le flot de la dynamique hamiltonienne, alors ltape dacceptation/rejet
nest pas ncessaire. Quen est-il dans le cas o est le flot dfini par un schma numrique ?
(3) Montrer que si le schma numrique est rversible et prserve le volume dans lespace des
phases, alors la mesure canonique est invariante par la chane de Markov.
(4) Montrer que cet algorithme nest pas ergodique pour un potentiel harmonique si est gal
un multiple priode, mais quil est ergodique pour les autres choix de . Commenter.
Exercice 5.2. Il est possible de remplacer la rgle dacceptation dans le schma de MetropolisHastings (Algorithme 5.2) par dautres rgles. Montrer par exemple que la rgle de Baker
rBaker (q n , qn+1 ) =
can (
q n+1 )T (
q n+1 , q n )
n+1
n+1
n
can (
q
)T (
q
, q ) + can (q n )T (q n , qn+1 )
6
Un exemple de proprit dynamique : lautodiffusion dans
les fluides
La physique statistique ne se borne pas tudier les proprits des systmes constitus dun
grand nombre de particules en interaction dans leurs tats dquilibre thermodynamique, elle vise
galement prdire comment ils vont voluer au cours du temps sous laction de sollicitations
extrieures. On souhaite ainsi retrouver, par exemple, le comportement visqueux des fluides en
coulement, ou bien les proprits de conductivit thermique des matriaux, partir de lchelle
molculaire. La simulation numrique par dynamique molculaire, puisquil sagit de modliser la
dynamique physique du systme et non pas seulement dchantillonner une certaine mesure dans
lespace des phases a t utilise pour cela ds son origine.
Nous ne donnons ici quune illustration dans un cas simple dun domaine vaste et complexe de
la physique statistique, dont ltude est plus difficile que celle des proprits dquilibre. Lexemple
de lautodiffusion des molcules dun fluide nous permet dillustrer le rle des fonctions de corrlation dpendant du temps et la relation entre rponse linaire des sollicitations extrieures et
corrlations du systme non perturb.
Tout au long de ce chapitre il est admis que les diffrentes moyennes sont values selon la
distribution de Boltzmann-Gibbs, tant entendu que lusage de lensemble canonique est conforme
aux indications du paragraphe 4.4.2 et naffecte que le tirage alatoire dune configuration initiale,
la dynamique hamiltonienne mise en uvre par la suite ignorant tout couplage avec le thermostat.
Les rsultats concernant la thermodynamique et les coefficients de transport macroscopiques sont
indpendants de lensemble statistique utilis pour les obtenir dans la limite thermodynamique
(i.e. dans la limite N +).
6.1 La diffusion de particules marques dans un fluide . . . . . . . . . . . . . . . 98
6.1.1 chelles de temps et nature du mouvement . . . . . . . . . . . . . . . . . . . . . . . . 98
6.1.2 Mouvement brownien et diffusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 99
6.2 Proprits des fonctions de corrlation . . . . . . . . . . . . . . . . . . . . . . . . . . 101
6.2.1 Proprits gnrales des fonctions de corrlation dpendant du temps . 101
6.2.2 Proprits particulires de la fonction dautocorrlation des vitesses . . . 103
6.3 Relation entre corrlation et rponse . . . . . . . . . . . . . . . . . . . . . . . . . . . . 105
6.3.1 Importance des proprits de rponse linaire . . . . . . . . . . . . . . . . . . . . . . 105
6.3.2 Rponse linaire une perturbation du Hamiltonien . . . . . . . . . . . . . . . . 105
6.3.3 Mobilit dune particule . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 106
6.4 Remarques finales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 107
98
(6.1)
caractrise la perte dinfluence de la condition initiale pour la trajectoire dune particule (dans
un fluide, du fait de lisotropie, C(t) peut tre dfinie partir de la corrlation dune coordonne
quelconque x de la vitesse : on a alors C(t) = 3 hvx (0)vx (t)i).
La fonction dautocorrlation de la vitesse est reprsente sur la figure 6.1 1 dans le liquide
de Lennard-Jones, normalise par sa valeur initiale C(0) = 3kB T /m. Elle prsente un dbut
doscillation pour des temps intermdiaires, et ne se distingue plus de zro pour des temps de
lordre de quelques units (rduites). De fait, pendant des intervalles de temps t successifs grands
devant lunit utilise sur cette figure, les dplacements r successifs dune particule dont on suit le
1. Rsultats dus D. Lvesque et L. Verlet, cits dans [20].
99
Fig. 6.2. Trajectoire dune particule dans le fluide de sphres dures pour la compacit = 0,24, vue en
projection dans les 3 plans de coordonnes. Les points noirs reprsentent les positions aux moments des
collisions, qui correspondent un changement de direction de la vitesse.
mouvement sont dcorrls. On a alors une marche alatoire dont les trajectoires erratiques, comme
le montre la figure 6.2, rappellent celles dun mouvement brownien (comparer la figure 5.3).
6.1.2 Mouvement brownien et diffusion
Hypothse dindpendance et consquences
Prcisons cette analogie, en admettant (cest une hypothse trs forte, qui nest pas exacte
en pratique) que les dplacements ri de la particule pendant des intervalles de temps successifs
t sont statistiquement indpendants. Ils sont alors galement quidistribus (le mouvement dune
particule est un processus stationnaire lquilibre), de moyenne nulle (par isotropie) et admettent
une matrice de covariance que nous prenons gale :
hr r i = 2Dt ,
dfinissant ainsi le coefficient D. Pour simplifier, tudions le mouvement selon la coordonne x
les autres coordonnes variant de faon indpendante. Agrgeons M 1 pas x, dfinissant des
pas plus grands x, correspondant aux mouvements pendant des intervalles de temps successifs
de longueur t = M t. Nous obtenons alors une chane de Markov (xn )nN , avec, en vertu du
thorme de la limite centrale,
xn+1 = xn + 2D t Gn ,
avec des variables alatoires Gn N (0, 1) indpendantes, cest--dire exactement (5.8) : on retrouve la discrtisation du mouvement brownien introduite au chapitre 5. temps long devant
t, on sait que chacune des coordonnes du vecteur bout--bout r(t) r(0) de la chane est
distribue comme N (0, 2Dt). Il y a talement, ou diffusion de la densit de probabilit de prsence du marcheur alatoire, et D, dont la dimension est [L]2 [T ]1 , est par dfinition le coefficient
de diffusion. Ltalement de cette densit correspond, physiquement, au mlange progressif des
100
molcules marques avec le reste du fluide, jusqu ce que leur concentration soit uniforme dans
lchantillon. tout instant t, la concentration c de particules marques obit lquation de
diffusion :
c
= Dc.
(6.2)
t
Il en est de mme pour la densit de probabilit de la position dune seule particule.
Test numrique
On peut vrifier quen dpit de lusage de lapproximation dindpendance, qui est une simplification, les observations sont bien en accord avec les conclusions quon en a tires concernant la
description statistique du mouvement long terme. Ainsi, on a bien r2 (t) t pour le carr de la
distance parcourue, comme le montre la figure 6.3, aprs quelques collisions dans le cas des sphres
dures, ou plus gnralement une fois passe la dure caractristique doscillation dune particule
dans la cage forme par ses proches voisines. Dans les simulations, on peut donc obtenir le
Fig. 6.3. Carr moyen de la distance parcourue, |r(t) r(0)|2 fonction de t dans le fluide de sphres
dures = 0,24 (mmes units que celles de la figure 2.2).
|r(t) r(0)|2
D = lim
t+
6t
(6.3)
101
peut tre dcrit comme brownien toutes les chelles de temps physiquement pertinentes pour
dcrire leur trajectoire.
Le coefficient de diffusion des particules collodales est nettement plus faible que celui des
molcules. On verra plus loin pourquoi il est donn par la formule (1.5).
hA t i = hAi ,
et, en considrant le produit de deux observables, fonctions de (Q, P) que lon peut composer avec
le flot hamiltonien t pour diffrentes valeurs de t, on trouve :
t, t0 R,
Pour les observables qui sont des fonctions diffrentiables des coordonnes des microtats, on peut
dfinir leur drive par rapport au temps par :
A =
N
N
X
X
A
A
A H
A H
q i +
p i =
.
q
p
q
p
p
i
i
i
i
i qi
i=1
i=1
(6.5)
La stationnarit entrane des relations utiles pour des fonctions de corrlation impliquant de telles
drives temporelles des observables. En effet, notons dabord que lon peut permuter moyenne et
drive par rapport au temps, on a ainsi
Z
d
d
hA(0)B(t)i =
A(Q, P)B t (Q, P)dcan (Q, P)
dt
dt
Z E
D
E
=
A(Q, P)B t (Q, P)dcan (Q, P) = A(0)B(t)
.
E
En crivant ensuite que la drive de hA(t0 )B(t + t0 )i par rapport t0 sannule (stationnarit), on
obtient pour des observables quelconques, fonctions rgulires des qi et des pi , lgalit :
D
E
D
E
d
102
(6.8)
de sorte que la moyenne dune observable impaire est nulle, ainsi que la covariance de deux observables de parits opposes.
Considrons maintenant deux observables A et B ayant des parits dfinies A et B , et cherchons relier CAB (t) CBA (t). Pour simplifier lcriture, nous supposons quitte remplacer A
par A hAi et B par B hBi que leurs moyennes sont nulles. Exploitant dabord (2.4), sous la
forme t = S t S, on a :
CAB (t) = hA(B t )i = hA (B S t S)i ,
qui entrane daprs (6.8) applique au produit des deux observables, sachant que S S = I,
CAB (t) = h(A S) (B S t )i ,
que lon transforme alors par (6.7) applique A et B en
CAB (t) = A B hA(0)B(t)i .
Invoquant alors la stationnarit qui entrane que
CAB (t) = CBA (t),
(6.9)
(6.10)
il vient :
Nous verrons plus loin que les fonctions de corrlation donnent directement la rponse des systmes
tudi en physique statistique des sollicitations extrieures. Dans ce contexte la proprit (6.10),
issue de la rversibilit en temps de la dynamique hamiltonienne au niveau microscopique, a des
consquences remarquables au niveau de la thermodynamique hors dquilibre macroscopique.
Dcorrlation temps long
Une proprit gnrale des fonctions de corrlation que nous admettons est quelles possdent
la limite nulle pour t + : pour deux observables quelconques A et B, on a
lim CAB (t) = 0,
t+
cest--dire
t+
Il sagit dune proprit, lie lergodicit, appele proprit de mlange de la dynamique hamiltonienne, dont nous admettons que les systmes dintrt physique constitus dun grand nombre
de particules en interaction sont dots en gnral (cf. la discussion de lergodicit au Chapitre 3,
Remarques 3.1 et 3.2). La proprit de mlange est plus forte que la proprit dergodicit au sens
de lgalit des moyennes sur le temps et des moyennes densemble.
103
Une majoration
Une application directe de lingalit de Schwarz, en utilisant la stationnarit, donne, pour
toutes observables A et B tout instant t :
1
|r(t) r(0)|
Z tZ
=
0
|r(t) r(0)|
Z tZ
=2
0
t1
|r(t) r(0)|2 = 2
(t u)C(u)du,
0
Z t
lim
u
C(u) du = 2
t
C(u) du
0
104
2
m
dv
1
2
=
|F| .
0 =
3kB T
dt
3mkB T
En convenant que les gradients sont pris par rapport la position de la particule marque, et en
notant V (fonction de toutes les positions) lnergie potentielle totale, on a :
Z
2
kB T
|F| =
V (exp[V ]) dQ,
Zq DN
do, par une intgration par parties, 2 on tire
Z
2 kB T
|F| =
2 V exp[V ]dQ.
Zq DN
0
Avec le potentiel de paire V(r), fonction de la distance seule, dont le laplacien est V 00 (r) + 2 V r(r) ,
cela scrit :
Z +
2
V 0 (r)
2
00
|F| = 4kB T
r g(r) V (r) + 2
dr.
r
0
On a donc :
Z
4 + 2
V 0 (r)
02 =
r g(r) V 00 (r) + 2
dr.
(6.12)
3m 0
r
La quantit 0 est appele frquence dEinstein. Autour de la particule marque et la distance r
le champ de densit moyen est g(r). Il en rsulte une force nulle lorigine, qui correspond un
minimum local du potentiel associ ce champ de densit. La frquence 0 est exactement gale
la pulsation propre des oscillations dune particule de masse m au voisinage de ce minimum.
La frquence dEinstein fixe le temps caractristique des variations rapides de la vitesse dun
particule. La connaissance de 0 permet un choix appropri du pas de temps dans les simulations.
Le pas de temps t se comparera alors 1/0 (typiquement on prendra 0 t dordre 1/10).
Comportement temps long
Le retour zro de la fonction dautocorrlation de la vitesse C(t) dtermine loubli des conditions initiales et la possibilit de passer, pour les temps plus longs, une description markovienne
du mouvement alatoire dune particule. Il est donc important de connatre le comportement
asymptotique de la fonction dautocorrlation temps long. Les modles les plus simples, fonds
sur lapproximation dune suite de collisions dcorrles, par exemple, dans le cas des sphres dures
(hypothse simplificatrice remontant Boltzmann, dite du chaos molculaire ), prdisent une
dcroissance exponentielle de C(t). Or, on a 3 :
2. le terme de flux au travers de DN sannule dans le cas dun systme confin par un potentiel de
bote ; et en fait la nature locale de la moyenne recherche entrane que le rsultat doit tre indpendant
de la nature des conditions aux limites.
3. Pour ce comportement, on peut fournir lexplication suivante [20], en comparant la vitesse de la
particule suivie celle dune petite rgion dans un fluide, qui serait anime dune vitesse suprieure, dans
une certaine direction, celle du fluide ambiant. La dcorrlation correspond alors la perte progressive de
cette diffrence de vitesse. Celle-ci se produit, dans un coulement,
par diffusion : la quantit de mouvement
est diffuse dans une rgion dont le diamtre crot comme t, tant la viscosit cinmatique. Cette
quantit de mouvement est mv, avec une masse m qui augmente comme t3/2 . La vitesse v doit donc
dcrotre comme t3/2 .
105
(6.13)
Cette dcroissance algbrique de C(t) tmoigne deffets collectifs complexes et persistants, difficiles
modliser. En fait, la fonction dautocorrlation de la vitesse dune particule collodale prsente
galement ce comportement temps long, ce qui montre quelle nest pas correctement dcrite
par lquation de Langevin (cest--dire (5.13) avec un potentiel V nul), cense modliser de telles
particules msoscopiques ! En effet (exercice) la dynamique de Langevin pour une particule isole
prdit une dcroissance exponentielle de la fonction dautocorrlation de sa vitesse.
Ce comportement temps long ne remet pas en cause, du moins dans un espace trois dimensions, lexistence dun coefficient de diffusion. Dans un espace deux dimensions, en revanche, on
ne parvient pas dfinir un coefficient de diffusion indpendant de la taille du systme.
106
Le paramtre peut dpendre du temps. Admettre une rponse linaire dune observable
quelconque A aux perturbations passes, cest postuler lexistence dune fonction de rponse que
nous noterons AB (t), telle que lon ait tout instant t :
Z
hA(t)i hA(t)i hAi0 =
AB (t u)(u)du.
(6.14)
Dans cette formule, hA(t)i est la moyenne selon un macrotat (mesure de probabilit) qui est
influenc par lhistoire de la perturbation (t), mais proche du macrotat dquilibre canonique
du Hamiltonien H0 du systme non perturb. Pour crire (6.14), nous avons suppos que, la
perturbation tant faible, son application nentranait aucune volution importante du systme,
qui ne vieillit pas, cest pourquoi leffet linstant t dune perturbation t0 ne dpend que de
la diffrence t t0 . De plus, on doit bien sr imposer la condition que la rponse ne dpende que
du pass : AB (t) est nulle pour tout t < 0.
Supposons maintenant que nous avons appliqu une perturbation constante (ou trs lentement
croissante) = 0 tout instant t < 0, de sorte qu t = 0 on a atteint le macrotat dquilibre
(canonique) avec le Hamiltonien (4.13) pour la valeur 0 . Alors les moyennes des observables
peuvent tre calcules, au premier ordre en , selon (4.14). linstant t = 0, supprimons la
perturbation : on aura (t) = 0 pour tout t > 0. Le systme volue alors avec la dynamique
hamiltonienne en labsence de perturbation, caractrise par le flot t . Nous pouvons alors valuer
hA(t)i, dfinie en (6.14), de deux faons diffrentes. Selon (6.14), nous avons :
Z
hA(t)i = 0
AB (t u)du = 0
AB (u)du.
(6.15)
(6.16)
En notant H(t) la fonction de Heaviside (qui vaut 1 si t 0 et 0 si t < 0), lgalit pout tout t
des seconds membres de (6.15) et de (6.16) donne le rsultat :
AB (t) =
d
CBA (t)H(t) = CB A (t)H(t).
dt
(6.17)
hv(t)i =
(t u)F (u)du,
C(t)H(t),
3
107
o nous retrouvons la fonction dautocorrlation de la vitesse C(t), qui exprime donc la rponse
de la vitesse une histoire de la force applique.
On appelle mobilit dune particule dans un fluide le coefficient de proportionnalit entre la
vitesse moyenne quelle acquire en rgime stationnaire et la force constante quon lui applique.
On a par dfinition
Z
Z +
+
C(t)dt.
=
(t)dt =
3 0
0
Par comparaison avec (6.11), on a donc
D = kB T.
(6.18)
Lorsque la particule suivie est de taille msoscopique, cest--dire grande lchelle molculaire
(mais elle doit rester assez petite toutefois si on veut pouvoir dceler son mouvement brownien),
sa mobilit se calcule simplement par lhydrodynamique macroscopique. Le mouvement dune telle
particule est gnralement en rgime de Stokes (trs faible nombre de Reynolds), et on a pour une
sphre de rayon R anime de la vitesse v la force visqueuse
Fv = 6Rv,
tant la viscosit de cisaillement du fluide. Sous laction dune force applique F , la vitesse en
rgime stationnaire est telle que F + Fv = 0, ce qui fournit la mobilit :
=
1
.
6R
kB T
,
6R
qui est donc tablie dans le cas dune particule collodale dont la mobilit est donne par lhydrodynamique de Stokes macroscopique.
Avec T = 293 K, = 103 Pa.s (viscosit de leau 293 K), R = 107 m, on a ainsi
D ' 21012 m2 s1 . Comme on la signal au Chapitre 1, la formule de Stokes-Einstein donne un
trs bon ordre de grandeur des coefficients dautodiffusion dans les liquides constitus de petites
molcules, qui sont donc de lordre de 109 m2 s1 .
On remarquera que la diffusion molculaire dans les liquides est un phnomne trs lent notre
chelle. Le temps caractristique D pour un transport diffusif sur une distance L est D = L2 /D,
il est inversement proportionnel la taille des particules diffusantes et atteint dj 105 secondes
(une journe) pour L 1 cm do lutilit de la petite cuiller pour homogniser la concentration
du sucre dans une tasse de caf !
108
V
kB T
La proprit de symtrie (6.10) des fonctions de corrlation est en fait lorigine des relations
de rciprocit dOnsager [23], important rsultat de la thermodynamique des phnomnes
hors dquilibre coupls. Un tel couplage se rencontre par exemple dans les conducteurs,
pour lesquels un gradient de potentiel lectrique entrane un courant lectrique (loi dOhm)
et aussi un flux de chaleur (effet Peltier), tandis quun gradient de temprature entrane un
flux de chaleur (loi de Fourier) et aussi un courant lectrique (effet Seebeck). Les rponses des
flux (chaleur, courant) aux forces conjugues (gradients de temprature ou de potentiel)
font intervenir une matrice de coefficients de rponse dont les relations de rciprocit, issues
de (6.10), tablissent la symtrie.
Partie II
7
Introduction historique : la rvolution quantique
La mcanique quantique est une thorie physique apparue au dbut du vingtime sicle. Venant
au secours de la mcanique Newtonienne et de llectromagntisme pour dcrire le monde de
linfiniment petit, elle proposait une vision pour le moins rvolutionnaire du fonctionnement des
constituants intimes de la matire et de la lumire. Incroyable pour certains (mme pour le grand
Albert Einstein !), choquante, trange, elle a pourtant donn le coup denvoi dun sicle de progrs
technologiques sans prcdents.
Le monde physique en 1900
Comme pour toute thorie, ses dbuts furent difficiles. A la fin du 19me sicle, le temps des
conservatismes religieux de lEurope, qui avaient fait abjurer Galile en 1633, est certes rvolu.
Pour autant, le monde scientifique connat un moment dautosatisfaction, qui le rend peu rceptif
aux ides nouvelles. Les physiciens ont en effet leur disposition trois thories, dites de nos jours
thories classiques, trs abouties :
la mcanique Newtonienne , dveloppe partir du 17me sicle, qui met en quations le
mouvement des corps, et dont les concepts se retrouvent la base des disciplines que sont
la mcanique des fluides et la rsistance des matriaux ;
la thermodynamique, ne au dbut du 19me sicle, que Boltzmann vient vers la fin du 19me
sicle de faire voluer jusqu sa version statistique ;
llectromagntisme, labor dans la deuxime moiti du 19me sicle, qui apprhende dans
une thorie unifie le caractre ondulatoire de la lumire et les phnomnes doptique, les
phnomnes dlectro et de magntostatique, ainsi que ceux de conduction et dinduction
lectrique.
Dans ces thories, les constituants de ce monde se partagent en deux entits clairement distinctes :
la matire, dune part, cest dire les corps solides, liquides ou gazeux, mais surtout palpables, que la mcanique classique apprhende au travers de la notion de particule, ou plus
prcisment, de point matriel. Cette entit a un caractre ponctuel et se meut dans lespace le long dune trajectoire. Soulignons quil nest pas encore question datome lpoque.
Lide de ces grains lmentaires de matire, emprunte la philosophie grecque antique,
fait encore dbat. Ds 1869, Mendeleev a certes dj labor sa fameuse classification des
lments. Pour autant, il faudra attendre la preuve exprimentale de lexistence de llectron
en 1897, puis de celle du noyau atomique en 1912, pour convaincre les derniers incrdules ;
les champs diffus (champ de gravitation, champ lectrique, champ magntique), qui occupent
tout lespace, vide et matire compris, et sont capables dinteraction avec la matire. Leurs
mouvements (au moins pour les champs lectromagntiques) prennent la forme de dformations, appeles ondes, plus ou moins tendues travers lespace, et qui ont la proprit
de se propager.
Force est de constater que ces thories expliquent remarquablement grand nombre daspects du
monde tel que nous le percevons avec nos cinq sens. Elles sont par ailleurs entirement suffisantes aux dveloppements technologiques de lpoque. Il nest ainsi pas trs tonnant quen 1892,
112
113
le don dubiquit des particules : une particule peut occuper simultanment plusieurs points
de lespace ;
limpossibilit de faire une mesure sur un systme sans modifier ltat de ce dernier ;
le fait que le rsultat de cette mesure est quasi-systmatiquement alatoire, tout en ne
pouvant prendre que des valeurs bien prcises.
Et la liste nest pas exhaustive. Quiconque nest pas choqu par la thorie quantique ne la pas
comprise , disait Niels Bohr, un des ses fondateurs. De nos jours, prs de 100 ans aprs ses
premiers balbutiements, et aprs pratiquement autant dannes de mise en oeuvre sans faille, la
mcanique quantique heurte toujours le sens commun. Le fait est que loin de se limiter nos
fournir de nouveaux outils mathmatiques pour dcrire la nature, la mcanique quantique nous
met face un monde que nous connaissons mal, et dont nous navons en gnral aucune intuition.
Au del de ses principes physiques, la thorie quantique choque aussi par son formalisme mathmatique. Les quations peuvent paratre, dune certaine manire, plus compliques, et la ralit
physique plus lointaine que dans les thories classiques, tel point quau dbut du 20me sicle,
cette thorie des quantas fut parfois appele mcanique des matrices. Soulignons qu lpoque,
les concepts mathmatiques sur lesquels elle sappuie, notamment les espaces de Hilbert et dans
une moindre mesure, les distributions, sont eux-mme loin dtre aboutis. Cest ainsi un dveloppement conjoint de la physique et des mathmatiques que lon a assist. La thorie quantique
doit beaucoup pour sa mise en forme des mathmaticiens comme Hilbert ou Von Neumann. En
retour, elle a t source dinspiration pour lancer de nouveaux sujets de recherche en mathmatique. Il nest dailleurs pas rare que certains rsultats de la thorie quantique, initialement admis
par les physiciens en tant que faits exprimentaux, mais sans que lon sache les dmontrer, naient
vu leurs preuves mathmatiques apportes que longtemps aprs.
La thorie quantique tonne donc, et pourtant, aprs un sicle de confrontation continue avec
lexprience, force est de constater que... a marche ! Jamais mise en dfaut ce jour, elle parvient, en ne sappuyant que sur un petit nombre de principes, rendre compte avec une extrme
finesse de toujours plus dobservations exprimentales. Construite lorigine sur la base dexpriences impliquant des lectrons, sa validit a pu depuis tre vrifie sur les noyaux atomiques
puis les constituants les plus intimes de la matire. La comprhension quelle a donn du monde
microscopique a permis dimaginer, puis de raliser, nombre de dveloppements technologiques et
scientifiques du 20me sicle :
les machines lectroniques semi-conducteurs , que lon retrouve aujourdhui partout, de la
simple montre lordinateur le plus perfectionn, en passant par le lave linge, les systmes
de communication, et les panneaux solaires ;
les nouvelles sources lumineuses : la lumire LASER, bien sur, et ses innombrables applications scientifiques, industrielles et mdicales, mais aussi les diodes lectroluminescentes
(LED), qui, simples voyants dappareils ou lments de tlcommandes infra-rouges lorigine, deviennent aujourdhui une vritable source conomique dclairage ;
les techniques de spectroscopie analytique (spectroscopie dabsorption UV-visible-Infra rouge,
spectroscopie de fluorescence, Rsonance Magntique Nuclaire,. . . ) qui permettent en peu
de temps de retrouver la structure chimique de composs, que ce soit dans un tube essai
ou aux confins de lespace. Citons galement un appareil de notre quotidien driv de ces
techniques : le four micro-ondes ;
une nouvelle discipline scientifique : la chimie quantique. La physique quantique donne les
clefs de comprhension du mcanisme de la liaison chimique, et permet maintenant de prdire, lavance, par le biais de la simulation numrique et - nouveau- grce de considrables
dveloppements en mathmatiques appliques, parfois bien mieux que lexprience, quelles
seront les proprits dune molcule donne ;
loin de linfiniment petit, on a dcouvert quil existait aussi des systmes de grande taille
rgis par la mcanique quantique : des corps clestes tels que les toiles neutrons, mais
galement des corps notre chelle, tels que les aimants, dont seule la physique quantique
explique laimantation temprature ambiante. Noublions pas enfin les supraconducteurs,
riches dacquis autant que despoirs au plan technologique.
114
Une fois que lon a, sinon compris, du moins assimil et admis les fondements de la physique
quantique, il est frappant de raliser que loin dtre abstraite et inaccessible, elle est a la base
de nombre de petites choses de notre quotidien. La couleur des objets, par exemple, ou le fait,
tout simplement, que tous les matriaux denses qui nous entourent ont des masses volumiques
comparables, de lordre de 1 10 kg par litre.
Les thories quantiques : Mcanique quantique et Thorie des champs
Parlons maintenant de mcanique quantique. Car peut-tre lavez vous remarqu, nous navons
jusquici employ que le terme de physique quantique. La physique quantique dsigne lensemble des
adaptations quont connues au dbut du vingtime sicle la mcanique Newtonienne et llectromagntisme. La distinction entre les deux disciplines, clairement spares lorigine, est devenue
un peu plus floue sur le fond, mais sest nanmoins maintenue en grande partie dans la forme, si
bien que la physique quantique se retrouve divise en deux branches :
la mcanique quantique, qui se proccupe, comme la mcanique classique, du mouvement et
de la dynamique de la matire, et qui peut tre vue comme une extension de la mcanique
classique vers les chelles microscopiques ;
la thorie quantique des champs : elle englobe en premier lieu loptique quantique, attache
la description des champs lectromagntiques, et qui manipule entre autres la notion de
photons. Mais elle sintresse de manire plus gnrale tous les phnomnes vibratoires
non localiss (ondes acoustiques dans les solides, avec la notion de phonons). Beaucoup plus
difficile daccs que la mcanique quantique, nous nous contenterons dy faire ponctuellement
allusion.
Physique quantique vs physique classique
Lhistoire nous enseigne donc que la thorie quantique a t pense comme complmentaire
de la thorie classique. Ce serait un contresens que de vouloir les opposer. La thorie quantique
est un largissement et un raffinement de la thorie classique, et permet de dcrire de nouveaux
phnomnes physiques. Rciproquement, la thorie classique peut tre vue comme un moyen de
simplifier la thorie quantique dans certaines situations.
Dans ce cours, nous verrons que, bien que le formalisme de la mcanique quantique soit clairement distinct de celui de la mcanique classique, il contient en lui nombre de rsultats dits
classiques. Un de nos soucis dans les pages qui viennent sera de faire ressortir, chaque fois que cela
sera possible, ces similarits.
8
La particule quantique isole
Le premier systme que nous tudions dans le cadre de la thorie quantique est une particule
isole qui se dplace dans le vide, sans la moindre interaction avec lextrieur. Ce systme simple
permet dintroduire le formalisme des fonctions donde. Alors que la mcanique classique enseigne
que la particule, pour peu quon lobserve dans un repre Galilen, suit un mouvement rectiligne
et uniforme, la thorie quantique prdit dj un comportement beaucoup plus riche.
116
Fig. 8.1. La fonction donde complexe (r, t) et la probabilit de prsence (r, t) = |(r, t)|2 .
Une interprtation physique de (r, t) est donne par le phnomne exprimental suivant :
lorsquon cherche, au moyen dun instrument de mesure, localiser la position de la particule
dans lespace, cette dernire se matrialise en un point , choisi alatoirement parmi les positions o (r, t) 6= 0. Au cours de ce processus, tous les points possibles dapparition ne sont pas
quiprobables. La probabilit p(B) de trouver la particule dans un domaine B de lespace est
Z
p(B) =
|(r, t)|2 dr.
B
R3
Par abus de language, (r, t) est souvent simplement appele probabilit de prsence. Au vu de
ces relations, la probabilit de prsence sexprime en m3 , et lamplitude en m3/2 .
Dun point de vue mathmatique, lespace des fonctions donde est un espace de Hilbert 2 ,
que lon notera H par la suite. Dans le cas dune particule sans spin 3 , lespace H est identifi
lespace L2 (R3 , C).
8.1.2 Lquation de Schrdinger
Postulat 8.1. Lvolution temporelle en repre Galilen de la fonction donde dune particule
isole de masse m est rgie par lquation de Schrdinger :
i~
~2
=
.
t
2m
(8.2)
Dans cette quation, i est le nombre complexe tel que i2 = 1, et dsigne loprateur
Laplacien par rapport la variable despace r. Lquation de Schrdinger est ainsi une quation
dvolution. Le fait quelle est bien pose mathmatiquement sera vu dans un cadre plus gnral
au 9.1.2.
1. Le formalisme des fonctions donde permet galement de dcrire simultanment plusieurs particules
(voir le chapitre 13).
2. On rappelle quun espace de Hilbert est un espace vectoriel norm complet muni dun produit scalaire.
3. Vous avez certainement entendu parler de cette petite flche oriente vers le haut ou le bas dont on
affuble llectron dans certaines situations. Nous verrons au 12.6 quoi elle correspond prcisment, et
surtout, dans limmdiat, nous loublions !
117
118
Preuve. La dmonstration sera dveloppe dans un cadre plus gnral au 9.1.4. Elle consiste
formellement considrer la quantit :
Z
N (t) =
|(r, t)|2 dr.
R3
dN
dt
Ce rsultat permet de ne pas faire de la condition de normalisation une proccupation permanente : il suffit en particulier quelle soit vrifie dans les conditions initiales dun problme pour
quelle soit vrifie tout le temps.
8.2.2 Forme locale de la conservation des probabilits : Courant et Vitesse de
probabilit
La conservation globale de la probabilit de prsence (r, t) = |(r, t)|2 peut scrire de manire
locale, la manire dune conservation de la masse en mcanique des fluides 4 . Dans les dfinitions
qui suivent, (r, t) dsigne la phase de la fonction donde.
Dfinition
p 8.3 (Courant et vitesse de probabilit). Etant donne une fonction donde
(r, t) = (r, t)ei(r,t) qui dcrit ltat quantique dune particule de masse m, on appelle courant
de probabilit le champ de vecteurs valeurs relles :
J(r, t) = i
~
.
2m
(8.3)
~
.
m
(8.4)
Le caractre rel du courant de probabilit vient du fait que le terme de droite de (8.3) est
la diffrence de deux quantits complexes conjugues. Ces deux nouvelles grandeurs prennent
pleinement leur sens physique grce la proprit (formelle) suivante :
Proprit 8.1 (Conservation locale). La probabilit de prsence (r, t), le courant de probabilit J(r, t), et la vitesse de probabilit v(r, t) vrifient les relations suivantes de conservation locale
de la probabilit de prsence :
J(r, t) = (r, t)v(r, t),
(8.5)
+J=
+ (v) = 0.
t
t
Ces quations forment un systme hyperbolique de lois de conservation.
(8.6)
La premire des
pdeux relations se montre simplement en considrant des fonctions donde de
la forme (r, t) = (r, t) ei(r,t) dans lexpression de J. On laisse en exercice le fait que
J=
~
.
m
Pour la seconde relation, il suffit de vrifier lquation concernant le vecteur J. Par lquation de
Schrdinger (8.2),
i~
i~
=
, et
=
.
t
2m
t
2m
Il vient ainsi :
4. Dailleurs, ce champ scientifique est celui de lhydrodynamique quantique (quantum hydrodynamics).
119
i~
=
+
=
.
t
t
t
2m
Par ailleurs,
J = i
~
~
+ = i
.
2m
2m
120
k R ,
3
u
(k) = F(u)(k) = (2)
3/2
u(r)eikr dr
R3
Z
hf, gi =
f (r)g(r) dr
R3
3
C0 (R ),
Z
Z
Z
~2
~2
~2
=
=
.
2m
2m
2m
R3
R3
La proprit fondamentale qui suit permet dappliquer beaucoup de rsultats importants (rappels
en Appendice C).
0 ). Loprateur
Proposition 8.2 (Caractre auto-adjoint de H
2
0 = ~
H
2m
H2 (R3 ). Comme C
0 (R ) D(H0 ), H0 est bien domaine dense dans H. Par dfinition,
~2
2
3
2
3
2
3
D(H0 ) = u L (R ), v L (R ), w H (R ),
w, u = hw, vi .
2m
Or,
Z
~2
~2
2
~2
|k| w,
u
=
w, u =
w(k)
(|k|2 u
(k)) dk.
2m
2m
2m R3
121
~2
u = v L2 (R3 )
2m
est quivalent
u=F
v
||2 +
~2 ||2
2m
H2 (R3 ).
~
Linverse ( 2m
)1 est donc de domaine dense et born.
0 ) = ess (H
0 ) = c ( H
0 ) [0, +[. Montrons prsent ess (H
0) =
On a donc ce stade (H
3
[0, +[. On considre pour ce faire 0, C (R ) telle que
soit support dans B(0, 2), et
de norme kkL2 (R3 ) = 1. On dfinit alors la suite de fonctions
r 0
r
u(r) = n3/2
eik r ,
un (r) = n3/2
n
n
2
0 2
|k |
~
o k0 R3 est tel que ~ 2m
= . On a, au sens des distributions, 2m
u = u, mais u 6 L2 (R3 ).
En revanche, un L2 (R3 ) pour tout n et
2
u
+
,
n
n
2m
m n5/2
n
2m n7/2
n
on a bien k
~2
2m un
~2
2m
Ek =
~2 |k|2
,
2m
E
i kr ~k t
sont des solutions au sens des distributions de (8.2). Cette forme de fonctions, appeles ondes
planes, ne correspond toutefois pas des fonctions dtats physiquement admissibles car elles ne
sont pas de norme L2 (R3 ) finie. Ce sont des tats propres gnraliss (mathmatiquement, des
limites de suites de Weyl).
La solution gnrale normalisable de lquation de Schrdinger sobtient en considrant un
paquet dondes, cest dire une superposition linaire de plusieurs ondes planes (en utilisant une
fonction de pondration (k)) :
122
1
(r, t) =
(2)3/2
Z
(k)e
E
i kr ~k t
(8.7)
dk,
R3
avec L2 (R3 ). Notons que (r, t) est la transforme de Fourier inverse de (k)e ~ Ek t . On
vrifie que la fonction ainsi construite vrifie bien lquation de Schrdinger dans le vide (8.2)
ds que
Z
i
R3
R3
|(k)|2 dk.
E
i kr ~k t
(8.9)
Une reprsentation schmatique de ces ondes est donne par la figure 8.2. Bien quils ne soient pas
normalisables, ces tats sont beaucoup utiliss en pratique pour dcrire la situation limite dans
laquelle la fonction de pondration devient extrmement pique autour dun vecteur donde
k donn. Cest le cas bien souvent des particules mises depuis une source lointaine 6 . En tant
qutat limite, la norme de londe de Broglie perd son sens physique de probabilit de prsence.
En revanche, sa phase garde toute sa pertinence.
Les ondes de De Broglie sont caractrises par leur vecteur donde k, et leur pulsation qui
2
vaut ici = E~k = ~k
2m . Ce rsultat confirme, sil tait encore besoin de sen convaincre, que
lquation de Schrdinger se comporte comme une quation des ondes. La particule peut donc
prendre des aspects trs diffrents :
6. Nous nous garderons bien de prciser ce que signifie lointain dans le cas prsent, mais pour nous
fixer les ides, cela sapplique aux lectrons mis par le canon lectrons dun tube cathodique, aprs
quelques dizaines de centimtres de parcours. La fonction donde tend naturellement staler sur une
distance certes modeste pour nous, mais considrable pour cette particule. Les conditions particulires
dacclration initiale de la particule lui garantissant son caratre monochromatique, on peut alors, en
premire approximation, dire que ltat de llectron en question est une onde de de Broglie vis vis dun
obstacle que llectron viendrait percuter. Cette proprit est la base du fonctionnement des microscopes
lecroniques transmission.
123
dune part, elle est capable de se matrialiser en un seul point de lespace lorsquon cherche
mesurer sa position ;
dautre part, elle peut, avec des tats sapprochant des ondes de De Broglie, galement
exhiber une comportement purement ondulatoire totalement dlocalis dans lespace.
Ces deux situations extrmes fixent le cadre de ce quon a coutume dappeler la dualit ondecorpuscule.
En tant que limite dtats normalisables (au sens des suites de Weyl), il est utile de donner
un sens physique aux ondes de De Broglie, par exemple en les reliant des concepts de physique
classique.
(1) Quelle est la vitesse de propagation de londe ? Les rsultats de la mcanique classique donnent
vonde =
k
~k
=
.
|k|2
2m
Une premire remarque vient du fait que contrairement, par exemple, llectromagtisme et
aux ondes acoustiques, les ondes de de Broglie ne se propagent pas une vitesse unique. Leur
vitesse de propagation est proportionnelle au vecteur donde k considr.
(2) Quelle est la vitesse de la particule ? Il ne sagit pas directement de la vitesse de londe. Car
londe nest pas la particule, mais uniquement un objet mathmatique qui la dcrit. Nuance
de taille ! La bonne vitesse considrer ici est celle du dplacement des probabilits de prsence. Elle ne dpend de la fonction donde que par sa phase, et le problme de normalisation
nempche donc pas de la calculer :
vprobabilit (r, t) =
~
~k
=
.
m
m
~2 k2
1
mv2probabilit =
= Ek = ~.
2
2m
124
La quantit Ek intervenant dans la dfinition (8.9) des ondes de De Broglie sidentifie donc
lnergie cintique 7 .
Les deux dernires relations ci-dessus se remettent en forme sous la forme condense :
p = ~k,
E = ~.
(8.10)
Elles ont t tablies par Louis De Broglie en 1923. Elles dictent une rgle assez gnrale qui
permet, lorsquon ne connat pas le dtail de la fonction donde dune particule, de dfinir les
caractristiques essentielles de son comportement ondulatoire partir de la seule connaissance
de sa vitesse. Elles sappliquent dans toutes les situations o, de par sa prparation physique,
la particule acquiert un comportement monochromatique et dlocalis. Elles relient quantit de
mouvement et nergie cintique respectivement au vecteur donde et la pulsation. Remarquons
le rle central jou par la constante de Planck.
Historiquement, en 1923, lexprience dite deffet Compton venait de mettre clairement en
vidence le caractre corpusculaire de la lumire, et les relations (8.10) venaient dtre identifies
comme celles donnant linterprtation corpusculaire des ondes lumineuses (dans le sens o les
photons associs une onde de pulsation et de vecteur donde k ont une impulsion p et une
nergie cintique E dfinies par (8.10)). De Broglie, cherchant transposer ce concept de dualit
la matire, reprit ces relations sur des bases purement pragmatiques.
8.5.2 Le paquet donde quasi-monochromatique
Ce modle de fonction donde correspond la situation dans laquelle la distribution utilise
dans la construction du paquet donde (8.7) est une approximation dune distribution de Dirac
(centre en un vecteur donde k0 ). Il offre un moyen de rsoudre la question de normalisation de
londe de De Broglie. La fonction donde propose est de la forme :
(r, t = 0) ' eik0 r F (r) .
Londe de De Broglie de vecteur k0 est multiplie par une fonction enveloppe F (r), que lon suppose
trs rgulire, au sens o ses drives despace premire et seconde sont ngligeables devant les
quantits |k0 | et |k0 |2 respectivement. La fonction F (r) permet de satisfaire la normalisation,
et fait apparatre explicitement le fait que la particule ne remplit jamais en pratique tout lespace
(voir la figure 8.3).
Si lon regarde (r, t = 0) comme un paquet donde (8.7), la pondration (k) est, une
translation prs de vecteur k0 , la transforme de Fourier de F (r), au moins au temps t = 0. On
peut alors donner une expression approche de (r, t), en effectuant un dveloppement limit
lordre 2 de lexponentielle dans lintgrale (8.8),
7. Nous verrons en fait dans les chapitres prochains quil faut interprter Ek comme lnergie totale de
la particule
(r, t) ' e
Ek
i k0 r ~ 0 t
= k0 (r, t)
125
Z
1
1
(k)ei(kk0 )(r ~ Ek (k0 )t) dk
3/2
(2)
R3
1
F r Ek (k0 )t .
~
On observe que les composantes onde k0 et enveloppe F ont chacune leur comportement propre
(voir la figure 8.4) :
londe de De Broglie k0 se dplace la vitesse constante,
vphase
1 Ek0 k0
1
~k0 ,
=
~ |k0 |2
2m
comme si lenveloppe ntait pas l. Nous retrouvons ici la vitesse que nous avions appele
vitesse de phase ;
la fonction enveloppe F se translate dans lespace, apparament sans se dformer, une vitesse
dfinie par :
1
1
vgroupe Ek (k0 ) = ~k0 .
~
m
Nous retrouvons la valeur de ce que nous avions appel vitesse de groupe.
Prcisons demble que labsence de dformation de lenveloppe nest quapparente. Elle rsulte
des approximations faites dans le calcul de lintgrale. Des calculs plus prcis montreraient quune
dformation, mme lente, a toujours lieu (voir 8.5.3 pour ltude dtaille dun cas particulier).
En ngligeant toutefois les effets de dformation de F , la probabilit de prsence de la particule
est
2
(r, t) = |F (r vgroupe t)| .
La translation subie par la fonction F rappelle le mouvement rectiligne et uniforme de la particule
classique. La vitesse de la particule est donc bien vgroupe . Sous cette enveloppe, la particule exhibe
nanmoins le caractre ondulatoire dune onde de De Broglie qui se dplace une autre vitesse.
Cette caractristique ne disparait que lorsque la particule est immobile, et donc que k0 = 0.
Par rapport la mcanique classique, la ncessaire lgre dlocalisation de la particule et le
comportement oscillant sous-jacent sont des faits exprimentaux dont seule la mcanique quantique
est capable de rendre compte.
Fig. 8.4. Vitesse de phase et vitesse de groupe pour le paquet donde monochromatique tal.
1
202
3/4
|r|2
exp 2 exp (ik0 r) .
40
126
Il sagit dune onde de De Broglie dimpulsion p0 = ~k0 contenue dans une enveloppe gaussienne.
Lcriture de sous sa forme paquet donde (8.8) utilise la fonction de pondration
2 3/4
2
2
(k) =
e0 (kk0 ) .
Lvolution temporelle sobtient sans difficult de principe en calculant de manire exacte lintgrale (8.8). Lexpression de (r, t) tous temps est cependant assez complique, et nous ne nous
intressons ci-dessous qu la probabilit de prsence, pour laquelle on obtient (voir Exercice 8.5) :
s
!
3/2
2
p0 2
r
t
~
1
m
2+
exp
,
(t)
=
t2 .
(r, t) = |(t, r)|2 =
0
2 2 (t)
2 2 (t)
2m0
(8.11)
Cette expression montre que lenveloppe de la fonction donde reste de forme gaussienne, et que son
centre se dplace de manire rectiligne et uniforme la vitesse de groupe p0 /m. Nous retrouvons en
cela (de manire rigoureuse !) les rsultats obtenus pour le paquet donde quasi-monochromatique.
Pour autant, maintenant que nous disposons de rsultats exacts, nous voyons que la largeur
de cette gaussienne, que lon peut typiquement prendre gale (t), augmente progressivement
au cours du temps (voir la figure 8.5). Cette volution, est lente jusqu des temps de lordre
de ttransition = 2m02 /~, puis sacclre ensuite pour atteindre sur les temps longs un accroissement
linaire en (t) = ~t/2m0 (voir la figure 8.6). Cette vitesse dtalement est dautant plus rapide
que la particule est lgre et initialement localise.
Fig. 8.5. Etalement du paquet donde gaussien au cours de sa propagation. La probabilit de prsence
(r, t) est reprsente trois instants successifs t = 0 < t1 < t2 .
127
Fig. 8.7. Eclatement dun paquet donde en une superposition de trois paquets indpendants lors de
sa diffraction sur un obstacle. Aprs limpact, la particule se trouve simultanment rpartie dans les trois
paquets diffracts.
128
On peut donc avoir des tats quantiques qui sont des superpositions de plusieurs paquets donde
indpendants, par exemple deux paquets quasi-monochromatiques :
Ek
Ek
~k1
~k2
i(k1 r ~ 1 t)
i(k2 r ~ 2 t)
(r, t) = e
F1 r
t + e
F2 r
t .
m
m
La particule est alors partage entre deux paquets qui ont chacun leur propre fonction enveloppe
et leur propre vitesse de dplacement. Dune certaine manire, la particule est comme scinde en
deux portions indpendantes.
De telles situations sont courantes en pratique, lorsque quune particule vient heurter un
obstacle (voir la figure 8.7). Le caractre ondulatoire de la fonction donde donne alors souvent
lieu un phnomne de diffraction : la particule se partage en plusieurs morceaux, qui repartent
chacun dans des directions diffrentes.
Dans un tel tat superpos, certaines questions perdent leur sens :
quelle est limpulsion de la particule ? On sent que la rponse doit faire intervenir, dune
certaine manire, les impulsions ~k1 et ~k2 , mais impossible den dire plus 8 , car la particule
possde ces deux impulsions simultanment ;
~2 k2
quelle est son nergie ? L aussi, nous sommes face un subtil mlange entre Ek1 = 2m1 et
~2 k2
Ek2 = 2m2 .
La suite du cours permettra, peu peu, de mieux apprhender ce type de situation.
Il peut enfin arriver que deux fractions indpendantes de la fonction donde dune mme particule viennent au cours de leur dynamique se rencontrer. Elles donnent lieu, comme en optique,
des phnomnes dinterfrences, dans lesquels la probabilit de prsence de la particule acquiert
des formes trs singulires.
129
Exercices
Exercice 8.1 (Longueur donde de de Broglie).
Calculer la longueur donde de de Broglie dans les cas suivants :
(1) Un lectron dnergie 1 eV.
(2) Un proton dnergie 1 MeV.
(3) Le centre de gravit dune masse de 1 kg se dplaant 1 m/s.
Commenter ces rsultats, en considrant la longueur donde comme la prcision avec laquelle on
peut raisonnablement localiser ces particules.
Exercice 8.2 (Exploration du noyau atomique).
Une exprience dexploration du noyau consiste bombarder une feuille dor par des lectrons
ayant une nergie dune centaine de MeV. Montrer que cest bien dans cette gamme dnergie que
les lectrons peuvent effectivement tre diffracts par un noyau dor. Pour lor, le nombre de charge
vaut Z = 79 et le nombre de masse vaut A = 197.
On indique que la taille des noyaux est r = A1/3 r0 avec r0 =1.2 fm.
Exercice 8.3 (Sensiblit de loeil humain).
En 1917, Fabry et Buisson mesurent la limite de sensibilit de loeil et montrent que le plus
faible point lumineux perceptible dans lobscurit totale est une bougie situe 27 km.
(1) La puissance de lnergie lumineuse visible mise par une bougie est de lordre de 0.01 W.
Quelle est la puissance collecte par la pupille de loeil dun observateur situ 27 km de
celle-ci ? (On assimilera la pupille un trou de 5 mm de diamtre)
(2) La longueur donde typique de la lumire visible est de lordre de = 500 nm. Quelle est, en
fonction de , de la constante de Planck h = 2~ et la vitesse de la lumire c lnergie E
porte par un photon visible ? Faire lapplication numrique.
(3) Pour dcider ou non denvoyer au cerveau linflux nerveux annonant la dtection dun point
lumineux, loeil intgre le nombre de photons reus en 100 ms. Dduire des rsultats qui
prcdent lordre de grandeur du nombre de photons ncessaires pour dclencher linflux.
Exercice 8.4 (Interfrence quantique).
On considre, dans une zone Z de lespace, une particule dont ltat est localement donn par
la superposition de deux ondes de De Broglie :
Ek1
Ek2
(r, t) = exp i k1 r
t
+ exp i k2 r
t
.
~
~
En dpit du problme de normalisation des ondes planes, nous considrons que la norme de (r, t)
ainsi dfinie reste physiquement interprtable dans la zone Z.
(1) Calculer, pour les points r intrieurs la zone Z, la densit de probabilit de prsence (r, t)
de la particule.
(2) Montrer que (r, t) possde un caractre ondulatoire dont on prcisera le vecteur donde et la
pulsation.
Exercice 8.5 (Paquet dondes gaussien).
Lobjectif de cet exercice est de montrer la formule (8.11) dans le cas o lespace ambiant est R.
Initialement, on considre la fonction donde
(0, x) = 0 (x) =
(1) Montrer que k(0, )kL2 (R) = 1.
1
202
1/4
ex
/402
eik0 x .
130
9
La particule quantique en interaction avec un potentiel
Nous exposons ici comment la mcanique quantique rend compte des interactions dune particule avec des forces drivant dun potentiel. La thorie quantique permet, dans certains cas particuliers, de retrouver la relation fondamentale de la dynamique de la mcanique classique. Nous
dcrivons linverse des situations dans lesquelles la particule quantique dfie les lois classiques,
et joue aux passes-murailles.
132
Dfinition 9.1. Linteraction dune particule avec des forces extrieures drivant dun potentiel
V (r, t) est dcrite par lquation de Schrdinger avec potentiel :
i~
~2
=
(r, t) + V (r, t)(r, t).
t
2m
(9.1)
Rappelons quune force F est dite driver dun potentiel si F F(r, t) et sil existe un champ
scalaire valeur relles V (r, t) tel que
F(r, t) = V (r, t).
On peut citer par exemple :
(1) la force de gravitation : pour une particule attire par un corps de masse M dont le centre de
gravit est pris comme origine de lespace, la force et le potentiel sont respectivement :
Fgravitation (r) = G
Mm
er ,
r2
Vgravitation (r) = G
Mm
,
r
(9.2)
133
(t))tR doprateurs
Alors iH est le gnrateur infinitsimal dun groupe fortement continu (U
sur H, cest--dire
(0) = Id, U
(t1 + t2 ) = U
(t1 )U
(t2 ) pour tout t1 , t2 R (proprit de groupe) ;
U
(t)u0 U
(t0 )u0 kH = 0 (continuit forte) ;
pour tout u0 H et t0 R, limtt0 kU
born) A de domaine D(A) H, les lments u D(A) tant caractriss par le fait que lappli
cation t 7 S(t)u
soit drivable en 0, avec
= d S(t)u
.
Au
dt
t=0
dinger (9.1). De plus, grce au propagateur U (t), on va pouvoir dfinir formellement des volutions
(t)0
physiques pour des donnes initiales moins rgulires : on dfinit, par densit, la quantit U
n
n
pour 0 H. En effet, pour 0 H, il existe une suite (0 )nN telle que k0 0 kH 0 lorsque
(t) n en utilisant la proprit de continuit forte
n +. On dfinit alors (t, ) = limn+ U
0
du groupe (U (t))tR .
9.1.3 Rgularit de la fonction donde
Connatre a priori la rgularit de la fonction donde et de ses drives se rvle trs utile dans
ltude explicite de solutions. On se place dans le cas de potentiels V (r) ne dpendant pas du
temps. On note
= {r R | V (r) < +}.
soit autoOn suppose que est ouvert, et que V L2 () + L () par exemple (afin que H
adjoint, voir la Remarque 10.2). On considre la quantit suivante, que nous verrons plus tard tre
lnergie moyenne du systme :
Z
Z
Z
~2
2
E=
H dr =
|(t, r)| dr +
V (r)|(r, t)|2 dr.
(9.3)
2m R3
R3
R3
On admet que le premier terme reprsente lnergie cintique, et le second lnergie potentielle de
la particule. Pour des raisons physiques, ces deux quantits ne peuvent tre infinies. Ceci montre
alors que
(1) le support de est contenu dans . En effet
Z
V (r)|(r, t)|2 dr < +.
R3
Z
R3
134
=
H, , H
=0
i~
est symtrique. Ceci montre que
si H
Z
t R,
|(x, t)|2 dx = 1.
R3
Dans le cas gnral dune donne simplement L2 (R3 ), ce rsultat dcoule directement de lunitarit
u
du propagateur (voir le Thorme 9.1).
t
Comme au chapitre prcdent, la conservation de la normalisation des fonctions donde peut
aussi se voir par le biais des formules de lhydrodynamique quantique.
Proprit
9.2. On considre une particule quantique dcrite par la fonction donde (r, t) =
p
(r, t)ei(r,t) . Si satisfait lquation de Schrdinger avec potentiel (9.1), alors la probabilit de prsence (r, t), le courant de probabilit J(r, t), et la vitesse de probabilit v(r, t) donns
respectivement par
(r, t) = |(r, t)|2 ,
J(r, t) = i
~
,
2m
v(r, t) =
~
,
m
+J=
+ (v) = 0
t
t
Ces quations forment un systme hyperbolique de lois de conservation.
135
i~
i
=
V ,
t
2m
~
i~
i
=
+ V ,
t
2m
~
do
=
+
=
t
t
t
i~
i
i~
i~
i
V +
+ V =
.
2m
~
2m
~
2m
Les termes potentiels se simplifient, et ne modifient finalement pas le rsultat de ce calcul. Les
proprits dmontres en sections 8.2.2 et 8.3 restent donc encore vraies.
La drive temporelle de la probabilit de prsence dpend donc uniquement de la fonction
donde, cest dire de ltat du systme linstant considr. En particulier, elle ne dpend pas
du terme potentiel de lquation de Schrdinger (9.1), cest dire des sollicitations extrieures
appliques au systme. Ce rsultat est rapprocher de la mcanique classique, pour laquelle la
dynamique de Newton scrit
dr
p
dt = m ,
dp X
=
Fi .
dt
i
On constate, ici aussi, que la prsence des forces naffecte pas lexpression de la drive temporelle
p
du vecteur position. Cette drive dpend exclusivement du vecteur vitesse v = m
, qui est, avec r,
une des informations dcrivant ltat du systme.
136
dR
=
dt
Z
r
R3
dr =
t
Z
(v) r dr =
R3
dR
dt se
()
d2 R
=
+
dr.
m 2 =m
dt
dt dt
i R3 t
t
Or, lquation de Schrdinger (9.1) donne
i~
i
=
+ V ,
t
2m
~
Il vient finalement :
d2 R
~2
m 2 =
dt
2m
()
i~
i
i
=
() V V .
t
2m
~
~
R3
() dr
Z
R3
V dr.
Une dernire intgration par parties montre que la premire intgrale est nulle.
u
t
d2 R
= V (R(t), t).
dt2
(9.7)
137
Fig. 9.1. La limite classique : lorsque le paquet donde est trs piqu, lacclaration de sa position
moyenne R(t) sidentifie, au terme de masse prs, la drive locale du champ de potentiel.
t R |(t)| = 1.
Les fonctions (r) et (t) = ei(t) sont des fonctions valeurs complexes, nommes respectivement parties spatiale et temporelle de ltat stationnaire.
Du point de vue physique, ces tats stationnaires dcrivent des situations dans lesquelles la
probabilit de prsence (r, t) = |(r)|2 reste constante au cours du temps. Cela ne signifie cependant pas que la particule
reste immobile. Par exemple, dans le cas des ondes de De Broglie,
la fonction donde e
non nul.
i kr
Ek
~
~k
m
138
et
(9.9)
avec une phase R quelconque. Lquation (9.8) est lquation de Schrdinger indpendante du
temps. La fonction (r) est appele tat dnergie dnergie E.
Remarque 9.3. Une autre manire de voir la chose est de dire que les tats stationnaires (r) et
leurs nergies E sont respectivement les vecteurs propres et les valeurs propres de loprateur
Hamiltonien :
2
= ~ + V.
H
2m
Preuve. Supposons que lon puisse crire (r, t) = (r)(t) avec les conditions de normalisation
donnes dans la Dfinition 9.2. Introduisant cette expression dans lquation de Schrdinger dpendante du temps, il vient :
i~(r)
d
~2
(t) = 0 (t)~(r)(t) =
(r)(t) + V (r)(r)(t).
dt
2m
~2
(r) + V (r)(r).
2m
Comme le second membre de cette galit ne dpend pas du temps, 0 (t) est constant et (t) =
E/~ t + pour des constantes E, R. Finalement,
~2
(r) + V (r)(r) = E(r).
2m
La rciproque, cest dire, le caractre suffisant des relations (9.8) et (9.9) est quant lui immdiat.
u
t
9.3.3 Energie de la particule
La constante E qui apparat dans lquation de Schrdinger indpendante du temps a la dimension dune nergie. Nous admettons ds prsent que E correspond sans ambiguit lnergie
totale de la particule place dans ltat (r). Les tats stationnaires sont dailleurs les seuls tats
quantiques dont lnergie est parfaitement connue. Nous en verrons les raisons plus tard (voir le
chapitre 11). Cela justifie que les tats stationnaires soient appels tats dnergie.
9.3.4 Rgularit des tats stationnaires unidimensionnels
On peut montrer, pour des solutions stationnaires, une rgularit plus grande pour la fonction
donde. En dimension 1 despace par exemple, une solution stationnaire (x) est de classe C1 sur
le domaine = {V < +} avec V L2 (R) + L (R) (on suppose encore ouvert). En effet,
pour une solution stationnaire,
~2 d2
+ (V (x) E)(x) = 0.
2m dx2
Or, (V E) est dans L2loc (), donc est dans H2loc (). Comme on a linjection (compacte)
H1 () , C0 () pour des ensembles ouverts et borns , on en dduit que x est C0 (), et
donc que C1 (). Ceci signifie donc que
est continue partout sur , sannule sur , et est nulle sur c ;
x est continue sur louvert , mais peut prsenter des discontinuits au niveau de .
139
(9.10)
rR
(r)(r) dr +
2m R3
R3
Or,
Z
R3
Z
(r)(r) dr =
R3
||2 dr 0,
R3
u
t
Etant donn que nous savons dj, par anticipation, que E est lnergie totale de la particule,
ce rsultat se comprend simplement comme le fait que cette nergie ne peut tre infrieure au
minimum dnergie potentielle accessible. Rsultat intuitif ? Peut tre dun point de vue classique.
Pour ce qui est de lintuition quantique attendons cependant un peu. . .
9.3.6 Importance des tats stationnaires en mcanique quantique
Lors de ltude dune situation donne, la recherche des tats stationnaires constitue en gnral
le premier travail effectuer. Ils fournissent une base dexemples de fonctions donde acceptables
pour la particule, et reprsentent en cela une prcieuse source dinformation pour mener des
raisonnements physiques. Nous le verrons plus tard, ils constituent galement une base au sens
mathmatique du terme, sur laquelle peuvent se dcomposer toutes les solutions de lquation de
Schrdinger (voir 10.4.3). Ces tats sont enfin des tats dans lesquels lnergie de la particule est
connue sans ambiguit ( loppos, par exemple, de fonctions dondes obtenues par superposition
dtats trs diffrents lun de lautre). Cela en fait des tats trs particuliers, qui se retrouvent
la base de nombre de dveloppements thoriques.
140
si x 0,
V = 0
V (x) = V = V0 0 si 0 < x < a,
V =0
si x a.
On cherche savoir comment une particule quantique, arrivant de la gauche avec une nergie
cintique Ec , interagit avec la barrire. Rappelons ce que nous enseignerait la mcanique classique
en pareille situation :
si Ec < V0 : la particule na pas lnergie suffisante pour grimper sur la marche. Elle rebondit
et repart vers la gauche. La vitesse ne fait que changer de signe, et lnergie cintique est
conserve ;
si Ec V0 : la particule passe par dessus la marche et continue sa route vers la droite. Une
fois la marche franchie, elle retrouve sa vitesse et son nergie cintique initiales.
9.4.2 Etats stationnaires de la barrire de potentiel
Calculons les tats stationnaires (x, t) = (x)(t) de la particule quantique et les nergies E
associes, en supposant que la particule arrive sur la barrire par la gauche (ceci sera utile par la
suite). La Proposition 9.4 montre que dans tous les cas, E 0. On cherche ainsi des solutions de
~2 d2
(x) + V (x)(x) = E(x).
2m dx2
Des rsultats gnraux de thorie spectrale (voir le chapitre 10) montrent que le spectre de loprateur Hamiltonien est purement continu. On ne sattend donc trouver que des pseudo-tats
propres (i.e. des limites de suites de Weyl, du type ondes planes). On peut prciser ce rsultat
par une construction analytique des solutions. Pour ce faire, il faut distinguer deux cas, selon que
E < V0 ou E > V0 .
Lorsque E < V0 .
La forme gnrale de la solution de lquation de Schrdinger indpendante du temps, rsolue
par morceaux sur les intervalles ] , 0], ]0, a[, et [a, +[ est :
ikx
ikx
si x 0,
g e + g e
Kx
Kx
(x) = e + e
(9.11)
si 0 < x < a,
ikx
ikx
d e + d e
si x a,
avec
k=
2mE
,
~
p
K=
2m(V0 E)
.
~
141
On a donc des solutions de type ondes planes linfini, qui ne sont pas normalisables (sauf dans le
cas trivial = 0). Du point de vue physique, on les considre cependant comme des tats limites
de paquets donde trs tals qui viendraient interragir avec la barrire 5 .
La forme de la solution (9.11) est la forme la plus gnrale possible mathmatiquement, mais
nest pas pertinente en tant que telle du point de vue physique. Rtablissons tout dabord la
E
dpendance temporelle de la fonction donde en la multipliant par la quantit ei ~ t . De part et
dautre de la barrire, l o le potentiel est nul, les termes en eikx et eikx correspondent aux
E
E
ondes de De Broglie ei(kx ~ t) et ei(kx ~ t) , et reprsentent des tats quantiques dans lesquels la
~k
particule se dplace respectivement aux vitesses + ~k
m et m . Ainsi,
ikx
le terme g e
dcrit une particule arrivant par la gauche. Cette composante correspond
la situation initiale du problme que nous nous posons. Pour imposer la prsence de cette
composante dans les tats recherchs, on prend arbitrairement g = 1. La valeur prcise de
cette constante na pas grande importance, du fait que nos tats ne sont de toute manire
pas normalisables ;
les termes g eikx et d eikx dcrivent respectivement une particule qui repart vers la gauche
aprs avoir rebondi sur la barrire, et une particule qui sloigne vers la droite aprs lavoir
franchie. Il sagit des deux destins envisageables pour la particule en mcanique classique, et
nous considrons, pour linstant sur la base de notre seul bon sens, que ces termes sont en
accord avec le problme pos ;
le terme d eikx dcrit en revanche une particule arrivant de la droite. Comme nous considrons une particule arrivant par la gauche, on prend d = 0.
Au final, on se restreint la recherche de solutions de la forme (voir figure 9.3) :
ikx
ikx
si x 0,
= e + g e
Kx
Kx
(x) = = e + e
si 0 < x < a,
= d eikx
si x a.
Fig. 9.3. Les cinq composantes des tats stationnaires dnergie E < V0 correspondant une particule
arrivant sur la barrire par la gauche.
Le tri qui a t fait parmi les termes proposs doit tre vu comme une tentative de donner aux
tats stationnaires une signification physique qui rpond lesprit du problme. Ce sens physique
est ici celui de la mcanique classique. Il reste cependant a vrifier que ces choix sont bien autoriss
par la thorie quantique. Pour cela, il faut sassurer quil est possible de satisfaire aux conditions
de raccordement des diffrents morceaux de solution. En vertu de leurs proprits de rgularit
5. On verra au 10.3 un autre cas particulier, pour lequel il faudra explicitement exclure certaines
solutions non normalisables. Lesdites solutions ne seront pas de type ondes planes dans ce cas.
142
1 + g = + ,
i(K + ik)keKa
,
(k 2 K 2 ) sinh(Ka) + 2ikK cosh(Ka)
d =
2iKkeika
.
(k 2 K 2 ) sinh(Ka) + 2ikK cosh(Ka)
(K 2 + k 2 ) sinh(Ka)
,
(k 2 K 2 ) sinh(Ka) + 2ikK cosh(Ka)
i(K ik)keKa
,
(k 2 K 2 ) sinh(Ka) + 2ikK cosh(Ka)
Lorsque E > V0 .
La forme gnrale de la solution de lquation de Schrdinger dans le cas o on se restreint
des ondes arrivant par la gauche est (voir figure 9.4)
ikx
ikx
si x 0,
= e + g e
0
0
ik
x
ik
x
(x) = = e
+ e
si 0 < x < a,
ikx
= d e
si x a,
avec
k=
2mE
,
~
p
0
k =
2m(E V0 )
.
~
i(k + k 0 )keik a
= 2
,
(k + k 02 ) sin(k 0 a) + 2ikk 0 cos(k 0 a)
i(k k 0 )keik a
= 2
,
(k + k 02 ) sin(k 0 a) + 2ikk 0 cos(k 0 a)
d =
2kk 0 eika
.
(k 2 + k 02 ) sin(k 0 a) + 2ikk 0 cos(k 0 a)
143
Fig. 9.4. Les cinq composantes des tats stationnaires dnergie E > V0 correspondant une particule
arrivant sur la barrire par la gauche.
il faut tout dabord comprendre ce phnomne comme le fait quen interragissant avec la
barrire, la fonction donde se spare en deux composantes : une qui continue sa course vers
la droite, et une qui revient vers la gauche. La particule quantique perd son unit, et son tat
aprs linteraction est une superposition de deux tats transmis et rflchi ;
ensuite, mme avec une nergie E infrieure la hauteur V0 de la barrire, une fraction de
la particule est capable, au moins en partie, de poursuivre sa route vers la droite. Plus fort
encore, la fonction donde, et donc, la probabilit de prsence, ne sont pas nulles dans la zone
0 < x < a o lnergie est pourtant infrieure au potentiel V (x). Cela serait parfaitement
inconcevable en mcanique classique. Pour autant, la thorie quantique autorise la particule
faire des excursions modres dans ces zones interdites. Ces phnomnes sont dsigns
sous le terme deffet tunnel ;
les coefficients g et d sont enfin des nombres complexes. La reflexion ou la transmission de
la particule saccompagne donc dun dphasage. Cette notion, propre la fonction donde,
chappe compltement la mcanique classique, pour qui seules importent les informations
de position et de vitesse.
Conservation de lnergie
Analysons les ondes transmises et rflchies. Toutes deux sont des ondes de De Broglie qui se
dplacent dans une zone o le potentiel V (x) est nul, et qui ont, au signe prs, le mme vecteur
donde k que la particule incidente. Elles dcrivent donc toutes deux une particule qui se dplace
1
~2 k 2
2
la vitesse v = ~k
m , et avec une nergie cintique Ec = 2 mv = 2m . Nous retrouvons le rsultat
classique qui dit que la vitesse et lnergie cintique de la particule se conservent au cours du
rebond ou du franchissement de la barrire.
Probabilits de rebond et de franchissement
Considrons enfin les courants de probabilit associs aux ondes incidente, rflchie, et transmise. Ces ondes de De Broglie ne sont pas normalisables, mais nous pouvons crire, en valeurs
absolues, et une constante multiplicative C prs (la mme pour les 3 ondes) :
Ji = C
~k
,
m
Jr = C|g |2
~k
,
m
Jt = C|d |2
~k
.
m
144
et surtout, ne part pas ailleurs. Ce rsultat souligne nouveau la cohrence physique des tats
stationnaires qui viennent dtre construits.
On peut dfinir, partir des flux Ji , Jr et Jt des coefficients de rflexion et de transmission
selon :
Jt
Jr
, T = ,
R=
Ji
Ji
avec R + T = 1. Une interprtation de ces coefficients est la suivante : si lon effectue une mesure
de la position de la particule juste aprs quelle a fini dinteragir avec la barrire, la particule
aura une probabilit R dapparatre gauche, et une probabilit T dapparatre droite (voir
figure 9.5). Les coefficients R et T prennent ainsi valeur de probabilit de rebond et de probabilit
de franchissement de la barrire. 6
Fig. 9.5. La diffraction dun paquet donde arrivant sur la barrire. Instant t1 : avant limpact. Instant t2 :
aprs limpact. Dans le traitement mathmatique de cette section, ces paquets donde sont approxims
par des ondes de De Broglie.
La manire dont R et T voluent en fonction des conditions du problme est galement remarquable. Considrons par exemple T . On dduit des relations qui prcdent que :
!!1
p
2
2m(V
E)
V
0
2
0
1+
sinh
a
si E < V0 ,
E(V0 E)
~
2
!!1
T = |d | =
(9.12)
p
2m(E V0 )
V02
sin
a
si E > V0 .
1+
E(E V0 )
~
Effet Tunnel
Ce cas concerne les nergies infrieures V0 . Fixons quelques ordres de grandeur. Pour un
lectron de masse m = 9.1 1031 kg, devant traverser une barrire dpaisseur a = 1 , de
hauteur V0 = 1 eV, avec une nergie incidente E = 0.5 eV, on trouve T 0.62, soit 62% de
chances de traverser la barrire ! Loin dtre anecdotique, leffet tunnel est donc un phnomne
prpondrant lchelle atomique.
Ds que la masse et les nergies mises en jeu sont ne serait-ce que lgrement suprieures, le
terme en sinus hyperbolique devient rapidement trs grand, et on peut faire lapproximation
6. Le cas de la barrire de potentiel prsente cependant un certain niveau de subtilit. En toute rigueur,
il faudrait, pour bien dfinir ces coefficients de transmission et de reflexion, intgrer la probabilit de
prsence associe chaque composante de ltat quantique, respectivement gauche ou a droite de la
barrire selon la composante, et comparer les valeurs des intgrales obtenues. Du fait que ltat manipul
ici nest pas normalisable, nous avons utilis une approche alternative qui consiste comparer les flux de
probabilit.
16E(V0 E)
T
exp 2
V02
145
!
p
2m(V0 E)
a .
~
Fig. 9.6. Probabilit T de traverser une barrire de 1 de large en fonction du rapport E/V0 . A gauche :
cas dun lectron sur une barrire de 1eV. T garde des valeurs trs significatives pour E < V0 . Cest leffet
tunnel. A droite : cas dun proton sur une barrire de 0.1eV. T prsente dimportantes oscillations pour
E > V0 . Cest la transmission rsonante.
Transmission rsonante
Pour les nergies E suprieures V0 , la probabilit de traverser la barrire T oscille entre une
situation de transfert partiel de la particule, et des situations de transfert total o T = 1. Ces
maxima de taux de transmission sont atteints quand k 0 a est un multiple de , cest dire, quand
a est gal un nombre entier de fois la demi longueur donde k0 qui dcrit la particule lintrieur
de la barrire. Ces oscillations sont ainsi le rsultat dinterfrences quantiques de la particule avec
elle-mme au niveau de lobstacle. Cette proprit peut servir en pratique concevoir, dans les
machines lectroniques, des filtres qui ne se laissent franchir que par des lectrons possdant une
nergie donne.
9.4.4 Et la limite classique ?
La limite classique est obtenue dans les situations o la taille du paquet donde devient trs
petite devant lchelle caractristique de variation du potentiel V (x). Une astuce efficace pour
trouver cette limite sans construire explicitement ces paquets donde est de faire tendre dans
les formules de la mcanique quantique la masse m de la particule tudie vers linfini, tout en
maintenant lnergie constante. On observe en effet que les particules massives sont en gnral
suffisamment bien dcrites par la mcanique classique.
Faisons donc tendre m vers linfini dans les rsultats (9.12). Pour E < V0 , nous avons vu que
leffet tunnel devient insignifiant, et nous retrouvons le fait classique de la particule rebondit entirement en arrire. Pour E > V0 , en revanche, augmenter la masse m nempche pas les oscillations
146
de T de se produire. Elles deviennent plus rapides, mais leur amplitude reste invariablement borne
1
V02
infrieurement par 1 + 4E(EV
et suprieurement par 1. On ne parvient donc pas tendre
0)
vers la limite classique dune transmission totale.
Cette bizarrerie provient des discontinuits du champ de potentiel. La distance caractristique
sur laquelle ce potentiel volue est en effet la distance nulle ! Ainsi, aussi localis quil soit, un
paquet donde prsentera toujours une largeur suprieure lchelle dvolution de V . En toute
rigueur, le rsultat concernant la limite classique de lquation de Schrdinger ne sapplique donc
pas. Cela ne signifie pas quil est impossible de retrouver le comportement classique : nous y
parvenons dans le cas de leffet tunnel. En revanche, cela nest plus une obligation, comme nous
le constatons pour la transmission rsonante.
Pour forcer le comportement classique rapparatre, il faudrait adoucir la forme de la barrire,
en remplaant, par exemple, les discontinuits en x = 0 et x = a par des rampes. Mme abruptes,
ces rampes possderaient alors une largeur finie. On verrait dans ce cas que les fonctions donde plus
localises que cette largeur retrouvent un comportement classique avec rflexion ou transmission
totale.
(x x, t) 2(x, t) + (x + x, t)
+ O(x).
x2
Introduisant le vecteur des approximations de aux points xi , ainsi que les matrices L du
Laplacien discret et Vx du potentiel, soit
2 1
0
1 2 1
V (x0 )
1
.. .. ..
..
= . , Lx =
, Vx =
,
. . .
.
.
x2
.
1 2 1
V (xN )
N +1
1 2
on a une approximation Hx = Lx + Vx du Hamiltonien sur la grille {xi }. Ainsi, lquation
de Schrdinger scrit, dans sa version discrtise en espace,
7. On peut en effet, par un changement de variables bijectif R [0, 1], se ramener ce cas. On peut
galement considrer un domaine suffisamment grand, un paquet dondes suffisamment localis et un temps
dvolution suffisamment court.
147
it = Hx .
On en dduit que
Cette formule dintgration exacte en temps peut tre utilise dans des cas simples o le calcul de
lexponentielle de matrice (qui demande une diagonalisation pralable de Hx ) peut tre effectu.
On obtient dans ce cas le schma numrique
n+1 = eitHx n .
(9.14)
1
it
it
1 Hx
1 + Hx
+ O(t2 ),
2
2
A(t, x) =
1
it
it
1
Hx
1+
Hx
.
2
2
(9.15)
En pratique, litration (9.15) est rcrite sous la forme dun systme tridiagonal, dont linversion
ne demande que O(N ) itrations :
1n+1
= 0
2ix
n+1
n+1
n+1
2
2 + 3
= R2n ,
1 2 + V (x2 )x +
..
(9.16)
.
2ix
n+1
n+1
n+1
n
N
+ N
2 + V (x2 )x2 +
+1 = RN ,
N 1
t
n+1
N
= 0,
+1
avec
2ix2
n
n
Rkn = k1
2 + V (x2 )x2
kn + k+1
,
t
1 k N.
Des gnralisations au cas des dimensions suprieures existent (on a une forme tridiagonale gnralise).
Ce schma a de bonnes proprits numriques. On vrifie en particulier que la probabilit
numrique
N
X
|kn |2 x
pn =
k=1
est conserve exactement. Ceci provient du fait que les valeurs propres de A(t, x) sont de
module 1. La vrification de cette dernire proprit est immdiate au vu de la dfinition donne
par (9.15).
8. Il faut galement recourir dautres mthodes si le potentiel dpend du temps ! Le schma de CranckNicholson est prcisment utilisable dans ce cadre.
148
it = .
it (k)
= |k|2 (k).
On a alors
1 it|k|2
cin
(e
).
t ()(x) = F
Au final, un schma numrique fond sur cette dcomposition et les approximations correspondantes des oprateurs lmentaires est donn par
pot
cin
n
n+1 = pot
t/2 t t/2 ( ),
(9.17)
o (tn ) est approxim par n comme pour le schma de Cranck-Nicholson, et les applications pot
t ,
cin
t sont approximes en considrant une grille uniforme (x0 , . . . , xN +1 ) de lespace rel [0, R]. Dans
ce cas,
itV (x0 )
pot
, . . . , eitV (xN +1 ) ) .
t = Diag(e
Pour la partie cintique, on utilise une transforme de Fourier discrte.
149
Exercices
Exercice 9.1 (Particule uniformement acclre).
On considre une particule quantique de masse m dcrite t = 0 par londe de De Broglie
(r, t = 0) = eik0 r .
On la soumet, partir de t = 0 laction dune force F.
(1) Ecrire lquation de Schrdinger pour la fonction donde (r, t) pour les temps positifs.
(2) Rsoudre cette quation. Indication : on montrera quil existe une solution de la forme gnrale
(r, t) = ei(k(t)r(t)) .
et on se limitera expliciter le vecteur k(t).
(3) Exprimer en fonction de k(t) limpulsion p(t) de la particule. Montrer que p(t) ainsi calcule
obit la relation fondamentale de la dynamique.
Exercice 9.2 (Marche de potentiel).
On considre, dans un contexte unidimensionnel, le paysage de potentiel suivant, dit marche
de potentiel :
(
0
si x < 0,
V (x) =
V0 0
si x 0.
On souhaite tudier ce quil advient dune particule quantique de masse m arrivant sur la marche
par la gauche.
(1) Reprsenter graphiquement ce champ de potentiel.
(2) Donner, sans se proccuper pour linstant des conditions de raccordement de la fonction donde
en x = 0, la forme gnrale de la partie spatiale (x) dun tat stationnaire dnergie E. On
distinguera les cas E > V0 et E < V0 .
On pourra poser :
p
p
2m(E V0 )
2m(V0 E)
2mE
0
k=
,
k =
si E > V0 ,
K=
si E < V0 .
~
~
~
(3) Quelle est, parmi ces tats, la forme des tats physiquement acceptables dcrivant une particule
arrivant par la gauche ?
(4) En utilisant les conditions de raccordement, prciser la forme des tats stationnaires pour
E < V0 . Montrer que la particule est entirement rflchie par la barrire. Montrer galement
quelle pntre lgrement dans la zone x > 0, sur une distance typique ltunnel :
ltunnel = p
~
2m(V0 E)
(5) Application numrique : on considre un lectron arrivant avec une nergie de 1 eV sur une
marche de 2 eV de haut. Calculer ltunnel . Mme question pour un cycliste de 70 kg arrivant
une vitesse de 10 m/s sur une rampe trs raide de 2 m de haut.
10
La particule quantique confine
Jusquici, nous avons considr des particules libres de se dplacer dans tout lespace. Lexemple
des ondes de De Broglie a montr quelles pouvaient adopter nimporte quelle impulsion, nimporte
quelle nergie cintique et nimporte quelle position. Cette libert est cependant loin dtre la
rgle en mcanique quantique. Nous regardons ici la situation dans laquelle un champ de potentiel
indpendant du temps pige la particule dans une rgion de taille limite. Lnergie, et bien dautres
grandeurs, ne peuvent alors prendre que certaines valeurs bien prcises : cest la quantification.
Ceci relve mathmatiquement de proprits spectrales particulires des Hamiltoniens quantiques, qui sont tudies au 10.2 au travers dexemples fondamentaux : puits infini, oscillateur
harmonique quantique, potentiel coulombien (atome de type hydrognode). Au-del des proprits abstraites donnes par la thorie spectrale, des tudes plus fines peuvent tre menes sur des
cas particuliers. Un tel exemple est le cas du trou de potentiel, trait analytiquement au 10.3.
Enfin, une discussion des implications physiques profondes du phnomne de quantification clt
ce chapitre ( 10.4).
152
Chercher les tats stationnaires de lquation de Schrdinger (9.1) revient donc chercher les
~2
H10 () tels que 2m
= E.
Caractre discret du spectre
Or, par le thorme de Lax-Milgram, pour f L2 (), lquation u = f admet une et une
seule solution, et lapplication f 7 u est linaire borne de L2 () dans H10 (). Alors, loprateur
T = 1 : L2 () H10 () , L2 ()
f 7 u 7 u
est linaire born auto-adjoint compact (car linjection H10 () , L2 () est compacte 1 ). Par
ailleurs, cet oprateur est positif car
D
E
Tf, f = hu, ui = kukL2 () 0.
Ceci montre, en utilisant le thorme C.2, quil existe une suite (n )n1 de rels strictement positifs
convergeant vers 0, et une base hilbertienne (n ) de L2 () tels que
n 1,
Tn = n n .
~2
,
2mn
n H10 (),
~2
n = En n .
2m
De manire gnrale, on ne peut pas plus prciser les suites (En )n1 et (n )n1 . Pour certaines
gomtries du domaine , on a toutefois des expressions analytiques.
1. Rappelons quun oprateur T : E F (E, F Banach) est compact si, de toute suite borne (un )
donne, on peut extraite une sous-suite (
uk ) = (T unk ) qui converge fortement.
153
Fig. 10.1. Le puits de potentiel infini en dimension 1. A gauche : Reprsentation du champ de potentiel.
Les parties grises correspondent V = +. A droite : Les trois premiers niveaux dnergie.
~ 2 2 n2
.
2ma2
Les valeurs admissibles de lnergie sont donc chercher dans un ensemble limit : on dit quelles
sont quantifies. On gnralise aisment au cas dun domaine rectangulaire en dimension suprieure. Dans tous les cas, on remarque que seul ltat de plus basse nergie a une fonction donde
qui ne sannule pas dans lintrieur du domaine. Il est dit tat fondamental (voir figure 10.1).
En =
avec > 0. En mcanique classique, cela correspond au cas dune particule de masse m qui serait
relie au point origine par un ressort de raideur k. Danc ce cas, correspond la pulsation des
oscillations queffectue la particule aprs avoir t
q loigne de sa position dquilibre. Le potentiel
classique est dans ce cas V (r) = k|r|2 /2 et =
k
m
R3
154
soit
=
D(H)
u L2 (R3 )
R3
Z
|r|4 |u(r)|2 dr +
R3
|k|4 |
u(k)|2 dk < +
est auto-adjoint.
On vrifie facilement que H
Pour vrifier que le spectre de loscillateur harmonique est purement ponctuel, on peut mener
une tude similaire au cas puits infini (voir Exercice 10.7). On peut galement recourir un rsultat
gnral de thorie spectrale (voir [29, Thorme XIII.67]) qui montre que les Hamiltoniens de la
forme + V avec V L1loc (R3 ) born infrieurement et tel que V (r) + lorsque |r| +,
a un spectre purement ponctuel et on peut galement
ont une rsolvante compacte. Ainsi, H
montrer quil est injectif.
Etats dnergie de loscillateur harmonique 1D
Les tats dnergie de loscillateur harmonique peuvent tre calculs de manire analytique.
Pour un espace de dimension d = 1, ce sont les fonctions de Hermite
n 0,
1/4 m 14 n2 m x2 dn m x2
n (x) =
e 2~
e ~
,
~
dxn
2n n!
155
Fig. 10.4. Le potentiel coulombien. Trs creus au voisinage de lorigine, il tend vers 0 linfini. Une
particule dnergie positive peut a priori explorer librement tout lespace.
Tout au long de cette partie, les rsultats essentiels sont illustrs par le cas du potentiel Coulombien que ressent un lectron au voisinage dun noyau atomique de nombre de charge Z (voir
figure 10.4) :
e2 Z
V (r) =
.
40 |r|
10.2.1 Caractre auto-adjoint
Pour montrer quun Hamiltonien quantique avec potentiel est auto-adjoint, on peut soit faire
une preuve directe au cas par cas, soit utiliser un thorme gnral qui garantit la conservation du
= ~2 + V moyennant certaines
caractre auto-adjoint pour des Hamiltoniens de la forme H
2m
conditions sur V (V perturbation pas trop importante du Laplacien).
0 et W
deux oprateurs non-borns sur un espace de Hilbert H. On dit
Dfinition 10.1. Soient H
uk akH
0 uk + bkuk.
kW
par rapport
Linfimum des a > 0 tels que cette ingalit soit vraie est appele la borne relative de W
H0 .
156
e2 Z
,
40 |r|
le Hamiltonien quantique
2
= ~ +V
H
2m
= H2 (R3 ) est auto-adjoint. Loprateur H
0 est ici le Hamiltonien priv de son
domaine D(H)
terme potentiel :
2
0 = ~ .
H
2m
Remarquons tout dabord que loprateur V associ la multiplication par V (r) est symtrique
est donc
de domaine D(V ) H1 (R3 ) par lingalit de Hardy (voir lexercice 10.1). Loprateur H
2
3
u H2 (R3 ),
157
Remarque 10.2. On peut en fait gnraliser directement la preuve prcdente au cas dun potentiel V L2 (R3 ) + L (R3 ) (voir Exercice 10.3).
10.2.2 Spectre essentiel
On a vu que le caractre auto-adjoint dun Hamiltonien quantique peut se dduire du caractre
0 , moyennant certaines conditions sur le potentiel
auto-adjoint du Hamiltonien quantique libre H
V . Sous des conditions plus fortes, on peut galement obtenir des renseignements sur le spectre
=H
0 + V .
essentiel de loprateur H
0 un
Thorme 10.2 (Stabilit du spectre essentiel par perturbation compacte). Soit H
0 ) et V un oprateur symtrique. On suppose que V est
oprateur auto-adjoint de domaine D(H
0 -compacte (i.e. V est un oprateur compact de D(H
0 ) muni de la norme du
une perturbation H
0 uk2 + kuk2 dans H). Alors loprateur H
=H
0 + V dfini sur D(H)
= D(H
0)
graphe |u|2 = kH
= ess (H
0 ).
est auto-adjoint et vrifie ess (H)
On peut appliquer ce rsultat par exemple lorsque le potentiel V (r) est tel que pour tout > 0,
on puisse crire V (r) = V2 (r) + V (r) avec V2 L2 (R3 ), V L (R3 ), et kV kL (R3 ) . Un
exemple de tel potentiel est le potentiel coulombien.
On vrifie en premier lieu que V dfinit un oprateur multiplicatif symtrique, auto-adjoint
0 -compact. On montre en premier
selon les rsultats du 10.2.1. Montrons ensuite que V est H
2
3
lieu que D(H0 ) D(V ). En effet, soit u D(H0 ) = H (R ). Alors u L2 (R3 ) L (R3 ) par les
injections de Sobolev, et
kV ukL2 (R3 ) kV2 kL2 (R3 ) kukL (R3 ) + kV kL (R3 ) kukL2 (R3 ) < +.
On montre ensuite que si (un ) est une suite borne dans H2 (R3 ) (par une constante M ), alors on
peut extraire de (V un ) une sous-suite convergente au sens de L2 (R3 ). En effet, comme (un ) est
une suite borne dans H2 (R3 ), on peut extraire une sous-suite (unk )k0 telle que
unk * u H2 (R3 ) faible,
soit n (H) est le bas du spectre essentiel, auquel cas il y a au plus n 1 valeurs propres
158
~2
2mk 2
hk , l i = kl .
Z
R3
|(r)|2 dr
e2 Z
40 k
Z
R3
|(r)|2
dr < 0
|r|
159
Fig. 10.5. Allure gnral du spectre dnergie dans le potentiel coulombien. Les nergies ngatives sont
quantifies, et correspondent au spectre ponctuel. Les nergies positives forment un continuum correspondant au spectre essentiel.
si x < a,
0
V (x) = V0 0 si a x a,
0
si x > a.
Nous recherchons les tats stationnaires dune particule de masse m place dans ce potentiel. La
partie spatiale (x) de la fonction donde et son nergie E doivent vrifier lquation de Schrdinger
indpendante du temps :
~2 d2
160
Fig. 10.6. Le trou de potentiel en dimension 1. Il dcrit de manire simpliste le potentiel ressenti par
une particule au voisinage dun centre attracteur plac lorigine.
fonctions donde. Ce calcul permettra galement de caractriser les valeurs de lnergie des tats
dnergie E < 0.
10.3.2 Etats dnergie lis
On considre V0 E < 0. Dans ce cas, les lments du spectre ne peuvent tre que dans le
spectre discret.
Solutions physiquement admissibles de lquation de Schrdinger
Mathmatiquement, la solution gnrale par morceaux de lquations de Schrdinger est donne
par :
Kx
Kx
si x < a,
e + e
ikx
ikx
(x) = e + e
si a x a,
Kx
e + eKx si x > a.
avec
p
2m(E + V0 )
2mE
K=
,
k=
.
(10.1)
~
~
Dun point de vue physique, les composantes eKx et eKx ne sont cependant pas acceptables,
car elles conduisent une fonction donde non normalisable, et qui ne peut pas non plus tre une
limite de suite de Weyl. 3 Les fonctions (x) physiquement admissibles sont donc de la forme
Kx
si x < a,
e
ikx
(x) = e + eikx si a x a,
Kx
e
si x > a.
Quantification des nergies
Les conditions de continuit sur (x) et sa drive en x = a conduisent au sytme de quatre
quations quatre inconnues , , , :
ika
e
(ik K) = eika (ik + K),
161
(i) K = k tan(ka) : les solutions du systme global sont alors obtenues avec = 6= 0 ;
(ii) K = k cot(ka) : les solutions du systme global sont alors obtenues avec = 6= 0.
Ces deux conditions sont en fait deux quations de quantification de lnergie : elles fixent des
conditions que E doit respecter pour pouvoir tre associe un tat stationnaire (rappelons en
effet que k et K sont donnes par (10.1)).
Il est commode, au lieu de rsoudre ces quations (par une mthode numrique ici car il ny
a pas de solution analytique), de les discuter graphiquement, en se plaant dans le plan (ka, Ka)
(voir figure 10.7). On considre alors
Ka = ka tan(ka),
Ka = ka cot(ka).
Par ailleurs,
2mE 2 2m(E + V0 ) 2
2mV0 2
a +
a =
a .
2
2
~
~
~2
Quand E dcrit [V0 , 0], le couple (ka, Ka)
dcrit donc, dans le quart de plan des coordon
2mV0
nes positives, un quart de cercle de rayon
a. Les nergies E autorises correspondent aux
~
intersections de cet arc de cercle avec les courbes dfinies par chacune des deux quations de
quantification.
(Ka)2 + (ka)2 =
Fig. 10.7. Rsolution graphique des quations de quantification dans le plan (ka, Ka). Larc de cercle peut
tre vu comme une courbe paramtre par lnergie E quand elle varie dans lintervalle [V0 , 0]. Lextrmit
de larc en haut gauche correspond lnergie E = V0 . Lextrmit en bas droite correspond lnergie
E = 0. Les intersections de cet arc avec les autres courbes fixent les valeurs dnergie quantifies.
162
Fig. 10.8. Etats dnergie dun trou de potentiel possdant 4 tats lis. Tous les tats lis sont reprsents.
Noter la caractre alternativement symtrique et antisymtrique des fonctions donde associes. En haut
du schma, la fonction donde dnergie positive donne lallure typique dun tat de diffusion.
A lintrieur du trou, les tats stationnaires ont une allure similaire celle trouve dans le cas
du puits infini. Pour autant, ces fonctions ne sont pas ici strictement contenues dans le puits. Elles
peuvent stendre gauche et droite, montrant des ailes exponentielles dcroissantes, dautant
plus larges que lnergie de ltat considr est importante. Ainsi, ltat fondamental reste relativement bien confin, alors que ltat 4 stend de manire plus gnreuse lextrieur. Ceci est une
consquence de leffet tunnel, qui autorise la particule quantique faire des excursions modres
l o son nergie est infrieure lnergie potentielle.
Lalternance de fonctions donde symtriques et antisymtriques nest pas un hasard. Cette
curiosit est une consquence directe, bien que technique dmontrer, du fait que le paysage de
potentiel utilis est symtrique autour du point origine de lespace.
Tous les tats obtenus dcrivent une particule qui reste essentiellement localise au voisinage du
trou, avec une probabilit de prsence qui tend rapidement vers 0 linfini. On les appelle tats lis.
En tant qutats propres dun oprateur auto-adjoint, ils forment une famille dtats orthonorms,
et constituent une base sur laquelle peuvent se dcomposer toutes les fonctions donde dcrivant
une particule pige dans le trou. La fonction donde de la particule quantique place dans un des
ces tats, ou dans une combinaison linaire de ces tats, a la proprit de ne pas staler dans le
temps.
10.3.3 Etats dnergie de diffusion
On examine le cas E > 0. La thorie spectrale enseigne que ces valeurs de E correspondent
aux lments du spectre essentiel. La forme gnrale des solutions de lquations de Schrdinger
est :
0
ik0 x
+ eik x
e
(x) = eikx + eikx
0
ik0 x
e
+ eik x
163
si x < a,
si a x a,
si x > a.
p
2m(E + V0 )
2mE
,
k=
.
~
~
On trouve de part et dautre du trou de potentiel une superposition dondes de De Broglie. Elles
signifient, par leur caractre compltement dlocalis, que la particule a la possibilit dexplorer
tout lespace, sans restriction. Cela correspond bien lintuition de la physique classique, selon
laquelle une particule peut accder toutes les zones o son nergie E est suprieure lnergie
potentielle. De mme que les ondes de De Broglie, cette forme de solution conduit des fonctions
dondes qui ne sont pas normalisables. Nanmoins, comme les ondes de De Broglie, elle reste
physiquement pertinente en tant que limite de suite de Weyl. Les conditions de raccordement en
x = a scrivent :
ik0 a
0
+ eik a = eika + eika ,
e
0
k 0 (eik a eik0 a ) = k(eika eika ),
0
0
0
0
avec
k0 =
Il sagit dun systme linaire de 4 quations 6 inconnues. Lespace des solutions est donc au
moins de dimension 2. Ainsi, toute nergie E positive possde plusieurs tats stationnaires associs.
A linverse des tats lis, pour qui apparaissait le phnomne de quantification, les tats stationnaires que nous trouvons ici peuvent prendre nimporte quelle valeur dnergie positive. Cela peut
sassocier au fait physique quils ne correspondent plus des tats confins, mais des tats dans
lesquels la particule explore librement tout lespace. Ils sont appels tats de diffusion. Lensemble
des nergies qui leurs sont associes forme un continuum dnergies. Notons les paquets donde
construits partir des tats de diffusion stalent, au contraire des tats lis.
On reprsente schmatiquement en figure 10.9 le diagramme nergtique complet du trou quantique. On retrouve la forme trs caractristique prdite par la thorie spectrale : on a un continuum
dtats de diffusion, associs au spectre essentiel, et qui occupe tout le domaine o la particule a
une nergie suffisante pour se dplacer librement partout dans lespace. En dessous, se trouvent
quelques tats lis, associs au spectre ponctuel, dont lnergie est donc quantifie, et qui dcrivent
physiquement une particule pige dans un minimum du potentiel. Quelque soit la taille du trou
(largeur a et profondeur V0 ) il existe toujours au moins un niveau dnergie quantifi.
Fig. 10.9. Structure du spectre nergtique complet du trou de potentiel une dimension. Les nergies
ngatives sont quantifies. Les nergies positives sont toutes accessibles, et forment un continuum dtats
de diffusion. Cette structure est rapprocher de celle du spectre nergtique du potentiel Coulombien.
164
Cette forme de diagramme est de porte assez universelle. Elle se retrouve qualitativement
quelque soit la forme de trou considre (voir par exemple le spectre du potentiel Coulombien,
figure 10.5).
0 (r) =
+
X
165
(10.2)
an n (r),
n=0
Lunique solution de lquation de Schrdinger avec condition initiale 0 est alors donne par
(r, t) =
+
X
an n (r)ei
En
~
(10.3)
n=0
Cette formule peut tre vue comme une simple consquence du principe de superposition.
Remarque 10.3 (Schma numrique). La dcomposition de la fonction donde sur la base dtats
stationnaires donne un schma numrique de rsolution de lquation de Schrdinger : on peut
en effet, pour une condition initiale donne, calculer les N premiers modes propres de la condition initiale selon (10.2), et en dduire une approximation de en tronquant la somme (10.3)
lordre N .
est un oprateur auto-adjoint quelRemarque 10.4 (Formulation spectrale gnrale). Lorsque H
conque, et que son spectre comporte une composante continue, il est possible de gnraliser la
dcomposition en modes propres (10.3). Partant de (r, t = 0) = 0 (r), la thorie spectrale donne
Z
(r, t) =
ei ~ t dP 0 (r),
R
k=0
+
X
ak al k (r)l (r)ei
El Ek
~
k,l=0
La densit (r, t) apparat ainsi comme une superposition de composantes oscillantes de pulsations
kl =
El Ek
.
~
La probabilit de prsence nest capable, dans son volution, de nexhiber quun nombre restreint
de frquences. Il en irait en fait de mme pour toutes les autres grandeurs physiques (position,
acclration, courant de probabilit,. . .) Les pulsations kl sont les pulsations propres dvolution
du systme, et sont soumises au phnomne de quantification.
10.4.4 Proprits spectrales des atomes, des molcules, et des corps denses
Corrolaire de la quantification des frquences propres dvolution, la quantification de lnergie
a une consquence directe sur la capacit dun systme absorber ou mettre des rayonnements
lectromagntiques.
166
Le spectre dabsorption-mission
Mme si ce cours ne traite pas doptique quantique, nous savons tous, de manire plus ou moins
prcise, quune manire quantique de regarder une onde lectromagntique de pulsation est de
dire que celle-ci est divise en fines particules, appeles photons, chacun portant individuellement
une nergie
Ephoton = ~.
Vis vis de llectromagntisme classique, lnergie du photon correspond donc la frquence
de londe. Cest le nombre de photons transports qui dtermine quant lui le flux dnergie du
faisceau lumineux.
Labsorption ou lmission dun rayonnement par un systme quantique ne peut se faire que
photon par photon (voir figure 10.10). Du fait de la quantification des nergies, pour quun photon
puisse tre absorb ou mis, il faut que son nergie corresponde la diffrence entre deux niveaux
dnergie du systme, cest dire quil existe 2 indices n et m tels que
Ephoton = Em En = ~nm .
Si les nergies accessibles forment un continuum, toutes les frquences sont ainsi susceptibles
dtre absorbes ou r-mises. En revanche, en prsence du phnomne de quantification, seules
les frquences propres nm dvolution du systme sont autorises. Le terme courant pour les
dsigner est celui de spectre dabsorption-mission du systme.
Fig. 10.10. Les mcanismes dabsorption et dmission de rayonnement de pulsation par transition
dun systme quantifi entre deux niveaux dnergie En et Em .
~ 2
N,
2ma2
167
Fig. 10.11. Structure du spectre dmission/absorption du puits de potentiel infini une dimension.
Fig. 10.12. Spectres de rsonance magntique nuclaire (RMN) de la molcule dthanol CH3 -CH2 -OH.
En RMN, le systme quantique tudi volue sur un nombre fini dtats quantifis. Le spectre ne possde
ainsi quun nombre fini de raies.
168
ailleurs, le potentiel retient les lectrons prs de lui dans des tats lis. Cest cela qui explique
que la structure de latome est stable, avec toujours une taille de lordre de lAngstrm (voir
aussi le 11.5.4 pour une dmonstration mathmatique de ces considrations physiques) ;
en astrophysique, ltoile neutrons est un assemblage compact de neutrons qui contient dans
une sphre de 10 km de diamtre une masse quivalente celle du soleil. Une telle masse
devrait en temps normal seffondrer encore plus sous son propre poids. Le niveau fondamental
de ce corps possde en fait une nergie norme qui oblige les neutrons maintenir une
agitation minimale mme dans la limite des trs basses tempratures, et entretient dans la
sphre une pression qui compense les forces de gravitation.
10.4.6 Et la limite classique ?
La quantification des nergies prend contre pied la mcanique classique, qui considre que
cette quantit peut prendre toutes les valeurs, du moment quelle reste suprieure au potentiel.
Pour examiner ce rsultat classique avec un oeil quantique, nous pouvons utiliser la rgle heuristique consistant regarder ce que devient le spectre des nergies lorsque la masse m de la particule
tend vers +.
Fig. 10.13. Densification du spectre quantifi du Hamiltonien lors du passage la limite classique (cas
du puits infini et de loscillateur harmonique unidimensionnel).
Reprenons par exemple les nergies propres du puits quantique unidimensionnel de largeur a :
En =
~2 2 2
n ,
2ma2
n 1.
~
Ces valeurs sont toutes espaces entre elles dun nombre entier de fois la quantit 2ma
2 . Lorsque
m crot, cette quantit tend vers 0. Les nergies En se rapprochent donc les unes des autres
(voir figure 10.13), pendant que lnergie du niveau fondamental tend vers 0. Au final, le spectre
nergtique tout entier se densifie ainsi sur le domaine [0, +[. Cela sobserve de mme dans le
cas de loscillateur harmonique, avec les nergies
r
1
k
n+
.
En = ~
m
2
2
Dans la limite m +, on a ainsi limpression que toutes les nergies sont nouveau accessibles
au systme, comme en physique classique. Pour autant, la quantification ne disparait pas : elle
nest simplement plus mesurable.
169
170
Exercices
Exercice 10.1 (Ingalit de Hardy).
On va montrer ici lingalit de Hardy
u
|x|
u H1 (R3 ),
(1) Montrer que, dans Rd ,
x
|x|2
2kukL2 (R3 ) .
L2 (R3 )
=
d1
.
|x|2
(2) En utilisant la formule ci-dessus et en effectuant une intgration par parties, montrer alors
lingalit de Hardy (on utilisera galement une ingalit de Cauchy-Schwarz).
Exercice 10.2. Montrer que la norme
kukH2 (R3 ) = (kukL2 (R3 ) + kukL2 (R3 ) )1/2
est bien quivalente la norme usuelle (somme L2 de toutes les drives).
Exercice 10.3. Montrer que si u H2 (R3 ), alors pour tout > 0, il existe M > 0 tel que
kukL (R3 ) kukL2 (R3 ) + M kukL2 (R3 ) .
On pourra passer en variables de Fourier, utiliser une ingalit de Cauchy-Schwarz avec (1 + |k|2 )
u
et (1 + |k|2 )1 pour montrer
k
ukL1 (R3 ) c k|k|2 ukL2 (R3 ) + kukL2 (R3 ) ,
et conclure en considrant u
n (k) = n3 u
(nk). Montrer alors que laffirmation de la Remarque 10.2
en sinspirant de la preuve donne dans lExemple 10.1.
Exercice 10.4 (Particule dans la boite).
On considre dans lespace R3 une particule de masse m confine dans le domaine paralllpipdique [0, a] [0, b] [0, c] avec a, b et c les longeurs des cts de la boite. A lintrieur de la
boite, le potentiel est nul. Il est infini lextrieur.
(1) Calculer les tats stationnaires qui peuvent se mettre sous la forme factorise :
(r) = x (x)y (y)z (z)
ainsi que les nergies associes.
(2) Montrer que lon peut extraire de cette famille dtats factoriss une base complte dtats
propres du Hamiltonien H.
Exercice 10.5 (Superposition dtats dans le puits quantique).
On considre, dans le fond dun puits quantique unidimensionnel infini de largeur a, une particule de masse m dont ltat t = 0 est donn par :
1
(x, t = 0) = (1 (x) + 2 (x)) ,
2
avec 1 et 2 les deux premiers tats dnergie du puits.
(1) Rappeler lexpression analytique de 1 et 2 .
(2) Donner, en explicitant 1 et 2 , lexpression de (x, t) pour t > 0.
(3) Calculer, en fonction de t, la probablit de prsence (x, t), le courant de probabilit J(x, t)
et la vitesse de probabilit v(x, t).
171
(4) Montrer que la particule est anime dun mouvement priodique dont on donnera la priode T .
(5) Reprsenter graphiquement lallure de (x, t), J(x, t) et v(x, t) pour t = 0, t =
t = 3T
4 .
T
4
,t=
T
2
et
)
acceptables vis vis de la condition de normalisation ? (On posera K = 2mE
~
(4) En intgrant lquation de Schrdinger sur un petit intervalle [, ], puis en faisant tendre
vers 0, montrer que :
d
d +
2m
(0 )
(0 ) = 2 (0).
dx
dx
~
(5) En tenant compte, par ailleurs, de la continuit de (x) en x = 0, en dduire une condition de
quantification sur lnergie E.
(6) Combien existe-t-il dtats stationnaires dnergie ngative ?
(7) Vrifier quaucune condition de quantification ne sapplique pour les nergies positives.
Exercice 10.7 (Le spectre de loscillateur harmonique est purement ponctuel). Considrons, pour f L2 (R3 ), le problme
Trouver u D0 (R3 ) tel que
= f,
Hu
R3
|k|2 |
u(k)|2 dk.
On voudrait appliquer un thorme de Lax-MilgramD pour Echercher u V tel que a(u, v) = l(v)
v et la forme linaire l(v) = hf, vi, et
pour tout v V, avec la forme bilinaire a(u, v) = Hu,
dfinir ainsi une application T : L2 (R3 ) V L2 (R3 ), qui f associe u.
(1) Vrifier que | |V est une norme.
(2) Vrifier que a est bilinaire continue et coercive.
(3) Montrer que l est linaire et continue pour la norme | |V . On pourra montrer que kukL2 (R3 )
|u|V en remarquant que
Z
Z
d
u2 = 2
u r u ;
R3
R3
172
11
Le formalisme de Dirac
Les fonctions donde que nous avons utilises jusqu prsent ne sont aptes dcrire quune
particule en translation. On montre dans ce chapitre quil est possible, au moyen dune reformulation plus abstraite, dobtenir un formalisme capable de plus de gnralit. Le formalisme vectoriel
introduit ici, dit encore formalisme de Dirac, permet, au travers dune srie de postulats, dasseoir
de manire rigoureuse lensemble des concepts que nous avons entrevus en mcanique ondulatoire.
Il donne une description prcise des phnomnes quantiques survenant lors de la mesure dune
grandeur physique, et explique, au travers des relations dincertitude de Heisenberg, pourquoi certaines de ces grandeurs ne peuvent tre connues simultanment. Ce formalisme permet dtendre
la thorie quantique des situations autres que la particule en translation, et autorise par exemple
la description des systmes plusieurs particules ou la rotation des particules sur elles-mme. Au
plan technique, on verra que les nouveaux outils introduits permettent de mener des calculs plus
efficacement.
174
11 Le formalisme de Dirac
Z
X(t) =
dX
~
=
(r, t)
(r, t), dr,
dt
i R3
x
Z
d2 X
1
V
(r, t)
=
(r, t) (r, t) dr.
dt2
m R3
x
moyenne(t) =
(r, t) A(r,
t) dr.
R3
avec A un oprateur agissant sur la fonction (r, t). Nous avons dans le cas prsent :
(r, t) ;
pour limpulsion, A(r,
t) =
i x
1 V
Dans les exemples qui prcdent, le caractre symtrique et autoadjoint des observables position, impulsion et acclration est une proprit qui peut effectivement tre dmontre (voir
Exercice 11.1).
11.1.2 Notations vectorielles : bra-ket
Dans lexemple des fonctions donde, nous voyons que ltat dun systme quantique est dcrit
par un vecteur de norme 1 dans un espace de Hilbert H (typiquement ici, H = L2 (R3 )). Pour
dsigner ce vecteur, sans faire rfrence la complexit du dtail de la fonction (r, t), le formalisme
vectoriel utilise la notation | i. On le prononce "ket". Le ket | (t) i dsigne donc ltat quantique
(r, t) linstant t. Dans ce formalisme, le vecteur conjugu de | i est not h |. On le prononce
"bra" 1 . Le bra h (t) | correspond au vecteur dtat conjugu (r, t).
Le produit scalaire sur cet espace entre un bra h | et un ket | i est not
Z
(h |, | i) = h | i
(r, t) (r, t) dr.
R3
Le formalisme bra/ket est une manire (un peu ludique) de rcrire les formules prcdentes.
Mais on verra que ce formalisme se montre extrmement puissant pour nombre de manipulations
mathmatiques ncessites par la thorie quantique.
1. Le jeu de mot fond sur langlais braket naura chapp personne. Ces appellations sont devenues
lusage en mcanique quantique.
175
px : (r, t)
(r, t),
i x
~
(r, t),
py : (r, t)
y : (r, t) y (r, t),
i y
.
2
Ces considrations ne tiennent que pour des formules relativement simples. Dans le cas dune
fontion gnrale f (x, p), trouver lobservable associe peut demander beaucoup plus de travail.
x
d
px =
176
11 Le formalisme de Dirac
Ce principe se gnralise tous les autres espaces vectoriels utiliss en mcanique quantique,
a cela prs que les observables de rfrence ne sont alors plus la position et limpulsion, mais
dautres oprateurs adapts chaque situation. Pour un systme physique quelconque, seule la
construction des quelques premires observables de rfrence relve donc dun vritable travail de
recherche tant exprimentale que thorique, les observables suivantes sobtenant, pour la plupart,
par dduction.
En mcanique ondulatoire, lapplication de ce principe quelques grandeurs usuelles mne
au Tableau 11.1. Notons quil nexiste pas en tant que telle dobservable vectorielle. Aux grandeurs classiques vectorielles sont en fait systmatiquement associes trois observables (une par
composante).
Tableau 11.1. Principe de correspondance entre les grandeurs physiques et les observables quantiques
associes.
Grandeur physique
Observable A
Position
Impulsion
Energie cintique
Energie potentielle
Energie totale
Force (drive du potentiel)
Composantes Fx , Fy , Fz
Moment cintique total
Moment cintique selon x
Moment cintique selon y
Moment cintique selon z
x, y, z
px , py , pz
p2
Ec = 2m
V (r, t)
E = Ec + V (r, t)
F = V
V
, V
, V
x
y
z
L=rp
Lx = ypz zpy
Ly = zpx xpz
Lz = xpy ypx
multiplication par x, y, z
px = i~x , py = i~y , pz = i~z
c = ~2
E
2m
Vd
(t) = multiplication par V (r, t)
[ = ~2 + V (r, t)
H(t)
2m
multiplication par V
, V
, V
x
y
z
x = i~(yz zy )
L
y = i~(zx xz )
L
z = i~(xy yx )
L
[ i.
(11.1)
i~ | i = H(t)|
t
est appel oprateur Hamiltonien ou encore Hamiltonien du systme.
Loprateur H
11.4 La mesure
La thorie spectrale sapplique aux oprateurs que sont les observables. Ce faisant, elle permet
de prciser un postulat fondamental de la mcanique quantique, le postulat de la mesure. Curieusement, ce postulat ne possde un nonc rigoureux que dans le cas o le spectre de lobservable
11.4 La mesure
177
est compltement discret. Cest cette situation que nous nous intressons en premier lieu. Dans
un second temps, nous discutons de la difficult gnraliser cet nonc au cas dobservables dont
le spectre possde des composantes continues.
11.4.1 Observable spectre discret
de spectre purement discret
On rappelle que la mesure spectrale associe une observable A(t)
est dfinie laide de la famille de projecteurs
X
P =
PE ,
R,
, (A(t))
o E est lespace propre associ la valeur propre et PE est le projecteur orthogonal sur E
(voir Appendice C.5).
Postulat 11.4 (Mesure dune grandeur physique : cas dune observable spectre dis
cret). Soit un systme physique plac linstant t dans un tat |avant i, et une observable A(t)
de spectre discret se rapportant ce systme. Alors :
(1) lorsque lon mesure linstant t la grandeur physique A, on ne peut trouver quun point du
;
spectre de A(t)
(2) le rsultat de la mesure rsulte dun tirage alatoire parmi les valeurs propres de A(t).
La
probabilit p quune valeur propre donne soit tire vaut :
p = kPE |avant i k2 ;
(3) si est la valeur propre tire lors de la mesure, ltat du systme immdiatement aprs la
mesure devient :
1
|apres i = PE |avant i .
p
Il apparat au travers de ce postulat que le rsultat dune mesure est fondamentalement probabiliste. Le choix se fait au prorata du carr des poids de dcomposition de ltat | avant i sur
La Dfinition C.11 et le Thorme C.3 assurent
les divers sous espaces propres de lobservable A.
que la somme des probabilits ainsi obtenues pour les diverses valeurs propres est bien gale 1 :
X
X
p =
kPE |avant i k2 = k |avant i k2 = 1
(A(t))
(A(t))
Ce principe choqua les physiciens du dbut du 20me sicle. Lhistoire dit quil ne fut notament
jamais accept par Einstein qui aurait dclar : "Dieu ne joue pas aux ds !" Et pourtant, un sicle
de physique la cl, force est de constater que. . . a marche !
La seule situation dans laquelle le rsultat dune mesure est compltement prdictible est
Cest le cas, par exemple, des tats
celui o le ket |avant i est dj un vecteur propre de A.
178
11 Le formalisme de Dirac
(A)
et plus gnralement,
An =
n PE .
(A)
(A)
Une autre nouveaut est le fait que la mesure engendre une modification de ltat du systme,
qui se trouve instantanment projet et renormalis selon un vecteur propre associ au rsultat
trouv. Ce phnomne porte le nom de rduction du paquet donde. Aussi choquant quil puisse
paratre, on peut toutefois se rassurer en se disant que la projection engendre par la mesure
assure que si on remesure le systme immdiatement aprs une premire mesure, on retrouve le
mme rsultat avec une probabilit gale 1. Encore mal comprise dun point de vue physique, la
rduction du paquet donde fait toujours lobjet de recherches au plan exprimental, visant en
percer la vritable nature.
A cause du phnomne de rduction du paquet donde, la mesure simultane de deux grandeurs
physiques A et B peut prendre des allures insolubles : si on observe dabord la grandeur A, on va
Si on veut ensuite mesurer la quantit B
projeter ltat du systme dans un sous espace propre de A.
ce nouveau vecteur dtat sera alors projet une seconde fois selon un sous espace propre de B.
Rien ne garantit alors que ce nouvel tat soit encore un tat propre de A. Si on remesure A, on
aura ainsi en gnral une valeur diffrente de la premire valeur mesure ! Lobservation selon B
perturbe le rsultat de la mesure selon A . . .
commutent. En
Une exception importante concerne cependant le cas o les observables A et B
effet, les sous espaces de A sont alors stables par la projection perpendiculaire sur les sous espaces
et rciproquement. Plusieurs mesures successives de A et B donnent alors toujours le mme
de B,
rsultat, quelque soit lordre des mesures. On parle, selon que les observables commutent ou ne
commutent pas, de mesures compatibles ou incompatibles.
11.4.2 Observable gnrale
Certaines parties du postulat de la mesure (Postulat 11.4) se transposent assez directement
au cas dobservables auto-adjointes gnrales, dont le spectre peut comporter des composantes
continues. Ces parties sont celles qui traitent des rsultats possibles et de leurs probabilits de
tirages. Nous faisons appel ci-dessous la notion de mesure spectrale dun oprateur auto-adjoint
quelconque (voir Appendice C.5).
Postulat 11.5 (Valeurs mesurables dune grandeur physique : cas gnral). Pour une
grandeur physique A, et son observable A associe sur H, on a les proprits suivantes :
(1) lorsque lon mesure la grandeur physique A, on ne peut trouver quun point du spectre de A ;
(2) si le systme se trouve linstant t prcdant la mesure dans ltat |avant i, alors le rsultat
de la mesure est dans lintervalle ]a, b] avec une probabilit k(PbA PaA ) |avant i k2 , o
179
Concernant la nature de ltat |apres i, tous les noncs que nous connaissons [28, 13, 6] font
intervenir une certaine erreur de mesure de lappareil physique, contrairement au cas dobservables
spectre purement discret. . . mais ncessaire pour la normalisation de la fonction donde aprs
mesure.
Tentative de postulat (Rduction du paquet donde : cas gnral). Pour une grandeur
physique A, et son observable A associe sur H, si le rsultat de la mesure est a a prs, ltat
du systme aprs la mesure est
|apres i =
A
A
Paa
) |avant i
(Pa+a
.
P A ) |avant i k
k(P A
a+a
aa
Lerreur de mesure est motive par le fait que tous les appareils donnent en effet en pratique
un rsultat de mesure avec une prcision finie (penser aux fentes dYoung par exemple, qui, si
troites soient-elles, ont toujours une largeur donne). Cet nonc soulve cependant un certain
nombre de questions :
faire dpendre |apres i de lerreur de mesure a est une ide angoissante voire inacceptable
pour nombre de physiciens : il est en effet possible, pour la mesure dobservables spectres
purement discret de supposer que les appareils sont de prcision infinie, pourquoi devrait-il
en tre autrement dans le cas gnral ? Et si cette erreur doit effectivement tre prise en
compte, pourquoi ne concerne-t-elle que la nature de |apres i, alors quelle ninflue pas sur
les probabilits de tirage des valeurs mesures ?
cependant, sans cette notion de prcision finie, on ne pourrait pas normaliser les paquets
donde lorsquon les projette en utilisant la mesure spectrale sur le spectre continu de lobservable. Un cas pratique o se pose cette difficult est celui on lon mesure la position
moyenne x0 dun paquet donde, avec une prcision x0 . Dans ce cas,
apres (t, x) =
On voit que cette expression nest pas dfinie dans la limite x0 0. Pour autant que
certains puissent la juger suspecte, lerreur de mesure est ncessaire pour assurer que |apres i
reste physiquement acceptable.
La physique quantique et la physique en gnral sont riches de tels dbats quasi-philosophiques,
o seule la dmonstration exprimentale peut faire figure de juge de paix. Malheureusement, la
difficult concevoir et mettre en place les bonnes expriences fait que lheure du jugement peut
parfois se faire attendre plusieurs dcennies.
A,
180
11 Le formalisme de Dirac
Lorque que ce crochet de commutation est loprateur nul, cela signifie que les oprateurs A
et B commutent.
sont des observables, cest dire, des oprateurs auto-adjoints, on montre que
Lorsque A et B
le crochet de commutation est encore un oprateur autoadjoint, et que son spectre est valeurs
imaginaires pures (voir Exercice 11.4). On tablit sans peine les relations suivantes :
B
et C oprant sur le mme espace de
Proprit 11.1. Pour trois oprateurs quelconques A,
Hilbert,
h
i
h
i
B
= B,
A ,
A,
h
i h
i h
i
B
+ C = A,
B
+ A,
C ,
A,
i
i h
i h
h
C .
C + B,
C = A,
A + B,
Commutation position-impulsion
Les relations de commutation entre les observables position et impulsion sont la base de
nombre de calculs en mcanique quantique. Il est utile de les connatre par coeur :
[
x, x
] = 0,
[
x, y] = 0,
[
y , y] = 0,
[
x, z] = 0,
[
y , z] = 0,
[
z , z] = 0,
[
px , px ] = 0,
[
x, px ] = i~,
[
y , px ] = 0,
[
z , px ] = 0,
[
x, py ] = 0,
[
y , py ] = i~,
[
z , py ] = 0,
[
px , py ] = 0,
[
py , py ] = 0,
[
px , pz ] = 0,
[
py , pz ] = 0,
[
pz , pz ] = 0,
[
x, pz ] = 0,
[
y , pz ] = 0,
[
z , pz ] = i~.
Dans ces formules, i~ dsigne par abus de notation loprateur multiplication par le scalaire i~.
11.5.2 Evolution dune observable
Le commutateur entre une observable donne et le Hamiltonien dtermine elle seule lvolution temporelle de la valeur moyenne de cet observable.
Proposition 11.1 (Thorme dEhrenfest). Soit un systme physique dont on note |(t)i
A(t)
= (t)|A(t)|(t)
volue au cours du temps selon
D
E
d A(t)
dt
A
(t)
t
+
+
E
i D
[H(t), A(t)]
.
~
(11.2)
1
Preuve. Cette galit dcoule simplement de lquation de Schrdinger t | i = i~
H| i et (par
1
d A(t)
d
dh
|
d
A
d| i
= h (t) |A(t)|
(t) i =
A(t)|
i + h|
| i + h |A(t)
dt
dt
dt
dt
dt
!
dA
i
A(t)|
H(t)|
= h (t) |
| (t) i +
h (t) |H(t)
(t) i h (t) |A(t)
(t) i ,
dt
~
constant avec H
autoadjoint.
2. Ceci est par exemple le cas si H(t)
H
u
t
181
Remarque 11.2. Il dcoule de ce thorme que toute grandeur physique dont lobservable est indpendante du temps et commute avec le Hamiltonien voit sa valeur moyenne conserve au cours
du temps. Parmi les grandeurs ne dpendant pas du temps, seules celles qui ne commutent pas
sont susceptibles dvoluer. Comme [H,
H]
= 0, on montre que la dynamique de Schravec H
dinger conserve lnergie moyenne du systme pour autant que le Hamiltonien ne dpende pas du
temps.
Application : dynamique de la position moyenne dun paquet donde
Pour la particule de masse m se dplaant dans un champ de potentiel V (r, t), on montre
facilement que
i~
i~
i
[H, x
] =
((x) x) = x ,
~
2m
m
On montre de mme que :
i
i
[H, px ] = [V , px ] = x V.
~
~
On a bien sr des relations analogues selon y et z. On en dduit, par le thorme dEhrenfest
(Proposition 11.2),
hpx i
d
dt hxi = m ,
(11.3)
d
V
.
dt hpx i = x
Ainsi que des relations similaires selon y et z. Nous laissons le lecteur libre dapprcier la facilit
avec laquelle on retrouve le rsultat du 9.2.
11.5.3 Relations dincertitude de Heisenberg
Une des consquences du principe de la mesure dune observable A est que le rsultat de la
mesure connat une dispersion statistique dcart type A :
q
p
2
A = Var(A) = hA2 i hAi .
La quantit A est aussi appele incertitude de la mesure. Elle traduit uniquement le fait que
et nest lie daucune manire
ltat | i peut tre rparti sur plusieurs sous espaces propres de A,
une ventuelle limite de prcision de lappareil servant la mesure. Le seul cas o cette incertitude
On a alors A = 0, et le rsultat de la mesure est
est nulle est celui o | i est tat propre de A.
D(A) D(B),
1 D E
A B [A, B] .
2
182
11 Le formalisme de Dirac
i .
i [A,
= 2Im h |AB|
(11.4)
Le polynme coefficients rels Q() tant positif pour tout , on en dduit que son discriminant
est ngatif, et donc
D
E2
B]
u
t
~
,
2
183
1
4|r|2
0.
3
Preuve. On prend E = C
0 (R ). Dans ce cas, on peut vrifier que toutes les expressions ci-dessous
= (
ont un sens. On calcule en premier lieu, pour r = (r1 , . . . , rd ) et p
p1 , . . . , pd ) dans un espace
de dimension d = 3,
d
X
1
1
~d
i
pj , rj = 2 .
|r| |r|
|r|
j=1
d
X
Im
j=1
1
1
pj , rj .
|r| |r|
Comme [
pj , |r|1 ] = i~|r|3 rj , on a alors
~(d 2)k|r|1 k2 = 2
d
X
j=1
rj
Im pj , 2 .
|r|
1/2
|d 2|2
4
1
, 2 .
|r|
u
t
Latome dhydrogne est instable dans la description classique de la matire. On dcrit en effet
llectron comme une particule ponctuelle dans le champ coulombien cr par un noyau ponctuel de
charge e, i.e. on a une dynamique newtonienne dans un champ de potentiel V (r) = e2 (40 |r|)1 .
Comme lnergie potentielle dcrot quand la distance au noyau |r| dcrot, on voit que cette
184
11 Le formalisme de Dirac
dynamique est instable par rapport aux perturbations normales une orbite dans la direction du
noyau.
Dans le formalisme de la mcanique quantique au contraire, on montre avec le Thorme 11.2
que le Hamiltonien est born infrieurement, ce qui assure la stabilit de latome dhydrogne. En
effet, au sens des oprateurs sur L2 (R3 ),
2
2
~2
e2
= ~ e
H
.
2m
40 |r|
8m|r|2
40 |r|
185
Exercices
Exercice 11.1 (Caractre autoadjoint des observables). Montrer, dans le formalisme fonction donde, le caractre autoadjoint des observables px et x V .
Exercice 11.2 (Crochets de commutation). Calculer pour une particule de masse m en trans c ], [
c ], [
c
lation dans un champ de potentiel V (r) les commutateurs [
px , H
x, H
px , V ] et [
x, V ], o H
p
b2
A=a
,
B=b
,
0 2
i 0
avec a et b deux constantes.
12
Le moment cintique en mcanique quantique :
Moment orbital et Spin
188
point de lespace, de position r0 , qui, pour une raison quelconque, revt pour nous une importance
particulire. Si un observateur, post en r0 , suit des yeux la trajectoire de la particule, il sera
certainement, la manire dun spectateur de course automobile, forc au cours du temps de
tourner progressivement la tte. Dune certaine manire, mme dans le cas o la particule se
dplace en ligne droite, la direction dans laquelle lobservateur doit orienter son regard tourne au
cours du temps. Ce mouvement de rotation apparent autour du point r0 est dcrit par le moment
cintique L(t) selon :
L = (r r0 ) p.
La figure 12.1 prsente graphiquement le moment cintique.
Fig. 12.1. Moment cintique L autour dun point r0 dune particule en translation.
La seule situation dans laquelle la particule ne semble pas tourner est celle o, soit elle se dirige
droit sur le point r0 , soit elle sloigne droit de ce point. Trs souvent, pour des raisons pratiques,
le point r0 sert dfinir le point origine de lespace. On a alors simplement :
L = r p.
(12.1)
Le vecteur L(t) est une nouvelle grandeur, mais nest pas proprement parler un nouveau paramtre de description de ltat du systme. En effet, il se dduit entirement de r(t) et de p(t), et
napporte donc pas dinformation physique supplmentaire sur la particule. Cependant, il jouit de
proprits remarquables qui en font un outil de raisonnement et de calcul intressant. La relation
fondamentale de la dynamique pour une particule soumise des forces Fi implique pour lvolution
temporelle de L :
!
X
dL
dr
dp
1
Fi ,
=
p+r
= pp+r
dt
dt
dt
m
i
soit
X
dL X
=
r Fi =
Mi .
dt
i
i
(12.2)
Le vecteur L(t) obit ainsi, linstar de p(t), une relation conceptuellement proche de la relation
fondamentale de la dynamique. Chaque force Fi est lorigine dun effort en rotation Mi = r Fi ,
dit moment exerc par la force autour du point de rfrence (ici, le point origine de lespace).
La quantit L est particulirement utile en astronomie ou en lectromagntisme pour tudier la
trajectoire dune particule en interaction avec un centre attractif ou rpulsif. Dans cette situation,
si ce centre est pris comme rfrence, les forces appliques sont toujours colinaires r. Le moment
appliqu est nul, et L devient donc une constante du mouvement. De mme, le moment cintique
dun systme isol est galement une constante du mouvement.
Remarque 12.1. Que lon considre ou pas le moment cintique, lnergie cintique de la particule
ponctuelle continue invariablement scrire :
Ec =
p2
.
2m
189
Remarque 12.2. Le point matriel considr ici peut aussi bien tre une vraie particule ponctuelle,
que le centre de gravit dun objet, ou encore la particule rduite dun systme de deux corps en
interaction.
12.1.2 Rotation dun objet rigide sur lui-mme
Moments cintiques interne et externe
Pour un objet rigide qui occupe chaque instant un certain volume (t) dans lespace, le
moment cintique est dfini comme lintgrale des moments cintiques lmentaires
Z
L(t) =
r v(r, t) (r, t) dr,
(t)
o v(r, t) est le champ de vitesse dans lobjet linstant considr et (r, t) est la masse volumique
locale du corps tudi. Mme pour un objet rigide, et voluent au cours du temps du seul fait
des mouvements de lobjet (mais resteraient constants dans un rfrentiel fix lobjet !).
Une particularit de ce moment cintique est quil est possible de le scinder en deux parties
externe et interne au corps tudi. Si on note G le centre de gravit de lobjet, rG (t) sa position,
vG (t) sa vitesse, et m la masse totale de lobjet, il vient en effet :
Z
L(t) = mrG vG +
(r rG (t)) (v(r, t) vG (t)) (r, t) dr = Lext + Lint .
(t)
Le vecteur Lext = mrG vG est le moment cintique du centre de gravit autour du point
dobservation. Il est exclusivement d la translation de lobjet dans lespace, et se calcule en
fonction de limpulsion totale pG = mvG . Le moment cintique Lint est appel moment cintique
interne de lobjet. Il dcrit uniquement le mouvement de rotation autour du centre de gravit (voir
la figure 12.2).
Fig. 12.2. Moments cintiques externe Lext et interne Lint dun corps rigide en translation/rotation
autour du point origine O.
Les quations dvolution de Lext et Lint peuvent galement tre dcouples. Pour un objet
soumis une densit volumique de forces f (r, t) :
Z
dLext
= rG Ftotale = Mext ,
avec Ftotale =
f (r, t) dr,
dt
o Ftotale reprsente donc la somme intgre de toutes les forces volumiques appliques au solide.
On a galement
Z
dLint
=
(r rG (t)) f (r, t) dr = Mint .
dt
Le moment global appliqu lobjet peut donc tre lui mme scind en deux composantes Mext
et Mint qui agissent respectivement sur le mouvement du centre de gravit et sur le mouvement
de rotation du solide autour de ce centre de gravit.
190
Lint 2
,
2I
o I est une grandeur scalaire (de dimension kg m2 ), et appele moment dinertie. Au mme titre
que la masse, cest une caractristique intrinsque de lobjet. Dans le cas gnral de corps non
symtriques, I prend une forme tensorielle. 1
x = ypz zpy = y ~ z ~ ,
i z
i y
y = zpx x
(12.3)
L
pz = z
x
,
i x
i z
~
~
z = x
py ypx = x
y
,
L
i y
i x
En vertu du principe de correspondance, elle constituent les observables associs aux trois composantes classiques du moment cintique.
Le moment cintique orbital dcrit le mouvement du centre de gravit de la particule, lexclusion de tout mouvement de rotation de la particule sur elle mme (notion qui de toute faon,
chappe au formalisme des fonctions donde). Il est galement utile de dfinir, toujours laide du
principe de correspondance, lobservable norme au carr du moment cintique, selon
2 = L
2x + L
2y + L
2z .
L
(12.4)
191
=
y (V ) z (V ) V
y z
i z
i
z
y
y
~
V
V
=
y
z
= i~(
y Fz zFy ),
i
z
y
o Fx , Fy et Fz sont les observables associes la force applique au systme.
Principales relations utiles
Nous rcapitulons ci-dessous les principales relations qui nous serviront dans ce chapitre :
h
i h
i h
i
x , r2 = L
y , r2 = L
z , r2 = 0,
L
h
i h
i h
i
x , p2 = L
y , p2 = L
z , p2 = 0,
L
i
i h
i h
h
2z , r2 = 0,
2y , r2 = L
2x , r2 = L
L
i
i h
i h
h
2 , p2 = 0,
2 , p2 = L
2 , p2 = L
L
z
y
x
h
i h
i h
i
2
2
,L
x = L
,L
y = L
2, L
z = 0,
L
ainsi que les relations de non-commutation :
h
i
h
i
x , V = i~ yFz zFy ,
y , V = i~ zFx x
L
L
Fz ,
h
i
h
i
x, L
y = i~L
z,
y, L
z = i~L
x,
L
L
h
i
z , V = i~ x
L
Fy yFx ,
h
i
z, L
x = i~L
y,
L
192
L
=
y
F
,
x
z
y
dt
D E D
E
d
Ly = zFx x
Fz ,
dt
D E D
E
d L
z = x
Fy yFx .
dt
x par exemple,
En effet, pour loprateur L
d D E
1 Dh iE
Lx =
Lx , H ,
dt
i~
=
o le Hamiltonien H
h
p2
2m
i
h
i h
i
x, H
= 1 L
x , p2 + L
x , V = 0 + i~ yFz zFy ,
L
2m
y et L
z.
do le rsultat. La dmonstration se fait de mme pour les oprateurs L
On observe, en accord avec le principe de correspondance, que les termes de droite ne sont rien
dautre que les valeurs moyennes des observables associes au composantes du moment classique :
yFz zFy
M = r F = zFx xFz .
xFy yFx
Lquation dvolution de la moyenne des grandeurs quantiques apparat donc comme une transposition directe de lquation classique t L = M.
Stabilit du moment cintique dans un potentiel central
Dfinition 12.2. Un potentiel central est un potentiel V (r) qui nest fonction que de la norme r
du vecteur position r.
Le potentiel Coulombien et le potentiel de gravitation centrs sur lorigine sont des exemples
de potentiels centraux.
x, L
y, L
z et L
2 commutent avec
Proposition 12.1. Dans un potentiel central, les observables L
2
p
=
le Hamiltonien H
2m + V .
x, L
y, L
z et L
2 commutent dj avec le terme p2 du Hamiltonien,
Preuve. Comme les observables L
2
x.
il suffit de montrer que Lx , Ly , Lz et L commutent avec V . Traitons par exemple le cas de L
x , V ]), et on calcule
Pour ce faire, on considre D([L
i h i
Lx , V = [yz zy ](V (r)) V (r)[yz zy ] = [yz zy ](V (r)) .
~
Or, [yz zy ](V (r)) = V 0 (r)[yz r zy r], et y r = y/r, z r = z/r. Ceci montre finalement que
x , V ] = 0.
u
[L
t
En consquence, dans un potentiel central, en mcanique quantique comme en mcanique
classique, les composantes et la norme du moment cintique sont des constantes du mouvement.
193
i~Lx = Ly Lz Lz Ly ,
z,
i~Ly = Lz Lx Lx L
xL
y L
yL
x.
i~Lz = L
Ces relations revtent en fait une importance toute particulire. Nous allons voir en effet qu elles
seules, elles dterminent pour une large part la forme du spectre de quantification du moment
cintique. On a coutume de les noter sous la forme contracte (cela nest quune notation formelle) :
=L
L,
i~L
x, L
y, L
z ) dsigne loprateur vectoriel dont les composantes sont les trois observables
= (L
o L
Lx , Ly et Lz .
Pour le moment cintique orbital, il sagit de relations dmontres. En revanche, lorsque nous
nous intresserons aux objets en rotation sur eux mmes, il faudra construire de toutes pices un
formalisme spcifique au traitement quantique du moment cintique interne, mettant en jeu de
nouveaux espaces quantiques et de nouveaux oprateurs de moment cintique. Dans ce contexte,
la thorie quantique considre alors ces relations de commutation comme postulat de base sur
les proprits des nouveaux oprateurs introduits. La notion de moment cintique prend ainsi la
dfinition largie suivante :
Dfinition 12.3. En mcanique quantique, on nomme oprateur de moment cintique tout triplet
= (Jx , Jy , Jz ) qui vrifient la relation de commutation fondamentale :
dobservables J
=J
J.
i~J
Du seul fait de ces relations de commutation, dautres proprits de commutation du moment
orbital sont galement conserves. On montre en effet la proprit suivante :
= (Jx , Jy , Jz ) vrifie les relations de commutation :
Proprit 12.1. Tout moment cintique J
h
i h
i h
i
J2 , Jx = J2 , Jy = J2 , Jz = 0,
avec J2 = Jx2 + Jy2 + Jz2 .
Remarque 12.3. La relation i~a = a a pour un vecteur a peut paratre choquante (Chacun sait
en effet que pour des vecteurs a R3 , on a a a = 0). Ici, cette relation est vraie dans un espace
doprateurs o le produit nest pas commutatif. Cette bizarrerie est donc parfaitement possible...
est traditionnelle en mcanique quantique pour dsigner un opRemarque 12.4. La notation J
est rserve aux seuls moments
rateur de moment cintique dans le cas gnral. La notation L
cintiques orbitaux.
triplet dobservables J
194
py |k i = ~ky |k i,
pz |k i = ~kz |k i.
On pourrait de mme se demander sil existe une base de kets orthogonaux |n i et de valeurs
propres an , bn et cn telles que
Jx |n i = an |n i,
Jy |n i = bn |n i,
Jz |n i = cn |n i.
Malheureusement, les seules familles doprateurs pouvoir tre diagonaliss simultanment dans
une mme base sont les familles doprateurs qui commutent deux deux. Ceci tait le cas de px ,
py et pz , mais ce nest en revanche pas celui de Jx , Jy et Jz .
Le traitement du problme de quantification passe ainsi par la diagonalisation dun seul de ces
oprateurs, traditionnellement Jz . Le rsultat de quantification se transpose ensuite Jx et Jy au
prix de changements de bases dans lespace des kets, changements de base qui correspondent en
fait des changes daxes dans lespace 3D. Il existe toutefois une relation de commutation qui
permet de simplifier le travail : celle entre entre Jz et J2 . Comme ces deux oprateurs commutent,
il est possible de leur rechercher une base dtats propres commun. Certes, seul Jz paraissait nous
importer, mais nous avons l un plus dont la thorie quantique trouve dommage de se priver.
Cest ainsi quen thorie quantique, on nomme quantification du moment cintique le travail
de diagonalisation simultane de Jz et J2 .
12.4.2 Le rsultat de quantification
= J
J,
il est possible de montrer le
Sur la base des seules relations de commutation i~J
rsultat suivant :
= (Jx , Jy , Jz ), les
Thorme 12.1. Etant donn un triplet doprateurs de moment cintique J
2
2
2
2
oprateurs Jz et J = Jx + Jy + Jz sont diagonalisables dans une mme base, avec les proprits
suivantes :
(1) Leurs valeurs propres sont de la forme gnrale m~ pour Jz et j(j + 1)~2 pour J2 , avec j et
m deux nombres rels sans dimension.
(2) Les seules valeurs possibles pour j sont les nombres positifs entiers ou demi-entiers, cest
dire :
1
3
5
j = 0, , 1, , 2, , . . .
2
2
2
(3) Pour une valeur de j fixe, les seules valeurs possibles pour m sont les (2j + 1) nombres relatifs
entiers ou demi-entiers :
m = j, j + 1, j + 2, . . . , j 2, j 1, j
(4) Pour une valeur de j fixe, les sous espaces propres Vj,m communs Jz et J2 obtenus pour
diffrentes valeurs de m ont mme dimension, nulle, finie ou infinie, et note dj .
195
Ce rsultat signifie quil existe, pour lespace de Hilbert sur lequel les observables Jz et J2
oprent, une base orthonormale de vecteurs que nous notons |j, m, ki, indics par les nombres j
et m autoriss ci-dessus ainsi que par un troisime nombre entier positif k tel que 1 k dj , qui
vrifient :
(
Jz |j, m, ki = m~|j, m, ki,
j, m, k,
J2 |j, m, ki = j(j + 1)~2 |j, m, ki.
Les indices entiers ou semi entiers j et m permettent de dsigner le sous espace propre Vj,m dappartenance du vecteur considr. Lindice entier k distingue, en cas de sous espaces de dimension dj
suprieure 1, les diffrents vecteurs de base de ce sous espace.
Remarque 12.5. Nous apprenons ici quelles sont les valeurs propres mathmatiquement autorises
= J
J.
Cela ne signifie pas pour
pour un moment cintique, au vu de la relation fondamentale i~J
autant que face une situation concrte, toutes ces valeurs apparaissent. Cest situation physique
par situation physique que sont dtermines les dimensions dj des sous espaces, et ainsi quelles
sont les valeurs propres qui se manifestent effectivement.
Remarque 12.6. Pour noncer ce rsultat, loprateur Jz a t choisi de manire arbitraire. Il est
aussi possible de diagonaliser simultanment Jx et J2 dune part, et Jy et J2 dautre part. Les
valeurs propres et les dimensions dj trouves restent alors les mme. Les sous espaces propres de
Pj
J2 forms par la somme despaces Vj = m=j Vj,m restent galement inchangs. Seul le dtail
des sous espaces Vj,m obtenus pour les diffrentes valeurs de m se trouve modifi.
Remarque 12.7. Ce rsultat montre que quelque soit la situation considre, nous sommes en prsence de spectres discrets. Ces spectres sont entirement dicts par la valeur de la constante de
Planck, lexclusion de tout paramtre spcifique au systme. Ces spectres ont donc la particularit
de ne pas pouvoir tendre vers un continuum quand on se dplace vers des situations classiques.
Le pas de discrtisation des composantes, qui vaut ~ 1034 kg m2 s1 nest cependant pas trs
contraignant, et passe bien souvent inaperu !
12.4.3 Elments de dmonstration
Nous donnons ici la trame gnrale de la dmonstration du rsultat de quantification. On
suppose tout dabord que le spectre des oprateurs de moment cintique est purement discret.
Tous les rsultats utiliss ne sont pas dmontrs dans le dtail. Le point essentiel est de mesurer
la prcision des renseignements laquelle on peut parvenir uniquement grce un usage habile
des relations de commutation.
Etape 1 : (J2 ) [0, +[
D
E
Pour D(Jx2 ), on a |Jx2 | = kJx k2 car Jx est auto-adjoint. Ceci montre que Jx2 est
positif. Ainsi, J2 = Jx2 + Jx2 + Jx2 est galement positif. On peut ainsi rechercher les valeurs propres
de J2 sous la forme j(j + 1)~2 avec j un rel positif ou nul. En effet, lapplication j 7 j(j + 1)
dfinit bien une bijection de R+ sur R+ .
Nous pouvons donc utiliser les notations |j, m, ki et Vj,m introduites dans le thorme. En effet,
comme Jz et J2 commutent, il existe une base commune de diagonalisation de ces deux oprateur.
On peut alors chercher une base orthonormale de vecteurs |j, m, ki telle que
(
Jz |j, m, ki = m~|j, m, ki,
J2 |j, m, ki = j(j + 1)~2 |j, m, ki.
La diffrence avec le thorme vient cependant qu ce stade de la dmonstration, j et m ne sont
a priori que des nombres rels dont nous ne connaissons rien (hormis j 0). Nous ne savons rien
non plus des dimensions dj,m des sous espaces Vj,m .
Afin de nous reprer dans lvolution de la dmonstration, nous dessinons dans le plan (j, m)
les lieux reprs comme possibles pour les valeurs propres (voir la figure 12.3).
196
Fig. 12.3. Etape 1 de la dmonstration : Plan des nombres quantiques j et m : la zone des couples (m, j)
identifis comme impossibles au vu du rsultat sur la positivit de j est hachure. La zone des couples
(m, j) encore potentiellement valables reste en blanc. Cette dernire zone inclue laxe vertical j = 0.
Etape 2 : j m j
On dfinit les deux oprateurs, conjugus lun de lautre
J+ = Jx + iJy ,
J = Jx iJy .
Notons quils ne sont pas hermitiens, et ne peuvent donc pas correspondre des observables. Du
fait des relations de commutation entre Jx , Jy et Jz , on peut montrer que ces deux oprateurs
commutent avec J2 . On peut calculer sur la base des relations de commutation que :
J+ J = J2 Jz2 + ~Jz ,
J J+ = J2 Jz2 ~Jz .
Il vient alors
2
J+ |j, m, ki = hj, m, k|J J+ |j, m, ki = j(j + 1)~2 m2 ~2 m~2
(12.5)
2
J |j, m, ki = ~2 [j(j + 1) m(m 1)] 0.
Jz J+ |j, m, ki = (m + 1)~J+ |j, m, ki.
197
J2 J+ |j, m, ki = J+ J2 |j, m, ki = j(j + 1)~2 J+ |j, m, ki.
Dans la mesure o J+ |j, m, ki nest pas le vecteur nul (cest dire m 6= j), ceci montre quil est
vecteur propre commun de Jz et J2 pour les valeurs propres (m + 1)~ et j(j + 1)~2 respectivement.
Pour une valeur de j fixe, si on dispose dun vecteur |j, m, ki dj identifi comme lment
de la base recherche, il est possible de construire des vecteurs de type J+ |j, m + 1, ki, J+ |j, m +
2, ki,. . . ,J+ |j, m + p, ki,. . . (p entier), prouvant par l mme lexistence des couples de valeurs
propres (j, m + 1), (j, m + 2),. . . , (j, m + p),. . . Cette construction ne peut tre arrte que sil
existe un nombre entier positif p tel que m + p = j. Dans ce cas en effet J+ |j, m + p, ki = 0
(par (12.5)), et lorsquon itre par J+ , on ne gnre plus que des vecteur nuls. Le dernier couple
dindices gnr par la rcurrence est alors le couple (j, m + p) = (j, j).
Or, les valeurs propres vrifient m j. La rcurrence ne peut donc jamais se poursuivre
indfiniment. Quel que soit le vecteur |j, m, ki pris dans la base orthonormale recherche, il existe
donc un entier p positif ou nul tel que j = m + p (voir la figure 12.5).
Fig. 12.5. Etape 3 de la dmonstration : Action de loprateur J+ sur les couples de valeurs (j, m). Les
seules zones restant autorises pour ces valeurs sont les demi droites m = j-entier (m j).
198
Fig. 12.6. Etape 4 de la dmonstration : Seuls subsistent les points dintersection entre les demi-droites
m = j entier avec m j et m = j+entier avec m j. On observe que lensemble de ces points sont
de coordonnes entires ou demi-entires.
Etape 5 : Pour j m < j, les espaces Vj,m et Vj,m+1 ont mme dimension
Il reste prciser les dimensions des sous espaces propres. Il peut se produire en premier lieu
que les deux sous espaces soient de dimension nulle. Il ny a alors rien dmontrer. Nous nous
interessons au cas o au moins un des sous-espaces, Vj,m par exemple, a une dimension dj,m 1.
La dmonstration qui suit sadapte sans difficult au cas o linformation initiale est dj,m+1 1.
Fig. 12.7. Etape 5 de la dmonstration : Egalit des dimensions des sous espaces associs des mmes
valeurs de j.
199
Considrons J+ comme une application de Vj,m vers Vj,m+1 uniquement. Nous allons montrer
que J+ est injective. On a dj tabli que
|i Vj,m ,
Comme ici j m j 1, le terme [j(j + 1) m(m + 1)] nest pas nul. Loprateur J J+
restreint Vj,m est donc un simple oprateur de multiplication par une constante diffrente de 0,
donc une injection. Loprateur J+ est donc lui mme injectif. Ceci montre que
dj,m+1 dj,m .
Lingalit inverse stablit en montrant de mme que lapplication J est injective de Vj,m+1
vers Vj,m (voir la figure 12.7).
1
1 2
2
2
L = ~
+
+
,
2
tan sin2 2
z = ~ ,
L
i
= ~ei + i cot .
L
z et L
2 sont diagonalisables
Proposition 12.2. Les observables de moment cintique orbital L
dans une mme base orthonorme, avec les proprits suivantes :
z et L
2 sont de la forme m~ et l(l + 1)~2 respectivement, avec l N, et
(1) les valeurs propres de L
m Z tel que l m l. Les nombres l et m sont appels nombres quantiques. Ils indicent
les sous espaces propres communs aux deux oprateurs ;
200
Fig. 12.9. Dimensions des sous espaces Vj,m pour le moment cintique orbital : seules les valeurs propres
entires sont autorises, avec des dimensions de sous-espace infinies.
Cest le fait que, dans la forme gnrale des tats propres, la partie radiale puisse tre choisie
de manire arbitraire, qui implique que les sous espaces propres sont de dimension infinie. Le fait
que les nombres quantiques l et m ne puissent prendre que des valeurs entires est quant lui
une consquence de ce que nous travaillons dans un espace de fonctions donde de lespace trois
dimensions (variables (r, , ) en coordonnes sphriques), comme le montre la dmonstration qui
suit. La recherche analytique des tats propres du moment cintique orbital fait plein usage des
rsultats gnraux sur la quantification des moments cintiques. Nous en donnons ici les grandes
lignes.
Etape 1 : Forme factorise des tats du type |l, l, ki
Les tats |l, l, ki, cest dire, les tats du type |l, m, ki pour lesquels m = l, sont tels que
(
J+ |l, l, ki = 0,
Jz |l, l, ki = l~ |l, l, ki.
Notant l,l,k (r, , ) la fonction associe |l, l, ki, on a alors, dans le formalisme des fonctions
donde,
201
l,l,k
l,l,k
i
~e
+
i
cot
=0
~ l,l,k = l~ l,l,k .
i
On constate en premier lieu quaucune drive en r nintervient dans ce systme. Il est donc
possible de factoriser l,l,k selon : l,l,k (r, , ) = f (r)g(, ), avec f (r) arbitraire. On obtient
pour la partie angulaire g(, ) :
g
g
g
+ i cot
=
lg cot = 0,
g = ilg.
De la seconde quation, on dduit que g(, ) se factorise lui mme en g(, ) = h()eil , avec
h() une nouvelle fonction quil reste dterminer.
Etape 2 : l est entier
En tant que partie angulaire dune fonction de lespace, g(, ) doit vrifier g(, ) = g(, +
2). Il est donc ncessaire, au vu de la forme factorise de g(, ), que ei2l = 1. On en dduit que
l est obligatoirement un nombre entier. Alors mme que le thorme gnral de quantification du
=L
L
autorisent a priori les
moment cintique montre que les relations de commutation i~L
valeurs demi-entires de l, ces valeurs se rvlent ici interdites.
Etape 3 : Forme gnrale des tats |l, l, ki
Cette forme est obtenue en rsolvant, l entier fix, lquation sur h(), i.e. h = l~ cot . La
solution gnrale obtenue pour l,l,k (r, , ) est ainsi
l
202
2
= 1 Z = 1 (r) 1 S Z .
H
2
|x|
2r r2
2r2
r
Ylm , Ylm
0
E
L2 (S2 )
=
0
Ylm (, )Ylm
(, ) sin d d = ll0 mm0 ;
0
toute fonction f L2 (S2 ) se dcompose de manire unique sur la base des harmoniques
sphriques :
+ X
l
X
f=
hYlm , f iL2 (S2 ) Ylm ,
l=0 m=l
i Ylm = mYlm .
2l + 1 (l m)!
4 (l + m)!
1/2
Plm (cos ) eim ,
o les fonctions Plm (cos ) sont obtenues partir des polynmes de Legendre
Pl (x) =
par m drivations :
Pl (cos ) =
(1)l dl
(1 x2 )l
l
l
2 l! dx
(m)
(sin )m Pl
(cos )
(l + m)! m
si 0 m l,
si l m 0.
et L
2, L
z commutent. On peut donc chercher des vecteurs propres
On vrifie facilement que H
communs tous ces oprateurs, qui sont donc de la forme :
(r, , ) = R(r)Ylm (, ).
= E donne une quation sur la partie radiale R du vecteur propre :
Ainsi, H
l(l + 1)
Z
1 d2
(rR(r)) +
R(r) R(r) = ER(r).
2r dr2
2r2
r
On peut montrer (voir par exemple [6, 6.1.2]) qu l fix, on a une famille de parties radiales
(Rn,l )n>l de la forme gnrale
Rn,l (r) = Qn,l (Zr) eZr ,
Z
associes une nergie En,l = 2n
2 qui ne dpend pas de l. Les fonctions Qn,l sont des polynmes
de degr n l 1 0. En rsum,
12.6 Le spin
203
12.6 Le spin
12.6.1 Dfinition
Les particules du monde physique, telles que les protons, les neutrons, les lectrons et plus
gnralement - et de manire non exhaustive - tous les noyaux datomes sont porteurs dun moment
cintique interne. Au mme titre que le moment Lint des corps rigides en mcanique classique, il
constitue pour ces particules un nouveau degr de libert. Il ne remet pas en cause la description par
la fonction donde, qui reste le bon outil pour apprhender les tats de translation travers lespace
tridimensionnel, mais vient complter cette dernire, en apportant une information supplmentaire
sur ltat du systme. Ce moment cintique sort donc du cadre de description donn par la fonction
donde, et ne correspond pas un moment orbital. En dpit de son analogie avec un moment
cintique interne, il na dailleurs aucun rel quivalent en mcanique classique. Cest un moment
cintique dun nouveau type, purement quantique, que lon nomme spin.
Vis vis du formalisme quantique, qui dit nouveau degr de libert dit nouvel espace de Hilbert
pour le dcrire. Par bonheur, alors que maintenant, fonction donde et spin dcrivent conjointement
la particule, ces deux aspects peuvent tre dissocis en premire approche. On peut ainsi construire
un nouvel espace quantique propre au spin, nomm espace de spin. Ce sont les vecteurs norms
de cet espace qui sont reprsentatifs des diffrents tats de spin accessibles au systme.
Sur cet espace, le spin prend la forme dun oprateur de moment cintique au sens largi, cest
dire, un triplet dobservables :
= (Sx , Sy , Sz ).
S
Ces oprateurs de spin vrifient, comme tout moment cintique, les relations de commutation 2 :
=S
S.
i~S
12.6.2 Espace de spin
Nous acceptons les principes suivants, historiquement issus de lexprience :
Dfinition 12.4. Lespace de spin dune particule est dfini par les quatre principes :
(1) toute particule est associ un nombre I entier ou demi entier, et positif ou nul : le nombre
de spin ;
(2) lespace de spin de la particule est un espace de Hilbert de dimension 2I + 1 ;
2. Voil qui est un peu flou. Nous ne savons toujours pas exactement sur quel espace nous travaillons,
et lon dfinit dj des oprateurs. Cest cependant le maximum que peuvent apporter les principes de la
mcanique quantique. Plus choquant, ou plus puissant peut tre, est mme le fait que nous connaissons dj
pratiquement les spectres de ces oprateurs de spin, avant mme de savoir quel espace ils sappliquent.
Il y a aujourdhui des thories physiques (hors programme !) qui permettent de prdire la forme de ces
espaces. Historiquement, ce nest pourtant pas la thorie, mais simplement lexprience, qui a permis den
deviner la nature.
204
(3) dans cet espace, les nombres quantiques (j, m) autoriss pour les tats propres des oprateurs Sz
et S2 sont uniquement ceux vrifiant :
(
j = I,
m = I, I + 1, . . . , I 1, I ;
(4) les sous espaces VI,m obtenus pour les 2I + 1 valeurs possibles de m sont de dimension 1.
Le nombre de spin nest pas une proprit qui dpend des circonstances. Cest une caractristique intrinsque du type de particule considr. Par exemple,
tous les lectrons, tous les protons, et tous les neutrons ont un spin 21 ;
tous les noyaux de deutrium (isotope de lhydrogne, dont le noyau est form dun proton
et dun neutron) ont un spin 1.
On peut par ailleurs remarquer que pour tout ket | i de lespace de spin :
S2 | i = I(I + 1)~2 | i.
Tous les kets de lespace de spin sont donc tats propres de S2 pour la valeur propre I(I + 1)~2 .
On peut interprter cela avec les mains comme le fait que le moment cintique interne dune
particule possde une norme parfaitement fixe quaucun facteur physique externe ne peut venir
modifier. La vitesse de rotation dune particule sur elle mme ne peut ainsi tre ni ralentie, ni
acclre. Tout au plus peuvent avoir lieu des modifications dorientation de laxe de rotation.
Base orthonormale de lespace de spin
Une base orthonormale naturelle de lespace de spin dune particule de nombre de spin I est
obtenue en prenant les vecteurs propres (tous dordre de multiplicit 1) de Sz (voir la figure 12.10).
Pour le spin 32 , on les note par exemple :
3
1
1
3
,
2
2 , 2 , 2 .
On ne fait alors rfrence quau nombre quantique m = 23 , 12 ,
grande importance.
1
2,
3
2,
= S.
On le dcrit, au mme titre que le moment cintique ou limpulsion, par un triplet dobservables
= (
x ,
y ,
z ). La constante qui apparat est dite rapport gyromagntique de la
particule. Elle est, au mme titre que I, une caractristique intrinsque de cette dernire ;
12.6 Le spin
Fig. 12.10. Dimensions des sous espaces Vj,m dans lexemple du spin de nombre I =
espaces pour lesquels j = 23 sont autoriss. Ils sont chacun de dimension 1.
3
2
205
: seuls les 4
1
2
Lespace de spin 12 , premier espace de spin non nul, nest pas le moindre cependant car il correspond au cas des protons, des lectrons, des neutrons,
plusieurs noyaux atomiques. Cest
et de
un espace de dimension 2. La base dtats propres 12 , 12 de loprateur Sz est traditionnellement note
| i, | i.
On prononce : spin up et spin down. Ces notions de up et down font rfrence lorientation du
spin de long de laxe z. Attention cependant, car dans lespace de spin, | i et | i sont des kets
orthogonaux, et ne sont donc en aucun cas les opposs lun de lautre. Nous touchons l encore au
fait que les kets rendent compte de ltat du spin, mais ne sont pas le spin. Tout tat de spin | i
normalis sexprime ainsi selon :
| i = | i + | i,
||2 + ||2 = 1.
206
Il est parfois utile, dans cet espace de dimension 2, de travailler avec des notations matricielles.
Dans la base | i, | i on note ainsi
!
|i =
.
Bz
Bx iBy
Bx + iBy
Bz
Lhistoire a donn des noms aux divers Hamiltoniens susceptibles dagir sur les espaces de spins.
Le Hamiltonien dinteraction avec B sappelle ici Hamiltonien de Zeeman.
3. Attention, ceci ne veut pas dire que loprateur Hamiltonien est nul dans lespace des fonctions
dondes ! On sintresse ici seulement son action sur les spins.
12.6 Le spin
207
Exercices
Exercice 12.1. Dmontrer la Proprit 12.1
Exercice 12.2 (Satellite terrestre et quantification).
Comme nimporte quel systme matriel li, un satellite artificiel de la Terre voit ses mouvements quantifis. On considre ici un satellite de masse m en orbite circulaire basse (r R =rayon
de la Terre).
(1) Rappeler, en fonction de la constante de gravitation terrestre g 10 N m1 , la relation entre
la vitesse v du satellite, et le rayon r de sa trajectoire.
(2) Calculer approximativement le nombre quantique l correspondant au moment cintique dune
telle orbite.
(3) Quelle est la distance qui spare deux orbites voisines ?
(4) Calculer lnergie ncessaire pour passer dune orbite basse lorbite quantifie voisine.
(5) A quelle variation de l correspondrait une modification daltitude de 1 m ?
Exercice 12.3 (Le four micro-ondes).
On approxime une molcule deau H2 O comme lassemblage rigide dun atome doxygne
(nombre de masse A = 16) et de deux atomes dhydrognes (nombre de masse A = 1). Les
\
noyaux dhydrogne sont situs une distance denviron 1 de celui doxygne, et langle HOH
est denviron 105.
(1) On assimile le noyau doxygne au centre de masse de la molcule. Calculer le moment dinertie I de la molcule lorsque celle-ci tourne sur elle-mme autour dun axe perpendiculaire
son plan HOH.
(2) Le moment cintique de la molcule deau est quantifi la manire dun moment orbital.
Exprimer en fonction de I et de ~ lnergie cintique Erot de rotation de la molcule en
fonction de son nombre quantique l.
(3) Quel est lordre de grandeur de lcart dnergie entre les niveaux les plus bas ?
(4) A quelle longueur donde et quelle frquence f de photon cette nergie correspond-elle ? (La
gamme des micro-ondes correspond des frquences entre 0.4 et 250 GHz.)
Exercice 12.4 (Loscillateur harmonique).
Les techniques de calcul utilises pour extraire les proprits spectrales des oprateurs de moment cintique partir des proprits de commutations peuvent sappliquer de manire fructueuse
dautres systmes. Nous tudions ici le cas unidimensionnel de loscillateur harmonique, dans
lequel une particule de masse m est confine dans un potentiel de la forme :
V (x) =
1
m 2 x2 .
2
Nous allons montrer que les niveaux dnergie quantifis pour cette particule sont
1
~,
n N.
En = n +
2
(1) Donner, en fonction des oprateur position x
et impulsion px , lexpression du Hamiltonien
qui gouverne la particule.
unidimensionnel H
(2) On introduit les oprateurs a
+ et a
, dits respectivement oprateurs de cration et dannihilation
(cette appelation vient de la thorie quantique des champs, dans laquelle ces deux oprateurs
sont abondament utiliss) :
r
r
1
m
px
m
px
1
+
,
a
=
.
x
+ i
x
i
a
=
~
~
2
2
m~
m~
208
=a
Donner, en fonction de x
et px , lexpression de loprateur N
+ a
. En dduire que
= N
+ 1 ~.
H
2
] et [
].
(3) Calculer les commutateurs [
a, a
+ ], [
a, N
a+ , N
, et | i un tat propre normalis associ. Montrer que :
(4) Soit une valeur propre de N
| i) ;
est ncessairement positif (Considrer
la quantit h |N
a
| i est un vecteur de norme ;
si 6= 0, a
| i est un vecteur propre de N
pour la valeur propre ( 1) ;
+
pour
si 6= 0, a
| i est un vecteur de norme + 1, et galement un vecteur propre de N
la valeur propre ( + 1).
(5) En dduire, laide dun raisonnement inspir de la dmonstration de la quantification des
sont entires et que le spectre de N
est
moments cintiques, que les valeurs propres de N
constitu de tous les entiers positifs ou nuls. Conclure sur les valeurs propres de H.
13
Le principe de Pauli : fermions et bosons
Le Spin, assimilable au moment cintique interne des particules, est un concept purement
quantique. On ne peut quimparfaitement lapprhender dans le monde de la physique classique,
et il droute notre intuition par le fait que ses nombres quantiques puissent prendre des valeurs
demi-entires interdites aux moments orbitaux. Nous voyons dans ce chapitre, quoutre leurs manifestations lectromagntiques, les spins sont lorigine de phnomnes dinteractions particulires
entre particules de mme type. Le principe de Pauli explicite ces nouveaux phnomnes, et classe,
en fonction des interactions dveloppes, les particules physiques en deux groupes : les fermions et
les bosons. Nous dtaillons sur un exemple simple deux consquences essentielles de ce principe :
les rgles de remplissage des niveaux dnergie lectroniques dans les atomes et les molcules, et
le phnomne dit dinteraction dchange, qui conditionne lexistence des aimants temprature
ambiante.
210
de laboratoire. Car mme dans lespace, le vide nest en gnral pas assez pouss pour dire que les
quelques particules qui sy trouvent ninteragissent pas entre elles.
Peu nombreux sont dans la nature les systmes qui ne sont pas constitus dau moins quelques
milliards de milliards de particules. Une seule goutte deau, par exemple, contient dans un volume
lgrement infrieur 50 mm3 environ 3 1021 noyaux dhydrogne (protons seuls), 1, 5 1021
noyaux doxygne, et 1, 5 1022 lectrons, tous en interactions mutuelles. Sans mme aller jusque
l, la majorit des atomes et des petites molcules sont dj en gnral constitus de quelques
dizaines quelques centaines de particules.
Nous souhaitons ici faire un pas vers ltude de tels systmes, en nous limitant cependant
dans le cadre de ce cours au cas o toutes les particules sont de mme nature - par exemple,
uniquement les lectrons dans le champ de potentiel Coulombien dun noyau atomique ou dune
petite molcule.
13.1.2 Description quantique
En mcanique quantique, le systme plusieurs particules est dcrit dans toute sa globalit par
un ket | i appartenant un certain espace de Hilbert. Cet espace est de dimension plus grande
que ceux que nous avons rencontrs jusquici, du fait du plus grand nombre de degrs de liberts
dont il doit rendre compte : position, impulsion, et spin de chaque particule.
Par exemple, omettant la variable de spin, ltat dun systme de N particules de masse m est
dcrit par une fonction donde N corps :
(r1 , r2 , . . . , rN , t) ,
avec r1 , r2 , . . . , rN les vecteurs position des particules i = 1, . . . , N . La quantit | (r1 , r2 , . . . , rN , t) |2
sinterprte ici comme la densit de probabilit de trouver au temps t, lors dune mesure, les N
particules aux positions respectives r1 , r2 , . . . , rN . La phase de reste quant elle porteuse de
linformation sur la dynamique instantane du systme. Le principe de correspondance continue
sappliquer, et le Hamiltonien des N particules sans spin scrit en gnral :
2
2
2
= ~ r ~ r ~ r + V (r1 , r2 , . . . , rN ) ,
H
1
2
2m
2m
2m N
X
1i<jN
e2
.
40 |ri rj |
211
Lchange de particules ne devant pas modifier ltat du systme, et 12 doivent dcrire le mme
tat. En vertu de la proprit 8.2, ces deux fonctions ne doivent donc diffrer au plus que par un
dphasage global. Il existe ainsi 12 C tel que |12 | = 1 et
r1 , r2 , r3 , . . . , rN
(r1 , r2 , r3 , . . . , rN , t) = 12 (r2 , r1 , r3 , . . . , rN , t) .
(r2 , r1 , r3 , . . . , rN , t) = 12 (r1 , r2 , r3 , . . . , rN , t) ,
do finalement
r1 , r2 , r3 , . . . , rN
2
(r1 , r2 , r3 , . . . , rN , t) = 12
(r1 , r2 , r3 , . . . , rN , t) .
2
On a alors 12
= 1 et donc 12 = 1. Il en ressort que, ncessairement,
r1 , r2 , r3 , . . . , rN
(r1 , r2 , r3 , . . . , rN , t) = (r2 , r1 , r3 , . . . , rN , t) ,
ou
r1 , r2 , r3 , . . . , rN
(r1 , r2 , r3 , . . . , rN , t) = (r2 , r1 , r3 , . . . , rN , t) .
212
13.3.1 Deux particules discernables sans spin dans le fond dun puits quantique
Rappel : systme une seule particule
Nous considrons un puits quantique unidimensionnel de largeur a. Les tats dnergie pour une
particule unique de masse m sont donns par les fonctions donde stationnaires 1 (x), 2 (x), . . .
et les nergies associes E1 , E2 , . . . Ces fonctions sont des tats propres du Hamiltonien une
particule
2
2
=~ ,
H
0 x a.
2m x2
Supposons que seuls les deux niveaux de plus basse nergie sont accessibles, et notons 1 et 2 ces
niveaux (voir les rsultats plus prcis du 10.1.1). Le puits quantique devient ce que lon appelle
un systme deux niveaux, dont le diagramme dnergie peut se reprsenter selon le schma de la
figure 13.1. Supposant aussi que la particule na pas de spin, le ket | i qui la dcrit volue dans
un espace de dimension 2, et sa forme gnrale est
| i = 1 (x) + 2 (x),
||2 + ||2 = 1.
Fig. 13.1. Les deux premiers niveaux dnergie du puits quantique unidimensionnel.
Supposons pour linstant que les deux particules sont discernables, de sorte pouvoir momentanment oublier les contraintes sur la symtrie ou lantisymtrie de la fonction donde. On peut
demble, en sappuyant sur les tats propres une particule 1 (x) et 2 (x), construire pour le
nouvel Hamiltonien des tats propres deux particules :
|11i :
|12i :
dnergie 2E1 ,
dnergie E1 + E2 ,
|21i :
|22i :
dnergie E1 + E2 ,
dnergie 2E2 .
213
Lhypothse que seuls les deux premiers niveaux du puits sont accessibles la particule individuelle
se traduit ici par le fait que ces quatre tats forment une base pour les tats accessibles la
paire. On vrifie facilement quils constituent bien une famille orthonorme au sens du produit
scalaire L2 ([0, a]) :
Z
h(x1 , x2 )|(x1 , x2 )i =
(x1 , x2 )(x1 , x2 ) dx1 dx2 .
[0,a]2
Fig. 13.2. Diagrammes nergtiques reprsentatifs des 4 tats de base du systme de deux particules
discernables, dans le cas o seuls 2 niveaux sont accessibles la particule isole.
(x1 , x2 ) = (x2 , x1 ).
214
Fig. 13.3. Fonctions donde deux particules reprsentatives des 4 tats de base du systme de deux
particules discernables.
x1 , x2 ,
21 (x1 , x2 ) = 12 (x2 , x1 ),
22 (x1 , x2 ) = 22 (x2 , x1 ).
Une condition ncessaire et suffisante pour que la condition de symtrie soit satisfaite est donc
= . La fonction donde deux particules scrit dans ce cas
(x1 , x2 ) = 11 (x1 , x2 ) + [12 (x1 , x2 ) + 21 (x1 , x2 )] + 22 (x1 , x2 ).
Proposition 13.2. Les fonctions donde dcrivant une paire de deux bosons sans spin dans le
puits quantique unidimensionnel deux niveaux sont contenues dans un sous espace de dimension 3
de lespace des fonctions donde. Une base orthonorme 1 de ce sous espace des fonctions donde
symtriques est donne par
|11i,
+
1
12
= (| 1 2 i + | 2 1 i) ,
2
|22i.
215
numroter 1 et 2. On observe que les 3 diagrammes nergtiques pourraient ici tre obtenus de
manire heuristique en rangeant de toutes les manire possibles deux particules non numrotes et
interchangeables sur les deux niveaux disponibles. Une diffrence essentielle avec le cas discernable
vient de ce quil ny a ici plus quun seul tat dans lequel les particules sont sur des niveaux
diffrents.
Fig. 13.4. Diagrammes nergtiques reprsentatifs des 3 tats de base du systme de deux bosons, dans
le cas o seuls 2 niveaux sont accessibles la particule isole.
Fig. 13.5. Fonctions donde deux particules reprsentatives des 3 tats de base du systme de deux
bosons.
216
gnrale des tats vrifiant cette condition. Dans le formalisme des fonctions donde, il faut que
x1 , x2
soit
= = 0,
= .
Fig. 13.6. A gauche : diagramme nergtique reprsentatif de lunique tat du systme de deux fermions,
dans le cas o seuls 2 niveaux sont accessibles la particule isole. A droite : la fonction donde deux
particules associe.
On peut enfin vrifier sur lexemple du puits infini unidimensionnel que lorthogonalit de | 12 i
avec chacun des trois tats symtriques | 1 1 i, | 12+ i et | 2 2 i implique que
217
Proprit 13.1 (Orthogonalit des tats symtriques et antisymtriques). Les sous espaces des fonctions donde symtriques et antisymtriques, qui dcrivent respectivement les tats
de bosons et de fermions, sont orthogonaux.
Preuve. On omet encore les variables de spin. Soit = (r1 , . . . , rN ) antisymtrique et =
(r1 , . . . , rN ) symtrique. Alors,
Z
Z
(r1 , r2 , . . . , rN )(r1 , r2 , . . . , rN ) dr =
(r2 , r1 , . . . , rN )(r2 , r1 , . . . , rN ) dr
R3N
R3N
Z
=
(r1 , r2 , . . . , rN )(r1 , r2 , . . . , rN ) dr
R3N
u
t
218
| 1 i | i,
| 2 i | i,
| 2 i | i.
Par rapport au cas de la particule sans spin, on peut dire, dune certaine faon, que la prsence
du spin ddouble chaque tat. A ces tats peuvent tre associs les diagrammes dnergie de la
figure 13.7.
Fig. 13.7. Diagrammes nergtiques des 4 tats de base pour une particule de spin
systme deux niveaux.
1
2
place sur un
| i :
| i :
| i :
De mme que pour les fonctions donde 2 particules, les deux derniers tats peuvent tre combins
pour former un tat symtrique, et un tat antisymtrique de spins :
+
1
= (| i + | i)
2
219
1
= (| i | i) .
2
On construit ainsi une base orthonorme de lespace deux spins, forme de trois tats symtriques :
+
| i,
| i,
(tats triplets),
et dun tat antisymtrique :
(tat singulet).
| 2 2 i
12
| i,
| 1 1 i
(spins antiparallles),
+
12
,
(spins antiparallles),
(spins parallles),
(spins antiparallles).
Voyons comment il est possible de rendre compte de ces tats au moyens de diagrammes nergtiques. Si nous plaons de toutes les manires possibles des particules non numrotes de spins | i
ou | i sur les deux niveaux du diagramme dnergie, tout en sinterdisant de mettre deux particules de mme spin sur le mme niveau, on obtient les 6 diagrammes de la figure 13.8.
Certains de ces diagrammes peuvent tre associs de manire assez vidente des tats de la
base. La vritable ambigut concerne les tats du centre de la deuxime ligne : tous deux dsignent
3. Une approche plus rigoureuse demande considrer, dans cet espace de spin de dimensions 4, loprateur norme au carr de la somme des spins, qui vaut, dans la base | i, | i, | i, | i :
2 0 0 0
0 1 1 0
(S1\
+ S2 )2 = ~2
0 1 1 0
0 0 0 2
On sapperoit alors que les tats triplets et singulet forment une base dtats propres de (S1\
+ S2 )2 , avec
2
2
les valeurs propres 2~ et 0 respectivement. On retrouve, dans la valeur 2~ , la norme au carr I(I + 1)~2
dun spin de nombre de spin I = 1.
220
Fig. 13.8. Les 6 diagrammes nergtiques qui peuvent tre construits pour deux fermions de spin 12
placs sur un systme
niveaux.
Quatre
identifiables aux tats
deux
directement
de ces diagrammes sont
, 12 | i, 12 | i et | 1 1 i . Lidentification avec les tats
de
base
|
2
2
i
+
12
et 12 + est plus dlicate. Cest l une limite de ce systme de reprsentation
graphique (la vrit tant dans la forme mathmatique des tats).
bien une occupation mutuelle des niveaux 1 et 2 par les 2 lectrons, mais ne sont pas capables de
rendre compte du caractre parallle ou antiparallle des spins. Nous touchons l une limite de
ce type de reprsentation. Bien que ces dessins soient une aide prcieuse la comprhension du
contenu physique des tats avec lesquels nous travaillons, le dtail de linformation se trouve bel
et bien dans les formules !
Remarque 13.1. Le lecteur attentif aura remarqu qu aucun moment nous navons parl de linteraction lectrostatique rpulsive entre les deux lectrons. Il est clair que pour la vraisemblance
physique de ce modle, il aurait t indispensable de prendre en compte cet aspect dans le Hamiltonien deux particules. Notre but ntait cependant pas tant ici davoir un modle vraisemblable,
quun systme simple pour illustrer la mise en pratique concrte du principe de Pauli. Mentionnons
toutefois, quen dpit de la complexit apporte par la prise en compte des interactions coulombiennes, on constate que pour des objets tels que les atomes et les molcules, tout se passe, en
premire approximation, comme si il existait bel et bien des niveaux lectroniques une particule, sur lesquels viendraient se ranger un un les lectrons comme nous lavons fait ici. Cette
approximation, trs courante, porte le nom dapproximation orbitale.
221
Regle 13.1. Les lectrons se rangent librement dans les niveaux dnergie, en adoptant chacun
un tat de spin up ou down, et en sinterdisant uniquement que deux lectrons de mme spin
co-existent sur un mme niveau.
Cette rgle permet en particulier de construire dans des systmes tels que les atomes et les molcules, la forme de ltat lectronique temprature ambiante. En gnrale, lagitation thermique
est insuffisante pour faire sortir ces systmes de leurs tats fondamentaux. On obtient ainsi leur
structure en empilant dans le fond du diagramme dnergie les lectrons les uns sur les autres,
en commenant par le niveau le plus bas et en procdant ensuite par niveaux dnergie croissante.
En dpit de leurs imperfections, et notamment, leur incapacit expliciter de manire univoque
lorientation relative de deux spins, ces diagrammes sont toujours bien plus lisibles que la forme
exacte de la fonction donde sous jacente, surtout lorsquon passe des systmes 3 particules ou
plus. Leur utilisation fin de raisonnements physiques est trs rpandue.
4. Rappelons quune nergie de E = 0.1 eV correspond une temprature de T = E/kB ' 1150 K.
222
Exercices
Exercice 13.1 (Un modle dEtoile Neutrons).
En fin de vie, lorsquelles sarrtent de briller, les toiles dont la masse est suprieure 1,44
fois la masse du Soleil seffondrent brutalement sur elles-mmes. Par effet de rebond, une quantit
colossale dnergie et de matire est alors expulse dans lespace : cest lexplosion de la super-nova.
En lieu et place de ltoile initiale, la matire restante se condense tel point que de nouvelles
ractions entre particules ont lieu, dans lesquelles tous les lectrons et tous les protons fusionnent
pour former des neutrons. Un nouveau corps prend forme : ltoile neutrons. Ce corps quasi
exclusivement form de neutrons ne possde plus datome. Nous nous proposons ici, laide du
principe de Pauli, destimer sa densit et sa taille.
Nous assimilons ltoile neutrons une sphre de rayon R, de densit homogne, contenant un
nombre N de neutrons ltat fluide. Cette sphre peut tre regarde comme un espace confinant.
De fait, lnergie des neutrons est quantifie. On admet sans dmonstration que, pour une particule
sans spin confine dans un espace de volume V , le nombre de niveaux dnergie compris entre le
niveau fondamental et une nergie donne E peut tre approxim, quand le volume est grand,
par :
3
4 (2mE) 2
N (E) = V
,
3
h3
avec h = 2~. On rappelle enfin que les neutrons sont des fermions, de spin 12 .
(1) Calculer, dans ltat fondamental de ltoile, lnergie Emax maximale accessible aux neutrons
en fonction du rayon R.
(2) Montrer que lnergie cintique totale des neutrons sexprime selon :
Z Emax
dN
Etot =
2E
dE.
dE
0
Calculer Etot en fonction de R et dautres paramtres du problme.
(3) On peut montrer que lnergie potentielle de gravitation dune sphre homogne de masse
volumique et de rayon R est
8 2 2 5
Egrav =
G R ,
15
avec G la constante de gravitation universelle. En dduire lnergie totale de ltoile neutrons
en fonction de R. On notera m la masse dun neutron.
(4) Pour quel rayon cette nergie est-elle minimale ?
(5) Si la masse de ltoile neutron est de 2 masses solaires (Msoleil 2 1030 kg), quel est son
rayon ? Quelle est sa densit ?
Exercice 13.2 (Ferro et Paramagntisme : le modle de Curie).
Certains corps solides peuvent, selon les circonstances, dvelopper des proprits magntiques
lchelle macroscopique. Cest notament le cas des aimants, qui prsentent spontanment une
aimantation et crent de forts champs magntiques dans leur voisinage : ces corps sont dits ferromagntiques. Cest galement le cas des solides dits paramagntiques, dans lesquels laimantation
nest pas spontane, mais peut tre induite par lapplication dun champ magntique extrieur. Ce
phnomne peut servir amplifier des champs magntiques : cest, par exemple, la raison dtre
des blocs de fer doux que lon place lintrieur des bobines des transformateurs lectriques.
La physique statistique montre que lapparition de ces aimantations ne peut pas tre explique
par la mcanique classique, et constitue un phnomne purement quantique. Un des principaux
mcanismes pouvant tre mis en jeu est lorientation massive de diples magntiques microscopiques contenus dans le solide. Ces diples sont induits conjointement par le moment orbital et le
spin dlectrons pigs dans les couches profondes de certains atomes (chrome, cobalt,. . . ).
Nous considrons ici un solide contenant en son sein un nombre N de tels diples, que nous
supposons tous identiques. On admet que les moments cintiques Ji de ces diples (1 i N )
se comportent comme des spins, tous de mme nombre quantique I, et on pose ici pour simplifier
I = 21 .
223
Diples indpendants
(1) Les diples, supposs sans interaction les uns avec les autres, sont placs dans un champ
magntique B orient selon laxe z. Ecrire, dans la base (| i, | i), la matrice du Hamiltonien
i dinteraction du diple i avec B. Quels sont les tats dnergie ? (On introduira le rapport
H
gyromagntique )
(2) En vertu des principes de physique statistique, ces tats propres sont occups au prorata du
facteur de Boltzman eE/kB T , avec kB la constante de Boltzman, T la temprature, et E lnergie de ltat considr. Calculer, pour lassemble de diples, la valeur moyenne hmz (T, B)i de
leur composante selon laxe z.
(3) Tracer lallure de hmz (T, B)i en fonction de B pour diffrentes valeurs de la temprature T .
(4) On dfinit une susceptibilit magntique selon
hmz i
.
=
B B=0
Calculer . Comment dpend-il de la temprature ? La dpendance en
loi de Curie.
1
T
N
X
i=1
i
H
N
X
Jz,i hmz i,
~2
i=1
14
La liaison chimique : des molcules diatomiques aux corps
solides
Le phnomne de quantification, dont un des effets est de fixer une valeur dnergie minimale
pour les systmes physiques usuels (lnergie fondamentale), est lorigine dinteractions particulires entre les atomes. En se rapprochant les uns des autres, les noyaux atomiques parviennent
en effet parfois abaisser en commun lnergie de leurs nuages lectroniques : cest le phnomne
de liaison, dite chimique ou ionique selon les circonstances.
Ce chapitre constitue une brve introduction aux domaines de la chimie quantique et de la
physique des solides. Nous traitons dans un premier temps le mcanisme de formation de la liaison chimique. Nous expliquons en particulier pourquoi elle ne peut se former quentre certains
atomes compatibles. Ensuite, nous montrons que le processus de modification des tats lectroniques concerne galement les corps solides. Des structures particulires dtats lectroniques
peuvent alors tre observes, qui expliquent notamment les proprits de conduction lectrique ou
la transparence optique de certains objets.
226
et rB leurs positions. Vis vis dun lectron qui viendrait passer prs de la molcule, le potentiel
dinteraction Coulombienne rsultant est (voir la figure 14.1) :
V (r) = VA (r) + VB (r) =
nA e2
1
nB e2
1
.
40 |r rA |
40 |r rB |
Nous nous intressons aux tats dnergie accessibles un lectron qui se trouverait plac dans ce
potentiel, et tout particulirement les tats lis (dnergie ngative), car ce sont eux qui dterminent
la structure lectronique de la molcule. Comme nous cherchons les tats dun lectron seul, on
omet dans la suite la variable de spin, et on ne considre que la fonction donde spatiale. Le
Hamiltonien scrit alors
2
+ VA + VB .
= ~ + VA (r) + VB (r) = h
H
2m
Fig. 14.1. Le double trou de potentiel cr par la juxtaposition des noyaux A et B. Sur ce schma,
nB > nA . Le puits de latome B sen trouve plus large et plus profond.
227
Fig. 14.2. Lapproximation CLOA : les diagrammes nergtiques de latome A isol, de la molcule
AB, et de latome B isol sont reprsents de manire juxtapose. On constate en pratique que chaque
orbitale | AB i de la molcule sapproxime comme une combinaison linaire de niveaux atomiques nergtiquement proches, dsigns par les flches en pointills. Par exemple, ltat not | AB,3 i est quasiexclusivement une combinaison linaire de | A,2 i, | B,1 i et | B,2 i. Il ne sagit ici que dun dessin de
principe. Des schmas plus prcis sont donns dans la suite du cours.
228
D
E
A |H|
= hA |E|i ,
D
E
B |H|
= hB |E|i .
Utilisant la dcomposition (14.1), on arrive
D
E
D
E
A + cB A |H|
B = cA hA |E|A i + cB hA |E|B i ,
cA A |H|
D
E
D
E
A + cB B |H|
B = cA hB |E|A i + cB hB |E|B i .
cA B |H|
Cette criture peut se simplifier :
(1) tant donn que les fonctions donde associes | A i et | B i sont valeur relles,
et tant
D
E
est un oprateur diffrentiel coefficients rels, on a A |H|
B =
donn que le Hamiltonien H
D
E
A R. Quitte changer le signe de | A i par exemple, on peut supposer que
B |H|
D
E D
E
B = B |H|
A 0.
= A |H|
La constante R est homogne une nergie ;
(2) on fait lapproximation que les proprits des orbitales atomiques des atomes isols sont peu
prs prserves lorsque les atomes forment une molcule. Ceci est vrai au premier ordre, et on
pourrait prendre en compte des termes de corrections (ce qui nest pas trs important pour
une premire comprhension du phnomne de liaison). On suppose donc
D
E
D
E
A EA ,
B EB ,
A |H|
B |H|
et
hA |B i = hB |A i 0.
Avec ces approximations, on obtient
(
EA cA + cB = EcA ,
cA + EB cB = EcB .
Le rcherche des tats dnergie pour llectron situ au voisinage des noyaux atomiques A et B
se rsume ainsi un problme de recherche de vecteurs propres (cA , cB ) et de valeurs propres E
dans un espace de dimension 2, pour la matrice symtrique coefficient rels :
EA
.
EB
Tant que 6= 0 ou EA 6= EB , il existe pour cette matrice deux sous espaces propres de dimension 1,
orthogonaux entre eux, et associs deux valeurs propres E1 , E2 :
p
p
(EA EB )2 + 4 2
(EA EB )2 + 4 2
EA + EB
EA + EB
,
E2 =
+
. (14.2)
E1 =
2
2
2
2
Le calcul des vecteurs propres associs ne pose ensuite plus de difficult de principe. Nous interrompons toutefois les calculs, et nous discutons la signification physique de ce rsultat.
14.1.4 Orbitales liante et antiliante
Dans la molcule AB, les niveaux dnergie atomiques | A i et | B i perdent leur qualit dtats
propre du Hamiltonien. Ils se combinent pour crer deux nouveaux tats dnergie, que nous notons
| 1 i et | 2 i associs aux nouvelles nergies E1 et E2 . Dans ces tats, du fait du mlange de | A i
229
et | B i, llectron se retrouve cheval, ou plutt rparti sur les deux atomes de la molcule. Ce
mlange des tats | A i et | B i est dit phnomne dhybridation.
Lorsque les tats | A i et/ou | B i sont initialement porteurs dlectrons, une grande partie
de la physique du rapprochement des atomes A et B se joue dans la manire dont E1 et E2 se
comparent aux nergies initiales EA et EB . Dans ce qui suit, nous supposons, quitte changer
les atomes A et B, que EA < EB .
Proprit 14.1. Les nergies E1 , E2 , EA et EB sont ranges dans lordre suivant :
E1 EA EB E2 .
Proprit 14.2. Les nergies E1 , E2 sont rparties de manire symtrique autour des nergies
EA , EB , au sens o
EA + EB
E1 + E2
=
.
2
2
p
La premire proprit provient simplement de la minoration (EA EB )2 + 4 2 EA EB
0. On a ainsi E2 EB et E1 EA . La seconde proprit rsulte directement de la dfinition (14.2)
des nergies E1 , E2 .
On reprsente les orbitales atomiques | A i et | B i et les orbitales molculaires | 1 i et | 2 i
dans le diagramme nergtique de la figure 14.3. La nouvelle orbitale | 1 i a une nergie plus
basse que les niveaux atomiques. Elle offre une situation nergtiquement plus favorable pour un
lectron. Elle est dite orbitale liante. La nouvelle orbitale | 2 i a une nergie plus haute que les
niveaux atomiques. Elle offre une situation nergtiquement moins favorable pour un lectron. Elle
est dite orbitale anti-liante.
Fig. 14.3. Eclatement des niveaux atomiques des atomes A et B en deux orbitales molculaires. Laxe
dnergie du diagramme nergtique de la molcule nest pas reprsent.
x +
EA EB
0,
x2 + 4
= ||
.
x + x2 + 4
230
E2 = EB .
Utilisant toujours la forme gnrale des orbitales molculaires (14.1), on obtient, pour le vecteur
propre associe E1 , le systme dquation dinconnues cA et cB :
(
EA cA + cB = E1 cA = (EA + )cA ,
cA + EA cB = E1 cB = (EA + )cB .
On voit donc que cA = cB . On en dduit la forme normalise dun reprsentant de lorbitale liante
(moyennant lapproximation dune quasi-orthogonalit de | A i et | B i)
1
| 1 i = (| A i + | B i)
2
Il est remarquable que ces deux orbitales fassent chacune intervenir les tats atomiques | A i
et | B i avec des poids gaux. Un lectron qui se situe dans ltat liant | 1 i se retrouve ainsi
simultanment prsent sur les deux atomes. On dit quil y a mise en commun de cet lectron. Le
diagramme dnergie obtenu est prsent en figure 14.4.
Liaison chimique covalente
Considrons le cas o les niveaux | A i et | B i sont initialement chacun porteurs dun lectron.
Lors du rapprochement, la formation de lorbitale liante permet ces deux lectrons dabaisser progressivement leur nergie. La rpartition schmatique obtenue ( laide de la rgle de remplissage)
est donne en figure 14.5.
La paire dlectrons se retrouve mise en commun entre les deux atomes. Il en rsulte un abaissement de lnergie lectronique totale dune quantit 2||, qui peut valoir en pratique jusqu 1 eV.
Comparativement, lnergie dagitation thermique kB T la temprature ambiante de T = 300 K
nest que de 0.026 eV. Cette situation, extrmement stable et favorable, pousse les deux atomes
rester en permanence accrochs lun lautre : cest la liaison chimique covalente. Elle est trs
difficile casser sans important apport extrieur dnergie.
231
Fig. 14.4. Diagramme nergtique de la molcule issue de lhybridation de deux orbitales atomiques de
mme nergie.
Fig. 14.5. Liaison chimique : mise en commun des lectrons de chaque atome sur lorbitale molculaire
liante.
EA EB
1.
x + x2 + 4
x + x2 + 4
E1 = EA +
,
E2 = EB
.
2
2
Comme x 1, on peut effectuer un dveloppement limit en =
E1 = EA + + O(3 ),
1
x
des nergies E1 , E2 :
E2 = EB + O(3 ).
232
Les nergies molculaires E1 , E2 restent ainsi trs proches des nergies atomiques. Procdons
au calcul de la forme des orbitales | 1 i et | 2 i. Les quations sur cA et cB scrivent ici, pour
lnergie E1 :
(
EA cA + cB = E1 cA ' (EA + )cA ,
cA + EB cB = E1 cB ' (EA + )cB .
De ces deux quations on tire, lordre 1 en , que cB = cA + O(2 ). On en dduit la forme,
normalise lordre 1 en , de lorbital liante :
| 1 i ' | A i + | B i
Non seulement les nergies, mais galement les orbitales molculaires elles-mme restent trs
proches des tats atomiques | A i et | B i. Ces derniers se mlangent en fait peine. Ltat
liant | 1 i est ainsi essentiellement ltat | A i, perturb au premier ordre par | B i, et ltat
antiliant | 2 i est ltat | B i perturb au premier ordre par | A i. Un lectron se trouvant dans
une de ces orbitales molculaires reste donc essentiellement localis sur lun ou lautre des atomes.
Il ny a presque pas de mise en commun. Le diagramme dnergie correspondant est prsent en
figure 14.6.
Fig. 14.6. Diagramme nergtique de la molcule issue de lhybridation de deux orbitales atomiques trs
dcales en nergie.
Liaison ionique
Considrons nouveau le cas o, avant dtre rapprochs, les niveaux | A i et | B i sont
chacun porteurs dun lectron. La paire dlectrons vient se placer dans lorbitale liante. Comme
elle correspond peu de choses prs ltat | A i, cela revient dire que les deux lectrons se
regroupent sur latome A : latome A gagne un lectron, et latome B en perd un. La molcule
ressemble ainsi la simple juxtaposition de deux ions A et B + .
Que se passe-t-il prsent si lon cherche casser la molcule en sparant les deux atomes ?
Il est peu probable quun lectron retourne se placer sur ltat | B i. Lnergie reprendre est
souvent de lordre de 1 eV, ce qui est extrmement couteux. Une solution bien plus rentable pour
la paire dlectrons consiste rester sur latome A, et de continuer ne peupler que ltat | A i.
233
Le cot nergtique de la sparation de la molcule nest plus que 2||, soit en pratique quelque
chose de lordre de 0.1 eV. Les deux ions A et B + se sparent, sans se restituer leurs lectrons
(voir la figure 14.7).
Fig. 14.7. Liaison ionique : llectron de latome B tombe dans lorbitale liante de la molcule. La
diffrence essentielle avec la liaison chimique vient de ce quici, cette orbitale liante est en premire approximation ltat | A i de latome A.
Un nouveau rapprochement des deux ions reformera la molcule, mais en ne mettant plus en
jeu que lnergie 2||, typiquement 10 fois infrieure lnergie de la liaison chimique. Ce type de
liaison assez fragile dans laquelle un atome donne un lectron lautre est nomm liaison ionique.
Elle peut garder une certaine solidit temprature ambiante. Nanmoins, une lgre perturbation
de lenvironnement de la molcule (sa dilution dans leau, notament) peut suffire la dissocier.
Dune certaine manire, la liaison ionique est une liaison chimique rate. . .
14.1.7 Compatibilit des orbitales atomiques
Nous voyons que lors de la formation dune molcule, deux tats atomiques ne se mlangent
rellement que sils sont initialement suffisament proches en nergie lun de lautre. Nous trouvons
l une justification a posteriori de lapproximation CLOA.
Par ailleurs mme Ddans le casE extrme o EA = EB , lhybridation nest pas systmatique. Le
B soit non nul, et surtout, ait une valeur significative, loin daller
fait que le terme = A |H|
de soit, est en fait un phnomne spcifique dune certaine compatibilit des tats | A i et | B i
pouvoir se combiner. Cette compatibilit dpend pour beaucoup des proprits de symtrie des
fonctions donde qui dcrivent | A i et | B i, et il nest pas rare quentre deux tats quelconques,
soit si petit quil puisse tre considr comme nul au regard des nergies caractristiques du
problme. Dans le cas particulier des molcules diatomiques, on peut mme avoir exactement
gal zro !
Malgr la profusion des tats lectroniques en prsence, la plupart des orbitales molculaires
des molcules diatomiques sont ainsi :
soit des tats atomiques qui nont pas trouv shybrider ;
soit des hybrides mettant en jeu un seul tat de latome A et un seul tat de latome B (le
seul qui leur soit compatible, tant du point de vue de la condition EA EB , que du point
de vue 6= 0).
Dans les molcules trois atomes et plus, des situations dhybridation plus complexes peuvent
survenir, dans lesquelles trois orbitales atomiques ou plus se combinent avec des poids comparables.
Il nen reste pas moins quune compatibilit pralable des atomes est ncessaire pour garantir la
stabilit de lensemble.
234
14.1.8 Exemples
Molcules homonuclaires
Ce sont les molcules qui rassemblent deux atomes de mme nature (atomes A et B identiques).
Les niveaux atomiques mis en prsence sont alors les mmes de part et dautre de la molcule. En
gnral, ces niveaux shybrident par paires, chaque niveau de latome A salliant son homologue
de latome B pour former les nouvelles orbitales molculaires.
Le schma de la figure 14.8 vaut pour tous les atomes, et montre de manire schmatique
comment fusionnent les 5 premiers niveaux atomiques. Les chimistes ont dvelopp pour dsigner
ces orbitales atomiques et molculaires toute une nomenclature que nous indiquons ici.
Fig. 14.8. Les premires orbitales molculaires hybrides de la molcule homo-nuclaire. Les hybridations
sont systmatiques entre niveaux atomiques homologues de chaque atome. Ce diagramme de principe vaut
quelque soit la molcule considre.
235
Essayons nous au mme exercice pour crer une molcule diatomique avec des atomes dhlium
(2 lectrons par atome). Du fait des rgles de remplissage, les quatre lectrons du systme sont
obligs de peupler non seulement lorbitale liante, mais galement lorbitale antiliante (voir la
figure 14.10). Lnergie lectronique totale de la molcule reste ainsi trs proche de celle des atomes
spars. Si lon tient compte par ailleurs de la rpulsion lectrostatique entre les noyaux atomiques,
de lagitation thermique et de lintrt, au plan entropique, de laisser les atomes spars, il apparat
que cette molcule nest pas stable. Nous comprenons ainsi qualitativement pourquoi la molcule
He2 nexiste pas.
Fig. 14.10. Diagramme nergtique de la molcule He2 . Lorbitale antiliante, qui reoit deux lectrons,
empche labaissement nergtique ncessaire pour la liaison chimique.
Molcules htronuclaires
Nous donnons ici lexemple de la molcule dacide fluorhydrique HF. Cette molcule, ltat
de gaz dans les conditions normales de temprature et de pression, se dissout facilement dans leau
en se dissociant de manire totale selon :
HF H+ + F
Latome de fluor porte lorigine 9 lectrons, et celui dhydrogne un seul. Dans le diagramme de la
figure 14.11, aucune des orbitales atomiques du fluor ne se trouve directement en face du niveau 1s
de lhydrogne. Dans le rapprochement, quasiment aucun tat atomique nest ainsi modifi. On
note juste une discrte hybridation entre un des niveaux 2p du fluor et le niveau 1s de lhydrogne.
Lorbitale molculaire liante dans laquelle llectron de lhydrogne descend nest ainsi autre quune
des orbitales 2p du fluor. Cet lectron reste pig sur le fluor lors de la sparation des deux atomes,
pour un cot nergtique modeste. Ceci explique la facile dissociation de la molcule en ions F
et H+ .
236
Fig. 14.11. Diagramme nergtique de la molcule dacide fluorhydrique HF. Elle ne doit son existence
qu un lger abaissement dun des niveaux 2p du fluor, par discrte hybridation avec lorbitale 1s de
lHydrogne, pourtant dj loigne en nergie.
se mlangent entre eux pour former de nouveaux tats dnergie lectroniques. La diffrence vient
cependant du fait que ce ne sont pas 2, mais N tats qui shybrident simultanment, et que ce ne
sont pas 2 orbitales, mais N orbitales qui sont formes chaque fois, avec N souvent de lordre
de NA 1023 ! Si lon considre les nergies de ces orbitales, on constate par ailleurs quelles ne
sont pas beaucoup plus disperses que les orbitales liante et antiliante de la molcule diatomique.
On obtient ainsi schmatiquement le diagramme nergtique de la figure 14.12.
Fig. 14.12. Formation de bandes dnergie par hybridation des orbitales atomiques dans un corps form
dun seul type datome.
237
Bandes dnergies
Par hybridation, chaque niveau atomique donne naissance un petit continuum dnergie,
dextension limite : la bande dnergie. Une bande rsultant de lhybridation de 1 tat par atome
contient exactement N orbitales, une bande rsultant de lhybridation de 2 tats par atome contient
exactement 2N orbitales, etc.
Densit dtat D(E)
Plutt que de considrer sparment les niveaux dngergie de toutes les orbitales, on a coutume
de dfinir une fonction D(E) dite densit dtat, telle que le nombre dorbitale ayant une nergie
RE
comprise entre E1 et E2 soit gal E12 D(E) dE. Sur cette densit dtats, chaque bande prend
lallure dune courbe en cloche.
Dune manire gnrale, le dtail des structures de bande dpend du solide tudi. La forme
prcise, la largeur, et la hauteur des bandes dans la diagramme dnergie est en effet trs sensible,
non seulement la nature de latome dont le solide est constitu, mais galement la manire
dont ces atomes sont rpartis dans lespace. Cest ainsi que la graphite et le diamant, pourtant
deux solides forms de carbone pur, ont des structures de bandes diffrentes.
Pour les solides forms datomes diffrents, ces structures de bandes sont galement observes.
Pour autant, selon la compatibilit chimique des niveaux dnergie des atomes en prsence, les
bandes peuvent parfois tre plus fines, beaucoup plus spares les unes des autres, et leurs nergies
plus calques sur celles des niveaux atomiques sous jacents que dans le cas des corps purs.
14.2.2 Le cas particulier des solides cristallins
Lapproximation CLOA est la seule mthode permettant de donner une premire approximation de la structure de bandes dans dans un solide quelconque. Dans le cas particuliers des solides
cristallins, il existe en revanche un certain nombre de rsultats mathmatiques permettant de
calculer la forme gnrale des tats dnergie lectronique et la structure de bande associe.
Dfinition 14.1 (Rseau de Bravais et solide cristallin). Un solide cristallin est un corps
dont les atomes sont disposs selon un motif qui se rpte priodiquement travers lespace. Plus
prcisment, pour un cristal donn, il existe trois vecteurs indpendants a, b, c R3 (dits vecteurs
de base) tels que quelque soit latome que lon trouve en un point donn r0 de lespace, cet atome
se rpte en tous les autres points r0 + n1 a + n2 b + n3 c, (n1 , n2 , n3 ) Z3 . Le rseau priodique
dfini par les vecteurs a, b, c est appel rseau de Bravais (voir la figure 14.13), et est not R :
R = {n1 a + n2 b + n3 c, (n1 , n2 , n3 ) Z3 }.
Il dfinit la priodicit de larrangement atomique du cristal.
Ceci nest pas quune dfinition mathmatique. Cette proprit sapplique rellement tout un
ensemble de corps, dont nombre sont dorigine naturelle. Ils se forment sur des temps gologiques,
au bnfice de conditions particulires de tempratures et de pression qui favorisent la mise en
ordre priodique des atomes. Cest le cas par exemple des cristaux de quartz, de mica et de
feldspath qui constituent le granit, roche forme dans les profondeurs de lcorce terrestre, ainsi
que de beaucoup de pierres prcieuses. Il sagit alors tout fait de limage traditionnelle du
cristal, qui peut naturellement prendre la forme dun polydre avec des faces planes de diverses
orientations. Certains, plus rares, peuvent galement tre synthtiss : le diamant artificiel, par
exemple, utilis pour la fabrication doutils de meulage nest cependant produit qua ltat de fine
poudre. Le silicium, galement, seul lment dont on sait produire des cristaux de plusieurs dizaines
de centimtres. La plupart des mtaux sont quant eux constitus, lchelle microscopique, dun
micro-assemblage de petits cristaux colls les uns aux autres (les grains, colls entre eux par des
joints de grains, chers la mtallurgie physique).
238
Fig. 14.13. Rseau de Bravais pour un cristal maille paralllpipdique rectangle (on parle de rseau
rhombodrique).
Ltude thorique des cristaux se montre ainsi riche denseignements sur de nombreux mtaux et
alliages. La priodicit de larrangement atomique dont il est question ici sarrte bien videmment
sur les bords du corps considr. Cela interfre peu avec les proprits du cristal, du moment
que celui-ci est de taille suffisament grande. Dans ce qui suit, par simplicit, le cristal sera ainsi
rellement suppos de taille infinie. Un cristal est alors caractris par un motif gnrateur, la
cellule unit.
Dfinition 14.2 (Cellule unit). Etant donn un rseau de Bravais R, on peut partitionner
tout lespace en considrant un polyhdre semi-ouvert Q, appel cellule unit, et ses images par le
rseau R :
[
(Q + R) = R3 ,
(R, S) R2 , S 6= R (Q + R) (Q + S) = .
RR
xa + yb + zc,
3 )
1 1
(x, y, z) ,
.
2 2
Fig. 14.14. Diffrents choix possibles de cellule unit pour un mme rseau bi-dimensionnel. Le choix
dune cellule de forme simple ( gauche) est une commodit pratique, mais pas une obligation.
2. Il y a une infinit de cellules units, certes. . . Mais certaines constructions sont univoques : cest le cas
de la cellule de Wigner-Seitz, qui a de plus le mrite de conserver les symtries de R. Nous ne prtendons
surtout pas que le choix que nous ferons par la suite est le meilleur !
239
Il est utile pour la suite de dfinir un rseau obtenu partir du rseau de Bravais : le rseau
rciproque.
Dfinition 14.3 (Rseau rciproque). Le rseau rciproque R0 dun rseau de Bravais R est
lensemble
R0 = n1 a0 + n2 b0 + n3 c0 , (n1 , n2 , n3 ) Z3 ,
o les vecteurs a0 , b0 et c0 , homognes des vecteurs donde, sont dfinis par les relations :
a a0 = 2, b b0 = 2, c c0 = 2,
a b0 = a c0 = b a0 = b c0 = c a0 = c b0 = 0.
La proprit essentielle sous jacente cette dfinition, est que le rseau rciproque regroupe
lensemble des vecteurs donde k tels que :
R R,
eikR = 1.
3. On appelle cette cellule la (premire) zone de Brillouin dans les ouvrages de physique.
240
Preuve. On prsente ici un argument formel (Pour une dmonstration complte, on renvoie [29]).
Pour L2loc (R3 ) par exemple, on introduit la translation R de vecteur R :
R (r) = (r R).
per commutent,
Du fait de la priodicit du potentiel, on peut montrer que R et le Hamiltonien H
quel que soit le vecteur R R choisi. Il est par ailleurs facile de voir que les oprateurs R
commutent 2 2. Il est donc possible de trouver une base commune de vecteurs propres au
per et tout lensemble des translations R (R R), sous la forme de fonctions
Hamiltonien H
solutions de 4
per = E,
H
(14.3)
R = (R), R R.
Entant donns deux vecteurs R, S R, la seconde condition ci-dessus implique (R + S) =
(R)(S) (car R+S = R S = S R ), et |(R)| = 1 (car ||
R || = ||||, en norme L2 (Q) par
exemple). Ainsi, il existe k R3 tel que (R) = eikR . Le systme (14.3) devient ainsi
per = E,
H
R = eikR , R R.
Posant alors (r) = (r)eikr , on vrifie facilement que pour tout vecteur R du rseau de Bravais,
R (r) = (r), cest dire que est R-priodique. Les tats propres communs au Hamiltonien
et tous les oprateurs de translation sont donc de la forme
(r) = (r)eikr
avec une fonction R-priodique.
On peut naturellement indicer le vecteur donde par k R3 . Pour viter les redondances, il
faut toutefois se restreindre k ZDB, quitte translater k dun vecteur q du rseau rciproque
selon
q R0 , k0 = k + q ZDB.
En effet,
ik r
u
t
et (r)
= (r) eiqr est bien R-priodique.
Structure de bandes
Pour un vecteur donde k ZDB donn, la recherche des ondes de Bloch associes conduit
pour la partie priodique (r) lquation :
~2
i~2
~2 |k|2
Gk =
k + Vper (r) +
= E.
2m
m
2m
per sont dtermines par celles de G
k , pour tous les k ZDB,
Ainsi, les proprits spectrales de H
au sens o
[
per ) =
k ).
(H
(G
kZDB
k est auto-adjoint dinverse compact (en essence, parce que les termes
On peut vrifier que G
0 = ~2 , qui est dinverse compact pour des
supplmentaires sont des perturbations de H
2m
problmes poss sur des ensembles borns).
k est une suite croissante de
On montre alors que pour k ZDB fix, le spectre de G
per en rassemblant les
rels (n (k))nN , homognes des nergies. On obtient le spectre de H
4. On se souviendra pour cela de linterprtation du spectre comme "ensemble des vecteurs propres
gnraliss".
241
k (k ZDB). Comme on peut montrer par ailleurs que k 7 n (k) est continue
spectres des G
pour tout n 1, on en dduit que In = {n (k), k ZDB} est un intervalle de R, not [n , n ].
Finalement,
[
per ) =
(H
[n , n ].
n1
Fig. 14.15. Structure de bandes (droite) et densit dtats associe (gauche) pour un compos BC3 N3 en
cellule rhombodrique [3]. Sur la structure de bandes sont reprsentes les courbes n (k) obtenues le long
dune ligne brise qui explore les divers recoins de la zone de Brillouin. La courbe la plus basse correspond
n = 0, celle immdiatement suprieure n = 1, etc. Ces courbes ont tendance ne plus voluer de
manire strictement monotone au del de n = 4. Ici, la plupart des bandes se recouvrent les unes les
autres, et la densit dtats prsente lallure dune courbe trs accidente, avec de nombreux pics. A noter
toutefois, sur la densit dtats, un trou aux alentours de -15 eV. Cette particularit est appele gap
dnergie. Elle est lorigine des proprits lectroniques et optiques des matriaux.
242
Fig. 14.16. Remplissage des bandes dnergie par les lectrons dans le lithium et le Graphite. Le remplissage commence par les orbitales les plus basses en nergie, raison de 2 lectrons par orbitale, et se
poursuit progressivement vers les orbitales immdiatement suprieures. Les bandes, ou portions de bandes
ainsi occupes apparaissent en gris.
Dans le cas du carbone, la structure de bande est lgrement diffrente. La bande suprieure
connat une anomalie, qui la spare en deux sous bandes. La sous bande infrieure porte extactement N orbitales. Les 6N lectrons viennent ainsi remplir en entier les 2 bandes du bas et cette
sous bande. Le remplissage sarrte exactement au ras de la 2me sous bande.
Matriaux conducteurs, matriaux isolants
Considrons la structure lectronique qui a t obtenue dans le lithium. Le remplissage des
lectrons sarrte mi-bande, un niveau nomm nergie de Fermi. Le niveau de Fermi F est
dfini par la relation
+ Z
2 X
1 (k) dk = Ncel ,
|ZDB| n=1 ZDB F n
o Ncel est le nombre dlectrons par cellule. Cette nergie se situe en plein continuum, et il existe,
juste au dessus delle, un foisonnement dorbitales libres. Il est ainsi possible de communiquer au
systme dlectrons de trs petites quantits dnergie. Il suffit pour cela de prendre des lectrons
juste en dessous du niveau de Fermi, et de les faire passer juste au dessus, en les excitant.
Communiquer une trs faible quantit dnergie, cest prcisment ce que lon fait lorsque
lon cherche crer un courant lectrique, cest dire imprimer aux lectrons un mouvement
densemble. Dans le cas du lithium, le remplissage des bandes est tel que ces faibles montants
dnergie peuvent tre accepts. Le lithium est ainsi un matriau conducteur lectrique.
La situation est en revanche trs diffrente lorsque le remplissage des bandes sarrte sur une
bande pleine. Il peut en effet se produire quun vide existe entre la dernire bande remplie et la
bande suivante (voir la figure 14.17) : on parle de gap dnergie. Il est alors impossible de fournir
au systme dlectrons une nergie infrieure la largeur E du gap. Dans certains corps E
peut tre de lordre de quelques eV. Cest peine perdue que de chercher y crer des courants
lectriques de manire douce, les lectrons refusant systmatiquement lapport dnergie propos.
Le matriau est dit isolant lectrique 5 .
Il existe des situations intermdiaires, dans lesquelle un gap existe, mais de largeur plus modeste, typiquement infrieure ou gale 1 eV (1,21 eV dans le silicium). Les matriaux sont alors
5. Un courant lectrique peut toujours nanmoins tre cr dans les isolants en appliquant de trs
fortes tensions. Il ne sagit alors plus de conduction lectrique proprement dite, mais de claquage, qui
saccompagne gnralement dun endomagement du matriau l ou le courant est pass.
243
Fig. 14.17. Le gap dnergie : le remplissage des orbitales lectroniques sarrte exactement sur un bord
de bande. Lorbitale dnergie immdiatement suprieure est distante dun intervalle E.
dits semi-conducteurs. Il est possible, par des sollicitations extrieures modres, ou par des modifications chimiques mineures lors de leur fabrication, de leur faire prendre sur commande des
proprits de conducteurs lectriques ou disolants. Cest l ce qui fait leur intrt dans les machines
lectroniques.
Transparence optique des isolants grand gap
De mme quil est difficile un isolant daccepter de lnergie pour produire un courant lectrique, il est aussi difficile ce mme isolant daccepter dabsorber un photon. Toujours cause
de la prsence du gap, seuls les photons dnergie ~ E ont de relles possibilits de pouvoir
tre absorbs (voir la figure 14.18).
Fig. 14.18. Absorption ou transmission dun rayonnement dans un isolant en fonction de lnergie du
photon incident. A gauche, lnergie ~ est infrieure au gap. Aucune absorption ne peut avoir lieu. A
droite, lnergie est suffisante pour pouvoir porter un lectron de la bande pleine dans un des tats dnergie
de la bande suprieure. Labsorption a lieu.
Dans le diamant, par exemple, il existe un gap de 7 eV de largeur. Les photons de la lumire
visible ont eux des nergies typiquement comprises entre 1.5 eV (lumire rouge) et 3 eV (lumire
violette). Ces nergies sont trop faibles pour tre absorbes, et nous comprenons ainsi lexceptionnelle transparence optique du diamant. Les premiers rayonnements absorbables correspondent
des photons de 7 eV, ce qui se situe dj loin dans lultraviolet. Il en va de mme pour le quartz
et le verre, qui sont respectivement les formes cristalise et amorphe de la silice (dioxide de silicium SiO2 ). Le verre ne laisse passer que la lumire visible, alors que le quartz, dont le gap
nergtique est plus grand, se laisse aussi traverser par le rayonnement ultraviolet. Cela explique
pourquoi il est impossible de bronzer derrire une vitre, et pourquoi les lampes bronzer (lampes
UV) doivent tre fabriques en quartz.
244
A loppos, les matriaux qui possdent des gaps plus faibles, et en particulier, tous les matriaux conducteurs, ne peuvent pas tre transparents la lumire. 6
6. Une nuance peut cependant tre apporte : sil est vrai que labsence de gap fait que tout rayonnement
est susceptible dtre absorb, le mcanisme dabsorption rclame cependant quune certaine paisseur de
matriau soit traverse pour que labsorption soit totale. Cette paisseur varie selon les longueurs donde.
De quelques microns pour la lumire visible, elle passe plusieurs centimtres pour les rayons X, voire
plusieurs mtres pour les rayons . Cest ainsi que les minces films dor dont sont recouvertes les visires
de certains avions restent globalement transparents la lumire visible, en dpit de leur conductivit,
et quil est illusoire de vouloir se cacher derrire une feuille de papier daluminium pour se protger de
rayonnements issus de sources radioactives.
245
Exercices
Exercice 14.1 (Un modle simple de liaison chimique).
Prliminaire
On considre, dans lespace tridimensionnel (x, y, z), la bote quantique paralllpipdique
(x, y, z) [0, a]3 . Le potentiel est nul lintrieur, et on rappelle que la fonction donde dune
particule de masse m confine dans la bote doit sannuler sur les bords de celle-ci.
(1) Ecrire lquation de Schrdinger indpendante du temps qui dfini la partie spatiale (x, y, z)
dun tat stationaire dnergie E.
(2) On admet que ces tats dnergie peuvent tre recherchs sous la forme factorise
(x, y, z) = x (x)y (y)z (z).
Calculer la forme gnrale de ces tats, et en dduire lnergie de ltat fondamental.
Liaison entre deux botes
(1) On considre deux botes spares, qui reprsenteront pour nous deux atomes, chacune de
dimensions aaa avec a = 1 , et contenant chacune un lectron dans son tat fondamental.
Calculer lnergie lectronique totale des deux botes.
(2) On fait se toucher les deux botes, de sorte ce quelles ne forment plus quune seule grande
bote de dimensions a a 2a. Quelle est la nouvelle nergie lectronique ?
(3) Quel est le gain nergtique du rapprochement (nergie de liaison) ? Faire lapplication numrique.
Exercice 14.2. On peut montrer directement quil ny a pas de spectre discret pour le solide priodique. Ceci montre au passage que lespace de Hilbert usuel nest pas le bon espace considrer,
car on ne peut pas avoir dtats lis.
et E = Ker(H
Id) (de dimension N ). Montrer que si f E, alors fp E
(1) Soit d (H)
avec fp (x) = f (x + p) si p R.
PN
(2) En considrant une base (ui )i=1,...,N de E, en dduire quon peut crire fp (x) = i=1 p,i ui
PN
2
| = 1.
avec i=1 |p,i
(3) Montrer que pour tout > 0, il existe R > 0 tel que
Z
1 i, j N,
ui uj ij .
BR
(4) En calculant
+.
R
BR
246
hi |j i = 0 si i 6= j,
j
i |H|
E
=
si i = j,
si i = j 1,
sinon.
N
X
ci |i i .
i=1
A
Constantes physiques fondamentales
Notation usuelle
Valeur
Nombre dAvogadro
Constante de Boltzmann
Constante de Planck
Charge de llectron
Masse de llectron
Masse du proton
Masse du neutron
Permittivit dilectrique du vide
Electron-Volt
Constante de gravitation
Vitesse de la lumire
NA
kB
~
e
me
mp
mn
0
eV
G
c
6, 02 1023
1, 381 1023 J/K
1, 054 1034 Js
-1, 602 1019 C
9, 11 1031 kg
1, 672 1027 kg
1, 674 1027 kg
8, 854 1012 F/m
1, 602 1019 J
6, 67 1011 m3 kg1 s2
2, 998 108 m/s
e = 1,
~ = 1,
1
= 1.
40
Dans ce cas, lunit de masse est 9, 11 1031 kg, lunit de longueur est le rayon de Bohr
a0 = 5, 29 1011 m, lunit de temps est 2, 42 1017 s, et lunit dnergie est le Hartree
Ha = 4, 36 1018 J = 27,2 eV = 627 kcal/mol. Ce changement dunit permet de travailler avec
des valeurs intuitives des grandeurs physiques : ainsi, les distances moyennes typiques entre un
lectrons et le noyau auquel il est rattach sont de lordre du rayon de Bohr, et les nergies des
tats fondamentaux (en valeur absolue) de lordre de quelques Ha pour les petits systmes.
B
Analyse numrique des schmas dintgration
Nous rappelons ici (brivement) des notions importantes pour lanalyse numrique des schmas
dintgration des EDO. Le lecteur intress par plus de dtails pourra par exemple se rfrer [9].
On considre ici une mthode numrique un pas, pour un pas de temps constant t et des temps
tn = nt :
y n+1 = t (tn , y n ),
(B.1)
dont le flot t est une approximation du flot t de lEDO
t [0, T ],
y = f (t, y(t)),
y(0) = y 0 + ,
(B.2)
o est un petit paramtre prcisant lapproximation de la condition initiale. Ainsi, y n est une
approximation au temps tn de la solution exacte y(tn ) de (B.2).
On suppose par la suite que le champ de force f est globalement Lipschitzien. Dans ces conditions, le problme de Cauchy (B.2) est bien pos sur des temps t T , T < + fix, et on peut
tudier thoriquement la convergence des schmas numriques. Une tude dans un cas plus gnral
demande un traitement spcifique au systme considr.
n=1
lorsque t 0.
La quantit |y(tn+1 ) y(tn ) tt (tn , y(tn ))| est lerreur de consistance locale, et reprsente
lerreur intrinsque dapproximation du schma numrique. La dfinition prcdente signifie que
lerreur de consistance est ngligable pour t suffisamment petit.
En pratique, pour vrifier la consistance, on a souvent recours la notion dordre dun schma :
Dfinition B.2 (Ordre). Soit t > 0. On dit que la mthode numrique (B.1) est dordre p si
|y(tn + t) y(tn ) tt (tn , y(tn ))| Ktp+1
pour t t0 suffisamment petit.
Ainsi, une mthode dordre 1 ou suprieur est consistante (si on peut montrer que la constante
K dans la dfinition B.2 est uniforme).
250
Exemple B.1 (Schma dEuler explicite). Pour le schma dEuler explicite et f autonome (ne dpendant pas explicitement du temps), on a, par un dveloppement de Taylor,
y(tn + t) y(tn ) tt (y(tn )) =
t2 00
t2 0
y (tn )) + O(t3 ) =
f (y(tn ))f 00 (y(tn )) + O(t3 ).
2
2
Ceci montre que le schma dEuler explicite est dordre 1. Dans le cas o le champ de force f est
drives bornes, on obtient galement la consistance de la mthode numrique.
B.2 Convergence
Dfinition B.3 (Stabilit). On dit quune mthode numrique est stable sil existe une constante
M > 0 telle que pour toutes suite y n , z n , n (n 0) vrifiant
n+1
y
= y n + tt (tn , y n ),
n+1
z
= z n + tt (tn , y n ) + n ,
on ait
max |z y | M
n
0nN
|y z | +
0
!
| | .
n
n<N
La stabilit prcise la robustesse du schma face laccumulation des erreurs locales (ou darrondi). Cest une notion pertinente sur un temps T > 0 donn.
Remarque B.1. En particulier, une instabilit ventuelle "en temps long" (T +, t fix) ne
contredit pas la consistance, qui est une convergence trajectorielle dans le cas limite t 0 pour
T fix.
Dfinition B.4 (Convergence). On dit que la mthode numrique est convergente si
max |y(tn ) y n | 0
0nN
lorsque 0, t 0.
On montre facilement quune mthode stable et consistante est convergente.
251
C
Elements de thorie spectrale
On prsente dans ce chapitre les fondements de la thorie spectrale, en insistant tout particulirement sur les oprateurs auto-adjoints. On prendra garde au fait que nombre de raisonnements
ou de proprits vrais dans le cas dun espace de dimension finie, ne le sont plus pour des espaces de dimension infinie ! On peut citer par exemple le fait que toutes les normes ne sont pas
quivalentes, que les oprateurs linaires ne sont pas forcment continus, quune application peut
tre injective sans tre surjective (et rciproquement) - et donc en particulier, ce nest pas parce
quune application a un noyau rduit {0} que lon peut linverser ! Ce chapitre est donc lire
et relire tranquillement. . . jusqu ce que les affirmations ci-dessus vous semblent honteusement
contingentes aux espaces de dimension finie !
La thorie spectrale est un outil fondamental pour ltude des systmes quantiques. Citons
deux applications particulirement importantes :
(i) la rsolution de lquation de Schrdinger par dcomposition spectrale (on prsente un cas
particulier en Section 10.4.3) ;
(ii) ltude qualitative voire quantitative de ltat fondamental du systme (voir Chapitre 14) ;
(iii) la caractrisation possible des rsultats de la mesure, dcrite par une observable auto-ajointe
(voir Chapitre 11).
kT ukF
.
uE\{0} kukE
sup
(C.1)
254
Dans le cas gnral, la notion dextension dun oprateur est dfinie par rapport au domaine
(non-ncessairement dense) de loprateur que lon cherche tendre.
Dfinition C.2 (Extension dun oprateur). On dit que T2 est une extension de T1 si D(T1 )
D(T2 ) et si les deux oprateurs concident sur le domaine de T1 .
On dfinit enfin la notion doprateur ferm :
Dfinition C.3 (Oprateur ferm). On dit quun oprateur T de E dans F de domaine D(T )
est ferm si son graphe
(T ) = {(u, T u), u D(T )}
est un ferm de E F . Un oprateur est dit fermable sil possde une extension ferme.
Ainsi, T est ferm si pour toute suite (un ) de D(T ) telle que un u dans E et Aun v
dans F , on a u D(T ) et Au = v.
Exemple C.1. On considre E = F = L2 (]0, 1[) et T u = u0 . Alors D(T ) = H1 (]0, 1[). Si un u
dans L2 (]0, 1[) et u0n v dans L2 (]0, 1[), alors (un ) est une suite de Cauchy dans H1 (]0, 1[), qui
est complet. Ceci montre que u H1 (]0, 1[) et v = u0 au sens de L2 (]0, 1[).
En revanche, si on prenait comme domaine D(T ) = C1 (]0, 1[), alors la suite
x
un (x) =
converge au sens de H1 (]0, 1[) vers
1
2
u(x) = x
1
n2
1/2
1
,
2
qui nest pas dans D(T ). Ceci montre que loprateur T , avec ce domaine, nest pas ferm (le
domaine de dfinition est trop petit). En revanche, il est fermable quitte tendre le domaine de
dfinition H1 (]0, 1[).
Remarque C.2. Tout oprateur nest pas fermable. On peut mditer par exemple le cas de T :
L2 (R+ ) R de domaine D(T ) = C
0 (R+ ) et donn par T u = u(0). En effet, la suite un (x) =
exp(nx) converge vers u = 0 au sens de L2 (R+ ), et T u = 0 ; alors que T un = 1 pour tout n.
v H,
hT u, vi = hu, T vi .
255
La grande majorit des oprateurs donns par la physique sont formellement symtriques (i.e
3
symtriques sur un espace de fonctions suffisamment rgulires, tel que C
0 (R )). Cette notion
nest pas suffisante dans la majorit des cas, et on voudra souvent avoir affaire des oprateurs
auto-adjoints.
Dfinition C.6 (Oprateur auto-adjoint). Un oprateur est auto-adjoint si T = T . Un oprateur T est essentiellement auto-adjoint si T admet une unique extension auto-adjointe.
Remarque C.3. Un oprateur T est auto-adjoint si et seulement sil est symtrique et D(T ) =
D(T ). En pratique, il est souvent plus ais de vrifier la symtrie que le caractre auto-adjoint,
cette dernire notion demandant en plus de montrer lgalit des domaines D(T ) et D(T ).
Remarque C.4. On peut montrer (voir [29, Section VIII.2]) quun oprateur symtrique est toujours
fermable, mais quil peut avoir plusieurs extensions auto-adjointes. . .
RT = IdIm(R) .
On dduit de la dfinition ci-dessus que linverse dun oprateur est unique sil est dfini, et on
note un tel oprateur T 1 . Trouver linverse dun oprateur revient rsoudre lquation T u = f
pour tout f Im(T ). Un critre dexistence dinverse de T est alors que T u = 0 implique u = 0
(T tant alors bijectif H Im(T )). Lexistence dun inverse se rsume ainsi linjectivit de
T : D(T ) H.
Dfinition C.8 (Ensemble rsolvant et spectre). Soit T un oprateur linaire non-born,
ferm, de domaine D(T ). Lensemble rsolvant (T ) de T est lensemble des C tels que
(1) loprateur T Id a un inverse (T Id)1 , cest--dire que (T Id)u = f a une unique
solution pour tout f Im(T Id) (injectivit) ;
(2) le domaine de (T Id)1 (i.e. limage de D(T ) par T Id) est dense dans H (presque
surjectivit) ;
(3) loprateur (T Id)1 est born de (T Id)(D(T )) (muni de la topologie induite de H) dans
H ( continuit de linverse).
Le complmentaire de (T ) dans C est le spectre de T , et on le note (T ).
On montre que lensemble rsolvant est un ouvert de C, et par consquent, le spectre (T ) est
un ferm de C.
Remarque C.5 (Bornes sur le spectre dun oprateur born). Pour un oprateur born, on peut
montrer que
(T ) { C, || kT k}.
Un lment C est dans le spectre de T si une des conditions de la Dfinition C.8 nest pas
remplie. Ceci conduit la classification suivante des lments de (T ) :
Dfinition C.9. Le spectre (T ) est la runion disjointe de trois sous-ensembles :
256
le spectre ponctuel, not p (T ), qui est lensemble des (T ) pour lesquels T Id nest
pas injectif. De telles valeurs de sont appeles des valeurs propres de T ;
le spectre rsiduel, not res (T ), qui est lensemble des (T ) pour lesquels (T Id)1 est
de domaine non dense dans H. On a alors dfaut de presque surjectivit : Im(T Id) 6= H ;
le spectre continu, not cont (T ), st lensemble des (T ) pour lesquels (T Id)1 est
un oprateur non born de domaine dense dans H (dfaut de continuit).
On peut ventuellement considrer une autre partition du spectre en termes de spectre discret d (T ), qui est lensemble des valeurs propres isoles, de multiplicit finie (i.e. dim Ker(T
Id) < +), et son complmentaire, appel spectre essentiel ess (T ). Le spectre essentiel est donc
lunion des spectres rsiduels et continus, ainsi que des valeurs propres de multiplicit infinie et
des points daccumulation des valeurs propres de multiplicit finie. On a une caractrisation des
lments du spectre essentiel via le
Lemme C.1 (Weyl). Soit T un oprateur auto-adjoint sur un espace de Hilbert H. Alors
ess (T ) si et seulement sil existe une suite (un )n0 de H telle que
kun k = 1,
un * 0,
k(T )un k 0.
h( T )u, vi = 0.
p (T ).
Le spectre peut donc tre prcis dans le cas dun oprateur auto-adjoint (voir la Remarque C.6) :
Thorme C.1. Pour un espace de Hilbert sparable 1 H, le spectre dun oprateur auto-adjoint
est contenu dans la droite relle, et son spectre rsiduel est vide.
La premire assertion est rapprocher du fait que les matrices symtriques relles sont diagonalisables et valeurs propres relles. Pour un oprateur auto-adjoint, le spectre essentiel comprend
donc le spectre continu, les valeurs propres plonges dans le spectre continu, et les valeurs propres
isoles de multiplicit infinie.
Exemples
Exemple de spectre rsiduel.
On considre lespace de Hilbert
(
2
l (C) =
(un )n0
+
)
X
2
|un | < + ,
n=0
et loprateur de shift droite T : l2 (C) l2 (C) de domaine D(T ) = l2 (C) donn par
1. Rappelons quun espace de Hilbert H est sparable sil possde un sous-ensemble dnombrable dense,
i.e. sil existe E H dnombrable tel que Vect(E) = H.
257
0 si n = 0,
(T u)n =
un1 sinon.
On a bien sr p (T ) = . Par ailleurs, Im( T ) = (0, u), u l2 (C) nest pas dense dans C,
on sattend donc ce que T possde un spectre rsiduel. Nous allons prciser le spectre de T en
calculant son adjoint et en utilisant la Remarque C.6. Pour trouver ladjoint de T , on crit
X
hT u, vi =
un vn+1 = hu, T vi .
n0
Loprateur T est donc loprateur de shift gauche (T u)n = un+1 , de domaine l2 (C) galement.
On vrifie facilement que kT k = kT k = 1, do
(T ), (T ) {|| 1}.
Par ailleurs, tout C tel que || < 1 est valeur propre de T associ au vecteur propre
(un ) = (n ). On montre galement que T ne peut pas avoir de valeur propre de module suprieur
ou gal 1 (pour des questions de normalisation du vecteur propre). Ainsi,
p (T ) = {|| < 1},
et donc, utilisant la Remarque C.6,
res (T ) = {|| < 1}.
Comme le spectre est ferm, on a galement
(T ) = (T ) = {|| 1}.
Il est dlicat de caractriser la partie {|| = 1} des deux spectres (on pourra consulter [29,
Section VI.3]).
Exemple de spectre continu.
Soit T : L2 (R3 ) L2 (R3 ) dfini par
T u(x) = xu(x),
de domaine
D(T ) = {u L2 (R3 ) | xu L2 (R3 )}.
On montre tout dabord que (T ) R. En effet, soit C\R, alors si ( T )u = v, on a
v(x) = ( T )1 u =
u(x)
.
x
Ceci montre que ( T )1 est continu et de domaine L2 (R3 ). On montre en fait que cest un
oprateur born, de borne k( T )1 k = |Im()|1 .
Montrons prsent (T ) = c (T ) = R. Soit R. On remarque en premier lieu que 6 p (T ),
car (x )u(x) = 0 implique u = 0 au sens de L2 (R3 ). Ensuite, on peut se rendre compte que T
est auto-adjoint, donc que son spectre rsiduel est vide. On conclut alors en trouvant une suite de
3
Weyl pour : par exemple, un = n3/2 u
(n(x )) avec u
C
0 (R ) support dans B(0, 1) et de
norme k
ukL2 (R3 ) = 1, est telle que kun kL2 (R3 ) = k
ukL2 (R3 ) = 1, et
Z
Z
1
|y|2 |
u(y)|2 dy 0,
k(T )un k2L2 (R3 ) =
|x |2 |
u(n(x ))|2 n dx = 2
n R3
R3
et un * 0 car, pour w L2 (R3 ),
Z
Z
u
w
=
u
w
ukL2 (R3 )
n k
3 n
1
R
|x|
n
!1/2
Z
1
|x| n
|w|
0.
258
avec n N, T en = n en .
Par ailleurs, pour tout (T )\{0}, lespace propre E = Ker( T ) est de dimension finie.
Remarque C.7. Le spectre des oprateurs auto-adjoints compacts peut tre de cardinal fini (on dit
quon a un oprateur de rang fini), auquel cas il est de la forme (T ) = p (T ) = {1 , . . . , n }{0}.
Si T nest pas de rang fini, il est possible quil soit injectif si son spectre ponctuel est de la forme
{1 , . . . , n , . . .} avec n 0 lorsque n +. Dans ce cas, c (T ) = {0}.
En pratique, on utilisera surtout le
Corollaire C.1. Soit H est un espace de Hilbert sparable de dimension infinie, et T un oprateur
auto-adjoint non-born sur H. Sil existe (T )R tel que (T )1 soit un oprateur compact,
alors il existe une suite (n )n0 de rels non nuls telle que |n | +, et une base hilbertienne
(en )n0 de H telle que
(T ) = {n } {0},
avec
n N,
T en = n en .
Par ailleurs, pour tout n 0, lespace propre En = Ker(n T ) est de dimension finie.
s lim+ P = Id ;
La limite forte (strong limit) s lim est entendre au sens suivant : s limn+ Tn = T si et
seulement si pour tout x H, Tn x T x.
On notera par la suite S lensembles des familles spectrales. Pour une famille spectrale donne,
on peut dfinir un oprateur T de domaine
Z +
D = x H,
||2 dkP xk2 < +
2. On parle densemble relativement compact lorsque ladhrence de cet ensemble est compact. Cela
revient dire que lensemble en question est contenu dans un compact.
par
Z
x D,
259
Tx =
dP x.
La mesure borlienne () = (, P ) est not d(, P ). Les intgrales ci-dessus sont des
intgrales au sens de Riemann : pour f continue, et un intervalle < a < b < +,
Z
K
X
f ()dP x =
a
lim
K+
f (k )(Pk+1 Pk )x
k=1
pour une partition de [a, b] de pas tendant vers 0 lorsque K +. Lintgrale est bien dfinie
car 7 P x est une fonction variations bornes. On considre ensuite la limite a et
b + de ces intgrales. On vrifie que T x est bien dfini si x D(T ) et que les oprateurs ainsi
construits sont linaires auto-adjoints non-borns. On dfinit ainsi une application S A, o on
a not A lensemble des oprateurs auto-adjoints non-borns.
Thorme C.3. Lapplication F dfinit une bijection entre les familles spectrales et les oprateurs
auto-adjoints.
Les oprateurs auto-adjoints quelconques sont donc caractriss de manire quivalente par
leur mesure spectrale, qui est une mesure borlienne valeur projecteurs. Pour un oprateur T
auto-ajoint, on considre
P T : B(R) P
telle que |P T (B)|2 soit la probabilit que T prenne ses valeurs dans B. On a en fait
Z
T
P (B) =
dP .
B
T =
dP .
Exemple C.2. Dans le cas dun oprateur auto-adjoint compact, on a un spectre purement ponctuel,
et dans ce cas
X
P =
PEk
k
o PEk est le projecteur orthogonal sur le sous-espace propre Ek associ la valeur propre k .
Exemple C.3. On prsente ici la dcomposition explicite de certains oprateurs quantiques :
pour loprateur x
k , on a (Pxk u)(x) = 1xk u(x) ;
pour loprateur pk , on a Ppk u = F 1 1k Fu ;
R + 1 2
(k)eikx dk,
pour le Hamiltonien H0 = 21 de la particule libre, on a H0 u = (2)3/2 0
2 |k| u
H0
1 1
et donc P u = F 1 2 ||2 Fu.
Dans ce cadre, la nomenclature du spectre devient plus parlante :
Thorme C.4. Soit H un espace de Hilbert sparable, T un oprateur auto-adjoint sur H
et (P )R la famille spectrale qui lui est associe. Alors
p (T ) si est seulement si lim0,>0 P 6= P ;
c (T ) si et seulement si lim0,>0 P = P et P 6= P+ pour tout > 0.
Ainsi, les lments du spectre ponctuel sont les points o la mesure spectrale saute, alors
quelle varie continment aux points du spectre continu.
D
Quelques relations de commutation entre observables
[
x, py ] = 0,
[
x, pz ] = 0,
[
y , px ] = 0,
[
y , py ] = i~, [
y , pz ] = 0,
[
z , px ] = 0,
[
z , py ] = 0,
[
z , pz ] = i~,
h
i
h
i
h
i
y = i~L
z, L
y, L
z = i~L
x, L
z, L
x = i~L
y.
x, L
L
Autres relations de commutation
h
i
h
i
h
i
x, x
x , y = i~
x , z = i~
L
= 0,
L
z,
L
y,
h
i
h
i
h
i
y, x
y , y = 0,
y , z = i~
L
= i~
z,
L
L
x
h
i
h
i
h
i
z, x
z , y = i~
z , z = 0,
L
= i~
y,
L
x,
L
h
i
h
i
h
i
x, x
x , y2 = 2i~
x , z2 = 2i~
L
2 = 0,
L
y z,
L
y z,
h
i
h
i
h
i
y, x
y , y2 = 0,
y , z2 = 2i~
L
2 = 2i~
xz,
L
L
xz,
h
i
h
i
h
i
z, x
z , y2 = 2i~
z , z2 = 0,
L
2 = 2i~
xy,
L
xy,
L
h
i
h
i
h
i
x , px = 0,
x , py = i~
x , pz = i~
L
L
pz ,
L
py ,
h
i
h
i
h
i
y , px = i~
y , py = 0,
y , pz = i~
L
pz ,
L
L
px ,
h
i
h
i
h
i
z , px = i~
z , py = i~
z , pz = 0,
L
py ,
L
px ,
L
h
i
h
i
h
i
x , p2x = 0,
x , p2y = 2i~
x , p2z = 2i~
L
L
py pz ,
L
py pz ,
h
i
h
i
h
i
y , p2x = 2i~
y , p2y = 0,
y , p2z = 2i~
L
px pz ,
L
L
px pz
h
i
h
i
h
i
z , p2x = 2i~
z , p2y = 2i~
z , p2z = 0,
L
px py ,
L
px py ,
L
i
i
h
i
h
h
2z , x
2y , x
2x , x
L
2 + y2 + z2 = 0,
L
2 + y2 + z2 = 0,
L
2 + y2 + z2 = 0,
h
i
h
i
h
i
2x , p2x + p2y + p2z = 0,
2y , p2x + p2y + p2z = 0,
2z , p2x + p2y + p2z = 0,
L
L
L
h
i
h
i
h
i
2, L
x = 0, L
2, L
y = 0, L
2, L
z = 0,
L
h
i
h
i
h
i
x , V = i~ yFz zFy , L
y , V = i~ zFx x
z , V = i~ x
L
Fz , L
Fy yFx .
Bibliographie
[1] M. P. Allen et D. J. Tildesley, Computer Simulation of Liquids (Oxford Science Publications, 1987).
[2] R. Balian, Du microscopique au macroscopique (cours de physique statistique de lcole
Polytecnique) (Ellipses, 1982).
[3] E. Betranhandy, Proposition et tudes ab initio des stabilits relatives de nouveaux matriaux par gomimtisme structural : modlisation des proprits physico-chimiques, Thse de
doctorat (Universit Sciences et Technologies - Bordeaux I, 2005).
[4] Ham Brzis, Analyse fonctionnelle : thorie et applications (Dunod, 1999).
[5] E. Cancs, F. Legoll, et G. Stoltz, Theoretical and numerical comparison of sampling
methods for molecular dynamics, accepted for publication in M2AN (2007).
[6] Eric Cancs, Claude Le Bris, et Yvon Maday, Mthodes mathmatiques en chimie
quantique, volume 53 of Mathmatiques & Applications (Springer-Verlag, Berlin, Heidelberg,
2006).
[7] Philippe Chartier et Erwan Faou, Intgration symplectique des systmes hamiltoniens
intgrables : comportement en temps long, Cours de DEA Niveau II (2003). (disponible
ladresse http://www.irisa.fr/ipso/perso/faou/publis/NotesDEA03.ps).
[8] O. Coussy et F. Chevoir. Physique des tats de la Matire. Cours de premire anne,
ENPC.
[9] M. Crouzeix et A.L. Mignot, Analyse numrique des quations diffrentielles (Masson,
1984).
[10] B. Diu, C. Guthman, D. Lederer, et B. Roulet, Physique statistique (Hermann, 1989).
[11] A. Douady, Dterminisme et indterminisme dans un modle mathmatique, In Chaos et
dterminisme, A. Dahan-Dalmenico and P. Arnoux, Eds. (Le Seuil, 1992), pp. 1118.
[12] S. Duane, A. D. Kennedy, B. J. Pendleton, et D. Roweth, Hybrid Monte-Carlo,
Phys. Lett. B 195(2) (1987) 216222.
[13] R. Dautray et J.L. Lions, Analyse mathmatique et calcul numrique pour les sciences et
les techniques. I. Modles physiques (Masson, 1987).
[14] H. Flyvberg et H. G. Petersen, Error estimates on averages of correlated fata, J. Chem.
Phys. 91 (1989) 461466.
[15] D. Frenkel et B. Smit, Understanding Molecular Simulation (Academic Press, 2005).
[16] C. J. Geyer, Practical Markov chain Monte Carlo (with discussion), Stat. Sci. 7(4) (1992)
473511.
[17] W. R. Gilks, S. Richardson, et D. J. Spiegelhalter, Markov Chain Monte Carlo in
practice (Chapman and Hall, 1996).
[18] E. Hairer, C. Lubich, et G. Wanner, Geometric numerical integration illustrated by the
stormer-verlet method, Acta Numerica 12 (2003) 399450.
264
BIBLIOGRAPHIE
[19] Ernst Hairer, Christian Lubich, et Gerhard Wanner, Geometric Numerical Integration : Structure-Preserving Algorithms for Ordinary Differential Equations, volume 31 of
Springer Series in Computational Mathematics (Springer-Verlag, Berlin, Heidelberg, 2006).
[20] J.-P. Hansen et I. R. McDonald, Theory of Simple Liquids (Academic Press, 1986).
[21] W. K. Hastings, Monte Carlo sampling methods using Markov chains and their applications,
Biometrika 57 (1970) 97109.
[22] J. Israelashvili, Intermolecular and surface forces (Academic Press, 1992).
[23] L. Landau et E. Lifchitz, Physique statistique (Ellipses, 1994).
[24] B. J. Leimkuhler et S. Reich, Simulating Hamiltonian dynamics, volume 14 of Cambridge
monographs on applied and computational mathematics (Cambridge University Press, 2005).
[25] S.-K. Ma, Statistical Mechanics (World Scientific, 1985).
[26] N. Metropolis, A. W. Rosenbluth, M. N. Rosenbluth, A. H. Teller, et E. Teller,
Equations of state calculations by fast computing machines, J. Chem. Physics 21(6) (1953)
10871091.
[27] S. P. Meyn et R. L. Tweedie, Markov chains and stochastic stability, Communications
and control engineering series (Springer-Verlag, London, New York, 1993).
[28] J. Von Neumann, Mathematical foundations of quantum mechanics, Princeton landmarks
in mathematics and physics (Princeton university press, 1996).
[29] M. Reed et B. Simon, Methods of modern mathematical physics, volume I - IV (Academic
Press, 1980).
[30] G. Roberts et R. Tweedie, Exponential convergence of langevin diffusions and their
discrete approximations, Bernoulli 2 (1997) 314363.